序贯决策.ppt
《序贯决策.ppt》由会员分享,可在线阅读,更多相关《序贯决策.ppt(47页珍藏版)》请在咨信网上搜索。
1、1序贯序贯决策分析决策分析 1.多阶段决策多阶段决策2.序贯决策序贯决策3.马尔可夫决策马尔可夫决策2在经济管理活动中,由于某些问题的特殊性,需在经济管理活动中,由于某些问题的特殊性,需要将活动过程分为若干个相互联系的阶段,在它要将活动过程分为若干个相互联系的阶段,在它的每一个阶段都需要做出决策,从而使整个过程的每一个阶段都需要做出决策,从而使整个过程达到最好的活动效果。达到最好的活动效果。当各个阶段决策确定后,就组成了一个决策系列,当各个阶段决策确定后,就组成了一个决策系列,决定了整个过程的一条活动路线。决定了整个过程的一条活动路线。把一个问题看作是一个前后关联的具有链状结构把一个问题看作是
2、一个前后关联的具有链状结构的多阶段过程就成为多阶段决策过程。的多阶段过程就成为多阶段决策过程。1.多阶段决策多阶段决策 1.1 多阶段决策问题多阶段决策问题 3多阶段决策的特点:多阶段决策的特点:决策者需要做出时间上有先后之别的多次决策;决策者需要做出时间上有先后之别的多次决策;前一次决策的选择将直接影响到后一次决策,后前一次决策的选择将直接影响到后一次决策,后一次决策的状态取决于前一次决策的结果;一次决策的状态取决于前一次决策的结果;决策者关系的是多次决策的总结果,而不是各次决策者关系的是多次决策的总结果,而不是各次决策的即时后果(全程最优)。决策的即时后果(全程最优)。1.1 多阶段决策问
3、题多阶段决策问题 1.多阶段决策多阶段决策 4解决多阶段问题的主要方法:解决多阶段问题的主要方法:决策树方法;决策树方法;动态规划方法动态规划方法1.2 多阶段决策方法多阶段决策方法 多阶段决策分析的步骤:多阶段决策分析的步骤:根据具体问题适当划分阶段;根据具体问题适当划分阶段;确定各阶段的状态变量,寻找多阶段之间的联系;确定各阶段的状态变量,寻找多阶段之间的联系;由后到前用逆序法进行决策分析由后到前用逆序法进行决策分析1.多阶段决策多阶段决策 有关活动方案的决策方法决策树法 构成(三点两枝):决策点:代表最后的方案选择 状态点:代表方案将会遇到的不同状态 结果点:代表每一种状态所得到的结果
4、方案枝:由决策点引出的线段,连接决策点和状态点,每一线段代表一个方案。概率枝:由状态点引出的线段,连接状态点和结果点。每一线段代表一种状态。1234 某厂为适应市场的需要,准备扩大生产能力,有两某厂为适应市场的需要,准备扩大生产能力,有两种方案可供选择:第一方案是建大厂;第二方案是先建种方案可供选择:第一方案是建大厂;第二方案是先建小厂,后考虑扩建。如建大厂,需投资小厂,后考虑扩建。如建大厂,需投资700700万元,在市场万元,在市场销路好时,每年收益销路好时,每年收益210210万元,销路差时,每年亏损万元,销路差时,每年亏损4040万万元。在第二方案中,先建小厂,如销路好,元。在第二方案中
5、,先建小厂,如销路好,3 3年后进行扩年后进行扩建。建小厂的投资为建。建小厂的投资为300300万元,在市场销路好时,每年收万元,在市场销路好时,每年收益益9090万元,销路差时,每年收益万元,销路差时,每年收益6060万元,如果万元,如果3 3年后扩建,年后扩建,扩建投资为扩建投资为400400万元,收益情况同第一方案一致。未来市万元,收益情况同第一方案一致。未来市场销路好的概率为场销路好的概率为0.70.7,销路差的概率为,销路差的概率为0.30.3;如果前;如果前3 3年年销路好,则后销路好,则后7 7年销路好的概率为年销路好的概率为0.90.9,销路差的概率为,销路差的概率为0.10.
6、1。无论选用何种方案,使用期均为。无论选用何种方案,使用期均为1010年,试做决策分年,试做决策分析。析。例题分析例题分析 这这是是一一个个多多阶阶段段的的决决策策问问题题,考考虑虑采采用用期期望望收收益益最最大大为为标标准准选择选择最最优优方案。方案。第一步,画出决策树图第一步,画出决策树图。145789623606060609090-40-40210210-40-40210210-40-40建大厂建大厂 建小厂建小厂 销路好销路好0.70.7 销路差销路差0.30.3 销路好销路好0.70.7 销路差销路差0.30.3 销路好销路好0.90.9 销路差销路差0.10.1 扩建扩建 不扩建不
7、扩建 销路好销路好0.90.9 销路差销路差0.10.1 销路好销路好0.90.9 销路差销路差0.10.1 3 3年内年内 7 7年内年内 1227.51227.51247.51247.512951295-280-280895895420420895895609609 第二步,第二步,从右向左从右向左计计算各点的期望收益算各点的期望收益值值。点点4 4:2102100.90.97-407-400.10.17=12957=1295(万元)(万元)点点5 5:-40-407=-2807=-280(万元)(万元)点点2 2:129512950.7+2100.7+2100.70.73-2803-28
8、00.3-400.3-400.30.33=1227.53=1227.5(万元)(万元)点点8 8:2102100.90.97-407-400.10.17-400=8957-400=895(万元)(万元)点点9 9:90900.90.97+607+600.10.17=6097=609(万元)(万元)点点6 6是个决策点,比是个决策点,比较较点点8 8和点和点9 9的期望收益,的期望收益,选择扩选择扩建。建。点点6 6:895895(万元)(万元)点点7 7:60607=4207=420(万元)(万元)点点3 3:8958950.7+2100.7+2100.70.73+4203+4200.3+60
9、0.3+600.30.33=1247.53=1247.5(万元)(万元)第三步,第三步,进进行决策。行决策。比比较较点点2 2和和点点3 3的的期期望望收收益益,点点3 3期期望望收收益益值值较较大大,可可见见,最最优优方方案案是是先先建建小小厂厂,如如果果销销路路好,好,3 3年以后再年以后再进进行行扩扩建。建。11某某公公司司考考虑虑是是否否花花费费4000元元钱钱从从某某科科研研机机构构购购买买某某项项技技术术,然然后后产产销销新新产产品品,如如果果买买技技术术,可可以以进进行行大大批批(a1)、中中批批(a2)或或小小批批生生产产(a3),可可能能出出现现的的市市场场情情况况也也分分为
10、为畅畅销销、一一般般和和滞滞销销三三种种情情况况。其收益矩阵如表其收益矩阵如表1所示。所示。1.3 应用举例应用举例 1.多阶段决策多阶段决策 12为为了了更更准准确确地地了了解解市市场场,在在正正式式投投产产前前可可先先生生产产少少量量产产品品试试销销。由由于于要要增增添添少少量量生生产产设设备备等等原原因因,试试销销费费需需要要600元元。由由于于试试销销前前未未做做广广告告,顾顾客客对对产产品品不不太太了了解解,加加之之试试销销销销量量较较小小,试试销销结结果果很很不不准准确确。假假设设试试销销结结果果分分为为产产品品受受欢欢迎迎(H1)、一一般般(H2)和和不不受受欢欢迎迎(H3)三种
11、,其准确度如表三种,其准确度如表21.多阶段决策多阶段决策 1.3 应用举例应用举例 13如不买此项技术,把这笔费用用在其他方面,在同如不买此项技术,把这笔费用用在其他方面,在同样的时期可获利样的时期可获利80008000元。那么,该公司应该如何元。那么,该公司应该如何决策?决策?(1 1)是否买技术?)是否买技术?(2 2)如果买技术,是否采取试销办法?)如果买技术,是否采取试销办法?(3 3)如果不试销,应大批生产,中批生产还是小批)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据试销结果决定生产?如果试销,又应该如何根据试销结果决定其行动?其行动?1.3 应用举例应
12、用举例 141.多阶段决策多阶段决策 1.3 应用举例应用举例 151.多阶段决策多阶段决策 1.3 应用举例应用举例 试销结果下的后验概率试销结果下的后验概率 16 某工厂现有10万元资金可供生产某种产品使用,生产过程有两个方案可供选择。方案1:每万元资金,每年可产生0.5万元的利润,年产量为2000吨。方案2:每万元资金,每年可产生0.2万元的利润,年产量为3000吨。每年可用一部分资金采取一种方案生产,另外一部分资金采取另一种方案进行生产,但一年内不变。假设前一年的利润可作为下一年的资金在两个方案间再行分配,但一个方案前一年的资金不得在下一年向另一方案转移。那么,为使四年内的总产量最高,
13、该厂在这四年中应该如何分配资金?连续连续情形的情形的决策分析决策分析应用举例应用举例17有些决策问题,在进行决策后又产生一些新情况,有些决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接着又有一些新的情况,有需需要进行新的决策,接着又有一些新的情况,有需要进行新的决策。这样决策、新情况、决策要进行新的决策。这样决策、新情况、决策,就,就构成一个系列,成为系贯决策。构成一个系列,成为系贯决策。多阶段决策的阶段数是确定的,序贯决策的阶段多阶段决策的阶段数是确定的,序贯决策的阶段数是不确定的,它依赖于执行决策过程中所出现的数是不确定的,它依赖于执行决策过程中所出现的状况。状况。决策方法:决
14、策树决策方法:决策树2.序列决策序列决策 例例 设有某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用每次30000元,钻井费用为10000元。若钻井后出油,这井队可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图上。问钻井队的决策者如何做出决策使收入的期望值为最大。图图 原决策树原决策树 203.1 马尔可夫决策问题马尔可夫决策问题 决策问题采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。