运筹学之决策论.ppt
《运筹学之决策论.ppt》由会员分享,可在线阅读,更多相关《运筹学之决策论.ppt(51页珍藏版)》请在咨信网上搜索。
1、第十一章第十一章 决策论决策论 Theory of Decision11.1 决策分析的基本问题决策分析的基本问题11.2 确定型和非确定型决策确定型和非确定型决策11.3 风险型决策风险型决策 11.4 效用理论效用理论11.5马尔可夫决策马尔可夫决策 “决策决策”一词来源于英语一词来源于英语Decision AnalysisDecision Analysis,直译为,直译为“做出决定做出决定”。所谓决策,就是为了实现预定的目标在若干可供选择的所谓决策,就是为了实现预定的目标在若干可供选择的方案中,选出一个最佳行动方案的过程,它是一门帮助人方案中,选出一个最佳行动方案的过程,它是一门帮助人们
2、科学地决策的理论。们科学地决策的理论。11.1 决策分析的基本问题决策分析的基本问题1.引例引例计划用计划用6 6个鸡蛋煎饼,现已经向碗里打了个鸡蛋煎饼,现已经向碗里打了5 5个鸡蛋,在打第个鸡蛋,在打第6 6个鸡蛋前,个鸡蛋前,有三种不同有三种不同行动方案行动方案可供选择可供选择:a a1 1:向盛有:向盛有5 5个好蛋的碗里打第个好蛋的碗里打第6 6个鸡蛋;个鸡蛋;a a2 2:向另一个碗里单独打第:向另一个碗里单独打第6 6个鸡蛋,以便检查好坏;个鸡蛋,以便检查好坏;a a3 3:放弃第:放弃第6 6个鸡蛋。个鸡蛋。第第6 6个鸡蛋有两种个鸡蛋有两种自然状态自然状态:1 1:好蛋;:好蛋
3、;2 2 :坏蛋。:坏蛋。各种行动方案在各种不同的自然状态下会产生不同的各种行动方案在各种不同的自然状态下会产生不同的结果结果o oijij:好蛋好蛋1 1 坏蛋坏蛋2 2打入碗里打入碗里a a1 1o o11116 6个蛋煎饼个蛋煎饼o o12125 5个好蛋浪费,无蛋煎饼个好蛋浪费,无蛋煎饼单独检查单独检查a a2 2o o21 21 6 6个蛋煎饼,多洗一个碗个蛋煎饼,多洗一个碗o o22225 5个蛋煎饼,多洗一个碗个蛋煎饼,多洗一个碗丢弃丢弃a a3 3o o31315 5个蛋煎饼,浪费一个好个蛋煎饼,浪费一个好o o32325 5个蛋煎饼个蛋煎饼决策问题的构成要素决策问题的构成要素
4、决策者决策者可供选择的的方案(行动、策略)可供选择的的方案(行动、策略)自然状态自然状态(不能被决策者所控制的客观存在的环境)(不能被决策者所控制的客观存在的环境)结果(每一方案选择所导致的后果,即收益或损失)结果(每一方案选择所导致的后果,即收益或损失)2.2.决策系统决策系统 决策系统可以表示为三个主要因素的函数:决策系统可以表示为三个主要因素的函数:DD(S,U,V)状态空间状态空间 不以人的意志为转移的客观因素,设一个状态为不以人的意志为转移的客观因素,设一个状态为Si,有,有m种不同状态,其集合记为:种不同状态,其集合记为:S称状态空间,称状态空间,S的元素的元素Si称为状态变量。称
5、为状态变量。(1 1)状态空间)状态空间S S (2 2)策略空间)策略空间U U (3 3)损益函数)损益函数V V策略空间策略空间 人们根据不同的客观情况,可能做出主观的选择,人们根据不同的客观情况,可能做出主观的选择,记一种策略方案为记一种策略方案为Ui,有,有n种不同的策略,其集合为:种不同的策略,其集合为:损益函数损益函数 当状态处在当状态处在Si情况下,人们做出情况下,人们做出Uj决策,从而产生的决策,从而产生的损益值损益值Vij,显然,显然Vij是是Si,Uj的函数,即:的函数,即:U称为策略空间;称为策略空间;U的元素的元素Uj称为决策变量。称为决策变量。当状态变量是离散型变量
6、时,损益值构成的矩阵叫当状态变量是离散型变量时,损益值构成的矩阵叫损益矩阵损益矩阵.10决策问题根据掌握的信息多少进行分类决策问题根据掌握的信息多少进行分类确定型决策问题确定型决策问题不确定型决策问题不确定型决策问题风险型决策问题风险型决策问题u 确定型决策确定型决策:在决策环境:在决策环境完全确定的条件下完全确定的条件下进行的决策,进行的决策,一个方案只能有一种确定的结果,其自然状态是为人们所掌握一个方案只能有一种确定的结果,其自然状态是为人们所掌握的的.例例1.背包问题背包问题 例例2.N台机器,台机器,N个工作,每台机器安排一项工作,如个工作,每台机器安排一项工作,如何安排生产费用最小?
7、何安排生产费用最小?u风险型决策风险型决策:在决策环境在决策环境不是完全确定的情况下不是完全确定的情况下进行决策进行决策.由于存在不由于存在不 可控制的自然状态,采取一种方案可能出现几种不同的结果,可控制的自然状态,采取一种方案可能出现几种不同的结果,各自然状态发生的概率已知。各自然状态发生的概率已知。例:例:天气天气产值产值策略策略最好最好 较好较好 坏坏A 10 1 2 B 8 4 0 C 3 3 3概率概率 0.15 0.60 0.25u 不确定型决策不确定型决策:不确定型决策对于各自然状态发生的概率,决策者是一不确定型决策对于各自然状态发生的概率,决策者是一无所知的,只能靠决策者的主观
8、倾向进行决策。无所知的,只能靠决策者的主观倾向进行决策。常用的不确定型准则有:常用的不确定型准则有:1.悲观准则悲观准则2.乐观准则乐观准则3.折衷法准则折衷法准则4.等可能性准则等可能性准则5.最小机会损失(后悔)准则最小机会损失(后悔)准则 特征:特征:1 1、自然状态已知;、自然状态已知;2 2、各方案在不同自然状态下的收益值已知、各方案在不同自然状态下的收益值已知;3 3、自然、自然状态发生不确定。状态发生不确定。例:某公司需要对某新产品生产批量作出决策,各种批量例:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(在不同的自然状态下的收益情况如下表(收
9、益矩阵收益矩阵):):S1(需求量大)S2(需求量小)A1(大批量生产)30-6A2(中批量生产)20-2A3(小批量生产)105自然状态自然状态行动方案行动方案自然状态自然状态行动方案行动方案11.2 不确定型决策不确定型决策 一、最小最大准则(悲观准则)一、最小最大准则(悲观准则)决策者从最不利的角度去考虑问题:决策者从最不利的角度去考虑问题:先选出每个方案在不同自然状态下的最小收益值(最保先选出每个方案在不同自然状态下的最小收益值(最保险),然后从这些最小收益值中取最大的,从而确定行动方险),然后从这些最小收益值中取最大的,从而确定行动方案。案。用用a a(A(Ai i,S Sj j)表
10、示收益值表示收益值二、最大最大准则(乐观准则)二、最大最大准则(乐观准则)决策者从最有利的角度去考虑问题:决策者从最有利的角度去考虑问题:先选出每个方案在不同自然状态下的最大收益值(最乐先选出每个方案在不同自然状态下的最大收益值(最乐观),然后从这些最大收益值中取最大的,从而确定行动方观),然后从这些最大收益值中取最大的,从而确定行动方案。案。用用a a(Ai(Ai,SjSj)表示收益值表示收益值 三、等可能性准则三、等可能性准则(Laplace(Laplace准则准则 )决策者把各自然状态发生的机会看成是等可能的:决策者把各自然状态发生的机会看成是等可能的:设每个自然状态发生的概率为设每个自
11、然状态发生的概率为 1/1/自然状态数自然状态数 ,然后计,然后计算各行动方案的收益期望值算各行动方案的收益期望值,最大的收益期望值为最优方案。最大的收益期望值为最优方案。用用 E(AE(Ai i)表示第表示第i i方案的收益期望值方案的收益期望值.四、乐观系数四、乐观系数(折衷折衷)准则准则 决策者取乐观准则和悲观准则的折衷:决策者取乐观准则和悲观准则的折衷:先确定一个乐观系数先确定一个乐观系数 (0 01 1),然后计算:),然后计算:CViCVi=max max a a(Ai(Ai,SjSj)+)+(1-1-)min min a a(Ai(Ai,SjSj)从这些折衷标准收益值从这些折衷标
12、准收益值CViCVi中选取最大的,从而确定行动方中选取最大的,从而确定行动方案。案。取取 =0.7当当 0时,是悲观准则,时,是悲观准则,当当 1时,是乐观准则时,是乐观准则 决策者从后悔的角度去考虑问题:决策者从后悔的角度去考虑问题:当决策者选定决策方案后,结果发现所选方案并非实当决策者选定决策方案后,结果发现所选方案并非实际最优方案,必然产生后悔际最优方案,必然产生后悔.这种后悔,实际上是一种机会这种后悔,实际上是一种机会损失。一定自然状态下所选方案的收益值与该状态下最优方损失。一定自然状态下所选方案的收益值与该状态下最优方案的收益值之差越大,后悔就越大案的收益值之差越大,后悔就越大.五、
13、后悔值准则五、后悔值准则后悔值后悔值:某自然状态下最大收益与该状态下其他收益之差某自然状态下最大收益与该状态下其他收益之差1.1.计算出在各种自然状态下各方案的后悔值,计算出在各种自然状态下各方案的后悔值,2.2.从各方案的最大后悔值中,选取后悔值最小的方案为最从各方案的最大后悔值中,选取后悔值最小的方案为最优方案优方案.S1(需求量大)S2(需求量小)A1(大批量生产)30-6A2(中批量生产)20-2A3(小批量生产)105自然状态自然状态行动方案行动方案自然状态自然状态行动方案行动方案本节学习要点本节学习要点1.1.针对不确定型决策,本节介绍的五种方法有一定的局限针对不确定型决策,本节介
14、绍的五种方法有一定的局限性,是因条件所限,没有办法的办法性,是因条件所限,没有办法的办法.2.2.不同的决策者有不同的决策习惯;同一个决策者当自身不同的决策者有不同的决策习惯;同一个决策者当自身的实力发生变化时,对同一个决策问题也会采取不同的决的实力发生变化时,对同一个决策问题也会采取不同的决策方法策方法.结论分析结论分析:在难以准确估计事件发生概率的条件下进行投资:在难以准确估计事件发生概率的条件下进行投资决策,主要取决于决策者对风险的偏好,根据决策者对风险决策,主要取决于决策者对风险的偏好,根据决策者对风险持有的态度,得到不同的最优方案持有的态度,得到不同的最优方案.作业作业:p297-1
15、 特征:特征:在决策环境不完全确定的情况下进行的决策,已知在决策环境不完全确定的情况下进行的决策,已知自然状态概率集。自然状态概率集。由于使用了概率,所以称此类决策为由于使用了概率,所以称此类决策为风险型决策风险型决策.11.3 风险型决策风险型决策风险型决策风险型决策期望收益决策法期望收益决策法决策树法决策树法选择期望收益最大的方案为最优方案选择期望收益最大的方案为最优方案.1.期望收益决策法期望收益决策法 例例 某建筑公司承建一项工程,需要决定下个月是否开工某建筑公司承建一项工程,需要决定下个月是否开工.如果开工后天气好,可以按期完工,并可获得利润如果开工后天气好,可以按期完工,并可获得利
16、润50万元;万元;如果开工后天气坏则将造成损失如果开工后天气坏则将造成损失20万元;如果不开工,不管万元;如果不开工,不管天气是好还是坏,都要付出窝工损失天气是好还是坏,都要付出窝工损失5千元千元.根据历史气象统根据历史气象统计资料,预计下月天气好的概率是计资料,预计下月天气好的概率是0.4,天气坏的概率是,天气坏的概率是0.6,数据列表见表数据列表见表4.10.为使利润最大,该公司应决定开工还是为使利润最大,该公司应决定开工还是不开工?不开工?解:解:计算各方案的期望收益值计算各方案的期望收益值.开工方案:开工方案:0.4 50+0.6(20)=8(万元万元)不开工方案:不开工方案:0.4(
17、5)+0.6(5)=5(万元万元)根据计算结果,如选择开工方案能够获利根据计算结果,如选择开工方案能够获利8万元;如选择不万元;如选择不开工方案则损失开工方案则损失5万元。因此,选择开工方案作为决策最优万元。因此,选择开工方案作为决策最优方案。方案。例例4.6 某市一家报社,现在每天印刷一种晚报某市一家报社,现在每天印刷一种晚报15万份,其大万份,其大部分通过零售网点发行。据部分通过零售网点发行。据100天内的销量调查,每天出售天内的销量调查,每天出售该晚报份数的分布如表所示。已知该晚报每份售价为该晚报份数的分布如表所示。已知该晚报每份售价为0.3元,元,成本为成本为0.25元。该报社领导决定
18、根据市场销售量调查结果,元。该报社领导决定根据市场销售量调查结果,确定一个最佳印刷量,使期望利润最大确定一个最佳印刷量,使期望利润最大.该报社领导应如何该报社领导应如何决策?决策?晚报销量分布表晚报销量分布表销量(万份销量(万份/天)天)15 14 13 12 11天天 数数12 20 30 25 13晚报销量分布表晚报销量分布表销量(万份销量(万份/天)天)15 14 13 12 11天天 数数12 20 30 25 13解:解:有有5个备选方案:个备选方案:每天印刷每天印刷:15:15万份;万份;:14:14万份;万份;:13:13万份;万份;:12:12万份;万份;:11:11万份;万份
19、;每天出售该晚报份数(万份)的自然状态有每天出售该晚报份数(万份)的自然状态有5种:种:,相应的自然状态概率为:相应的自然状态概率为:方案方案在自然状在自然状态态下得到收益下得到收益值为值为则则收益矩收益矩阵为阵为.有有1290,3430,4970,5610,5500 比比较较可知:可知:最大,故最大,故:每天印刷:每天印刷1212万份万份为为最最优优方案。方案。练习练习 某冷饮店要拟订某冷饮店要拟订6,7,86,7,8月份雪糕的日进货计划。雪糕进货月份雪糕的日进货计划。雪糕进货成本为每箱成本为每箱6060元,销售价格为元,销售价格为110110元,即当天能卖出去,每箱元,即当天能卖出去,每箱
20、可获利可获利5050元;如果当天卖不出去,剩余一箱就因冷藏费及其他元;如果当天卖不出去,剩余一箱就因冷藏费及其他原因而亏损原因而亏损2020元元.现市场需求情况不清楚,但有前两年同期现市场需求情况不清楚,但有前两年同期180180天的日销售资料,见表天的日销售资料,见表4.114.11。问:应怎样拟订雪糕的日进货计划,才能使利润最大?问:应怎样拟订雪糕的日进货计划,才能使利润最大?解解(1)根据前两年同期日销售量资料,进行统计分析,)根据前两年同期日销售量资料,进行统计分析,确定不同日销售量的概率,见表确定不同日销售量的概率,见表4.11的最后一列。的最后一列。则则每日利每日利润润的的计计算方
21、法如下:算方法如下:各各进货进货方案在不同的日方案在不同的日销销售量条件下的利售量条件下的利润润是随供需关系而是随供需关系而定的定的.设设以以代表日代表日进货进货量,以量,以(2)根据每天的日销售量,编制不同进货方案的收益表)根据每天的日销售量,编制不同进货方案的收益表(见表(见表4.12)代表市场的日可能销售量,代表市场的日可能销售量,当当时时,利,利润润;当当时时,利,利润润例如,日例如,日进货进货50箱,售出箱,售出50箱,即箱,即,利,利润为润为50 50=2500元,元,50 70-20 60=2300元,元,见见表表4.124.12。若需求量大于若需求量大于50箱,箱,利润仍为利润
22、仍为2500元;元;又日进货又日进货60箱而售出箱而售出50箱,箱,即即,这时的利润为,这时的利润为 计算各个进货方案的期望利润值。计算各个进货方案的期望利润值。各个方案的期望利润,是在收益表的基础上,将每个方案各个方案的期望利润,是在收益表的基础上,将每个方案在不同自然状态下的利润值乘以该自然状态发生的概率值在不同自然状态下的利润值乘以该自然状态发生的概率值之和。之和。(3)决策。从表)决策。从表4.12的计算结果可以看出:进货的计算结果可以看出:进货70箱的计划方案箱的计划方案期望利润最大。因此,该店的最优进货方案是日进货期望利润最大。因此,该店的最优进货方案是日进货70箱雪糕。箱雪糕。2
23、.决策树法决策树法 决策树法是风险决策中常用的方法。决策树法是风险决策中常用的方法。优点优点是能使决策问题形象直观,思路清晰,便于思考与集是能使决策问题形象直观,思路清晰,便于思考与集体探讨。在多阶段决策活动中,它更是层次分明,一目了然,体探讨。在多阶段决策活动中,它更是层次分明,一目了然,计算简便。计算简便。决策树的结构决策树的结构画决策树的具体步骤画决策树的具体步骤:(1)(1)从左向右绘制决策树;从左向右绘制决策树;(2)(2)从右向左计算各方案的期望值,并将结果标在相应方案节从右向左计算各方案的期望值,并将结果标在相应方案节点的上方;点的上方;(3)(3)选收益期望值最大选收益期望值最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 决策
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。