博弈论:第四章 重复博弈.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论:第四章 重复博弈 博弈论 第四 重复 博弈
- 资源描述:
-
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 重复博弈,本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。,本章分三节,4.1,重复博弈引论,4.2,有限次重复博弈,4.3,无限次重复博弈,4.1,重复博弈引论,4.1.1,为何研究重复博弈,4.1.2,基本概念,4.1.1,为何研究重复博弈,经济中的长期关系,人们的预见性,未来利益对当前行为的制约,长期合同、回头客、长客和一次性买卖的区别,有无确定的结束时间,4.1.2,基本概念,有限次重复博弈,:给定一个基本博弈,G,(可以是静态博弈,也可以是动态博弈),重复进行,T,次,G,,并且在每次重复,G,之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为,“,G,的,T,次重复博弈,”,,记为,G(T),。而,G,则称为,G(T),的,“,原博弈,”,。,G(T),中的每次重复称为,G(T),的一个,“,阶段,”,。,无限次重复博弈,:一个基本博弈,G,一直重复博弈下去的博弈,记为,G(),随机结束的重复博弈,:会结束但结束时间不确定的博弈;,重复博弈是特殊的动态博弈,重复进行的基本博弈称为,“,原博弈,”,4.1.2,基本概念,策略,:博弈方在每个阶段针对每种情况如何行为的计划,子博弈,:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分。重复博弈的子博弈要么仍然是重复博弈,要么就是原博弈。,均衡路径,:由每个阶段博弈方的行为组合串联而成。,思考:重复博弈有多少条博弈路径?,重复博弈的得益,补充知识:资金的时间价值及其等值计算,4.2,有限次重复博弈,4.2.1,两人零和博弈的有限次重复博弈,4.2.2,唯一纯策略纳什均衡博弈,的有限次重复博弈,4.2.3,多个纯策略纳什均衡博弈,的有限次重复博弈,4.2.4,有限次重复博弈的民间定理,4.2.1,两人零和博弈的有限次重复博弈,零和博弈是严格竞争的,重复博弈并不改变这一点。,以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。,零和博弈或其他严格竞争博弈的有限次和无限次重复博弈,都不可能产生比一次性博弈更理想的结果,博弈方的唯一选择时始终采用原博弈的混合策略纳什均衡策略,因为重复博弈不会改变博弈方之间的利益对立关系。,4.2.2,唯一纯策略纳什均衡博弈的 有限次重复博弈,定理,:设原博弈,G,有唯一的纯策略纳什均衡,则对任意整数,T,,重复博弈,G(T),有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用,G,的纳什均衡策略。各博弈方在,G(T),中的总得益为在,G,中得益的,T,倍,平均得益的与原博弈,G,中的得益。,-5,,,-5,0,,,-8,-8,,,0,-1,,,-1,坦 白,不坦白,囚徒,2,坦白,不坦白,囚,徒,1,(,-5,,,-5,),-10,,,-10,-13,,,-5,-5,,,-13,-6,,,-6,坦 白,不坦白,囚徒,2,坦白,不坦白,囚,徒,1,(,-10,,,-10,),有限次重复削价竞争博弈,100,,,100,20,,,150,150,,,20,70,,,70,高 价,低 价,高价,低价,寡头,2,寡,头,1,削价竞争博弈,有唯一纯策略纳什均衡,(,70,,,70,)有限次重复的结果仍然是,(低价,低价),重复囚徒困境悖论和连锁店悖论,重复囚徒困境与直接经验似乎有差异,寡头价格战应该随时发生,但似乎也没有理论分析上那么普遍,连锁店悖论,4.2.3,多个纯策略纳什均衡博弈的 有限次重复博弈,5,,,5,3,,,3,2,,,0,0,,,2,2,,,0,6,,,0,0,,,2,0,,,6,1,,,1,H,M,H,厂商,2,M,L,厂,商,1,L,三价博弈,2,,,2,3,,,1,3,,,1,1,,,3,4,,,4,7,,,1,1,,,3,1,,,7,8,,,8,厂,商,1,厂商,2,L,M,H,H,M,L,两次重复三价博弈的等价模型,触发策略,:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复,博弈方,1,:第一次选,h,;如第一次结果为,(H,H),,则第二次选,M,,否则选,L,博弈方,2,:同博弈方,1,触发策略的进一步讨论,如果在第一阶段由乙方偏离了均衡路径结果会是怎样的呢?,触发策略的可信性问题,并不是每个重复博弈的触发策略都有可信性问题,触发策略在不少情况下是非常可信的,两市场博弈的重复博弈(重复两次),(A,B)+(A,B)OR (B,A)+(B,A),(1,4)(4,1),连续两次采用混合策略,(2,2),(A,B)+(B,A)OR (B,A)+(A,B),(2.5,2.5),轮换策略,一次纯策略,+,一次混合策略,(1.5,3)(3,1.5),0,,,0,4,,,1,1,,,3,3,,,3,厂,商,1,厂商,2,B,A,A,B,两市场博弈,两市场博弈的重复博弈(重复两次),第一类均衡总得益比较高,但得益很不平衡,混合策略平均期望得益较低,因为其包含了(,B,,,B,)策略组合的可能性,双方轮换策略相对要好一点。轮换策略:轮流采用原博弈两个纯策略纳什均衡,即双方轮流去两个不同市场的策略,也是重复博弈中常用的策略。,该博弈中无机会运用触发策略。,如果博弈三次呢?,重复博弈不同策略、均衡及一次性博弈得益比较,不同策略组合、均衡得益图示,厂商,2,得益,厂商,1,得益,(1,4),(3,3),(2.5,2.5,),(2,2),(3,1.5),(4,1),(,1.5,3),4.2.4,有限次重复博弈的民间定理,个体理性得益,:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益,可实现得益,:博弈中所有纯策略组合得益的加权平均数组,定理,:设原博弈的一次性博弈有均衡得益数组优于,w,,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们,厂商,2,得益,厂商,1,得益,(1,4),(3,3),(1,,,1),(4,1),w=(1.1),4.3,无限次重复博弈,4.3.1,两人零和博弈的无限次重复博弈,4.3.2,唯一纯策略纳什均衡博弈,的无限次重复博弈,4.3.3,无限次重复古诺模型,4.3.4,有效工资率,4.3.1,两人零和博弈的无限次重复博弈,两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡,4.3.2,唯一纯策略纳什均衡博弈 的无限次重复博弈,两寡头削价竞争博弈,该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈,4,,,4,0,,,5,5,,,0,1,,,1,H,L,H,L,无限次重复两寡头削价博弈,触发策略,:第一阶段采用,H,,如果前,t-1,阶段的结果都是,(H,H),,则继续采用,H,,否则采用,L,。,如果博弈方,2,采用,L,,总得益现值为,如果博弈方,2,采用,H,,总得益现值为,因此当 时,此触发策略纳什均衡策略,两寡头削价竞争无限次重复博弈的民间定理,厂商,2,得益,厂商,1,得益,(1,4),(3,3),(1,1),(4,1),(5,0),(5,0),4.3.3,无限次重复古诺模型,假定,:,边际成本都为,2,。,在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡:,在第一阶段生产垄断产量的一半,1.5,;在第,t,阶段,如果前,t-1,阶段结果都是,(1.5,1.5),,则继续生产,1.5,,否则生产古诺产量,2,。,设厂商,1,已采用该触发策略,若厂商,2,也采用该触发策略,则每期得益,4.5,,无限次重复博弈总得益的现值为:,如果厂商,2,偏离上述触发策略,则他在第一阶段所选产量应为给定厂商,1,产量为,1.5,时,自己的最大利润产量,即满足:,解得 ,此时利润为,5.0625,,高于触发策略第一阶段得益,4.5,。,但从第二阶段开始,厂商,1,将报复性地永远采用古诺产量,2,,这样厂商,2,也被迫永远采用古诺产量,从此得利润,4,。因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为:,当,上述策略是厂商,2,对厂商,1,的同样触发策略的最佳反应,否则偏离是最佳反应。,4.3.4,有效工资率,模型设定,:,首先厂商选择工资率为 ,然后工人选择接受或拒绝。如果拒绝,则他作个体户得到收入 小于 ,如果接受 ,则工人选择努力工作(负效用 )还是偷懒(无负效用)。,厂商只能看到产量高低,高产量为 ,低产量,0,。,工人努力工作时一定是高产量 ,不努力时却并不一定是,0,,而是高产量 的概率为 ,低产量,0,的概率为 。,工人努力工作时,厂商得益为 ,工人得益为 ;工人偷懒时,厂商期望得益为 ,工人得益为 。,考虑如下的触发策略,:,厂商在第一阶段给工资率 ,在第,t,阶段,如果前面,t-1,阶段结果都是 则继续给 ,否则从此永远是 。,工人的策略是如果 则接受,否则宁愿作个体户得到 ,并在以前各期结果都是 和当前工资率为 时努力工作,否则偷懒。,设厂商已采用上述触发策略。由于 ,工人接受工作是最佳反应。用 记工人努力工作时无限次重复博弈得益的现值,则 即,用 记工人选偷懒时无限重复博弈得益的现值,则:,即,因此当 即,时,努力是工人的最佳选择。,反过来,设工人已采用上述触发策略。若厂商给的工资率满足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段的得益为 ,无限次重复博弈得益现值为,。若不愿给 ,则解雇工人,以后得益为,0,。因此只要 ,厂商选择前述触发策略就是最佳反应。,综上所述,在满足,的条件下,双方的触发策略构成一个纳什均衡。而上述两式实际上意味着,即工人努力的产出扣除努力负效用后的剩余,必须不小于工人作个体户的收入即机会成本,加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。,最后这个不等式正是存在有效工资率,工作激励有效的基本条件。,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




博弈论:第四章 重复博弈.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/7904769.html