分享
分销 收藏 举报 申诉 / 35
播放页_导航下方通栏广告

类型第5重复博弈与合作行为.pptx

  • 上传人:w****g
  • 文档编号:4232043
  • 上传时间:2024-08-27
  • 格式:PPTX
  • 页数:35
  • 大小:265.12KB
  • 下载积分:12 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    重复 博弈 合作 行为
    资源描述:
    第第5章章 重复博弈重复博弈(repeat game)与合作行为)与合作行为 本章介绍基本博弈基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体整体进行研究。本章分三节本章分三节4.1 重复博弈引论4.2 有限次重复博弈4.3 无限次重复博弈4.1 重复博弈引论重复博弈引论4.1.1 为何研究重复博弈为何研究重复博弈4.1.2 基本概念基本概念n重复博弈在现实中具有很强的普遍性,前面分析过的静态博弈和动态博弈模型反映的是短期一次性的合作或竞争关系。还存在许多长期反复的合作和竞争关系n如回头客问题、大企业为什么很少偷税、丈夫会真的打妻子吗?公交车上的位置之争,火车站小贩为什么老是买假烟,买菜的老太婆。n重复博弈中,长期的合作性能纠正人们短期行为的冲动,为了以后的长期利益计划,必须保持与周围的良好的人际关系。4.1.1 为何研究重复博弈为何研究重复博弈n经济中的长期关系n人们的预见性n未来利益对当前行为的制约n长期合同、回头客、长客和一次性买卖的区别n有无确定的结束时间4.1.1 为何研究重复博弈为何研究重复博弈4.1.2 基本概念n有限次重复博弈有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。n无限次重复博弈无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G()n策略策略:博弈方在每个阶段针对每种情况如何行为的计划n子博弈子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分n均衡路径均衡路径:由每个阶段博弈方的行为组合串联而成序惯博弈与重复博弈区别n序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;n重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stage game).重复博弈的三个特征重复博弈的三个特征n阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;n所有参与人观察到博弈过去的历史;n参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;重复博弈的得益重复博弈的得益n重复博弈不仅要考虑本阶段的得益,还要考虑整个重复博弈过程得益的总体情况。重复博弈和信誉问题重复博弈和信誉问题n如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。n重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。4.2 有限次重复博弈有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈4.2.2唯一纯策略纳什均衡博弈唯一纯策略纳什均衡博弈 的有限次重复博弈的有限次重复博弈4.2.3多个纯策略纳什均衡博弈多个纯策略纳什均衡博弈 的有限次重复博弈的有限次重复博弈4.2.4 有限次重复博弈的民间定理有限次重复博弈的民间定理4.2.1 两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈n零和博弈是严格竞争的,重复博弈并不改变零和博弈是严格竞争的,重复博弈并不改变这一点。这一点。n以零和博弈为原博弈的有限次重复博弈与猜以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的混合策略纳正确策略是重复一次性博弈中的混合策略纳什均衡策略。什均衡策略。n零和或严格竞争博弈不会改变博弈方的行为零和或严格竞争博弈不会改变博弈方的行为方式和博弈效率,因为博弈方之间的利益是方式和博弈效率,因为博弈方之间的利益是严格对立的,矛盾是不可调和的。严格对立的,矛盾是不可调和的。4.2.2唯一纯策略纳什均衡博弈的唯一纯策略纳什均衡博弈的 有限次重复博弈有限次重复博弈n定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)有限次重复削价竞争博弈有限次重复削价竞争博弈100,10020,150150,2070,70高 价低 价高价低价寡头寡头2寡寡头头1削价竞争博弈有唯一纯策略纳什均衡有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是有限次重复的结果仍然是(低价,低价)(低价,低价)4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈5,53,32,00,22,06,00,20,61,1HMH厂商厂商2ML厂厂商商1L三价博弈2,23,13,11,34,47,11,31,78,8厂厂商商1厂商厂商2LMHHML两次重复三价博弈的等价模型触发策略:两博弈方先试探合作,一旦发现对方不合作则也用触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复不合作报复博弈方博弈方1 1:第一次选:第一次选h h;如第一次结果为;如第一次结果为(H,H)(H,H),则第二次选,则第二次选M M,否则选,否则选L L博弈方博弈方2 2:同博弈方:同博弈方1 1两市场博弈的重复博弈(重复两次)子博弈纳什均衡:子博弈纳什均衡:(A,B)+(A,B)OR (B,A)+(B,A)(1,4)(4,1)(A,B)+(A,B)OR (B,A)+(B,A)(1,4)(4,1)连续两次采用混合策略连续两次采用混合策略(2,2)(2,2)(A,B)+(B,A)OR (B,A)+(A,B)(2.2,2.5)(A,B)+(B,A)OR (B,A)+(A,B)(2.2,2.5)轮换策略轮换策略一次纯策略一次纯策略+一次混合策略一次混合策略(1.5,3)(3,1.5)(1.5,3)(3,1.5)0,04,11,33,3厂厂商商1厂商厂商2BAAB两市场博弈重复博弈不同策略、均衡及一次性博弈得益比较n不同策略组合、均衡得益图示厂商2得益厂商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)4.2.4 有限次重复博弈的民间定理有限次重复博弈的民间定理n个体理性得益个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益n可实现得益可实现得益:博弈中所有纯策略组合得益的加权平均数组n定理定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈两人零和博弈的无限次重复博弈4.3.2 唯一纯策略纳什均衡博弈唯一纯策略纳什均衡博弈 的无限次重复博弈的无限次重复博弈4.3.3 无限次重复古诺模型无限次重复古诺模型4.3.4 有效工资率有效工资率4.3.1 两人零和博弈的无限次重复博弈n两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈 该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈4,40,55,01,1HLHL无限次重复两寡头削价博弈 触发策略触发策略:第一阶段采用H,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。如果博弈方2采用L,总得益现值为 如果博弈方2采用H,总得益现值为 因此当 时,此触发策略纳什均衡策略两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0)4.3.3 无限次重复古诺模型 假定假定:,边际成本都为2。在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡:在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。设厂商1已采用该触发策略,若厂商2也采用该触发策略,则每期得益4.5,无限次重复博弈总得益的现值为:如果厂商2偏离上述触发策略,则他在第一阶段所选产量应为给定厂商1产量为1.5时,自己的最大利润产量,即满足:解得 ,此时利润为5.0625,高于触发策略第一阶段得益4.5。但从第二阶段开始,厂商1将报复性地永远采用古诺产量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为:当 上述策略是厂商2对厂商1的同样触发策略的最佳反应,否则偏离是最佳反应。4.3.4 有效工资率模型设定模型设定:首先厂商选择工资率为 ,然后工人选择接受或拒绝。如果拒绝,则他作个体户得到收入 小于 ,如果接受 ,则工人选择努力工作(负效用 )还是偷懒(无负效用)。厂商只能看到产量高低,高产量为 ,低产量0。工人努力工作时一定是高产量 ,不努力时却并不一定是0,而是高产量 的概率为 ,低产量0的概率为 。工人努力工作时,厂商得益为 ,工人得益为 ;工人偷懒时,厂商期望得益为 ,工人得益为 。考虑如下的触发策略考虑如下的触发策略:厂商在第一阶段给工资率 ,在第t阶段,如果前面t-1阶段结果都是 则继续给 ,否则从此永远是 。工人的策略是如果 则接受,否则宁愿作个体户得到 ,并在以前各期结果都是 和当前工资率为 时努力工作,否则偷懒。设厂商已采用上述触发策略。由于 ,工人接受工作是最佳反应。用 记工人努力工作时无限次重复博弈得益的现值,则 即 用 记工人选偷懒时无限重复博弈得益的现值,则:即 因此当 即时,努力是工人的最佳选择。反过来,设工人已采用上述触发策略。若厂商给的工资率满足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段的得益为 ,无限次重复博弈得益现值为 。若不愿给 ,则解雇工人,以后得益为0。因此只要 ,厂商选择前述触发策略就是最佳反应。综上所述,在满足的条件下,双方的触发策略构成一个纳什均衡。而上述两式实际上意味着即工人努力的产出扣除努力负效用后的剩余,必须不小于工人作个体户的收入即机会成本,加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。最后这个不等式正是存在有效工资率,工作激励有效的基本条件。重复博弈和信誉问题重复博弈和信誉问题n如果博弈不是一次的,而是重复进行的,参与如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。与一次博弈大不相同。n重复博弈理论的最大贡献是对人们之间的合作重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。弈无限重复,合作就可能出现。社会关系与合作行为n更一般地讲,市场交易常常镶嵌在复杂的社会关系中。这种关系可以提高交易的合作程度。这也是人们愿意发展社会关系的原因。应用n家庭血缘关系;n朋友关系;n同学关系;n老乡关系(保姆市场);家族企业的困境;“杀熟”n如果惩罚对惩罚者本身的损害太大,惩罚就是不可信的。这与投鼠忌器是一个道理,你讨厌老鼠,但是你没有办法,因为你心疼那个盘子,那个器皿。投鼠忌器在我们企业内部很多环节都会发生,导致惩罚不可信,所以对方就不会太注重信誉。家族成员有时候比非家族成员更不可信任,更不守规矩,就是这个道理。n朋友专门骗朋友,是“杀熟”。问题也与惩罚的不可信有关。n59岁为什么是腐败高危的年段?
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:第5重复博弈与合作行为.pptx
    链接地址:https://www.zixin.com.cn/doc/4232043.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork