混合策略纳什均衡(下)2013.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 混合 策略 均衡 2013
- 资源描述:
-
北京邮电大学北京邮电大学本科选修课程本科选修课程信息经济学信息经济学高丛高丛1HUA1SHIJIE100VIP.SINA.COM混合策略纳什均衡第三章 混合策略纳什均衡(下)35 多重纳什均衡及其甄别许多博弈往往有不止一个纳什均衡,有时候甚至有无穷多个纳什均衡。当这种情况出现时,哪个纳什均衡最有可能成为最终的博弈结果?这往往取决于某种能使局中人产生一致性预测的机制或判断标准。2013年11月4日2新浪微博:一花一世界economics本节初步介绍一些甄别多重纳什均衡的机制或判别标准(一)帕累托优势标准(二)风险优势标准(三)帕累托标准与风险优势的关系(四)聚点均衡(五)相关均衡(六)抗共谋均衡(七)颤抖手精炼均衡2013年11月4日3新浪微博:一花一世界economics(一)帕累托优势标准虽然有些博弈存在多个纳什均衡,但这些纳什均衡之间很可能存在明显的优劣差异,造成所有局中人都偏好同一个纳什均衡的可能。一种情况是,博弈的某一个纳什均衡给所有局中人带来的得益,都大于其他纳什均衡给他们带来的得益。在这种情况下,局中人不会面临任何进一步选择的困难,因为所有局中人对于纳什均衡的理性选择倾向,都表现出一致。2013年11月4日4新浪微博:一花一世界economics哈萨尼(John C.Harsanyi)泽尔滕(Reinhard Selten)按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德国的泽尔滕教授的说法,这种按照支付大小筛选出来的纳什均衡,比其他纳什均衡具有帕累托优势。这种按照支付大小筛选纳什均衡的标准,称为帕累托优势标准。2013年11月4日5新浪微博:一花一世界economics帕累托优势均衡的例子很多:猎人博弈1010400444乙甲猎鹿打兔猎鹿打兔2013年11月4日6新浪微博:一花一世界economics帕累托(Vilfredo Pareto,1848-1923)法国巴黎出生的意大利经济学家。自从现代经济学主要关注社会资源的配置以来,经济学家求同存异,逐渐撇开一般效率评价的许多分歧,倾向于接受以帕累托命名的所谓帕累托效率标准。经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。要想再改善任何人的境况都必须损害别的人的利益了,这时候就说一个经济已经实现了帕累托效率。2013年11月4日7新浪微博:一花一世界economics(二)风险优势标准如果按照支付标准或者说帕累托优势标准,难以确定局中人将采用两个或多个纳什均衡中的哪一个纳什均衡规定的策略的时候,可以考虑不同纳什均衡之间的风险状况,风险小的优先。2013年11月4日8新浪微博:一花一世界economics风险优势标准99800877乙甲左右上下2013年11月4日9新浪微博:一花一世界economics风险优势标准:具体方法期望赢利比较法偏离损失比较法2013年11月4日10新浪微博:一花一世界economics偏离损失比较法6(A)650054(B)4乙左右甲上下2013年11月4日11新浪微博:一花一世界economics风险偏离损失乘积比较法0M/20(B)M0(A)M-m0M-m乙LR甲UD2013年11月4日12新浪微博:一花一世界economics(三)帕累托标准与风险优势的关系如果在一个博弈中,按照帕累托效率的标准筛选出的纳什均衡,与按照风险优势标准筛选出来的纳什均衡不一致时,我们应当选择哪一个呢?2013年11月4日13新浪微博:一花一世界economics帕累托标准与风险优势的关系6(A)651000100054(B)4乙左右甲上下2013年11月4日14新浪微博:一花一世界economics范丹墨(E.van Damme)维布尔(J.W.Weibull)斯堪的纳维亚经济学杂志(Scandinavian Journal of Economics)1995年第一期,荷兰范丹墨教授和瑞典维布尔教授合写的文章。“在帕累托标准和风险标准之间,理论给帕累托优势以优先权,而风险优势只有在局中人面临不知道选哪个均衡好的不确定性的时候,才变得重要。当一个均衡具有帕累托优势的时候,局中人一定选择这个均衡,不确定性就不存在了。”2013年11月4日15新浪微博:一花一世界economics另外的思考:经济学形成有限理性的理念(bounded rationality)进入行为经济学的天地(behavioral economics)2013年11月4日16新浪微博:一花一世界economics(四)聚点均衡萨林(Schelling,1960)在现实生活中,局中人可能会使用某些被博弈模型抽象掉的信息来达到一个均衡。事实上,对于一些既不存在帕累托优劣关系,也不存在风险优劣关系的博弈,人们往往都是利用聚点均衡的思想来指导自己的决策行动。2013年11月4日17新浪微博:一花一世界economics张维迎教授博弈论与信息经济学情侣博弈的聚点均衡:生日“提名博弈”2013年11月4日18新浪微博:一花一世界economics习俗和默契靠右行驶中国、美国、俄国靠左行驶英国、澳大利亚、日本聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,往往受博弈双方文化背景中的习惯或规范的影响,很难总结出能够形成条条杠杠具有普遍性的规律,只能具体问题具体分析地讨论。2013年11月4日19新浪微博:一花一世界economics(五)相关均衡(correlated equilibrium)奥蒙,1974局中人通过一个大家都能观测到的共同信号来选择行动,由此确定博弈的最终结局。相关均衡往往可能是局中人事前磋商的结果。相关均衡是局中人主动设计某种形式的选择机制形成制度安排从而确定对局结果的一种均衡选择。2013年11月4日20新浪微博:一花一世界economics相关均衡15004451乙甲左右上下2013年11月4日21新浪微博:一花一世界economics这个博弈存在三个纳什均衡:(上,左)、(下,右)和一个混合策略:每个局中人以相同的概率选择两种纯策略,各得2.5的期望支付。假定局中人双方事前同意根据到达集合地点的先后顺序采取行动(“甲先到,走甲上乙左均衡;乙先到,走甲下乙右均衡”)。2013年11月4日22新浪微博:一花一世界economics奥蒙还证明,如果能在局中人当中设计出一种机制,使得每个局中人收到不同的但相关的信号,则每个局中人还可以获得更高的期望支付。例如:以相同的可能性(各1/3)发出A、B、C三种信号;局中人甲只能观察到信号是否是A,局中人乙只能观察到信号是否是C。2013年11月4日23新浪微博:一花一世界economics可以验证:甲收到信号A采用策略“上”,否则采用策略“下”;乙收到信号C则采用策略“右”,否则采用策略“左”,是一个纳什均衡。但是,相关均衡在现实生活中的可操作性如何?是谁?“以相同的可能性发出A、B、C三种信号。”2013年11月4日24新浪微博:一花一世界economics(六)抗共谋均衡(coalition-proof equilibrium)经济学家本海姆(B.Douglas Bernheim)、别列葛(Bezalel Peleg)、温斯顿(Michael D.Whinston)在1987年的两篇论文中提出了抗共谋纳什均衡的概念。2013年11月4日25新浪微博:一花一世界economics抗共谋均衡:矩阵A0,0,10-5,-5,0-5,-5,01,1,-5乙甲LRUD2013年11月4日26新浪微博:一花一世界economics抗共谋均衡:矩阵B-2,-2,0-5,-5,0-5,-5,0-1,-1,5乙甲LRUD2013年11月4日27新浪微博:一花一世界economics集体偏离有两种:一种是能够利益维持的,就是若干局中人合伙偏离以后,在其他局中人的策略选择仍然不变的条件下,他们不会散伙。另外一种是不能利益维持的集体偏离,就是若干局中人合伙偏离以后,哪怕其他局中人的策略选择继续保持不变,原来合伙偏离的局中人之中,有人因为利益驱使,还要再改变策略选择。2013年11月4日28新浪微博:一花一世界economics通俗地说抗共谋纳什均衡的概念,不仅要求“单独偏离”没有好处,而且要求“不散伙的合伙偏离”也没有好处。事实上,在排除了共谋的影响后,多人博弈与二人博弈之间的区别,就不那么明显了,从而我们在前面介绍的筛选多重纳什均衡的分析方法,就都可以使用了。2013年11月4日29新浪微博:一花一世界economics抗共谋均衡仍然是关于非合作博弈的均衡概念抗共谋均衡讨论中局中人之间的共谋行为,都是没有强制力的,完全是建立在各局中人自觉自愿的利益基础上,它与后面合作博弈中谈到的各局中人之间允许用协议的方式强制执行的合作行为并不是一码事。2013年11月4日30新浪微博:一花一世界economics从学术发展的历史脉络讲,强均衡与抗共谋均衡是不同的概念。抗共谋均衡的概念是奥蒙提出的“强均衡”(strong equilibrium)概念条件的放宽。(Aumann,1959)强均衡要求,在其他局中人的策略选择给定的条件下,不存在局中人集合的任意一个子集所构成的联盟,能够通过联合偏离当前的策略选择而增加联盟中所有成员的支付。强均衡一定是抗共谋均衡,但是抗共谋均衡未必是强均衡。例如上例博弈中,不存在强均衡策略组合。2013年11月4日31新浪微博:一花一世界economics富登博格和梯若尔博弈论(Drew Fudenberg and Jean Tirole,Game Theory,The MIT Press,1991)抗联盟均衡的定义依联盟的规模归纳地给出。首先,它要求没有单局中人联盟会偏离,也就是说,所论的策略组合是一个纳什均衡。接着,它要求没有双局中人的联盟会偏离,条件是在这样的偏离发生以后,合伙偏离的局中人之中的任何一个(而不是任何其他人),都可以再次自由偏离。这就是说,在其他局中人的策略选择不变而导出的二人博弈中,所论的二人合伙偏离必须是这个二人博弈的纳什均衡。这样归纳地做下去,直至所有局中人的联盟。2013年11月4日32新浪微博:一花一世界economics抗共谋均衡已经成为判别一个纳什均衡是否稳健(robust)的重要标准。直到1994年格罗斯曼(Grossman,G.M.)和赫朴曼(Helpman E.)在American Economic Review上发表了一篇关于贸易保护的文章,以“抗共谋均衡”的概念作为他们的理论依据,直接把本海姆等人的理论结果搬到贸易行为的分析中,才引起经济学界对这个概念的重视。自此之后,抗共谋均衡的概念在经济学的各个领域得到广泛的使用。Dixit、Grossman和Helpman还对抗共谋均衡的理论结果作了进一步的发展。2013年11月4日33新浪微博:一花一世界economics(七)颤抖手精炼均衡人们的“理性行为”,是几十年来现代经济学讨论的基本假设。但是现实生活中人们的行为模式,很难符合理性行为的假设或者说理性人的假设。泽尔滕在1975年的一篇论文把这一思想引入到博弈论的研究中,提出了颤抖手精炼均衡(trembling-hand perfect equilibrium)或者简称颤抖手均衡的概念,进一步精炼纳什均衡。2013年11月4日34新浪微博:一花一世界economics泽尔滕的基本思想是:在任何一个博弈中,每一个局中人都有一定的犯错误的可能性。泽尔滕将局中人发生错误选择(即偏离均衡策略)的情况形象地说成是“颤抖手”,当某个局中人突然发现一个理性条件下不该发生的事件发生时,他把这个不该发生的事件归结为某一个别的局中人的非蓄意的失误。2013年11月4日35新浪微博:一花一世界economics原博弈的均衡,可以理解为被“颤抖”扰动后的博弈的均衡的极限。由于局中人的“手”(策略选择)可能“颤抖”(偏离纳什均衡的要求),致使他们的策略集中的每一个纯策略都有被选中的可能,即每一个纯策略被选中的概率都严格为正。2013年11月4日36新浪微博:一花一世界economics在给出颤抖手精炼均衡的正式定义以前,先看下面的例子:11-300-300BALRUD2013年11月4日37新浪微博:一花一世界economics(U,L)和(D,R)都是纳什均衡其中(U,L)是优势策略均衡,但(D,R)只是相对优势策略均衡。只要局中人B不选择L,D就是局中人A的最优选择;同样,只要局中人A不选择U,R就是局中人B的最优选择。在没有正式定义颤抖手纳什均衡之前,基于前面关于颤抖手均衡概念原始思想的介绍,我们先考虑这样一个问题:(D,R)应该是一个将定义的颤抖手均衡吗?2013年11月4日38新浪微博:一花一世界economics对比之下,(U,L)却应该是一个颤抖手均衡:无论局中人A犯错误的概率有多大,只要犯错误的概率小于1,局中人B都没有激励要选择R;同样地,无论B犯错误的概率有多大,只要小于1,局中人A都没有激励选择D。2013年11月4日39新浪微博:一花一世界economics泽尔滕1975年论文的证明结果,作为颤抖手均衡的定义:定义3.4在n人策略式表述的博弈中,,;,11nnuuSSG=),(1npp 我们说纳什均衡构成一个颤抖手精炼均衡,如果对于每一个局中人i,存在一个严格混合策略序列mip满足下列条件:1)对于每一个i,;limimimpp=2)对于每一个和每一个ipm,2,1=是对策略组合),(111mnmimimmippppp+=的最优反应,即)(.,maxargmiiipup。2013年11月4日40新浪微博:一花一世界economics)(.,maxargmiiipup是比较学术化的写法ip)(.,miipu是使目标函数达到最大的一个自变量。其中,目标函数表达中的小圆点,表示这个自变量的位置,max表示最大,arg表示自变量。因此该数学公式表示ip是使得目标函数)(.,miipu达到最大的自变量之一。2013年11月4日41新浪微博:一花一世界economics需要强调的是,上述定义中的mipip必须是严格混合策略,即选择每一个纯策略的概率都严格为正。条件1)意味着,尽管每一个局中人i都有可能会犯错误,但错误收敛于0。条件2)意味着,每一个局中人所选择的策略不仅在其他人不犯错误时是最优的(即符合纳什均衡的条件),而且在其他人错误地选择了)(imipp时也是最优的。2013年11月4日42新浪微博:一花一世界economics颤抖手精炼均衡定义中的条件2),也可以改写如下:对于每一个i,存在非负整数iMiMm 使得当时,ip是对策略组合),(111mnmimimmippppp+=的最优反应,即)(.,maxargmiiipup,iMm。2013年11月4日43新浪微博:一花一世界economics这是因为从数学分析我们知道,去掉序列的有限项,不影响序列的极限性态。事实上,序列中任何确定的有限项,一定位于序列“开始的部分”,而除了序列求和之类的整体数量计算以外,关于序列性质的讨论,总是关于序列极限性态的讨论。2013年11月4日44新浪微博:一花一世界economics颤抖手精炼的纳什均衡:例3.4考虑每个局中人各有三种纯策略可供选择的如下二人策略型博弈,A有上、中、下三个策略,B有左、中、右三个策略。各种策略对阵的得益如下图中数目所示。2013年11月4日45新浪微博:一花一世界economics颤抖手精炼的纳什均衡的例子12410312212011211112381132BA左中右上中下2013年11月4日46新浪微博:一花一世界economics左上方是颤抖手精炼的纳什均衡现在证明:左上方(上策略,左策略)得(4,12)的均衡,是颤抖手精炼的纳什均衡。首先,对上图的博弈采用混合策略的概率表达;如下图,2013年11月4日47新浪微博:一花一世界economics对上图的博弈采用混合策略的概率表达设A选择上策略的概率q,选择中策略的概率是r,那么他选择下策略的概率是1-q-r;设B选择左策略的概率是s,选择中策略的概率t,那么他选择右策略的概率是1-s-t。2013年11月4日48新浪微博:一花一世界economics颤抖手精炼的纳什均衡的例子12410312212011211112381132BA左中右上中下st1-s-tqr1-q-r2013年11月4日49新浪微博:一花一世界economics采用混合策略表达,左上方(上策略,左策略)得(4,12)这个纳什均衡(pA,pB),其中pA=(q,r,1-q-r)=(1,0,0)其中pB=(q,r,1-q-r)=(1,0,0)要说明(pA,pB)是一个颤抖手均衡,按照)1,1,21(mmmpmA=mBpm=2,3,,构造很明显,mAp收敛到Ap,mBp收敛到Bp,即条件1)成立。2013年11月4日50新浪微博:一花一世界economics下面考察对于每一个m=2,3,,Ap)1,1,21()1,(mmmtstspmB=是不是对于策略组合的最优反应。局中人A的期望支付是EUA=q4(m-2)+3+2/m+r0(m-2)+2+1/m+(1-q-r)3(m-2)+1+2/m=qm-3r(m-2)+(3m-3)/m可见,策略组合pA=(q,r,1-q-r)=(1,0,0)的确是局中人A对于局中人B的策略组合)1,1,21()1,(mmmtstspmB=的最优反应。2013年11月4日51新浪微博:一花一世界economics同样可知,pB=(q,r,1-q-r)=(1,0,0)是局中人B对于局中人A的策略组合的最优反应。可见,条件2)也成立。至此我们知道,(pA,pB)这个纳什均衡,是颤抖手纳什均衡。另外,泽尔滕1975年的一篇论文还证明了一个与纳什订理平行的定理:每一个有限同时博弈至少存在一个颤抖手精炼纳什均衡。2013年11月4日52新浪微博:一花一世界economics最后需要说明的是,按照上面的定义,为了论证),(nipp mip构成一个颤抖手精炼纳什均衡,我们只需要给每个局中人找到一个满足条件1)和2)的严格混合策略序列便可,而不需要证明,对任意满足条件1)的严格混合策略序列ip都是局中人i在给定其他局中人的策略组合mip条件下的最优反应。2013年11月4日53新浪微博:一花一世界economics强颤抖手精炼均衡(truly trembling-hand perfect equilibrium)如果后者成立,则我们称这个颤抖手精炼均衡是强颤抖手精炼均衡。需要注意的是,此时条件2)不能像前面讨论颤抖手精炼纳什均衡那样进行改写。强颤抖手精炼均衡的条件要比颤抖手精炼均衡本身强得多,有些博弈虽然存在颤抖手精炼均衡,但却不存在强颤抖手精炼纳什均衡。2013年11月4日54新浪微博:一花一世界economics甄别多重纳什均衡的机制或判别标准讨论同一商品在不同人的心中的保留价格不同多标准就可能存在多种矛盾价值观冲突:论语述而篇第七子曰:“饭疏食,饮水,曲肱而枕之,乐亦在其中矣。不义而富且贵,于我如浮云。”论语子路篇第十三子曰:“无欲速,无见小利。欲速,则不达;见小利,则大事不成。”2013年11月4日新浪微博:一花一世界economics55为什么柯出于木而反身能修木?诗经伐柯伐柯如何?匪斧不克。取妻如何?匪媒不得。伐柯伐柯,其则不远。我觏之子,笾豆有践。伐柯:采伐做斧头柄的木材。匪:同“非”。取:通“娶”。觏:遇见。则:原则、方法。此处是强调砍伐时应遵照一定的方法。笾:竹编的礼器,用来盛果脯。豆:木制、金属制或陶制的器皿,用来盛放腌制的食物和酱。2013年11月4日新浪微博:一花一世界economics56为什么青出于蓝而胜于蓝?荀子劝学篇君子曰:学不可以已。青,取之于蓝,而青于蓝;冰,水为之,而寒于水。木直中绳,輮以为轮,其曲中规,虽有槁暴,不复挺者,輮使之然也。故木受绳则直,金就砺则利,君子博学而日参省乎已,则知明而行无过矣。故不登高山,不知天之高;不临深谿,不知地之厚也;不闻先生之遗言,不知学问之大也。干、越、夷、貉之子,生而同声,长而异俗,教使之然也。诗曰:“嗟尔君子,无恒安息。靖共尔位,好是正直。神之听之,介尔景福。”神莫大于化道,福莫长于无祸。2013年11月4日新浪微博:一花一世界economics57展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




混合策略纳什均衡(下)2013.pdf



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/5657775.html