孙子兵法的博弈分析.docx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 孙子兵法 博弈 分析
- 资源描述:
-
一、引言 很早以来,学者们就对如何阐明一般性的策略原则有着极大的兴趣,无论这策略是应用于战争、棋类游戏、还是政治。对于像中国古代战略家孙子这样的人来说,他们感兴趣是因为需要就眼前的事务出谋划策,而对其他人来说,他们的兴趣源自知性的好奇心。不管兴趣来源为何,对策略原理进行研究都是有意义的,因为它抓住了人类生存的基本性事实:首先,人们的命运是相互决定的;其次,这种互赖性一般情况下表现为人们的目标相互冲突;最后,前面两点说明战争不是偶然的,而是国家政策的有目的性的延续,并因此必须用理性去解释。 写于两千五百多年前的《孙子兵法》是人类有记载以来第一次试图连贯地、一般性地理解冲突和策略。它的年代对于我们来说并不太重要,重要的是它写于一个形成中的中国内部长年交战时期,其时各诸侯国富有外交和军事上的策略经验。所以我们应该认为《孙子兵法》系统整理了那个时代战略和战术方面的精湛洞见。对《孙子兵法》加深理解不光有助于我们了解孙子写作的那个年代,也能对今日冲突的本质加深认识。 但尽管我们可以假设孙子的洞见适用于过去和现在,我们不能以为我们对策 略的理解在过去两千五百年里没有进步。新的分析模式,包括决策论和数学应用, 已经进入了策略分析的领域并使我们的思考得到了精炼和概括。所以要想理解孙子对策略理论的贡献,我们必须搞清楚怎样在现在的背景下理解和分析他的著作,因为只有这样我们才能最大化《孙子兵法》的当代意义。这也是本文所要分析的问题。但我们的讨论不从孙子本人开始,而从二十世纪下半叶发展出来的策略行为理论---博弈论开始。博弈论既可以被看成是数学的一个分支,也可以被看成是政治学或者经济学的一个分支(Ordeshook, 1986)。简单地说,博弈论试图就如下情况下的决策得出一般性的、抽象的原则:一个人行为会有什么结果取决于他人的行为,而每个人又都知道他们的行为是互赖的。所以博弈论不仅能应用在军事战略规划上,也能用于分析商业公司在争夺利润和市场份额时,政客们为了赢得选举、委员会成员们为了形成对自己有利的派系,以及各个国家为了在合纵连横中占据有利位置而进行的决策行为。 二、孙子兵法中的博弈思想 博弈论(Game T}leory),又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论,一般认为博弈理论开始于1944年由Von Neu.ma和Mor即nstem合作的《博弈论与经济行为》一书的出版,近50年来,博弈论得到了很大的发展,逐渐成为了主流经济学的一部分,其应用范围遍及经济、政治、军事、外交等众多领域。以至于有人说,如果未来社会科学还有纯理论的话,那就是博弈论。 (1)博弈均衡 纳什均衡(№sh EqLlilibium)是博弈论中最基本的博弈均衡概念,它指的是这样一种由所有参与人的最优战略组成的战略组合。其最重要的特征就是(联合)自我支持,即在博弈均衡的状态下,每个参与人都没有动机去偏离自己的选择。而自我支持是以每个参与人的支付函数最大化为前提的。博弈分析的目的就是预测博弈的均衡结果。 《孙子兵法》首篇——《计篇》中对胜负的预测就与博弈均衡的分析是一致的:首先,要“经之以五事、校之以计而索其情”,“主孰有道?将孰有能?天地孰得?法令孰行?兵众孰强?士卒孰练?赏罚孰明?”分析这些影响支付函数的关键因素,就可以制定出有利于己方的作战方略,“计利以听,乃为之势,以佐其外”,这里的势,事实上就是由双方的支付函数所确定的一个博弈均衡局势,即“势者,因利而制权也”,所以孙子正是“以此知胜负”,通过“庙算”,虽“未战”,但“胜负见矣”。 纳什(1950)已经证明,任何有限博弈都存在至少一个纳什均衡,真正令博弈论专家棘手的问题是一个博弈可能有多个均衡,因此对纳什均衡的改进、精炼及选择成为了博弈论研究的热点,出现了一系列博弈均衡概念,从帕累托上策均衡、风险上策均衡、聚点均衡(schellin,1960)、相关均衡(Aumann,1974)到子博弈精炼纳什均衡、(精炼)贝叶斯纳什均衡、序贯均衡(Krep—WiIBon,1982)、颤抖手均衡(selten,1975)等,它们构成了现代博弈论的基本内容。 《孙子兵法》在对胜负的预测的基础上更强调其实现的途径、策略的选择和制定,他认为“不可胜在己,可胜在敌”(《形篇》),支付函数的值——“胜(负)”依赖于己方的策略——攻或守的转换,“不可胜者,守也;可胜者,攻也”又言“十则围之,五则攻之,倍则战之,敌则能分之,少则能守之,不若则能避之”(《谋攻篇》),从“围”至“避”,策略空间的细分和增大攻守的转换,可使支付函数发生巨变,“守则有余,攻则不足”,“故善战者,能为不可胜,不能使敌必可胜”,他将均衡作为变量,反过来决定策略的选择。 (2)理性假设与博弈过程 纳什均衡的预测假设每个参与者是理性的,而且理性是参与者的共同知识的,因此,纳什均衡需要共同的正确的推断,逆向归纳法成为分析动态博弈的有效方法。如果所有人预测到一个纳什均衡会出现,那么没有人有兴趣作不同的选择。但纳什均衡、或者哪一个纳什均衡会出现,却依赖于具体的博弈过程,参与人偶然的错误(有关对手决策的预测的错误,或者自己决策的错误)、或者参与人有意识地偏离纳什均衡路径将可能导致非纳什均衡结果的出现。泽尔腾(selten,1975)引入的颤抖手均衡使动态博弈的均衡的稳定性更强、预测更可靠,但颤抖手均衡本身并没有解决博弈参与人犯错误的问题,即使博弈的颤抖手均衡是唯一的,也不能保证对它预测就一定实现。前向归纳法遵循参与人未来的行为应与其过去的行为,包括偏离均衡路径的行为相一致的原则,视参与人有意的偏离为他发送的信号,它是精炼纳什均衡的另一种思路。这些似乎可以解决动态博弈均衡的精确预测,但对“蜈蚣博弈”(centipede Game)的分析表明并非完全如此。 《孙子兵法》认为“见胜不过众人之所知,非善之善者也”(《形篇》),孙子更推崇超出一般人的见识(理性)的博弈。他认为“古之善战者,胜于易胜者也”(《形篇》),“善战者之胜,无奇胜,无智名,无勇功”,“其战胜不忒”(《形篇》)。孙子的观点是一方的胜利往往是另一方的错误造成的,“先为不可胜,以待敌之可胜”,“立于不败之地,而不失敌之败也”(《形篇》),不要放过敌人招致失败的时机,要“先胜而后求战”,而非“先战而后求战胜”。可见孙子非常注重战争(博弈)过程的分析,伦敦大学著名的博弈论专家Binomone(1990)也指出改进博弈论必须模拟出局中人的思考方式,应该更多地注意均衡过程而不是均衡点。 (3)混合战略均衡 所谓混合战略是指参与人以某种概率分布随机地选择不同的行动。对应地参与人只选择某一特定行动的战略称为纯战略,在博弈论里,假定参与人的偏好关系满足V-N-M效用假设时,混合战略纳什均衡具有一个令人费解的特征,即在混合战略纳什均衡下:每个参与人在所构成均衡的纯战略之间是无差异的,均衡却要求每个参与人以特定的概率选择纯战略。据此,难道人们真的是使用类似掷硬币的方法来决定选择什么行动的吗?这一令人难以满意的结论,博弈论专家们对此给出了各种解释。 一种解释是视混合战略均衡作为一个随机稳定状态,均衡中混合战略中某一战略的概率被理解为选择这一战略的参与人数量的概率;另一解释是考虑一个给定的个人在一次博弈中的选择,依赖于不能被对手确定的特质性因素。这种因素在其他参与人或外部观察者看来似乎是“随机的”。混合战略均衡正体现了有关参与人视作不相关因素方面的行为依存关系。海萨尼在标准型博弈模型中,将影响局中人决策的随机波动因素化为微小的连续随机变量,其具体取值仅为相关的局中人所知,其他人不知,随机变量的分布为公共知识,这样,混合战略均衡等价于不完全信息下的纯战略均衡。这一解释被认为是具有重大意义和概念创新。 “见胜不过众人之所知,非善之善者也”(《形篇》),《孙子兵法》中应该说是较多地考虑这类不存在纯战略均衡的博弈。善战者,“先为不可胜,以待敌之可胜”(《形篇》),要“立于不败之地,而不失敌之败”(《形篇》),选择均衡的混合战略,虽“人皆知我所胜之形。而莫知吾所以制胜之形,故其战胜不复,而应形于无穷”(《虚实篇》),“不可胜在己,可胜在敌”(《形篇》),“运兵计谋,为不可测”(《九地篇》),参与人选择均混合战略,目的是给其他人制造出更多的不确定而自己立于“不败”,尽管对手知道他选择各种战略的概率,但并不能猜透他实际上会选择哪个战略,博弈重复而制胜之策却是不重复的。“能因敌变化而取胜者,谓之神。”(《虚实篇》) 三、博弈模型分析孙子兵法 (1)单人决策 为了理解博弈论的看法和能教我们的东西,也为了理解孙子的洞见,我们首先应该考察决策人只有一个时的情况,这个决策人必须从某个可选行为的集合里选取一个。要用决策论(decision theory)讨论这种问题,通常我们需要详细说明下列要素: (1)该决策者所能选择的所有行为。这个行为清单必须是详尽的,也就是说决策者必须最终从中选择其行为。清单里的行为也必须是排他的,换句话说决策者只能选择其中一项行为。 (2)所有可能的行为结果。这个结果清单也必须是详尽的和排他的。 (3)各行为与各结果之间的关系,也就是说某项具体行为被采取后会发 生什么结果。 与上述内容相对应的是,《孙子兵法》的第一篇一开始就细述了连接行为与结果的策略环境要素:道(内政、民心)、天(气候、天象、季节)、地(地形、远近等)、将(将领、领袖的品质)、法(国家和军队的组织、管理效率)。其中的“将”是与策略和行动相关的决策变量。 决策环境的另一个重要成分是决策参与者的目标(对各种不同结果的偏 好)。当然,国王和军队统帅的目标是显而易见的---赢得胜利。正如孙子所言,取得战争胜利实际上是一个国家生存所必需的:“兵者,国之大事,死生之地,存亡之道,不可不察也”(计篇);“其用战也胜”(作战篇)。不光如此,孙子还指出,对胜利的追求应该放在社稷安危的框架下考虑,不能太短视:“兵贵胜,不贵久”(作战篇)。 更具体地来说,《孙子兵法》的开始几篇有好几段与持久性冲突相关。这些段落我们可以这样理解:应该避免会耗尽己方资源的冲突。“百战百胜,非善之善者也;不战而屈人之兵,善之善者也”(谋攻篇)。所以,正确的目标不应仅仅是取得某场战斗的胜利,而是用最小的成本取胜,并为将来的可能冲突保持实力。此外,我们应该采取能最大化胜利果实的战术:“凡用兵之法,全国为上,破国次之”(谋攻篇)。 除了统帅之外,孙子也没有忽视那些在战争中实际执行任务的人们—士兵—的目标: “故杀敌者,怒也;取敌之利者,货也。故车战,得车十乘已上,赏其先得者”(作战篇)。 在最简单的---也就是没有不确定性的---决策环境中,我们假设每个行为都会导致一个定义精确的(well-defined)具体结果。在这种情况下,我们只需知道决策者对各种不同结果的偏好顺序,然后就能推测出决策者会选择的行为。但是在一种更普遍的决策环境中,也就是带有风险的决策环境中,我们或者决策者可能不确定某个具体行为会导致什么结果。 在简单的决策论里我们假设行为的结果由“大自然”决定,这个“自然”是指一个自身不具目的、不追求任何目标的实体。因为自然没有目标---它既无善意也无恶意---我们可以认为我们对它的行为不具影响力。我们只能对自然的各种可能行为给定概率。 举例来说,农夫在决定种植何种作物时面临的就是这种决策环境。农夫可以选择播撒不同的种子,土地的出产是结果;农夫的偏好顺序由各种结果的相对收益率决定;而自然的行为则可能跟该年的气候相关。在这个例子里,我们一般不会把自然当作一个仁慈的或者邪恶的生命;相反,我们只会给该年可能出现的各种气候特征一定的概率(而这可能由历史纪录决定)。 某个具体行为会导致的后果可以看成是在各种可能的结果中进行抽(lottery)。决策理论家们关注的一个问题是人们如何看待这些抽彩---对各个具体的结果的偏好决定了对这些结果组成的抽彩的偏好。总的来说,博弈理论家假设我们可以给各个结果一个价值---即用数字表达的偏好,这样我们就可以计算每个行为的预期值并且推测决策者会选择那个带来最大预期收益的行为。 我们在这里举个例子,请看图 1。图1假设决策者(代号1)必须在两个行为A 和B 中选择一个。自然也有两个行为可以选择,其选择每个行为的可能性分别为p 和1-p。方格里显示的是决策者给每个结果赋予的值。在这个例子里,行为A的预期值E(A)等于4p+2(1-p) = 2+2p行为B的预期值E(B)等于p+3(1-p) = 3-2p。如果E(A)>E(B),或者说2+2p>3-2p,即p >1/4,那么决策者选择A。如果p = 1/4, 决策者对选择A 还是B无所谓如果p<1/4,那么决策者喜欢B 超过A。 自然 P 1-p 4 2 1 3 A B 孙子偶尔也会对类似于上述的简单策略结构提出建议。比如他说: “凡火攻有五……发火有时,起火有日。时者,天之燥也;日者,月在箕、壁、翼、轸 也。凡此四宿者,风起之日也”(火攻篇)。 但《孙子兵法》仅有少数几处地方集中讨论主要对手是自然的决策问题。很明显,孙子意识到一个全面的决策结构包括自然的可能行为、决策者的策略、以及决策者的对手们所拥有的策略。“知彼知己,胜乃不殆;知天知地,胜乃可全”(地形篇)。因此,要探究事务深处,我们必须求助于博弈论和互动决策分析。 (2)博弈 我们上面对简单决策的讨论只是为了抛砖引玉。实际上,孙子很早就警告说我们不能停留于这种初级决策模型对行为和目标的讨论:“兵者,诡道也”(计篇)。我们显然不能欺诈自然,因为自然是没有思维的匿名实体。所以战争都是两人或更多人之间的策略互动,我们接下去要讨论的就是面对自然的决策与面对他人的决策的区别。 为了清楚说明这种区别的重要性,我们把图 1 中的自然换为另一个决策人(代号2),此人也有两个选择:C 和D。所以1 号采取某项行为会有什么结果取决于2 号的行为,反之亦然。另外,我们假设这第2 个人的目标与第1 个人有所不同:具体地说,他们两人的偏好正相反,就象军事冲突双方通常遇到的情况。图2描述了这种新局面,每个方格中的第一个数字是第1 个人的收益,而第二个数字是第2 个人的收益。展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




孙子兵法的博弈分析.docx



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/6707679.html