博弈中的均衡理论/圆形时钟

来源:百度文库 编辑:神马文学网 时间:2024/04/29 13:32:56
博弈中的均衡理论

在《童区寄传》中,我们说,区寄与强盗的博弈最后形成的是一种纳什均衡。为什么这样说呢?
首先我们看看纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。也就是说,纳什均衡是各自认为做出了对自己最有利的选择。
在区寄与强盗的博弈中,两个强盗他们的选择始终是贩卖区寄从而获取财物,区寄在确定对方选择的情况下,只能做出反抗和服从两种选择。区寄选择了反抗,这对他来说是自己的最佳选择,尽管这对强盗来说不是最佳选择。当第一位强盗死在区寄手中,而区寄又落到第二位强盗手中的时候,强盗开始对自己的选择产生怀疑,这时强盗存在杀死区寄还是继续出卖区寄的选择,区寄也存在“坐以待毙”和“起而拯之”两种选择,区寄又作出了“起而拯之”的选择。在区寄的煽动下,强盗被金钱冲昏了头脑,坚持原来的选择,即出卖区寄,因为在他看来,杀死区寄得不到任何好处,但出卖区寄还可以独吞收入,因此,两相权衡,他接受了区寄的劝告,放弃了杀死区寄的念头。在这种情况下,区寄仍然坚持了他的反抗选择,最后杀死第二名强盗,不仅维护了自己“自由人”的地位,还获得了“荣誉称号”——比战国时期13岁能杀人的秦舞阳还厉害。
区寄和强盗博弈的纳什均衡是两名强盗先后丧命,区寄重新获得人身自由,并蜚声乡里。但是,如果我们撇开道德因素不谈,区寄和强盗相互间有没有更好大的选择呢?两名强盗绑架区寄,因为不知道这个小家伙的厉害而导致一位“仁兄”丧命,这时候另一位仁兄再次俘获区寄的时候,如果杀死区寄,肯定比丧命区寄之手要强,但肯定一分钱也得不到;如果他汲取自己伙伴的死亡教训,放了区寄,也比丧命区寄手中要强,但也拿不到一分钱。因此,他还是选择了贩卖区寄,最终自己也死在区寄手上。也许有人说,如果第二位强盗如果理智点,放了区寄,甚至与区寄“约法三章”,强盗不再侵犯区寄,区寄也不去官府告发,不就比被杀要好吗?但从强盗的角度来说,谁又能保证区寄不告发了,与其“约法三章”,还不如杀死区寄,与其杀死区寄,还不如卖了区寄,所以,强盗始终认为自己的选择是正确的,他也只能做出这样的选择,区寄也只能做出不择手段杀死强盗的选择。因此,双方的非合作性博弈是不可避免的。
但是,这种“一边倒”的博弈在现代生活中是不常见的,也是众多博弈双方不希望见到,因为这种你死我活的博弈对一方来说意味着全部完蛋,一方全盘胜利,而事实上,无论合作性博弈还是非合作性博弈,无论零和博弈、常和博弈还是变和博弈,无论是双方博弈,还是多方博弈,博弈各方都会根据自己和对方的实力而调整自己的策略,最终追求的是一种均衡,而纳什均衡仅仅是博弈均衡中的一种,所以,对博弈学来说,均衡是博弈学中的重要概念。那么,博弈学中的均衡应该是一种怎样的概念呢?
均衡是相对稳定的。在均衡的状态下,不会有明显的变化,也不会有激烈的利益冲突。各种要素都对自己的贡献和回报感到满意。也有积极性和安全感做出更多的努力和贡献。也就是说,均衡是各种力量或者各种利益在当时的情况下获得的和谐统一。我们知道,在博弈初始,每个人都制定了自己的目标和计划,但这种开始往往是在“知己而不知彼”或者“知己而不充分知彼”的情况下作出的决定。随着各方的相互接触,对“己方”和“彼方”的实力都有一定的认识,双方进入拉锯和磨合期,在彼此最初制定的目标和计划不能达到的情况下,往往会根据双方的实力作出新的目标,这就是一轮新的博弈。最后往往是双方根据各自的实力形成彼此有得有失的“均衡”。所以,均衡首先是一种感受。要细细体味存在的各种力量,感受它们的运动变化趋势,在一种整体的感觉中虚化它们,力求达到一种对等。但均衡未必是对等,至少是在某些方面难以实现对等,而且均衡往往需要通过协调来实现。
在区寄与强盗的博弈中,双方形成的是一种“一边倒”的纳什均衡,但在常见的博弈中,更多的往往是相互有得有失的纳什均衡或者均衡。
例如,博弈学中有名的智猪博弈。其博弈策略如下:假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,揿一下按钮会有10个单位的猪食进槽。若小猪去揿,大猪在食槽边等吃,大猪可吃到9个单位,小猪只能吃到1个单位;若大猪去揿,小猪在食槽边等吃,小猪可吃到4个单位,大猪吃到6个单位;若同时去揿,奔过来再同时吃,大猪可吃到7个单位,小猪吃到3个单位。在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待。而由于小猪总是会选择等待,大猪无奈之下只好去揿按钮。因为,小猪根本不会去按按钮。这实际上就是一种均衡,也是纳什均衡。但在现实生活中却真正存在,为什么大股东总“心甘情愿”监督公司,小股东却不闻不问;为什么偏僻地区富人愿意出钱修路,穷人却坐享其成,关键是小股东和大股东,穷人和富人是一对智猪博弈的关系。
又如,斗鸡博弈。两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,往往双方骑虎难下,都采取各种措施,以迫使对方退却。但到最后的关键时刻,必有一方要退下来。这就是美苏争霸时期,古巴导弹危机,美苏嘴上毫不退让,但谁都知道核战争打起来是两败俱伤,于是当双方却终于达成一种均衡,苏联从古巴撤出导弹,美国退出封锁,而且还象征性地从土耳其撤换导弹。虽然世界处于核战争地边缘,但最终一方妥协,另一方做出某种姿势,表示支持。同样的道理,为什么夫妻争吵到最后,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火,就是给自己和对方一个下台界,形成一种均衡。
',1)">
',2)">