博弈中的均衡理论

来源:百度文库 编辑:神马文学网 时间:2024/04/28 21:28:55

博弈中的均衡理论

    在《童区寄传》中,我们说,区寄与强盗的博弈最后形成的是一种纳什均衡。为什么这样说呢?

    首先我们看看纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。也就是说,纳什均衡是各自认为做出了对自己最有利的选择。

    在区寄与强盗的博弈中,两个强盗他们的选择始终是贩卖区寄从而获取财物,区寄在确定对方选择的情况下,只能做出反抗和服从两种选择。区寄选择了反抗,这对他来说是自己的最佳选择,尽管这对强盗来说不是最佳选择。当第一位强盗死在区寄手中,而区寄又落到第二位强盗手中的时候,强盗开始对自己的选择产生怀疑,这时强盗存在杀死区寄还是继续出卖区寄的选择,区寄也存在“坐以待毙”和“起而拯之”两种选择,区寄又作出了“起而拯之”的选择。在区寄的煽动下,强盗被金钱冲昏了头脑,坚持原来的选择,即出卖区寄,因为在他看来,杀死区寄得不到任何好处,但出卖区寄还可以独吞收入,因此,两相权衡,他接受了区寄的劝告,放弃了杀死区寄的念头。在这种情况下,区寄仍然坚持了他的反抗选择,最后杀死第二名强盗,不仅维护了自己“自由人”的地位,还获得了“荣誉称号”——比战国时期13岁能杀人的秦舞阳还厉害。

    区寄和强盗博弈的纳什均衡是两名强盗先后丧命,区寄重新获得人身自由,并蜚声乡里。但是,如果我们撇开道德因素不谈,区寄和强盗相互间有没有更好大的选择呢?两名强盗绑架区寄,因为不知道这个小家伙的厉害而导致一位“仁兄”丧命,这时候另一位仁兄再次俘获区寄的时候,如果杀死区寄,肯定比丧命区寄之手要强,但肯定一分钱也得不到;如果他汲取自己伙伴的死亡教训,放了区寄,也比丧命区寄手中要强,但也拿不到一分钱。因此,他还是选择了贩卖区寄,最终自己也死在区寄手上。也许有人说,如果第二位强盗如果理智点,放了区寄,甚至与区寄“约法三章”,强盗不再侵犯区寄,区寄也不去官府告发,不就比被杀要好吗?但从强盗的角度来说,谁又能保证区寄不告发了,与其“约法三章”,还不如杀死区寄,与其杀死区寄,还不如卖了区寄,所以,强盗始终认为自己的选择是正确的,他也只能做出这样的选择,区寄也只能做出不择手段杀死强盗的选择。因此,双方的非合作性博弈是不可避免的。

    但是,这种“一边倒”的博弈在现代生活中是不常见的,也是众多博弈双方不希望见到,因为这种你死我活的博弈对一方来说意味着全部完蛋,一方全盘胜利,而事实上,无论合作性博弈还是非合作性博弈,无论零和博弈、常和博弈还是变和博弈,无论是双方博弈,还是多方博弈,博弈各方都会根据自己和对方的实力而调整自己的策略,最终追求的是一种均衡,而纳什均衡仅仅是博弈均衡中的一种,所以,对博弈学来说,均衡是博弈学中的重要概念。那么,博弈学中的均衡应该是一种怎样的概念呢?

    均衡是相对稳定的。在均衡的状态下,不会有明显的变化,也不会有激烈的利益冲突。各种要素都对自己的贡献和回报感到满意。也有积极性和安全感做出更多的努力和贡献。也就是说,均衡是各种力量或者各种利益在当时的情况下获得的和谐统一。我们知道,在博弈初始,每个人都制定了自己的目标和计划,但这种开始往往是在“知己而不知彼”或者“知己而不充分知彼”的情况下作出的决定。随着各方的相互接触,对“己方”和“彼方”的实力都有一定的认识,双方进入拉锯和磨合期,在彼此最初制定的目标和计划不能达到的情况下,往往会根据双方的实力作出新的目标,这就是一轮新的博弈。最后往往是双方根据各自的实力形成彼此有得有失的“均衡”。所以,均衡首先是一种感受。要细细体味存在的各种力量,感受它们的运动变化趋势,在一种整体的感觉中虚化它们,力求达到一种对等。但均衡未必是对等,至少是在某些方面难以实现对等,而且均衡往往需要通过协调来实现。

 

    在区寄与强盗的博弈中,双方形成的是一种“一边倒”的纳什均衡,但在常见的博弈中,更多的往往是相互有得有失的纳什均衡或者均衡。

    例如,博弈学中有名的智猪博弈。其博弈策略如下:假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,揿一下按钮会有10个单位的猪食进槽。若小猪去揿,大猪在食槽边等吃,大猪可吃到9个单位,小猪只能吃到1个单位;若大猪去揿,小猪在食槽边等吃,小猪可吃到4个单位,大猪吃到6个单位;若同时去揿,奔过来再同时吃,大猪可吃到7个单位,小猪吃到3个单位。在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待。而由于小猪总是会选择等待,大猪无奈之下只好去揿按钮。因为,小猪根本不会去按按钮。这实际上就是一种均衡,也是纳什均衡。但在现实生活中却真正存在,为什么大股东总“心甘情愿”监督公司,小股东却不闻不问;为什么偏僻地区富人愿意出钱修路,穷人却坐享其成,关键是小股东和大股东,穷人和富人是一对智猪博弈的关系。

    又如,斗鸡博弈。两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,往往双方骑虎难下,都采取各种措施,以迫使对方退却。但到最后的关键时刻,必有一方要退下来。这就是美苏争霸时期,古巴导弹危机,美苏嘴上毫不退让,但谁都知道核战争打起来是两败俱伤,于是当双方却终于达成一种均衡,苏联从古巴撤出导弹,美国退出封锁,而且还象征性地从土耳其撤换导弹。虽然世界处于核战争地边缘,但最终一方妥协,另一方做出某种姿势,表示支持。同样的道理,为什么夫妻争吵到最后,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火,就是给自己和对方一个下台界,形成一种均衡。

 

 

    唐代著名的文学家、哲学家柳宗元在贬到今天广西柳州当刺史的时候,曾经记载了发生在湖南郴州的一个小孩徒手杀死两名强盗的真实故事。这篇文章名为《童区寄传》,翻译出来意思如下:

    儿童区寄,是湖南郴州地区打柴放牛的孩子。一天,他正一边放牛一边打柴,有两个蛮横的强盗把他绑架了,反背着手捆起来,用布蒙住他的嘴,离开本乡四十多里地,想到集市上把他卖掉。区寄装着小孩儿似的哭哭啼啼,害怕得发抖,做出一幅孩子常有的胆小的样子。强盗并不把他放在心上,相对喝酒,喝醉了。其中一个强盗离开前去集市谈买卖孩子的生意,另一个躺下来,把刀插在路上。区寄暗暗看他睡着了,就把捆绑自己的绳子靠在刀刃上,用力地上下磨动,绳子断了;便拿起刀杀死了那个强盗。 

 

    区寄逃出去没多远,那个上集市谈买卖的强盗回来了,抓住区寄,非常惊恐,打算要杀掉他。区寄急忙说:“做两个主人的奴仆,哪里比得上做一个主人的奴仆呢?他不好好待我,主子你果真能保全我的性命并好好待我,无论怎么样都可以。”强盗盘算了很久,心想:“与其杀死这个奴仆,哪里比得上把他卖掉呢?与其卖掉他后两个人分钱,哪里比得上我一个人独吞呢?幸亏杀掉了自己的伙伴,好极了!”随即埋藏了那个强盗的尸体,带着区寄到集市中窝藏强盗的主人那里,越发把区寄捆绑得结实。到了半夜,区寄自己转过身来,把捆绑的绳子就着炉火烧断了,虽然烧伤了手也不怕;又拿过刀来杀掉了做买卖的强盗。然后大声呼喊,整个集市都惊动了。区寄说:“我是姓区人家的孩子,不该做奴仆。两个强盗绑架了我,幸好我把他们都杀了,我愿把这件事报告官府。”

 

    集镇的差吏把这件事报告了州官,州官又报告给府官。府官召见了区寄,不过是个幼稚老实的孩子。刺史颜证认为他很了不起,便留他做小吏,区寄不愿意。刺史于是送给他衣裳,派官吏护送他回到家乡。

 

    乡里干抢劫勾当的强盗,都斜着眼睛不敢正视区寄,没有哪一个敢经过他的家门,都说:“这个孩子比秦武阳小两岁,却杀死了两个豪贼,怎么可以靠近他呢?”

    从表面上看,这仅仅是一个小孩用计杀死两个强盗,最后安然脱险回家的故事。假若只是这样想,那就大错特错。一个“业余”放牛娃,估计也是个“文盲”,居然有如此的心机,能够让两个以贩卖人口为职业的人贩子阴沟里翻船,不但生意没有做成,还赔上两条老命,这需要何等的智慧。试想一下我们当前各种新闻时常报道的女大学生被人贩子骗到某地给人家做媳妇,只会哭哭啼啼、有如梨花带雨,空有满腹经纶,却是束手无策,宛如任人宰割的小鸡。又如新闻报纸上屡屡登载的一两名抢劫犯凭借一两柄匕首,在公交车上呼风唤雨,劫财劫色,忙的不亦乐乎,好不快活,满车青壮年,脸色苍白,神情木讷,任其所为,又是何等的悲哀。

 

    为什么一个没有经过文化“熏陶”,没有经过格斗训练的牧童能够以“空手套白狼”的方式杀死对手,取得最后的胜利,关键在于他正确运用了以小胜多、以弱胜强、以无胜有的谋略,这就是人人都拥有,却不是个个都会用的智慧。

 

    如果说区寄和强盗是两军对垒,战斗一开始,这位牧童显然位居下风。对垒双方一方是毫无社会经验、人小力弱的牧童,一方是纵横乡里,有着丰富“战斗经验”的强盗;一方无心,一方有意;一方拥有先进武器——明晃晃的钢刀,一方估计就是赶牛棍一根,所以第一回合的“交锋”,强盗“兵不刃血”大获全胜——绑架了区寄,但强盗万万没有想到的是,这仅仅是对弈的开始。

 

    随之而来的是区寄的“扮猪吃象”,他首先装作害怕的样子,像平常的小孩一样,被这飞来横祸吓得屁滚尿流,让两个强盗觉得抓到了一只毫无还手之力的小鸡,放弃了最后一点戒备心理。强盗喝完酒,一个依照惯例去“谈生意”,一个放弃了自己的武装,倒地呼呼大睡。敌人分散了,力量削弱了,防范意识也没有了,于是区寄出击了,他反身用强盗的利刃割断捆绑自己的绳子,然后给了尚在睡梦中的强盗一个“安乐死”。

 

    然而,就在取得第一回合胜利,准备胜利大逃亡之际,第二个“谈生意”的强盗却回来了。两军相逢勇者胜,估计区寄再勇敢,真刀真枪也敌不过这位有了防范之心的强盗仁兄,于是区寄再次羊入虎口。但这时候区寄的处境就凶险多了,因为他那手“扮猪吃象”的策略已经被对手察觉了。闻到死亡气息的强盗准备一劳永逸地解决这个“小杀手”,然而区寄的一句话却让对手改变的主意。区寄扬言,侍侯两个主子就还不如侍侯一个主子了。就是这一句话,让强盗动了心,细细地算了一笔经济帐,如果用三段论来推算强盗地心理,估计如下:

 

    绑架小孩地目的就是为了挣钱。

    两人均分不如一人独吞利润大,理论上一人占有这个小孩合算。

    所以小孩杀死伙伴,意味着自己可以独吞,因此小孩杀伙伴反而帮助自己。

    就是这样一个利欲熏心地推算,即将到手的金钱的诱惑超过了小孩给自己的恐惧,区寄终于保存了自己。

    强盗把区寄带到了自己“窝藏赃物”的据点,这一次,强盗防范意识加强了,把区寄捆得更紧才安心睡了。可惜他还是低估了自己的对手,区寄把手放到火炉旁,烧断了绳子,再次让对手一命呜呼。这一次,区寄充分利用地处闹市的优势,不鸣则已,一鸣惊人,干脆大吵大闹,让整个集市的人都知道,让窝藏自己的宅主陷入人赃俱获的地步,计无可出,终于使自己回到了家乡。

 

    一个小孩,运用自己的谋略,抓住对方的弱点,不仅保护了自己的利益,而且使一个劫盗团伙覆灭,这就是博弈,区寄斗智不斗力,迷惑对手,软化对方,就是博弈策略。这个故事虽小,人物虽然名不见经传,但其中的智慧,所运用的策略,可能比不上谋略家,但的确是一种地地道道的策略,身处险境的区寄,他的策略,比现代很多接受过各种高等教育的人都要强。一个小故事,道出了人类最有价值的地方——智慧。任何人,只有运用自己的智慧才能维护自己的利益。