生活中的博弈论

来源:百度文库 编辑:神马文学网 时间:2024/05/01 16:29:13

  生活中的博弈论(全书)

作者:余治国 江雨燕  世界图书出版公司

 

在经济学史上,曾经发生过三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,因为它代表着一种新概念、新方法论、新分析方法和一种全新的思想……

 

 第一部分

对于许多非数学专业和经济学专业人士来说,博弈论应该是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具之一

 

序:大博弈的思维观

 

对于许多非数学专业和经济学专业人士来说,博弈论应该是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具之一。

 

1994年诺贝尔经济学奖即授予三位博弈论专家,1996年诺贝尔经济学奖又同样授予两位与博弈论一脉相承的信息经济学开拓者。

 

在经济学史上,曾经发生过三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,因为它代表着一种新概念、新方法论、新分析方法和一种全新的思想。

 

经济学家凯恩斯1936年在《就业利息与货币通论》中远见卓识地写过这样一段深刻的话,“经济学家和政治哲学家的思想,不管是正确的还是错误的,其力量之大,往往超出常人意料。事实上,统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知识的影响,却往往当上了一些已故经济学家的奴隶。执政的狂人,自称听到了上帝的指示,实际上却是从若干年前一些学术界劣等思想家那儿拾取了一些怪诞的想法……比起思想的逐渐侵蚀力来,既得利益的势力被过分夸大了。”

 

然而,博弈的技术分析有着严格的前提条件,逻辑严密,思路清晰。遗憾的是,这种技术分析的应用范围却是非常地狭窄。由此可见,博弈论的思想比任何技术性的分析都要重要。

 

实际上,博弈之道是古已有之,但博弈思想的系统化、数学化却是近几十年发展起来的。正是因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的研究还是停留在引进介绍层面上,他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博弈论与信息经济学在中国已是一门科学,但却逐渐变成阳春白雪或弃之不用或被滥用到极至的一门学问。

 

博弈论与信息经济学不仅仅能在学术领域中光彩夺目,在其它领域如军事、管理、体育、政治、公关、个人生活中同样能得到充分利用,甚至在生物学中都可以觅其踪迹。

 

在普通的企业管理中,经营者要熟练地掌握管理之术,必须能够自动自发并自觉地运用博弈论与信息经济学。在日常生活中,人们可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题。

 

正是因为如此,诺贝尔经济学奖获得者保罗·萨缪尔逊(Paul Samuelson)说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”

 

所谓“大博弈的思维观”正是表达了这层含义,人们身边无处不在的博弈哲学,无论是直接感受到或是从未接触过的社会、政治、法律、军事、经济、管理、自然、历史等现象。

 

笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法,能用语言可以描述的就尽量少用或不用数学。因此笔者未对博弈论与信息经济学作数学化、系统的证明与阐述,只是采用独立成篇的小文章来讲解这个学科的基本知识。

 

但也只有这样,才能够使似乎高深的博弈论与信息经济学思想很轻松地为普通读者所掌握,并能够让读者应用其思想方法来分析甚至是解决身边的诸多实际问题。

 

就在本书即将付梓之前,令笔者甚感欣慰的是,2005年诺贝尔经济学奖由拥有以色列和美国双重国籍的经济学家罗伯特·奥曼和美国经济学家托马斯·谢林分享。两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解”。(瑞典皇家科学院评语)

 

最后,笔者还要感谢黑龙江的吴学秋教授,他仔细批阅本书的初稿,并提供了大量的意见与建议。同时,还非常感谢客户服务管理(中国)有限公司董事、总经理、营销管理专家王正党先生、前托普集团托普大学培训学院副院长、现任职某大学的杨志宏先生、前托普集团培训学院副院长、前马来西亚东南集团副总、著名策划专家彭小利先生、著名管理专家、策划专家铂策划创始人郭林先生、著名经济学家、管理专家刘正山博士、著名经济学家、北京大学政府管理学院MPA教育小组组长余斌教授、当代中国出版社乔平先生、青年政治学院的叶楚华教授、安徽工业大学管理科学与工程学院院长汪家常教授对笔者的关心与爱护。同时还要感谢中国计算机世界出版服务公司的编辑,给本书提出了许多宝贵意见与建议。还有其他很多热心的朋友,笔者限于篇幅无法一一列出,只能在此深表感谢!本书获得安徽省教育厅人文社科基金项目计划,项目编号2006SK164。

 

由于笔者本人学识有限,对博弈论与信息经济学的理解与研究尚不深刻,错误在所难免,敬请博弈论与信息经济学的方家高人指点,以免贻误广大读者。本书有1/3的内容由江雨燕副教授编写,主要内容由余治国统筹编写,一切错误由主要编写人余治国负责。

 

余治国

 

《美丽心灵》的博弈解读

 

美国环球公司(Universal Pictures,USA)2001年出品的电影《美丽心灵》(A Beautiful Mind)可谓家喻户晓。该片一举囊括了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心灵。

 

《美丽心灵》艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症30多年又奇 迹般恢复正常的约翰·纳什(John Nash)传奇般的人生经历。

 

在一般的纪实性电影中,演员形象总是比真实生活中的原型要更具有动人风采。然而,让人难以置信的是,现实的纳什无论容貌风度都比男主角奥斯卡影帝罗素·克洛(Crowe Russell)略胜一筹。

 

正是这个曾如希腊古神一般英俊潇洒却又古怪精灵的数学与经济学的双料天才———纳什,其早年在博弈理论方面的巨大贡献一直改变着我们的生活。

 

然而,《美丽心灵》却又如实地反映出纳什喜悲交加的一生:纳什在数学领域工作,从早年开始就非常优异,1958年他被美国《财富》(Fortune)杂志评为新一代天才数学家中最杰出的人物。就在纳什春风得意、事业将达到顶峰时,却突然遭受命运无情的重重一击,从云端坠入地狱:30岁的纳什患上了严重的精神分裂症。天才的他一生为精神分裂症所困扰,并在私生活上毫不检点。纳什青年时代曾与一位大他5岁的姑娘交往,两人还有个私生子,纳什在精神分裂症发作之前一直与她保持着若即若离的暧昧关系。他的父母4年之后发现此事,不久后纳什父亲去世,不知是否与这个打击有关。父亲去世之后,纳什与麻省理工学院(MIT)年轻美丽的女学生爱莉西娅(Alicia)结婚,此后40多年患难与共的爱情和亲情中可以见证这是他的个人生活中最完美、最幸运的时光。

 

就在爱莉西娅身怀有孕,正待分娩的同年,纳什的精神状况却日益恶化。他的举止越来越古怪,正一步步走向心智狂乱。他麻烦缠身,有一次竟然因为在男洗手间“不恰当地”暴露了自己的身体被逮捕。

 

万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。1970年,纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的情感生活。她体贴他不肯去医院封闭治疗的愿望,把家搬到远离尘世喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。

 

爱莉西娅不能眼睁睁看着这个天赋异禀的天才就这样消沉。作为妻子的爱莉西娅用爱去挽救丈夫,尽管这对幸福的人在恋爱时的卿卿我我此时已荡然无存。纳什被妻子的这种无可动摇的爱和坚定的信念所感染,决心同疾病抗争到底。在深爱他的妻子爱莉西娅的帮助下,在他自己的天才与狂乱中,纳什陷入了一种狂热的智力上的极高的境界。

 

这改变了一切。经过很多年的艰苦努力,纳什最终走出阴霾,理性为他带来了心灵的平和。终于在1994年纳什凭借他在现代博弈理论上的卓越贡献,获得科学界的最高荣誉———诺贝尔奖。

 

人们在观看影片的时候,不禁会想,天才纳什在博弈上的贡献主要是什么?为什么好莱坞会为这样一个充满传奇色彩的博弈论大师拍摄出这样纪实性的影片呢?这部片子为什么又是如此地震撼了全球亿万观众的心灵?

 

可能很多人对博弈论的兴趣正是《美丽心灵》这部传世之作所引发出的。

 

众所周知,现代博弈理论由匈牙利大数学家冯·诺伊曼(John von Neumann)于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

 

对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈,比如两个人打乒乓球,一方赢则另一方必输,两个人获利的总和为零。在这里能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”或者是最优的具体策略?怎么样的策略才是“合理”?

 

应用传统决策论中的“最小最大”准则,即博弈的每一方都假设对方的所有策略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。用通俗的话说,这个著名的最小最大定理所体现的基本思想是“抱最好的希望,做最坏的打算”。

 

虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。二人零和博弈主要的局限性:一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大于零或小于零的净获利。

 

1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。

 

1950年纳什曾带着他的想法去会见当时名满天下的冯·诺依曼(博弈论创始人之一,天才数学家),遭到断然否定,在此之前他还受到爱因斯坦的冷遇。但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。

 

对于多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在于他天才性地提出了“纳什均衡”的基本概念,为更加普遍广泛的博弈问题找到了解。

 

1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都是沿着这条主线展开的。

 

纳什的好友,普林斯顿大学经济学教授迪克西特曾说:“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”

 

诺伊曼在《博弈论与经济行为》一书中还建立了合作型博弈论的基本模型,但是对于其中双向协商问题,也就是参与者如何“讨价还价”的问题,没有给出一个确定的解。

 

纳什对这一领域同样作出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤———协商的目的最终仍是最大化自己的利益。

 

此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。这一思想初次提示了在重复博弈理论中串谋的可能性,这一发现在经济和政治领域起到重要的作用。

 

在《美丽心灵》中有这样的情节:1994年美国政府向商家拍卖大部份电磁波谱。这一多回合拍卖由很多博弈论专家精心设计,设计的目的就是最大化政府收益和各商家利用率。这个设计取得极大的成功。政府获得超过100亿美元的收入,各频率的波谱也都找到了满意的归宿。

 

与此相对应的是,新西兰一个类似的拍卖会惨遭失败。因为他们没有经过博弈理论来设计拍卖规则。结果,政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证。

 

正是因为博弈论对现代经济生活具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。

 

也许正如罗素·克洛在领奖时对《美丽心灵》的评价一样,纳什与他的博弈论对我们,“能帮助我们敞开心灵,给予我们信念,生活中真地会有奇迹发生。”

 

无处不在的博弈

 

日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏?

 

实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略 ,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。

 

“自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。

 

生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。

 

在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。

 

夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。

 

根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。

 

夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。

 

在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。

 

事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。

 

如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是稀缺的或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始一场博弈。

 

《孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“……”,而这正是博弈双方所掌握的公共信息。

 

因此我们可以了解到,形成一个博弈有4个要素:

 

1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。比如一个单身汉,就不可能存在夫妻吵架的博弈,更不存在是否送花讨太太欢心的困扰。

 

从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。

 

最简单的一个最优化的例子就是,吸烟伤肺,不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡(Tradeoff)。如果这个烟民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着其他参与者的决策结果。

 

在冯·诺依曼(Von Neumann)的博弈论奠基之作《博弈论与经济行为》一书中举过这样一个经典的例子。在《鲁滨逊漂流记》中,与世隔绝的“鲁滨逊”(Robinson Crusoe)一个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最大值的问题。

 

因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五”(《鲁滨逊漂流记》中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈问题。

 

2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。资源指的不仅仅是自然资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职位等。

 

如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”“大道之行也,天下为公。”的大同社会。

 

当然,不可否认是,一方面,博弈者之间会发生冲突;另一方面,他们当中也包含着合作的潜力。

 

值得强调的是,资源是有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。

 

经济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如,“孩子总是自己的好,妻子总是别人的好”:自己的孩子在眼里是无价之宝,而在别人面前相对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正是效用递减规律起了作用。

 

最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国,人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。

 

3.参与者有自己能够选择的策略(Strategy)。所谓策略,就是“计利以听,乃为之势,以佐其外。势者,因利而制权也。”这指的是直接实用的针对某一个具体问题所采取的应对方式。通俗地说,策略就是计策,是博弈参与者所能够选择的手段方法。

 

一般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局势特征这些理论化的内容。而博弈论中的策略选择,是先对局势和整体状况进行分析,确定局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈对局中的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。

 

4.参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的。

 

但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情理上说,在实际生活中一般是要带伞以防不测。

 

通俗地说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就不可避免地要面对各种矛盾和冲突。

 

所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就是研究人们如何进行决策,以及这种决策如何达到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。

 

博弈是一种竞合游戏

 

2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟约,共同 抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救;其二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边和平关系。

 

当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联盟的破坏正是从齐国开始的。

 

在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好,结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系,齐国最终被灭,千古一帝秦始皇得以名扬千秋。

 

“博弈论”的英文是“Game Theory”,实际上Game的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。

 

从秦始皇的故事中,我们看到博弈中包含了竞争冲突与合作两种截然不同的策略。所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争中包含着潜在合作的种子,合作中包含着潜在竞争的种子。

 

合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。

 

合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称Opec)。1960年9月,伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。欧佩克在这个时候应运而生。欧佩克现在已发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。它统一协调各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。

 

对于个人来说,从博弈论的角度来看,在人生、事业一筹莫展的时候,如何能寻找到一个快速突破困境的办法?

 

首先要寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。如果在困境之中,有人与你因为同样的原因无法抽身,那么是否能够和这个人一起摆脱不利的处境,在合作的基础上走向双赢呢?

 

《红楼梦》里面形容四大家族的时候,用过一个评语,叫做“一荣俱荣,一损皆损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成一个牢固的联盟。

 

那么,如果两个同时处在困境中的人,也有这种利益+亲缘的双重关系,他们合作起来就会更加容易,而且形成的合力就会更大。正所谓“二人同心,其利断金”,而要做到“同心”,只有利益上的合作是不够的,还需要一种近乎亲情的亲缘关系。显然,这是可遇而不可求的,因为亲缘关系不是能够随便形成的。

 

智力游戏与博弈相近似的本质是:在确定游戏规则的约束下,游戏参与者决策、行动的过程。各种智力游戏实质上就是一个社会的经济、管理、军事、政治等现象抽象出来的缩微模拟模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。

 

游戏是一种抽象。面对复杂现象时,人们经常会“只见树木不见森林”,无法抓住某种现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低,从而轻松地分析问题并找到合理可行的解决方法。

 

中国最古老的围棋智力游戏,其最初的功能形态就是模拟战争。围棋包含最多的就是博弈的内涵,特别是战争中的博弈内涵,如围而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和目的,来研究战争的规律。

 

围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。然而,其作为一项智力游戏,围棋与战争在很多方面都相通。围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。

 

战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。

 

围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐就是基于效果的典范。

 

现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17分钟内过桥吗?”

 

这可不是微软公司的别出心裁,据说许多跻身世界500强的公司在招收新员工时,都要出类似的智力题。

 

智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。

 

思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想象,亲自动手操作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强。这一点已成为人们的共识。

 

在许多智力游戏中,都存在这么一个共同的特点:就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏的规则一旦定好之后,策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。

 

至于从围棋初段到九段之间的差别,从博弈论的角度去看,不过是他们策略选择技巧的高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。

 

任何游戏都有自己的规则(Rule of the game)。实际现实中的人类社会自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就确定了人们行为的前提条件。

 

因此博弈与游戏都有一个重要的共同特征:那就是这些规则规定游戏参加者可以做什么,不可以做什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的处罚等。

 

游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。

 

从围棋定式谈纳什均衡

 

我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世间的事物很少有不依赖于其他事物而存在的。非合作博弈强调利益的冲突,即非合作甚至对抗状态。

 

比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋1 9×19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。

 

世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受方案。

 

围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当,互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。

 

在经济学中,均衡(equilibrium)意即相关量处于稳定值。均衡是在分析均衡价格与数量的决定与变动的状况。供需均衡时会达到供需相等,市场出清,也就是在其他条件不变下,会维持不变的状况。

 

一物的供给量等于需求量的价格,就是其均衡价格,对应的数量就是均衡数量。这就是在供给线与需求线相交之处,也称为均衡点。比如在供需分析中,若某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重要方法。

 

在谈纳什均衡之前,我们先来看这样一个例子。这个例子对大家所熟知的“囚徒困境”做了一些微小的修改,结果却是发生根本的变化。

 

A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬而未决的银行抢劫案,并且他根据一系列的线索判定A和B是这桩案子的凶犯。

 

因为该局管辖地区治安一向混乱不堪,C的上级对C非常恼火,直接威胁C,如果银行案破不了,就要撤销C局长的职位,给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A和B。为了能够让两个囚犯认罪,C想让A和B明白,假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻发落。

 

于是,这个警察局长C分别与A、B立下许诺:如果只有一个人坦白认罪,则认罪的一方会收到所有指控,会因抢劫银行而判无期徒刑,另一个人则不会再加刑罚。如果无人认罪,两个人都会因盗窃罪而判刑2年。如果两个人都坦白,则两个人都被判处有期徒刑5年。

 

这样,警察局长C给A和B构造了一个博弈。不妨假设,A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时A和B被分别审查不能够进行沟通。

 

在这种情况下,A会在心里打起小算盘,他会想:如果选择坦白,那么B选择坦白时将判刑5年,B选择不坦白时将被判无期徒刑,因此选择坦白时最坏的打算就把牢底坐穿;若是选择不坦白,那么B选择坦白时将无罪释放获得自由,B选择不坦白时将判有期徒刑2年,因此选择不坦白时最坏的可能就是被囚禁5年。

 

两害相权,取其轻。因此在这种情况下,A必然会选择不坦白,同样的道理,B也会选择不坦白。这个时候,博弈达到了这样一种局面,这种局面就是纳什均衡(Nash Equilibrium)。

 

纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡。

 

这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。

 

再简单一点说,一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

 

由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就可称为是一个纳什均衡点。

 

相反,如果锅是扣在地上的,那么一个乒乓球很难在锅底部位保持稳定,因为往任何方向的一点点移动,都会使球立刻离开锅底。这时的锅底部位就不是一个纳什均衡点了。

 

博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。

 

在上面的“囚徒困境”变形的博弈中,A和B都不坦白就是一个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着对整体而言是最有利的结果,比如“囚徒困境”的例子导致了整体的不利。

 

围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下的博弈,这就是博弈论中的静态博弈概念。

 

围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。

 

这是一条线性的推理链:“假如我这么做,他就会那么做———若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。

 

在动态博弈中,存在明显的马太效应,也就是说凡是拥有较少的,连他仅有的那一点点也夺过来;凡是多的,就加给他,让他更多。比如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用马太效应原理,在获得优势的情况能够保持优势,扩大优势,直至最后成功。

 

而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。

 

要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。

 

因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认为……”。

 

这样来看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。

 

因此在动态博弈中,纳什均衡的要义在于:即使在对抗条件下,双方可以通过向对方提出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant strategy),即无论对方作何选择,这一策略始终应优于其它策略。

 

从爱情故事谈起:优势策略

 

“原地高天,堪叹古今情难尽;痴男怨女,可怜风月债难偿。”

 

我们来先看欧·亨利的小说《麦吉的礼物》描述的这样一个爱情故事。新婚不久的妻子和丈夫,很是穷困潦倒。除了妻子那一头美丽的金色长发,丈夫那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方 的利益,他们愿意奉献和牺牲自己的一切。

 

话说明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,每个人还是想悄悄准备一份礼物给对方。丈夫卖掉了心爱的怀表,买了一套漂亮发卡,去配妻子那一头金色长发。妻子剪掉心爱的长发,拿去卖钱,为丈夫的怀表买了表链和表袋。

 

最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主义行为,结果却使得双方的利益同时受损。

 

欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事,来交换送礼的好处。然而,我讲的这个平平淡淡的故事里,两个住公寓的傻孩子,却是笨到极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”

 

从这段文字看,欧·亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。我们假定,他们每个人,有一个“毫不利己,专门利人”的偏好系统,毫不考虑自身利益,专门谋求别人的幸福。

 

这样,个人选择付出还是不付出,只看对方能不能得益,与自己是否受损无关。以这样的偏好来衡量,最好的结果自然是自己付出而对方不付出,对方收益增大;次好的结果是大家都不付出,对方不得益也不牺牲;再次的结果是大家都付出;最坏的结果是别人付出而自己不付出,靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价:第一种结果给3分,第二种结果给2分,第三种结果给1分,最后那种给0分。

 

不难看出,无论对方选择付出,还是选择不付出,个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上,大家都选择不付出,明显优于大家都选择付出的境况,这就达到了上文提到的纳什均衡。

 

实际上,这里的例子有一个占优策略均衡。通俗地说,在占优策略均衡中,不论所有其他参与人选择什么策略,一个参与人的占优策略都是他的最优策略。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。

 

因此,占优策略均衡一定是纳什均衡。在这个例子中,妻子选择不付出,也就是不剪掉金发对于妻子来说是一个优势策略,也就是说妻子不付出,丈夫不管选择什么策略,妻子所得的结果都好于丈夫。同理,丈夫不卖掉怀表对于丈夫来说也是一个优势策略。

 

再举个常见的例子:一名篮球前锋和队友在篮下面对着对方的一个后卫时,形成了二打一的局面,该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。

 

如果一个球员具有这样一种策略,无论其他球员怎么做,这个策略都会高出一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策就会变得非常简单,只要直接采用该策略而完全不必考虑对手的应对策略。

 

还有一个要注意的问题是,采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者采用优势策略在对方采取任何策略时,总能够显示出优势。

 

比如就这个例子来说,就妻子来说,她采用不付出的策略,无论丈夫付出或不付出,妻子的不付出策略总是占有优势。丈夫的优势策略也是一样。但是,妻子选择不付出的最坏结果是1,选择付出的最好结果是3,很明显,妻子的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一筹。

 

反之,劣势策略则是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略,劣势策略是我们在日常生活中不可以选择的行动。劣势策略是与优势策略相对应的概念,笔者这里就不多做介绍。

 

房地产开发博弈、警察捉小偷与混和策略

 

实际上,在每个参与人都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。

 

假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

 

但遗憾的是,并不是所有博弈都有优势策略,哪怕这个博弈只有两个参与者。实际上,优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。

 

来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。

 

因为,如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。这样就形成了一个循环选择。

 

根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。

 

这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在房地产博弈中,我们无法知道,最后结果是A开发B不开发,还是A不开发B开发。

 

再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。

 

因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。

 

一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A家还是B家。

 

因为A家的财产是B家的2倍,小偷自然光顾A家的概率要高于B家,不妨用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。

 

而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l/3的机会去A家,2/3的机会去B家。这些数值是可以通过联立方程准确计算出的,笔者这里就不给出具体的数学计算过程了。

 

细心的读者会发现,警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别,就是用到了概率的知识,警察与小偷没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。

 

在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。

 

用专业的话来说,所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。

 

所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。

 

最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳什均衡。

 

再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

 

由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。

 

在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。

 

 位置博弈的策略

 

有这么一个大家都很熟悉的现象,那就是在每个大大小小的城市街道上,经常见到一些地段上的商店十分拥挤,形成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。

 

更有意思的是,往往同类型的商家总是聚集在比较近的地方,比如肯德基、麦当劳之间总是紧紧相邻。再如超市现象,前两年有很多人对超市的布局发表了一些议论。因为有人注意到,如果在 一条街上有2~3家超市的话,这几家超市经常会“相依为邻”,选址离得很近,倘若它们稍微分散地布置于街上,无疑对市民的购物提供相当的便利,因此他们认为超市“拥挤”在一起属于资源浪费。

 

类似的事情也发生于国内各省级电视台的节目播放。很多电视迷会发现,大部分电视台总是将最精彩的节目放在相同的时间段,甚至有些时候是在相同时间段播放类似的节目,比如你播“快乐大本营”,我就播“超级总动员”;你播“玫瑰之约”,我就播“单身男女”。人都说文人相轻,电视台也是这么相煎太急。

 

博弈论能够对这个现象作出科学的解释。首先对一个简单的博弈模型进行叙述:

 

假设有条完全笔直的公路,连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆,并且车流量在公路上是均匀分布的。假设有两家快餐店,我们不妨假设为靠高速公路起家的麦当劳与肯德基,它们要在这条公路上选择一个位置开设快餐,招揽来往车辆。为了能够更加清晰地说明这个博弈,我们不得不画一张图。

 

再对该模型作一个合乎逻辑的假定:通常情况下,车辆总是乐意到距自己最近的快餐店购买食物。根据这个原则,从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优。

 

在这种均匀散布的情况下,每家快餐店都拥有1/2的顾客量,同时对于开车的人们总体来说,这种策略的选择,车辆到快餐店的总的距离最短。

 

然而,人生不如意事十之八九,天并不总能遂人之愿。肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性。他们只要手段合法,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。

 

出于这种理性,肯德基分店经理肯定会想到:如果我将店铺从3/4点处向左移一点,那么1/4点之间的中点不再是1/2点处,而是位于1/2点的靠左边一点。这等于说,这一移位,肯德基将从麦当劳夺取部分顾客,这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。

 

不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态,甲乙两人相依为邻且相安无事地做起快餐生意。如果我们放宽条件,不是两家快餐店,而是很多家快餐店,很容易分析得到结果:这些快餐店仍然会在1/2处设店达到纳什均衡。

 

同样的道理,如果地段的繁华等其他原因在一条路上都可以认为到处相同的话,没有一个商家会将自己安置于某条路的一头,只要条件许可,超市将几乎趋向于相依为邻,这种现象完全可以看做公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理,在博弈论中称为位置博弈。

 

电视台之间在时间段上的重叠问题在本质上就是位置博弈。事实上,我们只要将时间设想为上述案例中的公路,就不难分析出:市场竞争的结果就是,观众青睐的精彩节目将集中在同一黄金时段。在这种情况下,电视台之间的竞争会更加激烈,为了获得收视率,电视台只能在制作质量上下功夫,最终获得实惠的仍然是广大观众。

 

西方国家在名义上是民权政治。实际上,选举上台的各个政党之间的政策并没有多大差别。就拿美国来说,民主党与共和党为了能够获得总统大选的胜利,必须要尽量争取最多的选民。两党在制订政策时,必然以这个目的为原则。我们把选民的政治主张看成是位置博弈中的均匀分布的人群,把两个政党看成是两个店铺,最终的结果必然是两个政党的政策趋向于折衷,并且非常近似。从这个意义上来说,西方政党的换届选举倒真是有“换汤不换药”的味道。

 

猎鹿模型的合作哲学

 

社会学告诉我们,在人类文明之初的原始社会,人们维生的方式主要是狩猎。

 

话说某个部落有两个出色的猎人,某一天他们狩猎的时候,看到一头梅花鹿。于是两人商量,只要守住梅花鹿可能逃跑的两个路口,梅花鹿就会无路可逃。只要他们能够齐心协力,梅花鹿就会成为他们的盘中餐。不过只要其中有任何一人放弃围捕,梅花鹿就会逃跑掉。

 

“福兮祸之所依;祸兮福之 所伏。”有时运气太好并不一定有好的结果。正当两个猎人严阵以待,围捕梅花鹿的时候,在两个路口都跑过一群兔子,如果猎人去抓兔子,会抓住4只兔子。从维持生存的角度来看,4只兔子可以供一个人吃4天,1只梅花鹿如果被抓住将被两个猎人平分,可供每人吃10天。这里不妨假设两个猎人叫A和B。

 

在这个矩阵图中,每一个格子都代表一种博弈的结果。具体说来:

 

1.左上角的格子表示,猎人A和B都抓兔子,结果是猎人A和B都能吃饱4天;

 

2.左下角的格子表示,猎人A抓兔子,猎人B打梅花鹿,结果是猎人A可以吃饱4天,B则一无所获;

 

3.在右上角,猎人A打梅花鹿,猎人B抓兔子,结果是猎人A一无所获,猎人B可以吃饱4天;

 

4.在右下角,猎人A和B合作抓捕梅花鹿,结果是两人平分猎物,都可以吃饱10天。

 

在这个博弈中,根据纳什均衡的定义,应用博弈论中的“严格劣势删除法”(有兴趣的读者可以找本书参考文献中的相关书籍阅读,这里不做详细介绍。)可以得到该博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。

 

两个纳什均衡,就是两个可能的结局。两种结局到底哪一个最终发生,这无法用纳什均衡本身来确定。

 

比较[10,10]和[4,4]两个纳什均衡,明显的事实是,两人一起去猎梅花鹿比各自去抓兔子可以让每个人多吃6天。按照经济学的说法,合作猎鹿的纳什均衡,分头抓打兔子的纳什均衡,具有帕累托优势。与[4,4]相比,[10,10]不仅有整体福利改进,而且每个人都得到福利改进。

 

换一种更加严密的说法就是,[10,10]与[4,4]相比,其中一方收益增大,而其它各方的境况都不受损害。这就是[10,10]对于[4,4]具有帕累托优势的含义。

 

在经济学中,帕累托效率准则是:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人。

 

一句话简单概括,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。

 

相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说已经达到帕累托效率。效率是指资源配置已达到这样一种境地,即任何重新改变资源配置的方式,都不可能使一部分人在没有其他人受损的情况下受益。这一资源配置的状态,被称为“帕累托最优”(Pareto optimum)状态,或称为“帕累托有效”(Pareto efficient)。

 

目前在世界上比比皆是的企业强强联合,就接近于猎鹿模型的帕累托改善,跨国汽车公司的联合、日本两大银行的联合等等均属此列,这种强强联合造成的结果是资金雄厚、生产技术先进、在世界上占有的竞争地位更优越,发挥的影响更显著。

 

总之,他们将蛋糕做得越大,双方的效益也就越高。比如宝山钢铁公司与上海钢铁集团强强联合也好,还是其他什么重组方式,最重要的在于将蛋糕做大。在宝钢与上钢的强强联合中,宝钢有着资金、效益、管理水平、规模等各方面的优势,上钢也有着生产技术与经验的优势。两个公司实施强强联合,充分发挥各方的优势,发掘更多更大的潜力,形成一个更大更有力的拳头,将蛋糕做得比原先两个蛋糕之和还要大。

 

猎鹿模型的讨论,我们的思路实际只停留在考虑整体效率最高这个角度,而没有考虑蛋糕做大之后的分配。猎鹿模型是假设猎人双方平均分配猎物。

 

我们不妨做这样一种假设,猎人A比猎人B狩猎的能力水平要略高一筹,但B猎人却是酋长之子,拥有较高的分配权。

 

可以设想,A猎人与B猎人合作猎鹿之后的分配不是两人平分成果,而是A猎人仅分到了够吃2天的梅花鹿肉,B猎人却分到了够吃18天的梅花鹿肉。

 

在这种情况下,整体效率虽然提高,但却不是帕累托改善,因为整体的改善反而伤害到猎人A的利益。我们假想,具有特权的猎人B会通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭到伤害,这必然会导致整体效率的下降。进一步推测,如果不是两个人进行狩猎,而是多人狩猎博弈,根据分配可以分成既得利益集团与弱势群体,这和我国的现状非常相似。

 

我国改革的进程在九十年代中期以前是一种帕累托改善的过程。但是随着各种复杂的不确定因素影响,贫富差距逐渐拉大,基尼指数甚至超过0.45的国际警戒线,帕累托改善的过程受到干扰。

 

这种情况如果继续下去,社会稳定和改革深化必将受到决定性的冲击。我们的党和政府已经关注到弱势群体的生存状态,并适时地提出建设和谐社会的改革目标,纠正了一些错误思潮,将改革的进程拉回到健康的轨道。

 

“囚徒困境”的深刻哲理

 

在博弈论中,有一个流传颇为广泛的故事,叫做“囚徒困境”(Pris-oner's Dilemma)。

 

话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。

 

这个时候,聪明 的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们2年刑期。但是,我可以和你做个交易。如果你招了,他不招,那么你会作为证人无罪释放,他将被判10年徒刑;如果你招了,他也招了,你们都将被判5年有期徒刑;如果他招了,你不招,他无罪释放,你被判无期徒刑,终身囚禁;如果你们都不招,各判2年。”

 

一般读者可能会误认为,既然两个囚犯最好的结果是都不招供,两人都只被判2年,那么,两个囚犯都选择不招供就是这个博弈的最终结果。

 

然而,人算不如天算,“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判有期徒刑5年。

 

反过来说,这也是警官的聪明之处。警官采取的游戏规则必然会让两名囚犯坦白罪行,认罪伏法。对一个博弈来说,游戏规则非常地重要,适宜的规则才能够达到目的。在我们的日常生活中莫不如此,规则制订者往往利用条件制定出有利于自身的规章制度。

 

读到这里,很多读者不禁会问,为什么两个人都选择了“招”,傻到接受这种最坏的结果呢?

 

在解释这个问题之前,笔者首先说明一下,囚徒困境和其它的博弈一样,都需要有2个前提假设:囚徒A和B两人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略;两人无法沟通,要在不知道对方所选结果的情况下,独自进行策略选择。

 

囚犯“思想搏斗过程”大致如下,囚犯A的内心活动是这样:假如他招了,我不招,我就要将牢底坐穿,招了最坏坐10年,还是招了合算;假如他不招,我也不招,只坐2年的牢(因无法串供,风险太大);如果我招,他不招,马上被释放,也是招了合算。

 

因此,无论囚犯B是坦白还是沉默,囚犯A采取坦白的策略对自己更为有利。

 

同样,以上推理也适用于囚犯B。结果两个囚徒都坦白了,都被判刑5年。

 

囚徒困境之所为被称为“困境”,正是在于:如果A、B二人都保持沉默,则都只被判刑2年,显然比两人都坦白的结果要好。

 

两名囚犯都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是惟一的纳什均衡点。

 

除了这个均衡点,A与B的任何一人单方面改变选择,他只会得到更加不经济的结果。而在其它的结果中,比如两人都不坦白的情况下,都有一人可以通过单方面改变选择,来减少自己的刑期。可是两人经过一番理性计算后,却选择了一个使自己陷入不利的结局。

 

其实“囚徒困境”不允许囚犯A和B进行沟通的假设,与实际生活中大部分情况的现实是有差异的。比如,在爱情博弈中,很多恋人会经常花前月下、彻夜厮守;在企业的价格战中,企业之间也会多有沟通,甚至结成价格联盟;即使是20世纪下半世纪的美苏军备竞赛中,两个超级大国也会经常进行外交交谈,及时交换信息。

 

因此不妨将条件放宽,允许囚犯A和B在审讯室里在一起呆上10分钟,给予他们充分的串供的机会。

 

很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。

 

我们不妨设想囚犯A的心理活动。他一定会认为,如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若自己不坦白就会被终生囚禁。事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。对于囚犯B也是一样。

 

虽然“坦白从宽,抗拒从严”的道理人人都懂,而从博弈论的角度来看,实际上就是一个囚徒困境的应用。“囚徒困境”被看成是博弈论的代表性案例,不仅因为其简单易懂,还在于它的现象在日常生活中广泛存在。

 

比如,恋人们在恋爱中的海誓山盟,最终还是分手;企业之间相互沟通合作结成战略关系时是信誓旦旦,但价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。

 

囚徒困境的游戏规则,能够让狡猾的罪犯招供,得到应有的惩罚,固然不是坏事。然而,我们不妨假设囚徒A和B完全都是清白的具有理性的大大的良民,这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中,审案存在对身体的残害,完全可能造成屈打成招的冤假错案。在中国历史上,这种冤案并不是什么稀少的事情。

 

从更深刻的意义上讲,囚徒困境模型动摇了传统社会学、经济学理论的基础,这是经济学的重大革命。

 

传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。

 

传统经济学秉承了亚当·斯密的思想。传统经济学认为:因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。

 

但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。

 

简单地说就是,在一个集体里,有可能每个人的选择都是理性的,但对于整个集体来说其结果却不是理性的。比如大家所熟悉的股市。股市的参与人数虽然十分庞大,但实际上是只有多与空、机构与机构、散户与散户之间的双方“博弈”,有人将此称之为“零和游戏”。

 

股市“博弈”双方的多数也处在一种“囚徒困境”中。对于股市中博弈双方来说,当股市涨到最高点时,无论对散户,还是对机构来说,任何一方的最大利益在于“我卖,而你没卖,我获得最大盈利”,而对于双方来说最理想的状态是“大家都不卖,把股市推向一个更高点位,大家都有更多利润空间”。但实际结果却大相径庭,市场“无形之手”没起作用,却是“囚徒困境”起到了决定性的作用。

 

佛家讲因果报应,儒家讲究“财自道生,利缘义取”。从“囚徒困境”看来,如果一味地想算计别人,算来算去,最后却算计到自己头上来了。如果我们将“囚徒困境”故事中的无期徒刑改为死刑,那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过了。

 

那么怎么样才能摆脱“囚徒困境”呢?

 

博弈双方都付出代价,失去自己不愿失去的东西,但只有这样才能共存并且摆脱囚徒困境,这有如壮士断臂,不得不为,也乐得为之。

 

如果说“兄弟阋于墙,共御外侮”是理想化的摆脱囚徒困境的策略,那么出卖“兄弟”以还得自己的平安,则是处于囚徒困境下本能的选择。趋利避害是人的本能,在经济行为和社会行为中这一本能都鲜明地体现着。

 

值得注意的是,并不是所有的“囚徒困境”都需要走出来或都需要解脱。如果所有的罪犯都走出了困境,那么将对社会产生灾难性后果,社会将充满了犯罪和混乱。

 

“囚徒困境”的破解:合作的约束

 

“不识庐山真面目,只缘身在此山中。”严格囚徒困境的前提条件是博弈各方不可以进行合作,也就是不能够制订有约束力的协议。但实际上,合作是文明的基础,比如兴修水利、组织国防、创建企业等都是合作而产生的,无怪乎哲学家卢梭写了本书《社会契约论》,认为契约是整个人类社会存在的前提条件之一。

 

如果囚徒困境只是一次性的博弈,签订协议是毫无意义的 ,其纳什均衡点并不会改变。可以签订协议的一个最基本的条件,就是博弈需要重复若干次,当然至少大于一次。

 

就恋爱博弈来看,男女双方在交往的过程中,随时都在博弈,因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩迭宕正是这个博弈模型的表现。

 

当然,那种素不相识一对男女,偶尔在酒吧中相遇,于是宾馆订房、春梦一场,拂晓之后就各自分道扬镳的一夜情,是理所当然的一次性囚徒困境博弈。

 

我们在这里要注意的是,重复博弈与我们前面所提及一般性的动态博弈是不同的。在多轮动态博弈中,参与者能够了解到博弈的每一步中其他参与者在这个参与者选择某种策略下的行动,而重复博弈的参与者无法了解到在任何一个步骤中,其它参与者的策略选择。

 

囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生非常大的变化,博弈的结局也就是纳什均衡点可能会完全不同。

 

举个例子,大家都知道国外的黑手党组织严密,对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国,而是意大利,囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉。

 

实际上,在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后,博弈参与者都有作弊的动机。

 

因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。还是用爱情来打比方,常言道:“婚姻是走向爱情的坟墓”,但从博弈论的角度来看,婚姻恰恰是男女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的压力与社会舆论的谴责。

 

在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。

 

因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都采取合作态度会带来合作收益。但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况。

 

对于有限次囚徒困境博弈,美国密西根大学的罗伯特·爱克斯罗德教授(Robert Axelrod)曾经做过一个著名的博弈论试验。这个试验的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序,然后这些程序会被成双成对地融入不同的组合。分完组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间作出选择。试验参与者连续玩上200次,于是这就更逼真地反映了日常人际关系。

 

试验的结果表明,囚徒困境在同样重复数十次或一百次的情况下,只要两个参与者仍然还是理性人(这可以在该试验的参加者所编程序中反映出),博弈的结果仍然是囚徒A和B都把对方招供出来。为了解释这个问题,我们不妨讨论一个博弈两次的模型。

 

我们首先考虑第二次博弈的情况,由于这是最后一次博弈,自然没有后面的博弈对这次博弈的影响,因此也就不必为将来打算,个人都只追求这次博弈的最大利益,于是第二次博弈的结果应该和一次囚徒困境博弈完全一样,自然是囚徒A和B都坦白,达到纳什均衡。

 

现在再来考虑第一次博弈的情况,博弈参与者A已经很清楚最后一次博弈时,B一定会招供,那么即使囚徒A不坦白,在下一次博弈时,B也一定会招供,这次博弈A不坦白对下一次博弈没有任何好的影响,那么作为理性人的A一定仍然选择坦白。对于B,也是一样的道理。由此可见,第一次博弈自然也和一次性囚徒困境博弈完全一样。

 

其实不论是两次博弈,还是3次,4次,甚至是上百次,只要是有限次数的重复囚徒困境博弈,其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法(Backward induction),这在博弈论中,对于重复博弈与动态博弈是一种重要的分析方法,当然这对我们在日常生活中分析问题也不无裨益。

 

比如,汽车企业之间的价格战往往不是一次性降价,而是一轮一轮地降价,这种类似的问题都可以用有限次囚徒困境模型来分析,事实情况和我们前面的分析完全相同,汽车企业之间每一次的价格博弈的纳什均衡只有一个,那就是全体降价。

 

笔者在这里最后还要补充一个问题,就是多人重复囚徒困境的博弈。实际上,生活中的两人博弈毕竟是特例,绝大部分的情况还是多人博弈,比如上面提到的汽车价格战。在多人博弈中,只有其它所有参与者在第k-1次博弈中都是合作的,某个参与者才会在k次博弈中采取合作策略。

 

然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的。

 

比如1992年英镑事件前后,可以明显感觉到有关游戏各方的思路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体;而它们在考虑统一货币的利益时,均在强调自己的利益;德国在其中的地位很特殊,它具有双重身份,既是欧洲汇率机制的基础,也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。

 

索罗斯的量子基金发起攻击的主要原因在于:德国联邦银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本国利益受到损害时,也必然倾向于自保。而在这种分歧加剧的背景下,无疑会加重有关各方拒绝承认错误的立场,这又进一步加重了分歧,索罗斯正是利用这套机制获利的。

 

这个结论似乎是一个令人绝望的,但绝望之处必有希望,欧元已经成功地在欧洲大陆通行,成为可以与美元相抗衡的硬通货。这其中的道理,笔者在后面将告诉读者,什么样的游戏规则可以保证博弈各方稳定合作。

 

威胁、承诺、作弊与惩罚

 

西方哲学家卢梭说过,“究竟是什么不可思议的艺术,使人类找到一种法,通过强迫人们服从,从而使他们获得自由?”

 

其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国 君主立宪政体的理论奠基人,其代表作是政治学名著《利维坦》(Leviathan)。所谓“利维坦”,是《圣经》中的一种力大无穷的巨兽名字的音译,在书中意指一个强大的国家。

 

霍布斯说:“人的自然本性是自私自利、恐惧、贪婪、残暴无情,人对人互相防范、敌对、争战不已,像狼和狼一样处于可怕的自然状态中。于是出于人的理性,人们相互间同意订立契约,放弃各人的自然权利,把它托付给某一个人或一个由多人组成的集体(如议会、董事会、法院等),这个人或集体能把大家的意志化为一个意志,能把大家的人格统一为一个人格;大家都服从他的意志,服从他的判断。这个人或这个集体就是主权者,而像这样通过社会契约而统一在一个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生,用更尊敬的方式来说,这就是活的上帝的诞生。”

 

按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。

 

霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说,没有权威的协议并不是导致民主,而是导致无政府状态。最后,霍布斯总结道,“在一切政体中,最坏的政体并不是专制而是无政府状态。”

 

霍布斯的观点虽然有些偏激,但却不无道理。根据博弈论的观点,无论是一次性或有限次重复博弈,“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑,这最终导致合作协议无法稳定遵守。

 

实际上,决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个,即承诺与威胁。所谓承诺,在囚徒困境中就是囚徒向对方相互许诺,在下一次博弈时会采取让对方有利的行为,也就是不坦白与对方合作;所谓威胁,就是某个囚徒告知对方如果下一次博弈时其采取招供策略而不合作,在第三次博弈时就会采取不利于对方的策略,即招供。

 

其实,在社会生活中,承诺与威胁是非常常见的现象。比如女生告诉她的男朋友,如果他敢结交其他的女生,只要被发现一次,就立刻分手,这是威胁;而她男朋友向她发誓绝对自己是个专一的情圣,决不会背叛爱情,这就是承诺。

 

再如在外交中,美国经常向中国承诺只承认一个中国的原则,我国政府向国际社会承诺中国强大也决不会采用霸权政策。很多常见的耳熟能详的俗语都是承诺与威胁,比如“人不犯我,我不犯人”、“坦白从宽,抗拒从严”、“以眼还眼,以牙还牙”等。

 

合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择之前作出的,如果承诺与威胁对博弈者的约束力越小,那么合作的可能性就越小。比如很多手慈心软却遇人不淑的妻子,一次又一次地原谅胡作非为的丈夫,希望用真情感动他回心转意。但结果却往往是丈夫反而得寸进尺,因为他知道无论如何,只要用一些花言巧语假装可怜的承诺就会获得宽恕。在这种情况下,妻子的威胁对丈夫是毫无作用的。

 

假想一个可信度很小的承诺与威胁。比如参加考试的学生承诺在没有老师监考的时候决不作弊,但却不难想象监考老师不在的时候,考场中将会是一种什么样的景象。

 

学生并不都是道德高尚、具有很强自制能力的人。即使在有老师监督考场,并威胁如果有学生敢于顶风作案,必然严惩不怠,比如考卷直接判零分。设想一下,如果这种威胁仅仅是威胁,在学生作弊后并未真地采取什么严惩的行动,那么学生作弊的风险非常小,考场纪律依然与没有老师一样。由此可见,监考老师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。

 

从实际的整个社会生活说来,对于有限次重复博弈合作问题的解决主要有两个典型方法,那就是社会道德与国家法律。至于其他解决方法在本质上并不会超脱于它们。

 

第二部分

 

亚当·斯密在写完《国富论》与市场这只“看不见的手”之后,转而又写了本《道德情操论》,专门论述个人道德与社会道德是维持市场经济的基本要素之一。

 

猴子的故事与道理约束

 

亚当·斯密在写完《国富论》与市场这只“看不见的手”之后,转而又写了本《道德情操论》,专门论述个人道德与社会道德是维持市场经济的基本要素之一。

 

亚当·斯密告诉我们:最商业化的社会,也是最讲究道德的社会,比如16世纪时荷兰人就比英国人值得信赖,当时荷兰的商业比英国发达,反之亦然。

 

人类道德的产生一般有两种解释:

 

一是纯文化因素起作用,有些国家道德程度高,有些国家则低。如北欧人之间的道德感高于意大利人的道德感。

 

二是宗教信仰的原因,怕上帝惩罚你,所以有宗教信仰的人道德感就要强于一般人。如在美国,教会的人道德感比较强,因为他们认为若不道德,将来会进地狱。在这种解释中,道德是外界强加于人们的,使人们不违约。而笔者主要想给出的是第二种解释,即博弈论是如何解释道德的。

 

道德可以打破囚徒困境的难题,化解个人理性与社会群体理性的矛盾,维系整个社会经济体系的稳定与发展。关于这一点,我们来看一个猴群博弈的故事。近两年这个故事一直流传于中文网络各大论坛与社区。

 

有一群猴子被关在笼子里。在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。

 

猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了。这个过程一直重复着。

 

猴子们发现,尽管有猴子吃到香蕉,但吃到香蕉的猴子是少数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了。

 

在这个故事里,猴子间产生了“道德”。如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是“不道德的”,它们也会自动地惩罚“不道德的”猴子。当然这只是一个故事,但这个博弈故事却反映了人类的道德的产生过程。

 

霍布斯认为人类在没有任何约束的自然状态中,就是“人与人之间像狼与狼一样”,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有正义或不正义,只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状态下无法产生文明。

 

与国家一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生了道德感。

 

道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德,正义或非正义的观念,就自动地产生了调节作用。

 

当然,道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德约束的作用便失效。

 

假设笼子中的这群猴子由于天气炎热,想要冲凉,却因道德约束无法用盆子中的水。这时,终于出现了一位猴子A。这只猴子在无意中碰到了香蕉,理所当然地饱受老拳。但在这个过程中,猴子们享受到了冲凉的乐趣。等身上的水干了之后,某只猴子B在无意中碰撞了A,使A又一次接触到了香蕉,于是,猴子们享受了第二次冲凉,A遭到了第二次痛殴。在此之后,只要大家有冲凉的需要,就总有一只猴子挺身而出,对A进行合理冲撞。大家对A的态度也有了明显的不同,在平时大家会对A异常温和,以弥补在冲凉时为维护规则而不得不对它进行的暴力举动。

 

一天,在大家冲凉时,饱受折磨的A闻到了香蕉的清香,生物本能使它在别的猴子没有注意到时将香蕉吃掉。而且此后没有了新的香蕉来填补空缺。于是猴子们陷入了另一个尴尬境地:没有冲凉的水,也没有香蕉。于是,另一个规则便形成了。猴子在烦躁的时候会痛打猴子A出气,猴子A不得反抗。当笼子里的旧猴子被新猴子换掉时,新猴子会在最快的时间内学会殴打猴子A。

 

终于有一天,老天有眼,历尽沧桑的猴子A被另一只猴子代替了。猴子们失去了发泄的对象,只能任意选取一个目标进行攻击。从此以后,笼子里的猴子们不吃不喝不冲凉,唯一的举动就是打架。

 

这就是社会整体道德沦丧的过程。

 

在生活中的道德约束失灵也很常见。所有的人都知道,拾金不昧是美德。当拾到别人丢的100块钱时还给失主不仅有道德满足感,还会受到社会的表扬,建立起自己的美誉;若不及时交还失主并很容易被发现的话,则会受到严厉的谴责并失去社会信誉。

 

假想一下,当拾到别人遗失的价值上百万的古玩名画时,极大的可能是归为己有。这是因为其归还物品所受表扬的效用(道德满足感)与不归还物品所受谴责的效用之和远小于该价值巨大的物品带给他的效用。这种情况下,道德作用失效,法治就不可替换地成为约束人们行为的主要手段。

 

 

 为什么要有法律?

 

100多年以前,粱启超曾说过:“我国成文法之起源不可确指,然以数千年之思想往往视法律与命令同为一物。”直至今日,很多人在骨子里面往往还是视法律和命令同为一物。

 

从命令的角度来理解法律,是指个人意志或某个集团的意志以上下级纵向关系的方式传达,具有直接的强制力,在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第三者裁判等中 间环节或者客观机制作为媒介。这样的法律往往是朝令夕改,其约束力并不能长久保持。

 

更严重的是,这种法律经常演变成是权力的合法外衣,为个人私欲谋取利益,而法律不再成为凌驾于社会生活博弈的超然之物,而是让博弈又多了一个权力者的不公平参与。真正的法律是在顾及社会各方利益博弈均衡的结果,在社会博弈中具有独立性,不参与博弈。

 

同时,合理的法律必须要有强制性,不管是对社会大众还是掌握权力的人,都拥有至高无上的权威,所有的人都必须遵守法律的约定,包括制定与执行法律的人,否则必然要受到无法逃脱的惩罚。

 

在这样一种法治环境中,法律必然可以改善囚徒困境。我们来看这样一个例子。如所前述,我们假定执法人员独立于博弈之外,有公司A与公司B是商业上的合作伙伴,公司A经常向公司B购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签订买卖合同,一般在一周最后的那一天,公司A将现金打入公司B的银行账户,公司B则发货到公司A,若违约则处以2~5倍罚款。

 

实际上,如果公司A与公司B都是理性人,那么他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次交易中都有可能存在其中一家公司不遵守合同,逃款或逃货,即使公司A现金充裕,而公司B货源充足。所谓的熟人欺诈也是这个道理。

 

然而,在我们理想的法律环境下,公司A和B最佳策略都是合作。不妨假设公司A与公司B每年的交易都有十几次,平均每笔生意为100万,若违约则罚款200万。

 

见上图,在这个博弈中:

 

1.在矩阵的左上角,公司A和B都选择合作,双方收益均为20万(指公司A与公司B的利润);

 

2.在矩阵的左下角,在公司A付款,而公司B不发货,A损失100万,B收益100万;

 

3.在矩阵的右上角,公司A不付款,公司B发货,公司A收益120万(其中包含20万的利润),公司B损失80万(指公司B货物的成本,也就是收入减去利润);

 

4.在矩阵的右下角,公司A不付款,公司B不发货,双方收益为零。

 

当然,这里还要说明的是这个博弈中没有考虑商业信誉的问题,商誉是社会道德中的问题,后面笔者会详细讨论。

 

很显然这是一个有限次重复博弈的囚徒困境,注意到前文所介绍的模型都是对称的,这个博弈则是非对称博弈,这更加贴切于日常生活的真相。

 

在没有法律背景的条件下,双方选择不合作是自然的纳什均衡点。然而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款其200万元,并且法院可以强制执行。在这种情况下,两个“囚徒”,也就是公司自然都会采取合作策略,完成合同对各方所要求的行动。简单说来,就是法律改变了两个公司博弈的均衡结果。

 

霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。

 

这就是法律制定的第一条原则:效率原则。效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。

 

强制性有效法律是非常重要的。在冷战时期,美苏两个超级大国40多年的军备竞赛反证出这一点。尽管他们双方签订一些制止军备竞赛的协议,但因缺乏一个世界性的公平合理又具有强制性的法律环境,其结果仍然是陷入无法解脱的囚徒困境。

 

类似的还有各国的贸易保护主义的永恒倾向也很能说明这个问题,除非某一天出现全世界的国家都得到统一,建立一个全球性政府才可以彻底解决这些国与国之间的囚徒困境问题。

 

法律制定的第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。用简单的一句话说,法律惩罚太重对犯法者不公平,惩罚太轻则对社会或他人不公平。

 

因此在不同的国家以及在同一个国家的不同时期,对这两个原则的态度是不同的。法律制定的这两条原则要根据不同时代,不同社会的具体状况而各有侧重。

 

就目前我国的社会现状来说,国家法律与立法执法的重要性日益凸现。我们从法律制定的第一条原则来看,违反契约的惩罚越是严厉并可信,则博弈者违约的可能性越小,这是路人皆知的道理。

 

再从法律制定的第二条原则来看,权力对法律公平性的侵害有损法律的权威性与公正性,这也是众所周知的。“乱世用重典”,通过上述分析,读者您认为目前的中国社会应采用什么方式,才能适宜于治理、整顿、重构目前的社会系统运行状态呢?

 

爱克斯罗德试验中的针锋相对策略

 

如果没有外部强制力,囚徒困境中的参与者怎样才可以维持合作呢?

 

这是一个非常实际的问题。比如在国际事务上,国家与国家之间经常就某些问题达成一定的协议,这种协议我们在前面解释过,由于不存在一个世界性的政府,约束力往往很小。

 

对于这个问题,有这样一种答案。如果一方采取不合作的策略,另一方随即也采取不合作策略并且永远采取不合作策略,在博弈 论里面称之为触发策略(Trigger strategy),或称冷酷策略。

 

如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。

 

但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。

 

美国密西根大学罗伯特·爱克斯罗德教授那个著名试验,给出了这个问题更好的答案。爱克斯罗德邀的这些人都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦多大学的拉波波特写出的针锋相对(tit-for-tat)策略。说穿了,所谓针锋相对策略,就是胡萝卜加大棒的原则。

 

爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

 

这个游戏共进行了两轮。在第一轮游戏中,共有14个程序参加竞赛,并附加上爱克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),总共运转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相对策略程序。

 

这个程序的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。爱克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。

 

为了进一步验证第一轮游戏得到的结论,爱克斯罗德邀请了更多的人再做一次游戏。这时游戏进入了第二轮。第二次爱克斯罗德征集到了62个程序,同样也附加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是针锋相对策略。

 

爱克斯罗德总结这次游戏的结论是:第一,针锋相对方法仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是“不善良的”,后15名中,只有1个总是合作的是“善良的”。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是“清晰性”,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

 

针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择“善行”,只因为合作是自我利益最大化的一种必要手段。

 

比如在爱情中的博弈原则应该是:善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。

 

比如对于恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁的回报。简单明了而不是山环水绕地对待恋人,在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。

 

在生活中一样可以运用这种方法。当一个人伤害了你的时候,你知道即便报复了他也并不能消除已对你形成的伤害。如果你还希望两个人的关系能够继续,那么最好是宽恕他。但是,若他知道即便伤害了你也会获得宽恕的时候,他就可能一直有意无意地不停伤害你。

 

就像我们在一些影片中看到某些心地善良却遇人不淑的女子。那些女子一次又一次原谅胡作非为的丈夫,希望用真情感动他回心转意;但结果丈夫反而得寸进尺,因为他知道无论如何只要一些花言巧语扮可怜就会获得宽恕。

 

所以有时候,人们会对伤害选择报复。当别人打你一拳,你若打回一拳,这本身并不能减轻你已挨那一拳的疼痛,而且用力打回一拳通常也得不到快感。那为什么还会回击呢?原因在于,你知道打不还手只会让对手更加猖狂,而选择回击是遏制对方进一步侵犯的方式。

 

所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见佳。这就是奇妙的人类互动世界。

 

利他主义与爱克斯罗德试验的局限

 

在爱克斯罗德试验中,选手策略有一定的演化趋向。就像物种遗传一样,对策者所组成的策略群体也是一代一代进化下去的。这种进化的规则包括:

 

1.试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。这就是试错法;

 

2.遗传。一个人如果合作性好,他的后代的合作基因就多;

 

3.学习。比赛过程就是对策者相互学习的过程,针锋相对策略好,有的人就愿意学。

 

在爱克斯罗德的试验中,第一轮比赛中的63个对策者,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。

 

试验结果很有趣。针锋相对策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个不善良的“哈灵顿”程序,它的对策方案是:首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。

 

这个程序一开始发展很快,但等到除了针锋相对之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。

 

进化试验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。针锋相对在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的。因为它让对方得到了高分。

 

哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。

 

那么,在一个极端自私者所组成的不合作者的群体中,针锋相对策略能否生存呢?爱克斯罗德发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的5%或更多成员是针锋相对策略的,这些合作者就能生存。

 

而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的趋势是不可逆转的,群体的合作性越来越大。

 

在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要作出回报,否则不会有人跟他长期合作的。

 

那么,提高团队合作性必须要做到以下8点:

 

1.要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作;

 

2.要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了;

 

3.要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作;

 

4.能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度;

 

5.不要嫉妒人家的成功,针锋相对策略正是这样的典范;

 

6.不要首先背叛,以免担上罪魁祸首的道德压力;

 

7.不仅对背叛要回报,对合作也要作出回报;

 

8.不要耍小聪明,占人家便宜。

 

爱克斯罗德在《合作的进化》一书结尾提出这么几个结论:

 

1.友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。

 

2.预见性也不是合作的前提,爱克斯罗德举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。

 

当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛时,以修正的针锋相对策略,即以一定的概率不报复对方的背叛,和“悔过的针锋相对策略”,即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,悔过的针锋相对策略效果越好,宽大的针锋相对策略效果越差。

 

爱克斯罗德所发现的针锋相对策略,从社会学的角度可以看做是一种利他主义。这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序。

 

这种秩序即使在多年隔绝、语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印第安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。

 

但是,爱克斯罗德博弈试验的假设使其研究不可避免地与现实情况相脱节。

 

首先,《合作的进化》一书暗含着一个重要的假定,即个体之间的博弈是完全无差异的。一方面,在现实的博弈中,对策者之间绝对的平等是不可能达到的。另一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分,这样,弱者的报复就毫无意义。

 

其次,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。爱克斯罗德的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。

 

“智猪博弈”的故事

 

博弈论里面有个十分卡通化的博弈模型,叫做“智猪博弈”(Pigs' payoffs)。

 

整个故事是这样的:笼子里面有两只猪,一只大,一只小。笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

 

如果定量地来看,踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食。

 

如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位。

 

如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的劳动耗费2个单位净得4个单位,小猪也吃到4个单位。

 

如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位。

 

如果大家都等待,结果是谁都吃不到。可以得出结论,唯一解是大猪踩踏板,小猪等待。

 

我们把这个博弈用矩阵的形式表达,见上图:

 

1.在矩阵的左上角,大猪踩踏板,小猪也踩踏板,大猪、小猪各得到5个单位食物和1个单位食物;

 

2.在矩阵的左下角,大猪等待,小猪踩踏板,大猪、小猪各得到9个单位食物和-1个单位食物;

 

3.在矩阵的右上角,大猪踩踏板,小猪等待,大猪、小猪都各得到4个单位食物;

 

4.在矩阵的右下角,大猪、小猪等待,大猪、小猪都得不到食物。

 

那么,两只猪各会采取什么策略?令人出乎意料的是,答案居然是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

 

原因何在呢?

 

因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

 

如果采用定量分析的方法,根据矩阵,“等待”是小猪的优势策略,“踩踏板”是小猪的劣势策略。先把小猪的劣势策略消去,再来看大猪的策略。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略。把它也删去,就分析出相同的结局:大猪来回在猪槽的两端奔波,小猪则坐享其成。

 

“智猪博弈”的结论似乎是,在一个双方公平、公正、合理和共享竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。

 

这种情况在现实中比比皆是。

 

比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。

 

“智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。

 

在现实生活中,很多人都只想付出最小的代价,得到最大的回报,争着做那只坐享其成的小猪。“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝”说的正是这样一个道理。这三个和尚都想做“小猪”,却不想付出劳动,不愿承担起“大猪”的义务,最后导致每个人都无法获得利益。

 

在日常的人际关系中,有一些人会成为不劳而获的“小猪”,而又另一些人充当了费力不讨好的“大猪”。

 

有一个笔者亲见的真实故事。某大学公开招聘两名教授,一个是教经济学的,一个是教会计学的。经过层层选拔,最终有两人获得机会,姑且称之为A教授和B教授。

 

接下来就是一个让所有人想不通的选择过程,但这个事情却是现实得不能再现实了。

 

会计学教授的工资是5000元/月,而经济学教授的工资是3500元/月。A、B两教授具有相同的学历背景———会计学硕士。同时又都有经济学的教学经验,A授的会计学教学经验优于B教授。

 

依一般人的想法,知识就是金钱,知识越多,工资越高,A教授理所当然地会获得会计学教授职位。这就是我们这些聪明人的天真之处,殊不知现实并非如此。

 

因为B教授知道市场行情,而且知道到了目前,不可能有新的竞争者加入。因此,在与教务主任谈判时,极力否认自己具有经济学的教学经验,甚至说如果让他去讲授经济学会误人子弟,与其这样,自己宁可不要这份工作。

 

而A教授为了证明自己的能力,一开始就合盘托出,甚至大谈特谈自己的经济学教学经验。事情到此为止,我想每个人都看出了门道,学校不可能重新招聘,而两个教授也都不可能随便丢掉到手的美差。最终的结果就是B教授获得了会计学的教授职位,而A教授只好退而求其次,教授经济学。

 

在我们的企业中,什么都缺,就是不缺人,所以每次不论多大的事情,加班的人总是越多越好。本来一个人就可以做完的事,总是会安排若干个人去做。

 

这时,“三个和尚”的现象就出现了。

 

如果大家都耗在那里,谁也不动,结果是工作完不成,挨老板骂。这些常年在一起工作多年的战友们,对对方的行事规则都了如指掌。“大猪”知道“小猪”一直是过着不劳而获的生活,而“小猪”也知道“大猪”总是碍于面子或责任心使然,不会坐而待之。

 

因此,其结果就是总会有一些“大猪们”过意不去,主动去完成任务。而“小猪们”则在一边逍遥自在,反正任务完成后,奖金一样拿。

 

智猪博弈用句通俗的话来形容就是“枪打出头鸟”。一个很常见的现象就是在企业中,不论国企还是民企或是外企,在企业内部总会存在各种各样的小团体。套用组织行为学的专业术语来说就是存在各种非正式组织。而每一个团体都代表了一部分人的利益,因此不可避免地会产生冲突。

 

这时,每个团体都会推选出各自的代言人。这些代言人是为集体利益(如争取加薪或增加福利等)作出积极行动的领头人。但我们这时会发现,被推选为代言人的总是那些胸无城府、意气用事的人。

 

然而,群体活动的最大受益者“小猪”们则永远躲在幕后。活动成功了,他们可以毫发无伤地优先分到一杯羹;如果失败了,他们也可以发表一通与我无关,我是受害者之类的演讲,让“大猪”成为永远的牺牲者。从另一个角度来看,懂得智猪博弈对于个人并非是件坏事。

 

实际上,作为一个有理性的人,谁都不愿意甘冒风险而为他人带来好处。如果是这种情况,智猪博弈便无法形成。在智猪博弈的模型中,要摆脱大家都无法生存的困境,就要让双方的期望值不同,然后由一方作出现象上的让步。实际上,让步的这一方,只是在表面上看起来是谦让了。

 

但他不是无原则无目的的让步,绝不像孔融让梨那样是出自道德心,而是出自自己理性的盘算和对期望值的估计,然后才采取看似让步的举动的。这样一来,别人看来你是让步了。因为表面上是如此的,而你在不违背自己意愿的基础上,打破了困境,实现了自己的期望。这看似愚蠢,实则智慧至极。

 

在智猪博弈里,利用他人的努力来为自己谋求利益的智者是最大的受益人,因为他不必付出什么劳动就能获得自己想要的东西。因此,关键就在于如何让对手心甘情愿地按照自己的期望去行动。

 

由此看来,中国人立身处世的态度———各家自扫门前雪,莫管他人瓦上霜”,其结局必然是整体利益受到损害。尽管人们只希望自己的行为对自己无害,并不想对他人有利。

 

反过来说,“智猪博弈”毕竟是有前提条件的。在生活中,不管是先发制人还是“智猪博弈”中的后发制人,不过是一个策略的选择,而非根本的原则分歧。到底是选择先发还是后发,在博弈论中,就要先分析形势,按照风险最小利益最大的原则,把风险留给对手,把获益机会把握在自己手中。

 

总而言之,在博弈中既有先动优势策略,也有后动的优势策略。至于在具体的博弈中究竟是选择先动还是后动,都是由博弈参与者的各方具体情形所决定的。

 

“智猪博弈”与激励机制设计

 

“智猪博弈”给了竞争中的弱者以等待为最佳策略的启发同时,也反映了一种“搭便车”现象。

 

“搭便车”的现象在现实中大量存在,在企业的运营过程中也不乏其例。很多企业的一般员工甚至中层管理者工资、福利也不算低,但依然缺乏工作能动性,不能创造优异的绩效,很多事情还要亲力而为。

 

对于社会而言,因为小猪未能参与竞争,创造价值。小猪“搭便车”时的社会资源配置并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府、公司都是如此。

 

智猪博弈告诉我们一个企业制度和流程的重要性,以及不好的规则对公司带来的影响。这就要求规则的设计者应清楚、慎重地考虑规则制定的前瞻性、适应性和高效性。

 

智猪博弈存在的基础,就是双方都无法摆脱共存局面,而且必有一方要付出代价换取双方的利益。而一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被破解。

 

能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适。“智猪博弈”的核心指标一般来说有两个:食物数量、踏板与食槽之间的距离。

 

那么,如果改变这两个关键条件,“搭便车”的现象会不会杜绝呢?

 

首先来看看减量方案。食物只有原来的一半分量,也就是5个单位的食物。这种情况下,小猪大猪都不去踩踏板。小猪去踩踏板,大猪将会把食物吃完;大猪去踩踏板,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方嫁衣裳,所以谁也不会有踩踏板的动力。如果目的是想让两只猪去踩踏板,这个制度的设计显然是非常失败的。

 

其次再来看看增量方案。食物是原来的两倍分量,也就是20个单位的食物。结果是小猪、大猪都会去抢着去踩踏板。谁想吃,谁就会去踩踏板。因为对方不可能一次把食物吃完,小猪和大猪相当于生活在应有尽有的天堂,当然它们的竞争意识也不会得到提高。对于制度设计者来说,这个制度的成本提高了一倍。在不需要付出多少代价就可以得到所需食物的情况下,两只猪自然都不会有多少动机去增加踩踏板的数量。这个制度的设计明显激励作用不足。

 

最后再来看看移位方案。考虑到问题的关键是移位,接下来我们探讨一下因移位而产生的几种改变方案:

 

1.移位并减少食物投放量。食物只有原来的一半分量,但同时将食槽与踏板之间的距离缩短。这种情况下,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完;

 

2.移位并增加食物投放量。正常情况移位用不着增量,大猪小猪都会去踩踏板。如果适当增量,成员会快速成长,小猪会长大,大猪会出栏,效益就会增长。不过需要把握成本增加的度,适当的增量更符合组织与个人的需求;

 

3.移位但不改变食物投放量。由于食槽与踏板之间的距离缩短,去踩踏板的劳动量减少,大猪小猪都会争着去踩踏板。如果把踩踏板的次数增加,吃到的食物会更多,对食物的不懈追求,将驱动合作机制的形成和生产效率的提高。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。

 

智猪博弈制度规则的改变对于企业的经营管理者而言,就是采取不同的激励方案,对员工积极性调动的影响也是不同的,并不是足够多的激励就能充分调动员工的积极性。比如企业实行职工全员持股的方案,结果如第二个方案一样,人人有股但没有起到相应的激励作用。

 

同样的,企业在构建战略性激励体系过程中,也需要从目标出发,设计相应的合理方案。

 

首先,根据不同激励方式的特点,结合企业自身发展的要求,准确定位激励方案的目标和应起到的作用;

 

其次,根据激励方案的目标和应起到的作用,选择相关激励方式,并明确激励的对象范围和激励力度。

 

扩而大之,从整个社会来讲,自身需求大的群体,比如现在媒体经常提及的弱势群体,他们往往才是社会生产力推动的主力。

 

换句话说,要迅速提高整个社会的生产力水平,就需要有一个自身具有很大消费需求的群体,并且需要给他们一定程度的奖励。第三种改变方案反映的就是这种情况,方案中降低了取食的成本,在现实中,也可以等同于增加了对取食者的奖励。

 

企业战略与“智猪博弈”

 

价格竞争作为市场经济实行优胜劣汰、优化资源配置的一种手段,起着独特的作用。但在一些行业除了大中型的公司以外还同时存在着一些管理规范、运作良好的小公司。那么在两个企业实力存在差距又面临价格竞争时,小企业的生存发展与其所选择的策略有着密不可分的关系。

 

我们都知道,“智猪博弈”的结果依赖于大猪的行为。如果小猪去踩踏板,大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果小猪等待,那么大猪将先去踩踏板再跑回来以获得相当于 4个单位的猪食,这总比空着肚子等待要好。

 

对小猪来说,情况非常清楚,无论大猪如何行动,它最好是等在食槽旁边。因此这个博弈的均衡结果就是:每次都是大猪去踩踏板,小猪先吃,大猪再赶来吃,只有这样大猪小猪才可以共同生存。

 

在实力悬殊公司之间的价格竞争策略也是这个道理。在商业竞争中,如果公司是弱小的一方,则可以选择如下策略:

 

首先是等待,静观其变。允许市场上占主导地位的品牌开拓本行业所有产品的市场需求。将自己的品牌定位在较低价格上,以享受主导品牌的强大广告所带来的市场机会;

 

其次是不要贪婪,妄图将“大猪”应得的那份也据为己有。只要主导品牌认为弱小公司不会对自己形成威胁,它就会不断创造市场需求。因此公司可以将自己定位在一个引起不了主导品牌兴趣的较小的细分市场,以限制自己对主导品牌的威胁。

 

如果公司是“智猪博弈”中的大猪,在行业市场中占主导地位,则可采取以下策略:

 

首先要接受小公司。作为主导品牌,加强广告宣传,创造和开拓对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种浪费资源的做法与小企业竞争,除非它对公司形成了真正的威胁。正是小企业采取的低价格阻止了潜在进入者的涌入;

 

其次对威胁的限制要清楚。如果小企业发展壮大到了构成威胁的程度,大公司就应该迅速作出进攻性的反应,并且让小企业清楚地知道它们在什么样的规模水平之下才是可以被容忍的,否则就会招致大公司强有力的回击。如果小公司知道对它们的限制,也就不会再有兴趣超越这种限制。

 

当然“大猪”“小猪”的共同生存是有条件的。“智猪博弈”说明了在某个市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况。这取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度。“智猪博弈”中“共同生存”的均衡结果只有在大猪的食物份额没有受到小猪严重威胁时才会出现。

 

70年代末80年代初,美国市场上私人标签(Private label,非品牌产品)的软饮料质量虽低劣,但价格很便宜,因此仍然能够占有较低的市场份额。可口可乐公司和百事可乐公司最初能够容忍这些私人标签软饮料的存在,因为它们的威胁是有限的。

 

可没过多久,一家主要的私人标签软饮料供应商Cott公司通过挑衅性的定价和较高的质量,从一只仅有较低市场份额的地区品牌的“小猪”,成为一个拥有1/3市场份额的、与两大可乐公司旗鼓相当的竞争者。

 

此时,可口可乐公司和百事可乐公司通过降低价格这种进攻性的战略行动,抢占了私人标签软饮料的市场份额,这些公司包括Scott公司在瞬间土崩瓦解。

 

总而言之,通过运用“智猪博弈”模型对两个规模与实力存在较大差距的竞争对手之间价格战的情况进行分析可以看到,竞争双方应对自己的地位和作用有一个清醒的认识。这一点非常重要。认清自己真正的利益所在,避免残酷的价格战的发生。两个地位相去甚远的对手,最终会达到和平的生存模式:共同生存,共同发展。

 

 证券市场中的“智猪博弈”

 

金融证券市场是一个群体博弈的场所,其真实情况非常复杂。在证券交易中,其结果不仅依赖于单个参与者自身的策略和市场条件,也依赖其他人的选择及策略。

 

在“智猪博弈”的情景中,大猪是占据比较优势的,但是,由于小猪别无选择,使得大猪为了自己能吃到食物,不得不辛勤忙碌,反而让小猪搭了便车,而且比大猪还得意。这个博弈中的关键要素是猪圈的设计, 即踩踏板的成本。

 

证券投资中也是有这种情形的。例如,当庄家在底位买入大量股票后,已经付出了相当多的资金和时间成本,如果不等价格上升就撤退,就只有接受亏损。

 

所以,基于和大猪一样的贪吃本能,只要大势不是太糟糕,庄家一般都会抬高股价,以求实现手中股票的增值。这时的中小散户,就可以对该股追加资金,当一只聪明的“小猪”,而让“大猪”庄家力抬股价。当然,这种股票的发觉并不容易,所以当“小猪”所需要的条件,就是发现有这种情况存在的猪圈,并冲进去。这样,你就成为一只聪明的“小猪”。

 

从散户与庄家的策略选择上看,这种博弈结果是有参考价值的。例如,对股票的操作是需要成本的,事先、事中和事后的信息处理,都需要金钱与时间成本的投入,如行业分析、企业调研、财务分析等。

 

一旦已经付出,机构投资者是不太甘心就此放弃的。而中小散户,不太可能事先支付这些高额成本,更没有资金控盘操作,因此只能采取小猪的等待策略。等到庄家动手为自己觅食而主动出击时,散户就可以坐享其成了。

 

股市中,散户投资者与小猪的命运有相似之处,没有能力承担炒作成本,所以就应该充分利用资金灵活、成本低和不怕被套的优势,发现并选择那些机构投资者已经或可能坐庄的股票,等着大猪们为自己服务。

 

由此看到,散户和机构的博弈中,散户并不是总没有优势的,关键是找到有大猪的那个食槽,并等到对自己有利的游戏规则形成时再进入。

 

遗憾的是,在股市中,很多作为“小猪”的散户不知道要采取等待策略。更不知道让“大猪”们去表现,在“大猪”们拉动股票价格后从中获取利润,才是“小猪”们的最佳选择。

 

作为“小猪”,还要学会特立独行。行动前,不用也不需要从其他“小猪”那里得到肯定;行动时,认同且跟随你的“小猪”越多,则你出错的可能也就越大。简单地说,就是不要从众,而是跟随“大猪”。

 

当然股市中的金融机构要比模型中的大猪聪明的多,并且不守游戏规则,他们不会甘心为小猪们踩踏板。事实上,他们往往会选择破坏这个博弈的规矩,甚至重新建立新规则。

 

比如他们可以把踏板放在食槽旁边,或者可以遥控,这样小猪们就失去了搭便车的机会。例如,金融机构和上市公司串通,散布虚假的利空消息,这就类似于踩踏板前骗小猪离开食槽,好让自己饱餐一顿。

 

当然金融市场中的很多“大猪”也并不聪明,他们的表现欲过强,太喜欢主动地创造市场反应,而不只是对市场作出反应。短期来看,他们可以很容易地左右市场,操纵价格,做胆大妄为的造市者。

 

这些“大猪”们并不知道自己要小心谨慎、如履薄冰,他们不知道自己的力量不如想象的那样强大到可以无敌于天下。自然而然地,每一年都会有一些高估自己的“大猪”倒下,幸存的“大猪”在经过优胜劣汰之后会变得更加强壮。

 

不过,无论是多么强壮的“大猪”,只要过于自信、高估自己控制市场的能力,总会倒下。

 

俗话说“家家有本难念的经”,在股市中,“大猪”有“大猪”的难处,“小猪”有“小猪”的难处。尽管“大猪”“小猪”只要了解自身处境,采取相应的策略就会成功,然而理性是有限的,确定的成功总是很难获得。

 

“斗鸡博弈”与“骑虎难下”

 

话说某一天,在斗鸡场上有两只好战的公鸡发生遭遇战。这时,公鸡有两个行动选择:一是退下来,一是进攻。

 

如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。

 

因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。

 

不妨假设两只公鸡如果均选择“前进”,结果是两败俱伤,两者的收益是-2个单位,也就是损失为2个单位;如果一方“前进”,另外一方“后退”,前进的公鸡获得1个单位的收益,赢得了面子,而后退的公鸡获得-l的收益或损失1个单位,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的收益或1个单位的损失。当然这些数字只是相对的值。

 

如果博弈有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。斗鸡博弈则有两个纳什均衡:一方进另一方退。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。

 

由此看来,斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。这就像武侠小说中描写的一样,两个武林顶尖高手在华山之上比拼内力,斗得是难分难解,一旦一方稍有分心,内力衰竭,就要被对方一举击溃。

 

斗鸡博弈在日常生活中非常普遍。比如,警察与游行者相遇,最好有一方退下来。

 

再比如,收债人与债务人之间的博弈类似于斗鸡博弈:

 

假如债权人A与债务人B双方实力相当,债权债务关系明确,B欠A100元,金额可协商,若合作达成妥协,A可获90元,减免B债务10元,B可获10元。

 

如一方强硬一方妥协,则强硬方收益为100元,而妥协方收益为0;如双方强硬,发生暴力冲突,A不但收不回债务还受伤,医疗费用损失100元,则A的收益为-200元,也就是不仅100元债收不回,反而倒贴100元,B则是损失了100元。

 

因此,A、B各有两种战略:妥协或强硬。每一方选择自己最优战略时都假定对方战略给定:若A妥协,则B强硬是最优战略;若B妥协,A强硬将获更大收益。于是双方都强硬,企图获100的收益,却不曾考虑这一行动会给自己和对方带来负效益100。

 

故这场博弈有两个纳什均衡,A收益为100,B收益为0,或反之,这显然比不上集体理性下的收益支付,A、B皆妥协,收益支付分别为90、10。也就是债权人与债务人为追求利益最大化,会选择不合作,从某种意义上说双方陷入囚徒困境。

 

尽管在理论上有两个纳什均衡,但由于当今中国信用不健全(如欠债不还、履约率低、假冒伪劣盛行),法律环境对债务人有利,可想而知B会首先选择强硬。

 

因此,这是一个动态博弈,A在B选择强硬后,不会选择强硬,因为A采取强硬措施反而结局不好,故A只能选择妥协。而在双方强硬的情形下,B虽然收益为-100,但B会预期,他选择强硬时A必会选择妥协,故B的理性战略是强硬。因此,这一博弈纳什均衡实际上为B强硬A妥协。

 

欠债还钱博弈是假定A、B实力相当,如实力相差悬殊,一般实力强者选择强硬。比如在家庭夫妻冲突中,首先退下阵的一般是丈夫。大部分夫妻怄气或吵架,最终得利的总是妻子。

 

战国思想家庄子讲过一个故事,说斗鸡的最高状态,就是好像木鸡一样,面对对手毫无反应,可以吓退对手,也可以麻痹对手。这个故事里面就包含着斗鸡博弈的基本原则,就是让对手错误估计双方的力量对比,从而产生错误的期望,再以自己的实力战胜对手。

 

然而,在实际生活中,两只斗鸡在斗鸡场上要作出严格优势策略的选择,有时并不是一开始就作出这样的选择的,而是要通过反复的试探,甚至是激烈的争斗后才会作出严格优势策略的选择,一方前进,一方后退,这也是符合斗鸡定律的。

 

因为哪一方前进,不是由两只斗鸡的主观愿望决定的,而是由双方的实力预测所决定的,当两方都无法完全预测双方实力的强弱的话,那就只能通过试探才能知道了,当然有时这种试探是要付出相当大的代价的。

 

在现实社会中,以这种形式运用斗鸡定律,却比直接选用严格优势策略的形式,要常见的多。这也许是因为人有复杂的思维、更多的欲望。

 

斗鸡博弈进一步衍生为动态博弈,会形成这样一个拍卖模型。拍卖规则是:轮流出价,谁出的最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。

 

假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想:如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品。但是,随着出价的增加,他的损失也可能越大。每个人面临着是继续叫价还是退出的两难困境。

 

这个博弈实际上有一个纳什均衡:第一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的),出价100元的参与人得到该物品。

 

一旦进入骑虎难下的博弈,尽早退出是明智之举。然而当局者往往是做不到的,这就是所谓“当局者迷,旁观者清”。

 

这种骑虎难下的博弈经常出现在企业或组织之间,也出现在个人之间。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,就是骑虎难下。其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是必胜的。

 

从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这样的赌场要设定赌博数额的限制。

 

当然骑虎难下的局面,在国家之间也经常碰到,20世纪60年代,美国介入越南就是一个骑虎难下博弈。

 

博弈论专家,有时候也将骑虎难下博弈称之为“协和谬误”。

 

20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。

 

协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。

 

银行会垮掉吗?

 

银行挤兑是存款人集中大量提取存款的行为,是一种突发性、集中性、灾难性的危机。自从银行诞生以来,挤兑现象就相并而存。

 

据载,世界上最早的两家银行是1272年和1310年在意大利设立的巴尔迪银行和佩鲁齐银行,均因债务和挤兑问题于1348年倒闭。始于银行挤兑而爆发的1929~1933年的经济大危机,使美国大约1.1万家银行倒闭或被兼并 ,造成金融混乱。20世纪70年代以来,银行危机发生的频率越来越高,世界上有100多个国家和地区的银行曾发生过银行挤兑的灾难。

 

近期的东南亚金融危机、俄罗斯金融危机,以及拉丁美洲各国金融危机时,银行挤兑现象也都非常严重,很多时候正是银行挤兑摧残了雪上加霜的国家经济。

 

一般来说,在经济危机发生之初,往往是由于经济持续低迷而股市泡沫彻底破灭。广大投资者开始疯狂抛售股票,股价雪崩般地下跌从而引起股市崩溃。股市崩溃又会引发了一连串连锁反应。

 

广大投资者的财富几乎是在一夜之间化为乌有,迫于生计和信心动摇,人们纷纷赶往银行兑换存款,这又直接导致银行相继倒闭。银行倒闭后,大量工商企业的正常运转由于失去了资金支持也相继宣告破产。

 

同时由于大批银行倒闭,吞掉了小额存户的存款,使千家万户濒于死亡的边缘。工人因此而大量失业,人民生活水平大幅下降,更无力去市场购买商品。国家经济由此开始进入了恶性循环,并要倒退很多年。

 

就拿美国1929年的经济大萧条来说,1929年,美国商业银行数量为25568家,而到1933年,美国商业银行总量只有14771家,有万余家银行破产倒闭。

 

那时出生的婴儿长期缺乏营养和医疗护理;约有200万~400万中学生中途辍学;大量的无家可归者栖身于铁道边简易的纸棚;许多人忍受不了生理和心理的痛苦而自杀;社会治安恶化。最为惨绝人寰的是,穷人被活活饿死的事件不断出现。

 

由此可见,银行挤兑问题是关系到每个人的事情。为了理解银行挤兑的成因,我们来看这样一个简单的例子。这个例子正反映了银行挤兑现象发生的机理。

 

假设现在有A和B两个朋友,都借给C朋友100万元人民币做生意,C拿到这200万元在第一年进行投资,第二年才可以赚得利润。笔者不妨假设第一年的时候,A和B索要借款,C只能还给两人各70万元,若是A和B并不是那么急着用钱,给C两年的时间,则C连本带利可以给付280万。

 

对于A、B两人来说,第一年要回借款,各得70万;其中一个人要回借款,而另一个人没有去索要,则索要的人先来一步得到100万本钱,另一个人则只拿到剩下的40万元;如果两人都在第二年才拿回存款,则各得140万元;在第二年,只有一个人要回借款,另一个人并没有催着C还钱的情况下,先催款的人得到180万,另一个人只拿到原来的本钱100万。

 

这种情况下,就是一个两阶段的动态博弈。见下面两个图。

 

动态博弈都是用倒推法进行分析,我们在这里仍然采用倒推法,首先看第二年时,A和B作为理性人会如何选择行动策略。假如A和B都将资金借给C用到第二年,这个时候,博弈均衡点是双方都要回自己的资金,A和B各得到140万元的还款,利息率高达40%。从博弈论的角度来看,整个均衡点是A、B两人理性博弈的唯一可能结果。

 

我们回过头来看,第一阶段也就是本例中第一年双方的博弈情况。由于在第一年时,双方都不抽回资金的策略将产生第二阶段的均衡结果,因此,在第一阶段的博弈矩阵可以改写成如下的图。

 

在我们假定A和B都是理性人的条件下,第一阶段的纳什均衡点很明显有两个,一个是双方都索要借款,这时双方都只能拿回70万元,另一个就是双方在第一年都不索要借款,这时根据我们在第二阶段的分析,双方各能收到140万元的回报。自然对于A和B来说,后一个纳什均衡比前一个纳什均衡要好。

 

遗憾是,没有什么可以保证A、B双方一定会在第一年不索要借款。

 

在现实生活中,这个模型中的C就相当于是一家银行,而A和B就是银行的存款客户。银行挤兑往往是由于谣言四起,存款客户不再放心将钱放在银行中,纷纷去银行拿回存款,在很短的时间内,银行又无法筹措大量的现金。

 

最终的结果就是银行倒闭,很多人只能抽回银行存款的一部分,甚至是一分存款都拿不到。在国外,许多银行因挤兑风潮倒闭的现象,就是源于此。

 

对付银行挤兑破产的根本只有依靠政府。强有力的、权威的、有担保能力的政府才可以出面保证客户资金安全,防止银行恶性竞争,并为银行辟谣,预防挤兑的发生。同时政府需要建立信贷制度、保险制度来加强人们的信心,尽量达到另一个较好结果的纳什均衡。

 

在历史上,博弈论诞生之前,一些国家的政府就已经这么做了。如1929年的经济危机之后,美国政府为了防止银行挤兑发生,预防经济危机,就采取了一系列的措施。为了降低银行业破产倒闭的风险,美国国会在20世纪30年代通过了《1933年银行法》和《1935年银行法》,这些法规强调了对银行业进行全方位的监管,限制银行业过度竞争,以保证银行业的稳定。同时,为了避免大危机中许多银行破产倒闭局面再次发生,美国国会于1933年通过了《联邦存款保险法》,并授权建立联邦存款保险公司。

 

 以弱战强的制胜之道

 

在中国历史上,以弱胜强的战役举不胜数。在现代企业竞争中,弱小企业打败大企业也是司空见惯的情形。

 

在第二次世界大战中,德国以最少的兵力最快的速度侵占法国。德国要进攻法国无非有三种选择:从两国接壤的边境发起进攻;借道比利时和卢森堡;借道瑞士。由于瑞士是个高山国家,阿尔卑斯山脉贯穿全境,不便于开展军事行动。所以第三种选择首先被排除。

 

于是,进攻路线的选择就剩下了两个:从两国接壤的边境发起进攻;借道比利时和卢森堡。法国修筑了漫长的防线,严阵以待,抵抗的军。

 

然而事实是,1940年5月10日,德军从卢森堡和比利时东部的阿登森林地区进入法国,撕开了法国防线,德军长驱直入。驻守在法国和比利时边境的英法联军,一下子被断了后路,被德军包围了。他们一路向后撤,直到大海边。5月26日一天,英国动员了所有的船只,从法国接回了33.8万人,这就是著名的“敦克尔刻大撤退”。

 

我们不妨用博弈论来简单地分析一下当时的法国是否有好的策略来阻止德国的进攻。

 

假设进攻方德军准备进攻法国,军力是2个师。而防守的法国军队则有3个师。德军与法军每个师的装备、人员、后勤等完全相同,自然战斗力相同。不妨假想,德国进攻法军有两个方向,分别是A、B两个方向。由于一个德军师与一个法军师的战斗力完全相同,因此两军相遇时,人数居多的一方取胜,战争中都是“易攻难守”,因此当两方人数相等时,守方获胜。同时,军队的最小单位为师,不能够再往下分割。只要德军可以突破防线,就算德军胜利;反之则法军胜利。

 

由此看来,进攻方德军的战略有两个:

 

1.两个师集中向法军防线的A方向进攻;

 

2.兵分两路,一个师向法军防线的A方向进攻,另一个师向法军防线的B方向进攻;

 

3.两个师集中向法军防线的B方向进攻。

 

防守方法军则有四种不同的防守策略:

 

1.3个师集中防守A方向;

 

2.2个师防守A方向,1个师防守B方向;

 

3.1个师防守A方向,2个师防守B方向;

 

4.3个师集中防守B方向。

 

我们依次用排列组合来看罗列双方各种策略组合下的结果,见下图。

 

这个博弈中,德军没有劣势策略,而法军有劣势策略。

 

很明显在这种情况下:法军选择第一种策略,也就是派3个师防守A方向劣于第二种策略,也就是派2个师防守A方向,1个防守B方向。因为,法军选择第二种策略的任何一个结果都不比选择第一种策略的结果要差。

 

在图中能够看出三种结果:

 

1.德军选择第一种策略时,法军选择第二种策略与第一种策略相同,都是法军胜利;

 

2.德军选择第二种策略时,法军选择第二种策略是法军胜利,而第一种策略则是德国胜利,自然选择第二种策略要好;

 

3.德军选择第三种策略时,法军选择第一、第二策略结果相同,都是德军胜利。由此可见,法军选择第二种策略自然好于第一种。

 

4.同理,法军选择第三种策略也好于第四种策略的结局。因此,法军策略选择种的第一种和第四种都是劣势策略。

 

劣势策略从理性人的角度来看是法军一定不会采用的策略,德军知道法军不会选择第一、第四种策略,德军和法军都知道博弈简化成下图。

 

这个简化的博弈中,法军反而没有劣势策略,德军却有一个劣势策略,也就是第二种策略,选择分兵两路进攻法军防线。很明显,德军选择第二种策略的结局就是根本不可能胜利,理性的德军自然不选择这个劣势策略。博弈矩阵得到了进一步的简化见下图。

 

这个时候,德法双方的形势是相同的,即德军尽管在总兵力上劣于法军,但实际上它只要运用谋略,攻其不备,其获胜的可能与守方是相同的。

 

在博弈论中,“以弱胜强”道理就是这样。比如在战争中,总兵力占优势的一方往往并不能保证在某个局部可以获得优势,处于弱势的一方则可以集中优势兵力,在某一个方向或某一场战斗中取得胜利,并逐步积累胜利成果达到最终整个战役的胜利。

 

在企业竞争中,也是一样。资本、规模、品牌、人力等都处于劣势的企业,可以在某个局部市场上,集中自己所有的资源并加以整合,造成细分市场上对强势企业的优势,从而成为市场竞争的胜家。

 

在个人求职中,学识、水平等自身素质固然十分重要。然而在面试时,如果能够运用以弱胜强的博弈方法,根据应聘职位的需求,集中展现自身优势,恰当地运用面试方法,就能够在众多实力不凡的竞争对手中脱颖而出。

 

“海盗分金”的正解

 

海盗,是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝的好习惯,而且总要画上一张藏宝图,以方便后人掘取。

 

然而很少有人知道,海盗是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,富有独立精神。

 

平时海盗们之间一切事都由投票解决。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。

 

现在船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依此类推。

 

我们先要对海盗们作一些假设:

 

1.每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而作出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信;

 

2.一枚金币是不能被分割的,不可以你半枚我半枚;

 

3.每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的;

 

4.每个海盗当然希望自己能得到尽可能多的金币;

 

5.每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理。总而言之,他们相信二鸟在林,不如一鸟在手;

 

6.最后,每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。

 

现在,如果有10个海盗要分100枚金币,结果将会怎样呢?

 

这是来自于《科学美国人》中的一道智力题,原题叫作《凶猛海盗的逻辑》。一般大家都称之为“海盗分金”问题。

 

要解决“海盗分金”问题,我们总是从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该作策略选择,依此类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我作这样的决定,下面一个海盗会怎么做?”

 

以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。

 

往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。

 

P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。

 

依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。

 

结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。

 

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

 

真地是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。

 

其实什么事情都是先手比较有优先决断权。历朝历代的农民起义、争斗不休的宫廷政变、企业内部成帮结派的明争暗斗、办公室脚下使绊的公司政治,哪一个得胜者不是用“强盗分金”的办法,他们都是以最小的代价获得最大的受益,拉拢“挑战者”分配方案中最不得意的人们,而打击“挑战者”。

 

当老大是不容易的,企业家就是要把各方面“摆平”。任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚 “挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

 

为什么革命者总是找穷苦人?因为他们是最失意的人。为什么恐怖分子拉登在沙特阿拉伯没有市场,在阿富汗却大受欢迎?因为阿富汗是全球的弃儿。为什么企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热?这正是因为公司里的小人物好收买,而二号人物却总是野心勃勃地想着取而代之。

 

海盗P10就相当于公司老板。假如你作为老板,拥有最先分配权,就看你是否仁厚或是黑心,你有权独吞所有共同成果,也可以合理分配让大家满意,如果你过于贪婪,就要承担被伙伴推翻的风险,如果您不想冒险,就放弃部分利益以求共存。

 

当然“海盗分金”的隐含假设是所有海盗的价值取向都是一致的,理性的。而在现实生活背景下,海盗的价值取向并不都一样,有些人的脾性是宁可同归于尽都不让你独占便宜,有些人则只求安稳,不计较利益。

 

所以这10个海盗换成不同性格的人在不同的位置都有可能影响结果。作为海盗P10,还必须对伙伴们的性格了如指掌,根据其性格特点和价值观作深入研究和策略分析,才能因地制宜,设计出最合适的分配方案,这是没有什么公式套路的。

 

和老板领导管理团队一样,要赚取最大化的利润又不能使自己的平台不至于垮掉,就必须对自己的下级作深入研究,制订相应合理的分配方案,才能获得最大的成功。

 

在“海盗分金”博弈中,我们还能看到一个富有哲学意义的命题。那就是生命与金钱孰重孰轻?

 

这在博弈中是一目了然的。没命的话要钱还有何用?所以首先是考虑自身的安全,当你身上只要还有一枚金币,别的海盗们就会贪图你这一枚金币,怎么办?除非什么都不要,剩下100枚金币让其他9个人平分。如果其他海盗都愿意以最小的代价(即9人内部不愿意再发生争执)换来最大的利益的话,这个方案就没有问题,但遗憾的是自己的利益就彻底丧失。

 

命比钱重要是肯定的,但在现实生活中,没钱又怎能有命呢?

 

第三部分

 

有一个关于牧民与草地的故事,说的是当草地向牧民完全开放时,每一个牧民都想多养一头牛。因为多养一头牛增加的收入大于其供养成本,明显这是有利可图的。

 

公共地悲剧与和谐社会

 

有一个关于牧民与草地的故事,说的是当草地向牧民完全开放时,每一个牧民都想多养一头牛。因为多养一头牛增加的收入大于其供养成本,明显这是有利可图的。

 

虽然对于单个牧民来说,他增加一头牛是有利的。但是如果所有的牧民都看到这一点,都增加一头牛,那么草地将被过度放牧,从而不能满足牛的需要,导致所有牧民的牛都饿死。这个故事就是公共资源的悲剧 ,即哈定悲剧,也叫作公共地悲剧。

 

哈定悲剧,由英国留学生哈定(GarritHadin),在1968年在《科学》杂志上发表的文章《Tragedy of Commons》(公共策略)中提出。

 

哈定在文中指出:“在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益。这就是悲剧的所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都奔向的目的地。因为在信奉公有物自由的社会当中,每个人均追求自己的最大利益。公有物自由给所有人带来了毁灭。”

 

在市场经济中最常见的“哈定悲剧”现象就是环境污染。当无政府管制时,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。

 

按照“看不见的手”的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而达到纳什均衡状态。

 

即使有一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。

 

这便是“看不见的手”的有效竞争机制失败的明证。

 

拿我们国家来说,20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但自然环境将变得更加和谐优美。

 

从历史上来看,中国的国家发展战略一波三折。

 

20世纪50年代,我们学苏联,走的是低就业、低消费、高消耗、自我封闭的重工业模式。然而,这个模式并不符合中国人均资源短缺、资本稀缺、劳动力资源丰富的基本国情,再加上政治动荡,走了一段就走不下去了,使我们延误了发展的黄金时期。

 

20世纪80年代,我们又学欧美传统的发展模式,用资源高消耗和生活高消费,来刺激经济高速增长。这一模式追求资本生产率与利润最大化,而忽视资源利用率与环境损失。

 

到了今天,中国成了世界上最大的制造业国家,也成了世界上自然资产损耗最严重的国家。45种主要矿产15年后将剩下6种,5年以后60%以上的石油依赖进口,我们单位GDP的能耗是日本的7倍、美国的6倍、印度的2.8倍。单位GDP污染排放量是发达国家平均水平的十几倍,劳动生产率却是人家的几十分之一。

 

建国50多年来,我们的人口从6亿增长到了13亿,多了一倍,而可居住的土地由于水土流失从600多万平方公里减少到300多万,减少了一半。中国在人均GDP400~1000美元时,出现了发达国家人均GDP3000~10000美元期间出现的严重污染。按照目前的污染水平,若干年后我们的经济总量翻两番时,污染负荷也会跟着翻两番。

 

资源和环境作为公共自由物,是全体国民的公共财产,政府作为人民大众管理社会事务的工具,责无旁贷地负有保护资源环境、实现经济、社会、自然协调发展的历史使命。

 

不少政府官员和学者,总是寄希望于通过技术手段,来解决公共地悲剧问题。然而早在20世纪60~70年代在现代自然科学领域已经形成一种认识,那就是包括人口问题、核战争及环境污染等在内的问题都只是一个局部问题,而这些是无法靠技术手段解决的。

 

要解决公共地悲剧,就必须要明晰公共地产权、牧民之间有效沟通形成共同愿景、采取违规行为之后的及时惩罚、牧民自身道德素质的提高、改善牛或者草的品种,甚至是牧民也可以换个职业等都是可行的方法。

 

这些方法对我国建设节约型社会也有很大的启发,比如增加资源环境危机的宣传和教育,以形成大众心理暗示,对公共自由物中的不可再生资源采用国家管理的形式,严格控制使用;对可再生资源采取委托管理的形式,培育社会力量加以保护,国家起到监督和引导作用等。

 

房地产市场的多方博弈

 

房地产行业不仅关系到国家经济,和普通人的生活也是息息相关。总体说来,在房地产市场中,政府的作用举足轻重。房地产开发过程中是多方博弈,也是一个复杂的过程,其参与者多,涉及面广,个中利益关系错综复杂,难以言表。

 

对于复杂难以预测的房价走势,各相关方莫衷一是。某刊物的记者在上海采访时发现了一个有趣的现象:认为房价会涨者多为相关政府官员 、房地产开发商、部分地产中介、房地产投资或投机者;认为房价会降者多为弱势群体、外行人士和学院派房地产研究人员。双方均言之凿凿,自成体系,令局外人眼花缭乱。

 

这在很大程度上反映出利益关系的格局。很多人的看法与其说是客观判断,还不如说是他们对房价走势的内心期望。因此,要分析今天的房地产市场及其走势,就不能不对所牵涉的几个基本利益主体及其博弈过程进行分析。

 

在今天的中国,房地产商已经成为一个发育程度最高的利益主体。

 

这首先是因为房地产是过去十几年间资源积聚速度最快、资源积聚规模最大的一个行业;其次,房地产商也是较早以自觉意识甚至集体力量影响政府政策和社会风向的一个群体。这个历史要追溯到90年代初海南等地房地产泡沫破灭之后。当时由于经济过热,特别是房地产过热,政府出台紧缩政策以收缩银根,这样就断了房地产炒作的资金链条。

 

于是,从这个时候起,人们就看到,由媒体或其他机构出面,召开了一系列的研讨会,请一些著名的经济学家出来讲话。这些研讨会的基调大体是:目前中国经济并没有过热,政府应当改变紧缩政策,放松银根。这些研讨会的目的是非常明确的:政府放松银根,被套的房地产解套。

 

现在看来,房地产已经开始成为目前中国发育程度最高、影响力最大同时自觉意识也最强的一个利益集团。

 

资料显示,目前中国最大的富豪中有相当一部分是集中在房地产领域。在中国福布斯2002年度公布的100名富豪中,有40多人涉足地产业。此后尽管不断有从事房地业的富豪身陷囹圄,但在福布斯《2003年中国内地富豪榜》上,涉足房地产的还是高达35名。而在2004年《中国大陆百富榜》中,主营行业与房地产有关的“富人”又恢复到总人数的40%。财富的规模、现实的利益以及历史的积累,造就了房地产集团的团体意识和集体行动能力。

 

应当说,在市场经济中,利益集团的发育是一件正常甚至是必需的事情。问题是如何对利益集团的利益表达进行规范以及对不同利益主体的关系进行平衡。

 

为了简化问题,首先来看中央政府作为市场“裁判”时的情形,即房地产商与消费者、房地产商与银行、地方政府在房地产开发过程中的利益博弈。

 

假设政府的宏观政策等不变,市场上仅两个参与主体,即房地产商与银行等金融机构。银行等金融机构有两种决策方式,即协作与不协作;房地产开发商也有两种决策,即优质产品与偷工减料,不难发现这个博弈有两个纳什均衡:金融机构不协作与开发商偷工减料,金融机构协作与开发商做出优质产品。

 

事实上,上述两种情况在不同阶段、不同城市都出现过,当然这也是房地产泡沫产生的原因之一。

 

一般来说,政府的政策制定与执行需要很长时间才能产生效果,这就是时滞效应。政府在制定政策以后要通过银行等金融机构和房地产商共同实施,并在实施过程中通过收集各种市场信息的反馈来修改政策,如此循环往复。

 

这个动态博弈的过程如下:首先,政府根据所收集的市场信息,选择紧缩或宽松的货币政策以调控市场繁荣程度;接着,银行等金融机构根据政府出台的政策,揣测政府意图,并结合自己对市场走向的判断,来增加或减少给房地产开发商与购房者的贷款。最后,房地产商根据银行等金融机构的操作过程相应地做出自己的投资规划:扩大投资规模或缩减投资量。

 

如果考虑到购房者,那么这个博弈就成了政府、开发商、购房者和金融机构的四方利益博弈。该博弈模型从国内的大前提下出发,从政策的制定到最终落实到购房者,讨论其利益的分配及决策。很明显,购房者在信息获取方面具有劣势,所掌握的信息既不及时,也不全面,仅仅是一些公开或较公开的信息,并且对于购房者整体而言,相互之间没有什么沟通能力,没有信息优势,处于房地产市场博弈各方最为被动的地位。

 

在这个动态博弈中,我们采用如下方式进行讨论。首先将四方参与者分为两类,设为A与B。

 

其中A由中央政府与购房者组成,因为两者立场较为接近:中央政府目的是规范市场,以保长治久安;同时,中央政府的政策倾向于购房者利益,公平的市场才不会使购房者盲从,这有利于规范化市场的形成。而规范化市场能为购房者提供良好的消费环境,如此形成良性循环,增强中央政府对市场的调控能力。

 

B由房地产商与银行、地方政府等组成,因为他们有共同的利益基础。

 

房地产商的大部分资金是由银行提供的,银行也是企业,都是以利益最大化为经营目标,因而这些金融机构监督房地产开发的全过程,并且拥有大量信息,以增强其监控能力,提高房地产开发过程的合理、规范操作可能性,预期获得高额回报。

 

又由于房地产的开发上投入的自有资金也占相当大比重,也不想将项目“烂”在自己手中,但由于其信息优势,且规模较大,易于操纵市场,并变相哄抬物价,从而形成卖方市场,损害消费者利益,占有超额利润。

 

同时,近些年来在政绩、财政压力等因素促发下,地方政府对于“经营城市”、“出售土地”的兴趣逐渐增加。这为房地产商与地方政府的结盟提供了可能。

 

2005年4月16日,新华社发表了记者包永辉的一篇文章,披露某地方政府操纵地价抬高商品房价格的做法。

 

文章说,江苏一家在全国也算得上重量级的房地产公司老板向他透露,有个城市为了抬高出让土地的价格,特意请他们这家公司来当“托儿”,与外地投标企业竞价。这位老板十分担心价格抬得太高,砸在自己手里吃不消。

 

该市政府一位官员“开导”他:“你只管往高里抬价就行了,如果砸在手里,由政府兜底,大不了再还给政府”。于是,吃了“定心丸”的这位老板果然创下该市土地出让价的新高。这个案例形象地揭示了房地产集团与地方政府的关系。至于地方政府官员在土地征用、地皮出让、工程项目中的腐败行为,更成为这种联盟关系的粘合剂。

 

事实上,最近几年时间一些城市房地产价格的扶摇直上,在很大程度上就是房地产商与地方政府结盟与合作的结果。

 

搜索一下最近几年有关房地产的消息,就会发现一个现象,在一些房地产价格上涨最迅猛的城市,当地政府的领导人总是利用各种途径向人们传达这样的一些信息:本地的房价不会下跌只会上涨;来本地投资房地产会有很好的回报;本地的房地产市场现在是一片兴旺等等。

 

甚至在国内外一些研究机构纷纷对中国房地产泡沫化提出警告的时候,这些地方政府的领导人仍然坚信本地的房地产发育健康,房价是正常的。而且,在游资形成的炒房团已经在一些地方兴风作浪的时候,一些地方政府的领导人甚至公开向游资发出这样的召唤:欢迎炒房团来本地加入房地产的发展。这几乎与直接呼吁炒房没有什么差别了。

 

在这种情况下,中央政府面临两种选择:其一是有所作为,下大力度规范市场,其二是不作为,任由市场随意变化。同时,购房者也面临两个选择:其一是正常地根据自己的经济条件合理购房,特别是在房价居高不下时持币待购,其二是毫无理性可言,盲目购房。

 

房地产开发商合理合法地开发新项目,或者投机取巧,开发不能保质保量的劣质品。银行也根据房地产商和政府的操作选择增加贷款以支持房地产投资或者减少贷款以维护自己的利益。

 

可见,对于政府来说,当市场混乱,价格失调时,有所作为是一个理性的选择;对于购房者则根据自身条件购房,不为购置房产来透支自己的消费能力方为上策。

 

对于房地产开发商而言合法合理开发新项目,定价适中,满足大部分人的需求是收益最大的选择。对于金融机构来说,根据国家宏观政策的变更而改变贷款策略是保持稳定发展的良好方法。

 

想象一下这种理想的情况:

 

在中央政府的有序管理与金融机构的大力支持下,开发商能够充分洞察购房者的消费需求与消费能力,科学规划、设计、建设并以合理的价位销售楼盘,那消费者自然趋之若鹜。

 

于是,开发商安心赚取利润,赢得越来越好的市场信誉;消费者购得满意的房屋,心身俱爽,安居乐业;市场秩序井然,国家宏观经济形势良好。

 

这不就是房地产市场皆大欢喜的多赢之局吗?

 

酒吧问题与少数人博弈

 

话说有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。

 

假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何作出去还是不去的决定呢?

 

这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。

 

这就是著名的酒吧问题(Bar problem)。它是由美国人阿瑟教授(W.B. Arthur)1994年在《美国经济评论》发表的《归纳论证的有界理性》一文中首次提出来的。

 

酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候作出的这些预测就错了。

 

反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。

 

因而一个作出正确预测的人应该是,他能知道其他人如何作出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何作出预测,因此所谓正确的预测几乎不可能存在。

 

阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。

 

在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,实验的部分数据如下:

 

从上述数据看,虽然不同的博弈者采取了不同的策略,但是其中共同点是这些预测都是用归纳法进行的。我们完全可以把实验的结果看做是现实中大多数理性人作出的选择。

 

在这个实验中,更多的博弈者是根据上一次其他人作出的选择而作出这一次的预测。

 

然而,这个预测已经被实验证明在多数情况下是不正确的。那么,在这个层面上说明,这种预测是一个非线性的过程。

 

所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”:在北京的一只蝴蝶动了一下翅膀,华盛顿就下了一场大暴雨。

 

通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或不去的人群,但这个系统的这个比例是不变的。如果把计算机模拟实验当做是更为全面的、客观的情形来看,计算机模拟的结果说明的是更为一般的规律。

 

生活中有很多例子与这个模型的道理是相通的。“股票买卖”、“交通拥挤”以及“足球博彩”等等问题都是这个模型的延伸。对这一类问题一般称之为“少数人博弈”。“少数人博弈”是改变了形式的酒吧问题,是由一位定居瑞士的中国人张翼成在1997年提出的。

 

在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格将上涨,你将获利。

 

在实际生活中,股民采取什么样的策略是多种多样的,他们完全根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用少数者博弈来解释。

 

“少数人博弈”中还有一个特殊的结论,即:记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。

 

“少数人博弈”还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。

 

实际的城市道路往往是复杂的网络。我们简化问题,假设在交通高峰期间,司机只面临两条路的选择。这个时候,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程,而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验,来判断哪条路更好走。当然,所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择,必须考虑其他司机的选择。

 

在司机行车的“少数者博弈”问题中,司机经过多次的选择和学习,许多司机往往能找到规则性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规则性。

 

在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,等等。最终,不同特点、不同经验司机的路线选择,决定了路线的拥挤程度。

 

彩票、赌博与投资

 

几年以前,美国加州一名华裔妇女买彩票中了头奖,赢得8900万美元奖金,创下加州彩票历史上个人得奖金额最高纪录。当消息传开之后,一时之间很多人跃跃欲试,纷纷去买彩票,彩票公司因此而大赚一笔。

 

然而,从数学的角度来看,在买彩票的路上被汽车撞死的概率远高于中大奖的概率。每年全世界死于车祸的人数以数十万计,中了上亿美元大奖的却没几个。死于车 祸的人中,有多少是死在去买彩票的路上呢?这恐怕难以统计,因而“死于车祸多于中奖”也成了无法从当事人调查取证的猜想。

 

在概率论里,“买彩票路上的车祸”和普通的车祸是完全不同意义的事件,是有条件的概率,这个概率是建立在“买彩票”和“出车祸”两个概率上的概率。不管怎么说,这都应该是一个极小的概率,它的概率比中大奖的居然大,可见中大奖的难得和稀奇。

 

但买彩票的人却比参与赌场赌博的人多得多,不能不说很多人缺乏理性的思考。通常,赌场的赔率是80%甚至更高,而彩票的赔率还到不了50%,也就是说买彩票还不如去赌博。但很多人却热衷于彩票,渴望一夜暴富,一把改变命运。精通消费者心理学的商家,不在每件商品上打折,而是推出购物中大奖之类的活动,也和彩票异曲同工,既节约成本,又满足了顾客的“侥幸”心理。

 

实际上,彩票中奖的概率远比掷硬币,连续出现10个正面的“可能性”小得多。如果你有充裕的空闲时间,不妨试试,拿一块硬币,看你用多长时间能幸运地掷出自始至终的连续10个正面。实际上,每次抛掷时,你都“幸运”地得到正面的可能性是1/2,连续10次下来都是正面的概率是10个1/2相乘的积,也就是(1/2)10=1/1024。想想吧,千分之一的概率让你碰上了,难道不需要有上千次的辛勤抛掷做后盾?

 

赌博就是赌概率,概率的法则支配所发生的一切。以概率的观点,就不会对赌博里的输输赢赢感兴趣,因为无论每一次下注是输是赢,都是随机事件,背后靠的虽然是你个人的运气。但作为一个赌客整体,概率却站在赌场一边。赌场靠一个大的赌客群,从中抽头赚钱。而赌客,如果不停地赌下去,构成了一个大的赌博行为的基数,每一次随机得到的输赢就没有了任何意义。在赌场电脑背后设计好的赔率面前,赌客每次下注,都没有意义了。

 

概率里还有一个重要的概念是事件的独立性概念。很多情况下,人们因为前面已经有了大量的未中奖人群而去买彩票或参与到累计回报的游戏,殊不知,每个人的“运气”都独立于他人的“运气”,并不因为前人没有中奖你就多了中奖的机会。

 

设想一下,前面10个人抛硬币,没有一个人抛出了正面,现在轮到了你,难道你抛出正面的可能性就大于其余的人?抛硬币出现正反的决定性因素是硬币的质地和你的手劲,每个人抛的那一次,都“独立”于其余的人。拉斯维加斯的很多赌场,老虎机上都顶着跑车,下面写着告示,告诉赌客已经有多少人玩了游戏,车还没有送出,只要连得三个大奖,就能赢得跑车云云。但得大奖的规则并无变化,每人是否幸运,和前面的“铺路石”毫无关系。

 

从某种意义上来说,赌博和投资并没有严格的分界线。这两者收益都是不确定的;其次,同样的投资工具,比如期货,你可以按照投资的方式来做,也可以按照赌博的方式来做———不做任何分析,孤注一掷;同样的赌博工具,比如赌马,你可以像通常人们所做的那样去碰运气,也可以像投资高科技产业那样去投资———基于细致的分析,按恰当的比例下注。

 

但是赌博和投资也有显然不同的地方:投资要求期望收益一定大于0,而赌博不要求,比如买彩票、赌马、赌大小……的期望收益就小于0;支撑投资的是关于未来收益的分析和预测,而支撑赌博的是侥幸获胜心理;投资要求回避风险,而赌博是找风险;一种投资工具可能使每个投资者获益,而赌博工具不可能。

 

投资也是一种博弈———对手是“市场先生”。但是,评价投资和评价通常的博弈比如下围棋是不同的。下围棋赢对手一目空和赢一百目空结果是相同的,而投资赚钱是越多越好。由于评价标准不同,策略也不同。

 

对于赌大小或赌红黑那样的赌博,很多人推荐这样一种策略:首先下一块钱(或1%),如果输了,赌注加倍;如果赢了,从头开始再下一块钱。理由是只要有一次赢了,你就可以扳回前面的全部损失,反过来成为赢家———赢一元;有人还认为它是一种不错的期货投资策略。实际上,这是一种糟透了的策略。因为这样做虽然胜率很高,但是赢时赢得少,输时输得多———可能倾家荡产,期望收益为0不变,而风险无限大。不过,这种策略对于下围棋等博弈倒是很合适,因为下围棋重要的是输赢,而不在于输赢多少目。

 

许多赌博方式都有庄家占先的特例。比如掷3只骰子赌大小,只要庄家掷出三个“1”或三个一样,则不管下注者掷出什么,庄家通吃,这使得庄家的期望收益大于0,而下注者的期望收益小于0。从统计的角度看,赌得越久,庄家胜率越大。

 

因而,赌场老板赢钱的一个重要原因便是:参赌者没有足够的耐心,或赌注下得太高,使得赌友很容易输光自己的资金,失去扳本的机会;而赌场老板的“战斗寿命”则要长得多,因为资金实力更雄厚,也因为面对不同的赌友老板分散了投资,因而不容易输光。

 

有部美国电影叫《赌场风云》,其中讲到,如果谁赢了大钱,老板就会想方设法缠住他再赌,使用的办法小到让妓女去挽留,大到让飞机晚点。没有耐心的赢家往往很快会变为输家。

 

上面讲的还是比较规范的赌场,有的赌场在赌具上搞鬼(出老千),或者使用暴力挽回损失,那么赌徒就更没有赢钱的希望。想通过赌博赚钱往往是“偷鸡不成,反蚀一把米。”

 

人并不是都是可以理性地去进行决策。比如从心理学的角度来看,大多数情况下,人们对所损失的东西的价值估计高出得到相同东西的价值的两倍。人们的视角不同,其决策与判断是存在“偏差”的。因为,人在不确定条件下的决策,不是取决于结果本身而是结果与设想的差距。也就是说,人们在决策时,总是会以自己的视角或参考标准来衡量,以此来决定决策的取舍。

 

一个赌徒去赌场赌,随身带了3000美元,赌客赢了100元,这时要求他离开赌场可能没什么。但如果是输了100元,这时同样要求他离开可能就很难,虽然赢100元时身上的现金为3100,输100元时身上的现金为2900,3100和2900相差6.9%,但这两种情况下给赌客的感觉和3100、2900并没有多大关系,而是和它们与本金3000之差100、-100,也即赢100还是输100有关,即人们对财富的变化十分敏感。

 

而且一旦超过某个“参照点”,对同样数量的损失和赢利,人们的感受是相当不相同的。在这个“参照点”附近,一定数量的损失所引起的价值损害(负效用)要大于同样数量的赢利所带来的价值满足。简单地说,就是输了100元钱所带来的不愉快感受要比赢了100元所带来的愉悦感受强烈得多。

 

当然,由于人的冒险本性和总希望有意外惊喜的本性,使得赌博可以作为一种娱乐。如果把赌博作为一种事业,嗜赌成瘾、贪婪、侥幸,带着一夜暴发的贪心会导致赌博过度,那就不是小赌怡情了,而是从娱乐变成痛苦。因为,“贪”字是由“今”和“贝”两个字构成,“今”是现在的意思,“贝”是金钱的意思,指的是急功近利。“婪”字是由“林”与“女”两个字构成,指的是女人如林,欲海无边。

 

现在与未来的博弈,“时间价值”与利率博弈

 

金钱虽然不是万能的,即使是古代社会,没有钱就是万万不能的。《钱神论》有云:“钱之为体,有乾坤之象。内则其方,外则其圆。其积如山,其流如川。动静有时,行藏有节。市井便易,不患耗折,唯折象寿,不匮象道。故能长久,为世神宝。亲之如兄,字曰孔方。失之则贫弱,得之则富昌。……钱多者处前,钱少者居后;处前者为君长,在后者为臣仆。君长者丰衍 而有余,臣仆者穷竭而不足。”

 

到了现代社会,金钱的重要性更是不言而喻。自然人们对待金钱的态度不仅是理性消费,更要注重理性投资。正所谓是“你不理财,财不理你”。这句话对于个人与家庭、企业甚至国家都是十分适用。所谓理财,简单说来就是以最低的成本筹集资金、以最低的风险取得最大的收益。

 

我们耳熟能详的一个常见的财经词汇———国家财政预算,就是政府收入与支出的理财计划。所谓公司财务或公司金融,则是公司的理财方法。

 

至于个人理财,最近几年才刚刚进入大众的视听范围之内。个人理财的逐渐流行主要是因为我国随着经济的迅猛发展,居民收入也水涨船高地快速增长,个人资产同时大幅度增加。

 

经济学告诉我们,收入与储蓄之间的变动关系受到收入效应的影响。根据恩格尔原理(随着家庭收入的增长,食物消费占整个的比例越来越低),居民收入(流量,指的是一段时间内所获得的经济报酬。)与财富(存量,指的是累积的总量,如一个家庭所拥有的总的资产。)的增长必将带来消费行为的改变。一般来说,这种影响就是收入的提高会使得人们在维持基本生活方面的消费比例降低,而节余却会相应增加,这些储蓄的资金可以用来进行各种理财活动。

 

在理财活动中,首先要了解的一个概念是“现金流”。

 

首先看这样一个例子。现在你要投资10万元开一家便利店,成本价1万元的商品卖的价格是1.2万元。如果1万元周转一次的销售收入是1.2万元,盈利是2000元。来看这样两种情况:第一,如果每天可以周转一次的话,每个月就可以获得6万元的利润;第二,如果每10天才周转一次的话,那么一个月的利润只有6000元。在前一种情况下,不考虑税收与其他因素的话,一年之后你的资产将会达到82万元;而在后一种情况下,一年之后你的资产仅有18.2万元。

 

那么,究竟什么是现金流呢?

 

其实,从上面那个例子,我们就能直观理解现金流了。如果一定要用比较严谨的语言来描述“现金流”的话,我们可以这么说:所谓现金流就是资产用“现金”来衡量时,资产价值随时间变化的流量。

 

如果你所投资的这10万元是从银行贷款的钱,那么情况又会如何呢?这个时候的现金流不仅要考虑每个月所赚到的收入,还要考虑资本成本。所谓资本成本就是必须要偿还银行贷款利息,一般都是以利息率表示资本成本。这就是所谓资金的“时间价值”。

 

资金的“时间价值”意味着钱财离开原先的所有者转移到使用者手中,经过一段时间之后,再从使用者转回到所有者手里必须要附加额外的钱,这个额外的资金即利息。

 

我们所熟知的投资基金的“七二法则”就是“时间价值”的应用原则之一。所谓“七二法则”就是说,不拿回利息,一直利滚利,本金增值一倍所需的时间。本金增长一倍所需时间(年)=72/年收益率。举例来说,如果你存10万元在银行,年利率2%,每年利滚利,要36年才可以增加一倍变成20万元。又比如,你投资30万元在一只每年报酬率12%的投资基金上,约需6年时间会增值一倍,变成60万元。

 

从博弈的角度去看待时间价值的话,就是资金拥有者是选择现在就将这些资金消费掉,还是选择将这些资金储蓄起来进行投资并在未来获得收益。简单来说,时间价值就是一个消费者现在与未来之间的消费决策博弈。决定消费者两种情况优劣的因素是市场利率。

 

市场利率变动机制是一个非常复杂的问题,职业经济学家们对于市场利率变动的原因是争论不休。总的说来有两种看法:一种认为市场利率完全是由市场来决定,一个国家的货币发行量是根据市场状况而定的;另一种看法认为市场利率是由政府的货币当局所发行的货币量来决定。在前一种情况下,“时间价值”中现在与未来之间的博弈方式正是前文所提到的人与“市场先生”进行博弈的一种形式。在后一种情况下,“时间价值”中现在与未来之间的博弈则是居民与政府之间的博弈。

 

为了简化利率的问题,我们不考虑市场利率变换的原因,只要知道未来的市场利率将会发生改变就可以。打个简单的比方。比如你现在需要购买住房,有这么两种选择:其一,一次性付清方式;其二,住房按揭贷款方式。我们不妨假设你所要购买的住宅现在一次性付清需要50万元。采用十年期按揭方式时,市场利率为12%,首付10万,每个月还贷5000元。如果不考虑“时间价值”,采用按揭方式的总还款额是0.5×12×10+10=70万元,比一次性付款所要付出的金额要大得多。

 

然而,考虑到“时间价值”时,按揭方式的购房总现值就是:

 

10+++……+=43.9万元

 

令人惊讶的事情发生了———一次性付款反而比按揭方式的现值要高6.1万元。这种情况下,理性的购房者将会选择按揭方式购买住房。

 

再来看这样一种情况,如果市场利率降低为6%。此时的十年期按揭方式所付出的现值是54.16万元。很明显,在市场利率降低之后,理性购房者会选择一次性购房。我们从这个例子中可以看到:当市场处于加息周期(市场利率升高)时,固定利率房贷对借款人有利,银行吃亏;但如果市场处于非加息周期甚至是处于降息周期(市场利率降低),那么住房贷款利率固定显然对银行有利,借款人则吃亏。

 

当然在现实生活中,大部分的居民很难承受一次性购房的经济压力,往往选择按揭方式购买住房。按照我国现有的经济法规,按揭利率可以是浮动利率也可以是固定利率。所谓固定利率住房贷款,就是借款人与银行签订贷款合同时即设定好固定的利率和对应的固定期间,不论固定期间内市场利率如何变动,借款人都按照合同约定的固定利率支付利息。浮动利率则不同,是购房者根据市场利率的变动不断调整,而且是同向变化,也就是说,市场利率上升则浮动利率上升,市场利率下降则浮动利率下降。

 

不管选择固定利率还是选择浮动利率,购房者应对两种利率在合同期内所支付的利息总额进行比较,哪一种付出的现值越低就选择哪一种方式。在这种情况下,购房者与政府的中央银行就构成了利率博弈的两个参与者。

 

这里要注意的问题是,购房者合同中的利率决定了购房者每个月或每年要交纳的还款金额,在市场不变的情况下,合同利率越高,现值越高;当合同利率不变时,市场利率越高,则现值越低。我们不得不用一个简单的数学公式表达这种关系:

 

购置房产所付的现值=D+++……+

 

D表示的购房者首付金额,K表示购房者贷款总额,i表示的是合同利率,r表示的是市场利率。K i是每年还款的数额,以年为单位的利率是复利,以月为单位的利率则是单利。如果合同的年利率是12%,则月利率是12%/12=1%,也就是说每个月则需要还款K i/12元。上面所提到的一次性购房与按揭购房的例子有一个假设就是合同利率是固定的,从这个例子中我们可以看到合同利率固定时,市场利率降低会导致购房者付出的现值增大,购房者遭受利率损失。反之,市场利率升高时,则购房者付出的现值降低,购房者比较划算。

 

这里还要注意一个问题,上面所有的计算中的市场利率指的都是实际利率。实际利率考虑到通货膨胀的因素,假设预期通货膨胀率是π,实际利率R,名义利率为r。那么如果2006年1月1日你将A元的现金以名义利率r借给别人,1年之后,2007年1月1日别人还你钱的数额名义是A(1+r),然而这一年中人民币一直是对内贬值,这A(1+r)的人民币只相当于2006年1月1日的A(1+r)/(1+π)。因此,你借给别人钱的实际利率R可以通过A(1+R)=A(1+r)/(1+π)的式子算出,结果是实际利率R=(r-π)/(1+π)。很多时候,人们都认为R=r-π,即实际利率为名义利率减去预期通货膨胀率。实际上,只有在π比较小时,R≈r-π。当通货膨胀率比较大时,就只能用R=(r-π)/(1+π)来计算实际利率。

 

如果购房者选择是浮动利率方式按揭的话,市场利率的上升与下降对所付现值的影响比较小,我们不妨认为,在这种情况下,购房者既无损失也无受益。

 

博弈的参与者是按揭购房者与政府或市场。对于购房者来说,购房的方式有两种选择:固定利率、浮动利率。由于政府的宏观调控或市场的作用,利率也会有两种变化的趋势,我们简单地看成是在购房者还款期间只调整一次,这样未来的市场利率变化也有两种选择:市场利率降低;市场利率提高。这样我们就可以得到购房者的收益矩阵。

 

在实际中,购房者与市场利率的变化之间既可能具有一致性,或者简单地说就是购房者无论选择哪种利率,还贷的期间都是处于市场利率变化要么提高要么降低的周期内。这种一致性也可能不具备,也就是说这种周期与购房者的还贷周期往往并不一致,这会让实际的情况更加复杂。这里的博弈分析只是一种简化而已。

 

如果考虑到市场利率既受到市场因素的影响,又受到政府货币政策以及各种随机因素的影响,利率变化的趋势将会极其复杂。总而言之,这种利率博弈对于购房者来说就是一种极难预测的利率风险,购房者对于这种利率风险应该审时度势、慎之又慎。

 

如何理解“风险越高,收益越高”?

 

在投资理财中,有这样的流行观点:“风险越高,收益越大。”换句话说,就是人们为了获得更高的利益愿意承担更大的风险。从另一个方面来看,就是所承担的风险具有一定的价值。这就是人们常说的“风险价值”。

 

在实际生活中,我们每一个人对未来所作的决策都不可能百分之百地准确。未来的变化是不确定的。对于未来变化的不确定性,有两种情况:其一,未来的 变化具有统计特征,可以通过统计方法来分析,比如前面提到的赌博;其二,未来变化是混沌的,无法通过统计方法来分析。风险则是指可以通过统计方法来处理的未来收益或损失的不确定性。

 

未来的风险既可能是发生危险与损失,也可能是获得机会与好处。我们来看这样的一个随机数集合{19,16,21,24,24,25,13,19,23,17,18,15,14,17,18,14,18,19,20,19,19,19,24,20,19,18,26,23,27,18,25,15,22,23,26,20,18,22,19,22,16,17,15,19,20,20,19,27,15,18}。这个集合中共有50个数字。这个数据集合的平均值是所有的20,方差是3。

 

如果这个集合是你作某个投资的收益各种可能回报,那么你这项投资的平均收益就是20万元,而未来可能的收益是围绕着20万元这个平均收益上下波动的。方差则是衡量波动幅度大小,方差越大,波动的幅度就越大,方差越小,波动幅度越小。

 

我们再来看这样一组投资收益的数据{18,15,20,18,20,18,16,18,21,17,15,17,14,13,13,19,17,17,15,17,12,20,16,13,20,13,13,17,16,17,16,24,17,17,19,15,18,18,20,11,18,17,16,14,17,19,17,14,16,14,31}。这组数据的平均收益是16万元,方差也是3万元,方差和前一组数据相同。很明显,在方差相同的情况下,平均收益越高,波动的程度就越小。

 

为了区分这种波动程度的不同,我们又引入了变异系数的概念,变异系数=方差/均值。变异系数越大,波动程度越大。对于风险的统计分析,则是通过这种均值-方差分析得来的。简单地说,变异系数越大,风险越高,变异系数越小,风险越低。在所举的两个例子中,3/20<3/16,因而前一种投资的风险比后一种投资的风险要小。

 

通过这两个例子,我们明显发现,前者的平均收益20万元比后者的平均收益16万元要高,然而风险却低于后者。肯定会有人产生疑问,难道“高风险高收益”错了吗?

 

实际上,任何投资包括个人理财的投资都具有不同性质的风险。比如你购买股票,风险可能来自于市场内在的振荡,央行的突然加息、降息或汇率调整,政治事件、某个企业的会计欺诈等多种因素。这许许多多的风险对于一个具体的投资项目可以分成系统性风险与非系统性风险。诺贝尔奖获得者马克维兹(Markowitz)早在几十年以前就通过统计学方法证明出,当合理投资于多个项目的时候非系统性风险就可以被分散化解,当投资组合足够大时所留下的不能被分散化解的只可能是系统性的市场风险。现在我们很容易能够理解上述两个例子的问题,前者平均收益高于后者而风险低于后者的原因是:后者的非系统性风险要高于前者,前者的系统风险则高于后者。

 

所谓“高风险高回报”的含义就是指系统性风险越高收益越高。用严格的数学表示式来描述就是资本资产定价模型:

 

R=R+(-R)×β

 

Rf表示的是无风险利率,RM表示的是投资组合达到完全分散非系统风险时的系统风险利率。

 

βim表示当整个市场收益波动时,某单个投资的波动程度的大小。βim越大,表示这个投资相对整个市场来说,风险较小,反之则较大。从统计学的角度来看,βim是随机变量Ri-Rf(单个投资项目的投资收益率-无风险收益率)关于随机变量Rm-Rf(投资组合收益率-无风险收益率)的回归系数。

 

资本资产定价模型的β系数概念深刻地改变并影响了投资学。β(beta)系数在投资理财中是一个核心概念,β系数告诉我们:任何投资项目的超额收益率与整个市场的超额收益率呈线性正比关系。β系数来度量了包括股票在内的证券市场等各种投资项目的系统风险,β系数越大系统风险越高,而不能用β系数来度量的则是非系统风险。

 

根据资本资产定价模型,我们还可以在二维坐标系上描述出一条证券市场线。关于这个问题在任何一本投资学的教材对这个问题都会有解释,笔者不再做详细的介绍。

 

根据资本资产定价模型与证券市场线的原理与实证的经验研究,各种投资理财项目的风险与收益之间的关系如下图:

 

“不要把鸡蛋放在一个篮子里”说的就是投资组合分散风险的道理。上文所述的市场组合指的是风险能够被完全分散的全球市场。然而在实际生活中,没有任何一个人可以具备这种天文数字般的财务能力投资于成千上万的项目。对于个人来说,所能选择投资项目毕竟是有限的。

 

我们先来考虑这样的情况:有两种股票可以选择,一家是彩电制造企业的股票,另一家是彩电元件生产企业的股票。在这种情况下,两家公司股票的上涨与下跌往往是同方向的,两种股票的投资组合并不能降低整体的风险。

 

再来看这样的例子:还是两种股票可以选择,一家是非碳酸饮料制造企业的股票,另一家是碳酸饮料制造企业的股票。碳酸饮料与非碳酸饮料的市场具有替代性,换句话说,其中一种饮料的消费量减少往往是因为另一种饮料的消费者增多。在这种情况,两家公司的股票上涨与下跌具有反方向的特征,两种股票的投资组合可以大大地降低风险,而平均收益率即使降低幅度也不会很大。

 

正是由于投资项目有互补性和替补性,个人投资理财才成为可能。简单说来,个人理财博弈可分为投资决策、消费决策、融资决策这三种情况的博弈模型。

 

先来看投资决策,设想你有一笔资金,可以投资股票、房地产、债券、国库券等投资项目。由图13可以得到下图。

 

这个矩阵的均衡点是(高风险,高稳定性)与(低风险,低稳定性)这两点。如果选择的是(低风险,高稳定性)所采取的策略,投资的平均收益率较低;如果选择的是(高风险,低稳定性)所采取的策略,则投资的风险过高。因而,最终的投资组合必然是在(高风险,高稳定性)与(低风险,低稳定性)这两种情况的各种组合之中选择最好的投资比例。

 

股票投资比重的“一百减年龄”原则就是这个博弈矩阵的一个应用。所谓“一百减年龄”原则是说,(100-年龄)×100%就是你投资股票的比重。对一个30岁的年轻人,追求成长,适当的投资股票比重是70%;一名60岁的退休者,要的是稳定平安,股票投资不可超过30%。当然你也可以将100改为80、70或60减去年龄,作为投资股票的比重。不同之处只在于,所取的X-100中的X越大,投资组合稳定性越高。

 

保险的“双十定律”原则也是同样的道理。它指的是保险额度为家庭年收入10倍最恰当,及总保费支出为家庭年收入10%最为适宜。

 

个人理财中的消费决策主要是由现在消费与未来消费之间的博弈结果决定的。消费决策指的是如何平衡现在的存量资产和未来的收入的消费状况,一般来说有3种类型:把现在的钱留给未来用的节俭型、现在赚的钱现在用未来赚的钱未来用的“月月光”型和把未来的钱拿到现在用的“游戏人生”型。现在用钱方式的博弈矩阵见上图。

 

这个博弈矩阵中的,好、中、差分别代表消费带来的满足的程度。用未来的钱指的是借钱现在用。比如(好,差)表示现在既多用现在所赚的钱少用未来所赚的钱,绝大部分未来赚取的钱留到未来再用。这种境况使得决策者现在的满足程度为好,未来的为差。两个均为(中,中)的策略表示,这时消费者的选择有两个:其一,现在赚的钱现在用,未来赚的钱未来用;其二,现在赚的钱未来用,未来赚的钱现在用,换句话说就是一边储蓄现在的钱留在将来用,一边借钱现在用。这个博弈矩阵个人最终的选择会是(中,好)境况的策略,也就是将现在与未来所赚取钱的绝大部分用于储蓄投资。这告诉我们,理性合理的理财会让我们整个一生的总体效用最大。

 

所谓融资决策,就是借钱,个人向银行借钱的贷款或按揭,主要是用来增加现期的现金流,以满足个人现在的消费需求或投资需求。上一节给出的房地产按揭案例已经解释了这个问题,这里就不再赘叙。

 

总的说来,理性理财的基本原则是资金的“时间价值”与“风险价值”。对于投资组合的选择,理性理财需要人们慎重考虑的是投资消费筹资的合理性、生命周期内的均衡性和规则性。

 

 “超级女声”、凯恩斯“美女投票论”与泡沫经济

 

很多电视台在进行各种电视大赛时经常会用采取有奖竞猜这样的方式来提高收视率与观众的参与度。所谓有奖竞猜,一般是将抽奖机会给予猜中最终结果的电视观众。当然参与竞猜的观众不仅要选对参赛者,而且还要将这些参赛者最终成绩的排序也要猜得完全准确,这样的观众(投票者)才能获得奖励。因此,投票者能够选中的话,或者说被他提名的参赛者能够“当选” 的话,关键是猜测别人的想法,猜对了你就能获胜,猜错了,你则不能获奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁不应该选上的问题,而是投票的人相互猜测的结果。

 

比如最近湖南卫视的“超级女声”栏目就是这样。“超级女声”在全国都有很大的影响力,最后决赛的时候投票人次甚至超过上千万。至于最后到底哪位选手的歌喉最优美,最能打动观众,这就要看观众整体的喜好。

 

这与经济学大师凯恩斯(John Maynard Kyenes)曾说过的“美女投票”故事有几分相似,这个故事一直被人们广泛引用。

 

凯恩斯说:“专业投资大约可以比做报纸举办的比赛,这些比赛由读者从100张照片当中选出6张最漂亮的面孔,谁的选择最接近全体投票者的平均偏好,谁就能获奖;因此,每个参加者必须挑选并非他自己认为最漂亮的面孔,而是他认为最能吸引其他参加者注意力的面孔,这些其他参加者也正以同样的方式考虑这个问题。现在要选的不是根据个人最佳判断确定的真正最漂亮的面孔,甚至也不是一般人的意见认为的真正最漂亮的面孔。我们必须作出第三种选择,即运用我们的智慧预计一般人的意见,认为一般人的意见应该是什么。”

 

在选美比赛中,最终的结果与谁是最漂亮的女人无关。人们所要关心的是怎样预测其他人认为谁最漂亮,又或是其他人认为其他人认为谁最漂亮。“超级女声”最终结果的预测也并不是看你觉得究竟谁的歌喉最动听,谁的歌声最打动你,而是要判断其他的观众是什么看法。

 

股票市场具有一些类似的特点。投资要义不在于投资者自己对证券价值的挖掘认识,应重点关心其他投资者的看法。也就是说,每个投资者都希望赚钱,可是能否赚钱,不完全取决于某个上市公司的赢利情况,更要取决于其他投资者是否看好这只股票。

 

然而,当我们进一步考虑时,会发现实际的问题更加复杂。因为投票者将全部从相同的角度来看待这个问题。因此,作为股票投资者必须判断的不仅仅是别人是什么想法,而是判断“其他某个人所判断的除这个人自己之外的其他人的想法是什么”。这句话说起来颇有些拗口,实际上,在投票时,没有多少人会去考虑这么多的信息,首先无法收集足够多的背景信息,其次对其他人的想法只是一种猜测,并不一定可以推测出其他人的真实想法。

 

现实中的情况是,研究表明,人们普遍有一种赌博的倾向。有专家估计,1974年美国的成年人口中有61%参与不同形式的赌博,其中,1.1%的男人和0.5%的女人是狂热的赌徒,另外的2.7%男人和1%的女人是潜在的狂热赌徒。在一定程度上,赌博者对于赌局的可能结果有非常好的理性预期,并且还有其他的感情因素会驱动他们的实际行为。

 

此外,在这种博弈中,“羊群效应”(Herd Effect)也起着很大的作用。人们在不确定下决策时,行为受到其它投资者的影响,模仿他人决策,或过度依赖舆论。因而人们面对类似的信息环境时,会作出类似的行为反应。“羊群效应”导致资产价格不连续的和大幅的波动,破坏了市场的稳定性。

 

假设市场上现在有1000个投资者,对一项在新兴市场上投资机会有不同的看法,其中200人认为这项投资有利可图,但其他800人则持有相反的意见。如果将这1000个人的意见综合起来看,这项投资肯定是不明智的。然而,在他们信息无法沟通的情况下,如果最初进行决策的投资者是少数的那200人,他们就会进行投资,而另外的800人则逐渐改变想法跟随着这少数人去投资。这便形成“滚雪球效应”(Snow-balling Effect),这种情况下“羊群效应”发生了。

 

同时,人们在“博傻心理”支配下,股票、房地产等资产价格越高越买,越买价格越高,从而导致金融市场超常规膨胀,引起泡沫经济。比如前两年的房地产市场与更久远的股票市场,它们在其他商品微幅涨价甚至跌价的时候,价格是大幅度上涨。目前大部分城市的房价是远远超出当地普通人的经济承受能力。

 

这里所谓的资产,是指股票、土地、厂房、设备、房产(房产既是消费品又是资产,当房产是购房者自住时,就可以当成是消费品)等。这些东西与一般的物品是不同的,比如房产可以通过出租方式长期获得收益,而日常用品诸如电视机、电冰箱、空调等商品仅仅是消费,并不能够通过它们来获得经济回报。

 

经济泡沫,最权威的《新帕尔格雷夫经济学大词典》中说,“'泡沫状态’不太严格定义为,一种或一系列资产在一个连续过程中陡然涨价,开始价格上升会使人们产生还要涨价的预期,于是又吸引新买主……只想通过买卖牟取利润,对资产本身使用和产生盈利能力不感兴趣。随着涨价常常是预期逆转,接着是价格暴跌,最后以金融危机告终。通常,“繁荣”时间比泡沫状态长些,价格、生产和利润上升比较温和,接着就是以暴跌(或恐慌)形式出现危机,或以繁荣逐渐消退告终而不发生危机。”

 

在18世纪英国的“南海泡沫”中,投资者趋之若鹜,其中包括半数以上的参众议员,就连国王也禁不住诱惑,认购价值10万英镑的股票。由于购买踊跃,股票供不应求,公司的股票价格狂飙,在6个月内从每股128英镑上升到每股1000英镑以上,涨幅高达700%。然而,南海公司的经营却每况愈下,赢利甚微,公司股票的市场价格与上市公司实际经营前景完全脱节。

 

在南海公司股票价格扶摇直上的示范效应下,全英所有股份公司的股票都是投机对象。社会各界人士,包括军人和家庭妇女,甚至物理学家牛顿都卷入漩涡。人们完全丧失理智,他们不在乎这些公司的经营范围、经营状况和发展前景,只相信发起人说他们的公司能获取巨大利润,人们惟恐错过大捞一把的机会。一时间,股票价格暴涨,平均涨幅超过5倍。大科学家牛顿在事后不得不感叹:“我能计算出天体的运行轨迹,却难以预料到人们如此疯狂”。

 

当然,股票市场和房地产市场毕竟是不同的。股票无论涨到多高,只要继续上涨就不会出现直接的受害者。然而,人们总是要在土地上生存的,遮风避雨的房子也是每个人的必需品。

 

然而,房地产、股票等资产价格的上涨,为投资家带来亿万的财富。人们依靠劳动所得的工资收入远远不能与之相比较,这使整个社会的价值观发生混乱。汗流浃背的劳动所得,远不如金钱游戏带来的利益,必然对劳动积极性产生很坏的影响。对于企业也是一样,试问,如果在房地产或股票市场投机所得的收入远高于企业经营管理的回报,还会有哪一家公司认认真真地把企业做好?

 

在这种情况下,“财富效应”的作用开始发生。所谓“财富效应”,即资产诸如股票、房地产的价格高涨可以使人们感到财富增加,从而加大消费动机,刺激消费需求。财富效应,资产泡沫导致人们忽视自己的经济能力,推动消费与投资的增长。对于为数众多的家庭,随着股票、房地产价格的上涨,会大幅度提高消费档次,而消费需要的不断增长当又给经济泡沫打上一针兴奋剂。

 

著名经济学家郎咸平教授曾经于2005年10月1日在澳大利亚的墨尔本对“财富效应”做过这样一段生动的描述:“我更担心是,上海市老百姓的消费习惯是很奇怪的,他不是根据赚多少钱来消费的,他的消费习惯有二个变数,一个是薪水多少,另外一个呢?是财富效果。由于房地产大幅泡沫现象,房子价值虚增比较多,甚至增值100%、200%的都有。老百姓觉得自己口袋鼓了,出门打的啦,晚上出去吃喝玩乐啦,腐败呀。上海是个最有趣的区域,你只要稍微下一点小雨,毛毛雨,再叫不到出租车,大家都怕淋点雨,娇贵的样子,怕淋点小雨。还有,不论你菜做得多难吃啊,总是高朋满座,这是上海人的一个独特现象。各位知道为什么吗?就是那种财富效果,所产生的一种畸形消费,这种畸形的消费拉抬了上海市的经济。”

 

当然,值得强调的是,不管是“羊群效应”,或是“美女投票”,还是“财富效应”,只要是泡沫,终归是要破灭的。因为从投机的作用机制看,这场游戏注定会结束。假设一项资产价值为100万,假定每一个人都在赚得10%后抛出,被n次转手的这项金融资产价格就会是100×(1+10%)n万。要使游戏不断玩下去,n将趋向于无穷大,永远不停止,这样100×(1+10%) n万也会趋向于无穷大。若货币发行量可以无限增大,以适应资产增值的要求,泡沫还可以继续维持。但是,货币的发行量总是有限的,否则会引起极度的通货膨胀,这样泡沫的破裂带有必然性。

 

在世界经济史上,狂热投机产生的泡沫事件,最早可追溯到17世纪30年代出现的席卷整个荷兰的“郁金香疯狂”。在“南海泡沫事件”和“密西西比泡沫事件”之后,泡沫事件与泡沫经济已不胜枚举。但共同的结局是,每次泡沫事件都沉重打击了当时的经济,用于修复投机创伤一般长达十几年甚至几十年之久。

 

随机游走(Random Walk)、正反馈与庞氏骗局

 

在证券投资中有这样一个经典的笑话,说的是:那些殚精竭虑的投资分析专家门精心挑选出来的投资组合与一群蒙住双眼的猴子在股票报价表上用飞镖胡乱投射所选中的股票在投资收益率上没有质的差别。这也就是说,股价波动是无法通过对历史数据的分析来预测未来的走向的。这就是著名的“随机游走”(Random Walk)理论。

 

在随机游走理论中,股价有一个均值P0 ,未来股价的Pn=P+εn(ε,音念乙朴休)。εn为随机干扰变量,并且其均值为0。在这种情况下,这种股价的变化就像一个“醉汉”在路上横行。在每一个时刻,他既可能往左走一步,也可能向右走一步。尽管这个股价这个“醉汉”总围绕着均值上下徘徊,但时间越长,他离均值就可能越远。

 

如果证券价格是服从随机游走理论的,那么这个金融市场就是有效的。在这种情况下,所有的金融工具都能准确、及时地反映出各种信息。也就是说,各种证券都能被准确地定价,任何人与机构都不可能预测证券未来的价格。这样,就不存在入市的最佳时机,也不存在选择股票,更不存在金融分析。那种追求赌博带来刺激与兴奋的人与小心翼翼地分析并选择金融资产的理性的投资者们也没有了任何区别。

 

然而,事实上,在金融市场中,几家欢乐几家愁,总有人大发其财,更有人倾家荡产,这其中的原因并不都是命运,巴菲特、索罗斯就是反例。看来金融市场并不完全满足随机游走的有效市场假设。

 

在金融市场的炒作中,对预期收益率、预期利率以及一切有关的信息的估计,往往有超常规的放大效应,这使得金融资产如股票的价格不仅变换频繁,而且往往带有惊人的震荡幅度。比如美国道琼斯30种工业股票价格指数从1995年的5117.1点,到1998年年中突破9000点,只不过两年半的时间,竟然上升了75%。在亚洲金融危机中,不少国家的股票指数都有一天跌破10%的记录。

 

这种现象,亚洲金融危机的始作俑者索罗斯在其所著的《开放社会———改革全球资本主义》中是这样描述的:“我把历史解释成一个反射过程,在这个过程中,参与者带有偏见的决策与一个超出他们理解力的现实相互影响。这种相互影响能够自我加强或自我矫正。一个自我加强的过程不可能永远持续下去而不受到现实世界极限的制约,但它却可以持续足够久远,以至于给现实世界带来重大的变化。当它不能朝着原有的方向发展下去时,就会进入一个相反方向的自我加强过程。”

 

在现实中,金融市场往往具有一种放大机制。因为过去的价格增长增强投资者的信心与期望,这些投资者又进一步地哄抬股价以吸引更多的投资者,这种循环不断进行下去,造成一种过激反应。从心理学角度来看这种现象就是,人们在任何领域获得成功之后,总会有一种自然倾向,采取行动来求得更大的成功,并不断继续下去。

 

在这种情况下,最初的价格上涨导致了更高的价格上涨,因为通过投资者需求的增加,最初价格上涨的结果又反馈到更高的价格中去。第二轮的价格上涨又反馈到第三轮中,接着反馈到第四轮,依此类推。最初的价格上涨的诱发因素被放大很多倍。一旦需求在某个时刻达到顶点后,整个泡沫瞬时崩溃。这就是在上一节中的泡沫形成的原因。

 

在所有的正反馈机制下的泡沫中,最典型的莫过于庞氏(Ponzi)骗局或称金融金字塔骗局。在一个庞氏骗局中,骗局制造者向投资者许诺,投资便能获得极高的收益率,但投资者付出的投资几乎没有甚至根本没有被投向任何真正的资产。相反,骗局制造者将第二轮投资者的部分资金支付给第一轮的投资者,又将第三轮投资者的部分资金支付给第二轮的投资者,依此类推。在最初的投资者盈利之后,他们的成功将会激发更多的投资者参与这个骗局。当盈利者越来越多,参与者越来越多时,最终整个金字塔不堪重负,轰然倒下,最后一轮的参与者将是整个骗局损失的最终承担者。

 

庞氏骗局的过程正形象地描述了金融市场中由于人的非理性心理因素而导致的投机性泡沫不断扩大并最终破灭的整个过程。

 

 博弈论不能包治百病

 

任何理论与方法都不是万能的。博弈论亦然,它不可能包治百病。这正如诺贝尔经济学奖得主———莱因哈德·泽尔滕教授(莱因哈德·泽尔滕:德国波恩大学,1994年因其在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖,其主要研究领域为博弈论、试验经济学、有限理性和行为经济学。)所说,“博弈论并不是疗法,也不是处方, 它不能帮我们在赌博中获胜,不能帮我们通过投机来致富,也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典的任务。”

 

要求博弈论能够完全刻画真实的世界,那么这命中注定是徒劳无功。根据著名的哥德尔不完备定理,任何一个理论体系必定是不完全的,任何理论都包含既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例尺是一比一的地图是没用的”。

 

博弈论也是这样,博弈论是在力图用最简单的假设下得到最大范围的推理应用。博弈论的这种方法与很多应用广泛的学科都是相似的。

 

如欧几里德几何学是在“两点之间直线最短”的基本假设下,推演出庞大而严密的几何体系。可以说,在生活中或工程应用中,博弈论的思想方法是无处不在、无时不有。博弈论的基本前提假设之一就是:人是理性的(rational)。所谓理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。

 

而现实生活中,人们在做决策时往往是有限理性。所谓有限理性,也就是说人不是机器,人的理性是有限度的。

 

比方说,某人要签署一份合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划进行;另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后一种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。

 

后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意义上的经济理性。

 

这是因为人们很难对每个措施将要产生的结果,具有完全的了解和正确的预测。人们常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策。因此,个人或企业的决策都是在有限理性的条件下进行的。

 

有这么一个经典的决策实验:研究者告诉一个实验群体,让他们设想美国准备帮助亚洲应对一种不寻常的疾病,该病可能导致600人死亡。A、B两种备选方案被提出。实验群体被分成两组,每组进行相应的选择。假设对方案实施结果的准确估算如下:

 

实验群体一的选择:“若方案A被采纳,能拯救200人;若方案B被采纳,有1/3的可能性拯救600人;2/3的可能性一个也不会救”。

 

实验群体二的选择:“若方案A被采纳,则会导致400人死亡;若方案B被采纳,有1/3的可能性把人全部救活;2/3的可能性导致600人全部死亡”。

 

如果人们是完全理性的,那么两组人的选择结果应该相同。但实际的实验结果显示,在群体一中,72%的人更偏好方案A;而在实验群体二中,68%的人更偏好方案B。看来,对方案描述的不同影响到人们的选择,大部分人并不是完全理性的。

 

学者们还做过这样的实验:有两种情况分别如下:

 

情况一:今天晚上你打算去听一场音乐会。票价100元。在你临出发前,发现自己丢掉100元。你还会去听音乐会吗?

 

情况二:昨天你花100元买了一张今晚的音乐会票。在你临出发时,发现票被遗失。如果你想听这场音乐会,就要再花100元买票。你还会去听吗?

 

实验表明,在第一种情况下,大多数人选择要听音乐会。而在第二种情况下,大多数人选择不去听。这明显是受到人们心理作用的结果。而实际上如果人们都是理性,这两个情况的预期效用是一样的。

 

我们在前面曾经举过一个银行挤兑的二阶段动态博弈的例子。如果在这个博弈中的参与者是完全理性,银行挤兑破产的情况并不会发生。然而,不管是经济学家们的实验还是真实的金融史都告诉我们,绝大部分人常常忽视第二阶段,仅仅考虑第一阶段,这说明决策者在决策时存在短视(myopia)。这种情况在经济学上被称为“分离效应”(Isola-tion Effect)。

 

分离效应是人们想等到信息显示后再进行决策的倾向,即使这些信息对决策并不真的重要,在没有信息时也会作出相同的决策,也要等到信息显示时采取最终决策。

 

例如抛硬币打赌,打第一个赌的人又被问到是否愿再打一个相同的赌。如果在第一次结果出来以后再问,大部分对是否打第二个赌取决于他们是否赢了第一次。然而,如果在第一次的结果出现之前就决定是否打第二次赌的话,大部分人不愿打赌。这样,如果不管第一次结果如何,一个人的决策是相同的,则此人在知道结果前就作出了相同的决策。这种行为的思考模式是如果第一次的结果已知并是好的,打赌人就会认为在第二次打赌中不会损失什么。但是如果结果未知,他们没有清楚的理由来打第二次赌。银行挤兑情况的发生往往就是因为这个原因。

 

完全理性,还意味着对每个抉择的确切后果都有完完全全的了解。事实上,一个人对自己的行动条件的了解,从来都只能是零碎的;至于使他得以从对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的。

 

人类的精力和时间永远是有限的,人不可能具有完全理性,不可能掌握所有知识和信息。人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本,而不是毫不费成本的。

 

因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息,企图作出收益最优的决策行为有时反而是最不理性的行为。

 

但是,当我们退而求其次时,博弈论可以得到对现实的客观世界描述的近似。

 

所以博弈论仍然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数学一样,博弈论是社会科学的力学和数学。

 

没有牛顿力学,我们连最简单的物理现象都无法理解。马用了多大的力拉动一车货物?上帝说:“让牛顿来做吧!”于是我们知道了马用的力相当于克服摩擦力。同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。

 

著名的博弈论大师鲁宾斯坦(Rubinstein)说过,“一个博弈模型是我们关于现实的观念的近似,而不是现实的客观描述的近似。”

 

康德“理论之树是灰色的,生命之树常青!”的话用在博弈论上也是十分贴切的。

 

“知识就是力量”的另类解释:信息有价

 

话说有一个古董商,他发现一个人用珍贵的茶碟做猫食碗,于是假装很喜爱这只猫,要从主人手里买下。猫主人不卖,为此古董商出了大价钱。成交之后,古董商装作不在意地说:“这个碟子它已经用惯了,就一块送给我吧。”猫主人不干了:“你知道用这个碟子,我已经卖出多少只猫了?”

 

可他万万没想到,猫主人不但知道,而且利用了他“认为对方不知道”的错误大 赚了一笔。这才是真正的“信息不对称”。信息不对称造成的劣势,几乎是每个人都要面临的困境。谁都不是全知全觉,那么怎么办?首先,为了避免这样的困境,我们应该在行动之前,尽可能掌握有关信息。人类的知识、经验等,都是这样的“信息库”。

 

再来看一个故事:有一个卖草帽的人,有一天,他叫卖归来,到路边的一棵大树旁打起瞌睡。等他醒来的时候,发现身边的帽子都不见了。抬头一看,树上有很多猴子,而且每一只猴子的头上都有顶草帽。他想到猴子喜欢模仿人的动作,于是就把自己头上的帽子拿下来,扔到地上;猴子也学着他,将帽子纷纷扔到地上。于是卖帽子的人捡起地上的帽子,回家去了。

 

后来,他将此事告诉了他的儿子和孙子。很多年之后,他的孙子继承了卖帽子的家业。有一天,他也在大树旁睡着了,而帽子也同样被猴子拿走了。孙子想到爷爷告诉自己的办法,他拿下帽子扔到地上。可是猴子非但没照着做,还把他扔下的帽子也捡走了,临走时还说:“我爷爷早告诉我了,你这个老骗子会玩什么把戏。”

 

这两个故事告诉我们:我们并不一定知道未来将会面对什么问题,但是你掌握的信息越多,正确决策的可能就越大。

 

这和我们前面所说的那些博弈是不同的。所谓“囚徒困境”、“智猪博弈”、“斗鸡博弈”等各种模型都有一个前提条件———博弈双方都有共同知识:博弈参与者都知道,对方所能采用的策略与各种可能发生的结局。简单地说,这些博弈都没有信息不对称的情况。

 

在实际生活中,很多情况下并不都是这么理想化的。人寿保险公司并不知道投保人真实的身体状况如何,只有投保人自己对自身健康状况才有最确切的了解。政府官员廉洁与否,一般的公民并不是非常清楚。求职者向公司投递简历,求职者的能力相对而言只有自己最清楚,公司并不完全了解。最常见的例子就是买卖双方进行交易时,对交易商品的质量高低,自然是卖方比买方更加了解。

 

之所以有这些信息不对称的情况,是因为存在“私有信息”。所谓“私有信息”,通俗地讲,就是如果某一方所知道的信息而对方并不知道,这种信息就是拥有信息一方的私有信息。

 

说到现在的“信息不对称”,那么到底什么是“信息”呢?

 

有位专家说,信息就是信息,既不是物质,也不是精神。这似乎是什么都没说,又似乎已经说得很正确。广义地说,所谓信息就是消息。对人类而言,人的五官生来就是为了感受信息的,它们是信息的接收器,它们所感受到的一切,都是信息。

 

然而,大量的信息是我们的五官不能直接感受的,人类正通过各种手段,发明各种仪器来感知它们,发现它们。信息可以交流,如果不能交流,信息就毫无用处。信息还可以被储存和使用。你所读过的书,你所听到的音乐,你所看到的事物,你所想到或者做过的事情,这些都是信息。

 

私有信息,简单地说,如商家的产品是否有严重缺陷的信息,这样的信息往往只被能接近和熟悉这种产品的人观察到,那些无法接近这种产品的人却无从了解或难以了解。

 

相反,如果一则信息是大家都知道的,或者是所有有关的人都知道的,它就叫做“公共信息”或者“公共知识”。“私有信息”的存在导致了“信息的不对称性”,也就是某些人掌握的信息要多于其他的人。

 

私有信息的存在是信息不对称情况发生的根本原因。比如一个女孩面对好几个追求的男生,这些男生的人品、上进心等信息对于这个女孩来说都是私有信息,女孩与追求的男生之间就存在着信息不对称的现象,因此这个女孩到底选择哪一个男生往往就带有很大的不确定性。

 

私有信息掌握与否也是委托代理关系的重要概念。委托代理关系的概念来自法律。在法律上,当A授权B代表A从事某种活动时,委托代理关系就发生了,A称为委托人,B称为代理人。

 

一般的委托代理关系泛指在任何一种涉及不对称信息的交易(合同、协议)中参与者之间的经济关系。掌握信息多、处于信息优势的一方称为代理人,掌握信息少、处于信息劣势的一方称为委托人。简单地说,“知情者”是代理人,“不知情者”是委托人。

 

社会是由众多个体构成的,人与人之间时刻发生着各种各样的联系。由于不对称信息在社会经济活动中相当普遍,所以许多社会经济关系,都可以归结为委托代理关系。

 

例如,政府与企业、股东与经理、雇主与雇员、消费者与厂家、计算机用户与服务商、信息经纪人与信息用户、病人与医生等等,他们之间都可以构成委托代理关系。

 

除了正式的有书面合同(协议)的委托代理关系,以及有口头委托的较为明显的委托代理关系外,社会经济关系中还有大量的隐含的委托代理关系,诸如老百姓与政府官员、选民与议员的关系等。

 

同一种经济关系中可能包含有多种不同的委托代理关系。例如软件生产商与软件用户的关系,对于软件的生产成本、软件性能等方面的信息,生产商掌握的比用户多,生产商是代理人,用户是委托人,从这一方面来说是“用户委托生产商进行生产”。对于需求欲望、支付能力等方面的信息,用户掌握的比生产商多,从这一方面来说又是“生产商委托用户进行消费”。

 

可见,委托代理关系是与不对称信息相联系的,针对不同的不对称信息,可以构成不同的委托代理关系,对于参与各方,我们不能简单地说某一方是委托人、某一方是代理人。

 

一般来说,私有信息指的是现状,如买卖双方交易商品的质量状况、追求女孩的男生人品、健康状况、求职者的能力等。总而言之,私有信息是双方博弈时已存在的事实。在信息经济学中,一般把这种关于现存事实特征的私有信息,叫做“隐蔽特征”。

 

前面所说的私有信息造成的信息不对称是一种事前的信息不对称,举个例子说,消费者到商家去买商品,在购买之前就不清楚商品质量的好坏。

 

然而,还有一种信息不对称是在一定的环境下,博弈的一方无法判断并观察到另一方未来的行为。在信息经济学中,这种未来别人难以判断或观察到的行为这种隐蔽信息,特别称为“隐蔽行为”。

 

比如,一个民营企业雇佣了一个职业经理人,并授予此人极大的权力,然而这个资本所有者无法判断并观察到将来这个经理上任之后是否会偷懒甚至是将公司的利益据为己有。雇员并不能被全天候监督,他会欺骗雇主或偷懒的行为不可避免。这种行为就是隐蔽行为。

 

再如,公务员都宣誓要一心为民,廉洁奉公。但是若无有效的监督机制,公务员寻私就成了一种隐蔽行为。

 

简而言之,隐蔽信息分为两大块:是事件(合同)前已经发生的和已经存在的有关事实,就叫做隐蔽特征;是事件(合同)后发生的有关事情,就叫做隐蔽行为。

 

正是因为参与博弈者掌握的信息并不完全,往往有很多私有信息的存在,其决策结果必然会有很大的不确定性。所谓“不确定性”,不管是对未来、现在或过去的任何决策,只要是我们不知道确切的结果的都具有“不确定性”。

 

不确定性可分为两大类:主观不确定性和客观不确定性。主观不确定性是指,决策者由于有关资料的缺乏,而不能对事物的态度作出正确的判断。

 

这种不确定性的判断,却是其它掌握资料的人可以有的。例如:消费者对商品的质量不如生产者更为了解,换句话说,商品质量对于消费者更加具有不确定性。

 

和主观不确定性相关的信息常常具有不对称性,一些人掌握事物状态的信息,而另一些人则缺乏事物状态的信息。信息的不对称性可以通过信息的交流和公开以及寻找而消除。

 

客观不确定性是指事物状态的客观属性本身具有不确定性,对此,人们可以通过认识去把握不确定性的客观规律,但是,认识本身并不能消除这种不确定性。

 

当存在不确定性时,决策者的决策就具有风险。不确定性和风险有密切的联系,但又是两个不同的概念。不确定性,直观上很容易理解,一件事情可能出现的结果越多,这件事情就越具有不确定性,结果越不明确(概率分布越分散),不确定性的存在就越显著。

 

风险的必要条件是决策面临着不确定性的条件。当一项决策在不确定条件下进行时,其所具有的风险性的含义是:从事后的角度看,事前作出的决策不是最优的,甚至是有损失的。决策的风险性不仅取决于不确定因素之所含不确定性的大小,而且还取决于收益的性质。所以,通俗地说,风险就是从事后的角度来看由于不确定性因素而造成的决策损失。

 

对个人来说,拥有信息越多,越有可能作出正确决策。对社会来说,信息越透明,越有助于降低人们的交易成本,提高社会效率。在绝大部分情况下,我们根本无法掌握影响未来的所有因素,这使得作确定性的决策变得困难重重。

 

信息本身的价值正在于此。博弈参与者一旦掌握了更多信息,其决策获得更大收益的可能性就增大。

 

比如,一个消费者买一部二手手机需要花1000元,而这部手机的真实价值也许只有500元,如果消费者购买了这部手机,就净损失500元,如果他和二手手机老板很熟,请老板吃顿饭支出100元,老板决定给这个消费者一部价值1200元的二手手机。

 

很自然,获取这部手机真实信息的价值或信息成本就是100元,但是不仅没有亏掉500元,反而赚了200元,一反一复投入100元的信息成本所得到的收益是500+200=700元。

 

因此,市场参与者的决策的准确性取决于信息的完整性。准确的决策需要更多信息的支持,所以信息的获取有减少风险的可能性。这就是说,信息的搜取有可能增加决策者的收益。信息的价值就可以用获取信息后可能增加的收益来衡量。

 

当然信息的获取,并不都像前面的两个故事那样完全不需要成本。甚至有的时候,这种成本可能会高到决策者无法承受的境地。

 

第四部分

 

喜爱刘德华的影迷都看过《赌侠1999》及其续集《赌侠大战拉斯维加斯》。在这两部片子中刘德华饰演成熟内敛的King,他头脑灵活、重义气、机智过人,凭着其锐利的眼光、十足的把握,在赌场叱咤一时,无人能及,被誉为赌侠。

 

从出老千谈道德风险

 

喜爱刘德华的影迷都看过《赌侠1999》及其续集《赌侠大战拉斯维加斯》。在这两部片子中刘德华饰演成熟内敛的King,他头脑灵活、重义气、机智过人,凭着其锐利的眼光、十足的把握,在赌场叱咤一时,无人能及,被誉为赌侠。两部戏从刘德华在赌场出老千被人拆穿,失手杀人被判入狱,造成妻离子散的情节开始直到大赌于拉斯维加斯结束,处处都充斥着出 老千的情节。

 

那些被蒙在鼓里的输家,往往不是认为自己牌技不好,就是认为自己运气不好,从不认为对方在搞什么鬼把戏。他们发现一些破绽,老千们也早已逃之夭夭,不知所踪。

 

这种情况和中国证券市场倒有几分惊人的相似之处:有的上市公司道德水准低下,拿蒙汗药喂股民,践踏股东权益,以圈钱为目的,重大事件不及时披露,透明度只对庄家“暗送秋波”,对股民采取虚假及误导性陈述,随心所欲编造业绩,或制造概念。有的大肆侵吞股东钱财,像达尔曼、伊利股份和近期挖出的开开股份触目惊心。有的在上市资格上瞒天过海,闽东电力等居然上市不久就变脸。2004年就有40多家上市公司因道德问题受到监管部门公开谴责和处罚。这些现象都属于道德风险范畴。

 

那么,什么是“道德风险”(moral hazard)?

 

所谓道德风险,就是人们利用市场的不成熟或者市场的扭曲,违背一般社会道德规范而作出符合经济理性的举动。当然,从事经济活动的人并不总是在最大限度地增进自身效用时,非要作出不利于他人的行动。

 

概括来说,道德风险一般存在于下列情况:由于不确定性、不完全的合同使负有责任的代理方不能承担全部损失(或利益),因而他们不承受他们的行动的全部后果。同样地,也不享有行动的所有好处。显而易见,许多不同的外部因素,可能导致不存在均衡状态的结果;或者均衡状态即使存在,也是没有效率的。

 

道德风险始终存在,一个保过险的人在避免风险方面的积极性普遍有降低的可能性。如果一个人对于他的行为后果只承担一部分责任,或者根本就不承担任何责任,那他的行为动机就被彻底改变了。

 

一般地,当交易双方签约后,如果代理人的行动选择会影响委托人的利益,而代理人选择了什么行动委托人又不知道,委托人利益的实现就有可能面临“道德风险”。道德风险是指代理人在使其自身效用最大化的同时损害委托人利益的行为,而代理人并不承担他们行为的全部后果。

 

“道德风险”这一专业术语产生于保险业。在保险市场上,购买了财产保险的人将不再像以前那样仔细地看管家里的财物。购买了医疗保险的人,可能让医生多开一些不必要的贵重药品。购买了汽车保险的人可能更不注意保管自己的汽车。

 

在这里,因为人们在投保后的行为保险公司无法观测到,从而产生了“隐藏行动”。保险公司面临着投保人松懈责任,甚至采取“不道德”行为而导致的损失。

 

在人身意外伤害保险市场上,谁也不敢保证投保的人为了获得保险赔偿,而不对自己的手脚四肢或眼睛“下手”。在人寿保险上也是如此,一个购买了大额保险的老人如果知道,万一他在保险期内去世,可以使子女得到一大笔补偿,他要动“死”的念头,谁也没办法。

 

保险公司在制度设计上只是应当尽量避免那些可能出现。在这种情况下,保险公司将很可能由于多数的投保人是高风险类型人士而破产关门。

 

比如很容易得病的人才投保健康保险,不容易得病的人不参加保险,于是保险公司需要赔给保户的钱将远远高于他们按照平均得病率计收的保费,从而带来损失。这里,私有信息的存在,使得投保人可以就他们本身的身体情况或风险程度说谎。

 

这样一来,从保险公司的角度看,他们得到很多“逆向选择”得来的投保人。平常人们说“选择”,都是往好的方面选。保险公司的上述市场活动带来的选择,“选”出来的是比较不那么好的一群。所以这种选择叫做“逆向选择”。逆向选择会导致保险公司因风险过高而破产。

 

实际上,“道德风险”在现实生活中是普遍存在的现象。

 

病人到医院看病动手术,手术能否成功,大夫在手术过程中的尽心尽责非常重要。大夫不用心可能导致手术失败。如果不能将正常的手术风险和医疗事故区分开来,大夫将不承担“不用心”行为导致的全部后果。这时,病人面临着来自大夫的“道德风险”。

 

学生选修某门课程,任课老师是否认真负责,这些行动的选择取决于老师,而这些行动又会影响到学生对知识的掌握。这时,学生即面临来自老师的“道德风险”。

 

 

逆向选择的困境

 

美国经济学家阿克洛夫(G.Akerlof)1970年提出了著名的旧车市场模型,开创了“逆向选择”(adverse selection)理论的先河。

 

在旧车市场上,买者和卖者之间对汽车质量信息的掌握是不对称的。卖者知道所售汽车的真实质量。一般情况下,潜在的买者要想确切地辨认出旧车市场上汽车质量的好坏是困难的。他最多只能通过外观、介绍及简单的现场试验等,来获取有 关汽车质量的信息。

 

然而,从这些信息中很难准确判断出车的质量。因为车的真实质量只有通过长时间地使用才能看出,但这在旧车市场上又是不可能的。

 

所以我们说,旧车市场上的买者在购买汽车之前,并不知道哪辆汽车是高质量的,哪辆汽车是低质量的,他只知道旧车市场上汽车的平均质量。

 

在这种情况下,典型的买者只愿意根据平均质量支付价格。但这样一来,质量高于平均水平的卖者就会将他们的汽车撤出旧车市场,市场上只留下质量低的卖者。

 

结果是,旧车市场上汽车的平均质量降低,买者愿意支付的价格进一步下降,更多的较高质量的汽车退出市场。在均衡的情况下,只有低质量的汽车成交,极端情况下甚至没有交易。

 

在旧车市场上,高质量汽车被低质量汽车排挤到市场之外,市场上留下的只有低质量汽车。也就是说,高质量的汽车在竞争中失败,市场选择了低质量的汽车。

 

这违背了市场竞争中优胜劣汰的选择法则。平常人们说选择,都是选择好的,而这里选择的却是差的,所以把这种现象叫做逆向选择。

 

从上述分析过程还可以看出,产品的质量与价格有关,较高的价格诱导出较高的质量,较低的价格导致较低的质量。逆向选择使得市场上出现价格“决定”质量的现象。

 

买者无法掌握产品质量的真实信息,这就为卖者通过降低产品质量来降低成本,从而争取低价格提供了可能。因而出现低价格导致低质量的现象。

 

逆向选择对经济是有害的:高质量的卖者和需要高质量产品的买者无法进行交易,双方效用都受到损害;低质量的企业获得生存、发展的机会和权利,迫使高质量的企业降低质量,与之“同流合污”;买者以预期价格获得的却是较低质量的产品。

 

如同“道德风险”一样,“逆向选择”这一术语也起源于保险行业。因为保险市场上的逆向选择现象相当普遍。以医疗保险为例。不同投保人的风险水平可能不同。有些人可能有与生俱来的高风险,比如他们容易得病,或者有家族病史。而另一些人可能有与生俱来的低风险,比如他们生活有规律,饮食结构合理,或者家族寿命都比较长。

 

这些有关风险的信息是投保人的私人信息,保险公司无法完全掌握。如果保险公司对所有投保人制定统一保险费用(这属于总体保险合同)。由于保险公司事先无法辨别潜在投保人的风险水平,这个统一的保险费用,只能按照总人口的平均发病率或平均死亡率来制定。所以,它必然低于高风险投保人应承担的费用,同时高于低风险投保人应承担的费用。

 

通过这种方式,低风险投保人会不愿负担过高的保险费用,退出保险市场。这时,保险市场上只剩下高风险的投保人。简单地说,这时,风险投保人驱逐低风险投保人的逆向选择现象发生了。其结果是保险公司的赔偿概率,将超过根据统计得到的总体损失发生的概率。保险公司出现亏损甚至破产的情况必然发生。

 

资本市场上也存在着逆向选择。比如对于银行来说,其贷款的预期收益既取决于贷款利率,也取决于借款人还款的平均概率,因此银行不仅关心利率,而且关心贷款风险,这个风险是借款人有可能不归还借款。

 

一方面,通过提高利率,银行可能增加自己的收益;另一方面,当银行不能观测特定借款人的贷款风险时,提高利率将使低风险的借款人退出市场,从而使得银行的贷款风险上升。

 

结果,利率的提高可能降低而不是增加银行的预期收益。显然,正是由于贷款风险信息在作为委托人的银行和作为代理人的借款者之间分布并不对称,导致了逆向选择现象。

 

不仅在经济生活中存在很多“劣币淘汰良币”的现象,日常生活中的逆向选择也随处可见。比如人们常说“巧妇常伴拙夫眠”,漂亮女孩身边的男孩总是貌不出众、能力平常。而那些普通女孩倒是不乏优秀男生与之相伴。

 

造成这种情况的真正原因就是信息不对称下的逆向选择。那些对漂亮女孩向往已久的崇拜者们相互之间,以及和漂亮女孩之间都不能沟通信息。

 

漂亮女孩的追慕者会这样想:这么漂亮的女孩,怎么轮得到我来追?肯定有那些比我有钱的阔佬,比如巴菲特去追求她。于是长叹一声,转而追求其他女孩去了。而巴菲特在华尔街上巧遇来纽约观光的漂亮女孩之后,也颇为心仪,但是巴菲特转念一想:这么漂亮的女孩,怎么轮得到我来追?肯定有那些比我年轻的阔佬,比如比尔·盖茨,去追求她。于是巴菲特长叹一声,转而与结发老妇相伴去了。

 

漂亮女孩去微软公司面试时,巧遇比尔·盖茨。面对如此佳人,比尔·盖茨再也不能正襟危坐了,心中一阵激动,但比尔·盖茨转念一想:这么漂亮的女孩,怎么轮得到我来追?肯定有那些比我更强壮的阔佬,比如乔丹,去追求她。于是比尔·盖茨长叹一声,埋头继续与司法部周旋。

 

漂亮女孩去观看篮球比赛时,邂逅飞人乔丹。面对如此佳人,乔丹岂能坐怀不乱,脑海中翻起千层浪,但乔丹冷静下来一想:这么漂亮的女孩,怎么轮得到我来追?肯定有那些比我更英俊的小伙,比如她的什么同学或同事,早就已经把她追到手了。于是乔丹长叹一声,转身来个空中走步。这就是漂亮女孩的困惑。

 

那些想追求她的人相互之间都不能互通信息,也不了解漂亮女孩的尴尬处境和真实想法。结果是每个想追求她的男人都根据自己的预期来决定是否要去追求漂亮女孩。由于大家都预期追求金发女郎一定是极高的门槛,最后造成大家都退缩不前。

 

在这个困惑中,大家只观察到了女孩的美貌,只发现了自己的不足之处,而根本不知道其他任何信息。最后每个人都相信追求漂亮女孩的代价将是很高的,因而大家都不采取行动。最后反而是那些不知天高地厚、懵懵懂懂的普通男生追到漂亮女孩。

 

武林高手、信号传递与声誉

 

记得有一部电视剧,其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆。生意十分兴隆,引起另一位武林高手的垂涎。这位武林高手决定打败那位豪杰然后霸占酒馆。两强相遇,武林豪杰和武林高手相互之间不知对方底细,于是来一番比试。

 

本来,他们俩可以通过打斗来解决问题,但打斗一场双方都会有所损伤,不如通过其他方式比较武功高低。豪杰拿来10块 砖交叠放置,一掌将其击碎,高手也不示弱,照样击碎10块砖。于是,豪杰又拿来15块砖,同样是一掌击得粉碎,高手见之,心中没底,于是明白自己武功较豪杰还差一截。于是,这位武林高手甘拜下风,放弃了原来的计划,弃剑而去。

 

这个电视剧中的情节就是一个典型的“信号传递博弈”。所谓“信号传递”,用学究式的话来说,就是“高质量”代理人利用信息优势向委托人传播自己的私人信息。我们已经知道,信息不对称是导致逆向选择的根源。要减少逆向选择,就必须解决信息不对称问题。

 

在这个故事中,豪杰身怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手,除非亲自与之交手并败于他。交战虽然可以决出高下,但对双方都会有损失,打个头破血流对谁都不是好事。当然,豪杰可以对外宣布他的武功非凡,其他人不是他的对手,但即使豪杰没有什么本事,也可以如此对外宣布。所以,仅凭口头宣布是难以令人信服的。

 

俗话说,是骡子是马,拉出去蹓蹓。豪杰用过人武功劈掉别人难以模仿的10块砖,就向别人发出一个信号。这个信号向外传递的信息是:我的武功高强,你们可不是对手。这样,不用打斗就决出高下,避免了打斗带来的更大损失。

 

在生物学中也有同样的道理。雄鸟通常有鲜艳厚实的羽毛,并以此来吸引雌鸟。很多人误认为,雌鸟在寻找基因优良的雄鸟,这样他们的后代才能有优良的基因吸引异性。

 

但是,为什么大而厚实的羽毛可以代表基因优良?人们也可以认为那是缺陷,因为太醒目的羽毛更容易被猎人发现,而且行动也不方便,很容易被抓获,这样的话为什么雌鸟要选择有缺陷的雄鸟呢?

 

答案还是可置信的信号传递条件。尽管厚重的羽毛是个缺陷,但是只有强健敏捷的鸟才能承受,越弱的鸟越不能负担厚重的羽毛,所以厚重的羽毛的确传递了雄鸟体质的可靠信号。

 

在日常生活中,这样的例子就更多了。当人们进行交易时,产品的质量好坏对于商家与消费者来说,了解的程度完全不同。在多数情况下,消费者在购买产品时并不能了解到每种产品的具体质量,真正了解产品质量的是商家。

 

不同的商家提供的产品质量不同。那些出售劣质品的商家,为了自己的利益将产品的质量信息隐藏起来。对于消费者来说,如果他们无法区分产品质量的优劣,就只能根据对整个市场的估计支付价格,即根据平均质量支付价格。

 

当质量不同的产品被消费者以同样的方式对待时,劣质品在成本上具有优势,从而有可能在销售上占据优势。优质品则因其机会成本超过市场价格,从而可能退出市场。

 

但是,优质品的提供者不会甘心被劣质品逐出市场,为了使自己的产品与劣质品区分开来,他们会选择适当的信号,向消费者传递自己的产品是优质品的信息,以改善信息不对称的状况,减少逆向选择的不利影响。

 

厂家可以提供质量保证和承诺,这是一种常见的低成本、短期效果明显的方法,真正的优质品因质量原因退换的概率非常小,保修期内的返修率非常低。因此,从整体上不会增加多少成本。而劣质品的卖者,肯定提供不了这种保证和承诺,因为这对于他们来说成本太高了。

 

名牌效应也是一种常见方法,这种方法投入成本较高,但却有十分丰厚的长期回报。如海尔电器、奇瑞汽车等,其品牌本身就传递了产品是优质品的信息。因为在消费者心目中,名牌代表优质。

 

尽管不是每件名牌产品都是优质品,但是消费者在其它产品找到优质品的成本通常很高。因此,希望购买优质品的消费者,通常会优先考虑选择名牌产品,或自己熟悉的品牌。

 

广告也是一种信号传递的手段,可以有效地减少信息不对称。商家或厂家可以通过大频率地投入各种广告,获得较高的宣传效用。这样,消费者几乎无需多少成本,就可以从广告中获得各种所需的产品质量信息。

 

我们还可以看到,在生活中有这样的广告。很多电视广告既无商品定价又无购买地点,只有影视明星的搔首弄姿的表演。这种广告往往是除了显示一下商标外,完全没有对产品性能的说明。

 

这种广告是否也有降低信息不对称的效果,厂家投入的资金是否是作无用功呢?

 

答案是:这种广告当然有很好的作用。

 

我们假设有一家企业A开发出一种很有市场潜力的饮料,该产品饮后对人的健康确实有好处。但同时,另一家生产假冒伪劣产品的企业B,也准备向市场推出一种伪劣产品饮料。

 

两个企业都会向公众宣布其产品质量过硬、绝对上乘。但公众是理性的,不会仅凭商业宣传就相信它们。但是,如果产品真的好,随着时间的推移,消费者能够识别出来。

 

所以,生产好饮料的企业A对自己的市场有信心,它相信随着时间的推移,企业B生产的伪劣产品终究会被消费者识破,顾客会跑到自己这里来,从而自己的市场会不断扩大,销售收入及利润会不断增长,而企业B开始可以蒙骗一部分消费者,但时间一长,产品的问题会暴露出来,市场会不断缩小,收入及未来利润都不会有企业A的大。

 

这样一来,企业A的未来预期收入远大于企业B。因此,如果企业A请一位当红明星打广告,由于是当红明星,他们打广告有很高的市场价格,就可以使企业B不敢模仿。譬如,假定企业A的预期收入为3千万元,企业B的预期收入为1千万元。当红明星打广告的市场价格为2千万元,那么,企业A可以请明星打广告但企业B就请不起。

 

消费者也明白这个道理。他们在一开始就认为,请不起当红明星打广告的企业B是生产伪劣产品的。这样,企业B一开始就没有市场。当企业A请了当红明星打广告时,企业B发现这位明星的市场价格太高,自己难以模仿企业A,开始就会放弃生产伪劣产品的计划。所以,企业A通过请当红明星打广告来清除掉了潜在的市场模仿者。企业A并不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告,就已经在告诉公众:它是生产优质产品的企业。

 

这种广告的价值正在于:当红明星出场费高低代表了企业A的产品质量高低。

 

然而,并不是所有产品都适用于做广告。对于低质量产品,消费者最多只会购买一次,如果做广告的成本高于产品一次销售所得的利润,这时低质量产品做广告就不合算。可见,较高的广告成本将屏蔽掉一部分低质量产品。

 

如果广告成本高于产品第一轮销售所得的利润,又低于多轮销售所得的利润,那么高质量产品做广告将有利可图。从这个角度说,高成本广告中的产品应该是高质量产品。结果,广告作为市场信号,传递了高质量产品的信息。

 

所罗门故事与制度设计

 

所罗门王是古代以色列国的一位智慧、英明的君主。有一次,两个少妇为争夺一个婴儿争吵到所罗门王那里,她们都说自己是婴儿的母亲,请所罗门王做主。

 

所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢这位 妇人的求诉,所罗门王立即作出最终裁决:婴儿是这位请求不杀婴儿的妇人的,应归于她。

 

这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。

 

所罗门王正是了解到这一点,才能很快识别出谁是婴儿真正的母亲。所罗门王的这种方法在博弈论中被称为“机制设计”。

 

机制设计,就是设计一套博弈规则,令不同类型的人作出不同的选择,尽管每个人的类型可能是隐藏的,别人观察不到,但他们所作出的不同选择却是可以观察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真实类型。更专业一点地说,就是委托人通过制定一套策略,根据代理人的不同选择,将代理人区分为不同的类别,这就是“信息甄别”。

 

人们都知道垄断企业可以获得垄断的超额利润,然而许多垄断厂商并未如人们所料想的那样高价格销售商品,而是以低价长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都长期远低于按照其垄断定价方法定出的价格。其实,这个问题的解决方法就是信息甄别,比如在飞机、轮船里设置头等舱、经济舱的差别定价方法。

 

无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些,或对花钱看得比较松一些,就可以支付较高的价格。相反,收入低的人或对花钱看得比较紧一些的人,就只愿支付较低的价格。但是,如果你问他们愿意支付什么样的价格,他们都必定说愿支付较低的价格,因为既使有钱人有也会在同样服务下以低价购买划算一些。

 

飞机或轮船公司为了将这些具有不同支付意愿的人区分开来,让能支付较高价格的人支付较高价格,就设计了一种信息甄别机制。这是减少逆向选择的又一种途径。通过这种机制在飞机、轮船公司就是设立头等舱、二等舱、三等舱……

 

当飞机或轮船的舱位条件和价格完全一样时,不同支付意愿的人都会以最低价格买票,不会有人愿支付比别人更多的钱去买相同的舱位的票。于是,航空公司或轮船公司将舱位分成头等舱、二等舱等,价格稍有不同,当然服务也不同,就将不同支付意愿的顾客区分开了。

 

头等舱比其它较低等级舱位的价格高许多,这并不表明相应的服务一定比其它舱位好很多。真正的原因在于:选择头等舱旅客的支付能力要远高于其他人。说白了,就是坐头等舱的人比坐其它舱位的人更有钱或更能花钱而已。

 

旅客支付能力无法观察,但买什么舱位的票却能够观察。这样,航空公司可以识别出不同的顾客,来赚取更多利润。

 

譬如,有两位旅客A和B乘飞机。A的最高支付能力为1000元,B的最高支付能力为1500元。经济舱的服务成本为800元,头等舱的服务成本为1200元。

 

经济舱带给A和B的消费满足感为1000元,头等舱带给A和B的效用为1800元。如果没有头等舱,航空公司最多把票价定到1000元,利润为2×(1000-800)=400元。因为票价一旦高于1000元,A和B就不会买票了。但当设立头等舱后,航空公司将经济舱票价定为1000元,将头等舱票价定为1500元。此时,A以1000元买经济舱。

 

B如果买经济舱,则其净效用(也就是获得的消费满足感减去付出的代价的净值)为1000-1000=0,但当B买头等舱票时的消费者剩余或净效用为1800-1500=300元,所以B会买头等舱。A的支付能力只有1000元,所以甲只有买经济舱。这时,航空公司的利润增大为(1000-800)+(1500-1200)=500元>400元。

 

这样,航空公司通过机制设计提高了公司利润。

 

大家都知道,很多消费者在购买商品时,会非常谨慎,他们为了某些自身利益会隐藏私人信息。这种情况下,消费者信息在买卖双方间便会产生不对称。航空公司的这种定价方法就是解决信息不对称的工具之一,可以应用于各行各业。

 

就拿推出一本新书来说,通过提供精装本和平装本两种版本,出版商可以将读者分为两大类:一类对书的评价较高,另一类对书的评价较低。这种情况下,对该书评价较高的读者会购买精装本,对该书评价较低的读者则购买平装本。出版社商的利润因此而大大提高。

 

电信提供服务时,服务商可以对手机用户提供两种收费标准:一种是单位时间通话费用较低,但需交纳一定的月租费;另一种是单位时间通话费用较高,但不需交纳月租费。根据用户使用手机频率的高低,服务商可以将用户区分为高频率用户和低频率用户两类。这种情况下,电信服务商赚得的利润最高。

 

对于一个公司来说,客户的需求信息,在公司与客户之间是不对称的。客户知道自己的需求,公司则不完全知道。高需求客户为了以更低的价格成交,往往会隐藏“自己急迫想要购买这种商品”的心理。在这种情况下,差别定价方式可以甄别出不同需求程度的客户。这样,公司对于高需求客户要价可以提高,对于低需求客户要价则可以降低,结果自然是得到更多的利润。

 

对于前面提到的保险困境的问题,也可以采用差别保险合同的方式解决。如果有高风险和低风险两种类型的潜在投保人,保险公司却无法辨别。为了获取投保人的信息,保险公司可以提供给投保人两种可供选择的合同,一种是“高保费高赔付”,一种是“低保费低赔付”。

 

显然,高风险投保人更愿意选择前一种合同,而低风险投保人则愿意接受后一种合同。这样一来,保险公司就可以从投保人的挑选中获得潜在投保人的类型信息,将两类投保人区分开来,从而降低了逆向选择的。

 

未婚者必读:“约会博弈”(Dating Game)与“麦穗理论”

 

西方的择偶观里有著名的“麦穗理论”,是说我们寻找伴侣时如同走进了一个麦田,一路有麦穗向我们招摇,很多人不知道摘取哪一支,因而就会有踌躇与彷徨,遗憾与悲伤。而正常人再花心,他或她也得选择一支来陪伴自己的旅程。当然并不排除有极少数人会在短短的一生里一换再换。

 

“麦穗理论”来源于这样一个故事。古希腊哲学导师苏格拉底的三个弟子 曾求教老师,怎样才能找到理想的伴侣。苏格拉底没有直接回答,却让他们走麦田埂,只许前进,且仅给一次机会选摘一支最最大的麦穗。

 

第一个弟子走几步看见一支又大又漂亮的麦穗,高兴地摘下了。但是他继续前进时,发现前面有许多比他摘的那支大,只得遗憾地走完了全程。

 

第二个弟子吸取了教训.每当他要摘时,总是提醒自己,后面还有更好的。当他快到终点时才发现,机会全错过了。

 

第三个弟子吸取了前两位教训.当他走到三分之一时,即分出大、中、小三类,再走三分之一时验证是否正确,等到最后三分之一时,他选择了属于大类中的一支美丽的麦穗。虽说,这不一定是最大最美的那一支,但他满意地走完了全程。

 

看来对于一个人来说,在众多的追求者中选择最合适的异性,这是关乎终生幸福的大事。

 

笔者不妨假设有20个合适的单身男子都有意追求某个女孩,这个女孩的任务就是,从他们当中挑选最好的一位作为结婚对象,决定跟谁结婚。从这20个里面选出最好的一个并非易事,该怎么做才能争取到这个结果?

 

首先要考虑的是约会时对对方真实性格、人品的判断。

 

约会时,男女双方一开始都是展示自己的优点,掩盖自己的不足。当然,他们都想了解对方的一切,不管是优点或是缺点。然而,每个人都是理性的,任何一方在约会时都会掩藏自己的缺点。

 

正如古圣人所说,“观其所以,视其所由,察其所安。”对于每一个人来说,在择偶的时候,都要仔细思考所面临的情形,并力图发现哪些是真实的,哪些只是为了获得良好印象而伪装出的。

 

对于一个女孩来说,男朋友赠送的鲜花是相对廉价的,而贵重的钻石、金表、项链等礼物也许更能代表一个人的真心。这并不是因为值多少钱的原因,正如有句话说的好,“一个男人爱一个女人有多深,就会为她掏出多少钞票”。这表明一个人乐意为你奉献多少的可靠证明。

 

然而,礼物值多少“钱”对于不同的人是有差异的。对一个身价亿万的有钱人来说,送上一颗名贵钻石可能比带你游山玩水的价值要低的多。反之,一个穷小子,花了大量时间辛勤工作,买上一颗钻石的价值就要高得多。

 

你也应当意识到,你的约会对象同样地会对你的行为挑拣一番。因此你得采取能真正代表你具有高素质的行为,而不是谁都学得来的那些行为。

 

探询、隐藏和发现对方内心深处的想法,不仅在初次约会时很重要,在整个关系发展的过程中都很重要。下面的故事说明了这一点。

 

一对青年男女,住在上海,分别租房。两人的关系已发展到同居的地步。女人要求男人退房,与她合租。这位男士非常精明,他会想:租这套房子,可以在分手的时候,留作后备,不至于过于狼狈不堪,四处求房。

 

即使他们分手的概率很小,但是只要有分手的可能,保留第二套房子还是有用的。对于女人来说,男人这么做,她当然非常反感,甚至可能立刻分手。

 

因为女人无法确认男人对关系的忠诚度有多高,她的要求实际上是对男人爱不爱她的一个甄别:口头的爱总是很廉价,因为“我爱你”除了唾沫四溅以外,别无其它成本。如果男人用行动实践诺言,放弃了廉租房,这将是爱情忠贞的有力证明。而他拒绝这样做实际上是给出了负面证明,女人选择分手是明智的。

 

其次要考虑的是选择什么样的方法来筛选出比较适合的异性。

 

很明显地,最好的方法是和这20个人都接触一遍,了解每个人的情况,经过对比筛选,找出那个最适合的(当然并不一定是优秀)的人。

 

然而在现实生活中,一个人的精力是有限的,不可能花大把大把的时间去和每个人都交往。不妨假定更加严格的条件:每个人只能约会一次,而且只能一次性选择放弃或接受,一旦选中结婚对象,就没有机会再约会别人。

 

那么最好的选择方法存不存在呢?事实上是存在。好的方法可以增加达成目标的机会,当然不能否认还有运气的成份。

 

不如我们就用模型来模拟实战一下。显然,你不应该选择第一个遇到的人,因为他是最适合者的机率只有1/20。这个几率可以说是非常的渺茫,直接把筹码放在第一个人身上,也是最糟的赌注。同样地,后面的人情况都相同,每个人都只有1/20的机率可能是20个人当中的最适合者。

 

可以将所有的追求者分成组(比如分成5组,每组4人)首先从第一组中开始选择,在第一组中每一个男性都约会,但并不选择第一组中的男性,即使他再优秀、再完美都要选择放弃。因为,最合适的对象在第一组中存在的机率不过1/5。

 

如果以后遇到比这组人更好的对象,就嫁给这个人。在现实生活中,人们往往就是这么进行选择的,通过总结从前恋爱的经验与心得体会,作为评估后来者的基础。

 

当然这种方法就像“麦穗理论”一样,它并不能保证选择出的是最饱满最美丽的麦穗,但却能选择出属于最大中比较美丽的麦穗。

 

无论是选择爱情、事业、婚姻、朋友,最优结果只可能在理论上存在。不把追求最佳人选作为最大目标,而是设法避免挑到最差的人选。这种规避风险的观念,对我们在作人生选择时非常有用。

 

 人类为什么会有男人和女人?

 

你有没有考虑过这样一个问题,世界上为什么会有男人和女人的区别?

 

关于这个问题古往今来有各种解释。按照《圣经》的说法,上帝创造了男人亚当,后来又用亚当的一根肋骨创造了女人夏娃。按照中国古代传统思想,阴阳是宇宙的普遍规律,正如天上有太阳和月亮一样,人也要分男女。还有的人甚至用“一生二,二生三,三生万物”的道理,来解释男女产生的原因。

 

实际从广义来说,性别差异并非人类所独有,而是在整个生物界普遍存在。在生物学上,性别 有一个非常枯燥的定义:基因的重组,也就是来自两个以上个体的遗传物质的融合。

 

根据生物学的研究,在自然界,有性生殖的生殖成本比无性生殖要高一倍,这种生殖方式对环境的适应程度比较低。可是,通常在生物进化过程中,这种“劣等”的有性生殖方式只要对自然界的适应程度稍微低那么一点儿,就会在几十代的时间里被淘汰掉。

 

难道有性繁殖方式真的必然会被大自然所淘汰吗?

 

常识告诉我们,人类男女性别出现的历史何止区区几十代!因此,性别的出现一定是一种合理的现象,有性生殖肯定有它的原因所在。

 

对于这个问题,我们可以通过博弈论给出合理的解释。在自然界中,很多生命体之间有一种共生共存的关系,它们分别是寄生者与宿主。然而,大家都知道,很多寄生虫对人体健康会造成很大伤害,有时甚至是危及生命。因此,寄生者也有危害宿主的可能。

 

在这种情况下,宿主不得不采取有性生殖的方法来逃避寄生者的危害。假设寄生者有A1和A2两种基因,宿主有B1和B2两种基因,持有B1的宿主只对持有A1的寄生者有抵抗力,而持有B2的宿主只对持有A2的寄生者有抵抗力。

 

在这种情况下,当宿主群体中B1基因较多时,A2型寄生者比较有利,使得A2型寄生者增加。但是当A2型寄生者较多时,对B2型宿主又会比较有利,由此又会促使B2型寄生者变为多数。这又使得B1型宿主再次增加,如此反复循环。

 

在这个循环过程中,如果是这个宿主是有性生殖的话,它对寄生者变化的反应就会快的多。因为有性繁殖带来了基因重组,基因重组带来了无穷无尽的变异,而丰富的变异更有能力接受生存的挑战。这就像参加抽奖,单性生殖只是买了一张彩票,然后把它复印了许多次,复印得再多也不能增加中奖机率,而有性生殖却是买了许多不同号码的彩票,显然最有可能中奖。

 

通过在每一代改变基因,有性物种能更好地躲避敌人(寄生虫和捕食者)的追捕。为了能够生存,必须不断地更新。相应地,寄生虫和捕食者也必须不断地进化。如果像单性生殖那样,母子一成不变,原地踏步,就会被敌人追上,最终导致灭亡。所以,即使只有50%的基因得到传递,也要比什么都没能传下去的好。这种解释,被称为“红后”理论,它得名于《爱丽斯漫游奇境记》中象棋红后对爱丽丝说的话:“为了停留在原地,要拼命地跑。”

 

原来,有性生殖的真正作用在于维持物种内部的基因多样性。通常我们判断某个物种是否“濒危”的重要指标就是该物种是否保有足够的基因多样性。通常人们对进化的理解是“优胜劣败,适者生存”,这是对的。但是“优”与“劣”、“适”与“不适”却会不断变化,在此时此地“优”的,在彼时彼地却可能是“劣”,反之亦然。

 

基因突变是随机的,在生态环境变化时,期待基因突变恰好产生一个“诺亚方舟”使物种度过难关是完全不现实的。进化则是一种高度近视、毫无远见的机制,会毫不客气的淘汰掉将来可能有利但现在有害的基因。

 

但是,有性生殖恰恰会保护这些暂时“坏”的基因,以备不时之需。这些“坏”基因是以隐性遗传的方式被保存的,假定这种基因在种群中的频度为1/1000,那么在有性生殖中被表达的可能性就是1/1000,000,很难被淘汰掉。由此可知,有性生殖的作用不是加快进化,恰恰是减慢进化。

 

人们经过研究发现:在人工选择很高的进化压力下,确实可以使物种很快进化,但是这个进化压力一旦撤销,有性生殖种会立即发生明显的“反弹”,而无性生殖种则没有这种现象。有性生殖可以有效的克服进化的“近视”,取得长远的利益。生物观察的结果也表明,在复杂多变的生态环境中,有性生殖有明显优势;而在贫瘠简单的生态环境中,无性生殖更能适应。

 

有性生殖的组合爆炸效应对于个体的多样性有更明显的贡献。仅仅考虑染色体的随机分配,一对夫妇可能有的不相同的孩子就有246≈1014种,远远超过全世界的人口。这也保证了多样性能通过种群变小的“瓶颈”。

 

由此可见,越复杂的高等生物,其发育过程越长,参与发育的基因就越多,而这些基因只要有一个被破坏,发育就会中断,导致个体死亡。所以复杂生物都有一些防止基因突变的机制,以降低突变率,否则其生殖效率会低到不能维持物种存在。与此相反,单细胞生物或较简单的多细胞生物却可以用较高的突变率和高得多的繁殖率来补偿进化淘汰导致的多样性损失。

 

在哺乳类和细菌这两个极端之间的很多生物,则往往同时存在着有性生殖与无性生殖,通常无性生殖物种的历史都比较短。这又说明了无性生殖在短期是有利的,但长远来看却容易灭绝。有性生殖则反之,它从长远来看则更加有利。比如有一种同时具有有性和无性生殖的鱼类,有性生殖的后代要比无性生殖的后代更不容易感染寄生虫,而且变异越大,越不容易感染。这也正是作为地球上最高等动物的我们———人类会分成男人与女人的原因。

 

情侣博弈的讨论

 

话说有一对热恋中的情侣男A和女B,他们都是工作繁忙的公司主管,平时很少能够在一起共度浪漫时光。这一天他们约好下班后去看电影。男A是个军事迷,特想看战争片,对艺术片一点都不感冒;女B则是艺术爱好者,只想看艺术片,对战争片毫无兴致。

 

不妨定量地来分析,假设男A看战争片的满意程度为10分,而看艺术片的满意程度为2分;女B看艺术片的满意程度 为10分,而看战争片的满意程度也为2分;两人在一起看电影满意程度各会提高10分。这个时候,我们可以得到如下的图。

 

很显然,男女要么都去看战争片,要么都去看艺术片,这两种情况达到了该博弈的纳什均衡。这个博弈还有一个特征就是,每一个参与者都不存在优势策略,因为不管是男A或是女B,都会发现自己的最优策略取决于对方的选择。

 

我们逐个分析以下几种情况:

 

1.如果男A选择看战争片,那么女B选择看战争片的满意程度最高;

 

2.如果男A选择看艺术片,那么女B选择看艺术片的满意程度最高。男A的策略选择亦然。

 

实际上,情侣博弈的正式名称是“性别之战”(Battle of Sex)。在情侣博弈中,双方都没遇到“囚徒困境”中那样的最佳策略。但是,他们总会作出一个较好的选择,谁叫他们是热恋的情侣呢?

 

我们只需留意就会发现,在情侣博弈中,双方都去看战争片,或者双方都去看艺术片,就是我们所说的相对优势策略的组合,一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。比方说两人一起看战争片,男A满意度为20分,女B满意度为12。如果男A改变主意单独去看战争片,变成双方满意度都是10分,没有好处;如果女B改变主意单独去看艺术片,也变成双方满意度也是10分,也没有好处,所以,两人一起走看战争片是稳定的结局。同样,两人都去看艺术片也是稳定的结局。

 

这种稳定的结局就是“纳什均衡”,在情侣博弈中,双方都去看足球,或者双方都去看芭蕾,是博弈的两个纳什均衡。就单次情侣博弈而言,最后结局究竟落实到哪一个“纳什均衡”,是博弈论本身无法解决的问题。

 

如果时间紧迫,双方来不及联系并且事先也没有商量好,每个人只好单独决定自己去看什么电影。这个时候,很可能会出现的情况是男A去看战争片,女B去看艺术片。

 

最为糟糕的情况是,男A和女B都很尊重对方意见反而各自去看对方想看的而自己不想看的电影,这时的整体满意程度只有4分。

 

很明显的,尽管情侣博弈中的两个纳什均衡都是有效率的,但这个博弈的不确定性却导致低效率的情况可能发生。

 

当然,这对恋人约会看电影事先打个电话,商量好再约定看什么,这比双方不进行沟通而私自决断要好的多。比方说,情侣双方可以随便定个规则,如双方商议,在看电影的前一天猜硬币,谁猜中了就听从谁的意见。说到猜硬币,笔者偶然想到在历史上,曾经发生过堂堂一朝宰相,在录用官员时,竟然用抽签的方式去决定,这实在是荒谬透顶。

 

假如这对恋人都是非常较真的人,根本就不可能用猜硬币的方式,而是强行承诺,比如男A是个大男子主义者,直接告诉女B他是一定会选择战争片,完全不会去看艺术片。

 

如果这个女主角B是个柔顺的小女人,结果当然仍是达到纳什均衡:双方都去看战争片。女B用威胁的手段亦然。在这种情况下,情侣博弈可以用来描述合作企业之间的关系。企业双方偶尔像真正的情侣那样互相谦让一下也有好处。但是,在许多情况下,结果会体现强硬一方的先动优势,虽然双方都会得好处,但是,强硬地先行动的一方得益多一些。

 

问题是,如果男A是大男子主义者,女B是女权主义者,双方都威胁对方不会去选择去看对方喜好的电影。这样的结果将达到次优,也就说无法达到帕累托最优的纳什均衡局面。好心办坏事。

 

更糟糕的情况是,双方虽然在口头上严辞相对、威胁对方,但内心里反而是相互体谅对方,最后进行策略选择的时候反而都作出让步,各自选择了对方所爱看的电影。最终的结果很显然是效率最低的局面。

 

更进一步地分析这个问题,男女恋人任意一方在谈判(男女双方对片子选择的协商本质上就是一种讨价还价的谈判)中承诺要看什么电影。

 

这关键在于,其可信度取决于作出诺言的一方,是否能够证明:除了遵守承诺以外,其它的选择并不是更痛苦。比如说,女B能够向她男朋友A证明:即使她一个人独自欣赏艺术片,也能津津有味地享受电影的乐趣,获得极大的满足感。这个时候,女B所作的一定要看艺术片的承诺就是可信的。

 

但是,假设男A正在追求女B,男A对女B的依赖性就会增强,他要考虑如何让女B开心来获得她的欢心。反过来说,男A向女B提出要求的能力自然就下降了。

 

生活当中就是这样的道理,“吃别人的嘴短,拿别人的手短”。不同的人在一起合作时,有求于对方的人,在讨价还价的谈判中,一定是处于劣势的。

 

先发优势与后发优势

 

有一天,上面故事中的这对恋人的女B过生日,两人庆祝生日不是去看电影,而是跑去切蛋糕了。那么怎样才能保证分配的公平合理呢?

 

最简单的一个方法,就是一方将蛋糕一切两半,另一方则选择自己分得哪一块蛋糕。不妨假设切蛋糕这种累活分配给男A,女B则在两块蛋糕中选择一块。

 

很显然,男A在这种切冰淇淋蛋糕的规则下一定是努力让两块蛋糕切得尽量相同大小。这就是著名的最后通牒博弈(Ultimatum games)。然而在现实中,谁都不可能将两块蛋糕切得完全一样大。就算使用高精密仪器去测量,使用高精密刀具去切割,这样做的成本太高,实在是得不偿失。

 

当然,在实际中,总是女士优先,男士礼让,不管谁去切,女士分得的蛋糕一定是比较大的那一块。如果这位女士还要保持身材,坚持减肥,最后吃到肚中最多的还是男士。

 

然而,如果两人都是斤斤计较、毫不体谅对方的人,他们都不愿意先去切这块蛋糕,于是又有了另一种分配蛋糕的规则。不妨假设蛋糕总量为1,男A和女B各自同时报出自己希望得到的蛋糕的份额,如4/5,8/9。他们之间约定,两人所报出的份额相加总和必须等于1,否则从新分配。

 

从数学上可以得到,这个两人博弈的纳什均衡点会有无数个,只要两人所报出份额相加之和为1的组合都是均衡结局,比如男A报1/2,女B报1/2;男A报2/3,女B报1/3,依此类推。

 

这里的问题在于如果女B报8/9,男A报1/9。这个时候男A也只有接收这个条件,因为这是一次性博弈,如果男A不接收那么双方连一丁点的蛋糕都分不到,从理性人的角度来看这显然不会出现的。

 

在实际生活中,除了绝对的利他主义者,或者带有其它目的的博弈参与者,显然8/9的蛋糕归某一参与者,剩余的部分仅仅1/9的蛋糕留给另一参与者的情况是很难发生。就这个例子来看,男A一定不满足于只能分到1/9的蛋糕,他一定要求再次分配。这种情况下,分蛋糕的博弈就不再是一次性博弈。

 

事实上,当分蛋糕博弈成为一个动态博弈时,这就形成一个讨价还价博弈的基本模型。在经济生活中,不管是小到日常的商品买卖还是大到国际贸易乃至重大政治谈判,都存在着讨价还价的问题。

 

比如中国加入WTO的时候,为了国家或民族利益与许多发达国家的讨价还价,进行了漫长而又艰难的谈判。一个谈判的过程实际上就是很多讨价还价的过程组成的。

 

比如发达国家首先对中国提出一个要求,中国决定是接受还是不接受,假如中国不接受,可以提出一个相反的建议,或者等待发达国家从新调整自己的要求。这样双方相继行动,轮流提出谈判要求,形成了一个多阶段的动态博弈。

 

我们来看这样一个故事。在某个朝代有个破落贵族的后代A,穷困得实在没有办法过下去,不得不将家中祖传的古字画拿到一个大财主B家去卖。这副字画在A看来至少值200两银子,财主B认为这副字画最多只值300两银子。

 

这样看来,如果顺利成交,字画的成交价格将在200~300两银子之间。这个交易的过程不妨简化为这样:首先由B开价,A选择成交或还价。这个时候,如果B同意A的还价,交易顺利结束;如果B不接受,则交易结束,买卖没有做成。这是一个很简单的两阶段动态博弈的问题。

 

我们应该解决动态博弈问题的倒推法原理来分析这个讨价还价的过程。首先看第二轮也就是最后一轮的博弈,只要A的还价不超过300两银子,B都会选择接受还价条件。

 

回过头来,我们再来看第一轮的博弈情况,A拒绝由B开出的任何低于300两银子的价格,这是很显然的,比如B开价290两银子购买字画,A在这一轮同意的话,只能卖得290两;如果A不接受这个价格反而在第二轮博弈提高到299两银子时,B仍然会购买此副字画。两项比较,显然A会还价。

 

细心的读者可以发现,这个例子中的财主B先开价,破落贵族A后还价,结果卖方A可以获得最大收益,这正是一种后出价的“后发优势”。这一优势在这个例子中相当是分蛋糕动态博弈中最后提出条件的人几乎霸占整块蛋糕。

 

事实上,如果财主B懂得博弈论:他可以改变策略,要么后出价,要么是先出价,但是不允许A讨价还价。如果一次性出价,A不答应,就坚决不会再继续谈判,来购买A的字画。这个时候,只要B的出价略高于200两银子,A一定会将字画卖于B。因为200两银子已经超出了A的心理价位,一旦不成交,那一文钱也拿不到,只能继续受冻挨饿。

 

在博弈理论中已经证明出,当谈判的多阶段博弈是单数阶段时,先开价者具有“先发优势”。它是双数阶段时,后开价者具有“后发优势”。

 

这在我们的生活中是非常常见的现象:非常急切想买到物品的消费者,往往要以较高的价格,购得所需之物;急于销售产品的业务员,往往也是以较低的价格,卖出自己所销售的商品。

 

正是这样,富有购物经验的人买东西、逛商场时总是不紧不慢,即使内心非常想得到某种物品都不会在商场销售员面前表现出来。而富有销售经验的店员们,总是会用“这件衣服卖得很好,这是最后一件”这样的陈词滥调,来让没有经验的顾客来不及讨价还价就迅速购买。

 

谈判的要诀

 

在生活中,恋人之间看战争片还是艺术片的谈判所耗费的时间,是一种成本。同时,恋人之间的争执,对双方心理的伤害也是巨大的。这些都是成本,它们往往远高于交易所带来的收益。

 

很多时候,夫妻之间的感情破裂、情侣之间的不欢而散,就是因为这种鸡毛蒜皮的小事无法达成妥协造成的。如果是情侣分手还好办,拍拍屁股就可以走人。然而,如果是夫妻离婚,随之而来的便是财产分割、小孩抚养等问题、这还会引起旷日持久的讨价还价过程,需要耗费更多 成本。

 

这也就是说,任何讨价还价的过程,都不可能无限制地进行。因为,讨价还价的过程总是需要成本的。在经济学上,这种成本称之为交易成本。

 

为了能够简单地说明这个问题,假设男女恋人不是分配一般的奶油蛋糕,而是冰淇淋蛋糕。冰淇淋蛋糕,会随着男女恋人之间的讨价还价过程而融化。不妨仅简单地认为:被融化的那部分蛋糕,就是这个讨价还价过程的交易成本。

 

这时,讨价还价的过程和买卖古字画的过程相同:女士优先,第一轮由女B提出要求,男A接受条件则谈判成功,若男A不接收条件进入第二轮;第二轮由男A提出分蛋糕的条件,女B接受则谈判成功,女B不接受,于是蛋糕融化,谈判失败。

 

对于女B来说,刚开始提出的要求非常重要。如果她所提的条件,其男友完全不能接受的话,蛋糕就会融化一半,即使第二轮谈判成功了,也有可能还不如第一轮降低条件来得收益大。

 

因此女B第一轮提出要求要考虑两点,首先要考虑是否可以阻止谈判进入第二阶段,其次,考虑她自己的男朋友是如何考虑这个问题的。

 

首先看最后一轮,蛋糕在第二阶段只有原先的1/2的大小,因此,女B在第二阶段即使谈判成功,也不只得到1/2蛋糕,而谈判失败则什么都得不到。

 

从最后一轮再反推到第一轮,男A知道女B在第二轮时所能得到的蛋糕最多为1/2,,因此当女B在第一轮时只要占据的蛋糕大于1/2,他都可以表示反对将这个谈判延续到第二轮。

 

女B对男A的如意算盘都很清楚,经过再三考虑,她在第一阶段的初始要求一定不会超过1/2的蛋糕大小。因此女方B在初始要求得到1/2个蛋糕时该谈判顺利结束,这个讨价还价的结果则是男女恋人双方各吃一半大小的蛋糕。

 

这种具有成本的博弈最明显的特征就是谈判者整体来说应该尽量缩短谈判的过程,减少耗费的成本。就分冰淇淋蛋糕谈判来看,就是尽量不让蛋糕融化太多。

 

我们再来看看当谈判有三个阶段时是什么样的结果。为了便于论述,不妨假设这个时候,蛋糕每过一个讨价还价的轮次就融化1/3大小,到最后一轮结束时由于过了两个谈判的阶段,蛋糕全部融化。

 

动态博弈一般都是采用倒推法。从最后一个阶段看,即使谈判成功,女B最多只能得到剩下的1/3个蛋糕。男A知道这一点,因此在第二阶段轮到自己提要求时要求两人平分第一轮剩下的2/3个蛋糕。

 

女B在第一轮时就知道男A第二轮的想法,于是在第一阶段刚开始提要求时,直接答应给男A蛋糕的1/3大小。

 

男A知道即使不同这个条件,进入第二轮也一样是最多得到1/3个蛋糕,到了第三轮几乎就分不到蛋糕,因此男A一定会接受这个初始条件。

 

这个三阶段的分蛋糕谈判最终的结果是男A分得1/3的蛋糕,女B分得2/3个蛋糕。

 

从数学上可以严格证明:只要博弈阶段是双数时,双方分得的蛋糕将会是一样大小;博弈阶段是单数时,后提要求的人所得到的收益一定会好于先提出要求的人,然而随着阶段数的增加,双方收益之间的差距会越来越小,每个人分得的蛋糕将越来越接近于一半。

 

如此看来,对于任何实际的谈判,谈判者要注意:

 

1.采取后发制人的方法,根据对方的行动来行动;

 

2.尽量摸清对方的底牌,了解对方的心理,根据对方的想法来制订自己的谈判策略;

 

3.谈判需要耐性,谈判者中能够忍耐的一方将获得利益,这一点凭借直觉可以判断,越是急于结束谈判的人将会越早让步妥协,或作出越大的让步,在前面分冰淇淋蛋糕的博弈中,如果考虑每一方谈判时间的价值,就可以在数学上严格地证明这一直觉的合理性。

 

总而言之,谈判是一种像跳舞一样的艺术。这种艺术的成功并不是消灭冲突,而是如何有效地解决冲突。因为我们不可能生活在一个没有冲突的世界里。

 

 理性、最后通牒游戏与独裁者博弈

 

如果有一天,你撞上大运,居然有人白送你1万块钱,条件是你与另一个陌生人分享这笔钱。规则很严格:你们两人分别在不同的房间,无法互相交流,通过掷硬币来选择谁有权分配这笔钱。假设你被选中,你(分配者)可以决定如何分配这笔钱,而另一个人(应答者)可以表示同意或拒绝。那人也知道上述规则和钱的总额。如果他表示同意,那么交易成功;如果他拒绝 ,那么你们两人谁也拿不到一分钱。无论出现那种情况,游戏都算结束,而且不再重复。

 

你会怎么做呢?

 

凭直觉,许多人都一位应该对半分,因为这种分法很“公平”,也容易被接受。然而,胆大一点的人认为他们可以送给对方不足一半的数额,而照样完成交易。

 

在做决定之前,你应该扪心自问一下:如果你是应答者,你会怎么做呢?

 

作为应答者,你唯一能做的是,对给定数额的钱表示同意或拒绝。如果那人给你1%,你愿意拿着10块钱,而让那人带着9990块钱溜之大吉吗?或者你宁可什么都不要?如果那人只给你0.1%,你又会怎么做呢?1块钱难道不比什么都没有好吗?

 

在这里,讨价还价是严格禁止的。提议者只能提供一种选择,而应答者或者同意,或者拒绝。

 

那么,你将给对方多少呢?

 

那个分配者会猜测你的反应,此时他最理性的方案是留给你一点点比如1分钱,而自己得9999.99块钱。你接收了能得到1分钱,如果拒绝什么都得不到。这是根据理性人的假定的结果,然而实际却不是这个结果。

 

研究表明,有2/3的人开价在40~50%,只有4%的人开价不足20%。开出如此低的数额要冒一定风险,因为很可能被对方拒绝。在所有的应答者中,有超过半数的人对不足20%的开价予以拒绝。

 

上述游戏被称为“最后通牒游戏”。最后通牒游戏是由柏林洪堡大学古斯教授(Werner Guth)在大约20多年前发明的。

 

然而,这里存在一个令人困惑的问题,为什么任何人都可以以“太少”为由而加以拒绝呢?

 

我们都知道,博弈论隐含了这么一个前提条件:首先博弈双方都是完全追求收益最大化的理性人。然而在最后通牒游戏的实验中,博弈论“理性人”的假定与实际完全不符。

 

根据美国学者的比较文化研究,结果表明:不管是在亚马逊流域的原始部落,还是在西方发达国家,试验结果总是与基于人的自私性的理性分析大相径庭。与追求收益最大化的自私行为形成鲜明对比的是,全世界绝大多数人都崇尚公正的结果。

 

博弈论中另一个必不可少的前提是博弈双方都是处于均等且相同的地位。然而在实际生活中,参与博弈的双方不可能绝对的平等。

 

比如,正常的恋人之间往往是女方先吃蛋糕,吃不下了才将剩下的蛋糕留给男方,这才像对如漆似胶、爱意浓浓的恋人。即使是在菜市场买菜,不同人的讨价还价心态也不同,经济困难的人常常会与小贩一而再、再而三的讨价还价,而富人则山珍野味,一掷千金不在话下。

 

对于国内的劳动力市场来说,由于人力过剩,雇员对老板的谈判地位明显是处于劣势。老板可以出这样一个价格:与雇员的贡献相比明显偏低,但是比他在别处可能得到的工资略微多一点点。

 

此时,雇员将面临这样一个处境:自己得到的报酬低于自己的贡献,但如果不接受这个价格,则得到的将更少,甚至什么都得不到。从博弈角度讲,虽然这个价格并不公平,但此时最明智的选择还是接受这个价格。

 

所以,就像在零和博弈的股市中庄家照样可以利用散户的弱点获利一样,仅仅博弈地位的不平等已经足以让老板得到一个有利的价格了。取得这个价格用不着特殊的博弈技巧,因为这是博弈地位本身提供的。

 

像在物理学研究中,假设物体运动都是真空中,不考虑摩擦力。我们也来抽象出一个严格假想的情况。对最后通牒游戏进行修改,取消应答者对分配者所提要求的否决权,那么,这个分配者就可以被叫作“独裁者”。这种严格不平等条件下的谈判博弈被称为“独裁者博弈”(Dictator games)。

 

设想,一个独裁者与一个无权者之间分配一笔固定资产。讨价还价只能进行有限次,最后一次博弈的决定者理所当然是独裁者。

 

按照理性人假设,自私自利的独裁者一定是独吞这笔财富。然而,从历史上来看,大部分的当政者并不会这么做。实际上,这个博弈的独裁者并不仅仅只是考虑资产多少,他还要考虑名誉、地位与统治的稳固与否。

 

如果将这些因素都考虑成收益,从广义上来说,这样的独裁者仍然是理性的。可见,对于平民来说,收益可能仅是资产分得多少,而对于当政者来说,资产并不是其全部的收益。反过来说,仅仅考虑自身经济收益的当政者反而是非理性的人。

 

令人感到遗憾的是,古往今来无数的统治者都因短视、贪婪而遭到灭顶之灾。历史上有名的昏君明万历皇帝就是这样一个不理性的人。他贪财好货,为了搜刮钱财,从万历24年(1596年)起就向全国增派了许多“税监”、“矿盐”,这些人横行霸道、鱼肉民间,影响极坏,这动摇了大明王朝的基业。短视的万历皇帝始终认识不到“普天之下,莫非王土”,财货并非是他唯一应该考虑的收益。万历死后不过短短24年,明朝便在农民起义军的熊熊烈火与外族侵扰的双重压力之下土崩瓦解。

 

第五部分

 

很多人都认为:在计划经济时代,企业员工缺乏激励,偷工减料,效率低下,因为都是吃大锅饭没有足够的动力;而在市场经济下,企业有赚取利润的驱动力,自然企业都会努力降低成本,提高效率以赚得更多的利润。

 

 管理需要建立预期

 

很多人都认为:在计划经济时代,企业员工缺乏激励,偷工减料,效率低下,因为都是吃大锅饭没有足够的动力;而在市场经济下,企业有赚取利润的驱动力,自然企业都会努力降低成本,提高效率以赚得更多的利润。

 

实际上,即使在市场经济体制下,企业员工也并不都是个个勤奋,人人努力。一般的企业领导人采用的不过是古已有之的胡萝卜加大棒的方法来统驭下属。

 

管理学家孔兹(Harold Koontz)对领导的界定是:“领导可定义为影响力。它是影响他人,并使他们愿意为达成群体目标而努力的一种艺术或方法。这种观念可以更扩大到不仅是使他们愿意工作,同时也愿意热诚而有自信地工作。”

 

其中最关键的理念是“影响他人使他们愿意为达成群体目标而努力”。管理者为了对组织的目的负责,达成企业“群体目标”,必然用一种艺术或方法去影响被领导者,使之愿意工作,甚至是热情而自信地工作。

 

对于下属来说,管理者的信用、权威必须要通过管理者长时间发给下属的各种信号与相互之间的良好交流才能达到。比如一个民营企业的老总若要建立起良好的名誉,必须乐意给下属高出劳动力市场上一般的福利待遇,让下属认识到企业对员工的关心与认可。

 

权威本身也要具有伟大的人格,优良的品质和出众的才能。权威并不是脱离群众的,他也要采纳群众的意见。只有部属能尊重上司的权威,而上司也能采纳部属意见的公司,一切才可以顺利推动。

 

管理者与员工交流能够大大提高领导者建立信誉的能力。如果员工发现分享管理者的私人信息和代价很高的努力是值得而理性的,这种信任就是必不可少的。管理者若无法得到员工的尊敬,上下级之间就会相互猜疑,信息沟通极少。用于尊敬员工以及敢于谈论他们自身缺点的领导者将赢得下属的尊重。一旦员工信任并尊敬一个管理者,真正的进步就成为可能。

 

管理者应该能够帮助员工建立对未来的预期。对未来的预期,是影响员工行为的重要因素。预期分为预期收益和风险,也就是员工这样做将来会有什么好处,同时这样做又可能面临的问题。这些将影响员工个人的策略,如员工是否会将精力真正的投入到企业的成长中。

 

来看这样一个有趣的故事。

 

一只绰号叫“天下无敌”的猫把老鼠打得溃不成军,最后老鼠几乎销声匿迹。残存下来的几只老鼠躲在洞里不敢出来,几乎快要饿死。“天下无敌”在这帮悲惨的老鼠看来,根本不是猫,而是一个恶魔。但是这位猫先生有个爱好:喜欢向异性献殷勤。

 

有一天,这只猫爬得又高又远去寻找相好。就在它和相好癫狂时,那些残存的老鼠来到了一个角落里,就当前的迫切问题召开了一个紧急会议。

 

一只十分小心谨慎的老鼠担任会议主席,一开始它就建议必须尽快地在这只猫的脖子上系上一只铃铛。这样,当这只猫进攻时,铃声就可以报警,大伙儿就可以逃到地下躲藏起来。会议主席只有这么个主意,大伙儿也就同意了它的建议,因为它们都觉得再没有比这个更好的建议了。

 

但问题是怎样把铃铛系上去。没有哪只老鼠愿意去栓这个铃铛。到了最后,大伙儿就散了,什么也没做成。看来,给猫系上铃铛无疑是一个绝妙的主意,但对于一群已经被吓破胆的老鼠来说,这个主意意味着只是无法实施的美好梦想而已。

 

在企业中,也是同样的道理。

 

对于一个管理者来说,应该本着务实的精神,制定切实可行的计划,让他的团队有一个可以实现的目标,而不是作出一个不可能实现的决定,同时管理者要对这个目标作出承诺。在承诺的同时,上级下之间要能够相互沟通,建立一个交流网络来寻求共同的价值观与信念。必不可少地,管理者能够以身作则,以自己的个人行为作为员工学习的典范。

 

许多公司现在也开始在一些社会议题上彼此互相合作,同时也透过一些公有与私有合伙关系的重组,以及制作各种保护环境,改善教育水准,发展提升医疗保健等计划,来回馈社会。在这里,就有许多机会,可以吸引各行各业以及各层面的优秀分子的注意。

 

通过领导者自己与下属之间的“互动过程”,有效地协调了子系统之间的竞争与合作关系。这树立了领导权威,促进了系统的有序化。现代领导的本质正在于此。显然这种领导权威不是领导者个人素质的单独结果,而是领导者与下属双方相互作用的结果。

 

在中国企业发展的进程中,管理者更应该从博弈论中学习到发挥更大作用的方法与技巧。当然,由于职业化管理的条件不成熟,领导者惟我独尊的传统管理还将持续相当长的时间。

 

强强之间如何有效联合?

一个企业按照系统论的说法,是一个开放耗散结构系统,与外部环境不断发生联系与交换。企业总是要在外部环境中,寻找供应商采购,寻找销售商销售,寻找合适人选招聘,以及与其它企业进行合作等。

 

在企业合作推出品牌的例子中,最典型的莫过于英美烟草(香港)有限公司与芜湖卷烟厂的合作。1990年4月,由安徽省烟草专卖局(公司)大力推荐,国家烟草专 卖局(总公司)出面牵线搭桥,两个公司开始了合作了历程。1991年,双方合作生产的“都宝”牌卷烟非常顺利地占领了首都市场,成为北京的畅销品牌,并远销内蒙古、河北等18个省市自治区。

 

一般来说,两家企业达成合作协议,推出双方共同拥有的新品牌,就意味着在很大程度上,合作双方开始相互依赖。没有任何一方可以在不牺牲自身利益的情况下回到原来独立经营的轨道上去。芜湖烟厂与英美烟草合作的都宝就是这样,如果其中有一方放弃合作,希望从对方身上榨取好处,整个合作的进程就会中断,造成许多不必要的损失。

 

我们不妨认为,英美烟草公司的技术水平要高于芜湖烟草,而芜湖烟草本土化的营销手段与网络则是英美烟草所缺乏的。因此,英美烟草与芜湖烟草之间的合作主要是英美烟草提供技术,而芜湖烟草开发市场。

 

设想英美烟草支持芜湖烟草的技术开发分为低技术开发与高技术开发两种,技术开发成本分别为9000万人民币与1.5亿人民币;芜湖烟草上新生产线的投入也分为低投入与高投入两种,开发成本分别为1.8亿人民币与3.0亿人民币。因此,我们可以得到双方合作的总成本有四种可能,见上图。

 

不妨双方合作都预期到,都宝香烟的市场利润在一年内可以达到3.9亿人民币的利润。双方都以一年内收回成本为目标,但赚取多少钱并不在考虑之列,主要是试探性地进行这个项目。很显然,芜湖烟草高投入上生产线,英美烟草采用高技术投入,此时的总成本达到4.5亿,明显一年内这个合作项目的成本无法收回。

 

我们不妨假定合作双方采用两种策略的概率都是1/2,由此,双方总成本为3.3亿、2.7亿、4.5亿和3.9亿的概率都是1/4。那么,双方总成本的期望值为(3.3亿+2.7亿+4.5亿+3.9亿)×1/4=3.6亿元,因此双方的预计利润为3.9亿-3.6亿=0.3亿元。

 

那么在英美烟草与芜湖烟草进行合作协商的时候,就要考虑到项目启动成本是否高于0.3亿元。这个例子中的项目启动成本包括双方谈判成本、人员培训成本、沟通成本等。如果项目启动的初期投资超过3000万,双方就没有合作的可能性,项目自然被否定掉。

 

在企业的实际合作中,最大的困难并不是作出这样的预期,关键在于每个企业是否真实地提供自己所负担的投入成本。比如这个例子中,英美烟草可以将其技术开发成本报为最高的2.5亿元,芜湖烟草报为最高的3.0亿。这种情况下,很明显合作双方的项目第一年的目标无法达到,更谈不上弥补先期的项目启动成本。自然,项目只会泡汤,双方无法达成合作。

 

看来让两个公司有效地合作一个项目,并不是一个简单的事情。我们不妨采取这样一种策略:加入芜湖烟草决定将合作项目继续下去,它必须要补偿英美烟草的成本,然后保有余下的利润。无论双方的成本总和是不是低于利润目标,芜湖烟草都将决定继续下去,它的收入为总收入减去自身上新生产线的成本,再减去对英美烟草的补偿之后的剩余。

 

双方不妨同时宣布自己投入的成本,并且在总成本低于利润目标的前提下,项目才能进行下去。对于芜湖烟草来说,补偿英美烟草成本的剩余利润必须要高于它实际付出的成本,它才能继续这个项目。由此看来,芜湖烟草最好的作法就是报出真实的投入成本。如果芜湖烟草所报的是虚假数字,很有可能这个项目就无法进行,芜湖烟草就失去了一个赚钱与技术更新的好机会。因此,芜湖烟草报出真实成本是一个优势策略。

 

同理,这种激励机制当然也可以用在英美烟草身上,报出真实成本自然也是英美烟草的一个优势策略。

 

然而,这种方法的局限在于,不管用在哪一方身上,都只能保证其中一方报出的是真实成本,无法约束另一方也是说真话。为了让双方都能够真实报出真实成本,在设计合作协议的时候是最重要。

 

这份协议要能够激励两家公司都报出真实成本,还要有确保有效继续项目或取消的决策。能够让大家精诚团结的协议,就是要使公司将它们通过自身行动加在对方身上的成本考虑进去。比如在这个例子中,一旦公司夸大自己的成本,项目不得不取消,反而自己所获收益减少。

 

奖罚分明的博弈原理

 

兵法上说,“用赏贵信,用刑贵正。”从我国企业的实践来看,对员工的管理激励与约束机制还没有很好地建立起来。

 

如在一些企业中,不仅缺乏有效的培育人才、利用人才、吸引人才的机制,还缺乏合理的劳动用工制度、工资制度、福利制度和对员工有效的管理激励与约束措施。当企业发展顺利时,首先考虑的是资金投入、技术引进;当企业发展不顺利时,首先考虑的 则是裁员和职工下岗,而不是想着如何开发市场以及激励职工去创新产品、改进质量与服务。

 

那究竟采用什么样的激励制度才能够有效驱动员工呢?

 

我们不妨先从一个案例入手,设想有一家游戏软件企业老总,打算开发一种新的网络游戏,不妨叫做“大话水浒”。如果开发成功的话,根据市场部的预测将得到2000万人民币的销售收入。如果开发失败,那将是血本无归。

 

根据经验,企业新网络游戏的成功与否,关键在于技术研发部员工是否全力以赴、殚精竭虑来做这项开发工作。如果研发部员工完全投入工作,有80%的可能,这款游戏的市场价值将达到市场部所预测的程度;如果研发部员工只是敷衍了事,那么游戏成功的可能性只有60%。

 

研发部全体员工在这个项目上所获得的报酬如果仅有500万元,那么这些员工对于这款游戏的激励不够,他们都是得过且过,敷衍了事。老板要想让这些员工得到高质量的工作表现,就必须要给所有员工700万元的酬金。

 

这样的话,如果老板仅付500万总酬金,那么市场销售的期望值有2000万×60%=1200万元,再减去500万的固定酬金,老板的期望利润有700万元。如果老板肯出700万的总酬金,则市场销售的期望值有2000万×80%=1600万元,再减去总酬金700万,老板最终的期望利润有900万元的剩余。

 

然而困难在于,对于研发部的员工,老板很难从表面了解到这些员工在进行工作时到底有没有敬忠职守,兢兢业业地完成任务。即使给了全体员工700万的高酬金,研发部员工也未必就尽心尽力地完成这款游戏。由此看来,一个良好的奖罚激励机制对于企业极其重要。

 

公司最好的方式就是:若是游戏市场反映良好,员工报酬提高,若是不佳,则员工报酬缩减。“禄重则义士轻死”,如果市场部目标达到,则付给全体研发人员900万元;若是失败,则让全体研发员工付给企业100万元的罚金。

 

这种情况下,员工酬金的期望值是900万×80%-100万×20%=700万元,其中900万元是成功的酬金,成功的概率为80%,1万元则是不成功的罚金,不成功的概率为20%。在理论上,采用这样的激励方法会大大提高员工工作的努力程度。

 

从某种意义上来说,这种激励方法相当于赠送1/2的股份给企业研发部员工,同时员工也承担项目失败的风险。

 

然而这种方法在实际中并不可行,因为不可能有任何一家企业能够通过罚金的方式来让员工承担市场失败风险。

 

可行的方法就是,尽量让企业奖惩制度接近于这种理想状态。更加有效的方法,就是在本质上类同于奖励罚金制度的员工持股计划。如果将股份中的一半赠送给研发部的全体员工,其结果仍然是和罚金制度是相同的。

 

通过这个例子,我们可以看到,员工工作努力与否与良好的激励机制密不可分。遗憾地是,我们现实中的很多公司却不明白这个道理。

 

比如很多公司的奖惩制度上写着:“所有员工应按时上班,迟到一次扣10元,若迟到30分钟以上,则按旷工处理扣50元。”国外有弹性工作制,即不强求准时,但是每天都必须有效地完成当天工作。

 

笔者认为,即使有人迟到、早退、被扣除工资,但是在实际工作中很有可能并不是努力工作,其因扣除工资而产生的逆反心理导致的隐性罢工成本反而有可能高于所扣除的工资。从表面上看,老板似乎赚得了所扣工资的钱,实际上是损失更多。可见,这并不是一个有效的奖罚激励制度。

 

再比如有的公司规章条例写着:“公司所有员工应具有主人翁意识,应大胆向公司领导提出合理化的建议,可以直接提出也可以以书面形式提出,若被采纳后奖励50元。”

 

试问,不同的合理化建议对公司所创造的效益是不同,假设一个人所提建议可以提高效益5万元,另一个人所提建议则只能提高效益500元,都用50元的奖金来进行物质激励,其条例本身明显就不是合理化的制度。

 

总而言之,一个良好的奖惩制度首先要选择好对象,其次要能够建立在员工相对表现基础之上的回报,简单的说,就是实际的业绩越好,奖励越高。只有这样的奖罚分明的制度才能够对员工创造出合适的激励。

 

如何争取到一个项目?

 

很多项目,尤其是建筑工程的项目,都是采用公开投标的方式来寻找合适的公司的。随着我国政府办公公开化、透明化进程的不断加快,政府项目公开招投标方式的应用也会越来越广泛。

 

在招投标中,最常见的是片面的、无标底的“最低价中标”。项目招投标可以通过竞争性的公开一次性报价,选择报价最低者中标,以达到降低投资的目的。

 

这种方法有很大的优点。有这样一个称为“旅行者困境”的故事就说明其优点所在。

 

话说有两个旅行者A和B从一个以出产瓷器的著名旅游胜地回来时,他们各买了一个瓷花瓶。提取行李时,发现花瓶被碰破了。他们向航空公司索赔。

 

航空公司估计花瓶的价格在80~90元左右,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。

 

如果两人都写100元,他们都会获得100元。但是,给定B写100元,A改写99元,则他会获得101元。B又想,若A写99元,他自己写98元,比写100元好,因为这样他获100元,而写100元当A写99元时自己却只获97元。而给定B写98元,A又会写97元……这样,最后落得两个人只写1元的境地。

 

读者如果有兴趣可以做一个实验:选定几个人,让他们都猜一个数字,必须是1或100之间的整数。条件是谁最接近所有实验者的所猜数字平均值的1/3,谁就可以得到100块钱。

 

这个时候,每一个人都会想:如果一开始其他人都是随机地选择数字,50就会是所有人的猜测。这个时候,猜50的1/3也就是大约17可能会赢。然而,每一个人都会猜到17这个数字的时候,大家就会猜测17的1/3,也就是6左右。依此类推,这个游戏中的每一个人最终猜测的结果是唯一最小的数字,那就是1。

 

这个游戏可以直观地反映出“旅行者博弈”的道理。

 

然而,这种博弈只是一种理想假设的状况,实际的企业招投标往往都有一个成本底线。

 

比如现在有一个政府项目,是公开招标选择网络公司建立政府网,某公司是投标者之一。对于这个公司来说,根据过去的经验能够预算出接手这个项目的真实成本是100万人民币,然而这个公司并不了解其它竞争对手的真实成本。

 

该公司根据市场行情推断,其他公司的真实成本在50万~150万元之间。从概率的角度去看,在50万~150万之间的任何一个价格都有可能是最终的胜利者。我们简化这个问题,假设每个公司的成本只能是50~60万、60~70万……120~130万、130~140万、140~150万这样的整数,总共有10种可能,因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率是1/10。

 

如果这个公司报价90万,很显然,公司即使胜出,仍然要亏本10万元,看来100万的报价是底线,低于这个价格的报价对于该公司毫无意义。当然这只是这一机制的理想状况。实际当中,如果价格低于成本,破坏了市场均衡,毫无疑问会影响项目质量,不但损害中标者利益,最终还会损害招标政府自身利益。

 

自然从理论上说,该公司投标报价一定要高于100万元,不妨假设报价120万,根据这10种价格的概率,其他公司报价低于120万该公司惜败的概率是3/5,即使开价100万,该公司不能中标的概率也有2/5。当然开价120万胜出时可以赚取20万利润,而开价100万时即使胜出也仅仅是能够弥补成本而已。

 

由此可见,开出一个较高的价码是该公司的优势策略。每一个投标公司都这么考虑的话,所有公司的报价都会高于实际成本,结果就是所有的开价都被人为抬高。

 

怎样才能让公司投标报价接近于真实成本呢?

 

问题的关键在于采用某种激励机制来驱动投标者不说谎。如有这样一种激励方式,就是将合同判给开价最低者,但是却让他付开价第二低者的价格。

 

这个时候该公司如果开出的还是120万的报价并且是第二低的价码,而另一家公司开出的价格比这个公司要低,比如是低于该公司成本价的90万元,该公司最终的价格120万反而成了这个胜出公司的最终项目价码。在这种招投标方式下,任何一个公司的优势策略就是开出一个接近其真实项目成本的价格。

 

按照博弈论的观点具体分析招投标行为我们还可以发现:就像博弈的参加者独立决策、独立承担后果那样,投标各方也如同分别隔离审问,不准串供,他们相当于处在“两难困境”中的“囚徒”,各家只能依据自身实力、期望利润和所掌握的市场信息,自主报价,独自承担风险。

 

不难看出,机制设计的关键是如何让每个公司的报价有利于集体选择,并最终达到“纳什均衡”。这里其实靠的是两个制度安排:

 

1.阻止公司之间的合作;

 

2.制订了一套“坦白从宽,抗拒从严”的赏罚规则。

 

由此可见,在招投标的机制设计中,通过博弈竞争使中标价接近成本价,达到均衡合理,为招标人节约投资,提高经济效益。通过优胜劣汰,使市场竞争力低下的投标人无力参与竞争而退出市场,让有实力的投标人脱颖而出,使资源达到均衡配置,市场秩序得以规范。

 

民主的悲剧:非排序式投票

 

人类社会一经出现便存在着社会选择的问题,如重要职位的人员选拔、各种政策的制订甚至是国家政治体制的确定等。

 

一般来说,社会选择的方式则又有两种,那就是投票制度与市场经济。

 

投票制度往往用于政治决策,市场机制毋庸多言即用于经济决策。在德国、法国以及北欧诸 国,投票制度使用范围极其广泛,常常直接或间接地通过投票作决策而较少采用市场机制,难怪人们将之称为社会市场经济国家或福利国家。

 

实际上,市场机制是投票的一种特殊形式,市场机制中人们手中的选票就是货币。

 

原始社会时,部落内部的重大事务,如各个部落的酋长、部落联盟之间的首领,都是通过投票表决的方式完成的。马克思称这种社会形态为“原始共产主义”。可见,投票表决是一种古老的表达民意的制度。

 

蜚声全国的湖南卫视“超级女声”节目中,冠亚季军的产生是通过短信投票的形式评选出的。

 

新浪(www.sina.com)、搜狐(www.sohu.com)、天涯社区(www.tianyaclub.com)等国内知名网站经常会通过网络投票等形式就某一问题调查人们的意愿。

 

投票在当代,已经成为我们必不可少的生活方式之一。

 

投票制度最根本的思想是少数服从多数。或者说,通过投票制度,绝大多数人的意愿得以表达,当然这种思想得到贯彻的基础是投票者能够在不受到外界影响的情况下,确确实实地表达了自己真实意愿。

 

在这些前提条件下,投票的过程又分为投票和计票。投票涉及到所有投票者,有些时候比如政治选举,投票者人数太多,容易产生混乱局面,这就要求投票的过程应该尽量简捷快速。

 

计票和投票不同的是,其参与者是少数人,如公共管理的专家和政府公务员等。计票过程则要求计票人不能徇私舞弊,计票数据真实可靠。

 

一般来说,投票分为两种方法,非排序式投票与排序式投票。在2004年美国小布什与戈尔两人在最终的总统竞选中,采用的就是非排序方法的计点式选举,这种方法式有多个候选人参加选举,每个投票人只有一票,并且以无记名投票方式给自己喜好的总统候选人投上“神圣”的一票。这种方法的计票方式最简单的多数票法则,也就是获得票数较多的候选人当选。

 

当候选人的数目超过两个人时,这种方法就不可靠了,这时,往往采用两种方法:

 

1.得票最多的候选人获胜,这叫简单多数法则或相对多数法则,有的时候采用半数代表制时,候选人必须要获得1/2以上的选票才算胜出。

 

2.采用二次投票或反复投票表决等方法来产生获得半数选票的人选。二次投票法规定,在第一次投票后若无任何候选人获得半数选票,则应对在第一次投票中得票最多的两个候选人之间进行第二此投票,从中选出一位得票超过半数的获胜者。

 

反复投票表决法对每次投票表决中候选人的人数不做规定,而希望得票太少的候选人自动退出竞选,或由投票人因自己原先所支持的候选人得票太少,当选无望,转而支持其它得票较多的候选人。就这样,投票反复进行,直到产生某个得票超过半数的当选者为止。美国共和党和民主党选举总统、副总统候选人时就采用这种方法。

 

在北京申办2000年奥运会时,前几轮都是北京遥遥领先,但在最后以一票之差惜败于悉尼,当时所采用正是取舍表决法。这种方法规定在第一次投票后若无过半数者,就将得票最少者淘汰,对其余候选人则进入下一轮投票,如此继续不断直到产生过半数的候选人为止。

 

这种不具有投票人偏好排序的方法是有内在缺陷的。所谓偏好,就是说在现有苹果、香蕉、桔子,你喜欢吃哪一个,比如说有的人最喜欢吃香蕉,其次苹果,再次桔子,而有的人则是最爱吃苹果,其次桔子,再次香蕉。这就是他们的偏好不同。

 

我们来看一下中国申办2000年奥运会失败的例子。北京1992年开始大张旗鼓、志在必得地申请主办2000年奥运会。申办奥运会的投票规则是取舍表决法。前两轮投票中北京一直领先。经过两轮投票,最后剩下3家:德国的柏林、澳大利亚的悉尼以及中国的北京。在第三轮投票时,北京获得最多的票,悉尼第二,柏林第三。这一轮投票结束后,柏林被淘汰掉。

 

如果就这一次投票,北京就获胜。但问题是还得再投一次票。当在北京与悉尼之间角逐时,北京输了,悉尼获得了举办2000年奥运会的主办权。

 

之所以这样的原因就是原来支持柏林的投票人大多数转而支持悉尼。这就是悉尼获胜的原因。没有人敢说这是公平的投票方法,这种不公平的内在原因正是非排序的投票规则不反映投票者的偏好排序。

 

再比如,2000年台湾所谓“总统”选举的结果是民进党的陈水扁上台。当时,台湾第一大党国民党居然输给了弱小的民进党。

 

这次选举是汉贼李登辉“弃连保扁”阴谋得逞的结果。李登辉做国民党主席时,主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴,因为他的资历,他得到大批的国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头,成立了新党。国民党被李登辉肢解。

 

李登辉推出连战作为国民党的“总统”候选人,但是身为国民党主席却在不同场合下支持陈水扁,使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间角逐。

 

最后,陈水扁以微弱优势获胜,而宋楚瑜和连战均告失败。如果李登辉不耍“弃连保扁”的政治伎俩,或者维护国民党的统一而不使其分裂,使得国民党只有一人参加竞选,那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。

 

另外一种情况是,假如台湾选举不是直选,选举规则是先角逐出两个而不是多个候选人,然后再在这两个候选人之间进行竞选,会出现什么结果呢?

 

试想,如果陈水扁能顺利过第一关而成为两个候选人之一,而宋楚瑜、连战之中的任何一个人成为候选人,比如这个候选人是连战。这时,在连战与陈水扁之间的最后角逐中,支持宋楚瑜的选民这次会支持连战———因他们的政治主张相近,那么连战获胜的机会肯定大于陈水扁。但是事实上不是这样,选举中各候选人同时竞选,国民党因分裂而使陈水扁得以上台。

 

以上所说的都是投票选出一个人的情况,当投票要选出两人或多人的投票表决就不能应用简单多数原则。一般说来,有以下几种投票方法。

 

一次性非转移式投票表决方法,这种方法规定每个投票人只有一票,用无记名投票方式,按照简单多数法确定当选者。在日本议员选举中采用的方法就是这样,在若干个候选人中根据得票多少排序,选取其中的前几位当选。

 

复式投票表决,这种方法是:在选举中要产生多少当选者,每个投票人就可以投多少张票,但对每个投票人只能投一票。

 

但是这种方法有一个巨大缺陷,由于一个人有多张选票,选票具有了放大效应,就是在投票中,当各利益集团的实力相差不大,利益冲突却白热化时,很有可能所有当选者都集中于实力稍强一些的某个集团。

 

比如,在投票时,有两个利益集团,其中一个利益集团的派别可获得稍微超过50%的投票人,当选人就将全部选自这个集团。显而易见,这种投票方式的效率是不高的。为了克服这种方法的缺陷,又出现了受限制的投票表决方式。这种方法规定每个投票人可以投的票数必须小于当选人数。在1868年英国大选中,这种方法被实际应用,可惜的是最终却以失败而告终,该方法仅仅稍稍改进而无法从根本上克服复式投票方法的缺陷。

 

其实这些非排序的投票方法很容易被某些野心家所操纵,非排序投票的任何一个法则都不能保证人民当家作主的真正实现。

 

假设有一个由3000人组成的原始部落,对部落酋长候选人A和B进行选举,并假定进行一次性投票,此时有2/3的人反对A而选举B,1/3的人选A而不选B。我们完全由办法设计另一个制度,通过“民主”的投票规则使A能够当选。

 

假定大家都同意服从大多数原则,但程序可以商量。我们把这300人构成3组———这3组既可以天然地形成,也可以设计。每组中候选人获得该组的大多数选票,他就赢得这组的选举,3组中赢得2组即赢得大多数,就算赢了。

 

在实际中这些是任何候选人都能同意的,并且也认为是公平的。我们假定每组的人数不是一样的:第一组是50人,第二组是100人,第三组是150人———我们这里人数的确定完全是随意的。

 

假定第一组中有30人赞成A而反对B,第二组中有60人赞成A而反对B,第三组中10人赞成A而反对B。即:第一组A与B的比例是:30∶20;第二组A与B的比例是:60∶40;第三组A与B的比例是:10∶140。

 

在这样一种规则下进行投票,A获得了3组中2组的赞成票。A获胜。在这个例子中,如果不分组就选一次,那么B肯定获胜。这个例子中,使B获胜的是直选机制,使A获胜的是间接选举机制。台湾采取的是前者,美国采取的是后者。

 

除了上述的一些方法以外,非排序式投票制度还有其它很多原则,如北欧各国采用的名单制,著名的可转移式投票,笔者这里就不一一作出详细介绍了。

 

然而在这里,不得不提及18世纪的著名法国思想家孔多塞(M De Condoret)提出的孔多塞法则。他说,当存在2个以上的候选人时,只有一种办法能够严格真实地反映多数投票人的意愿,那就是对候选人进行成对比较,若存在某个候选人,他能够按过半数决策规则击败其它所有候选人,则他被称为孔多塞候选人,应该由该人胜出。

 

在后面,我们可以通过分析知道,孔多塞法则实际上也是有内在缺陷的。

 

 孔多塞投票法则、Borda法则及其他

 

所谓排序式的投票制度就是,在投票时不仅要让投票人表达最希望哪些人当选,还应当让投票者说明他给这些心目中合格的候选人进行排序。这就是,投票人通过投票表达出对各候选人的偏好次序。

 

孔多塞法则就是最早的排序式投票方法。理所当然地,在200多年前的那个时代,孔多塞提出的这个方法,是一种富有创造力的制度创新。然而时至今日,人们已经很清楚这 种方法的内在缺陷。

 

在博弈论名著《策略思维》中举过这样一个孔多塞法则的案例。这个例子以法国大革命为背景,当时的革命者们攻陷巴士底狱之后,要从三个候选人种选出一个新平民主义领导者,这三个候选人分别是罗伯斯庇尔(Robespierre)、丹东(Danton)和拉法日(Lafarge)夫人(后面我们不妨简称为R、D、L)。革命者们分为三个同等的集团,分别代表左派、中间派和右派,他们的偏好如下图。

 

若是R对D的选举,那么前者会以2:1的比分获胜;如果是L对R的选举,那么前者也会以2:1的比分获胜;如果是D对L的选举,那么前者仍然是2:1的比分获胜。

 

我们很清楚看到,三个候选人都是对等的。至于哪一个能够胜出,完全是看哪一场选举最后进行。从这个例子中,我们可以看到孔多塞法则下的选举也不并能够完全多数民意。

 

根据位置博弈的原理,不管哪个政党当选,其政策都是接近的,因而对于大多数中下层的民众来说,无论谁当选(不过像希特勒这样的国家社会主义者当选元首则是另当别论的特例。),日子还是照常地过,选举孰胜孰败意义并不大。

 

在公元前1世纪,罗马发生过这样一个真实的诉讼判决故事。

 

从古代罗马的法律传统来说,一般一个案件的结果有三种可供选择的结果,分别是:

 

1.根据现实状况,首先裁定无罪或有罪,若是有罪再考虑合适的惩罚。这种思路在现代美国就有很好的反映。美国人认为,人是平等的,因而,个人对个人的诉讼,公正就是意味着一个天平式的证据衡量。而政府对个人决不是平等的,必须严格对证据提出要求,以限制政府利用权势对个人权利的侵犯。因为他们认为,权势是靠不住的,警察是靠不住的,联邦调查局是靠不住的,司法部的检察官是靠不住的,他们的大总管美国总统和美国政府都是靠不住的。他们都需要有力量与之平衡,他们都需要制度予以制约。因此,美国人在对嫌疑犯的判决首先都是假想他没有罪,之后再用证据来一步一步证明这个人是否有罪;

 

2.根据罗马法体系,听取证词之后,从最严厉的惩罚开始,一路下寻找合适的惩罚。首先要考虑要不要判处死刑,加入不要,考虑要不要判处终身监禁。依此类推,如果没有一种刑罚合适,那么该名被告就将无罪释放;

 

3.强制性确定该被告的所犯罪行的合适惩罚,然后确定该不该判处其有罪。

 

三名罗马法官对一个嫌疑犯的判决意见分别是:

 

1.A法官认为被告有罪,应该被判处死刑,其次是终身囚禁;

 

2.B法官认为被告有罪,应该终身囚禁,其次是无罪释放,并坚决反对判处死刑;

 

3.C法官认为该被告无罪,应该被释放,其次是死刑,绝对不能赞同终身囚禁的判决;

 

这名嫌疑犯生与死的命运无疑掌握在这三个法官手中。由此,我们得到下图。

 

如果三个法官能够应用倒推法,正确地预料到如果被告证明有罪,投票结果是以2:1决定判处死刑。这意味着,原本的投票其实就是要决定判处无罪释放或死刑。投票结果是以2:1决定判处无罪释放,这里B法官的宝贵一票决定了被告的判决结果。

 

然而,当法官们采用罗马法时,首先决定要不要判处死刑,如果死刑不成立,法官们通过倒推法意识到终身监禁将成为第二阶段的投票结果,由此投票结果是A和B法官决定判处死刑,而C法官投反对票,被告被判死刑。

 

如果是首先决定本案的合适惩罚,情况又有不同,仍然采用倒推法的思路,我们可以推断出该被告会被判处终身囚禁。由此看来,法庭运作方式或法律体系的不同,即使法官们都是非常公正廉洁的人,相同的案件也会出现不同的结果。

 

在数学上,人们已经证明出,只要存在两个或三个以上的选择,少数服从多数的任何投票方法都会出现循环,投票的人数越多,选择的候选人越多,就越容易出现多数循环。

 

由于少数服从多数规则的这些缺陷,一些人又寻找到一些新的投票方法。最著名的就是两个世纪以前法国大革命时期,伯达(C De Bor-da)提出的新方法,一般被称之为Borda法则。

 

与多数规则不同的是,Borda法则不依赖于一系列两两投票对决。每个投票人递交一张选票,上面的内容包括他对所有方案的完整的排序。

 

如2005年春节期间共有《天下无贼》、《功夫》、《一石二鸟》三部贺岁片,一次根据投票人的偏好,比如笔者本人就比较喜欢看《天下无贼》,其次是《功夫》,而《一石二鸟》则目不忍睹。

 

如果用数学符号来表示,则为《天下无贼》>《功夫》>《一石二鸟》。每个人排在最末尾的方案或候选人得到1票,每个人排在倒数第二的得到2票,依此类推。最后得票总和最多的方案获胜。

 

以投票的多数规则来确定集体的选择会产生循环的结果,这就好像一只狗在追自己的尾巴,会没完没了地循环下去。

 

结果,在这些选择方案中,没有一个能够获得多数票而通过,这又被称作“投票悖论”(Voting paradox),它对所有的公共选择问题都是一种固有的难题,所有的公共选择规则都难以避开这种两难境地。

 

举个例子,某公司营销部决定在今年十一国庆节由公司报销,集体到外地旅游,营销部经理决定让营销部全体成员用Borda法则投票表决来选择最终的旅游目的地。

 

不妨假设营销部所有员工为60人,有去黄山、张家界、泰山3个方案供大家选择。这个时候在60人中3个方案的排序如下图。

 

根据Borda法则,去黄山这个方案排在倒数第三位(也就是第一位)的次数是23次,得23×3=69票,排在倒数第二位的次数是2次,得2×2=4票,排在倒数第一位的次数是19次,得19×1=19票,因此去黄山整个方案最终的得票数位为19+4+69=92票。

 

同样的算法,可以得到去张家界的总票数为67票,去泰山的总票数为103票。因此该营销部全体员工最终选择的旅游目的地是泰山。

 

除了Borda法则以外,在我们的身边还有一些其它的投票方法。

 

比如,在投票表决时,除了采用过半数决策规则之外,常见的还有2/3多数原则,该原则规定得票超过投票人数或法定投票人数的2/3多数票时才能当选某个职位或通过某个方案。

 

比如在美国的议会中,一会通过的法案在总统行使否决权后,要在参议院与众议院获得2/3多数票时才能通过该法案。

 

除了2/3原则以外,还有更加严格的3/4绝对多数原则。美国宪法修正案就需要要有3/4以上的州立法机构认可才算通过。

 

此外,我们在新闻中经常听到的联合国安理会表决中,5个常任理事国中的任何一个国家都具有一票否决权也是一种特殊的投票方法。

 

投票操纵的方法:民主的悖论

 

民主的本质就是每个人都有发言与选择的权利,并且对于其整体是少数服从多数。

 

从形式上看,投票制度是民主的最佳形式。然而从实质上看,投票制度却有着根深蒂固的难以克服的内在缺陷。

 

笔者曾于2003年12月在天涯社区经济论坛发过一篇文章,名为《论民主与人类自私本性的不可调和性与民主的不可行性》。

 

文章的思路是:任何一种民主的方式都会被操纵,甚至在极端的情况下甚至会转化为独裁。换一种表达方式就是,无论是少数服从多数的规则,还是Borda法则,或是任何其他投票机制,都不可能完美无缺,完全可能会被个人或集团所操纵,以人民的意愿为表象实施少数人的独裁。

 

先看这样一个例子。假设某国总统候选人有三位,分别是A、B、C,A、C分别是两种持极端观点的党派或者团体推举的候选人,B为中间立场的候选人。

 

有3000个投票人,其中三派的力量对比是13:9:8,其真实的态度是:

 

1.1300人认为A最好,B其次,C最次;

 

2.400人认为B最好,C其次,A最次;

 

3.500人认为B最好,A其次,C最次;800人认为C最好,B其次,A最次。

 

见下图所示:

 

现在有个投票委员会制订投票规则,分别有是取舍表决方法和Borda法则。

 

当我们采用过取舍表决方法原则时,情况是这样的:

 

1.第一轮投票,A得1300票,B得900票,C得800票,C被无情淘汰。

 

2.这时,进入第二轮,A得1300票,B得1700票,按照常理,B是众望所归、理所当然的胜出者。

 

然而,如果候选人A的1300人支持者是严密组织起来的,并且事先通过调查已经了解到B和C的支持者大概人数。A这时只要让其支持者中的200人在第一轮投票中,转而投C的票,第一轮票数比例变成了11:9:10,B居然在第一轮就被淘汰;很自然进入第二轮后,A的票数将为1800票,C得票1200票,通过这种合法手段,A候选人顺利当选。

 

当委员会采用Borda法则时,情况则是:A得票总数为1300×2+500×1=3100,B得票总数为900×2+2100×1=3900,C得票总数为得分800×2+400×1=2000,可见,候选人B仍然当选。

 

事实上即使采用Borda法则,A候选人仍然有策略可以改变竞选的结果。

 

支持A的1300人只要让其中的1000人慌报其偏好顺序即可,也就是这1000人转而认为A最好,C其次,而B最次。其余的300人仍然保持A最好,B其次,C最次的顺序不变。这个时候,A的总得票数为3100,B为2000,C为3000,很显然,候选人A通过操纵选票仍然可以当选。这种情况,便是选举中的个体慌报偏好,使其所属集团获利。

 

苏联在最后的岁月里,也曾就或"联"或"散"问题搞过一次全民公决。公决的结果是约75%的公民主张维护苏联的统一。

 

然而,在除了俄罗斯以外的十几个加盟共和国内部,其各自的全民公决结果却是至少有80%以上的公民赞成本共和国从联盟中独立出来。其最终的结果我们大家都看见了:前苏联一分而成15个独立共和国。这个结果很难说是公平或者不公平。

 

由此看来,民主投票不能得出惟一的结果,其选举结果取决于:民主投票的程序安排以及每次确定的候选人数量,即投票规则。不同的投票规则将得出不同的选举结果。这就是说,民主投票有内在的缺陷。

 

我们再来看一个案例,在一些书中,这个例子通常被称之为三个火枪手的对决博弈。

 

设想一下,有个具有民主气氛的家庭由父亲A、女儿B、母亲C组成,3个家庭成员组成家庭协调委员会协商有关购买空调的事宜。

 

假设存在两种购买方案,其一是在两个卧室各装一个空调,其二是在客厅买一个中央空调。

 

不妨以数字代表A、B、C对两个方案的满意程度:

 

比如,父亲A对两个卧室各买一个空调的满意程度为20。父亲A喜欢抽烟,如果在客厅买空调,由于爱人C的管束,就没有办法独自跑客厅抽烟过瘾,因此父亲A对仅仅买一个中央空调的满意程度为-5。

 

当然,如果买三个空调,如果母亲C是个节俭性格的人,她一定不会让三个空调同时开着,抽烟的问题也就迎刃而解,因此父亲A满意程度为15。

 

父亲A、女儿B和母亲C的对各种方案的满意程度见下图。

 

如果两个采购方案分别进行投票表决的话,若家庭每个成员都表达真实的满意程度,两个方案都只有1票赞同,却有2票反对而不能被采纳。

 

然而当父亲A与女儿B私下协商,进行家庭“选票交易”时,父女二人在两个方案的选择中均投赞成票,家庭表决的结果一定是既在两个卧室各装一个空调,也在客厅买一个中央空调。

 

这时父亲A的满意程度为15,女儿B的满意程度为10,母亲C则是心疼不已,成为父女“私下交易”的“牺牲品”,满意程度仅为-10或者说是不满程度达到10。

 

由此可见,投票方式的政治民主实在是知易行难,由于排名内部的模棱两可,造成狡猾的候选人有极大的操纵空间,无论什么规则都有可能扭曲选举的公平性。所有政治演说也常谈到尊重人民意愿,却很难做到。通常宣称实行民主制度,远比实际实施民主要容易得多。

 

毫无疑问,任何一种“民主”形式,只要它不能有效抑制私下交易的形成和蔓延,那么终究不可能形成稳定的民主。尽管如此,以上的这些例子不过是勾结、串通、获取一定利益,但终归在形式上还是民主。

 

令人难以置信的是,形式上的民主在一些情况下,居然可以转化为独裁!我们来看下面这个案例。

 

假设有一个原始部落,总共有100个猎人,部落规定每次这些猎人早出晚归地打猎,并把所有打到的猎物带回部落,然后这些猎物在这100个猎人中平均分配。年复一年,日复一日,多少年来,多少代来,都是如此。

 

设想某个年代,其中一个猎人富有政治头脑,并具有与生俱来的领袖气质与领导才能。他采用各种方法,拉拢了50个人,组成一个利益集团,并和剩下的49个人协商,要求进行投票以确定每个猎人的打猎技术高低,以此确定猎物每个人各分多少。很自然地,以51:49的过半数原则,剩下的49人分到得自然很少,不妨假设猎物的95%被51人的集团平均分享。

 

这个猎人当然不会就此满足,他仍然采用同样的投票表决的方法,又组成了26人的小集团,从新分配这90%的猎物。结果不妨假设21人集团分到了85%的猎物。

 

如果这被排挤的25人中胆敢有人表示不满,这个富有谋略的猎人就可以威胁冒犯者:如果不满意就通过投票让他得到的猎物更少(当然也是投票操纵,26人集团当然是支持,而被排挤的剩下的那24人可以告知他们可以投票分享这个冒犯者的应得猎物,自然他们也会持有支持态度),分享到的猎物会更少。

 

在这种情况下,这25个人都屈服了这种分配的状况,结果猎物的绝大部分被这26人的联盟分享。依次类推,26人转化为14人……最终的结果居然变成了极少数人甚至是这个领导者占有猎物的绝大部分。

 

这个时候,这个领导者可以用手中的猎物当成诱饵来招募武士保卫其特权的地位,拥有这样的特权,领导者还可以分得更多的猎物,有了更多的猎物可以招募更多的武士来维护自己的特权。

 

这样就形成了一个正反馈系统,两个因素之间相互不断加强,这种独裁专制的系统一直循环到这些猎人可以维持基本生存为止。读者可以看到,最不可思议的事情发生了,那就是民主投票的结果竟然是选出了希特勒、墨索里尼式的大独裁者。

 

实际上即使没有这些作弊方法,民主投票也不一定就是灵丹妙药。美国的大选,基本上选来选去,都在共和党、民主党这两个大党之间作选择。究其根底,美国的这两大党派并不像有些国家的政敌那样,有着根深蒂固的矛盾与分歧。美国两大政党之间的根本理想与主张是颇为接近的。这样,大量选民在选举的时候游离于两党候选人之间,往往是不大的一点偏差就改变了选举的结果。而美国政党的假如与退出也是极其轻而易举、毫不严肃的事情,只要你愿意为某个党派交纳党费,你就是属于这个党派。因为在美国人看来,控制严密、架构完整的组织是令人感到恐惧的。

 

对于这种情况,就美国来说,他们采用了“三权分立”的方法。可以说,美国总统肯定不是美国政府的首脑,他只是美国政府的“立法、司法和行政”这三个分支中,“行政”这一分支的主管。照通俗化的说法,他只是美国联邦政府“大行政办公室”的主任,是一个“大管家”一类的人物。

 

在这里,你可以发现,美国人对于腐败的忧虑,而是着眼于来自权力机构本身可发生的内部变化。美国人不愿意寄希望于对总统们个人品质的信赖。在他们眼里,权力无疑就是强腐蚀剂的代名词。权力导致腐败,绝对权力导致绝对的腐败。即使选上来的确信是个好人,如果没有监督机制,依然不能保证在权力的腐蚀之下不发生变化。

 

对于他们来说,如果没有强有力的制度保障,在威权的催化作用之下,谁也无法保证“总统”会不会逐渐演变为事实上的“皇帝”。因此,即使是被他们公认为是“好人”而推选出来的第一个美国总统华盛顿,也从一开始就被置于他们所设计的整套机制的监督之下,没有过上一天随意用权的日子。

 

阿罗不可能定理

 

五四以来,民主与科学一同成为中国人孜孜以求的理想目标。民主一词源于古希腊的“demos”,原意为人民。其本意是:在民主制度下,公民拥有超越立法者和政府的最高主权。而在中国民主观念被简单化、理想化,似乎全民投票就代表了主。的确,在许多中国人观念里面,民主就是一种投票制度。

 

然而,我们知道,投票制度采用不同的方法会得到不同结论。而且,任 何一种方法都有操纵选票的策略。投票制度本身就充斥着内在的矛盾。

 

实际上,以代议制投票为核心的民主,并不是真正的民主,而是一种具有内在的不可调和的假民主。通过投票方式,欺骗者可以制造一种虚幻的公平与民意氛围,以此实现他的权力意志或达到其它目的。比如印度、南美、东南亚一些国家的民选政治的结果往往是只能产生无能、低效和腐败的政府。

 

对于这种问题,斯坦福大学教授肯尼思·阿罗(K·Arrow) 采用数学的公理化方法对通行的投票选举方式能否保证产生出合乎大多数人意愿的领导者或者用专业术语说“将每个个体表达的先后次序综合成整个群体的偏好次序”进行了研究,在《社会选择与个人价值》中,他总结出著名的阿罗不可能定理。

 

事实上,阿罗本身也是以一种绝对理想的假设状态下的“理想选举”来对这个问题进行研究的。因此,这个结论实际上意味着:即便在绝对理想状态即每个社会成员的偏好是明确和相对稳定(不受宣传等因素的严重干扰)、没有种种的具体社会政治生活中的消极因素(通过种种宣传工具对对手的诋毁、以经济等手段迫使投票人违背自己的意愿作出选择等等)等的绝对理想情况下,一种能够通过一定的程序准确地表达社会全体成员的个人偏好或者达到合意的公共决策的方法也是不可能存在的。

 

人类所能想出的任何办法,都注定无法依赖票选民主的手段达到实质民主的目的。因为问题就出在选举本身。

 

阿罗理想选举的第一步是,投票者不能受到特定的外力压迫、挟制,并有着正常智力和理性。毫无疑问,对投票者的这些要求一点都不过分。坦白地说,如果一个投票者连这些基本要求都无法满足,那么他要么根本就不是投票而是去捣乱的,要么———精神病院会是更适合他的场所。

 

阿罗理想选举的第二步是,将选举视为一种规则,它能够将个体表达的偏好次序综合成整个群体的偏好次序,同时满足“阿罗定理”的要求。

 

所谓“阿罗定理”也就是:

 

1.所有投票人就备选方案所想到的任何一种次序关系都是实际可能的。也就是说:每个投票者都是自由的,他们完全可以依据自己的意愿独立的投出自己的选票而不致因此遭遇种种迫害。

 

2.对任意一对备选方案A或B,如果对于任何投票人都有A优于B,根据选举规则就应该确定A方案被选中;而且只有所有投票人都有A与B方案等价时,根据选举规则得到的最后结果才能取等号。这其实也就是说:全体选民的一致愿望必须得到尊重。

 

但是一旦出现A与B方案等价的情况就意味着可能投票出现了问题。比如两个方案A、B受两个投票人C、D的选择。对C来说,A方案固然更好,但B方案也没什么重大损失;但是对D来说,却是A方案就是生存B方案就是死亡,那么让C和D两个人各自“一人一票”当然就绝非是公正平等的。在几乎所有的私企之中,我们都能见到类似的状况。

 

3.对任意一对备选方案A、B,如果在某次投票的结果中有A优于B ,那么在另一次投票中,如果在每位投票人排序中x的位置保持不变或提前,则根据同样的选举规则得到的最终结果也应包括A优于B。这也就是说:如果所有选民对某位候选人的喜欢程度,相对于其他候选人来说没有排序的降低,那么该候选人在选举结果中的位置不会变化。

 

这是对选举公正性的一个基本保证。比如,当一位家庭主妇来决定午餐应该买物美价廉的好猪肉还是质次价高的陈猪肉来吃时,我们很清楚:她对好猪肉和注水肉的“喜爱程度”应该不可能发生什么变化———然而这一次她却买了陈猪肉。这一定说明在主妇对猪肉的这次“选举”中有什么不良因素的介入。当然,如果原因其实是市场上已经百分之百都是陈猪肉,那也就意味着“选举”已经不复存在,主妇已经被陈猪肉给“专制”了。那不在我们的讨论范围之内。

 

4.如果在两次投票过程中,备选方案集合的子集中各元素的排序没有改变,那么在这两次选举的最终结果中,该子集内各元素的排列次序同样没有变化。

 

这也就是说:

 

现在,那个买猪肉的主妇要为自己家的午餐主食作出选择,有三位“候选人”分别是一元钱一斤的好面粉、一元钱一斤的霉面粉和一元钱一斤的生石灰。主妇的选择排序不说也罢,一清二楚。然而现在的情况却是:在生石灰先生出局之后,主妇居然选择了霉面粉!这一定意味着有这次“选举”之外的因素强力介入。

 

比如主妇的单位领导是这家霉面粉厂家老板的姐夫之类,所以为了照顾小舅子就强制要求属下员工必须每月购买200斤“指定产品”的霉面粉,不然就不发工资,还给“穿小鞋”、“揪小辫子”。阿罗定理3和4的结合也就意味着:候选人的选举成绩,只取决于选民对他们作出的独立和不受干预的评价。

 

5.不存在这样的投票人,使得对于任意一对备选方案A、B,只要该投票人在选举中确定A优于B,选举规则就确定A优于B。这也就是说:任何投票者都不能够凭借个人的意愿,就可以决定选举的最后结果。

 

这五条法则无疑是一次公平合理的选举的最基本的要求。

 

然而,阿罗发现:当至少有三名候选人和两位选民时,不存在满足阿罗定理的选举规则。也即“阿罗不可能定理”。

 

这其实也就是说:即便在选民都有着明确、不受外部干预和已知的偏好,以及不存在种种现实政治中负面因素的绝对理想状况下,也同样不可能通过一定的方法从个人偏好次序得出社会偏好次序,不可能通过一定的程序准确地表达社会全体成员的个人偏好或者达到合意的公共决策。

 

人们所追求和期待的那种符合阿罗定理五条要求的最起码的公平合理的选举居然是不可能存在的。这无疑是对票选制度的一记最根本的打击。更通俗的表达则是:当至少有三名候选人和两位选民时,不存在满足阿罗定理的选举规则。或者这也可以说是:随着候选人和选民的增加,“形式的民主”必将越来越远离“实质的民主”。

 

西方哲学大师苏格拉底之死,是对阿罗不可能定理一个绝佳的证明。口若悬河的大哲学家苏格拉底,是一个在西方文化中不亚于孔圣人的天才人物。苏格拉底因言出名,也因言获罪。

 

据史书记载,获罪的苏格拉底面对着公民大会的判决。此次公民大会也经历了初审和复审,初审中五百个公民进行了投票,结果是280票对220票判处苏格拉底有罪。复审是决定苏氏是否该判死刑,复审之前,苏氏有为自己脱罪的辩护权利,希腊民众不仅没有被苏格拉底的口才所征服,反而被激怒,结果是以360:140票判处苏格拉底死罪。

 

这就是希腊的民主。这种民主,被认为比现代西方民主更为先进的民主形式。但是,这种先进的民主,仍然从肉体上,把一个对人类社会作出巨大贡献的巨人碾作了尘土。

 

“人是不可靠的”这句话,在这里又有了新的注解。不仅处于权力巅峰上的当权者有可能是不可靠的,监督群体的“人”,同样也可能是不可靠的。因此,不断改进整个监督机制,使得一切不可靠因素处于制约与平衡的系统之中,一种权力的恶性扩展和群体的疯狂行为,才可能被抑制,在整个社会处于最弱势的个人的自由,才可能不被吞没。

 

帝国的衰落:短视的群体博弈

 

陋室空屋,当年花满堂;衰草枯杨,曾为歌舞场。近代西方最早兴起的殖民帝国———西班牙王国曾经生气勃勃,兴旺发达,然而却过早地陷入衰败,成为今日西欧最落后的国家之一。

 

笔者为什么突然要在书中讲起几百年前这个遥远欧洲国家的兴衰故事呢?

 

要知道,我们的社会现在 掀起了一阵奢侈迷华之风,还有一些人为了发家致富不讲道德不择手段。看完西班牙由兴盛转向衰落的故事之后,你就会明白国家的兴衰与个人生活之间密不可分,西班牙帝国衰落的故事十分值得我们去深思。

 

西班牙在15、16世纪时处于其兴盛的最顶峰,然而强盛的外表下却隐藏着那些尚不引人注目大但却起着致命作用的因素。当时的西班牙人热衷于海外探险和对外殖民,随着对殖民地的军事征服之后,各个阶层的居民纷涌而至,谋求财富,这原本是顺理成章的事情。然而,当整个群体在这种思潮的鼓动下都这么做的时候,就危及了整个国家的经济发展,甚至导致经济凋敝。

 

在那个时代,很多西班牙人前往美洲寻找黄金,企图一夜暴富。这当中包括了很多技术高超的工匠和专业的技术人才,遗憾的是,这些人并没有在新的定居地继续从事他们的手工业生产活动。

 

哈丁悲剧在这里又一次的发生了。西班牙整个民族过度追求黄金,对国家发展产生了诸多恶果。一方面,人们想通过淘金一夜暴富,不愿意老老实实地从事工农业生产。另一方面,殖民地的发展又造成对日常商品特别是日用手工业品的大量需求,而西班牙本国生产能力远远无法满足这种需求。迫不得已,西班牙人大量进口英国、荷兰的商品,他们把英国与荷兰当成了自己的生产基地,英国、荷兰两国也因此而经济繁荣起来。这样,西班牙在经济上对其他国家就有了很强的依赖性。

 

西班牙本土原有的大部分劳动者与外国劳动者之间就形成了一个循环博弈。由于西班牙人大量出国,国内劳动力紧缺,人员工资大幅度上涨,这样就带动了西班牙本土产品的价格上涨。同时呢,由于西班牙大量进口其他国家的商品,这些商品随着进口量的增长,价格越来越便宜,产品质量也越来越好。这使得西班牙本土的普通手工业者几乎无法与外国竞争者进行抗衡,结果是手工工场纷纷倒闭,劳动者失去工作。

 

那些在美洲新大陆大发横财的社会上层与冒险家,他们手中握有大量黄金,急切地要得到奢侈品来满足他们的穷凶极欲。这个博弈的结果就是,西班牙本土的手工业放弃普通消费品的生产,转而生产奢侈品。

 

可惜的是,西班牙手工业自此割断了与普通大众的联系,使工业资本主义的发展成为泡影,因为资本主义发展首要的条件是大众化生产。西班牙失去了依靠自身来推动本国资本主义发展的可能性。

 

西班牙人从美洲掳掠来大量的黄金,使得他们在当时成为欧洲首屈一指的富国。然而,他们却不知道怎么来利用这些财富创造更多的财富。西班牙政府消耗财富的方法就是战争,西班牙贵族与有钱的个人消耗财富的方法就是消费奢侈品。

 

西班牙人把生产交给其他国家,自己只管战争、消费和不断的掠夺。西班牙国王为了维持庞大的殖民帝国要不断发动对其他国家的战争。一些暴发户与贵族的钱实在是太多了,奢侈与浪费就是最好的花钱方法。在这种情况下,即使有人想做点实实在在的事情,因为成本太高,实在无法与国外对手竞争。

 

西班牙的商人们只知道不计后果地大把大把地捞取财富。大家都在拼命地寻找“多快好省”的发财方法。只要能够发财就行,管他死后巨浪滔天。当时美洲快速发展,急需大量的手工业制品。在这种情况下,西班牙商人倒腾英国、荷兰的产品,并把它们当成西班牙自己的产品卖到美洲,坐收暴利。

 

农业的命运与手工业相似,美洲金银并没有促进其发展,商人们则向国外购买粮食满足国内需求。这样一来,西班牙人似乎再也不需要制造任何东西了。

 

西班牙人陷入了一种群体博弈的躁动与陷阱。他们习惯于征服和劫掠,习惯于短时间内得到大笔金钱与土地,丧失了勤劳工作的美德。他们轻视平凡而扎扎实实的劳动,瞧不起从事劳动的普通人。有一个那个时代的人这样评价西班牙人:“他们从不种地,也不做农场工人、木匠或泥瓦匠。他们都寻求轻松的行业或寻找少做工作就能糊口的生活方式。西班牙人认为,与其劳动不如忍受饥饿和其它痛苦。他们把工人和奴隶等同看待。”

 

西班牙在美洲抢掠的金银太多了!这些巨量金银流入到欧洲之后,金银的价值也随之下降,由于当时的各种物品都是根据金银来定价的,这样表现出来的就是金银价格下降,反过来就是各种物品的价格上涨。在16世纪末,西班牙的物价平均上涨了4倍,谷物上涨了5倍。这给西班牙的普通百姓造成了巨大的打击,中下层阶级纷纷走向破产和饥荒,处在灾难的边缘。

 

而西班牙国王年年发动战争需要大量的税收,由于贵族等上流社会的人们可以轻易逃税,而美洲金银的掠夺速度远远不能满足战争费用的需要。于是,西班牙帝国税负的重担就无情地压在了平民的身上。

 

此外,腐败,特别是西班牙海外殖民地官员的腐败,像瘟疫一样传播开来。部队军官虚报采购军备的费用,领取空缺士兵的薪饷,甚至克扣士兵薪饷而中饱私囊。法官通过加速处理案件或判决交纳罚金来获取额外的好处费。市场与海关的官员与私营商人(当时西班牙的海外贸易是政府垄断,不允许私营海外贸易的存在)狼狈为奸,相互勾结获得额外收入。

 

钱很多并意味着钱花不完,再多的没有再增殖能力的财富也经不起贵族们漫无边际的消费和国王们持续不断的大规模战争。1557年、1575年、1597年西班牙政府都宣布过国家破产。

 

在1588年,穷兵黩武的西班牙,它的“无敌舰队”被英国人击败之后,一蹶不振,宣布其走向没落。西班牙人最终尝到了群体博弈短视的苦果。西班牙正是这样,因为有钱而逐渐衰落。

 

读者有没有从这个西班牙人群体博弈的迷乱中体悟出些什么道理呢?

 

“幸存者游戏”的人生启示

美国哥伦比亚广播公司(CBS)制作过一个著名的“幸存者(Surv-iors)”电视游戏纪实片。该片讲述了一场“游戏”,16名来自美国各地的应招者被集中在南中国海的一片海岸丛林里,并且在与外界隔绝的情况下,进行一场为期39天的“幸存者游戏”。他们分成两组(Tagitribe和Pagongtribe),这两组每3天进行一场团体比赛 ,胜方会得到豁免权或他们要求的物品,而负方将举行全体投票淘汰掉他们中间的一个组员,因此这种比赛又称豁免权比赛。比赛不停地进行下去,而淘汰也不停地进行下去,当每组只剩下8个人的时候,两个组合并为一个组,继续淘汰赛。直到最终只剩下一个人的时候,这个人就是最后的获胜者,也就是“幸存者”,他将拿走100万美元的奖金。

 

显然,与其说这是“幸存者游戏”,还不如说是一场微型的“人类生存博弈”。游戏的举办者也正是要通过这场微型的“生存博弈”,直观地向高度紧张和受压的现代人揭示了深刻的群体博弈哲理。

 

这个游戏从最后的结果来看,首先是一个零和博弈:只有唯一的一个人可以拿到100万美元,其他人都被淘汰出局;其次,由于一开始游戏分为两个组,在每个组中的成员既要通力合作又要善用谋略,这样才能保证自己在野外可以生存下来同时又不会被被淘汰。

 

那么在这个游戏中,首先淘汰的会是什么样的人呢?

 

在“幸存者游戏”的过程中,首先被淘汰的通常是这样一些人:

 

1.那些人要么是有明显的缺陷,要么是刚开始就成了众人厌恶的说谎者。对于前者,明显缺陷使他根本不能适应今后艰苦的竞争,淘汰这样的人无论对他还是整个团队都是明智的和轻易的;对于后者,当游戏刚开始众人就知道他在说谎,无疑,说谎者必须离开。特别是如果你的年龄明显偏大,而又不能充分融入一个年轻的群体中;

 

2.那些不愿与团队中的成员充分沟通和交流的人,由于大家不知道这些人的想法,所以对与这些“不合群”的人合作没有信心。反之,完全可以想见的是,如果你的做事能力差,但你愿意和其它团队成员充分沟通,你就有可能在与大家的沟通中“碰撞”出“灵感的火花”,从而为整个团队找到“好办法”,这样大家就知道你是有用的人,虽然可能做具体事不太行,但你的地位至少在初期是稳固的;

 

3.那些有能力为团队工作而又不肯工作,终日懒散而妄图坐享其成的投机分子;

 

4.居功自傲、藐视同僚的人将是团队初期的最后一批被淘汰者。这种人认为自己有过出色的成绩,于是藐视同僚,把整个团队的竞赛看成是个人英雄的表演。显然,作为团队的竞赛,这种人在初期是有用的,是不可能被淘汰的,而当整个团队开始进一步发展的时候,这种人便会成为整个团队的桎梏。

 

一个公司初期和中期的发展,也是以真正的团队领袖的出现来划分的。此前,团队的发展方向是由整个群体作出的,通常也会是公正的。而当团队领袖出现后,团队的发展方向将会受到群体意见的影响,也会受到团队领导个人意见的左右,换言之,团队的发展将是这两个“分力”的“合力”。

 

一个优秀的团队领袖,将是一个有“公心”的,时而能固执己见,力挽狂澜,时而又能因势利导,从善如流的“力学”高手。而你如果总是“因势利导”,就将被认为是缺乏魄力的“老好人”;而你如果总是固执己见,就将被认为是不能虚心纳谏的“偏执狂”;而你如果没有“公心”,甚至结党营私,即使你能“因势利导”,即使你能“从善如流”,那人们也会给你个准确的评价———阴谋家。

 

人们都知道,“忠言逆耳利于行”,然而从这个游戏中,我们可以看到:在一个团队里总有一些不会做事,只会“耍嘴皮子”的“甜言蜜语”制造者,而且这些人的地位通常会比人们想象的稳固得多,或者说,一旦当整个团队出现问题时,这种人反而不会被淘汰。实际上这样的故事古今中外颇为多见。

 

当这个游戏中的参加者只剩下8个人时,两个已走过初创期,并开始步入发展期的团队被合并为一个团队。这时,双方会面临很多差异、分歧和碰撞,而当面对一个共同的竞争时,这种碰撞将尤为激烈,而且表现方式是多种多样的,甚至是不择手段的,而一种暗地里的,被称做“阴谋”的东西通常就在这个时候应运而生了。

 

这个游戏的过程告诉我们,在激烈的团队竞赛中,个人的生存只有两条道路:支持和反对,如果你想走第三条路,一定会失败。很多公司的内部斗争都被简称为“站队”,结果通常是如果你不站在我这一队里,你就是我的敌人,我不仅要防着你,而且迟早要“铲除”你。

 

在一个高度竞争的团队中,你必须有敏感的洞察力,并时刻警惕危险的出现,对于哪怕是潜在的危机,也必须有充分的估计并立即制订有效的对策。而如果你的动作慢了,或者犹豫了,你将面临危险,虽然也许你不会被马上淘汰,但这种危险将使你陷入被动,最终导致无法逆转的恶果。充分估计和快速应对,正符合孙子兵法的名言:“多算胜,少算负,而况于无算乎”。

 

最终,在这场激烈竞争的游戏中,在这种竞争中,最终的“幸存者”会是什么人呢?

 

游戏的结果是:经验最丰富而善于谋略者被留下;最机智而年富力强者被留下。这是自然的选择。实际上,和很多群体博弈一样,最后的几名选手应该是不相上下、伯仲之间。因而最终谁是“幸存者”,就要看他有没有极好的运气了。综合说来,要在团队中成为“幸存者”,你就要做到以下几点:

 

1.做个诚实的人,获得团队成员的信任。这样别人才可以与你合作,甚至会帮助你度过难关;

 

2.和团队的其它成员充分沟通,让别人了解你。这样会增加你与其他人之间的亲密感,让别人感觉和你在一起合作是一件愉快的事情;

 

3.尽自己的力量为团队做好事,尤其是在你比较擅长的方面。你帮助了别人甚至整个团队,团队成员会对你心存感激,虽然这并不能保证别人不过河拆桥;

 

4.取得成绩后可以适当表现,但不要过分张扬,更不要藐视他人;

 

5.虽然你不搞“阴谋”,但不等于“阴谋”不会找上你,所以你还必须保持高度的警惕,对潜在的危机有充分的估计,并且尽快制订出对策。在必要的时候,必须要与别人合作,同他们达成交易,共同进退,保证自己不会出局;

 

6.“大树下面要乘凉”,“良臣视主而栖”,在一开始你就要选择好自己所忠于的团队领导,不能“站错队”。如果你想最终胜出的话,这一点是非常关键的。

 

7.俗话说,“一命,二运,三风水,四积德,五读书。”一切自己可以控制得了的事情都选择好策略之后,最终结果到底如何就要看命运女神是不是眷顾你了,你现在可以做的就只有祈祷了。

 

 

经济现象的心理分析

 

春天花开秋天风,冬天落阳夏日蝉。凡夫肉胎的每个人在现实生活中总是受到各种情感因素的影响, 人的决策选择并不总是英明的。传统经济学包括博弈论与信息经济学传统经济学一直以“理性人”为前提假设,构建出很多精美的数学模型搭建出公理化的理论体系。然而,这恰恰也是传统经济学对实际问题的分析结果偏差很大、经常失真的原因。

 

2002年诺贝尔获得者 心理学家卡尼曼(Kahneman)的研究成果———前景理论(prospect theory)正是独辟蹊径地从从心理学角度研究经济现象。

 

卡尼曼发现,人们在做决策时,往往并不是去严格计算所获得的真正收益,而是用比较容易与快速的评价方法去判断优劣。我们先来看这样的一个经典故事:现在有两杯哈根达斯冰淇淋,一杯冰淇淋A有7盎司,装在5盎司的杯子中,一眼看上去似乎满满一杯、快要溢出来;另一杯冰淇淋B是8盎司,但是装在了10盎司的杯子中,看上去似乎还没装满。那么在你不知道两杯冰淇淋实际分量的情况下,你愿意为哪一份冰淇淋付更多的钱呢?

 

显然8盎司的冰淇淋比7盎司的要好。可是实证结果表明,在分别独立判断的前提条件下,也就是说不能把这两杯冰淇淋放在一起让消费者进行比较,绝大部分人反而愿意为实际分量少的冰淇淋支付更多的钱。

 

根据严格控制下的经济学实验表明:大多数人居然愿意2.26美元买7盎司的冰淇淋,却只愿意用1.66 美元买8盎司的冰淇淋!显然,人们不根据实际获得的冰淇淋分量来选择的,而是根据心理喜好来决定给不同的冰淇淋支付多少钱的。

 

美国芝加哥大学经济学家塞勒(Thayer)教授提出了“心理账户”的概念。比如同样是100元,靠工资挣来的100元与靠摸彩票中奖得来的100元即使是对于同一个人也是不一样的。辛勤工作赚来的钱总是舍不得乱花,一笔意外之财却是“来得容易,去得快”,很快就被花掉。这就是说相同数额的钱在同一个消费者的心理上却是不同的,这就需要给来自不同途径的钱分别建立不同的账户———“心理账户”。

 

让我们来看这么一个例子。假设美国正在为预防一种流行病的爆发做准备,预计这种病会使600 人死亡。

 

现在有一个相同的方案采用不同的两种描述方法居然会有完全不同的效果。

 

第一种描述方法:不同现在有两种方案,采用A方案,可以救200人;采用B方案,有1/3的可能救600人,2/3的可能一个也救不活。实证结果是:人们不愿冒风险,更愿意选择A方案;

 

第二种描述的方法:有两种方案,C方案会使400 人死亡,而D方案有1/3 的可能性无人死亡,有2/3 的可能性600 人全部死亡。死亡是一种失去,因此人们更倾向于冒风险,选择方案D;

 

事实上,两种情况的结果是完全一样的。救活200 人等于死亡400 人;1/3 可能救活600 人等于1/3 可能一个也没有死亡。不同的表述方式改变的仅仅是参照点发生改变,一个是以死亡为方案评价标准,另一个是以存活作为参照点。

 

让我们再来看一个塞勒曾提出的问题:假设你得了一种病,有1/10000的可能性会猝死,现在有一种药吃了以后可以把死亡的可能性降到0,那么你愿意花多少钱来买这种药呢?如果你身体很健康,突然有家医药公司想找一些人测试他们新研制的一种药品,这种药服用后会使你有1/10000的可能性突然死亡,那么你要求医药公司花多少钱来补偿你呢?

 

在经济学实验中,很多人会说愿意出几百块钱来买药,但是即使医药公司花几万块钱,他们也不愿参加试药实验。这其实就是损失规避心理在起作用。得病后治好病是一种相对不敏感的获得,而本身健康的情况下增加死亡的概率对人们来说却是难以接受的损失,显然,人们对损失要求的补偿,要远远高于他们愿意为治病所支付的钱。

 

通过上面这些例子,我们可以得到“前景理论”的三个基本原理:其一大多数人在面临获得时是风险规避的,也就是说是小心谨慎、不愿冒风险的;;其二,大多数人在面临损失时是风险偏爱的,也就说在面对失去时会很不甘心,容易冒险;其三,人们对损失和获得的敏感程度是不同的,损失时的痛苦感要远远超过获得时的快乐的感觉。

 

经济学家塞勒还曾经根据行为经济学的“前景理论”提出过这么4个影响别人心理幸福感的原则:

 

第一,如果你有若干好消息要公布,应该把它们分开公布。比如今天你这个月奖金多发了1000元,同时买彩票又中了1000 块钱,那么你应该把这两个好消息分两天告诉你妻子或女友。这是因为根据“前景理论”,分别经历两次获得给你的妻子或女友所带来的幸福感之和要强于把两个获得放一起;

 

第二,如果你有若干坏消息要公布,应该把它们放一起公布。比方你今天走霉运,上午丢了1000元的现金,下午丢了价值1000元的手机。因为根据前景理论,两个损失结合起来所带来的痛苦感要低于分别经历这两次损失所带来的痛苦之和;

 

第三,如果你有一个天大的好消息和一个不重要的坏消息,应该把这两个消息一起告诉别人。这样的话,好消息所带来的快乐会将坏消息所带来的痛苦冲淡,负面效应也就少得多;

 

第四,如果你有一个天大的坏消息和一个无关紧要的好消息,应该分开公布这两个消息。因为只有这样,好消息所带来的快乐才不至于被坏消息所带来的痛苦湮没,人们还是可以享受好消息所带来的快乐。

 

21世纪的博弈论:行为博弈论

 

笔者在这里谈了这么多关于行为经济学的知识,看起来似乎和博弈论与信息经济学不太相关。实际上,长期以来,传统博弈论与信息经济学一直以“理性人”为理论基础,通过一个个精美的数学模型搭建起公理化的完美自洽的理论体系。

 

然而,心理学和行为经济学的研究结果表明,人类在作出经济决策时总是存在着系统的推理误差。这些误差产生的原因大多来自于思考成 

本、激动和经验等心理因素的影响。所谓思考成本是指,人类认知能力有着心理的临界极限,认知作为一种资源是稀缺的,使用它必须支付一定的成本,人们在实际决策时很少把这种成本考虑进去。

 

和传统博弈论不同,行为经济学从人自身的心理特质、行为特征出发,去揭示影响选择行为的非理性的情感因素。行为经济学家为了弥补传统博弈论理性人假定的不足,他们提出了“行为博弈论”。与传统博弈论相对,行为博弈论考虑人类非理性因素,研究参与人实际上做出什么行动。

 

设想有两位博弈者,分别称之为投资人A和借款人B。他们互不相识,博弈者A得到一笔钱并被告知可以完全保留也可以将其中的任意比例借给B,他给出的任何金额都会以大于1 的某一倍数付给B,然后由B决定是否回报和回报多少给A。按照传统博弈论的观点,理性的B应该最大化他自身的利益,那么他的最优策略就是保有获得的所有收益,不会返还给参与者A。而理性的B当然会估计到A的策略,因此不会借钱给B,这就是纳什均衡点。

 

下面我们来看行为经济学家利用实验的方法将得出怎样的结论?

 

实验设计如下:将招募来的博弈者安置在计算机实验室中,每人有10元的出场费,两人一组通过各自面前的计算机联系,相互不认识而且实验结束也不会知道对方是谁。每组中的一位(投资人A)可以完全保留手中的10元也可以将其中的任何部分借给对手(借款人B),不管A付出多少,B都会收到3倍的金额,如A借给对方4元,B总共会得到4×3+10=22元的支付,然后由B决定是否还钱给A和还多少,只要B 愿意借钱给A也同样会收到3倍的金额。按照传统博弈论,在这样的一次性博弈中,当处于纳什均衡时,A 和B各自都只能获得10元。

 

然而事实上,经过成百上千次的实验,发现50%的博弈者A会向对方进行借钱,而75%会收到对方的还款,博弈者B亦然。而且,B从A处借钱越多,随后向A还钱就越多。

 

行为博弈学家认为,之所以产生这种现象的原因在于:现行的社会、制度、经济和生活环境都会影响人与人之间的信任。传统博弈论认为理性自利的人不会信任别人,即使得到别人的信任也不会变的值得信任,但它忽略了一点,人类不仅是自利的,同时也是高度社会化的动物,整个不断社会化的过程使得大脑已经形成了一种自动的社会化的反应机制,我们在意别人的看法,考虑别人的反应,即使是对陌生人,虽然这种情感发生作用时我们甚至没有意识到,但它还是在决策制定中发挥着重要的作用。

 

我们的大脑作为一个内在的指南针引导我们做出“对”的选择。同样的,对于“囚徒困境”博弈,这两个被抓的嫌疑犯可能在一起合作很久,双方有密切的社会联系,各自对对方都非常信任,甚至愿意为对方牺牲自己,那么在这种情况下,“囚徒困境”的结局反而是两个嫌疑犯都不承认自己的罪行更不会揭发别人,他们的非理性行为使他们获得帕累托改善,也就是说两人的境况同时得到改善。因此,传统博弈论的结论是:在这样的博弈中理性人的个人理性行为导致集体的非理性。反过来,行为博弈论的结论则是:在这样的博弈中博弈者的个人非理性反而导致集体的理性。

 

我们再来看前文讨论过的一个例子。在这个例子中,博弈者A与博弈真B分配一个固定量的利益,比如一定数额的金钱或一个固定大小的蛋糕。其中一位博弈者A出价,也就是在双方之间分配这一定利益,要求博弈者B要么接受要么拒绝,如果B接受,那么双方就按照A提出的分配比例瓜分利益,如果B拒绝,那么双方之间不会有交易行为,双方都不会获得任何收益。按照传统博弈论的推导,博弈者都是理性自利的,有收益总是比没收益好,因此只要A对B的分配额大于0,理性的B都会接受,所以,这个博弈具有无穷多个纳什均衡。

 

该博弈的实验过程大致是这样的:两个博弈者(出价者A和回应者B)就10元钱进行议价,10元代表双方交易的利润或者说赢余,A向对方分配x元,则自己剩下10-x元,B要么接受他的出价则获得x元,而A得到10-x,要么B拒绝则大家均一无所获。

 

传统博弈论的分析结果显然是,A获得绝大部分利益,B只能分得蝇头小利。

 

然而根据行为博弈论的实验表明,出价者的平均出价大致是4~5元左右。50%的B都拒绝了2元以下的出价,B认为过分低于1/2的出价太不公平,因此以拒绝的方式惩罚对方的过分行为,结果双方的收益都为0元。

 

如果A出价过低,B的拒绝实质上是一种“报复性回报”。这就是说,回应者宁愿牺牲自身的利益去惩罚那些未公平对待他们的出价者。这种报复性回报在现实生活中很多,如人体炸弹、拒绝庭外调解、情杀案件等,都是回应人为了伤害对方不惜牺牲自己的非理性行为。

 

对这种行为博弈现象公认的解释是:一些博弈者将获得收益的一半视作公平交易点并且有要求被公平对待的偏好。这点很好理解,在我们的实际生活中,很多时候人们耗费大量的没有增加整体社会福利的成本所希望达到的境况不过是为了求得人与人之间的公平、公正与合理。

 

由于本书篇幅所限,笔者不再过多介绍行为博弈论的有关知识,有兴趣的读者可以参阅有关书籍来更进一步地了解行为博弈的知识。