生活中的博弈论

来源:百度文库 编辑:神马文学网 时间:2024/04/27 16:24:09
余治国 江雨燕  
       在经济学史上,曾经发生过三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,因为它代表着一种新概念、新方法论、新分析方法和一种全新的思想……
 
   第一部分
       对于许多非数学专业和经济学专业人士来说,博弈论应该是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具之一
 
    序:大博弈的思维观
 
对于许多非数学专业和经济学专业人士来说,博弈论应该是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具之一。
1994年诺贝尔经济学奖即授予三位博弈论专家,1996年诺贝尔经济学奖又同样授予两位与博弈论一脉相承的信息经济学开拓者。
在经济学史上,曾经发生过三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,因为它代表着一种新概念、新方法论、新分析方法和一种全新的思想。
经济学家凯恩斯1936年在《就业利息与货币通论》中远见卓识地写过这样一段深刻的话,“经济学家和政治哲学家的思想,不管是正确的还是错误的,其力量之大,往往超出常人意料。事实上,统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知识的影响,却往往当上了一些已故经济学家的奴隶。执政的狂人,自称听到了上帝的指示,实际上却是从若干年前一些学术界劣等思想家那儿拾取了一些怪诞的想法……比起思想的逐渐侵蚀力来,既得利益的势力被过分夸大了。”
然而,博弈的技术分析有着严格的前提条件,逻辑严密,思路清晰。遗憾的是,这种技术分析的应用范围却是非常地狭窄。由此可见,博弈论的思想比任何技术性的分析都要重要。
实际上,博弈之道是古已有之,但博弈思想的系统化、数学化却是近几十年发展起来的。正是因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的研究还是停留在引进介绍层面上,他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博弈论与信息经济学在中国已是一门科学,但却逐渐变成阳春白雪或弃之不用或被滥用到极至的一门学问。
博弈论与信息经济学不仅仅能在学术领域中光彩夺目,在其它领域如军事、管理、体育、政治、公关、个人生活中同样能得到充分利用,甚至在生物学中都可以觅其踪迹。
在普通的企业管理中,经营者要熟练地掌握管理之术,必须能够自动自发并自觉地运用博弈论与信息经济学。在日常生活中,人们可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题。
正是因为如此,诺贝尔经济学奖获得者保罗·萨缪尔逊(Paul Samuelson)说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”
所谓“大博弈的思维观”正是表达了这层含义,人们身边无处不在的博弈哲学,无论是直接感受到或是从未接触过的社会、政治、法律、军事、经济、管理、自然、历史等现象。
笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法,能用语言可以描述的就尽量少用或不用数学。因此笔者未对博弈论与信息经济学作数学化、系统的证明与阐述,只是采用独立成篇的小文章来讲解这个学科的基本知识。
但也只有这样,才能够使似乎高深的博弈论与信息经济学思想很轻松地为普通读者所掌握,并能够让读者应用其思想方法来分析甚至是解决身边的诸多实际问题。
就在本书即将付梓之前,令笔者甚感欣慰的是,2005年诺贝尔经济学奖由拥有以色列和美国双重国籍的经济学家罗伯特·奥曼和美国经济学家托马斯·谢林分享。两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解”。(瑞典皇家科学院评语)
最后,笔者还要感谢黑龙江的吴学秋教授,他仔细批阅本书的初稿,并提供了大量的意见与建议。同时,还非常感谢客户服务管理(中国)有限公司董事、总经理、营销管理专家王正党先生、前托普集团托普大学培训学院副院长、现任职某大学的杨志宏先生、前托普集团培训学院副院长、前马来西亚东南集团副总、著名策划专家彭小利先生、著名管理专家、策划专家铂策划创始人郭林先生、著名经济学家、管理专家刘正山博士、著名经济学家、北京大学政府管理学院MPA教育小组组长余斌教授、当代中国出版社乔平先生、青年政治学院的叶楚华教授、安徽工业大学管理科学与工程学院院长汪家常教授对笔者的关心与爱护。同时还要感谢中国计算机世界出版服务公司的编辑,给本书提出了许多宝贵意见与建议。还有其他很多热心的朋友,笔者限于篇幅无法一一列出,只能在此深表感谢!本书获得安徽省教育厅人文社科基金项目计划,项目编号2006SK164。
由于笔者本人学识有限,对博弈论与信息经济学的理解与研究尚不深刻,错误在所难免,敬请博弈论与信息经济学的方家高人指点,以免贻误广大读者。本书有1/3的内容由江雨燕副教授编写,主要内容由余治国统筹编写,一切错误由主要编写人余治国负责。
余治国
 
《美丽心灵》的博弈解读
 
美国环球公司(Universal Pictures,USA)2001年出品的电影《美丽心灵》(A Beautiful Mind)可谓家喻户晓。该片一举囊括了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心灵。
《美丽心灵》艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症30多年又奇 迹般恢复正常的约翰·纳什(John Nash)传奇般的人生经历。
在一般的纪实性电影中,演员形象总是比真实生活中的原型要更具有动人风采。然而,让人难以置信的是,现实的纳什无论容貌风度都比男主角奥斯卡影帝罗素·克洛(Crowe Russell)略胜一筹。
正是这个曾如希腊古神一般英俊潇洒却又古怪精灵的数学与经济学的双料天才———纳什,其早年在博弈理论方面的巨大贡献一直改变着我们的生活。
然而,《美丽心灵》却又如实地反映出纳什喜悲交加的一生:纳什在数学领域工作,从早年开始就非常优异,1958年他被美国《财富》(Fortune)杂志评为新一代天才数学家中最杰出的人物。就在纳什春风得意、事业将达到顶峰时,却突然遭受命运无情的重重一击,从云端坠入地狱:30岁的纳什患上了严重的精神分裂症。天才的他一生为精神分裂症所困扰,并在私生活上毫不检点。纳什青年时代曾与一位大他5岁的姑娘交往,两人还有个私生子,纳什在精神分裂症发作之前一直与她保持着若即若离的暧昧关系。他的父母4年之后发现此事,不久后纳什父亲去世,不知是否与这个打击有关。父亲去世之后,纳什与麻省理工学院(MIT)年轻美丽的女学生爱莉西娅(Alicia)结婚,此后40多年患难与共的爱情和亲情中可以见证这是他的个人生活中最完美、最幸运的时光。
就在爱莉西娅身怀有孕,正待分娩的同年,纳什的精神状况却日益恶化。他的举止越来越古怪,正一步步走向心智狂乱。他麻烦缠身,有一次竟然因为在男洗手间“不恰当地”暴露了自己的身体被逮捕。
万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。1970年,纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的情感生活。她体贴他不肯去医院封闭治疗的愿望,把家搬到远离尘世喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。
爱莉西娅不能眼睁睁看着这个天赋异禀的天才就这样消沉。作为妻子的爱莉西娅用爱去挽救丈夫,尽管这对幸福的人在恋爱时的卿卿我我此时已荡然无存。纳什被妻子的这种无可动摇的爱和坚定的信念所感染,决心同疾病抗争到底。在深爱他的妻子爱莉西娅的帮助下,在他自己的天才与狂乱中,纳什陷入了一种狂热的智力上的极高的境界。
这改变了一切。经过很多年的艰苦努力,纳什最终走出阴霾,理性为他带来了心灵的平和。终于在1994年纳什凭借他在现代博弈理论上的卓越贡献,获得科学界的最高荣誉———诺贝尔奖。
人们在观看影片的时候,不禁会想,天才纳什在博弈上的贡献主要是什么?为什么好莱坞会为这样一个充满传奇色彩的博弈论大师拍摄出这样纪实性的影片呢?这部片子为什么又是如此地震撼了全球亿万观众的心灵?
可能很多人对博弈论的兴趣正是《美丽心灵》这部传世之作所引发出的。
众所周知,现代博弈理论由匈牙利大数学家冯·诺伊曼(John von Neumann)于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈,比如两个人打乒乓球,一方赢则另一方必输,两个人获利的总和为零。在这里能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”或者是最优的具体策略?怎么样的策略才是“合理”?
应用传统决策论中的“最小最大”准则,即博弈的每一方都假设对方的所有策略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。用通俗的话说,这个著名的最小最大定理所体现的基本思想是“抱最好的希望,做最坏的打算”。
虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。二人零和博弈主要的局限性:一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大于零或小于零的净获利。
1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。
1950年纳什曾带着他的想法去会见当时名满天下的冯·诺依曼(博弈论创始人之一,天才数学家),遭到断然否定,在此之前他还受到爱因斯坦的冷遇。但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。
对于多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在于他天才性地提出了“纳什均衡”的基本概念,为更加普遍广泛的博弈问题找到了解。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都是沿着这条主线展开的。
纳什的好友,普林斯顿大学经济学教授迪克西特曾说:“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”
诺伊曼在《博弈论与经济行为》一书中还建立了合作型博弈论的基本模型,但是对于其中双向协商问题,也就是参与者如何“讨价还价”的问题,没有给出一个确定的解。
纳什对这一领域同样作出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤———协商的目的最终仍是最大化自己的利益。
此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。这一思想初次提示了在重复博弈理论中串谋的可能性,这一发现在经济和政治领域起到重要的作用。
在《美丽心灵》中有这样的情节:1994年美国政府向商家拍卖大部份电磁波谱。这一多回合拍卖由很多博弈论专家精心设计,设计的目的就是最大化政府收益和各商家利用率。这个设计取得极大的成功。政府获得超过100亿美元的收入,各频率的波谱也都找到了满意的归宿。
与此相对应的是,新西兰一个类似的拍卖会惨遭失败。因为他们没有经过博弈理论来设计拍卖规则。结果,政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证。
正是因为博弈论对现代经济生活具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。
也许正如罗素·克洛在领奖时对《美丽心灵》的评价一样,纳什与他的博弈论对我们,“能帮助我们敞开心灵,给予我们信念,生活中真地会有奇迹发生。”
 
无处不在的博弈
 
日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏?
实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略 ,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。
“自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。
生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。
在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。
夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。
根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。
夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。
在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。
事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。
如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是稀缺的或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始一场博弈。
《孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“……”,而这正是博弈双方所掌握的公共信息。
因此我们可以了解到,形成一个博弈有4个要素:
1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。比如一个单身汉,就不可能存在夫妻吵架的博弈,更不存在是否送花讨太太欢心的困扰。
从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。
最简单的一个最优化的例子就是,吸烟伤肺,不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡(Tradeoff)。如果这个烟民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着其他参与者的决策结果。
在冯·诺依曼(Von Neumann)的博弈论奠基之作《博弈论与经济行为》一书中举过这样一个经典的例子。在《鲁滨逊漂流记》中,与世隔绝的“鲁滨逊”(Robinson Crusoe)一个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最大值的问题。
因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五”(《鲁滨逊漂流记》中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈问题。
2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。资源指的不仅仅是自然资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职位等。
如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”“大道之行也,天下为公。”的大同社会。
当然,不可否认是,一方面,博弈者之间会发生冲突;另一方面,他们当中也包含着合作的潜力。
值得强调的是,资源是有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。
经济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如,“孩子总是自己的好,妻子总是别人的好”:自己的孩子在眼里是无价之宝,而在别人面前相对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正是效用递减规律起了作用。
最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国,人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。
3.参与者有自己能够选择的策略(Strategy)。所谓策略,就是“计利以听,乃为之势,以佐其外。势者,因利而制权也。”这指的是直接实用的针对某一个具体问题所采取的应对方式。通俗地说,策略就是计策,是博弈参与者所能够选择的手段方法。
一般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局势特征这些理论化的内容。而博弈论中的策略选择,是先对局势和整体状况进行分析,确定局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈对局中的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。
4.参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的。
但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情理上说,在实际生活中一般是要带伞以防不测。
通俗地说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就不可避免地要面对各种矛盾和冲突。
所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就是研究人们如何进行决策,以及这种决策如何达到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
 
博弈是一种竞合游戏
 
2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟约,共同 抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救;其二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边和平关系。
当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联盟的破坏正是从齐国开始的。
在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好,结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系,齐国最终被灭,千古一帝秦始皇得以名扬千秋。
“博弈论”的英文是“Game Theory”,实际上Game的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。
从秦始皇的故事中,我们看到博弈中包含了竞争冲突与合作两种截然不同的策略。所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争中包含着潜在合作的种子,合作中包含着潜在竞争的种子。
合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。
合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称Opec)。1960年9月,伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。欧佩克在这个时候应运而生。欧佩克现在已发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。它统一协调各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。
对于个人来说,从博弈论的角度来看,在人生、事业一筹莫展的时候,如何能寻找到一个快速突破困境的办法?
首先要寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。如果在困境之中,有人与你因为同样的原因无法抽身,那么是否能够和这个人一起摆脱不利的处境,在合作的基础上走向双赢呢?
《红楼梦》里面形容四大家族的时候,用过一个评语,叫做“一荣俱荣,一损皆损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成一个牢固的联盟。
那么,如果两个同时处在困境中的人,也有这种利益+亲缘的双重关系,他们合作起来就会更加容易,而且形成的合力就会更大。正所谓“二人同心,其利断金”,而要做到“同心”,只有利益上的合作是不够的,还需要一种近乎亲情的亲缘关系。显然,这是可遇而不可求的,因为亲缘关系不是能够随便形成的。
智力游戏与博弈相近似的本质是:在确定游戏规则的约束下,游戏参与者决策、行动的过程。各种智力游戏实质上就是一个社会的经济、管理、军事、政治等现象抽象出来的缩微模拟模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。
游戏是一种抽象。面对复杂现象时,人们经常会“只见树木不见森林”,无法抓住某种现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低,从而轻松地分析问题并找到合理可行的解决方法。
中国最古老的围棋智力游戏,其最初的功能形态就是模拟战争。围棋包含最多的就是博弈的内涵,特别是战争中的博弈内涵,如围而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和目的,来研究战争的规律。
围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。然而,其作为一项智力游戏,围棋与战争在很多方面都相通。围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。
战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。
围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐就是基于效果的典范。
现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17分钟内过桥吗?”
这可不是微软公司的别出心裁,据说许多跻身世界500强的公司在招收新员工时,都要出类似的智力题。
智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。
思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想象,亲自动手操作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强。这一点已成为人们的共识。
在许多智力游戏中,都存在这么一个共同的特点:就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏的规则一旦定好之后,策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。
至于从围棋初段到九段之间的差别,从博弈论的角度去看,不过是他们策略选择技巧的高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。
任何游戏都有自己的规则(Rule of the game)。实际现实中的人类社会自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就确定了人们行为的前提条件。
因此博弈与游戏都有一个重要的共同特征:那就是这些规则规定游戏参加者可以做什么,不可以做什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的处罚等。
游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。
 
从围棋定式谈纳什均衡
 
我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世间的事物很少有不依赖于其他事物而存在的。非合作博弈强调利益的冲突,即非合作甚至对抗状态。
比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋1 9×19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。
世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受方案。
围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当,互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。
在经济学中,均衡(equilibrium)意即相关量处于稳定值。均衡是在分析均衡价格与数量的决定与变动的状况。供需均衡时会达到供需相等,市场出清,也就是在其他条件不变下,会维持不变的状况。
一物的供给量等于需求量的价格,就是其均衡价格,对应的数量就是均衡数量。这就是在供给线与需求线相交之处,也称为均衡点。比如在供需分析中,若某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重要方法。
在谈纳什均衡之前,我们先来看这样一个例子。这个例子对大家所熟知的“囚徒困境”做了一些微小的修改,结果却是发生根本的变化。
A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬而未决的银行抢劫案,并且他根据一系列的线索判定A和B是这桩案子的凶犯。
因为该局管辖地区治安一向混乱不堪,C的上级对C非常恼火,直接威胁C,如果银行案破不了,就要撤销C局长的职位,给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A和B。为了能够让两个囚犯认罪,C想让A和B明白,假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻发落。
于是,这个警察局长C分别与A、B立下许诺:如果只有一个人坦白认罪,则认罪的一方会收到所有指控,会因抢劫银行而判无期徒刑,另一个人则不会再加刑罚。如果无人认罪,两个人都会因盗窃罪而判刑2年。如果两个人都坦白,则两个人都被判处有期徒刑5年。
这样,警察局长C给A和B构造了一个博弈。不妨假设,A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时A和B被分别审查不能够进行沟通。
在这种情况下,A会在心里打起小算盘,他会想:如果选择坦白,那么B选择坦白时将判刑5年,B选择不坦白时将被判无期徒刑,因此选择坦白时最坏的打算就把牢底坐穿;若是选择不坦白,那么B选择坦白时将无罪释放获得自由,B选择不坦白时将判有期徒刑2年,因此选择不坦白时最坏的可能就是被囚禁5年。
两害相权,取其轻。因此在这种情况下,A必然会选择不坦白,同样的道理,B也会选择不坦白。这个时候,博弈达到了这样一种局面,这种局面就是纳什均衡(Nash Equilibrium)。
纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡。
这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。
再简单一点说,一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就可称为是一个纳什均衡点。
相反,如果锅是扣在地上的,那么一个乒乓球很难在锅底部位保持稳定,因为往任何方向的一点点移动,都会使球立刻离开锅底。这时的锅底部位就不是一个纳什均衡点了。
博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。
在上面的“囚徒困境”变形的博弈中,A和B都不坦白就是一个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着对整体而言是最有利的结果,比如“囚徒困境”的例子导致了整体的不利。
围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下的博弈,这就是博弈论中的静态博弈概念。
围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。
这是一条线性的推理链:“假如我这么做,他就会那么做———若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。
在动态博弈中,存在明显的马太效应,也就是说凡是拥有较少的,连他仅有的那一点点也夺过来;凡是多的,就加给他,让他更多。比如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用马太效应原理,在获得优势的情况能够保持优势,扩大优势,直至最后成功。
而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。
要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。
因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认为……”。
这样来看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。
因此在动态博弈中,纳什均衡的要义在于:即使在对抗条件下,双方可以通过向对方提出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant strategy),即无论对方作何选择,这一策略始终应优于其它策略。
 
从爱情故事谈起:优势策略 
“原地高天,堪叹古今情难尽;痴男怨女,可怜风月债难偿。”
我们来先看欧·亨利的小说《麦吉的礼物》描述的这样一个爱情故事。新婚不久的妻子和丈夫,很是穷困潦倒。除了妻子那一头美丽的金色长发,丈夫那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方 的利益,他们愿意奉献和牺牲自己的一切。
话说明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,每个人还是想悄悄准备一份礼物给对方。丈夫卖掉了心爱的怀表,买了一套漂亮发卡,去配妻子那一头金色长发。妻子剪掉心爱的长发,拿去卖钱,为丈夫的怀表买了表链和表袋。
最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主义行为,结果却使得双方的利益同时受损。
欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事,来交换送礼的好处。然而,我讲的这个平平淡淡的故事里,两个住公寓的傻孩子,却是笨到极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”
从这段文字看,欧·亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。我们假定,他们每个人,有一个“毫不利己,专门利人”的偏好系统,毫不考虑自身利益,专门谋求别人的幸福。
这样,个人选择付出还是不付出,只看对方能不能得益,与自己是否受损无关。以这样的偏好来衡量,最好的结果自然是自己付出而对方不付出,对方收益增大;次好的结果是大家都不付出,对方不得益也不牺牲;再次的结果是大家都付出;最坏的结果是别人付出而自己不付出,靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价:第一种结果给3分,第二种结果给2分,第三种结果给1分,最后那种给0分。
不难看出,无论对方选择付出,还是选择不付出,个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上,大家都选择不付出,明显优于大家都选择付出的境况,这就达到了上文提到的纳什均衡。
实际上,这里的例子有一个占优策略均衡。通俗地说,在占优策略均衡中,不论所有其他参与人选择什么策略,一个参与人的占优策略都是他的最优策略。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。
因此,占优策略均衡一定是纳什均衡。在这个例子中,妻子选择不付出,也就是不剪掉金发对于妻子来说是一个优势策略,也就是说妻子不付出,丈夫不管选择什么策略,妻子所得的结果都好于丈夫。同理,丈夫不卖掉怀表对于丈夫来说也是一个优势策略。
再举个常见的例子:一名篮球前锋和队友在篮下面对着对方的一个后卫时,形成了二打一的局面,该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。
如果一个球员具有这样一种策略,无论其他球员怎么做,这个策略都会高出一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策就会变得非常简单,只要直接采用该策略而完全不必考虑对手的应对策略。
还有一个要注意的问题是,采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者采用优势策略在对方采取任何策略时,总能够显示出优势。
比如就这个例子来说,就妻子来说,她采用不付出的策略,无论丈夫付出或不付出,妻子的不付出策略总是占有优势。丈夫的优势策略也是一样。但是,妻子选择不付出的最坏结果是1,选择付出的最好结果是3,很明显,妻子的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一筹。
反之,劣势策略则是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略,劣势策略是我们在日常生活中不可以选择的行动。劣势策略是与优势策略相对应的概念,笔者这里就不多做介绍。
房地产开发博弈、警察捉小偷与混和策略
 
实际上,在每个参与人都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。
假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。
但遗憾的是,并不是所有博弈都有优势策略,哪怕这个博弈只有两个参与者。实际上,优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。
来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。
因为,如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。这样就形成了一个循环选择。
根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。
这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在房地产博弈中,我们无法知道,最后结果是A开发B不开发,还是A不开发B开发。
再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。
因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。
一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A家还是B家。
因为A家的财产是B家的2倍,小偷自然光顾A家的概率要高于B家,不妨用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。
而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l/3的机会去A家,2/3的机会去B家。这些数值是可以通过联立方程准确计算出的,笔者这里就不给出具体的数学计算过程了。
细心的读者会发现,警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别,就是用到了概率的知识,警察与小偷没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。
在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。
用专业的话来说,所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。
所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。
最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳什均衡。
再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。
由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。
在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。
 
位置博弈的策略
 
有这么一个大家都很熟悉的现象,那就是在每个大大小小的城市街道上,经常见到一些地段上的商店十分拥挤,形成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。
更有意思的是,往往同类型的商家总是聚集在比较近的地方,比如肯德基、麦当劳之间总是紧紧相邻。再如超市现象,前两年有很多人对超市的布局发表了一些议论。因为有人注意到,如果在 一条街上有2~3家超市的话,这几家超市经常会“相依为邻”,选址离得很近,倘若它们稍微分散地布置于街上,无疑对市民的购物提供相当的便利,因此他们认为超市“拥挤”在一起属于资源浪费。
类似的事情也发生于国内各省级电视台的节目播放。很多电视迷会发现,大部分电视台总是将最精彩的节目放在相同的时间段,甚至有些时候是在相同时间段播放类似的节目,比如你播“快乐大本营”,我就播“超级总动员”;你播“玫瑰之约”,我就播“单身男女”。人都说文人相轻,电视台也是这么相煎太急。
博弈论能够对这个现象作出科学的解释。首先对一个简单的博弈模型进行叙述:
假设有条完全笔直的公路,连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆,并且车流量在公路上是均匀分布的。假设有两家快餐店,我们不妨假设为靠高速公路起家的麦当劳与肯德基,它们要在这条公路上选择一个位置开设快餐,招揽来往车辆。为了能够更加清晰地说明这个博弈,我们不得不画一张图。
再对该模型作一个合乎逻辑的假定:通常情况下,车辆总是乐意到距自己最近的快餐店购买食物。根据这个原则,从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优。
在这种均匀散布的情况下,每家快餐店都拥有1/2的顾客量,同时对于开车的人们总体来说,这种策略的选择,车辆到快餐店的总的距离最短。
然而,人生不如意事十之八九,天并不总能遂人之愿。肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性。他们只要手段合法,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。
出于这种理性,肯德基分店经理肯定会想到:如果我将店铺从3/4点处向左移一点,那么1/4点之间的中点不再是1/2点处,而是位于1/2点的靠左边一点。这等于说,这一移位,肯德基将从麦当劳夺取部分顾客,这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。
不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态,甲乙两人相依为邻且相安无事地做起快餐生意。如果我们放宽条件,不是两家快餐店,而是很多家快餐店,很容易分析得到结果:这些快餐店仍然会在1/2处设店达到纳什均衡。
同样的道理,如果地段的繁华等其他原因在一条路上都可以认为到处相同的话,没有一个商家会将自己安置于某条路的一头,只要条件许可,超市将几乎趋向于相依为邻,这种现象完全可以看做公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理,在博弈论中称为位置博弈。
电视台之间在时间段上的重叠问题在本质上就是位置博弈。事实上,我们只要将时间设想为上述案例中的公路,就不难分析出:市场竞争的结果就是,观众青睐的精彩节目将集中在同一黄金时段。在这种情况下,电视台之间的竞争会更加激烈,为了获得收视率,电视台只能在制作质量上下功夫,最终获得实惠的仍然是广大观众。
西方国家在名义上是民权政治。实际上,选举上台的各个政党之间的政策并没有多大差别。就拿美国来说,民主党与共和党为了能够获得总统大选的胜利,必须要尽量争取最多的选民。两党在制订政策时,必然以这个目的为原则。我们把选民的政治主张看成是位置博弈中的均匀分布的人群,把两个政党看成是两个店铺,最终的结果必然是两个政党的政策趋向于折衷,并且非常近似。从这个意义上来说,西方政党的换届选举倒真是有“换汤不换药”的味道。
 
猎鹿模型的合作哲学
 
社会学告诉我们,在人类文明之初的原始社会,人们维生的方式主要是狩猎。
话说某个部落有两个出色的猎人,某一天他们狩猎的时候,看到一头梅花鹿。于是两人商量,只要守住梅花鹿可能逃跑的两个路口,梅花鹿就会无路可逃。只要他们能够齐心协力,梅花鹿就会成为他们的盘中餐。不过只要其中有任何一人放弃围捕,梅花鹿就会逃跑掉。
“福兮祸之所依;祸兮福之 所伏。”有时运气太好并不一定有好的结果。正当两个猎人严阵以待,围捕梅花鹿的时候,在两个路口都跑过一群兔子,如果猎人去抓兔子,会抓住4只兔子。从维持生存的角度来看,4只兔子可以供一个人吃4天,1只梅花鹿如果被抓住将被两个猎人平分,可供每人吃10天。这里不妨假设两个猎人叫A和B。
在这个矩阵图中,每一个格子都代表一种博弈的结果。具体说来:
1.左上角的格子表示,猎人A和B都抓兔子,结果是猎人A和B都能吃饱4天;
2.左下角的格子表示,猎人A抓兔子,猎人B打梅花鹿,结果是猎人A可以吃饱4天,B则一无所获;
3.在右上角,猎人A打梅花鹿,猎人B抓兔子,结果是猎人A一无所获,猎人B可以吃饱4天;
4.在右下角,猎人A和B合作抓捕梅花鹿,结果是两人平分猎物,都可以吃饱10天。
在这个博弈中,根据纳什均衡的定义,应用博弈论中的“严格劣势删除法”(有兴趣的读者可以找本书参考文献中的相关书籍阅读,这里不做详细介绍。)可以得到该博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。
两个纳什均衡,就是两个可能的结局。两种结局到底哪一个最终发生,这无法用纳什均衡本身来确定。
比较[10,10]和[4,4]两个纳什均衡,明显的事实是,两人一起去猎梅花鹿比各自去抓兔子可以让每个人多吃6天。按照经济学的说法,合作猎鹿的纳什均衡,分头抓打兔子的纳什均衡,具有帕累托优势。与[4,4]相比,[10,10]不仅有整体福利改进,而且每个人都得到福利改进。
换一种更加严密的说法就是,[10,10]与[4,4]相比,其中一方收益增大,而其它各方的境况都不受损害。这就是[10,10]对于[4,4]具有帕累托优势的含义。
在经济学中,帕累托效率准则是:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人。
一句话简单概括,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。
相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说已经达到帕累托效率。效率是指资源配置已达到这样一种境地,即任何重新改变资源配置的方式,都不可能使一部分人在没有其他人受损的情况下受益。这一资源配置的状态,被称为“帕累托最优”(Pareto optimum)状态,或称为“帕累托有效”(Pareto efficient)。
目前在世界上比比皆是的企业强强联合,就接近于猎鹿模型的帕累托改善,跨国汽车公司的联合、日本两大银行的联合等等均属此列,这种强强联合造成的结果是资金雄厚、生产技术先进、在世界上占有的竞争地位更优越,发挥的影响更显著。
总之,他们将蛋糕做得越大,双方的效益也就越高。比如宝山钢铁公司与上海钢铁集团强强联合也好,还是其他什么重组方式,最重要的在于将蛋糕做大。在宝钢与上钢的强强联合中,宝钢有着资金、效益、管理水平、规模等各方面的优势,上钢也有着生产技术与经验的优势。两个公司实施强强联合,充分发挥各方的优势,发掘更多更大的潜力,形成一个更大更有力的拳头,将蛋糕做得比原先两个蛋糕之和还要大。
猎鹿模型的讨论,我们的思路实际只停留在考虑整体效率最高这个角度,而没有考虑蛋糕做大之后的分配。猎鹿模型是假设猎人双方平均分配猎物。
我们不妨做这样一种假设,猎人A比猎人B狩猎的能力水平要略高一筹,但B猎人却是酋长之子,拥有较高的分配权。
可以设想,A猎人与B猎人合作猎鹿之后的分配不是两人平分成果,而是A猎人仅分到了够吃2天的梅花鹿肉,B猎人却分到了够吃18天的梅花鹿肉。
在这种情况下,整体效率虽然提高,但却不是帕累托改善,因为整体的改善反而伤害到猎人A的利益。我们假想,具有特权的猎人B会通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭到伤害,这必然会导致整体效率的下降。进一步推测,如果不是两个人进行狩猎,而是多人狩猎博弈,根据分配可以分成既得利益集团与弱势群体,这和我国的现状非常相似。
我国改革的进程在九十年代中期以前是一种帕累托改善的过程。但是随着各种复杂的不确定因素影响,贫富差距逐渐拉大,基尼指数甚至超过0.45的国际警戒线,帕累托改善的过程受到干扰。
这种情况如果继续下去,社会稳定和改革深化必将受到决定性的冲击。我们的党和政府已经关注到弱势群体的生存状态,并适时地提出建设和谐社会的改革目标,纠正了一些错误思潮,将改革的进程拉回到健康的轨道。
 
“囚徒困境”的深刻哲理
 
在博弈论中,有一个流传颇为广泛的故事,叫做“囚徒困境”(Pris-oner‘s Dilemma)。
话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。
这个时候,聪明 的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们2年刑期。但是,我可以和你做个交易。如果你招了,他不招,那么你会作为证人无罪释放,他将被判10年徒刑;如果你招了,他也招了,你们都将被判5年有期徒刑;如果他招了,你不招,他无罪释放,你被判无期徒刑,终身囚禁;如果你们都不招,各判2年。”
一般读者可能会误认为,既然两个囚犯最好的结果是都不招供,两人都只被判2年,那么,两个囚犯都选择不招供就是这个博弈的最终结果。
然而,人算不如天算,“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判有期徒刑5年。
反过来说,这也是警官的聪明之处。警官采取的游戏规则必然会让两名囚犯坦白罪行,认罪伏法。对一个博弈来说,游戏规则非常地重要,适宜的规则才能够达到目的。在我们的日常生活中莫不如此,规则制订者往往利用条件制定出有利于自身的规章制度。
读到这里,很多读者不禁会问,为什么两个人都选择了“招”,傻到接受这种最坏的结果呢?
在解释这个问题之前,笔者首先说明一下,囚徒困境和其它的博弈一样,都需要有2个前提假设:囚徒A和B两人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略;两人无法沟通,要在不知道对方所选结果的情况下,独自进行策略选择。
囚犯“思想搏斗过程”大致如下,囚犯A的内心活动是这样:假如他招了,我不招,我就要将牢底坐穿,招了最坏坐10年,还是招了合算;假如他不招,我也不招,只坐2年的牢(因无法串供,风险太大);如果我招,他不招,马上被释放,也是招了合算。
因此,无论囚犯B是坦白还是沉默,囚犯A采取坦白的策略对自己更为有利。
同样,以上推理也适用于囚犯B。结果两个囚徒都坦白了,都被判刑5年。
囚徒困境之所为被称为“困境”,正是在于:如果A、B二人都保持沉默,则都只被判刑2年,显然比两人都坦白的结果要好。
两名囚犯都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是惟一的纳什均衡点。
除了这个均衡点,A与B的任何一人单方面改变选择,他只会得到更加不经济的结果。而在其它的结果中,比如两人都不坦白的情况下,都有一人可以通过单方面改变选择,来减少自己的刑期。可是两人经过一番理性计算后,却选择了一个使自己陷入不利的结局。
其实“囚徒困境”不允许囚犯A和B进行沟通的假设,与实际生活中大部分情况的现实是有差异的。比如,在爱情博弈中,很多恋人会经常花前月下、彻夜厮守;在企业的价格战中,企业之间也会多有沟通,甚至结成价格联盟;即使是20世纪下半世纪的美苏军备竞赛中,两个超级大国也会经常进行外交交谈,及时交换信息。
因此不妨将条件放宽,允许囚犯A和B在审讯室里在一起呆上10分钟,给予他们充分的串供的机会。
很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。
我们不妨设想囚犯A的心理活动。他一定会认为,如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若自己不坦白就会被终生囚禁。事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。对于囚犯B也是一样。
虽然“坦白从宽,抗拒从严”的道理人人都懂,而从博弈论的角度来看,实际上就是一个囚徒困境的应用。“囚徒困境”被看成是博弈论的代表性案例,不仅因为其简单易懂,还在于它的现象在日常生活中广泛存在。
比如,恋人们在恋爱中的海誓山盟,最终还是分手;企业之间相互沟通合作结成战略关系时是信誓旦旦,但价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。
囚徒困境的游戏规则,能够让狡猾的罪犯招供,得到应有的惩罚,固然不是坏事。然而,我们不妨假设囚徒A和B完全都是清白的具有理性的大大的良民,这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中,审案存在对身体的残害,完全可能造成屈打成招的冤假错案。在中国历史上,这种冤案并不是什么稀少的事情。
从更深刻的意义上讲,囚徒困境模型动摇了传统社会学、经济学理论的基础,这是经济学的重大革命。
传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。
传统经济学秉承了亚当·斯密的思想。传统经济学认为:因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。
但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。
简单地说就是,在一个集体里,有可能每个人的选择都是理性的,但对于整个集体来说其结果却不是理性的。比如大家所熟悉的股市。股市的参与人数虽然十分庞大,但实际上是只有多与空、机构与机构、散户与散户之间的双方“博弈”,有人将此称之为“零和游戏”。
股市“博弈”双方的多数也处在一种“囚徒困境”中。对于股市中博弈双方来说,当股市涨到最高点时,无论对散户,还是对机构来说,任何一方的最大利益在于“我卖,而你没卖,我获得最大盈利”,而对于双方来说最理想的状态是“大家都不卖,把股市推向一个更高点位,大家都有更多利润空间”。但实际结果却大相径庭,市场“无形之手”没起作用,却是“囚徒困境”起到了决定性的作用。
佛家讲因果报应,儒家讲究“财自道生,利缘义取”。从“囚徒困境”看来,如果一味地想算计别人,算来算去,最后却算计到自己头上来了。如果我们将“囚徒困境”故事中的无期徒刑改为死刑,那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过了。
那么怎么样才能摆脱“囚徒困境”呢?
博弈双方都付出代价,失去自己不愿失去的东西,但只有这样才能共存并且摆脱囚徒困境,这有如壮士断臂,不得不为,也乐得为之。
如果说“兄弟阋于墙,共御外侮”是理想化的摆脱囚徒困境的策略,那么出卖“兄弟”以还得自己的平安,则是处于囚徒困境下本能的选择。趋利避害是人的本能,在经济行为和社会行为中这一本能都鲜明地体现着。
值得注意的是,并不是所有的“囚徒困境”都需要走出来或都需要解脱。如果所有的罪犯都走出了困境,那么将对社会产生灾难性后果,社会将充满了犯罪和混乱。
 
“囚徒困境”的破解:合作的约束
 
“不识庐山真面目,只缘身在此山中。”严格囚徒困境的前提条件是博弈各方不可以进行合作,也就是不能够制订有约束力的协议。但实际上,合作是文明的基础,比如兴修水利、组织国防、创建企业等都是合作而产生的,无怪乎哲学家卢梭写了本书《社会契约论》,认为契约是整个人类社会存在的前提条件之一。
如果囚徒困境只是一次性的博弈,签订协议是毫无意义的 ,其纳什均衡点并不会改变。可以签订协议的一个最基本的条件,就是博弈需要重复若干次,当然至少大于一次。
就恋爱博弈来看,男女双方在交往的过程中,随时都在博弈,因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩迭宕正是这个博弈模型的表现。
当然,那种素不相识一对男女,偶尔在酒吧中相遇,于是宾馆订房、春梦一场,拂晓之后就各自分道扬镳的一夜情,是理所当然的一次性囚徒困境博弈。
我们在这里要注意的是,重复博弈与我们前面所提及一般性的动态博弈是不同的。在多轮动态博弈中,参与者能够了解到博弈的每一步中其他参与者在这个参与者选择某种策略下的行动,而重复博弈的参与者无法了解到在任何一个步骤中,其它参与者的策略选择。
囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生非常大的变化,博弈的结局也就是纳什均衡点可能会完全不同。
举个例子,大家都知道国外的黑手党组织严密,对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国,而是意大利,囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉。
实际上,在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后,博弈参与者都有作弊的动机。
因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。还是用爱情来打比方,常言道:“婚姻是走向爱情的坟墓”,但从博弈论的角度来看,婚姻恰恰是男女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的压力与社会舆论的谴责。
在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。
因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都采取合作态度会带来合作收益。但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况。
对于有限次囚徒困境博弈,美国密西根大学的罗伯特·爱克斯罗德教授(Robert Axelrod)曾经做过一个著名的博弈论试验。这个试验的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序,然后这些程序会被成双成对地融入不同的组合。分完组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间作出选择。试验参与者连续玩上200次,于是这就更逼真地反映了日常人际关系。
试验的结果表明,囚徒困境在同样重复数十次或一百次的情况下,只要两个参与者仍然还是理性人(这可以在该试验的参加者所编程序中反映出),博弈的结果仍然是囚徒A和B都把对方招供出来。为了解释这个问题,我们不妨讨论一个博弈两次的模型。
我们首先考虑第二次博弈的情况,由于这是最后一次博弈,自然没有后面的博弈对这次博弈的影响,因此也就不必为将来打算,个人都只追求这次博弈的最大利益,于是第二次博弈的结果应该和一次囚徒困境博弈完全一样,自然是囚徒A和B都坦白,达到纳什均衡。
现在再来考虑第一次博弈的情况,博弈参与者A已经很清楚最后一次博弈时,B一定会招供,那么即使囚徒A不坦白,在下一次博弈时,B也一定会招供,这次博弈A不坦白对下一次博弈没有任何好的影响,那么作为理性人的A一定仍然选择坦白。对于B,也是一样的道理。由此可见,第一次博弈自然也和一次性囚徒困境博弈完全一样。
其实不论是两次博弈,还是3次,4次,甚至是上百次,只要是有限次数的重复囚徒困境博弈,其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法(Backward induction),这在博弈论中,对于重复博弈与动态博弈是一种重要的分析方法,当然这对我们在日常生活中分析问题也不无裨益。
比如,汽车企业之间的价格战往往不是一次性降价,而是一轮一轮地降价,这种类似的问题都可以用有限次囚徒困境模型来分析,事实情况和我们前面的分析完全相同,汽车企业之间每一次的价格博弈的纳什均衡只有一个,那就是全体降价。
笔者在这里最后还要补充一个问题,就是多人重复囚徒困境的博弈。实际上,生活中的两人博弈毕竟是特例,绝大部分的情况还是多人博弈,比如上面提到的汽车价格战。在多人博弈中,只有其它所有参与者在第k-1次博弈中都是合作的,某个参与者才会在k次博弈中采取合作策略。
然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的。
比如1992年英镑事件前后,可以明显感觉到有关游戏各方的思路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体;而它们在考虑统一货币的利益时,均在强调自己的利益;德国在其中的地位很特殊,它具有双重身份,既是欧洲汇率机制的基础,也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。
索罗斯的量子基金发起攻击的主要原因在于:德国联邦银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本国利益受到损害时,也必然倾向于自保。而在这种分歧加剧的背景下,无疑会加重有关各方拒绝承认错误的立场,这又进一步加重了分歧,索罗斯正是利用这套机制获利的。
这个结论似乎是一个令人绝望的,但绝望之处必有希望,欧元已经成功地在欧洲大陆通行,成为可以与美元相抗衡的硬通货。这其中的道理,笔者在后面将告诉读者,什么样的游戏规则可以保证博弈各方稳定合作。
 
威胁、承诺、作弊与惩罚
 
西方哲学家卢梭说过,“究竟是什么不可思议的艺术,使人类找到一种法,通过强迫人们服从,从而使他们获得自由?”
其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国 君主立宪政体的理论奠基人,其代表作是政治学名著《利维坦》(Leviathan)。所谓“利维坦”,是《圣经》中的一种力大无穷的巨兽名字的音译,在书中意指一个强大的国家。
霍布斯说:“人的自然本性是自私自利、恐惧、贪婪、残暴无情,人对人互相防范、敌对、争战不已,像狼和狼一样处于可怕的自然状态中。于是出于人的理性,人们相互间同意订立契约,放弃各人的自然权利,把它托付给某一个人或一个由多人组成的集体(如议会、董事会、法院等),这个人或集体能把大家的意志化为一个意志,能把大家的人格统一为一个人格;大家都服从他的意志,服从他的判断。这个人或这个集体就是主权者,而像这样通过社会契约而统一在一个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生,用更尊敬的方式来说,这就是活的上帝的诞生。”
按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。
霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说,没有权威的协议并不是导致民主,而是导致无政府状态。最后,霍布斯总结道,“在一切政体中,最坏的政体并不是专制而是无政府状态。”
霍布斯的观点虽然有些偏激,但却不无道理。根据博弈论的观点,无论是一次性或有限次重复博弈,“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑,这最终导致合作协议无法稳定遵守。
实际上,决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个,即承诺与威胁。所谓承诺,在囚徒困境中就是囚徒向对方相互许诺,在下一次博弈时会采取让对方有利的行为,也就是不坦白与对方合作;所谓威胁,就是某个囚徒告知对方如果下一次博弈时其采取招供策略而不合作,在第三次博弈时就会采取不利于对方的策略,即招供。
其实,在社会生活中,承诺与威胁是非常常见的现象。比如女生告诉她的男朋友,如果他敢结交其他的女生,只要被发现一次,就立刻分手,这是威胁;而她男朋友向她发誓绝对自己是个专一的情圣,决不会背叛爱情,这就是承诺。
再如在外交中,美国经常向中国承诺只承认一个中国的原则,我国政府向国际社会承诺中国强大也决不会采用霸权政策。很多常见的耳熟能详的俗语都是承诺与威胁,比如“人不犯我,我不犯人”、“坦白从宽,抗拒从严”、“以眼还眼,以牙还牙”等。
合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择之前作出的,如果承诺与威胁对博弈者的约束力越小,那么合作的可能性就越小。比如很多手慈心软却遇人不淑的妻子,一次又一次地原谅胡作非为的丈夫,希望用真情感动他回心转意。但结果却往往是丈夫反而得寸进尺,因为他知道无论如何,只要用一些花言巧语假装可怜的承诺就会获得宽恕。在这种情况下,妻子的威胁对丈夫是毫无作用的。
假想一个可信度很小的承诺与威胁。比如参加考试的学生承诺在没有老师监考的时候决不作弊,但却不难想象监考老师不在的时候,考场中将会是一种什么样的景象。
学生并不都是道德高尚、具有很强自制能力的人。即使在有老师监督考场,并威胁如果有学生敢于顶风作案,必然严惩不怠,比如考卷直接判零分。设想一下,如果这种威胁仅仅是威胁,在学生作弊后并未真地采取什么严惩的行动,那么学生作弊的风险非常小,考场纪律依然与没有老师一样。由此可见,监考老师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。
从实际的整个社会生活说来,对于有限次重复博弈合作问题的解决主要有两个典型方法,那就是社会道德与国家法律。至于其他解决方法在本质上并不会超脱于它们。
 
第二部分
 
亚当·斯密在写完《国富论》与市场这只“看不见的手”之后,转而又写了本《道德情操论》,专门论述个人道德与社会道德是维持市场经济的基本要素之一。
猴子的故事与道理约束
 
亚当·斯密在写完《国富论》与市场这只“看不见的手”之后,转而又写了本《道德情操论》,专门论述个人道德与社会道德是维持市场经济的基本要素之一。
亚当·斯密告诉我们:最商业化的社会,也是最讲究道德的社会,比如16世纪时荷兰人就比英国人值得信赖,当时荷兰的商业比英国发达,反之亦然。
人类道德的产生一般有两种解释:
一是纯文化因素起作用,有些国家道德程度高,有些国家则低。如北欧人之间的道德感高于意大利人的道德感。
二是宗教信仰的原因,怕上帝惩罚你,所以有宗教信仰的人道德感就要强于一般人。如在美国,教会的人道德感比较强,因为他们认为若不道德,将来会进地狱。在这种解释中,道德是外界强加于人们的,使人们不违约。而笔者主要想给出的是第二种解释,即博弈论是如何解释道德的。
道德可以打破囚徒困境的难题,化解个人理性与社会群体理性的矛盾,维系整个社会经济体系的稳定与发展。关于这一点,我们来看一个猴群博弈的故事。近两年这个故事一直流传于中文网络各大论坛与社区。
有一群猴子被关在笼子里。在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。
猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了。这个过程一直重复着。
猴子们发现,尽管有猴子吃到香蕉,但吃到香蕉的猴子是少数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了。
在这个故事里,猴子间产生了“道德”。如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是“不道德的”,它们也会自动地惩罚“不道德的”猴子。当然这只是一个故事,但这个博弈故事却反映了人类的道德的产生过程。
霍布斯认为人类在没有任何约束的自然状态中,就是“人与人之间像狼与狼一样”,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有正义或不正义,只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状态下无法产生文明。
与国家一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生了道德感。
道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德,正义或非正义的观念,就自动地产生了调节作用。
当然,道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德约束的作用便失效。
假设笼子中的这群猴子由于天气炎热,想要冲凉,却因道德约束无法用盆子中的水。这时,终于出现了一位猴子A。这只猴子在无意中碰到了香蕉,理所当然地饱受老拳。但在这个过程中,猴子们享受到了冲凉的乐趣。等身上的水干了之后,某只猴子B在无意中碰撞了A,使A又一次接触到了香蕉,于是,猴子们享受了第二次冲凉,A遭到了第二次痛殴。在此之后,只要大家有冲凉的需要,就总有一只猴子挺身而出,对A进行合理冲撞。大家对A的态度也有了明显的不同,在平时大家会对A异常温和,以弥补在冲凉时为维护规则而不得不对它进行的暴力举动。
一天,在大家冲凉时,饱受折磨的A闻到了香蕉的清香,生物本能使它在别的猴子没有注意到时将香蕉吃掉。而且此后没有了新的香蕉来填补空缺。于是猴子们陷入了另一个尴尬境地:没有冲凉的水,也没有香蕉。于是,另一个规则便形成了。猴子在烦躁的时候会痛打猴子A出气,猴子A不得反抗。当笼子里的旧猴子被新猴子换掉时,新猴子会在最快的时间内学会殴打猴子A。
终于有一天,老天有眼,历尽沧桑的猴子A被另一只猴子代替了。猴子们失去了发泄的对象,只能任意选取一个目标进行攻击。从此以后,笼子里的猴子们不吃不喝不冲凉,唯一的举动就是打架。
这就是社会整体道德沦丧的过程。
在生活中的道德约束失灵也很常见。所有的人都知道,拾金不昧是美德。当拾到别人丢的100块钱时还给失主不仅有道德满足感,还会受到社会的表扬,建立起自己的美誉;若不及时交还失主并很容易被发现的话,则会受到严厉的谴责并失去社会信誉。
假想一下,当拾到别人遗失的价值上百万的古玩名画时,极大的可能是归为己有。这是因为其归还物品所受表扬的效用(道德满足感)与不归还物品所受谴责的效用之和远小于该价值巨大的物品带给他的效用。这种情况下,道德作用失效,法治就不可替换地成为约束人们行为的主要手段。
 
 为什么要有法律?
 
100多年以前,粱启超曾说过:“我国成文法之起源不可确指,然以数千年之思想往往视法律与命令同为一物。”直至今日,很多人在骨子里面往往还是视法律和命令同为一物。
从命令的角度来理解法律,是指个人意志或某个集团的意志以上下级纵向关系的方式传达,具有直接的强制力,在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第三者裁判等中 间环节或者客观机制作为媒介。这样的法律往往是朝令夕改,其约束力并不能长久保持。
更严重的是,这种法律经常演变成是权力的合法外衣,为个人私欲谋取利益,而法律不再成为凌驾于社会生活博弈的超然之物,而是让博弈又多了一个权力者的不公平参与。真正的法律是在顾及社会各方利益博弈均衡的结果,在社会博弈中具有独立性,不参与博弈。
同时,合理的法律必须要有强制性,不管是对社会大众还是掌握权力的人,都拥有至高无上的权威,所有的人都必须遵守法律的约定,包括制定与执行法律的人,否则必然要受到无法逃脱的惩罚。
在这样一种法治环境中,法律必然可以改善囚徒困境。我们来看这样一个例子。如所前述,我们假定执法人员独立于博弈之外,有公司A与公司B是商业上的合作伙伴,公司A经常向公司B购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签订买卖合同,一般在一周最后的那一天,公司A将现金打入公司B的银行账户,公司B则发货到公司A,若违约则处以2~5倍罚款。
实际上,如果公司A与公司B都是理性人,那么他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次交易中都有可能存在其中一家公司不遵守合同,逃款或逃货,即使公司A现金充裕,而公司B货源充足。所谓的熟人欺诈也是这个道理。
然而,在我们理想的法律环境下,公司A和B最佳策略都是合作。不妨假设公司A与公司B每年的交易都有十几次,平均每笔生意为100万,若违约则罚款200万。
见上图,在这个博弈中:
1.在矩阵的左上角,公司A和B都选择合作,双方收益均为20万(指公司A与公司B的利润);
2.在矩阵的左下角,在公司A付款,而公司B不发货,A损失100万,B收益100万;
3.在矩阵的右上角,公司A不付款,公司B发货,公司A收益120万(其中包含20万的利润),公司B损失80万(指公司B货物的成本,也就是收入减去利润);
4.在矩阵的右下角,公司A不付款,公司B不发货,双方收益为零。
当然,这里还要说明的是这个博弈中没有考虑商业信誉的问题,商誉是社会道德中的问题,后面笔者会详细讨论。
很显然这是一个有限次重复博弈的囚徒困境,注意到前文所介绍的模型都是对称的,这个博弈则是非对称博弈,这更加贴切于日常生活的真相。
在没有法律背景的条件下,双方选择不合作是自然的纳什均衡点。然而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款其200万元,并且法院可以强制执行。在这种情况下,两个“囚徒”,也就是公司自然都会采取合作策略,完成合同对各方所要求的行动。简单说来,就是法律改变了两个公司博弈的均衡结果。
霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。
这就是法律制定的第一条原则:效率原则。效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。
强制性有效法律是非常重要的。在冷战时期,美苏两个超级大国40多年的军备竞赛反证出这一点。尽管他们双方签订一些制止军备竞赛的协议,但因缺乏一个世界性的公平合理又具有强制性的法律环境,其结果仍然是陷入无法解脱的囚徒困境。
类似的还有各国的贸易保护主义的永恒倾向也很能说明这个问题,除非某一天出现全世界的国家都得到统一,建立一个全球性政府才可以彻底解决这些国与国之间的囚徒困境问题。
法律制定的第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。用简单的一句话说,法律惩罚太重对犯法者不公平,惩罚太轻则对社会或他人不公平。
因此在不同的国家以及在同一个国家的不同时期,对这两个原则的态度是不同的。法律制定的这两条原则要根据不同时代,不同社会的具体状况而各有侧重。
就目前我国的社会现状来说,国家法律与立法执法的重要性日益凸现。我们从法律制定的第一条原则来看,违反契约的惩罚越是严厉并可信,则博弈者违约的可能性越小,这是路人皆知的道理。
再从法律制定的第二条原则来看,权力对法律公平性的侵害有损法律的权威性与公正性,这也是众所周知的。“乱世用重典”,通过上述分析,读者您认为目前的中国社会应采用什么方式,才能适宜于治理、整顿、重构目前的社会系统运行状态呢?
 
爱克斯罗德试验中的针锋相对策略
 
如果没有外部强制力,囚徒困境中的参与者怎样才可以维持合作呢?
这是一个非常实际的问题。比如在国际事务上,国家与国家之间经常就某些问题达成一定的协议,这种协议我们在前面解释过,由于不存在一个世界性的政府,约束力往往很小。
对于这个问题,有这样一种答案。如果一方采取不合作的策略,另一方随即也采取不合作策略并且永远采取不合作策略,在博弈 论里面称之为触发策略(Trigger strategy),或称冷酷策略。
如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。
但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。
美国密西根大学罗伯特·爱克斯罗德教授那个著名试验,给出了这个问题更好的答案。爱克斯罗德邀的这些人都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦多大学的拉波波特写出的针锋相对(tit-for-tat)策略。说穿了,所谓针锋相对策略,就是胡萝卜加大棒的原则。
爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
这个游戏共进行了两轮。在第一轮游戏中,共有14个程序参加竞赛,并附加上爱克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),总共运转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相对策略程序。
这个程序的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。爱克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。
为了进一步验证第一轮游戏得到的结论,爱克斯罗德邀请了更多的人再做一次游戏。这时游戏进入了第二轮。第二次爱克斯罗德征集到了62个程序,同样也附加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是针锋相对策略。
爱克斯罗德总结这次游戏的结论是:第一,针锋相对方法仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是“不善良的”,后15名中,只有1个总是合作的是“善良的”。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是“清晰性”,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。
针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择“善行”,只因为合作是自我利益最大化的一种必要手段。
比如在爱情中的博弈原则应该是:善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。
比如对于恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁的回报。简单明了而不是山环水绕地对待恋人,在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。
在生活中一样可以运用这种方法。当一个人伤害了你的时候,你知道即便报复了他也并不能消除已对你形成的伤害。如果你还希望两个人的关系能够继续,那么最好是宽恕他。但是,若他知道即便伤害了你也会获得宽恕的时候,他就可能一直有意无意地不停伤害你。
就像我们在一些影片中看到某些心地善良却遇人不淑的女子。那些女子一次又一次原谅胡作非为的丈夫,希望用真情感动他回心转意;但结果丈夫反而得寸进尺,因为他知道无论如何只要一些花言巧语扮可怜就会获得宽恕。
所以有时候,人们会对伤害选择报复。当别人打你一拳,你若打回一拳,这本身并不能减轻你已挨那一拳的疼痛,而且用力打回一拳通常也得不到快感。那为什么还会回击呢?原因在于,你知道打不还手只会让对手更加猖狂,而选择回击是遏制对方进一步侵犯的方式。
所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见佳。这就是奇妙的人类互动世界。
 
利他主义与爱克斯罗德试验的局限
 
在爱克斯罗德试验中,选手策略有一定的演化趋向。就像物种遗传一样,对策者所组成的策略群体也是一代一代进化下去的。这种进化的规则包括:
1.试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。这就是试错法;
2.遗传。一个人如果合作性好,他的后代的合作基因就多;
3.学习。比赛过程就是对策者相互学习的过程,针锋相对策略好,有的人就愿意学。
在爱克斯罗德的试验中,第一轮比赛中的63个对策者,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。
试验结果很有趣。针锋相对策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个不善良的“哈灵顿”程序,它的对策方案是:首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。
这个程序一开始发展很快,但等到除了针锋相对之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。
进化试验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。针锋相对在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的。因为它让对方得到了高分。
哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。
那么,在一个极端自私者所组成的不合作者的群体中,针锋相对策略能否生存呢?爱克斯罗德发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的5%或更多成员是针锋相对策略的,这些合作者就能生存。
而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的趋势是不可逆转的,群体的合作性越来越大。
在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要作出回报,否则不会有人跟他长期合作的。
那么,提高团队合作性必须要做到以下8点:
1.要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作;
2.要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了;
3.要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作;
4.能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度;
5.不要嫉妒人家的成功,针锋相对策略正是这样的典范;
6.不要首先背叛,以免担上罪魁祸首的道德压力;
7.不仅对背叛要回报,对合作也要作出回报;
8.不要耍小聪明,占人家便宜。
爱克斯罗德在《合作的进化》一书结尾提出这么几个结论:
1.友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。
2.预见性也不是合作的前提,爱克斯罗德举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。
当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛时,以修正的针锋相对策略,即以一定的概率不报复对方的背叛,和“悔过的针锋相对策略”,即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,悔过的针锋相对策略效果越好,宽大的针锋相对策略效果越差。
爱克斯罗德所发现的针锋相对策略,从社会学的角度可以看做是一种利他主义。这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序。
这种秩序即使在多年隔绝、语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印第安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。
但是,爱克斯罗德博弈试验的假设使其研究不可避免地与现实情况相脱节。
首先,《合作的进化》一书暗含着一个重要的假定,即个体之间的博弈是完全无差异的。一方面,在现实的博弈中,对策者之间绝对的平等是不可能达到的。另一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分,这样,弱者的报复就毫无意义。
其次,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。爱克斯罗德的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。
 
“智猪博弈”的故事
 
博弈论里面有个十分卡通化的博弈模型,叫做“智猪博弈”(Pigs‘ payoffs)。
整个故事是这样的:笼子里面有两只猪,一只大,一只小。笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
如果定量地来看,踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食。
如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位。
如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的劳动耗费2个单位净得4个单位,小猪也吃到4个单位。
如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位。
如果大家都等待,结果是谁都吃不到。可以得出结论,唯一解是大猪踩踏板,小猪等待。
我们把这个博弈用矩阵的形式表达,见上图:
1.在矩阵的左上角,大猪踩踏板,小猪也踩踏板,大猪、小猪各得到5个单位食物和1个单位食物;
2.在矩阵的左下角,大猪等待,小猪踩踏板,大猪、小猪各得到9个单位食物和-1个单位食物;
3.在矩阵的右上角,大猪踩踏板,小猪等待,大猪、小猪都各得到4个单位食物;
4.在矩阵的右下角,大猪、小猪等待,大猪、小猪都得不到食物。
那么,两只猪各会采取什么策略?令人出乎意料的是,答案居然是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在呢?
因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
如果采用定量分析的方法,根据矩阵,“等待”是小猪的优势策略,“踩踏板”是小猪的劣势策略。先把小猪的劣势策略消去,再来看大猪的策略。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略。把它也删去,就分析出相同的结局:大猪来回在猪槽的两端奔波,小猪则坐享其成。
“智猪博弈”的结论似乎是,在一个双方公平、公正、合理和共享竞争环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。
这种情况在现实中比比皆是。
比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。
“智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。
在现实生活中,很多人都只想付出最小的代价,得到最大的回报,争着做那只坐享其成的小猪。“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝”说的正是这样一个道理。这三个和尚都想做“小猪”,却不想付出劳动,不愿承担起“大猪”的义务,最后导致每个人都无法获得利益。
在日常的人际关系中,有一些人会成为不劳而获的“小猪”,而又另一些人充当了费力不讨好的“大猪”。
有一个笔者亲见的真实故事。某大学公开招聘两名教授,一个是教经济学的,一个是教会计学的。经过层层选拔,最终有两人获得机会,姑且称之为A教授和B教授。
接下来就是一个让所有人想不通的选择过程,但这个事情却是现实得不能再现实了。
会计学教授的工资是5000元/月,而经济学教授的工资是3500元/月。A、B两教授具有相同的学历背景———会计学硕士。同时又都有经济学的教学经验,A授的会计学教学经验优于B教授。
依一般人的想法,知识就是金钱,知识越多,工资越高,A教授理所当然地会获得会计学教授职位。这就是我们这些聪明人的天真之处,殊不知现实并非如此。
因为B教授知道市场行情,而且知道到了目前,不可能有新的竞争者加入。因此,在与教务主任谈判时,极力否认自己具有经济学的教学经验,甚至说如果让他去讲授经济学会误人子弟,与其这样,自己宁可不要这份工作。
而A教授为了证明自己的能力,一开始就合盘托出,甚至大谈特谈自己的经济学教学经验。事情到此为止,我想每个人都看出了门道,学校不可能重新招聘,而两个教授也都不可能随便丢掉到手的美差。最终的结果就是B教授获得了会计学的教授职位,而A教授只好退而求其次,教授经济学。
在我们的企业中,什么都缺,就是不缺人,所以每次不论多大的事情,加班的人总是越多越好。本来一个人就可以做完的事,总是会安排若干个人去做。
这时,“三个和尚”的现象就出现了。
如果大家都耗在那里,谁也不动,结果是工作完不成,挨老板骂。这些常年在一起工作多年的战友们,对对方的行事规则都了如指掌。“大猪”知道“小猪”一直是过着不劳而获的生活,而“小猪”也知道“大猪”总是碍于面子或责任心使然,不会坐而待之。
因此,其结果就是总会有一些“大猪们”过意不去,主动去完成任务。而“小猪们”则在一边逍遥自在,反正任务完成后,奖金一样拿。
智猪博弈用句通俗的话来形容就是“枪打出头鸟”。一个很常见的现象就是在企业中,不论国企还是民企或是外企,在企业内部总会存在各种各样的小团体。套用组织行为学的专业术语来说就是存在各种非正式组织。而每一个团体都代表了一部分人的利益,因此不可避免地会产生冲突。
这时,每个团体都会推选出各自的代言人。这些代言人是为集体利益(如争取加薪或增加福利等)作出积极行动的领头人。但我们这时会发现,被推选为代言人的总是那些胸无城府、意气用事的人。
然而,群体活动的最大受益者“小猪”们则永远躲在幕后。活动成功了,他们可以毫发无伤地优先分到一杯羹;如果失败了,他们也可以发表一通与我无关,我是受害者之类的演讲,让“大猪”成为永远的牺牲者。从另一个角度来看,懂得智猪博弈对于个人并非是件坏事。
实际上,作为一个有理性的人,谁都不愿意甘冒风险而为他人带来好处。如果是这种情况,智猪博弈便无法形成。在智猪博弈的模型中,要摆脱大家都无法生存的困境,就要让双方的期望值不同,然后由一方作出现象上的让步。实际上,让步的这一方,只是在表面上看起来是谦让了。
但他不是无原则无目的的让步,绝不像孔融让梨那样是出自道德心,而是出自自己理性的盘算和对期望值的估计,然后才采取看似让步的举动的。这样一来,别人看来你是让步了。因为表面上是如此的,而你在不违背自己意愿的基础上,打破了困境,实现了自己的期望。这看似愚蠢,实则智慧至极。
在智猪博弈里,利用他人的努力来为自己谋求利益的智者是最大的受益人,因为他不必付出什么劳动就能获得自己想要的东西。因此,关键就在于如何让对手心甘情愿地按照自己的期望去行动。
由此看来,中国人立身处世的态度———各家自扫门前雪,莫管他人瓦上霜”,其结局必然是整体利益受到损害。尽管人们只希望自己的行为对自己无害,并不想对他人有利。
反过来说,“智猪博弈”毕竟是有前提条件的。在生活中,不管是先发制人还是“智猪博弈”中的后发制人,不过是一个策略的选择,而非根本的原则分歧。到底是选择先发还是后发,在博弈论中,就要先分析形势,按照风险最小利益最大的原则,把风险留给对手,把获益机会把握在自己手中。
总而言之,在博弈中既有先动优势策略,也有后动的优势策略。至于在具体的博弈中究竟是选择先动还是后动,都是由博弈参与者的各方具体情形所决定的。
 
“智猪博弈”与激励机制设计
 
“智猪博弈”给了竞争中的弱者以等待为最佳策略的启发同时,也反映了一种“搭便车”现象。
“搭便车”的现象在现实中大量存在,在企业的运营过程中也不乏其例。很多企业的一般员工甚至中层管理者工资、福利也不算低,但依然缺乏工作能动性,不能创造优异的绩效,很多事情还要亲力而为。
对于社会而言,因为小猪未能参与竞争,创造价值。小猪“搭便车”时的社会资源配置并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府、公司都是如此。
智猪博弈告诉我们一个企业制度和流程的重要性,以及不好的规则对公司带来的影响。这就要求规则的设计者应清楚、慎重地考虑规则制定的前瞻性、适应性和高效性。
智猪博弈存在的基础,就是双方都无法摆脱共存局面,而且必有一方要付出代价换取双方的利益。而一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被破解。
能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适。“智猪博弈”的核心指标一般来说有两个:食物数量、踏板与食槽之间的距离。
那么,如果改变这两个关键条件,“搭便车”的现象会不会杜绝呢?
首先来看看减量方案。食物只有原来的一半分量,也就是5个单位的食物。这种情况下,小猪大猪都不去踩踏板。小猪去踩踏板,大猪将会把食物吃完;大猪去踩踏板,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方嫁衣裳,所以谁也不会有踩踏板的动力。如果目的是想让两只猪去踩踏板,这个制度的设计显然是非常失败的。
其次再来看看增量方案。食物是原来的两倍分量,也就是20个单位的食物。结果是小猪、大猪都会去抢着去踩踏板。谁想吃,谁就会去踩踏板。因为对方不可能一次把食物吃完,小猪和大猪相当于生活在应有尽有的天堂,当然它们的竞争意识也不会得到提高。对于制度设计者来说,这个制度的成本提高了一倍。在不需要付出多少代价就可以得到所需食物的情况下,两只猪自然都不会有多少动机去增加踩踏板的数量。这个制度的设计明显激励作用不足。
最后再来看看移位方案。考虑到问题的关键是移位,接下来我们探讨一下因移位而产生的几种改变方案:
1.移位并减少食物投放量。食物只有原来的一半分量,但同时将食槽与踏板之间的距离缩短。这种情况下,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完;
2.移位并增加食物投放量。正常情况移位用不着增量,大猪小猪都会去踩踏板。如果适当增量,成员会快速成长,小猪会长大,大猪会出栏,效益就会增长。不过需要把握成本增加的度,适当的增量更符合组织与个人的需求;
3.移位但不改变食物投放量。由于食槽与踏板之间的距离缩短,去踩踏板的劳动量减少,大猪小猪都会争着去踩踏板。如果把踩踏板的次数增加,吃到的食物会更多,对食物的不懈追求,将驱动合作机制的形成和生产效率的提高。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
智猪博弈制度规则的改变对于企业的经营管理者而言,就是采取不同的激励方案,对员工积极性调动的影响也是不同的,并不是足够多的激励就能充分调动员工的积极性。比如企业实行职工全员持股的方案,结果如第二个方案一样,人人有股但没有起到相应的激励作用。
同样的,企业在构建战略性激励体系过程中,也需要从目标出发,设计相应的合理方案。
首先,根据不同激励方式的特点,结合企业自身发展的要求,准确定位激励方案的目标和应起到的作用;
其次,根据激励方案的目标和应起到的作用,选择相关激励方式,并明确激励的对象范围和激励力度。
扩而大之,从整个社会来讲,自身需求大的群体,比如现在媒体经常提及的弱势群体,他们往往才是社会生产力推动的主力。
换句话说,要迅速提高整个社会的生产力水平,就需要有一个自身具有很大消费需求的群体,并且需要给他们一定程度的奖励。第三种改变方案反映的就是这种情况,方案中降低了取食的成本,在现实中,也可以等同于增加了对取食者的奖励。
 
企业战略与“智猪博弈”
 
价格竞争作为市场经济实行优胜劣汰、优化资源配置的一种手段,起着独特的作用。但在一些行业除了大中型的公司以外还同时存在着一些管理规范、运作良好的小公司。那么在两个企业实力存在差距又面临价格竞争时,小企业的生存发展与其所选择的策略有着密不可分的关系。
我们都知道,“智猪博弈”的结果依赖于大猪的行为。如果小猪去踩踏板,大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果小猪等待,那么大猪将先去踩踏板再跑回来以获得相当于 4个单位的猪食,这总比空着肚子等待要好。
对小猪来说,情况非常清楚,无论大猪如何行动,它最好是等在食槽旁边。因此这个博弈的均衡结果就是:每次都是大猪去踩踏板,小猪先吃,大猪再赶来吃,只有这样大猪小猪才可以共同生存。
在实力悬殊公司之间的价格竞争策略也是这个道理。在商业竞争中,如果公司是弱小的一方,则可以选择如下策略:
首先是等待,静观其变。允许市场上占主导地位的品牌开拓本行业所有产品的市场需求。将自己的品牌定位在较低价格上,以享受主导品牌的强大广告所带来的市场机会;
其次是不要贪婪,妄图将“大猪”应得的那份也据为己有。只要主导品牌认为弱小公司不会对自己形成威胁,它就会不断创造市场需求。因此公司可以将自己定位在一个引起不了主导品牌兴趣的较小的细分市场,以限制自己对主导品牌的威胁。
如果公司是“智猪博弈”中的大猪,在行业市场中占主导地位,则可采取以下策略:
首先要接受小公司。作为主导品牌,加强广告宣传,创造和开拓对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种浪费资源的做法与小企业竞争,除非它对公司形成了真正的威胁。正是小企业采取的低价格阻止了潜在进入者的涌入;
其次对威胁的限制要清楚。如果小企业发展壮大到了构成威胁的程度,大公司就应该迅速作出进攻性的反应,并且让小企业清楚地知道它们在什么样的规模水平之下才是可以被容忍的,否则就会招致大公司强有力的回击。如果小公司知道对它们的限制,也就不会再有兴趣超越这种限制。
当然“大猪”“小猪”的共同生存是有条件的。“智猪博弈”说明了在某个市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况。这取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度。“智猪博弈”中“共同生存”的均衡结果只有在大猪的食物份额没有受到小猪严重威胁时才会出现。
70年代末80年代初,美国市场上私人标签(Private label,非品牌产品)的软饮料质量虽低劣,但价格很便宜,因此仍然能够占有较低的市场份额。可口可乐公司和百事可乐公司最初能够容忍这些私人标签软饮料的存在,因为它们的威胁是有限的。
可没过多久,一家主要的私人标签软饮料供应商Cott公司通过挑衅性的定价和较高的质量,从一只仅有较低市场份额的地区品牌的“小猪”,成为一个拥有1/3市场份额的、与两大可乐公司旗鼓相当的竞争者。
此时,可口可乐公司和百事可乐公司通过降低价格这种进攻性的战略行动,抢占了私人标签软饮料的市场份额,这些公司包括Scott公司在瞬间土崩瓦解。
总而言之,通过运用“智猪博弈”模型对两个规模与实力存在较大差距的竞争对手之间价格战的情况进行分析可以看到,竞争双方应对自己的地位和作用有一个清醒的认识。这一点非常重要。认清自己真正的利益所在,避免残酷的价格战的发生。两个地位相去甚远的对手,最终会达到和平的生存模式:共同生存,共同发展。
 
证券市场中的“智猪博弈”
 
金融证券市场是一个群体博弈的场所,其真实情况非常复杂。在证券交易中,其结果不仅依赖于单个参与者自身的策略和市场条件,也依赖其他人的选择及策略。
在“智猪博弈”的情景中,大猪是占据比较优势的,但是,由于小猪别无选择,使得大猪为了自己能吃到食物,不得不辛勤忙碌,反而让小猪搭了便车,而且比大猪还得意。这个博弈中的关键要素是猪圈的设计, 即踩踏板的成本。
证券投资中也是有这种情形的。例如,当庄家在底位买入大量股票后,已经付出了相当多的资金和时间成本,如果不等价格上升就撤退,就只有接受亏损。
所以,基于和大猪一样的贪吃本能,只要大势不是太糟糕,庄家一般都会抬高股价,以求实现手中股票的增值。这时的中小散户,就可以对该股追加资金,当一只聪明的“小猪”,而让“大猪”庄家力抬股价。当然,这种股票的发觉并不容易,所以当“小猪”所需要的条件,就是发现有这种情况存在的猪圈,并冲进去。这样,你就成为一只聪明的“小猪”。
从散户与庄家的策略选择上看,这种博弈结果是有参考价值的。例如,对股票的操作是需要成本的,事先、事中和事后的信息处理,都需要金钱与时间成本的投入,如行业分析、企业调研、财务分析等。
一旦已经付出,机构投资者是不太甘心就此放弃的。而中小散户,不太可能事先支付这些高额成本,更没有资金控盘操作,因此只能采取小猪的等待策略。等到庄家动手为自己觅食而主动出击时,散户就可以坐享其成了。
股市中,散户投资者与小猪的命运有相似之处,没有能力承担炒作成本,所以就应该充分利用资金灵活、成本低和不怕被套的优势,发现并选择那些机构投资者已经或可能坐庄的股票,等着大猪们为自己服务。
由此看到,散户和机构的博弈中,散户并不是总没有优势的,关键是找到有大猪的那个食槽,并等到对自己有利的游戏规则形成时再进入。
遗憾的是,在股市中,很多作为“小猪”的散户不知道要采取等待策略。更不知道让“大猪”们去表现,在“大猪”们拉动股票价格后从中获取利润,才是“小猪”们的最佳选择。
作为“小猪”,还要学会特立独行。行动前,不用也不需要从其他“小猪”那里得到肯定;行动时,认同且跟随你的“小猪”越多,则你出错的可能也就越大。简单地说,就是不要从众,而是跟随“大猪”。
当然股市中的金融机构要比模型中的大猪聪明的多,并且不守游戏规则,他们不会甘心为小猪们踩踏板。事实上,他们往往会选择破坏这个博弈的规矩,甚至重新建立新规则。
比如他们可以把踏板放在食槽旁边,或者可以遥控,这样小猪们就失去了搭便车的机会。例如,金融机构和上市公司串通,散布虚假的利空消息,这就类似于踩踏板前骗小猪离开食槽,好让自己饱餐一顿。
当然金融市场中的很多“大猪”也并不聪明,他们的表现欲过强,太喜欢主动地创造市场反应,而不只是对市场作出反应。短期来看,他们可以很容易地左右市场,操纵价格,做胆大妄为的造市者。
这些“大猪”们并不知道自己要小心谨慎、如履薄冰,他们不知道自己的力量不如想象的那样强大到可以无敌于天下。自然而然地,每一年都会有一些高估自己的“大猪”倒下,幸存的“大猪”在经过优胜劣汰之后会变得更加强壮。
不过,无论是多么强壮的“大猪”,只要过于自信、高估自己控制市场的能力,总会倒下。
俗话说“家家有本难念的经”,在股市中,“大猪”有“大猪”的难处,“小猪”有“小猪”的难处。尽管“大猪”“小猪”只要了解自身处境,采取相应的策略就会成功,然而理性是有限的,确定的成功总是很难获得。
 
“斗鸡博弈”与“骑虎难下”
 
话说某一天,在斗鸡场上有两只好战的公鸡发生遭遇战。这时,公鸡有两个行动选择:一是退下来,一是进攻。
如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。
因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。
不妨假设两只公鸡如果均选择“前进”,结果是两败俱伤,两者的收益是-2个单位,也就是损失为2个单位;如果一方“前进”,另外一方“后退”,前进的公鸡获得1个单位的收益,赢得了面子,而后退的公鸡获得-l的收益或损失1个单位,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的收益或1个单位的损失。当然这些数字只是相对的值。
如果博弈有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。斗鸡博弈则有两个纳什均衡:一方进另一方退。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。
由此看来,斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。这就像武侠小说中描写的一样,两个武林顶尖高手在华山之上比拼内力,斗得是难分难解,一旦一方稍有分心,内力衰竭,就要被对方一举击溃。
斗鸡博弈在日常生活中非常普遍。比如,警察与游行者相遇,最好有一方退下来。
再比如,收债人与债务人之间的博弈类似于斗鸡博弈:
假如债权人A与债务人B双方实力相当,债权债务关系明确,B欠A100元,金额可协商,若合作达成妥协,A可获90元,减免B债务10元,B可获10元。
如一方强硬一方妥协,则强硬方收益为100元,而妥协方收益为0;如双方强硬,发生暴力冲突,A不但收不回债务还受伤,医疗费用损失100元,则A的收益为-200元,也就是不仅100元债收不回,反而倒贴100元,B则是损失了100元。
因此,A、B各有两种战略:妥协或强硬。每一方选择自己最优战略时都假定对方战略给定:若A妥协,则B强硬是最优战略;若B妥协,A强硬将获更大收益。于是双方都强硬,企图获100的收益,却不曾考虑这一行动会给自己和对方带来负效益100。
故这场博弈有两个纳什均衡,A收益为100,B收益为0,或反之,这显然比不上集体理性下的收益支付,A、B皆妥协,收益支付分别为90、10。也就是债权人与债务人为追求利益最大化,会选择不合作,从某种意义上说双方陷入囚徒困境。
尽管在理论上有两个纳什均衡,但由于当今中国信用不健全(如欠债不还、履约率低、假冒伪劣盛行),法律环境对债务人有利,可想而知B会首先选择强硬。
因此,这是一个动态博弈,A在B选择强硬后,不会选择强硬,因为A采取强硬措施反而结局不好,故A只能选择妥协。而在双方强硬的情形下,B虽然收益为-100,但B会预期,他选择强硬时A必会选择妥协,故B的理性战略是强硬。因此,这一博弈纳什均衡实际上为B强硬A妥协。
欠债还钱博弈是假定A、B实力相当,如实力相差悬殊,一般实力强者选择强硬。比如在家庭夫妻冲突中,首先退下阵的一般是丈夫。大部分夫妻怄气或吵架,最终得利的总是妻子。
战国思想家庄子讲过一个故事,说斗鸡的最高状态,就是好像木鸡一样,面对对手毫无反应,可以吓退对手,也可以麻痹对手。这个故事里面就包含着斗鸡博弈的基本原则,就是让对手错误估计双方的力量对比,从而产生错误的期望,再以自己的实力战胜对手。
然而,在实际生活中,两只斗鸡在斗鸡场上要作出严格优势策略的选择,有时并不是一开始就作出这样的选择的,而是要通过反复的试探,甚至是激烈的争斗后才会作出严格优势策略的选择,一方前进,一方后退,这也是符合斗鸡定律的。
因为哪一方前进,不是由两只斗鸡的主观愿望决定的,而是由双方的实力预测所决定的,当两方都无法完全预测双方实力的强弱的话,那就只能通过试探才能知道了,当然有时这种试探是要付出相当大的代价的。
在现实社会中,以这种形式运用斗鸡定律,却比直接选用严格优势策略的形式,要常见的多。这也许是因为人有复杂的思维、更多的欲望。
斗鸡博弈进一步衍生为动态博弈,会形成这样一个拍卖模型。拍卖规则是:轮流出价,谁出的最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。
假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想:如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品。但是,随着出价的增加,他的损失也可能越大。每个人面临着是继续叫价还是退出的两难困境。
这个博弈实际上有一个纳什均衡:第一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的),出价100元的参与人得到该物品。
一旦进入骑虎难下的博弈,尽早退出是明智之举。然而当局者往往是做不到的,这就是所谓“当局者迷,旁观者清”。
这种骑虎难下的博弈经常出现在企业或组织之间,也出现在个人之间。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,就是骑虎难下。其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是必胜的。
从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这样的赌场要设定赌博数额的限制。
当然骑虎难下的局面,在国家之间也经常碰到,20世纪60年代,美国介入越南就是一个骑虎难下博弈。
博弈论专家,有时候也将骑虎难下博弈称之为“协和谬误”。
20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。
协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。
 
银行会垮掉吗?
 
银行挤兑是存款人集中大量提取存款的行为,是一种突发性、集中性、灾难性的危机。自从银行诞生以来,挤兑现象就相并而存。
据载,世界上最早的两家银行是1272年和1310年在意大利设立的巴尔迪银行和佩鲁齐银行,均因债务和挤兑问题于1348年倒闭。始于银行挤兑而爆发的1929~1933年的经济大危机,使美国大约1.1万家银行倒闭或被兼并 ,造成金融混乱。20世纪70年代以来,银行危机发生的频率越来越高,世界上有100多个国家和地区的银行曾发生过银行挤兑的灾难。
近期的东南亚金融危机、俄罗斯金融危机,以及拉丁美洲各国金融危机时,银行挤兑现象也都非常严重,很多时候正是银行挤兑摧残了雪上加霜的国家经济。
一般来说,在经济危机发生之初,往往是由于经济持续低迷而股市泡沫彻底破灭。广大投资者开始疯狂抛售股票,股价雪崩般地下跌从而引起股市崩溃。股市崩溃又会引发了一连串连锁反应。
广大投资者的财富几乎是在一夜之间化为乌有,迫于生计和信心动摇,人们纷纷赶往银行兑换存款,这又直接导致银行相继倒闭。银行倒闭后,大量工商企业的正常运转由于失去了资金支持也相继宣告破产。
同时由于大批银行倒闭,吞掉了小额存户的存款,使千家万户濒于死亡的边缘。工人因此而大量失业,人民生活水平大幅下降,更无力去市场购买商品。国家经济由此开始进入了恶性循环,并要倒退很多年。
就拿美国1929年的经济大萧条来说,1929年,美国商业银行数量为25568家,而到1933年,美国商业银行总量只有14771家,有万余家银行破产倒闭。
那时出生的婴儿长期缺乏营养和医疗护理;约有200万~400万中学生中途辍学;大量的无家可归者栖身于铁道边简易的纸棚;许多人忍受不了生理和心理的痛苦而自杀;社会治安恶化。最为惨绝人寰的是,穷人被活活饿死的事件不断出现。
由此可见,银行挤兑问题是关系到每个人的事情。为了理解银行挤兑的成因,我们来看这样一个简单的例子。这个例子正反映了银行挤兑现象发生的机理。
假设现在有A和B两个朋友,都借给C朋友100万元人民币做生意,C拿到这200万元在第一年进行投资,第二年才可以赚得利润。笔者不妨假设第一年的时候,A和B索要借款,C只能还给两人各70万元,若是A和B并不是那么急着用钱,给C两年的时间,则C连本带利可以给付280万。
对于A、B两人来说,第一年要回借款,各得70万;其中一个人要回借款,而另一个人没有去索要,则索要的人先来一步得到100万本钱,另一个人则只拿到剩下的40万元;如果两人都在第二年才拿回存款,则各得140万元;在第二年,只有一个人要回借款,另一个人并没有催着C还钱的情况下,先催款的人得到180万,另一个人只拿到原来的本钱100万。
这种情况下,就是一个两阶段的动态博弈。见下面两个图。
动态博弈都是用倒推法进行分析,我们在这里仍然采用倒推法,首先看第二年时,A和B作为理性人会如何选择行动策略。假如A和B都将资金借给C用到第二年,这个时候,博弈均衡点是双方都要回自己的资金,A和B各得到140万元的还款,利息率高达40%。从博弈论的角度来看,整个均衡点是A、B两人理性博弈的唯一可能结果。
我们回过头来看,第一阶段也就是本例中第一年双方的博弈情况。由于在第一年时,双方都不抽回资金的策略将产生第二阶段的均衡结果,因此,在第一阶段的博弈矩阵可以改写成如下的图。
在我们假定A和B都是理性人的条件下,第一阶段的纳什均衡点很明显有两个,一个是双方都索要借款,这时双方都只能拿回70万元,另一个就是双方在第一年都不索要借款,这时根据我们在第二阶段的分析,双方各能收到140万元的回报。自然对于A和B来说,后一个纳什均衡比前一个纳什均衡要好。
遗憾是,没有什么可以保证A、B双方一定会在第一年不索要借款。
在现实生活中,这个模型中的C就相当于是一家银行,而A和B就是银行的存款客户。银行挤兑往往是由于谣言四起,存款客户不再放心将钱放在银行中,纷纷去银行拿回存款,在很短的时间内,银行又无法筹措大量的现金。
最终的结果就是银行倒闭,很多人只能抽回银行存款的一部分,甚至是一分存款都拿不到。在国外,许多银行因挤兑风潮倒闭的现象,就是源于此。
对付银行挤兑破产的根本只有依靠政府。强有力的、权威的、有担保能力的政府才可以出面保证客户资金安全,防止银行恶性竞争,并为银行辟谣,预防挤兑的发生。同时政府需要建立信贷制度、保险制度来加强人们的信心,尽量达到另一个较好结果的纳什均衡。
在历史上,博弈论诞生之前,一些国家的政府就已经这么做了。如1929年的经济危机之后,美国政府为了防止银行挤兑发生,预防经济危机,就采取了一系列的措施。为了降低银行业破产倒闭的风险,美国国会在20世纪30年代通过了《1933年银行法》和《1935年银行法》,这些法规强调了对银行业进行全方位的监管,限制银行业过度竞争,以保证银行业的稳定。同时,为了避免大危机中许多银行破产倒闭局面再次发生,美国国会于1933年通过了《联邦存款保险法》,并授权建立联邦存款保险公司。
 
以弱战强的制胜之道
 
在中国历史上,以弱胜强的战役举不胜数。在现代企业竞争中,弱小企业打败大企业也是司空见惯的情形。
在第二次世界大战中,德国以最少的兵力最快的速度侵占法国。德国要进攻法国无非有三种选择:从两国接壤的边境发起进攻;借道比利时和卢森堡;借道瑞士。由于瑞士是个高山国家,阿尔卑斯山脉贯穿全境,不便于开展军事行动。所以第三种选择首先被排除。
于是,进攻路线的选择就剩下了两个:从两国接壤的边境发起进攻;借道比利时和卢森堡。法国修筑了漫长的防线,严阵以待,抵抗的军。
然而事实是,1940年5月10日,德军从卢森堡和比利时东部的阿登森林地区进入法国,撕开了法国防线,德军长驱直入。驻守在法国和比利时边境的英法联军,一下子被断了后路,被德军包围了。他们一路向后撤,直到大海边。5月26日一天,英国动员了所有的船只,从法国接回了33.8万人,这就是著名的“敦克尔刻大撤退”。
我们不妨用博弈论来简单地分析一下当时的法国是否有好的策略来阻止德国的进攻。
假设进攻方德军准备进攻法国,军力是2个师。而防守的法国军队则有3个师。德军与法军每个师的装备、人员、后勤等完全相同,自然战斗力相同。不妨假想,德国进攻法军有两个方向,分别是A、B两个方向。由于一个德军师与一个法军师的战斗力完全相同,因此两军相遇时,人数居多的一方取胜,战争中都是“易攻难守”,因此当两方人数相等时,守方获胜。同时,军队的最小单位为师,不能够再往下分割。只要德军可以突破防线,就算德军胜利;反之则法军胜利。
由此看来,进攻方德军的战略有两个:
1.两个师集中向法军防线的A方向进攻;
2.兵分两路,一个师向法军防线的A方向进攻,另一个师向法军防线的B方向进攻;
3.两个师集中向法军防线的B方向进攻。
防守方法军则有四种不同的防守策略:
1.3个师集中防守A方向;
2.2个师防守A方向,1个师防守B方向;
3.1个师防守A方向,2个师防守B方向;
4.3个师集中防守B方向。
我们依次用排列组合来看罗列双方各种策略组合下的结果,见下图。
这个博弈中,德军没有劣势策略,而法军有劣势策略。
很明显在这种情况下:法军选择第一种策略,也就是派3个师防守A方向劣于第二种策略,也就是派2个师防守A方向,1个防守B方向。因为,法军选择第二种策略的任何一个结果都不比选择第一种策略的结果要差。
在图中能够看出三种结果:
1.德军选择第一种策略时,法军选择第二种策略与第一种策略相同,都是法军胜利;
2.德军选择第二种策略时,法军选择第二种策略是法军胜利,而第一种策略则是德国胜利,自然选择第二种策略要好;
3.德军选择第三种策略时,法军选择第一、第二策略结果相同,都是德军胜利。由此可见,法军选择第二种策略自然好于第一种。
4.同理,法军选择第三种策略也好于第四种策略的结局。因此,法军策略选择种的第一种和第四种都是劣势策略。
劣势策略从理性人的角度来看是法军一定不会采用的策略,德军知道法军不会选择第一、第四种策略,德军和法军都知道博弈简化成下图。
这个简化的博弈中,法军反而没有劣势策略,德军却有一个劣势策略,也就是第二种策略,选择分兵两路进攻法军防线。很明显,德军选择第二种策略的结局就是根本不可能胜利,理性的德军自然不选择这个劣势策略。博弈矩阵得到了进一步的简化见下图。
这个时候,德法双方的形势是相同的,即德军尽管在总兵力上劣于法军,但实际上它只要运用谋略,攻其不备,其获胜的可能与守方是相同的。
在博弈论中,“以弱胜强”道理就是这样。比如在战争中,总兵力占优势的一方往往并不能保证在某个局部可以获得优势,处于弱势的一方则可以集中优势兵力,在某一个方向或某一场战斗中取得胜利,并逐步积累胜利成果达到最终整个战役的胜利。
在企业竞争中,也是一样。资本、规模、品牌、人力等都处于劣势的企业,可以在某个局部市场上,集中自己所有的资源并加以整合,造成细分市场上对强势企业的优势,从而成为市场竞争的胜家。
在个人求职中,学识、水平等自身素质固然十分重要。然而在面试时,如果能够运用以弱胜强的博弈方法,根据应聘职位的需求,集中展现自身优势,恰当地运用面试方法,就能够在众多实力不凡的竞争对手中脱颖而出。
 
“海盗分金”的正解
 
海盗,是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝的好习惯,而且总要画上一张藏宝图,以方便后人掘取。
然而很少有人知道,海盗是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,富有独立精神。
平时海盗们之间一切事都由投票解决。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。
现在船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依此类推。
我们先要对海盗们作一些假设:
1.每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而作出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信;
2.一枚金币是不能被分割的,不可以你半枚我半枚;
3.每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的;
4.每个海盗当然希望自己能得到尽可能多的金币;
5.每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理。总而言之,他们相信二鸟在林,不如一鸟在手;
6.最后,每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。
现在,如果有10个海盗要分100枚金币,结果将会怎样呢?
这是来自于《科学美国人》中的一道智力题,原题叫作《凶猛海盗的逻辑》。一般大家都称之为“海盗分金”问题。
要解决“海盗分金”问题,我们总是从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该作策略选择,依此类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我作这样的决定,下面一个海盗会怎么做?”
以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。
往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。
P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。
依此类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。
结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。
在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
真地是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。
其实什么事情都是先手比较有优先决断权。历朝历代的农民起义、争斗不休的宫廷政变、企业内部成帮结派的明争暗斗、办公室脚下使绊的公司政治,哪一个得胜者不是用“强盗分金”的办法,他们都是以最小的代价获得最大的受益,拉拢“挑战者”分配方案中最不得意的人们,而打击“挑战者”。
当老大是不容易的,企业家就是要把各方面“摆平”。任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚 “挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
为什么革命者总是找穷苦人?因为他们是最失意的人。为什么恐怖分子拉登在沙特阿拉伯没有市场,在阿富汗却大受欢迎?因为阿富汗是全球的弃儿。为什么企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热?这正是因为公司里的小人物好收买,而二号人物却总是野心勃勃地想着取而代之。
海盗P10就相当于公司老板。假如你作为老板,拥有最先分配权,就看你是否仁厚或是黑心,你有权独吞所有共同成果,也可以合理分配让大家满意,如果你过于贪婪,就要承担被伙伴推翻的风险,如果您不想冒险,就放弃部分利益以求共存。
当然“海盗分金”的隐含假设是所有海盗的价值取向都是一致的,理性的。而在现实生活背景下,海盗的价值取向并不都一样,有些人的脾性是宁可同归于尽都不让你独占便宜,有些人则只求安稳,不计较利益。
所以这10个海盗换成不同性格的人在不同的位置都有可能影响结果。作为海盗P10,还必须对伙伴们的性格了如指掌,根据其性格特点和价值观作深入研究和策略分析,才能因地制宜,设计出最合适的分配方案,这是没有什么公式套路的。
和老板领导管理团队一样,要赚取最大化的利润又不能使自己的平台不至于垮掉,就必须对自己的下级作深入研究,制订相应合理的分配方案,才能获得最大的成功。
在“海盗分金”博弈中,我们还能看到一个富有哲学意义的命题。那就是生命与金钱孰重孰轻?
这在博弈中是一目了然的。没命的话要钱还有何用?所以首先是考虑自身的安全,当你身上只要还有一枚金币,别的海盗们就会贪图你这一枚金币,怎么办?除非什么都不要,剩下100枚金币让其他9个人平分。如果其他海盗都愿意以最小的代价(即9人内部不愿意再发生争执)换来最大的利益的话,这个方案就没有问题,但遗憾的是自己的利益就彻底丧失。
命比钱重要是肯定的,但在现实生活中,没钱又怎能有命呢?
 
第三部分
 
有一个关于牧民与草地的故事,说的是当草地向牧民完全开放时,每一个牧民都想多养一头牛。因为多养一头牛增加的收入大于其供养成本,明显这是有利可图的。
 
公共地悲剧与和谐社会
 
有一个关于牧民与草地的故事,说的是当草地向牧民完全开放时,每一个牧民都想多养一头牛。因为多养一头牛增加的收入大于其供养成本,明显这是有利可图的。
虽然对于单个牧民来说,他增加一头牛是有利的。但是如果所有的牧民都看到这一点,都增加一头牛,那么草地将被过度放牧,从而不能满足牛的需要,导致所有牧民的牛都饿死。这个故事就是公共资源的悲剧 ,即哈定悲剧,也叫作公共地悲剧。
哈定悲剧,由英国留学生哈定(GarritHadin),在1968年在《科学》杂志上发表的文章《Tragedy of Commons》(公共策略)中提出。
哈定在文中指出:“在共享公有物的社会中,每个人,也就是所有人都追求各自的最大利益。这就是悲剧的所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都奔向的目的地。因为在信奉公有物自由的社会当中,每个人均追求自己的最大利益。公有物自由给所有人带来了毁灭。”
在市场经济中最常见的“哈定悲剧”现象就是环境污染。当无政府管制时,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。
按照“看不见的手”的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而达到纳什均衡状态。
即使有一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。
这便是“看不见的手”的有效竞争机制失败的明证。
拿我们国家来说,20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但自然环境将变得更加和谐优美。
从历史上来看,中国的国家发展战略一波三折。
20世纪50年代,我们学苏联,走的是低就业、低消费、高消耗、自我封闭的重工业模式。然而,这个模式并不符合中国人均资源短缺、资本稀缺、劳动力资源丰富的基本国情,再加上政治动荡,走了一段就走不下去了,使我们延误了发展的黄金时期。
20世纪80年代,我们又学欧美传统的发展模式,用资源高消耗和生活高消费,来刺激经济高速增长。这一模式追求资本生产率与利润最大化,而忽视资源利用率与环境损失。
到了今天,中国成了世界上最大的制造业国家,也成了世界上自然资产损耗最严重的国家。45种主要矿产15年后将剩下6种,5年以后60%以上的石油依赖进口,我们单位GDP的能耗是日本的7倍、美国的6倍、印度的2.8倍。单位GDP污染排放量是发达国家平均水平的十几倍,劳动生产率却是人家的几十分之一。
建国50多年来,我们的人口从6亿增长到了13亿,多了一倍,而可居住的土地由于水土流失从600多万平方公里减少到300多万,减少了一半。中国在人均GDP400~1000美元时,出现了发达国家人均GDP3000~10000美元期间出现的严重污染。按照目前的污染水平,若干年后我们的经济总量翻两番时,污染负荷也会跟着翻两番。
资源和环境作为公共自由物,是全体国民的公共财产,政府作为人民大众管理社会事务的工具,责无旁贷地负有保护资源环境、实现经济、社会、自然协调发展的历史使命。
不少政府官员和学者,总是寄希望于通过技术手段,来解决公共地悲剧问题。然而早在20世纪60~70年代在现代自然科学领域已经形成一种认识,那就是包括人口问题、核战争及环境污染等在内的问题都只是一个局部问题,而这些是无法靠技术手段解决的。
要解决公共地悲剧,就必须要明晰公共地产权、牧民之间有效沟通形成共同愿景、采取违规行为之后的及时惩罚、牧民自身道德素质的提高、改善牛或者草的品种,甚至是牧民也可以换个职业等都是可行的方法。
这些方法对我国建设节约型社会也有很大的启发,比如增加资源环境危机的宣传和教育,以形成大众心理暗示,对公共自由物中的不可再生资源采用国家管理的形式,严格控制使用;对可再生资源采取委托管理的形式,培育社会力量加以保护,国家起到监督和引导作用等。
房地产市场的多方博弈
 
房地产行业不仅关系到国家经济,和普通人的生活也是息息相关。总体说来,在房地产市场中,政府的作用举足轻重。房地产开发过程中是多方博弈,也是一个复杂的过程,其参与者多,涉及面广,个中利益关系错综复杂,难以言表。
对于复杂难以预测的房价走势,各相关方莫衷一是。某刊物的记者在上海采访时发现了一个有趣的现象:认为房价会涨者多为相关政府官员 、房地产开发商、部分地产中介、房地产投资或投机者;认为房价会降者多为弱势群体、外行人士和学院派房地产研究人员。双方均言之凿凿,自成体系,令局外人眼花缭乱。
这在很大程度上反映出利益关系的格局。很多人的看法与其说是客观判断,还不如说是他们对房价走势的内心期望。因此,要分析今天的房地产市场及其走势,就不能不对所牵涉的几个基本利益主体及其博弈过程进行分析。
在今天的中国,房地产商已经成为一个发育程度最高的利益主体。
这首先是因为房地产是过去十几年间资源积聚速度最快、资源积聚规模最大的一个行业;其次,房地产商也是较早以自觉意识甚至集体力量影响政府政策和社会风向的一个群体。这个历史要追溯到90年代初海南等地房地产泡沫破灭之后。当时由于经济过热,特别是房地产过热,政府出台紧缩政策以收缩银根,这样就断了房地产炒作的资金链条。
于是,从这个时候起,人们就看到,由媒体或其他机构出面,召开了一系列的研讨会,请一些著名的经济学家出来讲话。这些研讨会的基调大体是:目前中国经济并没有过热,政府应当改变紧缩政策,放松银根。这些研讨会的目的是非常明确的:政府放松银根,被套的房地产解套。
现在看来,房地产已经开始成为目前中国发育程度最高、影响力最大同时自觉意识也最强的一个利益集团。
资料显示,目前中国最大的富豪中有相当一部分是集中在房地产领域。在中国福布斯2002年度公布的100名富豪中,有40多人涉足地产业。此后尽管不断有从事房地业的富豪身陷囹圄,但在福布斯《2003年中国内地富豪榜》上,涉足房地产的还是高达35名。而在2004年《中国大陆百富榜》中,主营行业与房地产有关的“富人”又恢复到总人数的40%。财富的规模、现实的利益以及历史的积累,造就了房地产集团的团体意识和集体行动能力。
应当说,在市场经济中,利益集团的发育是一件正常甚至是必需的事情。问题是如何对利益集团的利益表达进行规范以及对不同利益主体的关系进行平衡。
为了简化问题,首先来看中央政府作为市场“裁判”时的情形,即房地产商与消费者、房地产商与银行、地方政府在房地产开发过程中的利益博弈。
假设政府的宏观政策等不变,市场上仅两个参与主体,即房地产商与银行等金融机构。银行等金融机构有两种决策方式,即协作与不协作;房地产开发商也有两种决策,即优质产品与偷工减料,不难发现这个博弈有两个纳什均衡:金融机构不协作与开发商偷工减料,金融机构协作与开发商做出优质产品。
事实上,上述两种情况在不同阶段、不同城市都出现过,当然这也是房地产泡沫产生的原因之一。
一般来说,政府的政策制定与执行需要很长时间才能产生效果,这就是时滞效应。政府在制定政策以后要通过银行等金融机构和房地产商共同实施,并在实施过程中通过收集各种市场信息的反馈来修改政策,如此循环往复。
这个动态博弈的过程如下:首先,政府根据所收集的市场信息,选择紧缩或宽松的货币政策以调控市场繁荣程度;接着,银行等金融机构根据政府出台的政策,揣测政府意图,并结合自己对市场走向的判断,来增加或减少给房地产开发商与购房者的贷款。最后,房地产商根据银行等金融机构的操作过程相应地做出自己的投资规划:扩大投资规模或缩减投资量。
如果考虑到购房者,那么这个博弈就成了政府、开发商、购房者和金融机构的四方利益博弈。该博弈模型从国内的大前提下出发,从政策的制定到最终落实到购房者,讨论其利益的分配及决策。很明显,购房者在信息获取方面具有劣势,所掌握的信息既不及时,也不全面,仅仅是一些公开或较公开的信息,并且对于购房者整体而言,相互之间没有什么沟通能力,没有信息优势,处于房地产市场博弈各方最为被动的地位。
在这个动态博弈中,我们采用如下方式进行讨论。首先将四方参与者分为两类,设为A与B。
其中A由中央政府与购房者组成,因为两者立场较为接近:中央政府目的是规范市场,以保长治久安;同时,中央政府的政策倾向于购房者利益,公平的市场才不会使购房者盲从,这有利于规范化市场的形成。而规范化市场能为购房者提供良好的消费环境,如此形成良性循环,增强中央政府对市场的调控能力。
B由房地产商与银行、地方政府等组成,因为他们有共同的利益基础。
房地产商的大部分资金是由银行提供的,银行也是企业,都是以利益最大化为经营目标,因而这些金融机构监督房地产开发的全过程,并且拥有大量信息,以增强其监控能力,提高房地产开发过程的合理、规范操作可能性,预期获得高额回报。
又由于房地产的开发上投入的自有资金也占相当大比重,也不想将项目“烂”在自己手中,但由于其信息优势,且规模较大,易于操纵市场,并变相哄抬物价,从而形成卖方市场,损害消费者利益,占有超额利润。
同时,近些年来在政绩、财政压力等因素促发下,地方政府对于“经营城市”、“出售土地”的兴趣逐渐增加。这为房地产商与地方政府的结盟提供了可能。
2005年4月16日,新华社发表了记者包永辉的一篇文章,披露某地方政府操纵地价抬高商品房价格的做法。
文章说,江苏一家在全国也算得上重量级的房地产公司老板向他透露,有个城市为了抬高出让土地的价格,特意请他们这家公司来当“托儿”,与外地投标企业竞价。这位老板十分担心价格抬得太高,砸在自己手里吃不消。
该市政府一位官员“开导”他:“你只管往高里抬价就行了,如果砸在手里,由政府兜底,大不了再还给政府”。于是,吃了“定心丸”的这位老板果然创下该市土地出让价的新高。这个案例形象地揭示了房地产集团与地方政府的关系。至于地方政府官员在土地征用、地皮出让、工程项目中的腐败行为,更成为这种联盟关系的粘合剂。
事实上,最近几年时间一些城市房地产价格的扶摇直上,在很大程度上就是房地产商与地方政府结盟与合作的结果。
搜索一下最近几年有关房地产的消息,就会发现一个现象,在一些房地产价格上涨最迅猛的城市,当地政府的领导人总是利用各种途径向人们传达这样的一些信息:本地的房价不会下跌只会上涨;来本地投资房地产会有很好的回报;本地的房地产市场现在是一片兴旺等等。
甚至在国内外一些研究机构纷纷对中国房地产泡沫化提出警告的时候,这些地方政府的领导人仍然坚信本地的房地产发育健康,房价是正常的。而且,在游资形成的炒房团已经在一些地方兴风作浪的时候,一些地方政府的领导人甚至公开向游资发出这样的召唤:欢迎炒房团来本地加入房地产的发展。这几乎与直接呼吁炒房没有什么差别了。
在这种情况下,中央政府面临两种选择:其一是有所作为,下大力度规范市场,其二是不作为,任由市场随意变化。同时,购房者也面临两个选择:其一是正常地根据自己的经济条件合理购房,特别是在房价居高不下时持币待购,其二是毫无理性可言,盲目购房。
房地产开发商合理合法地开发新项目,或者投机取巧,开发不能保质保量的劣质品。银行也根据房地产商和政府的操作选择增加贷款以支持房地产投资或者减少贷款以维护自己的利益。
可见,对于政府来说,当市场混乱,价格失调时,有所作为是一个理性的选择;对于购房者则根据自身条件购房,不为购置房产来透支自己的消费能力方为上策。
对于房地产开发商而言合法合理开发新项目,定价适中,满足大部分人的需求是收益最大的选择。对于金融机构来说,根据国家宏观政策的变更而改变贷款策略是保持稳定发展的良好方法。
想象一下这种理想的情况:
在中央政府的有序管理与金融机构的大力支持下,开发商能够充分洞察购房者的消费需求与消费能力,科学规划、设计、建设并以合理的价位销售楼盘,那消费者自然趋之若鹜。
于是,开发商安心赚取利润,赢得越来越好的市场信誉;消费者购得满意的房屋,心身俱爽,安居乐业;市场秩序井然,国家宏观经济形势良好。
这不就是房地产市场皆大欢喜的多赢之局吗?
酒吧问题与少数人博弈
 
话说有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。
假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何作出去还是不去的决定呢?
这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。
这就是著名的酒吧问题(Bar problem)。它是由美国人阿瑟教授(W.B. Arthur)1994年在《美国经济评论》发表的《归纳论证的有界理性》一文中首次提出来的。
酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候作出的这些预测就错了。
反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。
因而一个作出正确预测的人应该是,他能知道其他人如何作出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何作出预测,因此所谓正确的预测几乎不可能存在。
阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。
在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,实验的部分数据如下:
从上述数据看,虽然不同的博弈者采取了不同的策略,但是其中共同点是这些预测都是用归纳法进行的。我们完全可以把实验的结果看做是现实中大多数理性人作出的选择。
在这个实验中,更多的博弈者是根据上一次其他人作出的选择而作出这一次的预测。
然而,这个预测已经被实验证明在多数情况下是不正确的。那么,在这个层面上说明,这种预测是一个非线性的过程。
所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”:在北京的一只蝴蝶动了一下翅膀,华盛顿就下了一场大暴雨。
通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或不去的人群,但这个系统的这个比例是不变的。如果把计算机模拟实验当做是更为全面的、客观的情形来看,计算机模拟的结果说明的是更为一般的规律。
生活中有很多例子与这个模型的道理是相通的。“股票买卖”、“交通拥挤”以及“足球博彩”等等问题都是这个模型的延伸。对这一类问题一般称之为“少数人博弈”。“少数人博弈”是改变了形式的酒吧问题,是由一位定居瑞士的中国人张翼成在1997年提出的。
在股票市场上,每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置,而你处于买的位置,股票价格低,你就是赢家;而当你处于少数的卖股票的位置,多数人想买股票,那么你持有的股票价格将上涨,你将获利。
在实际生活中,股民采取什么样的策略是多种多样的,他们完全根据以往的经验归纳得出自己的策略。在这种情况下,股市博弈也可以用少数者博弈来解释。
“少数人博弈”中还有一个特殊的结论,即:记忆长度长的人未必一定具有优势。因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大、速度快的计算机了,在实际中人们还没有发现这是一个炒股必赢的方法。
“少数人博弈”还可以应用于城市交通。现代城市越来越大,道路越来越多、越来越宽,但交通却越来越拥挤。在这种情况下,司机选择行车路线就变成了一个复杂的少数人博弈问题。
实际的城市道路往往是复杂的网络。我们简化问题,假设在交通高峰期间,司机只面临两条路的选择。这个时候,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程,而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验,来判断哪条路更好走。当然,所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择,必须考虑其他司机的选择。
在司机行车的“少数者博弈”问题中,司机经过多次的选择和学习,许多司机往往能找到规则性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规则性。
在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,等等。最终,不同特点、不同经验司机的路线选择,决定了路线的拥挤程度。
彩票、赌博与投资
 
几年以前,美国加州一名华裔妇女买彩票中了头奖,赢得8900万美元奖金,创下加州彩票历史上个人得奖金额最高纪录。当消息传开之后,一时之间很多人跃跃欲试,纷纷去买彩票,彩票公司因此而大赚一笔。
然而,从数学的角度来看,在买彩票的路上被汽车撞死的概率远高于中大奖的概率。每年全世界死于车祸的人数以数十万计,中了上亿美元大奖的却没几个。死于车 祸的人中,有多少是死在去买彩票的路上呢?这恐怕难以统计,因而“死于车祸多于中奖”也成了无法从当事人调查取证的猜想。
在概率论里,“买彩票路上的车祸”和普通的车祸是完全不同意义的事件,是有条件的概率,这个概率是建立在“买彩票”和“出车祸”两个概率上的概率。不管怎么说,这都应该是一个极小的概率,它的概率比中大奖的居然大,可见中大奖的难得和稀奇。
但买彩票的人却比参与赌场赌博的人多得多,不能不说很多人缺乏理性的思考。通常,赌场的赔率是80%甚至更高,而彩票的赔率还到不了50%,也就是说买彩票还不如去赌博。但很多人却热衷于彩票,渴望一夜暴富,一把改变命运。精通消费者心理学的商家,不在每件商品上打折,而是推出购物中大奖之类的活动,也和彩票异曲同工,既节约成本,又满足了顾客的“侥幸”心理。
实际上,彩票中奖的概率远比掷硬币,连续出现10个正面的“可能性”小得多。如果你有充裕的空闲时间,不妨试试,拿一块硬币,看你用多长时间能幸运地掷出自始至终的连续10个正面。实际上,每次抛掷时,你都“幸运”地得到正面的可能性是1/2,连续10次下来都是正面的概率是10个1/2相乘的积,也就是(1/2)10=1/1024。想想吧,千分之一的概率让你碰上了,难道不需要有上千次的辛勤抛掷做后盾?
赌博就是赌概率,概率的法则支配所发生的一切。以概率的观点,就不会对赌博里的输输赢赢感兴趣,因为无论每一次下注是输是赢,都是随机事件,背后靠的虽然是你个人的运气。但作为一个赌客整体,概率却站在赌场一边。赌场靠一个大的赌客群,从中抽头赚钱。而赌客,如果不停地赌下去,构成了一个大的赌博行为的基数,每一次随机得到的输赢就没有了任何意义。在赌场电脑背后设计好的赔率面前,赌客每次下注,都没有意义了。
概率里还有一个重要的概念是事件的独立性概念。很多情况下,人们因为前面已经有了大量的未中奖人群而去买彩票或参与到累计回报的游戏,殊不知,每个人的“运气”都独立于他人的“运气”,并不因为前人没有中奖你就多了中奖的机会。
设想一下,前面10个人抛硬币,没有一个人抛出了正面,现在轮到了你,难道你抛出正面的可能性就大于其余的人?抛硬币出现正反的决定性因素是硬币的质地和你的手劲,每个人抛的那一次,都“独立”于其余的人。拉斯维加斯的很多赌场,老虎机上都顶着跑车,下面写着告示,告诉赌客已经有多少人玩了游戏,车还没有送出,只要连得三个大奖,就能赢得跑车云云。但得大奖的规则并无变化,每人是否幸运,和前面的“铺路石”毫无关系。
从某种意义上来说,赌博和投资并没有严格的分界线。这两者收益都是不确定的;其次,同样的投资工具,比如期货,你可以按照投资的方式来做,也可以按照赌博的方式来做———不做任何分析,孤注一掷;同样的赌博工具,比如赌马,你可以像通常人们所做的那样去碰运气,也可以像投资高科技产业那样去投资———基于细致的分析,按恰当的比例下注。
但是赌博和投资也有显然不同的地方:投资要求期望收益一定大于0,而赌博不要求,比如买彩票、赌马、赌大小……的期望收益就小于0;支撑投资的是关于未来收益的分析和预测,而支撑赌博的是侥幸获胜心理;投资要求回避风险,而赌博是找风险;一种投资工具可能使每个投资者获益,而赌博工具不可能。
投资也是一种博弈———对手是“市场先生”。但是,评价投资和评价通常的博弈比如下围棋是不同的。下围棋赢对手一目空和赢一百目空结果是相同的,而投资赚钱是越多越好。由于评价标准不同,策略也不同。
对于赌大小或赌红黑那样的赌博,很多人推荐这样一种策略:首先下一块钱(或1%),如果输了,赌注加倍;如果赢了,从头开始再下一块钱。理由是只要有一次赢了,你就可以扳回前面的全部损失,反过来成为赢家———赢一元;有人还认为它是一种不错的期货投资策略。实际上,这是一种糟透了的策略。因为这样做虽然胜率很高,但是赢时赢得少,输时输得多———可能倾家荡产,期望收益为0不变,而风险无限大。不过,这种策略对于下围棋等博弈倒是很合适,因为下围棋重要的是输赢,而不在于输赢多少目。
许多赌博方式都有庄家占先的特例。比如掷3只骰子赌大小,只要庄家掷出三个“1”或三个一样,则不管下注者掷出什么,庄家通吃,这使得庄家的期望收益大于0,而下注者的期望收益小于0。从统计的角度看,赌得越久,庄家胜率越大。
因而,赌场老板赢钱的一个重要原因便是:参赌者没有足够的耐心,或赌注下得太高,使得赌友很容易输光自己的资金,失去扳本的机会;而赌场老板的“战斗寿命”则要长得多,因为资金实力更雄厚,也因为面对不同的赌友老板分散了投资,因而不容易输光。
有部美国电影叫《赌场风云》,其中讲到,如果谁赢了大钱,老板就会想方设法缠住他再赌,使用的办法小到让妓女去挽留,大到让飞机晚点。没有耐心的赢家往往很快会变为输家。
上面讲的还是比较规范的赌场,有的赌场在赌具上搞鬼(出老千),或者使用暴力挽回损失,那么赌徒就更没有赢钱的希望。想通过赌博赚钱往往是“偷鸡不成,反蚀一把米。”
人并不是都是可以理性地去进行决策。比如从心理学的角度来看,大多数情况下,人们对所损失的东西的价值估计高出得到相同东西的价值的两倍。人们的视角不同,其决策与判断是存在“偏差”的。因为,人在不确定条件下的决策,不是取决于结果本身而是结果与设想的差距。也就是说,人们在决策时,总是会以自己的视角或参考标准来衡量,以此来决定决策的取舍。
一个赌徒去赌场赌,随身带了3000美元,赌客赢了100元,这时要求他离开赌场可能没什么。但如果是输了100元,这时同样要求他离开可能就很难,虽然赢100元时身上的现金为3100,输100元时身上的现金为2900,3100和2900相差6.9%,但这两种情况下给赌客的感觉和3100、2900并没有多大关系,而是和它们与本金3000之差100、-100,也即赢100还是输100有关,即人们对财富的变化十分敏感。
而且一旦超过某个“参照点”,对同样数量的损失和赢利,人们的感受是相当不相同的。在这个“参照点”附近,一定数量的损失所引起的价值损害(负效用)要大于同样数量的赢利所带来的价值满足。简单地说,就是输了100元钱所带来的不愉快感受要比赢了100元所带来的愉悦感受强烈得多。
当然,由于人的冒险本性和总希望有意外惊喜的本性,使得赌博可以作为一种娱乐。如果把赌博作为一种事业,嗜赌成瘾、贪婪、侥幸,带着一夜暴发的贪心会导致赌博过度,那就不是小赌怡情了,而是从娱乐变成痛苦。因为,“贪”字是由“今”和“贝”两个字构成,“今”是现在的意思,“贝”是金钱的意思,指的是急功近利。“婪”字是由“林”与“女”两个字构成,指的是女人如林,欲海无边。
现在与未来的博弈,“时间价值”与利率博弈
 
金钱虽然不是万能的,即使是古代社会,没有钱就是万万不能的。《钱神论》有云:“钱之为体,有乾坤之象。内则其方,外则其圆。其积如山,其流如川。动静有时,行藏有节。市井便易,不患耗折,唯折象寿,不匮象道。故能长久,为世神宝。亲之如兄,字曰孔方。失之则贫弱,得之则富昌。……钱多者处前,钱少者居后;处前者为君长,在后者为臣仆。君长者丰衍 而有余,臣仆者穷竭而不足。”
到了现代社会,金钱的重要性更是不言而喻。自然人们对待金钱的态度不仅是理性消费,更要注重理性投资。正所谓是“你不理财,财不理你”。这句话对于个人与家庭、企业甚至国家都是十分适用。所谓理财,简单说来就是以最低的成本筹集资金、以最低的风险取得最大的收益。
我们耳熟能详的一个常见的财经词汇———国家财政预算,就是政府收入与支出的理财计划。所谓公司财务或公司金融,则是公司的理财方法。
至于个人理财,最近几年才刚刚进入大众的视听范围之内。个人理财的逐渐流行主要是因为我国随着经济的迅猛发展,居民收入也水涨船高地快速增长,个人资产同时大幅度增加。
经济学告诉我们,收入与储蓄之间的变动关系受到收入效应的影响。根据恩格尔原理(随着家庭收入的增长,食物消费占整个的比例越来越低),居民收入(流量,指的是一段时间内所获得的经济报酬。)与财富(存量,指的是累积的总量,如一个家庭所拥有的总的资产。)的增长必将带来消费行为的改变。一般来说,这种影响就是收入的提高会使得人们在维持基本生活方面的消费比例降低,而节余却会相应增加,这些储蓄的资金可以用来进行各种理财活动。
在理财活动中,首先要了解的一个概念是“现金流”。
首先看这样一个例子。现在你要投资10万元开一家便利店,成本价1万元的商品卖的价格是1.2万元。如果1万元周转一次的销售收入是1.2万元,盈利是2000元。来看这样两种情况:第一,如果每天可以周转一次的话,每个月就可以获得6万元的利润;第二,如果每10天才周转一次的话,那么一个月的利润只有6000元。在前一种情况下,不考虑税收与其他因素的话,一年之后你的资产将会达到82万元;而在后一种情况下,一年之后你的资产仅有18.2万元。
那么,究竟什么是现金流呢?
其实,从上面那个例子,我们就能直观理解现金流了。如果一定要用比较严谨的语言来描述“现金流”的话,我们可以这么说:所谓现金流就是资产用“现金”来衡量时,资产价值随时间变化的流量。
如果你所投资的这10万元是从银行贷款的钱,那么情况又会如何呢?这个时候的现金流不仅要考虑每个月所赚到的收入,还要考虑资本成本。所谓资本成本就是必须要偿还银行贷款利息,一般都是以利息率表示资本成本。这就是所谓资金的“时间价值”。
资金的“时间价值”意味着钱财离开原先的所有者转移到使用者手中,经过一段时间之后,再从使用者转回到所有者手里必须要附加额外的钱,这个额外的资金即利息。
我们所熟知的投资基金的“七二法则”就是“时间价值”的应用原则之一。所谓“七二法则”就是说,不拿回利息,一直利滚利,本金增值一倍所需的时间。本金增长一倍所需时间(年)=72/年收益率。举例来说,如果你存10万元在银行,年利率2%,每年利滚利,要36年才可以增加一倍变成20万元。又比如,你投资30万元在一只每年报酬率12%的投资基金上,约需6年时间会增值一倍,变成60万元。
从博弈的角度去看待时间价值的话,就是资金拥有者是选择现在就将这些资金消费掉,还是选择将这些资金储蓄起来进行投资并在未来获得收益。简单来说,时间价值就是一个消费者现在与未来之间的消费决策博弈。决定消费者两种情况优劣的因素是市场利率。
市场利率变动机制是一个非常复杂的问题,职业经济学家们对于市场利率变动的原因是争论不休。总的说来有两种看法:一种认为市场利率完全是由市场来决定,一个国家的货币发行量是根据市场状况而定的;另一种看法认为市场利率是由政府的货币当局所发行的货币量来决定。在前一种情况下,“时间价值”中现在与未来之间的博弈方式正是前文所提到的人与“市场先生”进行博弈的一种形式。在后一种情况下,“时间价值”中现在与未来之间的博弈则是居民与政府之间的博弈。
为了简化利率的问题,我们不考虑市场利率变换的原因,只要知道未来的市场利率将会发生改变就可以。打个简单的比方。比如你现在需要购买住房,有这么两种选择:其一,一次性付清方式;其二,住房按揭贷款方式。我们不妨假设你所要购买的住宅现在一次性付清需要50万元。采用十年期按揭方式时,市场利率为12%,首付10万,每个月还贷5000元。如果不考虑“时间价值”,采用按揭方式的总还款额是0.5×12×10+10=70万元,比一次性付款所要付出的金额要大得多。
然而,考虑到“时间价值”时,按揭方式的购房总现值就是:
10+++……+=43.9万元
令人惊讶的事情发生了———一次性付款反而比按揭方式的现值要高6.1万元。这种情况下,理性的购房者将会选择按揭方式购买住房。
再来看这样一种情况,如果市场利率降低为6%。此时的十年期按揭方式所付出的现值是54.16万元。很明显,在市场利率降低之后,理性购房者会选择一次性购房。我们从这个例子中可以看到:当市场处于加息周期(市场利率升高)时,固定利率房贷对借款人有利,银行吃亏;但如果市场处于非加息周期甚至是处于降息周期(市场利率降低),那么住房贷款利率固定显然对银行有利,借款人则吃亏。
当然在现实生活中,大部分的居民很难承受一次性购房的经济压力,往往选择按揭方式购买住房。按照我国现有的经济法规,按揭利率可以是浮动利率也可以是固定利率。所谓固定利率住房贷款,就是借款人与银行签订贷款合同时即设定好固定的利率和对应的固定期间,不论固定期间内市场利率如何变动,借款人都按照合同约定的固定利率支付利息。浮动利率则不同,是购房者根据市场利率的变动不断调整,而且是同向变化,也就是说,市场利率上升则浮动利率上升,市场利率下降则浮动利率下降。
不管选择固定利率还是选择浮动利率,购房者应对两种利率在合同期内所支付的利息总额进行比较,哪一种付出的现值越低就选择哪一种方式。在这种情况下,购房者与政府的中央银行就构成了利率博弈的两个参与者。
这里要注意的问题是,购房者合同中的利率决定了购房者每个月或每年要交纳的还款金额,在市场不变的情况下,合同利率越高,现值越高;当合同利率不变时,市场利率越高,则现值越低。我们不得不用一个简单的数学公式表达这种关系:
购置房产所付的现值=D+++……+
D表示的购房者首付金额,K表示购房者贷款总额,i表示的是合同利率,r表示的是市场利率。K i是每年还款的数额,以年为单位的利率是复利,以月为单位的利率则是单利。如果合同的年利率是12%,则月利率是12%/12=1%,也就是说每个月则需要还款K i/12元。上面所提到的一次性购房与按揭购房的例子有一个假设就是合同利率是固定的,从这个例子中我们可以看到合同利率固定时,市场利率降低会导致购房者付出的现值增大,购房者遭受利率损失。反之,市场利率升高时,则购房者付出的现值降低,购房者比较划算。
这里还要注意一个问题,上面所有的计算中的市场利率指的都是实际利率。实际利率考虑到通货膨胀的因素,假设预期通货膨胀率是π,实际利率R,名义利率为r。那么如果2006年1月1日你将A元的现金以名义利率r借给别人,1年之后,2007年1月1日别人还你钱的数额名义是A(1+r),然而这一年中人民币一直是对内贬值,这A(1+r)的人民币只相当于2006年1月1日的A(1+r)/(1+π)。因此,你借给别人钱的实际利率R可以通过A(1+R)=A(1+r)/(1+π)的式子算出,结果是实际利率R=(r-π)/(1+π)。很多时候,人们都认为R=r-π,即实际利率为名义利率减去预期通货膨胀率。实际上,只有在π比较小时,R≈r-π。当通货膨胀率比较大时,就只能用R=(r-π)/(1+π)来计算实际利率。
如果购房者选择是浮动利率方式按揭的话,市场利率的上升与下降对所付现值的影响比较小,我们不妨认为,在这种情况下,购房者既无损失也无受益。
博弈的参与者是按揭购房者与政府或市场。对于购房者来说,购房的方式有两种选择:固定利率、浮动利率。由于政府的宏观调控或市场的作用,利率也会有两种变化的趋势,我们简单地看成是在购房者还款期间只调整一次,这样未来的市场利率变化也有两种选择:市场利率降低;市场利率提高。这样我们就可以得到购房者的收益矩阵。
在实际中,购房者与市场利率的变化之间既可能具有一致性,或者简单地说就是购房者无论选择哪种利率,还贷的期间都是处于市场利率变化要么提高要么降低的周期内。这种一致性也可能不具备,也就是说这种周期与购房者的还贷周期往往并不一致,这会让实际的情况更加复杂。这里的博弈分析只是一种简化而已。
如果考虑到市场利率既受到市场因素的影响,又受到政府货币政策以及各种随机因素的影响,利率变化的趋势将会极其复杂。总而言之,这种利率博弈对于购房者来说就是一种极难预测的利率风险,购房者对于这种利率风险应该审时度势、慎之又慎。
如何理解“风险越高,收益越高”?
 
在投资理财中,有这样的流行观点:“风险越高,收益越大。”换句话说,就是人们为了获得更高的利益愿意承担更大的风险。从另一个方面来看,就是所承担的风险具有一定的价值。这就是人们常说的“风险价值”。
在实际生活中,我们每一个人对未来所作的决策都不可能百分之百地准确。未来的变化是不确定的。对于未来变化的不确定性,有两种情况:其一,未来的 变化具有统计特征,可以通过统计方法来分析,比如前面提到的赌博;其二,未来变化是混沌的,无法通过统计方法来分析。风险则是指可以通过统计方法来处理的未来收益或损失的不确定性。
未来的风险既可能是发生危险与损失,也可能是获得机会与好处。我们来看这样的一个随机数集合{19,16,21,24,24,25,13,19,23,17,18,15,14,17,18,14,18,19,20,19,19,19,24,20,19,18,26,23,27,18,25,15,22,23,26,20,18,22,19,22,16,17,15,19,20,20,19,27,15,18}。这个集合中共有50个数字。这个数据集合的平均值是所有的20,方差是3。
如果这个集合是你作某个投资的收益各种可能回报,那么你这项投资的平均收益就是20万元,而未来可能的收益是围绕着20万元这个平均收益上下波动的。方差则是衡量波动幅度大小,方差越大,波动的幅度就越大,方差越小,波动幅度越小。
我们再来看这样一组投资收益的数据{18,15,20,18,20,18,16,18,21,17,15,17,14,13,13,19,17,17,15,17,12,20,16,13,20,13,13,17,16,17,16,24,17,17,19,15,18,18,20,11,18,17,16,14,17,19,17,14,16,14,31}。这组数据的平均收益是16万元,方差也是3万元,方差和前一组数据相同。很明显,在方差相同的情况下,平均收益越高,波动的程度就越小。
为了区分这种波动程度的不同,我们又引入了变异系数的概念,变异系数=方差/均值。变异系数越大,波动程度越大。对于风险的统计分析,则是通过这种均值-方差分析得来的。简单地说,变异系数越大,风险越高,变异系数越小,风险越低。在所举的两个例子中,3/20通过这两个例子,我们明显发现,前者的平均收益20万元比后者的平均收益16万元要高,然而风险却低于后者。肯定会有人产生疑问,难道“高风险高收益”错了吗?
实际上,任何投资包括个人理财的投资都具有不同性质的风险。比如你购买股票,风险可能来自于市场内在的振荡,央行的突然加息、降息或汇率调整,政治事件、某个企业的会计欺诈等多种因素。这许许多多的风险对于一个具体的投资项目可以分成系统性风险与非系统性风险。诺贝尔奖获得者马克维兹(Markowitz)早在几十年以前就通过统计学方法证明出,当合理投资于多个项目的时候非系统性风险就可以被分散化解,当投资组合足够大时所留下的不能被分散化解的只可能是系统性的市场风险。现在我们很容易能够理解上述两个例子的问题,前者平均收益高于后者而风险低于后者的原因是:后者的非系统性风险要高于前者,前者的系统风险则高于后者。
所谓“高风险高回报”的含义就是指系统性风险越高收益越高。用严格的数学表示式来描述就是资本资产定价模型:
R=R+(-R)×β
Rf表示的是无风险利率,RM表示的是投资组合达到完全分散非系统风险时的系统风险利率。
βim表示当整个市场收益波动时,某单个投资的波动程度的大小。βim越大,表示这个投资相对整个市场来说,风险较小,反之则较大。从统计学的角度来看,βim是随机变量Ri-Rf(单个投资项目的投资收益率-无风险收益率)关于随机变量Rm-Rf(投资组合收益率-无风险收益率)的回归系数。
资本资产定价模型的β系数概念深刻地改变并影响了投资学。β(beta)系数在投资理财中是一个核心概念,β系数告诉我们:任何投资项目的超额收益率与整个市场的超额收益率呈线性正比关系。β系数来度量了包括股票在内的证券市场等各种投资项目的系统风险,β系数越大系统风险越高,而不能用β系数来度量的则是非系统风险。
根据资本资产定价模型,我们还可以在二维坐标系上描述出一条证券市场线。关于这个问题在任何一本投资学的教材对这个问题都会有解释,笔者不再做详细的介绍。
根据资本资产定价模型与证券市场线的原理与实证的经验研究,各种投资理财项目的风险与收益之间的关系如下图:
“不要把鸡蛋放在一个篮子里”说的就是投资组合分散风险的道理。上文所述的市场组合指的是风险能够被完全分散的全球市场。然而在实际生活中,没有任何一个人可以具备这种天文数字般的财务能力投资于成千上万的项目。对于个人来说,所能选择投资项目毕竟是有限的。
我们先来考虑这样的情况:有两种股票可以选择,一家是彩电制造企业的股票,另一家是彩电元件生产企业的股票。在这种情况下,两家公司股票的上涨与下跌往往是同方向的,两种股票的投资组合并不能降低整体的风险。
再来看这样的例子:还是两种股票可以选择,一家是非碳酸饮料制造企业的股票,另一家是碳酸饮料制造企业的股票。碳酸饮料与非碳酸饮料的市场具有替代性,换句话说,其中一种饮料的消费量减少往往是因为另一种饮料的消费者增多。在这种情况,两家公司的股票上涨与下跌具有反方向的特征,两种股票的投资组合可以大大地降低风险,而平均收益率即使降低幅度也不会很大。
正是由于投资项目有互补性和替补性,个人投资理财才成为可能。简单说来,个人理财博弈可分为投资决策、消费决策、融资决策这三种情况的博弈模型。
先来看投资决策,设想你有一笔资金,可以投资股票、房地产、债券、国库券等投资项目。由图13可以得到下图。
这个矩阵的均衡点是(高风险,高稳定性)与(低风险,低稳定性)这两点。如果选择的是(低风险,高稳定性)所采取的策略,投资的平均收益率较低;如果选择的是(高风险,低稳定性)所采取的策略,则投资的风险过高。因而,最终的投资组合必然是在(高风险,高稳定性)与(低风险,低稳定性)这两种情况的各种组合之中选择最好的投资比例。
股票投资比重的“一百减年龄”原则就是这个博弈矩阵的一个应用。所谓“一百减年龄”原则是说,(100-年龄)×100%就是你投资股票的比重。对一个30岁的年轻人,追求成长,适当的投资股票比重是70%;一名60岁的退休者,要的是稳定平安,股票投资不可超过30%。当然你也可以将100改为80、70或60减去年龄,作为投资股票的比重。不同之处只在于,所取的X-100中的X越大,投资组合稳定性越高。
保险的“双十定律”原则也是同样的道理。它指的是保险额度为家庭年收入10倍最恰当,及总保费支出为家庭年收入10%最为适宜。
个人理财中的消费决策主要是由现在消费与未来消费之间的博弈结果决定的。消费决策指的是如何平衡现在的存量资产和未来的收入的消费状况,一般来说有3种类型:把现在的钱留给未来用的节俭型、现在赚的钱现在用未来赚的钱未来用的“月月光”型和把未来的钱拿到现在用的“游戏人生”型。现在用钱方式的博弈矩阵见上图。
这个博弈矩阵中的,好、中、差分别代表消费带来的满足的程度。用未来的钱指的是借钱现在用。比如(好,差)表示现在既多用现在所赚的钱少用未来所赚的钱,绝大部分未来赚取的钱留到未来再用。这种境况使得决策者现在的满足程度为好,未来的为差。两个均为(中,中)的策略表示,这时消费者的选择有两个:其一,现在赚的钱现在用,未来赚的钱未来用;其二,现在赚的钱未来用,未来赚的钱现在用,换句话说就是一边储蓄现在的钱留在将来用,一边借钱现在用。这个博弈矩阵个人最终的选择会是(中,好)境况的策略,也就是将现在与未来所赚取钱的绝大部分用于储蓄投资。这告诉我们,理性合理的理财会让我们整个一生的总体效用最大。
所谓融资决策,就是借钱,个人向银行借钱的贷款或按揭,主要是用来增加现期的现金流,以满足个人现在的消费需求或投资需求。上一节给出的房地产按揭案例已经解释了这个问题,这里就不再赘叙。
总的说来,理性理财的基本原则是资金的“时间价值”与“风险价值”。对于投资组合的选择,理性理财需要人们慎重考虑的是投资消费筹资的合理性、生命周期内的均衡性和规则性。
 
 “超级女声”、凯恩斯“美女投票论”与泡沫经济
 
很多电视台在进行各种电视大赛时经常会用采取有奖竞猜这样的方式来提高收视率与观众的参与度。所谓有奖竞猜,一般是将抽奖机会给予猜中最终结果的电视观众。当然参与竞猜的观众不仅要选对参赛者,而且还要将这些参赛者最终成绩的排序也要猜得完全准确,这样的观众(投票者)才能获得奖励。因此,投票者能够选中的话,或者说被他提名的参赛者能够“当选” 的话,关键是猜测别人的想法,猜对了你就能获胜,猜错了,你则不能获奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁不应该选上的问题,而是投票的人相互猜测的结果。
比如最近湖南卫视的“超级女声”栏目就是这样。“超级女声”在全国都有很大的影响力,最后决赛的时候投票人次甚至超过上千万。至于最后到底哪位选手的歌喉最优美,最能打动观众,这就要看观众整体的喜好。
这与经济学大师凯恩斯(John Maynard Kyenes)曾说过的“美女投票”故事有几分相似,这个故事一直被人们广泛引用。
凯恩斯说:“专业投资大约可以比做报纸举办的比赛,这些比赛由读者从100张照片当中选出6张最漂亮的面孔,谁的选择最接近全体投票者的平均偏好,谁就能获奖;因此,每个参加者必须挑选并非他自己认为最漂亮的面孔,而是他认为最能吸引其他参加者注意力的面孔,这些其他参加者也正以同样的方式考虑这个问题。现在要选的不是根据个人最佳判断确定的真正最漂亮的面孔,甚至也不是一般人的意见认为的真正最漂亮的面孔。我们必须作出第三种选择,即运用我们的智慧预计一般人的意见,认为一般人的意见应该是什么。”
在选美比赛中,最终的结果与谁是最漂亮的女人无关。人们所要关心的是怎样预测其他人认为谁最漂亮,又或是其他人认为其他人认为谁最漂亮。“超级女声”最终结果的预测也并不是看你觉得究竟谁的歌喉最动听,谁的歌声最打动你,而是要判断其他的观众是什么看法。
股票市场具有一些类似的特点。投资要义不在于投资者自己对证券价值的挖掘认识,应重点关心其他投资者的看法。也就是说,每个投资者都希望赚钱,可是能否赚钱,不完全取决于某个上市公司的赢利情况,更要取决于其他投资者是否看好这只股票。
然而,当我们进一步考虑时,会发现实际的问题更加复杂。因为投票者将全部从相同的角度来看待这个问题。因此,作为股票投资者必须判断的不仅仅是别人是什么想法,而是判断“其他某个人所判断的除这个人自己之外的其他人的想法是什么”。这句话说起来颇有些拗口,实际上,在投票时,没有多少人会去考虑这么多的信息,首先无法收集足够多的背景信息,其次对其他人的想法只是一种猜测,并不一定可以推测出其他人的真实想法。
现实中的情况是,研究表明,人们普遍有一种赌博的倾向。有专家估计,1974年美国的成年人口中有61%参与不同形式的赌博,其中,1.1%的男人和0.5%的女人是狂热的赌徒,另外的2.7%男人和1%的女人是潜在的狂热赌徒。在一定程度上,赌博者对于赌局的可能结果有非常好的理性预期,并且还有其他的感情因素会驱动他们的实际行为。
此外,在这种博弈中,“羊群效应”(Herd Effect)也起着很大的作用。人们在不确定下决策时,行为受到其它投资者的影响,模仿他人决策,或过度依赖舆论。因而人们面对类似的信息环境时,会作出类似的行为反应。“羊群效应”导致资产价格不连续的和大幅的波动,破坏了市场的稳定性。
假设市场上现在有1000个投资者,对一项在新兴市场上投资机会有不同的看法,其中200人认为这项投资有利可图,但其他800人则持有相反的意见。如果将这1000个人的意见综合起来看,这项投资肯定是不明智的。然而,在他们信息无法沟通的情况下,如果最初进行决策的投资者是少数的那200人,他们就会进行投资,而另外的800人则逐渐改变想法跟随着这少数人去投资。这便形成“滚雪球效应”(Snow-balling Effect),这种情况下“羊群效应”发生了。
同时,人们在“博傻心理”支配下,股票、房地产等资产价格越高越买,越买价格越高,从而导致金融市场超常规膨胀,引起泡沫经济。比如前两年的房地产市场与更久远的股票市场,它们在其他商品微幅涨价甚至跌价的时候,价格是大幅度上涨。目前大部分城市的房价是远远超出当地普通人的经济承受能力。
这里所谓的资产,是指股票、土地、厂房、设备、房产(房产既是消费品又是资产,当房产是购房者自住时,就可以当成是消费品)等。这些东西与一般的物品是不同的,比如房产可以通过出租方式长期获得收益,而日常用品诸如电视机、电冰箱、空调等商品仅仅是消费,并不能够通过它们来获得经济回报。
经济泡沫,最权威的《新帕尔格雷夫经济学大词典》中说,“‘泡沫状态’不太严格定义为,一种或一系列资产在一个连续过程中陡然涨价,开始价格上升会使人们产生还要涨价的预期,于是又吸引新买主……只想通过买卖牟取利润,对资产本身使用和产生盈利能力不感兴趣。随着涨价常常是预期逆转,接着是价格暴跌,最后以金融危机告终。通常,“繁荣”时间比泡沫状态长些,价格、生产和利润上升比较温和,接着就是以暴跌(或恐慌)形式出现危机,或以繁荣逐渐消退告终而不发生危机。”
在18世纪英国的“南海泡沫”中,投资者趋之若鹜,其中包括半数以上的参众议员,就连国王也禁不住诱惑,认购价值10万英镑的股票。由于购买踊跃,股票供不应求,公司的股票价格狂飙,在6个月内从每股128英镑上升到每股1000英镑以上,涨幅高达700%。然而,南海公司的经营却每况愈下,赢利甚微,公司股票的市场价格与上市公司实际经营前景完全脱节。
在南海公司股票价格扶摇直上的示范效应下,全英所有股份公司的股票都是投机对象。社会各界人士,包括军人和家庭妇女,甚至物理学家牛顿都卷入漩涡。人们完全丧失理智,他们不在乎这些公司的经营范围、经营状况和发展前景,只相信发起人说他们的公司能获取巨大利润,人们惟恐错过大捞一把的机会。一时间,股票价格暴涨,平均涨幅超过5倍。大科学家牛顿在事后不得不感叹:“我能计算出天体的运行轨迹,却难以预料到人们如此疯狂”。
当然,股票市场和房地产市场毕竟是不同的。股票无论涨到多高,只要继续上涨就不会出现直接的受害者。然而,人们总是要在土地上生存的,遮风避雨的房子也是每个人的必需品。
然而,房地产、股票等资产价格的上涨,为投资家带来亿万的财富。人们依靠劳动所得的工资收入远远不能与之相比较,这使整个社会的价值观发生混乱。汗流浃背的劳动所得,远不如金钱游戏带来的利益,必然对劳动积极性产生很坏的影响。对于企业也是一样,试问,如果在房地产或股票市场投机所得的收入远高于企业经营管理的回报,还会有哪一家公司认认真真地把企业做好?
在这种情况下,“财富效应”的作用开始发生。所谓“财富效应”,即资产诸如股票、房地产的价格高涨可以使人们感到财富增加,从而加大消费动机,刺激消费需求。财富效应,资产泡沫导致人们忽视自己的经济能力,推动消费与投资的增长。对于为数众多的家庭,随着股票、房地产价格的上涨,会大幅度提高消费档次,而消费需要的不断增长当又给经济泡沫打上一针兴奋剂。
著名经济学家郎咸平教授曾经于2005年10月1日在澳大利亚的墨尔本对“财富效应”做过这样一段生动的描述:“我更担心是,上海市老百姓的消费习惯是很奇怪的,他不是根据赚多少钱来消费的,他的消费习惯有二个变数,一个是薪水多少,另外一个呢?是财富效果。由于房地产大幅泡沫现象,房子价值虚增比较多,甚至增值100%、200%的都有。老百姓觉得自己口袋鼓了,出门打的啦,晚上出去吃喝玩乐啦,腐败呀。上海是个最有趣的区域,你只要稍微下一点小雨,毛毛雨,再叫不到出租车,大家都怕淋点雨,娇贵的样子,怕淋点小雨。还有,不论你菜做得多难吃啊,总是高朋满座,这是上海人的一个独特现象。各位知道为什么吗?就是那种财富效果,所产生的一种畸形消费,这种畸形的消费拉抬了上海市的经济。”
当然,值得强调的是,不管是“羊群效应”,或是“美女投票”,还是“财富效应”,只要是泡沫,终归是要破灭的。因为从投机的作用机制看,这场游戏注定会结束。假设一项资产价值为100万,假定每一个人都在赚得10%后抛出,被n次转手的这项金融资产价格就会是100×(1+10%)n万。要使游戏不断玩下去,n将趋向于无穷大,永远不停止,这样100×(1+10%) n万也会趋向于无穷大。若货币发行量可以无限增大,以适应资产增值的要求,泡沫还可以继续维持。但是,货币的发行量总是有限的,否则会引起极度的通货膨胀,这样泡沫的破裂带有必然性。
在世界经济史上,狂热投机产生的泡沫事件,最早可追溯到17世纪30年代出现的席卷整个荷兰的“郁金香疯狂”。在“南海泡沫事件”和“密西西比泡沫事件”之后,泡沫事件与泡沫经济已不胜枚举。但共同的结局是,每次泡沫事件都沉重打击了当时的经济,用于修复投机创伤一般长达十几年甚至几十年之久。
 
随机游走(Random Walk)、正反馈与庞氏骗局
 
在证券投资中有这样一个经典的笑话,说的是:那些殚精竭虑的投资分析专家门精心挑选出来的投资组合与一群蒙住双眼的猴子在股票报价表上用飞镖胡乱投射所选中的股票在投资收益率上没有质的差别。这也就是说,股价波动是无法通过对历史数据的分析来预测未来的走向的。这就是著名的“随机游走”(Random Walk)理论。
在随机游走理论中,股价有一个均值P0 ,未来股价的Pn=P+εn(ε,音念乙朴休)。εn为随机干扰变量,并且其均值为0。在这种情况下,这种股价的变化就像一个“醉汉”在路上横行。在每一个时刻,他既可能往左走一步,也可能向右走一步。尽管这个股价这个“醉汉”总围绕着均值上下徘徊,但时间越长,他离均值就可能越远。
如果证券价格是服从随机游走理论的,那么这个金融市场就是有效的。在这种情况下,所有的金融工具都能准确、及时地反映出各种信息。也就是说,各种证券都能被准确地定价,任何人与机构都不可能预测证券未来的价格。这样,就不存在入市的最佳时机,也不存在选择股票,更不存在金融分析。那种追求赌博带来刺激与兴奋的人与小心翼翼地分析并选择金融资产的理性的投资者们也没有了任何区别。
然而,事实上,在金融市场中,几家欢乐几家愁,总有人大发其财,更有人倾家荡产,这其中的原因并不都是命运,巴菲特、索罗斯就是反例。看来金融市场并不完全满足随机游走的有效市场假设。
在金融市场的炒作中,对预期收益率、预期利率以及一切有关的信息的估计,往往有超常规的放大效应,这使得金融资产如股票的价格不仅变换频繁,而且往往带有惊人的震荡幅度。比如美国道琼斯30种工业股票价格指数从1995年的5117.1点,到1998年年中突破9000点,只不过两年半的时间,竟然上升了75%。在亚洲金融危机中,不少国家的股票指数都有一天跌破10%的记录。
这种现象,亚洲金融危机的始作俑者索罗斯在其所著的《开放社会———改革全球资本主义》中是这样描述的:“我把历史解释成一个反射过程,在这个过程中,参与者带有偏见的决策与一个超出他们理解力的现实相互影响。这种相互影响能够自我加强或自我矫正。一个自我加强的过程不可能永远持续下去而不受到现实世界极限的制约,但它却可以持续足够久远,以至于给现实世界带来重大的变化。当它不能朝着原有的方向发展下去时,就会进入一个相反方向的自我加强过程。”
在现实中,金融市场往往具有一种放大机制。因为过去的价格增长增强投资者的信心与期望,这些投资者又进一步地哄抬股价以吸引更多的投资者,这种循环不断进行下去,造成一种过激反应。从心理学角度来看这种现象就是,人们在任何领域获得成功之后,总会有一种自然倾向,采取行动来求得更大的成功,并不断继续下去。
在这种情况下,最初的价格上涨导致了更高的价格上涨,因为通过投资者需求的增加,最初价格上涨的结果又反馈到更高的价格中去。第二轮的价格上涨又反馈到第三轮中,接着反馈到第四轮,依此类推。最初的价格上涨的诱发因素被放大很多倍。一旦需求在某个时刻达到顶点后,整个泡沫瞬时崩溃。这就是在上一节中的泡沫形成的原因。
在所有的正反馈机制下的泡沫中,最典型的莫过于庞氏(Ponzi)骗局或称金融金字塔骗局。在一个庞氏骗局中,骗局制造者向投资者许诺,投资便能获得极高的收益率,但投资者付出的投资几乎没有甚至根本没有被投向任何真正的资产。相反,骗局制造者将第二轮投资者的部分资金支付给第一轮的投资者,又将第三轮投资者的部分资金支付给第二轮的投资者,依此类推。在最初的投资者盈利之后,他们的成功将会激发更多的投资者参与这个骗局。当盈利者越来越多,参与者越来越多时,最终整个金字塔不堪重负,轰然倒下,最后一轮的参与者将是整个骗局损失的最终承担者。
庞氏骗局的过程正形象地描述了金融市场中由于人的非理性心理因素而导致的投机性泡沫不断扩大并最终破灭的整个过程。
 
 博弈论不能包治百病
 
任何理论与方法都不是万能的。博弈论亦然,它不可能包治百病。这正如诺贝尔经济学奖得主———莱因哈德·泽尔滕教授(莱因哈德·泽尔滕:德国波恩大学,1994年因其在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖,其主要研究领域为博弈论、试验经济学、有限理性和行为经济学。)所说,“博弈论并不是疗法,也不是处方, 它不能帮我们在赌博中获胜,不能帮我们通过投机来致富,也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典的任务。”
要求博弈论能够完全刻画真实的世界,那么这命中注定是徒劳无功。根据著名的哥德尔不完备定理,任何一个理论体系必定是不完全的,任何理论都包含既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例尺是一比一的地图是没用的”。
博弈论也是这样,博弈论是在力图用最简单的假设下得到最大范围的推理应用。博弈论的这种方法与很多应用广泛的学科都是相似的。
如欧几里德几何学是在“两点之间直线最短”的基本假设下,推演出庞大而严密的几何体系。可以说,在生活中或工程应用中,博弈论的思想方法是无处不在、无时不有。博弈论的基本前提假设之一就是:人是理性的(rational)。所谓理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。
而现实生活中,人们在做决策时往往是有限理性。所谓有限理性,也就是说人不是机器,人的理性是有限度的。
比方说,某人要签署一份合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划进行;另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后一种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。
后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意义上的经济理性。
这是因为人们很难对每个措施将要产生的结果,具有完全的了解和正确的预测。人们常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策。因此,个人或企业的决策都是在有限理性的条件下进行的。
有这么一个经典的决策实验:研究者告诉一个实验群体,让他们设想美国准备帮助亚洲应对一种不寻常的疾病,该病可能导致600人死亡。A、B两种备选方案被提出。实验群体被分成两组,每组进行相应的选择。假设对方案实施结果的准确估算如下:
实验群体一的选择:“若方案A被采纳,能拯救200人;若方案B被采纳,有1/3的可能性拯救600人;2/3的可能性一个也不会救”。
实验群体二的选择:“若方案A被采纳,则会导致400人死亡;若方案B被采纳,有1/3的可能性把人全部救活;2/3的可能性导致600人全部死亡”。
如果人们是完全理性的,那么两组人的选择结果应该相同。但实际的实验结果显示,在群体一中,72%的人更偏好方案A;而在实验群体二中,68%的人更偏好方案B。看来,对方案描述的不同影响到人们的选择,大部分人并不是完全理性的。
学者们还做过这样的实验:有两种情况分别如下:
情况一:今天晚上你打算去听一场音乐会。票价100元。在你临出发前,发现自己丢掉100元。你还会去听音乐会吗?
情况二:昨天你花100元买了一张今晚的音乐会票。在你临出发时,发现票被遗失。如果你想听这场音乐会,就要再花100元买票。你还会去听吗?
实验表明,在第一种情况下,大多数人选择要听音乐会。而在第二种情况下,大多数人选择不去听。这明显是受到人们心理作用的结果。而实际上如果人们都是理性,这两个情况的预期效用是一样的。
我们在前面曾经举过一个银行挤兑的二阶段动态博弈的例子。如果在这个博弈中的参与者是完全理性,银行挤兑破产的情况并不会发生。然而,不管是经济学家们的实验还是真实的金融史都告诉我们,绝大部分人常常忽视第二阶段,仅仅考虑第一阶段,这说明决策者在决策时存在短视(myopia)。这种情况在经济学上被称为“分离效应”(Isola-tion Effect)。
分离效应是人们想等到信息显示后再进行决策的倾向,即使这些信息对决策并不真的重要,在没有信息时也会作出相同的决策,也要等到信息显示时采取最终决策。
例如抛硬币打赌,打第一个赌的人又被问到是否愿再打一个相同的赌。如果在第一次结果出来以后再问,大部分对是否打第二个赌取决于他们是否赢了第一次。然而,如果在第一次的结果出现之前就决定是否打第二次赌的话,大部分人不愿打赌。这样,如果不管第一次结果如何,一个人的决策是相同的,则此人在知道结果前就作出了相同的决策。这种行为的思考模式是如果第一次的结果已知并是好的,打赌人就会认为在第二次打赌中不会损失什么。但是如果结果未知,他们没有清楚的理由来打第二次赌。银行挤兑情况的发生往往就是因为这个原因。
完全理性,还意味着对每个抉择的确切后果都有完完全全的了解。事实上,一个人对自己的行动条件的了解,从来都只能是零碎的;至于使他得以从对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的。
人类的精力和时间永远是有限的,人不可能具有完全理性,不可能掌握所有知识和信息。人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本,而不是毫不费成本的。
因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息,企图作出收益最优的决策行为有时反而是最不理性的行为。
但是,当我们退而求其次时,博弈论可以得到对现实的客观世界描述的近似。
所以博弈论仍然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数学一样,博弈论是社会科学的力学和数学。
没有牛顿力学,我们连最简单的物理现象都无法理解。马用了多大的力拉动一车货物?上帝说:“让牛顿来做吧!”于是我们知道了马用的力相当于克服摩擦力。同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。
著名的博弈论大师鲁宾斯坦(Rubinstein)说过,“一个博弈模型是我们关于现实的观念的近似,而不是现实的客观描述的近似。”
康德“理论之树是灰色的,生命之树常青!”的话用在博弈论上也是十分贴切的。
 
“知识就是力量”的另类解释:信息有价
 
话说有一个古董商,他发现一个人用珍贵的茶碟做猫食碗,于是假装很喜爱这只猫,要从主人手里买下。猫主人不卖,为此古董商出了大价钱。成交之后,古董商装作不在意地说:“这个碟子它已经用惯了,就一块送给我吧。”猫主人不干了:“你知道用这个碟子,我已经卖出多少只猫了?”
可他万万没想到,猫主人不但知道,而且利用了他“认为对方不知道”的错误大 赚了一笔。这才是真正的“信息不对称”。信息不对称造成的劣势,几乎是每个人都要面临的困境。谁都不是全知全觉,那么怎么办?首先,为了避免这样的困境,我们应该在行动之前,尽可能掌握有关信息。人类的知识、经验等,都是这样的“信息库”。
再来看一个故事:有一个卖草帽的人,有一天,他叫卖归来,到路边的一棵大树旁打起瞌睡。等他醒来的时候,发现身边的帽子都不见了。抬头一看,树上有很多猴子,而且每一只猴子的头上都有顶草帽。他想到猴子喜欢模仿人的动作,于是就把自己头上的帽子拿下来,扔到地上;猴子也学着他,将帽子纷纷扔到地上。于是卖帽子的人捡起地上的帽子,回家去了。
后来,他将此事告诉了他的儿子和孙子。很多年之后,他的孙子继承了卖帽子的家业。有一天,他也在大树旁睡着了,而帽子也同样被猴子拿走了。孙子想到爷爷告诉自己的办法,他拿下帽子扔到地上。可是猴子非但没照着做,还把他扔下的帽子也捡走了,临走时还说:“我爷爷早告诉我了,你这个老骗子会玩什么把戏。”
这两个故事告诉我们:我们并不一定知道未来将会面对什么问题,但是你掌握的信息越多,正确决策的可能就越大。
这和我们前面所说的那些博弈是不同的。所谓“囚徒困境”、“智猪博弈”、“斗鸡博弈”等各种模型都有一个前提条件———博弈双方都有共同知识:博弈参与者都知道,对方所能采用的策略与各种可能发生的结局。简单地说,这些博弈都没有信息不对称的情况。
在实际生活中,很多情况下并不都是这么理想化的。人寿保险公司并不知道投保人真实的身体状况如何,只有投保人自己对自身健康状况才有最确切的了解。政府官员廉洁与否,一般的公民并不是非常清楚。求职者向公司投递简历,求职者的能力相对而言只有自己最清楚,公司并不完全了解。最常见的例子就是买卖双方进行交易时,对交易商品的质量高低,自然是卖方比买方更加了解。
之所以有这些信息不对称的情况,是因为存在“私有信息”。所谓“私有信息”,通俗地讲,就是如果某一方所知道的信息而对方并不知道,这种信息就是拥有信息一方的私有信息。
说到现在的“信息不对称”,那么到底什么是“信息”呢?
有位专家说,信息就是信息,既不是物质,也不是精神。这似乎是什么都没说,又似乎已经说得很正确。广义地说,所谓信息就是消息。对人类而言,人的五官生来就是为了感受信息的,它们是信息的接收器,它们所感受到的一切,都是信息。
然而,大量的信息是我们的五官不能直接感受的,人类正通过各种手段,发明各种仪器来感知它们,发现它们。信息可以交流,如果不能交流,信息就毫无用处。信息还可以被储存和使用。你所读过的书,你所听到的音乐,你所看到的事物,你所想到或者做过的事情,这些都是信息。
私有信息,简单地说,如商家的产品是否有严重缺陷的信息,这样的信息往往只被能接近和熟悉这种产品的人观察到,那些无法接近这种产品的人却无从了解或难以了解。
相反,如果一则信息是大家都知道的,或者是所有有关的人都知道的,它就叫做“公共信息”或者“公共知识”。“私有信息”的存在导致了“信息的不对称性”,也就是某些人掌握的信息要多于其他的人。
私有信息的存在是信息不对称情况发生的根本原因。比如一个女孩面对好几个追求的男生,这些男生的人品、上进心等信息对于这个女孩来说都是私有信息,女孩与追求的男生之间就存在着信息不对称的现象,因此这个女孩到底选择哪一个男生往往就带有很大的不确定性。
私有信息掌握与否也是委托代理关系的重要概念。委托代理关系的概念来自法律。在法律上,当A授权B代表A从事某种活动时,委托代理关系就发生了,A称为委托人,B称为代理人。
一般的委托代理关系泛指在任何一种涉及不对称信息的交易(合同、协议)中参与者之间的经济关系。掌握信息多、处于信息优势的一方称为代理人,掌握信息少、处于信息劣势的一方称为委托人。简单地说,“知情者”是代理人,“不知情者”是委托人。
社会是由众多个体构成的,人与人之间时刻发生着各种各样的联系。由于不对称信息在社会经济活动中相当普遍,所以许多社会经济关系,都可以归结为委托代理关系。
例如,政府与企业、股东与经理、雇主与雇员、消费者与厂家、计算机用户与服务商、信息经纪人与信息用户、病人与医生等等,他们之间都可以构成委托代理关系。
除了正式的有书面合同(协议)的委托代理关系,以及有口头委托的较为明显的委托代理关系外,社会经济关系中还有大量的隐含的委托代理关系,诸如老百姓与政府官员、选民与议员的关系等。
同一种经济关系中可能包含有多种不同的委托代理关系。例如软件生产商与软件用户的关系,对于软件的生产成本、软件性能等方面的信息,生产商掌握的比用户多,生产商是代理人,用户是委托人,从这一方面来说是“用户委托生产商进行生产”。对于需求欲望、支付能力等方面的信息,用户掌握的比生产商多,从这一方面来说又是“生产商委托用户进行消费”。
可见,委托代理关系是与不对称信息相联系的,针对不同的不对称信息,可以构成不同的委托代理关系,对于参与各方,我们不能简单地说某一方是委托人、某一方是代理人。
一般来说,私有信息指的是现状,如买卖双方交易商品的质量状况、追求女孩的男生人品、健康状况、求职者的能力等。总而言之,私有信息是双方博弈时已存在的事实。在信息经济学中,一般把这种关于现存事实特征的私有信息,叫做“隐蔽特征”。
前面所说的私有信息造成的信息不对称是一种事前的信息不对称,举个例子说,消费者到商家去买商品,在购买之前就不清楚商品质量的好坏。
然而,还有一种信息不对称是在一定的环境下,博弈的一方无法判断并观察到另一方未来的行为。在信息经济学中,这种未来别人难以判断或观察到的行为这种隐蔽信息,特别称为“隐蔽行为”。
比如,一个民营企业雇佣了一个职业经理人,并授予此人极大的权力,然而这个资本所有者无法判断并观察到将来这个经理上任之后是否会偷懒甚至是将公司的利益据为己有。雇员并不能被全天候监督,他会欺骗雇主或偷懒的行为不可避免。这种行为就是隐蔽行为。
再如,公务员都宣誓要一心为民,廉洁奉公。但是若无有效的监督机制,公务员寻私就成了一种隐蔽行为。
简而言之,隐蔽信息分为两大块:是事件(合同)前已经发生的和已经存在的有关事实,就叫做隐蔽特征;是事件(合同)后发生的有关事情,就叫做隐蔽行为。
正是因为参与博弈者掌握的信息并不完全,往往有很多私有信息的存在,其决策结果必然会有很大的不确定性。所谓“不确定性”,不管是对未来、现在或过去的任何决策,只要是我们不知道确切的结果的都具有“不确定性”。
不确定性可分为两大类:主观不确定性和客观不确定性。主观不确定性是指,决策者由于有关资料的缺乏,而不能对事物的态度作出正确的判断。
这种不确定性的判断,却是其它掌握资料的人可以有的。例如:消费者对商品的质量不如生产者更为了解,换句话说,商品质量对于消费者更加具有不确定性。
和主观不确定性相关的信息常常具有不对称性,一些人掌握事物状态的信息,而另一些人则缺乏事物状态的信息。信息的不对称性可以通过信息的交流和公开以及寻找而消除。
客观不确定性是指事物状态的客观属性本身具有不确定性,对此,人们可以通过认识去把握不确定性的客观规律,但是,认识本身并不能消除这种不确定性。
当存在不确定性时,决策者的决策就具有风险。不确定性和风险有密切的联系,但又是两个不同的概念。不确定性,直观上很容易理解,一件事情可能出现的结果越多,这件事情就越具有不确定性,结果越不明确(概率分布越分散),不确定性的存在就越显著。
风险的必要条件是决策面临着不确定性的条件。当一项决策在不确定条件下进行时,其所具有的风险性的含义是:从事后的角度看,事前作出的决策不是最优的,甚至是有损失的。决策的风险性不仅取决于不确定因素之所含不确定性的大小,而且还取决于收益的性质。所以,通俗地说,风险就是从事后的角度来看由于不确定性因素而造成的决策损失。