纳什:博弈论大师 〔转帖〕

来源:百度文库 编辑:神马文学网 时间:2024/04/26 07:17:07
纳什:博弈论大师    2001年环球公司出品的电影《美丽心灵》,取材于同名传记,艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症三十多年又奇迹般恢复的小约翰·福布斯·纳什传奇的人生故事。这部分别获得2002年金球和奥斯卡四项大奖的影片,连同银幕背后的人物原型,深深震撼了全世界人们的心灵。为纳什带来诺贝尔奖之殊荣的、他对博弈论发展的巨大贡献,以及他的坎坷生平,也再次引起人们极大的反响和关注。    什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…    面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。    虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。不提耽于游戏的玩家,可以说除了军事竞争,几乎难再有用武之地。二人零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。对於后者,让我们来看一个历史上最经典的有趣个例: “囚徒困境” 。话说警方抓到两个盗窃犯,惜证据尚不足,遂寄希望于嫌犯自己招供。警方把两个犯人隔离起来,分别审问,交代政策如下:坦白从宽,抗拒从严!如果你招了,另一个人没招,那么就将你释放,另一人判20年;同样如果你不招,另一个人招了,那么你得被判20年,另一个人被释放。如果两个人都招,警方证据就足了,两人都判10年。至於两个人都不招的情况,不用警方交代,两个人都得判,但因证据不力,判得都要轻许多,比如1年。警方最后说,那边还有个警察,对你的同伙交代一模一样的政策呢。罪犯心里打起小九九,如果对方招了,我招是10年,不招是20年,是招划算;如果对方不招,我招是无罪释放,不招是1年,还是招划算。於是乎,招!两个“精明” 的小偷都招了,都被判了10年,正中警方下怀。聪明的读者,其实如果两个小偷都不招,就会被各判1年,对他们来说岂不更好?在这个囚徒困境问题中,参与者仍是两名(两个盗窃犯) ,但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。    对於多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡” 。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡” 的基本概念,为更加普遍广泛的博弈问题找到了解。纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。以前面的囚徒困境为例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定” 的。在囚徒困境中,只存在一个纳什均衡。但若将条件改变一下,在许多其它的具体问题中,纳什均衡可能不止一个。纳什巧妙地运用数学技巧,证明了如下纳什定理:对於任何一个n人参与,非合作博弈(零和或非零和) ,如果每个参与者都只有有限条策略,那么一定存在至少一个纳什均衡解集。象许多科学上最杰出的思想一样,这一概念以极简洁明了的方式解决了悬而未解的难题。看似简单,似乎属於那种“本来我也能想到” 的东西,然而那时除了纳什,一代宗师诺伊曼也没有想到。纳什均衡的提出,对博弈论的发展产生了革命性的影响,纳什均衡的概念已成为现代博弈论的基石和中心(虽然在少数博弈理论家中此点仍有争议) 。纳什的好友,普林斯顿大学经济学教授迪克西特曾说,“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”    上面提到的博弈理论试图解决的都是非合作型问题,也就是参与者之间除了决策结果相互影响,没有其它形式的信息交流。通过囚徒困境一例可以看出,如果参与者两个小偷之间能够彼此商议,他们做出的策略决定会截然不同(当然是两人一起抵赖划算) 。诚然,在各种生活行为中,人与人之间除了竞争关系,还存在合作关系,常常是两种关系并存,合理的合作能够给双方带来共同利益。这是合作型博弈论研究的范畴。诺伊曼在《博弈论与经济行为》一书中建立了合作型博弈论的基本模型,但是对於其中及其重要的双向协商问题(即参与者如何“讨价还价”) ,没有能给出一个确定的解。纳什对这一领域同样做出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,直接裨益劳动经济和国际贸易,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤--协商的目的最终仍是最大化自己的利益。此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。而后一思想初次提示了后来发展起来的在经济和政治领域起重要作用的重复博弈理论中缄默共谋的可能性。    这些也许看起来略显枯燥的理论,以逻辑推理为工具对人们日常生活中的竞争和合作行为进行严谨有序的数学归纳,当数学家们孜孜不倦地将直觉上升为科学,再反作用于生活时,其影响之深远难以尽述。今天,纳什为之做出基础性贡献的现代博弈理论经过许多专家的不断发展,不仅自身理论体系日臻成熟和完善,而且被广泛应用于经济学、政治学、军事学甚至生物学等各个领域。在生物学领域,博弈论被用于研究种族遗传学和进化生物学中种间和种内的竞争,以及单个基因之间的竞争,并反过来推动博弈论的思想发展。在政治、军事学领域,博弈论被用于分析选举策略、战争起因、立法议程安排等等重大事宜。在经济学领域,博弈论更是已经融入整个学科的主流,经济学教材和杂志无不收入博弈论的内容,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具分析各类经济问题,诸如公共经济、国际贸易、自然资源经济、工业管理等等,等等。就博弈论应用于经济学的直接效益,举个实例,如《美丽心灵》一书中提到,1994年美国政府向商家拍卖大部份电磁波谱。这一多回合拍卖由一批博弈论专家本着最大化政府收益和各商家的利用率原则精心设计,取得极大的成功。政府获得超过一百亿美元的收入,各频率的波谱也都找到了满意的归宿。与此相对映的是,新西兰一个类似却没有经过博弈理论设计的拍卖会惨遭失败。政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证!正因为博弈论对现代经济学具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。    世界终于因为博弈论而承认了纳什的天才,这一年,他已是66岁的老人。与其在科学上令人眩目的杰出贡献相比,他用几十年漫长的岁月书写的充满才华和激情、充满磨难和苦痛、交织理性和疯狂的传奇人生,竟也毫不逊色,教人无限感慨和敬仰。纳什出生于1928年一个电子工程师家庭,少年时代一方面性格孤僻,一方面显示出非凡的数学才能。17岁进入今卡耐基梅隆大学时原专业是化学工程,但是在慧眼识珠的老师的建议下,转行专攻数学。在此期间他选修了一门国际经济学课程,从而引发了对经济学命题的兴趣,后来发表的关于合作型博弈讨价还价问题的论文就是源于这时的一些想法。20岁时纳什在卡耐基拿到数学学士和硕士学位,接受了普林斯顿大学优裕的奖学金,成为这里的一名研究生。他对许多数学学科都表现出兴趣,如拓扑学、代数学、几何学、博弈论和逻辑学等。着手准备博士论文时,他决心独创一个属於自己的崭新课题。最终过去曾思考的讨价还价问题引导他建立非合作型博弈论的基本原理。1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法、整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。1950年纳什曾带着他的想法去会见当时名满天下的诺伊曼,遭到断然否定,但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。同年他以论文《非合作型博弈》获得数学博士学位。    以纯数学家自居的纳什,毕业后在兰德研究所和普林斯顿大学工作期间,证明了一个反直觉的等距嵌入定理,并引入全新的方法证明困难得多的高维等距嵌入定理,强有力地推动了对偏微分方程存在性、唯一性和连续性定理的证明。对於纯数学家来说,数学是精神的艺术体操,评判一项研究的优劣,标准在於其数学深度及是否引入了数学新思想、新方法,或是解决了长期悬而未解的难题。从这一角度,纳什的这一成果,以及数年后于麻省理工学院工作时的更加艰深的数学研究,比他的纳什均衡还要让数学同行们信服。确实,1958年纳什因其在数学领域的优异工作被美国《财富》杂志评为新一代天才数学家中最杰出的人物。然而,天有不测风云,人有旦夕祸福,就在纳什春风得意、事业就要达到顶峰时,却突然遭受命运无情的重重一撞,从云端坠下地狱。纳什在他的而立之年患上了精神分裂症。    他不是一个完美的人,早在1952年,纳什懈逅了一位大他5岁的姑娘,与之交往,次年有了个私生子,此后仍一直与她保持若即若离的关系。1956年他的父母发现了儿子的风流韵事,不久后他的父亲就去世了,不知是否与此打击有关,也不知纳什是否曾为此自责。1957年他与麻省理工学院年轻美丽的女学生爱莉西娅结婚,此后四十多年患难与共的爱情和亲情可以见证,这或许是他的个人生活中最完美、最幸运的一刻。1958年爱莉西娅身怀有孕,尚未分娩,纳什的精神状况就开始恶化。他的举止越来越古怪,一步步走向心智狂乱。    纳什所患的是妄想型精神分裂症,所有精神疾病中最可怕的一种。病人被时断时续不切实际的疯狂念头充斥头脑,并且会产生幻视、幻听,同自己假想出来的人交谈。纳什会着对空气说,某份报纸里藏有来自另一个星球的只有他能破解的信息;会突然辞去在麻省的职位,只身跑到欧洲,要放弃美国国籍,还是爱莉西娅跟去把他拖回来;在家中,他不断地威胁着妻子爱莉西娅。万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。70年纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的心情。她体贴他不肯去医院封闭治疗的愿望,并把家搬到远离喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。    这是一场奇特的博弈。纳什,这个研究理性策略的数学天才,猝然间失去了赖以自傲的理性思维,身不由己地在清醒和疯狂之间来回挣扎徘徊,是永远坠向深渊还是走回家园?在那个无人能解的世界里,他始终没有放弃的对数学的热爱。我们无法知道纳什所承受的所有痛苦,但是足可以揣摩意愿和能力之间的巨大冲突是怎样漫长的精神灾难。幸运的是,在这场博弈里,还有一个忠贞不渝的参与者,当他喃喃自语说着谁也听不懂的话时,当他象幽灵似的逡巡于绿色校园时,总是一双温存的眼睛和手臂勇敢地陪伴着他。世上最坚强的两样东西,意志和爱情,结合在一起,创造出一个最优策略,那就是 - 奇迹。是的,世界目睹了这场博弈的喜剧性结局,在纳什罹患精神分裂症三十余年后的九十年代,他的精神逐渐恢复了正常。1994年纳什博士在为诺贝尔奖撰写的自传中没有提及精神疾病给他带来的痛苦,倒是说精神失常使他摆脱了常轨思维的束缚,可以帮助他创造全新的理论。结尾处他写道,“从统计上说,任何数学家或科学家在66岁时,都似乎已经不可能再有大的建树。但我仍在努力着,那25年异型思维的‘假期’ 本来就是不正常的。这样我就还有希望,也许通过目前的研究或将来产生的新思想,我还能够做出一点有价值的东西。” 读到此处,不能不为之一叹,叹这个博弈论大师非凡的天才,叹他顽强的意志,和对科学毫无保留的执着之心!或许,这些也是爱莉西娅爱的源泉罢?    世事如棋局局新。前一辈人的辉煌和辛酸俱已成为历史,未来掌握在后来者的手中,取决于他(她) 们的每一个决定。我们的人生,又将会是一场什么样的博弈呢?1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。  纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现---非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。  1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903-1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。  1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈---“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。  1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。  纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。  囚犯的两难处境  大理论中的小故事  要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。  博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择--坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁---3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。  从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。  价格战博弈:  现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。  污染博弈:  假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。  贸易自由与壁垒:  这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。(转帖〕