博弈论

来源:百度文库 编辑:神马文学网 时间:2024/04/20 12:51:40

兴奋剂泛滥的“囚徒困境” 博弈论揭开谜团

作者:克尔·舍默     2008年04月17日 自行车赛禁药名单中,最有效者当数重组促红细胞生成素(r-EPO)。这种人工合成激素能够刺激人体产生更多红细胞,从而为肌肉输送更多的氧
滥用兴奋剂现象在自行车赛车、棒球等竞技体育中有越演越烈之势,原因何在?博弈论或许有助于解开这一谜团

  许多选手认为,如果别人都在服药,自己还装作正人君子,将无法同对手竞争。我们都不愿意相信体育明星们会偷服禁药,但面对汇总的证据,我不得不得出结论:不论是自行车,还是棒球、足球、田径等体育项目,过去20年中的绝大部分顶尖选手一直在服用兴奋剂。

  现在已经到了思考这一现象产生的原因,而不是争论其是否存在的时候了。体育中的博弈论

  博弈论是研究对局者如何在预知对手策略的情况下选择应对策略,以达到最佳结果的学问。

这个理论所针对的“对局”不仅仅是指扑克游戏,或是侧重于战术策略的各种体育比赛,还包括需要作出经济、军事决策乃至国家外交政策的各种极其严肃的活动。所有这些“对局”都拥有一个共同点,那就是对局者会依据公开的选项范围,分析对手的每一“步”行动。

 

  著名的“囚徒困境”就是博弈论的一个经典实例:你和你的犯罪同伙落入法网,被分开关:因而无法串供。你们事先约定大家都打死不招,然而地方检察官给你们开出了下面几个选择:

  1.如果你坦白交待而同伙拒不认罪,那么你将获得释放,而他将蹲三年监狱。2.反之,如果是他坦白交待而你拒不认罪,那就轮到你蹲三年大牢,而他获得自由。3.如果两人都坦白,每人各处两年有期徒刑。4.如果两人都不认罪,每人各处一年有期徒刑。

  从这些结果来分析,背叛同伴似乎是你的最佳选择。为什么呢?我们首先从第一名罪犯的角度来考虑,他惟一无法控制、又能影响结果的因素就是第二名罪犯的选择。假定第二名罪犯始终保持沉默。那么,第一名罪犯坦白交代后结果最佳,可以躲过牢狱之灾;如果保持沉默,结果也还不错,只要蹲一年大牢。因此,对于第一名罪犯来说,最好的选择就是坦白。现在我们假设第二名罪犯认罪。在这种情况下,对第一名罪犯而言,情况依然是坦白交待胜过拒不认罪———坦白会让他被判两年监禁,否则迎接他的将是三年铁窗生涯。由于两名罪犯面临的情势完全相同,因此无论对方如何选择,对每个罪犯来说,最好的做法就是坦白。

  这些选择并不只是理论上的结果。当参与囚徒困境博弈的受试者在彼此间不允许通气的情况下,只玩一次或固定次数的对局时,他们常用的策略就是坦白交待从而背叛对方。如果受试者玩次数不定的对局,那么最常用的策略便是“针锋相对”:每位局中人开始时都会遵守他们先前的约定保持沉默,但随后就会看对方的表现来决定自己的选择:你义气我也义气,你不仁我也不义。多人囚徒困境的对局中,如果局中人玩的次数多得足以增进彼此间的信任,则可能出现更加合作的模式。不过研究表明,一旦大家都争相坦白而导致背叛成风,就会出现多米诺骨牌式的崩盘局面。

  在自行车、棒球和其他一些体育项目中,参赛者按照一组规则彼此竞争。自行车竞赛规则明文禁止使用兴奋剂。但这类药物极其有效,服用以后又很难检测出来(尽管还是有可能),再加上如果成功将名利双收,因此禁药的诱惑让运动员们无法抗拒。

  一旦几个顶尖车手依靠兴奋剂而获得佳绩,其他遵规守纪的选手也必定效仿,导致违规之风愈演愈烈。由于违规将导致重罚,于是车手们对此全都保持沉默。因此,通过公开协商来扭转这种局面而使比赛回到正轨的想法,是不现实的。

  以前的情况并非如此。20世纪40年代到60年代,许多车手都在服用兴奋剂和镇痛药。直到1967年环法自行车赛中,英国车手汤姆·辛普森(TomSimpson)因过量服用安非他明而在旺图山赛段爬坡时猝死,兴奋剂禁令才得以出台。即便在辛普森的悲剧之后,整个1970年代和1980年代,反兴奋剂条例的执行也时紧时松。由于对服用禁药没有明确的规定,很少有人把使用兴奋剂视为作弊行为。但随着1990年代出现的一个新生事物,博弈矩阵被改变了。神奇的EPO

  所谓的“新生事物”,就是经过基因改造的重组促红细胞生成素:r-EPO。普通EPO是人体中天然存在的一种激素。肾把这种激素释放到血液中,血液再把它带到骨髓里的受体上。当EPO分子与这些受体结合后,就会促使骨髓产生更多的红血细胞。慢性肾功能衰竭或者化疗都可能引起贫血,因此在20世纪80年代末,作为EPO代用品的r-EPO被发明出来。它在造福慢性贫血患者的同时,也被用于耐力型竞技中。

  r-EPO与输血的效果相当,但相比输血过程就简单多了。输血时,必须使用输血袋,还得将长长的针头插入血管。如果使用r-EPO,只须将它们装入小小的安瓿瓶,保存在保温瓶的冰块中或酒店的便携式冰箱里,使用时只要注射到皮下即可。

  r-EPO的效果主要体现在选手们的红细胞比容(HCT)上,即红细胞在血液中所占的体积百分比,这项指标是可以直接测出的。红细胞越多,能够输送到肌肉的氧就越多。对男性来说,HCT的正常值约为45%。训练有素的耐力型运动员,HCT值可维持在50%上下;使用EPO以后,该值可提升到60%以上。1996年环法自行车赛冠军比亚内·里斯(BjarneRiis)的绰号就是“60%先生”,去年他亲口承认使用过r-EPO,因此HCT水平才如此之高。上有政策,下有对策

  体育运动中,药检执法者与偷用禁药者之间的较量,就好比自然进化中,捕食动物与被捕食者之间的抗争。依我看,执法者已经比违法者落后了5年,而且这5年的差距将一直延续下去。服药带来的好处极大,会刺激选手想出新招去对付那些禁药政策。除非执法者也能看到同样的好处,否则将永远在这场竞赛中处于下风。1997年,由于还无法检测r-EPO(此种检测手段2001年才问世),主管自行车赛事的机构———国际自行车联盟(UCI)把HCT指标上限定为50%。很快,车手们发现他们可以超过这一上限,他们采用的是当时规则允许并频繁使用的一种方法———注射盐水进行再水化(rehydration)。因此,该项规定很快就失效了。

  反兴奋剂新规则出台后,选手们又有什么新的应对招数呢?我直截了当地向现年32岁的职业自行车手乔·帕普(JoePapp)提出了这个问题,他曾因合成睾丸激素药检呈阳性而遭到禁赛处分。回忆起他分到“神秘黑药”的那一天,帕普解释说,他面临的已不是道德上的抉择,而是经济上的考虑:“在一个有组织使用兴奋剂的车队里,面对兴奋剂,你就只能二者择一:要么吞下它,跟上大伙;要么扔掉它,也许就此断送职业前程。”不过帕普还达不到参加环法大赛的水平,在顶级车手中,情况会不会有所不同呢?我从另外一位知情人那里获悉,情况并无不同。在20世纪90年代,弗朗基·安德勒(FrankieAndreu)在美国邮政车队中充当领骑车手,为队中冠军车手兰斯·阿姆斯特朗(LanceArmstrong)提供支持。“多年来我一直在协助车队领袖,从未遇到任何问题,”安德勒说,“后来,大约是1996年左右吧,自行车赛的速度迅速提升。这事非常蹊跷,肯定不仅仅是训练的结果。”安德勒竭尽全力地抵制诱惑,但在1999年,他再也无法坚持了,“非常明显,竞技自行车运动这个圈子中使用兴奋剂可谓泛滥成灾,我也得干点什么才行了。”他开始给自己注射r-EPO,每周两到三次。

  意大利运动生理学家米凯莱·费拉里(MicheleFerrari)同某些药检呈阳性或被指控使用兴奋剂的顶尖选手过从甚密,因而广受争议。他认为,“如果红细胞的数量增加10%,车手的运动能力(即有效动能产出的净增量)就可提升大约5%。这意味着在计时赛中,以每小时50千米的速度骑行的选手每千米可获得1.5秒的优势;或者是在坡度为10%的爬坡路段上,以每小时10千米的速度骑行的选手每千米所用时间缩短8秒左右。”

  纳什均衡

  在博弈论中,如果任何一位局中人单方面改变策略不能使他获得任何优势,我们就说对局处于纳什均衡。这一概念是电影《美丽心灵》的原型、数学家纳什(JohnForbesNash)提出的。为了恢复纯洁的竞技环境,必须调整兴奋剂对局的设置,使竞争处于纳什均衡。这就是说,每个体育项目的主管机构都必须改变博弈矩阵中期望结果的收益值。首先,当其他局中人都按规矩对弈时,任何一位局中人老老实实对弈所获得的收益,必须大于作弊所能捞到的好处。其次,即使其他局中人作弊,任何一位局中人遵守规矩参赛所获得的收益也必须大于作弊的收益,这点也许更为重要,总之不能让遵规守纪者吃亏。

  在囚徒困境的对局中,减少在另一位囚徒坦白交待的情况下自己也坦白交待的好处,增加双方保持沉默的收益,将有助于促进双方的合作。让局中人在开始对局之前有机会相互通气,是增进双方合作的最有效途径。在体育竞赛中,这就意味着要打破已成为潜规则的“攻守同盟”。每个人都必须清楚,存在一个问题需要解决。药检也必不可少,结果必须定期向所有人公开,直到所有药检结果全都没有问题。这样做之后,每位选手都会明白,不论其他选手怎么做,自己光明磊落参赛的结果总要胜过作弊带来的好处。

  美国Slipstream自行车队现任总监沃特尔斯已经启动了一项定期内部药检制度。“请记住,我的车手多数是运动员而非罪犯,”他说,“如果他们相信其他人不再吃药,并且从自行车赛的速度中确实感受到这一点,他们会告别兴奋剂,从巨大的压力中解脱出来。”希望总是存在的。不过我深信,随着这些变化的出现,人们的博弈心态将逐步从背叛模式向合作模式倾斜。如果真的这样,竞技体育将恢复它的传统———选手们在取胜的意念激励下,表现出更高、更快、更强,赢得人们最大的尊重和奖励