从斗地主看博弈论假设条件的问题

来源:百度文库 编辑:神马文学网 时间:2024/04/29 17:50:00

    昨天端午节,和黄老师等人坐了两桌打斗地主,玩的还挺高兴,但自己是输多胜少。我对输赢倒是不在乎的,打牌就是图个高兴。但我打完牌,发现博弈论似乎在解释斗地主这个问题上存在点问题。

我在想,打斗地主其实是一种不完全信息动态博弈,好像可以用博弈论解释。但从昨天的结果来看,用博弈论术语,支付不是一个精炼贝叶斯均衡。按理说,每人摸到的牌可认为是随机变量,记为X1,X2,…,Xn…,且是相互独立的,方差DXi都存在并且有它们的公共上界,即DXi<>< span="">,i=1,2,…。那么随机变量肯定满足切比雪夫大数定理,随机变量的差异趋于收敛。也就是说,只要打牌次数足够多,每个人得到的牌的好坏基本都是一样的。如果按照博弈论的基本假设,每个参与者都是理性的,都是在面临约束条件下追求自身的效用最大化,那么,经过许多次斗地主,每人的输赢是趋于平均的。这个用概率论应该可以得到证明。

但事实是,打了很长时间,我输得很多。博弈论解释失效,我认为有三点原因。

首先,我认为最重要的原因在于博弈论的基本假设在斗地主这里不太满足,我斗地主相当不理性。举个例子,昨天有一局我当地主,我手上剩下双王、2、8、9,对方出了个三带1,我已经理性预期到了对方手上还有两个2。这时,如果我扔出双王炸弹,我肯定输,而且会翻番输。如果我是完全理性的,这时候应该选择不出双王炸弹,这盘也就小输一把。但这个时候,我一冲动,就扔下双王炸弹,我再出一个9,对方马上出2,这下我就没法了,输了个翻倍。在效用-2和-1之间,我选择了-2,显然非理性。这种情况在斗地主中太多了,不胜枚举。有时候输多了,明明自己的牌很烂,但仍要争着叫地主,也属于这种非理性行为。

其次,对于动态博弈,博弈论有个假设前提,博弈满足“完美回忆”(perfect recall)的要求。完美回忆是与信息集有关的一个概念,是指没有参与人会忘记自己以前知道的事情,所有参与人都知道自己以前的选择。但斗地主,经常出现记不住以前出了什么牌的情况,因此无法准确推测出现在对手手上应该剩哪些牌,还有几个2、几个A。甚至对方抠底是哪三张牌也会忘记。在这种情况下,博弈假设前提不满足,博弈论自然无法解释结论。

最后,博弈论没有考虑参与者的智商问题,我认为这是一个很大的缺陷。我知道博弈论的创始人,诸如冯.诺伊曼、纳什、泽尔腾、海萨尼都是天才,他们以为人们都会像他们那样聪明,所以博弈论中隐含着参与人智商都是相同的,只根据信息做出最佳反应。但事实上,每个参与人的智商(对于做某件事)差别是很大的。我想起了五一期间,一群朋友跟高智商的老师挑战五子棋。五子棋的棋局双方是完全可见的,属于完全信息动态博弈。可是,经常出现的情况是,老师能看出的招数,我们这些人却看不出,以至于屡屡被老师击败。完全信息对于陈老师有优势,但对我们完全是劣势的。同样根据完全信息做出决策,我们的决策就不能使自己的效用最大化。后来,由于大家使用车轮战术轮番挑战老师,加之不停说一些插科打诨的话去干扰陈老师的思维,使他在下五子棋上的智商优势没有了。所以,我和willian后来击败了老师。斗地主也存在着技术和智商上的差别,这种差别,使得不能产生出精炼贝叶斯均衡来。

泽尔腾曾经提出过一个颤抖的手均衡,假定所有参与都会犯错误。每个人犯错误相互独立,且概率很小。但我认为,这种假定也不太符合斗地主的实际。至少,这个颤抖的手均衡无法解释我以上提出的三点问题。

我想,如果有人能在博弈论中引入非理性行为分析,引入不满足“完美回忆”,再引入参与人的智商问题进行分析,那么这将是博弈论的一次革命。得诺贝尔经济学奖也是指日可待的事情的。我不是天才,虽然提出了这些设想,但至少现在是搞不出来的。如果有哪位天才,从我的设想出发,改进了博弈论,得了诺奖,似乎应该感谢我的发散思维才对。