世界杯、B2、LOTA、MSO—— 一些鲜为人知的故事(作者:BLL) - 智慧体育.cn...

来源:百度文库 编辑:神马文学网 时间:2024/04/28 09:30:12
庆祝MSO成立三周年,一直想写点什么,总没时间(也担心写不好,偶不是学中文的^_^)。当然,并不是为了获奖的缘故。认识偶的人都知道,BLL从不为名利。
周末花了些时间,认真拜读了大家写的文章,收获不小。为庆祝MSO成立三周年,我还是要尽力拿出点水平来。想来想去,还是给大家讲一讲MSO的内幕吧。
曾几何时,中国大陆开始有了足球彩票。在同事的从恿下,凭着自已也曾是一名运动员,对球类比赛有一定的了解,我也参加到了足球彩票的大军之中。
记得那是2002年夏天,世界杯前夕。我在华夏足彩网上认识了一个人,网名叫[足球不圆](也就是后来大家常常提到的“不圆”),第一个提到了理论赔率,并用欧洲赔率来分析足球比赛的结果。由此,改变了我仅仅从体育比赛猜测比赛结果的思路,开始了对赔率、盘口、数学模型的学习的万里长征。
知道什么是让半球/一球吗?也许你会一笑了之,这么低级的问题。但当时我就不知道。认识不圆后,他给我讲解了这些基本慨念,并且结合比赛做了比较详细的说明。慢慢地,我知道了让球盘,知道了下注,知道了地下庄家,知道了赌球是怎么一回事。也进一步了解了不圆的一些基本情况。其实,不圆并不神秘,为人很谦虚,他的英语、计算机水平都很高,在一家外资企业做软件开发工作。有空也要下注,不过赌得不大,用他的话来讲,找点额外收入。
在不断交流过程中,不圆阐述了他的理论赔率的思路及一些疑问。最早的理论赔率,纯粹是用联赛积分来推算的。我记得是用Excel做的,现在已经找不到原版了。先把球队的联赛积分经过一定比例换算,切入点是让0.5球,然后用正态分布来计算出理论赔率。经过一段时间的验证,这个方法对半球以下的盘还说得过去,但对半球以上的盘就出现误差了。而且从数学论证来讲,这种算法没有理论依据。于是,我们开始摸索新的赔率模型,力求把欧洲赔率与亚洲盘有机地结合起来。
不圆根据他的实战经验,提出要找出主队、客队的理论球,这样可以直接算出理论让球,以便与实际盘口做比较。在当时,几乎都是买亚洲盘的,很少有问及欧洲赔率的。这样做出的系统有很强的实用性,是国内市面上流行的足彩软件无法比拟的,市场前景广阔。
于是,我开始查阅大量相关资料,其中最多的就是超星图书馆。记得当时我没有号,还是不圆给了一个,现在都早过期了。经过几周的努力,我提出了第一个球队实力模型的初步方案,根据球队在联赛中的总体平均进球、总体平均失球、主场平均进球、主场平均失球、客场平均进球、客场平均失球、近六场平均进球、近六场平均失球,按分层分析计算原理,得出球队的静态实力水平。于是,我们在QQ上讨论算法的可行性。值得庆幸的是,虽然几经改朝换代(当时我的电脑配置是赛扬566+3.2G硬盘+0.48G硬盘+32M内存,勉强可以上网),还保留下来了一段当时在QQ上的讨论。
BLL 说:
也许我们可以建立这样一个模型试试:
某1队得分期望值G1      某2队得分期望值G2
|                               |
|                               |
------------------------------------------------------------------------------
|                |                 |                  |                 |               |
(得分能力*P,攻击能力*P,防守能力*P,主客场能力*P,近况表现*P,其它)
|                |                 |                  |                 |               |
------------------------------------------------------------------------------
|
公用以往战绩数据库
其中,P是修正系数,算法如前面看到的一样。
这是层次分析法的核心思想。我们给第二层的各项一定的比例系数,求和可得G1、G2,得出1队、2队的实力水平。
BLL 说:
用MONTE CARLO模拟比赛过程。
设G1与G2的比分为T1:T2,
1》G1胜,T2=rand(4),T1=T2+1+rand([1.5+6(G1-G2)]);
2》G1负,T1=rand(4),T2=T1+1+rand(2);
3》G1平,T1=T2=rand
为了消除随机数的影响,重复进行100次,取其平均值。
BLL 说:
“用MONTE CARLO模拟比赛过程。。。。。”这后面的内容就是教程P400讲的。
不圆 说:
我看了,正琢磨他的经验公式,依据何在
BLL 说:
第二层的系数(权)的算法,在教程P228
BLL 说:
经验公式,好象是在P244--P252里
不圆 说:
那么下一步该如何呢?
BLL 说:
用上赛季的意甲数据试算
不圆 说:
好象你的第二层没有权
BLL 说:
在求和时乘上权就行了。
不圆 说:
权应该是每项各自不同,如何确定?
BLL 说:
对I队,用教程P228的算法可求得WI。
BLL 说:
我想这个不难。主要是怎么调用数据库我不会。
不圆 说:
就是矩阵迭代?
BLL 说:
是的
不圆 说:
这种方法我以前不熟,还没仔细看,是否要先给出一个估计值,再通过迭代
不圆 说:
逼近真实值?
BLL 说:
以前的Excel表的数据可能无法直接用,要等你的软件出来看怎么调用数据来试算。
不圆 说:
我明白了理论方法,用程序实现就不是问题
BLL 说:
这是一种权重数的算法,属高等代数的内容。
不圆 说:
看看我的理解对不对。我们第一步是要计算出第二层的权重,需要原始数据
BLL 说:
是的
不圆 说:
我认为这里的因素确定,要围绕我们掌握的原始数据
不圆 说:
对于临场意外因素,我想应该这样考虑,我们要建立的模型,前提是
BLL 说:
攻击能力和防守能力也可量化,进球数/场次
不圆 说:
将意外因素忽略不计。我们由此可以得出一个标准的正常的实力值,
不圆 说:
而庄家开的盘正是多了临场的意外的因素,正好可以对照
不圆 说:
我前天试算了一下,没用近况,发现也比较准确,可能的确是重复了
BLL 说:
因为W1+W2+W3+。。。=1
不圆 说:
好,4项更简单
BLL 说:
应该可以扣除重复的因素
不圆 说:
你认为呢,够吗?
BLL 说:
我想最好是用单数的
不圆 说:
如果加上“其它”,该如何确定权呢?
BLL 说:
评价为:差、较差、中、教好、好
BLL 说:
最简是:差、中、好
不圆 说:
好吧。上述4项还是特殊了一点
BLL 说:
最繁是:差、A、较差、B、中、C、较好、D、好
BLL 说:
这是分层的基本方法
不圆 说:
我想这个因素的权不会大,但是在比如场外因素的情况下,尽管不能足以体现在我们的结果上,但必然体现在庄家的盘口上,我们可以对比
BLL 说:
我想我们取五项指标可能更好
不圆 说:
可以,就是麻烦了许多,因为增加的这项是要人为确定的
不圆 说:
我想可以初步用三个级别,对于历史的一些比赛,无背景的就默认“中”
BLL 说:
可以这么看,对“其它”的分类打分不易过细
不圆 说:

不圆 说:
中立场怎么办?
BLL 说:
联赛一般不会吧?
不圆 说:
我们的往绩里,有些是杯赛,在中立场打
BLL 说:
我想是不是先把联赛的试试,可行后再考虑杯赛
不圆 说:
上述各项考虑修正因素的完整表达式应该是
BLL 说:
等扥
不圆 说:
我今天开会时一直在考虑程序,
不圆 说:
我想把所有要素表格做在一个界面里,也许会便于使用
BLL 说:
我觉得500WAN的查询方法也许可以借鉴
BLL 说:
按比赛轮次、按博彩公司,再加上按某队,我想也够了。
BLL 说:
欧洲赔率=8家,亚洲盘=4家?
不圆 说:
中心表格是比赛表,有日期时间,主客队名,比分,半场比分等
不圆 说:
这个表格可按比赛日期、联赛种类,轮次,队伍查询
不圆 说:
围绕这个中心表格,有几个相关表格
不圆 说:
总体分为三大类,一是历史资料,二是外界赔率,三是分析
不圆 说:
历史资料包括这几个表:联赛积分表(总、主、客成绩)、主队历史比赛成绩表、客队历史比赛成绩表
不圆 说:
赔率表包括:固定赔率表、亚洲盘赔率表、半全场赔率表、波胆赔率表,全部是以时间为顺序,记录变化
不圆 说:
分析表就是我们的算法计算的结果逐项列表,便于研究
不圆 说:
这样,在一个窗口,可以选择任一场比赛,随后可以方便地查到有关这场比赛主客队的所有历史资料,以及本场比赛的所有外界赔率。
BLL 说:
在历史资料中能不能预留空白页?比如当时的舆论报导、外界评论等,也可复印保留,以后分析时有用。
不圆 说:
在那个中心的比赛表里,我留了这个空间. 不过,如果这个空间太大,会给系统增加负担,毕竟我采用的是小型数据库。
不圆 说:
主队历史比赛成绩表、客队历史比赛成绩表指的是历史对阵,包括所有当时那场比赛的内容,和上面讲的中心表格的格式一样。
BLL 说:
你估计这个软件最终投入使用是会有多大?
不圆 说:
运行文件估计在2M以内,数据库会随资料的增加而不断增大,无上限.
不圆 说:
但是中心数据库,可能最大的就是中心表格——比赛表,如果收录的场次达到几万以上,可能会出现不稳定, 有必要升级程序,采用大型数据库.
不圆 说:
我要走了
不圆 说:
明天在谈,算法你要多费心了
BLL 说:
好的。88
不圆 说:
88
接下来的一周里,我们确定了实力模型的算法,加上了时间衰减因素,把静态的球队实力变为了动态的球队实力。最难的,是要给不圆讲清楚模型的数学算法。这里涉及很多高等数学知识,那些公式、运算符号在QQ里打不出来。而我的计算机水平又很差,根本不懂编程。在不圆的指导下,费了好大的劲儿,才在Excel表里做出了一个完整的计算过程。
不圆搞懂了算法以后,开始编制软件。那段时间好象他上班比较忙,断断续续地大概过了三周,第一代赔率分析软件终于问世了。取名叫“ODDS WINNER”,版权所有 B2 ,来源于网名的第一个字母 Buyuan and BLL

不用说,第一次安装上ODDS WINNER,那种成功的满足感、喜悦感,难以用几句话来表达清楚。
因为当时做这个软件的时间很紧,不圆说其它辅助功能以后再逐步完善,所有的数据基本上都是手工录入。你可以想象,两个赛季的欧洲五大联赛,三千多场比赛的联赛分类、比赛轮次、比赛日期、比赛时间、主队、客队、半场比分、全场比分,两万多个数据,全靠手工录入呀!
当时不圆在对程序的稳定性做最后的调试,录入数据这类简单工作就由我来做。正值八月夏天,一丝风都没有,最热的时候。还好是假期,带着研究成功后的兴奋,我每天放个电风扇在书桌旁边,坐上十四个小时以上,花了差不多一周的时间,终于录完了两个赛季的比赛数据。
转眼进入了八月,我们做好了一切准备工作,就等着欧洲联赛新赛季的来临了。
2002年8月10日,德甲联赛首先开张。2002年8月17日,英超联赛也拉开了帷幕。
毕竟是第一次使用软件,还是得小心一些。再者,根据以往的经验,前几轮比赛只是观摩。
经过两轮的比较,首先遇到的问题是,新上来的升班马没有顶级联赛的往绩,既或有都是多年前的往绩,这样计算出来的数据误差很大。要想保持数据的连贯性,就得收集低一级联赛的数据,比较分析出它们与顶级联赛之间的连系系数。不言而喻,这将增大N倍的工作量。而且,在当时我们还找不到这些数据。经过一段时间的实验,不圆提出用联赛平均水平的25%来代替升班马的平均数据。遇到有升班马的场次,我们都暂时不用这些数据。
大慨是9月初,我开始上班,买足球彩票,基本上就没时间再继续搞软件的更新了。不圆后来接着又分析了各大联赛球队之间的换算系数,把欧洲五大联赛球队的实力数据统一起来,方便了欧洲其它比赛的计算。
接下来大慨近半年的时间,我主要还是看欧赔,因为它与足彩直接相关。这期间,我认识了核弹头,他对亚洲盘有一定的实战经验。我面临的是不可选比赛(每次足彩都是体彩中心规定的),不圆、核弹头他们更多的是研究有利的比赛。我们也经常一起交流一些与足彩有关的比赛场次。
到2002年年底,不圆提出了想创办网站的想法。
初步构思是以ODDS WINNER为后台技术支持,从足球比赛开始逐步发展,提供体育运动的数据、信息服务以及体育类游戏开发等等。我们都很支持他的这个想法。但是,我跟核弹头都不懂编程、网站制作,只能在一旁提一些建议。
经过不圆的努力,春节前MSO网站初具雏形。不圆给我们抓了一些图,让提提意见。正好还有一张图,可能也只有几个人曾经见过。
说到这里,我想大家已经知道LOTA、MSO 的来历了吧?
有了MSO以后,交流更方便了。在这里,我又认识了刀锋、Sayes 等一些朋友。在足彩论坛版块与大家讨论一些足彩比赛结果。
就ODDS WINNER来讲,对我的帮助的确很大。首先,在这次开发过程中,比较系统地学习了一些博彩理论,而且有些东西在国内是看不到的。对欧洲赔率的产生、亚洲盘的意义、以及两者之间的关系有了一定的认识。第二,从ODDS WINNER的原理来讲,是经过严格的理论证明的。虽然不同于美国人的Odds Wizard,但经过我们研究比较,两者大同小异,可以说各有千秋。第三,ODDS WINNER 在实战中发挥了作用,不光是我买足彩,为Sayes 的《新长征路》也做了很好的参考(顺便说一句,因为ODDS WINNER不外传,所以请Sayes理解)。第四,ODDS WINNER 之后,为了进一步提高,迫使我学习了很多计算机知识。
ODDS WINNER 虽然没有直接推向市场,但她以另一种方式发挥了她的市场价值。我们不得不佩服不圆的超前思维。
三年了,MSO 能发展壮大到今天,与不圆的不歇努力是分不开的。除了向他表示祝贺以外,衷心祝愿 MSO 越办越好!
(全文完)