真实统计数据的谎言 - 冯冠军的日志 - 网易博客

来源:百度文库 编辑:神马文学网 时间:2024/04/27 21:05:33
 

在量化、数据至上的今天,似乎认为如果一切以数据为基础,就越接近事实真相。其实不然。且不说在官出数字,数字出官的年代,统计数字无太大参考价值。更让人骇然的是,即使不刻意作假,统计数字本身依然会撒弥天大谎。

看个简单例子,假设你向行人发放问卷,问卷有这样一个问题:“你乐意回答调查问卷吗?”回收统计所有的问卷,你很可能得出下面的结论:压倒多数的人选择乐意回答。可这是事实?不是!事实上,大多数持否定意见的人,早已随手将你的问卷扔掉。也就是说根本不会统计到不乐意回答问卷的人,从而造成严重失真的统计结果。

更常见的是工资平均数。地球上任何一个人,只要和比尔·盖茨一平均,绝对世界大富翁!数据造假了?没有,统计数据有意义?很遗憾,一点也没。

来个广告:某品牌榨汁机,经过实验室的证明,该机榨汁功能增强了26%,并且得到了某某研究院的推荐。可这证明了什么?功能增强了26%,比较对象又是什么?如果是一台老式手摇榨汁机,说不定它是目前市场上最差的一种榨汁机。“26%”这个数据,其实并没告诉我们什么,虽然数字看来很精确!

美西交战期间,美国海军的死亡率是千分之九,而纽约市居民同期的死亡率是千分之十六。后来海军征兵人员用这些数据来证明参军更安全。这两组对象其实不可比。海军主要由体格健壮年轻人组成,而城市居民包括婴儿、老人和病人,他们无论在哪死亡率都比较高。这些数据根本不能证明这一点:符合参军标准的人在海军比在其他地方有更高的存活机会。

对教育的统计往往是这样:数据表明如果你上大学,比用其他方式度过这4年,你将获得更多的收入。理由很明显:既然大学生赚更多的钱,那么,他们赚的钱多是因为他们读了大学。实际上,那些能赚大钱的人就算不读大学也一样能发财。因为大学里大部分的学生是这样两类:聪明的和富有的。就算不读大学,聪明孩子也有赚大钱的潜力,至于富有的,不用说,富人的孩子一般都不属于低收入阶层。

以上两例犯的错误是数据和结论其实没有相关性。

英国新赫布里底群岛土著居民有一个信条:身上的跳蚤会带来健康。理由是当地人发现健康人有跳蚤,而身体羸弱的人没有跳蚤。但更进一步的观察是这样的:几乎每个居民身上都有跳蚤,只是当有人发烧时,跳蚤不能忍受高温,就离开了。所以因果关系正好颠倒了。

更有趣的一个例子:很久以前,当美国约翰·霍普金斯大学开始接收女学生时,一个不赞成异性同校的人做了一个惊人的报道:该校1/3的女学生嫁给了老师。这数字太雷人了!不过原始数据清楚描绘了事实:那年总共只有3名女同学被录取,其中1人嫁给老师!不禁莞尔。

当然还有其他若干统计本身的谎言。这且不论,只就这几类错误来说,我们看到的数据如果都能避免,已经难能可贵了。那么,在数据日益泛滥的今天,即便统计数字本身没有作假,可又有几个数据传递了真实的信息?

 

《统计数据会撒谎》当当网链接