前沿扩展阅读—统计学应用例子补充

来源:百度文库 编辑:神马文学网 时间:2024/04/29 00:27:40
一.先来一句名人名言来压压阵脚,表示统计学的应用是十分广泛的 。        在终极的分析中,
       一切知识都是历史.
    在抽象的意义下,
  一切科学都是数学.
  在理性的世界里,
  所有的判断都是统计学.
       ----C.R.Rao          c.r .rao:人物简介:统计学家 C.R. Rao
C.R.劳教授生于1920年9月10日,他出生在印度卡那塔加(Karnataka)省的那达加里(Hadagari)一个贵族家庭。
1940年,获得印度安德拉(Andra)大学数学硕士学位。
1943年,在加尔各答(Calcutta)大学获得统计学硕士学位。
1948年,从师数理统计学奠基人R.A.费歇(Fisher)教授,获得英国剑桥大学的统计学博士学位。  二 统计学应用的实际例子补充1.鉴别文章作者   “红楼梦”后40回是否为曹雪芹所写?1985、1986复旦大学李贤平教授带领他的学生作了这项工作,他们创造性的想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类。分析结果果然表明120回分属两类,即前80回为一类,后40回为一类,有说服力地证实了全书不是出自同一人的手笔。
 那么后40回是否为高鹗所写?
  论证结果推翻了后40回是高鹗一个人所写。
  这个论证在红学界轰动很大,支持了红学界观点,使红学界大为赞叹。
   类似的典型事例还有莎士比亚诗的鉴别 2。许多统计学家在第二次世界大战中发挥了重大作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被(英国皇家空军的作战指挥官)咨询飞机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累一段时间后,机身各部位几乎都被填满了,于是沃德建议,把剩下少数几个没有弹孔的位置加强,因为这些部位被击中的飞机都没有返航。

                 亚伯拉罕·瓦尔德(Abraham Wald,1902~1950) 罗马尼亚裔美国统计学家
  1902年10月31日生于罗马尼亚的克卢日,瓦尔德诞生在罗马尼亚,是正统的 (orthodox) 犹太世家,由于它的宗教信仰,使他受教育的机会受到某些限制,而必须靠自修弥补。他自修的结果竟能对希尔伯特 (Hilbert) 的《Foundation of Geometry》提出有价值的见解,他的建议列入该书的第七版中,这一事实充分显示了他的数学天赋。
3.统计学和德国坦克1941,1942年间,盟军的美国和英国造的坦克作战能力超过了德国的Panzer坦克。但是盟军还是很担心德国的新型坦克Mark IV和Mark V。而且盟军根本就不知道德国人一年能造出多少坦克来。缺少这个信息,盟军对西线作战的胜利没有把握。
一开始,情报部门观察德国坦克制造厂,甚至专门在战场上数德国人的坦克。这些方法收获甚微。后来情报部门找来了统计学专家,想看一看他们有没有什么好的办法。
统计学家们有一个关键信息:缴获的Mark V 坦克上的序列号。统计学家们相信根据德国人的天性,他们会根据生产的顺序给这些坦克编号。这些信息就足够让这些专家们就行精确的估计了。
原理是这样的:德国坦克编号是1,2,3,。。。N。这里的N就是坦克的总生产数量。假设盟军缴获了5台坦克,他们的编号分别是20, 31, 43, 78 和 92。这里样本总数S是5,最大序列号M是92。他们在其它一些系列上进行了测试和演算,得出了一个公式:制造总量=(M-1)(S+1)/S。在上面的例子中,(92-1)(5+1)/5 = 109.2。所以总产量在109左右。
运用这个公式,统计学家门得出结论:在1940年6月到1942年9月,德国每个月制造出246台坦克。情报部门得出的数据要高得多,1400台。战争结束后,盟军拿到了制造厂的生产报表,数据显示这三年德国每月生产245台坦克。
统计学家帮助盟军赢得了战争。