前沿扩展阅读—统计学应用例子补充
来源:百度文库 编辑:神马文学网 时间:2024/04/29 00:27:40
一.先来一句名人名言来压压阵脚,表示统计学的应用是十分广泛的 。 在终极的分析中,
一切知识都是历史.
在抽象的意义下,
一切科学都是数学.
在理性的世界里,
所有的判断都是统计学.
----C.R.Rao c.r .rao:人物简介:统计学家 C.R. Rao
C.R.劳教授生于1920年9月10日,他出生在印度卡那塔加(Karnataka)省的那达加里(Hadagari)一个贵族家庭。
1940年,获得印度安德拉(Andra)大学数学硕士学位。
1943年,在加尔各答(Calcutta)大学获得统计学硕士学位。
1948年,从师数理统计学奠基人R.A.费歇(Fisher)教授,获得英国剑桥大学的统计学博士学位。 二 统计学应用的实际例子补充1.鉴别文章作者 “红楼梦”后40回是否为曹雪芹所写?1985、1986复旦大学李贤平教授带领他的学生作了这项工作,他们创造性的想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类。分析结果果然表明120回分属两类,即前80回为一类,后40回为一类,有说服力地证实了全书不是出自同一人的手笔。
那么后40回是否为高鹗所写?
论证结果推翻了后40回是高鹗一个人所写。
这个论证在红学界轰动很大,支持了红学界观点,使红学界大为赞叹。
类似的典型事例还有莎士比亚诗的鉴别 2。许多统计学家在第二次世界大战中发挥了重大作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被(英国皇家空军的作战指挥官)咨询飞机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累一段时间后,机身各部位几乎都被填满了,于是沃德建议,把剩下少数几个没有弹孔的位置加强,因为这些部位被击中的飞机都没有返航。
亚伯拉罕·瓦尔德(Abraham Wald,1902~1950) 罗马尼亚裔美国统计学家
1902年10月31日生于罗马尼亚的克卢日,瓦尔德诞生在罗马尼亚,是正统的 (orthodox) 犹太世家,由于它的宗教信仰,使他受教育的机会受到某些限制,而必须靠自修弥补。他自修的结果竟能对希尔伯特 (Hilbert) 的《Foundation of Geometry》提出有价值的见解,他的建议列入该书的第七版中,这一事实充分显示了他的数学天赋。
3.统计学和德国坦克1941,1942年间,盟军的美国和英国造的坦克作战能力超过了德国的Panzer坦克。但是盟军还是很担心德国的新型坦克Mark IV和Mark V。而且盟军根本就不知道德国人一年能造出多少坦克来。缺少这个信息,盟军对西线作战的胜利没有把握。
一开始,情报部门观察德国坦克制造厂,甚至专门在战场上数德国人的坦克。这些方法收获甚微。后来情报部门找来了统计学专家,想看一看他们有没有什么好的办法。
统计学家们有一个关键信息:缴获的Mark V 坦克上的序列号。统计学家们相信根据德国人的天性,他们会根据生产的顺序给这些坦克编号。这些信息就足够让这些专家们就行精确的估计了。
原理是这样的:德国坦克编号是1,2,3,。。。N。这里的N就是坦克的总生产数量。假设盟军缴获了5台坦克,他们的编号分别是20, 31, 43, 78 和 92。这里样本总数S是5,最大序列号M是92。他们在其它一些系列上进行了测试和演算,得出了一个公式:制造总量=(M-1)(S+1)/S。在上面的例子中,(92-1)(5+1)/5 = 109.2。所以总产量在109左右。
运用这个公式,统计学家门得出结论:在1940年6月到1942年9月,德国每个月制造出246台坦克。情报部门得出的数据要高得多,1400台。战争结束后,盟军拿到了制造厂的生产报表,数据显示这三年德国每月生产245台坦克。
统计学家帮助盟军赢得了战争。
一切知识都是历史.
在抽象的意义下,
一切科学都是数学.
在理性的世界里,
所有的判断都是统计学.
----C.R.Rao c.r .rao:人物简介:统计学家 C.R. Rao
C.R.劳教授生于1920年9月10日,他出生在印度卡那塔加(Karnataka)省的那达加里(Hadagari)一个贵族家庭。
1940年,获得印度安德拉(Andra)大学数学硕士学位。
1943年,在加尔各答(Calcutta)大学获得统计学硕士学位。
1948年,从师数理统计学奠基人R.A.费歇(Fisher)教授,获得英国剑桥大学的统计学博士学位。 二 统计学应用的实际例子补充1.鉴别文章作者 “红楼梦”后40回是否为曹雪芹所写?1985、1986复旦大学李贤平教授带领他的学生作了这项工作,他们创造性的想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),数出每一回里变量出现的次数,作为数据,用多元分析中的聚类分析法进行分类。分析结果果然表明120回分属两类,即前80回为一类,后40回为一类,有说服力地证实了全书不是出自同一人的手笔。
那么后40回是否为高鹗所写?
论证结果推翻了后40回是高鹗一个人所写。
这个论证在红学界轰动很大,支持了红学界观点,使红学界大为赞叹。
类似的典型事例还有莎士比亚诗的鉴别 2。许多统计学家在第二次世界大战中发挥了重大作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被(英国皇家空军的作战指挥官)咨询飞机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累一段时间后,机身各部位几乎都被填满了,于是沃德建议,把剩下少数几个没有弹孔的位置加强,因为这些部位被击中的飞机都没有返航。
亚伯拉罕·瓦尔德(Abraham Wald,1902~1950) 罗马尼亚裔美国统计学家
1902年10月31日生于罗马尼亚的克卢日,
3.统计学和德国坦克1941,1942年间,盟军的美国和英国造的坦克作战能力超过了德国的Panzer坦克。但是盟军还是很担心德国的新型坦克Mark IV和Mark V。而且盟军根本就不知道德国人一年能造出多少坦克来。缺少这个信息,盟军对西线作战的胜利没有把握。
一开始,情报部门观察德国坦克制造厂,甚至专门在战场上数德国人的坦克。这些方法收获甚微。后来情报部门找来了统计学专家,想看一看他们有没有什么好的办法。
统计学家们有一个关键信息:缴获的Mark V 坦克上的序列号。统计学家们相信根据德国人的天性,他们会根据生产的顺序给这些坦克编号。这些信息就足够让这些专家们就行精确的估计了。
原理是这样的:德国坦克编号是1,2,3,。。。N。这里的N就是坦克的总生产数量。假设盟军缴获了5台坦克,他们的编号分别是20, 31, 43, 78 和 92。这里样本总数S是5,最大序列号M是92。他们在其它一些系列上进行了测试和演算,得出了一个公式:制造总量=(M-1)(S+1)/S。在上面的例子中,(92-1)(5+1)/5 = 109.2。所以总产量在109左右。
运用这个公式,统计学家门得出结论:在1940年6月到1942年9月,德国每个月制造出246台坦克。情报部门得出的数据要高得多,1400台。战争结束后,盟军拿到了制造厂的生产报表,数据显示这三年德国每月生产245台坦克。
统计学家帮助盟军赢得了战争。
前沿扩展阅读—统计学应用例子补充
前沿扩展阅读—统计学应用例子补充
前沿扩展阅读—统计学应用例子补充
前沿扩展阅读—其他
自定义扩展点代码例子_DM
TinyXML应用例子ggg
TinyXML应用例子
样本扩展阅读—管窥美国调查业之二
应用伦理学前沿问题研究
托福阅读的得分保障—背景知识补充
LM339的8个典型应用例子
WebGIS的主要发展趋势及前沿应用[从论文中整理而得] —
金融学前沿理论应用综述及其展望
SpringSide 对Acegi的扩展应用实例
甲骨文拟扩展在线应用 研发人力资源系统
SpringSide 对Acegi的扩展应用实例
使用Slice扩展伸缩OpenJPA 应用
保卫想象力(补充阅读)
保卫想象力(补充阅读)
PHP的GZIP压缩页面例子,使用zlib扩展实现页面GZIP压缩输出
一个类成员函数指针的应用例子
电压比较器LM339的8个典型应用例子
中文期刊在线阅读系统 (补充)
中文期刊在线阅读系统 (补充.)