参数估计的介绍

来源:百度文库 编辑:神马文学网 时间:2024/04/28 19:36:02
参数估计的介绍
一、总体参数估计概述
统计推断(Statistical inference)就是根据样本的实际数据,对总体的数量特征作出具有一定可靠程度的估计和判断。统计推断的基本内容有参数估计和假设检验两方面。概括地说,研究一个随机变量,推断它具有什么样的数量特征,按什么样的模式来变动,这属于估计理论的内容,而推测这些随机变量的数量特征和变动模式是否符合我们事先所作的假设,这属于检验理论的内容。参数估计和假设检验的共同点是它们都对总体无知或不很了解,都是利用部分观察值所提供的信息,对总体的数量特征作出估计和判断,但两者所要解决问题的着重点的所有方法有所不同。本节先研究总体参数估计的问题。
总体参数估计是以样本统计量(即样本数字特征)作为未知总体参数(即总体数字特征)的估计量,并通过对样本单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。
不论社会经济活动还是科学试验,人们作出某种决策之前总是要对许多情况进行估计。例如商品推销人员要估计新式时装可能为消费者所学好的程度,自选商场经理要估计附近居民的购买能力,民意调查机构要估计竞选者的得票率,医药生产部门要推广某种药品的新配方,必须估计新药疗效的提高程度等等。这些估计通常是在信息不完全、结果不确定的情况下作出。参数估计为我们提供一套在满足一定精确度要求下根据部分信息来估计总体参数的真值,并作出同这个估计相适应的误差说明的科学方法。
科学的抽样估计方法要具备三个基本条件。
首先是要有合适的统计量作为估计量。我们知道统计量是样本随机变量的函数,根据样本随机变量可以构造许多统计量,但不是所有的统计量都能够充当良好的估计量。例如,从一个样本可以计算平均数、中位数、众数等等,现在要用来估计总体平均数,究竟以哪个样本统计量作为估计量更合适,如果采用样本平均数作为估计量,这就需要回答样本平均数和总体平均数存在什么样的内在联系,以样本平均数作为良好估计量的标准是什么等等。只有这些问题解决了,才能通过样本的实际观察确定估计值,而估计值是参数估计的基础。
其次,要有合理的允许误差范围。允许误差范围又称抽样极限误差,指样本统计量与被估计总体参数离差的绝对值可允许变动的上限或下限。离差的绝对值愈小表明抽样估计的准确度愈高,反之,就表明准确度愈差了。由于统计量本身也是随机变量,所以要使所做的估计完全没有误差是难以实现的,但估计误差也不能太大,估计误差如果超过了一定限度参数估计本身也就会失去价值。当然也不见得误差愈小就是愈好的估计,因为减少误差势必增加费用、时间,增加人力、物力、财力的负担,这样甚至会失去组织抽样调查的意义。所以在做估计的时候应该根据所研究对象的变异程度和分析任务的要求确定一个合理的允许误差范围,凡估计值与被估计值之间的离差不超过允许范围,这种估计都算是有效的。例如估计粮食亩产600公斤,允许误差范围6公斤,这意味着如果实际的粮食亩产在594—606公斤之间都应该认为估计是有效的。我们把允许误差的区间594—606公斤称为估计区间,允许误差与估计值之比称为误差率,(1–误差率)称为估计精度,上例误差率为6/600=1%,估计精度为1–1%=99%。
再次,要有一个可接受的置信度。估计置信度又称估计推断的概率保证程度,这是估计的可靠性问题。由于抽样是随机抽样,统计量是随机变量,估计值所确定的估计区间也是随机的,在实际抽样中并不能做主被估计的参数真值都落在允许误差的范围内。这就产生要冒多大风险相信所作的估计。如果一种估计可信度很低,这就意味着所冒的风险很大,这种估计也就没有什么价值。例如我们愿意冒10%的风险,这表示如果进行多次重复估计,则平均每100次估计将10次是错误,90次估计正确。90%就称为置信度或称概率保证程度。在抽样估计中要求达到100%的置信度是难以做到的,但置信度小了,估计结论的可靠性太低,又会影响估计本身的价值,所以在做估计的时候,也应该根据所研究问题的性质和工作的需要确定一个可接受的估计置信度。当然估计置信度的要求和准确度的要求应该结合起来考虑,估计的准确度很高而置信度很低或准确很低而置信度很高都是不合适的。