2._参数估计概述
参数估计概述
前面介绍了几个常用统计量的抽样分布,引进统计量的目的在于对感兴趣的问题进行统计推断.而在实际问题中,虽然所研究的总体分布类型已知,但分布中含有一个或多个未知参数,根据样本如何构造适当的统计量估计所有未知参数,这就是参数估计问题.
参数估计有点估计(Point Estimation)和区间估计(Interval Estimation)两种形式 下面对两估计做一个整体概述,然后再详细介绍。
点估计
某个调查小组要统计当地人员的平均工资,为此,他们随机的找了当地5个工作人员,询问他们的工资,得到5个数据,他们把这5个数据累加起来除以5,算出平均值元,由此他们推出,当地人平均工资为 元。 这种估计被称为点估计。 从这里可以看到,点估计里,使用局部的样本值来估算整体的样本值。上面的做法用数学术语就是用“样本的平均值当做整体的期望值”,但是实际问题中通常问题比较复杂。虽然所研究的总体分布类型已知,但分布中含有一个或多个未知参数,我们要做的是根据样本数据如何构造一个函数使得参数的估计量更接近实际值,这就是参数估计问题。比如知道学生的身高服从正态分布, 如何根据样本值来推算出。因为这里算出的是估计值,所以通常写成。
点估计主要有矩估计法和极大似然估计法。
区间估计
当然,在上面估算过程里,虽然计算简单,容易理解,但是可能采样有问题差会产生较大的误差,所以,一个常用的方法是多次取样,然后给出一个估值出来。比如采样5次,得到5次平均工资为:
我们把得到的数据按照从小到大排列出来,得到
在这种数据里,取最小值 和最大值 , 那么我就可以说,该地区的人均工资在 在 之间 (即 ), 这样的说法虽然基本上是正确的,但是仍然未回答当地人的平均工资是都少,此时,我们就需要一个“概率估计”,比如: (1)该地区人工资在 2000元的可能性为 1% (2)该地区人工资在 5000元的可能性为 99% (3)该地区人工资在 7000元的可能性为 1% 因此区间估计相当于不把话说死,给出一个概率值,这个概率值称作置信区间 ,区间估计类似日常说话,今天天气阴的很重,我估计今天有八成会下雨。这个“八成(置信区间)”就是给出了一个概率值。