3._点估计_矩估计法

引入

引例1:矩估计法通俗解释:某个调查小组要统计当地人员的平均工资,为此,他们随机的找了当地100个工作人员,算出这100个人的平均工资为5000元,由此他们推出,当地人平均工资5000元。可以看到在这里,我们直接使用样本的均值来当做总体的期望值。

引例2 :对某型号的 20 辆汽车记录其每 5 L 汽油的行驶里程 (单位: km ), 观测数据如下:

\begin{array} 29.8 & 27.6 & 28.3 & 27.9 & 30.1 & 28.7 & 29.9 & 28.0 & 27.9 & 28.7 \\ 28.4 & 27.2 & 29.5 & 28.5 & 28.0 & 30.0 & 29.1 & 29.8 & 29.6 & 26.9 \end{array}

这是一个容量为 20 的样本观测值, 对应总体是该型号汽车每 5 L 汽油的行驶里程, 其分布形式尚不清楚, 可用矩法估计其均值、方差和中位数等. 本例中经计算有样本的均值方差和中位数

xˉ=28.695,s2=0.9668,m0.5=28.6,\bar{x}=28.695, \quad s^2=0.9668, \quad m_{0.5}=28.6,

由此给出总体均值、方差和中位数的估计分别为 28.695,0.966828.695,0.9668 和 28.6. 上面两个例子虽然不同,但是处理方法类似,就是我们直接使用样本值来替代总体值,这种方法被称为矩估计法。因此矩法估计的统计思想十分简单明确,众人都能接受,使用场合甚广.

矩估计法的矩是k阶矩的意思。比如上面引例2中,我们用 样本期望拟合总体期望(相当于1阶原点矩),用 样本方差拟合总体方差(相当于2阶中心矩),如果继续使用样本的3阶矩、4阶矩拟合总体的3阶矩、4阶矩,会让样本越来越接近总体估算。关于k解决详见此处

基本概念

若总体 XX 的分布已知,但它的一个或多个参数未知,则由总体 XX 的样本去估计未知参数的值,此类问题就属于参数的点估计。

例如,设总体 XX 的分布函数为 F(x;θ)F(x ; \theta) ,其中 θ\theta 为未知参数,由样本 X1,X2,,XnX_1, X_2, \cdots, X_n 构造一个统计量

θ^(X1,X2,,Xn)\hat{\theta}\left(X_1, X_2, \cdots, X_n\right)

去估计未知参数 θ\theta ,这种方法称为点估计θ^(X1,X2,,Xn)\hat{\theta}\left(X_1, X_2, \cdots, X_n\right) 称为参数 θ\theta估计量.若 x1,x2,,xnx_1, x_2, \cdots, x_n 是一组样本观测值,则 θ^(x1,x2,,xn)\hat{\theta}\left(x_1, x_2, \cdots, x_n\right) 称为参数 θ\theta估计值

矩估计法

某工厂生产某种型号的钢筋,为了解此种钢筋的强度,我们从中抽取50根进行检查.如何从抽查的50根钢筋的强度数据去估计此种钢筋的平均强度µ呢?这就是参数估计要解决的问题.其中又分为两种情形:是找一个数值去估计µ,还是找一个范围去估计µ?

在上面估计钢筋强度的例子中,如果 50 根钢筋的强度数据已经检测完毕,我们可以用这 50 根钢筋的平均强度去估计此种钢筋的平均强度 μ\mu ,即

μ^=xˉ=150i=150xi\hat{\mu}=\bar{x}=\frac{1}{50} \sum_{i=1}^{50} x_i

在实际问题中,我们常常以统计量

Xˉ=1ni=1nXi\bar{X}=\frac{1}{n} \sum_{i=1}^n X_i

作为总体X的期望值的估计量,这里用的就是矩估计法.

矩估计法的基本思想是替换原理,即用样本矩去替换相应的总体矩,这里的矩可以是原点矩,也可以是中心距.我们知道,矩是由随机变量的分布唯一确定的,而样本来源于总体,由大数定律可知,样本矩在一定程度上反映总体矩的特征

英国统计学家K.Pearson 皮尔逊于1900年提出了这个替换原理,后来人们称此方法为矩估计法或矩法(Moment Method of Estimation). 若估算的不够良好,再做适当调整.

矩估计的具体步骤

设总体 XX 的分布函数 F(x;θ1,,θk)F\left(x ; \theta_1, \cdots, \theta_k\right) 中含有 kk 个未知参数 θ1,,θk\theta_1, \cdots, \theta_k, 则: (1) 设总体 XX 的前 kk 阶矩 μl=E(Xl)(1lk)\mu_l=E\left(X^l\right) \quad(1 \leqslant l \leqslant k) 存在, 求出 μl=E(Xl)(1lk)\mu_l=E\left(X^l\right) \quad(1 \leqslant l \leqslant k),一般都是这 kk 个未知参数的函数, 记为

μl=μl(θ1,,θk),l=1,2,,k.\mu_l=\mu_l\left(\theta_1, \cdots, \theta_k\right), \quad l=1,2, \cdots, k .

(2) 设 Al(1lk)A_l(1 \leqslant l \leqslant k) 为样本 kk 阶矩, 用样本矩去替换总体矩, 即

{μ1(θ1,,θk)=A1μ2(θ1,,θk)=A2μl(θ1,,θk)=Al\left\{\begin{array}{c} \mu_1\left(\theta_1, \cdots, \theta_k\right)=A_1 \\ \mu_2\left(\theta_1, \cdots, \theta_k\right)=A_2 \\ \vdots \\ \mu_l\left(\theta_1, \cdots, \theta_k\right)=A_l \end{array}\right.

(3) 求出上面方程组的解 θ^1,θ^2,,θ^k\hat{\theta}_1, \hat{\theta}_2, \cdots, \hat{\theta}_k, 称 θ^l=θ^l(X1,X2,,Xn)\hat{\theta}_l=\hat{\theta}_l\left(X_1, X_2, \cdots, X_n\right) 为参数 θl(1lk)\theta_l(1 \leqslant l \leqslant k)的矩估计量, θ^l=θ^l(x1,x2,,xn)\hat{\theta}_l=\hat{\theta}_l\left(x_1, x_2, \cdots, x_n\right) 为参数 θl(1lk)\theta_l(1 \leqslant l \leqslant k) 的矩估计值.

在做矩估计时,既可用原点矩也可用中心矩建立关于未知参数的方程组,而且矩的阶数有多种选择,因而矩估计是不唯一的.为了计算方便,在矩估计中应该尽量采用低阶矩给出未知参数的矩估计.但通常估计使用期望和方差。 图片{width=500px}

例题

(离散型)设XX为某零配件供应商每周的发货批次,其分布律如下.

图片 其中 θ\theta 是未知参数.假设收集了该供应商 8 周的发货批次如下.

3,1,3,0,3,1,2,3.3,1,3,0,3,1,2,3 .

θ\theta 的矩估计值. 解 总体期望 E(X)=0×θ2+1×2θ(1θ)+2×θ2+3×(12θ)=34θE(X)=0 \times \theta^2+1 \times 2 \theta(1-\theta)+2 \times \theta^2+3 \times(1-2 \theta)=3-4 \theta . 样本均值 Xˉ=1ni=1nXi=18×(3+1+3+0+3+1+2+3)=2\bar{X}=\frac{1}{n} \sum_{i=1}^n X_i=\frac{1}{8} \times(3+1+3+0+3+1+2+3)=2 . 用样本均值估计总体期望有 E(X)=XˉE(X)=\bar{X} ,即 34θ=23-4 \theta=2 . 解得矩估计值为 θ^=14\hat{\theta}=\frac{1}{4}

(连续型)已知某种金属板的厚度 XX(a,b)(a, b) 上服从均匀分布,其中 a,ba, b 未知.设抽查了 nn 片金属板,厚度分别为 X1,X2,,XnX_1, X_2, \cdots, X_n 。试用矩估计法估计 a,ba, b

解:我们在随机变量的数字特征上给出了均匀分布的期望和方差,即

XX 若在 (a,b)(a, b) 上服从均匀分布, 则 E(X)=a+b2,D(X)=(ba)212E(X)=\frac{a+b}{2}, D(X)=\frac{(b-a)^2}{12}

总体的二阶矩 E(X2)=D(X)+E2(X)=(ba)212+(a+b2)2E\left(X^2\right)=D(X)+E^2(X)=\frac{(b-a)^2}{12}+\left(\frac{a+b}{2}\right)^2

{E(X)=a+b2=XˉE(X2)=(ba)212+(a+b2)2=1ni=1nXi2\left\{\begin{array}{l} E(X)=\frac{a+b}{2}=\bar{X} \\ E\left(X^2\right)=\frac{(b-a)^2}{12}+\left(\frac{a+b}{2}\right)^2=\frac{1}{n} \sum_{i=1}^n X_i^2 \end{array}\right.

解此方程组,得到 a,ba, b 的矩估计量分别为

(其中,B2=1ni=1n(XiXˉ)2B_2=\frac{1}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2 为二阶样本中心距)

a^=Xˉ3ni=1n(XiXˉ)2=Xˉ3B2b^=Xˉ+3ni=1n(XiXˉ)2=Xˉ+3B2\begin{aligned} & \hat{a}=\bar{X}-\sqrt{\frac{3}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2}=\bar{X}-\sqrt{3 B_2} \\ & \hat{b}=\bar{X}+\sqrt{\frac{3}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2}=\bar{X}+\sqrt{3 B_2} \end{aligned}

点评 本题因为需要估计两个参数 a,ba, b ,所以应该构造两个方程:(1)求出期望 EXE XXˉ\bar{X} 代替; (2)求出 E(X2)E\left(X^2\right)A2=1ni=1nXi2A_2=\frac{1}{n} \sum_{i=1}^n X_i^2 代替,这样为 a^=Xˉ3B2,b^=Xˉ+3B2\hat{a}=\bar{X}-\sqrt{3 B_2}, \quad \hat{b}=\bar{X}+\sqrt{3 B_2}

下面把上面抽象计算具体化,设厂钢板厚度服从均匀分布U(a,b),测量一批块钢板,其值为容量为 5 的样本:

4.55.04.74.04.2\begin{array}{lllll} 4.5 & 5.0 & 4.7 & 4.0 & 4.2 \end{array}

经计算,有 xˉ=4.48,s=0.3962\bar{x}=4.48, s=0.3962 ,于是可得 a,ba, b 的矩估计为

a^=4.480.39623=3.7938,b^=4.48+0.39623=5.1662.\begin{aligned} & \hat{a}=4.48-0.3962 \sqrt{3}=3.7938, \\ & \hat{b}=4.48+0.3962 \sqrt{3}=5.1662 . \end{aligned}

这样,我们就说,钢板服从 (3.794 ~ 5.166) 的均匀分布。

设总体 XX[a,b][a, b] 上服从均匀分布,(X1,X2,,Xn)\left(X_1, X_2, \cdots, X_n\right) 为其样本,样本均值 Xˉ\bar{X} ,样本方差 S2S^2 ,则 a,ba, b 的矩估计 a^=\hat{a}= \qquadb^=\hat{b}= \qquad。 解 由均匀分布的数字特征结论:

EX=a+b2,DX=(ba)212.E X=\frac{a+b}{2}, \quad D X=\frac{(b-a)^2}{12} .

EX=Xˉ,DX=S2E X=\bar{X}, D X=S^2 ,解得

a^=Xˉ3S,b^=Xˉ+3S\hat{a}=\bar{X}-\sqrt{3} S, \quad \hat{b}=\bar{X}+\sqrt{3} S

点评: 请仔细比较本例和上例的细微差别。因为a,b 是两个参数,所以需要2个方程。 上例使用期望和2解矩构造方程,本题使用期望和方差构造方程。所以,矩估计是不唯一的

设某种钛金属制品的技术指标为 XX ,其概率密度为

f(x)={βxβ+1,x>10,x1f(x)= \begin{cases}\frac{\beta}{x^{\beta+1}}, & x>1 \\ 0, & x \leqslant 1\end{cases}

其中未知参数 β>1\beta>1X1,X2,,XnX_1, X_2, \cdots, X_n 为来自总体 XX 的简单随机样本,求 β\beta 的矩估计量.

解 由于 E(X)=+xf(x)dx=1+xβxβ+1dx=ββ1E(X)=\int_{-\infty}^{+\infty} x f(x) d x=\int_1^{+\infty} x \cdot \frac{\beta}{x^{\beta+1}} d x=\frac{\beta}{\beta-1} ,令 ββ1=Xˉ\frac{\beta}{\beta-1}=\bar{X} ,解得 β=XˉXˉ1\beta=\frac{\bar{X}}{\bar{X}-1} ,所以参数 β\beta 的矩估计量为 β^=XˉXˉ1\hat{\beta}=\frac{\bar{X}}{\bar{X}-1}

设总体 XX 服从正态分布 N(μ,σ2)(X1,X2,,Xn)N\left(\mu, \sigma^2\right) ,\left(X_1, X_2, \ldots, X_n\right) 是取自总体 XX 的一个样本, (1) 求 μ\mu 的矩估计量; (2) μ\mu 已知, σ2\sigma^2 末知,求 σ2\sigma^2 的矩估计量; (3) μ\muσ2\sigma^2 都末知,求 σ2\sigma^2 的矩估计量.

解:(1)我们已经知道在正态分布里,其数学期望就是μ\mu,而上面说过,矩估法里,总体的数学期望可用样本的数学期望代替,因此 μ=E(X)\mu=E(X) ,故 μ\mu 的矩估计量 μ^=Xˉ\hat{\mu}=\bar{X}

(2) σ2=D(X)=E(X2)E2(X)\sigma^2=D(X)=E\left(X^2\right)-E^2(X), 又因为 μ=E(X)\mu=E(X) 已知, 故 σ^2=1ni=1nXi2μ2\hat{\sigma}^2=\frac{1}{n} \sum_{i=1}^n X_i^2-\mu^2 (3) 因为 μ=E(X)\mu=E(X) 末知,故

σ^2=1ni=1nXi2(Xˉ)2=1ni=1n(XiXˉ)2=Sn2.\hat{\sigma}^2=\frac{1}{n} \sum_{i=1}^n X_i^2-(\bar{X})^2=\frac{1}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2=S_n^2 .

上面这个例子说明,正态分布里,总体的期望就是样本的期望,总体的方程就是样本的方差。

设总体 XP(λ)X \sim P(\lambda) ,其中 λ>0\lambda>0 未知, (X1,X2,,Xn)\left(X_1, X_2, \cdots, X_n\right) 为取自该总体的一个样本. 试求: (1)λ\lambda 的矩估计量; (2)P(X=0) P(X=0) 的矩估计量.

解:(1) 因为 E(X)=λE(X)=\lambda ,故 λ\lambda 的矩估计量可定义为 λ^=Xˉ\hat{\lambda}=\bar{X}. 又 D(X)=λ=E(X2)(EX)2D(X)=\lambda=E\left(X^2\right)-(E X)^2 ,故 λ\lambda 的矩估计量又可写为 λ^=1ni=1nXi2Xˉ2\hat{\lambda}=\frac{1}{n} \sum_{i=1}^n X_i^2-\bar{X}^2. 这说明矩估计可能不唯一,通常尽量采用较低阶的矩给出未知参数的估计。 (2) 因 P(X=0)=eλλ00!=eλ=eE(X)P(X=0)= e ^{-\lambda} \frac{\lambda^0}{0!}= e ^{-\lambda}= e ^{-E(X)} 所以: P^(X=0)=eXˉ\hat{P}(X=0)= e ^{-\bar{X}}.

关于矩估计量有下列结论:

定理 设总体 XX 的均值 E(X)=μE(X)=\mu ,方差 D(X)=σ2(X1,X2,,Xn)D(X)=\sigma^2 ,\left(X_1, X_2, \cdots, X_n\right) 为取自该总体的一个样本, 则 Xˉ\bar{X}μ\mu 的矩估计量, Sn2S_n^2σ2\sigma^2 的矩估计量, SnS_nσ\sigma 的矩估计量.

设总体XX的密度函数为

f(x,θ)={e(xθ),xθ0 其它 f(x, \theta)=\left\{\begin{array}{cc} e^{-(x-\theta)} & , x \geq \theta \\ 0 & \text { 其它 } \end{array}\right.

,其中θ\theta 未知,(X1,X2,...Xn)(X_1,X_2,...X_n)未取自该总体的一个样本,求θ\theta得矩估计量 解:因为 E(X)=θ+xe(xθ)dx=0+(t+θ)etdt=0+tetdt+0+θetdt=1+θE(X)=\int_\theta^{+\infty} x e^{-(x-\theta)} d x=\int_0^{+\infty}(t+\theta) e^{-t} d t=\int_0^{+\infty} t e^{-t} d t+\int_0^{+\infty} \theta e^{-t} d t=1+\theta 所以 θ=E(X)1\theta=E(X)-1, 故 θ\theta 的矩估计量 θ^=Xˉ1\hat{\theta}=\bar{X}-1.

XU(θ,θ),(X1,X2,,Xn)X \sim U(-\theta, \theta),\left(X_1, X_2, \cdots, X_n\right) 为取自该总体的 一个样本,求 θ(θ>0)\theta(\theta>0) 的矩估计量. 解 因 E(X)=0E(X)=0 ,而 E(X2)=D(X)=θ23E\left(X^2\right)=D(X)=\frac{\theta^2}{3}, 所以可由此解出 θ2=3E(X2),θ=3E(X2)\theta^2=3 E\left(X^2\right), \theta=\sqrt{3 E\left(X^2\right)}, 故 θ\theta 的矩估计量为 θ^=31ni=1nXi2\hat{\theta}=\sqrt{3 \frac{1}{n} \sum_{i=1}^n X_i^2}.

Xf(x,θ)={2xθ20<x<θ0 其余 X \sim f(x, \theta)= \begin{cases}\frac{2 x}{\theta^2} & 0<x<\theta \\ 0 & \text { 其余 }\end{cases}

其中 θ>0\theta>0 末知, 求 θ\theta 的矩估计量. 解 由已知条件可求得

E(X)=+xf(x)dx=0θx2xθ2 dx=2θ3E(X)=\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x=\int_0^\theta x \frac{2 x}{\theta^2} \mathrm{~d} x=\frac{2 \theta}{3}

故, θ=32E(X)\theta=\frac{3}{2} E(X). 所以 θ^=32Xˉ\hat{\theta}=\frac{3}{2} \bar{X}.

3._点估计_矩估计法 - 概率论与数理统计 | OpenTech