6._有效性

评价点估计好不好有三个指标:无偏性是指估计量的期望和总体期望一样。 有效性是指估计量的方差应尽可能小,相合性是指当取样数量无限大时,估计量和真实值应无限接近

有效性

具有无偏性只是对"好"估计的基本要求,同一待估参数往往有很多无偏估计量,因此,必须给出另外的标准以便在众多的无偏估计量中"优中选优"。

θ^\hat{\theta}θ\theta 的无偏估计量,θ^\hat{\theta} 的取值在真值的附近波动,我们自然希望 θ^\hat{\theta}θ\theta 之间的偏差越小越好,也就是说 θ^\hat{\theta} 的方差越小越有效,由此便有了有效性的概念。

定义θ^1,θ^2\hat{\theta}_1, \hat{\theta}_2 均为参数 θ\theta 的无偏估计量,若

D(θ^1)<D(θ^2)D\left(\hat{\theta}_1\right)<D\left(\hat{\theta}_2\right)

则称 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 有效.

设某种产品的寿命 XX 服从指数分布,其概率密度为

f(x)={1θexθ,x>00,x0f(x)= \begin{cases}\frac{1}{\theta} e^{-\frac{x}{\theta}}, & x>0 \\ 0, & x \leqslant 0\end{cases}

其中 θ\theta 为末知参数.X1,X2,X3,X4X_1, X_2, X_3, X_4 是来自总体的样本,设有 θ\theta 的估计量

θ^1=16(X1+X2)+13(X3+X4)θ^2=15(X1+2X2+3X3+4X4)θ^3=14(X1+X2+X3+X4)\begin{gathered} \hat{\theta}_1=\frac{1}{6}\left(X_1+X_2\right)+\frac{1}{3}\left(X_3+X_4\right) \\ \hat{\theta}_2=\frac{1}{5}\left(X_1+2 X_2+3 X_3+4 X_4\right) \\ \hat{\theta}_3=\frac{1}{4}\left(X_1+X_2+X_3+X_4\right) \end{gathered}

哪一个估计量最优?

解 因为 XX 服从指数分布,所以 E(X)=1λ=θ,D(X)=1λ2=θ2E(X)=\frac{1}{\lambda}=\theta, D(X)=\frac{1}{\lambda^2}=\theta^2 .由于

E(θ^1)=16[E(X1)+E(X2)]+13[E(X3)+E(X4)]=θ,E(θ^2)=15[E(X1)+2E(X2)+3E(X3)+4E(X4)]=2θ,E(θ^3)=E(Xˉ)=E(X)=θ,\begin{gathered} E\left(\hat{\theta}_1\right)=\frac{1}{6}\left[E\left(X_1\right)+E\left(X_2\right)\right]+\frac{1}{3}\left[E\left(X_3\right)+E\left(X_4\right)\right]=\theta, \\ E\left(\hat{\theta}_2\right)=\frac{1}{5}\left[E\left(X_1\right)+2 E\left(X_2\right)+3 E\left(X_3\right)+4 E\left(X_4\right)\right]=2 \theta, \\ E\left(\hat{\theta}_3\right)=E(\bar{X})=E(X)=\theta, \end{gathered}

θ^1\hat{\theta}_1θ^3\hat{\theta}_3θ\theta 的无偏估计量.又

D(θ^1)=136[D(X1)+D(X2)]+19[D(X3)+D(X4)]=518θ2,D(θ^3)=D(Xˉ)=D(X)4=14θ2,\begin{gathered} D\left(\hat{\theta}_1\right)=\frac{1}{36}\left[D\left(X_1\right)+D\left(X_2\right)\right]+\frac{1}{9}\left[D\left(X_3\right)+D\left(X_4\right)\right]=\frac{5}{18} \theta^2, \\ D\left(\hat{\theta}_3\right)=D(\bar{X})=\frac{D(X)}{4}=\frac{1}{4} \theta^2, \end{gathered}

θ^3\hat{\theta}_3 最优. 可以证明:当 i=1nci=1\sum_{i=1}^n c_i=1 时,μ^=i=1n(ciXi)\hat{\mu}=\sum_{i=1}^n\left(c_i X_i\right) 是总体期望 μ\mu 的无偏估计量,其中 Xˉ\bar{X} 最有效.

X1,X2,,X2nX_1, X_2, \cdots, X_{2 n} 是从正态总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) 中抽取的样本,

μ^1=1ni=1nXi,μ^2=12ni=12nXi\hat{\mu}_1=\frac{1}{n} \sum_{i=1}^n X_i, \quad \hat{\mu}_2=\frac{1}{2 n} \sum_{i=1}^{2 n} X_i

试证:μ^1\hat{\mu}_1μ^2\hat{\mu}_2 都是 μ\mu 的无偏估计量,并指出哪一个较为有效。 证 因为

E(μ^1)=1ni=1nE(Xi)=1nnμ=μE(μ^2)=12ni=12nE(Xi)=12n2nμ=μ\begin{gathered} E\left(\hat{\mu}_1\right)=\frac{1}{n} \sum_{i=1}^n E\left(X_i\right)=\frac{1}{n} \cdot n \mu=\mu \\ E\left(\hat{\mu}_2\right)=\frac{1}{2 n} \sum_{i=1}^{2 n} E\left(X_i\right)=\frac{1}{2 n} \cdot 2 n \mu=\mu \end{gathered}

所以 μ^1\hat{\mu}_1μ^2\hat{\mu}_2 都是 μ\mu 的无偏估计量. 由于

D(μ^1)=1n2i=1nD(Xi)=1n2nσ2=1nσ2,D\left(\hat{\mu}_1\right)=\frac{1}{n^2} \sum_{i=1}^n D\left(X_i\right)=\frac{1}{n^2} \cdot n \sigma^2=\frac{1}{n} \sigma^2,
D(μ^2)=(12n)2i=12nD(Xi)=14n22nσ2=12nσ2,D\left(\hat{\mu}_2\right)=\left(\frac{1}{2 n}\right)^2 \sum_{i=1}^{2 n} D\left(X_i\right)=\frac{1}{4 n^2} \cdot 2 n \sigma^2=\frac{1}{2 n} \sigma^2,

D(μ^1)>D(μ^2),D\left(\hat{\mu}_1\right)>D\left(\hat{\mu}_2\right),

因此,μ^2\hat{\mu}_2 更有效.

此例中的情形在实际生活中也是如此。例如,要估计某个地级市的人均收人,在通过样本值进行估计时,常随机抽取一些人员,以他们的平均收人作为整个城市人员的平均收人。从理论上讲,抽取的人数越多,估计的精度越高.

6._有效性 - 概率论与数理统计 | OpenTech