9._置信区间

置信区间定义

(X1,X2,Xn)\left(X_1, X_2 \cdots, X_n\right) 是来自总体 f(x,θ)f(x, \theta) 的样本,其中参数 θΘ\theta \in \Theta 末知,对给定 的 0<α<10<\alpha<1 ,若存在统计量 θ1(X1,,Xn)θ2(X1,,Xn)\theta_1\left(X_1, \cdots, X_n\right) \leq \theta_2\left(X_1, \cdots, X_n\right), 使得

P(θ1(X1,,Xn)θθ2(X1,,Xn))1αP\left(\theta_1 \left(X_1, \cdots, X_n\right) \leq \theta \leq \theta_2\left(X_1, \cdots, X_n\right)\right) \geq 1-\alpha

那么称随机区间 [θ1(X1,,Xn),θ2(X1,,Xn)]\left[\theta_1\left(X_1, \cdots, X_n\right), \theta_2 \left(X_1, \cdots, X_n\right)\right]θ\theta 的双侧 1α1-\alpha 置信区间; 称 1α1-\alpha置信水平;

θ1\theta_1 θ\theta 的双侧 1α1-\alpha 置信区间的下限; 称 θ2\theta_2θ\theta 的双侧 1α1-\alpha 置信区间的上限, 简称双侧置信下限或者上限.

抽样以后就得到置信区间的观测值:

[θ1(x1,,xn),θ2(x1,,xn)]\left[\theta_1 \left(x_1, \cdots, x_n\right), \theta_2\left(x_1, \cdots, x_n\right)\right]

置信区间

置信区间是参数估计的重要内容,下面给他进行简单解释。

我们通常使用学生的身高来解释置信区间,假设某校学校初中生的身高分布服从如下正态分布 (μ=145,σ=1.4)(\mu=145, \sigma=1.4) : XN(145,1.42) X \sim N\left(145,1.4^2\right) 也就是说全校所有同学的平均身高为 145 cm ,为了表示只有上帝可以看到,我把真实分布用虚线来表示: 图片{width=450px}

我们不可能把每个学生身高都测量出来,我们只能在人群中抽样统计,比如下面是一次抽样数据,我把算出来的样本均值(记作 μ^\hat{\mu} ) 画在图上(蓝色的点):

图片{width=450px}

μ^\hat{\mu} 就是对真实的 μ\mu 的一次点估计。通过一次次的抽样,我们可以算出不同的身高均值的点估计: 图片{width=450px}

上图是在知道真实值的情况下,关闭上帝的视角,如下图,如果没有真实值,我们其实并不容易分辨不出哪个点估计更好,

图片{width=450px}

为此提出了置信区间,他提供了一种区间估计的方法。想象一下,我们拿一把尺子,尺子中心点对准采样的样本点,那么尺子左端点和右端点形成一个区间,这个区间称作置信区间。

图片{width=450px}

关闭真实值的置信区间是如下的样子。 图片{width=450px}

上图显示有7把“尺子”,在关闭真实值的情况下,我们要从这7把尺子里找到最符合真实值的区间,这就是我们本节要研究的工作。

95%的置信区间估计

置信区间,提供了一种区间估计的方法。下面采用 95%95 \% 置信区间来构造区间估计。如果把每次采样估计的“点”比喻为一条条小鱼,那我们的“网”尽95%的可能性把这些小鱼全网住。如下图的黄色区间尽可能覆盖所有的采样点。

图片{width=450px}

如何构造 95%95 \% 置信区间

假设人群的身高服从:

XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right)

其中 μ\mu 未知,σ\sigma已知。 我们不断对人群进行采样,样本的大小为 nn ,样本的均值:

M=X1+X2++XnnM=\frac{X_1+X_2+\cdots+X_n}{n}

根据大数定律和中心极限定律, MM服从:

MN(μ,σ2n)M \sim N\left(\mu, \frac{\sigma^2}{n}\right)

我们可以算出以 μ\mu为中心,面积为 0.95的区间,如下图 图片{width=450px}

即:

P(μ1.96σnMμ+1.96σn)=0.95P\left(\mu-1.96 \frac{\sigma}{\sqrt{n}} \leq M \leq \mu+1.96 \frac{\sigma}{\sqrt{n}}\right)=0.95 (具体推导见下面列子)

也就是, MM95%95 \% 的几率落入此区间:

图片{width=450px}

那自然,我们以 1.96σn1.96 \frac{\sigma}{\sqrt{n}} 为半径做区间,有 95%95 \% 的概率把 μ\mu包含进去:

6.gif{width=450px}

那么,只有一个问题了,我们不知道、并且永远都不会知道真实的 μ\mu是多少。

我们就只有用 μ^\hat{\mu}来代替 μ\mu :

P(μ^1.96σnMμ^+1.96σn)0.95P\left(\hat{\mu}-1.96 \frac{\sigma}{\sqrt{n}} \leq M \leq \hat{\mu}+1.96 \frac{\sigma}{\sqrt{n}}\right) \approx 0.95

上面这个公式的推导请参考下面的例1。

例题

X1,X2,,XnX_1, X_2, \cdots, X_n 为来自正态总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) 的样本,其中 σ2\sigma^2 已知, μ\mu 未知,试求出 μ\mu 的置信度为 1α1-\alpha 的置信区间.

解:根据点估计知,样本均值 Xˉ\bar{X}μ\mu 的良好估计量,且 根据大数定理与中心极限定理, XˉN(μ,σ2n)\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) ,把正态分布标准化后,故统计量

U=XˉμσnN(0,1).U=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1) .

如图所示,根据标准正态分布上 α\alpha 分位点的定义,可得

图片

P{uα2Uuα2}=1α,P\left\{-u_{\frac{\alpha}{2}} \leqslant U \leqslant u_{\frac{\alpha}{2}}\right\}=1-\alpha,

P{uα2Xˉμσ/nuα2}=1αP\left\{-u_{\frac{\alpha}{2}} \leqslant \frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \leqslant u_{\frac{\alpha}{2}}\right\}=1-\alpha

P{Xˉuα2σnμXˉ+uα2σn}=1αP\left\{\bar{X}-u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \leqslant \mu \leqslant \bar{X}+u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\right\}=1-\alpha

由置信区间的定义可知,[Xˉuα2σn,Xˉ+uα2σn]\left[\bar{X}-u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}, \bar{X}+u_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\right] 即为 μ\mu 的置信度为 1α1-\alpha 的置信区间.

注:上面这个例题可以对照下面的例题进行理解。

新疆旅游局为调查新疆旅游者的平均消费额,随机访问了 100 名旅游者,得知平均消费额 xˉ=80\bar{x}=80 元。根据经验,已知旅游者消费服从正态分布,且标准差 σ=12\sigma=12 元,求该地旅游者平均消费额 μ\mu 的置信度为 95%95 \% 的置信区间.

分析:本题要求估算旅游者平均消费额多少钱,现在已经知道平均消费8080元,这是一个点估计,本题要求给出的是区间估计,结合本题稍后给出的答案,本题可以转换为:我有95%95 \%的把握说用户的平均消费金额在77.682.477.6 \sim 82.4

95%95 \% 的置信区间就是要求所估计的平均消费金额有95%95 \%可能性在下图大的阴影面积里。总概率为1,大的占95%,则剩余的2个黄色面积之和为5%,为了计算方便,我们默认总是把剩余面积一份为二,即左右小的黄色面积各位2.5%

图片{width=500px}

因为考试时正态分布表不会给你数据直接查,所以需要进行转换 两旁的黄色面积总和为0.05, 考虑标准正态分布的对称性直接把α\alpha除以2, 所以两侧黄色阴影的面积各为α2=0.025\frac{\alpha}{2}=0.025

由此可得斜线阴影面积为 0.025+0.95=0.9750.025+0.95=0.975 图片{width=500px}

下面把视角切换到正态分布表里。 从正态分布分位数表可以看到当ua=1.96u_a=1.96 时,阴影面积正好为0.975.

上面这个结论最好记住:当正态分布估计量上下浮动±1.96\pm 1.96时,此时具有 95%95\% 的可信度,这是一个常用的结论

img-text{width=600px}

解:

对于给定的置信度

1α=0.951-\alpha=0.95

可知

α=0.05,α/2=0.025\alpha=0.05, \quad \alpha / 2=0.025

查标准正态分布表得 附录给出了 标准正态分布分位表

u0.025=1.96u_{0.025}=1.96

n=100,xˉ=80,σ=12,u0.025=1.96n=100, \quad \bar{x}=80, \quad \sigma=12, \quad u_{0.025}=1.96

计算得

xˉuα/2σn=801.961210=82.4=77.6,xˉ+uα/2σn=80+1.961210=82.4,\bar{x}-u_{\alpha / 2} \cdot \frac{\sigma}{\sqrt{n}}=80-1.96* \frac{12}{\sqrt{10}}=82.4=77.6, \quad \bar{x}+u_{\alpha / 2} \cdot \frac{\sigma}{\sqrt{n}}=80+1.96* \frac{12}{\sqrt{10}}=82.4,

所以 μ\mu 的置信度为 95%95 \% 的置信区间为 (77.6,82.4)(77.6,82.4)

即在已知误差为 σ=12\sigma=12 的情形下,可以 95%95 \% 的置信度认为每个旅游者的平均消费额在 77.682.477.6 \sim 82.4 元范围内.

扩展本题 如果本题要求有90%90\%的置信区间呢?此时阴影面积为0.9+0.05=0.950.9+0.05=0.95,查表得ua=1.645u_a=1.645

计算得

xˉuα/2σn=801.6451210=82.4=78.0xˉ+uα/2σn=80+1.6451210=82.0\bar{x}-u_{\alpha / 2} \cdot \frac{\sigma}{\sqrt{n}}=80-1.645* \frac{12}{\sqrt{10}}=82.4=78.0 \quad \bar{x}+u_{\alpha / 2} \cdot \frac{\sigma}{\sqrt{n}}=80+1.645* \frac{12}{\sqrt{10}}=82.0

对结果解读:

如果领导问你,游客平均消费多少呀?你可以回答,我有95%95\%的把握说用户消费金额在77.682.477.6 \sim 82.4 之间,如果希望更精确的消费答案,我有90%90\%的把握说用户消费金额在 78.082.078.0 \sim 82.0之间。从本题还可以看到,因为后者限定的范围更小,导致我在估算时的保证度降低,所以需要理解其中的含义。

图片{width=500px}

注意:下面这题可以等学完了 单个正态总体的参数的区间估计 再来理解。

新疆旅游局随机访问了 25 名旅游者,得知平均消费额 xˉ=80\bar{x}=80 元,样本标准差 s=12s=12 元,已知旅游者消费额服从正态分布,求旅游者平均消费额 μ\mu95%95 \% 置信区间.

解 对于给定的置信度

1α=0.951-\alpha=0.95

可知

α=0.05,α/2=0.025,\alpha=0.05, \alpha / 2=0.025,

查表得

tα/2(n1)=t0.025(24)=2.0639,t_{\alpha / 2}(n-1)=t_{0.025}(24)=2.0639,

xˉ=80,s=12,n=25,t0.025(24)=2.0639,\bar{x}=80, s=12, n=25, t_{0.025}(24)=2.0639,

计算得

xˉtα/2(n1)sn=75.05,xˉ+tα/2(n1)sn=84.95\bar{x}-t_{\alpha / 2}(n-1) \cdot \frac{s}{\sqrt{n}}=75.05, \quad \bar{x}+t_{\alpha / 2}(n-1) \cdot \frac{s}{\sqrt{n}}=84.95

所以 μ\mu 的置信度为 95%95 \% 的置信区间为 (75.05,84.95)(75.05,84.95) ,即在 σ2\sigma^2 未知的情况下,估计每个旅游者的平均消费额在 75.0584.9575.05 \sim 84.95 元范围内,这个估计的可靠度是 95%95 \%

总结

对此例进行分析,我们发现随机变量 UU 在置信区间的构造过程中起着关键作用,它具有下列特点: (1)是待估参数 μ\mu 和估计量 Xˉ\bar{X} 的函数; (2)不含其他未知参数; (3)其分布已知且与未知参数 μ\mu 无关。 我们称满足上述 3 条性质的量 QQ枢轴量。 在引入枢轴量 QQ 的概念后,我们归纳出求置信区间的一般步骤如下: (1)根据待估参数构造枢轴量 QQ ,一般可由未知参数的良好估计量改造得到; (2)对于给定的置信度 1α1-\alpha ,利用枢轴量 QQ 的分位点确定常数 aabb ,使

P{aQb}=1αP\{a \leqslant Q \leqslant b\}=1-\alpha

(3)将不等式恒等变形为

P{θ^1θθ^2}=1αP\left\{\hat{\theta}_1 \leqslant \theta \leqslant \hat{\theta}_2\right\}=1-\alpha

即可得到参数 θ\theta 的置信度为 1α1-\alpha 的置信区间 [θ^1,θ^2]\left[\hat{\theta}_1, \hat{\theta}_2\right]

置信上下限

同等置信区间定义1

如对给定的 α(0<α<1)\alpha(0<\alpha<1), 对任意的 θΘ\theta \in \Theta, 有

Pθ(θ^1θθ^2)=1α,P_\theta\left(\hat{\theta}_1 \leqslant \theta \leqslant \hat{\theta}_2\right)=1-\alpha,

则称 [θ^1,θ^2]\left[\hat{\theta}_1, \hat{\theta}_2\right]θ\theta1α1-\alpha 同等置信区间.

在一些实际问题中, 人们感兴趣的有时仅仅是未知参数的一个下限或一个上限.譬如, 对某种产品的平均寿命来说, 我们希望它越大越好, 因此人们关心的是它的 0.90置信下限是多少, 此下限标志了该产品的质量, 它的一般定义如下.

置信上限定义2

若有统计量 θˉ=θˉ(X1,,Xn)\bar{\theta}=\bar{\theta}\left(X_1, \cdots, X_n\right) ,使得 Pθ(θθˉ)1α,θΘP_\theta(\theta \leq \bar{\theta}) \geq 1-\alpha, \theta \in \Theta 则称 (,θˉ(X1,,Xn)]\left(-\infty, \bar{\theta}\left(X_1, \cdots, X_n\right)\right]θ\theta 的单侧 1α1-\alpha 置信区间, θˉ(X1,,Xn)\bar{\theta}\left(X_1, \cdots, X_n\right)θ\theta 的单侧 1α1-\alpha 置信上限.

置信下限定义3

若有统计量 θ=θ(X1,,Xn)\underline{\theta}=\underline{\theta}\left(X_1, \cdots, X_n\right) ,使得 Pθ(θθ)1α,θΘP_\theta(\theta \geq \underline{\theta}) \geq 1-\alpha, \theta \in \Theta 则称 [θ(X1,,Xn),+)\left[\underline{\theta}\left(X_1, \cdots, X_n\right),+\infty\right)θ\theta 的单侧 1α1-\alpha 置信区间, θ(X1,,Xn)\underline{\theta}\left(X_1, \cdots, X_n\right)θ\theta 的单侧 1α1-\alpha 置信下限.

9._置信区间 - 概率论与数理统计 | OpenTech