3._正态检验-均值检验_Z检验_U检验_t检验

正态检验主要检验μ\muσ2\sigma^2 他们共有四种情况: (1) σ2\sigma^2 已知,对 μ\mu 的检验(称做Z检验法或U检验法) (2) σ2\sigma^2 未知,对 μ\mu 的检验(称做T检验法) (3) μ\mu 已知,对σ2\sigma^2的检验 (这种情况极少使用) (4)μ\mu 未知,对σ2\sigma^2的检验(称作χ2\chi^2 开方检验)

本节介绍均值,下一节介绍方差。

正态检验

由于实际问题中大多数随机变量服从或近似服从正态分布,所以正态检验与正态分布基本上是等价的,且计算分位数或查相应的分布表比较方便。我们把这种利用服从标准正态分布统计量的检验方法称为正态检验。

正态检验功能强大,内容繁多下表列出主要公式,并介绍常见的几种检验方法。

双边检验与单边检验

在假设检验中,H0:μ=μ0H_0: \mu=\mu_0 ,备择假设 H1:μμ0H_1: \mu \neq \mu_0 的意思是 μ\mu 可能大于 μ0\mu_0 ,也可能小于 μ0\mu_0 ,称为双边备择假设,并称形如H0:μ=μ0,H1:μμ0H_0: \mu=\mu_0, H_1: \mu \neq \mu_0 的假设检验为双边检验.但有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的总体均值大,则可考虑采用新工艺。此时,我们需要检验假设:

H0:μμ0;H1:μ>μ0....(8.5)H_0: \mu \leqslant \mu_0 ; H_1: \mu>\mu_0 . ...(8.5)

形如(8.5)式的假设检验,称为右边检验。 类似地,有时我们需要检验假设:

H0:μμ0;H1:μ<μ0...(8.6)H_0: \mu \geqslant \mu_0 ; H_1: \mu<\mu_0 ...(8.6)

形如(8.6)式的假设检验,称为左边检验.右边检验与左边检验统称为单边检验

本章内容一定要配合例题来理解

1.σ2\sigma^2 已知,关于 μ\mu 的检验 (U检验或Z检验)

首先考虑以下假设检验.

(1)双侧检验-检验假设

H0:μ=μ0;H1:μμ0 ( μ0 为已知常数). H_0: \mu=\mu_0 ; H_1: \mu \neq \mu_0 \text { ( } \mu_0 \text { 为已知常数). }

H0H_0 为真时,由定理可知

Z=Xˉμ0σ/nN(0,1),Z=\frac{\bar{X}-\mu_0}{\sigma / \sqrt{n}} \sim N(0,1),

故选取 ZZ 作为检验统计量,记其观察值为 zz ,相应的检验法称为 ZZ 检验法UU检验法. 因为 Xˉ\bar{X}μ\mu 的无偏估计量,当 H0H_0 成立时, xˉ\bar{x} 应接近 μ0\mu_0 ,即 z|z| 不应太大,当 H1H_1 成立时, xˉ\bar{x}μ0\mu_0 有较大的偏差,即 z|z| 有偏大的趋势,故拒绝域形式为

z=xˉμ0σ/nk(k 待定 ).|z|=\left|\frac{\bar{x}-\mu_0}{\sigma / \sqrt{n}}\right| \geqslant k \quad(k \text { 待定 }) .

对于给定的显著性水平 α\alpha ,有

P{Zzα/2}=α.P\left\{|Z| \geqslant z_{\alpha / 2}\right\}=\alpha .

如图所示,拒绝域为

图片

z=xˉμ0σ/nzα/2,|z|=\left|\frac{\bar{x}-\mu_0}{\sigma / \sqrt{n}}\right| \geqslant z_{\alpha / 2},

W={zzα/2}W=\left\{|z| \geqslant z_{\alpha / 2}\right\}

根据一次抽样后得到的样本观察值 x1,x2,,xnx_1, x_2, \cdots, x_n 计算出 ZZ 的观察值 zz ,若 zzα/2|z| \geqslant z_{\alpha / 2} ,则拒绝原假设 H0H_0 ,即认为总体均值与 μ0\mu_0 有显著差异;若 z<zα/2|z|<z_{\alpha / 2} ,则接受原假设 H0H_0 ,即认为总体均值与 μ0\mu_0 无显著差异。

类似地推导,对单侧检验有:

(2)单侧检验-检验假设

H0:μμ0;H1:μ<μ0H_0: \mu \geqslant \mu_0 ; \quad H_1: \mu<\mu_0

图片{width=455px}

对应的拒绝域为

W={zzα}W=\left\{z \leqslant-z_\alpha\right\}

(3)单侧检验-检验假设

H0:μμ0;H1:μ>μ0H_0: \mu \leqslant \mu_0 ; \quad H_1: \mu>\mu_0

对应的拒绝域为

W={zzα}W=\left\{z \geqslant z_\alpha\right\}

下面的例题对上面进行了解释。

某车间生产钢丝,用 XX 表示钢丝的折断力,由经验判断 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,其中 μ=570,σ2=82\mu=570, \sigma^2=8^2 ;今换了一批材料,从性能上看估计折断力的方差 σ2\sigma^2 不会有什么变化(仍有 σ2=82\sigma^2=8^2 ),但不知折断力的均值 μ\mu 和原先有无差别。现抽得样本,测得其折断力为

578572570568572570570572596584\begin{array}{llllllllll} 578 & 572 & 570 & 568 & 572 & 570 & 570 & 572 & 596 & 584 \end{array}

α=0.05\alpha=0.05 ,试检验折断力均值有无变化. 解:

题目已经知道了方差,要判断钢丝断裂里的均值μ\mu是否等于570,此时就做两个假设:假设钢丝断裂的力为570和不是570,然后根据断裂力为570构建正态分布,推导看有没有矛盾。

(1)建立假设 H0:μ=μ0=570,H1:μ570H_0: \mu=\mu_0=570, H_1: \mu \neq 570 . (2)根据正态抽样, 选择统计量 Z=Xˉμ0σ/nN(0,1)Z=\frac{\bar{X}-\mu_0}{\sigma / \sqrt{n}} \sim N(0,1) . (3)对于给定的显著性水平 α\alpha ,确定 kk ,使 P{Z>k}=αP\{|Z|>k\}=\alpha

显著性水平α\alpha,在 枢轴变量 曾经说过,我们总是把α\alpha一分为二进行处理,所以左侧阴影面积为 0.025

但是,这个面积直接查找正态分布表里是没有的,根据对称性我们其实是查找的0.975的面积,他对应的值为 1.96,详见 置信区间与上a分位数

图片

现在切换到正态分布视图,查正态分布表k=zα/2=z0.025=1.96k=z_{\alpha / 2}=z_{0.025}=1.96 ,从而拒绝域为 z>1.96|z|>1.96

(4)由于 xˉ=110i=110xi=575.20,σ2=64\bar{x}=\frac{1}{10} \sum_{i=1}^{10} x_i=575.20, \sigma^2=64 ,所以

z=xˉμ0σ/n=2.06>1.96,|z|=\left|\frac{\bar{x}-\mu_0}{\sigma / \sqrt{n}}\right|=2.06>1.96,

故应拒绝 H0H_0 ,即认为折断力的均值发生了变化.

已知某炼铁厂铁水含碳量服从正态分布 N(4.5,0.12)N\left(4.5,0.1^2\right) .今年采用一种新工艺,现测定了 9 炉铁水,其平均含碳量为 4.56.若估计方差没有变化,则现在生产的铁水平均含碳量较上年有无显著性变化(显著性水平 α=0.05\alpha=0.05 )?

解 提出假设:

H0:μ=μ0=4.5;H1:μμ0=4.5.H_0: \mu=\mu_0=4.5 ; H_1: \mu \neq \mu_0=4.5 .

选取统计量 Z=Xμ0σ/nZ=\frac{X-\mu_0}{\sigma / \sqrt{n}} ,若 H0H_0 为真,则 ZN(0,1)Z \sim N(0,1) 。 一方面,对于 α=0.05\alpha=0.05 ,查表,得 zα2=z0,025=1.96z_{\frac{\alpha}{2}}=z_{0,025}=1.96 .另一方面,计算统计量 ZZ 的观察值,有

z0=xˉμ0σ/n=4.564.50.1/9=1.8<1.96.\left|z_0\right|=\left|\frac{\bar{x}-\mu_0}{\sigma / \sqrt{n}}\right|=\left|\frac{4.56-4.5}{0.1 / \sqrt{9}}\right|=1.8<1.96 .

由于 z0<zα2\left|z_0\right|<z_{\frac{\alpha}{2}} ,因此,不能拒绝原假设 H0H_0 ,即不能认为铁水平均含碳量较上年有显著性变化.

方差 σ2\sigma^2 末知,关于 μ\mu 的假设检验( TT 检验,TT-test)

(1)双侧检验-检验假设

H0:μ=μ0;H1:μμ0 ( μ0 为已知常数) H_0: \mu=\mu_0 ; H_1: \mu \neq \mu_0 \text { ( } \mu_0 \text { 为已知常数) }

由统计分布知,当 H0H_0 为真时,

T=Xˉμ0S/nt(n1)T=\frac{\bar{X}-\mu_0}{S / \sqrt{n}} \sim t(n-1)

故选取 TT 作为检验统计量,记其观察值为 tt .相应的检验法称为 TT 检验法. 由于 Xˉ\bar{X}μ\mu 的无偏估计量,S2S^2σ2\sigma^2 的无偏估计量,当 H0H_0 成立时,t|t| 不应太大,当 H1H_1成立时,t|t| 有偏大的趋势,故拒绝域形式为

t=xˉμ0s/nk(k 待定 )|t|=\left|\frac{\bar{x}-\mu_0}{s / \sqrt{n}}\right| \geqslant k \quad(k \text { 待定 })

对于给定的显著性水平 α\alpha ,有

P{Ttα/2(n1)}=αP\left\{|T| \geqslant t_{\alpha / 2}(n-1)\right\}=\alpha

如图所示,拒绝域为

图片

t=xˉμ0s/ntα/2(n1)|t|=\left|\frac{\bar{x}-\mu_0}{s / \sqrt{n}}\right| \geqslant t_{\alpha / 2}(n-1)

W={ttα/2(n1)}W=\left\{|t| \geqslant t_{\alpha / 2}(n-1)\right\}

根据一次抽样后得到的样本观察值 x1,x2,,xnx_1, x_2, \cdots, x_n 计算出 TT 的观察值 tt ,若 ttα/2(n1)|t| \geqslant t_{\alpha / 2}(n-1) ,则拒绝原假设 H0H_0 ,即认为总体均值与 μ0\mu_0 有显著差异;若 t<tα/2(n1)|t|<t_{\alpha / 2}(n-1) ,则接受原假设 H0H_0 ,即认为总体均值与 μ0\mu_0 无显著差异。

类似地推导,对单侧检验有:

(2)单侧检验-检验假设

H0:μμ0;H1:μ<μ0H_0: \mu \geqslant \mu_0 ; H_1: \mu<\mu_0

图片

对应的拒绝域为

W={tt1α(n1)}W=\left\{t \leqslant t_{1-\alpha}(n-1)\right\}

###(3)单侧检验-检验假设

H0:μμ0;H1:μ>μ0H_0: \mu \leqslant \mu_0 ; H_1: \mu>\mu_0

对应的拒绝域为

W={ttα(n1)}W=\left\{t \geqslant t_\alpha(n-1)\right\}

水泥厂用自动包装机包装水泥,每袋额定质量是 50 kg ,某日开工后随机抽查了 9 袋,称得质量如下

49.649.350.150.049.249.949.851.050.2\begin{array}{lllllllll} 49.6 & 49.3 & 50.1 & 50.0 & 49.2 & 49.9 & 49.8 & 51.0 & 50.2 \end{array}

设每袋质量服从正态分布,问包装机工作是否正常 (α=0.05)(\alpha=0.05) ? 解(1)建立假设 H0:μ=50,H1:μ50H_0: \mu=50, H_1: \mu \neq 50 . (2)选择统计量 T=Xˉμ0S/nt(n1)T=\frac{\bar{X}-\mu_0}{S / \sqrt{n}} \sim t(n-1) . (3)对于给定的显著性水平 α\alpha ,确定 kk ,使 P{T>k}=αP\{|T|>k\}=\alpha . 查附录 D 得 k=tα/2=t0.025(8)=2.306k=t_{\alpha / 2}=t_{0.025}(8)=2.306 ,从而拒绝域为 t>2.306|t|>2.306 . (4)由于 xˉ=49.9,s2=0.29\bar{x}=49.9, s^2=0.29 ,所以

t=xˉ50s/n=0.56<2.306|t|=\left|\frac{\bar{x}-50}{s / \sqrt{n}}\right|=0.56<2.306

故应接受H0H_0 ,即认为包装机工作正常

设某工厂生产的电灯泡的使用寿命用 XX 表示,假定 XX 服从正态分布 N(μ,σ2)N\left(\mu, \sigma^2\right) ,其中 μ\muσ2\sigma^2 都是未知参数。现抽取 20 个灯泡,测得其使用寿命分别为 x1,x2,,x20x_1, x_2, \cdots, x_{20} ,并由此算得 xˉ=1880,s=197\bar{x}=1880, s=197 。"该厂电灯泡的平均使用寿命为 μ=2000\mu=2000"这一结论是否成立(显著性水平 α=0.05\alpha=0.05 )?

解 考虑检验假设:

H0:μ=μ0=2000;H1:μμ0=2000.H_0: \mu=\mu_0=2000 ; H_1: \mu \neq \mu_0=2000 .

选取统计量

T=Xˉμ0S/nT=\frac{\bar{X}-\mu_0}{S / \sqrt{n}}

H0H_0 为真时,Tt(n1)T \sim t(n-1)TT 的观察值为

t0=xˉμ0s/n=18802000197/202.72.\left|t_0\right|=\left|\frac{\bar{x}-\mu_0}{s / \sqrt{n}}\right|=\left|\frac{1880-2000}{197 / \sqrt{20}}\right| \approx 2.72 .

对于给定的显著性水平 α=0.05\alpha=0.05 ,查表,得 t0.025(19)=2.093t_{0.025}(19)=2.093 . 由于 t02.72>t0.025(19)\left|t_0\right| \approx 2.72>t_{0.025}(19) ,因此,应拒绝 H0H_0 即不能认为 μ=2000\mu=2000

例题

某仪器厂生产的仪表圆盘,其标准直径应为 20( mm)20(\mathrm{~mm}) ,在正常情况下,仪表圆盘直径服从正态分布 N(20,1)N(20,1) .为了检查该厂某天生产是否正常,对生产过程中的仪表圆盘随机地抽查了 5 个,测得直径分别为

19,19.5,19,20,20.5,19,19.5,19,20,20.5,

若显著性水平 α=0.05\alpha=0.05 ,问:该天生产是否正常? 解 由题意,要检查生产是否正常,实际上就是检验直径均值是否为 20 . 因此,建立假设 H0:μ=20,H1:μ20H_0: \mu=20, H_1: \mu \neq 20 。 当 H0H_0 成立时,检验的统计量

U=Xˉ20σnN(0,1).U=\frac{\bar{X}-20}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1) .

当显著性水平 α=0.05\alpha=0.05 时,拒绝域为 U>u0.025|U|>u_{0.025} ,查正态分布表可得 U>1.96|U|>1.96

由样本值算得 xˉ=19.6\bar{x}=19.6 ,代入检验统计量中可得

u=19.62015=0.8944.u=\frac{19.6-20}{\frac{1}{\sqrt{5}}}=-0.8944 .

因为 u<u0.025=1.96|u|<u_{0.025}=1.96 ,这表明统计量的观测值没有落入拒绝域内,故应接受 H0H_0 ,从而认为该天生产的仪表圆盘的直径均值是 20 ,亦即认为该天的生产是正常的.

葡萄酒中除了水和酒精外,占比最多的就是甘油.甘油是酵母发酵的副产品,它有助于提升葡萄酒的口感和质地,因而经常需要对葡萄酒中的甘油含量进行检测。假设某品牌葡萄酒的甘油含量 X(mg/mL)X(\mathrm{mg} / \mathrm{mL}) 服从正态分布,现随机抽查了 5 个样品,测得它们的甘油含量分别为

2.67,4.62,4.14,3.81,3.832.67,4.62,4.14,3.81,3.83

若显著性水平 α=0.05\alpha=0.05 ,问:是否有理由认为该品牌葡萄酒的平均甘油含量为 4mg/mL4 \mathrm{mg} / \mathrm{mL} ? 解 由题意建立假设 H0:μ=4,H1:μ4H_0: \mu=4, H_1: \mu \neq 4 。 因方差 σ2\sigma^2 未知,故用 TT 检验法,检验统计量为

T=Xˉμ0Snt(n1)T=\frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}} \sim t(n-1)

α=0.05,n=5\alpha=0.05, n=5 时,拒绝域

T>tα2(n1) 为 T>t0.025 (4), 即 T>2.776|T|>t_{\frac{\alpha}{2}}(n-1) \text { 为 }|T|>t_{0.025} \text { (4), 即 }|T|>2.776 \text {. }

由样本值算得 xˉ=3.814,s=0.718\bar{x}=3.814, s=0.718 ,代入检验统计量中可得

t=3.81440.321=0.58t=\frac{3.814-4}{0.321}=-0.58

因为 t=0.58<2.776|t|=0.58<2.776 ,故接受 H0H_0 ,即可以认为该品牌葡萄酒的平均甘油含量为 4mg/mL4 \mathrm{mg} / \mathrm{mL}

附表

图片