4._正态检验-方差检验_卡方χ2检验

正态检验主要检验μ\muσ2\sigma^2 他们共有四种情况: (1) σ2\sigma^2 已知,对 μ\mu 的检验(称做Z检验法或U检验法) (2) σ2\sigma^2 未知,对 μ\mu 的检验(称做T检验法) (3) μ\mu 已知,对σ2\sigma^2的检验 (这种情况极少使用) (4)μ\mu 未知,对σ2\sigma^2的检验(称作χ2\chi^2 开方检验)

本节介绍方差,上一节介绍均值。

正态检验-方差检验(卡方χ2χ^2检验)

双边检验与单边检验

在假设检验中,H0:μ=μ0H_0: \mu=\mu_0 ,备择假设 H1:μμ0H_1: \mu \neq \mu_0 的意思是 μ\mu 可能大于 μ0\mu_0 ,也可能小于 μ0\mu_0 ,称为双边备择假设,并称形如H0:μ=μ0,H1:μμ0H_0: \mu=\mu_0, H_1: \mu \neq \mu_0 的假设检验为双边检验.但有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的总体均值大,则可考虑采用新工艺。此时,我们需要检验假设:

H0:μμ0;H1:μ>μ0....(8.5)H_0: \mu \leqslant \mu_0 ; H_1: \mu>\mu_0 . ...(8.5)

形如(8.5)式的假设检验,称为右边检验。 类似地,有时我们需要检验假设:

H0:μμ0;H1:μ<μ0...(8.6)H_0: \mu \geqslant \mu_0 ; H_1: \mu<\mu_0 ...(8.6)

形如(8.6)式的假设检验,称为左边检验.右边检验与左边检验统称为单边检验

方差检验

XN(μ,σ2),X1,X2,,XnX \sim N\left(\mu, \sigma^2\right), X_1, X_2, \cdots, X_n 是取自 XX 的样本, Xˉ\bar{X}S2S^2 分别为样本均值与样本方差.关于正态方差 σ2\sigma^2 的检验问题,本章讨论如下三种常用形式:

(1)H0:σ2=σ02,H1:σ2σ02H_0: \sigma^2=\sigma_0^2, H_1: \sigma^2 \neq \sigma_0^2 (2)H0:σ2σ02,H1:σ2<σ02H_0: \sigma^2 \geqslant \sigma_0^2, H_1: \sigma^2<\sigma_0^2 (3)H0:σ2σ02,H1:σ2>σ02H_0: \sigma^2 \leqslant \sigma_0^2, H_1: \sigma^2>\sigma_0^2

1. μ\mu未知, H0:σ2=σ02,H1:σ2σ02H_0: \sigma^2=\sigma_0^2, H_1: \sigma^2 \neq \sigma_0^2

设总体 XN(μ,σ2),μX \sim N\left(\mu, \sigma^2\right), \mu 未知,检验假设:

H0:σ2=σ02;H1:σ2σ02H_0: \sigma^2=\sigma_0^2 ; H_1: \sigma^2 \neq \sigma_0^2

其中 σ02\sigma_0^2 为已知常数. 由于样本方差 S2S^2σ2\sigma^2 的无偏估计量,因此,当 H0H_0 为真时,比值 S2σ02\frac{S^2}{\sigma_0^2} 一般来说应在 1 附近摆动,而不应过分大于 1 或过分小于 1 。因为正态抽样 ,知当 H0H_0 为真时,

χ2=(n1)S2σ02χ2(n1)\chi^2=\frac{(n-1) S^2}{\sigma_0^2} \sim \chi^2(n-1)

所以对于给定的显著性水平 α\alpha ,有(见下图) 图片

又因对于给定的 α\alpha ,查 χ2\chi^2 分布表(见附表),可求得 χ2\chi^2 分布的分位点 χ1α22(n1)\chi_{1-\frac{\alpha}{2}}^2(n-1)χα22(n1)\chi_{\frac{\alpha}{2}}^2(n -1) ,故 H0H_0 的接受域为

χ1α22(n1)χ2χα22(n1);\chi_{1-\frac{\alpha}{2}}^2(n-1) \leqslant \chi^2 \leqslant \chi_{\frac{\alpha}{2}}^2(n-1) ;

H0H_0 的拒绝域为

χ2<χ1α22(n1) 或 χ2>χα22(n1)\chi^2<\chi_{1-\frac{\alpha}{2}}^2(n-1) \text { 或 } \chi^2>\chi_{\frac{\alpha}{2}}^2(n-1) \text {. }

这种用服从 χ2\chi^2 分布的统计量对单个正态总体方差进行假设检验的方法,称为 χ2\chi^2 检验法.

已知维尼纶的纤度在正常条件下服从正态分布 N(μ,0.0482)N\left(\mu, 0.048^2\right) 。某日从中随机抽取 5 根,测得其纤度分别为 1.32,1.55,1.36,1.40,1.441.32,1.55,1.36,1.40,1.44 。这一天的维尼纶纤度总体标准差是否正常 (显著性水平 α=0.05\alpha=0.05 )?

解 待检假设为

H0:σ2=σ02=0.0482;H1:σ2σ02=0.0482.H_0: \sigma^2=\sigma_0^2=0.048^2 ; H_1: \sigma^2 \neq \sigma_0^2=0.048^2 .

n=5,α=0.05n=5, \alpha=0.05 ,查表,得 χ0.0252(4)=11.143,χ0.9752(4)=0.484\chi_{0.025}^2(4)=11.143, \chi_{0.975}^2(4)=0.484 . 于是,知其拒绝域为

(n1)S2σ02>11.143 或 (n1)S2σ02<0.484.\frac{(n-1) S^2}{\sigma_0^2}>11.143 \text { 或 } \frac{(n-1) S^2}{\sigma_0^2}<0.484 .

而由样本观察值,得

(n1)s2σ0213.51>11.143.\frac{(n-1) s^2}{\sigma_0^2} \approx 13.51>11.143 .

故拒绝 H0H_0 ,即认为这一天的维尼纶纤度总体标准差不正常.

某供货商声称他们提供的金属线的质量非常稳定,其抗拉强度的方差为 9 。为了检测抗拉强度,在该金属线中随机地抽出 10 根,测得样本标准差 s=4.5( kg)s=4.5(\mathrm{~kg}) ,设该金属线的抗拉强度服从正态分布 N(μ,σ2)N\left(\mu, \sigma^2\right) ,若显著性水平为 α=0.05\alpha=0.05 ,问:是否可以相信该供货商的说法?

解 由题意知,要检验假设 H0:σ2=9,H1:σ29H_0: \sigma^2=9, H_1: \sigma^2 \neq 9 . 因为 μ\mu 末知,故检验统计量为 χ2=(n1)S2σ02χ2(n1)\chi^2=\frac{(n-1) S^2}{\sigma_0^2} \sim \chi^2(n-1) . 拒绝域为

χ2>χα22(n1) 或 χ2<χ1α22(n1)\chi^2>\chi_{\frac{\alpha}{2}}^2(n-1) \text { 或 } \chi^2<\chi_{1-\frac{\alpha}{2}}^2(n-1) \text {. }

这里 n=10,α=0.05,χα22(n1)=χ0.0252(9)=19.02,χ1α22(n1)=χ0.9752(9)=2.70n=10, \alpha=0.05, \chi_{\frac{\alpha}{2}}^2(n-1)=\chi_{0.025}^2(9)=19.02, \chi_{1-\frac{\alpha}{2}}^2(n-1)=\chi_{0.975}^2(9)=2.70 . 由样本标准差 s=4.5s=4.5 ,算得

χ2=9×4.529=20.25.\chi^2=\frac{9 \times 4.5^2}{9}=20.25 .

因为 χ2=20.25>19.02\chi^2=20.25>19.02 ,根据 χ2\chi^2 检验法应拒绝 H0H_0 ,即不相信该供货商的说法.

μ\mu未知,单边检验(右边检验或左边检验)

设总体 XN(μ,σ2),μX \sim N\left(\mu, \sigma^2\right), \mu 未知,检验假设(右边检验):

H0:σ2σ02;H1:σ2>σ02H_0: \sigma^2 \leqslant \sigma_0^2 ; H_1: \sigma^2>\sigma_0^2

由于 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,因此,随机变量

χ2=(n1)S2σ2χ2(n1),\chi^{* 2}=\frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1),

故对于给定的显著性水平 α\alpha ,有(见图 ).

图片

P{χ2>χα2(n1)}=α.P\left\{\chi^{*^2}>\chi_{\alpha}^2(n-1)\right\}=\alpha .

因为当 H0H_0 为真时,统计量

χ2=(n1)S2σ02χ2,\chi^2=\frac{(n-1) S^2}{\sigma_0^2} \leqslant \chi^{* 2},

所以有

P{χ2>χα2(n1)}P{χ2>χα2(n1)}=α.P\left\{\chi^2>\chi_{\alpha}^2(n-1) \right\} \leqslant P\left\{\chi^{* 2}>\chi_\alpha^2(n-1)\right\}=\alpha .

可见,当 α\alpha 很小时,{χ2>χα2(n1)} \left\{\chi^2 > \chi_{\alpha}^2(n-1)\right\} 是小概率事件,在一次抽样中认为不可能发生,所以 H0H_0 的拒绝域是

χ2=(n1)S2σ02>χa2(n1) (右边检验). \chi^2=\frac{(n-1) S^2}{\sigma_0^2}>\chi_a^2(n-1) \text { (右边检验). }

类似地,可得左边检验假设:H0:σ2σ02;H1:σ2<σ02H_0: \sigma^2 \geqslant \sigma_0^2 ; H_1: \sigma^2<\sigma_0^2 的拒绝域为

χ2<χ1α2(n1) (左边检验). \chi^2<\chi_{1-\alpha}^2(n-1) \text { (左边检验). }

设某种零件的验收标准为长度均值为 10 mm ,标准差小于 0.02 mm .从某厂的一批零件中随机抽出 12 件进行检验,得到如下数据:

9.98,10,9.97,10.05,10.01,9.95,9.99,10.03,10,9.96,10.02,10.03.\begin{aligned} & 9.98,10,9.97,10.05,10.01,9.95, \\ & 9.99,10.03,10,9.96,10.02,10.03 . \end{aligned}

已知零件长度服从正态分布.这批零件是否合格(显著性水平 α=0.05\alpha=0.05 )? 解 由合格需要两个条件:μ=10\mu=10σ<0.02\sigma<0.02 ,知 xˉ9.9992,s0.0306\bar{x} \approx 9.9992, s \approx 0.0306 . 先检验假设:

H0:μ=10;H1:μ10.H_0: \mu=10 ; H_1: \mu \neq 10 .

此时方差未知,使用 tt 检验法.查自由度为 11 的 tt 分布表,得 t0,025(11)=2.201t_{0,025}(11)=2.201 .计算统计量的观察值,得

t0=9.9992100.0306/120.0906t_0=\frac{9.9992-10}{0.0306 / \sqrt{12}} \approx-0.0906

t0<2.201\left|t_0\right|<2.201 ,故不能拒绝原假设 H0:μ=10H_0: \mu=10 ,即零件的平均长度是合格的. 下面再检验假设:

H0:σ<0.02;H1:σ0.02.H_0: \sigma<0.02 ; H_1: \sigma \geqslant 0.02 .

查自由度为 11 的 χ2\chi^2 分布表,得 χ0.052(11)=19.675\chi_{0.05}^2(11)=19.675 .计算统计量的观察值,得

χ02=11×0.030620.02225.75.\chi_0^2=\frac{11 \times 0.0306^2}{0.02^2} \approx 25.75 .

χ02>χ0,052(11)\chi_0^2>\chi_{0,05}^2(11) ,即 χ02\chi_0^2 落人拒绝域内,故拒绝原假设,即不能认为这批零件长度的标准差小于 0.02 mm 。因此,这批零件不合格。

某供货商声称他们提供的金属线的质量非常稳定,其抗拉强度的方差为 9 .为了检测抗拉强度,在该金属线中随机地抽出 10 根,测得样本标准差 s=4.5( kg)s=4.5(\mathrm{~kg}) ,设该金属线的抗拉强度服从正态分布 N(μ,σ2)N\left(\mu, \sigma^2\right) ,若显著性水平为 α=0.05\alpha=0.05 ,问:是否可以相信该供货商的说法?

解 由题意知,要检验假设 H0:σ2=9,H1:σ29H_0: \sigma^2=9, H_1: \sigma^2 \neq 9 . 因为 μ\mu 末知,故检验统计量为 χ2=(n1)S2σ02χ2(n1)\chi^2=\frac{(n-1) S^2}{\sigma_0^2} \sim \chi^2(n-1) . 拒绝域为

χ2>χα22(n1) 或 χ2<χ1α22(n1)\chi^2>\chi_{\frac{\alpha}{2}}^2(n-1) \text { 或 } \chi^2<\chi_{1-\frac{\alpha}{2}}^2(n-1) \text {. }

这里 n=10,α=0.05,χα22(n1)=χ0.0252(9)=19.02,χ1α22(n1)=χ0.9752(9)=2.70n=10, \alpha=0.05, \chi_{\frac{\alpha}{2}}^2(n-1)=\chi_{0.025}^2(9)=19.02, \chi_{1-\frac{\alpha}{2}}^2(n-1)=\chi_{0.975}^2(9)=2.70 . 由样本标准差 s=4.5s=4.5 ,算得

χ2=9×4.529=20.25\chi^2=\frac{9 \times 4.5^2}{9}=20.25

因为 χ2=20.25>19.02\chi^2=20.25>19.02 ,根据 χ2\chi^2 检验法应拒绝 H0H_0 ,即不相信该供货商的说法.

某厂生产的某种型号的电池,其寿命(以小时计)长期以来服从方差 σ2=5000\sigma^2=5000的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变.现随机取 26 只电池,测出其寿命的样本方差 s2=9200s^2=9200 .问根据这一数据,能否推断这批电池的寿命的波动性较以往的有显著的变化(取 α=0.02\alpha=0.02 )?

解(1)提出假设 H0:σ=5000,H1:σ25000H_0: \sigma=5000, H_1: \sigma^2 \neq 5000 . (2)选取统计量

χ2=(n1)s2σ02\chi^2=\frac{(n-1) s^2}{\sigma_0^2}

H0H_0 为真,则 χ2χ2(n1)\chi^2 \sim \chi^2(n-1) . (3)对给定的显著性水平 α=0.02\alpha=0.02 ,求 χ1α/22(n1)χα/22(n1)\chi_{1-\alpha / 2}^2(n-1) 、 \chi_{\alpha / 2}^2(n-1) 使

P{χ2χ1α/22(n1)}=α2P{χ2χα/22(n1)}=α2\begin{aligned} & P\left\{\chi^2 \leqslant \chi_{1-\alpha / 2}^2(n-1)\right\}=\frac{\alpha}{2} \\ & P\left\{\chi^2 \geqslant \chi_{\alpha / 2}^2(n-1)\right\}=\frac{\alpha}{2} \end{aligned}

这里 χα/22(n1)=χ0.012(25)=44.314,χ1α/22(n1)=χ0.992(25)=11.524\chi_{\alpha / 2}^2(n-1)=\chi_{0.01}^2(25)=44.314, \quad \chi_{1-\alpha / 2}^2(n-1)=\chi_{0.99}^2(25)=11.524 . (4)计算统计量 χ2\chi^2 的观察值,代入观察值 s2=9200s^2=9200 ,得

χ2=(n1)s2σ02=46\chi^2=\frac{(n-1) s^2}{\sigma_0^2}=46

(5)判断:由于 46>44.31446>44.314 ,所以在显著性水平 α=0.02\alpha=0.02 下拒绝 H0H_0 ,认为这批电池寿命的波动性较以往有显著的变化.

某工厂生产金属丝,产品指标为折断力.折断力的方差用来表征工厂生产精度.方差越小,表明精度越高.以往工厂一直把该方差保持在 64( kg2)64\left(\mathrm{~kg}^2\right) 或 64 以下.最近从一批产品中抽取 10 根做折断力试验,测得的结果(单位: kg )如下

578,572,570,568,572,570,572,596,584,570.578,572,570,568,572,570,572,596,584,570 .

由上述样本数据算得:

xˉ=575.2,s2=75.74\bar{x}=575.2, \quad s^2=75.74

为此,厂方怀疑金属丝折断力的方差是否变大了.如确实增大了,表明生产精度不如以前,就需对生产流程做一番检验,以发现生产环节中存在的问题(显著性水平 α=0.05\alpha=0.05 ). 解 为确认上述疑虑是否为真,假定多金属丝折断力服从正态分布,并做下述假设检验: H0:σ264, H1:σ2>64H_0: \sigma^2 \leqslant 64, ~ H_1: \sigma^2>64.

上述假设检验问题可利用 χ2\chi^2 检验法的右侧检验法来检验,就本例而言,相应于 σ02=64\sigma_0^2=64n=10n=10

对于给定的显著性水平 α=0.05\alpha=0.05 ,查附录知

χα2(n1)=χ0.052(9)=16.919.\chi_\alpha^2(n-1)=\chi_{0.05}^2(9)=16.919 .

从而有 χ2=n1σ02s2=9×75.7464=10.6516.919=χ0.052\chi^2=\frac{n-1}{\sigma_0^2} s^2=\frac{9 \times 75.74}{64}=10.65 \leqslant 16.919=\chi_{0.05}^2 ,故不能拒绝原假设 H0H_0 ,从而认为样本方差的偏大是偶然因素,生产流程正常,故不需再做进一步检查.

一位生物学家研究生活在高原上的某一甲虫, 从高原上采集了 n=20n=20 个高山甲虫,以考察高山上的该甲虫是否不同于平原上的该甲虫,其中度量方法之一是翅膀上黑斑的长度. 已知平原甲虫黑斑长度服从期望 μ0=3.14mm\mu_0=3.14 mm ,方差 σ02=0.0505mm2\sigma_0^2=0.0505 mm^2 的正态分布,从高山上甲虫样本得到的黑斑长度 xˉ=3.23mm,s=0.4mm\bar{x}=3.23 mm, s=0.4 mm ,假定高山甲虫黑斑长度服从正态分布 N(μ,σ2)N\left(\mu, \sigma^2\right), 在显著性水平 α=0.05\alpha=0.05 下分别进行下列检验: (1) H0:μ=3.14H1:μ3.14H_0: \mu=3.14 \leftrightarrow H_1: \mu \neq 3.14; (2) H0:σ2=0.0505mm2H1:σ20.0505mm2H_0: \sigma^2=0.0505 mm^2 \leftrightarrow H_1: \sigma^2 \neq 0.0505 mm^2.

解 (1) 取检验统计量 T=n(Xˉ3.14)ST=\frac{\sqrt{n}(\bar{X}-3.14)}{S}, 拒绝域为

W={T>t1α/2(n1)}.W=\left\{|T|>t_{1-\alpha / 2}(n-1)\right\} .

t1α/2(n1)=t0.975(19)=2.093t_{1-\alpha / 2}(n-1)=t_{0.975}(19)=2.093. 计算 tt 检验统计量的观测值为

t=20(3.233.14)0.4=0.98<2.093.t=\frac{\sqrt{20}(3.23-3.14)}{0.4}=0.98 < 2.093 .

因而不能拒绝 H0H_0, 认为在显著水平 α=0.05\alpha=0.05 下, 高山甲虫的黑斑长度的均值是 3.14 mm .

(2)取检验统计量 χ2=(n1)S20.0505\chi^2=\frac{(n-1) S^2}{0.0505} ,拒绝域为

W={χ2>χ1α/22(n1) 或 χ2<χα/22(n1)},W=\left\{\chi^2 > \chi_{1-\alpha / 2}^2(n-1) \text { 或 } \chi^2 < \chi_{\alpha / 2}^2(n-1)\right\},

查附录 可得 χ0.9752(19)=32.852,χ0.0252(19)=8.907\chi_{0.975}^2(19)=32.852, \chi_{0.025}^2(19)=8.907 ,计算 χ2\chi^2 检验统计量的观测值为

χ2=190.420.0505=60.1980>32.852.\chi^2=\frac{19 \cdot 0.4^2}{0.0505}=60.1980 > 32.852 .

因而拒绝 H0H_0 ,认为在显著性水平 α=0.05\alpha=0.05 下,高山甲虫的黑斑长度的方差不再是 0.0505mm20.0505 mm^2

μ\mu 已知,方差的检验

以上讨论的是在均值未知的情况下对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为

χ2=i=1n(Xiμ)2σ02.\chi^2=\frac{\sum_{i=1}^n\left(X_i-\mu\right)^2}{\sigma_0^2} .

σ2=σ02\sigma^2=\sigma_0^2 为真时,χ2χ2(n)\chi^2 \sim \chi^2(n) . 关于单个正态总体的假设检验如附表。

附表

具体见附表

img-text

4._正态检验-方差检验_卡方χ2检验 - 概率论与数理统计 | OpenTech