5._两个正态总体均均值的假设检验_Z检验与t检验

在实际应用当中,我们还常常会遇到两个正态总体的参数比较问题,例如,比较两个品牌的同排量汽车的平均耗油量的优劣;又如,比较两台仪器测量精度的高低,等等.这些问题都可以在单个正态总体参数检验的基础上加以推广。

两个都是正态分布,通常有3种检验类型

(1)σ12,σ22\sigma_1^2, \sigma_2^2 已知,关于均值差 μ1μ2\mu_1-\mu_2 的检验 (2)σ12,σ22\sigma_1^2, \sigma_2^2 末知,但 σ12=σ22\sigma_1^2=\sigma_2^2 ,关于均值差 μ1μ2\mu_1-\mu_2 的检验 (3) μ1,μ2\mu_1, \mu_2 未知,关于方差比 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的检验

本节介绍(1)(2)检验法,下一节介绍(3) 检验法

两个正态总体均值的假设检验

XN(μ1,σ12),YN(μ2,σ22),X1,X2,,Xn1X \sim N\left(\mu_1, \sigma_1^2\right), Y \sim N\left(\mu_2, \sigma_2^2\right), X_1, X_2, \cdots, X_{n_1} 为取自总体 XX 的一个样本,Y1,Y2,,Yn2Y_1, Y_2, \cdots, Y_{n_2} 为取自总体 YY 的一个样本,记 Xˉ\bar{X}Yˉ\bar{Y} 分别为样本 X1,X2,,Xn1X_1, X_2, \cdots, X_{n_1}Y1,Y2,,Yn2Y_1, Y_2, \cdots, Y_{n_2} 的均值,并且两个样本相互独立.关于正态均值 μ1\mu_1μ2\mu_2 的比较,有如下三种检验问题: (1)H0:μ1=μ2,H1:μ1μ2H_0: \mu_1=\mu_2, H_1: \mu_1 \neq \mu_2 (2)H0:μ1μ2,H1:μ1>μ2H_0: \mu_1 \leqslant \mu_2, H_1: \mu_1>\mu_2 (3)H0:μ1μ2,H1:μ1<μ2H_0: \mu_1 \geqslant \mu_2, H_1: \mu_1<\mu_2 等价形式分别为 (1)H0:μ1μ2=0,H1:μ1μ20H_0: \mu_1-\mu_2=0, H_1: \mu_1-\mu_2 \neq 0 (2)H0:μ1μ20,H1:μ1μ2>0H_0: \mu_1-\mu_2 \leqslant 0, H_1: \mu_1-\mu_2>0 (3)H0:μ1μ20,H1:μ1μ2<0H_0: \mu_1-\mu_2 \geqslant 0, H_1: \mu_1-\mu_2<0

1.方差 σ12, σ22\sigma_1^2, ~ \sigma_2^2 已知,关于数学期望的假设检验( ZZ 检验法)

首先考虑双边假设检验。 (1)检验假设

H0:μ1=μ2;H1:μ1μ2H_0: \mu_1=\mu_2 ; \quad H_1: \mu_1 \neq \mu_2

Xˉ\bar{X}Yˉ\bar{Y} 分别为总体 XX 和总体 YY 的样本均值及第 6 章的知识可知

XˉN(μ1,σ12n1),YˉN(μ2,σ22n2)\bar{X} \sim N\left(\mu_1, \frac{\sigma_1^2}{n_1}\right), \quad \bar{Y} \sim N\left(\mu_2, \frac{\sigma_2^2}{n_2}\right)

由两样本独立及期望和方差的性质可得

E(XˉYˉ)=μ1μ2,D(XˉYˉ)=σ12n1+σ22n2E(\bar{X}-\bar{Y})=\mu_1-\mu_2, \quad D(\bar{X}-\bar{Y})=\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}

故随机变量 XˉYˉ\bar{X}-\bar{Y} 也服从正态分布,即

XˉYˉN(μ1μ2,σ12n1+σ22n2)\bar{X}-\bar{Y} \sim N\left(\mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\right)

从而

XˉYˉ(μ1μ2)σ12n1+σ22n2N(0,1)\frac{\bar{X}-\bar{Y}-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)

采用 ZZ 检验方法,选取 ZZ 统计量为

Z=XˉYˉσ12n1+σ22n2Z=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

H0H_0 为真时

Z=XˉYˉσ12n1+σ22n2N(0,1)Z=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)

由于 Xˉ\bar{X}Yˉ\bar{Y} 分别是 μ1\mu_1μ2\mu_2 的无偏估计量,当 H0H_0 为真时, xˉ\bar{x}yˉ\bar{y} 应较为接近,不应太大,若 xˉ\bar{x} 距离 yˉ\bar{y} 较远时,应拒绝 H0H_0 。类似前面的讨论可得此检验问题的拒绝域形式为

W={Zc}.W=\{|Z| \geqslant c\} .

对于给定的显著性水平 α\alpha ,有

P{Zzα/2}=α,P\left\{|Z| \geqslant z_{\alpha / 2}\right\}=\alpha,

由此即得拒绝域为

W={zzα/2}.W=\left\{|z| \geqslant z_{\alpha / 2}\right\} .

根据一次抽样后得到的样本观察值 x1,x2,,xn1x_1, x_2, \cdots, x_{n_1}y1,y2,,yn2y_1, y_2, \cdots, y_{n_2} 计算出 ZZ 的观察值 zz ,若 zzα/2|z| \geqslant z_{\alpha / 2} ,则拒绝原假设 H0H_0 ,即认为总体均值 μ1\mu_1μ2\mu_2 有显著差异;若 z<zα/2|z|<z_{\alpha / 2} ,则接受原假设 H0H_0 ,即认为总体均值 μ1\mu_1μ2\mu_2 无显著差异.

类似地,对单侧检验有: (2)检验假设

H0:μ1μ2,H1:μ1>μ2H_0: \mu_1 \leqslant \mu_2, \quad H_1: \mu_1>\mu_2

对应的拒绝域为

W={zzα}W=\left\{z \geqslant z_\alpha\right\}

(3)检验假设

H0:μ1μ2,H1:μ1<μ2H_0: \mu_1 \geqslant \mu_2, \quad H_1: \mu_1<\mu_2

对应的拒绝域为

W={zzα}.W=\left\{z \leqslant-z_\alpha\right\} .

设甲,乙两厂生产同样的灯泡,其寿命 X, YX, ~ Y 分别服从正态分布 N(μ1,σ12)N\left(\mu_1, \sigma_1^2\right)N(μ2,σ22)N\left(\mu_2, \sigma_2^2\right) ,已知它们寿命的标准差分别为 84 h 和 96 h ,现从两厂生产的灯泡中各取 60 只,测得平均寿命甲厂为 1295 h ,乙厂为 1230 h ,能否认为两厂生产的灯泡寿命无显著差异 ( α=0.05\alpha=0.05 )?

解(1)建立假设 H0:μ1=μ2,H1:μ1μ2H_0: \mu_1=\mu_2, H_1: \mu_1 \neq \mu_2 . (2)选择统计量 Z=XˉYˉσ12n1+σ22n2N(0,1)Z=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) . (3)对于给定的显著性水平 α\alpha ,确定 kk ,使 P{Z>k}=αP\{|Z|>k\}=\alpha 。 查标准正态分布表 k=zα/2=z0.025=1.96k=z_{\alpha / 2}=z_{0.025}=1.96 ,从而拒绝域为 z>1.96|z|>1.96 . (4)由于 xˉ=1295,yˉ=1230,σ1=84,σ2=96\bar{x}=1295, \bar{y}=1230, \sigma_1=84, \sigma_2=96 ,所以

z=xˉyˉσ12n1+σ22n2=3.95>1.96|z|=\left|\frac{\bar{x}-\bar{y}}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\right|=3.95>1.96

故应拒绝 H0H_0 ,即认为两厂生产的灯泡寿命有显著差异。

ZZ 检验法对两正态总体的均值做假设检验时,必须知道总体的方差,但在许多实际问题中,总体方差 σ12\sigma_1^2σ22\sigma_2^2 往往是未知的,这时只能用如下的 TT 检验法

2.方差 σ12, σ22\sigma_1^2, ~ \sigma_2^2 未知,但 σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2 关于数学期望的假设检验( TT 检验法)

首先考虑双边假设检验。 (1)检验假设

H0:μ1=μ2;H1:μ1μ2H_0: \mu_1=\mu_2 ; \quad H_1: \mu_1 \neq \mu_2

由前面的讨论可知 XˉYˉN(μ1μ2,σ12n1+σ22n2)\bar{X}-\bar{Y} \sim N\left(\mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\right) ,又 σ2\sigma^2 的一个无偏估计为

Sw2=(n11)S12+(n21)S22n1+n22S_{w}^2=\frac{\left(n_1-1\right) S_1^2+\left(n_2-1\right) S_2^2}{n_1+n_2-2}

其中 S12S_1^2S22S_2^2 分别表示 XXYY 方差.由 Sw2S_{ w }^2XˉYˉ\bar{X}-\bar{Y} 独立可得

T=XˉYˉ(μ1μ2)Sw1/n1+1/n2t(n1+n22)T=\frac{\bar{X}-\bar{Y}-\left(\mu_1-\mu_2\right)}{S_{w} \sqrt{1 / n_1+1 / n_2}} \sim t\left(n_1+n_2-2\right)

采用 TT 检验方法,选取 TT 统计量为

T=XˉYˉSw1/n1+1/n2.T=\frac{\bar{X}-\bar{Y}}{S_{w} \sqrt{1 / n_1+1 / n_2}} .

H0H_0 为真时

T=XˉYˉSw1/n1+1/n2t(n1+n22).T=\frac{\bar{X}-\bar{Y}}{S_{w} \sqrt{1 / n_1+1 / n_2}} \sim t\left(n_1+n_2-2\right) .

记其观察值为 tt .相应的检验法称为 TT 检验法. 由于 Sw2S_{ w }^2 也是 σ2\sigma^2 的无偏估计量,当 H0H_0 成立时,t|t| 不应太大,当 H1H_1 成立时,t|t| 有偏大的趋势,故拒绝域形式为

t=XˉYˉμ0Sw1/n1+1/n2k(k 待定 ).|t|=\left|\frac{\bar{X}-\bar{Y}-\mu_0}{S_{w} \sqrt{1 / n_1+1 / n_2}}\right| \geqslant k \quad(k \text { 待定 }) .

对于给定的显著性水平 α\alpha ,有

P{Ttα/2(n1+n22)}=α,P\left\{|T| \geqslant t_{\alpha / 2}\left(n_1+n_2-2\right)\right\}=\alpha,

由此即得拒绝域为

t=XˉYˉμ0Sw1/n1+1/n2tα/2(n1+n22)|t|=\left|\frac{\bar{X}-\bar{Y}-\mu_0}{S_{w} \sqrt{1 / n_1+1 / n_2}}\right| \geqslant t_{\alpha / 2}\left(n_1+n_2-2\right)

根据一次抽样后得到的样本观察值 x1,x2,,xn1x_1, x_2, \cdots, x_{n_1}y1,y2,,yn2y_1, y_2, \cdots, y_{n_2} 计算出 TT 的观察值 tt ,若 ttα/2(n1+n22)|t| \geqslant t_{\alpha / 2}\left(n_1+n_2-2\right) ,则拒绝原假设 H0H_0 ,否则接受原假设 H0H_0

类似地,对单侧检验有: (2)检验假设

H0:μ1μ2,H1:μ1>μ2H_0: \mu_1 \leqslant \mu_2, \quad H_1: \mu_1>\mu_2

对应的拒绝域为

W={ttα(n1+n22)}W=\left\{t \geqslant t_\alpha\left(n_1+n_2-2\right)\right\}

(3)检验假设

H0:μ1μ2,H1:μ1<μ2H_0: \mu_1 \geqslant \mu_2, \quad H_1: \mu_1<\mu_2

对应的拒绝域为

W={ttα(n1+n22)}.W=\left\{t \leqslant-t_\alpha\left(n_1+n_2-2\right)\right\} .

某地某年高考后随机抽得 15 名男生, 12 名女生的数学考试成绩如下:

男生: 49 48 47 53 51 43 39 57 56 46 42 44 55 44 40

女生: 46 40 47 51 43 36 43 38 48 54 48 34

这 27 名学生的成绩能说明这个地区男女生的数学考试成绩不相上下吗(显著性水平 α=0.05\alpha=0.05 )?

解 把男生和女生数学考试的成绩分别近似地视为服从正态分布的随机变量 XN(μ1,σ2)X \sim N\left(\mu_1, \sigma^2\right)YN(μ2,σ2)Y \sim N\left(\mu_2, \sigma^2\right) ,则本例可归结为双侧检验问题。

由题设,有 n1=15,n2=12n_1=15, n_2=12 ,从而 n=n1+n2=27n=n_1+n_2=27 . 再根据例中数据算出 xˉ=47.6,yˉ=44\bar{x}=47.6, \bar{y}=44

(n11)s12=i=115(xixˉ)2=469.6,(n21)s22=i=112(yiyˉ)2=412.Sw=(n11)S12+(n21)S22n1+n22=125(469.6+412)=5.94.\begin{gathered} \left(n_1-1\right) s_1^2=\sum_{i=1}^{15}\left(x_i-\bar{x}\right)^2=469.6, \quad\left(n_2-1\right) s_2^2=\sum_{i=1}^{12}\left(y_i-\bar{y}\right)^2=412 . \\ S_{w}=\sqrt{\frac{\left(n_1-1\right) S_1^2+\left(n_2-1\right) S_2^2}{n_1+n_2-2}}=\sqrt{\frac{1}{25}(469.6+412)}=5.94 . \end{gathered}

由此便可计算出

t=xˉyˉSw1/n1+1/n2=47.6445.941/15+1/12=1.565.t=\frac{\bar{x}-\bar{y}}{S_{w} \sqrt{1 / n_1+1 / n_2}}=\frac{47.6-44}{5.94 \sqrt{1 / 15+1 / 12}}=1.565 .

取显著性水平 α=0.05\alpha=0.05 ,查附录 D 得 tα/2(n2)=t0.025(25)=2.060t_{\alpha / 2}(n-2)=t_{0.025}(25)=2.060 . 因为 t=1.5652.060=t0.025(25)|t|=1.565 \leqslant 2.060=t_{0.025}(25) ,从而没有充分理由否认原假设 H0H_0 ,即认为这一地区男女生的数学考试成绩不相上下.

某厂铸造车间为提高缸体的耐磨性而试制了一种镍合金铸件以取代一种铜合金铸件,现从两种铸件中各抽一个样本进行硬度测试,其结果如下。

镍合金铸件 (X):72.0,69.5,74.0,70.5,71.8(X): 72.0,69.5,74.0,70.5,71.8. 铜合金铸件 (Y):69.8,70.0,72.0,68.5,73.0,70.0(Y): 69.8,70.0,72.0,68.5,73.0,70.0 。 根据以往经验知, 硬度 XN(μ1,σ12),YN(μ2,σ22)X \sim N\left(\mu_1, \sigma_1^2\right), Y \sim N\left(\mu_2, \sigma_2^2\right), 且 σ1=σ2=2\sigma_1=\sigma_2=2, 试在显著性水平 α=0.05\alpha=0.05 下, 比较镍合金铸件硬度有无显著提高. 解 根据题意假设 H0:μ1=μ2H1:μ1>μ2H_0: \mu_1=\mu_2 \leftrightarrow H_1: \mu_1>\mu_2, 这是一个单侧 (右侧) 检验问题, 检验统计量

Z=XˉYˉ45+46,W={Z>u0.95}.\begin{aligned} & Z=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{4}{5}+\frac{4}{6}}}, \\ & W=\left\{Z>u_{0.95}\right\} . \end{aligned}

拒绝域为 今 u0.95=1.645,xˉ=71.56,yˉ=70.55u_{0.95}=1.645, \bar{x}=71.56, \bar{y}=70.55, 代人得检验统计量的观测值为

z=71.5670.5520.3671.011.210.8347<u0.95=1.645z=\frac{71.56-70.55}{2 \sqrt{0.367}} \approx \frac{1.01}{1.21} \approx 0.8347<u_{0.95}=1.645

因此不能拒绝 H0H_0 ,即不能认为镍合金铸件的硬度有显著提高。

其拒绝域如表 8.3.1 所示. 图片