12._两个正态总体的参数的区间估计

已知某产品的质量指标服从正态分布,但由于原料、设备条件、操作人员不同或工艺过程的改变等原因,都会引起总体的均值或方差有所改变,我们需要知道这种改变有多大?这就需要考察两个正态总体的均值差或方差比的区间估计问题.下面我们给出正态总体参数区间估计的几种常见类型.对于非正态总体情形,即总体不服从正态分布或者不知道总体服从什么分布,一般采用大容量的样本,根据中心极限定理,按照正态分布近似处理.

两个正态总体的参数的区间估计 设总体 XN(μ1,σ12)X \sim N\left(\mu_1, \sigma_1^2\right) ,总体 YN(μ2,σ22),XY \sim N\left(\mu_2, \sigma_2^2\right), XYY 相互独立,样本 X1,X2,,Xn1X_1, X_2, \cdots, X_{n_1} 来自总体 XX ,样本 Y1,Y2,,Yn2Y_1, Y_2, \cdots, Y_{n_2} 来自总体 YY

(1)σ12\sigma_1^2σ22\sigma_2^2 已知,均值差 μ1μ2\mu_1-\mu_2 的置信区间

σ12,σ22\sigma_1^2, \sigma_2^2 均为已知.因 Xˉ,Yˉ\bar{X}, \bar{Y} 分别为 μ1,μ2\mu_1, \mu_2 的无偏估计,故 XˉYˉ\bar{X}-\bar{Y}μ1μ2\mu_1-\mu_2的无偏估计. 由于 XˉN(μ1,σ12n1),YˉN(μ2,σ22n2)\bar{X} \sim N\left(\mu_1, \frac{\sigma_1^2}{n_1}\right), \bar{Y} \sim N\left(\mu_2, \frac{\sigma_2^2}{n_2}\right) ,且 Xˉ\bar{X}Yˉ\bar{Y} 相互独立,所以

XˉYˉN(μ1μ2,σ12n1+σ22n2)\bar{X}-\bar{Y} \sim N\left(\mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\right)

取枢轴量为

U=XˉYˉ(μ1μ2)σ12n1+σ22n2N(0,1),U=\frac{\bar{X}-\bar{Y}-\left(\mu_1-\mu_2\right)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1),

可得 μ1μ2\mu_1-\mu_2 的置信度为 1α1-\alpha 的置信区间为

[(XˉYˉ)uα2σ12n1+σ22n2,(XˉYˉ)+uα2σ12n1+σ22n2]\boxed{ \left[(\bar{X}-\bar{Y})-u_{\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}},(\bar{X}-\bar{Y})+u_{\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right] }

(2)σ12\sigma_1^2σ22\sigma_2^2 未知,但 σ12=σ22\sigma_1^2=\sigma_2^2 ,均值差 μ1μ2\mu_1-\mu_2 的置信区间

由于总体方差 σ12\sigma_1^2σ22\sigma_2^2 未知,但 σ12=σ22\sigma_1^2=\sigma_2^2 ,有 正态总体的抽样分布, 故取枢轴量

T=XˉYˉ(μ1μ2)Sw1n1+1n2t(n1+n22)...(2)\boxed{ T=\frac{\bar{X}-\bar{Y}-\left(\mu_1-\mu_2\right)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t\left(n_1+n_2-2\right) ...(2) }

Sw2=(n11)S12+(n21)S22n1+n22S_w^2=\frac{\left(n_1-1\right) S_1^2+\left(n_2-1\right) S_2^2}{n_1+n_2-2}

可得 μ1μ2\mu_1-\mu_2 的置信度为 1α1-\alpha 的置信区间为

[XˉYˉtα2(n1+n22)Sw1n1+1n2,XˉYˉ+tα2(n1+n22)Sw1n1+1n2]\boxed{ \left[\bar{X}-\bar{Y}-t_{\frac{\alpha}{2}}\left(n_1+n_2-2\right) S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \bar{X}-\bar{Y}+t_{\frac{\alpha}{2}}\left(n_1+n_2-2\right) S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right] }

两个正态分布参数估计主要用于两条生产线生产同一批产品的对比,请结合下面例题理解。

为比较 I,II 两种型号步枪子弹的枪口速度,随机地取 I 型子弹 10发,得到枪口速度的平均值为 xˉ1=500 m/s\bar{x}_1=500 \mathrm{~m} / \mathrm{s} ,标准差 s1=1.10 m/ss_1=1.10 \mathrm{~m} / \mathrm{s} ,随机地取 II型子弹 20 发,得到枪口速度的平均值为 xˉ2=496 m/s\bar{x}_2=496 \mathrm{~m} / \mathrm{s} .标准差 s2=1.20 m/ss_2=1.20 \mathrm{~m} / \mathrm{s} .假设两总体都可认为近似地服从正态分布.且由生产过程可认为方差相等.求两总体均值差 μ1μ2\mu_1-\mu_2 的一个置信水平为 0.95 的置信区间。

解 按实际情况,可认为分别来自两个总体的样本是相互独立的.又因由假设两总体的方差相等,但数值未知,故可用(2)式求均值差的置信区间. 由于 1α=0.95,α/2=0.025,n1=10,n2=20,n1+n22=28,t0.025(28)=2.04841-\alpha=0.95, \alpha / 2=0.025, n_1=10, n_2=20, n_1+n_2-2=28, t_{0.025}(28)=2.0484. sw2=(9×1.102+19×1.202)/28,sw=sw2=1.1688s_w^2=\left(9 \times 1.10^2+19 \times 1.20^2\right) / 28, s_w=\sqrt{s_w^2}=1.1688 ,故所求的两总体均值差 μ1μ2\mu_1-\mu_2 的一个置信水平为 0.95 的置信区间是

(xˉ1xˉ2±sw×t0.025(28)110+120)=(4±0.93)\left(\bar{x}_1-\bar{x}_2 \pm s_w \times t_{0.025}(28) \sqrt{\frac{1}{10}+\frac{1}{20}}\right)=(4 \pm 0.93)

(3.07,4.93).(3.07,4.93) .

本题中得到的置信区间的下限大于零,在实际中我们就认为 μ1\mu_1μ2\mu_2 大.

为提高某一化学生产过程的得率,试图采用一种新的催化剂.为慎重起见,在实验工厂先进行试验.设采用原来的催化剂进行了 n1=8n_1=8 次试验,得到得率的平均值 xˉ1=91.73\bar{x}_1=91.73 ,样本方差 s12=3.89s_1^2=3.89 ;又采用新的催化剂进行了 n2=8n_2=8次试验,得到得率的平均值 xˉ2=93.75\bar{x}_2=93.75 ,样本方差 s22=4.02s_2^2=4.02 .假设两总体都可认为服从正态分布,且方差相等,两样本独立.试求两总体均值差 μ1μ2\mu_1-\mu_2 的置信水平为 0.95 的置信区间。

解 现在

sw2=(n11)s12+(n21)s22n1+n22=3.96,sw=3.96s_w^2=\frac{\left(n_1-1\right) s_1^2+\left(n_2-1\right) s_2^2}{n_1+n_2-2}=3.96, s_w=\sqrt{3.96}

由(5.12)式得所求的置信区间为

(xˉ1xˉ2±t0.025(14)sw18+18)=(2.02±2.13)\left(\bar{x}_1-\bar{x}_2 \pm t_{0.025}(14) s_w \sqrt{\frac{1}{8}+\frac{1}{8}}\right)=(-2.02 \pm 2.13)

(4.15,0.11)(-4.15,0.11) . 由于所得置信区间包含零,在实际中我们就认为采用这两种催化剂所得的得率的均值没有显著差别.

(3)μ1\mu_1μ2\mu_2 末知,方差比 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信区间

由于 μ1\mu_1μ2\mu_2 未知,根据正态分布参数估计 故取枢轴量为

F=S12σ12S22σ22F(n11,n21),F=\dfrac{\frac{S_1^2}{\sigma_1^2}}{\frac{S_2^2}{\sigma_2^2}} \sim F\left(n_1-1, n_2-1\right),

可得 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信度为 1α1-\alpha 的置信区间为

[S12S22F1α2(n21,n11),S12S22Fα2(n21,n11)].\left[\frac{S_1^2}{S_2^2} F_{1-\frac{\alpha}{2}}\left(n_2-1, n_1-1\right), \frac{S_1^2}{S_2^2} F_{\frac{\alpha}{2}}\left(n_2-1, n_1-1\right)\right] .

某厂利用两条自动化流水线罐装辣椒酱,现分别从两条流水线上抽取了容量分别为 13 与 17 的两个相互独立的样本,其中

xˉ=10.6g,yˉ=9.5g,s12=2.4g2,s22=4.7g2.\bar{x}=10.6 g, \bar{y}=9.5 g, s_1^2=2.4 g^2, s_2^2=4.7 g^2 .

假设两条流水线上罐装的辣椒酱质量分别服从正态分布 N(μ1,σ12)N\left(\mu_1, \sigma_1^2\right)N(μ2,σ22)N\left(\mu_2, \sigma_2^2\right)

(1)求它们的方差比 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信度为 0.95 的置信区间. (2)若它们的方差相同,σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2 ,求均值差 μ1μ2\mu_1-\mu_2 的置信度为 0.95 的置信区间.

解(1)由于 μ1\mu_1μ2\mu_2 未知,故方差比 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信度为 1α1-\alpha 的置信区间为

[S12S22F1α2(n21,n11),S12S22Fα2(n21,n11)].\left[\frac{S_1^2}{S_2^2} F_{1-\frac{\alpha}{2}}\left(n_2-1, n_1-1\right), \frac{S_1^2}{S_2^2} F_{\frac{\alpha}{2}}\left(n_2-1, n_1-1\right)\right] .

n1=13,n2=17,α=0.05n_1=13, n_2=17, \alpha=0.05 ,查 FF 分布表(见附表)得

F0.025(16,12)=3.16,F0.975(16,12)=1F0.025(12,16)12.89=0.346F_{0.025}(16,12)=3.16, \quad F_{0.975}(16,12)=\frac{1}{F_{0.025}(12,16)} \approx \frac{1}{2.89}=0.346

由公式得方差比 σ12σ22\frac{\sigma_1^2}{\sigma_2^2} 的置信区间为

[2.44.7×0.346,2.44.7×3.16]=[0.1767,1.6136]\left[\frac{2.4}{4.7} \times 0.346, \frac{2.4}{4.7} \times 3.16\right]=[0.1767,1.6136]

(2)由于方差未知,但 σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2 ,故 μ1μ2\mu_1-\mu_2 的置信度为 1α1-\alpha 的置信区间为

[(XˉYˉ)tα2(n1+n22)1n1+1n2(n11)S12+(n21)S22n1+n22(XˉYˉ)+tα2(n1+n22)1n1+1n2(n11)S12+(n21)S22n1+n22]\begin{aligned} & {\left[(\bar{X}-\bar{Y})-t_{\frac{\alpha}{2}}\left(n_1+n_2-2\right) \sqrt{\frac{1}{n_1}+\frac{1}{n_2}} \sqrt{\frac{\left(n_1-1\right) S_1^2+\left(n_2-1\right) S_2^2}{n_1+n_2-2}}\right.} \\ & \left.(\bar{X}-\bar{Y})+t_{\frac{\alpha}{2}}\left(n_1+n_2-2\right) \sqrt{\frac{1}{n_1}+\frac{1}{n_2}} \sqrt{\frac{\left(n_1-1\right) S_1^2+\left(n_2-1\right) S_2^2}{n_1+n_2-2}}\right] \end{aligned}

n1=13,n2=17,α=0.05n_1=13, n_2=17, \alpha=0.05 ,查 tt 分布表(见附表 4)得 t0.025(28)=2.0484t_{0.025}(28)=2.0484 ,将数据代入公式,得 μ1μ2\mu_1-\mu_2 的置信度为 0.95 的置信区间为 [0.3545,2.5545][ 0.3545,2.5545]

研究由机器 AA 和机器 BB 生产的钢管的内径(单位:mm),随机抽取机器 AA 生产的管子 18 只,测得样本方差 s12=0.34s_1^2=0.34 ;抽取机器 BB 生产的管子 13 只,测得样本方差 s22=0.29s_2^2=0.29 .设两样本相互独立,且设由机器 AA ,机器 BB 生产的管子的内径分别服从正态分布 N(μ1,σ12),N(μ2,σ22)N\left(\mu_1, \sigma_1^2\right), N\left(\mu_2, \sigma_2^2\right) ,这里 μi,σi2(i=1,2)\mu_i, \sigma_i^2(i=1,2) 均未知.试求方差比 σ12/σ22\sigma_1^2 / \sigma_2^2 的置信水平为 0.90 的置信区间.

解 现在 n1=18,s12=0.34,n2=13,s22=0.29,α=0.10,Fα/2(n11,n21)=F0.05(17,12)=2.59,F1α/2(17,12)=F0.95(17,12)=1F0.05(12,17)=12.38n_1=18, s_1^2=0.34, n_2=13, s_2^2=0.29, \alpha=0.10, F_{\alpha / 2}\left(n_1-1, n_2-1\right) =F_{0.05}(17,12)=2.59, F_{1-\alpha / 2}(17,12)=F_{0.95}(17,12)=\frac{1}{F_{0.05}(12,17)}=\frac{1}{2.38} ,于是 得 σ12/σ22\sigma_1^2 / \sigma_2^2 的一个置信水平为 0.90 的置信区间为即

(0.340.29×12.59,0.340.29×2.38),\left(\frac{0.34}{0.29} \times \frac{1}{2.59}, \quad \frac{0.34}{0.29} \times 2.38\right),

(0.45,2.79).(0.45,2.79) .

由于 σ12/σ22\sigma_1^2 / \sigma_2^2 的置信区间包含 1 ,在实际中我们就认为 σ12,σ22\sigma_1^2, \sigma_2^2 两者没有显著差别.

对以上关于正态总体参数的区间估计的讨论进行总结,单个正态总体参数的区间估计如表附表 正态分布参数估计表