14._0-1_分布参数的区间估计

(0-1)分布参数的区间估计

设有一容量 n>50n>50 的大样本,它来自(0-1)分布的总体 X,XX, X 的分布律为

f(x;p)=px(1p)1x,x=0,1,f(x ; p)=p^x(1-p)^{1-x}, x=0,1,

其中 pp 为未知参数.现在来求 pp 的置信水平为 1α1-\alpha 的置信区间. 已知 (01)(0-1) 分布的均值和方差分别为

μ=p,σ2=p(1p).\mu=p, \quad \sigma^2=p(1-p) .

X1,X2,,XnX_1, X_2, \cdots, X_n 是一个样本.因样本容量 nn 较大,由中心极限定理,知

i=1nXinpnp(1p)=nXˉnpnp(1p)\frac{\sum_{i=1}^n X_i-n p}{\sqrt{n p(1-p)}}=\frac{n \bar{X}-n p}{\sqrt{n p(1-p)}}

近似地服从 N(0,1)N(0,1) 分布,于是有

而不等式

P{zα/2<nXˉnpnp(1p)<zα/2}1α.zα/2<nXˉnpnp(1p)<zα/2\begin{gathered} P\left\{-z_{\alpha / 2}<\frac{n \bar{X}-n p}{\sqrt{n p(1-p)}}<z_{\alpha / 2}\right\} \approx 1-\alpha . \\ -z_{\alpha / 2}<\frac{n \bar{X}-n p}{\sqrt{n p(1-p)}}<z_{\alpha / 2} \end{gathered}

等价于

(n+zα/22)p2(2nXˉ+zα/22)p+nXˉ2<0.p1=12a(bb24ac),p2=12a(b+b24ac),\begin{gathered} \left(n+z_{\alpha / 2}^2\right) p^2-\left(2 n \bar{X}+z_{\alpha / 2}^2\right) p+n \bar{X}^2<0 . \\ p_1=\frac{1}{2 a}\left(-b-\sqrt{b^2-4 a c}\right), \\ p_2=\frac{1}{2 a}\left(-b+\sqrt{b^2-4 a c}\right), \end{gathered}

此处 a=n+zα/22,b=(2nXˉ+zα/22),c=nXˉ2a=n+z_{\alpha / 2}^2, b=-\left(2 n \bar{X}+z_{\alpha / 2}^2\right), c=n \bar{X}^2 。于是由(6.5)式得 pp 的一个近似的置信水平为 1α1-\alpha 的置信区间为

(p1,p2).\left(p_1, p_2\right) .

设自一大批产品的 100 个样品中,得一级品 60 个,求这批产品的一级品率 pp 的置信水平为 0.95 的置信区间.

解 一级品率 pp(01)(0-1) 分布的参数,此处 n=100,xˉ=60/100=0.6,1αn=100, \bar{x}=60 / 100=0.6,1-\alpha =0.95,α/2=0.025,zα/2=1.96=0.95, \alpha / 2=0.025, z_{\alpha / 2}=1.96 ,按(6.7),(6.8)式来求 pp 的置信区间,其中

a=n+zα/22=103.84,b=(2nxˉ+zα/22)=123.84,c=nxˉ2=36.a=n+z_{\alpha / 2}^2=103.84, b=-\left(2 n \bar{x}+z_{\alpha / 2}^2\right)=-123.84, c=n \bar{x}^2=36 .

于是

p1=0.50,p2=0.69.p_1=0.50, \quad p_2=0.69 .

故得 pp 的一个置信水平为 0.95 的近似置信区间为

(0.50,0.69)(0.50,0.69)