(0-1)分布参数的区间估计
设有一容量 n>50 的大样本,它来自(0-1)分布的总体 X,X 的分布律为
f(x;p)=px(1−p)1−x,x=0,1, 其中 p 为未知参数.现在来求 p 的置信水平为 1−α 的置信区间.
已知 (0−1) 分布的均值和方差分别为
μ=p,σ2=p(1−p). 设 X1,X2,⋯,Xn 是一个样本.因样本容量 n 较大,由中心极限定理,知
np(1−p)∑i=1nXi−np=np(1−p)nXˉ−np 近似地服从 N(0,1) 分布,于是有
而不等式
P{−zα/2<np(1−p)nXˉ−np<zα/2}≈1−α.−zα/2<np(1−p)nXˉ−np<zα/2 等价于
(n+zα/22)p2−(2nXˉ+zα/22)p+nXˉ2<0.p1=2a1(−b−b2−4ac),p2=2a1(−b+b2−4ac), 记
此处 a=n+zα/22,b=−(2nXˉ+zα/22),c=nXˉ2 。于是由(6.5)式得 p 的一个近似的置信水平为 1−α 的置信区间为
(p1,p2). 例设自一大批产品的 100 个样品中,得一级品 60 个,求这批产品的一级品率 p 的置信水平为 0.95 的置信区间.
解 一级品率 p 是 (0−1) 分布的参数,此处 n=100,xˉ=60/100=0.6,1−α =0.95,α/2=0.025,zα/2=1.96 ,按(6.7),(6.8)式来求 p 的置信区间,其中
a=n+zα/22=103.84,b=−(2nxˉ+zα/22)=−123.84,c=nxˉ2=36. 于是
p1=0.50,p2=0.69. 故得 p 的一个置信水平为 0.95 的近似置信区间为
(0.50,0.69)