12._泊松定理_二项分布的泊松近似

在阅读本文前,以及了解了 二项分布泊松分布

为啥引入泊松定理

答案其实很简单:二项式计算比较复杂,使用泊松分布则相对简单。有句古话:冰,水为之而寒于水。同样,泊松分布是从二项式推导出来的,所以部分二项分布可以使用泊松分布计算。

泊松定理用一句话概括:二项分布可以使用泊松分布来近似表达

某公司订购了一种型号的加工机床,机床的故障率为 1%1 \% ,各台机床之间是否出现故障是相互独立的,求在 100 台此类机床中,出现故障的台数不超过 3 台的概率。

解: 设 100 台机床中出现故障的台数为 XX ,则 XB(100,0.01)X \sim B(100,0.01) ,所求概率为

P{X3}=k=03C100k(0.01)k(0.99)100k...(使用二项分布)P\{X \leqslant 3\}=\sum_{k=0}^3 \mathrm{C}_{100}^k(0.01)^k(0.99)^{100-k} ...\text{(使用二项分布)}

由于 np=100×0.01=1n p=100 \times 0.01=1 ,根据泊松定理,XX 近似服从泊松分布 P(1)P(1) ,因此所求概率也可以通过泊松分布来近似计算.

P{X3}k=031kk!e1...(使用泊松分布)P\{X \leqslant 3\} \approx \sum_{k=0}^3 \frac{1^k}{k!} \mathrm{e}^{-1}...\text{(使用泊松分布)}

通过查表可得

P{X3}0.9810.P\{X \leqslant 3\} \approx 0.9810 .

通过上例可以发现,运用泊松定理能够简化二项分布中烦琐的计算。

泊松定理

泊松定理npn=λ(λ>0n p_n=\lambda(\lambda>0 是一常数,nn 是任意正整数),则对任意固定的一个非负整数 kk ,有 limnCnkpnk(1pn)nk=λkeλk!\lim _{n \rightarrow \infty} C_n^k p_n^k\left(1-p_n\right)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!}

证 由 pn=λnp_n=\frac{\lambda}{n} ,得

Cnkpnk(1pn)nk=n(n1)(nk+1)k!(λn)k(1λn)nk=λkk![1(11n)(12n)(1k1n)](1λn)n(1λn)k\begin{aligned} C_n^k p_n^k\left(1-p_n\right)^{n-k} & =\frac{n(n-1) \cdots(n-k+1)}{k!}\left(\frac{\lambda}{n}\right)^k\left(1-\frac{\lambda}{n}\right)^{n-k} \\ & =\frac{\lambda^k}{k!}\left[1 \cdot\left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right) \cdots\left(1-\frac{k-1}{n}\right)\right]\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-k} \end{aligned}

因为对任意固定的 kk ,当 nn \rightarrow \infty 时,有

[1(11n)(12n)(1k1n)]1\left[1 \cdot\left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right) \cdots\left(1-\frac{k-1}{n}\right)\right] \rightarrow 1

以及

(1λn)neλ,(1λn)k1\left(1-\frac{\lambda}{n}\right)^n \rightarrow e^{-\lambda},\left(1-\frac{\lambda}{n}\right)^{-k} \rightarrow 1

所以

limnCnkpnk(1pn)nk=λkeλk!\lim _{n \rightarrow \infty} C_n^k p_n^k\left(1-p_n\right)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!}

注(1)在上面定理 中,因为 λ=npn\lambda=n p_n 是常数,所以当 nn 很大时,pnp_n 必定很小.故该定理表明,当 nn 很大,pp 很小时,上式成立。通常认为 npn * p 小于5 适合泊松定理。

(2)二项分布的泊松近似,常被应用于研究稀有事件(即每次实验中事件 A 出现概率p 很小,想下面例题演示的疾病、或者、机器故障灯).当伯努利试验的次数n 很大时,事件A 发生的次数的分布.

例题

已知某种疾病的发病率为 0.001 , 某单位共有 5000 人. 问该单位患有这种疾病的人数不超过 5 人的概率为多少?

解 设该单位患有这种疾病的人数为 XX, 则有 Xb(5000,0.001)X \sim b(5000,0.001), 而我们所求的为

P(X5)=k=05(5000k)0.001k0.9995000k.P(X \leqslant 5)=\sum_{k=0}^5\left(\begin{array}{c} 5000 \\ k \end{array}\right) 0.001^k 0.999^{5000-k} .

这个概率的计算量很大. 由于 nn 很大, pp 很小, 且 λ=np=5\lambda=n p=5. 所以用泊松近似得

P(X5)k=055kk!e5=0.616.P(X \leqslant 5) \approx \sum_{k=0}^5 \frac{5^k}{k !} \mathrm{e}^{-5}=0.616 .

有 10000 名同年龄段且同社会阶层的人参加了某保险公司的一项人寿保险.每个投保人在每年初需交纳 200 元保费, 而在这一年中若投保人死亡, 则受益人可从保险公司获得 100000 元的赔偿费. 据生命表知这类人的年死亡率为 0.001 . 试求保险公司在这项业务上 (1) 亏本的概率; (2) 至少获利 500000 元的概率. 解 设 XX 为 10000 名投保人在一年中死亡的人数, 则 XX 服从二项分布 b(10000,0.001)b(10000,0.001). 保险公司在这项业务上一年的总收人为 200×10000=2000000200 \times 10000=2000000 (元). 因为 n=10000n=10000 很大, p=0.001p=0.001 很小, 所以用 λ=np=10\lambda=n p=10 的泊松分布进行近似计算. (1) 保险公司在这项业务上 “亏本” 就相当于事件 {X>20}\{X>20\} 发生. 因此所求概率为

P(X>20)=1P(X20)1k=02010kk!e10=10.998=0.002.P(X>20)=1-P(X \leqslant 20) \approx 1-\sum_{k=0}^{20} \frac{10^k}{k !} \mathrm{e}^{-10}=1-0.998=0.002 .

由此可看出,保险公司在这项业务上亏本的可能性是微小的. (2) 保险公司在这项业务上“至少获利 500000 元” 就相当于事件 {X15}\{X \leqslant 15\} 发生.因此所求概率为

P(X15)k=01510kk!e10=0.951.P(X \leqslant 15) \approx \sum_{k=0}^{15} \frac{10^k}{k !} \mathrm{e}^{-10}=0.951 .

由此可看出, 保险公司在这项业务上至少获利 500000 元的可能性很大.

为保证设备正常工作, 需要配备一些维修工. 如果各台设备发生故障是相互独立的, 且每台设备发生故障的概率都是 0.01 . 试在以下各种情况下, 求设备发生故障而不能及时修理的概率. (1) 1 名维修工负责 20 台设备; (2) 3 名维修工负责 90 台设备; (3) 10 名维修工负责 500 台设备. 解 (1) 以 X1X_1 表示 20 台设备中同时发生故障的台数, 则 X1b(20,0.01)X_1 \sim b(20,0.01). 用参数为 λ=np=20×0.01=0.2\lambda=n p=20 \times 0.01=0.2 的泊松分布作近似计算, 得所求概率为

P(X1>1)1k=010.2kk!e0.2=10.982=0.018.P\left(X_1>1\right) \approx 1-\sum_{k=0}^1 \frac{0.2^k}{k !} \mathrm{e}^{-0.2}=1-0.982=0.018 .

(2) 以 X2X_2 表示 90 台设备中同时发生故障的台数, 则 X2b(90,0.01)X_2 \sim b(90,0.01). 用参数为 λ=np=90×0.01=0.9\lambda=n p=90 \times 0.01=0.9 的泊松分布作近似计算, 得所求概率为

P(X2>3)1k=030.9kk!e0.9=10.987=0.013.P\left(X_2>3\right) \approx 1-\sum_{k=0}^3 \frac{0.9^k}{k !} \mathrm{e}^{-0.9}=1-0.987=0.013 .

注意, 此种情况下, 不但所求概率比 (1) 中有所降低, 而且 3 名维修工负责 90 台设备相当于每个维修工负责 30 台设备, 工作效率是 (1) 中的 1.5 倍. (3) 以 X3X_3 表示 500 台设备中同时发生故障的台数, 则 X3b(500,0.01)X_3 \sim b(500,0.01). 用参数为 λ=np=500×0.01=5\lambda=n p=500 \times 0.01=5 的泊松分布作近似计算, 得所求概率为

P(X3>10)1k=0105kk!e5=10.986=0.014.P\left(X_3>10\right) \approx 1-\sum_{k=0}^{10} \frac{5^k}{k !} \mathrm{e}^{-5}=1-0.986=0.014 .

注意, 此种情况下所求概率与 (2) 中基本上一样, 而 10 名维修工负责 500 台设备相当于每个维修工负责 50 台设备, 工作效率是 (2) 中的 1.67 倍, 是 (1) 中的 2.5 倍. 由此可知: 若干维修工共同负责大量设备的维修, 将提高工作的效率.

一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数 λ=5\lambda=5 的泊松分布来描述,为了以 95%95 \% 以上的概率保证不脱销,问商店在月底至少应进该商品多少件?

解 设该商品每月的销售数为 XX ,已知 XX 服从参数 λ=5\lambda=5 的泊松分布.设商店在月底应进该种商品 mm 件,求满足 P(Xm)>0.95P(X \leqslant m)>0.95 的最小的 mm ,即

k=0m5kk!e5>0.95\sum_{k=0}^m \frac{5^k}{k!} e^{-5}>0.95

查泊松分布表,有 k=095kk!e50.968172,k=085kk!e50.931906\sum_{k=0}^9 \frac{5^k}{k!} e ^{-5} \approx 0.968172, \sum_{k=0}^8 \frac{5^k}{k!} e ^{-5} \approx 0.931906 .于是得 m=9m=9 件.