在阅读本文前,以及了解了 二项分布 和 泊松分布
为啥引入泊松定理
答案其实很简单:二项式计算比较复杂,使用泊松分布则相对简单。有句古话:冰,水为之而寒于水。同样,泊松分布是从二项式推导出来的,所以部分二项分布可以使用泊松分布计算。
泊松定理用一句话概括:二项分布可以使用泊松分布来近似表达
例 某公司订购了一种型号的加工机床,机床的故障率为 1% ,各台机床之间是否出现故障是相互独立的,求在 100 台此类机床中,出现故障的台数不超过 3 台的概率。
解: 设 100 台机床中出现故障的台数为 X ,则 X∼B(100,0.01) ,所求概率为
P{X⩽3}=k=0∑3C100k(0.01)k(0.99)100−k...(使用二项分布) 由于 np=100×0.01=1 ,根据泊松定理,X 近似服从泊松分布 P(1) ,因此所求概率也可以通过泊松分布来近似计算.
P{X⩽3}≈k=0∑3k!1ke−1...(使用泊松分布) 通过查表可得
P{X⩽3}≈0.9810. 通过上例可以发现,运用泊松定理能够简化二项分布中烦琐的计算。
泊松定理
泊松定理 设 npn=λ(λ>0 是一常数,n 是任意正整数),则对任意固定的一个非负整数 k ,有 limn→∞Cnkpnk(1−pn)n−k=k!λke−λ
证 由 pn=nλ ,得
Cnkpnk(1−pn)n−k=k!n(n−1)⋯(n−k+1)(nλ)k(1−nλ)n−k=k!λk[1⋅(1−n1)(1−n2)⋯(1−nk−1)](1−nλ)n(1−nλ)−k 因为对任意固定的 k ,当 n→∞ 时,有
[1⋅(1−n1)(1−n2)⋯(1−nk−1)]→1 以及
(1−nλ)n→e−λ,(1−nλ)−k→1 所以
n→∞limCnkpnk(1−pn)n−k=k!λke−λ 注(1)在上面定理 中,因为 λ=npn 是常数,所以当 n 很大时,pn 必定很小.故该定理表明,当 n 很大,p 很小时,上式成立。通常认为 n∗p 小于5 适合泊松定理。
(2)二项分布的泊松近似,常被应用于研究稀有事件(即每次实验中事件 A 出现概率p 很小,想下面例题演示的疾病、或者、机器故障灯).当伯努利试验的次数n 很大时,事件A 发生的次数的分布.
例题
例 已知某种疾病的发病率为 0.001 , 某单位共有 5000 人. 问该单位患有这种疾病的人数不超过 5 人的概率为多少?
解 设该单位患有这种疾病的人数为 X, 则有 X∼b(5000,0.001), 而我们所求的为
P(X⩽5)=k=0∑5(5000k)0.001k0.9995000−k. 这个概率的计算量很大. 由于 n 很大, p 很小, 且 λ=np=5. 所以用泊松近似得
P(X⩽5)≈k=0∑5k!5ke−5=0.616. 例 有 10000 名同年龄段且同社会阶层的人参加了某保险公司的一项人寿保险.每个投保人在每年初需交纳 200 元保费, 而在这一年中若投保人死亡, 则受益人可从保险公司获得 100000 元的赔偿费. 据生命表知这类人的年死亡率为 0.001 . 试求保险公司在这项业务上
(1) 亏本的概率;
(2) 至少获利 500000 元的概率.
解 设 X 为 10000 名投保人在一年中死亡的人数, 则 X 服从二项分布 b(10000,0.001). 保险公司在这项业务上一年的总收人为 200×10000=2000000 (元). 因为 n=10000 很大, p=0.001 很小, 所以用 λ=np=10 的泊松分布进行近似计算.
(1) 保险公司在这项业务上 “亏本” 就相当于事件 {X>20} 发生. 因此所求概率为
P(X>20)=1−P(X⩽20)≈1−k=0∑20k!10ke−10=1−0.998=0.002. 由此可看出,保险公司在这项业务上亏本的可能性是微小的.
(2) 保险公司在这项业务上“至少获利 500000 元” 就相当于事件 {X⩽15} 发生.因此所求概率为
P(X⩽15)≈k=0∑15k!10ke−10=0.951. 由此可看出, 保险公司在这项业务上至少获利 500000 元的可能性很大.
例为保证设备正常工作, 需要配备一些维修工. 如果各台设备发生故障是相互独立的, 且每台设备发生故障的概率都是 0.01 . 试在以下各种情况下, 求设备发生故障而不能及时修理的概率.
(1) 1 名维修工负责 20 台设备;
(2) 3 名维修工负责 90 台设备;
(3) 10 名维修工负责 500 台设备.
解 (1) 以 X1 表示 20 台设备中同时发生故障的台数, 则 X1∼b(20,0.01). 用参数为 λ=np=20×0.01=0.2 的泊松分布作近似计算, 得所求概率为
P(X1>1)≈1−k=0∑1k!0.2ke−0.2=1−0.982=0.018. (2) 以 X2 表示 90 台设备中同时发生故障的台数, 则 X2∼b(90,0.01). 用参数为 λ=np=90×0.01=0.9 的泊松分布作近似计算, 得所求概率为
P(X2>3)≈1−k=0∑3k!0.9ke−0.9=1−0.987=0.013. 注意, 此种情况下, 不但所求概率比 (1) 中有所降低, 而且 3 名维修工负责 90 台设备相当于每个维修工负责 30 台设备, 工作效率是 (1) 中的 1.5 倍.
(3) 以 X3 表示 500 台设备中同时发生故障的台数, 则 X3∼b(500,0.01). 用参数为 λ=np=500×0.01=5 的泊松分布作近似计算, 得所求概率为
P(X3>10)≈1−k=0∑10k!5ke−5=1−0.986=0.014. 注意, 此种情况下所求概率与 (2) 中基本上一样, 而 10 名维修工负责 500 台设备相当于每个维修工负责 50 台设备, 工作效率是 (2) 中的 1.67 倍, 是 (1) 中的 2.5 倍.
由此可知: 若干维修工共同负责大量设备的维修, 将提高工作的效率.
例 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数 λ=5 的泊松分布来描述,为了以 95% 以上的概率保证不脱销,问商店在月底至少应进该商品多少件?
解 设该商品每月的销售数为 X ,已知 X 服从参数 λ=5 的泊松分布.设商店在月底应进该种商品 m 件,求满足 P(X⩽m)>0.95 的最小的 m ,即
k=0∑mk!5ke−5>0.95 查泊松分布表,有 ∑k=09k!5ke−5≈0.968172,∑k=08k!5ke−5≈0.931906 .于是得 m=9 件.