8._德莫弗一拉普拉斯中心极限定理

德莫弗一拉普拉斯定理

假设随机变量服从二项分布,即 YnB(n,p)(0<p<1,n1)Y_n \sim B(n, p)(0<p<1, n \geqslant 1) ,则对任意实数 xx ,有

limnP{Ynnpnp(1p)x}=12πxet22dt=Φ(x).\lim _{n \rightarrow \infty} P\left\{\dfrac{Y_n-n p}{\sqrt{n p(1-p)}} \leqslant x\right\}=\dfrac{1}{\sqrt{2 \pi}} \int_{-\infty}^x e^{-\frac{t^2}{2}} d t=\Phi(x) .

这个被称为 德莫弗一拉普拉斯中心极限定理,也称为二项分布极限定理。 证明:略。

他表明,如果 XB(n,p)X \sim B(n, p) ,则当 nn 充分大时,有

X 近似 N(np,np(1p)).X \stackrel{\text { 近似 }}{\sim} N(n p, n p(1-p)) .

如下图 图片

即当 n30n \geqslant 30 时,其误差可以忽略不计.

棣莫弗-拉普拉斯中心极限定理,也称为二项分布以正态分布为极限分布的中心极限定理

注意: (1)如果记 XiB(1,p)(0<p<1,i=1,2,)X_i \sim B(1, p)(0<p<1, i=1,2, \cdots) ,即 Xi(10p1p)X_i \sim\left(\begin{array}{cc}1 & 0 \\ p & 1-p\end{array}\right) 且相互独立,则

Yn=i=1nXiB(n,p)Y_n=\sum_{i=1}^n X_i \sim B(n, p)

由列维—林德伯格定理推出棣莫弗—拉普拉斯定理。 (2)二项分布概率计算的三种方法. 设 XB(n,p)X \sim B(n, p)

①当 nn 不太大时 (n10)(n \leqslant 10) ,直接计算

P{X=k}=Cnkpk(1p)nk,k=0,1,,nP\{X=k\}=C_n^k p^k(1-p)^{n-k}, \quad k=0,1, \cdots, n

②当 nn 较大且 pp 较小时 (n>10,p<0.1),λ=np(n>10, p<0.1), \lambda=n p 适中,根据泊松定理有近似公式

P{X=k}=Cnkpk(1p)nkλkk!eλ,k=0,1,,nP\{X=k\}=C_n^k p^k(1-p)^{n-k} \approx \frac{\lambda^k}{k!} e^{-\lambda}, \quad k=0,1, \cdots, n

③当 nn 较大而 pp 不太大时 (p<0.1,np10)(p<0.1, n p \geqslant 10) ,根据中心极限定理,有近似公式

P{a<X<b}Φ(bnpnp(1p))Φ(anpnp(1p))P\{a<X<b\} \approx \Phi\left(\frac{b-n p}{\sqrt{n p(1-p)}}\right)-\Phi\left(\frac{a-n p}{\sqrt{n p(1-p)}}\right)

隶莫弗-拉普拉斯中心极限定理表明n重伯努利试验事件A出现的次数服从正态分布。

某单位的局域网有 100 个终端,每个终端有 10%10 \% 的时间在使用,如果各个终端使用与否是相互独立的.(1)计算在任何时刻同时最多有 15 个个终端在使用的概率;(2)用中心极限定理计算在任何时刻同时最多有 15 个个终端在使用的概率的近似值;(3)用泊松定理计算在任何时刻同时最多有 15 个终端在使用的概率近似值。

解 设随机变量 Xi={1, 第 i 个终端在使用;0, 否则。 X_i=\left\{\begin{array}{l}1, \text { 第 } i \text { 个终端在使用;} \\ 0, \text { 否则。 }\end{array}\right. i=1,2,,100i=1,2, \cdots, 100 .由已知得 X1,,X100 X_1, \cdots, X_{100} 独立同分布 且 XiB(1,p)X_i \sim B(1, p) 其中 p=0.1p=0.1 .同时使用的终端数 i=1100XiB(100,0.1)\sum_{i=1}^{100} X_i B(100,0.1)

解 (1)借助于计算机得

P(i=1100Xi15)=k=015(100k)0.1k×0.9100k=0.9601P\left(\sum_{i=1}^{100} X_i \leq 15\right)=\sum_{k=0}^{15}\binom{100}{k} 0.1^k \times 0.9^{100-k}=0.9601

即在任何时刻同时最多有 15 个终端在使用的概率为 0.9601 。 (2)因为 E(i=1100Xi)=100×0.1=10,D(i=1100Xi)=10×0.9=9E\left(\sum_{i=1}^{100} X_i\right)=100 \times 0.1=10, D\left(\sum_{i=1}^{100} X_i\right)=10 \times 0.9=9 。运用德莫弗一拉普拉斯中心极限定理 i=1100Xi 近以 N(10,9)\sum_{i=1}^{100} X_i \stackrel{\text { 近以 }}{\sim} N(10,9) .因此

P(i=1100Xi15)1Φ(15109)=Φ(53)=0.9522P\left(\sum_{i=1}^{100} X_i \leq 15\right) \approx 1-\Phi\left(\frac{15-10}{\sqrt{9}}\right)=\Phi\left(\frac{5}{3}\right)=0.9522

即在任何时刻同时最多有 15 个终端在使用的概率近似值为 0.9522 .

(3)因为 n>10,p<0.1n>10, p<0.1 ,所以 i=1100Xi 近以 P(10)\sum_{i=1}^{100} X_i \stackrel{\text { 近以 }}{\sim} P(10) .有

P(i=1100Xi15)k=015e1010kk!=0.9513P\left(\sum_{i=1}^{100} X_i \leq 15\right) \approx \sum_{k=0}^{15} e^{-10} \frac{10^k}{k!}=0.9513

即在任何时刻同时最多有 15 个终端在使用的概率近似值为 0.9513 .

三大中心极限定理区别与应用

独立同分布的中心极限定理 limnP(i=1nXinμnσ)x)=x12πet22dt=Φ(x)\left.\lim _{n \rightarrow \infty} P\left(\dfrac{\sum_{i=1}^n X_i-n \mu}{\sqrt{n} \sigma }\right) \le x \right)=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e ^{-\frac{t^2}{2}} d t=\Phi(x)

棣莫弗-拉普拉斯定理 limnP{Xnpnp(1p)x}=x12πet22dt=Φ(x)\lim _{n \rightarrow \infty} P \left\{\dfrac{X-n p}{\sqrt{n p(1-p)}} \leqslant x\right\}=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e ^{-\frac{t^2}{2}} dt =\Phi(x)

李雅普诺夫定理 limnP{i=1nXii=1nμik=1nσk2x}=x12πet22dt=Φ(x)\lim _{n \rightarrow \infty} P\left\{\dfrac{\sum_{i=1}^n X_i-\sum_{i=1}^n \mu_i }{\sqrt{\sum_{k=1}^n \sigma_k^2}} \leqslant x \right\}=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e ^{-\frac{t^2}{2}} d t=\Phi(x)

背景

首先,列维-林德伯格定理,也就是独立同分布的中心极限定理,适用于独立同分布的随机变量序列,只要期望和方差存在,标准化后的和趋近于正态分布。这个定理是中心极限定理中最经典的形式,应用广泛,比如在统计学中的大样本推断。

然后是棣莫弗-拉普拉斯定理,它其实是列维-林德伯格定理的一个特例,专门针对二项分布的情况。当试验次数n很大时,二项分布可以用正态分布来近似。这个定理在概率论早期由棣莫弗提出,后来拉普拉斯推广,所以名字是两个人的。

接下来是李雅普诺夫定理,属于独立不同分布情况下的中心极限定理。李雅普诺夫放宽了条件,允许随机变量不同分布,但需要满足李雅普诺夫条件,即存在某个δ>0,使得高阶矩的条件成立。这样,即使变量不同分布,只要满足条件,标准化后的和仍然趋近于正态分布。

核心条件与适用范围

定理独立性分布特征矩条件通俗理解
列维-林德伯格定理独立同分布同分布,存在期望和方差仅需一阶、二阶矩存在同分布数据的“平均化”效应,如多次测量取平均后趋近正态分布。
棣莫弗-拉普拉斯定理独立同分布二项分布(特殊同分布)仅需一阶、二阶矩存在二项分布中成功与失败的独立叠加,当试验次数极大时,整体结果呈现正态性。 是列维-林德伯格定理的特例 。
李雅普诺夫定理独立不同分布允许不同分布需满足李雅普诺夫条件(存在 δ>0\delta >0 ),高阶矩有界)独立不同分布随机变量序列的标准化和依分布收敛于标准正态分布 。

应用场景对比

场景适用定理典型问题
同分布数据列维-林德伯格定理大样本均值估计(如重复实验测量误差分析) 。
二项分布近似棣莫弗-拉普拉斯定理抛硬币、抽样调查中成功次数的正态近似 。
异质数据融合李雅普诺夫定理多源传感器数据叠加、金融风险模型中不同资产波动的综合影响 。

8._德莫弗一拉普拉斯中心极限定理 - 概率论与数理统计 | OpenTech