5._切比雪夫不等式

切比雪夫不等式

设随机变量 XX 的数学期望 E(X)E(X) 及方差 D(X)D(X) 存在,则对于任意的 ε>0\varepsilon>0 ,有

P(XE(X)ε)D(X)ε2\boxed { P(|X-E(X)| \geq \varepsilon) \leq \frac{D(X)}{\varepsilon^2} }

这就是切比雪夫不等式。

切比雪夫不等式的通俗解释

引例1

扔一个硬币求正面的概率。容易知道,他的概率是0.5,但是在实验时,有可能 ①扔100次,正面的次数是48 ②扔1000次,正面的次数490 ③扔10000次,正面的次数为4800 ④扔100000次,正面的次数为50001 可以发现,随着重复的次数越来越多,其正面的几率越来越接近期望值0.5。 我们把这种重复次数很多的数叫做“大数

引例2

方差表示的数据离数学期望上下浮动的参数,例如张三和李四的立定跳远都是3m,张三的方差为0.00520.005^2,李四的方差为0.00820.008^2,可以看到,张三的成绩更稳定。因为方差本质反映数据的波动性

定义

有了上面两个引例,就容易理解切比雪夫不等式了。切比雪夫不等式的意思是:

“随机变量XX减去他的期望EXEX得绝对值”大于ε\varepsilon的概率 小于 方差除以ε2\varepsilon^2

我们把切比雪夫不等式拆开看。 (1)在中学就学过,xa|x-a|的绝对值表示xx离开a的距离,因为有左右两个,所以加了绝对值。同样XEX|X-EX|表示,样本值和他的期望值距离。 上面,张三跳远的平均值为3m,可能第一次跳 2.9米,第二次跳3.1米,不管是2.9米还是3.1米,样本值减去期望值后,误差都是0.1米(有绝对值,就不用考虑误差的正负了)。

(2)把XEX|X-EX|当成一个整体考虑,那XEX|X-EX|就表示每次跳远时,实际值和期望值的误差距离。比如上面张三第一次跳远的误差是0.1,第二次跳远误差是0.1,第三次跳远0.2,第四次跳远误差0.05,第五次跳远误差0.01等。可以看到,不管怎么跳,实际值总是在期望值左右来回摆动。 (3)在 P(XEX)>εP(|X-EX|) >\varepsilon 里, 微积分里已经学过ε\varepsilon表示一个无穷小量,比如取ε=0.1\varepsilon=0.1,则 P(XEX>0.1)P(|X-EX|>0.1)表示 张三跳远时,误差范围超过0.1的概率,也就是下图阴影部分的值 图片

(4)切比雪夫不等式告诉我们,张三跳远时,误差范围超过0.1的概率 小于 D(x)ε2=10.12=0.00520.12=0.25%\dfrac{D(x)}{\varepsilon^2} = \dfrac{1}{0.1^2}= \dfrac{0.005^2}{0.1^2}=0.25\%

假设取ε=0.2\varepsilon=0.2,可以计算张三跳远时,误差范围超过0.2的概率 小于 D(x)ε2=10.12=0.00520.22=0.062%\dfrac{D(x)}{\varepsilon^2} = \dfrac{1}{0.1^2}= \dfrac{0.005^2}{0.2^2}=0.062\%

可以看到,ε\varepsilon取的越大,他的概率越小。这也很好理解,想象一下,张三跳远平均值是3米,取误差 ε=5\varepsilon=5,然后可以说,张三跳远误差超过5米的概率为0,这是没问题的。

我们说过切比雪夫不等式左边求的是上图阴影部分的概率,这就像射箭,靶心是数学期望ε\varepsilon相当于误差的半径,当 允许的ε\varepsilon误差半径越大,则落在外面的概率越低。

切比雪夫还有一个等价公式(反向说法)即:

P{XEX<ε}1DX2ε2\boxed{ P\{|X-EX|<\varepsilon\} \geqslant 1-\frac{DX^2}{\varepsilon^2} }

例如 取 ε=0.0001\varepsilon=0.0001 (趋近于零),则1DX2ε21-\frac{DX^2}{\varepsilon^2}就趋近于1(ε\varepsilon 在分母上). 然后我们可以说,张三跳远平均值为3,每次跳远误差超过0.0001的概率为100%,即张三每次跳远误差一定超过0.0001m

证明

仅给出 XX 为连续型随机变量的证明。

P(XE(X)ε)=xε(x)εf(x)dxxE(x)εXE(X)2ε2f(x)dx+XE(X)2ε2f(x)dx=D(X)ε2\begin{aligned} & P(|X-E(X)| \geq \varepsilon)=\int_{|x-\varepsilon(x)| \geq \varepsilon} f(x) d x \leq \int_{|x-E(x)| \sum \varepsilon} \frac{|X-E(X)|^2}{\varepsilon^2} f(x) d x \\ & \leq \int_{-\infty}^{+\infty} \frac{|X-E(X)|^2}{\varepsilon^2} f(x) d x=\frac{D(X)}{\varepsilon^2} \end{aligned}

切比雪夫不等式作用

如果记数学期望EX=μEX=\mu, 方差DX2=σ2DX^2=\sigma^2, 利用切比雪夫不等式可以在未知随机变量 XX 分布的情况下,估计 P{Xμε}P\{|X-\mu| \geqslant \varepsilon\}P{Xμ<ε}P\{|X-\mu|<\varepsilon\} 。例如,

P{Xμ<3σ}1σ29σ20.8889P\{|X-\mu|<3 \sigma\} \geqslant 1-\frac{\sigma^2}{9 \sigma^2} \approx 0.8889
P{Xμ<4σ}1σ216σ2=0.9375.P\{|X-\mu|<4 \sigma\} \geqslant 1-\frac{\sigma^2}{16 \sigma^2}=0.9375 .

由切比雪夫不等式可知当 σ2\sigma^2 越小时,P{Xμ<ε}P\{|X-\mu|<\varepsilon\} 就越大,表明随机变量 XX 的取值集中在 μ\mu 的附近,进一步体现了 σ2\sigma^2 的意义.特别地,当 σ2=0\sigma^2=0 时,有下列推论:

推论 在切比雪夫不等式中,如果 σ2=0\sigma^2=0 ,则 P{X=EX}=1P\{X=E X\}=1 . 证 如果 σ2=0\sigma^2=0 ,则由切比雪夫不等式知,对任意的 ε>0\varepsilon>0 ,有 P{Xμ<ε}1P\{|X-\mu|<\varepsilon\} \geqslant 1 ,从而 P{Xμ<ε}=1P\{|X-\mu|<\varepsilon\}=1 .考虑到 ε\varepsilon 的任意性,得 P{X=μ}=1P\{X=\mu\}=1 ,即 P{X=EX}=1P\{X=E X\}=1

例题

XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) 计算 P(Xμ3σ)P(|X-\mu| \geq 3 \sigma) 。 解: 因为 XμσN(0,1)\frac{X-\mu}{\sigma} \sim N(0,1) ,所以

P(Xμ3σ)=P(Xμσ3)P(Xμσ3)=22Φ(3)=0.003\begin{aligned} & P(|X-\mu| \geq 3 \sigma)=P\left(\left|\frac{X-\mu}{\sigma}\right| \geq 3\right) \\ & P\left(\left|\frac{X-\mu}{\sigma}\right| \geq 3\right)=2-2 \Phi(3)=0.003 \end{aligned}

XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) 用切比雪夫不等式估计概率 P(Xμ3σ)P(|X-\mu| \geq 3 \sigma) 。 解 因为 ε=3σ\varepsilon=3 \sigma ,由切比雪夫不等式得

P(XE(X)ε)D(X)ε2P(Xμ3σ)D(X)(3σ)2=19\begin{aligned} & P(|X-E(X)| \geq \varepsilon) \leq \frac{D(X)}{\varepsilon^2} \\ & P(|X-\mu| \geq 3 \sigma) \leq \frac{D(X)}{(3 \sigma)^2}=\frac{1}{9} \end{aligned}

点评 此类题型的求解方法比较单一,在随机变量 XX 的期望 EXE X 和方差 DXD X 已知的情况下,直接应用切比雪夫不等式即可;若 EXE XDXD X 未知,当根据题意并结合数学期望和方差的性质计算出 EXE XDXD X ,然后再套用切比雪夫不等式.

设随机变量 XX 的方差 D(X)=0D(X)=0 ,求证, XX 服从参数为 cc 的退化分布。 证明 利用切比雪夫不等式得,对任意的 ε>0\varepsilon>0 ,有

0P(XE(X)ε)D(X)ε2=00 \leq P(|X-E(X)| \geq \varepsilon) \leq \frac{D(X)}{\varepsilon^2}=0

ε\varepsilon 的任意性知

P(X=E(X))=1P(X=E(X))=1

设随机变量 XX 的标准化随机变量为 X=XEXDX X^*=\frac{X-E X}{\sqrt{D X}} ,试根据切比雪夫不等式估计概率 P{X2}P\left\{\left|X^*\right| \leq 2\right\} 。 解

P{X<2}=P{XEXDX<2}=P{XEX<2DX}1DX(2DX)2=34\begin{aligned} & \quad P\left\{\left|X^*\right|<2\right\}=P\left\{\left|\frac{X-E X}{\sqrt{D X}}\right|<2\right\}=P\{|X-E X|<2 \sqrt{D X}\} \geqslant 1- \\ & \frac{D X}{(2 \sqrt{D X})^2}=\frac{3}{4} \text {. } \end{aligned}

已知正常男性成人血液中,每一毫升白细胞数平均是 7300 ,均方差是 700 ,利用切比雪夫不等式估计每毫升含白细胞数在 520094005200 \sim 9400 之间的概率 pp

解 假设正常男性成人血液中每毫升白细胞数为 XX ,依题设 E(X)=7300,D(X)=7002E(X)=7300, D(X)=700^2 ,于是

P{5200<X<9400}=P{X7300<2100}1700221002=89,P\{5200<X<9400\}=P\{|X-7300|<2100\} \geqslant 1-\frac{700^2}{2100^2}=\frac{8}{9},

即每毫升含白细胞数在 520094005200 \sim 9400 之间的概率不低于 89\frac{8}{9}

设电站供电网有 10000 个电灯,夜晚时每个电灯开灯的概率均为 0.7 ,假定所有电灯的开或关是相互独立的,试用切比雪夫不等式估计夜晚同时开着的电灯在 680072006800 \sim 7200个的概率. (解)令 XX 表示在夜晚同时开着的电灯数,则 XX 服从 n=10000,p=0.7n=10000, p=0.7 的二项分布,这时 E(X)=np=7000,D(X)=npq=2100E(X)=n p=7000, D(X)=n p q=2100 ,由切比雪夫不等式可得

P{6800<X<7200}=P{X7000<200}1210020020.95P\{6800<X<7200\}=P\{|X-7000|<200\} \geqslant 1-\frac{2100}{200^2} \approx 0.95

这个概率的近似值表明,在 10000 个电灯中,开着的电灯在 680072006800 \sim 7200 个的概率大于 0.95 .而实际上,此概率可由二项分布求得精确值为 0.99999 .由此可知,切比雪夫不等式虽可用来估计概率,但精度不够高.

5._切比雪夫不等式 - 概率论与数理统计 | OpenTech