4._马尔可夫不等式

马尔可夫不等式

定义:给定 XX 是一个非负的随机变量,我们有:

P(Xa)E(X)a\boxed{ \operatorname{P}(X \geq a) \leq \frac{ E (X)}{a} }

证明:当 XX 为非负离散型随机变量时,设 XX 的分布列为 P(X=xi)=pi,i=1,2,,nP\left(X=x_i\right)=p_i, i=1,2, \cdots, n ,其中 pi(0,+)p_i \in(0,+\infty)xi[0,+)(i=1,2,,n),i=1npi=1x_i \in[0,+\infty)(i=1,2, \cdots, n), \sum_{i=1}^n p_i=1 ,则对任意 ε>0\varepsilon>0

P(Xε)=xiεpixiεxiεpi=1εxiExipi1εi=1nxipi=E(X)εP(X \geq \varepsilon)=\sum_{x_i \geq \varepsilon} p_i \leq \sum_{x_i \geq \varepsilon} \frac{x_i}{\varepsilon} p_i=\frac{1}{\varepsilon} \sum_{x_i \geq E} x_i p_i \leq \frac{1}{\varepsilon} \sum_{i=1}^n x_i p_i=\frac{E(X)}{\varepsilon}

其中符号 xiEAi\sum_{x_i \geq E} A_i 表示对所有满足 xiεx_i \geq \varepsilon 的指标 ii 所对应的 AiA_i 求和.

马尔可夫不等式通俗解释

马尔可夫不等式的基本思想是:给定一个非负的随机变量 X(X0)X(X \geq 0) ,如果其期望是一个较小的值,对于随机变量的采样出来的序列中 X=x1,x2,x3,X=x_1, x_2, x_3, \ldots ,我们观察到一个较大值的 xix_i 的概率是很小的。

我们来考察一个例子.不妨设中国人的人均年收入是 60000元(6万元).随机选出一个家庭的收入至少为 120000元(12万元)的概率是多少?至少为 1000000元(100万元)的概率是多少? 从题目看,我们没有足够的信息来解决这个问题.也许有些人非常富有,而其他人却赚不到钱;或者恰恰相反,也许每个人的收入都接近平均水平.如果不知道收入是如何分配的,我们就无法得到确切的答案。但是,可以利用马尔可夫不等式来得到答案的范围.为此,我们需要一个均值有限且非负的随机变量.如果假设没有家庭的收入是负的,那么上述条件就能满足,因为另一个条件已经限制了数据(均值是有限的 60000元)。

因此,一个家庭至少有 120000 元收入的概率不会超过 60000/120000=1/260000 / 120000=1 / 2 ,或者说,收入是平均水平 2 倍的人最多占总人口的一半.那么百万富翁呢?成为百万富翁的概率最多是 60000/1000000=0.0660000 / 1000000=0.06 ,这种家庭最多占 6%6 \%

可以看到马尔可夫不等式的估值非常粗糙,因此接下来会介绍切比雪夫不等式。