20._多变量的卷积

我们已经成功地讨论了两个相互独立的随机变量之和的分布.在此基础上,我们来考察三个或更多个相互独立的随机变量之和的分布。设 XiX_i 是概率密度函数为 fXif_{X_i} 的随机变量. 如果 UUVV 是两个相互独立的随机变量,那么 fU+V(z)=(fUfV)(z)f_{U+V}(z)=\left(f_U * f_V\right)(z) .由此能不能求出 fX1+X2+X3f_{X_1+X_2+X_3} ,或者更一般的 fX1++Xnf_{X_1+\cdots+X_n} ? 答案是肯定的!

定理: (独立的随机变量之和)设 X1,X2,XnX_1, X_2 \cdots, X_n 是相互独立的随机变量,它们的概率密度函数分别是 fX1,fX2,,fXnf_{X_1}, f_{X_2}, \cdots, f_{X_n} ,那么

fX1++Xn(z)=(fX1fX2fXn)(z)f_{X_1+\cdots+X_n}(z)=\left(f_{X_1} * f_{X_2} * \cdots * f_{X_n}\right)(z)

其中

(f1f2fn)(z)=(f1(f2(fn2(fn1fn))))(z)\left(f_1 * f_2 * \cdots * f_n\right)(z)=\left(f_1 *\left(f_2 * \cdots *\left(f_{n-2} *\left(f_{n-1} * f_n\right)\right) \cdots\right)\right)(z)

我们已经证明了卷积是可交换的,也就是说 fg=gff * g=g * f .另外,卷积还满足结合律:(fg)h=f(gh)(f * g) * h=f *(g * h) .记住,卷积要用两个函数作为输入,并返回一个函数作为输出.我们不能直接对三个函数求卷积.所以,如果给出了 fghf * g * h ,就要小心地解释这是什么意思.因为卷积需要两个输入,所以这里有两种解释方法:fghf * g * h等于 (fg)h(f * g) * h 或者 f(gh)f *(g * h) .幸运的是,因为卷积满足结合律,所以这两个表达式是相等的,写哪个都可以。虽然我们可以直接证明结合律,但没必要这样做.原因在于,我们只在乎关于概率密度函数的卷积定理,而且有个很好的技巧能让我们更自由地使用结合律.

定理证明:我们只考察 n=3n=3 的情形,一般情形下的结果可以类似地证明。

那么,现在就来考察 Z=X1+X2+X3Z=X_1+X_2+X_3 .我们把这个式子写成 Z=(X1+X2)+Z=\left(X_1+X_2\right)+ X3X_3 .这样做的好处是,对于两个相互独立的随机变量,它们的和的概率密度函数就是它们概率密度函数的卷积.(注意,因为 X3X_3 独立于 X1X_1X2X_2 ,所以 X3X_3 与它们的和也是相互独立的.)于是有

fZ(z)=(fX1+X2fX3)(z)f_Z(z)=\left(f_{X_1+X_2} * f_{X_3}\right)(z)

现在,由定理 10.1.2 可知,fX1+X2=fX1fX2f_{X_1+X_2}=f_{X_1} * f_{X_2} .把它代入上式,就得到了

fZ(z)=((fX1fX2)fX3)(z)f_Z(z)=\left(\left(f_{X_1} * f_{X_2}\right) * f_{X_3}\right)(z)

当然,我们也可以写成 Z=X1+(X2+X3)Z=X_1+\left(X_2+X_3\right) ,而不是 Z=(X1+X2)+X3Z=\left(X_1+X_2\right)+X_3 .在这种情况下,首先得到的是

fZ(z)=(fX1fX2+X3)(z)f_Z(z)=\left(f_{X_1} * f_{X_2+X_3}\right)(z)

利用 fX2+X3=fX2fX3f_{X_2+X_3}=f_{X_2} * f_{X_3} ,有

fZ(z)=(fX1(fX2fX3))(z)f_Z(z)=\left(f_{X_1} *\left(f_{X_2} * f_{X_3}\right)\right)(z)

如果继续沿着这种思路论证下去,就不难看出如何对卷积进行分组并不重要。我们甚至可以颠倒函数的次序,比如 X1+X2+X3=X2+X3+X1X_1+X_2+X_3=X_2+X_3+X_1(等等).

对于四个相互独立的随机变量,可以写成 X1+(X2+(X3+X4))X_1+\left(X_2+\left(X_3+X_4\right)\right) ,这会给出概率密度函数 fX1(fX2(fX3fX4))f_{X_1} *\left(f_{X_2} *\left(f_{X_3} * f_{X_4}\right)\right)

上述过程是我最喜欢的论述之一。注意,这里完全没有求积分或求和。我们先分组,接着探讨了由此带来的结果,并最终得到了答案.我把这种方法称为分组证明法,其他相关示例,请参阅 A. 3 节.

回到 10.2 节的骰子问题.接下来的问题将会展示一个真正的精彩视角.独立地拋掷三颗骰子,我们可以求出得到数字的 PDF.我们知道掷一颗骰子以及掷两颗骰子所得数字的概率密度函数,所以现在只需要求出卷积.遗憾的是,说起来容易做起来难,原因是这里的代数运算有些杂乱。

我们把抛掷三颗骰子的头痛问题留给你自己来解决,现在继续考虑掷四颗骰子的情况.考察四颗骰子的好处在于,我们可以采用另一种还没有被提到过的分组方法.更好的解决方案是将四个变量分组为 (X1+X2)+(X3+X4)\left(X_1+X_2\right)+\left(X_3+X_4\right) ,而不是 X1+(X2+(X3+X4))X_1+\left(X_2+\left(X_3+X_4\right)\right) .为什么这种做法会更好呢?现在仍然要进行三次加法运算,不是吗?是的,但也不对!再看一下第二种分组方法:(X1+X2)+(X3+X4)\left(X_1+X_2\right)+\left(X_3+X_4\right) .注意,第一个加法和最后一个加法是相同的,概率密度函数 fX1+X2=fX1fX2f_{X_1+X_2}=f_{X_1} * f_{X_2} 就等于 fX3+X4=fX3fX4f_{X_3+X_4}=f_{X_3} * f_{X_4} .所以,虽然从技术上看,这里要进行三次加法运算,但其中两次是相同的.这远好于 X1+(X2+(X3+X4))X_1+\left(X_2+\left(X_3+X_4\right)\right) 的分组方式,因为后者涉及三个完全不同的加法运算。

如果考察八个相互独立且同分布的随机变量的和,这种优势就更明显了.这个和可以写成

((X1+X2)+(X3+X4))+((X5+X6)+(X7+X8)),\left(\left(X_1+X_2\right)+\left(X_3+X_4\right)\right)+\left(\left(X_5+X_6\right)+\left(X_7+X_8\right)\right),

从而减少大量运算.两个变量的加法要进行四次,然后把得到的和相加两次,接着再把两个结果相加.换句话说,我们要计算三种不同的卷积,但是如果采用下列分组方式

X1+(X2+(X3+(X4+(X5+(X6+(X7+X8)))))),X_1+\left(X_2+\left(X_3+\left(X_4+\left(X_5+\left(X_6+\left(X_7+X_8\right)\right)\right)\right)\right)\right),

就必须算出七个不同的卷积.这显然没有第一种分组方式好. 从某种意义上说,上述启示并不重要,但这种观点是不正确的.没错,如果不使用巧妙的分组方法,我们也可以算出 PDF,但这只会增加麻烦。我的人生目标之一就是尽量减少烦琐乏味的代数运算.分组是一种很好的方法,可以让代数运算更容易处理。

为了看出这一点,我们来考察独立地抛掷四颗骰子所得到的数字之和.让 X1X_1X2, X3X_2, ~ X_3X4X_4 分别表示这四颗骰子掷出的数字.我们知道这几个变量服从的分布,还知道 X1+X2X_1+X_2X3+X4X_3+X_4 的概率密度函数

fX1+X2(u)=fX3+X4(u)={u136 若 u{2,,7}13u36 若 u{7,,12}0 其他. f_{X_1+X_2}(u)=f_{X_3+X_4}(u)= \begin{cases}\frac{u-1}{36} & \text { 若 } u \in\{2, \cdots, 7\} \\ \frac{13-u}{36} & \text { 若 } u \in\{7, \cdots, 12\} \\ 0 & \text { 其他. }\end{cases}

现在就可以计算掷出的数字之和为 4,5,6,,244,5,6, \cdots, 24 的概率. 设 Z=X1+X2+X3+X4Z=X_1+X_2+X_3+X_4 ,我们有 fZ(z)=(fX1+X2fX3+X4)(z)f_Z(z)=\left(f_{X_1+X_2} * f_{X_3+X_4}\right)(z) ,其中,对于等号右端的两个非 0 的概率密度函数,它们的输入都只能是介于 2 和 12 之间的值.例如

fZ(6)=k=212fX1+X2(k)fX3+X4(6k)=k=24fX1+X2(k)fX3+X4(6k)=21364136+31363136+41362136=101296=5648\begin{aligned} f_Z(6) & =\sum_{k=2}^{12} f_{X_1+X_2}(k) f_{X_3+X_4}(6-k) \\ & =\sum_{k=2}^4 f_{X_1+X_2}(k) f_{X_3+X_4}(6-k) \\ & =\frac{2-1}{36} \frac{4-1}{36}+\frac{3-1}{36} \frac{3-1}{36}+\frac{4-1}{36} \frac{2-1}{36}=\frac{10}{1296}=\frac{5}{648} \end{aligned}

类似地,我们还能求出其余 20 个函数值.这比把 64=12966^4=1296 种可能的结果全都写出来要好得多.图 10-3 显示了其结果. 图片 如果你听说过中心极限定理, 那就透过它看看图 10-3 —— 你应该能开始看到钟形曲线, 或者开始想到高斯分布了.