20._多变量的卷积 - Probability Theory and Mathematical Statistics

我们已经成功地讨论了两个相互独立的随机变量之和的分布．在此基础上，我们来考察三个或更多个相互独立的随机变量之和的分布。设 $X_i$ 是概率密度函数为 $f_{X_i}$ 的随机变量．如果 $U$ 和 $V$ 是两个相互独立的随机变量，那么 $f_{U+V}(z)=\left(f_U * f_V\right)(z)$ ．由此能不能求出 $f_{X_1+X_2+X_3}$ ，或者更一般的 $f_{X_1+\cdots+X_n}$ ？答案是肯定的！

定理： （独立的随机变量之和）设 $X_1, X_2 \cdots, X_n$ 是相互独立的随机变量，它们的概率密度函数分别是 $f_{X_1}, f_{X_2}, \cdots, f_{X_n}$ ，那么

f_{X_1+\cdots+X_n}(z)=\left(f_{X_1} * f_{X_2} * \cdots * f_{X_n}\right)(z)

其中

\left(f_1 * f_2 * \cdots * f_n\right)(z)=\left(f_1 *\left(f_2 * \cdots *\left(f_{n-2} *\left(f_{n-1} * f_n\right)\right) \cdots\right)\right)(z)

我们已经证明了卷积是可交换的，也就是说 $f * g=g * f$ ．另外，卷积还满足结合律： $(f * g) * h=f *(g * h)$ ．记住，卷积要用两个函数作为输入，并返回一个函数作为输出．我们不能直接对三个函数求卷积．所以，如果给出了 $f * g * h$ ，就要小心地解释这是什么意思．因为卷积需要两个输入，所以这里有两种解释方法： $f * g * h$ 等于 $(f * g) * h$ 或者 $f *(g * h)$ ．幸运的是，因为卷积满足结合律，所以这两个表达式是相等的，写哪个都可以。虽然我们可以直接证明结合律，但没必要这样做．原因在于，我们只在乎关于概率密度函数的卷积定理，而且有个很好的技巧能让我们更自由地使用结合律．

定理证明：我们只考察 $n=3$ 的情形，一般情形下的结果可以类似地证明。

那么，现在就来考察 $Z=X_1+X_2+X_3$ ．我们把这个式子写成 $Z=\left(X_1+X_2\right)+$ $X_3$ ．这样做的好处是，对于两个相互独立的随机变量，它们的和的概率密度函数就是它们概率密度函数的卷积．（注意，因为 $X_3$ 独立于 $X_1$ 和 $X_2$ ，所以 $X_3$ 与它们的和也是相互独立的．）于是有

f_Z(z)=\left(f_{X_1+X_2} * f_{X_3}\right)(z)

现在，由定理 10．1．2 可知， $f_{X_1+X_2}=f_{X_1} * f_{X_2}$ ．把它代入上式，就得到了

f_Z(z)=\left(\left(f_{X_1} * f_{X_2}\right) * f_{X_3}\right)(z)

当然，我们也可以写成 $Z=X_1+\left(X_2+X_3\right)$ ，而不是 $Z=\left(X_1+X_2\right)+X_3$ ．在这种情况下，首先得到的是

f_Z(z)=\left(f_{X_1} * f_{X_2+X_3}\right)(z)

利用 $f_{X_2+X_3}=f_{X_2} * f_{X_3}$ ，有

f_Z(z)=\left(f_{X_1} *\left(f_{X_2} * f_{X_3}\right)\right)(z)

如果继续沿着这种思路论证下去，就不难看出如何对卷积进行分组并不重要。我们甚至可以颠倒函数的次序，比如 $X_1+X_2+X_3=X_2+X_3+X_1$ （等等）．

对于四个相互独立的随机变量，可以写成 $X_1+\left(X_2+\left(X_3+X_4\right)\right)$ ，这会给出概率密度函数 $f_{X_1} *\left(f_{X_2} *\left(f_{X_3} * f_{X_4}\right)\right)$ ．

上述过程是我最喜欢的论述之一。注意，这里完全没有求积分或求和。我们先分组，接着探讨了由此带来的结果，并最终得到了答案．我把这种方法称为分组证明法，其他相关示例，请参阅 A． 3 节．

回到 10.2 节的骰子问题．接下来的问题将会展示一个真正的精彩视角．独立地拋掷三颗骰子，我们可以求出得到数字的 PDF．我们知道掷一颗骰子以及掷两颗骰子所得数字的概率密度函数，所以现在只需要求出卷积．遗憾的是，说起来容易做起来难，原因是这里的代数运算有些杂乱。

我们把抛掷三颗骰子的头痛问题留给你自己来解决，现在继续考虑掷四颗骰子的情况．考察四颗骰子的好处在于，我们可以采用另一种还没有被提到过的分组方法．更好的解决方案是将四个变量分组为 $\left(X_1+X_2\right)+\left(X_3+X_4\right)$ ，而不是 $X_1+\left(X_2+\left(X_3+X_4\right)\right)$ ．为什么这种做法会更好呢？现在仍然要进行三次加法运算，不是吗？是的，但也不对！再看一下第二种分组方法： $\left(X_1+X_2\right)+\left(X_3+X_4\right)$ ．注意，第一个加法和最后一个加法是相同的，概率密度函数 $f_{X_1+X_2}=f_{X_1} * f_{X_2}$ 就等于 $f_{X_3+X_4}=f_{X_3} * f_{X_4}$ ．所以，虽然从技术上看，这里要进行三次加法运算，但其中两次是相同的．这远好于 $X_1+\left(X_2+\left(X_3+X_4\right)\right)$ 的分组方式，因为后者涉及三个完全不同的加法运算。

如果考察八个相互独立且同分布的随机变量的和，这种优势就更明显了．这个和可以写成

\left(\left(X_1+X_2\right)+\left(X_3+X_4\right)\right)+\left(\left(X_5+X_6\right)+\left(X_7+X_8\right)\right),

从而减少大量运算．两个变量的加法要进行四次，然后把得到的和相加两次，接着再把两个结果相加．换句话说，我们要计算三种不同的卷积，但是如果采用下列分组方式

X_1+\left(X_2+\left(X_3+\left(X_4+\left(X_5+\left(X_6+\left(X_7+X_8\right)\right)\right)\right)\right)\right),

就必须算出七个不同的卷积．这显然没有第一种分组方式好．从某种意义上说，上述启示并不重要，但这种观点是不正确的．没错，如果不使用巧妙的分组方法，我们也可以算出 PDF，但这只会增加麻烦。我的人生目标之一就是尽量减少烦琐乏味的代数运算．分组是一种很好的方法，可以让代数运算更容易处理。

为了看出这一点，我们来考察独立地抛掷四颗骰子所得到的数字之和．让 $X_1$ ， $X_2, ~ X_3$ 和 $X_4$ 分别表示这四颗骰子掷出的数字．我们知道这几个变量服从的分布，还知道 $X_1+X_2$ 和 $X_3+X_4$ 的概率密度函数

f_{X_1+X_2}(u)=f_{X_3+X_4}(u)= \begin{cases}\frac{u-1}{36} & \text { 若 } u \in\{2, \cdots, 7\} \\ \frac{13-u}{36} & \text { 若 } u \in\{7, \cdots, 12\} \\ 0 & \text { 其他. }\end{cases}

现在就可以计算掷出的数字之和为 $4,5,6, \cdots, 24$ 的概率．设 $Z=X_1+X_2+X_3+X_4$ ，我们有 $f_Z(z)=\left(f_{X_1+X_2} * f_{X_3+X_4}\right)(z)$ ，其中，对于等号右端的两个非 0 的概率密度函数，它们的输入都只能是介于 2 和 12 之间的值．例如

\begin{aligned} f_Z(6) & =\sum_{k=2}^{12} f_{X_1+X_2}(k) f_{X_3+X_4}(6-k) \\ & =\sum_{k=2}^4 f_{X_1+X_2}(k) f_{X_3+X_4}(6-k) \\ & =\frac{2-1}{36} \frac{4-1}{36}+\frac{3-1}{36} \frac{3-1}{36}+\frac{4-1}{36} \frac{2-1}{36}=\frac{10}{1296}=\frac{5}{648} \end{aligned}

类似地，我们还能求出其余 20 个函数值．这比把 $6^4=1296$ 种可能的结果全都写出来要好得多．图 10－3 显示了其结果． $图片$ 如果你听说过中心极限定理, 那就透过它看看图 10-3 —— 你应该能开始看到钟形曲线, 或者开始想到高斯分布了.