23._生成函数的唯一性和收敛性 - 概率论与数理统计

生成函数的唯一性和收敛性

根据序列 $\left\{a_n\right\}_{n=0}^{\infty}$ 的具体形式，生成函数 $G_a(s)$ 可能对所有的 $s$ 均存在，也可能只对某些 $s$ 存在，还可能仅当 $s=0$ 时存在．（由于 $G_s(0)=a_0$ ，所以这没有太多实际意义！）

考虑下面的例子．（1）最简单的情况是 $a_0=1$ 且其他项都满足 $a_n=0$ ，此时会得到 $G_a(s)=1$ ．更一般的情况是，除了有限多个 $n$ 之外，其余 $a_n$ 全为 0 ，那么 $G_a(s)$ 就是一个多项式。（2）如果对所有的 $n$ 均有 $a_n=1$ ，那么由几何级数公式可得， $G_a(s)=\sum_{n=0}^{\infty} s^n=$ $\frac{1}{1-s}$ ．当然，为了使用几何级数公式，这里必须满足 $|s|<1$ ．对于较大的 $s$ ，上述级数不收玫。（3）如果 $a_n=1 / n$ ！，那么 $G_a(s)=\sum_{n=0}^{\infty} s^n / n!$ ．这是 $e ^s$ 的定义，所以 $G_a(s)$ 对所有的 $s$ 均存在．（4）如果 $a_n=2^n$ ，那么 $G_a(s)=\sum_{n=0}^{\infty} 2^n s^n=\sum_{n=0}^{\infty}(2 s)^n$ ．这是比值为 $2 s$ 的几何级数．当 $|2 s|<1$ 时级数收玫，当 $|2 s|>1$ 时级数发散．因此，如果 $|s|<1 / 2$ ，那么 $G_a(s)=(1-2 s)^{-1}$ ．（5）如果 $a_n=n$ ！，那么不难看出，对于任意的 $|s|>0, G_a(s)$ 均发散。最容易看出该级数发散的方法是，对于任意一个固定的 $s \neq 0$ ，只要 $n$ 足够大，就有 $n!|s|^n>1$ ．因为级数中的项不趋向于 0 ，所以级数不能收玫．利用斯特林公式（参见第 18 章），我们可以估算 $n$ 必须取多大，才能保证 $n!|s|^n>1$ ．由斯特林公式可知， $n!\sim(n / e )^n \sqrt{2 \pi n}$ ，从而有 $n!|s|^n>(n|s| / e )^n . n!|s|^n$ 显然不会趋向于 0 ，因为当 $n> e /|s|$ 时，我们有 $n!|s|^n>1$ ．

如果有序列 $\left\{a_n\right\}_{n=0}^{\infty}$ ，那么显然可以得到它的生成函数（写出 $G_a(s)$ 的解析表达式可能并不容易，但它确实有一个公式）．反之亦然：如果有一个生成函数 $G_a(s)$ （存在一个 $\delta$ ，使得当 $|s|<\delta$ 时该函数收玫），那么我们就可以得到原来的序列．当 $G_a(s)$ 存在任意阶微分时，我们能轻松地得到这个序列，因为此时有 $a_n=\frac{1}{n!} \frac{ d ^n G_a(s)}{ d s^n}$ ．这个结果极其重要，我们以后会经常用到它，所以现在有必要把它作为定理单独列出来．

定理 19．3．1（序列生成函数的唯一性）设 $\left\{a_n\right\}_{n=0}^{\infty}$ 和 $\left\{b_n\right\}_{n=0}^{\infty}$ 是生成函数分别为 $G_a(s)$ 和 $G_b(s)$ 的两个数列。当 $|s|<\delta$ 时， $G_a(s)$ 和 $G_b(s)$ 均收敛。那么，这两个序列相等（即对于所有的 $i$ ，均有 $a_i=b_i$ ），当且仅当对于所有的 $|s|<\delta$ 均有 $G_a(s)=G_b(s)$ ．通过对生成函数求微分，我们可以重新得到序列： $a_n=\frac{1}{n!} \frac{ d ^n G_a(s)}{ d s^n}$ ．

证明：显然，如果 $a_i=b_i$ ，那么 $G_a(s)=G_b(s)$ ．对于另一个方向，如果可以对生成函数求任意阶微分，那么 $a_i=\frac{1}{i!} \frac{ d ^i G_a(s)}{ d s^i}$ 且 $b_i=\frac{1}{i!} \frac{ d ^i G_b(s)}{ d s^i}$ ．因为 $G_a(s)=G_b(s)$ ，所以这两个函数的导数也是相等的，从而有 $a_i=b_i$ ．

注 19．3．2 除以 $n$ ！看着有些不舒服，稍后我们会看到另一个不包含这个因子的生成函数。如果不想求微分，仍然可以利用生成函数来确定系数。显然，令 $s=0$ ，我们就得到了 $a_0$ 。接下来，观察 $\left(G_a(s)-a_0\right) / s$ 并让表达式中的 $s$ 等于 0 ，这样就能求出 $a_1$ ．按照这种方式继续进行下去，我们就可以求出任意的 $a_m$ ．当然，注意这与微分方法是多么相似！

最后是一个简短的提醒：虽然我们写出了生成函数，但这并不意味着它是有意义的！遗憾的是，不管 $s$ 取什么值（当然，除了 $s=0$ 之外，此时平凡地收敛），最终的和可能都不收敛。幸运的是，与概率相关的生成函数通常是（但不总是）收玫的，至少对某些 $s$ 收敛，稍后我们将详细讨论这个问题。判别级数是收敛还是发散的方法有很多，B． 3 节总结了四种更流行且更强大的判别法（比值判别法，根值判别法，比较判别法以及积分判别法）．

利用生成函数，最根本的是简化运算

离散型随机变量

定义19．4．1（序列的卷积）已知两个序列 $\left\{a_m\right\}_{m=0}^{\infty}$ 和 $\left\{b_n\right\}_{n=0}^{\infty}$ ．它们的卷积被定义为下面这个新序列 $\left\{c_k\right\}_{k=0}^{\infty}$

c_k=a_0 b_k+a_1 b_{k-1}+\cdots+a_{k-1} b_1+a_k b_0=\sum_{l=0}^k a_l b_{k-l} .

通常情况下，我们把它记作 $c=a * b$ ．这个定义来自于多项式乘法．如果 $f(x)=\sum_{m=0}^{\infty} a_m x^m$ 且 $g(x)=\sum_{n=0}^{\infty} b_n x^n$ ，并假设级数均收敛，那么

h(x)=f(x) g(x)=\sum_{k=0}^{\infty} c_k x^k

其中 $c=a * b$ ．例如，若 $f(x)=2+3 x-4 x^2$ 且 $g(x)=5-x+x^3$ ，那么 $f(x) g(x)=$ $10+13 x-23 x^2+6 x^3+3 x^4-4 x^5$ ．由定义可知， $c_2$ 应该等于：

a_0 b_2+a_1 b_1+a_2 b_0=2 \cdot 0+3 \cdot(-1)+(-4) \cdot 5=-23

这恰好是 $f(x)$ 与 $g(x)$ 相乘后得到的结果．引理 19．4．2 设 $G_a(s)$ 是 $\left\{a_m\right\}_{m=0}^{\infty}$ 的生成函数， $G_b(s)$ 是 $\left\{b_n\right\}_{n=0}^{\infty}$ 的生成函数，那么 $c=a * b$ 的生成函数是 $G_c(s)=G_a(s) G_b(s)$ ．

连续型随机变量

定义 19．5．1（概率生成函数）设 $X$ 是一个连续型随机变量，其概率密度函数为 $f$ ，那么

G_X(s)=\int_{-\infty}^{\infty} s^x f(x) d x

是 $X$ 的概率生成函数．

定义 19．5．2（函数卷积）两个函数 $f_1$ 和 $f_2$ 的卷积，即 $f_1 * f_2$ 被定义为

\left(f_1 * f_2\right)(x)=\int_{-\infty}^{\infty} f_1(t) f_2(x-t) d t .

如果 $f_i$ 都是概率密度函数，那么上述积分收敛．