生成函数的唯一性和收敛性 根据序列 { a n } n = 0 ∞ \left\{a_n\right\}_{n=0}^{\infty} { a n } n = 0 ∞ 的具体形式,生成函数 G a ( s ) G_a(s) G a ( s ) 可能对所有的 s s s 均存在,也可能只对某些 s s s 存在,还可能仅当 s = 0 s=0 s = 0 时存在.(由于 G s ( 0 ) = a 0 G_s(0)=a_0 G s ( 0 ) = a 0 ,所以这没有太多实际意义!)
考虑下面的例子.
(1)最简单的情况是 a 0 = 1 a_0=1 a 0 = 1 且其他项都满足 a n = 0 a_n=0 a n = 0 ,此时会得到 G a ( s ) = 1 G_a(s)=1 G a ( s ) = 1 .更一般的情况是,除了有限多个 n n n 之外,其余 a n a_n a n 全为 0 ,那么 G a ( s ) G_a(s) G a ( s ) 就是一个多项式。
(2)如果对所有的 n n n 均有 a n = 1 a_n=1 a n = 1 ,那么由几何级数公式可得,G a ( s ) = ∑ n = 0 ∞ s n = G_a(s)=\sum_{n=0}^{\infty} s^n= G a ( s ) = ∑ n = 0 ∞ s n = 1 1 − s \frac{1}{1-s} 1 − s 1 .当然,为了使用几何级数公式,这里必须满足 ∣ s ∣ < 1 |s|<1 ∣ s ∣ < 1 .对于较大的 s s s ,上述级数不收玫。
(3)如果 a n = 1 / n a_n=1 / n a n = 1/ n !,那么 G a ( s ) = ∑ n = 0 ∞ s n / n ! G_a(s)=\sum_{n=0}^{\infty} s^n / n! G a ( s ) = ∑ n = 0 ∞ s n / n ! .这是 e s e ^s e s 的定义,所以 G a ( s ) G_a(s) G a ( s ) 对所有的 s s s 均存在.
(4)如果 a n = 2 n a_n=2^n a n = 2 n ,那么 G a ( s ) = ∑ n = 0 ∞ 2 n s n = ∑ n = 0 ∞ ( 2 s ) n G_a(s)=\sum_{n=0}^{\infty} 2^n s^n=\sum_{n=0}^{\infty}(2 s)^n G a ( s ) = ∑ n = 0 ∞ 2 n s n = ∑ n = 0 ∞ ( 2 s ) n .这是比值为 2 s 2 s 2 s 的几何级数.当 ∣ 2 s ∣ < 1 |2 s|<1 ∣2 s ∣ < 1 时级数收玫,当 ∣ 2 s ∣ > 1 |2 s|>1 ∣2 s ∣ > 1 时级数发散.因此,如果 ∣ s ∣ < 1 / 2 |s|<1 / 2 ∣ s ∣ < 1/2 ,那么 G a ( s ) = ( 1 − 2 s ) − 1 G_a(s)=(1-2 s)^{-1} G a ( s ) = ( 1 − 2 s ) − 1 .
(5)如果 a n = n a_n=n a n = n !,那么不难看出,对于任意的 ∣ s ∣ > 0 , G a ( s ) |s|>0, G_a(s) ∣ s ∣ > 0 , G a ( s ) 均发散。最容易看出该级数发散的方法是,对于任意一个固定的 s ≠ 0 s \neq 0 s = 0 ,只要 n n n 足够大,就有 n ! ∣ s ∣ n > 1 n!|s|^n>1 n ! ∣ s ∣ n > 1 .因为级数中的项不趋向于 0 ,所以级数不能收玫.利用斯特林公式(参见第 18 章),我们可以估算 n n n 必须取多大,才能保证 n ! ∣ s ∣ n > 1 n!|s|^n>1 n ! ∣ s ∣ n > 1 .由斯特林公式可知,n ! ∼ ( n / e ) n 2 π n n!\sim(n / e )^n \sqrt{2 \pi n} n ! ∼ ( n / e ) n 2 πn ,从而有 n ! ∣ s ∣ n > ( n ∣ s ∣ / e ) n . n ! ∣ s ∣ n n!|s|^n>(n|s| / e )^n . n!|s|^n n ! ∣ s ∣ n > ( n ∣ s ∣/ e ) n . n ! ∣ s ∣ n 显然不会趋向于 0 ,因为当 n > e / ∣ s ∣ n> e /|s| n > e /∣ s ∣ 时,我们有 n ! ∣ s ∣ n > 1 n!|s|^n>1 n ! ∣ s ∣ n > 1 .
如果有序列 { a n } n = 0 ∞ \left\{a_n\right\}_{n=0}^{\infty} { a n } n = 0 ∞ ,那么显然可以得到它的生成函数(写出 G a ( s ) G_a(s) G a ( s ) 的解析表达式可能并不容易,但它确实有一个公式).反之亦然:如果有一个生成函数 G a ( s ) G_a(s) G a ( s ) (存在一个 δ \delta δ ,使得当 ∣ s ∣ < δ |s|<\delta ∣ s ∣ < δ 时该函数收玫),那么我们就可以得到原来的序列.当 G a ( s ) G_a(s) G a ( s ) 存在任意阶微分时,我们能轻松地得到这个序列,因为此时有 a n = 1 n ! d n G a ( s ) d s n a_n=\frac{1}{n!} \frac{ d ^n G_a(s)}{ d s^n} a n = n ! 1 d s n d n G a ( s ) .这个结果极其重要,我们以后会经常用到它,所以现在有必要把它作为定理单独列出来.
定理 19.3.1(序列生成函数的唯一性)设 { a n } n = 0 ∞ \left\{a_n\right\}_{n=0}^{\infty} { a n } n = 0 ∞ 和 { b n } n = 0 ∞ \left\{b_n\right\}_{n=0}^{\infty} { b n } n = 0 ∞ 是生成函数分别为 G a ( s ) G_a(s) G a ( s ) 和 G b ( s ) G_b(s) G b ( s ) 的两个数列。当 ∣ s ∣ < δ |s|<\delta ∣ s ∣ < δ 时,G a ( s ) G_a(s) G a ( s ) 和 G b ( s ) G_b(s) G b ( s ) 均收敛。那么,这两个序列相等(即对于所有的 i i i ,均有 a i = b i a_i=b_i a i = b i ),当且仅当对于所有的 ∣ s ∣ < δ |s|<\delta ∣ s ∣ < δ 均有 G a ( s ) = G b ( s ) G_a(s)=G_b(s) G a ( s ) = G b ( s ) .通过对生成函数求微分,我们可以重新得到序列:a n = 1 n ! d n G a ( s ) d s n a_n=\frac{1}{n!} \frac{ d ^n G_a(s)}{ d s^n} a n = n ! 1 d s n d n G a ( s ) .
证明:显然,如果 a i = b i a_i=b_i a i = b i ,那么 G a ( s ) = G b ( s ) G_a(s)=G_b(s) G a ( s ) = G b ( s ) .对于另一个方向,如果可以对生成函数求任意阶微分,那么 a i = 1 i ! d i G a ( s ) d s i a_i=\frac{1}{i!} \frac{ d ^i G_a(s)}{ d s^i} a i = i ! 1 d s i d i G a ( s ) 且 b i = 1 i ! d i G b ( s ) d s i b_i=\frac{1}{i!} \frac{ d ^i G_b(s)}{ d s^i} b i = i ! 1 d s i d i G b ( s ) .因为 G a ( s ) = G b ( s ) G_a(s)=G_b(s) G a ( s ) = G b ( s ) ,所以这两个函数的导数也是相等的,从而有 a i = b i a_i=b_i a i = b i .
注 19.3.2 除以 n n n !看着有些不舒服,稍后我们会看到另一个不包含这个因子的生成函数。如果不想求微分,仍然可以利用生成函数来确定系数。显然,令 s = 0 s=0 s = 0 ,我们就得到了 a 0 a_0 a 0 。接下来,观察 ( G a ( s ) − a 0 ) / s \left(G_a(s)-a_0\right) / s ( G a ( s ) − a 0 ) / s 并让表达式中的 s s s 等于 0 ,这样就能求出 a 1 a_1 a 1 .按照这种方式继续进行下去,我们就可以求出任意的 a m a_m a m .当然,注意这与微分方法是多么相似!
最后是一个简短的提醒:虽然我们写出了生成函数,但这并不意味着它是有意义的!遗憾的是,不管 s s s 取什么值(当然,除了 s = 0 s=0 s = 0 之外,此时平凡地收敛),最终的和可能都不收敛。幸运的是,与概率相关的生成函数通常是(但不总是)收玫的,至少对某些 s s s 收敛,稍后我们将详细讨论这个问题。判别级数是收敛还是发散的方法有很多,B. 3 节总结了四种更流行且更强大的判别法(比值判别法,根值判别法,比较判别法以及积分判别法).
利用生成函数,最根本的是简化运算
离散型随机变量 定义19.4.1(序列的卷积)已知两个序列 { a m } m = 0 ∞ \left\{a_m\right\}_{m=0}^{\infty} { a m } m = 0 ∞ 和 { b n } n = 0 ∞ \left\{b_n\right\}_{n=0}^{\infty} { b n } n = 0 ∞ .它们的卷积被定义为下面这个新序列 { c k } k = 0 ∞ \left\{c_k\right\}_{k=0}^{\infty} { c k } k = 0 ∞
c k = a 0 b k + a 1 b k − 1 + ⋯ + a k − 1 b 1 + a k b 0 = ∑ l = 0 k a l b k − l . c_k=a_0 b_k+a_1 b_{k-1}+\cdots+a_{k-1} b_1+a_k b_0=\sum_{l=0}^k a_l b_{k-l} . c k = a 0 b k + a 1 b k − 1 + ⋯ + a k − 1 b 1 + a k b 0 = l = 0 ∑ k a l b k − l . 通常情况下,我们把它记作 c = a ∗ b c=a * b c = a ∗ b .
这个定义来自于多项式乘法.如果 f ( x ) = ∑ m = 0 ∞ a m x m f(x)=\sum_{m=0}^{\infty} a_m x^m f ( x ) = ∑ m = 0 ∞ a m x m 且 g ( x ) = ∑ n = 0 ∞ b n x n g(x)=\sum_{n=0}^{\infty} b_n x^n g ( x ) = ∑ n = 0 ∞ b n x n ,并假设级数均收敛,那么
h ( x ) = f ( x ) g ( x ) = ∑ k = 0 ∞ c k x k h(x)=f(x) g(x)=\sum_{k=0}^{\infty} c_k x^k h ( x ) = f ( x ) g ( x ) = k = 0 ∑ ∞ c k x k 其中 c = a ∗ b c=a * b c = a ∗ b .例如,若 f ( x ) = 2 + 3 x − 4 x 2 f(x)=2+3 x-4 x^2 f ( x ) = 2 + 3 x − 4 x 2 且 g ( x ) = 5 − x + x 3 g(x)=5-x+x^3 g ( x ) = 5 − x + x 3 ,那么 f ( x ) g ( x ) = f(x) g(x)= f ( x ) g ( x ) = 10 + 13 x − 23 x 2 + 6 x 3 + 3 x 4 − 4 x 5 10+13 x-23 x^2+6 x^3+3 x^4-4 x^5 10 + 13 x − 23 x 2 + 6 x 3 + 3 x 4 − 4 x 5 .由定义可知,c 2 c_2 c 2 应该等于:
a 0 b 2 + a 1 b 1 + a 2 b 0 = 2 ⋅ 0 + 3 ⋅ ( − 1 ) + ( − 4 ) ⋅ 5 = − 23 a_0 b_2+a_1 b_1+a_2 b_0=2 \cdot 0+3 \cdot(-1)+(-4) \cdot 5=-23 a 0 b 2 + a 1 b 1 + a 2 b 0 = 2 ⋅ 0 + 3 ⋅ ( − 1 ) + ( − 4 ) ⋅ 5 = − 23 这恰好是 f ( x ) f(x) f ( x ) 与 g ( x ) g(x) g ( x ) 相乘后得到的结果.
引理 19.4.2 设 G a ( s ) G_a(s) G a ( s ) 是 { a m } m = 0 ∞ \left\{a_m\right\}_{m=0}^{\infty} { a m } m = 0 ∞ 的生成函数,G b ( s ) G_b(s) G b ( s ) 是 { b n } n = 0 ∞ \left\{b_n\right\}_{n=0}^{\infty} { b n } n = 0 ∞ 的生成函数,那么 c = a ∗ b c=a * b c = a ∗ b 的生成函数是 G c ( s ) = G a ( s ) G b ( s ) G_c(s)=G_a(s) G_b(s) G c ( s ) = G a ( s ) G b ( s ) .
连续型随机变量 定义 19.5.1(概率生成函数)设 X X X 是一个连续型随机变量,其概率密度函数为 f f f ,那么
G X ( s ) = ∫ − ∞ ∞ s x f ( x ) d x G_X(s)=\int_{-\infty}^{\infty} s^x f(x) d x G X ( s ) = ∫ − ∞ ∞ s x f ( x ) d x 是 X X X 的概率生成函数.
定义 19.5.2(函数卷积)两个函数 f 1 f_1 f 1 和 f 2 f_2 f 2 的卷积,即 f 1 ∗ f 2 f_1 * f_2 f 1 ∗ f 2 被定义为
( f 1 ∗ f 2 ) ( x ) = ∫ − ∞ ∞ f 1 ( t ) f 2 ( x − t ) d t . \left(f_1 * f_2\right)(x)=\int_{-\infty}^{\infty} f_1(t) f_2(x-t) d t . ( f 1 ∗ f 2 ) ( x ) = ∫ − ∞ ∞ f 1 ( t ) f 2 ( x − t ) d t . 如果 f i f_i f i 都是概率密度函数,那么上述积分收敛.