20._连续型_伽马分布garmma

注：在概率论里，和连续分布相关的基本上都和“时间”相关，因为时间是连续的。泊松过程的三个重要分布在概率论和随机过程理论中经常出现，它们分别是：泊松分布（Poisson Distribution）：描述固定时间内发生事件的数量。指数分布（Exponential Distribution）：描述事件间隔时间的分布。伽马分布（Gamma Distribution）：描述多个事件发生时间的分布。点击他们的分布链接可以了解三者之间的区别和联系。

伽马分布

若随机变量 $X$ 的密度函数为

\boxed{ p(x)= \begin{cases}\dfrac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0, \\ 0, & x<0,\end{cases} ...(1) }

则称 $X$ 服从伽马分布, 记作 $X \sim G a(\alpha, \lambda)$ , 其中 $\alpha>0$ 为形状参数, $\lambda>0$ 为尺度参数. 其中的 $\Gamma(\alpha)$ 定义如下

\Gamma(\alpha)=\int_0^{\infty} x^{\alpha-1} \mathrm{e}^{-x} \mathrm{~d} x

对于初次接触伽玛分布的同学，可能会被伽玛分布的密度函数吓跑，感觉太复杂了，请注意：正像正态分布里有 $\sqrt{2 \pi}$ 一样，伽玛分布之所以带 $\Gamma(\alpha)$ 主要是为了让分布函数的值为1，用来平衡积分的值，我们只要抓住核心关键参数即可

为了方便后面的讲解，这里给出伽玛分布的第二种写法，仅需要简单的变量替换即可，如果令(1)中 $\lambda=\frac{1}{\theta}$ 则伽玛分布可以写成

\boxed{ p(x)= \begin{cases}\dfrac{1}{\Gamma(\alpha) \theta^{\alpha}} x^{\alpha-1} e^{-\frac{x}{\theta}}, & x \geqslant 0, \\ 0, & x<0,\end{cases} ...(2) }

在这个写法里， $\lambda$ 使用了倒数，为什么使用倒数呢？当我们对事件之间的经过时间建模时，我们倾向于用时间间隔而不是速率来表示，例如，计算机可以正常开机的年数是 10 年（而不是说每年 0.1 次故障），飓风每 7 年出现一次（而不是说每年出现 $\frac{1}{7}$ ），这很好理解，只是为了表达方便。想想看：如果您每小时获得 3 个客户 $(\lambda)$ ，则意味着您每 $1 / 3$ 小时获得 1 个客户 $(1 / \lambda)$ ，他们本质是一样的。想象参考泊松分布里的解释。

伽马分布的密度函数图像

关于对密度函数的理解，参考本文后半部。

{width=600px}

伽玛函数

在理解伽玛分布前，先介绍一下伽玛函数，顾名思义，看到伽玛分布，他一定和伽玛函数有光，伽玛函数的定义是：

\Gamma(\alpha)=\int_0^{\infty} x^{\alpha-1} \mathrm{e}^{-x} \mathrm{~d} x

这是一个广义积分，当您第一次看到伽玛函数时，你有没有想过为什么要创造这样一个看起来很复杂又无规律的积分函数？其实伽玛函数并不是凭空产生的。伽玛函数的理由来自函数图像的绘图。在初中我们学过“描点”绘图，比如要绘出 $y=x^2$ 的图像，其中 $x$ 是实数，我们很容易想到，把实数 $x$ 用自然数 $n$ 代替，然后取 $n=-2,-1,0,1,2$ 可以得到5个点，把这5个点用曲线连接起来，这就是 $y=n^2$ 图像如下 $图片$ {width=300px} 然后我们就想当然的认为 $y=x^2$ 和 $y=n^2$ 长相类似，后者就是前者的粗略版。

有了这个想法，我们现在要问一个问题： $y=x!$ 的图像是多少(x!表示 $x$ 的阶乘)（点击查看阶乘定义）我们已经知道 $5!=5*4*3*2*1, 4!=4*3*2*1,... 1!=1$ 既然已经知道 $n!$ 得值，那么把这些点连接起来，是不是就是 $y=x!$ 的图形呢？

我们把问题在具体一点，那 $y=\frac{1}{2} !$ 是多少？如果要验证我们的阶乘值，就要知道 $y=\frac{1}{2} !$ 得值，为此，数学家重要得到了一个伽玛函数，伽玛函数有一个递推公式 $\Gamma(s+1)=s \Gamma(s)(s>0)$ ，现在我们已经知道 $\Gamma\left(\frac{1}{2}\right)=\sqrt{\pi}$ 而至于 $y=n !$ 的图形，也就可以画出来了。不过这已经超出了初等数学的范畴。伽玛函数的推导已经在高等数学里介绍过，详见高等数学伽玛函数教程

核心结论来了：伽玛函数可以理解为阶乘函数。他把阶乘的定义域从正整数扩展到了实数

进一步的，一说到阶乘，你想到了什么？当然是排列组合了，在一开始的排列组合会遇到大量阶乘运算，但是传统的阶乘都是正整数运算，伽玛函数相当于把定义域从正整数扩展到了整个实数范围内。

现在我们捋一捋其中的逻辑关系：

排列组合 $\Leftrightarrow$ 阶乘运算 $\Leftrightarrow$ 伽玛函数

所以，阶乘运算相当于桥梁，联系起了 “排列组合”和“伽玛函数”的内在关系。也因此，你会在概率论的密度函数里，会有大量的伽玛函数出现。理解了伽玛函数后，就可以引入伽玛分布了。

为什么要引入伽玛分布

在理解Gamma分布前，让我们思考以下几个问题：

1.为什么我们要发明Gamma分布？(也就是说，为什么这个分布会存在？)
2.什么时候应该用Gamma分布来做模型？

我们为什么要发明Gamma分布？ 答案：为了预测未来事件发生前的等待时间。嗯？难道这不是指数分布的研究的问题？那么，指数分布和Gamma分布的区别是什么呢？

指数分布描述的是独立事件的等待时间。而Gamma分布描述的是直到 k 个事件发生时的等待时间

简单的来说，指数分布解决的问题是“要等到一个随机事件发生，需要经历多久时间”，伽玛分布解决的问题是“要等到 k 个随机事件都发生，需要经历多久时间”

指数分布（Exponential Distribution）对应几何分布伽马分布（Gamma Distribution）对应负二项分布

推导伽玛分布的密度函数PDF

在指数分布中，我们从泊松过程推导出了指数分布的PDF（详见此处）。要很好地理解Gamma分布，需要很好地理解它们。我们的学习顺序应该是：1.泊松分布，2.指数分布，3.gamma分布。

Gamma分布的PDF的推导与指数分布PDF的推导非常相似，除了一点--它是到第 k 个事件的等待时间，而不是第1个事件。

$T$ ：到第 $k$ 个事件的等待时间的随机变量（这是感兴趣的随机变量），其中事件的到达是由速率为 $\lambda$ 的泊松过程建模的。 $k$ ：伽马的第一个参数，所等待的事件发生的次数。 $\lambda$ ： Gamma的第二个参数，遵循泊松过程的事件发生速率。 $P(T>t)$ ：到第 $k$ 个事件的等待时间大于 $t$ 个时间单位的概率。 $P(X=k |$ 在 $t$ 时间范围内 $)$ ：在 $t$ 个时间单位内发生 $k$ 个事件的泊松概率。

上面预订了参数，现在看看怎么推导出伽玛分布的密度函数PDF。要得到密度函数需要先得到伽玛分布的分布函数CDF，然后对CDF微分就是密度函数。分布函数 $CDF$ ：

\begin{aligned} P(T \leq t) & =1-P(T>t) \\ & =1-P(0,1,2, \ldots K-1 \text { 事件发生在 }[0, t]) \\ & =1-\sum_{x=0}^{k-1} \frac{(\lambda t)^x e^{-\lambda t}}{x!} \end{aligned}

第一步：与指数分布的推导完全相同，除了多个事件，而不是在 $T$ 期间的 0 个事件。第二步：增加手动排他性事件的规则

第三步： $x$ 为事件发生的次数

对分布函数 $CDF$ 求导，即可得到密度函数 $PDF$ ：

\frac{d}{d t}(C D F)=\frac{d}{d t}\left(1-\sum_{x=0}^{k-1} \frac{(\lambda t)^x e^{-\lambda t}}{x!}\right)

现在，让我们对它进行微分。为了便于微分，我们把 $x=0$ 时的 $\left(e^{-\lambda t}\right)$ 项从求和中取出。

$图片$

我们得到了Gamma分布的PDF。这个推导看起来很复杂，但我们只是重新排列变量，应用微分的乘积法则，再到求和，并划掉一些常数项，毕竟常数项的微分等于 0 。

如果你看一下推导的最终输出，当 $k=1$ 时，你会发现它与指数分布的PDF相同。由于 $k$ 是一个正整数（ $k$ 事件的数量）， $\Gamma(k)=(k-1)$ ！其中 $\Gamma$ 表示gamma函数。最终结果可以改写为：

\begin{aligned} \frac{\lambda e^{-\lambda t}(\lambda t)^{k-1}}{(k-1)!} & =\frac{\lambda e^{-\lambda t} \lambda^{k-1} t^{k-1}}{(k-1)!} \\ & =\frac{\lambda^k t^{k-1} e^{-\lambda t}}{(k-1)!} \\ & =\frac{\lambda^k t^{k-1} e^{-\lambda t}}{\Gamma(k)} \end{aligned}

如果事件的到达遵循速率为 $\lambda$ 的泊松过程，那么直到 $k$ 个到达的等待时间遵循 $\Gamma(k, \lambda)$ 分布。

Gamma分布参数：一个shape一个scale？

$图片$

第一：它有两种的参数集：－ $(\alpha, \beta)$ － $(k, \theta)$ 对应不同参数集的PDF，当然了只是形式不同，参数的简单变形而已。第二：对 scale 参数应有什么现实意义，暂时没有普遍共识。让我们来梳理一下：第一个问题是非常直接的，看上图后有直观的感受：－对于 $(\alpha, \beta)$ 参数形式：回顾一下，上面推导公式我们采用的是 $k$ （事件的数量）和 $\lambda$ （事件的速率）作为参数，那么，我们简单地 $k$ 替代为 $\alpha, \lambda$ 替代为 $\beta$ 。当然，PDF的格式与我们所得出的相同。－对于 $(k, \theta)$ 参数化： $k$ 没有变化，只是 $\theta$ 是事件率 $\lambda$ 的倒数，它服从 $[$ 指数分布 $]]$ （事件到达之间的平均时间）。

仅仅是PDF表达形式不同而已，所以两种参数化都会产生统一的模型。就像用参数来描述直线，有些人使用 $x$ －轴做为截距，而有些人使用 $y$ －轴做为截距，选择一种参数化而不是另一种参数化是一个习惯问题。仅限个人观点，使用 $\lambda$ 作为速率参数更有意义，因为我们是用泊松速率 $\lambda$ 推导出指数和Gamma分布，与指数分布的公式中的 $\lambda$ 保持统一，更容易记忆与理解。同时，我还发现 $(\alpha, \beta)$ 参数化公式更整洁。

第二，有些学者称 $\lambda$ 为尺度参数，而其他人则称 $\theta=1 / \lambda$ 为尺度参数。我认为，shape 或 scale 参数实际上是一种错误的命名。我用不同的 $k$ 和 $\lambda$ 组合绘制了多个Gamma PDF $(k$ 和 $\lambda$ 有无限的参数选择，因此，有无限多的可能的Gamma分布，会明显发现 $k$ 和 $\lambda$ 都会改变 shape 和 scale 。认真给它们命名的人可以给它们起更直观的名字，如-事件数和泊松速率！

眼见为实! 让我们来想象一下

K : 你等待发生的事件的数量。 $\lambda$ : 事件发生的速率，遵循泊松过程

$图片$

对于一个固定的比率 $\lambda$ ，如果我们等待更多的事件 $k$ 发生，等待时间 $T$ 将更长，符合人的认知预期。 $图片$

对于固定数量的事件 $k$ ，当事件率 $\lambda$ 较高时，我们等待的时间 $T$ 较短，当然符合我们的对世界的认知。

例假设某电话总机收到的电话数服从泊松过程，其中每分钟平均有5个.求第个电话后不到一分钟就有第二个电话的概率是多少?

解泊松过程中两个泊松事件发生的时间间隔服从伽玛分布 $\beta=0.2, \alpha=2 . X$ 记为第一个电话与第二个电话的间隔时间, 则所求的概率为:

P(X \leqslant 1)=\int_0^1 \frac{1}{\beta^2} x e^{-x / \beta} d x=25 \int_0^1 x e^{-5 x} d x=1-e^{-5}(1+5)=0.96 .

再次分析在本例题里参数意义，因为要求的是“第二个电话概率”，所以事件数量 $n=2$ ，但是伽玛分布通常使用 $\alpha$ 表示事件次数，所以 $\alpha=2$ 。其次，“每分钟平均有5个电话”那么这里 $\lambda=5$ ，因为伽玛事件里，需要使用 $\lambda$ 的倒数，并记做 $\beta$ ，所以 $\beta=1/\lambda=1/5=0.2$ 关于为什么使用倒数，请参考本章指数分布的介绍,他通常叫做速率

参数图

图2.5.6 给出若干条 $\lambda$ 固定、 $\alpha$ 不同的伽马分布密度函数曲线, 从图中可以看出： $图片$

当 $0<\alpha<1$ 时, $p(x)$ 是严格下降函数, 且在 $x=0$ 处有奇异点.
当 $\alpha=1$ 时, $p(x)$ 是严格下降函数,且在 $x=0$ 处 $p(0)=\lambda$ .
当 $1<\alpha \leqslant 2$ 时, $p(x)$ 是单峰函数, 先上凸、后下凸.
当 $2<\alpha$ 时, $p(x)$ 是单峰函数, 先下凸、中间上凸、后下凸. 且 $\alpha$ 越大, $p(x)$ 越近似于正态密度函数, 但伽马分布总是偏态分布, $\alpha$ 越小其偏斜程度越严重.

伽玛分布的应用

假设 $x_1, x_2, \ldots x_n$ 为连续发生事件的等候时间，且这 $n$ 次等候时间为独立的，那么这 $n$ 次等候时间之和 $Y\left(Y=X_1+X_2+\ldots+X_n\right)$ 服从伽玛分布，即 $Y \sim \operatorname{Gamma}(\alpha, \beta)$ ，亦可记作 $Y \sim \operatorname{Gamma}(\alpha, \lambda)$ ，其中 $\alpha=n$ ，而 $\beta$ 与 $\lambda$ 互为倒数关系， $\lambda$ 表单位时间内事件的发生率。

指数分布为 $\alpha=1$ 的伽玛分布。

伽玛分布的重要性在于它定义了一族分布，而某些分布族是它的特例，但伽玛分布本身在等待时间和可靠性问题方面也有重要的应用.指数分布描述了某个泊松事件发生的等待时间(或泊松事件的时间间隔)，而给定数目泊松事件发生的等待时间(或空间)可由伽玛分布描述这个给定的泊松事件数即为伽玛密度函数中的参数a，因此很容易看出，a=1时即为指数分布，伽玛密度函数可以类似上面指数密度的方法得到，细节留给大家证明.下面是伽玛分布在等待时间上应用的一些例子.

虽然伽玛分布的起源是用来处理 $\alpha$ 个泊松事件发生的等待时间问题，但是在很多情况下，即使不存在一个清晰的泊松结构, 伽玛分布仍可以很好地处理. 例如工程和生物医学中的生存时间问题.

例生物医学试验中经常对老鼠做试验, 剂量反映调查用于确定毒物剂量对老鼠寿命的影响. 所研究的有毒物质为排人空气中的喷气燃料. 该试验确定在一定剂量的有毒物质下，老鼠的生存时间（按周计）具有伽玛分布 $\alpha=5, \beta=10$ 。则老鼠的寿命不超过 60 周的概率是多少?

解令随机变量 $X$ 表示生存时间, 则所求概率为:

P(X \leqslant 60)=\frac{1}{\beta^5} \int_0^{60} \frac{x^{\sigma-1} e^{-x / \beta}}{\Gamma(5)} d x .

上述积分的求解可通过利用不完全伽玛函数, 该函数可以得到伽玛分布的累积分布. 不完全伽玛函数为：

F(x ; \alpha)=\int_0^x \frac{y^{\alpha-1} e^{-y}}{\Gamma(\alpha)} d y .

若令 $y=x / \beta$ , 所以 $x=\beta y$ , 于是有

P(X \leqslant 60)=\int_0^6 \frac{y^4 e^{-y}}{\Gamma(5)} d y,

在附表 A. 24 的不完全伽玛函数表中，上式可以记作 $F(6 ; 5)$ . 这样可以快速计算伽玛分布的概率. 因此老鼠寿命不超过 60 天的概率为：

P(X \leqslant 60)=F(6 ; 5)=0.715

例 由以前的数据知, 在某几个月内顾客对某产品的投诉服从参数 $\alpha=2, \beta=4$ 的伽玛分布，于是进行了产品质量控制的改进. 实行改进后， 20 个月后出现第一起投诉. 则该质量控制是否有效？

解令 $X$ 为第一起投诉的等待时间，改进前它是服从伽玛分布， $\alpha=2 ， \beta=4$ 。则我们关心的问题是在 $\alpha$ 和 $\beta$ 保持不变时， $X \geqslant 20$ 的概率？即改进前条件下投诉的等待时间达到 20 个月是否合理？因此我们需要解决上例

P(X \geqslant 20)=1-\frac{1}{\beta^\alpha} \int_0^{20} \frac{x^{\alpha-1} e^{-x / \beta}}{\Gamma(\alpha)} d x .

再令 $y=x / \beta$ , 我们有

P(X \geqslant 20)=1-\int_0^5 \frac{y e^{-y}}{\Gamma(2)} d y=1-F(5 ; 2)=1-0.96=0.04,

查表得 $F(5 ; 2)=0.96$ . 因此, 我们得到, 投诉等待时间达 20 个月的观测事实与参数 $\alpha=2, \beta=4$ 情况下的伽玛分布不相符. 因此, 认为质量控制有效是合理的.

伽马分布 $G a(\alpha, \lambda)$ 的数学期望和方差

利用伽马函数的性质, 不难算得伽马分布 $G a(\alpha, \lambda)$ 的数学期望为

E(X)=\frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^\alpha \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{\Gamma(\alpha+1)}{\Gamma(\alpha)} \frac{1}{\lambda}=\frac{\alpha}{\lambda},

又因为

E\left(X^2\right)=\frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha+1} \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{\Gamma(\alpha+2)}{\lambda^2 \Gamma(\alpha)}=\frac{\alpha(\alpha+1)}{\lambda^2},

由此得 $X$ 的方差为

\operatorname{Var}(X)=E\left(X^2\right)-[E(X)]^2=\frac{\alpha(\alpha+1)}{\lambda^2}-\left(\frac{\alpha}{\lambda}\right)^2=\frac{\alpha}{\lambda^2} .

伽马分布的两个特列

(1) $\alpha=1$ 时的伽马分布就是指数分布, 即

G a(1, \lambda)=\operatorname{Exp}(\lambda) .

(2) 称 $\alpha=n / 2, \lambda=1 / 2$ 时的伽马分布是自由度为 $n$ 的 $\chi^2$ (卡方) 分布, 记为 $\chi^2(n)$ , 即

G a\left(\frac{n}{2}, \frac{1}{2}\right)=\chi^2(n),

其密度函数为

p(x)= \begin{cases}\frac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} \mathrm{e}^{-\frac{x}{2} x^{\frac{n}{2}-1}}, & x \geqslant 0, \\ 0, & x<0 .\end{cases}

这里 $n$ 是 $\chi^2$ 分布的唯一参数, 称为自由度, 它可以是正实数, 但更多的是取正整数, $\chi^2$ 分布是统计应用中的一个重要分布.

因为 $\chi^2$ 分布是特殊的伽马分布, 故由伽马分布的期望和方差, 很容易得到 $\chi^2$ 分布的期望和方差为

E(X)=n, \quad \operatorname{Var}(X)=2 n .

例电子产品的失效常常是由于外界的"冲击引起". 若在 $(0, t)$ 内发生冲击的次数 $N(t)$ 服从参数为 $\lambda t$ 的泊松分布，试证第 $n$ 次冲击来到的时间 $S_n$ 服从伽马分布 $G a(n, \lambda)$ 。

证明因为事件"第 $n$ 次冲击来到的时间 $S_n$ 小于等于 $t$ " 等价于事件 " $(0, t)$ 内发生冲击的次数 $N(t)$ 大于等于 $n$ ", 即

\left\{S_n \leqslant t\right\}=\{N(t) \geqslant n\} .

于是, $S_n$ 的分布函数为

F(t)=P\left(S_n \leqslant t\right)=P(N(t) \geqslant n)=\sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!} \mathrm{e}^{-\lambda t}

用分部积分法可以验证下列等式

\sum_{k=0}^{n-1} \frac{(\lambda t)^k}{k!} \mathrm{e}^{-\lambda t}=\frac{\lambda^n}{\Gamma(n)} \int_t^{\infty} x^{n-1} \mathrm{e}^{-\lambda x} \mathrm{~d} x

所以

\begin{aligned} &F(t)=\frac{\lambda^n}{\Gamma(n)} \int_0^t x^{n-1} \mathrm{e}^{-\lambda x} \mathrm{~d} x\\ &\text { 这就表明 } S_n \sim G a(n, \lambda) \text {. 证毕。 } \end{aligned}

关于更多概率分布表见附录1：常见概率分布表

实例

我们可以在使用指数分布的所有应用中使用gamma分布，例如：

等待时间建模
可靠性（故障）建模
服务时间建模（排队理论）因为指数分布是伽玛分布的特例（只需将 1 代入 $k$ 即可）。

排队理论实例

你去了KFC，并加入队伍开始排队，前面有两个人。排在第一个的正在下单中，排在第二的人正在等待。他们的服务时间 $S 1$ 和 $S 2$ 是独立的、指数随机变量，平均为 2 分钟。因此，平均服务率是 0.5 ／分钟。如果这个＂速率与时间＂的概念让你感到困惑，看上面。

问题：你在队列中等待超过 5 分钟的概率是多少？

\begin{aligned} P(T>5) & =P(\text { 在 }[0,5] \text { 中发生的次数少于 } 2) \\ & =\sum_{x=0}^1 \frac{(\lambda t)^x e^{-\lambda t}}{x!} \\ & =0.2873 \end{aligned}

我们所做的就是把 $t=5$ 和 $\lambda=0.5$ 代入我们已经得出的Gamma分布的CDF中。这也是我们［［gamma函数］］中涉及的例子。如上所见，我们也可以用Gamma的CDF来解决这个问题。

我在 KFC 餐厅等待超过 5 分钟的机会不到 $30 \%$ ？我还是愿意接受。有几件事需要注意： 1．泊松、指数和gamma分布对同一个过程的不同方面进行建模，也就是泊松过程。 1．泊松分布用于模拟未来事件的数量。 2．指数分布用于预测到第一个事件为止的等待时间。 3．Gamma分布用于预测到第 $k$ 个事件为止的等待时间。 2．Gamma的两个参数都是严格的正数，因为一个是事件的数量，另一个是事件的速率。它们不可能是负的。

3．伽马分布的特殊情况 $图片$

埃朗分布Erlang和伽玛Gamma的区别在于，在Gamma分布中， $k$ 可以是正实数，而在Erlang中， $k$ 只能是正整数。

伽马分布

伽马分布的密度函数图像

伽玛函数

为什么要引入伽玛分布

推导伽玛分布的密度函数PDF

Gamma分布参数：一个shape一个scale？

伽玛分布的应用

伽马分布 Ga(α,λ)G a(\alpha, \lambda)Ga(α,λ) 的数学期望和方差

伽马分布的两个特列

实例

伽马分布 $G a(\alpha, \lambda)$ 的数学期望和方差