25._连续型随机变量函数的分布

初学者疑惑,已经学了连续型分布了,怎么又有随机变量函数的分布。随机变量函数的分布可以说是对随机变量再次定义随机变量。怎么比喻呢?比如函数y=f(x)y=f(x),对它导数,可以得一阶导数 y=f(x)y'=f'(x) ,如果把一阶导数再次求导,就得到二阶导数y=f(x)y''=f''(x) ,这个二阶导数就可以看成原函数的导数的导数。随机变量函数的分布和此类似,他类似求复合的随机变量。比如我们已经知道随机变量半径为XX的圆的分布,现在要求面积的,因为面积是S=πX2S=\pi X^2,此时就可以看成是求“πX2\pi X^2” 的分布。

相比离散型随机变量函数的分布,连续型随机变量函数的分布要复杂的多,因为他涉及大量积分运算,对学生微积分基础要求比较高。

连续型通常分为两种情况,设 XX 是连续型随机变量,则随机变量 Y=g(X)Y=g(X) 可能是离散型的,也可能是连续型的. (1)若 YY 只有有限个或可列无限个可能值,则按照上述离散型情形处理; (2)若 YY 所有可能值的集合是(有限或无限)区间,则一般先求 YY 的分布函数 FY(y)F_Y(y) ,再求导数 FY(y)F_Y^{\prime}(y) ,即可得到 YY 的密度函数 fY(y)f_Y(y)

连续型随机变量函数的分布

1.分布函数法

设连续型随机变量 XX 的分布函数为 FX(x)F_X(x) ,即

FX(x)=P{Xx},F_X(x)=P\{X \leqslant x\},

y=g(x)y=g(x) 是实数 xx 的函数,如何求随机变量 Y=g(X)Y=g(X) 的分布呢? 首先,求出随机变量 YY 的分布函数

FY(y)=P{Yy}=P{g(X)y},F_Y(y)=P\{Y \leqslant y\}=P\{g(X) \leqslant y\},

由不等式"g(X)yg(X) \leqslant y"得到关于 XX 的不等式,则 FY(y)F_Y(y) 就可以利用已知的分布函数 FX(x)F_X(x) 来表示. 其次,当 Y=g(X)Y=g(X) 是连续型随机变量时,将分布函数 FY(y)F_Y(y) 关于 yy 求导,就得到了 YY 的概率密度 fY(y)=FY(y)f_Y(y)=F_Y^{\prime}(y) ;当 Y=g(X)Y=g(X) 不是连续型随机变量时,要根据函数 g(x)g(x) 的特点做个案处理.

这种方法就称为分布函数法,它是求解连续型随机变量函数的分布函数的一般方法.

已知随机变量 XX 是区间 (0,1)(0,1) 上的均匀分布,求 Y=aX+b(a0)Y=a X+b(a \neq 0) 的密度函数.

解(1)设 a>0a>0 ,则

FY(y)=P{Yy}=P{aX+by}=P{Xyba}=FX(yba).F_Y(y)=P\{Y \leqslant y\} = P\{a X+b \leqslant y\}=P\left\{X \leqslant \frac{y-b}{a}\right\}=F_X\left(\frac{y-b}{a}\right) .

两边对 yy 求导,可得

fY(y)=fX(yba)(yba)y=1afX(yba).f_Y(y)=f_X\left(\frac{y-b}{a}\right)\left(\frac{y-b}{a}\right)_y^{\prime}=\frac{1}{a} f_X\left(\frac{y-b}{a}\right) .

fX(x)={1,0<x<1,0, 其他,f_X(x)=\left\{\begin{array}{ll}1, & 0<x<1, \\ 0, & \text { 其他,}\end{array}\right. 所以

fY(y)={1a,b<y<a+b,0, 其他. f_Y(y)= \begin{cases}\frac{1}{a}, & b<y<a+b, \\ 0, & \text { 其他. }\end{cases}

(2)设 a<0a<0 ,则

FY(y)=P{Yy}=P{aX+by}=P{Xyba}=1FX(yba)F_Y(y)=P\{Y \leqslant y\}=P\{a X+b \leqslant y\}=P\left\{X \geqslant \frac{y-b}{a}\right\}=1-F_X\left(\frac{y-b}{a}\right)

两边对 yy 求导,可得

fY(y)=fX(yba)(yba)y=1afX(yba).f_Y(y)=-f_X\left(\frac{y-b}{a}\right)\left(\frac{y-b}{a}\right)_y^{\prime}=-\frac{1}{a} f_X\left(\frac{y-b}{a}\right) .

将已知的密度函数 fX(x)f_X(x) 代人上式,得

fY(y)={1a,a+b<y<b,0, 其他. f_Y(y)= \begin{cases}-\frac{1}{a}, & a+b<y<b, \\ 0, & \text { 其他. }\end{cases}

综合(1)(2),得

fY(y)=1afX(yba).f_Y(y)=\frac{1}{|a|} f_X\left(\frac{y-b}{a}\right) .

X\mathrm{X} 服从区间 (1,3)(1,3) 上的均匀分布,求 X2X^2 的密度函数。

解 随机变量 XX 的取值范围 (1,3)(1,3) ,故随机变量 Y=X2Y=X^2 的取值范围为区间 (1,9)Y(1,9) , Y 仍 然是一个连续型随机变量。因此需求解 YY 的分布函数为 FY(y)F_Y(y) 和概率密度函数 fY(y)=F(y)f_Y(y)=F^{\prime}(y) 。 根据题意, XX 的概率密度函数为 f(x)={121<x<30 其它 \quad f(x)=\left\{\begin{array}{cc}\frac{1}{2} & 1<x<3 \\ 0 & \text { 其它 }\end{array}\right. Y\mathrm{Y} 的分布函数 FY(y)=P(Yy)=P(X2y)\quad F_Y(y)=P(Y \leq y)=P\left(X^2 \leq y\right)

Y 的分布函数 FY(y)=P(Yy)=P(X2y)\quad F_Y(y)=P(Y \leq y)=P\left(X^2 \leq y\right)

y<1y<1 时,FY(y)=0F_Y(y)=0 ; 当 1y<91 \leq y<9 时,FY(y)=P(yXy)=1y12dx=y12F_Y(y)=P(-\sqrt{y} \leq X \leq \sqrt{y})=\int_1^{\sqrt{y}} \frac{1}{2} d x=\frac{\sqrt{y}-1}{2} ; 当 y9y \geq 9 时,FY(y)=1F_Y(y)=1

通过 FY(y)=fY(y)F_Y^{\prime}(y)=f_Y(y) 得到 Y 的密度函数

fY(y)=FY(y)={14y,1<y<9;0, 其他 .f_Y(y)=F_Y^{\prime}(y)= \begin{cases}\frac{1}{4 \sqrt{y}}, & 1<y<9 ; \\ 0, & \text { 其他 } .\end{cases}

问题总结

Y=g(X)Y=g(X) 的分布函数与密度函数求解的一般步骤:

1 由随机变量 xx 的取值范围 Ωx\Omega_x 确定随机变量 yy 的取值范围 Ωx\Omega_x

2 对任意一个 yΩYy \in \Omega_Y ,求出 F(y)=P(Yy)=P(g(X)y)=P{XGy}=GYf(x)dxF(y)=P(Y \leq y)=P(g(X) \leq y)=P\left\{X \in G_y\right\}=\int_{G_Y} f(x) d x . 其中 {XGy}\left\{X \in G_y\right\} 是与 {g(X)y}\{g(X) \leq y\} 等价的随机事件,而 Gy={x:g(x)y}G_y=\{x: g(x) \leq y\} 是实数轴上的某个集合(通常是一个区间或若干个区间的并集)。

3 按分布函数的定义写出 FY(y),<y<+F_Y(y),-\infty<y<+\infty 4 通过对分布函数求导,得到 fY(y)=FY(y), <y<+f_Y(y)=F_Y^{\prime}(y), ~-\infty<y<+\infty

XN(0,1)X \sim N(0,1) ,求随机变量 Y=XY=|X| 的密度函数. 解 易得随机变量 Y=XY=|X| 的取值范围为区间 [0,+)Y[0,+\infty) , Y 仍然是一个连续 型随机变量。当 y0y \geq 0 时, YY 的分布函数为

FY(y)=P(Yy)=P(Xy)=P(yXy)=Φ(y)Φ(y)F_Y(y)=P(Y \leq y)=P(|X| \leq y)=P(-y \leq X \leq y)=\Phi(y)-\Phi(-y)

直接对上式求导有 fY(y)=Fy(y)=Φ(y)Φ(y)=22πey22f_Y(y)=F_y^{\prime}(y)=\Phi^{\prime}(y)-\Phi^{\prime}(-y)=\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{y^2}{2}} 所以, YY 的概率密度函数为 fY(y)={22πey22,y>0,0, 其它. \quad f_Y(y)= \begin{cases}\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{y^2}{2}}, & y>0, \\ 0, & \text { 其它. }\end{cases}

设连续型随机变量 XX 具有密度函数 fX(x)(<x<+)f_X(x)(-\infty<x<+\infty) ,求 Y=g(X)=Y=g(X)= X2X^2 的密度函数。

解 先求 YY 的分布函数 FY(y)F_Y(y) 。因为 Y=g(X)=X20Y=g(X)=X^2 \geqslant 0 ,所以当 y0y \leqslant 0 时,事件 {Yy}\{Y \leqslant y\}的概率为 0 ,即 FY(y)=P{Yy}=0F_Y(y)=P\{Y \leqslant y\}=0

y>0y>0 时,有

FY(y)=P{Yy}P{X2y}=P{yXy}=yyfX(x)dxF_Y(y)=P\{Y \leqslant y\} \leqslant P\left\{X^2 \leqslant y\right\}=P\{-\sqrt{y} \leqslant X \leqslant \sqrt{y}\}=\int_{-\sqrt{y}}^{\sqrt{y}} f_X(x) d x

将上述所得的 FY(y)F_Y(y) 关于 yy 求导,即得 YY 的密度函数为

fY(y)={12y[fX(y)+fX(y)],y>00,y0f_Y(y)= \begin{cases}\frac{1}{2 \sqrt{y}}\left[f_X(\sqrt{y})+f_X(-\sqrt{y})\right], y>0 \\ 0, & y \leqslant 0\end{cases}

例如,当 XN(0,1)X \sim N(0,1) 时,则 Y=X2Y=X^2 的密度函数为

fY(y)={12π,y>00,y0f_Y(y)= \begin{cases}\frac{1}{\sqrt{2 \pi}}, y>0 \\ 0, & y \leqslant 0\end{cases}

此时称 YY 服从自由度为 1 的 χ2\chi^2 分布.

上例 中关键的一步在于将事件 Yy}Y \leq y\} 由其等价事件 {yXy}\{-\sqrt{y} \leqslant X \leqslant \sqrt{y}\} 代替,即将事件 {Yy}\{Y \leqslant y\} 转换为关于 XX 的范围所表示的等价事件。下面我们仅对 Y=g(X)Y=g(X)[函数 g(x)g(x) 为严格单调的]写出一般结论.

公式法

定理1 设连续型随机变量 XX 的密度函数为 fX(x)Y=g(X)f_X(x) , Y=g(X) 是连续型随机变量, 若 y=g(x)y=g(x) 为严格单调函数, x=g1(y)x=g^{-1}(y) 为相应的反函数,且为可导函数,则 Y=g(X)Y=g(X) 的密度函数为

fY(y)=fX(g1(y))[g1(y)]f_Y(y)=f_X\left(g^{-1}(y)\right) \cdot\left|\left[g^{-1}(y)\right]\right|

证明:略。

定理2XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,则当 k0k \neq 0 时, Y=kX+bN(kμ+b,k2σ2)Y=k X+b \sim N\left(k \mu+b, k^2 \sigma^2\right) , 特别地, XμσN(0,1)\frac{X-\mu}{\sigma} \sim N(0,1)

证明:略。

设随机变量 XX 表示某服务行业一位顾客的服务时间,XX 服从指数分布,其概率密度为

f(x)={ex,x>0,0, 其他. f(x)= \begin{cases}\mathrm{e}^{-x}, & x>0, \\ 0, & \text { 其他. }\end{cases}

Y=eXY=\mathrm{e}^X 的概率密度. 解 函数 y=exy=\mathrm{e}^x 是单调函数,其反函数为 x=lny,x=1yx=\ln y, x^{\prime}=\frac{1}{y} ,故 YY 的概率密度为

fY(y)={1yelny,lny>0,0, 其他 ={1y2,y>1,0, 其他. f_Y(y)=\left\{\begin{array}{ll} \frac{1}{|y|} \mathrm{e}^{-\ln y}, & \ln y>0, \\ 0, & \text { 其他 } \end{array}= \begin{cases}\frac{1}{y^2}, & y>1, \\ 0, & \text { 其他. }\end{cases}\right.

应用公式法时,要注意函数 g(x)g(x) 必须是单调可导的,若不满足这个条件,就可以用分布函数法处理

XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,求随机变量 Y=eXY=\mathrm{e}^X 的密度函数. 解 因 y=exy=\mathrm{e}^x 的反函数为 x=lnyx=\ln y ;当 y>0y>0 时单增, x=1yx^{\prime}=\frac{1}{y} ,所以当 y>0y>0

fY(y)=fX(lny)(lny)=12πσye(lnyμ)22σ2f_Y(y)=f_X(\ln y)(\ln y)^{\prime}=\frac{1}{\sqrt{2 \pi} \sigma y} \mathrm{e}^{-\frac{(\ln y-\mu)^2}{2 \sigma^2}}

所以 Y=eXY=\mathrm{e}^X 的密度函数为

fY(y)={12πσye(lnyμ)22σ2,y>0,0, 其它. f_Y(y)= \begin{cases}\frac{1}{\sqrt{2 \pi} \sigma y} \mathrm{e}^{-\frac{(\ln y-\mu)^2}{2 \sigma^2}}, & y>0, \\ 0, & \text { 其它. }\end{cases}