初学者疑惑,已经学了连续型分布了,怎么又有随机变量函数的分布。随机变量函数的分布可以说是对随机变量再次定义随机变量。怎么比喻呢?比如函数y = f ( x ) y=f(x) y = f ( x ) ,对它导数,可以得一阶导数 y ′ = f ′ ( x ) y'=f'(x) y ′ = f ′ ( x ) ,如果把一阶导数再次求导,就得到二阶导数y ′ ′ = f ′ ′ ( x ) y''=f''(x) y ′′ = f ′′ ( x ) ,这个二阶导数就可以看成原函数的导数的导数。随机变量函数的分布和此类似,他类似求复合的随机变量。比如我们已经知道随机变量半径为X X X 的圆的分布,现在要求面积的,因为面积是S = π X 2 S=\pi X^2 S = π X 2 ,此时就可以看成是求“π X 2 \pi X^2 π X 2 ” 的分布。
相比离散型随机变量函数的分布,连续型随机变量函数的分布要复杂的多,因为他涉及大量积分运算,对学生微积分基础要求比较高。
连续型通常分为两种情况,设 X X X 是连续型随机变量,则随机变量 Y = g ( X ) Y=g(X) Y = g ( X ) 可能是离散型的,也可能是连续型的.
(1)若 Y Y Y 只有有限个或可列无限个可能值,则按照上述离散型情形处理;
(2)若 Y Y Y 所有可能值的集合是(有限或无限)区间,则一般先求 Y Y Y 的分布函数 F Y ( y ) F_Y(y) F Y ( y ) ,再求导数 F Y ′ ( y ) F_Y^{\prime}(y) F Y ′ ( y ) ,即可得到 Y Y Y 的密度函数 f Y ( y ) f_Y(y) f Y ( y ) .
连续型随机变量函数的分布 1.分布函数法 设连续型随机变量 X X X 的分布函数为 F X ( x ) F_X(x) F X ( x ) ,即
F X ( x ) = P { X ⩽ x } , F_X(x)=P\{X \leqslant x\}, F X ( x ) = P { X ⩽ x } , y = g ( x ) y=g(x) y = g ( x ) 是实数 x x x 的函数,如何求随机变量 Y = g ( X ) Y=g(X) Y = g ( X ) 的分布呢?
首先,求出随机变量 Y Y Y 的分布函数
F Y ( y ) = P { Y ⩽ y } = P { g ( X ) ⩽ y } , F_Y(y)=P\{Y \leqslant y\}=P\{g(X) \leqslant y\}, F Y ( y ) = P { Y ⩽ y } = P { g ( X ) ⩽ y } , 由不等式"g ( X ) ⩽ y g(X) \leqslant y g ( X ) ⩽ y "得到关于 X X X 的不等式,则 F Y ( y ) F_Y(y) F Y ( y ) 就可以利用已知的分布函数 F X ( x ) F_X(x) F X ( x ) 来表示.
其次,当 Y = g ( X ) Y=g(X) Y = g ( X ) 是连续型随机变量时,将分布函数 F Y ( y ) F_Y(y) F Y ( y ) 关于 y y y 求导,就得到了 Y Y Y 的概率密度 f Y ( y ) = F Y ′ ( y ) f_Y(y)=F_Y^{\prime}(y) f Y ( y ) = F Y ′ ( y ) ;当 Y = g ( X ) Y=g(X) Y = g ( X ) 不是连续型随机变量时,要根据函数 g ( x ) g(x) g ( x ) 的特点做个案处理.
这种方法就称为分布函数法 ,它是求解连续型随机变量函数的分布函数的一般方法.
例已知随机变量 X X X 是区间 ( 0 , 1 ) (0,1) ( 0 , 1 ) 上的均匀分布,求 Y = a X + b ( a ≠ 0 ) Y=a X+b(a \neq 0) Y = a X + b ( a = 0 ) 的密度函数.
解(1)设 a > 0 a>0 a > 0 ,则
F Y ( y ) = P { Y ⩽ y } = P { a X + b ⩽ y } = P { X ⩽ y − b a } = F X ( y − b a ) . F_Y(y)=P\{Y \leqslant y\} = P\{a X+b \leqslant y\}=P\left\{X \leqslant \frac{y-b}{a}\right\}=F_X\left(\frac{y-b}{a}\right) . F Y ( y ) = P { Y ⩽ y } = P { a X + b ⩽ y } = P { X ⩽ a y − b } = F X ( a y − b ) . 两边对 y y y 求导,可得
f Y ( y ) = f X ( y − b a ) ( y − b a ) y ′ = 1 a f X ( y − b a ) . f_Y(y)=f_X\left(\frac{y-b}{a}\right)\left(\frac{y-b}{a}\right)_y^{\prime}=\frac{1}{a} f_X\left(\frac{y-b}{a}\right) . f Y ( y ) = f X ( a y − b ) ( a y − b ) y ′ = a 1 f X ( a y − b ) . 因 f X ( x ) = { 1 , 0 < x < 1 , 0 , 其他, f_X(x)=\left\{\begin{array}{ll}1, & 0<x<1, \\ 0, & \text { 其他,}\end{array}\right. f X ( x ) = { 1 , 0 , 0 < x < 1 , 其他, 所以
f Y ( y ) = { 1 a , b < y < a + b , 0 , 其他. f_Y(y)= \begin{cases}\frac{1}{a}, & b<y<a+b, \\ 0, & \text { 其他. }\end{cases} f Y ( y ) = { a 1 , 0 , b < y < a + b , 其他 . (2)设 a < 0 a<0 a < 0 ,则
F Y ( y ) = P { Y ⩽ y } = P { a X + b ⩽ y } = P { X ⩾ y − b a } = 1 − F X ( y − b a ) F_Y(y)=P\{Y \leqslant y\}=P\{a X+b \leqslant y\}=P\left\{X \geqslant \frac{y-b}{a}\right\}=1-F_X\left(\frac{y-b}{a}\right) F Y ( y ) = P { Y ⩽ y } = P { a X + b ⩽ y } = P { X ⩾ a y − b } = 1 − F X ( a y − b ) 两边对 y y y 求导,可得
f Y ( y ) = − f X ( y − b a ) ( y − b a ) y ′ = − 1 a f X ( y − b a ) . f_Y(y)=-f_X\left(\frac{y-b}{a}\right)\left(\frac{y-b}{a}\right)_y^{\prime}=-\frac{1}{a} f_X\left(\frac{y-b}{a}\right) . f Y ( y ) = − f X ( a y − b ) ( a y − b ) y ′ = − a 1 f X ( a y − b ) . 将已知的密度函数 f X ( x ) f_X(x) f X ( x ) 代人上式,得
f Y ( y ) = { − 1 a , a + b < y < b , 0 , 其他. f_Y(y)= \begin{cases}-\frac{1}{a}, & a+b<y<b, \\ 0, & \text { 其他. }\end{cases} f Y ( y ) = { − a 1 , 0 , a + b < y < b , 其他 . 综合(1)(2),得
f Y ( y ) = 1 ∣ a ∣ f X ( y − b a ) . f_Y(y)=\frac{1}{|a|} f_X\left(\frac{y-b}{a}\right) . f Y ( y ) = ∣ a ∣ 1 f X ( a y − b ) . 例设 X \mathrm{X} X 服从区间 ( 1 , 3 ) (1,3) ( 1 , 3 ) 上的均匀分布,求 X 2 X^2 X 2 的密度函数。
解 随机变量 X X X 的取值范围 ( 1 , 3 ) (1,3) ( 1 , 3 ) ,故随机变量 Y = X 2 Y=X^2 Y = X 2 的取值范围为区间 ( 1 , 9 ) , Y (1,9) , Y ( 1 , 9 ) , Y 仍 然是一个连续型随机变量。因此需求解 Y Y Y 的分布函数为 F Y ( y ) F_Y(y) F Y ( y ) 和概率密度函数 f Y ( y ) = F ′ ( y ) f_Y(y)=F^{\prime}(y) f Y ( y ) = F ′ ( y ) 。
根据题意, X X X 的概率密度函数为 f ( x ) = { 1 2 1 < x < 3 0 其它 \quad f(x)=\left\{\begin{array}{cc}\frac{1}{2} & 1<x<3 \\ 0 & \text { 其它 }\end{array}\right. f ( x ) = { 2 1 0 1 < x < 3 其它
Y \mathrm{Y} Y 的分布函数 F Y ( y ) = P ( Y ≤ y ) = P ( X 2 ≤ y ) \quad F_Y(y)=P(Y \leq y)=P\left(X^2 \leq y\right) F Y ( y ) = P ( Y ≤ y ) = P ( X 2 ≤ y )
Y 的分布函数 F Y ( y ) = P ( Y ≤ y ) = P ( X 2 ≤ y ) \quad F_Y(y)=P(Y \leq y)=P\left(X^2 \leq y\right) F Y ( y ) = P ( Y ≤ y ) = P ( X 2 ≤ y )
当 y < 1 y<1 y < 1 时,F Y ( y ) = 0 F_Y(y)=0 F Y ( y ) = 0 ;
当 1 ≤ y < 9 1 \leq y<9 1 ≤ y < 9 时,F Y ( y ) = P ( − y ≤ X ≤ y ) = ∫ 1 y 1 2 d x = y − 1 2 F_Y(y)=P(-\sqrt{y} \leq X \leq \sqrt{y})=\int_1^{\sqrt{y}} \frac{1}{2} d x=\frac{\sqrt{y}-1}{2} F Y ( y ) = P ( − y ≤ X ≤ y ) = ∫ 1 y 2 1 d x = 2 y − 1 ;
当 y ≥ 9 y \geq 9 y ≥ 9 时,F Y ( y ) = 1 F_Y(y)=1 F Y ( y ) = 1 。
通过 F Y ′ ( y ) = f Y ( y ) F_Y^{\prime}(y)=f_Y(y) F Y ′ ( y ) = f Y ( y ) 得到 Y 的密度函数
f Y ( y ) = F Y ′ ( y ) = { 1 4 y , 1 < y < 9 ; 0 , 其他 . f_Y(y)=F_Y^{\prime}(y)= \begin{cases}\frac{1}{4 \sqrt{y}}, & 1<y<9 ; \\ 0, & \text { 其他 } .\end{cases} f Y ( y ) = F Y ′ ( y ) = { 4 y 1 , 0 , 1 < y < 9 ; 其他 . 问题总结 Y = g ( X ) Y=g(X) Y = g ( X ) 的分布函数与密度函数求解的一般步骤:
1 由随机变量 x x x 的取值范围 Ω x \Omega_x Ω x 确定随机变量 y y y 的取值范围 Ω x \Omega_x Ω x ;
2 对任意一个 y ∈ Ω Y y \in \Omega_Y y ∈ Ω Y ,求出 F ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = P { X ∈ G y } = ∫ G Y f ( x ) d x F(y)=P(Y \leq y)=P(g(X) \leq y)=P\left\{X \in G_y\right\}=\int_{G_Y} f(x) d x F ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = P { X ∈ G y } = ∫ G Y f ( x ) d x .
其中 { X ∈ G y } \left\{X \in G_y\right\} { X ∈ G y } 是与 { g ( X ) ≤ y } \{g(X) \leq y\} { g ( X ) ≤ y } 等价的随机事件,而 G y = { x : g ( x ) ≤ y } G_y=\{x: g(x) \leq y\} G y = { x : g ( x ) ≤ y } 是实数轴上的某个集合(通常是一个区间或若干个区间的并集)。
3 按分布函数的定义写出 F Y ( y ) , − ∞ < y < + ∞ F_Y(y),-\infty<y<+\infty F Y ( y ) , − ∞ < y < + ∞
4 通过对分布函数求导,得到 f Y ( y ) = F Y ′ ( y ) , − ∞ < y < + ∞ f_Y(y)=F_Y^{\prime}(y), ~-\infty<y<+\infty f Y ( y ) = F Y ′ ( y ) , − ∞ < y < + ∞ 。
例设 X ∼ N ( 0 , 1 ) X \sim N(0,1) X ∼ N ( 0 , 1 ) ,求随机变量 Y = ∣ X ∣ Y=|X| Y = ∣ X ∣ 的密度函数.
解 易得随机变量 Y = ∣ X ∣ Y=|X| Y = ∣ X ∣ 的取值范围为区间 [ 0 , + ∞ ) , Y [0,+\infty) , Y [ 0 , + ∞ ) , Y 仍然是一个连续 型随机变量。当 y ≥ 0 y \geq 0 y ≥ 0 时, Y Y Y 的分布函数为
F Y ( y ) = P ( Y ≤ y ) = P ( ∣ X ∣ ≤ y ) = P ( − y ≤ X ≤ y ) = Φ ( y ) − Φ ( − y ) F_Y(y)=P(Y \leq y)=P(|X| \leq y)=P(-y \leq X \leq y)=\Phi(y)-\Phi(-y) F Y ( y ) = P ( Y ≤ y ) = P ( ∣ X ∣ ≤ y ) = P ( − y ≤ X ≤ y ) = Φ ( y ) − Φ ( − y ) 直接对上式求导有 f Y ( y ) = F y ′ ( y ) = Φ ′ ( y ) − Φ ′ ( − y ) = 2 2 π e − y 2 2 f_Y(y)=F_y^{\prime}(y)=\Phi^{\prime}(y)-\Phi^{\prime}(-y)=\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{y^2}{2}} f Y ( y ) = F y ′ ( y ) = Φ ′ ( y ) − Φ ′ ( − y ) = 2 π 2 e − 2 y 2
所以, Y Y Y 的概率密度函数为 f Y ( y ) = { 2 2 π e − y 2 2 , y > 0 , 0 , 其它. \quad f_Y(y)= \begin{cases}\frac{2}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{y^2}{2}}, & y>0, \\ 0, & \text { 其它. }\end{cases} f Y ( y ) = { 2 π 2 e − 2 y 2 , 0 , y > 0 , 其它 .
例设连续型随机变量 X X X 具有密度函数 f X ( x ) ( − ∞ < x < + ∞ ) f_X(x)(-\infty<x<+\infty) f X ( x ) ( − ∞ < x < + ∞ ) ,求 Y = g ( X ) = Y=g(X)= Y = g ( X ) = X 2 X^2 X 2 的密度函数。
解 先求 Y Y Y 的分布函数 F Y ( y ) F_Y(y) F Y ( y ) 。因为 Y = g ( X ) = X 2 ⩾ 0 Y=g(X)=X^2 \geqslant 0 Y = g ( X ) = X 2 ⩾ 0 ,所以当 y ⩽ 0 y \leqslant 0 y ⩽ 0 时,事件 { Y ⩽ y } \{Y \leqslant y\} { Y ⩽ y } 的概率为 0 ,即 F Y ( y ) = P { Y ⩽ y } = 0 F_Y(y)=P\{Y \leqslant y\}=0 F Y ( y ) = P { Y ⩽ y } = 0 ;
当 y > 0 y>0 y > 0 时,有
F Y ( y ) = P { Y ⩽ y } ⩽ P { X 2 ⩽ y } = P { − y ⩽ X ⩽ y } = ∫ − y y f X ( x ) d x F_Y(y)=P\{Y \leqslant y\} \leqslant P\left\{X^2 \leqslant y\right\}=P\{-\sqrt{y} \leqslant X \leqslant \sqrt{y}\}=\int_{-\sqrt{y}}^{\sqrt{y}} f_X(x) d x F Y ( y ) = P { Y ⩽ y } ⩽ P { X 2 ⩽ y } = P { − y ⩽ X ⩽ y } = ∫ − y y f X ( x ) d x 将上述所得的 F Y ( y ) F_Y(y) F Y ( y ) 关于 y y y 求导,即得 Y Y Y 的密度函数为
f Y ( y ) = { 1 2 y [ f X ( y ) + f X ( − y ) ] , y > 0 0 , y ⩽ 0 f_Y(y)= \begin{cases}\frac{1}{2 \sqrt{y}}\left[f_X(\sqrt{y})+f_X(-\sqrt{y})\right], y>0 \\ 0, & y \leqslant 0\end{cases} f Y ( y ) = { 2 y 1 [ f X ( y ) + f X ( − y ) ] , y > 0 0 , y ⩽ 0 例如,当 X ∼ N ( 0 , 1 ) X \sim N(0,1) X ∼ N ( 0 , 1 ) 时,则 Y = X 2 Y=X^2 Y = X 2 的密度函数为
f Y ( y ) = { 1 2 π , y > 0 0 , y ⩽ 0 f_Y(y)= \begin{cases}\frac{1}{\sqrt{2 \pi}}, y>0 \\ 0, & y \leqslant 0\end{cases} f Y ( y ) = { 2 π 1 , y > 0 0 , y ⩽ 0 此时称 Y Y Y 服从自由度为 1 的 χ 2 \chi^2 χ 2 分布.
上例 中关键的一步在于将事件 Y ≤ y } Y \leq y\} Y ≤ y } 由其等价事件 { − y ⩽ X ⩽ y } \{-\sqrt{y} \leqslant X \leqslant \sqrt{y}\} { − y ⩽ X ⩽ y } 代替,即将事件 { Y ⩽ y } \{Y \leqslant y\} { Y ⩽ y } 转换为关于 X X X 的范围所表示的等价事件。下面我们仅对 Y = g ( X ) Y=g(X) Y = g ( X ) [函数 g ( x ) g(x) g ( x ) 为严格单调的]写出一般结论.
公式法 定理1 设连续型随机变量 X X X 的密度函数为 f X ( x ) , Y = g ( X ) f_X(x) , Y=g(X) f X ( x ) , Y = g ( X ) 是连续型随机变量, 若 y = g ( x ) y=g(x) y = g ( x ) 为严格单调函数, x = g − 1 ( y ) x=g^{-1}(y) x = g − 1 ( y ) 为相应的反函数,且为可导函数,则 Y = g ( X ) Y=g(X) Y = g ( X ) 的密度函数为
f Y ( y ) = f X ( g − 1 ( y ) ) ⋅ ∣ [ g − 1 ( y ) ] ∣ f_Y(y)=f_X\left(g^{-1}(y)\right) \cdot\left|\left[g^{-1}(y)\right]\right| f Y ( y ) = f X ( g − 1 ( y ) ) ⋅ [ g − 1 ( y ) ] 证明:略。
定理2 设 X ∼ N ( μ , σ 2 ) X \sim N\left(\mu, \sigma^2\right) X ∼ N ( μ , σ 2 ) ,则当 k ≠ 0 k \neq 0 k = 0 时, Y = k X + b ∼ N ( k μ + b , k 2 σ 2 ) Y=k X+b \sim N\left(k \mu+b, k^2 \sigma^2\right) Y = k X + b ∼ N ( k μ + b , k 2 σ 2 ) , 特别地, X − μ σ ∼ N ( 0 , 1 ) \frac{X-\mu}{\sigma} \sim N(0,1) σ X − μ ∼ N ( 0 , 1 )
证明:略。
例设随机变量 X X X 表示某服务行业一位顾客的服务时间,X X X 服从指数分布,其概率密度为
f ( x ) = { e − x , x > 0 , 0 , 其他. f(x)= \begin{cases}\mathrm{e}^{-x}, & x>0, \\ 0, & \text { 其他. }\end{cases} f ( x ) = { e − x , 0 , x > 0 , 其他 . 求 Y = e X Y=\mathrm{e}^X Y = e X 的概率密度.
解 函数 y = e x y=\mathrm{e}^x y = e x 是单调函数,其反函数为 x = ln y , x ′ = 1 y x=\ln y, x^{\prime}=\frac{1}{y} x = ln y , x ′ = y 1 ,故 Y Y Y 的概率密度为
f Y ( y ) = { 1 ∣ y ∣ e − ln y , ln y > 0 , 0 , 其他 = { 1 y 2 , y > 1 , 0 , 其他. f_Y(y)=\left\{\begin{array}{ll}
\frac{1}{|y|} \mathrm{e}^{-\ln y}, & \ln y>0, \\
0, & \text { 其他 }
\end{array}= \begin{cases}\frac{1}{y^2}, & y>1, \\
0, & \text { 其他. }\end{cases}\right. f Y ( y ) = { ∣ y ∣ 1 e − l n y , 0 , ln y > 0 , 其他 = { y 2 1 , 0 , y > 1 , 其他 . 应用公式法时,要注意函数 g ( x ) g(x) g ( x ) 必须是单调可导的,若不满足这个条件,就可以用分布函数法处理
例设 X ∼ N ( μ , σ 2 ) X \sim N\left(\mu, \sigma^2\right) X ∼ N ( μ , σ 2 ) ,求随机变量 Y = e X Y=\mathrm{e}^X Y = e X 的密度函数.
解 因 y = e x y=\mathrm{e}^x y = e x 的反函数为 x = ln y x=\ln y x = ln y ;当 y > 0 y>0 y > 0 时单增, x ′ = 1 y x^{\prime}=\frac{1}{y} x ′ = y 1 ,所以当 y > 0 y>0 y > 0 时
f Y ( y ) = f X ( ln y ) ( ln y ) ′ = 1 2 π σ y e − ( ln y − μ ) 2 2 σ 2 f_Y(y)=f_X(\ln y)(\ln y)^{\prime}=\frac{1}{\sqrt{2 \pi} \sigma y} \mathrm{e}^{-\frac{(\ln y-\mu)^2}{2 \sigma^2}} f Y ( y ) = f X ( ln y ) ( ln y ) ′ = 2 π σ y 1 e − 2 σ 2 ( l n y − μ ) 2 所以 Y = e X Y=\mathrm{e}^X Y = e X 的密度函数为
f Y ( y ) = { 1 2 π σ y e − ( ln y − μ ) 2 2 σ 2 , y > 0 , 0 , 其它. f_Y(y)= \begin{cases}\frac{1}{\sqrt{2 \pi} \sigma y} \mathrm{e}^{-\frac{(\ln y-\mu)^2}{2 \sigma^2}}, & y>0, \\ 0, & \text { 其它. }\end{cases}
f Y ( y ) = ⎩ ⎨ ⎧ 2 π σ y 1 e − 2 σ 2 ( l n y − μ ) 2 , 0 , y > 0 , 其它 .