3._联合分布函数

引入

例① 联合分布是指一个事件受到多个因素控制,比如判断一个孩子的健康需要考虑:身高和体重两个维度,我们就说“身高”和“体重”这两个参数联合起来共同决定了孩子的健康程度,后面还会有一个边缘分布,他只有一个参数决定。

例② 射靶,如果以靶心为原点建立直角坐标系,那么靶点落的位置则是有(X,Y)(X,Y)共同决定。 上面这两个引例都告诉我们,现实世界很多事情是由多个参数来决定,因此,引入多维联合分布。

二维联合分布

定义1 如果 X=X(ω),Y=Y(ω)X=X(\omega), Y=Y(\omega) 是定义在同一个样本空间 Ω={ω}\Omega=\{\omega\} 上的两个随机变量,则称 (X(ω),Y(ω))=(X,Y)(X(\omega), Y(\omega))=(X, Y) 为定义在 Ω\Omega 上的二维随机变量

定义2(X,Y)(X, Y) 是二维随机变量, 对任意实数 xyx 、 y, 二元函数

F(x,y)=P(Xx,Yy)F(x, y)=P(X \leqslant x, Y \leqslant y)

称为二维随机变量 (X,Y)(X, Y) 的分布函数或随机变量 XXYY联合分布函数.

离散型联合分布函数求法

袋中有一个红色球,两个黑色球,三个白球,现有放回的从袋中取两次,每次取一球,以 X,Y,ZX, Y, Z 分别表示两次取球的红,黑,白球的个数. (1)求 P{X=1Z=0}P\{X=1 \mid Z=0\} ; (2)求二维随机变量 (X,Y)(X, Y) 的概率分布.

解(1)在没有取白球的情况下取了一次红球,利用样本空间的缩减法,相当于只有 1 个红球, 2 个黑球有放回摸两次,其中摸一个红球的概率,所以

P{X=1Z=0}=C21×232=49.P\{X=1 \mid Z=0\}=\frac{C_2^1 \times 2}{3^2}=\frac{4}{9} .

(2)X,YX, Y 取值范围为 0,1,20,1,2 ,故

P{X=0,Y=0}=C31×C3262=14,P{X=1,Y=0}=C21×C3162=16,P{X=2,Y=0}=162=136,P{X=0,Y=1}=C21×C21×C3162=13,P{X=1,Y=1}=C21×C2162=19,P{X=2,Y=1}=0,P{X=0,Y=2}=C21×C2162=19,P{X=1,Y=2}=0,P{X=2,Y=2}=0.\begin{aligned} & P\{X=0, Y=0\}=\frac{C_3^1 \times C_3^2}{6^2}=\frac{1}{4}, \\ & P\{X=1, Y=0\}=\frac{C_2^1 \times C_3^1}{6^2}=\frac{1}{6}, \\ & P\{X=2, Y=0\}=\frac{1}{6^2}=\frac{1}{36}, \\ & P\{X=0, Y=1\}=\frac{C_2^1 \times C_2^1 \times C_3^1}{6^2}=\frac{1}{3}, \\ & P\{X=1, Y=1\}=\frac{C_2^1 \times C_2^1}{6^2}=\frac{1}{9}, \quad P\{X=2, Y=1\}=0, \\ & P\{X=0, Y=2\}=\frac{C_2^1 \times C_2^1}{6^2}=\frac{1}{9}, \quad P\{X=1, Y=2\}=0, \\ & P\{X=2, Y=2\}=0 . \end{aligned}

最后列表可得

图片

连续型联合分布的数学定义

联合分布用数学语言可以表示为:

对于二维随机变量 ξ=(X,Y)\xi =(X, Y), 如果存在非负函数 p(x,y)(<x<,<y<)p(x, y)(-\infty<x<\infty,-\infty<y<\infty), 使对任意 a<b,c<da<b, c<dD={(x,y):a<x<b,c<y<d}D=\{(x, y): a<x<b, c<y<d\}

P((X,Y)D)=Dp(x,y)dxdyP((X, Y) \in D)=\iint_D p(x, y) d x d y

则称随机变量 ξ=(X,Y)\xi=(X, Y) 为连续型的, 并称 p(x,y)p(x, y)ξ\xi 的分布密度, 也称 p(x,y)p(x, y)(X,Y)(X, Y) 的联合分布密度 (简称联合密度)。

续型随机变量属于更一般的平面子集 DD 的概率为

P((X,Y)D)=Dp(x,y)dxdyP((X, Y) \in D)=\iint_D p(x, y) d x d y

联合分布的几何解释

我们容易给出分布函数的几何解释:如果把二维随机变量 (X,Y)(X, Y) 看成是平面上随机点的坐标,那么分布函数 F(x,y)F(x, y)(x,y)(x, y) 处的函数值就是随机点 (X,Y)(X, Y) 落在直线 X=xX=x 的左侧和直线 Y=yY=y 的下方的无穷矩形域内的概率,如下图3-1所示.

图片

对于联合分布,用通俗语言理解是,例如用XX表示学生的身高,用YY表示学生的体重,那么联合分布 F(170,60)=P(X170,Y60)F(170,60)=P(X \leqslant 170, Y \leqslant 60) 表示的是:身高低于170cm,体重低于60kg的学生的分布。这句话还可以正面解释为求:身高在(,170)(-\infty,170) 与 体重在 (,60)(-\infty,60) 的学生的分布。

因此,给出一个点(X,Y)(X,Y),求他的联合分布,其实表示的该点“左边下边”所围成的面积(参考图3-1阴影部分面积)。

根据以上的几何解释,借助于图3-2,我们可以计算出随机点 (X,Y)(X, Y) 落在矩形域 {(x,y)x1<xx2,y1<yy2}\left\{(x, y) \mid x_1<x \leqslant x_2, y_1<y \leqslant y_2\right\} 内的概率为

图片

P{x1<Xx2,y1<Yy2}=F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1).P\left\{x_1<X \leqslant x_2, y_1<Y \leqslant y_2\right\}=F\left(x_2, y_2\right)-F\left(x_2, y_1\right)-F\left(x_1, y_2\right)+F\left(x_1, y_1\right) .

对于图3-2,也可以用学生身高体重解释。用XX表示学生的身高,用YY表示学生的体重,那么联合分布 P{160<X170,50<Y60}=F(170,60)F(170,50)F(160,60)+F(160,50)P\left\{ 160<X \leqslant 170, 50<Y \leqslant 60\right\}=F\left(170, 60\right)-F\left(170, 50\right)-F\left( 160, 60\right)+F\left( 160, 50\right) 等式左边表示的是求学生身高在160170160 \sim 170 和 体重在5060 50 \sim 60 之间的人数,他等于身高体重在 (170,60)(170,60)以下的人数减去 身高170170以下的人数,再减去体重6060以下的人数,注意此时对(160,50)(160,50)以下的人数减了两次,所以还要再补上一次,因此最后加上(160,50)(160,50)

看懂联合密度的密度图

我们在一维平面里说过,概率密度(a,b)(a,b)曲线下的面积是事件发生在(a,b)(a,b)间的频率,详见此处, 那么如何理解二维概率密度呢?

首先,我们要明白,二维概率事件是由3个参数决定:比如射靶,我们说“射在(1,2)的概率为0.01”,那么这里就有X=1,Y=2,Z=0.01X=1,Y=2,Z=0.01三个参数 因此,如果把密度函数画在坐标系里,他需要是三维空间,如下图: 图片{width=400px}

这个图形很像农民带的草帽,我们通常称呼这个图形为“草帽”图形。因为密度函数必须大于等于零,所以这个草帽可以认为为平底的,又因为所有射靶所有的概率最多为1,因此,这个概率的体积最大只能为1.

理解二维密度函数图像 如果我们从俯视图的视角从下看这个草帽,可以发现他的定义域D就是一个二维平面。 图片{width=400px}

想想一下我们用一把刀沿着X,YX,Y 切开草帽,因为分布函数的定义为 F(x,y)=P(Xx,Yy)=xyp(x,y)dxdyF(x, y)=P(X \leqslant x, Y \leqslant y)=\int_{-\infty}^{x} \int_{-\infty}^{y} p(x, y) d x d y ,所以,我们取的西瓜就是左边下边的那一部分。

如果把二维随机变量 (X,Y)(X, Y) 视为平面上随机点的坐标, 那么, 分布函数 F(x,y)F(x, y)在点 (x,y)(x, y) 处的函数值就是随机点 (X,Y)(X, Y) 落在直线 X=xX=x 的左侧和直线 Y=yY=y 的下方以 (x,y)(x, y) 为顶点的无穷直角区域内的概率, 如图所示. 图片

联合分布函数得性质

性质1: 0F(x,y)10 \leq F(x, y) \leq 1 这个性质很好理解,分布函数反映到是概率,概率总是大于等于0小于等于1.

单调性2: F(x,y)F(x, y) 关于 xxyy 均为单调非减函数, 即 对任意固定的 yy ,当 x2>x1x_2>x_1 时, F(x2,y)F(x1,y)F\left(x_2, y\right) \geqslant F\left(x_1, y\right) ; 对任意固定的 xx, 当 y2>y1y_2>y_1 时, F(x,y2)F(x,y1)F\left(x, y_2\right) \geqslant F\left(x, y_1\right).

有界性3:对任意实数 xyx 、 y ,有 0F(x,y)10 \leqslant F(x, y) \leqslant 1 ,且 对任意固定的 yy ,有 F(,y)=0F(-\infty, y)=0 , 对任意固定的 xx, 有 F(x,)=0F(x,-\infty)=0, F(,)=0,F(+,+)=1F(-\infty,-\infty)=0, \quad F(+\infty,+\infty)=1.

右连续性4 F(x,y)F(x, y) 关于 xxyy 均为右连续, 即

F(x,y)=F(x+0,y),F(x,y)=F(x,y+0).F(x, y)=F(x+0, y), \quad F(x, y)=F(x, y+0) .

非负性5 对于任意 x1<x2y1<y2x_1<x_2 、 y_1<y_2 ,下述不等式成立:

F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)0.F\left(x_2, y_2\right)-F\left(x_2, y_1\right)-F\left(x_1, y_2\right)+F\left(x_1, y_1\right) \geqslant 0 .

注意:对任意的 x1<x2,y1<y2 x_1<x_2, y_1<y_2 ,有矩形公式

P(x1<Xx2,y1<Yy2)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1).\begin{gathered} & P\left(x_1<X \leq x_2, y_1<Y \leq y_2\right) \\ &\quad=F\left(x_2, y_2\right)-F\left(x_1, y_2\right) - F\left(x_2, y_1\right)+F\left(x_1, y_1\right) . \end{gathered}

参考下图

图片

例题

(离散型)下图 所示的二维离散型随机向量 X=(X1,X2)X=\left(X_1, X_2\right) 的概率分布为

图片{width=300px} 解:

P(X1=2,X2=1)=1/3P(X1=2,X2=2.5)=1/4P(X1=5,X2=3)=5/12...(2.1)\begin{aligned} & P\left(X_1=2, X_2=1\right)=1 / 3 \\ & P\left(X_1=2, X_2=2.5\right)=1 / 4 \\ & P\left(X_1=5, X_2=3\right)=5 / 12 \end{aligned} ...(2.1)

从图上看出, X1X_1 的可能值为 225,X25, X_2 的可能值为 1,2.51,2.533 . 故形式上看, X=(X1,X2)X=\left(X_1, X_2\right) 应有 66组可能值,即 (2,1),(2,2.5),(2,3),(5,1),(5,2.5),(5,3)(2,1),(2,2.5),(2,3),(5,1),(5,2.5),(5,3)

XX的概率分布告诉我们, 实际上只有第 1,2,61,2,6 组是真正的可能值, 但这并无关系:对一组不可能的值,只要把它的概率定为 0 就行了.

(连续型)设二维随机变量 (X,Y)(X, Y) 的分布函数为

f(x,y)={cosxcosy,0<x,y<π20, else f(x, y)=\left\{\begin{array}{l} \cos x \cos y, 0<x, y<\frac{\pi}{2} \\ 0, \text { else } \end{array}\right.

(1) 试求 X,YX, Y 联合分布函数. (2) 试求 P(0Xπ4Yπ2)P\left(0 \leq X \leq \frac{\pi}{4} \leq Y \leq \frac{\pi}{2}\right).

解(1)根据限制域的特点,我们很显然要做分类讨论。 以下设待求函数为 F(u,v)F(u, v). 但是,这是完全没有必要一个一个情况代的。因为只需要在图上标出积分域, 就自然而然清楚需要怎么积分了。 图片 (a) u,vu, v 中有一个小于 0 (包括均小于 0)). 很明显, 只要有这种情况存在, 积分域内就没有非 0 的情况. (b) u,vu, v 均介于 0,π20, \frac{\pi}{2} 之间. 那么 F(u,v)=0u0vcosxcosydxdy=sinusinvF(u, v)=\int_0^u \int_0^v \cos x \cos y d x d y=\sin u \sin v. (c) u,vu, v 中有一个大于 π2\frac{\pi}{2}, 另一个介于 0,π20, \frac{\pi}{2} 之间. 那么 F(u,v)=010vcosxcosydxdy=F(u, v)=\int_0^1 \int_0^v \cos x \cos y d x d y= sinv\sin v 或同理, sinu\sin u. (d) u,vu, v 均大于 π2\frac{\pi}{2}. 显然 F(u,v)=1F(u, v)=1.

综上, F(x,y)={0,x0 or y0sinxsiny,0<x,y<π2sinx,0<x<π2,yπ2..(2) 只需套公式即可. siny,xπ2,0<y<π21,x,yπ2F(x, y)=\left\{\begin{array}{l}0, x \leq 0 \text { or } y \leq 0 \\ \sin x \sin y, 0<x, y<\frac{\pi}{2} \\ \sin x, 0<x<\frac{\pi}{2}, y \geq \frac{\pi}{2} . \text {.(2) 只需套公式即可. } \\ \sin y, x \geq \frac{\pi}{2}, 0<y<\frac{\pi}{2} \\ 1, x, y \geq \frac{\pi}{2}\end{array}\right.

分布函数和密度函数的转化

已知分布函数求密度函数 设二维随机变量 (X,Y)(X, Y) 的联合分布函数为

F(x,y)={13x3y+3xy,x0,y00, 其他. F(x, y)= \begin{cases}1-3^{-x}-3^{-y}+3^{-x-y}, & x \geqslant 0, y \geqslant 0 \\ 0, & \text { 其他. }\end{cases}

则二维随机变量 (X,Y)(X, Y) 的联合密度 φ(x,y)\varphi(x, y)\qquad . 解 可以验证这是二维连续型随机变量的分布函数,由公式:

φ(x,y)=2Fxy\boxed { \varphi(x, y)=\frac{\partial^2 F}{\partial x \partial y} }

Fx=3xln33xyln32Fxy=3xy(ln3)2\frac{\partial F}{\partial x}=3^{-x} \ln 3-3^{-x-y} \ln 3 \quad \frac{\partial^2 F}{\partial x \partial y}=3^{-x-y}(\ln 3)^2

φ(x,y)={3xy(ln3)2,x0,y00, 其他.\varphi(x, y)= \begin{cases}3^{-x-y}(\ln 3)^2, & x \geqslant 0, y \geqslant 0 \\ 0, & \text { 其他.}\end{cases}

已知密度函数求分布函数 设二维随机变量 (X,Y)(X, Y) 的概率密度为

f(x,y)={6x,0xy10, 其他. f(x, y)= \begin{cases}6 x, & 0 \leqslant x \leqslant y \leqslant 1 \\ 0, & \text { 其他. }\end{cases}

P{X+Y1}P\{X+Y \leqslant 1\} 是多少

解 由题意作图 所示

P{X+Y1}=x+y1f(x,y)dxdy=012dxx1x6xdy=0126x(12x)dx=14.\begin{aligned} P\{X+Y \leqslant 1\} & =\iint_{x+y \leqslant 1} f(x, y) d x d y \\ & =\int_0^{\frac{1}{2}} d x \int_x^{1-x} 6 x d y \\ & =\int_0^{\frac{1}{2}} 6 x(1-2 x) d x=\frac{1}{4} . \end{aligned}

图片

3._联合分布函数 - 概率论与数理统计 | OpenTech