在前两节中,我们介绍了一维随机变量的数字特征.对于二维随机变量 ( X , Y ) (X, Y) ( X , Y ) ,除了讨论随机变量 X X X 和 Y Y Y 各自的数学期望和方差,还需要研究描述 X X X 与 Y Y Y 之间相互关系的数字特征。例如,假设某品牌企业的广告支出 X X X 和销售收入 Y Y Y 都为随机变量,X X X 和 Y Y Y 往往是不独立的,需要分析 X X X 与 Y Y Y 之间的依赖关系,即相关性.本节介绍的协方差和相关系数就是用来描述 X X X 与 Y Y Y 之间相互关系的数字特征.
协方差定义 定义 设二维随机变量 ( X , Y ) (X, Y) ( X , Y ) ,若 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } E\{[X-E(X)][Y-E(Y)]\} E {[ X − E ( X )] [ Y − E ( Y )]} 存在,则称它为随机变量 X X X 与 Y Y Y 的协方差,记为 cov ( X , Y ) \operatorname{cov}(X, Y) cov ( X , Y ) ,或 σ X Y \sigma_{X Y} σ X Y ,即
cov ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } \operatorname{cov}(X, Y)=E\{[X-E(X)][Y-E(Y)]\} cov ( X , Y ) = E {[ X − E ( X )] [ Y − E ( Y )]} 当 D ( X ) > 0 , D ( Y ) > 0 D(X)>0, D(Y)>0 D ( X ) > 0 , D ( Y ) > 0 时,
ρ X Y = cov ( X , Y ) D ( X ) D ( Y ) \rho_{X Y}=\frac{\operatorname{cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} ρ X Y = D ( X ) D ( Y ) cov ( X , Y ) 称为随机变量 X X X 与 Y Y Y 的相关系数 .
当 ρ X Y = 0 \rho_{X Y}=0 ρ X Y = 0 时,称随机变量 X X X 与 Y Y Y 不相关 或线性无关.
将随机变量 X X X 与 Y Y Y 标准化,得
X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) X^*=\frac{X-E(X)}{\sqrt{D(X)}}, Y^*=\frac{Y-E(Y)}{\sqrt{D(Y)}} X ∗ = D ( X ) X − E ( X ) , Y ∗ = D ( Y ) Y − E ( Y ) 由相关系数的定义,显然有 ρ X Y = cov ( X ∗ , Y ∗ ) \rho_{X Y}=\operatorname{cov}\left(X^*, Y^*\right) ρ X Y = cov ( X ∗ , Y ∗ ) .
在实际应用当中,协方差和相关系数是用来描述随机变量 X X X 与 Y Y Y 之间线性相关方向和依赖程度的数字特征。
由协方差定义及数学期望的性质,可得协方差的计算公式
cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) \operatorname{cov}(X, Y)=E(X Y)-E(X) E(Y) cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) 离散型
若 ( X , Y ) (X, Y) ( X , Y ) 为离散型随机向量,其概率分布为
P { X = x i , Y = y j } = p i j i , j = 1 , 2 , ⋯ , P\left\{X=x_i, Y=y_j\right\}=p_{i j} \quad i, j=1,2, \cdots, P { X = x i , Y = y j } = p ij i , j = 1 , 2 , ⋯ , 则
Cov ( X , Y ) = ∑ i ∑ j [ x i − E ( X ) ] [ y j − E ( Y ) ] p i j \operatorname{Cov}(X, Y)=\sum_i \sum_j\left[x_i-E(X)\right]\left[y_j-E(Y)\right] p_{i j} Cov ( X , Y ) = i ∑ j ∑ [ x i − E ( X ) ] [ y j − E ( Y ) ] p ij 连续型
若 ( X , Y ) (X, Y) ( X , Y ) 为连续型随机向量,其概率分布为 f ( x , y ) f(x, y) f ( x , y ) ,则
Cov ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ { [ x − E ( X ) ] [ y − E ( Y ) ] } f ( x , y ) d x d y \operatorname{Cov}(X, Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}\{[x-E(X)][y-E(Y)]\} f(x, y) d x d y Cov ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ {[ x − E ( X )] [ y − E ( Y )]} f ( x , y ) d x d y 此外,由协方差定义和数学期望的性质可得以下有用的计算公式
Cov ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned}
\operatorname{Cov}(X, Y) & =E\{[X-E(X)][Y-E(Y)]\} \\
& =E(X Y)-E(X) E(Y)-E(Y) E(X)+E(X) E(Y) \\
& =E(X Y)-E(X) E(Y)
\end{aligned} Cov ( X , Y ) = E {[ X − E ( X )] [ Y − E ( Y )]} = E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) 特别地,当 X X X 与 Y Y Y 独立时,有 Cov ( X , Y ) = 0 \operatorname{Cov}(X, Y)=0 Cov ( X , Y ) = 0 .
例 已知离散型随机向量( X,Y ) 的概率分布为
求 Cov ( X , Y ) \operatorname{Cov}(X, Y) Cov ( X , Y ) .
解 容易求得 X X X 的概率分布为 P { X = 0 } = 0.3 , P { X = 1 } = 0.45 , P { X = 2 } = 0.25 P\{X=0\}=0.3, P\{X=1\}=0.45, P\{X=2\}=0.25 P { X = 0 } = 0.3 , P { X = 1 } = 0.45 , P { X = 2 } = 0.25 ; Y Y Y 的概率分布为 P { Y = − 1 } = 0.55 , P { Y = 0 } = 0.25 , P { Y = 2 } = 0.2 P\{Y=-1\}=0.55, P\{Y=0\}=0.25, P\{Y=2\}=0.2 P { Y = − 1 } = 0.55 , P { Y = 0 } = 0.25 , P { Y = 2 } = 0.2 ,
于是有
E ( X ) = 0 × 0.3 + 1 × 0.45 + 2 × 0.25 = 0.95 E ( Y ) = ( − 1 ) × 0.55 + 0 × 0.25 + 2 × 0.2 = − 0.15 \begin{gathered}
E(X)=0 \times 0.3+1 \times 0.45+2 \times 0.25=0.95 \\
E(Y)=(-1) \times 0.55+0 \times 0.25+2 \times 0.2=-0.15
\end{gathered} E ( X ) = 0 × 0.3 + 1 × 0.45 + 2 × 0.25 = 0.95 E ( Y ) = ( − 1 ) × 0.55 + 0 × 0.25 + 2 × 0.2 = − 0.15 计算得 E ( X Y ) = 0 × ( − 1 ) × 0.1 + 0 × 0 × 0.2 + 0 × 2 × 0 + 1 × ( − 1 ) × 0.3 + 1 × 0 × 0.5 + 1 × 2 × 0.1 + E(X Y)=0 \times(-1) \times 0.1+0 \times 0 \times 0.2+0 \times 2 \times 0+1 \times(-1) \times 0.3+1 \times 0 \times 0.5+1 \times 2 \times 0.1+ E ( X Y ) = 0 × ( − 1 ) × 0.1 + 0 × 0 × 0.2 + 0 × 2 × 0 + 1 × ( − 1 ) × 0.3 + 1 × 0 × 0.5 + 1 × 2 × 0.1 +
2 × ( − 1 ) × 0.15 + 2 × 0 × 0 + 2 × 2 × 0.1 = 0. 2 \times(-1) \times 0.15+2 \times 0 \times 0+2 \times 2 \times 0.1=0 . 2 × ( − 1 ) × 0.15 + 2 × 0 × 0 + 2 × 2 × 0.1 = 0. 于是
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 0.95 × 0.15 = 0.1425. \operatorname{Cov}(X, Y)=E(X Y)-E(X) E(Y)=0.95 \times 0.15=0.1425 . Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 0.95 × 0.15 = 0.1425. 例 设 ( X , Y ) (X, Y) ( X , Y ) 的概率密度为
f ( x , y ) = { x + y , 0 < x < 1 , 0 < y < 1 0 , 其他 , f(x, y)=\left\{\begin{array}{ll}
x+y, & 0<x<1,0<y<1 \\
0, & \text { 其他 }
\end{array}\right. \text {, } f ( x , y ) = { x + y , 0 , 0 < x < 1 , 0 < y < 1 其他 , 求 Cov ( X , Y ) \operatorname{Cov}(X, Y) Cov ( X , Y ) .
解 由于 f X ( x ) = { x + 1 2 , 0 < x < 1 0 , 其他 , f Y ( y ) = { y + 1 2 , 0 < y < 1 0 , 其他 f_X(x)=\left\{\begin{array}{ll}x+\frac{1}{2}, & 0<x<1 \\ 0, & \text { 其他 }\end{array}, \quad f_Y(y)=\left\{\begin{array}{ll}y+\frac{1}{2}, & 0<y<1 \\ 0, & \text { 其他 }\end{array}\right.\right. f X ( x ) = { x + 2 1 , 0 , 0 < x < 1 其他 , f Y ( y ) = { y + 2 1 , 0 , 0 < y < 1 其他 ,
E ( X ) = ∫ 0 1 x ( x + 1 2 ) d x = 7 12 E(X)=\int_0^1 x\left(x+\frac{1}{2}\right) d x=\frac{7}{12} E ( X ) = ∫ 0 1 x ( x + 2 1 ) d x = 12 7 E ( Y ) = ∫ 0 1 y ( y + 1 2 ) d y = 7 12 E ( X Y ) = ∫ 0 1 ∫ 0 1 x y ( x + y ) d x d y = ∫ 0 1 ∫ 0 1 x 2 y d x d y + ∫ 0 1 ∫ 0 1 x y 2 d x d y = 1 3 Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 1 3 − 7 12 × 7 12 = − 1 144 \begin{gathered}
E(Y)=\int_0^1 y\left(y+\frac{1}{2}\right) d y=\frac{7}{12} \\
E(X Y)=\int_0^1 \int_0^1 x y(x+y) d x d y=\int_0^1 \int_0^1 x^2 y d x d y+\int_0^1 \int_0^1 x y^2 d x d y=\frac{1}{3} \\
\operatorname{Cov}(X, Y)=E(X Y)-E(X) E(Y)=\frac{1}{3}-\frac{7}{12} \times \frac{7}{12}=-\frac{1}{144}
\end{gathered} E ( Y ) = ∫ 0 1 y ( y + 2 1 ) d y = 12 7 E ( X Y ) = ∫ 0 1 ∫ 0 1 x y ( x + y ) d x d y = ∫ 0 1 ∫ 0 1 x 2 y d x d y + ∫ 0 1 ∫ 0 1 x y 2 d x d y = 3 1 Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 3 1 − 12 7 × 12 7 = − 144 1 因此
协方差的性质 定理 设随机变量 X 、 Y X 、 Y X 、 Y 的方差存在,则
(1) Cov ( X , X ) = D ( X ) \operatorname{Cov}(X, X)=D(X) Cov ( X , X ) = D ( X ) ;
(2) Cov ( X , Y ) = Cov ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov ( X , Y ) = Cov ( Y , X ) ;
(3) Cov ( a X , b Y ) = a b Cov ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov ( a X , bY ) = ab Cov ( X , Y ) ,其中 a 、 b a 、 b a 、 b 是常数;
(4) Cov ( C , X ) = 0 , C \operatorname{Cov}(C, X)=0, C Cov ( C , X ) = 0 , C 为任意常数;
(5) Cov ( X 1 + X 2 , Y ) = Cov ( X 1 , Y ) + Cov ( X 2 , Y ) \operatorname{Cov}\left(X_1+X_2, Y\right)=\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right) Cov ( X 1 + X 2 , Y ) = Cov ( X 1 , Y ) + Cov ( X 2 , Y ) ;
(6)当 X X X 与 Y Y Y 相互独立时,则 Cov ( X , Y ) = 0 \operatorname{Cov}(X, Y)=0 Cov ( X , Y ) = 0 ;
(7)D ( X + Y ) = D ( X ) + D ( Y ) + 2 Cov ( X , Y ) D(X+Y)=D(X)+D(Y)+2 \operatorname{Cov}(X, Y) D ( X + Y ) = D ( X ) + D ( Y ) + 2 Cov ( X , Y ) .
特别地,若 X X X 与 Y Y Y 相互独立时,则
D ( X + Y ) = D ( X ) + D ( Y ) . D(X+Y)=D(X)+D(Y) . D ( X + Y ) = D ( X ) + D ( Y ) . 证明 仅证性质(5)
Cov ( X 1 + X 2 , Y ) = E [ ( X 1 + X 2 ) Y ] − E ( X 1 + X 2 ) E ( Y ) = E ( X 1 Y ) + E ( X 2 Y ) − E ( X 1 ) E ( Y ) − E ( X 2 ) E ( Y ) = [ E ( X 1 Y ) − E ( X 1 ) E ( Y ) ] + [ E ( X 2 Y ) − E ( X 2 ) E ( Y ) ] = Cov ( X 1 , Y ) + Cov ( X 2 , Y ) \begin{aligned}
\operatorname{Cov}\left(X_1+X_2, Y\right) & =E\left[\left(X_1+X_2\right) Y\right]-E\left(X_1+X_2\right) E(Y) \\
& =E\left(X_1 Y\right)+E\left(X_2 Y\right)-E\left(X_1\right) E(Y)-E\left(X_2\right) E(Y) \\
& =\left[E\left(X_1 Y\right)-E\left(X_1\right) E(Y)\right]+\left[E\left(X_2 Y\right)-E\left(X_2\right) E(Y)\right] \\
& =\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right)
\end{aligned} Cov ( X 1 + X 2 , Y ) = E [ ( X 1 + X 2 ) Y ] − E ( X 1 + X 2 ) E ( Y ) = E ( X 1 Y ) + E ( X 2 Y ) − E ( X 1 ) E ( Y ) − E ( X 2 ) E ( Y ) = [ E ( X 1 Y ) − E ( X 1 ) E ( Y ) ] + [ E ( X 2 Y ) − E ( X 2 ) E ( Y ) ] = Cov ( X 1 , Y ) + Cov ( X 2 , Y ) 例 设连续型随机变量 ( X , Y ) (X, Y) ( X , Y ) 的密度函数为
f ( x , y ) = { 8 x y , 0 ⩽ x ⩽ y ⩽ 1 0 , 其他 , f(x, y)=\left\{\begin{array}{ll}
8 x y, & 0 \leqslant x \leqslant y \leqslant 1 \\
0, & \text { 其他 }
\end{array}\right. \text {, } f ( x , y ) = { 8 x y , 0 , 0 ⩽ x ⩽ y ⩽ 1 其他 , 求 Cov ( X , Y ) \operatorname{Cov}(X, Y) Cov ( X , Y ) 和 D ( X + Y ) D(X+Y) D ( X + Y ) .
解 由 ( X , Y ) (X, Y) ( X , Y ) 的密度函数可求得其边缘密度函数分别为
f X ( x ) = { 4 x ( 1 − x 2 ) , 0 ⩽ x ⩽ 1 0 , 其他 , f Y ( y ) = { 4 y 3 , 0 ⩽ y ⩽ 1 0 , 其他 , f_X(x)=\left\{\begin{array}{ll}
4 x\left(1-x^2\right), & 0 \leqslant x \leqslant 1 \\
0, & \text { 其他 }
\end{array}, \quad f_Y(y)=\left\{\begin{array}{ll}
4 y^3, & 0 \leqslant y \leqslant 1 \\
0, & \text { 其他 }
\end{array}\right. \text {, }\right. f X ( x ) = { 4 x ( 1 − x 2 ) , 0 , 0 ⩽ x ⩽ 1 其他 , f Y ( y ) = { 4 y 3 , 0 , 0 ⩽ y ⩽ 1 其他 , 于是
E ( X ) = ∫ − ∞ + ∞ x f X ( x ) d x = ∫ 0 1 x ⋅ 4 x ( 1 − x 2 ) d x = 8 / 15 E ( Y ) = ∫ − ∞ + ∞ y f Y ( y ) d y = ∫ 0 1 y ⋅ 4 y 3 d y = 4 / 5 E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y = ∫ 0 1 d x ∫ x 1 x y ⋅ 8 x y ⋅ d y = 4 / 9 \begin{gathered}
E(X)=\int_{-\infty}^{+\infty} x f_X(x) d x=\int_0^1 x \cdot 4 x\left(1-x^2\right) d x=8 / 15 \\
E(Y)=\int_{-\infty}^{+\infty} y f_Y(y) d y=\int_0^1 y \cdot 4 y^3 d y=4 / 5 \\
E(X Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x y f(x, y) d x d y=\int_0^1 d x \int_x^1 x y \cdot 8 x y \cdot d y=4 / 9
\end{gathered} E ( X ) = ∫ − ∞ + ∞ x f X ( x ) d x = ∫ 0 1 x ⋅ 4 x ( 1 − x 2 ) d x = 8/15 E ( Y ) = ∫ − ∞ + ∞ y f Y ( y ) d y = ∫ 0 1 y ⋅ 4 y 3 d y = 4/5 E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y = ∫ 0 1 d x ∫ x 1 x y ⋅ 8 x y ⋅ d y = 4/9 从而
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 4 / 225 , \operatorname{Cov}(X, Y)=E(X Y)-E(X) E(Y)=4 / 225, Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 4/225 , 又
E ( X 2 ) = ∫ − ∞ + ∞ x 2 f X ( x ) d x = ∫ 0 1 x 2 ⋅ 4 x ( 1 − x 2 ) d x = 1 / 3 E\left(X^2\right)=\int_{-\infty}^{+\infty} x^2 f_X(x) d x=\int_0^1 x^2 \cdot 4 x\left(1-x^2\right) d x=1 / 3 E ( X 2 ) = ∫ − ∞ + ∞ x 2 f X ( x ) d x = ∫ 0 1 x 2 ⋅ 4 x ( 1 − x 2 ) d x = 1/3 E ( Y 2 ) = ∫ − ∞ + ∞ y 2 f Y ( y ) d y = ∫ 0 1 y 2 ⋅ 4 y 3 d y = 2 / 3 E\left(Y^2\right)=\int_{-\infty}^{+\infty} y^2 f_Y(y) d y=\int_0^1 y^2 \cdot 4 y^3 d y=2 / 3 E ( Y 2 ) = ∫ − ∞ + ∞ y 2 f Y ( y ) d y = ∫ 0 1 y 2 ⋅ 4 y 3 d y = 2/3 所以
D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 11 / 225 , D ( Y ) = E ( Y 2 ) − [ E ( Y ) ] 2 = 2 / 75 D(X)=E\left(X^2\right)-[E(X)]^2=11 / 225, D(Y)=E\left(Y^2\right)-[E(Y)]^2=2 / 75 D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 11/225 , D ( Y ) = E ( Y 2 ) − [ E ( Y ) ] 2 = 2/75 故
D ( X + Y ) = D ( X ) + D ( Y ) + 2 Cov ( X , Y ) = 1 / 9 D(X+Y)=D(X)+D(Y)+2 \operatorname{Cov}(X, Y)=1 / 9 D ( X + Y ) = D ( X ) + D ( Y ) + 2 Cov ( X , Y ) = 1/9