数学期望体现了随机变量取值的平均水平,它是随机变量的重要数字特征.但仅仅知道数学期望是不够的,还需要知道随机变量取值的波动程度,即随机变量所取的值与它的数学期望的偏离程度.例如,有一批电子管,其平均寿命 E(X)=10000 h ,但仅由这一指标还不能判断这批电子管质量的好坏,还需考察电子管寿命 X 与 E(X) 的偏离程度,若偏离程度较小,则电子管质量比较稳定。因此,研究随机变量与其平均值的偏离程度是十分重要的。那么用什么量去表示这种偏离程度呢?显然,可用随机变量 ∣X−E(X)∣ 的平均值 E[∣X−E(X)∣] 来表示,但为了运算方便,通常用 E{[X−E(X)]2} 来表示 X 与 E(X) 的偏离程度.
通俗来说,它描述了一组数据偏离平均值的程度。 想象两个班级考试平均分都是70分:甲班:大部分学生成绩在65-75分之间 → 方差小。乙班:一半学生考50分,另一半考90分 → 方差大。
方差的定义
设 X 是一个随机变量,如果 E[(X−E(X))2] 存在,则称
D(X)=E[(X−E(X))2] 为随机变量 X 的方差。
称方差的算术平方根 σX=D(X) 为随机变量的标准差。
离散型
当 X 为离散型随机变量,其概率函数为 P(X=xi)=pi,i=1,2,⋯, 如果级数 ∑i[xi−E(X)]2pi 收敛,则 X 的方差为 D(X)=∑i[xi−E(X)]2pi;
连续型
当 X 为连续型随机变量,其概率密度为 f(x) ,如果广义积分
∫−∞+∞[x−E(X)]2f(x)dx 收敛,则 X 的方差为
D(X)=∫−∞+∞[x−E(X)]2f(x)dx. 在实际计算方差时,我们更多的是使用下列公式,这样更简便,
D(X)=E(X2)−[E(X)]2 证明:
D(X)=E[X−E(X)]2=E{X2−2XE(X)+[E(X)]2}=E(X2)−2E[XE(X)]+E[E(X)]2=E(X2)−2E(X)E(X)+[E(X)]2=E(X2)−[E(X)]2 例 设有甲、乙两种棉花,从中各抽取等量的样品进行检验,结果如下:

其中 X、Y 分别表示甲、乙两种棉花的纤维的长度(单位: mm ),求 D(X) 与 D(Y) ,并评定它们的质量。
解 由于
E(X)=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30E(Y)=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30 故得
D(X)D(Y)=(28−30)2×0.1+(29−30)2×0.15+(30−30)2×0.5+(31−30)2×0.15+(32−30)2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1,=(28−30)2×0.13+(29−30)2×0.17+(30−30)2×0.4+(31−30)2×0.17+(32−30)2×0.13=4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38. 因 D(X)<D(Y) ,所以甲种棉花纤维长度的方差小些,说明其纤维长度变化要小些,也就是要均匀些,故甲种棉花质量较好。
例 设随机变量 X 的概率密度为
f(X)=⎩⎨⎧1+x,1−x,0,−1⩽x<00⩽x<1 其他 , 求 D(X) .
解
E(X)=∫−10x(1+x)dx+∫01x(1−x)dx=0E(X2)=∫−10x2(1+x)dx+∫01x2(1−x)dx=1/6D(X)=E(X2)−[E(X)]2=1/6 例 求 均匀分布:X∼U(a,b) 方差
解: X 的概率密度为 f(x)={b−a1,0,a<x<b 其他 ,而 E(X)=∫−∞+∞xf(x)dx=∫abb−axdx=2a+b ,故所求方差为
D(X)=E(X2)−[E(X)]2=∫abx2b−a1dx−(2a+b)2=12(b−a)2. 例 正态分布:X∼N(μ,σ2)
先求标准正态变量 Z=σX−μ 的数学期望和方差.因为 Z 的概率密度为
ϕ(z)=2π1e−z2/2,−∞<z<+∞ 于是 E(Z)=0 ,
D(Z)=E(Z2)=2π1∫−∞+∞z2e−z2/2dz=−2π1∫−∞+∞zd(e−z2/2)=−2πze−z2/2−∞+∞+2π1∫−∞+∞e−z2/2dz=π1∫−∞+∞e−(z/2)2d(2z)=1, 其中利用泊松积分 ∫−∞+∞e−x2dx=π .
因 X=μ+σZ ,由数学期望和方差的性质得
E(X)=E(μ+σZ)=μD(X)=D(μ+σZ)=E[μ+σZ−E(μ+σZ)]2=E(σ2Z2)=σ2E(Z2)=σ2D(Z)=σ2 或者
D(X)=D(μ+σZ)=D(μ)+D(σZ)=0+D(σZ)=σ2D(Z)=σ2 这就是说,正态分布的概率密度中的两个参数 μ 和 σ 分别就是该分布的数学期望和均方差,因而正态分布完全可由它的数学期望和方差所确定.
由前面知道,若 Xi∼N(μ,σ2),i=1,2,⋯,n ,且它们相互独立,则它们的线性组合 c1X1+c2X2+⋯+cnXn(c1,c2,⋯,cn 是不全为零的常数)仍然服从正态分布。于是由数学期望和方差的性质得:
c1X1+c2X2+⋯+cnXn∼N(i=1∑nciμi,i=1∑nci2σi2) 这是一个重要的结果.
常用分布的方差
在附表里列出了常见分布的期望和方差,详见 此处