4._样本均值_样本方差_原点矩和中心矩

样本均值

假设有一组学生,身高分别是 160,162,165,165,168160,162,165,165,168 我要求他的平均身高,只要把这几个数加起来,除以个数即可,即

xˉ=(160+162+165+165+168)/5=164\bar{x}=(160+162+165+165+168)/5=164

由此可得样本均值的定义:

样本均值 xˉ=1ni=1nxi\bar{x}=\frac{1}{n} \sum_{i=1}^n x_i

样本分组均值 在分组样本场合,样本均值的近似公式为

\bar{x}=\dfrac{x_1 f_1+x_2 f_2+\cdots+x_k f_k}{n} \

其中 kk 为组数,xix_i 为第 ii 组的组中值,fif_i 为第 ii 组的频数.

如何理解样本分组后的均值?简单的理解,就是“加权平均数”,比如电视直播歌手比赛,专业评委和观众都可以打分,同样是打9分,专业评委的权重会比观众的权重要高,因此,此时计算分数,就使用了加权平均数。

某单位收集到 20 名青年人某月的娱乐支出费用数据:

\begin{array} 790 & 840 & 840 & 880 & 920 & 930 & 940 & 970 & 980 & 990 \\ 1000 & 1010 & 1010 & 1020 & 1020 & 1080 & 1100 & 1130 & 1180 & 1250 \end{array}

则该月这 20 名青年的平均娱乐支出为

xˉ=120(790+840++1250)=994.\bar{x}=\frac{1}{20}(790+840+\cdots+1250)=994 .

将这 20 个数据分组可得到如下频数频率表:

图片

使用样本分组均值公式计算可得

xˉ=120(820×3+920×5++1220×2)=1000.\bar{x}=\frac{1}{20}(820 \times 3+920 \times 5+\cdots+1220 \times 2)=1000 .

我们看到两种计算结果不同.事实上,由于上式未用到真实的样本观测数据,因而给出的是近似结果.

样本方差与样本标准差

样本方差 s2=1n1i=1n(xixˉ)2s^2=\frac{1}{n-1} \sum_{i=1}^n\left(x_i-\bar{x}\right)^2

样本标准差的观测值 s=1n1i=1n(xixˉ)2s=\sqrt{\frac{1}{n-1} \sum_{i=1}^n\left(x_i-\bar{x}\right)^2}

为什么样本方差除以n1n-1而总体方差除以nn

在高中概率统计里学过方差,详见 此处, 样本方差计算公式里n-1与自由度有关系?那总体标准差为什么用n就没有自由度关系?

总体方差:总体方差是所有数据点与总体均值的偏差平方的平均值。如果总体数据是 X1,X2,,XnX_1, X_2, \ldots, X_n ,总体均值是 μ\mu ,那么总体方差 σ2\sigma^2 的计算公式为:

σ2=1Ni=1N(Xiμ)2\sigma^2=\frac{1}{N} \sum_{i=1}^N\left(X_i-\mu\right)^2

这里除以 N 是因为总体方差是所有数据点的平均偏差平方。

样本方差:样本方差是样本数据点与样本均值的偏差平方的平均值。如果样本数据是 x1,x2,,xnx_1, x_2, \ldots, x_n ,样本均值是xˉ\bar{x},那么样本方差 s2s^2 的计算公式为:

s2=1n1i=1n(xixˉ)2s^2=\frac{1}{n-1} \sum_{i=1}^n\left(x_i-\bar{x}\right)^2

样本方差是总体方差的无偏估计,那什么是无偏估计呢?

无偏估计:无偏估计是指估计量的期望值等于被估计的参数。在样本方差的计算中,使用 n1n−1 作为分母可以使得样本方差的期望值等于总体方差,即

E(s2)=σ2E(s^2)=\sigma ^2

这个性质对于统计推断非常重要,因为它保证了样本方差是一个可靠的总体方差估计。

综上所述,总体方差除以N是因为它是所有数据点的平均偏差平方,而样本方差除以 n1n−1 是为了对总体方差进行无偏估计。

或者说,这里除以 n1n-1 而不是 nn 的原因是样本方差需要对总体方差进行无偏估计。样本均值xˉ\bar{x}是从样本数据中计算出来的,它本身也存在一定的偏差。使用 n1n-1 作为分母可以校正这个偏差,使得样本方差的期望值等于总体方差。

关于本题的数学推导,请参考 无偏向

如果从自由度的角度来讲,首先我们先从样本方差统计计算来看,因为一组样本值,由于其均值是一定的,即 xˉ=(x1+x2...+xn)/n\bar{x}=(x_1+x_2...+x_n)/n ,由于有这个等式的存在,相当于增加了一个限制, 当xˉ\bar{x}固定了,看似有nn个变量,但是真正能随便取值的是n1n-1 个,因此样本方差计算时,它的自由度是n1n-1, 即要除以n1n-1 nn

那问题来了,为什么在计算整体(或称母本)方差时,而是除以nn呢? 还是自由度,当计算整体时,均值为 μ=(x1+x2...+xn)/n\mu=(x_1+x_2...+x_n)/n 数据中nn个可以自由变化的数字。在求解方差时,均值μ\mu 看似增加了一个等式,其实是nn个未知数,但是是n+1n+1个等式,因此方差除以n

结论

样本方差是度量样本散布大小的统计量,使用广泛,在它的这个定义中, nn 为样本量,i=1n(xixˉ)2\sum_{i=1}^n\left(x_i-\bar{x}\right)^2 称为偏差平方和,n1n-1 称为偏差平方和的自由度。其含义是:在 xˉ\bar{x} 确定后,nn 个偏差 x1xˉ,x2xˉ,,xnxˉx_1-\bar{x}, x_2-\bar{x}, \cdots, x_n-\bar{x} 中只有 n1n-1 个偏差可以自由变动,而第 nn个则不能自由取值,因为 (xixˉ)=0\sum\left(x_i-\bar{x}\right)=0

样本偏差平方和有三个常用的表达式:

(xixˉ)2=xi2(xi)2n=xi2nxˉ2\sum\left(x_i-\bar{x}\right)^2=\sum x_i^2-\frac{\left(\sum x_i\right)^2}{n}=\sum x_i^2-n \bar{x}^2

它们都可用来计算样本方差. 在分组样本场合,样本方差的近似计算公式为

s2=1n1i=1kfi(xixˉ)2=1n1(i=1kfixi2nxˉ2),s^2=\frac{1}{n-1} \sum_{i=1}^k f_i\left(x_i-\bar{x}\right)^2=\frac{1}{n-1}\left(\sum_{i=1}^k f_i x_i^2-n \bar{x}^2\right),

其中 xi,fix_i, f_i 分别为第 ii 个区间的组中值和频数, xˉ\bar{x} 为分组均值里给出的样本均值近似值.

原点矩与中心矩

x1,x2,,xnx_1, x_2, \cdots, x_n 是样本,kk 为正整数,则统计量

ak=1ni=1nxik\boxed{ a_k=\frac{1}{n} \sum_{i=1}^n x_i^k }

称为样本 kk 阶原点矩,特别,样本一阶原点矩就是样本均值.

统计量

bk=1ni=1n(xixˉ)k\boxed{ b_k=\frac{1}{n} \sum_{i=1}^n\left(x_i-\bar{x}\right)^k }

称为样本 kk 阶中心矩.

为什么要搞出原点矩和中心矩?如果说用样本估算总体,那我们希望估算的越准确越好。想象一下高等数学里泰勒展开 我们使用一阶导,二阶导,一直到n阶导拟合曲线。同样,如果样本期望和总体期望相同,样本方程和总体方差相同,样本3阶矩和总体3阶矩相同... 这不是最好的吗? 关于原点矩和中心矩还有矩母函数请点击附录2

设总体 XX 的均值 E(X)=μE(X)=\mu ,方差 D(X)=σ2(X1,X2,,Xn)D(X)=\sigma^2 ,\left(X_1, X_2, \cdots, X_n\right) 为取自该总体的一个 样本,则 (1) E(xˉ)=μ,D(xˉ)=σ2n\quad E(\bar{x})=\mu, D(\bar{x})=\frac{\sigma^2}{n} (2) E(S2)=σ2,E(Sn2)=n1nσ2,n2E\left(S^2\right)=\sigma^2, E\left(S_n^2\right)=\frac{n-1}{n} \sigma^2, n \geq 2 (3) XˉPμ,S2=1n1i=1n(XiXˉ)2Pσ2,Sn2=1ni=1n(XiXˉ)2Pσ2\bar{X} \stackrel{P}{\longrightarrow} \mu, S^2=\frac{1}{n-1} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2 \stackrel{P}{\rightarrow} \sigma^2, S_n^2=\frac{1}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2 \stackrel{P}{\longrightarrow} \sigma^2. 证 (1)

E(Xˉ)=E(1ni=1nXi)=1ni=1nE(Xi)=μ,D(Xˉ)=D(1ni=1nXi)=1n2i=1nD(Xi)=1nσ2,\begin{aligned} & E(\bar{X})=E\left(\frac{1}{n} \sum_{i=1}^n X_i\right)=\frac{1}{n} \sum_{i=1}^n E\left(X_i\right)=\mu, \\ & D(\bar{X})=D\left(\frac{1}{n} \sum_{i=1}^n X_i\right)=\frac{1}{n^2} \sum_{i=1}^n D\left(X_i\right)=\frac{1}{n} \sigma^2, \end{aligned}

证 (2)

(n1)E(S2)=E(i=1nXi2nXˉ2)=(i=1nE(Xi2)nE(Xˉ2))=n(D(X1)+E2(X1)D(Xˉ)E2(Xˉ))=n(σ2σ2n)=(n1)σ2E(S2)=σ2,E(Sn2)=n1nσ2\begin{aligned} (n-1) E\left(S^2\right) & =E\left(\sum_{i=1}^n X_i^2-n \bar{X}^2\right)=\left(\sum_{i=1}^n E\left(X_i^2\right)-n E\left(\bar{X}^2\right)\right) \\ & =n\left(D\left(X_1\right)+E^2\left(X_1\right)-D(\bar{X})-E^2(\bar{X})\right) \\ & =n\left(\sigma^2-\frac{\sigma^2}{n}\right)=(n-1) \sigma^2 \\ & \Rightarrow E\left(S^2\right)=\sigma^2, \quad E\left(S_n^2\right)=\frac{n-1}{n} \sigma^2 \end{aligned}

证 (3) 独立同分布的大数定律,即得 XˉPμ\bar{X} \stackrel{P}{\longrightarrow} \mu

1ni=1nXi2pσ2+μ2,\frac{1}{n} \sum_{i=1}^n X_i^2 \stackrel{p}{\rightarrow} \sigma^2+\mu^2,

所以 Sn2=1ni=1n(XiXˉ)2=1ni=1nXi2Xˉ2Pσ2+μ2μ2=σ2S_n^2=\frac{1}{n} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2=\frac{1}{n} \sum_{i=1}^n X_i^2-\bar{X}^2 \stackrel{P}{\longrightarrow} \sigma^2+\mu^2-\mu^2=\sigma^2

S2=nn1Sn2Pσ2S^2=\frac{n}{n-1} S_n^2 \stackrel{P}{\rightarrow} \sigma^2

从某班级的英语期末考试成绩中,随机抽取 10 名同学的成绩(单位:分),分别为 100,85,70,65,90,95,63,50,77,86100,85,70,65,90,95,63,50,77,86 .求样本均值、样本方差及二阶原点矩.

xˉ=110i=110xi=110(100+85++86)=78.1S2=1n1i=1n(xixˉ)2=19(21.92+6.92++7.92)=252.5a2=1ni=1nxi2=110i=110xi2=110(1002+852+702++862)=6326.9\begin{gathered} \bar{x}=\frac{1}{10} \sum_{i=1}^{10} x_i=\frac{1}{10}(100+85+\cdots+86)=78.1 \\ S^2=\frac{1}{n-1} \sum_{i=1}^n\left(x_i-\bar{x}\right)^2=\frac{1}{9}\left(21.9^2+6.9^2+\cdots+7.9^2\right)=252.5 \\ a_2=\frac{1}{n} \sum_{i=1}^n x_i^2=\frac{1}{10} \sum_{i=1}^{10} x_i^2=\frac{1}{10}\left(100^2+85^2+70^2+\cdots+86^2\right)=6326.9 \end{gathered}

二阶矩的重要性质

设总体 XX 具有二阶矩,即 E(X)=μ,D(X)=σ2<+,X1,X2,,XnE(X)=\mu, D(X)=\sigma^2<+\infty, X_1, X_2, \cdots, X_n 为来自总体 XX 的样本, Xˉ\bar{X}S2S^2 分别是样本均值与样本方差,则 (1)E(Xˉ)=E(X)=μE(\bar{X})=E(X)=\mu ; (2)D(Xˉ)=1nD(X)=σ2nD(\bar{X})=\frac{1}{n} D(X)=\frac{\sigma^2}{n} ; (3)E(S2)=D(X)=σ2E\left(S^2\right)=D(X)=\sigma^2

证明: (1)E(Xˉ)=E(1ni=1nXi)=1ni=1nE(Xi)=nμn=μE(\bar{X})=E\left(\frac{1}{n} \sum_{i=1}^n X_i\right)=\frac{1}{n} \sum_{i=1}^n E\left(X_i\right)=\frac{n \mu}{n}=\mu . (2)D(Xˉ)=D(1ni=1nXi)=1n2i=1nD(Xi)=nσ2n2=σ2nD(\bar{X})=D\left(\frac{1}{n} \sum_{i=1}^n X_i\right)=\frac{1}{n^2} \sum_{i=1}^n D\left(X_i\right)=\frac{n \sigma^2}{n^2}=\frac{\sigma^2}{n} . (3)因为 E(Xi2)=D(Xi)+E2(Xi)=σ2+μ2E\left(X_i^2\right)=D\left(X_i\right)+E^2\left(X_i\right)=\sigma^2+\mu^2 ,且 E(Xˉ2)=D(Xˉ)+E2(Xˉ)=σ2n+μ2E\left(\bar{X}^2\right)=D(\bar{X})+E^2(\bar{X})=\frac{\sigma^2}{n}+\mu^2 ,所以

E(S2)=1n1E[i=1n(XiXˉ)2]=1n1E(i=1nXi2nXˉ2)=1n1[nμ2+nσ2n(μ2+σ2n)]=σ2\begin{aligned} E\left(S^2\right) & =\frac{1}{n-1} E\left[\sum_{i=1}^n\left(X_i-\bar{X}\right)^2\right]=\frac{1}{n-1} E\left(\sum_{i=1}^n X_i^2-n \bar{X}^2\right) \\ & =\frac{1}{n-1}\left[n \mu^2+n \sigma^2-n\left(\mu^2+\frac{\sigma^2}{n}\right)\right]=\sigma^2 \end{aligned}

设总体 XB(m,θ),X1,X2,,XnX \sim B(m, \theta), X_1, X_2, \cdots, X_n 为来自该总体的简单随机样本, Xˉ\bar{X} 为样本均值,求 E[i=1n(XiXˉ)2]E\left[\sum_{i=1}^n\left(X_i-\bar{X}\right)^2\right]

解 由上面性质可得 E(S2)=D(X)=mθ(1θ)E\left(S^2\right)=D(X)=m \theta(1-\theta) ,从而

E[i=1n(XiX)2]=E[(n1)S2]=m(n1)θ(1θ).E\left[\sum_{i=1}^n\left(X_i-X\right)^2\right]=E\left[(n-1) S^2\right]=m(n-1) \theta(1-\theta) .