2._总体与个体

总体与个体

总体、样本和统计量是数理统计的基本概念,同时也是数理统计的研究对象.本节将从总体、样本和统计量的直观概念引出其数学定义. 直观上,总体是全体研究对象的集合,样本是一部分研究对象的集合.数学上,视随机变量为总体,把与总体同分布的一组随机变量称为样本.

在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(population), 总体中的每个元素称为个体(individual).

例如,我们想了解某厂生产的一批节能灯的平均寿命,则这样的一批节能灯寿命值的全体就组成一个总体, 其中每一只节能灯的寿命就是一个个体. 要将一个总体的性质了解清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,研究节能灯的寿命,因为寿命试验是破坏性的,一旦我们获得试验的所有结果,这批节能灯也就全废了,所以我们只能从整批节能灯中抽取一部分节能灯做寿命试验,并记录其结果,然后根据这部分数据来推断整批节能灯的寿命情况.

由于节能灯的寿命在随机抽样中是随机变量,因此,为了便于数学上处理,我们将总体定义为随机变量,随机变量的分布称为总体分布.

一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的那部分个体,称为总体的一个样本.

所谓从总体抽取一个个体,就是对总体 XX 进行一次观察(即进行一次试验),并记录其结果. 我们在相同的条件下对总体 XX 进行nn 次重复、独立的观察,将nn 次观察结果按试验的次序记为X1,X2,,XnX_1, X_2, \cdots, X_n .由于 X1,X2,,XnX_1, X_2, \cdots, X_n 是对随机变量 XX 观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出如下关于样本的定义。

定义

设总体 XX 是具有分布函数 F(x)F(x) 的随机变量。若 X1,X2,,XnX_1, X_2, \cdots, X_n 是与 XX 具有同一分布函数 F(x)F(x) ,且相互独立的随机变量,则称 X1,X2,,XnX_1, X_2, \cdots, X_n 为从总体 XX 中得到的容量为 nn的简单随机样本(random sample),简称样本.其中 nn 称为样本容量.

nn 次观察一经完成,我们就得到一组实数 x1,x2,,xnx_1, x_2, \cdots, x_n 。它们依次是随机变量 X1,X2,X_1, X_2, \cdotsXnX_n 的观察值,称为样本值。

对于有限总体,采用放回抽样就能得到简单样本,而当总体中个体的总数 NN 比要得到的样本的容量 nn 大得多时(一般地,当 Nn10\frac{N}{n} \geqslant 10 时),在实际中可将不放回抽样近似地当成放回抽样来处理.

X1,X2,,XnX_1, X_2, \cdots, X_n 为总体 XX 的一个样本,XX 的分布函数为 F(x)F(x) ,则 X1,X2,,XnX_1, X_2, \cdots, X_n 的联合分布函数为

F(x1,x2,,xn)=i=1nF(xi)F^*\left(x_1, x_2, \cdots, x_n\right)=\prod_{i=1}^n F\left(x_i\right)

若总体 XX 为离散型随机变量,其概率分布为p(x)=P{X=xi} p(x)={P}\left\{X=x_i\right\} ,则样本的概率分布为 p(x1,x2,,xn)=P{X=x1,Xx2,,X=xn}=i=1np(xi)p^*\left(x_1, x_2, \cdots, x_n\right)=P\left\{X=x_1, X x_2, \cdots, X=x_n\right\}=\prod_{i=1}^n p\left(x_i\right)

设总体 XB(1,p)X \sim B(1, p) ,试写出总体分布律 f(x;p)f(x ; p) . 解

f(x;p)=P(X=x)=(1p)1xpx,x=0,1,2,,nf(x ; p)=P(X=x)=(1-p)^{1-x} p^x, x=0,1,2, \cdots, n

设总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,试写出总体分布 f(x;μ,σ2)f\left(x ; \mu, \sigma^2\right) . 解

f(x;μ,σ2)=^fX(x)=12πσe(xμ)22σ2,<x<+f\left(x ; \mu, \sigma^2\right) \hat{=} f_X(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty