9._拟合优度检验

拟合优度检验

第七章的参数估计是假定总体的分布类型是已知的,需要通过样本来估计刻画总体分布的一个或若干个参数。但是,在实际问题中,经常不知道总体服从什么分布,这时只能假定其为某种分布,那么就需要根据样本数据来检验假设是否合理,即检验假设的总体分布是否可以被接受, 又称为分布的拟合检验, 常用的方法有 χ2\chi^2 拟合优度检验.

检验一枚骰子是否是均匀的ꎬ 首先抛掷一枚骰子 120 次 得到如下结果记录 图片

在显著性水平 α=0.01\alpha=0.01 水平下, 请问, 这枚股子是否是均匀的? 分析 设 XX 为骰子出现的点数,根据题意可以假设 XX 的分布为

H0:P(X=i)=pi=16,i=1,2,,6.H_0: P(X=i)=p_i=\frac{1}{6}, i=1,2, \cdots, 6 .

如果骰子是均匀的,即在 H0H_0 成立的假定下,投掷 120 次,平均来说每个点面应该都出现 npi=12016=20n p_i=120 \cdot \frac{1}{6}=20 次, 这称为理论频数, 如果每个点面实际出现次数与 20 次相差不大, 那么可以说明股子是均匀的, 如果相差太大, 例如有些点面严重偏多, 而另外一些点面严重偏少,那么可以说明股子是不均匀的。由于有正偏差就一定有负偏差,所以用偏差平方的方式来计算每一个点面出现的偏差, 并计算所有点面累积的总偏差, 如果总偏差太大,超过了容忍的最大值 cc ,就拒绝原假设,即认为骰子是不均匀的,反之,则不拒绝骰子是均匀的原假设.

根据上述分析,我们构造拒绝域的形式为 W={i=1k(Ninpi)2>c}W=\left\{\sum_{i=1}^k\left(N_i-n p_i\right)^2>c\right\} ,其中 NiN_i 表示第 ii 个点面实际出现的次数,又称为实际频数;当我们有了一组样本观测值以后, NiN_i 的观测值记为 nin_i. 其中的 kk 表示总体分布取值分组的组数,例如在例 1 中, kk 取 6 。

那么这里的容忍最大值 cc 取何值呢? 根据显著性水平的定义,容忍最大值 cc 需满足

P((X1,X2,,Xn)W)=P(i=1k(Ninpi)2>cH0 成立 )α.P\left(\left(X_1, X_2, \cdots, X_n\right) \in W\right)=P\left(\sum_{i=1}^k\left(N_i-n p_i\right)^2>c \mid H_0 \text { 成立 }\right) \leqslant \alpha .

统计学家 K - 皮尔逊基于上述拒绝域的形式构造了一个检验统计量

χ2=i=1k(Ninpi)2npi\chi^2=\sum_{i=1}^k \frac{\left(N_i-n p_i\right)^2}{n p_i}

并证明了如下重要的结论, 我们以定理的方式不加证明地给出. 定理1 如果原假设 H0:P(X=i)=pi,i=1,2,,kH_0: P(X=i)=p_i, i=1,2, \cdots, k 成立, 则当样本量 nn \rightarrow \infty 时, χ2=i=1k(Ninpi)2npi\chi^2=\sum_{i=1}^k \frac{\left(N_i-n p_i\right)^2}{n p_i} 的极限分布是自由度为 k1k-1χ2\chi^2 分布,即

χ2=i=1k(Ninpi)2npiχ2(k1),\chi^2=\sum_{i=1}^k \frac{\left(N_i-n p_i\right)^2}{n p_i} \sim \chi^2(k-1),

所以

P((X1,X2,,Xn)W)=P(i=1k(Ninpi)2npi>X1α2(k1)H0 成立 )α.P\left(\left(X_1, X_2, \cdots, X_n\right) \in W\right)=P\left(\left.\sum_{i=1}^k \frac{\left(N_i-n p_i\right)^2}{n p_i}>X_{1-\alpha}^2(k-1) \right\rvert\, H_0 \text { 成立 }\right) \leqslant \alpha .

即拒绝域为

W={i=1k(Ninpi)2npi>χ1α2(k1)}.W=\left\{\sum_{i=1}^k \frac{\left(N_i-n p_i\right)^2}{n p_i}>\chi_{1-\alpha}^2(k-1)\right\} .

在例 1 中, χ2\chi^2 检验统计量的观测值,

χ2=i=1k(ninpi)2npi=(2320)220+(2620)220+(2120)220+(2020)220+(1520)220+(1520)220=4.8.\begin{aligned} \chi^2 & =\sum_{i=1}^k \frac{\left(n_i-n p_i\right)^2}{n p_i} \\ & =\frac{(23-20)^2}{20}+\frac{(26-20)^2}{20}+\frac{(21-20)^2}{20}+\frac{(20-20)^2}{20}+\frac{(15-20)^2}{20}+\frac{(15-20)^2}{20} \\ & =4.8 . \end{aligned}

查表 可得, χ0.992(5)=15.0863>4.8\chi_{0.99}^2(5)=15.0863>4.8, 所以, 在显著性水平 α=0.01\alpha=0.01 下接受原假设,即可认为这枚骰子是均匀的。

在上面这个例子中,我们假定每一组 {X=i}\{X=i\} 的概率值 pip_i 都是已知的 i=1,2,,ki=1,2, \cdots, k ,但在实际问题中,有时 pip_i 还依赖于 rr 个未知参数,而这 rr 个未知参数需要利用样本来估计,这时,我们先用点估计法估计出这 rr 个未知参数,然后再算出 pip_i 的估计值 p^i\hat{p}_i 。类似于式(8-1),定义检验统计量

χ2=i=1k(Ninp^i)2np^i\chi^2=\sum_{i=1}^k \frac{\left(N_i-n \hat{p}_i\right)^2}{n \hat{p}_i}

当样本量 nn \rightarrow \infty 时, 费希尔在 1924 年证明了, 式 (8-2) 还是渐近服从 χ2\chi^2 分布, 但是自由度为 kr1k-r-1, 即

χ2=i=1k(Ninp^i)2np^iχ2(kr1).\chi^2=\sum_{i=1}^k \frac{\left(N_i-n \hat{p}_i\right)^2}{n \hat{p}_i} \sim \chi^2(k-r-1) .

故此时,拒绝域为

W={i=1k(Ninp^i)2np^i>χ1α2(kr1)}.W=\left\{\sum_{i=1}^k \frac{\left(N_i-n \hat{p}_i\right)^2}{n \hat{p}_i}>\chi_{1-\alpha}^2(k-r-1)\right\} .

图片

图片

图片

图片

图片

图片

图片 当总体 XX 是连续型的随机变量,分布函数为 F(x)F(x) ,选 k1k-1 个实数 a1<a2<<ak1a_1<a_2<\cdots<a_{k-1} , 将实数轴分为 kk 个区间

(,a1],(a1,a2],(ak1,+)\left(-\infty, a_1\right],\left(a_1, a_2\right], \cdots\left(a_{k-1},+\infty\right)

当观测值落在第 ii 个区间内,就把这个观测值看作是属于第 ii 类,因此, 这 kk 个区间就相 当于是 kk 个类。在 H0H_0 成立时,记

pi=P(ai1<Xai)=F(ai)F(ai1),i=1,2,,rp_i=P\left(a_{i-1}<X \leq a_i\right)=F\left(a_i\right)-F\left(a_{i-1}\right), i=1,2, \ldots, r

其中 a0=,ar=+a_0=-\infty, a_r=+\infty , 以 nin_i 表示样本观测值 x1,,xnx_1, \cdots \ldots, x_n 落在区间 (ai1,at\left(a_{i-1}, a_t\right. 内的个数 (i=1,2,,r)(i=1,2, \ldots, r) 之后的求解过程与总体只取有限个值的情况一样。

图片

图片

图片

图片