18._正态分布表的使用与上a分位数-Part4

正态分布表的使用

在介绍标准正态分布 xN(0,1)x \sim N(0,1)时提到,标准正态分布密度函数图像 如下 图片{width=550px}

标准正态分布的密度函数图像的意义 图片{width=550px}

从上面两个图里可以知道正态分布有如下性质:

性质1. 概率密度函数图像是关于 x=0x=0 对称的,根据函数的奇偶性,所以 φ0(x)=φ0(x)\varphi_0(-x)=\varphi_0(x);

性质2 概率密度函数图像在 x=0x=0 处达到极大(参考密度函数图像,很容易理解);

性质3 分布函数有性质 Φ0(x)=1Φ0(x)\Phi_0(-x)=1-\Phi_0(x),且Φ0(u)=0.5\Phi_0(u)=0.5

请务必牢记分布函数的定义,分布函数F(X)=P(Xx)F(X)=P(X \leqslant x)他是一个累加值。比如考试分F(90)=P(X<90)=80F(90)=P(X<90)=80 表示分数小于90分的人数为80人,F(60)=P(X<60)=20F(60)=P(X<60)=20 表示分数小于60分的人数为20人, 现在要求分数在609060-90之间的人数,显然就是F(90)F(60)=8020=60F(90)-F(60)=80-20=60人,分布函数求导就是密度函数,密度函数积分就是分布函数。而积分的本质就是求面积,所以密度函数曲线围成的整个面积就是所有的概率为1.通常认为分布函数的作用用来计算密度函数,单纯看分布函数图像其实看不出多少有价值的东西。数学上的表达就是密度函数在区间ab(a, b)上的积分。所以,概率的大小就是“概率密度函数曲线下的面积”的大小,这个不太起眼的概念实际上就决定了你日后是否能理解假设检验中所谓的“拒绝域”。

性质3可以通过正态密度函数的积分进行计算,但是我们准备从密度函数的图像上来解释一下Φ0(x)=1Φ0(x)\Phi_0(-x)=1-\Phi_0(x)的意义。 根据分布函数的定义,他表示的是概率的累加值,而所有概率的可能性为100%,所以分布函数的整体值就是1。也就是说,密度函数曲线下所围成的总面积为1.

Φ0(2)\Phi_0(-2) 解: STEP1 要求Φ0(2)\Phi_0(-2),根据分布函数的定义即是求Φ0(2)=P(X2)\Phi_0(-2)=P(X \le -2) ,也就是求红色区域的面积。

图片{width=400px}

STEP2 很遗憾,从正态表里,查不到Φ0(2)\Phi_0(-2),但是根据对称性可以查到 Φ0(2)\Phi_0(2) ,而Φ0(2)=P(X2)\Phi_0(2)=P(X \le 2) 表示的下图绿色图形的面积。

图片{width=400px}

STEP3 我们用总面积减去上面大的绿色曲面面积,就可以得到下图小的绿色曲面面积。

图片{width=400px}

STEP4 根据对称性,上图红色曲面面积就等于小的绿色曲面面积。

STEP5 因此,查表知 Φ0(2)=0.9772\Phi_0(2)=0.9772,所以 Φ0(2)=10.9772=0.0228\Phi_0(-2)=1-0.9772=0.0228

Φ0(1.65)\Phi_0(1.65) 解:题目已经是标准正态分布,直接差表 Φ0(1.65)=0.9505\Phi_0(1.65)=0.9505

求标准正态分布,P{X2}P\{|X| \le 2\} 的值。 解:P{X2}=P{2X2}P\{|X| \le 2\}= P \{-2 \le X \le 2 \} 在例1里,已经算出其值,所以 =Φ0(2)Φ0(2)=0.9720.0228=0.9492=\Phi_0(2)-\Phi_0(-2)=0.972-0.0228=0.9492

下面我们再来分析一下例3的题目: P{X2}=Φ0(2)Φ0(2)P\{|X| \le 2\}=\Phi_0(2)-\Phi_0(-2) 在例1里,已经知道Φ0(2)\Phi_0(2) 表示的是大的绿色曲面面积 Φ0(2)\Phi_0(-2) 表示的是左下角小的红色的曲面面积,因此这个结果是如下曲面面积

图片{width=400px}

有一批袋装大米,质量误差服从XN(50,1)X \sim N(50,1)的正态分布,求质量范围在49 5149~51之间的概率。 解:这是一个一般正态分布,因XN(50,1)X \sim N(50,1),所以μ=50,σ=1\mu=50,\sigma=1

要求质量在495149-51之间,就是求 P{49X51}=Φ(51)Φ0(49)P\{ 49 \le X \le 51\}=\Phi(51)-\Phi_0(49) 利用上节介绍的一般正态分布化为标准正态分布公式:

Φ(x)=Φ0(x)(xμσ)\Phi(x)= \Phi_0(x) \left(\frac{x-\mu}{\sigma} \right)

,做一个线性变换的

Φ(51)Φ(49)\Phi(51)-\Phi(49)=Φ0(1)Φ0(1)=2Φ0(1)1\Phi_0(1)-\Phi_0(-1)= 2 \Phi_0(1)-1

标准正态分布的分位数概念

XN(0,1)X \sim N(0,1), 对给定的 α\alpha, 若 数 uαu_\alpha 满足

Φ(uα)=uαφ(x)dx=P(Xuα)=α\Phi\left(u_\alpha\right)=\int_{-\infty}^{u_\alpha} \varphi(x) \mathrm{d} x=P\left(X \leq u_\alpha\right)=\alpha

uαu_\alpha 为随机变量XXα\alpha- 分位数

分位数的几何意义

图片{width=500px}

α\alpha 分位数 与下 α\alpha 分位数

为什么要引入分位数?其实就方便统计,比如班级里考试,这次考试有30%30\%的同学考试成绩超过9090分,在这句话里, 90分就是一个分为点,他把整个成绩分成了90分上和90分下,而 30%30\% 则包含了9090分以上的占比。

α\alpha 分位数 定义 P=(XZa)=aP=\left(X \geqslant Z_a\right)=a, 在标准正态分布的概率分布图中, 临界值右侧曲线下的面积大小为 aa (下图)。

图片{width=300px}

根据定义其意思等价于 zα+f(z)dz=α\int_{z_\alpha}^{+\infty} f(z) d z=\alpha 或者 zαf(z)dz=1α\int_{-\infty}^{z_\alpha} f(z) d z=1-\alpha ,其中 f(z)f(z)ZZ 的概率分布函数。

右侧尾部的阴影部分面积为α,这个区域在右单侧检验时也叫拒绝域否定域。α也称(差异)显著性水平,置信水平则等于接受域的面积1−α 。

aa 分位数, 则是 P=(XZ1a)=aP=\left(X \leqslant Z_{1-a}\right)=a, 临界值左侧曲线下的面积大小为 aa (下图)。

图片{width=300px}

根据定义:随机变量 ZZ 的下 α\alpha 分位点 z1αz_{1-\alpha} 满足:P{Z<z1α}=α, 0<α<1P\left\{Z<z_{1-\alpha}\right\}=\alpha, ~ 0<\alpha<1 . 即 z1αf(z)dz=α\int_{-\infty}^{z_{1-\alpha}} f(z) d z=\alpha 或者 z1α+f(z)dz=1α\int_{z_{1-\alpha}}^{+\infty} f(z) d z=1-\alpha ,其中 f(z)f(z)ZZ 的概率分布函数。

注意:记号 z1αz_{1-\alpha} 的定义来自 z1α+f(z)dz=1α\int_{z_{1-\alpha}}^{+\infty} f(z) d z=1- \alpha ,表示该点右侧累积概率为 1α1-\alpha ,满足下 α\alpha 分位点的定义。

另一种记法(已经不能显示"下"的意思了)P{Z>z1α}=1α, 0<α<1P\left\{Z>z_{1-\alpha}\right\}=1-\alpha, ~ 0<\alpha<1

下a 分位点通常作为左单侧检验或者双侧尾部检验的参考值,与假设命题、置信水平或显著性水平配合使用。

概率统计背景

要理解上 α\alpha 分位数 与下 α\alpha 分位数 这其中的区别还是需要一点小常识。 总体来说,全国各大高校统计真题分为五大门派:纯贾、贾茆、纯茆、贾Pro、茆Pro。 这里的贾不仅仅指贾俊平的《统计学》,而是以贾俊平《统计学》为代表的偏文、偏经济的一类教材,比如袁卫的《统计学》等。

同样,这里的茆不仅仅只是茆诗松的《概率论与数理统计》,而是以茆诗松《概率论与数理统计》为代表的偏数理的一类教材,比如盛骤的《概率论与数理统计》等。

图片{width=500px}

经过不断的合并,最后形成两点派别,贾派对应的高校包括中央财经大学、天津财经大学、西安科技大学等,茆派对应的高校包括北京师范大学、深圳大学、广东财经大学等

在贾书中,使用的是上分位数,而在茆书中,使用的却是下 α\alpha 分位数,所以对于贾书中的 ZαZ_\alpha, 我们在茆书中查表的时候, 应该查找 Z(1α)Z_(1-\alpha), 以 α=0.05\alpha=0.05 为例, 当贾书中求标准正态分布的上 0.05 分位数时,我们査找茆书的时候,应该査找Z0.95=1.645Z_{0.95}=1.645,而不是Z0.05=1.645Z_{0.05}=1.645 所以一定要区分清楚!

目前,在考研老师出题里,我们一般使用的上 aa 分位数,但是也有老师使用下aa 分位数

设随机变量 XX 服从正态分布 N(0,1)N(0,1) ,对给定的 α(0<α<1)\alpha(0<\alpha<1) ,数 uαu_\alpha 满足 P{X>uα}=αP\left\{X>u_\alpha\right\}=\alpha ,若 P{X<x}=αP\{|X|<x\}=\alpha ,则 xx 等于( ). (A)uα2u_{\frac{\alpha}{2}} (B)u1α2u_{1-\frac{\alpha}{2}} (C)u1α2u_{\frac{1-\alpha}{2}} (D)u1αu_{1-\alpha} 解 应选(C). 如图所示,从几何直观看,条件中给出的 uαu_\alpha 即为上侧 α\alpha 分位数。类比可得 P{X<u1α2}=αP\left\{|X|<u_{\frac{1-\alpha}{2}}\right\}=\alpha ,故选择(C).

图片

某学校规定划分考生成绩的等级方法如下:考试成绩的实际考分在前10%的为 AA 等,考分在前 10%10 \% 以后但在前 50%50 \% 的为 BB 等,考分在前 50%50 \% 以后但在前 85%85 \% 的为 C等,考分在后 10%10 \% 的为D等.某次期末考试中,设考生的成绩X服从正态分 布 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) ,经计算可知 μ=73σ2=144\mu=73 , \sigma^2=144 ,求这次期末考试等级划 分的具体分数线。 解 由题意可知 XN(73,144)X \sim N(73,144) ,则

P(Xa)=1Φ(a7312)=0.1(a7312)=u0.9=1.282a=88.38488\begin{aligned} & P(X \geq a)=1-\Phi\left(\frac{a-73}{12}\right)=0.1 \\ & \Rightarrow\left(\frac{a-73}{12}\right)=u_{0.9}=1.282 \Rightarrow a=88.384 \approx 88 \end{aligned}
 又 P(Xb)=1Φ(a7312)=0.5(b7312)=u0.5=0b=73 又 P(Xc)=Φ(a7312)=0.5(c7312)=u0.1=u0.9=1.282c58\begin{aligned} & \text { 又 } P(X \geq b)=1-\Phi\left(\frac{a-73}{12}\right)=0.5 \\ & \Rightarrow\left(\frac{b-73}{12}\right)=u_{0.5}=0 \Rightarrow b=73 \\ & \text { 又 } P(X \leq c)=\Phi\left(\frac{a-73}{12}\right)=0.5 \\ & \Rightarrow\left(\frac{c-73}{12}\right)=u_{0.1}=-u_{0.9}=-1.282 \Rightarrow c \approx 58 \\ & \end{aligned}

综述所求,可知,在此次考试中,分数在88.384以上的,为等级A,分数在73至88.384之间的,为等级B,分数在57.616至73之间的,为等级C,分数在57.616以下的,为等级D。90)

α\alpha 分位数 在上面列子中知道,Φ0(2)=0.0228\Phi_0(-2)=0.0228 表示小的红色曲面面积如下图,但是,利用图像的对称性,我们也知道Φ0(2)\Phi_0(2)右侧的绿色的曲面面积也等于0.02280.0228, 我们把这个0.02280.0228称作上α\alpha 分位数,记做 α0.0228\alpha_{0.0228} 换句话说,上α\alpha 分位数可以看成是右侧小绿色曲面面积。

图片{width=400px}

知某门课程考生分数 XX 服从正态分布 N(75,102)N\left(75,10^2\right), 若把考生分数在后 10%10 \% 的评为 CC 级, 则 CC 级的分数线为 \hx 分. (结果四舍五入, 已知 Φ(1.285)=0.9\Phi(1.285)=0.9, 其中 Φ(x)\Phi(x) 为正态分布函数) 解:有 0.9=1P(X7510x7510)=1Φ(x7510)=Φ(x7510)0.9=1-P\left(\frac{X-75}{10} \leq \frac{ x -75}{10}\right)=1-\Phi\left(\frac{ x -75}{10}\right)=\Phi\left(-\frac{ x -75}{10}\right)x7510=1.285-\frac{ x -75}{10}=1.285, 有 x=62.15x=62.15

本节内容节选自 附录1:置信区间与上α\alpha分位数

正态分布表的使用方法

正态分布表如下图,为了让列表不太长,我们把 "0.1" 的值垂直排列,然后把每个 0.1 后面的 "0.01" 值水平排列。形成一个方表,也就是 第一列:0,0.1,0.2,3.00, 0.1, 0.2, 3.0 精确到小数点的第一位 第一行:0,0.01,0.02,0.03...0.090, 0.01, 0.02, 0.03 ...0.09 精确到小数点的第二位

因此要查一个数,比如 Φ0(1.96)\Phi_0(1.96) 需要把1.961.96分解为1.91.9加上0.060.06, 然后按行找到1.91.9,按列找到0.060.06,即可得到0.9750.975

再比如 Φ0(0)=0.5000\Phi_0(0)=0.5000 第一行第一列 Φ0(0.01)=0.5040\Phi_0(0.01)=0.5040 第一行第二列 Φ0(0.10)=0.5398\Phi_0(0.10)=0.5398 第二行第一列 Φ0(0.11)=0.5438\Phi_0(0.11)=0.5438 第二行第一列

图片