10._分位数和中位数

中位数与分位数的基本理解(高中版)

中位数:一组数据按从小到大排序后,位于正中间的那个数值。

(1)如果数据的个数 n 是奇数,中位数就是排序后第 (n+1)/2 个位置上的数值。

例如:数据 [1, 3, 5, 7, 9] (n=5,奇数)。排序后就是 [1, 3, 5, 7, 9]。中位数是第 (5+1)/2 = 第 3 个位置的数,即 5。

(2)如果数据的个数 n 是偶数,中位数是排序后第 n/2 个位置和第 (n/2)+1 个位置上两个数值的平均数。

例如:数据 [1, 3, 5, 7] (n=4,偶数)。排序后是 [1, 3, 5, 7]。中位数是第 4/2=2 个位置(3)和第 (4/2)+1=3 个位置(5)的平均数,即 (3+5)/2 = 4。

中位数把数据分成了两半。一半的数据比中位数小,另一半的数据比中位数大。

分位数:分位数是将一组数据按照从小到大排序后,然后把排列的数据分割成相等部分的点。 比如“班级里 20%的学生考试成绩在90分以上”

如何理解分位数(以四分位数为例): 想象你把所有数据从小到大排成一条线: Q1 是把这条线切成 1/4 和 3/4 的点。最前面的 25% 的数据在 Q1 左边。 Q2 (中位数) 是把这条线切成两半的点。 Q3 是把这条线切成 3/4 和 1/4 的点。最后的 25% 的数据在 Q3 右边。 中间 50% 的数据位于 Q1 和 Q3 之间,这个范围称为四分位距,是衡量数据离散程度的重要指标。

定义

设 连续型随机变量 XX 的分布函数为 F(x)F(x) ,密度函数为 f(x)f(x)

F(vp)=P(Xvp)=vpf(x)dx=pF\left(v_p\right)=P\left(X \leq v_p\right)=\int_{-\infty}^{v_p} f(x) d x=p

则称 vp=F1(p)v_p=F^{-1}(p) 是随机变量 XXpp 分位数。 特别地,当 p=12p=\frac{1}{2} 时,称 v12v_{\frac{1}{2}} 为中位数

已知随机变量 XN(3,4)X \sim N(3,4) ,求 XX 的分位数 v14, v34v_{\frac{1}{4}}, ~ v_{\frac{3}{4}} ,和中位数 v12\frac{v_1}{2}

因为 P(Xv14)=14P\left(X \leq v_{\frac{1}{4}}\right)=\frac{1}{4}P(Xμσv14μσ)=14P\left(\frac{X-\mu}{\sigma} \leq \frac{v_{\frac{1}{4}}-\mu}{\sigma}\right)=\frac{1}{4} ,所以 v14μσ=u14\frac{v_{\frac{1}{4}}-\mu}{\sigma}=u_{\frac{1}{4}} 其中 u14u_{\frac{1}{4}} 为标准正态分布的 14\frac{1}{4} 分位数。查表得 u34=0.6745u_{\frac{3}{4}}=0.6745

因此,u14=0.6745u_{\frac{1}{4}}=-0.6745 ,那么

v1/432=0.6745v14=1.651\frac{v_{1 / 4}-3}{2}=-0.6745 \quad v_{\frac{1}{4}}=1.651

同理 v34=4.349\frac{v_3}{4}=4.349 。由密度函数的轴对称性,知 v12=3v_{\frac{1}{2}}=3

定义

XX 为离散型随机变量,其分布律为 P(X=ai)=pi,i=1,2,P\left(X=a_i\right)=p_i, i=1,2, \cdots , , 如果存在实数 aa^* ,使得 P(X=a)P(X=ai)P\left(X=a^*\right) \geq P\left(X=a_i\right), 对一切 i=1,2,i=1,2, \cdots 成立,那么称 aa^*XX (或 XX 所服从的分布) 的众数。