中位数与分位数的基本理解(高中版)
中位数:一组数据按从小到大排序后,位于正中间的那个数值。
(1)如果数据的个数 n 是奇数,中位数就是排序后第 (n+1)/2 个位置上的数值。
例如:数据 [1, 3, 5, 7, 9] (n=5,奇数)。排序后就是 [1, 3, 5, 7, 9]。中位数是第 (5+1)/2 = 第 3 个位置的数,即 5。
(2)如果数据的个数 n 是偶数,中位数是排序后第 n/2 个位置和第 (n/2)+1 个位置上两个数值的平均数。
例如:数据 [1, 3, 5, 7] (n=4,偶数)。排序后是 [1, 3, 5, 7]。中位数是第 4/2=2 个位置(3)和第 (4/2)+1=3 个位置(5)的平均数,即 (3+5)/2 = 4。
中位数把数据分成了两半。一半的数据比中位数小,另一半的数据比中位数大。
分位数:分位数是将一组数据按照从小到大排序后,然后把排列的数据分割成相等部分的点。
比如“班级里 20%的学生考试成绩在90分以上”
如何理解分位数(以四分位数为例):
想象你把所有数据从小到大排成一条线:
Q1 是把这条线切成 1/4 和 3/4 的点。最前面的 25% 的数据在 Q1 左边。
Q2 (中位数) 是把这条线切成两半的点。
Q3 是把这条线切成 3/4 和 1/4 的点。最后的 25% 的数据在 Q3 右边。
中间 50% 的数据位于 Q1 和 Q3 之间,这个范围称为四分位距,是衡量数据离散程度的重要指标。
定义
设 连续型随机变量 X 的分布函数为 F(x) ,密度函数为 f(x) ,
F(vp)=P(X≤vp)=∫−∞vpf(x)dx=p 则称 vp=F−1(p) 是随机变量 X 的 p 分位数。
特别地,当 p=21 时,称 v21 为中位数
例 已知随机变量 X∼N(3,4) ,求 X 的分位数 v41, v43 ,和中位数 2v1 。
因为 P(X≤v41)=41 得 P(σX−μ≤σv41−μ)=41 ,所以 σv41−μ=u41
其中 u41 为标准正态分布的 41 分位数。查表得 u43=0.6745 ,
因此,u41=−0.6745 ,那么
2v1/4−3=−0.6745v41=1.651 同理 4v3=4.349 。由密度函数的轴对称性,知 v21=3 。
定义
设 X 为离散型随机变量,其分布律为 P(X=ai)=pi,i=1,2,⋯, , 如果存在实数 a∗ ,使得 P(X=a∗)≥P(X=ai), 对一切 i=1,2,⋯ 成立,那么称 a∗ 为 X (或 X 所服从的分布) 的众数。