本节介绍如何计算分位数。
要计算列中 n 个非缺失值的第 p 分位数,请将 n 个值按升序排列并将这些列值称为 y1, y2, ..., yn。将第 p 分位数的秩数计算为 p / 100(n + 1)。
• 若结果为整数,则第 p 分位数就是该秩的相应值。
• 若结果不为整数,则通过插值来查找第 p 分位数。第 p 分位数(表示为 qp)定义如下:
其中:
‒ n 是变量的非缺失值个数
‒ y1, y2, ..., yn 代表变量的排序值
‒ yn+1 视为 yn
‒ i 是 (n+1)p 的整数部分,f 是其小数部分
‒ (n + 1)p = i + f
例如,假定某个数据表有 15 行,而您想要查找某一连续列的第 75 分位数和第 90 分位数的值。将该列按升序排列后,包含这些分位数的秩计算如下:
且
值 y12 是第 75 分位数。第 90 分位数通过计算排在第 14 位和第 15 位的值的加权平均值内插得到:y90 = 0.6y14 + 0.4y15。