离群值箱线图是数据分布的图形汇总。请注意关于离群值箱线图的以下方面(图 6.7):
• 箱中的水平线表示样本值中位数。
• 箱的两端表示第 75 和第 25 分位数,也分别称为第三和第一四分位数。
• 第一和第三四分位数之间的差值称为四分位间距。
• 每个箱有从两端延伸的线,有时也称为须线。须线从箱的两端延伸到如下距离内的最远数据点:
第三四分位数 + 1.5*(四分位间距)
第一四分位数 - 1.5*(四分位间距)
若数据点未达到计算范围两端,则由这些数据点的高值和低值(不包括离群值)来确定须线。
图 6.7 离群值箱线图示例