检测离群值的“分位数范围离群值”方法使用列中值的分位数分布来查找极值。分位数有助于检测离群值,因为分位数与分布假设无关。数据只是从小到大排序。例如,第 20 个分位数就是在这个值处,有 20% 的值较小。使用四分位间距(两个指定的分位数之间的距离)的倍数来查找极值。有关如何计算分位数的更多详细信息,请参见《基本分析》手册中的“分位数”。
“分位数范围离群值”面板支持您指定如何计算离群值以及您希望如何管理离群值。图 3.6显示了默认的“分位数范围离群值”窗口。
图 3.6 “分位数范围离群值”窗口
开启“分位数范围离群值”报表的选定列中的离群值的排除行状态。点击重新扫描更新“分位数范围离群值”报表。
将选定的离群值添加至“缺失值代码”列属性。使用该选项标识数据中已知的缺失值或错误代码。缺失值和错误代码往往是整数,有时还是正的或负的一串 9。点击重新扫描更新“分位数范围离群值”报表。
将离群值改为数据表中的缺失值。将值改为缺失值时务必要小心。只有在明确数据无效或不准确时才将值改为缺失值。点击重新扫描更新“分位数范围离群值”报表。
将选定的离群值添加至“缺失值代码”列属性。您必须点击重新扫描更新“分位数范围离群值”报表。
注意:首次通过选择某个操作(比如:更改为缺失或排除行)来更改数据时,警示窗口会提醒您使用另存为命令将数据表另存为新文件,以保留原始数据的副本。显示该窗口时,请点击确定。若决定保存新数据文件,系统会自动提示您使用新名称保存该文件。