JMP 13.2 联机文档
发现 JMP
使用 JMP
基本分析
基本绘图
刻画器指南
实验设计指南
拟合线性模型
预测和专业建模
多元方法
质量和过程方法
可靠性和生存方法
消费者研究
Scripting Guide
JSL Syntax Reference
预测和专业建模
•
建模工具
• “探索离群值”实用工具
上一个
•
下一个
“探索离群值”实用工具
探索和了解数据中的离群值是分析中的重要组成部分。数据中之所以出现离群值可能是因为:数据收集或报告出错、测量系统失效,或是在数据集中包含了错误或缺失值代码。离群值的存在可能会使估计值失真。因此,执行的所有分析都会朝着这些离群值偏倚。离群值还会增大样本方差。不过有时保留数据中的离群值也是有必要的,删除它们会低估样本方差,在反方向上使数据发生偏倚。
无论是删除还是保留离群值,您都必须要找到它们。可通过很多方式直观检查离群值。例如,箱线图、直方图和散点图有时就很容易显示这些极值。详细信息,请参见《
发现 JMP
》手册中的“直观演示数据”。
“探索离群值”工具提供四个不同选项来标识、探索和管理一元或多元数据中的离群值。
分位数范围离群值
使用每列的分位数分布将离群值标识为极值。该工具适用于发现数据中的缺失值或错误代码。这是推荐在开始探索数据中的离群值时使用的方法。请参见
分位数范围离群值
。
稳健拟合离群值
查找每列的中心和散布的稳健估计值,将远离这些值的值标识为离群值。请参见
稳健拟合离群值
。
多元稳健离群值
使用“多元”平台中的“稳健”选项可基于距估计的稳健中心的 Mahalanobis 距离来查找离群值。请参见
多元稳健离群值
。
多元 k 最近邻离群值
将远离其 k 最近邻的值标识为离群值。请参见
多元 k 最近邻离群值
。