预测和专业建模 > 探索离群值
发布日期: 09/18/2023

探索离群值

查找一元和多元数据中的离群值

“探索离群值”平台支持您识别、探索和管理离群值。探索和了解数据中的离群值是分析中的重要组成部分。数据中之所以出现离群值可能是因为:数据收集或报告出错、测量系统失效、在数据集中包含了错误或缺失值代码,或只是异常值。离群值的存在可能会使估计值失真,使结果向这些离群值偏倚。

离群值会增大样本方差。不过有时保留数据中的离群值也是有必要的,删除它们会低估样本方差,让数据朝着反方向偏倚。

无论是删除还是保留离群值,最好都要找到这些离群值。可通过很多方式直观检查离群值。例如,箱线图、直方图和散点图就很容易显示这些极值。请参见《发现 JMP》中的“数据可视化”

图 21.1 多元 k 最近邻离群值示例 

Multivariate k-Nearest Neighbor Outlier Example

目录

探索离群值概述

分位数范围离群值
稳健拟合离群值
稳健 PCA 离群值
K 最近邻离群值

探索离群值的示例

启动“探索离群值”平台

“探索离群值”报表

“分位数范围离群值”报表
“稳健拟合离群值”报表
“稳健 PCA 离群值”报表
“K 最近邻”报表

“探索离群值”平台选项

“探索离群值”平台的更多示例

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).