Probe.jmp 样本数据表包含对 5800 个半导体晶片测量的 387 个特征(响应列组)。批 ID晶片编号列唯一标识晶片。您关注的是:标识数据集中的一组选定列内的离群值。使用“探索离群值”实用工具可标识离群值,随后可使用“分布”平台检查这些离群值。
1.
选择帮助 > 样本数据库并打开 Probe.jmp 样本数据表。
2.
选择分析 > 筛选 > 探索离群值
3.
从列 VDP_M1 一直选择到 VDP_SICR,然后点击 Y,列。您应选定 14 列(请参见探索离群值启动窗口)。
探索离群值启动窗口
Explore Outliers Launch Window
4.
点击确定
5.
点击分位数范围离群值
6.
在“分位数范围离群值”报表中,选中名为仅显示带离群值的列的复选框。这会将列列表限定为仅包含离群值的那些列。
8.
点击将最高 9 添加至缺失值代码
会有一条 JMP 警示提醒您应该使用另存为命令保留原始数据。
9.
点击确定
11.
选中名为将搜索限制为整数的复选框。
12.
取消选择将搜索限制为整数
2.
点击选择行
3.
选择分析 > 分布
4.
将选定列分配到 Y,列角色。由于您在“分位数范围离群值”报表中选定了这些列名,所以它们在“分布”启动窗口中已然处于选定状态。
5.
点击确定
带有已选定离群值的列的分布显示报表的简化版本。
带有已选定离群值的列的分布
Distribution of Columns with Outliers Selected
在列 VDP_M1VDP_PEMIT 中,请注意选定的离群值与大多数数据有些接近。对于其余列,选定的离群值足够远离大多数数据,所以可以从分析中排除。
4.
点击重新扫描
5.
选择报表中的列 VDP_M1VDP_PEMIT。点击选择行
4.
选择恢复 > 重新运行分析
带有已排除离群值的列的分布显示报表的简化版本。
带有已排除离群值的列的分布
Distributions of Columns with Outliers Excluded