预测和专业建模 > 探索离群值 > “探索离群值”报表 > “稳健 PCA 离群值”报表
发布日期: 09/18/2023

“稳健 PCA 离群值”报表

“探索离群值”平台中的“稳健 PCA 离群值”报表包含一个表,其中包含有关若干结果表的算法的信息。初始表包括低秩矩阵的秩、SVD 迭代次数、收敛准则、Lambda 值和插补缺失值的数量。若启用“随机化 SVD”选项,“随机化 SVD”选项中使用的维数也包含在汇总表中。这些是包含在报表中的其他表。

单元格大残差

显示最大离群值观测的表,由列名和行号标识。显示的观测数由“离群值阈值”决定。该表包含观测的列名和行号、残差值和统一尺度的残差值。

提示:要对数据表中的特定离群值单元格着色,请选择“单元格大残差”表中的行并点击着色

均方根行

显示数据表中每行的均方根值的表。使用统一尺度的残差计算均方根。

提示:若在“均方根行”表中选择了某行,在数据表中会选定相应的行。

均方根列

显示启动窗口中指定的每列的均方根值的表。使用统一尺度的残差计算均方根。

提示:若在“均方根列”表中选择某行,然后点击选择列,则会在数据表中选定相应的列。

快照

数据表中离群值单元格的图形表示。离群值单元格着红色。

残差

矩阵分解后的残差矩阵。若统一尺度残差的绝对值大于以下值,则会对单元格着色:

min[0.99 × max{abs(残差)}, 离群值阈值]

低秩近似

矩阵分解后的统一尺度残差矩阵。

奇异值

来自 SVD 的奇异值向量。

“稳健 PCA 离群值”选项

“稳健 PCA 离群值”报表底部有一些按钮,提供保存报表不同部分的选项。

关闭

关闭“稳健 PCA 离群值”报表。

保存大离群值

将“单元格大残差”表中的信息保存到新的数据表中。

保存已清除

打开一个窗口,其中提供了几种方法,可以根据阈值清除离群值并将新列保存到数据表中。

切尾

若相应的绝对统一尺度残差大于指定阈值,则去除离群值单元格。默认情况下,阈值为 10。选择“颜色”Image shown here 为离群值单元格着红色。修剪的单元格设置为未统一尺度的阈值。

插补

若相应绝对统一尺度残差大于指定阈值,则将离群值单元格设置为低秩近似的值。默认情况下,阈值为 100。选择“颜色”Image shown here 为这些单元格着绿色。

生成缺失值

若相应的绝对统一尺度残差大于指定阈值,则将离群值单元格设置为缺失。默认情况下,阈值为 1000。选择“颜色”Image shown here 为这些单元格着蓝色。

对缺失值插补着色 Image shown here

若选定,则为最初为缺失值并被插补的单元格着色。

保存残差

将残差保存至原始数据表中的新列。

保存统一尺度的残差

将统一尺度的残差保存至原始数据表中的新列。

保存低秩近似

将低秩近似保存至原始数据表中的新列。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).