通过选择分析 > 多元方法 > 主成分来启动“主成分”平台。“多元”平台和“三维散点图”平台也提供主成分分析。
主成分分析的示例中所述的示例使用 Solubility.jmp 样本数据表中的所有连续变量。
图 4.3 “主成分”启动窗口
默认选项使用“逐行”、“配对”或“REML”方法。“JMP 警示”还建议在适当的时候切换至“宽”方法。
‒
|
逐行估计用于不含缺失值的数据表。
|
‒
|
配对估计用于包含缺失值并且多于 10 列、多于 5,000 行或列数多于行数的数据表。
|
‒
|
在其他情况下使用 REML 估计。
|
‒
|
限制最大似然 (REML) 估计使用所有数据,即使存在缺失值。由于存在偏倚修正因子,若您的数据集很大且包含许多缺失值,该方法会很慢。因此,REML 最适用于较小的数据集。若数据中不含缺失单元格,则 REML 和 ML 估计值等价于样本协方差矩阵。若存在缺失单元格,与 ML 估计相比,REML 的方差和协方差估计值的偏倚更小。详细信息,请参见REML。
宽估计不使用含缺失值的观测,因此在应用该方法之前会删除包含缺失单元格的行。该估计方法使用基于完整奇异值分解的算法。该算法避免计算协方差矩阵,因此计算效率较高,适用于数据中列非常多的情况。更多信息,请参见宽。
稀疏估计使用所有数据,即使存在缺失值。该估计方法使用基于部分奇异值分解的算法,它只计算第一个指定数量的奇异值和奇异值向量。该算法避免计算协方差矩阵以及不必要的主成分,因此计算效率较高,当数据稀疏(即包含很多零时)或当数据中具有大量列时,该算法非常有用。更多信息,请参见稀疏。
•
|
•
|