主成分分析构造的成分是分析中的所有变量的线性组合。相比之下,“聚类变量”选项构造的成分是同一类别的相似变量的线性组合。整个变量集划分为各个聚类。对于每个聚类,使用该聚类中的变量的第一主成分构造聚类成分。该聚类成分是一个线性组合,用于解释该聚类的变量中的尽可能多的变异。
您可以将“聚类变量”选项用作降维方法。大型变量集中的绝大部分变异往往可以通过聚类成分或聚类中最典型的变量来表示。随后,这些新变量可用在预测或其他建模方法中。基于聚类的新变量通常比基于所有变量的主成分更容易解释。
由一组相同变量构造的主成分相互之间正交。不过,聚类成分不正交,因为它们是由不同的变量集构造的。
当具有大量变量时,“聚类变量”平台使用基于奇异值分解的算法来缩短计算时间。有关更多背景信息,请参见“宽线性”方法和奇异值分解。