主成分分析采用一组变量的少数几个相互独立的线性组合(主成分)的形式,对这组变量中的变异建模。
若您想要查看各点在许多相关变量中的排列,则可以使用主成分分析显示高维数据的最显著方向。使用主成分分析可减少一组数据的维度。主成分是使用尽量少的变量尽可能完全标绘数据结构的一种方式。
对于 p 个变量,这是 p 个主成分形成的方式:
• 第一主成分是进行标准化之后的原始变量的线性组合,具有最大可能方差。
• 随后的每个主成分都是具有最大可能方差并且与之前定义的所有成分都无关的变量的线性组合。
通过将相关性矩阵(协方差矩阵或平方和与叉积矩阵)的特征向量与变量进行线性组合来计算每个主成分。特征值表示每个成分的方差。
“主成分”平台使您能够针对相关性矩阵、协方差矩阵或未统一尺度的数据执行分析。您也可以在“主成分”平台内执行“因子分析”。请参见因子分析。