本节说明如何使用 SVD 获取协方差矩阵的特征向量和特征值。关注的矩阵具有至少一个大的维度时,计算 SVD 比计算它的协方差矩阵和特征值分解高效得多。
用 n 表示观测数,用 p 表示关注的多元分析中涉及的变量数。用 X 表示数据值的 n x p 矩阵。
通常对标准化数据应用 SVD。要将某个值标准化,需减去其均值,再除以其标准差。用 Xs 来表示标准化数据值的 n x p 矩阵。之后,标准化数据的协方差矩阵成为 X 的相关性矩阵,该矩阵定义如下:
可以对 Xs 应用 SVD 来获取 Xs′Xs 的特征向量和特征值。当矩阵 X 很宽(很多列)或很高(很多行)时,这样做可以高效计算特征向量和特征值。此方法是宽 PCA 的基础。请参见“主成分”报表。