主成分分析(PCA; Principal Component Analysis)は、複数の変数における変動をできるだけ説明する、少数の独立した線形結合(主成分)を求めます。主成分分析は次元を削減する手法であり、探索的データ分析(EDA; Exploratory Data Analysis)の手法の1つです。主成分回帰(PCR)によって予測モデルを作成するときにも使えます。
「主成分分析」プラットフォームには、変数の個数が非常に多いデータに対する分析のために、「横長」(wide)というオプションも用意されています。「横長」手法では、横長なデータに対して、通常の処理方法よりも計算時間が短くてすみます。主成分スコアをデータテーブルに保存すれば、それをもとに主成分回帰が行えます。
多くの0があるデータ(疎データ)に対する分析のために、「疎」(sparse)というオプションも用意されています。「横長」オプションと同様、「疎」オプションも計算時間が短くなります。ただし、「横長」オプションとは異なり、「疎」オプションはすべての次元ではなく、ユーザが指定した個数だけ主成分が算出されます。
また、「主成分分析」プラットフォームでは因子分析も行うことができます。JMPには、抽出した因子を解釈しやすくするために、いくつかの直交回転や斜交回転が用意されています。因子分析については、因子分析を参照してください。
図4.1 主成分分析の例