多変量分析
『多変量分析』では、複数の変数をまとめて分析する以下の手法について取り上げます。
• 「多変量の相関」プラットフォームでは、複数の変数間における相関関係を調べます。多変量の相関を参照してください。
• 「主成分分析」プラットフォームでは、複数の変数における変動をできるだけ説明する、少数の独立した線形結合(主成分)を求めます。主成分分析は探索的な手法であり、また、予測モデルを構築するときの手助けにもなります。「主成分分析」を参照してください。
• 「判別分析」プラットフォームは、連続量の応答(Y)からカテゴリカルな分類変数(X)を予測する手法で、多変量分散分析(MANOVA)からの逆推定とみなすことができます。判別分析を参照してください。
• 「PLS回帰」プラットフォームは、説明変数(X)の線形結合からなる因子に基づいて、応答変数(Y)を予測する線形モデルを構築します。PLS回帰は、XとYの関係を調べ、潜在的な因子を抽出します。PLS回帰を参照してください。
• 多重対応分析(Multiple Correspondence Analysis; MCA)は、複数のカテゴリカルな変数を分析対象とし、それらのカテゴリカルな変数の水準間にある関係を調べます。多重対応分析は、特にフランスや日本の社会科学分野で広く利用されています。多重対応分析は、質問紙調査では、複数の質問における関係を調べるのに役立つでしょう。多重対応分析を参照してください。
• 「構造方程式モデル」プラットフォームでは、確証的因子分析モデル(確認的因子分析モデル)、(潜在変数がある場合も含む)パスモデル、測定誤差モデル、潜在成長曲線モデルなどのさまざまなモデルをあてはめられます。構造方程式モデルを参照してください。
• 「因子分析」プラットフォームは、多数の観測変数から因子を抽出します。因子分析モデルでは、複数の因子の線形結合により各観測変数が表されると仮定されています。このプラットフォームでは、観測データを表すのに適切であろう因子の個数を調べたり、因子と変数との関係の強さを調べたりできます。因子分析を参照してください。
• 「多次元尺度構成」(Multi-Dimensional Scaling; MDS)プラットフォームは、対象間の類似度(類似性・相違性・距離)を視覚化します。多次元尺度構成を参照してください。
• 「多変量埋め込み」プラットフォームでは、高次元空間のデータ点を、低次元空間に写像します。多変量埋め込みを参照してください。
• 「項目分析」プラットフォームでは、項目反応理論モデルをあてはめることができます。項目反応理論は、テストや調査などを分析するのに使われています。項目反応理論は、各個人に能力を仮定し、その個人が特定の質問に正答する確率をモデル化したものです。項目反応理論は、標準化テスト、認知テスト、消費者の選好などを分析するのに使用できます。項目分析を参照してください。
• 「階層型クラスター分析」プラットフォームは、多変量データをもとに、値が近い行をグループにまとめます。クラスター分析は、データにおける塊を見つけ出すための探索的な統計手法です。階層型クラスター分析を参照してください。
• 「K Meansクラスター分析」プラットフォームも、多変量データをもとに、値が近い行をグループにまとめます。K Meansクラスター分析を参照してください。
• 「正規混合」プラットフォームは、重なりのある多変量正規分布のデータに対するクラスタリングです。正規混合分布法を参照してください。
• 「潜在クラス分析」プラットフォームは、カテゴリカルなデータに対するクラスタリングです。潜在クラスモデルでは、「観測されるデータは、多項分布の混合分布に従っている」と仮定します。潜在クラス分析を参照してください。
• 「変数のクラスタリング」プラットフォームは、似通った変数をクラスターに分類します。この手法は、データの次元を減らすために使えます。この手法により、多変量データ全体の変動をうまく説明する、少数のクラスター成分や代表的な変数を探し出すことができます。何かしらの別の分析を行う際に、すべての変数ではなく、「変数のクラスタリング」で求められたそれらのクラスター成分や代表的な変数だけでモデル化することが考えられます。変数のクラスタリングを参照してください。