多変量分析 > 変数のクラスタリング > 「変数のクラスタリング」プラットフォームの統計的詳細
公開日: 09/19/2023

「変数のクラスタリング」プラットフォームの統計的詳細

変数のクラスタリングのアルゴリズムは、反復的に変数のクラスターを分割し、それ以上の分割が不可能となるまで変数をクラスターに割り当てます。最初のクラスターはすべての変数で構成されます。このアルゴリズムはSASが開発し、PROC VARCLUS(SAS Institute Inc. 2020g)に実装しました。

メモ: このアルゴリズムでは、[Y, 列]に指定されたすべての変数に関して欠測値がないオブザベーションだけを使用します。

アルゴリズムの反復ステップは次のとおりです。

1. すべてのクラスターについて、次を実行します。

a. 各クラスターにおいて、そのクラスターに属する変数だけを対象に主成分分析を行います。

b. すべてのクラスターの2番目の固有値が1より小さい場合、アルゴリズムを終了します。

2. 2番目の固有値が最も大きい(かつ1より大きい)クラスターを、次のようにして新しい2つのクラスターに分けます。

a. オーソブリク(orthoblique)回転を用いて、現在のクラスター内の変数から求められた主成分を回転させます。

b. 回転後の第1主成分との相関のR2乗が第2主成分との相関のR2乗よりも大きい変数を選び、それを1つのクラスターとします。

c. そして、その残りの変数をもう1つのクラスターとします。このもう1つのクラスターは、第1主成分との相関よりも第2主成分との相関のほうが大きくなっている変数です。

d. これら2つの新しいクラスターにおいて、第1主成分を計算します。

3. 次に、別のクラスターに割り当てるべき変数がないかどうかをテストします。変数ごとに、次を実行します。

a. 各クラスターの第1主成分との相関のR2乗を計算します。

b. 変数を、相関のR2乗が最も大きいクラスター内に含めます。

メモ: オーソブリク(orthoblique)回転における直交回転には、生のコーティマックス(quartmax)回転を用いています。オーソブリク回転については、Harris and Kaiser(1964)を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).