クラスタリングのアルゴリズムは、反復的に変数のクラスターを分割し、それ以上の分割が不可能となるまで変数をクラスターに割り当てます。最初のクラスターはすべての変数で構成されます。このアルゴリズムはSASが開発し、PROC VARCLUS(SAS Institute Inc. 2020g)に実装しました。
メモ: このアルゴリズムでは、[Y, 列]に指定されたすべての変数に関して欠測値がないオブザベーションだけを使用します。
アルゴリズムの反復ステップは次のとおりです。
1. すべてのクラスターについて、次を実行します。
a. 各クラスターにおいて、そのクラスターに属する変数だけを対象に主成分分析を行います。
b. すべてのクラスターの2番目の固有値が1より小さい場合、アルゴリズムを終了します。
2. 2番目の固有値が最も大きい(かつ1より大きい)クラスターを、次のようにして新しい2つのクラスターに分けます。
a. オーソブリク(orthoblique)回転を用いて、現在のクラスター内の変数から求められた主成分を回転させます。
b. 回転後の第1主成分との相関のR2乗が第2主成分との相関のR2乗よりも大きい変数を選び、それを1つのクラスターとします。
c. そして、その残りの変数をもう1つのクラスターとします。このもう1つのクラスターは、第1主成分との相関よりも第2主成分との相関のほうが大きくなっている変数です。
d. これら2つの新しいクラスターにおいて、第1主成分を計算します。
3. 次に、別のクラスターに割り当てるべき変数がないかどうかをテストします。変数ごとに、次を実行します。
a. 各クラスターの第1主成分との相関のR2乗を計算します。
b. 変数を、相関のR2乗が最も大きいクラスター内に含めます。
メモ: オーソブリク(orthoblique)回転における直交回転には、生のコーティマックス(quartmax)回転を用いています。オーソブリク回転については、Harris and Kaiser(1964)を参照してください。