「階層型クラスター分析」プラットフォームの折衷型Ward法では、第1段階で近傍結合の処理を行います。近傍結合を何サイクルか行ってデータを小さくしてから、通常の階層型クラスター分析処理に引き継ぎます。近傍結合の処理に対しては、以下のオプションを指定できます。
折衷型 目標値
ここに指定したクラスター数以下になった場合に近傍結合の処理を終了し、通常の階層型クラスター分析へと移ります。デフォルト値は400です。
折衷型 サイクル 数
近傍結合の処理を、最大、何サイクルだけ繰り返すかを指定します。デフォルト値は30です。
折衷型 K
近傍結合の処理における近傍点の個数の初期値を指定します。デフォルト値は10です。
折衷型Ward法における近傍結合の処理では、以下のステップを繰り返します。
1. 最初は、各データ行を1つのクラスターとみなします。まず、近傍点を効率的に見つけるために、VP木を生成します。
2. 各クラスターについて、近傍に位置するk個のクラスターを求めます。
3. それらの近傍にあるクラスターのペアを、距離の短い順に並べます。
4. 距離が短い方から半分の各ペアだけにおいて、ペアを結合するかどうかを距離の短い順に決めていきます。現在のサイクルでまだ別のクラスターと結合されていない場合は、そのペアを結合します。結合したクラスターは、次のサイクルでは1つのクラスターとして処理されます。
5. サイクルの最大回数(「折衷型 サイクル数」)に達するまで、step 1からstep 4を繰り返します。
– 「折衷型 目標値」以下にクラスター数がなったら、停止します。
– クラスター数が「折衷型 目標値」より大きい場合は、「折衷型 目標値」以下になるまで、step 1からstep 4を繰り返します。
各サイクルで、結合されたペアの数が少ない場合、次のサイクルで近傍点の個数kを増やします。前のサイクルで十分な数のペアが結合された場合、kの値を減らします。kの値は、以下の規則にしたがって増減します。
• step 4でペアの20%未満が結合された場合、kの値に10を足します。
• step 4でペアの10%未満が結合された場合、kの値に20を足します。
• step 4でペアの5%未満が結合された場合、kの値に30を足します。
• step 4で30%を上回るペアが結合された場合、kの値から10を引きます。