公開日: 09/19/2023

折衷型Ward法における近傍結合の統計的詳細

「階層型クラスター分析」プラットフォームの折衷型Ward法では、第1段階で近傍結合の処理を行います。近傍結合を何サイクルか行ってデータを小さくしてから、通常の階層型クラスター分析処理に引き継ぎます。近傍結合の処理に対しては、以下のオプションを指定できます。

折衷型 目標値

ここに指定したクラスター数以下になった場合に近傍結合の処理を終了し、通常の階層型クラスター分析へと移ります。デフォルト値は400です。

折衷型 サイクル 数

近傍結合の処理を、最大、何サイクルだけ繰り返すかを指定します。デフォルト値は30です。

折衷型 K

近傍結合の処理における近傍点の個数の初期値を指定します。デフォルト値は10です。

折衷型Ward法における近傍結合の処理では、以下のステップを繰り返します。

1. 最初は、各データ行を1つのクラスターとみなします。まず、近傍点を効率的に見つけるために、VP木を生成します。

2. 各クラスターについて、近傍に位置するk個のクラスターを求めます。

3. それらの近傍にあるクラスターのペアを、距離の短い順に並べます。

4. 距離が短い方から半分の各ペアだけにおいて、ペアを結合するかどうかを距離の短い順に決めていきます。現在のサイクルでまだ別のクラスターと結合されていない場合は、そのペアを結合します。結合したクラスターは、次のサイクルでは1つのクラスターとして処理されます。

5. サイクルの最大回数(「折衷型 サイクル数」)に達するまで、step 1からstep 4を繰り返します。

「折衷型 目標値」以下にクラスター数がなったら、停止します。

クラスター数が「折衷型 目標値」より大きい場合は、「折衷型 目標値」以下になるまで、step 1からstep 4を繰り返します。

各サイクルで、結合されたペアの数が少ない場合、次のサイクルで近傍点の個数kを増やします。前のサイクルで十分な数のペアが結合された場合、kの値を減らします。kの値は、以下の規則にしたがって増減します。

step 4でペアの20%未満が結合された場合、kの値に10を足します。

step 4でペアの10%未満が結合された場合、kの値に20を足します。

step 4でペアの5%未満が結合された場合、kの値に30を足します。

step 4で30%を上回るペアが結合された場合、kの値から10を引きます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).