クラスター分析の例の「Birth Death Subset.jmp」について検討してみましょう。
図12.5 「Birth Death Subset.jmp」の「樹形図」レポート
クラスターが4個である位置にひし形が設定されています。クラスターが4個になる直前で結合されたクラスターは、「Algeria」から「Bangladesh」までで構成されるクラスターと、「Iraq」から「Saudi Arabia」までで構成されるクラスターです。ひし形でクラスターを4個にしたときの距離グラフに、これら2個のクラスター間の距離が示されています。この距離の数値は、「クラスター分析の履歴」レポートにおいて、「クラスター数」が「4」である行に表示されています。その数値は1.618708760です。これは、4個のクラスターが形成されるときに結合された2つのクラスター(「Algeria」で始まるクラスターと、「Iraq」で始まるクラスター)の距離です。
クラスターが5個になる直前に結合された2つのクラスターは、「Australia」から「Korea, South」までで構成されるクラスターと、「Austria」から「Korea, North」までで構成されるクラスターです。これら2つのクラスター間の距離は、「Algeria」から「Bangladesh」までで構成されるクラスターと、「Iraq」から「Saudi Arabia」までで構成されるクラスターとの距離とあまり変わりません。縦線の位置を見ると、ほぼ同じ距離であることが分かります。つまり、クラスター数が4個の場合と、クラスター数が5個の場合では、その直前に結合されたクラスター間の距離にはさほど違いはありません。
距離グラフを見ると、4個のクラスターで折れ線が平らになっています。クラスターを4個から5個にしても、直前に結合されたクラスター間の距離はあまり変化しないことがわかります。しかし、クラスターを3個から4個にすると、距離は大きく減少します。