樹形図は、各行を結合した集まりを表現したツリー状の図です。樹形図では、クラスター間の距離がどれぐらい離れているかも判断できます。
クラスタリングの過程は、樹形図を左から右へとたどると確認できます。各ステップで、最も距離が近い2つのクラスターを、1つのクラスターに結合しています。
• 2つのクラスターが1つに結合したことは、2本の横線が縦線で繋がれることによって樹形図で表されています。
• 縦線のX座標は、そこで結合された2つのクラスター間の距離を表しています。また、そこまでの結合により、樹形図上で繋がっているだけの個数だけクラスターが形成されています。
メモ: データの行数が256行より少ない場合、「距離グラフ」のY座標は距離に比例します。それ以外の場合は、「距離グラフ」のY座標には幾何級数が使用されます。樹形図のスケールを参照してください。
ここでは、次のような操作ができます。
• 樹形図の上下にあるひし形のハンドルのいずれかを左右にドラッグすると、その位置でのクラスターの個数が表示されます。
• クラスターの幹のどれかをクリックすると、そのクラスターに属するすべての点が、樹形図上とデータテーブル内の両方で強調表示されます。
樹形図の下には、「距離グラフ」が描かれます。この「距離グラフ」には、2つのクラスターが1つのクラスターに結合される箇所で、点がプロットされています。X軸はクラスターの個数を表しており、左から右にいくにつれ減少します。Y軸は、その個数になるのに結合されたクラスター間の距離を表しています。
樹形図の上下にあるひし形のハンドルのいずれかを左右にドラッグすると、クラスターの個数を変更できます。ひし形をクリックしてドラッグすると、樹形図に縦線が表示され、クラスターの個数に対応して移動します。多くの場合、距離があまり急激に変化しなくなる箇所があります。そのような情報を参考にしてクラスターの個数を決めるとよいでしょう。