クラスタリングは、多変量データをもとに、値が近い行をグループにまとめていく手法です。データにおける塊を見つけ出すために使用します。
階層型クラスター分析では、逐次的にクラスターを結合していきます。階層型クラスター分析では、まず、データ行の1つ1つそれぞれが1つのク ラスターとみなされます。そして、1ステップごとに距離が最も近い2つのクラスターが1つに結合されていきます。この結合過程は最終的にツリー(樹形図)として描かれます。
階層型クラスター分析は、数千行までの小さなテーブルに適しています。計算には時間を要する場合があります。大きなデータテーブルの場合は、K Meansクラスター分析または正規混合を使用してください。
メモ: 「階層型クラスター分析」プラットフォームは、文字型の列にも対応しています。「K Meansクラスター分析」と「正規混合」のプラットフォームは数値型の列しか対応していません。
図12.1 正座樹形図の例