クラスタリングは、多変量データをもとに、値が近い行をグループにまとめていく手法です。データにおける塊を見つけ出すために使用します。
階層型クラスター分析では、逐次的にクラスターを結合していきます。階層型クラスター分析では、まず、データ行の1つ1つそれぞれが1つのク ラスターとみなされます。そして、1ステップごとに距離が最も近い2つのクラスターが1つに結合されていきます。この結合過程は最終的にツリー(樹形図)として描かれます。
階層型クラスター分析は、基本的に、数千行までの小さなテーブルに適しています。計算には時間を要する場合があります。階層型クラスター分析では、高速Ward法および折衷型Ward法も提供されています。これらの方法は計算が高速なので、大きなデータテーブルのクラスタリングに役立ちます。
メモ: 「階層型クラスター分析」プラットフォームは、文字型の列にも対応しています。「K Meansクラスター分析」と「正規混合」のプラットフォームは数値型の列しか対応していません。
図13.1 正座樹形図の例