分析対象のデータが距離行列である場合、次のような列を含むデータになっていなければいけません。
• データタイプが文字型であるID列(通常は最初の列)。
• 距離を含む、n列の数値列。nは行数と一致していなければいけません。これらn列のデータは、0または欠測値を対角に含む対称行列になっていなければいけません。
「Flight Distances.jmp」の距離行列で、この構造を確かめてみましょう。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Flight Distances.jmp」を開きます。
2. [分析]>[クラスター分析]>[階層型クラスター分析]を選択します。
3. 起動ウィンドウの左下のリストで、[通常のデータ]を[データは距離行列]に変更します。
4. 「都市」を選択して[ラベル]をクリックします。
5. 残りのすべての列を選択し、[Y, 列]をクリックします。
図12.6 設定後の距離行列の起動ウィンドウ
6. [OK]をクリックします。
7. 「階層型クラスター分析」の赤い三角ボタンをクリックし、[クラスターの色分け]を選択します。
図12.7 「Flight Distances.jmp」の「樹形図」レポート
「樹形図」レポートにおけるひし形の位置は、このモデルでは都市を3つのクラスターにグループ化していることを示し、樹形図でこれら3つのクラスターが色分けされています。レポートの解釈方法の詳細については、「樹形図」レポートを参照してください。