「Diabetes.jmp」サンプルデータテーブルには、病症の進行をモデル化するのに使われる10個の説明変数が含まれています。この例では、それらの連続尺度の変数をクラスタリングします。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Diabetes.jmp」を開きます。
2. [分析]>[クラスター分析]>[変数のクラスタリング]を選択します。
3. 「性別」を除く「年齢」から「グルコース」までの列(「年齢」、「BMI」、「血圧」、「総コレステロール」、「LDL」、「HDL」、「TCH」、「LTG」、「グルコース」)を選択し、[Y, 列]をクリックします。
[変数のクラスタリング]では数値の連続変数を使用する必要があるため、「性別」の列は含めることができません。
4. [OK]をクリックします。
図16.2 「Diabetes.jmp」の「変数のクラスタリング」レポート
「クラスター要約」レポートを見ると、変数は3つのクラスターにグループ化されています。
• 「クラスターメンバー」レポートを見ると、クラスター1は「BMI」、「HDL」、「TCH」、「LTG」で構成されています。「クラスター要約」レポートによると、クラスター1の最も代表的な変数は「TCH」です。また、このクラスターの1つ目の主成分によって、これら4変数が持つ変動の62.8%を説明していることがわかります。
• クラスター2は、「総コレステロール」と「LDL」の2つだけで構成されています。「クラスター要約」レポートによると、クラスター2の最も代表的な変数は「総コレステロール」です。また、このクラスターの1つ目の主成分によって、これら2変数が持つ変動の94.8%を説明していることがわかります。
• クラスター3は、年齢、血圧、グルコースで構成されています。「クラスター要約」レポートによると、クラスター3の最も代表的な変数は「血圧」です。また、このクラスターの1つ目の主成分によって、これら3変数が持つ変動の56.2%を説明していることがわかります。