この例では、病症の進行をモデル化するのに使われる連続尺度の説明変数をクラスタリングします。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Diabetes.jmp」を開きます。
2. [分析]>[クラスター分析]>[変数のクラスタリング]を選択します。
3. 「性別」を除く「年齢」から「グルコース」までの列(「年齢」、「BMI」、「血圧」、「総コレステロール」、「LDL」、「HDL」、「TCH」、「LTG」、「グルコース」)を選択し、[Y, 列]をクリックします。
[変数のクラスタリング]では数値の連続変数を使用する必要があるため、「性別」の列は含めることができません。
4. [OK]をクリックします。
図17.2 「Diabetes.jmp」の「変数のクラスタリング」レポート
「クラスター要約」レポートを見ると、変数は3つのクラスターにグループ化されています。
• 「クラスターメンバー」レポートを見ると、クラスター1は「TCH」、「HDL」、「LTG」、「BMI」で構成されています。「クラスター要約」レポートによると、クラスター1の最も代表的な変数は「TCH」です。また、このクラスターの1つ目の主成分によって、これら4変数が持つ変動の62.8%を説明していることがわかります。
• クラスター2は、「総コレステロール」と「LDL」の2つだけで構成されています。「クラスター要約」レポートによると、クラスター2の最も代表的な変数は「総コレステロール」です。また、このクラスターの1つ目の主成分によって、これら2変数が持つ変動の94.8%を説明していることがわかります。
• クラスター3は、「血圧」、「年齢」、「グルコース」で構成されています。「クラスター要約」レポートによると、クラスター3の最も代表的な変数は「血圧」です。また、このクラスターの1つ目の主成分によって、これら3変数が持つ変動の56.2%を説明していることがわかります。