多変量分析 > 変数のクラスタリング > 「変数のクラスタリング」プラットフォームの例
公開日: 04/01/2021

「変数のクラスタリング」プラットフォームの例

「Diabetes.jmp」サンプルデータテーブルには、病症の進行をモデル化するのに使われる10個の説明変数が含まれています。この例では、それらの連続尺度の変数をクラスタリングします。

1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Diabetes.jmp」を開きます。

2. [分析]>[クラスター分析]>[変数のクラスタリング]を選択します。

3. 「性別」を除く「年齢」から「グルコース」までの列(「年齢」「BMI」「血圧」「総コレステロール」「LDL」「HDL」「TCH」「LTG」「グルコース」)を選択し、[Y, 列]をクリックします。

[変数のクラスタリング]では数値の連続変数を使用する必要があるため、「性別」の列は含めることができません。

4. [OK]をクリックします。

図16.2 「Diabetes.jmp」の「変数のクラスタリング」レポート 

Image shown here

「クラスター要約」レポートを見ると、変数は3つのクラスターにグループ化されています。

「クラスターメンバー」レポートを見ると、クラスター1は「BMI」「HDL」「TCH」「LTG」で構成されています。「クラスター要約」レポートによると、クラスター1の最も代表的な変数は「TCH」です。また、このクラスターの1つ目の主成分によって、これら4変数が持つ変動の62.8%を説明していることがわかります。

クラスター2は、「総コレステロール」「LDL」の2つだけで構成されています。「クラスター要約」レポートによると、クラスター2の最も代表的な変数は「総コレステロール」です。また、このクラスターの1つ目の主成分によって、これら2変数が持つ変動の94.8%を説明していることがわかります。

クラスター3は、年齢血圧グルコースで構成されています。「クラスター要約」レポートによると、クラスター3の最も代表的な変数は「血圧」です。また、このクラスターの1つ目の主成分によって、これら3変数が持つ変動の56.2%を説明していることがわかります。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).