「変数のクラスタリング」プラットフォームの例

「Diabetes.jmp」サンプルデータテーブルには、病症の進行をモデル化するのに使われる10個の説明変数が含まれています。この例では、それらの連続尺度の変数をクラスタリングします。

1. ［ヘルプ］>［サンプルデータライブラリ］を選択し、「Diabetes.jmp」を開きます。

2. ［分析］>［クラスター分析］>［変数のクラスタリング］を選択します。

3. 「性別」を除く「年齢」から「グルコース」までの列（「年齢」、「BMI」、「血圧」、「総コレステロール」、「LDL」、「HDL」、「TCH」、「LTG」、「グルコース」）を選択し、［Y, 列］をクリックします。

［変数のクラスタリング］では数値の連続変数を使用する必要があるため、「性別」の列は含めることができません。

4. ［OK］をクリックします。

図16.2 「Diabetes.jmp」の「変数のクラスタリング」レポート

Image shown here

「クラスター要約」レポートを見ると、変数は3つのクラスターにグループ化されています。

• 「クラスターメンバー」レポートを見ると、クラスター1は「BMI」、「HDL」、「TCH」、「LTG」で構成されています。「クラスター要約」レポートによると、クラスター1の最も代表的な変数は「TCH」です。また、このクラスターの1つ目の主成分によって、これら4変数が持つ変動の62.8%を説明していることがわかります。

• クラスター2は、「総コレステロール」と「LDL」の2つだけで構成されています。「クラスター要約」レポートによると、クラスター2の最も代表的な変数は「総コレステロール」です。また、このクラスターの1つ目の主成分によって、これら2変数が持つ変動の94.8%を説明していることがわかります。

• クラスター3は、年齢、血圧、グルコースで構成されています。「クラスター要約」レポートによると、クラスター3の最も代表的な変数は「血圧」です。また、このクラスターの1つ目の主成分によって、これら3変数が持つ変動の56.2%を説明していることがわかります。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).