多変量分析 > 変数のクラスタリング > 「変数のクラスタリング」プラットフォームの別例 > 「変数のクラスタリング」プラットフォームによる次元削減の例
公開日: 04/01/2021

「変数のクラスタリング」プラットフォームによる次元削減の例

この例では、「変数のクラスタリング」プラットフォームによって次元を少なくします。「Penta.jmp」サンプルデータテーブルには、応答変数「log RAI」の予測に使用する15個の変数が含まれています。変数のクラスタリングを使用して、より低次元の合成変数を作成してみましょう。

変数のクラスタリング

1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Penta.jmp」を開きます。

2. [分析]>[クラスター分析]>[変数のクラスタリング]を選択します。

3. 「log RAI」を除くすべての連続変数を選択し、[Y, 列]をクリックします。

4. [OK]をクリックします。

5. 「変数クラスター」の赤い三角ボタンをクリックし、[クラスター成分の保存]を選択します。

グループ化された5つの計算式の列がデータテーブルに追加されます。

図16.5 「Penta.jmp」の「変数のクラスタリング」レポート 

Image shown here

「クラスター要約」レポートと「クラスターメンバー」レポートから、変数が5つのグループにクラスタリングされ、5つのクラスター成分があることがわかります。

モデルのあてはめ

次に、次の2つのモデルをあてはめて、「log RAI」を予測します。

すべての変数を説明変数として使用したモデル

クラスター成分を説明変数として使用したモデル

1. 「変数クラスター」の赤い三角ボタンをクリックし、[モデルのあてはめを起動]を選択します。

2. 「log RAI」を選択し、[Y]をクリックします。

各クラスターにおいて最も代表的な変数である5変数だけが、「モデル効果の構成」リストに入力されていることに注目してください。しかし、ここでは、すべての変数を用いたモデルをあてはめてみます。

3. 「S1」から「P5」までのすべての連続変数を選択し、[追加]をクリックします。

「Obs Name」を含めないように注意してください。

4. 「ダイアログを開いたままにする」の横のボックスにチェックを入れます。

5. [実行]をクリックします。

図16.6 すべての連続尺度の説明変数を使ったモデルの「最小2乗法によるあてはめ」レポート 

Image shown here

6. 「モデルのあてはめ」ウィンドウで、「モデル効果の構成」リスト内のすべての変数を選択して、[削除]をクリックします。

7. [クラスター成分]を選択し、[追加]をクリックします。

8. [実行]をクリックします。

図16.7 クラスター成分を説明変数として使ったモデルの「最小2乗法によるあてはめ」レポート 

Image shown here

5つのクラスター成分だけを説明変数として含めたモデルでは、自由度調整R2乗が0.784で、応答変数のかなりの変動を説明しています。15個すべての説明変数を使用したモデルの自由度調整R2乗は、それより少しだけ高い0.853です(図16.6)。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).