「変数のクラスタリング」プラットフォームによる次元削減の例

公開日: 04/01/2021

この例では、「変数のクラスタリング」プラットフォームによって次元を少なくします。「Penta.jmp」サンプルデータテーブルには、応答変数「log RAI」の予測に使用する15個の変数が含まれています。変数のクラスタリングを使用して、より低次元の合成変数を作成してみましょう。

1. ［ヘルプ］>［サンプルデータライブラリ］を選択し、「Penta.jmp」を開きます。

2. ［分析］>［クラスター分析］>［変数のクラスタリング］を選択します。

3. 「log RAI」を除くすべての連続変数を選択し、［Y, 列］をクリックします。

4. ［OK］をクリックします。

5. 「変数クラスター」の赤い三角ボタンをクリックし、［クラスター成分の保存］を選択します。

グループ化された5つの計算式の列がデータテーブルに追加されます。

図16.5 「Penta.jmp」の「変数のクラスタリング」レポート

Image shown here

「クラスター要約」レポートと「クラスターメンバー」レポートから、変数が5つのグループにクラスタリングされ、5つのクラスター成分があることがわかります。

次に、次の2つのモデルをあてはめて、「log RAI」を予測します。

• すべての変数を説明変数として使用したモデル

• クラスター成分を説明変数として使用したモデル

1. 「変数クラスター」の赤い三角ボタンをクリックし、［モデルのあてはめを起動］を選択します。

2. 「log RAI」を選択し、［Y］をクリックします。

各クラスターにおいて最も代表的な変数である5変数だけが、「モデル効果の構成」リストに入力されていることに注目してください。しかし、ここでは、すべての変数を用いたモデルをあてはめてみます。

3. 「S1」から「P5」までのすべての連続変数を選択し、［追加］をクリックします。

「Obs Name」を含めないように注意してください。

4. 「ダイアログを開いたままにする」の横のボックスにチェックを入れます。

5. ［実行］をクリックします。

図16.6 すべての連続尺度の説明変数を使ったモデルの「最小2乗法によるあてはめ」レポート

Image shown here

6. 「モデルのあてはめ」ウィンドウで、「モデル効果の構成」リスト内のすべての変数を選択して、［削除］をクリックします。

7. ［クラスター成分］を選択し、［追加］をクリックします。

8. ［実行］をクリックします。

図16.7 クラスター成分を説明変数として使ったモデルの「最小2乗法によるあてはめ」レポート

Image shown here

5つのクラスター成分だけを説明変数として含めたモデルでは、自由度調整R2乗が0.784で、応答変数のかなりの変動を説明しています。15個すべての説明変数を使用したモデルの自由度調整R2乗は、それより少しだけ高い0.853です（図16.6）。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).