この例では、「変数のクラスタリング」プラットフォームによって次元を少なくします。「Penta.jmp」サンプルデータテーブルには、応答変数「log RAI」の予測に使用する15個の変数が含まれています。変数のクラスタリングを使用して、より低次元の合成変数を作成してみましょう。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Penta.jmp」を開きます。
2. [分析]>[クラスター分析]>[変数のクラスタリング]を選択します。
3. 「log RAI」を除くすべての連続変数を選択し、[Y, 列]をクリックします。
4. [OK]をクリックします。
5. 「変数クラスター」の赤い三角ボタンをクリックし、[クラスター成分の保存]を選択します。
グループ化された5つの計算式の列がデータテーブルに追加されます。
図16.5 「Penta.jmp」の「変数のクラスタリング」レポート
「クラスター要約」レポートと「クラスターメンバー」レポートから、変数が5つのグループにクラスタリングされ、5つのクラスター成分があることがわかります。
次に、次の2つのモデルをあてはめて、「log RAI」を予測します。
• すべての変数を説明変数として使用したモデル
• クラスター成分を説明変数として使用したモデル
1. 「変数クラスター」の赤い三角ボタンをクリックし、[モデルのあてはめを起動]を選択します。
2. 「log RAI」を選択し、[Y]をクリックします。
各クラスターにおいて最も代表的な変数である5変数だけが、「モデル効果の構成」リストに入力されていることに注目してください。しかし、ここでは、すべての変数を用いたモデルをあてはめてみます。
3. 「S1」から「P5」までのすべての連続変数を選択し、[追加]をクリックします。
「Obs Name」を含めないように注意してください。
4. 「ダイアログを開いたままにする」の横のボックスにチェックを入れます。
5. [実行]をクリックします。
図16.6 すべての連続尺度の説明変数を使ったモデルの「最小2乗法によるあてはめ」レポート
6. 「モデルのあてはめ」ウィンドウで、「モデル効果の構成」リスト内のすべての変数を選択して、[削除]をクリックします。
7. [クラスター成分]を選択し、[追加]をクリックします。
8. [実行]をクリックします。
図16.7 クラスター成分を説明変数として使ったモデルの「最小2乗法によるあてはめ」レポート
5つのクラスター成分だけを説明変数として含めたモデルでは、自由度調整R2乗が0.784で、応答変数のかなりの変動を説明しています。15個すべての説明変数を使用したモデルの自由度調整R2乗は、それより少しだけ高い0.853です(図16.6)。