この例では、JMP Proにおいて、「モデルのあてはめ」でPLS回帰を使って、カテゴリカルな応答および多数の変数を対象とした分析を行います。JMP Proでは、「モデルのあてはめ」でPLS回帰を指定することができ、また、K分割交差検証も使用できます。サンプルデータには、165人の男性から取得した血清のサンプルの結果が含まれています。このうち、84人が前立腺ガンを患っており、残りの81人は前立腺ガンではありません。分析の目標は、血清のサンプルに基づいて、前立腺ガンを患っている男性を特定することです。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Prostate Cancer.jmp」を開きます。
2. [分析]>[モデルのあてはめ]を選択します。
3. 「ステータス」を選択し、[Y]をクリックします。
4. 「Proteins」列グループを選択し、[追加]をクリックします。
5. 「手法」から[PLS回帰]を選択します。
6. [実行]をクリックします。
7. (オプション)「PLS回帰」の赤い三角ボタンをクリックし、[乱数シード値の設定]を選択します。
8. (オプション)「乱数シード値の指定」に「1234」と入力します。
乱数シード値を指定すると、ここで示す例と同じ結果を再現できます。
9. (オプション)[OK]をクリックします。
10. 「モデルの設定」にある[実行]をクリックします。
図6.15 「PLS回帰」レポート
PRESS平均平方根プロットを見ると、因子数が5のときにPRESS平均平方根が最小になっていることがわかります。このことは、PRESS平均平方根プロットの下に注として記載されています。レポートの下部には、「NIPALS: 5因子, 特異値分解=高速」という名前のレポートが作成されます。