サポートベクトルマシンの別例

この例では、サポートベクトル回帰（SVR; Support Vector Regression）によって連続尺度の応答をモデル化します。サポートベクトル回帰は、サポートベクトルマシンのアルゴリズムを使って連続尺度の応答データを予測します。ここでは、サポートベクトルマシンの例で使用したのと同じ糖尿病患者のデータを使用します。ただし、今度は糖尿病の進行状態を示す2値の指標の代わりに、連続尺度の指標を予測します。この連続尺度の指標は、値が大きいほど、症状の進行が進んでいます。動径基底関数の「コスト」パラメータを変えて、最も良くあてはまるモデルを見つけることにします。

1. ［ヘルプ］>［サンプルデータフォルダ］を選択し、「Diabetes.jmp」を開きます。

2. ［分析］>［予測モデル］>［サポートベクトルマシン］を選択します。

3. 「Y」を選択し、［Y, 目的変数］をクリックします。

4. 「年齢」から「グルコース」までを選択し、［X, 説明変数］をクリックします。

5. 「検証」列を選択し、［検証］ボタンをクリックします。

6. ［OK］をクリックします。

7. 「モデルの設定」パネルで、カーネル関数が［動径基底関数］が選択されており、「コスト」が1、「ガンマ」が0.1に設定されていることを確認します。

8. ［実行］をクリックします。

9. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。

10. 「コスト」パラメータを「0.1」に変更します。

11. ［実行］をクリックします。

12. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。

13. 「コスト」パラメータを「2」に変更します。

14. ［実行］をクリックします。

図9.6 「モデルの比較」レポート

「モデルの比較」レポート

「モデルの比較」レポートには、異なる「コスト」パラメータを使ったモデルの結果が含まれています。「コスト」パラメータが大きいほど、学習セットの点を誤分類する割合が小さくなり、「コスト」パラメータが小さいほど、マージンの幅が広くなることを思い出してください。このシナリオでは、より柔軟なモデル（「コスト」パラメータが0.1）が最も良くあてはまっています。

15. 「モデルの比較」レポートの「表示」列で、「モデル 1」と「モデル3」の選択を解除します。

図9.7 連続尺度の応答変数に対するモデルレポート

連続尺度の応答変数に対するモデルレポート

連続尺度の応答変数に対するモデルレポートには、「モデルの要約」・「推定の詳細」・「予測値と実測値のプロット」があります。「モデルの要約」レポートでは、RASE（Root Average Squared Error; 平均平方誤差の平方根）が学習セットに対して52.58、検証セットに対して57.50になっています。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).