この例では、サポートベクトル回帰(SVR; Support Vector Regression)によって連続尺度の応答をモデル化します。サポートベクトル回帰は、サポートベクトルマシンのアルゴリズムを使って連続尺度の応答データを予測します。ここでは、サポートベクトルマシンの例で使用したのと同じ糖尿病患者のデータを使用します。ただし、今度は糖尿病の進行状態を示す2値の指標の代わりに、連続尺度の指標を予測します。この連続尺度の指標は、値が大きいほど、症状の進行が進んでいます。動径基底関数の「コスト」パラメータを変えて、最も良くあてはまるモデルを見つけることにします。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Diabetes.jmp」を開きます。
2. [分析]>[予測モデル]>[サポートベクトルマシン]を選択します。
3. 「Y」を選択し、[Y, 目的変数]をクリックします。
4. 「年齢」から「グルコース」までを選択し、[X, 説明変数]をクリックします。
5. 「検証」列を選択し、[検証]ボタンをクリックします。
6. [OK]をクリックします。
7. 「モデルの設定」パネルで、カーネル関数が[動径基底関数]が選択されており、「コスト」が1、「ガンマ」が0.1に設定されていることを確認します。
8. [実行]をクリックします。
9. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。
10. 「コスト」パラメータを「0.1」に変更します。
11. [実行]をクリックします。
12. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。
13. 「コスト」パラメータを「2」に変更します。
14. [実行]をクリックします。
図9.6 「モデルの比較」レポート
「モデルの比較」レポートには、異なる「コスト」パラメータを使ったモデルの結果が含まれています。「コスト」パラメータが大きいほど、学習セットの点を誤分類する割合が小さくなり、「コスト」パラメータが小さいほど、マージンの幅が広くなることを思い出してください。このシナリオでは、より柔軟なモデル(「コスト」パラメータが0.1)が最も良くあてはまっています。
15. 「モデルの比較」レポートの「表示」列で、「モデル 1」と「モデル3」の選択を解除します。
図9.7 連続尺度の応答変数に対するモデルレポート
連続尺度の応答変数に対するモデルレポートには、「モデルの要約」・「推定の詳細」・「予測値と実測値のプロット」があります。「モデルの要約」レポートでは、RASE(Root Average Squared Error; 平均平方誤差の平方根)が学習セットに対して52.58、検証セットに対して57.50になっています。