公開日: 09/19/2023

サポートベクトルマシンの別例

この例では、サポートベクトル回帰(SVR; Support Vector Regression)によって連続尺度の応答をモデル化します。サポートベクトル回帰は、サポートベクトルマシンのアルゴリズムを使って連続尺度の応答データを予測します。ここでは、サポートベクトルマシンの例で使用したのと同じ糖尿病患者のデータを使用します。ただし、今度は糖尿病の進行状態を示す2値の指標の代わりに、連続尺度の指標を予測します。この連続尺度の指標は、値が大きいほど、症状の進行が進んでいます。動径基底関数の「コスト」パラメータを変えて、最も良くあてはまるモデルを見つけることにします。

1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Diabetes.jmp」を開きます。

2. [分析]>[予測モデル]>[サポートベクトルマシン]を選択します。

3. 「Y」を選択し、[Y, 目的変数]をクリックします。

4. 「年齢」から「グルコース」までを選択し、[X, 説明変数]をクリックします。

5. 「検証」列を選択し、[検証]ボタンをクリックします。

6. [OK]をクリックします。

7. 「モデルの設定」パネルで、カーネル関数が[動径基底関数]が選択されており、「コスト」が1、「ガンマ」が0.1に設定されていることを確認します。

8. [実行]をクリックします。

9. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。

10. 「コスト」パラメータを「0.1」に変更します。

11. [実行]をクリックします。

12. 「モデルの設定」の横にあるグレーの三角ボタンをクリックして、「モデルの設定」パネルを開きます。

13. 「コスト」パラメータを「2」に変更します。

14. [実行]をクリックします。

図9.6 「モデルの比較」レポート 

「モデルの比較」レポート

「モデルの比較」レポートには、異なる「コスト」パラメータを使ったモデルの結果が含まれています。「コスト」パラメータが大きいほど、学習セットの点を誤分類する割合が小さくなり、「コスト」パラメータが小さいほど、マージンの幅が広くなることを思い出してください。このシナリオでは、より柔軟なモデル(「コスト」パラメータが0.1)が最も良くあてはまっています。

15. 「モデルの比較」レポートの「表示」列で、「モデル 1」と「モデル3」の選択を解除します。

図9.7 連続尺度の応答変数に対するモデルレポート 

連続尺度の応答変数に対するモデルレポート

連続尺度の応答変数に対するモデルレポートには、「モデルの要約」・「推定の詳細」・「予測値と実測値のプロット」があります。「モデルの要約」レポートでは、RASE(Root Average Squared Error; 平均平方誤差の平方根)が学習セットに対して52.58、検証セットに対して57.50になっています。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).