起動ウィンドウで[OK]をクリックすると、「サポートベクトルマシン」レポートウィンドウが開き、モデルをあてはめるための「モデルの設定」パネルが表示されます。この「モデルの設定」パネルを使用して、カーネル関数や関連するパラメータ、および検証法を指定します。
図9.5 「モデルの設定」パネル
「モデルの設定」パネルには、以下のオプションがあります。
カーネル関数
モデルで使用するカーネル関数を指定します。次のカーネル関数の中から選びます。
動径基底関数
クラスを分けるための非線形超曲面を作成する、動径基底関数カーネルを選択します。
– 「コスト」パラメータは、オブザベーションの誤分類に関連するペナルティです。「コスト」パラメータが大きいほど、点を誤分類する可能性が低いアルゴリズムが実行され、「コスト」パラメータが小さいほど、より柔軟なアルゴリズムが実行されます。「コスト」パラメータは0より大きくなければなりません。デフォルト値は1です。
– 「ガンマ」パラメータは、カーネル関数のパラメータです。このパラメータによって、決定線の曲がり具合が決まります。ガンマ値が大きいほど、曲がり具合が大きいことを意味します。非線形の決定線では、より柔軟なあてはめが行われますが、曲がり具合が大きすぎると、オーバーフィットになります。「ガンマ」パラメータは0より大きくなければなりません。デフォルト値は1/(説明変数の数)です。
直線
クラスを分けるための直線の超曲面を作成する、直線カーネル関数を選択します。
– 「コスト」パラメータは、オブザベーションの誤分類に関連するペナルティです。「コスト」パラメータが大きいほど、点を誤分類する可能性が低いアルゴリズムが実行され、「コスト」パラメータが小さいほど、より柔軟なアルゴリズムが実行されます。「コスト」パラメータは0より大きくなければなりません。デフォルト値は1です。
注: 範囲外のパラメータ値を指定した場合は、デフォルト値が使用されます。
ヒント: 最良モデルを見つけるには、一連の範囲のカーネル関数とパラメータ値をあてはめて、「モデルの比較」レポートを使用します。
検証法
モデルの検証法を指定します。初めて[実行]ボタンをクリックしたときには、指定された検証法を使って最初のサポートベクトルマシンモデルがあてはめられます。その後、この検証法は「サポートベクトルマシン」ウィンドウ内のすべてのサポートベクトルマシンモデルに対して使用されます。これにより、レポートウィンドウ内のすべてのモデルが同じ検証法と検証セットを使ってあてはめられます。
保留
元のデータを無作為に学習セットと検証セットに分割します。データのうち、検証セットとして使用する部分の割合(保留する割合)を指定することができます。
K分割
(Yに2つの水準がある場合にのみ使用可能。)データをランダムにK個に分割します。順番に、(K-1)個分のデータにモデルがあてはめられ、残っているデータでモデルが検証されます。全部でK個のモデルがあてはめられます。検証に用いた統計量が最良のものが、最終的なモデルとして選ばれます。
検証列
(起動ウィンドウで検証列を指定した場合にのみ使用可能。)指定された検証列の値を使用して、データを部分に分けます。列の値によって、分割方法および検証方法が決まります。
– 検証列に一意な値が3つある場合は
最小の値が学習セットを指定するのに使用されます。
中間の値が検証セットを指定するのに使用されます。
最大の値がテストセットを指定するのに使用されます。
– 検証列に一意な値が2つある場合は、データが学習セットと検証セットに分かれます。
検証列 k分割
([Y, 目的変数]列に2つの水準があり、起動ウィンドウで検証列が指定された場合にのみ使用可能。)指定された検証列の値を使用して、データをK個のセットに分割します。ここで、Kは列内の一意の値の数です。その後、K分割検証が実行されます。
なし
検証は使用されません。
実行
指定されたサポートベクトルマシンモデルをあてはめ、モデルレポートを表示します。
注: データテーブルが大きい場合は、データにあてはめる各モデルに対してそれぞれ進行状況を示すバーが表示されます。モデルあてはめの合計数はk!/2(k-2)!です。ここで、kは目的変数の水準の数です。各進行状況バーにそれぞれ[現在の推定値を採用]ボタンがあります。このボタンは、あてはめアルゴリズムを早期に終了し、現在の推定値を受け入れる場合にクリックします。予測の計算はこのボタンをクリックした後に実行されるため、レポートが表示されるまでに少し時間がかかる場合があります。