公開日: 11/25/2021

Image shown here「サポートベクトルマシン モデル」レポート

応答プロファイルプロット

(応答変数がカテゴリカルの場合にのみ使用可能。)モデルによる分類のグラフを描きます。プロット上の点は実際の観測値で、連続尺度の変数がちょうど2つある場合にのみデフォルトで表示されます。陰影付きの等高線は、プロットされている2変数以外の変数を特定の値に固定したときに、平面上の領域がどちらに分類されるかを表しています。この分類は、あてはめたサポートベクトルマシンによって行われています。プロットの上には、その他の変数を特定の値に固定するためのスライダーとテキストボックスがあります。スライダーまたはテキストボックスにて変数の数値を変更すると、プロットも自動的に更新されます。また、X軸とY軸にある赤い三角ボタンにて、X軸とY軸にプロットする変数を変更できます。

「応答プロファイルプロット」の赤い三角ボタンのメニューには、以下のオプションがあります。

グリッド密度

等高線を描くためのグリッドの細かさを変更する。グリッドを多くするほど、分割の曲線は滑らかになります。

点の表示

プロット上の点の表示/非表示を切り替える。変数がちょうど2つある場合には、デフォルトで表示されます。

モデルの要約

応答列の名前、検証法、およびモデルのあてはめに使用されたカーネル関数の種類が表示されます。また、「モデルの要約」表には、学習セット・検証セット・テストセットにおける要約統計量が含まれています。各セットに対し、データの行数(標本サイズ)とサポートベクトルの個数が報告されます。応答変数がカテゴリカルの場合は、各セットに対して誤分類率が報告されます。誤分類率は、モデルによって誤分類されたデータの割合です。この値は、誤分類されている個数を、データ全体の標本サイズ(すべての観測数)で割ったものです。応答変数が連続尺度の場合は、各セットに対してRASEとR2乗の値が報告されます。

推定値の詳細

モデルで使用されているパラメータの値が表示されます。

あてはめの詳細

(応答変数がカテゴリカルの場合にのみ使用可能。)学習セットに対して以下の統計量が表示されます(検証セットやテストセットが指定された場合には、それらに対しても同じ統計量が表示されます)。

エントロピーR2乗

現在のモデルと切片だけのモデルの対数尤度を比較する適合度の指標です。エントロピーR2乗の範囲は0~1で、値が1に近いほど、あてはまりが良いことを意味します。エントロピーR2乗を参照してください。

一般化R2乗

この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗(正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗)を一般化したものです。この一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。Nagelkerke(1991)を参照してください。値が1に近いほど、適合度が良いことを示します。

平均 -Log p

-log(p)の平均。pは、実際に生じた応答水準に対する予測確率です。値が小さいほど、適合度が良いことを示します。

RASE

平均2乗誤差平方根(Root Average Squared Error)。RASEは次のように計算されます。ここで、Sourceは学習セット・検証セット・テストセットを示します。

Equation shown here

平均 絶対偏差

誤差の絶対値の平均。誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。値が小さいほど、適合度が良いことを示します。

誤分類率

予測確率が最も大きい応答の水準が、観測された水準と一致しない割合。

メモ: 「あてはめの詳細」レポートの誤分類率は、「混同行列」レポートの誤分類率と一致しない場合があります。応答変数が2値である場合、「あてはめの詳細」レポートの誤分類率は、確率に対する閾値として0.5を使用して計算されます。一方、「混同行列」レポートの誤分類率は、「確率の閾値」の値を閾値として使用して計算されます。

N

標本サイズ(観測数)。

混同行列

(応答変数がカテゴリカルの場合にのみ使用可能。)混同行列は、モデルで指定されている各セット(学習セット・検証セット・テストセット)について表示されます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。モデルを評価するときは、混同行列や誤分類率を参考にしてください。

混同行列と誤分類率は、「確率の閾値」ボックスの値を、分類の際の閾値として使用します。この閾値のデフォルト値は、あてはめたサポートベクトルマシンによる分類に基づき計算されます。この閾値は、「確率の閾値」の横にあるテキストボックスに新しい値を入力するか、または、スライダーを移動することで、変更できます。確率の閾値を変更した場合は、混同行列と誤分類率が自動的に更新されます。「モデルの比較」レポートの「確率の閾値」列および「検証 条件付き誤分類率」列も自動的に更新されます。

予測値と実測値のプロット

(応答変数が連続尺度の場合にのみ使用可能。)予測値と実測値のプロットを作成します。対角線はY = Xの直線です。点がこの線に近いほど、データはモデルによくあてはまります。検証を使用した場合は、学習セットと検証セット、さらにテストセットが指定されている場合にはテストセットに対して、プロットが表示されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).