応答プロファイルプロット
分類モデルのグラフを描きます。プロット内の点は実際のデータオブザベーションです。プロットされた2つの変数に対し、陰影付きの等高線は、残りのモデル因子の固定値によって決定された予測空間の平面を表しています。この予測は、プラットフォームによって計算される分類決定ルールに基づいています。プロットの上には、固定値のコントロールがあります。スライダまたは数値ボックスを使用して因子の固定値を変更すると、プロットされている変数の予測空間が自動的に更新されます。また、各軸の赤い三角ボタンを使用してプロットの軸を変更すれば、連続尺度の任意の因子を表示できます。
「応答プロファイルプロット」の赤い三角ボタンのメニューには、プロットのグリッド密度を変更するためのオプションがあります。このオプションによって、陰影付き等高線の下にある予測グリッドの細かさが決まります。グリッド密度が大きいほど、決定線は滑らかになります。
モデルの要約
応答列の名前、検証法、およびモデルのあてはめに使用されたカーネル関数のタイプが表示されます。また、「モデルの要約」テーブルには、学習セット、検証セット、テストセットのモデルのあてはめに関する情報が含まれています。各セットに対し、オブザベーション数、誤分類率、サポートベクトルの個数が報告されます。誤分類率は、モデルによって誤分類されたオブザベーションの割合です。この値は、誤分類の数をオブザベーションの合計数で割ることで得られます。
推定値の詳細
モデルで使用されているパラメータの値が表示されます。
あてはめの詳細
学習セットに対して以下の統計量が表示されます(検証セットやテストセットが指定された場合には、それらに対しても同じ統計量が表示されます)。
エントロピーR2乗
現在のモデルと切片だけのモデルの対数尤度を比較する適合度の指標です。エントロピーR2乗の範囲は0~1で、値が1に近いほど、あてはまりが良いことを意味します。エントロピーR2乗を参照してください。
一般化R2乗
この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗(正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗)を一般化したものです。この一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。詳細については、Nagelkerke(1991)を参照してください。値が1に近いほど、適合度が良いことを示します。
平均 -Log p
-log(p)の平均です。pは、実際に生じた応答水準に対する予測確率です。値が小さいほど、適合度が良いことを示します。
RASE
誤差の平均平方根(Root Average Squared Error)。RASEは次のように計算されます。ここで、Sourceは学習セット、検証セット、テストセットを示します。
平均 絶対偏差
誤差の絶対値の平均。誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。値が小さいほど、適合度が良いことを示します。
誤分類率
予測確率が最も大きい応答の水準が、観測された水準と一致しない割合。
注: 「あてはめの詳細」レポートの誤分類率は、「混同行列」レポートの誤分類率と一致しない場合があります。応答がバイナリの場合、「あてはめの詳細」レポートの誤分類率は0.5という確率の限界値を使用しますが、「混同行列」レポートの誤分類率は「確率の閾値」の値を限界値として使用します。
N
オブザベーション数。
混同行列
混同行列は、モデルで指定されている各セット(学習、検証、テスト)について表示されます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。モデルを評価するときは、混同行列や誤分類率を参考にしてください。
混同行列と誤分類率は、「確率の閾値」ボックスの値を限界値として使用します。特に設定を変更しない限り、この値は、プラットフォームによって計算される分類決定ルールに基づきます。この限界値は、「確率の閾値」の横にあるボックスに新しい値を入力するか、またはスライダをドラッグして変更できます。確率の閾値を変更した場合は、混同行列と誤分類率が自動的に更新されます。「モデルの比較」レポートの「確率の閾値」列および「検証 条件付き誤分類率」列も自動的に更新されます。