「モデルのスクリーニング」プラットフォームでは、指定した各モデルについて、各セット対して、それぞれ適合度統計量が計算されます。たとえば、「学習」だけ、「学習」・「検証」、または、「学習」・「検証」・「テスト」のセットです。各レポートには、それぞれ以下の列を含む表があります。
手法
モデルのあてはめに使用された手法の名前。
N
各セット内の標本サイズ(観測数)。
重みの合計
重みの合計。
R2乗
(連続尺度の応答のみ。)あてはめられたモデルのR2乗値。
エントロピーR2乗
(応答がカテゴリカルな場合のみ。)現在のモデルと切片だけのモデルの対数尤度を比較する適合度の指標です。エントロピーR2乗の範囲は0~1で、値が1に近いほど、あてはまりが良いことを意味します。エントロピーR2乗を参照してください。
誤分類率
(応答がカテゴリカルな場合のみ。)モデルによって誤分類されたデータの割合。値が小さいほど、適合度が良いことを示します。
メモ: この表での誤分類率は、確率に対する閾値として常に0.5を使って計算されます。
AUC
(応答がカテゴリカルな場合のみ。)ROC曲線の曲線下面積。値が1に近いほど、適合度が良いことを示します。
RASE
平均平方誤差の平方根(Root Average Squared Error)。RASEは次のように計算されます。ここで、Sourceは学習セット・検証セット・テストセットを示します。
一般化R2乗
(応答がカテゴリカルな場合のみ。)この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗(正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗)を一般化したものです。この一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。Nagelkerke(1991)を参照してください。
分割
(起動ウィンドウで[K分割交差検証]または[入れ子式交差検証]オプションを指定した場合のみ。)該当のモデルのあてはめに用いられた分割(外側分割)。
内側分割
(起動ウィンドウで[入れ子式交差検証]オプションを指定した場合のみ。)該当のモデルのあてはめに用いられた内側分割。
試行
(起動ウィンドウで[K分割交差検]オプションを指定した場合のみ。)該当のモデルのあてはめでの試行回数。
各表の下にはそれぞれ以下のオプションがあります。
パレート優位を選択
モデルのあてはめ条件に関して、他のすべてのモデル以上に良い各モデルを選択する。応答変数が連続尺度である場合は、パレート優位を決定するときに「R2乗」と「度数合計」が考慮されます。応答変数がカテゴリカルである場合は、パレート優位を決定するときに「エントロピーR2乗」・「誤分類率」・「AUC」・「度数合計」が考慮されます。
選択したモデルの実行
選択した各行で指定されている個々のモデルを実行する。
選択したモデルのスクリプトを保存
選択されているモデルのスクリプトをスクリプトウィンドウに保存する。