公開日: 09/19/2023

「モデルの比較」レポート

最初の「モデルの比較」レポートには、「予測子」レポートと「適合度指標」レポートが含まれています「予測子」レポートには、すべての応答変数の列、および、すべてのモデルが表示されます。また、ここには、予測式や予測値の列を作成したプラットフォームの名前も表示されます。「適合度指標」レポートには、各モデルの適合度統計量が表示されます。なお、表示される適合度統計量の種類は、応答変数が連続尺度かカテゴリカルかによって異なります。

連続尺度の応答変数に対する適合度指標

R2乗

決定係数（寄与率）。データに欠測値がない場合は、「モデルの比較」レポートにおけるこの値は、元のモデルのR2乗と一致します。欠測値がある場合は、異なった値になります。

RASE

平均平方誤差の平方根（Root Average Squared Error）。次のように計算されます。

– 以下の式において、予測誤差（応答の実測値と予測値の差）の平方和を、SSEとします。

– 標本サイズ（観測値の個数）をnとします。

– RASEは次の式で求められます。

RASE = ここに式を表示

AAE

平均絶対誤差（Average Absolute Error）。

度数

データの度数を含む列。

カテゴリカルな応答変数に対する適合度指標

エントロピーR2乗

あてはめたモデルの対数尤度と、切片だけのモデルの対数尤度を比較している指標です。あてはめたモデルの対数尤度を、切片だけのモデルの対数尤度で割り、その値を1から引いたものです。この指標の範囲は0～1です。

一般化R2乗

この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗（正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗）を一般化したものです。この一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。Nagelkerke（1991）を参照してください。

平均 -Log p

-log(p)の平均。pは、実際に観測された応答水準に対する予測確率です。

RASE

平均平方予測誤差の平方根。応答変数がカテゴリカルの場合は、誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。

平均絶対偏差

誤差の絶対値の平均。応答変数がカテゴリカルの場合は、誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。

誤分類率

予測確率が最も大きい応答の水準が、観測された水準と一致しない割合。

標本サイズ（観測数）。