「学習」・「検証」・「テスト」の適合度統計量

予測モデルおよび発展的なモデル > モデルのスクリーニング > 「モデルのスクリーニング」レポート > 「学習」・「検証」・「テスト」の適合度統計量

公開日: 11/25/2021

「学習」・「検証」・「テスト」の適合度統計量

指定した各モデルについて、各セット対して、それぞれ適合度統計量が計算されます。たとえば、「学習」だけ、「学習」・「検証」、または、「学習」・「検証」・「テスト」のセットです。各レポートには、それぞれ以下の列を含む表があります。

手法

モデルのあてはめに使用された手法の名前。

各セット内の標本サイズ（観測数）。

重みの合計

重みの合計。

R2乗

（連続尺度の応答にのみ使用可能。）あてはめられたモデルのR2乗値。

エントロピーR2乗

（応答がカテゴリカルな場合にのみ使用可能。）現在のモデルと切片だけのモデルの対数尤度を比較する適合度の指標です。エントロピーR2乗の範囲は0～1で、値が1に近いほど、あてはまりが良いことを意味します。エントロピーR2乗を参照してください。

誤分類率

（応答がカテゴリカルな場合にのみ使用可能。）モデルによって誤分類されたデータの割合。値が小さいほど、適合度が良いことを示します。

メモ: この表での誤分類率は、確率に対する閾値として常に0.5を使って計算されます。

AUC

（応答がカテゴリカルな場合にのみ使用可能。）ROC曲線の曲線下面積。値が1に近いほど、適合度が良いことを示します。

RASE

平均2乗誤差平方根（Root Average Squared Error）。RASEは次のように計算されます。ここで、Sourceは学習セット・検証セット・テストセットを示します。

Equation shown here

一般化R2乗

（応答がカテゴリカルな場合にのみ使用可能。）この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗（正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗）を一般化したものです。この一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。Nagelkerke（1991）を参照してください。

分割

（起動ウィンドウで［K分割交差検証］または［入れ子式交差検証］オプションを指定した場合にのみ使用可能。）該当のモデルのあてはめに用いられた分割（外側分割）。

内側分割

（起動ウィンドウで［入れ子式交差検証］オプションを指定した場合にのみ使用可能。）該当のモデルのあてはめに用いられた内側分割。

試行

（起動ウィンドウで［K分割交差検］オプションを指定した場合にのみ使用可能。）該当のモデルのあてはめでの試行回数。

各表の下にはそれぞれ以下のオプションがあります。

パレート優位を選択

モデルのあてはめ条件に関して、他のすべてのモデル以上に良い各モデルを選択する。応答変数が連続尺度である場合は、パレート優位を決定するときに「R2乗」と「度数合計」が考慮されます。応答変数がカテゴリカルである場合は、パレート優位を決定するときに「エントロピーR2乗」・「誤分類率」・「AUC」・「度数合計」が考慮されます。

選択したモデルの実行

選択されているモデルを実行する。

注意: 何らかの形でK分割交差検証が指定された場合、［選択したモデルの実行］は、最後の分割によって決定される学習セットと検証セットに関して、選択されたモデルを実行します。

選択したモデルのスクリプトを保存

選択されているモデルのスクリプトをスクリプトウィンドウに保存する。

注意: 何らかの形でK分割交差検証が指定された場合、［選択したモデルのスクリプトを保存］は、最後の分割によって決定される学習セットと検証セットに関して、選択されたモデルのスクリプトを保存します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).