「モデルの比較」の赤い三角ボタンのメニューにあるオプションは、応答が連続尺度であるかカテゴリカルであるかによって異なります。
応答が連続尺度である場合、「モデルの比較」の赤い三角ボタンのメニューには以下のオプションが含まれます。
モデル平均化
モデル全体にわたる予測値の算術平均を含む新しい列を作成します。
予測値と実測値のプロット
予測値に対して実測値をプロットした散布図の表示/非表示を切り替えます。複数のモデルの結果が、重ね合わされてプロットされます。
行番号と残差のプロット
行番号に対して残差をプロットした散布図の表示/非表示を切り替えます。複数のモデルの結果が、重ね合わされてプロットされます。
プロファイル
予測式のプロファイルの表示/非表示を切り替えます。プロファイルはモデルごとに表示されます。
応答がカテゴリカルな場合、「モデルの比較」の赤い三角ボタンのメニューには以下オプションが含まれます。
モデル平均化
モデル全体にわたる予測確率の算術平均を含む新しい列を作成します。
ROC曲線
応答変数の各水準に対するROC曲線の表示/非表示を切り替えます。複数のモデルにおけるROC曲線が、重ね合わされてプロットされます。
AUCの比較
AUCの比較の表示/非表示を切り替えます。ここでのAUCは、ROC曲線の曲線下面積(Area Under Curve)です。AUCは、そのモデルの適合度を表します。AUCが1なら、あてはまりが完全なことを意味します。
レポートには次の情報も表示されます。
– 各AUCの標準誤差と信頼区間
– AUCのペアごとの比較。差、および、その標準誤差・信頼区間・仮説検定
– 「すべてのAUCが等しい」という帰無仮説に対する全体的な仮説検定
リフトチャート
応答変数の各水準に対するリフト曲線の表示/非表示を切り替えます。複数のモデルにおける曲線が、重ね合わされてプロットされます。
累積ゲイン曲線
応答変数の各水準に対する累積ゲイン曲線の表示/非表示を切り替えます。累積ゲイン曲線は、予測確率でデータを降順に並び替えて、すべてのデータでの割合をX軸に、該当の応答水準での割合をY軸にプロットしたものです。予測が完璧なモデルでは、累積ゲイン曲線は、X軸の値がデータ全体における応答水準の割合になった時点で、Y軸の値が1.0に達します。複数のモデルにおける曲線が、重ね合わされてプロットされます。
混同行列
各モデルに対する混同行列の表示/非表示を切り替えます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。度数と割合の混同行列が表示されます。グループ変数の水準ごとに個別に混同行列が作成されます。
応答に「利益行列」の列プロパティが割り当てられている場合は、混同行列の右側に「決定行列 度数」と「決定行列 割合」の行列が表示されます。これらの行列の詳細については、「パーティション」プラットフォームの別例を参照してください。
プロファイル
予測式のプロファイルの表示/非表示を切り替えます。プロファイルはモデルごとに表示されます。
分類の閾値
(2値のカテゴリカルな応答変数でのみ使用可能。)学習セット・検証セット・テストセットが指定されている場合に、それらに対する「分類の閾値」レポートの表示と非表示を切り替えます。各レポートには、それぞれのモデルの予測確率の分布を示すグラフ、各モデルの混同行列、モデルのあてはめを比較できる分類グラフ、および分類精度の指標のグラフが含まれています。「分類の閾値」レポートを参照してください。
• ROC曲線
• リフトチャート