起動ウィンドウで[OK]をクリックすると、「単純Bayes」レポートが表示されます。「単純Bayes」レポートにはデフォルトで、「あてはめの詳細」・「<応答列名>」・「混同行列」・「ROC曲線」、「リフトチャート」のレポートが含まれます。
図8.7 「単純Bayes」レポート
「あてはめの詳細」レポートには、学習セットから計算された、モデルのさまざまな適合度指標が表示されます。検証セットやテストセットを指定した場合は、それらのセットから計算された適合度指標も表示されます。「指標」列には、異なる適合度統計量の名前が含まれています。「定義」列には、それらの各指標の計算式が表示されます。カテゴリカルな応答変数に対する適合度指標を参照してください。デフォルトでは、「単純Bayes」レポートウィンドウの「あてはめの詳細」レポートは閉じています。
応答変数の各列に対して、単純Bayesモデルによる分類に関する統計量が、学習セット・検証セット・テストセットごとに表示されます。検証セットやテストセットに対する結果は、それらのデータが指定された場合にのみ計算されます。この表には以下の列があります。
度数
該当する各データ(学習セット・検証セット・テストセット)に含まれる標本サイズ(観測数)。
誤分類率
該当する各データにおいて、モデルによって誤分類されたデータ行の割合。誤分類されている度数を、全度数で割ったものです。
誤分類
該当する各データにおいて、モデルによって誤分類されたデータ行データの度数。
「混同行列」レポートには、学習セットの混同行列と混同率行列が表示されます。検証セットとテストセットを指定した場合は、その混同行列と混同率行列も表示されます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。混同率行列は、混同行列の度数を行合計で割ったものです。
このレポートには、学習セットの受診者動作特性曲線(ROC曲線; Receiver Operating Characteristic curve)、および指定されていれば検証セットとテストセットのROC曲線が表示されます。ROC曲線は、あてはめられたモデルが応答変数の水準を正確に分類する予測能力を示したグラフです。ROC曲線が対角線から離れているほど、適合度が良いことを表します。ROC曲線については、『基本的な統計分析』のROC曲線で紹介されています。
ROC曲線の詳細は、ROC曲線を参照してください。