起動ウィンドウで[OK]をクリックすると、「単純Bayes」レポートが表示されます。デフォルトでは、「単純Bayes」レポートには、「あてはめの詳細」、「<応答列名>」、「混同行列」、「ROC曲線」のレポートが含まれています。
図8.7 「単純Bayes」レポート
「あてはめの詳細」レポートには、学習セットから計算された、モデルのさまざまな適合度指標が表示されます。検証セットと検証セットを指定した場合は、それらのセットから計算された適合度指標も表示されます。「指標」列には、異なる適合度統計量の名称が含まれて射ます。「定義」列には、それらの各指標の計算式が表示されます。カテゴリカルな応答変数に対する適合度指標を参照してください。デフォルトでは、「単純Bayes」レポートウィンドウの「あてはめの詳細」レポートは閉じています。
応答変数の各列に対して、単純Bayesモデルによる分類に関する統計量が、学習セット・検証セット・テストセットごとに表示されます。検証セットやテストセットに対する結果は、それらのデータが指定された場合にのみ計算されます。この表には以下の列があります。
度数
該当する各データ(学習セット・検証セット・テストセット)に含まれる標本サイズ(オブザベーション数)。
誤分類率
該当する各データにおいて、モデルによって誤分類されたオブザベーションの割合。誤分類されている度数を、全度数で割ったものです。
誤分類
該当する各データにおいて、モデルによって誤分類されたオブザベーションの度数。
「混同行列」レポートには、学習セットの混同行列が表示されます。検証セットとテストセットを指定した場合は、その混同行列も表示されます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。
このレポートには、学習セットの受診者動作特性(ROC; Receiver Operating Characteristic)曲線、および指定されていれば検証セットと検定セットの受診者動作特性(ROC)曲線が表示されます。ROC曲線は、応答変数の水準を正確に分類する性能示したグラフです。曲線が対角線から離れるほど、予測能力が高いことを意味しています。ROC曲線の概要については、『基本的な統計分析』のROC曲線を参照してください。
応答変数が2水準の場合、ROC曲線は応答変数の第1水準に対するROC曲線のみを表示します。応答変数の水準が3水準以上である場合、応答変数の各水準ごとにROC曲線が描かれます。ある特定の水準に対するROC曲線は、その水準が正確に分類されるかどうかを示すROC曲線になっています。ROC曲線の詳細は、ROC曲線を参照してください。