「スコアの要約」レポートは、判別スコアを要約したものです。図5.12の表は、実測値と予測値との2元表になっています。すべてのデータ行が正しく判別されたとき、この表の非対角要素における度数が0になります。
図5.12 「Iris.jmp」のスコアの要約
「スコアの要約」レポートには、次のような情報が表示されます。
列
[ステップワイズ変数選択]を使用してモデルを作成した場合、モデルに追加された列がリストされます(図5.6)。
ソース
検証セットを使用していない場合、すべてのデータ行が学習セットに使われます。検証セットを使用している場合は、学習セットと検証セットの結果が表示されます。また、テストセットも用いた場合は、学習セット、検証セット、テストセットの結果が表示されます。
誤判別の数
指定のセットで誤判別されたデータ行の数。
誤判別の割合(%)
指定のセットで誤判別されたデータ行の割合。
エントロピーR2乗
適合度の指標。値が大きいほど、あてはまりが良いことを示します。エントロピーR2乗が1の場合、すべての分類が正しく行われたことを意味します。一般に、判別分析モデルによる分類は100%的中することはなく、エントロピーR2乗の値は小さくなる傾向にあります。
エントロピーR2乗を参照してください。
注: 「エントロピーR2乗」は負の値である場合もあります。
-2対数尤度
負の対数尤度を2倍したもの。モデルに基づいて、学習セットから算出されます。値が大きいほど、あてはまりが良いことを示します。学習セットに対してのみ計算されます。『基本的な回帰モデル』を参照してください。
混同行列
この行列は、分類変数Xの各水準について、実測値と予測値との2元表となっています。JMP Proで検証セットやテストセットを使用した場合、それらのセットに対しても混同行列が表示されます。標準版JMPでは、データテーブルで除外した行を使用している場合に、除外した行が検証セットとみなされ、学習セットと検証セットに対する混同行列が表示されます。標準版JMPとJMP Proの違いを参照してください。
エントロピーR2乗は適合度の指標です。検証セットやテストセットを使用している場合には、学習セットだけではなく、検証セットやテストセットに対してもエントロピーR2乗が計算されます。
学習セットに対するエントロピーR2乗は次のように求められます。
• 学習セットだけに対して、判別分析モデルがあてはめられます。
• モデルに基づいた予測確率が求められます。
• これらの予測確率を使って、学習セットの尤度が求められます。これを、Likelihood_FullTrainingとします。
• 学習セットだけに対して、減少モデル(共変量を1つもたない判別分析モデル)があてはめられます。
• 減少モデルから求められる、X水準に対する予測確率を使って、学習セットの尤度が計算されます。これを、Likelihood_ReducedTrainingとします。
• 学習セットのエントロピーR2乗は次のように求められます。
検証セットに対するエントロピーR2乗は次のように求められます。
• 学習セットだけに対して、判別分析モデルがあてはめられます。
• 学習セットだけから推定されたモデルに基づき、検証セットで予測確率が求められます。
• これらの予測確率を使って、検証セットの尤度が求められます。これを、Likelihood_FullValidationとします。
• 学習セットだけに対して、減少モデル(共変量を1つもたない判別分析モデル)があてはめられます。
• 減少モデルから求められる、X水準に対する予測確率を使って、検証セットの尤度が計算されます。これを、Likelihood_ReducedValidationとします。
• 検証のエントロピーR2乗は次のように求められます。
テストセットのエントロピーR2乗は、検証セットのエントロピーR2乗と同様の方法で求められます。