「モデル全体の検定」レポートには、「データ全体で応答確率が一定である」と仮定したときよりも、現在のモデルがどれぐらい良くあてはまっているかが示されます。このレポートは、連続尺度の応答に対する分散分析表に相当します。ここでは、モデルがデータを説明しているかどうかが、カイ2乗近似の尤度比検定で検定されます。
あてはめられたモデルから計算される確率の自然対数を取り、その合計の符号を逆にしたものが「(-1)*対数尤度」です。カテゴリカルな応答における「(-1)*対数尤度」は、連続尺度の応答における平方和に相当します。現在のモデルの「(-1)*対数尤度」から、全体で確率が一定であると仮定したモデルの「(-1)*対数尤度」を引いた差を2倍したものが、尤度比検定のカイ2乗統計量になります。この尤度比検定は、「X変数が応答変数に対して、まったく効果を持たない」という帰無仮説を検定します。
「R2乗(U)」(R2)は0~1の値を取ります。モデルのあてはまりがよい場合はR2値が高い値になりますが、カテゴリカルなモデルでは高い値になることはほとんどありません。
「モデル全体の検定」レポートには、次の情報が表示されます。
モデル
(「要因」ともいう)
– 「縮小」モデルは、切片だけを含むモデルです。
– 「完全」モデルは、すべての効果と切片を含むモデルです。
– 「差」は、完全モデルと縮小モデルの対数尤度の差です。
自由度
モデルに関係する自由度。
(-1)*対数尤度
データの変動やばらつきを表す指標。不確定性ともいう。
「完全」(完全モデル)は、あてはめたモデルの「(-1)*対数尤度」(不確定性)です。ロジスティック回帰では、線形式をロジスティック変換して、確率が予測されます。この予測された確率から計算される不確定性が最小になるように、モデルがあてはめられます。
「縮小」(縮小モデル)は、応答確率が全体で一定であると仮定し、応答全体の割合で応答確率を推定したときの「(-1)*対数尤度」(不確定性)です。これは、モデルに効果がないときの不確定性を表します。
上の2つの「(-1)*対数尤度」の差は、モデルをあてはめた結果生じた対数尤度の減少で、それに2を掛けた値が尤度比カイ2乗です。
『基本的な回帰モデル』の尤度・AICc・BICを参照してください。
カイ2乗
尤度比カイ2乗。「応答確率が標本全体で一定であるとしたときよりも、モデルの適合度は良いわけではない」という帰無仮説を検定する値です。これは「差」の「(-1)*対数尤度」を、2倍したものです。つまり、あてはめたモデルの対数尤度から、標本全体で応答確率が一定であるとしたモデルの対数尤度を引いた差を、2倍したものです。「ロジスティック」プラットフォームの統計的詳細を参照してください。
p値(Prob>ChiSq)
カイ2乗検定の観測有意確率(p値)。これは、「応答変数の各水準が生じる確率は、説明変数によって左右されない」という仮定のもとで、現在のカイ2乗値よりも大きいカイ2乗値を得る確率です。通常、p値が0.05より小さいとモデルが有意だと考えられます。
R2乗(U)
不確定性のうち、あてはめたモデルに起因する部分。負の対数尤度の「差」を「縮小」で割った値で定義される。R2乗(U)の値が1である場合、イベントが発生する予測確率が1に等しい(予測確率に不確定性はない)ということを意味します。ロジスティックモデルの場合、予測確率が確定的であることはほとんどないため、「R2乗(U)」の値は小さくなるのが普通です。「ロジスティック」プラットフォームの統計的詳細を参照してください。
メモ: 上式によって計算された「R2乗(U)」は、「McFaddenの疑似R2乗」と呼ばれることもあります。
AICc
修正済み赤池情報量規準。『基本的な回帰モデル』の尤度・AICc・BICを参照してください。
BIC
ベイズ情報量規準。『基本的な回帰モデル』の尤度・AICc・BICを参照してください。
オブザベーション
(または重みの合計)計算に使用したすべてのデータの標本サイズ。ただし、重み変数を指定した場合は、重みの合計です。