「分散分析」レポートでは、標本の合計変動が2つの要素に分かれています。そのうち、平均平方の比はF値と呼ばれます。F値の確率が小さいときは、そのモデルがYの全体平均よりも統計的に良いあてはめであることを意味します。
メモ: ブロック列を指定した場合は、「分散分析」レポートにブロック変数も表示されます。
要因
変動の3つの要因(モデル要因、「誤差」、「全体(修正済み)」)。
自由度
各変動因の自由度(DF)。
– 「全体(修正済み)」の自由度は、N - 1で求められます。Nは分析に使用された標本サイズ(観測値の個数)です。
– X変数の水準数をkとすると、モデルの自由度はk - 1になります。
「誤差」の自由度は、「全体(修正済み)」とモデルの自由度の差(N - k)です。
平方和
変動の要因ごとの平方和(SS;Sum of Squares)。
– 「全体(修正済み)」の平方和は、各応答から全体平均までの距離の平方和です。「全体(修正済み)」の平方和は、基本モデルの平方和として、その他のモデルとの比較に使用されます。
– 「誤差」(残差)の平方和は、各点からそれぞれのグループ平均までの距離の平方和です。この平方和は、分散分析モデルをあてはめた後に残った、説明できない部分の平方和です。
全体平方和から誤差平方和を引いたものがモデルの平方和です。全変動のうちモデルによって説明されている部分を表します。
平均平方
平方和を関連する自由度で割った値。
– モデルの平均平方は、グループ平均が等しいという仮説のもとでの誤差分散推定値にもなっています。
– 「誤差」の平均平方は、モデルの平均平方とは無関係に推定した誤差の分散で、モデルの仮説による制約を受けません。
F値
モデルの平均平方を誤差の平均平方(MSE)で割ったもの。「すべてのグループの母平均は等しい(真のモデルにおいて母平均には差がない)」という仮説が真のとき、誤差とモデルの平均平方が両方とも誤差分散の推定値となり、その比はF分布に従います。分散分析モデルをあてはめた結果、誤差の変動が全体の変動よりも有意に減少した場合、「F値」は期待値よりも大きくなります。
p値(Prob>F)
すべてのグループの母平均の間に差がないという仮定のもとで、現在のF値よりも大きなF値を得る確率。p値が0.05以下だと、グループ平均に有意差がある証拠だとみなされます。