「PValues」データテーブルには、選択した統計手法や、Y変数とX変数の尺度の組み合わせに応じて、いくつかの統計量が出力されます。このデータテーブルには、以下のような列があります。
Y
指定した応答列。
X
指定した因子列。
Count
検定に使用された行の数、または、[度数]変数または[重み]変数の和。
PValue
X変数とY変数の関係に対する有意性検定のp値。「二変量の関係」の統計量の詳細については、『基本的な統計分析』の「二変量の関係」プラットフォームの概要を参照してください。
LogWorth
-log10(p値)。p値のグラフのスケールが対数価値(LogWorth)に変換されると、解釈がしやすくなります。2を上回る値は、有意水準0.01で有意となります(-log10(0.01) = 2)。
FDR PValue
FDR(False Discovery Rate; 偽発見率)を制御するように調整されたp値。Benjamini‐Hochberg法で計算されています。FDRは、検定の多重性を考慮して、生のp値を調整したものです。[グループ変数]が指定されていない場合は、データテーブルに表示されるすべての検定を考慮して、多重性の調整が行われます。[グループ変数]が指定されている場合は、グループ変数の水準ごとに多重性の調整が行われます。FDRについては、Benjamini and Hochberg(1995)を参照してください。また、FDR(False Discovery Rate; 偽発見率)を参照してください。
FDR LogWorth
-log10(FDR調整p値)。これは、検定の有意性をグラフに表すのに適している統計量です。p値が小さいと、この値は大きくなります。FDR LogWorthの値が2より大きい(p値が0.01より小さい)セルは、背景色に色が付けられます。
Effect Size
Xの水準や値によって応答の値がどの程度異なるかを示します。Effect Size(効果の大きさ、効果量)は、次のように計算される、尺度不変な指標です。
– Yが連続尺度の場合、効果の大きさは、モデル平方和を標本サイズで割ったものの平方根を、応答変数の標準偏差の推定値で割った値です。応答変数の標準偏差の推定値は、四分位範囲(IQR)がゼロでなく、IQR > 範囲/20の場合、IQR/1.3489795で求められます。それ以外の場合は、標本標準偏差が使用されます。
– YがカテゴリカルでXが連続尺度の場合、効果の大きさは、モデル全体のカイ2乗検定統計量を標本サイズで割ったものの平方根です。
– YとXが両方ともカテゴリカルな場合、効果の大きさは、Pearsonのカイ2乗値を標本サイズで割ったものの平方根です。
Rank Fraction
対数価値の順位を、検定の総回数で割ったもの。検定の総回数をmとした場合、対数価値が最大のときに、「Rank Fraction」は1/mとなります。また、対数価値が最小のときに、「Rank Fraction」は1となります。この「RankFraction」は、対数価値では大きい順ですが、p値では小さい順に対応しています。「Rank Fraction」は、「FDR PValue Plot」の横軸に使われます。
Ymean
Yの平均。
SSE
Yが連続変数の場合に表示されます。誤差の平方和。
DFE
Yが連続変数の場合に表示されます。誤差の自由度。
MSE
Yが連続変数の場合に表示されます。誤差の平均平方。
F Ratio
Yが連続変数の場合に表示されます。分散分析または回帰分析のF値。
RSquare
Yが連続変数の場合に表示されます。R2乗値(重相関係数の2乗、寄与率、決定係数)。モデルで説明される変動の割合を表します。
Intercept
YとXが両方とも連続変数である場合に表示されます。対応するY変数とX変数のペアに関連する回帰モデルの切片。
Slope
YとXが両方とも連続変数である場合に表示されます。対応するY変数とX変数のペアに関連する回帰モデルの傾き。
DF
YとXが両方ともカテゴリカルな場合に表示されます。カイ2乗検定の自由度。
LR Chisq
YとXが両方ともカテゴリカルな場合に表示されます。尤度比カイ2乗統計量。