[多重比較]オプションを選択したときの多重比較の方法のひとつとして、[すべてのペアの比較]があります。すべてのペアを比較する検定として、「すべてのペアの比較 ‐ TukeyのHSD検定」(Hsu 1996; Westfall et al. 2011)と「各ペアの比較 ‐ Studentのt検定」があります。TukeyのHSD検定は、すべてのペアの比較に関して有意水準が保たれています(Hsu, 1996およびWestfall et al., 2011)。一方、Studentのt検定は、1つ1つの比較のみにしか有意水準が保たれていません。Studentのt検定を用いた場合、行った複数の比較のうちのいずれか1つで第1種の誤りを犯す確率は、設定した有意水準をかなり超えてしまいます。
「すべてのペアの比較 - TukeyのHSD検定」レポートの上部には、次のものが表示されます。
分位点
検定の棄却値。TukeyのHSD検定では、分位点はです。ここで、qはスチューデント化された範囲の分位点です。
自由度
検定や信頼区間を算出する際に使用された自由度。
調整方法
棄却値やp値を求めるために使用された計算手法。
Tukey
この方法は、正確な棄却値とp値を算出します。この方法は、推定値の間に相関がなく、かつ、推定値の分散が等しい場合にだけ使えます。バランスが取れているデータ(釣合い型データ)の場合には、この条件を満たしています。
Tukey-Kramer
この方法は、棄却値とp値の近似値を算出します。この近似法は、正確なTukey法が使えないような状況で使用されます。
技術的な詳細については、SAS Institute Inc.(2020b)の「GLM Procedure」章を参照してください。
一方、「各ペアの比較 ‐ Studentのt検定」レポートの上部には、t検定のDF(t検定で使用される自由度)および分位点(棄却値)が表示されます。
TukeyのHSD検定も、Studentのt検定も、水準のすべてのペアを比較します。それぞれのペアに対して、レポートには次の統計量が表示されます。
• 比較する水準
• 差 - 平均間の差の推定値
• 標準誤差 - 差の標準誤差
• t値 - 差がゼロかどうかの検定のt値
• p値(Prob > |t|) - 検定のp値
• 平均差に対する信頼区間の上限および下限
このレポートには、平均差ごとに信頼区間のプロットも表示されます。有意な差が分かるように、色分けされています。
「ペア比較の散布図」は、すべてのペアについて、平均差の信頼区間を描いたグラフです。ディフォグラム(diffogram)や、平均-平均散布図(mean-mean scatterplot)などとも呼ばれています。(Figure 3.57)。有意な差が分かるように、色分けされています。
図には、右上から左下に向けて対角線が描かれています。この対角線は、2つの平均が等しい座標を示します。各線分がペアごとの比較の信頼区間に対応しています。左上から右下に向けて描かれた線分は、平均の差の信頼区間を表しています。線分上の中点の座標は、グループの平均を表しています。これらの点にカーソルを置くと、グループ名と差の推定値を示したツールヒントが呼び出されます。線分が対角線に交わっている場合、統計的な有意差はありません。
ペア比較の散布図には次のオプションがあります。
参照線の表示
散布図上の各点に対して、参照線を表示します。散布図の点が多い場合、これは推奨できません。カーソルを点の上に置くとツールヒントに比較対象が表示されます。点が多い場合にはこちらを推奨いたします。
このオプションを選択すると、有意な差と有意ではない差を文字によって示すレポートが表示されます。このレポートでは、同じ文字でつながっていない水準は、有意差があります。同じ文字でつながっている水準は、有意ではありません。
このオプションはデータテーブルを作成し、効果の水準、接続文字、最小2乗平均、標準誤差、信頼区間の列を保存します。このデータテーブルには、「棒」というスクリプトも保存されます。このスクリプトは、最小2乗平均を棒グラフとして描き、それに信頼区間のバーを重ねたグラフを作成します。棒グラフにおいて、水準は最小2乗平均の降順に並べられます。
「Lipid Data.jmp」サンプルデータを例に見てみましょう。平均身長において、性別(男性と女性)、年齢(25歳と35歳)、喫煙状況(非喫煙者と元喫煙者。それぞれ「喫煙歴」が「no」と「quit」)の組み合わせで構成される群による「コレステロール」の違いを調べてみます。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Lipid Data.jmp」を開きます。
2. [分析]>[モデルのあてはめ]を選択します。
3. 「コレステロール」を選択し、[Y]をクリックします。
4. [性別]、[年齢]、[身長]、[喫煙歴]を選択して、[追加]をクリックします。
5. [実行]をクリックします。
6. 「応答 コレステロール」の赤い三角ボタンをクリックし、[推定値]>[多重比較]を選択します。
7. 「推定値の種類」リストから[ユーザ定義の推定値]をクリックします。
8. 「性別の水準を選択」リストから[female](これはデフォルトで選択されているはずです)と[male]を選択します。
9. 「喫煙歴を選択」リストから、[no]と[quit]を選択します。
10. [年齢]リストで、最初の2つの行にぞれぞれ「25」、「35」を入力します。
[身長]というタイトルのリストには何も入力しないでください。[身長]の値が入力されていないので、多重比較レポートでは[身長]列の平均値が使用されます。
11. [推定値の追加]をクリックします。
指定したレベルで可能なすべての組み合わせが「比較の推定値」レポートに表示されます。
12. 「比較の選択」リストで、[すべてのペアの比較 - TukeyのHSD検定]を選択します。
これで、ウィンドウがFigure 3.56のようになっていることを確認します。
図3.56 ユーザ定義の推定値を指定
13. [OK]をクリックします。
「すべてのペアの平均差」レポートを見ると、28個のペアの比較の中で2つが有意になっています。「ペア比較の散布図」では、これらの比較の信頼区間が赤色になっています。いずれかの点の上にカーソルを置いて、その点がどのペアの比較を表しているかを決定することができます。ツールヒントには、比較の2つの水準の間の差も含まれています。2つの赤い点は、35歳の元喫煙者と25歳の非喫煙者を男女について比較している点を表しています。
図3.57 ユーザ定義の推定値のペア比較の散布図