「応答のスクリーニング」プラットフォームの[ロバスト]オプションを使用して、多数の外れ値がある応答を分析してみましょう。外れ値は従来の検定の誤差分散を大きくし、効果が有意になりにくくなる場合があるため、ロバストなあてはめを使用することが重要になります。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Drosophila Aging.jmp」を開きます。
2. [分析]>[スクリーニング]>[応答のスクリーニング]を選択します。
3. 連続尺度の列をすべて選択して、[Y, 応答変数]をクリックします。
4. 「遺伝子型」を選択し、[X]をクリックします。
5. 「詳細オプション」の横にあるグレーの三角ボタンをクリックします。
6. [ロバスト]チェックボックスをオンにします。
7. [OK]をクリックします。
図24.12 「Drosophila Aging」データの「ロバスト FDR P値 プロット」
ロバスト推定の未調整p値を用いた場合、いくつかの検定で有意差が認められることが、0.05を下回る赤い点の存在で示されています。ただし、ロバスト推定のFDR調整p値を見ると、有意差が認められる検定は2つだけです。これらの2点は、「FDR 対数価値」(FDR補正の対数価値)の値を表示するプロットで、もっと簡単に見分けることができます。
8. 「応答のスクリーニング」のプロットタイトルのリストをクリックし、[ロバスト FDR 対数価値 By 効果の大きさ]を選択します。
9. 「ロバスト FDR 対数価値」の値が2を超える点をクリックし、右クリックして[行ラベル]を選択します。
図24.13 「Drosophila Aging」データの「ロバスト FDR 対数価値 By 効果の大きさ」
2の位置で引かれた赤い線より上にある点は、有意確率が0.01(-log10(0.01) = 2)を下回っています。だいたい1.3のあたりで横に引いた線が、有意水準0.05に対応します。
10. 「応答のスクリーニング」のプロットタイトルのリストをクリックし、[ロバスト FDR 対数価値 By FDR 対数価値]を選択します。
図24.14 「Drosophila Aging」データの「ロバスト FDR 対数価値 By FDR 対数価値」
ロバストな検定が通常の検定とまったく同じであれば、Figure 24.14の点は、対角線上に沿ってプロットされます。図で丸く囲まれている点は、「ロバスト 対数価値」値が「対数価値」を上回っており、対角線付近に位置していません。
11. プロット上でこの点をクリックして選択します。
12. 「結果の表」でこの点に該当する行を見つけます。
応答「log2in_CG8237」の「p値」が0.9568で、「ロバスト p値」が0.0176であることがわかります。
13. 「応答のスクリーニング」の赤い三角ボタンをクリックし、[選択した項目の二変量関係]を選択します。
「選択した項目の二変量関係」レポートに、応答「log2in_CG8237」の一元配置分析の結果が表示されます。プロットには、「遺伝子型」OREについて、2つの外れ値が表示されます(Figure 24.15)。これらの外れ値が、ロバストな検定と通常の検定の結果が大きく異なっていた理由です。通常の検定では、外れ値により誤差分散が過大に推定され、有意な効果を検出しにくくなっています。一方、ロバストな検定では、これらの外れ値に小さな重みを与えるので、誤差分散の推定に外れ値の与える影響が小さくなっています。
図24.15 log2in_CG8237の一元配置分析