「Probe.jmp」サンプルデータには、5800のウエハについて387の特性を調べたデータが(「Responses」列グループに)記録されています。「ロットID」列と「ウエハ番号」列は、一意にウエハを識別します。工程の変化(「工程」列)の前後で値が違っている特性を調べたいと思います。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Probe.jmp」を開きます。
2. [分析]>[スクリーニング]>[応答のスクリーニング]を選択します。
3. 「Responses」列グループを選択し、[Y, 応答変数]をクリックします。
4. 「工程」を選択し、[X]をクリックします。
5. 「最大対数価値」ボックスに「100」と入力します。
100以上の対数価値(-log10(p-value))は非常に小さなp値に対応しています。「最大対数価値」の値を設定することで、報告される対数価値の値が制限されるため、プロットのスケールを調整できます。
6. [OK]をクリックします。
レポートに、p値の結果を含む表とFDR P値プロット、およびその他2つのプロットが表示されます。
「FDR P値 プロット」には、387個の各検定について、「FDR P値」(FDR調整したp値)と、「p値」(生のp値)がプロットされています。グラフのY軸がこれら2種類のp値を、X軸が「分数順位」を表しています。「p値」は、工程に対するYの通常のp値です。「FDR P値」は、偽発見率(false discovery rate)を制御するように調整されたp値です。「FDR P値」は青、「p値」は赤でプロットされます。「分数順位」は、「FDR P値」を小さい方から順番に(有意性が高い順で)順位付けしています。
グラフにおける青の水平線と赤の右上がりの直線は両方とも、FDR調整したp値に対する5%の閾値を示します。FDR調整p値が青い線を下回る場合、FDRを5%に抑えたなかで有意となっています。同じように、通常のp値が赤い線を下回る場合、FDRを5%に抑えたなかで有意となります。このように、プロットのどちらのp値を見ても、FDR法で有意かどうかを確認できます。
図22.2 「工程」に対する387回の検定の「応答のスクリーニング」レポート
「FDR P値 プロット」から、60%以上の検定で有意差が認められていることがわかります。未調整のp値だと「有意差あり」と判断されるのに、FDR調整したp値だと「有意差なし」となる検定は、赤い線より上で、青い線より下にある赤い点が該当します。そのような検定は少ないことが分かります。
「工程」に対して有意差が認められる特性を見極めるためには、プロット上で該当する点の周りをドラッグし、四角く囲みます。すると、これらの点に対応する行が「結果の表」で選択されます。その第1列を見れば、該当する応答変数の変数名がわかります。
「結果の表」には、「Responses」グループの各応答につきそれぞれ1行、計387個の行があります。応答は第1列(「Y」)に含まれています。各応答変数が「X」列(つまり、「工程」)の効果に照らして検定されています。
残りの列には、「Y」と「X」の検定に関する情報が記録されています。この例で使われている検定は、一元配置の分散分析です。この表には他にも、p値、対数価値、FDR調整したp値、FDR対数価値が含まれています。この表において、各種の統計量を並べ替えたり、行を選択したり、目的の統計量のグラフを作成したりすることができます。
起動ウィンドウで「最大対数価値」を100に設定したため、対数価値とFDR 対数価値の値のうち、p値が1e-100以下である値は「100」として表示されています。また、FDR 対数価値の値が2を超えるセルは、背景に色が付けられます。
レポートと「p値」データテーブルの詳細については、「応答のスクリーニング」レポートを参照してください。