「計画の評価」レポートの「検出力分析」セクションは、モデルのパラメータに対する検定の検出力を計算します。検出力とは、特定の大きさをもつ効果を検出できる確率のことです。「検出力分析」は、現在の計画によって重要な効果を検出できるかどうかを評価するのに役立ちます。検出力が高ければ高いほど、(係数とRMSEに関する仮定が正しいと想定したときの)効果を検出できる確率が大きくなります。検出力は、実験回数・有意水準・誤差分散などによって決まります。検出力分析は、追加の実験が必要かどうかを判断するのに役立ちます。
次節以降では、次のようなトピックを扱います。
• 検出力分析の概要
• 計画と予測応答
検出力は、「モデル」セクションに一覧されている効果に対して計算されます。検出力が計算される効果には、連続変数・離散数値・カテゴリカル・ブロック・配合因子・共変量が含まれます。また、検出力は、個々のモデルパラメータに対してと、効果全体に対して計算されます。検出力の計算方法については、検出力の計算を参照してください。
検出力とは、真のモデルパラメータが特定の値をもっている場合に、「効果がない」という帰無仮説を棄却できる確率を指します。多くの場合、分析者が興味をもっているのは、モデルパラメータそのものではなく、応答平均における差でしょう。「検出力分析」セクションでは、「係数の予想値」で指定した値に対し、「応答の予想値」が算出されます。これにより、応答平均の差に対応した係数値を知ることができます。
Figure 16.14は、「Design Experiment」フォルダにある「Coffee Data.jmp」データテーブルの計画の「検出力分析」セクションです。「モデル」スクリプトで指定されているモデルは、主効果のみを含むモデルです。
図16.14 「Coffee Data.jmp」の検出力分析
「検出力分析」セクションでは、次のことが可能です。
• 検出したい差を反映する「係数の予想値」を指定できます。それらの値は、セクションの上部にある「係数の予想値」に入力してください。
• 検出したい差を反映する「応答の予想値」を指定できます。「応答の予想値」を指定すると、そこで指定された値をもとに「係数の予想値」が設定されます。「応答の予想値」は、「計画と予測応答」パネルで指定してください。
「検出力分析」の赤い三角ボタンのメニューでは、次のようなことができます。
• 検出力を指定できます。その値をもとに「係数の予想値」が設定されます。指定した検出力を満たす係数が存在しない場合、係数はゼロに設定されます。
• デルタの値を指定できます。その値の半分が「係数の予想値」となります。「係数の予想値」に基づいて検出力が更新されます。
検出力を求めるには、「有意水準」と「RMSEの予想値」も指定してください。これらの値も考慮して、モデルパラメータの検定に対する検出力が計算されます。
有意水準
「効果なし」という帰無仮説が真のときに、その帰無仮説を誤って棄却する確率。検出力の計算結果は、値を入力するとすぐに更新されます。
RMSEの予想値
誤差の標準偏差(誤差分散の平方根)。検出力の計算結果は、値を入力するとすぐに更新されます。
「検出力分析」レポートを最初に開くと、その冒頭部分には「係数の予想値」のデフォルトの値が表示されています(Figure 16.14)。これらのデフォルトの値は、デルタに基づいて求めた値です。詳細オプション > 検出力計算のデルタを設定を参照してください。
メモ: 推定するパラメータ数が実験回数を上回る過飽和計画の場合、係数の予想値は0に設定されます。
Figure 16.15は、「係数の予想値」を指定した後の「検出力分析」レポートの先頭の部分です。これらの値は、検出したい係数の大きさを表します。
図16.15 「Coffee Data.jmp」の「係数の予想値」における入力の例
「項」の列には、モデル項が一覧表示されています。「係数の予想値」には、それらの項に対するパラメータ値が含まれています。「検出力」の列に含まれている値は、「係数の予想値」を真の係数の値としたときの、「係数が0 である」という帰無仮説に対する検定の検出力です。
項
検定される係数に対応しているモデル項の名前。
メモ: 「検出力分析」レポートのモデル項の表示順序は、標準最小2乗法で取得した「パラメータ推定値」レポートでの順序と異なる場合があります。表示順が異なるのは、自由度が2以上の交互作用項がモデルに含まれる場合だけです。
係数の予想値
モデル項に対応している係数の値。この値は、検出力の計算に使われます。また、「計画と予測応答」セクションの「応答の予想値」列の計算にも使われます。「係数の予想値」列に新しい値を入力し、[係数の予想値に基づき変更]ボタンをクリックすると、「検出力」と「応答の予想値」の列が更新されます。
メモ: 「係数の予想値」のデフォルト値は、連続尺度の効果に対しては、1です。カテゴリカルな効果に対しては、1と-1が交互に現れます。赤い三角ボタンのメニューから[詳細オプション]>[検出力計算のデルタを設定]を選択すると、デルタの値を変更できます。デルタの値を変更すると、「係数の予想値」の値が、それらの絶対値がデルタの半分になるように更新されます。詳細については、詳細オプション > 検出力計算のデルタを設定を参照してください。
検出力
指定した「係数の予想値」が真の係数の値である場合に「効果なし」という帰無仮説を棄却できる確率。連続変数の主効果に対しては、低水準と高水準における応答平均の差は、係数に2を掛けた値です。カテゴリカル因子の係数の場合、因子の全水準における(モデルに基づく)応答平均の変化は、係数の予想値の絶対値に2を掛けた値になります。
検出力の計算には、「有意水準」と「RMSEの予想値」も考慮されます。検出力の計算については、1つのパラメータに対する検出力を参照してください。
係数の予想値に基づき変更
「係数の予想値」列に新しい値を入力し、[係数の予想値に基づき変更]ボタンをクリックすると、「検出力」と「応答の予想値」の列が更新されます。
3水準以上のカテゴリカルな効果がモデルに含まれている場合は、[係数の予想値に基づき変更]ボタンの下に次の列が表示されます。
効果
カテゴリカルな効果の名前。
検出力
「効果がない」という帰無仮説に対する検定の検出力。なお、この帰無仮説は、「因子のすべての水準において、応答平均は等しい」、つまり、「効果に関係するすべてのモデルパラメータはゼロである」というものです。検出したい応答平均の差は、「係数の予想値」列によって決められます。「係数の予想値」によって定義された応答平均の差をもとに、検出力が計算されます。「係数の予想値」によって定義された応答平均の差をもとに、検出力が計算されます。
検出力の計算には、「有意水準」と「RMSEの予想値」も考慮されます。検出力の計算については、カテゴリカルな効果に対する検出力を参照してください。
「計画と予測応答」セクションでは、最初に「応答の予想値」列、続いて計画が表示されます。「応答の予想値」列の値は、計画の各設定に対する応答の平均値を表しています。この「応答の予想値」は、「係数の予想値」を使って計算されます。
Figure 16.16の「計画と予測応答」セクションは、Figure 16.15で指定した「係数の予想値」に対応しています。
図16.16 「Coffee Data.jmp」の「応答の予想値」
「応答の予想値」列では、因子設定ごとに値を指定できます。これらの値から、検出したい応答平均の違いを表すことができます。
[応答の予想値に基づき変更]をクリックすると、「係数の予想値」列と「検出力」列が更新されます。
応答の予想値
「係数の予想値」をモデルの係数として使い、計算した応答値。「応答の予想値」のデフォルト値は、「係数の予想値」のデフォルト値に基づいて計算されています。「応答の予想値」列で新しい値を設定し、[応答の予想値に基づき変更]をクリックすると、「係数の予想値」と「検出力」の列が更新されます。
計画の作成
「応答の予想値」の右に続く列は、計画に含まれる実験の因子設定を示しています。
応答の予想値に基づき変更
「応答の予想値」列で新しい値を設定し、[応答の予想値に基づき変更]をクリックすると、「係数の予想値」と「検出力」の列が更新されます。
「Coffee Data.jmp」データテーブルの計画を見てみましょう。ここでは、「濃度」に対する各効果の影響を検出できるかどうかを調べたいとします。「挽き」は2水準のカテゴリカル因子で、「温度」・「時間」・「豆の量」は連続因子、「場所」は3水準のカテゴリカルなブロック因子です。
この例では、「場所」の役割がブロック因子であることは無視します。そして、「場所」が「濃度」に及ぼす効果に興味があるとします。「場所」は、3水準のカテゴリカル因子であるため、「パラメータ」リストでは2つの項(「場所 1」と「場所 2」)で表されます。
ここで知りたいのは、「濃度」の平均における次のような変化を検出できる確率です。
• 「挽き」を「Coarse」(粗い)から「Medium」(中)に変更したときに、平均が0.10だけ変化すること。
• 「温度」、「時間」、「豆の量」を低水準から高水準に変更したときの、平均が0.10だけ変化すること。
• 場所1および場所2が、両方とも、全体平均よりも0.10だけ上回ること。これは、場所3が全体平均よりも0.20下回ることを意味します。
ここでは、有意水準を「0.05」に設定します。また、「濃度」の標準偏差は以前の調査から0.1と分かっているので、それを「RMSEの予想値」として入力します。
値を入力すると、「検出力分析」はFigure 16.17のようになります。ここまでで、「有意水準」・「RMSEの予 想値」・各「係数の予想値」を指定しています。
[係数の予想値に基づき変更]をクリックすると、「応答の予想値」が指定したモデルを反映した値に更新されます。
図16.17 「係数の予想値」セクションの「係数の予想値」に入力を行ったところ
「温度」は、-1と1にコード化された水準を持つ連続因子です。「温度は濃度に影響しない」という帰無仮説の検定に対する検出力について考えてみましょう。Figure 16.17を見ると、「温度」が最小から最大まで変更したときの応答平均の差が0.10である場合、その差を統計的検定で検出できる確率は0.291に過ぎないことが分かります。
次に、3水準のカテゴリカル因子である「場所」について、効果全体の検定に対する検出力を検討してみましょう。つまり、「場所は濃度に影響しない」という帰無仮説の検定に対する検出力について検討してみましょう。この検定は、[分析]>[モデルのあてはめ]を実行したときに「効果の検定」レポートでカテゴリカル因子に対して表示される通常のF検定に該当します。『基本的な回帰モデル』の効果の検定を参照してください。
この検定の検出力は、[係数の予想値に基づき変更]ボタンのすぐ下に表示されます。「係数の予想値」には、「場所 1」と「場所 2」に対してどちらも0.10を指定しました。この指定によって、これら2つの場所における「濃度」の平均は全体平均を0.10上回ると仮定しています。「場所 1」と「場所 2」に対するこの指定は、「場所 3」における「濃度」の平均が、全体平均よりも0.20だけ下回ることを意味しています。Figure 16.17を見ると、検定の検出力が0.888であることがわかります。