実験計画(DOE) > カスタム計画の例 > スクリーニング計画 > 過飽和スクリーニング計画
公開日: 11/25/2021

過飽和スクリーニング計画

応答に影響している因子を探し出すには、最初にブレインストーミングなどで意見を出し合いながら数十の因子を候補として挙げるのが一般的でしょう。過飽和計画(supersaturated design)という実験計画を使えば、データに基づき、それらの多数の候補の因子から重要な因子を絞り込むことができます。

飽和計画(saturated design)とは、実験回数と、モデルに含まれた項の個数が等しい計画を指します。過飽和計画は、名前からわかるとおり、モデル項の個数が実験回数より多い計画を指します(Lin, 1993)。過飽和計画を使えば、何十個もの因子をその半分以下の実験回数で検討することができます。調べたい因子の数は多いのに、1つの実験に膨大な費用がかかってしまう状況で、因子のスクリーニングを行いたい場合に過飽和計画は役立ちます。

または、従来の過飽和計画よりも効果的に有効な効果を特定したい場合は、群直交過飽和計画を用いることを検討してください。詳細については、群直交過飽和計画を参照してください。

過飽和計画の制約

過飽和計画には欠点があります。

有効な因子(active factor; 実際に応答に対して影響をもつ因子)の個数が実験回数の半分以上である場合、それらの因子の影響を検出できなくなる可能性が高くなります。一般に、実験回数は、有効な因子の個数の4倍以上である必要があります。つまり、有効な因子が5つあると考えられるときは、少なくとも20回の実験が必要です。

過飽和計画のデータを自動的に処理する統計分析は、まだ考案されていません。JMPでは、変数増加法によるステップワイズ回帰を使えば、ある程度、穏当な統計分析ができます。また、「スクリーニング」プラットフォーム([実験計画(DOE)] >[古典的な計画]>[2水準スクリーニング]>[2水準スクリーニングのあてはめ])を使えば、より合理的な枠組みで簡単に分析できます。

過飽和計画の作成

例として、12因子、8実験の過飽和計画を作成してみましょう。過飽和計画を作成するには、すべてのモデル項(切片を除く)の「推定」を[可能な場合のみ]に設定します。

メモ: ここで取り上げている例は、過飽和計画を説明するためだけのものです。どのような過飽和計画でも、実験回数は14回以上にすべきです。また、この例では有効な因子が4つ以上ある場合には、8回だけの実験で実験結果を解釈することは非常に難しいです。過飽和計画の制約を参照してください。

1. [実験計画(DOE)]>[カスタム計画]を選択します。

2. 「N個の因子を追加」の右側のボックスに「12」と入力します。

3. [因子の追加]>[連続変数]を選択します。

4. [続行]をクリックします。

5. 「モデル」アウトラインで、切片以外のすべての効果を選択します。

6. いずれかの効果の横の[必須]をクリックして、[可能な場合のみ]に変更します。

いくつかのモデル効果を[可能な場合のみ]に設定すると、Bayes流のD-最適化基準が使われるようになります。

図5.12 因子、モデル、実験の回数 

Factors, Model, and Number of Runs

7. 「交絡項」アウトラインで、すべての項を選択して[項目の削除]をクリックします。

これにより、「相関のカラーマップ」には主効果だけが表示されます。「相関のカラーマップ」は、計画が作成された後に作成されます。

8. 「カスタム計画」の赤い三角ボタンをクリックし、メニューから[応答のシミュレート]を選択します。

これにより、計画のデータテーブルにおける応答列に乱数が生成されます。このシミュレーションされた応答を使って、分析方法を確認します。

「実験の回数」はデフォルトの8のままにします。

メモ: 乱数シード値(ステップ9)と開始点の数(ステップ10)を設定すると、以下の計画と同じ結果が得られます。同じ実験設定でなくても良い場合は、これらの手順は不要です。なお、乱数シード値などを設定しても、「Yのシミュレーション」の値は、図5.13にある値とは一致しない可能性があります。

9. (オプション)「カスタム計画」の赤い三角ボタンをクリックし、[乱数シード値の設定]を選択します。次に、「12345」と入力して[OK]をクリックします。

10. (オプション)「カスタム計画」の赤い三角ボタンのメニューから[開始点の数]を選択し、「5」と入力して[OK]をクリックします。

11. [計画の作成]をクリックします。

12. [テーブルの作成]をクリックします。

「カスタム計画」ウィンドウを閉じないでください。この例の後半で使用します。

図5.13 計画のデータテーブルに表示されたシミュレーション結果 

Design Table with Simulated Responses

応答列の「Y」「Y のシミュレーション」は、最初は同じシミュレーション値になっています。この例の応答値は、N(0, s)に従う乱数です。ここで、sは、デフォルトでは1になっています。「検出力分析」アウトラインにおける「RMSEの予想値」で指定されている値がデフォルトでは使われます。「Yのシミュレーション」の値は、「応答をシミュレート」ウィンドウのパラメータ値によって定義されたモデルを使い、ランダムに生成されます。「Y」列には、実験を実行した後に、その実験で得られた値を入力してください。

図5.14 「応答をシミュレート」ウィンドウ 

Simulate Responses Window

「応答をシミュレート」ウィンドウには、すべての項の係数が0(デフォルトの値)、選択された分布が[正規]、「誤差σ」が1と表示されています。「Y」列と「Yのシミュレーション」の値は、現在、ランダムな誤差だけを反映しています。

13. 「応答をシミュレート」ウィンドウの係数の値を、図5.15のように変更します。

図5.15 「応答をシミュレート」のパラメータ値 

Parameter Values for Simulated Responses

14. [適用]をクリックします。

すると、「Yのシミュレーション」列の応答値が変化します。

メモ: 応答値はランダムに生成されます。そのため、図5.16の値とは一致しません。

図5.16 X1とX11が有効な因子の場合の「Yのシミュレーション」列 

Y Simulated Response Column with X1 and X11 Active

今回のシミュレーションでは、「X1」「X11」を、誤差の標準偏差よりもかなり大きな効果を持つ因子として指定しました。次節では、統計分析によって、これら2つの因子を有意な因子として識別できるかどうかを確認していきます。

「スクリーニング」プラットフォームを使用した過飽和計画の分析

「スクリーニング」プラットフォームは、有効な因子(実際に応答に影響している因子)を識別する1つの方法を提供しています。このプラットフォームを使用して、計画のデータテーブル(図5.16)に含まれる「Yのシミュレーション」を分析してみましょう。「スクリーニング」プラットフォームは、[実験計画(DOE)]>[古典的な計画]メニューにあります。

メモ: データテーブルの「Yのシミュレーション」の値は、この例のものとは少し異なります。レポートに表示される値は、ここで紹介する結果とは一致しません。

1. [実験計画(DOE)]>[古典的な計画]>[2水準スクリーニング]>[2水準スクリーニングのあてはめ]を選択します。

2. 「Y のシミュレーション」を選択し、[Y]をクリックします。

3. 「X1」から「X12」を選択し、[X]、次に[OK]をクリックします。

図5.17 過飽和実験計画の「スクリーニング」レポート 

Screening Report for Supersaturated Design

因子「X1」「X11」の「対比」と「Lenthのt値」の値は大きく、「同時p値」の値は小さくなっています。「半正規プロット」内では、「X1」「X11」も直線からかなり離れています。これらの「対比」レポートと「半正規プロット」レポートから、「X1」「X11」が重要であることがわかります。「X12」の「個別のp値」は0.05以下ですが、その効果は「X1」「X11」に比べてずっと小さいことがわかります。

この計画は過飽和なので、この計画におけるp値は、すべての効果が推定可能となっている計画におけるp値よりも、小さくなっているかもしれません。なぜなら、過飽和計画では、ある効果の推定値は、応答に影響している他の効果によってバイアスをもつようになっているからです。図5.17に示すように、[モデルの作成]ボタンの上に、その可能性を説明する注釈が表示されます。

さらに、問題としている効果が、他の効果と高い相関関係にあるかどうかも確認したほうが良いでしょう。相関が高い場合、一方の効果が他方の効果がもつ有意性を隠してしまう場合があります。図5.19のカラーマップには、効果間における相関係数の絶対値が表示されます。

4. [モデルの作成]をクリックします。

作成されたモデルには、効果「X1」「X11」「X12」だけが含まれます。

5. 「モデルの指定」ウィンドウで[実行]をクリックします。

図5.18 モデルのパラメータ推定値 

Parameter Estimates for Model

「X11」「X1」のパラメータ推定値は、モデルをシミュレートするのに使用した理論上の値に近いものとなっています。「X1」「X11」に「10」と指定した図5.15を参照してください。因子「X12」の有意性は偽陽性の例です。

6. 「カスタム計画」ウィンドウで、「計画の評価」>「相関のカラーマップ」アウトラインを開きます。

図5.19 「相関のカラーマップ」アウトライン 

Color Map on Correlations Outline

セルの上にポインタを置くと、相関係数の絶対値が表示されます。「X1」は、他の主効果(「X4」「X5」「X7」)と0.5という高い相関があります。(図5.19は、JMPのデフォルトの色を使用しています。)

ステップワイズ回帰を使用した過飽和計画の分析

ステップワイズ回帰を使っても、重要な因子を識別できます。図5.16の計画テーブルには、3つのスクリプトが含まれています。「モデル」スクリプトで呼び出される「モデルのあてはめ」プラットフォームで、ステップワイズ回帰を使用してデータを分析しましょう。

メモ: データテーブルの「Yのシミュレーション」の値は、この例のものとは少し異なります。レポートに表示される値は、ここで紹介する結果とは一致しません。

1. 計画のデータテーブルにおけるテーブルパネルで、「モデル」スクリプトの横にある緑の三角ボタンをクリックします。

2. 「手法」[標準最小2乗]から[ステップワイズ法]に変更します。

3. [実行]をクリックします。

4. 「Yのステップワイズ」レポートで、「停止ルール」[最小AICc]に変更します。

今回のような標本サイズが非常に小さい過飽和計画では、有効でない効果もモデルに含まれる傾向がBICにはあり、AICcよりも多くの説明変数がモデルに含まれます。

5. [実行]をクリックします。

図5.20 過飽和計画のステップワイズ回帰 

Stepwise Regression for Supersaturated Design

図5.20は、選択したモデルで、2つの重要な因子「X1」「X11」で構成されています。一番下には「ステップ履歴」が表示されます。「X1」「X11」とその他の因子の相関によって、他の因子の有意性が隠されている可能性があることも気を付けてください(図5.19)。

メモ: この例では2つの大きな主効果だけが選択されて、残りの因子(の係数)は0とされています。実際の状況で効果にこれほど明らかな差が出ることはあまりありません。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).