「決定的スクリーニングのあてはめ」プラットフォームの技術的詳細

効果的モデル選択の計算

この節では、「決定的スクリーニングのあてはめ」プラットフォームで使用されている効果的モデル選択（effective model selection）の概要を説明します。Jones and Nachtsheim（2016）を参照してください。

応答の分解

効果的モデル選択では、応答YをYMEとY2ndに分けます。ここで、Y = YME + Y2ndという関係があります。

– YMEは、主効果および偽因子に基づきYの回帰を行って得た予測値です。

YMEは、主効果と偽因子に対してYを回帰することにより得た予測値です。なお、決定的スクリーニング計画は折り重ね構造になっているので、この主効果部分にブロック因子は含められません。ブロック因子はY2ndに含められます。

– Y2ndは、Y2nd = Y - YMEで計算します。

注: 決定的スクリーニング計画では、YMEとY2ndの列は互いに直交しています。

分析は2ステージに分けて進められます。

• ステージ1: 応答YMEを使って、主効果を特定する。このステージでは、応答に影響している主効果（有効な主効果）を特定します。

• ステージ2: 応答Y2ndを使って、2次効果を特定する。このステージでは、ステージ1 で有効であると特定された主効果を含む2次効果をすべて検討して、その中から有効と思われる2次効果を特定します。

注: ブロック因子がある場合は、有意であるかどうかに関わらず、ステージ2の効果のリストに加えられます。

ステージ1の手法

ステージ1の処理は、計画を作成するのに偽因子が使われたかどうか、または、中心点が反復されているかどうかによって異なります。

ケース1: 偽因子が使われたり、中心点が反復されたりしている場合

1. 偽因子や反復されている中心点を用いて、モデルに依存しない誤差分散の推定値が算出されます。3次以上の奇数次数の効果は存在しないという前提において、この誤差分散推定値はバイアス（偏り）のない不偏推定値です。

2. この誤差分散推定値に基づき、YMEを用い、主効果を検定します。主効果のp値閾値より小さくなる場合、その主効果は応答に影響している（有効である）と見なされます。閾値は次のとおりです。

– 誤差の自由度が1の場合、閾値は0.20です。

– 誤差の自由度が2の場合、p値に対する閾値は0.10です。

– 誤差の自由度が3以上の場合、p値に対する閾値は0.05です。

– ユーザが指定した場合には、その指定したp値が閾値になります。

注: デフォルトとは異なるp値の閾値を指定するには、「決定的スクリーニングのあてはめ」の赤い三角ボタンのメニューから［ステージ1のp値を設定］を選択します。

3. この閾値を下回るp値を持つ主効果がない場合は、有効な主効果がなく、有効な2次効果もないと結論付けられます。そして、この時点で、処理を終了します。

4. 重要な主効果が見つかった場合は、重要でない主効果の変動を、(1)で生成した誤差分散にプールします。

注: 計画の中にカテゴリカル因子がある場合、有効な主効果が選択されるたびに主効果係数の推定値が計算しなおされます。

ケース2: 偽因子が使われておらず、かつ、中心点も反復されていない場合

このケースでは、モデルに依存しない誤差分散の推定値は存在しません。有効でない主効果をもとに計算された誤差分散の推定値に対して、主効果を順番に検定していきます。主効果がm個あるとしましょう。

1. YMEを応答として使用し、効果の推定値の絶対値を大きい順に並べます。

2. 1 ≤ i < mとし、i番目に大きい効果の絶対値を検証するには、その効果、およびそれより大きい絶対値を持つ効果すべてを考慮に入れたモデルから計算した残差平方和を使用します。

3. 最小のp値を持つモデルに含まれている効果が有効であると見なされます。

4. こうして有効な主効果を特定した後、有効でない主効果の変動を、誤差分散の推定値の計算に用います。この時も、YMEを応答として使用します。

注: この「決定的スクリーニングのあてはめ」のケース2の処理が成立するには、有効な主効果と有効でない主効果が少なくとも1つずつ必要になります。有効な主効果がなかったり、すべての主効果が有効であったりした場合は、上述の説明とは異なった方法で主効果の組み合わせが特定されます。

ステージ2の手法

ステージ2で考慮される因子は、強い親子関係のオプションに左右されます。強い親子関係が選択されている場合、ステージ1で有効だと判断された主効果を含む2次効果のみが検討されます。ステージ2での手法は、ステージ1で有効だと判断された主効果の数によって決まります。

ケース1: 有効な主効果が7個以下

ステージ2では、特定の基準が満たされるまで2次効果を追加していきます。この処理では、ステージ1のRMSEに対するステージ2のRMSEの比が指定の閾値を上回っていれば、モデルに2次効果を加えていく処理を続けます。比が閾値以下になった時点で、モデルに2次効果を追加していく処理を終了します。デフォルトの閾値は1です。閾値が低ければ低いほど、有効だと判断される項の数が多くなります。

注: RMSE比の閾値を1以外に設定するには、「決定的スクリーニングのあてはめ」の赤い三角ボタンのメニューから［ステージ2の比を設定］を選択します。

ステージ2:

• 誤差の自由度が1の場合、p値に対する閾値は0.20です。

• 誤差の自由度が2の場合、p値に対する閾値は0.10です。

• 誤差の自由度が3以上の場合、p値に対する閾値は0.05です。

• ユーザが指定した場合には、その指定したp値が閾値になります。

1. まず、ステージ1の誤差推定値をもとに、Y2ndの変動を検定し、2次効果に起因する変動があるかどうかを調べます。

– この検証のp値が閾値より大きい場合には、応答に影響している2次効果（有効な2次効果）はないものとして、この時点で処理を終了します。

2. この検証のp値が閾値以下である場合は、サイズk（k = 1,2,3,...）のモデルを、k = 1から順にあてはめていきます。

3. 各kについて、サイズkの組み合わせにおいて、RMSEが最小となる組み合わせを取り出します。そして、そのRMSEを、ステージ1のRMSEと比べます。

4. サイズkの組み合わせにおいて、ステージ1のRMSEに対するステージ2のRMSEの比が、比に対して指定した閾値より小さくなっている場合は、次の処理を行います。

5. 処理を終了したkよりも1つ前の組み合わせが、有効な2次効果と見なされます。

ケース2: 有効な主効果が8個以上

ステージ1で8個以上の主効果が有効だと判断された場合、ステージ2では、変数増加法を使って2次項が選択されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).