決定論的データの重要な特徴は、ランダムな要素がないことです。決定論的な関係においては、入力値が同じだと、出力も常に同じになります。そのため、あてはめた統計モデルのp値は、通常のような意味を持ちません。F値が大きいこと(p値が小さいこと)は、その効果の影響を示唆する指標になるかもしれません。しかし、モデルに基づく予測や効果について、妥当な信頼区間を求めることはできません。
なぜなら、決定論的なデータにあてはめたモデルの残差は、ノイズ(ランダムな誤差)ではないからです。決定論的なデータにおける残差は、あてはめたモデルのバイアス(偏り)を示しています。ここでのバイアスは、真の値と予測値との差のことです。残差に明確なパターンが見られる場合は、バイアスを減らすために、モデルに新たな項を追加することを検討する必要があります。
実用上の多くの場面では、真のモデルを解析的な数式で表すことはできません。したがって、前節で説明した予測バイアスは観測したデータ点でしかわかりません。しかし、先ほどの試錘孔の例では真のモデルの関数がわかっています。「Borehole Sphere Packing.jmp」データテーブルの「true model」列には、既知の関数の計算式が含まれています。この計算式を使って、因子の入力範囲に対する予測バイアスのプロファイルを作成できます。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Design Experiment」フォルダの「Borehole Sphere Packing.jmp」を開きます。
2. 「Gauss過程モデルのあてはめ」スクリプトの横にある緑の三角ボタンをクリックします。
「Gauss過程モデル」レポートにおいて、因子と結果Yとの関係を調べます。
3. 「Gauss過程モデルY」の赤い三角ボタンをクリックし、[予測式の保存]を選択します。
4. 「Borehole Sphere Packing.jmp」データテーブルに戻ります。
5. 「true model」と「Y 予測式」の列の見出しを選択します。
6. 右クリックして、[計算式列の新規作成]>[組み合わせ]>[差]を選択します。
バイアスを含む新しい列が作成されます。
7. 「Borehole Sphere Packing.jmp」データテーブルで、[グラフ]>[プロファイル]を選択します。
8. 「true model-Y 予測式」を選択し、[Y, 予測式]をクリックします。
9. [中間計算式の展開]を選択します。
このオプションを選択すると、バイアスが8つの因子の関数として表示されます。
図21.30 「Borehole Sphere Packing.jmp」のプロファイルのダイアログ
10. [OK]をクリックします。
プロファイルは、デフォルトでは、計画領域の中心点に対して描かれます。予測モデルにバイアスがない場合は、プロファイルのトレースはすべての因子の全領域で一定になります。この例では、logRw, Hu, Hlの各変数がバイアスに対して影響を及ぼしていることがわかります。
図21.31 試錘孔のGauss過程モデルのバイアスのプロファイル(Y軸を-30から30に設定)
このプロファイルを使って、領域全体の予測バイアスの範囲を調べることができます。最小バイアスと最大バイアスの点を見つけるには、「予測プロファイル」の赤い三角ボタンのメニューから、[最適化と満足度]>[満足度関数]を選択してください。『プロファイル機能』の満足度プロファイルと最適化を参照してください。計画点に対する予測バイアスを評価するには、[分析]>[一変量の分布]を選択して、一変量の分析を表示してください。
図21.32 予測バイアスの一変量の分布
この例では真のモデルが既知である点に留意してください。応用の場面では、どのような因子設定においても、真のモデルは未知であるのが普通です。なお、実験データの各データ点における予測バイアスは、計画領域全体でのバイアスを過小評価する傾向があります。