「モデルのあてはめ」プラットフォームの[標準最小2乗]手法によるあてはめの場合、因子の設定値のてこ比が外挿の指標として使用されます。
i 番目の観測値のてこ比であるhiiは、X(X′X)-1X′という行列のi番目の対角要素(ハット値)です。新しい予測点のてこ比は、次の式で計算されます: hpred = x′pred(X′X)-1xpred。てこ比がhpredである予測が外挿かどうかを判断するために、次の2つの基準を使用できます。
• hpred > K × max(hii)。ここで、Kはカスタマイズ可能な乗数です
• hpred > L × p/n。ここで、Lはカスタマイズ可能な乗数、pは変数の数、nは観測値の数、p/nは平均てこ比です
「閾値の基準を設定」オプションを使用して、使用する基準および乗数の値を指定できます。乗数のデフォルト値は、K = 1およびL = 3です。
メモ: 保存された最小2乗法モデルを使用して[グラフ]メニューからプロファイルに対する外挿の抑制を実行する場合、てこ比の方法は使用されません。代わりに、正則化されたHotellingのT2方法が使用されます。
最小2乗法以外のモデルでは、正則化されたHotellingのT2の値が外挿指標として使用されます。学習データのT2値と予測点のT2値は、次のように計算されます。
ここで、は、学習データに基づいて推定された、Schafer and Strimmerの正則化された共分散行列の推定値です。Schafer Strimmerの推定値に使用される目標行列は、対角共分散行列です。Schafer and Strimmer (2005)を参照してください。欠測値のあるオブザベーションを使用してモデルを学習するプラットフォームでは、共分散行列の推定は欠測値をペアワイズ法で処理して行われます。
メモ: そのような計算では、カテゴリカル変数はダミー変数に変換されます。
閾値の計算は、学習データで計算された、欠測値でないT2の値の数に依存します。
• 欠測値でないT2の値が10個以上ある場合、閾値は次のように設定されます。
ここで
Kはカスタマイズ可能な乗数で、デフォルトは3
はT2の値の標準偏差
• 欠測値でないT2の値が10個未満の場合、閾値はKσ限界に相当するF分布の分位点を使用して設定されます。
ここで
q= Φ(K)
Φ(·)は標準正規分布
Kはカスタマイズ可能な乗数で、デフォルトは3
pはパラメータの個数
nは、欠測値でないT2の値の個数