公開日: 09/19/2023

SVEMの概要

「一般化回帰」プラットフォームの変数増加法またはLassoモデルでは、検証方法としてSVEM(self-validated ensemble modeling; 自己検証アンサンブルモデリング)法を用いることができます。SVEM法は、標本再抽出法(リサンプリング法)の一種です。SVEM法では、その標本再抽出において、学習セットと検証セットの両方に同じデータを用いて、その各データ行にゼロでない重みを乱数で与えていきます。各行の学習データと検証データの重みは、相関が負になるように生成されます。つまり、学習セットで大きな重みを与えた場合、検証セットの同じデータ行には小さな重みを与えます。逆に、学習セットに小さな重みを与えた場合、検証セットの同じデータ行には大きな重みを与えます。SVEM法は、実験計画データの分析において有用である場合があります。

SVEM法の主な計算手順は、以下のとおりです。

1. 計画行列を縦方向に複製します。元の計画行列がn行の場合、新しい計画行列は2n行になります。列の数は同じです。

2. 応答ベクトルを縦方向に複製します。新しい応答ベクトルの行数は、元の応答ベクトルの行数の2倍になります。

3. 位置パラメータが1の指数分布から、n個の乱数を生成します(nは、元の計画行列の行数です)。これらが、計画行列の前半のn行に適用される重みになります。

4. 最初のn個の乱数と負の相関をもつようなn個の乱数を生成します。これらが、計画行列の後半のn行に適用される重みになります。

5. 生成した学習セットと検証セットに変数増加法またはLassoモデルをあてはめて、パラメータ推定値セットを作成します。

6. step 3からstep 5までのステップを、各モデルについて繰り返します。SVEM法であてはめられた個々のモデルの数は、「モデルの設定」パネルの「標本」で指定できます。

7. 個々のモデルからパラメータ推定値の平均値を求め、組み合わせたモデル(アンサンブルモデル)のパラメータ推定値を生成します。

メモ: 「モデルのあてはめ」起動ウィンドウで検証列を指定した場合、SVEM法は学習セットに適用されます。検証セットとテストセットは、テストセットとして保持されます。

SVEM(self-validated ensemble modeling)法の詳細については、Lemkus et al.(2021)を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).