この付録では、各プラットフォームで利用できる交差検証法(クロスバリデーション法)の種類を説明しています。JMPで利用できる交差検証法には、次のような種類があります。
除外行による保留法
データテーブルで除外されている行を、検証データとして利用します。
注: データテーブルで除外されている行を検証データとして用いるプラットフォームでは、起動ウィンドウで検証列または検証セットの割合が指定されていない場合にのみ、データテーブルで除外されている行が検証データとして使用されます。
無作為抽出による保留法
データを無作為に学習セットと検証セットに分割します。学習セットや検証セットだけではなく、テストセットも含めることができます。各セットに割り当ている割合(元のデータにおける割合)を指定できます。
K分割交差検証法
データをK個に分割します。順番に、(K-1)個分のデータにモデルがあてはめられ、残っているデータでモデルが検証されます。全部でK個のモデルがあてはめられます。検証セットの統計量で最良だったものが、最終的なモデルに選択されます。
注: 一部のプラットフォームでは、設定パネルにて指定します。それ以外のプラットフォームでは、起動ダイアログにて指定します。また、検証列によって指定できるプラットフォームもあります。
検証列
検証列の値に基づいて、データを分割します。いくつかのプラットフォームでは起動ウィンドウにて、検証セットを示す列を指定できます。
注: プラットフォームによって、検証列が4水準以上の値を含む場合の扱い方が異なります。以下の表におけるメモを参照してください。
プラットフォーム |
除外行による保留法 |
無作為抽出による保留法 |
K分割交差検証法 |
検証列 |
---|---|---|---|---|
モデルのあてはめ > 最小2乗法によるあてはめ |
× |
× |
× |
〇(モデル評価の場合のみ)1 |
モデルのあてはめ > ステップワイズ増加法 |
× |
× |
〇(応答が連続尺度の場合のみ) |
〇 |
モデルのあてはめ > ロジスティック回帰 |
× |
× |
× |
〇(モデルの評価のみ)a |
モデルのあてはめ > 一般化回帰 |
× |
〇 |
○ |
〇 |
モデルのあてはめ > PLS |
× |
〇 |
○ |
〇 |
パーティション |
〇 |
○ |
〇 |
〇2 |
ブートストラップ森 |
〇 |
〇 |
× |
〇b |
ブースティングツリー |
〇 |
〇 |
× |
〇b |
K近傍法 |
〇 |
〇 |
× |
〇b |
単純Bayes |
〇 |
〇 |
× |
〇b |
ニューラル |
○ |
〇 |
〇(モデルの設定パネルまたは4水準以上の検証列によって) |
〇 |
K近傍法 |
〇 |
〇 |
× |
〇b |
単純Bayes |
〇 |
〇 |
× |
〇b |
サポートベクトルマシン |
× |
〇 |
〇(モデルの設定パネルによって) |
〇 |
関数データエクスプローラ |
× |
× |
× |
〇(「クラスター抽出」された検証列を用意する必要あり)3 |
判別分析 |
オプション |
× |
× |
〇b |
PLS |
× |
〇 |
〇(モデルの設定パネルまたは4水準以上の検証列によって) |
〇 |
アップリフト |
× |
〇 |
× |
〇b |
1 4水準以上ある場合、検証列は無視される。
2 4水準以上ある場合、小さいいほうから3水準だけを使用する。
3 3水準以上の場合は、最小値が学習セットに、その他のすべての値が検証セットに定義される。