•
|
モデルパラメータの推定に使うデータを、学習セットといいます。
|
•
|
モデルの予測能力を評価するのに用いるデータを、検証セットといいます。
|
•
|
検証セットを指定した場合には、[実行]ボタンが表示されます。この[実行]ボタンは、[分岐]ボタンを手動で繰り返し押すことなしに、分岐処理を一度に実行したいときに使います。[実行]ボタンをクリックすると、現時点より後の10回のどの分岐においても、検証セットのR2乗が改善されない時点まで、一度に処理が実行されます。この方法では、解釈しにくい複雑なツリーになるかもしれませんが、求められたツリーの予測精度は高いでしょう。
行の属性と行の除外の詳細については、『JMPの使用法』の「データの入力と編集」章を参照してください。
データを無作為に学習セットと検証セットに分割します。プラットフォームの起動ウィンドウにある「検証セットの割合」で、検証セットとして使用する部分の割合(保留する割合)を指定することができます。検証セットの割合の詳細については、第 “「パーティション」プラットフォームの起動”を参照してください。
データをランダムにK個に分割します。順番に、(K-1)個分のデータにモデルがあてはめられ、残っているデータでモデルが検証されます。全部でK個のモデルがあてはめられます。最終的なモデルは交差検証のR2乗により選択されます。なお、JMPの「パーティション」では、オーバーフィットを防ぐために、ある停止ルールが使われています。この方法は、少ないデータを効率的に利用するので、小規模なデータセットに適しています。第 “K分割交差検証”を参照してください。