検証(validation)とは、データの一部をモデルパラメータの推定に使用し、残りのデータでモデルの予測能力を評価することを指します。このようにデータを分割することにより、モデルがオーバーフィット(過学習)することを回避できます。
検証列は、データを2つまたは3つの部分に分けます。
• モデルパラメータの推定に使うデータを、学習セットといいます。
• 予測能力が高いモデルを選ぶのに用いるデータを、検証セットといいます。
• モデルが選択された後、モデルの予測能力をチェックするデータを、テストセットといいます。
検証列は、多くのJMPプラットフォームで検証の手法の1つとして使用できます。検証列をサポートするプラットフォームを参照してください。
「検証列の作成」プラットフォームでは、さまざまな手法を使って学習セット、検証セット、およびテストセットを作成できます。層別、グループ、またはカットポイントの列を指定して、検証列を作成するための手法を決定できます。