検証(validation)とは、データの一部だけからモデルパラメータを推定し、残りのデータでモデルの予測能力を評価することを指します。このようにデータを分割することにより、モデルがオーバーフィット(過学習)することを回避できます。
このプラットフォームで作成された検証列は、データを2つまたは3つに分割します。
• モデルパラメータの推定に使うデータを、「学習セット」といいます。
• 予測能力が高いモデルを選ぶのに用いるデータを、「検証セット」といいます。
• モデルが選択された後、モデルの予測能力をチェックするデータを、「テストセット」といいます。
作成された検証列は、多くのJMPプラットフォームで、検証を行う時に利用できます。JMPのモデル化での検証を参照してください。
「検証列の作成」プラットフォームでは、さまざまな手法で、学習セット・検証セット・テストセットにデータを分割できます。層別、グループ、またはカットポイントの列を指定して、検証列を作成するための手法を決定できます。