検証(validation)とは、データの一部だけからモデルパラメータを推定し、残りのデータでモデルの予測能力を評価することを指します。このようにデータを分割することにより、モデルが過剰適合(オーバーフィット、過学習)することを回避できます。
検証列の1つの用途は、データを2つまたは3つに分割することです。
• モデルパラメータの推定に使うデータを、「学習セット」といいます。
• 予測能力が高いモデルを選ぶのに用いるデータを、「検証セット」といいます。
• モデルが選択された後、モデルの予測能力をチェックするデータを、「テストセット」といいます。
検証列のもう1つの用途は、データを4つ以上に分割して、K分割交差検証で使用することです。
検証列は、JMPの多くのプラットフォームで検証法として使用できますが、検証列によるK分割交差検証は、少数のプラットフォームでしかサポートされていません。JMPのモデル化での検証を参照してください。
「検証列の作成」プラットフォームでは、さまざまな手法で、学習セット・検証セット・テストセットにデータを分割できます。なお、層別・グループ・カットポイントに基づいて、検証列を作成することもできます。