予測モデルおよび発展的なモデル > 検証列の作成 > 「検証列の作成」プラットフォームの概要
公開日: 09/19/2023

ここに画像を表示「検証列の作成」プラットフォームの概要

検証(validation)とは、データの一部だけからモデルパラメータを推定し、残りのデータでモデルの予測能力を評価することを指します。このようにデータを分割することにより、モデルが過剰適合(オーバーフィット、過学習)することを回避できます。

検証列の1つの用途は、データを2つまたは3つに分割することです。

モデルパラメータの推定に使うデータを、「学習セット」といいます。

予測能力が高いモデルを選ぶのに用いるデータを、「検証セット」といいます。

モデルが選択された後、モデルの予測能力をチェックするデータを、「テストセット」といいます。

検証列のもう1つの用途は、データを4つ以上に分割して、K分割交差検証で使用することです。

検証列は、JMPの多くのプラットフォームで検証法として使用できますが、検証列によるK分割交差検証は、少数のプラットフォームでしかサポートされていません。JMPのモデル化での検証を参照してください。

「検証列の作成」プラットフォームでは、さまざまな手法で、学習セット・検証セット・テストセットにデータを分割できます。なお、層別・グループ・カットポイントに基づいて、検証列を作成することもできます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).