「ニューラル」プラットフォームでは、モデルをあてはめるときに何かしらの検証法を必ず用います。検証法としては、保留法やK分割法があります。また、JMP Proでは検証列の使用を用いることもできます。「ニューラル」プラットフォームでは、モデルをあてはめるときに次のために検証セットを行います。
• モデルのパラメータに対して、ペナルティ(罰則)を課す
• 検証セットによってパラメータに対するペナルティ(罰則)を調整する
以下のような検証法が用意されています。
除外行の保留
行の属性によって、データを分割します。除外されていない行を学習セット、除外されている行を検証セットとして用います。
行の属性と行の除外の詳細については、『JMPの使用法』のデータテーブル内での行の非表示と除外を参照してください。
保留
この保留(holdout)の方法では、データを無作為に学習セットと検証セットに分割します。データのうち検証セットとして用いる部分の割合(保留する割合)を指定します。この無作為選択は、説明変数の層化抽出に基づいています。単純な無作為抽出に比べ、よりバランスのとれた学習セットと検証セットが作成されます。
K分割
データをK個に分割します。順番に、(K-1)個分のデータにモデルがあてはめられ、残っているデータでモデルが検証されます。全部でK個のモデルがあてはめられます。モデルのうち、検証セットにおける統計量が最良だったものが、最終的なモデルとして選ばれます。
この方法は、少ないデータを効率的に利用するので、小規模なデータセットに適しています。
検証列
検証セットを定義する数値列に基づき、データを分割します。この列の値によって、データの分割方法が決まります。
– 検証列の値が2つしかない場合は、小さい方の値が学習セット、大きい方の値が検証セットとして扱われます。
– 水準が3つの場合は、値が小さいものから順に、学習セット、検証セット、テストセットとして使われます。
– 検証列に一意な値が4つ以上ある場合は、K分割検証法が行われます。分割数は、検証列の値の数によって決まります。
「ニューラル」プラットフォームでは、検証列を使ってモデルを学習・調整するか、またはモデルを学習・調整・評価します。検証については、JMPのモデル化での検証を参照してください。