公開日: 09/19/2023

ニューラルの検証法

「ニューラル」プラットフォームでは、モデルをあてはめるときに何かしらの検証法を必ず用います。検証法としては、保留法やK分割法があります。また、JMP Proでは検証列の使用を用いることもできます。「ニューラル」プラットフォームでは、モデルをあてはめるときに次のために検証セットを行います。

過剰適合(オーバーフィット、過学習)を回避するために、JMPのニューラルネットワークでは、モデルのパラメータに対してペナルティ(罰則)が課せられています。

パラメータに対するそのペナルティ(罰則)を調整するために、検証セットが使われています。

以下のような検証法が用意されています。

除外行の保留

行の属性によって、データを分割します。除外されていない行を学習セット、除外されている行を検証セットとして用います。

行の属性と行の除外の詳細については、『JMPの使用法』のデータテーブル内での行の非表示と除外を参照してください。

保留

この保留(holdout)の方法では、データを無作為に学習セットと検証セットに分割します。データのうち検証セットとして用いる部分の割合(保留する割合)を指定します。この無作為選択は、説明変数の層化抽出に基づいています。単純な無作為抽出に比べ、よりバランスのとれた学習セットと検証セットが作成されます。

K分割

データをK個に分割します。順番に、(K-1)個分のデータにモデルがあてはめられ、残っているデータでモデルが検証されます。全部でK個のモデルがあてはめられます。モデルのうち、検証セットにおける統計量が最良だったものが、最終的なモデルとして選ばれます。

この方法は、少ないデータを効率的に利用するので、小規模なデータセットに適しています。

ここに画像を表示検証列

検証セットを定義する数値列に基づき、データを分割します。この列の値によって、データの分割方法が決まります。

検証列の値が2つしかない場合は、小さい方の値が学習セット、大きい方の値が検証セットとして扱われます。

水準が3つの場合は、値が小さいものから順に、学習セット・検証セット・テストセットとして使われます。

検証列に一意な値が4つ以上ある場合は、K分割検証法が行われます。分割数は、検証列の値の数によって決まります。

「ニューラル」プラットフォームでは、検証列を使ってモデルを学習・調整するか、またはモデルを学習・調整・評価します。検証については、JMPのモデル化での検証を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).