JMP 14.2オンラインマニュアル
はじめてのJMP
JMPの使用法
基本的な統計分析
グラフ機能
プロファイル機能
実験計画(DOE)
基本的な回帰モデル
予測モデルおよび発展的なモデル
多変量分析
品質と工程
信頼性/生存時間分析
消費者調査
スクリプトガイド
スクリプト構文リファレンス
JMP iPad Help (英語)
JMP Interactive HTML (英語)
機能インデックス
JMP統計機能ガイド
このバージョンのヘルプはこれ以降更新されません。最新のヘルプは
https://www.jmp.com/support/help/ja/15.2
からご覧いただけます。
予測モデルおよび発展的なモデル
•
モデル化ユーティリティ
•
「検証列の作成」ユーティリティ
• 「検証列の作成」ユーティリティの起動
前へ
•
次へ
「検証列の作成」ユーティリティの起動
「検証列の作成」ユーティリティを起動するには、2通りの方法があります。
•
[分析]>[予測モデル]>[検証列の作成]を選択します。
第 “「検証列の作成」ウィンドウ”
を参照してください。
•
プラットフォームの起動ウィンドウで[検証]をクリックします。
第 “各プラットフォームの起動ウィンドウで[検証]ボタンをクリックする”
を参照してください。
「検証列の作成」ウィンドウ
「検証列の作成」ウィンドウでは、学習・検証・テストの各セットに割り振る行の割合を指定します。次に、各セットを作成する方法を選択します。
図3.17
「検証列の作成」ウィンドウ
•
「学習セット」・「検証セット」・「テストセット」の横には、これらのセットのそれぞれに含めたい行の割合または行数を入力します。デフォルト値は、学習セットが行の約75%で、検証セットが行の約25%です。
•
「新しい列の名前」の横には、検証列の名前を入力します。
データの抽出には5通りの方法があります。
単純無作為 計算式
入力された配分に基づいてデータをセットに分けます。たとえば、デフォルトの値が入力されている場合、各行は学習セットに含まれる確率が約0.75、検証セットに含まれる確率が約0.25となります。この方法では、無作為抽出を行う計算式が列に保存されます。計算式を表示するには、「列」パネルで列名の右側にあるプラスアイコンをクリックします。
単純無作為 固定値
入力された配分に基づいてデータをセットに分けます。たとえば、デフォルトの値が入力されている場合、各行は学習セットに含まれる確率が約0.75、検証セットに含まれる確率が約0.25となります。実行した分割と同じ分割を後に再現するための乱数シード値を入力できます。この方法では、計算式ではなくてデータ値が列に保存されます。
層化無作為抽出
指定した列の水準を層とし、層化無作為抽出によってデータをセットに分けます。指定した列の各水準内において、学習セット・検証セット・テストセットのぞれぞれの割合を同じようにしたい場合には、このオプションを使用します。
[層化無作為抽出]をクリックすると、層化無作為抽出の対象となる列を1つ以上選択できるウィンドウが表示されます。[OK]をクリックすると、検証列がデータテーブルに追加されます。[単純無作為 固定値]の場合と同様に、指定された割合に基づいて、各行が無作為にいずれかのセットに割り当てられます。ただし、単純無作為抽出ではなくて、指定された列の水準または水準の組み合わせを層として、層化無作為抽出が行われます。
データテーブルには、層別変数が記された「ノート」プロパティのある列が追加されます。
クラスター抽出
指定した列の水準全体が、または、2つ以上の列の水準の組み合わせ全体が同じセットに割り振られるように、データを各セットに分けます。このオプションは、ある列における各水準を別々のセットに割り振るのが適切でない場合に使用します。
[クラスター抽出]をクリックすると、1つまたは複数のグループ列を指定するためのウィンドウが表示されます。[OK]をクリックすると、グループ列の水準が各セットに無作為に割り振られます。まず、検証セットやテストセットに割り振るのですが、ある水準を検証セットやテストセットに割り振ったときに、指定した割合や行数より大きくなっても、その水準はそのセットに割り振ります。そのため、学習セットに割り振られる行数は、指定されたものよりも少なくなります。結果的に得られる各セットの大きさは、指定したものとわずかに異なります。
カットポイント
時系列のカットポイント(データを前後で分割する時点)に基づいてデータをセットに分けます。このオプションは、時系列データを特定の時点に基づいてセットに割り当てたい場合に使用します。
[カットポイント]をクリックすると、1つまたは複数の列を選択して時点を定義するためのウィンドウが表示されます。[OK]をクリックすると、どこでデータが分割されたかを知らせるダイアログウィンドウが表示されます。そして、そのカットポイントで分割した列がデータテーブルに追加されます。学習セットは、最初のカットポイントから2番目のカットポイントまでの行で構成されます。検証セットは、2番目のカットポイントから3番目のカットポイントまでの行で構成されます。テストセットは、残りの行で構成されます。これらのセットは、指定した行の割合または行数を反映するように選択されます。
各プラットフォームの起動ウィンドウで[検証]ボタンをクリックする
いずれかのプラットフォームの起動ウィンドウをすでに開いていて、その起動ウィンドウで検証列を作成したい場合には、本節で説明する方法を使用してください。次の点に注意してください。
•
用いているプラットフォームが「検証」列に対応している必要があります。
•
どの列も「列の選択」リストで選択されていない状態にて、以下の操作を行って下さい。
プラットフォームの起動ウィンドウで[検証]ボタンをクリックします。「学習セット」に0.7、「検証セット」に0.3、「テストセット」に0.0というデフォルト設定が入力された、「検証列の作成」ウィンドウが開きます。
1.
「学習セット」・「検証セット」・「テストセット」の横に目的の割合または行数を入力します。
2.
「新しい列の名前」の横に新しい列の名前を入力します。
3.
[OK]をクリックします。
計算式を含む新しい列がデータテーブルに表示されます。また、起動ウィンドウでは、追加された新しい列が「検証」の役割に割り当てられます。
メモ:
プラットフォームの起動ウィンドウから「検証列の作成」ユーティリティを起動することは、[分析]>[予測モデル]>[検証列の作成]から[単純無作為 計算式]を選ぶのと同じことです。プラットフォームの起動ウィンドウから呼び出した場合には、[単純無作為 固定値]、[層化無作為抽出]、[クラスター抽出]、[カットポイント]法は使用できません。