予測モデルおよび発展的なモデル > 関数データエクスプローラ > 「関数データエクスプローラ」の起動
公開日: 09/19/2023

ここに画像を表示「関数データエクスプローラ」の起動

[分析]>[発展的なモデル]>[関数データエクスプローラ]を選択すると、「関数データエクスプローラ」プラットフォームが起動します。

図16.5 「関数データエクスプローラ」起動ウィンドウ 

「関数データエクスプローラ」起動ウィンドウ

「列の選択」の赤い三角ボタンのメニューのオプションについては、『JMPの使用法』の列フィルタメニューを参照してください。

データ形式の選択

「関数データエクスプローラ」起動ウィンドウには、いくつかの異なるデータ形式に対するタブがあります。使用するデータ形式に合ったタブを選択してください。

積み重ねたデータ形式

データテーブルの各行が1つの観測値に対応しています。そして、出力変数・入力変数・ID変数のそれぞれに1列があります。

メモ: 「積み重ねたデータ形式」は、2つ以上の出力変数(応答変数)をもつデータを指定できる唯一のデータ形式です。[積み重ねたデータ形式]タブで2つ以上の列を[Y, 出力]に割り当てると、各Y変数は別々に分析されます。そして、「モデルのあてはめ」レポートには、それぞれのY変数について個別のレポートが作成されます。

各行が1つの関数

データテーブル内の各行がID変数の各水準における出力関数全体に対応している形式です。各列は入力変数の各水準に対応しています。

ヒント: データ形式が[各行が1つの関数]である場合、列に「FDE X」列プロパティを用いることで、入力変数の値を指定できます。列に「FDE X」列プロパティが含まれていない場合、[各行が1つの関数]データ形式は、列名に含まれている数値を使用します。列名が複雑すぎる場合は、どの列に問題があったかを示すエラーメッセージが表示され、入力変数の値はx = 1, 2, ..., nとされます。ここで、nは関数内の観測数です。たとえば、t20 2x30v20は問題のある列名です。

各列が1つの関数

データテーブル内の各列がID変数の各水準における出力関数全体に対応している形式です。そして、各行が、入力変数の1水準として扱われます。

列の役割の指定

起動ウィンドウには、列の役割を指定するための以下のオプションがあります。

Y, 出力

関数データf(t)を含む列を割り当てます。ID変数の各水準に対して、非欠測値である出力値が2つ以上必要です。

メモ: 観測された出力値が2つに満たない関数は分析から除外されます。

X, 入力

([積み重ねたデータ形式]タブと[各列が1つの関数]タブでのみ使用可能。)入力変数tの列を割り当てます。[X, 入力]を指定しなかった場合は、行番号が使用されます。行番号が使用された場合、入力変数の値は等間隔であると仮定されます。

ID, 関数

([積み重ねたデータ形式]タブと[各行が1つの関数]タブでのみ使用可能。)ID変数を各関数に割り当てます。積み重ねたデータでID変数が割り当てられていない場合は、すべての観測値が1つの関数から来たものと仮定されます。

Z, 追加

([積み重ねたデータ形式]タブと[各行が1つの関数]タブでのみ使用可能。)1つまたは複数の追加変数を割り当てます。追加変数は「関数データエクスプローラ」プラットフォームの関数データの曲線を求める際には一切、使用されず、追加変数を含めても曲線のあてはめの結果には影響しません。「追加変数」とは、「関数データエクスプローラ」から得られた結果を今後の分析で用いたい場合に、その今後の分析で利用したい変数を指します。追加変数を指定すると、それらの変数は、[データの保存]オプションや[要約の保存]オプションで作成されるデータテーブルの「追加変数」列グループに含まれます。これらの列では、元のデータテーブルで指定されていた任意の列プロパティが保持されます。また、[関数実験計画分析]オプションでも追加変数による分析を行えます。関数実験計画分析を参照してください。

度数

([積み重ねたデータ形式]タブでのみ使用可能。)各データ行の度数を表す列を割り当てます。度数は、その行のデータが繰り返されていることを意味します。したがって、整数の度数がkであることは、該当のデータ行とまったく同じ観測値となっているデータ行がk回繰り返してあることを意味します。

検証

検証セットを定義するオプションの数値列を割り当てます。この列には、一意の値が2つ含まれていなければなりません。小さい方の値をもつ行が学習セット、大きい方の値をもつ行が検証セットとして使われます。3つ以上の値がある場合、最小値となっている部分が学習セット、その他のすべての部分が検証セットとして使用されます。「関数データエクスプローラ」プラットフォームでは、検証列を使ってモデルを学習・評価します。検証については、JMPのモデル化での検証を参照してください。

メモ: [検証]オプションを使用するときには、同じ関数における観測値が学習セットと検証セットに分かれてしまうことを避け、同じ関数におけるすべての観測値をいずれかのセットだけに割り振るようにしてください。つまり、同じID値をもつ観測値を、学習セットもしくは検証セットのいずれかの同じセットに割り振ってください。「関数データエクスプローラ」では、ID値が同じ観測値を両方のセットにまたがって割り振らないでください。データの分割を検証列によって行う手順については、クラスター無作為抽出による検証列を参照してください。

注意: 「列の選択」リストで列を選択せずに[検証]ボタンをクリックし、データテーブルに検証列を追加した場合、それはクラスター無作為抽出による検証列にはなりません。代わりに、「検証列の作成」プラットフォームを使用する必要があります。クラスター無作為抽出による検証列を参照してください。

By

変数の列を指定すると、水準ごとに個別の分析が行われます。複数のBy変数を割り当てた場合、それらのBy変数の水準の組み合わせごとに個別に分析が行われます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).