「データ処理」の赤い三角ボタンのメニューには、以下のオプションがあります。
データの取捨
データを取捨するための、次のようなオプションが含まれたサブメニュー。
ゼロの削除
ゼロとなっている観測値を削除します。データ中にゼロの値がなかった場合は、ゼロの値が発見されなかったという旨のメッセージが表示されます。
指定した値の削除
データから削除する値を指定するためのウィンドウを表示します。
選択されているデータの削除
データテーブルで選択されている行の観測値を削除します。
選択されていないデータの削除
データテーブルで選択されていない行の観測値を削除します。
注意: [選択されているデータの削除]と[選択されていないデータの削除]は行番号に基づいて行を削除します。[自動再計算]が有効になっている場合は、これらのオプションを使用する前に別の方法で行を追加または削除しないよう注意してください。
フィルタX
指定した間隔内に入らないX値を削除します。[フィルタX]オプションを選択した場合は、「上限」と「下限」の値を指定する必要があります。指定した間隔内に入らないX値は分析に使用されません。
フィルタY
指定した間隔内に入らないY値を削除します。[フィルタY]オプションを選択した場合は、「上限」と「下限」の値を指定する必要があります。指定した間隔内に入らないY値は分析に使用されません。
データ削除
以下のいずれかの手法を使用してX値のデータを減らします。
– [グリッド]タブでは、一般的な値グリッドに対し、観測値を補間します。グリッドのサイズを指定できます。デフォルトでは、グリッドのサイズが一意の入力値の数の半分であるため、観測値の合計数が減ります。観測数を減らすことに興味はないが、観測値を同じグリッド内に入れたいという場合には、グリッドのサイズが一意の入力値の数となるように指定します。
– [ビン分割]タブでは、一意のX値について間隔が均等となるような指定数のビンを作成します。各関数(または[ID, 関数]変数の水準)について、それぞれビン内の観測値が平均化され、対応するビンの水準のY値が生成されます。
– [間引き]タブでは、指定した間引き率Nを使ってX値における観測値を削除します。これは、各関数(または[ID, 関数]変数の水準)について行われます。デフォルトの間引き率は2で、各関数で観測値の半分が削除されます。
メモ: これらの削除に関するオプションを使用すると、指定された観測値が分析やモデル化のレポートから除外されますが、それらの観測値の行はデータテーブル内では変更されないままです。
変換
[変換]メニューには、出力(Y変数)の変数変換に関する次のオプションが含まれています。
中心化
平均を引くことにより、出力を中心化します。
標準化
平均値が0、分散が1になるように、出力を標準化します。
範囲 0~1
0~1の範囲内に収まるように、出力を線形変換します。
平方根
出力を平方根変換します。出力値は非負である必要があります。
平方
出力を2乗することにより平方変換します。
対数
出力を自然対数により対数変換します。
指数
出力を指数関数(exp関数)により指数変換します。
符号反転
出力の符号を逆にします。
ロジット
出力をロジット関数によりロジット変換します。出力値は0~1の間になっている必要があります。
配置
[配置]メニューには、入力データを配置(アライン)する次のオプションが含まれています。
行番号
入力値を行番号に置き換えます。
最大の位置をゼロ
出力値が最大値となっている入力値がゼロになるように、入力値をずらします。出力値が最大となっている入力値をゼロとし、そのほかの入力値もそれに合わせてシフトします。
最小の位置をゼロ
出力値が最小値となっている入力値がゼロになるように、入力値をずらします。出力値が最小となっている入力値をゼロとし、そのほかの入力値もそれに合わせてシフトします。
0~1に配置
入力値が0~1の範囲になるように、入力値を線形変換します。
ヒント: この[0~1に配置]は、P-スプラインモデルをあてはめる場合に特に役立ちます。
動的時間伸縮
(関数が2つ以上ある場合にのみ使用可能。)動的時間伸縮(DTW; Dynamic Time Warping)によって入力値を配置します。動的時間伸縮は、2つ以上の関数の差が最も小さくなる配置(アラインメント)を見つけます。[動的時間伸縮]オプションを選択すると、「基準とする関数の選択」ウィンドウが表示されます。このウィンドウで、基準とする関数を選択してください。「基準とする関数」とは、それ以外の関数を配置(アライン)するときの基準に用いる関数のことです。
基準とする関数を選択して[OK]をクリックすると、伸縮関数のプロットが表示されます。伸縮関数のプロットにおいて、基準とした関数は縦軸、入力を伸縮させた関数は横軸にプロットされます。赤色の対角線(y = x)からの差は、基準とした関数に近づけるために入力値が動かされていることを示しています。
目標関数
(関数が2つ以上ある場合にのみ使用可能。)目標関数をロードできるサブメニュー。
目標関数のロード
目標関数を指定できるウィンドウが表示されます。目標関数は曲線のマッチングに使用されます。すべての関数が目標関数のように見えることが望ましいとされます。また、2つの目標関数を指定して、残りの曲線を「最良」ケースと「最悪」ケースの関数と比較できます。
1つまたは複数の目標関数を指定した場合、それらの関数からのデータはモデルのあてはめでは使用されません。指定した各関数について、それぞれ2つの行が関数主成分プロファイルに追加されます。関数主成分プロファイルを参照してください。
メモ: 目標関数は、他のすべての前処理を行う前にロードする必要があります。
時間伸縮関数のプロット
時間伸縮関数プロットの表示/非表示を切り替えます。デフォルトは「オン」です。
距離行列の保存
距離行列を別のデータテーブルに保存します。この距離行列は、関数をクラスタリングするのに役立ちます。距離行列のデータテーブルには、階層型クラスタースクリプトが含まれています。
時間伸縮関数の保存
時間伸縮関数を別のデータテーブルに保存します。データテーブルのそれぞれの行には、動的伸縮関数により調整された入力変数、元の入力変数、ID変数が含まれています。