関時間などの連続的な変数に対して記録されたデータを「関数データ」と呼びます。関数データにおける測定値は、曲線やイメージです。関数の定義域は時間であることが多く、1つの関数における一連の測定値はID変数で区別されます。ある時点tにおけるIDがiである関数の観測値を、fi(t)とここでは記します。「関数データエクスプローラ」プラットフォームを使用すると、このような関数データを探索・分析できます。
関数データは、密(dense)の場合もありますし、疎(sparse)の場合もあります。関数データが密になるのは、観測値がすべてのIDにおいて、等間隔のグリッド上で観測されている場合です。関数データが疎になるのは、IDごとに測定時点が異なっており、IDごとに観測値数が異なっている場合です。「関数データエクスプローラ」プラットフォームは、どちらの関数データも取り扱えます。
関数データの表現方法には各種ありますが、一般的には次の2つのケースに分類されます。
• 興味がある1つの応答変数f(t)が関数形式となっている場合。
• 2つ以上の応答変数f(t)が関数形式となっている場合。これらの複数の出力変数は、関数過程(functional process)または信号過程(signal process)と呼ばれることがあります。
「関数データエクスプローラ」プラットフォームは、そのような関数データを探索するツールとして役立ちます。ただし、「関数データエクスプローラ」プラットフォームの強みは、複数の出力変数を分析できる点です。複数の出力変数からなる関数データから、後続の高度なモデリングに使用するための重要な特徴を抽出できる点が強みです。「関数データエクスプローラ」では、最初に、B-スプラインモデル、P-スプラインモデル、Fourier基底モデルを、IDごとに別々にあてはめます。次に、そのあてはめの結果に対して、関数主成分分析を行います。関数主成分スコア(FPC score; Functional Principal Comopnent score)のような関数主成分分析の結果は、データテーブルに保存することができますので、「モデルのあてはめ」の「一般化回帰」手法のような、他のプラットフォームでの分析に使用できます。別の方法として、一連の追加変数を指定し、「関数データエクスプローラ」プラットフォーム内で一般化回帰モデルをあてはめて、これらの変数が応答にどのように影響するかを判断することもできます。
関数データ分析の詳細については、Ramsay and Silverman(2005)を参照してください。