時間などの連続的な変数に対して記録されたデータを「関数データ」と呼びます。それらの関数データは主に曲線で表されます。関数の定義域は、多くの場合、時間です。また、1つの関数における一連の測定値はID変数で区別されます。ある時点tにおけるIDがiである関数の観測値を、fi(t)とここでは記します。「関数データエクスプローラ」プラットフォームを使用すると、このような関数データを探索・分析できます。
関数データは、密(dense)の場合もありますし、疎(sparse)の場合もあります。関数データが密になるのは、観測値がすべてのIDにおいて、等間隔のグリッド上で観測されている場合です。関数データが疎になるのは、IDごとに測定時点が異なっており、IDごとに観測値数が異なっている場合です。「関数データエクスプローラ」プラットフォームは、どちらの関数データも取り扱えます。
関数データの表現方法には各種ありますが、一般的には次の2つのケースに分類されます。
• 関心のある応答f(t)が関数になっている。
• 関数のある共変量f(t)が関数になっている。これらの関数データは、関数過程(functional process)または信号過程(signal process)と呼ばれることがあります。
「関数データエクスプローラ」プラットフォームは、そのような関数データを探索するツールとして役立ちます。ただし、「関数データエクスプローラ」プラットフォームの強みは、複数の出力変数を分析できる点です。複数の出力変数からなる関数データから、後続の高度なモデリングに使用するための重要な特徴を抽出できる点が強みです。そのような分析を行うために、まず、特定の関数モデルをデータにあてはめます。次に、そのあてはめの結果に対して、関数主成分分析を行います。関数主成分スコア(FPC score; Functional Principal Comopnent score)のような関数主成分分析の結果は、データテーブルに保存することができますので、「モデルのあてはめ」の「一般化回帰」手法のような、他のプラットフォームでの分析に使用できます。別の方法として、一連の追加変数を指定し、「関数データエクスプローラ」プラットフォーム内で「一般化回帰」モデルをあてはめて、これらの変数が応答にどのように影響するかを判断することもできます。
関数データ分析の詳細については、Ramsay and Silverman(2005)を参照してください。