函数数据可以定义为某个连续域上记录的数据,其中一个测量值集构成曲线或图像。通常该域是时间,测量值集由 ID 变量定义。将域上特定点 t 处的 ID 水平 i 的函数数据观测表示为 fi(t)。通过“函数数据分析器”平台,您可以探索和分析函数数据。
函数数据的形式可以是密集或稀疏的。当 ID 变量的所有水平对应的观测值位于同一相等间距的点的网格上时,函数数据为密集的。当 ID 水平具有不同观测数(它们在域上散布,之间的间距不相等)时,函数数据为稀疏的。“函数数据分析器”平台可以处理这两种函数数据。
尽管函数数据可以用很多方式来表示,通常它可分为以下两种情况:
• 相关响应 f(t) 具有函数形式。
• 有一个或多个协变量 f(t),它们具有函数形式。这些有时是指函数或信号处理。
“函数数据分析器”平台是一种有用的探索性工具,适用于任意类型的函数数据。但是,该平台的优势在于使用很多函数过程(可能与某个标量响应关联)并提取关键特征以在进一步建模中使用。它首先使用 B 样条、P 样条或傅里叶基函数将数据拟合为函数模型。然后对该函数模型执行函数主成分分析(函数 PCA)。保存函数 PCA 的结果(例如函数主成分 (FPC) 得分)并在另一建模平台(例如“拟合模型”平台的“广义回归”特质)使用它进行特征提取和分析。
有关函数数据分析的详细信息,请参见 Ramsay and Silverman (2005)。