“数据处理”红色小三角菜单包含以下选项:
清除
一个包含以下数据清除选项的子菜单:
删除零
删除为零值的观测。若数据中没有零,将显示警报,指示未找到零值。
删除值
显示一个规格窗口,允许您指定要从数据中删除的值。
删除选定项
删除一些观测,它们对应在数据表中选定的行。
删除未选定项
删除一些观测,它们对应在数据表中未选定的行。
警告:“删除选定项”和“删除未选定项”将删除行号。启用“自动重新计算”时,必须先添加或删除行,然后才能使用这些选项。
过滤 X
删除落在指定区间之外的 X 值。选择“过滤 X”选项时,必须指定“之下”和“之上”值。落在指定区间之外的 X 值不用在分析中。
过滤 Y
删除落在指定区间之外的 Y 值。选择“过滤 Y”选项时,必须指定“之下”和“之上”值。落在指定区间之外的 Y 值不用在分析中。
简化
使用以下方法之一简化 X 值上的数据:
‒ 使用“网格”选项卡将观测内插到值的公共网格中。您可以指定网格大小。默认情况下,网格大小是唯一输入值数量的一半,因此减少了总观测数。若您不想减少观测总数,而只是希望观测位于同一网格中,请将网格大小指定为唯一输入值的数目。
‒ 使用“箱”选项卡创建指定数量的箱,这些箱在唯一 X 值上均匀分布。对于每个函数(或“ID,函数”变量的水平),对箱中的观测进行平均,以生成对应箱水平的 Y 值。
‒ 使用“细”选项卡删除 X 值上的每个 N 观测,其中 N 由指定的细化率确定。针对每个函数(或“ID,函数”变量的水平)执行该操作。默认情况下,细化率为 2,这将删除每个函数中一半的观测值。
注意:“删除”选项将指定的观测从分析和建模报表中排除,但是观测在数据表中保持不变。
变换
一个包含以下选项的子菜单,用于变换输出数据:
中心
将输出中心化。
标准化
通过将数据中心化和统一尺度,使输出的均值为 0、方差为 1。
范围 0 至 1
将输出统一尺度到处于 0 到 1 的范围内。
平方根
通过计算输出的平方根来变换数据。输出值必须为非负数。
平方
通过计算输出的平方来变换数据。
对数
通过计算输出的自然对数来变换数据。
指数
通过计算输出的指数函数来变换数据。
求反
通过对输出求反来变换数据。
Logit
通过计算输出的 Logit 函数来变换数据。输出值必须介于 0 到 1 之间。
对齐
一个包含以下选项的子菜单,用于对齐输入数据:
行对齐
用行号替换输入值。
对齐最大值
使用观测的每个 ID 水平的最大输出值对齐函数。对于每个 ID 水平将与观测的最大输出值关联的输入值设置为零,基于观测的最大值和零之间的差值上移或下移其他输入值。
对齐最小值
使用观测的每个 ID 水平的最小输出值对齐函数。对于每个 ID 水平将与观测的最小输出值关联的输入值设置为零,基于观测的最小值和零之间的差值上移或下移其他输入值。
在 0 到 1 范围内对齐
对齐输出函数,使输入值的范围为 0 到 1。
Tip: 拟合 P 样条模型时,在 0 到 1 范围内对齐尤其有用。
动态时间规整
(仅当有多个函数时才可用。)使用动态时间规整 (DTW) 对齐输出函数。DTW 是一种函数对齐方法,它查找一个最佳规整来一起对齐两个或更多函数。选择 DTW 选项时,将显示“选择参考函数”窗口。使用它来选择参考函数。参考函数是其余函数要对齐到的函数。
选择一个参考函数并点击“确定”后,将显示一个规整函数图以及一个其余查询函数的列表。在规整函数图上,参考函数位于 y 轴,选定的查询函数位于 x 轴。与红色对角线 (y = x) 的偏差指示查询函数的输入已规整以便更好地对齐。
目标函数
(仅当有多个函数时才可用。)支持您加载目标函数的子菜单。
加载目标
显示一个窗口,该窗口支持您指定目标函数。目标函数用于曲线匹配,其中所有函数最好都看起来像目标函数。您还可以指定两个目标函数,将其余曲线与“最佳”和“更差”情况函数进行比较。
若指定一个或多个目标函数,则模型拟合中将不使用这些函数的数据。对于每个指定的目标函数,将向 FPC 刻画器添加两行。请参见FPC 刻画器。
注意:在执行任何其他预处理步骤之前,必须加载目标函数。
标绘规整函数
显示或隐藏规整函数图。默认情况下处于打开状态。
保存距离矩阵
将距离矩阵保存到单独的数据表。距离矩阵对于函数聚类很有用。距离矩阵数据表包含一个层次聚类脚本。
保存规整函数
将规整函数保存到单独的数据表。数据表的每行包含进行了 DTW 调整的输入变量、原始输入变量和 ID 变量。