“数据处理”报表选项

预测和专业建模 > 函数数据分析器 > “函数数据分析器”平台选项 > “数据处理”报表选项

发布日期: 08/07/2020

“数据处理”报表选项

“数据处理”红色小三角菜单包含以下选项：

清除

一个包含以下数据清除选项的子菜单：

删除零

删除为零值的观测。若数据中没有零，将显示警报，指示未找到零值。

删除值

显示一个规格窗口，允许您指定要从数据中删除的值。

删除选定项

删除一些观测，它们对应在数据表中选定的行。

删除未选定项

删除一些观测，它们对应在数据表中未选定的行。

过滤 X

删除落在指定区间之外的 X 值。选择“过滤 X”选项时，必须指定“低于”和“高于”值。落在指定区间之外的 X 值不用在分析中。

过滤 Y

删除落在指定区间之外的 Y 值。选择“过滤 Y”选项时，必须指定“低于”和“高于”值。落在指定区间之外的 Y 值不用在分析中。

减少

使用以下方法之一减少 X 值上的数据：

‒ 使用“网格”选项卡将观测内插到值的公共网格中。您可以指定网格大小。默认情况下，网格大小是唯一输入值数量的一半，因此减少了总观测数。若您不想减少观测总数，而只是希望观测位于同一网格中，请将网格大小指定为唯一输入值的数目。

‒ 使用“箱”选项卡创建指定数量的箱，这些箱在唯一 X 值上均匀分布。对于每个函数（或“ID，函数”变量的水平），对箱中的观测进行平均，以生成对应箱水平的 Y 值。

‒ 使用”细“选项卡删除 X 值上的每个 N 观测，其中 N 由指定的细化率确定。针对每个函数（或“ID，函数”变量的水平）执行该操作。默认情况下，细化率为 2，这将删除每个函数中一半的观测值。

注意：“删除”选项将指定的观测从分析和建模报表中排除，但是观测在数据表中保持不变。

变换

一个包含以下选项的子菜单，用于变换输出数据：

中心

将输出中心化。

标准化

通过将数据中心化和统一尺度，使输出的均值为 0、方差为 1。

范围 0 至 1

将输出统一尺度到处于 0 到 1 的范围内。

平方根

通过计算输出的平方根来变换数据。输出值必须为非负数。

平方

通过计算输出的平方来变换数据。

对数

通过计算输出的自然对数来变换数据。

指数

通过计算输出的指数函数来变换数据。

求反

通过对输出求反来变换数据。

Logit

通过计算输出的 Logit 函数来变换数据。输出值必须介于 0 到 1 之间。

对齐

一个包含以下选项的子菜单，用于对齐输入数据：

行对齐

用行号替换输入值。

对齐最大值

使用观测的每个 ID 水平的最大输出值对齐函数。对于每个 ID 水平将与观测的最大输出值关联的输入值设置为零，基于观测的最大值和零之间的差值上移或下移其他输入值。

对齐最小值

使用观测的每个 ID 水平的最小输出值对齐函数。对于每个 ID 水平将与观测的最小输出值关联的输入值设置为零，基于观测的最小值和零之间的差值上移或下移其他输入值。

将范围对齐为 0 到 1

对齐输出函数，使输入值的范围为 0 到 1。

提示：拟合 P 样条模型时，将范围对齐为 0 到 1 特别有用。

动态时间规整

（仅当有多个函数时才可用。）使用动态时间规整 (DTW) 对齐输出函数。DTW 是一种函数对齐方法，它查找一个最佳规整来一起对齐两个或更多函数。选择 DTW 选项时，将显示“选择参考函数”窗口。使用它来选择参考函数。参考函数是其余函数要对齐到的函数。

选择一个参考函数并点击“确定”后，将显示一个规整函数图以及一个其余查询函数的列表。在规整函数图上，参考函数位于 y 轴，选定的查询函数位于 x 轴。与红色对角线 (y = x) 的偏差指示查询函数的输入已规整以便更好地对齐。

目标函数

（仅当有多个函数时才可用。）支持您加载目标函数的子菜单。

加载目标

显示一个窗口，该窗口支持您指定目标函数。目标函数用于曲线匹配，其中所有函数最好都看起来像目标函数。您还可以指定两个目标函数，将其余曲线与“最佳”和“较差”情况函数进行比较。

若指定一个或多个目标函数，则模型拟合中将不使用这些函数的数据。对于每个指定的目标函数，将向 FPC 刻画器添加两行。请参见FPC 刻画器。

在执行任何其他预处理步骤之前，必须加载目标函数。

动态时间规整选项

标绘规整函数

显示或隐藏规整函数图。默认情况下处于打开状态。

保存距离矩阵

将距离矩阵保存到单独的数据表。距离矩阵对于函数聚类很有用。距离矩阵数据表包含一个层次聚类脚本。

保存规整函数

将规整函数保存到单独的数据表。数据表的每行包含进行了 DTW 调整的输入变量、原始输入变量和 ID 变量。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).