JMP 14.2 联机文档
发现 JMP
使用 JMP
基本分析
基本绘图
刻画器指南
实验设计指南
拟合线性模型
预测和专业建模
多元方法
质量和过程方法
可靠性和生存方法
消费者研究
Scripting Guide
JSL Syntax Reference
该帮助的版本不再更新,请参见
https://www.jmp.com/support/help/zh-cn/15.2
获取最新的版本.
预测和专业建模
•
建模工具
•
“生成验证列”实用工具
• 启动“生成验证列”实用工具
上一个
•
下一个
启动“生成验证列”实用工具
您可以通过两种方式启动“生成验证列”实用工具:
•
选择“分析”>“预测建模”>“生成验证列”。请参见
“生成验证列”窗口
。
•
在平台启动窗口中点击“验证”。请参见
在平台启动窗口中点击“验证”
。
“生成验证列”窗口
在“生成验证列”窗口中,您需要指定每个保留集的比例或行数。然后您要选择用于构造保留集的方法。
图 3.17
“生成验证列”窗口
•
在“训练集”、“验证集”和“测试集”旁边,输入表示您想要加入以上每个集中的行比例或行数。默认值构造一个包含大约 75% 的行的训练集以及一个包含大约 25% 的行的验证集。
•
在“新建列名”旁边输入您的验证列的名称。
可使用五种方法来创建保留集。
公式随机
基于输入的分配值将数据划分到各个集中。例如,若输入默认值,则每行都有 0.75 的概率包括在训练集内,有 0.25 的概率包括在验证集内。该公式保存到列中。要查看该公式,点击“列”面板中列名右侧的加号图标。
固定随机
基于输入的分配值将数据划分到各个集中。例如,若输入默认值,则每行都有 0.75 的概率包括在训练集内,有 0.25 的概率包括在验证集内。您可以指定支持您将来重现分配的随机种子。没有任何公式保存到列中。
分层随机
基于您指定的列水平将数据划分到均衡的各个集中。若您想要在每个训练集、验证集和测试集中均衡表示列水平,则使用该选项。
点击“分层随机”后将出现一个窗口,该窗口支持您选择对数据分层所依据的一个或多个列。点击“确定”后,该验证列将添加到数据表中。正如“固定随机”中的情况,各行根据指定的分配随机分配给保留集。不过,分配时针对的是分层列的每个水平或水平组合。
将向数据表添加一列,该列具有提供分层变量的“注释”属性。
分组随机
通过以下方式将数据划分到各个集中:指定列的全部水平或是两个或更多列的水平组合都放置在同一个保留集中。若在保留集之间拆分水平不可行,则使用该选项。
点击“分组随机”后将出现一个窗口,该窗口支持您选择一个或多个列用作分组列。点击“确定”后,这些水平将随机分配给保留集。若某个水平大于您指定的行比例或行数,则它会保留在为其分配的保留集中。不过,分配到训练集中的行数会减少。出于该原因,结果集的大小会与您指定的大小稍有不同。
割点
基于时间序列割点将数据划分到各个集中。若您想要基于时间期间将数据分配到保留集,可使用该选项。
点击“割点”后将出现一个窗口,该窗口支持您选择一个或多个列来定义时间期间。点击“确定”后,将出现一个 JMP 警示,其中显示分配的割点。反映这种分配的列将添加到数据表中。训练集包含第一个割点与第二个割点之间的行。验证集包含第二个割点与第三个割点之间的行。测试集包含其余行。选择这些集是为了体现您指定的行比例或行数。
在平台启动窗口中点击“验证”
若您位于平台启动窗口中并且需要快速构造验证列,则使用该方法。请注意以下事项:
•
该平台必须支持验证列。
•
无需在“选择列”列表中选定任何列。
在平台启动窗口中点击“验证”按钮。随即显示“生成验证列”窗口,其中,“训练集”的默认设置为 0.7,“验证集”的默认设置为 0.3,“测试集”的默认设置为 0.0。
1.
在“训练集”、“验证集”和“测试集”旁边,输入您需要的比例或数字。
2.
在“新建列名”旁边键入新列的名称。
3.
点击“确定”。
新列与公式一起显示在数据表中。在启动窗口中,新列分配给“验证”角色。
注意:
通过平台启动窗口启动“生成验证列”实用工具等同于从“分析”>“预测建模”>“生成验证列”中选择“公式随机”方法。“固定随机”、“分层随机”、“分组随机”和“割点”方法均不可用。