预测和专业建模 > 生成验证列 > 启动“生成验证列”平台
发布日期: 08/07/2020

启动“生成验证列”平台

通过选择分析 > 预测建模 > 生成验证列启动“生成验证列”平台。

“生成验证列”启动窗口 

有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的“列过滤器”菜单

“生成验证列”启动窗口提供以下选项:

分层列

分配一个或多个分层列。

分组列

分配一个或多个分组列。

割点列

分配一个数值型割点列。

割点批次 ID

分配割点列时,还可以为分配一个割点批次 ID 列。这样您就能够确定“割点批次 ID”列的每个水平中的割点值。

选择的方法

描述基于指定的分层、分组和割点列的选定验证列方法。选择某种方法并点击“确定”后,可以在“生成验证列”报表中为每个集指定分配。请参见指定比率或相对比率设置割点。有五种方法可用于构造保留集:

随机验证列

在启动窗口中未分配任何列时所用的默认方法。该方法基于在“生成验证列”报表输入的分配将数据划分到各个集中。

分层验证列

分配了一个或多个分层列时所选的方法。该方法基于指定的分层列的水平将数据划分为均衡的各个集。与在“随机验证列”方法中一样,基于在“生成验证列”报表中输入的分配将行随机分配给保留集。不过,分配时针对的是分层列的每个水平或水平组合。当需要均衡表示每个训练集、验证集和测试集中列的水平时,可使用该方法。

分组验证列

指定了一个或多个分组列时所选的方法。该方法通过以下方式将数据划分到各个集中:将指定列的全部水平或是两个或更多列的水平组合都放置在同一个集内。出于该原因,结果集的大小会与您指定的大小稍有不同。若在保留集之间拆分水平不可行,则使用该选项。

按组分层验证列

同时指定了分层和分组列时所选的方法。该方法划分数据以均衡分层列中的水平,同时要求指定的各组一同保留在同一个保留集中。正如在“分组验证列”中那样,可以将组创建为指定列的水平或是两个或更多列的水平组合。结果集的大小会与您指定的大小稍有不同。

割点验证列

指定了割点列时所用的方法。该方法基于时间序列割点将数据划分到各个集中。若您想要基于时间期间将数据分配到保留集,可使用该选项。训练集包含第一个割点与第二个割点之间的行。验证集包含第二个割点与第三个割点之间的行。测试集包含其余行。这些集是基于“设置割点”报表中的选项而选择的。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).