神经网络会在其拟合例程中使用某种验证方法。可选的验证方法包括保留、K 折或(在 JMP Pro 中)使用验证列。要拟合模型,“神经”平台执行以下操作:
• 对模型参数应用罚值
• 使用验证集来调节参数罚值。
选择以下验证方法之一:
保留排除行
使用行状态对数据取子集。未排除的行用作训练集,排除的行用作验证集。
有关使用行状态和如何排除行的详细信息,请参见《使用 JMP》中的隐藏和排除数据表中的行。
保留
将原始数据随机划分为训练集和验证集。指定要用作验证集(保留)的数据占原始数据的比例。随机选择基于对模型因子的分层抽样,尝试创建比基于简单随机抽样的训练集和验证集更平衡的训练集和验证集。
K 重
将数据分为 K 个子集或折。这 K 折中的每一折依次用于验证其余数据的模型拟合,总共拟合 K 个模型。最佳模型是得到具有最佳验证统计量的那一折模型。
该方法适合小数据集,因为它能充分利用有限的数据。
验证列
使用用来定义验证集的某个数值列。验证列的值将确定如何拆分数据:
‒ 若验证列有两个水平,则较小的值定义训练集,较大的值定义验证集。
‒ 若验证列包含三个水平,将按值由小到大的顺序相应定义训练集、验证集和测试集。
‒ 若验证列包含三个以上唯一值,则执行 K 折验证。折数由验证列中的值的数量决定。
“神经”平台使用验证列来训练和调优模型,或者训练、调优和评估模型。有关验证的详细信息,请参见JMP 建模中的验证。