验证是使用数据集的一部分估计模型参数并使用另一部分评估模型预测能力的过程。对于复杂数据,验证可以降低模型过度拟合的风险。
验证列的一种用法是将数据划分为两个或三个部分。
• 训练集用于估计模型参数。
• 验证集用于帮助选择具有良好预测能力的模型。
• 测试集可在选定模型后检查该模型的预测能力。
验证列的另一个用法是将数据划分为四个或更多折,以用于 K 折交叉验证。
在许多 JMP 平台中,验证列可以用作验证方法,但只有少数平台支持通过验证列进行 K 折交叉验证。请参见“JMP 建模中的验证”。
“生成验证列”平台支持您使用多种方法创建训练集、验证集和测试集。可以指定分层、分组或割点列,以确定用于创建验证列的方法。