训练集是用于评估模型参数的部分。
验证集是评估或验证模型的预测能力的部分。
测试集是对模型预测能力的最终独立评估。仅当使用验证列时才能使用测试集。请参见启动“分割”平台
使用验证方法时,显示执行按钮。使用执行按钮可反复拆分而不必重复点击拆分按钮。点击执行按钮后,将反复执行拆分,直到验证 R 方值大于接下来的 10 个拆分所获得的 R 方值时结束。该规则可能会生成不太容易解释但预测能力很强的复杂树。
使用执行按钮会启用拆分历史记录命令。若使用执行按钮生成的树包含 40 个以上的节点,则会禁用显示树状结构命令。
将原始数据随机划分为 K 个子集。这 K 个子集依次对基于剩余 k-1 个子集的数据构建的模型进行验证,总共拟合 K 个模型。基于交叉验证 R 方选择最终模型,其中应用停止规则来避免过度拟合模型。该方法适合小数据集,因为它能充分利用有限的数据。请参见K 重交叉验证