•
|
训练集是用于评估模型参数的部分。
|
•
|
验证集是评估或验证模型的预测能力的部分。
|
使用验证方法时,显示执行按钮。使用执行按钮可反复拆分而不必重复点击拆分按钮。点击执行按钮后,将反复执行拆分,直到验证 R 方值大于接下来的 10 个拆分所获得的 R 方值时结束。该规则可能会生成不太容易解释但预测能力很强的复杂树。
将原始数据随机划分为 K 个子集。这 K 个子集依次对基于剩余 k-1 个子集的数据构建的模型进行验证,总共拟合 K 个模型。基于交叉验证 R 方选择最终模型,其中应用停止规则来避免过度拟合模型。该方法适合小数据集,因为它能充分利用有限的数据。请参见K 重交叉验证。