在 K 重交叉验证中,将整个观测集分割为 K 个子集,称之为重。每个重视为保留样本,其余观测则作为训练集。
不加限制的交叉验证 R 方值优化可能过度拟合模型。要解决该问题,当交叉验证 R 方改进量最小时,K 重交叉验证停止规则终止步进。具体来说,停止规则选择一个模型,对于该模型,下十个模型的交叉验证 R 方的改进量均不超过 0.005 个单位。
选择“K 重交叉验证”选项时,显示“交叉验证”报表。拆分决策树时更新该报表中的结果。或者,若您点击“执行”,分级显示项显示最终模型的结果。
“交叉验证”报表显示以下内容:
k 重
重数。
-2LogLike 或 SSE
响应为分类变量时给出负对数似然值的两倍(-2对数似然)。响应是连续变量时,给出误差平方和 (SSE)。第一行给出重上的平均结果。第二行给出单个模型拟合所有观测的结果。
R 方
第一行给出重上的平均 R 方值。第二行给出单个模型拟合所有观测的 R 方值。