“按树汇总”报表涉及袋内和袋外观测的概念。对于单个树,在抽取用于拟合树的观测的 Bootstrap 样本时是有回放的。即便指定对 100% 的观测抽样,但因为抽样时有回放,所以未使用的观测数的预期比例为 1/e。对于每一棵树,这些未使用的观测都称为袋外观测。拟合树中使用的观测称为袋内观测。
“按树汇总”报表显示每棵树的以下汇总统计量:
拆分
决策树中的拆分数。
排名
以升序排列的树的 OOB 损失的排名。OOB 损失最小的数字树的排名为 1。
OOB 损失
一个测度,用于衡量当应用到“袋外”行时树的总预测误差。较低的值指示较高的预测准确性。
OOB 平均损失
除以 OOB 行数 (OOB 个数) 后的 OOB 损失。
R 方
(仅可用于连续响应。)树的 R 方值。
IB 误差平方和
(仅可用于连续响应。)“袋内”行的误差平方和。
IB 平均误差平方和
(仅可用于连续响应。)“袋内”行的误差平方和除以“袋内”观测数。“袋内”观测数等于训练集中的观测数乘以您在“Bootstrap 森林法规格”窗口中指定的 Bootstrap 抽样率。
OOB 个数
(仅可用于连续响应。)“袋外”行数。
OOB 误差平方和
(仅可用于连续响应。)当树应用到“袋外”行时的误差平方和。
OOB 平均误差平方和
(仅可用于连续响应。)除以 OOB 行数 (OOB 个数) 后的 OOB 误差平方和。