模型验证集汇总

预测和专业建模 > Bootstrap 森林法 > “Bootstrap 森林法”报表 > 模型验证集汇总

发布日期: 08/07/2020

模型验证集汇总

（仅当您选择了“Bootstrap 森林法规格”窗口中的“在数个项数下进行多个拟合”选项时才可用。）提供所有模型拟合的拟合统计量。请参见分类响应的“Bootstrap 森林法”报表和“多重拟合”面板。

规格

显示拟合模型时使用的设置。

总体统计量

提供训练集以及验证集和测试集（若已指定）的拟合统计量。报表的具体形式取决于响应的建模类型。

假定您使用“Bootstrap 森林法规格”窗口中的“在数个项数下进行多个拟合”选项拟合多个模型。之后，结果显示在“总体统计量”报表和“累积验证”报表中的模型就是验证集的熵 R 方值（对于分类响应）或 R 方（对于连续响应）最大的模型。

分类响应

“测度”报表

提供训练集以及验证集和测试集（若已指定）的以下统计量。

注意：对于熵 R 方和广义 R 方，值越接近 1 表示拟合效果越好。对于 -Log p 均值、RMSE、绝对偏差的均值和误分类率，值越小表示拟合效果越好。

熵 R 方

比较拟合模型和恒定概率模型的对数似然的一种拟合测度。它的范围介于 0 到 1 之间。请参见熵 R 方。

广义 R 方

可以应用到一般回归模型的测度。它基于似然函数 L，并且统一尺度后最大值为 1。值为 1 表示完美模型，值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应，“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2，它是 Cox and Snell 伪 R2 的标准化版本。

-Log p 均值

-log(p) 的平均值，其中 p 是与发生的事件有关的拟合概率。

RMSE

均方根误差，已针对自由度进行调整。差值介于 1 和 p（实际发生的响应水平的拟合概率）之间。

绝对偏差的均值

响应的真实值与预测值的差值绝对值的平均值。差值介于 1 和 p（实际发生的响应水平的拟合概率）之间。

误分类率

具有最高拟合概率的响应类别不是观测到的类别的比率。

数目

观测数。

混淆矩阵

（仅可用于分类响应。）显示训练集以及验证集和测试集（若已指定）的分类统计量。

决策矩阵

（仅适用于分类响应，并且响应具有“收益矩阵”列属性或者您使用“指定收益矩阵”选项指定了成本。）为训练集以及验证集和测试集（若已指定）提供“决策计数”矩阵和“决策率”矩阵。请参见分割的更多示例。

连续响应

“单个树”报表

提供“袋内”和“袋外”观测在所有树中经过平均的 RMSE 值。用于构造树的训练集观测称为袋内观测。未用于构造树的训练观测称为袋外 (OOB) 观测。

对于每棵树，袋外 RMSE 都计算为除以 OOB 观测数的误差平方和的平方根。每棵树的袋外 RMSE 的平方值在“按树汇总”报表中作为 OOB 平均误差平方和提供。

R 方和 RMSE 报表

提供针对训练集以及验证集和测试集（若定义）的 R 方、均方根误差和观测数。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).