总体统计量

预测和专业建模 > 提升树 > “提升树”报表 > 总体统计量

发布日期: 08/07/2020

总体统计量

显示训练集以及验证集和测试集（若已指定）的拟合统计量。

假定您使用“提升树规格”窗口中的“在数个拆分和学习率下进行多个拟合”选项拟合多个模型。之后，结果显示在“总体统计量”报表和“累积验证”报表中的模型就是验证集的熵 R 方值（对于分类响应）或 R 方（对于连续响应）最大的模型。

“测度”报表

（仅可用于分类响应。）提供训练集以及验证集和测试集（若已指定）的以下统计量。

注意：对于熵 R 方和广义 R 方，值越接近 1 表示拟合效果越好。对于 -Log p 均值、RMSE、绝对偏差的均值和误分类率，值越小表示拟合效果越好。

熵 R 方

比较拟合模型和恒定概率模型的对数似然的一种拟合测度。它的范围介于 0 到 1 之间。请参见熵 R 方。

广义 R 方

可以应用到一般回归模型的测度。它基于似然函数 L，并且统一尺度后最大值为 1。值为 1 表示完美模型，值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应，“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2，它是 Cox and Snell 伪 R2 的标准化版本。

-Log p 均值

-log(p) 的平均值，其中 p 是与发生的事件有关的拟合概率。

RMSE

均方根误差，已针对自由度进行调整。差值介于 1 和 p（实际发生的响应水平的拟合概率）之间。

绝对偏差的均值

响应的真实值与预测值的差值绝对值的平均值。差值介于 1 和 p（实际发生的响应水平的拟合概率）之间。

误分类率

具有最高拟合概率的响应类别不是观测到的类别的比率。

数目

观测数。

混淆矩阵

（仅可用于分类响应。）显示训练集以及验证集和测试集（若已指定）的分类统计量。

决策矩阵

（仅适用于分类响应，并且响应具有“收益矩阵”列属性或者您使用“指定收益矩阵”选项指定了成本。）为训练集以及验证集和测试集（若已指定）提供“决策计数”矩阵和“决策率”矩阵。请参见分割的更多示例。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).