发布日期: 08/07/2020

模型验证集汇总

(仅当您选择了“Bootstrap 森林法规格”窗口中的“在数个项数下进行多个拟合”选项时才可用。)提供所有模型拟合的拟合统计量。请参见分类响应的“Bootstrap 森林法”报表“多重拟合”面板

规格

显示拟合模型时使用的设置。

总体统计量

提供训练集以及验证集和测试集(若已指定)的拟合统计量。报表的具体形式取决于响应的建模类型。

假定您使用“Bootstrap 森林法规格”窗口中的“在数个项数下进行多个拟合”选项拟合多个模型。之后,结果显示在“总体统计量”报表和“累积验证”报表中的模型就是验证集的熵 R 方值(对于分类响应)或 R 方(对于连续响应)最大的模型。

分类响应

“测度”报表

提供训练集以及验证集和测试集(若已指定)的以下统计量。

注意:对于熵 R 方和广义 R 方,值越接近 1 表示拟合效果越好。对于 -Log p 均值、RMSE、绝对偏差的均值和误分类率,值越小表示拟合效果越好。

熵 R 方

比较拟合模型和恒定概率模型的对数似然的一种拟合测度。它的范围介于 0 到 1 之间。请参见熵 R 方

广义 R 方

可以应用到一般回归模型的测度。它基于似然函数 L,并且统一尺度后最大值为 1。值为 1 表示完美模型,值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应,“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2,它是 Cox and Snell 伪 R2 的标准化版本。

-Log p 均值

-log(p) 的平均值,其中 p 是与发生的事件有关的拟合概率。

RMSE

均方根误差,已针对自由度进行调整。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。

绝对偏差的均值

响应的真实值与预测值的差值绝对值的平均值。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。

误分类率

具有最高拟合概率的响应类别不是观测到的类别的比率。

数目

观测数。

混淆矩阵

(仅可用于分类响应。)显示训练集以及验证集和测试集(若已指定)的分类统计量。

决策矩阵

(仅适用于分类响应,并且响应具有“收益矩阵”列属性或者您使用“指定收益矩阵”选项指定了成本。)为训练集以及验证集和测试集(若已指定)提供“决策计数”矩阵和“决策率”矩阵。请参见分割的更多示例

连续响应

“单个树”报表

提供“袋内”和“袋外”观测在所有树中经过平均的 RMSE 值。用于构造树的训练集观测称为袋内观测。未用于构造树的训练观测称为袋外 (OOB) 观测。

对于每棵树,袋外 RMSE 都计算为除以 OOB 观测数的误差平方和的平方根。每棵树的袋外 RMSE 的平方值在“按树汇总”报表中作为 OOB 平均误差平方和提供。

R 方和 RMSE 报表

提供针对训练集以及验证集和测试集(若定义)的 R 方、均方根误差和观测数。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).