显示训练集以及验证集和测试集(若已指定)的拟合统计量。
假定您使用“提升树规格”窗口中的“在数个拆分和学习率下进行多个拟合”选项拟合多个模型。之后,结果显示在“总体统计量”报表和“累积验证”报表中的模型就是验证集的熵 R 方值(对于分类响应)或 R 方(对于连续响应)最大的模型。
(仅可用于分类响应。)提供训练集以及验证集和测试集(若已指定)的以下统计量。
注意:对于熵 R 方和广义 R 方,值越接近 1 表示拟合效果越好。对于 -Log p 均值、RMSE、绝对偏差的均值和误分类率,值越小表示拟合效果越好。
熵 R 方
比较拟合模型和恒定概率模型的对数似然的一种拟合测度。它的范围介于 0 到 1 之间。请参见熵 R 方。
广义 R 方
可以应用到一般回归模型的测度。它基于似然函数 L,并且统一尺度后最大值为 1。值为 1 表示完美模型,值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应,“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2,它是 Cox and Snell 伪 R2 的标准化版本。
-Log p 均值
-log(p) 的平均值,其中 p 是与发生的事件有关的拟合概率。
RMSE
均方根误差,已针对自由度进行调整。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
绝对偏差的均值
响应的真实值与预测值的差值绝对值的平均值。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
误分类率
具有最高拟合概率的响应类别不是观测到的类别的比率。
数目
观测数。
(仅可用于分类响应。)显示训练集以及验证集和测试集(若已指定)的分类统计量。
(仅适用于分类响应,并且响应具有“收益矩阵”列属性或者您使用“指定收益矩阵”选项指定了成本。)为训练集以及验证集和测试集(若已指定)提供“决策计数”矩阵和“决策率”矩阵。请参见分割的更多示例。