在“提升树”平台中,“总体统计量”报表显示训练集以及验证集和测试集(若已指定)的拟合统计量。
假定您使用“提升树规格”窗口中的“在数个拆分和学习率下进行多个拟合”选项拟合多个模型。之后,结果显示在“总体统计量”报表和“累积验证”报表中的模型就是验证集的熵 R 方值(对于分类响应)或 R 方(对于连续响应)最大的模型。
(仅可用于分类响应。)提供训练集以及验证集和测试集(若已指定)的以下统计量。
注意:对于熵 R 方和广义 R 方,值越接近 1 表示拟合效果越好。对于 -Log p 均值、RASE、绝对偏差的均值和误分类率,值越小表示拟合效果越好。
熵 R 方
比较拟合模型和恒定概率模型的对数似然的一种拟合测度。它的范围介于 0 到 1 之间。请参见“熵 R 方”。
广义 R 方
可以应用到一般回归模型的测度。它基于似然函数 L,并且统一尺度后最大值为 1。值为 1 表示完美模型,值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应,“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2,它是 Cox and Snell 伪 R2 的标准化版本。
-Log p 均值
-log(p) 的平均值,其中 p 是与发生的事件有关的拟合概率。
RASE
均方根预测误差。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
绝对偏差的均值
响应的真实值与预测值的差值绝对值的平均值。差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
误分类率
具有最高拟合概率的响应类别不是观测到的类别的比率。
数目
观测数。
(仅可用于分类响应。)显示训练集以及验证集和测试集(若已指定)的分类统计量。“混淆矩阵”报表包含混淆矩阵和混淆率矩阵。混淆矩阵是实际响应和预测响应的双向分类。混淆率矩阵等同于混淆矩阵,只不过其中的数字要除以行合计。
(仅适用于分类响应,并且响应具有“收益矩阵”列属性或者您使用“指定收益矩阵”选项指定了成本。)为训练集以及验证集和测试集(若已指定)提供“决策计数”矩阵和“决策率”矩阵。请参见““分割”平台的更多示例”。