Figure 10.7显示了连续响应的初始“模型比较”报表的示例。
图 10.7 最初的“模型比较”报表
预测变量报表显示所有响应以及针对每个响应比较的所有模型。同时还列出创建预测变量列的拟合平台。
拟合测度报表显示每个模型的拟合测度。连续响应和分类响应的报表中会显示不同的列。
R 方
R 方统计量。在不含缺失值的数据表中,“模型比较”报表与原始模型中的 R 方统计量保持一致。不过,若存在缺失值,R 方统计量会有所不同。
RASE
均方预测误差的平方根。它按以下方式计算:
‒ 对预测误差(实际响应和预测响应之间的差值)求平方和以获得 SSE。
‒ 用 n 表示观测数。
‒ RASE 是:
RASE =
AAE
平均绝对误差。
频数
包含每行频数统计的列。
熵 R 方
1 减去拟合模型与常数概率模型的负对数似然比。它的范围介于 0 到 1 之间。
广义 R 方
可以应用到一般回归模型的测度。它基于似然函数 L,并且统一尺度后最大值为 1。值为 1 表示完美模型,值为 0 表示并不比常数模型好的模型。对于标准最小二乘设置中的连续正态响应,“广义 R 方”测度简化为传统 R 方。“广义 R 方”亦称 Nagelkerke/Craig and Uhler R2,它是 Cox and Snell 伪 R2 的标准化版本。请参见 Nagelkerke (1991)。
-Log p 均值
-log(p) 的平均值,其中 p 是与发生的事件有关的拟合概率。
RMSE
均方根误差,已针对自由度进行调整。对于分类响应,差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
绝对偏差的均值
响应的真实值与预测值的差值绝对值的平均值。对于分类响应,差值介于 1 和 p(实际发生的响应水平的拟合概率)之间。
误分类率
具有最高拟合概率的响应类别不是观测到的类别的比率。
数目
观测数。
训练和验证拟合测度提供了关于分类响应的拟合测度的详细信息。