“ROC 曲线”选项仅对分类响应可用。受试者操作特征 (ROC) 曲线显示模型的拟合概率在排序响应水平方面的效率。有关 ROC 曲线的简介,请参见《基本分析》中的ROC 曲线。
分割模型中每个观测的预测响应为介于 0 到 1 的值。要使用预测响应来将观测分类为正数或负数,将使用一个截断点。例如,若截断点是 0.5,则具有预测响应 0.5 或之上的观测被分类为正数,在 0.5 之下的观测则为负数。分类可能有权衡,因为截断点变了。
为了生成 ROC 曲线,将每个预测响应水平视为可能的截断点,并为每个可能的截断点计算以下值:
• 灵敏度是真阳率或具有预测响应的正观测大于截断点的百分比。
• 特异度是真阴率或具有预测响应的负观测小于截断点的比例。
ROC 曲线标绘灵敏度与 (1 - 特异度)。具有 n 个拆分的分割模型具有 n+1 个预测值。分割模型的 ROC 曲线具有 n+1 个线段。
若您的响应具有两个以上的水平,对于每个响应水平与其他水平,“分割”报表包含单独的 ROC 曲线。每个曲线是阳性响应水平的表示。若只有两个水平,一个曲线是另一曲线的反射。
图 4.17 三水平响应的 ROC 曲线
若模型可以对响应值实现完美的等级排序,则排序后的数据首先包含所有正值,后跟所有其他值。在这种情况下,曲线先一直移到顶部,然后再完全移至右侧。若模型预测效果不好,则曲线沿着对角线从图左下角延伸到右上角。
实际上,ROC 曲线位于对角线之上。曲线下的面积指示模型的拟合优度。值 1 指示完美拟合,接近 0.5 的值指示模型无法区分各组。
响应有两个以上的水平时,ROC 曲线图支持您查看哪个响应类别具有曲线下的最大面积。