当您执行具有二值结果的简单 Logistic 回归时,系统提供用于该分析的 ROC 曲线的平台选项。选择 ROC 曲线选项后,您必须指定要用作正响应的水平。
注意:另见ROC 曲线的示例。
假定您有作为诊断测量的 x 值,并要确定指示以下内容的 x 的阈值:
• 若 x 值大于阈值,则条件存在。
• 若 x 值小于阈值,则条件不存在。
例如,您可以测量血液成分水平作为诊断检验以预测某种癌症。现在考虑当更改阈值时诊断检验的情况,它会导致更多或更少假阳性和假阴性。然后您标绘这些比率。理想情况是在很窄范围的 x 准则值能最好地区分真阴性和真阳性。受试者操作特征 (ROC) 曲线显示这一转变以多快速度发生。ROC 曲线的目标是得到最大化曲线下的面积的诊断。
医学中使用了两个标准定义:
• 灵敏度:给定的 x 值(检验或测量)正确预测现有条件的概率。对于给定的 x 值,错误预测某一现有条件的概率为 1 – 灵敏度。
• 特异度:检验正确预测条件不存在的概率。
ROC 曲线是显示每个 x 值的(1 – 特异度)对比灵敏度图。ROC 曲线下的面积是用于汇总曲线所含信息的常见指数。
若检验预测效果好,将有一个值,整个异常人群所在的值范围将落在该值之上且所有正常值范围将落在该值之下。它将非常灵敏并穿过网格上的点 (0,1)。ROC 曲线离这个理想点越近,它的判别能力越强。没有预测能力的检验生成一条沿网格对角线的曲线(DeLong 和其他人 1988)。
ROC 曲线是假阳性率和真阳性率之间关系的图形表示法。估计该关系的标准方法是使用曲线下的面积,它显示在报表中的图下方。在图中,黄线是根据 ROC 曲线的正切 45 度角绘制的。它标记了假定假阴性和假阳性具有相似成本时的一个理想截止点。