ロジスティック回帰で応答が2値の場合は、ROC曲線コマンドがプラットフォームのポップアップメニューに表示されます。[ROC曲線]オプションを選択した場合は、どちらの水準を「陽性」にするかを指定する必要があります。
メモ: ROC曲線の例も参照してください。
ある疾患にかかっているかどうかを、次のようにXの値によって診断するとします。
• Xの値が特定の閾値より大きいときは、その疾患にかかっていると診断するとします。
• Xの値が閾値より小さいときは、その疾患にかかっていないと診断するとします。
たとえば、特定の種類のガンを診断する検査では、ある血液成分の濃度を測定します。診断における閾値をいろいろな値に変更し、それに伴って変化した偽陽性率と偽陰性率をプロットしてみれば、診断の良し悪しが分かります。分析の目的は、真陰性と真陽性を最も高める、Xに対する閾値を求めることです。受診者動作特性(ROC)曲線を見ると、これらの値がどれだけ急激に変化するかがわかります。理想的な診断では、ROC曲線における曲線下の面積(AUC; Area Under Curve)が大きくなります。
次の2つは、医学の分野で使用されている概念です。
• 感度 ある状態が存在しているときに、その状態が存在していることを、与えられたXの閾値によって(診断や検査によって)正確に予測する確率。Xの閾値が与えられているときに、状態が本当は存在しているのに存在していないと予測される確率は、「1-感度」です。
• 特異度 ある状態が存在していないときに、その状態が存在しないことを、診断によって正確に予測する確率。
受診者動作特性(ROC)曲線は、Xの閾値ごとに、「1-特異度」に対して感度をプロットしたものです。ROC曲線より下の面積(AUC)は、曲線によって示唆された情報を要約するための指標として使用されます。
検査による予測が完全であれば、1つの閾値を境にして、それより大きな確率予測値となっているすべての対象者で実際にある状態になっており、それより小さな確率予測値となっているすべての検査対象者で実際にある状態になっていない、というデータになっています。その場合、曲線は完璧な感度を持ち、グリッド上の(0,1)の点を通ります。ROC曲線がこの理想の点に近ければ近いほど、モデルによる判別能力は高くなります。逆に、予測することがまったくできない場合は、ROC曲線はグリッドの対角線上を通ります(DeLong et al. 1988)。
ROC曲線は、偽陽性率と偽陰性率の関係をグラフ化したものです。この関係は通常、曲線下の面積(AUC)に基づいて評価されます。この曲線下の面積(AUC)は、レポートにおいてプロットの下に表示されています。また、プロット内には、ROC曲線に接する45度の線が黄色で表示されます。黄色い線と曲線との交点は、偽陰性と偽陽性のコストが等しいと仮定したときに、コストが最小になる点を示しています。