応答変数が連続尺度の場合は、「予測値と実測値のプロット」が実測値と予測値の関係を示す典型的なグラフです。ディシジョンツリーをあてはめた場合、各葉に属するすべてのデータ行で予測値は同じになるので、葉の数がn枚の場合、「予測値と実測値のプロット」の横軸には、多くてn個の異なる予測値にプロットされます。よって、実測値は、n本の縦線上で各葉の平均を中心に散らばります。
対角線はY = Xの直線です。あてはまりが完全なら、すべての点が対角線上に並びます。検証セットが使用されている場合は、学習セットと検証セットの両方におけるグラフが描かれます(図4.16)。
図4.16 応答変数が連続尺度である場合の「予測値と実測値のプロット」