この例では、13個の説明変数を使って男性の体脂肪率を予測します。「Body Fat.jmp」サンプルデータには、体脂肪率の推定値が含まれています(この体脂肪率の推定値は、身体各部の周囲長と水中で測定した体重に基づいて算出されています)。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Body Fat.jmp」を開きます。
2. [分析]>[予測モデル]>[K近傍法]を選択します。
3. 「体脂肪率」を選択し、[Y, 目的変数]をクリックします。
4. 「年齢」から「手首囲(cm)」までを選択し、[X, 説明変数]をクリックします。
5. 「検証」列を選択し、[検証]ボタンをクリックします。
6. [OK]をクリックします。
7. 「体脂肪率」の赤い三角ボタンをクリックして、[予測値と実測値のプロット]を選択します。
図7.3 「K近傍法」レポート
「検証セット」における「RASE」の値が最も小さくなっているモデルは、K = 8のモデルです。つまり、あてはめたK近傍法モデルのなかでは、8個の近傍点に基づくモデルが最も予測精度が高くなっています。学習セットの「予測値と実測値のプロット」は、点が直線に沿っており、予測値が実測値に近いことを示しています。検証セットのプロットでも、直線に沿って点は分布しますが、上端のいくつかの点は少し離れています。