この例では、13個の説明変数を使って男性の体脂肪率を予測します。「Body Fat.jmp」サンプルデータには、体脂肪率の推定値が含まれています(この体脂肪率の推定値は、身体各部の周囲長と水中で測定した体重に基づいて算出されています)。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Body Fat.jmp」を開きます。
2. [分析]>[予測モデル]>[K近傍法]を選択します。
3. 「体脂肪率」を選択し、[Y, 目的変数]をクリックします。
4. 「年齢」から「手首囲(cm)」までを選択し、[X, 説明変数]をクリックします。
5. 「Validation」列を選択し、[検証]ボタンをクリックします。
6. [OK]をクリックします。
7. 「体脂肪率」の赤い三角ボタンをクリックして、[予測値と実測値のプロット]を選択します。
図7.3 「K近傍法」レポート
「検証セット」における「RMSE」の値が最も小さくなっているモデルは、K = 8のモデルです。K近傍法モデルのなかでは、8個の近傍点に基づくモデルが最も予測精度が高いようです。学習セットの予測値と実測値のプロットは、予測値が実際の値に類似していることを示す点が直線に沿っており、予測値が実測値に近いことを示しています。検証セットのプロット上のポイントの大部分は直線に沿って分布しますが、上端のオブザベーションのいくつかは少し離れています。