この例では、「Boston Housing.jmp」データテーブルを使用します。地域ごとの住宅価格の中央値を、その地域の地理的特性によって予測するモデルを作成してみましょう。次の手順に従ってニューラルネットワークモデルを作成します。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Boston Housing.jmp」を開きます。
2. [分析]>[予測モデル]>[ニューラル]を選択して、「ニューラル」プラットフォームを起動します。
3. 「持ち家の価格」を[Y, 目的変数]に指定します。
4. その他の列(「犯罪率」から「低所得者」まで)を[X, 説明変数]に指定します。
5. [OK]をクリックします。
6. 「検証データ抽出確率」に「0.2」と入力します。
7. 「乱数シード値」に「1234」と入力します。
メモ: 検証セットが無作為に抽出されるため、一般に、結果は図とは異なります。上記のシード値を入力すると、この例で示す結果を再現できるようになります。
8. 第1層のノード数を「3」に設定します。
9. 「説明変数の変換」オプションをオンにします。
10. [実行]をクリックします。
図3.6 「ニューラル」レポート
学習セットと検証セットの両方に対し、結果が表示されます。検証セットの結果を見ると、得られたニューラルネットワークが将来のデータをどれぐらい予測できるかが分かります。
検証セットのR2乗は0.913と高い値になっています。このことは、学習に使用されなかったデータについても、モデルの予測能力が高いことを示します。モデルのあてはめを示すもう1つの指標として、「モデル NTanH(3)」の赤い三角ボタンをクリックし、[予測値と実測値のプロット]を選択します。
図3.7 予測値と実測値のプロット
点が回帰直線上に並んでいることから、予測値が実測値に近いことがわかります。
X変数が予測値に与える影響を把握するため、「モデル NTanH(3)」の赤い三角ボタンのメニューから[プロファイル]を選択します。
図3.8 プロファイル
変数の中には、プロファイルの傾きが正のものと負のものがあります。たとえば、変数の「部屋数」は傾きが正です。地域において部屋数が多い家が多いほど、住宅価格の中央値は高くなることを示します。「先生と生徒の比」は、町ごとに求められた、先生1人あたりの生徒数です。この変数の傾きは負です。これは、先生1人あたりの生徒数が増えるほど、住宅価格の中央値が低くなる傾向があることを意味します。