バギングは様々な目的で使用されますが、そのうちの1つに、予測能力を高めるというものがあります。特に、不安定なモデルで役立ちます。この例では、「Tiretread.jmp」サンプルデータを使用します。3つの因子(「シリカ」、「シラン」、「硫黄」)と、4つの応答(「摩擦」、「引張応力」、「伸び」、「硬度」)があります。まず、これらの3つの因子から4つの応答変数を同時に予測するモデルとして、ニューラルネットワークモデルをあてはめます。次に、ニューラルネットワークモデルでバギングを実行します。最後に、予測結果を比較し、バギングによって予測能力が向上したことを確かめます。
1.
|
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Tiretread.jmp」を開きます。
|
2.
|
[分析]>[予測モデル]>[ニューラル]を選択します。
|
3.
|
4.
|
5.
|
[OK]をクリックします。
|
7.
|
[実行]をクリックします。
|
8.
|
「モデル NTanH(3)」の赤い三角ボタンをクリックし、[計算式の保存]を選択します。
|
1.
|
「モデル NTanH(3)」の赤い三角ボタンをクリックし、[プロファイル]を選択します。
|
2.
|
「予測プロファイル」の赤い三角ボタンをクリックし、メニューから[バギング予測の保存]を選択します。
|
5.
|
[OK]をクリックします。
|
データテーブルのウィンドウに戻ります。「予測式 <列名> バギング平均」、「標準誤差 <列名> バギング平均」、「標準偏差 <列名> バギング」の3つの新しい列が追加されています。「予測式 <列名> バギング平均」列が、最終的な予測値です。
図3.31 バギングの後にデータテーブルに追加された列
1.
|
[分析]>[予測モデル]>[モデルの比較]を選択します。
|
2.
|
「予測式摩擦 2」を選択し、[Y, 予測子]をクリックします。
|
3.
|
「予測式 摩擦 バギング平均」を選択し、[Y, 予測子]をクリックします。
|
4.
|
[OK]をクリックします。
|
5.
|
[摩擦]を選択して[OK]をクリックします。
|
6.
|
「モデルの比較」の赤い三角ボタンのメニューから[予測値と実測値のプロット]を選択します。
|
図3.32 「摩擦」に対する予測値の比較
「適合度指標」と「予測値と実測値のプロット」を、「摩擦」に対する予測値の比較に示します。バギングによる予測値は青で、元のニューラルネットワークモデルによる予測値は赤で示されています。全体的に見て、元のモデルよりもバギングの予測値のほうが、線の近くに位置しています。バギングの予測値のほうが線に近いため、その「R2乗」の値は0.6803と、元のモデルの値よりも大きくなっています。つまり、バギングによって「摩擦」の予測値が向上したと結論付けることができます。
この例では、「摩擦」の予測値を比較しました。他の応答変数の予測値を比較するには、第 2 步から第 6 步までの手順を繰り返してください。その際、「摩擦」を別の応答変数に変更します。「硬度」に対する予測値の比較は、「硬度の適合度指標」レポートです。このレポートでも、「摩擦の適合度指標」レポートと同様の結果が導かれています。バギングの予測値の「R2乗」の値は、元のモデルの値よりもわずかに大きく、適合度が向上していることが示唆されています。
図3.33 「硬度」に対する予測値の比較