「Tiretread.jmp」データテーブルで、「摩擦」のみを3因子で予測するとしましょう。この例では、「摩擦」を予測するために、一般化回帰モデルをあてはめます。次に、このモデルでバギングを実行します。最後に、新しく追加されたデータに対して予測値を求め、その予測の精度を検討します。検討材料として、予測の信頼区間を求めます。
1.
|
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Tiretread.jmp」を開きます。
|
2.
|
[分析]>[モデルのあてはめ]を選択します。
|
3.
|
「摩擦」を選択し、[Y]をクリックします。
|
4.
|
「手法」のリストから[一般化回帰]を選択します。
|
5.
|
6.
|
[実行]をクリックします。
|
7.
|
[実行]をクリックします。
|
1.
|
「適応法Lassoによる推定(検証法: 検証列)」の赤い三角ボタンのメニューから、[プロファイル]>[プロファイル]を選択します。
|
2.
|
「予測プロファイル」の赤い三角ボタンをクリックし、メニューから[バギング予測の保存]を選択します。
|
5.
|
[各予測を計算式として保存]が選択されていることを確認します。
|
6.
|
[OK]をクリックします。
|
データテーブルのウィンドウに戻ります。「予測式 摩擦 バギング平均」、「標準誤差 摩擦 バギング平均」、「標準偏差 摩擦 バギング」の3つの新しい列が追加されています。「予測式 摩擦 バギング平均」列が、最終的な予測値です。
データテーブルの各行に、「摩擦」の予測式とその標準誤差が追加されました。ここで、「シリカ」、「シラン」、「硫黄」がそれぞれ0.9、43、2という値になっているときの予測値を求めるとします。先ほど、[各予測を計算式として保存]オプションを使って、個々のバギングモデルの計算式を保存しました。この保存した計算式によって、応答変数である「摩擦」を予測し、その信頼区間を求めることができます。ここでは、先ほど述べた因子値について、M個の予測値を求め、その分布を求めることにします。これらM個の予測値を平均したものが、最終的な予測値となります。また、M個の予測値の分布を見れば、予測の精度がわかります。
1.
|
データテーブルで、[行]>[行の追加]を選択します。
|
2.
|
「追加する行数」に「1」と入力し、[OK]をクリックします。
|
3.
|
新しい行の「シリカ」の列に、「0.9」と入力します。
|
4.
|
新しい行の「シラン」の列に、「43」と入力します。
|
5.
|
新しい行の「硫黄」の列に、「2」と入力します。
|
図3.34 新しい行の値
6.
|
[テーブル]>[転置]を選びます。
|
7.
|
「バギング 摩擦 (500/0)」を選択し、[転置する列]をクリックします。
|
8.
|
[OK]をクリックします。
|
9.
|
[分析]>[一変量の分布]を選択します。
|
10.
|
「行 21」を選択して、[Y, 列]をクリックします。
|
11.
|
[OK]をクリックします。
|
12.
|
「行 21」の赤い三角ボタンをクリックし、メニューから[表示オプション]>[横に並べる]を選択します。
|
図3.35 「一変量の分布」レポート
「一変量の分布」レポートの「一変量の分布」レポートには、各バギングモデルからの摩擦の予測値の分布情報が表示されています。新しく追加したデータに対する「摩擦」の最終的な予測値は104.44です。これは、M個のバギング予測の平均値です。この予測値の標準誤差は、4.56です。分位点から、この新しく追加したデータに対する予測値の信頼区間も求めることもできます。この例では、新しい予測値の95%信頼区間は、95.89~112.98です。