在很多情况下使用 Bagging。其中之一是为了提高预测功效。Bagging 对不稳定的模型特别有用。本例使用 Tiretread.jmp 样本数据表。共有三个因子(硅石、硅烷和硫磺)和四个响应(磨损、弹性系数、伸长和硬度)。首先,您拟合一个神经网络模型来同时预测作为三个因子的函数的四个响应变量。然后,您对神经网络模型执行 Bagging。最后,您比较预测结果,查看通过 Bagging 获得的改进。
1. 选择帮助 > 样本数据库,然后打开 Tiretread.jmp。
2. 选择分析 > 预测建模 > 神经。
3. 选择磨损、弹性系数、伸长和硬度,然后点击 Y,响应。
4. 选择硅石、硅烷和硫磺,然后点击 X,因子。
5. 点击确定。
6. (可选)在“随机种子”旁边输入 2121。
注意:由于在神经网络模型中是随机选择验证集,结果可能有所不同。输入上面的种子,这样您可以重现本例中所示的结果。
7. 点击执行。
8. 点击“模型 NTanH(3)”旁边的红色小三角并选择保存公式。
注意:该选项将神经网络模型的所有响应变量的预测值保存到数据表。稍后将这些值与从 Bagging 获得的预测进行比较。
构造了初始模型后,您可以使用该模型执行 Bagging。通过“预测刻画器”访问 Bagging 功能。
1. 点击“模型 NTanH(3)”旁边的红色小三角并选择刻画器。
“预测刻画器”显示在报表底部。
2. 点击“预测刻画器”红色小三角并选择保存 Bagged 预测。
3. 在“Bootstrap 样本数”旁边输入 100。
4. (可选)在“随机种子”旁边输入 2121。
注意:由于放回抽样是随机的,所以结果会有所不同。要重现本例的精确结果,请设置“随机种子”。
5. 点击确定。
返回数据表。对于每个响应变量,有三个分别表示为预测公式-<列名> Bagged 均值、标准误差-<列名> Bagged 均值、<列名> Bagged 标准差的新列。预测公式-<列名> Bagged 均值列是最终预测。
图 3.31 Bagging 后添加到数据表的列
为了查看 Bagging 如何提高预测功效,将 Bagged 模型的预测与原始模型预测进行比较。使用“模型比较”平台一次查看一个响应变量。
1. 选择分析 > 预测建模 > 模型比较。
2. 选择预测“磨损”,然后点击 Y,预测变量。
3. 选择预测公式-磨损 Bagged 均值,然后点击 Y,预测变量。
4. 点击确定。
将显示包含列列表的窗口。
5. 选择磨损,然后点击确定。
6. 点击“模型比较”红色小三角并选择标绘“预测值-实际值”图。
图 3.32 磨损预测的比较
“拟合测度”报表和“预测值-实际值”图显示在图 3.32 中。从 Bagging 得到的预测用蓝色显示。从原始神经网络模型得到的预测用红色显示。通常,Bagging 预测比原始模型预测更接近实际线。因为 Bagging 预测更接近实际线,因此 Bagged 预测的 R 方值 0.8379 高于原始模型预测的 R 方值。您得出结论:Bagging 改进了磨损的预测。
该示例比较了磨损的预测。要比较其他响应变量的预测,请按照第 2 步到第 6 步执行,将磨损替换为所需的响应变量。作为另一示例,图 3.33 显示硬度的“拟合测度”报表。该报表显示的结果与磨损的“拟合测度”报表结果相似。Bagged 预测的 R 方值略高于原始模型预测的 R 方值,这说明拟合效果更好,预测得到改进。
图 3.33 硬度预测的比较