本例使用 Boston Housing.jmp 数据表。假定您想要创建一个模型来预测住房价格中位数,它可以表示为几项人口统计特征的函数。按照以下步骤来构建神经网络模型:
1. 选择帮助 > 样本数据库,然后打开 Boston Housing.jmp。
2. 通过选择分析 > 预测建模 > 神经来启动“神经”平台。
3. 将中位数分配给 Y,响应角色。
4. 将其他列(从犯罪率到低收入者)分配给 X,因子角色。
5. 点击确定。
6. 为保留比例输入 0.2。
7. 为随机种子输入 1234。
注意:一般来说,由于验证集是随机选择的,所以结果会有所不同。输入上面的种子可以重现本示例中所示的结果。
8. 为第一层中的 TanH 节点数输入 3。
9. 选中变换协变量选项。
10. 点击执行。
图 3.6 神经报表
报表中同时为训练集和验证集提供了结果。您可以使用验证集的结果来表示模型对于将来观测的预测能力。
验证集的 R 方统计量为 0.913,表明该模型可以很好地预测未用于训练模型的数据。作为对模型拟合的进一步评估,点击“模型 NTanH(3)”旁边的红色小三角并选择标绘“预测值-实际值”图。
图 3.7 “预测值-实际值”图
图上的点沿着线条分布,表明预测值与实际值相差不大。
要对 X 变量如何影响预测值有总体了解,请点击“模型 NTanH(3)”旁边的红色小三角并选择刻画器。
图 3.8 刻画器
有些变量的刻画迹线具有正斜率,有些则具有负斜率。例如,变量房间数具有正斜率。这表明住房中的房间数越多,中位数预测值就越高。变量学生老师比是按城镇划分的师生比。该变量的斜率为负数,指示师生比越高,中位数值越小。