Boston Housing.jmp 样本数据表包含可能与住房价格中位数相关的 13 个因子的数据。您使用神经网络拟合模型。由于神经网络不适用于正式的假设检验,所以不能借助这些检验来评估哪些变量在预测响应时很重要。不过,您可以使用“评估变量重要性”刻画器选项来评估变量重要性。
请注意,您的结果虽然可能不同于下面所示的结果,但应该与其相似。本例中有两个随机变异来源。拟合神经网络时,使用了 k 重交叉验证。这会将数据随机划分为训练集和验证集。此外,还使用 Monte Carlo 抽样来计算因子重要性指标。
1.
|
2.
|
选择分析 > 预测建模 > 神经。
|
3.
|
4.
|
从“选择列”列表中选择其他所有列,然后点击 X,因子。
|
5.
|
点击确定。
|
6.
|
7.
|
点击执行。
|
8.
|
9.
|
从“预测刻画器”旁边的红色小三角菜单中,选择评估变量重要性 > 非独立再抽样输入。
|
“变量重要性: 非独立再抽样输入”报表随即显示(“非独立再抽样输入”报表)。检查“预测刻画器”单元格是否已经按照报表中的“总效应”指标的量值重新排序。在“非独立再抽样输入”报表中,检查“总效应”重要性指标是否将房间数和低收入者标识为对预测响应影响最大的因子。
10.
|
从“预测刻画器”旁边的红色小三角菜单中,选择评估变量重要性 > 独立再抽样输入。
|
再抽样输入选项在本例中有意义,因为涉及的分布不是均匀分布。“变量重要性: 独立再抽样输入”报表显示在“独立再抽样输入”报表中。检查标识为对预测值影响最大的两个因子是否为低收入者和房间数。请注意,因子重要性指标的顺序与使用“非独立再抽样输入”时的顺序正好相反。