支持向量回归 (SVR) 模型使用 SVM 算法来预测连续响应数据。本例使用支持向量机示例中所用的关于糖尿病患者的相同医疗数据。您现在有了一个连续测度,而不是糖尿病发展的二值型测度。值越高,疾病进展越快。改变径向基函数的成本参数以便找到最佳拟合模型。
1. 选择帮助 > 样本数据库,然后打开 Diabetes.jmp。
2. 选择分析 > 预测建模 > 支持向量机。
3. 选择 Y 并点击 Y,响应。
4. 从年龄一直选到葡萄糖,然后点击 X,因子。
5. 选择验证并点击验证。
6. 点击确定。
7. 在“模型启动”控制面板中,检查核函数是否为成本参数为 1 且 Gamma 参数为 0.1 的“径向基函数”。
8. 点击执行。
9. 点击“模型启动”旁边的灰色小三角以打开“模型启动”控制面板。
10. 将成本参数改为 0.1。
11. 点击执行。
12. 点击“模型启动”旁边的灰色小三角以打开“模型启动”控制面板。
13. 将成本参数改为 2。
14. 点击执行。
图 9.6 “模型比较”报表
“模型比较”报表包含使用不同成本参数的模型结果。回想一下,较高的成本参数实现的算法不太可能误分类某个点,而较低的成本参数实现的算法更灵活。在这种情况下,更灵活的模型(成本参数等于 0.1)会生成最佳模型拟合。
15. 在“模型比较”报表的“显示”列中,取消选择“模型 1”和“模型 3”。
图 9.7 连续响应的模型报表
连续响应的模型报表包含“模型汇总”、“估计详细信息”和“预测值-实际值”图。在“模型汇总”报表中,训练集的 RASE 是 52.58,验证集的 RASE 是 57.50。