您需要评估各种模型预测糖尿病进展的能力。数据集中包括 442 名糖尿病患者的基准医疗数据,还包括在每名患者首次就诊一年后得到的糖尿病疾病进展的连续测量。值越高,疾病进展越快。
1. 选择帮助 > 样本数据文件夹,然后打开 Diabetes.jmp。
2. 选择分析 > 预测建模 > 模型筛选。
3. 选择 Y 并点击 Y,响应。
4. 从年龄一直选到葡萄糖,然后点击 X,因子。
5. 在“已折叠交叉验证”部分中,选择 K 折交叉验证旁边的框。
6. (可选)在“操作选项”部分中的设置随机种子旁边键入 42920。
使用随机种子以匹配示例输出。
7. 点击确定。
8. 点击“‘Y’的模型筛选”旁边的红色小三角并选择可选报表 > 耗用时间。
图 10.2 连续响应的模型报表
基于跨越折计算的平均验证 R 方的最佳效果模型是“提升神经”。“提升神经”的验证 R 方平均值为 0.5503。“耗用时间”报表显示“提升神经”模型的拟合时间也最长。在这种情况下,经过的时间只有 5 秒,但是对于更大的数据集或更复杂的模型,这些信息可能很重要。
提示:要查看各个模型的性能量度,请点击“验证”旁边的灰色展开图标。