您有 442 名糖尿病患者的基准医疗数据,还有在每名患者首次就诊一年后得到的糖尿病疾病发展的连续测度。值越高,疾病进展越快。您需要评估各种模型预测糖尿病进展的能力。
1. 选择帮助 > 样本数据库,然后打开 Diabetes.jmp。
2. 选择分析 > 预测建模 > 模型筛选。
3. 选择 Y 并点击 Y,响应。
4. 从年龄一直选到葡萄糖,然后点击 X,因子。
5. 在“已折叠交叉验证”部分中,选择 K 折交叉验证旁边的框。
6. (可选)在“选项”部分中的设置随机种子旁边键入 42920。
使用随机种子以匹配示例输出。
7. 点击确定。
8. 点击“‘Y’的模型筛选”旁边的红色小三角并选择可选报表 > 耗用时间。
图 10.2 连续响应的模型报表
基于跨越折计算的平均验证 R 方的最佳效果模型是“提升神经”。“提升神经”的验证 R 方平均值为 0.5503。“耗用时间”报表显示“提升神经”模型的拟合时间也最长。在这种情况下,经过的时间只有 5 秒,但是对于更大的数据集或更复杂的模型,这些信息可能很重要。
提示:要查看各个模型的性能量度,请点击“验证”旁边的灰色展开图标。