在本例中,您将“聚类变量”平台用作进行建模的降维工具。Penta.jmp 样本数据表包含 15 个变量用于预测响应变量对数 RAI。使用“聚类变量”可降低该数值。
1. 选择帮助 > 样本数据库,然后打开 Penta.jmp。
2. 选择分析 > 聚类 > 聚类变量。
3. 选择所有连续变量(但不包括对数 RAI)并点击 Y,列。
4. 点击确定。
5. 点击“变量聚类”红色小三角并选择保存聚类成分。
五个分组公式列将添加至数据表。
图 16.5 Penta.jmp 的“聚类变量”报表
“聚类汇总”和“聚类成员”报表显示变量分为五个组,因此有五个聚类成分变量。
接下来,拟合并比较两个模型以预测对数 RAI:
• 使用所有连续变量作为预测变量的模型。
• 使用聚类成分作为预测变量的模型。
1. 点击“变量聚类”红色小三角并选择启动拟合模型。
2. 选择对数 RAI 并点击 Y。
注意到五个聚类的“最典型变量”已输入到“构造模型效应”列表中。但是,您想输入所有预测变量。
3. 从 S1 一直选到 P5 ,选择所有连续变量并点击添加。
一定不要包括观测名称。
4. 选择保持对话框打开旁边的框。
5. 点击运行。
图 16.6 包含所有连续预测变量的模型的“拟合最小二乘法”报表
6. 在“拟合模型”窗口中,选择“构造模型效应”窗口中的所有变量,然后点击删除。
7. 选择聚类成分组并点击添加。
8. 点击运行。
图 16.7 聚类成分作为预测变量的模型的“拟合最小二乘法”报表
仅包括五个聚类成分作为预测变量的模型解释响应中的绝大部分变异,其调整 R 方为 0.784。使用全部十五个预测变量的模型仅有略高的调整 R 方,它的值为 0.853(Figure 16.6)。