Diabetes.jmp 样本数据表包含十个基线变量,用于对疾病发展进行建模。在本例中,您对连续型基线变量聚类。
1. 选择帮助 > 样本数据库,然后打开 Diabetes.jmp。
2. 选择分析 > 聚类 > 聚类变量。
3. 从年龄列一直选到葡萄糖列,但不包括性别(年龄、BMI、BP、总胆固醇、LDL、HDL、TCH、LTG 和葡萄糖),然后点击 Y,列。
不能包括性别列,因为“聚类变量”要求提供数值型连续变量。
4. 点击确定。
图 16.2 糖尿病数据的聚类变量报表
“聚类汇总”报表显示变量被分组到三个聚类中:
• “聚类 1”包括 TCH、HDL、LTG 和 BMI,如“聚类成员”报表中所示。“聚类汇总”报表显示 TCH 是对于“聚类 1”最典型的变量,而且对于“聚类 1”中的变量,62.8% 的变异是由第一个主成分解释的。
• “聚类 2”包括总胆固醇和 LDL。“聚类汇总”报表显示总胆固醇是对于“聚类 2”最典型的变量,而且对于“聚类 2”中的变量,94.8% 的变异是由第一个主成分解释的。
• 聚类 3 包括 BP、年龄和葡萄糖。“聚类汇总”报表显示最典型变量是 BP,对于“聚类 3”中的变量,56.2% 的变异是由第一个主成分解释的。