聚类示例

在本例中，我们将按照各国 1976 年每 100,000 人的粗出生率和死亡率将各国分组。

1. 选择帮助 > 样本数据库，然后打开 Birth Death Subset.jmp。

2. 选择分析 > 聚类 > 层次聚类。

3. 选择出生率和死亡率并点击 Y,列。

4. 选择国家并点击标签。

该选择可确保国家列（而不是行号）用于对点击“确定”后出现的系统树图添加标签。

5. 点击确定。

6. 点击“层次聚类”红色小三角并选择聚类着色。

图 12.2 “层次聚类”报表

Image shown here

该系统树图显示聚类是如何执行的。可以从左到右读取系统树图来查看聚类过程。每步包括将两个最近聚类组成一个聚类。

在系统树图中，聚类之间的相对距离由连接聚类的垂线之间的水平距离给出。例如，Afghanistan 和 Zaire 之间的距离大于 Malaysia 与 Mexico 和 Venezuela 组成的聚类之间的距离。

系统树图下方显示的图，两个聚类连成一个聚类的每一步对应一个点。水平坐标表示聚类数，它们从左至右递减。点的垂直坐标是连接起来形成指定聚类数的两个聚类之间的距离。您可以点击系统树图中的菱形并拖动线以选择最能代表数据的聚类数。还可以使用“层次聚类”红色小三角菜单中的“聚类数”选项以选择聚类数。

有四个聚类时，距离图斜率有明显变化。斜率变化指出在剩下四个聚类之前所连接的聚类之间的差异相对较小。这表明 4 是聚类数不错的选择。注意到这是默认显示的聚类数。

7. 点击“层次聚类”红色小三角并选择星座图。

图 12.3 星座图

Image shown here

该星座图将国家显示为端点，将每个聚类连接显示为新点。各条线表示聚类中的成员关系。聚类连接之间的线长度近似等于连接的聚类之间的距离。星座图指出包含 Afghanistan 和 Zaire 的聚类和其余国家组成的聚类，相比上半部分图中其余国家和下半部分图中其余国家构成的两个聚类，它们之间的距离是差不多的。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).