层次聚类方法首先将每个观测作为一个聚类。在每一步中,聚类过程会计算各对聚类之间的距离,并将两个相距最近的聚类组合起来。该组合过程会一直进行到所有点都位于一个聚类中。层次聚类亦称为自下而上聚类,因为它使用的是一个组合方法。
提示:层次聚类过程针对 n 个观测会从 n(n + 1)/2 个距离开始计算,但使用“快速 Ward”方法时除外。因此,当 n 较大时,该方法会运行较长时间。对于大量数值观测的情况,考虑使用“K 均值聚类”或“正态混合”。