“K 均值聚类”平台使用迭代拟合过程形成指定数量的聚类。K-均值算法首先选择一组称为聚类种子的 n 个点作为对聚类均值的最初推测。每个观测被分配到最近的聚类种子,形成一组临时聚类。然后这些种子被聚类均值替代,各点会重新分配,最后该过程一直持续到聚类中不再有进一步的变化。
K-均值聚类仅支持数值列。K-均值聚类忽略建模类型(名义型和有序型),而将所有数值列视为连续型。
有关 K-均值聚类的背景,请参见 SAS Institute Inc. (2005) 和 Hastie et al. (2009)。