多元方法 > K 均值聚类 > “K 均值聚类”平台概述
发布日期: 08/07/2020

“K 均值聚类”平台概述

“K 均值聚类”是 JMP 提供的对观测进行聚类的四个平台之一。有关四种方法的比较,请参见对观测聚类的平台概述

“K 均值聚类”平台使用迭代拟合过程形成指定数量的聚类。K- 均值算法首先选择一组称为聚类种子k 个点作为对聚类均值的最初推测。每个观测被分配到最近的聚类种子,形成一组临时聚类。然后这些种子被聚类均值替代,各点会重新分配,最后该过程一直持续到聚类中不再有进一步的变化。

K-均值算法是 EM 算法的一种特殊情况,其中 E 代表期望,M 代表最大化。在 K-均值算法中,计算临时聚类均值代表期望步,将点分配给最近的聚类代表最大化步。

K-均值聚类仅支持数值列。K-均值聚类忽略建模类型(名义型和有序型),而将所有数值列视为连续型。

您必须提前指定聚类数 kk 的值范围。不过,您可以比较不同 k 值的结果以选择适合您的数据的最优聚类数。

有关 K 均值聚类的背景信息,请参见 SAS Institute Inc.(2018d) 中的“FASTCLUS 过程”一章以及 Hastie et al.(2009)。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).