使用“K 均值聚类”平台可将在几个变量上享有相似值的观测分组在一起。K-均值法适用于包含大约 200 到 100,000 个观测的大型数据表。
“K 均值聚类”平台使用迭代算法对观测进行划分来构造指定数量的聚类。该方法称为 K-均值,它将观测划分聚类以便最小化到聚类重心的距离。您必须提前指定聚类数 k。不过,您可以比较不同 k 值的结果以选择适合您的数据的最优聚类数。
图 13.1 三维双标图