JMP 14.2 联机文档
发现 JMP
使用 JMP
基本分析
基本绘图
刻画器指南
实验设计指南
拟合线性模型
预测和专业建模
多元方法
质量和过程方法
可靠性和生存方法
消费者研究
Scripting Guide
JSL Syntax Reference
该帮助的版本不再更新,请参见
https://www.jmp.com/support/help/zh-cn/15.2
获取最新的版本.
多元方法
•
K 均值聚类
• “K 均值聚类”平台概述
上一个
•
下一个
“K 均值聚类”平台概述
“K 均值聚类”是 JMP 提供的对观测进行聚类的四个平台之一。有关四种方法的比较,请参见
对观测聚类的平台概述
。
“K
均值聚类”平台使用迭代拟合过程形成指定数量的聚类。
K-
均值算法首先选择一组称为
聚类种子
的
k
个点作为对聚类均值的最初推测。每个观测被分配到最近的聚类种子,形成一组临时聚类。然后这些种子被聚类均值替代,各点会重新分配,最后该过程一直持续到聚类中不再有进一步的变化。
K-
均值算法是
EM 算法
的一种特殊情况,其中
E
代表期望,
M
代表最大化。在
K
-均值算法中,计算临时聚类均值代表期望步,将点分配给最近的聚类代表最大化步。
K
-均值聚类仅支持数值列。
K
-均值聚类忽略建模类型(名义型和有序型),而将所有数值列视为连续型。
您必须提前指定聚类数
k
或
k
的值范围。不过,您可以比较不同
k
值的结果以选择适合您的数据的最优聚类数。
有关
K
均值聚类的背景信息,请参见《SAS/STAT 14.3 用户指南》中的“FASTCLUS 过程”一章 (SAS Institute Inc.
2017c
) 和 Hastie et al. (
2009
)。