当数据来自重叠正态分布时,使用“正态混合”进行聚类。您需要提前指定聚类数。
“正态混合”是基于假设使用多元正态分布的混合分布近似计算观测的联合概率分布的迭代方法。这些混合代表不同的聚类。各聚类都具有多元正态分布。
若聚类分隔地很好,层次聚类和 K-均值聚类都适用。但若聚类重叠,则正态混合是更好的替代方法,因为它基于聚类成员概率,而不是基于边界的任意聚类分配。
图 14.1 正态混合双标图