多元方法 > K 均值聚类 > K 均值报表 > “K 均值聚类数”报表
发布日期: 09/18/2023

“K 均值聚类数”报表

在“K 均值聚类”平台中,每个“K 均值聚类数”报表都为每个聚类提供以下汇总统计量:

“聚类汇总”报表提供聚类数和每个聚类中的观测数,以及所需的迭代次数。

“聚类均值”报表为每个变量提供每个聚类中观测的均值。

“聚类标准差”报表为每个变量提供每个聚类中观测的标准差。

“K 均值聚类数”报表选项

每个“K 均值聚类数”报表都包含以下红色小三角菜单选项:

双标图

以数据的前两个主成分显示点和聚类的图,以及用于标识聚类颜色的图例。围绕聚类中心绘制圆圈,而且圆圈的大小与聚类内的计数成比例。着色区域是围绕均值的密度等高线。默认情况下,该区域指示该聚类中 90% 的观测所在的位置 (Mardia et al. 1980)。使用该图下方的列表可将图轴改为其他主成分。或者,使用箭头按钮在所有可能的轴组合之间循环切换。该图之下还有一个用于将聚类颜色保存到数据表的选项。请参见将颜色保存至表。特征值以降序方式显示。

注意:若在启动窗口中选中“逐列统一尺度”,则双标图使用相关性矩阵。若未选中“逐列统一尺寸”,则双标图使用协方差矩阵。

双标图选项

包含用于控制“双标图”外观的下列选项:

显示双标图射线

显示双标图射线。带标签的射线显示协变量在由主成分定义的子空间中的方向。它们表示每个变量与每个主成分的关联程度。

双标图射线位置

可让您指定双标图射线的位置和射线尺度。默认情况下,这些射线从点 (0,0) 发出。在该图中,您可以拖动射线或使用该选项指定坐标。您还可以使用“射线尺度”选项调整射线的尺度,以便更加清晰地显示。

双标图等高线密度

支持您指定密度等高线的置信水平。默认置信水平为 90%。

标记聚类

将标识聚类的标记分配给数据表的行。

三维双标图

显示数据的三维双标图。仅当有三个或更多变量时可用。

平行坐标图

为每个聚类创建平行坐标图。图报表提供用于显示和隐藏数据和均值的选项。请参见《基本绘图》中的“平行图”

散点图矩阵

显示或隐藏使用所有 Y 变量的散点图矩阵。每个散点图都包含基于当前聚类数的密度椭圆。

SOM 热图

(仅可用于“自组织图”。)显示或隐藏自组织图聚类均值的热图,按聚类中使用的其中一个 Y 变量着色。使用“选择列”旁边的菜单对热图着色以更改 Y 变量。

注意:热图上的聚类以自上而下、从右到左的布局进行组织。这意味着第一个聚类位于右上角,最后一个聚类位于左下角。

将颜色保存至表

将标识聚类的颜色分配给数据表的行。若报表窗口中有双标图,保存到数据表的颜色将与双标图中的聚类颜色相匹配。若双标图中的颜色改变,而且再次选定“将颜色保存至表”选项,那么表中的颜色将更新以便与双标图中的那些颜色相匹配。

注意:选定任何保存选项时,每个保存的列都包含一个“注释”列属性,该属性指定这一特定列数据的聚类数。这使您能够保存来自多个聚类拟合的列,并使用列属性来标识保存的列来自哪个聚类拟合。

保存聚类

将以下两列保存至数据表:

聚类列包含分配了给定行的聚类的编号。

(不适用于“自组织图”。)距离列包含给定观测与其聚类均值之间的欧氏距离平方。对于每个变量,将观测值与该变量的聚类均值之间的差值除以该变量的总标准差。然后对所有变量的这些统一尺度的差值进行平方与求和计算。

保存聚类距离

(不适用于“自组织图”。)将距离列保存到数据表中。该列与从保存聚类选项获得的距离列相同。

保存自组织图网格

(仅可用于“自组织图”。)将新列保存到数据表中。新列包含每个观测最可能的聚类的 SOM 网格行和列编号。

保存聚类公式

将名为“聚类公式”的公式列保存至数据表。这是标识每个聚类的聚类成员关系的公式。

保存距离公式

(不适用于“自组织图”。)将名为“距离公式”的公式列保存至数据表。这是用于计算到所分配聚类的距离的公式。

保存 K 聚类距离

(不适用于“自组织图”。)保存包含到每个聚类中心的欧氏距离平方的 k 列。

保存 K 距离公式

(不适用于“自组织图”。)保存包含到每个聚类中心的欧氏距离平方的公式的 k 列。

发布聚类公式

向“公式存储库”发布在“保存聚类公式”选项中使用的相同的得分代码。

模拟聚类

使用聚类均值和标准差,创建包含 Y 变量的模拟聚类观测的新数据表。

删除

删除聚类报表。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).