多元方法 > 层次聚类 > “层次聚类”选项
发布日期: 04/13/2021

“层次聚类”选项

“层次聚类”红色小三角菜单包含以下选项:

聚类着色

根据聚类成员关系对系统树图的标签及其关联的连接条进行着色。此外将相应的颜色分配给数据表的行。若您更改聚类数,颜色也会更新。若您取消选择该选项,颜色将不再根据变量数进行更新。

标记聚类

将标记分配给数据表中与该行所属的聚类对应的那些行。若您更改聚类数,标记也会更新。若您取消选择该选项,标记将不再根据变量数进行更新。

聚类数

提示您输入聚类数并将系统树图滑块放置在该数目对应的位置上。

聚类准则

提供针对聚类数整个范围的三次聚类准则 (CCC)。CCC 用于估计聚类数。它可以与任何基于距离的聚类算法一起使用。CCC 值越大则表明在特定聚类数下拟合的效果越好。请参见 SAS Institute Inc. (1983)。(选定数据为距离矩阵时不可用。)

显示系统树图

显示或隐藏“系统树图”报表。

系统树图尺度

包含用于统一系统树图尺度的选项:

距离尺度

基于在启动窗口中指定的距离方法,将任意两个连接点之间的水平距离显示为在该点连接的两个聚类之间的距离。距离尺度与“距离图”中使用的是同一个尺度,它是系统树图的默认尺度。

等间距

显示任意两个连接点之间的水平距离相等。

几何间距

随聚类数的增加,连接点之间的水平距离也随之增加。当有许多对象并且您想较小的聚类比较大的聚类更加明显时可以使用该选项。

距离图

显示或隐藏系统树图下方的距离图。

显示聚类数控点

在系统树图上显示或隐藏用于手动更改聚类数的控点。

放大至选定行

在系统树图中选择聚类之后,选择并放大特定聚类。或者,您可以双击聚类将其放大。使用“解除放大”可恢复到原始视图。

解除放大

在放大之后,使系统树图恢复到原始视图。

以选定聚类为轴心转动

反转当前选定聚类的两个子聚类的顺序。

色图

提供选项来添加色图或热图,用于显示按值着色的各个“Y,列”变量。子菜单中提供了若干颜色主题选择。

双向聚类

按在“Y,列”中指定的变量以及行来进行聚类。色图和系统树图一起添加,并且在其底部添加了“Y,列”变量。通常情况下,对于双向聚类,变量以相同的尺度进行测量,您不需要选择“标准化数据”。(选定数据被堆叠时不可用。)

定位

提供用于更改标签和系统树图的其他部分的位置的选项。

图例

显示或隐藏色图中使用的颜色的图例。该选项仅在启用色图时才可用。

更多色图列

为指定列添加色图。(选定被汇总的数据数据为距离矩阵数据被堆叠时不可用。)

星座图

显示或隐藏另一种在层次聚类系统树图中显示信息的方式。每个观测(行)由一个端点表示,每个聚类连接由一个新点表示。绘制的线条表示聚类成员关系。线条长度表示聚类之间的距离。较长的线表示聚类之间的距离较长。

您可以将指针置于星座图中的线条上来查看其长度。但是,长度值只有相对意义。轴尺度、点方向和线条角度是任意的。这样安排可以使节点端间隔开,图不会显得很混乱,这对于大数据集来说十分重要。

要关闭端点处的标签,请在“星座图”内右击并选择显示标签

保存星座坐标

将星座图坐标保存至数据表。(选定被汇总的数据数据为距离矩阵数据被堆叠时不可用。)

保存聚类

创建包含聚类数的数据表列。若在启动窗口中选择了“添加空间测度”,则聚类数也会保存到 Hough 数据表。

保存最近聚类公式

创建包含最近聚类的公式的数据表列。该选项计算每个聚类重心之间的欧氏距离平方,并选择最靠近的聚类。请注意,该公式不一定总能重现“层次聚类”提供的聚类分配,因为聚类的确定方式有所不同。不过,聚类分配非常相似。(选定被汇总的数据数据为距离矩阵数据被堆叠时不可用。)

保存显示顺序

创建包含行在系统树图中的显示顺序的数据表列。

保存聚类层次结构

创建一个数据表,其中包含编写自定义系统树图的脚本所需的信息。对于每个聚类连接,该选项都输出三行:第一行表示连接对象、第二行表示前导对象、第三行表示结果,用于给出聚类中心、大小和其他信息。

保存聚类树

创建一个新的数据表,其中包含在 JMP 和 SAS 之间比较聚类树所需的信息。对于每个聚类连接,该选项都为每个新聚类输出一行,包含该聚类的大小和其他信息。

保存距离矩阵

创建一个新的数据表,其中包含观测之间的距离。

保存聚类均值

创建一个新的数据表,其中包含每个聚类中的行数和每列的均值。

聚类汇总

(选定数据为距离矩阵时不可用。)显示以下信息:

聚类均值

给出每个聚类的观测数(若数据被堆叠则为“对象 ID”)和每个变量的均值的表。

聚类标准差

给出每个聚类的观测数(若数据被堆叠则为“对象 ID”)和每个变量的标准差的表。

聚类均值图

聚类均值的平行图或二维热图。

该图为平行图,但选中数据被堆叠并且有两个“特性 ID”变量时除外。对于平行图,每个变量的轴尺度如下所示:

若选中“标准化数据”,轴的范围在均值的上下两个标准差,其中标准差和均值基于原始数据进行计算。若聚类均值超出该范围,则轴会扩展以包括该均值。

若未选中“标准化数据”,则会使用显示了尺度的公共垂直轴。(该尺度等价于“图形生成器”中的“统一尺度”选项)。

当选中数据被堆叠并且有两个“特性 ID”变量时,在每个位置为每个聚类显示 Y 变量均值的二维图。这些图使用“由蓝经灰到红”颜色梯度着色。

列汇总

对于每个变量,给出表示聚类所解释的变异比例的 R 方值。该数值是聚类中变量回归的 R 方值。选项还给出 R 方值的条形图。

散点图矩阵

使用所有变量创建散点图矩阵。(选定被汇总的数据数据为距离矩阵数据被堆叠时不可用。)

平行坐标图

为每个聚类创建平行坐标图。(选定被汇总的数据数据为距离矩阵数据被堆叠时不可用。)轴的尺度参照“聚类均值图”的说明。请参见聚类均值图

聚类处理比较

(仅当您按住 Shift 并点击“层次聚类”红色小三角时才可用。)选择响应列和二水平处理列。创建“层次聚类差值”报表。

请参见《使用 JMP》中的本地数据过滤器“重新运行”菜单“保存脚本”菜单 ,获取有关下列选项的信息:

本地数据过滤器

显示或隐藏支持您过滤特定报表中使用的数据的本地数据过滤器。

重新运行

包含使您可以重复或重新启动分析的选项。在支持该功能的平台中,“自动重新计算”选项立即在相应报表窗口中反映您对数据表所做的更改。

保存脚本

包含的选项支持您保存可将报表重现到若干目标的脚本。

保存“依据”组脚本

包含使您可以保存脚本的选项,可将为“依据”变量的所有水平重新生成平台报表的脚本保存到多个不同的位置。仅当在启动窗口中指定“依据”变量时才可用。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).