“层次聚类”红色小三角菜单包含以下选项:
聚类着色
根据聚类成员关系对系统树图的标签及其关联的连接条进行着色。此外将相应的颜色分配给数据表的行。若您更改聚类数,颜色也会更新。若您取消选择该选项,颜色将不再根据变量数进行更新。
标记聚类
将标记分配给数据表中与该行所属的聚类对应的那些行。若您更改聚类数,标记也会更新。若您取消选择该选项,标记将不再根据变量数进行更新。
聚类数
指定行聚类的数量,并将系统树图滑块定位到该数量。
聚类准则
(将“数据为距离矩阵”选作“数据格式”时不可用。)显示或隐藏整个行聚类数量范围的“三次聚类准则”(CCC) 表。CCC 用于估计聚类数。它可以与任何基于距离的聚类算法一起使用。CCC 值越大则表明在特定聚类数下拟合的效果越好。请参见 SAS Institute Inc. (1983)。
显示系统树图
显示或隐藏“系统树图”报表。
系统树图尺度
包含用于统一系统树图尺度的选项:
距离尺度
基于在启动窗口中指定的距离方法,将任意两个连接点之间的水平距离显示为在该点连接的两个聚类之间的距离。距离尺度与“距离图”中使用的是同一个尺度,它是系统树图的默认尺度。
等间距
显示任意两个连接点之间的水平距离相等。
几何间距
随聚类数的增加,连接点之间的水平距离也随之增加。当有许多对象并且您想较小的聚类比较大的聚类更加明显时可以使用该选项。
距离图
显示或隐藏系统树图下方的距离图。
显示聚类数控点
在系统树图上显示或隐藏用于手动更改聚类数的控点。
缩放至选定行
在系统树图中选择聚类之后,选择并放大特定聚类。或者,您可以双击聚类将其放大。使用“解除缩放”可恢复到原始视图。
解除缩放
在缩放之后,使系统树图恢复到原始视图。
以选定聚类为轴心转动
反转当前选定聚类的两个子聚类的顺序。
定位
提供用于更改标签和系统树图的其他部分的位置的选项。
色图
支持您添加色图或热图,用于显示按值着色的各个“Y,列”变量。子菜单中提供了若干颜色主题选择。要删除色图,请选择色图 > 无。
更多色图列
(仅当将“惯例数据”选作“数据格式”时才可用。)为指定列添加色图。
图例
显示或隐藏色图中使用的颜色的图例。每个指定列都有一个单独的图例。该选项仅在启用色图时才可用。
注意:若有超过 400 列,则会显示一个图例,并为色图中使用的颜色提供标准化得分。
双向聚类
(仅当将“惯例数据”或“被汇总的数据”选作“数据格式”时才可用。)按指定的列和行进行聚类。色图添加到系统树图中,Y 变量的系统树图位于其底部。通常情况下,对于双向聚类,变量以相同的尺度进行测量,您不需要对数据进行标准化。
列聚类
(仅当使用“双向聚类”时才可用。)提供用于在双向聚类中聚类各列的选项。
列聚类数
指定列聚类数。
列聚类准则
显示或隐藏整个列聚类数量范围的“三次聚类准则”(CCC) 表。CCC 用于估计聚类数。它可以与任何基于距离的聚类算法一起使用。CCC 值越大则表明在特定聚类数下拟合的效果越好。请参见 SAS Institute Inc. (1983)。
保存列聚类
保存包含列的聚类成员信息的新数据表。
保存聚类
保存包含聚类成员信息的新数据表。若在启动窗口中选择了“添加空间测度”,则聚类数也会保存到 Hough 数据表。
保存聚类均值
创建一个新的数据表,其中包含每个聚类中的行数和每列的均值。
保存其他
显示其他保存选项的子菜单。
保存最近聚类公式
创建包含最近聚类的公式的数据表列。该选项计算每个聚类重心之间的欧氏距离平方,并选择最靠近的聚类。请注意,该公式不一定总能重现“层次聚类”提供的聚类分配,因为聚类的确定方式有所不同。不过,聚类分配非常相似。(选定被汇总的数据、数据为距离矩阵或数据被堆叠时不可用。)
保存聚类历史
创建新的数据表,其中包含“聚类历史记录”报表中的信息。
保存显示顺序
创建包含行在系统树图中的显示顺序的数据表列。
保存距离矩阵
创建一个新的数据表,其中包含观测之间的距离。
保存星座坐标
将星座图坐标保存至数据表。(选定被汇总的数据、数据为距离矩阵或数据被堆叠时不可用。)
保存聚类层次结构
创建一个数据表,其中包含编写自定义系统树图的脚本所需的信息。对于每个聚类连接,该选项都输出三行:第一行表示连接对象、第二行表示前导对象、第三行表示结果,用于给出聚类中心、大小和其他信息。
保存聚类树
创建一个新的数据表,其中包含在 JMP 和 SAS 之间比较聚类树所需的信息。对于每个聚类连接,该选项都为每个新聚类输出一行,包含该聚类的大小和其他信息。
聚类历史记录
显示或隐藏“聚类历史记录”报表。请参见聚类历史记录。
聚类汇总
(选定数据为距离矩阵时不可用。)显示或隐藏包含以下信息的报表:
聚类均值
给出每个聚类的观测数(若数据被堆叠则为“对象 ID”)和每个变量的均值的表。
聚类标准差
给出每个聚类的观测数(若数据被堆叠则为“对象 ID”)和每个变量的标准差的表。
聚类均值图
聚类均值的平行图或二维热图。
该图为平行图,但选中数据被堆叠并且有两个“特性 ID”变量时除外。对于平行图,每个变量的轴都统一了尺度。
• 若选中“标准化数据”,轴的范围在均值的上下两个标准差,其中标准差和均值基于原始数据进行计算。若聚类均值超出该范围,则轴会扩展以包括该均值。
• 若未选中“标准化数据”,则会使用显示了尺度的公共垂直轴。(该尺度等价于“图形生成器”中的“统一尺度”选项)。
当选中数据被堆叠并且有两个“特性 ID”变量时,在每个位置为每个聚类显示 Y 变量均值的二维图。这些图使用“由蓝经灰到红”颜色梯度着色。
列汇总
对于每个变量,给出表示聚类所解释的变异比例的 R 方值。该数值是聚类中变量回归的 R 方值。该选项还给出 R 方值的条形图。
最后连接离群值
显示或隐藏在算法中很晚聚类的观测所在的表。当算法完成 80% 时,该表中的每一观测仍然自成一个聚类。由于这些观测中的每一个直到算法后期都仍保持自成一个聚类,因此这些观测是数据集中的可能离群值。
星座图
显示或隐藏另一种在层次聚类系统树图中显示信息的方式。每个观测(行)由一个端点表示,每个聚类连接由一个新点表示。绘制的线条表示聚类成员关系。线条长度表示聚类之间的距离。较长的线表示聚类之间的距离较长。
您可以将鼠标悬停在星座图中的线条上来查看其长度。但是,长度值只有相对意义。轴尺度、点方向和线条角度是任意的。这样安排可以使节点端间隔开,图不会显得很混乱,这对于大数据集来说十分重要。
要关闭端点处的标签,请在“星座图”内右击并选择显示标签。
散点图矩阵
(仅当将“惯例数据”选作“数据格式”时才可用。)使用所有变量创建散点图矩阵。
平行坐标图
(仅当将“惯例数据”选作“数据格式”时才可用。)为每个聚类创建平行坐标图。轴的尺度参照“聚类均值图”的说明。请参见聚类均值图。
聚类处理比较
(仅当您按住 Shift 并点击“层次聚类”红色小三角时才可用。)选择响应列和二水平处理列。创建“层次聚类差值”报表。
请参见《使用 JMP》中的“JMP 报表中的本地数据过滤器”、“JMP 报表中的“重新运行”菜单”、“保存平台首选项”和“JMP 报表中的“保存脚本”菜单”获取有关下列选项的信息:
本地数据过滤器
显示或隐藏支持您过滤特定报表中使用的数据的本地数据过滤器。
重新运行
包含使您可以重复或重新启动分析的选项。在支持该功能的平台中,“自动重新计算”选项立即在相应报表窗口中反映您对数据表所做的更改。
平台首选项
包含的选项支持您查看当前平台首选项或更新平台首选项以匹配当前 JMP 报表中的设置。
保存脚本
包含的选项支持您保存可将报表重现到若干目标的脚本。
保存“依据”组脚本
包含使您可以保存脚本的选项,可将为“依据”变量的所有水平重新生成平台报表的脚本保存到多个不同的位置。仅当在启动窗口中指定“依据”变量时才可用。