“X,类别”列的每个水平定义一个指示符变量。典型相关性在表示类别的指示符变量组和协变量之间执行。会推导得出协变量的线性组合(称为典型变量)。这些典型变量尝试汇总类别间的变异。
第一个典型变量是协变量的线性组合,它最大化类别指示符变量和协变量之间的多重相关性。第二个典型变量是与第一个典型变量不相关的协变量的线性组合,它最大化协变量与类别的多重相关性。若“X,类别”列具有 k 个水平,则获取 k - 1 个典型变量。
图 5.9 Iris.jmp 的典型图
双标图轴是前两个典型变量。这些变量定义两个维度来提供组之间的最大分隔。每个典型变量是协变量的线性组合。(请参见典型结构。)双标图显示如何用典型变量表示每个观测以及每个协变量对典型变量的贡献大小。
‒
|
为了帮助在权重之间进行比较,协变量进行了标准化,使得每个协变量的均值为 0 且标准差为 1。标准化协变量的系数称为典型权重。协变量的典型权重越大,它与典型变量的关联越强。
|
‒
|
•
|
通过从红色小三角菜单中选择典型选项 > 显示均值置信限椭圆来显示或隐藏 95% 置信椭圆。
|
•
|
通过从红色小三角菜单中选择典型选项 > 显示双标图射线来显示或隐藏射线。
|
•
|
将双标图射线中心拖到图中其他位置。通过从红色小三角菜单中选择典型选项 > 双标图射线位置来指定其位置和尺度。除非需要调整以使射线可见,“典型图”中显示的默认“射线尺度”为 1.5。
|
•
|
通过从红色小三角菜单中选择典型选项 > 显示正态 50% 等高线来显示或隐藏 50% 等高线。
|
•
|
通过从红色小三角菜单中选择典型选项 > 点着色来对点进行颜色编码以匹配椭圆。
|
•
|
花瓣长度与“典型1”正相关,与“典型2”负相关。与“典型2”相比,定义“典型1”时它具有更大的权重。
|
•
|
花瓣宽度与“典型1”和“典型2”均正相关。在定义两个典型变量时,它具有大概相同的权重。
|
•
|
萼片宽度与“典型1”负相关,与“典型2”正相关。与“典型1”相比,定义“典型2”时它具有更大的权重。
|
•
|
萼片长度在定义“典型1”时负加权,并且与定义“典型2”具有很弱的关联。
|
图 5.10显示了样本数据表 Fitness.jmp 的“典型图”。使用七个连续变量将个体分类为 M(男性)或 F(女性)。因为分类变量只有两个类别,因此只有一个典型变量。
图 5.10 Fitness.jmp 的“典型图”
图 5.10中的点已按性别着色。请注意,这两个组用“典型1”的值很好地分隔开。
•
|
•
|
•
|
吸氧量与“典型1”负相关。
|