您已经确定哪些谷物早餐可以食用,哪些谷物早餐需要避免,接下来就是要了解谷物早餐变量彼此如何相关。“多元”平台支持您观察变量之间的模式和关系。从“多元”报表中,您可以执行以下操作:
• 使用“相关性”表总结每对响应变量之间的线性关系强度
• 使用散点图矩阵确定相依性、离群值和聚类
• 使用其他方法检查多个变量,例如偏相关性、逆相关性和配对相关性、协方差矩阵以及主成分
注意:有关“多元”平台的详细信息,请参见《多元方法》中的相关性和多元方法。
您想要查看脂肪和卡路里等变量之间的关系。分析“多元”平台中的谷物早餐数据揭示了关于以下问题的答案:
• 哪些变量对高度相关?
• 哪些变量对不相关?
1. 在 Cereal.jmp 数据表中,点击“列”面板顶部的底部小三角撤销选择行。
图 6.6 撤销选择行
2. 选择分析 > 多元方法 > 多元。
3. 从卡路里一直选到钾,点击 Y,列,然后点击确定。
“多元”报表随即出现。该报表默认包含“相关性”报表和散点图矩阵。“相关性”报表是一个相关系数矩阵,该矩阵总结了每对响应 (Y) 变量之间的线性关系的强度。发暗的数字表明相关度较低。
图 6.7 “相关性”报表
请注意以下几点:
‒ 在“卡路里”列中,卡路里值与钠和膳食纤维之外的所有变量都高度相关。
‒ 在“膳食纤维”列中,膳食纤维和钾看起来高度相关。
‒ 在“钠”列中,钠与其他变量不高度相关。
散点图矩阵中的密度椭圆进一步演示了变量之间的关系。
图 6.8 散点图矩阵的一部分
默认情况下,每个散点图中都有一个 95% 二元正态密度椭圆。假定每对变量都服从二元正态分布,该椭圆将覆盖大约 95% 的点。若该椭圆较圆,不向对角方向延伸,则变量之间不相关。若该椭圆较窄且向对角方向延伸,则变量之间相关。
请注意以下几点:
‒ 在“钠”行中,椭圆较圆,该形状表明“钠”与其他变量不相关。
‒ 在“脂肪”行中,蓝色 x 标记(代表 Nat. Bran Oats & Honey、Cracklin’ Oat Bran 和 Banana Nut Crunch)显示在椭圆之外。该位置表明该数据是个离群值(因为谷物早餐中的脂肪含量)。
稍后您会进一步探究散点图矩阵。
4. 点击“多元”红色小三角并选择配对相关性以显示“配对相关性”报表。
图 6.9 “配对相关性”报表的一部分
“配对相关性”报表列出每对 Y 变量的 Pearson 乘积矩相关系数。该报表还显示显著性概率并在条形图中比较相关性。
5. 要快速查看哪对变量高度相关,请在报表中右击并选中按列排序、显著性概率、升序复选框,然后点击确定。
相关度最高的变量对显示在报表顶部。变量对的较小 p 值指示存在相关性。最显著的相关性存在于“总碳水化合物”和“卡路里”之间。
图 6.10 变量对的较小 p 值
查看这些结果,您可以回答以下问题:
哪些变量对高度相关?
“相关性”报表和散点图矩阵显示卡路里值与钠和膳食纤维之外的所有变量高度相关。“配对相关性”报表显示“总碳水化合物”和“卡路里”是最为相关的变量对。
哪些变量对不相关?
“相关性”报表和散点图矩阵显示“钠”与其他变量都不相关。
您印证了之前的结论:应避免高脂肪含量的 100% Nat. Bran Oats & Honey。这再次表明:尝试 All-Bran with Extra Fiber 和 Fiber One 不失为明智的选择。这两种膳食纤维含量高的谷物早餐还有额外的好处,卡路里、脂肪和糖份较低,而且钾含量更高。此外,您还要避免碳水化合物含量高的谷物早餐,因为它们很可能含有较高的卡路里。