散点图是所有多变量图形中最简单的一个。使用散点图可以确定两个连续变量之间的关系,并且可以发现两个连续变量之间是否相关。相关性表示两个变量之间的相关程度。若两个变量高度相关,则一个变量可能会影响另一个变量。或者,两个变量被其他变量以相似方式影响。
图 4.9 散点图示例
本示例使用 Companies.jmp 数据表,表中包含一组公司的销售数字和雇员数量。
财务分析人员想探究下列问题:
• 销售额和雇员数量之间是什么关系?
• 销售额会随雇员数量增长吗?
• 能从雇员数量预测出平均销售额吗?
要回答这些问题,使用雇员数量-销售额 ($M) 散点图。
1. 选择帮助 > 样本数据库,然后打开 Companies.jmp。
2. 选择分析 > 以 X 拟合 Y。
3. 选择销售额 ($M) 和 Y,响应。
4. 选择雇员数量和 X,因子。
图 4.10 以 X 拟合 Y 窗口
5. 点击确定。
图 4.11 雇员数量-销售额 ($M)散点图
图形右上方的一个点表示有一家公司的雇员数量和销售额都很高。该数据点和其他数据点之间的距离使其他公司之间的关系很难实现可视化。按照下面的步骤,从图形中删除该点并重新创建图形:
1. 点击该点来选上它。
2. 选择行 > 隐藏和排除。数据点隐藏并且不再包含在计算中。
注意:区分隐藏和排除很重要。隐藏某个点会从图形中删除该点但统计计算会继续使用它。排除某个点会从统计计算中删除该点但不会从图形中删除它。若同时隐藏和排除某个点,将从所有计算和所有图形中删除该点。
3. 要重新创建不包含离群值的图形,点击“二元”红色小三角并选择重新运行 > 重新运行分析。可以关闭原始报表窗口。
图 4.12 已删除离群值的散点图
更新的散点图给出下列回答:
• 销售额和雇员数量之间存在关系。
数据点有辨别得出的模式。在图形中数据点不是随机分散,可以靠近大部分数据点绘制一条对角线。
• 销售额随雇员数量增长,并且关系为线性。
若绘制对角线,它将从左下方向右上方倾斜。这样倾斜表示随着雇员数量增加(底部轴从左到右),销售额也会增长(左侧轴从下到上)。直线靠近大部分数据点,这表示是线性关系。若必须弯曲线条才能靠近数据点,则仍然存在关系(因为数据点的模式),但关系将不是线性的。
• 可以从雇员数量预测出平均销售额。
散点图显示销售额通常会随雇员数量的增加而增长。若您知道某家公司的雇员数量,则可以预测出该公司的销售额。您的预测落在一条假想线。虽然不会很准确,但会接近实际的销售额。
与其他 JMP 图形相同,散点图是交互式的。将鼠标悬停在右下角的点上会显示行号以及 x 和 y 值。
图 4.13 将鼠标悬停在某个点上
点击某点会在数据表中突出显示相应的行。通过执行下列操作可以选择多个点:
• 点击并将光标拖过这些点。这样操作会选择矩形区域内的点。
• 选择套索工具,然后点击并拖过多个点。套索工具会选择一个形状不规则的区域。