若您具有连续 Y 变量和分类 X 变量,则可以比较 X 变量不同水平下的平均值。
本示例使用 Companies.jmp 数据表,表中包含来自医药和计算机行业的 32 家公司的财务数据。
财务分析人员想探究以下问题:
• 计算机公司的利润与医药公司的利润相比怎么样?
要回答该问题,以类型拟合利润 ($M)。
1. 选择帮助 > 样本数据库,然后打开 Companies.jmp。
2. 若您仍然打开着 Companies.jmp 样本数据表,则可能排除或隐藏了行。要将这些行恢复为默认状态(包含所有行并且不隐藏任何行),选择行 > 清除行状态。
3. 选择分析 > 以 X 拟合 Y。
4. 选择利润 ($M) 并点击 Y,响应。
5. 选择类型并点击 X,因子。
6. 点击确定。
图 5.15 公司类型-利润
“计算机”类型中有一个离群值。该离群值扩大了图形的范围,使得利润的比较很困难。排除并隐藏该离群值:
1. 点击离群值。
2. 选择行 > 排除/撤销排除。数据点不再包含在计算中。
3. 选择行 > 隐藏/撤销隐藏。数据点不再显示在所有图形中。
4. 要重新创建不包含离群值的图形,点击“‘类型-利润 ($M)’单因子分析”并选择重新运行 > 重新运行分析。可以关闭原始“散点图”窗口。
图 5.16 更新的图形
删除离群值可以帮助财务分析人员更加清晰地查看数据。
5. 要继续分析关系,从“‘类型-利润 ($M)’单因子分析”旁边的红色小三角中选择下列选项:
‒ 显示选项 > 均值线。这会将均值线添加到散点图中。
‒ 均值和标准差。这将显示一个报表,其中提供平均值和标准差。
图 5.17 均值线和报表
财务分析人员想知道计算机公司利润和医药公司利润的比较情况。更新的散点图显示医药公司比计算机公司的平均利润要高。在报表中,若您从一个均值中减去另一个均值,利润差异大约为 $6.35 亿。图形还显示某些计算机公司的利润为负值,而所有医药公司的利润均为正值。
财务分析人员仅查看了诸公司的一个样本数据(数据表中的公司)。财务分析人员现在想研究下列问题:
• 在更大总体中是否存在差异,或者 $6.35 亿的差异是否因偶然因素而造成?
• 若存在差异,则差异是什么?
要回答这些问题,执行双样本 t 检验。通过 t 检验,可以使用样本中的数据对更大总体进行推断。
要执行 t 检验,点击“单因子分析”红色小三角并选择均值/方差分析/合并的 t。
图 5.18 t 检验结果
p 值为 0.0001,小于显著性水平 0.05(表示统计显著性)。因此,财务分析人员可以推断出样本数据的平均利润的观测差异具有统计显著性。这意味着在更大总体中,医药公司的平均利润不同于计算机公司的平均利润。
使用置信区间限值可以确定在两种公司类型的利润中存在的差异程度。查看图 5.18 中的差异置信上限和差异置信下限值。财务分析人员可以推断出:医药公司的平均利润比计算机公司的平均利润高出的值介于 $3.43 亿和 $9.26 亿之间。