分析连续变量可能会涉及下列问题:
• 数据形状与任何已知的分布匹配吗?
• 数据中有离群值吗?
• 数据的平均值是多少?
• 平均值从统计意义上来说不同于目标值或历史值吗?
• 数据的分散程度如何?换句话说,标准差是多少?
• 最小值和最大值是多少?
您可以使用图形、汇总统计量和简单的统计检验来回答这些以及其他问题。
本示例使用 Car Physical Data.jmp 数据表,表中包含 116 种不同汽车型号的信息。
铁路公司向设计专家求教,以确定通过火车运输汽车的过程中可能出现的问题。使用该数据,设计专家想探究下列问题:
• 汽车平均重量是多少?
• 汽车重量的分散程度(标准差)如何?
• 汽车最小和最大重量是多少?
• 数据中有离群值吗?
使用车重的直方图可以回答这些问题。
1. 选择帮助 > 样本数据库,然后打开 Car Physical Data.jmp。
2. 选择分析 > 分布。
3. 选择车重并点击 Y,列。
4. 点击确定。
5. 要旋转报表窗口,点击“车重”红色小三角并选择显示选项 > 水平布局。
图 5.7 车重的分布
报表窗口包含三个部分:
• 用于可视化数据的直方图和箱线图。
• 显示分布百分位数的分位数报表。
• 显示均值、标准差和其他统计量的汇总统计量报表。
使用Figure 5.7 中提供的结果,设计专家可以回答问题。
汽车平均重量是多少?
“直方图”显示重量在 3,000 磅左右。
汽车重量的分散程度(标准差)如何?
“汇总统计量”显示重量在 2,958 磅左右。“汇总统计量”显示标准差在 536 磅左右。
最小和最大重量是多少?
“直方图”显示最小值在 1,500 磅左右;最大值在 4,500 磅左右。“分位数”显示最小值在 1,695 磅左右;最大值在 4,285 磅左右。
有离群值吗?
没有。
Figure 5.7 中的默认报表窗口至少提供图形和统计量。其他图形和统计量可以通过红色小三角菜单得到。
根据其他研究,铁路公司确定平均重量为 3000 磅是最高效的运输重量。现在,设计专家需要确定在想要运输的汽车总体中汽车平均重量是否为 3000 磅。使用 t 检验可以根据这个总体样本得到更大总体的推论。
1. 点击“车重”红色小三角并选择检验均值。
2. 在出现的窗口中,在“指定假设均值”框中键入 3000。
3. 点击确定。
图 5.8 检验均值结果
t 检验的主要结果是 p 值。在该示例中,p 值为 0.396,分析人员使用显著水平 0.05。因为 0.396 大于 0.05,您不能推断出在更大总体中汽车平均重量与 3000 磅之间存在显著差异。若 p 值小于显著水平,设计专家会推断出在更大总体中汽车平均重量与 3000 磅之间存在显著差异。