发现 JMP > 分析数据 > 分析分布 > 连续变量的分布
发布日期: 11/15/2021

连续变量的分布

分析连续变量可能会涉及下列问题:

数据形状与任何已知的分布匹配吗?

数据中有离群值吗?

数据的平均值是多少?

平均值从统计意义上来说不同于目标值或历史值吗?

数据的分散程度如何?换句话说,标准差是多少?

最小值和最大值是多少?

您可以使用图形、汇总统计量和简单的统计检验来回答这些以及其他问题。

情境

本示例使用 Car Physical Data.jmp 数据表,表中包含 116 种不同汽车型号的信息。

铁路公司向设计专家求教,以确定通过火车运输汽车的过程中可能出现的问题。使用该数据,设计专家想探究下列问题:

汽车平均重量是多少?

汽车重量的分散程度(标准差)如何?

汽车最小和最大重量是多少?

数据中有离群值吗?

使用车重的直方图可以回答这些问题。

创建直方图

1. 选择帮助 > 样本数据库,然后打开 Car Physical Data.jmp

2. 选择分析 > 分布

3. 选择车重并点击 Y,列

4. 点击确定

5. 要旋转报表窗口,点击“车重”红色小三角并选择显示选项 > 水平布局

图 5.7 车重的分布 

Image shown here

报表窗口包含三个部分:

用于可视化数据的直方图和箱线图。

显示分布百分位数的分位数报表。

显示均值、标准差和其他统计量的汇总统计量报表。

解释分布结果

使用图 5.7 中提供的结果,设计专家可以回答问题。

汽车平均重量是多少?

“直方图”显示重量在 3,000 磅左右。

汽车重量的分散程度(标准差)如何?

“汇总统计量”显示重量在 2,958 磅左右。“汇总统计量”显示标准差在 536 磅左右。

最小和最大重量是多少?

“直方图”显示最小值在 1,500 磅左右;最大值在 4,500 磅左右。“分位数”显示最小值在 1,695 磅左右;最大值在 4,285 磅左右。

有离群值吗?

没有。

图 5.7 中的默认报表窗口至少提供图形和统计量。其他图形和统计量可以通过红色小三角菜单得到。

结论

根据其他研究,铁路公司确定平均重量为 3000 磅是最高效的运输重量。现在,设计专家需要确定在想要运输的汽车总体中汽车平均重量是否为 3000 磅。使用 t 检验可以根据这个总体样本得到更大总体的推论。

检验结论

1. 点击“车重”红色小三角并选择检验均值

2. 在出现的窗口中,在“指定假设均值”框中键入 3000。

3. 点击确定

图 5.8 检验均值结果 

Image shown here

解释 t 检验

t 检验的主要结果是 p 值。在该示例中,p 值为 0.396,分析人员使用显著水平 0.05。因为 0.396 大于 0.05,您不能推断出在更大总体中汽车平均重量与 3000 磅之间存在显著差异。若 p 值小于显著水平,设计专家会推断出在更大总体中汽车平均重量与 3000 磅之间存在显著差异。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).