分析分类(有序型或名义型)变量可能会涉及下列问题:
• 变量有多少个水平?
• 每个水平有多少个数据点?
• 数据是统一分布吗?
• 每个水平表示总体的多大比例?
参见连续变量的分布中的情境。
现在铁路公司确定了汽车的平均重量与目标重量之间没有显著差异,铁路公司还有其他问题。
设计专家想回答铁路公司的下列问题:
• 汽车是什么类型?
• 原产国是哪里?
要回答这些问题,查看车型和产地的分布。
1. 选择帮助 > 样本数据库,然后打开 Car Physical Data.jmp。
2. 选择分析 > 分布。
3. 选择产地和车型,并点击 Y,列。
4. 点击确定。
图 5.9 产地和车型的分布
报表窗口包含产地和车型的条形图和“频数”报表。条形图是“频数”报表中提供的频数信息的图形表示。“频数”报表包含下列信息:
• 数据类别。例如,“Japan”是“产地”的一个类别,“Sporty”是“车型”的一个类别。
• 每个类别的总计数。
• 每个类别占总体的比例。
例如,有 22 辆紧凑型汽车,大约占 116 个观测的 19%。
在一个图形中选择某个直条时它也会在其他图形中选择对应的数据。例如,在“产地”条形图中选择“Japan”直条会发现大部分日本车是跑车。
图 5.10 日本车
选择“Other”类别会发现大多数汽车是小型车,几乎没有大型车。
图 5.11 其他汽车