发现 JMP > 数据可视化 > 比较多个变量 > 使用并排箱线图比较多个变量
发布日期: 09/18/2023

使用并排箱线图比较多个变量

并排箱线图显示数据中的关系和差异。

一个连续变量和一个分类变量之间的关系

连续变量在分类变量不同水平下的差异

图 4.18 并排箱线图示例 

Example of Side-by-Side Box Plots

情境

本示例使用 Analgesics.jmp 数据表,表中包含分别使用三种不同药物的病人的疼痛测量数据。

研究人员想探究下列问题:

各药物之间的平均止疼疗效有差异吗?

每种药物的止疼疗效的变异性有差别吗?变异性高的药物不如变异性低的药物可靠。

要回答这些问题,可使用疼痛水平和药物类别的并排箱线图。

创建并排箱线图

1. 选择帮助 > 样本数据文件夹,然后打开 Analgesics.jmp

2. 选择分析 > 以 X 拟合 Y

3. 选择疼痛并点击 Y,响应

4. 选择药物并点击 X,因子

图 4.19 以 X 拟合 Y 窗口 

Fit Y by X Window

5. 点击确定

6. 点击“‘药物-疼痛’单因子分析”旁边的红色小三角并选择显示选项 > 箱线图

图 4.20 并排箱线图 

Side-by-Side Box Plots

解释并排箱线图

箱线图根据下列原则进行设计:

贯穿盒体的直线表示中位数。

数据的中值落在盒体内。

大部分数据落在须线两端之间。

落在须线外部的数据点可能是离群值。

图 4.20 中的箱线图给出下列回答:

有证据证实服用药物 A 的病人感受到的疼痛更少,因为相比其他药物,药物 A 的箱线图中的疼痛范围较小。

药物 B 看起来比药物 A 和药物 C 有更大的变异性,因为箱线图较高。

药物 C 的一个点明显低于药物 C 的其他点。将鼠标悬停在低点上可以看到它是数据表中的第 26 行。该点看起来更像药物组 A 或药物组 B 中的数据。行 26 中的数据需要研究。数据记录时可能发生了录入错误。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).