您可以使用“生成分箱公式”选项将数据分布到等宽箱中。选择要划分到多个箱中的一个或多个列,然后选择列 > 实用工具 > 生成分箱公式。新的公式列将添加至数据表。
“生成分箱公式”窗口包含以下选项:
格式
选择用于在箱中显示一系列值的格式。您可以通过将光标移动到图形上方来查看预览。
箱形状:剩余偏差
为箱的下边缘选择偏移值。
注意:箱通过其下边缘来标识。下边缘位于箱中。上边缘位于下一个箱中,因为它是下一个箱的下边缘。
箱形状:宽度
选择箱的值宽度。
注意:着色带反映相对于数据的箱偏移和宽度。
标签
指定是否用值标签代替数据值进行显示。
使用值标签
显示标签而不是值。
使用范围标签
在标签中包含每个范围的下限值和上限值。
无标签
将下边缘值用作标签。
请参见值标签。
提示:大多数平台都建议使用值标签,其中很多平台都不支持范围标签。在“分类”平台中,您必须使用值标签。在某些轴上,您可能会发现范围标签可以更清晰地标识值,或者您可以尝试调整轴的偏移和宽度。
使所有列类似于 X
(仅当选定多列时才显示。)将对第一列 (X) 所做的选择应用到其余列。
生成公式列
创建公式列并关闭该窗口。
1. 选择帮助 > 样本数据库,然后打开 Big Class.jmp。
2. 选择身高列。
3. 选择列 > 实用工具 > 生成分箱公式。
您希望值范围显示为 X-X,所以请将范围设置为低 - 高。
4. 将偏移改为 -0.5。
提示:对于整数数据,将偏移设置为 -0.5 有助于区分边缘处的值。在该示例中,一个箱的取值范围介于 59.5 到 64.5 之间,所以很明显 59 和 65 都不包含在该箱内。
5. 保持宽度设置为 5。
6. 对于标签,请保持设置为使用值标签,这样您就可以看到箱的值范围。
已完成的分箱窗口
7. 点击生成公式列。
名为“身高”分箱的列添加至 Big Class.jmp 数据表。
8. 要查看如何计算公式,请右击“身高”分箱列并选择公式。
公式