该帮助的版本不再更新,请参见https://www.jmp.com/support/help/zh-cn/15.2 获取最新的版本.


Lipid Data.jmp 数据表包含来自加利福尼亚州医院 95 个研究对象的血液测量值、体格检查测量值和问卷数据。您关注的是如何在将来分析中将验证列用作验证方法。
1.
选择帮助 > 样本数据库,然后打开 Lipid Data.jmp
2.
选择分析 > 分布
3.
性别分配给“Y,列”角色。点击确定
图 3.15 Lipid Data.jmp 中性别的分布
Distribution of Gender in Lipid Data.jmp
图 3.15演示了数据集中性别的分布。请注意,表示出来的男性和女性的比例不相同。由于数据中的女性稀少,您想要平衡验证集和训练集之间的性别比例。
4.
选择分析 > 预测建模 > 生成验证列
5.
点击分层随机
6.
性别选作用于验证保留的列。
7.
点击确定
8.
选择分析 > 以 X 拟合 Y
9.
验证分配给“Y,响应”,将性别分配给“X,因子”。
10.
点击确定
图 3.16 性别在验证集和训练集之间的分布
Distribution of Gender across Validation and Training Sets
图 3.16演示了性别在每个验证集和训练集之间的分布。请注意,男性和女性都有大约 75% 位于训练集中,并且男性和女性都有大约 25% 位于验证集中。