Lipid Data.jmp 数据表包含来自加利福尼亚州医院 95 个研究对象的血液测量值、体格检查测量值和问卷数据。您关注的是如何在将来分析中将验证列用作验证方法。
1.
选择帮助 > 样本数据库,然后打开 Lipid Data.jmp
2.
选择分析 > 分布
3.
性别分配给“Y,列”角色。点击确定
Lipid Data.jmp性别的分布
Distribution of Gender in Lipid Data.jmp
Lipid Data.jmp性别的分布 演示了数据集中性别的分布。请注意,表示出来的男性和女性的比例不相同。由于数据中的女性稀少,您想要平衡验证集和训练集之间的性别比例。
4.
选择分析 > 预测建模 > 生成验证列
5.
点击分层随机
6.
性别选作用于验证保留的列。
7.
点击确定
8.
选择分析 > 以 X 拟合 Y
9.
验证分配给“Y,响应”,将性别分配给“X,因子”。
10.
点击确定
在验证集和训练集之间的性别的分布
Distribution of Gender across Validation and Training Sets
在验证集和训练集之间的性别的分布 演示了性别在每个验证集和训练集之间的分布。请注意,男性和女性都有大约 75% 位于训练集中,男性和女性都有大约 25% 位于验证集中。