Hair Care Product.jmp 样本数据表来自一个营销活动,该活动旨在提高男性和女性对染发产品的购买量。为了设计该研究并跟踪购买行为,我们选取了一家大型美发连锁店的 126,184 名持有“会员卡”的会员为研究对象。并从中随机抽取一半的会员,向他们发送该产品的促销信息。接下来我们追踪了所有持有会员卡的会员在随后三个月对该产品的购买行为。
数据表包含一个促销列,表示会员是否收到了促销资料。购买列表示会员在试验期内是否购买了产品。对于每个会员,我们收集了以下信息:性别、年龄、头发颜色(自然)、美国地区和住处(会员是否居住在城市地区)。数据表还包含一个验证列,包含大约 33% 的测试对象。
对于分类响应,“提升”平台会把值排序中的第一个水平当做关注的响应进行建模。这是购买列具有“值顺序”列属性的原因所在,该属性确保“是”响应排在第一位。
1. 选择帮助 > 样本数据库,然后打开 Hair Care Product.jmp。
2. 选择分析 > 消费者研究 > 提升。
3. 从“选择列”列表:
‒ 选择促销,然后点击处理。
‒ 选择购买,然后点击 Y,响应。
‒ 选择性别、年龄、头发颜色、美国地区和住处,然后点击 X,因子。
‒ 选择验证并点击验证。
4. 点击确定。
5. 在显示的报表中的图形下方,点击执行。
基于验证集的最优拆分数确定为 3。请注意,左垂直尺度已锁定,以便保持右垂直轴上显示的结果的总体比率。
图 6.2 三次拆分后的图形
图中的右侧垂直轴指示购买的比例比不购买的比例小。该图形显示购买的提升发生在具有黑色、红色或棕色头发的女性群体中或具有金发的更年轻的女性(年龄 < 42)会员中。对于男性会员和年龄更大的淡黄色头发的女性会员(年龄 ≥ 42),促销具有负面影响。
6. 点击“‘购买’的提升模型”红色小三角并选择提升图形。
图 6.3 提升图形
请注意,对于后面的两组测试对象(男性组和年龄 ≥ 42 的非金发的女性组),促销具有负面影响。“提升图形”中显示的水平线绘制了验证集的图形。具体来说,首先根据验证集对决策树进行评估,然后“提升图形”根据估计的提升值构造提升图形。