「Hair Care Product.jmp」データテーブルは、毛染め製品に関する、仮想的なデータです。ある大手美容雑貨チェーンが、126,184名の男女のカード会員に対して、毛染め製品を購入するかどうかを追跡しました。まず、カード会員の中から約半数を無作為に抽出し、毛染め製品の広告を送付しました。そして、その後3か月にわたって、カード会員全員を対象に、製品を購入するかどうかを追跡しました。
データテーブルの「広告」列は、広告が送付されたかどうかを示します。「購入」列は、製品を購入したかどうかを示します。各カード会員について、「性別」、「年齢」、「髪の色」、「米国 地域」、「居住地」(都市部かどうか)の情報が収集されています。また、「検証」列によって、カード会員の約33%が検証データとして使われるように設定されています。
JMPの「アップリフト」プラットフォームでは、応答変数がカテゴリカルである場合は、並び替えたときに順番が最初になっている水準が、関心のある水準として扱われます。「購入」列に「値の表示順序」列プロパティが設定されているのは、「Yes」を最初の水準とするためです。この列プロパティを設定しないと、「No」が最初の水準となり、分析において関心のある水準として扱われてしまいます。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Hair Care Product.jmp」を開きます。
2. [分析]>[消費者調査]>[アップリフト]を選択します。
3. 「列の選択」リストから
– 「広告」を選択し、「処置」をクリックします。
– 「購入」を選択し、[Y, 目的変数]をクリックします。
– 「性別」、「年齢」、「髪の色」、「米国 地域」、「居住地」を選択し、[X, 説明変数]をクリックします。
– 「検証」を選択し、[検証]ボタンをクリックします。
4. [OK]をクリックします。
5. レポートのグラフの下にある[実行]をクリックします。
検証セットに基づき、最適な分岐の数が3と判断されます。左側の縦軸のスケールは、右側の縦軸上に表示される全体での結果の割合を維持するためにロックされています。
図6.2 3回分岐した後のグラフ
グラフの右側の縦軸は、購入の割合が非購入に比べて小さいことを示しています。グラフから、広告によって購入にアップリフトが生じているのは、髪の色が黒(black)・赤(red)・茶色(brown)の女性、または低年齢層(年齢 < 42)で髪の色がブロンドである女性のいずれかのグループだとわかります。高年齢層(年齢 ³ 42)でブロンドの女性の場合は、広告の効果がマイナスとなっています。
6. 「購入のアップリフトモデル」の赤い三角ボタンをクリックし、[アップリフトグラフ]を選択します。
図6.3 アップリフトグラフ
被験者のうち、2つのグループ(男性と、年齢 ³ 42のブロンドの女性)で、広告の効果がマイナスとなっています。アップリフトグラフにある横線は、検証データにおけるアップリフト値です。学習データから推定されたツリーが、検証データに対して評価され、アップリフト値の推定値が算出されます。