「Hair Care Product.jmp」データテーブルは、毛染め製品に関する、仮想的なデータです。ある大手美容雑貨チェーンが、126,184名の男女のカード会員に対して、毛染め製品を購入するかどうかを追跡しました。まず、カード会員の中から約半数を無作為に抽出し、毛染め製品の広告を送付しました。そして、その後3か月にわたって、カード会員全員を対象に、製品を購入するかどうかを追跡しました。
データテーブルの「広告」列は、広告が送付されたかどうかを示します。「購入」列は、製品を購入したかどうかを示します。各会員について、「性別」、「年齢」、「髪の色」、「米国 地域」、「居住地」(都市部かどうか)の情報が収集されています。また、「検証」列によって、カード会員の約33%が検証データとして使われるように設定されています。
JMPの「アップリフト」プラットフォームでは、応答変数がカテゴリカルである場合は、並び替えたときに順番が最初になっている水準が、関心のある水準として扱われます。「購入」列に「値の表示順序」列プロパティが設定されているのは、「Yes」を最初の水準とするためです。この列プロパティを設定しないと、「No」が最初の水準となり、分析において関心のある水準として扱われてしまいます。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Hair Care Product.jmp」を開きます。
2. [分析]>[消費者調査]>[アップリフト]を選択します。
3. 「列の選択」リストから
– 「広告」を選択し、「処置」をクリックします。
– 「購入」を選択し、[Y, 目的変数]をクリックします。
– 「性別」、「年齢」、「髪の色」、「米国 地域」、「居住地」を選択し、[X, 説明変数]をクリックします。
– 「検証」列を選択し、[検証]ボタンをクリックします。
4. [OK]をクリックします。
5. レポートのグラフの下にある[実行]をクリックします。
検証セットに基づき、最適な分岐の数が3と判断されます。次の図では、わかりやすいように、縦軸のスケールを変更しています。
3回分岐した後のグラフ
グラフから、広告によって購入にアップリフトが生じているのは、髪の色が黒(black)・赤(red)・茶色(brown)の女性、または低年齢層(年齢 < 42)で髪の色がブロンドである女性のいずれかのグループだとわかります。高年齢層(年齢 ≥ 42)でブロンドの女性の場合は、広告の効果がマイナスとなっています。