この例では、食料品店におけるトランザクションデータをまとめた「Grocery Purchases.jmp」サンプルデータを使用します。このデータテーブルには、1001人の顧客が購入した商品がリストされています。顧客には、それぞれ一意の顧客IDが割り当てられています。消費者行動のパターンを特定する目的で、商品間の関連性を探ってみましょう。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Grocery Purchases.jmp」を開きます。
2. [分析]>[スクリーニング]>[アソシエーション分析]を選択します。
3. 「商品」を選択し、[アイテム]をクリックします。
4. 「顧客ID」を選択し、[ID]をクリックします。
5. [OK]をクリックします。
デフォルトでは、「ルール」レポートは「信頼度」により、降順に並べられています。ただし、非常に信頼度の高いアソシエーションルールでは、条件セットのアイテム数が増える傾向もあります。条件セットの少ないアソシエーションルールを表示したければ、レポートを「信頼度」で昇順にソートします。
6. 「ルール」レポートを右クリックし、[列の値で並べ替え]を選択します。
「列の選択」ウィンドウが表示されます。
7. 「信頼度」を選択し、その後[昇順]チェックボックスをオンにします。
8. [OK]をクリックします。
図25.2 「アソシエーション分析」レポート
9. 「信頼度」の値が58%の位置までレポートを下にスクロールします。
「ルール」レポートテーブルにおける該当箇所を見ると、アボカド(avocado)を購入した顧客の58%がアーティチョーク(artichoke)も購入していることが分かります。そのリフト値は1.908であり、依存関係があるらしいことを示しています。次に、トランザクションのなかで、アボカドとアーティチョークがどれぐらい一緒に購入されているかを考えてみましょう。
10. 「高頻度のアイテム集合」の開閉アイコンをクリックします。
図25.3 「高頻度のアイテム集合」レポート
「高頻度のアイテム集合」レポートからは、顧客の36%がアボカドを購入していることが分かります。先ほどの図25.2の「ルール」からは、アボカドを購入した顧客のうち58%がアーティチョークも購入していることが分かります。この割合は大きいので、アボカドとアーティチョークを近い売り場に配置するのがよいかもしれません。
また、リフト値が最も高いアソシエーションルールについても見てみましょう。
11. 「ルール」レポートの表内を右クリックし、[列の値で並べ替え]を選択します。
「列の選択」ウィンドウが表示されます。
12. 「リフト値」を選択し、[OK]をクリックします。
「ルール」表がリフト値の降順で並べ替えられます。2番目のアソシエーションルールを見ると、リフト値は5.642、信頼度は83%です。この場合、条件集合({chicken, ice cream})と帰結集合({Coke, sardines})の支持度が適切な値であることを確認する必要があります。
13. 「高頻度のアイテム集合」レポート内を右クリックし、[列の値で並べ替え]を選択します。
「列の選択」ウィンドウが表示されます。
14. 「アイテム集合」を選択し、その後[昇順]チェックボックスをオンにします。
15. [OK]をクリックします。
「高頻度のアイテム集合」がアイテム集合のアルファベット順に並べ替えられます。リストをスクロールして、条件アイテム集合({chicken, ice cream})の支持度が14%であることを確認します。帰結アイテム集合({Coke, sardines})の支持度は15%です。このアソシエーションルールでは、リフト値が高いものの、トランザクション数は最初に検討したアソシエーションルールより少ないです。