この例では、「Grocery Purchases.jmp」サンプルデータからより深い洞察を得るため、トランザクション-アイテム行列の特異値分解を行います。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Grocery Purchases.jmp」を開きます。
2. [分析]>[スクリーニング]>[アソシエーション分析]を選択します。
3. 「商品」を選択し、[アイテム]をクリックします。
4. 「顧客ID」を選択し、[ID]をクリックします。
5. [OK]をクリックします。
6. 「アソシエーション分析」の赤い三角ボタンをクリックし、[特異値分解]を選択します。
7. [OK]をクリックします。
図24.5 特異値分解プロット
トランザクション特異値分解プロットを見ると、トランザクションのグループが2つか3つあるようです。アイテム特異値分解プロットの右上の方に、「Coke」と「ice cream」の点が重なり合っています。点の近さから、この2つのアイテムには強い関連性があると考えられます。
8. 「特異値分解」の赤い三角ボタンをクリックし、[トピック分析, 特異値分解を回転]を選択します
9. 「トピック (回転後の特異ベクトル) の個数」として「3」を入力し、[OK]をクリックします。
「トピック別上位負荷量」や「トピックスコア」などのレポートが表示されます。
図24.6 「トピック別上位負荷量」レポート
3つのグループ(トピック)が作成され、「トピック別上位負荷量」レポートに表示されます。「トピック別上位負荷量」表に最初にリストされているアイテムは、そのトピックの主要なアイテムです。たとえば、トピック1はアボカド(avocado)を含まないがオリーブ(olives)を含むトランザクションのグループといえます。
図24.7 トピックスコア
「トピックスコア」レポートには、1001のトランザクションそれぞれに割り当てられたトピックのスコアがプロットされます。あるトピックで点のグループを選択すると、これらのトランザクションが他のトピックとどのように関連しているかがわかります。たとえば、トピック1で高い値を持つトランザクションは、トピック2とトピック3では値が低い傾向にあります。
10. 「特異値」レポートを開いてみましょう。
図24.8 「特異値」表
図24.8を見ると、最初の2つの特異値は、食料品店データの変動のおよそ30%しか説明していないことがわかります。十分に変動を説明するためには、3次元以上の次元が必要そうです。