予測モデルおよび発展的なモデル > アソシエーション分析 > 「アソシエーション分析」プラットフォームの概要
公開日: 04/01/2021

「アソシエーション分析」プラットフォームの概要

「アソシエーション分析」プラットフォームは、独立したイベント(トランザクション)に現れるアイテムの関連性を調べます。アソシエーション分析で分析対象となる基本単位は、「アイテム」(item)です。アイテムは、たとえば製品・Web ページ・サービスなどが相当します。また、1つまたは複数のアイテムを含む集合を、「アイテム集合」(item set)と言います。

2つのアイテム集合の関係は、アソシエーションルール(association rule)によって記述されます。アソシエーションルールは、条件(condition)のアイテム集合と帰結(consequent)のアイテム集合から構成されます。条件に含まれるアイテムは、「先行」(antecednt)とも呼ばれています。アソシエーション分析は、ある条件がトランザクションで生じている場合に、ある帰結がどれぐらいの頻度で含まれるかを予測します。関連が強いアソシエーションルールを探し出すことは有用でしょう。アソシエーションルールの強さを表すのに、次の3つの指標が使われています。

支持度(support)は、該当のアイテム集合を含んでいるトランザクションの割合です。支持度が高いということは、そのアイテム集合が頻繁に現れることを意味します。

信頼度(confidence)は、条件アイテム集合を含むトランザクションのうち、帰結アイテム集合を含むものの割合を指します。信頼度は、アソシエーションルールの関係の強さや予測能力の強さを表します。アソシエーション分析の信頼度は信頼区間の概念には関連していないことに注意してください。

リフト値(lift)は、条件アイテム集合と帰結アイテム集合がそれぞれ独立してトランザクションに現れると仮定した場合の信頼度の期待値に対する、観測された信頼度の比です。リフト値は、帰結アイテム集合がどれだけ条件アイテム集合の存在に依存しているかを表します。リフトの最小値は0です。

リフト値が1より小さい場合、条件と帰結が一緒に生じる頻度が、偶然に期待される頻度よりも低いことを意味します。よって、条件と帰結が反発していると考えられます。

リフト値が1に近い場合、条件と帰結は、偶然に期待される頻度と同じ頻度で生じていると考えられます。

リフト値が1より大きい場合、条件アイテム集合と帰結アイテム集合が一緒に生じる頻度が、偶然に期待される頻度よりも高いことを意味します。よって、条件と帰結は関連していると考えられます。

これらの指標の詳細については、アソシエーション分析における指標を参照してください。

「アソシエーション分析」プラットフォームでは、特異値分解(SVD; Singular Value Decomposition)も実行できます。特異値分解は、アソシエーション分析とは別の枠組みにもとづいた分析です。特異値分解により、類似のトランザクションやアイテムを見つけることができます。アソシエーション分析の結果を補完するかたちで、別の観点からデータを見ることができます。

アソシエーション分析の詳細については、 Hastie et al.(2009)およびShmueli et al.(2010)を参照してください。特異値分解の詳細については、Jolliffe(2002)を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).