「アソシエーション分析」プラットフォームは、独立したイベント(トランザクション)に現れるアイテムの関連性を調べます。アソシエーション分析で分析対象となる基本単位は、「アイテム」(item)です。アイテムは、たとえば、製品・Webページ・サービスなどが相当します。また、1つまたは複数のアイテムを含む集合を、「アイテム集合」(item set)と言います。
2つのアイテム集合の関係は、アソシエーションルール(association rule)によって記述されます。アソシエーションルールは、条件(condition)のアイテム集合と帰結(consequent)のアイテム集合から構成されます。条件に含まれるアイテムは、「先行」(antecednt)とも呼ばれています。アソシエーション分析は、ある条件がトランザクションで生じている場合に、ある帰結がどれぐらいの頻度で含まれるかを予測します。関連が強いアソシエーションルールを探し出すことは有用でしょう。アソシエーションルールの強さを表すのに、次の3つの指標が使われています。
•
|
支持度(support)は、該当のアイテム集合を含んでいるトランザクションの割合です。支持度が高いということは、そのアイテム集合が頻繁に現れることを意味します。
|
•
|
信頼度(confidence)は、条件アイテム集合を含むトランザクションのうち、帰結アイテム集合を含むものの割合を指します。信頼度は、アソシエーションルールの関係の強さや予測能力の強さを表します。
|
•
|
リフト値(lift)は、条件アイテム集合と帰結アイテム集合がそれぞれ独立してトランザクションに現れると仮定した場合の信頼度の期待値に対する、観測された信頼度の比です。リフト値は、帰結アイテム集合がどれだけ条件アイテム集合の存在に依存しているかを表します。リフトの最小値は0です。
|
これらの指標の詳細については第 “アソシエーション分析における指標”を参照してください。
アソシエーション分析の詳細については、Hastie et al.(2009)およびShmueli et al.(2010)を参照してください。特異値分解の詳細については、Jolliffe(2002)を参照してください。