两个项集之间的关系由关联规则来定义。关联规则由条件项集和结果项集构成。前项是条件项集中的单个项。关联分析识别关联规则,这些规则预测在某单交易中已经包含条件项集的前提下,结果项集也会出现在该交易中。某些关联规则作用较强,因而比其他规则更有用。以下三个性能测度描述关联规则的强度:
•
|
支持度是其中出现项集的交易的比例。较高的支持度值指示该项集经常出现。
|
•
|
置信度是在交易包含条件项集的前提下,包含结果项集的交易的比例。置信度测量关联规则的隐含强度或预测能力。
|
•
|
提升度是关联规则的置信度与其期望置信度的比率,假设前提是:条件项集与结果项集在交易中出现的概率是独立的。提升度测量结果项集在多大程度上依赖于条件项集的存在。提升度的最小值为 0。
|