预测和专业建模 > 关联分析 > “关联分析”平台概述
发布日期: 08/07/2020

“关联分析”平台概述

“关联分析”平台识别独立事件或交易中各组项之间的关系。在关联分析中,是基本的相关对象。例如,项可以是产品、网页或服务。项集是一个或多个项的列表。

两个项集之间的关系由关联规则来定义。关联规则由条件项集和结果项集构成。前项是条件项集中的单个项。关联分析识别关联规则,这些规则预测在某单交易中已经包含条件项集的前提下,结果项集也会出现在该交易中。某些关联规则作用较强,因而比其他规则更有用。以下三个性能测度描述关联规则的强度:

支持度是其中出现项集的交易的比例。较高的支持度值指示该项集经常出现。

置信度是在交易包含条件项集的前提下,包含结果项集的交易的比例。置信度测量关联规则的隐含强度或预测能力。请注意,关联分析中的置信度与置信区间的概念无关。

提升度是关联规则的置信度与其期望置信度的比率,假设前提是:条件项集与结果项集在交易中出现的概率是独立的。提升度测量结果项集在多大程度上依赖于条件项集的存在。提升度的最小值为 0。

小于 1 的提升比指示条件和结果彼此排斥,因为它们一起出现的频率小于其单独偶然出现的频率。

接近 1 的提升比指示结果出现在包含条件的交易中的频率与其单独偶然出现的频率相同。

大于 1 的提升比指示结果项集与条件项集具有密切关联。结果项集与条件项集一起出现的频率比其单独偶然出现的频率要高。

有关这些性能测度的详细信息,请参见关联分析性能测度

“关联分析”平台还支持您执行奇异值分解。奇异值分解 (SVD) 使用不同于关联分析中所用方法的矩阵简化方法对相似交易以及相似项进行分组。使用 SVD 方法获得的深入分析可以为从关联分析中了解到的信息提供有益补充。

有关关联分析的详细信息,请参见 Hastie et al. (2009) 和 Shmueli et al. (2010)。有关奇异值分解的详细信息,请参见 Jolliffe (2002)。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).