通过选择分析 > 筛选 > 关联分析启动“关联分析”平台。
图 24.4 “关联分析”启动窗口
有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的“列过滤器”菜单。
项目
一个或多个分类列,其中包含要分析的项数据。若列的建模类型为“多重响应”,则每行中的多重响应都被视为一项。若指定多列,则每行中的每列都被视为一个项。
ID
标识某项所属的交易的列。ID 角色是必需的,除非“项目”角色填充了建模类型为“多重响应”的列或是“项目”角色填充了多个列。
注意:若指定 ID 角色,则具有相同 ID 的所有行都组合为一个交易。
频数
标识“项目”列中交易频数的列。例如,若某个交易的频数为 3,则将其视为包含“项目”列中的项的三个相同的交易。
注意:若“项目”角色填充的列的建模类型不是“多重响应”,则忽略“频数”角色。
依据
为“依据”变量的每个水平生成单独的报表。若指定了多个“依据”变量,将为“依据”变量水平的每种可能组合生成单独的报表。
最小支持度
指定某个项集出现的比例的最小值。该值必须介于 0 到 1 之间。只有支持度等于或超过该值的项集才会在分析中加以考虑。
最小置信度
指定在包含条件项集的交易中,结果项集出现的比例的最小值。该值必须介于 0 到 1 之间。只有置信度等于或超过该值的关联规则才会出现在报表中。
最小提升度
指定最小依赖性比率。提升度值必须是为 0 或 0 以上的值。只有提升度值等于或超过该值的关联规则才会出现在报表中。
最大前项
指定条件项集中的最大项数。条件集中的项数超过该项数的关联规则不会在分析中加以考虑。
最大规则大小
指定出现在条件和结果项集的并集中的最大项数。超过该合并项数的关联规则不会在分析中加以考虑。默认值为 4。
注意:您可以在启动窗口中使用最小支持度、最大前项和最大规则大小等选项来减少大型数据集的计算时间。有关这些测度的详细信息,请参见“关联分析”平台的统计详细信息。
“关联分析”平台接受三种数据格式:
• 您可以在“项目”角色中的每行中指定一个项响应,并且使用 ID 角色标识包括在每个交易中的项。在这种格式中,“项目”和 ID 角色是必需的,“频数”角色将被忽略。
• 您可以为“项目”角色指定“多重响应”建模类型列。在这种格式中,“项目”角色是必需的,ID 和“频数”角色是可选的。若指定 ID 角色,则具有相同 ID 的所有行都组合为一个交易。若指定“频数”角色,则将频数应用到交易而不是交易中的特定项。
• 可以在“项目”角色中指定多个项响应列。在这种格式中,ID 和“频数”角色是可选的。若指定 ID 角色,则具有相同 ID 的所有行都组合为一个交易。若指定“频数”角色,则将频数应用到交易而不是交易中的特定项。