关联规则

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 旧操作 > 算法 

关联规则

复制链接

1.概述

关联规则(Association Rules)是无监督的机器学习方法,从数据背后发现事物之间可能存在的关联或者联系,用于知识发现,而非预测。这种事物之间的关联或者联系就叫规则。

2.配置参数

拖拽一个数据集和一个关联规则节点到画布,连接数据集和关联规则节点。

添加关联规则模型到实验后,可通过右侧的“配置项目”页面,对模型进行设置。

Depthanalysis_OldAssociationRules1

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。运用Apriori算法时,绑定的数据集不能是集市数据集。

添加关联规则模型到实验后,可通过右侧的“配置项目”页面,对模型进行设置。

【支持度范围(%)】模型所生成的规则的支持度级别的百分比值范围。如果不在此范围内,规则将被废弃。

【置信度(%)】模型所生成的规则的置信度级别的最小百分比值。如果模型所生成的规则的置信度级别小于此数量,那么该规则将被废弃。

【最小项数】模型所生成的规则的最小项数,小于此值将被废弃。

【最大项数】模型所生成的规则的最大项数,大于此值将被废弃。

【自变量】从选择列对话框中选出需要作为自变量的字段。

3.查看Apriori算法模型结果

关联规则模型运行成功后,会自动切换到“结果展示”页面,查看实验模型的结果,再次运行时则不会自动切换,可以手工切换至结果展示页面。

关联规则图

各项的关联关系图,每个圆圈代表一条规则,指向圆圈的是左项,圆圈指向的是右项;圆圈大小代表支持度大小,圆圈越大支持度越大,圆圈颜色代表提升度,颜色越深提升度越大。

Depthanalysis_OldAssociationRules2

关联规则

Depthanalysis_OldAssociationRules3

【左项】规则的先导项集。

【右项】规则的结论项集。

【支持度】项集出现的次数除以总的记录数。

【置信度】项集{X,Y}同时出现的次数占项集{X}出现次数的比例。

【提升度】度量项集{X}和项集{Y}的独立性。数值越大模型越好。