<< Click to Display Table of Contents >> 关联规则 |
在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。
用法:
该节点接收数据集节点的输入,数据集中应该至少有事务标识列和事项列。设置关联规则后,可通过连接表格视图来查看性能指标;连接图片视图来查看ROC曲线。
注意事项:
最小支持数:建议应当小于所有事务中的最大事务项数量。
❖关联规则节点的配置方法
将关联规则节点添加到实验后,可通过右侧的”配置项目“页面,对关联规则节点进行设置。
【最小支持数】对于样本量较大数据集,建议:最小支持数/事务标识总量(支持度)>0.5%,例如,事务标识总量=10000,最小支持数建议大于50。取值范围大于等于1的整数。
【最大置信度】取值范围(0,1]。
【事务标识】事务主体标识列,通常为某个事务ID,如订单号、Session_ID等等。
【事项列】记录事项编号、名称等等信息的字段。
关联规则节点右键菜单
❖关联规则节点运行
运行节点,将数据传递给DM-Engine进行计算,得到输出结果。
❖关联规则节点重置
已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。
❖关联规则节点重命名
在关联规则节点的右键菜单中,选择“重命名”,可以对节点进行重命名。
❖删除关联规则节点
在关联规则节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。
❖刷新关联规则节点
在关联规则节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。