<< Click to Display Table of Contents >> FP-Growth |
在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。
用法:
该节点接收数据集节点的输入,数据集中应该至少有事务标识列和事项列。设置关联规则后,可通过连接表格视图来查看性能指标;连接图片视图来查看ROC曲线。
注意事项:
最小支持数:建议应当小于所有事务中的最大事务项数量。
❖FP-Growth节点的配置方法
将FP-Growth节点添加到实验后,可通过右侧的”配置项目“页面,对FP-Growth节点进行设置。
【最小支持数】对于样本量较大数据集,建议:最小支持数/事务标识总量(支持度)>0.5%,例如,事务标识总量=10000,最小支持数建议大于50。取值范围大于等于1的整数。
【最大置信度】取值范围(0,1]。
【事务标识】事务主体标识列,通常为某个事务ID,如订单号、Session_ID等等。
【事项列】记录事项编号、名称等等信息的字段。
FP-Growth节点右键菜单
❖FP-Growth节点运行
运行节点,将数据传递给DM-Engine进行计算,得到输出结果。
❖FP-Growth节点重置
已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。
❖FP-Growth节点重命名
在FP-Growth节点的右键菜单中,选择“重命名”,可以对节点进行重命名。
❖刷新FP-Growth节点
在FP-Growth节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。
❖保存为组合节点
在FP-Growth节点的右键菜单中,选择“保存为组合节点”,可以将选中的节点保存为组合节点以实现复用节点,保存的节点的参数与原节点一致。
❖剪切FP-Growth节点
在FP-Growth节点的右键菜单中,选择“剪切”,在目标位置右键选择“粘贴”,可以实现节点的剪切粘贴。
❖复制FP-Growth节点
在FP-Growth节点的右键菜单中,选择“复制”,在目标位置右键选择“粘贴”,可以实现节点的复制粘贴。
❖删除FP-Growth节点
在FP-Growth节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。