本文作者为永洪科技高级咨询顾问
1998年《哈佛商业评论》上刊登了这样一则案例:20世纪90年代的美国沃尔玛超市中,管理人员分析销售数据时发现了一个令人费解的现象:在某些特定情况下,“啤酒”与“尿布”两件看上去毫无关联的商品会经常一同出现在购物篮中,这一独特的销售现象引起了管理人员的注意。
后经过调查发现,这种现象出年轻父亲的身上:刚有婴儿的美国家庭中,目前负责照看婴儿,年轻的父亲来到超市进行采购,在购买尿布时,他往往会顺便为自己购买啤酒,因此,啤酒与尿布两件看上去毫不相干的商品经常一同出现在购物车中。如果这个父亲在商场中只能买到两件商品之一,则他可能会放弃购买转而选择另一家商店,知道一次可以同时购买到啤酒与尿布。
沃尔玛发现这一现象,开始在卖场中尝试将啤酒与尿布摆放在同一区域,让年轻父亲可以同时找到这两件商品,快速完成购物,同时也可以确保客户购买两件商品,而非其中一件,从而获得更高的销售收入,这就是“啤酒与尿布”故事的由来。
“啤酒与尿布”的案例可以说已经成为从营销界到数据分析行业的经典段子,这个故事的实质其实就是商品的交叉销售,放到今天就犹如电商网站的商品推荐。研究这种关联关系的方法就是购物篮分析,购物篮分析可以帮助我们在门店、网站的销售过程中找到具有关联关系的商品,以此推动销售额的增长。
商品的关联分析是购物篮分析中最重要的部分。关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。就像在购物篮中频繁出现的“啤酒与尿布”组合。
关联分析算法有很多,例如Apriori算法、基于划分的算法、FP-growth算法等。如今,关联分析已经不仅仅运用于零售、快消行业,也更多地运用在互联网、金融、医学、气象、交通等行业,在推荐、反欺诈、精准营销等领域有深入应用。
Yonghong Z-Suite V7.5深度分析模块提供关联规则算法,用户可直接通过拖拽实现关联规则挖掘模型构建。考虑如下场景,某连锁超市有所有用户的消费数据,通过Yonghong完成了数据处理,经过处理后得到图1一张宽表,包含:信用卡ID、用户年龄、性别、收入、支付方式、以及商品购买清单等信息。
图1
图2
我们希望了解交易数库中不同商品项的关联,找出客户的购买行为模式。则可以通过运用深度分析模块,进行深度信息挖掘,具体步骤如下:
1. 添加数据节点后,拖入购物篮模型:
图3
2. 进行参数配置,在关联规则节点,选择合适的支持度和置信度,得到关联规则。设置10%的支持度,设置80%的置信度,最小项数为2,最大项数为4,将所有购买的产品添加为自变量列:
图4
图5
3. 点击运行,即可查看结果展示:
图6:关联规则图
图7:关联规则
4. 结果分析
1)以第一条数据为例,bear(啤酒 )和frozenmeal(冻肉)是左项、cannedveg(罐装蔬菜)是右项、支持度(Support)表示购买左项(啤酒和冻肉)的记录数占所有的购买记录数的百分比、置信度(confidence)表示同时购买左项和右项的记录数占购买后项(蔬菜)记录数的百分比,提升度(Lift)表示置信度与已知右项的百分比的比值,提升大于 1 的规则才是有意义的。
图8
2)根据结果可以看出购买了啤酒、冻肉的顾客,同时有85.9%购买了罐头蔬菜,而且提升度为2.834,表明此规则的相关性很强。由此可知,啤酒和冻肉、罐装蔬菜放在一起销售比较合理。
注:以上的深度分析应用案例基于Yonghong Z-Suite V7.5版本,使用前需要先配置R环境。以下为两种主要推荐的方式:
1)windows安装产品,推荐用linux虚拟机的方式:
安装linux虚拟机,里面有已经配置好的R和Rserve,把Rserve启动即可。
2)linux安装产品,推荐用docker镜像的方式:
在linux上安装docker,下载R的docker镜像(里面是centos7,已经包含R和Rserve),启动docker,把Rserve启动即可。
在11月18日的永洪科技用户大会上,我司咨询专家将为大家带来《AI助力企业深度洞察数据》的主题分享,为你详解AI的实践应用案例。快来报名吧~