<< Click to Display Table of Contents >> 网站流量预测复制链接 |
1.背景介绍
网站流量分析,是指在获得网站访问量基本数据的情况下对有关数据进行统计分析、预测,从中发现用户访问网站的规律,通常会将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。
2.数据说明
本案例中我们使用某网站每天的用户访问记录作为数据,该历史数据集(时间段为2017-08-15至2017-09-11),元数据信息如表所示。
字段名称 |
字段描述 |
数据类型 |
---|---|---|
AboutUsPage |
“关于我们”子页面的访问次数 |
数值型 |
AccountPage |
“个人中心”页面的访问次数 |
数值型 |
AllNewsPage |
“新闻”页面的访问次数 |
数值型 |
HomePage |
首页面的访问次数 |
数值型 |
Time |
日期 |
日期时间型 |
3.方案介绍
该案例中,我们主要关心“HomePage”页面的数据流量规模,这是个单维时序数据,我们可以采用ARIMA算法。
“R绘图”节点的输入为一个数据集,输出为图片,不输出其他数据,但是该节点的脚本编写比较自由,用户可以在其中做数据处理、编写模型训练、预测的处理逻辑,生成用于绘图的数据。
在做单维时序预测时,通常我们会选用若干模型评价指标(如MSE、RMSE、MAPE等)来评估预测的准确性,但是这里我们更多想通过可视化形式直观展示模型预测的结果是否符合预期。
4.方案分析
1)模型工作流搭建
使用自定义R脚本进行建模还是比较简单的。我们直接将“客户访问记录”数据集从工作面板左侧“数据集”tab下拖拽至页面,并从操作tab下的 “脚本”目录中拖拽“R绘图”节点至画布,将两节点直接相连构建实验工作流。
2)编写R脚本
在这里我们使用ARIMA算法做单维时间序列预测,并用ggplot2工具将历史数据和预测结果可视化。
5.结果说明
在我们构建好实验工作流并录入了R脚本之后,连接图片视图节点,点击“运行全部”按钮运行实验,当实验运行完成后,点击“图片视图”节点,在右侧面板上的“结果展示”,即可查看绘制的png图片,如图所示。其中,红色折线为未来7天的预测值,蓝色折线为预测时间点前的历史实际值。这是我们经过调参之后的运行结果,基本符合经验预期。ARIMA算法参数的含义及用法可参考其它文献资料了解。