<< Click to Display Table of Contents >> 分析算法复制链接 |
1. 概述
1.1 功能简介
制作报告时,还支持新建分析算法,将维度、度量列作为分析变量,进一步分析各变量之间的关系,并通过图表展示分析结果,变量关系清晰明了。
支持一元回归、K-Means聚类、HoltWinters时序分析和定制细节计算、聚合计算:
【一元回归】根据自变量X和因变量Y的相关关系,建立X与Y的线性回归方程进行预测,可以计算拟合值、残差、上界、下界等,分析实际值与拟合值的关系,可以一定程度上反映数据质量,也支持绘制回归线,分析变量满足的相关关系。
【K-Means聚类】基于聚类算法,给一组数据点指定聚类中心个数,每个数据点会划分到最近的聚类中心归为一类。
【HoltWinters时序分析】是一种时间序列分析和预测方法,利用指数平滑法让模型参数不断适应非平稳序列的变化,并对未来趋势进行短期预测。
产品提供有多种分析算法,如果想进一步了解算法使用方法,请参考数据集中新建分析算法。
1.2 应用场景
分析两组变量之间的线性相关关系或分析实际值与预期值的误差,可以使用一元回归。
数据集内种类属性不明晰,希望能够通过数据挖掘出或自动归类出有相似特点的对象,可以使用K-Means聚类。
已知一批数据,想预测未来一段时间内数据变化趋势,可以使用HoltWinters时序分析。
2. 操作步骤
•快捷使用分析算法绘图
1)先拖入一个图表组件,点击数据集下的【分析算法】页签,提供有一元回归、K-Means聚类、HoltWinters时序分析三种算法。
2)选择一种分析算法,拖入图表组件,在弹出的“ 分析算法” 窗口中选择并设置算法需要的数据列或属性值,点击“ 确定” 之后,R 字段会自动绑定到图表上,绘制出用户期望的图形:
例如对一组数据点设置K-Means聚类,k=3,会根据聚类中心将所有数据聚合为三类,结果如下:
•新建分析算法,生成分析字段,生成可视化图表
1)以一元回归为例,鼠标移入数据字段,点击后面的【更多】图标,下拉选择【新建分析算法】:
2)在“分析算法”弹窗中选择对应算法,并指定相关变量及配置项,例如一元回归,设置自变量为销量,因变量为总成本,多项式次方为1,输出拟合值、残差、置信区间等,如下图:
3)会在度量区域新增一个“分析算法”文件夹,文件夹中包含新生成的字段:拟合值、残差、下界、上界:
4)我们可以将分析算法_拟合值和因变量-总成本绘制到同一张图表,对比两者差异:
可以看到,在55k~60k范围内与期望偏差较大,其它区域比较吻合,整体数据满足线性分布规律。