分析算法

<< Click to Display Table of Contents >>

当前位置:  制作可视化报告 > 数据处理与分析 

分析算法

复制链接

1. 概述

1.1 功能简介

制作报告时,还支持新建分析算法,将维度、度量列作为分析变量,进一步分析各变量之间的关系,并通过图表展示分析结果,变量关系清晰明了。

支持一元回归、K-Means聚类、HoltWinters时序分析和定制细节计算、聚合计算:

【一元回归】根据自变量X和因变量Y的相关关系,建立X与Y的线性回归方程进行预测,可以计算拟合值、残差、上界、下界等,分析实际值与拟合值的关系,可以一定程度上反映数据质量,也支持绘制回归线,分析变量满足的相关关系。

【K-Means聚类】基于聚类算法,给一组数据点指定聚类中心个数,每个数据点会划分到最近的聚类中心归为一类。

【HoltWinters时序分析】是一种时间序列分析和预测方法,利用指数平滑法让模型参数不断适应非平稳序列的变化,并对未来趋势进行短期预测。

产品提供有多种分析算法,如果想进一步了解算法使用方法,请参考数据集中新建分析算法

1.2 应用场景

分析两组变量之间的线性相关关系或分析实际值与预期值的误差,可以使用一元回归。

数据集内种类属性不明晰,希望能够通过数据挖掘出或自动归类出有相似特点的对象,可以使用K-Means聚类。

已知一批数据,想预测未来一段时间内数据变化趋势,可以使用HoltWinters时序分析。

2. 操作步骤

快捷使用分析算法绘图

1)先拖入一个图表组件,点击数据集下的【分析算法】页签,提供有一元回归、K-Means聚类、HoltWinters时序分析三种算法。

DataProcess_Analysis1

2)选择一种分析算法,拖入图表组件,在弹出的“ 分析算法” 窗口中选择并设置算法需要的数据列或属性值,点击“ 确定” 之后,R 字段会自动绑定到图表上,绘制出用户期望的图形:

DataProcess_Analysis2

例如对一组数据点设置K-Means聚类,k=3,会根据聚类中心将所有数据聚合为三类,结果如下:

DataProcess_Analysis3

 

新建分析算法,生成分析字段,生成可视化图表

1)以一元回归为例,鼠标移入数据字段,点击后面的【更多】图标,下拉选择【新建分析算法】:

DataProcess_Analysis4

2)在“分析算法”弹窗中选择对应算法,并指定相关变量及配置项,例如一元回归,设置自变量为销量,因变量为总成本,多项式次方为1,输出拟合值、残差、置信区间等,如下图:

DataProcess_Analysis5

3)会在度量区域新增一个“分析算法”文件夹,文件夹中包含新生成的字段:拟合值、残差、下界、上界:

DataProcess_Analysis6

4)我们可以将分析算法_拟合值和因变量-总成本绘制到同一张图表,对比两者差异:

DataProcess_Analysis7

可以看到,在55k~60k范围内与期望偏差较大,其它区域比较吻合,整体数据满足线性分布规律。