分析算法

<< Click to Display Table of Contents >>

当前位置:  可视化数据计算和交互分析 > 数据处理与分析 

分析算法

复制链接

1. 概述

1.1 应用场景

报告端与数据集端相同,也提供了三种自带算法:一元回归、K-Means聚类、HoltWinters时序分析,支持用户通过定制自定义分析算法。能够满足以下数据分析和任务需求:

线性关系分析:使用一元回归功能,可以分析两组变量之间的线性相关关系,评估实际值与预测值之间的误差,为业务决策提供数据支持。

数据挖掘与归类:面对数据集中种类属性不明晰的情况,K-Means聚类算法能够自动将数据点归类为具有相似特点的对象,助力数据驱动的市场细分或用户画像构建。

时间序列预测:通过HoltWinters时序分析,用户能够预测未来一段时间内数据的变化趋势,为库存管理、销售预测等场景提供前瞻性的洞见。

1.2 功能简介

制作报告时,不仅可以直接使用数据集中创建的分析算法结果列,还支持在报告级别新建分析算法,将维度、度量列作为分析变量,进一步分析各变量之间的关系,并通过图表展示分析结果,变量关系清晰明了。此外,还支持定制算法,进一步丰富数据分析的能力。要使用分析算法,需要先配置Rserver,配置方法参考《R安装、启动》和《R配置》。

说明:

本章节模块为产品高级模块,需单独购买:Y+Analytics。

2. 功能说明

这里介绍报告中三种使用分析算法的方式。分析算法的详细设置和使用参考增强分析>分析算法

数据集中新建分析算法

1)创建方式参考数据准备>数据集>分析算法。这里我们创建一元回归,自变量选择Sales,因变量选择Profit。

2)新建报告,并拖入一个图表组件(例如线图),点击数据集下的【数据列】页签。在度量中,可以看到数据集中创建的分析字段。

dataprocess_analysis10_zoom80

3)我们可以将Profit分析_fitted和因变量-Profit绘制到图表中,对比两者差异。

dataprocess_analysis11_zoom60

快捷使用分析算法绘图

1)新建报告,并拖入一个图表组件(例如线图),点击数据集下的【分析算法】页签,默认提供一元回归、K-Means聚类、HoltWinters时序分析三种算法。

dataprocess_analysis1

2)选择一种分析算法,拖拽到图表组件上,在弹出的“分析算法” 窗口中选择并设置算法需要的数据列或属性值,点击“ 确定” 之后,R分析字段会自动绑定到图表上,绘制出用户期望的图形:

dataprocess_analysis2_zoom60

例如预测未来三个月Sales,选择时间列Time,数据列选择Sales,汇总类型为总和。往后预测跨度为3个月,置信区间95%。结果如下:

dataprocess_analysis8_zoom50

报告中新建分析算法

1)新建报告,并拖入一个图表组件(例如线图),点击数据集下的【数据列】页签。鼠标移入数据字段,点击后面的【更多】图标,下拉选择【新建分析算法】。

dataprocess_analysis9_zoom80

2)在“分析算法”弹窗中选择对应算法,并指定相关变量及配置项,例如一元回归,设置自变量为Budget_Cogs,因变量为Sales,多项式次方为1,输出拟合值、残差、置信区间等,如下图:

dataprocess_analysis5_zoom60

3)点击确定,数据列>度量区域新增一个“分析算法”文件夹,文件夹中包含新生成的字段:拟合值、残差、下界、上界:

dataprocess_analysis6_zoom80

4)我们可以将分析算法_拟合值和因变量-Sales绘制到图表中,对比两者差异:

dataprocess_analysis7_zoom60