数据准备

<< Click to Display Table of Contents >>

当前位置:  产品简介 > 产品模块功能概述 

数据准备

复制链接

当前的数据类型、数据结构、数据范围和数据库类型各种各样且纷繁复杂,不能够直接用于数据分析,必须按照用户需求和vividime Z-Suite的规范进行过滤,才能成为系统可以识别的数据,用于数据分析。

用户可通过各种方式创建数据集,并对数据进行多角度多层次的治理操作,包括联接、联合、分组汇总、自循环列、透视/逆透视、去重、抽样、排序、镜像;建立数据层次以方便报告端钻取、除此之外,还有日期转年/季度/月/周/日等、填充缺失值、对数据进行分组/分箱、值映射、拆分数据列、去除数据中的空格、数据类型转换等。如果基础数据未包括所需的所有列(字段),也可以通过计算创建新列,vividime Z-Suite支持100多个计算函数。经治理的数据,过滤掉不符合要求的数据,才能带来高质量的数据分析与科学的结论。

另外,数据集还提供了血缘分析功能,方便数据处理人员查看数据、报告、组件之间的依赖关系。

创建数据集模块目前支持以下数据集:SQL数据集、Excel数据集、组合数据集、自服务数据集、数据集市数据集、流式数据集、Mongo数据集、内嵌数据集、多维数据集、定制数据集、Neo4j数据集、RESTful数据集。

fo_dataset_zoom50

数据准备还可以通过数据模型定义数据库表或数据集的列与列之间一对一,一对多,多对一或多对多的关系。在可视化端,根据表格、图表等可视化组件用到的字段,找到依赖的表,将这些表根据模型的定义自动形成关联关系并执行数据。使用数据模型可在以下场景发挥极佳优势。

支撑更好的分析场景,如销售表、订单表、客户表,既可以分析每个销售人员的销售绩效,也可以分析客户在不同产品的购买情况。

更好的解决数据膨胀问题,一对多,多对多的关联场景下,都会出现数据计算多次的情况,数据模型的执行逻辑避免了重复计算。

更好的解决数据完整性问题,无需了解左侧联接,右侧联接,外部联接,模型自动计算。

支持在模型中动态汇总指标,为所有下游分析提供服务。

同源计算合并,并支持跨源建模和跨源计算(内存计算,VooltDB加速),并且能基于自服务加工之后的结果再进行建模。

fodatamodel_zoom47