数据类型与分类

<< Click to Display Table of Contents >>

当前位置:  创建数据集 > 自服务数据集 > 数据治理 

数据类型与分类

Previous pageReturn to chapter overviewNext page

数据源的数据有数据类型的概念。根据数据类型不同,数据的展现,对话框的输入,格式的使用,都不同。 Yonghong Z-Suite 中支持的数据类型是可以在创建数据集模块上定义或修改的。数据源的数据可能是数字类型,但数据只有 0 和 1,可从业务逻辑上表明此字段是布尔类型,就可以在界面上改成布尔类型。

数据类型分好了,还需要把其分成两类:维度和度量。一般维度用来给数据分组的,是表示一个方面;而度量是用来做汇总统计的数值。通过不同的方面,来分析一些数值的指标,这样数据就被组合成立方体。对立方体的数据过滤,可以切成小立方,和一个平面片。对应 BI 的 OLAP 概念里得切片和切面。

维度是可以被划分成层次。根据层次的高低,用户可以向上、向下钻取。另外日期类型的层次较特殊,界面上创建日期类型的层次来实现。数据分箱也是维度的一种字段,用户自定义出一种划分数据分箱的字段,把数据分箱作为维度来分析数据也是很常用的使用。另外,用户还可以自定义出各种字段来达到分析需求,包括新建的表达式字段,日期层次的字段,数字分箱的字段。还可以在制作报告界面定义维度指标计算器,细节指标计算器,聚合指标计算器,动态计算器。

现支持的数据类型包括文本(字符,字符串),数值(长整数,短整数,整数,字节,单精度,双精度),日期时间(日期,时间,时间戳)和布尔,见下表。

数据类型

说明

范围

String

字符串

多个任意字符

Char

单个字符

单个任意字符

Boolean

布尔

True, false

Long

长整数

64位,范围:从-263到263-1

Short

短整数

16位,范围:从-215 到215-1

Integer

整数

32位,范围:从-231到231-1

Byte

字节

8位,范围:从-27到27-1

Float

单精度浮点数

32位

Double

双精度浮点数

64位

Date

日期

日期:YYYY-MM-DD

Time

时间

时间:HH:MM:SS

Timestamp

时间戳

日期+时间: YYYY-MM-DD HH:MM:SS

各数据类型除了有数据存储和展现上的区别外,在使用的时候还有一些区别。例如根据类型不同,默认是维度还是度量,画图表时轴的类型, 能支持聚合函数的类型,等方面也有不同。

支持的字段类型会根据数据集类型有所区分,多维数据集只支持计算列、分析算法(分析算法见“深度分析”中“其它分析算法”部分),其它数据集能够支持的以下描述的所有字段类型。