<< Click to Display Table of Contents >> 数据类型与分类 |
数据源的数据有数据类型的概念。根据数据类型不同,数据的展现,对话框的输入,格式的使用,都不同。 Yonghong Z-Suite 中支持的数据类型是可以在创建数据集模块上定义或修改的。数据源的数据可能是数字类型,但数据只有 0 和 1,可从业务逻辑上表明此字段是布尔类型,就可以在界面上改成布尔类型。
数据类型分好了,还需要把其分成两类:维度和度量。一般维度用来给数据分组的,是表示一个方面;而度量是用来做汇总统计的数值。通过不同的方面,来分析一些数值的指标,这样数据就被组合成立方体。对立方体的数据过滤,可以切成小立方,和一个平面片。对应 BI 的 OLAP 概念里得切片和切面。
维度是可以被划分成层次。根据层次的高低,用户可以向上、向下钻取。另外日期类型的层次较特殊,界面上创建日期类型的层次来实现。数据分箱也是维度的一种字段,用户自定义出一种划分数据分箱的字段,把数据分箱作为维度来分析数据也是很常用的使用。另外,用户还可以自定义出各种字段来达到分析需求,包括新建的表达式字段,日期层次的字段,数字分箱的字段。还可以在制作报告界面定义维度指标计算器,细节指标计算器,聚合指标计算器,动态计算器。
现支持的数据类型包括文本(字符,字符串),数值(长整数,短整数,整数,字节,单精度,双精度),日期时间(日期,时间,时间戳)和布尔,见下表。
数据类型 |
说明 |
范围 |
---|---|---|
String |
字符串 |
多个任意字符 |
Char |
单个字符 |
单个任意字符 |
Boolean |
布尔 |
True, false |
Long |
长整数 |
64位,范围:从-263到263-1 |
Short |
短整数 |
16位,范围:从-215 到215-1 |
Integer |
整数 |
32位,范围:从-231到231-1 |
Byte |
字节 |
8位,范围:从-27到27-1 |
Float |
单精度浮点数 |
32位 |
Double |
双精度浮点数 |
64位 |
Date |
日期 |
日期:YYYY-MM-DD |
Time |
时间 |
时间:HH:MM:SS |
Timestamp |
时间戳 |
日期+时间: YYYY-MM-DD HH:MM:SS |
各数据类型除了有数据存储和展现上的区别外,在使用的时候还有一些区别。例如根据类型不同,默认是维度还是度量,画图表时轴的类型, 能支持聚合函数的类型,等方面也有不同。
支持的字段类型会根据数据集类型有所区分,多维数据集只支持计算列、分析算法(分析算法见“深度分析”中“其它分析算法”部分),其它数据集能够支持的以下描述的所有字段类型。