度量

<< Click to Display Table of Contents >>

当前位置:  创建数据集 > 自服务数据集 > 数据治理 > 数据类型与分类 

度量

Previous pageReturn to chapter overviewNext page

度量表示可被用于衡量和统计的数值,销售,利润,成本等都是度量。以此,数值类型的数据都被划分为度量了。另外把日期,时间也划分为度量。常用来做度量的数据类型包括:

数据类型

说明

Long

长整数

Short

短整数

Integer

整数

Byte

字节

Float

单精度浮点数

Double

双精度浮点数

度量同样也可以变为维度,转变规则如上。

 

度量支持的统计函数较多,支持所有本产品提供的统计函数。

函数名

用途

Sum

返回数据集中所有数据之和

Count

返回数据集中的数据个数

AccurateDistinct Count

返回数据集中不同值数据个数,采用HashSet计数,无误差

Distinct Count

大数据的基数估计算法,采用HyperLogLog计数,误差3%

Max

返回数据集中的最大数值

Min

返回数据集中的最小值

Range

返回数据集的范围

Average

返回数据集中的平均值

Product

返回一组数据的乘积

Median

返回给定数值集合的中位数

Quartile

返回一组数据的四分位点

Mode

返回在某一数组或数据区域中的众数

Sum Square

返回一组数据的平方和

Pth Percentile

返回数值区域的P百分比数值点

Variance

返回一组数据的方差

Population Variance

返回一组数据的总体方差

Standard Deviation

返回一组数据的标准差

Standard Error

返回一组数据的标准误差

Population Standard Deviation

返回一组数据的总体标准差

Sum Weight

返回一组数据的权重之和

Weight Average

返回一组数据的权重的均值

Covariance

返回一组数据的协方差

Correlation

返回一组数据的相关系数

需要自动把数据类型分成维度还是度量分类的地方包括:

1)刷新元数据。在数据集建立好后,刷新元数据的时候,需要把数据集里的所有字段自动分成维度和度量,分配规则如上。分好后,会分别在元数据界面的两个节点上列出来。

2)新建表达式。在元数据界面上新建表达式,即用脚本生成字段,此时需要选择数据类型。会自动列到对应的节点上。

3)创建了层次,日期层次,数字范围,新建分组,值映射、去空格,拆分列会自动列到维度上;缺失值填充根据原字段数据类型来判断,如果是字符串会自动列在维度上,如果是数值类型会自动列在度量上。

4)在制作报告的时候,创建表达式字段。在报表的绑定界面上,不会根据数据类型来分,而是根据选择的表达式字段的类型来分。细节维度字段是维度。细节度量字段和聚合度量字段是度量。