<< Click to Display Table of Contents >> 度量 |
度量表示可被用于衡量和统计的数值,销售,利润,成本等都是度量。以此,数值类型的数据都被划分为度量了。另外把日期,时间也划分为度量。常用来做度量的数据类型包括:
数据类型 |
说明 |
---|---|
Long |
长整数 |
Short |
短整数 |
Integer |
整数 |
Byte |
字节 |
Float |
单精度浮点数 |
Double |
双精度浮点数 |
度量同样也可以变为维度,转变规则如上。
度量支持的统计函数较多,支持所有本产品提供的统计函数。
函数名 |
用途 |
---|---|
Sum |
返回数据集中所有数据之和 |
Count |
返回数据集中的数据个数 |
AccurateDistinct Count |
返回数据集中不同值数据个数,采用HashSet计数,无误差 |
Distinct Count |
大数据的基数估计算法,采用HyperLogLog计数,误差3% |
Max |
返回数据集中的最大数值 |
Min |
返回数据集中的最小值 |
Range |
返回数据集的范围 |
Average |
返回数据集中的平均值 |
Product |
返回一组数据的乘积 |
Median |
返回给定数值集合的中位数 |
Quartile |
返回一组数据的四分位点 |
Mode |
返回在某一数组或数据区域中的众数 |
Sum Square |
返回一组数据的平方和 |
Pth Percentile |
返回数值区域的P百分比数值点 |
Variance |
返回一组数据的方差 |
Population Variance |
返回一组数据的总体方差 |
Standard Deviation |
返回一组数据的标准差 |
Standard Error |
返回一组数据的标准误差 |
Population Standard Deviation |
返回一组数据的总体标准差 |
Sum Weight |
返回一组数据的权重之和 |
Weight Average |
返回一组数据的权重的均值 |
Covariance |
返回一组数据的协方差 |
Correlation |
返回一组数据的相关系数 |
需要自动把数据类型分成维度还是度量分类的地方包括:
1)刷新元数据。在数据集建立好后,刷新元数据的时候,需要把数据集里的所有字段自动分成维度和度量,分配规则如上。分好后,会分别在元数据界面的两个节点上列出来。
2)新建计算列。在元数据界面上新建计算列,即用脚本生成字段,此时需要选择数据类型。会自动列到对应的节点上。
3)创建了层次,日期层次,数字范围,新建分组,值映射、去空格,拆分列会自动列到维度上;缺失值填充根据原字段数据类型来判断,如果是字符串会自动列在维度上,如果是数值类型会自动列在度量上。
4)在制作报告的时候,创建计算列字段。在报表的绑定界面上,不会根据数据类型来分,而是根据生成的计算列字段的类型来分。细节维度字段是维度。细节度量字段和聚合度量字段是度量。