<< Click to Display Table of Contents >> 聚合函数 |
函数 |
语法 |
说明 |
举例 |
---|---|---|---|
approximateCount |
approximateCount(expression) |
数据库内计算的不同值计算,如果采用集市数据集,就是采用HyperLogLog计数(大数据的基数估计算法,误差3%),返回一组数据不同值的个数 |
例如: approximateCount(col['sales']) |
avg |
avg(expression) |
返回一组数据的平均值。avg 只能用于数字字段。会忽略 Null 值 |
例如: avg(col["利润"]) |
count |
count(expression) |
返回一组数据中数据的个数,不对 Null 值计数 |
例如: count(col['product']); |
correlation |
correlation(expression , expression) |
返回一组数据的相关系数 |
例如: correlation(col['sales'], col['profit']) |
countAll |
countAll(expression) |
返回一组数据的计数,包含 null 值计数 |
例如: countAll(col['sales']) |
covariance |
covariance(expression) |
返回一组数据的协方差 |
例如: covariance(col['sales'], col['profit']) |
distinctCount |
distinctCount(expression) |
返回一组数据不同值的个数 , 不对 Null 值计数 |
例如: distinctCount(col['product']) |
max |
max(expression) |
返回一组数据中的最大数值 |
例如: max(col['date']) |
median |
median(expression) |
返回一组数据的中位数 |
例如: median(col['sales']) |
min |
min(expression) |
返回一组数据的最小值 |
例如: min(col['sales']) |
mode |
mode(expression) |
返回一组数据中的众数 |
例如: mode(col['sales']) |
populationStandardDeviation |
populationStandardDeviation(expression) |
返回一组数据的总体标准差 |
例如: populationStandardDeviation(col['sales']) |
populationVariance |
populationVariance(expression) |
返回一组数据的总体方差 |
例如: populationVariance(col['sales']) |
Product |
Product(expression) |
返回一组数据的乘积 |
例如: Product(col['sales']) |
pthPercentile |
pthPercentile(expression , number) |
返回数值区域的P百分比数值点 |
例如: pthPercentile(col['sales'], 10) |
quartile |
quartile(expression , 4) |
返回一组数据的四分位点 |
例如: quartile(col['sales'], 4) |
range |
range(expression) |
返回一组数据的范围 |
例如: range(col['sales']) |
standardDeviation |
standardDeviation(expression) |
返回一组数据的标准差 |
例如: standardDeviation(col['sales']) |
standardError |
standardError(expression) |
返回一组数据的标准误差 |
例如: standardError(col['sales']) |
sum |
sum(expression) |
返回一组数据中所有数据之和 |
例如: sum(col['sales']) |
sumSQ |
sumSQ(expression) |
返回一组数据的平方和 |
例如: sumSQ(col['sales']) |
sumWT |
sumWT(expression 1 , expression 2) |
返回数据的权重之和 |
例如:sumWT(col['sales'], col['profit']) |
variance |
variance(expression) |
返回一组数据的方差 |
例如: variance(col['sales']) |
weightAvg |
weightAvg(expression 1 , expression 2) |
返回数据的权重的均值 |
例如: weightAvg(col['sales'], col['profit']) |