Hive高阶聚合函数用法示例
这篇文章主要为大家展示了“Hive高阶聚合函数用法示例”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hive高阶聚合函数用法示例”这篇文章吧。
如果需要多维度做一些指标统计,数据量比较大的话,我们一般会选择olap引擎,比如kylin等,但是如果数据量不是很大的话,hive也是可以实现的。
create table wedw_tmp.hive_function_test_df ( province_name string comment '省份名称' ,city_name string comment '城市名称' ,area_name string comment '地区名称' ,people_cnt int comment '人口数量' ,amt decimal(16,2) comment 'GDP' ) row format delimited fields terminated by ',' |
广东,广州,白云区,100,30 广东,广州,番禺区,120,45 广东,深圳,福田区,200,67 广东,深圳,南山区,290,100 浙江,杭州,萧山区,80,20 浙江,杭州,滨江区,120,50 浙江,宁波,江东区,80,23 浙江,宁波,江北区,45,5 |
select * from wedw_tmp.hive_function_test_df; |
一 with cube
select province_name ,city_name ,area_name ,sum(people_cnt) as all_people_cnt from wedw_tmp.hive_function_test_df group by province_name ,city_name ,area_name with cube ; |
二 grouping sets
select province_name ,city_name ,area_name ,sum(people_cnt) as all_people_cnt from wedw_tmp.hive_function_test_df group by province_name ,city_name ,area_name grouping sets((),(province_name),(province_name,city_name)) ; |
三 with rollup
select province_name ,city_name ,area_name ,sum(people_cnt) as all_people_cnt from wedw_tmp.hive_function_test_df group by province_name ,city_name ,area_name with rollup ; |
以上是“Hive高阶聚合函数用法示例”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注蜗牛博客行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
评论