Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析

蜗牛互联网技术资讯 2021-12-17 314 0

本篇文章给大家分享的是有关Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。

下面看下union的使用：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第1张

使用collect操作查看一下执行结果：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第2张

再看下groupByKey的使用：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第3张

join操作就是一个笛卡尔积操作的过程，如下示例：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第4张

使用collect查看执行结果：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第5张

可以看出join操作完全就是一个笛卡尔积的操作；

reduce本身在RDD操作中属于一个action类型的操作，会导致job的提交和执行：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第6张

下面我们看下lookup的使用：

Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析 spark api 第7张

以上就是Spark API编程中如何在Spark 1.2版本实现对union、groupByKe的分析，小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注蜗牛博客行业资讯频道。

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：niceseo99@gmail.com进行举报，并提供相关证据，一经查实，将立刻删除涉嫌侵权内容。

本文地址：http://vps90.com/vps/5857.html

版权声明：如无特殊标注，文章均为本站原创，转载时请以链接形式注明文章出处。

评论

有免费节点资源，我们会通知你！加入纸飞机订阅群

×

天气预报查看日历手机扫码留言评论 Telegram