Spark API编程中spark文件操作和debug是怎样的

蜗牛互联网技术资讯 2021-12-17 336 0

本篇文章为大家展示了Spark API编程中spark文件操作和debug是怎样的，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

这次我们以指定executor-memory参数的方式来启动spark-shell：

Spark API编程中spark文件操作和debug是怎样的 spark api 第1张

Spark API编程中spark文件操作和debug是怎样的 spark api 第2张

从hdfs上读取文件：

Spark API编程中spark文件操作和debug是怎样的 spark api 第3张

可以看出MappedRDD是从HadoopRDD转换而来的

再看下textFile的源代码：

Spark API编程中spark文件操作和debug是怎样的 spark api 第4张

Spark API编程中spark文件操作和debug是怎样的 spark api 第5张

下面进行一个简单的wordcount操作：

Spark API编程中spark文件操作和debug是怎样的 spark api 第6张

再次使用toDebugString，查看下依赖关系：

HadoopRDD -> MappedRDD -> FlatMappedRDD -> MappedRDD -> ShuffledRDD

上述内容就是Spark API编程中spark文件操作和debug是怎样的，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注蜗牛博客行业资讯频道。

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：niceseo99@gmail.com进行举报，并提供相关证据，一经查实，将立刻删除涉嫌侵权内容。

本文地址：http://vps90.com/vps/5864.html

版权声明：如无特殊标注，文章均为本站原创，转载时请以链接形式注明文章出处。

评论

有免费节点资源，我们会通知你！加入纸飞机订阅群

×

天气预报查看日历手机扫码留言评论 Telegram