Hadoop MapReduce有什么作用

蜗牛互联网技术资讯 2021-12-09 392 0

这篇文章主要介绍“Hadoop MapReduce有什么作用”，在日常操作中，相信很多人在Hadoop MapReduce有什么作用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Hadoop MapReduce有什么作用”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

Hadoop MapReduce是一个软件框架，基于该框架能够容易地编写应用程序，这些应用程序能够运行在由上千个商用机器组成的大集群上，并以一种可靠的，具有容错能力的方式并行地处理上TB级别的海量数据集。

1.软件框架，2.并行处理，3.可靠且容错，4.大规模集群，5.海量数据集。

因此，对于MapReduce可以简单地认为，他是一个软件框架，海量数据是它的“菜”，它在大规模集群上以一种可靠且容错的方式并行地“烹饪这道菜”。

MapReduce能做什么？简单讲可以做大数据处理，即如何烹饪这道菜，比如数据加工、挖掘和数据分析等。

MapReuce的思想就是“分而治之”。Mapper负责“分”，即把复杂的任务分解为若干个“简单的任务”来处理。“简单的任务”包含三层含义：一是数据或计算的规模相对原任务要大大缩小；二是就近计算原则，即任务会分配到存放着所需数据的节点上进行计算；三是这些小任务可以并行计算，彼此间几乎没有依赖关系。Reducer负责对map阶段的结果进行汇总。至于需要多少个Reducer，用户可以根据具体问题，通过在mapred-site.xml配置文件里设置参数mapred.reduce.tasks的值，缺省值为1。

MapReduce的思想就是“分而治之”。Mapper负责“分”，即把复杂的任务分解为若干个“简单的任务”来处理。“简单的任务”包含三层含义：一是数据或计算的规模相对原任务要大大缩小；二是就近计算原则，即任务会分配到存放着所需数据的节点上进行计算；三是这些小任务可以并行计算，彼此间几乎没有依赖关系。Reducer负责对map阶段的结果进行汇总。至于需要多少个Reducer，用户可以根据具体问题，通过在mapred-site.xml配置文件里设置参数mapred.reduce.tasks的值，缺省值为1。

爱上

Mapreduce大规模数据集的操作，分发给一个主节点管理下的各分节点共同完成，然后通过整合各分节点的中间结果，得到最终的结果。简单地说，MapReduce就是“任务的分解与结果的汇总”。上述处理过程被MapReduce高度的抽象为两个函数：map和reduce，map负责把任务分解成多个任务，reduce负责把分解后多任务处理的结果汇总起来。至于在并行编程中的其他种种复杂问题，如分布式存储，工作调度，负载均衡，容错处理，网络通信等，均由MapReduce框架负责处理。

用MapReduce来处理的数据集（或任务）必须具备这样的特点：

待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行的进行处理。

Hadoop MapReduce有什么作用 mapreduce 第1张