下列有关MapReduce计算框架的描述正确的是()。
A.MapReduce可以计算任务的划分和调度;
B.MapReduce可完成数据的分布存储和划分;
C.MapReduce可以实现处理系统节点出错检测和失效恢复;
D.MapReduce可实现处理数据与计算任务的同步;
A.MapReduce可以计算任务的划分和调度;
B.MapReduce可完成数据的分布存储和划分;
C.MapReduce可以实现处理系统节点出错检测和失效恢复;
D.MapReduce可实现处理数据与计算任务的同步;
A.前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
B.前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
C.前者相比后者学习起来更难
D.前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
A.MPI适用于数据相关性强,迭代次数多的计算
B.MapReduce适用于大规模数据处理,节点失效对系统无影响
C.MPI设计前提是计算相关性强,硬件容易坏
D.MapReduce设计前提是数据全局性弱,硬件是容易坏的
A.对相互间具有计算机以来关系的大数据进行分而治之
B.用Map和Reduce两个函数提供了高层并行编程抽象模型
C.提供了同一框架
D.为程序员隐藏系统细节
A.MapReduce是一种计算方式,是用以进行大数据量计算的方法
B.Map对数据集上的独立元素进行指定操作
C.生成的中间结果不是键-值对形式输出
D.Reduce则对中间结果中相同“键”的所有“值”进行规约,以得到最终结果
A.Hadoop通过并行处理加快处理速度
B.Hadoop的集群往往需要昂贵的机器来构建
C.Hadoop是可靠的,维护多个数据副本
D.Hadoop支持分布式计算