题目内容
(请给出正确答案)
[单选题]
以下哪个是Mapreduce正确的流程?()
A.map->reduce->shuffle
B.shuffle->map->reduce
C.map->shuffle->reduce
D.shuffle->reduce->map
查看答案
如果结果不匹配,请 联系老师 获取答案
A.map->reduce->shuffle
B.shuffle->map->reduce
C.map->shuffle->reduce
D.shuffle->reduce->map
A.MapReduce是一种计算方式,是用以进行大数据量计算的方法
B.Map对数据集上的独立元素进行指定操作
C.生成的中间结果不是键-值对形式输出
D.Reduce则对中间结果中相同“键”的所有“值”进行规约,以得到最终结果
A.HDFS
B.MapReduce
C.Hbase
D.Zookeeper
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
B.MultipleOutputs可以将不同的键值对输出到用户自定义的不同的文件中
C.输出文件的命名前缀可在publicvoidwrite(KEYOUTkey,VALUEOUTvalue,StringbaseOutputPath)第三个参数中指定
D.利用MultipleOutputs输出多个文件时还会产生默认的文件part-m-00*或part-r-00*,不过这些文件是无内容的,大小为0