题目内容
(请给出正确答案)
[单选题]
Hadoop生态系统中,()的主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作。
A.HDFS
B.Flume
C.Hive
D.Sqoop
查看答案
如果结果不匹配,请 联系老师 获取答案
A.HDFS
B.Flume
C.Hive
D.Sqoop
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase多用于存储非结构化和半结构化的松散数据
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高