Hadoop中,与谷歌对应的三项分布式云计算技术包括()。
A.HDFS
B.MapReduce
C.BIGTABLE
D.HBase
A.HDFS
B.MapReduce
C.BIGTABLE
D.HBase
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase多用于存储非结构化和半结构化的松散数据
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高
A.利用MapReduce计算模型
B.基于Hadoop集群
C.实现了一批开源的挖掘方法
D.采用了DFS分布式文件系统
B.分布式消息服务Kafka
C.对象存储服务OBS
D.应用与数据集成平台ROMA Connect
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源