A.纠删码
B.RAID—x
C.rsync
D.镜像复制
A.默认使用哈希索引
B.MySQL使用Memory存储引擎作为临时表来存放查询的中间结果集
C.支持外键和事务处理
D.将表中数据存放在内存中
A.将一部分数据存放到本地数据中心的磁盘柜上
B.删除一部分旧数据
C.通过生命周期规则将30前的数据沉降至低频存储
D.通过生命周期规则将30后的数据沉降至低频存储
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源
A.切勿将欧盟公民的个人数据存储在欧盟之外。
B.个人数据的数据屏蔽和加密。
C.仅使用欧盟批准的加密协议。
D.将个人数据传输到欧盟以外的来源时的匿名化。
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎
A.数据写入时被切割成N个数据块,大小相同。
B.在ErasureCode存储模式下,系统最多支持N块硬盘失效。
C.系统将N+M个数据块并行的存储于不同的硬盘中。
D.每N个连续数据块通过ErasureCode算法计算出M个校验块(M
A.在主端存储使用SmartCache进行加速,加快主端存储IO处理速度。
B.RPO不要求为零的场景下,建议选用异步远程复制方案。
C.根据主端存储各LUN的业务压力情况,将各LUN的归属控制器归属均分到A控制器和B控制器上。
D.如果使用异步远程复制方案,需要根据RPO指标来设计启动同步时间,并且考虑尽量将尽量让数据同步在业务低谷期间进行。
A.数据采集是通过传感器、移动互联网、观测设备等获得种多类型的海量数据
B.数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储中的过程
C.数据存储过程需要将采集到的数据进行存储管理,在大数据场景下,只能使用非关系型数据库进行存储
D.数据分析是指利用相关数学模型以及机器学习算法对数据进行统计、预测和文本分析。数据的主要分析方法有探索性数据分析方法、描述统计法、数据可视化等