A.它是一种纯文本的文件格式,在电子商务系统中广泛使用
B.XML文档比HTML更适合表达数据
C.XML文档适合不同平台和系统中传递数据
D.XML已经取代了HTML
A.数据采集是通过传感器、移动互联网、观测设备等获得种多类型的海量数据
B.数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储中的过程
C.数据存储过程需要将采集到的数据进行存储管理,在大数据场景下,只能使用非关系型数据库进行存储
D.数据分析是指利用相关数学模型以及机器学习算法对数据进行统计、预测和文本分析。数据的主要分析方法有探索性数据分析方法、描述统计法、数据可视化等
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎