A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
A.是一个分布式应用程序协调服务
B.Google的Chubby一个开源实现
C.是Hadoop的重要组件
D.提供的服务包括配置维护、域名服务、分布式同步、组服务
A.成千上万的计算机节点构成计算机集群,把文件分布存储到多个计算机节点上
B.用于在Hadoop与传统数据库之间进行数据传递
C.一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统
D.一种高吞吐量的分布式发布订阅消息系统,可以处理消费者网站中所有动作流数据
A.是一个分布式数据库与并行计算系统
B.是一个分布式存储系统与分布式数据库
C.是一个集中式存储与分布式并行运算系统
D.是一个分布式存储与分布式并行运算系统
A.同一个存储池可以选择多种压缩算法,提高压缩速度和比例
B.在同一个存储池只能选择一个压缩算法
C.存储池压缩算法的修改会影响已经压缩的数据
D.压缩引擎采用三种不同压缩算法组合运行
A.分布式文件存储系统(HDFS)
B.分布式计算框架(MapReduce)
C.分布式资源调度系统(Yarn)
D.数据处理方法(DPW)