A.数据处理框架(MapReduce),集群管理(YARN),分布管理控制(ZooKeeper)
B.Spark高效数据处理架构
C.安全管理组件
D.Hadoop的客户端
A.分布式文件系统是一种可以处理跨多个群集(节点)的数据访问的系统
B.分布式文件系统是可以跨全球的互联网进行数据共享
C.分布式文件系统跟我们普通的FAT32以及NTFS格式的文件系统没有什么区别
D.分布式文件系统可以很好支持高并发性,但是对于容错性没有很好的支持甚至不支持
A.成千上万的计算机节点构成计算机集群,把文件分布存储到多个计算机节点上
B.用于在Hadoop与传统数据库之间进行数据传递
C.一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统
D.一种高吞吐量的分布式发布订阅消息系统,可以处理消费者网站中所有动作流数据
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。
A.是运行在阿里云平台上的流式大数据分析平台
B.提供给用户在云上进行流式数据实时化分析工具
C.可以使用阿里云StreamSQL进行流式数据分析
D.流计算的数据存储是基于盘古分布式文件系统的
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现