下列关于Map/Reduce计算流程叙述不正确的一项为()
A.Mapper读取分派给它的输出Split,并生成相应的本地缓存
B.Mapper执行计算处理任务,将中间结果输出保存在本地缓存
C.ApplicationMaster调度Reducer读取Mapper的中间输出文件,执行Reduce任务
D.Reducer将最后结果写入输出文件保存到HDFS
A.Mapper读取分派给它的输出Split,并生成相应的本地缓存
B.Mapper执行计算处理任务,将中间结果输出保存在本地缓存
C.ApplicationMaster调度Reducer读取Mapper的中间输出文件,执行Reduce任务
D.Reducer将最后结果写入输出文件保存到HDFS
A.一个reduce的输入数据可能来自于多个map的输出
B.一个MR处理可以不包括任何map
C.一个MR处理可以不包括任何reduce
D.一个map的输出结果可能会被分配到多个reduce上去
A.map->reduce->shuffle
B.shuffle->map->reduce
C.map->shuffle->reduce
D.shuffle->reduce->map
A.支持计算在内存中进行,中间结果不落地
B.支持Map后连续任意多个Reduce操作
C.可以在上一次的reduce结束之后,直接增加一次map
D.从Map直接到Reduce,省去Shuffle阶段
A.支持Map后连接任意多个Reduce操作,如Map-Reduce-Reduce
B.支持Map后不连接Reduce,而是连接另一个map,如Map-Map-Reduce
C.支持ChainMapper/Reducer,即支持Map-Reduce-Map-Reduce
D.支持没有Map,直接进入Reduce
A.抽象层次低,需要手工编写代码来完成,使用上难以上手
B.只提供两个操作,Map和Reduce,表达力欠缺
C.处理逻辑隐藏在代码细节中,没有整体逻辑
D.中间结果也放在HDFS文件系统中
A、Hive最佳使用场景是大数据集的批处理作业
B、Hive可以实现在大规模集群上实现低延迟快速查询
C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销
D、Hive查询操作过程严格遵循HadoopMap Reduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为Map ReduceHadoop集群上
A.输入的文件尽量使用大文件
B.合理的分配map和reduce的任务的数量
C.压缩中间数据,减少1/0
D.在map之后先进行bine处理,减少1/0