题目内容
(请给出正确答案)
[多选题]
下列关于spark中的RDD描述正确的有()。
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
查看答案
如果结果不匹配,请 联系老师 获取答案
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
A.metastore
B.Statestore
C.Storeage
D.Warehouse
A.RDD支持各种粗粒度和细粒度的操作
B.RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集
C.RDD读取的数据都存储在一台机器上
D.RDD是只读存储
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。