首页 > 其他
题目内容 (请给出正确答案)
[多选题]

下列关于spark中的RDD描述正确的有()。

A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;

B.Resilient:表示弹性的;

C.Destributed:分布式,可以并行在集群计算;

D.Dataset:就是一个集合,用于存放数据的;

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“下列关于spark中的RDD描述正确的有()。”相关的问题
第1题
Spark的RDD缓仔方法有persist 和cache。()
点击查看答案
第2题
针对仅存储数据在内存中的存储策略,如果内存不足的话,Spark会使用______缓存策略清除最老的分区,为新的RDD提供空间。

点击查看答案
第3题
Spark最核心的东西是什么?()

A.RDD

B.SDD

C.ROM

D.RAM

点击查看答案
第4题
Spark的关键技术包括以下哪几个()。

A.RDD;

B.Scheduler;

C.Storage;

D.Shuffle;

点击查看答案
第5题
Spark可以通过哪些外部存储创建RDD()。

A.文本文件

B.目录

C.压缩文件

D.通配符匹配的文件

点击查看答案
第6题
如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()。

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

点击查看答案
第7题
RDD有Transformation和Action算子,下列属于Action算子的是:()。

A.metastore

B.Statestore

C.Storeage

D.Warehouse

点击查看答案
第8题
RDD有Transformation和Action算子,下列属于Action算子的是?()

A.map

B.saveAsTextFile

C.Filter

D.reduceByKey

点击查看答案
第9题
关于RDD论述正确的是()。

A.RDD支持各种粗粒度和细粒度的操作

B.RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集

C.RDD读取的数据都存储在一台机器上

D.RDD是只读存储

点击查看答案
第10题
关于NoSQL、Reids、Spark的描述,哪项是错误的?()

A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。

B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库

C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。

D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。

点击查看答案
第11题
下列选项中,()是Spark的重要角色。
A、Node Manager

B、Resource Manager

C、Data Node

D、Driver

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改