首页 > 其他

题目内容（请给出正确答案）

[多选题]

下列关于spark中的RDD描述正确的有（）。

A.RDD（ResilientDistributedDataset）叫做弹性分布式数据集，是spark中最基本的数据抽象；

B.Resilient：表示弹性的；

C.Destributed：分布式，可以并行在集群计算；

D.Dataset：就是一个集合，用于存放数据的；

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“下列关于spark中的RDD描述正确的有（）。”相关的问题

第1题

Spark的RDD缓仔方法有persist 和cache。（)

点击查看答案

第2题

针对仅存储数据在内存中的存储策略，如果内存不足的话，Spark会使用______缓存策略清除最老的分区，为新的RDD提供空间。

点击查看答案

第3题

Spark最核心的东西是什么？（)

A.RDD

B.SDD

C.ROM

D.RAM

点击查看答案

第4题

Spark的关键技术包括以下哪几个（）。

A.RDD；

B.Scheduler；

C.Storage；

D.Shuffle；

点击查看答案

第5题

Spark可以通过哪些外部存储创建RDD（)。

A.文本文件

B.目录

C.压缩文件

D.通配符匹配的文件

点击查看答案

第6题

如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是（)。

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

点击查看答案

第7题

RDD有Transformation和Action算子，下列属于Action算子的是：（)。

A.metastore

B.Statestore

C.Storeage

D.Warehouse

点击查看答案

第8题

RDD有Transformation和Action算子,下列属于Action算子的是？（)

A.map

B.saveAsTextFile

C.Filter

D.reduceByKey

点击查看答案

第9题

关于RDD论述正确的是（)。

A.RDD支持各种粗粒度和细粒度的操作

B.RDD提供一种高度受限的共享内存模型，是一个弹性分布式数据集

C.RDD读取的数据都存储在一台机器上

D.RDD是只读存储

点击查看答案

第10题

关于NoSQL、Reids、Spark的描述，哪项是错误的？（)

A.NoSQL数据库因为不受schema的限制，可以获得比传统关系型数据库更好的读写性能，因此，所有应用都可以使用NoSQL数据库替代关系型数据库。

B.NoSQL数据库类型可以分为键值型NoSQL数据库，文档型NoSQL数据库，列存储型NoSQL数据库和图NoSQL数据库

C.Redis是单纯的内存数据库，不提供数据持久化功能，因此可靠性很低。

D.Spark分布式计算框架可以支持多种计算模式，包括批处理、流处理和SQL查询。

点击查看答案

第11题

下列选项中，()是Spark的重要角色。

A、Node Manager

B、Resource Manager

C、Data Node

D、Driver

点击查看答案

湖南优积谷网络科技有限公司版权所有 ©2024

湘ICP备16018319号-1 湘公安备案43019002000613号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）