A.RDD 可以从 HDFS 输入创建. 或从与 Had oop 兼容的其他存储系统中输入创建
B.Spark 的所有 Transform 操作都是基于 RDD 来实现的。
C.RDD 是只读和可分区的。要想对 RDD 进行操作. 只能重新生成一个新的 RDD。
D.当前 RDD 默认是存储于内存. 当内存不足时, RDD 也不会溢出到磁盘中
第1题
B.当前 RDD 默认是存储于内存.当内存不足时,RDD 也不会溢出到磁盘中。
C.Spark 的所有 Transform 操作都是基于 RDD 来实现的。
D.RDD 是只读和可区分的。要想对 RDD 进行操作.只能重新生成一个新的 RDD
第4题
A、相比Mapreduce,Spark的中间数据放在内存中,对于迭代运算的效率更高
B、Spark支持使用Scala、Java、Python和R语言进行编程
C、RDD可从文件创建或通过对其他RDD执行转换操作而创建
D、窄依赖是划分Stage的依据,遇到窄依赖就划分stage
第5题
B.Reids 是单纯的内存数据库.不提供数据持久化功能,因此可靠性很低
C.NoSQL 数据库类型可以分为键值型 NoSQL 数据库.文档型 NoSQL 数据库,列存储型NoSQL 数据库和图 NoSQL 数据库
D.NoSQL 数据库因为不受 schema 的限制.可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用 NoSQL 数据库替代关系型数据库
第6题
A、Spark Streaming是Spark核心的扩展,支持实时数据流处理
B、Spark Streaming能够接收Kafka、HDFS等多种数据源的数据
C、Spark Streaming的实时性比Storm好
D、Spark Streaming把流式计算转化为一系列微小数据块的批处理计算
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!