A.对
B.错
第2题
A、在Shark原有的架构上重写了逻辑执行计划的优化部分,解决了Shark存在的问题
B、Spark SQL在Hive兼容层面仅依赖HiveQL解析和Hive元数据
C、Spark SQL执行计划生成和优化都由Catalyst(函数式关系查询优化框架)负责
D、Spark SQL执行计划生成和优化需要依赖Hive来完成
第3题
A、Spark Streaming采用的数据抽象是DStream(本质上就是一系列RDD),而Structured Streaming采用的数据抽象是DataFrame
B、Structured Streaming将Spark SQL和Spark Streaming二者的特性结合起来
C、Structured Streaming可以使用Spark SQL的DataFrame/Dataset来处理数据流,但Spark SQL只能处理静态的数据,而Structured Streaming可以处理结构化的数据流
D、Spark Streaming只能实现秒级的实时响应,而Structured Streaming由于采用了全新的设计方式,采用微批处理模型时可以实现100毫秒级别的实时响应,采用持续处理模型时可以支持毫秒级的实时响应。
第4题
A、Spark SQL可以提供DataFrame API,可以对内部和外部各种数据源执行各种关系操作
B、可以支持大量的数据源和数据分析算法,组合使用Spark SQL和Spark MLlib,可以融合传统关系数据库的结构化数据管理能力和机器学习算法的数据处理能力
C、Spark SQL无法对各种不同的数据源进行整合
D、Spark SQL无法融合结构化数据管理能力和机器学习算法的数据处理能力
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!