A、hadoop
B、Spark streaming
C、Flink
D、STORM
第2题
A.Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合
B.Spark不适用那种异步细粒度更新状态的应用
C.Spark基于非实时数据流的数据处理
D.Spark的适用面比较广泛且比较通用
第3题
A、Spark实时计算框架
B、Strom流计算框架
C、Giraph图计算框架
D、Mapreduce离线计算框架
第4题
A、复杂的批量数据处理:MapReduce
B、基于历史数据的交互式查询:Impala
C、基于实时数据流的数据处理:Storm
D、图结构数据的计算:Hive
第5题
A、利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B、利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C、构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D、把实时采集的数据作为流计算系统的输入,进行实时处理分析
第6题
A、Pig:处理大规模数据的脚本语言
B、Tez:支持DAG作业的计算框架
C、Oozie:工作流和协作服务引擎
D、Kafka:分布式发布订阅消息系统
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!