A.ume属于Apache的顶级项目,它是一款高性能,高可用的分布式日志收集系统
B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)
C.KAFKA架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息
D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高
第1题
下面关于Lucene描述不正确的是
A Lucene是一款开源全文搜索引擎。
B Lucene使用纯Java编写。
C Lucene支持分布式检索。
D Lucene可以实现跨平台应用。
第2题
A.Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统
B.Flume的数据源和目标都是可定制、可扩展的
C.Flume支持多级级联和多路复制
D.Flume适用于大量数据的实时数据采集
第3题
A.分布式云存储技术
B.高性能并行计算技术
C.多源数据清洗及数据整合技术
D.分布式文件系统及分布式并行数据库
E.可视化高维度展示技术
第4题
A.分布式云存储技术
B.高性能并行计算技术
C.多元数据清洗及数据整合技术
D.分布式文件系统及分布式并行数据库
E.可视化高维展示技术
第6题
A.HadoopHDFS
B.Ceph
C.OpenStackSwift
D.GlusterFS
第7题
A、Hadoop是一个有Apache基金会开发的分布式系统开源架构,设计来源于Google的学术论文。
B、Hadoop最核心的功能是提供了大数据的分布式存储MapReduce和并行计算框架HDFS。
C、Hadoop 能够组织和管理成百上千台计算机。
D、Hadoop已衍生出了很多开源项目如HBase、Hive、ZooKeeper等,逐渐发展成了Hadoop生态系统。
第8题
A.高吞吐量
B.高可扩展性
C.集中式
D.分布式
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!