A.小规模
B.无用数据
C.大规模数据
D.非分布式数据
第1题
A.分布式文件系统
B. 分布式数据库系统
C. 关系型数据库系统
D. 非结构化数据分析系统
第4题
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
第6题
A.数据保险箱
B. 使用NVDIMM非易失性内存来保存和恢复元数据和缓存数据
C. 集群节点自身具备冗余模块
D. 分布式元数据和数据保护
第7题
A.A.HDFS是Hadoop技术体系中数据管理的基础,是一个高容错的系统,能检测和应对硬件故障
B.B.Sqoop数据同步工具,它是SQL TO Hadoop的缩写,主要用于关系型数据库和Hadoop之间的数据传输
C.C.Sqoop数据导入和导出本质上还是一个MapRuduce程序,充分利用了MapRuduce的并行化和容错性
D.D.Kafka主要用于处理活跃的流式数据,在web网站上非常常见,包括网站的pageview
第10题
A.利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B.利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C.构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D.把实时采集的数据作为流计算系统的输入,进行实时处理分析
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!