A.MapReduce是支持分布式机器学习算法的计算框架。
B.MapReduce的运行需要基础的分布式存储系统HDFS支持。
C.MapReduce可以对分布式的大数据分片进行并行的实时分析。
D.MapReduce上的数据分析属于数据并行计算类型。
第1题
A、它们都是支持大数据处理的分布式并行计算框架。
B、它们都可以把大数据转化为小数据,然后分布在集群进行并行分析。
C、它们对机器学习算法的处理方法是一样的。
D、Haoop支持模型并行,Spark支持数据并行。
第2题
B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义
C.想完全禁止输出,可以使用NullOutputFormat
D.每个reduce需将它的输出写入自己的文件中,输出无需分片
第3题
B、TaskTracker通过周期性心跳向JobTracker表明自己还活着
C、MapTask失败后,能够被重新调度到其他节点上执行
D、ReduceTask失败后,能够被重新调度到其他节点上执行
第4题
A、k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B、k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C、k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D、k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
第5题
A、MapReduce中 maperconbiner reducer 缺一不可
B、在 JobConf 中 InputFormat 参数可以不设
C、在 JobConf 中 MapperClass 参数可以不设
D、在 JobConf 中 OutputKeyComparator 参数可以不设
第6题
A、MapReduce采用“分而治之”策略
B、MapReduce设计的一个理念就是“数据向计算靠拢”,而不是“计算向数据靠拢”
C、MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker和Task
D、MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数,Map和Reduce
第7题
B.实现WritableComparable接口的类可以是值或键
C.Hadoop的基本类型Text并不实现WritableComparable接口
D.键和值的数据类型可以超出Hadoop自身支持的基本类型
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!