A.count():返回RDD中元素的个数
B.foreach(func):将数据集中的每个元素传递到函数func中运行
C.reduce(func):通过函数func(输入两个参数并返回一个值)聚合RDD中的元素
D.filter(func):筛选出满足函数的元素,并返回一个新的 RDD
第2题
A、("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)
B、1,1,1,1
C、”Hadoop”,1,”Spark”,1
D、4
第3题
A、”Hadoop”,”Spark”,”Hive”,”Spark”
B、”Hadoop”,”Spark”,”Hive”
C、(”Hadoop”,1),(”Spark”,1),(”Hive”,1)
D、("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)
第4题
A、相比Mapreduce,Spark的中间数据放在内存中,对于迭代运算的效率更高
B、Spark支持使用Scala、Java、Python和R语言进行编程
C、RDD可从文件创建或通过对其他RDD执行转换操作而创建
D、窄依赖是划分Stage的依据,遇到窄依赖就划分stage
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!