A.与决策树算法不同,朴素贝叶斯模型是比较各种类别出现的概率大小确定样本的类别。
B.朴素贝叶斯算法是一种使用概率理论的非监督分类算法。
C.朴素贝叶斯模型需要先确定特征,并根据样本计算相关的先验概率,再计算特征条件下的分类变量的后验概率。
D.朴素贝叶斯模型课用于垃圾邮件分类、微博用户情感的识别等场景。
第1题
A、朴素贝叶斯算法基于贝叶斯定理和特征条件独立性假设
B、朴素贝叶斯算法使用最大似然估计来确定参数
C、条件独立指的是数据集各个特征的取值与其他特征不相关
D、朴素贝叶斯算法对离群值不敏感
第4题
A、基于知识的推荐主要看目前用户掌握知识的情况,依赖知识关系图进行推荐。
B、基于标签的推荐可以通过表征用户兴趣的标签进行推荐,标签可以由用户给定或利用算法提取。
C、基于用户行为二分图的推荐可以依据用户与物品之间的相关性计算。
D、多种推荐算法对同一用户进行推荐时,每种推荐算法的结果都是相同的。
第5题
A、动态规划算法本质上是时间换空间的算法
B、动态规划算法的每一个子问题只解一次,存储子问题结果,避免重复计算。
C、贪心和递推算法是线性解决问题,动态规划则是全面分阶段地解决问题。
D、状态转移方程表示状态间的递推关系,也是子问题间的递推关系。
第6题
A、对于定性属性,计算某一类别的样本中某种属性取该值的样本所占比例来近似
B、对于定性属性,将转化为定量属性,再计算相应的概率
C、对于定量属性,将取值离散化变为区间,再当做定性属性处理
D、对于定量属性,假设变量服从某种概率分布,通过训练数据集估计分布的参数
第7题
A、枚举法适用于问题的小规模实例
B、减少枚举变量可以减少枚举算法的时间复杂度。
C、在某些问题实例中枚举是唯一的解决方法。
D、蛮力是枚举算法的一种。
第8题
A、k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B、k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C、k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D、k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
第9题
A、过拟合是因为训练样本太多了,把训练样本的规律都拟合进去了,因此检测样本的准确率也很高。
B、减少过拟合的方法可以通过降低决策树的复杂度,例如减少决策树的深度。
C、判断模型是否过拟合可以看随着训练的增加,学习到的模型准确度高了,但检测样本的准确率下降。
D、分类算法都可能会遇到过拟合现象。
第10题
A、算法必须在有穷时间终止。
B、程序是算法用某种程序设计语言的具体实现。
C、程序总是在有穷步的运算后终止。
D、算法可以使用自然语言描述,但要保证无歧义。
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!