A.作为决策树分支属性的选择方法,信息增益的效果不如Gini指数。
B.一般而言,分类算法准确率提高,召回率就会下降,因此可以使用F1值作为评价分类算法的综合评价指标。
C.k折交叉校验中的k可以通过实验确定合理的值,常用取10。
D.对于同一个训练样本集,不同的决策树算法可能得到不同的决策树模型,模型的好坏可以比较检验样本的评价指标确定。
第1题
A、算法参数是默认调好的,分析过程不需要修改
B、分类算法的优劣需要通过实验比较才能确定
C、分类算法对数据有一定的要求,一种算法不能解决所有的分类问题
D、分类算法的结果只要训练样本准确度高就可以使用了
第2题
A、可以对不同分类器算法进行集成
B、可以对相同分类器在不同条件下集成
C、集成算法无法在不同条件下进行集成
D、对数据集不同部分分配给不同分类器后集成
第3题
A、如果一个属性对于所有样本都没有区分能力,那么对于决策毫无用处
B、单一支持向量机模型本身是针对多分类问题的算法
C、K近邻算法中,K值的选择,不会对分类结果有很大影响
D、属性在决策树中的位置不同,并不会影响决策树的效率
第4题
A、在分类时,特征越多越有利于分类。
B、在不影响分类效果的前提下,特征越少越有利于分类。
C、在特征选择中,有两个很重要的方面,一个是特征的评价准则,另外一个是特征的寻优算法。
D、特征选择不仅可以降低特征空间的维度,还可以消除特征之间的相关性。
第5题
A、在DBSCAN算法中,将点分类核心点、边界点和噪音点三类
B、DBSCAN算法,需要指定聚类后簇的个数
C、DBSCAN算法是一种基于划分的聚类算法
D、DBSCAN算法是一种基于密度的聚类算法
第6题
A、密码系统的分类中,依据对明文的处理方式可以划分为流密码和分组密码。
B、分组密码中,分组或密码越长安全性越高,因此实际应用中应选择密钥和分组都最长的分组密码算法。
C、分组密码一般采用简单的、安全性弱的加密算法进行多轮迭代运算,一般来说,迭代轮数越多,密码分析越困难。
D、分组密码中,分组长度、密钥长度以及密文长度都是一样长的。
第7题
A.SVM对噪声(如来自其他分部的噪声样本)具备鲁棒性
B.在adaboost算法中,所有被分错样本的权重更新比例不相同
C.boosting和bagging都是组合多个分类器投票的方法,二者都是根据单个分类器的正确率确定其权重
D.给定n个数据点,如果其中一半用于训练,一半用户测试,则训练误差和测试误差之间的差别会随着n的增加而减少的
第8题
B、搜索引擎有一个索引数据库,网络机器人或网络蜘蛛采集的网页,经过其他程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,添加到这个索引数据库中
C、当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引呈现给我们。所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果是相同的
D、和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息﹑分析信息和查询信息三部分,只不过分类目录的收集﹑分析信息两部分主要依靠人工完成
第9题
A、K近邻算法中K值的选择对分类的结果影响不大
B、模型测试阶段的测试数据集不能与训练数据集有交集
C、决策树算法中最能将样本数据显著分开的属性应该在决策早期就使用
D、支持向量机模型中距离平面最近的几个样本对平面的选择影响最大
第10题
A、应用逻辑回归时,异常值会对模型造成很大的干扰。
B、逻辑回归的自变量必须是分类变量,因此要对连续型变量进行离散化处理。
C、逻辑回归对模型中自变量的多重共线性较为敏感。
D、逻辑回归属于分类算法。
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!