A、TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。
B、TF-IDF的背景是:特征向量里高频词的权重更大,这些词在文集内其他文档里面也经常出现。它们往往太普遍,对区分文档起的作用不大。因此有必要抑制那些在很多文档中都出现了的词条的权重。
C、采用TF-IDF模式,词条t在文档d中的权重计算与词条在在文档d中的频率无关
D、其它答案都不对
第2题
A、scikit-learn包括许多知名的机器学习算法的实现,包括SVM等
B、scikit-learn封装了其他的Python库,如自然语言处理的NLTK库
C、scikit-learn内置了大量数据集,如iris数据集等
D、scikit-learn实现了多种分类的评估方法,如准确率、精确率、召回率等
第4题
A、B的家乡代理的IP地址
B、B的外地代理的IP地址
C、B的家乡地址
D、B的转交地址
第7题
A、A点所在等干球温度线;
B、过A的等焓线与饱和空气线的交点所在的等干球温度线;
C、过A的等湿度线与饱和空气线的交点所在的等干球温度线;
D、以上说法均不正确。
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!