A、中文分词技术采用了基于符号的方法来识别
B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量
C、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等
D、动态索引包含2个关键的索引结构:倒排索引、临时索引
第1题
A、PageRank标准算法不考虑没有超链接网页的情况
B、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n
C、PageRank简化算法可以保证迭代过程中的PageRank值之和为1
D、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善
第2题
A、隐语义模型很难实现实时推荐
B、基于用户的协同过滤算法更社会化,着重于反映和用户兴趣相似的小群体的热点
C、使用基于内容的推荐算法进行个性化推荐时,由于非结构化特征难以利用,我们通常直接将其舍弃
D、基于物品的协同过滤算法着重于维护用户的历史兴趣
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!