A.Google搜索引擎很重要
B.搜索引擎排名很重要
C.关键词匹配很重要
D.被搜索引擎能检索到很重要
第1题
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。
(1)请描述你解决这个问题的思路;
(2)请给出主要的处理流程,算法,以及算法的复杂度。
第2题
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。
(1)请描述你解决这个问题的思路;
(2)请给出主要的处理流程,算法,以及算法的复杂度。
第3题
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。
(1)请描述你解决这个问题的思路;
(2)请给出主要的处理流程,算法,以及算法的复杂度。
第5题
B、搜索引擎有一个索引数据库,网络机器人或网络蜘蛛采集的网页,经过其他程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,添加到这个索引数据库中
C、当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引呈现给我们。所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果是相同的
D、和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息﹑分析信息和查询信息三部分,只不过分类目录的收集﹑分析信息两部分主要依靠人工完成
第10题
设计一个实际的组网方案并完成查阅相关资料的任务 第一部分: 【作业内容】假设医院某科室的一个办公室已经接入了一部中国电信的座机电话,现要把一个办公室改造成一个可供5名医生同时在互联网上查阅资料的电子资料室,提供智能终端Wi-Fi上网,并共用一台打印机(要求所有电脑对打印机的访问方式是相同的),接入互联网后不能影响电话的正常使用。请根据课程所学并查阅资料完成组网方案的设计。你的组网方案应该包含以下要点: 需要的硬件列表及数量(购置硬件清单中要注意陈述关键硬件参数) 需要的软件 局域网的采用组网方式和拓扑结构 互联网接入方式和步骤(接入方式,都要对哪些硬件进行设置) 画出的整体方案连接结构图 【格式要求】请把你的组网方案在Word中用文字、表格和图表等你认为合适的方式表达出来,要求结构清晰,内容表述齐全准确。 第二部分: 【作业内容】利用Internet搜索引擎,检索一周内,以“糖尿病”为关键词,但不包括“高血压”关键词的网页,列出“简体中文”和“英文”网页各前5条(截屏) 【格式要求】请打开“第一部分”创建的Word文档,继续通过文字和截图,把你的搜索关键字设置和搜索结果通过截图的方式在Word中展示出来。 完成第一部分和第二部分后所有的要求并检查无误后,将Word文档转成PDF格式上交。
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!