网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立()文件,其他还包括去除重复网页、分析超链接,计算网页的重要度。
A.系统
B.动态
C.索引
D.下载
参考答案
更多 “ 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立()文件,其他还包括去除重复网页、分析超链接,计算网页的重要度。 A.系统B.动态C.索引D.下载 ” 相关考题
考题
关于表层网页及深层网页,以下说法不正确的是()。
A、表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主构成的Web页面。B、深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。C、深层网页中包含的信息远远少于表层网页。D、深层网页爬虫主要用于爬去因此在搜索表单后的深层网页。
考题
关于网页快照的说法不正确的是____。A.“网页快照”是搜索引擎在收录网页时,备份保存在搜索引擎的服务器缓存里的内容B.当检索到的网页被删除或链接失效时,即使使用网页快照也不能打开链接C.网页快照中,关键字会用其他颜色显示(如红色或者黄色),因此通过网页快照可以快速定位关键词D.由于网页快照以文本内容为主,因此网页快照的访问速度比一般的网页快
考题
高中信息技术《网海寻珠-搜索引擎的工作原理》
一、考题回顾
题目来源:2019年5月19日北京市面试考题
试讲题目
1.题目:搜索引擎的工作原理
2.内容:
搜索引擎的工作原理
搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它不能真正理解网页上的内容, 只能机械的匹配网页上的文字。
真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有页面内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。
搜索引擎的整个工作过程可以简单的理解为三步:一是从互联网上抓取网页,二是建立索引数据库,三是在索引数据库中对搜索结果进行排序,如图3-2-4所示。
1.从因特网上抓取网页
搜索引擎利用能够从因特网上自动收集网页的“蜘蛛”(Spider)系统程序,自动访问因特网,沿着网页中的所有链接“爬”到其他网页,重复这一过程,并把所有“爬”过的网页收集过来。
2.建立索引数据库
分析索引程序对收集回来的网页进行分析,提取相关网页信息,包括网页的URL,编码类型,页面内容包含的所有关键词,关键词的位置、生成时间、大小、与其他网页的链接关系等,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字及链接中每一个关键词的相关程度(或重要性),然后用这些相关信息建立网页索引数据库。
3.在索引数据库中对搜索结果进行排序
当用户输人关键词搜索后,搜索系统程序就从网页索引数据库中查找与该关键词相匹配的所有网页。然后根据这些网页与关键词的相关程度,对搜索到的数值进行排序。一般来讲,相关程度越高,排的次序越靠前。
3.基本要求:
(1)请在10分钟内完成试讲。
(2)配合讲解过程中要有学生参与。
(3)试讲过程中涉及操作,进行演示即可。
答辩题目1.本节课你是通过什么方式进行小结?
2.请你说出搜索引擎的工作过程?
考题
在国外搜索引擎界曾经有这样一句话:“如果你的网页不能被Google检索到,那么你的网页等于不存在;如果你的网页不能被Google检索排在检索结果第一页中,那么你的网页也等于不存在”。 这句话有很多理解,其中哪些项理解正确?A.Google搜索引擎很重要B.搜索引擎排名很重要C.关键词匹配很重要D.被搜索引擎能检索到很重要
考题
97、关于网页快照的说法不正确的是 。A.“网页快照”是搜索引擎在收录网页时,备份保存在搜索引擎的服务器缓存里的内容B.当检索到的网页被删除或链接失效时,即使使用网页快照也不能打开链接C.网页快照中,关键字会用其他颜色显示(如红色或者黄色),因此通过网页快照可以快速定位关键词D.由于网页快照以文本内容为主,因此网页快照的访问速度比一般的网页快
热门标签
最新试卷