网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
5、下面关于网络爬虫的描述错误的是:
A.网络爬虫由控制节点、爬虫节点和资源库构成
B.网络爬虫中可以有多个控制节点,每个控制节点下可以有多个爬虫节点
C.控制节点之间可以互相通信,控制节点和其下的各爬虫节点之间也可以进行互相通信
D.属于同一个控制节点下的各爬虫节点间不可以互相通信
参考答案和解析
网络爬虫的行为和人们访问网站的行为是完全不同的
更多 “5、下面关于网络爬虫的描述错误的是:A.网络爬虫由控制节点、爬虫节点和资源库构成B.网络爬虫中可以有多个控制节点,每个控制节点下可以有多个爬虫节点C.控制节点之间可以互相通信,控制节点和其下的各爬虫节点之间也可以进行互相通信D.属于同一个控制节点下的各爬虫节点间不可以互相通信” 相关考题
考题
()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。
A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫
考题
以下关于网络爬虫的说法,不正确的是()。
A、网络爬虫还可以对网页建立索引B、有些网络爬虫能够从网站抓取内容聚合起来C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等D、隐藏在表单后的信息无法被网络爬虫发现
考题
如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。
A、增量式网络爬虫B、聚焦网络爬虫C、DeepWeb爬虫D、全网爬虫
考题
关于各种网络爬虫,以下说法不正确的是()。
A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
考题
()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。
A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫
考题
()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。
A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫
考题
如果要采集指定的数据,则需要使用到(),因为它只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快。
A、聚焦网络爬虫B、聚焦网络爬虫C、通用网络爬虫D、深层网络爬虫
考题
下面关于带宽的描述哪个是正确的?()A、速度带宽是描述网络的最低传输速度B、速度带宽用来描述网络传输信号的延迟大小C、频率带宽是描述网络的频率响应能力的D、频率带宽是描述网络禁止的频率的
考题
关于网络爬虫协议文件robots.txt,说法错误的是()A、一个网站可以放多个不同robots文件B、robots文件不可以用xml格式命名C、disallow用来描述不希望被访问到的一个URLD、robots文件可以放在任何位置
考题
单选题下面关于带宽的描述哪个是正确的?()A
速度带宽是描述网络的最低传输速度B
速度带宽用来描述网络传输信号的延迟大小C
频率带宽是描述网络的频率响应能力的D
频率带宽是描述网络禁止的频率的
考题
单选题爬行对象从一些种子URL扩充到整个网络,主要为了门户站点搜索引擎和大型网络服务提供商采集数据()。A
通用网络爬虫B
聚焦网络爬虫C
增量式网络爬虫D
反向网络爬虫
热门标签
最新试卷