首页 > 建筑工程类考试> 暖通工程师
题目内容 (请给出正确答案)
[单选题]

网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。

A.robot.txt

B.robot.html

C.robots.txt

D.robots.html

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的…”相关的问题
第1题
Robots优化一般是编写Robots.txt文件,然后把文件放在网站根目录。()
点击查看答案
第2题
李民想到“巴黎”旅游,他在网吧访问了一个介绍巴黎的网站,里面有非常多的图片和文字信息,但是一时看不完而且家里没有网络,他想把内容保存到U盘上慢慢看,最合适的做法是()

A.使用IE浏览器的“收藏夹”功能

B.使用IE浏览器中“文件”→“另存为”→“网页,全部”

C.将所有文字粘贴到记事本,将每张图片另存为文件,最后放到同一个文件夹内

D.使用截屏键将屏幕内容粘贴到“画图”软件中

点击查看答案
第3题
关于文件上传漏洞,以下哪一项描述是错误的?()

A.由于对上传文件的类型、内容没有进行严格的过滤、检查,使得攻击者可以通过上传木马获取服务器的webshell权限

B.用户直接或者通过各种绕过方式将webshell上传到服务器中进而执行利用

C.会导致网站被控制,增删改查文件,链接数据库

D.上传漏洞与SQL注入或XSS相比,其风险更小

点击查看答案
第4题
以下哪个说法是错误的()

A.控制族图元显示性和详细程度的最常用的方法是族图元可见性设置。

B.对族文件管理时,一级根目录是按照族类型分类的。

C.族样板文件的扩展名为“.rfa”。

D.体量族属于系统族。

E.族编辑器中的大多数视图中,工作平面是自动设置的,执行某些绘图操作及在特殊视图中启用某些工具时必须使用工作平面。

点击查看答案
第5题
搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。()
点击查看答案
第6题
一个可行的自动更换代理的爬虫系统,应该下列哪些功能?()

A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中

B.在发现某个请求已经被设置过代理后,什么也不做,直接返回

C.在ProxyMiddlerware的process.request中,每次从数据库里面随机选择一条代理IP地址使用

D.周期性验证数据库中的无效代理,及时将其删除

点击查看答案
第7题
在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()?

A.深度优先

B.OPIC

C.广度优先

D.局部PageRank策略

点击查看答案
第8题
当运行爬虫代码后,出现"Forbiddenbyrobots.txt"提示后,说明当前时间段被爬取的网站无法访问。()
点击查看答案
第9题
网站中文章内容页面的标题就是()。

A.文中的核心关键词

B.内容文章的题目

C.内容文章的摘要

D.以“.html”为后缀的文件名

点击查看答案
第10题
网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息网络数据采集方法。()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改