u小马_微软原版 Win10/Win11 iso镜像下载

当前位置:首页 > 文章教程 > 软件教程

后羿采集器正确输入网址的方法

时间:2020-09-22 来源:u小马 访问:次

后羿采集器 V3.5.3正式版

后羿采集器 V3.5.3正式版

大小:45.44 MB类别:国产软件

更新:2020-09-22下载:4585

后羿采集器免费版是原Google技术团队倾力打造的一款网页数据采集软件,可视化点选,一键采集网页数据,全平台,Win/Mac/Linux都可用,采集和导出全免费,无限制放心用,后羿采集器免费版能后台运行,速度实时显示。那么今天小编要向大家简单的介绍一下后羿采集器正确输入网址的具体操作方法,希望大家会喜欢。

后羿采集器正确输入网址的方法:

1、在采集器的首页输入框中输入网址信息(智能输入一个网址),点击智能采集创建智能模式采集任务。

后羿采集器正确输入网址

2、新建智能模式采集任务,打开网址编辑窗口:

智能模式支持手动输入多个网址、从本地文件中导入网址(目前只支持TXT格式文件,其余文件格式正在开发中)及批量生成网址。

在该窗口中输入/导入网址时,请保证格式符合如下要求:

1.的网页属于同一个网站;

2.网址请用回车键分割,保证每一行只有一个网址;

3.的网页属于同一种类型,例如都是单页类型、列表类型或列表详情页类型。

注意:不同网站的网页或者同一网站的不同类型的网页请建立不同的任务。

后羿采集器正确输入网址

点击文件导入即可上传本地文件到软件中,选择完成后点击打开按钮即可。

后羿采集器正确输入网址

点击批量生成、在输入网址框中输入出变化参数之外的网址,然后点击添加参数。

后羿采集器正确输入网址

3、智能采集任务打开的界面中:

这里可以对网址进行编辑,超过200个请直接修改本地文件。

注意:如果是从本地文件中导入的网址,这里的修改不会影响本地文件。

点击如图所示位置修改网址信息

后羿采集器正确输入网址

编辑之后的网址格式请符合上述第2条中的要求

后羿采集器正确输入网址

输入网址的来源:

在智能模式下,后羿采集器可以进行自动翻页,所以输入的网址应该是已经完成了搜索操作,显示出最终需要被采集的内容的页面(或是多个需要被采集的连续页面中的第一个页面)。

例如:单网址采集,在爱奇艺中搜索“极限挑战”,打开对应的页面,复制网址粘贴到软件中即可。

后羿采集器正确输入网址

4、选择页面类型及设置分页

在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也有可能出现偏差,此时您可以先手动自动识别一下,如果手动自动识别还不起效果,您可以手动点选列表,从而辅助软件识别出正确的结果。

后羿采集器正确输入网址

5、预登录

在数据采集过程中,我们有时候会遇到需要登录才能查看内容的网页,这时我们需要用到预登录功能,登录成功之后就能进行正常的数据采集。

后羿采集器正确输入网址

6、切换浏览器模式

在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。

后羿采集器正确输入网址

7、设置提取字段

智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。单击鼠标右键即可。

后羿采集器正确输入网址

8、采集任务的设置

在启动采集任务之前,我们需要对采集任务进行设置,包括一些定时启动、防屏蔽、自动导出、和加速引擎等。

后羿采集器正确输入网址

9、防屏蔽

防屏蔽功能有较多的设置,用户可以通过多种方式来实现防屏蔽或者防反爬的目的。

后羿采集器正确输入网址

10、自动导出

自动导出功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。

后羿采集器正确输入网址

11、对上述操作完成后点击启动按钮或返回页面点击保存。

后羿采集器正确输入网址

以上介绍的内容就是关于后羿采集器正确输入网址的方法教程,不知道大家学会了没有,如果你也遇到了这样的问题的话可以按照小编的方法自己尝试一下,希望可以帮助大家解决问题,谢谢!!!想要了解更多的软件教程请关注Win10镜像官网~~~

热门Win镜像下载

本类热门教程