爬山虎有二种数据采集模式自定义采集
和简易采集
。下面简单介绍下什么情况下选择不同的采集模式。
-
如果
简易采集
中有合适的模板,即可直接选用模板,或者保存规则修改参数,确定后即可一键采集。 -
如果
简易采集
中没找到合适的模板,即可选择自定义采集模式
。
1、如何查找采集模板?
① 起始页搜索框
在客户端起始页搜索框
中,输入目标网站名称,爬山虎会自动匹配相关的采集模板。将鼠标移到需要的模板上并单击,进入模板详情页面。
(注意,请确保输入的网站名称正确,否则可能无法查找到相关模板)
现在,我们已经学会【使用模板采集数据】,赶紧尝试下使用模板采集数据吧。
②起始页采集模板类型
点击类别导航,方可切换到不同类型的模板,进入采集模板展示页面,寻找到目标模板。
2、如何自定义编辑采集模板?
简易采集的模板并不适用所有用户,有时我们需要对其参数进行一些修改,比如对字段进行删除、添加,对采集数据进行进一步的处理等。
下面我们如何学习编辑采集模板,根据自己需求来设置模板规则。
Step1:保存采集模板
找到需要的简易采集模板
-立即使用
,用二种类型,根据个人习惯自行选择。
仅保存任务
和进入高级模式
-
仅保存任务
:是把当前采集模板保存在爬山虎左边任务列表栏。 -
进入高级模式
:直接可编辑,进入自定义模式,编辑后自动保存在左边任务列表栏。
Step2:编辑采集保存的模板
选中采集模板右击高级模式,修改关键词“行政”,采集器自动匹配行政列表,
第二步也可以添删、修改字段等一系列自定义操作。
完整的操作流程如下:
从上可以看见,把简易采集的模板保存下来并修改,以达到自己的采集需求。