下面为大家详细介绍根据关键词采集数据的方法(列表数据+搜索关键词+内容页)

采集网站:http://www.gxstzy.cn/index/tzxw/tzgg.htm

采集内容:列表页+搜索关键词+内容页

采集字段:关键词内容页

第一步:新建任务,进入主页,选择“新建任务”输入需要采集的网址。

第二步:抓取数据

采集器自动识别列表数据 自动识别分页(需要采集多页数据)

点击标题列/右键/高级过滤(可以根据需求自定义添加删除字段,修改名称等)

必须包含

输入关键词:教学仪器设备,添加确定即可

可以看到,不包含关键词的名称已删除,需要采集多页:自动识别分页

选中链接/深入此链接(需要采集关键词的内容页)

添加字段/点击选中全文

第三步:设置 根据需要,自定义设置,可以大大提高加载速度及工作效率。 第四步:加载数据 任务列表中:选中任务/点击开使 可以看到加载的进程 (点击数据也可以查看刚加载的数据) 第五步:查看保存数据 任务列表中:选中任务/点击查看 可以预览刚加载的数据,并导出数据 特殊情况 :编辑内容,可以预览全部数据(修改后统一下载 )