下面为大家详细介绍根据关键词采集数据的方法(列表数据+搜索关键词+内容页)
采集网站:http://www.gxstzy.cn/index/tzxw/tzgg.htm
采集内容:列表页+搜索关键词+内容页
采集字段:关键词内容页
第一步:新建任务,进入主页,选择“新建任务”输入需要采集的网址。
第二步:抓取数据
采集器自动识别列表数据 自动识别分页(需要采集多页数据)
点击标题列/右键/高级过滤(可以根据需求自定义添加删除字段,修改名称等)
必须包含
输入关键词:教学仪器设备,添加确定即可
可以看到,不包含关键词的名称已删除,需要采集多页:自动识别分页
选中链接/深入此链接(需要采集关键词的内容页)
添加字段/点击选中全文
第三步:设置
根据需要,自定义设置,可以大大提高加载速度及工作效率。
第四步:加载数据
任务列表中:选中任务/点击开使
可以看到加载的进程 (点击数据也可以查看刚加载的数据)
第五步:查看保存数据
任务列表中:选中任务/点击查看
可以预览刚加载的数据,并导出数据
特殊情况 :编辑内容,可以预览全部数据(修改后统一下载 )