下面为大家详细介绍赶集网批量生成网址的采集方法(生成网址参数+列表数据)
采集网站:http://sh.ganji.com/fang5
采集内容:赶集网批量生成网址后,二手房列表数据的采集
采集字段:楼盘名称、楼层、户型、面积、朝向,价格、是否装修等
第一步:新建任务
进入主页,选择“新建任务”输入需要采集的网址。 选中网址关键词“sh”,这时会弹出生成网址参数窗口, 选中“列表”,输入多个关键词以英文逗号,分割即可生成批量网址
第二步:抓取数据
采集器自动识别批量生成网址列表数据
可以根据需求自定义添加删除字段,分页设置/自动识别分页
第三步:设置
根据需要,自定义设置,可以大大提高加载速度及工作效率。
第四步:加载数据
任务列表中:选中任务/点击开使
可以看到加载的进程,速度是非常快的
第五步:查看保存数据
任务列表中:选中任务/点击查看
可以预览刚加载的数据,并导出数据
选择合适的保存格式
下面是我们刚保存的Excel表格