下面为大家详细介绍百度地图数据的采集方法(编辑脚本+列表数据)
采集网站:http://map.baidu.com
采集内容:酒店数据列表
采集字段:名称、评分、级别、价格、地址等
第一步:新建任务
进入主页,选择“新建任务”输入需要采集的网址。
第二步:抓取数据
由于网页结构不同,采集器无法自动抓取数据,需手动编辑脚本 (简单的说,把我们日常搜索流程,用命令记录下来) 添加命令/点击(输入框,输入“酒店”) 添加命令/点击(搜索按钮) 命令已设置好,点击“运行”,返回数据列表 可以看到采集器已自动识别列表数据 浏览器引擎/json引擎,(网站中没有js动态,选json加载速度会更快) 分页设置/自动识别分页
第三步:设置
根据需要,自定义设置,可以大大提高加载速度及工作效率。
第四步:加载数据
任务列表中:选中任务/点击开使 可以看到加载的进程
第五步:查看保存数据
任务列表中:选中任务/点击查看 可以预览刚加载的数据,并导出数据 选择合适的保存格式 刚我们选择Excel,效果如下