本文介绍如何使用爬山虎采集器,采集淘票票网站影院列表信息,操作流程如下:

第一步:下载爬山虎采集器,安装完成之后打开软件

在软件起始页的“自定义采集”或者直接“新建”,输入网址;

第二步:抓取数据

采集器自动识别列表,(可能过添加字段,自定义增添列)

分页设置:手动识别分页(部分网站自动识别不了,需要手动识别分页)下一步,直至完成。

第三步:加载数据

任务列表中:选中任务/右键/开始采集

通过日志,可以看到加载的进程

点击数据按钮,直接预览正在加载的数据

第四步:查看保存数据

任务列表中:选中任务/点击查看 ,导出数据