本文介绍使用爬山虎采集器,批量采集豆瓣电影短评数据,根据模板提示,输入搜索(电影)后网址,一键即可采集。
采集网站:https://movie.douban.com/subject/1291543/comments?status=P
第一步:下载爬山虎采集器,安装完成之后打开软件
简易采集/找到对应的模板,也跟根据关键搜索查找。
第二步:预览模板的采集字段和示例数据,立即使用
进入规则后,根据提示,输入搜索(电影)后的网址,开使采集
通过日志可以看出加载的进程,可见,爬山虎采集器速度是非常的快
点击数据,可以预览正在加载的内容
第三步:查看保存数据
任务列表中:选中任务/点击查看 ,导出数据