经过前几课的学习,我们已经掌握了单条数据、列表数据、表格数据、能过列表页链接进入详情页数据、实现不同类型的分页等,完全可以成功的配置一个完整的采集规则了。
如何启动采集并导出数据?
任务配置完成后,直接懒人式点击下一步
即可启动采集任务,爬山虎全自动的采集数据,选择需要的格式导出或都上传。
1.查看并预览数据:
启动本地采集,通过运行日志
可以查看采集进程,运行到哪一步,具体采集到哪一页数据。
点击数据
可以预览已采集的数据
2、优化加速采集:
爬山虎第三步设置基本设置
中,针对网站情况,可以禁用弹窗``拦截广告``禁用flash
等设置,优化并提高采集速度。
3、导出:
爬山虎采集器支持多个格式的数据导出(发布),包括TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及发布到网站接口(Api)等。
完整的采集流程如下:
通过以上几节课学习,我们完全可以熟练的使用爬山虎来采集数据,并配置一条完整的采集规则,规则配置完成后,启动采集并到导出所需的数据。