本文介绍爬山虎采集器采集【寻医问药】网,有问必答相关数据的采集,。 操作流程如下:
第一步:下载爬山虎采集器,安装完成之后打开软件
在软件起始页的“自定义采集”或者直接“新建”,输入网址
第二步:抓取数据
采集器自动识别列表,分页设置:自动识别分页(可能过添加字段,自定义增添列,修改表头名称)
选中链接列,深入链接(需要采集子页内容)
添加字段,根据提示,选取需要采集的内容,下一步直至完成
第三步:加载数据
任务列表中:选中任务/右键/开始采集
通过日志,可以看到加载的进程
点击数据按钮,直接预览正在加载的数据
第四步:查看保存数据
任务列表中:选中任务/点击查看 ,导出数据