本文介绍爬山虎采集器,按关键搜索,批量采集天涯论坛发帖信息。本案例采集关键词“文学”。 第一步:下载爬山虎采集器,安装完成之后打开软件。 在软件起始页的简易采集,点击开始使用 然后点击分类“其它”,找到对应的模板,也可以根据关键词搜索,点击进入 第二步:预览模板的采集字段和示例数据,立即使用。 如需编辑模板,点击此处详见此文: 进入规则后,根据提示,输入需要采集的关键词,本案例关键词:“文学” 开始采集后,通过日志,可以看到加载的进程,爬山虎爬取速度是非常快的 第三步:查看保存数据 任务列表中:选中任务/查看数据 导出数据,选择合适的格式导出数据