经过一段时间的开发,爬山虎采集器V3 (Chromium内核)终于发布测试版本。新版本相比之前版本更加稳定、快速,主要功能改动如下:
- 浏览器更换为Chromium内核
- 增加任务查找功能
- 增加备份全部任务、导入备份功能,方便迁移
- 完全兼容之前版本的规则
软件下载:V3下载地址
2020/7/30 更新
- 修改为AnyCpu模式 ,支持64位
- 优化列表识别
- 修复部分bug
2020/6/10 更新
- 优化脚本录制
- 脚本命令的重试
- 点击命令加入模拟
- 输入命令增加回车选项
- 深入采集时加入refer参数
- 修复部分bug
2020/5/29 更新
- 优化列表识别
- 优化脚本命令
- 输入命令支持输入回车
- 修复部分bug
2020/4/2 更新
- 修复长时间采集内存溢出问题
- 采集详情页面的速度提高一倍
2020/4/9 更新
- 修复安装时的一些问题
- 修复运行任务时的焦点丢失问题
- 修复一些其他小问题
2020/4/24 更新
- 增加运行历史记录
- 优化分页识别算法
- 当导出txt、csv时已经存在文件,则追加内容
- 丰富采集日志(增加采集数量)
- 优化日志刷新
- 自定义数据 当前网址支持post数据
2020/5/1 更新
- 解决部分网站长时间采集异常退出问题
- 优化分页识别算法
- 修复部分网站cookie无效问题
- 修复部分系统sqlite无法使用问题
2020/5/8 更新
- 修复验证码检测bug
- 修复iframe的相关问题
2020/5/18 更新
- 修复异常退出问题
- 在导出文件界面加入"追加模式" 选项,支持excel
2020/5/23 更新
- 优化列表识别
- 支持mysql8.0默认验证算法
使用Chromium内核的优势:
- 采集速度更快
- 可以解决之前一些网站长时间采集卡死问题
- 解决部分网站的反爬虫技术(携程、美团点评等网站)
老版本升级注意:
- 可直接把原来版本的任务复制到新版本目录,V2的任务目录
D:\Program Files (x86)\PashanhuV3\tasks
,V3目录D:\Program Files (x86)\PashanhuV3\tasks
- 配置文件
Settings.xml
和ExportSettings.xml
也可以直接复制过去