更新历史

2.4.2.0

2019/1/16

  • 新增数据处理,日期提取功能
  • 修改对任务字段增删改操作时,不删除已采集数据
  • 优化列表算法
  • 优化界面操作提示
  • 修改一个下载名自动探测问题
  • 增加下载器线程设置(选项-高级)
  • 在生成xpath窗口,添加设置到字段按钮
  • 优化计划任务cron部分,增加提示和测试

2.4.1.0

2018/12/17

  • 增加对onclick链接的识别及自动转换
  • 浏览器工具栏按钮,增加脚本命令、模式切换按钮
  • json引擎下,添加字段时自动重命名
  • 优化批量生成网址,修复海量网址导致内存溢出
  • 修复无法清空缓存问题
  • 修复自动分页的一个bug

2.4.0.0

2018/11/5

  • 对浏览器内核进行升级(Firefox 52)
  • 修复部分网站的兼容问题
  • 注意:如果之前有安装过,请先卸载老版本
  • 注意:卸载后不要删除程序目录,里面包含规则文件

2.3.0.1

2018/10/24

  • 新增请求重试
  • 新增设置任务运行窗口最大化
  • 增加导出到邮箱
  • 增加https tls1.2选项
  • 优化数据导出界面
  • 修复浏览器语言问题,可以在自定义Header中设置
  • 修改规则的发布配置,只保存配置名称
  • 完善浏览器模式的POST
  • 输入脚本命令支持select option 按照%1索引方式来选择
  • 修复一个特殊分页问题
  • 移除路由和adsl拨号功能

2.3.0.0

2018/9/26

  • 在任务运行窗口,新增导出按钮
  • 新增浏览器右击菜单 XPath生成,生成图片列表XPath
  • 数据查看器,新增按照导出状态显示数据
  • 优化XPath生成算法
  • 优化分页识别算法
  • 优化选择列表功能,只需要点击一次即可识别列表
  • 修改正则匹配忽略大小写
  • 修复一些插件问题
  • 修复字段拖动切换顺序导致无法拖大小
  • json分页支持组合形式,比如 设置分页的JSONPath为http://xxx.com/?{$.next}

2.2.0.0

2018/8/30

  • 新增简易采集,内置主流网址的采集模板
  • 增加打开任务分组文件夹菜单
  • 新增浏览器右击菜单 XPath生成,可按照文本和前缀生成XPath
  • 新增通过拖动字段来调整字段顺序
  • 完善图片下载功能
  • 修复发布的一些问题
  • 定时清空任务运行日志
  • 任务运行日志自动保存到文件
  • 数据处理-字符转码-转换HTML到文本
  • 修改导出数据的选择字段移到文件类型中
  • 优化浏览器引擎下的超时问题
  • 修复部分页面瀑布流无效问题
  • 优化滚动的脚本命令,可设置滚动页数(之前是滚动到底部

2.1.8.0

2018/7/21

  • 增加插件功能
  • 增加导出 txt (一条保存为一个文件)
  • 多值连接符支持换行符
  • 修改数据处理的文本映射(支持查找替换)
  • 修复登陆时的DNS问题
  • 修复图片下载问题
  • 修复 json 一些问题

2.1.7.0

2018/6/25

  • 修复若干 BUG
  • 登陆窗口添加清空 cookie 功能
  • 优化数据导出功能
  • 增加 post 数据粘贴(multipart/form-data
  • 修复 http 引擎下的UA没生效
  • 修复文件下载问题
  • 修复 http 请求不能指定编码问题
  • 新增更新模式(二次采集时,如果某唯一字段重复,则其他字段数据 update 到数据库
  • 新增不检查分页地址重复功能
  • 修复滚动命令参数显示问题
  • 修复计划任务相关问题
  • 优化 json 提取