更新历史

3.0.3.2

2021/09/13

  • 新增数据查看- 预览、编辑完整数据
  • 新增数据查看- 执行 sql 功能
  • 数据处理,新增 自动补全相对URL功能
  • 对单个脚本命令 可设置所有分页执行(右击命令行
  • 修改文本框高亮
  • 修复innerText包含style、script问题
  • 修复其他等问题

3.0.3.1

2021/08/07

  • 添加任务右击菜单图标
  • 修复列表识别问题
  • 优化瀑布流滚动
  • 优化点击深入功能
  • 修复导出配置重命名问题
  • 修复分组计划任务包含全部子分组任务
  • 优化查看数据窗口的分页控件
  • 其他细节修改

3.0.3.0

2021/07/23

  • 新增任务列表拖动操作、多选、批量操作
  • 新增分组的计划任务
  • 新增请求截取功能
  • 新增通过点击深入采集功能(字段菜单下
  • 简易采集任务的参数,新增多行模式和从文件导入功能
  • 新增 任务编辑器的浏览器tab页图标
  • 新增开机自启动软件功能
  • 适配高分辨屏幕(高DPI
  • 移动 分页执行脚本命令选项 至脚本编辑界面
  • 优化滚动命令
  • 移除禁用flash、弹窗 选项
  • 优化计划任务的设置

3.0.2.8

2021/6/24

  • 修复部分系统下任务结束时异常退出问题
  • 修复编辑器中脚本命令一直等待问题
  • 优化默认导出路径,记录上次保存目录
  • 修复数据处理-文本替换不能保存换行问题

3.0.2.7

2021/4/6

  • 修复编辑器中ua不生效问题
  • 修复自定义时间为24小时制
  • 修复任务结束后,无法访问已释放对象的问题
  • 完善发布到qq邮箱问题检测
  • 修复运行时设置cookie不生效问题
  • 优化已经过滤的url不深入

3.0.2.6

2021/1/23

  • 修复瀑布流分页的兼容问题
  • 添加web发布测试
  • 修复探测文件下载名的编码问题
  • 批量日期生成的一个bug
  • 修复非独立进程任务运行时代理的问题
  • 支持post请求,url可以批量生成
  • 修复导出access问题

3.0.2.5

2020/12/29

  • 修复某些网址中#数据不加载问题
  • 优化XPath生成
  • 优化输入命令

3.0.2.4

2020/12/22

  • 修复文件下载可能会导致部分文件不完整
  • 修复批量参数,部分网址跳转后丢失问题
  • 优化脚步命令输入
  • 优化识别列表
  • 修复编辑器的json测试问题

3.0.2.3

2020/12/3

  • 修复脚步命令生成的bug

3.0.2.2

2020/12/1

  • 优化点击命令的XPath生成
  • 修复规则编辑时出现的问题
  • 修复其他bug

3.0.2.0

2020/11/13

  • 修复脚本命令单步测试错误

3.0.1.9

2020/11/13

  • 新增进程内运行任务,以解决部分网站不能登陆问题
  • 修改对系统设置缩放的兼容
  • 优化任务搜索
  • 修复网址生成的一个bug
  • 修复数据预览的问题
  • 优化列表识别和分页识别
  • 修复网站加载慢导致无法采集数据问题

3.0.1.8

2020/10/10

  • 增加起始网址的最大数量
  • 优化编辑器点击字段列头卡的问题
  • 增加预览网址
  • 增加记住窗口大小设置
  • 增加网址生成时间格式
  • 解决网址生成[嵌套的问题
  • 补全图片地址 增加补全a链接
  • 修复其他问题

3.0.1.7

2020/9/7

  • 修复一个下载文件名检测
  • 识别列表时不过滤表格列
  • 优化数据处理 http post
  • 修复一些网站卡死、打不开问题
  • 修复其他问题

3.0.1.6

2020/8/3

  • 升级 Chrome 内核
  • 程序支持64位,可用内存更大
  • 增加任务查找功能
  • 导出excel、csv时支持追加模式
  • 增加运行历史记录功能
  • 优化列表识别、分页识别算法
  • 丰富采集日志信息
  • 增加备份全部任务、导入备份功能,方便迁移
  • 提升采集速度,修复其他问题

2.5.0.0

2020/4/18

  • 优化测试网址的逻辑
  • 完善csv的写入转义
  • 增加补全图片相对地址功能
  • 修复cookie value逗号问题
  • 修复http请求br编码问题
  • 增加ctrl+拖动 复制字段功能
  • 修复探测文件名时的问题
  • 修复文件名超长问题

2.4.9.0

2019/11/22

  • 优化网页表格数据的识别,可按照表格列名自动命名字段
  • 优化时间提取
  • 修复当有自定义字段,没有匹配到不保存数据的问题
  • 添加时间戳变量
  • 计划任务,每间隔分钟增加开始秒

2.4.8.0

2019/10/23

  • 修复运行状态不显示采集数量问题
  • 修复程序不正常退出问题
  • 修复导入任务,界面卡死问题
  • 修复一个下载文件名问题

2.4.7.0

2019/10/13

  • 增加任务超时设置,超时任务强制结束
  • 增加程序启动进度
  • 修改清除HTML标签功能,添加保留模式
  • 修复计划任务一个bug
  • 修复浏览器模式下的请求重试bug
  • 修复计划任务分组重名导致添加失败问题
  • 去除打码平台
  • 优化http编码检测
  • 优化采集效率

2.4.6.0

2019/9/4

  • 增加删除全部测试地址菜单
  • 新增数据处理,设置默认值
  • 增加暂停任务时,可修改部分设置功能
  • 增加批量生成网址补零的选项
  • 请求重试中增加暂停任务的选项
  • 对jsonpath增加向上操作符($$.x,类似于XPath的../
  • 修改导出数据窗口的显示方式,可以同时导出多个任务数据
  • 优化软件性能,修改其他小问题

2.4.5.0

2019/7/16

  • 主界面增加账号到期时间
  • 对 [数据处理] -[添加前后缀] 增加变量按钮
  • 优化图片识别功能
  • 脚本命令支持批量参数,从网址参数 a=b 中提取
  • 字段jsonpath支持多值
  • 增加代理的用户名和密码功能

2.4.4.0

2019/4/25

  • 该版本需要通过下载安装包安装,不能从程序内更新
  • 修改导出规则为.pshx后缀格式,并且添加文件关联
  • 对下载文件重名的自增方式修改
  • 增加FormattedText属性,可以获取格式化的文本内容,而非InnerText的混乱文本
  • 修复运行时间长后,磁盘占用太大问题
  • 优化xpath相关

2.4.3.0

2019/3/6

  • 修复iframe问题
  • 优化文件下载功能
  • 完善界面提示
  • 优化偶尔启动任务时报错问题
  • 优化正文提取功能

2.4.2.0

2019/1/16

  • 新增数据处理,日期提取功能
  • 修改对任务字段增删改操作时,不删除已采集数据
  • 优化列表算法
  • 优化界面操作提示
  • 修改一个下载名自动探测问题
  • 增加下载器线程设置(选项-高级)
  • 在生成xpath窗口,添加设置到字段按钮
  • 优化计划任务cron部分,增加提示和测试

2.4.1.0

2018/12/17

  • 增加对onclick链接的识别及自动转换
  • 浏览器工具栏按钮,增加脚本命令、模式切换按钮
  • json引擎下,添加字段时自动重命名
  • 优化批量生成网址,修复海量网址导致内存溢出
  • 修复无法清空缓存问题
  • 修复自动分页的一个bug

2.4.0.0

2018/11/5

  • 对浏览器内核进行升级(Firefox 52)
  • 修复部分网站的兼容问题
  • 注意:如果之前有安装过,请先卸载老版本
  • 注意:卸载后不要删除程序目录,里面包含规则文件

2.3.0.1

2018/10/24

  • 新增请求重试
  • 新增设置任务运行窗口最大化
  • 增加导出到邮箱
  • 增加https tls1.2选项
  • 优化数据导出界面
  • 修复浏览器语言问题,可以在自定义Header中设置
  • 修改规则的发布配置,只保存配置名称
  • 完善浏览器模式的POST
  • 输入脚本命令支持select option 按照%1索引方式来选择
  • 修复一个特殊分页问题
  • 移除路由和adsl拨号功能

2.3.0.0

2018/9/26

  • 在任务运行窗口,新增导出按钮
  • 新增浏览器右击菜单 XPath生成,生成图片列表XPath
  • 数据查看器,新增按照导出状态显示数据
  • 优化XPath生成算法
  • 优化分页识别算法
  • 优化选择列表功能,只需要点击一次即可识别列表
  • 修改正则匹配忽略大小写
  • 修复一些插件问题
  • 修复字段拖动切换顺序导致无法拖大小
  • json分页支持组合形式,比如 设置分页的JSONPath为http://xxx.com/?{$.next}

2.2.0.0

2018/8/30

  • 新增简易采集,内置主流网址的采集模板
  • 增加打开任务分组文件夹菜单
  • 新增浏览器右击菜单 XPath生成,可按照文本和前缀生成XPath
  • 新增通过拖动字段来调整字段顺序
  • 完善图片下载功能
  • 修复发布的一些问题
  • 定时清空任务运行日志
  • 任务运行日志自动保存到文件
  • 数据处理-字符转码-转换HTML到文本
  • 修改导出数据的选择字段移到文件类型中
  • 优化浏览器引擎下的超时问题
  • 修复部分页面瀑布流无效问题
  • 优化滚动的脚本命令,可设置滚动页数(之前是滚动到底部

2.1.8.0

2018/7/21

  • 增加插件功能
  • 增加导出 txt (一条保存为一个文件)
  • 多值连接符支持换行符
  • 修改数据处理的文本映射(支持查找替换)
  • 修复登陆时的DNS问题
  • 修复图片下载问题
  • 修复 json 一些问题