更新历史

3.0.2.7

2021/4/6

  • 修复编辑器中ua不生效问题
  • 修复自定义时间为24小时制
  • 修复任务结束后,无法访问已释放对象的问题
  • 完善发布到qq的问题检测
  • 修复运行时设置cookie不生效问题
  • 优化已经过滤的url不深入

3.0.2.6

2021/1/23

  • 修复瀑布流分页的兼容问题
  • 添加web发布测试
  • 修复探测文件下载名的编码问题
  • 批量日期生成的一个bug
  • 修复非独立进程任务运行时代理的问题
  • 支持post请求,url可以批量生成
  • 修复导出access问题

3.0.2.5

2020/12/29

  • 修复某些网址中#数据不加载问题
  • 优化XPath生成
  • 优化输入命令

3.0.2.4

2020/12/22

  • 修复文件下载可能会导致部分文件不完整
  • 修复批量参数,部分网址跳转后丢失问题
  • 优化脚步命令输入
  • 优化识别列表
  • 修复编辑器的json测试问题

3.0.2.3

2020/12/3

  • 修复脚步命令生成的bug

3.0.2.2

2020/12/1

  • 优化点击命令的XPath生成
  • 修复规则编辑时出现的问题
  • 修复其他bug

3.0.2.0

2020/11/13

  • 修复脚本命令单步测试错误

3.0.1.9

2020/11/13

  • 新增进程内运行任务,以解决部分网站不能登陆问题
  • 修改对系统设置缩放的兼容
  • 优化任务搜索
  • 修复网址生成的一个bug
  • 修复数据预览的问题
  • 优化列表识别和分页识别
  • 修复网站加载慢导致无法采集数据问题

3.0.1.8

2020/10/10

  • 增加起始网址的最大数量
  • 优化编辑器点击字段列头卡的问题
  • 增加预览网址
  • 增加记住窗口大小设置
  • 增加网址生成时间格式
  • 解决网址生成[嵌套的问题
  • 补全图片地址 增加补全a链接
  • 修复其他问题

3.0.1.7

2020/9/7

  • 修复一个下载文件名检测
  • 识别列表时不过滤表格列
  • 优化数据处理 http post
  • 修复一些网站卡死、打不开问题
  • 修复其他问题

3.0.1.6

2020/8/3

  • 升级 Chrome 内核
  • 程序支持64位,可用内存更大
  • 增加任务查找功能
  • 导出excel、csv时支持追加模式
  • 增加运行历史记录功能
  • 优化列表识别、分页识别算法
  • 丰富采集日志信息
  • 增加备份全部任务、导入备份功能,方便迁移
  • 提升采集速度,修复其他问题

2.5.0.0

2020/4/18

  • 优化测试网址的逻辑
  • 完善csv的写入转义
  • 增加补全图片相对地址功能
  • 修复cookie value逗号问题
  • 修复http请求br编码问题
  • 增加ctrl+拖动 复制字段功能
  • 修复探测文件名时的问题
  • 修复文件名超长问题

2.4.9.0

2019/11/22

  • 优化网页表格数据的识别,可按照表格列名自动命名字段
  • 优化时间提取
  • 修复当有自定义字段,没有匹配到不保存数据的问题
  • 添加时间戳变量
  • 计划任务,每间隔分钟增加开始秒

2.4.8.0

2019/10/23

  • 修复运行状态不显示采集数量问题
  • 修复程序不正常退出问题
  • 修复导入任务,界面卡死问题
  • 修复一个下载文件名问题

2.4.7.0

2019/10/13

  • 增加任务超时设置,超时任务强制结束
  • 增加程序启动进度
  • 修改清除HTML标签功能,添加保留模式
  • 修复计划任务一个bug
  • 修复浏览器模式下的请求重试bug
  • 修复计划任务分组重名导致添加失败问题
  • 去除打码平台
  • 优化http编码检测
  • 优化采集效率

2.4.6.0

2019/9/4

  • 增加删除全部测试地址菜单
  • 新增数据处理,设置默认值
  • 增加暂停任务时,可修改部分设置功能
  • 增加批量生成网址补零的选项
  • 请求重试中增加暂停任务的选项
  • 对jsonpath增加向上操作符($$.x,类似于XPath的../
  • 修改导出数据窗口的显示方式,可以同时导出多个任务数据
  • 优化软件性能,修改其他小问题

2.4.5.0

2019/7/16

  • 主界面增加账号到期时间
  • 对 [数据处理] -[添加前后缀] 增加变量按钮
  • 优化图片识别功能
  • 脚本命令支持批量参数,从网址参数 a=b 中提取
  • 字段jsonpath支持多值
  • 增加代理的用户名和密码功能

2.4.4.0

2019/4/25

  • 该版本需要通过下载安装包安装,不能从程序内更新
  • 修改导出规则为.pshx后缀格式,并且添加文件关联
  • 对下载文件重名的自增方式修改
  • 增加FormattedText属性,可以获取格式化的文本内容,而非InnerText的混乱文本
  • 修复运行时间长后,磁盘占用太大问题
  • 优化xpath相关

2.4.3.0

2019/3/6

  • 修复iframe问题
  • 优化文件下载功能
  • 完善界面提示
  • 优化偶尔启动任务时报错问题
  • 优化正文提取功能

2.4.2.0

2019/1/16

  • 新增数据处理,日期提取功能
  • 修改对任务字段增删改操作时,不删除已采集数据
  • 优化列表算法
  • 优化界面操作提示
  • 修改一个下载名自动探测问题
  • 增加下载器线程设置(选项-高级)
  • 在生成xpath窗口,添加设置到字段按钮
  • 优化计划任务cron部分,增加提示和测试

2.4.1.0

2018/12/17

  • 增加对onclick链接的识别及自动转换
  • 浏览器工具栏按钮,增加脚本命令、模式切换按钮
  • json引擎下,添加字段时自动重命名
  • 优化批量生成网址,修复海量网址导致内存溢出
  • 修复无法清空缓存问题
  • 修复自动分页的一个bug

2.4.0.0

2018/11/5

  • 对浏览器内核进行升级(Firefox 52)
  • 修复部分网站的兼容问题
  • 注意:如果之前有安装过,请先卸载老版本
  • 注意:卸载后不要删除程序目录,里面包含规则文件

2.3.0.1

2018/10/24

  • 新增请求重试
  • 新增设置任务运行窗口最大化
  • 增加导出到邮箱
  • 增加https tls1.2选项
  • 优化数据导出界面
  • 修复浏览器语言问题,可以在自定义Header中设置
  • 修改规则的发布配置,只保存配置名称
  • 完善浏览器模式的POST
  • 输入脚本命令支持select option 按照%1索引方式来选择
  • 修复一个特殊分页问题
  • 移除路由和adsl拨号功能

2.3.0.0

2018/9/26

  • 在任务运行窗口,新增导出按钮
  • 新增浏览器右击菜单 XPath生成,生成图片列表XPath
  • 数据查看器,新增按照导出状态显示数据
  • 优化XPath生成算法
  • 优化分页识别算法
  • 优化选择列表功能,只需要点击一次即可识别列表
  • 修改正则匹配忽略大小写
  • 修复一些插件问题
  • 修复字段拖动切换顺序导致无法拖大小
  • json分页支持组合形式,比如 设置分页的JSONPath为http://xxx.com/?{$.next}

2.2.0.0

2018/8/30

  • 新增简易采集,内置主流网址的采集模板
  • 增加打开任务分组文件夹菜单
  • 新增浏览器右击菜单 XPath生成,可按照文本和前缀生成XPath
  • 新增通过拖动字段来调整字段顺序
  • 完善图片下载功能
  • 修复发布的一些问题
  • 定时清空任务运行日志
  • 任务运行日志自动保存到文件
  • 数据处理-字符转码-转换HTML到文本
  • 修改导出数据的选择字段移到文件类型中
  • 优化浏览器引擎下的超时问题
  • 修复部分页面瀑布流无效问题
  • 优化滚动的脚本命令,可设置滚动页数(之前是滚动到底部

2.1.8.0

2018/7/21

  • 增加插件功能
  • 增加导出 txt (一条保存为一个文件)
  • 多值连接符支持换行符
  • 修改数据处理的文本映射(支持查找替换)
  • 修复登陆时的DNS问题
  • 修复图片下载问题
  • 修复 json 一些问题

2.1.7.0

2018/6/25

  • 修复若干 BUG
  • 登陆窗口添加清空 cookie 功能
  • 优化数据导出功能
  • 增加 post 数据粘贴(multipart/form-data
  • 修复 http 引擎下的UA没生效
  • 修复文件下载问题
  • 修复 http 请求不能指定编码问题
  • 新增更新模式(二次采集时,如果某唯一字段重复,则其他字段数据 update 到数据库
  • 新增不检查分页地址重复功能
  • 修复滚动命令参数显示问题
  • 修复计划任务相关问题
  • 优化 json 提取

2.1.6.0

2018/5/19

  • 优化列表识别算法
  • 修复浏览器引擎下设置 Referer 问题
  • 优化执行 C# 代码功能
  • 优化瀑布流分页
  • 优化 Excel 导出,大大减少内存消耗
  • 修复文件下载的一些问题
  • 兼容 Iframe 类型网页
  • 新增设置数据为已导出菜单
  • 修复分页无数据停止导致不能自动导出数据
  • 优化 Web 发布,增加 Header,自定义标识

2.1.5.0

2018/5/8

  • 新增 POST 方式采集(采集速度更快
  • 新增 数据处理-文本映射功能
  • 数据处理-字符转码-ToDate 增加时间戳转时间
  • 新增采集脚步在分页执行选项
  • 新增导出数据库字段映射
  • 新增导出倒序
  • 修复高级过滤的一些问题
  • 修改计划任务的模式(阻塞导致内存增长
  • 完善 JSON 引擎
  • 完善文件下载功能
  • 修复导出数据的一些问题
  • 优化数据查看查看的体验
  • 修复若干问题

2.1.4.0

2018/3/14

  • 新增数据处理 - 正文提取
  • 新增数据处理 - HTTP POST 请求
  • 数据数据处理 - 字符转码 - 提取时间格式
  • 新增高级过滤 - 按长度过滤
  • 新增数据处理 - 前后缀增加引用字段
  • 新增设置,分页重复N页停止采集
  • 新增导出配置管理窗口
  • 新增运行完关闭窗口选项
  • 新增数据查看-ID 倒序
  • 新增请求超时选项
  • 新增从剪切板复制 Http Header 功能
  • 修改正则提取时,直接从 Response 获取 Html
  • 对 Referer 中可能包含中文进行 UrlEncode
  • 修改导出 MySQL 测试连接可能失败问题
  • 修复补全网址时,没用 baseURL 问题
  • 优化清除 HMTL 标签功能
  • 对字段名称进行检查
  • 修改测试网址默认添加5条
  • 优化URL补全功能
  • 当然字段 XPath 为空时,使用RawHTML作为输入
  • 优化瀑布流分页的代码接口
  • 修复配置文件读取的问题