智能分析可视化界面

一步采集

一款简单易用、功能强大的数据采集工具。无需学习编程,
点击式界面,自动生成采集脚本,可以采集互联网99%的
网站。
V2 免费下载 下载 .Net Framework 4.0 (48M 适用于Windows XP SP3, Windows 7)

更新历史

2.4.0.0

2018/11/5


  • 对浏览器内核进行升级(Firefox 52)
  • 修复部分网站的兼容问题
  • 注意:如果之前有安装过,请先卸载老版本
  • 注意:卸载后不要删除程序目录,里面包含规则文件

2.3.0.1

2018/10/24


  • 新增请求重试
  • 新增设置任务运行窗口最大化
  • 增加导出到邮箱
  • 增加https tls1.2选项
  • 优化数据导出界面
  • 修复浏览器语言问题,可以在自定义Header中设置
  • 修改规则的发布配置,只保存配置名称
  • 完善浏览器模式的POST
  • 输入脚本命令支持select option 按照%1索引方式来选择
  • 修复一个特殊分页问题
  • 移除路由和adsl拨号功能

2.3.0.0

2018/9/26


  • 在任务运行窗口,新增导出按钮
  • 新增浏览器右击菜单 XPath生成,生成图片列表XPath
  • 数据查看器,新增按照导出状态显示数据
  • 优化XPath生成算法
  • 优化分页识别算法
  • 优化选择列表功能,只需要点击一次即可识别列表
  • 修改正则匹配忽略大小写
  • 修复一些插件问题
  • 修复字段拖动切换顺序导致无法拖大小
  • json分页支持组合形式,比如 设置分页的JSONPath为http://xxx.com/?{$.next}

2.2.0.0

2018/8/30


  • 新增简易采集,内置主流网址的采集模板
  • 增加打开任务分组文件夹菜单
  • 新增浏览器右击菜单 XPath生成,可按照文本和前缀生成XPath
  • 新增通过拖动字段来调整字段顺序
  • 完善图片下载功能
  • 修复发布的一些问题
  • 定时清空任务运行日志
  • 任务运行日志自动保存到文件
  • 数据处理-字符转码-转换HTML到文本
  • 修改导出数据的选择字段移到文件类型中
  • 优化浏览器引擎下的超时问题
  • 修复部分页面瀑布流无效问题
  • 优化滚动的脚本命令,可设置滚动页数(之前是滚动到底部

2.1.8.0

2018/7/21


  • 增加插件功能
  • 增加导出 txt (一条保存为一个文件)
  • 多值连接符支持换行符
  • 修改数据处理的文本映射(支持查找替换)
  • 修复登陆时的DNS问题
  • 修复图片下载问题
  • 修复 json 一些问题

2.1.7.0

2018/6/25


  • 修复若干 BUG
  • 登陆窗口添加清空 cookie 功能
  • 优化数据导出功能
  • 增加 post 数据粘贴(multipart/form-data
  • 修复 http 引擎下的UA没生效
  • 修复文件下载问题
  • 修复 http 请求不能指定编码问题
  • 新增更新模式(二次采集时,如果某唯一字段重复,则其他字段数据 update 到数据库
  • 新增不检查分页地址重复功能
  • 修复滚动命令参数显示问题
  • 修复计划任务相关问题
  • 优化 json 提取

2.1.6.0

2018/5/19


  • 优化列表识别算法
  • 修复浏览器引擎下设置 Referer 问题
  • 优化执行 C# 代码功能
  • 优化瀑布流分页
  • 优化 Excel 导出,大大减少内存消耗
  • 修复文件下载的一些问题
  • 兼容 Iframe 类型网页
  • 新增设置数据为已导出菜单
  • 修复分页无数据停止导致不能自动导出数据
  • 优化 Web 发布,增加 Header,自定义标识

2.1.5.0

2018/5/8


  • 新增 POST 方式采集(采集速度更快
  • 新增 数据处理-文本映射功能
  • 数据处理-字符转码-ToDate 增加时间戳转时间
  • 新增采集脚步在分页执行选项
  • 新增导出数据库字段映射
  • 新增导出倒序
  • 修复高级过滤的一些问题
  • 修改计划任务的模式(阻塞导致内存增长
  • 完善 JSON 引擎
  • 完善文件下载功能
  • 修复导出数据的一些问题
  • 优化数据查看查看的体验
  • 修复若干问题