纯净系统
软件下载

批量图片识别 Umi-OCR v2.1.5 中文绿色版

介绍

Umi-OCR用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

软件截图

https://110.40.170.171/puresys/6494-1.png

https://110.40.170.171/puresys/6494-2.png

软件特点

忽略区域功能

忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下干净的台词文本。

“忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。

点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。

将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。

绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。

绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。

本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。

更新日志

v2.1.5 主要更新:

  • 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
  • 新增:大部分标签页能手动切换左右/上下双栏模式。
  • 新增:Esc键隐藏主窗口。
  • 新增:调整二维码生成相关参数后,自动刷新二维码生成。
  • 新增:命令行指令 --reload ,用于重新加载配置文件。 👉 文档
  • 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。
  • 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
  • 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
  • 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
  • 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
  • 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。
  • 修复:Linux版本截图后,主窗口的位置与操作前不一致。
  • 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。
  • Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
  • 新增UI语言:俄语 Português ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。

修复:Docker 部署 在部分旧统中报错 ‘code’: 803 的问题。(#621)

下载说明

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

下载地址

蓝奏云        飞机盘        123云盘

未经允许不得转载:Puresys纯净系统-软件下载 » 批量图片识别 Umi-OCR v2.1.5 中文绿色版

相关推荐

  • 暂无文章

评论 1

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #0

    蓝奏云 有密码啊

    wzzok3年前 (2022-07-23)回复

支付宝扫一扫打赏