介绍

Umi-OCR用于批量导入本地图片，识别图片中的文本，输出到软件面板或本地txt文件。除了能批量识别普通图片，本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等，往往只需要提取字幕区域的文本，而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字，来实现这一目的。尤其是，特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档，或者想翻找包含某一段台词/字幕的截图；将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

软件截图

软件特点

忽略区域功能

忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰，批量识别游戏截图时排除UI与按钮的干扰，让识别结果只留下干净的台词文本。

“忽略区域”是指图片上指定位置与大小的矩形区域，完全处于这些区域内的文字块，将被排除。

点击设置选项卡中的添加忽略区域，进入忽略区域选择窗口。

将任意图片拖入该窗口，可预览该图片。将新图片拖入窗口可切换预览，但已绘制的忽略区域不会消失；可切换不同图片来仔细调整忽略区域。

绘制忽略区域：拖入图片后，点击选中左起第一按钮 +忽略区域 1 ，然后在图片上按住左键拖拽，绘制矩形区域。可撤销步骤。

绘制完后，点击完成返回软件主窗口。若不想应用此次绘制，则右上角X，取消。

本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序，使用过程中无需联网。支持更换Paddle官方模型（v2.x版本）或自己训练的模型，支持修改PaddleOCR参数。通过添加不同的语言模型，软件可识别多国语言。

更新日志

v2.1.5 主要更新：

新增：日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别（默认为ERROR）的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中，保存级别可以在全局设置标签页中更改。
新增：大部分标签页能手动切换左右/上下双栏模式。
新增：Esc键隐藏主窗口。
新增：调整二维码生成相关参数后，自动刷新二维码生成。
新增：命令行指令 --reload ，用于重新加载配置文件。 👉 文档
修复：文档识别提取PDF自带的文本内容时，未考虑页面旋转的影响。
修复：文档识别生成单层PDF时，未写入原PDF自带的文本内容。
修复：OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复：调整标签页顺序或删除标签页后，未及时保存顺序信息。
修复：HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复：Linux版本截图时，系统任务栏推移顶层窗口，导致截图位置偏移。
修复：Linux版本截图后，主窗口的位置与操作前不一致。
优化：图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹，且能预览加载进度。
Windows 版本更新第三方依赖库：PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言：俄语 Português ，译者：Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ，译者：தமிழ்நேரம்。

修复：Docker 部署在部分旧统中报错 ‘code’: 803 的问题。(#621)

下载说明

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

下载地址

蓝奏云飞机盘 123云盘

批量图片识别 Umi-OCR v2.1.5 中文绿色版

介绍

软件截图

软件特点

更新日志

v2.1.5 主要更新：

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

下载地址

相关推荐

评论 1

站内链接

支付宝扫一扫打赏