介绍
Umi-OCR用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。
软件截图
软件特点
忽略区域功能
忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下干净的台词文本。
“忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。
点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。
将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。
绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。
绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。
本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。
更新日志
v2.1.5 主要更新:
- 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到
Umi-OCR/UmiOCR-data/logs
目录中,保存级别可以在全局设置标签页中更改。 - 新增:大部分标签页能手动切换左右/上下双栏模式。
- 新增:Esc键隐藏主窗口。
- 新增:调整二维码生成相关参数后,自动刷新二维码生成。
- 新增:命令行指令
--reload
,用于重新加载配置文件。 👉 文档 - 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。
- 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
- 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
- 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
- 修复:HTTP接口
/api/doc/download
参数ignore_blank
的错误。 - 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。
- 修复:Linux版本截图后,主窗口的位置与操作前不一致。
- 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。
- Windows 版本更新第三方依赖库:
PyMuPDF 1.24.11
,fontTools 4.56.0
,Pillow 10.4.0
,psutil 10.4.0
,pynput 1.8.0
,zxing-cpp 2.3.0
- 新增UI语言:俄语
Português
,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语தமிழ்
,译者:தமிழ்நேரம்。
修复:Docker 部署 在部分旧统中报错 ‘code’: 803 的问题。(#621)
下载说明
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
蓝奏云 有密码啊