【开源工具推荐】Umi-OCR 文字识别工具:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别
Umi-OCR_文字识别工具下载」:https://pan.quark.cn/s/c39fad0c4c6egithub地址:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.5免费:本项目所有代码开源,完全免费。方便:解压即用,离线运行,无需网络。高效:自带高效率的离线OCR引擎,内置多种语言识别库。灵活:支持命令行、HTTP接口等外部
·
Umi-OCR 文字识别工具介绍
「Umi-OCR_文字识别工具下载」:https://pan.quark.cn/s/c39fad0c4c6e
github地址:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.5
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
高效:自带高效率的离线OCR引擎,内置多种语言识别库。
灵活:支持命令行、HTTP接口等外部调用方式。
功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别
基本信息
- 定位:一款免费、开源、可批量处理的离线OCR软件。
- 兼容性:适用于 Windows7 x64 及以上版本、Linux x64 系统。
- 多语言支持:提供中文、英文、日文等多种语言版本。
核心特点
- 免费开源:所有代码开源,完全免费使用。
- 便捷易用:解压即可使用,无需安装,离线运行,不依赖网络。
- 高效识别:自带高效率的离线OCR引擎(支持PaddleOCR-json、RapidOCR-json等),在计算机性能足够的情况下,识别速度可能超过在线OCR服务,且内置多种语言识别库。
- 灵活多样:
- 支持自定义界面。
- 提供命令行、HTTP接口等多种外部调用方式。
- 支持截图OCR、批量OCR、PDF识别、二维码识别、公式识别等多种功能。
主要功能
-
截图OCR:
- 打开对应页面后,可通过快捷键唤起截图,识别图中文字。
- 左侧图片预览栏支持用鼠标划选复制文字;右侧识别记录栏可编辑文字,也能划选多个记录进行复制。
- 支持从其他地方复制图片并粘贴到Umi-OCR进行识别。
- 具备OCR文本后处理功能,可通过预设的排版解析方案(如多栏按自然段换行、单栏保留缩进等)整理识别结果的排版和顺序,使其更易读和使用。
-
批量OCR:
- 支持批量导入本地图片或文件夹进行文字转换。
- 识别内容可保存为txt、jsonl、md、csv(Excel)等多种格式。
- 支持文本后处理技术,能识别并合并属于同一自然段落的文字,也支持代码块、竖排文字等多种处理方案。
- 一次导入处理的图片数量无限制,任务完成后软件可自动关机或休眠。
-
文档识别:
- 支持pdf、xps、epub、mobi、fb2、cbz等格式。
- 可对扫描件进行OCR,或提取原有文本,还能输出为双层可搜索PDF。
- 支持设定忽略区域,用于排除页眉页脚的文字。
- 可设置任务完成后自动关机或休眠。
-
其他功能:
- 二维码:支持扫码或生成二维码图片。
- 全局设置:可调节对所有页面生效的全局设置项。
赞助支持
该项目主要由作者【hiroi-sora】(https://github.com/hiroi-sora)利用业余时间开发和维护。
网易易盾是国内领先的数字内容风控服务商,依托网易二十余年的先进技术和一线实践经验沉淀,为客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全、安全专家服务四大领域,全方位保障客户业务合规、稳健和安全运营。
更多推荐


所有评论(0)