【开源工具推荐】Umi-OCR 文字识别工具：截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

Umi-OCR_文字识别工具下载」：https://pan.quark.cn/s/c39fad0c4c6egithub地址：https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.5免费：本项目所有代码开源，完全免费。方便：解压即用，离线运行，无需网络。高效：自带高效率的离线OCR引擎，内置多种语言识别库。灵活：支持命令行、HTTP接口等外部

2401_87245171

1046人浏览 · 2025-10-31 16:34:38

2401_87245171 · 2025-10-31 16:34:38 发布

Umi-OCR 文字识别工具介绍

「Umi-OCR_文字识别工具下载」：https://pan.quark.cn/s/c39fad0c4c6e
github地址：https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.5

免费：本项目所有代码开源，完全免费。
方便：解压即用，离线运行，无需网络。
高效：自带高效率的离线OCR引擎，内置多种语言识别库。
灵活：支持命令行、HTTP接口等外部调用方式。
功能：截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

基本信息

定位：一款免费、开源、可批量处理的离线OCR软件。
兼容性：适用于 Windows7 x64 及以上版本、Linux x64 系统。
多语言支持：提供中文、英文、日文等多种语言版本。

核心特点

免费开源：所有代码开源，完全免费使用。
便捷易用：解压即可使用，无需安装，离线运行，不依赖网络。
高效识别：自带高效率的离线OCR引擎（支持PaddleOCR-json、RapidOCR-json等），在计算机性能足够的情况下，识别速度可能超过在线OCR服务，且内置多种语言识别库。
灵活多样：
- 支持自定义界面。
- 提供命令行、HTTP接口等多种外部调用方式。
- 支持截图OCR、批量OCR、PDF识别、二维码识别、公式识别等多种功能。

主要功能

截图OCR：
- 打开对应页面后，可通过快捷键唤起截图，识别图中文字。
- 左侧图片预览栏支持用鼠标划选复制文字；右侧识别记录栏可编辑文字，也能划选多个记录进行复制。
- 支持从其他地方复制图片并粘贴到Umi-OCR进行识别。
- 具备OCR文本后处理功能，可通过预设的排版解析方案（如多栏按自然段换行、单栏保留缩进等）整理识别结果的排版和顺序，使其更易读和使用。
批量OCR：
- 支持批量导入本地图片或文件夹进行文字转换。
- 识别内容可保存为txt、jsonl、md、csv（Excel）等多种格式。
- 支持文本后处理技术，能识别并合并属于同一自然段落的文字，也支持代码块、竖排文字等多种处理方案。
- 一次导入处理的图片数量无限制，任务完成后软件可自动关机或休眠。
文档识别：
- 支持pdf、xps、epub、mobi、fb2、cbz等格式。
- 可对扫描件进行OCR，或提取原有文本，还能输出为双层可搜索PDF。
- 支持设定忽略区域，用于排除页眉页脚的文字。
- 可设置任务完成后自动关机或休眠。
其他功能：
- 二维码：支持扫码或生成二维码图片。
- 全局设置：可调节对所有页面生效的全局设置项。