Umi-OCR 文字识别工具介绍

「Umi-OCR_文字识别工具下载」:https://pan.quark.cn/s/c39fad0c4c6e
github地址:https://github.com/hiroi-sora/Umi-OCR/releases/tag/v2.1.5

免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
高效:自带高效率的离线OCR引擎,内置多种语言识别库。
灵活:支持命令行、HTTP接口等外部调用方式。
功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

基本信息

  • 定位:一款免费、开源、可批量处理的离线OCR软件。
  • 兼容性:适用于 Windows7 x64 及以上版本、Linux x64 系统。
  • 多语言支持:提供中文、英文、日文等多种语言版本。

核心特点

  1. 免费开源:所有代码开源,完全免费使用。
  2. 便捷易用:解压即可使用,无需安装,离线运行,不依赖网络。
  3. 高效识别:自带高效率的离线OCR引擎(支持PaddleOCR-json、RapidOCR-json等),在计算机性能足够的情况下,识别速度可能超过在线OCR服务,且内置多种语言识别库。
  4. 灵活多样
    • 支持自定义界面。
    • 提供命令行、HTTP接口等多种外部调用方式。
    • 支持截图OCR、批量OCR、PDF识别、二维码识别、公式识别等多种功能。

主要功能

  1. 截图OCR

    • 打开对应页面后,可通过快捷键唤起截图,识别图中文字。
    • 左侧图片预览栏支持用鼠标划选复制文字;右侧识别记录栏可编辑文字,也能划选多个记录进行复制。
    • 支持从其他地方复制图片并粘贴到Umi-OCR进行识别。
    • 具备OCR文本后处理功能,可通过预设的排版解析方案(如多栏按自然段换行、单栏保留缩进等)整理识别结果的排版和顺序,使其更易读和使用。
  2. 批量OCR

    • 支持批量导入本地图片或文件夹进行文字转换。
    • 识别内容可保存为txt、jsonl、md、csv(Excel)等多种格式。
    • 支持文本后处理技术,能识别并合并属于同一自然段落的文字,也支持代码块、竖排文字等多种处理方案。
    • 一次导入处理的图片数量无限制,任务完成后软件可自动关机或休眠。
  3. 文档识别

    • 支持pdf、xps、epub、mobi、fb2、cbz等格式。
    • 可对扫描件进行OCR,或提取原有文本,还能输出为双层可搜索PDF。
    • 支持设定忽略区域,用于排除页眉页脚的文字。
    • 可设置任务完成后自动关机或休眠。
  4. 其他功能

    • 二维码:支持扫码或生成二维码图片。
    • 全局设置:可调节对所有页面生效的全局设置项。

赞助支持

该项目主要由作者【hiroi-sora】(https://github.com/hiroi-sora)利用业余时间开发和维护。

Logo

网易易盾是国内领先的数字内容风控服务商,依托网易二十余年的先进技术和一线实践经验沉淀,为客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全、安全专家服务四大领域,全方位保障客户业务合规、稳健和安全运营。

更多推荐