Umi-OCR 提供多种实用功能,满足您的各种OCR需求
快捷键唤起截图,即时识别图中文字,支持多栏排版解析和文本后处理,识别结果可直接编辑复制。
批量导入本地图片进行识别,支持多种输出格式,可设置忽略区域排除水印,无数量限制。
支持PDF、XPS、EPUB等多种文档格式,可从扫描件中提取文本,或生成双层可搜索PDF。
支持扫码或生成二维码图片,支持19种协议和纠错等级设置,可同时识别一图多码。
提供完整的命令行接口,支持截图、粘贴图片、指定路径识别、二维码识别等多种操作。
提供HTTP API接口,方便与其他应用程序集成,支持图片OCR、文档识别、二维码处理等功能。
我们致力于打造最实用、高效的OCR工具
本项目所有代码开源,完全免费使用,无任何功能限制或广告。
解压即用,无需联网,保护您的数据隐私安全,适合在无网络环境下使用。
自带高效率的离线OCR引擎,内置多种语言识别库,识别速度快、准确率高。
支持命令行、HTTP接口等外部调用方式,可轻松集成到您的工作流程中。
高效识别
快速准确的OCR技术
Umi-OCR 设计为开箱即用,无需复杂配置
从下载页面获取最新版本的安装包,支持Windows和Linux平台。
从下载页面获取最新版本
解压下载的压缩包,找到Umi-OCR.exe文件,双击即可运行。
解压后双击Umi-OCR.exe运行
选择您需要的功能(截图OCR、批量OCR等),开始使用OCR功能。
选择功能开始识别文本
直观展示Umi-OCR的各项功能和界面设计
支持快捷键截图、粘贴图片识别,左侧预览栏可直接复制,右侧记录栏可编辑文字。
支持批量导入本地图片进行识别,多种输出格式选择,可设置忽略区域排除水印。
支持PDF等多种文档格式,可从扫描件中提取文本,或生成双层可搜索PDF。
支持扫码或生成二维码图片,支持19种协议和纠错等级设置。
Umi-OCR 提供多种接口,方便开发者集成和调用
通过命令行快速调用Umi-OCR的各项功能,适合自动化脚本和系统集成。
# 截图OCR
Umi-OCR --screenshot
# 识别指定图片
Umi-OCR --path "D:/example.png"
# 二维码识别
Umi-OCR --qrcode_read "D:/qrcode.png"
通过HTTP API调用Umi-OCR功能,方便与其他应用程序集成。
// 图片OCR识别示例
POST http://localhost:5000/api/ocr
Content-Type: application/json
{
"image": "base64编码的图片数据",
"options": {
"language": "ch_sim+en",
"detect_direction": true
}
}