DangoOCR
基于PaddleOCR搭建的OCR server... 离线部署用
Install / Use
/learn @PantsuDango/DangoOCRREADME
开头说明
DangoOCR 是基于大家的 CPU处理器 来运行的,CPU处理器 的好坏会直接影响其速度,~~但不会影响识别的精度~~,目前此版本识别速度可能在 0.5-3秒之间,具体取决于大家机器的配置,可以的话尽量不要在运行时开其他太多东西。需要配合团子翻译器 Ver3.6 及其以上的版本才可以使用!
此项目底层基于百度开源的PaddleOCR搭建,这是团子第一次尝试自己封装离线的OCR,遇到了不少坑,也受到了不少人的帮助才顺利完成这第一个版本~此离线版本以后都会开源,团子也会慢慢优化它的精度和速度,也欢迎对OCR领域有所研究的大佬能一起讨论研究~
项目相关
DangoOCR 源码地址 希望能收到你点的 Star ~ 团子感激不尽
ps:此文档为离线文档,相关说明和问题集可能会过时,如果此文档不能帮助你解决问题,请直接查看 DangoOCR 源码地址
团子翻译器 源码地址 配合翻译器 Ver3.6 及其以上版本使用,啃生肉!
b站个人主页 关于 团子翻译器 和 团子OCR 的任何事宜,团子都会第一时间在b站的动态发布,关不关注你看着办~
团子QQ:394883561 邮箱:394883561@qq.com
特别鸣谢
PaddleOCR 项目地址 项目底层基于此框架搭建
QPT 打包工具地址 推荐开发者了解一下这个打包工具,比 pyinstaller 好用!DangoOCR 就是使用此工具打包的 ~ 感谢作者
使用前注意
- 只可以运行在 x64 位的系统,x86 32位的系统可以暂时不支持;
- 只支持windows,windows7-10都可以,windows7以下不行,mac和移动端和linux都不支持;
- 使用前务必关掉所有杀毒软件,不然被误杀导致文件缺失无法启动自己想办法;
- <span style="color:red;">只可以运行在全英文的路径,路径中不能含有中文或者中文类型的字符;</span>
- <span style="color:red;">路径不可以带有空格;</span>
~~以后的版本可能会修复以上问题~~,第4.5条注意事项可详见下图说明:
错误演示
路径带的 "团子" ,有中文启动会失败
正确演示
特别说明
对于盘符,D盘C盘E盘,盘符及其之前的路径带有中文是没有关系,不会影响的
安装和启动
第一次启动需要初始化(安装),切勿关闭黑色的运行窗口,待进度条满后初始化完毕,只有第一次启动才会有进度条
中途这些红色的错误不需要在意,不影响,等它一直运行就好了
如弹出,点允许访问
出现如下情况,则启动完毕,可以配合翻译器直接使用了,<span style="color:red;">使用过程中千万不可以关掉此运行的黑窗口,直接缩小即可</span>
注意翻译器此处不要打勾,不要打勾,如果打勾就是使用百度的OCR,当然你有高额度的百度OCR账号优先用百度OCR会更好
测试工具
可以在不使用翻译器的情况下简单测试自己的 DangoOCR 是否正常
记得先完成 DangoOCR 的运行,再启动此脚本测试,可以测试使用速度
如图完成测试,团子的测试结果是平均 0.81s,垃圾CPU
已知的问题和解决方案
计算机名中文
出现如上图的错误的话,按照如下方法解决:
错误是由于你的计算机名带有汉字或者一些奇葩字符导致的,需要修改成英文或者数字
修改完成后保存重启 DangoOCR 即可
缺少vc++2017运行环境
安装以下文件即可解决
缺少 mkl 驱动
一些盗版系统或者老版系统可能会没有 mkl 驱动,DangoOCR 需要此驱动来加速 OCR 的识别速度
需要的文件在这里
解压后都丢到 C:\Windows\System32 就可以解决了
Related Skills
node-connect
352.9kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
111.5kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
352.9kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
352.9kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
