字符识别之PaddleOcr介绍、安装与应用
liuian 2025-07-01 21:21 36 浏览
- paddleocr介绍
paddleocr是一款轻量型字符识别工具库,支持多语言识别,支持pip安装与自定义训练。详细信息如下表所示。
名称 | 许可证 | 当前版本 | 下载地址(github地址) | 支持语言 | 运行方式pip安装 |
PaddleOCR | Apache 2.0 license | PaddleOCR v2.3 | https://gitee.com/paddlepaddle/PaddleOCR?utm_source=alading&utm_campaign=repo | python等 | 安装相应的pip即可,或者下载github源码 |
2. paddleocr安装
在python环境中,运行pip命令:
pip install "paddleocr>=2.0.1"
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple在执行安装命令之前需要配置完成一些必要的库,参考requments.txt安装如下的包:
shapely、scikit-image==0.17.2、imgaug==0.4.0、pyclipper、lmdb
tqdm、numpy、visualdl、python-Levenshtein、opencv-contrib-python==4.4.0.46
lxml、premailer、openpyxl此外还需要安装paddlepaddle以及必须的模型等。模型下载地址:
模型信息:
下载:!wget
https://paddleocr.bj.bcebos.com/inference.tar 并且需要将模型放在固定位置
模型信息:https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md
官方文档:
https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.0/doc/doc_ch
https://www.bookstack.cn/read/PaddleOCR/quickstart.md
3. 测试
提供两种测试方式,一种是pip方式,一种以命令行的源码启动。以下图为例进行测试。
对代码方式运行结果如下:
左右两边分别对应原图标识和结果。对命令行启动步骤如下(以需要下载模型为例)
- 在github或其他相关网页上找到需要下载的模型,一般会有两个模型,分别是检测模型和识别模型。下载完成后在源码路径下新建inference文件夹,然后将模型解压放在该文件夹下。
- 使用命令
>python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_PP-OCRv2_det_slim_quant_infer/" --rec_model_dir="./inference/ch_PP-OCRv2_rec_slim_quant_infer/" --use_gpu=False* use_gpu=False表示不使用GPU。
完成后结果保存在源码路径下的inference_results文件夹下。可以看出更换模型后效果较默认模型要好。
这里使用官方图像进行测试的结果。
4. paddleocr训练
paddleocr提供完全的训练方式,具体方式可参考官方文档进行处理。官方提供了标注工具,界面启动和截图如下。在PaddleOcr源码下PPOCRLabel文件夹下执行命令(需要先安装pyqt):
python PPOCRLabel.py --lang ch执行后界面如下:
相关推荐
-
- 惠普台式机进入bios设置u盘启动
-
设置u盘启动的步骤如下:1、首先,将u盘插入hp台式机的USB接口处。2、开机快速断续的按F10键进入BIOS设置界面。3、将光标移到【BootDevicePriority】选项按回车键进入。4、选择【HDDGroupBootPr...
-
2026-01-15 00:37 liuian
- 云手机免费版无限挂机怎么用
-
1、登陆后,如果需要挂网页游戏,点击服务器的左下角,找到IE浏览器,然后打开网页游戏,登陆你的账号就行了,不要关闭IE浏览器,你的网页游戏就会24小时挂在云服务器上面。2、如果想要挂机,打开IE浏览器...
- 上海最近3天疫情情况(上海近几天的新冠疫情情况)
-
根据国家卫健委的每天疫情通报及上海市的疫情通报,上海没有一个区属中高风险地区,所以从上海任何一个区返乡都不需要隔离14天。上海这么大的城市,每天人来人往的Ill流不息,能继续做到区级地区没有中高级风险...
- windows media player怎么下载
-
方法如下:在安装WMP11时只是把C:\DocumentsandSettings\AllUsers\ApplicationData\WindowsGenuineAdvantage\data...
- during(during用法)
-
during用来表示一段时间,其意义大致相当于in的用法。一般来说,凡是能用in的地方,也可以用during.例如:Hecametoseemeduringmyabsence.Don’t...
- 深圳电脑城在哪里(深圳电脑卖场)
-
龙岗:世纪电脑城,平湖电脑城,京科电脑城坪山新区:坪山电脑城龙华:观澜电脑城,大浪电脑城,宏华电脑城,龙华电子城宝安区:赛格电子城,宝安电子城,丰明电脑城,沙井电子城龙岗中心区那边有两个电子城,...
- 电脑上怎么清理c盘垃圾(电脑里怎么清理c盘的东西)
-
C:\ProgramFiles\WindowsApps(隐藏文件夹)。打开“此电脑”,点击“查看”,勾选“隐藏的项目”,即可查看隐藏文件。为保证文件安全,此文件夹需要获取权限才能操作。获取方式...
- 手机哪个杀毒软件最好用
-
杀毒软件我有用过好几种用过之觉得体验感及安全性来说人喜欢推荐腾讯手机管家功能比较全面监控流量、查杀病毒、保护隐私等等界面也比较漂亮重点还要定期扫描同时也要轻易点开别人发链接之类软件有提示危险绝对要点开...
-
- 笔记本电脑怎样截图(苹果笔记本电脑怎样截图)
-
方法/步骤1第一个办法自然是我们最常见最简单的,使用“PrintScreen”键截图了。点击“PrintScreen”键,我们就可以直接截取全部屏幕,找个对话框或者文字区域粘贴就好了。我截的图是这样的2Windows系统都自带有截图工具,我...
-
2026-01-14 22:37 liuian
- vaio笔记本u盘启动(hipaa笔记本u盘启动)
-
可能是u盘启动快捷键没有使用正确。因为笔记本型号不同,所以BIOS会有所不同,并且进入bios的启动快捷键也会不同。而索尼笔记本开机需要按F2键进入bios设置中。 2、在bios中没有正确设置u盘...
- win7补丁更新在哪(win7系统补丁更新到几月)
-
答,方法如下1、点击开始菜单。在开始菜单键上面有三个图标,分别是;用户。设置。电源。点击其中的设置按钮。 2、接着,就打开了Windows设置窗口。点击最后一个“更新和安全”。 3、选择左侧列表中...
- 大白菜启动盘下载(大白菜启动盘官网)
-
要在大白菜U盘上下载系统并创建启动盘,首先需要确保U盘的容量足够大以容纳整个系统镜像文件。然后,您可以从官方网站或可信的下载源获取所需的系统镜像文件,并使用专业的启动盘制作工具,如Rufus或UNet...
- win10笔记本强制关机(windows10笔记本强制关机)
-
笔记本强制关机方法:1、按笔记本的电源键不松手,即可实现强制关机。2、一般涉及强制关机主要有死机、蓝屏、电脑运行程序无响应。强制关机后,笔记本电脑可能会出现非常卡的情况。这主要是因为在强制关机的过程中...
- 硬盘低级格式化软件哪个好(硬盘低级格式化对硬盘有损伤吗)
-
万能低格工具llftool好万能低格工具llftool是一款强大易用的硬盘低级格式化软件,支持硬盘、移动硬盘、内存卡、u盘等等存储设备的低格功能,过程快速方便,性能安全稳定。另外,...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
