百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

字符识别之PaddleOcr介绍、安装与应用

liuian 2025-07-01 21:21 3 浏览

  1. paddleocr介绍

paddleocr是一款轻量型字符识别工具库,支持多语言识别,支持pip安装与自定义训练。详细信息如下表所示。

名称

许可证

当前版本

下载地址(github地址)

支持语言

运行方式pip安装

PaddleOCR

Apache 2.0 license

PaddleOCR v2.3

https://gitee.com/paddlepaddle/PaddleOCR?utm_source=alading&utm_campaign=repo

python等

安装相应的pip即可,或者下载github源码

2. paddleocr安装

在python环境中,运行pip命令:

pip install "paddleocr>=2.0.1"
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

在执行安装命令之前需要配置完成一些必要的库,参考requments.txt安装如下的包:

shapely、scikit-image==0.17.2、imgaug==0.4.0、pyclipper、lmdb
tqdm、numpy、visualdl、python-Levenshtein、opencv-contrib-python==4.4.0.46
lxml、premailer、openpyxl

此外还需要安装paddlepaddle以及必须的模型等。模型下载地址:

模型信息:

下载:!wget
https://paddleocr.bj.bcebos.com/inference.tar 并且需要将模型放在固定位置

模型信息:https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md

官方文档:

https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.0/doc/doc_ch

https://www.bookstack.cn/read/PaddleOCR/quickstart.md

3. 测试

提供两种测试方式,一种是pip方式,一种以命令行的源码启动。以下图为例进行测试。

对代码方式运行结果如下:

左右两边分别对应原图标识和结果。对命令行启动步骤如下(以需要下载模型为例)

  1. 在github或其他相关网页上找到需要下载的模型,一般会有两个模型,分别是检测模型和识别模型。下载完成后在源码路径下新建inference文件夹,然后将模型解压放在该文件夹下。
  2. 使用命令
>python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_PP-OCRv2_det_slim_quant_infer/" --rec_model_dir="./inference/ch_PP-OCRv2_rec_slim_quant_infer/" --use_gpu=False

* use_gpu=False表示不使用GPU。

完成后结果保存在源码路径下的inference_results文件夹下。可以看出更换模型后效果较默认模型要好。

这里使用官方图像进行测试的结果。

4. paddleocr训练

paddleocr提供完全的训练方式,具体方式可参考官方文档进行处理。官方提供了标注工具,界面启动和截图如下。在PaddleOcr源码下PPOCRLabel文件夹下执行命令(需要先安装pyqt):

python PPOCRLabel.py --lang ch

执行后界面如下:

相关推荐

RazorSQL Mac版(SQL数据库查询工具)

RazorSQLMac特别版是一款看似简单实则功能非常出色的SQL数据库查询、编辑、浏览和管理工具。RazorSQLformac特别版可以帮你管理多个数据库,支持主流的30多种数据库,包括Ca...

史上最强!开源数据库管理工具DBeaver 24.2发布

DBeaverCommunity是一个免费的跨平台数据库工具,面向开发人员、数据库管理员、分析师和所有使用数据的人员。它支持所有流行的SQL数据库,如MySQL、MariaDB、PostgreSQL...

10个优秀的MySQL管理工具,都是大佬们的珍藏

Mysql开源、体积小、速度快、成本低、安全性高,目前在全球中小型网站中被广泛应用。今天给大家介绍10个优秀的MySQL管理工具,都是大佬们的珍藏,对你有用的话,可以收藏转发。1、Induction...

Mac电脑如何安装向量数据库Milvus

Milvus是一个高性能、高度可扩展的矢量数据库,可在从笔记本电脑到大规模分布式系统的各种环境中高效运行。Milvus提供强大的数据建模功能,使您能够将非结构化或多模态数据组织成结构化集合。Mil...

干掉 PowerDesigner!这款国人开源的数据库设计工具真香

当我们在项目开发初期时,往往需要设计大量的表,此时使用数据库设计工具就会比较高效!今天给大家推荐一款国人开源的数据库设计工具chiner,界面漂亮,功能强大,希望对大家有所帮助!聊聊PowerDesi...

数据库管理工具推荐!SQL Studio:免费、高效,歪...

随着国际环境的变化,越来越多的企业基于供应链安全的需求。信息技术的飞速发展,数据库管理工具的需求也越来越迫切。然而,在众多软件中,要找到一款得心应手的数据库管理工具并不容易。今天,我向大家推荐一款功能...

Mac密码安全管理工具----Enpass(mac密码管理在哪里)

Enpassmac版是一款适用于macOS用户的密码安全管理工具,使用Enpass,你无需再为记住太多的密码和其他重要凭据而头疼了。Enpass把你的密码存放在一个安全的地方,然后通过一个主密码随时...

超实用的14款MySQL数据库管理工具

MySQL是当前流行的数据库引擎之一,具有成本低、速度快、体积小且开放源代码的优点。今天就给大家分享14款MySQL数据库管理工具。1.MySQLDumper这款软件的应用,有效解决使用PHP进行大数...

神器收藏:macOS最强工具清单,16.6k+星 awesome-macOS

神器收藏:macOS最强工具清单,16.6k+星标必看引言在macOS生态中,有一个备受瞩目的神仓库,汇集了最全面、最实用的macOS应用和工具清单。这个项目在GitHub上已获得超过16.6k的...

JetBrains DataGrip Mac中文破解版V2025.1下载安装教程

DataGripforMac是由JetBrains开发的数据库集成开发环境(IDE),专为数据库管理员和开发人员设计。它支持多种数据库(如MySQL、PostgreSQL、Oracle、SQ...

GIS坐标参考系统:EPSG、WKT和PROJ

在之前的教程中,我们介绍了什么是坐标参考系统(CRS)、坐标参考系统的组成部分以及投影坐标参考系统和地理坐标参考系统之间的一般差异。在这个教程中,我们将介绍CRS信息的不同存储方式。推荐:用...

【地理信息可视化】basemap(cartopy)+geopandas显示地图-03

importwarningswarnings.filterwarnings('ignore')importosimportnumpyasnpfromscipy....

字符识别之PaddleOcr介绍、安装与应用

paddleocr介绍paddleocr是一款轻量型字符识别工具库,支持多语言识别,支持pip安装与自定义训练。详细信息如下表所示。名称许可证当前版本下载地址(github地址)支持语言运行方式pi...

111.Python——基于pipenv打包PaddlePaddle的GUI项目

飞桨PaddlePaddle是百度的深度学习框架,用来做一些项目还是非常不错。但是打包就是一件非常麻烦的过程。在文中有讲过打包问题。29.Python程序打包成可执行文件——常见疑难问题解决办法。本文...

Shamos算法:一种在平面上找到最远点的方法

旋转卡尺算法简介Shamos算法,也叫旋转卡尺(Rotatingcalipers)算法,是一种用于解决计算几何问题的优化算法。它可以用来解决许多几何问题,包括计算点集的宽度或直径。算法的名称来源于其...