图片转文字--四种OCR工具的安装和使用
liuian 2025-05-10 23:18 39 浏览
本文仅测试简单的安装和使用,
下一步应该是测试不同数据集下的检测准确率和检测效率,敬请期待。
作者的系统环境是:
笔记本:ThindPad P520
OS:win11
显卡:Quadro P520
一、EasyOCR
源码地址:
https://github.com/JaidedAI/EasyOCR
1、安装anaconda
为什么要安装anaconda?
因为我日常开发用python3.11的版本,使用YOLOv8需要python3.8的环境,这次使用EasyOCR需要python3.10的环境,需要切换python环境。
anaconda的安装和配置,请参考《YOLOv8入门篇--YOLOv8的安装和使用》。
2、创建虚拟环境(指定python3.10)
查看已有的conda虚拟环境
切换到创建好的虚拟环境
conda create -n testOCR python=3.10
conda env list
conda activate testOCR或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testOCR,效果一样。
3、安装EasyOCR
pip install easyocr4、写代码测试
import easyocr
reader = easyocr.Reader(['ch_sim','en']) # this needs to run only once to load the model into memory
result = reader.readtext('img.png')
print(result)二、CnOCR
源码地址:
https://github.com/breezedeus/CnOCR
1、安装anaconda
同上,略过。
2、创建虚拟环境(指定python3.10)
查看已有的conda虚拟环境
切换到创建好的虚拟环境
conda create -n testCNOCR python=3.10
conda env list
conda activate testCNOCR或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testCNOCR,效果一样。
3、安装CnOCR
pip install cnocr碰到如下错误:
Failed to build Polygon3
ERROR: Could not build wheels for Polygon3, which is required to install pyproject.toml-based projects3.1、试试源码安装
git clone https://github.com/breezedeus/CnOCR
cd CnOCR
pip install -r requirement.txt出现同样的错误,参考这篇文章:
https://wenku.csdn.net/answer/1pak5c8m9v
和
https://github.com/PaddlePaddle/PaddleOCR/issues/9668
需要安装一下:
https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/
这次通过了,
Successfully built polygon3
4、写代码测试
from cnocr import CnOcr
img_fp = './images/img.png'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)
print(out)三、Tesseract
Tesseract官方仓库:
https://github.com/tesseract-ocr/tesseract
Tesseract是用C++进行开发的,因此如果要在python中进行使用,需要借助第三方依赖pytesseract
首先需要在本机上安装Tesseract
安装包下载地址:
https://digi.bib.uni-mannheim.de/tesseract/
安装过程可参考:
https://blog.csdn.net/weixin_51571728/article/details/120384909
安装过程记得在“Additional languange data(download)”中,选上中文相关的4种语言,如下面两图:
配置完成后,在命令行输入tesseract -v打印出版本信息则表示安装成功。
1、安装anaconda
同上,略过。
2、创建虚拟环境(指定python3.10)
查看已有的conda虚拟环境
切换到创建好的虚拟环境
conda create -n testTEOCR python=3.10
conda env list
conda activate testTEOCR或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testTEOCR,效果一样。
3、安装pytesseract
pip install pytesseract4、写代码测试
import pytesseract
from PIL import Image
def demo():
# 重要!!!
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
# 打开要识别的图片
image = Image.open('./images/img.png')
# 使用pytesseract调用image_to_string方法进行识别,传入要识别的图片,lang='chi_sim'是设置为中文识别,
text = pytesseract.image_to_string(image, lang='chi_sim')
# 输入所识别的文字
print(text)
if __name__ == '__main__':
demo()四、PaddleOCR
PaddleOCR是百度旗下的产品,目前已经迭代到第四版。
PaddleOCR官方仓库:
https://github.com/PaddlePaddle/PaddleOCR
1、安装anaconda
同上,略过。
2、创建虚拟环境(指定python3.10)
查看已有的conda虚拟环境
切换到创建好的虚拟环境
conda create -n testPAOCR python=3.10
conda env list
conda activate testPAOCR或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testPAOCR,效果一样。
3、安装PaddleOCR
pip install PaddleOCR4、写代码测试
import cv2
from paddleocr import PaddleOCR
if __name__ == '__main__':
ocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version='PP-OCRv4')
image_input_fullname = 'images/img.png'
img = cv2.imread(image_input_fullname)
result = ocr.ocr(img, cls=True)
print(result)运行代码,提示缺少paddle
安装paddle,又提示缺少xx。
罗列如下:
pip install paddle
pip install common
pip install dual
pip install tight
pip install data
pip install prox再次运行,碰到如下错误:
ModuleNotFoundError: No module named 'paddle.distributed'
pip install paddlepaddle再次运行,下载模型,输出检测结果。
相关推荐
- 联想售后服务公司大全(联想各大服务售后地址)
-
方法如下:使用电脑打开QQ浏览器。打开浏览器以后,使用搜索引擎搜索联想,找到官方网站。点击打开官方网站,将鼠标放在服务选项上,弹出界面的左侧可以看到服务网点查询选项,点击该选项会自动定位用户所在的位置...
- oem win10(oem win10 换硬盘)
-
我不能对Windows10OEM版本做出评价。但是,OEM版本通常比零售版本便宜且功能相同,但可能在支持和保修方面有所区别。总的来说,购买合法,适合您的操作系统版本是最重要的。wⅰn10的OEM版...
- 为什么系统重装不了(系统重装不了的n种情况)
-
1、首先看电脑里是不是安装了其他版本的office,如果之前安装有的话,要卸载之前的版本。1.重新安装office,选择“添加或删除功能”,点“下一步”;2.“选择应用程序的高级自定义”,然后你会...
- w10如何定时关机(win10怎么样定时关机)
-
进入“电脑属性”。右键点击“此电脑”图标——“属性”,进入“电脑属性”。进入“控制面板主页”。点击左侧“控制面板主页”,进入“控制面板主页”。进入“系统和安全”设置。点击“系统和安全”,进入“系统和安...
- fast路由器地址(fast路由器ip地址)
-
fast路由器的登录地址(管理页面地址)是falogin.cn,电脑、手机连接到fast路由器的网络后,在浏览器中输入falogin.cn,就可以进入到fast路由器的登录页面。在登录页面中,输入正确...
- 电脑进不去桌面怎么重新安装系统
-
把一个系统放到桌面的方法方法1在桌面上空白处单击鼠标右键,在弹出的快捷菜单中选择【个性化】菜单命令2弹出【个性化】窗口3选择【更改桌面图标】链接4弹出【桌面图标设置】对话框5选择要添加的桌面图标,在复...
- cad2008下载免费中文版破解版
-
1还可以。不是很难用。2比较用的多的是CAD2007和CAD2004。但实际上CAD2008也是好用的。这是大家用的少。3 CAD哪个版本比较好?其实主要看周围的人用什么版本。一般人选...
-
- windows键的功能(windows键有什么用)
-
windows键上有一个微软Windows样式的图标,Win键处于电脑键盘的左下角,处于Ctrl键与Alt键中间的那个带着微软的徽标键就是Win键,该按键属于辅助按键,主要与其它按键组合使用,实现一些特定的功能,配合Win键可以和其他按键组...
-
2025-12-26 10:55 liuian
-
- 一键恢复照片免费(一键恢复照片免费版app)
-
如何一键还原涂鸦图片?1、涂鸦的作用就是为破坏其背后图像的细节,利用ps软件里面的修复画笔工具、修补工具和仿制图章工具,根据不同污点大小选择不同工具,可以还原部分图片。2、对于涂鸦严重的照片是无法还原,利用美图秀秀还原涂鸦图片,如果是涂鸦后...
-
2025-12-26 10:05 liuian
- 快捷方式小箭头怎么去除(快捷方式小箭头怎么去除图标)
-
要去除Windows桌面快捷方式的小箭头,可以按照以下步骤操作:针对Windows7、8、10系统:1.**通过注册表编辑器去除**: -按`Win+R`键打开“...
- qq网页版登录后怎么聊天(qq聊天网页版电脑登录)
-
两种方法:1对方知道的情况下:让对方把她的Tencent\QQ\(QQ号码)\Msgex.db文件发送给你,你先用对方的qq登陆一次,然后替换调Tencent\QQ\(QQ号码)\Msgex.db文...
- 免费全局主题商店(主题商店的全局主题是什么意思)
-
vivo手机下载免费全局主题方法:进入手机自带的i主题-主题中的搜索框输入“免费”,在主题中找到免费的全局主题下载应用即可。具体操作步骤(以vivoX20为例):1、待机桌面进入i主题2、主题...
- 怎么取消电脑自动更新(怎么取消电脑自动更新win10)
-
如果您想临时关闭Windows计算机的自动更新功能,可以按照以下步骤操作:1.打开“设置”应用程序。您可以点击Windows菜单并选择“设置”选项,或者使用Win+I快捷键打开“设置...
- 如何安装cad2014(如何安装监控摄像头视频教程)
-
安装AutoCAD2014的步骤如下:解压软件安装包。自动弹出安装面板,点击安装。选择“我接收”,点击下一步。提供三组序列号666-69696969、667-98989898、400-4545454...
- 惠普1020打印机怎么连接电脑
-
1,先安装好打印机,将打印机的连接线接到电脑上,打开打印机电源。2,打开电脑,然后使用随机的打印机驱动程序或者到打印机的官网下载当前系统的驱动程序,然后点击安装。3,安装完成后,点击打印测试页,如...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
