百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

图片转文字--四种OCR工具的安装和使用

liuian 2025-05-10 23:18 32 浏览

本文仅测试简单的安装和使用,

下一步应该是测试不同数据集下的检测准确率和检测效率,敬请期待。


作者的系统环境是:

笔记本:ThindPad P520

OS:win11

显卡:Quadro P520


一、EasyOCR

源码地址:
https://github.com/JaidedAI/EasyOCR

1、安装anaconda

为什么要安装anaconda?

因为我日常开发用python3.11的版本,使用YOLOv8需要python3.8的环境,这次使用EasyOCR需要python3.10的环境,需要切换python环境。

anaconda的安装和配置,请参考《YOLOv8入门篇--YOLOv8的安装和使用》。


2、创建虚拟环境(指定python3.10)

查看已有的conda虚拟环境

切换到创建好的虚拟环境

conda create -n testOCR python=3.10
conda env list
conda activate testOCR

或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testOCR,效果一样。


3、安装EasyOCR

 pip install easyocr


4、写代码测试

import easyocr
reader = easyocr.Reader(['ch_sim','en']) # this needs to run only once to load the model into memory
result = reader.readtext('img.png')
print(result)


二、CnOCR

源码地址:
https://github.com/breezedeus/CnOCR

1、安装anaconda

同上,略过。


2、创建虚拟环境(指定python3.10)

查看已有的conda虚拟环境

切换到创建好的虚拟环境

conda create -n testCNOCR python=3.10
conda env list
conda activate testCNOCR

或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testCNOCR,效果一样。


3、安装CnOCR

pip install cnocr

碰到如下错误:

Failed to build Polygon3
ERROR: Could not build wheels for Polygon3, which is required to install pyproject.toml-based projects


3.1、试试源码安装

git clone https://github.com/breezedeus/CnOCR
cd CnOCR
pip install -r requirement.txt


出现同样的错误,参考这篇文章:

https://wenku.csdn.net/answer/1pak5c8m9v

https://github.com/PaddlePaddle/PaddleOCR/issues/9668

需要安装一下:

https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

这次通过了,

Successfully built polygon3


4、写代码测试

from cnocr import CnOcr

img_fp = './images/img.png'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)

print(out)


三、Tesseract

Tesseract官方仓库:
https://github.com/tesseract-ocr/tesseract

Tesseract是用C++进行开发的,因此如果要在python中进行使用,需要借助第三方依赖pytesseract


首先需要在本机上安装Tesseract

安装包下载地址:
https://digi.bib.uni-mannheim.de/tesseract/

安装过程可参考:
https://blog.csdn.net/weixin_51571728/article/details/120384909

安装过程记得在“Additional languange data(download)”中,选上中文相关的4种语言,如下面两图:


配置完成后,在命令行输入tesseract -v打印出版本信息则表示安装成功。


1、安装anaconda

同上,略过。


2、创建虚拟环境(指定python3.10)

查看已有的conda虚拟环境

切换到创建好的虚拟环境

conda create -n testTEOCR python=3.10
conda env list
conda activate testTEOCR

或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testTEOCR,效果一样。


3、安装pytesseract

pip install pytesseract


4、写代码测试

import pytesseract
from PIL import Image


def demo():
    # 重要!!!
    pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
    # 打开要识别的图片
    image = Image.open('./images/img.png')
    # 使用pytesseract调用image_to_string方法进行识别,传入要识别的图片,lang='chi_sim'是设置为中文识别,
    text = pytesseract.image_to_string(image, lang='chi_sim')

    # 输入所识别的文字
    print(text)


if __name__ == '__main__':
   demo()


四、PaddleOCR

PaddleOCR是百度旗下的产品,目前已经迭代到第四版。

PaddleOCR官方仓库:
https://github.com/PaddlePaddle/PaddleOCR


1、安装anaconda

同上,略过。


2、创建虚拟环境(指定python3.10)

查看已有的conda虚拟环境

切换到创建好的虚拟环境

conda create -n testPAOCR python=3.10
conda env list
conda activate testPAOCR

或者在pycharm开发环境下,选择conda+python3.10创建虚拟环境,并命名为testPAOCR,效果一样。


3、安装PaddleOCR

pip install PaddleOCR


4、写代码测试

import cv2
from paddleocr import PaddleOCR

if __name__ == '__main__':
    ocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version='PP-OCRv4')
    image_input_fullname = 'images/img.png'
    img = cv2.imread(image_input_fullname)
    result = ocr.ocr(img, cls=True)
    print(result)


运行代码,提示缺少paddle

安装paddle,又提示缺少xx。

罗列如下:


pip install paddle
pip install common
pip install dual
pip install tight
pip install data
pip install prox


再次运行,碰到如下错误:

ModuleNotFoundError: No module named 'paddle.distributed'

pip install paddlepaddle

再次运行,下载模型,输出检测结果。

相关推荐

163邮箱登录入口官网网页(163邮箱官方登录页面)

1.在网页上搜索maiI163邮箱登录,如果有邮箱账号密码的话就直接输入并点击“登录”,没有的话就点击“立即注册”。2.点击“立即注册”后进入页面,输入信息点击“注册”。3.注册成功后就直接搜索登录。...

pe系统安装教程(pe系统装机教程)

用PE进入电脑装系统方法:1、进入pe后,选择在u盘里的iso系统文件。右击它,选择加载为虚拟磁盘。2、点击进来之后,再点击确定就可以挂载成功了。3、挂载成功后去桌面打开windows安装器。4、第一...

优酷视频免费下载并安装(下载优酷视频安装)

很高兴回答你的问题!1.首先在电脑上打开优酷。2.点击右上角的三道杠点击“设置”。3.点击“转码设置”。4.将转码格式改成mp4。5.打开要下载的视频,点击下载按钮。6.勾选“下载完后自动转码”。优酷...

u盘变成系统盘怎么变回来(u盘变成系统盘还能用吗)
  • u盘变成系统盘怎么变回来(u盘变成系统盘还能用吗)
  • u盘变成系统盘怎么变回来(u盘变成系统盘还能用吗)
  • u盘变成系统盘怎么变回来(u盘变成系统盘还能用吗)
  • u盘变成系统盘怎么变回来(u盘变成系统盘还能用吗)
360浏览器官网电脑版(360浏览器 官网)

网页版的入口,你的意思是说如何打开嘛?它安装完了之后。就会在桌面上出现一个图标,你直接点击不就可以了吗?1、首先打开电脑浏览器。2、然后在浏览器上搜索搜索360网盘。3、然后就可以看到网页版登录入口。...

服务器重装系统(服务器重装系统按什么键)

进入服务器之后选择清除系统重新安装即可如果确实忘记了服务器电脑密码,可以尝试使用重装系统的方式来解决问题。首先需要准备一个可启动的系统安装盘或U盘,然后在服务器开机时进入BIOS设置,将启动设备设为安...

win11下载一半可以取消吗(win11下载两次)

1.首先回到桌面,右键单击鼠标开始win徽标,右击菜单点击运行,或者直接WIN+R组合键。  2.跳出运行对话框,输入services.msc并单击OK按钮。3.转到服务列表,找到Windowsup...

windows7怎么进入bios(windows7怎么进入管理员界面)

1、开机时按F2键或者DEL键,进入BIOS系统;注:机器型号不同,进入BIOS的按键可能有所不同,具体可参看左下角的屏幕提示。2、选择Security选项卡,选择SecureBoot,按回车键——...

截图快捷键ctrl加什么电脑截图

ctrl+alt+a是qq的截图快捷键;台式电脑还可以使用的截图方式:方法一:按PrtScSysRq键,然后在文档中右击选择粘贴就可以看见截图,将截图另存为即可获得截图;方法二:按win+PrtScS...

手机怎样提高网速(手机怎样提高网速华为)
  • 手机怎样提高网速(手机怎样提高网速华为)
  • 手机怎样提高网速(手机怎样提高网速华为)
  • 手机怎样提高网速(手机怎样提高网速华为)
  • 手机怎样提高网速(手机怎样提高网速华为)
ios官方网站(苏州晶体公司ios官方网站)
ios官方网站(苏州晶体公司ios官方网站)

方法/步骤1,点击下方的【safari】图标。2,搜索苹果官网,点击进入3,进入苹果的页面,点击左上角二道横4.查询苹果的相关产品。1.打开苹果官网:http://www.apple.com.cn/并点击页面右上角的技术支持选项。2.选择您...

2025-11-10 09:55 liuian

手机突然无法识别u盘(手机突然无法识别u盘怎么办呢)

1、手机不支持OTG功能,所以将U盘连接到手机后,手机无法识别U盘的内容,因此显示不了;这种情况只能换台支持OTG功能的手机来连接U盘才行。2、手机支持OTG功能,但是使用的OTG线质量有问题导致无...

windows10更新不了一直重试(window10一直更新失败)

可能是以下几个原因导致的:1.可能是硬盘剩余空间太少或者碎片太多,队伍用文件进行清理并清理碎片即可。2.可能是windows10版本不支持软件进行运行。3.没有权限,打开相应的权限后重启即可情况说明你...

联想笔记本怎么进入安全模式
联想笔记本怎么进入安全模式

联想笔记本电脑进入安全模式的方法如下:1、第一步,按下【windows+R】,打开【运行】,输入【msconfig】后,点击【确定】。2、第二步,打开【系统配置】窗口后,点击【引导】。3、第三步,勾选【安全引导】后,选择需要的安全模式,通常...

2025-11-10 08:05 liuian

winxp升级包下载(xp 升级)

题主你好,XP系统要升级成WIN7很简单,方法如下:1,下载win7系统iso镜像到本地硬盘,右键使用WinRAR等工具解压出来2,将最大的win7.gho文件和Onekeyghost工具放到同一目...