pytesseract库的安装和使用

lvg3687 lvg3687     2022-12-29     236

关键词:

在写爬虫的时候总是遇到一些以图片的形式展示的信息,因此要怎么解析图片上的信息呢?在Google上查了一下,需要安装pytesseract和pillow(我用的python3.7)和Tesseract-OCR

1. 安装pytesseract

  pip insatll pytesseract

2. 安装pillow

  pip install pillow

3. 安装Tesseract-OCR(https://github.com/tesseract-ocr/tesseract)

4. 安装完后将Tesseract-OCR的安装路径添加到环境变量中PATH和Path中都要添加

例如:

技术分享图片

 

5. 在python的安装路径下的修改安装的pytesseract库里面的pytesseract.py,将默认的改成Tesseract-OCR的安装路径

技术分享图片

7. 配置完了开始撸代码吧

技术分享图片

运行后发现会报错

技术分享图片

用Google查了一下,发现是因为验证码的图片模式为RGBA,是无法分配调色盘给透明通道的。更换为RGB模式则不会出现该问题。

对原先的代码修改一下,变为:

技术分享图片

修改后就能正常使用了。

 

pytesseract的使用|python识别验证码(代码片段)

目录1.安装tesseract2.安装pytesseract3.修改包中部分代码4.代码网站测试1.安装tesseract详见:https://blog.csdn.net/lijiamingccc/article/details/1194597752.安装pytesseract在pycharm终端下,安装pytesseract,如图所示pipinstall 查看详情

pytesseract使用的坑

...本人用的是Windows64位,IDE是VS2017。pip版本过低。首先安装pytesseract这个库,pipinstalltessract。由于自己输错了,tessract前少了py两个字母,安装没有成功,抛出一个pip版本过低的问题,我就将pip升级到最新版9.0.3,以前是9.0.1。输入py... 查看详情

pytesseract识别验证码(代码片段)

pytesseract识别验证码0.下载https://tesseract-ocr.github.io/tessdoc/Installation.html`1.安装选择添加Math和Chinese包安装完成后,配置环境变量,之前我安装1201版本的会报错,win1064位下会报这种错误:所以我选择20190623的安装... 查看详情

pytesseract识别验证码(代码片段)

pytesseract识别验证码0.下载https://tesseract-ocr.github.io/tessdoc/Installation.html`1.安装选择添加Math和Chinese包安装完成后,配置环境变量,之前我安装1201版本的会报错,win1064位下会报这种错误:所以我选择20190623的安装... 查看详情

[原]python使用pytesseract库识别验证码(mac系统)

1.安装pythonbrewinstallpython2.安装PIL及图片格式支持下载http://www.pythonware.com/products/pil/index.htm解压tar-xzfImaging-1.1.7.tar.gz安装PILcdImaging-1.1.7sudopythonsetup.pyinstall安装图片格式支持brewinstalllibpngbrewinstal 查看详情

我对 pytesseract 有疑问

】我对pytesseract有疑问【英文标题】:Ihaveissueswithpytesseract【发布时间】:2020-12-3001:50:23【问题描述】:我有一个使用pytesseract的项目。我安装了tesseract,但每次尝试运行代码时都会出现此错误。pytesseract.pytesseract.TesseractError:(1,\'E... 查看详情

libiconv库的安装和使用

1.libiconv包的下载路径包的下载页面http://www.gnu.org/software/libiconv/ 2.编译安装libiconv库$tarzxvf libiconv-1.14.tar.gz$cd libiconv-1.14$./configure--prefix=/usr/local$make$makeinstall 查看详情

windowspython安装pytesseract(代码片段)

1.使用豆瓣源,再命令行安装pipinstallpytesseract-ihttps://pypi.douban.com/simple2.下载驱动到这个网站驱动下载下载这个安装即可然后进行安装就行了,就像安装QQ那样子安装就好了,不过一定要记住安装在哪里了!!我... 查看详情

pytesseract识别验证码(代码片段)

pytesseract识别验证码0.下载https://tesseract-ocr.github.io/tessdoc/Installation.html`1.安装选择添加Math和Chinese包安装完成后,配置环境变量,之前我安装1201版本的会报错,win1064位下会报这种错误:所以我选择20190623的安装... 查看详情

安装和使用无法通过 pip 或 tarball 发行版获得的 python 库的最佳实践

】安装和使用无法通过pip或tarball发行版获得的python库的最佳实践【英文标题】:Bestpracticesforinstallingandusingpythonlibrariesthatarenotavailablethroughpiportarballdistributions【发布时间】:2020-02-2305:30:06【问题描述】:安装VCS上可用但不作为pip... 查看详情

python中的数字识别(OpenCV和pytesseract)

】python中的数字识别(OpenCV和pytesseract)【英文标题】:Digitrecognitioninpython(OpenCVandpytesseract)【发布时间】:2020-01-2116:53:49【问题描述】:我目前正在尝试从小屏幕截图中检测数字。但是,我发现准确性很差。我一直在使用OpenCV,... 查看详情

使用 PIL 从 url 打开图像文件以使用 pytesseract 进行文本识别

】使用PIL从url打开图像文件以使用pytesseract进行文本识别【英文标题】:OpeningImagefilefromurlwithPILfortextrecognitionwithpytesseract【发布时间】:2017-09-1005:09:06【问题描述】:我在尝试下载图像并使用BytesIO打开它以便使用PIL和pytesseract从... 查看详情

当我使用 pytesseract 和 CREATE_NO_WINDOW 运行 tesseract 时如何隐藏控制台窗口

】当我使用pytesseract和CREATE_NO_WINDOW运行tesseract时如何隐藏控制台窗口【英文标题】:HowtohidetheconsolewindowwhenIruntesseractwithpytesseractwithCREATE_NO_WINDOW【发布时间】:2017-11-2716:14:41【问题描述】:我正在使用tesseract对屏幕抓图执行OCR。... 查看详情

1小程序vant_webapp组件库的安装步骤和简单使用

...所谓的npm包有如下的三个限制不能支持依赖于Node.js内置库的包因为小程序当中并没有**Node.js的环境,**例如有些npm的 查看详情

使用pytesseract+tesseract-ocr识别图片的简单步骤(代码片段)

1.首先安装Pytesseract,这个很简单,直接输入命令pipinstallpytesseract即可2.Tesseract-OCR https://pan.baidu.com/s/1sVYyKcPclZxWfFJDjy471g提取码:5ib2这个我也是在网上找到,可以直接下载使用下载好后去修改pytesseract.py中的内容如下图3.pycharm中... 查看详情

python•图片识别pytesseract快速识别提取图片中的文字(代码片段)

...配置环境1.安装python依赖本程序用到了两个python库,pytesseract和PIL,所以先来安装。运行以下命令pipinstallPillowpipinstallpytesseract如果在python中没有报错,说明程序安装成功,2.安装识别引擎安装完以上两个依赖还需要... 查看详情

使用pytesseract识别验证码,报错windowserror:[error2]

问题现象:按照网上的方式进行代码编写,使用pytesseract模块,然后导入指定图片进行解析,报错WindowsError:[Error2]  问题原因:源代码里面的路径设置错误,这里有一个坑,就是下载下来的源码需要配置 解决方法:源... 查看详情

如何使用 PyTesseract 去除图像噪声以改善结果?

】如何使用PyTesseract去除图像噪声以改善结果?【英文标题】:HowtogetridofimagenoiseforimprovingresultswithPyTesseract?【发布时间】:2020-09-0305:54:19【问题描述】:我正在尝试从视频的左上角获取文本“P1”和“P2”。P1P2我拍摄一帧并将它... 查看详情