tesseract-ocr-03-图片文字识别

xpwi xpwi     2022-12-29     492

关键词:

Tesseract-OCR-03-图片文字识别

本篇介绍使用 Tesseract-OCR 做图片文字识别,识别手写文字的时候,正确率能达到 90%,当训练后正确率是极高的。这里介绍的图片文字识别,可以识别英文,数字和中文等

Tesseract-OCR 图片文字识别

  • Tesseract:一款由HP实验室开发由Google维护的开源OCR,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎
  • 如果还没有安装 Tesseract-OCR 请参考:
  • 当然配置环境也都下载上面那篇文章了,一步一图很详细

正题 图片文字识别

  • 我搜集了几个素材,懒得找可以直接下载:
  • https://pan.baidu.com/s/10XxYJa19KIa8-ENdQkhhHg
    技术分享图片
  • 这里我是将图片放在了:D:p
  • 我们需要在 cmd 进入此目录
    • 使用 cd 目录名 进入目录
    • 使用 cd.. 返回上一级目录
  • 使用 Tesseract 命令:
    tesseract 文件名 保存的txt文件名 -l eng 例:

    tesseract num1.jpg num1

  • 这里 -l eng 是设置语言,不写的话,默认是 eng 也就是英语
    技术分享图片
  • 结果:
    技术分享图片
  • 注意:

识别手写英文

  • 识别图片 eng2.jpg
    技术分享图片
  • 输入命令:保存为 eng2.txt
    技术分享图片
  • 我们对比一下结果:
    技术分享图片
  • 这里是识别错了一个字母,把 ig 错误的识别成 S,包括上面那张 数字也是错了一个
  • 那也就是我们要努力的方向了

识别中文

  • 这里识别中文只需要将 -l 参数改成 chi_sim 例如:
  • 对 有中文文字的图片 chi1.jpg ,进入图片路径,使用一下命令:

    tesseract chi1.jpg chi1 -l chi_sim

  • 图片样式:
    技术分享图片
  • 执行命令:
    技术分享图片
  • 运行结果:
    技术分享图片

识别英文和数字夹杂验证码

  • 例如:
  • 对 图片 timg.jpg ,进入图片路径,使用一下命令:

    tesseract timg.jpg timg

  • 图片样式:
    技术分享图片
  • 执行命令:
    技术分享图片
  • 运行结果:
    技术分享图片

Tesseract 训练:

  • 我们可以通过重复的训练,用更多的数据去训练,就可以达到更多高的识别正确率
  • 我们使用 jTessBoxEditor 训练
  • 由于 jTessBoxEditor 的安装和训练,内容比较多,我再整理一篇

更多文章链接:Tesseract 随笔


  • 本笔记不允许任何个人和组织转载

怎么在迅捷ocr文字识别软件中将图片文字识别出来

工作中我们经常会遇到从图片中识别文字的问题,如果我们一个字一个字打出来,太浪费时间了,这时候就需要使用借助到文字识别软件来帮助实现图片文字识别的问题了,具体要怎样去操作呢?一起来看看下面的方法。  解... 查看详情

怎样做才能实现图片转文字

无论是在生活中,还是在工作中,面对图片文字我们最好的办法就是进行图片转文字,学会了图片转文字这个方法,可以在图片上节约很多的时间,方法也有好与坏,下面小编分享一个简单、识别效果不错的图片转文字方法。使... 查看详情

在迅捷ocr文字识别软件中怎么进行图片局部识别

怎么进行图片局部识别呢?我们在观看一些图片的时候,有些图片上的文字我们会需要将局部文字识别提取出来,但是如何去识别呢,借助图片文字识别软件就可以帮助实现了,下面为大家讲解下具体的操作方法。  使用工具... 查看详情

快速实现图片文字识别的步骤

进行图片文字识别,相信大家都知道,在工作中我们经常会收到上级给我们的文件,其中肯定是有图片文件的,面对整理图片信息大家的方法是什么呢?下面小编就给大家介绍一个简单图片文字识别的步骤,以后再实现图片文字... 查看详情

图片识别文字(批量图片文字查找分类)

SuperOcr是一款AI识别图片文件中的文本内容。它可以:(1)单图文字识别快速复制文字(2)批量图片进行文字内容检索查找(3)批量图片根据关键词查找分类下载地址:https://pan.baidu.com/s/1JiaeejWvRWZPoDmA5Werwg?pwd=8888 (1)功能1:... 查看详情

如何快速识别提取图片上的文字

我们在日常工作中,我们经常会遇到将图片上文字转换成Word文档这样的情况,要知道,图片上的文字是不能直接复制的,这是一件令人头疼的一件事情。那么要怎样才能快速的提取这些图片的文字呢?快速识别提取图片上的的... 查看详情

[c13]应用实例:图片文字识别(待整理)

十八、应用实例:图片文字识别(ApplicationExample:PhotoOCR)18.1问题描述和流程图参考视频:18-1-ProblemDescriptionandPipeline(7min).mkv图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。... 查看详情

图片提取文字图片识别

这几天研究了下ORC文字识别,大概了解了三种识别方式:1、通过微软的控件调用MicrosoftOfficeDocumentImaging。2、是通过AspriseOCR调用3、是TesseractORC 微软组件:安装  https://www.cnblogs.com/beautylan/p/4173713.html调用 https://www.cnblogs.... 查看详情

图片识别文字软件该怎么使用

有时候要将图片上的文字识别出来,导出文档形式,那么怎么使用软件进行识别呢?图片文字识别软件,操作起来很方便,下面我就给你分享一下我的使用方法吧:我们首先打开图片文字识别软件。点击上面的【快速识别】功能... 查看详情

怎么把图片字体识别?

用软件可以将图片的字体识别。现在很多的图片上面都有文字,或是名言警句,或是一段美文等等,有时候我们只想要图片上的文字,就可以使用一些转换器去提取文字。迅捷文字识别是一款OCR文字识别软件,支持全能扫描拍照... 查看详情

电脑图片转文字无法识别怎么回事

...考技术A非文本方式如果这样的话,表明你的PDF是扫描或图片生成,其中的文字是图片方式而非文本方式,一般的转换软件无法识别图片中的文字,所以转换成word后没有文字了。只有借助OCR(光学字符识别)技术才能将非文本格... 查看详情

如何通过迅捷ocr文字识别软件精准识别图片中的文字

怎样精准的将图片中的文字识别出来呢?相信这是很多人的烦恼,因为我们经常会遇到文字识别的时候,使用到的方法也有很多,但是很多方法识别出来的效果不是很好,需要对比着原图去改正,这就很令人烦恼了。下面小编将... 查看详情

识别jpg图片转文字的教程

如何识别JPG图片转文字呢?相信很多人跟小编一样电脑中都保存了一些带有文字的图片,其中就有JPG格式的图片,如果想将其识别出来转文字的话我们应该怎样去操作呢?下面小编就来为大家简单讲解下具体的操作方法。  辅... 查看详情

图片转文字的巧妙方法

...地变成了可能,甚至是实现了那种不可能的事情。比如说图片转文字,在早些年都是使用打字的方法把图片上的文字输入到电脑中,现在都是使用工具来帮助我们解决,不可思议吧,下面小编就分享一个方法可以帮助我们轻松搞... 查看详情

图片识别文字翻译的方法

是不是也有人跟小编一样,经常需要的不仅是识别图片文件,往往还需要将识别的结果翻译成英语,那这该怎么做呢?今天就和大家分享一个最近在发现的乐意拍照识别图片文字还可以能翻译的工具。工具:迅捷文字识别拍照识... 查看详情

pythoneasyocr图片文字识别

✅作者简介:热爱科研的算法开发者,Python、Matlab项目可交流、沟通、学习。 查看详情

职场进行图片文字识别的方法?

在职场中很多公司都需要打字员,安排他们去整理一些图片上的文字,或者是有关于打字工作。在以前很多打字员也是很好找工作的,但是现在不行了,因为在网上出现了一个可以识别文字的OCR文字识别软件,可以轻松的帮助我... 查看详情

如何在迅捷ocr文字识别软件中进行图片局部识别

...信很多朋友都知道OCR文字识别,通过OCR识别可以快速的将图片文件中的文字识别出来转换成文字格式,那如果是图片局部识别的话又该如何去操作呢,下面就来为大家讲解一下。  使用工具:迅捷OCR文字识别软件。  第一步... 查看详情