光学字符识别。使用tesseract识别里程表

     2023-04-17     69

关键词:

【中文标题】光学字符识别。使用tesseract识别里程表【英文标题】:OCR. Using tesseract to recognize odometer 【发布时间】:2016-08-09 03:21:56 【问题描述】:

我想识别里程表中的数字。我找到了适用于 iOS 的本教程。 https://www.raywenderlich.com/93276/implementing-tesseract-ocr-ios

我的 tesseract 属性:

func performImageRecognition(image: UIImage) 

    let tesseract = G8Tesseract()
    tesseract.language = "eng"
    tesseract.engineMode = .TesseractCubeCombined
    tesseract.pageSegmentationMode = .Auto
    tesseract.maximumRecognitionTime = 60.0
    tesseract.setVariableValue("0123456789", forKey: "tessedit_char_whitelist")
    tesseract.image = image.g8_blackAndWhite()
    tesseract.recognize()
  

应用成功识别标准文本。 但应用程序无法识别里程表中的数字。 是否可以调整 tesseract 来扫描里程表?

我试过这些图片:

【问题讨论】:

【参考方案1】:

如果我是你,我会尝试从里程表图像中剪下数字,拉直它们,做阈值(一切手动),看看 tesseract 是否正确扫描处理后的图像,结果有多清晰。 如果它确实正确扫描,您应该使用算法以编程方式处理图像(使用 openCV 可能是最好的)。如果它没有,您应该尝试为这些数字训练您的 tesseract,这在里程表上很常见,然后看看 tesseract 是如何工作的(我没有尝试过亲自训练,也许this 会有所帮助)。

您的图像应该看起来像这样,但问题是,例如,最后一个数字肯定不会被识别为 1,即使您将 tesseract 字符白名单减少到“0123456789”,它也会被扫描为 1和 1(因为有两个部分)。如果您想使用 tesseract,我认为在您的情况下必须进行 tesseract 培训。顺便说一句,你前两张图片的情况应该会更好。

【讨论】:

【参考方案2】:

OCR for Seven-segment display numbers in objective C.

【讨论】:

非黑即白--谷歌ocr光学字符识别

...识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract。能让机器识别图片是无数工程师梦寐以求的事任何物体只有成功转为二进制才有可能被机器识别,而识别是做出一系列智能行为的前提下面以一张验证码为例梳理... 查看详情

tesseract-ocr安装中文识别与训练字库

...,然后用字符识别方法将形状翻译成计算机文字的过程。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后由Google进行改进、修改bug、优化,重新发布。下载1、Wind 查看详情

OCR - 如何使用 python 识别方框内的数字?

...当数字位于方框内时,它无法正确识别数字。此处讨论了tesseract的一个失败示例:Tesseract-HowcanIrecognizenumbersinbox?我在这里 查看详情

Tesseract 无法识别单个字符

】Tesseract无法识别单个字符【英文标题】:Tesseractdoesnotrecognizesinglecharacters【发布时间】:2012-03-2618:50:32【问题描述】:如何表示:使用油漆创建新图像(任何尺寸)在此图片中添加字母A尝试识别->tesseract找不到任何字母将此... 查看详情

使用 tesseract 进行字符识别

】使用tesseract进行字符识别【英文标题】:CharacterRecognitionusingtesseract【发布时间】:2014-01-0907:30:15【问题描述】:我正在尝试与tesseractAPI进行交互,我也是图像处理的新手,最近几天我一直在努力解决这个问题。我尝试过简单... 查看详情

Tesseract 无法识别随机英文字符序列

】Tesseract无法识别随机英文字符序列【英文标题】:TesseractfailstorecognizeasequenceofrandomEnglishcharacters【发布时间】:2019-12-0406:59:17【问题描述】:我正在寻找一些帮助来配置Tesseract以识别以下图像(称为token.png)中的字符:使用默... 查看详情

如何使用光学字符识别解析数字 4

】如何使用光学字符识别解析数字4【英文标题】:Howtoparsethenumber4usingopticalcharacterrecognition【发布时间】:2013-09-2600:48:25【问题描述】:我正在研究一种OCR算法,该算法给出了一个包含一些数字的图像。我希望它能够简单地检测... 查看详情

tesserocr的安装

... 图1-23验证码tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层PythonAPI封装,所以它的核心是tesseract。因此,在安装tesserocr之前,我们需要先安装tesseract。2.相关链接tesserocrGitHub:https://github.com/sirfz/tesserocr tesserocrPyPI:h... 查看详情

使用 Tesseract-OCR 获取已识别字符的字体

】使用Tesseract-OCR获取已识别字符的字体【英文标题】:GetfontofrecognizedcharacterwithTesseract-OCR【发布时间】:2013-03-1817:23:15【问题描述】:是否可以,即它们是Arial还是TimesNewRoman,无论是从命令行还是使用API。我正在扫描可能有不... 查看详情

Android OCR(光学字符识别)[重复]

】AndroidOCR(光学字符识别)[重复]【英文标题】:AndroidOCR(OpticalCharacterRecognization)[duplicate]【发布时间】:2011-10-3008:25:27【问题描述】:我想开发一个从图像中读取文本的应用程序。我应该使用哪个库?【问题讨论】:开始使用co... 查看详情

使用 Tesseract OCR 进行汉字识别

】使用TesseractOCR进行汉字识别【英文标题】:chinesecharacterrecognitionusingTesseractOCR【发布时间】:2013-05-1100:05:00【问题描述】:我一直在使用Tesseract3.0.2OCRSDK进行图像文本提取。但是,如果我使用中文文本图像并通过OCR,则Tesseract... 查看详情

在进行字符识别之前使用 OpenCV 进行图像预处理(tesseract)

】在进行字符识别之前使用OpenCV进行图像预处理(tesseract)【英文标题】:ImagepreprocessingwithOpenCVbeforedoingcharacterrecognition(tesseract)【发布时间】:2016-09-1502:05:08【问题描述】:我正在尝试开发用于车牌识别的简单PC应用程序(Java+Ope... 查看详情

带有 OpenCV 的光学字符识别 Android

】带有OpenCV的光学字符识别Android【英文标题】:OpticalCharacterRecognitionAndroidwithOpenCV【发布时间】:2012-03-1308:13:55【问题描述】:我目前正在从事一个项目,该项目涉及Android中的光学字符识别,确实需要一些在该领域有经验的人... 查看详情

tesseract-ocr+java实现图片文字识别(代码片段)

...资料的图片进行识别,获取文本信息的技术。  目前tesseract-ocr这个工具可以很方便的在Windows、Linux、Mac下安装。  windows下的安装链接:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.0.1.20220118.exe  这个工具安装... 查看详情

是否可以使用 Tesseract OCR 识别 iPhone 屏幕上绘制的字符?

】是否可以使用TesseractOCR识别iPhone屏幕上绘制的字符?【英文标题】:IsitpossibletoRecognizetheCharacterdrawnoniPhonescreenusingTesseractOCR?【发布时间】:2014-01-0713:35:52【问题描述】:从过去2周开始,我正在尝试实现“识别iPhone屏幕上绘制... 查看详情

移动端车牌识别,ocr光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术。在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果——"文字图像识别技术TH-OCR"产业化,... 查看详情

光学字符识别多行检测

】光学字符识别多行检测【英文标题】:OpticalCharacterRecognitionMultipleLineDetection【发布时间】:2019-05-2412:40:50【问题描述】:我正在构建OCR。为此,我使用CNN、RNN和CTC损失函数。我的输入层获取图像,输出层预测该图像上写入的内... 查看详情

pytesseract——验证码的识别——pil库的介绍

1、简介Python-tesseract是一款用于光学字符识别(OCR)的python工具,即从图片中识别出其中嵌入的文字。Python-tesseract是对GoogleTesseract-OCR的一层封装。它也同时可以单独作为对tesseract引擎的调用脚本,支持使用PIL库(PythonImagingLibrary... 查看详情