用于屏幕文本的 OCR(光学字符识别)

     2023-04-17     109

关键词:

【中文标题】用于屏幕文本的 OCR(光学字符识别)【英文标题】:OCR (Optical Character Recognition) for on-screen text 【发布时间】:2010-10-28 03:05:50 【问题描述】:

我正在尝试创建一个软件,通过捕获屏幕截图来自动化 PC,然后 OCR(光学字符识别)它会寻找一个特定的按钮来点击(例如)。我有鼠标和键盘控制部分,但现在,我需要一个 OCR 来处理屏幕截图。我发现 Tesseract OCR 似乎不能很好地处理屏幕上的文本。文本太小,或者某些文本似乎是连接的,例如 K 和 X。我应该如何处理?

p/s:这是一个自动化测试程序。

【问题讨论】:

你能在测试机器上增加文本大小并调整字体吗? 你到底想测试什么?如果它是一个简单的测试程序,您可以使用 SendMessage 和 GetWndText 查询 Windows 以搜索您喜欢的按钮和控件。为什么要忙于 OCR? 我可以调大文本大小,但是应用程序内部的某些字体如果不修改代码就无法调大。 【参考方案1】:

我不确定这是否真的适合您,但我在自动化领域看到的一些更好的 OCR 是由 Tevron 的 CitraTest 完成的。它包含一个字体库,如果字体集不存在,他们将根据您提交的内容创建一个新字体。此工具的不利因素是成本以及与可变屏幕分辨率相关的常见问题。

【讨论】:

【参考方案2】:

也许在 OCR 之前查看 this question 上的图像增强。 否则这个问题与"OCR for .NET" 非常相似。

如果您真的很大胆,您可以随时提出一个简单的基于感知器或神经网络的方法 :-)

【讨论】:

在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]

】在OCR(光学字符识别)之前,您会推荐啥软件用于图像增强?[关闭]【英文标题】:WhatsoftwarewouldyourecommendforimageenhancementpriortoOCR(OpticalCharacterRecognition)?[closed]在OCR(光学字符识别)之前,您会推荐什么软件用于图像增强?[关闭... 查看详情

光学字符识别技术

...业化。如何通过识别软件将图像中的信息提取或文字转换文本格式,或者解决除错和利用辅助信息提高识别的正确率,是OCR识别的最重要课题。下面就来详细了解一下OCR识别技 查看详情

Android OCR(光学字符识别)[重复]

...2011-10-3008:25:27【问题描述】:我想开发一个从图像中读取文本的应用程序。我应该使用哪个库?【问题讨论】:开始使用coderanch.com/t/506270/Streams/java/read-text-image-file【参考方案1】:go 查看详情

ocr技术(光学字符识别)

什么是OCR?OCR英文全称是opticalcharacterrecognition,中文叫光学字符识别。它是利用光学技术和计算机技术把印在或者写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域... 查看详情

ocr(opticalcharacterrecognition,光学字符识别)

OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光... 查看详情

ocr识别要依赖于深度学习的进展吗?

...并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。1)建立中文资料库要大量输入各种文书、刊、报及文件,使用光学字符识别(OCR)可以缩短建库时间,减轻劳动强度,降低费用。2)办公... 查看详情

移动端车牌识别,ocr光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术。在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果——"文字图像识别技术TH-OCR"产业化,... 查看详情

非黑即白--谷歌ocr光学字符识别

#非黑即白--谷歌OCR光学字符识别颜色的世界里,非黑即白。computer表示深信不疑。今天研究一下前沿技术OCR光学识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract。能让机器识别图片是无数工程师梦寐以求的事任何物... 查看详情

python,opencv中的光学字符识别(ocropticalcharacterrecognition)

Python,OpenCV中的光学字符识别(OCROpticalCharacterRecognition1.什么是OCR?2.光学字符识别简史3.光学字符识别的应用4.OSD方向和脚本检测5.前处理和后处理的重要性6.OCR工具和API参考这篇博客将介绍什么是光学字符识别OCR࿰... 查看详情

开发函数计算的正确姿势——ocr服务(代码片段)

...符识别):光学字符识别(OpticalCharacterRecognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。Tesserocr:Tesserocr是python的一个OCR识别库,但其... 查看详情

android图片文字识别demo(基于百度ocr)

...白点阵的图像文件,通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术(好吧,这是我查来的)。简单的来说,OCR技术就是可以把图片上的文字识别出来,并以文本格式的形式提取出来。 ... 查看详情

labviewocr实现车牌识别

...动从图像中识别文本字符的过程,OCR机器视觉系统可用于对被测件的识别和分类。常见的识别应用包括:药品包装标签识别、IC芯片编码读取、冲压 查看详情

光学字符识别。使用tesseract识别里程表

】光学字符识别。使用tesseract识别里程表【英文标题】:OCR.Usingtesseracttorecognizeodometer【发布时间】:2016-08-0903:21:56【问题描述】:我想识别里程表中的数字。我找到了适用于iOS的本教程。https://www.raywenderlich.com/93276/implementing-tess... 查看详情

andrewng-ml-第十九章-应用举例:照片ocr(光学字符识别)

1.问题描述与OCRpipeline 图1.图像文字识别流水线 首先是输入图片-》进行文字检测-》字符分割-》字符识别。 这些阶段分别需要1-5人这样子。 2.滑动窗口主要讲滑动窗口分类器。图2.滑动窗口检测 对于行人检测... 查看详情

ocr技术系列之一字符识别技术总览

...什么是OCR?OCR英文全称是OpticalCharacterRecognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识 查看详情

光学字符识别

...:大家好,我正在尝试用Java创建一个程序,它可以读取屏幕的数字,也可以识别屏幕上的图像。我想知道我怎么能做到这一点?数字的字体将始终相同。我以前从未编写过这样的程序,但我对它的工作原理的想法是让程序截取... 查看详情

是否有任何 Watson 或 Bluemix API 能够与 OCR(光学字符识别)一起使用? [关闭]

】是否有任何Watson或BluemixAPI能够与OCR(光学字符识别)一起使用?[关闭]【英文标题】:IsthereanyWatsonorBluemixAPItobeabletoworkwithOCR(OpticalCharacterRecognition)?[closed]【发布时间】:2017-03-1718:13:30【问题描述】:是否有任何Watson或BluemixAPI... 查看详情

专为屏幕阅读而设计的 OCR 引擎

...【发布时间】:2011-03-2116:14:06【问题描述】:是否有任何用于识别屏幕捕获的图像中的文本而不是扫描文本的OCR发动机?我有一个项目,我需要在应用程序中检索和识别文本,但到目前为止我尝试过的所有OCR引擎都不能很好地处... 查看详情