在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]

     2023-03-16     168

关键词:

【中文标题】在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]【英文标题】:What software would you recommend for image enhancement prior to OCR (Optical Character Recognition)? [closed]在 OCR(光学字符识别)之前,您会推荐什么软件用于图像增强? [关闭] 【发布时间】:2010-09-13 15:39:57 【问题描述】:

我们目前正在研究在提交给 OCR 之前提高图像质量的方法。我们目前使用的 OCR 引擎是 Nuance (v15) 的 Scansoft API。我们正在研究Lead Tools,但后来决定寻找其他地方。与 Lead Tools 相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜、去斑点、去除线条、去除打孔、锐化等。我们正在运行 .NET 和 Java 软件的混合,但首选 Java 解决方案。

【问题讨论】:

【参考方案1】:

Kofax 非常适合进行预处理,但对于您所说的清理类型,可能会有些过头,除非图像真的很糟糕。除非您的专长是图像处理,否则我建议您与执行图像清理和 OCR 的提供商合作,这样您就可以专注于您实际增加的价值。

我们从 ABBYY (ABBY SDK) 获得了 OCR 开发套件的许可,发现它在图像处理和 OCR 方面都非常出色。 API 非常广泛,示例应用程序、帮助和支持令人印象深刻。我绝对建议您看看。

【讨论】:

【参考方案2】:

免责声明:我为 Atalasoft 工作

我们为 .NET 提供这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有 OCR 组件,包括用于 Abbyy、Tesseract 等的 .NET 包装器以及可搜索的 PDF 生成(PDF 中文本顶部的图像)

【讨论】:

【参考方案3】:

不确定这是否完全符合你们需要的标准,但也许您应该查看一些Paint.Net API。我不知道提取他们的图像处理算法以用于您的项目有多么容易,但我相信他们会做一些您正在寻找的事情。此外,它是一个具有 MIT 许可证的开源项目,因此对于商业用途应该非常友好。

【讨论】:

【参考方案4】:

在 KOFAX.com 上对 KOFAX VRS 的研究

【讨论】:

【参考方案5】:

也许是JMagick,它是ImageMagick 的一个开源Java 接口。它以薄 Java 本机接口 (JNI) 层的形式实现到 ImageMagick API。它是根据 LGPL 获得许可的,因此在许可方面应该不会有问题。

http://sourceforge.net/projects/jmagick/

【讨论】:

【参考方案6】:

我建议 Intel 使用它的零成本运行时许可。

【讨论】:

【参考方案7】:

取决于原始图像的数量和质量。托管代码和成像工具包可以工作,但如果您要处理数百万张图像,它并不总是最好的解决方案。对于小批量和紧张的预算,我同意以前的海报,即像 Aforge、Paint.NET 和其他开源计算机视觉库这样的项目可以解决问题。当然,如果结果没有改善,您就只能靠自己了……至少这可以让您以低成本将所需的一切都放在一个应用程序中。

如果您每月要处理数十万张图像,那么我建议您将流程划分为更小的工作流程步骤并调整每个步骤,直到您的每张图像成本尽可能接近于零。您会发现 OCR 结果一开始上升很快,然后比您预期的更快趋于平稳。 (我不是 OCR 的忠实粉丝,但它有它的位置)

我使用来自 Recogniform 的商业 Windows 产品,使用针对各种图像调整的脚本以批处理模式在 OCR 之前处理和清理图像。如果图像未通过 QC 或被 OCR 引擎拒绝,则会使用使用 Atalasoft 的 工具包构建的自定义 .NET 应用程序手动“修复”它。批处理一切,只触及失败的部分。

【讨论】:

ocr(opticalcharacterrecognition,光学字符识别)

OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光... 查看详情

光学字符识别技术

...一下——OCR识别,OCR(OpticalCharacterRecognition),中文名叫光学字符识别。如今的它应该在技术领域上那是小有名气了,毕竟它可是实用型技术的代表,技术融入生活最快最好的方式那就是利用与商业化。如何通过识别软件将图像... 查看详情

ocr技术(光学字符识别)

什么是OCR?OCR英文全称是opticalcharacterrecognition,中文叫光学字符识别。它是利用光学技术和计算机技术把印在或者写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域... 查看详情

labviewocr实现车牌识别

...f1a;LabVIEW目标对象分类识别(理论篇—5)OCR(光学字符识别)是指机器自动从图像中识别文本字符的过程,OCR机器视觉系统可用于对被测件的识别和分类。常见的识别应用包括:药品包装标签识别、IC芯片... 查看详情

移动端车牌识别,ocr光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术。在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果——"文字图像识别技术TH-OCR"产业化,... 查看详情

ocr识别要依赖于深度学习的进展吗?

这些年深度学习的出现,让光学字符识别(OCR)技术焕发第二春。现在光学字符识别(OCR)基本都用卷积神经网络来做了,而且识别率也是惊人的好,人们也不再需要花大量时间去设计字符特征了。在光学字符识别(OCR)系统中... 查看详情

ocr文本识别软件提示说无法对该语言执行ocr,请将您的ocr语言设置更改为可用的ocr语言是啥问题?

...T7gcPlPh9D6pw提取码:0tpy  OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;... 查看详情

非黑即白--谷歌ocr光学字符识别

#非黑即白--谷歌OCR光学字符识别颜色的世界里,非黑即白。computer表示深信不疑。今天研究一下前沿技术OCR光学识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract。能让机器识别图片是无数工程师梦寐以求的事任何物... 查看详情

Android OCR(光学字符识别)[重复]

】AndroidOCR(光学字符识别)[重复]【英文标题】:AndroidOCR(OpticalCharacterRecognization)[duplicate]【发布时间】:2011-10-3008:25:27【问题描述】:我想开发一个从图像中读取文本的应用程序。我应该使用哪个库?【问题讨论】:开始使用co... 查看详情

python,opencv中的光学字符识别(ocropticalcharacterrecognition)

Python,OpenCV中的光学字符识别(OCROpticalCharacterRecognition1.什么是OCR?2.光学字符识别简史3.光学字符识别的应用4.OSD方向和脚本检测5.前处理和后处理的重要性6.OCR工具和API参考这篇博客将介绍什么是光学字符识别OCR࿰... 查看详情

如何识别作为光学字符识别 (OCR) 输出的文本中的实体?

】如何识别作为光学字符识别(OCR)输出的文本中的实体?【英文标题】:Howtorecognizeentitiesintextthatistheoutputofopticalcharacterrecognition(OCR)?【发布时间】:2019-07-2420:51:28【问题描述】:我正在尝试使用文本数据进行多类分类。我面临的... 查看详情

ocr简介及使用

OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光... 查看详情

请问用啥方法单独安装modi(不重新安装office2003),来调用modi的ocr引擎的啊?0分

...T7gcPlPh9D6pw提取码:0tpy  OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;... 查看详情

推荐一款强大的ocr工具

...github.com/hiroi-sora/Umi-OCROCR(OpticalCharacterRecognition,光学字符识别)是指使用光学识别技术将纸质文档中的文字、数字等信息转换为电子文本的过程。Umi-OCR是一款基于深度学习的OCR工具,它的主要特点是准确度高、... 查看详情

是否有任何 Watson 或 Bluemix API 能够与 OCR(光学字符识别)一起使用? [关闭]

】是否有任何Watson或BluemixAPI能够与OCR(光学字符识别)一起使用?[关闭]【英文标题】:IsthereanyWatsonorBluemixAPItobeabletoworkwithOCR(OpticalCharacterRecognition)?[closed]【发布时间】:2017-03-1718:13:30【问题描述】:是否有任何Watson或BluemixAPI... 查看详情

android图片文字识别demo(基于百度ocr)

前言  OCR是OpticalCharacterRecognition的缩写,翻译为光学字符识别,指的是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,通过识别软件将图像中的文字转换成文本格式,供文字处理软件... 查看详情

推荐OCR软件面对这个识别案例[关闭]

】推荐OCR软件面对这个识别案例[关闭]【英文标题】:RecommendationofOCRsoftwaretofacethisrecognitioncase[closed]【发布时间】:2019-11-1007:50:28【问题描述】:我必须像这样识别图片中的文字:Imagetorecognise我尝试过Tesseract,但我对结果不是很... 查看详情

[译]opencv的基础光学字符识别(basicocrinopencv)(代码片段)

...sic-ocr-in-opencv/在这个教程当中我们将完成一个基础的数字光学字符识别。这包括把一个手写的数字分类进它所属的类里。为了完成它,们我将要使用我们之前的教程里所有学到的东西,我们将要使用简单的basicpainter和theba... 查看详情