如何识别作为光学字符识别 (OCR) 输出的文本中的实体?

     2023-02-16     305

关键词:

【中文标题】如何识别作为光学字符识别 (OCR) 输出的文本中的实体?【英文标题】:How to recognize entities in text that is the output of optical character recognition (OCR)? 【发布时间】:2019-07-24 20:51:28 【问题描述】:

我正在尝试使用文本数据进行多类分类。我面临的问题是我有非结构化的文本数据。我会用一个例子来解释这个问题。 以这张图片为例:

我想提取和分类图像中给出的文本信息。问题是当我提取信息时,OCR 引擎会给出如下输出:

18
EURO 46
KEEP AWAY
FROM FIRE
MADE IN CHINA
2226249917581
7412501
DOROTHY
PERKINS

现在这里的目标类是:

18 -> size
EURO 46 -> price
KEEP AWAY FROM FIRE -> usage_instructions
MADE IN CHINA -> manufacturing_location
2226249917581 -> product_id
7412501 -> style_id
DOROTHY PERKINS -> brand_name

我面临的问题是输入文本不可分离,这​​意味着“多行可以属于同一个类”,并且可能存在“单行可以有多个类”的情况。

所以我不知道如何在将行传递给分类模型之前拆分/合并行。有什么方法可以使用 NLP 我可以根据目标类拆分段落。换句话说,给定的输入段落会根据目标标签对其进行拆分。

【问题讨论】:

【参考方案1】:

如果只考虑文本,这是一个命名实体识别 (NER) 任务。

你可以做的是train a Spacy model to NER for your particular problem。

这是您需要做的:

    首先收集训练文本数据列表 用相应的实体类型标记数据 将数据拆分为训练集和测试集 使用训练集通过 Spacy NER 训练模型 使用测试集对模型进行评分 ... 利润!

见Spacy documentation on training specific NER models

祝你好运!

【讨论】:

对达到良好准确度 (>80%) 所需的训练数据量有任何想法吗?

光学字符识别技术

...表,技术融入生活最快最好的方式那就是利用与商业化。如何通过识别软件将图像中的信息提取或文字转换文本格式,或者解决除错和利用辅助信息提高识别的正确率,是OCR识别的最重要课题。下面就来详细了解一下OCR识别技 查看详情

用于屏幕文本的 OCR(光学字符识别)

】用于屏幕文本的OCR(光学字符识别)【英文标题】:OCR(OpticalCharacterRecognition)foron-screentext【发布时间】:2010-10-2803:05:50【问题描述】:我正在尝试创建一个软件,通过捕获屏幕截图来自动化PC,然后OCR(光学字符识别)它会寻... 查看详情

ocr(opticalcharacterrecognition,光学字符识别)

...换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高 查看详情

Android OCR(光学字符识别)[重复]

】AndroidOCR(光学字符识别)[重复]【英文标题】:AndroidOCR(OpticalCharacterRecognization)[duplicate]【发布时间】:2011-10-3008:25:27【问题描述】:我想开发一个从图像中读取文本的应用程序。我应该使用哪个库?【问题讨论】:开始使用co... 查看详情

ocr技术(光学字符识别)

...OCR?OCR英文全称是opticalcharacterrecognition,中文叫光学字符识别。它是利用光学技术和计算机技术把印在或者写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支... 查看详情

非黑即白--谷歌ocr光学字符识别

#非黑即白--谷歌OCR光学字符识别颜色的世界里,非黑即白。computer表示深信不疑。今天研究一下前沿技术OCR光学识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract。能让机器识别图片是无数工程师梦寐以求的事任何物... 查看详情

移动端车牌识别,ocr光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术。在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果——"文字图像识别技术TH-OCR"产业化,... 查看详情

python,opencv中的光学字符识别(ocropticalcharacterrecognition)

Python,OpenCV中的光学字符识别(OCROpticalCharacterRecognition1.什么是OCR?2.光学字符识别简史3.光学字符识别的应用4.OSD方向和脚本检测5.前处理和后处理的重要性6.OCR工具和API参考这篇博客将介绍什么是光学字符识别OCR࿰... 查看详情

android图片文字识别demo(基于百度ocr)

...sp; OCR是OpticalCharacterRecognition的缩写,翻译为光学字符识别,指的是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步... 查看详情

光学字符识别。使用tesseract识别里程表

】光学字符识别。使用tesseract识别里程表【英文标题】:OCR.Usingtesseracttorecognizeodometer【发布时间】:2016-08-0903:21:56【问题描述】:我想识别里程表中的数字。我找到了适用于iOS的本教程。https://www.raywenderlich.com/93276/implementing-tess... 查看详情

开发函数计算的正确姿势——ocr服务(代码片段)

...介绍下在本文出现的几个比较重要的概念:OCR(光学字符识别):光学字符识别(OpticalCharacterRecognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形... 查看详情

光学字符识别中的表示是啥?

】光学字符识别中的表示是啥?【英文标题】:Whatisrepresentationinopticalcharacterrecognition?光学字符识别中的表示是什么?【发布时间】:2017-11-0720:48:05【问题描述】:我正在学习OCR并正在阅读这本书https://www.amazon.com/Character-Recognitio... 查看详情

光学字符识别多行检测

】光学字符识别多行检测【英文标题】:OpticalCharacterRecognitionMultipleLineDetection【发布时间】:2019-05-2412:40:50【问题描述】:我正在构建OCR。为此,我使用CNN、RNN和CTC损失函数。我的输入层获取图像,输出层预测该图像上写入的内... 查看详情

在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]

】在OCR(光学字符识别)之前,您会推荐啥软件用于图像增强?[关闭]【英文标题】:WhatsoftwarewouldyourecommendforimageenhancementpriortoOCR(OpticalCharacterRecognition)?[closed]在OCR(光学字符识别)之前,您会推荐什么软件用于图像增强?[关闭... 查看详情

ocr简介及使用

...换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高 查看详情

使用 java 时,Sikuli 中的文本识别 (OCR) 已关闭

...一直把它作为输出Region.text:文本识别当前已关闭我无论如何都找不到在java中打开此功能。【问题讨论】:b 查看详情

如何使用光学字符识别解析数字 4

】如何使用光学字符识别解析数字4【英文标题】:Howtoparsethenumber4usingopticalcharacterrecognition【发布时间】:2013-09-2600:48:25【问题描述】:我正在研究一种OCR算法,该算法给出了一个包含一些数字的图像。我希望它能够简单地检测... 查看详情

ocr文字识别(初识)

一、OCR的概念:光学字符识别OCR(OpticalCharacterRecognition):定位与识别图片中的所有文字信息,返回文字框位置与文字内容。即对文本资料和图像文件进行分析识别处理,获取文字及版面信息的过程。二、... 查看详情