从图片提取文字的终极解决方法——通用文字识别api(代码片段)

海碗吃饭 海碗吃饭     2023-04-02     310

关键词:

写在前面

相信你用过类似对进行图片中的文字提取的功能,但是你了解过背后的原理吗?

本文将从图片中文字提取的原理以及应用案例等多方面进行讲述,希望一文能为你讲透通用文字识别。

通用文字识别是什么技术

随着信息化和数字化的发展,大量的文字信息产生和传播,这些信息需要被整理和分析。通用文字识别技术,也称为OCR(Optical Character Recognition,光学字符识别),就是一种将图像或扫描件中的文字识别出来并转化为可编辑、可搜索的数字化文本的技术。

通用文字识别的技术原理

OCR技术 的主要原理是将图片或扫描件转化为二值图像,然后利用图像处理算法对图像进行预处理,如去噪、二值化、分割、特征提取等操作。接下来,利用模式匹配和机器学习等方法对文字进行识别,并输出识别结果。OCR技术的精度和速度取决于预处理、识别算法的复杂度和识别引擎的性能等因素。

挖掘通用文字识别的应用场景

通用文字识别可以应用在多种场景,用得好能帮助用户解决很多痛点问题,如在以下领域上,通用文字识别技术能提供非常大的帮助,包括:

  • 文字识别和翻译:识别图片中的文字,并将其翻译成其他语言。
  • 金融服务:识别和处理客户的身份证、银行卡、票据等文档。
  • 教育教学:数字化教材、试卷和笔记。
  • 医疗健康:识别和转换医学报告、病历和处方等文档。
  • 商业营销:识别广告宣传物料上的文字。
  • 社交娱乐:识别和处理用户上传的图片和视频。
  • 人工智能辅助:收集大量的文本数据,进行训练和算法优化。

通用文字识别 API 使用方法

讲透通用文字识别技术之后,如何找到并将这项技术应用在自己的应用里面呢。在这里推荐 APISpace 的 【通用文字识别】 API ,它支持多场景、多语种、高精度的整图文字检测和识别服务,多项指标行业领先,可识别中、英、日、韩、法、德多种语言。

具体使用方式如下:

1.注册并获取通用文字识别 API 密钥

进入 【通用文字识别 API】详情页,点击【免费试用】,即可唤起注册按钮。

注册成功后,我们在页面导航菜单点击 【我的 API】进入 【访问控制】页面,即可看到平台提供的密钥。

2.在线测试调用 API 进行文字识别

回到 【通用文字识别 API】详情页,再次点击【免费试用】,我们可以在获得一定次数的免费调用权限,并且进入测试界面。

在测试界面中,根据 API 接口文档中的要求,输入图片地址

如我们输入

API 返回的识别结果如下:

    "words_result": [
        "word": "桃花历乱李花香",
        "location": [
            [978, 218],
            [1046, 218],
            [1046, 810],
            [978, 810]
        ]
    , 
        "word": "草色青青柳色黄",
        "location": [
            [1088, 211],
            [1156, 210],
            [1160, 810],
            [1092, 810]
        ]
    , 
        "word": "春日偏能惹恨长",
        "location": [
            [748, 219],
            [816, 218],
            [822, 810],
            [754, 810]
        ]
    , 
        "word": "东风不为吹愁去",
        "location": [
            [862, 219],
            [930, 218],
            [932, 806],
            [864, 806]
        ]
    , 
        "word": "春思",
        "location": [
            [1238, 218],
            [1332, 218],
            [1332, 447],
            [1238, 447]
        ]
    , 
        "word": "贾至",
        "location": [
            [624, 697],
            [666, 697],
            [666, 806],
            [624, 806]
        ]
    ],
    "words_count": 6,
    "log_id": "1e165580-cde1-11ed-989b-000000003532"

哇,识别结果着实非常精确,感兴趣的小伙伴赶快去体验一下。

在程序中接入通用文字识别 API

在Java 程序中,我们可直接复制以下代码接入通用文字识别 API

OkHttpClient client = new OkHttpClient().newBuilder().build();
MediaType mediaType = MediaType.parse("application/json");
RequestBody body = RequestBody.create(mediaType, ""image":"","url":"https://data-apibee.apispace.com/license/1678270527930990ebabe-a570-44ca-9966-b892d2bb6df8","language":"CHN_ENG"");
Request request = new Request.Builder()
  .url("https://eolink.o.apispace.com/ocrbase/ocr/v1/base")
  .method("POST",body)
  .addHeader("X-APISpace-Token","替换自己的 API 密钥")
  .addHeader("Authorization-Type","apikey")
  .addHeader("Content-Type","application/json")
  .build();

Response response = client.newCall(request).execute();
System.out.println(response.body().string());

如何快速识别提取图片上的文字

我们在日常工作中,我们经常会遇到将图片上文字转换成Word文档这样的情况,要知道,图片上的文字是不能直接复制的,这是一件令人头疼的一件事情。那么要怎样才能快速的提取这些图片的文字呢?快速识别提取图片上的的... 查看详情

基于百度ocr提取图像中的文本(代码片段)

从图片或者扫描版的pdf文件中提取出文本信息的需求在日常工作和学习中经常遇到。扫描版的pdf文件可以使用adobeacrobat将文本数据提取出来,不过adobeacrobat安装文件较大且收费。部分网站也提供在线OCR服务,这些网站在不注册的... 查看详情

基于百度ocr提取图像中的文本(代码片段)

从图片或者扫描版的pdf文件中提取出文本信息的需求在日常工作和学习中经常遇到。扫描版的pdf文件可以使用adobeacrobat将文本数据提取出来,不过adobeacrobat安装文件较大且收费。部分网站也提供在线OCR服务,这些网站在不注册的... 查看详情

将图片局部文字提取出来的小技巧

如何对图片中的文字内容进行识别提取呢?当图片中的文字需要编辑需改时,又该如何去操作呢?通常情况下,对于图片局部提取文字方面,我们都是借助相关OCR文字识别请添加链接描述工具来实现,下面就是具体的操作方法,... 查看详情

如何通过迅捷ocr文字识别软件识别提取图中文字

...问题,也是时常会发生的,就比如说你的领导给了你一些图片文件让你将上面的文字录入到文档里面,这时候你该不会傻傻的手动录入吧,这种方法工作效率太低了,下面小编将教大家一种通过使用文字识别工具就可以识别提取... 查看详情

请问一下在电脑上怎么把图片上的文字提取出来?

...最好是直接看图软件的那种推荐几款方法一、WPS提取1、图片转文字WPS也是当前主流的办公软件,这上面有很多特色功能,都是我们在办公时经常用到的,进入软件点击顶部的【特色应用】,在下方找到【图片转文字】功能。2、... 查看详情

怎么把word2016中,大量图片里的文字提取出来?

怎么把word2016中,大量图片里的文字提取出来?求助,求助楼主您好,把大量的图片实现文字提取,建议使用ocr文字识别软件,因为ocr可以批量提取图片中的文字,使用起来方便省心;1、打开cor文字识别软件,选择上面的极速识... 查看详情

对图片中的局部文字提取的教程

怎么对图片中的局部文字进行提取呢?有时候我们在图片上看到一段文字想保存下来这个时候就需要使用文字提取的方法了,具体怎样去操作呢?下面就来分享一个教程。  步骤一、如果想对图片中的文字进行提取,则我们需... 查看详情

如何使用迅捷ocr文字识别软件识别提取图中文字

...们还有其它的选择,就是通过借助文字识别软件识别提取图片中的文字,具体怎样去操作呢?一起来学习下。  使用工具:电脑        迅捷OCR文字识别软件  实用系数:☆☆☆☆☆  推荐理由:软件采用先进的... 查看详情

为啥qq提取文字识别失败

...辑器中打开点击过后,在跳出来的页面中选择需要识别的图片,并单击“打开”图四:打开图片打开图片之后,就可以直接进入识别界面了,软件会自动识别图片中的内容,并支持将识别出来的内容做修改,比如字体大小... 查看详情

怎么在迅捷ocr文字识别软件中将图片文字识别出来

工作中我们经常会遇到从图片中识别文字的问题,如果我们一个字一个字打出来,太浪费时间了,这时候就需要使用借助到文字识别软件来帮助实现图片文字识别的问题了,具体要怎样去操作呢?一起来看看下面的方法。  解... 查看详情

图片转文字的巧妙方法

...地变成了可能,甚至是实现了那种不可能的事情。比如说图片转文字,在早些年都是使用打字的方法把图片上的文字输入到电脑中,现在都是使用工具来帮助我们解决,不可思议吧,下面小编就分享一个方法可以帮助我们轻松搞... 查看详情

图片中的文字如何翻译成英文

如果给你一张带有文字的图片,需要你将文字内容翻译成英文,这时候该怎么办呢?你会选择手动输入文字到相关翻译工具中进行翻译吗,这显然不是一种有效的方法,比较耽误时间,下面小编就来为大家分享一种简单将图中文... 查看详情

怎样做才能实现图片转文字

无论是在生活中,还是在工作中,面对图片文字我们最好的办法就是进行图片转文字,学会了图片转文字这个方法,可以在图片上节约很多的时间,方法也有好与坏,下面小编分享一个简单、识别效果不错的图片转文字方法。使... 查看详情

如何通过迅捷ocr文字识别软件精准识别图片中的文字

怎样精准的将图片中的文字识别出来呢?相信这是很多人的烦恼,因为我们经常会遇到文字识别的时候,使用到的方法也有很多,但是很多方法识别出来的效果不是很好,需要对比着原图去改正,这就很令人烦恼了。下面小编将... 查看详情

图片提取文字图片识别

这几天研究了下ORC文字识别,大概了解了三种识别方式:1、通过微软的控件调用MicrosoftOfficeDocumentImaging。2、是通过AspriseOCR调用3、是TesseractORC 微软组件:安装  https://www.cnblogs.com/beautylan/p/4173713.html调用 https://www.cnblogs.... 查看详情

快速将图片转文字的方法,超实用的小技巧

相信使用电脑办公的小伙伴经常会遇到图片转文字的问题,因为图中文字不可直接进行复制粘贴,所以想要将文字应用到别的地方去的话就很麻烦,那这时候有什么轻松将图片转文字的方法呢?  参考工具:迅捷OCR文字识别软... 查看详情

人口普查分析:利用python+百度文字识别提取图片中的表格数据(代码片段)

今天发布了最新的人口普查结果,笔者拿到的文件是pdf格式(网上应该有)。之前就一直想实现从pdf提取表格数据,输出为excel。正好这次有公开数据,因此打算用来练个手。尝试了两种方法:1.python的pdfpl... 查看详情