ocr开源项目对比总结

author author     2023-05-09     481

关键词:

参考技术A 光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。

ocr的发展已经有了非常多的积累,一般人或者企业使用, 都是直接使用第三方的服务,目前提供第三方服务的大企业也非常多,百度,阿里云,腾讯等等,都提供了非常方便的api接口,可以进行调用,识别的速度、精确度和效果也都是非常不错的。唯一的缺点就是api的调用是需要收费的,对于调用频次不高的个人和企业,这个费用还是非常低的。

目前因为公司的现状,使用开源的有几个目的

目前针对ocr的相关开源项目也还是有不少的,作者正好是公司也需要类似的功能,所以做了一些简单的调研,在这里进行记录。

对于调研不准确的希望大家指出

Tesseract 是谷歌开发并开源的图像文字识别引擎,使用python开发。

所以针对目前公司的现状,放弃了这个项目的学习和调研

PaddleOCR 是百度开源的中文识别的ocr开源软件

EasyOCR 是一个用 Python 编写的 OCR 库,用于识别图像中的文字并输出为文本,支持 80 多种语言。

chineseocr

chineseocr_lite

TrWebOCR

cnocr

针对上面的比较讨论,同时根据现在的公司的情况和之前既定的一些目标,暂时选择最简单的cnocr进行学习和内部学习和使用。同时也针对目前cnocr仅仅是一个python包,而且无法通过接口进行调用的情况,做了一个补充项目 hn_ocr 。

目前放到github上面,欢迎大家一起学习和完善。

技术选型总结(代码片段)

...分析2.2.2上手难易程度2.2.3教程多么2.2.4如果选择的是一个开源项目,那么需要考虑的是,这个开源项目是否更新的快(比方说,这个开 查看详情

ocr+nlp提取信息并分析,这个开源项目火了!

文字是传递信息的高效途径,利用OCR技术提取文本信息是各行业向数字智能化转型的第一步。与此同时,针对OCR提取的海量文本信息,利用NLP技术进一步加工提取、分析理解后才能最大化发挥文本信息的价值。NLP技术... 查看详情

ocr+nlp提取信息并分析,这个开源项目火了!

文字是传递信息的高效途径,利用OCR技术提取文本信息是各行业向数字智能化转型的第一步。与此同时,针对OCR提取的海量文本信息,利用NLP技术进一步加工提取、分析理解后才能最大化发挥文本信息的价值。NLP技术... 查看详情

项目管理javaocr实现图片文字识别(代码片段)

...识别,不去申请云账号啥的了。所以需要对去了解OCR开源项目1.2OCR引擎选择OCR开源项目简介优点劣势Te 查看详情

专门为渲染文本设计开源 OCR 引擎(截图)

】专门为渲染文本设计开源OCR引擎(截图)【英文标题】:DesigninganopensourceOCRenginespecificallyforrenderedtext(screenshots)【发布时间】:2011-05-3100:31:39【问题描述】:所以我目前的个人项目是能够自动从游戏中截取屏幕截图,对文本进... 查看详情

开源ocr识别库-tesseract介绍

最近在github上面看到一个开源的ocr文字识别库,感觉效果还可以,所以在这里介绍一下,这个项目的原地址在:https://github.com/tesseract-ocr/tesseract。tesseract库支持你训练自己的文字识别模型,当然其本身已经提供了几十种不同语言... 查看详情

materialdesign开源项目总结

Android开发中,我们不免会遇到MaterialDesign展示的需求,以下是本人之前star的开源项目,供大家参考:一、RippleEffect项目地址:https://github.com/traex/RippleEffectMDRipple效果--波纹视图,用于View中增加动态效果。效果图如下:  查看详情

最硬核的ocr开源课程来了!

 Datawhale开源 内容方向:OCR技术学习你日常会用到OCR(光学字符识别)技术吗?“妈妈再也不用担心我的学习了”、“老板来问进度了,文献还没整”......除了点读机广告,很多人对OCR的印象主要是肝文... 查看详情

ocr文字识别技术总结(代码片段)

...文字识别实战流程,具体分为算法介绍、代码解读、项目实战等几个部分。本系列目录:1️⃣OCR系列第一章:OCR文字识别技术总结(一)2️⃣OCR系列第二章:OCR文字识别技术总结(二)3️⃣OCR系... 查看详情

免费-开源-简洁天若ocr文字识工具使用介绍(代码片段)

【免费-开源-简洁】天若OCR文字识工具使用介绍本地版,(无需网络):https://gitee.com/wanglifree/tianruoocr-cl/releases天若OCR文字识别5.0开源版,软件大小2.1M,在各下载网站都有下载,就不提供了。不管是本... 查看详情

richtext开源项目总结

一、RichEditor开源项目地址:https://github.com/renhui/RichEditorRichEditor是本人开源的一个富文本编辑器,功能相对简单,但麻雀虽小五脏俱全,支持了图文混排的编辑方式和展示方式的控件及对应的demo。核心功能:图文混排展示,支持... 查看详情

中文开源 OCR [关闭]

】中文开源OCR[关闭]【英文标题】:OpensourceOCRforChinese[closed]【发布时间】:2010-12-2616:06:27【问题描述】:我搜索了中文的开源OCR。但是如果没有任何运气,似乎很少有一些可用的开源OCR(中文)。所以我在这里想知道:有没有开... 查看详情

关于个人开源项目(vueapp)的一些总结(代码片段)

关于个人开源项目(vueapp)的一些总结项目地址https://github.com/BYChoo/record项目简介此项目名叫:Record。是以Vue全家桶(vue,vue-router,vuex)+axios+express+mongodb技术栈开发的一个校园考勤网站,专门为老师定制的。网站目前实现了登录注册、... 查看详情

chart图表开源项目总结(代码片段)

...会遇到图表展示的需求,以下是本人之前star的悬浮窗的开源项目,供大家参考:1. WilliamChart:创建图表的Android库2. HelloCharts:兼容到API8的Android图表库3. MPAndroidChart :一个强大的Android图表视图/图形库一、WilliamChar... 查看详情

对比度和亮度自动(用于 OCR)

】对比度和亮度自动(用于OCR)【英文标题】:contrastandbrightnessautomatic(forOCR)【发布时间】:2011-08-1720:54:24【问题描述】:我正在寻找一种算法来自动调整将由Tesseract(一种OCR引擎)扫描的图像的对比度和亮度。你知道这是否可... 查看详情

几种知名开源富文本编辑器记录和对比(仅供参考)

1、UEditor百度的。优点:插件多,基本满足各种需求,类似贴吧中的回复界面。缺点:不再维护,文档极少,使用并不普遍,图片只能上传到本地服务器,如果需要上传到其他服务器需要改动源码,较为难办,加载速度慢。总结... 查看详情

ruby我们对比了github的上8800个开源机器学习项目,并选出了其中的top30(代码片段)

查看详情

开源 OCR [关闭]

】开源OCR[关闭]【英文标题】:OpensourceOCR[closed]【发布时间】:2011-07-0607:49:38【问题描述】:我正在寻找一个在Linux上运行的开源OCR库。我需要它来处理PNG和PDF。大多数情况下,我想从java或ruby​​接口这个库。想知道有什么可用... 查看详情