Ⅰ OCR文字识别软件哪个易用可网上下载
OCR文字识别软件 Mini Ocr
xdowns.com/view_soft/3/7/OCRwenzishibieruanjian Mini Ocr.html
件
本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中,出现
的汉字显示字体。Ocr的中文含意是光学字符识别。
为什么叫Mini呢?因为现有的识别汉字的商业Ocr软件,动辄二三十兆,而本软件解
压后,也不过三兆多,身材比较纤小,再加上本软件主要用于识别字体比较小的汉字,所
以叫Mini,中文的发音是“迷你”,中文含义是超小型。
既然有了商业Ocr软件,为什么还要开发这个软件?
不同于商业Ocr软件,本软件是免费的,可以自由使用。第二个不同之处,本软件的
识别对象是屏幕出现的“显示汉字”,而不是针对扫描仪扫出来的“打印汉字”。二者有什
么不同呢?最重要的一点: 扫描出来的打印汉字的高度和宽度一般都在30多个像素点之
上,这是我用画图软件,打开某个商业Ocr的samples\sample1.tif,然后一点一点数出
来的。从文件名和目录名的中文含意可以看出,这个点数应该是一个典型值。那么,如果
用商业Ocr识别屏幕上出现的小五号字,汉字的高度是12个像素点,会出现什么情况呢?
测试方法:用记事本随便写几行汉字,设置字体为小五号字。这大概是看着还算舒服
的最小号的汉字字体了(高度是12个像素点),如果再小,字体就很难看了。然后,按拷
屏键PrtSc,把屏幕的图像拷贝、粘贴到画图软件中,修剪尺寸后,保存为bmp的格式。
然后,我找了两个国内最着名的Ocr软件进行测试,结果让人大吃一惊,识别率几乎为零。
把图像放大两倍,再测试,结果仍然很不理想,大概也只有百分之二三十的样子。
开发Mini Ocr软件的由来
我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能
把文字识别出来,图像的含义就很容易让计算机理解了。预算有限,我连扫描仪都舍不得
买,就更别想买商业Ocr的开发包了,大概几十万,或者更多,或者别人压根就不卖。况且
它们的识别率对小字体几乎为零,不符合我的要求。看来,只好自力更生,重新写一个了。
开发Mini Ocr的历程
经过三个多月的努力,终于诞生了这款Mini Ocr 软件。第1个月做出了汉字识别的
核心模块,第2个月做出了文章段落切分的算法,并加入了对英文,数字,标点的支持,
第三个月继续调整英汉混排和汉字切分的算法,并用MFC 做了一个界面。
Mini Ocr的软件架构
为了让更多的人能使用到这个软件,我在windows系统下,采用VC进行编程,界面当
然只好用MFC写了。软件架构是一个SDI框架下的多窗口切分界面,左上角的窗口是一个
CFormView,用来显示常用的按钮;左下角是一个CEditView,用来显示帮助信息;右上角
是一个CView,用来显示要识别的图像;右下角是一个CEditView,用来存放识别出来的文
字。识别部分采用了工作者线程,以避免显示界面的主线程僵掉。识别部分是整个软件的
核心,与操作系统无关,可以单独摘出来放在dos窗口里跑,也可以移植到Linux系统中跑。
汉字识别软件的难点所在:
英文识别有一些开放源码的软件,我看过的软件,主要采取两种识别方法:基于规则
的方法,和采用神经网络方法。而这两种方法,在识别汉字时,都不宜采用。因为汉字数
目众多,最常用的国标2312的一级汉字就有3755个。如果借用基于规则的方法,需要对
三千多个汉字,逐一人工写出分类规则,工作量太大,我一个人无法完成;如果采用神经
网络的方法,这么多汉字,我不敢想象,需要多少层网络和神经节点呀!如果采用网格法,
抗位移的效果太差;而采用不变矩法,识别人和入,土和士,相似度又难于控制。除此之
外,汉字切分也是一大难题。英文宽度大概只有汉字一半,标点符号大概只有汉字三分之
一宽,数字大概只有四分之一的宽度。而汉字本身又有二分字,和三分字。某些字,如“啊”,
字体小时可能是独体字,字体大些,变为二分字,字体再大,又变为三分字。加上汉字与
汉字之间的粘连、汉字与英文的混排,英文与英文的粘连,造成汉字切分模块的算法,甚
至比汉字识别模块的算法还要复杂得多。为了克服这些难点,并加快识别速度,我在算法
设计时,采用了一些优化和简化的策略。经过实践检验,证明行之有效。
Mini Ocr进行汉字识别的策略:
1) 采用复合特征的分类方法。
2) 字符集选择3755个一级汉字。
3) 字体选择最常用的宋体。
4) 字号选择从小五号到一号汉字,主要针对20个点之内的小字体。
5) 英汉混排时,汉语优先。
6) 汉字粘连时,进行动态优化切分。
展望与下一步的开发计划:
1) 重新优化英文识别的算法;
2) 对英文粘连的切分算法进行调整;
3) 移植进入Linux;
选择Ocr软件的建议:
如果您选择Ocr软件,目的是用来识别扫描仪出来打印字体,推荐还是选用知名的商业Ocr。
如果您要识别屏幕上显示的汉字,Mini Ocr是一个比较不错的选择。真诚地希望您在使用
中,能喜欢上它
Ⅱ java中有没有图像识别的开发包
目前没有
Ⅲ 最好的图片识字软件是什么
慧视OCR文字识别app、扫描全能王安卓版、Scanbot安卓版、textgrabber手机版、云脉OCR云识别都是不错的图片识字软件
1、扫描全能王安卓版:扫描全能王安卓版是一款可以帮助用户方便快速记录文档、数据以及笔记的手机软件。可以拍摄文档,并自动优化背景。很方便,省时省力更省心。扫文档管理工具。能自动切除文档背景,生成高清pdf、JPEG或TXT文本。还可以邮件发送、连接打印机、发传真、发微信、存到云端,多设备查看。
4、云脉OCR云识别是一款手机识别软件,能够更加准确的对身份证,名片,银行卡等作出文字图片识别,便捷了信息的录入,操作简单,安全识别。云脉ocr云识别软件是云脉科技公司提供的光学字符识别技术(ocr)演示软件,支持身份证、名片、文档等多种类型的识别对象。手机端提交要识别的内容,云端服务器执行识别任务,并迅速返回识别结果。用户可以用这个手机应用软件多方位地体验云脉光学识别技术,了解该技术在不同对象中的应用。
5、慧视OCR文字识别app是一款专注于OCR文字扫描服务的手机扫描软件,独有的OCR引擎技术,一键智能识别扫描。慧视OCR文字识别软件是一款十分优秀的OCR文字扫描软件,您只需要将您想要识别的文字拍一张照片,就可在一秒内识别。中安未来独有的场景模式OCR引擎,清晰度不高的图片上的文字也可以识别。中安慧视OCR文字识别有完整的SDK开发包,可以继承在任意APP上,支持iOS、Android两大平台。
Ⅳ importimage_ocr需要什么包
importimage_ocr需要开发包:
ImageOCR是一款功能实用、简单易用的图片识别文字软件,ImageOCR官方版免费图片的OCR使您能够准确地识别您可能从任何扫描的文档的文本,以使其可编辑。此外,还可以提取的文本保存到一个单独的文件或创建一个加密的PDF文档。ImageOCR是完全免费和安全的,不会尝试安装任何恶意组件到您的计算机上。它保证不包含任何间谍软件,病毒或任何其他类型的恶意软件。
ImageOCR的图像有能力添加到PDF文件的密码,这样你可以限制谁可以查看,编辑,复制,打印或添加评论到您的PDF文档。你可以清除密码解锁PDF文件添加数据,打印或复制一些文件。
Ⅳ 什么是OCR SDK
OCR是光学字符识别技术,OCR SDK识别文字识别的开发包,可以将ocr识别技术整合到自己的系统中,推荐用云脉OCR SDK,支持IOS、安卓、WINDOWS及服务端平台的开发,识别速度快识别率高
Ⅵ 有没有免费的ocr(光学字符识别)开发包
开发包比如GOOGLE公开的tesseract-2.03.tar
不过效果就太差了
软件可以试试赛酷OCR,很好很强大
网络一下 赛酷OCR
Ⅶ 怎么把图片转换成文字 ocr文字识别软件来帮你
云脉ocr文档识别软件基于成熟的OCR技术,可将图片上的文字进行识别并提取成文本文之后可进行保存以及编辑,然后可以导出word格式以及PDF格式;另外,在云脉OCR SDK开发者平台上有提供多种OCR SDK开发包,比如文档识别、名片识别、车牌识别、身份证识别、驾照识别等,可自主下载...
Ⅷ 测试了好几种ocr软件,还是云脉的识别率好,他们有OCR开发包可以提供吗
云脉提供各类OCR开发包定制,同时也可以在云脉OCR SDK开发者平台下载API接入文档。里面有文档识别,名片识别,身份证识别等开发文档
Ⅸ ocr文字识别软件开发包
OCR文字识别开发包是用于做二次开发来使用的,现在国内对于文字字符识别中中文、英文、韩文、日文以及少数民族OCR文字识别做的比较好的有北京文通等,另外还有一些开源的,一般识别不高,还不提供接口做二次开发,现在的SDK比较成熟,对于集成商二次开发问题都不大,还能提供各种语言的调用例程。
Ⅹ ocr文字识别软件,文档识别的那种,最好用的软件开发包集成,求高手来!
这是ocr文字识别SDK。是一种功能技术集成开发包,也就是集成了文字识别这样的功能就行了,图上的那个是加入了“文档ocr识别”的功能开发包!