OCR字符识别

OCR字符识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题的友好性，产品的稳定性，易用性及可行性等。

OCR字符识别组成
OCR字符识别造价信息
OCR字符识别由来历史
OCR字符识别常见问题
OCR字符识别文献
OCR文字识别软件结构
汉王 PDF OCR 8.1简体中文版软件功能
OCR文字识别历史背景

OCR字符识别基本信息

中文名	OCR字符识别	属性	对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程

OCR字符识别组成

编辑本段软件结构由于扫描仪的普及与广泛应用，OCR软件只需提供与扫描仪的接口，利用扫描仪驱动软件即可。因此，OCR软件主要是由下面几个部分组成。

1. 图像输入、预处理：

2. 图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式。预处理：主要包括二值化，噪声去除，倾斜较正等

3. 二值化：

对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为了让计算机更快的，更好的识别文字，我们需要先对彩色图进行处理，使图片只前景信息与背景信息，可以简单的定义前景信息为黑色，背景信息为白色，这就是二值化图了。

4. 噪声去除：

对于不同的文档，我们对噪声的定义可以不同，根据噪声的特征进行去噪，就叫做噪声去除

5. 倾斜较正：

由于一般用户，在拍照文档时，都比较随意，因此拍照出来的图片不可避免的产生倾斜，这就需要文字识别软件进行较正。

6. 版面分析：

将文档图片分段落，分行的过程就叫做版面分析，由于实际文档的多样性，复杂性，因此，还没有一个固定的，最优的切割模型。

7. 字符切割：

由于拍照条件的限制，经常造成字符粘连，断笔，因此极大限制了识别系统的性能，这就需要文字识别软件有字符切割功能。

8. 字符识别：

这一研究，已经是很早的事情了，比较早有模板匹配，后来以特征提取为主，由于文字的位移，笔画的粗细，断笔，粘连，旋转等因素的影响，极大影响特征的提取的难度。

9. 版面恢复：

人们希望识别后的文字，仍然像原文档图片那样排列着，段落不变，位置不变，顺序不变，的输出到word文档,pdf文档等，这一过程就叫做版面恢复。

10. 后处理、校对:

根据特定的语言上下文的关系，对识别结果进行较正，就是后处理。

编辑本段工作流程一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。

从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出。国内最有实力的OCR字符识别公司有：云脉OCR, 汉王OCR等。

查看详情

OCR字符识别造价信息

市场价

信息价

询价

材料名称	规格/型号	市场价（除税）	工程建议价（除税）	品牌	单位	税率	供应商
字符显示终端	品种:字符显示终端;型号:P3.75;产品说明:P3.75 LED电子双色屏;	查看价格	查看价格	蓝普	m2	13%	云南勇恒科技有限公司
字符叠加器	TC-9304	查看价格	查看价格	天地伟业	台	13%	南京天地伟业数码科技有限公司
字符叠加器	TC-9316-4H	查看价格	查看价格	天地伟业	台	13%	南京天地伟业数码科技有限公司
字符叠加器	TC-9101	查看价格	查看价格	天地伟业	台	13%	天津天地伟业数码科技有限公司成都办事处
字符叠加器	TC-9316	查看价格	查看价格	天地伟业	台	13%	天津天地伟业数码科技有限公司成都办事处
字符叠加器	TC-9304	查看价格	查看价格	天地伟业	台	13%	天津天地伟业数码科技有限公司成都办事处
字符叠加器	TC-9316	查看价格	查看价格		台	13%	大连天地伟业数码科技有限公司
字符叠加器	TC-9316-4H	查看价格	查看价格		台	13%	天地伟业数码科技有限公司哈尔滨办事处

材料名称	规格/型号	除税信息价	含税信息价	单位	地区/时间
制作地标.字符	贴附式大型、小型、箭头等	查看价格	查看价格	m²	东莞市2017年4月信息价
制作地标.字符	贴附式大型、小型、箭头等	查看价格	查看价格	m²	东莞市2017年3月信息价
制作地标.字符	大型、小型、箭头等	查看价格	查看价格	m²	东莞市2017年1月信息价
制作地标.字符	贴附式大型、小型、箭头等	查看价格	查看价格	m²	东莞市2016年12月信息价
制作地标.字符	贴附式大型、小型、箭头等	查看价格	查看价格	m²	东莞市2016年7月信息价
制作地标.字符	大型、小型、箭头等	查看价格	查看价格	m²	东莞市2016年5月信息价
制作地标.字符	大型、小型、箭头等	查看价格	查看价格	m²	东莞市2016年4月信息价
制作地标.字符	大型、小型、箭头等	查看价格	查看价格	m²	东莞市2016年3月信息价

材料名称	规格/需求量	报价数	最新报价（元）	供应商	报价地区	最新报价时间
快速冲洗接头DN32OCr18Ni9	快速冲洗接头DN32OCr18Ni9\|1个	3	查看价格	上海菲航阀门制造有限公司	四川达州市	2017-06-13
号牌识别软件能识别汉字、颜色、字符	能识别汉字、颜色、字符\|41套	1	查看价格	深圳市索威尔科技开发有限公司	广东惠州市	2010-11-09
OCR证件阅读器	3mm;图像分辨率:不小于300DPI;色彩深度:24位真彩色;图像格式:BMP,JPEG,JPEG2000;光源:可见光,红外光(B900),紫外光(UVA);OCR识别:可识别符合ICAO9303文件\|20套	1	查看价格	盛视科技股份有限公司	全国	2018-11-08
不带字符功能矩阵	BL-D2150SV(机箱数是1) BL-D2150S-8-8\|6742台	1	查看价格	北京美电贝尔电业科技有限公司	北京北京市	2015-12-24
不带字符功能矩阵	BL-D2150SV(机箱数是1) BL-D2150S-12-6\|422台	1	查看价格	北京美电贝尔电业科技有限公司	北京北京市	2015-03-30
字符叠加功能	通过软件定制，各收费亭达到字符叠加功能，车道收费亭字符叠加功能，含过车信息，收费信息，上下收费站信息等字符叠加信息。\|147套	1	查看价格	金三立视频科技（深圳）有限公司	广东东莞市	2017-04-27
不带字符功能矩阵	BL-D2150SV(机箱数是1) BL-D2150S-8-4\|3891台	1	查看价格	北京美电贝尔电业科技有限公司	北京北京市	2015-12-01
不带字符功能矩阵	BL-D2150SV(机箱数是1) BL-D2150S-16-12\|5414台	1	查看价格	北京美电贝尔电业科技有限公司	北京北京市	2015-11-14

OCR字符识别由来历史

光学文字识别的概念是在1929年由奥地利科学家Gustav Tauschek最先提出来的，后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy，1966年他们发表了第一篇关于汉字识别的文章，采用了模板匹配法识别了1000个印刷体汉字。

早在60、70年代，世界各国就开始有OCR的研究，而研究的初期，多以文字的识别方法研究为主，且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例，1960年左右开始研究OCR的基本识别理论，初期以数字为对象，直至1965至1970年之间开始有一些简单的产品，如印刷文字的邮政编码识别系统，识别邮件上的邮政编码，帮助邮局作区域分信的作业；也因此至今邮政编码一直是各国所倡导的地址书写方式。

20世纪70年代初，日本的学者开始研究汉字识别，并做了大量的工作。中国在OCR技术方面的研究工作起步较晚，在70年代才开始对数字、英文字母及符号的识别进行研究，70年代末开始进行汉字识别的研究，到1986年汉字识别的研究进入一个实质性的阶段，不少研究单位相继推出了中文OCR产品.早期的OCR软件，由于识别率及产品化等多方面的因素，未能达到实际要求。同时，由于硬件设备成本高，运行速度慢，也没有达到实用的程度。只有个别部门，如信息部门、新闻出版单位等使用OCR软件。1986年以后我国的OCR研究有了很大进展，在汉字建模和识别方法上都有所创新，在系统研制和开发应用中都取得了丰硕的成果，不少单位相继推出了中文OCR产品。进入20世纪90年代以后，随着平台式扫描仪的广泛应用，以及我国信息自动化和办公自动化的普及，大大推动了OCR技术的进一步发展，使OCR的识别正确率、识别速度满足了广大用户的要求。

查看详情

OCR字符识别常见问题

破解版OCR

已发，请查收！
求问汉王ocr怎么样

1）双击桌面上的汉王图标将进入汉王软件界面； 2）将待扫描的纸张放到扫描仪的工作面上； 3）点击汉王软件界面工具栏的第一个图标（扫描按钮），进入扫描设置窗口——设置成标准，文本，单色，400象...
扫描仪ocr安装方法是什么?

如果是自带的话，随即光盘都有OCR软件如果不是自带的，可以找经销商（卖机器的地方）要个，网上现在都有下载的，汉王OCR，清华紫光等都还不错

OCR字符识别文献

基于BP神经网络的金属材料字符识别研究

格式：pdf

大小：77KB

页数： 3页

评分： 4.5

字符识别是模式识别领域的一项传统课题,其内容是模式识别领域中很多课题的基本内容。人工神经网络的出现为字符识别的研究提供了一种新的手段,BP神经网络(Back Propagation Neural Network)作为人工神经网络的一个分支,现已成为其最广泛的应用。本文以三层BP网络作为模型,并将其应用于对金属角铁上的字符识别。由于角铁字符为数字与英文字母混合,文中在对传统的BP算法进行了改进的基础上,采用了分组神经网络的设计方法,取得了良好的识别效果。

立即下载

MER方法在工程图纸字符识别中的算法研究与应用

格式：pdf

大小：77KB

页数： 2页

评分： 4.4

如何把数字图像中各种长度和角度书写的字符或字符串统一识别、组合并校正成归一化的水平方向,以供后续准确的字模识别,是工程图纸数字图像字符识别中必须首先解决的问题。应用计算最小邻接矩形方法来实现上述目标,取得了良好效果。

立即下载

OCR文字识别软件结构

由于扫描仪的普及与广泛应用，OCR软件只需提供与扫描仪的接口，利用扫描仪驱动软件即可。因此，OCR软件主要是由下面几个部分组成。

1、图像输入、预处理：

图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式。预处理：主要包括二值化，噪声去除，倾斜较正等

2、二值化：

3、噪声去除：

对于不同的文档，我们对噪声的定义可以不同，根据噪声的特征进行去噪，就叫做噪声去除

4、倾斜较正：

由于一般用户，在拍照文档时，都比较随意，因此拍照出来的图片不可避免的产生倾斜，这就需要文字识别软件进行较正。

版面分析：

5、将文档图片分段落，分行的过程就叫做版面分析，由于实际文档的多样性，复杂性，因此，还没有一个固定的，最优的切割模型。

6、字符切割：

由于拍照条件的限制，经常造成字符粘连，断笔，因此极大限制了识别系统的性能，这就需要文字识别软件有字符切割功能。

7、字符识别：

8、版面恢复：

人们希望识别后的文字，仍然像原文档图片那样排列着，段落不变，位置不变，顺序不变，的输出到word文档,pdf文档等，这一过程就叫做版面恢复。

9、后处理、校对：

根据特定的语言上下文的关系，对识别结果进行较正，就是后处理。

开发一个OCR文字识别软件系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。

从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出。2100433B

查看详情

汉王 PDF OCR 8.1简体中文版软件功能

有批量处理功能，避免了单页处理的麻烦；支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件；可识别简体、繁体和英文三种语言；具有简单易用的表格识别功能；具有TXT、RTF、HTM和XLS多种输出格式，并有所见即所得的版面还原功能。新增打开与识别PDF文件功能，支持文字型PDF的直接转换和图像型PDF的OCR识别，既可以采用OCR的方式将PDF文件转换为可编辑文档，也可以采用格式转换的方式直接转换文字型PDF文件为RTF文件或文本文件。

查看详情

OCR文字识别历史背景

光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的，后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy，1966年他们发表了第一篇关于汉字识别的文章，采用了模板匹配法识别了1000个印刷体汉字。

1986年以后我国的OCR研究有了很大进展，在汉字建模和识别方法上都有所创新，在系统研制和开发应用中都取得了丰硕的成果，不少单位相继推出了中文OCR产品。

进入20世纪90年代以后，随着平台式扫描仪的广泛应用，以及我国信息自动化和办公自动化的普及，大大推动了OCR技术的进一步发展，使OCR的识别正确率、识别速度满足了广大用户的要求。其中以OCR为科技核心的云脉技术不断创新进取，研发了一系列OCR软件产品，并且运用在医院，学校，企业等各大市场。

查看详情

OCR字符识别相关推荐

相关百科
相关知识
相关专栏

百科

OCR字符识别

OCR字符识别基本信息

OCR字符识别组成

OCR字符识别造价信息

OCR字符识别由来历史

OCR字符识别常见问题

OCR字符识别文献

OCR文字识别软件结构

汉王 PDF OCR 8.1简体中文版软件功能

OCR文字识别历史背景

最新词条