印刷体数字识别(精选6篇)
印刷体数字识别 篇1
1 BP网络
BP神经网络算法根据数据流正向传播及误差信号反向传播所构成。当数据流正向传播时,传播方向从输入层到隐层,再到输出层,每一层的神经元只受上一层神经元状态影响。假设输出层所输出的结果与期望结果不吻合,就自然变成误差信号的反向传播流程。经过正反过程交替后,误差函数梯度降低策略将被权向量空间如期执行,权向量将被动态迭代搜索,网络函数将达到最小误差值,信息提取和记忆过程得以完成。
1.1 正向传播
设BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间的权值为v,隐层与输出层之间的权值为W,如图一所示。
隐层的传递函数为f1(·),输出层的传递函数为f2(·),则隐层节点的输出为(将阐值写入求和项中):
输出层节点的输出为:
1.2 反向传播
(l)定义误差函数
输入p个学习样本,用x1,x2,…,xp来表示。第p个样本输入到网络后得到yjp(j=1,2,…,m)。采用平方型误差函数,于是得到第p个样本的误差Ep:
P个样本,全局误差为:
(2)输出层权值的变化
采用累计误差BP算法调wjk,使全局误差E变小,即
定义误差信号为:
第一项为:
第二项:
由链定理得:
即,输出层各神经元的权值调整公式为:
2 图像矩函数的一般定义
用函数值f(x,y)表示点(x,y)处图像像素的亮度值,则一幅图像看成一个二维密度分布函数f(x,y)。
f(x,y)为图像的亮度因数,它的(p+q)阶矩函数的定义如下:
φpq(x,y)是矩的权核或基本集,它表示一个关于(x,y)在ξ内的连续函数,函数φpq(x,y)下标pq表示所定义的坐标(x,y)的次数。对于一幅图像亮度因数f(x,y)在ξ中是有界的和紧凑的,因而,式(12)给出的积分是有限的。
3 几种改进的Hu不变矩
3.1 Hu不变矩改进一
以上改进的Hu不变矩具有结构平移、缩放、旋转不变性。
3.2 Hu不变矩改进二
归一化中心矩重新定义为:
3.3 Hu不变矩改进三
3.4 Hu不变矩改进四
在Hu矩的基础上采用改进的Hu矩,可以避免计算量大而复杂,不适用于实时监控的问题出现,从而可以做到离散状态下的尺度不变性。
4 实验结果及分析
4.1 神经网络训练
4.2 各种不变矩识别率比较
各种不变矩识别率如表一、表二所示。
4.3 神经网络隐含节点对识别率的影响分析
经过神经网络的实验训练,根据各种不变矩识别率的比较及神经网络隐含节点对识别率的影响分析,几种改进的不变矩对识别率的提高具有可操作的现实意义。
参考文献
[1]许颖泉.用神经网络进行数字图像识别研究[J].科技风,2008,(24).
[2]张红,刘磊,孙彦峰.BP数字识别自动监控系统[J].小型微型计算机系统,2009,30(03).
[3]刘浩,白振兴.BP网络的Matlab实现及应用研究[J].现代电子技术,2006,29(02):49-51.
[4]马耀名,黄敏.基于BP神经网络的数字识别研究[J].信息技术,2007,31(04):87-88.
[5]张彤,肖南峰.基于BP网络的数字识别方法[J].重庆理工大学学报(自然科学版),2010,24(03):43-47.
[6]杜娟,韦关锋,李夕海.基于matlab和神经网络的数字识别[J].电脑编程技巧与维护,2004,(02):31-32.
印刷体数字识别 篇2
关键词:数字识别,特征抽取,过线数,编码器
1 概述
光学字符识别 (OCR) [1]是模式识别学科的一个传统的研究领域。印刷数字识别就是字符识别的一个重要分支, 在很多方面都有重要应用, 如邮政编码、汽车牌照、支票、身份证件的数字识别等。在过去的数十年中, 研究者们提出了许多的识别方法, 这些方法可以分为六类:模板匹配法[2]、统计决策法 (含几何分类法) [3]、句法结构法[4]、模糊判别法[5]、逻辑推理 (人工智能) 法[6]、神经网络法[7,8]
由于印刷数字具有字符集小, 笔画简单的特点, 识别难度相对较小。本文采用特征模板匹配法, 具体来说就是通过多特征抽取来构造字符的特征编码器, 以此来实现对宋体印刷数字的快速识别。因为实际应用汇总对OCR提出了高识别率和高置信度的要求, 单一特征抽取构成的识别系统通常难以满足要求。该方法抗干扰性强, 能对数字进行快速、准确的识别。算法共两个步骤:首先, 对进行了二值化[1,2]和分割[1,2]好的待识别数字进行特征抽取, 用特征单元对字符结构进行完整的描述;然后, 根据数字特征构造编码器, 对数字进行识别。
2 识别过程
本文提出的印刷体数字识别操作的结构流程如图1所示:其中, 预处理主要完成图像的平滑、二值化、细化等, 预处理后的图像通过提取结构特征, 编码识别和匹配识别输出最终结果。
2.1 图像预处理
字符识别时, 首先将印 (写) 在纸上的字符, 经光电扫描产生模拟电信号, 再通过模数转换为带灰度值的数字信号输入计算机。输入设备的鉴别率、线性度、光学畸变、量化过程也都产生噪声。所以, 在单个字符识别之前, 要对带有随机噪声的字符灰度值数字信号进行预处理。
首先要对图像进行灰度化[1,2]和二值化处理。灰度化的过程就是彩色图像转换为黑白图像的过程。灰度化是为下一步二值化做准备。其方法是根据原图片中的RGB三个分量及它们的权重来求取灰度值。二值化即把灰度图像变成0 (黑色) 或255 (白色) 取值的二值图像。对一幅图像进行二值化首先必须选取阈值, 把高于阈值灰度的像素点转换为255, 低于阈值的像素点转换为0。
在图像处理中, 形状信息是十分重要的, 为了便于描述和抽取特征, 对那些细长的区域常用它的“类似骨架”的细线来表示, 这些细线处于图形的中轴附近, 而且从视觉上来说仍然保持原来的形状。这就是所谓的细化。利用逐层迭代的细化算法[1,2]把二值印刷体图像进行细化, 大大减少冗余的信息, 突出了印刷数字的主要特征, 从而便于后面的特征提取。
另外, 还要进行字符分割[1,2], 将图片上的字符分割成一个个单个图片文件并且去掉字符上下左右的空白, 以便进行以后的识别。图像的分割首先采用垂直投影的方法进行垂直分割将图片分割为单个的字符, 去掉其左右空白, 在利用像素扫描的方法进行水平分割去掉上下的空白。
2.2 特征抽取
基于印刷体数字结构, 抽取数字的4种特征:横线特征、竖线特征、水平方向过线数和垂直方向过线数。
2.2.1 横线特征
根据数字的结构特征, 在数字水平方向上, 定义横线比例:
HoriR=nHBlackNum/nWidth
其中:n Width为图像的宽度, 用像素点个数来度量, nHBlackNum为水平方向上黑像素点连续出现的个数。若0.6≤Hori R≤1, 则认为该数字中这些连续出现的黑像素点构成了一条横线。
根据横线在数字中的不同位置定义:从左上角开始的横线为上横线, 从左下角开始的横线为下横线。
以数字1、7为例, 如图2.a所示:
根据上述的描述, 易知:1有一条下横线, 7有一条上横线。
2.2.2 竖线特征
与横线特征原理相同。在垂直方向上, 定义比例:
VertR=nVBlackNum/nHeight
若0.4≤VertR≤1, 则认为该数字中这些连续出现的黑像素点构成了一条竖线。
根据竖线在数字中的不同位置定义:从左下角开始的竖线为左竖线, 从右下角开始的竖线为右竖线。以数字0为例, 如图2.b所示。
根据上述描述易知:0有一条左竖线和一条右竖线。
2.2.3 水平方向过线数
把数字平分成上、下两部分, 在每个部分中分别以水平方向的扫描从左到右穿过数字, 计算每条扫描线穿越黑象素区域的交点数, 在上部分得到的最大交点数定义为该数字的上过线数, 在下部分得到的最大交点数定义为该数字的下过线数。
以数字2为例, 如图3.a所示。
显而易见:数字2的上过线数为2, 下过线数也为2。
2.2.4 垂直方向过线数
把数字平分成左、右两部分, 在每个部分中分别以垂直方向的扫描线从上到下穿过数字, 计算每条扫描线穿越黑像素区域的交点数, 在左部分得到的最大交点数定义为该数字的左过线数, 在右部分得到的最大交点数定义为该数字的右过线数。以数字9为例, 如图3.b所示。
显而易见:数字9的左过线数为3, 右过线数也为3。
2.3 模式识别算法
2.3.1 构造编码器
以上述原理为依据, 以宋体为例构造数字0-9的模板, 抽取其上横线、下横线、左竖线、右竖线、上过线数、下过线数、左过线和右过线数8个特征。宋体印刷数字如图4所示。可得到它们的特征值编码器, 如表1所示。
由表1易知, 每个数字的编码表不完全相同, 所以可由此编码器识别出数字。
2.3.2 数字识别
首先对图像中的数字经过预处理, 而后对数字进行定位分割。将待识别数字作一次行扫描, 抽取水平方向的过线数和横线特征;再作一次列扫描, 抽取垂直方向的过线数和竖线特征。再利用表1的编码, 对数字进行识别。由于有8个特征, 所以设每个特征的权值为0.125, 将得到的特征与编码器中的特征逐一对比, 若某个特征与其符合, 则相似度P=P+0.125, 找到相似度最大的数字, 按照下列判别式进行识别判断。
3 试验及总结
使用Visual C++6.0编制所有必需软件, 进行实践验证, 在P C K 6-2 3 0 0 (32MB内存) 上对400张小超市会员卡图像中的编号数字进行识别, 识别统计结果如表2所示。
实验表明该算法简洁、快速、可靠使用、抗干扰性强。但是由于此方法的局限性, 它对旋转较大的字符识别能力有待提高, 需要在预处理中用倾斜校正的方法得到直立图形。有了数字字符的编码器, 就可以根据它来识别数字。还有对于宋体以外的其他字体, 如果形状差异较大, 那么其特征也会发生很大的变化, 如图5所示。这时就需要构造多个编码器针对不同的字体进行识别。但是这又涉及到如何自动选择编码器的问题, 这是将来的研究方向。
参考文献
[1]Mori S J, Suen C Y, Yamamoto K.Historical Review of OCR Research and Development.Proc.IEEE, 1992, 18 (7) :1029-1057
[2]陈廷标, 夏良正.数值图像处理[M].北京:人民邮电出版社.1990.376-387.
[3]陶庆.统计决策法分析与研究[J], 北京统计.1997, 03:35-36
[4]Chang F, Lu Y C, Pavlidis T.Feature Analysis Using Line Sweep Thinning Algorithm.IEEE Transactions on Pattern Analysis and Machine Intelligence, 1999-02, 21 (2) :145-158
[5]Downton A C, Impedovo S Eds.Progress in Handwriting Recognition.World Scientific Publishing Co.Pte.Ltd., 1997
[6]Lam L, Suen C Y.Structural Classification and Relaxation Matching of Totally Unconstrained Handwritten Zip-code Numerals.Pattern Recognition, 1998, 21 (1) :19-31
[7]Huang Y S, Liu K, Suen C Y.The Combination of Multiple Classifiers by a Neural Network Approach.International Journal of Pattern Recognition and Artificial Intelligence, 1995, 9 (3) :197-206
印刷体数字识别 篇3
1 光字符识别
自20世纪50年代[1]商业光学字符阅读器出现起,各种使用文档和字符识别技术的产品和系统大量涌现到市场,极大地满足了当时的工业和商业需求。目前的一些商业性质识别软件主要有:Microsoft Office,Document Imaging,Exper Vision等。
开发实用OCR系统是一项很复杂的工作。从光学字符识别开始,研究人员就已提出了许多不同的方法来识别字符。例如试图识别字符的一个子集的特征点,该特征点是人对图像感兴趣的点[2]。它可能是两行之间的交叉、角或点空间。通常情况下,图像大小对字符识别的准确率也有影响,故作预处理时需对字符进行归一化。目前被证实有效的一种识别方法是人工神经网络(ANN)[3,4],它是一种由人类大脑处理信息启发的信息处理模式。人工神经网络是数学模型的集合,可看作代表一些观测特性的生物神经系统,并利用类比方法进行自适应生物学习[5,6]。利用神经网络进行字符识别的另一个优点是该系统具有良好的可扩展性,这种方法能够识别比训练集规模大的多的各种测试字符。因此,经过大量的研究和调查,本系统主要利用人工神经网络实现该系统,选择ANN中的后向传播算法BP(Back Propagation)实现关键功能。后面的部分将对BP算法作详细讨论。
2 BP神经网络
2.1 基本介绍
BP反向传播网络[7]通常分别由三层组成:输入层、隐藏层和输出层。图1清晰地描绘了BP网络结构。
该算法为一种监督训练,反向传播的基本步骤如下:(1)初始化网络随机权值并设置随机数种子;(2)计算期望输出和激活值的差值,估计网络的激活错误;(3)调整输出神经元权重,减少此输入模式激活错误;(4)将错误值返回到每个隐藏层神经元;(5)调整每个隐藏神经元权重,减少误差;(6)重复步骤(2)至(5);
重复训练直到网络满足要求为止。
该算法的难点在于如何找到最佳的方式使得每一次迭代适合地更新权重和阈值以尽量减少错误[8]。定义变量:output_o表示输出神经元的激活值,error_o表示输出神经元的错误值,error_h表示隐藏神经元的错误值,weight_ho表示连接一个隐藏神经元到输出神经元的权值。因此,反馈到隐藏神经元的误差信息可以由下面的式子计算得到。
2.2 系统的体系结构
由于该系统使用监督学习方法,所以在设置系统种子与模式前进行学习。这部分任务主要通过三个子过程完成,图2为系统架构示意图。
(1)输入模式到系统用于训练网络;(2)预处理是每幅图像,然后系统从图像中提取数据;(3)生成模式,这步为神经网络生成随机种子;(4)使用反向传播算法训练网络。
当该模式所产生的错误训练集低于某一阈值时,表示训练完成,该网络使用新的输入模式,并产生一个基于学习过程的经验输出。
2.3 数据结构系统建模
许多应用程序不提取实体,如神经细胞,神经元层,或网络的层次,而是在一个单一阶段构建整个神经网络结构。
神经元体系结构有利于这些实体分割成不同的层,也允许重复使用这些组成元件和规模较小的通用件,从而建立新体系结构。本系统通过这种方式实现面向对象模型(OOP)[9]。
下面介绍几个重要概念:
神经元:包含权值、输出值和输入值。
层:神经元集合,这是一个基类,它包含所有神经元的层次常见的功能。
网络:一个神经元层次集合的神经网络,它执行特定的神经网络结构。
激活功能:激活函数的接口。激活函数被用于神经元的激活。
反向传播学习:这个类包括所有的上一个项目BP算法解释的执行情况。
图3显示了系统各类之间的关联性。
3 生成模式
该系统主要针对印刷字符进行识别,在这种前提下,每个字母都被看作一个模式。下面分别介绍输入和输出部分。
输入:一个包含输入数据的数组,即字母图像的数字化表示。预处理模块负责计算基于图像的亮度阵列。将图片分割成正方形区域,并计算100个小区域的均值,然后使得图片数据取值变成区间0到1之间。上述处理过程可用图4表示。
输出:表示预期结果的阵列,阵列里包含的元素和被识别的字符数目一致。因此,为了识别英文字母“A”至“Z”,将需要包含26个元素的输出数组。
每个模式的输入被设置为数字化的图像数据,输出数组中的相应数值为1,网络将输出与输入数据对应。所有字符训练样本设置完之后,就可以开始训练网络了。
人们普遍认为,网络的输入层必须归一到0和1之间。该处理过程将图片分割成方形,并计算每张方形图的均值。然后把结果按比例缩减,求得矩阵的最大值,并根据它分割矩阵的元素输出。若标准的sigmoid的范围是从0到1或从-1到1,则只能取该范围内的输出,不需要进行缩放。
4 调整网络性能
前面的部分阐述了BP算法的工作原理,从分析中知道,反向传播过程是极其缓慢的,而实际需求希望它运行得更快。下面将讨论几种网络性能调整方法以便加快学习过程[10]。
4.1 Sigmoid函数
Sigmoid函数是一个神经元的非线性作用函数。神经网络的学习是基于一组样本进行的,它包括输入和输出。输入和输出有多少个分量就有多少个输入和输出神经元对应。最初神经网络的权值(Weight)和阈值(Threshold)是任意给定的,学习就是逐渐调整权值和阈值使得网络的实际输出和期望输出一致的过程。神经元的非线性作用函数是Sigmoid函数,即:
及其派生:
如图5所示。
而是因为神经元工作在0到1之间,略微调整功能函数为:
派生为:
通过计算得到如图6所示的结果,这一调整降低了运算复杂度并提高了效率,从而对规模更大的网络具有良好的鲁棒性。
4.2 调整锐度/增益:
训练时间可通过增加锐度或减少标准sigmoid函数的增益(α):
事实上,在没有动量的情况下训练耗时为1/α,有动量则为当α值太大时,这个方案不合适,最佳α值是小于1[11]。
4.3 隐藏层数量
输入层的神经元数量取决于可能的输入个数,而输出层的神经元数量取决于期望输出的个数。隐藏层数量和每层隐藏层的神经元个数不能事先确定,每个网络配置和数据类型需要进行调整。一般情况下,增设了一个隐层可能允许网络学习更复杂的模式,但同时降低其性能[12]。为了达到的目的,已经做了一些试验,增加隐层自0至3隐层。
正如表2可以看到,没有任何隐含层的网络已经能够识别,但是,当添加一个隐层,错误和训练时间也都增加了很多。最后,当添加多个层,网络变得缓慢,而不再能够学习。
4.4 隐藏层中的神经元
在确定隐藏层层数后,使用多少神经元以提高性能成为难点。首先确定一个函数G(x):
为了找出Z的最佳值,通过变化隐藏层的数目,进行了实验。测试结果如表1所示。
从表中数据可以看出,如果确定了隐藏层神经元的数目为输出的一半时(50%数量的字符),能取得很好的识别效果。在所有这些调整中,网络的错误值为“0/26”,这表明训练网络可以识别所有训练集,并能达到最佳效果。
5 系统接口
这部分主要阐述系统接口。首先设置随机种子,允许用户设置一个文件夹,其中包括所有的模式(图像),也包括各种不同的字体。然后,用户可以选择“生成模式”,并在屏幕显示所有数据的模式如图7所示。
下一步是建立网络,输入一个值为Sigmoid函数的参数:α。然后,加载“训练网”的模式。输入两个参数:学习率和错误限制(这是一个可容纳的错误,当网络达到这个值,它将会停止)。重复和错误显示给用户,直到它完成训练或者用户中止。训练结果如图10所示。
这一阶段完成了训练过程,我们可以看到第一次加载图像时的识别结果。按下按钮“识别”,网络开始匹配模式,运行完成后将显示结果:“网络认为该字符是:”,如图12所示。
6 实验结果分析
本系统用监督学习方法,第一步是测试阶段,输入训练数据的标记。然后,输入的新数据被划分为训练集。从英文词汇表中选定一个78个字母图像的样本库,标注代表每个字母的26幅图像的学习过程完成后,系统开始识别其他字符,结果表明如表3所示。
本次实验得出的字符识别准确率是83.33%。如果这是原始数据,那么这个比率是相当大,可以通过一个单独的预处理步骤提高。由于网络的特征值混淆产生字符识别错误,例如区别“0”和“D”或一个“Q”字和一个“O”。
第二个实验是用模糊图像做的,使用高斯方法添加噪声,如图14所示。
然后,把样本输入到系统,并获得满意的结果,如表5所示。
从表5中可以明显看到,计算的准确率略有下降,降到75.64%。在样本输入到系统后,测得下一个结果,如表6所示,最终得到的准确率是76.92%。
7 结论
实验结果表明,神经网络和BP算法能较好地适用于字符识别领域。本文对OCR系统进行了调整,开发了面向对象模型适合于神经网络的光学字符识别系统,并对多幅图片进行了测试,实验结果表明该系统能较大程度地提高字符识别率。未来的工作可以从以下2个方面开展:改进BP神经网络算法的研究;对隐藏层数目的确定及网络收敛性问题的探讨。
摘要:光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。
关键词:模式识别,离线字符识别,机器印刷字符,BP神经网络
参考文献
[1]Hiromichi F.Forty years of research in character and document recognition-an industrial perspective[J].The Journal of the PatternRecognition Society.Central Research Laboratory,Tokyo 185-8601,2008:1-3.
[2]Brown Eric W.Character Recognition by Feature Point Extraction[EB/OL].Northeastern University.Boston Massachusetts.http://www.ccs.neu.edu/home/feneric/charrec.html.
[3]Anderson J.An Introduction to Neural Networks[M].MIT Press,1995.
[4]Davalo E.NAIM P.Neural Networks[M].London:The Macmillan Press Ltd,1991:145.
[5]Cybenko G.Approximations by superposition of a sigmoidal function[J].Math.Control Signals Systems,1989(2):303-314.
[6]Funahashi K.The approximate realisation of continuous mappings by neural networks[J].1989:183-192.
[7]Wikipedia.Backpropagation[EB/OL].http://en.wikipedia.org/wiki/Backpropagation.
[8]Mohammed A.and WALID A.Speeding Up Back-Propagation Neural Networks[C].2005 Informing Science and IT Education Joint Con-ference,2005.
[9]Rogers J.Object-Orientated Neural Networks in C++[M].1996.
[10]Yoshio I,Alex P.Speeding up Back-Propagation[J].IJCNN-90-WASH-DC,Lawrence Erlbaum,1990(1):639-642.
[11]Thimm G,Moerland P,Fiesler E.The Interchangeability of learning rate and gain in the Backpropagation neural networks[J].NeuralComputation,1996,8(2).
印刷体数字识别 篇4
关键词:人民币,版本识别,投影,模板匹配,图像处理
0引言
人民币是国家发行的货币符号,是目前货币的主要流通形式,在国民经济活动中起着至关重要的作用[1]。 随着经济的发展,市场的需求,印刷工艺的提高,国家每隔一定的时间就会发行一套新的人民币,这时旧版本人民币就需要回收,以避免旧版本与新版本的混合使用,造成市场混乱,此外版本的混用,也不利于对假币的监督。如果使用传统的人工回收就会造成大量人力资源的浪费且效率低下。所以自动对人民币版本的识别, 将会具有十分重要的意义[2]。
人民币版本原始的识别方法是人工识别,这种方法会造成人力资源的浪费。目前在人民币版本识别方面主要有基于纸币长宽不同进行识别和基于局部区域的差别。不同版本的人民币长宽相差很小,甚至第五版50元与第四版5元长宽都一样,这就无法仅用基于长宽来判断纸币的版本[3]。但是不同版本的人民币背部的印刷年份都不相同,因此利用这一特征,就可以采用基于印刷年份这一局部区域的差别来进行版本的判别,这能很好地提高人民币版本的识别率和简化版本识别方法。
1图像的预处理
图像的预处理是图像识别前十分重要的工作。为了获取印刷年份,需要对图像预处理,包括图像的灰度化、边缘检测、倾斜校正等[4]。因为印刷年份字符位置相对固定,经过预处理就可进行初步的定位和提取,下面以99版100元人民币为基础,探讨基于印刷年份的人民币版本识别。
1.1图像的采集与灰度化
将人民币背面向上放在固定位置上,通过摄像装置拍摄多幅图像,采集到的图像是RGB彩色图,RGB彩色图几乎包含了人类视力所能感知的所有颜色,干扰信息较多,而灰度图只有图像的强弱信息,此外RGB图像存储三种颜色的信息,所需的内存要比灰度图大得多。所以需要把RGB彩色图转化为灰度图如图1所示。本文采用加权平均法进行图像的灰度化,灰度化公式采用工业标准化公式[3],公式如下:
1.2图像的边缘检测
检测图像边缘点是为了通过得到的边缘点进行最小二乘拟合得到边缘直线,进而得到图像的倾斜角[5]。 从图1可以看出纸币的区域与背景的像素值有十分大的差距,设纸币区域与背景之间阈值为T。由于图像倾斜缘故,边缘点可能不在同一条直线上,因此需要从纸币中间取边缘点。边缘点检测的具体步骤是:x从80到W-80(W为图像区域的宽度)由上至下直线搜索上,当灰度值发生阶跃性变化即大于T标记为边缘点,由下至上直线搜索下边缘点。令上边缘点为P0(x0,y0),下边缘点为P1(x1,y1)。y从80到H-80(H为图像区域的高度) 由左至右直线搜索左边缘点,由右至左直线搜索右边缘点 。 令左边缘 点为P2(x2,y2),右边缘点 为P3(x3, y3)。图2所示绿点部分标出了钱币图像的边缘。
用检测到的所有上边缘点P0,下边缘点P1,左边缘点P2,右边缘点P3进行最小二乘拟合,得到上边缘直线为y = k0x + d0,下边缘直线为y = k1x + d1,左边缘直线为y = k2x + d2,右边缘直线为y = k3x + d3,相邻边缘直线的交点就是纸币的顶点。根据上边缘直线的斜率k1得到cos2θ = 1 (1 + k12) ,倾斜角
1.3图像旋转
边缘检测中得到了顶点坐标和倾斜角θ,只需将图像绕左下角旋转θ度,就可进行图像旋转校正,得到水平图像。设左下角坐标为(x0,y0),原图像上任意一点为(x, y),旋转之后的坐标为(x1,y1),坐标变换矩阵方程为:
由矩阵方程可得到变换后坐标表达式如下:
根据上述公式,便可对图像进行旋转校正。
2印刷年份的提取
2.1印刷年份的初步提取
印刷年份位置是相对固定的,图像经过预处理,就可以初步从原图上切割出印刷年份的图像,由于切割出来区域印刷年份字符非常小,不利于识别,需要进行放大处理,本文将分割出来区域的宽高各放大为原来的4倍。 放大后印刷年份初步提取图像如图3所示。初步提取出来的图像范围较大,有其他的干扰信息,需要进一步精确定位,图3可以发现字符区域灰度值较小,为了使字符的灰度值与背景区分更加明显,先将图像最小值滤波,最小值滤波后的图像如图4所示。
2.2印刷年份的精确定位
印刷年份字符与其他区域灰度值有明显差别,且印刷年份字符的高度基本一致。
通过计算印刷年份区域图像灰度值的水平投影,得到其水平方向的差分矩阵记为T1,通过扫描矩阵T1得到一个最大值位置即为上边界,得到一个最小值即为下边界。假设有M×N个像素的灰度图像f(i,j),则水平,垂直投影差值分别如下:
印刷年份区域及其水平方向的差分如图5所示。 计算垂直投影,得到其垂直方向的差分矩阵T2,扫描T2得到左边界和下边界,印刷年分区域及其垂直方向的差分如图6所示。
3人民币版本的判别
3.1字符特征的提取
本文提取的是图像的八向特征,即提取图像8个方向的梯度特征作为统计特征[6]。可以选用Sobel算子或Robert算子来计算图像的梯度,本文选用的是Sobel算子。特征提取步骤如下:选用Sobel算子计算图像在x方向和y方向的梯 度 ,图像在点(x,y)处的梯度 向量
根据上述梯度向量g(x,y) = [gx,gy]T,然后把该向量分解到8个方向上 ,生成8个梯度子 图 ,梯度子图 如图7所示的。
3.2字符特征的识别
将将提提取取的的特特征征向向量量与模板中的特征向量逐一比较, 计算两向量之间的欧氏距离[7]。与待测样本相似度的距离最小的模板样本的版本作为待测样本的版本。假设第i个模板的特征向量为Zi,图像提取的特征为X,它们之间的欧氏距离如下:
4实验结果
本实验选取了100张99版和100张05版的100元人民币样张,模板样本有99版和05版的图像,将待测样本与模板样本一一匹配,与待测样本最为相似(即欧氏距离最小)的模板样本的版本作为识别结果,最终实验结果如表1所示。
从表1可以看到,利用人民币纸币背面印刷年份特征这一特征进行版本识别具有很高的识别率,在进行八向模板匹配后,其99版和05版人民币的识别都比较理想,完全可以应用到实际的系统中。
5结语
印刷体数字识别 篇5
在包装印刷过程中,也会结合更多承印材料与颜色,同时制作周期不断缩短。想要不被当前日趋激烈市场竞争所淘汰,生产企业一般被要求用最短时间,多次反复更改原先产品相关信息或设计图案。而数字印刷技术恰好就因为它短版印刷和可变数据而满足了以上要求,因而对其进行深入研究,对于包装印刷行业持续发展是非常有利,也是有必要的。
1 数字印刷技术新概念
数字印刷技术指的是通过数字方法,取得图文信息通过计算机操作以后生成电子文件,直接在纸张、橡皮布与板材等上成像,不需要像以往那样输出菲林与人工拼晒版,一种新型印刷模式。此项技术同时牵引出很多新概念,比如远程印刷、个性印刷、数据可变印刷与按需印刷等[1]。所谓按需印刷,指的是根据消费者需求,为其量身定做印刷。主要反映在印量可以调整,按照客户所需,一张也可以印制,同时印刷可以根据需要随时进行,达到零库存效果;远程印刷,指的是远程图文信息经网络通过异地设备输出印刷;数据可变印刷,指的是印张数据印制过程中根据人们需要随时做出调整,从而使每张数据都是色彩可变、图像可变的印制品;个性印刷,是指数据可变印刷与按需印刷高层级印制,高质量与高效率对客户个人资料和文件进行个性式印刷。
2 数字印刷技术在包装印刷中的应用
2.1 标签中的应用
因为市场竞争表现的越发明显,更多药品、消费品与食品等对产品推陈出新速度加快,包装更换速度也越来越勤。该产品供应厂商对标签印刷也就提出了更高的要求,需要通过较短时间,最快速将为数不多新标签与新设计印制好。此外大型公司往往对企业形象非常重视,通常在节假日会举办部分促销推广活动,或是比较特殊日子当中会考虑些纪念性活动。而该类活动举办时,往往会有些试用品派发,礼品数量为数不多,因而产品包装和标签数量也就不多,但是印制产品力求精美[2]。很明显,如果这时候采取传统印制办法,不单制版会花费较长时间,而且成本偏高,所以客户需求很难满足。但数字印制技术不需要排版,即使一张也可以,而且质量也比较好等,很适合这种情况下使用。所以,不论新产品试水,亦或是包装标签翻新,数字印制成本都是相对比较低的,对于新理念和新产品尽早问世很有好处。伴随数字印制技术被广泛应用于标签印刷当中,印刷商对完整数字印刷和印后加工集于一身的方案也会更为需求。这也就需要相关人员在后续不断对研究进行深化,并始终建立于人类需求基础之上。
2.2 软包装中的应用
因为当前软包装正在全速替代硬塑包装,所以其增长幅度较标签市场还要快,所以对于数字印刷需求量也在不断上涨过程中。想要对软包装市场进行开发,还是要把重心放在印刷速度上面。通常情况看,数字印制技术速度越发加快,被应用的范围也越广,就越有可能拓展新领域。伴随数字印制技术大力发展改革,当前传统印制市场也势必被取而代之。也可以预估数字印制技术应用于软包装市场的范围也会逐渐拓展,特别是在少量标准盒与用户特制包装当中,其发展前景定会十分良好。数字印制在满足了生产成本不高,但是质量并不下降的需要以后,假如印制速度再提升上去的话,那么在软包装等领域将会有更广阔的应用空间。在以往软包装印制领域,我们很多地方可以看到数字印制技术的身影。以往五年时间,亚特兰大printpack公司通过对相关设备的购置,当前其数字印刷程度已经至90%左右。因为此公司擅长于长版印刷,因而当有客户提出短版印制需求时,该公司选择同Waston公司合作[3]。Waston新近安装一部Omnius One Shot彩色数字印制机,结合此台机器可以对短版活件进行印制,同时周期更加缩短,成本大幅减少,而且要明显低于柔版印刷。
2.3 纸盒纸箱中的应用
以Menasha公司为例,该公司主要经营方向是给POP市场提供技术支撑,公司非常看重创新,坚持将前沿技术作为发展基础。该公司大量应用数字印制技术,究其原因在于该公司看到当前全世界都正向数字化世界过渡,而这也是历史发展必然。对大型消费品企业与供应商而言,要想对市场进行更详细的划分,呈区域化分布,数字印制就是其发展必由之路。应用数字印制成功秘诀在于规范工作流程与经验丰富操作人员,把新数字印制设备同当前工作系统相结合,会促使公司得到更广阔的发展天地。Odyssey数字印制公司为数字印制专门公司,拥有数台数字印刷设备,当前此公司在短版个性高尔夫盒、食品包装、DVD与CD等方面都大有建树,同时范围还在持续拓展,而数字印制技术也势必会促进此公司在未来谱写更为广阔的发展蓝图。
3 结语
综上所述,包装印刷市场当中,烟草与食品包装印刷排名第一,接下来是酒类与软饮料类包装印刷,然后是宠物食品、热饮、纺织产品、个人护理产品与卫生用品等。包装种类分为金属包装、硬塑料、纸盒、软包装与玻璃包装等。伴随新技术的不断发展,数字印刷技术因为它更为经济成本,可提供短版包装服务,所以近年来包装行业当中应用也逐渐增多。可以说数字印刷技术发展属于动态性的,伴随时代发展,人们要求越发提高,相信数字印刷技术也会有更多用武之地,而这就需要人们与时俱进、发散思维,给该项技术以更多应用空间。
摘要:最近几年,伴随网络不断发展流行,数字化也渐渐渗透于各行各业当中,对传统产业形成冲击同时,也有了新的发展动力与机会。作为包装印刷行业新宠,可以看到数字印刷技术因为它个性印制、数据可调、流程简便与短版优势明显等特征,更多受到行业内人士关注和青睐。在如此受到大家追捧与发展势头迅猛情况下,可以说数字印刷技术足可以称之为印刷行业新的里程碑,是印刷历史上新的一轮变革。
关键词:数字印刷技术,包装印刷,应用
参考文献
[1]黄耀春.数字印刷技术与纸包装产业[J].品牌,2015(03):45.
印刷体数字识别 篇6
作为柯尼卡美能达bizhub PRO家族的又一新成员,这款黑白数字印刷系统将生产力、图像质量、可靠性和人性化提高到一个新的层次。除了单色打印功能外,还配合着多种综合解决方案,具备更强的综合竞争力,可以满足印量较大的文印店、企业内部文印中心,政府机关文印中心、学校等不同用户的多种需求,帮助用户进一步拓展自己的生产能力,将成本和生产周期降至最低,从而获得更多的业务,创造更多的利润!
高生产力和高可靠性
bizhub PRO 951快速响应以及处理纸张的能力,是它最突出的优势之一。
bizhub PRO 951打印速度为95页/分钟,最大月印量可达150万印,在40至216g/m2的纸张范围内,可实现不降速输出,并且可处理最大纸张克重为350g/m2。bizhub PRO 951主机配有两个纸盒,供纸量可达3000张,配合大容量纸柜,容纸量最大可达9000张,可处理最大324×483m m尺寸的纸张。预热时间不超过390秒,首页复印时间仅为3.4秒或更少。
为了拓展设备的应用,选购相应的印后组件将大大提升bizhub PRO 951的性能。Z型折页打孔组件可实现Z型折页,也可进行2孔或4孔的打孔,帮助客户降低订单制作时间以及人力成本。同时柯尼卡美能达推出了新的排纸处理器,配合其它的选购件提高它的综合能力,帮助客户实现更多应用。比如,配合鞍式装订器,可进行最多20张纸的鞍式装订;配合页面插入器可对文件进行自动插页,而无需人工执行;配合打孔组件,可对文件进行2孔或4孔的打孔。
bizhub PRO 951的高可靠性是实现其高生产力的有力保证。它采用了超坚固机架和柜式双层底盘以实现卓越的耐用性,能够经受繁重和不间断的使用考验;超坚固构造也有助于防止震动和扭曲受损,可确保稳定性能。可靠性更高,停机时间更少,极大地降低了运行成本。
高品质打印
通过使用柯尼卡美能达LPH (LED打印头),bizhub PRO 951打印分辨率可达1200×1200dpi,细节表现更突出,呈现出更高质量图像。带式转印技术使其在优化处理高浓度图像表现的同时,带来更平滑的图像灰阶过渡。柯尼卡美能达专利Simitri HD高清晰聚合碳粉将细微、统一规则的碳粉颗粒渗透在纸张的纤维内,保证长久而稳定的输出品质,带来可与胶印相媲美的输出效果。较低温度下就可将聚合碳粉附着在纸张上,减少纸张发生卷曲的情况,从而也防止由于纸张热胀冷缩使得双面打印发生纸张移位的情况。
●网屏设定
柯尼卡美能达开发了适用于bizhub PRO 951输出的预设网屏(3种模式,6种类型)和点阵网屏。优化处理各种图像、文本和混合数据。选择最适合特定输出类型的网屏,可最大化提高打印品质。
●色调曲线应用程序
色调曲线应用程序是打印控制器的标准组成部分。利用该程序可调节图像亮度和对比度,以防止图像过亮或过暗。无需再使用其他软件,仅通过此程序就能简单、快速地调节图像。而在调节图像时,可保持文字浓度不受影响。
●CIE色彩空间
CIE色彩空间转换功能可将彩色数据精确转换为单色再现。该模式可生成更丰富的阴影、精细的高亮效果和平滑的阶调。运用此功能,客户可根据需求实施色彩管理,进一步实现完美的图像打印,提高客户满意度。
●通用设计和易用功能
bizhub PRO 951采用了明亮的15英寸彩色LCD触摸显示屏,便于用户轻松管理设备运行和监控进度,为方便操作,面板会适时显示帮助信息,提供简单的指示说明;而且设备从纸盒到按钮无不采用了以方便用户为基础的设计,带来更多操作便利性。此外,配合多种解决方案,可进一步拓展设备应用,帮助客户有效地管理设备,提高设备的利用率,降低成本。
在环保方面bizhub PRO 951更是广泛采用了可再生的PC/PET材料和植物型生物塑料,减少对环境的不良影响;同时多种技术的应用,可在保证质量和生产力的同时减少废物排放、能耗及不必要的成本。
【印刷体数字识别】推荐阅读:
数字印刷风暴12-03
数字印刷技术应用11-05
数字印刷实习报告07-21
数字印刷技术新进展05-13
数字印刷发展现状综述10-04
数字印刷技术实习参观体会08-19
数字印刷机的维护保养06-08
承接超市海报设计印刷、画册设计印刷06-07
北京印刷公司对印刷的五个基本要素介绍08-18
印刷市场06-04