车牌字符识别(精选7篇)
车牌字符识别 篇1
1 汉字的分类识别
按照我国机动车号牌标准, 车牌的第一个字符为汉字, 并且该字符为省、自治区、直辖市简称和一些特殊字符, 总共37个汉字, 且汉字字体有标准统一, 因为所有的机动车号牌中第一个汉字字符固定, 是37个汉字中的一个, 因此我们可以对每个字符进行特征统计, 通过聚类的思想对字符进行分类。
2 基于聚类的汉字字符判别
汉字字符的分类识别识别与其他分类一样, 同样分为三个步骤:分类对象特征提取;构建分类器;分类计算。
2.1 提取特征向量
本文将通过数字图像的统计特征进行字符特征的提取。
对每个字符iy建立特征向量yi (28) (7) xil, xi2, (43) , xin (8) 。首先, 对车牌中的37汉字字符标准的图像样本进行特征统计, 读取图像后, 转换为二值图像。提取特征包括字体占有率、左右分布比例、上下分布比例。
从37个字符中可以看出, 随着每个汉字字符的笔画数目复杂程度不同, 字符的占有率、左右分布、上下分布各不相同。因此, 这些特征对于字符的判别分类具有重要的意义, 首先, 通过图像的数值矩阵结构特征计算图像边界:Bou, 1Bou2, Bou3, Bou4分别为边界上下左右的行列号。下面对这些特征信息进行提取:
占有率:
左右分布:
上下分布:
至此, 完成对汉字特征的提取, 下面对汉字进行识别。
2.2 聚类分类识别
这里我们仍然采用聚类分析的思想, 通过衡量距离计算相似度, 达到对汉字字符分辨识别的目的。根据上面建立的样本集合Y, Y (28) yii (28) , 1, 2, 3 (43) , 37, 首先, 采集样本信息, 计算出每一个向量iy, 然后对每个判别对象y0进行相同信息的提取, 然后进行测度衡量。
2.3 分类计算
下面将样本代入进行计算, 通过预处理、放缩、角度校正等得到字符图像的二值图, 对样本y0进行直接聚类法判别, 结果如表1。
从表1中我们可以看出, 最小距离为1.1521, 判别结果为‘京’, 结果正确。
摘要:车牌字符分割后的字符识别是车牌识别系统的技术关键, 目前字符识别的主流技术方法为基于字符特征提取的神经网络识别。目前国际上对字符识别技术有了较为成熟的研究成果, 但是, 这些技术尚不能对中国机动车牌中的汉字部分进行识别。本文将对车牌的汉字识别技术提出基于统计的识别方法, 并对汉字的特征提取提出相应的技术方案。
关键词:统计,车牌识别,特征提取,分类器
参考文献
[1]邹永星.车牌字符分割方法的研究[D].硕士学位论文, 湖南:湖南师范大学, 2008.
[2]王广宇.车辆牌照识别系统综述[J].郑州轻工业学院学报 (自然科学版) , 2001, 16 (2) :47-50.
[3]陈瑜.车牌识别系统关键技术研究[D].硕士学位论文.湖南大学, 2011.
神经网络在车牌字符识别中应用 篇2
近年来, 神经网络的智能化特征与能力使其应用领域日益扩大, 潜力日趋明显。许多用传统信息处理方法无法解决的问题采用神经网络后取得了良好的效果。其中, 神经网络在车牌字符识别中的应用效果尤为明显。目前, 车牌字符识别主要采用两种方法, 即模式匹配法和神经网络法。由于神经网络模式识别方法能够实现基于计算理论层次上的模式识别理论所无法完成的模式信息处理工作, 这种方法是选用适当的字符图像特征提取方法, 然后使用训练样本训练网络并构建一个识别网络作为分类器。所以, 相信未来一段时期内神经网络在车牌字符识别领域中的应用还会是趋于主导地位。
1. 人工神经网络简介
人工神经网络[1] (ARTIFICIAL NEURAL NETWORK, ANN) , 亦称为神经网络, 是对人脑或生物神经网络的抽象和建模, 具有学习能力, 以类似生物的交互方式适应环境。神经网络是智能科学和计算智能的重要部分, 为解决复杂问题和实现自动控制提供有效的途径。
1.1 人工神经元
人工神经元是可以模拟生物神经元的一阶特性一输人信号的加权和。神经元在获得网络输入后, 它应当给出适当的输出。按照生物神经元的特性, 每个神经元有一个阈值, 当输入信号的累计效果超过阈值时, 就处于激发态;反之, 则处于抑止态。为使系统有更宽的适用面, 人工神经元应有一个更一般的变换函数, 用来变换所获得的网络输入, 这就是激活函数。将人工神经元的基本模型和激活函数合在一起构成人工神经元。一个典型的人工神经元[1]模型如图1:
2. 反向传播网络
反向传播网络 (BP网络) 是一种多层前馈网络, 它是神经网络的重要一类, 一直是神经网络中最为流行的神经计算模型, 得到了极其广泛的应用。反向传播网络有以下三个突出的特点。1.网络中的每个神经元模型包括一个非线性激活函数。2.网络包括一层或多层神经元的隐层, 这些隐层神经元逐步从输入模式 (向量) 中提取更多的有用特征, 可以是网络学习复杂的任务。3.网络的连接强度由网络突触决定。
2.1 反向传播网络的结构
反向传播网络实际上是一个多层感知器[5], 因而具有具有类似多层感知器的体系结构, 也即典型的前馈神经网络的体系结构。下图所示为一个具有一个隐层和一个输出层的多层感知器结构图:
2.2 BP网络的结构设计原则
首先, 隐层数的选择:理论分析表明, 具有单隐层的前馈网可以映射所有连续函数, 只有当学习不连续函数时, 才需要两个隐层, 所以多层前馈网最多只需两个隐层。本文采用只含一个隐含层的三层BP神经网络来进行车牌字符的识别。
其次, 隐节点数的选择:隐节点的作用是从样本中提取并存储其内在规律, 每个隐节点有若干个权值, 而每个权值都是增强网络映射能力的一个参数。隐节点数量太少, 网络从样本中获取的信息能力就差, 不足以概括和体现训练集中的样本规律;若节点数量太多, 则会出现所谓“过度吻合”问题, 反而降低了泛化能力, 还会增加训练时间。因此, 通常情况下, 网络隐含层神经元数目的选择原则是:在能够解决问题的前提下, 再加上1到2个神经元以加快误差的下降速度。
2.3 BP算法的缺陷与改进
将BP算法用于具有非线性转移函数的三层前馈网, 可以以任意精度逼近任何非线性函数, 这一优势是多层前馈网得到广泛的应用。然而标准的BP算法在应用中暴露不少内在缺陷。如:容易形成局部极小;收敛速度慢;学习新样本有遗忘旧样本的趋势等。针对以上问题, 对BP算法的改进常用的方法主要有:增加动量项;自适应调节学习率;引入陡度因子等。
3. 基于神经网络图像识别系统
神经网络的图像识别系统是神经网络模式识别系统的一种。一般神经网络图像识别系统由预处理, 特征提取和神经网络分类器组成。预处理就是将原始数据中的无用信息删除, 二值化和进行幅度归一化等。神经网络图像识别系统中的特征提取部分实际上是传统方法与神经网络方法技术的结合, 这种方法可以充分利用人的经验来获取模式特征以及神经网络分类能力来识别目标图像[6]。特征提取必须能反映整个图像的特征, 具有很强的抗干扰能力。
当BP网用于分类时, 首先要选择各类的样本进行训练, 每类样本的个数要近似相等。其原因在于一方面防止训练后网络对样本多的类别响应过于敏感, 而对样本数少的类别不敏感。另一方面可以大幅度提高训练速度, 避免网络陷入局部最小点。
神经网络在样本学习中就像人记数字一样, 学习样本时的网络权值调整就相当于人记住各个数字的形象, 网络权值就是网络记住的内容, 网络学习阶段就像人由不认识数字到认识数字反复学习过程是一样的。神经网络是按整个特征向量的整体来记忆图像的, 只要大多数特征符合曾学习过的样本就可识别为同一类别, 所以当样本存在较大噪声时神经网络分类器仍可正确识别。在图像识别阶段, 只要将图像的点阵向量作为神经网络分类器的输入, 经过网络的计算, 分类器的输出就是识别结果。
4. BP神经网络在车牌字符识别中应用设计
对采集到的车牌图像, 经过定位、预处理、分割和归一化等处理之后, 下面就要从被分割归一处理完毕的字符中, 提取最能体现这个字符特点的特征向量。将提取出训练样本中的特征向量输入BP网络之中就可以对网络进行训练, 提取出待识别的样本中的特征向量代入到训练好的BP网络中, 就可以对字符进行识别[2]。
4.1 13点特征提取法
本文采用13点特征提取法[4]来提取特征向量, 把字符平均分成8份, 统计每一份内黑色像素点的个数作为8个特征, 即分别统计这8个区域中的黑色像素点的数目, 可以得到8个特征。然后统计水平方向中间两列和竖直方向中间两列的黑色像素点的个数作为4个特征, 最后统计所有黑色像素点的个数作为第13个特征。如下图所示:
4.2 BP网络分类器设计。
根据车牌字符的特点:车牌第一个字符为汉字, 第二个字符为英文字母, 第三、四个字符为英文字母或数字, 第五到第七个字符均为数字。本文构造了4个含一个隐含层的三层BP神经网络, 分别用来识别汉字、英文字母、英文字母或数字以及数字。用于识别汉字的BP神经网络, 它有13节点输入 (即13特征提取法) , 6个输出节点。用于识别英文字母的BP神经网络, 它有13个节点输入, 10个节点输出 (由于实际情况的限制, 拍摄到的汉字和英文字母样本较少) 。用于识别英文字母或数字的BP神经网络, 它有13个输入节点, 20个输出节点 (其中英文字母10个, 数字10个, 共20个) 。用于识别数字的BP神经网络, 它有13个输入节点输出节点10个[3]。
5. 实验
以识别数字的神经网络为例, 通过matlab模拟。
首先, 样本的选择。实验采用由CCD拍摄到的50幅汽车图片, 选取其中的20张为训练样本, 剩余的30张为测试样本。首先对采集到的各图片进行定位、预处理、分割以及归一化等操作后, 各原始图片变成大小都为16×16的字符图像, 接着利用13特征法进行特征提取, 将其作为网络的输入。对于每一个车牌字符, 通常选用5个左右的不同字符作为训练样本, 例如字符1, 从分割后的图片中选, 5个不同的字符1作为网络的输入。
其次, 初始权值、激活函数的选取以及各参数的设定。网络的权值和阈值为随机选取, 各层的激活函数依次为双曲正切S型函数tansig m和线性函数purelin.m。本文采用了附加动量法和自适应学习速率调整法两种策略, 各参数依次设定为:误差目标goal=5×10-3;学习速率η=0.1;学习速率的递增乘因子η_inc=1.15;学习速率的递减乘因子η_dec=0.8;动量因子mc=0.95[1]。
最后, 识别数字的网络输出。网络的设计是为了使其输出矢量在正确的位置上输出为1, 而在其他位置上输出为0。然而噪声输入矢量可能导致网络的1或0输出不正确, 或出现其他输出值。为了使网络具有抗干扰能力, 在网络训练后, 再将其输出经过一层竞争网络函数的处理 (在MATLAB下为compet.m) , 使网络的输出只在最接近输入值的输出位置输出为1, 保证在其他位置输出均为0。对于1到5的这5个数字, 实验结果表明网络对测试样本的识别率接近100%, 其对应的输出表如下表所示:
6. 结论
目前BP网络是神经网络中字符识别应用比较在成功的, BP人工神经网络具有很强的自适应学习能力;具有执行非线性任务和去除噪声的能力, 使它能够很好的用于分类和预测问题;因此, BP神经网络为车牌识别系统中的重要环节即车牌字符识别, 不仅提供了有效的智能化的理论思想, 还对车牌字符识别的效果和速率及质量提供了保障, 扩展和丰富了车牌字符识别的方式方法。
参考文献
[1]高隽人工神经网络原理及仿真实例.2007.2月第2版
[2]魏武, 黄心汉等.基于模板匹配和神经网络的车牌字符识别方法.模式识别与人工智能, 2001, 14 (1) :123~126
[3]苗迪铭, 宣国荣.神经网络在车牌字符识别中的应用.微型电脑应用, 1999, 4 (16) :5~8
[4]刘智勇, 刘迎建.车牌识别中的图像提取及分割.中文信息学报, 2000, 14 (4) :29~34
[5]R.Parisi, et.al.Car Plate Recognition by Netural Networks andImagineProcessing.In:IEEE ISCAS.USA, 1998, Ⅲ-195-Ⅲ-198.
车牌自动识别中的字符特征提取 篇3
关键词:特征提取,复杂性指数,归一化
0 前 言
汽车牌照自动识别技术是智能交通系统中的关键技术之一,广泛应用于高速公路出入口、港口、机场、停车场管理处、军事要塞等场所。汽车牌照自动识别系统一般由图像采集、牌照定位、字符分割和字符识别4部分组成。车牌定位与字符分割技术已能基本满足实际需要,字符识别仍然是个瓶颈。对于应用模糊神经网络进行车牌字符识别的方法,识别结果与特征提取密切相关,而特征提取比较耗时,因此特征提取是关键所在。
本研究主要探讨车牌自动识别中的字符特征提取。
1 车牌字符的特征提取
特征抽取的目的是获取一组“少而精”的分类特征,即获取特征数目少且分类错误概率小的特征向量。目前,在特征提取与选择时还没有通用的理论作为指导,在实际问题中只能根据实验对比来确定分类的特征及相应的算法。一般的方法主要有基于统计的特征选取和基于字符结构的特征选取方法。无论哪种方法,用于字符识别的分类特征应具有较强的分类能力,即同一类中各样本间距离应尽量小,而类与类之间的距离则应尽量大,最好没有交叠部分。要具有较高的稳定性和抗干扰性,且特征向量应便于提取,算法要尽量简便,在保证识别系统性能的前提下,特征向量的维数不能过高,以减少机器开销,提高运算速度。
综合考虑上述因素,本研究根据车牌字符特性提取了笔画的4个复杂性指数,以及面积、复杂度、占空比共7个字符特征。
1.1 笔画的复杂性指数
车牌字符的结构有的简单,有的复杂。横笔画多的字符,垂直方向复杂;竖笔画多的字符,水平方向复杂[1,2]。为了反映出最能包含字符特点的字形和笔划结构,本研究引入了字符的复杂性指数,根据笔画复杂性指数的不同对字符加以分类。
实验中本研究将字符区域依次划分,如图1所示。图1中,4个方向分别为水平方向、竖直方向、右斜方向和左斜方向,本研究分别在各方向上计算黑象素总数和2阶中心矩。
设字符二值点阵图像为f(i,j),点阵的大小为M×N,ic,jc分别为字符质心的0°、90°方向坐标。S1、S2、S3、S4、S5分别代表0°、45°、90°、135° 几个角度方向的像素点黑像素总数,定义为:
M1,M2,M3,M4为对应方向的2阶中心矩:
字符在4个角度的复杂指数定义为:
由此构成四维特征向量X=(t1,t2,t3,t4)。这些特征量能很好地反映经过倾斜度校正的车牌字符的特征。
1.2 面积
这里的面积指的是字符目标区域所包含的像素个数,对于目标像素的灰度值为“0”的N×M的数字图像,面积A的计算式如下:
1.3 复杂度
复杂度C的计算式如下:
式中 L—周长;A—面积。
在相同条件下,圆形的周长最短,可称为最密集的形状,C=1;随着周界凸凹加剧,周长增大,C随之增大,因此常用复杂度作为区域相对于圆的离散性度量。
1.4 占空比
占空比L的计算式如下:
其中,最小外接矩形的长定义为连接目标边界上最远两点的距离,该直线称为长轴;宽定义为位于长轴两侧的目标边界点到长轴的最远距离之和。
2 数据归一化处理
在统计分析过程中,各个数据之间的量纲不相同,量级差别也很大,若直接进行后续处理,则对系统的性能影响很大。为了消除各特征之间量纲、量级等不同的影响,且使各个指标具有可比性,在分析之前需要对原始数据进行归一化处理[3,4]:
式中 xij、x′ij—第i个字符的第j个特征变换前和变换后的数据;xjmax、xjmin—n个字符中第j个特征的最大值和最小值。
3 字符特征提取
3.1 字符特征提取示例
车牌包含的字符模板可以分为如下3类:①汉字54个,包括京、津等省级简称31个,甲、乙等天干10个,子、丑等地支12个,以及“警”字;②英文字母26个:A、B、……Z;③阿拉伯数字10个:0、1、……、9。
在实验中分别对90类字符进行特征提取。特征提取步骤如下:
第1步,特征形成。根据传感器的测量值产生被识别对象的一组原始特征。
第2步,特征选择。根据本研究提出的特征提取方法确定车牌字符的7个特征。进行字符特征选择的主要原因在于原始特征很多,如果把所有的原始特征都作为分类特征送往分类器,不仅使得分类器复杂,分类计算判别量大,而且分类错误概率也不一定小,因此需要减少特征数目[5,6]。
例如:根据上述步骤对如图2所示的字符图像进行处理,其中字母B和数字2的提取结果,如表1所示。
3.2 归一化处理
由表1可知,各种字符特征数据的值域范围、数据分布均不同,为突出小数据特征的分类作用必须对所有特征值归一化处理。根据本研究提出的方法进行归一化处理,所得结果,如表2所示。由表2可知,归一化后各特征无量纲,各个指标具有可比性,为字符的识别提供了准确信息。
3.3 字符模型库的建立
分类器设计的好坏,对于字符识别效果有着重要的影响。模糊逻辑技术与神经网络技术是解决车牌识别这一复杂非线性问题的理想途径。对于利用模糊逻辑技术设计的模糊分类器,提高识别率的关键因素之一就在于能否获得一个良好的字符模型库。
以每类目标样本集特征的均值和方差来描述该类目标,即每类目标将对应一个确定的均值和方差矢量。假定共有c类目标,每类目标共有D个较好的特征和N个训练样本。每个样本中提取出的特征记为fijk,其中,i表示目标类,j表示特征序号,k表示样本序号。则第i个目标类特征的均值和方差矢量为P(i),Q(i),即:
根据本研究的特征提取方法,D的取值应为7。7个特征不仅具有较强的分类能力而且所构成的特征向量维数低,大大减少了机器开销,从而能提高识别算法速度。此外这7个特征具有较高的稳定性和抗干扰性,对字符的平移、旋转和尺度变换不敏感,从而为字符识别率的提高打下基础。
4 结束语
利用抽取到的90类数据的特征,本研究设计了一种基于模糊决策的模糊分类器,该算法由2部分组成:①建立各类字符的模型库;②利用模糊决策的方法对待识别样本进行识别分类。
以上算法本研究采用Visual C++ 6.0编程,并对1 000幅牌照进行了识别,识别算法不仅运算量小、速度快、效率高而且其字符识别率达96.2%以上,大大超过统计模式识别率92.3%。其主要原因在于本研究根据车牌字符特性提取的7个典型的形态学特征,具有较强的分类能力、较高的稳定性和抗干扰性,有助于建立完善的字符模型库。
参考文献
[1]杨枝灵,王开.数字图像获取处理及实践应用[M].北京:人民邮电出版社,2003.
[2]王永茂,刘贺平.强噪声车牌图像中的字符识别[J].计算机仿真,2006,23(12):244-246.
[3]DEFRIES R S,TOWNSHEND J R G.NDVI-derived landcover classification ata global scale[J].InternationalJournal of Re-mote Sensing,2004,15(17):3567-3586.
[4]王枚,王国宏.利用伴生与互补颜色特征的车牌定位新方法[J].计算机工程与应用,2007,43(1):206-211.
[5]李正峰,侯杰.基于改进遗传算法的车牌图像分割[J].计算机应用研究,2005,26(9):15-17.
车牌字符识别 篇4
关键词:车牌识别系统,二值化,字符分割,先验知识,垂直投影
1 引言
车牌字符分割是车牌识别系统(Vehicle License Plate Recognition System,简称VLPRS)的三大关键技术之一。车牌定位后得到的是一个包含车牌字符的近似水平条形区域,为了进行字符识别,需要将车牌区域中的单个字符分割出来。字符分割的正确与否,直接影响识别的正确性。通常车牌图像中存在较大的干扰、噪声,可能产生字符粘连或字符断裂、字符的笔画可能变粗、字符的轮廓模糊不清等现象。这些都给正确的分割带来了困难。本文在车牌区域预处理的基础上提出了一种基于先验知识的垂直投影字符分割方法。
2 车牌字符分割
提取车牌区域后,得到的可能是从原始图像中分割出的彩色车牌区域图像。由于其可能存在着边框、铆钉、噪声干扰等,为了能迅速准确的进行单字符分割与提取,必须对定位后的彩色车牌区域图像进行预处理。预处理主要包括对其大小归一化、灰度化、去噪、二值化、去除边框和铆钉等。
2.1 车牌区域图像的预处理
2.1.1 车牌区域大小归一化
车牌定位后得到的彩色车牌区域图像,由于拍摄时的距离、角度等因素的影响,它们大小不一,不适于快速、正确的进行单字符的分割。这就需要根据车牌的特征对定位后的车牌区域进行归一化处理,即把车牌区域的尺寸规范到一个统一尺寸上再进行单字符分割。常用的大小归一化的方法是将车牌区域外边框按比例线形放大或缩小成为规定大小的区域。
2.1.2 OTSU二值化
彩色图像包含大量信息,给图像存储及处理速度带来很大不便。为了减少图像信息,提高处理速度,以及方便字符分割,需要对定位后的车牌区域进行二值化。二值化图像画面内只包含黑色和白色两种颜色,容易将图像中的目标和背景分离出来。图像二值化的关键在于阀值T的选取。根据阀值T来区分图像中的对象和背景。
在各种二值化方法中,全局阀值方法对输入图像量化噪声或不均匀光照等情况抵抗能力差,在分割时会出现断裂和大面积粘连现象,应用受到极大限制;局部阀值法[1]也存在缺点和问题,分割时会出现非字符区域的干扰和粘连现象。当两个相邻的块的阈值相差太大,二值化后的车牌字符就可能造成变形,不能保证字符笔划连通性,降低了识别率。而且,该方法实现速度慢、容易出现伪影现象。
本文采用全局动态阀值化方法进行二值化。该方法是从整个灰度图像的像素分布出发,寻求一个最佳的阀值。其中经典算法是OTSU算法——类间最大方差算法[2]。该方法的主要思想是从图像的灰度直方图中把灰度的集合用阀值t分为两类,然后根据两个类别的平均值方差——类间方差和各类的方差——类内方差的比为最大来确定阀值t。该阀值即为二值化图像的最佳阀值。这种方法不论图像的直方图有无明显的双峰,都能得到较为满意的效果,因此这种方法是阀值自动选取的较优方法。
Otsu算法有以下优点:该算法实现较为简单;它是基于图像的整体特性而非局部特性的;它可以推广到多阀值的分割方法中去;该算法适应性较强。
2.1.3 其他基于车牌区域图像的预处理
为了更好地对车牌字符进行分割与识别,还需要对车牌区域图像进行诸如灰度化、倾斜校正、去除边框、去除铆钉等预处理,限于篇幅,此处不再详细叙述。
2.2 车牌单字符分割
经过预处理后的车牌是大小统一的包含所有车牌字符的二值图像。由于识别是逐个字符进行的,这就需要将二值图像进行单字符分割。字符分割的方法很多,如小区域投影方法结合四连通算法的字符分割算法、利用Hough变换和先验知识的车牌字符分割算法等等。但这些算法实现复杂,实时性不高。常用的字符分割方法有模板匹配法、水平投影法、聚类分析法等。下面就这些方法做个简介,并在此基础上提出自己的字符分割方法——基于先验知识的垂直投影字符分割算法。
2.2.1 常用车牌字符分割算法简介
1)模板匹配法[3]:
该方法先在二值图像上计算竖直积分投影的平滑曲线,搜索平滑曲线的局部最小值得到一个波谷位置序列;再将相邻两个波谷分别作为左右边界提取出一组矩形区域;最后,根据一定的规则对矩形区域进行删除、分裂、合并及调整大小。从而实现对车牌区域的单字符分割。该方法执行速度较快,能较好地解决汉字不连通问题,而且能克服分割过程中复杂背景的干扰,对车牌尺寸的变化及磨损也有很强的适应性。但该方法程序设计复杂,对车牌左右边框分割不准,有待改进。
2)水平投影法[4]:
该方法先自下而上再自上而下对车牌区域图像进行逐行扫描,找到并分别记录下扫描到的第1个白色像素点位置,确定图像大致的高度范围;在此高度范围之内再自左向右逐行扫描,遇到第1个白色像素时认为是字符分割的起始位置,然后继续扫描,直至遇到没有白色像素的列,则认为是这个字符分割结束。重复上述过程,直至图像的最右端,得到每个字符比较精确的宽度范围;在已知的每个字符比较精确的宽度范围内,再分别进行自上而下和自下而上的逐行扫描来确定每个字符精确的高度范围。此方法主要是针对在车牌定位、图像预处理后比较规则的车牌图像比较常用。优点是程序逻辑设计简单,循环执行功能单一,便于设计和操作,而且程序执行时间短。但是它对字符的粘连问题,解决得不很理想,且在汉字的不连通问题上也存在不足[6]。
3)聚类分析法[5]:
该方法是按照属于同一个字符的像素构成一个连通域的原则,再结合先验知识:字符的高度、间距的固定比例关系等,来逐个分割车牌区域中的字符的。该方法分割精确,很好的解决了汉字不连通的问题,对噪声干扰及车牌磨损问题也能较好处理。但其程序设计复杂,执行时间长,较投影分割速度慢。
2.2.2 车牌先验知识
标准车牌是由指定国家机关按规定制作的,其特征固定,先验知识明确。充分利用先验知识有助于单一字符精确切分。
除军车、警车、教练车、领使馆车外,标准车牌格式是X1X2·X3X4X5X6X7,共有七个字符和一个点符号。其中第一个字符X1是各省、市、军区和自治区的简称,一般是汉字;第二个字符X2是大写的英文字母;接着是一个点·;第三、四位字符X3和X4可能是大写英文字母,也可能是阿拉伯数字;目前,第五到七位X6和X7均为阿拉伯数字。
另外,标准车牌长度为450mm,字符总长度为409mm,其中单个字符宽度为45mm,高度为90mm,第二和第三字符间间距为34mm,其中中间小圆点宽度为1Omm,与第二和第三字符间间距均为12mm,其余字符间间距为12mm;字符“1”的宽度约为13.5mm,与其它字符间间距约为22.5mm,连续两个字符“1”间间距约为38.5mm,第三字符为字符“1”时,与第二字符间间距约为44.5mm。
2.2.3 基于先验知识的垂直投影字符分割算法
在预处理后的车牌区域上,充分结合车牌的先验知识,再利用垂直投影算法对车牌区域进行单字符分割,可以获得较好的分割效果。其算法可按下面步骤实现:
1)利用Hough变换求取字符水平分割线;
2)对车牌区域进行字符垂直投影,寻找字符垂直投影的谷底,将谷底位置作为候选垂直分割线的位置;
3)根据水平分割线和候选垂直分割线提供的位置信息,并利用车牌尺寸的先验知识,估算整个车牌的宽度和每个字符的宽度;
4)估算出车牌尺寸以后,利用车牌尺寸的先验知识,再估算出前两个字符和后面5个字符之间的大间隔的位置,然后根据垂直投影以及方差信息,在估算出的位置附近搜索,确定大间隔的左右边界;
5)根据4)中确定的大间隔的位置,并利用先验知识估算出垂直分割线的位置,然后再在估算出的位置附近,根据垂直投影以及方差信息,从候选垂直分割线中确定最终垂直分割线。确定垂直分割线时,需要通过强化先验知识的约束来准确定位。
从大量的实验结果看,此方法能得到较好的分割效果,可以满足系统对字符分割的需求。下面是对车牌单字符分割的过程与结果图示。
3 总结
通过与几种常用的字符分割方法的比较以及实验的验证,本文提出的基于先验知识的垂直投影字符分割方法,在对定位出的车牌区域进行归一化、二值化等一系列处理后,能迅速、准确地对车牌区域字符进行单字符分割。这为后续的字符识别打下了良好的基础,能够满足车牌识别系统的实时性、准确率的要求。
参考文献
[1]吴冰,秦志远.自动确定图像二值化最佳阀值的新方法[J].测绘学院学报,2001,18(4):1-2.
[2]吴传孙,邹德扬,周定康.二值化算法在车牌识别中的应用[J].计算机与现代化,2003.6:13-16.
[3]范玮琦,穆长江.一种基于汉字结构特征的车牌照字符分割方法[J].仪器仪表学报,2003,24(4):472-474.
[4]胡小锋,赵辉.Visual C++/MATLAB图像处理与识别[M].北京:人民邮电出版社,2004.
[5]李文举,梁德群.质量退化的车牌字符分割方法[J].计算机辅助设计与图形学学报,2004,6(5):697-700.
[6]刘明军,谢宏霖,孙雪松,等.车牌字符分割算法的比较研究[J].济南大学学报:自然科学版,2006,30(3):246-248.
车牌字符识别 篇5
1 车牌字符识别
一般来说,字符的识别可分为训练模块和识别模块,而在进行识别之前,首先要对车牌字符图像进行相应的预处理,然后进行特征提取,把提取所得的特征向量作为分类器的输入来进行训练或识别。其识别流程,如图1所示。
在这些步骤当中,重点是特征提取方法和分类器的选择,本文采用了多角度投影、小波分解、Pseudo-znerike相结合的方式对样本进行特征提取。再对提取的特征使用径向基核函数的支持向量机进行训练识别。
1.1 车牌字符图像预处理
对已经切割好的车牌图像进行预处理有利于后续工作。本文采用灰度变换、倾斜校正[7]、快速二值化算法对其进行处理,再利用基于边缘检测与Hough变换的车牌字符分割算法[8]分割出单个字符,一般情况下分割后的单个字符图像的尺寸大小都不一样,由于标准车牌字符的高与宽的比值固定为2:1,所以文将车牌字符图像统一归一化为32×16像素的字符点阵,黑底白字,并规定黑色像素为0,白像素为1,实验结果表明,32×16的字符点阵在保持车牌字符基本特征的情况下,取得了较好的识别率。
1.2 车牌字符图像的特征提取
字符特征提取是模式识别过程中一个相当重要的步骤,本文采用了基于小波分解的多角度投影和Pseudo-znerike不变矩来实现字符特征的提取。
1.2.1 基于小波分解的多角度投影特征提取
投影特征即投影直方图,是描述字符在某方向上白色像素数量的特征,考虑到方向的特殊性、计算量以及小波变换的“数字显微镜”作用,本文在水平、450、垂直、对角线四方向分别进行投影,然后对其进行一维二层小波分解以得到字符的细节特征。如下步骤就可实现字符基于小波分解的多角度投影特征的提取,图2给出了字符0的基于小波分解的多角度投影特征。
1)将归一化大小后的字符图像在水平、垂直方向分别进行投影。
2)将归一化大小后的字符图像分别向450、对角线进行旋转,然后分别进行垂直投影。
3)将这些投影特征合并为一个行向量。
4)对以上行向量采用DB2小波进行一维二层Mallat塔式分解。
1.2.2 Pseudo-znerike不变矩特征提取
不变矩是图像的重要全局特征之一,而Zernike和Pseudo-Zernike综合性能最优,Pseudo-Zernike矩不但具有Zernike矩的旋转不变性,而且它较Zernike矩具有更好的抗噪声性能和图像重建能力。本文采用外接法实现图像到单位圆内的映射,从而得到数字图像的Pseudo-znerike矩的离散化公式:
其中N,M是图像f(x,y)的大小,且|l|≤n,
从式(1)可以看出,要计算Anl关键是计算Rnl(r)的值,为了实现车牌字符的实时识别,可采用Pseudo-Zernike矩的快速算法计算Rnl(r),文中采用文献[5]提出的l迭代法进行计算,该算法的思想是:当n-l≤1时采用式(2)、(3)计算Rnl(r),而当n-l≥2时采用式(4)进行计算。
其中:
本文提取字符图像前20阶Pseudo-znerike不变矩的共210维全局特征,多角度投影经一维二层小波分解后的126维局部特征,为便于处理分别对其采用式(5)进行归一化到[-1,1],然后将其组合在一起,就形成了336维的训练或待测数据。
其中Ymax=1,Ymin=-1,Xmin是全局特征和局部特征各自特征向量的最小值,Xmax是最大值。
1.3 识别分类算法
目前比较常用的识别分类方法有:模板匹配,神经网络和支持向量机。模板匹配对车牌字符图像的质量要求很高,而神经网络的收敛速度慢,并无法保证全局最优,识别率对样本数量有较大的依耐性。SVM则能有效解决小样本学习、非线性及高维模式识别问题。在运用SVM进行识别分类时,核函数以及相应参数的选择对识别率有较大的影响。
1.3.1 SVM介绍
设样本集:(x1,y1),(x2,y2)…,(xn,yn),xi∈Rn,yi∈{-1,1},i=1,2…n,把输入样本xi通过ψ:x→H射到高维特征空间H。决策函数可以用下面的方程表示:
f(x)=sgn(ω·φ(x)+b)
SVM其实要解决的问题是:
训练集的最优分类判别函数为:
式中k(xi,xj)=ψ(xi)ψ(xj),xi为支持向量,x为未知向量,式(7)即为SVM[9],常用的核函数形式主要有:线性核、多项式核、径向基(RBF)核、Sigmoid核。而应用最广的为RBF核,其k(xi,xj)=exp(-μ‖xi-xj‖)2。
这样求RBF核对应的式(6)的最小值就取决于参数(C,μ)的选择,选择最佳的参数就可以使SVM分类器性能最好,即学习精度最高。
1.2.2 RBF核函数的SVM参数优化选取方法
不同的(C,μ)取值对RBF核的SVM的分类性能影响[10]不同,为了求解最佳(C,μ),有多种方法可以选择[11],本文中采用双线性搜索法来求解。文献[10]中提到,参数空间可分为欠训练/过训练区和“好区”。以㏒C,㏒μ作为参数空间的坐标,经大量实验证明,学习精度最高的参数组合(C,μ)集中出现在“好区”中的直线附近。因此,双线性搜索法的步骤如下:
1)对线性SVM求解最佳参数C,使得以之为参数的线性SVM学习精度最高,称之为。
2)对RBF核的SVM,固定,对满足的(C,μ),训练SVM,根据对其学习精度的估算,得到最优参数。
对学习精度的估计本文采用n重交叉验证[12]的方法,取n=5。
2 实验结果与分析对比
2.1 样本选取
本次实验应用了台湾大学林智仁博士开发的libsvm2.91工具箱[13],在MATLAB7.1平台中实现,实验用的车牌图像都来自路口实拍,由于所采集的样本中汉字数量较少,所以样本集中包含了数字和字母(其中数字10类,字母24类)。每类的样本数量为130个,每类任取其中的30个作为训练样本,剩余的100个作为测试样本。
2.2 RBF核SVM参数的优化选取
在测试样本之前,先得训练RBF核SVM分类器,为了确定(C,μ)最优组合,运用双线性搜索法,首先,训练线性SVM,在C的取值为[2-8,2-7,…,210]内,搜索使线性SVM学习精度最高的,然后,基于此训练RBF核SVM,根据在㏒2μ的取值为[-8,-7,…,7,8]内搜索使RBF核SVM学习精度最高的(C,μ)组合,即最优的(C,μ)组合。表1中给出了优化得到的参数。
2.3 实验对比
为显示本文方法的优越性,基于同样的训练样本集和测试样本集,本文又分别对基于小波分解的多角度投影特征和Pseudo-Zernike不变矩特征,采用RBF核SVM进行车牌字符识别。表2给出了各自在优化前、后的识别率。其中优化前的(C,μ)组合是libsvm2.91工具箱中提供的默认值。而各类字符在最优的(C,μ)组合下的识别率如图3所示,表3则给出了它与BP神经网络[3]、模板匹配[1]的识别结果。
从以上测试结果可以看出:相比于参数优化前,优化后的识别效果有明显的提高,同两种独立特征识别方法相比,文中提出的基于组合特征的方法的识别率有较大的提高,从图4可以看出基于组合特征的识别率不小于基于小波分解的多角度投影特征的字符类别数为30(共34类)类,而不小于基于Pseudo-Zernike不变矩特征的字符类别数为31类,并且在相似字符如:0和D,8和B,S和5等有明显的提高。此外比BP神经网络和模板匹配的识别率有较大的改善。
3 结论
本文提出了基于组合特征和支持向量机的车牌字符识别方法。算法首先运用一维二层小波和Pseudo-Zernike不变矩提取字符图像特征,然后运用双线性搜索法,用提取的特征训练出使RBF核SVM学习精度达到99.88%的分类器,使用该分类器是对大量样本进行分类识别,整体识别正确率达到了97.25%。实验结果表明了本文方法的有效性和先进性,具有一定的实用价值。
摘要:为了提高车牌字符识别率,提出了基于组合特征和支持向量机的车牌字符识别方法,算法首先采用一维小波分解多角度投影和Pseudo-znerike不变矩提取车牌字符图像的特征,然后运用双线性搜索法,用提取的特征训练出使支持向量机学习精度最高的分类器,再运用此分类器分类和识别车牌字符,用大量样本对系统进行测试,车牌整体识别率达到97.25%,通过对比性研究,验证了该方法的有效性和先进性。
车牌字符识别 篇6
随着我国经济的迅猛发展, 我国的交通事业进入了一个高速发展的阶段, 智能交通管理也显得越来越重要, 它能提高交通服务的质量, 促进交通运输事业的发展, 而车牌识别系统是现代智能交通管理的重要组成部分, 是计算机视觉、图像处理、神经网络和模式识别技术的综合应用[1,2]。车牌识别系统一般包括车牌定位、车牌字符分割、车牌字符识别等部分, 而其中字符识别是车牌识别系统中重要的组成部分。车牌识别的研究, 最早出现于20世纪80年代, 可以粗略地计算出车辆的速度、车流量、道路负载等数据。通过图象识别、模式识别、人工神经网络识别等方法[3,4,5], 进一步发展国内外对汽车牌照识别系统的研究工作已经有了很大进展。随着我国交通事业的高速发展, 目前报道的这些方法都存在识别速度慢、精度低、抗干扰性能差等问题。
车牌识别系统应该有强大的分类能力、容错能力和鲁棒性, 而且能较好地解决车牌识别中所提出的因字符残缺不完整而无法识别的问题, 还可以避免繁重的数据分析和数学建模工作, 可以将信息存储与处理并行起来, 从而大大提高运行速度[6,7]。本文提出一种分级识别思路, 就是对已经进行了定位、预处理 (灰度化、二值化) 、字符分割、归一化的车牌图像, 用一级径向基神经网络进行汉字、字母、混合和数字的粗分类; 二级子网用于对字母网络、混合网络和数字网络内部易混字符再进行精确识别, 解决如车牌特征识别与分类输出问题。
1基于分级神经网络识别网络的实现
在车牌自动识别系统中, 经过车牌定位和字符分割, 就进入到字符识别阶段。中国大陆 (不包括香港、澳门、台湾) 车牌主要由三种类型组成:黄底黑字、蓝底白字、白底黑字。字符也可以分成四种类型:中文字符、英文字母、阿拉伯数字、圆点分隔符。民用车牌, 共由七位组成, 例如:鲁U12345, 牌照是由7个字符合成的字符串, 其中第一个字符是汉字, 由31个省、自治区和直辖市的简称组成。第二个字符是英文字母, 第三个字符是英文字母或者是数字, 第四、五、六、七个字符则是数字。因此, 首先可以构造4个一级径向基神经网络 (RBF) , 即汉字、字母、混合和数字, 用于粗分类;然后, 对字母网络、混合网络和数字网络根据内部字符的易混程度 (如0、O、Q、D等) 分别构建了不同的二级子网进行精确识别。网络的组织结构如图1所示。
一级网络工作过程如下:对采集到的车牌图像, 经过定位、预处理、分割和归一化等处理之后, 根据分割结果将七个不同位字符图像输入对应的一级网络进行识别, 分割后的第一个字符输入一级汉字网络, 第二个字符输入一级字母网络, 第三个字符输入一级混合网络, 第四、五、六、七个字符输入一级数字网络。每个一级网络输出该网络的识别结果及结果的置信度。
二级网络工作过程如下:经过一级网络产生的识别结果及置信度, 将此识别结果及置信度输入一个类分流器的二级网络进行分流或直接输出识别结果, 如果确定需要二级识别, 将根据一级识别结果选择二级识别子网进行识别, 最后将识别结果转入表决器进行评判表决, 本文根据字符的易混淆程度最终确定了16个二级子网。这些二级子网分别是汉字京吉甘贵网、汉字冀蒙鲁晋网, 汉字赣鄂豫网;字母CDLOU网、字母BFHPR网、字母ATVY网和字母ABEFLP网;八个混合子网:混合OCD网、混合158BEFR网、混合2379VZ网、混合1479ATY网、混合589BES网、混合358BHK网、混合6BCDGOU网和混合0O网;1个数字子网, 即数字35网。
表决器工作过程如下:根据二级径向基神经网络 (RBF网络) 的输出产生结果转入表决器, 表决器是通过一种基于竞争的网络结构进行评判, 输出置信度大的识别结果作为最终结果, 实现了“胜者为王败者为寇”的功能。
2一种改进的径向基函数神经网络及其算法
在多层前向网络的研究中, 径向基函数神经网络广泛应用于有导师学习的插值非线性函数拟合, 近似非线性映射性质的系统建模、聚类等方面。在径向基函数神经网络中, 它把输入分别输入到第一层的每一个输入神经元, 第一层的每一个神经元的输出无加权地直接传送到隐层的神经元的输入端, 隐层神经元的输入输出采用聚类特性, 隐层神经元的输出经过加权求和直接产生输出, 即输出层的神经元只有加权求和, 而没有非线性。这种结构是多层相连接的, 网络没有输出端反馈到输入端带来的全局稳定性问题, 一种改进的径向基函数神经网络结构如图2所示。
RBF网络是一个前向神经网络, 有三层, 网络输入层神经元节点数就是系统特征因子个数 (4个) , 分别接收Up, Um, Uc, Uf。
输出层神经元节点数就是系统目标个数 (7个) , 分别输出Ma, Mm, Mc, Md, Me, Mf, Mw。
使用高斯函数作为神经元的输出函数:
式中:v=Up+Um+Uc+Uf;ci表示函数的中心;ai用来确定函数的宽度。
RBF网络的输出为:
网络隐层节点预取若干个, 在网络训练时, 再对不同隐层节点数分别进行比较, 最后根据误差变化过程确定出隐层节点合理的网络结构。
在径向基函数前向互联网络中, 利用误差反向传输学习算法, 优化求解函数的中心ci, 宽度ai, 以及加权系数wi。
RBF网络训练方法:
对于第p (p=1, 2, …, P) 个模式, RBF网络训练过程中的输出为:
eundefined是第p个模式的信号相对于输出层的第j神经元的输出与要求的输出之间的局部误差, 表达为:
这里dundefined是要求的输出。
对于整个训练集, 网络的误差函数定义为:
依据对于第P个模式的信号相对于输出层神经元的误差函数E达极小值计算。
当采用传统的均方误差ϕ (eundefined) = (dundefined-f (xundefined (k) ) ) 2时, 利用梯度下降法, 通过undefined可求网络权值修改因子, 网络权值修改的调整量为:
利用梯度下降法, 通过undefined可求网络中心修改因子, 网络权值修改的调整量为:
利用梯度下降法, 通过undefined可求网络权值修改因子, 网络权值修改的调整量为:
对P个模式的信号训练时, 误差反向传输学习算法计算连接权调整, 这种方法完成训练后整个神经元网络的总误差函数E可达极小。
3基于分级神经网络识别网络的车牌字符识别结果
在实际的操作过程中, 因光线、天气、拍摄等原因, 汉字也容易出现断裂、粘连等现象, 这也影响了汉字的识别率。本文采用基于字符的灰度图像提取字符特征, 避免了汉字字符图像因断裂、粘连等影响使得提取的特征不准确的问题。通过上述径向基神经网络结构来训练, 可得汉字网络独立字符识别结果, 如表1所示 (数据来源参考文献[8]) 。
从表1中可以看出, 系统对汉字独立字符的平均识别率为92.92%, 大于文献[8]的汉字独立字符识别率89.7%。
系统对于字母和数字已经有较高的识别率, 经实验测试, 结果如表2, 表3所示。
从表3中可以看出, 系统对数字的识别率已经很高了, 识别率都高于95%, 数字3, 5和8比较容易混淆, 所以这些易混淆数字的识别率相对来说会低些。
字母和数字的混合网络识别率如表4所示。
从表4中可以看出, 混合网络中各字符的平均识别率为92.45%, 比数字独立字符识别率及字母独立字符识别率低, 这也说明, 神经网络随识别类别的增加, 网络变得复杂, 识别率会降低。
为了整体衡量系统的性能, 取1 500张实际交通道路抓拍的车牌图像进行测试。测试结果如表5所示, 可以看出, 全车牌识别率为87.9%, 平均识别时间为174 ms, 可以满足实际应用系统的技术要求。
4结语
本文提出了一种基于分级RBF神经网络的车牌字符识别方法, 用大量样本对所设计的网络进行了测试, 识别率达到了90%以上, 平均运行时间为174 ms, 有效地提高了识别的精度。该方法不仅对于提高汽车车牌上字符的识别速度和识别正确率等问题是可行的, 而且该思路也适合其它图象、字符等综合性识别, 因此具有良好的研究与开发价值。
参考文献
[1]KERRY L C.Intelligent transportation systems[J].BetterRoad, 2005, 75 (7) :75-76.
[2]BRIAN L S, WILLIAM T S.Development of integrated in-telligent transportation systems[J].Trans.on ResearchRecord, 1999, 6 (4) :84-90.
[3]钟余.基于神经网络的车牌识别技术的研究与应用[D].大连:大连海事大学, 2007.
[4]李飞.基于人工神经网络的车牌识别系统的研究[D].太原:中北大学, 2007.
[5]王海涛, 黄文杰, 朱永凯, 等.基于聚类分析与神经网络的车牌字符识别[J].数据采集与处理, 2008, 23 (2) :238-242.
[6]HUANG Xiao-li, ZENG Huang-lin.A new image fusion al-gorithm based on fuzzy biorthogonal wavelet transform[J].Proceeding of IFITA, 2009, 2:684-686.
[7]ZENG Huang-lin, ZENG Xiao-hui.Reasoning decisionrules of an uncertain system[C]//The Fourth Interna-tional Conference on Rough Sets and Knowledge Technolo-gy, Proceeding of RSKT 2009.Australia:Springer-Verlag, 2009:634-642.
[8]李孟歆.基于分级网络的车牌字符识别算法[J].计算机工程与应用, 2008, 44 (30) :213-216.
[9]ZENG Huang-lin, ZENG Xiao-hui.Studies on consistenceof the knowledge simplification of an uncertain system[C]//Proceeding of 8th International Conference on Cogni-tive Informatics.Hongkong:[s.n.], 2009:162-166.
利用反馈的车牌字符分割算法 篇7
随着信息技术和人工智能技术的发展, 交通管理系统的信息化、智能化是大势所趋, 智能交通系统已成为一个热点研究领域。车牌识别系统是智能交通系统的重要组成部分, 在现代交通管理中占有举足轻重的地位。车牌识别系统包括三个主要环节, 即车牌定位、字符分割和字符识别。目前的字符识别算法基本上是针对单一字符, 因此字符分割是一项十分关键的技术。
目前的车牌字符分割方法主要有: (1) 基于二值化图像垂直投影的方法[1,2]。这是最普遍采用的方法, 优点是速度快, 但对图像质量要求较高, 当牌照中出现字符粘连和断裂等情况时会发生分割错误; (2) 基于垂直投影和先验知识的方法[3,4,5], 该方法除了应用垂直投影外, 还考虑字符的宽度等先验知识, 改善了字符分割效果, 但当字符褪色严重或有干扰信息时会分割失败; (3) 基于模板匹配的字符分割方法[6,7], 该方法设计车牌字符串模板, 通过模板匹配确定字符位置, 该方法具有较好的字符分割效果, 但如何设计匹配模板是一个难点。
本文提出了一种新的车牌字符分割算法。该算法避免仅采用垂直投影分割字符, 而是将垂直投影和反馈相结合, 既考虑车牌的先验知识, 又考虑字符的纹理特点, 通过字符个数与字符宽度反馈以及字符识别反馈, 经由粗到精的过程分割车牌字符图像。
1 图像预处理
1.1 光照不均校正与对比度增强
光照度一般变化缓慢, 可采用低通滤波获得图像背景的照度估计, 再从原始图像中减去此照度来校正光照不均, 最后通过对比拉伸变换增强对比度。图1为原始车牌图像, 图2为经过对光照不均的校正与对比度增强后的图像。
1.2 倾斜校正
倾斜的车牌图像有三种倾斜模式:水平倾斜、垂直倾斜和水平垂直倾斜。本文采用文献[8]的方法, 即通过水平和垂直边缘检测结合旋转投影来求取车牌的水平和垂直倾斜角度, 对水平倾斜的车牌进行双线性插值旋转校正, 对垂直倾斜的车牌进行双线性插值错位偏移校正, 在倾斜校正的同时确定车牌的上下位置。图3为倾斜校正后的图像。
1.3 边缘增强与二值化
将车牌图像归一化为48像素高, 然后以宽度为w, 幅值为w/2 (w根据笔画宽度选取) 的阶梯信号与车牌图像卷积进行边缘增强, 然后二值化。边缘增强图像和二值化图像分别如图4和图5所示。
2 基于垂直投影的字符粗分割
垂直投影法是字符分割的常用方法, 其基本原理是, 设车牌图像二值化后的背景点为黑像素0, 字符点为白像素1, 则在垂直方向统计白像素的个数, 获得白像素的垂直投影分布。由于字符区域白像素较多, 而字符间空隙区域白像素较少, 因此可将白像素个数的波谷作为字符间的分界处。
我们将上述垂直投影法进行了改进。首先对二值化车牌图像进行垂直投影, 然后选取阈值T, 若投影值小于T, 则将该投影值设为0, 垂直投影结果如图6所示。根据垂直投影获得的粗分割图像如图7所示。由图可见, 字母“C”被分割为两个字符, 而数字“7”被分割为三个字符。
3 基于两级反馈的字符精分割
3.1 基于字符个数与字符宽度反馈的字符分割
车牌图像的特点之一是具有7个字符, 字符的字段宽度固定。因此, 可以计算粗分割后字段的个数和每个字段的宽度, 并给它们设定合适的阈值, 然后通过反馈进行字符分割。字段个数阈值为7, 字段宽度阈值范围为[D1, D2]。如果字段的个数大于7, 将字段宽度最小的字段与其相邻两个字段中宽度小的字段合并, 否则将字段宽度最大的字段进行分裂, 直到字段的个数等于7;如果字段的宽度大于D2, 则对该字段进行分裂操作, 如果字段的宽度小于D1, 则进行合并操作。图8为分割结果。
3.2 基于识别反馈的字符分割
3.2.1 基于离散余弦变换的字符纹理特征
车牌字符具有明显的纹理特征, 该纹理特征可通过字符的垂直投影来描述。
当求车牌字符的垂直投影时, 可得到坐标对 (0, y0) , (1, y1) , …, (N-1, yN-1) , 其中N为字符区域宽度。这样, 垂直投影就可以表示为一个序列f (n) ={yn}, n=0, 1, …, N-1。求取f (n) 的离散余弦变换为:
其中, F (u) 为f (n) 的频域描绘子。由于高频系数决定细节部分, 低频系数决定总体形状, 所以可使用前m个系数 (即低频系数) 重构垂直投影图得到f^ (n) , 这里, 取m=8。
根据重构的垂直投影图可获得如下统计量:
(1) 均值μ
(2) 标准偏差σ
(3) 三阶矩3
结合重构后垂直投影的统计量, 将字符的纹理特征向量定义为:
3.2.2 基于识别反馈的字符分割
将标准车牌字符模板图像二值化和归一化, 尺寸为48×24, 按式 (7) 计算模板字符的纹理特征向量MTV和待识别字符的纹理特征向量BTV, 则与模板匹配的置信度R定义如下:
其中, m=27是纹理特征向量的维数。
按如下步骤进行字符分割:
(1) 设3.1中分割的字符子图像的宽度为N, 若N<24, 则将其和相邻子图像合并。
(2) 在子图像内移动48×24的滑动窗口, 计算窗口内图像的纹理特征向量BTV, 与字符模板序列相匹配, 计算字符匹配置信度R1, R2, …, Rd, 其中d=N-23。
(3) 设Rmax=max{Ri, i=1, 2, …, d}, 若Rmax大于给定阈值, 则匹配成功, 其对应的窗口区域为字符, 否则, 将此子图像和相邻子图像合并, 转 (2) 。
最后的字符精分割结果如图9所示。
4 实验结果
本文对154幅有严重影响的车牌图像进行字符分割, 正确分割率为98.7%, 在具有PⅣ2.66GHz CPU, 512MB内存的计算机上运行由MATLAB编写的本算法程序, 平均用时8.530s, 实际应用时采用C语言编程能够满足实时性要求。在相同的实验环境下应用文献[4]中的算法, 正确分割率为97.4%, 平均用时8.850s。图10为本文算法与文献[4]中算法的部分实验对比结果。从实验结果看, 文献[4]算法在有半圆的出租车标志牌干扰信息时分割失败, 而本文算法能正确分割。而且, 对光照不均、对比度较小、倾斜、污迹严重、褪色、字符粘连和断裂等质量严重退化的车牌图像, 本文算法也具有更好的分割效果。
5 结论
本文提出的算法具有很好的车牌字符分割性能。采取的图像预处理技术较好地解决了车牌图像光照不均、对比度较小、倾斜等问题;所采取的由粗到精, 两级反馈的方法能正确地分割污迹、褪色、字符粘连和断裂等严重影响的车牌字符图像。特别是在基于识别反馈的字符分割中, 通过对字符的垂直投影进行离散余弦变换, 应用其低频系数重构垂直投影, 可抑制噪声, 在此基础上构建的纹理特征更能反映车牌的字符纹理, 提高了字符分割的准确率。
参考文献
[1]宋建才.汽车牌照识别技术研究[J].工业控制计算机, 2004, 17 (4) :44-45.
[2]Zhang Jian, Fan Xiaoping, Huang Cailun.Research On characters seg-mentation and characters recogition in intelligent license plate recogi-tion system[C]//Proceedings of the 25th Chinese Control Conference, Harbin, 2006:1753-1755.
[3]迟晓君, 孟庆春.基于投影特征值的车牌字符分割算法[J].计算机应用研究, 2006, 7 (2) :256-257.
[4]Jia Xiaodan, Wang Xinnian, Li Wenju, et al.A novel algorithm for char-acter segmentation of degraded license plate based on prior knowledge[C]//Proceedings of the IEEE International Conference on Automa-tion and Logistics, Jinan, 2007:249-253.
[5]朱俊梅, 陈少平.基于改进的投影方法的车牌图像字符分割[J].中南民族大学学报:自然科学版, 2007, 26 (4) :58-61.
[6]王兴玲.最大类间方差车牌字符分割的模板匹配算法[J].计算机工程, 2006, 32 (19) :193-195.
[7]邓红耀, 管庶安, 宋秀丽.投影和模板匹配相结合分割车牌字符[J].计算机工程与设计, 2008, 29 (6) :1568-1570.