迭代二值化论文(精选7篇)
迭代二值化论文 篇1
0 引 言
随着OCR技术的发展,护照证件的自动识读技术已经被广泛应用于机场、海关、酒店登记、身份核查等业务中,它能有效地解决证件信息的录入,实现快速、高效地处理数据,从而提高工作效率,具有很重要的实际意义。然而,由于护照证件的背景通常有复杂的底纹和防伪的水印图案,以及光照不均匀,使得获取的图像带有极大的噪声干扰,给识读造成很大的困难。如何有效地去除强干扰的噪声,如何使文本信息能完整的分离就成为护照识读的关键。护照证件图像的二值化问题是识读的关键步骤,二值化的处理效果将直接影响到识读的准确度。
本文根据护照图像的特点,提出一种全局阈值与局部分析相结合的适用于护照证件图像的二值化方法。该算法在全局阈值二值化基础上结合局部二值化方法,较完整地保持文本笔画,同时引入局部二值化的门限值,有效地消除了伪影现象,并能保持较快的处理速度,完全满足护照实时识读的要求。
1 文本图像的二值化方法
文本图像的二值化方法可分为全局阈值方法和局部阈值方法。全局阈值法根据文本图像的直方图或灰度空间分布确定一个阈值,从而实现灰度文本图像的二值化。典型的全局阈值方法包括迭代算法[1] 、Ostu方法[3]、灰度期望值算法等。全局阈值法算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但其对输人图像有噪声或不均匀光照等情况抵抗能力差,应用受到极大限制。局部阈值法通过定义考察点的邻域,比较考察点与其邻域的灰度值来确定考察点的阈值。非均匀光照条件或噪声存在等情况虽然影响整体图像的灰度分布却不影响局部的图像性质,使得局部阈值法较全局阈值法有更广泛的应用。常用的局部阈值法有Niblack算法[4]、Bernsen算法[2]、Kamel-Zhao算法等。但局部阈值算法对文本图像进行二值化处理时,由于需要分析局部邻域的灰度分布情况,处理速度慢,同时会出现伪影等问题。
1.1 全局迭代阈值算法
全局迭代算法[1]是一种全局阈值二值化方法。该方法首先选取一初始阈值,初始阈值取为文本图像的最大灰度值与最小灰度值的均值,根据该阈值将图像二值化为目标与背景,然后以目标和背景的平均期望值作为新的阈值,对图像重新二值化,如此不断迭代。当阈值不再变化时,停止迭代,最后根据阈值逐点二值化。
1.2 局部二值化算法
经典的局部二值化方法有Niblack算法[4]、Bernsen算法[2]、Kamel-Zhao算法。考虑以坐标(x,y)为中心的(2×W+1)×(2×W+1)模板,选取适当的W,计算模板的平均灰度aver或求取模板内的极大值fmax和极小值fmin,则局部阈值TL=aver或TL= (fmax+fmin)/2,再将考察点(x,y)的灰度值g(x,y)与TL比较,对图像进行二值化。
2基于全局迭代阈值和局部分析的二值化算法
由于护照证件图像中的文字和背景的灰度有相当部分重叠,文字笔划细节和滤除噪声干扰很难兼顾。采用基于最小误差全局迭代分割阈值方法。这种算法简单、时间复杂度低,能将字符笔划较好地从背景中分离出来。
也由于护照证件图像中的复杂的底纹和防伪阴影的噪声干扰使得图像的背景灰度深浅不一。要把文字笔划清晰地从背景中分割出来,还要考虑像素点的邻域特征。采用经典的局部二值化Bersen算法。另外考虑到局部二值化存在伪影现象的缺点,可以在考察点灰度值和局部阈值比较时增加一个门限值。
由于护照证件图像的特殊性,复杂的底纹和防伪阴影的噪声干扰使得目标字符和背景的灰度对比不大,给图像二值化带来一定的困难。如果将上述讨论的两种方法综合起来使用对护照图像进行二值化处理,即全局迭代阈值和局部分析的二值化方法。该方法在最小误差分割的基础上结合考虑了像素的邻域特征,从而能使目标字符清晰地从背景中有效地提取出来,并滤除噪声。
具体算法描述如下:
步骤1 求出全局迭代最佳阈值。
1) 求出图像的最大和最小灰度值gmax和gmin,阈值初值:
2) 根据阈值Tk将图像分割成目标和背景两部分,分别计算出两部分的像素数N
3) 求出新阈值:
4) 如果Tk+1=Tk或k>100,则转5);否则k=k+1,转2);
5) Td=Tk+1。
步骤2 求出局部二值化间隔参数T1和T2和门限值T3:
T1=(1-α)×TdT2=(1+β)×Td
其中α,β∈(0.1,0.3)
T3=μ×(gmax-gmin)
其中μ∈(0.1,0.4)
步骤3 逐点二值化。
If考察点(x,y)的灰度值g(x,y)>=T2,then g(x,y)=255;
Else If考察点(x,y)的灰度值g(x,y)<T1,then g(x,y)=0;
Else 取字符笔画的最大宽度为5个像素,即选用以考察点(x,y)为中心的11×11的模板窗口。寻找模板窗口内灰度极大值fmax和极小值fmin,计算局部阈值:
If g(x,y)-TL>T3,then g(x,y)=255
Else g(x,y)=0
3 实验结果
实验对一幅1930×1300大小的护照图片分别使用全局迭代阈值方法,局部Bersen方法和本文方法进行二值化处理进行比较。结果比较见表1,表1中的目标像素点百分比=二值化后黑色像素点个数/整个图像像素点个数。图2为全局迭代阈值方法二值化处理结果,处理时间最短,但是处在图像顶端两角的图案没有分离出来,原因在于图像的四角光照比较暗淡;图3为局部Bersen算法处理结果,伪影现象非常明显,并且处理时间最长;图4为本文方法处理结果,处理时间比全局迭代阈值方法长,但是能把文本字符和背景有效分离,图像中的图案也能显著分离,有比较好的总体性能。
4 结 论
本文针对护照证件图像中复杂的底纹和防伪阴影的噪声干扰强烈的特点,根据最小误差的分割策略,并结合像素点的邻域特征,提出一种基于全局迭代和局部分析的二值化分割算法。实验表明,该算法具有较好的抗噪能力,目标文字和背景噪声能有效显著分离,从而能较准确地提取出待识别的文字,并且具有较快的处理速度,总体性能较好。
参考文献
[1] Perez A,Gonzalez R C.An Iterative Thresholding Algorithm for Image Segmentation[J].IEEE Trans on Patt Anal Mach Intel1.1987,9(6):742-751.
[2] Bernsen J.Dynamic Thresholding of Gray-level Images[C]//Proc of 8th lntel Conf.on Patt.Recog.Paris,France:IEEE Computer Society Press.1986:l251-l255.
[3] Ostu N.A Threshold Selection Method From Gray Level Histogram[J].IEEE Transactions on System,Man and Cybernetics,SMC-9(1979):62-66.
[4] Niblack W.An Introduction to Image Processing[M].Prentice-Hall,1986:115-116.
凝胶图片二值化处理 篇2
1 基本原理
1.1 噪声去除
凝胶图片采用数码相机拍摄,一般是灰度图像,由于紫外光线照射角度,凝胶制作等因素,会产生噪声。图像去除噪声的方法较多,本文中采用中值滤波器和梯度锐化滤波器进行处理。
中值滤波器是非线性平滑滤波,在一定的条件下可以克服平均值滤波等带来的图像细节模糊问题,而且对过滤脉冲干扰及图像扫描噪声非常有效。中值滤波器采用一个基数点的滑动窗口,将窗口中心点的值用各点的中值代替。常见的滑动窗口采用3×3,5×5等奇数点范本[1,2]。
1.2 锐化
采用中值滤波后,图像部分细节会变模糊,因此要对图像进行锐化处理。常见的锐化方法是梯度操作数法和拉普拉斯操作数法[3,4,5]。
对灰度图像f(x,y),在其(x,y)上的梯度可以定义一个二维向量:
向量的模值GM[f(x,y)]定义为:
对于数字图像,上式计算量大,因此采用差分方法近似。
常见的近似操作数有Roberts操作数、Sobel操作数和Prewitt等。其中Roberts操作数采用2×2范本,Sobel操作数和Prewitt操作数采用3×3范本。
1.3 二值化处理
对于灰度图像,可以进行二值化处理,将图像变成黑白图像。本文中二值化采用3×3模板,灰度图像在点(x,y)处的灰度值记为(x,y),定义:
如果th≥6,则G(i,j)=0;否则G(i,j)=255。
2 实验结果
本文中采用3×3奇数点模板进行中值滤波,滤波之后,使用Sobel操作数进行水平方向的锐化处理,然后再使用3×3模板进行二值化处理。处理过程如图3所示。
图4是凝胶图像的原始图像,一般使用数码相机拍摄为灰度图片,并附加了一些噪声。对原始图像进行中值滤波后,可以滤除部分噪声。噪声滤除能力与所选模板大小相关,模板越大,噪声滤除能力越强,但图像越模糊。图5是中值滤波后的图像,中值滤波采用3×3奇数点模板进行中值滤波,图像边缘有些模糊,但凝胶条带信息并没有破坏。图6是使用Sobel操作数进行水平方向的锐化处理后的图像,锐化后,条带拖尾的现象得到很好的抑制,条带信息并未丢失。图7是使用Matlab标准函数产生的二值图像,图8是使用3×3矩阵进行二值化得到的图像。图7与图8比较可以看出,图8更能准确表示凝胶条带的信息,条带图谱更较清晰,采用3×3模板进行二值化,图像边缘略有展宽,条带位置更加清晰准确。
3 结束语
本文通过对凝胶图像进行中值滤波、锐化后,并使用3×3矩阵进行二值化处理,二值化图像较好地反映了凝胶条带的信息。使用3×3矩阵进行二值化,有效地防止了干扰信息的误判,尽管条带略有展宽,但条带位置信息准确,为进一步处理提供了较好的基础。
摘要:该文使用3×3模板中值滤波方法对凝胶图像进行噪声去除,使用Sobel算子进行锐化,使用3×3模板进行二值化。结果表明,经过该文处理后,有效地防止了干扰信息的误判,且凝胶图片条带位置信息准确,为进一步处理提供了较好的基础。
关键词:凝胶图片,Sobel算子,二值化
参考文献
[1]Lee C Had,YU kuo.Adapted weighed fuzzy mean filtering[C].Process.IEEE-FUZZ96,1996(3):2110-2120.
[2]Brownrigg D R K.The weighed median filter[J].Communication of the Association for computing machinery,1998,27(8):807-818.
[3]姚敏.数字图像处理[M].北京:机械工业出版社,2006.
[4]徐飞,施晓红.Matlab应用图像处理[M].西安:西安电子科技大学出版社,2002.
基于车牌识别的二值化算法研究 篇3
关键词:车牌识别,车牌定位,二值化算法,灰度值拉升
车牌识别系统的关键技术之一就是车牌定位,同时也是进行车牌正确识别的第一步,车牌定位的好坏将会直接影响到车牌识别的质量,同时对于车牌识别的速度也会有很大的影响。
目前,车牌定位的方法主要是基于边缘检测的定位,根据车牌的字符和背景之间强烈的对比来对车牌进行定位,首先选取一个合适的阈值来对图像进行二值化,然后进行水平投影来定位车牌。但是在车牌定位过程中,由于环境的影响,车牌亮度会随着光照的不同而产生变化,这就给阈值限定的二值化过程产生很大影响。为此,本文通过对车牌图像的特点进行分析,提出一种改进算法,能够实现将不同亮度环境的的车牌进定位。
1 已有的二值化算法
目前应用较为广泛的二值化算法有以下两类:
1.1 阈值限定的二值化算法
这种算法的原理和实现都比较简单,首先确定图像的灰度值变换范围,并从中选取一点的灰度值作为阈值T,将图像中的任何一点(i,j)的灰度值u(i,j)与T对比,如果大于或等于T则将这点的灰度值设为255,如果小于T则将这点的灰度值设为0,如式1所示:
这种算法虽然原理简单,容易实现,但是由于随着光照的不同,图片曝光情况不同,选取一个合适的阈值非常困难。
1.2 阈值自适应的二值化算法
阈值自适应的二值化算法与阈值限定的二值化算法类似,只是在阈值T的选取上不同,并不是一直固定不变的,而是通过对全图的迭代分析,来确定T的值,虽然能够一定程度的消除由于曝光不同所带来的影响,但是在阈值T的确定过程中要进行多次迭代才能够找到合适的阈值,因此计算的效率不高。
2 一种改进的二值化算法研究
2.1 车牌灰度分布特点分析
通过对已有的二值化算法的研究,发现问题的关键在于如何快速、有效的找到阈值T。其中阈值限定二值化算法的缺点在于:由于拍摄环境的影响,限定的阈值并不能够适用于所有的拍摄环境;而阈值自适应的二值化算法虽然能够有效的改善这种情况,但是由于阈值T的寻找过程较为繁琐,所以整个算法过程也变得繁琐。为了能够更清晰的了解由于光照等拍摄环境给二值化算法实现带来的问题,首先对车牌的灰度分布特点进行分析。
其中图1是三张不通光照情况下的车牌,以及他们的灰度直方图。
为了能够更好的观察在不同光照条件下车牌的灰度特征,对第三个直方图的纵坐标进行了缩放,虽然看起来点很少,其实三张车牌号码的图片大小一样,横坐标表示的是0-255的图像灰度值,虽然三张图的纵坐标进行了缩放,而且三张图的灰度值分布明显不同。但是其中也有一个相同的特点就是“虽然由于光照的不同,波峰出现的位置不同,但是每张照片的直方图都有两个明显的波峰由于车牌的特点,很容易就可以联想到,这两个像素数量最多的波峰就是代表了车牌的字符和背景,所以,二值化算法中的阈值的选值范围必定在这两个波峰之间。只是如果图片整体偏暗,那么两个波峰的位置偏左,同时阈值T的选值就会较小;如果图片整体偏亮,两个波峰的位置就会偏右,同时阈值T的选值就会较大。这给二值化算法的阈值T选定带来了很大的困难。
2.2 改进的二值化算法
在遥感影像处理过程中,经常会将遥感影像的灰度值拉升2%来提高其对比度。其计算的公式如式2所示:
其中的F表示原始图像中点(i,j)的灰度值;G则表示经过拉升之后的点(i,j)的灰度值;Gmin和Gmax表示拉升后图像的最大灰度值和最小灰度值。由于在车牌识别中,我们总是希望字符与背景下像素的对比度差距能够越大越好,因此,Gmin和Gmax分别取值0和255;因此,我们只需要确定式(2)中的Fmax和Fmin就可以确定图像中每一点拉升之后的灰度值G。
整个算法的过程如下:首先从车牌相片直方图的最小灰度值开始累加,当累加的像素个数达到了整张图像素个数的2%时,那么就将整个像素的灰度值设为是Fmin,同理,不断累加,当累加的像素个数达到整张图像素个数的98%时,将整个像素的灰度值设为Fmax。由于在遥感影像图中的灰度值并不集中,所以采用了2%这么一个值作为界限,但是在车牌照片中,去除噪声点就只剩下字符和背景两种颜色,灰度值非常集中,因此,在车牌图像灰度值拉升过程中,采用10%作为界限。
2.3 实验结果
利用改进的灰度值10%拉升算法继续对图1中的三张车牌号码进行分析,得出的直方图如图2所示。
将图2中的三张直方图分别与图1中的三张直方图进行对比,可以发现:在进行灰度值10%拉升后的直方图中,原本灰度值较高的像素灰度值更高,甚至有一部分已经达到了灰度的最高值255,而原本灰度值较低的像素灰度值更低,但是在每张拉升后的直方图中依然保存着非常明显的双峰结构,但是这两个波峰的左边波峰更靠左,右边的波峰更靠右,这样使得两个波峰的距离更大,两峰之间的谷底范围更大,合理阈值的选择将会更加的简便。
为了检测改进算法的可行性,笔者采集了在不同环境下所拍摄的车牌照片进行测试,并且将这些车牌号码直方图在拉升之前和之后的波谷范围进行了统计,统计的结果如表1所示。
虽然从表1中不能无法精确的得到阈值T的精确值,但是可以分析出,无论光照的强弱如何,在灰度值140和灰度值200之间的范围总是处在波谷,所以将阈值T取在这个范围之内可以满足绝大多数的情况,在本文的设计中,采用了中间值160作为阈值T,对图1中的三个车牌号码进行二值化的结果如图3所示。
从图3可以看出,在光照条件弱、一般、强的情况下,使用改进的二值化算法可以很好的提取出车牌中的车号信息,并且几乎没有什么干扰。
3 结束语
在车牌识别中,车牌图像的二值化是进行车牌定位的关键技术之一。但是由于光照条件的影响,会使车牌图像中像素灰度值整体会偏小或者偏大,造成二值化算法中阈值的选择非常困难,如果采用阈值自适应的二值化算法又会由于需要多次迭代而导致算法的效率下降。通过灰度值拉升的改进算法,使得原图中灰度值较小的像素灰度值更小,而灰度值较高的像素灰度值灰度更高,从而使得阈值的选择范围扩大,降低阈值的选取难度,提高二值化算法的效率。
参考文献
[1]王锋.一种快速、高效的车牌定位方法[J].计算机工程与应用,2010,43(11):120-123.
[2]张向东.一种基于灰度图像的车牌快速定位算法[J].电子科技,2010,212(5):173-177.
迭代二值化论文 篇4
关键词:机械工件,图像二值化,全局阈值,动态阈值
0 引言
机械工件上的字符是靠凸凹字模对压形成的字体,具有一定的深度或高度,是立体字符,属于三维字符,如图1。这是与其他字符相区别的最主要特征。在光学成像时,字符的轮廓是靠其表面不同强度的反射光形成的图像,属于反光差字符。因而图像灰度的区域均匀性很差,字符形状呈断裂和不连续状,给后续处理带来很大困难。采用传统的字符图像处理方法很难获得理想的效果,因此如何充分利用其特点来获取易于处理和识别的图像,从而实现对工件凹凸字符进行快速的识别与检测已成为目前字符识别领域内新的研究课题。
在机械工件字符的图像采集过程中,受多种因素的影响,图像质量都会有所下降。例如外部光线的影响、恶劣的工作环境、设备本身、待测器件本来自带的划痕和油污等干扰因素都会导致所拍摄的图片成像不够清晰。主要表现在对比度太小或太大、图片模糊等。因此单独用局部阈值和全局阈值的方法都难以对图像进行准确的分割[1,2,3],从而严重影响后期对数字的正确识别,所以有效的二值化算法是高检测率的保证。本文将机械工件数字字符作为研究内容,结合LOG算子的局部动态阈值[4,5]和基于最大类间方差的全局阈值二值化[6]方法,辅以简单聚类分析,能很好地提取字符图像的二值化重要信息,从而尽可能的提高识别效率和精确度。
1 原理算法
阈值法是一种有效的图像分割[5,6]方法,它通过设定不同的特征阈值,将像素点分为若干类。阈值法又可分为全局阈值法、局部阈值法两种。全局阈值法是指利用全局信息对整幅图像求出最优分割阈值,可以是单阈值,也可以是多阈值。局部阈值法是首先将图像分解成一系列子图像,这些子图像可以互相重叠也可以只相邻;然后可以对每个子图像计算一个阈值,此时阈值可以用任何一种固定阈值法选取。
阈值分割的优点是实现简单,对于不同类的物体灰度值或其它特征值相差较大时,它能有效地对图像进行分割。缺点在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。
1.1 全局阈值的二值化算法
典型的全局阈值方法包括Otsu方法,最大熵方法等。最大类间方差法的基本思想是:设一幅图像的灰度值为0~m-1级,阈值T将图像分割成两组,一组灰度C1(0∼T-1)对应目标,另一组灰度C2(T∼m-1)对应背景。
类内方差:
类间方差:
判断准则:
其中:1ω和ω2分别是类C1和类C2的发生概率,1µ和µ2以及δ12和δ22分别是类C1和C2像素的灰度平均值和灰度方差,µT是整体灰度图像的平均值。当η(T)取最大值时,T就是最佳的阈值。
全局阈值法算法简单,对目标和背景对比度反差较大的图像进行分割比较有效。对于目标和背景明显分离、直方图分布呈双峰的图像效果良好;但其对于由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像,二值化效果明显变差。如果图像中照明不均,即使图像中仅包含一个目标,也很难用一个阈值来分割图像。工业中获得的大部分工件字符图像存在着光照不均、对比度差等特点,因而无法直接利用阈值法将机刻数字字符与图像中其它内容有效地加以分割。图2中,2(a)表示原图像质量从上到下依次为好、中等、差和很差。图2(b)即为利用Otsu方法得到阈值对标牌图像进行分割处理的结果。从图中可以看出,图像背景部分的光照不均和表面的油渍在很大程度上影响了压印字符分割的效果,处理后的图片中仍存在很多噪声的干扰。
1.2 基于LOG算子的局部自适应二值化算法
梯度算子和Laplacian算子对噪声都比较敏感。因此,可以先用高斯二维低通滤波器对图像进行滤波,然后再对图像作Laplacian边缘提取,这种方法称为Laplacian-Gauss算子法。二维高斯型低通滤波器的表达式是
式中:r是点的像素距离高斯滤波器中心的距离,σ是高斯滤波器概率分布函数的标准方差,它同滤波器作用的邻域大小成正比。像素距离高斯滤波器算子中心越远,对滤波器的影响越小。Laplacian算子得到图像函数的二阶导数∇2f(m,n),该算子与方向无关。考虑一幅图像经高斯滤波,再经Laplacian算子变换,这个操作可以缩写为LOG(Laplacian of Gaussian),可以写成如下的卷积形式:
由于高斯滤波器的二阶导数∇2G可以预先计算与具体图像无关,二阶微分即LOG可写为
令乘积因子k使得模板元素之和规范为0。在实际中,∇2G我们可以选取n×n模板。以n=5为例:
局部自适应的二值化方法[8,9],是利用像素自身及其邻域灰度变换的特征确定其阈值。由于充分考虑了每个像素邻域的特征,能够更好的突出背景和目标的边界,保全了图像的局部细节信息。从图2(c)中可以看出,基于LOG算子的局部自适应的二值化方法对噪声的处理优于全局阈值的方法。
2 全局阈值与局部自适应相结合的二值化方法
全局阈值的二值化方法通常速度比较快,因为它一般只需要一次扫描图像。但是当图像的灰度变化较大的时候,二值化的效果往往不好。局部阈值的二值化算法因其适应性强、细节信息保留完整。由于机械工件数字压印成形时变形不一致,并且由于凹凸字符的深度导致灰度相差较大,对于机械工件数字识别的复杂背景图像,单一的二值化方法处理的图像往往达不到很好的处理效果。研究将多种二值化方法融合进行二值化,我们将选取基于LOG算子的自适应二值化算法和全局阈值中的最大类间方差法相融合作为研究对象。
综合分析比较以上两种二值化算法,优缺点及适用范围。提出了一种新的图像二值化方法,步骤如下:
l)首先对原图像用两种算法分别进行二值化,得到两张二值化图像:基于LOG算子的局部动态阈值二值化图像和基于最大类间方差的全局阈值二值化图像。
2)对这两张二值化图像的对应像素点进行“或”运算。如果结果为0,则说明是背景点,则该点不做任何处理直接跳到步骤5);如果运算之后结果为1,则说明两张二值化图像中至少有一张图像中该点是前景字符点。
3)两张图像的对应点“或”运算,结果为1有两种情况:两张二值化图像的对应点全部为1,这种情况直接跳到步骤5);另外一种情况是两张图像一个为0(背景点),另一个为1(前景点),则进入步骤4)分析处理。
4)所有的字符图像都是在一个很小的邻域内连通的。连通域太大说明阈值选取错误导致字符与背景没有划分出来,而连通域太小则说明是孤立的噪声点,不是有效的字符。所以该步骤对两个点中像素值为1的点进行邻域检测,判断该连通区域的大小。若符合有效字符连通域的参数,则在结果二值化图像中将该点置为1,否则置为0;
5)若所有像素点都己经遍历结束则输出合成的二值化图像。否则选取下一像素点,跳到步骤2)。
最后将图像空间中具有一定关系的像元进行聚类。把数据空间中的每一个点作为一个模式,把每个数字的连通区域作为一个类,从而根据简单模式聚类方法,把符合要求的模式分到各类中而提取出最后尽可能真实的边缘。
图2(d)为使用该算法所得到的效果,与图2(b)和图2(c)进行对比得出结论该算法的总体效果较好。
3 实验结果与分析
为了验证理论分析的正确性,在光照不均匀的情况下用该方法二值化效果明显好于分别单用全局阈值法和局部自适应二值化算法,我们依次把这三种二值化算法处理后的图像输入系统进行匹配识别,用最终的识别率作为评价二值化算法优劣的最优标准。
为了验证本文提出的二值化算法的优越性,我们特选取两大类图像样本集:第一类是在正常工业环境,背景简单且光照均匀的情况下拍摄的一般图像(图像质量的好坏基本服从正态分布);第二类是在待测工件本身有划痕、油渍等干扰,光照不均匀且工业环境恶劣情况下拍摄的质量较差的图像。进而我们分别把二值化算法处理过的两类图像输入识别系统,通过识别率的高低对二值化算法进行评价。由于经过多次(大于5)试验且每次图像样本的基数(大于500)较大,根据统计学原理,识别率的高低基本可以反映出二值化算法的效果。
由表1的实验结果可以看出对一般质量的图像来说,三种二值化处理,系统的识别率分别达到了93.58%、94.17%和95.07%,识别效果差别不明显,主要是因为图片质量好,噪声少,对比度高,三种方法对这一类图片的分割效果都比较好没有明显的差距。由表2我们明显可以得出结论,对第二类质量不好的高噪声图像来说,本文提出的二值化算法分割效果明显优越于Otsu和自适应的二值化方法,相对于另外两种算法本文提出的二值化算法具有很好的自适应性和实用性,对多噪声,光照不均匀,油污严重等图像,也都有很好的分割效果;对一般图像和质量不好的图像二值化后系统识别率都有较大的提高。
4 结论
由于机械工件上的数字字符靠反射光成像,图像均匀性很差,再加上多种干扰因素的存在,所以很难找到一种普遍适应、计算简单、同时自适应性又很强的二值化算法对图像进行有效的处理。在从灰度图像向二值图像的转化过程中,如何尽量减少噪声并使损失的有用信息量减少到最小,是人们长期以来所追求的目标。所以研究二值化算法的根本目的在于提取信息,将有用的部分作为前景显示出来与背景进行有效的区分。
本文通过分析,结合机械工件数字字符实际情况找出一种有效的算法来满足工业上数字字符识别系统的需求。针对机械凹凸数字字符图像的特点,基于LOG算子的局部动态阈值算法通过边缘增强凸显字符的细节信息,对于容易混淆的字符能够起到很好的效果。而基于最大类间方差的全局阈值算法运算速度快、引入噪声相对较少。提出将两种算法有效的综合起来,可以扬长避短,提高识别效率。此种方法目前只是应用在工件小类别数字识别上,今后有待在工件复杂文字识别上深入研究,拓展应用。
参考文献
[1]张云刚,张长水.利用Hough变换和先验知识的车牌字符分割算法[J].计算机学报,2004,27(1):130-135.ZHANG Yun-gang,ZHANG Chang-shui.Segmenting Characters of License Plate by Hough Transformation and the Prior Knowledge[J].Chinese Journal of Comoputers,2004,27(1):130-135.
[2]田雪冰,韩绍坤.零件钢印号码自动识别预处理算法研究[J].光学技术,2006,32(S1):557-559.TIAN Xue-bing,HAN Shao-kun.Image preprocess research on the automation recognition technology of workpiece steel seal number[J].Optical Technique,2006,32(S1):557-559.
[3]周小龙,张小洪,冯欣.基于视觉显著图的车牌定位算法[J].光电工程,2009,36(11):145-150.ZHOU Xiao-long,ZHANG Xiao-hong,FENG Xin.A Novel License Plate Localization Algorithm Based on Saliency Map[J].Opto-Electronic Engineering,2009,36(11):145-150.
[4]刘成云,陈振学,马于涛.自适应阈值的小波图像去噪[J].光电工程,2007,34(6):77-81.LIU Cheng-yun,CHEN Zhen-xue,MA Yu-tao.Adaptive wavelet thresholding method for image denoising[J].Opto-Electronic Engineering,2007,34(6):77-81.
[5]彭碧霞.车牌图像自动识别系统预处理算法研究[J].武汉大学学报:工学版,2006,39(3):131-134.PENG Bi-xia.Study on method of pre-processing on vehicle license plate image recognition system[J].Engineering Journal of Wuhan University,2006,39(3):131-134.
[6]王延杰,宋建中.一种实时自适应图像二值化方法[J].光学精密工程,1994,2(5):17-21.WANG Yan-jie,SONG Jian-zhong.An Adaptive Method for Image Binarization in Real-Time[J].Optics and Precision Engineering,1994,2(5):17-21.
[7]Yun Eun-Kyung,Cho Sung-Bae.Adaptive fingerprint image enhancement with fingerprint image quality analysis[J].Image and Vision Computing(S0262-8856),2006,24(1):101-110.
[8]Erikson Mats.Two preprocessing techniques based on grey level and geometric thickness to improve segmentation results[J].Pattern Recognition Letters(S0167-8655),2006,27(3):160-166.
基于多层次分块的指纹图像二值化 篇5
目前, 自动指纹识别系统中常用的二值化算法一般为全局固定阈值法和自适应动态阈值法两种。全局固定阈值法一般根据整幅指纹图像的灰度直方图分布选择一个合适的判断阈值, 对整幅指纹图像进行二值化处理。在指纹图像对比度较好的情况下, 由于统计直方图的两个峰值比较明显, 从而能够选择合适的阈值对指纹图像进行二值化处理。但该判定阈值的选择完全依赖于统计直方图, 该方法抵抗噪声干扰的能力较弱。另外, 现有的指纹采集仪器一般都是接触式的, 受按压力度的不同, 指纹图像中心区域和边缘区域的灰度分布并不一致, 一般而言, 图像中心区域的按压力度较大, 所采集到的指纹图像较深。因此, 全局固定阈值二值化算法并不能很好地适应实际处理的要求。
相比之下, 自适应动态阈值法根据指纹图像的实际纹理特点, 在确定某区域指纹图像的二值化阈值的过程中, 首先假定该阈值能够将该区域像素划分为数量大致相等的两个集合, 然后根据统计规律, 选择一个合适的判定阈值, 将对应区域的指纹图像划分为大致相等的两个区域:前景区域和背景区域。该方法能根据图像的局部灰度自动选择合适的阈值, 在选择合适的分块大小情况下, 能够取得最佳的二值化效果。一般而言, 最佳分块尺寸应该是指纹图像纹线距离的整数倍。但是, 纹线距离的求取本身就是一个难点, 一般很难精确确定指纹图像的纹线距离。同时, 指纹图像各区域的纹线距离并不一致, 甚至偏差很大, 选择合适的分块尺寸非常困难。鉴于此, 本文提出了一种基于方向信息的多层次分块的指纹图像二值化方法。算法首先根据点方向对指纹图像进行多层次分块, 然后对各像素点根据该点的灰度值与它所在块区域的灰度平均值的比较结果进行二值化, 取得了较好的效果。
1 指纹图像多层次分块
1.1 计算点方向
点方向, 表示源指纹图像中每一点脊线的方向。指纹图像点方向代表的是指纹图像中各个点的方向信息, 点方向的求取是块方向求取的先决条件。这里采用文献[4]中求取点方向的方法, 如下所示:
(1) 将指纹纹线的方向在0°~180°之内划分为8个基本的方向, 如图1所示。
(2) 对规格化后的指纹图, 按下式计算点 (i, j) 沿每个方向的灰度均值和方差。
undefined
其中, Gd (ik, jk) 是点 (i, j) 沿方向d上的第k点的灰度值, n是所取的邻点数, 文中取n=8。
(3) 点 (i, j) 的方向是Vd取值最小的方向d, 即灰度变化最小的方向。
1.2 根据点方向对指纹图像进行多层次分块
由上文得到指纹图像的点方向以后, 按照以下步骤对指纹图像进行分块:
(1) 将整个指纹图像分成16×16的小块, 对每一分块计算其方向直方图。若每一分块的指纹方向直方图的峰值均大于16×16×α, 分块结束, 否则继续下一步。
(2) 对每一不满足 (1) 的16×16的指纹分块, 对其进行下一步划分, 将其分成8×8的4个小块再计算每一小分块的方向直方图, 若每一分块的指纹方向直方图的峰值均大于8×8×α, 分块结束, 否则继续下一步。
(3) 对每一不满足 (2) 的8×8的指纹分块, 对其进行下一步划分, 将其分成4×4的4个小块, 分块到此结束。
2 指纹图像二值化
在对指纹图像进行多层次分块之后, 即可结合分块信息进行自适应动态阈值计算, 最后根据所选定阈值对原始图像进行二值化, 其具体算法如下:
(1) 求取各块区域的阈值
根据上文所得的多层次分块信息求取各块区域的阈值, 步骤如下:
① 求取该区域内所有像素的灰度平均值:
undefined
② 分别计算该区域内大于等于阈值T的像素点个数N和小于阈值T的像素点个数M。
③ 如果N-M≤S (S=w×w×10%) , 则T为阈值, 否则进行下一步。
④ 如果N>M, 则T=T+1, 返回到上一步;否则T=T-1, 返回到上一步。
(2) 二值化
对给定的一幅指纹图像, 对其中的任一像素点 (i, j) , 当该点的灰度值大于它所在块区域的灰度平均值时, 点 (i, j) 为谷线上的点, 将其置为0, 否则点 (i, j) 为脊线上的点, 将其置为1。
3 实验结果及结论
本实验在IntelP43.0GHZ的台式电脑上进行, 使用的编程语言为Visual C++6.0, 运行环境为Windows XP。本实验使用的指纹输入设备是Veridicom公司推出的第三代半导体指纹传感器FPS200。获取的图像是256级灰度图像, 大小是256×300像素, 分辨率为500dpi。本算法的实验结果如图2和图3所示。图2 (a) 和图3 (a) 为原始指纹图像, 图2 (b) 和图3 (b) 为文献[5]对应的二值化后的图像, 图2 (c) 和图3 (c) 为本文实验对应的二值化后的图像。
从实验结果中可以看出, 使用本文提出的基于多层次分块的指纹图像二值化方法, 效果明显优于文献[5]。本文实验先根据点方向对指纹图像进行多层次分块, 然后对各像素点根据该点的灰度值与它所在块区域的灰度平均值的比较结果进行二值化, 能够得到脊线平滑连续的二值化图像, 有较强的抗干扰能力;对采集过程因手指过湿和过干引起的纹线模糊和断裂, 具有消除噪声干扰、连接断线、去除叉连点及边缘锐化的能力, 对采集过程因压力而不均产生的图像灰度不均现象, 具有一定的平滑作用。所以本文算法有效地改善了不同质量的指纹图像, 保证了下一步细化处理。
参考文献
[1]傅景广, 许刚, 王裕国.基于二值图像的指纹细节点提取[J].计算机研究与发展, 2004, 41 (4) :720-727.
[2]Anil K Jain, Salil Prabhakar, Ling Hong.Filterbank-based FingerprintMatching[J].IEEE Transactions on Image Processing, 2000, 9 (5) :846-859.
[3]尹义龙, 詹小四, 谭台哲, 等.基于加博函数的指纹增强算法及其应用[J].软件学报, 2003, 14 (3) :484-489.
[4]何东宇, 蔡远利.基于方向图的指纹预处理方法研究[J].计算机工程与应用, 2004 (14) :77-80.
一种改进的文本图像二值化方法 篇6
关键词:文本图像,二值化,局部阈值,全局阈值,Niblack算法
文本图像的二值化效果是影响OCR(光学字符识别)系统性能的主要因素,研究人员为此作了大量工作。二值化方法可分为全局阈值法和局部阈值法。全局阈值法根据文本图像的直方图或灰度空间分布确定一个阈值,算法较简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对光照不均匀、噪声干扰较大的图像,二值化效果明显变差。局部阈值法通过定义考察点的邻域,并由邻域计算模板实现考察点灰度与邻域点的比较,根据区域灰度分布特性,自适应调节阈值。典型的局部阈值法有均值分割法、Kamel-Zhao算法[1]、Bernsen算法[2]、Niblack算法[3]等。局部阈值法较全局阈值法有更广泛的应用,但缺点也较明显,如速度慢、容易出现伪影现象和笔画断裂现象。
近年来,对文本图像二值化的研究仍在继续。如Gatos提出了针对退化文本图像的二值化方法[4];Bolan Su则提出将多种文本图像二值化方法结合使用[5]。文献[6]针对Bernsen算法提出了一种改进算法,通过引入一个简单的整体阈值进行辅助判断,对算法得到的阈值曲面进行光滑处理并对局部窗口的极大、极小值进行考察,从而较好地避免了伪影及笔画断裂。文献[7]和[8]分别将谱聚类和图谱理论应用于文本图像二值化算法中。文献[9]对一种基于局部阈值分割的LLT算法给出了改进方法。文献[10]则在Niblack方法的基础上提出了一种改进的针对退化文本图像的二值化方法,该方法仅在文本区域周围较小范围内进行局部阈值计算,减少了运算量,克服了Niblack方法容易产生大量背景噪声的缺点,对于低对比度的文本图像有更好的适应性。
到目前为止,还没有一种通用的文本图像二值化方法[11]。寻找更好的文本图像二值化方法,仍然是图像处理研究领域的目标之一。该文以Niblack算法为基础,针对Niblack算法所存在的问题,综合一些已有算法的优点,提出了一种改进的二值化方法。改进后的Niblack算法抗噪能力强,较好地避免了伪影,并且能最大限度地保持笔画像素。
1 Niblack算法概述
在以下的讨论中,不妨设笔画占据灰度文本图像低灰度级部分,背景占据高灰度级部分。这与一般扫描的文本图像是相符的。
记f(x,y)为图像在考察点(x,y)坐标的灰度,W为估计最大笔画宽度,一般取W=7。考察以(x,y)点为中心的(2W+1)×(2W+1)窗口,则Ni Black算法计算点(x,y)处阈值的公式为:
其中m(x,y)和V(x,y)分别是窗口内(2W+1)×(2W+1)个像素点的平均灰度值和均方差,k是根据经验预定的某阈值,一般取k =0.1~0.5。Niblack算法的阈值由考察点邻域的灰度确定,强调二值化阈值随区域变化而动态调整,对容易受光源影响的图像和字符灰度变化较大的图像,有比较好的适应性,但容易出现笔画断裂及伪影现象。这是因为Niblack算法以公式(1)计算考察点的阈值,当考察窗内像素绝大部分为目标(或背景)点,而目标(或背景)灰度又不均匀时,会使得宏观上本应同类的部分像素:目标(或背景)被强行二值化为背景(或目标),从而产生笔画断裂及伪影。另外,由于对图像中每个像素点(x,y),均需取一个以(x,y)点为中心的(2W+1)×(2W+1)窗口计算平均灰度值和均方差,运算量较大。
为减少运算量和伪影,在算法中,一般先用全局阈值方法估计一个粗阈值。计算方法如下:对整个图像计算平均灰度值m和均方差V,通过公式T = mk×V计算得到粗阈值。得到粗阈值T后,把图像中灰度值大于T的像素强行判定为背景像素点,不再参与计算。因为文本图像背景像素点至少占到50%以上,而且往往达75%以上,所以运算量减少了很多。但仍然存在如下问题:(1)背景灰度不均匀的区域,伪影仍然较多(图1);(2)可能导致较淡的字符笔画的丢失;(3)笔画断裂现象依旧没有得到改善。
为了尽量保全较淡的字符笔画、避免字符断裂和有效地减少伪影,下面对Niblack算法进行一些改进。
2 改进的Niblack算法
本文对Niblack算法的改进主要有以下几个方面:1)为克服图像获取的光照条件未知等缺点,先对文本灰度图像进行灰度拉伸。2)给出了一种新的估算粗阈值T的方法。3)为避免字符笔画断裂,对考察点阈值的计算公式进行了改进。4)为了消除伪影,对邻域灰度均值较大的考察点的阈值作了进一步的调整。下面给出具体的实现步骤。
2.1对图像进行灰度拉伸
设原始灰度图像f(x,y)的最大灰度值为Max Gray,最小灰度值为Min Gray,灰度拉伸后的图像为g(x,y),则g(x,y) = 255×( f(x,y)Min Gray)/(Max GrayMin Gray)。经过灰度拉伸后,图像灰度将分布在0~255之间,避免了获取图像时环境光线强弱变化的影响。以下针对拉伸后的图像g(x,y)进行讨论。2.2
2.2选取粗阈值
粗阈值选取除了上述通过整个图像的平均灰度值m和均方差V来估算外,也可以利用已有的一些方法确定全局阈值,如Otsu法,Li和Lee的最小交叉熵方法,Huang和Wang的基于最小模糊度的方法等。为了尽量保全较淡的字符笔画,该文提出一种类似比赛评分的机制,通过估算出的字符平均灰度和背景平均灰度来计算粗阈值的方法。
根据对文本图像的大量统计,发现笔画像素至少占据图像像素的2%以上,但不会超过50%,从而可以根据灰度直方图估算出字符平均灰度和背景平均灰度。先去掉灰度值最小的1%的像素点,再去掉20%的灰度值最大的像素点,对图像上剩下的像素点,取1%灰度值最小的像素点的灰度平均值作为字符平均灰度Char Aver,再取20%灰度值最大的像素点的灰度平均值作为背景平均灰度Back Aver,最后通过下面的公式计算出粗阈值T。
由于统计出的背景平均灰度Back Aver一般很准确,而计算出的T值小于且接近背景平均灰度,所以,通过粗阈值T既可以滤除大部分背景,又能完整的保留较淡的字符笔画。对灰度拉伸后的图像g(x,y),当g(x,y)>T时,直接将考察点(x,y)判为背景像素点。
2.3 阈值计算公式的改进
通过对Niblack算法二值化后的文本图像的分析,发现笔画断裂现象主要出现在多笔画字符的中心。因为当待考察像素点(x,y)位于多笔画字符的中心时,考察点(x,y)邻域的平均灰度值m(x,y)较小,而均方差V(x,y)较大。此时,通过原Niblack算法阈值计算公式(1)计算出的考察点阈值T(x,y)会偏小, 从而在二值化时会把部分笔画点错误的归入背景点,造成笔画断裂。为了克服上述偏差,我们将原阈值计算公式(1) 改进如下:
改进后的公式,相当于对公式(1)中的系数k根据考察点的邻域性质进行了动态调整。当考察点位于多笔画字符的中心时,m(x,y)较小,而V(x,y)较大,此时k×(1-V(x,y)/m(x,y))比k要小很多,甚至为负值,从而T(x,y)的值得到了有效的提升。这样,就能较好的避免把部分笔画像素点错误的归入背景点。
2.4 消除伪影
经过上述三个步骤的改进后,字符的完整性得到了较好的保证,但在背景灰度不均匀的区域,伪影仍然较多。这是因为,当待考察的像素点(x,y)位于背景区域时,考察点邻域的平均灰度值m(x,y)很大,而均方差V(x,y)较小,另外,在公式(3)中,系数k=0.1~0.5,因此T(x,y)≈m(x,y),即T(x,y)与考察点邻域的平均灰度值m(x,y)很接近,所以始终会把一部分背景点错误的归为笔画点,形成伪笔画。为了消除伪影,需要对由公式(3)计算出的阈值作进一步调整。
对待考察的像素点(x,y)和它的8邻域有下面的平滑性假设:笔画点的邻域点很可能是笔画点,而背景点的邻域点很可能是背景点。从而可以认为:考察点(x,y)的8邻域的平均灰度值越大,则该点是背景点的可能性越大。根据上述假设,若考察点(x,y)的8邻域平均灰度值m8(x,y)较大,可适当降低由公式(3)计算出的阈值T(x,y)。当m8(x,y) > 4×T/5时(T为由公式(2)计算出的粗阈值),将阈值计算公式(3)最终调整为如下形式:
经过上述几个步骤改进后的Niblack算法,能较有效的消除伪影,较完整的保留淡的字符笔画,并克服多笔画字符的笔画断裂现象。改进后的Niblack算法的二值化效果(图2)与原始的Niblack算法的二值化效果(图1)相比,伪影明显少了很多。
3 实验结果分析
下面是分别用Niblack算法与本文改进后的Niblack算法对几幅具代表性的文本图像进行二值化的效果(图3(a)—(d))。实验中取W=7,k = 0.2,算法用VC++6.0编程实现。
从实验结果来看,文本图像采用原始的Niblack算法二值化后有较明显的伪影,非常不利于字符的识别,而采取本文的改进措施后,伪影现象基本消除,字符断裂情况也减少。但对有纹理背景的图像,仍会有少量伪影现象存在(图3(c))。
4 结束语
迭代二值化论文 篇7
关键词:图像熵,区域最大值,车牌,二值化算法
0 引言
车辆牌照识别(License Plate Recognition,LPR)技术是智能交通的核心技术之一,现已广泛用于电子收费、车辆监控等方面。该系统从图片中自动提取车牌区域,自动分割字符并进行识别,最终得到车牌号码。车牌字符分割是该系统的重要组成部分。车牌字符二值化贯穿字符分割的始终。车牌字符二值化的效果,直接影响车牌识别系统的精度。早期的二值化算法是简单方差阈值法,利用背景区域和前景区域的方差对比,实现二值化处理[1]。另一种基于方差的二值化算法是最大类间方差法Otsu[2]。此外,有文献利用Gabor滤波器的频域和方向选择性,提出采用Gabor滤波算法[3]。另外,有T.Pun[4,5],Pal[6]和Abutaleb[7]等多次提出的信息熵算法,Kittler提出的最小误差算法[8]等。
本文针对目前常用的车牌字符二值化算法所存在的问题,将图像熵应用于车牌字符二值化处理中,并针对车牌特征,通过改变最大图像熵的计算方法,对车牌进行二值化。
1 图像熵
1.1 信息熵
在Shannon信息论中,熵是不确定的量度,或对随机试验结果的无知性度量,熵的值越大,系统内部就越不均匀,系统的平均不确定程度就越大。熵是信息量的概率加权统计的平均值,是信息出现概率的不确定性的一种表征。图像的二值化算法,就是依据信息熵的这个物理意义来实现的。
1.2 图像熵
图像熵是计算图像信息熵值的一种方法。根据Shannon熵概念,对于灰度范围{0,1,…,L-1}的图像直方图,其熵测量为
式中:pi为第i个灰度出现概率。假设有门限t将图像分为目标与背景两类,则。目标元素和背景元素的后验概率pm,pb和pt之间的关系为:pm=pt,pb=1-pt。
图像的后验熵为
2 区域最大值的原理
区域最大值是基于数学平方和基础上的衍生,在数学理论上,当X和Y数值相等时,2xy与(x2+y2)相等。通过这个原理,在图像处理过程中,假设某一门限值为t,通过t把图像的直方图序列或是图像熵序列分为两个部分,其总和分别为x和y,通过平方和的原理计算出序列的最大值,即图像区域最大值。求取最大值公式为2xy≤x2+y2。当x=y时,该式取最大值,即2xy=x2+y2,则有
3 基于区域最大图像熵的二值化算法
3.1 算法的原理
最大图像熵的二值化方法已经得到了肯定,但是该方法只是单一的最大值,作为图像的阈值存在很大的局限性。本文基于区域最大图像熵的二值化算法,在传统算法的基础上,在合理的理论支持下,通过对最大值选取方式的改变,来计算二值化的阈值。
在最大值选取方式上,由单个点的选择扩展到通过区域的比较来进行选择,再结合图像熵的物理意义和车牌图像的特殊性实现阈值的选取。
3.2 算法实现
3.2.1 计算图像熵
通过式(2)得到图像熵序列为H′(t),其中t=0,1,...,255。假设一个位置t,把熵序列H′分为两个类,一个是背景H1,一个是目标H2。根据式(1),两个类的图像熵分布计算如下
3.2.2 计算区域最大值和原始图像直方图(ZFT)
最大值位置阈值为
用T把序列H′和ZFT分为两个部分,公式为
3.2.3 进行初选阈值
分别统计直方图两边序列S2和S1的总和,得到L和R,并求比值K=L/R,初步确定阈值选取的范围。通过对车牌图像的研究,发现车牌图像中车牌字符与背景之间的灰度个数比值在一定的范围之内。确定阈值范围的原则如下:
1)如果K>1,且小于某一个数值t1的时候,选取阈值范围[T,255];
2)如果K<1,且大于某一个数值t2的时候,选取阈值范围[0,T];
3)如果K>t1,直接选取阈值范围[T,255];
4)如果K
3.2.4 进行精选阈值范围
如果出现情况1,对H2进行区域最大值位置的选取,得到max_point,确定阈值范围[max_point,255];如果出现情况2,对H1进行区域最大值位置的选取,得到max_point,确定阈值范围[0,max_point];如果出现情况3或情况4,就选取阈值范围[T,255]或[0,T]。
3.3 阈值提取和二值化实现效果
图1是阈值提取的过程,实线是第一次区域最大值T,通过T把图像熵曲线分为H1和H2两个部分,然后通过上述精选阈值的方法对某一部分进行二次区域最大值,确定最后的阈值,即MAX_POINT,图中的虚线是精选阈值。图2是原始车牌图像和二值化后的效果。
4 实验结果
为验证算法的有效性,通过365幅车牌图像进行实验,车牌的特点有:1)车牌尺寸多样化,有150×30,190×45,160×40,75×20;2)车牌颜色组成多样化,有蓝底白字、黑底白字、白底黑字、黄底黑字。4种颜色车牌字符的二值化情况如图3所示。
具体测试结果如表1所示。
在测试中,有21幅车牌图像二值化效果不好,原因在于:1)强光噪声影响下的车牌,该类车牌由于光照影响,几乎不能辨认字符;2)车牌比较脏,很难辨认字符。
5 结论
基于区域最大图像熵的车牌字符二值化算法是针对车牌图像目标与背景分布的特殊情况而提出的,该算法把局部的剧烈变化和整体的分布特点很好地结合起来,先初选阈值范围,判断车牌字符的颜色,再在初选阈值范围的基础上,确定精确的阈值范围。在阈值范围提取后,可以直接把不同颜色的车牌字符二值化为1。通过算法的研究证明,该算法有一定的理论依据,并具有非常好的二值化效果和准确率。
参考文献
[1]SAHOO P,SOLTANI S,WONG A.A survey of threshold techniques[J].Compute Vision,Graphics and Image Processing,1988,41(3):233-260.
[2]OTSU N.A threshold selection method from gray-level histograms[J].IEEE Trans.Systems Man.,and Cybernetics,1979,9(1):62-66.
[3]JAIN A K,RATHA N K.Object detection using Gabor filters[J].Pattern Recognition,1997,30(2):295-309.
[4]PUN T.A new method for gray-level picture thresholding using theentropy of the histogram[J].Signal Processing,1980,2:223-237.
[5]PUN T.Entropic thresholding:a new approach[J].Comp.Graphics andImage Processing,1981,16(3):210-239.
[6]JOHANNSEN G,BILLE J.A threshold selection method using infor mation measures[C]//Proc.the 6th International Conference on PatternRecognition.Munich,Germany:[s.n.],1982:140-143.
[7]ABUTALEB A S.Automatic thresholding of grey-level pictures usingtwo-dimensional entropies[J].Pattern Recognition,1989,47:22-32.
[8]KITTLER J,ILLINGWORTH J.Minimum error thresholding[J].PatternRecognition,1986,19(1):41-47.