灰度控制论文(精选7篇)
灰度控制论文 篇1
灰度进程管理的模型实现, 利用视觉刷新率的倍增技术提升led显示屏视觉的刷新率。灰度进程管理理念的建立, 可以为led显示屏的灰度控制技术提供一定基础。
一、LED显示屏概述
Led显示屏的核心就是半导体晶片, 而晶片要安装在一个支架上, 一端为负极, 而另一端要连接在电源的正极上, 从而使晶片的整体被环氧树脂所封装。晶片主要由两个部分构成, 其中一部分为空穴占主体作用的P型半导体, 另一部分为电子占主体作用的N型半导体[1]。如果两种半导体连接一起时, 彼此之间就能够组成一个P-N结构。如果电流通过导线作用在晶片的两端, 这时电子就要被推向P区, 而在P区中的电子会与空穴复合, 从而就以光子的形态释放能量, 上述就是led显示屏发光的原理。Led显示屏的灰度等级可以由led灯呈现的亮度等级反映出来, led灯的亮度与导通时间存在线性关系, 因此仅仅需要把图像的数字信号变化成与时间相对应的电信号, 然后把电信号转变成光信号, 从而完成数字信号转变为光信号的过程。恒流驱动芯片的主要工作原理是由显示控制核心发射的串行数字信号SDI在移存过程时钟的驱动下, 完成逐级移存, 如果移存到需求的长度时, 锁存的信号led实现移存相关数据的捕获, 同时在消隐信号的有效控制下转变为恒流的电脉冲信号, 此电脉冲主要作用在led上, 使led发光, 这时电脉冲信号就转变为光信号。
二、灰度调制技术基础研究
1、灰度调制模型。
研究led显示屏的灰度调制, 必须制定灰度调制模型。现阶段, 主流led显示屏应用的是PWM驱动形式, 在此基础上建立通用的led显示屏的灰度调制模型。此模型选择一路串行的数据当作基准, 并以串行数据的控制相关驱动芯片当作依托, 完成现宽Nw和高Nhled显示屏的控制[2]。每一个驱动芯片的通道数是Nch, 而驱动芯片有关数据信号具备串行输入的数据SDI和串行输出的数据SDO, SDI和SDO能够级联。另外控制信号具备扫描时钟fclk和锁存LE、消隐OE, 各个驱动芯片都可以共同享用上述三个控制信号。2、灰度调制模型的数学表达。灰度调制模型要想表述必须确定各个参数间的关系、各个控制信号的具体时序等方面。在芯片运用角度来讲, 灰度调制的参数主要包含串行数据和移存长度及扫描时钟等;而在工程运用角度来讲, 客户较关心的是led显示屏的现实效果和刷新率及灰度等级;在控制系统角度来讲, 设计人员更为注的是硬件资源的具体消耗, 相对优越的控制效果, 即高性价比。
三、灰度进程管理的研究
1、创建灰度进程管理模型。
灰度进程的管理模型主要包含数据录入、缓存1、图像处理、灰度进程控制、比较器、扫描输出等。视频数据一定要先缓存1, 而缓存1一般是由外部的存储器组成, 例如SDRAM和DDR内存[3]。缓存1的输出数据通过图像处理过后, 输到比较器中输入端, 而比较器的另外一端是由权值电路进行控制, 权值电路要由灰度进程控制的有关模块控制。一个比较器会输出1bit, 多个1bit数据会依照规律存入缓存2。另外红绿蓝要独立存入到各自的缓存, 可以定义成缓存2-1和缓存2-2级缓存2-3。最后, 利用扫描模块显示出缓存2中的有关数据, 同时完成进程调制模块的有关控制显示。
2、权值电路。
单一权值电路每一次存储1bit的权值数据, 此权值数据根据其权值能够被读出1次或是r次, 进而组成一个非均匀的双体操作类型的权值电路。此电路可以在一样图像存储器的读取速度下, 提升led显示屏的刷新频率, 并存储在图像存储器中。另外, 单一的权值电路形成的数据, 经过比较器的比较, 可以获得单一权值的时间片1bit的亮度数据。比较器形成的单一权值1bit的亮度数据要存在单一的权值存储器中, 选取电路对重复权1bit的亮度数据进行重复读数, 然后对单一权值1bit的亮度数据完成输出1次, 利用交替执行方式。选取电路输出1bit的亮度数据传送到扫描的输出电路, 一直到图像扫描的完成[4]。控制电路用在协调各个部分工作时序与图像存储器的运行状态, 这样在读取一次图像的存储器, 就能够扫描输出r+1次的权值时间片, 在一定程度上节约了存储空间。
四、结束语
Led显示屏运行时, 不仅要提升灰度的管理水平与刷新率, 还要确保led显示屏的稳定性与同步性。在未来的研究中, 要重点研究led显示屏的超稳态现实与多节点的同步刷新, 确保led显示屏的稳定性与同步性。
参考文献
[1]俞彬杰.基于FPGA的全彩色LED同步显示屏控制系统的设计[D].[硕士学位论文].上海:上海交通大学电子信息与电气工程学院, 2010.
[2]张倩.基于FPGA的高灰度级LED屏控制系统的设计与研究[D].[硕士学位论文].山东:山东师范大学, 2011.
[3]中华人民共和国电子行业标准.SJ/T_11281_2003-LED显示屏测试方法[S].北京, 中华人民共和国信息产业部, 2013.
[4]赵才荣, 刘金娥, 丁铁夫.基于LED图文屏的多灰度图像实现方法[J].液晶与显示, 2010, 21 (1) :82-86.
灰度图像水印综述 篇2
随着计算机通信技术和互联网的迅速发展, 数字多媒体的传播也越来越方便快捷。同时数字媒体信息版权的保护[1]成为了一个新的信息安全问题。加密技术是保护信息和数据安全的传统手段, 作为加密技术的补充方法, 数字水印可望在技术上为数字信息及其所有者权益提供有效的保护。因此, 数字水印技术也成为了目前学术界研究的一个前沿热门方向。
1 数字图像水印技术
数字水印[2]是指永久镶嵌在其他数据 (宿主数据) 中的具有可鉴别性的数字信号或模式, 并且不影响宿主数据的可用性[3]。关于数字水印定义的其它解释可见文献[4]。
不同的应用对数字水印的要求不尽相同, 一般认为数字水印应具有的特点包括:不可感知性[3]、健壮性 (或鲁棒性) [5]、安全性[5]和可证明性[6]。
数字图像水印作为目前数字水印里面研究最多的一种水印技术, 同样具备数字水印的所有特点。 在数字图像水印中, 水印的嵌入算法主要有空域和频域两类。空域水印算法就是将水印直接嵌入到原始数据中, 特点是算法简单、计算复杂度低, 但鲁棒性差。典型的空间域算法有:最不重要位算法 (LSB) [7]、patchwork算法[8]等。变换域算法是对图像进行各种变换后再嵌入水印, 常见的变换方法有DCT变换[9], DWT[10], DFT[8]变换等。水印的提取算法有盲检测和非盲检测两种, 盲检测是指提取水印不需要原始载体信号参与, 此算法在网络环境下相当实用。非盲检测算法在水印提取时需要原始载体信号参与。
目前为止, 绝大部分的数字水印技术因信息量过大会影响载体图像的视觉效果而只使用基于一维ID (identification) 序列和二维二值数字水印来进行研究, 这种水印所包含的知识产权的保护信息量少、保密性差, 而多数商标或版权标志都是以灰度图像或彩色图像表示的, 因此对于如何嵌入灰度图像水印的研究具有很重要的实用价值。
2 数字灰度图像水印
2.1 空域灰度级数字图像水印技术
易开祥等人[11]设计了一种以灰度图像为水印信息的数字水印系统, 这种系统是在空域上完成的, 被加载了水印信息的载体图像在经历攻击性实验时鲁棒性不高, 这对该技术的应用产生了一定的限制。
2.2 变换域的灰度数字图像水印
典型的变换域水印加载过程如图1所示。
2.2.1 DCT域灰度级数字水印技术
在DCT域进行数字水印的嵌入主要是基于对载体图像进行全局或分块的二维DCT变换后, 将数字水印信息嵌入到DCT系数中。
文献[12]中提出了一种应用于DCT域以灰度图像为水印信号的公有水印算法, 先将256级灰度水印图像分解为二值图像, 再将灰度水印图像嵌入到宿主图像中。该算法对灰度水印图像的转换处理是有效的, 但该算法存在几个缺点:一是非盲水印嵌入, 提取水印时尚需原始宿主图像参与, 二是所嵌入的灰度水印图像没有压缩, 对处理较大分辨率的灰度水印图像是比较困难的, 三是没有有效利用不同水印比特的重要性。鉴于文献[12]中的几个缺点, 易开祥[13]利用JPEG压缩原理将灰度水印DCT域量化取整, 提取非零系数构成嵌入数据, 提高了水印系统的性能。
2.2.2 DWT域灰度级数字图像水印技术
对载体图像进行小波分解后, 可以得到图像的4个部分:低频近似部分LL、以及各方向上的高通部分LH、HL、HH。由于DWT良好的空间-频率分解特性更符合HVS的特点, 以及在新一代图像压缩标准JPEG2000[14]中的成功应用, DWT正在越来越多地应用于当前图像水印算法中。所以在DWT域嵌入数字水印已经成为数字水印技术发展的一种趋势。
牛夏牧等[15]提出了一种基于多分辨率分解的灰度级数字水印技术, 根据人的视觉的多分辨率特性, 利用文献[16]中描述的分辨率缩减方法, 把水印分解为多分辨率金字塔式层次结构, 如图2所示。同分辨率层次的灰度级数字水印嵌入到对应的分辨率层次的原始静态图像之中, 使水印对原始图像具有自适应言。
3 自适应灰度级数字水印
典型的自适应水印嵌入过程如图3所示。
自适应图像水印算法的基本思路是根据HVS的对比特性, 自适应地调整局部隐藏的水印强度, 其依据则是利用了HVS的视觉掩蔽 (visual masking) 特性。具体的讲, 就是对HVS比较敏感的区域, 降低水印强度;而HVS不太敏感的区域, 则提高水印强度。对于常用嵌入水印的公式:F=F× (1+a×W) (式中F表示选择修改的系数值, F′表示修改以后的系数值, a表示拉伸系数, W表示嵌入水印信息) , 自适应意味着拉伸系数a的自适应改变。通过对不同的区域合理地分配水印能量, 有利于水印稳健性的提高。
视觉掩蔽特性分为照度掩蔽 (luminance masking) 、频率特性 (frequency masking) 和纹理掩蔽 (texture masking) 。照度掩蔽特性可以描述为:背景越亮, HVS的对比度门限越高。频率掩蔽定义为:一个一定频率的空间正弦信号, 将降低其他相近频率的空间正弦信号的可检测性。纹理掩蔽描述的则是:背景纹理越复杂, HVS对噪声越不敏感。这意味着, 在纹理较为复杂的区域, 可以隐藏较强的水印能量。
为了充分利用DWT良好的空间-频率分解特性和人类视觉特性, 很多文献将两者结合起来进行灰度级数字水印的嵌入。文献[17]利用了图像小波分解后系数的树型结构[15], 把小波系数和它代表的空间域联系在一起, 同时结合视觉特性, 将小波系数按其特征 (频率、背景亮度、纹理、边缘) 进行分类后计算出JND, 并根据JND来确定嵌入水印信息的强度。
4 灰度数字图像水印的性能评价
对于水印图像的客观评价, 目前应用最广泛的客观评价准则则是峰值信噪比PSNR[18] (peak signal to noise ratio) 。但是文献[19]就直接指出了峰值信噪比不宜用来评价信息隐藏技术, 因为PSNR在评价信息隐藏不可感知性指标存在缺陷。如图4给出了说明。
图4 (a) 为原始载体图像, 图4 (b) 为嵌入水印信息的图像 (PNSR=32.0773) , 图4 (c) 只是在载体图像上眼睛处稍做修改 (PSNR=33.5128) 显然根据PSNR值, 图4 (c) 较图4 (b) 更加接近原始图像, 但是根据人类主观视觉特性, 显然中间图像效果更好。
秦小琦等[20]提出了更为细致拟合主观视觉特性的评价指标——图像构造相似度函数[21] (Structural Similarity Function, SSF) , 并且进行了仿真实验来验证新的不可感知性评价指标更接近于主观评价标准, 更适合数字水印系统的评价标准。
对于提取水印与原始水印相似性而言, 大多采用相关系数 (NormalizedCorrelation, NC) [22]来作为其评价标准。相关系数公式为:
undefined
其中, W (i, j) 为原水印像素值, W' (i, j) 为提取的水印像素值, M、N为水印的宽度和高度。
5 研究展望
在图像中嵌入灰度级数字水印可以提高信息容量, 而且这样得到的数字水印信息也更有意义, 更加符合实际需求[23]。
综合目前的情况, 嵌入灰度级数字水印之前对水印图像进行相应的预处理是很有必要的, 比如说文献[15]对水印图像进行多分辨率分解再进行位平面分解产生二进制水印序列, 根据图像的分辨率不同进行相应地嵌入, 缺陷在于增加了水印嵌入量;文献[13]则是对水印图像进行相应的变换处理, 如DCT或DWT, 再对其系数进行相应的量化处理来减少嵌入的信息量, 但是引起了水印图像的部分失真。因此, 如何对灰度级数字水印进行有效的处理是一个值得重视的问题。
另一方面, 很多应用对数字水印的健壮性要求很高, 因此研究健壮性仍是水印的重点发展方向, 尤其是对灰度级数字水印, 如何更好地结合人类视觉系统 (HVS) 将是提高算法健壮性的一个新的研究思路。同时还应该注意自适应思想以及一些新的信号处理算法在水印算法中的应用, 如分形编码, 混沌编码, 随机共振[24]等。
摘要:数字水印技术作为数字媒体版权保护的重要手段之一, 近年来已成为国内外研究的热点。与传统的嵌入一个无意义的一维或二维伪随机序列以及可视的二值图像相比, 嵌入灰度图像水印不仅嵌入信息量大, 而且更加有意义。对灰度级数字图像水印技术的最新发展情况进行了介绍, 主要内容包括:空域及变换域的灰度数字图像水印技术, 其中变换域水印主要讨论了DCT域和DWT域两类灰度数字水印;自适应灰度级数字水印技术;灰度数字图像水印的性能评价。最后展望了该技术的进一步研究前景及可能的研究热点。
基于曲率的灰度图像拼接研究 篇3
1 曲率及其特性
1.1 曲率的定义
平面曲线上某点处的切线与X轴的夹角相对于弧长的变化率,即:
其计算公式为:
曲率反应了平面曲线在某点处的弯曲程度。
1.2 曲率的位移不变性[1]
将y=f(x)确定的曲线的原点位移到(x0,y0),令,,则,,故,假设函数二次可导,则绝对曲率为:
1.3 曲率的旋转不变性[1]
假设将坐标系沿原点反向旋转角,用极坐标系表示为:x=rcosθ,y=rsinθ;旋转θ0角后,)。
代入(1)后,可以同样得到结论,说明旋转不变性成立。
曲率反应了曲线在某点处的弯曲程度,而且曲率具有位移不变性和旋转不变性,所以图像两条切口上所对应的点处的曲率理论上是相等的。
2 图像边界的提取
如图2所示,a图和b图是一个图形被切开后的两部分,假设图像物体和背景具有反差,为了简便,将图像转换为灰度图像。首先需要提取图像的边界,边界检测与边界提取的算法很多,例如跟踪虫算法、拉普拉斯边缘检测算法[2]等等。由于这里只分析灰度图像,采用跟踪虫算法就能够很好地提取图像的边界。因为图像中灰度级最高的点(即在原始图像中梯度值最高的点)必然在边界上,所以可以把这一点作为边界跟踪过程的起始点。如果有几个点都具有最高灰度级,可以任选一个,接着搜索以边界起始点为中心的3×3邻域,找出具有最大灰度级的邻域点作为第2个边界点。如果有两个邻域点具有相同的最大灰度级,就任选一个。从这一点开始,起动了一个在给定当前和前一个边界点的条件下寻找下一个边界点的迭代过程。在以当前边界点为中心的3×3邻域内,考察前一个边界点位置相对的邻点和这个邻点两旁的两个点,如图1所示。下一个边界点就是上述3点中具有最高灰度级的那个点。如果所有3个或两个相邻边界点具有同样的最高灰度级,就选择中间的那个点。如果两个非邻接点具有同样的最高灰度级,可以任选其一。
图像轮廓边缘检测出来后,如图3所示,将图像轮廓点按顺序保存成图像文件。
3 计算图像边界上每个点的曲率[3,4,5]
得到图像的轮廓后,需要计算出图像轮廓上的各离散点的曲率,从而比较切口的相似度。常用的一种曲率计算方法为三点法,这种方法是考虑轮廓上相邻的3个点并用差分代替微分得到近似曲率值。设轮廓共有N个数据点P1……Pi……PN,Pi=(xi,yi),其曲率可近似表示为
这种方法计算简单,但对噪声过于敏感,在实际应用中,有时很难得到理想的结果。三点法对噪声过于敏感的原因是曲率计算的支撑区间太小。为此,将以上三点曲率计算方法扩充改进为十一点,可有效减小噪声的影响。设,Ri1=Pi-Pi-5,Ri2=Pi+5-Pi,则十一点法的计算公式为:
实际上,十一点法计算得到的并不是真正意义上的曲率,但在表达轮廓的几何特性方面它与曲率有相同的行为,更重要的是,由于扩大了曲率计算的支撑区间,大大提高了抗噪声能力。
4 计算相关系数
由于两条图像切口线的形状是吻合的,其上各点处的曲率也是吻合的。对于图2中a和b,可以求出相应的切口上各点的曲率,图像轮廓上各离散点的曲率可以看成信号序列,计算切口上各点曲率构成信号的相关系数,可以验证当切口上的各点完全吻合时,相关系数最大。
4.1 互相关序列
对于两个实信号序列x(n)和y(n),每个序列都是有限能量的。x(n)和y(n)的互相关序列定义为[3]:
4.2 自相关序列
在y(n)=x(n)的特殊情况下,得到x(n)的自相关[3]:
4.3 相关系数
归一化的互相关序列(相关系数)为[3]
信号y(n)移位l后,如果ρxy达到最大值,则说明y(n)移位l后和x(n)相似度最大。
5 结语
把图3中a曲线和b曲线的切口部分(ABC)各点处求得的曲率当作信号序列x(n)和y(n),经过验证,当l=0时,即a轮廓的A,B,C与b轮廓A,B,C重合时,ρ取得最大值,ρmax=0.9814。
参考文献
[1]葛云,舒华忠,罗立民.基于曲率及相关性的相似区域的线性配准.电子学报,2000,(8).
[2]徐晓刚,于金辉,马利庄.复杂物体轮廓提取.中国图像图形学报,2001,(02).
[3]John G.Proakis,Dimitris G.Manolakis,Digital Signal Pro-cessing Principles,Algorithms,and Applications.
[4]Rafael C.Gonzalez,Richard E.Woods,Digital Image Pro-cessing,Secong Edition.
[5]Williams.Donna and Shah.Mubarak,A fast algorithm for active contours and curvature estimation.
[6]Sergios Theodoridis,Konstantions Koutroumbas,Pattern Recongnition,Second Edition,Elsevier Academic Press.
灰度控制论文 篇4
随着计算机视觉的快速发展,人脸识别与跟踪成为了模式识别领域一个非常活跃的研究方向,在人机交互、视频监督等领域有着非常重要的应用。近年来在人脸跟踪领域提出了许多优秀的算法,如基于形态学相关概念的人脸识别[1]、基于奇异值分解的人脸识别[2]、利用神经网络识别人脸的方法[3],然而许多算法由于计算复杂都未能应用到对实时性要求较高的场合。Dorin Comaniciu将Mean shift算法引入了人脸跟踪领域[4]并成功的进行了人脸跟踪,极大的减少了跟踪算法的计算量。因此国内外有许多人继续完善Mean shift算法的应用[5],解决了算法中存在的一些缺点和不足[6]。然而Dorin Comaniciu提出的算法以彩色直方图作为特征来实现目标的识别与定位,对于灰度图像,由于灰度直方图所包含的图像信息单一且易受到光照变化的影响,使得Mean shift算法很难应用于灰度图像,限制了Mean shift算法的适应环境。国内外还没有提出成熟的算法来解决上述问题。同时,彩色图像同样难以克服光照变化的影响,因此提出一种结合多种特征的快速跟踪算法具有十分重要的意义。本文提出了以代表图像的梯度方向信息的方向编码[7]与灰度直方图相结合的特征模型,将灰度-方向编码二维直方图与Mean shift算法相结合,使得Mean shift算法在灰度图像中的应用更加有效。能克服光照的影响,并且在背景混乱且存在遮挡的情况下仍可稳定快速的实现人脸跟踪。
2 目标模型描述
2.1 方向编码
给定一灰度图像I,我们定义像素的梯度方向角:
其中:分别是该像素处沿着x和y方向的梯度,可以通过梯度算子(如Sobel算子)来获得。梯度方向角θ的取值范围是0~2π(radians),为了获得方向编码,需要对方向角进行量化。设方向角量化的间距为∆θ,于是方向编码可按式(2)计算:
如果方向编码量化成m个,则cij的取值为{0,1,2,…,m-1}。对于小于阈值T的像素,定义其方向编码为m,因为此区域很难计算出稳定的梯度方向角,阈值T根据经验来选择,可根据要跟踪的目标的梯度丰富程度来适当调整,本文选择T=5。如采用的量化方向为16个,方向编码的间距∆θ取π/8(radians)。
2.2 灰度-方向编码二维直方图
在人脸跟踪的过程中,光照的影响是无法避免的,当人从阳光直射区域走向阴影区域,或者从一种光源下走到另一种光源下,人脸的灰度将发生明显的变化,此时即便是彩色图像也很难克服光照的影响。因此仅靠彩色或者灰度特征的最大局限性就在与此。结合灰度-方向编码的目标描述模型可以有效的克服光照的影响。
像素的灰度值Ii,j可以表示为n个等级。方向编码可以将梯度方向角量化成m个等级。可以利用灰度-方向编码构造二维直方图p(u,v)来描述人脸目标模型。灰度-方向编码直方图就是统计各个灰度-方向编码在图像中出现的概率。图像中第u=0,1,…,m-1;v=0,1,…,n-1个灰度-方向编码出现的频率为
其中δ是delta函数。
图2显示了灰度-方向编码对光照变化的稳定克服。当图像的亮度或者对比度发生改变的时候,由灰度-方向编码构成的图像仅存在很微小的变化,因此应用灰度-方向编码在灰度图像中描述人脸的特征模型具有很高的稳定度。
(m=16,n=16,T=5)(a)、(b)、(c)是不同光照下的人脸图像;(d)、(e)、(f)是(a)、(b)、(c)对应的灰度-方向编码图像(m=16,n=16,T=5)(a),(b),(c)is the original face image in illumination change;(d),(e),(f)is the IOC of(a),(b),(c)
3 Mean shift原理
Mean-shift算法[8]是一种非参数密度估计的算法,可以通过迭代快速的收敛于概率密度函数的局部最大值,因此在目标实时跟踪领域有着很高的应用价值。对于n维欧式空间X中的有限序列S,样本数据点x∈X处的样本均值定义为[9]
其中:K为核函数,w为样本的权值函数,差值m(x)-x被称为Mean shift矢量,反复将数据点朝着Mean shift矢量方向移动直至收敛的过程被称为Mean shift算法。在迭代过程中,在x处利用核函数K计算出的Mean shift矢量指向卷积曲面J(x)=∑aG(a-x)w(a)的负梯度方向,其中,核函数K与G的相互关系应满足g′(r)=-ck(r),r=||s-x||2,c>0。g和k分别为核函数G与K的轮廓函数,c为常数。当迭代结束时核中心的位置对应某个概率密度的极值。在目标跟踪的过程中,通过J(x)来刻画目标模型和侯选区域之间的相似形,从而使跟踪问题转化为Mean shift的模式匹配问题。
4 跟踪算法
4.1 模板模型
灰度-方向编码二维直方图统计的是图像中梯度的方向编码与灰度值出现的概率,不受目标尺寸变化以及光照条件变化的影响。假设目标模板的中心为y0,核函数窗口宽度为h。模板中的各个像素位置以表示。若目标的模型被量化成m个方向编码和n个灰度等级,则归一化后的目标的第u=0,1,…,m-1;v=0,1,…,n-1个灰度-方向编码出现的概率可表示为
其中:函数b1:R2→{0,1...,m-1}是位于xi处的像素向方向编码索引的映射,b2:R2→{0,1...,n-1}是位于xi处的像素向灰度量化索引的映射,在实验中我们选取m=16、n=16。Ch是灰度-方向编码直方图的归一化常数。为了增加密度估计的鲁棒性,我们对距离中心y0较远的像素分配较小的权值,因为位于此处的像素很可能是背景;而对于距离中心y0较近的像素分配较大的权值,因为位于此处的像素更可能是要被跟踪的目标。因此对方向直方图进行加权处理,引入核函数k(x),则模板的方向直方图随即修改如下:
由条件可得到归一化常数:
4.2 候选区域模型
为了实现在当前帧中准确的匹配跟踪目标,需要得到目标侯选区域的概率模型,设为目标候选区域的各个像素的位置,在当前帧的中心位置为y,应用同样的核函数k(x)以及窗口宽度h,目标候选区域的第u=0,1…,m-1;v=0,1…,n-1个灰度-方向编码出现的概率可由下式计算:
其中Ch1可按式(7)将中心位置y0换成y后计算。
4.3 用Bhattacharyya系数度量相似度
在得到目标模板和候选区域的概率密度函数后,在当前帧中寻找目标位置的任务就转换成寻找使得密度函数最相似的位置。在这里我们用Bhattacharyya系数评价方向直方图的相似性。目标模型的概率分布与候选模型概率分布的Bhattacharyya系数为
越大,则模板与侯选区域越相似。跟踪过程就是通过Mean shift算法的快速匹配,迭代到与模板最相似的位置。
4.4 目标定位
采用Mean shift算法搜索目标位置。定义样本均值为
其中:g(x)=-k′(x)为核密度估计,wi为数据点xi的权值。
定义样本均值与实际数据点之差为Mean shift矢量Mh,g(x),即:
Mean shift的过程即通过计算Mean shift矢量Mh,g(x),并根据Mh,g(x)来反复迭代更新核函数窗口中心位置的过程。设核函数窗口的初始位置为ŷ0,ŷj+1是在ŷj位置计算的加权均值,则当前帧中目标位置ŷj+1为
5 实验步骤与结果
算法的整个跟踪过程如下:
1)在当前帧初始位置处计算侯选目标特征模型,并根据式(9)计算侯选区域模型与模板模型的相似度;
2)计算;
3)根据式(13)计算Mean shift算法迭代的侯选目标新位置;
4)计算新的侯选目标位置的目标特征模型,并计算其与模板的相似度;
5)如果,则ŷ2←(ŷ1+ŷ2)/2,直到;
6)如果||ŷ2-ŷ1||<ε停止,否则ŷ1←ŷ2转到步骤2)。ε的选择应使ŷ2与ŷ1的间距小于一个像素。
通过大量的序列图像对本算法进行了测试。图3显示了存在人脸三维旋转、遮挡以及其他人脸干扰的情况下的跟踪结果。图像的大小为768pixel×576pixel。模板大小选择48pixel×68pixel,采用的方向编码量化为16个,灰度等级为16个。在跟踪过程中通过人工选定目标后,就无需输入任何参数。第10帧与初始帧相比目标没有显著变化;第119帧目标发生较大幅度旋转;第241帧目标发生三维旋转,导致人脸发生大幅度变化;第333帧人脸位于复杂背景下,并且出现人脸三维变化,同时造成光线变化;第431帧人脸被手臂遮挡;第591帧背景中出现其他人脸的干扰。对序列图像的实验结果表明,结合灰度与方向编码特征的方法具有稳定的跟踪效果。本实验在奔腾2.8G的PC机上以VC++6.0为平台运行,计算时间为34ms/f。
图4显示了本算法对光照变化的适应能力,对图像的像素值随机乘以上下分别变化10%的光照影响因子,直方图的量化等级与图3的实验相同。结果表明,本算法对光照具有较好的适应能力。
6 结论
针对灰度图像的直方图信息单一使得Mean shift算法难以应用到灰度图像上的状况,本文提出了新的目标概率模型的建立方法。以灰度-方向编码直方图为目标的特征模型,结合了多种特征,克服了单一的灰度特征易丢失目标的缺点。以Mean shift算法为核心,减小了目标的模式匹配的搜索范围,通过迭代使得搜索过程快速收敛。实验结果证明,该算法可以增强Mean shift算法在灰度图像中应用的稳定性,可以成功的克服光照变化、混乱、遮挡、以及目标自身的缩放与旋转,并且计算简单,对于48×68大小的目标,计算时间仅为34ms,完全可以满足实时性的要求。
参考文献
[1]余杨,张旭苹.灰度人脸识别形态学相关的一般理论研究[J].光子学报,2006,35(2):299-303.YU Yang,ZHANG Xu-ping.General Theory Research on Morphological Correlation for Gray-Scale Face Recognition[J].Acta Photonica Sinica,2006,35(2):299-303.
[2]梁毅雄,龚卫国,潘英俊,等.基于奇异值分解的人脸识别方法[J].光学精密工程,2004,12(5):543-549.LIANG Yi-xiong,GONG Wei-guo,PAN Ying-jun,et al.Singular value decomposition-based approach for face recognition[J].Optics and Precision Engineering,2004,12(5):543-549.
[3]赵静,夏良正.基于连续小波变换的神经网络人脸识别研究[J].光子学报,2005,34(9):1425-1430.ZHAO Jing,XIA Liang-zheng.Face Recognition Using Neural Network Based on Continuous Wavelet Transform[J].Acta Photonica Sinica,2005,34(9):1425-1430.
[4]Comaniciu D,Ramesh V,Meer P.Kernel-based object tracking[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2003,25(5):564-577.
[5]Ning Song P,Jie Y,Zhi L.Mean shift blob tracking with kernel histogram filtering and hypothesis testing[J].Pattern Recognition Letters,2005,26(5):605-614.
[6]彭宁嵩,杨杰,刘志,等.Mean-Shift跟踪算法中核窗宽的自动选取[J].软件学报,2005,16(9):1542-1550.PENG Ning-song,YANG Jie,LIU Zhi,et al.Automatic Selection of Kernel-Bandwidth for Mean-shift Object Tracking[J].Journal of Software,2005,16(9):1542-1550.
[7]Ullah F,Kaneko S.Using orientation codes for rotation-invariant template matching[J].Pattern Recognition,2004,37(2):201-209.
[8]Fukanaga K,Hostetler L D.The estimation of the gradient of a density function,with application in pattern recognition[J].IEEE Trans.on Information Theory,1975,21(1):32-40.
灰度位图背景杂质剔除算法的优化 篇5
在痕迹识别、人脸识别、计算机视觉等研究领域中, 高效准确的剔除所采集的图像背景中的杂质是一项极其重要的研究内容, 但是至今为止, 相关的研究工作也仅仅是一个开端, 传统算法都有着严重的弊端, 算法复杂度过高, 运行非常慢, 杂质剔除的不完全, 算法本身的稳定性和可靠性不高等等。
本文针对痕迹识别中图像背景杂质剔除提出了两种新的算法, 且与传统算法的做了比较, 指出了本文算法的优势, 并利用两种算法的优点进行整合得出新的算法。本文中提出的算法对于位图背景杂质剔除有高准确的结果, 在痕迹识别系统、人脸识别系统等应用领域中大大提高了整体程序的运算速度、图像结果的正确率。
1 算法一
本算法的运行时间较长, 不符合当今社会的高效率需求, 但是目前计算机硬件价格的降低和运行速度的提高, 弥补了这个算法的缺陷, 更重要的是这种算法有高准确性的图像结果, 无论整个图像中有多少个离散点, 本算法均能剔除干净。
算法实现如下:
2 算法二
依据各个离散区域的像素值, 标识各个离散区域。本算法运相对于常见算法和算法一的运算时间都有大大提高, 但是一次能处理的区域大小有限, 只能标示255个区域, 在痕迹识别系统和人脸识别系统中可利用增加循环次数来进行处理, 得到更高准确性的图像结果。如果分割图像进行区域遍历搜索的话, 有可能把某些连续的痕迹区域分割开, 导致剔除错误!故不采用区域遍历搜索的方式来提高图片结果的正确性。
算法实现如下:
3 算法三
本文设计的算法一具有高准确性的优点, 较低效率的缺点, 需要提高硬件设备来弥补其缺点;算法二具有高效率的优点, 较低准确性的缺点。整合这两种算法, 分别利用其优点, 避其缺点, 设计出算法三, 算法三具有可以一次剔除众多离散痕迹, 效率也非常高的优点。
以下为算法三的主要代码实现与关键点解释:
定义成员
pt Array*m_p Blockix;//点坐标集合
构造和析构
关键函数
4 算法三设计前的思路
比较本文两种算法并设计将本文的两种算法结合使用以及与常见的算法进行比较, 提出了以下算法优化思路:
(1) 算法一运算效率低, 但图像结果准确性高, 可通过提高硬件设备弥补该算法;
(2) 算法二运算效率高, 但准确性降低了, 需要通过多次循环后得到的图像结果准确性也非常高。
(3) 如果查找连通区域, 然后对连通区域判断是否为杂质。本文认为这种算法仅仅是针对小颗粒杂质进行剔除, 不能针对原有形状进行剔除, 并且这种算法效率不高。
(4) 本文作者想设计一个辅助数组在算法二上扩展使用算法一。但又考虑到辅助数组的方法不为最佳选择, 因为图像在处理前, 并不知道更个图像有多少个离散区域, 这个必定大大浪费内存。
5 算法实验后的结果比较 (各个计算机的硬件配置不同, 本实验结果只作参考)
(1) 采集到的图像包含矩形、椭圆形、三角形、圆形、渐变的椭圆形和旋转过的矩形和椭圆如图1所示:
(2) 运用算法一的程序处理该图像一次后的图像如图2所示, 耗时1m左右:
(3) 运用算法二的程序处理该图像一次后的图像, 耗时不到2s:
(4) 运用算法三处理后的图像, 准确率和高效性大大提高:
6 结论
根据以上实验所得到图像的结果和比较常见算法, 结合算法一和算法二的优点所设计的算法三在运算上所用时间更少, 并且得到更为优质的图像结果。算法三在痕迹识别系统、人脸识别系统等应用领域中大大提高了整体程序的运算速度、图像结果的正确率。
摘要:本文主要针对目前痕迹识别中采集的具有背景杂质的灰度位图 (.bmp) , 通过离散区域与连通区域的数目统计, 然后不同灰度级区域进行标识, 设计出了两种更为优化的灰度位图 (.bmp) 背景杂质剔出的算法, 并提出了两种算法整合使用的设计思路, 算法实现了更高效高准确性的图像结果 , 在痕迹识别系统、人脸识别系统等应用领域中大大提高了整体程序的运算速度、更高效更准确的剔除图像背景杂质, 得到最优化的图像结果。
关键词:识别,背景杂质剔除,灰度位图,算法
参考文献
[1]陈炳发, 钱志峰, 廖文和.简单多边形凸凹性自识别算法.计算机辅助设计与图形学学报.2002.
[2]程治国, 刘允才.一种通用的去除文字图像中干扰线的算法.上海交通大学学报.2005.
[3]李海军, 宁玉富, 郭长友.规则几何图形的识别分析与算法实现.常熟理工学院学报 (自然科学版) .2007.
[4]陈刚, 戚飞虎.基于分形和遗传算法的人脸识别方法.红外与毫米波学报.2000.
基于灰度图像的阈值分割改进方法 篇6
图像分割就是将图像按照人们的意愿分成许多个区域,使这些区域具有不重叠的特性或者该区域具有实际意义或是几个区域的图像特征相差不大。图像分割使得人们分离出目标区域,同时人们可以对图像的特征进行提取或者是对目标的一些参数进行一些简单的测量,为人们进行更深入的图像研究提供了基础。图像分割是图像处理的一个重要步骤,在人们进行图像处理研究的初期就已经受到人们的高度重视。
经过几十年的发展,到目前为止,人们已经提出了很多种分割方法。尽管图像分割的方法和种类有很多,却没有唯一的标准的分割方法。有些分割运算可直接应用于任何图像,而另一些只能适用于特殊类别的图像。许多不同种类的图像或景物都可作为待分割的图像数据,不同类型的图像,已经有相对应的分割方法对其分割,同时,某些分割方法也只是适合于某些特殊类型的图像分割。分割结果的好坏需要根据具体的场合及要求衡量。图像分割是从图像处理到图像分析的关键步骤,可以说,图像分割结果的好坏直接影响对图像的理解。
图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。
图像分割的主要方法有基于区域的分割方法、基于边缘的分割方法、基于聚类分析的图像分割方法、基于小波变换的分割方法、基于神经网络的分割方法、基于模糊集理论的分割方法、基于灰度图像的阈值分割方法。本文主要运用的是基于灰度图像的阈值分割方法,其它方法不再赘述。
2 基于灰度图像的阈值分割方法
阈值处理是一种区域分割技术,将灰度根据主观愿望分成两个或多个等间隔或不等间隔灰度区间,它主要是利用图像中要提取的目标物体和背景在灰度上的差异,选择一个合适的阈值,通过判断图像中的每一个像素点的特征属性是否满足阈值的要求来确定图像中该像素点属于目标区还是应该属于背景区域,从而产生二值图像。(图1设计流程图)
3 实验步骤
3.1 双峰法图像分割
选取双峰间的谷底处的灰度值T作为阈值,即可将物体和背景很好地分割开。利用双峰法分割图像,需要知道图像直方图的分布情况,首先读入一幅数字图像并查看其直方图,执行如下程序代码:
3.2 迭代法
迭代的方法产生阈值,可以通过程序自动计算出比较合适的分割阈值。程序代码如下:
3.3 最大类间方差法图像分割
最大类间方差法基本思想是通过图像的灰度直方图来寻找一个阈值, 使得这个阈值将图像分为目标和背景两部分, 同时使得这两部分的类间方差最大。程序代码如下:
4 基于图像增强的分割改进算法
梯度图像能够更好地适应图像边缘的变化快慢,边缘检测也常用各种微分算子来提取图像的边界。图像边界信息更多地是高频信号,这与梯度有更大的关系,因此对保存有完整图像边界信息的图像进行梯度锐化后分割更加合理。
4.1 双峰法分割
实验中我们发现,由于增强后图像的灰度直方图没有呈现明显的双峰状,由前面介绍的双峰法的原理我们知道,增强后的图像不能使用双峰法来分割。
4.2 迭代法分割
说明:执行的程序和上面迭代法使用的程序的几乎相同,只是由于增强后得到的图像需要重新储存,只是将I=imread ('E:lunwenb1jpg') ,改为I=imread ('E:lunwenb22.bmp') 即可。使用迭代法分割得到的图像如图7所示。
4.3 最大类间方差法分割
执行的程序也是和上面最大类间方差法分割的几乎相同,也只是将I=imread ('E:lunwenb1.jpg') ,改为I=imread ('E:lunwenb22.bmp'即可。这样得到的图形如图8所示。
4.4 重复实验步骤
当k=3时,我们重复上面的实验步骤得到的图像如下:
(1)迭代法得到的分割图像如图9;
(2)最大类间方差法得到的分割图像如图10。
前面我们已经证实,由于增强后图像的灰度直方图没有呈现双峰状,所以对于双峰法在这里我们就不予考虑。
5 结论
双峰法、迭代法和最大类间方差法是基于阈值的图像分割方法,由分割得到的结果我们发现这三种方法的优点在于实现简单,但是这只是针对少数不同类别物体彼此灰度相差很大时,才能进行有效的分割。当图像中不存在明显灰度差异或灰度值范围有较大重叠,难以得到准确的分割结果。其次,仅考虑灰度信息而不考虑图像空间信息,因此对噪声的灰度不均匀性敏感。最后,分割后得到的图像不能很好的显示图像的细节。三种分割方法得到的图像都不能很好的显示物体的表面细节,并且未能将图像边界完整分割开来。所以,在实际的运用中,总是将其与其它方法结合起来使用。
使用梯度增强算法后,随着k值的增加,图像的锐化程度的提高,分割后物体表面上的图像等细节都被完整的分割出来。对比直接分割处理的效果,增强后在处理的图像效果有了明显改善。
灰度控制论文 篇7
关键词:纹理分析,纹理分类,纹理图像,Gabor滤波
本文采用基于灰度—梯度共生矩阵的纹理统计方法。该方法将灰度直方图和边缘梯度直方图结合起来, 为了获得旋转不变测量, 采用高斯拉普拉斯算子计算梯度信息, 容易验证其旋转不变性。通过获得旋转不变特性, 梯度信息就得到了具有旋转不变特性的灰度—梯度共生矩阵。从此, 在灰度—梯度共生矩阵中提取适当的纹理特征,
为了同时考虑空间域和频域的统计信息, 将环形Gabor滤波与灰度—梯度共生矩阵方法结合, 提出了基于灰度—梯度共生/环形Gabor滤波联合的旋转不变纹理分类方法。提出了Gabor滤波的参数选择方案, 同时从灰度—梯度共生矩阵中提取适当的特征, 采用马氏距离分类器来分类纹理。实验结果表明该方法的有效性。
1 灰度—梯度共生矩阵 (GGC)
1.1 灰度—梯度共生矩阵定义
一幅图像{f (i, j) ;i, j=0, 1, 2, 3, …, N-1}, 灰度级数为N, 为了减少计算量, 可将灰度正规化处理
式中:Lf为规定的灰度级数目, fmax为图像的灰度级数目。
同样, 对于梯度算子, 可将其梯度图像{g (i, j) ;i, j=0, 1, 2, 3, …, N-1}进行正规化处理, 使其梯度更加离散公式为
式中:Lg为规定的灰度级数目;gmax为梯度图像的灰度级数目。为了得到旋转不变梯度图像, 采用高斯拉普拉斯算子作为梯度算子。
由此得到了2个正规化矩阵:
1) 灰度矩阵:
2) 梯度矩阵:
则灰度—梯度共生矩阵定义如下:
H (x, y) 定义为集合{ (i, j) |F (i, j) =x且G (i, j) =y;i, j=0, 1, 2, 3, …, N-1}中的元素数目, 即灰度为x, 梯度为y的总像素点数。如:Lf=Lg=16, H (7, 10) =14, 表示一幅图像的灰度取值范围和其梯度取值范围均为16, 在灰度-梯度共生矩阵中, 灰度为7 (x=7) , 梯度为10 (y=10) 的总像素点数为14。
1.2 灰度—梯度共生矩阵归一化
变换公式为
显然,
式中:x=0, 1, 2, …, Lf-1;y=0, 1, 2, …, Lg-1。
1.3 基于灰度—梯度共生矩阵的特征统计量
从灰度—梯度共生矩阵中可以抽取以下重要特征统计量:
1) 小梯度优势
2) 灰度分布不均匀性
3) 梯度分布不均匀性
4) 能量
5) 灰度平均
6) 梯度平均
7) 灰度均方差
8) 梯度均方差
9) 灰度熵
10) 梯度熵
11) 混合熵
12) 惯性
13) 逆差矩
2 环形Gabor滤波 (CGF)
传统的Gabor函数是由方向复数正弦信号控制的高斯函数, 其数学表达式为
式中:
式中:F为环形Gabor滤波的中心频率。图1具体说明了环形Gabor滤波的特性。
2.1环形Gabor滤波旋转不变纹理分析
在基于Gabor滤波的纹理分析中, 通过将纹理表面I (x, y) 投影到复杂Gabor滤波上得到每个像素的纹理属性。在分析中用到的环形Gabor小波为
考虑将原图像旋转Δθ角度之后的纹理图像I′ (x′, y′) , 其投影变为
此时,
;
则
所以, 上述表达式可以表示为
由P=P′证明了当一幅图像旋转后, 其在环形Gabor滤波器下的投影保持不变。也就是说该属性具有旋转不变性。
2.2参数选择方法
1) δ=2π与传统的Gabor滤波中的取值相同;
2) 对于一幅大小为N×N的纹理图像, 选择频率F, 公式为
对于每一个F, 可以计算出UF和σF:
其中
对得到的数据进行标准化, 这样一幅纹理图像可以表示为
3 基于信息增益的特征选择
信息增益的特征选择可以得到比较好的纹理, 降低图像维数, 从而提高分类系统性能。
定义信息熵I (s1, s2, …, sM) :
式中:S为样本集;M为S的分类数目; (s1, s2, …, sM) 为S的一个划分, 设Ci为第i类分类标号;Pi为任意样本属于Ci的概率;si为分类Ci上的样本数。
假设有V个不同的属性, A为其中的任意一个属性, 则由属性A划分整个样本集为M类不相交子集的熵E (A)
因此, 属性A的信息增益Gain (A)
在实验中, 有16类样本, 分类标号Ci∈ (1, 2, …, 16) , 每一类含有N个样本, 共有16×N个样本, 即S=160×N。
计算每一维属性的信息增益, 通过选取信息增益较大者对应的属性来完成特征的选择, 最终选择前70%的属性对应的特征, 得到的分类效果最好。此特征选择过程如下
Step 1 每一类含有N个样本, 即
Step 2 采用基于信息增益最小的数据离散化方法, 将连续的属性值离散化, 得到M个整数值;
Step 3 数据离散化之后, 样本数据集被重新划分, 量化值为k (k=1, 2, …, M) , 分类标号为i, i=1, 2, …, 16的样本数为sk, i, 得到
Step 4 计算I (sk, 1+sk, 2+…+sk, 16) , (k=1, 2, …, M) ;
Step 5 计算属性A的信息熵:
Step 6 计算属性A的信息熵
基于以上步骤, 选择较大的信息增益值对应的特征。
4 实验结果
从Brodatz图片集中选取16类纹理图像, 如图2所示。每一类纹理包含8个大小为512×512的原始图像, 其中1个用于训练分类器, 剩下的7个用于测试分类器。将这些原始图像旋转, 从旋转后的图像中截取大小为360×360的子图像。采用10个旋转角 (0°、20°、30°、45°、60°、70°、90°、120°、135°、150°) , 在旋转过程中, 采用双线性插值算法, 纹理在旋转后没有产生任何局部扭曲。这样得到了简单易控的旋转不变纹理分析图像数据。最初的实验是从训练图像中抽取几个64×64的子图像来训练纹理分类器, 这些比较小的样本增加了纹理分类问题的难度。训练集包含576个样本图像, 这些图像具有同一个旋转角度, 而用其他角度的纹理图像进行分类测试。
在实验过程中, 特征选择过程使用同一训练集进行数据离散化。测试集包含5 184个样本, 采用最小距离分类器作为纹理分类器, 用马氏距离来计算测试样本与训练样本模型的接近程度。得到的实验结果见表1。
5 结束语
将灰度—梯度共生矩阵与环形Gabor滤波方法结合来解决旋转不变纹理分类问题。文中示出了灰度-梯度共生矩阵与环形Gabor滤波的旋转不变特性, 同时采用了基于信息增益的特征选择方法来进一步选择特征以提高系统的性能, 实验结果表明了其有效性。未来的工作是彩色图像检索问题, 本文提出的方法加上颜色统计信息或许可以很好地解决此问题。
参考文献
[1]Xia De-shen, Jin Sheng, Wang Jian. Fractal Dimension and GGCM Meteorology Cloud Pictures Recognition. Journal OF NANJING UNIVERSITY OF Science And Technology, 1999, 23 (4) .
[2]U.M.Fayyad, K.B.Irani.“On the Handling of Continuous-valued Attributesin Decision Tree Generation”.Machine Learn-ing, 1992, 8:87-102.
[3]P.Brodatz, Textures:A Photographic albumfor artist and de-signers.Dover, 1996.
[4]Dong-Gyu Sim, Hae-Kwang Kim, Dae-Il Oh. Translation, Scale, and Rotation Invariant Texture Descriptor for Texture-Based Image Retrieval. ICIP, 2000:742-745.