轮廓特征

2024-05-11

轮廓特征(精选6篇)

轮廓特征 篇1

1 引言

数字图像处理泛指从图像获取到图像信息输出的全过程, 包括对已有图像信息的处理, 它具有精度高、成本低、速度快及灵活性好等特点, 使得其在诸多领域得到了广泛的应用。作为数字图像处理的常用技术, 图像增强、图像分割、边缘检测等已经发展的较为成熟【1】, 并经常被结合起来用以处理图像。

轮廓特征提取作为数字图像处理中的一个重要方面, 更是许多有关图像研究的重要中间环节, 目前已有很多相关工作完成【2】。提取出图像中物体的大致轮廓等特征可以用来模式识别【3】、物体判断、数学特征值 (如分形维数【4】) 等的计算。

本文对图像轮廓提取过程及应用到的关键技术进行了研究, 给出照片中河流轮廓提取实例。

2 图像轮廓特征提取的流程分析

对于给定的原始图像, 为了提取出轮廓特征, 需要消除图像中的无用噪声, 同时考虑增强消噪后可能变模糊的图像中对提取有利的特定信息, 在此基础上把图像分割成有意义的区域, 再使用特定算子勾勒出图像的轮廓。下图为图像轮廓特征提取的流程示意:

本文对已有的数字图像, 采用目前常用的空间域和频率域的平滑算法 (如理想低通滤波器) 滤波去噪增强, 然后选择适当的阈值分割法 (如OTSU算法) 分割得到二值化黑白图, 再采用适当的边缘检测算子 (如log算子) 提取图像的轮廓特征, 并对所用技术进行描述。

2.1 图像增强

图像经过增强处理后效果会得到改善, 它的某些特定信息将得到增强。在增强过程中, 不分析图像降质的原因, 处理后的图像不一定逼近原始图像, 即可以是一个失真的过程, 且不能增加原图像得信息。其目的是要增强视觉效果, 针对给定图像的应用场合, 有目的地强调图像的整体或局部特性, 扩大图像中不同物体特征之间的差别, 强调某些感兴趣的特征, 抑制不感兴趣的特征, 满足某些特殊分析的需要。将原来不清晰的图像变得清晰或改善图像质量、丰富信息量, 加强图像判读和识别效果。

根据图像增强处理过程所在的空间不同, 可分成基于频率域的方法和基于空间域的方法。前者是一种间接增强的算法, 把图像看成一种二维信号, 经傅里叶变换将图像从空间域变换到频率域, 然后在频率域对频谱进行操作和处理, 再将其反变换到空间域, 从而得到增强后的图像;后者直接在图像所在的二维空间进行处理, 即直接对每一个像素的灰度值进行处理。基于空域的算法分为点运算算法和邻域去噪算法:点运算算法即灰度级校正、灰度变换和直方图修正等, 目的或使图像成像均匀, 或扩大图像动态范围, 扩展对比度;邻域增强算法分为图像平滑和锐化两种:平滑一般用于消除图像噪声, 但是也容易引起边缘的模糊, 常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓, 便于目标识别, 常用算法有梯度法、算子、高通滤波、掩模匹配法、统计差值法等。

2.1.1 理想低通滤波增强

一般图像的能量主要集中在其低频部分, 噪声和系统中所要提取的边缘信息主要集中在其高频部分, 图像增强的目的是去掉高频干扰又同时保持边缘信息。可以采用低通滤波的方法去除高频干扰来平滑图像。低通滤波是频域滤波增强的一种, 是在变换域空间对图像进行滤波。如上所述, 一般通过某种变换 (如傅里叶变换、小波变换) 将图像从空间域变换到频率域, 然后在频率域对频谱进行操作处理, 再将其反变换到空间域, 从而得到增强后的图像。图像从空间域变换到频率域后, 其低频分量对应了图像中灰度值变化比较缓慢的区域。

以傅里叶变换为例, 频域滤波的主要步骤为:

(1) 对原始图像f (x, y) 进行傅里叶变换得到F (u, v) :假设图想以undefined存储, 则离散傅里叶变换undefined可由如下公式得到

undefinedundefined

(2) 将F (u, v) 与传递函数H (u, v) 进行卷积运算得到G (u, v) :

undefined

(3) 将G (u, v) 进行傅里叶逆变换得到增强图像g (x, y) :

undefinedundefined

故频域滤波的核心在于如何确定传递函数H (u, v) , 一个二维的理想低通滤波器的传递函数如下:

undefined

式中, D0是一个非负整数;D是从点 (u, v) 到频率平面原点的距离, 即:

undefined

理想低通滤波器的含义是指小于D0的频率, 即以D0为半径的圆内所有频率分量可以完全无损地通过, 而圆外的频率, 即大于D0的频率分量则完全被除掉。

2.1.2 Roberts算子锐化

图像滤波平滑往往使图像中的边界、轮廓变的模糊, 为了减少这类不利效果的影响, 这就需要利用图像鋭化技术, 使滤波增强后图像的边缘、轮廓线以及图像的细节变的清晰。经过平滑的图像变得模糊的根本原因是因为图像受到了平均或积分运算, 因此可以对其进行逆运算 (如微分运算) 就可以使图像变的清晰。

Roberts算子又称为梯度交叉算子, 是一种利用局部差分算子寻找边缘的算子。梯度幅值计算近似方法如图2:

(i, j) 为当前像素的位置, f (i, j) 为该点的灰度值, 由如下锐化公式得到表示增强后的图像 (i, j) 位置处灰度值g (i, j) :

undefined

2.2 图像分割与OTSU法

图像分割的目的是把图像空间分成一些有意义的区域, 可以逐个像素为基础去研究图像分割, 也可以利用在规定邻域中的某些图像信息去分割。图像分割比较正式的定义如下:

令集合R代表整个图像区域, 对R的图像分割可以看作是将R分成N个满足以下条件的非空子集R1, R2, …, RN:

(1) undefined;

(2) 对i=1, 2, …, N, P (Ri) =TRUE;

(3) 对∀i, j, i≠j, 有Ri∩Rj=φ;

(4) 对∀i, j, i≠j, P (Ri∪Rj) =FALSE;

(5) 对i=1, 2, …, N, Ri是连通的区域。

对于此定义需要补充的是, 实际的图像处理和分析都是面向某种特定应用的, 所以条件中的各种关系也是需要和实际要求结合而设定的。图像分隔的依据可以建立在图像像素间的“相似性”和“非连续性”两个基本概念之上。像素的“相似性”是指图像中在某个区域内像素具有某种相似的特性, 如像素灰度相等或相近, 像素排列所形成的纹理相同或相近。“不连续性”是指像素灰度的不连续, 形成调变的阶跃, 或是指像素排列形成的纹理结构的突变。故相似性分割就是将具有同一灰度级或相同组织结构的像素聚集在一起, 形成图像的不同区域;非连续性分割就是首先检测局部不连续性, 然后将它们连接在一起形成边界, 这些边界将图像分成不同的区域。图像分割方法又可以分为结构分割方法和非结构分割方法两大类。结构分割方法是根据图像的局部区域像素的特征来实现图像分割, 如阈值分割、区域生长、边缘检测、纹理分析等, 这些方法是假定事先知道这些区域的特性, 或者在处理过程中能够求得这些特性, 从而能够寻找各种形态或研究各像素群。非结构分割法包括统计模式识别、神经网格方法或其他利用景物的先验知识实现的方法等。

图像的黑白二值图像转化是指通过设定某个临界阈值, 大于该临界值时为白, 存储时用1表示, 小于该临界值时为黑, 存储时用0表示, 这样就可以将任意的彩色或者灰度图像转换成黑白二值图像。根据峰值个数以及处理过程的不同, 可以用不同的方法完成灰度图像转换为黑白二值图像的过程, 对于灰度峰值的多少, 可以设定多个不同的临界值。

常用的黑白二值化处理方法有:

1) 单阈值法。对于具有单灰度峰值的图像, 将灰度最大峰值作为临界值F, 并将图像点阵点上的颜色值小于等于某临界值F的像素undefined转换为黑色;大于F的像素值转换为白色。

2) 双阈值法。对于具有两个灰度峰值的图像, 将这两个最大峰值设定为两个不同的临界值F1和F2。当某个像素undefined的像素值介于F1和F2之间时设为白色, 其他情况设为黑色。

大津法 (又称OTSU法或最大类间方差法) 于1979年提出, 它是在灰度直方图基础上用最小二乘法原理推导出来的, 具有统计意义上的最佳分割阈值。Otsu法算法简单, 对光线等具有很强的自适应能力, 在灰度图像目标和背景的自动分割上具有广泛的应用。具体算法如下:

对图像A, 记t为前景与背景的分割阈值, 前景点数占图像比例为w0, 平均灰度为u0;背景点数占图像比例为w1, 平均灰度为u1。

图像的总平均灰度为:

u=w0×u0+w1×u1

从最小灰度值到最大灰度值遍历t, 当t使得值

g=w0× (u0-u) 2+w1× (u1-u) 2

最大时t即为分割的最佳阈值。

对大津法可作如下理解:g实际上就是类间方差值, 阈值t分割出的前景和背景两部分构成了整幅图像, 而前景取值u0, 概率为 w0, 背景取值u1, 概率为w1, 总均值为u, 根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量, 方差值越大, 说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小, 因此使类间方差最大的分割意味着错分概率最小。

2.3 边缘检测

图像的边缘是图像的最基本特征, 集中了图像大部分的信息, 图像边缘的确定与提取对于整个图像场景的识别与理解是非常重要的。物体的边缘是以图像局部特征不连续的形式出现的, 也就是指图像局部亮度变化最显著的部分, 例如灰度值的突变、颜色的突变、纹理结构的突变等, 同时物体的边缘也是不同区域的分界处。图像边缘有方向和幅度两个特征, 通常沿边缘的走向灰度变化平缓, 垂直于边缘走向的像素灰度变化剧烈。根据灰度变化的特点, 常见的边缘可分维阶跃型、房顶型和凸缘型。

当使用一阶倒数的边缘检测算子时, 如果所求的一阶导数高于某一阈值, 则确定该点为边缘点, 这样做会导致检测的边缘点太多。一种更好的方法就是求梯度局部最大值对应的点, 并认定它们是边缘点。通过去除一阶导数中的非局部最大值, 可以检测出更精确的边缘。一阶导数的局部最大值对应着二阶导数的零交叉点, 通过找图像强度的二阶导数的零交叉点就能确定精确的边缘点。通常将Gaussian滤波器和Laplacian边缘检测结合在一起, 形成LOG算法。即先用高斯函数对图像进行平滑, 然后再用拉普拉斯算子进行运算, 得到Laplacian-Gauss算法, 它使用一个墨西哥草帽函数形式:

undefined

这种方法在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点, 这一点可以用拉普拉斯算子将边缘点转换成零交叉点, 然后通过零交叉点的检测来实现边缘检测。所谓的零交叉点就是:如果一个像素出的值小于一θ0, 而此像素连通的各个像素都是大于θ0 (θ0为一个正数) , 那么这个像素就是零交叉点。

与其他边缘检测算子一样, LOG算子也是先对边缘做出假设, 然后再这个假设下寻找边缘像素。但Log算子对边缘的假设条件最少, 因此它的应用范围更广。另外, 其他边缘检测算子检测得到的边缘时不连续的, 不规则的, 还需要连接这些边缘, 而LOG算子的结果没有这个缺点, 对于Log 算子边缘检测的结果可以通过高斯函数标准偏差σ来进行调整。

3 基于MATLAB环境的实验分析

在MATLAB环境下定义函数并编写代码, 对一副照片上的河流轮廓进行提取, 过程如图:

图二是原始彩色照片灰度转化后的图像, 经过低通滤波去噪后得到图三所示图像, 去除了图像的高频噪声, 但略显模糊。对其进行Robert算子锐化调整后可以得到图四所示的增强图像, 图像特征明显变得清晰。大津法 (OTSU) 阈值分割后得到的图五可以看出特征区域和非关注区域的明显对比, 然后由log算子边缘检测提取河流的轮廓, 由图二和图六比较可见提取的效果较为理想。

4 结束语

本文首先介绍了数字图像轮廓特征提取的一般过程, 给出了流程图, 然后详细讨论了数字图像处理的中间环节技术, 并给出了这些技术的部分具体算法, 最后在MATLAB环境下编写代码, 从一副照片中提取出了河流的轮廓, 实验分析结果较为理想。数字图像处理技术应用于图像轮廓的提取, 能够简化一些实验研究工作, 缩短时间提高效率, 如提取的河流可以用于识别和地图绘制, 提取岩石断面轮廓可以用于分形维数计算等等。为了满足不同的需求, 研究者可以对提取过程中用到的技术加以改进或提出新的算法, 如采用不同的边缘检测模型和技术[5], 以达到自己研究所需要的特征和精度。

参考文献

[1]龚声蓉, 刘纯平, 王强等.数字图像处理与分析.北京:清华大学出版社, 2006, 1-84, 168-234

[2]邹柏贤, 林京壤.图像轮廓提取方法研究.北京:计算机工程与应用, 2008, 161-165

[3]魏冬冬, 聂铁铸等.人脸特征提取与识别技术研究.计算机与现代化, 2007, 3:69-76

[4]彭瑞东, 谢和平, 鞠杨.二位数字图像分形维数的计算方法.中国矿业大学学报.2004, 33 (1) :19-24

[5]辛动军, 周献中.基于snake模型的地图中河流提取算法.计算机工程.2006, 32 (20) :16-17

基于轮廓特征的图像配准 篇2

图像配准就是将同一场景在不同时刻、位置和波段拍摄的一组图像相互准确重叠的过程[1]。图像配准应用十分广泛,例如航空航天技术、地理信息系统、图像镶嵌、图像融合、目标识别、医学图像分析、机器人视觉、虚拟现实等领域。

根据所关注内容的不同,图像配准算法可分为两类[2]:基于区域的和基于特征的。基于区域的配准算法一般不需要对图像进行复杂的预处理,而是利用两幅图像的某种统计信息作为相似性判别标准,采用适当的搜索算法得到令相似性判别标准最大化的图像转换形式,以达到图像配准的目的。主要特点是实现比较简单,但应用范围较窄,不能直接用于校正图像的非线性形变,而且在最优变换的搜索过程中往往需要巨大的运算量。基于特征的图像配准算法借助图像中具有的显著特征结构,将其作为标志位,分别在参考图像和待匹配图像中提取出它们,然后再找到两幅图像的标志位之间的匹配关系,继而完成空间对位。基于特征的配准方法由于提取了图像的显著特征,大大压缩了图像信息的数据量,同时较好地保持了图像的位移、旋转、比例方面的特征,配准时计算量小,速度较快,应用也更为广泛。图像的显著特征有很多,如点特征(包括角点、高曲率点等)、直线段、边缘、轮廓、闭合区域特征等,本文则主要讨论基于轮廓特征的图像配准算法。

1 基于轮廓特征的配准算法发展现状

最经典的基于轮廓特征的图像配准算法是由Li提出[3],首先从输入图像中提取闭合轮廓和开轮廓,然后进行轮廓匹配,最后将闭合轮廓的质心和开轮廓的角点作为控制点来估计配准参数。这种配准方法存在角点检测和匹配的问题,算法较复杂。Dai[4]则提出了另一种基于轮廓的图像配准方法,该方法只是利用输入图像中的闭合轮廓进行配准,首先提取输入图像中的闭合轮廓,然后对闭合轮廓进行区域填充,利用区域不变矩和链码表示的方法对这些闭合轮廓进行匹配,最后根据匹配后的闭合轮廓的质心来估计配准参数。很显然,该方法在配准过程中只利用输入图像中的闭合轮廓提供的信息,如从输入图像中不能检测到匹配的闭合轮廓对,则这种方法就不能适用,此外,当闭合轮廓所形成的区域较大时,进行区域填充以及求取区域不变矩的计算量较大。陈桂友[5]则结合前两种算法各自的特点提出了一种改进算法,先提取输入图像中的所有开轮廓和闭合轮廓,然后分别对开轮廓和闭合轮廓进行匹配,最后在进行配准参数估计时,先将开轮廓轮换成闭合轮廓,然后通过所有闭合轮廓的质心和长轴来估计配准参数。这种算法相比Dai所提算法而言,更多地利用了开轮廓的所提供的信息,使得算法应用范围更广,但开轮廓质心和长轴的计算精度对配准参数的估计影响很大,而且其针对闭合轮廓的匹配方式与Dai的方式相同,因而同样存在计算量较大的问题。

前述几种基于轮廓的配准方法均是在完成特征配对后再一次性估计出所有的配准参数,而先估计出旋转角度然后再进行其他参数估计的配准方法亦被提出[6,7]。这种方法首先需要提取闭合轮廓,并求出其质心,然后以质心为中心,计算质心与轮廓点连线的距离,从而可得到一组距离值序列,其数目与轮廓点数相同,若配准的两幅图像的轮廓点数相同,则可通过对这两组距离值序列进行圆周相关计算来获取配准参数。显然,先估计出旋转角度参数的方式可以大大简化其他参数的估计复杂度,可以减少计算量从而实现快速配准。然而,这种方法在轮廓本身存在缺陷时,通过轮廓所计算出的质心便存在着偏差,显然这种偏差会引起采样误差并最终导致所估计的旋转角度参数出现偏差。此外,这种方法通常只适用于图像中存在单个闭合轮廓的情况,如单个零件、香烟盒等,当存在多个闭合的轮廓或开轮廓时均无法应用,应用面比较窄。

针对现有算法所存在的各种不足,本文提出了一种新的基于轮廓特征的配准算法,具有原理简单、实现方便、计算量小且精度高以及适用范围广等特点。

2 基于轮廓点法向角特征的配准算法

本文也是采取先估计出旋转角度参数然后再估计其他参数的方式,但与已有方式不同的,亦即本文的创新之处,本文是利用轮廓点的法向角特征来估计两幅图像之间的旋转角度。在本节,首先将重点叙述利用轮廓点法向角进行旋转角度估计的原理,然后通过具体的实验数据测试其估计精度以及特性,在本节最后将简要论述在旋转角度估计出来后其他参数的估计方法。

2.1 轮廓点法向角估计旋转角度的原理

利用轮廓点法向角来估计旋转角度参数可分为三个步骤:轮廓点法向角的计算、法向角直方图统计和直方图圆周相关。下面将详细论述这一过程。

2.1.1 轮廓点法向角的计算

显然,在计算轮廓点法向角之前,先需要提取出图像轮廓,不同类型的图像,所需要采用轮廓提取方式是不同的,由于这点不是本文讨论的主题,因而在这里假设图像轮廓已经被提取出来。当轮廓被提取出来后,最直接的便是通过轮廓点坐标来计算轮廓点法向角,计算方式如下:

其中:i表示当前轮廓点索引,N表示采样间隔,显然,这种计算方式受N值影响较大。针对法向角的计算,在本文则是采用下面所述的这种计算方式。

为了提高配准精度,通常会对提取到的轮廓进行亚像素校正处理,而在这方面,Zernike不变矩方法[8,9]是最常用的,本文即是采用这种方法来对轮廓进行亚像素校正,同时,还直接将Zernike矩亚像素边缘校正模型(如图1)中的偏转角φ作为每一个轮廓点的法向角。偏转角φ的计算公式为

其中:A11为一阶Zernike矩,Im[]、Re[]分别表示取复数的虚部和实部。

采用这种方式来计算法向角有两方面的优点,一是充分利用了已有计算结果,可以减少计算量;另一方面是这种方式所计算出来的角度更加准确和真实。

图2(a)为2008年北京奥运的Logo图,对其进行轮廓提取并计算轮廓点法向角结果如图2(b)所示,图中绿色线段表示每个轮廓点的法向角方向。

2.1.2 法向角直方图统计

当每个轮廓点的法向角均求出来以后,便需要对其进行离散化处理:法向角取值范围为[0°,360°),当采用分辨率为0.1°来对其进行量化时,可知一共有3 600个量化等级,其中,分辨率的大小在很大程度上决定了旋转角度参数的估计误差。量化处理完成后,即可进行直方图统计,将得到一组长度为3 600的序列。

2.1.3 直方图圆周相关

设两幅图像轮廓点的法向角直方图分别保存在h1(n)和h2(n)两个序列中(n=1,2,…,N),通过循环移位进行相关性计算(即为圆周相关),计算公式如下

找到rxy(n)序列的最大峰值点,将其所对应位置经过简单转换后即为旋转角度的估计结果。

2.2 旋转角度估计精度测试

以下为轮廓点法向角来估计旋转角度的方法在轮廓出现缺失以及尺度变换的情况下的估计精度测试示例,测试所用的参考图像均为图2(a)北京奥运Logo。

图3(a)图像为图2(a)沿顺时针方向旋转5°,同时增加了一些缺陷,从这幅图像中一共提取到3 324个轮廓点,每个轮廓点的法向角如图3(b)所示,法向角直方图统计分布则如图3(c)右上角曲线图所示。与图3(c)左上角曲线所示的参考图像轮廓点法向角直方图进行圆周相关后的结果如图3(c)下方曲线图所示,峰值出现在Angle=49,Count=5 685处,即估计出的旋转角度为4.9°,误差为0.1°。

图4(a)图像为图2(a)顺时针旋转15°、部分轮廓缺失以及缩小为原图的0.8倍所得到的,从这幅图像中一共提取到2 896个轮廓点,每个轮廓点的法向角如图4(b)所示,法向角直方图统计分布则如图4(c)右上角曲线图所示。与参考图像轮廓点法向角直方图进行圆周相关后的结果如图4(c)下方曲线图所示,峰值出现在Angle=147,Count=4 400处,即估计出的旋转角度为14.7°,误差为0.3°。

从实验数据可以看出,与前述利用质心-轮廓点距离来估计旋转角度的方式相比,这种基于轮廓点法向角直方图圆周相关来估计旋转角度的方式具有非常多的优点,首先,由于每个点的法向方向可近似看作是相互独立的,因此误差不会出现传递,因而在轮廓出现缺失时依旧可以保持较高的估计精度,即对噪声以及轮廓的缺失都具有良好的鲁棒性;其次,由于角度具有尺度不变性,而法向角本身就是一种角度,因而这种估计旋转角度的方式同样具有尺度不变性;再者,可以广泛应用于多个轮廓的情况,且同时适用于闭合轮廓、开轮廓,计算也十分简洁。

2.3 其他参数的估计

在本文只考虑相似变换,即图像之间存在尺度、旋转、平移变换的情况下,一共有四个参数:s、θ和(tx,ty)。假设待配准图像中的两个特征点A和B,在参考图像中的对应点分别为C和D,由于旋转角度θ已经初步估计出来了,如果(A,C)和(B,D)均为正确配对时,则与所成的夹角将正好与事先估计出的旋转角θ一致。当满足这一条件时,便按如下式计算缩放尺度:

式中:σ表示图像的缩放尺度,d表示两点之间的距离。

对所求出的一系列σ值进行统计,便可初步得到缩放尺度s。然后再利用θ和s进行特征点匹配,此时便可以得到准确配对的特征点,最后,根据准确配对的特征点利用最小二乘法来进行各参数的精确估计。

3 算法在PCB缺陷检测中的应用

目前,高端PCB裸板线路板缺陷检测通常采用高性能CCD线阵扫描相机获取高分辨率以及高对比度的图像,通过提取实际PCB图像与参考图像的轮廓然后采用轮廓对比的方式进行在线缺陷检测,其检测流程示意如图5所示。

由于定位误差,实际获取的PCB图像与参考图像通常会存在一定角度的旋转和平移(即刚性变换,为相似变换的特例),如图6(a)和(c)所示,因而在进行实际PCB图像与参考图像轮廓对比分析之前,需要先求出两幅图像之前所存在的旋转角度和平移,即进行轮廓配准,本文算法则可实现这一目的。

图6(a)为一幅PCB参考图像(部分),分辨率为1 000×1 000,(b)为其轮廓,(c)为(a)顺时针旋转5°,再人为增加一些短路和断路缺陷后所得到的结果,将其作为待配准的缺陷图像,(d)为缺陷PCB图像的轮廓,(e)为采用本文算法进行配准后的缺陷轮廓。在本次实验中,先通过轮廓点法向角特征估算出旋转角度,然后采用闭合轮廓的形心作为特征点进行其他参数的估计,最终所估计出的刚性变换参数值为:旋转角度为5.005°,平移值为-41.690,45.977,旋转角度误差为0.005°,误差是比较小的,可以满足实际精度需求。

4 结论

本文采用轮廓点法向角直方图圆周相关的方式实现了配准算法中旋转角度参数快速精确地估计,从而大大简化了其他参数的估计复杂度,由此提出了一种新的基于轮廓特征的图像配准算法,本算法可广泛适用于各种闭合轮廓和开轮廓的情况,并已成功应用于PCB缺陷检测中实现了参考图像轮廓和待检测图像轮廓的快速精确配准。

参考文献

[1]Brown L G.A survey of image registration techniques[J].ACM Comput.Surv(S0360-0300),1992,24(4):325-376.

[2]Zitov B,Flusser J.Image registration methods:a survey[J].Image and Vision Computing(S0262-8856),2003,21(11):977-1000.

[3]Li H,Manjunath B S,Mitra S K.A contour-based approach to multisensor image registration[J].IEEE Transactions on Image Processing(S1057-7149),1995,4:320-334.

[4]Dai X,Khorram S.A feature-based image registration algorithm using improved chain-code representation combined with invariant moments[J].IEEE Transactions on Geoscience and Remote Sensing(S0196-2892),1999,37(5):2351-2362.

[5]陈桂友,徐胜男,李振华,等.刚体变换下基于轮廓的多传感器图像配准算法[J].系统工程与电子技术,2007,29(7):1169-1173.CHEN Gui-you,XU Sheng-nan,LI Zhen-hua,et al.Contour-based multisensor image registration with rigid transformation[J].Systems Engineering and Electronics,2007,29(7):1169-1173.

[6]舒小华,沈振康,龙永红.一种基于轮廓配准的包装缺陷检测方法[J].包装工程,2006,28(3):19-21.SHU Xia-hua,SHEN Zhen-kang,LONG Yong-hong.A method of detecting package defects based on image contours registration[J].Packaging Engineering,2006,28(3):19-21.

[7]郭安哲,马莉.基于模板配准的零件轮廓缺损检测[J].机电工程技术,2008,37(12):54-56.GUO An-zhe,MA Li.Detection of part-contour defect based on registration template[J].M&E Engineering Technology,2008,37(12):54-56.

[8]Ghosal S,Mehrotra R.Orthogonal moment operators for subpixel edge detection[J].Pattern Recognition(S0031-3203),1993,26(2):295-306.

融合轮廓和区域特征的形状描述子 篇3

在基于内容的图像检索中,形状是一种主要的低层特征,它是人对图像理解的重要内容之一,相比于颜色和纹理特征,它更能从语义上描述目标图像。有关形状分析的研究至今已有几十年历史。文献[1]将现有的形状描述子分为两大类,一类是基于轮廓的描述子,另一类是基于区域的描述子。

轮廓形状描述了图像的边界信息,由于轮廓描述法具有易于提取的特点,因此在很多场合得以应用。轮廓法又分为两个子类,一类将边界作为整体,从中提取表示形状的参数(轮廓曲线坐标、质心距离[1]、三角形面积函数[2]、拱高[3]等等),再进行后续处理,形成诸如曲率尺度空间[4]、傅立叶描述子[1,5]、小波描述子[6]等形状描述法。另一类根据一定的准则,将边界用原语表示,最终的形状特征通常用字符串或树来表示。

在第二类形状描述法的提取过程中,区域的所有像素都参与形状描述。其中,矩是一种有效的描述法,常见的矩有Hu不变矩[7]、Zernike矩等。除此之外形状的分区描述法也是一类有效的区域描述法。

形状的轮廓描述和区域描述各有利弊。前者主要对目标边界上的像素进行处理,从视觉生理的角度讲,这类方法更接近人眼识别形状的机理,而且该类方法参与计算特征的数据量小。后者是对整个区域像素进行处理,其参与计算的数据量大,相比前者,该类方法在抵抗噪声等外部干扰上具有较强优势。文献[8]给出一个评价形状特征优劣的准则:较高的检索准确率,紧凑的描述性,具有通用性,计算复杂度低,并且对图形的检索具有鲁棒性等。其中较高的准确率是最基本也是最重要的准则。

为了提高检索的性能,现提出一种综合轮廓与区域描述优点的形状特征。该算法从图像的边界曲线中提取表示形状内容的空域和频域描述,为了克服轮廓法过于依赖边缘检测结果的弊端,算法结合形状矩阵这一区域描述,组合形成具有较高检索性能的混合形状描述子。

1 混合形状特征的提取

1.1 轮廓特征

一般描述形状的图像可分为目标区域与背景区域,因此往往用1和0两个值来表示图像,即对图像进行二值化。为提取目标图形的边界描述,首先通过边缘检测获取二值图像的边界曲线,然后在曲线上进行采样。为了后继处理中能够使用FFT提高算法速度,采样点数目N取2的整数次幂。设曲线长度为L,在对轮廓曲线进行采样时,首先在曲线上任取一点,每隔[L/N]个点采样一次(“[]”表示取整数),形成用于描述形状轮廓的有序采样点列表。

图像的质心距离定义为边界轮廓上的像素点到图像质心像素之间的距离。设区域形状图像I={f(x,y); 0≤x<M, 0≤y<N},区域形状I大小为M×N,其质心坐标(xc,yc)定义为:

xc=1Ax=0Μ-1y=0Ν-1xf(x,y)(1)

yc=1Ax=0Μ-1y=0Ν-1yf(x,y)(2)

其中A是区域面积,定义为:

A=x=0Μ-1y=0Ν-1f(x,y)(3)

则质心距离定义为:

r=(x-xc)2+(y-yc)2(4)

获得质心及质心距离后,对所有采样点进行跟踪获取邻点。对某个采样点a分别顺时针和逆时针沿着图像边界跟踪距离S(S是该采样点处质心距离的1/2)获得邻点bc(如图1所示)。获得邻点后可以获取abc连线的垂直距离作为拱高的值。拱高的符号由采样点a相对bc连线的位置确定,将bc看作从b指向c的有向线段,若abc的右边,拱高的符号定义为正, 反之定义为负[3]。 拱高的符号可以反映图形边界的凸凹情况,如图1(a) 拱高符号为正,对应点的边界是凸的,而图1(b)符号为负,对应边界是凹的。显然,线段bc的长度也可以反映凸凹的程度。这样对于N个采样点,每个点获得相邻点距离,拱高以及质心距离3个参数,用于表示该点处的形状信息。

为了进一步分析上述3个参数对形状的描述能力,图2给出了两幅图形的拱高,相邻点距离,以及质心距离3个参数的函数曲线。其中图(a)和图(e)是苹果形状的边界,图(b)和(f)是拱高函数曲线,图(c)和(g)是相邻点距离曲线,图(d)和(h)是质心距离曲线。由于图(a)与(e)仅在一些细节上存在差异,因此边界采样点到质心之间的距离曲线的形状相似,因而质心距离可以用于描述形状之间的相似性。而由图可以发现,拱高与相邻点距离的函数曲线存在差异,这恰恰表明了这两个函数能够反映形状的细节特征。

在数理统计中,均值反映一组数据平均水平和集中趋势,极差反映数据的变化范围,方差反映数据偏离均值的情况,方差越大,数据波动越大,因此分别求取3个函数的均值、方差和极差3个统计量作为形状特征的子特征。

为了获取更多的形状信息,算法通过傅立叶变换将图像从空域转换到频域,在频域中提取图像的形状内容。具体方法是:将描述形状相似性信息的质心距离作为实部,将描述形状细节内容的拱高作为虚部,构成拱高半径复函数[3]。对复函数进行离散傅立叶变换,获得低频傅立叶系数作为傅立叶描述子,形成算子的第2个子特征。

1.2 区域特征

上述两个子特征都是针对图像轮廓提取的,因此存在轮廓特征的一些固有缺点,比如易受噪声干扰,以及过于依赖边缘检测的结果。为了增强算法的鲁棒性,考虑增加一个区域形状子特征。

形状矩阵是一种有效的描述图像区域内容的工具,它实质是对图像区域的重新采样,用一个矩阵来描述图像的形状内容。获取一幅图像的形状矩阵的具体操作过程是:以图像质心为圆心,以最大质心距离为半径形成目标区域的最小外接圆。将圆半径等距离划分成P份,形成P个同心圆,极轴从(0~360)°逆时针旋转,记录极角为360/QK倍(K为0~Q-1之间的整数)时极轴与同心圆交点处的像素信息,形成一个记录图像形状信息的、大小为P×Q的形状矩阵。矩阵的行对应同心圆,列对应半径。由于极坐标极点位于区域质心,且是对最大质心距离进行等距离划分,所以形状矩阵满足对图像的平移和缩放不变性[9]。

图3给出了不同图像及它们对应的形状矩阵的图像。其中(a)和(c)是仅在细节上存在差异的苹果形状,如苹果梗处的叶子不同,另外(c)图形出现残缺,这两个形状相似,由图可以发现其对应的形状矩阵的图形(b)和(d)在形状上也相似。而图3(e)和前两个苹果图形在形状上存在较大差异,其形状矩阵图形(f)也与(b)和(d)存在较大差异。由此可见,形状矩阵可以描述图形的区域形状信息,通过提取图像的形状矩阵,可以减少参与后继计算的数据量。如原图尺寸256×256,对图像重采样获得的形状矩阵的大小是50×50,则形状矩阵的数据量是原图数据量的0.04。

由于图像的能量主要集中在低频部分,而高频部分的分量很弱,仅仅揭示了图像的某些细节。通过离散傅立叶变换,将形状矩阵由空间域转换到频域,可以获得表示图像形状信息的低频傅立叶系数作为形状描述子。

1.3 特征融合

在进行特征融合时,不同子特征的特征向量的取值范围可能存在很大差异,为了使子特征在特征相似性比较中具有公平的贡献,在进行特征组合前,需要对子特征进行归一化,公式为

fi′=(fi-fmin)/(fmax-fmin) ;1≤iD (5)

式(5)中fi是第i个特征量,fi′是归一化后的特征量,fmin与fmax分别是子特征向量中最小和最大的值,D是特征维数,经过公式(5)处理后,特征向量的取值范围在0~1之间的概率达到100%。

1.4 形状特征提取流程

检索算法的基本思想是:首先对图像库中的所有图像提取形状特征,形成特征库,在检索时,将待检索图像的特征与特征库中的其余特征进行比较,并按相似性大小返回检索结果。对形状特征提取的步骤总结如下:

(1)对图像进行边缘检测,并等间隔采样N个点;

(2)求取图像的质心(xc,yc),以及采样点到质心的距离r;

(3)对采样点在顺时针和逆时针两个方向跟踪距离r/2,在边界上获得两个邻点,计算拱高函数,以及两邻点间的距离;

(4)对采样点处的质心距离、拱高函数以及邻点距离进行统计,获取3个函数的统计量作为第1个子特征;

(5)以质心距离为实部,拱高为虚部构成复函数,在频域中提取表示形状内容的子特征作为第2个子特征;

(6)对图像区域进行重新采样,获得形状矩阵,并提取关于形状矩阵的傅里叶描述子,作为第3个子特征;

(7)对3个子特征分别进行归一化,组合成混合形状描述子。

2 实验结果和讨论

2.1 图形库

MPEG—7多媒体内容描述接口(Multimedia Content Description Interface),目标是为了产生一种通用的多媒体数据内容描述接口,以满足各种多媒体信息系统对多媒体数据的管理和检索的需求。MPEG—7图形库(set B)包含1 400幅图形,70大类,每类图形包含20幅在形状上存在差异的图片,它是用于形状特征描述算子的标准验证库,主要用于进行图像相似性检索实验,测试形状描述子对任意形状畸变的鲁棒性。

2.2 相似性比较

在进行检索时,需要进行特征之间的相似性比较。若图像AB的第i个子特征fiAfiB之间的距离表示为D(fiA,fiB),则本文利用3个子特征进行相似性比较时引入权值,采用式(6)的方式进行:

D(A,B)=w1D(f1A,f1B)+w2D(f2A,f2B)+w3D(f3A,f3B) (6)

式(6)中,w1、w2和w3依次是子特征1、2、3的权值,并且w1+w2+w3=1,权值w1、w2、w3的具体取值可以通过实验确定。

2.3 实验过程

信息检索中衡量一个算法性能的指标通常是查全率和查准率。其中,查全率表示从图像库中成功检索出相似图像的能力;查准率表示检索返回的图像中相似图像所占的比例。查全率和查准率之间具有互逆的关系,一般查全率较高时查准率较低,而当查准率较高时查全率又较低。为了客观反映检索的性能,可以将查全率与查准率绘制在一个图形中,即PVR指数曲线。

在测试形状描述子检索性能的实验中,对图形库中的每一幅图片都进行检索匹配。具体过程是:将图形库中的某一幅作为待查询图形,在剩余的图形中检索同类图形,总共需要进行1400次匹配。其中每次检索都记录查全率分别为10%、20%、30%……100%时对应的查准率,最终绘制PVR指数曲线。

2.4 检索结果

图4是4种不同算法的检索结果示例,第一列是待检索图像,每个算法返回最相似的9幅图像。其中第一行是现算法的检索结果,第二行是拱高半径复函数的结果,第三、四、五行分别是三角形函数、质心距离傅立叶描述子和Hu不变矩算法的检索结果。从图中可以看出,该算法在针对这一形状时的检索结果明显优于其它3种算法。

为了能够客观地测试算法的性能,将其与另外4种算法在Mpeg—7图形库上进行了对比实验,其中Hu不变矩是一种经典的区域形状描述法,其余参与比较的3种算法是轮廓描述法。具体结果如图5所示,其中横轴表示查全率,纵轴表示准确率,每种算法计算所有图像在10种查全率取值时的平均准确率,绘制图5所示的曲线。可以看出5种算法中三角形面积函数的检索性能相对最差,Hu不变矩其次,拱高半径复函数的检索平均准确率较前两者分别高出9%和6%。而现算法又比拱高半径复函数算法的平均准确率高出近16%。实验数据显示,该算法的检索性能显著优于参与比较的其余4种算法。

BEP(Bull’s Eye Percentage)性能指标[10]也是对检索性能进行评价的标准,它定义为检索返回的前40幅图像中相似图像所占的比例。假设每次检索实际匹配数为ni,则总的实际匹配数为i=1Sni,其中S为图像库中图像的总数。每类图形的数目为M,则总的理想正确匹配数为SM。对于MPEG—7 Set B图像库,S=1 400,M=20。则BEP定义为实际的正确匹配数与理想正确匹配数的比例,即:

BEΡ=i=11400ni1400×20(7)

表1给出了本文算法与其它4种形状特征的BEP检索性能,从数据可以看出该算法的BEP性能要远远高于参与比较的其余算子。这与PVR指数曲线显示的结果是一致的。

3 结论

现有的形状特征一般分为基于轮廓和区域两类方法。为克服轮廓描述法易受噪声等因素干扰的缺点,将两种描述法结合,提出一种融合轮廓和区域信息的新的形状描述算法。 该算法将包含形状信息的轮廓采样点的相邻点之间的距离函数,以及采样点的拱高函数和质心距离函数进行数理统计,并获取由拱高和质心距离组成的函数在频域中的低频系数,构成轮廓形状特征。再对图形区域进行采样获得形状矩阵,同样获得表示区域形状信息的傅里叶变换的系数。最后对两种形状特征进行组合,构成形状描述子。在对MPEG—7图形库的检索结果显示,该算法具有较高的检索准确率。今后将结合其它特征及相关反馈技术来获取更好的检索性能。

参考文献

[1] Zhang D S,Lu G J.Study and evaluation of different Fourier methodsfor image retrieval.Image and Vision Computing,2005;23(1):33—49

[2] Alajlan N,Kamel M S,Freeman G.Multi-object image retrieval baseon shape and topology.Signal Processing:Image Communication,2006;21:904—918

[3]王斌.一种用于形状描述的拱高半径复函数.电子学报,2011;39(4):831—836

[4] Mokhtarian F,Ung Y K,Wang Z T.Automatic fitting of digitisedcontours at multiple scales through the curvature scale space tech-nique.Computers&Graphics,2005;29(6):961—971

[5] Kunttu I,Lepisto L.Shape-based retrieval of industrial surfacedefectsusing angular radius Fourier descroptor.IET Image Processing,2007;1(2):231—236

[6] Yaday R B,Nishchal N K,Gupta A K.Retrieval and classificationof shape-based objects using Fourier,generic Fourier,and wavelet-Fourier descriptors technique:a comparative study.Optics and lasersin Engineering,2007;45(6):695—708

[7] Hu M K.Visual pattern recognition by moment invariants.IRE Trans-actions on Information Theory,1962;11(2):179—187

[8] Datta R,Toshi D,Li jia.Image retrieval ideas influences and trendsof the new age.ACM Computiong Surveys,2008;40(2):1—60

[9] Goshtasb A.Description and discrimination of planar shape usingshape matrices.IEEE Trans Pattern Anal Mach Intell,1985;7(6):738—743

轮廓特征 篇4

要实现基于计算机视觉的触摸屏就需要从背景图像中对手指进行快速、准确的识别和定位。但目前的图像处理算法大多存在着识别率较低、受光线影响大、多点触控不易实现等问题[3—6]。本课题设计出一种基于手指轮廓特征的目标识别与定位算法,该算法利用肤色信息和手指形状特征进行目标识别,利用所提出的9点快速定位算法对手指进行定位。该算法运算量较小,目标识别率和定位准确较高,且易于实现,能有效提高基于计算机视觉的人机交互系统的实时性,可在公共信息发布、互动媒体广告、教学、监控中心、展览展示等领域得到广泛应用。

1 多手指识别算法设计

在进行手指识别算法设计之前,先需要利用动态阈值分割法对灰度图像进行二值化分割,对分割完成的区域做连通标记,然后利用手指区域面积和长度特征滤去干扰区域,得到包含手指信息的二值目标图像(图1)。多手指识别算法的主要任务是根据手指的形状特征识别出指尖点所在的位置。

传统算法大多通过模板匹配进行手指特征识别[7—9],其虽然简单,但运算量很大,且随着图像和模板的增大,计算量会大幅增加,影响系统运行的实时性。为了提高指尖识别速度,本文利用指尖边缘呈圆弧状的形状特征,通过计算分割出的手形区域中曲率最大的点,来进行指尖识别。

1.1 手指轮廓提取

本文所采用的手指轮廓形状提取方法是在二值目标图像中,对某一区域边缘按某一固定的方向进行搜索,将区域边缘的坐标值按顺序进行记录,然后通过顺序读取的方式得到区域的轮廓特征。图2为经过提取处理后的手指轮廓图像。

1.2 手指轮廓曲率计算

由图2可以看出,在指尖处曲线产生了一个圆弧状的凸起,而其他部位的曲线较为平滑;因此,可将该特征作为指尖点的目标特征进行手指特征识别。通过平面曲线曲率的计算能较好的描述出该圆弧状的凸起。

平面曲线的曲率指的是针对曲线上某个点的切线方向角对弧长的转动率,表明的是曲线偏离直线的程度。曲率越大,表示曲线的弯曲程度越大[10]。在图2中,取相邻的3点计算斜率的变化率,通过斜率的变化表示曲率。图像中某个像素点的横纵坐标值分别用X、Y表示。

由式(1)可知,在斜率变化越大的地方Δk值越大,手指轮廓在指尖处的斜率发生了突变,Δk的值在连续函数中属于局部极大值,曲率值较大。而在轮廓曲线较为平滑的地方,相邻点的斜率基本没有发生变化,Δk的值趋近为0。因此按顺序计算出手指轮廓上每点的曲率,就可以利用曲率来识别指尖点。

1.3 指尖识别

从手指轮廓曲率的计算可以看出,在轮廓形状较为平滑的时候,曲率近似为0,指尖处曲率较大,指缝处曲率为负极大值。在波峰处的局部极大值基本处于0.5~0.8之间。本课题取0.5为阈值,将曲率大于0.5的点标记出来,可以得到指尖处圆弧状的连续曲线,取中点作为标记点,即指尖点。图3和图4分别给出了无干扰和有异物干扰(光照、杂物)情况下的指尖识别效果。

2 手指定位算法设计

根据手指识别算法可以得到指尖在摄像头坐标下的坐标,那么如何将摄像头坐标系中的坐标值转换到显示屏幕坐标系中的坐标是手指定位算法的主要任务。为了减少定位算法的计算量,提高系统的运算速度,本文在传统标定技术的基础上,提出了9点快速定位算法。

2.1 摄像机与屏幕坐标系的转换

采用的摄像机分辨率为640×480,需将其转化成分辨率为1 024×768的投影屏幕坐标,才能在投影屏幕上进行互动。

图5为理想情况下摄像头坐标系和屏幕坐标系之间的坐标映射关系。u-v坐标系表示摄像机坐标系,每一个像素的坐标(u,v)代表该像素在640×480图像中所处的行和列。x-y坐标系表示屏幕坐标系。

假设在像素坐标系中各个像素之间在x轴方向和在y轴方向上的距离分别是dx和dy,那么由图5可得图像中的任意点在摄像头坐标系u-v和屏幕坐标系x-y之间存在着如下转换关系。

其矩阵表示形式为

通过上述坐标转换公式可以进行摄像头坐标系和屏幕坐标系间的转换。

2.2 9点快速定位算法设计

在进行定位算法设计之前,需先对图像进行预标定,即得到某些点在两种坐标系下的坐标。通过这些已知的标定点简化两种坐标间的转换。本课题选择如图6所示的A、B、C、D、E、F、G这9点作为预标定点。

图7为从摄像机中采集的包含9个预标定点的图像,可以看出,图像产生了畸变,且在x轴方向偏差较大,y轴方向偏差较小,预标定点的位置由矩形排列畸变成了梯形排列。因此,在图像定位算法的设计过程中,必须对因图像畸变引起的x轴方向的偏差进行校正,否则会对定位精度产生影响。

在图7中,9个预标定点将屏幕分成了①、②、③、④四个区域。假设摄像机坐标系中某点M(x,y)处于区域①中,M0(x0,y0)为该点对应的屏幕坐标。已知边界处A、B、D、E四点的屏幕坐标(Xa,Ya),(Xb,Yb),(Xd,Yd),(Xe,Ye)和摄像机坐标(Ua,Va),(Ub,Vb),(Ud,Vd),(Ue,Ve),根据几何关系可得:

计算可得,M(x,y)经过坐标转换后的屏幕坐标M0(x0,y0)为

同理,在区域②中的定位公式为

在区域③中的定位公式为

在区域④中的定位公式为

由公式(6)~式(9)可以看出,在9个标定点预设好的情况下,对每个目标点只需进行8次减法运算和2次乘法运算就可计算出其在屏幕坐标系中的坐标,完成目标点的定位。与传统的定位算法相比,这种9点定位算法在确保识别精度的前提下,简化了计算量,提高了运算速度。

3 算法性能测试

为了验证上述目标识别与定位算法能否满足屏幕交互系统的整体要求,搭建了由CCD摄像头(分辨率640×480)、DH—VT120图像采集卡、投影机、背投屏幕等设备组成实物测试系统(图8),对该算法的运行实时性、识别准确率、定位精度等性能进行了测试。

该系统的工作原理如图9所示,桌面图像由摄像头经图像采集卡读入计算机,通过软件编写的算法处理,完成手指识别和指尖定位,最后经投影机显示人机互动效果。

3.1 实时性测试

本课题主要测试了不同识别点数量、有无环境干扰等因素对系统运行实时性的影响。图10~图13为识别效果图,表1给出了实时性测试结果。

从表1可以看出,在有/无干扰、单/多点识别等多种情况下,系统运行时间均小于40 ms,能保证每秒24帧流畅画面的识别速率。

3.2 目标识别正确率测试

在该系统中影响目标识别正确率的因素主要有:指尖是否充分接触桌面、有无手指状异物干扰(如圆珠笔)、有无强光源干扰等因素。目标识别正确率测试效果如图14~图17所示。表2给出了不同情况下,目标识别正确率的统计结果。

从表2可以看出,要确保系统识别的正确率,需要指尖与桌面充分接触,桌面上不能有手指状干扰物存在,并对强干扰光源等进行遮挡。

3.3 定位精度测试

经测试,桌面中心处定位误差较小,约为3 mm。桌面边缘处定位误差稍大,约为8 mm。基本可满足屏幕交互系统对定位精度的要求。

4 结论

通过对基于手指轮廓特征的目标识别与定位算法的研究,建立了一套基于计算机视觉的桌面互动系统。该算法利用肤色信息和手指轮廓特征能正确识别出手指轮廓,利用提出的9点快速定位算法实现了对进行目标的准确定位。该算法的运行时间不超过40 ms,能满足系统对实时性的要求;在无手指状干扰物存在的情况下,目标识别的准确率可达95%以上;定位精度误差小于8 mm,可满足系统对定位精度的要求。这种基于手指轮廓特征的目标识别与定位算法为增强人机交互系统的和谐性提供了一种新的技术途径。

摘要:为了提高从背景图像中提取目标的速度和精度,设计了一种基于手指轮廓特征的目标识别与定位算法;该算法利用肤色信息和手指轮廓特征进行目标识别,利用提出的9点快速定位算法进行目标定位。仿真结果表明,该算法能正确识别出手指的特征;并对其进行快速定位。在实物系统上对算法的实时性、识别准确率、定位精度等性能进行了测试,测试结果表明,算法运行时间不超过40 ms,能保证系统对实时性的要求;在无手指状干扰物存在的情况下,目标识别的准确率可达95%以上;定位精度误差小于8 mm,可满足系统对定位精度的要求。这种基于手指轮廓特征的目标识别与定位算法为增强人机交互系统的和谐性提供了一种新的技术途径。

关键词:人机交互,手指轮廓特征,目标识别,快速定位

参考文献

[1]吕明,吕延.触摸屏的技术现状、发展趋势及市场前景.机床电器,2012;39(3):1—7LüMing,LüYan.Technical status,development trend and market prospect of touch screen.Machine Tool Electrical Equipment,2012;39 (3):1—7

[2] 陈康才,李春茂.电阻式触摸屏两点触摸原理.科学技术与工程,2012;12(18):4525—4529Chen Kangcai,Li Chunmao.Two touch principle of resistance type touch screen.Science and Technology and Engineering,2012;12(18):4525—4529

[3] Kanhangad V,Kumar A,Zhang D.A unified framework for contactless hand verification.Information Forensics and Security,2011;6(3):1014—1027

[4] Guo J M,Hsia C H,Liu Y F,et al.Contact-free Hand geometrybased identification system.Expert Systems with Applications,2012;39 (14):11728—11736

[5] 魏巍.基于DSP的手形图像采集及处理系统.长春:吉林大学自动化学院控制工程系,2013Wei Wei.A system of hand image acquisition and processing based on DSP.Changchun:Department of Control Engineering,School of Automation,Jilin University,2013

[6] 荆澜涛.非理想条件下手形识别方法的研究.沈阳:沈阳工业大学通信学院通信系,2014Jing Lantao.Research on shape recognition method under non ideal conditions.Shenyang:Department of Communication,Shenyang University of Technology,2014

[7] Zeng P Y,Zhu B Q,Liu D A,et al.Application of image processing based on multiple filters in an alignment system.High Power Laser Science and Engineering,2014;34(3):1—6

[8] 冈萨雷斯,伍兹,艾丁斯.数字图像处理的MATLAB实现(第2版).北京:清华大学出版社,2013:301—307Gonzalez R C,Woods R E,Eddins S L.MATLAB implementation of digital image processing(second edition).Beijing:Tsinghua University Press,2013:301—307

[9] 帕科尔,景丽.图像处理与计算机视觉算法及应用(第2版).北京:清华大学出版社,2014:104—110Parker,Jing Li.Image processing and computer vision algorithms and applications(second edition).Beijing:Tsinghua University Press,2014:104—110

轮廓特征 篇5

点和边是CAD网络模型的重要组成因素, 可以直接影响其模型构建效益, 对模型建设具有至关重要的意义。在对全局轮廓形状特征保持的CAD网格模型进行简化的过程中要首先把握好模型点和边, 对点和边混合进行全面分析, 由该内容生成视觉感知信息, 从而确定模型表面分割内容。以前主要是依照模型结构对常规CAD网格模型进行分割, 这种分割在很大程度上影响了模型表面效果, 而在全局轮廓形状特征保持的CAD网格模型分割过程中, 主要从表面和轮廓特征出发, 由上述两项内容确定最终轮廓数据, 形成对应轮廓简化依据。在上述简化过程中系统轮廓与简化轮廓特征基本一致, 结构处理对全局不会造成任何影响, 这种分割效果对CAD网络模型简化具有非常好的促进作用。

当前全局轮廓形状特征保持的CAD网格模型轮廓简化中, 主要以离散曲率计算法实现系统数据的分析和计算, 对点、边网格进行构建, 依照网格体系完成基于点和边混合的边界轮廓分割, 轮廓简化效益非常显著。

2 改进QEM算法, 实现CAD网络模型特征简化

传统QEM算法只是对CAD网络模型进行分析, 并没有把握好CAD网络模型的全局特征。在该算法简化下, CAD网络模型全局特征效果大打折扣, 整体简化效益并不理想。在对QEM算法进行改进时, 针对全局特征性质, 对该算法内容进行了调整和转变, 其整体和局部特征保持效果均明显提升。因此, 在全局轮廓形状特征保持的CAD网格模型简化过程中可以适当选取基于改进的QEM算法实现模型全局优化。该体系可以依照该内容对机械表面特征进行分割, 依照对应算法得到边界轮廓曲线数据, 根据该数据完成系统处理, 形成网络模型的全局简化。该体系可以同时获取机械CAD网络模型的全局特征和局部特征, 可以及时依照轮廓特征分割图形, 形成对应曲线多边形。除此之外, 该体系还可以由上述多边形构建数学模型, 确定轮廓参照解, 以构建结果对轮廓全局进行简化, 从而优化全局轮廓形状特征保持的CAD网格模型简化效益。

3 保持形状特征, 实现CAD网络模型形状逼近

在对机械CAD网络模型进行初步简化后要对其边界形状进行把握, 要对上述过程中得到的特征多边形进行全面分析, 由上述多边形形成对应简化策略, 依照该多边形完成模型逼近, 从而保证简化后的机械CAD网络模型特征与原模型一致。在该过程中要对系统特征进行全面把握, 依照轮廓多边形点和边的位置对其实施逼近, 要严格保证逼近后的点和边的特征与原特征相似, 优化整体逼近网络模型。

全局轮廓形状特征保持的CAD网格模型简化过程中可以实时依照系统全局轮廓特征对其形状曲线进行调整, 要尽量保证逼近后数据信息符合QRM简化数据信息, 从而真正实现CAD网格模型特征的保持, 提升全局轮廓形状CAD网格模型简化效益。与此同时, 在该简化过程中还要把握好QEM简化后的模型特征轮廓曲线, 要对系统中的特征点和特征边进行约束, 形成对应点和边控制体系, 对上述特征结构进行保持。可以适当选取离散PSO算法进行系统点、边的计算和处理, 构造函数对逼近处理中出现的特征偏差进行分析, 及时调整, 从而实现全面逼近约束, 提升逼近的有效性和准确性, 改善全局轮廓形状特征保持的CAD网格模型简化质量。

4 多边形逼近调整, 实现CAD网络模型轮廓优化

全局轮廓形状特征保持的CAD网格模型简化过程中要对系统形状进行全面分析, 对其逼近后模型进行适当函数计算, 由计算结果对逼近进行调整, 从而保证逼近后的特征点和边的位置与原特征点和边的位置相同。要依照上述逼近后的点和边的位置对机械CAD模型进行完善, 对原始曲线在特征不变的状况下进行调整, 将机械CAD网络模型进一步提升。在该过程中需适当利用QEM简化中的局部特征, 根据系统中各项点的状况及系统状况对模型进行校验, 对拓扑关系和顶点位置进行调节和修改, 完成全局轮廓形状特征保持的CAD网格模型简化。

5 总结

作为机械CAD网络模型的重要组成部分, 全局轮廓形状特征保持简化不仅可以从根本上提升机械模型可视化效果, 还可以改进硬件交互及传输效益, 对机械生产具有至关重要的意义。在对全局轮廓形状特征保持的CAD网格模型进行简化的过程中, 人员要把握好点和边混合方法、改进QEM算法、保持全局形状、多边形逼近结果四项内容, 要不断对上述简化思路进行优化, 从而全面提升模型简化效益, 加速机械CAD系统发展进程。

参考文献

[1]周元莉.边界特征保持的机械CAD模型简化研究[D].哈尔滨工程大学, 2012.

[2]易兵, 刘振宇, 谭建荣.边界特征保持的网格模型分级二次误差简化算法[J].计算机辅助设计与图形学学报, 2012 (04) :427-434.

[3]杨钒沁.面向CAD应用的三维网格分割算法研究[D].浙江大学, 2007.

轮廓特征 篇6

关键词:分形维数,医学超声图像,轮廓提取

1 引言

医学超声图像轮廓提取是医学超声图像处理的关键技术之一, 目的是在存有大量噪声背景的医学超声图像中确定目标腔体的轮廓[1]。图像轮廓的清晰与否对医学诊断具有十分重要的作用。为了做出更准确的诊断, 医生需要定量地知道如心输出量等一些重要的参数信息, 这就希望在医学超声图像中能够较为精确地确定出目标腔体 (如心房和心室等) 的舒张和收缩轮廓, 从而为后续的诊断和治疗提供有效的信息。

然而, 由于受超声图像成像原理等固有因素影响, 图像的轮廓通常比较模糊[2]。经典的图像轮廓提取主要有Sobel算子[3]、Laplace算子[4]、Preivitt算子[5]、Kirsch算子[6]、Robert算子[7]等方法。这些基于微分算子的提取方法对普通图像的轮廓有较好的检测效果, 然而超声图像中存在大量的Speckle噪声, 这使得图像轮廓难以检测。直接将这些方法应用于医学超声图像, 难以获得准确的图像轮廓提取结果。

分形几何中通常采用分形维数的方法来估计一幅图像的复杂程度, 分形维数能够反映一幅图像中更深层次的结构信息。本文将分形维数概念扩展, 介绍一种局部模糊分形维数LFFD (Local Fuzzy Fractal Dimension) , 用来提取图像的轮廓信息。鉴于局部模糊分形维数对噪声不敏感, 本文采用基于局部分形维数特征的方法, 通过提取图像的局部模糊分形维数特征, 对医学超声图像进行轮廓提取。

2 局部模糊分形维数的原理及基于分形维数特征的轮廓提取方法

2.1 分形维数

在欧氏空间中, 人们习惯把空间看成三维的, 面看成二维, 而把线看成一维。也可以稍加推广, 认为点是零维的, 还可以引入高维空间, 但通常人们习惯于整数的维数。为了定量地描述客观事物的复杂程度, 1919年, 数学家F.Hausdorff从测量的角度引入了维数概念, 将维数从整数扩大到分数, 突破了一般拓扑集维数为整数的界限。

分形维数FD (Fractal Dimension) 有许多不同的定义, 计盒维数易于计算, 得到广泛使用。它可以用点覆盖方法来估计二维单色图像分形维数。用点覆盖的方法计算二值图像计盒维数时, 图像F被分割成M个宽度为δ的方块Ciδ。二值图像白点用1表示, 黑点用0表示。

计盒维数定义如下:

其中, Nδ (F) 是用半径不大于δ的盒子覆盖图像F时至少包含1个白点的盒子数目。可由下式求得:

其中, 若象素点p是白点, f (p) 取值为1;若象素点p是黑点, f (p) 取值为0。

实验中, 通过获取一组样本数据 (-logδ, log Nδ (F) ) , 采用最小二乘线形回归方法估计这群样本数据点, 计算直线斜率就可以得到该图形的分形维度。

2.2 模糊分形维数

分形维数只能估计二值图像的复杂程度。然而实际应用中, 元素的特征值常常不只取两个值。例如, 对于灰度图像, 在用点覆盖方法估计分形维数时就需要先二值化。二值化将导致大量信息的丢失。这对于医学图像分析诊断是不合适的。

因此将分形维数概念扩展, 用模糊分形维数FFD (Fuzzy Fractal Dimension) 作为灰度图像的特征。将图像F分割成M个宽度为δ的方块Ciδ。模糊分形维数定义如下:

其中, Nδ (F) 是用半径不大于δ的盒子覆盖图像F时所用到的盒子数目。可由下式求得:

其中, 象素点p的特征值f (p) 反映象素点p与白点的相似程度。对于256级灰度图像, 点的特征值采用点灰度值G (p) 除以256。特征值越大, 点与白点越相似。

2.3 局部模糊分形维数

FFD可以表明灰度图像整体的复杂程度。为了能够提取医学图像的局部特征, 图像点的局部模糊分形维数LFFD (Local Fuzzy Fractal Dimension) 被定义为该象素点周围邻域的FFD。由于FFD表示的是灰度图像整体的复杂程度, LFFD也就反映了灰度点周围邻域图像的复杂程度。局部模糊分形维数LFFD的计算流程如图1所示。

2.4 基于局部分形维数特征的医学超声图像轮廓提取

由于不同的灰度、不同的纹理形成的图像轮廓通常有不同的复杂度, 大量实验表明局部模糊分形维数可以反映图像的轮廓信息。又因为局部模糊分形维数对噪声不敏感, 于是, 实验中采用基于局部模糊分形维数的方法, 通过提取图像的局部模糊分形维数特征, 对医学超声图像进行轮廓提取。

3 实验结果与讨论

实验选取了大量医学超声图像, 图2 (a) 为其中一幅心室声像图。下面将基于局部分形维数特征的轮廓提取方法与传统微分算子方法相比较, 对该心室声像图进行轮廓提取。

图2 (b) 到图2 (e) 依次为采用Laplace算子[3]、Preivitt算子[4]、Kirsch算子[5]、Robert算子[6]对图2 (a) 进行轮廓提取的结果, 可以看出, 对于医学超声图像, 这些方法的检测结果受噪声影响都相当严重, 几乎不能达到轮廓提取的效果。图2 (f) 是基于LFFD方法的检测结果, 它较上述轮廓提取方法对噪声有较好的抗干扰性, 同时图像轮廓得到较好的提取, 检测效果明显优于上述轮廓提取方法。

4 结论

本文采用了基于局部分形维数特征的轮廓提取方法提取医学超声图像的轮廓。实验结果表明, 与经典微分算子轮廓提取方法相比, 基于分形维数特征的轮廓提取对医学超声图像中存在的噪声有较好的抗干扰性, 能够较好地提取图像轮廓信息, 为医学超声图像轮廓提取开辟了一条新的途径。

参考文献

[1]陈文山, 汪天富, 林江莉.基于相似度测量的医学超声图像对比度增强[J].中国医学影像技术.2006 (9) :1432-1434.

[2]陈文山.基于曲面形变模型的心脏超声图像三维分割[J].福建电脑.2011 (9) :96-97.

[3]N.C.Woods.A Sobel Edge Detection Algorithm Based System for Analyzing and Classifying Image Based Spam[J].Journal of Emerging Trends in Computing and Information Sciences.2012 (4) :506-111.

[4]Binghui Wei.The Effective Particles Edge Detection Method Based on Laplace[J].Procedia Engineering.2012 (29) :3096-3099.

[5]Jair Garcia-Lamont.Analogue CMOS prototype vision chip with prewitt edge processing[J].Analog Integrated Circuits and Signal Processing.2012 (3) :507-514.

[6]Shao Ping.Fast Kirsch edge detection based on templates decomposition and integral image[J].Acta Automatica Sinica.2007 (8) :795-800.

上一篇:原创文学网站下一篇:意识教学模式