灰度共生(精选7篇)
灰度共生 篇1
0 引言
图像的边缘是指图像局部强度变化最显著的部分,往往是由图像中景物的物理特性发生变化而引起的。边缘检测就是检测图像局部特征值(如灰度等)不连续或变化较为剧烈的像素点,把这些点连接起来就形成物体的边缘。通常可将边缘检测的算法分为两类:基于查找的算法和基于零穿越的算法。
基于查找的方法是指通过寻找图像一阶导数中的最大和最小值来检测边界,通常将边界定位在梯度最大的方向。基于零穿越的方法是指通过寻找图像二阶导数零穿越来确定边界,景刚是拉普拉斯过零点或者非线性差分表示的过零点。基于一阶导数的边缘检测算子包括Roberts算子、Sobel算子、Prewitt算子[1]等,基于二阶导数的边缘检测算子主要是高斯-拉普拉斯边缘检测算子。除此之外,还有Canny边缘检测算法、统计判别方法等。但是上述算子仅仅只是考虑某一特性进行检测,因而无法适应图像丰富多样的各式变化。
大量的实验表明,纹理是图像固有的特征之一,是灰度(对彩色图像而言则是颜色)在空间以一定的形式变换而产生的图案(模式),而且具有一定的周期性。既然纹理区域的像素灰度级分布具有一定的形式,而直方图正是描述图像中像素灰度级分布的有效工具,因此可选用直方图来对纹理进行描述就成为了此问题的基本解决思路。图像纹理分析方法在最近几年大量地涌现,其中常用的主要有基于傅里叶变换、基于小波变换等等方法[2,3]。通过如上的纹理分析方法可以得到有关纹理的相应特征,如纹理的粗细、疏密、一致性等,这些特征在一定程度上均表征了图像某个局部区域内边缘的部分特征。
1 灰度共生矩阵的定义
1973年,Haralick[4]等人提出了用灰度共生矩阵来描述纹理特征的方法。灰度共生矩阵[5]表达的是具有某种空间位置关系的两个像素的联合分布,可将其看成是两个像素灰度对的联合直方图,因而是一种二阶统计量。通常用Pd(i j)来表示灰度共生矩阵,如果灰度级为L,则Pd(i,j)为一个L觹L的方阵。方阵中的元素可表示为:Pd(i,j),(i,j=0,1,2,…,L-1),对其含义则可陈述为,具有空间位置关系d=(Dx,Dy)并且灰度分别为i和j的两个像素出现的次数或概率(归一化)。常用的空间位置关系d有水平、竖直和正、负45°之分,总共4种,如图1所示。
空间位置关系d确定后,就可以生成与d对应的灰度共生矩阵Pd(i,j)。Pd(i,j)的数字表达式如下:
共生矩阵中,每个元素均代表了某种灰度组合下出现的次数,例如元素Pd(1,0)就代表了图像上位置关系为d的,且两个像素灰度分别为1和0的情况总共出现的次数。
2 特征参数的选择
灰度共生矩阵提供了图像灰度方向、间隔和变化幅度的信息,因而可根据共生矩阵来计算一些对应的特征值,并以这些特征值来表征图像的纹理信息。但是由于灰度共生矩阵不能直接用于描述图像的纹理,基于这种状况,又定义了一些统计量来提取其所反映的纹理特征。由Ulaby[5]等人研究发现:在基于GLCM的14个纹理特征中,仅有4个[6]特征是不相关的。本文即以其中的二阶距作为特征参数,并将其应用到边缘提取中。
二阶距的数学表达式为:
由式(2)可知,二阶距是灰度共生矩阵元素的平方和,反映了图像灰度分布的均匀程度和纹理粗细度。当共生矩阵中元素集中分布时,f1值较大;反之,当共生矩阵中元素分散分布时,f1值较小。
3 本方算法的提出
对于纹理疏密程度不同的图像,传统边缘检测算子都是采用固定的模板。这样,对于纹理密集的区域,如果采用大模板,就无法区分边缘的细节;而对于纹理稀疏的区域,如果采用小模板,又容易受到噪声影响。基于对传统边缘检测算子存在问题的分析,本文根据纹理变化所表现出的边缘特征,将灰度共生矩阵与传统的边缘检测算子相结合,提出了一种基于灰度共生矩阵的边缘检测方法。该方法将边缘的纹理疏密程度与模板大小相对应,依据纹理疏密程度选择不同的模板,使模板的选择具有了一定的自适应性。
4 纹理复杂度
由于灰度共生矩阵Pd(i,j)总共含有L觹L个元素,当灰度级L比较大时,就是一个庞大的方阵。如对于通常的256灰度图,Pd(i,j)就是一个256觹256的矩阵,共216个元素。如此规模的矩阵则将使后续的计算量剧增。因此一般情况下,灰度图像都是要经过处理以减少灰度级数,而后再计算生成灰度共生矩阵的。而文中对该过程的实现则是,通过分析纹理图像的直方图,在尽量不影响纹理质量的情况下,进行适当的灰度变换以实现灰度级的压缩。进一步地考虑到模板选取与图像的局部特征相关的基本情况,本文提出了一种以图像中边缘信息作为纹理复杂度的度量新方法,可凭此来计算图像空间域中各点的纹理复杂度。
对图像空间域中的一点取窗口大小为m×n,求其灰度直方图。计算公式如下:
其中,E0表示能量分布峰值的点的个数。
5 纹理的疏密与模板大小的选择
本文中的算法将纹理分为:密集、稀疏、很稀疏。对不同的区域分别使用对应大小的模板:对密集区域选择的模板大小是3,稀疏区域选择的是5,而很稀疏的区域选择的则是7。做这种选择,可以使得:当选择小模板时,边缘细节不致丢失,而选择大模板时,也能保持边缘方向和图像平滑。在实验中,纹理的疏密程度和模板大小都是影响本算法的重要因素,因而可以根据具体的情况,适当调整纹理疏密程度和模板大小的对应关系。该过程的计算公式如下:
式中,Grad(i,j)表示像素(i,j)的梯度,small(i,j),middle(i,j)和big(i,j)分别表示使用小,中和大模板所求得的对应像素的梯度值,T1和T2则表示纹理复杂度的域值。
6 具体算法
算法步骤如下:
(1)首先,对输入的图像进行滤波,其目的是去噪,同时实现边缘平滑和改善分割效果;
(2)其次,对滤波后图像空间域中的每一点,以该点作为中心,取滑动窗口16觹16,做二阶距计算;
(3)经二阶距计算后得到能量谱的直方图,统计最大的峰值和窗口内像素点个数,并利用公式(3)求出其纹理复杂度;
(4)然后,根据公式(4),对图像空间域中的每一点选择模板,求取梯度;
(5)最后,对图像空间域中的每一点都进行步骤(2)~(4)的操作。
算法流程如图2所示。
7 实验结果及分析
采用matlab实现本文提出的算法并与传统的边缘检测算子做一比较,传统算子选用的是Robert算子和Canny算子。实验检测结果如图3所示,由图3可以看出,Robert算子在脸和帽子处有漏检现象,检测的边缘连续性较差;Canny算子对女士的边缘检测较完整,但是由于对噪声比较敏感,在脸和头发处生了许多假边缘,影响了算法执行的效率。本文针对火焰图像存在较多噪声的特点,采用基于灰度共生矩阵的边缘检测方法,所得到的火焰边缘较清晰,且定位准确,边缘提取效果更为显著。
参考文献
[1]GONZALEZ C,WOODS R E.数字图像处理[M].北京:电子工业出版社,2003.
[2]ZHOU F,SHI J Q.Texture feature based on local fourier tr-ansform[J].IEEE International Conference on Image,Processing,2001,17(2):610-613.
[3]朱萄华,杨新,李俊,等.基于纹理分析的保细节平滑滤波器[J].中国图象图形学报,2001,6A(11).
[4]HARALICK R M,SHANMUGAM K.Texture features for ima-ge classification[J].IEEE Trans,On Sys,Man,and Cyb,1973,SM-C-3(6):610-621.
[5]ULABY FT,KOUYATE F,BRISCO B,et al.Textural inform-ation in SAR Image[J].IEEE Transactions on Geoscience andRemote Sensing,1986,24(2):235-245.
[6]杨帆.数字图像处理与分析[M].北京:北京:航空航天大学出版社,2007,277-281.
灰度共生 篇2
关键词:纹理分析,纹理分类,纹理图像,Gabor滤波
本文采用基于灰度—梯度共生矩阵的纹理统计方法。该方法将灰度直方图和边缘梯度直方图结合起来, 为了获得旋转不变测量, 采用高斯拉普拉斯算子计算梯度信息, 容易验证其旋转不变性。通过获得旋转不变特性, 梯度信息就得到了具有旋转不变特性的灰度—梯度共生矩阵。从此, 在灰度—梯度共生矩阵中提取适当的纹理特征,
为了同时考虑空间域和频域的统计信息, 将环形Gabor滤波与灰度—梯度共生矩阵方法结合, 提出了基于灰度—梯度共生/环形Gabor滤波联合的旋转不变纹理分类方法。提出了Gabor滤波的参数选择方案, 同时从灰度—梯度共生矩阵中提取适当的特征, 采用马氏距离分类器来分类纹理。实验结果表明该方法的有效性。
1 灰度—梯度共生矩阵 (GGC)
1.1 灰度—梯度共生矩阵定义
一幅图像{f (i, j) ;i, j=0, 1, 2, 3, …, N-1}, 灰度级数为N, 为了减少计算量, 可将灰度正规化处理
式中:Lf为规定的灰度级数目, fmax为图像的灰度级数目。
同样, 对于梯度算子, 可将其梯度图像{g (i, j) ;i, j=0, 1, 2, 3, …, N-1}进行正规化处理, 使其梯度更加离散公式为
式中:Lg为规定的灰度级数目;gmax为梯度图像的灰度级数目。为了得到旋转不变梯度图像, 采用高斯拉普拉斯算子作为梯度算子。
由此得到了2个正规化矩阵:
1) 灰度矩阵:
2) 梯度矩阵:
则灰度—梯度共生矩阵定义如下:
H (x, y) 定义为集合{ (i, j) |F (i, j) =x且G (i, j) =y;i, j=0, 1, 2, 3, …, N-1}中的元素数目, 即灰度为x, 梯度为y的总像素点数。如:Lf=Lg=16, H (7, 10) =14, 表示一幅图像的灰度取值范围和其梯度取值范围均为16, 在灰度-梯度共生矩阵中, 灰度为7 (x=7) , 梯度为10 (y=10) 的总像素点数为14。
1.2 灰度—梯度共生矩阵归一化
变换公式为
显然,
式中:x=0, 1, 2, …, Lf-1;y=0, 1, 2, …, Lg-1。
1.3 基于灰度—梯度共生矩阵的特征统计量
从灰度—梯度共生矩阵中可以抽取以下重要特征统计量:
1) 小梯度优势
2) 灰度分布不均匀性
3) 梯度分布不均匀性
4) 能量
5) 灰度平均
6) 梯度平均
7) 灰度均方差
8) 梯度均方差
9) 灰度熵
10) 梯度熵
11) 混合熵
12) 惯性
13) 逆差矩
2 环形Gabor滤波 (CGF)
传统的Gabor函数是由方向复数正弦信号控制的高斯函数, 其数学表达式为
式中:
式中:F为环形Gabor滤波的中心频率。图1具体说明了环形Gabor滤波的特性。
2.1环形Gabor滤波旋转不变纹理分析
在基于Gabor滤波的纹理分析中, 通过将纹理表面I (x, y) 投影到复杂Gabor滤波上得到每个像素的纹理属性。在分析中用到的环形Gabor小波为
考虑将原图像旋转Δθ角度之后的纹理图像I′ (x′, y′) , 其投影变为
此时,
;
则
所以, 上述表达式可以表示为
由P=P′证明了当一幅图像旋转后, 其在环形Gabor滤波器下的投影保持不变。也就是说该属性具有旋转不变性。
2.2参数选择方法
1) δ=2π与传统的Gabor滤波中的取值相同;
2) 对于一幅大小为N×N的纹理图像, 选择频率F, 公式为
对于每一个F, 可以计算出UF和σF:
其中
对得到的数据进行标准化, 这样一幅纹理图像可以表示为
3 基于信息增益的特征选择
信息增益的特征选择可以得到比较好的纹理, 降低图像维数, 从而提高分类系统性能。
定义信息熵I (s1, s2, …, sM) :
式中:S为样本集;M为S的分类数目; (s1, s2, …, sM) 为S的一个划分, 设Ci为第i类分类标号;Pi为任意样本属于Ci的概率;si为分类Ci上的样本数。
假设有V个不同的属性, A为其中的任意一个属性, 则由属性A划分整个样本集为M类不相交子集的熵E (A)
因此, 属性A的信息增益Gain (A)
在实验中, 有16类样本, 分类标号Ci∈ (1, 2, …, 16) , 每一类含有N个样本, 共有16×N个样本, 即S=160×N。
计算每一维属性的信息增益, 通过选取信息增益较大者对应的属性来完成特征的选择, 最终选择前70%的属性对应的特征, 得到的分类效果最好。此特征选择过程如下
Step 1 每一类含有N个样本, 即
Step 2 采用基于信息增益最小的数据离散化方法, 将连续的属性值离散化, 得到M个整数值;
Step 3 数据离散化之后, 样本数据集被重新划分, 量化值为k (k=1, 2, …, M) , 分类标号为i, i=1, 2, …, 16的样本数为sk, i, 得到
Step 4 计算I (sk, 1+sk, 2+…+sk, 16) , (k=1, 2, …, M) ;
Step 5 计算属性A的信息熵:
Step 6 计算属性A的信息熵
基于以上步骤, 选择较大的信息增益值对应的特征。
4 实验结果
从Brodatz图片集中选取16类纹理图像, 如图2所示。每一类纹理包含8个大小为512×512的原始图像, 其中1个用于训练分类器, 剩下的7个用于测试分类器。将这些原始图像旋转, 从旋转后的图像中截取大小为360×360的子图像。采用10个旋转角 (0°、20°、30°、45°、60°、70°、90°、120°、135°、150°) , 在旋转过程中, 采用双线性插值算法, 纹理在旋转后没有产生任何局部扭曲。这样得到了简单易控的旋转不变纹理分析图像数据。最初的实验是从训练图像中抽取几个64×64的子图像来训练纹理分类器, 这些比较小的样本增加了纹理分类问题的难度。训练集包含576个样本图像, 这些图像具有同一个旋转角度, 而用其他角度的纹理图像进行分类测试。
在实验过程中, 特征选择过程使用同一训练集进行数据离散化。测试集包含5 184个样本, 采用最小距离分类器作为纹理分类器, 用马氏距离来计算测试样本与训练样本模型的接近程度。得到的实验结果见表1。
5 结束语
将灰度—梯度共生矩阵与环形Gabor滤波方法结合来解决旋转不变纹理分类问题。文中示出了灰度-梯度共生矩阵与环形Gabor滤波的旋转不变特性, 同时采用了基于信息增益的特征选择方法来进一步选择特征以提高系统的性能, 实验结果表明了其有效性。未来的工作是彩色图像检索问题, 本文提出的方法加上颜色统计信息或许可以很好地解决此问题。
参考文献
[1]Xia De-shen, Jin Sheng, Wang Jian. Fractal Dimension and GGCM Meteorology Cloud Pictures Recognition. Journal OF NANJING UNIVERSITY OF Science And Technology, 1999, 23 (4) .
[2]U.M.Fayyad, K.B.Irani.“On the Handling of Continuous-valued Attributesin Decision Tree Generation”.Machine Learn-ing, 1992, 8:87-102.
[3]P.Brodatz, Textures:A Photographic albumfor artist and de-signers.Dover, 1996.
[4]Dong-Gyu Sim, Hae-Kwang Kim, Dae-Il Oh. Translation, Scale, and Rotation Invariant Texture Descriptor for Texture-Based Image Retrieval. ICIP, 2000:742-745.
灰度共生 篇3
公路收费站根据车辆的类型收取相应的费用,采用自动车型识别系统可大大降低人工识别车型的工作量。学者们在智能车型识别系统领域提出了很多方法。文献[1]和文献[2]采用支持向量机分类车型,该方法以提取车辆侧面图像的特征作为研究对象,不同类型车辆的细节信息不能被提取出,无法精确识别车型。 文献[3]采用背景差分法提取目标车辆的Harris角点, 计算待识别车辆与标准样本Harris角点的Hausdorff距离,选择距离最短的为识别结果,该方法虽然只需研究车辆的某些特殊点,但对噪声没有良好的鲁棒性。 文献[4]以车脸图像灰度共生矩阵的纹理特征量作为标准样本,计算待识别车辆的纹理特征量与标准样本的欧氏距离,选择距离最短的为识别结果,该方法克服了文献[1]~文献[3]的不足。但文献[4]在图像滤波方面没有给出模板的大小和具体的车脸分割方法,这两步图像处理效果的好坏直接影响后续的车型识别。
本文提出 基于灰度 共生矩阵 ( gray level co-occurrence matrix,GLCM)纹理特征的车型识别系统,主要对文献[4]存在的不足加以研究。在图像滤波方面,对高斯滤波、各种参数大小模板的中值滤波进行比较;明确了分割车脸图像的方法。
1基于灰度共生矩阵纹理特征的车型识别系统
基于灰度共生矩阵纹理特征的车型识别系统由车辆图像采集及预处理、车脸分割、纹理特征提取、 最小距离分类器等组成,其结构图如图1所示。
车型识别流程:首先,采集一段在公路上拍摄的监控视频,提取出各帧图像,由于摄像头静止拍摄固定场景,因此在车辆出现期间,背景部分基本无变化, 通过背景差分算法可得到车辆图像;然后,对车辆图像中值滤波,利用车辆图像的水平、垂直积分投影方法分割出车脸图像;接着,对各车脸图像进行标准化, 建立标准车脸图像库,提取标准车脸图像的纹理特征, 建立纹理特征库,用纹理特征库的数据训练最小距离分类器;最后,将待识别的车脸图像的纹理特征量输入最小距离分类器进行识别分类。
2图像采集及预处理
2.1图像采集
本文从公路车辆视频中提取各帧图像,选择一张不含运动目标的图像作为参考;然后计算当前帧与参考图像对应像素位置的灰度差值,若差值不为0的像素数目超过设定的阀值则认为图像中存在运动目标, 否则没有运动目标,将检测出有运动目标的当前帧作为前景图像加以保存(本文视频的帧速率为13帧/秒); 最后将运动目标刚好离开拍摄范围的相连3帧图像的平均图像作为背景图像加以保存。
2.2图像预处理
2.2.1图像灰度化
拍摄的图像一般为24位真彩色图像,其图像像素值由R(红)、G(绿)、B(蓝)3种基色组成。 图像的数据量较大,使处理图像的时间过长,而且提取目标、中值滤波、分割车脸、生成灰度共生矩阵等操作都在灰度图像上实现。因此,需将存储的前景图像、背景图像灰度化,以便后续图像处理能正常进行。 本文采用加权平均法对图像做灰度化处理。
其中:分别表示在(i, j)处像素的红分量、绿分量、蓝分量;f(i, j)表示在(i, j)处像素的灰度值。
2.2.2运动目标提取
背景差分法是获取运动目标的最普遍方法,该方法简单并能完整地提取出运动目标。2幅图像直接相减获得的目标图像
其中,是运动目标图像;是第t帧是运动目标刚好离开拍摄范围的相连3帧图像的平均图像。
2幅图像直接相减,若像素差值出现负数则将其灰度值设置为0,其效果如图2所示。
2幅图像绝对相减所获得的目标图像
图像绝对相减获得的运动目标图像如图3所示。
由图2、图3可见,图像直接相减获得的目标图像噪声小,并且车辆与背景分离良好,有利于下一步的车脸分割。
2.2.3中值滤波
采集图像的质量会受到外界因素干扰,如光照强度、灰尘、空气湿度等。若图像中噪声较大,难以准确确定车脸位置。为降低噪声的影响,采用中值滤波对图像进行处理。实验图像的分辨率为宽320像素× 高240像素,通过调节模板参数比较处理结果,采用3×3模板时能获得较好的降噪效果。
3车脸分割
为减少数据量,提高系统识别速度,本文只研究车脸图像。车脸的具体范围:车辆左右雾灯的外边沿分别作为车脸图像的左右边界;车辆前挡风玻璃的下沿作为车脸图像的上边界;车辆保险杠作为车脸图像的下边界,四边界所围的区域称之为车脸。利用水平、 垂直积分投影的方法分割出车脸。由水平积分投影确定车脸图像的上、下边界,垂直积分投影确定车脸图像的左、右边界。目标图像的水平投影如图4所示,垂直投影如图5所示,分割后的车脸图像如图6所示。
分割后的车脸图像通常大小各异,且明暗程度也存在较大差异,使提取的纹理特征量没有统一的衡量标准。为此,需要将车脸图像缩放成统一大小。经过大量实验,车脸图像大小确定为宽120像素×高50像素。然后对车脸图像进行灰度拉伸、直方图均衡化, 使图像的衡量标准统一。经过一系列处理得到的标准车脸图像如图7所示。按照上述方法,将样本图像全部标准化,建立标准车脸图像库。
4纹理特征
4.1灰度共生矩阵
纹理反映图像的内部结构信息,表示在图像中某方向上相距为d的两像素存在着特定的关系。灰度共生矩阵是一种基于像素间的特定关系来描述纹理的方法。GLCM的每个元素[P(i,j)]表示在方向上, 相距d的2个灰度级分别为i和j的像素出现的概率或次数。若图像灰度级为L,则灰度级i,j=0,1,2,…,L-1。 θ一般取0º、45º、90º和135º;d一般取1、2、3等。
4.2提取纹理特征
本文选择GLCM 5个常见非线性相关的纹理特征作为研究对象:energy(能量)、contrast(对比度)、 entropy(熵)、relativity(相关)、local stationarity (局部平稳性)。
1) energy:是GLCM元素值的平方和,亦称为能量。能量越大,纹理就越粗;反之,纹理就越细。
其中,f1表示图像纹理的粗细程度;p(i, j)表示像素值分别为i和j的2个像素出现的次数或概率;L表示图像的灰度级数。
2) contrast:反映图像的清晰度和纹理沟纹深浅的程度。对比度值越大意味着图像的清晰度越高,纹理的沟纹越深;反之,纹理的沟纹越浅。
其中:f2表示图像的对比度;n = |i - j|。
3) entropy:是图像所具有的信息量的度量。纹理信息也属于图像的信息。熵表示纹理的非均匀程度或复杂程度。熵越大意味着纹理越复杂。
其中:f3表示图像具有的信息量。
4) relativity:反映GLCM的元素在横向或纵向上的相似程度。
其中:f4表示图像在水平或垂直方向有纹理;
5) local stationarity:度量图像纹理局部变化的多少。其值越大,表示局部越均匀;反之,局部变化不均匀。
其中f5表示局部图像纹理变化的大小。
5车型识别
本文用最小距离分类器识别车型。最小距离分类器的原理[4]:任何一个模式类在特征空间中都处于较为聚集的状态,将同类型样本特征量的平均值作为该模式类的中心;计算待识别样本的特征量与每类模式中心的欧式距离;选择距离最短的模式类作为该样本的分类结果。
本文基于灰度共生矩阵纹理特征的车型识别系统对小轿车、SUV、面包车、大客车、小货车、大货车等车型进行了实验,品牌包括大众、丰田、雪佛兰等。以图8实验车脸图像为例,本文设定图像的灰度等级L为256,GLCM的大小为8×8,像元距离d为1。计算4个方向(0°,45°,90°,135°)上的GLCM,其中1个GLCM为
灰度共生矩阵P(i,j|1, 0°)的纹理特征值能量为4406974、对比度为12502、熵为34561.6569、相关为1909、局部平稳性为1632.2393。将这5个特征值按顺序分别作为元素组成一个列向量。按照上述方法, 在所建立的标准车脸图像库中,分别提取每幅图像的纹理特征,建立纹理特征库。
将待识别样本的纹理特征向量与纹理特征库中每类车型的平均纹理特征向量进行距离计算,选择距离最短的为识别结果。3个品牌车的实验结果见表1。
6实验
本文实验系统开发平台为Microsoft Windows7操作系统,前端开发工具采用VS2010,图像处理中应用Open CV函数包。实验中,在公路上拍摄了100幅车辆的正面序列图像,将图像进行处理。在标准车脸图像库中选取15幅车脸图像作为训练样本,85幅车脸图像作为测试样本,正确识别的车型有77幅, 识别率达到90%。
7结论
本文提出的基于灰度共生矩阵纹理特征的车型识别系统稳定、正确识别率高、实时性好,但适用范围窄,例如光照强度等因素严重影响准确度。若光线强烈,车辆的颜色较暗时,前景图像中车辆所在的区域会比背景图像暗,用前景图像减去背景图像所得到的车辆图像不完整,提取的纹理特征量就不能准确地代表该车型,致使识别结果不准确。因此后续还需进一步研究去光照的算法。
参考文献
[1]王慧斌,芦蓉.基于视频的车型特征提取及识别方法研究[J].微型电脑应用,2010,26(10):50-53.
[2]冯超,贺俊吉,史立.基于支持向量机的轿车车型识别[J].上海海事大学学报,2011,32(3):85-89.
[3]周爱军,杜宇人.基于视频图像Harris角点检测的车型识别[J]扬州大学学报:自然科学版,2008,11(1):67-70.
灰度共生 篇4
直升机巡线可以提高电力系统维护和检修的速度和效率, 未来采用直升机巡检输电线路将成为主流[1,2]。直升机巡检得到大量的航拍图像, 图像处理技术在电力系统中的应用日益广阔[3]。
输电导线是输电线路的重要部分, 承担着输送电能的重要责任, 输电导线具有距离长、架设环境复杂等特点, 极易受到外力的破坏。在直升机巡检过程中, 及时发现导线的安全隐患, 防患于未然, 对电网安全稳定运行具有重要的意义。利用图像处理相关技术, 正确识别航拍图像中的导线, 奠定了导线缺陷监测的基础, 提高了直升机巡检输电线路的智能化、自动化水平。
在分析输电线路航拍图像特点的基础上, 相关研究者提出了不同的输电导线提取算法[4]。多数研究者采用边缘检测、Hough变换等图像处理技术, 利用图像的形状特征进行导线的提取。然而, 对于背景复杂、导线弯曲的图像, 导线提取效果并不理想。本文在分析输电线路航拍图像特点的基础上, 利用图像的纹理特征, 对导线的提取进行了深入的研究[5,6,7]。首先, 选取合适的窗口大小分析输电图像的灰度共生矩阵纹理特征, 选取分辨率较高的特征进行导线提取;其次, 利用上述纹理特征遍历整幅图像提取导线;最后, 利用图像分割技术去除非导线区域的像素点, 并且利用最小二乘法拟合得到完整的输电导线[8]。
1 灰度共生矩阵纹理特征
灰度共生矩阵 (GLCM) 是Haralick于1973年提出用来描述纹理特征的一种方法, 能很好地表征图像表面灰度分布的周期规律, 是目前一种重要的纹理分析方法[7]。
灰度共生矩阵常用的表达方式如下:设灰度图像矩阵为G, 位置相距为 (Δx, Δy) 灰度值为i, j的两个像素对同时出现的联合概率分布称为灰度共生矩阵。即矩阵中各像素点 (i, j) 的取值就等于符合相应条件的像素对个数。若将图像中灰度等级分为n挡, 那么联合概率分布可以用n*n阶的灰度共生矩阵M (Δx, Δy) 表示。如图1所示, 为一个3*3的灰度矩阵, 共有四个灰度级, 将原有的灰度级分为2挡, 像素值为1和2的为第一挡, 3和4为第二挡, 则当 (Δx, Δy) 为 (0, 1) 时, 此时构成的灰度共生矩阵p为:
灰度共生矩阵 (GLCM) 是描述在θ方向上, 相隔d像素距离的一对像素分别具有灰度值i和j的概率。显然GLCM是一个对称矩阵, 是距离和方向的函数, 其阶数由图像中的灰度级决定。由GLCM能导出多种纹理特征, 并且提取的纹理特征具有很好的鉴别能力, 但是GLCM计算特别耗时, 所以很多研究者尝试对此种方法进行改进。第一, 减少分析图像的灰度级, 如此一来虽然减少了计算量, 但是同时也丢失了一定的灰度空间信息, 降低了分析结果的准确性。第二, 合理选择距离d和方向θ。一般情况下, d取值为1, θ取值 (角度值) 为0、45、90、135。第三, 研究各种纹理特征之间的相关性, 选择效果比较好的纹理特征。
常用的纹理特征主要为以下几种:
1) 能量 (角二阶矩)
能量描述的是图像灰度均匀分布的特征, 当p (i, j) 的值分布均匀时, 能量值较小;当p (i, j) 的值分布并不均匀时, 则能量值较大。
2) 对比度 (惯性矩)
对比度反应的是矩阵中取值较大的元素远离主对角线的程度, 对比度越大则说明大值元素到对角线的距离远, 因此粗纹理的对比度较小, 细纹理的对比度较大。
3) 相关
其中μx, μy, σx和σy分别是px (i) =∑kpx (i, k) 和px (j) =∑kpy (k, j) 的均值和方差。
相关度量的是矩阵元素在行或列方向上的相似程度, 相关值大小反映了图像中局部灰度相关性。
4) 一致性 (逆差矩)
逆差距反映的是矩阵中大值元素到主对角线的集中程度, 逆差矩值越大, 说明大值元素越集中。
5) 熵
熵反应的是矩阵中取值较大元素远离主对角线的程度, 熵越大说明大值元素到对角线的距离越远, 因此粗纹理的熵较小, 细纹理的熵较大。
2 输电导线的识别
输电线路图像的背景比较复杂, 依靠传统的Canny边缘检测与Hough变换进行输电导线提取与分析时, 容易丢失弱边缘, 抗噪声能力较弱;对比分析常见的输电线路图像发现, 图像背景多为天空、森林、雪山、河流等, 它们的纹理特征与输电导线的纹理有较大的区别, 这为基于纹理特征提取输电导线提供了一个新的思路。下文基于灰度共生矩阵纹理特征提取输电导线, 其实现过程如下:
2.1 输电图像预处理
直升机巡检过程中, 采集航拍图像是在恶劣的、人力不可干预的自然环境下完成的, 输电线路图像的采集容易受到噪声、抖动、光照条件等影响, 从而造成航拍图像的退化变形, 因此在对输电线路航拍图像进行分析与处理之前需要进行必要的预处理。预处理主要是采用图像处理有关的技术手段改善航拍图像的质量, 抑制图像中的噪声, 凸显图像中的有用信号, 便于后续的输电导线识别等处理与研究。常用的图像处理技术包括灰度处理、二值化、直方图均衡化、空间滤波、亮度变换、形态学变换等。
2.2 图像纹理特征分析
1) 从输电导线图像中框选任意一窄块图像 (如图5红色矩形所示) 分析, 矩形块的宽度像素数为奇数, 长度一般取图像的高度值;接下来, 在该矩形块中选择一个正方形滑动窗口 (如图3绿色正方形所示) , 正方形与矩形宽度相同, 正方形可以沿着矩形框向下滑动。
2) 在正方形窗口内计算熵、能量、对比度、相关、一致性五个纹理特征, 沿着矩形框向下滑动, 绘出五种纹理特征的变化曲线图, 对比找到提取输电导线时分辨率较高的纹理特征。
3) 灰度量化水平反映了纹理特征分析的精度, 针对输电线路图像通常选择64, 满足实际应用需求。本次纹理特征分析, 参数选择如下:灰度量化水平 (即灰度共生矩阵的阶次) 选取64, 像素间距为2像素, 像素方向90°。此次实验用输电线路图像中导线的直径约为11像素, 矩形框宽度分别选择5像素、11像素、23像素、, 正方形滑块大小对应为5*5像素、11*11像素、23*23像素, 实验结果对比如图4所示。
为了直观地进行对比分析, 首先截取一窄条图像 (本例中选取横坐标为100像素处的矩形框图像) , 并将矩形框图像旋转90°, 放置于纹理特征图像的上部, 实验给出了熵、对比度、一致性、相关、能量五种纹理特征曲线。观察实验结果可以发现:一致性、相关、能量这三组纹理特征便相对辨别性不高, 熵和对比度则具有相对较好的分辨特性;矩形框宽度值选择在导线直径附近, 纹理特征曲线整体变化趋势相近, 只是细节分辨率不同。故本次基于纹理特征的输电导线提取将基于熵和对比度这两组纹理特征展开, 参数选择为:灰度量化水平64, 像素间距2像素, 像素方向90°, 矩形框宽度选择23像素。
2.3 输电导线提取
根据上节纹理特征分析结果, 选取熵和对比度两种纹理特征进行导线提取, 实验参数按照3.2节结果选取。输电图像纹理特征分析结果如图7所示。
由图5可以得知, 导线区域较背景区域其熵和对比度都比较大, 定义如下规则:熵和对比度同时大于其均值2倍的区域为导线区域。遍历整幅图像, 满足上述规则的区域即为导线区域, 导线提取结果如图6所示。
2.4 去除非导线区域像素点
观察图6可知, 在导线提取过程中, 存在误提取像素点, 即背景区域被当做导线提取出来。利用区域描述技术, 分析得到图8中各区域像素面积分布, 其中误提取区域的面积远小于导线区域的面积, 误提取区域面积绝大部分在500像素以下, 因此将图像中面积小于500像素的区域删除, 便得到不存在背景像素点的导线图像。本次实验得到的区域筛选后的图像如图7所示。
2.5 最小二乘法导线拟合
利用区域描述技术去除了无关的背景区域, 但是得到的导线图像仍然存在不完整、断裂等问题, 利用最小二乘法拟合导线的曲线方程, 得到完整的输电导线, 如图8所示。
3 结束语
传统依靠边缘检测和Hough变换技术的输电导线提取方法, 抗噪声能力差, 容易出现误识别, 并且无法有效提取弯曲的导线, 针对此问题本文从输电图像的纹理特征入手, 利用导线与背景间纹理特征的区别有效从输电线路图像中提取出了导线。利用区域描述与分割技术去除了图像中非导线区域的像素点, 并且利用最小二乘法拟合导线, 得到了完整的输电导线。
参考文献
[1]李国兴.我国直升机电力作业的现状与发展[J].电力设备, 2006 (03) .
[2]仝卫国, 苑津莎, 李宝树.图像处理技术在直升机巡检输电线路中的应用综述[J].电网技术, 2010, 12:204-208.
[3]孙凤杰, 崔维新, 张晋保, 等.远程数字视频监控与图像识别技术在电力系统中的应用[J].电网技术, 2005, 05:81-84.
[4]孙凤杰, 杨镇澴, 李媛媛, 等.输电导线图像目标识别方法[J].中国图象图形学报, 2012, 03:349-356.
[5]刘丽, 匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报, 2009, 04:622-635.
[6]步亚东.图像纹理特征提取的研究[D].山东师范大学, 2012.
[7]冯建辉, 杨玉静.基于灰度共生矩阵提取纹理特征图像的研究[J].北京测绘, 2007, 03:19-22.
[8]刘卫国.MATLAB程序设计教程[M].中国水利水电出版社, 2005.
灰度共生 篇5
医学影像技术的产生对医学的发展起到极大的促进作用。医学影像诊断是医学无创伤性诊断的主要方法之一,是国内外医学领域重点研究的方向[1]。对医学图像建立相应数据库并进行分类和检索,能够帮助医生给出更客观的评价和诊断结果。医学影像作为图像资料,无法直接输入数据库,需要对图像数据进行特征数据提取,将图像转换为具有描述图像特征意义的数值[2]。本研究采用灰度共生矩阵法进行特征值提取。
将各类疾病类型图像进行分类也是计算机辅助诊断需要解决的问题。本研究采用决策树方法进行图像分类。决策树是一种树结构,其中每个非叶子节点代表一个条件属性,其下的每个分枝代表该条件属性的一个取值,而每个叶节点代表一个类或类的分布,树的最顶层节点为根节点[3,4,5]。决策树的基本思想是:首先寻找数据集中的一个属性,建立决策树的一个节点,再根据该属性的不同属性建立树的分枝,在每个分枝子集中重复建立下层节点和分枝,这样便产生一棵决策树[6]。
图像检索即根据输入的图像从图像库中检索出所有与之同类型的图像。检索的准确性一直是研究的热点问题[7,8]。
2 原理与方法
本研究实现对图像库中的图像进行分类,并根据输入的图像检索并显示出图像库中与之相似疾病类型图像。
首先对图像库中的图像进行特征值计算,根据决策树分类算法来确定其疾病类型。还可对新输入的图像进行特征值计算,并检索整个图像库,最后将病灶相似图像显示出来。
本文所用图像数据均来源于临床,经过影像医生归类,大致分为3类:肝癌、肝血管瘤、肝囊肿。在实验中,我们首先对这些图像进行了必要的预处理,包括去噪和图像增强。随后用灰度共生矩阵计算二阶矩、熵、相关度、对比度等4个特征值。因为纹理是景物的一个重要特征,所以通常认为纹理是在图像上表现为灰度或颜色分布的某种规律性,这种规律性在不同类别的纹理中有其不同特点。由于纹理是由灰度分布在空间位置上反复出现而形成的,因而在图像空间中相隔某距离的2个像素之间会存在一定的灰度关系,即图像中灰度的空间相关特性。灰度共生矩阵就是一种通过研究灰度的空间相关特性来描述纹理的常用方法。比如,一幅图像中每个点都有其灰度值,其中任意一点(x,y)及偏离它的另一点(x+i,y+j),这2个点对应的灰度值差为(i,j)。令点(x,y)在整个画面上移动,则会得到各种(i,j)值,设灰度值的级数为K(本文算法选取级数值为16级),则(i,j)的组合共有K2种。对于整个画面,统计出每一种(i,j)值出现的次数,然后把它们排列成一个方阵,再用(i,j)出现的总次数将它们归一化为出现的概率P(i,j),这样的方阵称为灰度共生矩阵[9]。
其中,二阶矩是灰度共生矩阵元素值的平方和,也称能量,反映图像的灰度分布均匀程度和纹理粗细度。如果共生矩阵的所有值均相等,则二阶矩值小;相反,如果其中一些值大而其他值小,则二阶矩值大。当共生矩阵中元素集中分布时,此时二阶矩值大;相关度用来度量空间灰度共生矩阵元素在行或列方向上的相似程度,因此,相关值大小反映了图像中局部灰度相关性。当矩阵元素值均匀相等时,相关值就大;相反,如果矩阵像元值相差很大则相关值小。如果图像中有水平方向纹理,则水平方向矩阵的相关值大于其余矩阵的相关值;对比度反映了图像的清晰度和纹理沟纹深浅的程度。纹理沟纹越深,其对比度越大,视觉效果越清晰;反之,对比度小,则沟纹浅,效果模糊。灰度差即对比度大的像素对越多,这个值越大。灰度共生矩阵中远离对角线的元素值越大,对比度越大;熵是图像所具有的信息量的度量,纹理信息也属于图像的信息,是一个随机性的度量,当共生矩阵中所有元素有最大的随机性、空间共生矩阵中所有值几乎相等时,共生矩阵中元素分散分布时,熵较大。它表示图像中纹理的非均匀程度或复杂程度[10]。基于灰度共生矩阵的4个特征计算公式如下:
式中,u1、u2、σ1、σ2分别定义如下:
上述公式中的P(i,j)为像素i和j的灰度共生矩阵,L为P的矩阵阶数。
通过计算上述4个特征值结果,提取出能够比较明显区分3类疾病的特征为:熵和对比度,故我们选用此2类特征作为我们的分类特征。
3 实验结果与分析
本文所用图像数据均来源于临床,大致分为3类:肝癌、肝血管瘤、肝囊肿。在实验中,我们引入3类疾病的关键特征:熵和对比度。并将图像分类和检索用Matlab 7.0.4可视化呈现出来,以辅助医生诊断。
当我们点击“分类”按钮时,系统会对图库中的图像进行分类,同时可以逐一地查看各种疾病的图像及图像库中该类病的图像张数。图1为单击“分类”按钮后的界面。
当我们输入一幅新图像以后,系统会对其进行特征提取,并且判断当前图像的疾病类型。将其特征值在图像库中进行匹配,检索出与此图像有相似的图像,并给出图像总张数。同时根据系统检索出的图像数占图库中该疾病图像数的比例来计算本次检索的准确率,也将其显示在界面上。图2为点击“图像检索”按钮后的界面。界面上可以显示出该图像的疾病类型,并显示出此次检索的准确率。
通过临床图像实验,当图像达到300张及以上时,该算法的检索准确率还在90%以上,基本能达到临床医生的要求。如果在此实验基础上进一步引入其他的检索特征,如上下文联系、形状等[8],并对数据库中图像数据引入更有效的预处理方法,系统检索准确率将会进一步提高。
4 总结与讨论
随着医学成像技术的迅猛发展,临床上每天都会产生大量的影像数据,这些是医生诊断病情的重要依据。为了辅助医生诊断,降低医生工作强度,很多学者都致力于图像分类和检索的研究,旨在帮助医生在海量医学图像数据库中快速寻找具有类似病理特征的医学图像,提高疾病诊断的准确率。本文利用灰度共生矩阵计算了图像的熵和对比度,能够较准确地分类和检索出肝癌、肝血管瘤、肝囊肿等3类疾病,准确率最低达到90%。考虑到人体影像的系统性及疾病种类多样性特点,在后续工作中可以考虑将头部、胸部等医学影像数据陆续加入到本系统中,同时也将典型的疾病影像数据加入到本系统中,使其能更好地辅助医生诊断。
参考文献
[1]任仙,张勇.现代科技革命与医学影像学的发展[J].科技创新导报,2011(2):215-216.
[2]Antonie Maria—Luiza,Zaiane Osmar R,Coman Alexandru.Application of Data Mining Techniques for Medical Image Classification[J]. Proceeding of the Second International Workshop on Multinational Data Mining(MDM/KDD),2001(8):94-101.
[3]王大玲,鲁家乐,吴霜,等.图像分类与聚类算法在医学图像挖掘中的应用[J].计算机工程,2007,33(2):168-170.
[4]姜萱.利用数据挖掘技术构造医学图像分类器的研究[J].时珍??国医国药,2008,19(8):2 038-2 039.
[5]贾淑华,李星野,马琳琳,等.基于相关关系的图像分类和图像检索[J].微计算机信息,2009,25(5):294-296.
[6]Quinlan J R.Induction of Decision Trees[J].Machine Learning, 1996,1(1):81-106.
[7]Flickner M,Sawhney H,Niblack W,et al.Query by image and video content:the QBIC system[J].IEEE Comput Mag,1995,28(19):23-32.
[8]于梅,卢振泰,冯前进,等.非张量积小波的肝脏CT图像检索[J].计算机工程与应用,2010,46(28):28-32.
[9]蒲华,马缚龙,焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报,2006,32(1):155-158.
灰度共生 篇6
1 数字图像的灰度共生矩阵
数字图像由一个离散的二维函数f(x,y)表示,其函数值的物理意义由图像源决定。对于灰度图像,f(x,y)表示图像在点(x,y)处的灰度值。f(x,y)的灰度共生矩阵为:
式中,x,y是图像的像元坐标,x=1,2,3,…,M,y=1,2,…,N;i,j=1,2,…,L是灰度级,L是最高灰度级;Dx,Dy是位置偏移量,具有方向性;d为灰度共生矩阵的生成步长;!为灰度共生矩阵的生成方向,一般取0°、45°、90°、135°四个方向。
假设给定了生成方向!=0°,生成步长d=1,最高灰度级L=6。原始图像矩阵(8×8像素)转换为相应的灰度共生矩阵GLCM,如图2所示。在原始图像图2(a)中,当i=1,j=3时,对于像素点对(1,3)出现的次数为1,对应灰度共生矩阵的第1行第3列的位置P(1,3,1,0°)=1;类似的,当i=1,j=1时,对于像素点对(1,1)出现的次数为21,对应灰度共生矩阵的第1行第1列的位置P(1,1,1,0°)=21。在整个原始图像矩阵上按照d=1和!=0°的位置关系滑动,对所有像素进行统计得到相应的GLCM,如图2(b)所示。
帘子布纹理是由在空间位置上反复出现灰度分布而形成的,因而在图像空间相隔一定距离的两个像素之间会存在一定的灰度关系。生成步长d、生成方向θ是构造灰度共生矩阵P的重要参数,它们之间的不同匹配对生成的矩阵P有较大的差异[5,6]。
2 帘子布灰度共生矩阵生成步长d及生成方向θ值的确定
以图1帘子布各类图像为样本,d依次取1、2、3、4,θ依次取0°、45°、90°、135°获得不同的灰度共生矩阵。
从帘子布各类疵点的GLCM矩阵以及大量的实验证明,当d=2且θ=0°时,能够很好地区分帘子布疵点,如图3所示。正常帘子布图像得到的GLCM矩阵,主要分布在第一行和第一列的次对角线附近,其他空间分量较小,尤其在主对角线上,概率分布几乎为0;当有疵点时,其GLCM的次对角线上的概率相应的减小,而其他位置上的概率明显增大,尤其在主对角线上,概率分布剧烈增加。
3 特征参数的获取
以其他纹理(如木材纹理、大气云团、织物褶皱、商标图像、合成孔径雷达等)为研究对象时,经常选用的特征参数有角二阶矩W1、角二阶矩W2、相关W3、熵W4、方差W5、逆差矩W6等[7,8]。帘子布原特征参数实验结果如表1所示。
选用角二阶矩W1、角二阶矩W2、相关W3等为特征参数时,必需将灰度共生矩阵归一化后进行二次统计,通常归一化常数比较大,在运算过程中很多数据采用四舍五入处理,得到的结果有误差。实验结果表明,含疵点帘子布图像的特征阈值与正常帘子布图像的特征阈值有明显的交叉,实验结果不太理想。
根据帘子布纹理的结构特点,选取Q1、Q2、Q4、Q4四种参数作为帘子布特征参数。假设P(i,j,d,θ)为灰度共生矩阵中归一化前的任意一个元素,则Q1=P(1,1,2,0°)、Q2=P(1,9,2,0°)、Q3=[P(1,15,2,0°)+P(1,16,2,0°)]/2、Q4=[P(14,14,2,0°)+P(14,15,2,0°)+P(14,16,2,0°)+P(15,15,2,0°)+P(15,16,2,0°)+P(16,16,2,0°)]/6。
由于得到的GLCM是关于主对角线对称的矩阵,所以只讨论主对角线上半部分的概率分布情况。选取Q1、Q2、Q3、Q4为特征参数,其参数选取范围如表2所示。正常的帘子布图像的GLCM,概率主要分布在P(1,15,2,0°)和P(1,16,2,0°)的位置,其他位置分布几乎为0;缺经、断经疵点的GLCM概率在P(1,1,2,0°)处明显增加,甚至比在P(1,15,2,0°)和P(1,16,2,0°)位置出现的概率还大。其他位置出现的概率几乎为0;浆斑疵点的GLCM除了在P(1,1,2,0°)处明显增加外,在P(1,9,2,0°)也有明显的增加。粘并疵点的GLCM概率在P(1,1,2,0°)处明显增加,且在P(1,15,2,0°)和P(1,16,2,0°)位置出现的概率急剧减小;劈裂疵点的GLCM概率在P(1,1,2,0°)处也有明显增加,在P(15,16,2,0°)、P(16,16,2,0°)附近概率急剧增大。所以通过特征参数Q1、Q2、Q3、Q4可以比较准确地识别帘子布疵点。
在进行帘子布检测时,首先查看Q1、Q2、Q4的值是否在各自的特征阈值内,如果Q1、Q2、Q4均在各自的特征阈值内,说明帘子布图像中没有疵点。如果Q1、Q2、Q4中的任何一个值不在其特征阈值内,说明帘子布图像中有可疑疵点;然后再查看Q3是否在其特征阈值内,若不在其特征阈值内,说明帘子布图像中存在疵点,若在其特征阈值内,说明帘子布图像中没有疵点。总之,Q1、Q2、Q4体现了帘子布外表的不确定性,选取Q1、Q2、Q3和Q4作为图像的特征值可以消除此影响,实验结果证明了该方法的可行性和可靠性。
参考文献
[1]SHIMIZU Y.Expert system to inspect fabric defects by pattern recognition[J].IEEE Transactions on Pattern Recog-nition,1990,46(3):460-469.
[2]COHEN F S,FAN Z,ATTALI S.Automated inspection of textile fabric using textile models.IEEE Transactions on pattern Analysis and Machine Intelligence,1991,13(8):803-808.
[3]CHAN Chi Ho,Grantham K H Pang.Fabric defect detection by fourier analysis[J].IEEE Transactions on Industry Appli-cation,2000,36(5):1267-1276.
[4]BODNAROVA A,BENNAMOUN M,LATHAM S.Optimal gabor filters for textile flaw detection[J].Pattern Recognition,2002,35:2973-2991.
[5]汪黎明,陈健敏,王锐,等.织物折皱纹理灰度共生矩阵分析[J].青岛大学学报,2003,18(4):5-8.
[6]郭德军,宋蛰存.基于灰度共生矩阵的纹理图像分类研究[J].林业机械与木工设备,2005,33(7):21-23.
[7]薄华,马缚龙,焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报,2006,34(1):155-134.
灰度共生 篇7
关键词:Tamura,灰度共生矩阵,皱纹分析
1 皮肤皱纹测定赴法概述
纹理是一种在自然界里随处可见的客观现象, 在人类使用的各种物品中也普遍存在。对纹理分析方面的研究经历了近半个世纪, 并广泛应用于图像分析领域。从狭义的观点来看, 纹理就是粗糙度 [1]。人体皮肤表面由许多皱纹或皮纹构成, 是人类特有并由基因决定的 [2]。随年龄增加, 这些皮纹会缓慢地形成皱纹, 皱纹是成年后形成的 [3]。
目前最常用、又是最科学的皮肤皱纹测定原理是利用皮肤粗糙度参数来测定 [4]。皱纹一旦形成就难以平复, 尤其是出现在面部的皱纹影响人的美观, 因此, 防皱祛皱成为皮肤美容研究的重点。通过机理分析和检测, 对纹理粗糙度进行有效的数学描述, 是正确应用纹理粗糙度的关键。为了反映皮肤质量的变化, 检测祛皱型美容产品的实际应用效果, 测量皱纹参数是具有重要意义的步骤。
2 纹理特征提取方法
最早期的粗糙度测量方法来源于工程师计算机械工件的粗糙度Ra。1998年美国的M.A.Younis提出了精确度不高的表面图像参数和Ra值的线性函数关系。之后, 法国的D.Chappard等人又采用多种图像分析方法, 找到了更接近实际的参数和分析方法。埃及的E.S.Gadelmawla开发出了一种基于灰度共生矩阵分析方法的图像处理系统, 可以用于计算共生矩阵最大值及其位置, 以及矩阵的标准差, 然后将其与Ra值进行比较, 提取出一种称为最大值宽度的参数作为评价表面粗糙度的性能指标。
纹理特征是一种不依赖于颜色或亮度而反映图像中同质现象的视觉特征 [5], 通常被看作是一种局部特征, 它反映了图像的灰度信息、空间分布信息和结构信息。纹理特征与图像的色彩空间无关, 但是与纹理的位置、走向、尺寸、形状有关。纹理特征是对图像进行识别时经常采用的一种重要特征, 它已被成功应用于数字水印、目标追踪、图像检索、刑事侦察等领域。常用的纹理特征的提取方法有:统计法、结构法、频谱法和模型法等四种。
2.1 统计方法
统计方法是描述纹理特征最早采用的方法之一, 是以图像在灰度空间的分布情况为基础的, 能够描述图像纹理的粗细、均匀性记忆方向性特征的方法。灰度共生矩阵从原理上也属于统计分析方法的范畴, 其基于直方图的纹理度量也是典型的统计分析方法。统计方法计算原理简单, 但适用范围并不广泛, 主要适用于随机性大的结构图像分析。
2.2 结构方法
结构方法认为复杂的纹理可以由一些简单的纹理基元 (基本纹理元素) 以一定的形式组合而成。结构法主要研究纹理基元及其空间的关系, Tamura纹理分析方法就是一种典型的结构分析方法。
2.3 频谱方法
频谱方法用频谱分析的方法对图像的纹理进行特征表达。对图像进行傅立叶变换是最典型的频谱方法, 该方法从傅立叶频谱成分的分布中来求得图像纹理特征。但频谱方法在实际应用中效果并不是很满意, 究其原因是由于这种方法只能获取图像的频率分解信息。
2.4 模型方法
模型法是一种基于像素的纹理分析方法, 主要研究各个像素与其邻域像素之间的相互关系。模型法明显的缺点主要表现在其计算量很大, 若想采用单一的数学模型来表达自然纹理是非常困难的, 所以, 模型法一般很难应用于对自然纹理现象进行实际分析。
3 Tamura纹理分析
1978年, 根据人类对纹理视觉感知的心理学研究, Tamura等人首先提出了纹理特征的表达。Tamura纹理特征的粗糙度分量是最基本最重要的纹理特征。结合本文的主要研究目的:首先用Tamura特征的粗糙度来分析人脸皱纹变化的情况。
3.1 粗糙度计算步骤
Tamura纹理粗糙度的计算步骤如下:
第一步, 计算图像中点周围大小为2k×2k像素区域的平均灰度值。
第二步, 对每个像素点 (x, y) , 2k×2k分别计算其在水平方向、垂直和对角方向上互不重叠的区域间的平均灰度差。
第三步, 比较第二步中产生的多组E值, 利用以下公式
求出使得取得最大值时的值, 用公式
即求得每个像素的最佳尺寸
第四步, 计算整幅图像的平均值就是这幅图像的Sbest粗糙度。
3.2 粗糙度数据分析
实验中选用皱纹相对较明显的图像, 为了尽量排除噪声干扰, 从图像中裁剪出感兴趣的局部皱纹区域来进行计算分析。编号1、3、5的图像是从临床医院图像数据库中随机选取的, 2、4、6则分别为图像1、3、5用Photoshop进行祛皱处理之后的效果。
参照Tamura纹理粗糙度的计算步骤, 编写相应Matlab程序, 计算各幅图像的粗糙度, 同时记录完成一次粗糙度计算所需的时间, 用以分析Tamura方法的运行效率。结果见表3-1。对不同结构的纹理模式来说, 基元尺寸越大或者基元重复次数越小, 给人的感觉越粗糙 [6]。结合表中数据也可以看出, 经过处理的理想图片2和6, 皱纹已大部分消除, 给人的视觉感知是皮肤变得更平滑细腻, 也即纹理更细小, 在更小的区域内是均匀平稳的, 粗糙度就越小。
而对于图片4, 由于额头部位肤色颜色不均匀, 经处理之后粗糙度反而变大。总体来说, Tamura方法能反映皮肤纹理的变化情况, 但是运算效率明显太低, 不太符合应用需求。
4 灰度共生矩阵
图像的灰度共生矩阵是Haralick等在1970年代初期提出来的。在分析图像的局部模式结构以及排列规则时, 灰度共生矩阵是基础, 它能体现图像灰度关于相邻间隔、方向、变化幅度几个方面的综合信息。图像的一般灰度级数为256级, 但是级数太多会导致灰度共生矩阵太大, 计算量过大。所以, 在求灰度共生矩阵之前常压缩为16级。
灰度共生矩阵方法首先对图像空间的灰度分布做统计, 得到图像的灰度相关的共生矩阵, 然后通过对定义在灰度共生矩阵上的一些纹理特征指标进行计算, 最后依据这些特征指标来得到对图像纹理的诸如深浅程度和密度大小等特征的定性描述。
灰度共生矩阵定义为图像中相距为的两个灰度像素同时出现的联合概率分布。设图像的灰度级为0~L~1, 则其对应的灰度共生矩阵的大小为L×L, 记为Md, 灰度共生矩阵是一个对称矩阵, 其阶数由图像中的灰度级数L来确定。设表示灰度值分别为i和j、相距的像素对出现的频率。显然, △x和△y的取值不同, 灰度共生矩阵就不同。
4.1 特征值选择
灰度共生矩阵可以描述在某个方向上相隔一定距离的一对像元灰度出现的统计规律。它是以主对角线为对称轴, 两边对称的。对于粗纹理的区域, 其灰度共生矩阵中的数值较大者集中于主对角线附近。对于细纹理的区域, 其数值较大者散布于远离主对角线处。因此灰度共生矩阵可初步反应皱纹的特征。1979年Haralick从灰度共生矩阵中提出了14个代表纹理特征的量, 但是这14种特征值间存在着冗余, 因此必须进行特征选择 [7]。
最终选用角二阶矩、熵、对比度、局部平稳性这4个统计量。这里给出这四种统计量 [8]。设图像的灰度等级为0~L~1:
(1) 角二阶矩 (ASM) , 用来刻画图像灰度分布的均匀性。从图像整体看, 纹理较粗, ASM值相应较大;反之, ASM值相应较小。如果共生矩阵的全部元素都相等, 那么ASM值就小;而相反, 当共生矩阵中的元素都集中分布时, 则ASM值大 [9]。
(2) 熵 (ENT) 用来表示图像包含的纹理数量:ENT越大, 图像包含的纹理越多, 相反, ENT越小, 图像包含的纹理越少。它表征图像中纹理的复杂程度, 反映了图像纹理灰度分布的随机性, 是图像所具有的信息量的度量。
(3) 对比度 (CON) (沿主对角线的惯性矩) , 反映灰度局部变化情况, 用来刻画纹理的清晰程度:CON越大, 图像中纹理越清晰, 即纹理的沟、峰越明显。
灰度共生矩阵中远离对角线的元素值越大, CON越大 [10]。
(4) 局部平稳性 (IDM) 又称逆差矩阵, 是图像纹理局部变化的度量, 反映了纹理的规则程度。纹理越规则, IDM值就越大, 反之亦然。
在实际使用过程中, 通常选用四个独立的方向 (0°、45°、90°、135°) [11], 来计算图像的二次统计特征量。
4.2 共生矩阵特征值提取分析
测试图像同Tamura纹理算法的图像, 对于初步选定的特征值参数, 灰度共生矩阵算法中主要有4个变量影响计算复杂度:图像灰度级, 计算窗口大小, 方向和距离 [12]。为了提高计算效率, 将图像转化为256级灰度图像并压缩至16级, 这样就减小了计算量。实验研究表明, 当距离取1时, 一般可获得较好的效果。
由于计算的图像组本身就是截取的感兴趣区域, 计算窗口的大小会随着图像大小的变化而更改。再结合其他3个变量的选取情况, 分别计算0°、45°、90°、135°条件下的4个特征值, 计算结果见表4-1、表4-2以及表4-3。
第一组采样特征值的曲线分析图如图4-1, 由曲线图可以看出经过祛皱处理之后, 在四种角度条件下, 二阶矩和局部平稳性都升高了, 而熵和对比度都降低了。第二组和第三组采样特征值的曲线分析图也呈现出类似的规律。
结合灰度共生矩阵各特征值的计算原理:局部区域内图像灰度分布较均匀, 角二阶矩相应就大;图像纹理越复杂, 随机性越大, 则熵的值就越大;图像纹理越规则, 局部平稳性值就越大, 纹理沟纹越深, 其对比度就越大。在测试实验中得到的数据结果和计算原理基本是相符的。
同时, 灰度共生矩阵的计算量小于Tamura算法, 因此, 计算速度明显提升, 处理的效率比较高, 适合人脸美容效果智能分析系统的中皱纹分析模块的实际应用。对应皱纹较明显的图像, 角二阶矩小, 熵大, 而经过祛皱处理的图像, 灰度分布变均匀, 纹理随机性越小, 因此其角二阶矩变大, 熵变小, 对比度呈现一定程度的增大趋势, 局部平稳性则呈现一定程度的减小趋势, 但是对比情况未能呈现较明显的参考价值, 因此在后期计算准确性时, 会考虑通过准确性计算来确定最终选择哪几个特征值作为评价标准。
4.3 准确性分析
在进行皱纹分析的过程中, 随机选取了临床医院图片库中的40幅存在较明显面部皱纹的图像, 对初步确定的对比规律进行准确性计算和验证。针对40幅图像, 分别编号为第1至40取样组, 截取感兴趣的皱纹区域, 分别在每一组图像中编号1;再利用PhotoshopCS4进行简单的祛皱处理, 模拟使用某护肤产品之后的皮肤状态。
结合灰度共生矩阵特征值的原理, 角二阶矩描述图像灰度分布的均匀性, 图像灰度分布越均匀, 角二阶矩对应越大, 熵表征了图像中纹理的复杂程度, 体现了图像纹理分布的随机性, 度量图像所具有的信息量, 因此图像纹理越复杂、随机性越大, 对应熵值就越大。再结合数据计算结果可以得出, 随机选取的40组图像中, 模拟祛皱效果后, 角二阶矩增大的概率为95%, 熵减小的概率为95%, 也即祛皱处理之后选用角二阶矩和熵来作为对比分析的特征值, 准确性为95%, 而对比度和局部平稳性未能呈现较明显的变化规律, 在对比检测中可以作为分析因素, 但是最主要的因素还是角二阶矩和熵。
5 小结
本文首先阐述了皮肤纹理的相关定义, 并总结了纹理特征提取的常用方法。针对临床医院图像库, 选用了Tamura纹理分析算法初步检测图像粗糙度, 验证了该方法计算效率低的问题。再详细论述灰度共生矩阵算法, 并从图像库中选取图像编程测试了纹理特征, 通过对不同纹理特征值进行数据分析, 得出了较为实用的人脸皱纹分析规律以及较好的准确性。证明了灰度共生矩阵在人脸皱纹分析系统中更为适用。
参考文献
[1]王伸春, 高岳, 黄粤熙等.显微成像检测表面粗糙度[J].光学技术, 1998, (5) :45-48.
[2]Kligman AM, Takase Y, Gilchest BA, et al.Cutaneous aging[J].Tokyo:CRC Press Inc, 1997.41-55.
[3]李利, 唐莉, S.Mac-Mary, P.Humbert.皮肤纹理量化评价及在医学美容中的应用[J].中华医学美学美容杂质, 2005, 11 (1) :53~55.
[4]丁克祥, 刘伟.老化皮肤测定的原理及方法[A].第四届东南亚地区医学美容学术大会论文汇编, 1999.
[5]薄华, 马缚龙, 焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报, 2006, (1) :155-158.
[6]吕晓琪, 郭金鸽, 赵宇红, 任晓颖.基于图像分割的Tamura纹理特征算法的研究与实现[J].中国组织工程研究, 2012, 16 (17) 3160-3163.
[7]冯伟兴, 唐墨, 贺波.Visual C++数字图像模式识别技术详解[M].北京:机械工业出版社, 2010.7:187.
[8]郭德军, 宋蛰存.基于灰度共生矩阵的纹理图像分类研究[J].林业机械与木工设备.2005.33 (7) :21-23.
[9]陈锦.人脸皮肤粗糙度的量化评价及其在医学美容界的应用[D].成都:电子科技大学, 2009.
[10]冉会中, 周激流.彩色图像中的正面人脸检测的研究[J].成都纺织高等专科学校学报, 2008, 25 (3) :16-20.
[11]张鹤, 关泽群.基于灰度共生矩阵的图像文理分析[J].中国科技论文在线.