多尺度多方向

2024-08-16

多尺度多方向(共8篇)

多尺度多方向 篇1

0 引言

图像成像设备在获取图像时,由于环境因素(如光照不均、雨雾、沙尘)影响,常出现曝光不足、对比度低、不清晰、模糊等现象,造成图像信号质量不佳,严重影响了图像目标提取与分析。因此,在进一步处理之前须作预处理。图像增强通常是指使用特定的增强技术对图像进行处理,突出感兴趣的部分抑制非感兴趣的部分以提高图像的质量和使用价值,其在遥感图像、监控图像、夜视图像、模式识别等领域应用广泛。

图像增强的方法主要有空域法和变换域法两大类[1]。这些算法简单、易实现,但光照变化剧烈时,增强效果往往达不到预期要求。直方图均衡化、同态滤波、梯度域增强方法等是解决光照不均的常用方法[2]。自Retinex理论在1971年被Land提出后,许多学者将其应用到图像增强领域,为解决光照不均问题提供了一条新思路。Retinex理论是基于人类视觉感知物体颜色和亮度的模型,其基本思想是运用某种方法对图像的光照进行估计,然后消除或调整光照以得到一幅受环境光影响较小的增强图像。Retinex增强方法简单有效,自该理论被提出后,出现了很多Retinex经典算法,如单尺度Retinex算法、多尺度Retinex算法、带色彩恢复的Retinex算法[3]等。这些经典Retinex算法实质上是通过对输入图像进行高斯平滑滤波来估计光照图像的,都会有一个显著缺点,即在明暗对比强烈处会产生“光晕现象”。这是由于Retinex理论假设光照是平滑变化的,但实际上光照并不总是满足这样的假设,因此在使用高斯滤波器对原图进行光照估计时,容易在明暗对比度变化强烈处产生光晕。

基于Retinex理论,很多学者提出了不同的图像处理方法。鄢丹青[4]等人提出了一种新型的自适应Retinex图像增强算法,该算法不需要复杂的参数调节就能实现高动态范围图像增强,在图像细节恢复和光照还原上能达到很好的效果;周扬[5]等人提出的一种基于改进Mean Shift滤波的Retinex彩色图像增强算法,采用主成分分析法将对比度较低的图像分解成色彩与亮度两部分,使用改进的Mean Shift滤波方法实现光照分量的自适应增强并对色彩通道进行恢复,以全局为基础进行图像补偿;陈超[6]等人提出基于双边滤波的光照估计方法,使用双边滤波替代高斯滤波对输入图像进行光照估计。

针对传统SSR光照突变处理不好且增强图像常伴有光晕现象的问题,本文提出一种基于多方向的双边滤波单尺度Retinex图像增强方法,使用多方向双边滤波器估计光照,在Retinex增强时保留一定程度的光照,在有效克服光照不均、消除光晕现象的同时增强了图像细节。

1 Retinex理论

Retinex理论的基本假设是输入图像S为光照图像L和反射率图像R的乘积,即S(x,y)=L(x,y)·R(x,y),L决定了图像的亮度和动态范围,R代表原图的实质反射能力,是原图的本质图像。基于Retinex图像增强的目的,就是从S中估计出L,从而通过一定处理得到R。在处理过程中一般将图像转换到对数域,即s=logS,l=logL,r=logR,从而r=s-l。其数学形式可简述为

式中*表示卷积运算;F(x,y)=λexp(-(x2+y2)/c2)为高斯环绕函数,λ为归一化常数,使得c为尺度参数,控制着图像细节增强、动态范围压缩性能及色彩保真度。

2 双边滤波

双边滤波器(BF,Bilateral Filter)是一种能同时去除噪声和保持图像边缘细节的空域滤波器[7,8],是基于高斯函数的改进,由高斯滤波核与图像亮度信息相乘得来,这样在平滑滤波的同时能将图像边缘信息考虑进去,解决了高斯滤波后出现的边缘模糊问题。与高斯滤波原理相同,BF输出是通过BF与输入图像做卷积运算得到的,其实质为中心像素点领域内像素亮度值的加权平均,其数学表达式为:

式中,(x,y)为图像像素点,N(x,y)为中心在(x,y)大小为(2 N+1)·(2 N+1)的领域,(m,n)为领域像素点,I(x,y)和I(m,n)分别为(x,y)和(m,n)的亮度值,IB(x,y)为BF输出,w(m,n)为BF滤波核,是滤波权系数,由两部分乘积因子组成:

因此

式中ws(m,n)为空间滤波核,wr(I(x,y),I(m,n))为范围滤波核。

BF的性能由3个参数控制:滤波半径N、参数σs和σr,N控制平滑强度,σs和σr分别控制空间滤波核和范围滤波核。

3 多方向双边滤波SSR

传统的SSR算法采用高斯环绕函数估计光照,其操作简单、易实现,但当图像边缘处光照剧烈变化时,高斯环绕函数的各向同向性导致难以准确估计到光照,从而产生光晕现象。为消除光晕,估计光照时须考虑到图像中光照剧烈变化的情况。BF是具有平滑保边特性的各向异性滤波器,用于估计光照效果很好。考虑到环境的复杂性,同一幅图像可能受到多个环境光的影响,表现在像素点领域内的不同方向上,导致像素亮度变化不同。为获得更精确的光照,本文使用多方向BF代替SSR算法中的高斯环绕函数来估计光照。方法为使用多个方向的BF模板分别平滑输入图像,获得不同的光照图,然后通过融合得到最终光照。图1为算法流程。

图1 算法流程

3.1 多方向双边滤波估计光照

在多方向BF的选择上没有固定的方案,通常选取多个BF以保证不同方向的区分,但过多的BF容易降低算法效率。本文选取4个不同方向的BF方向模板,如图2所示。

图2 多方向BF方向模板

如图2所示,各模板中白色小圆圈为待处理像素点所对应的BF权系数,黑色小圆圈为待处理像素点的领域像素点所对应的BF权系数,黑色细线包围的部分即为多方向BF处理部分。

多方向BF输出即为BF方向模板对应的像素亮度值加权平均,多方向BF对图像的光照估计如下:

式中,d为不同方向,wd(m,n)为不同方向模板,Ld(x,y)为d取不同方向得到的光照图。

在处理范围滤波核时,基于Weber定律,根据图像每一点像素值与其领域内像素的差值进行判断比较,具体公式如下:

式中,当两点亮度差小于K·I(x,y)时,人眼无法辨别出该点与中心点,令其等于K·I(x,y)以增强该点对中心点的影响,K为介于0~1之间的值。

3.2 融合

图像融合分为基于像素的融合和基于区域的融合。基于像素的融合又分为像素灰度最小值、像素灰度最大值和灰度加权平均法[9]。

灰度加权平均融合法虽然计算较复杂,但是融合效果好,采用灰度加权平均法得到最终光照结果,具体如下:

式中,L(x,y)为最终融合光照图。

由于Retinex增强是通过消除光照影响来增强图像的,因此对完全消除光照与保留一定程度光照做了对比实验,发现不完全消除光照得到的增强图像效果要比完全消除光照得到的效果更自然。为此,文中增强算法保留一定程度的光照,通过式(1)中的光照图L(x,y)前面乘以一个控制系数(1-)来控制光照保留程度,其形式如下:

其中,∂∈(0,1)。

4 结果与分析

采用Matlab2010b在Pentium(R)D、2.30GHz、2GB内存的PC机上对文中提出的算法进行仿真,对增强图像进行主客观评价。实验过程中,分别用SSR算法、文献[6]算法、文中算法对不同类型的Tower、House、Scene灰度图像进行增强处理,图3、图4、图5为效果对比图。

由图3(b)可知,在塔中间部分有隐约可见的由白到黑、再由黑到白的阴影存在,即存在光晕现象,这主要是因为在进行光照估计时,光照剧烈变化处估计不准,图4(c)、图4(d)并没有出现光晕,但图4(d)效果好于图4(c),细节更为清晰。

图3 不同算法对Tower处理后的效果

图4(b)、图4(c)左边松树和大地处有种像雾一样灰蒙蒙的感觉,看起来很不自然,相比之下图4(d)的效果更自然。

图4 不同算法对House处理后的效果

图5(b)、图5(c)、图5(d)在全局视觉上没有多大差别,但在树枝和天空等细节处图4(d)效果要好得多。

图5 不同算法对Scene处理后的效果

使用均值、对比度、平均梯度客观评价标准对图像进行定量分析,数据见表1、表2、表3。

从各表数据分析可得,在均值上,各类算法都提高了图像均值,但本文算法均值提高不会过度或不足,这说明本文算法更能平衡增强图像,使增强图像更适合人眼观察。

在对比度上,Tower图和Scene图的对比度均得到了提高,但本文算法提高最大;House图对比度均降低了,但本文算法降低最小。这说明相比其余两种算法,本文算法更能提高图像对比度。

在平均梯度上,Tower图和Scene图的平均梯度均得到了提高,但文中算法提高最大;对于House图,SSR算法和文献[6]算法降低了图像平均梯度,但文中算法对其处理后,平均梯度没有下降反而提高了。这说明本文算法在图像细节增强上优于其它两种算法。

表1 均值算法对比

表2 对比度算法对比

表3 平均梯度算法对比

综上分析,本文算法能有效克服光照不均、消除光晕现象、增强图像细节,增强效果优于传统SSR。

5 结语

传统SSR算法不能解决因光照剧烈变化而产生的光晕现象,在图像细节增强上不够理想,主要是因为高斯环绕函数不能很好地估计光照图像。针对这种情况,本文研究了一种能更好估计光照的方法,提出采用多方向BF代替高斯环绕函数对光照进行估计,然后进行Retinex图像增强。实验结果表明,文中算法能有效地克服光照不均现象,消除光晕,增强图像细节,增强效果优于传统的SSR。

摘要:传统的单尺度Retinex(SSR)图像增强算法无法准确估计明暗突变剧烈区域的背景光照,增强图像易产生光晕现象且图像细节信息减弱。针对这种情况,提出一种基于多方向的双边滤波单尺度Retinex图像增强算法,利用不同方向的双边滤波器平滑输入图像,获得不同的光照图,通过融合得到光照估计,在Retinex增强时保留一定程度的光照使图像增强更加自然。实验结果表明,该方法能有效克服光照不均且可消除光晕现象,增强图像细节,其增强效果优于传统的SSR。

关键词:图像增强,Retinex,双边滤波,多方向融合,光晕

参考文献

[1]傅剑峰.Retinex图像增强方法的关键技术研究[D].合肥:合肥工业大学,2012.

[2]梁琳,何卫平,雷蕾.光照不均图像增强方法综述[J].计算机应用研究,2010,27(5):1625-1628.

[3]秦绪佳,王慧玲,杜轶诚.HSV色彩空间的Retinex结构光图像增强算法[J].计算机辅助设计与图形学学报,2013,25(4):488-493.

[4]鄢丹青,隋运峰,王雨果.自适应Retinex算法在高动态光照环境下的应用[J].计算机应用,2013,33(2):166-167.

[5]周扬,孙瑾,牛犇.一种基于改进Mean Shift滤波的Retinex彩色图像增强算法[J].计算机科学,2014,41(6):160-163.

[6]陈超.改进单尺度Retinex算法在图像增强中的应用[J].计算机应用与软件,2013,30(4):55-57.

[7]周雨薇,陈强,孙权森.结合暗通道原理和双边滤波的遥感图像增强[J].中国图像图形学报,2014,19(2):313-321.

[8]余博,郭雷,钱晓亮.一种新的自适应双边滤波算法[J].应用科学学报,2012,30(5):517-523.

[9]郭雄飞.图像融合技术研究与应用[D].太原:中北大学,2014.

多尺度多方向 篇2

关键词:矢量数据 像斑 变化检测 多尺度分割

中图分类号:P237 文献标识码:A 文章编号:1674-098X(2016)07(b)-0000-00

引言

遥感影像变化检测方法已经从传统的像元级变化检测开始向像斑级(对象级)变化检测方向转变。虽然许多变化检测方法采用了面向对象概念[1][2],但由于多数对象(像斑)仅由影像分割获得,获取方式单一,且该方法极度依赖影像分割算法的精度,目前为止仍没有一种具有普适性和高精度的针对高分辨率遥感的分割技术。

本文提出一种面向地理国情监测的高分辨率遥感影像与矢量数据结合的变化检测的方法。首先,分析了遥感影像与矢量数据套合结果的不一致性,通过应用矢量数据辅助分割,提出了一种获取同质性较强的像斑的方法[3][4]。进一步地,本文提出了基于历史矢量与双时相遥感影像的变化检测方法,并用实验证明了其可行性。

1 同质像斑获取

1.1 遥感影像与矢量数据套合不一致性

在理想的情况下,通过配准套合获取的遥感影像各像斑,其内部像素应保持灰度同质性;同时,属于同一类别的像斑应该保持类内光谱一致性,不同类别的像斑应具有类间光谱的相异性。这也是影像分割的目的和后续基于像斑进行影像分析的基础。然而,由于土地利用和土地覆盖的不同,使得这种理想情况在实际的应用中很难出现。因 此,由 于 数 据 源、数 据 格 式、生 成 标准、规范等多方面的不同,以及数据本身的特点和数据综合应用时的方法及其误差等的存在,使得遥感影像与矢量数据套合结果存在上述不一致性。本文对遥感影像与矢量数据套合不一致性问题展开初步探讨,采用多尺度分割算法获取同质像斑。

1.2 基于多尺度分割获取同质像斑

为获取同质像斑,本文综合利用GIS辅助数据分割和多尺度分割方法。首先,利用矢量辅助数据与遥感影像套合获取像斑。其次,对套合获取的像斑进行再分割,生成子像斑,从而保证各像斑内的光谱同质性。技术流程如图1所示。

具体步骤如下:

1)通过矢量数据和两个时期遥感影像分别配准套合,仅利用矢量数据的图斑边界信息获取影像像斑,分别视为T1期像斑和T2期像斑。同时,根据矢量数据属性信息中的类别信息,获取像斑类别。2)设定一定的尺度参数,以T1、T2时期影像的响应光谱特征为依据,分别对T1、T2期像斑进行再分割,再分割后的像斑继承上一级像斑的类别信息。3)对步骤2)中获得的像斑,根据类别的不同分别设置相应的尺度参数进行进一步分割,使得各类别像斑同质性均增强后,停止分割,将获取的子像斑视为T1、T2期子像斑。4)将步骤3)获得的T1时期子像斑和T2时期子像斑进行叠置分割,使得前后两个时期像斑一一对应。

因此,该方法是建立在多尺度分割的基础上,与已有的方法不同,该方法充分考虑了矢量数据的属性信息、影像的光谱信息以及上下文信息。

2 变化检测

基于历史矢量与双时相遥感影像的变化检测方法,主要分为以下几个步骤:1) 像斑的获取及其特征提取。在第2节中已做了详细阐述。在获得同质像斑的基础上,提取光谱、纹理、形状等特征,构建像斑特征空间,并对特征空间进行优化。像斑特征由组成像斑的内部像素灰度值通过一定的数学运算获取。2) 变化像斑获取方法。主要采用分类后处理的方法。针对分类后处理方法,T1期影像根据T1期矢量数据的属性信息,获取像斑类别,对像斑进行分类。T2期影像可采用基于像斑的最邻近分类算 法,对T2期 影 像 的 像 斑 进 行 分 类。

获取两个时期像斑分类结果后,通过叠置分析,对两个时期影像的像斑进行变化检测。该方法在决定是否发生变化的同时,也获得了像斑的变化类别。

获取变化检测结果后,可以根据再分割过程中形成的像斑与子像斑之间的继承关系,将已经获取的变化检测结果转换到矢量图斑上去,以此评价变化检测结果,并估计应用此变化检测结果更新现有矢量数据的能力。

3 实验及结果分析

本文采用的实验数据为某地区2012年5月和2014年5月的快鸟卫星影像(蓝、绿、红、近红外波段,以及全色波段),以及相同区域2012年5月矢量图。实验区大小为1001像元×1003像元,矢量图斑总数118个。

3.1 获取同质像斑

首先,分别将两个时期遥感影像与矢量数据进行配准套合获取像斑,并获取像斑类别。其次,以光谱特征和形状特征为依据,对T1、T2时期影像分别进行多尺度分割,具体参数:尺度参数为250,形状指数为0.7,紧致度为0.5。此时获得的分割结果出现了植被过分割和非植被分割尺度不够的现象,因此需要根据类别的不同分别设置相应的尺度参数。植被类别的分割尺度参数为:尺度参数为300,形状指数为0.6,紧致度为0.5,对植被类别像斑进行合并;非植被类别的分割尺度参数为:尺度参数为200,形状指数为0.8,紧致度为0.5,对非植被类别的像斑进行再分割。从而使得各类别像斑同质性均增强,停止分割。最后,将两期影像分割结果叠置分割,从而获取一一对应的影像像斑。如图2所示,共获得385个子像斑,从目视效果来看,绝大多数的像斑同质性较强,有利于后续的变化检测分析。

3.2 变化检测

采用基 于 类 间 距 离 和 穷 举 法 的 特 征 选 择 方法,对初始化特征空间进行优化,选取最佳特征组合。表1为特征优化结果。根据矢量数据中的属性信息,对2012年影像像斑进行分类。同时,利用基于像斑的最邻近分类算法,以最小距离为测度对2014年影像像斑进行分类。

获取两个时期像斑的分类结果后,通过叠置分析,对两个时期影像对应像斑的类别进行变化检测,如图3所示。变化检测结果如表2所示,由实验结果得出,80%发生变化的像斑,通过上述方法均能够被成功检测出来,证实了该方法的有效性和可行性。最后,将基于像斑的变化检测结果转换到矢量图斑上去。如果矢量图斑范围内有像斑发生变化,则认为该图斑发生变化,从而可以对历史矢量图进行更新。

表2 变化检测结果

4 结束语

本文针对遥感影像与矢量数据套合不一致性问题,提出了一种多尺度分割算法来获取同质像斑,并在此基础上利用历史矢量与双时相遥感影像的变化检测方法进行变化检测。矢量数据信息的引入促进遥感影像分割、分类分析基本模式的变化,它使遥感影像分析从一种纯粹认识的过程转化为一种具有先验知识的再认识过程,使本是 “理解”的影像分析变为了一种通过影像进行的 “鉴别” “比较”的过程。

参考文献

[1] 张连华,庞勇,岳彩荣,等.基于缨帽变换的景洪市时间序列Landsat影像森林扰动自动识别方法研究[J].林业调查规划,2012,38(2):6-12.

[2] 赵珍珍,燕琴,刘正军. 高分遥感影像与矢量数据结合的变化检测方法[J]. 测绘科学,2015,40(6):120-124.

多尺度多方向 篇3

关键词:深度信念网络,多尺度主线方向特征,图像分类,正确识别率,分类性能

图像分类是根据图像具有的某种属性将其划分到预先设定的不同类别中[1]。如何能提高图像分类的准确性,最核心的问题是对图像的有效表达。因此,特征的构建和提取一直受到广泛关注。近些年来常用的特征提取方法有SIFT[2]、HOG、LBP[3]、Gabor[4]等,但不能反映图像最本质的特征。深度学习能通过无监督的方式让机器自动地从样本中提取到表征这些样本的低层、高层特征,从而使学习到的特征更具有推广性和表达力。

深度信念网络( Deep Belief Network,DBN) 作为深度学习的一种模型。自从Hinton等人[5]提出基于DBN的贪婪逐层训练算法之后,DBN作为一种无监督特征学习复杂层次概率模型的方法,已成功应用于语音识别[6]、手写字体识别[7]、人脸识别[8]、遥感图像分类[9]和垃圾邮件过滤[10]等领域中。然而,进一步提升DBN模型的分类性能,提高算法的正确识别率仍是需要解决的根本问题。提升性能最简单和直接的方法就是通过增加DBN网络的隐含层数或每个隐含层神经元数来实现。但文献[11-12]研究发现当DBN中的隐含层数和神经元数目达到一定峰值后,再增加数目并不会提升识别性能,反而导致整个DBN网络训练时间过长。文献[13]从DBN网络结构着手,提出一种由DBN串联而成的层次结构深度信念网络方法,进而提升DBN的性能。文献[14]通过把卷积神经网络的局部感受野引入到DBN的单层中,把DBN的单层分成多个子RBM,提出一种改进的深度信念网络,用于有效提高识别率。文献[15]提出了基于Gabor小波和RBM的二次特征提取,来获取具有更好分类性质的特征。文献[16]通过将瓶颈结构与DBN结合实现了有效提高语音识别率的目的。

因此,DBN的性能仍有进一步提升的空间。鉴于DBN的可视层输入是将一个图像矩阵一维向量化,输入信息仅包含幅度信息,没有充分考虑到图像的二维结构信息。本文通过在DBN可视层输入端加入多尺度主线方向( Multi-Scale Main Direction,MSMD) 信息的方法( 简称MSMD-DBN) ,增加有效信息的维度,进而提升DBN的性能。实验结果表明,该算法可以有效提高图像分类的正确识别率。

1 深度信念网络

DBN是一种概率生成模型,由多层受限玻尔兹曼机( Restricted Boltzmann Machine,RBM) 单元组成。 DBN的结构如图1所示。

1. 1受限玻尔兹曼机

一个典型的RBM子模块结构图是由可视层和隐含层两层神经元构成的,每层有若干个节点,层内节点无连接,不同层之间的节点依靠权值系数矩阵来连接。各层之间的权重值是采用无监督的贪心算法获取的。

RBM是一种能量模型,其可视层和隐含层的联合组态能量表示为

式中: θ = ( W,a,b) ,为RBM模型中的3个参数; wij是可视层节点i与隐含层节点j之间的连接权重值; ai和bj分别是可视层第i个节点、隐含层第j个节点的偏置值; vi和hj分别是可视层第i个节点、隐含层第j个节点的状态值。对应于可视层神经元和隐含层神经元的相应映射概率分布为

式中: σ 是Sigmoid函数。RBM采用迭代的方式进行训练,训练的目标在于学习出参数 θ = ( W,a,b) 的值,以拟合给定的训练数据。参数 θ 可以通过最大化对数似然函数得到,最大化似然函数常用的数值方法是梯度上升。参数 θ = ( W,a,b)的迭代公式为

式中: η 为预训练的学习率,L为目标函数。采用Hinton提出的对比散度( CD) 算法对重构数据进行近似拟采样,可得各参数的更新规则为

式中: 〈·〉data为训练样本集所定义的分布之上的数学期望;〈·〉recon为重构后的模型所定义的分布上的期望。

1. 2DBN 算法的训练学习过程

通过式( 5) ~ 式( 7) 这样一个非监督的预训练过程就可以将一个RBM调整到合适的初始值,然后再将多个RBM自底向上组合建立DBN模型,最后通过使交叉熵最小,采用BP算法对整个网络进行监督式学习,最终建立DBN。

具体过程归纳为两步:

1) 无监督预训练。DBN模型采用无标签的数据,以重构误差为目标函数,基于CD-k的快速学习算法逐层地训练每个RBM来获得可视层和隐含层的偏置值,以及可视层和隐层间的权值。

2) 有监督微调。DBN模型采用带标签的数据,以交叉熵为目标函数,利用共轭梯度算法训练分类器,并实现整个DBN网络参数的优化调整。

2 MSMD-DBN 算法

DBN的输入端是将图像二维矩阵转化成一维向量输入到可视层中,然后通过逐层的学习训练提取特征。提取特征的精细程度直接影响后续图像分类识别的性能,甚至决定成败。本文正是从特征提取角度着手,在保证原有信息不丢失的情况下,通过增加多尺度主线方向( MSMD) 特征的方法,增加有用信息的维度,有效补偿DBN模型自身的缺点,提升DBN性能。简称这种算法为MSMD-DBN。

2. 1多尺度主线方向信息的特征提取

为了能提升DBN的性能,提高分类器的分类精度。提取特征的有效性非常关键。当用所有的特征进行分类训练时,会取得一个较高的错误识别率; 而仅使用关键特征变量,则得到的分类器性能较好[17]。本文的核心思想是在原有DBN输入信息的基础上,提取主线方向信息中的关键特征,即主线方向特征。并通过选择不同的尺度,获取更多的局部信息和全局信息。具体步骤如下:

1) 计算图像的方向投影值。 假设样本图像的大小是m × m,选取图像左上角的区域块,大小为d × d( d为奇数) ,以1个像素为步长,向右或向下平移,得到( m - d + 1) ×( m - d + 1) 个区域块。再对区域 块的像素 值进行归 一化处理。

以一个尺度为d的区域块为例,将经过区域块中心点的垂直方向的直线作为基准,以 π/dr的角度为间隔,逆时针旋转得到dr条直线,则每条直线与正方向的夹角分别为 π/dr,2π / dr,…,( dr - 1) π / dr,π。计算每一条直线所经过的区域块的像素值,并将这d个像素值累加求和作为该区域块在某个方向上的投影值Rθ。

改变角度 θ 就可以得到该区域块在dr个方向上的投影值。向右或向下移动区域块,就可以得到( m - d + 1) × ( m -d + 1) 个区域块在dr个方向上的投影值。

2) 根据不同方向上的投影值,计算线方向图和能量图。

将步骤1) 中得到的dr个投影值放在一个1行dr列的矩阵里,矩阵记为R1 × n; 选取矩阵R中的最小值,将该最小值记为r,并记录对应的列号( n) 。线方向图和能量图的计算规则如下

式中: D为线方向图; E为能量图; dr为选取方向的个数; x和y分别是尺度为d的某个区域块的中心点在原图像中对应的横、纵坐标。

移动区域块,利用式( 8) ~ 式( 9) 就可以计算出不同位置点( x,y) 对应的线方向值D( x,y) 和能量值E( x,y) ,进而得到整个线方向图D和能量图E。

3) 计算能量图E的二值图Eb。将能量图中的所有能量值按从大到小排序,并选取某个合适的能量值作为门限值M,对能量图进行二值化,规则如下

4) 计算能量二值图Eb的方向分离图EAb和EBb,规则如下

5) 以3 × 3区域为最小单位,删除EAb,EBb中连通区域的面积( Si,i = 1,2,…,n) 小于P的线条,将去掉杂线后的方向分离图( LA,LB) 合并为主线能量图。即

同理,计算得到LB

式中: PL为主线能量图。

6) 简化步骤2) 中的线方向图D,提取主线方向信息: 提取主线方向信息,即记录主线能量图PL像素值为1的位置,并保留线方向图D的此位置,其余位置置于0。即

式中: Ld( x,y) 为主线方向特征图。

采用以上步骤得到的多尺度主线方向信息,与传统DBN方法中输入的灰度信息,两两独立,互不相关,因此,能最大程度地反映原始训练样本图像所包含的信息[18]。

2. 2MSMD-DBN 算法及模型

增加DBN可视层输入端信息的维度有助于提高图像分类的正确识别率。借助此思想把第2. 1节提出的多尺度主线方向特征提取的方法与DBN模型结合,得到基于多尺度主线方向信息的DBN二次训练模型,即MSMD-DBN模型。其基本模型结构如图2所示。

根据图2的模型结构,该算法的训练学习过程如下:

1) 根据第2. 1节的多尺度主线方向信息特征提取方法,获得训练样本集的多尺度主线方向信息;

2) 将训练样本图像特征与1 ) 中得到的多尺度主线方向特征作为可视层的输入来训练第一个RBM,每个RBM的输出作为下一个RBM的输入数据,用来训练RBM,类似这样,利用无监督预训练算法逐层训练获得网络参数值;

3) 当逐层学习完成一组堆叠的RBM后,即将参数调整到一个比较合适的初始值后,再利用有监督微调方法对整个网络进行优化。

该算法在保证原有输入信息的前提下,通过添加多尺度主线方向信息的方法,增加输入端信息的维度,提升DBN的性能,使RBM更好地拟合数据,提取到更本质的特征,进而提高图像分类的有效正确识别率。

3基于MSMD-DBN算法的分类实验

为了验证本文提出的MSMD-DBN算法模型识别性能的有效性,实验选用CIFAR-10和MNIST数据库来进行测试,并与传统DBN算法以及文献[15]提出的Gabor小波与RBM二次特征提取方法进行对比。

3. 1CIFAR-10数据库上的实验

实验以CIFAR-10数据库为例,选取飞机、汽车和鸟三类图像,每类包括6 000幅,分辨率为32 × 32。从每类中随机抽取5 000幅图像作为训练样本集,另外1 000幅组成测试样本集。该实验中,主线方向信息特征提取方法中采用3 × 3和9 × 9这2个尺度空间,12个方向,门限值M = 280,DBN的结构设置为: 4028-300-300-800,RBM无监督预训练和DBN有监督微调中的迭代次数都设置为50次。

实验中用到的部分训练样本集和用3 × 3尺度空间提取到的对应的主线方向特征图分别如图3和图4所示。

为了验证本文算法的有效性,本实验采用3种算法在CIFAR-10数据库上进行测试,性能指标包括训练样本正确识别率和测试样本正确识别率。其中,文献[15]的算法采用4个方向的Gabor滤波器组。

实验1以飞机和鸟为实验对象进行分类,实验2以飞机、汽车以及鸟这3类图像为实验对象进行分类,3种算法的实验结果比较分别如表1、表2所示。

由表1和表2可知,相比于传统DBN算法,本文算法正确识别率有明显的提高,提高了11% 左右; 相比文献[15]也有一定的提高。这是因为本文的MSMD-DBN算法在输入端添加了更多的有效局部、全局主线方向信息,增加了输入信息的维度,使得提取到的特征更具有代表性。

为了进一步综合评价该算法,表3给出了不同算法在实验1中的耗时对比。

从运行结果可以看出,本文算法由于增加了信息的维度,相对于传统DBN算法,耗时较长,但相比于文献[15]的算法运行效率明显提高。综合考虑分类性能和耗时,本文算法相比于其他算法,既能保证一定的运行效率,又能提高识别性能。

3. 2MNIST数据库上的实验

实验以MNIST手写字体数据库为例,选取数字0,3和8等3类图像进行分类测试。从数字0中随机选取5 900幅图像作为训练样本集,900幅图像作为测试样本集; 从数字3中随机选取6 100幅图像作为训练样本集,1 000幅图像作为测试样本集; 从数字8中随机选取5 800幅图像作为训练样本集,900幅图像作为测试样本集。所有样本图像的分辨率为28 ×28。

该实验中,主线方向信息特征提取方法中采用3 × 3的尺度空间,12个方向,门限值M = 190,DBN的结构设置为:1568-500-300-800,RBM无监督预训练和DBN有监督微调中的迭代次数都设置为30次。

实验中用到的部分训练样本集和提取到的对应的主线方向特征图分别如图5和图6所示。

图7为本文算法的3层RBM得到的重构误差,从中可以看出重构误差在每一层RBM中呈下降趋势,且随着层数的递增,重构误差也呈下降趋势。

为了进一步比较和数据分析,本实验采用3种算法对MNIST数据库中的数字0 ,3 ,8进行分类测试,文献[15]的算法同样采用4个方向的Gabor滤波器组。实验结果比较如表4所示。

从表4的运行结果可以看出,本文算法相比传统DBN算法,正确识别率有一定的提高,而文献[15]的算法对手写字体分类性能不能起到改善作用。

4 小结

分层多尺度建模-计算方法 篇4

1 基本假设

我们所考虑的材料结构都被假定为宏观上足够均匀, 但在微观上是不均匀 (异质) 的 (以可区分的组成物来说, 例如夹杂、晶粒、界面及空洞) , 如图1所示。

由于此细观尺寸比分子尺寸要大得多, 所以我们可以将每种组成相当做连续介质来看待。与此同时, 以尺度区分的准则来说, 细观尺寸又要比宏观试样的特征长度或宏观下载荷的波长要小得多。

目前大部分的多尺度方法都假定材料具有周期性的细观结构, 即认为整个宏观结构件都由空间单胞重叠而成。目前, 有些学者采用了更加合理的假设:局部周期假设。即在宏观上不同的点相应的细观结构可以不同, 而在宏观点周围一小块部分细观形态是重复的。局部和整体周期性的概念示意图如图2所示。笔者采用的是第一种假设。即整体周期性假设。

在此方法中, 每一个宏观材料点的变形 (梯度) 张量FM需要先计算出来。这个材料点的变形张量FM参与构建RVE的边界条件。然后求解RVE的边界值问题, 宏观的应力张量PM就可以通过相应RVE的应力场的体积平均来得到。因此, 在宏观材料点上的变形 (应变) -应力数值关系就很容易得到了。方法流程如图3所示。

2 细观尺度上的问题说明

材料细观结构的物理和几何特征由代表性体积单元RVE来确定。一个典型的二维RVE如图4所示。实际上对RVE的选取是一项十分复杂的工作:

RVE尺寸必须足够大来代表材料的细观结构, 同时RVE尺寸又要足够小来进行更加效率的建模和计算。在文献[2,3,4,5]中详细说明了代表性体积单元RVE的概念和构建。这里假定一个合适的RVE已经建好。

给宏观材料点指定的RVE, 已知RVE的初始状态向量为X (在参考体积V0范围内) , 当前位置向量为x (在当前体积V) , 细观结构变形梯度张量表示为:Fm= (∇0mx) c, 其中∇0m是关于所参考微观结构的梯度算子;c表示共轭。

如图4所示, 此RVE处于一个状态, 在数学上反映为关于柯西应力张量σm或者关于第一Piola-Kirchhoff应力张量Pm=det (Fm) σm (Fmc) -1的平衡方程式, 其表达式为 (不考虑体力) :

∇m·σm=0 V中 或

∇0m·Pmc=0 在V0中 (1)

其中∇m是关于当前单胞细观结构形状的梯度算子。

各细观组成物的力学特征由各自的本构关系来描述, 现对各细观组成物指定时间相关的应力-应变关系:

Pm (α) (t) =RP (α) {Fm (α) (τ) , τ∈[0, t]} (2)

其中t表示当前时间, undefined为可区分的细观组成物的数量 (例如基体、夹杂等) 。

然后指定位移边界条件, 变形状态下RVE上一个点的位置向量可表示为:

x=FM·X (X在Γ0上) (3)

其中Γ0为RVE上未产生变形的边界。

3 宏-细观尺度耦合

使用的是位移边界条件, 假定宏观变形张量FM为细观变形张量Fm的体积平均:

undefined

现在验证位移边界条件 (3) 是否满足式 (4) , 把式 (3) 代入式 (4) , 然后使用散度定理∇0mX=I。

undefined

=FM (5)

4 应用实例

镍基超合金广泛应用于航空、发电站等领域, 尤其是发动机涡轮叶片等热端部件。

4.1 缺口试样拉伸实验的有限元建模

缺口试样拉伸实验主要用于对金属材料塑性损伤和断裂的研究。圆形缺口试样示意图如图5所示, 单位为mm。

使用分层多尺度方法进行此材料拉伸实验的有限元模拟, 考虑到试样是绕中心线轴对称的, 所以使用轴对称单元进行二维分析。试样的二维几何模型及网格划分如图6所示。

由于试样采用镍基超合金, 此材料为多晶体材料, 其细观结构的几何模型和网格划分如图7所示。二维多晶体的几何模型构建参见文献[5,6]。

单元类型上, 选择一阶常规单元, 不使用减缩积分。最后的模型中, 二维网格单元总数为343。关于单元的详细信息见表1。

4.2 材料定义和边界条件设置

缺口试样采用某镍基合金的材料数据, 宏观材料参数见表2。

微观结构采用晶体粘塑性本构模型。下面简要列出其弹性本构方程,

undefined

其中左端是以中间构形为基准状态的Kirchhoff应力张量τ的Jaumann导数。L为刚度张量。

镍基合金各组成相得流动法则和硬化规律方程参见文献[7]的晶体塑性理论部分。

4.3 计算结果

宏观试样分析和细观结构分析的有限元分析结果如图8所示, 图8 (a) 为宏观试样在拉伸载荷下的最大主应变分布, 图8 (b) 是在细观尺度下RVE的最大主应变分布。由图可以看出, 试样在缺口底部的应变量最大, 其值为0.3789。细观结构进行位移继承后得到的最大主应变结果为0.3871, 两者差异2.16%。这在计算缺口部位应变能和疲劳强度的时候相差是巨大的。

引起细观结构应变结果比宏观分析要大的原因可能是由于细观尺度下晶粒大小、晶体学取向等的影响[8]。因此, 为了要获得这种影响的机理进行详细的多尺度分析是必要的。

5 结论

首先提出了多尺度建模方法, 然后讨论了此方法的可行性, 最后将此方法应用到圆形缺口试样拉伸实验的有限元模拟。完成了缺口试样从宏观到细观的跨尺度计算。得到了如下启示:

(a) 宏观 (b) 细观

1) 从宏观试样的分析结果中我们知道在缺口底部会出现应力应变集中, 一般把此区域称为危险区域, 选用此区域的单元作为宏-细观跨尺度计算的连接点;

2) 传统的宏观计算由于没有考虑细观因素的影响, 可能会导致错误的结果, 所以进行考虑细观结构影响的宏-细观的计算是必要的。此方法已经成功应用于某镍基合金的跨尺度分析。

参考文献

[1]V.Kouznetsova, Computational homogenization for themulti-scale analysis of multi-phase materials[D], Eindhoven University of Technology, 2002.

[2]J.Zemanand, M.Sejnoha, Numerical evaluation of effec-tive elastic properties of graphite fiber towimpregnated bypolymer matrix[J], J.Mech.Phys.Solids, 2001, 49:69-90.

[3]Z.ShanandA.M.Gokhale, Representative volume elementfor non-uniform micro-structure[J], Comput.Mater.Sci, 2002, 24:361-379.

[4]C.Huet, Application of variational concepts to size effectsin elastic heterogeneous bodies[J], J.Mech.Phys.Sol-ids, 1990, 38 (6) :813-841.

[5]黎倪.材料微观组织结构的有限元模拟[D].兰州理工大学材料科学与工程学院, 2005.

[6]刘玉振.基于Abaqus的材料微结构有限元计算的后处理研究[D].兰州理工大学材料科学与工程学院, 2008.

[7]王自强, 段祝平.塑性细观力学[M].北京:科学出版社, 1995.

多尺度多方向 篇5

本文立足于提高基于HOG的人体检测方法的性能,并增强存在遮挡情况下的检测率,提出了一种基于多尺度方向直方图的特征提取方法提取图像的粗特征和精特征。在此基础上使用级联SVM模型和Adaboost算法进行检测,形成一种多尺度多分类器的人体检测模型,并对其效能进行测试。

人体检测作为计算机视觉研究应用领域的重要研究方向之一,有着巨大的市场应用潜力和研究意义,可广泛运用于人机交互、自动控制、视频检索和智能视频监控等方面[1]。这也进一步推动了学者对视频帧和图像中的人体目标检测,但迄今为止人体检测仍然存在着效率低下且易受遮挡、视角、光照等因素影响,这些方面的问题成为人体检测领域的难点亟待解决[2]。

在目前的研究成果中,主要有三类人体检测方法,分别是模板匹配、基于Haar特征的方法和基于梯度方向直方图HOG(Histograms of oriented gradients)的方法[3,4,5]。其中模板匹配是提取图像并与已有人体形状模板进行匹配检测是否是人体,较为典型的有头肩模型用于匹配检测[6],但人体形态的多样性导致这种方法效果较差,已较少使用;基于Haar特征的方法使用Haar特征和分类器材识别,由于人脸特征能与Haar特征较好契合从而在人脸检测中得到较好应用,但因背景颜色、衣服色泽等因素影响,在人体检测中的效果不如预期[7];基于HOG的方法经描述局部图像的方向分布情况和梯度获取该区域的HOG作为检测特征并结合训练的分类器进行识别,该方法精度较高因此得到了较多的重视和研究[8]。但基于HOG的也存在训练速度较慢、特征窗口提取单一等缺陷,因此许多研究对其进行改进,如多尺度HOG方法[9]、局部二值模式结合HOG方法[10]、加权块[11]等方法来增强局部特征的表达能力从而提高基于HOG方法的效率。但这类方法都是在固定尺度上计算,没有将人体的多尺度轮廓纳入特征提取中,而多尺度特征表达的提出通过使用Gabor小波、灰度协方差、组合块等方法提高了基于HOG方法的性能,进一步增强了基于HOG方法的应用价值。

1 本文人体检测方法

本文在已有研究的基础上,综合考虑复杂背景下相互遮挡且不易检测的难点,以背景区分、多视角检测、遮挡去除等方法用于人体目标检测。训练特征块以多尺度方法从训练样本中提取和选择,包含粗特征和精特征,其中粗特征使用扩展多尺度方向特征提取并使用粗分类器选择,精特征使用WTA hash编码的扩展多尺度方向直方图提取并使用贪婪算法选择,对特征集使用多层级联的Adaboost算法和SVM分类器进行多视角分类器进行分类训练。将训练好的分类器运用于待检测图像,并结合复杂背景处理、多视角样本生成和遮挡处理得到最后的检测结果,算法流程如图1所示。

2 特征提取

本文分别使用扩展多尺度方向特征提取和WTA hash编码的多尺度梯度方向直方图特征提取方法获得图像的粗特征和精特征。

2.1 HOG原理

HOG是按照图像的外观、形状等特征的边缘方向和梯度来获取图像特征,这种特征并没有从图像整体去提取特征,而是将图像分割成许多个名为cell的小细胞单元,再计算所有cell中的梯度方向直方图。同时为了提高算法效率将多个cell融合成一个名为block的大单元并将其梯度进行归一化,计算梯度方向向量[12]。

在HOG特征计算过程中,首先使用一维离散微分模板从垂直和水平两个方向将180°分成N个方向计算内部各个cell的梯度,研究得出,当N为9时梯度精度最大[13]。然后取各cell单元中所有像素点的梯度幅值进行加权求得其比重,依照比重为直方图通道投票加权。由于图像背景的存在和影响,各cell的梯度变化幅度较大,分类器难以适应其变化,因此再进行归一化处理,使用L2范数为因子,计算如式(1)所示。

式中e为常数,V表示归一化前的梯度向量值。这样可求得图像的HOG特征。

2.2 扩展多尺度方向特征提取

多尺度方向MSO(Multi-scale orientation)特征是从水平和垂直两个方向综合描述直立或者姿态变化小的人体轮廓信息,但却不能有效识别姿态变化明显的人体轮廓信息[14]。为此设计一种扩展多尺度方向特征EMSO(Extended MSO)提取方法,以扩展的Haar-like特征为基础,在MSO的基础上再提取两个特征块,使人体轮廓信息特征提取的姿态变化适应性更强,其原理如图2所示。

EMSO的方法是将图像分解为n个单元块,再将各单元块划分为4个子块并计算各子块颜色积分值,常规MSO已有垂直梯度Dd和左旋45°梯度Ddl,而水平梯度Dl和右旋45°梯度Ddr需计算得出,Dl计算方法为:

Ddr计算方法为:

式中I(·)是该点的像素值。计算4个子块的颜色积分值后,可得EMSO单元块方向He的值为:

在此基础上可得量化块方向Fi的值为:

即将180°以内方向的连续值进行8值离散化处理,将所有Fi进行连接后可得EMSO特征,该特征可用方块表征任何矩形,其方向计算可在方向上进行,可降低EMSO特征维数,且不易受光照、形变影响,因此可提高运算效率。

2.3 扩展梯度方向直方图提取

设存在图像,其尺寸为(W,H),对应的多尺度图像金字塔度数为K=3,其中各度在k=4个相互独立级的量化将使用的尺度因子。在这种条件下,各级图像将被分为8×8的cell,在2×2的重叠block上提取HOG特征,各级HOG级联可得多尺度梯度方向直方图MHOG(Multi-scale Histograms of oriented gradients)特征[15],对应的维数为4644,维数值较大,计算复杂度较高,因此使用WTA hash编码予以改进,即WM-HOG。

图像上的X和Y两点相似性在某种程度上和对对应的特征维数排序类似,其pairwise-order量度计算方法为:

式中,xi、xj分别是X和Y对应的第i特征维数,T(·)是阈值函数,其公式为:

式(6)可变换为:

式中有:

WTA hash编码[16]如图3所示,图3(a)中L(X,0)={1,2,3,5}对应式(10)的低于0下标元素的元素下标集合,类似的L(Y,0)={3,4,5},代入式(9)可得R0(X,Y)=|{3,5}|=2,由于维数为6,因此K=4,θ={1,4,2,5,0,3},图3(a)和(b)的X不相关,编码结果分别为1和2,即不相等。而图3中的(c)、(d)是对(a)做线性运算而得,因此对应的输出结果也为1。通过实例可知,WTA hash编码可抗干扰,且具备线性稳定性,能将MHOG转换到对特征维数不敏感的空间中得到稀疏特征,避免原特征空间中的冗余度大的缺陷,提高运算速度和运算效率。

WTA hash编码的步骤如图4所示,实际上是将向量X中的值随机排列,通过滑动窗口法扫描,将最大值保留,其他值设置为0,同时利用随机数组θ消除向量中元素的相关性,这就是本文所用的WMHOG特征提取方法。

图5所示为图2的例图经MHOG和WMHOG两种特征提取方法后的效果对比,分析发现,WMHOG特征比MHOG特征更为稀疏,降低了约17%。

3 特征选择

对EMSO提取的粗特征块的选择使用Adaboost算法[17],对WMHOG提取的精特征块使用贪婪算法[18]。

使用Adaboost算法选择粗特征先需构建弱分类器,由于人体的轮廓普遍存在一定的角度范围,对应的方向特征fn在人体轮廓的表征上具有较好的性能。因此对弱分类器的需求是在特征选择时将处于一定角度范围内的特征作为正例样本,这是选择Adaboost算法的主要原因。弱分类器的构建方法为:

式中,C(n)是粗特征经粗分类器分类之后的结果,fn是通过式(1)所得的EMSO方向特征。Tmin(n)、Tmax(n)为弱分类器的最小和最大角度阈值,阈值可使用贪婪算法获取。

WMHOG特征块选择使用贪婪算法,在其第t次求解过程中,由于局部最优解的优势,新加入的特征ft+1可进一步增大分类精度,整个求解过程是从待选特征集A中选出局部最优解的特征值加入到已选集S中,即:

式中,I(u;C)=∑Cp(C,f)log(p(C|f))为f的条件熵,p(C|f)为C样例正确的概率。这样经t次求解后,A、S的更新如下:

即从集合A中去除ft+1加入到集合S中,持续这一过程直到分类精度不增长或增长幅度小于一定阈值时为止。

4 目标检测

4.1 多视角检测

分类器训练使用级联Adaboost和线性SVM,共分四层,第一层全部视角样本共同训练单一模型,第二、三层分别使用3个、5个视角,前三层使用Adaboost,第四层使用SVM,其框架如图6所示。在人体目标检测时,对图像窗口进行逐一分类以判定图像中是否存在目标人体,并对其位置进行确定,当4层分类器都通过时判定存在目标人体,反之判定不存在目标人体。图6的分类器框架经过实验验证确定前三层只用3个级联就能实现较高的查全率和较快的检测速率,对第四层的SVM分类器,在超过128个精特征块可使SVM分类精度超过97%。

但是这种多视角检测中存在一定的问题,即人体的正面(0°)和侧面(90°)的样本易获取,但是获得中间角度(30°、45°、60°)的样本较困难,对此采取特征块位置线性平移的方法合成中间角度样本。由于人体的对称性完成0°到90°的样本获取即可,设特征块n的视角样本度数为D,对应的位置为XD(n),则可得0°,90°内的样本线性合成为:

式中α(n)为合成系数,由于不进行精确的姿态识别,因此可假定人体为圆柱体,可得α(n)为合成系数α(n)为:

类似地,块特征也可由式(16)获取:

式中FD(n)表示特征块n在D°的特征值,这样可实现通过正面样本及侧面样本获取中间各视角的样本从而完成分类器训练。

4.2 复杂背景处理

图像人体识别过程中复杂背景处理主要解决人体轮廓与背景图层灰度相似情况下检测目标出现空洞的问题[15]。因此在复杂背景存在的情况下,定义函数f(a,b):

式(17)中a(x,y)是当前帧在像素点(x,y)的像素值,b(x,y)是对应点的背景像素值,这样根据式(17)可知:当(x,y)是背景点时,f(a,b)=0,且f(a,b)分散分布;当(x,y)为人体目标区域内点时,f(a,b)≥0且f(a,b)集中分布。计算f(a,b)集中分布的范围即为目标人体区域范围。

4.3 遮挡处理

解决了复杂背景问题,还需解决其他目标或其他人体对人体目标遮挡的问题,在遮挡存在的情况下会使人体目标局部轮廓缺失导致分类错误[17],在此使用特征重装方法。先设是被遮挡的特征之一,可由式(18)合成:

式中f0m(n)是训练样本集中样本m的第n特征块,M是正例样本个数,wm是样本m的权值向量,wm的计算方法为:

式(19)是限定与遮挡人体相似度高的样本在样本重装时权值较大的基础上得出,fu(n)是需分类目标的未被遮挡特征,fum(n)是第m个样本的第n特征块且该特征块未被遮挡,最后对其进行归一化从而完成被遮挡样本块样本的重装再进行分类。

5 实验及分析

为对本文的人体检测算法进行验证,使用法国国家信息与自动化研究所的公共测试集INRIA行人数据库进行实验。该数据库是目前最常用的静态行人检测数据库,提供了原始的图片和相应的标注文件。训练时采用了2000正例样本和1000反例样本,反例样本主要是建筑、树干等和人体轮廓相似的圆柱形物体,其中正面和侧面视角的样本由人工划分形成,中间视角(30°、45°、60°)的样本能过多视角样本合成算法生成。最后使用测试集INRIA数据库进行实验,部分人体检测结果如图7所示。可以看出本文算法可以检测出大部分人体,图7(a)-(g)包含了复杂背景、与类人形圆柱体较为贴近、非正面或侧面多视角人体、多姿态人体等多种情况,本文算法都能成功检测,这是由于使用了复杂背景处理和特征重装成功检测出了中间复杂背景中有遮挡的人像。但在图7(h)和图7(i)中漏检了后方复杂背景下的人体目标,分析发现是WTA hash编码导致部分有用信息被删除从而无法检测出复杂背景下较小像素的遮挡人体目标。

算法性能定量分析比较使用单位图片误检/图片FPPI(False Positive per Image)条件下的漏检率,分别与常规的HOG特征提取检测[9]、HOG和局部二值模式HOG+LBP(HOG+Local Binary Pattern)相结合的方法[10]及多尺度HOG(MHOG)特征方法[11]相比较,其结果如图8所示。从图8可知,在相同FPPI的条件下本文的多尺度多视角算法的漏检率低于HOG、HOG+LBP、MHOG等方法,但在FPPI接近1的时候,本文算法的漏检率与MHOG逐渐接近,经分析这是由于WTA hash编码后部分有用信息被滤除导致漏检率增加。

上述各种算法在复杂背景下的检测效率如表1所示。由表1可知,本文的多尺度多视检测算法的检测率比HOG等算法高,检测时间比HOG等算法少得多,这主要是因为使用WTA hash编码后滤除图像特征中的冗余信息使图像特征变得较为稀疏,从而使后续算法较为迅速,降低了检测时间。

6 结语

基于多尺度空间边缘检测的研究 篇6

1 多尺度检测的概念

多尺度检测就是有效地组合利用多个不同尺度的边缘检测算子正确地检测出产生于一幅图像内的边缘.常用的多尺度边缘检测方法是,先分别用几个不同尺度的边缘检测算子检测边缘,再组合它们的输出结果以获得理想的边缘图。

多尺度方法随着多分辨率和小波理论的出现而逐渐发展起来的,窗口大小(或尺度)参数的自动调整是很难的,而应用多个尺度可以对此问题给出一个比较满意的解决,多尺度信号处理的目的不仅是为了辨识出信号中的重要特征,而且能以不同细节程度来构造对信号的描述,在高层次视觉处理任务中多尺度方法有着重要的作用。

2 多尺度边缘检测的方法

2.1 多尺度形态学边缘检测方法

在形态学边缘检测算子的基础上,综合形态膨胀和形态腐蚀,得到修正的边缘检测算子,以减轻图像边缘检测的模糊性;进行形态结构元素尺度调整,并综合各种尺度下的边缘特征,得到噪声存在条件下较为理想的图像边缘。首先用形态边缘检测算子进行图像边缘提取,在此基础上通过自适应方法对所获图像边缘进行修正,逐步调整结构元素窗口尺寸,达到有效增强模糊边缘并适当消除噪声影响的目的。

借助形态运算,下面引入图像边缘检测算子[2,3]:

定义1:设f(x,y)是一个定义在R2或Z2上的图像灰度函数,g(x,y)是一个定义在R2或Z2上的给定域;

由于式(1)是基于形态膨胀,所得到的图像边缘信号较弱,出现了图像的模糊边缘;式(2)是基于形态腐蚀,虽然所得到的图像边缘信号较强,但是相应地增强了噪声。

综合以上两种边缘检测算子,提出修正后的图像边缘检测算子:

对于一个给定的结构元素序列{gi|i=1,2,…},如果所有gi均有相同形状且尺寸随i增加而单调增大,则称序列{gi}为一个多尺度序列。对一个给定的结构元素序列,不同大小的结构元素可用于抽取在不同尺度上的特征。为了得到准确的边缘检测信息和有效克服噪声影响,必须合理地调节结构元素尺度的大小。首先取一正方形结构元素{gi|i=1,2,…n},gi的大小为(2i+1)×(2i+1)像素,式(6)多尺度边缘检测算子为:

形态多尺度边缘检测只作普通的加减运算及求最大最小运算,时间开销少,实验上它们所化的时间比大约是5/3。

2.2 多尺度自适应加权形态边缘检测方法

同样利用大小不同的结构元素提取图像边缘特征,多尺度形态学边缘检测对于最终边缘的合成,通常采用均值合成方法[4],虽然它能抑制图像噪声的影响,但没能发挥不同尺度下的不同抗噪能力和边缘检测精度大小不同的特性。针对此问题,根据图像的噪声及各个尺度的结构元对噪声的抑制能力的不同,自适应地确定相应的权值大小,然后再将这些不同尺寸下检测到的边缘图像用自适应确定的权值进行加权合成,可提取出较理想的边缘图像。[5,6]

采用的多尺度结构元素定义如下(假设B为有限结构元素):

n为尺度参数,B为十字形3×3结构元.按以上的多尺度结构元进行边缘检测得到的各尺度下的边缘图像后,再对得到的多尺度边缘检测图像进行合成运算,加权合成运算如下:

式中f'(x,y)为合成的新边缘图像;[k,l]为尺度n的取值范围;wn为各尺度下的权重;给出不同尺度下的权值wn如下算法:用膨胀得到的不同尺度的多结构元对图像进行开闭、闭开滤波,并分别求得不同尺度下的结构元开闭、闭开滤波的均值图像:

计算不同尺度下的图像标准差值Δn=|f-fn|和方差Δn2=|f-fn|2,各个不同尺度下的图像标准差值或方差的比例确定权值wn,即

2.3 基于直方图的自适应多尺度形态边缘检测方法[7]

尺度大小的选取因图像而异,且进行各尺度下的边缘图像合成运算时权值的选取不确定。而后又提出了一种多尺度数学形态学边缘检测算法,首先用形态边缘检测算子进行图像边缘提取,用不同尺度大小的结构元素分别检测出图像的边缘信息。由于各种不同尺寸下的边缘图像直方图分布不同,算法首先对各边缘图进行直方图配准,然后采用取极小值的方法自适应地对每个尺寸结构元检测得到的图像边缘进行融合,达到有效增强模糊边缘并消除噪声影响的目的。

具体步骤如下:

1)用不同尺度大小的结构元素分别检测出图像的边缘信息。选取有限个具有代表性的有限的结构元,对各个结构元进行膨胀,其尺度的选取n可根据具体的情况而定(一般取2~5)。对不同尺度的各个结构元进行多尺度的边缘提取。

2)自适应地对每个尺度结构元检测得到的图像边缘进行融合,从而得到合成边缘图像。对每个尺度结构元检测得到的边缘图像进行直方图配准。配准方法是,首先分析各个边缘图像直方图中第一个谷底位置,比较它们之间的关系,确定各个边缘图像的灰度拉伸系数,使得乘上该系数后,所有边缘图像的直方图第一个谷底位置相同。然后合成边缘图。

3 结果分析

如图1所示(a)是加了噪声的原图片,(b)是自适应加权形态边缘检测方法的结果,可以看出明显的边缘模糊,受到噪声的影响严重。(c)是直方图的自适应多尺度形态边缘检测方法结果,边缘非常的清晰,而且噪声基本剔除。

摘要:边缘检测一直是计算机视觉和图像处理领域的经典研究课题之一。该文综述了多尺度边缘检测技术:介绍了多尺度检测的基本概念;归纳了现有的各种多尺度形态学边缘检测方法。

关键词:边缘检测,多尺度空间

参考文献

[1]Lindeberg T.Edge detection and ridge de-tection with automatic scale selection.1966IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1996,465-470.

[2]龚炜,石青云,程民德.数字空间中的数学形态学——理论及应用[M].北京:科学出版社,1997.

[3]吴敏金.图像形态学[M].上海:上海科学技术文献出版社,1991.

[4]卢官明.一种计算图像形态梯度的多尺度算法[J].中国图像图形学报,2001,6(3):214-218.

[5]Bhabatosh Chanda,Malay K Kundu,Y Vani Padmaja.A Multi-scale Morphologic Edge Detection[J].Pattern Recognition,1998,31(10):1469-1478.

[6]杨述斌,彭复员,张增常.多尺度自适应加权形态边缘检测方法[J].华中科技大学学报:自然科学版,2002,10(30):87-89.

基于多尺度特征学习的阴影检测 篇7

阴影是许多图像的组成部分,有时候反映了物体形状、大小等重要信息,然而图像中的阴影会对图像的后续处理造成不利的影响。例如:在智能视频监控中,阴影会严重影响目标的跟踪。阴影检测率会直接影响阴影消除的效果,因此阴影检测也是近些年的研究热点之一。

目前阴影检测方法大体可以分为两类:基于模型[1,2,3]的方法和基于特征[4,5,6]的方法。基于模型的方法利用一定的先验信息建立光照模型来检测阴影;基于特征的方法根据阴影的色度、亮度等特征来识别和检测阴影。基于模型的方法通常需要利用多幅图像的先验信息进行建模,该类方法有一定的局限性,只适合于特定的场景。基于特征的方法不需要场景的先验知识,仅仅通过图像的特征检测阴影,时间复杂度较小。当阴影区被覆盖时,虽然亮度变低却仍然保留着一定的色度信息,依据这一特点,在阴影检测时往往将图像转换为亮度与色度相互独立的颜色空间[7,8]。基于色度的阴影检测方法计算量小,但是对噪声和光照比较敏感。近几年来,基于统计属性[9,10,11,12]的阴影检测方法受到了更高的关注。Zhu等[9]基于图像的可变特征和不可变特征、Lalonde等[10]基于图像的色彩特征和纹理属性、Jiang等[11]基于图像的色彩分割与照明估计、Guo等[12]基于成对区域,这类方法都采用条件随机场标识阴影区域。该类方法对不同的场景与不同光照条件具有较强的适应性,代表了当前的研究水平与未来的发展方向。但是该类方法都需要花费大量精力小心的设计这些特征。Zhu等[9]提取可变特征与不可变特征,这些特征用来训练一个分类器,该方法消耗资源大训练时间长。Lalonde等[10]使用了48维的特征向量,虽然增加特征维数能够达到很好的效果,但是阴影检测的时间大大的增长了。Jiang等[11]对Lalonde等[10]方法进行了改进,取得了更好的效果,却花费了更长的时间。Guo等[12]首先采用均值漂移的方法对图像进行分割,把提取的特征作为支持向量机(SVM)的输入建立分类模型。该方法对局部细节噪声较为敏感并且当场景比较复杂时大大增加了SVM的测试时间。

针对上述方法的缺点,本文提出一种新的多尺度特征学习的阴影检测方法。与上述基于统计属性的方法相比,本文方法是一种在场景中,通过特征学习的方法学习大部分相关特征,这些特征用来进行阴影检测。卷积神经网络CNNs(Convolutional Deep Neural Networks)[13]是人工神经网络的一种,已成为当前图像处理领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。它模拟人脑进人脑的机制来解释、处理图像等。因此,本文采用卷积神经网络进行特征学习。一个像素是否属于阴影区像素,不仅与像素自身的亮度、色度等特征有关,还与其周围相邻区域与不相邻区域有紧密的关系,多尺度(图像的拉普拉斯金字塔)的特征学习很好地解决了这个问题。条件随机场CRF(Conditional Random Fields)[14]是一种基于统计的模型。2001年,由John等人首次提出,可在给定全局条件的前提下,计算全局最优输出标记的条件概率。它是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料。卷积神经网络特征学习之后的后验分布反馈给条件随机场,条件随机场对图像进行标注达到阴影检测的目的。

1 自学习阴影检测框架

给定一副图像,本文在像素级别下检测和定位阴影。对于一个像素来说,不能简单地根据与周围相邻像素之间的关系来判断它是否属于阴影区像素。一个像素与其周围较远处不相邻的像素也有较为密切的关系。人眼能够根据图像中阴影区与其周围非阴影区的不同快速定位阴影。本文对输入的图像经过拉普拉斯金字塔变换,分别以确定的聚类中心为中心进行窗口提取达到考虑像素周围较远处区域的目的。合成训练样本后在卷积神经网络中进行训练,用小的测试集进行测试,最后产生的后验分布反馈给条件随机场,不同标签集合的交集形成阴影检测的结果。本文方法流程如图1所示。

1.1 确定聚类中心

超像素是指许多相似的像素点组合在一起,作为一个整体来处理,这个整体就称之为超像素。近年来,超像素已经被越来越多地应用于图像预处理过程中。超像素利用像素与像素之间特征的相似程度对像素进行分组,从而获取图像的冗余信息,在很大程度上降低了后续图像处理任务的复杂程度。SLIC算法[15]是一种思想简单、效率很高并且运行速度快的算法,通常只需迭代10次就完成聚类。该方法将彩色图像转换为CIELAB颜色空间和XY坐标下的五维特征向量,然后对五维特征向量构造度量标准,对图像像素进行局部聚类的过程。假设图像有N个像素,预分割为K个超像素,则每个超像素的平均像素数目为N/K,聚类中心间的近似距离为。该聚类方法是对k-means聚类算法的一种改进,为提高k-means算法的运算速度,在进行聚类时是以聚类中心的2S×2S正方形区域内搜索相似的像素,而不是在整张图像搜索。本文进行聚类时在聚类中心周围半径为S的区域内进行搜索,如图2所示。

在聚类中心点数目相同时,该方法能够减少重复计算的时间,因为圆形具有严格的几何不变性[16],确定的聚类中心为:

其中,lk、ak与bk表示坐标为(xk,yk)的像素点在CIELAB颜色空间下各通道的值,k∈[1,K]。

1.2 窗口提取与特征学习

输入图像经过拉普拉斯金字塔变换,以每个聚类中心为中心进行窗口提取,则对于坐标为(xk,yk)的像素点,此操作可以描述为:

其中,Ωk为所提取的图像块Ωk∈Ω,W(·)为窗口操作,t为提取窗口的大小,由于所选图像集阴影区域的不平衡性,采用合成少数类过取样算法[17]合成训练样本:

其中,Λ(·)为合成样本操作,Ο为样本集,样本集在卷积神经网络中进行特征学习。本文卷积神经网络结构如图3所示。

对于卷积层来说,上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每一个输出特征图可能是组合卷积多个输入的特征图:

其中,xjl和xil-1分别为当前层l和上一层l-1的特征图(下同),k是卷积核,f(·)是非线性激活函数,b为偏置,Mj代表输入特征图的一个选择。对于降采样层来说,有多少个输入特征图,就有多少个输出特征图,只是每个输出特征图都变小了:

其中,down(·)表示降采样函数,kjl为权值,神经元的非线性作用函数为f(x)=(1+e-x)-1。神经元的输出层:

对于式(6)j∈[shadow,n-shadow],卷积神经网络以一个图像块作为输入,经过训练之后得到一个后验分布。在本文中,池操作的步幅等于池邻域的均值,通过降采样层执行池操作有助于学习不变性的特征描述。全连接层工作原理是有一层隐藏层的多层传感器,这个隐藏层后边跟着一个逻辑回归的输出层,逻辑回归的输出层提供类的分布。图像转化为二值图像,二值输出变量的后验分布:

图像块训练之前先进行预处理,采用卷积神经网络可以把概率分布的模型PCNNs(Yi|Οk)定义为:

其中,θ(·)是预处理,F(·)是有5层隐藏层的卷积神经网络。预处理之后,通过在线学习(随机梯度下降),卷积神经网络进行有监督的训练。在训练过程中,梯度通过反向传播的方式计算,交叉熵损失函数被最小化[17]。采用交叉验证的方法确定训练参数,训练样本在训练之前被打乱,这是因为卷积神经网络对未知样本学习得更快。卷积神经网络的初值是从0均值的高斯分布中随机取样来初始化的。

卷积神经网络在训练过程的每个阶段用一个小的验证集来评估正在训练的网络,一旦验证集在执行时不能达到κ步,训练过程就停止(本文κ=5)。在验证集上表现好的网络被用来在图像库上进行测试,最初的学习率是试探性的选择能使误差收敛的最大学习率。

1.3 条件随机场

给定输入图像,阴影检测的任务实际上就是把整幅图像的像素分为了两类,也是对每一个像素进行标签的过程,一个像素要么被标记为阴影像素要么被标记为非阴影像素。这种二分类问题从有监督的特征学习中建立概率估计并提供给条件随机场。条件随机场定义在网格拓扑结构图上,图的节点对应于图像的像素,如式(9),条件随机场是对像素标签最常用的方法之一。由于训练空间(标签图像)的大小增加了计算似然函数梯度的难度,因此条件随机场的参数不能被简单的手工标签阴影区的最大似然估计来得到,采用一种最大化利润学习方法[18]来学习条件随机场的参数。把阴影检测定义为条件概率分布:

其中,ω是该模型的权值,Z(ω)是归一化函数,ν表示节点(比如单个像素),ε表示边(比如相邻像素),X表示整幅图像的像素。对吉布斯能量函数而言,上述分布形式为:

由式(7)与式(8)可知,存在两个隐函数:一元隐函数和二元隐函数。一元函数从卷积神经网络的概率估计得到:

二元函数由类转移隐函数和空间转移隐函数结合得到:

当Yi≠Yj时,否则如下:

其中,α和β通过在每个数据集上交叉验证得到,对随机变量Y∈ΓN,通过采用最大后验估计Y'来确定像素的标签,由于归一化函数Z(ω)不依赖与Y',这种估计转化为能量最小化问题:

根据Y'求标签集合SJ最后求交集:

2 结果与讨论

2.1 实验方案

为了验证提出方法的有效性和高效性,本文实验方案如下:

(1)图像库:本文实验图像库来源于文献[9]图像库(大部分阴影图像背景复杂,多为硬阴影,阴影面积小)和文献[12]图像库(大大部分阴影图像背景简单,多为软阴影,阴影面积大)。

(2)实验参数:本文聚类数目K取150,拉普拉斯金字塔J取5。实验条件为Intel(R)Core(TM)i3-2370@2.40 GHz处理器,2 GB内存,32位操作系统,Visual Studio2012开发平台编程实现。

K的值小于图像大小与样本大小的商,这样能够保证在窗口提取时能够提取每个超像素的大部分像素,从而能够得到更可靠的样本。而当K等于150时,对于图像库中的所有图像,窗口提取都能够满足条件。对于一些特定的实时领域,K的值需要简单的计算与测试确定。实验的精度并不随J的增大而增大,当J=5时,阴影的检出率最高,而当J>5时,阴影的检出率反而下降,因此J取5。

(3)实验方法:宏观上交叉训练,交叉测试;微观上选取9幅场景复杂度不同的图像进行测试。

(4)计算方法:

对于一副有阴影标签的图像来说,假设A表示阴影区像素的集合,B表示非阴影区像素的集合,A'、B'分别表示经过实验得到的阴影区与非阴影区像素的集合。阴影检测效果采用阴影检出率SD、阴影误检率SE来评价,TP计算方法如下(其中N(·)表示计算像素的数目):

2.2 实验结果

(1)宏观测试

本文采用在其中一个图像库上训练然后在另一图像库进行测试的方法,然后比较本文在不同图像集上所能达到的最高精度(阴影检出率SD)。在文献[9]图像库上进行训练,在文献[12]图像库测试的精度达到81.9%;而在文献[12]图像库上训练,在文献[9]图像库上测试的精度为79.8%。这是因为文献[9]图像库的图像场景比较复杂能够训练得到一个更好的网络。本文方法在文献[9]图像库与文献[12]图像库上测试达到的最高精度分别为90.71%与93.37%。由阴影检测计算公式可知:在相同条件下误检率相同时,阴影区的面积越大阴影的检出率相对较高,而文献[12]图像库的阴影区面积较大,因此本文方法在文献[12]图像库上取得较高的精度。

(2)微观测试

为了验证本文方法的场景适应性,选取了9幅场景复杂度不同的图像作为本位阴影检测结果的实例,如图4所示。其中第一排、第三排和第五排为源图像,第二排、第四排和第六排为阴影检测效果图。

定性上,从阴影检测的效果来看,本文方法能够很好地检测软阴影、硬阴影、自阴影以及场景非常复杂的阴影。(a)、(b)、(d)与(f)场景较为简单且无自阴影,但是(a)与(b)阴影多为软阴影,(d)与(f)阴影接近硬阴影;(c)、(d)、(g)、(h)与(i)都包含自阴影,其中(c)与(d)场景较为简单,(g)、(h)与(i)场景较为复杂,(g)与(h)为遥感图像,(i)为复杂的室外自然场景。实验表明,本文提出方法在各种不同场景下的图像的阴影检测效果较好,能够准确检测出由于遮挡产生的自阴影。

定量上,本文对选取的图像进行测试并将本文方法的阴影检出率与误检率和传统的方法进行比较,如表1、表2所示。

从表1与表2可以看出,本文方法阴影检出率较传统的方法高,阴影误检率较传统方法低。而SD与SE并没有完全的相关性,这与SD与SE的计算方法有关。传统方法阴影的检出率随场景的变化变化较大且检出率较低,而本文方法相对较为稳定且能够达到更高的检出率。

在训练资源的消耗上,文献[9]所采用的方法需要更大的内存(9 GB)和更大的时间消耗(大约10小时训练125幅图像)。本文的多尺度特征学习方法只需要2 GB内存,训练时间也更短(大约4小时能训练两个图像库全部的图像)。在实验中当用网络i的权值初始化网络i+1时(1<=i,i+1<=5),本文方法的训练时间能够缩短到2.5小时左右。文献[12]采用的支持向量机方法只适合小数据,卷积神经网络模拟人的可视域可以用多个卷积核映射出多个特征图,更适合图像像素的分类。当图像扩展到三维,或图像场景非常复杂,卷积神经网络的优势就体现出来了。就目前来说,图像越来越复杂,卷积神经网络的适应性越强。

3 结语

本文主要阐述了一种新的阴影检测方法,利用卷积神经网络进行特征学习,结合条件随机场对图像进行标签。该方法场景适应性强,在阴影面积较大、软阴影较多的图像中也取得了很好的效果,而且训练的时间也比现有的基于统计属性的方法大大缩短,阴影检出率也较现有传统的算法高。

多尺度测井分析方法的应用分析 篇8

关键词:多尺度分析,小波基,数据压缩

近些年来, 处理测井资料的方法有许多, 但是不断的得到推广的则是多尺度分析法, 导致关于多尺度分析法和测井信号方面的文章越来越多, 但是关于对选取小波基而进行分析和研究对比文章还不是很多。科学技术的不断发展, 也使得钻测井技术的应用越来越普遍, 对实时测量数据的传输需求越来越多, 而数据的压缩技术则为数据的快速传递等数据传输需求提供了可能[2]。本研究主要分析多尺度测井分析方法在测井方法中的应用价值, 具体如下:

1 多尺度测井分析方法

多尺度系统理论在上个世纪80年代后期形成, 多尺度系统理论是小波分析的一个核心内容。随着多尺度系统理论的不断发展, 多尺度分析方法将此前的正交基构造统一, 使得小波理论的进展发生了巨大的变化, 并且从中还提出了两种方式, 即多尺度分解和重构算法, 更加确立了小波分析的重要位置。

1.1 分析的概念

多尺度分析是把其中的函数x (t) 看做成函数中的极限, 并且被包含在函数L2 (R) 空间内。在空间内, 每个近似函数都逼近函数x (t) 的平滑, 从而使得近似函数能够在不同程度上被越来越细的近似函数所获得, 从而得出多尺度分析法。

1.2 分析时的思想观念

分析时会产生许多的信号, 需要把这些信号进行详细的分解, 信号被分置在粗尺度上时称为平滑信号, 被分置在细尺度上并且粗尺度上的信号已消失, 这时信号称为细节信号。其中, 小波变化是在不同尺度之间作为连接信号之用的桥梁, 这是多尺度分析方法的基本思想[4]。

2 小波基选取问题

小波基的选取问题是多尺度分析方法在应用过程中必须要考虑到的问题, 而对小波基的考虑应该从两方面进行考虑:小波基的具体应用和小波基的一般原则, 在考虑之前, 我们需要了解小波基的基本性质。

2.1 小波基的基本性质

(1) 紧支性的基本性质, 当支撑时的宽度越窄, 小波局部所展现出来的特性更好, 从而降低小波变换计算时的复杂性, 提高其计算的速度, 达到快速的实现。

(2) 正交性基本的性质, 多尺度分析法在选择小波基的必要条件就是正交性, 而严格规范的正交性可以对小波分解的系数精确重构问题起到积极的作用。

(3) 正则性的基本性质, 正则性是对小波函数的光滑程度的一种描述方式, 主要表现的是小波基的可微性, 当正则性的阶数越大时, 则说明其正则性越好, 当收集的速度越快时, 则表明领域能量就愈集中。

(4) 对称性的基本性质。对称性是指在对小波函数进行选择的时候, 应当尽量选择对称或反对称的函数, 这可以有效使多尺度的分解以及重构在进行中信号出现失真的情况, 信号不失真能够有效的获取到重构时高质量的信号, 具有重要的作用。

(5) 消失矩特性的基本性质。消失矩特性是指为提高衰减的速度, 而要求基函数必须要有一定的消失矩[5]。

2.2 常见的几种小波

在多尺度分析方法中, Bior2.2、Sym4、Coif4、Db4等几种小波是人们普遍认可的小波。

其中, Db4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为7, 其消失矩的阶数为4;

Bior2.2小波基为双正交, 但是没有对称性, 有正则性, 其支撑的宽度为分解、重构5, 消失矩的阶数为1;

Coif4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为23, 其消失矩的阶数为8;

Sym4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为7, 其消失矩的阶数为8。

3 多尺度测井分析方法的实例分析

多尺度测井分析方法的测井数据为地层真值经过低通的滤波器进行滤波, 从而得出准确的平滑数据, 由于薄层信息的高频分量被削弱, 至此才使得测井时能够得到平滑的数据曲线。

根据以上分析可以得出, 多尺度测井分析法的基本原则是“分频加权重构”, 它是通过数据曲线的信息来补充能量, 从而进行重构, 这样做的好处就在于能够恢复被削弱的薄层信息, 进而能够提高测井曲线的真值和纵向分辨率。

(1) 实例分析。为了更好的对多尺度测井分析方法能够提高测井曲线的分辨率的可信度进行验证, 特地选取了某井的GR测井曲线以及MSFL测井曲线进行频谱的研究处理分析。

对比发现, 测井曲线的低频含有成分很相近GR中的高频成分和MSFL对比之后发现, GR中的改频成分幅值更低。如此可以决定出, 分辨率较高的MSFL是标准的频谱, 而GR曲线中的所有高频段都是加权系数。为了能够得出更加可行的加权系数, 需将重构之后的曲线频谱和标准频谱进行相应的对比, 从而得出结论。

(2) 压缩数据。多尺度分析法在地震数据压缩的使用也是很广泛, 但用于测井数据方面的压缩则相对较少。近段时间随着钻井技术的不断发展, 实时测量的数据需要进行传输, 因此, 测井数据的压缩技术为数据的快速传输提供了更多的保证。

4 小结

多尺度分析方法的运用和小波基的最优选择都使测井曲线的纵向分辨率得到了很大的提升, 同时也提高了纵向分辨率作为精细评价时所提供的依据。多尺度分析法的数据压缩能力, 能够有效的帮助钻测井时进行的实时数据传输提供新的思路。

参考文献

[1]雷芬丽, 许平, 程武伟等.小波分析在测井数据融合处理中的应用[J].上海国土资源, 2013 (04) :87-90.

[2]雷芬丽, 许平, 程武伟等.小波分析在测井数据融合处理中的应用[J].工程地球物理学报, 2014, 11 (01) :77-80.

[3]刘唐伟.地下渗流模型多尺度有限元及参数估计方法[D].中国科学院大学, 2013.

[4]肖大志.基于常规测井资料小波多尺度分析的裂缝识别方法[J].工程地球物理学报, 2011, 08 (02) :216-221.

上一篇:慢性鼻窦炎鼻息肉下一篇:肝性脑病的临床护理