多尺度估计

2024-10-20

多尺度估计(通用7篇)

多尺度估计 篇1

0引言

由于三维影像可以带给受众更加逼真的临场感,在各领域中都得到了广泛的应用[1],市场潜力巨大。然而,三维视频制作成本高、技术难度大、现实周期长等问题,则限制了资源的供应,无法满足市场需求。为了解决这一矛盾,通过获取二维影像的深度信息,并利用该信息将现有二维影像三维化处理获得三维影像,即已成为解决三维显示内容不足的一个重要手段。该方案不但可以降低制作成本,缩短制作周期,还能够充分利用现有的影像资源避免资源浪费。自2003年,德国Christoph Fehn提出了基于深度图绘制DIBR( Depth - Image - based Rendering)[2]的三维图像生成方式后,深度信息提取已然成为实现二维影像三维化的关键技术之一。

场景深度信息是指在空间上场景对象与图像物理成像焦平面的实际距离。二维场景图像的纹理变化、纹理梯度、 颜色都能给人们提供良好的深度感知。通过比较一纹理区域在不同尺度下的位置、大小、方向,估算出纹理区域的相对位置关系,进而得到相应纹理区域的场景深度。Knorr等提出了利用图像纹理梯度线索来提取深度的方法[3]实现深度估计。对于室外场景的转换得到了较好的重建质量,但由于线索单一,对室内场景图像效果较差。Malic,Saxena[4,5]等人,根据景物对象在不同深度上存在着纹理及阴影差异,通过建立马尔科夫随机场模型,监督学习方法训练参数,从而估计图片场景深度。Derpanis等人则从时空方向能量对动态纹理进行描述[6],提出利用方向滤波器的能量响应对视频进行处理,按照不同的等级对运动的形式进行定向分析。

基于对纹理特征的研究及优化算法的总结,提出了一种基于多尺度纹理特征的最小二乘深度估计方法。该方法采用了纹理滤波器分别对图像的纹理梯度、纹理渐变、颜色进行滤波,用以捕捉图像不同尺度的纹理能量作为特征,通过训练得到纹理线索与场景深度间的关系参量,并利用该关系参量来估计待测样本的深度。

1多尺度纹理特征提取

二维图像是三维场景在二维平面上的投影。在投影过程中丢失了大量的三维信息,其中不仅包括深度信息,还包括真实物体的形状等几何信息。只有充分挖掘二维图像中残留的信息,才能重构三维场景。因此,通过构建多尺度模型,捕捉多尺度纹理特征实现二维图像的深度信息估计。

在研究中,以宏块为基本处理单位,通过计算图像中的所有宏块的深度值,获得整幅图像的深度信息。首先,将图像划分成固定大小的宏块; 然后,对于任一宏块构建多尺度模型; 最后采用滤波器模板对该多尺度模型中的每个宏块进行卷积,进而求得该宏块的多尺度纹理特征。

1.1多尺度模型构建

单目二维场景图像的局部特征并不能够完全正确地反映场景对象中某一宏块的深度值,因此需要引入与之相邻的局部特征或全局特征才能正确估计图像的深度信息。因此, 为了获得更多图像本质特征,引入了尺度空间的思想[7,8]。 构建如图1所示的多尺度空间模型,采用多尺度分析法获得二维场景的本质特征。

在观察物体时,随着物体和观察者之间的距离不断地变化,视网膜感知到的图像信息也是不断变化的,通过综合分析这些不同的视觉信息可以获得被观察物体的本质特征。 多尺度空间分析思想是根据人眼观察事物的这一特点,在图像信息处理过程中引入一个尺度参数( 如物体和观察者之间的距离) ,通过不断变化尺度参数获得在不同尺度下的图像信息,然后综合分析这些信息深入地挖掘图像的本质特征。 多尺度空间分析方法对于深度特征提取具有重大意义。如图1中,A0、B0、C0分别是三个尺度下的图像宏块。对于宏块A0,仅通过其本身特征来推断其深度信息是不可能的。 而B0、C0提供了不同尺度下的图像特征,通过综合分析这些全局信息可以更好地推断出宏块A0的深度信息。

在对图像中景物深度信息判断过程中,发现相邻宏块的特征对目标宏块的深度估计也具有很大贡献,可以约束相邻宏块之间深度的依赖关系。因此,将宏块A0、B0、C0的上、 下、左、右四个相邻宏块包含在多尺度模型中。这样不仅可以将与目标宏块直接相邻的宏块的特征引入深度判断,而且还可以将较远的宏块的特征引入深度判断。

最终构建了宏块A0的多尺度模型,共计5宏块/尺度 × 3尺度 = 15个宏块。

1.2纹理特征提取

纹理是一种反映图像中同质现象的视觉特征,体现了物体表面共有的内在属性,包含了物体表面结构组织排列的重要信息以及其与周围的联系[9]。在图像的分析中将描述这种灰度变化规律的数字特征称为图像的纹理特征。

纹理的变化在人眼视觉感知深度的过程中扮演着重要的角色[10]。图像纹理线索作为深度提取的主要因子之一, 在人眼视觉深度感知过程中发挥着关键性的功能主导作用。 随着深度的变化,图像纹理在视觉中的变化是很明显的。纹理分析方法广泛应用于视频图像恢复、图像增强、三维立体视频制作等。因此,采用Laws滤波器以及纹理梯度滤波器滤波的方式获得纹理特征。

由于Laws滤波器[11]检测均值( Level) 、边缘( Edge) 、斑点( Spot) 等诸多信息简单有效,至今为止仍被广泛用于分割与模式识别等领域。本文采用3阶Laws模板( 如图2所示) 对图像的灰度通道进行滤波,以获得图像的灰度纹理变化信息; 采用图2中第一个模板对图像的两个色度通道滤波,以获得色度通道的纹理变化信息。

纹理梯度侦测器是用于检测图像纹理方向的一组滤波器模板。图3中给出的是间隔为30°方向侦测器,将0 ~ 180° 的空间划分成6个方向,考虑到纹理方向不存在正向与反向之分,可以通过这组侦测器将纹理梯度具体归结到6个方向上来处理。

将上述9 + 2 + 6 = 17个滤波器Fn( x,y) ( n = 1,……, 17) 与图像宏块I( x,y) 卷积并求其能量。式( 1) 中,k = 1时为绝对能量,k = 2时为平方能量和。这样,每一个宏块获得34维特征向量。

再将多尺度空间模型与纹理特征提取方法相结合。即采用式( 1) 所示的方法,对于每个目标宏块i所建立的多尺度模型中的15个宏块,进行纹理变化、纹理梯度等特征的提取,最终获得34 ×15 =510维可以反映其深度信息的特征。利用这些特征,采用模式识别的概率模型来估计场景对象深度。

2基本算法模型

模式识别起源于二十世纪二十年代,随着计算机的出现和人工智能的兴起,在六十年代发展成为一门重要的学科, 并广泛应用于代数、矩阵论、概率论等其他领域。模式识别是研究图像或各种物理对象的分类与描述的实用性科学,是将每一具体事物正确地归入某一类别。可以说,模式识别是模式空间经过特征空间变换到类别空间的一个实现过程。

将深度估计引入模式识别,即把深度估计问题归为模式识别问题,深度即是离散的拟要识别的模式类。对训练样本集和待估计的测试样本集内图像分别进行特征的提取; 以贝叶斯原理为基础建立分类器进行分类决策模型; 然后,根据最小二乘方法训练模型参数,使得基于这种分类决策对被识别对象进行分类所造成的误差要尽量趋小; 最后,利用所得模型参数完成深度估计,生成待估计测试样本的深度图。

2.1基于模式识别方法的深度模型

利用模式识别分类方法,对已有的真实深度图像和二维场景图像进行监督训练,在本实验中参考Saxena的数学模型方法,将训练样本图像分成M × N个宏块单元,选取三个尺度的纹理能量作为训练样本集的纹理特征,并将训练样本同一行的纹理特征进行相关组合,构成特征矢量,研究样本集中场景图像深度与纹理能量之间的关系模型,模型数学表达如式( 2) 所示[12]:

这种算法是针对宏块的深度值属于每一类进行决策。 式中Z是归一化常数; xi是宏块i的特征矢量; di是宏块i的真实深度值。σr表示真实深度的方差,用来衡量深度对于纹理能量特征的不确定性。大多相片是由水平安装的相机拍摄,每行具有不同的布局。因此,对不同行r采用不同的参数( θr,σr) 。针对同一图像中不同行场景布局的不同,所需训练的行参数也不尽相同,并用 θr来表示每一行的参数矩阵,θr的估计是通过l( d) = logP( d | X; θr)的极大似然函数来获得。将其他参数看成已知,则 θr的最大似然估计即为求解线性最小二乘问题的真实结果。

2.2基于最小二乘的参量估计

最小二乘法是一种数学优化技术,通过最小化误差的平方和来寻找数据的最佳匹配函数,进而简便求得未知数据, 并使得这些计算数据与实际数据之间的误差平方和达到最小值。

利用最小二乘法的思想,根据估计深度值与真实深度值之差的平方最小来估计最优参数矢量 θr,满足式( 2) 中概率最大的估计深度值即为二维场景图像在三维场景中的最适深度。式( 2) 中,P表示满足二维图像宏块的深度值取值概率,因此通过确定式中P的最大值,就可确定该宏块最有可能的深度值。同时,又根据指数基本性质,可知若使得P取最大值,则需要满足式( 2) 中的取值为最小,并且式中,因此,就要使其中取值达到最小,此处可令:

那么满足关系式取值为最小,即需使:

根据矩阵的基本性质,利用最小二乘方法,对式( 4) 求导可得:

为满足式( 4) 中I取最小值,令,则:

从而得出二维场景图像的纹理特征与深度之间的关系参量:

2.3深度估计

由式( 7) 得知,参数矩阵 θr与纹理特征xi有着直接的关系。如前所述,每个宏块的纹理特征xi都是510 × 1维特征向量,参数矩阵 θr则为1 × 510的特征矩阵。在进行深度估计时,可以认为深度di是宏块i的纹理特征矩阵的非线性组合。这样,参数矩阵 θr就是不同的权值组合,每一权值就是其相应的纹理特征对深度的影响程度,进而得到深度值如式 ( 8) 所示:

3实验结果与分析

在Matlab2011b环境下通过仿真验证方法的有效性。选取400幅1 704* 2 272像素的二维图像及其真实深度图为训练集,133幅1 704* 2 272像素的二维图像及其真实深度图作为测试样本集。场景中包括人造环境( 楼房,街道等) , 自然环境( 森林,灌木丛等) 。

试验中,为了权衡由宏块大小所带来的训练速度与深度的统计特性的显著性之间的矛盾,将图像分成17 × 32像素的宏块。实验结果如图4所示,其中( a) 为原始图像、( b) 为本方法得到的二维场景图像深度估计结果、( c) 组图像是激光扫描设备得到的二维场景图像的真实深度图像,深度范围是在0 ~ 81m,对于超过81m的深度都将记为81m。

4结束语

本文中,提出了一种基于多尺度纹理特征的最小二乘深度信息估计方法。该方法通过建立多尺度模型、采用了纹理滤波器对图像的纹理梯度、纹理渐变、颜色进行滤波,捕捉图像不同尺度的纹理能量作为特征,并通过训练得到纹理线索与场景深度间的关系参量,该关系参量可用来估计待测样本的深度。

实验结果表明,该方法可以获得较好的深度信息提取效果,且对场景结构及空间布局要求较低。但对于纹理轮廓不明显,深度值高度接近的图像,很难得到一个理想的深度图。 因此,在未来的研究中将重点解决这个问题。首先,在深度特征提取方面,可以尝试使用其他特征,并且可尝试结合其他特征不同的特点,分配不同的权重。其次,在模式识别方法模型方面,可以尝试更好的方法来研究特征和深度信息之间的关系,建立不同的更加有效的模型。

多尺度估计 篇2

设随机变量X服从两参数复合Rayleigh分布,相应的概率密度函数和分布函数分别为:

f(x;θ,λ)=2θλθx(λ+x2)-(θ+1);x>0,θ,λ>0 (1)

F(x;θ,λ)=1-λθ(λ+x2)-θ;x>0,θ,λ>0 (2)

其中θ为尺度参数,λ为形状参数。

1最大似然估计

X1,X2,…,Xn为来自两参数复合Rayleigh分布式(1)的容量为n的一个简单随机样本,(x1,x2,…,xn)为的样本观测值。则给定下参数θ的似然函数为:

L(θ)=i=1nf(xi;θ)=i=1n2θλθxi(λ+xi2)-(θ+1)=2nθnλnθi=1nxii=1n(λ+xi2)-(θ+1)(3)

相应的对数似然函数为:

lnL(θ)=nln2+nlnθ+nθlnλ+i=1nlnxi-(θ+1)i=1nln(λ+xi2)(4)

从而似然方程为:

lnL(θ)θ=nθ+nlnλ-i=1nln(λ+xi2)=0(5)

于是参数θ的最大似然估计为:

θ^=nΤ(6)

式(6)中Τ=i=1nln(1+Xi2λ)~Γ(n,θ)

注1:由文献[8],我们有Τ=i=1nln(1+Xi2λ)~Γ(n,θ)。从而T的概率密度函数为:

fΤ(t)=1Γ(n)tn-1e-θtt>0(7)

则有EΤ-1=θn-1,且易知T为参数θ的完全充分统计量,从而尺度参数θ的最小方差无偏估计为[9]:

θ^UΜVU=n-1Τ(8)

2Bayes估计

以下均设X1,X2,…,Xn为来自复合Rayleigh分布式(1)的容量为n的一个简单随机样本,Τ=i=1nln(1+Xi2λ)。本文我们感兴趣的的损失函数为平方误差损失函数:L(θ^,θ)=(θ^-θ)2和LINEX损失函数[10]:

L(Δ)=ecΔ-cΔ-1,c0(9)

式(9)中Δ=θ^-θ,θ^为参数θ的估计, c为损失函数的形状参数,且在LINEX损失下,参数θ的Bayes估计为:

θ^BL=-1cln[E(e-cθ|X)](10)

定理2.1设X=(X1,X2,…,Xn)为来自复合Rayleigh 分布式(1)的容量为n的简单随机样本,x=(x1,x2,…,xn) 为相应的样本观测值, tT的观察值,并设参数θ的先验分布为伽玛分布Γ(α,β),则

(i)在平方误差损失函数下,参数θ的Bayes估计为:

θ^BS=n+αβ+Τ

(ii) 在LINEX损失函数下,参数θ的Bayes估计为:

θ^BL=n+αclnΤ+β+cΤ+β

证明 设参数θ的共轭先验分布为伽玛分布

Γ(α,β)

即相应的概率密度函数为:

π(θ;α,β)=βαΓ(α)θα-1e-βθ; θ>0,α,β>0。

由式(3)及Bayes 定理,参数θ的后验密度函数为:

h(θ|x)∝l(θ|x)π(θ;α,β)∝

θne-θtθα-1e-βθθn+α-1e-(β+t)θ (11)

从而θ的后验分布为Γ(n+α,β+t)。

则(i)在平方误差损失函数下,参数θ的Bayes估计为其后验均值,从而θ的Bayes估计:

θ^BS=E(θ|X)=n+αβ+Τ

(iii)由式(11)有

E(e-cθ|X)=0+e-cθ(β+Τ)n+αΓ(n+α)θn+α-1e-(β+Τ)θdθ=(β+Τ)n+αΓ(n+α)Γ(n+α)(β+Τ+c)n+α=(Τ+βΤ+β+c)n+α

于是在LINEX损失函数下,参数θ的Bayes估计为:

θ^BL=-1clnE(e-cθ|X)=n+αclnΤ+β+cΤ+βc0

3数值模拟例子和结论

利用Monte Carlo数值模拟一组来自参数θ=1.5和λ=2的复合瑞利分布式(1) 容量为n=21的样本(见表1)。

利用公式Τ=i=1nln(1+Xi2λ)T=10.978 3,从而可以计算出尺度参数θ的各种估计值(见表2)。

从表2以及大量的数值模拟可以得到如下结论:

(i)给定合适的先验参数值,尺度参数θ的Bayes估计会比最大似然估计和最小方差无偏估计的估计结果更加准确;

(ii)随着样本容量的增大,这几种估计值都越来越接近参数真值.

摘要:基于完全样本讨论了复合Rayleigh分布尺度参数的估计问题。在平方误差损失、LINEX损失函数下导出了复合Rayleigh分布尺度参数的Bayes估计。给出了Monte Carlo数值模拟例子,将得到的估计与最大似然估计进行比较。

关键词:最大似然估计,Bayes估计,平方误差损失函数,LINEX损失函数,复合,Rayleigh分布

参考文献

[1] Bekker A,Roux J,Mostert P.A generalization of the compound Ray-leigh distribution:using a Bayesian methods on cancer survival times.Communications in Statistics-Theory and Methods,2000;29(7):1419—1433

[2] Al-Hussaini E K.Predicting observables from a general class of distri-butions.Journal of Statistical Planning and Inference,1999;79(1):79—91

[3] Abushal T A.Estimation of the unknown parameters for the com-pound Rayleigh distribution based on progressive first-failure-censoredsampling.Open Journal of Statistics,2011;1:161—171

[4]王炳兴.Burr Type XII分布的统计推断.数学物理学报,2008;28A(6):1103—1108

[5] Kundu D.,Hatem H.Bayesian inference and prediction of the inverseWeibull distribution for Type-II censored data.Computational Statis-tics and Data Analysis.2010;54:1547—1558

[6]王琪,阳连武.对称熵损失函数下一类分布族参数的Bayes估计.科学技术与工程,2011;11(22):5241—5243

[7]王亮,师义民.逐步增加II型截尾下比率危险率模型的可靠性分析.数理统计与管理,2011;30(2):315—321

[8]任海平.熵损失函数下一类广义分布族参数估计的容许性.西北师范大学学报(自然科学版),2010;46(6):19—22

分层多尺度建模-计算方法 篇3

1 基本假设

我们所考虑的材料结构都被假定为宏观上足够均匀, 但在微观上是不均匀 (异质) 的 (以可区分的组成物来说, 例如夹杂、晶粒、界面及空洞) , 如图1所示。

由于此细观尺寸比分子尺寸要大得多, 所以我们可以将每种组成相当做连续介质来看待。与此同时, 以尺度区分的准则来说, 细观尺寸又要比宏观试样的特征长度或宏观下载荷的波长要小得多。

目前大部分的多尺度方法都假定材料具有周期性的细观结构, 即认为整个宏观结构件都由空间单胞重叠而成。目前, 有些学者采用了更加合理的假设:局部周期假设。即在宏观上不同的点相应的细观结构可以不同, 而在宏观点周围一小块部分细观形态是重复的。局部和整体周期性的概念示意图如图2所示。笔者采用的是第一种假设。即整体周期性假设。

在此方法中, 每一个宏观材料点的变形 (梯度) 张量FM需要先计算出来。这个材料点的变形张量FM参与构建RVE的边界条件。然后求解RVE的边界值问题, 宏观的应力张量PM就可以通过相应RVE的应力场的体积平均来得到。因此, 在宏观材料点上的变形 (应变) -应力数值关系就很容易得到了。方法流程如图3所示。

2 细观尺度上的问题说明

材料细观结构的物理和几何特征由代表性体积单元RVE来确定。一个典型的二维RVE如图4所示。实际上对RVE的选取是一项十分复杂的工作:

RVE尺寸必须足够大来代表材料的细观结构, 同时RVE尺寸又要足够小来进行更加效率的建模和计算。在文献[2,3,4,5]中详细说明了代表性体积单元RVE的概念和构建。这里假定一个合适的RVE已经建好。

给宏观材料点指定的RVE, 已知RVE的初始状态向量为X (在参考体积V0范围内) , 当前位置向量为x (在当前体积V) , 细观结构变形梯度张量表示为:Fm= (∇0mx) c, 其中∇0m是关于所参考微观结构的梯度算子;c表示共轭。

如图4所示, 此RVE处于一个状态, 在数学上反映为关于柯西应力张量σm或者关于第一Piola-Kirchhoff应力张量Pm=det (Fm) σm (Fmc) -1的平衡方程式, 其表达式为 (不考虑体力) :

∇m·σm=0 V中 或

∇0m·Pmc=0 在V0中 (1)

其中∇m是关于当前单胞细观结构形状的梯度算子。

各细观组成物的力学特征由各自的本构关系来描述, 现对各细观组成物指定时间相关的应力-应变关系:

Pm (α) (t) =RP (α) {Fm (α) (τ) , τ∈[0, t]} (2)

其中t表示当前时间, undefined为可区分的细观组成物的数量 (例如基体、夹杂等) 。

然后指定位移边界条件, 变形状态下RVE上一个点的位置向量可表示为:

x=FM·X (X在Γ0上) (3)

其中Γ0为RVE上未产生变形的边界。

3 宏-细观尺度耦合

使用的是位移边界条件, 假定宏观变形张量FM为细观变形张量Fm的体积平均:

undefined

现在验证位移边界条件 (3) 是否满足式 (4) , 把式 (3) 代入式 (4) , 然后使用散度定理∇0mX=I。

undefined

=FM (5)

4 应用实例

镍基超合金广泛应用于航空、发电站等领域, 尤其是发动机涡轮叶片等热端部件。

4.1 缺口试样拉伸实验的有限元建模

缺口试样拉伸实验主要用于对金属材料塑性损伤和断裂的研究。圆形缺口试样示意图如图5所示, 单位为mm。

使用分层多尺度方法进行此材料拉伸实验的有限元模拟, 考虑到试样是绕中心线轴对称的, 所以使用轴对称单元进行二维分析。试样的二维几何模型及网格划分如图6所示。

由于试样采用镍基超合金, 此材料为多晶体材料, 其细观结构的几何模型和网格划分如图7所示。二维多晶体的几何模型构建参见文献[5,6]。

单元类型上, 选择一阶常规单元, 不使用减缩积分。最后的模型中, 二维网格单元总数为343。关于单元的详细信息见表1。

4.2 材料定义和边界条件设置

缺口试样采用某镍基合金的材料数据, 宏观材料参数见表2。

微观结构采用晶体粘塑性本构模型。下面简要列出其弹性本构方程,

undefined

其中左端是以中间构形为基准状态的Kirchhoff应力张量τ的Jaumann导数。L为刚度张量。

镍基合金各组成相得流动法则和硬化规律方程参见文献[7]的晶体塑性理论部分。

4.3 计算结果

宏观试样分析和细观结构分析的有限元分析结果如图8所示, 图8 (a) 为宏观试样在拉伸载荷下的最大主应变分布, 图8 (b) 是在细观尺度下RVE的最大主应变分布。由图可以看出, 试样在缺口底部的应变量最大, 其值为0.3789。细观结构进行位移继承后得到的最大主应变结果为0.3871, 两者差异2.16%。这在计算缺口部位应变能和疲劳强度的时候相差是巨大的。

引起细观结构应变结果比宏观分析要大的原因可能是由于细观尺度下晶粒大小、晶体学取向等的影响[8]。因此, 为了要获得这种影响的机理进行详细的多尺度分析是必要的。

5 结论

首先提出了多尺度建模方法, 然后讨论了此方法的可行性, 最后将此方法应用到圆形缺口试样拉伸实验的有限元模拟。完成了缺口试样从宏观到细观的跨尺度计算。得到了如下启示:

(a) 宏观 (b) 细观

1) 从宏观试样的分析结果中我们知道在缺口底部会出现应力应变集中, 一般把此区域称为危险区域, 选用此区域的单元作为宏-细观跨尺度计算的连接点;

2) 传统的宏观计算由于没有考虑细观因素的影响, 可能会导致错误的结果, 所以进行考虑细观结构影响的宏-细观的计算是必要的。此方法已经成功应用于某镍基合金的跨尺度分析。

参考文献

[1]V.Kouznetsova, Computational homogenization for themulti-scale analysis of multi-phase materials[D], Eindhoven University of Technology, 2002.

[2]J.Zemanand, M.Sejnoha, Numerical evaluation of effec-tive elastic properties of graphite fiber towimpregnated bypolymer matrix[J], J.Mech.Phys.Solids, 2001, 49:69-90.

[3]Z.ShanandA.M.Gokhale, Representative volume elementfor non-uniform micro-structure[J], Comput.Mater.Sci, 2002, 24:361-379.

[4]C.Huet, Application of variational concepts to size effectsin elastic heterogeneous bodies[J], J.Mech.Phys.Sol-ids, 1990, 38 (6) :813-841.

[5]黎倪.材料微观组织结构的有限元模拟[D].兰州理工大学材料科学与工程学院, 2005.

[6]刘玉振.基于Abaqus的材料微结构有限元计算的后处理研究[D].兰州理工大学材料科学与工程学院, 2008.

[7]王自强, 段祝平.塑性细观力学[M].北京:科学出版社, 1995.

多尺度估计 篇4

旋转机械在工业领域中的使用十分广泛, 振动故障是旋转机械各类故障中出现频次较高, 后果较为严重的类型之一。在旋转机械振动信号的各类参数图形中, 存在着大量反映设备运行状态的信息, 如二维幅频或相频特性曲线、小波图、趋势图、三维谱图、三维阶比图等。通过分析图形信息实现对旋转机械的状态监测是目前该领域的研究热点[1,2,3,4]。

在旋转机械故障诊断中, 振动信号参数图形的有用信息没有得到很好的利用, 这主要是由于施工环境较为复杂, 噪声干扰严重, 参数图形的边缘特征提取困难所致。数学形态学的主要研究对象是图像的形态特征, 此类特征可通过某种结构元素的形态与图像相应形态的对比方式来确定, 以此完成对图像的分析、滤波、识别、边缘检测、分割和重建等处理过程[5]。使用数学形态学相关方法分析处理旋转机械振动信号参数图形时, 可通过调节结构元素尺度来剔除环境噪声等干扰信息, 有效提取参数图形的边缘特征, 为进一步的故障诊断扫清障碍。

为此, 本文在文献[1]实验的基础上, 根据数学形态学Top-Hat变换和Bottom-Hat变换理论, 对旋转机械振动信号参数图形进行多尺度滤波增强处理;通过多结构元边缘检测方法对滤波处理后的旋转机械参数图形进行边缘检测。

1 数学形态学的基本原理

数学形态学的基本原理是通过一整套的变换来描述图像的基本特征和结构。数学形态学最基本的2种变换是腐蚀和膨胀, 其他变换都是由这2种变换的组合来定义的[6]。

1.1 形态学腐蚀运算、膨胀运算

设A为待处理的灰度图像, B为结构元素, 则结构元素B关于图像A的腐蚀与膨胀运算定义为

其中, DA和DB分别是A和B的定义域, 位移参数则必须包含在灰度图像A的定义域内。

腐蚀运算可以消除图形中的小成分, 可从内部对图形进行滤波;膨胀运算可以填充图形边缘处小的凹陷部分以及图形中比结构元素小的孔洞, 可从外部对图形进行滤波[7]。

1.2 形态学开运算、闭运算

形态学开运算、闭运算分别定义为

开运算在纤细处分离物体和平滑较大物体边界, 具有消除散点、毛刺和小桥等细小物体的作用;闭运算连接两个邻近的区域和平滑边界, 具有填充物体内细小孔洞的作用[8]。

1.3 形态学变换

形态学Top-Hat变换是对灰度图像做减去其开运算结果处理, 该变换可以提取亮度较高的背景中的较暗区域;形态学Bottom-Hat变换是对灰度图像的闭运算结果做减去原始图像处理, 该变换可提取亮度较低的背景中的较亮区域。形态学变换可用来提取目标图像中尺度小于结构元素的峰值和谷值[9]。

Top-Hat变换定义为

Bottom-Hat变换定义为

2 多尺度滤波增强处理

形态学腐蚀、膨胀、开、闭4种运算中的1种或2种串联或并联的组合就是形态学滤波运算。多尺度形态学滤波增强处理是通过不同尺寸的结构元素多次对图像进行滤波的, 其中多尺度开闭滤波在消除噪声、保持图像细节和提高信噪比等方面优于多尺度腐蚀膨胀滤波, 从而在一定程度上优化了灰度图像的有用信息, 令后续边缘检测结果更加真实可靠, 因此在形态学滤波中应用较多。

多尺度结构元素定义为

其中, B为十字形3×3结构元素, n为滤波尺度, 式 (7) 含义即为大尺度结构元素由小尺度结构元素多次膨胀得到。

为了得到足够平滑的图像, 本文采用最大尺度的结构元素Bn对图像进行多尺度开闭滤波增强处理, 其表达式为

其中, 权值ω对最后的滤波增强结果有较大影响, 一般取为0.5, 本文根据滤波增强处理结果的优劣, 取0.3。

图像经过多尺度开闭滤波增强处理后得到足够平滑的低频图像, 为获得更全面的有用信息, 还需提取图像的高频细节信息。在多尺度滤波增强处理方法中, 由于噪声在经小尺度结构元素处理的图像中出现几率较大, 并且随着尺度的增加其影响逐渐消失[10], 故本文选用带有修正系数的Top-Hat变换 (FT (i) ) 和Bottom-Hat变换 (FB (i) ) 来提取图像的高频细节信息。为减小噪声对图像的影响, 修正系数设定为公比为0.5的等比数列, 此过程完成了不同尺度间小尺度图像特征的平滑处理, 具体的表达式如下:

由多尺度开闭滤波增强处理的图像最终由三部分组成:第一部分是图像经最大尺度结构元素开闭滤波增强以后生成的低频平滑图像, 该部分包含图像中的大尺度图像信息;第二部分是提取比该滤波增强尺度还小的亮点图像高频特征;第三部分是提取比该滤波增强尺度还小的暗点图像高频特征。至此, 一幅灰度图像经多尺度滤波增强处理后生成的图像为[11]

3 多结构元边缘检测算子

在图像边缘检测处理中存在着多种梯度, 若在某一像素点处梯度值大, 则表示在该像素点处图像的灰度值变化迅速, 从而认定该点可能是图像的边缘点。数学形态学边缘检测方法主要是利用形态学梯度来完成图像的边缘检测。若将数学形态学的腐蚀、膨胀、开、闭等基本运算用于图像处理, 可构造出合适的形态学梯度算子 (经典边缘检测算子) 用于图像的边缘检测[12]。

腐蚀型边缘检测算子:

膨胀型边缘检测算子:

膨胀腐蚀型边缘检测算子:

上述3种形态学边缘检测算子是一种非线性的差分算子, 这些算子容易实现, 在实际中有一定的应用。但是, 这些算子对噪声都很敏感, 不能在保持较高检测精度的同时又不损失抗噪性能。由于旋转机械振动信号中普遍存在噪声, 虽然已经过多尺度滤波增强处理, 但仍有少量残留, 而且噪声信号和参数图形的边缘又均为频域中的高频分量, 因此, 为了更好地提取旋转机械振动信号参数图形的边缘特征, 应选择抗噪性能优于经典边缘检测算子的方法对参数图形进行边缘检测。根据腐蚀、膨胀、开、闭4种运算抑制噪声的相关特性, 本文对式 (12) ~式 (14) 做如下改进。

抗噪腐蚀型边缘检测算子:

抗噪膨胀型边缘检测算子:

抗噪膨胀腐蚀型边缘检测算子:

数学形态学边缘检测方法不仅与所使用的边缘检测算子有关, 还与结构元素自身特点密切相关, 如大小、方向、形状等。在边缘检测过程中, 不同结构元素对图像不同边缘细节信息的敏感性各不相同, 一种结构元素只能提取图像的一种边缘信息, 这不利于保持图像边缘的有用信息。因此, 应尽量选用具有不同特征的结构元素对图像进行边缘检测, 让每个结构元素都发挥作用, 提取出具有其自身特征的边缘信息, 这样可以充分保持图像的各种边缘信息, 达到既能检测出图像的各种边缘纹理, 又能抑制噪声的目的[13]。本文利用抗噪膨胀腐蚀型边缘检测算子 (式 (17) ) 构造多结构元边缘检测算子, 其表达式如下:

其中, B1、B2、B3为结构元素, 尺寸固定不变 (3×3正方形) , B1, B2可取为同一种结构元素, 也可取为不同的结构元素。

4 多尺度多结构元边缘检测仿真

为验证多尺度多结构元边缘检测方法的正确性与有效性, 本文选取结构元素B1=[1 2 1;2 62;1 2 1], B2=[0 1 0;1 1 1;0 1 0], B3=[1 0 1;0 1 0;1 0 1], 对含有5%椒盐噪声的Lenna灰度图像进行多尺度多结构元边缘检测, 其中多尺度滤波增强处理使用结构元素B1作为初始结构元素, 滤波尺度n取4, 多结构元边缘检测算子使用结构元素B1、B2、B3进行检测。图1a为原始灰度图像, 图1b为边缘检测结果。从图中可以看出:多尺度多结构元边缘检测方法滤除了Lenna图像中的椒盐噪声, 检测出的图像边缘轮廓清晰、纹理明确, 信噪比有所提高。该方法边缘检测效果优于经典边缘检测算子边缘检测效果, 更适用于含有噪声污染图像的边缘检测。

5 旋转机械参数图形边缘检测实例

5.1 实验

旋转机械故障模拟实验在600MW超临界汽轮发电机组轴系试验台上完成, 分别进行了转子正常、转子不对中和轴承松动故障的实验。试验台主要包括5个部分, 即发电机组轴系、润滑系统、动力系统、供气系统和信号采集分析系统。其中发电机组轴系由9个轴承5跨组成;润滑系统用独立的油路系统对各个轴承供油, 每个轴承座均安装BENTLY3000 XL8 mm电涡流传感器, 输出为7.87V/mm;动力装置采用55k W变频电机经过FRENIC变频器输出转速和功率, 并采用HG0G-C2型变速箱, 试验台详细结构布置如图2所示。在实验过程中, 采样时间为0.64s, 采样频率为转速的32倍, 实验时转子最高工作转速为3200r/min, 采集的信号经A/D卡传送到计算机, 为后续的数据分析做准备[7]。

实验中对转子正常、转子不对中及轴承松动故障, 每种采集40个启停机样本, 共计120个。首先将每个原始振动信号的采集样本进行处理, 生成各自的振动三维谱图, 如图3所示。

5.2 多尺度多结构元边缘检测

根据三维谱图倍频特征明显的特点, 将频率作为横轴, 转速作为纵轴, 像素点灰度值作为该转速下、该频率下幅值的大小, 将其转化为二维灰度图形, 结果如图4所示。灰度图中明显的竖线为倍频线, 与三维谱图中的倍频线相对应。

为了有效地提取旋转机械振动信号参数图形的边缘特征, 本文对图4各种状态下的参数图形进行量化、直方图均衡化等预处理, 选取结构元素B4=[1 3 1;3 5 3;1 3 1], B5=[0 1 0;1 1 1;0 10], B6=[1 0 1;0 1 0;1 0 1], 应用上述多尺度多结构元边缘检测方法对其进行边缘检测。其中多尺度滤波增强处理使用结构元素B4作为初始结构元素, 滤波尺度n取4;多结构元边缘检测算子使用结构元素B4、B5、B6进行检测, 最终的多尺度多结构元边缘检测结果如图5所示。从图5可以看出:旋转机械振动信号参数图形经多尺度多结构元边缘检测处理后, 噪点大幅降低, 环境污染噪声基本被滤除干净, 有用信息得到保持的同时信噪比大幅提高, 边缘鲜明, 轮廓清晰, 充分保持了图形的细节特征。至此已说明多尺度多结构元边缘检测方法能够有效地提取旋转机械振动信号参数图形的边缘特征, 具有较强的抗噪声干扰能力, 适合在环境比较复杂、噪声污染较为严重的情况下对旋转机械实施状态监测。

6 结论

(1) 依据数学形态学多尺度图形处理方法, 结合Top-Hat变换和Bottom-Hat变换处理方法, 选取合适的结构元素, 在对旋转机械振动信号参数图形进行有效滤波的同时, 可以保持图形的高频细节特征, 增强参数图形的有用信息, 提高参数图形的信噪比。

(2) 运用多结构元边缘检测算子检测旋转机械振动信号参数图形的边缘, 能够有效剔除多尺度滤波增强处理过程残留的噪点信息, 提取的参数图形边缘特征质量较高。

(3) 在实际应用中, 结合旋转机械振动信号参数图形及其噪声的特点, 多尺度多结构元边缘检测方法可以较好地解决边缘检测精度与抗噪声性能的协调问题, 为基于振动三维图形的旋转机械故障诊断奠定基础。

基于多尺度空间边缘检测的研究 篇5

1 多尺度检测的概念

多尺度检测就是有效地组合利用多个不同尺度的边缘检测算子正确地检测出产生于一幅图像内的边缘.常用的多尺度边缘检测方法是,先分别用几个不同尺度的边缘检测算子检测边缘,再组合它们的输出结果以获得理想的边缘图。

多尺度方法随着多分辨率和小波理论的出现而逐渐发展起来的,窗口大小(或尺度)参数的自动调整是很难的,而应用多个尺度可以对此问题给出一个比较满意的解决,多尺度信号处理的目的不仅是为了辨识出信号中的重要特征,而且能以不同细节程度来构造对信号的描述,在高层次视觉处理任务中多尺度方法有着重要的作用。

2 多尺度边缘检测的方法

2.1 多尺度形态学边缘检测方法

在形态学边缘检测算子的基础上,综合形态膨胀和形态腐蚀,得到修正的边缘检测算子,以减轻图像边缘检测的模糊性;进行形态结构元素尺度调整,并综合各种尺度下的边缘特征,得到噪声存在条件下较为理想的图像边缘。首先用形态边缘检测算子进行图像边缘提取,在此基础上通过自适应方法对所获图像边缘进行修正,逐步调整结构元素窗口尺寸,达到有效增强模糊边缘并适当消除噪声影响的目的。

借助形态运算,下面引入图像边缘检测算子[2,3]:

定义1:设f(x,y)是一个定义在R2或Z2上的图像灰度函数,g(x,y)是一个定义在R2或Z2上的给定域;

由于式(1)是基于形态膨胀,所得到的图像边缘信号较弱,出现了图像的模糊边缘;式(2)是基于形态腐蚀,虽然所得到的图像边缘信号较强,但是相应地增强了噪声。

综合以上两种边缘检测算子,提出修正后的图像边缘检测算子:

对于一个给定的结构元素序列{gi|i=1,2,…},如果所有gi均有相同形状且尺寸随i增加而单调增大,则称序列{gi}为一个多尺度序列。对一个给定的结构元素序列,不同大小的结构元素可用于抽取在不同尺度上的特征。为了得到准确的边缘检测信息和有效克服噪声影响,必须合理地调节结构元素尺度的大小。首先取一正方形结构元素{gi|i=1,2,…n},gi的大小为(2i+1)×(2i+1)像素,式(6)多尺度边缘检测算子为:

形态多尺度边缘检测只作普通的加减运算及求最大最小运算,时间开销少,实验上它们所化的时间比大约是5/3。

2.2 多尺度自适应加权形态边缘检测方法

同样利用大小不同的结构元素提取图像边缘特征,多尺度形态学边缘检测对于最终边缘的合成,通常采用均值合成方法[4],虽然它能抑制图像噪声的影响,但没能发挥不同尺度下的不同抗噪能力和边缘检测精度大小不同的特性。针对此问题,根据图像的噪声及各个尺度的结构元对噪声的抑制能力的不同,自适应地确定相应的权值大小,然后再将这些不同尺寸下检测到的边缘图像用自适应确定的权值进行加权合成,可提取出较理想的边缘图像。[5,6]

采用的多尺度结构元素定义如下(假设B为有限结构元素):

n为尺度参数,B为十字形3×3结构元.按以上的多尺度结构元进行边缘检测得到的各尺度下的边缘图像后,再对得到的多尺度边缘检测图像进行合成运算,加权合成运算如下:

式中f'(x,y)为合成的新边缘图像;[k,l]为尺度n的取值范围;wn为各尺度下的权重;给出不同尺度下的权值wn如下算法:用膨胀得到的不同尺度的多结构元对图像进行开闭、闭开滤波,并分别求得不同尺度下的结构元开闭、闭开滤波的均值图像:

计算不同尺度下的图像标准差值Δn=|f-fn|和方差Δn2=|f-fn|2,各个不同尺度下的图像标准差值或方差的比例确定权值wn,即

2.3 基于直方图的自适应多尺度形态边缘检测方法[7]

尺度大小的选取因图像而异,且进行各尺度下的边缘图像合成运算时权值的选取不确定。而后又提出了一种多尺度数学形态学边缘检测算法,首先用形态边缘检测算子进行图像边缘提取,用不同尺度大小的结构元素分别检测出图像的边缘信息。由于各种不同尺寸下的边缘图像直方图分布不同,算法首先对各边缘图进行直方图配准,然后采用取极小值的方法自适应地对每个尺寸结构元检测得到的图像边缘进行融合,达到有效增强模糊边缘并消除噪声影响的目的。

具体步骤如下:

1)用不同尺度大小的结构元素分别检测出图像的边缘信息。选取有限个具有代表性的有限的结构元,对各个结构元进行膨胀,其尺度的选取n可根据具体的情况而定(一般取2~5)。对不同尺度的各个结构元进行多尺度的边缘提取。

2)自适应地对每个尺度结构元检测得到的图像边缘进行融合,从而得到合成边缘图像。对每个尺度结构元检测得到的边缘图像进行直方图配准。配准方法是,首先分析各个边缘图像直方图中第一个谷底位置,比较它们之间的关系,确定各个边缘图像的灰度拉伸系数,使得乘上该系数后,所有边缘图像的直方图第一个谷底位置相同。然后合成边缘图。

3 结果分析

如图1所示(a)是加了噪声的原图片,(b)是自适应加权形态边缘检测方法的结果,可以看出明显的边缘模糊,受到噪声的影响严重。(c)是直方图的自适应多尺度形态边缘检测方法结果,边缘非常的清晰,而且噪声基本剔除。

摘要:边缘检测一直是计算机视觉和图像处理领域的经典研究课题之一。该文综述了多尺度边缘检测技术:介绍了多尺度检测的基本概念;归纳了现有的各种多尺度形态学边缘检测方法。

关键词:边缘检测,多尺度空间

参考文献

[1]Lindeberg T.Edge detection and ridge de-tection with automatic scale selection.1966IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1996,465-470.

[2]龚炜,石青云,程民德.数字空间中的数学形态学——理论及应用[M].北京:科学出版社,1997.

[3]吴敏金.图像形态学[M].上海:上海科学技术文献出版社,1991.

[4]卢官明.一种计算图像形态梯度的多尺度算法[J].中国图像图形学报,2001,6(3):214-218.

[5]Bhabatosh Chanda,Malay K Kundu,Y Vani Padmaja.A Multi-scale Morphologic Edge Detection[J].Pattern Recognition,1998,31(10):1469-1478.

[6]杨述斌,彭复员,张增常.多尺度自适应加权形态边缘检测方法[J].华中科技大学学报:自然科学版,2002,10(30):87-89.

基于多尺度特征学习的阴影检测 篇6

阴影是许多图像的组成部分,有时候反映了物体形状、大小等重要信息,然而图像中的阴影会对图像的后续处理造成不利的影响。例如:在智能视频监控中,阴影会严重影响目标的跟踪。阴影检测率会直接影响阴影消除的效果,因此阴影检测也是近些年的研究热点之一。

目前阴影检测方法大体可以分为两类:基于模型[1,2,3]的方法和基于特征[4,5,6]的方法。基于模型的方法利用一定的先验信息建立光照模型来检测阴影;基于特征的方法根据阴影的色度、亮度等特征来识别和检测阴影。基于模型的方法通常需要利用多幅图像的先验信息进行建模,该类方法有一定的局限性,只适合于特定的场景。基于特征的方法不需要场景的先验知识,仅仅通过图像的特征检测阴影,时间复杂度较小。当阴影区被覆盖时,虽然亮度变低却仍然保留着一定的色度信息,依据这一特点,在阴影检测时往往将图像转换为亮度与色度相互独立的颜色空间[7,8]。基于色度的阴影检测方法计算量小,但是对噪声和光照比较敏感。近几年来,基于统计属性[9,10,11,12]的阴影检测方法受到了更高的关注。Zhu等[9]基于图像的可变特征和不可变特征、Lalonde等[10]基于图像的色彩特征和纹理属性、Jiang等[11]基于图像的色彩分割与照明估计、Guo等[12]基于成对区域,这类方法都采用条件随机场标识阴影区域。该类方法对不同的场景与不同光照条件具有较强的适应性,代表了当前的研究水平与未来的发展方向。但是该类方法都需要花费大量精力小心的设计这些特征。Zhu等[9]提取可变特征与不可变特征,这些特征用来训练一个分类器,该方法消耗资源大训练时间长。Lalonde等[10]使用了48维的特征向量,虽然增加特征维数能够达到很好的效果,但是阴影检测的时间大大的增长了。Jiang等[11]对Lalonde等[10]方法进行了改进,取得了更好的效果,却花费了更长的时间。Guo等[12]首先采用均值漂移的方法对图像进行分割,把提取的特征作为支持向量机(SVM)的输入建立分类模型。该方法对局部细节噪声较为敏感并且当场景比较复杂时大大增加了SVM的测试时间。

针对上述方法的缺点,本文提出一种新的多尺度特征学习的阴影检测方法。与上述基于统计属性的方法相比,本文方法是一种在场景中,通过特征学习的方法学习大部分相关特征,这些特征用来进行阴影检测。卷积神经网络CNNs(Convolutional Deep Neural Networks)[13]是人工神经网络的一种,已成为当前图像处理领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。它模拟人脑进人脑的机制来解释、处理图像等。因此,本文采用卷积神经网络进行特征学习。一个像素是否属于阴影区像素,不仅与像素自身的亮度、色度等特征有关,还与其周围相邻区域与不相邻区域有紧密的关系,多尺度(图像的拉普拉斯金字塔)的特征学习很好地解决了这个问题。条件随机场CRF(Conditional Random Fields)[14]是一种基于统计的模型。2001年,由John等人首次提出,可在给定全局条件的前提下,计算全局最优输出标记的条件概率。它是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料。卷积神经网络特征学习之后的后验分布反馈给条件随机场,条件随机场对图像进行标注达到阴影检测的目的。

1 自学习阴影检测框架

给定一副图像,本文在像素级别下检测和定位阴影。对于一个像素来说,不能简单地根据与周围相邻像素之间的关系来判断它是否属于阴影区像素。一个像素与其周围较远处不相邻的像素也有较为密切的关系。人眼能够根据图像中阴影区与其周围非阴影区的不同快速定位阴影。本文对输入的图像经过拉普拉斯金字塔变换,分别以确定的聚类中心为中心进行窗口提取达到考虑像素周围较远处区域的目的。合成训练样本后在卷积神经网络中进行训练,用小的测试集进行测试,最后产生的后验分布反馈给条件随机场,不同标签集合的交集形成阴影检测的结果。本文方法流程如图1所示。

1.1 确定聚类中心

超像素是指许多相似的像素点组合在一起,作为一个整体来处理,这个整体就称之为超像素。近年来,超像素已经被越来越多地应用于图像预处理过程中。超像素利用像素与像素之间特征的相似程度对像素进行分组,从而获取图像的冗余信息,在很大程度上降低了后续图像处理任务的复杂程度。SLIC算法[15]是一种思想简单、效率很高并且运行速度快的算法,通常只需迭代10次就完成聚类。该方法将彩色图像转换为CIELAB颜色空间和XY坐标下的五维特征向量,然后对五维特征向量构造度量标准,对图像像素进行局部聚类的过程。假设图像有N个像素,预分割为K个超像素,则每个超像素的平均像素数目为N/K,聚类中心间的近似距离为。该聚类方法是对k-means聚类算法的一种改进,为提高k-means算法的运算速度,在进行聚类时是以聚类中心的2S×2S正方形区域内搜索相似的像素,而不是在整张图像搜索。本文进行聚类时在聚类中心周围半径为S的区域内进行搜索,如图2所示。

在聚类中心点数目相同时,该方法能够减少重复计算的时间,因为圆形具有严格的几何不变性[16],确定的聚类中心为:

其中,lk、ak与bk表示坐标为(xk,yk)的像素点在CIELAB颜色空间下各通道的值,k∈[1,K]。

1.2 窗口提取与特征学习

输入图像经过拉普拉斯金字塔变换,以每个聚类中心为中心进行窗口提取,则对于坐标为(xk,yk)的像素点,此操作可以描述为:

其中,Ωk为所提取的图像块Ωk∈Ω,W(·)为窗口操作,t为提取窗口的大小,由于所选图像集阴影区域的不平衡性,采用合成少数类过取样算法[17]合成训练样本:

其中,Λ(·)为合成样本操作,Ο为样本集,样本集在卷积神经网络中进行特征学习。本文卷积神经网络结构如图3所示。

对于卷积层来说,上一层的特征图被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征图。每一个输出特征图可能是组合卷积多个输入的特征图:

其中,xjl和xil-1分别为当前层l和上一层l-1的特征图(下同),k是卷积核,f(·)是非线性激活函数,b为偏置,Mj代表输入特征图的一个选择。对于降采样层来说,有多少个输入特征图,就有多少个输出特征图,只是每个输出特征图都变小了:

其中,down(·)表示降采样函数,kjl为权值,神经元的非线性作用函数为f(x)=(1+e-x)-1。神经元的输出层:

对于式(6)j∈[shadow,n-shadow],卷积神经网络以一个图像块作为输入,经过训练之后得到一个后验分布。在本文中,池操作的步幅等于池邻域的均值,通过降采样层执行池操作有助于学习不变性的特征描述。全连接层工作原理是有一层隐藏层的多层传感器,这个隐藏层后边跟着一个逻辑回归的输出层,逻辑回归的输出层提供类的分布。图像转化为二值图像,二值输出变量的后验分布:

图像块训练之前先进行预处理,采用卷积神经网络可以把概率分布的模型PCNNs(Yi|Οk)定义为:

其中,θ(·)是预处理,F(·)是有5层隐藏层的卷积神经网络。预处理之后,通过在线学习(随机梯度下降),卷积神经网络进行有监督的训练。在训练过程中,梯度通过反向传播的方式计算,交叉熵损失函数被最小化[17]。采用交叉验证的方法确定训练参数,训练样本在训练之前被打乱,这是因为卷积神经网络对未知样本学习得更快。卷积神经网络的初值是从0均值的高斯分布中随机取样来初始化的。

卷积神经网络在训练过程的每个阶段用一个小的验证集来评估正在训练的网络,一旦验证集在执行时不能达到κ步,训练过程就停止(本文κ=5)。在验证集上表现好的网络被用来在图像库上进行测试,最初的学习率是试探性的选择能使误差收敛的最大学习率。

1.3 条件随机场

给定输入图像,阴影检测的任务实际上就是把整幅图像的像素分为了两类,也是对每一个像素进行标签的过程,一个像素要么被标记为阴影像素要么被标记为非阴影像素。这种二分类问题从有监督的特征学习中建立概率估计并提供给条件随机场。条件随机场定义在网格拓扑结构图上,图的节点对应于图像的像素,如式(9),条件随机场是对像素标签最常用的方法之一。由于训练空间(标签图像)的大小增加了计算似然函数梯度的难度,因此条件随机场的参数不能被简单的手工标签阴影区的最大似然估计来得到,采用一种最大化利润学习方法[18]来学习条件随机场的参数。把阴影检测定义为条件概率分布:

其中,ω是该模型的权值,Z(ω)是归一化函数,ν表示节点(比如单个像素),ε表示边(比如相邻像素),X表示整幅图像的像素。对吉布斯能量函数而言,上述分布形式为:

由式(7)与式(8)可知,存在两个隐函数:一元隐函数和二元隐函数。一元函数从卷积神经网络的概率估计得到:

二元函数由类转移隐函数和空间转移隐函数结合得到:

当Yi≠Yj时,否则如下:

其中,α和β通过在每个数据集上交叉验证得到,对随机变量Y∈ΓN,通过采用最大后验估计Y'来确定像素的标签,由于归一化函数Z(ω)不依赖与Y',这种估计转化为能量最小化问题:

根据Y'求标签集合SJ最后求交集:

2 结果与讨论

2.1 实验方案

为了验证提出方法的有效性和高效性,本文实验方案如下:

(1)图像库:本文实验图像库来源于文献[9]图像库(大部分阴影图像背景复杂,多为硬阴影,阴影面积小)和文献[12]图像库(大大部分阴影图像背景简单,多为软阴影,阴影面积大)。

(2)实验参数:本文聚类数目K取150,拉普拉斯金字塔J取5。实验条件为Intel(R)Core(TM)i3-2370@2.40 GHz处理器,2 GB内存,32位操作系统,Visual Studio2012开发平台编程实现。

K的值小于图像大小与样本大小的商,这样能够保证在窗口提取时能够提取每个超像素的大部分像素,从而能够得到更可靠的样本。而当K等于150时,对于图像库中的所有图像,窗口提取都能够满足条件。对于一些特定的实时领域,K的值需要简单的计算与测试确定。实验的精度并不随J的增大而增大,当J=5时,阴影的检出率最高,而当J>5时,阴影的检出率反而下降,因此J取5。

(3)实验方法:宏观上交叉训练,交叉测试;微观上选取9幅场景复杂度不同的图像进行测试。

(4)计算方法:

对于一副有阴影标签的图像来说,假设A表示阴影区像素的集合,B表示非阴影区像素的集合,A'、B'分别表示经过实验得到的阴影区与非阴影区像素的集合。阴影检测效果采用阴影检出率SD、阴影误检率SE来评价,TP计算方法如下(其中N(·)表示计算像素的数目):

2.2 实验结果

(1)宏观测试

本文采用在其中一个图像库上训练然后在另一图像库进行测试的方法,然后比较本文在不同图像集上所能达到的最高精度(阴影检出率SD)。在文献[9]图像库上进行训练,在文献[12]图像库测试的精度达到81.9%;而在文献[12]图像库上训练,在文献[9]图像库上测试的精度为79.8%。这是因为文献[9]图像库的图像场景比较复杂能够训练得到一个更好的网络。本文方法在文献[9]图像库与文献[12]图像库上测试达到的最高精度分别为90.71%与93.37%。由阴影检测计算公式可知:在相同条件下误检率相同时,阴影区的面积越大阴影的检出率相对较高,而文献[12]图像库的阴影区面积较大,因此本文方法在文献[12]图像库上取得较高的精度。

(2)微观测试

为了验证本文方法的场景适应性,选取了9幅场景复杂度不同的图像作为本位阴影检测结果的实例,如图4所示。其中第一排、第三排和第五排为源图像,第二排、第四排和第六排为阴影检测效果图。

定性上,从阴影检测的效果来看,本文方法能够很好地检测软阴影、硬阴影、自阴影以及场景非常复杂的阴影。(a)、(b)、(d)与(f)场景较为简单且无自阴影,但是(a)与(b)阴影多为软阴影,(d)与(f)阴影接近硬阴影;(c)、(d)、(g)、(h)与(i)都包含自阴影,其中(c)与(d)场景较为简单,(g)、(h)与(i)场景较为复杂,(g)与(h)为遥感图像,(i)为复杂的室外自然场景。实验表明,本文提出方法在各种不同场景下的图像的阴影检测效果较好,能够准确检测出由于遮挡产生的自阴影。

定量上,本文对选取的图像进行测试并将本文方法的阴影检出率与误检率和传统的方法进行比较,如表1、表2所示。

从表1与表2可以看出,本文方法阴影检出率较传统的方法高,阴影误检率较传统方法低。而SD与SE并没有完全的相关性,这与SD与SE的计算方法有关。传统方法阴影的检出率随场景的变化变化较大且检出率较低,而本文方法相对较为稳定且能够达到更高的检出率。

在训练资源的消耗上,文献[9]所采用的方法需要更大的内存(9 GB)和更大的时间消耗(大约10小时训练125幅图像)。本文的多尺度特征学习方法只需要2 GB内存,训练时间也更短(大约4小时能训练两个图像库全部的图像)。在实验中当用网络i的权值初始化网络i+1时(1<=i,i+1<=5),本文方法的训练时间能够缩短到2.5小时左右。文献[12]采用的支持向量机方法只适合小数据,卷积神经网络模拟人的可视域可以用多个卷积核映射出多个特征图,更适合图像像素的分类。当图像扩展到三维,或图像场景非常复杂,卷积神经网络的优势就体现出来了。就目前来说,图像越来越复杂,卷积神经网络的适应性越强。

3 结语

本文主要阐述了一种新的阴影检测方法,利用卷积神经网络进行特征学习,结合条件随机场对图像进行标签。该方法场景适应性强,在阴影面积较大、软阴影较多的图像中也取得了很好的效果,而且训练的时间也比现有的基于统计属性的方法大大缩短,阴影检出率也较现有传统的算法高。

多尺度测井分析方法的应用分析 篇7

关键词:多尺度分析,小波基,数据压缩

近些年来, 处理测井资料的方法有许多, 但是不断的得到推广的则是多尺度分析法, 导致关于多尺度分析法和测井信号方面的文章越来越多, 但是关于对选取小波基而进行分析和研究对比文章还不是很多。科学技术的不断发展, 也使得钻测井技术的应用越来越普遍, 对实时测量数据的传输需求越来越多, 而数据的压缩技术则为数据的快速传递等数据传输需求提供了可能[2]。本研究主要分析多尺度测井分析方法在测井方法中的应用价值, 具体如下:

1 多尺度测井分析方法

多尺度系统理论在上个世纪80年代后期形成, 多尺度系统理论是小波分析的一个核心内容。随着多尺度系统理论的不断发展, 多尺度分析方法将此前的正交基构造统一, 使得小波理论的进展发生了巨大的变化, 并且从中还提出了两种方式, 即多尺度分解和重构算法, 更加确立了小波分析的重要位置。

1.1 分析的概念

多尺度分析是把其中的函数x (t) 看做成函数中的极限, 并且被包含在函数L2 (R) 空间内。在空间内, 每个近似函数都逼近函数x (t) 的平滑, 从而使得近似函数能够在不同程度上被越来越细的近似函数所获得, 从而得出多尺度分析法。

1.2 分析时的思想观念

分析时会产生许多的信号, 需要把这些信号进行详细的分解, 信号被分置在粗尺度上时称为平滑信号, 被分置在细尺度上并且粗尺度上的信号已消失, 这时信号称为细节信号。其中, 小波变化是在不同尺度之间作为连接信号之用的桥梁, 这是多尺度分析方法的基本思想[4]。

2 小波基选取问题

小波基的选取问题是多尺度分析方法在应用过程中必须要考虑到的问题, 而对小波基的考虑应该从两方面进行考虑:小波基的具体应用和小波基的一般原则, 在考虑之前, 我们需要了解小波基的基本性质。

2.1 小波基的基本性质

(1) 紧支性的基本性质, 当支撑时的宽度越窄, 小波局部所展现出来的特性更好, 从而降低小波变换计算时的复杂性, 提高其计算的速度, 达到快速的实现。

(2) 正交性基本的性质, 多尺度分析法在选择小波基的必要条件就是正交性, 而严格规范的正交性可以对小波分解的系数精确重构问题起到积极的作用。

(3) 正则性的基本性质, 正则性是对小波函数的光滑程度的一种描述方式, 主要表现的是小波基的可微性, 当正则性的阶数越大时, 则说明其正则性越好, 当收集的速度越快时, 则表明领域能量就愈集中。

(4) 对称性的基本性质。对称性是指在对小波函数进行选择的时候, 应当尽量选择对称或反对称的函数, 这可以有效使多尺度的分解以及重构在进行中信号出现失真的情况, 信号不失真能够有效的获取到重构时高质量的信号, 具有重要的作用。

(5) 消失矩特性的基本性质。消失矩特性是指为提高衰减的速度, 而要求基函数必须要有一定的消失矩[5]。

2.2 常见的几种小波

在多尺度分析方法中, Bior2.2、Sym4、Coif4、Db4等几种小波是人们普遍认可的小波。

其中, Db4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为7, 其消失矩的阶数为4;

Bior2.2小波基为双正交, 但是没有对称性, 有正则性, 其支撑的宽度为分解、重构5, 消失矩的阶数为1;

Coif4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为23, 其消失矩的阶数为8;

Sym4小波基在正交性上正交, 有对称性和正则性, 其支撑的宽度为7, 其消失矩的阶数为8。

3 多尺度测井分析方法的实例分析

多尺度测井分析方法的测井数据为地层真值经过低通的滤波器进行滤波, 从而得出准确的平滑数据, 由于薄层信息的高频分量被削弱, 至此才使得测井时能够得到平滑的数据曲线。

根据以上分析可以得出, 多尺度测井分析法的基本原则是“分频加权重构”, 它是通过数据曲线的信息来补充能量, 从而进行重构, 这样做的好处就在于能够恢复被削弱的薄层信息, 进而能够提高测井曲线的真值和纵向分辨率。

(1) 实例分析。为了更好的对多尺度测井分析方法能够提高测井曲线的分辨率的可信度进行验证, 特地选取了某井的GR测井曲线以及MSFL测井曲线进行频谱的研究处理分析。

对比发现, 测井曲线的低频含有成分很相近GR中的高频成分和MSFL对比之后发现, GR中的改频成分幅值更低。如此可以决定出, 分辨率较高的MSFL是标准的频谱, 而GR曲线中的所有高频段都是加权系数。为了能够得出更加可行的加权系数, 需将重构之后的曲线频谱和标准频谱进行相应的对比, 从而得出结论。

(2) 压缩数据。多尺度分析法在地震数据压缩的使用也是很广泛, 但用于测井数据方面的压缩则相对较少。近段时间随着钻井技术的不断发展, 实时测量的数据需要进行传输, 因此, 测井数据的压缩技术为数据的快速传输提供了更多的保证。

4 小结

多尺度分析方法的运用和小波基的最优选择都使测井曲线的纵向分辨率得到了很大的提升, 同时也提高了纵向分辨率作为精细评价时所提供的依据。多尺度分析法的数据压缩能力, 能够有效的帮助钻测井时进行的实时数据传输提供新的思路。

参考文献

[1]雷芬丽, 许平, 程武伟等.小波分析在测井数据融合处理中的应用[J].上海国土资源, 2013 (04) :87-90.

[2]雷芬丽, 许平, 程武伟等.小波分析在测井数据融合处理中的应用[J].工程地球物理学报, 2014, 11 (01) :77-80.

[3]刘唐伟.地下渗流模型多尺度有限元及参数估计方法[D].中国科学院大学, 2013.

[4]肖大志.基于常规测井资料小波多尺度分析的裂缝识别方法[J].工程地球物理学报, 2011, 08 (02) :216-221.

上一篇:城区农村信用社下一篇:马克思主义新闻观教育