端点效应

2024-09-20

端点效应(精选4篇)

端点效应 篇1

0 引言

传统时频分析算法,如Fourier变换[1,2]、Gabor变换[3]、Winger-Ville分布[4]、小波变换[5]等,都是基于信号“线性”或“平稳”假设,建立严格的数学模型,然而,现实生活中的数据却极其复杂。于是,人们迫切期望找到一种能自适应地处理非线性、非平稳复杂信号的新颖算法。希尔伯特-黄变换(Hilbert-Huang transform,HHT)的提出[6],正好弥补了这一空白。该算法不同于传统的Fourier变换,没有严格的数学理论框架,是完全由数据驱动的一种自适应算法[7,8,9,10,11,12,13,14,15]。其核心是经验模态分解(Empirical mode decomposition,EMD)和希尔伯特变换(Hilbert transform,HT)。然而,作为一种新兴算法,HHT仍有许多亟待解决的公开问题[16,17,18,19]。

其中,端点效应作为HHT创始人黄鄂教授指出的一类重要公开问题,同时存在于EMD和HT两个过程中[6,18,19]。一方面,在EMD过程中,当以极值点为节点作样条插值来构造包络时,不能确保数据序列左右两端点恰为极值点,造成样条曲线在端点处的插值精度很差,容易发生“过冲”或“欠冲”现象,并可能通过循环迭代使整个数据序列都被这种不良影响所“污染”,最终导致本征模态函数(Intrinsic mode function,IMF)严重失真;另一方面,对IMF进行HT时,由于其数字实现过程涉及构造与原始信号相位差为π/2的共轭信号,而共轭信号通过“Fourier变换-双边谱对折为单边谱-Fourier逆变换”求取,对周期信号进行非完整周期采样时,Fourier变换将引起所谓的“Gibbs现象”,发生频率泄露。而对单边谱进行Fourier逆变换时,这种频率泄露造成的误差无法抵消,导致信号两端产生“飞逸”,使求取的Hilbert谱无法准确反映原始信号本质特性。端点效应的不良影响,严重阻碍了HHT的广泛应用,促使很多学者致力于这方面的研究,提出了多种抑制端点效应的办法,如:加窗函数法[20,21]、镜像延拓法[22,23,24,25]、波形匹配延拓法[26]、多项式拟合法[27,28]、自回归滑动平均模型法[29,30,31]、比例延拓法[32]、人工神经网络法[33]、支持向量回归机法[34]等,在一定程度上解决了端点效应问题。

本文对HHT端点效应抑制算法相关研究和最新成果进行了综述。第2节介绍HHT的算法流程,进而分析抑制端点效应必须解决的关键问题,第3节对现有文献中端点效应抑制算法作了分类,并对每类算法进行了详细阐述和比较,第4节提出了一种基于灰色预测模型的边界延拓算法,最后在第5节总结全文,并展望端点效应抑制算法未来的发展方向。

1 希尔伯特-黄变换简介

1.1 HHT算法流程

传统的时频分析算法大都不能恰当地表示非线性、非平稳信号的频谱特性,HHT则不然,它以自适应地表征给定信号的物理特性为出发点,通过EMD提取一组IMF,然后对这些IMF进行HT,得到能充分反映信号时-频-能量分布的局部能量和瞬时频率。可见,HHT是分析非线性、非平稳信号的理想工具。

HHT算法包括两个核心步骤,如算法1所示,第一个核心是EMD,也称为“筛分”,它把任意给定信号分解为,其中,L,I为IMF,它满足如下两个基本条件:1)在整个数据序列中,极值点数与过零点数相等或相差为1;2)在每个时间点上,由极大值构造的上包络和由极小值构造的下包络的局部均值为0。第二个核心是Hilbert谱分析,L,I进行,提取瞬时频率和振幅,最终得到反映信号能量在时间和频率上分布规律的Hilbert谱:

1.2 HHT端点效应分析

由EMD过程知

其中,J i,i=1,2,L,I表示求取第i个IMF ci(t)时的最大迭代次数。

另一方面,对于残差ri+1(t)有

于是

式(4)表明,IMF完全由包络均值决定[35,36],而包络均值取决于插值算法和极值点。由于EMD过程中不能保证端点恰为极值点,由插值得到的上下包络线在端点处无法有效“包住”给定信号,从而产生了端点效应。此外,在HT过程中,Hilbert变换的数字实现方法是基于Fourier变换的,容易引起端点处频率泄露,使Hilbert谱出现严重的端点效应。下面给出一个具体例子:

设原始信号为

y=(1+0.25*sin(2*π*12*t))*cos(2*π*30*t+0.5*sin(2*π*10*t))+sin(2*π*100*t),t=0:0.001:0.4s;图1(a)表示在计算第二个IMF时出现的端点效应,理想情况下,上下包络线应该从上下两个方向分别“包住”信号。但从图1(a)观察到,由于产生了“过冲”和“欠冲”现象,端点处的包络线偏离了其本来位置,从而无法“包住”信号,图1(b)为y的Hilbert谱,其端点效应也是很明显的。

2 端点效应抑制算法分类

现有的端点效应抑制算法主要分为4大类:基于信号处理的方法,基于数学模型的方法,基于人工智能的方法和基于组合算法的方法,如图2所示。下面分类加以介绍。

2.1 基于信号处理的方法

基于信号处理的方法通常采用各种常用的信号分析方法对数据序列的端点进行特殊处理,降低边界处发生端点效应的可能性。近年来出现的典型方法有:加窗函数法、镜像延拓法以及波形匹配延拓法。

2.1.1 加窗函数法

加窗函数法是指进行HHT之前,对数据序列附加一个对称的窗函数[20],然而,加了窗函数之后,原始信号将发生变化,对EMD而言,其上下包络线也会相应地被改变,为了降低窗函数带来的误差,要求选取的窗函数本身能被样条函数很好地插值。对HT而言,虽然没有样条函数的限制,但所选窗函数也要求尽量不改变中间位置的信号而使两端信号被抑制。比较常见的办法是在数据序列的中间加矩形窗,两个端点附近加Hamming窗、Hanning窗或Cosine窗[21]。这些窗函数的两个端点均为0,一方面使EMD过程中,信号的端点恰为上下包络线的端点,另一方面能降低HT数字计算过程中的频率泄露,大大减轻HHT的端点效应。

算法1 HHT算法流程

Algorithm 1 The procedure of HHT

输入:原始信号s(t)∈l1(□),(t∈□+),ε>0;输出:IMF和Hilbert谱

1、i=1,j=0,ri(t)=s(t),SD=10000%通过EMD,计算IMF

2、while ri(t)不单调,则

3、while SD>ε,则

4、j=j+1,hi,j-1(t)=ri(t),找出hi,j-1(t)的所有极大值和极小值点,并通过插值求上、下包络emax和emin

5、计算包络均值mi,j(t)=(emax+emin),hi,j(t)=hi,j-1(t)-mi,j(t),及终止准则SD

6、end while

7、ci(t)=hi,j(t);ri+1(t)=ri(t)-ci(t);i=i+1;j=0

8、end while

9、I=i-1;i=1%通过HT,计算Hilbert谱

10、while i≤I

11、求ci(t)的HT,得di(t)=H[ci(t)],提取瞬时频率ωi(t)和幅值ai(t),i=i+1

12、end while

13、计算Hilbert谱H(ω,t)

加窗函数方法能在一定程度上抑制端点效应,但是附加一个窗函数后,原始数据序列将被改变,反而使得EMD过程产生的IMF未能代表原始信号的真实组分,对这些IMF进行HT得到的Hilbert谱将无法准确反映原始信号的特性.一种改进思路是结合其他端点效应抑制算法,先将信号两端分别向前后延拓,然后对延拓后的信号用加窗函数法,最后再舍去延拓部分即可。

2.1.2 镜像延拓法

镜像延拓包括镜像闭合延拓和镜像对称延拓两种.黄大吉等人提出用镜像闭合延拓(Mirror extending)来减少端点效应[22,23]。其基本思想是根据原始信号波形分布特征,在前后两端具有对称性的极值点处各放一面镜子,把镜内信号向外映射,得到长度2倍于原始信号的周期信号。如果把延拓后的周期信号首尾相接,便构成一个不含端点的环形闭合曲线,绕开了EMD和HT的端点问题[24]。特别地,考虑到IMF与极值点有关,Rilling等人提出了专门针对EMD端点效应的镜像对称延拓(Mirror symmetry)法[25],他们直接把镜子固定在信号两端附近,将信号内部的极值点向外部镜像延拓合适长度,因此,该方法也称极值点对称延拓法。

以上两种镜像延拓法都具有操作简单、直观的优点。一方面,由于环形闭合曲线无端点,无论是EMD过程还是HT过程,镜像闭合延拓只需对原始信号进行一次延拓;另一方面,虽然镜像对称延拓在EMD的每次迭代中都要进行,但仅对极值点作延拓,计算量小。然而,镜像延拓要求信号本身存在较强的对称性,尽可能把镜子放到对称的极值点处。否则,如果信号对称性不强,无论镜子的位置如何,都将受到人为因素对端点的影响。此外,该方法不适合处理短数据序列。

2.1.3 波形匹配延拓法

波形匹配延拓法的基本思想是认为原始数据的变化趋势不仅表现在端点处,而且在内部也将存在,特别是对规律性很强的信号,这种特性更明显.如果能在信号内部找到一段与端点变化趋势最为匹配的子波,那么就可以用这段子波来延拓端点处的波形,尽可能地保持原始信号的发展趋势,达到降低端点效应的目的[26]。当端点处发生异常变化,在信号内部找不到与之相匹配的子波时,数据延拓仅需考虑端点处的局部数据,以靠近端点的两个极值的平均来近似端点处的极值。

该方法的优势很明显,一方面当信号内在规律性较强时,可以最大限度地遵循这种规律;另一方面当信号内在趋势规律性很弱时,尤其当端点处产生异常变化时,只取端点处的局域数据作为匹配子波,确保信号在端点处的趋势变化不大。然而,该方法要求延拓波形与原始信号相似,也就限制了延拓波形潜在的发展趋势,当真实延拓波形与原始信号相差较大时,用此方法求得的延拓波形误差较大。

2.2 基于数学模型的方法

其基本思想是建立某种特定的数学模型,然后依据原始信号求取其参数,通过建立的数学模型来预测信号两端的趋势,常用的方法有:多项式拟合法,自回归滑动平均模型法和比例延拓法。

2.2.1 多项式拟合法

多项式拟合法是想用数据拟合的方法得到反映原始数据序列端点附近变化趋势的近似多项式函数[27,28]。具体说来,依据最小二乘法在二范数意义下,选取最佳逼近多项式函数。需要注意的是,这种方法要根据具体情况事先确定拟合多项式的次数.对于EMD,分别找到原始信号端点附近适量的极大值(或极小值),然后用这些点来确定拟合多项式函数。对于HT,直接选取IMF中靠近端点的恰当个数的数据点,再用它们来求取拟合多项式系数。

该方法能较好地拟合某些简单信号端点处的变化规律,有效减少误差。但是多项式的次数不好确定,一般建议取一次或两次为佳,次数太高反而导致失真,拟合函数不能反映原始信号端点附近的变化趋势。此外,对于非线性或非平稳复杂信号,可以考虑选取其他正交多项式(如Legendre多项式,Chebyshev多项式等)逼近这些信号的复杂规律,改善拟合效果。

2.2.2 自回归滑动平均模型法

自回归滑动平均(autoregressive moving average model,ARMA)模型法由自回归(AR)模型和滑动平均(MA)模型综合而成,其基本思想是利用参数模型对数据序列进行处理,通过模态参数识别,可在最小方差意义下对平稳信号进行逼近和预测[29,30]。ARMA模型的数学表示如下:

式中,εt为零均值平稳白噪声过程,(5)式左边为AR模型,右边为MA模型,ak,bk分别为待识别的自回归系数和滑动均值系数。

也有的学者提出用AR模型进行预测,但是,考虑到无论是ARMA模型或AR模型,都假设信号是平稳的,因而不适合处理非平稳信号。为此,研究者们提出了不同的改进模型,其中,自回归综合滑动平均(ARIMA)模型和时变ARMA模型是最典型的两种,ARIMA(p,d,q)模型先对数据序列进行平稳检验,如果非平稳,则d阶差分直至平稳;然后再建立ARMA(p,q)模型,并求解[31]。时变ARMA模型将ARMA模型参数改为时变的,并假设左边的时变参数是一组时间基函数的线性组合,右边的时变参数简化为常数,并用反馈线性法进行参数估计。

长期以来,ARMA模型法是信号预测或功率谱分析的有效方法,也能在一定程度上减轻HHT的端点效应,但是,它局限于平稳假设条件,而在其基础上发展起来的其他方法,如ARIMA模型法或时变ARMA模型法等,虽然能对一些常见非平稳信号进行延拓,但是计算过程复杂,且对复杂非平稳信号的预测精度不高,可见,该算法仍有很大的改进空间。

2.2.3 比例延拓法

2010年,Qin Wu等人提出了一种抑制端点效应的比例延拓法(Ratio boundary extension),对于EMD过程,此方法采用比例法来预测极值点的位置[32]。步骤如下:

1)找到数据序列最后3个极大值点位置:τ-3,τ-2和τ-1,并求它们的比例rmax=(τ-1-τ-2)/(τ-2-τ-3);

2)类似1),找出最后3个极小值点的位置:η-3,η-2和η-1,并求它们的比例rmin=(η-1-η-2)/(η-2-η-3);

3)计算比例均值:r=(rmax+rmin)/2;

4)求延拓的第一个极大值点位置τ1,使其满足:(τ1τ-1)/(τ-1τ-2)=r。

依此类推,可用类似的方法来估计其他极值点的位置,另一方面,极值点的大小由二次插值来预测。

对于HT过程,直接用最靠近端点的3个点代替极值点。

比例延拓法作为一种新颖的端点效应抑制算法,原理简单,计算方便,在包括非线性、非平稳在内的大多数情况下,都有很出色的表现,但是,在某些极端情况下,不满足极大、极小值交错条件,此时,需要用其他延拓方法(如镜像延拓法)来预测第一个极值点。

2.3 基于人工智能的方法

其基本思路是用人工智能的方法对数据序列进行预测,如果以时间为自变量,就相当于对信号作前向或反向预测,两种典型的人工智能方法是神经网络(ANN)法和支持向量回归机(SVR)法。

2.3.1 人工神经网络法

人工神经网络(Artificial neural network,ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统,它通过对人脑基本特性的抽象和模拟,将各种信息等势分布贮存在网络的各个神经元内,采用并行处理的方法充分逼近任意复杂非线性关系。

ANN预测数据序列的过程可以分为2步:1)训练。此时需要提供一组训练样本,每个样本有输入样本和期望输出组成,当网络的所有实际输出与其期望输出一致时,训练结束,否则反复修正权值,直到网络的实际输出与期望输出一致。令xp(t)为t时刻神经元q接收的来自神经元p的输入信息,op(t)表示t时刻神经元q的输出信息,则神经元q的状态可以表示为

其中,τpq为输入输出间的突触时延;θq为神经元q的阈值;ωpq为神经元p到q的突触连接系数或权重值;f(⋅)为神经元变换函数。

2)预测。输入n个数据点,利用训练好的网络来预测第1个点的值o10,并以其为原始数据序列预测第2个值o20,依此类推,将端点向外延拓N个值oj0,(j=1,2,...,N),值得注意的是,对于EMD,ANN的输入数据为迭代过程中的各个hij;而对于HT,ANN的输入数据为各个IMF。

ANN预测算法能延拓复杂的非线性信号,有利于减少HHT的端点效应[33],但是它也存在很多固有局限,比如所需训练样本多,学习时间过长,难以进行实时处理,且容易陷入局部极小值,隐节点的选取缺乏理论指导等。

2.3.2 支持向量回归机法

支持向量回归机(Support vector regression,SVR)通过非线性映射φ将数据x映射到高维特征空间Ω,并在这个特征空间进行线性回归[34],即

式中,⋅,⋅表示高维特征空间Ω中的内积,ϕ:x→Ω,b为阈值,这样,高维特征空间Ω的线性回归便对应于低维输入空间¡n的非线性回归。特别地,SVR在支持向量机的基础上定义了ε不敏感损失函数

引入松弛变量ξi和ξi*,Lagrange系数ai和ai*,SVR的目标函数为

约束条件是

其中,ε为不敏感损失函数,C为惩罚因子,K(x,y)为核函数。

求解以上二次规划,得最优的Lagrange系数ai,ai*,以及阈值b,最终可得SVR的估计公式为

基于统计学习理论的SVR,克服了ANN的很多固有缺点,比如过学习,结构和类型的选择过分依赖经验等,且具有全局最优、良好的泛化能力,特别是可以用于小样本数据情形,但是,对于特定问题,如何选取最佳的核函数和最优的一组模型参数仍是SVR难以解决的一个问题,因而,SVR模型选择的标准有待改进。

2.4 基于组合算法的方法

其基本思想是选取前文提到的某些方法,重新组合成新算法。这样做的最大好处是能充分挖掘各种算法的优点,比单独使用一种算法更具优势,最大的难点在于如何找到各种不同算法的契合点,将它们有机结合。两种典型的结合方式有:1)镜像闭合延拓与ANN(或SVR)相结合;2)加窗函数与镜像对称延拓相结合;第一种方法采用ANN(或SVR)预测给定信号序列,将信号向前后各延拓一个点(对EMD为极值点,对HT直接为数据点),再采用镜像闭合延拓来抑制HHT的端点效应;第二种方法先对信号进行极值点对称延拓,然后对延拓后的信号采用加窗函数法。该方法利用窗函数能抑制远离中心点信号的优点,通过对信号进行延拓来防止加窗函数后的失真,从而比单独使用加窗函数法更有优势。

3 一种基于灰色预测模型的边界延拓算法

由前文的分析,我们期望能找到一种具有以下优点的预测算法:1)不改变原始信号特性;2)能有效预测复杂、不确定性信号;3)计算量小,速度快;4)允许少量数据预测;5)短期预测精度高,鉴于此,我们提出一种基于灰色预测模型的边界延拓算法,它隶属于3.2节中基于数学模型的方法。

设原数据序列为

对应的累加生成序列为

其中

可建立灰色预测模型

该模型也称GM(1,1)模型,用梯形公式对(12)中导数进行离散化,得

其中,z(1)(k)=0.5(x(1)(k)+x(1)(k-1)),用最小二乘法求灰色系数β=[a,b]T,便可以得到如下预测结果

其中,m为预测步长,为原数据序列的预测值,GM(1,1)模型详细求解步骤见[37,38,39,40]。

基于GM(1,1)模型的预测算法对信号长度要求很低,已被证明只要多于4个数据点即可[39],特别地,对于EMD过程,可以用最靠近端点的4个极大值为输入数据,采用GM(1,1)模型进行延拓,极小值的处理类似,对于HT过程,直接以IMF最靠近端点的4个数据点为输入数据,用GM(1,1)模型来预测。然而,GM(1,1)模型存在两个不足:1)GM(1,1)模型中,导数离散化方法采用的是梯形公式,其精度不高,直接导致灰色系数的计算精度不高,从而影响GM(1,1)模型的精度;2)对于特别复杂的信号,GM(1,1)模型预测精度有可能不符合要求。对于以上两点不足,对应的改进思路是:1)寻求更高精度的导数离散化方法,例如文献[38]提出一种3sp GM(1,1)模型,该模型借用三次Hermite样条来对导数进行离散化,提高了GM(1,1)模型的预测精度;2)充分利用残差序列来修正原始GM(1,1)模型.设å(0)={ε(0)(1),ε(0)(2),(43),ε(0)(n)},n∈□+,其中的残差序列,以å(0)为原始数据序列,再次建立GM(1,1)模型,求得求灰色系数,则可以用å(0)来修正x(1)的预测序列

最后,由来预测原始数据序列。

4 结论与展望

本文对HHT的热门公开问题——端点效应进行了系统研究和全面综述,首先对HHT的算法流程进行了简单回顾,然后重点阐述了端点效应抑制算法研究的主要成果,在科学分类的基础上,本文对这些算法的基本原理、适用范围及优缺点进行了总结和对比,最后给出一种新的算法。

尽管HHT已取得了一些研究成果并有了很广泛应用,但尚未形成一个成熟的理论体系和框架,而HHT的端点效应抑制算法也还处于起步阶段,很多问题有待进一步探讨和解决,概括如下:

1)改进和完善已有算法,不断改进和完善现有算法的不足,是抑制HHT端点效应、得到准确信号组分和Hilbert谱的有效途径。

2)寻求新的端点效应抑制算法,找寻更准确的极值点检测算法,自适应地对非线性、非平稳等复杂信号或短数据序列进行较高精度预测的算法等。

3)研究更有效的插值算法,插值算法的好坏影响到IMF能否真实反映了原始信号组分,可以考虑研究三次样条插值之外的其他插值算法。

4)改进Hilbert谱的数字实现,现有Hilbert谱数字实现方法与Fourier分析有关,如何摆脱此束缚,找到其他计算Hilbert谱的有效算法,是具有现实意义的重大挑战。

端点效应 篇2

经验模态分解 (Empirical Mode Decomposition, EMD) 是一种新兴的非线性、非平稳信号分析处理方法, 在地震、结构工程及机械故障诊断等领域得到了应用研究[1]。但是原始方法中存在着影响分析结果的端点效应问题, 主要表现在:一是在对信号分解时包络曲线在数据两端出现发散现象, 并且逐渐向内“污染”数据而使得结果失真;二是对分解得到的基本模态函数 (Intrinsic Mode Function, IMF) 进行希尔伯特变换时, 信号两端也产生端点效应。

本文在分析EMD分解原理及分解过程中产生端点效应原因的基础上, 研究了将端点优化对称延拓和镜像延拓相结合的方法来抑制端点效应。通过对仿真信号的分析表明, 该方法能够有效解决EMD中的端点效应问题。

1 端点效应问题和影响

在经验模式分解过程中, 求包络平均是通过对原数据中的上极值点和下极值点分别进行三次样条插值拟合然后求取平均值。在三次样条插值时, 如果数据的两个端点处不是数据的极值点, 就不能确定端点处的极值点, 这样在样条插值时产生数据的拟合误差。在经验模式分解的过程中, 由于端点处极值的不确定性, 每一次样条插值都有拟合误差, 这样, 误差不断积累, 分解出来的第一个基本模态函数端点处就会有较大的误差。而第二个基本模态函数的分解是建立在原始数据减去第一个基本模态函数的残余项的基础上进行的, 这样, 由于第一个基本模态函数的误差, 使残余项也产生误差, 导致分解的第二个基本模态函数产生更大的误差。照此类推, 随着分解的进行, 误差就会由端点处向内逐渐传播, 使得所得到的结果失真。这就是经验模式分解方法中的端点效应问题。

目前研究抑制端点效应方法的思路有两种, 一个是延长数据序列或者在数据两端增加极值点;二是采用其它的样条函数。后者虽然可以在一定程度上解决端点效应问题, 但其插值性能比三次样条函数差。前者是得到普遍认可的一种方法, 对于随机性很强的信号, 完全准确地延拓数据序列是不可能也是不合理的, 但是可以使延拓后得到的平均包络与真实平均包络比较接近, 从而达到抑制端点效应的目的。

目前国内外的学者们为抑制端点效应问题提出了很多解决方法, 如波形延拓法[1]、端点优化对称延拓法[2]、镜像延拓法[3]、极值延拓法[4]、基于神经网络的数据序列延拓法[5]、基于AR时序模型的数据序列延拓法[6]等。这些方法都有各自的优势和局限, 因此本文研究了将端点优化对称延拓和镜像延拓相结合的方法来抑制端点效应。

2 基于端点优化对称延拓和镜像延拓的改进方法

2.1 端点优化对称延拓

信号的端点优化对称延拓方法, 基本思想是通过对信号和其包络线的偏差评价函数的最小化计算, 获取最佳的信号端点值, 在此基础上延拓信号的上、下包络线两端将最大化地逼近原始信号两端点, 在经验模式分解后续“筛选”IMF过程中抛弃两端延拓的数据, 将端点效应释放到原始信号以外。

对振动数据序列两端各延拓一个局部极值, 获取最佳的信号端点值。对于给定信号xi (i=0, 1, ...n-1) , 将其两端点值用β, α替代, 构造一个如下式的新数据序列xi′

为使有限长数据序列在保持本身结构特征不变的前提下得到加长, 以x0′, x′i-1两端点为中心对xi′分别向两边进行对称延拓得到如公式 (2) 表示的数据序列h。

式中, i=0, 1, …, n-1。应用三次样条插值方法, 样条函数为s (x) , 得到延拓信号h的包络线为S。若通过优化式 (2) 中未知两端点的值, 使包络线S与hi的偏差最小, 构建信号序列hi与其对应包络Si的偏差评价函数如下:

在,求解得到 β, α 的值即端点值。

这种方法在对复杂的非平稳非线性振动信号的分析中, 比较其它的延拓方法具有分解效果较好和效率较高的优势。但是, 这种方法也同样具有在每次分解出前一个IMF分量后再次进行延拓计算的缺陷, 对于柴油机复杂的振动信号分析时效率不高。

2.2 镜像延拓

形象地说就是把镜子放在具有对称性的极值位置, 通过镜像法把镜内信号映射成一个周期性的环形信号, 不存在端点, 从根本上避免了端点问题。

左镜放在信号左起向右的第l个极值处, 其相应的序列号:当镜面置于极大值处时, I1=Im (1) ;当镜面置于极小值处时, I1=In (1) 。

右镜放在信号右起向左的第l个极值处, 其相应的序列号:当镜面置于极大值处时, I2=Im (2) ;当镜面置于极小值处时, I2=In (2) 。新的信号序列 (t′, x′) :

镜像延拓法的优点在于将原始数据序列延拓成一环形数据, 求各IMF分量时, 对环形数据进行一次次筛选, 并把镜面以上的数据作为输出, 而不必每次对原始数据进行延拓, 所以运算速度大大提高。但是若原始信号数据的端点处不是极值点或中点, 会使延拓部分的均值与原始信号数据的均值相差很大, 而影响经验模式分解的效果甚至产生虚假分量。

本文提出的端点优化对称延拓和镜像延拓相结合的方法, 避免了单独采用端点优化对称延拓法在预测的点数较多会造成速度较慢, 以及单独采用镜像延拓法在处理端点不是极值点的短时间序列时效果不佳的问题。首先利用端点优化对称延拓法对振动数据序列两端各延拓一个局部极值, 获取最佳的信号端点值, 然后利用镜像延拓法把镜内的信号映射成一个不存在端点的环形信号, 完成经验模式分解过程。

3 仿真分析

为了验证改进方法的有效性, 利用仿真信号进行分析。仿真信号由一个200Hz的正弦信号, 一个基频为30Hz、调制频率为15Hz的调频调幅信号叠加而成, 其表达式为:

采样频率为1000Hz, 取512个数据点长度的仿真信号, 分别采用镜像延拓法和本文提出的改进方法进行分析, 原始信号的时域波形如图1所示。

图2、图3为两种分解方法得到的EMD分解结果, 省略了余项。图中C1和C2表示第1和第2个IMF分量。

从图2、图3的比较可以发现, 改进方法的分解结果要好于镜像延拓法的分解结果, 镜像延拓法的分解结果存在着明显的端点效应。对分解结果进行Hilbert变换, 得到时频谱图如图4、图5所示。

图4为应用镜像延拓法得到的时频谱图, 可以看出在信号两端出现了高频成分, 而仿真信号本身不包含这些成分, 是端点效应产生的信号失真。图5为本文改进方法得到的时频谱图, 较好地表现出仿真信号包含的时频信息。

对比镜像延拓法、端点优化对称延拓法和改进方法对仿真信号进行EMD分解的运算时间, 如表1所示。可以看出改进方法在计算效率上也有一定优势。

4 结束语

EMD方法是一种应用广泛的非平稳信号分析方法, 但是端点效应对其分析精度有很大的影响。通过将端点优化对称延拓和镜像延拓相结合的方法来抑制端点效应, 仿真分析表明该方法有效, 可以更加有效快速地解决端点效应问题, 准确分析出信号所包含的时频信息。

参考文献

[1]Huang N E, Shen Z, Long S R.The ernpirical mode de-composition and the Hilbrt spectrum for nonlinear and non-stationary time series analysis[J].Proc.Royal Society.London, 1998, 454 (12) :903-995.

[2]黄大吉, 赵进平, 苏纪兰.希尔伯特黄变换的端点延拓[J].海洋学报, 2003, 25 (1) :1-11.

[3]曹冲锋, 杨世锡, 杨将新.一种抑制EMD端点效应新方法及其在信号特征提取中的应用[J].振动工程学报, 2008, 21 (6) :588-593.

[4]Daji H.Practical implementation of Hilbert-Huang trans-form algorithm.Acta Oceanologica Sinica, 2003, 22 (1) :1-14-

[5]Deng Yongjun, Wang wei.Boundary processing technique in EMD method and Hilbert transform[J].Chinese Science Bul-letin, 2001, 46 (11) :257-263.

端点效应 篇3

电力系统中的谐波分析方法主要有傅里叶变换,小波变换等。傅里叶变换对平稳谐波的分析具有良好的效果,但是对于非平稳谐波、间谐波及分数阶谐波的分析却无能为力。小波变换中小波基的选择对分析结果影响较大,且一旦选择了某个小波基,则在整个分析过程中都无法更换,该小波基在全局上可能是最佳的,但对于某个局部来说却可能是最差的,故小波变换对信号局部没有自适应性[1]。

本文利用EMD方法[2,3]对谐波信号进行分解,通过EMD方法可以将任何复杂的谐波信号分解成有限个平稳的单分量信号。但是,在运用EMD方法对信号进行分解时,数据两端会产生发散现象,并且这种发散的结果会逐渐向内“污染”整个数据序列,使得分解结果严重失真[5,6,7,8]。

现已提出多种抑制端点效应的延拓方法,如人工神经网络[9], ARMA模型[10],SVM[11],镜像延拓[12]等,但这些方法都有各自的局限性,人工神经网络基于经验风险最小原理,容易形成局部极小点,且当预测的数据点较多时,导致速度太慢;AR及ARMA模型只适用于简单的非平稳信号;SVM对非平稳数据进行预测时,距信号末端越远的数据预测误差越大;镜像延拓一般要求把镜面放在极值点处,当无法确定信号端点是否为极值点时,最好截去一部分数据以便把镜面放在极值点处。如果处理一个短数据,不适合截去时,处理效果就会欠佳。

基于上面的分析,本文提出了一种支持向量回归机和镜像延拓相结合的新方法对短时间序列进行延拓。首先用支持向量回归机对短时间序列两端各延拓一个极大值和一个极小值,避免了预测数据较多造成预测误差较大的问题,再利用镜像延拓法中把镜内的信号映射成一个周期性的环形信号,不存在端点,从根本上避免了EMD中的端点问题。

本文将这种改进方法应用于谐波分析中,对稳态谐波,多频率谐波(包含分数次谐波,简谐波等)进行了分析,仿真结果表明该方法有效地抑制了EMD中的端点效应问题。

2 EMD方法

定义固有模态函数,它必须满足两个条件:1)在整个数据段内,其极值点的个数和过零点的个数必须相等或相差一个;2)在任意时刻,由局部极大值点和极小值点形成的上、下包络线平均值为零。

对于不满足IMF的复杂信号,用EMD方法对其进行分解,方法如下:确定信号s(t)的所有局部极大值点和局部极小值点,然后用三次样条曲线分别连接所有的局部极大值点和局部极小值点形成上、下包络线v1(t)和v2(t),求出上、下包络线的平均值m1, 然后求取s(t)与m1之差,即h1=s(t)-m1理想的若h1是一个IMF,则h1就是s(t)的第一个IMF分量。若h1不满足IMF的条件,把h1作为原始数据,重复以上过程,直到h1满足IMF的条件为止。令c1=h1k,且c1为信号s(t)的第1个IMF分量。将c1从s(t)中分离出来,得到r1=s(t)-c1,将r1作为原始数据重复上述过程,得到s(t)的第2个IMF分量c2,重复循环n次,得到信号s(t)的n个IMF分量。这样就有r1-c1=r2,…,rn-1-cn=rn,当rn成为一个单调函数不能再从中提取IMF分量时,分解过程结束,rn称为残余函数。于是s(t)=i=1nc1+rn

3 改善EMD中端点效应的新方法

3.1 仿真信号的延拓及EMD分析

仿真信号: x(t)=4cos(8πt)+cos(4πt)+0.5cos(πt), -0.45≤t≤0.45s,采样频率200Hz,数据点数为N=181,数据序列为s(1),s(2),… ,s(181),如图1所示,该数据序列存在三个极大值和四个极小值,由于数据序列很短,产生的端点效应会向内“污染”整个数据序列,图1中c1,c2和c3为采用带镜像延拓法分解得到的各IMF。应用EMD方法得到的第一个IMF分量c1的频率最高,c2的频率次之,依次降低。可见c1、c2和c3都失去了本来的特征,尤其是c3,理论上c3=0.5cos(πt),但是在图1中c3是幅值频率均为零的直线,完全失去了原来的物理意义。

为了改善EMD中的端点效应,本文提出用支持向量回归机与镜像延拓相结合的新方法对时间序列进行延拓。应用SVM对时间序列进行延拓,首先考虑向后延拓的情况,选择精度参数ε=0,惩罚参数C=∞,损失函数采用线性ε不敏感损失函数,核函数为线性核函数,训练样本数l=177,训练样本集L={(x1,y1),…,(x177,y177)},其中yi=s(i+4),xi=[s(i)s(i+1)…s(i+3)]T,i=1,2,…,177。构造回归模型,就可以预测边界外的第1个预测值s(182),再将s(182)作为原始数据新的边界点,就可以得到第2个数据序列的延拓值s(183),以此类推,本文向后延拓了40个数据点。同理,向前也延拓40个数据点。延拓后的信号如图2(a)所示。图中实线为采用SVM延拓后的信号,虚线为真实信号,可以看出预测信号基本上与真实信号重合。图2(b)中的实线为采用BP神经网络方法延拓后的信号,虚线为真实信号。两种延拓方法的比较见表1,对于该仿真信号,SVM预测的信号与原始信号误差的均方值要比BP神经网络的稍大点,但是SVM的训练时间要比BP神经网络短得多。相同结构的BP神经网络对不同的信号延拓效果也不相同(见表2、3),所以神经网络具有结构和类型的选择过分依赖于经验等固有缺陷。而支持向量机克服了这些缺点,对于不同的信号都可以得到满意的结果,稳定性好。

为保证预测的精度,用SVM预测的数据不能太多,若直接对图2(a)中的延拓信号s(t)用EMD方法分解,由于延拓后的数据序列还是很短,其效果并不理想,所以本文在SVM延拓的基础上,再对延拓后的信号用镜像延拓法映射成一个周期性的信号,不存在端点,因而从根本上避免了EMD中的端点问题。用SVM对数据两端各延拓一个极大值和一个极小值,避免了镜像延拓对原始短时间序列处理效果欠佳的问题。

本文对图2(a)中的延拓信号用带镜像延拓法的EMD方法进行分解,所得各IMF见图2(c)所示。其中实线为预测信号的分解,虚线为真实信号的分解。c1、c2与真实的IMF完全重合,只有c3的误差稍大一点,这是由于c3的频率最低,特征尺度最大,边界效应容易向内“污染”整个数据序列。但是考虑到c3只有半个波形,且与真实的IMF的误差很小,处理效果已经相当令人满意。

3.2 谐波信号的延拓及EMD分析

谐波信号:s(t)=sin(100πt)+0.6sin(200πt),0≤t≤0.06s采样频率为2000Hz,如图3s(t)所示,直接对其分解得到的各IMF如图3中c1、c2和r所示。理论上,当t=0时,c1和c2的幅值也应该为零,而图中c1和c2都不过原点,所以直接用镜像延拓法处理短数据序列的端点效应效果不佳。

采用SVM和BP神经网络对谐波信号延拓后的信号见图4(a)和(b)。表3对这两种方法进行了比 较,可见,无论训练时间还是延拓信号与真实信号误差的均方值,SVM的效果都优于BP神经网络。因为这里的谐波信号是一个规则的周期信号,这两种延拓方法所延拓的信号与真实信号误差的均方值都几乎为零,差别主要体现在训练时间上。

用带镜像延拓法的EMD分解方法对图4(a)中的延拓信号进行分解,并取原始信号长度,得到各IMF如图4(c)所示,分解出的IMF分量c1和c2是幅值分别为0.6和1,频率分别为100Hz和50Hz的2次谐波和基波,r为残差信号,几乎为零。实际输出与理论分析完全相符。

3.3 多频谐波信号的延拓及EMD分析

某电力系统中Y,y联结变压器中的多频谐波信号如图5中s(t)所示,采样频率为1000Hz,用带镜像延拓法的EMD方法对其进行分解,得到各IMF如图5中的c1、c2、c3、c4和r所示。各IMF的边界都出现了不同程度的边界效应。由于信号的特征尺度都较小,所以只在信号的两端产生误差,并没有向内“污染”整个数据序列。

采用SVM和BP神经网络分别对图5中的多频谐波信号s(t)进行延拓如图6(a)、(b)所示。SVM的效果比BP神经网络的好,其比较如表3所示。对图6(a)中的延拓信号用带镜像延拓法的EMD程序分解,最后取原始信号长度,所得各IMF如图6(c)所示,支持向量回归机和镜像延拓相结合的延拓方法较好地抑制了EMD分解时的边界效应问题。

4 结语

本文提出的基于支持向量回归机和镜像延拓相结合的数据延拓方法,结合了两种延拓方法的优点,并且避免了其各自的缺点。通过对短时谐波数据的仿真分析,验证了该方法能有效地抑制EMD方法中的端点效应问题,使得谐波分析结果更加令人满意。

参考文献

[1]于德介,程军圣,杨宇(Yu Dejie,Cheng Junsheng,YangYu).机械故障诊断的Hilbert-Huang变换方法(Hilbert-Huang Transform method for diagnosing of mechanismmalfunction)[M].北京:科学出版社(Beijing:SciencePress),2006.

[2]Huang N E,Shen Z,Long S R,et al.The empirical modedecomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc.Royal Society ofLondon Series A,1998,454:903-995.

[3]杨世锡,胡劲松,吴昭同,等(Yang Shixi,Hu Jingsong,Wu Zhaotong,et al.).旋转机械振动信号基于EMD的希尔伯特变换和小波变换时频分析比较(Comparison ofvibration signals’time-frequency analysis between EMD-basedHT and WT method in rotatin machinery)[J].中国电机工程学报(Proc.CSEE),2003,23(12):102-107.

[4]李天云,赵妍,季小慧,等(Li Tianyun,Zhao Yan,JiXiaohui,et al.).HHT方法在电力系统故障信号分析中的应用(Application of HHT method for analysis of faultsignal in electric power system)[J].电工技术学报(Trans.China Electrotechnical Society),2005,20(6):87-91.

[5]赵进平(Zhao Jinping).异常事件对EMD方法的影响及其解决方法研究(Study on the effects of abnormal events toempirical mode decomposition method and the removal methodfor abnormal signal)[J].青岛海洋大学学报(J OceanUniv.of Qingdao),2001,31(6):805-814.

[6]张郁山,梁建文,胡聿贤(Zhang Yushan,Liang Jianwen,Hu Yuxian).应用自回归模型处理EMD方法中的边界问题(Application of AR mode to improve end effect of EMD)[J].自然科学进展(Progress in Natural Science),2003,13(10):1054-1059.

[7]Zeng Kan,He Ming-Xia.A simple boundary processtechnique for empirical decomposition[A].IGARSS 2004[C].AK,USA,2004.4258-4261.

[8]盖强,马孝江,张海勇(Gai Qiang,Ma Xiaojiang,ZhangHaiyong).一种消除局域波法中边界效应的新方法(New method for processing end effect in local wave method)[J].大连理工大学学报(J Dalian Univ.of Tech.),2002,41(1):115-117.

[9]Deng Yongjun,Wang Wei.Boundary processing technique inEMD method and Hilbert transform[J].Chinese ScienceBulletin,2001,46(11):257-263.

[10]程军圣,于德介,杨宇(Cheng Junsheng,Yu Dejie,YangYu).Hilbert-Huang变换端点效应问题的探讨(Diacussion of the end effects in Hilbert-Huang transform)[J].振动与冲击(J Vibration and Shock),2006,24(6):40-47.

[11]程军圣,于德介,杨宇(Cheng Junsheng,Yu Dejie,YangYu).基于支持矢量回归机的Hilbert-Huang变换端点效应问题的处理方法(Process method for end effects ofHilbert-Huang transform based on support vector regressionmachines)[J].机械工程学报(Chinese J MechanicalEng.),2006,42(4):23-31.

声音端点的检测方法 篇4

关键词:端点检测,模型,过零率

1 引言

在现代社会人类进行交流, 最方便和快捷的方式毫无疑问那就是语音的交流。提高语音的传播速度, 扩大云因的传播内容, 一直是工程人员的一个研究的重点, 如何能够实现云因的人类还有机器人的互相交互, 提高语音功能的智能化, 一直是语音信号处理研究领域中的重要研究课题。然而语音端点检测它包括以下几项内容, 首先是要对语音进行分析, 然后还有语音的合成, 对语音系统进行编码处理, 还有一个更为重要的技术难题就是对说话者的说话内容要能够进行准确的识别也是一项十分重要的环节, 它将直接影响到后面一些列工作的实施还有就是工作进行的准确性。但是在实际的操作的过程中, 要做的第一步及是对系统的输入信号能够进行一个准确的判断, 语言的数据的准确性是保证和确定声音的端点还有尾点的关键所在, 因此这就会大大的增加准确性运算强度, 提高了学习效率, 同时降低了完成这项任务所需要花费的时间。

在日常的语音识别系统中, 首先是根据一定的端点检测算法, 对语音的信号进行分割处理, 语音信号一般分为有音信号, 还有无音信号, 两者是有很大区别的, 姐姐就是对有声片段进行处理, 这主要包括根据语音信号的某些明显特征进行处理。通过实验我们发现了一下几点现象, 首先是在安静的环境中, 语音系统识别的出错率, 都集中在端点位置上。从以上的实验中我们可以得出, 对语音的信号识别系统的检测就显得尤为重要。安静的环境如此, 在噪音的环境中更是如此, 如果不能保证端点检测的准确率, 会直接影响后续工作的进行, 所以我们必须保证准确性, 这是我们进行下面工作的前提保证。所以语音信号的准确还有语音信号的端点检测一直是现在进行研究的重难点分析。

2 语音信号的时域特征

2.1 短时能量分析

语音信号的强弱是由多方面决定, 其中一个关键点就是, 语音信号时间的长短问题, 这也是人们非常容易忽视的一个问题, 信号也会随着清浊音的变化从而发生一系列相应的变化, 通过总结和分析我们得出了一下的计算工程式:

从上述公式中我们看出, 函数也会随着短时能量的变化而发生相应的变化, 线性的高低都会出现一个冲突:

根据短时间的能量, 从而看出能量的高低会直接影响我们的所得数值的准确性, 因此通过总结研究得出以下方程式可以大大的提高运算的准确性。

2.2 短时平均过零率

大家都非常熟悉的一点是, 段时间的平均的过零率会对信号有着极为严格的要求, 平均值的准确性实际上就是所得符号它采集的准确性, 这都密不可分。根据短时能量的定律我们可以得出, 短时能量的大体位置和方向。

w (n-m) 为窗函数, 定义为:

Sgn[]是符号函数, 即

3 端点检测

3.1 端点检测介绍

识别语音信号的起止点是所有语音识别系统所必须经历的一个过程。只有保证起点还有终点的准确率。这样我们才能保证我们测试出的结果是正确的, 这样也能够保证我们的数据分析得出的结果是准确的。通过这样的方法, 不但降低了我们数据量的采集, 还有就是降低了运算的工程量还有处理的时间, 这些方面的提高都会在一定的程度上降低我们的出错率。人类的声音也是各有特色的每个人都有每个人的特点, 但是从总体上我们可以大体分为两个部分首先第一个就是清音, 第二个是浊音。这两种声音是有很大不同的, 平常我们所采用的端点检测方法, 大多数会采用特征提取方法。根据这两种声音的发生规律, 对其进行比较和研究, 将该特征和设定的门限进行比较或是采取某种判决机制来判断。

在日常的语音识别过程中, 过零率的端点检测, 是最普遍的语音端点检测的方法, 它有明显的物理意义, 而且计算的过程也是相对的简单, 他的这些优点, 使它在端点的实际操作中得到了最为广泛的应用。但是任何事物都具有它的两面性, 因此他也具有不可否认的缺点, 而最根本最实际的判断的标准就是根据我们日常积累的实际经验才判断们限的端点问题。

3.2 双门限端点检测算法

对过零率的端点的检测都是采用2级的判断的方法, 第一步就是根据平均值进行第一次判断, 接下来在这个基础上, 我们再利用段时间平均的过零率统一进行第二次判断。之所以我们不用段时间判断作为第一判断, 原因就是段时间的判断不能准确的得出起点的关键位置, 因此为了增加我们判断的准确率, 通常是常采用双门限的方法, 通过比较得出一个准确的答案。

从图1我们可以看出, 符值都会在这个限度范围之内。通过这个步骤我们可以进行第一次初步的判断。如果进行语音测试的语音落在了, 这个起止点所对应的时间的间隔之外 (即AB段之外) 。接下来, 要做的事要在噪声的情况下, 对语音进行数据研究分析, 我们通过分析, 得出以下两个公式, 从这公式中我们可以清晰地看到, 平均值准确性, 完全是由多级判断而决定的, 语音的起点还有结束的尾点都至关重要。

3.3 基于调频-调幅模型的语音端点检测技术

双门限检测方法我们在上文介绍中, 已经提到了就是要根据我们以往的经验值, 来判断一个大概的经验值, 榆次同时呢, 要对判断结果进行二次判断, 得出一个相对来说更为准确的门限值。这样也会增加我们判断的误差。与之相反的如果我么采用而运用Teager能量算子判断, 这样既可以反映幅值的变化, 同时也能反映出频率的变化。判断他们是成正想观性还是负相关性, 是不是频率的的增加, 频率也会增加。能量的输出值是不是也会随之发生相应的改变, 同时呢, 在针对不同类别的信号时, Teager能量算子的输出也反映出不同的特性。因此, 能量算法的使用非线性能量算子来跟踪语音信号, 这是我们语音信号系统的一个创新之举, 不在是单纯的靠单个共振峰的语音信号能量的检测进行分析:

可以看出R (n) 信号的能量算子输出由两部分组成:一部分频率调制后的瞬时频率, 另一部分是幅值调制后的幅值包络, 它可以反应出幅值和频率的变化。根据这个特点可以进行以Teager能量算子输出的能量为特征的端点检测。

4 结论

本篇论文主要是对声音端点检测的方法进行研究, 我们通过双门限的检测方法, 可以高效的将频率与幅值完全给结合起来, 这种方法的检测要比以往的传统的能量进行端点检测得到更为准确的结果。但是万物都存在着优点还有缺点, 如果在噪音较大的情况下, 我们的检测结果也是不准确的, 在没有噪音干扰的情况下它的检测结果就会提高, 同时信号不是很强的情况下, 它的结果也不是很准确。

参考文献

[1]赵力.语音信号处理[M].北京:机械工业出版社, 2003.

[2]易克初.语音信号处理[M].北京:国防工业出版社, 2004.

[3]王炳锡, 屈丹, 彭煊.实用语音识别基础[M].北京:国防工业出版社, 2005.

[4]雷静.语音识别技术的研究及基本实现[D].武汉:武汉理工大学, 2002.

[5]张雄伟, 陈亮, 杨吉斌.现代语音处理技术及应用[M].北京:机械工业版社, 2003.

上一篇:专业化综述下一篇:区域辐射中心