混叠信号分离

2024-08-12

混叠信号分离(共3篇)

混叠信号分离 篇1

摘要:在敌我识别(IFF)信号侦察中,侦收到的IFF信号存在混叠现象,严重影响了信号分选、解码和模式识别。采用基于盲源分离思想的独立分量分析方法,首次将等变化自适应(EASI)算法应用到混叠敌我识别信号分离中,该算法选择四阶累积量——峭度作为目标函数实现混叠IFF信号的分离,并通过仿真验证了该算法的可行性和有效性。

关键词:敌我识别,盲源分离,独立分量分析,EASI

0 引言

现代战场上,舰机目标相互之间传输的敌我识别 (IFF)信号含有大量军事情报信息。通过信号侦察接收被侦察方询问、应答设备辐射出的信号,并对截获的IFF信号进行处理分析,就可以提取出对方飞机和舰艇的重要信息,为军事作战提供情报保障。然而在实际的信号侦察中,不可避免地存在信号相互混叠的现象,对信号解码、模式识别造成影响,因此实现混叠信号的分离,对IFF信号侦收获取具有重要意义。

目前已有相关文献提出一些针对信号分离的方法,如文献[1]中提到的滑窗点迹录取和单脉冲点迹录取可实现简单混叠信号的分离,这2种方法在民航系统中应用较多;文献[6]采用快速定点算法实现混叠IFF信号分离,此方法具有较好的收敛性,但计算量大,源信号数目增加时,算法性能会变差,同时该算法不适于信号的实时处理。下面将采用基于盲源分离的——EASI[5]算法,研究IFF混叠信号的分离问题,通过控制步长参数的变化跟踪时变的源信号,达到算法收敛性和稳定性的平衡。

1 盲源分离

盲源分离技术可从复杂的信号传输通道中有效地提取或恢复人们希望得到的信号成份,因此在地震勘探、语音信号处理和生物医学工程等信号处理领域,盲源分离技术得到了广泛的应用。盲源分离的模型如图1所示。

图1中信号接收机接收的信号为观测向量x(t),信源发射的信号为源向量s(t),混合矩阵A表示的是信号的混合情况,A中的元素和源向量均是未知的。利用观测向量和学习算法寻找分离矩阵W,使得输出向量y(t)是源向量的拷贝或估计,便是盲源分离问题。

目前,盲信号处理的方法有:盲辨识、盲抽取和独立分量分析(ICA)等多种,这里选取的EASI算法属于ICA 方法。

2 独立分量分析

ICA方法利用源信号统计独立等容易满足的先验条件,能够从混合信号中重现不可观测的各种源信号分量,是阵列信号处理和数据分析的有力工具。

独立分量分析的目标就是找到分离矩阵W,使得y(t)=Wx(t),其中y(t)的各个分量之间尽可能地相互独立,此时将y(t)看作是对源信号s(t)的恢复。由于A和s(t)未知,导致基于ICA的分离算法实现信号分离的解存在2个不确定性:尺度不确定性和分离出的信号的次序不确定性。但信号波形往往携带所需的信息,所以分离结果的2种不确定性不会对工程问题造成不利影响。

基于独立分量分析的盲源分离算法推导思想可归结为:首先选择目标函数,然后采用某种学习算法最优化目标函数,进而搜索目标函数的极值点。这里采用四阶累积量——峭度[3]作为目标函数。

峭度定义如下:

Kurt(s(t))=c4[s4(t)]=E[s4(t)]-3{E[s4(t)]}2。 (1)

通过计算可知,若源信号为高斯信号则其峭度Kurt(s(t))=0;当Kurt(s(t))<0时,称源信号s(t)为亚高斯信号,其概率分布比高斯信号要平,当Kurt(s(t))>0时,称s(t)为超高斯的,其概率分布比高斯信号要陡。

峭度可用来衡量信号高斯性,定义峭度作为代价函数,就是用峭度来衡量信号与高斯分布的距离。在盲源分离中,观测信号是源信号的线性叠加,由统计学理论可知,观测信号的高斯性比源信号更强,因此,盲源分离的过程就是分离信号各分量非高斯性增强的过程。

3 算法及性能指标

3.1 EASI算法

1996年,Cardoso和Laheld提出了一种借助独立性的等变化自适应分离算法——EASI算法,该算法对已知高斯性的盲信号分离很有效,在盲分离中引入目标函数的“相对梯度”这一新概念,通过EASI学习算法使目标函数取得极大或极小值,确定分离矩阵W使变换后的输出向量y(t)尽可能的统计独立。

EASI算法有较好的收敛速度和稳定性,同时可以保证分离矩阵的正交性。算法的等变化性具体体现在算法的收敛速率和稳定性条件只和源信号的概率密度分布有关,与源信号如何混合无关。

实际中,多个传感器检测到的混合信号中难免有相关成分,采用白化处理可以实现混合信号各分量的不相关,将白化矩阵V作用到观测数据上从而得到白化数据z(t),对白化的观测数据进行处理时效果会更好;另外还需一个正交矩阵U作用到预处理的白化数据上从而得到盲分离信号。因此分离矩阵可表示为W=UV,通过计算单位矩阵I和白化信号z(t)之间的K-L散度的相对梯度得到求解白化矩阵的自适应串行白化算法:

Vt+1=Vt-μ(z(t)z(t)T-I)Vt。 (2)

式中,z(t)=Vx(t)。

观测信号白化后得到白化信号之间的自协方差矩阵为单位矩阵,因此目标函数可简化为:

undefined。 (3)

通过计算上述目标函数的相对梯度得到正交约束下的相对梯度盲分离算法:

Ut+1=Ut-μ(ᐁϕ-ᐁϕT)Ut。 (4)

式中,∇ϕ为目标函数的相对梯度。

由W=UV可得Wt+1=Ut+1Vt+1,即式(4)与式(2)相乘得到:

Wt+1=Ut+1Vt+1=

[Ut-μ(ᐁϕ-ᐁϕT)Ut]×[Vt-μ(ztzTt-I)Vt]=

{I-μ[y(t)y(t)T-I+ϕ(y(t))-ϕ(y(t))T+

O(μ2)]}Wt。

忽略μ2项便得到了EASI算法迭代公式为:

W(t+1)=W(t)+μ(I-ϕ(y(t))yT(t)+

y(t)ϕT(y(t))-y(t)yT(t))W(t)。

式中,ϕ(y(t))为y(t)的非线性变换函数,与信号的概率密度函数(pdf)有密切关系,算法迭代过程中采用信号的pdf是不实际的,采用与实际信号的概率密度函数相近的pdf同样可以得到正确的结果,根据亚高斯信号和超高斯信号的不同分布特性,选择不同的非线性函数ϕ(y(t))。通过分析信号的峭度可知,这里涉及到的IFF信号为超高斯分布,因此仿真试验中,选取的非线性函数为:

ϕ(y(t))=tanh(10y(t))。

步长参数μ的选择也很重要,过大会导致整个算法不稳定,选择过小会影响到算法的收敛速度。步长参数的选择与信号的采样频率有关,一般可选择为采样频率的倒数,作为自适应算法,在合理的情况下,算法在收敛过程中,开始收敛时解混矩阵变化大,接近收敛时,矩阵W变化很小,所以选择步长参数时,可令μ为递减的非线性函数。

这里用于算法仿真的数据为实际采集数据,如果选择固定的步长参数,算法极有可能发散,考虑采用减函数1/(a+bn)作为步长参数,其中选择a为采样率的1/50,b为略大于1的数1.001。在迭代过程中步长参数的值逐渐减小。

3.2 算法性能指标

为了评价EASI盲源分离算法的分离性能优劣,这里采用性能指数作为算法的性能指标。

性能指数PI[2]的定义如下:

undefined

式中,C=AW={cij}为全局传输矩阵(合并的混合—分离矩阵),当分离出的信号y(t)与源向量s(t)波形完全相同时PI=0,分离效果越差,PI的值越大。

4 仿真结果及分析

敌我识别信号不同于通信、雷达信号,其具有特定的信号格式和载频(询问信号为1 030 MHz,应答信号为1 090 MHz),采用多通道信号接收机可实现询问、应答信号的分别采集。因此,混叠现象仅发生在同类信号之间。

文中的仿真实验在MATLAB环境下实现,针对同类信号混叠的情况,采用实际的IFF应答信号(Mark X),其采样率为100 MHz。图2(a)和图2(b)所示为来自不同信源相互独立的源信号。通过满秩矩阵将2路源信号混合,得到需要分离的2路混叠信号,如图3(a)和图3 (b)所示。采用文中所述的EASI算法进行实验仿真得到分离结果,如图4所示。

采用EASI算法对上述混合信号进行分离,从图4(a)和图4 (b)中可以看出,混合信号得到了很好的分离,因受盲源分离2个不确定性的影响,输出信号的幅度和次序发生了变化。

由混合矩阵A和解混矩阵W得到的性能指数变化情况如图5所示,从图中可以看出算法的性能指数变化范围很小,即采用自适应步长,算法较稳定。因受到噪声等因素影响,图中性能指数值PI无法无限接近于0,即分离信号和源信号的波形不能达到完全一致,虽然存在差异,但不影响信号分选和解码。

5 结束语

上述首次将EASI算法应用到IFF信号的分离,从信号的仿真结果来看,虽然分离后的信号幅度和信号次序发生了变化,但清晰可见与源信号的波形差别不大,因此采用EASI算法实现敌我识别信号的分离是可行和有效的。基于盲分离的混叠敌我识别信号分离研究刚起步,还有许多问题待研究,例如在由于噪声存在,性能指数受到影响,无法无限趋近于0;采用峭度作为目标函数寻求独立分量时,容易受到大幅度随机脉冲的烦扰,影响算法的稳定性;若时变步长参数μ的值在每次迭代过程中根据算法中其他参数的变化而做出相应的调整,算法的收敛速度和跟踪能力效果会更好,等等。对上述问题还需进一步研究。

参考文献

[1]张尉.二次雷达原理[M].北京:国防工业出版社,2009.

[2]马建仓,牛奕龙,陈海洋,等.盲信号处理[M],北京:国防工业出版社,2006.

[3]李著成.基于独立分量分析盲源分离算法的研究[D].太原:太原理工大学,2006:23-40.

[4]由科军.盲信号分离算法研究[D].西安:西安电子科技大学,2009:17-25.

[5]CARDOSO JF,LAHELD B.Equivariant Adaptive SourceSeparation[J].IEEE Trans.Signal Processing,1996,44(12):3017-3029.

[6]顾军,胡显丹.基于FastICA算法的敌我识别信号分选方法研究[J].舰船电子对抗,2009(10):19-22.

混叠信号分离 篇2

关键词:峭度,盲源分离,极大化非高斯性

一、引言

通信中的基本问题是要在一端精确或近似地有选择地再现另一端的信息(Claude Shannon,1948)。盲源分离是在缺乏混合系统和源信号先验知识的条件下,仅通过观测信号来恢复出源信号,从而再现另一端的信息,已经成为目前数字信号处理领域中最热门、最前沿的研究方向之一,并在语音信号处理、特征提取与图象处理、无线通信的信号处理、生物医学信号分离(脑电图EEG、脑磁图MEG、心电图ECG、肌电图EMG)等领域得到了广泛的关注[1]。

在语音信号处理领域,目前的语音识别与降噪增强算法仅能够识别和处理混有环境噪声的语音信号,而对于人声作为背景噪声的混叠语音信号就无能为力,而盲源分离算法不受话音信号基音和谐波等声音特征的影响,在没有目标语音信号的先验信息条件下,通过利用麦克风阵列来模仿人类的耳朵,将采集到的混叠话音信号进行分离,从而提取出我们感兴趣的目标语音。尤其在数字移动通信高速发展的今天,如何从比较嘈杂的话音环境中分离出我们感兴趣的话音信号,提高输入信号的可懂度将具有广阔的应用前景。

二、盲源分离基本理论

盲源分离起源于对“鸡尾酒会问题”(Cocktail-PartyProblem)的研究,即人耳可以在多人声嘈杂环境中专注于某个人的声音,从而提取出我们感兴趣的目标话音信息,而我们通过现代仪器却很难模拟实现人耳的这一功能。如果没有任何假设条件和先验信息,仅由观测信号来确定源信号,从数学原理上讲是不可能的。但是出人意料的是,在一个非常宽松的假设条件下,即假定源信号矢量的各个分量是彼此独立的,同时允许一定的模糊性存在(信号幅度的不确定性和信号分量顺序的不确定性),这一问题通过盲源分离算法是可解的。

1. 极大化非高斯性原理

根据中心极限定理的重要推论,在一定条件下,彼此相互统计独立的随机向量和的分布趋向于正态(高斯)分布.换句话说,两个相互统计独立的随机向量的和比其中任何一个参与求和的随机向量更加接近高斯分布.我们可以如下式来进行逆运算:

这样,为了估计一个独立成分,我们考虑的线性变换:

其中w是我们要估计的分离矩阵.同时可知,说明y是si的某个线性变换.令,则上式可以表示为:

由上式我们可以看出,如果wT是混合矩阵A的逆的其中一行时,则线性变换wTx刚好就是我们想要的一个独立成分。我们可以通过改变系数向量q是来使得y=qTs的分布情况相应产生变化。由中心极限定理,两个独立随机向量的和比其中任何一个随机向量的高斯性要强,由于qTs=wTx,我们可以通过寻找最优分离矩阵w使得wTx的非高斯性极大化,则y就是一个独立成分,即极大化wTx的非高斯性便可得到混合向量中的一个最接近于源信号的独立成分[2]。

2. 非高斯性的度量

为了在盲源分离算法中使用非高斯性原理,我们必须对一个随机向量的非高斯性定义一个量化的指标。非高斯性的程度在实际计算中通常采用四阶累积量即Kurtosis(峭度)来度量。

对于零均值单位方差的随机向量,上式变为:

上式中,当随机向量为高斯分布时,峭度值为零,而超高斯分布的峭度值大于零,亚高斯分布的峭度值小于零,并且随机向量的非高斯性越强,峭度的绝对值越大。

三、基于峭度的渐进正交化不动点算法

快速不动点算法是由Hyvärinen等人提出来的,该类算法有基于峭度最大、基于负熵最大、基于似然最大等形式,这里,我们介绍一种基于峭度最大的渐进正交化不动点算法。

为了得到极大化峭度的绝对值,我们可以从某个初始向量w开始,依据可用的样本值z(z为PCA白化预处理过的数据),计算出使y=wTz的峭度绝对值增大最快的方向,然后将向量w转到该方向。由公式1.5知wTz的峭度绝对值的导数为:

在上式中,对于已PCA白化过的数据,有。由于我们是在单位球上进行优化,在每一步运算后应将w投影到单位球上,即将w除以其范数即可。令式(1.7)中峭度的梯度与w相等,可以得到:(1.8)在每次不动点迭代后,w都要除以其范数以满足相应的约束,我们可以首先计算式(1.8)右边的项,并将其赋给w作为新值:(1.9)最后收敛的向量w以y=wTz的线性组合形式可以给我们其中一个独立成分。在白化空间中,不同的独立成分对应的向量wi是彼此正交的,根据这一特性我们可以对已估计出的独立成分进行渐进正交化,即一个接着一个地将独立成分估计出来,这样可以避免算法的多个独立成分同时收敛于同一个峭度最大值上。

然后再对wp+1标准化:除以其范数即可。在算法的稳定收敛处,wp和wp-1应该具有相同的方向,即迭代前后wp和wp-1的点积应该几乎等于1,由此可以进行算法收敛的判定。当p等于需要估计的独立成分数目时即完成ICA算法的分离运算,得到独立成分out=wpTz。

四、算法的分离仿真及性能分析

为了验证本文算法在混叠语音信号分离中的应用,我们采用MATLAB7.3进行算法的仿真。试验语音信号是在5×6×3m的普通实验室通过PC机自带的麦克风所采集到的四个语音信号,录音长度为6s,采样频率为16000Hz,s1.wav为一段英文歌曲,s2.wav为一段中文朗读,s3.wav为阿拉伯数字1~10的英文读法,s4.wav为阿拉伯数字1~10的藏语读法,用随机矩阵A对四个源语音信号进行混合,并加入一定程度的高斯白噪声,然后执行本文算法进行分离实验,源语音信号和从带噪混叠信号中分离出的语音信号波形图如图1、图2所示:

通过PC机的音响分别播放分离出的四个语音信号,可以准确地获得源信号所载的语音信息,验证了该算法的可行性。通过对比源语音信号与分离后的语音信号波形图可以发现除了信号顺序的不确定性外,两者波形信息非常接近,播放后的语音与源语音十分相似。

为了找到一种更适合处理带噪混叠语音信号的盲源分离算法,特将本文算法与目前比较成熟的基于信息极大化的Infomax算法和基于高阶累积量的JADE算法进行对比,以下将分别对三种算法的分离结果进行定性和定量的对比分析。

1. 定性对比分离前后信号的语谱图

与四个源语音信号分别对应的三种分离算法分离出的信号语谱图如图3所示:

在图3所示的语谱图中,从上到下依次为:源语音信号、本文算法、Infomax算法、JADE算法。在语谱图中,横坐标表示时间,纵坐标表示频率,而每像素的灰度值大小(颜色的深浅)反映相应时刻和相应频率的信号能量密度。语谱图中的花纹有横杠、乱纹和竖直条等,横杠是与时间轴平行的几条带纹,它们是共振峰,从横杠对应的频率和宽度可以确定相应的共振峰频率和带宽;竖直条是语谱图中出现与时间轴垂直的一条窄条,每个竖直条相当于一个基音,条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音周期,条纹越密表示基音频率越高。从源信号和不同算法分离出信号的语谱图上可以看出,本文算法分离后的语音频谱的共振峰和基音分布最接近于源信号语谱图,只是在频谱的能量(语谱图上表现为颜色的深度)略有差别,听觉上效果更接近于源信号。

2. 定量对比不同算法的分离性能

我们还可以通过分析不同算法分离后语音信号与源信号的相似系数来衡量不同ICA算法的性能优劣,si为源语音信号,outi为分离后的语音信号,我们定义相似系数如下式:

其中,cov(si,outi)为si与outi之间的协方差。当ICA算法的分离结果outi确实是源信号si的较好估计时,将有接近于1,表示分离成功,当接近于0,表示分离失败[3]。

对于不同算法计算的如图4所示:

从上图可以看出本文算法分离出的各个语音信号的相似系数均很接近于1,表明分离成功,用扬声器播放出分离后的信号可以轻松地获得语音信号中所携带的信息;而另外两种算法对于带噪的混叠语音信号分离效果不佳,有些分离结果接近于0,用扬声器播放出这些分离后的信号明显混有多个源信号,而且可懂度不高。对比三种算法的分离结果,明显看出本文算法对于多人声带噪混叠语音信号的分离效果要优于JADE算法,而Infomax算法效果最差。

六、结束语

仿真试验结果表明本文介绍的基于峭度的渐进正交化不动点盲源分离算法是有效的,对于带噪的混叠语音信号具有较好的分离效果,无论是分离出语音信号的信噪比和相似系数均高于其他两种算法,同时继承了不动点迭代的优点,计算简单,收敛速度快,迭代稳定,一般5步之内就能达到收敛。但基于峭度的方法也有不足之处,因为峭度可能对野值极其敏感,所有该算法的鲁棒性有待进一步提高。

参考文献

[1]A nd r zej CICHOCK I,Shu n-ich i A M A R I;Adaptive Blind Signal and Image Processing[M].JOHN WILEY&SONS,Ltd.2002.

[2]Aapo Hyvrinen,Juha Karhunen,Erkki Oja;Independent Component Analysis[M].A Wiley-Interscience Publication.JOHN WILEY&SONS,INC.2001.

混叠信号分离 篇3

关键词:基于奇异值分解的聚类分析,最小相关准则,波形恢复,独立分量分析,小波包分解

0 引言

许多应用领域中, 如声源识别、 声学故障诊断等都面临着多个混叠声源的分离与波形恢复问

题[1,2,3]。只有使用合适的方法分离并恢复有用的声源信号波形, 才能正确识别与评价主噪声源;在声学故障诊断中, 多通道声观测的冗余特性及外来干扰噪声往往影响后续的特征提取工作, 使得故障诊断变得困难, 因此有必要采取适当的方法加以解决。

传统的源波形恢复方法, 往往过分依赖于源信号类型相关的详细知识或信号传输系统特性的精确辨识, 实用性较差[3,4]。近年来出现的独立分量分析 (independent component analysis, ICA) 方法, 为此问题的解决提供了一个新的手段[5]。统计意义上, ICA相当于一种冗余取消技术, 其典型应用为盲源分离 (blind source separation, BSS) 。利用ICA (BSS) , 仅从传感观测出发即可实现传输系统特性的辨识与源波形的估计, 显然这是一种‘盲’的信号处理方法, 也是ICA (BSS) 的优势所在。但是, 实际的声学环境中通常存在着强烈的干扰噪声, 这使得仅仅利用ICA (BSS) 进行混叠声源分离还难以获得满意的波形恢复效果, 从而限制了这种方法的进一步应用。

通过联合应用基于独立分量分析 (ICA) 的盲源分离 (BSS) 与基于小波包分解 (wavelet packet decomposition, WPD) 的信号去噪, 提出一种混叠声源信号分离与波形恢复的新方法。仿真与现实声源波形恢复实验的结果证明了该方法的有效性。

1 FastICA基盲源分离

某些情况下, 多个声源混合过程可建模为如下的线性瞬时混叠模型[2]:

x (t) =As (t) +n (t) (1)

式中, x (t) 为M维传感观测向量;s (t) 为未知的N维源向量, 通常M>N;A为一个未知的M×N混合矩阵;n (t) 为外加噪声向量。

FastICA[6]是一种基于固定点迭代的快速独立分量分析算法。算法实施中, 采用如下的最大熵原理来近似负熵:

J (yi) ≈c[E{G (yi) }-E{G (v) }]2 (2)

式中, G (·) 为任意非二次函数;c为常数;v为一个标准化的 (即零均值单位方差) 高斯变量;yi为假设的零均值单位方差随机变量。

算法通过如下参照的最大化寻找一个独立分量或投影追求方向yi=wTx, 从而实现估计源互信息的最小化:

JG (w) ≈[E{G (yi) }-E{G (v) }]2 (3)

这里分离矩阵wM维 (权) 向量, 并且满足约束条件E{ (yi) 2}=1。从而, ICA模型的估计可归结为如下的优化问题:

Argmaxi=1ΝJG (wi) wrt. wi i=1, 2, …, N

满足E{ (wTkx) (wTjx) }=δj k (4)

当优化问题收敛时, 每个wi (i=1, 2, …, N) 给出w的一个行向量, 从而由s=wx给出ICA问题的解。

2 ICA-WPD基混叠声源波形恢复

2.1 WPD基信号去噪

小波变换 (WT) 与小波包分解 (WPD) 已在信号压缩与去噪、时频特征分析、状态监测等方面得到广泛应用[7,8]。对于任意信号x (t) 关于时间τ、尺度a的连续小波变换为

WΤx (a, τ) =1ax (t) ψ* (t-τa) dt (5)

式中, ψ为一个基本小波或母小波。

WT的实质是以小波基函数的形式将信号x (t) 分解为不同频带的子信号。

小波包分解可视作小波变换在多分辩分析意义上的进一步推广, 它同时对信号的低频、高频部分进行多层次划分, 实现更加精细的分析。利用WPD, 信号x (t) 可正交展开成如下形式:

x (t) =Ιk, nΡ, jΖcn, jk2k/2un (2kt-j) (6)

式中, j为尺度参数;k为时间或位置参数;n为振荡参数, n∈N;un (·) 为小波包基函数。

其中, ckn, j=2k/2∫kx (t) un (2kt-j) dt, 并且有Ik, n={2kn, 2kn+1, …, 2k (n+1) -1}。按Ik, n的形式将N分解成两两不相交的形式, 任意分解记为P, 则{2k/2un (2kt-j) : (k, n) ∈P, j∈Z}构成了Hilbert空间的一个标准正交基, 系数cn, jk称为信号x (t) 的小波包变换[7]。

基于WPD的信号去噪主要由小波包树分解、最优树计算、小波分解系数的量化以及小波包重构等步骤组成。其中最关键的是如何选取合适的量化阈值, 它直接关系到信号去噪的质量。阈值选择的方法有很多, 实用中应根据不同的应用对象与目标加以合理选择。

2.2 混叠声源的波形恢复

基于ICA-WPD的混叠声源信号分离与波形恢复的处理过程由三个主要环节构成:①基于源数估计的原始观测维数削减;②基于ICA的独立源分量抽取;③WPD基信号去噪及估计结果后处理。

在实际的声信号检测中, 传声器往往冗余设置, 即其数目大于声源个数 (M>N) 。就源波形恢复而言, 这种观测维数的冗余是不利的。对此, 可使用奇异值分解 (Singular Value Decomposition, SVD) 或改进的SVD-Clustering分析方法[8]估计系统中未知的独立源数, 并基于MCC准则削减原始观测的维数, 形成新观测向量x (t) 。随后, 应用ICA基冗余取消算法初步抽取各独立原分量yj。最后, 利用WPD基信号去噪技术对初步抽取的独立源信号作适当的消噪处理及去均值、归一化等后处理, 获得独立源估计s^j, 完成多个混叠声源信号的波形恢复。

MCC基原始观测维数的削减需要遵循一定的原则。设独立源数的估计为N。由M维原始观测向量x (t) 可得到如下的M×M相关矩阵:

Cx=[Cx1, x1Cx1, xΜCxΜ, x1CxΜ, xΜ]

在矩阵Cx中, 第i行第j列元素Cxi, xj的大小体现了两个观测分量xixj之间的相关程度, 且有-1≤Cxi, xj≤1, i, j=1, 2, …, M。考虑两个不同观测分量组合 (xi, xj) 与 (xi, xk) , 如果满足关系式|Cxi, xj|>|Cxi, xk|, 说明分量xjxi之间的相关性更强。反过来, 也可以认为组合 (xi, xj) 中包含的信息量少于组合 (xi, xk) 。

进行有效的源分离与波形恢复, 要求观测信号中包含尽可能多的源信息。因此, 选择原始观测x (t) 的N个分量构成新的观测x (t) 时, 应尽可能使被选分量间具有较小的且平均的绝对相关度, 以获得包含更多信息量的观测向量x (t) , 这就是MCC基观测维数削减的原则, 表达为

Argminxm, xnxj{Cxm, xnSΤD (Cxm, xn)

(7)

m, n=1, 2, …, N, 且m<n;j=1, 2, …, CΜΝ

式中, STD (·) 为求标准差运算。

为了评价源信号分离的整体效果, 提出如下的整体二次残差 (TVQM) 指标:

ΤVQΜ=E{10lg (E{ (|s^j|-|sj|) 2}E{sj2}) } (8)

式中, sj为源信号向量s中第j个源分量;s^j为对应的源分量估计。

3 实验研究

3.1 仿真混叠源信号的波形恢复

仿真源信号模型如下:

s1=sin (2πf1t) s2=sin (2πf2t) sin (2πf3t) s3=square (2πf4t)

其中, f1=250Hz, f2=10Hz, f3=500Hz, f4=100Hz。根据瞬时混叠模型式 (1) , 任选混合矩阵A与仿真源向量s (t) = (s1, s2, s3) T, 混合成一个五通道的虚拟加噪观测x (t) = (x1, x2, x3, x4, x5) T。其中, 外加噪声为n=Γ1R, R为任选的高斯白噪声向量, 加噪因子取为Γ1=0.3。采样频率设置为Fs=2kHz。为了表达清楚起见, 仿真实验中使用了短数据样本, 即采样长度T=512的样本点。

由于矩阵A的混合作用, 使得不同源频率成分同时出现在每一个观测分量中。此外, 外加噪声也严重干扰了传感观测波形。这些都给后续的进一步应用增加了难度, 有必要加以解决。

首先对原始观测信号x执行SVD, 获得的奇异值估计集合为SVs={37.0193, 18.7617, 16.6793, 6.9690, 6.5774}。应用SVD-Clustering分析[8], 可得正确的独立源数估计为NIS=3。进一步地, 对x执行相关分析, 可得相关矩阵Cx。经计算, Cx的总平均绝对相关值为0.4635。据此, 选取±0.4为相关度评价的上下界, 观测分量xixj (i, j=1, 2, …, 5, 且i<j) 间的相关度分布如图1所示。

图1中, Cx1~Cx4分别为矩阵Cx的四个互不重复的相关行向量。依据前述的MCC基观测维数削减原则, 应优先选择图1中位于上下相关界之间的相关元素所对应的观测分量。综合考虑, x (t) = (x1, x2, x3) Τ应该是最佳的选择, 它可以保证各观测分量间同时具有较小的相关度。其次为x (t) = (x2, x3, x4) Τ

接下来, 分别实验对比了经过原始观测维数削减后应用FastICA抽取的独立源分量波形和未经过观测维数削减情况下应用FastICA抽取的源分量波形, 结果发现:应用FastICA算法可以获得更加明确的独立源抽取结果, 而且, 干扰噪声也得到了某种程度的抑制。例如对源分量s2的抽取, 经过观测维数削减后所抽取的独立分量y3的二次残差VQM为-20.8140dB, 而未经过观测维数削减所抽取的三个独立分量y3、y4和y5的VQM仅分别为-17.0405dB、-18.1038dB和-16.1909dB, 获得了改进的源分离效果。但上述源分离改进对于准确恢复源波形而言是不够的。

进一步地, 对初步抽取的独立源分量y1~y3进行了WPD基去噪处理, 去噪参数设置详见Matlab2007a软件帮助。各抽取源y1、y2和y3去噪前的二次残差VQM依次为-6.9362dB、-8.9014dB和-20.8140dB, 整体二次残差TVQM为-12.2172dB。经过WT和WPD消噪处理后, 各估计源的VQM分别达到-10.1318dB、-26.8805dB和-32.5762dB, TVQM达到了-23.1962dB, 获得了相当明显的改进源波形恢复效果。

3.2 实际混叠声源信号的波形恢复

利用计算机自带声卡的数/模 (D/A) 转换功能, 在Matlab2007a环境下产生两个参考声源文件s1.wav和s2.wav。其中, 源s1是一个典型的幅值调制信号, 具有490Hz与510Hz两个对称边带, 对称中心为500Hz。源s2是一个频率为1350Hz的正弦信号。

数据测试工作选择在一个安静的开放空间中进行。两只扬声器分别播放参考声源文件s1.wav和s2.wav。三个传声器组成等距 (间隔为0.04m) 线阵, 接收扬声器辐射出的声信号, 经过信号预处理后由模数转换器 (ADC) 以并行的方式采样并存储于计算机中。采样频率Fs=100kHz。实验测试系统框图如图2所示。

图3所示为实测的三通道混叠声观测信号x的时域波形与FFT幅值谱。

图3中标注出了各观测分量的三个主特征谱峰, 即476Hz (□) 、805或799Hz (○) 和1373 Hz (△) 。可以看到:不仅FFT谱分析中信号出现了严重的能量泄漏, 而且参考声源的频率 (490~500~510Hz及1350Hz) 在其混合观测中也发生了显著畸变, 特别是805 (799) Hz频率成分的意外出现。这可能是由于扬声器复杂的非线性振声模态、测试空间的散射、混响与滤波等效应所导致。尽管测量失真已扭曲了真实的源信息, 但仍可利用所测数据对本文建议的源波形恢复方法进行验证。首先, 对混合声观测x执行SVD分析, 奇异值估计为SVs={135.0477, 107.8933, 28.9507}, 进一步的源数估计结果为NIS=2。对x执行相关分析, 获得的相关矩阵Cx

Cx=[1.00000.7105-0.15140.71051.00000.4563-0.15140.45631.0000]

显然, 分量x1与x3之间具有最小的绝对相关度 (-0.1514) , 而分量x1与x2之间的绝对相关度则最大 (-0.7105) 。

原始声观测x经过MCC基维数削减后, 应用FastICA算法抽取独立源分量, 并基于WPD进行信号消噪处理及去均值、归一化等后处理, 完成混叠声源信号的分离与波形恢复。

图4、图5所示为各处理阶段所产生信号的特征谱峰。

表1所示为各处理阶段所产生信号的特征谱峰 (476、805与1373Hz, 个别情况例外) 数据, 其中对应于参考源信号的突出特征谱峰值用加粗的数字表示。

图4a、图4b中给出的参考源信号及其特征谱峰分别为Ref1 (500Hz) 和Ref2 (1350Hz) ;x1、x2和x3对应三个原始混合声观测分量, 其特征谱峰为476、805 (或799) 和1373Hz, 表达于图4c、图4e和图4g中;y1、y2和y3对应于用FastICA直接抽取的三个独立源分量, 其特征谱峰为476、805 (或793) 和1373 (或1330) Hz, 表达于图4d、图4f和图4h中。可以看到:原始混合声观测x= (x1, x2, x3) 中, 源信息被强烈混叠 (例如在观测分量x2和x3中) , 并且发生了严重的能量泄漏与特征频率畸变。直接应用FastICA算法进行独立源分量的抽取, 混叠源信号得到某种程度的分离 (见y1和y3, 对应第二个参照源Ref2) , 但源信息混叠依然严重 (见y2) 。

在图5中, y1 (y2) —x1, x2) 、y1 (y2) — (x1, x3) 、y1 (y2) — (x2, x3) 表示不同削减观测维组合下FastICA所抽取的独立源分量;y1 (y2) — (x1, x2) wy1 (y2) —x1, x3) wy1 (y2) — (x2, x3) w表示经过进一步消噪处理后, 最终获得的对应估计源信号的特征谱峰。对比分析各处理阶段所产生的信号特征谱峰, 可以看到:FastICA基源分离与WPD基信号去噪的联合应用, 有针对性地突出了参考源Ref1和Ref2的特征谱峰, 获得了明显改进的源信号分离与波形恢复效果 (图5与图4对比) 。当然, 采用不同的削减观测维组合, 所获得的源波形恢复效果也有所差别。对比图5c、图5d, 图5e、图5f,

图5a、图5b, 我们发现:无论是否进行信号消噪处理, 削减观测维组合 (x1, x3) 和 (x2, x3) 所给出的源波形恢复效果都要好于组合 (x1, x2) 。由原始声观测的相关分析可知, 观测分量x1与x3之间具有最小的绝对相关度 (-0.1514) , x2与x3次之 (0.4563) , 而x1与x2之间则最大 (-0.7105) , 此实验结果并不令人意外, 它证明了MCC基观测维数削减原则的正确性。

4 结语

在对原始观测进行正确的维数削减的基础上, 我们联合应用ICA基源分离与WPD基信号去噪实现多个混叠声源信号的分离与波形恢复。实验结果表明:与单纯的ICA基盲源分离相比, 所提出的ICA-WPD方法能更加有效地分离多个混叠声源信号, 并正确恢复其波形, 从而为后续的进一步应用 (如声源识别、声学故障诊断等) 奠定基础。特别值得一提的是, 即使在强噪声干扰下, 该方法也能有效地恢复隐藏于多通道传感观测中的源信息, 这暗示了它的潜在应用价值。

许多实际应用场合中, 声信号的传播往往难以避免散射、混响与结构滤波等效应的影响, 此时用卷积混叠模型来描述其混合过程可能更加贴近现实。相应地, 需要采用不同的分析处理方法, 实现混叠声源信号的分离与波形恢复, 这有待于后续的进一步研究。

参考文献

[1]郑珍珍, 冯华君, 沈常宇, 等.基于坐标系变换的三维声源定位算法[J].浙江大学学报 (工学版) , 2008, 42 (2) :341-343.

[2]Ypma A, Leshem A, Duin R P W.Blind Separation of Rotating Machine Sources:Bilinear forms and Convolutive Mixtures[J].Neurocomputing, 2002, 49:349-368.

[3]焦卫东.基于独立分量分析的旋转机械故障诊断方法研究[D].杭州:浙江大学, 2003.

[4]Lyon R H.Machinery Noise and Diagnostics[M].Boston:Butterworths, 1987.

[5]钱苏翔, 焦卫东, 杨世锡.基于独立分量分析的传感观测信息融合压缩方法及其在故障诊断中的应用[J].中国电机工程学报, 2006, 26 (5) :137-142.

[6]Hyvarinen A, Oja E A.Fast Fixed-point Algorithm for Independent Component Analysis[J].Neural Computation, 2000, 9 (7) :1483-1492.

[7]钱世锷.时频变换与小波变换导论[M].北京:机械工业出版社, 2005.

上一篇:虚假源地址下一篇:住房公积金管理制度