独立分量分析及应用(通用7篇)
独立分量分析及应用 篇1
独立分量分析(Independent Component Analysis,ICA)是信号处理领域在20世纪90年代后期,发展起来的一项全新的信号处理和数据分析方法,它是伴随着盲信号问题而发展起来的,故又称为盲分离(Blind Source Separation-BSS)。自Comon[1]提出ICA的理论框架以来,已有多种算法用于解决各类实际问题。Bell等人在1995年提出了基于信息极大传输原理的独立分量提取算法-最大熵(Infomax)算法[2]。此后Lee等人提出了扩展的Infomax算法[3],Hyvarinen等人提出了采用批处理的固定点快速分离算法FastICA[4],其中FastICA使得盲源信号分离技术实用化。其实ICA基本含义是将多道观测信号根据统计独立原则通过优化算法分解为若干独立成分,从而实现信号的增强和分解,在语音识别、通讯、图像处理、医学信号处理等领域尤其受到关注[5]。
ICA算法的具体解决途径可以大致分为两条:批处理(Batch Processing)和自适应处理(Adaptive Processing)。批处理的含义是指依据一批已经取得的数据来进行统计学处理,尽管这些数据可以反复使用,但却需要大量的存储空间来存储,而且统计处理无法快速适应变化的数据,属于离线处理;而自适应处理的含义是指随着数据的不断输入作递归式迭代处理,其无需大量的数据存储空间,输入数据即被处理,所以数据的整个处理过程也被称为实时处理或在线处理。因此,根据上述两种数据的处理方式,将盲源分离算法分为批处理算法和自适应算法两大类。这两类算法相比较,后者具有以下优点:(1)计算量小,计算时间短;(2)适用于非平稳环境。
固定点算法的特点是收敛速度非常快,且没有学习步长(Step-size)的选择问题,但只能以批处理的方式进行,是一种离线算法[6]。对于自适应盲源分离算法,如信息最大化法、最小互信息法、最大似然估计法等,都可以视为LMS型算法。LMS算法的稳态误差与步长成正比,收敛时间与步长成反比,这一内在的矛盾使得LMS算法的收敛速度和稳态误差特性不能同时满足,必须在收敛速度和稳态误差这两个性能指标之间进行权衡。
传统的自适应盲源分离算法多采用固定的步长进行学习。其中,若采用大的学习速率,则算法收敛快,但信号的稳态性能差;而采用小的学习速率,则稳态性能好,但算法收敛慢[7,8]。解决这一矛盾的简单做法是令步长参数随时间递减或采用所谓变步长的算法[9]。因此,步长的选择对自适应盲源分离算法的收敛起着至关重要的作用。鉴于此,文中给出一种在线变步长ICA算法通过自适应学习改变步长参数,有效地避免了步长选择对分离效果的影响,降低了算法性能对步长的依赖性。
1 独立分量分析模型
假设存在m个相互独立的未知源信号s(t)=[s1(t),s2(t),…,sm(t)]T,通过某个未知的待检测分析系统后线性叠加在n个传感器上接收到的观测信号x(t)=[x1(t),x2(t),…,xn(t)]T。已经证明:在n≥m的条件下,如果源信号s(t)不含一个以上的高斯过程则存在混合矩阵A,使x=Ax。噪声环境下传感器接收的线性混合图像系统模型为
x=Ax+N (1)
其中,A是一个n×m维的矩阵,源信号s(t)和混合矩阵A都是未知的,只有混合后的x(t)可以观测到,N=[n1(t),n2(t),…,nn(t)]T为维加性高斯白噪声,一般设m=n。
ICA算法的基本思路在于求解一矩阵B,使其作用于观测信号x(t),所得估计信号如式(2)所示。
y(t)=Bx(t) (2)
进而可得y(t)=Bx(t)=BAs(t),在统计独立的意义下最逼近于未知源信号s(t),即要找到矩阵B使得信号y(t)的各个分量尽可能相互独立。为此需要建立一个合适的目标函数,再采用某种优化算法分离源信号。
2 基于负熵的自适应ICA算法
采用高阶统计量来近似表示概率密度函数的缺点是:数据中的野点对估计效果影响较大,因此估计结果不够稳健。为此,这里采用Hyvarinen提出的非多项式函数逼近概率密度函数的方法,从而得到负熵的近似表达形式[10]
J(y)=(E{G(y)}-E{G(v)})2 (3)
用负熵作为分离信号的独立性判据有3大优点:(1)基于负熵的盲源分离算法既可以用于单个独立源的盲提取,也可以用于盲分离;(2)此算法无需对信号源的特性进行假设,即可以分离超高斯和亚高斯的混合信号;(3)负熵作为独立性判据稳健性好。
基于负熵的算法通常需对信号进行白化预处理。
2.1 基于负熵的自适应ICA算法的原理
假设对白化后的信号z进行独立分量分析,提取独立分量。设y是其中一个独立分量,则
y=bTz (4)
其中,b是分离矩阵B的某一列向量。假设源信号s具有单位方差,则y也应具有单位方差,即有
因此,白化后基于负熵的独立分量分析的目的就是求解如下约束优化问题
其中,v是与y具有相同的均值和方差的高斯随机向量,G为非二次函数,一般选择G(y)=log(cosh(y)),g(y)=G′(y)。对于如上简单约束,可以采用约束集上投影的方法,即先求解式(6)中无约束目标函数的最优值,再在每步迭代后将解向量b投影到单位球面
式中,γ=[E{G(bTz)}-E{G(v)}]对于超高斯信号如语音信号等,γ可设为-1。用瞬时值代替期望值,即得到基于负熵最大化的随机梯度算法为
然而,该算法收敛速度较慢,不能满足实时分离的需要。为此,文中提出一种改进的基于负熵的自适应ICA算法[11]。
2.2 改进的基于负熵的自适应ICA算法
考虑到约束条件
目标函数式(9)最优时满足等式
2γE{zg(bTz)}-2β1b=0 (10)
因此得惩罚因子β1=γE{bToptzg(bToptz)},其中,bTopt是代价函数最优时b的取值。实际计算时可用当前值b代替bTopt近似估计β1得:β1=γE{bTzg(bTz)}。令β=β1/γ,则
因此,b的迭代公式为
b+=b-[E{zg(bTz)}-βb] (12)
考虑到向量b需要归一化,(12)式可以进一步简化
b+/(1+β)=b-E{zg(bTz)}/(1+β)
b+=b-E{zg(bTz)}/(1+β) (13)
式(13)中用瞬时值代替期望值,即可得到改进的基于负熵的在线算法
其中,β=E{bTzg(bTz)}可由下式迭代更新得到
β+=λβ+bTzg(bTz) (15)
式中遗忘因子λ取<1并接近于1的数。
上述算法用于逐个提取独立分量,即信号源的盲提取。为了同时获得N个独立成分,将算法写成矩阵形式
B+=B-μdiag(αi)g(u)zT (16)
其中,u=Bz,αi=1/(1+βi),i=1,2,…,N。βi由下式迭代更新得到
βi+=λβi+BIzg(BIz) (17)
其中,Bi是B的第i个行向量。为了避免算法收敛到相同的独立成分,需在每一步迭代后对B进行对称正交化
因为每步迭代后B都经过对称正交化,满足BBT=I,所以有
g(u)zT=g(u)zTBBT=g(u)TB (19)
因此,改进算法的迭代公式也可表示为
B+=B-μdiag(αi)g(u)uTB
2.3 改进的基于负熵的变步长自适应ICA算法
前面介绍的自适应梯度算法的性能依赖于学习步长的选择,学习步长的选择与算法的最终收敛效果密切相关。适当的学习步长有利于算法的快速收敛,反之,会使算法收敛困难,甚至不收敛,影响分离效果。于是,人们提出了变步长自适应盲分离算法,从而保证在算法初始阶段或未知系统参数发生变化时,算法步长比较大,有较快的收敛速度和对时变系统的跟踪速度;而在算法收敛后期,则保持很小的调整步长,以达到很小的稳态误差[11]。
目前所提出的变步长自适应盲分离方法大致可分为3大类:
(1) 模拟退火类,即根据模拟退火原理,把变步长表示为时间变量的函数。其中包括:指数衰减型变步长、时间递减型变步长;
(2) 分离阶段类,即根据信号不同的分离状态,将步长取为不同的表达形式。其中包括:峭度型变步长、状态型变步长和平滑信道型变步长;
(3) 梯度求取类,即根据步长梯度的不同求取方法,将步长取为不同的表达形式。其中包括:内积型变步长、直接型变步长;
这里,介绍其中一种可变步长算法,即Thomas和Allen等[12]提出的基于估计函数的变步长算法。
该方法的基本思想是,首先选取一个适当的估计参数,当估计参数与其最优值之间的差距较大时,选择较大的步长;反之,选择较小的步长。然而,在盲分离问题中,两者之间的真实距离不容易测得,所以要寻找一个具有代表性的测量标准。于是,对于B+=B-μdiag(αi)g(u)uTB,Thomas和Allen等选择取估计函数
H(k)=diag(αi)g(u)uT (21)
其中,H(k)表示H在第k次迭代时的值。Thomas等建议用E{H(k)}的范数的平方作为控制步长的参数。为实现步长的自适应调整,E{H(k)}用估计函数H(k)的平滑形式
来逼近。所以用
μ(k)αμ(k-1)+(1-α)ρf(k) (24)
其中,α为遗忘因子,一般取为α=0.998,ρ为比例常数。同时为了避免μ选择过大,步长μ的上界如式(25)所示。
如果步长不超过μup,则按照(24)式计算步长;如果步长超过了μup,步长应选取为u=μup。
结合式(21)~式(25)即可得到文中变步长算法。
因此基于负熵的自适应变步长算法的计算步骤为:
(1) 给出算法所需用的初始值;
(2) 根据式(22)~式(24)和式(21)计算步长μ(k);
(3) 根据式(20)计算下一次迭代的初值B(k+1);
(4) 令k=k+1,转至步骤(2),直到循环结束。
3 计算机仿真结果
为了检验这个算法的性能,下面分别给出改进的基于负熵的自适应变步长方法仿真实例,用以说明此改进算法的正确性和有效性。这里选用非平稳语音信号来进行仿真。
一个语音信号s1和音乐信号s2如图1所示。通过Matlab随机产生一混合矩阵A,进而得到两个混合语音信号x1和x2,如图2所示。用改进的基于负熵的自适应变步长方法对混合语音进行盲分离的结果
实验1 取初始步长为μ=0.000 3,改进的变步长自适应算法分离结果,如图3所示。
实验2 取初始步长为μ=0.001,改进的变步长自适应算法分离结果,如图4所示,原算法分离结果,如图5所示。
从上述实验可见,当步长分别选择为μ=0.001和μ=0.000 3时,文中改进的变步长算法都能够较好的分离出源语音信号。但μ=0.001时步长选择偏大,对于原算法就不能正确地分离出源信号。由此可见原算法对步长的选取有很大的依赖性,当步长选择不合适时,算法不能达到分离出源信号的目的。
表1为步长选择合适时不同算法收敛速度统计结果比较表。随机进行多次分离运算,给出最少迭代次数、最多迭代次数和平均迭代次数。从表可以看出,改进后的变步长算法收敛速度明显加快。
下面用相关系数来评价改进的变步长算法分离性能,表2给出源语音信号与对应分离信号之间的相关系数,结果如表2所示。
由上述实验结果可知,分离的语音信号与源信号比较接近,改进的变步长梯度方法成功分离出了原始信号。表2显示了分离信号和原始信号的相似系数,分离误差较小。由此可见,改进的基于负熵的自适应变步长算法是可行的,而且该方法具有较快的收敛速度,降低了算法性能对步长的依赖性。
4 结束语
收敛速度、稳态误差是衡量一个在线盲源分离算法性能优劣的两个主要参数。文中给出的这种在线变步长ICA算法通过自适应学习改变步长参数,有效的解决了收敛速度和稳态误差两者之间的内在矛盾。该算法具有更快的收敛速度和更小的稳态误差,并且无需过多关心步长因子的大小。理论分析和实验结果证明该算法具有较好的分离性能。
摘要:对于自适应盲分离算法,选择步长参数以达到理想的分离性能是必要的。结合基于估计函数的可变步长自适应优化方法,提出了基于负熵的自适应算法,有效提高了算法的收敛速度,降低了算法性能对步长的依赖性。仿真实验证明了此改进算法具有较好的分离效果。
关键词:独立分量分析,盲源分离,可变步长
独立分量分析及应用 篇2
1 独立分量分析算法原理
1.1 独立分量分析模型
假设存在m个相互独立的未知源信号s(t)=[s1(t),s2(t)…sm(t)]T,通过某个未知的待检测分析系统后线性叠加在n个传感器上接收到的观测信号x(t)=[x1(t),x2(t),…xn (t)]T。已经证明:在n≥m的条件下,如果源信号s(t)不含一个以上的高斯过程则存在混合矩阵A,使x=As。噪声环境下传感器接收的线性混合图像系统模型见式(1):
其中,A是一个n×m维的矩阵,源信号s(t)和混合矩阵A都是未知的,只有混合后的x(t)可以观测到,而N=[n1(t),n2(t),…nn(t)]T为n维加性高斯白噪声,一般设m=n。
ICA算法的基本思路在于求解一矩阵B,使其作用于观测信号x(t)所得估计信号,见式(2)。
进而可得y(t)=Bx(t)=BAs(t),在统计独立的意义下最逼近于未知源信号s(t),即要找到矩阵B使得信号y(t)的各个分量尽可能相互独立。为此,需要建立一个合适的目标函数,再采用某种优化算法分离源信号。ICA算法的目标函数很多,主要包括最大化非高斯性、最小化互信息、Infomax和极大似然估计。虽然建立不同的目标函数的基础和出发点不尽相同,但是许多目标函数都有着相同的形式,在一定的条件下它们是等价的[6]。优化算法则可采用牛顿迭代法、基于神经网络的自适应算法、随机梯度法、自然梯度算法等[7]。
1.2 Infomax算法(最大熵法)
Infomax算法[8]是基于信息最大化判据导出的一种新的优化算法。这个算法是由Bell和Sejnowski于1995年提出的。
图1是Infomax算法的处理流程图。其处理过程的特点是:经B阵解混后对所得y的每一个分量yi分别用一个非线性函数gi(yi)加以处理,得r=g(y)=[g1(yN),…gN(y1)]T[r1,…rN]T。自适应处理得目标函数是调节B使r的总熵量H(r,B)极大,因为H(r)极大便意味着y的各分量间互信息I(y1,…yN)极小。
非线性函数gi()的选择与边缘熵H(yi)的取值有着密切关系。在Infomax算法中,非线性函数通常选择为类似式(3)所示的sigmoid函数,式(4)是其导函数。式(3)与式(4)中,参b数a的大小决定着sigmoid函数上升沿和导函数的陡峭度,为波形位置偏移参数。
理论上gi(yi)应取为Si的概率密度函数,此时gi(yi)就是p(si)的累积概率密度函数。
参数调节以式(5)为指导:
由前面可知:H(r)=-∫p(r)log p(r)dr,但ri=gi(yi),
因而调节公式是:
所谓信息最大化传输就是使解混系统的输入x和输出y的互信息最大化。
1.3 互信息极小法
互信息是盲源分离算法里一个规范的代价函数,因为它表达了独立源的关键性质。不同的ICA算法中包含不同的代价函数,但是一般都是以输出信号的互信息最小为最终目的。就算法的原理而言,互信息最小算法(或简称MMI算法)比Infomax等其他一些算法具有更加严密的理论体系。
此法的目标函数是使I(y,B)极小,因此调节规律是:
最后得系数调节公式:
此系数调节公式与Infomax具有相同的形式,只是φ(y(k))的具体表示式不同。可见,这些看似不同的算法可以在信息论的理论框架下得到统一。
1.4 固定点算法(FastICA)
固定点算法是对一组给定数据的递推计算,属于批处理。
首先对观测信号进行预处理,包括中心化和白化。
中心化即观测信号减去它的均值,变成零均值矢量。
白化是通过PCA网络将观测信号线性变换为具有单位方差且各分量互不相关的Z。预处理是为了简化计算。
下面对x进一步处理,即依据负熵判据来寻找矩阵以实现独立分量的分离。依据牛顿迭代定理,FastICA算法的调整公式为:
B+是某一次牛顿迭代的结果,B*是B+归一化后的更新值。式(11)只估计了一个独立分量,若要估计n个独立分量,在每次提取一个分量之后,要从观测信号中减去该独立分量,如此重复,直到所有分量都被提取出来为止。去掉已提取的独立分量的方法如下(设已估计了P个分量):
与基于梯度的算法相比,固定点算法不需要选择学习步长或其他参数,使得这种算法更易使用,更可靠。由于此算法一次只提取一个独立分量,而不是所有的分量,所以如果只要提取某个分量,又有足够的先验知识,就可以很快地把它提取出来,从而减小计算量。此外,不管是具有正峭度还是负峭度的分量它都能提取出来。
本文采用最大熵算法是根据自然梯度学习算法求解矩阵B,算法的目标判据为独立分量通过非线性环节后信息熵极大,其迭代公式为:
其中,μ(k)为学习率,T为每次处理的向量个数,φ(y(t))与源信号的分布及其假设有关,根据不同的情况有多种选取方法。
2 ICA在通信信号分离中的应用
语音源信号s1(t)和正弦源信号s2 (t)如图2所示。源信号通过混合矩阵A=[1.5,1;1,1.4]混合作为观测信号,如图3所示。本文采用ICA算法对混入正弦信号的语音信号进行提取。分离出的语音信号和正弦信号如图4所示。
从试验结果可以看出,分离语音信号从波形上看,很好地保持了原始信号的波,而且实际分离的信号在听觉上也很好地实现了分离。
3 结论
语音信号盲分离是通信信号处理领域研究的热点。本文采用算法仿真了其在语音信号处理中的应用。实验结果表明,在混合语音中采用该方法能够取得较好的分离效果。
参考文献
[1]Comon P.Independent component analysis,A new concept[J]. SignalProcessing,1994,36(3):287-314.
[2]Bell A J,Sejmowski TJ.An information-maximization approach to blind separation and blind deconvolution[J].Neural Computation, 1995,7(6):1159.
[3]Lee T W,Girolam M,Sejnowski T J,et al.Independen tcomponent analysis using an extended infomax algorithm for mixed subgaussian and supergaussian sources[J].Neural Computation,1999,11 (2):417-441.
[4]Hyvarinen A,Lja E,et al.A fast fixed-point algorithm for independent component analysis[J].Neural Computaton,1997,9(7): 1483-1492.
[5]Hyvarinen A.Survey on Independent Component Analysis[J].Neural Computing Surveys,1999,2:94-128.
[6]T-W.Lee,M.Girolami,A.J.Bell,T.J.Sejnowski.A Unifying Information -Theore-tic Framework for Independent Component Analysis [J].Computers & Mathematics with Applications,2003,1(11 ): 1-21.
[7]Shun-ichi AMARI.Andrzej CICHOCKI[M].吴国正,唐劲松,章林柯,等,译.北京:电子工业出版社,2004.
独立分量分析及应用 篇3
对于复杂信号的脉内调制特征的研究一直是非平稳信号处理中的热点,学者们提出了诸多方法,例如瞬时自相关法、时频分析法、相位差分法等。相位差分法利用信号的瞬时相位序列,其计算简单,有较高的工程应用价值,但对噪声敏感,抗噪能力较弱。谱相关方法是传统频率谱分析的延伸,在低信噪比下需要对信号多次积累处理。时频分析法是通过时频分析将一维信号变换到二维时频面,将信号时频特征分离,进而可在具体时间和特定频率上展开分析[2,3]]。但由于非线性时频分析方法不可避免地存在交叉项干扰,对噪声敏感性很高,因而限制了其应用。而线性小波变换能克服交叉项的影响,在时频域有良好的局部化和多分辨的特征,可以改善信噪比[4],因此小波变换被广泛应用于大时宽带宽积信号的脉内特征分析中[5]。
文献中提到的方法较少考虑到未知辐射源的雷达信号识别问题,目前对已有先验信息的雷达信号有较好的识别效果,而对未知雷达辐射源并不适用。在实际战场环境中,对缺少先验知识的雷达信号进行识别判决具有更为重要的意义。对此,本文提出了联合盲信号分离和小波变换脊线提取的方法。在多分量信号混叠的条件下,首先利用独立分量分析对观测信号进行盲分离,将盲源分离作为预处理,把多分量信号的调制识别的问题转化成对单信号的脉内信息分析,然后采用小波变换实现对各个雷达信号辐射源的调制类型识别。
1 ICA的基本原理和分析模型
独立分量分析(ICA)是一种基于高阶统计量的盲源分离技术,在源信号和传输信道参数未知时,仅由多通道观测信号恢复出源信号的各个独立分量。它的核心思想是寻找一组线性非正交坐标系对多通道观测信号进行变换,分解成满足统计独立的分量,从而完成信号的盲分离。
假设m个源信号S=[s1,s2,…,sm]T,各个信号相互独立,侦察机接收到的n个观测信号X=[x1,x2,…,xn]T。其观测分量xi是各个源信号的线性混合,即X与S之间的关系为
式(1)中,A为未知的m×n阶混合矩阵,N=[n1,n2,…,nm]T为m维加性噪声信号。峭度、负熵和互信息是度量分离后各分量之间独立性的主要准则[6]。Hyvrinen等人提出了基于固定点迭代的快速ICA算法(Fast ICA)[7]。Fast ICA是一种快速寻优迭代算法,利用负熵最大化的准则进行信号分离,求得一个分离矩阵W(m×n维)。
观测信号经Fast ICA后,各单分量信号之间统计独立性达到最大。
Fast ICA的处理流程图可以由图1表示。
2 小波变换和脊线提取
瞬时频率是描述信号调制特征的重要参数,相比于幅度具有更强的抗干扰性。因此正确提取信号的瞬时频率信息是多分量信号分离识别的重要手段[8]。
2.1 连续小波变换
连续小波变换是一种线性时频变换,是分析信号与小波基函数的内积。设信号s(t)∈L2(R),小波基函数为ψ(t),其连续小波变换(CWT)的定义为
式(3)中,a、b分别是尺度和平移参数,ψ*(·)是ψ(·)的共轭复数。本文选择了时频特性较好的Morlet小波作为小波基,它是一种常见的单频复正弦调制高斯波[9],其定义为
式(4)中,fc是小波的中心频率。
2.2 小波脊线
根据信号理论得知,信号频率f与尺度参数a之间的关系为a=fc/f,引入瞬时频率的定义:
设分析信号形式f(t)=A(t)cos(t)。选择的解析小波函数为φ(t)=g(t)exp(iw0t),其中w0是小波的中心频率,若ξ=w0/a为信号的载频,利用上文的连续小波变换公式得到:
式(6)中,G是g(t)的傅里叶变换;校正项ε(b,ξ)满足
式中,a和b分别是尺度因子和平移参数。如果在变换过程中消除了偏移,则b等于时间t,A(b)表示时间点b的振幅大小,φ'(b)和φ(b)分别表示b时刻的瞬时频率和瞬时相位。
由式(1)和式(2)可以说明,若A(t)和φ'(t)在窗函数g(t)的支集上有很小的变差且φ'(b)≥Δw/a,记Δw为G的带宽,则校正项ε(b,ξ)可以忽略不计。由此可知,对于每个b值,当不计校正项时,在ξ=φ'(b)时连续小波变换模取得极大值。相应的时频点(b,ξ(b))称为小波脊点,脊点组成的集合称为小波脊线,脊点处φ'(b)值表征了信号瞬时频率的变化[10]。
3 基于脊线特征的调制识别
根据上节的论述,利用信号小波脊线可以估计出信号的瞬时频率,从而获得判决信号调制类型的特征参数。下面对几种常见的雷达辐射源信号,分析通过小波变换提取出小波脊线从而进行调制识别的可行性。
单一载频正弦信号由于载波频率固定,小波脊线的幅度没有发生起伏,斜率为0。线性调频信号调频斜率不为0时,频率随时间线性变化,因此小波脊线是斜率不为0的直线[11]。相位调制信号在不同的码元内,载波的频率和振幅不变,相应脊线的位置和幅度也相同[12]。而在不同码元间,相位发生跳变,瞬时频率不同于载波的频率,因此跳变时刻的脊线位置将产生跳变,出现若干脉冲。如果码元间跳变时刻增多,相应的脉冲分布情况也会变得复杂。其中脉冲的幅度信息表征了PSK的调制特征,幅度的个数对应了相位调制的调制阶数。
综上所述,对不同信号的小波脊线可以提取特征参数进行识别。本文采用最小二乘估计的方法,在时频平面对小波脊线进行直线拟合,获取特征参数估计值,进而判决调制类型。
设需要拟合的直线函数关系为y=kx+b,采样点数为N,得到待估计序列为(xi,yi)(i=1,2,…,N),其中yi为小波脊在采样时刻对应的瞬时频率值。用最小二乘法估计参数时,要求观测值yi的估计误差ε2最小,即
分别对斜率k和斜率b求偏导,
经计算可得,斜率k的估计值
定义特征参数,其中fs为采样率。可以明显看出,P1代表了小波脊线在时频面的斜率,表征了信号的调制斜率信息。
由于相位调制信号小波脊线在跳变时刻出现脉冲,因此将当前时刻频率值与前后若干时刻频率均值进行对比,可以分辨出小波脊线中的跳变点。对于采样序列中提取出的跳变点,统计超过一定门限的跳变点分布情况,进而可以识别出相位调制信号的调制阶数特征。
定义特征参数P2=max(ξ(k)),设,其中μ1(k)和μ2(k)分别为小波脊线在k时刻前后各M点的均值。P2表征了采样序列中是否存在跳变点。
定义特征参数P3=sum(ξ(n)>h0),其中h0为门限。P3统计了码元跳变点的分布情况。
特征参数P1对应的是信号的调制斜率。首先对特征参数P1进行判决,如果小波脊线斜率较大,则P1较大,可以识别出线性调频信号。然后判断特征参数P2,单频信号频率固定,不存在相位跳变点,进而识别出单频信号。对于相位调制信号,采用特征参数P3判决,P3表征了相位跳变点的分布情况,根据信号序列中跳变点的数量和分布可以区分出二相编码和四相编码信号。图2是基于脊线特征的调制识别流程图。
4 实验结果与仿真分析
图3给出了侦察机多通道接收到的雷达信号的混叠分离的仿真过程。
假设源信号是线性调频信号,单频正弦信号,7位巴克码二相调制信号和13位巴克码四相调制信号等常见雷达辐射源信号。四种信号波形如图3(a)由上到下依次所示。
将这四种信号随机混合,图3(b)中是由侦察接收机接收到的四路观测信号。
混合矩阵A是随机矩阵,具体阵列为
将观测信号经过Fast ICA处理,结果由图3(c)所示。由图中可以明显看出,分离后的单分量信号由上至下依次为线性调频信号,BPSK信号,QPSK信号和单频正弦信号。根据上述的算法流程,计算出分离矩阵
解混后的信号次序与源信号并不一致,但基本恢复了各个分量信号,幅度得到了增强,有效地完成了对各信号的分离。
对分离后的单分量信号分别连续小波变换并提取时频面的小波脊线,如图4所示。
图4(a)是单一载频正弦信号,频率是50 MHz。小波脊线斜率为0,横坐标指向恒定载频值50 MHz,不存在跳变点。
图4(b)是线性调频信号,中心频率是40 MHz,调频斜率为80。小波脊线在起点处有频率的波动,随后是一条斜率不为0的直线,不存在跳变点。
图4(c)是7位巴克码编码的二相编码信号,载频10 MHz,采样频率为100 MHz,脉宽10.5μs。BPSK信号的小波脊线斜率为0,在相位跳变时刻出现间隔不等,幅度相同的脉冲,跳变点分布比较简单。
图4(d)是13位巴克码编码的四相编码信号,载频10 MHz,采样频率为100 MHz,脉宽19.5μs。与BPSK信号不同的是,QPSK信号小波脊线在一个码元周期中脉冲数目增加,幅度值增多,且脉冲分布在多个区域。脉冲共有三个幅度值,符合了相位调制信号的调制阶数特征。
最后对以上四种信号提取小波脊线分别进行调制识别仿真。测试信噪比从-5 d B增加到5 d B的调制识别概率,以1 d B为步长,进行500次Mont Carlo实验,得到了各信号在不同信噪比条件下的识别概率曲线,如图5所示。从图中可以得出,盲分离和小波变换对多分量信号调制识别具有较好的效果,当信噪比大于0时,基本可以实现各分量信号调制类型的自动识别。
5 结论
本文基于复杂电磁环境下多分量信号调制识别问题,提出了一种联合独立分量分析和小波变换的方法。在无先验信息条件下,采用独立分量分析将时频混叠信号恢复成单分量信号。通过连续小波变换,提取信号小波脊线和瞬时频率,利用最小二乘法拟合直线,计算小波脊线特征参数最终完成各信号的调制类型识别。分离过程中不需要雷达信号的先验知识,具有自适应性。此外小波变换可以改善信噪比,该方法具有较强的抗噪性,在低信噪比情况下仍有较好的识别效果。
参考文献
[1]罗永江,赵国庆,斯海飞.基于ICA和小波脊的多辐射源调制类型识别.航天电子对抗,2010;26(6):38-41Luo Y J,Zhao G Q,Si H F.Modulation type recognition base on ICA and wavelet ridge in multiple radar overlapping signal.Aerospace Electronic Warfare,2010;26(6):38-41
[2] Gustavo L R,Jesus G,Alvora S.Digital channelized receiver based on time-frequency analysis for signal interception.IEEE Trans Aerospace and Electronic Systems,2005;41(3):879-898
[3]殷晓中,于盛林.信号的时频分析理论与应用评述.现代电子技术,2006;29(21):118-120Yin X Z,Yu S L.Time-frequency analysis theory and its application.Modern Electronics Technique,2006;29(21):118-120
[4]赵彩华,刘琚,孙建德,等.基于小波变换和独立分量分析的含噪混叠语音盲分离.电子与信息学报,2006;28(9):1565-1568Zhao C H,Liu J,Sun J D,et al.Blind separation of noisy speech mixtures based on wavelet transform and independent component analysis.Journal of Electronics&Information Technology,2006;28(9):1565-1568
[5]刘凯,韩嘉宾,王韵白,等.基于切割聚类的快速多分量LFM信号分离.系统工程与电子技术,2015;37(6):1004-1008Liu K,Han J B,Wang Y B,et al.Fast separation of multi-component LFM signals based on segmented clustering.Systems Engineerin and Electronics,2015;37(6):1004-1008
[6]冷明伟,陈晓云,谭国律.基于小样本集弱学习规则的KNN分类算法.计算机应用研究,2011;28(3):915-917Leng M W,Chen X Y,Tan G L.KNN classification algorithm based on rule of weak leaming on small sample sets.Application Research of Computers,2011;28(3):915-917
[7] Hyvrinen A,Oja E.A fast fixed-point algorithm for independen component analusis.Neural Computation,2000;9(7):1483-1482
[8]任春辉,魏平,肖先赐.改进的Morlet小波在信号特征提取中的应用.电波科学学报,2003;18(6):633-677Ren C H,Wei P,Xiao X C.Application of a modified morlet wavele in feature extraction.Chinese Journal of Radio Science,2003;18(6):633-677
[9]郁春来,万建伟,徐如海.改进小波脊线法算法分析和仿真.现代雷达,2005;27(8):46-47Yu C L,Wan J W,Xu R H.Algorithem analysis and simulation o improved wavelet-ridge method.Modern Radar,2005;27(8):46-47
[10]余志斌,陈春霞,金炜东.一种新的Morlet小波及其在雷达信号特征提取中的应用研究.电路与系统学报,2010;15(1):129-134Yu Z B,Chen C X,Jin W D.Application of a new morlet wavelet in feature extraction.Journal of Circuits and Systems,2010;15(1):129-134
[11]张晓松,林明.小波变换与线性调频信号脉内调制特征分析.科学技术与工程,2012;12(36):9840-9844Zhang X S,Lin M.Modulation ananlysis of wavelet and LFM signal.Science Technology and Engineering,2012;12(36):9840-9844
独立分量分析及应用 篇4
在信号处理中, 将混合在混沌信号中的其他信号分离出来是混沌信号处理领域中的重要课题, 对于混沌在通信、雷达、生物医学等方面的应用有十分重要的意义。在这类分离中, 常规的处理方法是应用小波变换等方法, 利用信号与噪声频谱的差别进行滤波, 以达到分离目的, 但是当信号与噪声的能量分布在同一频带时, 该方法就不再适用。现有的此类信号分离方法一般都要利用各个混沌信号的内在性质以及一定约束。文献[1]利用各个混沌信号之间的互不相关性, 依据重构理论, 重构出源信号, 但只假设信号间互不相关, 且只涉及到数据的二阶统计特性, 并未充分利用包含有实际信号中大部分重要信息的高阶统计特性。本文假设各信号间为更符合实际的相互独立模型, 提出应用独立分量分析法, 利用高阶统计量方法对混合混沌信号进行分离, 实现此类混合信号的盲分离。此处“盲”是指源信号不能被观测;源信号如何混合是未知的[2]。通过仿真实验证实该方法有效可行。
1 基本原理
设X= (x1, x2, …, xm) T为m维零均值混沌信号与其他信号的观测混合信号, 它由源信号向量S= (s1, s2, …, sn) T中相互独立的混沌信号、其他信号sj (j=1, 2, …, n) 线性加权组合而成, 此线性混合模型可表示为:
式中:A= (a1, a2, …, an) 是m×n满秩矩阵, 称为混合矩阵;aj为混合矩阵的基向量。
混合混沌信号分离基本原理图如图1所示。
为确保上述模型可被估计, 需做以下假设和约束:
(1) 源信号中各分量即混沌信号与其他信号是相互统计独立的。
(2) 源信号中各分量sj具有非高斯分布, 且最多只允许一个具有高斯分布。
(3) 混合矩阵A为方阵, 即假设传感器数与混合混沌信号的源信号分量数相等, 即m=n, 此时A为非奇异矩阵, 逆矩阵A-1存在。
利用观测混合信号X和上述条件构建解混矩阵W= (wij) n×n后, 经过W变换后得到n维源信号估计值Y=[y1, y2, …, yn]T, 则ICA的解混模型可表示如下:
式中:G称为全局 (系统) 矩阵, 若通过学习得G=In×n (n×n 单位阵) , 则y (t) =s (t) , 从而达到分离目的。实际上, 只要G的各行各列只要有一个元素接近1而其他接近零, 则可认为分离成功。由ICA分离得到的各源信号存在两种内在的不确定性:排列顺序不确定;复幅值不确定[3,4,5], 但这并不影响最终对信号的识别。
2 分离方法
分离过程可分为三个部分:
(1) 观测混合信号的中心化;
(2) 观测混合信号的白化;
(3) 提取源信号。
在分离过程中假设观测混合信号已经过中心化, 其均值为零。
2.1 观测混合信号的白化
白化 (Whitening) 定义为对于观测的混合混沌信号x寻找线性变换V, 使得变换后的信号z:z=Vx是白的。“白的”是指变换后各源信号分量zi是不相关的且具有单位方差。
线性变换V一般可利用协方差矩阵的特征值法 (EVD) 来求得。混合信号的协方差为:
式中:E是E{xxT}的特征向量的正交矩阵;D是相应的特征向量的对角矩阵, D=diag (d1, d2, …, dn) , 则可令线性白化矩阵为:
可以证明此时z为白化的:
2.2 基于峭度的快速不动点分离法 (FastICA法) [3,6]
极大非高斯性分离定理指出, 混合混沌信号的各源信号是极大非高斯性分量。在对混合混沌信号分离中, 极大化y=wTz的峭度 (z为预处理中经白化后的零均值观测混合信号) , 可以得到混合混沌信号中各分量的估计值。当采用梯度算法极大化峭度的绝对值时有:
当令式 (6) 中, 峭度的梯度与w相等, 即可得到:
w∝{E[z (wTz) 3]-3‖w‖2w}, (‖w‖2=1) (7)
由式 (7) 可得不动点迭代算法, 此时可以先计算右面的项, 并将其赋给w作为新值。
由此可得不动点的两步迭代算式:
该算法也被称为FastICA。实际应用时, E[z (wTi (k) z) 3]需用各时刻的统计均值代替, 收敛后得到的wTi是矩阵中的一行, 所以yi (t) =wTiz (t) 就是分离出的混合混沌信号中某一个源信号si (t) 。原理上, 可以多次运行算法而获得多个源信号, 但这并不可靠。要应用极大化非高斯原理, 以估计更多的源信号时利用:在白化空间中, 不同的源信号对应向量wi是正交的。因此, 当估计多个源信号时, 需将上述一元算法运行多遍, 而为了避免不同的向量收敛至同一个极值点, 必须在每次迭代后将w1, w2, …, wm进行正交化。
在正交化时一般采用并行正交化, 其可以使源信号能够并行估计, 同时被分离出来。W的对称正交化可以通过矩阵平方根的方法来实现。
式中:
式中:E为WWT的特征向量的正交矩阵, D是相应的特征向量的对角矩阵,
3 仿真实验
下面, 应用基于峭度的FastICA分离法对混合混沌信号的分离进行仿真实验。仿真中定义分离性能指标为:
分离出的估计信号y (t) 与源信号s (t) 波形完全相同时, PI=0;实际上当PI=10-2时说明算法分离性能已经相当好。
实验1:两个不同模型的混沌信号混合的分离 两个混沌信号分别为logistic map与henon map, 其中:logistic map 映射方程为x (n) =μx (n-1) [1-x (n-1) ], 式中μ=4, 初始值为0.2。henon map 映射方程为x (n) =y (n-1) +1-ax (n-1) 2, y (n) =bx (n-1) ;式中a=1.4, b=0.3。取10 000个观测点, 舍去前3 000个点 (确保系统进入混沌状态) 再取其后连续的150个点进行分离仿真。混合信号中一路观测信号与源信号明显不同, 另一路波形与logistic map相似, 但幅值有明显变化。经11次迭代后收敛, 分离后不影响对信号的最终识别 (见图2) 。该实验分离指数为PI=0.063 4。
实验2:logistic map与均方差为1的高斯白噪声 (GWN) 的混合 在仿真中logistic map采用实验1的映射方程, 式中μ=4, 初始值为0.2, 高斯白噪声的能量为1。同样, 当确保进入混沌状态后, 再取150个连续的点进行仿真。一路混合信号形似噪声, 此时混沌信号被“淹没”在噪声中, 经FastICA法分离, 11次迭代后, 将混沌信号从噪声中“抽取”出来 (见图3) 。分离性能指数为PI=0.050 4, 表明很好地将信号分离出来。
实验3:混沌信号与谐波信号混合的分离 混沌信号为logistic map, 其映射方程为 x (n) =μx (n-1) [1-x (n-1) ], 式中μ=4, 初始值为0.2。谐波信号为Asin (2πft+φ) , 式中A=0.02, 归一化频率f=0.3, 初相位φ=1。混沌信号与谐波信号混合时, 微弱的谐波信号“隐藏”在强混沌信号中, 应用本文的方法可快速有效地将其从中分离出来。此外在强谐波信号背景中, 混沌信号“淹没”在其中时, 也可很好地将混沌信号从中分离出来。同样, 在本实验中经11次迭代后收敛 (见图4) , 分离性能指数为PI=0.074 5, 同样表明, 可以很好地将混合混沌信号分离开来。
将上述实验时FastICA法分离性能列表, 见表1。
4 结 语
本文提出基于独立分量分析的方法对混合混沌信号进行分离, 利用各源信号独立, 基于极大非高斯性原理, 应用FastICA法对此类信号进行分离, 在未知混合情况时, 实现此类信号的盲分离, 通过实验仿真, 分离性能指数均可达10-2, 表明该方法可以很好地将此类信号分离开来。
摘要:现有的混合混沌信号分离方法一般都要利用各个混沌信号的内在性质以及一定的约束。利用混合混沌信号中各源信号的独立性, 依据基本ICA估计原理中的极大非高斯性原理, 采用基于峭度的不动点分离法对此类混合信号进行分离, 实现了此类信号的盲分离。对多种此类混合信号进行分离仿真的结果表明, 该方法可以快速有效地分离出混合混沌信号中的各个源信号。
关键词:混合混沌信号,独立分量分析,盲分离,噪声频谱
参考文献
[1]李雪霞, 冯久超.一种混沌信号的盲分离方法[J].物理学报, 2007, 56 (2) :701-703.
[2]张贤达, 保铮.盲信号分离[J].电子学报, 2001, 29 (12) :1 766-1 768.
[3]Aapo Hyvarinen, Juha Karhunen Erkki Oja.IndependentCcomponent Analysis[M].John Wiley and Sons, 2001.
[4]张发启.盲源信号分离技术[J].现代电子技术, 2004, 27 (20) :81-83.
[5]杨福生, 洪波.独立分量分析的原理与应用[M].北京:清华大学出版社, 2006.
独立分量分析及应用 篇5
关键词:文本聚类,向量空间模型,独立分量分析,非负矩阵分解,特征提取
0 引言
在文本聚类的过程中,通常涉及到两个关键问题,一是文本的预处理,二是选择合适的文本聚类算法模型。对文本预处理主要包括分词、去停用词处理和特征词提取等几个过程。北京大学计算机语言研究所在中文分词领域做了很多工作,提出了中文分词的有效方法[1];词频/倒文档频率方法是筛选特征词的有效方法,康乃尔大学的萨尔顿(Salton)多次写文章、写书讨论TF/IDF在信息检索中的用途。
文本聚类算法目前常用的则有分层法、分割法、密度法、网格法、基于模型的方法、基于模糊的方法等等。但这些算法多数都对文本特征矩阵的维度有较为苛刻的要求,一旦维度增大,则聚类效果会急剧下降。由于原始文本数据的复杂性,经处理形成的文本特征矩阵维度仍然相当大,出现了“维度灾难”问题[2]。这种不平衡问题导致许多聚类算法不能直接在文本特征数据上有效应用。在文本特征矩阵中还存在着冗余、词语多义和噪声等问题。为了克服这些缺点,本文提出将独立分量分析(ICA)用于特征词提取,目的是,在聚类之前,减少冗余数据和噪声数据的影响,以得到一个更为理想的聚类结果。
文本聚类过程如下:先通过数据清洗、分词过滤等处理过程构建出向量空间矩阵(Vectro-space Model,VSM);然后,采用独立分量分析(Independent Component Analysis,ICA)算法选出m个特征词构成的矩阵Y;进而,应用非负矩阵分解(NMF)、稀疏非负矩阵分解(SNMF)等算法对选出的数据集聚类,得出聚类结果。处理流程如图1所示。
1 文本的向量空间模型
本文采用向量空间模型(VSM)[3]来表示文本数据。其基本思想是:假设词与词之间是不相关的,以向量来表示文本,从而简化了文本中关键词之间的复杂关系,使得模型具备了可计算性。
在VSM中,将文档看成是相互独立的词条组(T1,T2,T3,…,Tn)构成,对于每一个词条Ti,根据其在文档中的重要程度赋予一定权值Wi,并将(T1,T2,T3,…,Tn)看成是一个n维坐标系中的坐标轴,(W1,W2,W3,…,Wn)为对应的坐标值。这样由(T1,T2,T3,…,Tn)分解得到的正交词条矢量组就构成了一个文档向量空间[4]。常用[0,1]区间内的实数来表示某个特征词在文档中的权重,权重主要根据词频tf、倒文档频率idf、规格化因子来计算。
目前应用效果比较好的权值函数是改进的TF-IDF公式,如式(1)所示。
t f(T):词T在整个文本集中的总频数,log(N/df(T)):为词T的倒文档率,
df(T):包含词T的文本数,N:整个文本集中的文本数。
采用该算法计算各文本筛选出来的每个特征词的权重Wi,构成向量空间模型矩阵X,如式(2)所示。设T={t1,…,tp}表示某文本中所有特征词组成的一个词条组,其中ti(1≤i≤p)表示一个特征词,表示全部特征词的个数。设S={s1,…,sn}表示由文本所构成的样本集合,其中表示样本数量,每一个样本si(1≤i≤n)表示在某文本中所有特征词的权重向量,即si(1≤i≤n)是一个p维空间向量,且。
2 文本特征提取过程
上述文本特征矩阵X仍然具有较高的维度,且数据具有典型的非高斯性,不仅要抽取数据的线性(二阶)统计信息,而且要注重数据的非线性(高阶)统计信息。
2.1 独立分量分析算法
独立分量分析(ICA)是主分量分析(PCA)的一种扩展[5],它已被用于声音信号的分离以及生物信息的处理等领域,并取得了很好的效果。PCA作为一种有用的无监督统计方法用来找出一致特征样本,其特点是只对二阶统计信息敏感。而在对文本特征数据作分析时,很多重要的信息是含在样本的高阶关系之中。独立分量分析(ICA)可以克服这一缺陷,其主要任务是使得变换后的信号尽可能地相互独立,这意味着数据的高阶相关性可以由ICA来去除。实验中,我们分析了一系列的独立分量(ICs)的数目和所选特征词的数量,旨在找出可以得到最大聚类正确率的最小特征词数。
设有n×p的矩阵X,其行表示变量(对于文本特征数据来说表示文本样本),其列表示个体(对于文本特征数据来说表示特征词),则矩阵的ICA模型可以记为式(3):
式(3)中,S是源矩阵,A是n×n维的混合矩阵。S的各列sk是统计独立的,称作矩阵S的独立分量ICs。X的各列是ICs的线性混合。我们将混合矩阵作如式(4)的转换:
ICA算法就是寻找合适的权矩阵W,从特征词矩阵X中提取独立的特征样本U(S的拷贝),以使U的各列尽可能地统计独立。
2.2 Fast-ICA算法
目前,已经提出了很多的独立分量分析算法[6]。由于Fast-ICA所具有的快速计算性及处理海量数据的能力,我们用该算法对特征词矩阵数据进行分析处理,在Fast-ICA中[7],各分量间的互信息是用近似计算公式(5)来表示的:
其中,G是任意的非二次函数,ζ是均值为0、方差为1的高斯分布的变量。ICA在分离变量的幅值和顺序上存在一定的不确定性,为消除不确定性,通常假定分离变量的方差为1。
Fast-ICA算法处理过程如图2所示,样本的快照ri看作是一系列相互统计独立的特征样本si的线性叠加。ICA算法就是要寻找合适的权矩阵W,从文本特征数据X中提取独立的特征样本U。在这个模型中,每一个快照ri看作一个随机变量,其中的每个文本各特征词权重组成的向量看作是随机变量的一个取值。
用ICA算法来估算矩阵W,使得矩阵U的各行统计独立,然后就可以用这些独立的特征样本(U的各行)来表示各个样本的快照ri。如式(6)所示,一个文本样本ri可以用独立的特征样本U和与之对应的坐标ai来表示。
这些坐标实际上就是混合矩阵A=W-1的各个行。
3 实验分析
为验证上述方法的有效性,于2011年11月从新浪网(www.sina.com.cn)上采集了中文文本数据集。数据集有400例样本。这400例样本分别属于4类:财经、社会、科技、体育。实验中,采用了评估文本分类经常使用的指标--召回率进行结果正确率评价。
在运行关键特征词选择程序时,独立分量的个数z值从1至10分别取10个不同的值,对于每个值,试验了50个不同的m值(1≤m≤p)。为了论证我们所用方法的有效性,对每个所选出的数据集,都分别应用NMF、SNMF、NMFSC进行聚类。使用召回率来表述聚类正确率[8],召回率计算公式如式(7)。
其中若样本ji的聚类正确,则I(ji)值为1,否则为0,n为样本数。
表1给出了对应不同关键特征词数NMF,SNMF和NMFSC算法对所选出的数据集聚类时的聚类正确率,其中,对于ICA,独立分量(ICs)数值z=7,对于NMF,SNMF和NMFSC,k=4。由以上结果可以看出,对于此数据集,ICA算法提取特征词可以有效改善聚类效果。
4 总结
本文提出了将独立分量分析方法用于文本特征词的提取。文中通过选择用ICA抽取的独立分量的个数和关键特征词的个数,找到了利用不同聚类算法得到最大聚类正确率的最少关键特征词数。至于关键特征词选择对于聚类稳定性的影响,并没有发现明显的规则。今后,应在更多的数据集上针对ICA算法与其他聚类算法的协作问题以及聚类稳定性等问题作更深入的研究。
参考文献
[1]北京大学计算语言学研究所.[EB/OL].http://icl.pku.edu.cn,2011.9.20
[2]West M.Bayesian factor regression models in the'large p,small n'paradigm[J].Bayesian Statistics,2003(7):723-732.
[3]王秀娟.文本检索中若干问题的研究[D].北京:北京邮电大学,2006.
[4]沈斌.基于分词的中文文本相似度计算研究[D].天津:天津财经大学,2006.
[5]Shahnaz F,Berry M,Pauca P,et al.Document clustering using nonnegative matrix factorization[J].Journal on Information Processing&Management,2006,42(2):373-386.
[6]HyvarinenA,Oja E.Independent component analysis:algorithm and applications[J].IEEE Transactions on Neural Networks,2000(13):411-430.
[7]HyvarinenA.Fast and robust fixed-point algorithms for independent component analysis[J].IEEE Transactions on Neural Networks,1999(10):626-634.
独立分量分析及应用 篇6
企业财务困境分析与预测是以企业财务报表、经营计划及相关经济资料为依据, 通过对财务指标的综合分析、预测, 反映企业经营情况和财务状况的变化, 并对企业各环节发生或可能发生的经营风险发出预警信号, 同时寻找财务危机发生的原因与企业财务管理体系中的隐藏问题, 为企业管理提供决策依据。
自Beaver开创性地提出财务困境预测模型以来, 许多预测方法被用于财务困境研究。20世纪60年代主要是Beaver和Altman分别采用的单变量、多变量判别分析;70~80年代判别分析被Logistic分析模型所取代, 90年代以来神经网络又被引入财务困境预测。
实证研究表明, 神经网络分析在判定正确率方面比线性模型和Logistic回归模型更加有效, 并且不受变量分布特征影响, 不需要主观定性地判断企业财务危机状态, 因而能够更加合理地确定危机状态。
BP神经网络是目前在财务分析中应用较多的一种神经网络类型。但是, 描述财务比率的指标很多, 如果将这些指标都作为模型输入, 将导致网络结构过于庞大。对于过大的网络结构, 一方面要求巨大的训练样本集支持, 在一般的研究中很难做到;另一方面也将导致神经网络的泛化能力下降, 使其预测性能变坏。因此很多研究中只选取部分指标作为模型输入, 这样又将导致分析信息的不完整。
有研究人员利用主分量分析 (Principal Component Analysis, PCA) 对高维指标进行降维, 但PCA建立在高斯性假设的基础上, 在小样本情况下 (财务分析在很多情况下是小样本) , 样本分布的高斯性假设一般是不成立的, 这时PCA对原指标信息的反映能力下降, 使神经网络分析预测结果的可靠性降低。
独立分量分析 (Independent Component Analysis, ICA) 是近年来发展起来的一种新的信号处理技术, 是将多通道观测信号按照统计独立的原则, 通过优化算法分解为若干独立分量, 这些分量是对源信号的估计, 观测信号可由这些独立分量的线性组合重建。
基本的ICA是指从多个源信号的线性混合信号中分离出源信号的技术。除了已知源信号是统计独立外, 无其他先验知识, ICA是伴随着盲信源问题而发展起来的, 故又称盲分离。
独立分量分析的基本前提条件是源信号为非高斯分布, 更适合小样本的降维与特征提取。
本文提出在财务困境分析这类小样本问题中, 利用ICA对高维指标进行降维, 在保留绝大多数样本信息的前提下缩小网络规模, 提高分析与预测的可靠性。
二、独立分量分析
独立分量分析可以认为是主分量分析在数据处理领域的延伸。两者的基本思想都是通过对数据的分解, 获取信号的特征分量, 以构造特征空间, 在特征空间中处理相应问题。但由于两者解决问题的思路和采用的数学方法不同, 因此也存在很大的差异。PCA利用的是基于数据协方差矩阵的二阶统计规律, 而ICA的算法要复杂得多, 其利用的是数据高阶统计规律;在PCA中, 一般假设处理的数据是高斯分布的, 而在ICA中, 假设处理的数据为非高斯分布。
在包括财务困境分析的许多实际问题中, 所处理的数据大多数是非高斯分布, 数据的重要特征往往包含在高阶统计特性中, 从上面的分析可以看出ICA比PCA更接近实际情况并满足更严格的数学条件, 因此有着更大的应用潜力。
在独立分量分析中, 令:x= (x1, x2, …, xn) T是n个随机观测信号;
每个观测信号都是由m个未知源信号s= (s1, s2, …, sn) T (其中n≥m) 线性混合而成;
每个随机观测信号和源信号都是零均值变量。
该模型描述了观测信号是如何由信源混合而成的。
由 (2) 式可知, 各观测信号xi是由独立分量经过不同的aij线性加权得到的。独立源sj是隐含变量, 不能直接测量;A=[a1, a2, …, am]是一个n×m矩阵, 称为混合矩阵, 混合矩阵也是一个未知矩阵, 唯一可利用的已知信息只有观测信号x。
独立分量分析首先基于一个简单的假设, 即源变量s是统计独立的, 同时源变量为非高斯分布。在估计出混合矩阵A后, 通过求混合矩阵的逆可以得到分离矩阵W=A-1, 从而得到独立分量s的估计u:
独立分量分析包括预处理和估计分离矩阵W两部分。
三、财务指标体系模型
关于财务困境的描述, Altman等综合了学术界定义财务困境的四种情形, 具体如下:第一, 经营失败。第二, 无偿付能力。第三, 违约。第四, 破产。
我国证券市场上被特别处理 (Special Treatment, ST) 的股票大多是因为“连续两年亏损或每股净资产低于股票面值 (1元) ”, 即财务指标的恶化是上市公司被特别处理的主要原因。
由于数据披露等问题, 国内学者一般将ST的上市公司作为财务困境公司。基于相同的原因, 本文中对财务困境的界定以是否被ST为准, 如果上市公司被ST, 则该公司陷入财务困境;反之, 则没有陷入财务困境。
根据有关财务困境预测模型的分析, 常用于财务困境预测的财务比率主要有30个。如果将30个财务比率指标全部作为神经网络的输入 (即30维向量) , 则输入节点多达30个, 而过大的网络结构一方面要求巨大的训练样本集支持, 另一方面也将导致神经网络的泛化能力下降;如果简单地从30个指标中选取部分指标作为神经网络输入, 则因为输入的信息不完整将会使预则结果的客观性和可靠性下降。
为此, 本文利用ICA的降维能力对原来30个财务比率指标的高维向量进行处理, 这里通过ICA将原来30维向量降为5维向量。
神经网络的输出用来描述分析结果, 即公司处于财务困境或未处于财务困境二种状态, 因此可以构造单隐含层神经网络结构:6个输入层节点 (第6个结点输入始终为-1, 作为阈值使用) , 8个隐含层节点, 2个输出层节点 (描述二种财务状态) , 由此建立了神经网络预测模型。
四、ICA神经网络分析实例
实验中选择的样本分为两类:财务困境 (ST) 类公司和非财务困境 (非ST) 类公司。从ST公司中选择51家中小规模的制造类公司, 然后根据相同的行业和规模选择51家非财务困境企业。分别选取30家ST和30家非ST企业作为训练样本集, 剩下的21家ST和21家非ST企业作为测试样本集。所有数据来自于网上公开披露数据。
为了反映在财务困境分析这类小样本问题中ICA与PCA对信息的描述能力, 本文采用相同的神经网络结构, 分别运用ICA和PCA将原来的30维财务比率指标降维成5维指标, 以降维后的指标作为神经网络的输入。测试时, 分别采用训练集中不同数量的样本进行训练, 以测试集全集进行测试, 结果见表2。
从表2中可以发现如下情况:
第一, 在训练样本很少的情况下, ICA降维的错误率比PCA降维低得多。在样本数为10、20的条件下, ICA的错误率只有9.5%, 比PCA的21.4%和16.7%要低得多。
第二, 随着训练样本的增加, PCA和ICA的错误率都在下降, 但ICA的错误率更低, 并且更稳定。
第三, 可以预见, 如果增加训练样本数, PCA的错误率将会进一步下降, 但是, 在实际使用中往往很难收集到足够大的训练样本集。
综上所述, 神经网络作为分一种具有并行计算、自学习和容错能力的分析技术, 为企业财务动态预警提供了一种可行的方法。为了避免构造过大规模的神经网络或由于简单地选取部分指标而造成信息不足, 同时为了适应财务困境分析中的小样本条件, 本文提出先采用独立分量分析对高维指标降维, 然后由神经网络对财务困境进行预测的方法。通过对我国ST与非ST公司财务困境的预测表明, 在小样本条件下ICA神经网络的预测能力明显高于PCA神经网络。
参考文献
[1]张祥、陈荣秋:《财务预警的模型分析》, 《科技与管理》2003年第3期。
[2]朱敏、聂顺江、范晓燕:《基于BP神经网络的财务预警机制研究》, 《财会通讯》2007年第4期。
[3]周遊:《企业财务管理的计算机辅助评价方法探讨》, 《江苏经贸职业技术学院学报》2009年第3期。
[4]陈磊:《基于比例危险和主成分模型的公司财务困境预测》, 《财经问题研究》2007年第7期。
[5]Jutten C, Herault J.Independent Component Analysis versus Principal Component Analysis.Processing of Europena Signal Processing Conference, Grenoble, France, 1988:643-646.
独立分量分析及应用 篇7
随着科技的高速发展, 海量数据的采集和存储已不再成为问题。在模式识别领域中, 仅获得待识别目标的原始数据是不够的, 需要从原始数据中发掘潜在的本质信息。通常待识别目标的原始数据的数据量相当大, 处于一个高维空间中, 直接用原始数据进行分类识别, 计算复杂度高且影响了分类器的性能。为了有效实现分类识别, 需要从待识别目标的原始数据映射到一个低维空间, 提取到最大可能反映待识别目标的本质信息。目前常用的提取特征的方法有主成份分析 (PCA) 和独立成分分析 (ICA) 。
PCA方法[1,2]是一种最小均方意义上的最优变换, 它的目标是去除输入随机向量之间的相关性, 突出原始数据中的隐含特性。其优势在于数据压缩以及对多维数据进行降维。但PCA方法利用二阶统计信息进行计算, 并未考虑到信号数据的高阶统计特性, 变换后的数据间仍有可能存在高阶冗余信息。从统计观点来看, 实际信号的大部分重要信息往往包含在高阶统计特性当中, 因此只有当多变量数据是由高斯分布的源信号构成时, PCA方法才能用来实现信号的分离。然而在现实中, 真正满足正态 (高斯) 分布的随机变量很少, 绝大部分随机变量都是非高斯的。
ICA方法[3,4,5]是20世纪90年代 Jutten和Herault提出的一种新的信号处理方法。该方法的目的是将观察到的数据进行某种线性分解, 使其分解成统计独立的成分。从统计分析的角度看, ICA和PCA同属多变量数据分析方法, 但ICA处理得到的各个分量不仅去除了相关性, 还是相互统计独立的, 而且是非高斯分布。因此, ICA能更加全面揭示数据间的本质结构。因此, ICA在许多方面对传统方法的重要突破使得其越来越成为信号处理中一个极具潜力的工具, 并己在模式识别、信号除噪、图像处理等诸多领域中得到了广泛应用。
本文把ICA应用到钞票识别中, 提出基于ICA的钞票识别。首先介绍了ICA的基本原理;接着提出了基于ICA的钞票识别方案;然后以第五套人民币作为实验对象进行了实验, 并对实验结果进行分析。
1 ICA原理[6,7,8]
假设存在N个独立的源信号, 写成向量形式为S= (s1, s2, ..., sn) T, 以及N个观测信号X= (x1, x2, ..., xn) T。这些信号是由未知且相互独立的源信号经混合系统A线性混合而成, X=AS。则由己知的观测信号X在A未知时求未知的源信号S问题就构成ICA模型。A称为混合阵, 由混合系数组成, A的每个行向量中的N个元素作为N个源信号的加权系数对源信号进行混合, 就得到对应的一个观测信号。
ICA方法的基本目标是寻找一个线性变换W, 称之为分离矩阵, 将其施加到观测信号X, 通过它能由观测信号恢复相互独立的源信号S。当W通过某种优化算法得到, 便有:Y=WX=WAS。
可见, 输出Y= (y1, y2, ..., yn) T是源信号S的一个估计。当分离矩阵W是A的逆时, 源信号S在Y中得到了分离, 由于没有任何参照目标, 这一过程只能是无监督的、无组织的过程。因此, ICA算法首先是要建立度量分离结果独立程度的准则即目标函数, 然后是对目标函数选择优化算法, 找出分离矩阵W。
在使用ICA算法对数据进行分离前, 通常需要对数据进行预处理。通过对数据进行预处理, 既可以简化下面的分析和计算, 也可以使ICA的算法更加稳定。
1.1 标准化
数据标准化的主要目的是从观测数据中除去其均值。
设均值m=E{x}, 可得到x′=x-m, 从而使E{x′}=0, 且x=x-m=As-E{As}=A (s-E{s}) =As′, E{s′}=0, 从上面可以看出, 数据去中心化后, 其混合矩阵不变, 在估计出s′后, 再加上相应的A-1E (x) , 就可以得到s。下面我们把x′和s′分别称为x和s。
1.2 白 化
白化的主要目的是去除数据的相关性。数据的白化处理可以使随后的计算大为简化, 并且还可以压缩数据。我们通常使用特征值分解的方法进行数据的白化, 即将x的协方差矩阵进行特征值分解为:
其中E为特征向量构成的正交阵, D=diag (d1, d2, ..., dn) 由特征值构成的对角阵。白化矩阵的形式如下:
其中, D-1/2 = diag (d1 -1/2, d2 -1/2, ..., dn-1/2) , 则x=D-1/2ETAs那么:
可以看出白化后得到的新的混合矩阵互是正交阵。白化减少了需要估计的参数的个数, 若要估计出n×n的原混合矩阵A, 需要估计出它的n×n个元素, 现在我们需要估计的是新的混合矩阵, 因其为正交阵, 只有n× (n-1) /2个未知参数。可以看出白化能极大地减少ICA的后续的计算量。白化还能压缩数据的维数, 考察x的协方差矩阵E{xxT}的特征值时, 可以舍去那些特征值很小的特征值, 这一点也有助于去掉噪声的影响。
1.3 ICA判据
在设计ICA算法的过程中, 最实际的困难是如何可靠地验证源信号分量间的独立性。由于概率密度未知, 直接利用互信息的方法去测度独立程度几乎是不可能的。为了测度这些分量的独立性, 需要给出独立性判据。目前常用的独立性判据[9,10]主要有:
(1) 非高斯的最大化;包括4阶累计量 (Kurtosis) 、负熵等。
(2) 互信息的最小化。
(3) 最大似然函数估计 (ML) 。
独立性判据的选择有赖于具体应用想要得到的最优计算性能。
1.4 FastICA算法
固定点算法又称为FastICA算法[12,13,14], 是一种快速寻优迭代算法。它有基于峰度、基于最大似然和负嫡最大化等多种形式。基于负墒最大化的FastICA算法, 以负嫡最大作为一个搜寻方向, 可以实现顺序地提取独立源, 充分体现了投影追踪这种传统线性变换的思想;而且该算法采用了定点迭代的优化算法, 使得收敛更加快速、稳健。采用基于负熵的固定点算法的优点是:
(1) 在ICA模型中, FastICA算法的收敛速度是二次以上的, 而梯度搜索法只是一次收敛。
(2) 与梯度搜索法相比, FastICA的步长参数容易确定。
(3) 该算法适合于任何非高斯信号。
(4) 可以通过选择不同的非线性函数f使算法获得不同的性能。
(5) 一次性可以估计出所有的独立成分。
(6) 该算法是并行的、分布的, 且计算简单, 需要的内存较少。
因此, 本文将采用基于负嫡的FastICA算法, 算法的实现步骤如下:
(1) 将x去均值、标准化, 然后加以白化得z。
(2) 设p为待提取独立成分的数目, 令i=1。
(3) 任意选择ui的初值ui (0) , 要求‖ui (0) ‖=1。
(4) 令ui (k + 1) =E{ zf[uiT (k) z]}-E{ f ′[uiT (k) z} ui (k) , f和f ′可以查表得到。
(5) 正交化:
(6) 归一化:
(7) 如ui未收敛, 回到步骤 (4) 。
(8) 令i加1, 如i≤p, 则回到步骤 (3) 。否则迭代结束。
2 基于ICA的钞票识别
在基于ICA的钞票识别算法中, 把钞票图像X 看作是统计独立基图像S 和未知混合矩阵A 的线性混合。钞票图像是独立基图像的线性组合。
提取到钞票图像的独立基图像, 由这些独立基图像张成的空间构成钞票的特征空间。钞票图像在特征空间上的投影向量可作为钞票识别的特征向量, 即可用钞票图像在特征空间上的投影来表示该钞票。
因训练样本的类别标记已知, 利用训练样本在钞票特征空间的投影可得到不同类的投影向量, 构成了特征模板库。根据特征模板库设计分类器。
基于ICA的识别框架如图1所示。
2.1 ROI切割
由于直接对钞票图像进行PCA, 其运算量是非常大, 以至于不能实用化。因此, 我们对倾斜校正后的图像进行ROI切割, 如表1所示。
表中的ROI切割位置为:行6~26, 列60~110。其ROI大小为50×20。
2.2 提取独立基图像
对于由ROI图像组成的图像库, 把图像库中每幅图像的各个像素逐行串接, 构成一维向量。再把库中的M幅图片构成的M个一维向量组成数据矩阵。设每幅图像的像素总数为N, 则数据的结构为:每幅图片的一维向量为一行。将各个图片的向量逐行叠置构成M×N数据阵X, 如图2所示。矩阵X经过解混矩阵W处理而得到独立成分矩阵U=WX, U的各行是相互独立的基本图像, 而解混矩阵之逆W-1的各行是各独立基图像在各原图像中的组合系数。
本文采用FastICA算法提取独立基图像。为了降低计算复杂度, 先采用PCA去除钞票ROI图像的二阶统计相关性, 其余的高阶统计量由FastICA进行分离。
先对图像作标准化、白化处理。设P是前k (k<m) 个特征向量组成p×k维矩阵, p是图像的像素数, k是主元个数。按FastICA算法步骤对PT进行处理, 提取到k个独立基图像:
由上式可得:
设R是m×n维的PCA系数, 则:
由上式可得:
由式 (3) 及式 (4) 可得:
因此, 独立系数B为:
经上述处理步骤提取到的独立基图像如图3所示。
2.3 分类决策
对任一待识别目标, 把它往特征空间上投影, 得到其投影向量, 通过比较待识别目标在特征空间上的投影向量与特征模板的距离, 可实现分类识别。这里选取最近邻分类器作为分类器。
对于有L个类别ω1, ω2, …, ωL的模式识别问题, 每类的特征模板为Bi, i=1, 2, …, L;设待识别目标X在特征空间上的投影向量为BX, d (·) 为马氏距离度量准则, X被判为ωj类的判别规则为:
为提高识别性能, 增加拒识处理。按照最小距离法获得待识别目标的最可能类别后, 按如下规则给出识别结果。
式中, Tmin和Tmax为经验阈值。
3 实 验
选取人民币第五套2005版的钞票作为实验样本, 该套人民币有五个面值、四个面向。训练样本:每个面值、面向各有10张图像, 对应200个样本。测试样本:每个面值、面向各有20张图像, 对应400个样本。实验样本共600个, 为了测试算法的泛化能力, 训练样本和测试样本分别来自两批钞票。
为了对比, 采用上述实验样本, 本文还实现了文献[15]提出的基于神经网络的钞票识别算法。
实验是在Intel Pentium Dual Core 1.8G CPU以及Miscrosoft Windows 2000的环境下用VC++ 6.0编程实现。
3.1 实验结果
用识别率、拒识率来衡量识别性能。以下是性能指标的说明。
(1) 识别率
识别率=正确判别数 / 总测试样本数;
(2) 拒识率
拒识率=拒识样本数 / 总测试样本数。
测试实验结果如表2所示。
3.2 实验结果分析
实验结果表明, 与文献[15]提出的识别方法相比, 本文方法的识别效果更好。神经网络可解释性差, 是黑盒模型, 给权值和网络节点的训练带来困难。此外, 实验给两种方法都加入拒识。
通过分析拒识样本, 发现拒识的原因主要有: (1) 钞票污损严重, 存在折痕、笔画, 给钞票图像引入大量的噪声; (2) 钞票图像残缺导致信息不完整; (3) 成像设备的限制影响了钞票图像质量。
由于ICA处理的对象是ROI图像, 因此, 识别性能与ROI的选取有关:只有选取的ROI图像具有较好的可区分性时, 才能保证识别算法的性能。
4 结 论
ICA是一种基于高阶统计的多变量分析方法, 能够从非高斯分布的信号中分离出独立的信号分量。实际的随机变量多为非高斯分布。本文的实验结果表明, ICA能从钞票图像中提出到有效特征, 可应用于钞票识别。
ICA处理的对象是ROI图像, 通过寻找更为适合的ROI切割方法将有助于提高ICA算法性能。
摘要:提出一种基于独立分量分析的钞票识别算法。先对钞票图像作感兴趣区域 (ROI) 切割;接着对ROI图像作标准化、白化预处理;然后采用基于负熵独立性判据的固定点方法 (FastICA) 对预处理后的ROI图像做ICA分离, 提取独立基图像, 进而获得钞票的特征空间, 并构建特征模板;通过计算待识别目标与特征模板的距离实现识别。以第五套人民币作为实验对象进行实验, 实验结果表明方法的有效性。