模糊径向基函数(共7篇)
模糊径向基函数 篇1
摘要:提出了基于径向基函数神经网络的电网模糊元胞故障诊断方法,旨在有效解决神经网络应用于电网故障诊断所面临的适应网络拓扑结构变化的可移植性问题。该方法以单个线路、母线和变压器为元胞对象,以保护各元胞的所有关联保护和对应的断路器为输入,建立了元胞通用神经网络诊断模型,并给出了故障诊断时模型的自动生成方法。此外,考虑到电网故障信息存在不完备性和不确定性,本文采用模糊矢状图来描述电网元件、保护和断路器之间的逻辑推理关系,并提取出蕴含不确定性的模糊推理规则,用于训练元胞通用神经网络。算例仿真结果表明,该方法简单、有效,能处理各种复杂故障情况,且能有效适应网络拓扑结构的变化,具有良好的容错性和可移植性。
关键词:电力系统,元胞故障诊断,径向基函数神经网络,模糊矢状图,可移植性
0 引言
神经网络凭借其分布式并行处理,高容错、强泛化等特点近年来在电网故障诊断中得到了深入的研究。基于神经网络的电网故障诊断方法主要分为集中诊断方法[1]和分区诊断方法[2-3]。集中诊断方法将整个电网作为一个整体,通过一个神经网络来实现故障元件辨识。该方法原理简单,但当电网规模较大时,易陷入“维数灾”问题。而分区诊断方法将整个电网分割为若干小规模子网,针对每个子网分别进行诊断,从而解决了“维数灾”问题。然而,当网络拓扑结构变化时,两者均需重新提取训练样本用于训练神经网络,模型的可移植性[4]较差。若将分区诊断方法继续细分粒化则可得到元胞诊断方法[5-6]。电网元胞故障诊断方法以电网单个设备,如线路、母线和变压器为元胞对象,根据不同元胞的保护配置特点建立相应的神经网络诊断模型。文献[7]利用神经网络模拟元胞的每套继电保护,并通过专家系统对所有神经网络的输出进行决策。然而,当电网保护配置发生变化,抑或将其移植于其他配置不同保护的电网时,该方法需要重新建模,从而降低了可移植性。文献[8]利用一个神经网络来模拟元胞的全套保护,克服了文献[7]的缺陷,然而其以安装在元胞位置上的所有保护和相应的断路器为神经网络输入,需通过模糊积分融合其他元胞的诊断结论来综合决策,增加了诊断复杂度,且模糊积分的参数也不易确定。
此外,电网故障时存在诸如保护和/或断路器误动、拒动以及信息畸变等,使得电网故障信息存在不完备性和不确定性。在多重故障或扩大性故障发生时,这种不完备性和不确定性尤其明显[9]。此种背景下,电网故障诊断方法需要具备良好的故障容错能力。
对此,本文提出了基于径向基函数神经网络的电网模糊元胞故障诊断方法。该方法直接以保护元胞的所有关联保护和相应的断路器为输入来构建各个元胞的通用神经网络诊断模型,并给出了故障诊断时模型的自动生成策略。此外,采用模糊矢状图来描述元胞、保护和断路器之间的逻辑推理关系,并提取出蕴含不确定性的模糊推理规则来训练相应的元胞通用神经网络。最后,通过算例仿真结果验证该方法的有效性。
1 电网元胞故障诊断模型
1.1 线路故障诊断模型
图1(a)为保护线路L2的关联保护示意图,包括主保护LSm和LRm、近后备保护LSp和LRp及远后备保护LSs和LRs,其通用神经网络诊断模型如图1(b)所示。图中,线路两端(送端S和受端R)的所有远后备保护和对应的断路器分别用一个神经元表示,其输入为:
式中:MLPSs(MLPRs)和MLCBSs(MLCBRs)分别为S端(R端)已动作的保护数和对应的断路器数;NLPSs(NLPRs)和NLCBSs(NLCBRs)分别为S端(R端)的所有保护数和对应的断路器数。
1.2 母线故障诊断模型
母线B2的关联保护示意图如图2(a)所示,包括主保护Bm和远后备保护Bs。对应的通用神经网络诊断模型如图2(b)所示,其中直接与母线相连的所有断路器采用一个神经元表示,输入为:
式中:MBCBm为已动作的与母线相连的断路器数;NBCBm为与母线相连的所有断路器数。
而母线的所有远后备保护和相应的断路器也都采用一个神经元表示,其输入为:
式中:MBPs(MBCBs)为已动作的保护(断路器)数;NBPs(NBCBs)为母线对应的所有保护(断路器)数。
1.3 变压器故障诊断模型
图3(a)为保护变压器T的关联保护示意图,包括主保护Tm、近后备保护Tp和远后备保护LSs和LRs,其通用神经网络诊断模型如图3(b)所示。两端的所有远后备保护和相应的断路器输入采用式(1)、式(2)的输入方案。
2 电网元胞故障诊断系统结构
提出的元胞故障诊断系统结构如图4所示。
电网发生故障后,首要任务是对监控中心收到的警报信息进行预处理,包括故障区域确定,候选故障元件辨识,信息分组、归并、转换等;警报信息经预处理模块处理后进入元胞通用神经网络诊断模块,完成各个候选故障元件的故障诊断,得到元件的故障可信度;最后,经过故障诊断结论综合处理模块处理,包括保护和断路器的动作逻辑评价、神经网络的诊断输出汇总,从而整理出完整的诊断结论,并将其输出。
3 电网元胞故障诊断模型自动生成方法
电网中不同元胞对应的保护和断路器不同,且电网接线经常发生变化,虽然元胞的神经网络模型是通用的,但故障后要求调度人员人工生成每个元胞的诊断模型是不切实际的。为此,本文利用3-D矩阵[10]来自动生成电网元胞故障诊断模型。3-D矩阵包含拓扑矩阵、保护矩阵和断路器矩阵,是一种基于母线位置信息的表示方法。含有N条母线的电网均可表示为N ×N阶的方阵。图5所示局部电网可表示为式(5)所示的拓扑矩阵和式(6)—式(9)所示的保护和断路器矩阵。其中,拓扑矩阵的对角线元素表示母线,非对角线元素表示连接两两母线的元件;保护矩阵元素和断路器矩阵元素表示相应的保护或断路器。
主保护矩阵:
近后备保护矩阵:
远后备保护矩阵:
断路器矩阵:
蕴含于3-D矩阵之间的逻辑推理信息如下。
1)保护矩阵与拓扑矩阵间的保护规则:1主保护矩阵元素和近后备保护矩阵元素均对应于拓扑矩阵相应位置元素;2远后备保护矩阵元素对应于拓扑矩阵除自身位置外相应列的所有元素,如若两个或两个以上远后备保护指向同一位置元素,则取其交集。
2)保护矩阵与断路器矩阵间的动作推理规则:1母线主保护矩阵元素对应于断路器矩阵相应行的所有断路器元素;2 线路保护和变压器保护(主保护、近后备保护和远后备保护)矩阵元素对应于断路器矩阵相应位置断路器元素。
电网故障后,可通过下述步骤快速确定候选故障元件,并生成相应的元胞故障诊断模型。
步骤1:确定电网故障后的停电区域,则故障元件肯定在停电区域内,从而确定候选故障元件。
步骤2:在停电区域内搜索拓扑矩阵和保护矩阵,确定元件的主保护、近后备保护和远后备保护。
步骤3:搜索保护矩阵和断路器矩阵,确定各个保护对应的断路器。
步骤4:确定候选故障元件及其对应的保护、断路器配置后,结合监控中心收集到的警报信息确定各个元件对应的元胞通用神经网络的输入。
通过上述步骤可以快速确定各个神经网络的输入,生成元胞故障诊断模型,提高故障诊断效率。此外,待诊断出故障元件后,可将警报信息与3-D矩阵进行比对,从而评价保护和断路器的动作逻辑。
4 模糊矢状图
4.1 模糊逻辑与模糊算子
模糊逻辑中,论域X中某元素x与模糊集合A的关系并非“非此即彼”,而是以某一偏度包含于A中:
式中:μA(x)∈[0,1],为元素x包含于模糊集合A的偏度,称为隶属度。
论域X中,两模糊集合A与B的析取记为A∨B,合取记为A ∧B。文献[11]提出了一种广义Dombi运算算子,其运算如下:
式中:γ∈[0,∞)和α 为模糊参数;a=μA(x),b=μB(x),分别为元素x包含于模糊集合A和B的隶属度。
4.2 模糊矢状图
电网故障及其故障清除过程可用矢状图[12]来表示,矢状图以图形化形式描述故障发生后故障元件、保护和断路器之间存在的不确定因果逻辑关系。矢状图包含3种节点集:故障元件集、保护集和断路器集。3种节点之间的因果关系用矢量箭头表示,矢量箭头的权值表示两个节点之间推理的可信度。以图1(a)所示输电线L2为例,其对应的矢状图如图6所示。
蕴含于矢状图中的模糊关系可利用广义Dombi算子通过以下两个步骤实现推理。
步骤1:利用合取算子分别计算所有连通路径(指保护与断路器都动作的路径)的合取运算结果。
步骤2:利用析取算子对多条连通路径的合取结果进行析取运算,所得结果即为元件的故障可信度。
通过上述两个步骤可获得不同故障动作模式对应的元胞故障可信度,实现元胞—保护—断路器之间的模糊推理,并将提取出的推理规则用于元胞神经网络的训练。本文取γ=0.5,并集算子中α=-2,交集算子中α=2。
4.3 模糊矢状图权值确定
为使推理更加真实地反映实际电网的运行情况,本文选用2004—2008 年[13]国家电网公司220kV及以上系统线路、母线和变压器主保护动作正确率的加权平均值作为矢量箭头权值。而主保护对应的断路器的动作可信度采用文献[14]中的值,即0.983 3。对于后备保护和相应的断路器,本文采用文献[15]的取值,即近后备保护和远后备保护的动作可信度分别取0.8和0.7,相应断路器的值增加0.05。从而可得各类保护和断路器动作可信度值如表1所示。
注:“—”表示不存在此数据。
5 电网模糊元胞故障诊断流程
基于径向基函数神经网络的电网模糊元胞故障诊断的流程如图7所示。
首先,通过电网的静态数据(网络拓扑结构、保护配置信息等)建立电网的3-D矩阵,用于存储网络拓扑结构和继电保护信息,并结合模糊矢状图和径向基函数神经网络建立不同类型元胞的诊断模型,完成元胞故障诊断系统的构建。故障发生后,结合电网的静态数据和监控中心收到的实时数据(保护和断路器动作信息)确定候选故障元件,并对实时数据进行预处理,然后运行相应的元胞诊断模型求出各个候选故障元件的故障可信度,并评价各个保护和断路器的动作逻辑,最后经过故障结论综合处理模块整理并输出相关诊断结果,完成整个诊断过程。
6 算例仿真
本文采用附录A图A1所示的IEEE 30节点系统作为仿真测试系统。图中,母线为B01至B30,线路和变压器分别表示为LXY和TXY(X和Y表示母线编号,下同);限于篇幅,未标出断路器编号,其编号采用母线编号交互编码,标为CBXY(CBYX),表示该断路器位于相连母线BX和BY上,并与母线BX相接(与母线BY相接)。对于保护系统,母线主保护为B01m至B30m,线路保护为LZk(Z为断路器编号,k=m,p,s,下同),变压器保护为TMk(M为变压器编号)。
采用正交最小二乘法来训练径向基函数神经网络。本文进行了大量仿真实验,其中部分故障情况较为严重的测试样本列于表2中。
1)算例1:单重故障存在保护或断路器拒动
测试样本1和2的诊断结果列于表3中。由结果可知,当故障存在保护或断路器拒动时,本文故障诊断方法能有效诊断故障元件,且其故障可信度较高。
注:限于篇幅,此表仅列出故障元件的相关信息,下同。
2)算例2:单重故障存在信息畸变(或误动)
表4为样本3 和4 的故障诊断输出。由表可知,故障发生后,因某种原因(如信息传输干扰)导致警报信息(CB0604和L1009m)丢失或保护系统存在误动(L2110p)时,本文方法仍能有效诊断故障元件。
3)算例3:多重故障伴随拒动或信息畸变(误动)
多重故障对电网故障诊断方法提出了更高要求,特别是伴随着保护/断路器拒动或信息畸变(误动)的情况,要求诊断方法具有很强的故障容错能力。而本文的元胞故障诊断方法在电网发生多重故障时仍具有很好的诊断效果,如表5所示。
4)算例4:网络拓扑变化时诊断模型的快速修正
元胞诊断模型的一个突出优点就是具有良好的可移植性。当电网拓扑结构发生变化时,通用神经网络模型无需修正,而只需修正3-D矩阵即可,且修正极为简单,共有3种修正情况。
1)增添一行与一列:当增加一条母线时,只需在所有矩阵之后增添一行与一列,并按照各矩阵的构造原理在与新增母线有关联的位置增添相应的元素。
2)删减一行与一列:当删减一条母线时,只需删掉所有矩阵中被删母线所在行与所在列,并按照矩阵的构造原理修正与被删母线相连的其他母线相应的位置元素。
3)矩阵维数保持不变:当网络母线结构保持不变,只是增加或减少线路时,只需按照各矩阵的构造原理修正由该线路连接的两条母线相应的位置元素。
表6为网络拓扑结构发生变化时部分测试样本的诊断结果。其中,测试样本7为在测试样本1基础上增加母线B31和线路L0931后的故障情况,如附录A图A1中虚线所示;测试样本8为在测试样本5基础上线路L1215因检修而停运的故障情况;而测试样本9为在测试样本6基础上增加一条线路L0528后的故障情况。对比故障诊断结果可知,网络拓扑结构变化时模型的诊断效果不受影响,仍能得出相同的诊断结论。
上述结果表明,通用神经网络诊断模型一经建好即可直接用于电网中相应类型的所有元件,无需针对每个元件分别建模,从而大大降低了建模复杂度。模型在诊断过程中采用的是局部诊断策略,该策略只跟元件的接线方式有关,而无需全网的信息,因此不受电网规模大小的影响。神经网络输出直接给出了相应元件的故障可信度,而无需通过其他技术或策略对该输出进行再诊断,因此在进一步降低建模复杂度的同时提高了诊断效率。此外,该模型能正确处理各种类型的故障情形,具有良好的故障容错能力和诊断准确度,且能适应网络拓扑结构的变化,有效地解决了神经网络应用于电网故障诊断面临的可移植性问题。
7 结论
1)元胞通用神经网络故障诊断模型易于构造、实现,诊断过程采用局部诊断策略,不受电网规模的影响,从而可用于大规模电网的故障诊断。
2)3-D矩阵的使用为诊断时故障诊断模型的自动生成和最终的动作评价带来便利。
3)模糊矢状图能很好地描述元件、保护和断路器之间的逻辑推理关系,能有效反映电网故障信息存在的不完备性和不确定性。
4)该方法能正确处理各种复杂故障,诸如存在保护/断路器拒动、误动或警报信息丢失,甚至多重故障的情况,且网络拓扑结构变化时模型的修正方法简单、快速,具有良好的容错性和可移植性。
附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。
模糊径向基函数 篇2
关键词:航站楼,位置服务,定位技术,集合,加权径向基函数
0 引 言
为了满足航空旅客在航站楼内的位置服务需要,机场决定开发面向航空旅客的位置服务技术,例如登机口指引,机场服务设施引导等。针对这种情况,提出采用航站楼内已部署好的无线通信设施为用户提供精确的位置信息。
现有的基于信号强度的无线定位技术主要分为传播模型和位置指纹。对于复杂的室内环境很难建立精确的传播模型,因此传播模型定位精度受到很大的限制。位置指纹技术在每个采样单元的中心收集AP信息,形成采样数据库; 在定位阶段,将实测数据与采样数据库中的数据对比,最终确定位置。最简单的对比算法是最近邻,在文献[1,2]中通过统计学方法降低环境因素引起的信号强度波动,提高了最近邻算法的准确度。文献[3]提出了加权最近邻,根据采样点处样本数和样本方差确定权值。文献[4]提出根据AP在各采样点的信号强度变化情况确定权值,并将其应用到径向基核函数中。文献[5,6]证明了信号强度的变化近似符合正态分布,并将其应用到各自的定位算法中。文献[7 - 11]都采用一些人工智能算法提高了定位准确率和精度。文献[12]介绍了一种基于隐状态排序的半异构无线定位技术。文献[13]通过计算未知节点信号向量与各个样本点对应向量的贴近度,最终确定未知节点的坐标。文献[14,15]详细分析和总结了现有基于信号强度的定位技术及其普适性。
考虑到航站楼实际环境中,旅客非常多且走动频繁,由于人体大约90% 的成分是水,水的共振频率大约为2. 4 GHz,而无线局域网也工作于该频段,因此旅客会对无线信号产生较大的影响。因此,如何降低人对信号的影响是提高航站楼内定位准确度的关键。本文提出通过多次采集AP信息,来降低人对信号强度的随机性影响,同时采用集合和加权径向基融合的定位技术,实现用户的准确定位。
1 定位算法
与传统指纹定位技术一样,本文方法也分为两个阶段: 离线采样阶段和实施定位阶段。在离线采样阶段,本文分别提取了采样数据的集合特征和数值特性,集合特性描述了信号较弱的AP对定位的作用,数值特性主要描述信号较强的AP对定位的作用。在实施定位阶段,先通过集合特征缩小定位范围,再通过数值特征实现准确定位,其定位方法框架如图1所示。采用集合的方式处理AP信息,第一能够降低人对信号的随机性影响,第二利用了信号较弱的AP对定位作用,可以弥补传统定位算法只是用信号强的AP的不足,第三对于某个AP的突然故障不敏感,降低了对定位影响。
1. 1 离线采样与预处理
与传统位置指纹定位技术一样,离线采样阶段的目标是构建一个关于采样点与采样点感测到的AP的关系数据库。为了获取这些数据,首先需要在待定位环境里划分采样点,例如可以将定位环境用网格划分,每1或2 m2为一个采样点,然后遍历所有采样点,记录下每个采样点收到的AP信息。采样点实测到的AP信息集合表示为:
其中APi,j表示在第i个采样点第j次采样的AP信息集合,api,j,k表示在第i个采样点处,第j次采样感测到的第k个AP信息,maci,j,k和rssii,j,k分别表示相应AP的MAC地址和信号强度值。
1. 1. 1 提取集合特征
在不同采样点处无线网卡能够感测到AP的数量存在差异。即使在同一位置处检测到AP的数量也在变化,因为在航站楼内旅客非常多,走动非常频繁,对无线信号的影响非常大,因此造成无线网卡感测到的AP的数量不稳定。因此,对采样数据应采用集合的方式处理。
以集合的方式处理采样数据,就是充分利用信号强度较弱的AP对定位的贡献。例如某些AP只有少部分采样点能够感测到,假如在定位阶段时能够感测这些AP就可以迅速缩小候选定位位置集合。相反,如果每一个采样点都能感测到某个AP,那么这个AP不能用于区分位置。航站楼是一个面积较大的建筑楼层,且内部部署了大量无线AP,这就会存在某些采样点能够感测到一个或几个信号较弱的AP,而其他采样点则是无法感测到,充分利用这些AP能大幅降低定位时的比较次数、提高准确率。这种方法充分利用信号较弱的AP对定位的贡献,弥补了传统定位算法只使用信号较强的AP的缺点。
基于以上思想处理采样数据,第一步获取每个采样点能够感测的AP集合,例如第i个采样点感测到的AP的MAC地址集合可以表示如下:
其中MACi,j表示第i个采样点第j次采样的AP对应MAC地址集合,MACi表示第i个采样点m次采样感测到的所有AP的MAC地址集合,m表示在第i个采样点处采样的次数。
第二步根据MACi集合建立能够感测到某个AP的所有位置集合,例如能够感测到第k个AP的位置集合表示如下:
其中positioni( 0≤i≤l) 表示第i个位置。
1. 1. 2 提取数据特征
无线信号随着传播距离逐渐衰减,加之航站楼内墙壁、设备、人员走动对信号的干扰,在采样点某些AP会出现时有时无,不稳定状态,这些AP对于数值方式定位的贡献非常小。因此,在数值处理时只使用在某采样点处的m次采样中出现比例超过70% 的AP,通过数学统计得到采样点的数值特征包括均值和方差,最终形成采样点数字特征集合,例如第i个采样点数值特征集合表示如下:
其中,表示第k个AP的m次采样值的均值,δi,k表示第k个AP的m次采样值的标准差,在采样数据中,存在某些AP在某几次采样中没有出现,这时使用能够感测到AP信号的极小值作为缺省值,通过实验选择为 - 95 d Bm。
1. 1. 3 确定权值
对于不同的AP在数值定位算法中贡献并不相同,例如: 某些AP在各个采样点感测到的信号强度变化幅度非常大,那么这些AP在数值定位算法贡献也大,可用于区分位置; 相反,如果在各个采样点处的信号强度变化不大,那么这些AP对数值定位算法的贡献也就小。因此在数值定位中应该有区别地对待各个AP。本文采用不同采样点感测到的AP信号强度的方差描述AP的权值。因为方差越大,说明不同采样点感测到该AP的信号强度变化越大,越容易区分位置,反之,如果方差很小,说明不同采样点感测到该AP的信号强度相差不大,很难用于区分位置。其第k个AP的权值计算方式如下:
其中,l表示采样点的总数,表示第k个AP在所有采样点处信号强度的均值,同样在计算中存在缺失值问题,与上面一样默认缺失值为 - 95 d Bm。
1. 2 实现定位
为了降低航站楼内人员频繁走动对定位准确度的影响,在实验中采用连续多次收集AP信息的方式来降低人对无线信号的影响。对于收集到的数据,其处理过程与采样阶段一样,最后得到需定位位置的MAC集合和Num集合。MAC集合表示感测到AP的MAC地址集合,通过该集合可以缩小定位范围,Num集合表示感测到AP的数值特征集合,通过数值特征比对实现准确定位。
1. 2. 1 以集合方式缩小定位算法
在定位阶段能够感测到的AP的集合可以表示为:
根据MAC集合的各个元素查找相应的Position集合,选择元素最少的Position集合作为目标位置集合。
其中,Count( APk) 计算APk集合的元素个数,Positiontarget表示元素个数最少的AP集合。
1. 2. 2 以数值方式准确定位
定义1径向基满足K( x,c) = f( ‖x - c‖) ,其中c是中心点。
径向基函数是一个取值仅依赖于离中心点距离的实值函数,一般距离选择欧式距离。在大量采集数据的前提下,某一位置感测的固定AP的信号强度基本满足高斯分布,这一结论在文献[5,6]中已经得到验证。因此,本文选择高斯函数作为径向基函数,可以表示为如下:
在数值定位阶段计算得到待定位位置的数值特征集合表示为如下:
在本文中,选择样本均值作为径向基函数的中心点c ,δ为样本的方差。由径向基函数定义可以看出,距离中心点越近的值,径向基值越大。在数值定位阶段,集合Positiontarget中各个位置的数值特征分别与待定位置Num的数值特征计算径向基值,并将其作为相似值。最终选择具有最大相似度的候选位置作为旅客位置,其计算公式如下:
其中,计算径向基值也涉及到缺省值,与前面类似采用缺失值 - 95 d Bm。
2 建立实验环境
实验为了模仿航站楼旅客多,走动频繁等特点,实验选择中国民航大学南院第四教学楼五楼( 见图2所示) ,该教学楼的第二、三、四层都部署了大量无线AP,因为五楼为计算机学院实验机房,平时上机人员非常多,且走动非常频繁。采样工作和定位选在学生上机时间,以达到与航站楼的最大相似性。
实验中使用Android智能手机和装有Linux操作系统的笔记本作为移动终端,实验软件由Java语言编写实现,再结合本文的定位算法完成实验。对于采样阶段,本文采用网格划分采样点,其中每个采样点面积约为2 m2,第一次在各采样点中心位置采样40 ~ 50次,其中每次采样间隔5分钟,以保证收到的AP集合不受随机性事件影响,用于离线阶段的提取集合和数值特征。第二次在每个采样点连续采样15 ~ 20次用于实测定位实验,验证本文算法的有效性。
3 实验结果与分析
在实验验证中,第一次采集的数据用于提取各个采样点的集合特征和数值特征,第二次采集的数据用于验证本文定位算法的准确度。从第一次采样数据中随机选择3个采样点,统计扫描次数与扫描到的AP个数的关系如图3所示。
图3显示了3个采样点在30次采样时感测到AP的数量,实验结果表明不同采样点处能够感测到的AP数量不同,即使在同一采样点处感测的AP的数量也是一直变化的,这说明实验室的电子设备、学生的走动对无线信号产生很大的影响。因此,在实施定位阶段应该以集合角度处理数据,另外可以采用多次收集AP信息以保证数据的完整性。
本文统计了某个采样点在30次采样中4个AP信号强度的变化情况如图4所示,通过统计结果可以看到AP信号强度越大,信号强度变化幅度就大,这也进一步说明人员的走动对无线信号的影响非常大。因此,在提取集合和数据特征时采用多次收集AP信息能够降低随机性对信号强度的影响。
通过图3和图4可以看出单次采样具有很大随机性,这正是人员频繁的走动造成的。为了降低随机性对提取位置特征的影响,在实验中采用连续多次采样和加入5分钟时间的方式来降低随机事件对无线信号的影响。
为了说明本文方法在定位准确度上的性能,在误差2 m内条件下,与参考文献中的最近邻算法、加权最近邻、加权核函数、高斯分布四种定位算法进行了对比如图5所示。
通过在图5可以看出在精度2 m内的条件下,各算法随着采样次数的增加,定位准确度逐渐升高。同时与最近邻算法、加权最近邻、加权核函数、高斯分布方法的对比,可以看出本文方法在定位误差为2 m内、采样次数为7时,相对最近邻算法、加权最近邻、加权核函数、高斯分布,定位准确 率分别提 高了33% 、25% 、17% 、20% 。通过实验与现有的定位技术进行对比,表明本文算法能够降低人员频繁走动对定位的影响,同时大幅提高定位精度,能满足航站楼内位置服务的需要。
4 结 语
模糊径向基函数 篇3
轴承是电机主轴的支撑, 是电机的重要部件之一。异步电动机的轴承故障发生概率约为40%, 由于工作面接触应力的长期反复作用, 极易引起轴承疲劳、裂纹、压痕等故障, 将引起电机异常振动, 电机将无法正常运行。这种异常振动超过常规振动所规定的允许值时, 也会对电力生产及人身安全带来极大的危害甚至整机报废, 造成重大事故。可见轴承工作状态是否正常, 对于电机有着重大的影响。
目前, 轴承故障可通过目测、测量和无损探伤等方法进行检测, 但这些方法易受噪声干扰而产生误判。而神经网络的自学习能力、非线性映射能力、对任意函数的逼近能力、并行计算能力和容错能力等为构造新型故障诊断系统提供了有力手段[1]。本文采用基于径向基函数神经网络技术对作为电机主要支承型式的滚动轴承进行智能故障诊断。
1 径向基函数神经网络
径向基函数神经网络用径向基函数作为隐层单元的“基”, 构成含层空间, 隐含层对输入矢量进行变换, 将低维的模式输入数据变换到高维空间内, 使得在低维空间内的线性不可分问题在高维空间内线性可分。
1.1 径向基函数神经网络建模原理
径向基函数神经网络是单隐层的前向网络, 它有三层构成:第一层是输入层, 由信号源节点组成;第二层是隐含层, 隐单元的个数由所描述的问题而定, 隐单元的变换函数是对中心点径向对称且衰减的非负非线性函数;第三层是输出层, 它对输入模式做出响应。径向基函数网络模型如图1所示。
1.2 径向基函数神经网络训练算法
径向基函数的Gaussian函数网络的学习参数有3个, 即各径向基函数的中心Ck、方差σk和输出单元的权值Wk。径向基函数网络算法步骤如下[2,3]:
1) 从输入向量中选一组初始中心值Ck;
2) 计算方差值
式中dmax为最大的距离, K为Ck的数量;
为网络期望输出;为3个参数的学习步长。
5) 如网络收敛, 则计算停止, 否则转到步骤 (4) 。
2 电机轴承的故障特征提取
本实验采用型号为6204的深沟球轴承, 在电机驱动端轴承座上使用带磁座的电荷加速度传感器采集振动信号。考虑到生产现场很难搜集全各种故障数据, 采用电火花加工技术在正常轴承各表面加工出细微的点蚀。轴承故障分为内圈故障、外圈故障、滚子故障、正常轴承4种状态。故障直径分别分为0.007inchs, 0.014inchs, 0.021inchs三个等级, 深度都为0.011 inchs。马达电机负载分别在0, 1, 2, 3HP下测得的, 电机转速为1430rpm, 其每一个状态如表1所示组合进行测试。然后采用小波包频带能量分析技术提取滚动轴承的故障特征[4]。
3 电机轴承故障诊断仿真结果
通过调用MATLAB神经网络工具箱的newrb函数创建一个径向基函数神经网络, 输入层神经元16个, 输出层神经元16个, 径向基函数的分布密度SPREAD=3, 训练目标误差值取为0.0001。网络的输出模式, 采用以下的输出模式:
滚动体故障: (1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0) ;
内圈故障: (0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0) ;
外圈故障: (0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0) ;
无故障: (0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0) ;
在训练的过程中, 隐含层的神经元数量的确定是一个关键, 传统的做法是使其与输入向量的元素相等, 显然此方法在输入矢量过多时, 过多的隐含层神经元让人难以接受。此处, 隐含层的神经元从0个神经元开始训练, 通过检查输出误差使网络自动增加神经元, 每次循环使用, 使网络产生的最大误差所对应的输入向量作为权值向量, 产生一个新的隐含层神经元, 然后检查新网络的误差, 重复此过程直到达到误差要求或最大隐含层神经元数为止。
我们选择了80组训练样本时, 73步达到训练目标, 如图2所示。选用滚动轴承的48组测试样本送入训练好的径向基函数神经网络进行模式识别, 诊断结果如表2所示。由表2可以得到径向基函数神经网络诊断准确率为97.91%。
在径向基函数神经网络的设计中, 最重要的参数是径向基函数的分布密度。为了验证径向基函数的分布密度的取值对故障诊断准确率的影响, 分别取SPREAD=1, SPREAD=2, S P R E A D=8, 仍采用原训练样本和测试样本进行试验。图3、4、5分别为取SPREAD=1, SPREAD=2, SPREAD=8时径向基函数神经网络训练过程, 当SPREAD=1时, 径向基函数神经网络诊断准确率为93.75%;当SPREAD=2时, 径向基函数神经网络诊断准确率为95.83%;当SPREAD=8时, 径向基函数神经网络诊断准确率为97.91%。
4 结论
本文将径向基函数神经网络用于电机轴承的故障诊断, 采用径向基函数神经网络对电机轴承在滚动体故障、内圈故障、外圈故障以及无故障状态给予识别。试验结果表明, 系统不仅能够检测到轴承故障的存在, 而且能够更高效、准确地进行电机轴承的故障模式识别, 能够更好的应用于电机轴承的故障诊断中。
参考文献
[1]梅宏斌.滚动轴承振动监测与诊断——理论·方法·系统[M].北京:机械工业出版社, 1996.
[2]Simon Haykin.Neural Networks:A Comprehensive Foundation (Second Edition) [M].Prentice Hall, 1999.
[3]Ham F M, Kostanie I, Priciples of Neuro Computing for Science&Engineering[M].McGraw Hill, 2001.
模糊径向基函数 篇4
目前, 常用的区域物流需求的预测方法有:时间序列方法 (移动平滑法、指数平滑法、随机时间序列方法) 、相关 (回归) 分析法、以及灰色预测方法等[1,2,3,4]。这些方法多采用物流需求量本身的历史数据来进行预测, 所建立的模型不能全面、科学和本质地反映所预测对象的内在结构和复杂特性。神经网络具有的高度非线性函数映射能力, 它有着传统建模方法所不具备的很多优点, 因此近年来部分学者采用BP神经网络来对物流需求进行预测[5,6]。但BP网络在用于函数逼近时, 存在收敛速度慢和局部极小等缺点, 在解决样本量少且噪声较多的问题时效果并不理想。此外, 这些模型只考虑了经济因素对物流需求的影响, 并未综合考虑其他相关因素的作用, 如宏观经济政策、物流服务水平、消费水平、价格水平、人口数量等, 预测结果难以令人满意。
笔者认为, 区域物流需求是一种典型的派生需求, 其大小及其变化归根结底是由区域内各种社会、经济、政策、资源等多种因素及其相互关系决定的。因此, 对物流需求进行预测研究, 应综合考虑这些因素的作用。基于此, 本文较全面地分析了影响区域物流需求的多种因素, 然后采用径向基函数神经网络构建了一个基于多种因素的区域物流需求量预测模型, 以求实现少样本条件下区域物流需求的准确预测。
一、区域物流需求的多因素分析
区域物流需求的多因素数学模型可表示为:
Y=f (X) (1)
式中, Y= (y1, y2, …, ym) T为区域物流需求量向量, 它包含m个分量, 表示m个物流需求量指标;X= (x1, x2, …, xn) T表示影响区域物流需求的因素向量, 它包含n个分量, 这n个分量主要包括在经济、社会、科技和环境等方面:
(一) GDP与产业结构
物流活动贯穿于整个经济活动的生产、流通、消费过程之中, 是经济活动的重要组成部分, 因而物流需求与经济发展有着密切的相关性, 即经济发展是影响物流需求的主要因素。在未来的一段时间里, 我国的产业结构将实现较快升级, 呈现“软化”趋势, 以知识密集型为主的第三产业比重在产业结构中会不断提高。第三产业比重的快速增长将会带动批发零售贸易和交通运输仓储业等流通业的发展, 为物流发展提供了良好的产业基础。因此, 未来的产业结构变化必然会影响物流需求。经济发展快, 将对物流需求起刺激作用, 经济发展慢, 将对物流需求起抑制作用。
(二) 宏观经济政策和管理体制
宏观经济政策对物流需求有重大影响。国家和地区经济政策的倾向性, 会强烈地影响区域经济的发展速度, 进而影响其物流需求。国家宏观经济政策的支持, 会使该区域经济发展加快, 物流需求也会相应增加;反之亦然。
管理体制也会对物流需求产生刺激或抑制作用, 这一点在我国表现得很明显。目前, 我国的铁路、公路和水路交通的基础设施由不同的部门投资经营, 管理体制各不相同。不同的体制, 必会使投资于铁路、公路和水路的资金力度不一, 进而将直接影响它们的建设及技术改造程度, 刺激或抑制着区域的物流需求。
(三) 市场环境
市场环境变化将影响物流需求, 这包括国际、国内贸易方式的改变和生产企业、流通企业的经营理念的变化及经营方式的改变等。物流服务于生产和市场销售, 物流的具体对象更离不开企业和社会所需要的各种物质资料, 因而市场环境的改变将影响物流的物质流向、服务方式、服务数量和质量等。
(四) 消费水平
消费水平直接影响着企业经营决策和生产、销售行为, 进而影响物流的规模、流动方向和作用对象, 使得物流需求随着消费水平而变化。消费水平提高, 就会产生新的消费需求, 促使企业生产和销售新产品来满足这种需求, 这样就会增加对物流的需求;反之, 消费水平下降, 会抑制对物流的需求。
(五) 技术进步
技术进步, 特别是信息技术的发展, 提升了物流服务的质量和范围, 从而对物流需求的量、质和服务范围均产生重大影响。正是由于现代技术的发展, 才使中国在国际分工中世界加工中心的地位得到加强, 从而使中国在国际上的原料输入和产品输出规模急剧扩大, 进而增大不同区域的物流需求。
(六) 物流服务水平
物流服务水平也将刺激或抑制物流需求。例如货物及时准确的配送情况、货损率的高低、缺货的多少等, 都将影响需求主体对物流服务的需求变化。当物流服务水平提高时, 将刺激物流需求;服务水平降低时, 抑制物流需求。
(七) 价格水平
价格的变动将影响物流供给和商品流通, 从而影响物流需求的变化。价格提高会抑制物流需求;价格降低, 会刺激物流需求。
(八) 人口数量
人口越多, 消费需求便越多, 因而带来的人们对物流的需求量也就会增大, 反之亦然。
二、RBF网络及算法
径向基函数 (Radial Basis Function, RBF) 神经网络是由Broomhead和Lowe于20世纪80年代末提出的新的神经网络方法, 在逼近能力、泛化能力和学习速度等方面均优于BP神经网络。此外, RBF网络所需的训练样本量较少, 训练结果唯一, 特别适合于本文样本数据少的特点。
RBF网络是一种3层前向网络:首先用径向基函数作为隐含层节点的“基”构成隐含层空间, 对输入向量进行一次变换, 将低维的模式输入数据映射到高维空间内, 然后通过对隐含层节点输出数据的加权求和得到输出, 即通过线性函数将隐含层节点输出数据映射到输出层节点空间[7]。这就是RBF网络的基本思想。
径向基函数就是某种沿径向对称的标量函数, 通常定义为空间任一点Xt到某一中心di之间欧式距离的单调函数。径向基神经网络中常用的径向基函数是高斯函数:
undefined
因此, 从输入层节点空间到输出层节点空间的映射函数关系可以表示为:
undefined
式 (3) 中, ‖g‖为欧式范数;i=1, 2, …, M, M表示隐含层的节点数;Xt= (xt1, xt2, …, xtn) T, Xt∈Rn, t=1, 2, …, N, 是训练样本集合中第t个输入样本, N为样本总数;di∈Rn, i=1, 2, …, M, 是RBF网络隐含层节点的中心;wik为隐含层到输出层的连接权值;m为输出层的节点。
RBF网络的学习过程分为两个阶段。第一阶段, 提取典型训练样本, 结合使用递推K-均值聚类算法和递推最小二乘法来确定隐含层节点中心、RBF的宽度、隐含层节点个数以及隐含层到输出层连接权值;第二阶段, 在确定好隐含层的参数后, 根据样本校正隐含层和输出层的参数, 以进一步提高网络的精度。
三、区域物流需求预测模型构建
(一) 区域物流需求量指标选取
反应物流需求量的指标较多, 主要包括不同环节、不同功能的具体物流作业量, 如货运量、库存量、装卸搬运量、流通加工量、配送量等。但到目前为止, 我国只有货物运输量和货物周转量统计数据, 其他物流业的相关指标均没有公开的统计资料, 也没有权威的统计方法和基础数据, 故在建模时只选取了区域的货物运输量和货物周转量作为物流需求量指标, 即区域物流需求量向量Y只包含2个分量:y1货物运输量 (万吨) 、y2货物周转量 (亿吨公里) 。
(二) 影响区域物流需求的多因素指标选取
鉴于统计数据可获得性的限制, 以及2节中对区域物流需求的多因素分析结果, 本文选取如下的指标来构成因素向量X的分量, 并分别记为:
x1区域国内生产总值 (亿元) 、x2区域人均国内生产总值 (元/人) 、x3区域第一产业产值 (亿元) 、x4区域第二产业产值 (亿元) 、x5区域第三产业产值 (亿元) 、x6区域全社会固定资产投资 (亿元) 、x7区域进出口总额 (万美元) 、x8区域社会消费品零售总额 (亿元) 、x9区域居民人均消费水平 (元/人) 、x10科技经费支出总额 (万元) 、x11区域物流行业就业人数 (万人) 、x12商品零售价格总指数、x13区域总人口数。这些指标中, 区域国内生产总值、区域人均国内生产总值、第一产业产值、第二产业产值、第三产业产值不仅反应了区域经济总量, 而且反应了产业结构对物流需求量的影响;区域全社会固定资产投资体现区域宏观经济政策的实施情况;区域进出口总额、区域社会消费品零售总额体现了区域商品市场的规模和环境变化;区域居民人均消费水平反应了区域的消费水平;科技经费支出总额则从侧面反应了区域科技水平的进步;由于服务业劳动者人数的多少直接决定着服务产品的总量, 进而决定着服务的质量, 因此采用区域物流行业就业人数来反应物流服务业的服务水平;商品零售价格总指数则体现了区域的价格水平变化;区域总人口数反应不同时期区域人口数量的大小。
(三) RBF网络设计
本文中, RBF网络的输入维数为13, 等于因素向量X的分量个数;输出层神经元个数为2, 等于要预测的物流需求量向量Y的分量个数。隐含层基函数选取的是高斯函数, 隐含层到输出层采用纯线性函数。
在实际预测中, 采用上一年的因素向量X的分量指标数据, 对应下一年的区域物流需求量向量Y的分量指标数据来构成训练样本对, 对神经网络进行训练。为取得较好的预测效果, 在训练网络之前需将原始数据作预处理, 本文采用将所有输入、输出训练数据都转换到[0, 1]区间的归一化处理。网络训练完毕后, 将验证数据也作归一化处理后, 输入到训练完成的网络, 就可得到网络的预测输出。
四、实例分析
(一) 样本数据的确定
由《四川省统计年鉴》, 得到四川省1996-2006年共11年的相应指标数据, 如表1所示。
说明:表中x12商品零售价格总指数是以1995年为基期指数 (=100) 计算而得。
由于是采用上一年的因素指标数据来预测下一年的区域物流需求量, 因此由表1中的数据, 可得到10对样本。将前8对数据作为训练样本集, 后2对数据作为测试样本集, 即采用前8对数据训练得到的网络, 来预测2005-2006年的区域物流需求量, 并和实际值进行比较, 以检验预测效果。
(一) 结果分析
预测模型的样本拟合值及相对误差如表2所示, 货物运输量和货物周转量的最大相对误差绝对值均为0, 实现了精确拟合;其样本的预测值及相对误差如表3所示, 货物运输量的最大相对误差绝对值为4.9216%, 相对误差绝对平均值为2.634%;货物周转量最大相对误差绝对值为2.8777%, 相对误差绝对平均值为2.3887%。
根据上面的拟合和预测结果, 可以看到模型具有高度的拟合能力, 并且外推样本的预测值和实际值也十分接近, 所有相对误差的绝对值均小于5%, 结果令人满意。这表明该模型在少样本的条件下, 仍有较高的预测精度和良好的泛化能力, 可用于区域物流需求的预测。
五、结束语
本文在对影响区域物流需求的多种因素进行充分分析的基础上, 利用径向基函数网络具有的高度非线性映射功能, 构建了基于多因素的区域物流需求神经网络预测模型, 在少样本条件下实现较高精度的预测。为进一步提高预测精度, 还需要使用更多的样本数据来进行训练, 此外如何去除原始数据噪声对网络预测精度的影响等问题还有待进一步研究。
参考文献
[1]Bahram A, Arjun C, Kambiz R.The demand forUS air transport service:a chaos and nonlinearityinvestigation[J].Transportation Research Part E37, 2001:337-353.
[2]Fite J, Taylor G, Usher J, Roberts J.Forecastingfreight demand using economic indices[J].nterna-tional Journal of Physical Distribution&LogisticsManagement, 2001, 31 (4) :299.
[3]赖一飞, 郑清秀, 章少强, 纪昌明.灰色预测模型在水运货运量预测中的应用[J].武汉水利电力大学学报, 2000, 33 (1) :96-99.
[4]陈森, 周峰.基于灰色系统理论的物流需求预测模型[J].统计与决策, 2006 (3) :59-60.
[5]后锐, 张毕西.基于MLP神经网络的区域物流需求预测方法及其应用[J].系统工程理论与实践, 2005 (12) :43-47.
[6]贾星辰, 王铁宁, 裴帅.基于BP神经网络的物流需求量预测模型研究[J].物流科技, 2006 (4) :3-5.
模糊径向基函数 篇5
轻轨交通系统是一种现代化水平高、主要面向旅客运输的中等客运量城市公交系统,而锚固螺杆是连接轨道梁和墩台的关键受力部件,若其出现松动、断裂等现象,将严重威胁轻轨列车的运行安全。因此对轻轨在役锚固螺杆进行健康监测具有重要意义[1]。利用结构的动态响应识别结构损伤是近年发展起来的结构损伤诊断新方法,其中模态参数是决定结构动力特性的主要参数,而单位脉冲响应函数的提取是振动信号模态分析理论的重要组成部分,许多算法(如SSI、ERA、ITD等)都是以单位脉冲响应函数为基础进行模态参数提取[2,3]。目前国内外对振动信号单位脉冲响应函数的提取方法有:基于FFT的功率谱法,直接求得频响函数;基于Duhamal积分的时域法, 直接获得系统的单位脉冲响应函数;小波变换法, 试图克服FFT功率谱法要求输入信号的频率成分丰富、只适用于稳态信号、存在能量泄露等固有的缺陷[4,5]来提取单位脉冲响应函数。而在实际应用中,常见的方法是NExt法、随机减量法等, 但很多时候受环境影响信号中会夹杂着很多非线性噪声,这就使得NExt法、随机减量法等方法的应用受到一定限制,同时给识别精度带来影响。
文献[5]的径向基网络设计中先对网络输入层的输入样本矩阵采用LU变换,学习层的权值矩阵运用规则化最小二乘法来提取单位脉冲响应函数。本文在文献[5]的基础上提出对径向基网络学习层的权值矩阵用稀疏优化求解算法取代规则化最小二乘法。由于该权值矩阵不一定稀疏, 本文先用二维DCT基对学习权值矩阵进行稀疏表示;其次通过 稀疏优化 的正交匹 配追踪 (orthogonal matching pursuit,OMP)算法来求解尽可能稀疏的网络权值矩阵,再通过稀疏反变换求解实际的学习权重;最后将单位激励脉冲信号输入此系统提取单位脉冲响应函数。
1稀疏径向基网络
RBF径向基神经网络[6]是一种性能优良的前馈型神经网络,它结构简单,只有一个隐层,具有全局的非线性逼近能力,可以以任意精度逼近任意的非线性函数,学习速度快,应用较为广泛。 但是,对于非线性系统的建模,该神经网络的预测结果误差较大,而且抗噪性能较差。
1.1经典径向基及其权重学习
径向基函数神经网络首先要选择K个基函数,各基函数 形式为φi(u-ci),i=1,2,…,K; j=1,2,…,N。由于距离是径向同性的,因此称为径向基函数。‖u-ci‖2表示差向量的模(即欧氏范数)。 径向基神 经网络的 结构如图1所示。图中,u和Y分别为径向基网络的输入信号和输出信号,T为径向基网络的教师信号。径向基网络由三层即输入层、隐含层和输出层组成,其中输入层仅仅起到传输信号的作用,隐含层节点一般由高斯核函数作为径向基函数,输出层节点通常是简单的线性函数。
基函数采用高斯函数[6]时,可表示为
式中,ci为高斯函数的中心;σ 为高斯函数的方差。
设计隐含层单元数为K,且K< N,先从样本中随机选取K个样本作为隐含层中心,隐含层的作用就是将低维空间的输入映射到一个高维空间。由输出层和隐含层的线性关系:
即
满足
记
则上述方程组可以改写成如下形式:
令φ表示元素为φij的K ×N阶矩阵,W和Y分别表示权值向量和期望输出向量,上式可以写成:
显然φ是个对称矩阵,且与u的维度无关,当φ可逆时,可求得权值矩阵W,有:
当输入的隐层神经元个数大于 输入样本 维数,且样本数目很大时,计算的权值矩阵会很大, 容易产生病态问题,权值矩阵W的求解就不能用求逆W =Yφ-1,而用最小二乘法[7.8]求权值W:
另一种规则化最小二乘法的基本思想是通过加入一个含有解的先验知识的约束来控制映射函数的光滑性,使得相似的输入对应相似的输出,寻找逼近函数Y(u)通过最小 化以下目 标函数来 实现:
式(7)中,第一项是均方误差,寻找最优的逼近函数,使均方误差最小,dj为Yj(u)的实际值,第二项用来控制逼近函数光滑程度,即为规则化项,λ 是规则化参数,D是一个线性微分算子,代表了对Y(u)的先验知识,于是式(7)的解为
则权向量为
径向基网络学习算法中用经典最小二乘法和规则化二 乘法求解 网络权值W时存在以 下问题[8]:1在训练数据中存在较大噪声时,神经网络将拟合一个错误的曲面,从而使网络的泛化能力下降;2当输入样本数目过大时,权值矩阵成员值之间差距会很大,从而产生病态问题,可能就会导致求解不稳定。
为了提高网络的泛化能力,使得在有噪声的情况下也能较准确的提取脉冲函数,本文下面提出利用稀疏优化的OMP算法来获得稳定的网络权值W。
1.2径向基网络权重的稀疏求解算法
Donoho[9]指出,在某个基上具有稀疏描述信号的少量线性投影包含了重构和处理该信号的足够信息,也就是仅仅利用信号稀疏的先验和少量全局的线性测量就可以获得精确的重建。 因此, 对权系数W矩阵的重建过程可以看做是输出信号在径向基函数网络φ上的稀疏分解过程[10]。 OMP算法[11?13]就是通过递归对已选择原子集合进行正交化以保证迭代的最优性,从而减少达到收敛的迭代次数。
径向基神经网络学习算法需要求解的参数有3个:基函数中心、方差和隐含 层到输出 层的权值。学习过程分为2个阶段:一是自组织学习阶段,此阶段为无导师学习过程,求解隐含层基函数的中心和方差;二是有导师学习阶段,这一阶段就是求隐含层到输出层之间的权值,本文利用稀疏优化的OMP算法求解权值矩阵W的最稀疏解, 其步骤如下:
(1)为了与OMP算法[11]相对应,把式(4)先进行转置φTWT=YT,由于权值矩阵W不一定是稀疏的,需要先对其进行稀疏表示。 令S表示权值W的稀疏解,选择二维的离散余弦基(DCT基) 进行稀疏表示,式(10)中的D1、D2T就是两个不同维度的DCT基,得到:
S就是W在二维DCT变换下的投影系数,由于一般矩阵在二维DCT变换下系数值集中在低频,一般来说S是稀疏[12]的。 由此把问题从求解一般非稀疏的W变换成求解稀疏的S。
(2)权值矩阵 和输出的 关系就变 为φT× D1T×S=YT×D2T,记A=φT×D1T,B=YT×D2T, 所以有式(11)对应OMP算法:
(3)构造随机观测矩阵G,对A和B随机采样,得到Ar=G×A,Br=G×B,式(11)表示为
(4)令初始余量R0=Br,迭代次数ks=1,索引值集合Λ0=Ø;
(5)计算相关系数,找到满足下述最优化问题的指标λks:
(6)扩充指标集和矩阵,即令 Λks=Λks-1∪ {λks},Arks←[Arks-1Arks],Ar0为空矩阵;
(7)解决如下最小乘问题:
(8)更新残差值:
(9)ks←ks+1,若ks< m1(其中m1为稀疏度),则返回步骤(5);
(10)恢复信号S中的非零值指标为Λm1中的元素,第λj个元素的值等于Sks的第j个元素。
(11)得到稀疏值S后,利用稀疏反变换WT= D1T×S×D2,求得原权值矩阵WT,再转置即为W。
2基于稀疏径向基网络的单位脉冲响应函数提取算法
振动系统在单位脉冲激励信号作用下的自由响应称为单位脉冲响应函数,简称脉冲响应。 在一个因果时不变线性系统中,系统的输出y(t) 表示为脉冲响应函数h(t)与输入的卷积,写成积分形式为
简化整理为
其中,H为系统的单位脉冲响应信号系数矩阵,u为输入信号组成的系数矩阵,Y为该因果时不变系统的响应信号矩阵。
从上式可以知道,用最小二乘法可以求脉冲响应信号H,当系统的输入信号存在较多的零值如脉冲信号等,求逆容易出现奇异矩阵,因此使用求伪逆的方法,但在噪声大的情况下,会使得最终提取的脉冲响应信号不可用。因此本文选择更加稳定可靠的算法来提取单位脉冲响应函数,构建稀疏径向基神经网络的输入输出方案,以及单位脉冲激励方案来提取脉冲响应信号。
已知输入信号矩阵u=[u1u2…uN],输出信号矩阵为Y=[y1y2…yN],N代表样本输入信号数,每条样本信号的维数为m,第一条样本输入信号u1=[u11u12…u1 m],假设该径向基网络的输入信号矩阵u为N条轻轨锚固螺杆的采集信号,而输出信号Y是该输入信号矩阵u与理想单位脉冲信号h的卷积并加入白噪声得到的。
本文设计的稀疏 径向基神 经网络结 构有3层[13?14],输入层、隐层和输出层,输入的N条采集的信号矩阵u作为该径向基网络的输入,由理想的单位脉冲信号h和式(15)得到N条输出信号, 将该输出信号加入信噪比RSN=5dB的白噪声Y作为该径向基网络的最终输出,即用这两个大量的信号矩阵对网络进行训练学习,其中用OMP算法得到隐层的权值矩阵W。这个网络就是一个已经训练好的神经网络,等同于一个物理系统。
训练完成后,采用单位脉冲激励方案,即取一条单位脉冲信号σ(t)输入到该训练好的网络中, 那么该网络的输出就是系统对应的单位脉冲响应函数h(t)。具体过程如下:
(1)将采集的N条轻轨锚固螺杆的输入信号矩阵u输入到该网络中,由理想的单位脉冲信号h据下式可得到N条输出信号矩阵Y′:
(2)将得到的输出信号矩阵Y′ 添加RSN=5 dB的白噪声后的Y作为网络的目的输出,输入信号矩阵u作为网络的输入,对该径向基网络进行训练学习,由最终输出为隐层节点输出的线性组合,已知输出信号矩阵Y和隐层输出的高斯函数 φ,用稀疏优化的OMP算法可求得隐层的权值W:
(3)再取一条单位脉冲信号作为该网络的输入,那么最终网络的输出就是系统对应的理想的单位脉冲响应函数h(t),即:
本文稀疏径向基网络提取单位脉冲响应函数的算法流程图和OMP算法流程图如图2所示。
3仿真与测试
3.1仿真理想脉冲响应函数时域分析
在MATLAB环境下进行仿真计算,每条信号的采样点数为1024,采样频率为8kHz,假设式 (17)为仿真的理想单位脉冲信号h也就是教师信号:
式(17)是双模态时不变因果线性系统。 本文采用传感器采集到的轻轨锚固螺杆的激励信号作为输入信号uk,N为训练网络的样本数为72,径向基函数的隐层点数K =30。
由式(15)可以精确的计算系统的输出响应信号,然后把不同强度噪声信号与系统的激励信号和响应信号叠加,以输入信号矩阵和求解的加噪声的输出信号矩阵对径向基神经网 络进行训练,理想的脉冲信号为教师信号,隐层径向基函数采用高斯径向基φ(u-ci)=exp(-λ‖u-ci‖2), 其中λ=1×10-5。
图3a和图3b是输入信号uk和该输入信号与仿真单位脉冲响应函数卷积的响应信号Yk,图3c是仿真的双模态理想单位脉冲响应信号h,图3d和图3e分别是本文算法获得的单位脉冲响应函数和经典径向基网络学习算法中的规则化最小二乘法提取的单位脉冲响应函数图形。本文仿真的脉冲响应信号h是双模态的,轻轨锚固螺杆的脉冲响应函数是显著双模态的,因此选用双模态信号[15]进行模拟仿真具有实际意义。
通过多次实验,结果显示径向基网络学习算法中的经典最小二乘法出现了很大的误差,提取不到单位脉冲响应函数。这是由于经典最小二乘法在求逆过程中出现了奇异矩阵,导致误差变大, 所以在提取脉冲响应函数时经典最小二乘法不可行。通过图3d和图3e对比分析,利用提取到的单位脉冲响应函数与仿真理想信号的差值的均方根来计算误差,稀疏优化算法的误差是0.0290, 而规则化最小二乘法的误差为0.0301,程序的运行时间是28.4283s。根据以上仿真验证稀疏优化的径向基网络提取单位脉冲响应函数算法是可行的,其中经典最小二乘法和规则化最小二乘法是经典径向基网络学习算法中的两种不同方法。
3.2仿真理想脉冲响应函数频域分析
在MATLAB环境下分别用本文提出的稀疏径向基网络算法获得的单位脉冲响应函数的频谱及规则化最小二乘法获得的单位脉冲响应函数的频谱如图4所示,采样频率是8kHz。图4a是仿真的理想脉冲响应函数实际频谱图,图4b是稀疏优化算法提取脉冲响应函数的频谱图,图4c是规则化最小二乘法提取脉冲响应函数的频谱图。经过10次仿真实验,规则化最小二乘法才能提取出如图4c所示的脉冲响应函数的两个显著模态频率,而稀疏优化算法更容易获得理想脉冲响应函数的两个显著模态,再次证明稀疏优化算法的优越性。
4轻轨在役锚固螺杆的脉冲响应信号
本文研究对象是在役轻轨锚固螺杆[16],因此选取一根长975mm,直径为36mm的不锈钢双头螺杆。锚固螺杆暴露在锚箱外的一端有一个用于在安装时定位的长度为25mm的扁方,在锚箱内的另一端则焊接了一个用于固定的球面螺母。 通过传感器采集得到振动信号,分别采样获得一条激励信号uk和振动响应信号yk,其中采样频率为8kHz,每个信号的采样点数为1024,径向基函数神经网络的隐层节点数K=30,其锚固螺杆采集图如图5所示。
图6是由传感器采集获得的一组实际激励信号uk和相应的振动响应信号yk,信号采样点数为1024。先将采集获得的多组激励信号和振动响应信号加噪后输入到网络进行训练,即可以获得脉冲响应函数。随后利用本文算法和规则化最小二乘法对单位脉冲信号进行测试,将单位激励脉冲信号输入到此训练好的网络中,得到网络输出即为轻轨锚固螺杆的单位脉冲响应函数。图7是稀疏径向基网络获得的轻轨锚固螺杆脉冲响应函数与经典径向基网络的规则化最小二乘法获得的轻轨锚固螺杆脉冲响应函数的时域图和频谱图。
从图7a和图7c的时域图对比可得,稀疏优化算法和规则化最小二乘法都能提取轻轨锚固螺杆的单位脉冲响应函数,且准确性较高。根据已知的锚固螺杆 结构设计 的物理参 数,其在1000 Hz、1300Hz、1500Hz和1800Hz附近都存在真实模态,具体的模态主频跟实际的锚固螺杆结构参数有关,并非确切的整数值。从理论值分析,稀疏优化算法得到的主频值更加精确,其它几个模态峰的结果也反映出稀疏优化算法得到的主频值更加接近理论值。从频谱图的对比可得,稀疏优化算法 能获得轻 轨锚固螺 杆的脉冲 响应函数1000Hz、1300Hz、1500Hz、1800Hz等多个显著模态;而规则化最小二乘法较难提取轻轨锚固螺杆的模态,经过8次实验才得到如图7d所示的频谱,且在1000Hz和1800Hz的模态峰值微弱,很不明显,容易造成频率泄漏。稀疏算法能提取频谱图中1000Hz处的模态峰,而规则化最小二乘法对1000Hz处的模态峰无法提取,会导致后期的模态参数识别有很大误差。因此,本文提出的稀疏径向基网络能更好提取锚固螺杆单位脉冲响应信号的显著模态,特别是较弱小的显著模态。
显著模态的提取直接影响单位脉冲响应函数中有效的模态参数的提取。对比发现,径向基函数神经网络的稀疏优化算法对提取实际信号的单位脉冲响应函数是可行的,并且效果较好;而使用经典最小二乘法提取轻轨锚固螺杆的脉冲响应函数时,由于求逆过程中奇异矩阵的出现,导致提取的脉冲响应函数误差极大,所以这一方法不可行。
损伤识别包含模态参数识别和损伤指标构造两个步骤,因此首先要获得结构的模态参数。获得锚固螺杆的单位脉冲响应函数后,利用随机子空间算法(SSI)提取其模态参数。将获得的模态参数输入到分类器中进行故障诊断。由于神经网络是非线性映射,所以在本文中,使用的训练样本都是通过真实锚固螺杆在有故障和无故障的情况下通过实验采集振动信号而来的,保证实验的可靠性。
5结论
综上所述,基于稀疏径向基网络RBF的单位脉冲响应函数提取算法具有可行性。相较于经典径向基函数神经网络学习算法的传统最小二乘和规则化最小二乘法,稀疏优化的OMP算法能够较好的提取单位脉冲响应函数,准确的获得脉冲响应函数的显著模态参数,而不用考虑最小二乘法中的奇异矩阵问题,可以应用于实际信号的脉冲响应函数提取。
摘要:轻轨锚固螺杆是轻轨交通中连接轨道梁和墩台的关键受力部件,脉冲响应函数的提取是其健康监测的关键和核心技术。引入稀疏优化算法取代经典径向基网络的最小二乘法,构建网络的输入输出方案,引入二维DCT基对学习权值矩阵进行稀疏表示并通过正交匹配追踪算法来获得尽可能稀疏的网络训练权值。将单位脉冲激励信号输入该网络即可获得系统的单位脉冲响应函数。实验结果表明,所构建的稀疏径向基网络能准确提取单位脉冲响应函数,对工程应用具有参考价值。
模糊径向基函数 篇6
径向基函数神经网络是一种三层前馈式局部逼近网络,具有较强的非线性逼近能力,现已广泛用于函数逼近、模式识别以及非线性时间预测等领域[1]。传统的径向基函数的神经网络所采用的基函数大多是径向对称的,而在对称的径向基函数中最常用的是采用高斯基函数,而高斯径向基函数神经网络需要确定4个参数,即RBF网络的中心值、基宽值、隐层神经元个数( 中心个数) 以及隐层同输出层间神经元的所有连接权值[2]。而这4个参数的确定一直是RBF神经网络难以解决的问题,至今没有系统的规律可参照。许多学者为确定RBF网络4个参数采用了基于智能计算的优化方法,但均因设计参数太多而导致计算量大,所建立的RBF网络模型的精度也不高[3]。此外,也有许多学者采用其他的径向对称基函数,如二次基、逆多元二次基和三次函数基等,但这些基函数均是径向对称的,这些基函数( 包括高斯基) 对任意的输入变量x ,均有基函数的值大于零,且当输入信息远离中心时,径向对称基函数的值已相当小,可作为零对待,这样,只有当基函数大于某一数值( 例如0. 05)时才对相应的权值进行修改,这在一定程度上失去了局部调整网络节点连接权值的优点,同时因高斯函数不具备紧密性的缺点[4]。基于此,本文构建一种非径向对称基函数神经网络,该网络所确定的参数少,为提高网络模型的精度,采用混沌优化方法以求出不同训练样本调整权值后网络的最优输出,也就是降低了网络实际输出同期望输出的误差,并利用模型输出的误差变化率增加新的隐层节点。本文给出了基于Ulam-von Neumann混沌映射的非径向对称基函数神经网络模型构建的具体算法,并采用基于Mackey-Glass时滞微分方程的混沌时间序列预测问题以验证该模型的精度,从文献对比中得出,本文所构建的网络模型具有模型所需的隐层节点数少、模型预测精度高等优点。
1 非径向对称基函数的神经网络结构
非径向对称基神经网络结构也是由3层组成,即输入层、隐层和输出层。输入层节点仅是传递输入数据x1,x2,…,xn到隐层节点,且输入层神经元个数对应着输入变量的维数; 隐层神经元是将输入层传入的非线性空间信息转化为高维线性空间可分信息,从而完成输入信息的近似、分类或预测。考虑到提高网络精度和减少隐层基函数参数的设置,此处网络基函数采用多变量正态密度函数,其函数形式如式( 1) 所示。隐层到输出层节点由简单的线性函数构成,其具体结构如图1所示。
式中,K = E[( x - ci)T( x - ci) ]-1是输入协方差阵的逆。这时的基函数已不再是径向对称的。x是n维输入向量; ci是第i个基函数的唯一参数,与x具有相同维数的向量; p是隐层神经元的个数。
从图1可以看出,输入层实现从x→Ri( x) 的非线性映射,输出层实现从Ri( x) 到yk的线性映射,即:
式中,wik是隐层第i个节点到输出层第k个节点的连接权; m是输出节点数。
2 基于 Ulam-von Neumann 混沌映射的非径向对称基函数神经网络参数的确定
2. 1 Ulam-von Neumann 混沌映射
混沌是非线性系统所独有且广泛存在的一种非周期运行形式,它具有随机性、遍历性、规律性,并对初值具有敏感性。因其在一定范围内不重复地遍历空间内所有点,故常把这一特性用在复杂的非线性优化中,以寻找一定空间内的全局最优解。具体操作为,将设计问题的优化变量通过某一混沌映射规则映射到混沌变量空间的取值区间内,然后利用混沌变量的遍历性和规律性进行寻优搜索,最后将获得的混沌优化空间内的最优解再线性转化到具体设计问题的空间中。在产生混沌变量的多种映射规则中,使用传统的Logistic混沌映射规则最多,但因Logistic映射空间在[0,1]区间内具有0. 25、0. 5和0. 75三个间断点,因此在作混沌映射优化时应跳过这3个间断点[5]。也有文献采用遍历性较好的Lozi’s映射以及Henon映射,但这两种映射存在映射点均匀性较差,故本文将采用遍历性及均匀性较好的Ulam-von Neumann映射规则产生混沌变量,即:
式中,α为生长率控制参数,当α = 2时形成[- 1,1]区间的满映射,即系统处于混沌状态。其混沌变量cxi( 表示为Ulam-vonNeumann映射的第i个混沌变量) 的一种演变算式为[6]:
cx(t)i为cxi在第t步混沌演变后的值,当cxi∈[- 1,1]时将产生混沌现象,cxi在[- 1,1]区间内遍历。式( 1) 的变量xi∈ [ai,bi]可由式( 5) 及式( 6) 与混沌变量cxi∈[- 1,1]进行正映射和逆映射。
式中,x'i为经混沌映射后转化为常规优化变量而获得的值。
2. 2 非径向对称基函数神经网络参数的确定
基于图1的分析可知,非径向对称基函数神经网络的参数包括: 隐层神经元个数、非径向对称基函数的参数ci以及隐层同输出层间的所有连接权wij。
对隐层神经元个数的确定采用的策略为: 先初始设置一个较少隐层节点个数的非径向对称基函数神经网络,并初始化该较小规模的神经网络,然后采用基于混沌映射的方式训练该神经网络,在训练过程中,当网络的混沌最优输出同网络的期望输出间的差值变化率连续N次小于某一事先设计的常数值δ时,则表示该网络的权值wij以及参数ci的调整处于停滞不前,此时现有的网络结构无法满足设计的要求,则增加一新的神经元节点。
对于非径向对称基函数的参数ci以及连接权wij的调整策略为: 假设因ci以及wij作微小变化,即,则:
同时,第i个隐层神经元的非径向对称基函数参数ci的变化Δci能被具有零均值和偏差σci的高斯分布所定义,而第i个隐层神经元同第j个输出层神经元的连接权wij的变化Δwj也能被具有零均值和偏差σwj的高斯分布所定义[7]。
由于这种参数 的变化而 使整个神 经网络的 输出产生 变化( Δyj)2,即:
3 基于 Ulam-von Neumann 混沌映射的非径向对称基函数的神经网格构建方法
由上述对Ulam-von Neumann混沌映射的介绍,以及对非径向对称基函数神经网络隐层节点的自适应增加策略、对隐层中心参数ci以及连接权wij调整策略的介绍,给出基于Ulam-von Neumann混沌映射的非径向对称基函数神经网格构建方法的具体算法步骤。
步骤1设i = 1 ,n = 1 ,i和n分别代表隐层节点个数和第n个训练样本。并设置一个较小隐层神经元节点数的3层非径向对称基函数神经网络结构,并初始化非径向对称基函数参数ci以及相关连接权值wij,同时完成对数据样本的归一化处理过程。
步骤2提取并训练第n个样本,在对该训练样本训练前依据式( 2) 求网络各个节点输出值yj,为提高网络输出值的精确性,采用如下基于Ulam-von Neumann混沌映射的优化方法。
1将xi的每个分量通过式( 5) 的变换,映射为Ulam-vonNeumann的混沌变量cxi。
2 Ulam-von Neumann的混沌变量cxi的各分量经式( 4) 作混沌操作。
3将Ulam-von Neumann的cxi每个分量通过式( 6) 变换,映射为 { ai,bi}ni = 1间的普通变量x'i,并依据式( 2) 计算非径向对称基函数神经网络的输出yi。
步骤3计算:
式中,为训练样本的第i个输出神经元的期望输出值。
步骤4判断E < ε,ε为一事先设置的较小常数值,如果条件成立,转步骤5,否则重新训练该网络,以求出新的输出值yi,即转步骤2,执行相关的混沌优化操作。
步骤5判断ΔE < δ ,δ为事先设置的较小常数值,如果条件成立,转步骤7; 否则转步骤6。
步骤6训练下一个数据样本,即n = n + 1,转步骤2。
步骤7判断ΔE < δ的次数是否达到一事先定的常数N次,N为一事先设置的正常数值,如果条件成立,则转步骤8,否则转步骤10。
步骤8增加一新的隐层节点。
步骤9初始化该增加的新节点,转步骤2。
步骤10输出该稳定的非径向对称基函数神经网络结构参数值。
4 数值试验
为了验证本文所构建的基于混沌映射的非径向对称基函数的神经网络精度,采用一个通用的非线性系统模型的标准测试问题,即对基于Mackey-Glass时滞微分方程的混沌时间序列预测,而Mackey-Glass时滞微分方程为:
式中,τ为时滞参数,当τ≥17时式( 14) 具有混沌性[8]。对Mackey-Glass混沌时间序列进行预测是指根据t时刻以前的一组数据[x( t - lΔt) ,x( t - ( l - 1) Δt) ,…,x( t - 2Δt) ,x( t - Δt) ,x( t) ]去预测x( t + Δt) ,Δt为预测时间步长。
为了实验方便,设a = 0. 2,b = 0. 1,c = 10,τ = 17,初始值x( 0) = 1. 2,并选取l = 3,Δt = 6,采用四阶龙格—库塔法生成1000组样本数据,即产生序列[x( t - 18) ,x( t - 12) ,x( t - 6) ,x( t) ,x( t + 6) ,…],此时,取t = 19,20,…,1018共获得1000个数据样本,其中系列的前4个数据作为输入,第5个数据作为输出,依此类推。并用前500对数据样本作为训练样本,以此训练获得非径向对称基函数神经网络模型,用后500对数据样本测试所构建模型的有效性。
为了表明本文算法的稳定性和普适性,同时也方便与其他方法进行比较,分别采用本文方法、高斯径向基神经网络构建设计预测模型方法[8]以及文献[9]中采用混合进化算法的RBF神经网络时间序列预测方法作对比,从每种方法所需隐层节点数、训练样本时的均方误差以及测试样本的均方误差作对比,其中均方误差依据式( 15) 计算,采用Intel( R) Core( TM) i3 - 2120,3. 30GHz CPU,并在Matlab7. 0编程环境下进行实验,且实验时的基本参数设置为ε = 0. 05,δ = 0. 001,N = 5。每种方法在实验时,以独立运行20次的平均统计结果为最终实验结果,具体实验结果如表1所示。
式中,分别为预测的真实值、模型预测值和平均值。
从表1中对比数据可看出,采用基于混沌映射的非径向对称基函数神经网络模型在对该问题进行时间序列预测时,所需的隐层节点数远少于其他两种方法,而且在训练样本以及测试样本的均方误差均小于其他两种方法。但该方法在训练网络时所需时间比采用高斯径向基函数神经网络要长许多,主要是因为在训练网络过程中要寻找最优的网络输出值时,需要将设计问题的常规变量映射到混沌空间内,并依据混沌的遍历性优化,故训练网络时花费更多的时间。图2给出了采用本文方法以及高斯径向基函数神经网络方法在构建该问题模型时训练所需时间以及训练样本的均方误差曲线对比图。可以看出,采用基于混沌映射的非径向对称基函数方法在构建时间序列预测时所需的训练时间少,且训练样本的均方误差值也比另一种方法小一个数量级。
5 结 语
在分析了传统径向对称基函数所具有的缺点以及非径向对称基函数所具有的优点基础上,设计了非径向对称基函数神经网络结构。采用遍历性及均匀性较好的Ulam-von Neumann混沌映射方法优化获得不同训练样本在不同网络参数环境下的网络输出的最优值,以降低网络输出值与期望值的误差,同时采用训练样本的输出值同期望值的变化率以自适应地增加隐层节点数。这种非径向对称基函数神经网络结构参数设置少,故能提高计算效率以及提高模型的预测精度,这种方法设计的网络模型也可在复杂非线性函数逼近方面有所应用。
摘要:为提高神经网络模型的预测精度,构建了非径向对称基函数神经网络模型结构。为确定非径向对称基函数神经网络模型参数,采用Ulam-von Neumann映射规则确定混沌变量,利用混沌变量的遍历性获得不同网络结构参数下的最优网络输出,以减少所构建网络模型的实际输出与期望输出的差值,并利用模型输出的误差变化率以决定是否增加新的隐层节点。给出基于混沌映射的非径向对称基函数的网络模型构建步骤。采用基于Mackey-Glass时滞微分方程的混沌时间序列预测问题验证该模型的预测精度,并同其他文献对该序列预测的精度以及所需隐层节点数作对比。比较结果表明,采用该设计模型具有对时间序列预测精度高且所需网络结构规模小等优点。
关键词:Ulam-von Neumann映射,非径向对称基函数,径向基函数神经网络
参考文献
[1]Orisini P,Power H,Lees M,el al.A control volume radial basis function techniques for the numerical simulation of saturated flows in semi-confined aquifer[J].Transport in Porous Media,2009,79(2):171-196.
[2]Li Jianyu,Luo Siwei,Qi Yingjian,et al.Numerical solution of elliptic partial differential equation using radial basis function neural networks[J].Neural Networks,2003(16):729-734.
[3]娄燕强,宋如顺,马永彩.基于RBF神经网络的攻防博弈模型[J].计算机应用与软件,2011,28(1):99-101.
[4]李旭东,张振跃.非对称径向基函数与稳定边界图像变形算法[J].计算机辅助设计与图形学学报,2004,16(6):747-752.
[5]刘道华,原思聪,兰洋.混沌映射的粒子群优化方法[J].西安电子科技大学学报,2010,37(4):764-769.
[6]刘起方,马光文,王和康,等.基于分形与混沌理论的嵌套搜索算法在梯级水电厂节能调度运行中的应用[J].四川大学学报,2008,40(3):27-32.
[7]Shi D,Yeung D S,Gao J.Sensitivity analysis applied to the construction of radial basis function networks[J].Neural Networks,2005(18):951-957.
[8]唐艳,王洪博,王万新.基于高斯径向基函数神经网络的十字路口车流量预测[J].农业装备与车辆工程,2006(3):41-43.
模糊径向基函数 篇7
关键词:GPS,高程异常,多面函数,RBF,二次曲面,PSO
0 引言
凭借全天候、高精度等优点,全球定位系统(GPS)技术已被广泛地应用于大型控制网的建立中。目前GPS所建立的控制网平面精度可达到亚毫米级甚至更高,然而GPS的高程信息在实际工程中至今未能充分利用。究其原因是GPS高程和工程所需的正常高不属于同一个高程系统,GPS高程是基于WGS-84参考椭球的大地高,而正常高是基于似大地水准面的高程。并且正常高主要是通过水准仪所建立的水平视线进行高差观测获取,这也就意味着正常高与重力铅垂线有关系,而GPS三维坐标主要与测站和卫星之间的几何关系相关[2]。因此,近些年来国内外学者提出了各种将GPS大地高转换至正常高的方法,如地球重力场模型[3~6],数值拟合[7,8]和机器算法[9~11],并最终试图将GPS测高代替传统的水准测量。由于重力场模型的推算需要大量的重力数据,而且计算过程比较复杂,故重力法在通常情况下难于普及。另外,机器算法如神经网络需要设置大量参数(如隐含层数,结点个数以及权重等),而且最常用的BP学习算法还存在局部最优等缺点[12]。近些年来,多面函数以其模型的多样化和灵活性在地磁场建模[13]、地壳形变监测[14]等领域被广泛应用,但用于GPS高程转换则并不理想,原因主要受限于核函数及其参数的选取。不少文献[7,8]已证实了在平坦地区利用二次曲面和样条函数进行GPS水准拟合可达到厘米级精度,而多面函数用于GPS水准拟合的效果又将如何?因此,本文提出利用粒子群算法(PSO)对径向基核函数进行优选,然后探讨经优化的多面函数模型在GPS水准拟合中的应用,并将最终结果与二次曲面拟合进行对比分析。
1 大地高和正常高系统
如图1所示,GPS高程是地面某一点到参考椭球(如WGS-84椭球)的铅垂距离,即大地高HGPS,而实际工程中常采用的高程数据是地面某点到似大地水准面得铅垂距离,即正常高Hnor,两者相差了一个高程异常ε[1]:
根据大地高和正常高的关系,我们可以将GPS高程转换大地高,其原理主要是利用测区中一定数量且分布均匀的公共点(同时包含GPS大地高和水准正常高的水准点),进而按(1)式计算公共点的高程异常,并利用一定的数学法则(条件允许还可结合重力资料)构造某种曲面来逼近似大地水准面,然后推算出测区中未进行水准联测的GPS点(未测点)的高程异常,最终反算未测点的正常高。
2 多面函数拟合模型
多面函数[15]是美国的Hardy于1971年首次提出的,其基本思想是任何数学表面和任何不规则的圆滑表面,总可以用一系列有规则的数学表面总和以任意的精度逼近。
设某点(x,y)处的高程异常ξ的表达式为:
式中ki为待定系数;xi,yi为选定的中心点,n为中心点的个数;Q(x,y,xi,yi)为x,y的核函数,核函数可以根据实际情况而定,本文主要采用径向基核函数
其中λ为核参数。
当公共点的个数大于中心点的个数时,可采用最小二乘法求解待定系数,即:
当多面函数的待定系数求得后,可按式(2)推算待定点的高程异常。
3 PSO优化核参数
PSO[16]是由Eberhart和Kennedy提出的一种模拟鸟群捕食行为的进化算法,该方法不需进行大量参数的调整,而主要通过粒子追随自己搜寻最优解和整个粒子群的最优解来进行优化。本文将利用PSO对径向基核函数的参数进行优选,其主要步骤如下。
(1)初始化粒子群。对粒子进行随机定位(编码)方案,并将每个粒子的二进制表达转化为核参数及所选择的特征子集。
(2)进行多面函数拟合。根据粒子适应度(均方根误差RMSE),确定粒子个体最优pbest和全局最优gbest[17]。
(3)更新粒子的速度
其中:vk是粒子当前速度,rand()为均匀分布在(0,1)区间的随机数,Ti为最大迭代次数,c1,c2分别为加速因子,wmax为初始惯性权重,wmin为最后惯性权重,t为当前迭代次数,w为惯性权重[18],以避免最大速度设置不当引起的算法搜索最优解的能力。
(4)更新粒子的位置,即:
其中:xk是粒子当前位置。
(5)反复迭代步骤(2)~(4),直至达到最大迭代次数。
4 实例分析
4.1 试验数据
本文采用文献[19]中的GPS控制网数据进行建模分析。测区范围约300km2,且地势比较平缓。该控制网共有44个控制点,其空间分布如图2所示,其中控制点间的高差最大为0.5062m。
4.2 计算分析
在高程异常拟合之间先进行核参数的优化。在实际计算过程中,核参数的范围设为[1-108],粒子的规模设为10,加速因子c1和c2均设为2,wmax设为0.8,wmin设为0.2,最大迭代次数设为200,并作为算法终止条件。在优选步骤第(2)步中,笔者选取12个共同点(图2中“ο”注记)进行多面函数的系数求解,然后外加8个点(图2中“Δ”注记)进行适应度的计算,并优选核参数,其历史全局最优适应度轨迹见图3。考虑PSO算法的结果具有一定随机性,因此笔者进行多次运算,最终确定λ为23114000。
确定核函数后,再次运用多面函数对所有的高程异常进行拟合,其结果与二次曲面拟合模型进行了对比,结果见图4。另外,笔者采用内符合精度指标μ1和外符合精度指标μ2[8]对高程转换的精度进行了评定,其结果见表1。
5 结论