GRNN

2024-10-06

GRNN(精选6篇)

GRNN 篇1

摘要:采用广义回归神经网络 (GRNN) 对影响货运量的因素进行分析和处理, 对网络进行训练和拟合, 用实际数据进行模型检验。在计算过程中, 光滑因子Spread对预测效果起着重要作用, Spread值越小, 网络对样本的逼近性也就越强;Spread值越大, 网络对样本数据的逼近过程也就越平滑, 但误差也相应增大。为更好的选取最佳Spread值, 文中采用GRNN参数来优化参数, 以期达到更高的预测精度。

关键词:广义回归神经网络,光滑因子,果蝇优化算法

1. 引言

运输系统作为社会经济系统中的一个子系统, 在受外界影响和作用的同时, 对经济系统具有一定的反作用, 使得运输需求同时受到来自运输系统内外两方面因素的共同影响。作为运输基础设施建设投资决策的基础, 运输需求预测在国家和区域经济发展规划中具有十分重要的作用。在此情况下, 将神经网络引入到货运量预测中, 其中广义回归神经网络在逼近能力、分类能力和学习速度方面具有较强的优势网络。

由于GRNN[1]的积函数是径向对称的, 通常假定训练样本都是呈高斯分布的, 需要确定的光滑因子参数, 但是参数值越大, 往往产生的误差也大。为了克服上述缺点, 采用一种新的优化参数方法:果蝇优化算法。其基本思想是基于果蝇觅食行为推演出寻求全局优化, 在此需要确定果蝇寻优的行进轨迹, 根据其轨迹, 确定参数值。如何进行参数优化是FOA中一个关键问题。为此, 先用广义回归神经网络求出目标值及参数最优值, 对其参数进果蝇算法优化, 得到最优参数值, 预测未来货运总量。

2. 货运量预测方法

2.1 货运量指标选取

货物运输和地方经济及企业发展的紧密联系, 货运需求成为货运需求和经济发展关系研究中的一个重要问题。因此作为反映货物需求的一项重要指标, 货运量预测研究和分析具有较强的实际和理论意义。影响货运量的预测的因素很多, 如规划区域内国内生产总值、人口、货运车辆数等等[2], 因此货运量的指标选取变得很重要。

2.2 货运量预测方法

常用的货运量预测方法包括时间序列分析、移动平滑法、指数平滑法、随机时间序列分析方法以及灰色预测方法和多种方法综合组合的预测方法等。这些方法大都集中在对其因果关系回归模型和时间序列模型的分析上, 所建立的模型不能全面、科学和本质的反映所测动态数据的内在结构和复杂特性, 丢失了信息量。而GRNN在逼近能力、分类能力、和学习速度方面具有较强的优势网络, 并且在数据缺乏时效果也比较好。在求出GRNN参数值时, 采用果蝇优化算法进行参数优化, 文中结合潘文超果蝇最佳化演算算法, 建构货运量预测模型, 并与一般广义回归模型进行比较, 检视二者分类侦查能力的差异。

3. 基本原理与算法分析

3.1 广义回归神经网络基本结构与算法

广义回归神经网络[3] (Generalized Regression Neural Network, 简称GRNN) 是美国学者Donald F.Specht在1991年提出的, 它是径向基函数网络的一种。GRNN在结构上与RBF网络较为相似, 由四层构成, 如图1所示。

3.2 果蝇优化算法

果蝇优化算法的步骤为[4]:

(1) 随机初始果蝇群体位置;

(2) 计算果蝇个体利用嗅觉搜寻食物之随机方向与距离;

(3) 由于无法得到食物的位置, 因此先估计与原点距离 (Dist) , 再计算味道浓度判定值 (S) , 此值为距离之倒数;

(4) 味道浓度判定值 (S) 代入味道判定函数以求出该该果蝇个体位置的味道浓度 (smell) ;

(5) 找出果蝇群体的味道浓度最高的果蝇 (求极大值) ;

3.3 基于果蝇优化算法优化广义回归神经网络参数

对于GRNN预测模型, 根据公式:

光滑因子Spread值越小, 网络对样本的逼近性越强;Spread值越大, 网络对样本的逼近程度越平滑, 但误差也相应增大。在实际应用中为了选取最佳的Spread的值, 需要不断尝试来确定最佳值。为解决此问题, 本文采用一种新的群体智能算法--果蝇优化算法, 此算法是仿真果蝇利用其嗅觉觅食的行为, 然后根据味道浓度值迭代搜寻, 来完成问题的寻优, 具有寻优能力强等优点。采用果蝇算法来寻找光滑因子Spread的最优参数值, 进而设计出果蝇算法优化GRNN的神经网络模型。步骤如下:

(1) 读取数据并分两组交叉训练, 避免网络训练过度。

(2) 初始果蝇群体位置, 利用嗅觉寻找食物, 然后初始果蝇个体飞行距离。

(3) 先求出味道浓度判定函数, 利用该函数求出味道浓度。

(4) 果蝇迭代寻优。

(5) 根据味道浓度寻找极值, 迭代保留最佳位置与味道浓度, 每代最优值记录到数组中。

(6) 利用果蝇算法确定的最优值, 来进行货运量预测。

4、仿真实验

通过对全国货运量影响因素的分析, 分别取国内生产总值 (GDP) (亿元) 、工业总产值 (亿元) 、铁路运输线路长度 (万km) 、复线里程比重 (%) 、公路运输线路长度 (万km) 、等级公路比重 (%) 、铁路货车数量 (万t) 和民用载货汽车数量 (万t) 8项指标因素作为网络输入, 货运总量作为网络输出。采用1996-2008年中前12年的历史统计数据作为网络训练样本 (数据来自于中国统计年鉴) , 以08年的数据作为预测数据, 建立GRNN神经网络对货运量进行预测。

根据GRNN参数选择spread最优值为0.5, 此时的货运总量可以达到快速收敛。通过计算GRNN的输入和输出存在很大的相关性, 说明GRNN模型对于货运量的预测的可行性。此外, 预测出2008年的货运总量为308490, 误差值为9959。根据GRNN的预测公式, 可以发现光滑因子不同, 网络对样本的逼近能力不同, 光滑因子越大, 逼近过程也就越接近所有样本的因变量的均值, 但是误差却在增大, 需要反复调整Spread值来寻找, 在此采用果蝇算法来优化参数。

设定果蝇的初始位置为 (0, 0) , 迭代的果蝇寻食物的随机飞行方向与距离区间为[-10, 10], 种群规模为10, 迭代次数为100.经由果蝇优化算法的100次迭代动态调整GRNN的收敛情形。可以发现当光滑因子为0.31, 收敛速度最快, 而此时的相对应的预测值为311223, 误差值为7226, 与GRNN相比, 预测值更为精确。

5. 结束语

在分析货运量影响因素和预测特点的基础上, 本文采用了广义回归神经网络对货运量进行预测, 经过对预测效果的检验与分析, 证明了GRNN用于货运预测的可行性和有效性。但是, 在确定最佳光滑因子时, 需要循环训练, 在预测数据方面会造成很大的误差, 针对此问题, 提出了一种新的智能算法, 即果蝇优化算法, 其类似与蚁群优化算法、鱼群优化算法, 该研究都是将演化重心转移到动物的觅食行为与群体行为上, 它们必须通过迭代搜寻才能寻到最优解, 因此亦属于演化式计算领域。本文通过果蝇算法优化参数, 从而得到最优光滑因子, 而且其预测精度得到提高。然而, 果蝇优化算法属于新式算法, 其中的优点缺点还需要学者们进一步研究, 使其在各个领域得到推广。

参考文献

[1]黄金杰, 夏静, 满春涛.王松涛.一种参数优化旋转广义回归神经网络模型[J].电机与控制学报, 2009, 13 (3) :03-06.

[2]赵闯, 刘凯, 李电生.基于广义回归神经网络的货运量预测[J].铁道学报, 2004, 26 (1) :12-15.

[3]刘敬贤, 刘振东, 周峰.基于广义回归神经网络的船舶交通流预测模型[J].中国航海, 2011, 34 (2) :74-78.

[4]Pan WT.A new Fruit Fly Optimization Algorithm:Tak-ing the financial distress model as an example[J].Knowl-edge-Based Systems, 2011, 26:69–74.

GRNN 篇2

电力系统状态估计是保证电力系统安全经济运行和实现电网调度的重要依据。状态估计也称滤波,它是利用实时量测系统的冗余度来提高数据精度,自动排除随机干扰所引起的错误信息,估计或预报系统的运行状态。预测结果的准确与否对电力系统的安全、可靠和经济运行影响较大。

人工神经网络(ANN)作为一门新兴的交叉学科,为处理某个时间断面上的高维空间(网络)问题提供了新的途径。目前使用的ANN多数为多层前向网络,这主要是因为前向神经网络具有很好的函数逼近能力,通过对训练样本的学习,能反应出对象的输入、输出间复杂的非线性关系。但ANN在电力系统的实际运用中又存在着学习收敛速度慢等缺点,从而影响了其进一步的应用。而广义回归神经网络(General Regression Neural Network)是一种局部逼近网络,网络最后收敛于样本量集聚最多的优化回归面,只要学习样本确立,则相应的网络结构和神经元之间的连接权值也随之确定,网络训练过程实际上是确定光滑因子的过程,人为调节的参数少,网络稳健,计算速度快。为此,提出应用GRNN,即运用递推更新的样本数据训练网络构成动态GRNN网络,进行电力系统状态估计。

1 广义回归神经网络

1.1 GRNN网络的结构

GRNN结构如图1所示。它包含4层神经元,分别是输入层、模式层、求和层与输出层。输入层有m个结点,接收输入矢量x并前传给模式层;模式层有p个单元,模式层的神经元数目等于学习样本数目n,各神经员对应不同样本,其神经元i的传递函数为

式中X为网络输入变量;Xi为神经元i对应的学习样本;σ为平滑参数。

求和层包括2种神经元,其中1种神经元对所有模式层神经元的输出进行算术求和,模式层各神经元与该神经元的连接权值为1,其它神经元对所有模式层神经元的输出进行加权求和。输出层有1个单元,执行除法运算。

1.2 GRNN网络原理

设自变量为x,因变量为y,定义x、y的联合概率密度为f(x,y),条件概率密度为

则得到x的条件平均值y(也称为y在x上的回归)为

联合概率密度函数满足高斯分布,表达式为

式中xi和yi分别为训练集内的输入和输出;σ为宽度函数,σ满足下列趋势,表达式为

undefined

将式(5)代入式(3),整理后得

理论上可以证明,当样本容量趋于无穷大时(n→∞),GRNN能以任意高的精度拟合任何复杂的连续函数。对于多因变量的问题,假设每个因变量均与自变量满足高斯分布,则每个因变量均可用式(6)计算出来。

1.3 宽度σ的选取

若确定了GRNN的学习样本,则相应的网络结构和各神经元之间的连接权值也随之确定,网络的训练实际上只是确定平滑参数σ的过程。与传统的误差反向传统算法不同,GRNN的学习算法在训练过程中不调整神经元之间的连接权值,而是改变平滑参数,从而调整模式层中各单元的传递函数,以获得最佳的回归估计结果。若平滑参数较大,则概率密度函数的估计比较平滑,为多元Gauss函数。当平滑参数σ→∞时,估计值为所有样本观测值的均值;若平滑参数较小,则概率密度函数的估计为非Gauss型;当平滑参数α→0时,估计值为与输入变量X之间欧几里徳(Euclid)距离最近的样本观测值;对于适中的平滑参数,所有样本观测值均计算在内。其中,与X之间Euclid距离较近的样本观测值的权重因子较大。

为了得到理想回归估计结果,提出了平滑参数的确定方法:选择平滑参数以增量△σ在一定范围[σmin,σmax]内递增变化,除去1、2个样本,用剩余的样本构造GRNN并对该样本进行估计,得到估计值与样本值之间的误差,对每个样本重复该过程,得到误差序列,将误差最小对应的σ用于最后的GRNN。

2 训练样本的选取

应用GRNN进行状态估计时,处理输入样本数据对网络的学习训练有着至关重要的影响,即影响神经网络的学习速度、网络结构的复杂性和网络的输出状态量的精度。在样本数据已知的情况下,若输入神经元的数目过大,则供网络训练的子学习样本太少;反之,若输入神经元的数目过小,则子学习样本太多。由于网络的输出结果是子学习样本对应的样本观测值的加权平均,因此输入神经元数目对GRNN的估计性能存在影响。

确定输入神经元数目到目前还没有确切的理论依据。参考自回归(AR)模型阶次的选择方法,根据自回归模型阶次的选择经验,初步确定输入神经元数目为

undefined

仔细对m值附近进行搜索,对每个m值确定散布参数后,计算网络对学习样本的误差,当满足精度要求时,搜索即可以停止。状态估计流程图如图2所示。

3 GRNN网络的状态估计算例

根据上述的方法,应用Matlab对东北某地区电网进行状态估计研究。针对不同的运行状况,选择12套样本,该样本为系统12个时间的不同实际潮流状态。在训练样本的确定上主要考虑了以下2个原则:

a.能够真实反映系统的实际运行状态,以基准、高峰及低谷不同的负荷状态为依据。

b.数据样本能够体现系统的特殊运行状态,如线路的开断检修、故障切除等。

按照上述原则,对实际采集到的数据进行分析整理,最后确定了12个输入量、7套训练样本,用其余的5套样本数据作为输入,确定最优散布参数为0.167,估计时间为4.324 s。仿真结果如表1所示。

从表1可以看出,状态估计是准确的,满足电力系统实际应用误差(5%)要求,证明了GRNN网络用于电力系统状态估计的可行性。GRNN网络具有训练简洁快速的特点,预测精度高,满足在线估计的实时性要求。

4 结论

应用广义回归神经网络(GRNN)进行电力系统状态估计,证明了该算法可行性及准确性,网络迅

速便捷,估计精度高。网络的训练过程实际上只是确定平滑参数σ的过程,人为调节的参数少,这个特点决定了网络以最大限度地避免人为主观假定对估计结果的影响,达到电力系统理想的估计效果。

摘要:阐述了应用递推更新的样本数据训练广义回归神经网络进行状态估计的方法,分析了广义回归神经网络(GRNN)的结构与基本算法,提出平滑参数的确定方法,并给出确定输入神经元数目的方法。仿真结果表明,该网络训练方便快捷,估计精度高,能够满足在线估计的实时性要求。

关键词:在线估计,广义回归神经网络,状态估计

参考文献

[1]吴耀华.基于GM-GRNN的电力系统长期负荷预测[J].继电器,2007,35(6):45-48.

[2]栾兆文,王庚.电力系统状态估计算法研究[J].电力系统及其自动化学报,1998(12):13-16.

[3]覃光华.人工神经网络技术及其应用[D].成都:四川大学,2003.

[4]贾德香,韩净.基于改进BP网络的电力系统超短期负荷预测[J].安徽电气工程职业技术学院学报.2008,13(3):71-73.

[5]刘耀年,李聪.应用动态泛回归神经网络的在线负荷预测[J].东北电力大学学报,2009,29(4):39-44.

[6]Roy Hoffman.Practical State Estimation for Electric DistributionNetworks[J].PSCE.2006.

GRNN 篇3

短时交通流预测是交通管理与控制系统运行的基础, 预测的实时性和可靠性直接影响到这类系统运行的效果。出于需要, 学术界在20世纪60-70年代开始把其他领域应用成熟的预测模型用到短时交通流预测领域。据文献报道至今已提出了近百种预测模型, 根据预测模型所用技术的差异, 可以将预测模型划分为计量模型、神经网络模型、非线性系统理论模型、动态交通分配及仿真模型等。由于交通系统是一个有人参与的、时变的、复杂的非线性大系统, 很难有一种模型在单独使用时能得到完全满意的预测结果, 各种预测模型均有其优缺点, 因此将多种方法进行融合, 取各方的优点来提高短时交通流预测精度已成为学术界越来越关注的一个研究方向。

卡尔曼滤波用于预测只有在预测系统的数学模型是确定的情况下才是最优的, 而系统数学模型的建立本身就是一件非常困难的事, 对交通流预测来说更是如此。神经网络已经被证明具有很强的非线性映射能力, 在历史数据充足的情况下, 通过训练, 神经网络可以模拟出任何一种非线性系统。本文从减轻构建精确数学模型压力、降低系统建模复杂度出发, 提出了一种基于广义回归神经网络 (GRNN) 技术并融合卡尔曼滤波的短时交通流预测方法, 并将这种方法运用到深圳市路网的短时交通流预测过程中。

文中实验数据来自深圳市2007年7月实际检测的交通流数据。数据来自3个检测点, 分别为10200205 (北环新洲) 、10100203 (北环皇岗) 和10200103 (泥岗红岭) 。实验分别运用单独GRNN方法和融合后的新方法进行预测, 并对比分析了预测结果。

1卡尔曼滤波预测方法

卡尔曼滤波采用由状态方程和观测方程组成的线性随机系统的状态空间模型来描述滤波器, 并利用状态方程的递推性, 按线性无偏最小均方误差估计准则, 采用一套递推算法对滤波器的状态变量作最佳估计, 从而求得滤掉噪声的有用信号的最佳估计。这种方法无须保存过去的历史数据, 只要新数据测得后, 结合前一个时刻已求得新的估计值, 这就特别适用于电子计算机上的计算。卡尔曼滤波在空间技术、工业过程控制与电子工程等领域得到了比较广泛的应用。

卡尔曼滤波有两步:预测步, 下一个系统的状态根据前面测量的结果进行预测;更新步, 当前的系统状态由当前的测量进行估计。预测步和更新步所对应的方程如下所示:

预测:

m-k=Ak-1mk-1 (1)

P-k=Ak-1Pk-1Aundefined+Qk-1 (2)

更新:

vk=yk-Hkm-k (3)

Sk=HkP-kHundefined+Rk (4)

Kk=P-kHTkSundefined (5)

mk=m-k+Kkvk (6)

Pk=P-k-KkSkKundefined (7)

undefined和undefined是各自预测的状态均值和状态协方差, 在时间步k得到测量结果前获得。mk和Pk是各自估计的状态均值和状态协方差, 在时间步k得到测量结果后获得。vk是时间步k的更新或者是测量的残余。Sk是时间步k的测量预测协方差。Kk是滤波增益, 它给出了在时间步k时预测结果要进行多大程度上的修正。

2基于GRNN并融合卡尔曼滤波实现预测

2.1神经网络在预测上的应用

近年来, 神经网络模型作为一种非线性模型被用来研究预测问题, 由于其自身的特性, 神经网络模型属于数据驱动的方法, 成功地应用于许多领域。

神经网络方法相对于传统方法具有如下优点:①神经网络能够在信息源不完整、不准确等复杂的数据环境下, 通过其自身结构的调整过程, 提取数据特性, 并对未来做出有效的预测;②神经网络模型是一种变结构模型, 具有自适应性、并行处理能力, 因此具有很强的数据处理能力, 同时可以通过网络对新样本的学习, 调整其内部的结构, 从而适应系统变量的变化;③神经网络模型具有较好的容错能力, 可实现对样本最大拟合;④可以实现对系统变量之间相关影响的分析, 识别系统变量不同发展时期的特征。

2.2广义回归神经网络预测模型 (GRNN)

GRNN是径向基函数 (RBF) 神经网络的一种, 它由3层构成:输入层只传递输入信号到隐层;隐层节点由类似高斯函数的辐射状作用函数构成;输出层节点通常是简单的线性函数。

广义回归神经网络是一种基于非线性回归理论的前馈式神经网络模型。它通过激活神经元来逼近函数, 网络结构见图1。GRNN由一个径向基网络层和一个线性网络层组成, ai1表示第一层输出a1的第i个元素, iW1表示第一层权值矩阵W1的第i行元素, 同时还表示训练样本的个数, b1为隐含层阈值。符号“⨂”表示‖dist‖的输出与阈值b1的元素与元素之间的乘积关系。隐含层的传递函数为径向基函数, 常用高斯函数作为网络的传递函数undefined, 作为网络的传递函数, 式中σi被称为光滑因子。

网络的第二层为线性输出层, 其权函数为规范化点积权函数, 传递函数为a2=purelin (n2) , 从而计算网络输出。

对于广义回归神经网络, 其初始化就是对训练样本的学习过程, 学习样本确定, 则相应的网络结构和各神经元之间的连接权值也随之确定, 网络的训练实际上只是确定光滑因子的过程。与传统的误差反向传输算法不同, 广义回归神经网络的学习算法在训练过程中无需调整神经元之间的连接权值, 而是改变光滑因子, 从而调整各单元的传递函数, 以获得最佳回归估计结果。

2.3GRNN和卡尔曼滤波融合预测模型

基于GRNN的系统辨识, 就是应用GRNN作为被辨识系统P的模型undefined、逆模型undefined (假定P是可逆的) , 也就是用GRNN来逼近实际系统或其逆。

根据传统的卡尔曼滤波的特点, 为解决系统建立精确数学模型的问题, 降低系统建模的复杂度, 本文利用GRNN优良的非线性映射能力, 提出一种基于GRNN并融合卡尔曼滤波的新预测方法。方法核心思想是将系统状态矩阵Ak用GRNN进行模型参数辨识, 采用确定性采样方法选取有限样本进行训练以获得所需精度的状态转移矩阵undefined, 从而可利用卡尔曼滤波进行处理。将GRNN和卡尔曼滤波相结合得到的新方法的信号模型见图2, 这里使用了误差ek来调整矩阵undefined, 调整步骤如下:①先给出学习集 (x (k-1) , x (k-2) , ……, x (k-t) , y (k) ) , 学习得到矩阵undefined不输出, 是GRNN的权重;②根据新的预测值yk和实测值xk的误差对GRNN进行系数调整, 形成undefined;③用undefined进行下一轮预测。

3模型应用

3.1融合模型实现短时交通流预测

实验数据来自深圳市2007年7月实际检测的交通流数据。数据来自3个检测点, 分别为10200205 (北环新洲) 、10100203 (北环皇岗) 和10200103 (泥岗红岭) , 其地理位置如图3所示。行驶方向为由东向西, 3个检测点的车道数均为4车道, 两个区段的间隔分别为3 770m和2 800m (见图3) 。实验的目的是要对北环皇岗 (检测点:10100203) 的短时交通流进行实时预测。

方法一:单独使用GRNN进行预测。

实验直接使用MATLAB工具箱提供的GRNN函数进行预测, 训练集的大小10*285个, 预测集的大小283。输入为6维数组, 输出为1维, 满足关系undefined是GRNN逼近的函数, 式中l表示当前路段, l-1表示上游路段, l+1表示下游路段, n表示当前时段, n-1, n-2表示当前时段前的两个检测时段。取光滑因子为0.1时, GRNN预测效果最好, 图4显示了运用GRNN实现短时交通流预测的结果。

方法二:使用融合模型进行预测。

采用GRNN对交通流预测系统辨识后, 则其卡尔曼滤波方程可以简单表示成如下形式:

undefined (8)

yk=Ikxk+vk (9)

其中, undefined由GRNN系统辨识而来, 和“方法一”一样, 训练在训练集10*285个基础上进行。由于系统噪声依然存在, 所以可以简单地把预测矩阵看成是单位阵Ik。系统动态噪声确定可以根据一定的上下游及之前时间段的实测数据和当前时间段实测数据分析后得到。观测噪声可以根据预测结果多次统计分析后得到, 如果GRNN系统辨识结果精度高, 观测噪声引起的误差是很小的。在得到 (8) 和 (9) 各参数基础上, 再运用卡尔曼滤波理论就可以实现融合后的短时交通流预测, 图5显示了最终的预测结果。

3.2对比评价

本文采用如下5个指标来评价实验结果, 5种方法的结果如表1所示。

(1) 最大绝对误差 (maximum absolute error : MAE)

undefined (10)

(2) 平均误差 (mean error : ME)

undefined (11)

(3) 平均相对误差 (mean relative error : MRE)

undefined (12)

(4) 平均绝对误差 (mean absolute error : MAE)

undefined (13)

(5) 平均相对绝对误差 (mean absolute relative error:MARE)

undefined (14)

实验结果可以看出, 基于GRNN并融合卡尔曼滤波的新方法在预测精度上要高于单独使用GRNN方法。 同时, 相对于经典卡尔曼滤波方法及其改进方法, 新方法又具有如下特点:①数学建模简单, 精度高, 实现容易。理论上已经证明了GRNN可以实现任意的非线性关系的映射, 这就意味着可以通过神经网络对系统进行有效辨识, 从而获得系统模型, 降低了建立数学模型的复杂度;②有效提高精度, 防止滤波发散。由于神经网络对动态过程具有良好的自适应性, 运用于卡尔曼滤波, 则能抑制滤波发散, 提高了预测精度;③运用GRNN进行模型辨识, 有效降低了神经网络训练的时间, 所需的训练样本也大为减少, 从而保证了模型预测的实时性。

5结语

交通问题的复杂性决定了短时交通流预测不是用哪一种预测模型就能完全解决, 多种方法的融合是提高预测精度的一种有效手段。本文提出了一种基于GRNN并融合卡尔曼滤波的短时交通流预测模型, 模型充分利用了神经网络良好的非线性映射的能力, 通过神经网络的训练得到卡尔曼滤波预测所需的参数, 从而解决了卡尔曼滤波预测的一个重要问题, 即无需构建预测对象系统的精确数学模型, 因为在很多情况下, 构建系统的数学模型并不是件简单的事。预测模型充分利用了GRNN和卡尔曼滤波两种模型的优点, 从实验及其分析可以看出这种融合模型可以有效提高卡尔曼滤波的适用范围, 预测精度相比传统方法有了进一步的提高, 且容易实现。

摘要:针对卡尔曼滤波应用需要构建精确数学模型的局限, 提出将广义回归神经网络与卡尔曼滤波相融合, 并将其用于短时交通流预测。这种融合后的新方法利用了GRNN良好的非线性映射能力, 能对实际系统进行系统辨识, 并获得符合预测要求的系统状态方程。深圳市实际流量数据的验证表明, 这种方法在简化系统数学建模的同时, 也能达到较高的预测精度, 从而证实了这种方法的可行性和有效性。

GRNN 篇4

关键词:超磁致伸缩材料,广义回归神经网络,BP神经网络,磁滞曲线拟合

0 引言

由于GMM具有输出力大、机电耦合系数大、能量密度高、响应速度快和应用频率宽等优点,使得在精密驱动技术中,GMM的应用非常广泛。但是,由于磁性材料的磁滞非线性,使得由GMM制成的超磁致伸缩执行器(GMA)的输入和输出存在着一定的滞后,给GMA的精确控制带来了一定困难。因此,怎样去拟合磁滞环已成为各国学者研究的热点。目前,国际上通用的磁滞模型主要有3种:一种是基于数学的唯像模型,典型代表为Preisach模型;一种是基于材料内部机理的物理模型,典型代表为J-A模型;还有一种是基于自由能和统计学分布理论的自由能磁滞模型。其中,运用preisach模型时,需要测出大量的一阶折返曲线,但是折返曲线的测量非常繁琐,对实验器材的精度要求也比较高,工作量庞大;运用J-A模型来反映GMM磁滞特性时,需要辨识和调整大量的物理参数;自由能磁滞模型兼顾了Preisach模型和J-A模型的部分优点,但是该模型的运算量很大,而且没有考虑涡流损失的影响[1]。除此之外,最近几年新兴起来的还有神经网络模型。神经网络模型中最常用的为误差逆向传播的前馈BP网络,理论证明,BP网络可以以任何给定的精度去拟合强非线性的连续函数或者映射关系,不过BP算法的误差曲面上存在高频分量,而且存在局部极小问题[2,3,4,5,6]。而径向基网络无论是在逼近能力、分类能力还是在学习速度等方面均优于BP网络。李贵存等[7]用混合径向基函数网络去拟合磁滞曲线,有效克服了BP神经网络和径向基函数神经网络在拟合磁滞回线各方面的缺点,效果比较理想。不过该方法程序复杂,而且径向基函数的扩展系数采用默认值,并不是最佳值。

在此,笔者提出一种基于径向基网络的变化形式—广义回归神经网络(GRNN)去拟合磁滞非线性,并对传统的GRNN神经网络进行优化,利用交叉验证方法训练神经网络,使得训练后的样本值能够更好地预测输出;同时,采用循环算法找出最佳的径向基函数的扩展系数,以构建最佳的GRNN网络,并与BP网络拟合进行对比分析。

1 GRNN神经网络非线性逼近

1.1 GRNN神经网络的理论基础

GRNN的理论基础主要是非线性回归,计算非独立输出变量Y相对于独立的输入变量X的非线性回归,主要是得出概率最大的y。设f(x,y)为随机变量x和随机变量y的联合概率密度函数,X为x的观测值,则条件均值为[8]:

式中:X—输入,Y—输出,Y∧—Y的预测输出。

如果给定样本数据,则根据Parzen非参数估计,就可以估算出密度函数f∧(X,y):

式中:n—样本容量;Xi,Yi—随机变量x和y的样本观测值;p—随机变量x的维数;σ—光滑因子。

如果用估算密度函数去代替f(X,y),代入式(2)中并交换积分次序,则上式变为:

样本Xi与X之间Euclid距离平方的指数即为相应的观测值Yi的权重因子,估计值Y∧(X)为所有的Yi的加权平均。当光滑因子σ比较大的时候,估计值Y∧(X)近似为所有样本值的均值;当σ趋向于0时,Y∧(X)近似为训练样本,这时,如果被预测点包含在训练样本中,则预测值会和样本中的值非常接近,如果被预测点不包含在训练样本中,则预测误差可能会比较大。只有当σ取值适中时,所有的训练样本才都被考虑进去。

当用GRNN网络拟合磁场强度和GMM应变曲线时,以磁场强度作为自变量,则GMM的应变ε关于磁场强度H的预测输出为:

利用该公式,根据输入磁场强度样本H,便能得到GMM应变ε的预期输出。

1.2 基于GRNN神经网络的磁滞曲线拟合

GRNN为3层神经网络,第2层为径向基隐层,输出层为一个特殊的线形层。其结构如图1所示。

其中:

式中:P—输入,W—权重,b1—阈值,R—输入向量元素的数目,Q—输入目标样本数目。

在GRNN神经网络中,阈值b1=0.832 6/SPREAD,第1层神经元的网络输入即为加权输入与相应阈值的乘积,然后通过式(5)计算就可以得到第1层神经元的网络输出。从上面计算阈值的公式中,可以看出径向基函数的扩展系数SPREAD值对网络的阈值有很大影响,而阈值对网络的性能又有很大影响。通常情况下GRNN网络中SPREAD值的选用原则为使得第1层输入向量与神经元权值向量之间的距离为0.5,该距离可以通过Mtalab中dist函数计算得到,默认值为1.0。不过1.0只是一个经验值,在该SPREAD值下,网络的预测误差未必最小。为了提高网络的预测精度,设置合理的SPREAD值是关键。同时,由于所取的训练数据较少,为了扩大样本容量,笔者采用交叉验证方法来训练GRNN神经网络,并用循环方法找出最佳的SPREAD值和输入、输出,在该条件下构建最佳GRNN神经网络。为了便于观察神经网络的预测效果,本研究将网络预测的曲线与J-A模型仿真曲线进行了对比。对比所用的J-A模型曲线来自于Calkins和Smith所建[9,10,11],该模型的工作条件为:偏置磁场为0 k A/m,频率为1 Hz,负载等效刚度系数Kl为5.67×105N/m。

由于神经网络只能逼近任意单值映射函数,而磁滞曲线是非线性多值映射关系,本研究中将磁滞曲线分为外加磁场强度增加阶段和磁场强度减小阶段两部分,分别用神经网络去逼近,再把两部分合在一起。为了便于分析BP网络和GRNN网络的拟合效果,笔者分别用BP网络和GRNN网络去拟合磁滞曲线。

实验方案设计如下:从Calkins实验曲线上磁场强度增加的那一部分随机的取得47组数据作为网络的训练数据,随机的取得46组数据作为网络的预测数据。从实验曲线上磁场强度减小的那一部分随机的取得47组数据作为训练数据,再随机地取47组数据作为预测数据。采用Matlab中crossvalind函数来交叉验证训练神经网络,SPREAD最佳值从0.1~2之间循环求解,可得最佳SPREAD值为0.1。

程序工作流程图如图2所示。

在此扩展系数下的网络预测如图3~图6所示。

从图3~6中可以看出,相对于J-A模型理论曲线来说,GRNN神经网络的预测输出曲线和实验的实际输出曲线还是比较接近的,磁场强度增加阶段的网络预测误差最大为-1.38×10-5,下降阶段的网络预测误差最大为-2.39×10-5,这个精度还是比较高的,在实际工程应用中,可以将GRNN神经网络的预测输出用作GMM的期望输出。

2 BP神经网络非线性逼近

2.1 BP网络算法理论基础

假设一个含有隐含层的3层BP神经网络,输入层节点为xi,隐层节点为yj,输出节点为zl,θ为阈值函数,f为输入和输出之间的传递函数,输入节点与隐层节点间的网络权值为wji,隐层节点与输出节点间的网络权值为vlj,输出节点的期望值为tl,则模型的计算公式为:

其中:

输出节点的输出为:

其中:

输出节点的误差为:

假设输入为磁场强度H,输出为GMM应变ε,则式(7)可变为:

其中:

式(11)变为:

2.2 BP神经网络磁滞曲线拟合

在该部分,笔者同样将磁滞曲线分为磁场强度增加阶段和磁场强度减小阶段两部分,网络所用训练数据、测试数据与1.2节相同,网络的隐含层节点个数为5,输出层节点个数为1,网络的输出如图7~图10所示。

从图7~10中可以看出,BP神经网络的预测输出和实验实际输出相比,还是存在一定误差的,磁场强度增加阶段的最大网络预测误差为-7.18×10-5,磁场强度减小阶段网络的最大预测误差为-5.83×10-5,预测精度比GRNN神经网络略差。不过和J-A模型仿真曲线相比,BP神经网络的预测输出还是更接近于实验曲线,因此,在精度要求不是非常高的场合,可以用BP神经网络的预测输出来代替GMM的期望输出。

3 GRNN和BP神经网络的对比分析

为了便于观察最佳扩展系数下的GRNN神经网络和BP神经网络的预测效果,本研究对GRNN和BP网络进行预测对比分析,结果如图11所示。

从图11中可以看出,总体上来讲GRNN神经网络和BP神经网络的预测效果还是令人满意的,和J-A模型理论曲线相比,两种网络的预测都更接近于试验曲线。不过在磁场强度比较大的部分,BP神经网络的预测还存在较大误差。

为了更好地区别BP神经网络和优化后的GRNN神经网络间的拟合能力,这里再给出另一张Calkins试验曲线的拟合图,如图12、图13所示。

从图12、图13中可以看出,优化后的GRNN神经网络的预测能力明显好于BP神经网络。

4 结束语

本研究用优化的广义回归神经网络GRNN和前馈神经网络BP分别对GMM的磁滞曲线进行了非线性拟合,并对两种拟合方法进行了对比,从对比中可以看出,两种网络的预测都取得了令人满意的效果。另外,采用循环算法求解SPREAD值的GRNN神经网络精度要略高些,不管是在加磁阶段,还是在退磁阶段,GRNN神经网络的预测误差都要低于BP神经网络,该研究可以为GMM的广泛应用提供很好的指导。

不过,GRNN神经网络的光滑性能(内退和外插能力)略差,因此,笔者将在未来的研究中,继续探索怎样更进一步优化和改进GRNN神经网络。

参考文献

[1]卢全国.基于GMM的微致动研究及应用[D].武汉:武汉理工大学计算机科学与技术学院,2007.

[2]董长虹.Matlab神经网络与应用[M].北京:国防工业出版社,2007.

[3]CINCOTTI S,MARCHESI M,SERRI A.A neural networkmodel of parametric non-linear hysteretic inductors[J].IEEE Transactions on Magnetics,1998,34(2):3040-3043.

[4]VECCHIO P D,SALVINI A.Neural network and fourrier descriptor macromodelin-g dynamic hysteresis[J].IEEE IEEE Transactions on Magnetics,2000,36(4):1246-1249.

[5]MINCHEV S V.Neural networks for modeling of dynamic systems with hysteresis[C]//First International IEEE Sympo sium"Inteligent Systems",2002:42-47.

[6]MAKAVEEV D,DUPRE L,DE W M,et al.Dynamic hyster esis modeling using feedforward neural network[C]//In 15th Solft Magnetic Confenence Abstract,Bilbao,2003:256-258.

[7]李贵存,刘万顺,宫德锋,等.用于磁化曲线拟合的高精度混合型径向基函数神经网络[J].电网技术,2001,25(12):18-21.

[8]史峰,王小川,郁磊,等.MTALAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.

[9]CALKINS F T,SMITH R C.Energy-based hysteresis mod el for magnetostrictive transducers[J].IEEE Transactions on Magnetics,2000,36(2):429-439.

[10]CLARK A E.Magnetostrictive Rare Earth-Fe 2 Compounds,in Ferromagnetic Materials[M].E.P.Wohlfarth,Norh-Hol land,Amsterdam,1980.

GRNN 篇5

关键词:月度负荷预测,广义回归神经网络,小波软阈值,去噪

0 引言

电力负荷预测是电力系统中一项重要的工作,是电力系统运行、控制和规划不可缺少的组成部分,特别是电力系统逐步过渡到商业化运行的情况下,电力负荷预测工作更为重要。在保证系统安全可靠运行、满足用户需求的前提下,电力企业必须更多地从经济效益方而考虑系统的规划、运行。而通过准确的负荷预测,可以避免资源的浪费,从而提高电力系统的经济效益。

负荷预测的核心是根据其历史变化规律,推断出负荷未来的发展。电力系统的月负荷,随着社会经济的发展,人民生活水平的提高,呈现不断增长的趋势;同时,由于各月的情况不同,月负荷每年重复出现循环变动,即以12个月为周期的季节性波动;电网月负荷同时具有增长性和季节波动性的二重趋势,因此使得负荷的变化呈现出复杂的非线性组合特征[1,2]。

基于此,本文提出的预测方法仅仅是考虑负荷数据本身,不考虑其影响因素,把负荷序列看作一个信号序列,应用小波去噪原理,将信号与噪声分离,然后把去噪后的数据分解为反映负荷增长趋势的纵向历史负荷和反映负荷波动趋势的横向历史负荷,最后将横向历史负荷和纵向历史负荷共同作为神经网络的输入神经元,同时反映波动趋势和增长趋势这两种不同的变化,预测未来月份的负荷数据。

1 小波阈值去噪理论简介

小波去噪的根本任务是在小波域将信号的小波变换与噪声的小波变换有效的分离。小波阈值收缩(Wave Shrink)的方法是由Donoho和Johnstone于1992年提出的,该方法在最小均方误差意义下可达到近似最优,并且可取得较好的视觉效果,因而能得到了深入的研究和广泛的应用[3]。

小波阈值收缩法去噪的主要理论依据是,小波变换特别是正交小波变换具有很强的去数据相关性,它能够使信号能量在小波域集中在一些大的小波系数中,而噪声的能量却分布于整个小波域内,因此,经小波分解后,信号的小波系数幅值要大于噪声的系数幅值,可以认为,幅值比较大的小波系数一般以信号为主,而幅值比较小的系数在很大程度上是噪声。于是,采用阈值的方法可以把信号系数保留,而使大部分噪声系数减少至零。

小波阈值收缩法去噪的具体处理过程为:将含噪信号在各尺度上进行小波分解,保留大尺度低分辨率下的全部小波系数;对于各尺度高分辨率下的小波系数,可以设定一个阈值,幅值低于该阈值的小波系数置为0,高于该阈值的小波系数或者完全保留,或者作相应的“收缩”(shrinkage)处理。最后将处理后获得的小波系数利用逆小波变换进行重构,恢复出有效的信号。

目前,人们提出了多种阈值的选取方法:Visu Shrink、Risk Shrink、Sure Shrink、Wave JSShrink等。最常用的是Visu Shrink,这种方法采用全局统一阈值其中σ是噪声信号的标准差(度量噪声的强弱),N是信号长度。去噪算法如下:

1)计算含噪信号的正交小波变换。对于长度为N的含噪信号X,不妨设N=2J,利用正交小波变换的快速算法获得低分辨率L(0≤L

2)对小波系数进行非线性阈值处理。为保持信号的整体形状不变,保留所有的低频系数{vL,k,k=1,L,2L}。取阈值对每个小波系数,采用软阈值方法进行处理:

即,将含噪信号的小波系数与所选定的阈值进行比较,大于阈值的点收缩为该点值与阈值的差值;小于阈值相反数的点收缩为该点与阈值的和;幅值小于等于阈值的点变为零。

3)进行逆小波变换。由所有低频尺度系数,以及经由阈值处理后的小波系数做逆小波变换进行重构,得到恢复的原始信号的估计值。

2 广义神经网络模型

GRNN网络是由The Lockheed Palo Alto研究实验室的Donald Specht提出的一种新型的神经网络,它建立在数理统计的基础上,能够根据样本数据逼近其中隐含的隐射关系,主要用于系统模型和预测。优点是学习速度快,网络最后收敛于样本量集聚最多的优化回归面,一旦学习样本确定,则相应的网络结构和神经元之间的连接权值也随之确定,网络训练过程实际上只是确定平滑参数的过程,并且在样本数据较稀少时,效果也很好,网络可以处理不稳定的数据。人为调节的参数少,只有一个阈值。网络的学习全部依赖数据样本。这个特点决定了网络得以最大限度地避免人为主观假定对预测结果的影响。GRNN用标准的统计学公式来计算在随机变量x的给定测量值X时,变量y的有条件平均值Y。在计算这个条件平均值是要用到相关可能性密度函数(pdf),在GRNN中,相关的pdf使用泊松估计,由训练矢量近似来得到[4,5]。

2.1 广义回归神经网络的算法理论

广义回归神经网络的理论基础是非线性回归分析。当给定矢量随机变量x的一个测量值X时,随机变量Y的条件平均为

在此f(X y)是y和x的相关可能性密度函数。在GRNN中,f(X y)用泊松来近似,其窗口为常对角斜方差矩阵。

式中:{(X(t),Y(t)),t=1,L,T}是一组输入输出值,并且

为x和X(t)之间的欧几里德距离,N是输入空间的维数,即在网络中的输入单元数。

σ是一个宽度函数,当泊松窗口的数量T变化大时,必须满足下列的趋势。

将pdf的估计方程(2)直接带入(1),改变积分求和顺序,可得到下面的条件平均估计。

若设变量z=y-Y(t),分子的积分项可化简为

分母中的积分项化简为

将式(5)、(式6)代入式(4),可得到

2.2 广义回归神经网络的结构

GRNN结构如图1所示,包括输入层,模式层,求和层与输出层四层神经元。对应网络输入X=[X1,X2,L,Xm]T,其输出为Y=[y 1,y2,L,y l]T。

输入层的神经元数目等于学习样本中输入层的维数m,各神经元是简单的分布单元,直接将输入变量传递给隐含层。

模式层的神经元数目等于学习样本的数目n,各神经元对应不同的样本,模式层中神经元i的传递函数为

其中:X为网络输入变量,Xi为神经元i对应的学习样本,σ为平滑参数,也就是说,神经元i的输出为输入变量X与其对应的样本Xi之间的Euclid距离平方的指数形式

求和层包括两种类型神经元,其中一种神经元对所有模式层神经元的输出进行算术求和,模式层各神经元与该神经元的连接权值为1,传递函数为

其它神经元对所有模式层神经元的输出进行加权求和,模式层中第i个神经元与求和层中第j个求和神经元之间的连接权值为第i个输出样本iY中的第j个元素yij,求和神经元的传递函数为

输出层中的神经元数目等于学习样本中输出向量的维数L,各神经元将求和层的输出相除,即

2.3 光滑因子的确定

对于广义回归神经网络,其初始化就是对训练样本的学习过程,学习样本确定,则相应的网络结构和各神经元之间的连接权值也随之确定,网络的训练实际上只是确定光滑因子的过程。与传统的误差反向传输算法不同,广义回归神经网络的学习算法在训练过程中无需调整神经元之间的连接权值,而是改变光滑因子,从而调整各单元的传递函数,以获得最佳回归估计结果。

由式(7)可以看出,光滑因子σ对网络的预测性能影响较大,令平滑参数以增量σ在一定范围[σmin,σmax]内递增变化;在学习样本中,除去一个样本,用剩余的样本构造广义回归神经网络对该样本进行估计,得到估计值与样本值之间的误差,对每一样本重复该过程,得到误差序列,将误差序列的均方值

作为网络性能的评价指标,将最小误差对应的平滑参数用于最后的广义回归神经网络。在确定平滑参数的过程中,初始值σmin太小,式(4)可能会出现除以0的情况,给出如下σmin的计算方法

其中:Dmin为学习样本中各输入样本之间Euclid距离的最小值,ε>0为计算机能够表达的最小正数。

平滑参数的确定过程隐含了网络性能的验证过程。因此,在网络的学习样本中不需要另外的验证数据。

3 研究算例

本文所取负荷数据是以月为单位的时间序列,负荷数据由陕西某供电局提供,资料取自1989年—2005年共17年(204个月)的历史负荷数。

3.1 原始数据分析

首先基于Matlab语言对1989—2004这连续192个月的负荷数据应用小波软阈值进行去噪处理,小波去噪前后数据曲线如图2,由图可以看出,软阈值法去噪不仅几乎完全可以抑制噪声,而且可很好地保留反映原始信号的特征尖峰点,因而具有较好的去噪效果[6]。

3.2 样本选择

通过分析月度负荷特性数据序列可知,随时间的推移,月度负荷和往年同一月的历史负荷相比具有明显的增长趋势;同时,月度负荷随季节变化与最近相邻几个月的历史负荷呈现出某种波动趋势。因此,考虑将横向历史负荷和纵向历史负荷共同作为广义神经网络的输入神经元,同时反映波动趋势和增长趋势这两种不同的变化[7]。

将待预测年某月的负荷数据用f(i,j)表示,其中i代表年,j代表月,j=1,…,12,i=4,…,16。未来一年各月负荷f(i,j)预测模型如下:

样本输入:f(i,j-1),f(i,j-2),f(i,j-3),f(i-1,j),f(i-1,j-1),f(i-1,j-2),f(i-2,j),f(i-2,j-1),

其中:

样本输出:f(i,j)

3.3 模型结构

其网络结构如图1。输入层为8个神经元,输出层为1个神经元,模式层为11个,求和层2个,网络结构为8-11-2-1[8]。根据反复实验确定最优平滑参数取为0.154 7。

3.4 预测结果

以1989年—2004年历史负荷数据为依据,采用了直接用GRNN和历史负荷数据经小波去噪两种方法,分别预测2005年12个月的负荷数据,预测结果见表1。从结果可以看出:如果不采用小波阈值去噪,而直接用GRNN神经网络预测,其相对误差较大,相对误差最大已超过6%,平均相对误差达4.755%,而用本文介绍的方法预测,相对误差最大不超过3%,平均相对误差为:2.236%,预测精度比较高。

4 结论

首先对负荷数据进行小波软阈值处理,然后将去噪后的数据送入广义神经网络进行预测。考虑到月度负荷具有趋势增长性和季节波动性的二重特性,该神经网络预测模型以横向负荷数据和纵向负荷数据作为神经网络的输入神经元,使得预测模型更合理。

通过实例应用表明,该模型具有较好的鲁棒性,预测精度较高且较为稳定,既有良好的实用性,且可适用于周,季负荷特性等具有二重趋势的序列的预测。

参考文献

[1]刘晨晖.电力系统负荷预报理论与方法[M].哈尔滨:哈尔滨工业大学出版社,1987.

[2]牛东晓,曹树华,赵磊,等.电力负荷预测技术及其应用[M].北京:中国电力出版社,1998.

[3]杨福生.小波变换的工程分析与应用[M].北京:科学出版社,1998.

[4]张立明.人工神经网络的模型及其应用[M].上海:复旦大学出版社,1993.

[5]张际先,宓霞.神经网络及其在工程中的应用[M].北京:机械工业出版社,1996.

[6]吴耀华.小波软阈值去噪在电压变换器选型中的应用[J].继电器,2008,36(4):47-49.WU Yao-hua.Application of Wavelet Soft-threshold Denoising in Voltage Converter Selection[J].Relay,2008,36(4):47-49.

[7]刘学琴.小波和神经网络在电力系统中长期负荷预测中的应用研究[D].西安:西安理工大学,2007.LIU Xue-qin.Apply Wavelet and Neural Network to Power System Mid-Long Term Load Forecasting[D].Xi’an:Xi'an University of Technology,2007.

GRNN 篇6

“河流健康”的概念已提出20余年,由于各国学者从不同方面对其内涵进行了阐述和诠释,加之研究目的和研究背景的差异,对河流健康概念的理解至今仍未能达成共识[1]。河流健康可以理解为在河流生态系统良好状态下,河流能够维持其生态系统结构完整性,充分发挥其自然生态功能,并提供相应的社会服务功能[2,3,4]。河流健康状况的表征和评价技术不仅能够应用于对河流现状的客观描述和评估,而且可以有效评价受损河流生态修复的成效,对于河流的可持续管理、区域生态环境建设都具有非常重要的意义[5]。河流健康评价的方法众多,但从评价原理上主要可分为预测模型方法和多指标方法[6,7]。多指标方法由于是对河流各方面特征的综合评价,其结果更加全面、客观,是河流健康状况评价的一种发展方向[4]。多指标评价系统难于或不适宜建立常规数学模型,只能借助诸如人工智能、模糊识别、知识工程等方法建立模型,以处理多指标系统的综合评价问题[8]。目前,模拟智能方法已成为建立和评价这类复杂系统最为有效的途径之一,而人工神经网络则是这类智能算法中运用最为广泛的算法之一。本文参考相关文献[9,2],利用层次分析法构建符合区域中小河流健康评价指标体系和等级标准,基于网络结构较为相似的径向基神经网络(RBF)和广义回归神经网络(GRNN)原理,分别构建河流健康评价模型对区域中小河流健康进行综合评价,为区域河流的可持续管理和生态环境建设提供参考依据。

1 河流健康评价模型

1.1 RBF神经网络模型[10,11,12,13,14,15]

径向基神经网络(RBF,Radial Basis Function Neural Network)是以函数逼近理论为基础而构造的一种前向网络,它是由输入层、隐藏层和输出层组成的3层网络,如图1所示。输入层由信号源节点组成,第2层是隐藏层,该层的变换函数采用RBF,第3层为输出层,对输入模式作出响应。

RBF网络的基本思想是:用RBF作为隐单元的“基”构成隐藏空间,隐含层对输入量进行变换,将低维的模型输入数据变换到高维空间内,使得在低维空间的线性不可分问题在高维空间线性可分。RBF网络结构简单、训练简洁而且学习收敛速度快,能够逼近任意非线性函数,近年来的研究表明:无论在逼近能力、分类能力(模式识别)和学习速度等方面RBF均优于BP网络。RBF网络的输出为:

采用Gaussian函数作为径向基函数。

式中:x为输入样本;y为输出;CK为高斯函数的中心;‖xCK‖为欧式范数;σ为高斯函数方差;ωik为隐含层到输出层的连接权值;N为隐含层节点数。径向基函数网络算法步骤如下:

(1)从输入向量中选一组初始中心值CK;

(2)计算方差值:

式中:d为最大的距离;K为CK的数量。

(3)由输入x(n)计算^yi(n)

(4)更新网络参数

式中:

式中:yd(n)为网络期望输出;μN,μC,μσ为3个参数的学习步长。

(5)如网络收敛,则计算停止,否则转到步骤(4)。

1.2 GRNN神经网络模型[10,11,12,13,14,15]

广义回归神经网络(GRNN,Generalized Regression Neural Network)是一种高度并行径向基网络,它是由输入层、模式层、求和层和输出层组成的4层网络,对应网络输入X=[x1,x2,…,xn]T,其输出为Y=[y1,y2,…,yn]T,如图2所示。

GRNN在结构上与RBF网络较为相似,具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题。GRNN在逼近能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本量积聚较多的优化回归面,并且在样本数据较少时,预测效果也较好。此外,网络还可以处理不稳定数据。GRNN网络算法步骤原理如下:

(1)输入层。输入神经元数目等于学习样本中输入向量维数,各神经元是简单的分布单元,直接将输入变量传递给模式层。

(2)模式层。模式层神经元数目等于学习样本数目n,各神经元对应不同样本,模式层神经元传递函数为:

式中:X为网络输入变量;Xi为第i个神经元对应的学习样本;σ为光滑因子。

(3)求和层。求和层中使用2类神经元进行求和。一类计算公式为:

对所有模式层神经元的输出进行算术求和,模式层与各神元的连接权值为1,传递函数为:

另一类计算公式为:

对所有模式层神经元的输出进行加仅求和,模式层中第i个神经元与求和层中第j个分子求和神元之间的连接权值为第i个输出样本Yi中的第j个元素,传递函数为:

输出层。输出层中的神经元数目等于学习样本中输出向量的维数n,各神经元将求和层的输出相除,神经元j的输出对应估计结果Y(X)的第j个元素,即

2 河流健康评价的指标体系构建

2.1 评价指标及标准

鉴于国内外河流健康评价指标体系及等级标准的多样性与复杂性[1,2,3,4,5,6,7],本文参考文献[9],结合丰水地区区域中小河流特征及评价指标数据获取的难易程度,利用层次分析法构建适用于丰水地区河流健康评价的指标体系和分级标准,将区域河流健康评价分为目标层A、准则层B和指标层C3个层次。目标层A主要用于综合评价河流健康状况;准则层B用于反映河流健康状况的内部协调性,分别由河流动力、生态功能和经济社会服务功能3部分构成,它将河流健康的各个方面有机地结合在一起;指标层C反映河流健康评价中各个准则层的具体指标,由反映河流动力等准则的15个评价指标组成,它是河流健康评价的基础。以下建立适用于丰水地区中小河流健康状况评价的标准和尺度,并将河流健康分5个等级,详见下表1、表2。

2.2 河流健康评价的实现

2.2.1 指标数据标准化处理

表1中的河流健康评价指标分为正向指标和负向指标,为了消除不同量纲对评价结果的影响,首先需对评价指标数据进行标准化处理。对河流健康评价等级起正作用的指标,如单位面积径流量、生境多样性指数等,其处理方法为:

对河流健康评价等级起负作用的指标,如河段弯曲度、水土流失面积比例等,其处理方法为:

式中:为经过标准化处理的数据;x为原始数据;xmax为数据序列中的最大数。

经过标准化处理后,数据处于[0~1]范围之内,有利于网络训练。

2.2.2 训练样本设计

依据表1,以各评价因子上下限(极小极大值)为限值,利用线性插值方法将标准化的各评价因子插值得到50个训练样本作为网络的输入,将0~1插值得到50个训练样本作为输出;将标准化的河流健康分级评价标准值作为“预测”样本进行“预测”,并将结果作为河流健康综合评价等级的划分标准,对区域中小河流健康状况进行评价分析。

2.2.3 网络训练

本文采用RBF与GRNN神经网络对河流健康状况进行评价,见图1和图2。以表1中各评价指标作为输入向量,即输入层神经元个数为15个;以0~1插值结果作为输出向量,即输出层的神经元数为1个。对于RBF和GRNN神经网络,由于人为调节的参数少,只有一个阈值,因此网络根据训练算法和训练样本集即可开始学习训练,当网络训练好以后,各个隐节点的数据中心相应的输出权值将不再改变,此时的神经网络可以进行河流健康评价。本文采用MATLAB软件编写RBF和GRNN神经网络算法程序对河流健康状况进行评价,程序采取循环训练算法,最终确定RBF和GRNN神经网络的SPREAD分别选取为1.2和0.2时,网络达到最佳评价效果。为验证RBF与GRNN网络的有效性,本文选用目前应用最为广泛的BP网络作为对比网络,经反复验证,模型结构为15-62-1,隐含层和输出层传递函数分别采用tansig和logsig,训练函数采用traingdx,阀值和权值的学习函数采用learngd,性能函数采用mse,设定期望误差为1×10-4,最大训练轮回为2 000次。经过试算,网络达到了较好的训练精度和评价要求。

3 实例应用

3.1 研究区域概况

文山州位于云南省东南部,属亚热带低纬度高原季风气候区,全州总面积31 456km2,辖文山、砚山、西畴、麻栗坡、马关、丘北、广南、富宁8县,现人口345万。境内河流分属珠江流域和红河流域,珠江流域为西江水系,面积17 145km2,占全州总面积的54.5%,主要有清水江、驮娘江、西洋江、普厅河、那马河等;红河流域为泸江水系,面积14 311km2,占全州总面积的45.5%,主要有盘龙河、八布河、南利河、斋河、那么果河等。境内降水量及水资源总量相对丰富:多年平均降水量1 178.5mm,水资源总量157.7亿m3[18]。近年来,由于流域内水土资源的开发利用,尤其是引流式水电站的无序开发,使得减水河段占河段总长的比重不断加大,水土流失加剧,对河流生态环境造成不良影响。因而,河流现状的客观描述和评估,对于河流的可持续管理、区域生态环境建设都具有重要的意义。

3.2 评价结果及分析

依据表1、表2河流健康评价指标体系及分级标准,利用上述训练好的RBF和GRNN神经网络模型分别对河流健康分级评价标准值和区域中小河流健康状况进行评价,结果见下表3和表4。

分析表3、表4可以得出以下结论:

(1)文山州各评价河流健康状况评价等级为Ⅱ~Ⅲ级,即处于健康与不健康之间,基本反映了区域中小河流现状特征,符合区域河流自然状态与开发利用现状,表明研究建立的RBF与GRNN神经网络河流健康评价模型和评价方法均是合理可行的,评价结果可以作为区域河流综合治理与健康评判的依据。

注:区域河流数据主要来源于《文山州水资源综合规划》、《文山州水资源开发利用》等。

(2)从表4可以看出,处于亚健康的河流除河段弯曲度、比降、森林覆盖率等自然因素外,主要受河流水能资源开发利用、水土流失以及水体污染的影响,使得河流处于亚健康状态。

(3)从评价方法上看,RBF与GRNN神经网络评价模型对河流健康评价结果完全一致,与BP神经网络评价结果基本相同,说明RBF与GRNN神经网络评价模型均可作为河流健康状况评价的选用模型。

(4)BP神经网络隐含层神经元个数需要人为确定,是一个较为复杂的问题,确定个数的合理与否,直接影响到预测的精度。与BP相比,RBF神经网络不但学习速率快,而且克服了BP网络易陷入局部极值的缺点;调整的参数较少,只有一个SPREAD(径向基函数的分布密度)参数。由于SPREAD的大小不但影响网络的逼近精度,而且还影响着网络的预测精度,本文在网络设计过程中,采用循环算法确定SPREAD最优值为1.2[15,20]。

(5)与BP神经网络相比,GRNN神经网络有收敛速度快、预测精度高、不易陷入局部极小值等优点;而且GRNN需要调整的参数较少,只有一个SPREAD参数,可以更快地预测网络,具有较大的计算优势。尤其是GRNN神经网络在样本量少而且噪声较多时预测效果也较好,这是诸如BP网络无法比拟的[20]。

(6)GRNN网络在逼近能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本积聚较多的优化回归面,并且在样本数据较少以及存在不稳定数据时,预测效果也较好。

4 结语

(1)本文分别构建基于RBF和GRNN神经网络的河流健康评价模型对区域中小河流健康状况进行评价,评价结果完全一致,表明研究建立的网络模型应用于河流健康评价是合理可行的,评价结果令人满意。

(2)参考相关文献[9]建立了区域中小河流健康评价指标体系及分级标准,采用线性内插法构建训练样本,将分级标准值作为“预测”样本进行“预测”,并将结果作为河流健康等级评价的划分依据,最大限度地克服了主观臆断成分,使评价具有客观性和通用性。但评价结果往往受评价指标标准值和评价指标上下限极值范围的影响较大,这也是如何客观综合评价此类“系统”的难点和关键所在。

【GRNN】推荐阅读:

上一篇:精神家园生态意识下一篇:仔猪流行性腹泻

本站热搜

    相关推荐