神经网络建模

2024-05-13

神经网络建模(精选12篇)

神经网络建模 篇1

0 引言

在智能系统和智能产品的开发中,控制和结构一体化设计有多种思路,其中一种是采用神经网络和结构并行进化设计,并将设计模型直接接入实体造型和激光快速成型技术,直接生成具有一定自治能力的机器人。在自治机器人中,神经网络由人工神经元硬件实现,因此,神经网络连线应尽可能少以便于加工,同时连线少也有利于提高控制系统的可靠性。现有的神经网络模型主要是通过多目标优化和进化策略寻找最优构型[1,2,3,4,5,6],主要依靠增加连接来提高网络性能。有的学者认为生物学上如此复杂的连接是不现实的,自然进化不应该朝向如此庞大的连接[6]。其中有的文献基于神经元形态学(Neuron Morphologies)通过进化算法生成神经元形态和神经网络[5],侧重于神经元层的行为和操作过程,但用在工程中计算成本过高。

神经生物学提供了人工制品控制设计可以借鉴的原型。有两种途径建立神经系统模型。一种是直接建立仿生物模型。主要缺陷在于有机体神经发育中包含大量的化学反应,过程过于复杂,难以建摸。第二种途径是依据现有的神经元理论建模。神经元的作用机制模型已经有专门的研究,有成熟的成果可以借鉴。这样做的问题是现有的研究主要集中在神经元信息传递和处理机制,而非神经元网络的拓扑构型的生物学依据。

本文结合上述两种途径建模,采用简化的生物神经模型,提炼神经系统构型特征,建立神经元网络模型。

1 神经传递通路简化模型

神经系统模型非常复杂,必须提炼主要特征,才能建立有效计算模型,并应用在工程实际中。本节依据神经系统主要组成和神经传递通路特征建立神经传递通路简化模型。

1.1 神经系统组成

神经传递通路主要由感受器、神经纤维、神经元、效应器组成[7,8]。感受器是一种换能装置,将内外刺激的能量转变为神经的兴奋过程。效应器支配肌肉的活动。运动神经传递模式为感受器一初级传入神经元一二级传入神经元—三级传入神经元—中间神经元—一级传出神经元—二级传出神经元—骨骼肌。不同的通路对应不同的功能以及大脑皮质中不同的区域。以随意控制神经传递通路为例,主要回路有四个,各个回路功能不同,共同参与运动调控。大脑一小脑—丘脑—大脑联络皮质回路:投射系统对大脑皮质的运动区产生调节性影响;大脑皮质一基地核—丘脑—大脑皮质回路:主要功能为参与运动计划、启动和执行;大脑一运动前神经元一小脑—丘脑:将动作经验和当前情况核对,以矫正运动神经元的发放,使运动产生新的速度;大脑—丘脑回路:大脑皮质的下行纤维对丘脑有抑制作用。防止过激反应。

1.2 神经传递通路简化模型

依据随意控制神经传递通路特征,本文建立神经传递通路简化模型。模型由4个回路组成:(1)大脑—小脑—丘脑—大脑皮质回路;(2)大脑皮质—基地核—丘脑一大脑皮质回路;(3)大脑一运动前神经元一小脑—丘脑;(4)大脑一丘脑回路,分别简称为丘脑回路、基底核回路、小脑回路、大脑皮质回路。如图1所示。

2 神经网络建模

神经模型基本要素为基本单元和基本构型。基本单元包括神经元、感受器、效应器和神经中枢。基本构型采用上述简化模型,神经网络采用固定形态和连接模式,网络权植通过学习训练确定。

2.1 神经元分类

神经元包括胞体、轴突和树突三个组成部分。神经元分为5类:传入神经元,传出神经元,大脑皮质区中间神经元,基底核中间神经元,小脑中间神经元。其区别在于胞体的传递函数、输入函数、树突和轴突的形态、树突输入加权函数以及轴突输出不同。

2.2 网络结构

对图1简化模型建立神经网络,如图2所示。

网络含4个侧枝回路:丘脑回路、大脑皮质回路、基底核回路、小脑回路,分别控制感知和整合信息、调节姿态、运动启动和规划执行、核对和矫正运动等功能。灰色为抑制神经元,网络为动态网络。动态网络含有网络输入延迟或反馈环节,因此,网络的仿真输出与数据元素的顺序有关。图2a为原型网络,直接依据神经传递通路原型建模,包含14层,14个神经元,19条连线,4个回路。网络的主要优点是连线少,且整个网络为平面图,连线没有交叉,当采用神经元器件实现时便于加工布线。图2b为变形网络,共6层,14个神经元,53条连线。变形网络的优点是网络参数比原型网络简单。主要缺点是结构复杂,层间连线交叉,当采用神经元器件实现时布线和制造难度增加。

网络输入设定两种方式:(1)输入运动信息;(2)输入运动信息和控制幅度,以实现控制。

实现上述神经元网络,必须首先建立神经元数理模型。本文采用现有的神经元传递函数和加权函数[9]构造数理模型,并用基于matlab的函数实现[10]。

2.3 神经元数理模型

(1)神经元胞体

一级、二级传入神经元胞体数理模型:

中间神经元输入输出关系:Xi(s)=Hi(s)Xi(s)

传出神经元:yi(t)=f(xi)

(2)轴突

传入神经元、中间神经元以及非传出运动神经元为:

传出神经元为:a=n

(3)树突

分加权函数和输入函数两部分。

加权函数为欧氏距离加权函数:

输入函数为以加权方式将加权输入和阈值组合。matlab函数为N=netsum(Z1,Z2,∧,Zn)。

2.4 网络学习和训练

学习能力依靠突出结合权的变化实现。

(1)训练函数

训练分为两步。第一步采用弹性反向传播算法RPROP(resilient backpropagation algorithm)对网络进行训练;第二步采用BFGS准牛顿(quasi-Newton)反向传播算法对网络进行训练。作者计算表明:选用两种算法可以避免锯齿现象,加快收敛;对不同的系统特性,应需选取不同的训练函数。对有噪音的输入——输出系统,弹性反向传播算法有利;对PID姿态控制系统,选用单一贝叶思正则化训练函数即可。

弹性反向传播算法依据误差能量函数独立调整网络各层权重和偏差以控制步长,权值和阈值更新时只考虑梯度符号。牛顿反向传播算法是将目标函数在极小点附近用二次函数逼近,避免锯齿现象。贝叶斯正则化方法可自动调整网络规模,防止过度训练。

(2)学习函数

采用动量梯度下降权值和阈值学习函数,即权值和阈值的调整值由动量因子mc、前一次学习时的调整量dWprev、学习速率lr和梯度gW共同确定,方程为:

2.5 网络测试

用计算实例测试网络的逼近精度和泛化能力,并与其它网络比较。泛化能力(Generalization Ability)指用较少的样本进行训练,使网络能对未经训练的输入能给出合适的输出。

函数逼近能力见表1,泛化能力见表2。比较网络构型选择原则为连线数大于原型网络。观察表1和表2,对随机函数和非线性函数,在相同训练次数情况下,4回路网络与其它网络相比同时具有更好的函数逼近能力和泛化能力。由于原型网络连线数少且连线在同一平面内,因而更利于硬件实现。

2.6 网络特点

1)多个实例计算表明,本文提出的两种网络均可以满足一般输入输出映射关系。对同样的神经元数目,原型网络和变形网络比一般网络能适应更多类型的函数映射关系。2)原型网络和变形网络在算法上容易实现,适应性强。前者收敛速度慢,但是结构简单,易于布线,并利用基于激光的层加工技术实现神经元器件埋设;后者收敛速度快,但是连线多。故在线训练采用变形网络;神经元硬件实现采用原型网络。3)多个网络并联实现复杂控制。4回路神经网络模型的潜在应用是实现复杂的姿位控制,如自治卫星、机器人等,在此情况下,需要多个神经传递通路协作实现预定目标。4)网络与其它网络比较具有以下优点:(1)对任意函数逼近能力好;(2)在相同训练次数条件下泛化能力好。

3 结论

本文建立神经传递通路简化模型,建立相应的神经网络模型——4回路动态延迟神经网络模型。包括丘脑回路、大脑皮质回路、基底核回路和小脑回路。网络可采用两种形式表达:一种是直接模拟神经传递通路形态的原型网络,另一种为变形网络。原型网络包含14层,14个神经元,19条连线。主要优点是连线少,且整个网络为平面图,连线没有交叉,当采用神经元器件实现时便于加工布线。变形网络有6层,14个神经元,53条连线。优点是网络参数比原型网络简单。主要缺点是结构复杂,层间连线交叉,当采用神经元器件实现时布线和制造难度增加。两种网络均易于数学实现,并具有良好的函数逼近能力和泛化能力。

参考文献

[1]Garcya Pedrajasa N,Herva's Marty neza C,Mun~oz Pe'rezb J.Multi-ob- jective cooperative coovolution of artificial neural networks.Neural Net- works 15,2002:1259-1278.

[2]Christian Schittenkopf,Gustavo Deco,Wilfried Brauer.Two Strategies to Avoid Overfitting in Feedforword Networks.Neural Network,1997,10 (3):505-516.

[3]Alistair G Rust,et al.Towards Computational Neural Systems through Developmental Evolution.Wermter S,et al.(Eds.):Emergent Neural Computational Architectures,LNAI 2036,Springer-Verlag Berlin Hei- delberg,2001:188-202.

[4]Nariman-Zadeh N,Darvizeh A,Jamali A,et al A.Evolutionary.design of generalized polynomial neural networks for modelling and prediction of explosive forming process.Journal of Materials Processing Technology, 2005:1561-1571.

[5]Sung-Kwun Oh,Pedrycz W,Byoung-Jun Park.Relation-Based Neuro- fuzzy Networks with Evolutionary Data Granulation.Mathematical and Computer Modeillng,2004,40:891-921.

[6]Torts JJ,et al.Influence of topology on the performance of a neural network.Neurocomputing,2004:229-234.

[7]许绍芬.神经生物学.第二版.上海:上海医科大学出版社,1999.

[8]Palay S L.等.神经元形态与功能,神经生理学手册(3).黄世楷,等译.上海:上海科学技术出版社,1985:1-195.

[9]史忠植.神经计算.北京:电子工业出版社,1993:27-31.

[10]许东,吴铮.基于madab6.X的系统分析与设汁——神经网络.西安:电子科技大学出版杜,2002:1-23.

神经网络建模 篇2

基于BP神经网络的光纤陀螺仪温度建模研究

目前光纤陀螺应用广泛,但是其性能容易受到环境温度影响,从而影响到惯性导航系统的性能.光纤陀螺的温度特性具有非常复杂的.非线性特点,而BP神经网络具有良好的逼近复杂非线性函数能力.使用BP神经网络建立光纤陀螺温度特性的黑箱模型,不对零漂和标度因子进行补偿,而直接对陀螺输出进行校正.经实际数据检验,该建模补偿方法比未经补偿和经过传统工程补偿方法的精度提高了两个数量级.与传统的线性模型相比较,本文基于BP神经网络建立的光纤陀螺温度模型具有补偿方法简单,精度高,通用性好等优点.

作 者:周海波 刘建业 熊智 赖际舟 ZHOU Hai-bo LIU Jian-ye XIONG Zhi LAI Ji-zhou  作者单位:周海波,ZHOU Hai-bo(南京航空航天大学,导航研究中心,江苏,南京,210016;空军飞行试验训练基地,河北,沧州,061022)

刘建业,熊智,赖际舟,LIU Jian-ye,XIONG Zhi,LAI Ji-zhou(南京航空航天大学,导航研究中心,江苏,南京,210016)

刊 名:光电工程  ISTIC PKU英文刊名:OPTO-ELECTRONIC ENGINEERING 年,卷(期):2006 33(6) 分类号:V241.5 关键词:光纤陀螺仪   黑箱模型   BP神经网络   温度补偿  

网络分析与市场动力学建模 篇3

关键词:市场动力学;社会网络分析;复杂网络;计算机模拟;新产品接受

市场动力学(Market Dynamics)是一类关于市场现实的崭新研究,该类研究希望以尽可能自然的方式刻画市场现象的关联、动态与交互特点(丁海欣,2010)。本文将主要讨论市场动力学如何可能从关联的角度反映市场动态现象。内容上主要包含如下三部分内容:功能角度的网络分析;结构角度的网络分析;通过具体的研究实例展示网络结构对于刻画市场动力现象的重要意义。

一、 社会网络分析:网络的功能分析

社会网络分析(Social Network Analysis)是当代西方主流社会学一个重要的研究方向,作为一种研究范式和一个具体的研究领域,被社会学之外的其他社会科学与自然科学学科广泛接受。从思想史的角度看,对网络或关系的重视具有悠久的历史,但在早期的研究中网络或者表现为比喻,或者只在抽象的意义上得到应用。现代意义上的社会网络分析与上述意义上的网络不同,它不仅重视对网络的分析,更重视量化分析。

社会网络分析的中心概念是网络,即交互作用单元之间的关系,对关系重要性的强调指导了与之相关的理论发现、模型构建及其应用,并使得社会网络分析成为一种独特的研究视角。根据Wasserman & Fraust(1994),社会网络分析除了强调交互主体之间关系的核心重要性之外,以下四个设定也具有重要意义:其一,行动者(Actor)及其行动被视为相互依赖而不是相互独立的;其二,行动者之间的关系联结(Tie)被视为资源传递与“流动”的渠道,其中资源既可以是物质性的,也可以是非物质性的,比如信息;其三,以个体为焦点的模型认为网络结构环境或者为行动者提供机会,或者对其行为提供约束;其四,网络模型将结构(社会、经济、政治等)概念化为行动者之间持久的关系模式。

社会网络分析思想进一步通过其所提出并论证的具体研究理念体现其对于市场动力学建模所具有的价值,比如嵌入(Embeddedness)思想。在论文《经济行为与社会结构:嵌入问题》中,Granovetter(1985)认为经济行动深深嵌入到社会关系中(经济行动是社会行动的一个特殊类别),受各种非经济因素的影响,因此应该从行动者所处的社会关系之中去解释经济活动。只有这样,才能克服以往经济学与社会学研究中存在的过度社会化与低度社会化问题,从而更好地说明经济活动及其与之相关的社会关系结构。

嵌入体现在个体之间的具体关联上。不同的关联则可能存在强弱之分。Granovetter(1973)于其著名论文《弱联结的优势》一文提出了联结的强度问题:关系联结具有强弱之分,弱联结(Weak Tie)与强联结(Strong Tie)在人际之间、组织之间以及个体与社会之间发挥着不同的作用。强联结主要维系着群体、组织内部的联系,而弱联结则在群体之间、组织之间充当信息桥,在群体间建立起纽带关系,使社会系统成为可能。

社会网络分析主要从功能意义上确定了市场动力学分析中重视网络的合法性与必要性。从存在性上讲,网络结构可能存在于消费者之间,也可能存在于企业之间,以及企业——消费者之间,所有这些存在的网络都有其意义并将发挥其影响。而从形态上看,这样的网络往往可能具有多重性,比如,在消费者之间,就不仅可能存在信息网络,同时也可能存在归属网络等(Krackhardt,1992),这些具有不同功能的网络可能具有并不完全相同的拓扑结构,并且不同的网络往往并不重合。而且对于不同的消费对象,消费者之间的网络结构也会存在差异(Janssen,M.A.,Jager, W.,2003)。

企业之间通常也会存在关联。市场往往具有不同类型的企业,不同的企业或者相互合作以完成对消费者需要的满足,比如供应链体现出的合作关系。企业之间也可能是竞争的,因导向性竞争而形成关联。或者甚至可能是竞争合作的。所有这些关系都需要在具体市场动力学建模中给予必要的重视。

二、 复杂网络:网络的结构分析

复杂网络(Complex Network)是关于不规则网络的研究。复杂网络所研究的对象往往涉及大量的网络节点及其关系,因此与传统的图论模型不同,复杂网络主要关注网络的统计特征,从统计角度刻画网络的拓扑结构,并进而展开其他相关研究。

在复杂网络研究兴起之前得到广泛研究的两类网络分别是规则网络与随机网络(Random Network)(Newman, 2003)。其中规则网络高度聚集,但不具有小世界性;随机网络具有小世界性,但不具有明显的聚集特性。虽然上述网络得到大量研究,却不能对于现实中的网络结构作出良好表示,因为现实中的网络可能既不是完全规则,也不是完全随机的。

为了对现实中的网络小世界性作出解释,Watts与Strogatz在1998年于Nature提出了一个被称为Watts-Strogatz网络(简称WS网络)的小世界模型。其构造算法如下:(1)从规则图开始:考虑一个含有N个点的规则网络,它们构成一个环,其中每个节点都与它左右相邻的各K/2节点相连,K为偶数。(2)随机化重连(Rewiring):以概率p随机地重连网络中的每个边,即将边中的一个端点保持不变,而另外一个端点取为网络中随机选择的一点。其中规定,任意两个不同的节点之间最多只能有一条边,并且每一个节点都不能有边与自身相连。

按照上述算法,p=0对应于规则网络,p=1对应于完全随机网络,通过调节p值就可以控制从规则网络到完全随机网络的过渡。

现实中的很多网络不仅具有小世界性,而且其连接度具有幂律形式,比如Internet等。针对该现象,Barabási与Albert在1999年于Science撰文提出一类无标度网络以解释幂律分布网络的产生。该论文提出了如下两个一般的解释机制:(1)增长机制(Growth):网络因为新节点的加入而不断扩张;(2)偏好连接机制(Preferential Attachment):新节点更偏好与那些具有较高连接度的节点相连接。这种现象也被称为“富者更富”(Rich Get Richer)或“马太效应”(Matthew effect)。

当前关于复杂网络的研究便主要受到以上两个典型研究的激发与促进,取得丰富成果,并在很多领域得到应用(Albert,R.,Barabási,A.-L.,2002;Newman,M. E. J.,2003; Boccaletti,et al.,2006)。

对于市场动力学建模而言,目前复杂网络所提供的关于网络拓扑结构的说明将为具体的市场动态现象建模提供结构上的支持。结构决定功能(Strogatz,2001),复杂网络将具体化通过社会网络分析所提出的关系结构并确定其功能。

复杂网络目前更多的研究主要集中于关于网络拓扑结构的讨论,但这一切并不是终点,所有关于结构的讨论都是为了更好地了解演化现象在网络结构下的动态演变(Dynamics)。根据Barabási(2009),复杂性科学的未来要求就是去理解那些被认为具有复杂性的系统的行为,而下一步需要解决的问题就是去理解那些发生在网络上的动态过程。Newman(2003)也指出,复杂网络中最重要的研究方向很可能就是关于对那些发生在网络上的过程与行为的理解。这首先取决于对于网络拓扑结构的揭示与建模。关于网络结构性理解的重要性对于市场动力学研究同样成立,并且成为具体问题讨论与建模的关键支持之一。

三、 一个示例:网络结构下的新产品接受研究

消费者对于新产品的接受(或创新扩散)具有重要意义。原因在于创新首先是当前社会进步的关键维度,并被视为现代性的一个最好指示,其次,新产品接受更具有隐喻的意义,在所有的社会变化中,都很可能存在着与上述现象相似的过程,比如群体对于新观念的接受。

根据网络分析的要求,新产品的潜在接纳者往往处于一定的社会关系下,受到其他采纳者选择的影响,对于这种影响可以概括地称之为口碑效应(Word of Mouth, WOM)。市场动力学研究利用基于主体的建模方法,可以对发生在不同网络结构下的新产品接受过程作出模拟(详细分析可参看第一作者博士论文相关章节)。结果如图1所示。

首先对图1结果与模拟作出简单说明。图中1-2所示结果分别表示Barabási-Albert网络(简称BA网络)与WS网络下不存在口碑效应的虚拟接受过程;图中3-4分别表示BA网络与WS网络下存在口碑效应的新产品接受过程,在后两种情况下,与每个消费者距离不超过2的消费者的选择行为都将对未采纳新产品的消费者的采纳行为发生影响。每种情况模拟20次,模拟时间长度为300回合,潜在采纳者为200人。

图1揭示出了明确的信息,其一,口碑效应显然对于新产品接受具有重要影响。与不存在口碑效应的对应过程相比,存在口碑过程的新产品接受在最终接受比例上要远远超过前者,从数值上看,不存在口碑效应的过程,模拟结束时的采纳比例不超过0.5,而存在口碑过程的最终采纳在0.9左右;从接受过程上看,两类情况显然表现为不同的接受路径,在有口碑过程的新产品接受中,可以看出非常清晰的接受跃迁,而这显然对应于口碑效应的促进作用。

其二,不同的网络结构下的结果也存在差异,可以看到, 虽然BA网络下的平均最终接受结果与WS网络下的平均最终接受结果大致相同(前者为0.941 5,后者为0.882 5),但从过程角度看,BA网络下的接受跃迁显然强于WS网络的接受过程。事实上,针对两类情景的非参数检验(Ma-nn-Whitney U检验)结果显示,无论是从过程的角度,还是从结果角度看,两类网络均存在统计显著性差异。

事实上,两者在接受“跃迁”上的差异很大程度上起源于相应网络结构的度分布,BA网络中存在明星式的节点(Star Node),如果这样的节点一旦采纳,则将从两个方面促进对新产品的接受,其一,从连接的人数上,可以对更大范围内的潜在接受者施加其影响,从而可能极大地促进对新产品的接受;其二,从影响的权重上,高的节点度在模拟中意味着高的影响加成,从而进一步推动对新产品的接受(节点“权重”的影响参看文献)。

四、 结语

论文首先从一般意义上简要介绍了市场动力学如何从功能与结构角度把握市场动态现实中的网络关系问题,并通过示例揭示了重视市场过程中存在的网络关系的必要性、可能性及其所具有的重要意义。希望这样的展示能够为类似研究提供一定的启示。当然需要指出的是,对于不同的问题情境,往往可能需要选择合适的关系拓扑。从构成一项完整的市场动力学研究而言,对于网络的关注往往只构成其底层基础,从实现的角度看,仍然需要其它知识(比如,与情景主体相关的理论)与技术(比如,基于主体的建模)的支持。

参考文献:

1. 丁海欣.市场动力学建模:基本市场空间内的问题.山东大学博士学位论文,2010.

2. Wasserman, S., Faust, K. Social Networks Analysis: Methods and Application.Cambridge C- ambridge University Press,1994.

3. Granovetter, M. The Strength1 of Weak Ties. American Journal of Sociology,1973,78(6):1360-1380.

4. Granovetter, M. Economic Action and Social Structure: The Problem of Embeddedness. The American Journal of Sociology,1985,91(3):481-510.

5. Krackhardt, D. Hanson, J. Informal Networks: The Company behind the Chart. Harvard Business Review,1993,71(4):104-111.

6. Janssen, M.A., Jager, W. Simulating Market Dynamics: Interactions between Consumer Psychology and Social Networks. Artificial Life,2003,(9):343-356.

7. Newman, M. E. J. The Structure and Function of Complex Networks. SIAM Review,2003,45(2):167-256.

8. Watts, D.J., Strogatz, S.H. Collective Dynamics of“Small-world”Networks. Nature,1998,(393):440-442.

9. Barabási, A.-L., Albert, R. Emergence of Scaling in Random Networks. Science,1999,(286): 509-512.

10.Albert, R., Barabási, A.-L. Statistical Mechanics of Complex Networks, Rev. Modern Phys,2002,(74):47-97.

11.Boccaletti, S., Latora, V., Moreno, Y., Chavez, M., Hwang, D.-U. Complex Network: Structure and Dynamics. Physics Report,2006,(424): 175-308.

12. Barabási,A.Scale-Free Networks:A Decade and Beyond, Science,2009,(325):412-413.

13.Strogatz,S.Exploring Complex Networks.Nature,2001,(410):268-276.

14.Delre,S.A,Jager W,Janssen M.A.Diffusion dynamics in small-world networks with heterogeneous consumers.Comput Math Organ Theory,2006,(4):5-12.

15.Rogers,E.M.New Product Adoption and Diffusion.The Journal of Consumer Research, 1976,2(4):290-301.

16.Rogers,E.M.Diffusion of innovations(4th edition).New York:The Free Press,1995.

17.Scott,J.Social Network Analysis:A Handbook(2nd edition).Sage Publications,London,2000.

18.Solomon,S,Weisbuch G,de Arcangelis L,Jan N,,Stauffer D.Social percolation models. Physica A,2000,(277):239-247.

19.Valente,T,W.Social network thresholds in the diffusion of innovation.Social Networks, 1996,(18):69-89.

作者简介:丁海欣,山东大学管理学院博士生;苗旺,山东大学管理学院博士生。

神经网络建模 篇4

开关磁阻电动机(Switched Reluctance Motor,SRM)因其结构简单、性能可靠、效率高、成本低等优点,成为极具应用前景的电动机。但SRM结构特殊(双凸极铁心结构,转子无绕组亦无永磁体),磁路呈现非线性特性[1],比如磁链、转矩是电流、位置的非线性函数。建立准确的SRM模型成了一个研究的热点。参考文献[2]提出建立电流、角度、磁链关系表,然后求解绕组电压方程。还有学者用有限元建立电动机的磁路模型,虽然提高了精度,但是计算烦琐。同时也有一些学者尝试用神经网络等智能方法建立模型,参考文献[3,4]采用BP神经网络建模,分析非线性关系。参考文献[5]采用支持向量机建立电动机模型,参考文献[6]采用变结构模糊神经网络建立电动机的磁链模型,参考文献[7]采用BP神经网络建模。通过比较分析,BP神经网络学习算法切实可行,但缺点是学习速度慢、收敛时间长、易陷入局部极小。如果能够改进这些缺点,那么BP神经网络将成为SRM建模的有效工具。

本文在研究优化算法基础上[8,9,10],针对现有SRM建模方法初始网络权值参数随机给定和易于陷入局部最小点的缺点,提出了并行优化混沌(Parallel Chaotic Search,PCS)BP神经网络建模方法。首先,利用混沌系统对神经网络权值向量、阈值向量进行初始优化;然后利用BP神经网络的Levenberg-Marquardt算法进行收敛训练,如果陷入局部最小点则再次使用并行混沌搜索进一步优化模型;最后,利用优化混沌BP神经网络建立SRM模型,再建立调速系统。仿真结果表明,该方法具有运算速度快、精度高的特点。

1 SRM模型

设SRM的各相绕组采用正向方式连接,各相间的互感忽略不计。同时,假设各相绕组具有相同的电磁特性,只要检测其中一相的磁链、转矩特性就可以推算其他相的特性。四相SRM基本方程如下:

Uk=rkik+dΨkdt(1)Jdωdt=Τe-ΤL-βω(2)

根据电磁理论的虚位移法,对于转距为T,绕组磁共能为Wk的机电联系方程为

Τk(θ,ik)=Wk(θ,ik)θ|ik=const(3)Wk(θ,ik)=0iΨk(θ,ik)dik(4)Ψ=L(θ,i)i(5)

式中:UkrkikΨkWkTk分别为电动机的第k相绕组电压、电阻、电流、磁链、磁共能、电磁转矩,k=1,2,3,4;J为电动机的转动惯量;TL为负载转矩;Te为电磁转矩;β为系统的黏滞系数;ω为电动机角速度;θ为转子位置角;L为电感。

对于常见的SRM模型,可通过建立复杂的转矩和磁链数据表,并查表获得转矩和磁链。但是这种方法往往会随着数据精度的提高而使表格变得复杂,占用大量的存储空间,而查找速度也将下降。本文通过优化的神经网络来建立电流、磁链、位移角和转矩、电流、位移角模型,搭建SRM模型并进行调速仿真。通过训练模型计算输出转矩和电流,不仅简化了系统结构,而且降低了内存消耗,提高了运算速度。

2 并行混沌优化

混沌已成为一种广泛使用的优化技术[11,12,13]。为了避免混沌优化方法在缩小优化变量的搜索空间前出现盲目搜索,本文提出在同一搜索空间,利用2种不同的混沌机制Logistic映射(式(6))和另一类混沌机制(式(7))进行同步搜索。同步使用2种方法搜索各权值和阈值在各自的空间中的最优值,2种方法中任何一种达到系统要求即可停止混沌搜索工作。通过引入并行混沌优化机制,不但增强了搜索的充分性,而且减少了盲目搜索的次数,提高了搜索效率。

2.1 Logistic映射

xk+1ch1=μxkch1(1-xkch1)0<xkch1<1(6)

μ=4时,描述系统混沌稳定性的Lyapunov指数达到最大值0.69,Logistic映射完全处于混沌状态。

2.2 一维迭代混沌自映射

xk+1ch2=sin(2/xkch2)(7)

式中:k=0,1,2,…,-1≤xkch2≤1,xkch2≠0且不能取x=sin(2/x)方程不动解。

需要把对应解的范围进行缩放(载波)。假设待搜索优化变量的取值范围为x′1(2),k∈(a,b),那么Logistic变量对应线性变换:x′1,k=a+xkch1(b-a),第二种混沌迭代线性变换:x′2,k=0.5(a+b)+0.5xch2k(b-a)。

3 BP神经网络建模

由于忽略了相间互感且每一相具有相同的磁特性曲线,所以,只需要建立其中一相磁特性模型,就可以得知其他各相对应的模型。

3.1 神经网络基本关系式

在BP神经网络中,输出节点的误差E表示为

E=12(d-o)2=12k=1l(dk-ok)2(8)

式中:l为输出节点数;dk为期望输出;ok为网络输出;k=1,2,…,l

输出层:

ok=f2(netk)=f2(j=1mwjkyj-Θk)(9)

式中:Θk为输出节点k的阈值。

隐含层:

yj=f1(netj)=f1(i=0nvijxi-ϖj)(10)

式中:ῶj为隐含层节点j的阈值,j=1,2,…,m

神经网络训练就是针对样本的输出误差以某种形式通过隐含层向输入反传。根据误差,调整各层间权值连接向量和阈值向量,使得误差不断减小。因此,可以将神经网络的训练描述为一个优化问题的目标函数:

{minE(W,V,Θ,ϖ)st.W,V,Θ,ϖΤ(11)

式中:W,V,Θ,ῶ分别对应隐含层到输出层的权值、输入到隐含层的权值、输出节点k的阈值、隐含层节点j的阈值;T为式(11)所有解的集合。

4个向量W,V,Θ,ῶ构成了一个解空间。算法的目标就是在解空间内找到误差更小的解。

3.2 训练样本

采用参考文献[14]所介绍的方法,采集一相电压、电流在半个极矩内固定角度下的值,根据式(12)计算Ψ(θ,i)

Ψ(t)-Ψ(0)=0i[u(t)-i(t)r]dt(12)

实验所用SRM为四相(8/6极),额定功率为500 W。从定子槽中心线与转子极中心线对齐为0°位置,磁链变化周期为60°。通过DSP和上位机在非均匀间隔的转子位置,测量对应角度磁化特性,如图1所示。

3.3 建模步骤

并行混沌BP神经网络建模步骤:

Step1: 设置网络参数:学习率η、步长Epoch、BP神经网络目标误差εgoal、实际误差εLM、扰动因子λ(0<λ<1、混沌迭代时比较误差最小值εmin,nch、当前误差最小值εmin,nch、输出权值当前最优向量W*n、隐含层权值当前最优向量V*n、隐含层阈值当前最优向量ῶ*n、输出阈值当前最优向量Θ*n、混沌迭代次数Ks1(并行搜索阶段1)、Ks2(并行搜索阶段2)。

Step2: 利用并行混沌优化权值算法,在权值、阈值空间中按照混沌迭代式进行搜索。

(1) 随机产生2组向量对应的混沌初始变量Δh1nch1(ch2)h2nch1(ch2)h3nch1(ch2)h4nch1(ch2),代入混沌迭代式(6)、式(7)中,求解并且载波到对应权值、阈值范围。产生2组权值、阈值向量Wnch1(ch2),Vnch1(ch2),ῶnch1(ch2),Θnch1(ch2)(n=1)。学习样本用式(8)、式(9)、式(10)计算初始化的网络误差,推出“精英解”,取εmin,nch=minn(1,Κs1)(εnch1,εnch2),并且记作εmin,n=εmin,nch

(2) n=n+1。继续按式 (5)、式(6) 迭代混沌变量,并放大到对应的区间(a,b),产生新的混沌向量。通过样本学习计算2组混沌搜索权值、阈值向量内部推出“精英解”。如果εmin,n>εmin,nch,则εmin,n=εmin,nch,取误差小的权值、阈值为最优值W*n,V*n,ῶ*n,Θ*n;否则εmin,n不变,当前最优值权值、阈值保持不变。如果εmin,n<εgoal,停止并行混沌优化权值算法,网络达到精度要求,进入Step5;否则,直到满足迭代次数Ks1,进入Step3。

Step3:Levenberg-Marquardt算法训练网络。利用混沌搜索的网络,再次利用Levenberg-Marquardt算法训练网络。如果误差函数达到要求,训练结束,进入Step5;否则,训练步数大于Epoch,仍未达到精度要求,说明系统可能已经陷入某个局部最小点,进入到Step4,需要再次利用并行混沌搜索。

Step4:二次并行混沌优化。解决陷入局部最小点的方法就是添加权值、阈值的扰动量,来试探输出误差是否在扰动下减小,如果减小,那么返回Step3,重新训练;否则,分阶段逐渐增加权值扰动量。步骤如下:

(1) 产生权值、阈值随机小幅扰动量混沌向量Δh1nch1(ch2)、Δh2nch1(ch2)、Δh3nch1(ch2)、Δh4nch1(ch2)(0<nKs2)。代入Xn+1ch1(ch2)=Xnch1(ch2)+λΔXnch1(ch2)(X:W,V,Θ,ῶ)。根据样本计算误差、取小,并且记误差:εmin,n=εmin,nch=minn=1(εnch1,εnch2)和当前最优向量W*nV*n、ῶ*nΘ*n

(2)迭代混沌变量产生新的向量Xn+1ch1(ch2)=Xch1(ch2)n+λΔXnch1(ch2)(X: W,V,Θ,ῶ)。

如果εmin,n<εLM,则返回Step3,重新训练;如果εmin,n<εgoal,则转入Step5,结束训练;否则,混沌迭代继续,n=n+1。直到n=Ks2,返回Step3。

(3) 步骤分析。① 若经过多次迭代后,εmin,n>εLM,且无法进行权值更新,说明在局部最小点附近仍然无法跳出,那么就应该加大扰动量,增强变量的遍历范围,帮助跳出局部最小点;② 迭代多次误差减小,此时系统已经跳出局部最小点,向精度更高解收敛。

Step5: 神经网络训练结束。

4 开关磁阻电动机模型训练

通过实验方法[14]计算出样本数据,获得一相绕组i,θ,Te数据。根据SRM内部结构采用电流和角度计算转矩。转矩曲线(Te,θ,i)用实验[14]的方法获得。BP网络输入变量为转子位置角θ和相绕组电流i,输出为转矩Te,故网络的结构为输入2个节点,输出1个节点。任何在闭区间内的一个连续函数,都可以用只有一个隐含层的BP网络来逼近。因此,采用单隐含层BP网络。优化后的神经网络输入、隐含层、输出为2×15×1。其中f1采用正切sigmoid函数tansig,f2采用purelin线性函数。为了得到好的训练结果,对样本数据进行归一化处理。图2为利用并行混沌搜索仿真SRM模型预测电流为1、3、5、7、9 A时不同转角下的转矩曲线。从图2可看出,预测数据与实际采样数据得到的磁化曲线误差很小。

图3为训练误差。从图3可看出,通过混沌优化(PCS),使得权值、阈值在对应范围内逼近最优值,再通过Levenberg-Marquardt (L-M)算法使误差进一步收敛,不断地向最优的权值、阈值向量逼近。通过神经网络建立的转矩模型提高了运算速度和精度,因此,该模型完全可以替代传统SRM模型。

5 调速系统仿真研究

SRM调速系统由速度控制器、电流控制器、驱动控制器和SRM组成,如图4所示。驱动控制部分主电路采用不对称半桥功率变换器结构。给定转速ωd=500 r/min,转动惯量J=0.004 3 kg·m2。

分别用基于BP神经网络的非线性转矩、电流模型和实验建立的转矩、电流表在Matlab中建立SRM仿真模型。其中SRM模块中包括A,B,C,D四相,单相结构如图5所示。用相同的方法建立i(θ,Ψ)块,每一项中都包括了i(θ,Ψ)模块和Τe(θ,i)块。四相绕组对称,控制方式相同 ,所以,四相只需移相处理即可满足每相依次滞后1/4 电周期角度即15°的条件。采用并行混沌搜索和查表法对调速系统进行仿真。2种算法采用相同的PID方法控制速度误差,其中Kp=6,KI=1.2。

图6为基于并行混沌搜索神经网络模型的调速仿真波形。从图6可看出,基于并行混沌搜索神经网络的四相SRD的仿真模型中的转速波动很小,能够很好地跟随给定转速,而且转速大致在小于0.05 s时进入稳态。

图7为基于查表法的速度仿真波形。从图7可看出,查表法虽然也实现了速度控制,但是速度波动大,而且在相同的控制条件下,速度静态误差较大,速度响应在0.05 s后才进入稳定状态。因此,基于并行混沌搜索的神经网络模型具有更好的动态特性。

图8为系统仿真过程中C相磁链仿真曲线。从图8可看出,仿真模型特性接近实际模型,具有较好的动态特性。

6 结语

提出了一种利用优化BP神经网络和并行混沌寻优建立SRM模型的方法。模型训练结果和SRM调速系统动态仿真结果表明,采用并行混沌神经网络建模方法建立的模型运行平稳,系统动态性能好,响应速度快,解决了传统查表法响应速度慢、需要消耗大量内存资源来换取计算精度的缺点,对进一步研究SRM建模方法具有参考意义。

摘要:针对开关磁阻电动机的非线性特点及其现有建模方法存在初始网络权值参数随机给定和易于陷入局部最小点的缺点,提出了一种采用并行优化混沌BP神经网络的建模方法。该方法首先利用混沌系统对神经网络权值向量、阈值向量进行初始优化,然后利用BP神经网络的Levenberg-Marquardt算法进行收敛训练,如果陷入局部最小点则再次使用并行混沌搜索进一步优化模型,使模型具有精度高、速度快的特点。模型训练和开关磁阻电动机调速系统动态仿真结果表明,采用该方法建立的模型运行平稳,系统动态性能好,响应速度快。

神经网络建模 篇5

最近学习了黄廷祝教授的《数学建模与数学实验》的网络课程培训,黄老师主要从数学建模课程概况、数学建模教学方法等方面进行了讲解,既有理论深度,又跟实践结合紧密,对概念引入的背景阐述,对理论在其它方面的应用上,都完美体现了数学建模课程的应用性、广泛性、严谨性。本课程的目的是通过数学建模有关概念、特征的学习和数学模型应用实例的介绍,培养学生双向翻译能力、数学推导能力、简化计算能力和熟练运用相关数学软件的能力,培养学生想象能力、洞察能力和综合分析能力,培养学生的坚忍不拔精神和团结合作精神。黄老师的课程对自己启发颇多,收益匪浅。

1、数学建模与数学实验课程概况

数学建模课程建设的指导思想是将数学建模课程建设与其他工科数学教学改革有机结合;数学建模课程建设与数学建模培训、竞赛有机结合;数学建模课程建设与培养青年教师有机结合;努力将数学建模的思想融入工科数学主干课程中去;以介绍数学建模的一般方法为主线,着重训练学生运用数学工具建立数学模型、应用数学理论方法解决实际问题的能力。

2、数学建模课程的教学内容和方法介绍

数学建模课程努力实现在教学理念上以下四个转变:从以传授知识为主要目标的继承性教育转变到以培养能力素质为主要目标的创新教育;从以教师为中心的注入式教育转变到教师主导作用与学生主体作用相结合的探究式教育;从应试教育转变到素质教育;从传统的教学模式转变到新型教学模式。

实践教学模式应是学生三人为一组集体完成,指导学生开展数学建模课外活动,积极组织学生参加三项数学建模竞赛,组织学生参与校学生创新基金项目活动。教学方法主要采用探究式教学方法、问答式教学方法、研讨式教学方法。

3、基于数据的建模方法

数据作用于模型的形式主要有:建立数学模型的初始研究阶段,对数据的分析有助于寻求变量间的关系;利用数据来估计模型中出现的参数值,称为模型参数估计;利用数据进行模型检验,通常用实际数据与模型运算出的相应理论值进行比较。

总之,数学建模是用数学语言描述实际现象的“翻译”能力;是综合应用已学过的数学知识,对问题进行分析处理的能力;是想象力和洞察力,进而提高学生的综合素质和创新能力。

计算机网络安全性的建模分析 篇6

关键词:计算机网络;安全性;建模

中图分类号:TP393文献标识码:A文章编号:1007-9599 (2013) 06-0000-02

目前Internet、计算机网络的迅速发展,并且得到了广泛的应用,与此同时各种破坏型攻击(比如:黑客入侵、拒绝服务、蠕虫等)也相继出现,并且呈现出日益增多的趋势。这些恶意破坏型攻击行为不但可以窃取各种机密信息,同时也可以对系统和数据进行篡改,最严重的情况,还会导致大规模的网络瘫痪。因此,国内外的相关人员在计算机网络安全研究方面做出了大量的深入性研究,并且把计算机网络与安全相关的系统资源和安全因素抽取出来建立面向安全性的计算机网络模型。主要分析系统设备、访问权限、主题链接关系和弱点,从攻击者的目的出发,做出提升特权的形式化描述。要做到主动发现、定期检查,以防范于未然。

对计算机网络安全的研究已经深入到了计算机科学理论和工程实践的各个领域,主要是为了最大限度的保证系统的安全性。先找出可能存在的漏洞和错误,通过构建模型,进行修复,并且验证其可行性和正确性,之后再将其应用到实际网络中。目前主要的代表性模型有有限状态机模型、存取矩阵模型、信息流模型和Bell-LaPadula模型等。

1计算机网络安全概述

计算机网络安全本质上是指网络中信息的安全,即在计算机网络中流动的数据和在路由器等节点的缓存器保存的数据,不受到破坏,以保持系统的正常运行,努力减少或者避免数据信息被恶意程序更改或者泄露。从宏观角度来看,计算机网络安全研究包括了所有与网络上信息相关的保密性、完整性、可控性以及真实性的理论和技术。

2计算机网络安全保护技术

2.1数据加密技术

按照作用的不同,数据加密技术可分为数据存储加密技术、数据传输加密技术、数据完整性鉴别技术以及密钥的管理技术。其中数据存储加密技术可以防止数据在存储环节丢失;数据传输加密技术则是完成数据在传输过程中数据流加密工作,包括线路加密和端口加密;数据完整性鉴别技术则是对数据处理人输入的身份验证信息与预定的信息进行验证比对,以保证数据的安全;最后是密钥管理技术,它包括密钥的产生、分配、保存、更改和销毁几个阶段,在很多场合都有应用。

2.2防火墙技术

防火墙技术需要事先预定义安全策略,在网络之间通过这些策略对内外网通信实施强制性的访问控制措施,对两个或者多个网络之间的数据包按照这些预定策略进行检查,判断是否允许这些数据通过,并且监视网络的运行状态,以达到保护网络安全的目的。

2.3防病毒技术

防病毒软件是最常使用的防病毒技术,按照不同的划分方式可以包括不同的方面,其中按照应用范围的不同可分为单机防病毒软件和网络防病毒软件。不言而喻,所谓的单机防病毒软件一般都要安装在单机上,采用分析扫描的方式进行病毒检测,包括对本地和对工作站连接的远程资源,找出病毒,并且将其及时消除;显而易见,对于网络防病毒软件则主要侧重于网络方面的防病毒,网络杀毒软件不仅能够检测到网络中出现病毒入侵的现象,还能够检测到病毒通过网络向其他资源进行传播的现象,一旦检测到这两种现象,网络杀毒软件便会立刻将其清除。

2.4入侵检测技术

入侵检测技术在很大程度上可以保证计算机网络系统设计和配置的安全,因为入侵检测技术能够及时发现并且报告系统中被授权和异常现象。对于计算机网络中违反安全策略行为现象的检测,一般都会采用入侵检测技术。

3计算机网络的安全建模分析

3.1计算机网络安全需求建模

计算机网络安全需求是指用户在信息的完整性、机密性以及可用性等各方面上的安全要求。对于计算机网络安全需求,一般都是以安全策略作保证,安全策略可以确定某一个主体是否对另外的某一个客体具有一定的访问权限。安全策略包括有组织自身的特定策略、强制访问控制策略和自主访问控制策略等。可以安全需求看作集合T={t1,t2,t3,……tm},其中ti(i=1,2,……m)分别表示相应的个别策略。

其安全等级可根据系统的机密性、完整性和可用性分为不同的等级。其中机密性等级可分为C1—C8这八个等级,并且这八个等级之间具有一定的独立性和关联性,相互之间又有一定的互补性。这都是因为它们都可以单独用来评价安全质量,互不冲突;同时它们又有各自的侧重点,相互补充,以保证全面的需求;而它们的关联性则体现在它们可以破坏其他安全属性,影响安全属性的系统漏洞。

对于不同的领域,对计算机通信网络系统安全性能的要求也是各不相同。当前,计算机网络中的操作系统软件是主要的对计算机网络安全具有威胁的根源所在,最常见的威胁包括系统漏洞、后门程序和木马程序等。要想找出破坏这种网络安全属性的弱点和这些安全威胁的攻击方法,并且分析当前已存在的攻击方法和导致的后果,都可以采用对网络安全需求类型分析和等级分析。对安全性能最有影响的就是攻击者在目标主机或者网络中具有了最高权限。

3.2系统设备建模

计算机网络由个人计算机、服务器、防火墙、路由器和交换机等组成,并且网络中的主机都有唯一的地址,它们根据不同实体分别可用IP地址、MAC地址、和主机名来进行唯一标记。可以把设备看作一个集合H,那么H={h1,h2,h3,……hm},其中hi(i=1,2,3,……)表示单独的一个实体设备。

网络中需要涉及到的主机属性一般有主机的操作系统类型和对应的版本、主机开放的服务和对应的端口信息、主机的弱点信息等。所以一个主机在网络中可以用(hostid,os,svcs,vuls)来表示,它们依次表示网络中主机的唯一标识符、操作系统类型和版本号、开放的服务列表以及弱点列表。

3.3访问权限建模

按照用户身份角色来分类,访问权限可以分为五个等级:Root、Supuser、User、Guest、Access,各个等级权限的相对应的描述为:一切资源(包括系统设备、系统文件和系统进程等);低于管理员的权限,但它拥有比普通用户更多的权限;任意的一个普通系统用户,拥有特定属于自己的资源;匿名访问计算机系统的来宾,具有User的部分权限;可进行远程网络服务的访问、数据交互、扫描系统的信息等。

3.4主体链接关系建模

目前,计算机网络大多是基于TCP/IP协议来构建的,这个协议族包括很多协议。网络层的协议是网络之间的通信而设计的,网络中的每一个主机都拥有一个唯一的IP地址,通过ICMP协议获取路由、传输时间、和目标可达性等信息。传输层的两个协议TCP和UDP都拥有65535个端口,作为主机间的对话协议。应用层则负责提供各种网络服务,为区别主机间的个性化修改,可以将主机设备在应用层的连接关系描述为TCP(UDP)_端口号_服务类型_应用程序名称。网络主机和设备之间的连接关系集合为Protocol={pro1,pro2,pro3,……prom},其中proi(i=1,2,3,……m)。主机间的连接关系可以用三元组(Hsrc,Hdst,protocols)来表示,其内容分别表示源主机、目标主机和这两者之间的连接关系集合的子集。

神经网络建模 篇7

现代电力系统的谐波问题正随着非线性负荷的广泛使用而日趋严重,为了有效地对谐波进行分析与治理,准确并合理的谐波源模型必不可少[1]。现有的谐波源模型[2]有恒流源模型、基于交叉频率导纳矩阵模型、Norton等效模型、基于最小二乘法的简化模型等。对于铁磁饱和型负荷、电弧型负荷和网络拓扑结构复杂的多个谐波源组合的负荷来说,难以获得其数学模型,因此学者们提出根据实测数据对谐波源建模[3,4]。

神经网络具有强大的非线性映射能力、并行处理和自学习的优点,它不用考虑谐波源内部机理。文献[5]提出用RBF神经网络建立不可控整流桥的稳态频域模型,将谐波负荷功率灵敏度引入潮流计算,提高潮流计算的收敛速度;文献[6]利用广义生长-剪枝RBF神经网络表征相同谐波源的电压-电流特性,建立稳态频域谐波源模型,进一步提高模型精度。非线性负荷在实际运行过程中吸收的谐波电流受其基波电压和基波功率等运行条件的影响,现有方法还未能直接揭示这一特性。本文引入电压运行度Sv和功率负荷度Sp分别表征基波电压和基波功率水平,基于广义回归神经网络采用实测数据建立谐波源的负荷度-电流特性;对网络平滑系数进行优化设计,将最小检测误差对应的平滑系数用于网络训练。以某铸造厂中频炉实测数据为例,结果表明该模型计算值与实测值的误差很小;具有人为确定参数少、训练时间短、所需样本少、精度高等优点,适合一般谐波源的建模。

2 广义回归神经网络

广义回归神经网络(Generalized Regression Neural Network,GRNN)是由Specht在1991年提出的,它是RBF神经网络的一种变化形式。GRNN具有良好的非线性映射能力、建模所需样本少、人为确定参数少的优点,其网络的训练完全取决于数据样本;网络的结构和连接权值由学习样本唯一确定,训练过程只需通过一维寻优来人为确定平滑系数σ,最大程度避免了人为主观因素的影响[7]。

2.1 GRNN网络结构

GRNN仍然采用BP算法对连接权值进行修正,网络隐含层节点采用高斯函数作为基函数,当输入信号靠近基函数的中央范围时,隐含层节点将对输入信号产生局部响应。GRNN包括输入层、模式层、求和层和输出层4层神经元[7,8]。

输入层:神经元数目等于学习样本中输入向量X的维数m,即X中有m个元素。

模式层:神经元数目等于学习样本的数目n,神经元i的传递函数为

求和层:该层中有2种类型的神经元,一种是对所有模式层神经元的输出进行算术求和,模式层各神经元与该神经元的连接权值为1,传递函数为

另一种是对所有模式层神经元的输出进行加权求和,模式层中第i个神经元与求和层中第j个求和神经元之间的连接权值为第i个输出样本Yi中的第j个元素yij,其传递函数为

输出层:神经元数目等于学习样本中输出向量的维数l,各神经元将求和层的两种神经元的输出相除得到网络的输出yj,即

2.2 GRNN平滑系数的优化设计

GRNN的网络训练实际上是确定平滑系数的过程,隐含了网络性能的验证过程,在学习样本中无需另外的验证数据。与BP算法不同,GRNN在训练过程中只需改变平滑系数,从而调整模式层中各神经元的传递函数,以获得最佳的回归估计结果。

本文将平滑系数在区间(0,0.05)内划分成50等分等间隔递增变化,一次性随机抽取10%左右的样本集用于检验,其余的样本用于构建网络,用构建的网络模型计算检测样本的均方根相对误差,称为检测误差E,在此省略了文献[8]中需要循环每一个样本的步骤,提高了平滑系数的寻优效率。

式中,和Yi(X)分别为检测样本的计算值和实测值;n为检测样本个数。

3 基于GRNN的谐波源建模

由于电压运行度Sv和功率负荷度Sp两者之间的不同组合关系对应着谐波负荷不同运行状态,产生的谐波电流也不同。对于单个谐波负荷而言,可以采用负荷电压标幺值和功率标幺值来表示Sv、Sp,即负荷实际基波电压与额定电压之比,实际基波功率与额定功率之比。

然而,当需要对一个谐波负荷群进行建模时,由于各谐波负荷运行状态不同,此时不便于采用电压和功率标幺值来代替Sv、Sp,可以考虑采用各谐波负荷的加权Sv、加权Sp来等效这一谐波负荷群的Sv、Sp,从而反映该谐波负荷群的负荷度-电流特性。

值得注意的是,当不考虑Sv的变化时,可以采用基波电流标幺值代替Sp,但对于电压变化很剧烈的电弧炉这类负荷来说,应该考虑Sv的影响。

文献[9]将谐波源的电压-电流非线性特性统一表述为

式中,为非线性负荷吸收的h次谐波电流向量;为供电电压基波和各次谐波电压向量;C为负荷特征参数集。在实际工程中,C难以确定,因此文献[10]提出了谐波源简化模型,假设C在运行期间内保持不变,不考虑C的影响。

本文提出的基于GRNN的谐波源建模方法采用实测数据作为输入输出变量,根据实测数据的大小和GRNN网络训练的需要决定是否归一化处理。对于不同谐波源,其负荷特征参数C也不同,而Sv、Sp则反映了所有谐波源的共性,因为非线性负荷在实际运行中,其吸收谐波电流的变化受到Sv、Sp的影响,因此对于所有谐波源都可以用Sv、Sp作为谐波负荷特征参数的一个子集,本模型只考虑各次谐波电压、电流幅值,而不考虑它们的相角关系。

综上所述,根据式(7)的关系,考虑Sv、Sp的谐波源模型可表示为

这样,各次谐波电流幅值与各次谐波电压幅值、Sv和Sp的非线性映射关系可以通过对GRNN的训练建立起来。在系统实际运行过程中,基波电压和各次谐波电压幅值的变化范围不会超过系统电压额定值的10%[6];而谐波负荷功率随着运行工况的改变可能大幅度变化。此时,各次谐波电流主要受Sp的影响,根据Sp可以估计出各次谐波电流幅值,式(8)可以简化为式(9)的关系式,用于单独研究Sv、Sp对各次谐波电流幅值的影响。

定义1:用于衡量GRNN学习精度的两个指标[6]:算术平均误差εM AE和均方根误差εRM SE。

式中,Ih^、Ih分别为进行GRNN网络训练时各次谐波电流幅值的计算值和实测值。

4 算例分析

为了验证所提出的基于GRNN的谐波源模型的有效性,采用宜宾某铸造厂的中频炉实测数据进行GRNN网络训练。该中频炉由12脉波整流电源供电,理论上只含有12k±1(k为整数)次的特征谐波,本文考虑1、11、13、23、25次特征谐波电流幅值。中频炉额定功率为6600kW,选取供电变压器一次侧进行实际测量,考虑了谐波电流在变压器中的传播特性。互感器PT为110kV/100V,CT为400A/5A,如图1所示。测量仪器为电能质量分析仪PQPT1000,GRNN编程软件为MATLAB。

测量数据为每分钟一个值,取A相的400个样本,随机抽取350个为训练样本,剩下50个为测试样本。GRNN人为确定的参数只有一个平滑系数σ,使其预测模型能最大限度地避免人为主观假设对预测结果的影响,σ一般小于1,能够更好地拟合数据。为了更好地说明Sv、Sp与各次谐波电流幅值的内在联系,分别对式(8)、式(9)和文献[10]的简化模型进行GRNN网络训练,通过对比来反映Sv、Sp对各次谐波电流幅值的影响,分别按2.2节中的方法确定平滑系数σ为0.021,0.003,0.006,此时的检测误差Emin最小,拟合结果也最满意。

图2显示了中频炉11、13次特征谐波电流幅值(I11、I13)与Sv、Sp之间的相互关系。从2图中可以看出,在中频炉运行过程中,Sv在区间(0.59,0.605)范围内随机波动,它对I11、I13的影响比较小,I11、I13主要受Sp的影响,两者的变化是基本一致的,当Sp增大时,I11、I13随之增大;I23、I25也有类似的关系,由于篇幅有限,在此不再多作说明。

由表1可见,通过三个模型的GRNN训练结果可以很清楚地发现:(1)功率负荷度Sp对各次谐波电流幅值的影响很大,Sp是负荷特征参数的一个很重要的元素,如果没有它,很难确定谐波电流;(2)GRNN网络训练并不是输入参数越多越好,考虑太多影响很小的因素而忽略了影响很大的因素时,可能导致其训练结果误差很大,甚至导致不正确的结果。与文献[6]的GGAP-RBF方法相比,本文方法的训练时间比其缩短两倍左右,GRNN网络训练的平均绝对误差比较大,其原因有:(1)基波电流幅值比其余谐波电流幅值大很多,其误差占了平均绝对误差的绝大部分;(2)本文方法采用的变压器一次侧(110kV)的实测数据比文献[6]方法采用的基于电压、电流三相对称假设条件下的仿真数据随机性和影响因素也更多,对GRNN的训练误差有一定的影响。除此之外,文献[6]方法不能反映谐波源的负荷度-电流特性。

表2显示了在两种不同运行条件下的各次谐波电流幅值估计的结果。通过Sv、Sp对各次谐波电流幅值的预测误差比较小,满足实际工程中谐波源建模的要求,可以根据不同Sv、Sp的组合关系通过GRNN建模方法估计谐波源的各次谐波电流幅值。

5 结论

(1)提出一种基于广义回归神经网络采用实测数据的谐波源建模方法,算例结果验证了模型的正确性和有效性,此方法适用于一般谐波源建模。

(2)引入电压运行度和功率负荷度概念,将谐波源负荷度-电流特性关系通过广义回归神经网络建模,对网络平滑系数进行了优化设计。

(3)研究了谐波源在不同运行条件下的负荷度-电流特性,根据电压运行度和功率负荷度估计各次谐波电流幅值,模型精度能够满足实际工程要求。

摘要:提出了一种基于广义回归神经网络采用实测数据的谐波源建模方法。引入电压运行度和功率负荷度概念,通过广义回归神经网络将它们与各次谐波电流幅值之间的非线性映射关系建立谐波源模型。在该模型中,对网络平滑系数进行了优化设计,将最小检测误差对应的平滑系数用于网络训练;对谐波源在不同运行条件下的负荷度-电流特性进行了研究,根据电压运行度和功率负荷度估计各次谐波电流幅值。以某中频炉实测数据为例,结果表明该模型计算值与实测值的误差很小,具有人为确定参数少、训练时间短、精度高等优点,是一种有效的谐波源建模方法。

关键词:电能质量,谐波源建模,广义回归神经网络,功率负荷度,实测数据

参考文献

[1]肖湘宁(Xiao Xiangning).电能质量分析与控制(A-nalysis and control of power quality)[M].北京:中国电力出版社(Beijing:China Electric Power Press),2004.

[2]郑连清,吴萍,李鹍(Zheng Lianqing,Wu Ping,LiKun).电力系统中谐波源的建模方法(Modeling ap-proaches of harmonic sources in power system)[J].电网技术(Power System Technology),2010,34(8):41-45.

[3]Nassif A B,Yong J,Xu W.Measurement-based ap-proach for constructing harmonic models of electronichome appliances[J].IET Generation,Transmission&Distribution,2010,4(3):363-375.

[4]Mau Teng Au,Jovica V Milanovic.Development of sto-chastic aggregate harmonic load model based on fieldmeasurements[J].IEEE Transactions on Power Delivery,2007,22(1):323-330.

[5]Moreno M A,Usalla J.A new balanced harmonic load flowincluding nonlinear loads modeled with RBF networks[J].IEEE Transactions on Power Delivery,2004,19(2):686-693.

[6]占勇,程浩忠,葛乃成,等(Zhan Yong,Cheng Ha-ozhong,Ge Naicheng,et al.).基于广义生长-剪枝径向基函数神经网络的谐波源建模(Generalized growingand pruning RBF neural network based harmonic sourcemodeling)[J].中国电机工程学报(Proceedings of theCSEE),2005,25(16):42-46.

[7]Donald F Specht.A general regression neural network[J].IEEE Transactions on Networks,1991,2(6):568-576.

[8]陈娇,王永泓,翁史烈(Chen Jiao,Wang Yonghong,Weng Shilie).广义回归神经网络在燃气轮机排气温度传感器故障检测中的应用(Application of general re-gression neural network in fault detection of exhaust tem-perature sensors on gas turbines)[J].中国电机工程学报(Proceeding of the CSEE),2009,29(32):92-97.

[9]Task Force on Harmonics Modeling and Simulation.Mod-eling and simulation of the propagation of harmonics in e-lectric power networks part I:concepts,models,and sim-ulation techniques[J].IEEE Transactions on Power De-livery,1996,11(1):452-465.

神经网络建模 篇8

间隙的存在使副元素在运动过程中发生碰撞分离, 从而引起机构的剧烈震动, 降低了系统的稳定性和精度, 尤其在高速机构的设计中, 这种影响更大。因此, 在机构的分析和设计过程中, 必须考虑间隙对系统的影响。而对于如何比较准确的建立含间隙机构动力学模型进行仿真实验是至关重要的, 国内外许多研究学者在这方面进行了大量的研究工作[1~6]。由于很难确定机构在分离和接触两种状态过渡时的各项运动参数, 故很难建立比较精确的数学模型。为了解决这个问题, 采用神经网络 (Neural Network, NN) 对含间隙机构建模, 它以其特有的学习能力和逼近函数的功能, 使其可以对任何非线性系统进行建模。为了减轻或消除机构运动副间隙所引起的不稳定性, 国内外很多学者从不同的控制方法入手开展了研究工作[7,8], 但仅仅处于初步探索阶段, 只是从理论上用一些被动控制的方法研究了间隙的控制问题, 但研究对象为单杆的简单机构, 或是从优化设计[9,10]的角度出发, 利用优化算法重新分配机构的结构参数, 该方法虽然在一定程度上控制了间隙的不良反应, 但是其改变了机构原有的组成参数, 故有可能恶化机构的其它动态特性。本文针对含间隙连杆机构, 采用BP神经网络离线对含间隙连杆机构进行建模, 并对其建立逆模型;利用神经网络超强的鲁棒性和模糊控制的人性化与智能化, 对含间隙连杆机构间隙产生的误差分别进行了神经网络内模控制和参数自调整模糊控制研究实验, 取得了比较满意的控制结果。

1 建模

1.1 连杆机构实验系统

由于含间隙连杆机构是一个强非线性系统, 系统建模非常复杂, 很难建立比较准确的数学模型。因此, 在建模时通过所测试数据, 采用B P神经网络离线对含间隙连杆机构建模。通过连杆机构实验系统 (The Experimental System of Linkage Mechanism) 获得测试实际数据, 其工作原理为利用连杆机构作往复运动的滑块 (Slider Crank) 推动光电脉冲编码器 (Photoelectric Pulse Encoder) , 通过同步脉冲发生器 (Synchronous Pulse Generator) 输出与滑块位移相当的脉冲信号, 然后输入到机械动态参数测试仪 (Mechanica Dynamic Parameter Tester) , 再经过微处理器进行数据处理, 输出测试数据。

通过试验, 测得连杆机构理想情况下与含间隙时滑块位移对比数据如图1所示。

由图1可知, 由于间隙的存在, 使得系统很不稳定, 连杆机构位移误差如图2所示, 在2rad和4rad以及8rad左右的时候, 误差比较大, 偏差大概在4mm左右, 尤其在不到5rad时位移误差达到了负向最大, 达到4.5mm左右, 对于这种不稳定的系统在系统运行中缺乏可靠性。所以, 为了减少或者消除这种误差给系统带来的不稳定性, 本文采用图3和图4所示的控制模型, 对位移误差进行消除。

1.2 含间隙连杆机构建模

采用神经网络构造含间隙连杆机构的模型。其辨识结构采用串并联的形式, P为系统被控对象, 即连杆机构, P-1 (NN) 是学习被控对象的神经网络模型。由被控对象P的输入u (k) 和输出z (k) 作为P-1 (NN) 神经网络的输入, 通过网络训练不断调整权值, 不断地减小P-1 (NN) 网络模型输出和被控对象P输出z (k) 的差值e (k) , 最终达到P-1 (NN) 对被控对象的模拟。

采用离散型非线性差分方程来描述被控对象P, 如公式 (1) 所示。

式中:f (·) 是未知非线性函数;nz是输出的阶次, nu是输入的阶次。此式说明在k时刻的输出, 取决于过去nz个时刻的输出值以及过去nu个时刻的输入值。

在系统建模时, 被控对象的采集样本集由若干组历史数据{u (k) , z (k) }组成, 对采集数据进行归一化处理, 使u (k) ∈[0, 1], z (k) 由实测的位移信号映射到区间[0, 1]。

下面采用BP神经网络进行控制, 选用三层网络:有1个输入节点、6个隐层节点、1个输出节点, 隐含层采用Tansig函数, 输出层采用Purelin函数作为它们的传递函数。其输出可用公式 (2) - (4) 计算。

式中:z (k) 和u (k) 分别为网络输出、输入;ci (k) 为隐含层各节点输出;1i为输入层到隐含层的连接权值;2i为隐含层到输出层的连接权值。

为了评价BP神经网络的学习状况, 用被控对象输出和网络模型输出的误差平方和 (取L2范数) 为目标函数:

式中:n为样本组数, zm (k) 为被控对象输出, 学习目标是使Jk≤, 为预先设定的一个很小的值。

在BP神经网络中, 误差信号从后向前传递, 在反向传播的过程中, 逐层修改连接权值。由 (5) 式中的Jk计算在误差信号的反向传播过程中各层连接权值的调整, 使网络的输出接近期望的输出。

1) 输入层M上任一节点与隐含层I上任一节点之间连接权值调整为

式中:η为学习因子, 在本系统建模中取0.1。

2) 隐含层I上任一节点与输出层P上任一节点的连接权值调整为

BP神经网络各层间权值的初始值在实际建模中, 是随机给定的, 采用BP算法训练网络, 训练200次左右即可使训练目标误差小于0.001。

1.3 含间隙连杆机构逆模型

从系统求逆理论和高等数学可知, 系统正模型和逆模型的关系可被认为是映射和逆映射的关系。把被控对象的逆状态NN-1模型与被控对象NN串联, 那么, NN-1输入就等于被控对象NN的输出, 即

模型的具体建立过程与其正模型基本一致, 只是将输入和输出调换即可, 所不同的是逆模型中, BP神经网络有4个隐层节点。

2 补偿控制

含间隙系统是一个强非线性系统, 系统及其外部环境具有很多未知和不确定的模糊性因素, 采用经典控制理论和现代控制理论无法得到满意的控制效果。神经网络以生物神经网络为模拟基础, 使人工智能更接近人脑的自组织和并行处理等功能, 具有逼近任意非线性函数的能力, 以及并行分布计算、自学习和容错能力。模糊控制是以模糊逻辑为基础, 抓住人类思维中模糊性的特点, 模仿人的思维方式, 对复杂的非线性、时变系统实施控制, 具有鲁棒性强, 以语言变量代替常规的数学变量等特点。下面分别采用神经网络内模控制和参数自调整模糊控制对系统误差进行控制。

2.1 神经网络内模控制

采用神经网络内模控制模型[11]来控制含间隙连杆机构的误差。基于NN的内模控制结构如图3所示。

在NN内模控制结构中, 采用神经网络模型 (NNM) 来模拟系统的特性, 用模型的逆模型即NN-1作为NNC, 附加外部随机干扰信号d到Slider Crank系统, 将对象与模型的误差f (28) y-y'反馈到参考输入r, 构成闭环系统。如果神经网络模型 (NNM) 能够准确的表达对象Slider Crank的输入输出关系, 反馈信号f=0, 系统为开环 (y (28) r) , 是直接逆控制。若由于模型不准确以及干扰等原因, yy', 则由于负反馈的作用, 仍可使y接近r。

神经网络内模控制系统误差如图5所示。分析比较图2和图3可以明显看到, 采用神经网络内模控制, 使系统误差减小, 并且误差稳定在一定的区间范围, 最大位移误差从4mm左右减小到2.7mm, 使系统控制精度大大提高。因此, 神经网络内模控制具有很强的鲁棒性, 是一种较好的控制方案。

2.2 参数自调整模糊控制

采用参数自调整模糊控制来控制含间隙连杆机构的误差。模糊控制器采用Mamdani算法, 输入为滑块位移的偏差E和偏差变化率EC, 输出为曲柄速度V, 描述输入/控制量的语言值模糊子集选取为:{NB, NS, ZO, PS, PB}, 其中:NB=负大;NS=负小;ZO=零;PS=正小;PB=正大。

对n维输入状态xl, x2, …, xn, 根据模糊控制规则“Rm:if xl is A1m and x2 is A2m…and xn is Anm then Um is Bm”, 那么, 第i条规则模糊输出隶属度为:

以重心法解模糊, 则模糊系统的输入、输出关系为:

由上式可见, 模糊控制器的输出U由隶属函数的参数ai、bi、ci和输入状态x1、x2、…、xn共同决定, 因后者是由外部环境所决定, 故模糊控制器的输出主要取决于隶属函数。

含间隙连杆机构的隶属函数选用三角函数trimf, 滑块位移的隶属函数取值范围取-2~2;滑块位移变化率的隶属函数取值范围取-100~100;曲柄速度的隶属函数取值范围取8.5~8.9。再根据给出的隶属函数编出模糊规则, 建立模糊控制器。

常规模糊控制器的量化因子Ke、Kec和比例因子Ku是固定不变的, 不能很好地满足系统的静态和动态性能要求, 难以保证被控过程的全过程都处于最佳控制状态。因此, 采用参数自调整模糊控制[12]方式, 根据误差和误差变化率的大小, 控制器自动选取不同的参数值, 在线调整Ke、Kec、Ku, 以满足系统的性能要求。参数自调整模糊控制系统结构如图4所示, 图中的“Parameter Regulation System”模块, 通过“If-else”选择语句编程来实现参数Ke、Kec、Ku自调整。

参数自调整模糊控制系统误差如图5所示。仿真结果表明, 采用参数自调整模糊控制, 进一步提高了系统的稳定性和控制精度, 最大位移误差从2.7mm减小到1mm以下。

3 结论

本文提出了采用神经网络对含间隙连杆机构建立模型和其逆模型的方法, 并对含间隙连杆机构间隙产生的误差进行了两种非线性控制研究。通过图2与图5比较得知, 采用神经网络内模控制, 系统最大误差从4mm左右减小到2.7mm;采用参数自调整模糊控制, 最大位移输出误差减小到1mm以下, 控制精度有明显的提高。实验结果表明, 采用神经网络内模控制、参数自调整模糊控制来控制含间隙连杆机构系统误差, 控制效果明显。

摘要:由于含间隙机构是一个强非线性系统, 很难建立比较准确的数学模型, 采用传统控制方法难以获得理想的控制效果。本文针对上述问题, 以含间隙连杆机构为例, 根据实验样本数据, 运用BP神经网络离线建模, 并对含间隙机构分别运用神经网络内模控制和参数自调整模糊控制, 以减小间隙带来的非线性误差。实验结果表明, 运用智能控制技术, 系统稳定性得到明显改善, 有效地减小了系统误差。

关键词:间隙,连杆机构,神经网络,模糊控制,鲁棒性

参考文献

[1]Dubowsky S, Gardner T N.Dynamic interactions of link elasticity and clearance connections in planar mechanical systems[J].Journal of Engineering for Industry, 1975, 97B (2) :652-661.J.Clerk Maxwell, A Treatise on Electricity and Magnetism, 3rd ed., Oxford:Clarendon, 18 9 (2) :68–73.

[2]Earles SW E, Wu C L S.Motion analysis of a rigid-link mechanism with clearance at a bearing, using lagrangian mechanism and digital computation[R].Conference onMec hanisms, IME, London, England, 1972:83—89.

[3]Seneviratne L D, Earles SW E.Chaotic Behaviour Exhibited During Contact Loss in a Clearance Joint of a Four-bar Mechanism[J].Mechanism and Machine Theory, 1992, 27 (3) :307—321.

[4]Mansour W M, TownsendM A.Impact Spectra and Intensities for High-speed Mechanisms[J].Trans.ASMEJournal of Engineering for Industry, 1975, 97B (2) :347-353.

[5]Li Z, Li L, Bai S X.A New method of predicting the occurrence of contact loss between pairing elements in plannar linkages with clearance[J].Mech.Mach.Theory, 1992, 27 (3) :295-301.

[6]王国庆, 刘宏昭, 何长安.含间隙连杆机构非线性行为研究[J].机械设计, 2005, 22 (3) :12-13.

[7]Tzou H S.Dynamic evaluation and passive control of design to tolerance between machine elements, In:Tipins V A, Patton E M.Computers in Engineering1988, New York:ASME, 1988.585-591.

[8]Ashwath N, Paul F W.Computer control compensation for mechanical clearance in hydraulic robot joint s e r v o m e c h a n i s m s, I n:P a u l F W, Y o u c e f2t o u m i K.R o b o t i c s:T h e o r y a n d A p p l i c a t i o n s, N e w York:ASME, 1986.129-134.

[9]Feng Bin, Morita, Nobuyoshi, Torii, Takao.Optimization of joint force on planar linkage, Transactions of the Japan Society of Mechanical Engineers, Part C, 1995, 61:2725-2729.

[10]李哲.考虑运动副间隙和构件弹性的平面连杆机构动力学研究[D].北京:北京工业大学, 1991.

[11]丛爽.神经网络、模糊系统及其在运动控制中的应用[M].合肥:中国科技大学出版社, 2001.

神经网络建模 篇9

当前,小微企业在我国建设创新型国家和实现充分就业方面发挥着越来越重要的作用,但其量大面广,给税收征缴工作带来了很大的难度,建立实用性强和可靠的纳税评估模型,既能帮助企业提高涉税风险防控能力、促进其健康发展,又能帮助税务部门足额征收税款。因此,越来越受到政府有关部门和学界的关注。1991 年,Feinstein采用判别分析(MDA)模型和Tobit模型研究企业偷逃税问题[1],Joulfaian(2000)从管理人员偏好角度建立了预测企业偷逃税额的Tobit模型[2]。李选举(1998)也用MDA模型和Tobit模型研究企业偷逃税现象和税额[3];楼文高等(2013)概述了国内纳税评估(税务稽查选案)的主要研究方法[4]。由于神经网络(NN)等新兴数据挖掘技术以及与传统统计方法的组合模型具有很强的逼近能力,已成为纳税评估研究的重要方法,如BP神经网络(BPNN)模型[5,6,7,8]和广义回归神经网络(GRNN)模型[4],K均值(K-means)与概率神经网络(PNN)模型[9]、支持向量机(SVM)与自组织神经网络(SOM)模型[10]、MDA与SOM模型[11]、PCA与BPNN模型[12]等。

传统统计方法主要适用于对服从正态分布规律数据的建模,否则,就不能保证建立模型的有效性和可靠性,而NN等新兴数据挖掘技术可用于不服从正态分布规律数据的建模[13,14,15]。SOM、PNN以及采用多个输出节点的BPNN模型,只能用于分类研究(通常也很难进行可靠分类),即只能判定企业或个人(统称为纳税人)为诚实纳税(或税收遵从)和非诚实纳税(或税收不遵从)两种情况。事实上,对税务部门和纳税人来讲,不仅需要判定纳税人是否做到了诚实纳税,更需要研究纳税人(不)诚实纳税的概率到底有多大。因此,NN模型采用一维连续实数函数的输出形式是最理想的。

马庆国等(2002)[5]、李蓓丽(2004)[7]、蔡伟鸿和郭陈熹(2008)[8]、周伍阳(2005)[12]和Lin等(2012)[6]采用BPNN模型进行了纳税评估的探索性研究,但他们在建模训练时都没有采用检验样本实时监控训练过程。事实上,BPNN建模存在的最大问题就是在训练过程中很容易发生“过训练”现象,而发生了“过训练”现象的BPNN模型没有泛化能力,也就没有任何实用价值。因此,BPNN建模训练时必须采用检验样本实时监控训练过程,以避免发生“过训练”现象或取发生“过训练”现象前的权重,否则,如果发生了“过训练”现象,即使训练样本误差很小,或者即使个别测试样本的误差也很小,建立的BPNN模型也没有泛化能力和实用价值[13,14]。因此,读者(包括原文作者)无法判断上述文献在应用BPNN进行建模时,训练过程是否发生了“过训练”现象,即无法判定上述BPNN模型是否具有泛化能力和实用价值。楼文高等[4]讨论了很小样本条件下采用多重交叉检验法进行GRNN建模的问题,但如何删除冗余(不重要)指标,以及充分利用样本数据的特性,把样本分成性质相似、按照一定比例配置的训练样本、检验样本和测试样本等三类样本,建立更加简洁、可靠和实用的GRNN模型等问题,还有待进一步深入探讨和研究。

与其他NN模型相比,GRNN模型具有结构简单、逼近能力强等特点,尤其适用于小样本、稀疏数据系统的非线性建模[13,14,15]。因此,本文将GRNN模型引入到上海某区木制家具制造企业的纳税评估研究中,以期获得更加可靠和实用的评估模型。作为对比,也建立了多元线性回归(MLR)、MDA、Logistic和SVM模型。对不同模型结果的比较表明:GRNN模型的分类错误率最低,检验样本和测试样本的I类和II类分类错误率分别低于2.0%和5.4%,平均分类错误率低于2.5%,应优先用于纳税评估的研究和实践中。

2 企业纳税评估GRNN模型的建立

2.1 实证分析数据和纳税评估指标体系

以上海某区税务局管辖的木制家具制造企业增值税纳税情况为例进行建模研究。该区木制家具制造企业共有2000多家,考虑到数据的真实可靠性,我们选取一般纳税人作为研究对象。在2010~2012年度有较完整财务数据和增值税纳税申报数据的正常经营企业只有786 家(次),其中2010年、2011年和2012年分别为272家、332家和182 家,成立时间最短的只有1 年多,最长的为16年。在对比研究和参考现有文献纳税评估指标体系的基础上,从现有企业财务数据和增值税纳税申报表可获得数据的视角出发,建立了由15个指标组成的企业增值税纳税评估指标体系,具体指标为:全部收入税负率(x1)、成本费用税负率(x2)、销售毛利率(x3)、成本费用利润率(x4)、销售利润率(x5)、总资产收益率(x6)、销售费用率(x7)、管理费用率(x8)、财务费用率(x9)、流动资产周转率(x10)、总资产周转率(x11)、流动比率(x12)、速动比率(x13)、现金比率(x14)和资产负债率(x15)。课题组删除了有部分数据缺失的61家企业,有完整数据支撑的企业725家。课题组邀请多位具有丰富管理经验的同志和税务学方面的专家,对上述725家企业的增值税纳税情况进行甄别,判定属于诚实纳税的企业211家,属于不诚实纳税的企业175家,另有339家企业的纳税情况较难判定,希望借助本课题组完成的模型进行辅助判断。

2.2 GRNN模型原理简介

Specht于1991年提出的基于非线性回归理论的前馈型GRNN模型,具有很强的非线性逼近能力、容错性和鲁棒性,与其他NN模型不同,尤其适用于小样本、稀疏数据的建模,在训练过程中也不会发生“过训练”现象,建模时只需确定一个合理的参数值———光滑因子值,可最大程度避免人为因素的影响,在不服从正态分布的贫数据或者稀疏数据领域获得了广泛的应用[13,14,15]。 如图1 所示的GRNN模型由输入层、模式层、求和层和输出层构成,输入层节点个数等于评价指标个数,实现输入向量的转置;模式层节点个数一般等于或者稍少于训练样本个数,实现高斯径向基函数变换;求和层一般有两个节点,实现模式层函数值与权重的点积;输出层一般只有一个节点,用实数表示,则GRNN模型的输出值可表示为:

其中,Di=(X-Xi)T(X-Xi)= ‖X-Xi‖,Xi和Yi为第i个训练样本的输入值和期望输出值,σ为光滑因子,其合理值可以通过采用逐步增加或者减小其值,并根据非训练样本均方根误差的变化情况来确定。

2.3 部分指标数据的修正和预处理

GRNN模型虽然可处理不服从正态分布的数据,但如果存在明显差错以及太异常、太离群的数据也必将降低模型的可靠性和实用性,如流动比率指标(x12)的最大值为170000,而其次小值为3200,然后为2500、670 和550等,显然,如果不修正其最大的3~4个值,除了最大值外,其他样本的归一化值都将几乎等于0,这将大大降低该评价指标的区分度和重要性;同理,成本费用利润率指标(x4)的最大值为126.75,其次小值为1.827,然后依次为0.772和0.738等,也必须修正其最大值和次大值。还有部分指标的数据也存在相似情况,也需要修正。而且,为了消除各指标量纲不同对建模结果的不利影响,应对各评价指标的数据进行线性归一化预处理,转化为[0,1]区间内的值。考虑分类要求的对称性,笔者设定诚实纳税和非诚实纳税样本的模型期望值分别为-1和1。

2.4 建立纳税评估GRNN模型

(1)筛选出纳税评估的重要评价指标作为GRNN模型的输入指标

一般由纳税评估领域的专家选取初步的评价指标及收集样本数据,也就是说,选取哪些评价指标主要取决于专家的知识水平和喜好,专家们往往会选取尽可能多的评价指标,以期提高预测精度,但大量研究表明,如果模型中包含不重要的(或者称为不相关的)指标,不仅不能提高模型的精度(性能),反而会降低模型的精度,并无谓增加建模和收集样本数据的成本,也会增加发生“过训练”的几率,可以说是有害无益[13,16,17,18]。因此,国外众多学者已将采用合适的方法筛选出重要评价指标的内容作为NN建模的重要步骤(国内学者不重视这个步骤)来研究,并提出了自组织神经网络(SOM)、遗传算法(GA)和指标灵敏度分析(SAM)等方法[13,16,17]。笔者选用简单、有效的SAM方法来筛选重要评价指标,即将全部样本都作为训练样本,从大到小改变光滑因子σ值,考察删除各个评价指标后GRNN模型均方根误差(RMSE)的变化情况,引起RMSE变化最小的评价指标的灵敏度最低,或者说其对提高模型精度贡献最小。一般说,删除指标后模型RMSE增大小于5%的指标是非重要指标,可以删除[13]。为了消除各评价指标之间相关性的影响,每次只能删除灵敏度最低的一个指标,然后重新建模,如此反复进行,直至所有评价指标都是重要的为止。针对本例数据,在σ = 0.05~1.5范围内,笔者调用Statsoft公司出品的商品化软件STATISTICA Neural Network(以下简称STNN)软件[13]进行试验,首先是指标x13的RMSE变化率最小(小于1%),可以删除;再对剩余的14个指标进行建模,指标x8的RMSE变化率也小于3% 而删除,继续进行建模试验,还可以删除指标x9、x12和x14,至此,所有指标的RMSE变化率都大于5%,即课题组从15 个指标中筛选出了对纳税评估有重要影响的10个评价指标。

(2)把样本数据进行合理分组,以提高GRNN模型的泛化能力和鲁棒性

因为NN模型具有很好的非线性逼近能力,根据存在性定理,理论上总存在使误差变得足够小(非常接近于0)的模型,但是,如果在建模过程中发生了“过训练”现象,即使误差再小,这个模型也没有泛化能力和实用价值。因此,国外学者十分重视(国内学者不太重视)在NN建模时确保不发生“过训练”现象,必定会用不同于训练样本的检验样本判断建模过程是否发生“过训练”现象,并用测试样本评定NN模型的性能。因此,如果样本数量足够多,无论采用什么方法、进行怎样的分组都能确保训练样本、检验样本和测试样本(简称为三类样本)具有相似(同)的性质(尽管每组数据都可能不同),即他们的均值和标准差相差不大(比较接近)。但如果样本数量不是很多,如果分组不合理,这三类样本的性质就可能相差很大,如果出现这种情况,就不可能建立可靠的NN模型。研究表明[18]:在测试样本占总样本数量20%(或以上)、检验样本占总样本数量24%(或以上)时,在样本分组较合理的情况下,如果训练时没有发生“过训练”现象,建模通常能取得较理想的效果,模型也具有较好的泛化能力。因此,国外文献很早就开始研究如何确保分组样本具有相似性质的方法,通常用随机选择法(Random sampling method,RSM)、SOM、GA和模糊聚类(FC)等方法,其中SOM和FC方法效果较好,又便于实现,在样本数量不是很多的情况下,SOM方法往往能取得较理想的效果,为此,本文选用SOM方法进行样本分组。笔者对本例数据调用STNN软件,取SOM程序的默认参数,即输出层取49个(7×7)节点,学习率为0.05,邻域节点取一个(neighborhood=1),随机选取样本进行训练并交叉验证,对诚实纳税样本和非诚实纳税样本分别进行SOM分析,样本分组的基本原则为:①如果某个节点上只有一组样本,说明其与其他样本相差较大,则归入训练样本;②如果某节点上有两组样本,则一组归入训练样本,一组归入检验样本;③如果某节点上有三组样本,则训练样本、检验样本和测试样本各一组;④如果有四组样本,则训练样本两组,检验样本和测试样本各一组;⑤如果有五组样本,则训练样本三组,检验样本和测试样本各一组;⑥如果有六组样本,则参照一组样本和五组样本的情况,其他情况以此类推。而且,NN模型的内插性能要好于外插性能[13,18],即要求训练样本必须包含每个指标的最大值和最小值(包括诚实纳税和非诚实纳税两种情况),对于本例,计有11个诚实税收样本和10个非诚实纳税样本。笔者仔细审核非诚实纳税的训练样本数据时发现了两个异常数据样本:资产负债率较大的企业几乎都是诚实纳税的,但其值最大和第三大的企业却存在逃税现象,这样的异常数据样本可能会扭曲资产负债率对纳税情况(在最大值附近区域)的影响(下文研究表明确实存在这种扭曲现象)。因此,作为对比,笔者分别建立了包括和删除这两个异常数据样本的GRNN模型。根据上述SOM分析结果及其分组原则和内插建模要求,得到了具有相似性质的训练样本、检验样本和测试样本,其特征值(均值和标准差)如表1所示。

注:“-1”和“-2”分别表示诚实纳税和非诚实纳税样本,Tr、Ver和Te分别指训练样本、检验样本和测试样本;诚实纳税样本211个,Tr、Ver和Te分别为117、50和44个,非诚实纳税样本175个,Tr、Ver和Te分别为95、43和37个,测试样本占比21.0%,检验样本占比24.4%.

从表1可以看出,三类样本棍评价指标均值和标准差的一致性均较好,表明采用SOM方法的分组结果是比较合理和可靠的。

(3)确定合理的光滑因子σ值

一般地,光滑因子σ值逐步减小时,训练样本RMSE值也必定逐渐减小,当σ 值足够小时(本例取σ ≤ 0.012时),训练样本RMSE值将趋于0,而检验样本和测试样本RMSE值开始时也逐渐减小,但当σ值小于某个合理值后,其RMSE值就会在降至最小值后出现增大趋势,如图2所示,检验样本和测试样本RMSE在σ=0.06~0.065时取得最小值。因此,根据选取σ 合理值的原则,笔者取σ的合理值为0.065。

(4)建立GRNN模型及其计算结果

笔者采用StatSoft公司出品的STNN软件[13]进行建模,设置光滑因子值σ=0.065,计算得到的训练样本、检验样本和测试样本的I类和II类识别错误率如表2所示(I类错误率是指GRNN模型把诚实纳税样本判定为非诚实纳税样本的百分率,反之为II类错误率)。同时,根据建立的GRNN模型,还可以得到各个评价指标与GRNN模型输出值之间的非线性关系,如图3所示是指标x6与模型输出值(归一化值)之间的关系(其他指标取均值,下同),还可以同时改变两个指标的值,得到评价指标与GRNN模型输出值(归一化值)之间的三维关系图,如图4所示是x4和x6两个指标与模型输出值之间的三维关系图。

3 讨论与分析

3.1 GRNN建模结果及其判定样本的属性

每个样本GRNN模型的输出结果都是一个实数,因此,还必须采用一定的规则来判定该结果(实数)究竟属于诚实纳税还是非诚实纳税。如果所有诚实纳税样本的计算结果基本服从(右半支)正态分布N(μ1,σ1),所有非诚实纳税样本的结果服从(左半支)正态分布N(μ2,σ2),则区分诚实纳税和非诚实纳税样本的分界值μF为[19]:

其中,μ1、μ2分别为诚实纳税和非诚实纳税样本的均值,σ1、σ2分别为他们的标准差。

因此,从分界值的意义我们可以得到判定准则:① 如果某样本的模型输出值等于分界值μF,则该样本属于诚实纳税或非诚实纳税的概率均为50% ;②如果某个样本的模型输出值小于上述分界值μF,则就可判定该样本是诚实纳税的,离分界值越远,诚实纳税的概率就越大,反之,就判定模型输出值大于分界值μF的样本是非诚实纳税的,输出值越大,非诚实纳税的概率就越大。根据这个判定准则,在本例研究的211 个诚实纳税样本中,117 个训练样本GRNN模型的识别结果全部正确,在50个检验样本中,有一个样本被判定为非诚实纳税,44个测试样本的识别结果也全部正确;在173个(删除了两个异常样本)非诚实纳税样本中,103个训练样本全部正确识别,43个检验样本中有2个被GRNN模型错误地判定为诚实纳税样本,37个测试样本中也有2个样本被GRNN模型错误地判定为诚实纳税样本。

事实上,对模型输出值接近于分界值的样本,可以将其作为纳税可疑企业,请税务专家再对其进行仔细、全面的审核和甄别。对上述那些被错分的企业,必须进行全面的会计审核。如果模型判定结果是正确的,则调整样本重新建模,这样就更有利于提高模型的可靠性和实用性。

3.2 关于建模方式

在样本数量不是很多的情况下,为确保模型的泛化能力,不少文献建议采用多重交叉检验法,可以在一定程度上抵消由于分类样本(训练样本、检验样本和测试样本三类)性质不相似对建模结果的影响。但在多重模型中,通常情况下,有些模型的训练样本精度较低,其他模型则可能是检验样本或者测试样本的精度较低,因此,无法直接判断模型的精度和有效性,一般都用多重模型的均值来表示模型的精度和可靠性,体现的是平均效应作用。同时,采用多重交叉检验法建模还存在另一个突出问题,即对一个未知的新样本,根据多重交叉检验法模型可能得到完全不同的多种结果,如五重交叉检验法至少有五个模型,可能的结果是:三个模型的判定结果为诚实纳税,另二个模型的判定结果为非诚实纳税,哪我们究竟如何判定该样本的最终属性呢?此外,多重交叉检验法建模很繁琐。

本文采用了被国外学者广泛采用的样本合理分组建模方法,即首先把样本分成按一定比例配置、性质相似的三类样本,再进行建模的方法。与多重交叉检验法建模过程相比,样本合理分组建模法不仅建模过程可大大简化,而且建模效果也很好。本例研究也表明,这种方法建立的GRNN模型具有很高的识别正确率,正确率达95%以上,要高于采用多重交叉检验法建立的GRNN模型的识别正确率(笔者也建立了相应的多重模型);而且,对新样本属性的判定比较简捷,只需把归一化的数据输入已建立的GRNN模型,如果模型输出值小于分界值μF,就可以判定该样本为诚实纳税样本,否则就判定其为非诚实纳税样本。

3.3 关于GRNN模型的泛化能力

与其他NN模型相比,建立GRNN模型只需要确定一个合理参数———光滑因子值σ,而且必定存在适度值,σ值取得较大,模型泛化能力较好,但拟合能力会变差,即训练样本的精度较低,反之,训练样本精度可以达到很高,而模型的泛化能力较差,即非训练样本的误差很大。本例数据研究表明:光滑因子值σ在0.06~0.065是合理的,检验样本与测试样本的RMSE、AAE和相关系数都比较接近,I类和II类识别错误率也相差不大,说明建立的GRNN模型具有较好的泛化能力和鲁棒性。

3.4 异常数据样本对GRNN建模结果的影响

事实上,如果存在异常数据的样本,通常都会对建模结果产生或多或少的影响。本文以删除上述两个异常数据样本前后的建模结果为例加以研究对比。图5所示是删除两个异常数据样本前后评价指标x10与GRNN模型输出值之间的关系示意图。

从图中可以看出,两个异常数据样本(x10接近1 时的两个非诚实纳税样本)严重扭曲了x10大于0.85区域的分布规律,但对其他区域的影响则不太明显。研究还表明,这两个异常数据样本对其他指标分布规律的影响不太明显。同理,笔者也研究了这两个异常数据样本对Logis-tic建模结果的影响,也列于图5 中,显然,异常数据样本对Logistic建模结果虽然不会产生严重的扭曲,但也会产生比较大的影响,而且影响区域比较宽。

3.5 与其他模型计算结果的对比分析

根据上述合理分组的三类样本数据,笔者应用SPSS和DPS软件[20]分别采用MDA、MLR、Logistic、SVM(参数为系统默认值,下同)方法进行建模,其I类、II类和平均分类错误率也列于表2中。

从表2可以看出,GRNN模型的分类错误率最低,MDA和SVM模型的分类错误率大于10%,Logistic模型和MLR模型的分类错误率分别为5.98%和8%。另一方面,从原理上来讲,这些传统统计模型只适合于服从正态分布规律数据的建模,显然,本文的各个评价指标数据不服从正态分布规律。因此,虽然这些模型的分类错误率也不是太高,但原理上无法保证其可靠性和有效性,是否能用于实际企业纳税情况的判定,还有待于进一步研究分析。

从图3、图4、图5可以看出,GRNN模型揭示出了各个评价指标与模型输出值之间存在的复杂相关关系,通常不能用简单的显性函数来表示,而MLR和MDA模型只能表示各个评价指标与模型输出值之间的线性关系(显性函数关系),Logistic模型只能表示各个评价指标与模型输出值之间的“S”型关系(图5所示)。因此,不论这些传统统计模型的精度如何,他们都无法刻画出具有适度值的(如图5所示)评价指标x10与模型输出值之间的复杂关系。

此外,BPNN建模过程涉及需选取如合理的隐层节点数等多个参数,并需要判断训练过程是否发生或者何时发生“过训练”现象等,建模过程十分繁琐,即使根据相同的数据,不同的学者(即使同一学者)也不可能建立完全相同的模型,其结果的稳定性和可比性相对较差,因此,本文不再对其进行比较研究。

3.6 其他339家木制家具制造企业纳税情况的判定

根据前述,另有339家企业的纳税情况有待判定。把上述339家企业的10个指标数据进行归一化处理,并导入上述建立的GRNN模型,就得到了339 家企业的模型输出值,其中188家企业的模型输出值小于分界值μF(-0.4142),被判定为诚实纳税企业,另外151家企业的模型输出值大于分界值μF,被判定为非诚实纳税企业,建议税务专家对这151家企业的财务数据和申报数据再次进行审核和分析。为了进一步研究诚实纳税样本和非诚实纳税样本的特性,表3列出了用于建模的全部386个样本、诚实纳税样本和非诚实纳税样本的各个评价指标的均值和标准差。作为对比,也计算得到了339个待判定样本各个评价指标的均值和标准差(用*表示)以及被GRNN模型判定为诚实纳税与非诚实纳税企业的各个评价指标的均值和标准差(也列于表3中)。从表3可以看出:①待判定的339个样本各个评价指标的均值和标准差与386个建模样本的各个评价指标的均值和标准差非常接近,因此,基本可以确定,339 个待判定样本中既有诚实纳税企业,又有非诚实纳税企业;②339家企业中,被判定为诚实纳税的188家企业与建模样本中诚实纳税样本的数据性质是基本一致的,即他们的均值和标准差都很接近;③被判定为非诚实纳税的151家企业与建模样本中非诚实纳税样本的数据性质也很相近。从这些样本数据性质的对比中可以得出明确的结论:本文建立的GRNN模型具有很好的鲁棒性和泛化能力,可用于企业实际纳税情况的判定。

4 结语

根据上海市某区386家木制家具制造企业财务指标和纳税申报的15个评价指标数据,采用灵敏度分析方法,从15个指标中筛选出对企业纳税情况具有显著影响的10个指标,并采用SOM方法,把所有样本分成既符合得到较好泛化能力的配置比例要求、又具有相似性质的训练样本、检验样本和测试样本,以确保建立GRNN模型的泛化能力,剔除了两个数据异常的样本。用逐步减小光滑因子值同时考察非训练样本(检验样本和测试样本)RMSE值变化情况的方法,确定了GRNN模型合理的光滑因子值,从而建立了可用于判断企业纳税情况的GRNN模型。共有训练样本210个、检验样本93个和测试样本81个,检验样本和测试样本的识别正确率都达到了95%,说明建立的GRNN模型具有很高的精度、较好的泛化能力和可靠性,可用于实际企业纳税情况的判定。由于采用多重交叉检验法建模不仅繁琐,且后续使用不太方便,多重模型可能出现相互矛盾的判定结果。本文基于合理分组样本建立的GRNN模型的识别正确率要高于采用多重交叉检验法建立模型的识别正确率。

针对上述三类分组样本,本文应用MLR、MDA、Logistic和SVM方法,建立了相应的模型,总体上看,这些模型的识别正确率都要低于GRNN模型,而且,从原理上讲,无法保证这些根据不服从正态分布规律的数据建立的传统统计模型的可靠性和有效性。

神经网络建模 篇10

关键词:电力系统,短期负荷预测,BP神经网络,样本数据,Matlab

1 引言

短期负荷预测作为电网规划及经济调度重要的基础性经济信息, 对电力企业许多部门工作的高效稳定开展有着重要的作用, 尤其对于电力需求量评估管理、实时电能营销管理、检修维护计划制定和峰谷电价施行等诸多方面均具有较为深远的影响。基于BP神经网络的电力系统短期负荷预测模型是神经网络自适应训练学习与Matlab强大非线性多元参数矩阵数据一致逼近处理相结合的混合负荷预测模型, 能够通过神经网络模型内部层间及层层间神经元“权值”和“阈值”的自动学习优化获得准确度较高的可信负荷预测数据, 具有模型层次结构清晰、参数优化性能较强、应用较为简便、对动态波动负荷特性描述能力较强等优点。

2 BP神经网络

BP神经网络是一个包含输入层、隐含层、输出层三层结构的多层前馈性神经网络, 其算法严格遵循“误差反向传播”推理, 按照“梯度最速下降法”运算原则, 不断调整各层神经元间的内部约束权值, 以期通过网络自优化达到目标数据与期望数据的误差均方值最小, 实现误差一致目的。三层标准BP神经网络拓扑结构如图1所示。

神经元间的连接约束权值δ包括隐含层与输出层神经元间的连接权vjk和输入层与隐含层神经元间的连接权wjk两大类, 即:

隐含层与输出层神经元间的连接权v:

输入层与隐含层神经元间的连接权W:

3 短期负荷预测BP神经网络模型

为提高电网系统调度部门机组优化组合、检修计划决策、最优潮流运算等工作的效率和质量水平, 将具有多元参数非线性矩阵数据函数映射一致逼近功能的BP神经网络算法引入到短期负荷预测中, 结合电网系统历史运行负荷波动样本数据, 利用计算机高速运算分析进行归一化统计处理功能, 建立具有“自适应、自学习、自优化”性能的多元输入单输出的三层四功能BP神经网络短期负荷自动预测模型, 其逻辑组成如图2所示。

4 样本数据中异点剔除处理

短期负荷预测具有较为明显的周期波动特性, 因此, 在进行历史负荷波动样本数据处理过程中, 将负荷序列按照一天24小时定义为x (i, n) (i为0~23时刻的任一时刻;n为第i时刻的负荷数据) ;将一个负荷预测周期内的第N天的负荷数据定义为N=1, 2, …, N (N取≤7的整数) 。按照BP神经网络“梯度最速下降法”运算原则, 采用负荷均值E (i) 和相应方差值求出一个预测周期内N天负荷的均值E (i) 及方差值V (i) , 其具体表达式为:

由于负荷存在一定波动特性, 假定负荷的变异率 (即预测值与实际值间的偏移率) 为:

假定负荷预测模型中变异率的允许值为θ, 则变异点判断逻辑为:

若ρ (i, n) ≥θ, 则认为该负荷点为变异点;

若ρ (i, n) ≤θ, 则认为该负荷点为正常点。

在实际模型参数优化过程中, 可通过调整负荷变异率θ的大小, 来调整神经网络对历史负荷样本数据优化学习的准确可靠性。经多次模型参数优化比较分析, 选择θ=1, 1与实际负荷波动较为匹配, 相应获得的负荷数据曲线光滑度较好。

5 仿真实例

利用历史运行负荷数据对模型进行自适应优化调整学习训练后, 为验证BP神经网络在电力系统短期负荷预测中的可信度和准确度, 采用Matlab自带的Simulink神经网络工具箱编写三层四功能单元的电力系统BP神经网络短期负荷预测结构程序, 具体如图3所示。

5.1 模型参数设置

结合负荷预测的实际经验, 将预测日日期类型, 预测日气象中最高、最低、平均气温, 以及预测日24小时内各时刻实时历史负荷数据等信息干预项分别用[R]、[TmaxTminTav]及[L (h) ]矩阵形式表示;与预测日性能相似的相似日外部相关干预项用[R′]、[T′maxT′minT′av]及[L′ (h) ]矩阵形式进行表示。在输入层神经元中采用样本数据矩阵P=[R′T′max T′minT′av]作为BP网络中神经元自动优化“学习”训练的基准约束权值当量;以T=[L′ (h) ]作为BP神经网络网络模型输出误差e对应的误差率ev的比对当量。利用Matlab软件中自带的Simulink神经网络工具箱, 按照BP推理原则, 选择函数trianlm () 对Matlab三层四功能单元的BP神经短期负荷预测模型进行内部学习训练。BP神经网络模型参数设置部分主要程序为:

5.2 仿真结果分析

在对BP神经网络模型进行初始值设置后, 以电力系统中某条线路1年的历史负荷波动数据集作为BP神经网络模型的学习训练样本数据集, 再通过网络模型神经元连接权值约束训练后, 获得某一天24小时各时刻实际历史运行负荷与BP神经网络模型预测负荷对比曲线如图4所示。

从图4可以看出, 通过BP神经网络预测获得的负荷波动趋势与实际负荷波动趋势能够保持较好的一致性。为判断BP神经网络自适应学习效果, 采用命令ploterr (tr, eg) 从模型中调取学习训练误差修正波动曲线如图5所示。

从图5中可知, 网络模型在优化学习全过程中一直处于逐步光滑收敛工况, 没有出现上下反极性波动, 且模型在迭代次数为587 epochs就基本达到期望误差要求, 比模型初始正常设置值max_epoch=1000要小, 模型没有出现滞后现象。

从图4中提取出预测日24小时各时刻的负荷数据作误差比对分析, 所获得的预测日24小时各时刻预测数据与实际数据保持较好的一致性, 其相似度在93%以上, 且两者间的相对误差值很小, 最大为1.19%, 最小为0.03%, 均能有效控制在1.2%以内, 完全满足模型预设误差2%要求, 说明整个BP神经网络模型建立具有较高的准确性和可靠性, 能够真实地反映电网中短期负荷非线性波动演变趋势特性, 所获得的数据真实可靠, 能够应用于实际负荷预测电力调度运行工程领域。

6 结束语

利用BP神经网络强大的多元参数非线性一致逼近功能及快速可靠的自适应优化学习算法, 与Matlab归一化数据矩阵处理能力相结合, 对电力系统短期负荷预测通过历史数据样本特性提取思想进行建模仿真, 获得预测日24小时的负荷波动可靠的特性数据, 比传统经验调度更加经济高效。把BP神经网络引入到电力系统短期负荷特性数据的预测中, 提高了电力经济调度负荷预测的准确度和工作效率, 为电力系统经济调度及运行检修计划科学安排提供了一种新的研究方法。

参考文献

[1]廖立, 忻建华, 翟海青等.短期负荷预测模型及其影响因素[J].上海交通大学学报, 2004, 38 (9) :1545-1547.

[2]沈道义, 杨振睿, 王斌.电力系统短期负荷预测方法分析[J].上海电力, 2012, 25 (4) :206-210.

[3]杨浩, 何茜, 殷家敏.基于改进熵值法和限幅小波的大波动地区短期负荷预测[J].电力系统保护与控制, 2012, 40 (11) :70-75.

[4]兰华, 常家宁, 周凌, 等.基于局部均值分解与神经网络的短期负荷预测[J].电测与仪表, 2012, 49 (5) :48-51.

神经网络建模 篇11

摘要:认知网络是解决复杂异构网络系统自我管理的一个新途径,其模型与分析方法研究是亟待解决的关键问题,提出一种基于多元π演算的认知网络形式化建模方法,首先分析认知网络的基本特征,然后结合认知问题本质,构建认知网络理论参考模型,并将多元π演算为描述语言建立认知网络系统形式化模型,把自感知、上下文感知和动作调用的过程抽象成一系列进程,利用进程动作及其运算分别严格地刻画认知单元和系统全局认知过程,最后以自配置为例说明了模型应用,该方法以逻辑精确性为特色,能够应用于系统实现的任何阶段,为认知网络的设计提供理论指导。

关键词:认知网络;服务性能;理论模型;形式化建模;多元π演算

摘要:认知网络是解决复杂异构网络系统自我管理的一个新途径,其模型与分析方法研究是亟待解决的关键问题,提出一种基于多元π演算的认知网络形式化建模方法,首先分析认知网络的基本特征,然后结合认知问题本质,构建认知网络理论参考模型,并将多元π演算为描述语言建立认知网络系统形式化模型,把自感知、上下文感知和动作调用的过程抽象成一系列进程,利用进程动作及其运算分别严格地刻画认知单元和系统全局认知过程,最后以自配置为例说明了模型应用,该方法以逻辑精确性为特色,能够应用于系统实现的任何阶段,为认知网络的设计提供理论指导。

关键词:认知网络;服务性能;理论模型;形式化建模;多元π演算

摘要:认知网络是解决复杂异构网络系统自我管理的一个新途径,其模型与分析方法研究是亟待解决的关键问题,提出一种基于多元π演算的认知网络形式化建模方法,首先分析认知网络的基本特征,然后结合认知问题本质,构建认知网络理论参考模型,并将多元π演算为描述语言建立认知网络系统形式化模型,把自感知、上下文感知和动作调用的过程抽象成一系列进程,利用进程动作及其运算分别严格地刻画认知单元和系统全局认知过程,最后以自配置为例说明了模型应用,该方法以逻辑精确性为特色,能够应用于系统实现的任何阶段,为认知网络的设计提供理论指导。

神经网络建模 篇12

电力是国民经济的命脉,在我国政治、经济和社会生活中,电力系统发挥着十分重要的作用。在电力系统中,火力发电又显得尤为关键。在火力发电过程中,煤炭经过工业锅炉燃烧产生蒸汽,蒸汽驱动气轮发电机来产生电能。因此工业锅炉是火力发电的、关键生产设备之一[1],而锅炉效率是表征锅炉经济运行的主要综合技术指标,在锅炉的性能考核时有相应的锅炉效率的计算模型,但所需测量参数比较多,在锅炉实际运行过程中,受运行条件的限制,几乎不可能测得进行锅炉效率计算的所有参数,此外在实际生产过程中,影响系统运行的因素繁多,即使相同的设备、相同的运行工况也会因为某一个操作参数发生变化而影响系统运行过程。因而单纯从物质、能量等角度建立准确的、反映设备生产过程的机理性数学模型十分困难。从生产现场采集的数据中隐含了与过程运行状态相关的建模知识,对此生产数据的准确建模,可以建立起能反映生产过程运行状态的较为精确的数学模型,在保证稳定性的同时,提高整个系统运行的效率和系统的可维护性,让生产由一般意义上的安全运行向经济运行飞跃。

2 锅炉生产过程的神经网络建模

锅炉系统的主要性能参数是锅炉效率,由于电厂锅炉的效率受设备、工况、燃料等等多种因素影响,并且它们之间存在着高度的复杂性和非线性性,无论是正平衡法还是反平衡法都是经验的公式总结,不能完全反映真实锅炉燃烧过程的实际情况,因此在实际使用中有很大的局限性。神经网络作为一种智能建模方法,能够充分逼近任意复杂的非线性关系,非常适合描述具有黑箱性质和非线性强的对象。同时采用神经网络方法对锅炉效率进行建模预测的结果对锅炉效率的优化也可以起到一定的指导作用,因此本文采用神经网络对锅炉效率进行建模研究。

2.1 建模思路

在了解锅炉的生产过程,特别是了解了锅炉效率的计算模型后,可以很容易得确定影响锅炉效率的因素,通常情况下,对锅炉效率用神经网络进行建模时,需要测定以下参数:排烟温度、排烟处的氧量、飞灰含碳量、应用基低位发热量、应用基灰分、NOx排放等等。将这些因素作为神经网络的输入,而将锅炉效率作为神经网络的输出建立模型。模型结构如图1所示。此模型比较简单,需要测量的数据量不大,计算比较方便。

上述参数中,排烟温度、排烟处的氧量等可以从电厂DCS中获得实时数据,而应用基低位发热量、应用基灰分等一类和煤种煤质相关的数据可以从检验部分获得。而飞灰含碳量、NOx排放浓度等数据通常是要靠计算出来的。这些靠计算得到的数据其计算又牵涉到很多复杂的影响参数,并且参数之间的非线性程度也比较高,往往也很难通过某一数学公式计算出来,即便根据经验总结出相应的计算公式,在不同生产环境下计算出来的数据也不一定准确,这时,我们也可以通过神经网络的方法建立飞灰含碳量和其主要影响因素之间的模型以及NOx排放的质量浓度和其主要影响因素之间的模型,对其进行建模、预测和软测量。

2.1.1 锅炉生产过程中飞灰含碳量建模

影响锅炉热效率较大的几个因素主要是排烟损失和固体不完全燃烧损失,对于煤粉燃烧锅炉,固体不完全燃烧损失中又以飞灰含碳量造成的不完全燃烧损失为主。排烟损失与锅炉运行参数(配风、煤质、氧量等)的关系较简单,已知锅炉燃用煤质、排烟氧量、排烟温度及环境温度等有关参数后即可确定它们之间的函数关系。锅炉散热损失、其他热损失与锅炉运行参数之间的函数关系也容易获得。而锅炉飞灰含碳量与锅炉运行参数之间的关系较复杂,受煤种、锅炉负荷、配风方式、炉型、燃烧器型式、炉温、过剩空气系数、煤粉细度、风粉分配均匀性等多种因素的影响,因此实际测量比较困难。

针对以上问题,可以采用神经网络对锅炉飞灰含碳量特性进行建模,将煤种、锅炉负荷、配风方式、炉型、燃烧器型式、炉温、过剩空气系数、煤粉细度、风粉分配均匀性九个参数值作为神经网络的输入,采用三层BP神经网络,隐含层神经元数目为19,将锅炉的飞灰含碳量作为神经网络的输出,构造结构为9-19-1的神经网络,如图2所示。

2.1.2 锅炉生产过程中NOx排放建模

锅炉燃烧过程中锅炉热效率与NOx排放的影响因素大部分相同,但具有矛盾的要求。电站锅炉燃烧产物(简称排放物)的生成机制很复杂,受多种因素的制约,诸如煤种、锅炉热负荷、风煤比、配风方式、炉膛温度以及其分布的均匀性等,鉴于理论、实验和检测研究的不完备,目前难以用机理性模型描述。锅炉生产过程中NOx的排放往往可以用神经网络的方法进行建模和软测量。

锅炉实际运行中,影响NOx排放质量浓度的各运行因素(炉膛氧的质量分数,炉内风分配,炉膛热负荷,煤粉的分配)是相互影响的,加之所得试验工况有限,因此不容易找出NOx质量浓度的规律。但是从NOx生成的机理来看锅炉燃烧过程中NOx质量浓度主要取决于空气中的氧和燃料的混合情况和燃烧反应的温度,即主要是空气与燃料分级的程度。各实际运行因素均是通过影响燃烧过程的上述条件而影响NOx质量浓度的。因此可将各种运行因素从空气与燃料的分级和燃烧反应温度的角度进行反映,提出影响NOx质量浓度的综合性指标。此外,炉膛氧的质量分数可用炉膛出口氧的质量分数(或过量空气系数)反映;炉膛热负荷可用锅炉负荷反映。由此出发,可将影响锅炉NOx排放质量浓度的综合性因素确定为:炉内风的分配、炉膛总氧的质量分数、锅炉热负荷。煤粉分配因素因对NOx生成的影响较小而将其忽略。炉内风的分配这个指标综合反映了一次风风速、二次风配风方式和制粉系统运行方式对NOx质量浓度的影响。风分配因素对NOx质量浓度有重要影响,但通常都是通过定性指标来衡量(如配风方式,磨煤机投运套数等),因此如何将风分配因素定量化是获得NOx定量计算模型的关键。

NOx的排放质量浓度在风量上移时一般会下降,风量下移时一般会增加;缩腰配风有利于减少氮氧化物的生成可理解为风分配的不均匀性越大,空气分级程度增加,从而降低NOx质量浓度,所以均等配风风中心虽然并不比缩腰配风高,但NOx的排放质量浓度要高很多。因此风分配的影响可通过风量中心位置和风分配的不均匀性来反映。这样就可将反映风分配因素的定量化指标确定为风中心位置和风分配不均匀系数,从而解决了风分配因素量化的困难。将风中心位置定义为炉内风的质量中心高度,可通过如下公式计算:

式中:L为炉内风中心位置,mm;mi为各风口风量,m3;li为各风口到基准点的距离,mm;M为总风量,m3。

通过上述分析可得出,各种因素按对炉内NOx质量浓度影响的大小排列,依次是:炉内风中心位置、炉膛氧的质量分数的大小、炉膛热负荷。由于各个指标都已量化,所以可以作为神经网络的输入,将锅炉的NOx质量浓度作为神经网络的输出建立模型,如图3所示。

有了以上两个参数的神经网络模型,就可以通过调整网络结构和网络参数比较准确地对飞灰含碳量和NOx排放质量浓度进行建模预测。用此模型的结果合并锅炉效率的其他影响因素作为锅炉效率网络模型的输入,将锅炉效率作为网络的输出,就可以建立锅炉效率的神经网络模型,如图4所示。

此模型要求锅炉所有单位在锅炉的运行过程中检测的数据不多,它能在对锅炉效率建模预测的同时实现对飞灰含碳量、NOx排放质量浓度以及锅炉效率的软测量。对指导锅炉生产过程的优化有很重要的意义。当然,由于各单位的设备情况和检测手段不一样,上述参数可能有少部分在个别单位测量不到相应的数据,这样的情况下,我们不必完全按照上述网络模型进行建模,可以通过经验,在可测得的数据项中选择和锅炉效率相关性比较大若干项的作为网络输入,当然比较好的方法是使用数据挖掘技术,在可测得的数据项中找到和锅炉效率最相关的若干项数据作为网络的输入。此时有可能会忽略对飞灰含碳量和NOx排放质量浓度的测量。

2.2 建模方法

通过以上分析,得到了对锅炉效率建模所需要的参数,将此方法用在江苏某公司锅炉效率的建模预测中,通过该公司检验部门及公司的DCS系统中可以监测到对建模有用的参数数据列在表1中。

由于仅仅针对该公司的一台锅炉燃烧过程进行建模,一些锅炉自身的参数不会发生变化,因此这些参数可以在建模时不予考虑。

在运用神经网络建模以前,根据经验或者使用数据挖掘的方法,在现有的监测数据中挑选出对锅炉效率的影响比较大的数据项。将挑选出来的这些影响较大的数据项作为神经网络的输入,将锅炉效率作为神经网络的输出建立神经网络模型。建模过程流程图如图5所示。

3 应用实例

选取某公司2000年11月20日到2001年1月8日的生产监测数据为训练样本,将数据挖掘方法用于可监测到的所有数据项,挑选做锅炉效率影响比较大的因素作为网络的输入参数,它们是排烟温度、飞灰含碳量、水份、灰份、低位发热量、锅炉的最高负荷、主汽温度、主汽压力、主汽焓、给水焓、标准煤量。生成的训练样本集。选择该公司2001年1月9日到2001年1月18日共10天的生产参数作为神经网络建模的输入模式,预测该段时间的锅炉效率,并和实际效率做比较。

选择神经网络的结构为:12-25-1,即:12个输入对应排烟温度、飞灰含碳量、水份、灰份、低位发热量、锅炉的最高负荷、主汽温度、主汽压力、主汽焓、给水焓、标准煤量这12个影响因素数据项,隐含层神经元数为25,输出锅炉效率。设定网络的学习速率为0.9,最大迭代次数为6000,误差限为0.0001。建模预测结果如表2所示。

建模结果显示,用此种网络结构进行锅炉效率建模,其误差均低于3%,精度比较高。

4 结语

通过以上实例的结果可以看出,使用上面讨论的神经网络模型对锅炉效率进行建模预测,在保证结果准确性的基础上,所需要的监测数据项不多,比通过公式计算速度快,需要的参数少,并且在实际生产中的适应性比较强,通过这种方法得到的建模预测结果可以进一步对各项参数进行调优,优化资源的配置,提高锅炉的热效率。

摘要:针对锅炉效率计算中正平衡法和反平衡法都不能完全反映真实锅炉燃烧过程的实际情况,该文提出基于神经网络的锅炉生产过程建模方法,该方法不需要太多监测数据并且保证了建模的准确性。

关键词:锅炉效率,神经网络,建模

参考文献

[1]李斌.国产300MW机组在现有化运行信息系统的研究[D].浙江:浙江大学,2002.

[2]李伟.锅炉热力计算通用软件的开发及大容量锅炉变工矿特性的研究[D].北京:华北电力大学,2000

上一篇:热工保护下一篇:幼儿教育中评价的原则