动态模糊神经网络

2024-08-17

动态模糊神经网络(精选7篇)

动态模糊神经网络 篇1

0 引 言

有效的数据预测在金融投资领域占有重要地位, 而以股票涨落为代表的金融数据影响因素非常复杂, 其变化有着很强的无序性, 从而增加了预测的难度。目前, 已出现众多分析股市的手段以及预测方法。其中, 逐步形成理论的有K线法、波浪法、道琼斯法等。但这些都仅作为分析方法, 作为缺乏经济理论和证券知识的普通用户, 并不能直接从中预测股市的动态。除此之外, 有利用现代统计学的手段, 试图建立模型来预测股市。然而, 影响股市的因素多且复杂, 许多因素本身尚具模糊性、混乱性, 所以上述种种努力所取得的效果甚微。在股市发展过程中, 的确有某种规律性的东西, 或者称为模式。这些规律性的东西常常蕴涵于看似杂乱无章的大量历史数据中, 因此, 要想获得有效的预测, 关键在于发现规律。从数学的角度看, 就是建立某种映射关系 (函数) , 并进行函数的拟合, 神经网络是解决这一问题的最佳工具之一。人工神经网络已被广泛应用于包括经济领域在内的预测问题中, 并已取得了不错的效果。

股市往往具有如下特点:① 含有大量原始数据;② 影响因素众多, 因素之间关系复杂且有某种并行性;③ 很多因素具有一定的模糊性;④ 股市的发展有某种规律性。基于这些特点, 采用模糊神经网络方法进行股价的预测较为合理。然而, 传统的模糊神经网络也具有一定的局限性, 研究人员必须预先划分输入空间, 确定模糊规则基, 在此基础上, 再利用神经网络的学习功能和自适应能力对系统参数进行优化。这往往导致所建立的神经网络不一定具有应用所需的最佳网络结构, 使得研究者不得不经过反复试验, 才能最终确定。本文使用的广义动态模糊神经网络 (GD-FNN) 不同于传统神经网络, 它的网络结构不是预先设定的, 而是动态变化的, 即在学习开始前, 没有一条模糊规则, 其模糊规则在学习过程中逐渐增长而形成。这样就克服了上述缺点, 为应用带来了很多方便。

1 GD-FNN结构

GD-FNN共分为四层, 分别为输入层、隶属度函数层、T-范数层和输出层, 如图1所示。

第一层为输入层, 节点的个数为输入变量的个数, 设共有r个输入变量, 并且每个输入变量xi (i=1, 2, …, r) 有u个隶属函数Aij (j=1, 2, …, u) , 共有r×u个节点位于第二层, 每个输入变量xi与其自身的u个隶属函数相连, 隶属函数为高斯函数, 形式为:

其中, μijxi的第j个隶属函数, cijσij分别为xi的第j个高斯隶属函数的中心和宽度。第三层用于计算每个规则触发权的T-范数算子用乘法, 第三层的j个规则Rj (j=1, 2, …, u) 的输出用下式计算:

第四层为输出层, 用如下的表达式:

其中, y是输出变量的值, ωj为第j个规则的连接权。

2 GD-FNN学习算法

广义动态模糊神经网络的结构是在学习过程中逐渐生成、调整的, 通过对模糊规则的调整从而调整网络结构, 因此算法要完成网络结构调整和参数确定、调整两个功能。对于网络结构的调整分为模糊规则的产生和剔除, 对于参数的学习分为两个方面:前提参数估计和结果参数确定。

2.1 模糊规则的产生和剔除

2.1.1 模糊规则的产生

模糊规则的产生考虑两个因素:系统误差和模糊规则的ε-完备性。

GD-FNN输出误差是确定是否需要增加一条新的模糊规则的一个重要因素。误差规则可以表示如下:

对每个观测数据 (Xk, tk) , k=1, 2, …, n;其中, n是全部训练数据的数量, Xk是第k个输入样本向量, tk是第k个期望的输出, 用式 (2) 和式 (3) 计算当前结构下的GD-FNN输出yk。定义系统误差为:

如果‖ek‖>ke, 则应考虑增加一条新的模糊规则。这里, ke是根据GD-FNN期望的精度预定义的一个阈值, 它在学习过程中按以下准则逐渐变化:

其中, emin是GD-FNN期望的输出精度, emax是选择的最大误差, k是学习的次数, β∈ (0, 1) 称为收敛常数, 可以推导出:

模糊规则的ε-完备性是确定是否需要增加一条新的模糊规则的另一个重要因素。ε-完备性定义如下:

定义1 模糊规则的ε-完备性 对某个变化范围内的输入, 如果至少存在一条模糊规则, 使得匹配度 (即触发权) 的值不小于ε, 我们就说这样的模糊规则具有ε-完备性。

在模糊系统中ε的最小值通常选择为εmin=0.5。

从模糊规则观点来看, 一条模糊规则是在输入-输出空间中的一个局部表达。如果一个新的样本满足ε-完备性, 那么GD-FNN不会产生一个新的规则, 而会通过更新现有规则的参数来包容样本。

根据ε-完备性, 当一个观测数据 (Xk, tk) , k=1, 2, …, n进入系统, 可以计算观测数据Xk 和现有的高斯单元的中心Cj (j=1, 2, …, u) 之间的马氏距离mdk (j) , 找到:

如果:

其中kd是一个预先设定并与ε相关联的阈值, 则表明现有的系统不满足ε-完备性而应该考虑产生一条新规则。这里kd在学习过程中按下式变化:

其中, k是学习的次数, γ∈ (0, 1) 称为衰减常数, 由式 (9) 推算出:

2.1.2 模糊规则的剔除

定义误差减少率矩阵Δ= (ρ1, ρ2, …, ρu) ∈R (r+1) ×u, △的第j列是对应的第j个规则的 (r+1) 个误差减少率。定义:

ηj代表了第j个规则的重要性。如果ηj<kerr, j=1, 2, …, u;其中, kerr是预先定义的值, 则第j个规则被删除。

2.2 参数的确定和调整

参数的确定和调整, 包括高斯函数宽度和中心的确定, 高斯函数宽度的调整和权值的调整。

2.2.1 高斯函数宽度和中心的确定

假设u个模糊规则已经产生, 当得到一个新的采样样本Xk (k=1, 2, …, n) 时, 按照规则产生准则, 需要产生一条新的模糊规则。这时, 把多维输入变量Xk投影到相应的一维隶属函数空间, 同时计算数据xik和边界集Φi之间的欧氏距离为:

其中, Φi∈{ximin, ci1, ci2, …, ciu, ximax}, 同时找到:

如果edi (jn) ≤kmf, 其中, kmf是一个预先定义的常数, 该常数控制相邻隶属函数的相似性, 那么, 就说xik不用在该维产生新的隶属函数就可以被现有的模糊集Aijn (cijn, σijn) 完全表示。否则, 将分配一个新的高斯函数, 高斯函数的宽度确定为:

其中, ci-1和ci+1是与第i个隶属函数邻近的两个隶属函数的中心。而高斯函数的中心确定如下:

2.2.2 高斯宽度修正

对于一个新样本Xk, 可以找到以马氏距离“最靠近”该样本的第j个规则。如果条件‖ek‖>kemdk, min≤kd都成立, 把向量Xk分解为相应的一维输入变量, 则输入变量xi (i=1, 2, …, r) 的最近的隶属函数的宽度σij (j=1, 2, …, u) 可以修正如下:σijnew=ζ×σijold, 其中ζ∈ (0, 1) 为衰减因子, 它由如下式子确定:

其中, r是输入变量的总数。

2.2.3 权值确定

r个输入变量的n次观测样本产生u个模糊规则, 将网络的输出写成矩阵形式为:Wϕ=Y, 其中WRu (r+1) , ο∈Ru (r+1) ×nY∈Rn。假设期望的输出为T= (t1, t2, …, tn) ∈Rn, 确定最优参数W*的问题可以用公式表示为最小化Wϕ-Τ2的线性问题, W*由广义逆方法确定如下:W*=TTϕ) -1ϕT, 其中, ϕT是ϕ的转置。

整个算法的流程图如图2所示。

3 样本选择

用定量模型对股票市场进行预测, 首先就是要对股票市场进行定量化描述。就GD-FNN而言, 需将股市的历史数据处理成一系列可供神经网络学习的例子样本, 组成一个学习样本集, 每个学习样本为因果关系的偶对: (预测依据|预测对象) 。

本文以上证指数第七天的收盘价作为预测对象。预测依据表示在预测对象的结果发生前系统的描述, 就股市技术分析而言, 某时刻t前的系统状态为价格和成交量的时间序列数据, 显然这里的数据量是相当庞大的, 且股票价格变化在短期内具有很大的随机性, 而瞬时的变化对未来趋势预测意义很小。人们在长期的实践中已总结出数百种描述系统状态的技术指标, 如MA、MACD、WMS%、KDJ、RSI、BIAS、PSY、AR、OBV、ADR等, 另外, 还有一些特征提取的数学方法, 如卡尔曼滤波、小波变换等。具体应用时可针对不同的预测对象, 选取若干种和该预测对象相关度大的技术指标, 来组成描述系统状态的预测依据向量。

本文选用移动平均线 (MA (6) ) 、乖离率 (BIAS (6) ) 、随机强弱指标 (RSI (6) ) 和心理线 (PSY (6) ) 作为输入变量, 用第7天的收盘价作为目标输出, 对网络进行训练。

MA是利用若干天或若干周收市价的均值为参数绘制的曲线。由于它利用了移动平均理论, 剔除了股价的偶然变动, 因而可以作为投资者判断行情走向的依据。MA的计算公式为:

BIAS用来描述股价与移动平均线距离的远近程度, 计算公式为:

式中, Cn为当日收盘价, MA为n日移动平均值, BIAS可正可负, 也可为零。

RSI是反映行情变化动量的指标, 即市场向某一个方向变化时, 其内部所包含的能量, 可用以反映股价变动的强弱状况。计算公式为:

其中, n为天数, Un表示n日中股价上升幅度之和, Dn表示n日中下跌幅度之和。

PSY指标是在时间的角度上计算N日内的多空总力量, 来描述股市目前处于强势或弱势, 是否处于超买或超卖状态。它主要是通过计算N日内股价或指数上涨天数的多少来衡量投资者的心理承受能力, 反映股市未来发展趋势及股价是否存在过度的涨跌行为。计算公式为:

4 上证指数预测实验

本文用上证指数2008-07-12到2008-12-14共100个样本数据, 其中, 前70个作为训练样本, 后30个作为测试样本。计算出MA (6) 、BIAS (6) 、RSI (6) 和PSY (6) 作为输入数据, 用第7天的收盘价作为输出数据。为保持数据取值范围的一致性, 这里用MA (6) /100代替MA (6) 作为输入。实验结果如图3和图4所示。

图中圆圈为期望输出, 星号为实际输出。从结果来看, 预测值与实际值完全吻合, 取得了非常好的效果。

5 结 语

将GD-FNN用于上证指数的预测取得了较为理想的效果, 但股票市场复杂多变, 影响因素众多。尽管GD-FNN具有良好的自学习能力, 但依然存在一些不稳定的因素, 如何设计出更为稳定的网络, 依然需要做进一步的研究, 另外, 如果能将影响股市的因素经模糊化后作为模糊神经网络的输入, 也许会收到更好的效果, 也有待研究。

摘要:提出一种用广义动态模糊神经网络预测股票价格的方法, 网络结构可随模糊规则在学习过程中逐渐增长而自动调节, 以达到预测最优化。通过选用实用的技术参数指标作为网络的输入变量对上证指数的收盘价进行预测, 取得了较为理想的效果。

关键词:广义动态模糊神经网络,上证指数,预测,技术指标

参考文献

[1]伍世虔, 徐军.动态模糊神经网络—设计与应用[M].北京:清华大学出版社, 2008.

[2]张学仁, 宋全启.股票理论与投资分析[M].西安:西北大学出版社, 1998.

[3]陈兴, 孟卫东, 严太华.基于T-S模型的模糊神经网络在股市预测中的应用[J].系统工程理论与实践, 2001 (2) :66-72.

[4]Pei-Chann Chang and Chen-Hao Liu.ATSKtype fuzzy rule based systemfor stock price prediction[J].Expert Systems with Applications, 2008.

动态模糊神经网络 篇2

关键词:光伏电池,MPPT,椭圆基,广义动态模糊神经网络,智能控制

0 引言

智能电网是近年来国际上备受关注的未来电力系统发展方向的热门话题。分布式电源是智能电网中一个很重要的分支。光伏电池作为一种新兴的分布式电源越来越受人类的青睐[1]。因此对光伏电池的研究具有相当重要的意义。

光伏发电系统[2]的电流-电压的输出特性是非线性的,再加上其输出功率受光照和环境温度的影响很大,为了提高能源的利用效率,人们提出了最大功率点跟踪(MPPT)理论。MPPT这种理论目前已经有这几种算法:电压回授法,增量电导法,扰动与观察法[3]等。但是这些方法存在着对环境的适应性差,算法不严谨等缺点。目前神经网络和模糊系统在这方面的应用比较广泛,而且取得了较好的效果。模糊标记的权值是在训练之前选定的,只能对特定的情况实现最优控制。为了克服这些缺点,本文提出了基于椭圆基的广义动态模糊神经网络。该算法中,高斯函数的宽度可以通过训练实施在线自适应调整,并提出了模糊ε-完备性作为在线参数分配机制,避免初始化选择的随机性,提高了系统的自适应能力。

1 光伏电池的特性及MPPT原理

1.1 光伏电池的特性分析

光伏电池是通过光电效应或者光化学效应直接把光能转化成电能的装置。其输出特性方程式是[4]:

其中:Isc是指光电流密度,与照射时的光照强度有关,与所加电压无关;I0是逆饱和电流,是由PN结两端的少量载流子和载流子的扩散常数决定的;q指单位电流,取值1.6×10-19 C;A是理想因子,取值为1;k是波尔兹曼系数,取值是1.38×10-23J/K;T是电池表面温度;V是输出电压;I是输出电流;Rs为串联等效电阻。

根据光伏电池的数学模型在Matlab/Simulink建立模型,得到P-V曲线如图1所示。

由图1可以分析,输出功率随光照强度的增加而增大。当外部环境发生变化的时候,功率就会发生相应的变化,如果不及时控制,就会造成能源的浪费。因此,如何在外部环境发生变化时实现功率的最优化是光伏电池控制中一个急需解决的问题。

1.2 MPPT的原理

在光伏系统中,为了寻求阻尼的最佳匹配,通常是通过控制PWM的占空比来实现功率的最优化的。于是,在此基础上提出了MPPT理论[5,6,7]。由图1可以看出,当且仅当d P/d V=0时,输出功率最大。而电压V是由占空比决定的。因此直接把占空比作为控制变量,能够使控制系统简化,容易实现。

2 光伏系统最大功率跟踪控制原理

2.1 控制方案设计

在MPPT控制系统中,选择系统的第n周期和第n-1周期的功率差b(n-1)及第n-1周期的采样步长c(n-1)作为GD-FNN的输入量,第n周期的采样步长c(n)为神经网络的输出量。利用Matlab/Simulink搭建光伏发电系统控制器,其核心部分的原理框图如图2。

其中:S函数实现D(n)=D(n-1)+c(n)的功能。

2.2 GD-FNN的结构[8]

广义动态模糊神经网络是由输入层,隶属函数层,模糊推理层和输出层构成的网络。网络结构共有两个输入信号:第n个周期和第n-1个周期的功率差以及第n-1周期的采样步长。输出变量是第n个周期的采样步长。其结构如图3所示。

2.3 网络结构的算法

模糊规则的数量可以在线自适应调整是GD-FNN算法的优势之一,而其输出误差和其新样本是否满足ε-完备性是确定是否需要增加模糊规则的重要因素。

定义系统误差为:

其中tk是第k个期望输出。

如果ek>ke,则应该考虑增加一条新的规则。其中

其中:emin是系统期望的输出精度;emax是选择的最大误差;k是学习的次数;β∈(0,1)称为收敛常数。可以推导出:

同时,定义马氏距离为:

如果

则表明现有的系统不满足ε-完备性而应该考虑产生一条新的规则,其中kd是这样变化的:

上式中,r为衰减常数,它可以由上式推导:

当一条模糊规则产生以后,下一步就是如何分配参数。

假设u个模糊规则已经产生,当得到一个新的样本时,把多维输入变量投影到相应的一维隶属函数空间,同时计算数据xik和边界集φi之间的欧式距离edi(j),并找到它的最小值edi(jn),如果

就不用分配新的高斯函数,否则需要增加一个新的高斯函数,其宽度由式(11)决定,高斯函数的中心设置如下:

把输出变量的方程式看成是线性回归方程,其模型为:D=Hθ+E;其中,D=TT为期望输出;H=φT=(h1,…,hv);θ为实参数;E为误差向量。H通过QR分解成正交基向量集:H=PN,其中P=(p1,p2,…,pv)。

定义pi的误差减少率为

此外定义

其中ρj为误差减少率矩阵△=(ρ1,ρ2,…,ρu),如果ηi

高斯宽度可以修正是GD-FNN算法的另一个优势。输入变量的最近的隶属函数的宽度σij可以修正如下:

其中ζ是衰减因子,它是由下式决定的:

其中Bij是输入变量的敏感性。

从前面的分析可以看出,运用广义动态模糊神经网络对系统进行控制,其输入输出的隶属度函数的宽度是可以通过训练的,这就提高了系统跟踪环境变化的能力。

3 仿真设计与实现

在Matlab/Simulink里进行仿真,系统原理框图如图4所示,主要由光伏电池、模糊神经网络控制系统以及电阻性负载构成。

为了显示文中提出方法的控制效果,仿真中把结果与文献[9]中提出的模糊控制进行比较。采用ode23tb算法,设置环境温度为25°,光照在0.1 s时由600 W/m2变成900 W/m2,仿真时间为0.2 s,仿真图形如图5。

图5(a)是采用模糊控制的输出功率的曲线,图5(b)是采用广义动态模糊神经网络进行控制的功率输出曲线。可以看到,前一种方法响应速度慢,而且在最大功率点出现了震荡。运用本文提出的理论仿真的结果能在0.01 s快速找到最大功率点,并且有效地克服了最大功率点震荡问题。具有较好的鲁棒性和快速性。

4 结论

针对光伏电池这种新兴的分布式电源的特性,本文采用广义动态模糊神经网络控制算法,建立了一个光伏系统的控制模型,通过调节PWM的占空比对光伏系统的输出电压加以控制,从而实现输出功率的最大化。这种方法不仅能够很好地跟踪外部环境的变化,而且需要设置的参数比较少,同时具有一定的自适应能力,容易实现在线智能控制。仿真结果表明,这种控制系统的学习效率和性能有着更突出的优势,具有很好的鲁棒性及快速性。

参考文献

[1]Haase P.Intelligrid:a smart network of power[J].EPRI Journal,2005:27-32.

[2]Ghiang S J,Ghang K T,Yen C Y.Residential photovoltaic energy storage system[J].IEEE Trans on Industrial Electronics,1998,45(3):386-298.

[3]王松.一种基于神经网络的光伏电源最大功率控制系统[J].山东大学学报,2004,34(4):45-48.WANG Song.A maximum power control system of photovoltaic cells based on neural network[J].Journal of Shandong University,2004,34(4):45-48.

[4]滨川圭弘.太阳能光伏电池及其应用[M].北京:科学出版社,2009:18-34.Hamagawa Yoshihiro.Solar photovoltaic cells and its application[M].Beijing:Science Press,2009:18-34.

[5]Eduardo Román.Intelligent PV module for grid-connected PV systems[J].IEEE Transactions on Industrial Electronics,2006,53(4):1066-1073.

[6]叶秋香.光伏电池最大功率跟踪器的模糊控制及其应用研究[D].上海:东华大学,2006.YE Qiu-xiang.A study on PV maximum power point tracking system using a fuzzy controller[D].Shanghai:Northeastern University,2006.

[7]Efichios Koutroulis,Kostas Kalaitzkis,Voulgaris C.Development of microcontroller-based photovoltaic maximum power point tracking control system[J].IEEE Transaction on Power Electronics,2001,16(1):46-54.

[8]舒菲.基于RBF神经网络与模糊理论的电力系统短期负荷预测[D].西安:西安理工大学,2008:11-17.SHU Fei.Short-term load forecasting of power system based on RBF neural network and fuzzy theory[D].Xi'an:Xi'an University of Technology,2008:11-17.

动态模糊神经网络 篇3

人脸识别是模式识别研究领域的重要课题。该研究不仅对图像处理、模式识别和计算机视觉等研究领域有重要的作用,而且在商业、司法、监控和视频检索等其他领域也有着广泛的应用价值。在过去的三十多年里,心理学家、神经生理学家和工程技术人员对人和机器如何识别人脸的各个方面进行了广泛的研究。人脸分类器的设计方法主要有四种:统计方法、神经网络方法、多分类器组合方法、混合方法,混合方法是将各种现有的方法进行适当地综合以发挥各自的优势[1,2,3]。在诸多的混合方法中,将神经网络与模糊系统结合形成的模糊神经网络是近年来在软计算领域研究的热点之一[4,5],并已广泛应用到各个领域。但模糊神经网络的学习速度慢,容易陷入局部极小点。为了避免以上情形的产生,本文提出了一种改进的动态模糊神经网络,即动态补偿模糊神经网络(DCFNN)。动态补偿模糊神经网络结合了补偿模糊神经网络和动态模糊神经网络的优势,将补偿模糊神经元引入到原有的动态模糊神经网络中,代替了原有的归一化层神经元。引入了补偿模糊神经元的动态模糊神经网络能够从初始正确或错误定义的模糊规则开始训练,从而使网络容错性更好,网络更稳定,再加上动态模糊神经网络自身的优势,使得动态补偿模糊神经网络更优化、更适应。

1 动态补偿模糊神经网络的结构与学习算法

1.1 动态补偿模糊神经网络的结构

动态补偿模糊神经网络是一个结合了补偿模糊逻辑和动态模糊神经网络的混合系统,由面向控制和面向决策的模糊神经元构成。动态补偿模糊神经网络的网络结构不是预先设定的,而是动态变化的,即在学习开始前,没有模糊规则,其模糊规则在学习过程中逐渐增长而形成,而且所得到的模糊规则数并不会指数式增长[6],避免了维数灾难的影响。

一个动态补偿模糊神经网络有五层结构:输入层、模糊化层、模糊推理层,补偿运算层和输出层,其结构如图1所示。

在图1中,x1,x2,…,xn是输入的语言变量,y1,y2,…,ym是输出变量,MFij是第i个输入变量的第j个隶属函数[6],Ru表示第u条模糊规则,Cr是第r个补偿模糊神经元,wum是第u个规则到第m个输出的连接权。

(1)第1层:输入层,每个节点分别表示一个语言输入变量。

(2)第2层:模糊化层,每个节点分别代表一个隶属函数,隶属函数用高斯函数[6]表示为:

其中,μij是xi的第j个隶属函数,cij是xi的第j个隶属函数的中心,σj是xi的第j个隶属函数的宽度,n是输入变量数,u是系统总的规则数,即隶属函数的个数。

(3)第3层:模糊推理层,每一个节点分别代表一个可能的模糊规则中的IF-部分。该层节点数反映了模糊规则数。第j个规则Rj的输出为:

其中,X=(x1,x2,…,xn)∈Rn,Cj=(c1,c2j,…,cnj)∈Rn是第j个神经元的中心。

(4)第4层:消极-积极补偿运算层,补偿模糊神经元的个数与模糊规则节点数相同。第j个节点Cj的输出如式(3)所示:

其中,γ是补偿度[7],γ∈[0,1]。

该层采用的是一种基于积极运算和消极运算的补偿运算。积极运算时,能够将输入映射到最好的输出,为最好的输出制定一个乐观的决策;消极运算刚好相反,它能够将输入映射到最坏的输出,为最坏的输出制定一个保守的决策。补偿运算则是映射最好输入和最坏输入到补偿输出,介于最好输入和最坏输入制定一个折衷的决策[7]。其中,积极运算表示为:

消极运算为:

那么,补偿运算为:

引入补偿运算,提高了网络的容错性能,使得网络系统更稳定。值得注意的是补偿度的选择,过大或者过小都会影响训练速度和实验结果,所以往往要通过多次实验的比较才能确定一个合适的补偿度。

(5)第5层:输出层,该层的每个节点分别表示一个输出变量,该输出是所有输入信号的叠加,表示为:

其中,wji是第j个补偿模糊神经元到第i个输出神经元的权值。

1.2 动态补偿模糊神经网络的学习算法

1.2.1 规则产生准则

动态补偿模糊神经网络的结构不是预先设定的,在学习开始前,没有一条模糊规则,模糊规则是在学习过程中逐渐增长而形成。对于一个系统,如果规则数太少,系统不能包含所有的输入-输出的状态空间,DCFNN的性能将表现的很差;相反,如果规则数太多,将增加系统的复杂性,而且导致DCFNN的泛化能力变差[6]。所以确定一条新规则是否应该加入系统非常重要,其中输出误差和高斯函数的覆盖范围是确定新规则是否应该加入的重要考量。

1)输出误差

对于第i个训练数据(Xi,ti)(i>1),其中Xi是输入向量,ti是期望输出,根据式(7)计算DCFNN的输出yi,那么输出误差[6]为:

如果ei>ke,则增加一条新规则,其中ke是设定的误差指数。

2)可容纳边界

当输入变量的隶属函数采用高斯函数描述时,整个输入空间是由一系列的高斯函数划分。把高斯函数的覆盖范围称为可容纳边界,如果一个新的样本位于可容纳边界内,那么该新样本可以用存在的高斯函数代表,就不需要增加规则,否则增加新规则。

对于第i个训练数据(Xi,ti),根据式(9)计算输入值Xi和现有的神经元的中心Cj之间的距离di(j):

其中,u是现有的模糊规则数,同时根据下式求出dmin:

如果,则增加一条新规则,其中kd是可容纳边界的有效半径[6]。这里可容纳边界的有效半径kd和误差指数ke根据下式动态调节:

其中,emax是预先设定的最大误差,emin是期望精度,β(0<β<1)是收敛常数,dmax是预先设定的输入空间的最大长度,dmin是预先设定的最小长度,α(0<α<1)是衰减常数[6]。这里,只有当ei>ke,dmin>kd,同时成立时,才增加一条新的规则。不满足该条件的3种情况作如下处理:

(1)ei≤ke,dmin≤kd时,DCFNN可以完全容纳训练数据,所以不需要增加规则,只需要调整补偿运算层到输出层的权值。

(2)ei≤ke,dmin>kd时,DCFNN具有很好的泛化能力,只要调整补偿运算层到输出层的权值即可。

(3)ei>ke,dmin≤kd时,覆盖Xi的神经元的泛化能力不是很好,需要调整最接近Xi第k个神经元的宽度σki以及补偿运算层到输出层的权值[6]。按照式(12)对σki进行调整为:

其中,ku(ku>1)是设定的常数。

1.2.2 动态补偿模糊神经网络的学习算法

动态补偿模糊神经网络的学习算法如下:

(1)首先初始化动态补偿模糊神经网络的预定义参数。

(2)第一个训练数据X1输入后,产生第一条规则,C1=X1,σ1=σ0,γ1=γ0,其中,σ0、γ0、是预先设定的常数。

(3)对任意数据(Xi,ti)(i>1)进入系统后,开始训练网络,计算实际输出误差ei,根据式(9)和式(10)计算出dmin,根据式(11)计算可容纳边界的有效半径kd和误差指数ke。

(4)比较dmin与kd的大小关系,dmin>kd转到步骤(5),否则转到步骤(8)。

(5)比较ei与ke的大小关系,ei>ke转到步骤(6),否则转到步骤(10)。

(6)产生一条新规则,根据式(13)确定新规则的参数:

其中,k(k>1)是设定的重叠因子[6]。

(7)计算误差下降率ηi(详见文献[6,8]),ηi表示第i个规则的重要性,ηi越大,表示该规则越重要。通过比较误差下降率ηi与预先设定阈值kerr的大小来判断新规则的重要性,如果ηi<kerr那么说明新产生规则不重要,剔除新规则,然后重复步骤(3)、步骤(4),否则转到步骤(10)。

(8)比较ei与ke的大小关系,ei>ke转到步骤(9),否则转到步骤(10)。

(9)根据式(12)调整模糊规则层神经元的宽度。

(10)利用线性最小二乘法(LLS)调整补偿运算层到输出层的权值,详见文献[6]。

(11)重复步骤(3)、步骤(4)直到所有训练数据均进入系统训练过网络。

算法中涉及到的预设常数,都是经过多次实验比较后才确定的一个合适的初始值。

2 动态补偿模糊神经网络在人脸识别中的应用

Weizmann人脸数据库包含28个人,每个人45张图片,分别是每个人在5种角度(其中相邻两种姿态角度相差17°)、3种光照(左侧、正面以及右侧光照)和3种表情下的不同图像,每幅图像的像素是512×352。为了提高算法速度在进行训练和测试前首先将图像缩小到64×44像素。图2中从左向右分别显示的是3种不同光照条件下的图像,每组图像包括3种表情,从上到下分别是5个不同角度下的图像。

选取数据库中每个人在偏移角度为0°和±17°下的图像做训练集来训练网络,剩余的2个角度(±34°)做测试集来测试网络的性能。首先由训练集分别利用状态估计方法对测试集进行状态估计[9],然后利用张量脸方法[10]对图像进行特征提取,最后分别利用径向基神经网络(RBFNN)、动态模糊神经网络(DFNN)[6]和动态补偿模糊神经网络(DCFNN)进行训练和测试,通过对测试集的正确识别率来反映网络的性能,实验结果如表1所示。

同时,得到动态模糊神经网络(D-FNN)和动态补偿模糊神经网络(DCFNN)的均方根误差以及训练时的实际输出误差的对比情况,分别如图3和图4所示。

从图中可以看出,虽然DFNN训练时的实际输出误差总体低于DCFNN的,但是经过多次训练之后DCFNN的均方根误差总体小于DFNN的均方根误差。所以,总体上来看DCFNN的性能是优于DFNN的。

此外,为了更好地验证DCFNN的性能,本文又利用ORL人脸数据库中的图像进行了训练和测试。该数据库由40个人,每个人有10幅大小为112×92、灰度级为256的人脸图像组成,如图5所示其中一个人的十个不同表情图像。

训练集由每人前5幅共200幅人脸图像组成,测试集由每人的后5幅共200幅人脸图像组成,且训练集与测试集的人脸图像互不重叠。然后利用PCA对图像进行特征提取,最后分别利用径向基神经网络(RBF)、动态模糊神经网络(D-FNN)[6]和动态补偿模糊神经网络(DCFNN)进行训练和测试,得到实验结果如表2所示。

从实验结果可以看出,动态补偿模糊神经网络分类器的性能优于动态模糊神经网络分类器的,基于动态补偿模糊神经网络的人脸识别分类器的正确识别率高于基于径向基神经网络人脸识别分类器和基于动态模糊神经网络的人脸识别分类器。

3 结语

本文在研究动态模糊神经网络和补偿模糊神经网络的基础上建立了基于动态补偿模糊神经网络的人脸识别分类器,并提出了一种改进的动态模糊神经网络。改进模型结合了动态模糊神经网络和补偿模糊神经网络的优势,使网络结构更优化,提高了网络的泛化能力。在Weizmann人脸数据库和ORL人脸数据库上的实验结果表明,该模型的性能优于一般神经网络和动态模糊神经网络。

摘要:结合动态模糊神经网络和补偿模糊神经网络,提出一种改进的动态模糊神经网络。首先介绍动态补偿模糊神经网络的结构和学习算法,然后将其用于人脸识别。对Weizmann人脸数据库和ORL人脸数据库的人脸图像识别实验表明,动态补偿模糊神经网络分类器算法性能优于一般的动态模糊神经网络。

关键词:模糊神经网络,动态补偿模糊神经网络,模糊规则,人脸识别

参考文献

[1]Lawrence S,GIL Es C L,Tsoi A C,et al.Face recognition:a convo-lutional neural network approach[J].IEEE Trans Neural Network,1997,8(1):98-113.

[2]Intrator N.Face recognition using a hybrid supervised/unsupervised neural network[J].Pattern Recognition Letters,1996,17(1):67-76.

[3]Gu TTA S,Wechsl ER H.Face recognition using hybrid classifiers[J].Pattern Recognition,1997,30(4):539-553.

[4]丁震.模糊数学理论与信息融合技术的应用研究[D].南京:南京理工大学,1997.

[5]Noza KI K,Ishibuchi H,Tana KA H.A simple but powerful heuristic method for generating fuzzy rules from numerical data[J].Fuzzy Sets and System,1997,86(3):251-270.

[6]武世虔,徐军.动态模糊神经网络——设计与应用[M].北京:清华大学出版社,2008.

[7]闻新,周露,李翔,等.Matlab神经网络仿真与应用[M].北京:科学出版社,2003.

[8]Chen S,Cowan C F N,Grant P M.Orthogonal Least Squares Learning Algorithm for Radial Basis Function Network[J].IEEE Trans.Neural Networks,1991,2:302-309.

[9]Hyung-Soo Lee,Daijin Kim.Tensor-Based AAM with Continuous Vari-ation Estimation:Application to Variation-Robust Face Recognition[J].IEEE Transactions on PAMI,2009,31:1102-1116.

动态模糊神经网络 篇4

随着现代控制技术的提高, 模糊控制和神经网络得到了极大发展。模糊控制利用它独特的控制方式在一定程度上促进了铝电解过程控制的发展, 但是模糊控制过于依赖专家经验, 在控制过程中不能自适应优化参数, 使得所开发的铝电解过程控制系统的适应性和灵活性较差。而利用神经网络的一些优点, 如学习能力、自适应能力以及泛化能力, 可以很好地与模糊控制形成互补。基于上述背景, 本文提出采用广义动态模糊神经网络算法进行铝电解过程控制。该算法的优点在于不需要铝电解领域的专家知识, 利用铝电解槽实际样本便可对系统自动建模及抽取模糊规则。所得到的系统模型具有结构紧凑的特点, 避免了过拟合现象, 给铝电解控制量决策带来极大方便。本文将广义动态模糊神经网络 ( GD-FNN) 方法运用在铝电解槽的出铝量和氟化铝添加量的预测过程中, 并利用铝电解厂实际数据训练模型结构及其参数, 最终得到预测模型。然后将设定的铝电解槽温度、分子比和铝水平作为输入量, 代入到预测模糊控制模型中, 得出出铝量和氟化铝添加量的预测值, 再与铝电解槽实际值进行对比, 评判该算法的实用性能。

1系统模型的建立

铝电解过程中, 工业电解槽上所有工艺参数相互影响, 如电解槽温度、分子比、铝水平、炉底压降、氟化铝累积添加量、炉膛形状、物料性能等。 对于这样一个多变量耦合系统, 很难建立其数学模型[1]。我们利用GD-FNN建立铝电解预测模型, 采用对输出量影响较大的主要因子作为输入量对每日出铝量和氟化铝添加量进行预测。

所建立的GD-FNN结构[2]如图1所示。输入层的输入变量为电解槽温度x1、分子比x2和铝水平x3, 且每个输入变量都有u个高斯函数, 分别为A11~ A1u, A21~ A2u和A31~ A3u, 这里采用高斯函数作为隶属函数, 将多维输入变量映射到相应的一维隶属函数空间; T - 范数层为模糊规则R1~ Ru; 输出层的输出变量为加权 ( ω 为权值) 后得到的每日出铝量y1和氟化铝添加量y2。由于系统结构是动态构建的, 所以u的值会根据训练结果的不同而不同。

GD-FNN网络隶属函数层选用的高斯函数为:

式中, Aij (xi) 是xi的第j个隶属函数;cij和σij分别为xi的第j个高斯函数的中心和宽度。通过调整这两个值, 可以控制高斯函数对输入量的表达程度。

T-范数层的每个节点分别代表一个模糊规则中的IF部分, 第j个节点规则

则输出层的输出是:

其中, ωjp=kjp+kjp1x1+kjp2x2+kjp3x3

上述式中, kjp, kjpi是实数值参数。对于GD-FNN系统, 该层节点和连接组成了去模糊器, 执行去模糊化的功能。

使用矩阵表示方法, 不难得到

其中,

2模型训练

铝电解槽的模糊规则是在学习过程中逐渐增长而形成的, 依据前面搭建的GD-FNN结构, 采用GD-FNN学习算法来训练网络。通过训练, 由规则数u的确定对系统结构进行辨识, 并求解网络参数, 最终得到预测模型。

2. 1模糊规则的产生

在输入第1组样本时, 根据新规则生成公式得到第1条规则的前提参数并确定其结果参数。 之后, 根据系统的输出误差和可容纳边界, 判断是否需要增加新的规则, 并对规则库中的规则进行适当修剪后, 去除对系统不起作用的规则, 最终确定规则数。

2. 1. 1规则产生准则

令X ( k) =[x1 ( k) , x2 ( k) , x3 ( k) ]T是第k个输入向量 ( k为样本组数, k = 1, 2, …, n) , T ( k) = [t1 ( k) , t2 ( k) ]T是第k个期望输出向量, Y ( k) = [y1 ( k) , y2 ( k) ]T是第k个预测输出向量。模糊规则的产生取决于铝电解槽预测模型的输出误差e ( k) 以及新的样本输入向量X ( k) 是否在隶属函数的可容纳边界内两个条件。

系统的第k个系统误差e ( k) 为向量T ( k) 和Y ( k) 之间的欧式距离, 表示如下:

在系统中按以下规则预先设定GD-FNN期望输出误差:

式中, emin和emax分别为系统的最小、最大值期望输出误差。在学习初期称为粗糙学习, 可将emax设为较大值, 然后逐渐衰减到emin, 以实现精细学习。 本文中emin和emax是通过经验值估计, 然后仿真结果对比之后确定得到的。k为对第k组样本的学习次数。

如果‖e ( k) ‖ > ke, 则表示预测输出不符合GD-FNN期望的输出精度, 应该考虑增加一条规则; 否则, 不考虑。

我们采用通过欧式距离来判断新的样本输入向量X ( k) 是否在可容纳边界内。如果其最小欧氏距离位于某个存在的高斯函数覆盖范围内, 则X ( k) 可由此高斯函数表示, 否则需要增加一条新的模糊规则。计算当前输入向量X ( k) 和与之前的高斯函数中心cij之间的欧式距离dk, 即dk= ‖xi ( k) - cij‖, 并从中找出最小欧式距离dk,min。 在系统中按以下规则预先设定样本输入高斯函数可容纳边界有效半径:

式中, dmax和dmin分别为可容纳边界的最大、最小半径。在学习的初期称为粗糙学习, 可将dmax设为较大值, 然后逐渐衰减到dmin, 以实现精细学习。本文中dmax和dmin是通过经验值估计, 然后仿真结果对比之后确定的。

如果dk,min> kd, 则表示新的样本输入不满足可容纳边界判据, 应该考虑产生一条新规则; 否则, 不考虑。

当上述两个条件均满足时, 就增加一条新规则; 若只满足一个条件, 则不增加。

2. 1. 2模糊规则的修剪

模糊规则的修剪是采用误差下降率 ( E) 方法[2]作为修剪策略, 对规则库中不起作用或对铝电解槽系统重要度不够的规则进行删除。这种方法为寻找重要的回归量提供了一种简单有效的方法。对于本文中3输入2输出的铝电解槽预测模型, E矩阵定义为:

式中, epiu+j越大, 则表示第i个输入变量的第j条模糊规则对期望输出tp越重要;ej为第j个规则的第p (i+1) 个误差减少率。

定义第j条规则的总误差减少率Tej为

在系统中预先设定重要性判断阈值kerr= 0. 002, 如果Tej< kerr, 那么第j条规则可以删除。

2. 2参数训练

规则数确定后即确定了网络结构, 下面就利用GD-FNN学习算法对网络参数进行分配并不断修正, 使网络输出尽可能接近期望输出值。网络参数分配包括前提参数的分配和修正以及结果参数的确定。

2. 2. 1前提参数的分配和修正

前提参数是指模糊层中高斯函数的中心 ( cij) 和宽度 ( σij) 。

令输入向量X ( k) 的第i个分量为xi ( k) 。当一条模糊规则产生后, 需要考虑如何分配它的前提参数。当第1组输入数据 ( X ( 1) , T ( 1) ) 进入系统后, 此时GD-FNN还没有建立起来, 因此, 需要建立第1条模糊规则, 前提参数的分配原则是高斯函数最优的表达输入量, 即高斯函数的值为1。 因此, ci1= xi ( 1) , σi1= σ × dmin。式中, σ 是系统预定义的常数, 一般取为0. 8。

当输入第k组新的样本输入X ( k) 时, 假设虽然已经产生了u个模糊规则, 但根据规则产生准则判定后, 系统仍需要产生一条新的模糊规则。 新的规则产生后, 需要判断是否要增加新的高斯函数, 如需要增加, 则分配新的高斯函数。我们通过最小欧式距离进行判断如下。

通过隶属函数层把多维的输入变量投影到相应的一维隶属函数空间, 并计算输入变量xi ( k) 与边界集 Φi= { ximin, ci1, ci2, …, ciu, ximax} 之间的最小欧式距离

其中, φi (j) ∈Φi

同时预先定义相邻高斯函数的相似性常数kmf, 其值取决于高斯函数对输入量的泛化能力要求, 本系统中设为0. 65。如果di ( j) ≤kmf, 则表示输入数据xi ( k) 可以被现有的模糊集表示, 不需要在该维增加新的高斯函数; 否则, 将分配一个新的高斯函数中心和宽度。高斯函数中心和宽度设置分别如下:

另外, 在网络训练过程中, 除了以上所说的产生一条新规则的情况以外, 还有另一种情况, 即当 ‖e ( k) ‖ > ke, 且dk,min< kd时, 表明系统虽然已经满足可容纳边界判据, 不需要产生一条新的规则, 但预测控制系统的输出误差无法满足其期望值, 这时不仅要调整结果权值, 还需要调整通过欧式距离找到的最接近新输入样本xk的第j个规则的高斯函数宽度, 减小椭球体域, 以获得更好的局部逼近。调整方法如下:

其中,

式中, δ由输入变量的灵敏度决定;kS为系统中预先设定的常数, 一般设为0.8;Bij表示第j个规则中的第i个输入变量的敏感性, 可表示为

2. 2. 2结果参数确定

结果参数是指T - 范数层到输出层之间的权值 ωj。

根据2. 1节的规则产生准则, 假设n组输入数据共产生了u个模糊规则, 其值可由式 ( 2) 得到, 再将工厂实际运行的输出数据T作为系统的理想输出, 然后根据这两个参数, 采用最小二乘法 ( LLS) 找出最优结果参数, 使理想输出与预测输出之间误差最小。

由式 ( 3) 可以得到预测输出与结果参数之间的关系, 我们将其写成矩阵形式Y = WR。确定最优结果参数W*的问题可以用公式表示为最小化 ‖WR - T‖的系统辨识问题。该问题通过最小二乘法 ( LLS) 逼近: W*R = T。

因此, 最优结果参数

3仿真实验

为了验证动态模糊神经网络算法在铝电解槽预测控制中的性能, 本文分别采用多电解槽和单一电解槽实际数据作为输入, 根据以上训练算法, 初始化各参数, 再通过Matlab m文件编写该算法, 训练出各自的网络结构, 最后将出铝量与氟化铝添加量的实际值与预测值比较, 得出结论。

3. 1数据预处理

电解槽中分子比是3 ~ 4 d采集一次, 每3 d出铝2次。鉴于电解槽测量参数的这个特点, 测量数据不能直接使用, 需要对输入模型的参数进行预处理。我们主要采用简单的加权平均和移动平均方法等进行预处理。其中, 对电解温度采用3 d加权平均, 在没有采集分子比时, 则使用最近一次的分子比和最近几日氟化铝添加量和温度等数据进行计算, 以得到可用的模型输入参数。

另外, 本系统还对输入数据进行均值化预处理, 解决各输入数据之间因计量单位和数量级存在差异而不能进行综合分析的问题。设共有n组原始样本数据xik, 各数据均值为, 则均值化后的数据

未处理前, 温度、分子比、铝水平的取值范围分别在[934 ℃, 971 ℃], [2. 27, 33. 4], [2. 3 cm, 32. 9 cm]; 均值化处理后, 温度、分子比、铝水平的取值范围分别在[0. 981 9, 1. 020 8], [0. 115 9, 1. 706 0], [0. 205 9, 2. 945 4]。

3. 2参数初始化

在铝电解预测系统中, 有很多预先设定的参数 ( 例如: ke, kd, kerr, kmf, kS…等) , 虽然这些参数缺乏物理意义, 但却直接影响系统网络结构的调整和参数生成。本系统中参数的选择是经过多次仿真试验后, 使电解槽预测系统预测结果最接近理想值而确定的, 并且某些预定义参数在训练过程中需要多次调整才能使系统达到最优运行效果。

3. 3仿真流程

仿真流程图见图2。

3. 4仿真结果

3. 4. 1多电解槽

我们分别在3个运行良好的铝电解槽中采集了466组数据, 其中300组作为训练数据, 166组作为测试数据, 对多电解槽预测输出模糊神经网络进行训练。完成数据预处理后, 将处理后的数据分别作为输入量和输出量。经过300组数据训练之后, 系统得到了5条规则。输入变量温度高斯函数有A11 ( 0. 98, 0. 015 6) , A12 ( 0. 98, 0. 019 4) , A13 ( 1. 02, 0. 019 4) ; 分子比高斯函数有A21 ( 0. 11, 0. 795 0) , A22 ( 1. 70, 0. 715 5) ; 铝水平高斯函数有A31 ( 2. 94, 1. 095 8) , A32 ( 2. 28, 1. 356 8) , A33 ( 2. 94, 1. 369 7) , A34 ( 0. 20, 1. 232 8) 。结果参数根据第2. 2. 2节运算, 得到一组2 × 20的结果参数矩阵。 根据高斯函数和结果参数矩阵, 由模型式 ( 3) 计算输出预测值, 并与实际检验值比较, 如图3所示。 由图上可以看出, 训练输入数据得到的预测数据曲线与实际值曲线变化趋势一致, 除个别点误差较大以外, 整体效果良好。测试输入数据得到的预测数据曲线与实际值曲线变化趋势大体一致, 但误差明显增大, 预测输出精度需要提高。

3. 4. 2单一电解槽

取同一个槽上的数据共167组, 将前119组用作训练网络, 后48组用作测试性能。训练后共产生了7条规则。输入变量温度高斯函数有A11 (0.98, 0.015 8) , A12 (1.01, 0.015 8) ;分子比高斯函数有A21 (0.78, 0.188 4) , A22 (1.16, 0.188 4) ;铝水平高斯函数有A31 (0.18, 0.070 1) , A32 (0.92, 0.070 1) , A33 (1.06, 0.070 1) 。然后通过运算得到一组2×32的结果参数矩阵。根据高斯函数和结果参数矩阵, 由模型式 (3) 计算输出预测值, 并与实际检验值比较, 如图4所示。由图上可以看出, 训练输入数据得到的预测数据曲线与实际值曲线变化趋势一致, 除个别点误差较大以外, 整体效果良好。测试输入数据得到的预测输出数据曲线与实际值曲线变化趋势大体一致, 在一些极值点与实际值重合, 误差较之多电解槽有所下降。

3. 4. 3结果比较

为了比较网络的预测性能, 本文采用绝对百分比误差APE作为性能评判指标, 对多电解槽和单一电解槽的预测精度APE进行了对比。

式中, t ( m) 和y ( m) 分别为第m个期望输出和实际输出。

多电解槽与单一电解槽比较结果见表1。 APEtrn和APEchk分别表示训练数据、测试数据的绝对百分比误差。

由表1可以看出, 在铝电解槽中运用广义动态神经网络进行预测时, 用单一电解槽比用多电解槽的数据作为训练样本得到的预测结果与实际值的误差更小, 这说明不能把多个生产效率不同的电解槽数据放在一起来建立控制规则, 原因是不同铝电解槽的管理人员不同, 采用的管理策略不同, 导致电解槽温度、铝水平、分子比不同, 使电解槽的参数指标有差异, 从而导致电解槽电流效率和电能消耗产生差异。但是可以通过实际良好运行的单一电解槽数据对单一电解槽预测系统进行训练, 得到控制规则, 建立预测模型, 再把良好的管理制度推广到一般电解槽, 就可以达到提高电解过程电流效率、降低能量消耗的目的。

在铝电解生产过程中, 同一车间结构相同、槽龄相同、原材料相同的电解槽的电流效率和能量消耗有时会相差很大。这种差别主要是由于管理者的经验和技术水平不同导致对温度和过热度等重要参数的决策不当, 具体体现在每日出铝量、氟化铝添加量的决策不当。所以把好的电解槽的管理制度推广到一般电解槽, 使电解槽管理朝标准化的方向发展, 是铝电解生产节能降耗的主要途径之一。

4结束语

本文利用广义动态模糊神经网络能够同时自适应结构辨识和参数调整以及学习速度快的优点, 构造了对铝电解中影响温度最大的每日出铝量、氟化铝添加次数的预测模型。通过对每日出铝量、氟化铝添加次数的输出决策, 可以达到对铝电解槽温度和过热度的控制的目的。结果表明GD-FNN算法运用在工业领域性能良好, 在一些非线性、多变量耦合的工业过程中可以解决一些传统算法不能很好解决的问题。

为了改善系统预测性能, 今后应进一步研究初始化参数的选取原则, 以提高系统的预测精度, 实现对铝电解过程温度和过热度的准确控制; 同时, 寻求更精确的模型反映变量重要性, 达到优化规则的效果。

摘要:铝电解过程中, 每日出铝量、氟化铝添加量的决策对铝电解过程温度和过热度的准确控制非常重要, 是影响铝电解技术经济指标的重要因素之一。本文基于广义动态模糊神经网络算法 (GD-FNN) , 构造了铝电解预测系统, 在给定铝电解槽所需温度之后, 对铝电解中的出铝量和氟化铝添加量进行预测。此算法通过对高电流效率、低能耗的电解槽的运行规律进行自适应分析, 训练出对应的决策规则, 运用到效率低的电解槽, 可以实现铝电解槽温度和过热度控制, 提高铝电解电流效率。通过对某铝电解厂实际数据进行仿真实验, 证明了该算法在铝电解控制中的有效性。

关键词:铝电解,出铝量,氟化铝添加量,广义动态模糊神经网络

参考文献

[1]曾水平, 李晋宏, 任必军.铝电解过程氟化铝添加量和出铝量的模糊决策[J].冶金自动化, 2008, 32 (1) :18-21.

[2]伍世虔, 徐军.动态模糊神经网络-设计与应用[M].1版.北京:清华大学出版社, 2008.

[3]纪荣方.主成分分析法中数据处理方法的改进[J].山东科技大学学报:自然科学版, 2007, 26 (5) :95-97.

[4]陈伟文.基于模糊神经推理系统的铝电解槽故障诊断研究[D].长沙:中南大学, 2010.

[5]彭强强, 曾水平.铝电解过程的氟化铝添加量的决策[J].冶金自动化, 2008, 32 (增刊2) :339-341.

模糊动态AHP导弹识别算法 篇5

弹道导弹为有效地突破反导防区天基、地基的各种光电设备的探测跟踪,采用了大量现代技术,使之具有多种突防与反识别措施。其飞行中段至再入段初期因飞行时间较长,便于进行跟踪和识别被认为是导弹防御的关键阶段,而中段的威胁目标群中,弹头与伴飞物的飞行速度和弹道轨迹大体相同,不利于速度和轨道参数识别,再加之各种电磁干扰与诱饵,因此单一的陆基雷达探测系统难以进行有效识别,已不能完全满足反导的需求,而天基红外预警卫星系统[1]是除雷达之外对弹道导弹进行监视与识别的另一种重要手段,其各类红外探测器能够获得识别真假弹头的多种特性,因而在弹道导弹目标识别中扮演着重要角色。

在一般情况下,弹道导弹的真弹头约占到有效载荷与容积的80%以上,弹头与诱饵及假目标在质量与形体上存在着较大差异,而不同目标的红外辐射特性又因其质量、形体的差异表现出不同变化规律。因此,导弹预警卫星系统的目标识别,主要是通过其所携带各类红外探测器从背景环境中区分出真假弹头的红外辐射特性差异。通过对各种情报及装备技术资料进行整理分析,本文认为,其中温度变化率、热容差异、辐射强度、灰度特性、运动特性是识别判断的关键因素,它们集中反映了弹头的物理和动力学特性。目前,国外研究弹道导弹在飞行中段及再入段的预警卫星目标识别的相关文章还少有报道,国内研究尚处起步阶段。文献[2]、[3]对预警卫星导弹粗识别与目标综合识别模型做了些有益的研究,但从公布的文献资料来看,预警卫星目标识别主要集中在早期预警(粗识别)和单一的红外识别技术及识别流程上,相关的信息融合算法研究还比较少。对此,本文提出一种信息融合下的多属性决策模型,对上述几种弹头的主要红外属性特征进行分析并作为目标识别特征量,完成了属性权重的动态构建,最后给出了仿真计算与结果分析。

1 弹道导弹目标红外识别原理分析

从中段到再入段初期,弹道导弹会产生如下动作:助推火箭关机,弹体分离,产生诱饵弹及气球、碎片等伴飞物质,再入大气层。这一阶段中,如何对目标群中的真假弹头识别成为预警卫星系统目标识别的重要任务。通过对这一时间段的目标群研究分析,发现以下几种目标红外特性及探测手段可利用目标的质量与形体间的关联来有效识别真假弹头。1)温度变化率。目标的温度变化与其质量存在着一定关系:由于弹头的质量最大,因此在同样外部环境下,弹头的温度变化要比诱饵慢得多[4,5,6],所辐射出的红外信号也比诱饵要强。因此,可采用双色长波红外阵列组成一个辐射比温度计,通过在两个红外谱段测量目标的辐射功率之比值,来消除因目标的表面物理特性不同而带来的发射率的影响,以确定出目标群中各个物体的相对温度高低,记录其变化过程,并进而推导出各个物体的相对质量大小。2)热容差异。当目标群进入中段飞行后暴露于温度极低的外太空环境中以及再入段初期进入大气层,这两个时间段目标温度随时间的变化规律反映了其热量吸收率av与放射率εIR的信息,其中重目标的热量吸收率av与放射率εIR的比值av/εIR,即热容量,比轻目标的变化快[6,7]。因此,通过短波和中波红外探测器测量目标的av/εIR可以有效地识别目标。3)辐射强度。目标表面被认为是具有一定发射率的灰体,其辐射强度由表面温度和发射率决定,而发射率是由目标的材质、质量、表面涂层材料、壳体厚度等因素构成。进入大气层前,目标群温度基本处于平衡状态,而一旦进入大气层后,气动加热将使表面温度迅速升高,一些轻诱饵都将被燃烧掉,剩下的主要是弹头和重型诱饵。它们的速度在100 km以上的高度上几乎无差异,但它们的辐射强度则随着高度的降低出现明显区别[4,5,8]。其中辐射强度变化率单调增加无明显波动,且辐射强度最大者即为弹头。4)灰度特性。目前,随着在低轨天基红外系统(SBIRS-Low)中大规模像元的焦平面阵凝视红外成像器[9]硬件和超高速图像信息处理软件技术等的应用,使红外成像技术对真假弹头的识别更加有效。红外成像可以对飞行中众多目标的红外图像进行分析判断[10],以达到利用目标的灰度特性来识别弹头的目的。例如同样环境下,真弹头温度变换比假目标与诱饵慢,其红外成像灰度上,弹头灰度变化就较为平缓。5)红外识别运动特性。可以通过一系列红外图像检测目标的运动特性。诱饵及假弹头、弹体碎块等在分离抛射过程中由动量守恒而产生的分离前后相对速度的变化。以及再入段初期,受空气阻力和各自质量与形体的影响,再入减速特征差异明显[4,11],而弹头则因形状规则重心稳定,其运动相对平稳且速度最快,根据目标红外运动图像序列,可以识别出真假弹头。

综上所述,以上五种红外特性均能从不同侧面反映出目标间的质量形体差异,但各有其局限性:一是判定时只考虑一个因素或部分因素,其可靠性与准确性不佳;二是各因素在不同时间段,表现效果会有较大变化。而将此五项因素构成决策的综合属性集,可以较全面、准确的反映各目标的红外威胁程度。因此,结合目前相应红外传感器的可靠性与精确性,本文主要综合利用这五个红外特性作为目标识别的依据。

2 模糊动态AHP目标识别模型的建立

目标识别是一个推断和决策的行为,从上节分析可知,如果将每个目标看作一个方案,将各种红外特性分别看作各方案的属性,决策准则是目标红外威胁程度,则多目标识别就成为一个多属性决策的排序问题,实时甄选出威胁值最大的目标,即质量形体威胁最大的目标作为主要威胁目标,即达到目标识别目的。

2.1 总体模型

在此,根据由目标的质量及形体特征引起的红外特性变化规律,将目标群中具有较大质量与形体,可构成“可视的红外目标”的物质分为五类,由此设立方案集(即目标集)A={A1,A2,A3,A4,A5}={真弹头、气球、加热角锥体、重型假目标、弹体碎块},属性集G={G1,G2,G3,G4,G5}={温度变化率、热容差异、辐射强度、灰度特性、运动特性}。基于模糊动态AHP算法的识别排序模型如下图1所示。

由于在本属性集属性中既有定量描述又有定性描述,而且相互之间关系复杂,具有一定的模糊性。而层次分析法AHP是一种新的应用较为广泛的建模方法,利用层次分析数学可把半定性、半定量的问题转化为定量计算,但传统算法中简单利用成对比较法构造判断矩阵比较粗糙,主观随意性大,所以,本文结合模糊动态评判来构造判断矩阵和决策模型可以提高评估精度,增强决策的科学性。

2.2 应用比较法和模糊动态评判法构造属性重要性矩阵

AHP的主要步骤:1)建立层次结构;2)构造判断矩阵并进行一致性检验;3)求解权重向量,综合排序。而在第2步中传统的判断矩阵构造中的两两属性比较法,由于简单采用1—9标度法,构造矩阵比较粗糙,甚至会出现逻辑上不合理的情况,一致性比较差,而且不能求解重要性随时间变化的因素的权值。因此,本文引入模糊动态评判法来构造判断矩阵,具体步骤为:

1)构建两个属性对于目标的相对重要性矩阵。采用专家打分对比法,根据各自的相对重要性给予评分,采用1—9标度法[12],如有属性G1、G2,专家P的打分分别为n1、n2,则G1关于目标的相对重要性指标为ap=n1/n2,而G2关于目标的相对重要性指标为bp=n2/n1。用此方法可以得到任意两个属性关于目标的相对重要性指标,构造出判断矩阵。通常,给出的判断矩阵很难满足完全一致性[13],文献[12]指出当n阶判断矩阵的最大本征值λmax小于相应的临界本征值λ′max时,即认为判断矩阵A具有满意一致性。

2)建立动态因素[13]。如第i个因素相对于第j个因素比较,则可表示为aij Tm=(lij Tm,xij Tm,uij Tm),其中xij Tm为相对重要度即中心值,Tm为时间,lij Tm和uij Tm分别为aij Tm的左右范围。当uij Tm—lij Tm的值越大,判断越模糊;反之,越清楚。设A(Tm)=(a ij Tm)n×n×Tm是模糊判断矩阵,满足:

3)计算判断矩阵权值向量。首先确定时间Tm,采取文献[13]中的方法对判断矩阵(仅针对中心值,而非左右范围)进行微调,使之达到一致性要求。如调整后的一致性判断矩阵为A(Tm)=(a ij Tm)n×n×Tm(Tm已确定),则经过一系列推导,可以得出如下计算公式:

首先,第i个因素满足n个目标的综合程度值(ei)[13]的计算公式为

其次,第i个因素未归一化权重(ωi)[13]如下所示:

式中:α∈[0,1]为决策者的优化度。当α=1时,表示一个决策者的乐观观点;当α=0时,表示决策者的悲观观点;当0<α<1时,表示决策者的观点介于两者之间。

将求出的权重ωi逐层聚合后,进行归一化处理,即可得到归一化权重ωi*。取不同时间段Tm,重复上述步骤,即可求出各个关键时间段上的归一化权重向量WTm=[ω1*,ω2*,ω3*,ω4*,ω5*]T,它表示n个特征属性的相对威胁程度大小。

4)时间Tm与tmn的确定。T为根据导弹各飞行阶段呈现不同的特点而划分的若干连续时间段集合T={T1,T2,...Tm},各Tm对应于相应的归一化权重向量WTm,其间包含预警卫星对目标群的探测时间点tmn,即tmn∈Tm。

结合本模型,参评专家P为天基红外预警卫星所采取的各探测技术手段,决策优化度α为某时间段Tm属性Gi的观测效果权值。所以,本文充分考虑了空间与时间上的信息融合,以降低识别结果的不确定性。

3 算法实现

3.1 属性权重的确定

利用模糊动态法来构建属性相对重要性矩阵A,可以较好地解决五个红外属性特征的相对重要性随时间变化而改变的问题。例如,在导弹飞行中段时期的灰度特性相比运动特性变化明显,易于辨别弹头,因而灰度特性相对于运动特性重要。而到了再入段初期,目标群的运动特性相对于灰度特性变化明显,易于分辨弹头,因而运动特性相对于灰度特性重要性上升。

为了说明动态判断矩阵在整个识别过程中属性相对重要性的变化,本文选取T1为再入段初期一时间段为例,结合目前各相应红外传感器的探测精度,预先制定属性相对重要性矩阵A如表1,并存入数据库。本文限于篇幅,只列出了中心值的判断矩阵,对于矩阵中除对角线以外的值大于1的元素,其左扩展为中心值减去1,右扩展为中心值加上1,对于矩阵中除对角线以外的值小于1的元素,可以按式(1)处理。

通过“本征向量法”[12]求得表1的λmax=5.279,小于五阶矩阵的临界值λ′max=5.45,可以通过一致性检验,以下各表求λkmax方法同。取α=0.5,防御系统方根据式(1)~(3)和表1可实时计算得五个因素在T1的归一化相对威胁权重系数为:TW1=[.0293,.0297,.0082,.0159,.0168]T。

3.2 确定各属性下的判断矩阵

以某型洲际弹道导弹为例进行计算。各属性下目标威胁判断矩阵计算过程不同于属性重要性矩阵A。取观测时间点t1n为再入段初期一时刻(t1n∈T1),各目标在五项属性下的变化情况,目前无法直接得到探测数据,只能依据前面的理论和文献[4]、[5]、[8]及相关情报资料建立的数据库,进行模拟计算仿真,防御系统方再将实时结果两两比较,得出各属性下目标威胁判断矩阵。

例如,对于温度变化率属性G1,经计算五类目标相互之间的威胁性比较矩阵P1,如表2所示。

其中,λ1max=5.293<λ′max=5.45,符合一致性要求。求解

得特征向量Wk=[w1k,w2k,w3k,w4k,w5k]T即为各目标在第k个特征属性下优劣比较的权值向量,

热容差异判断矩阵P2,辐射强度判断矩阵P3,灰度特性判断矩阵P4,运动特性判断矩阵P5(考虑再入减速特性差异)中,各目标相对威胁性比较,如表3、4、5、6所示。

整理后得各目标在五个红外特征属性下的决策矩阵Ct1n=[W1,W2,W3,W4,W5],如表7所示。

3.3 计算各目标的威胁值

目标的威胁值是指目标的红外特性威胁程度大小,据此判断各目标属于弹头的可信度,将其按大小排序后,最大值者即为真弹头。根据前面求得的各属性权重和综合决策矩阵,利用简单的矩阵相乘法则,就可得各目标的红外威胁值(如图1所示),按下式计算:

最终得各目标红外威胁值为

按威胁值大小排序为A1>A3>A4>A2>A5。由排序结果可以看出,A1具有最大红外威胁值,防御系统即判其为真弹头,与仿真系统中攻击方所给情况一致,达到预期效果。其余各目标的红外威胁值与各自目标的真实情况基本一致。

而在T2飞行中段一时期,用上述方法计算出各目标t2n时(t2n∈T2)红外威胁值为

按威胁值大小排序为:A1>A4>A3>A2>A5。通过比较可以看出,两次计算的排序结果基本一致,只是A3,A4的红外威胁值排序发生了变化。这是因为飞行中段时期目标灰度特性相对于运动特性重要,说明在不同时间,各属性的相对权重系数发生了一定变化,从而最终影响了各目标红外威胁值向量Mtmn的计算结果。本例证明该方法的正确性与有效性。本文相对于文献[2]做到了更进一步的弹头目标精识别。

结束语

动态模糊神经网络 篇6

关键词:动态能力,灰色模糊综合评价,指标体系

自动态能力理论提出以来, 众多学者就开始了对动态能力构成要素或维度的研究, 尤其在最近几年中, 不少学者对动态能力的理论与实证进行研究, 不断揭开动态能力的黑箱。

先前研究主要从理论与实证方面来探讨动态能力的构成要素。一是从理论探讨中来研究其构成。Teece认为动态能力由三种能力组成:感知、塑造机会与威胁的能力;捕获机会的能力, 通过提升、组合、保护、重组企业资源来保持竞争力的能力。Zott认为动态能力是一种系列的组织程序, 可以内化为日常运营惯例, 从而指导构建企业资源。Lichtenthaler和Muethe也认为动态的创新能力可以从上述维度进行分解。二是从实证研究来分析动态能力的构成部分。郑素丽等透过知识视角, 将动态能力与知识相结合, 用调查问卷量表化知识获取、知识创造、知识整合三个维度。徐思雅和冯军政引入诺基亚的衰落案例, 实证研究了通信领域的动态能力, 侧重于获取外部资源以及资源释放这两个维度。

然而, 企业的动态能力在测评方面的定量研究比较少, 同时动态能力的“黑箱”还未被完全打开, 可以被视为一个灰色系统, 因而适合采用灰色模糊的方法对其进行评价。因此, 基于以上分析, 本文将动态能力分为四个维度:感知能力、整合能力、吸收能力和创新能力, 并构建评价指标体系, 以为评价动态能力提供借鉴。

一、动态能力指标体系

本文建立了反映动态能力的指标体系, 如图1, 首先, 感知能力包括了感知环境与市场的能力X11 (对企业内外环境的识别、感知, 外部环境包括政治、经济、社会、技术等的变化, 内部环境包括组织战略、结构、人力资源等;竞争对手的反应等) 、风险和威胁的预警能力X12 (对企业内外部风险的预警) 、市场新机遇的发现和塑造能力X13、顾客需求变动和市场反应的鉴别能力X14。整合能力包括内部整合能力和外部整合能力。内部整合能力X21是组织内部不同的子单位之间的全面协作, 对组织内部的各种资源包括人力资源、财务资源、物力资源、知识资源等的全面协调以完成给定目标。外部整合能力X22是对市场知识与顾客群的整合能力、对新技术知识的整合能力。客户整合是把未来顾客的信息、知识与他们对产品的使用和开发流程工艺与工程细节的理解连接起来。技术整合是把企业内外的技术知识的进化基础与现有的组织内部的能力基础连接起来的能力。吸收能力包括获取能力、消化能力、转换能力、开发能力。获取能力X31是指企业识别与取得对企业的运用至关重要的外部资源知识的能力。消化能力X32是企业的惯例和流程使其分析、处理、解释与理解从外部获取的资源。转换能力X33是指开发和提炼企业惯例, 促进现有知识与新获取的知识的组合。开发能力X34使企业提炼、扩展及利用现有的能力, 或者是创造新能力, 通过把获取的并已转换的知识融合到企业的运营中。创新能力的指标包含技术创新X41是关于产品或服务和生产工艺技术的创新, 管理创新X42即组织结构和管理过程的创新。 (图1)

二、动态能力灰色模糊综合评价模型的构建

(一) 确定因素集与评语集。

根据已经建立的动态能力指标体系, 确定因素集为:X={X1, X2, X3, X4};子因素集为:X1={X11, X12, X13, X14};X2={X21, X22};X3={X31, X32, X33, X34};X4={X41, X42}。评语是对各一级与二级指标的优劣、强弱、好坏等的评价, 一般的评语集有: (非常重要、重要、一般、不太重要、不重要) 、 (非常强、强、一般、较弱、弱) (低、较低、一般、较高、高) 等, 可根据实际情况来确定评语集。本文将评语集确定为五级评语: (非常重要、重要、一般、不太重要、不重要) 或者 (非常强、强、一般、较弱、弱) , 分别对应的分值为 (5, 4, 3, 2, 1) 。

(二) 确定权重集。

权重集可视为指标集与评价对象之间的灰色模糊关系, 可利用专家评分法确定各评价指标的权重, 其相应的灰度也通过专家评分的方法给出。

在企业动态能力评价中, 由于评价各指标大多是定性指标, 其好坏强弱所用到的信息可能是不完全的, 很难用数值来衡量, 所以本文使用一些描述性的语言来对应一定的灰度范围, 将信息多少及其对应灰度值如表1, 具体的灰度评分视评判者的实际情况给定。 (表1)

(三) 建立灰色模糊评价矩阵。

评价矩阵可视为因素集与评语集之间的灰色模糊关系, 根据某一因素给出评价对象对评语集中各元素的隶属度uijs, 它是通过评价小组对某一评价对象的评价uij, 得到其在各种评语上的比重, 比如10个专家对“技术创新”的评价中2个人认为非常重要, 占20%;4个人认为比较重要, 占40%;3个人认为一般, 占30%;1个人认为不太重要, 占10%;0人认为不重要, 占0%, 则“技术创新”的隶属度为u41l= (0.2, 0.4, 0.3, 0.1, 0) 。并根据信息的充分程度给出相应的灰度, 从而得到评价矩阵:

(四) 一级灰色模糊评价。

为了保留尽可能多的评判信息, 在模部运算中采用M (·, 堠) 算子, 而在灰部运算中采用M (∧, 堠) 算子, 因此灰色模糊综合评判的结果为:

(五) 二级灰色模糊评价。

(六) 结果处理。

将评价结果按如下公式转化:

将评语集中评语等级给出标准分 (5, 4, 3, 2, 1) , 得到集合VT= (5, 4, 3, 2, 1) T, 据此可得到动态能力的度量值:

三、算例分析

现组织10位专家对某企业动态能力的状况水平进行评定。

(一) 权重及其灰度的确定。

评语集为 (非常强、强、一般、较弱、弱) , 对应的分值为 (5, 4, 3, 2, 1) , 通过专家估计法得到企业动态能力各级评价指标的权重, 各级指标的灰度值也由专家打分的方式给出。

(二) 灰色模糊评价矩阵的建立。

请10位专家对动态能力各指标进行评价, 可得到其各指标的隶属度及其灰度值, 从而得到灰色模糊评价矩阵:

(三) 一级灰色模糊综合评价按公式

按公式 (1) 计算得:

(四) 二级灰色模糊综合评价

由公式 (2) 可得到:

(五) 评价结果的处理。

根据已经确定的评语集及其对应的分值, 可以得出, 该企业的动态能力水平介于一般和较强之间, 这就要求企业采取适当的措施来增强自身的动态能力, 增强其在市场上的竞争力。

四、结束语

当前对动态能力的评价研究目前为止还非常有限, 本文采取的灰色模糊综合评价方法在对企业的动态能力进行评价是合适可行的, 并尝试用比较成熟的模糊综合评价理论以及用来解决信息不完全的问题的灰色理论对企业的动态能力进行评定, 因而能够加深企业对自身的动态能力状况的了解和理解, 为企业在多变动态的环境下培育、发展动态能力提供明确的方向和路径。本文的不足之处是对动态能力指标体系的组成部分的科学性未进行进一步的验证, 以期对企业发展动态能力有所裨益。

参考文献

[1]Teece, D.J.Explicating dynamic capabilities:the nature and microfoundations of (sustainable) enterprise performance[J].Strategic Management Journal, 2007.28.13.

[2]Zott, C.Dynamic capabilities and the emergence ofintra-industry differential firm performance:insights from a simulation study[J].Strategic Management Journal, 2003.24.2.

[3]Lichtenthaler U, Muethel M.The impact of family involvement on dynamic innovation capabilities:Evidence from German manufacturing firms[J].Entrepreneurship Theory and Practice, 2012.36.6.

[4]郑素丽, 章威, 吴晓波.基于知识的动态能力:理论与实证[J].科学学研究, 2010.28.3.

动态模糊神经网络 篇7

目前兆瓦级风力发电机组在风电市场占有重要地位。在风速高于额定风速时,往往采用变桨距控制方法使其输出功率保持在额定功率[1]。变桨距的风能转换系统由风力机气动子系统、传动系统和发电机组等组成。风能转换系统是一个强非线性系统[2,3],目前一般是采用在稳定点附近通过泰勒公式得出系统的线性方程来解决非线性问题[4],这种方法在稳定点附近控制效果很好和易实现。然而由于风电系统是一个风速大范围变化的系统,当工作点远离稳定点时,系统的控制性能就会大打折扣[5~8]。非线性动态逆方法是通过状态反馈将非线性系统转变成伪线性系统,该方法克服了局部线性化的缺点且具有工程意义[9]。为了满足控制要求,文献[2,10,11]提出在动态逆非线性控制中加入PID的控制,该方法在风速恒定时能保持很好的稳定性,但当风速大范围变化时,固定参数PID控制器的性能将下降。为解决此问题,本文在动态逆非线性控制中引入模糊控制算法,利用其不依赖系统的数学模型、鲁棒性好和抗干扰性强的优点[12~15],解决变桨距非线性系统的控制问题,有着很好的控制效果。

1 风电机组的数学模型

从空气动力学角度考虑,当风速过高时,需要通过调整桨叶节距,改变气流对叶片攻角,调整发电机获得的空气动力转矩,使功率输出保持在额定值。

变桨距控制是通过叶片和轮毂之间的轴承机构转动叶片减小迎角,由此来减少翼型的升力,达到减少作用在风轮叶片的扭矩和功率的目的。变桨距调节时,叶片的迎角可相对气流连续变化,获得希望的功率输出范围。

1.1 风力机非线性模型

风力机的风能捕获效率直接决定了风能转化系统的转化效率。风力机的建模原理是建立在贝兹理论和风电机的机械和气动特性基础之上的[1],风力机在风场中捕获的功率为:

其中Pm为风力机的吸收功率,r为空气密度,S为风轮扫风面积,Cp为风力机的利用系数也称功率系数,l是叶尖速比,b是桨叶节距角,R为风轮半径,Wr为风轮转速,v为风速。Cp可用l、b表示为:

Cp与l、b的关系可由图1表示。由图1可知,b从0°�8°时对应的Cp跟l的关系曲线是不同的,呈现非线性关系,所以在变桨距控制时应考虑其非线性。

1.2 传动机构动态数学模型

风力发电机组传动机构是风力机和发电机的连接环节,主要由风力机转子、低速轴、齿轮箱、高速轴和发电机转子构成,如图2所示。

低速轴侧的运动方程为:

其中Jr为风力机的转动惯量,Tr为风力机的转矩,Tm为高速轴传递给齿轮箱的转矩,n为传动比。

高速轴侧的运动方程为:

其中:Jg为发电机的转动惯量,Tn为发电机的电磁转距,Wf为发电机转子转速。

由式(4)、(5)可得到传动系统的运动方程:

1.3 变桨距机构模型

变桨距机构使得风力发电系统性能和运行的稳定性得到提高,考虑变桨距系统的时滞特性,可以用一阶系统来表示:

其中:T1为时间常数,b1为桨距角的设定值,b为桨距角的输出值。

根据以上得出的数学模型经过推导整理可得出变桨距风电系统的模型为:

其中:X=[b,Wr]T,控制量u=[b1,0]T

2 变桨距控制系统设计

2.1 动态逆控制的设计

动态逆的基本思想是利用全状态反馈抵消原系统中的非线性特性,得到输入输出之间具有线性行为的新系统(称之为伪线性系统),从而可以应用线性方法对系统进行控制。由于兆瓦级风力机的惯性比较大,电控子系统和桨距角调节子系统的响应速度远大于风力机系统,根据奇异摄动理论[2],可以忽略“快模态”,将系统模型降阶为一阶系统:

转矩的准稳态值,且,TN为发电机的额定电磁转矩,J=Jr+n2Jg。

单输入单输出系统求逆系统的方法为:先通过原系统求导,当y(n)(t)中含有u而y(n-1)(t)不含有u时停止求导(n≥1),这样根据隐函数定理可以解出u[9]。根据其算法可以求出式(11)的逆系统,表达式为:

且u根据式(14)求逆可得。

图中j为x,x反馈到逆系统中。

2.2 模糊动态逆变桨距控制器的设计

为了实现控制要求,在伪线性系统跟输入误差之间必须加控制器,根据风电机组自身具有的模型不确定性、参数易变性以及外界环境的复杂性[1],本文提出了采用模糊推理的控制器[15,16]。其结构框图如图4所示。

模糊控制鲁棒性能好,抗干扰能力强,无需知道被控对象的内部结构。本文采用风力机转速的误差作为桨距角控制信号,再通过调节桨距角来保证其转速为额定转速,输出功率为额定功率。由此确定模糊输入为转速误差和误差的变化率以及模糊输出j。

对于本文研究的风力发电机组,模糊输入偏差、输入偏差变化量以及控制量所取的模糊子集论域均为{-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6},模糊子集为{NB,NM,NS,ZO,PS,PM,PB}。为了保证控制的精度和平稳性,偏差与偏差变化量的隶属度函数采用三角形隶属度函数,控制输出量隶属度函数采用高斯型隶属度函数。根据调节要求确定模糊控制器规则如表1所示。

表1反应了误差和误差变化率出现7种情形时计算机给出的处理法则,遵循实际变桨距控制的规律。

3 仿真分析

通过MATLAB/SIMULINK对系统进行仿真[17]。风电系统的参数[10]如下:桨叶半径r=40m,空气密度为r=1.25kg/m3,切入风速为v=3m/s,切出风速为v2=22m/s,额定风速为vf=13m/s,风力机的转动惯量为Jr=9×107kg/m3,风力机的额定转速为r=1.5rad/s,传动比n=100,发电机的转动惯量Jg=97.5kg/m2,发电机的同步转速为1500r/m,发电机的额定功率为1.5MW,桨距角的时间调节常数为T1=0.1s。当风速大于切入风速低于额定风速时令桨距角b=0,采用最大功率系数Cp=0.445进行最大风能捕获;当风速高于额定风速且小于切出风速时,通过模糊动态逆变桨距控制方法调节桨距角,使得输出功率保持额定功率;当风速大于切出风速时变桨距角为90°,风轮停止转动。

本文对自然风进行模拟时考虑其随机性和突变性,用四种风速来构成。其四种风速分别为基本风速、阵风风速、渐变风速和噪声风速,自然风的仿真如图5所示。

为了更好的体现模糊动态逆变桨距控制方法的优越性,先采用PID动态逆变桨距控制,功率输出如图6所示。

由上图很容易看出当风速为固定风速15m/s时,虽然系统出现一定的超调量,但总体来说系统比较稳定。当风速不断变化时,采用自然风速来模拟时,系统就出现很强的不稳定性。当采用模糊动态逆变桨距控制时,风速用自然风速,功率输出如图7所示。

经过比较可看出采用模糊动态逆变桨距控制相对PID动态逆变桨距控制有很大的优势,在稳定性和抗干扰性方面更能贴切实际要求。

4 结论

由于风电系统的强非线性、迟滞性以及参数易变性,使得一般变桨距控制很难满足实际要求。本文对此提出了改进方案,用动态逆的方法使得系统的非线性问题得到解决,并通过加入模糊控制环节组成模糊动态逆变桨距控制器使得系统的抗干扰能力以及鲁棒性增强。

摘要:针对变桨距风力发电系统存在的非线性及风机参数的时变性特点,提出了风电系统在额定风速以上工作时基于模糊动态逆的变桨距控制策略。该策略研究分析风电系统的降级模型,并将此模型的逆系统跟原系统串联,通过反馈形成“伪线性”系统,有效解决变桨距风力发电系统存在的非线性控制问题,同时,采用模糊控制器解决外界干扰大、参数易变等问题。仿真结果表明,与其他非线性控制方法相比,该控制策略实时性更好、鲁棒性更强。

上一篇:营林工作问题下一篇:分散式处理