动态RBF网络

2024-05-13

动态RBF网络（共9篇）

动态RBF网络篇1

引言

径向基函数神经网络 (RBFNN) 以其简单的网络结构、快速的学习方法、较好的推广能力, 已经广泛地应用于许多领域, 特别是模式识别和函数逼近等领域。然而, 如何有效地确定RBF神经网络的网络结构和参数, 至今没有系统的规律可循。在RBF神经网络中需要确定的参数包括隐含层节点数、隐含层基函数的中心值和宽度、隐含层到输出层的连接权值。目前, 隐含层节点数主要依靠经验来选取。而根据moody准则, 神经网络的设计应该在满足精度要求的情况下有最小的结构, 以保证网络的泛化能力[1]。

由于隐含层基函数中心值的选取对网络的函数逼近能力有很大的影响, 目前最常用的确定隐含层中心值的方法是K-均值聚类法。由于K-均值聚类法的聚类过程一般能够根据输入向量比较准确地确定聚类数和相应的聚类中心, 因此, 如果在已知全部输入向量时使用该方法能够比较精确地确定网络结构。但是, 它要求实现确定全部输入向量和指定聚类中心的数目, 这在实际应用中很难办到。而动态K-均值聚类方法能够根据输入来实时地确定网络的中心。因此, 本文提出动态均值聚类方法, 对一般的K-均值方法进行改进。

一、BRF神经网络的结构原理

RBF神经网络最基本的结构形式是一种三层前向网络。网络的基本构成包括输入层、隐含层和输出层, 各层的节点数目分别为P, M, L, 每一层都有着完全不同的作用。其结构如图1所示。

第一层是输入层, 由一些信号源节点 (感知单元) 组成, 它们将网络与外界环境连接起来。第二层是隐含层, 由若干个隐节点构成。隐含层只有一个隐含层单元, 采用径向基函数作为其输出特性。第三层是输出层, 由若干个线性求和单元的输出节点组成, 它对输入模式的作用产生响应。输入层节点传递输入信号到隐含层。从输入空间到隐含层空间的变换是非线性的, 而从隐含层空间到输出层空间的变换是线性的。网络输出节点计算隐节点给出基函数的线性组合。输入层到隐含层之间的权值固定为1, 只有隐含层到输出层之间的权值Wkj (k=1, 2, …, L;j=1, 2, …, M) 可调。

在图1中, 输入层由P个信号源节点组成。设N为当前训练的样本总数, 对于训练集的每个样本即为输入矢量:X= (xl, x2, …, xp) , 其中xi (i=1, …, P) 为网络的第i个输入。隐含层由M个隐节点组成。每个隐含层节点的激活函数是一个径向基函数, 它是一种局部分布的中心点径向对称衰减的非负非线性函数。由于高斯基函数具备表示形式简单、径向对称、光滑性好、易于进行理论分析等优点, 所以文中隐含层变换函数采用高斯基函数, 其表达形式如下所示:

其中, X= (x1, x2, …, xp) T为网络输入矢量。Cj为隐含层第j个高斯单元的中心矢量, 与X具有相同维数的向量, Cj= (cj1, cj2, …, cjp) , (j=l, 2, …, M) 。ðj是第j个感知的变量 (可以自由选择的参数) , 它决定了该基函数围绕中心点的宽度。M是隐节点的个数。‖X-Cj‖是向量X-Cj的Euclid范数, 表示X和Cj之间的距离。Φj (X) 为隐含层第j个节点的输出, 即为第j个隐节点的活跃值。当前活跃值矢量为。由高斯公式可知, 从输入层到隐含层之间是一种函数变换, 隐含层节点的输出范围在0~1之间, 且输入样本愈靠近节点的中心, 输出值愈大, Φj (X) 在Cj处有一个唯一的最大值。随着‖X-Cj‖的增大, Φj (X) 迅速衰减到零。输出层由L个节点组成。设N为当前训练的样本总数, 对于每个样本即为网络的实际输出矢量为:yk= (y1, y2, …, yL) , k=l, …, L, 为网络的第k个输出。RBF神经网络的输出为隐含层节点输出的线性组合, 输出形式可表示为:

其中L是输出节点个数, Φj (X) 为高斯函数。wkj为第k (k=1, 2, …, L) 个输出节点与第j (j=l, 2, …, M) 个隐节点的连接权值。

二、BRF中心调整的动态K-均值聚类算法

2.1 动态K-均值的引入

RBF网络中心学习过程分两步:一是根据输入样本确定隐含层各节点的变换函数的中心Cj和半径ρj;二是采用误差校正学习算法, 调节输出层的权W。其目的就是把输入数据分配到一定数目的有意义的类别中去, 即根据欧氏空间中的距离来对输入向量进行聚类。本文采用自适应调整聚类中心的方法——动态均值聚类法。

该方法的基本思想是:首先已知据聚类中心的数目, 然后随着向量的输入, 计算输入向量与特定聚类中心的欧氏距离。如果距离小于门限值, 则将该聚类中心所对应的输入向量的平均值作为新的聚类中心;如果距离大于门限值, 则将刚输入的向量作为新的聚类中心。再接着输入向量, 直到确定所有的聚类中心。

2.2 动态K-均值聚类算法在RBF中的应用

动态K-均值聚类算法在RBF网络中心选取中的作用是调整聚类中心, 使网络中心的选取更精确。它的计算过程可以简要的描述如下:

首先, 令类别数为0 (第一个输入会强迫创建出一个类别模式以支持该输入) 。以后, 每遇到每一个新的输入向量, 则计算它与任何一个已分配的类别模式之间的距离。如果指定第P个输入向量为X (p) 以及第j个聚类中心为Cj, 则欧氏距离d可以表示为:

其中M是输入向量的维数。

设输入向量X (p) 和所有已分配的模式类别之间的距离已知, 且和该输入矢量最近的中心为Ck, 应有d0=‖X (p) -Ck‖<‖X (p) -Cj‖, j=1, …, T, j≠k其中T是已分配类别的数目。

在确定了与输入矢量最近的中心后, k就已经确定了, 从而d0也就确定了。先把它和距离门限值ρ进行比较, 会有如下两种情况:

(1) 当d0<ρ时, 输入矢量X (p) 在允许的误差范围内, 该输入矢量属于第k个类别。也就是说, 如果用Sk表示第K个中心所对应的全部输入矢量的集合, 则X (p) ∈Sk。这时可以引入k-均值聚类方法的思想, 通过求得所有成员矢量的平均值来进行中心更新。即:

其中NSk表示第K个聚类中心所对的输入矢量的个数。

(2) 当d0>ρ时, 输入矢量X (p) 不在允许的误差范围内, 从而不能分配到该类别中去。此时, 应该以X (p) 为中心, 分配一个新的聚类中心, 算法流程图如图2所示。

上面的过程用动态聚类的方法实时的找到了网络的中心, 在确定网络中心Cj之后, 可以令相应的半径ρj等于其与属于该类的训练样本之间的平均距离, 即:

最后可以根据误差梯度下降法调节权值W以完成RBF网络学习过程。

三、仿真试验及结果分析

本实验通过RBF神经网络函数逼近的方法来比较K-均值聚类和动态K-均值聚类方法的优劣。实验环境为PC机一台, 所用工具为MATLAB。

考虑非线性函数y=2sin (πx) +2cos (0.5πx) , x∈[0, 10], 用RBF神经网络进行函数逼近。

x以0.1为间隔在[0, 10]上均匀取值, 可得到100个样本作为训练样本。RBF神经网络的中心点个数取m=20, 基函数用高斯函数。对分别采用K-均值算法和动态K-均值算法确定RBF神经网络中心进行比较:采用K-均值聚类算法, 训练时样本的最小平均相对误差为0.1014327, 图3为K-均值聚类法RBF拟合曲线。采用动态K-均值聚类算法, 训练时样本的平均相对误差为0.0731432, 图4为动态K-均值聚类法RBF拟合曲线。可见采用动态K-均值聚类算法可以获得更好的效果。

四、结论

本文在k-均值聚类算法的基础上, 将动态均值聚类方法应用到RBF神经网络。该方法有效地解决了k-均值聚类的局限性, 提高了RBF的网络学习能力。通过仿真实验验证了该方法的实用性和精确度, 可供进一步的研究和实际应用。

参考文献

[1]阎平凡, 张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社, 2003.

[2]张海朝, 黄淼.基于RBF神经网络的B样条曲面重构[J], 微电子学与计算机, 2008, 7.

[3]兰天鸽, 方勇华.构造RBF神经网络及其参数优化[J], 计算机工程, 2008, 33 (5) .

[4]Roy A, Govil S, Miranda R.A Neural Network Learning Theory and aPolynomial Time RBF Algorithm[J].IEEE Trans.on Neural Network, 1997, 8 (6) :1301-1313.

[5]潘登, 郑应平.基于RBF神经网络的网格数据聚类方法[J].计算机应用, 2007, 26 (2) .

[6]任江涛, 孙婧昊.一种用于文本聚类的改进的K均值算法[J].计算机应用, 2006, 26 (6) .

[7]Mashor M Y.Hybrid training algorithm for RBF network[J].Interna-tional Journal of the Computer, the Internet and Management, 2000, 8 (2) :48-65.

[8]Bianchini M, Frascono P, Cori M.Learning without minima radialbasis function network[J].IEEE Trans on Neural Networks, 1995, 6 (3) :749-756.

[9]Pedrycz W.Conditional fuzzy clustering in the design of radial ba-sis function neural network[J].IEEE Trans on Neural Networks, 1998, 9 (4) :601-612.

[10]Gonzalez J, Pojas I, Pomares H.A new clustering technique for function approximation[J].IEEE Trans on Neural Networks, 2002, 13 (1) :132-142.

动态RBF网络篇2

基于RBF神经网络的航空发动机故障诊断

航空发动机的`故障诊断研究在民航安全发面有着重要的意义,而故障诊断模型的建立尤其(RBF)神经网络建立发动机的故障诊断模型,论述了径向基函数神经网络的结构、学习和运行,并通过该模型对发动机参数进行辨识,结果表明RBF神经网络具有较高的故障诊断正确率.

作者：丁平白杰作者单位：中国民航大学,航空工程学院,天津,300300刊名：中国民航大学学报 ISTIC英文刊名：JOURNAL OF CIVIL AVIATION UNIVERSITY OF CHINA年，卷(期)：25(z1)分类号：V263.6关键词：航空发动机故障诊断径向基函数神经网络

动态RBF网络篇3

随着非线性、强耦合、多输入多输出机器人,数控机床,以及动力传动系统等精密机械系统对定位精度要求的不断提高,因摩擦的存在而引发的跟踪误差(特别是低速的情况下)、黏滑运动以及极限环振荡等非线性现象,对系统控制性能的影响越来越大。特别是对于一些重载的机器人[1],摩擦甚至造成了50%的误差。若负载、润滑条件以及环境条件改变,机器人系统中的摩擦也会发生相应的变化,即摩擦具有非线性、时变性、不确定性及复杂性。因此,对摩擦力进行辨识和补偿是一项不可缺少、重要和关键的研究任务。国内外众多学者以及技术人员采用了多种方法对机器人的摩擦进行补偿[2],若从控制策略角度来分类,主要有以下四种:①固定摩擦补偿技术;②基于部分摩擦特性的补偿技术;③自适应补偿方法;④不基于模型的补偿算法和神经模糊技术。

在处理动态摩擦这类具有不确定性、非线性的问题方面,RBF神经网络作为一种特殊的三层前馈神经网络,具有并行计算、分布式信息存储、容错能力强、自适应、学习收敛速度快等一系列优点,而模糊逻辑具有较强的定性知识表达能力和推理能力。因此,Kosko[3]综合两者长处,提出了基于结构等价型融合的模糊RBF神经网络系统,该系统的结构和权值都有一定的物理含义,在设计其结构时,可以根据问题的复杂程度及精度要求,并结合先验知识来构造合适的模糊神经网络模型,这样,网络的学习速度就会大大加快,并且避免了局部极值。

本文在遵循摩擦学的3个公理的前提下[4],结合机器人的动力学模型及7种重要典型的动态摩擦模型的特性[5,6,7,8],分析、总结了各种不同的摩擦补偿方法或技术的优缺点,提出了一种基于动态摩擦模型——LuGre模型的模糊RBF神经网络分块补偿的机器人数字鲁棒滑模控制算法,对机器人系统中的摩擦不确定项进行有效的估计、逼近、补偿,从而实现机器人系统高精度、高可靠、长寿命、大转矩、低能耗的目标。

1 带摩擦补偿的机械臂动力学模型

对于一个n自由度关节机器人,基于拉格朗日运动学建立的机器人动态方程为

$D (q) \ddot{q} + C (q, \dot{q}) \dot{q} + G (q) + F (\dot{q}) + τ_{d} = τ$ (1)

$\begin{array}{l} q \in R^{n} \dot{q} \in R^{n} \ddot{q} \in R^{n} τ \in R^{n \times 1} D (q) \in R^{n \times n} \\ C (q, \dot{q}) \in R^{n \times n} G (q) \in R^{n \times 1} F (\dot{q}) \in R^{n \times 1} \end{array}$

式中,q、 $\dot{q}$ 、 $\ddot{q}$ 分别为机器人各关节的位置、速度和加速度;τ为控制力矩;D(q)为对称正定的惯性矩阵; $C (q, \dot{q})$ 为哥氏力和向心力矩阵;G(q)为重力矩阵; $F (\dot{q})$ 为动态摩擦力矩;τd为外部干扰。

取 $x_{1} = q, x_{2} = \dot{q},$ 则式(1)可转化为以下动力学方程:

$\begin{array}{l} \dot{x}_{1} = x_{2} \\ x_{2} (k + 1) = D^{- 1} (x_{1} (k)) (τ (k) - C (x_{1}, x_{2}) x_{2} (k) - \\ G (x_{1} (k)) - F (x_{2} (k)) - τ_{d} (k)) \end{array}}$

(2)

在式(1)中,F为非线性动态摩擦补偿项。LuGre模型是一个比较完善的摩擦模型,能够准确地预测摩擦的各种重要特性,且对摩擦环节的动态补偿效果较好,已有学者用实验方法辨识了LuGre模型的参数[9]。但是,该模型动态参数的辨识迄今仍是一个难题。因此,本文采用模糊RBF神经网络来估计、逼近LuGre模型的动态参数。LuGre摩擦模型是基于鬃毛的平均变形来建模的。

鬃毛的平均变形用状态变量zi(关节i=1,2,…,n)表示[10],按照下式来建模:

Δzi(k)=x2(k)-σ0i|x2(k)|·(g(x2(k)))-1zi(k) (3)

式中,σ0i为鬃毛的刚度。

摩擦力由鬃毛的挠曲产生,可以描述为

Fi=σ0izi(k)+σ1izi(k+1)+σ2ix2(k) (4)

其中,σ1i是微观阻尼系数,σ2i是黏性摩擦因数。

函数g(x2)描述了Stribeck效应:

$g (x_{2} (k)) = F_{c i} + (F_{s i} - F_{c i}) \exp (- (x_{2} (k) / \dot{q}_{s})^{2}) (5)$

式中,Fc i为关节库仑摩擦力矩;Fsi为关节黏性摩擦力矩; $\dot{q}_{s}$ 为关节的虚拟速度。

根据式(3)～式(5),可以得出:

F(k)=σ0izi(k)-σ3ihi(x2(k))zi(k)+σ4ix2(k) (6)

σ3i=σ0iσ1iσ4i=σ1i+σ2i

hi(x2(k))=|x2(k)|(g(x2(k)))-1

2 模糊RBF神经网络数字鲁棒滑模控制

2.1 控制结构

本文所用的机器人数字控制系统框架如图1所示,采用三个RBF网络(图1中只画了一个网络)分别实现对F0i、F3i和F4i建模、估计[11],输入语言变量为 $z (\dot{q})$ 、 $h (\dot{q}) z (\dot{q})$ 、 $\dot{q} (k)$ ,FNN系统的输出为F,根据功能等价性,也可以把隶属函数层和T-范数层合并成一层,称为模糊化层。整个控制器输出的数字信号经过D/A转换成模拟信号(如电压或电流),用于控制机械臂各驱动关节,以一定的速度、加速度运动至一定位置,再经过A/D转换,与给定的位置、速度比较,得到相应关节的位置误差、速度误差,反馈到由滑模控制器、模糊RBF神经网络、鲁棒控制器构成的数字控制器,形成位置闭环、速度闭环,实现机器人的高精度、高可靠智能控制。则F0i、F3i、F4i的神经网络逼近、估计值为

$\begin{array}{l} \hat{F}_{0 i} (z) = [\hat{W}_{0 i} (z (\dot{q} (k)))]^{Τ} \cdot Ξ_{0 i} (z (\dot{q} (k))) \\ \hat{F}_{3 i} (h z) = [\hat{W}_{3 i} (h (\dot{q} (k)) z (\dot{q} (k)))]^{Τ} \cdot \\ Ξ_{3 i} (h (\dot{q} (k)) z (\dot{q} (k))) \\ \hat{F}_{4 i} (\dot{q}) = [\hat{W}_{4 i} (\dot{q} (k))]^{Τ} \cdot Ξ_{4 i} (\dot{q} (k)) \end{array}}$

(7)

其中, $Ξ (\dot{q})$ 为权函数, $\hat{W}$ 0i、 $\hat{W}$ 3i、 $\hat{W}$ 4i分别为实际权值W0i、W3i、W4i的估计权值,摩擦项的估计 $\hat{F} = \hat{F}_{0 i} - \hat{F}_{3 i} + \hat{F}_{4 i}$ 。

2.2 控制律的设计

设位置指令为x1d(k),x1(k)为实际的位置,则跟踪误差定义为

e(k)=x1(k)-x1d(k) (8)

滑模函数设计为

si(k)=ei(k+1)+Λei(k) (9)

其中,Λ为正定阵。

与滑模面函数相关的设定速度为

x2si(k)=x2di(k)-Λei(k) (10)

式中,x2di(k)为机器人各关节的给定速度;si、di对应不同的机器人关节。

控制律设计为

$\begin{array}{l} τ (k) = D (x_{1}) x_{2 s_{i}} (k + 1) + C (x_{1}, x_{2}) x_{2 s_{i}} (k) + \\ G (x_{1}) + \hat{F} (x_{2}) - Κ_{D} s_{i} (k) - Κ_{s} s a t (s_{i}) (11) \end{array}$

其中,KD=diag(Ki),Ki>0,克服模糊神经网络建模误差的鲁棒项为Kssat(si),Ks=diag(Ks i),Ks i>0,i=1,2,…,n。饱和函数设计为

$s a t (s_{i}) = {\begin{cases} 1 s_{i} ＞ δ \\ s_{i} / δ | s_{i} | \leq δ \\ - 1 s_{i} ＜ - δ \end{cases} δ ＞ 0$

(12)

式中,si为每个时刻滑模面函数的值。

自适应律设计为

$\begin{array}{l} Δ \hat{W}_{0 i} (z) = - Γ_{0 i} \cdot [ξ_{0 i} (z (k))] s_{i} (k) \\ Δ \hat{W}_{3 i} (h z) = Γ_{3 i} \cdot [ξ_{3 i} (h (x_{2} (k)) z (k))] s_{i} (k) \\ Δ \hat{W}_{4 i} (x_{2}) = - Γ_{4 i} \cdot [ξ_{4 i} (x_{2} (k))] s_{i} (k) \end{array}}$

(13)

其中,Γ0i、Γ3i、Γ4i为对称正定矩阵。

2.3 稳定性分析

定义Lyapunov函数为

$\begin{array}{l} V (k) = [s (k)]^{Τ} s (k) + \sum_{i = 1}^{n} [\tilde{W}_{0 i} (k)]^{Τ} \tilde{W}_{0 i} (k) + \\ \sum_{i = 1}^{n} [\tilde{W}_{3 i} (k)]^{Τ} \tilde{W}_{3 i} (k) + \sum_{i = 1}^{n} [\tilde{W}_{4 i} (k)]^{Τ} \tilde{W}_{4 i} (k) (14) \end{array}$

$\tilde{W}_{0 i} = W_{0 i} - \hat{W}_{0 i}, \tilde{W}_{3 i} = W_{3 i} - \hat{W}_{3 i}, \tilde{W}_{4 i} = W_{4 i} - \hat{W}_{4 i}$

根据D(k+1)-2C(k)的斜对称特性,并将式(1)、式(7)～式(13)代入式(14)得

$\begin{array}{l} Δ V = [s (k + 1)]^{Τ} s (k + 1) - [s (k)]^{Τ} s (k) + \\ \sum_{i = 1}^{n} [\tilde{W}_{0 i} (k + 1)]^{Τ} \tilde{W}_{0 i} (k + 1) + \\ \sum_{i = 1}^{n} [\tilde{W}_{3 i} (k + 1)]^{Τ} \tilde{W}_{3 i} (k + 1) + \\ \sum_{i = 1}^{n} [\tilde{W}_{4 i} (k + 1)]^{Τ} \tilde{W}_{4 i} (k + 1) - \sum_{i = 1}^{n} [\tilde{W}_{0 i} (k)]^{Τ} \tilde{W}_{0 i} (k) - \\ \sum_{i = 1}^{n} [\tilde{W}_{3 i} (k)]^{Τ} \tilde{W}_{3 i} (k) - \sum_{i = 1}^{n} [\tilde{W}_{4 i} (k)]^{Τ} \tilde{W}_{4 i} (k) \leq 0 (15) \end{array}$

3 仿真结果及分析

两关节机器人系统(图2)动力学模型参照式(1),其中,n=2,忽略外部干扰,机器人各关节低速的位置指令分别为qd1=-0.1cos t,qd2=0.1sin t,高速时为qd1=-cos t,qd2=sin t;系统的初始条件:低速时为qd(0)=[-0.1 0]或[0 0],高速时为qd(0)=[-1 0],其他条件一样, $z (0) = \dot{q}_{d} (0) = [00],$ 控制器参数为Λ=10I,KD=20I,W=2I,Γ0i=Γ3i=Γ4i=0.000 05I,摩擦补偿 $F (\dot{q})$ 采用式(6),其中,神经网络高斯基函数权值W(0)=0,中心ci=0.6rand(1,5),σi=150×[1],重力加速度g取为9.8m/s2,机器人参数及其摩擦力参数见表1,机器人的动力学模型如下:

$Μ (q) = [\begin{matrix} m_{11} & m_{12} \\ m_{21} & m_{22} \end{matrix}]$

(16)

m11=(m1+m2)L21+m2L22+2m2L1L2cosq2

m12=m2L $_{2}^{2}$ +m2L1L2cosq2

m21=m2L $_{2}^{2}$ +m2L1L2cosq2m22=m2L $_{2}^{2}$

$C (q, \dot{q}) = [\begin{matrix} - m_{2} L_{1} L_{2} \dot{q}_{2} s i n q_{2} & - m_{2} L_{1} L_{2} (\dot{q}_{1} + \dot{q}_{2}) s i n q_{2} \\ m_{2} L_{1} L_{2} \dot{q}_{1} s i n q_{2} & 0 \end{matrix}]$

(17)

$G (q) = [\begin{matrix} (m_{1} + m_{2}) g L_{1} c o s q_{2} + m_{2} g L_{2} \cos (q_{1} + q_{2}) \\ m_{2} g L_{2} \cos (q_{1} + q_{2}) \end{matrix}]$

(18)

图3～图8反映了两关节机器人的轨迹跟踪、摩擦力矩、控制力矩随时间的变化关系及摩擦力矩与速度的变化关系。由图3、图4对应的数据可以得出,两关节机器人的轨迹跟踪精度高,最大位置误差为1×10-3rad,且动态摩擦补偿的效果也很好。由图5、图6可以看出,是否对机器人系统建模的不确定性进行动态LuGre摩擦补偿,对机器人控制力矩的稳定性影响非常大:特别是在速度换向(如2.446s)时,有动态摩擦补偿时,机器人连杆1控制力矩为28.0046N·m;无摩擦补偿时,连杆1控制力矩为32.0270N·m,控制力矩产生跳跃式增大。而在7.3750s时则产生了跳跃式减小,这对机器人高精度、高可靠的操作来说都是要极力避免或不允许的。因此,非常有必要对机器人中的摩擦力矩进行补偿。

图7、图8是低速运行时机器人中摩擦力矩随速度变化的相图,其形状类似菱形。由初始状态O→平衡状态时,其启动摩擦力矩存在一定程度的波动或者速度超调,即机器人的初始位置姿态对机器人的稳定性影响非常大。而达到稳态时,幅值达到最大,为24.1199N·m,且随着时间的推移,摩擦力矩与角速度x2之间存在菱形稳定吸引子。此时,在图7中,连杆1相图曲线由D→A时,速度逐渐增大,而摩擦力矩幅值由正向最大→0→负向最大,摩擦力矩表现为负斜率现象,即Stribeck现象。同样地,该规律也存在于机器人连杆2。

图9是高速运行时,机器人中摩擦力矩随速度变化的相图,除了存在Stribeck现象外,当连杆1角速度x2由0.2805rad/s→1.0018rad/s(A→B)或者由1.0018rad/s→-0.0545rad/s(B→C)时,摩擦力矩与速度x2成比例增大或者减少,且力矩较稳定,因为此时z1为一常量,则 $\frac{d z_{1}}{d t} = 0,$ 式(5)中的g(x2)为一常量,式(6)中F的简化为关于x2的一阶线性函数,此时主要体现为黏性摩擦。同样地,相图中D→E→F的摩擦力矩与速度也成线性关系。该规律也存在于机器人连杆2。

4 结论

(1)本文提出了用模糊RBF神经网络分块补偿机器人中的动态摩擦不确定项及数字滑模机器人鲁棒控制算法,分析了控制器的Lyapunov稳定性,利用模糊神经网络在线自适应训练LuGre模型中的各摩擦分项,从而实现了机器人高精度的轨迹跟踪、高品质的动态响应。

(2)发现了在该两自由度机器人低速运动时,其关节中存在着Stribeck效应、类菱形吸引子等非线性动力学现象;高速运动时,其黏性摩擦为主。不合适的初始条件会使机器人的启动摩擦力矩出现较大振荡。

参考文献

[1]Kermani M,Wong M,Patel R,et al.Friction Com-pensation in Low and High-Reversal-VelocityManipulators[C]//Proc.ICRA’04,2004IEEE Int.Conf.on Robotics and Automation.New Orleans,2004:4320-4325.

[2]Basilio Bona,Marina Indri.Friction Compensation inRobotics:an Overview[C]//Proceedings of the 44thIEEE Conference on Decision and Control,and theEuropean Control Conference 2005.Seville,Spain,2005:4360-4367.

[3]Kosko B.Neural Networks and Fuzzy System[M].New Jersey:Prentice-Hall,1992.

[4]谢友柏.摩擦学的三个公理[J].摩擦学学报,2001,21(3):161-166.

[5]de Wit C C,Olsson H,Astrom K J,et al.A NewModel for Control of Systems with Friction[J].IEEE Transactions on Automatic Control,1995,40(3):419-425.

[6]Bliman P A.Mathematical Study of the Dahl’s Fric-tion Model[J].Eur.J.Mech.,1992,11(6):835-848.

[7]Armstrong B,Dupont P,Canudas de Wit C.A Sur-vey of Models,Analysis Tools and CompensationMethods for the Control of Machines with Friction[J].Automatica,1994,30(7):1038-1183.

[8]Dupont P,Armstrong B,Hayward V.Elasto-Plas-tic Friction Model:Contact Compliance and Stiction[C]//Proceedings of ACC 2000.Chicago,2000:1072-1077.

[9]Kermani M R,Patel R V,Moallem M.Friction Iden-tification and Compensation in Robotic Manipulators[J].IEEE Transactions on Instrumentation andMeasurement,2007,56(6):2346-2353.

[10]Haessig D A,Fliedland B.On the Modeling andSimulation of Friction[J].ASME Journal of Dy-namic Systems Measurement and Control,1991,113(3):354-362.

动态RBF网络篇4

摘要：介绍一种利用径向基函数(RBF)神经网络和智能温度传感器DSl8B20改善传感器精度的新方法。RBF网络具有良好的非线性映射能力、自学习和泛化能力，通过大量的样本数据训练构建了双输入早输出网络模型，采用改进的算法实现了传感器高精度温度补偿。

关键词：传感器精度温度补偿径向基函数神经网络温度传感器DSl8B20

一般工业测控现场的环境温度变化急剧，传感器大多数都对温度有一定的敏感度，这样就会使传感器的零点和灵敏度发生变化，从而造成输出值随环境温度的变化而变化，导致测量出现附加误差，因此温度补偿问题一直是工业测控系统中的关键环节[1]。本文采用DSl8B20智能温度传感器和RBF神经网络相结合的温度补偿新方法来实现传感器高精度温度补偿。本文介绍的方法将DSl8B20测量值作为温度补偿输入，将传感器本身的测量值作为另一输入，用RBF神经网络构成双输入单输出的补偿模型，输出即为补偿后的测量值。RBF神经网络主要用于传感器的数据处理，以改善传感器测量精度。

1 DSl8B20数字温度传感器测温原理

1.1 DSl8B20的特性

DSl8B20是美国DALLAS公司继DSl820之后推出的增强型单总线数字温度传感器，它在测温精度、转换时间、传输距离、分辨率等方面较DSl820有了很大的改进，这给用户带来了更方便的使用和更令人满意的效果。其特点如下：(本网网收集整理)

(1)单线接口：仅需一根口线与单片机连接;

(2)由总线提供电源，也可用数据线供电，电压范围：3.0～5.5V;

(3)测温范围为：-55～+125℃，在-10～+85℃时，精度为0.5℃;

(4)可编程的分辨率为9～12位，对应的分辨率为0.5～0.0625℃;

(5)用户可编程的温度报警设置;

(6)12位分辨率时最多在750ms内把温度值转换为数字量。

1.2 DSl820引脚功能说明

DSl820的PR-35封装形式见图1，其外表看起来像三极管。另外还有8脚SOIC封装形式，只用3、4和5脚，其余为空脚或不需连接引脚。不过最常见的形式是PR-35封装，其引脚说明如表1所示。

表1 DS1820引脚说明

8脚SOICPR-35符号说明51GND地42DQ单线数据输入输出引脚33VDD正电源，一般为+5V

1.3 DSl820温度数据格式

在DSl820中，转换温度值是以9位二进制形式表示的，而输出温度则是以16位符号扩展的二进制补码读数形式提供。采用的办法是将低八位用补码表示，第九位以符号扩展形式扩展至其它七位。具体温度表示格式见表2。

表2 温度/数据关系

温度数字输出(二进制)数字输出(十六进制)+12500000000 1111101000FAH+2500000000 001100100032H+1/00000 000000010001H+000000000 000000000000H-1/211111111 11111111FFFFH-2511111111 11001110FFCEH-5511111111 10010010FF92H

在实际应用中，测量温度往往在0℃以上，此时可只取16位二进制温度输出的低8位，即1个字节，这样将使计算和编程工作更为便利。

1.4 DSl8B20的测温原理

DSl8B20的测温原理为：内部计数器对一个受温度影响的振荡器的脉冲计数，低温时振荡器的脉冲可以通过门电路，而当到达某一设置高温时，振荡器的脉冲无法通过门电路。计数器设置为-55℃时的值，如果计数器到达0之前门电路未关闭，则温度寄存器的值将增加，这表示当前温度高于-55℃。同时，计数器复位在当前温度值上，电路对振荡器的温度系数进行补偿，计数器重新开始计数直到回零。如果门电路仍然未关闭，则重复以上过程。温度转换所需时间不超过750ms，得到的温度值的位数因分辨率不同而不同[2]。DSl8B20同AT89C52单片机的接口电路如图2所示。这种接口方式只需占用单片机一根口线，与智能仪器或智能测控系统中的其它单片机或DSP的接口也可采用类似的方式。

2 RBF神经网络及学习算法

RBF神经网络即径向基函数(Radial Basis Function)神经网络[3～4]，其结构如图3所示。它很容易扩展到多输出节点的情形，在此只考虑一个输出变量Y的情况。

RBFNN包括一个输入层、一个隐含层和一个输出层的最简模式。隐含层由一组径向基函数构成，与每个隐含层节点相关的参数向量为Ci(即中心)和σi(即宽度)。径向基函数有多种形式，一般取高斯函数[5]。具体如下：

上式中，m是隐含层结点数;‖・‖是欧几里德范数;X，Ci∈R n，ωi是第i个基函数与输出结点的连接权值(i=1,2…，m)。

RBF神经网络是一种性能良好的前向网络，它具有最佳逼近性能，在结构上具有输出一权值线性关系、训练方法快速易行、不存在局部最优问题的特点。该网络的学习算法有很多种，本文将带遗忘因子的梯度下降法应用于RBF神经网络的参数调整[6]，即在考虑当前时刻(k时刻)的网络状态的变化时，将前一个时刻(k―1时刻)的网络参数变化也包括进去。其具体算法如下：

上式中，m是隐含层结点数;||・||是欧几里德范数;X，Ci∈Rn，ωi是第i个基函数与输出结点的连接权值(i=1,2,…，n)。

RBF神经网络是一种性能良好的前向网络，它具有最佳逼近性能，在结构上具有输出一权值线性关系、训练方法快速易行、不存在局部最优问题的特点。该网络的学习算法有很多种，本文将带遗忘因子的梯度下降法应用于RBF神经网络的参数调整，即在考虑当前时刻(k时刻)的网络状态的变化时，将前一个时刻(k-1时刻)的网络参数变化也包括进去。其具体算法如下：

其中，J为误差函数，Y(k)代表希望的.输出，Y(W，k)为网络的实际输出，W是网络的所有权值组成的向量。

隐层一输出层连接权值矩阵的调整算法为：

其中，μ(k)为学习率，α(k)为动量因子，也称为遗忘因子，又称动量项或阻尼项。将其称为遗忘因子可从对于新旧信息的学习与遗忘的角度来理解;称为动量项或阻尼项是因为在网络的学习训练中，此项相当于阻尼力，当训练误差迅速增大时，它使网络发散得越来越慢。总之，它使网络的变化趋于稳定，有利于网络的收敛。

3 测试方法及推广应用分析

实验中以测量压力为例，采用Honeywell的24PCG―FAlG型压力传感器。将传感器测量值和DSl8B20的输出值作为网络输入层节点的输入，与其对应的压力是网络输出层节点的输出。采用的RBF神经网络为三层网络结构，其中，输入层有2个节点，隐含层有8个节点，输出层有1个节点。基于上一节中提到的网络参数调整算法，通过调整RBF网络中的可调参数(隐层节点数、学习速率、遗忘因子和网络权值、隐层标准偏差等)进行网络的训练和测试，并采用均方根(RMS)计算其训练精度和测试精度。共采集样本数据120组，其中72组作为网络训练样本，48组作为网络测试样本，在环境温度变化范围为-5℃～75℃时，最佳RBF的神经网络的训练精度为0.048%，测试精度为0.062%。同时基于获得的实验数据，采用最小二乘拟合方法建立的数学模型，其拟合精度为0.170%;用单片机直接预存线性插值补偿的方法，测试精度为0.280%。

对于其它参数的检测，如流量、浓度或温度本身，也可采用增加温度或其它辅助传感器来实现补偿的方法。对于同时存在温、湿度漂移的测量场合，可以采用温湿度一体化传感器进行补偿。在本文图3所示的神经网络中增加一个X3输入代表湿度，只是会增加具体计算的复杂性。

三种RBF神经网络比较分析篇5

关键词：神经网络,径向基函数,Matlab

0 引言

人工神经网络是一种模仿生物神经网络的结构和功能的数学模型或计算模型。现代神经网络是一种非线性统计性数据建模工具, 常用来对输入和输出间复杂的关系进行建模, 或用来探索数据的模式。RBF神经网络即径向基函数神经网络 (Radical Basis Function) , 是由J. Moody和C. Darken于上世纪80年代末提出的一种神经网络模型。径向基函数神经网络是一种高效的前馈式神经网络, 它具有其他前向网络所不具有的最佳逼近性能和全局最优特性, 并且结构简单, 训练速度快。同时, 它也是一种可以广泛应用于模式识别、非线性函数逼近等领域的神经网络模型。

1 RBF神经网络原理

由输入层、一个隐含层 (径向基层) 和一个线性输出层组成的前向RBF神经网络结构如图1。

隐含层神经元是将该层权值向量w与输入向量c之间的矢量距离与偏差b相乘后作为该神经元激活函数的输入, 即:

undefined

若取径向基函数为高斯函数, 则神经元的输出为:

undefined

由式 (1) 可以看出, 随着和之间距离的减少, 径向基函数输出值增加, 且在其输入为0时, 即w和c之间的距离为0时, 输出为最大值1。

1.1 基于聚类的RBF神经网络原理

基于聚类的RBF神经网络方法最早由Broomhead and Lowe提出。最简单形式是有固定的中心, 映射属性的参数有两组:输出层权值w, 和径向基函数中心c。该方法通常随机地选择输入数据集合的子集, 很难确定足够的中心是多少, 才能达到输入空间的适当取样。一般的方法就是选择数目相对大的输入向量为中心, 这样可以保证有适当的输入空间取样。在网络训练以后, 一些中心可能根据系统化的方式去除而不引起网络映射性能的显著退化。一旦中心选定, 训练数据集的输入向量对应的网络输出可以计算为[1]:

undefined

1.2 基于梯度的RBF神经网络原理

基于聚类的RBF神经网络可调参数仅为输出层的权值, 该方法产生一个非常简单的训练算法。然而, 为了实现输入的恰当取样必须从输入数据集合中选择较大数目的中心, 这产生相对大的网络。基于梯度方法允许调整所有的3组网络参数 (权值、RBF中心的位置、RBF中心的宽度) 。具有更新隐藏层处理单元的中心位置及扩展参数的能力极大地提高RBF神经网络的性能。对于给定大小的隐藏层, 与随机梯度方法一起训练的RBF神经网络超过一个固定中心的网络。其代价是增加训练算法的复杂度, 增加了训练网络需要的时间[2]。网络更新方程式为:

undefined

1.3 基于正交最小二乘的RBF神经网络原理

RBF神经网络设计的主要挑战是中心的选择。按随机方式选择, 甚至使用随机梯度算法修改, 通常导致一个相对大的网络。正交最小二乘 (OLS) 方法提供了用于中心选择的系统方法, 显著地压缩神经网络的大小[3]。正交最小二乘法基于格拉姆-斯密特正交化算法, 格拉姆-斯密特正交化的过程为:

(1) 设置第一个基向量等于矩阵M的第一列:

undefined

(2) 抽取第k个基向量, 以便它与前面k-1个向量正交:

undefined

重复步骤 (2) , 直到k=m。

2 三种RBF神经网络仿真实验

仿真实验在Pentium (R) D CPU2.8、2G内存、Windows XP环境下用Matlab2008b进行。为了对这3种RBF神经网络进行比较分析, 分别应用这3种方法对f (x) =sin (x) 函数进行逼近, 网络训练样本随机取[-3.14, 3.14]之间的200个数据作为3种RBF网络的训练样本, 测试样本取:[-π: π/100: π], 目标误差:0.9。

2.1 三种RBF神经网络训练步骤

2.1.1 基于聚类的RBF神经网络的训练步骤

(1) 初始化聚类中心, 隐层节点数定义为10, 选择足够数量的中心以确保输入向量空间的适当取样[4]。

ClusterNum = 10;

Centers = SamIn (:, 1:ClusterNum) ;

(2) 计算欧几里德距离。

AllDistance = dist (Centers', SamIn (:, i) ) ;

[MinDist, Pos] = min (AllDistance) ;

(3) 保存旧的聚类中心, 重新计算聚类中心, 判断新旧聚类中心是否一致, 是则结束聚类。

(4) 计算各隐节点的扩展常数, 以隐节点间的最小距离作为扩展常数。

Spreads = Overlap*min (AllDistances) ';

(5) 计算隐节点输出阵, 输出权值、偏移。

HiddenUnitOut=radbas (Distance./SpreadsMat) ;

W2=W2Ex (:, 1:ClusterNum) ;

B2=W2Ex (:, ClusterNum+1) ;

(6) RBF神经网络测试。

Test = W2*TestHiddenUnitOut+B2;

(7) 输出结果。

plot (TestSamIn, TestNNOut, 'rv', 'MarkerSize', 2) ;

2.1.2 基于梯度的RBF神经网络的训练步骤

(1) 选择RBF函数中心, 隐层节点数定义为10, 从[-4, 4]之间随机选择中心数值, 最大训练次数定义为500, 学习系数定义为0.001。

Center = 8*rand (InDim, UnitNum) -4;

(2) 计算中心距离。

AllDist = dist (Center', SamIn) ;

(3) 获取训练误差, 达到目标误差就退出。

Error = SamOut-NetOut;

(4) 没达到目标误差, 调整隐节点数据中心、扩展常数及输出权值。权值的梯度:

WGrad = Error*UnitOut (i, :) ';

(5) 如果网络已经收敛则停止, 否则继续循环计算。

(6) RBF神经网络测试、结果输出。

2.1.3 基于正交最小二乘的RBF神经网络的训练步骤

(1) 计算样本输入维数和最大允许隐节点数。

[InDim, MaxUnitNum] = size (SamIn) ;

(2) 计算隐节点输出阵。

dd = sum ( (SamOut.*SamOut) ') ';

(3) 计算投影矢量, 获取最大投影的矢量, 构成相应的数据中心。

Angle= ( (SamOut*VectorsSelectFrom) .^ 2) ./

Denominator;

(4) 用广义逆求广义输出权值, 求训练误差, 达到目标误差就退出。

W2Ex = SamOut*pinv (HiddenUnitOutEx) ;

( 5) 没达到目标误差, 作Gram-Schmidt

正交化, 调整计算各隐节点输出矢量与目标输出矢量的夹角平方值, 继续循环, 直到收敛停止。

ProjectionLen = NewVector' * VectorsSelectFrom /

(NewVector'* NewVector) ;

(6) RBF神经网络测试、结果输出。

2.2 仿真结果对比分析

3种RBF神经网络在相同输入样本数据, 对正弦函数进行逼近所得到的结果如图2-图7。从图2-图4可以看出, 3种RBF神经网络都能较好地对正弦函数进行逼近。其中, 图2与图3、图4相比数据边缘效果略差。

图5-图7显示3种网络训练收敛情况, 图7收敛速度最快, 图6收敛速度最慢。

从表1中可以看出, 3种RBF神经网络中, 基于正交最小二乘的网络训练速度最快, 所需的训练时间只是最慢的基于梯度网络的36%, 基于聚类的网络所需训练时间是基于梯度网络的64%。从表1中也可以看出, 基于梯度的神经网络训练时间长是因为网络所需的训练次数要远远超过其它两种方式。

3 结语

通过使用Matlab对3种RBF神经网络在相同输入样本数据, 对正弦函数进行逼近的仿真实验。对比分析结果表明:相对基于聚类、梯度的神经网络, 基于正交最小二乘的神经网络不需要预先定义隐层节点数, 并且所需的训练时间最短, 网络收敛速度最快。

参考文献

[1]FREDRIC M, HAM IVICA KOSTANIC.神经计算原理[M].北京:机械工业出版社, 2007.

[2]葛哲学, 孙志强.神经网络理论与MATLAB R2007[M].北京:电子工业出版社, 2007.

[3]朱大奇, 史慧.人工神经网络原理及应用[M].北京:科学出版社, 2006.

RBF神经网络的研究与应用篇6

由此可知,人脑神经系统的工作原理就是:外部刺激信号或上级神经元信号经合成后由树突传给神经元细胞体处理,最后由突触输出给下级神经元或做出响应。

人工神经网络的网络模型有很多种,如感知器网络、线性网络、BP网络、径向基函数网络(RBF网络)、自组织网络、回归网络等。本文介绍RBF网络的学习过程以及采用RBF神经网络进行高压断路器故障诊断的过程。

1 RBF神经网络的学习过程

对于RBF网络的数学描述可表达为:在n维空间中,给定N个输入样本Xi(i=1,2,…,N),则网络隐含层的第k个节点的输出可以表示为:

其中,Xi是n维输入向量;Tk是第k个隐层节点的中心,k=1,2,…,l;‖·‖通常为欧式范数。

R(·)即是RBF函数,具有局部感受的特性,体现了RBF网络的非线性映射能力。而网络输出层第j个节点的输出,则为隐含层节点到输出层的线性映射,即:

式中,wkj是隐含层到输出层的权值,θj是第j个输出节点的阈值,m是输出节点数。

最常用的RBF函数形式是Gauss函数:

它的可调参数有两个,即中心和宽度参数隐含层节点k的传递函数表达式为:

其中,X=(x1,x2,…,xn)—n维输入向量,Tki为节点k的中心Tk的第i个分量,σk为节点k的Gauss分布宽度,‖·‖表示欧式范数。

输出层节点j相应的输出则可以表示为:

由此可见,对于RBF网络来说,Tk、σk及w是最为重要的参数,设计RBF网络的任务就是用一定的学习算法来确定这三个参数。

设有N个训练样本,则系统对所有N个训练样本的总误差函数为:

式中,N为模式样本对数;L为网络输出节点数;tkp表示在样本p作用下的第k个神经元的期望输出;ykp表示在样本p作用下的第k个神经元的实际输出。

RBF网络的学习过程分为两个阶段:第一阶段是无教师学习,是根据所有的输入样本决定隐含层各节点的高斯核函数的中心向量ci和标准化常数σi;第二阶段是有教师学习,在决定好隐含层的参数后,根据样本,利用最小二乘原则,求出隐含层和输出层的权值wki。有时在完成第二阶段的学习后,再根据样本信号,同时校正隐含层和输出层的参数,以进一步提高网络的精度。下面具体介绍一下这两个阶段:

1)无教师学习阶段

无教师学习也称为非监督学习,是对所有样本的输入进行聚类,求得各隐含层节点的RBF的中心向量ci。这里介绍k-均值聚类算法调整中心向量,此算法将训练样本集中的输入向量分为若干族,在每个数据族内找出一个径向基函数中心向量,使得该族内各样本向量距该族中心的距离最小。

算法步骤如下:

(1)给定各隐节点的初始中心向量ci(0)和判定停止计算的ε;

(2)计算距离(欧氏距离)并求出最小距离的节点;

式中,k为样本序号,r为中心向量ci(k-1)与输入样本x(k)距离最近的隐节点序号;

(3)调整中心

式中,β(k)是学习速率;,int(·)表示对(·)进行取整运算。可见,每经过q个取样本之后,调小一次学习速率,逐渐减至零;

(4)判定聚类质量

对于全部样本k(k=1,2,…,N)反复进行以上(2),(3)步,直至满足以下条件,则聚类结束。

2)有教师学习阶段

有教师学习也称为有监督学习。当确定以后,训练由隐含层至输出层之间的权值,由上可知,它是一个线性方程组,则求权值就成为线性优化问题。因此,问题有惟一确定的解,不存在BP网络中所遇到的局部极小值问题,肯定能获得全局最小点。

类似于线性网络,RBF神经网络的隐含层至输出层之间的连接权值wki(k=1,2,…,L;i=1,2,…,q)学习算法为:

式中,,Ri(x)为高斯函数;η为学习速率。可以证明,当0<η<1时,可保证该迭代学习算法的收敛性,而实际上通常只取0<η<1;tk和yk分别表示第k个输出分量的期望值和实际值。由于向量Ri(x)中只有少量几个元素为1,其余均为0,因此在一次数据训练中只有少量的连接权需要调整。正是由于这个特点,才使得RBF神经网络具有比较快的学习速度。另外,由于当x远离ci时,Ri(x)非常小,因此可作为0对待。因此,实际上只当Ri(x)大于某一数值(如0.5)时才对相应的权值wki进行修改。经这样处理后,RBF神经网络也同样具备局部逼近网络学习收敛快的优点。

2高压断路器故障的训练

对高压断路器进行状态监测,获取12组故障样本数据,包括机构正常(ZC)、操作电压过低(GD)、合闸铁心开始阶段有卡涩(HKS)、操作机构有卡涩(CKS)、合闸铁心空行程太大(TD)、辅助开关动作接触不良(FK),其中前6组数据作为建立神经网络时的输入向量,二进制输出向量的位数由故障的种类数来决定,发生某种故障时其所对应的二进制位为1,其余位为0。利用

建立神经网络,取误差目标值Goal为0.01;RBF网络的分布密度SPREAD为0.6。

接下来对网络进行训练,用后六组数据如表1做为训练样本。输入到上面建立的RBF网络中。

训练结果如图1所示。

可见,经过10次的训练后,网络的输出已经达到预先设定的精度要求,结果如图1所示。输出结果如表2所示。

以表2中所示的样本序号3为例,当输入合闸铁心开始阶段有卡涩故障样本数据时,其输出结果中越接近1表明发生该故障的几率越大,因此可以看出发生HKS故障的几率最大。说明此RBF神经网络可以投入实际应用之中。

3结束语

人工神经网络是模仿生物脑结构和功能的一种信息处理系统,已经在信号处理、目标跟踪、模式识别、机器人控制、专家系统等众多领域显示出极大的应用价值。本文介绍了RBF神经网络的学习过程,并给出了RBF神经网络在高压断路器故障诊断中的应用。

参考文献

[1]刘爱民,林苹,刘向东.基于(RBF)神经网络的自动化电器设备故障诊断方法[J].控制与监测,2005.(12):67-72.

[2]罗小华,翁陈宇.基于RBF神经网络在高压断路器故障诊断的研究[J].电气应用,2007.

动态RBF网络篇7

BP神经网络也称为反向传播网络 (Back-Propagation Net work) , 是目前最为广泛、最具影响的人工神经网络 (Aritificial neural network) 学习算法之一。它可以从大量的离散实验数据中, 经过学习训练, 提取其领域知识, 并将知识表示为网络连接权值的大小与分布, 建立起反映实际过程内在规律的系统模型。BP网络可以包含不同的隐含层, 但理论上已经证明, 在不限制隐层节点数的情况下, 两层 (只有一个隐含层) 的BP网络可以实现任意非线性映射。一般情况下, 我们用得最多的BP神经网络是只有一个隐含层的BP网络, 只要我们能够保证该隐含层中的隐单元数足够多, 理论上就能够实现对任意一个问题的非线性分类了。

2 RBF神经网络的原理

径向基函数RBF (Radial basis function) 是指某种沿径向对称的标量函数, 通常定义为空间中任一点X到某一中心ci之间欧氏距离的单调函数。最常用的径向基函数是高斯核函数, 形式为

其中ci为核函数中心, σ为核函数的宽度参数, 控制基函数的径向作用范围, 即方差。

RBF神经网络是在借鉴生物局部调节和交叠接受区域知识的基础上提出的一种采用局部接受域来执行函数映射的人工神经网络, 具有最优逼近和全局逼近的特性。其网络拓扑结构是由一个隐含层和一个标准全连结的线性输出层组成的前向网络。隐含层最常用的是高斯径向基函数, 而输出层采用线性激活函数[2]。RBF神经网络是一种前馈式神经网络, 它由输入层、隐含层和输出层组成。它结构简单, 其设计比普通前向网络训练要省时得多。如果隐含层神经元的数目足够, 每一层的权值和阈值正确, 那么RBF神经网络完全能够精确地逼近任意函数。RBF神经网络权值的训练是一层一层进行的, 对径向基函数层权值的训练采用无导师训练, 在输出层权值的设计采用误差纠正算法, 为有导师训练。在RBF神经网络中, 输入层到隐含层的基函数输出是一种非线性映射, 而输出则是线性的。这样, RBF神经网络可以看成是首先将原始的非线性可分的特征空间变换到另一线性可分的空间 (通常是高维空间) , 通过合理选择这一变换使在新空间中原问题线性可分, 然后用一个线性单元来解决问题, 从而很容易的达到从非线性输入空间向输出空间映射的目的。值得指出的是, 由于RBF神经网络的权值算法是单层进行的, 它的工作原理采用的是聚类功能, 由训练得到输入数据的聚类中心, 通过值来调节基函数的灵敏度, 也就是RBF曲线的宽度, 虽然网络结构看上去是全连结的, 实际工作时神经网络是局部工作的, 即对输入的一组数据, 神经网络只有一个神经元被激活, 其他神经元被激活的程度可忽略。所以RBF神经网络是一个局部逼近网络, 这使得它的训练速度要比BP网络快2~3个数量级。

2.1 RBF神经网络的局限性

RBF网络之所以能有广泛的应用, 是因为它具有网络结构简单、非线性逼近能力强、收敛速度快以及全局收敛等优点[3]。RBF网络虽然有以上优点, 但我们也应该看到传统的RBF网络仍然存在泛化能力不足的缺点。以前人们在神经网络的学习算法方面进行了大量的研究工作, 也就是说大量的工作多集中于如何缩短学习时间、提高收敛速度和逼近精度等问题上;而在如何提高神经网络的泛化能力方面, 尚需作进一步的研究, 探讨网络泛化能力问题仍然是RBF网络的一个重要研究方向。

2.2 提高RBF神经网络的泛化能力

泛化能力是指对未知样本进行正确分类的能力, 它是衡量网络效果好坏的重要指标之一。现阶段, 提高系统泛化能力比较成熟的理论有正则化理论、统计学理论和信息熵理论等。上述提高系统泛化能力的理论虽然成熟, 但离实际应用的距离还比较大。目前, 提高系统泛化能力的研究主要集中在如何选取合适的网络规模, 设计合理的网络结构上。

吴永贤老师多年来一直从事RBF神经网络的研究, 他提出了基于RBF神经网络的局部泛化误差模型, 大大提高了RBF神经网络的泛化能力。局部泛化误差的创新点在于这个模型针对一些对评价一个分类器有真正影响的非训练样本, 计算该分类器对于这些非训练样本的泛化误差, 从而得到一个比较合理和实用的泛化误差模型。这个局部泛化误差模型的优点主要体现在它能贴近真实应用情况, 针对RBF神经网络进行评价且具有很好的理论支持。

摘要：本文重点介绍了当前有着广泛应用的BP神经网络, 对BP神经网络的局限性进行了说明, 并且给出了一些改进BP算法的实用技术。

关键词：人工神经网络,BP神经网络,RBF神经网络,改进,泛化能力

参考文献

动态RBF网络篇8

RBF网络即Radial Basis Function Neural Network,是以函数逼近理论为基础而构造的一种前向网络,它是由输入层、隐藏层和输出层组成的三层网络,如图1所示。输入层由信号源节点组成,第二层是隐藏层,该层的变换函数采用RBF。近年来的研究表明:无论在逼近能力、分类能力(模式识别)和学习速度等方面RBF均优于BP网络。RBF网络的输出为

采用Gaussian函数作为径向基函数。

从Gaussian核函数可见,其中矢量参数x是函数的自变量矢量,是输入;c是常数矢量,径向基函数的中心;Φ(x-c)就是径向基函数。

Gaussian函数网络有3个学习参数:各RBF的中心CK、方差σK和输出单元的权值WK。径向基函数网络算法步骤如下:

(1)从输入向量中选一组初始中心值CK;

(2)计算方差值

式中dmax为最大的距离,K为CK的数量;

(3)由输入x(n)计算yi(n)

(4)更新网络参数

yd (n)为网络期望输出;μN,μC,μσ为3个参数的学习步长。

(5)如网络收敛,则计算停止,否则转到步骤(4)。

2 基于RBF网络的分析模型

把企业发展过程作为一时间序列,就可以采用人工神经网络模型对企业的营运能力进行预测,具体可按以下步骤进行。

2.1 预测企业营运能力指标体系设计

对指标体系的设计一般要遵循以下原则:即科学性、完备性和可操作性,要以客观、准确地反映企业发展转折点作为出发点。此外,合理控制指标体系的规模也是重要的方面,指标太少,处理和建模相对简单,但难以综合反映被预测对象的特性;指标太多,有利于预测,但也存在掩盖对象之间差异性的问题。根据上述要求,并结合企业发展实际情况,确定预测企业发展转折点的指标体系如下:

X1应收账款周转率(次数)、X2应收账款周转率(天数)、X3存货周转率(次数)、X4存货周转率(天数)、X5营业周期、X6现金周期、X7流动资产周转率(次数)、X8流动资产周转率(天数)、X9固定资产周转率(次数)、X10固定资产周转率(大数)、X11总资产周转率(次数)、X12总资产周转率(天数)。在这里,我们选取的都是企业发展的先行指标,只有这样才有利于对企业的发展进行预测,因此,在这里还要确定指标的滞后期。

2.2 基于RBF网络预测模型

2.2.1 确定输入层的节点数

由于输入层的节点数取决于数据源的维数,如果数据中存在大量未经处理或者虚假的信息数据,那将会妨碍对网络正确的训练,所以要剔除那些无效的数据,确定数据源的合适维数。我们在这里结合企业的实际情况,并考虑到系统的学习时间和网络的复杂性,选取了上述17个指标作为输入矢量,(X1,X2,…,X12),由于人工神经网络只能处理表示成数值的输入数据,所以要将一些模糊、混沌的信息变换或编码,一般将数值标度泛化至0～1之间。

2.2.2 确定隐含层的节点数

隐含单元数太少,网络可能训练不出来,这是因为隐含单元数极少时,局部极小值就多,就不能识别以前没看过的样本,容错性差,但是隐含单元数太多又使学习时间过长,误差也不一定最佳,因此存在如何确定一个最佳的隐含单元数问题。我们可以采用Hecht-Nielsen提出的确定隐含层节点数的方法,即节点数为2N+1:,其中N为输入层的节点数。当然也可以根据经验和使用情况确定。在此,我们根据使用情况确定隐含层单元数为15。

2.2.3 输出层节点数的确定

输出层的维数根据使用者的要求来设计,根据企业发展的实际情况和研究的需要,在这里设定为一个节点,即响应输出为Y1。

2.2.4 实际输出矢量的计算

我们将输出指标按照企业实际情况进行合成,得到合成指数,一般限定在0～1内,这样我们也就可以根据已有的数据来计算未来的企业营运能力,预测企业的发展。

2案例研究

为验证上述分析模型的有效性,也检验分析方法的可行性,我们选择了三家上市公司A、B、C (出于商业原因,这里隐去实际企业名称),以三个企业1990年至1999年的实际数据对BP网络进行了训练,并使用训练后的BP网络对企业2000年至2008年进行了计算,计算结果如下图所示。从实验结果来看,BP神经网络的预测效果准确率为90.00%。综合以上几个实验可以得知,模型有效且预测率较高,可以有助于全方位的对企业发展能力进行评估和预测。

3 结语

本文针对企业营运能力提出了基于RBF神经网络的分析方法,给出了分析原理,学习算法,集合实际案例研究表明:RBF神经网络能够有效地对企业发展能力进行评估,分析与预测精度达到预期目标,客服了传统方法在计算速度慢的缺点,又提高预测精度。可为企业管理人员分析企业价营运能力提供依据。

参考文献

[1]Wang H M,Chen X,An G,et al.IC engine misfire fault diagnosis with contour map based on explosive noise signal resample[J]. ISTM,2003,15:4037 - 4040.

[2]Hagan M T.Dem uth H B,Beale M.Neural network design[M] Boston:PWS Publishing Company,2002.

[3]李维安.服务管理:运营、战略与信息技术[M].机械工业出版社,2003.

动态RBF网络篇9

开关磁阻电机(SRM)具有结构简单牢固、制作成本低廉、可控参数多、调速范围宽和系统效率高等优点。但是,电机本身固有的转矩脉动和非线性特性限制了其在工业领域的广泛应用。如何减小转矩脉动成了当前一个热门的课题。为减小SRM的转矩脉动, 各国学者做了大量研究工作, 提出很多方法, 主要可以分为两大类: 一是通过电机结构的优化设计来减小转矩脉动;二是通过控制算法来减小转矩脉动。文献[1]提出采用神经网络来优化开关磁阻电机的转矩。文献[2]提出给予RBF的神经网络对SRM的瞬时转矩进行控制。文献[3]采用迭代学习的方法减小SRM的转矩脉动。

然而由于开关磁阻电机按照“磁路最小”的工作原理设计,其电感是转子位置的非线性函数,开关磁阻电机两相励磁运行时,由于存在互感影响,其电感模型更加复杂。文献[4]中提到了采用磁网络模型对开关磁阻电机两相励磁运行时的磁场特性进行分析,为开关磁阻电机两相励磁运行时电流控制分析提供了很好的理论方法。

本文从电磁的角度对开关磁阻电机定子绕组电感进行分析,基于RBF神经网络建立了SRM的电感非线性模型,RBF网络为3-6-1结构(3个输入变量、6个隐层节点、1个输出量)。最后通过离线训练完成SRM在两相励磁时考虑互感的电感与转子位置的非线性建模,使该模型能有效映射电感与转子位置和定子电流之间的非线性关系。最后通过已建立的电感模型动态调节PWM的占空比,使实际电流很好地跟随给定电流,并经过实验验证该方法能获得满意的电流控制效果。

2 电机励磁电感分析

8/6结构的开关磁阻电机采用图1所示的电容分裂式功率拓扑结构,其各相绕组电流可独立控制,从而降低转矩脉动,提高开关磁阻电机的性能。但在实际控制中发现,相电流控制存在一定难度,开关磁阻电机是按照“磁路最小”的工作原理设计的,因此当给定子绕组通以电流时,产生的磁链不仅与电流有关,还与转子位置有关。在不同的转子位置,电感是不一样的,同样占空比的PWM作用下,电流的变化值是不一样的。

从电磁角度分析,开关磁阻电机各相绕组均绕在定子上,转子的位置决定磁场的分布。图2是8/6结构开关磁阻电机两相同时激励时(两相绕组都施加6 A电流)的磁场分布图。一相处于齿齿对齐位置,另一相处与齿齿相差15°位置,两

相定子绕组均施加6 A电流。

对于8/6结构开关磁阻电机,磁链和电感可以用下式表示:

$\frac{d λ_{j}}{d t} = u_{j} - i_{j} \cdot R_{p h} (1)$

λj=λj(θ,ia,ib,ic,id)⇒

ij=ij(θ,λa,λb,λc,λd) (2)

Lj=λj/ij (3)

式中:λj为j相绕组产生的磁链;uj为j相绕组两端的电压;Rph为绕组电阻;Lj为j相绕组电感。

当两相同时导通时,以A,B相导通为例,A相磁链可用2部分表示:

λa(θ,i)=λaa(ia,ib=0)+λba(ia,ib) (4)

SRM的电感包括自感和互感2部分,由式(3)可得

$L_{a} (θ, i) = \frac{λ_{a a}}{i_{a}} + \frac{λ_{b a}}{i_{b}} (5)$

3 RBF神经网络

由上面分析可知,SRM电感是与转子位置相关的非线性函数,显然传统的性能分析方法不能解决这个问题。

人工神经网络具有很强的非线性映射功能,在控制中,应用较多的网络是BP网络,但BP网络采用的是一阶梯度下降法来学习的,故存在局部极小值,速度也比较慢(耗时太长)。RBF网络具有最佳逼近的特性,收敛速度快,在一定程度上克服了这些问题[5,6],近年来,RBF神经网络在非线性系统建模和控制等方面得到广泛的研究和应用。

图3给出的是一个多输入、多输出的RBF神经网络结构图。图3中,RBF网络有2层组成:输入层实现从x 到aj(x)的非线性映射;输出层实现从aj(x)到y的线性映射。常用的RBF基函数是高斯基函数。

本文采用RBF网络对SRM电感进行非线性建模。SRM的电感包括自感和互感2部分,而且与转子位置相关,因此以A相电感为例,将转子位置θ,自身电流ia及同时导通的另一相邻相电流ineighbor作为神经元的输入,即

X(k)=[ia(k),ineighbor(k),θ(k)]T (6)

对于隐层径向基函数采用高斯核函数

$α_{j} (x) = e^{- \frac{∥ x - c_{j} ∥^{2}}{2 σ_{j}^{2}}} j = 1, 2, \dots, m (7)$

式中:αj为第j个隐层单元的输出;‖*‖为欧几里德范数;x为RBF网络的输入;cj为第j个隐层节点的中心;σj为第j个隐层节点的宽度。

电感作为RBF网络的输出

$y_{o u t} (k) = \sum_{j = 1}^{m} w_{j} α_{j} (x) (8)$

式中:wj为第j个隐层节点的连接权。

隐层节点数量的确定要考虑到系统的实时性要求。在既满足一定网络期望精度的要求又要满足控制实时性要求的情况下,隐层节点数确定为6个。即整体RBF网络为3-6-1结构。最后通过离线训练完成SRM在两相励磁时考虑互感的电感与转子位置的非线性建模。

为确定输出权值、隐层中心及基宽参数,定义二次性能指标函数为

$J_{c} = \frac{1}{2} [r (k) - y (k)]^{2} (9)$

式中:r(k)为系统参考输入;y(k)为系统输出。

则可由梯度下降法得到输出权值、隐层中心及基宽参数的更新算法如下:

$\begin{array}{l} w_{j} (k) = w_{j} (k - 1) + η_{w} [r (k) - y (k)] h_{j} + \\ α_{w} [w_{j} (k - 1) - w_{j} (k - 2)] \end{array} (10)$

$Δ σ_{j} = [r (k) - y (k)] w_{j} h_{j} \frac{∥ x - c_{j} ∥^{2}}{σ_{j}^{3}} (11)$

$\begin{array}{l} σ_{j} (k) = σ_{j} (k - 1) + η_{σ} Δ σ + \\ α_{σ} [σ_{j} (k - 1) - σ_{j} (k - 2)] \end{array} (12)$

$Δ c_{j i} = [r (k) - y (k)] w_{j} \frac{x - c_{j i}}{σ_{j}^{2}} (13)$

$\begin{array}{l} c_{j i} (k) = c_{j i} (k - 1) + η_{c} Δ c_{j i} + \\ α_{c} [c_{j i} (k - 1) - c_{j i} (k - 2)] \end{array} (14)$

式中:j=1,2,3,4,5,6;i=1,2,3;ηw,ησ,ηc分别为输出权值、基宽及隐层中心的学习速率;αw,ασ,αc分别为它们的动量因子。

4 实验结果

本文以TI公司的数字信号处理器TMS320LF2407为核心控制芯片,验证所提出的控制方法的性能。控制系统框图如图4所示,与传统PWM控制相比,系统增加了RBF网络,考虑到绕组电感对电流变化的影响。基于RBF网络的SRM电感模型建立起来以后,在转子的不同位置,根据RBF网络得到的电感值实时调节PWM的占空比。RBF网络通过离线训练得到,控制算法通过DSP由软件实现。

功率电路采用电容分裂式拓扑结构,主开关器件采用IGBT。实验选用1台8/6结构开关磁阻电机,额定功率0.75 kW,额定转速1 500r/min, Lmin=13 mH,Lmax=270 mH。

图5、图6均为给定电流为2 A,在不同电压等级下,传统电流PWM控制和采用RBF网络对电流PWM控制进行改进的对比电流波形。

图5为给定电流2 A,电压155 V时传统电流PWM控制和采用RBF网络对电流PWM控制进行改进的电流波形。如图5a所示,传统电流PWM控制下,在不同转子位置由于电流变化率不一致,导致电流波动很大,波动为±1 A。图5b为采用RBF网络对传统电流PWM控制进行改进的电流波形,波动为±0.4 A,通过这种办法使电流波动大大减小,提高电流控制精度。

图6为给定电流2 A,电压310 V时传统电流PWM控制和采用RBF网络对电流PWM控制进行改进的电流波形。如图6a所示,传统电流PWM控制下,波动为±2 A。图6b为采用RBF网络对传统电流PWM控制进行改进的电流波形,波动为±1.4 A。这是因为电源电压变大,导致在一个斩波周期中绕组电流变化相应变大。因而图6的电流波形波动比图5大。

图5、图6说明采用该方法在不同电压给定下都能在很大程度上平滑电流波形,获得满意的实际控制效果。

5 结论

开关磁阻电机的转矩与电流和电感直接相关,只有控制好电流,才能获得理想的转矩。SRM电感模型存在严重的非线性,难以精确建立。而RBF网络特别适合于非线性对象建模,同时具有最佳逼近及收敛速度快的特性,在满足控制要求的情况下,选择合适的隐层节点数目,能满足控制的实时性要求。本文依据RBF网络对SRM电感进行建模,根据不同转子位置的电感值动态调整PWM的占空比,改善了对电流的控制效果。

摘要：开关磁阻电机(SRM)具有结构简单、成本低、控制灵活等优点,尤其组成的调速系统具有交、直流调速系统所没有的优点。但由于电机本身的非线性电磁特性,导致了其转矩脉动比其他传动系统严重,因此如何控制好转矩成为关键,而转矩控制最终要通过控制电流来实现。对8/6结构SRM的绕组磁场特性及电感进行分析,构建了基于3层结构的径向基函数(RBF)神经网络的SRM电感模型,该模型算法简单并能较好地反映SRM电感非线性模型;依据该模型提出了一种自调节的电流控制方法,该方法通过已建立的SRM电感模型动态调节PWM的占空比,克服电感对电流的影响。实验结果证明,该方法使实际电流很好地跟随给定电流,有效减小了电流波动,取得了良好的电流控制效果。

关键词：开关磁阻电机,径向基函数,神经网络,两相励磁

参考文献

[1]Zhengyu Lin,Donald S Reay,Barry W Williams,et al.TorqueRipple Reductionin Switched Reluctance Motor Drives Using B-spline Neural Networks[J].IEEE Trans.Ind.Appl.,2006,42(6):1445-1453.

[2]Sahoo N C,Xu J X,Panda S K.Low Torque Ripple Controlof Switched Reluctance Motors Using Iterative Learning[J].IEEE Transactions on Energy Conversion,2001,16(4):318-326.

[3]王宏华.开关型磁阻电动机调速控制技术[M].北京:机械工业出版社,1995.

[4]郭伟,赵争鸣,詹琼华.磁网络模型在两相激磁开关磁阻电机中的应用[J].中国电机工程学报,2006,10(2):154-159.

[5]夏长亮,王明超.基于RBF神经网络的开关磁阻电机单神经元PID控制[J].中国电机工程学报,2005,25(15):161-165.

[6]王旭东,邵惠鹤.RBF神经元网络在非线性系统建模中的应用[J].控制理论与应用,1997,14(1):59-66.

[7]Amit Kumar Jain,Ned Mohan.Dynamic Modeling,Experi-mental Characterization,and Verification for SRM Operationwith Si multaneous Two-phase Excitation[J].IEEE Transac-tions on Industrial Electronics,2006,53(4):1238-1249.

[8]ZHENG Yi,SUN He-xu,DONG Yan,et al.Torque RippleMini mization with Current Oriented Method for Switched Re-luctance Motor[C]∥ICEMS2007.

[9]O′Donovan J G,Roche P J,Kavanagh R C,et al.Neural Net-work Based Torque Ripple Mini mization in a Switched Reluc-tance Motor[C]∥in Proc.IECON,1994:1226-1231.

【动态RBF网络】推荐阅读：

网络动态06-27

动态卫星网络07-18

网络动态管理06-21

用动态规划的思想实现动态投资问题实验报告06-21

动态炼钢07-21

>> 查看更多相关文档