PNN神经网络(精选7篇)
PNN神经网络 篇1
随着信息技术和人工智能技术的发展,人们已经把神经网络看作解决与分类、模式识别和归纳有关的复杂问题的强有力的工具[1],并已经应用于地球物理的各个方面。在勘探地球物理中,其用途包括初至拾取、静校正、地质异常定位和断裂系统分析等[2,3]。人工神经网络(Artificial Neural Network.简称ANN)是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。它实际上是由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统,当前神经网络理论与应用已经取得了丰硕的成果[4]。本文通过PNN神经网络训练建立起地震属性与波阻抗反演之间的联系,进而实现两者的结合。
在薄互层地震储层预测中,属性分析和地震反演是当前应用地震资料进行储层预测的主要技术,两者实质上都属于反问题范畴。前者指由叠前或叠后地震数据经过数学变幻而道出的有关地震波的几何形态、运动学特征、动力学特征和统计学特征的特殊测量值,该方法横向预测能力较强,但是受地震分辨率的影响;后者就是把常规的界面型反射剖面转换成岩层性的测井剖面,井约束反演是当前应用最广的反演技术,该技术可以有效地提高地震的纵向视分辨率,但横向预测能力较差。本文提出了一种基于PNN神经网络的多属性反演技术,利用井约束反演提高地震纵向分辨率的同时,通过网络训练建立起多属性分析与反演的结合,充分发挥二者的优势,在大庆GTZ地区扶余油层的应用中取得了良好的效果。
1 PNN神经网络原理
在众多的人工神经网络模型中,最常用的是BP(Back Propagation)模型[5,6],即利用误差反向传播算法求解的多层前向神经网络模型。BP网络具有方便、快捷的优点,在故障诊断、模式识别、图像识别、管理系统等很多方面都有广泛的应用,但也存在如下缺点:(1)网络本身是“黑匣“,无法直接控制权值;(2)由于模拟退火算法使用了随机数发生器搜索全局最优,使用相同的数据进行训练可能会产生不同的结果。
本文采用的PNN网络(概率神经网络———Probabilistic Neural Network),是一种数学内插方案,只不过在实现时利用了神经网络的架构,这是它潜在的优势,可以通过数学公式理解它的行为(因而不是黑匣子)。其实现原理如下:
对于给定训练样本,如{A1i,A2i,A3i,…},i=1,2,3,…,n。PNN假设新的储层参数可以表示为训练集中储层参数的线性组合,也就是说对于具有属性向量x的新样本,其储层参数可以表达为
其中,表示属性向量x到第i个训练样本之间的n为空间距离;训练网络的目的是确定σj,确定σj的准则是整个网络的校验误差最小。所谓的校验误差是针对训练集中的样本而言的,某个样本的校验误差是样本储层参数值与估计值之间的差值,该估计只可以表达为
PNN既可应用于离散型数据(如岩相)又可应用于连续型数据(如各种测井曲线和孔隙度、渗透率等)。和BP神经网络相比,PNN网络具有如下优点(1)PNN网络本身属于数学内插方法,权值可以控制;(2)相同的数据的不同次训练结果完全相同,但由于PNN网络存储所有的训练数据,网络应用对计算机运算能力要求比较高。
2 应用实例
2.1 研究区概况
松辽盆地北部GTZ地区扶余油层地层厚度在(90—110)m之间,为三角洲平原亚相沉积,具有薄互层、横向不稳定、非均质性强的特点,砂体平面展布异常复杂。砂体单层厚度一般在(2—5)m,储层横向变化大,不易对比;测井解释有效孔隙度一般在10%左右,渗透率大多在0.2×10-3μm2以下,具低孔、低渗特点。通过钻井资料分析可以发现,区内扶杨油层的砂岩与电阻率和自然伽玛曲线具有较好的对应关系,表现为高电阻率与低自然伽玛的特征,声波与电阻率测井曲线的对比表明,区内扶杨油层的砂岩总体上为高速砂岩,砂岩和泥岩相比具有较高的速度。该区的高分辨率地震资料在扶余油层为(50~60)Hz,地震垂向分辨率大约为8m,还无法直接识别(2~5)m的河道砂体,因此利用测井约束反演是准确预测薄层砂体的有效手段。本文采用的是基于PNN神经网络的多属性反演技术,实践应用效果较好。
2.2 PNN神经网络的多属性反演技术
2.2.1 属性的提取与分析
随着储层地球物理学的进展,地震属性分析技术越来越得到重视[7,8]。地震属性既包括经过特殊处理的三瞬信息、地震波的运动学和动力学信息,还包括经过数学运算得到的一些能够表征储层地质特征的参数,如主分量参数、小波变换参数和相关分析参数等[9]。目前可以提取的地震属性可以达到100多种,但部分属性之间物理意义接近,除去相似的地震属性后一般常用的、具有明确物理意义的参数约有30余种,通过专家优化和自动优化的技术最终选取参数17种。
2.2.2 井旁地震属性与波阻抗PNN网络训练
在PNN神经网络多属性反演中,网络训练过程至关重要,为此设计了如下的训练分析过程:
(1)通过声波曲线和密度曲线构筑井点的波阻抗曲线,作为目标曲线;然后提取井旁的地震属性与井点阻抗曲线进行相关性分析,分析过程中尝试对目标曲线及地震属性做一些常规的非线性变换,以获取最大的相关系数。从分析结果(表1)来看,相关系数最高的仅为0.517,可见单属性与与目标区县的相关性是比较差的,接下来将进行多属性的网络训练以提高与目标曲线的相关性。
(2)多属性网络训练提高网络训练精度。首先,应用线性关系模式确定最佳地震属性参数的优化组合,选取参与训练的属性个数。通过多属性联合分析(图1)发现,刚开始随属性数量的增加,其训练误差和交叉检验误差都减小,但加入9个属性以后,训练误差减小而交叉检验误差增大,说明超过9个属性后出现了过度训练。因此,选用前9个属性对井上的波阻抗体进行预测。
然后利用选取的9个地震属性为输入,井孔的波阻抗曲线作为期望输出,进行PNN网络训练,当网络收敛且网络整体方差达到要求的精度时,便完成网络训练。从网络训练的相关交汇图(图2)来看,网络输出的结果与期望输出具有很好的相关性,其相关系数达到了0.869,较单属性时有着明显的提高。
最后利用上述训练的PNN网络预测进行波阻抗曲线反演,得到最终的波阻抗体。
2.3 效果分析
利用基于PNN神经网络的反演技术对研究区完成了地震反演工作,并取得了良好的效果,首先从图3来看,与钻井资料之间有良好的对应关系;其次,其垂向分辨率比常规波阻抗反演有明显的提高,一般而言厚度(2—3)m的砂层在反演剖面上都有清晰的显示;第三,从平面图来看,砂体的平面展布趋势与区域地质认识有较好的吻合,而且没有出现围井画圈的现象(图4)。可见,PNN神经网络方法反演的使用对于纵向分辨率的提高并没有破坏地震属性很像分辨率好的优势。另外在反演过程中,在约150 km2的范围内预留了5口后验井,并对扶余油层单层厚度超过3 m的砂体反演的符合情况进行了统计,表2表明,5口井砂体单层厚度达于3m的砂体共有11层,其中符合的有10层,这个符合率是相当高的。
3 结论
(1)在薄互层储层研究中,基于神经网络技术的多属性地震反演技术,有利于发挥地震属性分析与地震反演的各自优势,从而提高地震反演的质量,提高储层预测精度。
(2)属性的选取、网络的训练是基于神经网络技术的多属性地震反演技术成功与否的关键所在。
摘要:在薄互层地震储层预测中,属性分析和地震反演是当前应用地震资料进行储层预测的主要技术,两者实质上都属于反问题范畴,两者各有优缺点。提出了一种基于PNN神经网络的多属性地震反演技术,可以比较好地发挥两者的优势。概率神经网络(PPN)是一种数学内插方案,只不过在实现时利用了神经网络的架构,可以通过数学公式理解它的行为,克服了BP网络的的“黑匣子”问题。该技术在GTZ扶杨油层的砂岩预测中应用效果较好,厚度大于3 m的砂岩识别符合率超过90%以上。
关键词:PNN神经网络,属性地震反演,扶杨油层
参考文献
[1]焦李成.神经网络的应用与实践.西安:西安电子科技大学出版社,1995:218—259
[2]张学庆,刘燕,肖慈珣,等.在测井中用一种组合优化神经网络识别油水.石油物探,2001;40(4):119—124
[3]宋维琪,韩宏伟.2D地震小波变换和自组织神经网络联合边界检测.石油物探,2003;42(4):473—476
[4]靳蕃,范俊波,潭水洞.神经网络与神经计算机.成都:西南交通大学出版社,1991:55—276
[5]王大力,陈云英.前馈神经网络用于压裂效果预测.石油物探,2000;39(3):121—126
[6]杨德义,王赟,王妙月,等.一种改进的多层感知器神经网络技术.石油物探,2000;39(2):107—116
PNN神经网络 篇2
关键词:概率神经网络,特征提取,故障诊断,模式识别
0 引言
油井功图是抽油机工况分析和故障诊断的重要依据, 根据功图形状判断抽油机工况是目前普遍采用的方法。通常情况下, 工作人员依据经验来分析示功图, 从而判断出抽油机的工况。这种方法效率低、人为因素影响大, 不能满足油田现代化生产的需要。近年来随着人工神经网络技术的发展使用BP网络进行油井功图识别在一定程度上提高了油井工况诊断的效率, 但由于其识别准确率较低未能得到广泛应用。
概率神经网络 (Probabilistic Neural Network, PNN) 是Specht博士在1989年首先提出的, 它是径向基函数 (Radial Basis Function, RBF) 模型发展而来的一种前馈型神经网络。其理论依据是贝叶斯最小风险准则, 主要用于模式分类的问题研究[1]。它是一种将输入矢量或者预处理映射到高维空间中的神经网络学习方法, 不仅具有良好的推广能力, 而且避免了像BP算法那样繁琐的计算, 从而可以实现神经网络的快速学习[2]。
本文研究了一种基于PNN网络的油井功图识别方法。该方法通过提取油井功图的面积特征, 特征向量和傅里叶级数分解特征作为PNN网络的输入。实验结果表明所提取的功图特征能够有效区分油井的工况类别, 基于提取特征的PNN网络功图识别模型比传统BP网络进行功图识别具有更好的性能。
1 概率神经网络PNN
PNN神经网络主要用于模式分类问题研究, 是径向基函数 (RBF) 模型的发展, 和RBF神经网络结构相似, 只是第二层为竞争层, 其结构如图1所示[3]。
径向基层的输入权值IWi1, 1为训练样本的转置矩阵PT, 输出;竞争层的输入权值IWi2, 1为样本的期望值矩阵T, T的每一行只有一个1代表相应的类别, 输出。
PNN网络径向基层的输出表示输入向量与训练样本的接近程度。竞争层将与输入向量相关的所有类别综合在一起, 输出表示概率向量, 最后通过竞争层的竞争传递函数 (Competition) 进行取舍, 概率值最大的输出为1, 其他类别的输出为0。
2 示功图特征提取
示功图原始数据由随时间变化的位移数据和载荷数据组成, 其包含数据量大, 且不能有效反映示功图所表达的工况特征, 因此需对示功图原始数据进行特征提取, 利用提取后的特征值代替示功图原始数据作为PNN网络的输入。本文选取能够有效反映油井工况的示功图面积特征、示功图特征向量和载荷曲线的傅里叶逼近特征值作为油井工况的识别特征。
2.1 示功图面积特征值
示功图所包围的有效面积反映了抽油机在一个冲程中有用功的大小, 间接反映了抽油机的产量[4], 是区分抽油机是否正常工作的一个重要特征。通过抽油机工作时的上死点a和下死点b将示功图分成两条曲线如图2所示, 其中l1为上冲程示功图曲线y=l1 (x) , l2为下冲程示功图曲线y=l2 (x) , 功图面积。
2.2 示功图特征向量
油井功图为一封闭的曲线, 令其包围的平面区域为σ, 给定二维连续函数
对任意正整数m和n, f (x, y) 的矩定义为:
当f (x, y) 相当于物体的密度时, 物体的质心即平面图形的形心坐标为,
为了更好地描述示功图各部分的细微特征, 以形心为原点做水平和垂直轴线, 这两条轴线将示功图分为上、下、左、右四部分, 如图3所示。分别求出这四部分的形心o1 (x1, y1) 、o2 (x2, y2) 、o3 (x3, y3) 、o4 (x4, y4) , 以向量、、、作为示功图的四个特征向量。这四个特征向量表示了示功图包围区域的质量分部情况, 反映了示功图的形状特征, 是区分不同工况下示功图的一个有效特征。、
2.3 傅里叶逼近特征值
示功图数据包括位移数据x (t) 和载荷数据p (t) , 在Gibbs提出的确定有杆泵井下工况的方法中, 将抽油杆的位移曲线和载荷曲线用截断傅里叶基数来近似表示[5]。在悬点处所测示功图中, x (t) 为近似正弦周期信号, 为周期信号。p (t) 可用载荷曲线的傅里叶逼近特征值来代替载荷曲线的特征。载荷数据p (t) 的傅里叶展开式如下:
在傅里叶展开式中, 高次谐波大多由震动和噪声引起, 且其幅值接近于0, 因此取傅里叶级数展开式中的基波与二次谐波的幅值和相位A1, A2, φ1, φ2作为载荷曲线的傅里叶逼近特征值。
3 PNN网络进行示功图识别
取表1所列的10种油井典型工况作为PNN网络的输出模式类别。PNN网络进行油井工况进行识别时, 首先通过特征提取获得特征数据, 然后用归一化后的特征数据作为PNN网络的输入, 网络经过学习后可根据输入特征来诊断油井的工况类别。
3.1 选择样本
每一种工况选取10幅不同的功图, 共100幅功图作为PNN网络的训练样本, 测试样本集取中原油田20口油井的实测功图如图4所示。
3.2 网络设计
PNN网路输入层有13个节点, 分别对应示功图特征提取后的13个特征值。输出为10维二进制向量, 分别对应10种油井工况识别结果。网络输出结果与油井工况识别结果的对应关系如表1所示, 其中网络输出为10×1维列向量在表1中用索引来表示, 每个输出向量中只有一个元素为1, 代表一种工况, 其余元素全为0, 如正常功图对应索引值为12表示输出为列向量。
使用Matlab2012a中的神经网络工具箱实现PNN网络识别示功图, Matlab算法的伪代码如下:
Step1:提取功图数据特征值R=get R (t, y, p) ;
Step2:对特征值进行归一化处理P=normal (R) ;
Step3:创建并训练概率神经网络net=newpnn (P_train, T_train) ;
Step4:检验网络对训练样本的识别能力YC_train=vec2ind (sim (net, p_train) ) ;
Step5:检验网络对测试样本的识别能力YC_t=vec2ind (sim (net, P_test) ) ;
t、y、p分别对应功图原始数据的时间序列、位移序列、载荷序列, P_train、P_test分别为归一化后的训练样本特征和测试样本特征。T_train为训练样本的输出模式。
3.3 仿真结果
在Intel G870 3.10GHz CPU、2GB内存的计算机平台上利用matlab软件进行仿真, 有100幅样本功图对网络进行训练所需要的时间为3.27s, 训练后的网络识别一幅功图所用时间为8.2ms。所设计的PNN网络对100个训练样本进行测试, 准确率为99.8%。用图4中的20组测试样本对训练好的网络进行测试, 测试结果如表2所示, 对测20个试样本的识别准确率为100%。与BP网络进行油井功图识别[6]相比, PNN网络具有训练时间短、识别速度快、识别效率高等特点, 能够满足功图识别的实时性和准确性的要求。
4 结语
本文通过提取油井功图特征的方法实现了基于PNN网络的油井功图计算机自动识别。实验结果表明, 特征提取所得到的功图面积特征、向量特征和载荷傅里叶级数分解特征能够对油井工况进行有效区分。基于功图特征的PNN网络功图识别模型具有训练时间短、诊断速度快、识别率高的特点, 便于实现实时诊断, 是一种高效准确的油井功图识别方法。
参考文献
[1]李东辉, 刘浩.基于概率神经网络的故障诊断方法及应用[J].系统工程与电子技术, 2004, 26 (7) :997-999.
[2]TAN Kun, DU Pei-jun.Hyperspectral Remote Sensing Image Classification Based on Radical Basis Function Neural Network[J].Spectroscopy and Spectral Analysis, 2008, 28 (9) :28.
[3]董长虹.Matlab神经网络与应用[M].二版.北京:国防工业出版社, 2007.
[4]杨鲤铭, 朱种, 王星.有杆抽油系统的数学建模及诊断[J].数学的实践与认识, 2013, 43 (15) :49-57.
[5]Gibbs S G.Method of Determining Sucker Rod Pump Performance[J].United States Patent Office, Sep.1967.
PNN神经网络 篇3
随着互联网的快速发展,网络安全越来越受到人们重视。2015年,我国出台了“互联网+”行动计划,加快建设网络强国,并不断完善网络安全保障措施,进一步提升网络安全防护水平。然而,网络安全问题仍然层出不穷。入侵检测作为网络防御方法的重要组成部分,受到了各国政府和学者的重视。自20世纪80年代提出入侵检测技术以来[1],经过多年发展,入侵检测技术已从理论研究进入了实际应用阶段,但仍存在一定问题,主要体现在误报率过高、警报数量过大等方面。文献[2]指出,在实际应用中,通常产生的警报中有90%以上是误报;文献[3]提出将神经网络应用于入侵检测是目前网络安全领域的研究热点。
因此,为了改善传统入侵检测技术的不足,提高入侵检测系统的检测效率具有重要意义。本文将概率神经网络引入到入侵检测技术中。PNN(Probablistic Neural Network)概率神经网络通过对学习样本的直接存储和处理,可以大大简化网络训练,在模式分类方面具有很大优势。实验结果表明,将PNN网络应用于入侵检测中,能够提高入侵检测性能。
1 应用神经网络的入侵检测技术
人工神经网络简称神经网络,是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型[4]。它通过调整内部大量节点之间的相互连接关系,达到处理信息、解决问题的目的。将人工神经网络应用于入侵检测技术具有以下优势[5]:1高度的学习和自适应能力;2采用并行工作方式,大量神经元可以同时工作;3对信息采用分布式存储方式,并具有一定容错性,当其中的某一点或某几点被破坏时,信息仍然可以被存储,具有鲁棒性。
概率神经网络作为神经网络中的一种,主要用于模式分类问题。它结构简单、训练迅速,利用其强大的非线性分类能力,可以非常准确地完成入侵攻击分类[6]。
2 数据源与评价指标
实验采用MATLAB R2013a软件及其神经网络工具箱。实验数据来自KDD 1999异常检测的标准数据集,该数据集包括Probe、Dos、R2L和R2R四种攻击方式下的正常数据和异常数据。在本实验中,针对Dos攻击数据集,选取Dos攻击中6类攻击模式下的数据和正常数据,分为正常和异常两大类。表1为实验样本集。
为了验证本文采用入侵检测方法的有效性和可行性,采用检测准确率、误报率和漏报率作为PNN概率神经网络的入侵检测实验评定指标。
3 PNN神经网络仿真实验
3.1 数据预处理
由于KDD1999数据集中的数据值跨度较大,如果不对数据进行归一化处理,收敛速度较慢,有时甚至不能收敛。如果对样本数据进行归一化处理,则会加快收敛速度。
数据归一化方法可以把所有数据都转化为[0,1]之间的数值,目的是取消各维数据间的数量级差别。归一化方法采用最大最小值法和平均数方差法。
(1)最大最小法。函数形式如下:
其中,xmin为数据序列中的最小值,xmax为数据序列中的最大值。
(2)平均数方差法。函数形式如下:
其中,xmean为数据序列的均值,xvar为数据的方差。
图1为未对实验数据进行归一化处理的网络训练误差图,图2为使用最大最小法归一化后的网络训练误差图,图3为采用平均数方差法归一化后的训练误差图。实验中都采用41维特征数据作为神经网络输入数据,网络训练数据采用1 821个训练样本,测试数据采用400个测试样本,其它网络训练参数保持一致。将所有数据样本划分为正常和异常两类。
对比以上网络训练曲线图,可以看到未对数据进行归一化处理时[8],训练数据到1 000步左右时几乎不再收敛,8 000步左右时几乎已停止收敛,没有达到精度要求;数据采用最大最小法归一化后,在200步左右已经收敛;数据采用平均数方差法进行归一化后,数据较为规整,与采用最大最小法相比,收敛时间更短。表2为实验结果。
由表2可以看出,对数据进行归一化处理,可以明显提高收敛速度,且检测率与未归一化相比略有提高。对比最大最小法和平均数方差法两种归一化方法可以得出,采用平均数方差法对实验数据进行归一化处理,检测率与最大最小法基本一致,但它可以使数据更规整,且收敛速度更快。因此,在后续研究工作中,输入数据都采用平均数方差法进行归一化处理。
3.2 PNN神经网络设计
BP神经网络是目前采用最多也是最成熟的训练算法之一,但其存在收敛速度慢、易陷入局部极小状态等问题。PNN网络主要应用于解决分类问题,因此本节基于PNN网络进行实验。
本文将PNN网络应用于入侵检测技术中,实现对入侵攻击的正确分类。PNN网络有3层,除输入层外,隐层为径向基神经元层,输出层为竞争层。本实验输入数据采用1 821个KDD1999数据集中的样本作为神经网络的输入向量,经过网络径向基层,将低维非线性问题映射到高维空间中,使之成为一个线性可分问题,再经过竞争层,通过竞争(Compet)传递函数的取舍,计算网络输出为表示概率的向量。概率最大的一类置为1,其它类别置为0。
应用Matlab中的newpnn()函数设计PNN网络。其中p为输入向量,t为期望目标向量。其它参数采用默认值。
径向基层传递函数一般使用高斯函数radbas()。该函数的调用格式如下:
iw为径向基层输入权值矩阵,p为输入向量矩阵,A1为函数返回矩阵,b为神经元阈值。
竞争层采用竞争传递函数compet。该函数调用格式如下:
lw为竞争层权值矩阵,A2为函数返回矩阵。
3.3 PNN网络测试与实验结果分析
测试时,输入层把入侵数据的测试集送至所有的模式层单元。每个模式层单元计算测试入侵数据样本和该单元训练向量之间的距离等,输出层从求和层中求得输入测试数据相对于各类别号的分布密度最大值,并将其对应的类别号1、2和各类数据个数作为PNN的输出。本实验测试集共400个样本,输入向量采用18维特征向量,并成功将测试样本分为正常和异常两类,如图4所示。
将基于PNN网络的实验结果与BP网络仿真结果进行对比,结果如表3所示。
如图5、图6所示,在基于PNN网络的实验中,通过构建适当的网络,可以明显提高检测率。检测率为100%,误报率为0。与使用BP神经网络得出的实验结果相比,检测率由98.44%提高到100%。因此,采用PNN神经网络效果更佳。
4 结语
针对入侵检测技术检测率低、误报率高的问题,提出了基于PNN网络的入侵检测技术。实验结果表明,与传统入侵检测方法相比,使用PNN网络的入侵检测方法能够有效识别出入侵数据的正常与异常,分类结果稳定,并且克服了BP神经网络收敛速度慢等问题,具有重要的理论研究价值。但PNN网络必须经过训练才能达到要求,而且需要收集完备的训练样本。因此,将PNN神经网络应用于入侵检测技术中,还需进一步研究。
参考文献
[1]ANDERSON J P.Computer security threat monitoring and surveillance[R].1980.
[2]JULISCH K.Mining alarm clusters to improve alarm handing efficiency[C].Proceedings 17th Annual Computer Security Applications Conference,2001.
[3]马丽芳,史宇浩.神经网络在入侵检测中的应用[J].计算机安全,2012(11):20-22.
[4]刘冰,郭海霞.MATLAB神经网络超级学习手册[M].北京:人民邮电出版社,2014:210-260.
[5]程曦.基于概率神经网络的入侵检测技术[J].计算机辅助工程,2005,14(4):129.
[6]徐桂敏,杨正祥.概率神经网络在油浸式变压器故障诊断中的应用[J].动力与电气工程,2011(9):143.
[7]宋海波,陆正福,刘仕云.基于改进人工免疫算法的入侵检测算法研究[J].软件导刊,2015,14(12):67-68.
[8]马正华,王腾,周炯如.基于BP神经网络的太湖富营养化时空变化预测[J].常州大学学报:自然科学版,2013,25(3):63-64.
[9]HUANG GB,ZHOU HM,DING X J,et al.Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems Man and Cybernetics Part B-Cybernetics,2012,42(2):513-529.
PNN神经网络 篇4
钢板在加工制造业中应用广泛。由于受原材料、轧制工艺、加工设备等因素的影响,钢板表面出现裂纹、孔洞、氧化皮、辊印、麻点、色斑等缺陷,对其耐磨性、抗疲劳性、抗腐蚀性和电磁特性等主要特性都有不同程度的影响[1]。传统的人工目视检测方法因检测效率低、误检率高,且耗费大量人力,已不能满足当前钢板生产的需要。近年来,随着计算机技术、自动化技术的发展,以及人工智能、神经网络等理论的成熟,以机器视觉技术为核心的钢板表面缺陷检测技术已成为当前研究的重点和趋势[2]。目前国外基于机器视觉的金属表面缺陷检测技术已经比较成熟,以美、日、德为主导的金属表面检测系统已获得应用[3]。这类系统能够在线实时检测带钢表面缺陷并加以分类处理。如德国Parsytec公司开发的HTS-2冷轧带钢自动表面质量检测系统,可统计和存储缺陷的图像、种类、数量和位置等信息,自动判定钢卷表面质量等级。该系统采用了基于人工神经网络的分类器设计技术,可在轧制速度为300 m/min的情况下,检测最小尺寸为0. 5 mm的带钢表面缺陷[4]。但其缺陷识别率的高低受限于专家样本组的完善程度及分类器的参数设置[5]。国内华中科技大学等高校和钢铁企业也都致力于该领域的研究,其检测精度和稳定性方面有待进一步提高。
由于受光源光照均匀性、光色及现场环境的影响, 系统采集的钢板表面图像的信噪比很低,而缺陷区域又较小,形状也不规则,各类缺陷间的特征差别不明显,因此钢材表面缺陷识别率难以提高。缺陷分类就是实现从缺陷的特征空间到类别空间的非线性映射[6]。人工神经网络( ANN) 作为描述和刻画非线性系统的一种有效工具,在模式识别与分类中获得了广泛应用。其中,误差反向传播( BP) 神经网络因其非线性逼近性能好、易于硬件实现和泛化能力强,成为目前应用最广的一类神经网络[7,8,9]。概率神经网络( PNN) 的训练过程简单,算法容易设计,常用于模式识别与分类[10]。
现阶段的研究大多采用BP神经网络来实现钢板表面缺陷的分类,而采用PNN作为钢板表面缺陷分类器的研究还比较少。为了提高钢板表面缺陷检测的效率,笔者选择和设计有效提高钢板表面缺陷识别率的分类器,根据钢板表面缺陷图像的特征,用BP神经网络和PNN对钢板表面的5种缺陷分别进行分类识别。其实现过程为: 将采集的缺陷图像进行预处理,得到含目标缺陷的二值图像,再对目标图像进行特征提取和选择。根据缺陷特征向量,分别以BP神经网络和概率神经网络PNN为分类器,对缺陷图像训练集进行分类模型训练,利用测试集对训练好的分类识别模型预测分类结果。
1缺陷特征提取和选择
特征提取和特征选择是为了选出一组对识别最有效、数量最少的特征。这种理想的特征应该具有可区分性、可靠性和独立性[11]。这里主要以几何特征、灰度特征和Hu矩特征来表征目标图像的缺陷信息。本研究根据钢板制品常见的划痕、麻点、夹杂、锈蚀、辊印5种表面缺陷的图像特征进行提取。经过实验,笔者在众多特征中选取能够比较全面地反映缺陷信息的圆形度、矩形度、细长度3个特征参数; 均值、方差、歪度、峭度、能量和熵直方图6个灰度特征; 以及Hu不变矩的4组特征参数,组成13维的特征向量作为神经网络的输入数据,为缺陷识别提供依据。所提取缺陷样本的特征数据如表1所示。
从表1可见,不同种类的缺陷,其各特征参数也在不同的值域内。如麻点较为接近圆形,其圆形度在1左右,主要集中在0. 6 ~ 1. 2,矩形度在0. 7 ~ 1. 0,细长度比其他缺陷小( 1. 5 ~ 2. 5) 。划痕一般为细长形,其圆形度( 1. 7 ~ 3. 2) 与细长度( 4 ~ 15) 都比其他缺陷大,而矩形度( 0. 1 ~ 0. 4) 则明显比其他缺陷小。夹杂的歪度和峭度较多出现负值,且其熵值( 0. 1 ~ 0. 9) 较小。辊印的峭度最大( 10 ~ 30) ,熵值较大( 4 ~ 8) ,而能量( 0. 003 ~ 0. 04) 较小。锈蚀的Hu不变矩Ф2( 4 ~ 10) 普遍比其他缺陷大。尽管各类缺陷的特征参数区间存在交集,但是综合利用13个特征参数就能够对具体的缺陷类型作出判决。
2分类识别模型设计
2. 1 BP 神经网络
BP网络是一种按误差逆传播算法训练的多层前馈网络,是现今最广泛应用的神经网络模型之一。应用BP神经网络识别钢板表面缺陷的过程如下[12]:
( 1) 输入训练样本。将输入样本进行归一化处理,使训练样本的输入特征值在[- 1,1]之间。
( 2) 初始化网络的权值、阈值。
( 3) 设计网络结构,采用典型的三层结构( 输入层、隐含层、输出层) ,隐含层节点数参考经验公式k =( k—隐含层节点数,n—输入层节点数,m—输出节点数,a—1 ~ 10之间的调节常数) ,改变k值,用同一样本集训练,从中确定网络误差最小时对应的隐含层节点数。
( 4) 选择激活函数和相关参数。选取神经元作用函数,设定学习系数、期望误差和最大迭代次数等,选择神经网络的学习规则。
( 5) 设定输出期望值。针对不同类型的输入缺陷样本,设定一个输出向量。
( 6) 进行BP网络训练,获取最终的权值与阈值矩阵。
( 7) 输入待识别的缺陷样本,进行分类识别。
2. 2 概率神经网络( PNN)
2. 2. 1 PNN的模型结构
PNN是由径向基函数网络发展而来的一种前馈型神经网络。它基于概率统计思想,由Bayes分类规则构成,是一种有监督的网络分类器。在进行分类模式识别时,笔者采用Parzen窗函数密度估计方法估算条件概率,由Parzen方法得到的概率密度函数估计式如下:
式中: Xai—缺陷模式的第i个训练向量,m—缺陷模式的训练样本数,δ—平滑参数。
对应以样本点为中心的钟状曲线的宽度,对分类结果有着重要影响。PNN的模型结构由输入层、模式层、累加层、决策层组成,如图1所示。其工作过程为: 待识别样本X由输入层直接送到模式层各类别单元, 进行向量输入向量X与连接权值W的点积计算,再送入累加层。在累加层中,各单元只与相应类别的模式单元相连,并依据Paren方法求和估计各类别的概率; 在决策层中,根据对输入向量的概率估计,按Bayes分类规则将输入向量分到最大后验概率值的类别[13]。
基于PNN的缺陷识别是利用其强大的非线性处理能力,将缺陷样本的特征空间映射到缺陷类型空间中,而形成一个具有较强容错能力和结构自适应能力的识别网络系统[14],以此提高识别率。
2. 2. 2概率神经网络的构建过程
( 1) 采集缺陷特征数据。选取代表性强、包括足够的反映缺陷特征的数据作为训练和测试数据。
( 2) 根据已有的缺陷数据训练网络。将已有的缺陷特征数据作为训练样本的输入,以缺陷类别作为期望输出。通过训练网络从而得缺陷分类识别的PNN网络模型。
( 3) 进行网络性能测试。将各层神经元间的连接权值代回网络中,对训练样本进行回归模拟,当训练样本的期望值输出与PNN网络的仿真输出一致时,说明网络已训练成功,可用来预测未知样本的类别。
( 4) 利用已训练好的网络进行预测。利用已构建的PNN网络来对未知的缺陷样本数据进行分类。
3缺陷识别实验
本研究选择现场采集的钢板表面缺陷样本300个,将其分成两组,一组为训练集,每类缺陷40个,共200个样本; 另一组为验证集,每类缺陷20个,共100个样本。
3. 1 网络输入数据的归一化
由表1可见,钢板缺陷图像的特征提取值大小不一,有的特征值达到负的几十次方数量级,有的达到正的几次方数量级。为了避免不同种类的特征数据以及同一种类不同特征之间的数量级差距对分类准确率的影响,消除参数量纲的不统一,将参数化为同一范围内的数值,并加快网络的训练速度,本研究将每个特征值归一化为[- 1,1]之间的数值。
3. 2 BP 网络设计
用BP神经网络设计缺陷分类器时,本研究根据提取到的13维特征向量设定输入层神经元数为13, 需要识别的缺陷数为5,输出层神经元数为5,学习速率取0. 1,精度要求取0. 001,最大训练次数为1 000。为避免学习算法不收敛,提高学习速度,设期望输出为相应小数,即期望输出的0和1分别用0. 001和0. 999代替。期望输出矩阵T如下:
式中: [y1y2y3y4y5]—划痕、麻点、夹杂、锈蚀、辊印5种缺陷形式的期望输出矢量矩阵T。
隐含层神经元个数分别取n = { 6,7,…,16} ,通过对各种算法进行比较实验,采用仿真速度快、训练精度高的Levenberg-Marquardt算法进行训练。网络训练结果如表2所示,综合考虑网络性能和训练速度,隐含层节点数为12的BP神经网络的训练误差最小、训练时间和次数较少,逼近效果最好,所以将网络隐含层的节点数确定为12。
在隐含层节点数为12时,笔者分别采用梯度下降BP算法、自适应学习率算法、Levenberg-Marquardt 3种常用的BP网络改进模型进行比较实验,训练效果如图2所示。3种算法的训练时间分别为14 s、3 s、2 s, 迭代次数分别为1 000、168、84,后两种算法均能达到期望误差,而第一种算法经过1 000次训练仍未达期望误差。综合比较,本研究选择训练效果最好的Levenberg-Marquardt算法作为BP网络的训练函数。
图 2 3 种算法的训练效果
3. 3 BP 网络的缺陷识别实验结果与分析
训练完成后,本研究对训练好的网络进行测试, 抽取每类缺陷20个样本,共100个未训练的新数据,作为网络测试的输入数据,BP神经网络的分类识别结果如表3所示。由表3可见,共100个检测样本,均未出现拒识,各类缺陷误判的个数合计为19, 因此BP网络对各类缺陷的识别正确率平均为81% , 分类基本准确,用时2. 43 s。对划痕、锈蚀两种缺陷的识别率较高,达到85% ,而对夹杂的识别率最低, 仅为75% 。可见,采用BP神经网络法对训练样本特征值进行多次训练后再进行分类识别时,识别结果具有较高的稳定性和容错性。但在新增训练样本或除去某些旧的训练样本时,需要对修改过的训练样本重新进行训练。
3. 4 PNN 的缺陷识别实验结果与分析
首先确定PNN网络的结构,根据径向基函数的特点,其输入层神经元个数与输入样本向量个数相同,输出层神经元个数等于训练样本数据的种类个数,网络的输出层是竞争层,每个神经元分别对应于一个数据类别。则本研究设计的PNN网络的结构为: 输入层有13个神经元,输出层有5个神经元。中间层神经元的传递函数为高斯函数,输出层的传递函数为线性函数。
笔者首先用提取的200组特征数据作为训练输入样本P和目标样本T,检验网络对训练数据的分类; 用另外的100组作为检验样本数据以检验网络的泛化性能。在Matlab中创建PNN网络,创建函数为net = newpnn( P,T,SPREAD)[12]。为分析SPREAD对网络性能的影响,仿真过程中将SPREAD分别取20、10、1. 5、1、0. 5、0. 1、0. 005、0. 001进行训练和分类、总测试精度分别对 应为31% 、52% 、73% 、82% 、87% 、85% 、76% 、59% 。可见,对于概率神经网络方法,传播率过大或过小,网络模型可分性都比较差,宜取0. 1 ~ 1之间的数据,尤以0. 5左右较佳。故本研究将SPREAD值取为0. 5,把100个检验样本输入已经训练好的PNN网络中,此时PNN网络的分类结果如图3所示, 其统计数据如表4所示。由表4可见,以PNN作为缺陷分类器,共100个检验样本,均未出现拒识,其中出现误判的样本个数为13,故总识别率为87. 0% ,识别时间为0. 461 s。其中划痕、麻点类缺陷识别率相对较高。某些仿真样本出现误判,可能因钢板表面各种缺陷形状相似,以及缺陷图像处理、特征提取,或是训练样本不足,未能全面涵盖缺陷特征信息而造成的缺陷特征信息缺失,从而影响了识别率,这有待于以后对算法进行优化。
图 3 PNN 的分类结果 “* ”—真实缺陷,“△”—PNN 的分类结果
结果分析: 1由于PNN对缺陷样本噪声具有较强的鲁棒性,将PNN与BP神经网络应用于钢板表面缺陷的识别分类中,PNN比BP神经网络准确率高,用时少。2PNN的隐层节点个数相对确定,训练速度快, 工程应用中易于实现。3BP神经网络初始权值随机分配,隐层节点个数不易确定,难以选择合适的学习速率和改进算法,故其分类结果的重复性和可靠性差,需要进行反复测试才能取得优化参数和最佳分类性能。4新增训练样本易于加进已训练好的PNN分类器中, 随着训练样本的增加,缺陷识别率可进一步提高。
4结束语
PNN神经网络 篇5
概率神经网络(Probabilistic Neural Network,PNN)是在径向基函数(RBF)神经网络的基础上发展而来的一种前馈型神经网络,最早是由D.F.Specht博士在1989年提出。其实质是基于贝叶斯最小风险准则的一种并行算法,特别适合于模式识别及分类。PNN结构简单,训练简洁,当获得足够多且足够代表性的样本后可直接使用,无需训练过程,在一般的模式识别问题中都能取得比较理想的效果。
但PNN在训练样本数量较大冗余度较高的情况下,分类效果往往不理想。主成分分析(Principal Component Analysis,PCA)是一种重要的多元统计分析方法,它将显示变量作一定的线性转化产生数量较少的隐式变量,降低原始数据空间的维数,再从新的隐式变量中提取主要变化信息及特征,这样既保留了原有数据信息的特征,又消除变量间的关联、简化分析复杂度,从新的数据空间中提取符合相应的主元数,同时也消除了部分的系统噪声干扰。目前PCA被广泛用于神经网络,主要用来降低神经网络输入向量的维数,进而提高神经网络的模式识别效率。为此,本文提出了一种基于PCA和PNN的故障诊断方法,克服了训练样本数据冗余度比较大的缺点,并以某汽车发动机的故障诊断为例验证了所提算法的有效性。
1 主成分分析法
主成分分析法(PCA)通常又称为Hotelling变换或者K-L变换,它是研究如何将多指标问题转化为较少综合指标的一种重要方法,是一种基于目标统计特性的最佳正交变换,这是因为它具有很多重要的优良性质,如变换后产生的新的分量正交或者不相关,以部分新的分量表示原矢量时均方误差最小,变换矢量更趋确定、能量更趋集中等,这使它在特征选取、数据压缩等方面都有着极其重要的应用。
设x=(x 1,x 2,⋅⋅⋅,x n)T为n维随机矢量,则PCA的具体计算步骤如下:
(1)将原始观察数据组成样本矩阵X,每一列为一个观察样本x,每一行代表一维数据。
(2)计算每一维的均值,即计算样本矩阵X每一行的均值,并对矩阵中的每个样本x做如下处理:
这样做的目的是简化利用新生成的分量估计原始目标特征时估计式的形式。
(3)计算样本的协方差矩阵:
(4)计算协方差矩阵Cn的特征值iλ及相应特征向量,其中i=1,2,,n。
(5)将特征值按由大到小顺序排列,并按照下式计算前m个主元的累积贡献率:
(6)取前m个较大特征值对应的特征向量构成的变化矩阵T':
(7)通过Y=(T')TX计算前m个主成分,达到降低维数的目的。
若用压缩后的数据Y估计原始数据,即数据恢复,可以按照以下步骤进行处理:
(1)估计原始数据矩阵:
(2)对估计矩阵X每一维分别进行加均值处理:
由于变换矩阵T'仅由协方差矩阵的部分特征向量构成,因此,恢复数据不可能完全与原始数据相同,差异程度由所选的m个主元的累积贡献率衡量。
2 基于PCA和PNN的汽车发动机故障诊断研究
2.1 发动机模型描述
发动机是最常用的动力设备之一,在国民经济和日常生活中起着举足轻重的作用,广泛应用于各个行业,已成为某些行业中不可或缺的关键设备。它具有零部件多且相互关联、运动复杂、工作环境恶劣等特点,因而发生故障的可能性也比较大,而且发生故障后,将会影响机械系统的正常运转,直接或者间接地造成巨大的经济损失。发动机在运行过程中,最常见的故障一般分为两类,一类是油路故障;另一类是气路故障。这两类故障的检测与诊断一直是研究的热点。
本文以某汽车发动机的故障诊断为研究实例。在发动机运行过程中,选取AI、MA、DI、MD、TR和PR共计6个变量作为特征参数。其中,AI为最大加速度指标,MA为平均加速度指标,DI为最大减速度指标。
在进行故障诊断时,首先根据PCA对所提取的特征参数进行降维处理,然后利用PNN进行诊断,诊断模型如图1所示。
2.2 仿真研究
由图2可见,我们设计了两个PNN进行故障诊断。PNN-I的输入层有两个节点,对应TR和正常状态;样本模式层有两个节点,分别对应正常和故障两种模式;输出层有两个节点,分别对应正常和故障两种状态。
PNN-II的输入层有5个节点,分别对应5个特征参数为AI、MA、DI、MD、PR;模式层有十个节点,对应每个节点的正常和故障中的10组模式;输出层有4个节点,分别对应油路故障、气门漏气、汽缸漏气和正常4种状态。所谓信息处理就是通过输出的4种状态综合判定实际输出究竟是单故障还是复合故障。
选用发动机中的1号汽缸进行分析。经过分析,该汽缸一共出现了3种故障,分别为油量少、气门漏气和汽缸漏气,再加上正常状态,可以认为一共有4种故障模式。利用二进制数格式描述这4种故障模式,如表1所示。这4种故障模式通过现场试验和对历史资料的收集分析,可以得到4组故障样本数据,如表2所示。
由于这些数据之间相差都不大,因此,不需要再进行归一化处理。将表2所得的故障样本数据用PCA方法进行分析处理,得到降维后的数据,如表3所示。
利用这些降维后的故障信息作为网络的训练样本,从而创建一个概率神经网络用于故障诊断。PNN的创建方法和RBF网络的创建方法非常相似,代码为:
其中,P和T分别为输入向量和目标向量,SPREAD为径向基函数的分布密度,默认为0.1。为了更好地分析SPREAD对网络性能的影响,这里将SPREAD设置为5个值,分别为0.1、0.2、0.3、0.4和0.5。
函数newpnn已经创建了一个准确的概率神经网络,可以利用该网络进行故障诊断和分析了。
首先,检验网络对训练数据的分类:
不同的SPREAD值对应的概率神经网络的输出结果都是一样的,即:
由此可见,网络成功地将故障模式分为了4类。为了进一步检验网络的分类效果,接下来给出了一组测试样本数据,如表4所示。这组数据都来源于真实的故障信息,因此可以有效地检验网络的分类性能。
同样的,根据PCA方法对表4所得的测试样本数据进行分析处理,并得到降维后的数据,如表5所示。
利用表5降维后中测试样本对概率神经网络进行测试,代码为:
输出结果为:
由此可见,网络的分类是正确的。也就是说,概率神经网络成功地诊断出了这4种故障。
3 结语
本文提出了一种基于PCA和PNN的汽车发动机的故障检测与诊断算法。仿真研究结果表明,与传统的PNN相比,该方法在降低数据维数的同时保证了很高的识别正确率,进一步说明了PCA很好地保留了原始特征信息。在保证较高的分类识别率的前提下,简化了识别算法、提高了识别算法的推广能力和运算速度,这对于分类识别系统尤其是实时分类识别系统具有重要意义。
参考文献
[1]Specht D F.Probabilistic neural network[J].Neural Network.1990.
[2]李冬辉,刘浩.基于概率神经网络的故障诊断方法及应用[J].系统工程与电子技术.2004.
[3]常羽彤,张鹏.基于PNN的飞机发动机故障诊断研究[J].微计算机信息.2007.
[4]邢杰,萧德云.基于PCA的概率神经网络结构优化[J].清华大学学报(自然科学版).2008.
[5]李军梅,胡以华,陶小红.基于主成分分析与BP神经网络的识别方法研究[J].红外与激光工程.2005.
[6]杨荣英,苗张木.BP神经网络主成分分析法在交通需求预测中的应用[J].武汉理工大学学报.2002.
[7]黄孝彬,刘吉臻,牛玉广.主元分析方法在火电厂锅炉过程检测中的应用[J].动力工程.2004.
PNN神经网络 篇6
随着工业发展和全球科技进步,电能质量问题越来越受到重视。这是由2 个方面因素决定的:一方面,电力负荷结构的重大调整,大量非线性、波动性、冲击性和不平衡性负荷的广泛使用,导致电能质量下降;另一方面,随着计算机技术和半导体技术的发展,高自动化和高智能化的电子设备对电能质量提出了越来越高的要求[1,2]。IEEE标准中将电能质量扰动分为七大类,其中电力系统中常见的动态电能质量扰动有电压骤升、电压骤降、电压中断、暂态脉冲和暂态振荡。本文主要针对这5种扰动类型进行分析。
针对如何从扰动信号中定位并提取扰动特性以完成自动分类的问题,国内外学者进行了广泛深入的研究,已提出许多可行的方法。动态电能质量扰动分类包括特征提取与模式识别2个过程。其中,特征提取是对原始波形进行变换和重构,并从中提取有效的分类特征,较常用的有Hilbert-Huang变换[2]、FFT和STFT变换[3]、小波变换[4,5]、S变换[6]等。模式识别过程是对扰动信号样本进行分类,主要方法有神经网络[7]、支持向量机[8,9]、粒子群算法[9]等。与其他变换方式相比,小波包变换时- 频表现更好,可自适应地选择相应频带,高频部分分辨率高,在提取不同频段特征量的同时可有效定位扰动信号。 概率神经网络(Probabilistic Neural Networks,PNN)是一种结构简单、训练简洁的人工神经网络,较BP网络训练过程更加简单,收敛速度更快,稳定性更高。
本文首先选用小波包变换对原始信号进行3层分解,利用第3尺度上高频分解系数的模极大值点定位扰动信号,并在不同频率范围内提取重构系数,构造特征向量;然后,通过收集特征向量创建并训练PNN网络;最后,利用训练后的PNN网络对电能质量扰动信号进行分类。
1 小波包和PNN算法
1.1 小波包分析
小波分析作为一种时频分析方法,具有多分辨率分析的特点,其在分析和处理非平稳信号上,可以很好地展现出非平稳信号最根本和最关键的时频局域性质。小波包分析能够将频带进行多层次划分,它在对低频部分进行分解的同时也对高频部分进一步分解,为信号提供了一种更加精细的分析方法。同时,小波包可自适应地选择相应频带,与信号频谱相匹配[10]。
对采样信号S进行3层小波包分解,小波包分解树结构如图1所示,其中每层分解的低频段用A表示,高频段用D表示。
1.2 PNN算法
PNN是基于统计原理的一种前馈型神经网络模型,它由径向基函数网络发展而来,建立在贝叶斯最小风险准则的理论依据之上。PNN作为径向基网络的一种,适合于模式分类。PNN的层次模型由输入层、模式层、求和层、输出层共4层组成,其基本结构如图2所示。
PNN的4层结构有着不同的功能。输入层负责接收训练样本的值,再将其特征向量传递给整个网络。模式层负责计算输入特征向量与训练集中各个模式的匹配关系。模式层神经元的个数等于各类别训练样本数之和,该层每个模式单元的输出为
式中:X为输入向量;Wi为输入层与模式层连接的权值;δ为平滑因子,对分类起着至关重要的作用。
求和层将属于某一类的概率累加,按式(1)计算,从而得到扰动信号类别的概率密度函数。输出层是一种竞争神经元,该层的每个神经元与一个数据类型(即扰动信号类别)形成映射关系。
1.3 小波包和PNN算法实现
小波与PNN相结合的算法流程如图3所示。
2 基于小波包的扰动信号定位
采用Matlab软件对本文选取的正常信号和5种常见动态电能质量扰动信号建立模型,见表1。其中A为电压信号峰值;ω 为工频频率;u()为阶跃函数;T为工频周期;α,β为常系数;t1,t2,tb为常数;τ为时间系数;ωb为震荡频率。
选择稳定、标准的工频信号,并同时添加电压骤降、电压骤升、电压中断、暂态脉冲和暂态振荡5种扰动信号作为动态电能质量的扰动信号进行仿真分析,如图4所示。在信号采样时对每工频周期采样100个点,分解时选用db4小波函数对采样信号进行小波包3层分解。
利用小波包分析扰动信号,获得第3尺度上的信号重构系数如图5所示。
对原始采样信号进行小波包系数分解和重构后,不同扰动信号各个频段和同一扰动信号不同尺度上的重构系数均表现出明显的差异。因为扰动信号在除扰动起点和终点外的时间段内都是连续的,所以,在小波高频尺度上,只有突变点才有信息。利用这个性质可以定位扰动的起始和终止时刻。小波分析可以计算高频尺度上的模极大值点,通过确定模极大值点即可定位信号突变点。通过高频重构系数结点[3,7]的图像可以明确定位扰动信号。
3 基于小波包和PNN的扰动信号分类方法
3.1 信号能量特征向量提取
选取PNN扰动信号特征量时,需要使得扰动样本在最大程度上包含其信息量,最能反映扰动类别。同时,特征向量的构建应忽略一些无关量,以减小PNN规模。原始信号经过小波包3层分解重构后用8个频率成分S3j(j=0,1,…,7)代表第3尺度分解8个结点的频率范围。设频带S3j对应的能量为E3j,有
式中xjk(k=1,2,…,n)表示S3j的离散点幅值。
由于扰动信号出现时,会对各频带内信号的能量有较大的影响,所以,可以为元素构造一个特征向量T:
当能量较大时,E3j通常是一个较大的值,在数据分析上会造成不便。因此,可对向量T进行归一化处理,令
归一后的向量T′为
利用式(2)、式(4)、式(5)计算扰动信号,即可构造8个能量特征向量,特征向量的数据均转化为[0,1]之间的数,将其作为PNN网络的输入。选取一组计算后的能量值,见表2。
3.2 PNN网络训练与测试
采用Matlab函数newpnn()来创建PNN,建立扰动信号分类程序,PNN调用格式:
式中:P为输入向量;Q为目标分类向量;SPREAD为径向基函数的扩展速度。
式(6)表明扰动分类的准确率与训练样本数和参数spread值有关。将5 种扰动信号分别设置不同的信号参数,每种不同的扰动信号都获得20组训练样本及5组测试样本,共得到100组训练样本和25组测试样本。将所有训练样本作为训练PNN的输入样本,利用测试样本对该网络进行测试。使用100组训练样本和25组测试样本的特征向量作为输入,用数字1—5分别代表5种不同的扰动信号,作为分类的输出。
利用Matlab软件平台对训练样本进行PNN训练及测试,spread值选为0.9。PNN训练后的分类结果及误差如图6所示,PNN网络的测试样本分类结果如图7所示。
由图6和图7可知,经过训练,将训练数据输入已经训练好的PNN网络中,只有5 个样本出现判断错误,即总的判断准确率为95%。当通过预测样本进行验证时,只有1个样本出现了判断错误,即总的判断准确率为96%。经过训练后的PNN准确率表明,最后得到的网络可以用来对更多扰动信号进行分类预测。
4 结语
针对动态电能质量扰动的定位与分类问题,首先阐述了利用小波包系数分解和重构原始信号并在高频尺度定位扰动信号的方法,然后说明了进行扰动信号能量计算和特征向量构造的过程,最后介绍了通过PNN对不同特征向量(即扰动信号)进行分类的方法。Matlab仿真结果表明,该方法是可行的,具有一定的理论意义和实践价值。
参考文献
[1]宋雪雷.基于小波变换和支持向量机的电能质量扰动分析方法[D].哈尔滨:哈尔滨工业大学,2007.
[2]王畅.基于HHT的微网电能质量检测与分析[D].北京:华北电力大学,2014.
[3]徐永海,赵燕.基于短时傅里叶变换的电能质量扰动识别与采用奇异值分解的扰动时间定位[J].电网技术,2011,35(8):174-180.
[4]黄振威,郑寿森,祁新梅,等.基于db4小波变换和双ARM Cortex-M的电能质量分析系统[J].电测与仪表,2013,50(1):83-88.
[5]刘慧芳,陈勇胜,王群,等.基于小波变换和模糊逻辑的暂态电能质量扰动分类[J].电网技术,2008,32(3):84-87.
[6]黄南天,徐殿国,刘晓胜.基于S变换与SVM的电能质量复合扰动识别[J].电工技术学报,2011,26(10):23-30.
[7]王曦,毕贵红,祖哲.基于递归特性分析和BP神经网络的电能质量扰动识别与定位[J].电网技术,2012,36(8):215-222.
[8]李志勇,吴为麟,林震宇.基于相空间重构和支持向量机的电能扰动分类方法[J].电力系统自动化,2007,31(5):70-75.
[9]杨宁霞,孙皓,公政,等.一种基于PSO-SVM的电能质量扰动识别与分类的新方法[J].电测与仪表,2014,51(16):17-20.
PNN神经网络 篇7
1 声发射(1)
当材料发生变形或开裂后,材料受到外部或内部的作用力,会有瞬态弹性波因快速释放能量从材料的局部产生,这种物体因受力而产生瞬态弹性波的现象称为声发射现象。声发射源通常意义下是指弹性波在一定的应力作用下因有裂缝或变形产生引起弹性波的物体;而与材料变形或断裂没有直接关系的瞬态弹性波可以称为二次声发射源,如机械摩擦、流体泄漏、燃烧及撞击等[5]。
长期运行时,由于往复泵泵阀的腐蚀、磨损、变形或异物卡涩等原因造成泵阀泄漏,由于泵阀泄漏孔口前后之间的压力有较大的差异,泵阀内的流动介质会在泄漏孔口形成脉动压力场,介质从孔口处喷射而出,产生多相湍流射流,泄漏的声发射信号主要由3个原因引起[6]:机械振动发声———流体介质的压力在阀体内部产生不规则的波动与流体介质中的扰动和冲击使弹性元件振动产生的机械振动声音,这种振动模式产生的声发射,类似于金属拍击。空气动力学或湍流发声———当介质流动时,流体介质从泄漏孔口流出,由于流动突然膨胀或减小,会形成湍流。汽蚀发声———当流体介质泄漏时,液体通过节流孔流段的泄漏会突然收缩,孔口的压力可以使液体汽化,即达到液体的汽化压力时液体蒸发,使部分液体形成泡沫;在流体介质的下游,因流体的扩张而压力上升,随着压力升高,流体介质形成的气泡内部的压力会低于流体介质的外部压力,泡沫因压力差过大破裂产生汽蚀发声。汽蚀发声是泵阀声发射的主要声源,它的大小与流体流动的流量、速度、泵阀大小、阀门进出口压力、泵阀类型、流体的物理性质和泄漏孔口形状有关[7]。因此通过声发射信号可以对往复泵泵阀进行故障诊断和模式识别。
2 故障诊断实验
实验采用的往复泵是BW-250型注浆泵。往复泵在工作时,活塞、密封圈、缸套及泵阀等是液力端的主要易损件,选取活塞磨损、弹簧断裂和阀盘磨损3种故障作为故障样本进行实验。将正常的和带有故障特征的部件分别换上,往复泵泵阀声发射信号采集系统如图1所示。基于LMD盒维数和PNN的往复泵泵阀声发射故障诊断流程如图2所示。
实验中往复泵转速设为72r/min,传感器选择SR150M型声发射传感器,采用SAEU2S声发射采集箱,前置放大器采用PAⅠ系列前置放大器,该系列前置放大器的增益为40±1d B,带宽为10.0k Hz~2.0MHz。前置放大器在声发射系统中对准确采集声发射信号起着重要的作用,在整个声发射系统中,前置放大器对噪声测量有较大的影响。在测量声发射信号时为准确测量需要提高增益和降低噪声,前置放大器在整个系统中的作用是提高信噪比性能,具有降低噪声和提高增益的功能。实验时设置采样频率为1MHz,采样长度为140 000点,对4种工况下的声发射信号进行采集。
3 LMD分解和盒维数计算
局部均值分解和经验模态分解(EMD)相比减少了迭代次数,摒除了EMD在处理信号时的具有欠包络和过包络的弊端,复杂的多分量信号可以分解为一系列单一成分的纯调频调幅信号即PF分量,能有效地提取各个故障状态下的信号特征信息,可在一定程度上抑制端点效应,PF分量相较于EMD分解的IMF分量有更多的频率和包络信息得到保存,所以LMD与EMD相比包含原始信号的有效信息较多,含有声发射信息的噪音较少[8,9,10]。LMD分解有以下7个步骤:
a.对于任意信号x(t)找出它所有的局部极值点ni,求出所有相邻局部极值点平均值和所有相邻局部极值点相减的绝对值,并分别除以2,得到mi和αi,
b.将相邻的mi均用直线连接起来,为得到局部均值函数m11(t),需要进行平滑处理,可以使用滑动平均法进行。用同样的方法得到包络估计函数α11(t)。
c.从原始信号x(t)中分离出局部均值函数m11(t),得到h11(t)=x(t)-m11(t)。
d.用h11(t)除以包络估计函数α11(t)以对h11(t)进行解调,得到s11(t)=h11(t)/α11(t)。当s11(t)是一个理想的纯调频信号,即它的包络估计函数α12(t)满足α12(t)=1,如果α12(t)≠1,则将s11(t)作为原始数据重复以上迭代过程,直到s1n(t)是一个纯调频信号,即它的包络估计函数α1(n+1)(t)满足α1(n+1)(t)=1。实际应用中,在不影响分解效果的前提下,可以设定一个变动量Δ,当满足1-Δ≤α1n≤1+Δ时,迭代终止。然后把迭代过程中产生的所有包络估计函数相乘得到包络信号,
e.原始信号的第1个分量可通过将包络信号α1(t)和纯调频信号s1n(t)相乘得到,PF1(t)=α1(t)s1n(t)。
f.PF1(t)包含给定信号中的最高频率成分,它是一个单分量调幅-调频信号,其瞬时幅值就是包络信号α1(t),其瞬时频率f1(t)则可由纯调频信号s1n(t)求出。
g.将PF1(t)从给定信号x(t)中分离出来,得到一个新信号u1(t),将u1(t)作为原始数据重复以上步骤,循环k次,直到uk(t)为一个单调函数为止。这样给定原始信号x(t)被分解成k个PF分量和uk(t)之和,即,其中uk(t)是残余项,PFp(t)为包络信号和纯调频信号乘积。这说明LMD信号分解后没有造成信息丢失,原始信号保持良好[11]。
图3所示是一个活塞磨损声发射信号LMD分解图。声发射信号经LMD分解后,各PF分量在不同频率范围反映了信号的变化趋势,往复泵泵阀声发射信号的主要信息分布在前几个PF分量中,因此前几个PF分量是分析的主要对象,从图3中可以看出PF1(t)~PF6(t)贡献率之和超过95%,而且PF7(t)贡献率很低,残余信号R分量几乎呈直线,说明与原始信号相关性很小,可以忽略不计。
在经过LMD处理的基础上结合分形盒维数的方法,计算各LMD分解的PF分量的盒维数。系统的非线性行为可以使用分形理论中的分形维数定量描述其特征量,其中盒维数的大小和变化可以反映非线性信号的复杂程度和不规则程度,它是分形维数的一种[12]。因为盒维数的计算相对于其他分形维数不太复杂,在信号处理中得到了较为广泛的应用。在往复泵泵阀信号的特征提取中,分形盒维数不仅可以定性分析机械系统各故障状态的运行状况,还可以对各状态信号进行量化,对机械系统产生的非线性信号计算盒维数,对其进行进一步的分析比较可实现对复杂机械系统的故障诊断。
设集合F是Rn中任一非空有界子集,记N(A,δ)表示最大直径为δ且能覆盖F的集合的最小数,则F的盒维数定义为:
然后在ln N(δ)~ln(1/δ)图中确定拟合一段线性良好的信号无标度区,则分形盒维数即是拟合得到的直线斜率。由于分型空间的特殊性,其元素F必定是非空紧子集,故盒维数所针对的集合允许是开的。
利用式(1)求出每种情况下PF1~PF6的盒维数,它可以反映非平稳信号不平稳程度的大小和复杂度的变化,不仅可以对信号进行定性分析,还可以对系统进行定量分析,因此可以准确、清楚地反映4种工况下的故障特征。活塞磨损故障信号各PF分量盒维数如图4所示,可以看出从PF1到PF6分量的盒维数依次减小。信号的盒维数大小反映信号的规则程度,包含的信息量越多,信号不规则的程度越大,其盒维数也越大,盒维数最大的是PF1分量信号,是信号中的主要成分,从PF2到PF6盒维数依次减小,表明与原信号的关联程度也随之减小。
对信号进行LMD分解后,计算4种状态声发射信号各PF分量的盒维数(表1)。分形盒维数介于1和2之间,信号越不规则,分形盒维数越大[13]。从表1可以看出,LMD分解信号的各PF分量的盒维数中,不同故障状态下的盒维数数值有明显的区间范围,往复泵泵阀正常状态盒维数最大,依次是阀盘磨损故障盒维数、活塞磨损故障盒维数,弹簧断裂故障盒维数最小。
正常工况下系统产生声发射信号的因素有缸套、底座等振动发声多方面因素,但不起决定性作用,正常信号PF1~PF4由于信号分布均匀、复杂性大,其盒维数比故障信号盒维数大,而其余PF分量由于随机性小于故障工况,因此其盒维数比故障工况小或差别不大。而且,正常状态的声发射信号也包含规律性的声发射成分,它不是完全的噪声成分。弹簧断裂故障的盒维数与其他运行状态相比最小,由于泵阀在工作过程中弹簧有规律的上下往复运动,弹簧磨损不会产生泄漏孔口,内外压力差相对较小,泵阀内的流体相对平稳,所以弹簧断裂故障的不规则和不确定性较低,盒维数最小。
4 PNN分类预测
19世纪80年代,Specht D F博士首先提出概率神经网络,它是一种基于Parzen窗与贝叶斯分类规则的概率密度函数估计方法。这样的网络权值对应模式样本的分布格局不需要训练,可以满足实时处理的训练要求[14]。
PNN网络经由径向基函数发展成为一种前馈神经网络,比较适用于信号的模式识别,它由输入层、模式层、求和层、输出层共4层组成[15]。其基本结构如图5所示。
随机选取正常、活塞磨损、弹簧断裂、阀盘磨损4种状态下各20组数据,共80组声发射信号,LMD分解的PF1~PF6计算得到的盒维数作为PNN网络的特征向量。任意取其中48组作为训练样本,其余32组作为测试样本进行模式识别,从而训练PNN多故障分类器,分别对正常、活塞磨损、弹簧断裂、阀盘磨损4种状态进行分类。训练样本分类器时,将选取的正常样本标记为1,活塞磨损故障样本标记为2,弹簧断裂故障样本标记为3,阀盘磨损故障样本标记为4。
将样本输入分类器的训练效果如图6所示,可见第13组数据实际故障是阀盘磨损故障(标记为4),训练时将其识别为正常(标记为1),故训练误差为-3.0;第16组数据实际故障是活塞磨损故障(标记为2),训练时将它识别为弹簧断裂故障(标记为3),训练误差为1.0;第40组数据实际故障是阀盘磨损故障(标记为4),训练时被识别为弹簧断裂故障(标记为3),训练误差为-1.0。因此,网络对训练集分类的正确率为93.75%。
利用训练好的网络对测试集分类,分类效果如图7所示,32个测试对象中的30个被正确识别,其中第26组和31组数据将阀盘磨损故障划分到弹簧断裂故障类别中,总体分类成功率为93.75%,分类效果比较理想。
5 结论
5.1 LMD分解信号的方法有效地提取了往复泵泵阀声发射信号特征,减小了EMD方法中存在的模式混叠现象,提高了系统的抗噪能力。
5.2在往复泵泵阀故障诊断中LMD和分形盒维数可以定量计算盒维数正常条件和故障的不同部分的描述,说明不同失效模式的盒维数具有可分性和明显的区间范围,采用盒维数计算各个状态下的非线性平稳信号分析比较进行故障诊断。
5.3通过LMD分解声发射信号,计算各分解信号盒维数输入PNN进行识别,减少了工作量且分类效果较好。
5.4声发射技术可以用在往复泵泵阀设备的故障诊断,并取得不错的效果。
摘要:针对往复泵泵阀故障诊断,提出使用声发射技术对往复泵泵阀进行故障信号采集。利用局部均值分解(LMD)对非线性声发射信号处理和分形盒维数对非线性信号定量描述的特点,首先对故障信号进行LMD处理,得到含有故障特征的PF分量,然后算出各PF分量的盒维数,通过比较分析盒维数进行故障诊断,最后将各PF分量的盒维数作为特征向量输入概率神经网络(PNN)进行模式识别。通过实验分析,证明该方法对往复泵泵阀故障诊断是有效可行的。