改进的LVQ神经网络(精选9篇)
改进的LVQ神经网络 篇1
摘要:随着知识发现和数据挖掘的迅速发展, 出现了很多的数据挖掘方法, 这些方法很多都依赖于离散的数据, 连续属性的离散化是数据分析预处理中的一项重要内容, 在数据挖掘、机器学习等领域中具有重要作用。然而, 在现实世界数据库中, 存在着大量的连续值属性。因此, 常常需要对连续值属性进行离散化本文利用LVQ神经网络能够找到连续属性断点的功能, 提出了一种基于LVQ神经网络的离散化方法, 从而实现了对连续属性的离散化。算法分析和实验证明, 本算法是切实可行的。
关键词:离散化,LVQ神经网络,连续属性
0前言
随着信息爆炸时代和网络化普及时代的到来, 我们每天都处于被信息包围的的环境, 在这种情形下, 数据挖掘技术发挥了越来越重要的作用, 而离散化是数据挖掘在实际应用过程中一个非常重要的环节。因为在我们所接收到的信息中, 包含了大量的非离散化的数据, 为了更好地利用数据挖掘技术进行数据处理, 必须首先对我们接收道德数据进行离散化处理, 现在离散化处理的算法已经达到了一个比较完善的高度。目前离散化主要利用统计学、布尔理论、聚类技术和熵等[1,2,3,4], 这些方法在数据挖掘过程中也已经发挥了重要的作用, 但这些方法也有缺陷, 最主要就是对离散化对象的敏感性考虑的不到位, 最终可能对影响对数据离散化处理的效率和准确性。
本文在对离散化的各种算法进行分析比较研究之后, 利用LVQ神经网络在对断点分析方面的优势, 提出了一种基于LVQ神经网络的离散化算法。
1 离散化的内涵
国内外众多的研究者进行了各种新的尝试, 从各个角度提出了许多可行有效的离散化办法[5,6,7], 但是目前理想的、适用于不同类别数据, 不同的归纳学习算法的离散化方法还没有见到.因此, 数据离散化的方法及其实现技术仍是一个有意义的研究方向。
2 LVQ神经网络
LVQ神经网络学习的过程实际上就是逐渐调整其权值的过程[3], 它是由芬兰学者Kohonen提出的自组织特征映射神经网络[4,9]演变而成, 其中的向量量化是标量量化的扩展。该网络是一种混合网络, 其网络结构如图1所示, 该模型分为两层, 第一层是竞争层, 第二层是线性层, 主要功能是将竞争层的分类结果传递到用户定义的目标分类上。
LVQ神经网络有i两个网络层, 即竞争层和线性层, 竞争层对输人向量的学习分类与竞争层一致, 我们把竞争层的分类称为子分类, 线性层根据用户的要求将竞争层的分类结果映射到目标分类结果中, 我们把线性层的分类称为目标分类。竞争层和线性层的每一个神经元的输出都对应一个分类 (子分类或目标分类) 结果, 所以竞争层通过学习, 可以得到S类子分类结果, 然后线性层将S类子分类结果再分成T类目标分类结果 (S始终大于T) 。例如假设竞争层的第1, 2, 3个神经元对输入空间的子分类锁对应的线性层的目标分类为第2类, 则竞争层的第1, 2, 3个神经元与线性层的第2个神经元的连接权将全部为1, 而与其他线性层神经元的连接权全部为0, 这样, 当竞争层的第1, 2, 3个神经元中的任意一个神经元在竞争中获胜时, 线性层的第2个神经元将输出1.
3 基于LVQ神经网络的离散化方法
LVQ神经网络学习的过程实际上就是逐渐调整其权值的过程, 由芬兰学者Kohonen教授提出的[9], LVQ神经网络是一个两层网络, 即由输入层和竞争层组成, 输入层接收样本, 竞争层对样本进行分类, 这两层的神经元进行完全相互连接, 竞争层的神经元按二维形式排列成一个节点矩阵, 一般输入层节点数等于能够代表分类问题模式的维数, 输出节点数根据具体问题来决定。
(1) 算法思想
我们首先利用LVQ神经网络的分类功能, 将每一个连续属性分割成若干类, 分割连续属性也就等于找到了一个断点集合, 这样对每个连续属性离散化完毕之后, 我们再次利用LVQ神经网络检测离散化后的属性是否仍然满足决策一致性, 若满足就说明离散化成功, 否则重新寻找断点集合, 直到满足决策一致。
(2) 算法步骤
(1) 判定属性重要性
设K= (U, R) 是一个知识库, P, Q哿R, 我们说知识Q程度k (0≤k≤1) 与知识P相关, 记为P圯k Q, 当且仅当
若k=1, 则称Q与P完全相关, 即P圯Q;若0<k<1, 则称Q与P粗 (或部分) 相关;若k=0, 则称Q独立于P。P圯1Q圳P圯Q
(2) 利用LVQ神经网络对连续属性分类
利用LVQ神经网络对连续属性进行离散处理, 输出层神经元数量等于聚类数目。因此聚类数目的选取是第一步, 如果选取的少, 则很有可能会导致离散效果不准确, 影响我们对学习情况的判断和下一步的处理;否则, 会出现过离散情况, 可能会得到与事实不符的处理情况, 失去离散化处理的意义。极端情况下, 离散处理后决策系统中对象的条件部分互不相同, 各自形成独立的规则, 导致应用中对规则条件匹配判断的复杂性增加。然而在现有的讨论结果中, 网络输出层神经元数目的确定没有一套固定成型和科学的方法。因此这种方法的关键在于确定神经元的数目。
(3) 找到其中一个断点集合, 并对其进行离散化
对得到的聚类数据, 分别用不同的离散数据替代得到的每一类数据, 从而实现了连续属性的离散化, 然后转 (2) , 直到对每一组属性离散化完毕, 就得到了离散化后的属性表。
(4) 判断离散化后的决策系统是否满足决策一致性
得到离散化后的属性表, 再次利用LVQ神经网络进行训练, 利用Matlab仿真函数验证得到的聚类结果是否满足决策一致性。如果满足证明离散化成功, 否则转 (2) 重新对其离散化, 直至满足决策一致性。
利用LVQ神经网络的newc () 函数新建一个的网络, 为了加快学习, 将学习效率设置为0.1, 训练样本为属性A, 经过训练之后为了检验网络的分类能力, 需要对网络进行测试, 我们利用仿真函数sim () 可以看到的聚类结果是:
表明将数据分为三类。由此可见, 网络成功的对训练样本进行了分类, 其中第1、第7为一类, 第2、第6为一类, 第3、第4、第5、第8为一类。每一类用一个离散数据替代, 所以可以得到的离散化结果是:[0 1 22 2 1 0 2]
用同样的方法对属性B进行离散化处理, 得到的离散化结果是:[0 1 2 0 2 2 1 0]
连续属性离散化之后我们需要验证一下离散化的结果是否对属性表的一致性产生了影响, 所以我们再次利用LVQ神经网络来检验, 现在训练样本为P=[0 1 2 2 2 1 0 2;0 1 2 0 2 2 1 0]
经过训练得到的聚类结果是:
我们发现得到的结果和原来的决策属性完全一致, 说明对连续属性的离散化并没有改变属性表的一致性。
4 小结
我们利用LVQ神经网络的自主学习和记忆功能, 找到连续属性的断点结合, 经过LVQ神经网络的训练和学习, 解决了数据挖掘技术中的离散化问题, 并通过Matlab仿真实验验证了离散化后并没有改变原始数据的基本属性, 说明离散化处理对于我们在信息爆炸时代, 而又无法在数据的海洋中无法找到所需要的数据的问题有非常重要的作用和意义。
参考文献
[1]徐泽柱, 王林.基于粗糙集理论和BP神经网络的数据挖掘算法[J].计算机工程与应用, 2004, 31 (03) :169-172.
[2]余卫雄, 姜礼平, 萧星.基于粗糙集和神经网络的联合模式识别系统[J].海军工程大学学报, 2006, 18 (02) :87-90.
[3]蒋丽华, 覃征等.基于粗糙集的LVQ神经网络的稽查选案模型研究[J].计算机应用.2006, 26 (12) :205-207.
[4]谢振华, 商琳, 李宁等.粗糙集在神经网络中应用技术的研究[J].计算机应用研究, 2004, 21 (9) :71-74.
[5]江虹, 伍春, 包玉军等.基于粗糙集的认知无线网络跨层学习[J].电子学报, 2012, 40 (1) :155-161.
[6]赵长雷.数据挖掘中属性离散化方法研究[D].大连:大连理工大学, 2010.
[7]董卓, 朱永利, 胡资斌.基于遗传规划和数据归一化的变压器故障诊断[J].电力科学与工程, 2011, 27 (9) :31-34.
[8]刘小龙, 江虹, 吴丹.基于CACC的连续数据离散化改进算法[J].计算机工程, 2013, 39 (4) :48-51.
[9]Kohonen T.Self-Organizing Maps[M].Berlin, Germany:Springer Verlag, 1995:155-165.
改进的LVQ神经网络 篇2
关键词:大豆品质;检测速度;神经网络
中图分类号: TP391.41;S126 文献标志码: A 文章编号:1002-1302(2014)03-0263-03
我国大豆产业的发展已经日趋成熟,基于大豆作物的深加工产品(包括色拉油、异黄酮等)也为企业带来了丰厚的利润。目前我国每年的大豆深加工产值已经超过300亿元人民币。大豆在收购时必须进行质量的检测与评估,当前我国大豆检测手段的准确度和效率均难以达到要求,导致我国大豆由于质量问题而出口机会减少。大豆品质检测的主要指标有外观品质、营养品质、食味品质、卫生品质等,其中外观品质包括大豆的病斑、虫蚀、霉变等。已有研究证明大豆的外观皮质与其营养品质、卫生品质具有高度的正相关性[1],因此可以通过对大豆外观的检测来辨别其质量的优劣。当前,如何通过大豆的外观品质特征来评估其品质水平是作物品质检测研究的热点之一[2-3]。基于神经网络识别的方法由于自学习能力强,并能够对人脑的神经进行高效模拟,从而实现具有较强鲁棒性的推理判别,十分适合于作物果实品质的鉴定和评估[4],检测效果较好。传统的神经网络算法存在学习过程收敛速度慢、算法易陷入局部极小点和鲁棒性差等缺陷,常常会导致作物识别与品质评估识别的正确率受到影响[5-6]。本研究针对传统神经网络算法所存在的缺陷,引入粒子群优化算法对其进行改进,使之具备更加准确地分类并识别大豆种子的能力,最后通过仿真对比试验,证明了所构建的大豆品质检测系统的准确度有了显著提升。本研究的成果在作物种子品质鉴别与质量评估方面有着很好的理论价值与实践意义。
1 基于改进神经网络的大豆品质检测算法
1.1 大豆种子样本图像的获取
大豆种子采集时间为2012年9月,采集地点为河北省农业研究所宣化林场及育种基地。室内简单背景下拍摄大豆种子的静态图片。将大豆种子平铺于拍摄平台上,在三角架上固定相机,保持镜头与大豆距离恒定在1.0 m,确保颜色及特征清晰,图像输入电脑并以JPG格式保存。
1.2 大豆种子样本图像预处理
1.2.1 灰度预处理 原始图像数据量较大,首先将其转换为8位灰度图像。转换之后的图像仅保留灰度信息,这对图像预处理已足够。在大豆图像增强中,主要是对一些强度不足的边缘与细节进行处理,同时保留强度足够的部分。本研究引入分段线性形式,来实现小波变换的增强函数,如下式:
2 仿真研究
2.1 仿真环境的设置
本研究将包含3层结构的神经网络作为大豆品质识别的基本模型。前面已经通过关联分析而得到了影响较大的5个因子(能量、对比度、熵、I分量、H分量),所以神经网络输入层的节点数目确定为5个。结合文献中学习速率区间为[0.01~0.7]的研究结论,将学习速率最终定位于0.7。结合Kolmogorov算法[9],得出隐含层为15个节点,神经网络为6-15-1型结构。以粒子群算法优化传统的神经网络方法,对神经网络进行训练,从而获取较优的权值、阈值。
具体步骤为:(1)构建优化神经网络的输入矩阵,包括网络所需的训练样本、网络的期望输出值以及网络的测试样本;(2)引入Matlab实现对试验数据的仿真分析,创建神经网络(函数均来自Matlab的神经网络工具箱,下同,注略):
net=newff(min max(PTrain),{logsig″logsig″},′traingd′
程序语句中,″logsig″为神经网络不同层次之间的传递函数,′traingd′为训练函数。神经网络创建之后,便开始进行权值、阈值的初始化;(3)创建粒子群优化的神经网络:创建方法同(1);(4)通过Matlab的train函数实现对神经网络的训练。语句为:
[net,tr]=train(net,P_Train,T_rain)
网络输入、输出维数以参数P、T表示。
2.2仿真结果分析
2.2.1 网络性能对比 图2所示为基本神经网络与粒子群优化神经网络的训练误差曲线对比。
图2中,横坐标是神经网络的训练次数,纵坐标为训练误差值。从基本神经网络的误差曲线可知,训练次数超过300次时,目标误差值10-4尚未达到,收敛较慢,性能不佳;而粒子群优化后的神经网络则在第19次时满足了目标误差值,可见性能有较为明显的提升,经过更少的迭代次数就使网络的性能达到了要求。
2.2.2 识别结果比较 选取正常大豆、各类带病大豆以及正常与病态混合大豆各100幅图片,以传统神经网络与粒子群优化神经网络对其进行识别,识别结果如表1所示。
可见,粒子群优化的神经网络对各类大豆样本图像的识别率均超过90%,其平均识别率为93.1%;传统神经网络平均识别率仅为88%。可见优化的神经网络拥有更精确的大豆品质识别能力,对各类缺陷豆和病害豆的识别率均显著优于传统神经网络。仿真结果表明:经过粒子群优化的神经网络可以对大豆种子的品质评估提供令人满意的支持,效果比较理想。
3 小结
作物种子的品质识别是现代农业中非常重要的技术,也是农业信息化和精确农业的研究热点之一。本研究基于传统神经网络在图像识别中的一些不足之处,引入粒子群优化的算法进行改进,对经过预处理和特征提取的大豆种子图像进行验证,仿真结果表明优化的神经网络可以显著增强大豆种子品质的识别率、提升识别效率,在现代农业中应用前景看好。
nlc202309022340
参考文献:
[1]傅艳华,王鹏程,阳庆华,等.大豆食品加工利用现状与发展前景[J]. 湖北农业科学,2001(1):62-64.
[2]李 聪,高海燕,袁 超. 基于计算机视觉的苹果自动分级方法研究[J]. 计算机仿真,2012(9):293-296.
[3]黄星弈,魏海丽,赵杰文. 实时在线检测苹果果形的一种计算方法[J]. 食品与机械,2006,22(1):27-29.
[4]冯 斌. 计算机视觉信息处理方法与水果分级检测技术研究[D]. 北京:中国农业大学,2010.
[5]Schroder M,Rehrauer H,Seidek K,et al. Interactive learning and probabilistic retrieval in remote sensing image archives[J]. Geoscience and Remote Sensing,38(5):2288-2298.
[6]彭淑敏. 神经网络图像识别技术研究及实现[D]. 西安:西安电子科技大学,2005.
[7]Kalchmair S,Jhrling N,Becker K,et al. Image contrast enhancement in confocal ultramicroscopy[J]. Optics Letters,2010,35(1):79-81.
[8]高 岩,乔彦峰. 一种改进直方图均衡的图像增强方法[J]. 计算机仿真,2008,25(4):198-200.
[9]Kenned J,Ebemart R C. Partical swarm optimi-zation[C]//Proceeding of 1995 IEEE International Conference on Neural Networks,1995:192-194.
[10]常爱英,吴铁军,包 鑫,等. 基于最小二乘支持向量机的配煤着火特性预测模型[J]. 煤炭学报,2010,35(8):1380-1383.
[11]蔡金锭,付中云. 粒子群神经网络混合算法在负荷预测中的应用[J]. 高电压技术,2007,33(5):90-93.
改进的LVQ神经网络 篇3
异步电动机具有结构简单、制造成本低廉、可靠性高等特点,在生产领域中得到广泛应用。它的正常工作对保证生产制造过程中的安全、高效、敏捷、优质及低耗运行具有重大意义。文献[3]对电动机的振动信号进行小波变换,提取特征向量,利用BP网络建立了故障诊断系统。
学习矢量量化(learning vector quantization,LVQ),为一种有教师状态下对竞争层进行学习的算法,通过竞争层的自动学习来识别输入向量,能有效解决BP网络学习速度慢、可能陷入局部最小的问题。应用LVQ神经网络实现对异步电动机的故障识别分类,并与传统的BP网络诊断进行比较。
1 异步电动机故障简述
异步电动机故障分为机械部分故障和电气部分故障。其中,电动机电气部分故障有:匝间短路,断条,线圈间短路,铸造缺陷,气隙不均等。电动机的机械部分故障主要有:运动部件的质量不平衡,轴承磨损,几何轴线不对中,运动部件配合失当,油膜振荡等。
当电动机内部出现故障、零部件产生缺陷或装配和安装情况不当时,其振动的振幅、振动形式及频谱成分均会发生变化,常见的电动机异常振动有以下几种:
a) 定子异常产生的电磁振动。当定子三相磁场不对称、定子铁心和定子线圈松动、电动机座底螺丝松动等都将引起异常振动。
b) 气隙不均匀造成的电磁振动。气隙不均匀有两种情况,一种是静态不均匀,转子轴心与定子中心不重合时,定、转子之间气隙将出现偏心现象:另一种是动态的不均匀,由转轴挠曲或转子铁心不圆造成。都将引起异常的电磁震动。
c) 转子不平衡产生的机械振动。电动机转子质量分布不均匀时,产生重心偏移,不平衡重量在旋转时产生的单边离心力引起了变化的支撑力,因而产生异常的机械振动。
d) 滚动轴承异常造成的机械振动。由于电动机滚动轴承破坏、设计和制造中的误差,在运行中将会出现异常的机械振动。
2 异步电动机故障诊断方法
2.1 故障诊断的神经网络方法
目前,不少文献已对异步电动机的故障机理进行了研究,得到了大量有关异步电动机振动的典型故障征兆。充分利用小波变换优良的时频局部特性和多分辨率的处理能力,把与电动机故障密切相关的频段内提取的能量值作为故障诊断的特征量。
神经网络故障识别方法,是根据异步电动机不同状态的振动信号,通过建立故障模式训练样本集,对网络进行训练。当网络训练完成后,对于每一个新输入的状态信息,网络将能够迅速地给出分类结果。其诊断流程如图1所示。
2.2LVQ神经网络的结构
LVQ神经网络是在监督状态下对竞争层进行训练的一种学习算法。其网络模型如图2所示。
LVQ神经网络分为两个网络层,即竞争层和线性层。竞争层对输入向量的学习分类,这种分类的结果仅仅依赖于输入向量之间的距离。线性层根据诊断的要求将竞争层的分类结果映射到目标分类的结果中。其中,R是输入矩阵的元素数,S1是竞争神经元数,S2是线性神经元数。竞争层通过学习最多可将输入分为S1个子类,而线性层以后最多能形成S2个目标类别,通常有S1>S2。
2.3 LVQ神经网络的学习规则
LVQ神经网络的学习是一种有导师的学习方法,所以其训练样本集的输入向量和目标向量是成对出现的,即:{p1,t1},{p2,t2},…,{pQ,tQ}。每个目标向量,除了有一个元素为1以外,其余元素均为0,目标向量中元素为1的行即为相应的输入向量模式。
网络进行训练时,对每个输入向量p,先以函数ndist计算它与输入权值向量IW1每行元素的距离,使隐层神经元进行竞争。假设n1的第i个元素值最大,则竞争层的第i个神经元将赢得竞争,这使得竞争层的输出a1的第i个元素值为1,其余元素为0。当a1与第二层网络权值LW2相乘时,在a1中唯一的一个元素值为1的元素被认为是与输入向量对应的第k个分类模式,所以网络认为输入向量p为第k个分类模式,则a2的第k个元素输出1,当输入向量p得到正确的分类时,aundefined=tk=1,IW1的第i行可以按下式进行修正:
IW1(q)=iIW1(q-1)+α[p(q)-i,IW1(q-1)] (1)
当输入向量p得到错误的分类时,aundefined=1,tk=0,aundefined≠tk,IW1的第i行可以按下式进行修正:
iIW1(q)=iIW1(q-1)-α[p(q)-iIW1(q-1)] (2)
经过以上的修正后,每个神经元移向那些落入形成子类的类中的向量,而远离那些落入其他类中的向量。
3 基于lvq网络的异步电动机振动故障诊断仿真
3.1 网络训练样本集的构建
应用神经网络分析异步电动机故障的振动信号,首先提取电动机振动故障状态的特征向量,把这些特征向量作为网络的输入信号。根据文献[3],对额定功率5.2kW,额定频率50Hz,额定电压380V,额定电流13.2A,极对数4,额定转速720r/m,三角形接法的异步电动机进行模拟故障试验,对其振动信号,采样频率为1000Hz,采用Daubechies小波,分解层数6,共分成64个频带;从中选取 S2(15.652Hz~23.4275Hz)、S3(23.4275Hz~31.26Hz)、S6(46.865Hz~54.6865Hz)、S16(124Hz~132.8126Hz)、S19(148.4275Hz~156.35Hz),S25(195.3124Hz~ 203.135Hz)频带上的能量值作为特征向量。
取异步电动机的3种典型故障(轴承故障,转子故障,绝缘故障)及正常状态,在这4种运行状态下分别选取15组共60组数据作为LVQ网络的训练样本,其中前56组用来训练神经网络,用后4组对训练好的网络进行测试。目标输出分别为:1)正常状态;2)轴承故障;3)转子故障;4)绝缘故障。表1是对应4种运行状态的部分学习样本。
3.2 LVQ网络对异步电动机振动故障的分类
由于LVQ网络是一种有监督状态下对竞争层训练的方法,所以竞争层自动学习分类输入矢量。但是,竞争层划分的类别仅仅决定于输入矢量间的欧氏距离。显然,如果2个输入矢量非常接近,竞争层可能将它们划分为同一类,所以LVQ网络的设计主要在于竞争层节点数的选择。
首先创建一个LVQ神经网络,小波包分解提取了振动信号6个频带内的能量值作为输入,所以输入层为6个神经元,竞争层分别取5,10,15,20个神经元。然后分别用训练样本对网络进行训练和对检测样本进行检验。设置训练步数为500,精度0.01,观察其分类性能。为方便比较,同时创建了一个BP网络,输入层为6个神经元,输出层为4个神经元,分别用(1000),(0100),(0010),(0001)代表故障诊断的四种状态,隐含层分别取6,7,10个神经元,用相同的训练样本和测试样本进行仿真检验,最大训练步数设为3000,精度0.01,学习速率0.05。两种神经网络的分类结果列于表3和表4。
图3是竞争层节点数为10时LVQ网络的训练结果,经过13次训练后,网络误差为0;图4是隐含层节点数为7时BP网络的训练结果,经过1857次训练后,网络误差才达到要求。
从表3和表4及图3和图4可以看出,虽然二者都能正确分类,但LVQ网络的训练过程要比BP网络快得多,并且LVQ网络对竞争层的节点数要求并不高,只要竞争层的节点数大于输出层节点数就可以得到与测试目标一致的分类结果,而BP网络则随着隐结点数的变化,训练步数及分类精度也有较大的差别。
4 结语
对LVQ网络诊断方法在异步电动机振动故障诊断中的应用进行了探讨,并基于LVQ网络理论,构造了一个LVQ网络分类器,成功地对异步电动机4种典型振动故障类型进行了诊断与识别,并与BP网络诊断方法作了对比分析。仿真结果表明,该方法学习周期短,对学习样本、竞争层数量要求相对较低,具有良好的故障识别性能,表明了利用LVQ网络进行异步电动机振动故障诊断快速分类是可行的。该方法有一定的理论意义和实用价值。
参考文献
[1]朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006.
[2]王楠,谷立臣.SOM网络在电机转子故障诊断应用中的可视化分析[J].煤矿机械,2009,30(3):190-192.
[3]朱丽娟,田慕琴.基于小波神经网络的异步电动机振动故障诊断研究[D].山西:太原理工大学,2008.
[4]彭文季,罗兴锜,逯鹏.基于对向传播神经网络的水电机组振动故障诊断研究[J].西安理工大学学报,2006,22(4):365-368.
[5]徐涛,王祁.基于小波包LVQ网络的传感器故障诊断[J].哈尔滨工业大学学报,2007,39(1):8-10.
网络团队教研竞赛中的问题和改进 篇4
【关键词】网络团队教研竞赛 问题 改进 建议
网络团队教研竞赛是在新课程背景下,依托网络通讯技术,通过同侪互助的协作方式在参与信息化教学设计、评价教学设计、反思与完善教学设计、可视化陈述与答辩的竞赛过程中,快速提升教学业务能力、感悟网络促进教师专业发展方法的信息化教师竞赛方式。这种竞赛方式一经推出,很快得到了教研及相关机构的重视,这一赛事也成为新时期教研机构促进教师专业发展的重要项目之一。
作为连续几届南京市网络团队教研竞赛的评委,笔者欣喜地看到参赛团队明显增多,教师参赛意识普遍增强,珍惜机会,认真准备,积极参与,把竞赛过程当成是学习、交流、体验、反思的过程。各队在竞赛中不仅分工合作,协调作战,而且从教学设计、教学方法、评价与修订到陈述与答辩等多个方面充分体现了先进的教育理念和专业精神,展示了他们雄厚的实力,彰显出各自独特的魅力。
当然,竞赛中也反映出一些问题,其中不乏共性的东西,值得我们关注和研究。
一、网络团队教研竞赛中存在的共性问题
问题之一:一些教师的观念依然陈旧。他们不理解竞赛的目的、意义和要求,甚至误读“网络团队教研”竞赛的宗旨,不能把握网络团队教研的真正内涵。
问题之二:部分参赛选手教学能力不足。在教学设计环节中,少数参赛团队不按要求,凭经验、凭想象设计教案。
问题之三:对“网络团队教研”的理解不到位。个别参赛团队误解“网络团队教研”,他们对课堂设计的理解仍然停留在PPT和图片运用的基础上,基本没有达到参加竞赛的意义。
问题之四:滥用现代信息技术。部分团队在竞赛中设计了QQ、家教新干线等等,这些手段并不适合学校教育的实际情况,因为学校并不主张大部分学生使用QQ,使用QQ不仅耗时耗力,而且对未成年人来说很不安全,家教新干线也必须在特定的环境下才能使用。
问题之五:存在贪大求全的现象。个别参赛团队求多、求全,想在一节课中解决所有问题,导致在设计和教学过程中过度使用PPT。如某校使用了74张PPT,学生只好跟着PPT被动地学习。
二、改进网络团队教研竞赛的建议
网络团队教研竞赛是在网络教研的基础上应运而生的。网络教研和网络教研团队竞赛因其先进的理念和显著的价值,对于教师的专业成长发挥着巨大的促进作用。然而无论网络教研还是网络团队教研竞赛,都属于新生事物,难免会出现这样或那样的不足和问题。作为竞赛的评委,笔者对网络团队教研竞赛提出以下改进建议,期望这一竞赛能够健康发展,更好地服务于广大教师的专业成长。
1.明晰内涵和功能。
由于一线教师对这类竞赛知晓甚少,所以要使这项竞赛得到更大的发展,取得更大的实效,就必须帮助广大教师明晰网络教研和网络团队教研竞赛的内涵和功能,让更多的教师通过学习和介绍认识到网络团队教研竞赛的目的和价值,知晓网络团队教研竞赛的要求和流程,掌握竞赛的要点和技巧。吸引更多的教师投身网络团队教研竞赛,使更多的教师从竞赛中获益。
2.处理好各种关系。
要处理好常规教研和网络教研、网络团队教研竞赛之间的关系。尽管网络教研和网络团队教研竞赛有常规教研难以比拟的优越性,但我们要清醒地认识到,各种教研形式都有各自的优势与不足,不可走极端,用网络教研和网络团队教研竞赛来替代常规教研。如何在中小学常规教研活动中推广、推进网络团队教研竞赛,使其向纵深发展是一个值得探讨的问题。笔者建议在现有基础上探索创建教学反思与网络研讨相结合的新型教研形式,寻找提升教师在网络环境下合作开展教学工作的更有效的途径,促进大众教研与精英教研并行发展,实现教师生命质量的新飞跃,使网络团队教研竞赛具有指导性和辐射性,并成为中小学教研活动的亮点。
3.促进自组织形成。
网络团队教研竞赛是一个新概念、新话题、新形式,更应该解放思想、突破常规,进行一些新尝试。目前的网络团队教研竞赛都要求按区县和学校组队参赛,这是常规教研活动的一种延伸,仍属于一种他组织。作为网络教研的延伸和典型代表,网络团队教研竞赛应该促使教研团队从他组织向自组织的转变,鼓励更多的教师跨区县、跨学校,甚至跨学科自由组成团队参赛,让更多的教师感悟网络环境下同侪互助、自我完善的教师专业发展方式,养成网络环境下自我研修的习惯。
4.增进成果的共享。
网络团队教研竞赛可以帮助教师更新教育资源观念,提升资源感悟能力,还可以发挥网络积淀教育资源的优势,帮助教师构建基于网络头脑风暴的动态优化的教学资源新体系。鉴于目前参赛团队仍然不多,因此笔者建议要在更大的范围内扩大网络团队教研竞赛的影响,让更多的教师通过网络平台共享网络团队教研竞赛的成果,达到发挥网络主体大众化积聚教育智慧的优势,提升教师从事教学设计的能力和可视化表达的能力,提升课堂教学水平的目的。
5.加强教师的专业培训。
网络团队教研竞赛还暴露出一些青年教师专业能力欠缺的问题,他们对新课程理论的认识依然不到位,教学设计能力较弱,在教学过程中运用信息技术与课程整合的方法设计与实施步骤上显得不够。因此,当务之急是加强对广大教师的网络教研专业培训,继续强化新课程相关理论的培训。另一方面加强网络团队教研竞赛相关的业务培训,如正确解读“整合点”,要使教师认识到“整合点”绝不是语言间或教学板块间的整合,而是信息技术与本学科教学的整合;“整合点”考查的是团队在网络环境下有机使用信息技术的能力。强调使用信息技术的必要性和可行性,在今后的竞赛评比中加大“整合点”的分值。
6.建立可持续发展的机制。
要使网络团队教研竞赛更具生命力,发挥更大的作用,必须有相应的机制做保障。建议进一步加强网络团队教研竞赛的机制建设,完善组织和流程管理,建立健全科学合理的评价体系,以保证网络教研和网络团队教研竞赛的可持续发展。此外,在一些细节上要更加人性化,多为教师参与网络教研和网络团队教研竞赛提供便利条件。如为了确保学校能派出优秀教师组队,为了确保参赛教师有足够的时间准备,网络团队教研竞赛可以安排在第一学期举行,以回避第二学期面临的中考和高考。
【参考文献】
[1]金陵.侃侃网络教研团队竞赛之目的[J].中国信息技术教育,2012(3).
[2]肖年志.网络教研团队竞赛真正比的是什么——第六届NOC活动网络教研团队决赛感想[J].中国信息技术教育,2009(1).
[3]王殿强,张法林.搭建网络教研平台,促进教师专业成长[J].中国教育信息化,2009(6).
改进的LVQ神经网络 篇5
一、LVQ网络及其模式识别
LVQ(Learning Vector Quantization),即学习矢量量化,是在有教师状态下对竞争层训练的一种学习方法。
(一)LVQ网络基本结构及基本原理
一个LVQ网络由三层神经元组成,即输入层、隐含层和输出层。该网络在输入层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出神经与隐含神经元的不同组相联接,如图1所示。
LVQ算法是根据输入向量和权值向量的最小欧氏距离选取获胜神经元,并且采用胜者为王的竞争机制,令获胜的神经元的输出为1,其他神经元的输出为0。并且,其学习速率随迭代次数的增加而减少。这个过程实质上就是权值不断逼近输入的过程(李琳和张永祥,2006)。由于这种算法把权值向量和输入向量之间的欧氏距离最小作为判断竞争获胜的条件,所以整个算法过程中不需要对权值向量和出向量进行归一化处理。
(二)基于LVQ网络的模式识别
将LVQ网络应用于模式识别中,首先通过训练样本建立模型,然后用检验样本对模型的预测能力进行检验。
与其他的模式识别或影射方式相比较,采用此网络的优点在于网络结构简单。它只需要通过内部单元的相互作用,就可以完成十分复杂的分类处理,也很容易将设计域中各种繁杂分散的设计条件收敛到结论上来。在这个过程中,设计人员不需要构造复杂的,甚至是难以构造的非线性处理函数。而且,它能表现出更强的容错性,不容易导致系统的崩溃(董长虹,2007)。因而,LVQ网络具有很好的模式分类识别特性。
二、样本选择与指标选取
样本选择与指标选取如下:
(一)样本选择
关于“财务困境”的界定,在我国目前主要的做法是:将ST公司作为面临财务困境的公司,因为它具有客观、高度可度量性和可操作性强等优点(宋新平和张玉才,2007),而将非ST公司作为没有面临财务困境的公司(杨淑娥和黄礼,2005)。因此,本文也采纳这种界定,将ST公司看作面临财务困境的公司,将非ST公司看作为财务健康的公司。
面临财务困境的公司的选取标准是:(1)只发行A股股票的上市公司;(2)其股票于2004年1月1日前已在上海证券交易所上市交易的公司;(3)于2007年因财务状况被列为特别处理(ST)的上市公司;满足条件的上市公司有30间。财务健康的上市公司的选取标准是:(1)只发行A股股票的上市公司的上市公司;(2)其股票于2004年1月1日前已在上海证券交易所上市交易的公司;(3)截至2007年12月31日从未因为财务状况而被列为特别处理(ST)的上市公司;从满足条件的上市公司中选取35间。
由基于LVQ网络的模式识别过程,需要将所选择的样本分为训练样本和检验样本两类,每类样本分别由代表面临财务困境的上市公司和代表财务健康的上市公司组成。在本研究中,训练样本是由25间面临财务困境的公司和25间财务健康的公司组成,训练样本则由其余的15间公司所组成。
(二)指标选取
Altman(1986)选取营运资本/总资产、留存盈余/总资产、息税前利润/总资产、股权的市场价值/债务账面价值、销售收入/资产总额5个财务指标来预测财务困境。Altman、Haldeman和Narayanan(1977)在原来的基础上加入公司规模与盈余稳定性两个变量。Ohlson(1980)实证研究也表明公司规模、资本结构、资金报酬率、变现能力具有显著的预测能力。Altman(2000)在实证研究的基础上提出要对删去带来行业影响因素的销售收入/总资产以进行跨行业的财务困境预测。Andrews(2004)的研究结果表明经营现金流含有增量的信息,能够更好地财务困境做出预测。Chen和Marshall(2006)根据中国市场研究了财务比率指标在预测公司困境风险方面的有效性,结果表明息税前利润与总资产比率、每股盈余、资产负债率、账面市值比表现出较好的解释能力。
因此,根据我国上市公司年报披露制度,上市公司公布其当年年报截止日期为下一年的4月30日,上市公司(t-1)年的年报和它在t年是否会因财务状况异常而被特别处理这两件事几乎是同时发生的,所以这里选择(t-2)年的财务指标进行判别。基于国内相关研究成果(Chen和Marshall,2006),选取息税前利润与总资产比率、每股盈余、资产负债率、净资产收益率和经营活动现金流量净额与流动负债之比作为财务困境预测的指标。
所有选入样本的公司财务信息均来自锐思金融数据库。
三、模型建立、预测结果及检验
本文将用来衡量财务状况的建模变量作为神经网络的输入向量,将代表分类结果的量作为神经网络的输出向量,用训练样本来训练这个网络,使训练样本中的面临财务困境的公司和财务健康公司的输入向量相对应,从而区分和识别两类不同公司财务状况特征。
(一)模型建立
为了建立基于LVQ网络的财务困境预测模型,本文需要确定输入层、隐含层与输出层的神经元数目。由于本研究的财务指标只有5个,所以网络输入具有5个元素的输入向量,即该网络的输入神经元的个数为5。输出一个具有2个元素的输出向量,即输出神经元的个数为2。此外还需要确定网络的竞争层神经元的数目,而且该数目的多少会导致学习效率的低下和影响误差。为此,参考确定网络的竞争层神经元的数目时的公式(董长虹,2007),该网络最佳的竞争层神经元数目的范围在5至14之间。然后,就该范围内的竞争层神经元数目创建对应的LVQ网络,并利用训练样本对网络进行训练。运用MALTAB7.0,对于输入向量所属的类别,将ST公司用1表示,正常公司用2来表示。利用函数ind2vec将类别向量转换为网络可用的目标向量。对网络进行仿真,检验网络是否对训练数据中的输入向量进行正确的分类。运算结果表明,竞争层神经元数目为7的网络特征识别准确率达到92%,如图2所示。该LVQ网络的网络结构如图3所示。
(二)预测结果
在确定LVQ网络模型之后,接下来对网络进行交叉检验,即利用网络对训练样本以为的数据进行分类。首先,利用Sim函数对LVQ网络进行模拟。然后,利用vec2ind函数将模拟的结果输出。将输出结果与检验样本相对比,对于由15间公司所组成的检验样本,发现被网络错误识别的公司有2间,LVQ网络的预测精度达到86.67%。
由以上分析,可以得出以下结论:
第一,从基于LVQ网络的财务困境预测模型对训练样本和检验检验样本的识别准确率来说,基于LVQ网络的财务困境预测模型能够有效地预测企业是否面临财务困境。
第二,在整个LVQ网络设计过程中不需要构造复杂的,甚至是难以构造的非线性处理函数;而且LVQ网络不需要对输入向量进行归一化和正交化。因而,基于LVQ网络所建立的模型,能够大大减少模型使用者的工作量。
改进的LVQ神经网络 篇6
关键词:传感器阵列,主成分分析,学习矢量量化,混合神经网络,电子鼻
长期以来食物品质评价主要通过专家感官评测和化学评测两种方法。感官评测的主观性强, 存在较大个体差异, 标准不统一, 重复性差, 并且人的感官对食品气味具有适应性, 容易出现疲劳影响评价结果;化学评测方法, 如气相色谱质谱分析仪 (GC-MS) 、试纸法等, 测量过程中需要制备和处理样品, 对检测人员的专业水准有较高的要求, 而且化学检测方法又有检测周期较长、仪器成本高等局限性, 因此难以推广[1,2]。电子鼻系统的出现从根本上克服了以上缺点, 与传统的气体成分分析方法相比, 它具有体积小、功耗低、可靠性高、价格低廉、可以实现在线测量、可以实现便携式设计等优点, 已被广泛应用于环境监控、化学工业控制、医疗卫生、食品质量检测等领域[3,4,5]。
采用分立式传感器阵列, 研制了电子鼻系统。实验中, 通过对5种不同种类的食用酱进行气体成分检测, 获得“气体指纹信息”, 建立“气味指纹数据库”, 在此基础上对未知酱品进行检测, 实现了对不同种类食用酱的准确区分。
1 硬件设计
电子鼻系统在硬件设计方案上由采样系统和控制系统两部分组成, 如图1所示。采样系统包括传感器阵列、传感器阵列驱动电路以及气体采集装置。传感器阵列置于气体采集装置内部, 可对被测敏感气体进行探测。传感器阵列驱动电路通过电缆与传感器阵列相连, 向传感器阵列提供驱动电流, 并使它们工作在预置状态。气体采集装置用来为气体检测提供一个稳定的实验环境。环境条件的改变可以通过电源控制模块对气体采集装置的控制得以实现。
控制系统由传感器阵列信号调理电路、模数转换模块ADC以及中央处理器组成。传感器阵列信号调理电路根据各气体传感器的气敏特性存在差异性, 设计出针对不同参数特性量级的信号调理电路。模数转换器ADC将传感器阵列信号调理电路输出的模拟量转换为中央处理器所需的数字量。同时, 为了对数据进行快速处理, 控制系统采用32位微处理器STM32F103ZE作为核心控制器, 可以对各信号调理电路通道进行切换和模数转换器ADC的控制。测试过程中, 控制系统通过RS232通信方式将数据实时上传至上位机进行数据整理, 并通过主成分分析PCA和学习矢量量化LVQ混合神经网络模式识别算法对数据进行分析, 最终将气体检测结果呈现出来。
1.1 传感器阵列
传感器阵列作为获取样品特征信息的源头, 是硬件系统的核心部分。根据食物品质评价的需求, 选用了6种性能优良的费加罗金属氧化物半导体传感器TGS2610、TGS2600、TGS2620、TGS2602、TGS2201和TGS2611构成传感器阵列, 性能指标如表1所示。
1.2 气体采集装置
传感器阵列及传感器驱动电路均置于5 L的玻璃气室中, 如图2所示。由于被测气体与传感器接触后, 其表面电导率会发生变化, 通过信号调理电路将半导体传感器输出信号调整在0~5 V之间, 经过处理的信号通过采集系统传输给中央处理器[6]。
由于半导体传感器的性能受其工作环境温度的影响, 实验中, 采用温度传感器监测环境温度, 利用水浴加热的方式保证测试环境温度恒定, 减小温度因素对传感器特性的影响, 同时促进样品气体的充分挥发。
1.3 传感器阵列调理电路
由于各气体传感器的气敏特性 (内阻) 存在差异性, 传感器阵列信号调理电路针对不同量级 (1 kΩ、15 kΩ、27 kΩ) 的传感器内阻, 设计出相应的配套驱动电路, 并且可以根据实际情况由微处理器对各通路进行切换, 如图3所示。
为了减少交叉电源波动对传感器的影响, 在传感器供电方面采用驱动电压和偏置电压分离设计。H5V为传感器驱动电压, M5V为传感器信号调理电路偏置电压。S1_r1、S1_r2、S1_r3为量程切换控制端, INA_CH0为传感器共同输出端[7,8]。
1.4 数据采集系统
数据采集系统将传感器阵列信号调理电路输出的数据滤除干扰及整理后, 通过模数转换器ADC将模拟信号转换为中央处理器所需的数字信号, 最后通过通信端口将采集到的数据上传至上位机。以意法半导体公司的32位微处理器STM32F103ZE为核心, 实现对电子鼻各个外设的控制和数据采集。同时, 以Analog Device公司的24位Σ-Δ型模数转换器AD7794作为电子鼻信号采集单元, 利用微控制器集成的USART通信端口, 以RS232通信方式将数据上传至上位机[9], 电子鼻数据采集系统原理如图4所示。
2 系统软件设计
上位机软件从控制系统获取传感器阵列的响应数据, 并对其进行整理, 通过混合PCA和LVQ模式识别算法对数据进行分析。
首先, 利用主成分分析方法PCA对从6个半导体气体传感器获取的数据进行分析, 通过式 (1) 对数据进行标准化, 然后通过式 (2) 进行线性变换得到一个新变量组, 从而找出数据中最“主要”的元素和结构, 去除数据中的噪音和冗余, 将原有的复杂数据矩阵降维, 揭示隐藏在复杂数据背后的简单逻辑关系。
其中, x为气体数据样品矩阵, mean (x) 为对气体数据样品矩阵x进行均值化处理, std (x) 为数据样品矩阵x的方差。
其中, princomp (z) 为样品PCA分析函数。
利用PCA分析方法降维后得到的主成分函数CO-EFF绘制坐标系得到二维PCA散点图形使降维后的数据可视化, 然后通过LVQ神经网络, 对PCA分析所得到的新变量组进行模式识别, 最终将检测结果呈现出来, 具体实现过程如下:
(1) 通过对标准样本进行检测, 6个传感器每次产生一组 (6个) 电阻值, 每组样品采集100组数据, 得到100×6的数据矩阵, 作为样本的原始数据, 将多个样本的原始数据汇集形成样本数据库。对未知样品进行检测时, 将数据库中的样本数据与未知样本的数据融合, 进行PCA分析, 最终得到PCA的成分图谱。PCA分析方法流程图如图5所示。
(2) 对PCA分析所得到的新变量组进行LVQ所需要训练参数的设定。输入层根据训练样本为6个传感器的电子数据, 从而确定输入层节点数为6个。输出层为所识别的类别数, 根据对5种酱品的品质进行鉴别, 固确定输出层个数为5个, 隐含层通过实验确定为12, 学习速率和初始权值向量选取系统默认值。
(3) 最后软件系统通过PCA和LVQ混合神经网络模式识别算法所得到气味的“指纹信息”与数据库中的特征数据进行比对, 最终将气体检测结果呈现出来。
3 实验结果及分析
实验中, 利用自主研制的电子鼻系统对5种不同的食用酱进行检测, 并对未知酱品进行识别。5种酱品分别为大酱、豆瓣酱、多味辣酱、黄干酱和沙茶酱。所有酱品在相同的条件下进行实验处理。实验中每种样品取5 g放入蒸发皿中, 放入气室内。当样品在气室中静置5 min后采集传感器数据。采集样品数据前获取100组电阻值作为R0样本, 采集样品后600个点作为Rx, 分别绘制电子鼻系统对6种样品的标准化响应曲线, 如图6所示。
通过电子鼻系统对6种样品的标准化响应曲线对比, 发现各曲线相似度极高, 很难发现不同酱品标准化响应曲线的差别。因此, 需要借助PCA方法做进一步处理, 绘制的PCA分析图谱如图7所示。
通过以上PCA分析图谱可以准确判断未知酱品为长春大酱, 但黄干酱与多味辣酱的图谱位置很接近, 如果对黄干酱或豆瓣酱进行品质鉴别, 得到的图谱可能会互相干扰, 影响对分析结果的判断。同时利用半导体传感器阵列对5种酱品的灵敏度响应信息对LVQ神经网络进行训练。电子鼻系统对5种酱品响应电阻的LVQ神经网络训练结果如图8所示。
由图8可知, 电子鼻对5种样品的混淆度为0, 可以准确地对5种酱品进行检测评价。
基于PCA和LVQ混合神经网络算法的电子鼻系统硬件方面由采样系统和控制系统组成, 在软件方面根据主成分分析 (PCA) 和学习矢量量化 (LVQ) 混合神经网络模式识别算法, 研制出能够对五种不同种类的食用酱进行准确评价的电子鼻系统。系统依据气体传感器在气体特性上存在差异, 对其信号调整电路进行了优化, 并建立了气味的“指纹信息”数据库, 最终将气体检测结果呈现出来。
参考文献
[1]张青春, 叶小婷.基于电子鼻技术的混合气体检测方法研究[J].电子技术应用, 2011, 37 (12) :80-82.
[2]石志标, 黄胜全, 范雪冰, 李扬.基于生物嗅觉的电子鼻研究[J].中国机械工程, 2007, 18 (23) :2810-2813.
[3]MAHMOUDI E.Electronic nose technology and its applications[J].Sensors&Transducers, 2009, 107 (8) :17-25.
[4]YU H, WANG J, YAO C, et al.Quality grade identication of green tea using E-nose by CA and ANN[J].LWTFood Science and Technology, 2008 (41) :1268-1273.
[5]ZHANG S, XIE C, BAI Z, et al.Spoiling and formaldehyde-containing detections in octopus with an E-nose[J].Food Chemistry, 2009 (113) :1346-1350.
[6]袁桂玲, 袁军强.基于ICA算法的智能电子鼻在混合气体特征提取中的应用[J].计算机测量与控制, 2011, 19 (4) :984-986.
[7]CARMEL L, LEVY S, LANCET D, et al.A feature extraction method for chemical sensors in electronic noses[J].Sensors and Actuators B, 2003 (93) :67-76.
[8]栾淑禾, 闰卫平, 全宝富, 陈丽华.用于电子鼻研究的多传感器实时动态测试系统设计[J].测控技术, 2005, 24 (2) :1-4.
改进的LVQ神经网络 篇7
一、LVQ神经网络原理
早在1990年, 著名的神经网络专家Kohonen就提出了学习向量量化 (Learning Vector Quantization, LVQ) 算法。LVQ神经网络是用于模式分类是一种神经网络模型, 允许对输入分到哪一类进行指定。LVQ算法对应的网络结构如下: (1) 包含n个输入神经元, 输入向量为X= (x1, x2, …, xn) , 即样本是n维的, X所对应的类别为T; (2) 每个输出神经元j都对应一个权向量, Wj= (w1, w2, …, wn) , 记所有输出神经元构成的集合为Ω; (3) Cj为输出神经元j所代表的类别, 不同的输出神经元可以代表同一个类别。
下面介绍LVQ算法: (1) 初始化权向量Wj, 坌j∈Ω, 设初始学习率为α (0) ; (2) 从训练集中选取一输入向量X, 找出与X具有最小欧氏距离的Wk;其中; (3) 按下列公式调整神经元k的权值, 如果T=Ck, 即分类正确, 则Wk (t+1) =Wk (t) +α (t) (X-Wk (t) ) , 如果T≠Ck, 即分类不正确, 则Wk (t+1) =Wk (t) -α (t) (X-Wk (t) ) ; (4) 选择下一个输入向量, 返回第二步, 直到样本集中所有的向量都提供一遍为止; (5) 判断停机条件是否满足。若满足, 停机;若否, 转第二步。
二、遗传算法优化的LVQ神经网络
LVQ神经网络具有很好的分类识别特性, 能对任意输入向量进行分类, 无论它们是否可分, 但LVQ神经网络有两个不足: (1) 存在“死神经元”, 即未被充分利用的神经元; (2) 算法天然对初始权值敏感, 即如果初值的选择偏差太大就会影响聚类的结果, 从而影响诊断结果。为了克服LVQ算法对初始权值的敏感性, 本文采用遗传算法对LVQ的初始权值进行优化, 形成基于遗传算法的LVQ神经网络。遗传算法是模拟生物进化过程中自然选择和遗传变异的一种随机优化算法, 它只是要求被优化的函数是可计算的, 不要求目标函数具有连续性和可微性, 搜索能力不依赖于特定的求解模型, 具有很强的全局搜索能力。目前遗传算法已被广泛应用于各个领域, 如自适应控制、优化组合、机器学习等。遗传的操作步骤为: (1) 种群初始化。由于染色体代表的是LVQ网络的权值, 故染色体采用实数编码, 假设训练样本输入向量的维数为n, 则选择n个0-1的随机数作为初始网络权值, 并组成染色体, 染色体的长度为m×n, m为输出神经元的个数, 重复上述过程, 得到S个染色体。 (2) 计算每一条染色体的适应度。在本算法中, 记适应度最小的染色体为Wmin, Wmin为一个好的初始权值。因为LVQ算法是有导师的学习, 所以, 本文将适应度函数定义为:。其中, r为输出层节点数, q为样本个数。 (3) 交叉操作。将染色体群体中的个体随机两两配对, 采用双点交叉算子进行交叉操作, 产生新一代群体。 (4) 变异操作。变异操作是遗传算法种群多样化的保证。在该算法中, 由于染色体对应于LVQ神经网络的权值, 因此采用位置变异算子, 以较小的变异率对新一代种群进行变异操作。基于遗传算法和LVQ神经网络的故障检测算法如下: (1) 产生初始种群, 并指定最大运行代数。 (2) 建立网络, 并用种群中的个体对网络的权值进行初始化。 (3) 用训练集对网络进行训练并仿真。 (4) 计算当前群体的适应度值。 (5) 染色体进行选择、交叉和变异。 (6) 选择最优的染色体, 得到网络权值。 (7) 用测试集, 测试遗传算法优化的LVQ神经网络的性能。
三、实验与讨论
本实验分别用LVQ神经网络和遗传算法优化的LVQ神经网络对相同的训练集进行学习训练, 再用测试集分别测试学习好的网络的性能。训练集是通过安装在箱体8个敏感点的压电加速度传感器拾取各测试点的振动信号, 经数据采集系统和数据处理系统处理后的12组数据, 测试集为3组数据。齿轮的三种故障模式为:无故障1;齿根裂纹2;断齿3。实验过程中, 两个网络都是三层网络结构, 隐层都含有5个神经元。基于遗传算法的LVQ神经网络利用遗传算法优化了输入层到隐层的权值。
结果表明, 遗传算法优化LVQ网络比LVQ网络有更高的诊断精度。
四、结论
改进的LVQ神经网络 篇8
关键词:LVQ神经网络,BP神经网络,风电机组,齿轮箱,故障诊断
0 引言
风力发电技术是目前国际上可再生能源领域发展最快的技术手段之一, 齿轮箱是风力发电机组故障率最高的部件, 风电机组齿轮箱安装空间狭小, 而且又位于高空塔顶作业, 一旦发生故障, 维修非常困难。人工神经网络的快速发展为解决非线性复杂系统的故障诊断问题提供了一种新的解决途径。在众多的人工神经网络类型中, 反向传播 (Back Propagation, BP) 神经网络是应用最为广泛的一类网络。但是, 标准BP网络的收敛速度较慢, 而且可能陷入局部极小值[1~4]。学习向量量化法 ( Learning Vector Quantization, LVQ) 神经网络是在监督状态下对竞争层进行训练的一种学习算法。竞争层自动学习并对输入向量进行分类, 这种分类的结果仅仅依赖于输入向量之间的距离。如果两个输入向量特别相近, 竞争层就把它们分在同一类, 从而能较好地克服标准BP网络训练时间长及计算复杂度高等缺点[5]。目前专门研究风电机组齿轮箱故障诊断的文献尚且不多, 因此, 文中尝试将LVQ神经网络应用于风电机组齿轮箱的故障诊断中, 基于Matlab 2007 平台, 编程建立了LVQ网络诊断模型, 并和BP网络诊断模型的结果进行对比。仿真结果表明, 基于LVQ神经网络的风电机组齿轮箱故障诊断的准确率高, 验证了该方法的有效性。
1 LVQ神经网络的结构与算法
LVQ神经网络是一种结合监督学习与非监督学习的混合网络结构, 它由三部分组成:输入层、竞争层 (隐含层) 和输出层。竞争层根据输入向量的距离学习来对输入向量分类, 输出层将竞争层传递来的分类信息转换成所定义的类别, 每个输出层处理单元表示一个分类[6]。
基本的LVQ网络算法如下:
初始化输入层的第j个神经元与竞争层的第i个神经元之间的权值wij及学习效率 η (η > 0) ;
将输入向量X = (X1, X2, ..., XR) T送入到输入层, 并按照式 (1) 计算竞争层神经元与输入向量之间的距离di;
选择与输入向量距离最小的竞争层神经元。如果di最小, 则令与之连接的输出层神经元的类标签为Ci;
设输入向量对应的类标签为Cx, 如果Ci=Cx, 则按照式 (2) 调整权值, 否则按照式 (3) 进行权值更新。
2 基于LVQ网络的风电机组齿轮箱故障诊断实例
2.1 风电机组齿轮箱故障特征信息提取
文中利用振动传感器测得某风电场风电机组齿轮箱在正常工作、齿面磨损故障和齿轮断齿故障三种状态下的振动数据, 每种状态下均取15 个不同转速, 共45 组振动数据。由于测试过程中存在诸多干扰, 测得的原始数据包含较多噪声。文中利用小波分析方法对原始振动信号进行小波降噪处理, 小波分析进行阈值处理一般有三种方法:默认阈值消噪处理, 给定阈值消噪处理和强制消噪处理[7]。文中采用wthresh函数进行阈值量化处理, 滤除原始信号中的干扰和噪声, 突出了的原始振动信号中的有效信息。为了能够较为全面地反映风电机组齿轮箱的故障特征, 从时域和频域两方面提取齿轮箱的特征参数。因此在时域内选取裕度、峭度、峰值和脉冲四项故障评价指标对振动信号进行特征提取;在频域内选取功率谱熵评价指标对振动信号进行特征提取。为了使网络训练收敛速度更快, 对输入向量进行归一化处理, 经过大量的数据分析归纳, 并参考相关的文献资料[8], 由Matlab 2007 仿真得到标准化 (经过归一化处理) 的用于训练神经网络的特征值。最终得到样本集数目为45 组, 其中42 组用于神经网络的学习训练, 3 组数据用作神经网络的测试样本数据, 部分训练样本数据如表1 所示, 测试样本数据如表2 所示。
2.2 基于LVQ网络的风电机组齿轮箱故障诊断模型的建立
LVQ网络采用有教师的训练学习方式, LVQ网络的训练样本集由输入数据和目标输出组成。在表1 的训练样本集中, 输入向量维数为5, 即输入层神经元为5 个, 由风电机组齿轮箱的5 个故障评价指标组成;目标输出向量对应输出状态, 即正常工作、齿面磨损故障和齿轮断齿故障, 设置三种状态分别对应代码1, 2, 3;LVQ网络的竞争层起到聚类作用, 竞争层的神经元个数是LVQ网络设计的一个关键问题, 一般为输出层神经元数量的整数倍[9~10], 在风电机组齿轮箱的故障诊断中, 分别选取竞争层神经元个数为6, 9, 12, 15, 18 进行了仿真, 各自经过26, 21, 24, 22, 23 次训练, 网络达到稳定, 学习函数为learnlv1, 目标误差设定为0.001, 学习速率设为0.1。为了比较标准的BP神经网络和LVQ网络的诊断性能, 用BP神经网络的方法对风电机组齿轮箱故障进行诊断, BP神经网络的参数设置为:输入神经元数为5, 输出神经元数为3, 用3 位不同的二进制代码表示三种故障类型, (0 0 1) 代表正常工作状态输出, (0 1 0) 代表齿面磨损故障输出, (1 0 0) 代表齿轮断齿故障输出。综合考虑两种网络的性能和速度, LVQ网络竞争层神经元个数最终取为9 个;BP网络隐含层神经元数选择15 个, 隐含层神经元的传递函数采用tansig, 输出层神经元的传递函数采用logsig, 目标误差为0.001, 学习速率设为0.1。
2.3 LVQ网络故障诊断模型的训练
利用表1 中的训练样本数据对LVQ与标准BP网络诊断模型进行训练, LVQ网络训练函数为trainr, 标准BP网络训练函数为traingd。在目标精度设置为0.001、最大训练步数设为20 000、训练样本数目相等的条件下, 仿真得到如下结果:标准BP网络诊断模型需要9 395步才能达到目标精度, 均方误差为0.000 999 983;LVQ网络诊断模型只需要24 步就可以达到目标精度, 均方误差为0, 远远高于目标精度要求。仿真结果表明, 标准BP网络的训练速度不但没有优势, 而且训练过程中发生多次震荡甚至陷入局部最小值而使训练中断, 而LVQ网络则要稳定得多, 网络性能也比标准BP网络更佳。总的来说, 对于训练样本集而言, 只要训练步数设置足够大, LVQ网络诊断模型与标准BP网络诊断模型都能在规定的训练步数范围内完成对训练样本的诊断, 但相比之下, LVQ网络诊断模型的收敛时间明显比标准BP网络诊断模型少, 均方误差也远小于标准BP网络诊断模型。由此可以得出结论, LVQ网络诊断模型对于训练样本诊断的精度更高, 收敛速度更快。
2.4 LVQ网络故障诊断模型的泛化能力测试
LVQ神经网络经过非监督的聚类和有监督的学习之后, 最终形成的分类器网络就可以对测试数据进行分类了。为了测试LVQ网络诊断模型的实际诊断性能, 文中利用表2 中的测试样本数据对所建立的LVQ网络诊断模型进行泛化能力测试, 利用仿真函数sim得到网络的输出。针对LVQ网络诊断模型利用函数ind2vec将类别向量转换成最终的目标向量输出。标准BP网络诊断模型对测试样本的诊断结果如表3 所示。
表3 可以看出, 标准BP网络的分类性能对隐含层神经元的个数要求较高, 隐含层神经元的个数越多分类结果越接近于目标输出, 诊断性能越优。但仿真实验表明, 过多的隐含层神经元的个数势必增加网络的复杂度, 最终导致陷入局部极小值而不能收敛;而对于LVQ网络而言, 只要竞争层神经元数目大于输出层神经元, 就可实现正确分类, 即LVQ网络对竞争层 (隐含层) 神经元的个数设计要求较低。相比之下, LVQ网络的故障隶属度之间的差别比和标准BP网络诊断的结果要明显得多, 故障诊断的结果更加明确。总的来说, LVQ网络和标准BP网络诊断模型都能在规定的精度范围内完成对测试样本的诊断, 诊断正确率为100%。但是, 在LVQ网络和标准BP网络诊断模型的隐含层神经元数目相同情况下, LVQ网络诊断模型的诊断结果更为精确直观, 且LVQ网络的收敛速度要比BP网络快得多, 诊断性能更优;而标准BP网络诊断模型的诊断结果随着隐含层神经元数目的变化, 且误差较大, 诊断性能较差。
3 结语
文中构建了一个LVQ神经网络分类器, 对某风电场风电机组齿轮箱的故障进行诊断, 并与标准BP神经网络的诊断结果进行对比。仿真结果表明:只要训练步数设置足够大, LVQ网络诊断模型与标准BP网络诊断模型都能在规定预设精度范围内完成诊断任务。但相比之下, LVQ网络诊断模型的收敛速度更快、训练准确性和诊断精度更高、诊断性能更优。所以基于LVQ神经网络的风电机组齿轮箱的故障诊断方法是可行的。
参考文献
[1]DING Shuo, CHANG Xiao-heng, WU Qing-hui.Approximation performance of BP neural networks improved by heuristic approach[J].Applied Mechanics and Materials, 2013 (411/414) :1952-1955.
[2]余妹兰, 匡芳君.BP神经网络学习算法的改进及应用[J].沈阳农业大学学报, 2011, 42 (3) :382-384.
[3]丁硕, 常晓恒, 巫庆辉, 等.LM算法改进的BP网络在模式分类中的应用研究[J].电子测试, 2014 (2) :33-35.
[4]DING Shuo, CHANG Xiao-heng, WU Qing-hui.A study on the application of learning vector quantization neural network in pattern classification[J].Applied Mechanics and Materials, 2014 (525) :657-660.
[5]刘军.基于学习矢量神经网络的电力变压器故障诊断[J].自动化与仪器仪表, 2008 (1) :86-88.
[6]刘文轩, 严凤, 田霖, 等.基于LVQ神经网络的配电网故障定位方法[J].电力系统保护与控制, 2012 (5) :90-95.
[7]林渊, 肖峰.小波变换阈值降噪方法及在武器自动机数据处理中的应用[J].电子测量技术, 2009, 32 (1) :128-130.
[8]王斌.面向风电机组齿轮箱的故障诊断系统研究[D].北京:华北电力大学, 2012.
[9]王凯, 任子晖, 谷林柱, 等.LVQ神经网络在煤矿风机故障诊断中的研究[J].煤矿机械, 2011, 32 (11) :256-258.
改进的LVQ神经网络 篇9
关键词:网络技术;防火墙技术;网络安全控制器;改进方案
随着计算机科学与网络技术的迅猛发展,全球范围内计算机的网络安全形势也日趋严峻,针对网络信息安全的各种攻击也不断增多。因此,采取有效的網络安全技术来应对计算机网络安全问题非常必要。网络安全技术是保证数据传输的安全性和有效进行介入控制的一种技术手段。采用的技术主要包括物理安全分析、管理安全分析、系统安全分析以及技术网络结构安全分析等技术。与网络安全联系紧密的防火墙和入侵检测技术在网络安全中应用的非常广泛。防火墙是一个由软件和硬件设备组合而成、在内部网和外部网之间、专用网与公共网之间的界面上构造的保护屏障,是一种保护内网操作环境的特殊网络互联设备。可以用来加强网络之间访问控制,防止外部网络用户以非法手段进入内部网络来访问内部网络资源。它采用的安全策略是对两个或多个网络之间传输的数据包和链接方式进行实施检查,从而决定网络之间的通信是否被允许,并监视网络运行状态。利用防火墙技术,虽能在内外网之间提供安全的网络保护,降低了网络安全风险,是目前保护网络免遭黑客袭击的有效手段,但是,仅仅使用防火墙却不能防止从LAN 内部的攻击,也不能完全防止传送已感染病毒的软件或文件,以及防范数据驱动型的攻击等。因此,要想真正实现网络安全,除了采用多种网络安全措施,加强网络控制器的技术改进也是非常必要的。
1 网络安全控制器的特点
网络安全控制器属于网络安全产品,其特点主要包括:第一,网络安全来源于安全策略与技术的多样化;第二,网络的安全机制与技术也要不断地更新变化;第三,与功能强大的网络安全软件紧密结合,实现软件与硬件相结合,才能真正实现网络安全。
2 网络安全控制器改进的意义
现有的网络安全控制器通过网络存储“中介”,来交换内网与外网的信息,虽然把内网与外网进行物理上的阻断,但内网的敏感信息仍然能够借助“中介”,被外网访问,安全性比较低。而且内网与外网的信息都通过“中介”存储,再进行访问,其效率比较低。由于现有的网络安全控制器存在网络安全功能欠缺,不能同时兼顾安全与网络的连接效率,所以在使用过程中会造成许多安全隐患。而改进后的网络安全控制器则可以实现敏感信息的自动检测的功能。如果检测到内网的敏感信息被外网访问,将自动进行物理隔离,采用自适应网络安全控制器,用户可以在内外网络之间方便地来回切换,尽情享受信息化环境工作的方便快捷。
3 网络安全控制器的改进方案
新型自适应网络安全控制器是在网关的交换控制处理器和接入端口之间设置网络切换器、敏感信息探测器。通常情况下,内网与外网直接连接,一旦敏感信息探测器嗅探到敏感信息,网络切换器自动把内网与外网进行物理隔离,从而实现了内外网的兼顾,既能克服软保护方式的局限性,同时又解决了现有物理隔离出现的通信限制的问题。其中,敏感信息嗅探器的主要作用就是实现包过滤,实际上就是对数据包的源地址、目的地址和端口号、网络协议进行授权,并对敏感信息进行标注,控制网络切换器进行通和断。通过对这些信息的过滤处理,让有许可权的数据包传输通过敏感信息嗅探器,而对那些没有许可权的数据包进行拦截甚至丢弃,一旦探测到敏感信息被外网访问,网络切换器可以自动断开内外网之间的物理联系,可以很好地对整个本地网络进行保护而不对整个网络造成瓶颈。为了实现该功能,敏感信息嗅探器在结构图上设有接入端、接出端口以及交换控制处理器等几个部分。接入和接出端口分别连接外网和主机。而交换控制处理器则用于数据交换并实时侦测外网硬盘或内网硬盘的信号。接入端口通过交换控制处理器与接出端口实现数据交换;接出端口与交换控制处理器之间连接有输入连接线;交换控制处理器与接入端口之间连接有输入连接线一一对应的输出连接线,每个输出连接线上均设有隔离器。在敏感信息嗅探器的交换控制处理器和接入端口之间设置网络切换器,从而实现了内外网的兼顾,既能克服软保护方式的局限性,同时又解决了现有物理隔离出现的通信限制的问题。
总之,网络安全技术的全面发展为网络安全产品的改进和更新提供了事实依据。虽然入侵和攻击方式多种多样,但新型自适应网络安全控制器的使用在一定程度上实现真正意义上的网络安全起到了重要的安全防范作用。
参考文献:
[1]刘远生,辛一.计算机网络安全[M].清华大学出版社,2009年6月.
[2]张蒲生.网络安全应用技术[M].电子工业出版社,2008.
[3]赵安军.网络安全技术与应用[M].人民邮电出版社,2007.