SOM网络模型论文

2024-09-20

SOM网络模型论文(通用8篇)

SOM网络模型论文 篇1

摘要:自组织特征映射 (SOM) 是Kohonen提出的一种人工神经网络模型, 其整个学习过程是在输入样本空间内进行, 并以欧氏距离为度量。本文先介绍了SOM网络模型的来源, 接着对SOM网络的结构与学习过程进行了介绍, 最后给出了一个SOM网络模型在聚类中的程序实例。

关键词:神经网络,SOM网络模型,聚类

0 引言

脑科学的研究表明, 人类大脑皮层中的细胞群存在着广泛地自组织现象。处于不同区域的神经元具有不同的功能, 它们具有不同特征的输入信息模式, 对不同感官输入模式的输入信号具有敏感性, 从而形成大脑中各种不同的感知路径。并且这种神经元所具有的特性不是完全来自生物遗传, 而是很大程度上依赖于后天的学习和训练。而本文所介绍的自组织特征映射网络 (SOM) 就是根据这种理论而提出的。

自组织映射 (Self-Organizing Feature Maps, SOM) 网络也称为Kohonen网络, 该模型是由芬兰的赫尔辛基大学神经网络专家Teuvo Kohonen于1981年提出, 现在已成为应用最为广泛的自组织神经网络方法。Teuvo Kohonen认为处于空间中不同区域的神经元有不同的分工, 当一个神经网络接受外界输入模式时, 将会分为不同的反应区域, 各区域对输入模式具有不同的响应特征。这种网络模拟大脑神经系统自组织特征映射的功能。它是一种竞争型神经网络, 采用无监督学习算法进行网络训练, 此网络广泛地应用于样本聚类、排序和样本检测等方面。

1 自组织特征映射网络 (SOM)

1.1 SOM 网络结构

从网络结构上来说, SOM网络最大的特点是神经元被放置在一维、二维或者更高维的网格节点上。SOM网络的具体模型为:

最普遍的自组织特征映射二维网格模型如图1所示。

SOM网络的一个典型特性就是可以在一维或二维的处理单元阵列上, 形成输入信号的特征拓扑分布, 因此SOM网络具有抽取输入信号模式特征的能力。SOM网络一般只包含有一维阵列和二维阵列, 但也可以推广到多维处理单元阵列中去。下面只讨论应用较多的二维阵列。

输入层是一维的神经元, 具有N个节点, 竞争层的神经元处于二维平面网格节点上, 构成一个二维节点矩阵, 共有M个节点。输入层与竞争层的神经元之间都通过连接权值进行连接, 竞争层临近的节点之间也存在着局部的互联。SOM网络中具有两种类型的权值, 一种是神经元对外部输入的连接权值, 另一种是神经元之间的互连权值, 它的大小控制着神经元之间相互作用的强弱。在SOM网络中, 竞争层又是输出层。SOM网络通过引入网格形成了自组织特征映射的输出空间, 并且在各个神经元之间建立了拓扑连接关系。神经元之间的联系是由它们在网格上的位置所决定的, 这种联系模拟了人脑中的神经元之间的侧抑制功能, 成为网络实现竞争的基础。

1.2 SOM 网络学习过程

SOM网络的主要目的是将任意维数的输入转换为一维或二维的离散映射, 并且以拓扑有序的方式自适应实现这个过程。

生物学基础实验表明, 外界信息对于神经元的刺激并非是单一的, 而是以某一细胞为中心的一个区域;并且刺激强度有强弱之分, 大脑神经的刺激趋势和强度呈墨西哥草帽形状;神经元受刺激的强度以中心最大, 随着区域半径的增大逐渐减弱;远离中心的神经元相反会受到抑制作用。根据这个原理, 当某类模式输入时, 输出层某节点 (神经元) 得到最大刺激而获胜, 获胜者以及其周围节点的权值会向着输入模式向量的方向进行修正。随着输入模式的变化, 相应获胜神经元也发生变化, 网络即通过自组织的方式在大量样本数据的训练下, 使得输出层特征图能够反映出输入样本数据的分布情况。

SOM网络采用的学习算法为无监督聚类法, 它能将任意模式的输入在输出层映射成为一维或二维离散图形, 并保持其拓扑结构不变。学习过程分为三个主要过程, 分别是:

(1) 竞争:对每个输入模式, 网络中的神经元计算它们各自的判别函数的值。这个判别函数对神经元之间的竞争提供基础。具有判别函数最大值的特定神经元成为获胜者。

(2) 合作:获胜神经元决定兴奋神经元的拓扑邻域的空间位置, 从而提供相邻神经元合作的基础。

(3) 权值调整:兴奋神经元通过对它们突触权值的适当调节以增加关于该输入模式的判别函数值, 从而使得该神经元对以后相似的输入有一个增强的响应。

2 应用 SOM 网络进行聚类算法及程序运行结果

SOM网络广泛地应用于样本聚类、排序和样本检测等方面。当训练过程完成之后, 所有的权值都收敛。可以用下面的算法进行聚类。

下面是对SOM网络聚类的程序分别运行的结果, 如图2、图3、图4所示。

3 结束语

本文介绍了SOM网络的起源以及学习过程, 运用算法进行SOM网络进行分类。最后利用一个程序实例运行出了SOM网络的运行过程。利用图形化的方式显示出了利用SOM网络进行分类的具体过程。

参考文献

[1]秦立龙, 余奇, 王振宇.基于泛化理论的集成神经网络优化算法[J].计算机仿真, 2013.1

[2]金以明.基于DEA和SOM的数字图书馆评价研究[J].情报科学, 2011.1

[3]李春华, 李宁, 史陪军.自组织特征映射神经网络原理和应用研究[J].北京师范大学学报 (自然科学版) , 2006.5

网络舆情网民参与意图模型研究 篇2

摘要:在网络舆情网民参与行为收益成本分析基础上,利用社会交换理论,重点探讨网络舆情网民参与意图影响因素,并拟定相关的测度指标和测度方法。期望通过分析模型中关键因素感知利益和感知风险之间的逻辑关系,解释和预测网络舆情网民参与行为,为企业和政府监测网民互联网行为提供帮助。

关键词:网络舆情;网民参与意图;社会交换理论

中图分类号:D9 文献标识码:A doi:10.19311/j.cnki.1672-3198.2016.07.067

1 引言

网络舆情是指网民通过互联网表达与传播以危机事件为中心的多种意见、情绪和态度等的总和。近年来,旅游危机事件、食品安全事件等频发,严重威胁到公众人身财产安全,同时微博、微信等平台上发帖、回帖和转贴等网民参与行为,在缺乏网络道德约束、社会法律规制和网络治理机制的前提下,加推了网络舆情的形成。该网民参与行为直接影响网络舆情的演化方向,若不加以科学的引导与控制,极可能引起不必要的社会风险。因此,有必要对网络舆情网民参与行为影响因素进行研究,通过了解网民为什么要参与危机事件讨论以及网民不参与危机事件讨论原因,提出网络舆情健康发展策略。

本文拟从网络舆情网民参与收益成本角度分析,提出一个适合解释网络舆情网民参与行为的模型。经典技术接受研究(技术接受模型等)已经证实“参与行为”由“参与意图”所直接决定,因此,本文将“参与意图”作为因变量来解释网民参与行为。

2 网络舆情网民参与意图收益成本分析

美国社会学家Homans首次用经济学、社会学和心理学理论从微观角度提出社会交换理论(SET)。该理论认为收益和成本是人类从事一切行为的导向,其中收益并不特指物质财富,也有可能包括精神上的奖励、享受或安慰等心理财富和获得身份、地位与声望等社会财富;成本也不特指物质财富,也可能包括体力上和时间上的消耗、放弃享受、忍受惩罚和精神压力等。我们将人类从事一切行为结果称为效用,则效用等于收益减去成本,若效用为正,则人类继续从事该行为;若效用为负,则人类终止从事该行为。

依据社会交换理论,若将网络舆情网民参与行为看作一次交换行为,则网民是否继续从事交换行为准则就是权衡获得的收益与成本。此处,将网络舆情网民参与获得收益称为感知收益,该因素驱使网络舆情网民参与;将网络舆情网民参与付出成本称为感知风险,该因素驱使网民拒绝参与网络舆情。因此,网络舆情网民参与行为准则可表示为感知收益减去感知风险。当感知收益大于感知风险时,其效用为正,网民倾向于承担风险而选择参与网络舆情,而且当这一过程可以带来持续的正效用时,网民会持续参与网络舆情,否则拒绝参与。因此,本文拟从社会交换理论的感知收益和感知风险角度对网络舆情网民参与意图影响因素进行建模。

3 网络舆情网民参与意图研究模型

网络舆情网民参与意图感知收益大致包括外部激励、享受乐趣和自我提升三个方面,感知风险包括认知成本和执行成本两个方面。其中外部激励是网络舆情网民参与意图的外在动机,而享受乐趣和自我提升则是网络舆情网民参与意图的内在动机,认知成本和执行成本可理解为网络舆情网民参与所耗费的时间、精力等。构建研究模型如图1所示,研究假设涉及感知收益(外部激励、享受乐趣、自我提升)、感知风险(认知成本、执行成本)和参与意图三类变量。

3.1 模型研究假设

外部激励是促使网络舆情网民参与行为的重要因素,其中外部激励包括经济回报、社会规范和声望等不同表现形式。经济回报体现在物质金钱奖励,还有积分、经验等,而本文主要体现虚拟社区积分和经验的返点;社会规范指个人是否采取某行为所感受到的社会压力,规范越大,压力越小,外部激励越大;声望在虚拟社区对某件时间的威望。故提出:外部激励越大,获得的收益越大。据此提出:H1:外部激励对网络舆情网民参与的感知收益具有正向影响。

享受乐趣是指用户能够从其贡献知识的行为中获得满足感,而这种满足感来源其喜欢助人。但在网络舆情网民参与研究中网民通过分享自身对某件危机事件的看法,可使别的网友了解到此事件,从而自己感到愉快和心灵的舒服。故提出:享受乐趣是指网络舆情网民参与过程中,网民通过在虚拟社区中针对某危机事件的转帖、回帖等行为使别的网友参与到此事件的讨论中,自身获得满足感。参与行为越频繁,从中享受的乐趣越多,获得的收益越大。据此我们提出:H2:享受乐趣对网络舆情网民参与的感知收益具有正向影响。

自我提升是指渴望从别的网民出得到认可,以求地位和形象的认可。但在网络舆情网民参与研究中网民通过分享自身对某件危机事件的看法,达到自我营销的目的,从而驱使着网民不断的参与到危机事件讨论中。故提出:自我提升空间越大,获得的收益越大。据此我们提出:H3:自我提升对网络舆情网民参与的感知收益具有正向影响。

认知成本是指个体从事某种行为所耗费的时间、精力、物力以及财力等。但在网络舆情网民参与研究中,网民要花很多时间和精力来了解危机事件,去学习很多东西,甚至动用自己的社会资源来解决问题。这可以看作为一种机会成本,因为如果将这一过程所耗费的时间和精力用于其它活动,也许可以获得更多的回报和收益。故提出:认知成本越大,承担的风险越大。据此我们提出:H4:认知成本对网络舆情网民参与的感知风险具有正向影响。

执行成本是指网络舆情网民参与时,他们需要将自己的观点输入到不同的平台中。而在参与网络舆情的过程中,需要耗费他们大量的时间。特别是输入速度慢的,该过程将是冗繁且费力的,有可能网民就因为输入速度慢或者说要写的事情多,太耗时,而自己又没有时间来完成而放弃参与。故提出:执行成本越大,承担的风险越大。据此我们提出:H5:执行成本对网络舆情网民参与的感知风险具有正向影响。

Davis(1989)认为使用意图是指用户使用新系统的意向强度;据此我们提出:参与意图是指网络舆情网民参与的意向强度。依据社会交换理论,用户在决定是否参与某项行为时,会进行收益成本分析,以权衡该行为的效用。感知收益因素有利于网络舆情网民参与,感知风险因素不利于网络舆情网民参与。据此我们提出:H6:感知收益对网络舆情网民参与意图具有正向影响;H7:感知风险对网络舆情网民参与意图具有负向影响。

3.2 测度指标及方法

基于上述模型和假设,实证研究方案拟采用对网络舆情用户参与行为进行问卷调查的形式获取数据,利用结构方程对模型进行验证。测度问题将拟采用Likert七分量表形式(1表示完全不同意,7表示完全同意),对每一个测度指标进行1至7分的评价,对回收的问卷进行识别,挑选合格的问卷,并进行数据的信度和效度分析。研究指标体系如表1所示。

3.3 模型探讨

所提出的研究模型主要是为了解释网络舆情网民参与行为,通过对感知收益、感知风险与网民参与意图之间的重点分析,理解影响网络舆情网民参与行为的原因。所提出的测度指标是基于网络舆情网民参与收益和成本分析,也继承了已有的研究成果,所得出的模型具备较高的解释能力。

理论模型是以Homans(1958)的SET理论为基础,以感知收益和感知风险作为直接影响因素导致最终的网民参与意图的形成,结合感知收益和感知风险具体的表现指标最终整合成为本文的研究模型。影响网络舆情网民参与行为的影响因素并非仅限于此,例如社会规范、企业或政府反应是否及时以及网民过去的行为习惯等等因素同样影响着网络舆情网民参与行为,这些因素在研究中处于间接地位,都可以归纳为模型中所提出的影响因素。理论模型简单清晰的逻辑结构更能揭示网络舆情网民参与行为过程。网络舆情相关领域广泛,在研究中应该针对不同领域有目的地选择指标体系进行分析,这样才能对网络舆情网民参与行为做出科学的解释和预测。由于网络舆情网民参与收益和成本的重要性,关注收益和成本的影响因素,能够对解释网络舆情网民参与行为给予帮助,在选择检测网民行为时也能给出有利的建议。

4 结束语

SOM网络模型论文 篇3

雷达是战场信息处理系统最基本、最直接、最重要的信息来源之一, 对雷达系统进行数字化和信息化改造, 增加自动目标识别功能, 是现代雷达武器系统的发展方向。识别系统中采用的识别算法是整个系统的核心和中枢环节。因此, 识别算法是否具备原理简单、结构合理、人工调整参数少以及性能稳定等特点, 不仅决定识别系统的综合分类能力, 而且直接影响着系统维护与扩展的难易程度和稳健性[1]。

人工神经网络模拟生物神经系统结构和信息处理机制, 具有自组织、自学习等性能, 允许样本存在缺损和畸变, 具有对不确定性问题的学习与适应能力, 被越来越多地应用与目标识别领域中[2]。自组织特征映射网络[3] (Self-Organizing Feature Map, SOM) 作为一类无监督学习的神经网络模型, 可以对外界未知环境或样本空间进行学习或者模拟, 不需要先验知识, 与BP神经网络[4]等方法相比更适合用于雷达目标识别。

1 SOM 神经网络原理

自组织特 征映射网 络 (Self-Organizing Feature Map, SOM) 也称Kohonen网络 , 它是由荷兰学者Teuvo Kohonen于1981年提出的。 该网络是一个由全连接的神经元阵列组成的无教师、自组织、自学习的网络, 实现从输入空间 (n维) 到输出平面 (二维) 的低维映射, 并且映射具有拓扑特征保持性质, 通过不断地调整网络节点连接权值, 自动地寻找样本数据类型间的内在特征并进行聚类[5]。

1.1 SOM 神经网 络结构

典型的SOM网络结构如图1所示, 由输入层和竞争层组成。第一层为输入层, 输入层神经元个数同输入样本向量维数一致;第二层为竞争层, 竞争层节点呈全连接二维阵列分布, 输入节点和竞争节点之间以可变权值连接。

1.2 SOM 神经网络学习算法

自组织特征映射算法能够自动找出输入数据之间的类似度, 将相似的输入在网络上就近配置, 因此是一种可以构成对输入数据有选择地给予反应的网络。自组织特征映射的学习算法步骤如下[5]:

(1) 网络初始化

用随机数设定输入层和映射层之间的权值的初始值。对m个输入神经元到输出神经元的链接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中, Sj (0) 表示时刻t=0的神经元j的“邻接神经元”的集合, Sj (t) 表示时刻t的神经元j的“邻接神经元”的集合 。区域Sj (t) 随着时间的增长而不断缩小。

(2) 确定输入向量

把输入向量X= (x1, x2, …xm) T输入给输入层。

(3) 寻找获胜神经元

在映射层, 计算各神经元的权值向量和输入向量的欧氏距离。映射层的第j个神经元和输入向量的距离计算公式如下:

(4) 权值的调整

修正输出神经元j*及其“邻接神经元”的权值:

(5) 计算输出ok

式中, f (*) 一般为0-1函数或者其他非线性函数。

(6) 验证结果

如达到要求 (此要求根据具体问题具体确定) 则算法结束;否则返回步骤 (2) , 进行下一轮学习。

2 雷达目标识别实验

2.1 实验场景及数据说明

本实验的场景以及场景的三维回波显示如图2所示。

其中, 图2中主要包含三种特征信息:公路、草地和车辆。两条高速公路穿过一片草地, 在上行高速公路中运行着五辆小轿车和一辆大卡车。本实验的目的是准确识别出各个车辆的位置。

首先, 利用统计的方法, 选取合适的阈值, 去除孤立点和不合理的聚集点, 会得到非常好的结果。但是, 此方法的阈值都是符合具体问题的, 具有穷举性, 不具有通用性。

2.2 评价指 标

针对此问题, 本文定义了三个评价指标, 分别为最小距离和D、信息覆盖率ρ和冗余信息率ζ。

最小距离和:本文第二章中, 用统计的方法选取合适的阈值, 会得到雷达目标点的集合A。本文中集合A会作为标准目标点, 用其它算法得到的雷达目标点集合记为S, 那么S中每个点到A的所有点的最小距离求和, 就是最小距离和D。计算公式如下:

式中, aj1, aj2分别为集合A中第j个点的横纵坐标值;si1, si2分别为集合S中第i个点的横纵坐标值。

信息覆盖率: 集合A和集合S中位置相同的目标点占集合A的比例, 计算公式如下:

冗余信息率: 集合S中除去集合A和集合S中位置相同的目标点, 其余的目标点占集合A的比例, 计算公式如下:

通过评价指标的定义, 我们可以知道, 最小距离和D和冗余信息率ζ越趋近于0越好, 而信息覆盖率ρ越趋近于1越好。

3 实验结果

文献[2]中, 提出竞争层神经元的个数应为聚类类别的1.5~2.5倍, 因此, 本实验选取从5×5到12×12几个类别进行比较分析。进行200次实验, 计算平均值进行统计分析, 得到表1:

从表1中, 我们可以知道, 随着竞争层神经元个数的增加, 最小距离和D越来越小, 最后变为0, 而信息覆盖率ρ由1慢慢变少, 冗余信息率ζ也会也来越少, 直至变为0, 但是运行时间t会变得越来越长。通过比较, 我们发现当竞争层神经元为6×6时, 各个指标最好。于是得到如图3所示的目标点相对位置图。

其中, 图3中三角形是SOM网络得到的目标点位置即S, 实心圆点是统计的方法得到的目标点位置即A。

4 结论

本文针对现有的雷达目标识别问题, 采用了无监督的SOM网络得到了较为理想的结果。但是还是存在一些不足, 如:学习率的选取, 本文只是选取了η=0.9, 不具有普遍性, 下一步的改进方向就可以是把学习率改为学习函数, 这样, 可以根据前一步或者前几步的学习速率, 自动的调整其大小。另外, 还可以把粒子群算法 (PSO) 引入其中, 进行权值训练, 加快运行速度。总之, SOM网络在雷达目标识别中具有其特有的优势。

摘要:针对雷达目标识别的问题, 前人提出了许多方法 , 而本文研究了无监督的SOM网络在雷达目标识别中的应用。本文主要研究的是雷达的三维回波显示数据, 提出了三个检验指标, 分别为最小距离和、信息覆盖率和冗余信息率。通过大量的实验, 结果显示:SOM网络可以很好的进行雷达目标识别。

关键词:SOM,雷达目标识别,聚类

参考文献

[1]郁文贤.智能化识别方法及其在舰船雷达目标识别系统中的应用[D].长沙:国防科技大学, 1992.

[2]Bishop C M.Neural networks for pattern recognition[M].Oxford, England:Oxford University Press, 1996:1-28.

[3]涂晓芝, 颜学峰, 钱锋.基于SOM网络的基因表达数据聚类分析[J].华东理工大学学报:自然科学版, 2006, 32 (8) :992-996.

[4]张静, 宋锐, 郁文贤.雷达目标识别中的BP神经网络算法改进及应用[J].系统工程与电子技术, 2005, 27 (4) :582-585.

SOM网络模型论文 篇4

城市分类不仅便于我们对各个城市的发展进行评估, 并且为我们制定城市的发展决策提供了依据。然而, 如何能够进行科学的城市分类一直备受关注。而基于近些年来人工神经网络的飞速发展, 它帮助我们解决了许多棘手的难题, 其中的自组织特征映射网络 (SOM) 具有强大的聚类功能, 利用它可以帮助我们根据各个城市的特点从而进行科学分类, 为加速我国城市的发展和城镇化建设有着重要的意义。2005年吴聘奇、黄民生利用SOM网络对福建省城市进行了职能分类, 同年, 刘耀彬、宋学锋又基于SOM人工神经网络对长江三角洲地区城市职能分类做了研究。从而可见, 基于人工神经网络的自组织特征映射网络 (SOM) 在城市的分类问题确实可以发挥强大的作用。

评价一个城市的各个行业的发展, 有许多指标。其中行业就业人口是评价一个城市该行业的发展的基础指标。本文对山东地区城市的分类实证分析中, 对各个城市的各行业就业人口数量进行了采集, 其中包括农林牧渔业, 采矿业, 制造业, 电力、煤气及水的生产和供应业, 建筑业, 交通运输、仓储和邮政业, 信息传输、计算机服务和软件业, 批发和零售业, 房地产业, 住宿和餐饮业, 金融业, 租赁和商务服务业, 水利、环境和公共设施管理业, 居民服务和其他服务业, 教育, 科学研究、技术服务和地质勘查业, 卫生、社会保障和社会福利业, 文化、体育和娱乐业, 公共管理和社会组织等19个行业的从业人员数。然后, 通过MATLAB软件进行编程构建, 成功地将山东省的17个城市进行了分类, 从而说明了SOM网络在城市分类方面的确有优于其他传统方法的优点。

二、SOM网络的基本原理

(一) SOM网络简介

自组织特征映射网络也称Kohonen网络, 或者称为Self-Orgnizing Feature Map (SOM) 网络, 它是由芬兰学者Teuvo Kohonen于1981年提出的。该网络是一个由全连接的神经元阵列组成的无教师自组织、自学习网络。Kohonen认为, 处于空间中不同区域的神经元有不同的分工, 当一个神经网络接受外界输入模式时, 将会分成不同的反应区域, 各区域对输入模式具有不同的响应特征。

SOM网络的一个典型特征就是可以在一维或二维的处理单元阵列上, 形成输入信号的特征拓扑分布, 因此SOM网络具有抽取输入信号模式特征的能力。SOM网络一般只包含有一维阵列和二维阵列, 但也可以推广到多维处理单元阵列中去。

(二) SOM网络学习算法

1、初始化。对N个输入神经元到输出神经元的连接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中Sj (0) , 表示时刻t=0的神经元j的“邻接神经元”的集合, Sj (t) 表示时刻t的“邻接神经元”的集合。区域Sj (t) 随着时间的增长而不断缩小。

2、提供新的输入模式X。

3、计算欧式距离dj, 即输入样本与每个输出神经元j之间的距离:并计算出一个具有最小距离的神经元j*, 即确定出某个单元k, 使得对于任意的j, 都由dk=mjin (dj) 。

4、给出一个周围的邻域Sk (t) 。

5、按照下式修正输出神经元j*及其“邻接神经元”的权值:wij (t+1) =wij (t) +η (t) [xi (t) -wij (t) ]。其中, η为一个增益项, 并随时间变化逐渐下降到零, 一般取

6、计算输出其中f (·) 为0-1函数或其他非线性函数。

7、提供新的学习样本来重复上述学习过程。

三、基于SOM网络的城市分类实证分析

城市分类可以便于我们了解各个城市的发展状况, 从而为我们制订城市的发展决策提供依据。现在人工神经网络已经得到了很大的发展, 它为我们研究此类问题提供了一种新的工具和思路。所以基于这个问题, 我们尝试利用SOM网络来进行城市分类。SOM网络是一种具有聚类功能的神经网络, 并且它是无教师训练方式, 我们只需要采集输入样本, 而不必如入目标值就可以得到我们想要的结果, 可见SOM网络使用也十分方便。

(一) 网络样本设计

从山东省统计局网站, 我们得到了山东省17个地级市城市的样本。从中我们看出, 原始指标数据波动较大, 而一般来说, 神经元的输出函数在0-1之间最为灵敏, 为了提高训练的效率, 所以要把数据进行归一化处理。归一化处理方法为:找出每个指标数据中的最大和最小值, 利用 (x-min) / (max-min) 公式把所有数据归一化为0到1之间的数。

(二) 网络设计

本文利用MATLAB R2008进行编程构建。确定网络的输入模式为:

Pk= (P1k, P2k, …pnk) , k=1, 2, …17, n=19

即一共有17组城市样本向量, 每个样本中包括19个元素。

1、首先利用函数newsom创建一个SOM网络。根据实际情况本文创建网络的竞争层分别选用3、4、5、6层的结构。然后经过实验, 分别观察其性能, 从而选取分类效果最好的一组。

2、利用函数train和仿真函数sim对网络进行训练并仿真。仿真的步数大小同样影响网络的聚类性能, 这里我们设置步数为1000。

最后经过分类结果如表1所示。

(三) 实验结果分析

最后经过分析筛选, 发现当这17个城市被划分为6类时和现实情况较为符合。分类情况如表2所示。

第一类:从表中看出, 济南和青岛被归为了一类, 并且在分类数为3、4、5、6时, 济南和青岛都被列为了一类。从表中我们可以看到济南、青岛在各方面都优于其他城市, 尤其是制造业、教育、以及公共管理和社会组织方面。济南是山东省省会, 是全省、文化、经济, 金融, 教育中心, 也是国家批准的沿海开放城市和十五个副省级城市之一。青岛是全国70个大中城市之一, 全国五个计划单列市之一。工业有纺织、机车车辆、机械、化学、石油化工、钢铁、橡胶、家用电器、啤酒、卷烟等。有驰名中外的青岛啤酒、海尔集团、海信集团等大企业集团。并且, 二者都有丰富的教育资源, 全省大多高校均聚集在此。

第二类:淄博、泰安、德州、聊城在发展方面, 各个方面较为均衡, 没有特别显著的特点。四者的制造业、建筑业和教育大约位于全省中间地位。

第三类:枣庄、东营属特殊职能类型城市。两个城市相对其他城市来说, 采矿业较为发达。枣庄境内已探明地下矿藏36种:煤、铁、铜、铝、金、银、锶 (天青石) 、石膏、萤石、水泥原料灰岩等。其中煤、石膏地质储量为15.4亿吨和4.1亿吨。而东营又称“石油之城”, 丰富的石油、天然气资源。但是, 两个城市的制造业相对薄弱, 其他产业大约处于平均水平。

第四类:烟台在此被单独分成了一类, 其具有自身的特色, 并且发展潜力巨大。烟台的制造业和交通运输业位于全省前列。烟台的工业主要以造船、轻纺、机械、建材、电子、冶金、医药等行业为主, 并且还有张裕葡萄酒、三环锁等烟台的传统产品。近年来, 锦纶、白卡纸、电子网目板等技术水平较高的项目相继投产。烟台在地理位置上东连, 西接潍坊, 西南与毗邻, 北濒、, 与对峙, 并与隔海相望, 共同形成拱卫首都的海上门户。所以, 烟台的交通运输业较为发达。另外, 烟台的招远金矿为烟台采矿业也提供了大量了就业机会。

第五类:潍坊、临沂、济宁和菏泽在教育和公共管理和社会组织方面处于全省前列地位, 其他方面稍稍逊色一些。

第六类:威海、日照、莱芜、滨州这四个城市各个方面表现均不太突出, 但是, 这些城市的发展潜力很大。威海、日照属沿海城市, 交通便利, 可以重点发展交通运输业。莱芜、滨州虽地处内陆, 但也可依附内陆的经济中心———济南来发挥特色经济。

四、结论

通过本文的研究, 可以看出利用SOM网络基本可以完成城市的分类研究, 并且可以调整分类类别, 来满足不同的需要。但是, SOM的分类还不够精确, 这主要是采集数据的不完备性。因为信息的不完全, 使SOM的聚类功能并未发挥极致。但是, 利用SOM网络, 操作过程较传统方法方便很多, 只需收集数据, 将其输入网络, 网络就能自行进行学习、训练, 并且是无教师学习方式, 不必输入目标值, 这些优点都是许多其他方法不能比拟的, 相信随着采集数据的完备性和精确性, 这种方法在城市分类方面可以得到广泛的应用和推广。

参考文献

[1]、神经网络理论与MATLAB R2007实现[M].电子工业出版社, 2008.

[2]、吴聘奇, 黄民生.SOM网络在福建省城市职能分类中的应用[J].经济地理, 2005 (1) .

SOM网络模型论文 篇5

随着科学与生产技术的发展,现代设备大多数集机电液于一体,结构越来越复杂,自动化程度越来越高。在工作过程中,故障发生的概率相对提高,出现故障后不仅会造成经济损失,甚至会导致整个设备遭受灾难性的毁坏。柴油机由于其本身的结构异常复杂,加之系统的输入输出不明显,难以用比较完备准确的模型对其机构、功能、以及状态等进行有效的描述,因而给故障诊断带来了很大麻烦。近年来,随着模式识别和神经网络理论的引入,柴油机故障诊断技术有了较快的发展。神经网络技术的出现,为故障诊断问题提供了一种新的解决途径,特别是对于柴油机这类复杂的系统。神经网络的输入输出非线性映射特性、信息的分布存储、并行处理和全局集体应用,特别是其高度的自组织和自学习能力,使其成为故障诊断的一种有效方法和手段。

1 神经网络故障诊断方法

1.1 SOM网络的结构

特征映射(self-organizing feature map,也称kohonen映射)神经网络(简称SOM神经网络),是由Kohonen教授提出的对神经网络的数值模拟方法,这种方法是人工神经网络的重要分支之一。自组织特征映射神经网络(SOM)模拟大脑神经系统的自组织特征映射功能,是一种无监督竟争式学习的前馈网络,在训练中能无监督自组织学习。它通过学习可以提取一组数据中的重要特征或某种内在规律,按离散时间方式进行分类。网络可以把任意高维的输入映射到低维空间,并且使得输入数据内部的某些相似性质表现为几何上邻近的特征映射。这样,就在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。这种分类反映了样本集的本质区别,大大减弱了一致性准则中的人为因素。

SOM网络结构如图1所示,由输入层和竟争层组成。输入层神经儿数为n,竟争层由M=n2个神经元组成的二维平面阵列,输入层与竟争层各神经元之间实现全连接。

1.2SOM神经网络的训练方法

SOM神经网络进行学习时,首先对网络的连接权系数ωij赋于[0,1]区间内的随机值,然后给网络提供输入矢,必存在与输入神经元获得最佳匹配时的最佳匹配单元C,在C的邻域内,各神经元与最佳匹配单元C 的侧向连接为兴奋型,以外各神经元受抑制作用而使输出为0。

具体学习算法如下:

a) 设输入矢量,即故障征兆集合为,相应于第i个神经元的权系数构成的加权矢量,在没有反馈的情况下,神经元的稳态输出值为:

X=[x1,x2,…,xn]T,相应于第i个神经元的权系数构成的加权矢量。

Wi=[wi0,wi1,…,win]T,在没有反馈的情况下,神经元的稳态输出值为:

yi=nj=1wijxj=WiΤX(1)

b) 找到yi取最大值时的神经元i,则其为最佳匹配单元C。

c) 为使网络具有一种聚类功能,定义最佳匹配单元C的一个拓扑邻域Nc,使Nc内的单元输出为1,Nc外的单元输出为0,即:

{yi=1iΝcyi=0iΝc(2)

d) 权值的训练公式为:

{wij(t+1)=wij(t)+α(t)[xi(t)-wij(t)]iΝcwij(t+1)=wij(t)iΝc(3)

式中,0<α(t)<1为一学习因子。权值训练后返回步骤b),直到Ncα(t)满足要求为止。

e) 输入下一个输入矢量,转入式(1)进行下一轮的学习,直到所有的样本都学习完为止。

学习初始阶段,邻域Nc和学习因子α(t)要取大些,然后随时间的推移逐渐减小,当α(t)降到0时学习结束。在训练初期,不需像BP网络先给出期望输出值,为无监督学习。网络通过学习后,输入矢量的所有信息都记忆在各个加权矢量Wi中,即:故障征兆与故障之间的规则就隐含在权系数Wi之中,学习结束后,各个神经元都只对某些输入矢量最敏感。对具有最大输出的神经元标以该故障的记号,不同的敏感神经元称为获胜元,它们分布在不同的位置,在任何情况下这种相对位置是不会发生变化的,所以SOM神经网络的最大特点是保持输入矢量特征的拓

朴结构不变,当输入矢量比较接近时,它们对应的输出神经元在输出层的位置也很接近。

2 应用于柴油机故障诊断的步骤

将SOM网络应用于柴油机故障诊断步骤如下:

a) 选取标准故障样本;

b) 对每一种标准故障样本进行学习,学习结束后,对具有最大输出的神经元标以该故障的记号;

c) 将待检样本输入到SOM神经网络中;

d) 若输出神经元在输出层的位置与某标准故障样本的位置相同,说明待检样本发生了相应的故障;若输出神经元在输出层的位置介于很多标准故障之间,说明这几种标准故障都有可能发生,且各故障的程度由该位置与相应标准故障样本位置的欧氏距离确定。

3 利用SOM神经网络进行柴油机多故障诊断

3.1 柴油机故障诊断故障样本

对于燃油压力波形来说,最大压力(P1),次最大压力(P2),波形幅度(P3),上升沿宽度(P4),波形宽度(P5),最大余波的宽度(P6),波形的面积(P7),起喷压力(P8)等特征最能体现柴油机运行的状况(图2)。

燃油系统常见的故障(表1)有供油量不足,针阀卡死至油孔堵塞,针阀泄漏,出油阀失效等几种故障,文中诊断的故障也是基于这几种故障,主要有100%供油量(正常情况T1),75%供油量(T2),25%供油量(T3),怠速油量(T4),针阀卡死(小油量T5),针阀卡死(标定油量T6),针阀泄漏(T7),出油阀失效(T8)等8种故障。

4 故障诊断的仿真实验5

4.1 利用表1中的样本对SOM网络进行训练,设计该SOM网络的结构如下:

输入层:10个节点(神经元);

输出层:100个=10×10(节点)输入层。

图3为训练后T1,T2,T3,T4,T5,T6,T7,T8共8种标准故障状态对应与输出层获胜神经元的映射位置。SOM网络完成学习训练后,对于每一个输入的故障模式,输出平面中都有一个特定的神经元对其敏感,这种输入-输出的映射关系在输出特征平面中表现得非常清楚。

在SOM训练结束后,对输入样本增加随机数的(随机数范围0~1之间)10%的增量作为干扰来进行故障模式识别。将其输入训练过的SOM网络中,观察输出的敏感神经元,得到输出结果如图4所示。

从输出结果很容易知道,输入样本增加随机数的(随机数范围在0~1之间)10%的增量作为干扰几乎可以忽略不计。

5 结论

利用SOM神经网络把多维输入向量聚类降到二维平面上,通过图形可视化很容易对故障模式进行分类。通过

以神经网络中以SOM 算法为基础的柴油机故障诊断方法,基本能够对各种故障模式进行识别。但同时可以看到SOM网络对于输入特征向量非常接近的类别,该网络不能将其明显区分,这是由该网络算法所确定的。

摘要:利用神经网络的非线性映射及其高度的自组织和自学习能力,将SOM网络应用于柴油机的故障诊断。利用夹持式传感器获得柴油机喷射系统的燃油压力波形,对波形进行时域分析和特征提取。根据所取得故障信息及其对应的故障类型来构造网络结构,用单一故障样本对网络进行训练,根据输出神经元在输出层的位置对故障进行判断。通过仿真实验验证SOM神经网络在柴油机故障诊断的正确性。经实例分析证明,该方法可对故障进行有效诊断。

关键词:柴油机,故障诊断,神经网络

参考文献

[1]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2006.

[2]周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005.

[3]朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006.

[4]闻新,周露,李翔,等.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003.

[5]李玉峰,刘玫.基于动量BP网络的柴油机故障诊断[J].控制工程,2007.

SOM网络模型论文 篇6

1 SOM网络简介

SOM(Self-Organizing Map)是自组织神经网络的意思,由芬兰学者Kohonen在20世纪80年代初期模拟真实存在的生物神经系统,并且结合前人在20 世纪70 年代的工作建立了的,因此也称为Kohonen映射。

Kohonen映射的结构可以认为是由输入层和输出层构成的双层网络,其拓扑结构是网络上的所有神经元接受不同刺激时做出不同的反应,即不同形式的兴奋状态下形成的整体。双层网络之间连接是通过一系列的权值实现的,如果这些权值变得收敛或者相对稳定,输出层的某个神经元上就会接受到来自输入层的信号,这就是SOM网络多维数据聚类的基础。SOM网络的聚类性质是按几何特征进行的,一般以几何中心作为参照,此外SOM具有很强的自组织学习能力。

SOM网络在无监督的学习方式由以下几个机制组成:

1)竞争机制:映射中的神经元计算所有输入的信号(也称为模式),分别得到它们判别函数的值,为神经元之间的竞争提供了基础。网络中输出层的神经元之间互相竞争以求被激活,任一时刻都有且只有一个神经元被激活,这个神经元称之为竞争获胜神经元,竞争过程中选择胜利者的标准是具有判别函数最大值的特定神经元。

2)协作机制:兴奋神经元的拓扑邻域的空间位置是由成为胜利者的神经元所决定的,提供了类似的相邻神经元协作的基础。

3)权值的调节机制:兴奋神经元通过对它们权值的适当调节,以增加其关于该输入模式的判别函数值。所做的调节增强了成为胜利者的神经元对以后相似的输入模式的响应。

2 SOM算法

设δij是输入层各个节点i到输出层的神经元j的连接权向量, λ=(λ1,λ2,…,λn)是一个输入为n维的向量。SOM算法如下:

1)初始化。对输出层的各权向量δij随机赋值,范围在0到1之间,其中δij的值两两不相等。

2)接受输入。从输入集中随机选取一个模式,并对其做归一化处理。

3)计算神经元的激活值。即寻找胜利者的神经元。从初始输入集按一定的方式选取初始网络训练样本集φ,对每一输入向量λ(λ∈φ), 使用欧几里得距离作为不相似性度量, 计算输出层各神经元的激活值。

其中λi(t)是输入向量所在时刻的值。

4)更新权值向量。找到胜利者的神经元之后,用下面的公式更新和调整神经元的权值:

其中η(λ)是学习速率,它虽迭代次数λ的增加而减小的单调不增函数,因此可以保证无监督学习机制的收敛性。 hj,i(λ)(t)是获胜神经元周围的领域函数,采用Gauss邻域函数。

其中rj、ri(λ)分别是输出节点j、i(λ)的位置,σ反映了邻域的范围。hj,i(λ)(λ)是两点间距离的单调递减函数。为了得到最好的结果,η(λ)和hj,i(λ)(λ)在学习过程中都是动态变化的。

5)接受新的输入,重复步骤(2)(3)(4)直到到达预设的循环次数为止,即可完成SOM神经网络的训练。

3 预测工区中剩余油

利用SOM聚类分析的特点,将时移地震数据与一次地震数据分别做一系列的处理,然后比较其中的差异,即可得到工区中剩余油的分布。如图所示,大体可分为以下4个步骤:

1)优选出对含油饱和度敏感的属性

首先对工区中所有井进行勘测获得其基本的储层参数,即原始含油饱和度。经过一段时间的开采,分别在两个不同的时间对所有井进行勘测,第一次获得数据称为一次地震数据,第二次获得的数据称为二次地震数据,也称时移地震数据。然后对一次地震数据做加权平均计算出每个储层井点含油饱和度的原始值,其中不乏一些差异较大的值,根据统计储层参数的分布的真实性去除这些异常值,并把其他的值作为样本。在样本中提取储层的流体属性并进行预处理,优选出对含油饱和度敏感的流体属性。

2)储层参数预测的预处理

为了简化处理工作,对优选出的敏感属性进行降维压缩,以便获取压缩的敏感属性集合。SOM网络的输入节点是压缩后的敏感属性集,输出节点为统计的储层参数。经过网络的训练,得到模式识别的参数,结合降维后的敏感属性压缩集合来预测储层参数的分布情况。

3)工区的预测结果校正

对原始预留的样本和测井数据拟合地理几何信息进行检验,若预测的效果跟实际情况不符合,应重新提取和处理储层流体属性,直至重新预测的结果跟实际情况相差无几。

4)多属性的SOM聚类差异化

获得时移地震数据后,首先提取其中的敏感性流体属性并对它做预处理,分析敏感性流体集合,并对该集合做优化处理。将时移前后的敏感流体属性优化组合相比较,可以得出属性差异集。再将该差异集进行SOM类聚处理可以得出时移后的含油饱和度的变化图,与时移前储层参数分布图相比较,得到剩余油分布的预测图。

参考文献

[1]高兴军,于兴河,李胜利,等.利用神经网络技术预测剩余油分布[J].石油学报,2005(3):60-63.

[2]石小松,程国建.BP神经网络在剩余油分布预测中的应用研究[J].电脑知识与技术,2008(36):2706-2708.

[3]Kai Xie,Zhijun Bai,Wenmao Yu,Fast Seismic Data Compres-sion Based on High-efficiency SPIHT,ELECTRONICS LET-TERS,50(5),pp365-366,2014.

[4]丁露,崔平.SOM聚类算法在文本分类上的应用[J].现代情报,2007(9):162-164.

SOM网络模型论文 篇7

文本聚类是将文本集合划分成若干个簇, 要求每个簇中的文本内容尽可能相似, 而不同簇中的文本内容尽可能不同, 是一种无教师指导的文本分类行为, 因此也称为无监督文本聚类。文本聚类在大规模文档集的组织和浏览、文档集层次归类的自动生成等方面, 都具有重要的应用价值[1]。

人工免疫系统是基于生物免疫系统功能特性的启发而设计的各种工程应用方法的总称。免疫系统是人体的重要防御系统, 其最重要的功能特性就是多样性识别能力、增强学习机制和联想记忆机制。人工免疫网络[2,3,4] (aiNet) 是近几年新兴的一种基于免疫系统中克隆选择、高频变异和免疫网络原理的网络模型, 目的是研究未标示的数据集合的聚类和过滤问题, 具有减少数据冗余、描述数据结构和聚类形状等优点。该算法在数据聚类方面有相当优势, 已经广泛用于数据挖掘、数据聚类、模式识别等众多领域, 但是其最大缺点是对高维数据的聚类能力差, 本文在研究了自适应神经网络[5,6]SOM聚类算法的基础上, 利用其很好的降维特性, 先用自组织神经网络对文本聚类, 然后再用人工免疫网络进行文本聚类, 提出一种基于aiNet 和SOM的两阶段文本聚类方法。

1 人工免疫网络聚类算法原理及描述

De Cstro和Von Zuben教授在免疫网络理论的基础上提出了人工免疫网络算法并用于数据分析。与Jerne和Farmer的网络一样, 该网络模型也忽略B细胞和抗体的区别, aiNet采用抗体 (Ab) 呈现在网络中, 把原始数据作为抗原 (Ag) 。抗原刺激抗体产生的克隆并不消灭抗原, 而是呈现抗原之间的内在特性及结构布局, 并且抗体所受到的刺激仅考虑抗原对它的刺激, 临近抗体对它的抑制则推迟到记忆抗体集产生后, 通过删除抗体集里自识别的抗体来实现。该算法的学习过程如下:

网络输出可以作为记忆细胞矩阵M和细胞间亲和力矩阵S。矩阵M表示抗原群体的网络内映像。矩阵S负责确定哪些细胞互相连接, 描述网络结构。要使网络收敛, 通常有以下几个不同的收敛条件 (即终止条件) :

(1) 在预先定义的步骤数完成后停止循环;

(2) 当网络达到预先定义的细胞数时停止循环;

(3) 评估抗原和M之间的误差;

(4) 如果平均误差在k次连续循环后开始增加, 可以认为网络是收敛的。

2 SOM神经网络聚类算法

2.1 SOM神经网络简介

SOM网络是由芬兰赫尔辛基大学神经网络专家Kohonen教授于1981年提出的竞争式神经网络。SOM网络结构如图1所示, 从图中可以看出, 网络只有输入层和输出层, 且两层之间为完全连接, 输入层模拟感知外界输入信息的视网膜, 输出层模拟做出响应的大脑皮层。输入层各神经元通过权向量将外界信息汇集到输出层的各个神经元。输入层的节点数与样本维数相等。输出层也是竞争层, 输出层内的每个神经元与其邻域连接, 此连接是相互激励的关系, 训练后输出层不同节点代表不同的分类模式。神经元的排列有多种形式, 如一维线阵、二维平面阵和三维栅格阵。在本研究课题中采用的是二维平面阵的SOM。

2.2 SOM神经网络聚类算法

SOM算法的具体过程描述如下:

SOM算法虽然较简单, 它不包含复杂的求导、积分运算, 能很好地处理孤立点问题, 但网络的收敛时间过长。

3 基于aiNet和SOM的文本聚类算法

本文在研究了SOM神经网络能对高维数据做降维映射的优点的基础上, 提出一种融合SOM和aiNet的两阶段文本聚类算法TCBSA, 既利用了SOM神经网络聚类的自组织特性, 同时也克服了aiNet算法文本聚类时的缺点。首先由样本数为n的经预处理后的大型文本向量矩阵作为输入数据, 用SOM网络自组织学习训练, 将高维的文本向量映射到二维平面空间, 由于SOM具有将输入向量进行有序组织的特点, 所以我们可得到m<<n个组织有序的二维平面, 即产生输出节点空间, 然后对这些有序的节点集用aiNet算法聚类, 得到聚类结果。

3.1 SOM算法训练学习初次聚类

将经过预处理后得到的向量模型输入到神经网络中, 算法的执行步骤为:

3.2 aiNet聚类算法进行再次聚类

将SOM聚类的结果作为本阶段的输入向量, 进行第二阶段的聚类, 算法的执行步骤为:

3.3 关键问题及解决方法

在研究过程中, 主要有以下几个关键问题:

(1) 文本特征相似度和亲和力的计算

目前, 常用的文本的特征表示模型主要有布尔模型、概率模型和向量空间模型。向量空间模型[7,8]VSM (Vector Space Model) 是Gerald Salton等人于20世纪60年代末提出的, 利用向量空间模型表示文本能够进行部分匹配, 检索结果按相关性大小排序给出, 更符合用户的需要, 因此向量空间模型是目前比较普遍使用的文本表示和处理模型。

基于向量空间模型, 文档集被看作是由一组正交词条向量所组成的向量空间, 每个文档被表示成在该空间中的一个范化特征向量 (这里假设该空间中所有向量的维数都是相同的) 。本文参考文献[9]中借鉴Timmis的RLAIS网络[10]对阈值的设置, 对文本的相似度和亲和力的计算均采用公式 (1) 。

设文本T= (T1, T2, …, Ti, …, Tn) , T′ = (T′1, T′2 , …, Ti, …, Tn) , 则TT′之间的相似度表示如下:

sim (Τ, Τ) =i=1nΤi×Τii=1nΤi2×i=1nΤi2 (1)

(2) 优胜劣汰机制

在aiNet算法学习过程中, 抗体是通过竞争机制学习的, 对竞争成功的抗体要进行克隆和变异, 对没有发生抗原识别的抗体或者对抗原的识别能力低于一定点时要予以淘汰, 是通过分别设定阈值σd, σs (分别表示自然死亡阈值和抑制阈值) 来控制的。

网络亲和力阈值定义如下:

ΝAΤ=dag¯ (dag¯=2m (m-1) j=1m-1i=j+1mAffij) (2)

为了使σs的取值与网络的发展相适应, 初次取值采用式 (2) 计算。从第二次迭代开始, 则取:

σs=ΝAΤ=r×dab¯ (dab¯=2n (n-1) j=1n-1i=j+1nAffij)

其中n为此代网络中的抗体总数。而r在区间 (0, 1) 中取值, 并且r的取值是没有参考的, 在多次的试验中由用户依据经验来决定, 直到取一合适的值为止, 以后就固定下来。用式 (2) 的方法计算σs, 则σs既不会太小而使优良的抗体被淘汰但也不会过大。

在aiNet中, 未受抗原刺激的抗体会死去, 而在文本聚类过程中或者是查询过程中, 则认为该文本是孤立的, 没有与该抗体文本相关的文档存在或者是没有与该查询相关的文档存在。因此在这里设σd的取值由式 (2) 得, 即:

σd=dag¯ (3)

设当前网络中抗体总数为 n, 抗原总数为 m, 抗体Abi能识别的抗原数为 k, 则该抗体被克隆的数量为:

Νci=km×i=1nk (4)

4 仿真试验及结果分析

在测试阶段, 以人民网中的部分已知类别文档作为文档源进行聚类, 用查全率Re和查准率Pr来评价聚类效果, 其中查全率表征聚类的正确性, 查准率表征聚类的完整性, 其中Fpi是错分到ci类且属于其它类的文档数, Tpi是正确分到中的文档数, Fni是属于ci类而错分到其它类的文档数。在SOM的训练中, 我们所采用的学习率 (t) =1-tR, 其中R是大于最大训练次数的常数;σ (t) =k1×exp (-kt) , k1和k2是参数, t是当前训练次数。SOM输出层为10×10的矩阵。在aiNet训练中, 多次实验后, 参数r取0.6, 学习率α的取值与SOM阶段的学习率取值方法一致, 这样做是为了使人工干预的次数和程度减少, 尽量使算法能够在运行过程中自适应整参数σsσd。相似度的计算均采用公式 (1) ;在aiNet聚类阶段, 对染色体采用实数编码;进行第二阶段聚类时, 对第一阶段的结果作为输入向量时先做一标准化处理, 使输入向量均在 (0, 1) 区间内。本文总共分别做了如下2组对比实验, 下面分别对2组实验做介绍。

4.1 实验1 TCBSA对文本聚类的可行性实验

我们将TCBSA与典型的SOM算法进行对比实验。实验结果如表1所示。

实验数据表明我们提出的两阶段中文文本聚类算法是可行的, 并且TCBSA具有很好的自组织学习能力。

4.2 实验2特征提取得到的特征数目对聚类的影响

在特征提取时, 必须确定应提取的最终特征数目。最终特征目的大小, 会影响聚类结果。为此, 我们进行了试验以确定最终征数目对聚类结果产生什么样的影响。试验结果如表2所示。

初步实验结果表明, 最终特征数目对查全率和查准率是有影响的。当最终特征数目较小时 (小于50) 类有一定的查全率和查准率, 但是查全率和查准率都较低;当最终特征数目从50到 220类的查全率和查准率逐步增长;当最终特征数目增加到260时, 聚类的查全率和查准率在一个小范围内波动, 基本保持不变;当最终特征数目多于350时, 聚类的查全率和查准率而呈现一个下降的趋势。

由此可见, 最终特征数目不能太小, 这样会降低聚类的查全和查准率;也不能太大, 因为过多的特征对并不能显著地改善聚结果, 反而会使聚类结果变得更坏。同时, 最终特征数越多, 计算量越大, 时间复杂度越高。从初步的实验数据可知:最终特征数目, 一般取200—250之间较好。

5 结束语

随着对文本聚类研究的深入, 人们正在努力寻找发现各种文本聚类算法。人工免疫系统的兴起引起了研究人员的广泛关注, 在此基础上发展了很多优秀的聚类方法。本文在人工免疫网络算法和自组织神经网络聚类的研究基础上, 提出一种基于免疫网络和自组织神经网络的文本聚类算法, 并进行了实验验证, 结果表明该算法是可行的, 并具有一定的优越性。

参考文献

[1]Jiawei Han, Micheline Kamber著.数据挖掘概念与技术[M].范明, 孟小峰, 等译.机械工业出版社, 2001.

[2]Leandro N.de Castro, Jon Timmis.An Artificial Immune Network forMutimodal Function Optimization[C]//Proceedings of IEEE Congresson Evolutionary Computation (CEC02) , Hawaii, May 2002:674-699.

[3]de Castro LN, Von Zuben F J.aiNet:An Artificial Immune Network forData Analysis, in Data Mining:A Heuristic Approach, H.Abbass, R.Sarker, and C.Newton, Eds.Sydney, Australia:Idea Droup Publishing, Univ.New South Wales, 2001.

[4]李涛.计算机免疫学[M].电子工业出版社, 2004, 7.

[5]Kohonen T, Kaski S, et al.Self Organization of a Massive DocumentCollection[J].IEEE Transactions On Neural Network, 2000, 11 (3) :574-585.

[6]Kohonen T, Kaski S, et al.Self Organization of a Massive DocumentCollection[J].IEEE Transactions On Neural Network, 2000, 11 (3) :574-585.

[7]姜亚莉, 关泽群.用于Web文档聚类的基于相似度的软聚类算法[J].计算机工程, 2006, 32 (2) :59-61.

[8]Modha D Spangler.Feature weighting in k-means clustering[J].Ma-chine learning, 2003, 52 (3) :217-237.

[9]李春华, 朱燕飞, 毛宗源.一种新型的自适应人工免疫算法[J].计算机工程与应用, 2004, 22 (7) :84-87.

SOM网络模型论文 篇8

矿井提升机是矿井中非常关键和重大的设备。主要用途是提升矿物,在多数矿中,矿井的主产量就是提升设备的提升量。提升设备也是井上、井下升降人员的主要设备,并且在垂直或倾斜的状态下高速运行。矿井提升机虽然本身有一些保护措施,可由于煤矿生产的复杂性、环境的恶劣性,一些保护不能达到预期效果,致使煤矿生产中仍有不少事故发生,轻则影响生产,重则造成国家财产的严重损失,甚至导致人身伤亡。因此关于矿井提升机的故障诊断研究具有重要意义[1]。

故障诊断系统的核心是故障诊断算法的设计。神经网络是一种新的方法体系,它以分布的方式存储信息,利用网络的拓扑结构和权值分布实现非线性的映射,并利用全局并行处理实现从输入空间到输出空间的非线性信息变换。自组织映射(SOM)神经网络能模拟大脑神经系统自组织特征映射的功能,是一种竞争式无教师自组织、自学习的网络。本文主要分析SOM神经网络的模型结构、学习算法,以及在MATLAB环境下采用此网络模型实现对矿井提升机故障的诊断。

1 SOM神经网络结构和学习算法

1.1 SOM神经网络结构

自组织特征映射(self-organizing feature map,也称Kohonen映射,SOM)神经网络,是由Kohonen教授提出的对神经网络的数值模拟方法。该网络由输入层和输出层组成。其中输入层神经元个数的选取按输入网络的向量个数而定,输入神经元接收网络的输入信号,输出层则是由神经元按一定的方式排列成一个平面。输入层的神经元与输出层的神经元通过权值联结在一起。当网络接收到外部输入信号后,输出层的某个神经元便会兴奋起来[3]。自组织特征映射神经网络模型结构如图1所示。

1.2SOM神经网络的训练方法

SOM神经网络进行学习时,首先对网络的连接权系数ωij赋予[0,1]区间内的随机值,然后给网络提供输入矢量X=[x1,x2,x3,…,xn]T, 必存在与输入神经元获得最佳匹配时的最佳匹配单元C, 在C的邻域NC内,各神经元与最佳匹配单元C的侧向连接为兴奋型, NC以外各神经元受抑制作用而使输出为0。

具体学习算法如下:

1) 设输入矢量, 即故障征兆集合为X=[x1,x2,x3…,xn]T,相应于第i个神经元的权系数构成的加权矢量Wi=[wi0,wi1…,win]T,在没有反馈的情况下,神经元的稳态输出值为:

undefined

2) 找到yi取最大值时的神经元i,则其为最佳匹配单元C。

3) 为使网络具有一种聚类功能,定义最佳匹配单元C的一个拓扑邻域NC,使NC内的单元输出为1,NC外的单元输出为0,即:

undefined

4) 权值的训练公式为:

undefined

式中0<α(t)<1,为一学习因子。权值训练后返回步骤2),直到NC或a(t)满足要求为止。

5) 输入下一个输入矢量,转入1)进行下一轮的学习,直到所有的样本都学习完为止。

2 SOM神经网络用于矿井提升机的故障诊断

2.1 矿井提升机故障样本的建立

矿井提升机系统的主要设备包括液压站、减速器和制动器等。现以矿井提升机系统中的液压站模块为例实现基于SOM神经网络的故障诊断。液压站模块的主要故障有:a) 合闸压力过小;b) 开闸残压过大;c) 油温过高;d) 开闸间隙过大;e) 合闸间隙过大。

各个设备的运行是相对独立的,利用数据采集板将各主要设备的参数及性能指标采集出来,对矿井提升机的状态进行监测。数据采集系统如图2所示。

归一化处理后的液压站标准样本集,如表1所示。

2.2 SOM神经网络学习与训练

把液压站标准样本输入到自组织神经网络系统中,系统经过训练,会反复调整权值。利用MATLAB中的神经网络工具箱,net=newsom(Xr,[d1,d2, …, di])函数创建一个SOM神经网络。该神经网络的输入层为6个神经元,输出为36(6×6)个神经元。创建完成SOM神经网络后,就对其进行训练,在MATLAB神经网络工具箱中,train(net,X)函数用来训练神经网络,net是创建SOM神经网络[6]。图3为训练完成后在输出层映射的结果,从图中可看出,编号即映射故障集中相应的故障,圆圈处表示对所有输入都不兴奋的神经元。

3 故障诊断实例

将表2所示待检的2组样本送入训练好的SOM网络,验证训练后的SOM神经网络对矿井提升机故障的诊断性能。

故障诊断结果如图4所示。

由图4可知,将X1,X2输入已经训练好的神经网络,神经网络经过聚类输出诊断结果分别为故障5(开闸间隙过大),故障4(油温过高),与现场检测的结果完全一致。

4 结论

研究了基于SOM神经网络的矿井提升机故障诊断方法,给出了SOM网络的结构和学习算法,采用MATLAB的神经网络工具箱函数来对网络进行训练和仿真,以实现对矿井提升机故障诊断。SOM神经网络具有无监督自学习,诊断结果简单、直观的特点,利用MATLAB的神经网络工具箱不必进行繁琐的编程,具有高效率和高解题品质的优点。故障实例表明该方法是有效可行的。

摘要:应用自组织特征映射(SOM)神经网络实现矿井提升机的故障诊断。介绍了SOM网络的结构和学习算法;总结了矿井提升机的故障集、征兆集和故障特征数据。在MATLAB环境下给出了矿井提升机故障诊断的具体实例,表明该方法是一种可行有效的矿井提升机故障诊断方法。

关键词:故障诊断,矿井提升机,SOM神经网络

参考文献

[1]郑殿贺,吴文革,刘仲良.矿井提升机故障监测及安全保护系统分析[J].工矿自动化,2003.

[2]《矿井提升机故障处理和技术改造》编委会.矿井提升机故障处理和技术改造[M].北京:机械工业出版社,2005.

[3]朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006.

[4]闻新,周露,李翔,等.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003.

[5]虞和济,陈长征,张省.基于神经网络的智能诊断[M].北京:冶金工业出版社,2000.

上一篇:竞技能力结构下一篇:高校公共英语