神经元网络技术(精选12篇)
神经元网络技术 篇1
1、人工神经元模型
人们试图用物理器件或计算机模拟人脑, 以便用机器代替人脑的部分劳动。迄今为止, 人们已提出几百种人工神经元模型。
最典型的人工神经元模型。人工神经元可看成是生物神经元的结构与功能的模拟与近似。这种神经元模型的输入输出关系 (数学表达式) 为:
其中θj称为阈值, wji称为连接权系数, f (·) 称为输出变换函数。
一般说来, 不同的应用场合采用不同的变换函数。图3.3表示了在自动化领域常用的几种变换函数。
(1) 线性函数 (比例函数)
(2) 符号函数 (硬限幅函数)
(3) Sigmoid函数 (S型函数)
曲线的曲率可以通过改变μ值的大小来调整。
2、人工神经网络
人工神经网络用许多人工神经元按某种结构连接构成的, 是人脑神经网络的某种简化、抽象和模拟。
影响人工神经网络的特性与能力的几个主要因素是:人工神经元模型及其变换函数、网络的拓扑结构、学习方法等。
人工神经网络的典型结构主要有:前馈型网络 (例如BP网络) 、反馈型网络 (例如Hopfield网络) 、互连网络。
3、人工神经网络的学习方法
3.1 人工神经网络连接权的确定方法
主要有如下二种:直接计算;通过学习。学习方法是人工神经网络研究中的核心问题, 学习方法归根结底就是网络连接权的调整方法。
3.2 几种基本的规则
(1) Hebb学习规则;根据生理学中条件反射机理, 如果两个神经元同时兴奋 (即同时被激活) , 则它们之间的突触连接被加强。
连接权调整量的表达式为:
其中:wji为神经元i到神经元j的连接权;yj和yi分别为神经元j和神经元i的输出 (激活值) ;η为学习速率。
(2) δ学习规则;δ学习规则利用已知样本对神经元之间的连接权和阈值进行学习和调整, 这种方法又称为误差校正规则。这种学习规则实质上是一种梯度方法, 这里的样本相当于“教师”, 所以这是一个有监督的学习问题。
连接权的调整量为:
其中:wji为神经元i到神经元j的连接权;
yi为神经元i的输出, 即神经元j的输入;
Yj-yj为误差, 即网络期望输出Yj与实际输出yj之差;F (·) 所表示的函数关系应根据具体情况而定。
3.3 人工神经网络的主要研究课题
网络的基本特性、结构以及快速学习算法等;网络的工程应用;网络的硬件实现。
3.4 人工神经网络在控制工程中的应用
(1) 基于神经网络的系统辩识, 实质上是选择一个适当的网络模型来逼近实际系统, 可用于非线性系统的辨识。
(2) 系统控制, 主要针对系统的非线性与不确定性。
第一、具有不确定性和时变性 (包括环境) 的非线性系统的自适应控制问题, 可单独应用人工神经元网络。例如:单神经元自学习控制器。
第二、融合多种智能技术的智能控制系统, 可将神经网络与专家控制、模糊控制相结合。例如, 模糊神经网络控制。
第三、基于常规控制算法的神经网络控制, 可将神经网络与常规控制算法相结合。例如, 神经网络预测控制。
(3) 控制系统的故障诊断与容错控制。
4、优化计算
神经元控制系统是一种能在其运行过程中逐步获得被控对象及其环境的未知信息, 积累经验, 并在一定的评价标准下进行估计、分类、决策, 从而使系统品质逐步改善的自动控制系统。通过本文的讲解学习控制通过对被控对象及其环境的未知信息来估计和逐步改善而导致系统品质的逐步改善。
参考文献
[1]孙增圻等编著.智能控制理论与技术.清华大学出版社, 1997年.
[2]蔡自兴, 徐光佑.人工智能及其应用.清华大学出版社, 2000年.
[3]邵军力等编著.人工智能基础.电子工业出版社, 2000年.
[4]王永骥, 涂健编著.神经元网络控制.机械工业出版社, 1998年.
神经元网络技术 篇2
摘要:目的:进一步研究神经外科中,神经内镜技术的应用。方法:收集了2010年2月-2011年2月来我院接受神经内镜治疗的164例患者的临床资料进行详细研究,54例患者接受内镜直接手术,88例患者接受内镜辅助外科手术,22例患者接受内镜控制手术。结果:164例患者生命体征、临床症状,均得到改善,头部CT检查显示,颅内病变全部或大部分切除,并发症发生几率较小。结论: 神经外科中,神经内镜技术的应用,能够显著降低对正常脑组织的损伤,提高手术成功率,降低并发症的发生几率。
关键词:神经外科; 神经内镜; 临床应用
【中图分类号】R561【文献标识码】A【文章编号】1672-3783(2013)11-0161-01
作为神经外科微创手术重要组成部分的神经内镜,在临床上应用广泛。此技术微创、照明效果好、放大效果佳,被越来越多的医生接受与认可,并广泛应用到神经外科众多领域[1]。但是,相比于欧美等发达国家,我国神经内镜技术起步比较晚、还不成熟,但是,发展速度较快[2]。现阶段,神经内镜技术在神经外科中的应用取得了可喜可贺的成绩。为了进一步研究神经外科中,神经内镜技术的应用,笔者收集了2010年2月-2011年2月来我院接受神经内镜治疗的164例患者的临床资料进行详细研究,研究报告如下:
1资料与方法
1.1临床资料:收集了2010年2月-2011年2月来我院接受神经内镜治疗的164例患者的临床资料进行详细研究,其中,100例男,64例女,患者年龄在10岁-67岁之间,平均年龄为41.3岁。其中,22例垂体腺瘤,28例三叉神经痛,36例前循环动脉瘤,4例室内肿瘤,18例蛛网膜囊肿,24例交通性脑积水,32例梗阻性积水。
1.2方法:设备:选择蛇牌电子内镜。观察镜为30度镜,工作鞘内工作镜为0度镜。54例患者接受内镜直接手术,包括脑室底造瘘术、切除蛛网膜囊肿、肿瘤活检术;88例患者接受内镜辅助外科手术,包括前循环动脉瘤切除、微血管减压、脑室腹腔分流等。22例患者接受内镜控制手术,均属于切除垂体腺瘤。
2结果
164例患者生命体征、临床症状,均得到改善,头部CT检查显示,颅内病变全部或大部分切除,仅30例患者出现并发症,16例发热,6例硬膜下积液,4例脑出血,4例颅内感染。
3讨论
随着医学的不断发展,神经内镜技术以及手术器材越来越成熟,被广泛的应用在神经外科领域。根据其操作性不同,可以将这类技术分为三种:第一,内镜直接手术。完全在内经环境下进行,通过颅骨钻孔,直接达到病灶部位。通过内镜手术通过直接完成手术操作。因止血困难,一定要严格筛选手术适应症,主要包括:包括切除蛛网膜囊肿、梗阻性积水、肿瘤活检术以及脑室底造瘘术。直达病灶,手术成功率高。第二,内镜辅助外科手术。这种操作是充分利用了神经内镜的放大作用以及照明作用。在外科手术中,对于显微镜无法到达的部位、脑深处部位等,通过神经内镜的应用,能够全面观察,对脑深部的组织病变、周围组织等等进行准确定位,降低盲目性操作以及误伤,降低对正常组织的牵拉。在夹闭动脉瘤手术、表皮样囊肿、三叉神经病症等手术中,应用广泛。第三,内镜控制手术。随着医学的不断进步,现阶段很多医院开展了垂体腺瘤切除手术,通过神经内镜控制鼻蝶,这种手术方式可以最大限度的保护患者正常鼻腔结构,在神经内镜优越的光照条件下,尽可能将肿瘤切除,避免伤害海绵窦、颈内动脉等重要组织。
神经内镜技术受到自身因素影响,会出现以下并发症:第一,发热。发热是最常见的并发症,与脑室操作有很大关系,胆固醇结晶、肿瘤成分等等,都会引发无菌炎症。生理盐水冲洗与术后短期地塞米松应用,能够降低发热几率。本文16例发热患者,给予地塞米松治疗后,症状消失。第二,硬膜下积液。这类并发症经常发生在儿童患者身上,可选择骨瓣开颅手术,预防发生皮下积液。本文6例患者,随访半年,自行吸收。第三,脑室出血。在手术过程中,应避开血管,降低钝性分离操作。动脉出血患者,可用生理盐水清洗联合出血点电凝方式止血。静脉出血患者,反复冲洗,可停止。本文4例患者均为静脉出血,经过反复冲洗,止血。第四,颅内感染。鞍膈开放,很容易导致气颅与脑脊液漏,进而导致颅内感染。在手术过程中,应积极进行鞍底重建,并合理应用抗生素。本文4例患者,接受头孢曲松钠、万古霉素治疗。
由于神经内镜的术野比较小,操作受到空间限制,图像分辨率差[2],因此,对于住手要求标准高,手术意外的应对力较差,一旦发出血则不容易应对。但是,这种技术在处理颅内囊性病变以及脑室内病变方面,优势显著。
综上所述,神经外科中,神经内镜技术的应用,能够显著降低对正常脑组织的损伤,提高手术成功率,降低并发症的发生几率。
参考文献
[1]刘重霄,师蔚,郭振字,等.神经内镜治疗中颅窝蛛网膜囊肿的作用及疗效探讨[J].中国临床实用医学,2010,2(5):40-41
[2]宋英,师蔚,高李贵,等.囊性脑膜瘤伴出血与钙化一例报告[J].中华神经医学杂志,2011,5(2):206-207
神经元网络技术 篇3
【关键词】故障诊断;基本原理;神经网络;实际应用
引言
电梯在实际生活中出现不正常运行、停运等故障是在所难免的,而作为高层建筑中主要的垂直交通工具如果不能及时准确的查明故障原因并维修往往会给乘客带来巨大的生命威胁。只有保证电梯的安全运行,及时的发现故障并解决故障,才能够为乘坐电梯的乘客提供合格的安全保证。目前,国内在用的电梯缺乏完善的故障诊断系统,仅仅依靠维修技术人员的经验以及简单的诊断仪器已经不能够及时的解决复杂的电梯故障问题。神经网络技术可以应用于复杂多模式的故障诊断并且既可以用于实时监测也可以进行离线诊断,在系统模式非常复杂或者根本不知道系统模式的情况都可以应用,这些特点恰恰解决了传统方法中最最难以解决的问题。因此必须加快神经网络技术应用于诊断电梯故障的步伐,形成完善的故障诊断系统,才能更及时准确的查明故障原因进一步及时的解决问题,保证乘客的人身安全。
一、电梯的运行原理和电梯故障的特点
只有清楚地了解电梯控制系统的运行原理才能够及时准确的诊断出电梯故障原因,因此清楚的了解电梯运行原理,每一个电梯维修人员必须要做到。电梯运行过程总体上可分为以下几个阶段:第一、登记层外召唤信号和登记内选指令阶段;第二、电梯门关闭或者电梯按照系统指令停运阶段;第三、启动阶段;第四、在到达信号记录的楼层前进行减速制动;第五、平层开门阶段。在整个过程中电梯需要从外界接收信号并处理,然后完成相应的指令或者输出信号,由此可以将电梯看作是一个完整的独立的系统,只需要外界给予相应的信号就可以自动的做出动作。电梯系统内部复杂的构件紧密的结合在一起,正是如此才使得电梯系统故障具有了复杂性、层次性、相关性以及不确定性的特点。
二、神经网络技术基本原理
生物学上的神经是由一个个简单的神经元相互连接进而形成了复杂的庞大的神经系统,同理,神经网络就是由大量简单的处理单元相互连接形成的复杂的智能系统。单独的处理单元类似于一个神经元,是一个可以接受不同信息但是只输出一种信息的结构单位。神经网络系统与生物学神经系统相似的是具有自我修改能力,它可以同时接收大量的数据并进行统一的分析处理,进而输出相应的处理结果。这就使得神经网络系统具有了高度容错性、高度并行性、自我修改性、学习性以及高度复杂性,也正是由于这些特性才使的利用神经网络技术能够及时准确的查明电梯故障原因并得出故障解决方案。电梯故障诊断中应用的神经网络模型分为三个层次:输入层、接收外部信号或者是电梯自我检测信息(如载重信息);隐含层、对接收到了大量数据进行相应的分析处理;输出层、将记录着动作命令的数据传送出来。在电梯出现故障时,首先可以通过神经网络模型快速确定故障发生在哪一层达到节约时间的目的。但是神经网络也会因为收敛速度过于慢、训练强度太大或者是选择的网络模型不好等问题导致诊断结果受到影响。
三、神经网络模型在电梯故障诊断中的应用分类
神经网络模型已经成为了如今电梯故障诊断中应用最广泛的技术模型,相比于传统方式它具有诊断速度快、故障原因命中率高的优点,因此引起了各方面专业人士的强烈关注,并在他们的不懈努力下得到了发展与创新。它跨越多个专业领域、通过对各种复杂的高难度工作的不断的发展与改进出现了越来越多的应用模型,下面主要介绍了当前应用最普遍的BP网络模型,并且简单的引入并介绍了近年来新兴的模糊神经网络模型和遗传小波神经网络模型。
(一)BP网络模型
BP神经网络作为神经网络应用最广泛的一种,它多应用的误差反向传播算法使其在模式识别、诊断故障、图像识别以及管理系统方面具有相对先进性。基于BP网络的电梯故障诊断技术就是通过学习故障信息、诊断经验并不断训练,并将所学到的知识利用各层次之间节点上的权值从而表达出来。BP网络系统的主要诊断步骤主要可以分为三步。第一步:对输入输出的数据进行归一化处理,将数据映射到特定的区间。第二步:建立BP网络模型,训练BP网络模型。第三:通过已经训练好的网络模型对原来的样本进行全面的检测。算法步骤:a、在一定的取值范围内对数据进行初始化;b、确定输入值数值大小,计算出预期输出量;c、用实际输出的值减去上一步得到的数值;d、将上一步得到的误差分配到隐含层,从而计算出隐含层的误差;e、修正输出层的权值和阈值,修正隐含层的权值;f、修正隐含层的阈值,修正隐含层和输入层的权值。
(二)遗传小波神经网络模型
遗传算法运用了生物界的优胜劣汰、适者生存的思想对复杂问题进行优化,适用于复杂的故障,起到了优化简化问题的作用。对局部数据进行详细的分析是小波法最大的特点,所以它被誉为“数字显微镜”。遗传算法小波神经网络就是运用小波进行分解的方法分解模拟故障信号,将得到的数据进行归一化,将归一化后的数值输入到神经网络模型中。它融合了神经网络、小波分析和遗传算法三者所有的优点。基于遗传小波神经网络的电梯故障诊断的一般步骤为:测试节点信号采样、小波分解、故障特征量提取、归一化得到训练样本集、遗传算法优化、得到故障类型。遗传小波神经网络模型在故障原因复杂、数据信息量巨大的电梯系统的应用中能够发挥更大的作用。
(三)模糊神经网络模型
模糊神经网络模型就是创新性的将神经网络与模糊理论结合到一起。它采用了广义的方向推理和广义的前向推理两种推理方式。与其它两种模型不同的是,它的语言逻辑、判断依据和结论都是模糊的。但是它的数据处理能力还有自我学习能力并没有因此而变差,反而更加丰富了它的定性知识的内容。在处理实际问题的过程中,首先要建立所有可能发生的故障的完整集合,其次将所有的故障发生原因归入到同一个集合中去,最后就是建立故障和原因的关系矩阵。分别叫做模糊故障集、模糊原因集、模糊关系矩阵。相较于BP网络模型,这种模型更加的简单易行,充分发挥了神经网络和模糊逻辑的优点,不会因为故障原因过于复杂而失去诊断的准确性,在原本丰富定性知识和强大数据处理能力的基础上具有了很大的自我训练能力。
结语
综上所述,神经网络技术可以应用于复杂多模式的故障诊断并且既可以用于实时监测也可以进行离线诊断,在系统模式非常复杂或者根本不知道系统模式的情况都可以应用,这些特点恰恰解决了传统方法中最最难以解决的问题,它的应用提高了电梯故障的诊断速度和准确度,保证了电梯运行的安全性。虽然神经网络技术的优点很多,但是在實际生活中的应用还很少,因此还需要不断的进行改进完善。同时还要注意将集中诊断方法融合到一起,例如稳重提到的模糊神经网络模型和遗传小波神经网络模型都是集成应用的典型代表。
参考文献
神经元网络技术 篇4
随着现代科学技术的发展和人们生活质量的提高,舆论对于服务的满意度提出了越来越高的要求。当需要对某一具体的事项征求调查对象的意见和想法时,问卷调查则是一种行之有效的手段,也属最常使用的方法之一。然而,用普通纸张来作为调查问卷用纸时,由于纸张的折叠、弯曲、变形等原因引起的数据误判常有发生[1]。而采用神经元网络对由扫描仪输入的调查问卷图像进行数据文件自动生成的方法则可较好地解决这一误判问题,本文将讨论这一信息处理方法。
通过问卷形式进行的调查一般包括舆论调查、市场调查、疾情调查等,其调查方法是基于概率统计理论,而调查结果则无论在学术上还是在实际操作中都很重要。当采用填注标记的方式回答问题时,调查问卷通常由特殊纸张构成,且需专用的读取装置进行读取处理,使用成本很高。因此使用普通纸张制作调查问卷的需求便应运而生。但由于价格便宜的普通纸张易弯曲、变形而导致机器读取识别错误的频发,一般只能采用手工方式将数据输入到计算机中。这样一来,在调查对象众多的情况下,就会既费时又费力。为了实现“普通纸张问卷调查”的自动化,开发基于神经元网络的图像读取和数据处理文件自动生成的信息处理系统就成为满足这方面需求的必然结果[2]。
1 系统构成与数据形式
问卷调查识别系统是由扫描仪和计算机构成的信息处理系统。问卷调查的回答采用在问卷上的正方形框里打勾或者画圈的方式进行标记,回答结果可通过普通扫描仪和计算机进行处理,转换成可进行后续统计处理的数据形式。在问卷的周围设定识别问卷有效区域处理时所需要的信息。回答框采用黑色边框白色背景的正方形框以便调查对象选择和标记。
图1是一张模拟问卷。在问卷的外侧左端和下端标有涂黑的基准标记符号。对应于基准标记位置上的点叫做基准点。位于问卷下端沿横向排列的基准点称作“横向基准点”,左端沿纵向排列的基准点称作“纵向基准点”。问卷中文字的书写方向可任意,读取问卷时,将从左方开始首先读取纵向基准点。在横向基准点上从左向右,在纵向基准点上从上向下,编有从1开始的一组序号。回答框的位置由横向基准点和纵向基准点上的一对序号表示。
在模拟调查问卷中的基准点除了用于标识回答框的坐标位置,也可对在图像扫描输入所产生的形变进行校正时提供方位信息。问卷可按图2表示的方法进行自由填写,只是注意不要把标记延伸到相邻的栏中即可。
计算机需要统计的信息为打勾标记的回答框的坐标位置,所以识别时,首先要找到具有“勾”标记的回答框,然后识别出其纵横坐标并记录下来。再根据与调查问卷相对应的数据表,查找其代表的具体内容。
2 Hopfield网络识别模型的建立
本文所讨论的基于神经元的问卷调查识别系统的核心部分就是Hopfield网络识别[3],其识别流程如图3所示。
2.1 图像预处理
图像预处理是识别的第一个阶段,根据具体识别方案的不同,可以包括二值化、去噪、切分、大小规格化、形态学处理等步骤。例如在问卷读取处理中,首先要将图像矫正,根据需要再将灰度图像采用全局阈值化、自适应阈值化等方法二值化。本文在处理过程中,先将图像反色,反色后的图像更有利于网络识别。然后基于图像的直方图统计,采取全局阈值化,让灰度图像变换为二值化图像。
问卷调查纸张的厚薄、洁白度、光洁度、油墨深浅、书写质量等都要造成符号畸变,产生污点、飞白等干扰。输入设备扫描仪的鉴别度、线性度、光学畸变、量化过程也要产生噪声,因此要去噪。符号大小归一化分为线性归一化和非线性归一化,线性归一化实质上是对符号图像作比例变换,这种线性转换式易于进行数学处理,但是仅能保证输入向量维数的统一,对其他符号变形却无能为力,不能保持符号的基本形状结构。非线性归一化能克服线性归一化的这些缺点,但是运算复杂,需要的时间长。对于实时性要求强的情况并不适用。
如图4预处理前后图像对比所示,在处理之前,由于上述系列原因,扫描得到的回答框和符号数据周围充满了噪声和污点,采取全局阈值化的方法对扫描图像进行预处理。预处理后的图像有利于进行下一步工作—特征提取。
2.2 特征提取
待识别对象的特征提取通常有三种方法,模板匹配法、统计特征法及结构特征法。后两种方法在数字识别、汉字识别等识别量较大时经常使用,本文采用模板匹配法来进行特征提取。其工作原理是:每一种手写体符号都有模板[4],和待识别的符号的点阵图像距离最小的模板所对应的符号,就判定为输入的待识别的符号。模板匹配的关键在于模板设计。由于手写符号人为因素太多,符号变化复杂,而模板又对尺寸、旋转、噪声等微小变化敏感[5,6],为了适应各种情况,必须为每一种可能的变形设计模板,设计任务繁重,而且测试速度慢,这就需要采集大量数据运用Hopfield网络进行学习训练。
文中采取相关匹配的方法[7]寻找回答框的位置,在找到回答框之后提取回答框中的待识别对象的判别特征,通过与模板的比较来判定符号的类别。
如图5所示,采取空白回答框作为模板对调查问卷进行相关匹配,在匹配结果图上可以看出,峰值出现在回答框的中央。换句话说,当模板与回答框完全匹配时,相关运算出现峰值。下一步的工作就是将已找到的回答框中的待识别数据提取出来,如图6所示。
2.3 Hopfield网络训练与识别
问卷调查识别系统的核心部分就是Hopfield网络训练与识别[8],识别的准确率和效率主要取决于网络的训练效果。首先是训练样本的获取,样本的获取要具有普遍性;其次是样本数量的控制,样本太多势必导致训练和识别所用时间加长,样本过少则会影响识别率;再次就是网络参数的设置,参数的设置直接影响到最终识别的效果。总之,要得到好的识别结果需要不断尝试寻求最优值。
Hopfield网络采用的学习算法是Hebb学习规则,由于要识别三种符号、四种状态(三种符号加空白),因此必须针对每一种符号提取样本进行训练[9]。在训练过程中,本文采用提取样本集中训练的方法,即针对每种符号提取样本后,集中起来再训练。符号的结构相对比较简单,因此采集样本数量不需太多,训练结束后就可以对问卷调查专用纸进行识别检验,具体结果详见第3节。
3 系统仿真与实际操作
所谓系统仿真就是完全依靠计算机模拟出要处理的问题,然后用计算机处理该问题。之所以在实际操作之前进行仿真处理,一方面是检验模型的正确性,就是在理想的情况下,能否得到理想的效果;另一方面系统仿真也有助于发现系统本身的漏洞,找出模型的缺点并加以修正。
3.1 系统仿真
在进行系统仿真之前,要利用计算机制作一张模拟的调查问卷,让计算机自动绘制待识别符号,并用这些符号进行训练。模拟的调查问卷与实际调查问卷在大小、像素以及背景色上尽可能地保持一致,对模拟问卷进行处理,采用第2节所建立的模型,处理结果及相关参数如表1所示。
从上述参数设置和仿真结果可以看出,本文所设计的问卷调查识别系统是合理可行的,所提出的Hopfield网络识别模型能够处理符号识别问题。本例中相关峰和网络判断两个阈值的选取是结合仿真过程中所遇到的问题,综合识别效果和识别率所设置的,在不同的识别系统中可根据实际情况选用其他数值。
3.2 实际操作与结果分析
通过上述系统仿真,得到了Hopfield识别模型两个重要参数的设置,下面就可针对实际的调查问卷进行处理操作。
本文利用宽为215.9mm,高为297.2mm的标准A4纸作为调查问卷专用纸,以1:1的比例对填好的调查问卷进行扫描读取,读取后的图片像素为1169×850,其中答题框的大小为21×21,待识别符号特征提取17×17(大小足以描述符号的特征)。
为了说明训练样本对于符号识别的重要性,样本的获取全部来源于学生A,然后分别针对学生A和学生B所完成的调查问卷进行识别处理,处理结果如表2所示。
其中,90(30)A表示每种符号取30个样本共90个,样本来源为学生A。
从上述的实际操作处理中可以看出两点内容:
(1)样本数量直接影响到识别效果和识别率。以学生A为例,样本数为90时,其识别率高达96%;而当样本数缩小一半为45时,其识别率只有76%。
(2)样本来源也会影响到识别效果。由于采集的样本完全来源于学生A,所以无论样本数为多少时,针对学生A的识别率总是高于学生B;此外当样本数变化时,学生A的识别系统的稳定程度波动也较大。
知道样本来源对识别效果有很大影响之后,使用优化的样本对问卷进行判断识别,操作结果如表3所示,可以看出优化后的样本使得系统的识别率较为稳定。
其中,45(15)A+45(15)B表示分别从学生A和学生B取每种符号15个样本,共90个。
由上述实际操作过程中所遇到的问题结合结果分析图可知,在实际系统建立过程中,一方面要寻找适宜的参数,另一方面要采集大量的样本。参数的设置直接影响到系统的识别效果、运行时间以及稳定性;而样本采集过程中要注意多且广,即采集数据量要多,同时采集人群范围要广。当然不可避免的还有其他一些问题,如实际系统开发过程中要考虑成本因素,这就要求尽可能地精简化、效率化、实时化。
4 结束语
本文初步探讨了基于神经元的问卷调查识别技术,通过分析研究识别技术现状,确定了采取神经网络和数字图像处理的方法来解决这一问题。初步建立了基于MATLAB的Hopfield网络识别模型,给出了符号识别的一般方法。
针对建立的识别模型,本文进行了系统仿真和实际操作检验,均取得良好效果。其中,系统仿真情况下,符号识别率达到100%;在实际操作过程中,当样本数充足,样本来源可靠的情况下,识别率高达96%,而当训练样本不足且待识别样本来源不定的情况下,识别率可达到72%,基本达到预期效果。同时,针对所得出的结果,本文也提出了一些注意要点和改进方案。
参考文献
[1]谷口庆治.数字图像处理—基础篇[M].北京:科学出版社,20-01:127-148.
[2]谷口庆治.数字图像处理—应用篇[M].北京:科学出版社,20-02:268-276.
[3]杜选,高明峰.人工神经网络在数字识别中的应用[J].计算机系统应用,2007(2):21-23.
[4]柳回春,马树元,吴平东.手写体数字识别技术的研究[J].计算机工程,2003(3):24-26.
[5]谭旭,乐晓波,朱亨荣.基于语义和Hopfield网络的模糊汉字识别[J].计算机工程,2004(11):140-142.
[6]王启瑞,朱婉玲.一种基于MATLAB的带噪声字符识别算法实现[J].计算机仿真,2002(7):91-93.
[7]TANG Mingshou.Research of target image recognition based oncorrelation match[J].SPIE,1996,2898(9):297-305.
[8]王韬.基于连续型Hopfield神经网络的噪声字符识别[J].系统仿真学报,2003(9):1288-1290.
人工神经网络论文 篇5
关于人工神经网络,到目前为止还没有一个得到广泛认可的统一定义,综合各专家学者的观点可以将人工神经网络简单的概括为是模仿人脑的结构和功能的计算机信息处理系统[1]。人工神经网络具有自身的发展特性,其具有很强的并行结构以及并行处理的能力,在实时和动态控制时能够起到很好的作用;人工神经网络具有非线性映射的特性,对处理非线性控制的问题时能给予一定的帮助;人工神经网络可以通过训练掌握数据归纳和处理的能力,因此在数学模型等难以处理时对问题进行解决;人工神经网络的适应性和集成性很强,能够适应不同规模的信息处理和大规模集成数据的处理与控制;人工神经网络不但在软件技术上比较成熟,而且近年来在硬件方面也得到了较大发展,提高了人工神经网络系统的信息处理能力。
王先臣:打造财政的神经网络 篇6
首先,给大家介绍一下建立全国的财政的神经网络,是财政管理创新的一项重要的内容。财政信息系统建设的目标是实现财政利用资金全过程的管理,也就是要有一个统一的技术支撑平台来集成各项应用,来形成纵向到底,横向到边的完整的信息系统。这也是2006年财政信息化工作会议上提出的目标,也就是说财政资金的运用要能跟踪每一笔资金运用的过程,从中央到省、市、县,各级政府纵向贯通,横向本级政府财政内部从预算到预算的执行,一直到核算,到绩效评价,整个内部一体化系统的建立,到预算单位资金的运用,预算单位和银行、个人等等也建立起一个完整的信息系统。
建立这么一个信息系统最关键的是它的顶层设计,财政管理要在总的框架下做好顶层设计,我们是希望以资产负债的总体架构下来管理好一些基础信息,在管理好基础信息的基础上做好预算编审的管理、预算指标的管理和政府会计的管理,以及决策信息的管理。用这个信息系统来准确地反映一级政府的财政资产的状况、资金的状况,让领导能随时掌握财力的情况以及他关心的关键项目的进展情况。做总体设计的关键就是要有一个完整的预算管理的框架体系,也就是要支撑公共的财政、政府性的资金、社会的保障、国有资本金经营等完整的财政资金的预算管理体系,也就是说首先要从预算开始,对领导要提供一个完整的信息,就是一级政府有多少钱,有多大的实力,能干哪些事情。另外,与财政管理机制要匹配,就是为决策层、管理层以及预算的操作层提供提高效率的有力的支撑。同时,我们在管好预算和支出的基础上,能更好地评价我们的钱用的是不是合理,是不是达到了预先的目标。
对未来的财政信息化,我们有这样的设想,首先是建立网络的感测系统,因为我们管理一级的政府资金,资金的运用和各部门连在一起,是他们重要的组成部分,所以应该很好地实现政府财政各部门、纳税人、银行、供应商等相关机构和决策的良好,对财政和其他的核心业务系统实施实时的感测。另外,在感测的基础上,要敏捷处理,利用用友的政务云来支撑各部门业务系统之间的信息交换。在公共需求和政府财政资源层面形成完整的模型和规划支持数字运行图,也就是说使整个一级政府的资金运行状况在我们脑子里有个缩小的图像。通过我们用友政务的财政管理信息系统,为政府的公共服务提供全面的支撑,那就是支持创新,支持广泛、结构化的公共需求与财政资源,就是我们通过建立信息系统以后有了公共的标准,就使我们的财政数据进行历史性的积累,进行纵向分析,为我们预测未来形成我们的支持,预测我们未来的一些发展,预测我们未来的收入。
神经元网络技术 篇7
随着经济的增长, 对于股市的预测将变得越来越重要, 也成为经济理论研究中的一个重要课题。股票市场的变化有很多因素, 是一个复杂的非线性系统, 而人工神经网络能够从大量复杂的数据中找到数据间的内在联系, 具有良好的自我学习和抗干扰能力, 在股票预测领域中取得了显著的效果。本文应用一种更接近于生物神经系统的Spiking神经网络, 采用基于粒子群算法的学习模型, 构建了沪市上证综合指数的学习预测模型, 并用实际数据进行了分析实验。
二、Spiking神经网络及其学习模型
Spike神经元模型是更接近生物神经元的一个数学模型, 由Spike神经元构成的人工神经网络称为Spiking神经网络。在Spiking神经网络中, 一个Spike神经元在t时刻接收来自于父突触神经元的多个post-synaptic potential (PSP) 信号, 不断改变自己的膜电压。当它的膜电压超过阈值时, 产生一个spike, 并通过突触连接向外发送PSP信号。用于描述PSP信号的spike响应函数定义为:
其中, 是Heaviside步长函数, 如果>0, 则=1, 否则=0;是膜电压常量用于描述PSP信号开始衰减的时间。
每个spike神经元传送的PSP信号是类似的, 在这Spiking神经网络中真正用于传递信息的是spike时间。这个用于编码信息的spike时间tj定义为:
粒子群算法 (Particle swarm optimization, PSO) 是Kennedy和Eberhart于1995年提出的一种集群智能的算法。该算法的基本思想是:群中的粒子在可行解空间中飞行, 通过与自己和群中粒子的竞争, 找到问题的最优解。将粒子群算法应用于Spiking神经网络中即是找到最优的连接权值, 用于衡量粒子优劣性的适应度值可表示为:
其中为第j个输出神经元的理想spike时间, 为第j个输出神经元的实际spike时间, N为学习样本的个数。
我们给出基于粒子群算法的Spiking神经网络学习过程描述如下:
1. 初始化群中各粒子的位置和速度, 并计算各粒子的初始fitness值。
2. 查找群中全局最优的粒子, 根据最优粒子更新各粒子的飞行速度和新位置。
根据式 (2) 计算各粒子新位置下的fitness值:
While maximum iteration or minimum error is not attained;
其中求粒子fitness值的算法描述为:
For each learning sample j
在学习时间T内, 分别计算隐含层和输出层的积累发放过程, 获得各输出神经元的spike时间。
End for
以上求粒子适应度值的算法时间复杂度表示为:
故在该学习模型下神经网络学习的时间复杂度T (n) 为:, n是进化的次数, C是系数常量 (5)
三、上证综合指数的预测
沪市上证综合指数是上海证券交易所编制的, 以上海证券交易所挂牌上市的全部股票为计算范围, 以发行量为权数综合, 上证综指反映了上海证券交易市场的总体走势, 所以对上证综指的预测具有重要的意义。文中选取了2006年6月~2007年7月共286个工作日的沪市上证综合指数作为研究的原始数据, 利用滑动窗口技术, 通过前6天收盘时的上证指数来预测第7天收盘时的上证指数。
我们构建了具有6个输入神经元、4个隐含层神经元和1个输出节点的前向全连接Spiking神经网络, 并利用以上的Spiking神经网络学习模型进行测试。选取了原始数据中的前276个数据构成神经网络的训练集, 后10个数据用于测试。在实验前, 我们对原始数据进行归一化的处理转换为[0, 1]之间的值。把归一化后的前6天收盘时的上证指数分别作为6个输入神经元的spike时间加入到Spiking神经网络中进行学习和计算, 获得神经网络输出节点的spike时间, 该时间对应于第7天的收盘指数。按本文式 (3) 计算获得Spiking神经网络的学习误差, 通过粒子群算法不断调整神经网络的参数使误差最小化。获得了最优的Spiking神经网络后, 用测试集的数据对其性能进行了测试。经Spiking神经网络学习预测后的上证指数变化如图。
结果表明, 与传统BP算法相比, 基于粒子群算法的Spiking神经网络具有较快的运算速度和逼近性能, 同时可以克服Spike Prop算法陷入局部最优解和对权值有约束的缺点, 可以较好地处理股票类非线性数据的学习和预测。
四、结论
股票市场的不确定因素太多, 是一个复杂的非线性系统, 而神经网络具有自我学习的能力, 能很好地解决不明确环境中的非线性应用问题。Spiking神经网络作为一种新型的动态的神经网络, 其利用动态的spike时间进行信息编码和计算的特点与股票市场中动态的时间序列相吻合。文中对应用Spiking神经网络预测国内股票市场做了初步的探讨, 获得了较好的拟合效果。进一步改进原始数据的处理方式, 提高Spiking神经网络的自适应能力, 将能得到更好的预测效果。
摘要:Spiking神经网络是一种新型的神经网络, 它采用更接近于生物神经元的动态的Spike神经元作为计算单元, 进行信息的编码和处理。文中给出了基于粒子群算法的Spiking神经网络学习模型, 并运用于上证指数的趋势预测, 结果表明其用于股市预测是有效性。
关键词:Spiking神经网络,学习模型,股市预测
参考文献
[1]Sander M:Bohte, Spiking Neural Networks[D].ISBN90-6734-167-3, 2003
[2]Gerstner W, Kistler W.Spiking Neuron Models:Single Neurons, Populations, Plasticity[M].Cambridge University Press, 2002
[3]韩文蕾王万诚:概率神经网络预测股票市场的涨跌[J].计算机应用与软件, 2005, 22 (11) :133~135
[4]廉新宇吴立锋:基于小波神经网络的股票价格预测[J].商场现代化, 2006, 10月中旬刊:331~332
神经元网络技术 篇8
(一) 风险投资业风险评价的目的
在高新技术产品的投资开发过程中, 由于高技术产业化的不确定性, 投资主体对外部因素估计不足, 或对投资过程无法控制等多种因素的作用, 从而造成实际结果与预期目标发生偏离并导致利益损失。如果能在投资前或运营中较准确地预计风险之所在并加以有效控制, 可以大量减少盲目投资或经营不善带来的损失。对这种风险的有效控制往往是通过对风险因素进行正确的分析评价, 对项目进行科学的决策来进行的。进行风险评价的目的就是达到对风险投资发展、运行的全过程进行调控, 保证风险投资决策的科学性。
(二) 风险投资业风险评价指标分析
建立合理的指标体系是评价模型建立的基础, 指标体系的科学性在于它能够客观反映投资风险因素构成及其内在联系。
1.技术状况。
C11技术与科技政策的吻合度:国家和各级地方政府往往对与本地区经济发展规划有关的产业技术有倾斜和鼓励政策, 这种来自政府的支持可以影响到企业经营的很多方面, 如税收优惠、出口政策倾斜等, 违反政府法规的生产技术也会受到经营上的限制。
C12技术的适用性:技术的适用性描述了技术适用的难易程度、广泛性和大规模产业化的可行性。
C13技术的先进性:技术先进性的大小不仅关系到所生产产品在市场上的竞争力, 而且关系到技术生命周期的长短。当今科学技术的发展一日千里, 信息量以指数倍增, 新技术的涌现日新月异。一项技术的领先能否保持一定的生命周期对企业和投资者而言非常重要。技术的先进性的判断标准一般通过对比分析国内外同类技术的参数来确定技术的发展水平, 以此来判断技术在同业中的地位。
C14技术的可靠性:技术可靠性是指其接近最后产品的程度及产品在规定条件下和规定时间内无故障的发挥其特定功能的概率。我国高科技投资失败的原因很多是由于技术仍停留在实验室阶段, 一旦投入生产就会遇到工程等方面的问题。因此, 在投资一项高科技之前必须确定其配套的工程技术和产品技术已经完善, 产品的性能达到可靠性标准。
C15技术的可替代性:技术的替代性是指用不同的方法, 实现同一功能的技术。当替代技术完全能实现同样功能, 同时在可靠性、成本等方面更胜一筹时, 待投资的技术风险加大了。
C16技术的发展潜力:它主要用来反映技术的创新能力及盈利空间。
2.财务状况。
C21资金结构:企业的资金结构主要包括企业的筹资结构的指标, 以及反应企业偿债能力指标。企业筹资结构是构成目前投资各方的资金比例状况, 如果是先期投资者则面临着投资数额大, 无法与人分担投资风险, 但是收益率高;反之, 若已有多方投资者则可减少投资风险, 收益率也随之降低。本项指标用筹资结构百分比表示, 该指标越大投资风险越大, 但收益也高。
C22投资管理:本指标用来衡量企业资产的利用、经营、管理状况, 反映企业的资金利用效率和管理水平, 是传统企业价值评估中常用的指标。
C23投资决策:主要用募集资金投向、技术开发进度是否符合投资者意愿, 衡量企业的资产利用状况。
C24赢利能力:本指标衡量企业获取利润的能力。
C25投资的效益:任何投资, 投资者最关心的是其是否赢利, 赢利程度如何, 即投资的效益如何。
3 环境状况。环境状况主要包括C31社会环境、C32政治环境、C33法律环境、C34微观经济环境、C35宏观经济环境。
4 市场状况。市场是现代企业生存发展的关键, 再好的技术和产品, 如果不能为市场所接受, 则直接影响到企业的收益和成败。因此, 对投资对象进行市场分析, 有利于投资者更好的了解投资对象的特性, 从而在激烈的市场竞争中立于不败之地。具体考察因素如下:
C41市场规模:市场规模主要指产品在同类及相关市场上的占有率及市场份额, 产品市场规模的分析主要是对产品的潜在市场进行分析。产品的潜在市场、尤其是高新技术的潜在市场的大小往往比目前市场还重要, 由于其具有创新性, 它的发展必然会带动潜在的市场需求, 这往往更能决定一个企业的长期发展。
C42市场竞争力:对产品市场竞争力的分析主要是考察产品自身的导入频率高低。如果产品所应用的技术变化很快, 新产品层出不穷, 则导致产品被替代的可能性加大, 从而导致利润减少, 竞争力减弱;同时还要分析目标市场的进入是否存在障碍, 如果顾客对现有产品或供货商十分忠诚, 则会对新产品的前景构成威胁, 降低产品的竞争力。反之, 如果顾客的需求经常驻发生变化, 则会给予新产品可乘之机。
C43市场销售能力:企业的销售能力反映了公司营销管理的效率以及抗风险和生存竞争的能力。
C44市场价格策略:企业的产品定价策略是为了使产品在市场上有合理正确的定位, 产品定位的准确合理与否关系到企业的发展。若产品定位过低则以后很难生产出可与进口产品相媲美的高档产品, 因为用户已经把公司定位为生产低档产品的企业;反之, 若产品定位过高则曲高和寡, 难以获得较大市场份额, 所以企业产品的定位很重要。
二、基于神经元网络的风险投资评价体系
现有研究对风险投资的投资风险评价采用层次分析法 (AHP) 确定指标权重, 用模糊综合评价法建立评价模型, 但是AHP法采用专家评分来确定权重, 主要依靠评价人员的主观经验性, 而且这些方法缺乏自学能力。近年来神经元网络技术得到了快速发展, 其应用也渗透到各个领域, 其中BP网络的理论和应用研究成为较活跃的一个方面。因此, 本文用人工神经网络理论中的BP网络模型构建风险评价模型, 从而解决了以往的很多不足。
(一) 风险投资风险评价的BP网络模型
误差反向传播神经网络, 简称BP (Back Propagation) , 是一种含有隐含层的多层前馈网络。如果网络的输入节点数为M、输出节点数为L, 则此神经网络可看成是从M维欧氏空问到L维欧氏空间的映射。这种映射是高度非线性的, 现实中的许多的问题, 如模式识别、图像处理、系统辨识、函数拟合、优化计算等, 都可以转换成这种神经网络来处理, 因此BP网络的应用范围较为广泛。
风险投资的风险评价问题实际上是一个从M维输入指标值到1维输出值的空间映射, 本节采用三层BP网络完成对风险投资的评价。网络模型的第一层为输入层, 中间层为隐含层, 第三层为输出层, 各层次的神经元之间形成全互连连接, 而各层次内的神经元之间没有连接, 输入层的单元数为风险投资风险评价的指标数, 输出层的单元数为1个, 即风险投资的风险评价值。隐含层单元数的确定与输入输出单元的多少有直接的关系, 隐单元数太少网络不能训练出来, 或网络不强壮, 不能识别以前没有看到的样本, 容错性差;隐单元数太多又使学习时间过长, 误差也不一定最佳。一般情况下可按经验公式给出:
式中:nH——隐含层神经元数目;nI——输入层神经元数目;no——输出层神经元数目;l—— 1-10之间的整数。
在本文中, nI取20, no取1, l暂取8, 则隐含层单元数为12。隐含层的选取也可视网络训练的具体情况而定, 本文BP网络的隐含层单元数取为12。网络中输入层神经元的输入值等于输出值, 隐含层和输出层神经元的输入和输出关系采用Sigmoid函数, 即:f (x) =1/ (1+e-x) 。
(二) 三层BP网络的计算原理
1.输入层的输出值:
Opi=rpi (P=1, 2, …s;i=1, 2, …, m )
p为样本模式的对数;i为输入向量的维数。
2.隐单元的输出值:
j为隐含层的神经元数。
3.输出层的输出值:
其中rpi为所有样本的指标经归一化处理后的无量纲的值, wij (i=1, 2…m;j=1, 2…, n) 表示输入层第i层单元到隐层第j单元的连接权值, wj (j=l, 2…, n) 表示隐单元j到输出层的连接权值, θj为隐单元的阈值, θ为输出单元的阈值, Op为样本模式P的网络输出值。
3. 三层BP网络学习算法。对于样本模式 (输入~输出对) p, 实际输出Op, 与目标输出bp之间的误差函数为Ep:
则p个样本的总误差为:
当E<ε (ε为给定的任意小正数, 文中e=1.0×10-3) 时, 神经网络学习结束, 按此时确定的网络模型就可计算各风险投资项目的风险评价值。该评价模型的算法如下: (1) 对网络连接权值wij (0) , wj (0) 和神经元阈值θj (0) , θ (0) 赋初值。 (2) 输入样本模式对 (输入数据和目标数据) 。 (3) 从输出层开始, 按下列公式调整权值及阈值:
其中t为迭代次数, η表示学习效率且η∈ (0, 1) , α表示动量因子, 且α∈ (0, 1) , 且有:
(4) 计算E, 如果E小于给定的收敛值, 则神经网络训练结束, 否则转 (3) 。
在BP学习算法中, 有几个值得注意的问题:
(1) 学习算法中的η表示学习速率, 或称步幅, η较大时, 权值的修改量就较大, 学习速率比较快, 但有时会导致震荡;η值较小时, 学习速率慢, 然而学习过程平稳。在实际的学习过程中可以将η取为一个与学习过程有关的变量, 并且在学习刚开始时η值相对较大, 然后随着学习的深入, η值逐步减小。自适应学习速率公式为:
(2) 在学习开始时必须给各个连接权值赋初值。首先对每个连接权值赋予一个随机值, 但不能使所有的连接权值都相等。在实际的网络训练过程中, 通常的处理方法是给每一个连接权赋予 -1至l之间的一个随机数。
(3) 对于动量因子α, 又称为惯性矫正系数, 应与η协调选取, 通常较大的α可以改善网络的收敛速度, 但对提高网络的收敛精度却没有积极的作用。有文献指出, 当α按下式取值时, 可同时获得较好的精度和收敛速度:
将上述学习算法应用Matlab软件, 就可以训练BP神经网络。首先, 选取若干个风险投资项目的相关数据 (包括输入和输出) 作为训练样本, 样本数据输入后BP网络自动进行学习, 不断调整权值和阈值, 当误差减到要求的范围内, BP网络停止学习, 此时权值与阈值固定下来, BP网络训练结束。此后, 要对任意一个风险投资项目进行风险评价, 只要将有关数据输入已训练好了的网络 (数据输入前必须进行归一化处理) , 就可以得到相应的输出值即风险投资项目的风险评价值, 再根据各个风险投资项目评价值进行排序。
三、典型案例剖析
(一) 实证分析对象特征
本文以致力于推动社会信息化进程的某高新技术企业为分析对象, 对该公司风险投资的风险性进行评价。该公司地处西安高新技术开发区, 该区是1991年3月经国务院批准成立的国家级高新技术产业开发区。该公司以信息系统应用为基础, 在计算机系统集成、信息网络建设、多媒体应用信息系统等领域都有所建树。
1.公司的产品及技术特点。
主要产品有网络协议分析仪、IP语音网关、多媒体网络视频系统等具有自主知识产权的宽带网络维护、应用和接入产品。网络协议分析仪采用“虚拟仪器”的设计思想, 以国际标准和信息产业部标准, 综合国外Fril类网络协议测试仪表的先进功能以及可视化编程技术和全中文界面等特点, 研发出的一种新的通信仪器。这种仪器不仅能满足数据通信网络维护监测的实际需要, 而且属国内首创, 并填补了国内在该领域仪器的空白, 其中多项测试功能达到国际先进水平。公司参考国际流行的Cmm标准, 进行严格的配置管理和变换控制管理, 同时加强技术共享, 并严格按照IS09001开发生产规范, 建立了一套开发和生产的技术质量管理手册、作业指导书等手册。对应的指标是:C11, C12, C13, C14, C15, C16。
2.市场需求及营销特点。
近年来, 随着我国社会信息化、网络化进程的加快, 数据通信业务发展迅速, 1997年以前数据通信用户仅为15万户, 1998年底达到45万户, 1999年预计新增长85万户, 达145万户。可以看出用户数成指数倍上升, 如果对网络分析仪的需求保持每年以4 000台递增, 则5年后将增加2万台, 5年后市场对网络协议分析仪的市场总容量为35 000台。在营销上, 为了突出公司主营方向, 明确业务定位, 以产品或项目形成专业销售队伍, 同时确定销售目标与任务, 并实行部门经理且标负责制, 通过销售管理、技术支撑, 实现销售目标利润的最大化。对应的指标是:C21, C22, C23, C24, C25。
3 财务概况。公司下设财务管理中心, 由计划财务部和财务审计部组成。财务管理中心的财务报告采用ABC (Activity Based Costing) 核算法。资金需求及使用计划:需要新增投资额为1035万元, 用于完成公司产品的生产线建设, 市场销售渠道的建设, 广告宣传和大量流动资金的投资。
投资回报及退出途径:经预算, 该项目的内部收益率为69%, 挣现值 (I=30%) 为1 121万元, 动态投资回收期为2.4年。风险投资机构可以通过以下渠道实现投资回报:公司回购;公司争取三年内通过香港创业板或在国内借壳上市, 投资机构可以通过股权转让获得资本收益。对应的指标是:C31, C32, C33, C34, C35。
4 环境风险。目前国际互联网 (因特网) 的兴起与发展, 正逐步深入地改变着全人类的生活方式。中国的因特网虽起步较晚, 但正以非常迅猛的速度发展。该公司产品能全面提高电信、计算机网络的服务运营质量, 在确保网络运行畅通的同时为我国的信息产业化带来巨大的推动作用。同时显著地减少网络运行问题的发生, 降低网络运行问题所造成的经济损失。对应的指标是:C41, C42, C43, C44。
(二) 样本模式对的输入与输出
在实际评价中, 首先要收集有关风险投资项目的实际观测数据, 确定BP网络的输入, 包括20个输入指标:C11, C12, C13, C14, C15, C16, C21, C22, C23, C24, C25, C31, C32, C33, C34, C35, C41, C42, C43, C44。为了有效的对网络进行训练, 需要对这些数据进行归一化处理, 为此, Matlab给出了专门的归一化处理函数Premnmx。
网络输出就是项目的风险评价等级。 公司在拟开发项目风险等级的评判中将评判准则划分为五等, 其风险度取值范围分别在[0, 0.2], [0.2, 0.4], [0.4, 0.6], [0.6, 0.8]和[0.8, 1]之间, 构成项目投资风险评判准则集:T=[t1 t2 t3 t4 t5]=[低风险, 较低风险, 中等风险, 较高风险, 高风险]。本文在进行实证分析前先选取30组样本数据, 其中前20组数据作为学习样本, 用来训练BP网络的连接权值;后10组数据作为检验样本数据。输入数据在[-1, 1]区间随机产生, 由于目标输出与输入存在正相关联系, 并且要落入[0, 1]区间, 所以目标输出矩阵可经过下列变换得到:
Out=logsig (ones (1, 20) * rands (20, 20) )
(三) BP网络的训练
相应的神经网络训练函数为trainbpx, 最大步数为1 800, 最小误差为0.001, 用Matlab6.0进行训练, 直到网络能达标为止。训练结束后, 利用训练好的三层BP网络, 分别输入后10组检验数据, 就可得到响应的输出结果。由于样本数据矩阵和输入层与隐含层的权值连接矩阵过大, 不便附在文中, 所以只给出部分结果:
TRAINBPX:820/1800epochs, lr=0.701523, SEE=0.000886734
意义为运用trainbpx训练函数, BP神经网络经过820步训练, 网络性能达标, 学习率为0.701523, 误差为0.000886734。
隐含层12个神经元的阈值B1 (1×12) 为:
B1=[-1.3401, -0.7843, 0.3678, -3.4723, 2.4521, -2.4781, 1.7832, -3.5674, 7.2764, 2.3679, 1.4536, -4.3892]
输出层神经元的阈值为:
B2=1.2679
隐含层与输出层的权值连接矩阵为W2 ( 1×12) :
W2=[-2.3178, 0.7645, -0.3724, -1.3716, -4.6128, 3.7982, 1.5428, -6.3281, -0.0463, -0.7432, 7.3874, -0.7321]
最后, 运用训练好的BP网络, 输入一组输入数据就可以得到相应的输出结果。In (1×20) 为随机产生的某个投资项目的20个指标数据, 则Out为应用BP网络得到的该投资项目的风险评价值:
(四) 公司项目投资风险度计算
运用上述训练好的BP网络, 将该公司技术状况、财务状况、环境状况和市场状况的定量数据及定性数据作为网络输入, 则:
In=[C11, C12, C13, C14, C15, C16, C21, C22, C23, C24, C25, C31, C32, C33, C34, C35, C41, C42, C43, C44]=[0.3781, 0.6732, 0.8432, -0.1285, 0.2564, 0.4389, -0.2348, -0.5384, 0.3571, 0.3482, -0.5419, 0.3829, 0.4281, 0.5819, -0.4831, 0.5894, 0.34819, -0.9532, 0.1832, 0.7392]
经BP网络计算, 得出风险度的结果如下:
Out=0.2714
公司在拟开发项目风险等级的评判原则, 风险度为[0, 0.2], [0.2, 0.4], [0.4, 0.6], [0.6, 0.8]和[0.8, 1]之间, 分别为低风险、较低风险、中等风险、较高风险和高风险。从结果可以看出, 风险度在0.20-0.40之间, 其系统风险度等级应评定为较低风险, 说明该项目有较低的风险。
(五) 结论
该公司实际运行情况:风险投资公司于2007年9月投入1 000万元, 占33.3%股份。风险投资公司投资后, 针对该企业制定了企业发展战略、资源配置、引进战略伙伴等方面作了大量工作, 使该公司迅猛发展, 企业价值剧增, 由此可见, 该模型对风险投资评价系统的风险程度具有较高的实际应用价值。
综上所述, 用人工神经元网络评价风险投资项目的特点是: (1) 通过对参与评价风险投资项目样本的学习就能够确定人工神经元网络模型的结构, 按照风险投资项目评价的最优算法准则反复迭代, 不断调整神经网络结构 (神经元之间的连接权值和阈值) , 直至达到一个相对稳定的状态, 然后以该神经网络模型进行评价和排序。 (2) 计算误差小。人工神经网络模型对参与评价样本的学习, 能使系统误差达到指定的精度要求, 具有收敛性。 (3) 动态评价性能好。随着参评样本的增加和时间的演进, 能够进行进一步的样本学习和实现动态跟踪评价。
参考文献
[1]杨葵.风险投资的筹资研究[M].上海:上海财经大学出版社, 2007.
[2]范柏乃.中国风险投资退出机制及相关法律制度研究[J].风险投资分析, 2004.
[3]刘曼红.风险投资创新与金融[M].北京:中国人民大学出版社, 2004.
[4]张元萍.风险投资运行机制与模式[M].北京:中国金融出版社2003.
神经传递通路的神经网络建模 篇9
在智能系统和智能产品的开发中,控制和结构一体化设计有多种思路,其中一种是采用神经网络和结构并行进化设计,并将设计模型直接接入实体造型和激光快速成型技术,直接生成具有一定自治能力的机器人。在自治机器人中,神经网络由人工神经元硬件实现,因此,神经网络连线应尽可能少以便于加工,同时连线少也有利于提高控制系统的可靠性。现有的神经网络模型主要是通过多目标优化和进化策略寻找最优构型[1,2,3,4,5,6],主要依靠增加连接来提高网络性能。有的学者认为生物学上如此复杂的连接是不现实的,自然进化不应该朝向如此庞大的连接[6]。其中有的文献基于神经元形态学(Neuron Morphologies)通过进化算法生成神经元形态和神经网络[5],侧重于神经元层的行为和操作过程,但用在工程中计算成本过高。
神经生物学提供了人工制品控制设计可以借鉴的原型。有两种途径建立神经系统模型。一种是直接建立仿生物模型。主要缺陷在于有机体神经发育中包含大量的化学反应,过程过于复杂,难以建摸。第二种途径是依据现有的神经元理论建模。神经元的作用机制模型已经有专门的研究,有成熟的成果可以借鉴。这样做的问题是现有的研究主要集中在神经元信息传递和处理机制,而非神经元网络的拓扑构型的生物学依据。
本文结合上述两种途径建模,采用简化的生物神经模型,提炼神经系统构型特征,建立神经元网络模型。
1 神经传递通路简化模型
神经系统模型非常复杂,必须提炼主要特征,才能建立有效计算模型,并应用在工程实际中。本节依据神经系统主要组成和神经传递通路特征建立神经传递通路简化模型。
1.1 神经系统组成
神经传递通路主要由感受器、神经纤维、神经元、效应器组成[7,8]。感受器是一种换能装置,将内外刺激的能量转变为神经的兴奋过程。效应器支配肌肉的活动。运动神经传递模式为感受器一初级传入神经元一二级传入神经元—三级传入神经元—中间神经元—一级传出神经元—二级传出神经元—骨骼肌。不同的通路对应不同的功能以及大脑皮质中不同的区域。以随意控制神经传递通路为例,主要回路有四个,各个回路功能不同,共同参与运动调控。大脑一小脑—丘脑—大脑联络皮质回路:投射系统对大脑皮质的运动区产生调节性影响;大脑皮质一基地核—丘脑—大脑皮质回路:主要功能为参与运动计划、启动和执行;大脑一运动前神经元一小脑—丘脑:将动作经验和当前情况核对,以矫正运动神经元的发放,使运动产生新的速度;大脑—丘脑回路:大脑皮质的下行纤维对丘脑有抑制作用。防止过激反应。
1.2 神经传递通路简化模型
依据随意控制神经传递通路特征,本文建立神经传递通路简化模型。模型由4个回路组成:(1)大脑—小脑—丘脑—大脑皮质回路;(2)大脑皮质—基地核—丘脑一大脑皮质回路;(3)大脑一运动前神经元一小脑—丘脑;(4)大脑一丘脑回路,分别简称为丘脑回路、基底核回路、小脑回路、大脑皮质回路。如图1所示。
2 神经网络建模
神经模型基本要素为基本单元和基本构型。基本单元包括神经元、感受器、效应器和神经中枢。基本构型采用上述简化模型,神经网络采用固定形态和连接模式,网络权植通过学习训练确定。
2.1 神经元分类
神经元包括胞体、轴突和树突三个组成部分。神经元分为5类:传入神经元,传出神经元,大脑皮质区中间神经元,基底核中间神经元,小脑中间神经元。其区别在于胞体的传递函数、输入函数、树突和轴突的形态、树突输入加权函数以及轴突输出不同。
2.2 网络结构
对图1简化模型建立神经网络,如图2所示。
网络含4个侧枝回路:丘脑回路、大脑皮质回路、基底核回路、小脑回路,分别控制感知和整合信息、调节姿态、运动启动和规划执行、核对和矫正运动等功能。灰色为抑制神经元,网络为动态网络。动态网络含有网络输入延迟或反馈环节,因此,网络的仿真输出与数据元素的顺序有关。图2a为原型网络,直接依据神经传递通路原型建模,包含14层,14个神经元,19条连线,4个回路。网络的主要优点是连线少,且整个网络为平面图,连线没有交叉,当采用神经元器件实现时便于加工布线。图2b为变形网络,共6层,14个神经元,53条连线。变形网络的优点是网络参数比原型网络简单。主要缺点是结构复杂,层间连线交叉,当采用神经元器件实现时布线和制造难度增加。
网络输入设定两种方式:(1)输入运动信息;(2)输入运动信息和控制幅度,以实现控制。
实现上述神经元网络,必须首先建立神经元数理模型。本文采用现有的神经元传递函数和加权函数[9]构造数理模型,并用基于matlab的函数实现[10]。
2.3 神经元数理模型
(1)神经元胞体
一级、二级传入神经元胞体数理模型:
中间神经元输入输出关系:Xi(s)=Hi(s)Xi(s)
传出神经元:yi(t)=f(xi)
(2)轴突
传入神经元、中间神经元以及非传出运动神经元为:
传出神经元为:a=n
(3)树突
分加权函数和输入函数两部分。
加权函数为欧氏距离加权函数:
输入函数为以加权方式将加权输入和阈值组合。matlab函数为N=netsum(Z1,Z2,∧,Zn)。
2.4 网络学习和训练
学习能力依靠突出结合权的变化实现。
(1)训练函数
训练分为两步。第一步采用弹性反向传播算法RPROP(resilient backpropagation algorithm)对网络进行训练;第二步采用BFGS准牛顿(quasi-Newton)反向传播算法对网络进行训练。作者计算表明:选用两种算法可以避免锯齿现象,加快收敛;对不同的系统特性,应需选取不同的训练函数。对有噪音的输入——输出系统,弹性反向传播算法有利;对PID姿态控制系统,选用单一贝叶思正则化训练函数即可。
弹性反向传播算法依据误差能量函数独立调整网络各层权重和偏差以控制步长,权值和阈值更新时只考虑梯度符号。牛顿反向传播算法是将目标函数在极小点附近用二次函数逼近,避免锯齿现象。贝叶斯正则化方法可自动调整网络规模,防止过度训练。
(2)学习函数
采用动量梯度下降权值和阈值学习函数,即权值和阈值的调整值由动量因子mc、前一次学习时的调整量dWprev、学习速率lr和梯度gW共同确定,方程为:
2.5 网络测试
用计算实例测试网络的逼近精度和泛化能力,并与其它网络比较。泛化能力(Generalization Ability)指用较少的样本进行训练,使网络能对未经训练的输入能给出合适的输出。
函数逼近能力见表1,泛化能力见表2。比较网络构型选择原则为连线数大于原型网络。观察表1和表2,对随机函数和非线性函数,在相同训练次数情况下,4回路网络与其它网络相比同时具有更好的函数逼近能力和泛化能力。由于原型网络连线数少且连线在同一平面内,因而更利于硬件实现。
2.6 网络特点
1)多个实例计算表明,本文提出的两种网络均可以满足一般输入输出映射关系。对同样的神经元数目,原型网络和变形网络比一般网络能适应更多类型的函数映射关系。2)原型网络和变形网络在算法上容易实现,适应性强。前者收敛速度慢,但是结构简单,易于布线,并利用基于激光的层加工技术实现神经元器件埋设;后者收敛速度快,但是连线多。故在线训练采用变形网络;神经元硬件实现采用原型网络。3)多个网络并联实现复杂控制。4回路神经网络模型的潜在应用是实现复杂的姿位控制,如自治卫星、机器人等,在此情况下,需要多个神经传递通路协作实现预定目标。4)网络与其它网络比较具有以下优点:(1)对任意函数逼近能力好;(2)在相同训练次数条件下泛化能力好。
3 结论
本文建立神经传递通路简化模型,建立相应的神经网络模型——4回路动态延迟神经网络模型。包括丘脑回路、大脑皮质回路、基底核回路和小脑回路。网络可采用两种形式表达:一种是直接模拟神经传递通路形态的原型网络,另一种为变形网络。原型网络包含14层,14个神经元,19条连线。主要优点是连线少,且整个网络为平面图,连线没有交叉,当采用神经元器件实现时便于加工布线。变形网络有6层,14个神经元,53条连线。优点是网络参数比原型网络简单。主要缺点是结构复杂,层间连线交叉,当采用神经元器件实现时布线和制造难度增加。两种网络均易于数学实现,并具有良好的函数逼近能力和泛化能力。
参考文献
[1]Garcya Pedrajasa N,Herva's Marty neza C,Mun~oz Pe'rezb J.Multi-ob- jective cooperative coovolution of artificial neural networks.Neural Net- works 15,2002:1259-1278.
[2]Christian Schittenkopf,Gustavo Deco,Wilfried Brauer.Two Strategies to Avoid Overfitting in Feedforword Networks.Neural Network,1997,10 (3):505-516.
[3]Alistair G Rust,et al.Towards Computational Neural Systems through Developmental Evolution.Wermter S,et al.(Eds.):Emergent Neural Computational Architectures,LNAI 2036,Springer-Verlag Berlin Hei- delberg,2001:188-202.
[4]Nariman-Zadeh N,Darvizeh A,Jamali A,et al A.Evolutionary.design of generalized polynomial neural networks for modelling and prediction of explosive forming process.Journal of Materials Processing Technology, 2005:1561-1571.
[5]Sung-Kwun Oh,Pedrycz W,Byoung-Jun Park.Relation-Based Neuro- fuzzy Networks with Evolutionary Data Granulation.Mathematical and Computer Modeillng,2004,40:891-921.
[6]Torts JJ,et al.Influence of topology on the performance of a neural network.Neurocomputing,2004:229-234.
[7]许绍芬.神经生物学.第二版.上海:上海医科大学出版社,1999.
[8]Palay S L.等.神经元形态与功能,神经生理学手册(3).黄世楷,等译.上海:上海科学技术出版社,1985:1-195.
[9]史忠植.神经计算.北京:电子工业出版社,1993:27-31.
神经元网络技术 篇10
BP神经网络也称为反向传播网络 (Back-Propagation Net work) , 是目前最为广泛、最具影响的人工神经网络 (Aritificial neural network) 学习算法之一。它可以从大量的离散实验数据中, 经过学习训练, 提取其领域知识, 并将知识表示为网络连接权值的大小与分布, 建立起反映实际过程内在规律的系统模型。BP网络可以包含不同的隐含层, 但理论上已经证明, 在不限制隐层节点数的情况下, 两层 (只有一个隐含层) 的BP网络可以实现任意非线性映射。一般情况下, 我们用得最多的BP神经网络是只有一个隐含层的BP网络, 只要我们能够保证该隐含层中的隐单元数足够多, 理论上就能够实现对任意一个问题的非线性分类了。
2 RBF神经网络的原理
径向基函数RBF (Radial basis function) 是指某种沿径向对称的标量函数, 通常定义为空间中任一点X到某一中心ci之间欧氏距离的单调函数。最常用的径向基函数是高斯核函数, 形式为
其中ci为核函数中心, σ为核函数的宽度参数, 控制基函数的径向作用范围, 即方差。
RBF神经网络是在借鉴生物局部调节和交叠接受区域知识的基础上提出的一种采用局部接受域来执行函数映射的人工神经网络, 具有最优逼近和全局逼近的特性。其网络拓扑结构是由一个隐含层和一个标准全连结的线性输出层组成的前向网络。隐含层最常用的是高斯径向基函数, 而输出层采用线性激活函数[2]。RBF神经网络是一种前馈式神经网络, 它由输入层、隐含层和输出层组成。它结构简单, 其设计比普通前向网络训练要省时得多。如果隐含层神经元的数目足够, 每一层的权值和阈值正确, 那么RBF神经网络完全能够精确地逼近任意函数。RBF神经网络权值的训练是一层一层进行的, 对径向基函数层权值的训练采用无导师训练, 在输出层权值的设计采用误差纠正算法, 为有导师训练。在RBF神经网络中, 输入层到隐含层的基函数输出是一种非线性映射, 而输出则是线性的。这样, RBF神经网络可以看成是首先将原始的非线性可分的特征空间变换到另一线性可分的空间 (通常是高维空间) , 通过合理选择这一变换使在新空间中原问题线性可分, 然后用一个线性单元来解决问题, 从而很容易的达到从非线性输入空间向输出空间映射的目的。值得指出的是, 由于RBF神经网络的权值算法是单层进行的, 它的工作原理采用的是聚类功能, 由训练得到输入数据的聚类中心, 通过值来调节基函数的灵敏度, 也就是RBF曲线的宽度, 虽然网络结构看上去是全连结的, 实际工作时神经网络是局部工作的, 即对输入的一组数据, 神经网络只有一个神经元被激活, 其他神经元被激活的程度可忽略。所以RBF神经网络是一个局部逼近网络, 这使得它的训练速度要比BP网络快2~3个数量级。
2.1 RBF神经网络的局限性
RBF网络之所以能有广泛的应用, 是因为它具有网络结构简单、非线性逼近能力强、收敛速度快以及全局收敛等优点[3]。RBF网络虽然有以上优点, 但我们也应该看到传统的RBF网络仍然存在泛化能力不足的缺点。以前人们在神经网络的学习算法方面进行了大量的研究工作, 也就是说大量的工作多集中于如何缩短学习时间、提高收敛速度和逼近精度等问题上;而在如何提高神经网络的泛化能力方面, 尚需作进一步的研究, 探讨网络泛化能力问题仍然是RBF网络的一个重要研究方向。
2.2 提高RBF神经网络的泛化能力
泛化能力是指对未知样本进行正确分类的能力, 它是衡量网络效果好坏的重要指标之一。现阶段, 提高系统泛化能力比较成熟的理论有正则化理论、统计学理论和信息熵理论等。上述提高系统泛化能力的理论虽然成熟, 但离实际应用的距离还比较大。目前, 提高系统泛化能力的研究主要集中在如何选取合适的网络规模, 设计合理的网络结构上。
吴永贤老师多年来一直从事RBF神经网络的研究, 他提出了基于RBF神经网络的局部泛化误差模型, 大大提高了RBF神经网络的泛化能力。局部泛化误差的创新点在于这个模型针对一些对评价一个分类器有真正影响的非训练样本, 计算该分类器对于这些非训练样本的泛化误差, 从而得到一个比较合理和实用的泛化误差模型。这个局部泛化误差模型的优点主要体现在它能贴近真实应用情况, 针对RBF神经网络进行评价且具有很好的理论支持。
摘要:本文重点介绍了当前有着广泛应用的BP神经网络, 对BP神经网络的局限性进行了说明, 并且给出了一些改进BP算法的实用技术。
关键词:人工神经网络,BP神经网络,RBF神经网络,改进,泛化能力
参考文献
神经网络遗传算法的系统思维特性 篇11
遗传算法则是由美国Michigan大学的 J.Holland教授于1962年提出,20世纪80年代开始掀起一股遗传算法的研究热潮至今。遗传算法是一类随机化的搜索算法模型,它模拟了达尔文的遗传选择和自然淘汰的生物进化过程。按照达尔文的进化,论,生命历程包括繁殖、变异、竞争和选择等多种复杂过程。在繁殖过程中,个体的遗传物质将复制给后代。繁殖可以理解为一种信息的传递,信息传递过程中基因的复制可以发生错误,这就产生了变异。竞争是在有限资源空间中生物个体数量持续扩张产生的,而选择则是在物种充满整个可获得空间后相互竞争的必然结果。这些相互作用的随机运行构成了生命的进化过程。遗传算法就是受到生命进化原理的启示而形成的一种寻优方法。
神经网络与遗传算法都是一种智能计算技术,是用来求解优化问题的有效途径,可以广泛地应用于自动控制、模拟识别、图象处理、地震勘探、信号处理和社会经济等众多领域中需要进行寻优计算的场合。关于探讨神经网络哲学意义的文献较多,而本文则试图从现代科学思维方式的角度来共同反思神经网络与遗传算法所给予我们的重要启示。
从神经网络和遗传算法的兴起与原理可见,这两门边缘学科的产生与发展都是与科研人员的现代科学思维方式分不开的。具体来说,二者都是运用系统思维方式进行科学思维的成功范例。
现代系统思维揭示了“系统”作为事物普遍联系的一种具体形式。整个自然界就是一个由各种事物相互联系的活生生的有机整体。由于现代系统思维方式是对马克思主义辩证整体性思维方式的继承和发展;因此,马克思、恩格斯所揭示的辩证整体性思维方式仍然是科学的正确的思维方式。恩格斯指出,世界表现为一个有机联系的统一整体,自然科学本质上是“关于过程、关于这些事物的发生和发展以及关于把这些自然过程结合为一个伟大整体的联系的科学”(《马克思恩格斯选集》第4卷,第241页)。马克思和恩格斯把人类的理论思维方式推广到了辩证思维的高度,使之成为适应当代科学技术发展的最科学的最重要的思维方式,“因为只有它才能为自然界中所发生的发展过程,为自然界中的普遍联系,为从一个研究领域到另一个的过渡提供类比,并从而提供说明方法” (《马克思恩格斯选集》第3卷,第466页)。事实上,无论是神经网络还是遗传算法,它们都是将生物学原理应用于科学研究的仿生学理论成果;而且,神经网络与遗传算法这两门技术的本身在近来也出现了相互交融的趋势。这就集中体现了世间万物实际上是处于一个普遍联系的大系统之中,连科学寻优运算的方法也可以借助于世间生灵之灵气。其实,现代科学技术发展的主要特点就是精细的分科与多学科交叉联系的辩证统一,即在微观上深入分析和在宏观上广泛综合的辩证统一。我们强调系统的大科学思维方式,其意义上在于要求人们按照科学大系统的方式进行思维,改变传统狭隘的思维方式和价值观念。
神经元网络技术 篇12
模糊控制一直是自动控制领域中的一个重要技术分支, 它的核心思想是通过对, 待分析的问题建模与分析后, 模拟人的思维模式, 进行自动控制。其最大的优点是能够将人们在实际工作过程中所形成的各种具体工程经验、控制规则加以抽象和归纳, 形成一套自动控制理论和方案。因此模糊控制相比传统的控制模式, 具有其独特的优势, 主要表现为其分析过程中, 对待解问题并不要求要有非常严格和准确的描述或建模, 允许用户在分析过程中不断对模型修改完善。这一分析特点非常适合人们对一些复杂问题的分析, 因为, 对于复杂问题, 人们的认识过程本来就是一个逐步求精, 逐步细化的一个过程。第二个优势是模糊控制理论是基于人们此前的研究经验和规则, 易于表示和控制, 这在实际应用中是的模糊控制器比较易于设计和开发, 实现的门槛较低。第三个优势是模糊控制器开发出来后, 具有较强的系统鲁棒性, 不容易被一些运行环境或意外因素所干扰和影响, 这对工业控制领域是至关重要的。也正因为如此, 模糊控制理论从其在1965年一提出来就广泛受到重视, 短短几十年的实际里面, 成为工业控制领域中一个非常有竞争力和发展前途的应用技术。
近几年来, 随着人们对自动控制原理的深入研究与发展, 人们发现模糊控制技术可以在复杂系统动态运行参数分析、模式识别、自动化应用等场合发挥重要的作用。而神经元网络则是模糊控制向智能化方向发展的一门重要技术。尤其是在工业控制方面, 通过将人工神经元网络技术和模糊控制技术相结合, 人们研究出了多种不一样的自动控制系统。并且在实际的工程应用领域发挥了重要的作用, 其中, 基于神经元网络和模糊控制理论在液压伺服系统上的英语则是非常具有代表性的一类应用, 并且该应用对于机械制造、工业控制等的技术提高有着非常现实的意义。
(二) 基于神经元网络的模糊控制原理
模糊控制的基本思想是将人们在平时工程控制中积累的经验、方法进行抽象, 将一些平时无法用定量描述的过程或技术进行形式化描述, 并给出所以涉及的变量参数定量关系。由此将一个非定量的过程或问题定量化, 明确问题之间的条件和约束关系。再设计专门的模糊控制器, 用来对前面抽象出来的规则、约束进行分析和判断, 代替传统的人工判断过程, 做出正确的控制动作。整个模糊控制的思想就是要将传统由人工分析和解决问题的思想予以规则化和确定化。使得人们已有的经验能够被快速、正确地推广应用。由于这是将一个不易于准确描述的问题进行确定, 并制定判别规则, 所以整个过程被称为模糊控制。既然模糊控制的核心思想是期望模拟人的控制过程, 因此, 在研究模糊控制的具体实现策略时, 研究者发现采用神经元网络能够活动比较好的模拟效果。人工神经元网络技术研究的初衷就是为了模拟人脑的思维过程。因此采用基于人工神经元网络的模糊控制策略是一个很好的实现策略。
模糊控制的关键是如何将一个模糊问题明确化, 并制定正确有效的判断规则。这就需要对被控制对象进行建模和分析后, 形成模糊控制的控制条件。再以此为依托, 建立人工神经元网络判别模型, 抽象出具体的判别条件和规则, 这些规则即为前面介绍的模糊控制规则。生成这些判别规则后, 实际上已经将一个模糊问题明确化了, 可以直接对控制模块发出明确控制指令。因此, 之后则是利用生成的模糊控制规则进行实际的判别及控制动作。为了防止发出的控制动作出现过大偏差, 需要对被控制对象进行监控, 即需要测量被控对象的实际动作效果是否符合预期, 如果与预期要求还有差距, 则调整神经元网络的判别条件, 使其做出的判别动作更接近于期望值。整个基于神经元网络的模糊控制原理图如图1所示。
整个模糊控制的过程中关键是如何将采集到模糊数据, 推理成规则明确的判别条件。一般而言, 在这一过程中, 首先需要对被控制对象, 如液压系统中腔油压力进行采样, 得到离散的初始采样值。根据该采样值计算控制系统中其输入条件大概数值, 由于此数值并非很确定的数值, 因此将此条件数值作为模糊输入变量。然后由模糊控制系统进行模糊推理, 形成模糊判别规则和具体的控制条件范围。此时得到的判别规则还是一个大概范围, 相当于模糊输出。最后再将模糊输出进行明确化, 形成定量的控制条件输出。
(三) 液压伺服系统结构及性能
液压伺服控制系统总体结果如图2所示。该系统主要由液压控制器、伺服信号分析模块、伺服信号去扰和放大模块、伺服控制装置、液压缸和压力传感器器等部分组成。该系统中液压控制器主要实现对液压系统进行伺服控制, 调整液压系统工作状态等功能。伺服信号分析模块则根据液压控制其的动作, 对伺服控制信号进行分析, 准备对液压系统进行相应的动作处理。不过在使用液压伺服信号进行实际的处理之前, 还需要对伺服信号进行去扰和放大, 相当与对伺服控制信号进行了过滤和信号增益, 使得其能够直接对液压伺服装置进行操作。最后通过液压伺服控制装置, 对液压缸等部件进行直接操作, 驱动液压元件进行工作。在液压元件工作时, 再通过压力传感器监测液压元件的工作状态, 并将监测到信号传会液压控制器, 进行下一轮的伺服控制动作。
液压系统伺服的性能形式化描述主要涉及到液压流量关系式和液压系统的连续工作状态关系式。液压流量关系式为:
该关系式中c1为液压流量系数;
ms为液压进油腔内压力;
Φ为液压阀实际通过流量;
x为液压阀芯偏移距离;
m为液压系统负荷。
液压系统的连续工作状态流量与液压缸关系式为:
该关系式中V为液压腔油的总体积;
L为液压腔油运行中泄漏比值;
K为液压腔油的容积模量;
A, y为液压缸的截面积和位移量;
液压阀芯偏移距离与液压腔流量关系式为:
1k为液压阀芯偏移比值, k2为液压腔流量补充比值。
(四) 基于神经元网络的液压伺服控制方案及仿真结果
基于神经元网络的液压伺服系统将液压系统中的测量到的各个参数作为神经元网络的基本输入, 各神经元同时也接受其他神经元的输入参数值。当每个神经元接收到外界的参数输入值后, 将表现为一定的变化趋势。这种趋势一直累计到一定阈值后, 将会导致神经元状态的迁移。神经元的迁移关系式则是液压伺服系统的模糊控制规则。当神经元的状态迁移到最后一层, 将进行数据的输出, 该结果即为液压伺服系统的控制结果。
基于神经元网络的液压伺服系统以控制方案通过对液压伺服系统的建模和参数化分析, 建立液压环境的参数约束关系, 在此基础上形成神经元网络的层次关系和各神经元直接的状态迁移关系。对液压系统工作过程中所测量的运行参数作为神经元网络的基本输出, 影响着神经元网络的状态迁移。通过神经元网络的控制得到液压伺服系统的控制信号, 该信号与原施加在液压系统中的控制信号做差值计算后, 得到液压伺服系统实际控制信号调整量。用该变量实现对液压系统的精确输出控制。同时, 通过液压系统的运行状态检测传感器, 采集该系统的各运行参数反馈值, 验证和校正模糊控制系统的控制精度。基于神经元网络的液压伺服系统控制方案原理图如图3所示。
在实验环境中, 本文对设计的基于神经元网络的液压伺服控制系统进行测试, 检验其控制精度。
实验中以液压系统中的进油腔液压力作为实验对象, 经过神经元网络的自我学习和模糊规则生成后, 形成了神经元网络中状态迁移的隶属函数。该函数通过液压系统系统自动的运行状态监测传感器不同调整修正后, 能够对液压系统中液压力进行动态监测和补偿, 使得进油腔液压力变化趋于稳定。如图4所示的实线, 图中的虚线则是在没有采用模糊控制方案的液压伺服系统进油腔液压力测量值。
(五) 总结
模糊控制理论的发展与应用已经有较长的历史了, 但其与人工神经元网络结合, 应用与液压伺服系统控制研究的并不多, 而该技术的研究对于提高机械制造、工业控制的自动化程度和控制精度有着重要的意义。本文研究的基于神经元网络的液压伺服系统通过对液压系统主要性能参数的建模与分析, 所设计的自动控制系统具有工作稳定、鲁棒性好、控制精度高和收敛速度快等特点。并且本文所设计的自动控制方案和技术可以推广至类似其他的液压控制领域中, 基于较好的扩展性。
摘要:通过对模糊控制理论的研究和分析后, 提出了一种基于人工神经元网络的液压伺服系统自动控制方案, 详细阐述了该液压伺服系统中模糊控制的总体框架、基本原理和组成结构。对基于人工神经元网络的控制原理和模型结构进行了分析, 结合实际的液压驱动领域中的伺服系统组成结构和功能进行了分析, 给出了详细带自反馈的智能控制系统。分析过程中重点以液压伺服系统的工作特点、性能参数作为研究主要对象。所设计的液压伺服智能控制系统进行了实验分析和仿真, 仿真结果表明, 基于人工神经元网络的液压伺服系统具有控制精度高、收敛速度快等特点, 在性能上完全达到预期设计要求。
关键词:神经元网络,模糊控制,液压,伺服控制,仿真
参考文献
[1]王锐, 赵昊阳, 张乐, 林烜, 季天晶.船用舵机电液伺服单元单神经元自适应PID控制的研究[J].齐齐哈尔大学学报:自然科学版, 2009, 25 (5) :1-4.
[2]孙希通, 王育才, 李世超, 严卫.神经网络滑模控制在位置伺服系统的应用[J].机电一体化, 2009 (7) :45-46, 50.
[3]张殿华, 冯莹莹, 骆宗安, 苏海龙, 王黎筠.BP神经网络PID控制对液压伺服控制的改进[J].钢铁研究学报, 2009, 21 (3) :59-62.
[4]王清太段毅.神经网络在某交流伺服系统建模中的应用[J].火力与指挥控制, 2008, 33 (11) :152-154.