人工神经网络测评方法(精选10篇)
人工神经网络测评方法 篇1
一、引言
近年来, 随着现代教育理论的不断发展, 研究生综合素质测评方法已经越来越受到人们的重视。研究生综合素质测评方法是多指标综合评价方法在教育科学领域中的应用, 包括指导思想、评估指标方法、统计抽样、权重确定、数据处理、神经网络训练、确定方法、统计分析、辨别真伪等若干环节和步骤, 最终把各评估对象的不同指标经过数据预处理、神经网络训练, 得出综合评价值。作为一个完整的体系, 具有重要的研究指导意义。本文以研究生综合素质为研究对象, 以神经网络为主要实现工具, 重点探讨研究生综合素质评价方法, 形成研究生综合素质评价方法的理论概念, 在深化研究生素质评价方法、完善评价技术、丰富评价实践活动等方面作进一步的探讨和研究。
二、神经网络理论
人工神经网络 (ArtificialNeuralNetwork, ANN) 是20世纪80年代之后迅速发展起来的一门新兴学科。由于它具有全息性、鲁棒性、并行性、非线性等突出的特点, 在本课题研究中, 面对着这样一个人文课题, 需要我们从大量的非线性和无规律的材料中找到其内在本质规律, 从而完成研究生综合素质测评方法的研究。但是我们知道通过问卷调查、人为加权、数理统计等传统方法, 建立一个标准的数学公式, 并以此作为研究生综合素质测评方法的基础, 必然是不准确、不客观的。因而我们提出将采用神经网络应用于研究生综合素质测评方法的研究。在人工神经网络的应用中, 绝大多数的网络模型是采用BP网络模型或它的变化形式。BP算法 (BackPropagationAlgorithm) 是BP网络的核心部分, 并体现了人工神经网络精华的部分。
BP算法的步骤可概括如下:
(1) 选定初始权值;
(2) 重复下面的过程直至收敛 (对各样本依次计算) 。
(1) 对k=1到N。
正向过程计算:计算每层各单元的Ojkl-1、netljk和yk, k=1, 2, LN
反向过程计算:对各层 (l=L-1到2) , 对每层各单元计算δljk。
(2) 修正权值。
μ为步长, 其中
三、BP神经网络分类器的建立
由神经网络理论可知, 要建立BP神经网络分类器, 首先要对神经网络分类器输入参数 (即检测参量) 进行选取, 在此本文采取对20多所大学的研究生院专家学者进行问卷调查的形式来确定系统的检测参数, 其方法是根据多年研究生评优经验初步确定五个检测参数, 由专家根据其重要性选择其中三个, 根据百分数确定输入参数。结果如表1:
由表1本文将参加活动能力、思想状况、科研成果重要性作为基于神经网络理论的研究生综合素质测评方法的检测参量。
在检测参数确定以后, 本文以2006年的某学院研究生资料作为测试及校验样本库, 抽取其中100个样本, 其中50个为测试样本, 50个为校验样本, 对其进行数据处理具体采用加权平均的方法, 例如参加活动能力:首先设定参数权值将省市级活动定以为10, 校级活动定义为6, 院级活动定义为2, 将权值与数量相乘便得到该生参加活动能力的量化值。
由于输入样本各参数在样本集中范围不同, 有的参数可能比其它的参数大得多或小得多, 为了使各类参数所起的作用大致相等, 以防止夸大某些因素的作用, 必须对样本数据进行标准化处理。数据预处理模块就是将输入数据归一化到[0, 1]之间, 标准化方法如下:
根据情况确定输入数据的最小值min (R) 和最大值max (R) , 然后按下式变换:
上式中, Xpi为第i个输入归一化值;min (Ri) 为输入的最小值;R为第i个输入的原始值;max (Ri) 为输入的最大值;P为样本号。因为0和1是响应函数的上下极限值, 不宜作为输入输出实际值来使用, 所以实际中应把输入输出限定在0.1~0.9之间。
当用神经网络作为分类器时, 根据特征提取所获得的特征向量, 确定输入层维数为M, 并且根据所需分类数确定输出层维数为N。在本系统中确定输入层维数为3, 并且根据所需分类数确定输出层维数为3, 输出为正确的分类结果, 神经网络隐层设定为1层。基于BP神经网络的分类器, 其输出误差信号可以沿原来的连接返回, 通过对各层神经元权值的修正, 使误差最小, 经反复训练以达到理想分类效果, 并用测试样本对训练好的网络进行检测。其分类如表2所示。设训练样本中的任一样本x属于第j类, 则要求在相应的第j个输出为“1”, 而其余输出为“0”, 即有:
当满足x属于j类时, yj=1;否则yj=0。
在确定好神经网络的输入输出后, 将标准化完成的输入代入神经网络分类器对其进行训练, 完成神经网络分类器的建立。
四、试验结果与分析
由2006年的某学院研究生资料所获取的50组参数作为测试输入, 用已训练好的基神经网络作为识别分类器来确定策略分类。其中50组测试数据正确识别46组, 错误2组。正确率达92%, 系统部分试验结果如表3所示。而传统的系统只能达到70%, 与之相比检测准确率提高了22%。
五、结语
本文完成了基于神经网络理论的研究生综合素质测评方法的设计, 并对基于神经网络理论的客户管理系统的算法进行了相应研究, 取得了一定的进展, 但由于该方法是一个复杂的非线性系统, 应继续应用于实践, 以一年或更长时间作为检测周期, 以验证方法的稳定可靠性。
参考文献
[1].Dai Yan, Ma Hongqing, Liu Jilin, Li Langang.A high perform-ance license plate recognition system based on the web technique.2001IEEE Proceedings on Intelligent Transportation Systems, 2001
[2].Sunghoon Kim Daechul Kim, A Robust License-plate Ex-traction Method under ComplexImage Conditions.In:The16th In-ternational Conference on Pattern Recognition, 2002
[3].阎平凡, 张长水.人工神经网络与模拟进化计算.北京:清华大学出版社, 2000
人工神经网络测评方法 篇2
利用NOMAD数据集建立了基于人工神经网络的漫射衰减系数Kd490的反演算法.该人工神经网络是3层的反向传输神经网络.其结构为输入层有4个节点,它们分别对应4个波段443,490,555,665 nm的遥感反射比,隐含层有10个节点,输出层1个节点对应于漫衰减系数Kd490.利用另一独立的现场测量数据集(COASTLOOC)印证该反演算法的`性能.结果表明,该研究建立的反演算法的性能明显好于业务化SeaWiFS算法,略好于Lee等人的半分析算法.
作 者:张亭禄 李肖霞 ZHANG Ting-Lu LI Xiao-Xia 作者单位:中国海洋大学海洋遥感研究所,海洋遥感教育部重点实验室,山东,青岛,266100刊 名:中国海洋大学学报(自然科学版) ISTIC PKU英文刊名:PERIODICAL OF OCEAN UNIVERSITY OF CHINA年,卷(期):37(4)分类号:P237关键词:漫射衰减系数 人工神经网络 反演方法
网络团购测评 篇3
红榜
糖豆网近日推出中国首家“Group Store”概念开放式免费团购平台,消费者可以持“糖豆储值卡”到其加盟商户低价享受优质服务。实际上,早在2010年,糖豆网已经在北京、上海、成都、重庆、深圳等重点城市的数千家餐饮、娱乐、休闲业商户建立合作关系,商户可以通过糖豆网自主平台进行“储值卡”团购。业内专家指出,糖豆网所推崇的“Group Store”模式,具有典型的创新元素,是对现有本地化服务电子商务概念的重度深化。
评价:糖豆网利用打折储值卡作为团购凭证,具有浓厚的中国特色,容易得到中国消费者和商家的认可。这种具备客户关系维护功能的“储值卡”,拓展了商家的视野,同时为消费者赢得更多实惠,对其他团购网站来说,具有很典型的借鉴意义。
黑榜
上海的郑小姐在“团拼网”上花200元购买了一个学车培训,得到1200元的驾校抵用券一张。凭此券,学车只需要再支付给驾校2500元即可。但驾校在郑小姐缴费后,几个月来一直无法安排其上车。虽然“团拼网”退了200元团购费,但驾校方却迟迟不退款。当郑小姐日前要求“团拼网”履行先行赔付的承诺时,“团拼网”竟然删除了郑小姐的团购订单。据“团拼网”当时的页面显示,这个团购总共销售出396份。
人工神经网络的优化方法 篇4
关键词:人工智能,神经网络,小波分析,蚁群算法,粒子群优化算法
对于人工神经网络的研究自20世纪40年代起始, 一直是科学研究的一个热门领域, 近20年来各种关于它的研究更是方兴未艾。神经网络结构独特, 处理数据方法高效, 在解决许多具体问题上得到了广泛的应用。然而, 神经网络也有其固有的缺点首先, 由于受到搜索步长的限制, 当解空间函数存在局部极小值时, 容易陷入局部极小特性;其次, 现行的学习算法收敛速度较低, 容易影响研究的进度。为了应对这两个问题, 学者们采取了多种多样的方法, 其中最为常见的便是将神经网络与其他人工智能方法相结合再加以一定的改进。本文选取了这一类方法中较有代表性的几种, 加以介绍。
1 方法介绍
1.1 小波神经网络
小波分析从傅立叶变换发展起来, 属于时频分析方法的一种, 因此, 它在时域和频域同时具有良好的局部化性质, 可将分析的重点聚焦到任意的细节, 而这正是我们所需要的特性。用小波分析局部化性质良好的优点, 去配合神经网络自学习、自适应、并行处理和高容错性的特点, 结合成为小波神经网络。
除了能够有效避免局部极小值、网络学习速度快、逼近能力强外, 小波神经网络还可以弥补神经网络对于结构构造缺乏足够理论性指导的缺点, 能够对于参数的选取做出理论性充足的指导, 有效避免某些种类的神经网络在结构设计上的盲目性。
1.2 蚁群算法与神经网络的结合
蚁群算法是一种仿生优化算法, 常被用来寻找最优路径。该算法具有强大的并行分布式计算能力、适应能力和优秀的全局寻优能力, 并非常易于与其它算法相结合。
蚁群算法使用随机生成的蚂蚁群体进行检索, 使得算法找到全局最优解的概率大大增加。在考虑到神经网络所存在的局部最优问题时, 蚁群算法舍不确定性规则而取概率规则来指导检索, 从而逃离了局部最优的陷阱。
除此之外, 因为蚁群算法是让所有蚂蚁独立地在无监督的情况下同时搜索解空间中许多点, 因此它同时还是一种高效的并行搜索算法, 与神经网络相结合能够起到锦上添花的效果。
1.3 P SO粒子群优化算法与神经网络的结合
粒子群优化算法最早是由美国的Kennedy和Eberhart教授受鸟群觅食行为的启发而提出的, 它以求解连续变量优化问题为背景, 以模拟鸟的群集智能为特征, 通过利用个体间的协作和竞争来实现对问题最优解的搜索, 具有全局优化的优点, 是一种基于群体智能的进化计算技术。
为了更好地解决所遇到的问题, 在将粒子群优化算法与神经网络结合的同时还要进行进一步的优化。动态变异粒子群优化算法可以动态改变惯性权重, 它能够使粒子扩大搜索范围, 从而降低落入局部最优解的概率, 这样就能使粒子及时远离局部最优解而继续进行全局搜索, 同时又能使粒子在全局最优解处收敛得更好。而先将原始粒子运用混沌理论处理, 继而再采用粒子群优化算法训练神经网络所得到的混沌理论下混合型PSO-BP模型在P SO进化过程中加入了混沌的思想。混沌具有随机性, 遍历性, 规律性等特点, 因此, 与其它的随机搜索算法相比, 在处理基本粒子群在算法后期易陷入局部极值的问题上, 混沌搜索更强的局部搜索能力能够很好地避免陷入局部最优, 并且在局部搜索得更细致。
1.4 基于遗传模拟退火算法优化的B P神经网络
遗传模拟退火算法是结合了模拟退火算法和遗传算法思想的一种混合智能算法, 这两者都具有优秀的数值优化方面的性能。遗传算法的原理模仿生物界优胜劣汰的进化机理, 是一种优化搜索方法。模拟退火算法源于固体的退火原理, 退火既是指在金属热加工工艺中, 在金属材料被加热到某一高温状态后再让其慢慢冷却下来的热处理过程。总体而言, 遗传模拟退火算法在基本遗传算法的编码的基础上, 运用模拟退火算法的局部寻优搜索过程来找出在目前环境下每个个体的局部最优解, 从而改善种群的总体性能。
在面临BP神经网络所长久存在的收敛速度慢、容易陷入局部最优解等问题时, 引入寻优能力较强的遗传模拟退火算法扩大网络的权值更新空间, 对BP网络在训练过程中的参数进行优化, 赋予其所得到的最优权值, 即能使优化后的BP网络具有分类精度高、不易陷入局部极值、泛化性好等优点。
1.5 混沌算法与神经网络的结合
混沌是一种行为复杂且类似随机、但存在着内在规律性的普遍的非线性现象。混沌具有许多独特的性质:随机性, 即混沌具有类似随机变量的杂乱表现;规律性, 即混沌是由确定性的迭代式产生的;遍历性, 即混沌能够不重复地历经一定范围内的所有状态。混沌具有极为丰富的时空动态, 介于随机性和确定性之间。
对于神经网络算法而言, 混沌的重要性在于它的随机性和遍历性特点。由于混沌具有上述特性, 因此将其应用到BP算法中, 就可以作为搜索过程中避免陷入局部极小的一种优化机制来提高BP算法的原有性能。如果将BP网络隐层中的少数神经元的激励函数进行优化, 使其具有混沌特性, 利用这种激励函数及其导数不存在饱和区域的特点, 就可以避免BP网络中的假饱和现象, 并且提高网络的泛化能力。克服假饱和现象的意义在于这样能减少学习的迭代次数, 大大地提高混沌神经网络的学习速度。
2 结语
网络团购测评 篇5
红榜
美团网:创造团购首个千万大单
近日,美团网联手万达影院在 44 个城市同时推出特惠月活动,上线仅 5 天,销售额突破 1255 万元,打破中国电影票团购的纪录,同时也创造了团购业的第一个“千万大单”。据了解,该电影票团购活动瞄准了贺岁档,消费者可持购买的美团券在 1 月 10 日至 3 月 10 日在万达影院低价享受高质大片。
评价:春节前后,不但大片集体扎堆上映,同时也是团购网站争抢市场的重要时机。万达影城是国内较大的电影院线,它此次选择与美团网合作,与美团网单日团购电影票销售记录经常保持在高位有较大关系。而团购业的“千万大单”,也证明即使在“冬天”,有些团购网站也可以做得很好。
黑榜
窝窝团: 岁末遭遇欠款风波
临近岁末,窝窝团却遭遇欠款风波。网络营销服务商亿玛近日在窝窝团北京总部拉起标语追讨欠款,最终导致当地公安部门介入。窝窝团随即发声明否认拖欠亿玛在线200万元广告费,并称亿玛存在作弊行为,窝窝团也已掌握了相关证据。日前,窝窝团和亿玛发表联合声明称,双方正进行磋商,并希望尽快达成一致。
评价:虽然窝窝团宣布掌握亿玛作弊的证据,并通过协商的途径解决欠款纠纷,但此场风波也让窝窝团的企业形象受到了影响。有分析人士认为,窝窝团与亿玛合作4个多月,既然已察觉亿玛作弊,就应及时提出解决办法,而不是在年底结算时“做文章”。
舆论关注榜
点评:窝窝团本周陷入欠款风波 ,并放出赴美上市的风声,因而舆论关注度攀升幅度较大,位列榜首;24券欠款风波虽仍延续,但本周势头渐弱,终于跌出舆论关注榜单。从整体看,本周舆论关注指数整体下降。
信誉榜
点评:本周QQ团升至信誉榜首位,F团和淘宝聚划算位列二、三名。与上周相比,本周信誉指数整体略降,58团购和美团网入榜,满座网和24券跌出榜单。本周投诉内容以酒店类、服装类团购居多。
服务榜
人工神经网络测评方法 篇6
现有的次同步谐振监测方法按测量信号的不同分为机械量测量和电气量测量两种测量方法。基于机械量测量的次同步谐振监测装置通常是通过在发电机轴系两端装设齿轮片的方法实现[1]。这种方法的原理是利用电磁感应原理快速测量轴系的瞬时速度和轴系的机械位移偏差,从而判断是否发生了次同步谐振[2]。
基于电气量测量的次同步谐振监测方法直接测量对象是三相瞬时电流值/三相瞬时电压值,测量信号经过处理,得到其中的次同步特征信号,将它和整定值比较,就可以做出逻辑判断,该方法优点在于结构简单、价格便宜、可靠性高[3]。本文提出的监测方法便是基于电气量测量的。
在工程实际中,扭矩是判断次同步谐振最直接的量[4],但轻易不能得到;电流是最容易得到的量,但要判断次同步谐振发生与否却要面对滤波等问题[5]。考虑到实时性的要求,测量最易获得的电流,经过处理得到最直接的判断量转矩,进而做出快速可靠的判断,应该是最理想的监测效果。
1 监测原理
电网的互补自然频率接近汽轮发电机轴系的一个扭转频率时,可能激励次同步谐振[6],在这种条件下,由于转子振荡感应的小电压可以产生大的次同步电流,该电流产生转子扭矩的振荡分量,加剧转子振荡,当该扭矩大于机械阻尼时,耦合的机电系统会经受增长的振荡[7]。
基于以上分析,扭矩振荡加剧是次同步谐振发生的重要判据。但直接监测扭矩比较困难[8],因此首先测得最易获取的电流量,经过处理,间接取得扭矩上的表现,进而判断次同步谐振是否发生。依靠人工神经网络的记忆功能和非线性映射特性是实现这种信号转变可行且可靠的手段。
ANN的输入是实时采样的电流值,训练时它是电流在故障后规定时间内的采样值。ANN的输出是与实时采样电流相对应的转矩的表现,用n个时间段上的平均值描述,训练时它是转矩在故障发生后n个时间段每个时间段上的的平均值,基于PSCAD仿真得到。最后由输出是否呈发散趋势判断次同步谐振发生与否。按上述原理组成的ANN次同步谐振监测电路示于图1。如果ANN的结构适当,算法选择可行,并用合理的样本进行充分训练,一旦给训练好的ANN加上所要监测的电流信号,那么在输出端就会实时得出其对应转矩的表现。
2 BP网络理论及其Matlab实现
BP网络是一种单向传播的多层前馈神经网络[9],BP网络具有三层或三层以上的神经网络,上下层之间实现全连接,每层神经元之间无连接,他的工作原理是输入一组学习样本,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应,接着,按照减小目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权值,最后回到输入层,随着这种误差逆的传播修正不断进行,网络对输入模式响应的正确率也不断上升[10]。
BP网络有一个非常重要的特性,即对于任何在闭区间内的一个连续函数都可以用单隐层的BP网络逼近,也就是说,一个三层BP网络就可以完成任意的n维到m维的非线性映射[11],这一点正好与文意契合,因此选择BP网络用于次同步谐振的监测。建立一个电流采样值到转矩特征值的10维到10维的映射,以此获得转矩的表现。
以此建立的BP网络,学习过程如下[12]。
首先初始化,给每个连接权值Wij、Vjt、阈值θj与γt赋予区间(-1,1)内的随机值,然后,随机选取一组输入和目标样本Pk=(a1k,a2k,…,ank)、TK=(s1k,s2k,…,spk)提供给网络。用输入样本Pk=(a1k,a2k,…,ank)、连接权Wij和阈值θj计算中间层各单元的输入SJ,然后用SJ通过传递函数计算中间层各单元的输出bj:
接着,利用中间层的输出bj、连接权Vjt和阈值γt计算输出层各单元的输出Lt,然后通过传递函数计算输出层各单元的相应Ct:
之后,利用网络目标向量Tk=(y1k,y2k,…,yqk),网络的实际输出Ct,计算输出层的各单元一般化误差dtk:
利用连接权Vjt、输出层的一般化误差dt和中间层的输出bj计算中间层各单元的一般化误差ejk:
结合输出层各单元的一般化误差dtk与中间层各单元输出bj来修正连接权Vjt和阈值γt:
已算得中间层各单元的一般化误差ejk,联合输入层各单元的输入Pk=(a1,a2,…,an)来修正连接权Wij和阈值θj:
随机选取下一个学习样本向量提供给网络,直到m个训练样本训练完毕。之后重新从m个学习样本中随机选取一组输入和目标样本,返回网络测试,直到网络全局误差E小于预先设定的一个极小值,即网络收敛[13]。
通常,经过训练的网络还应该进行性能测试。测试的方法就是选择测试样本向量,将其提供给网络,检验网络对其分类的正确性[14]。这在接下来的仿真研究中会作详细描述。
BP网络的构造及训练经由Matlab软件实现,其神经网络工具箱对BP网络有完整的配置,以学习算法为例,普通的BP网络算法是最速下降法,对应的训练函数为“traingd”[15]。但在本例中,考虑到收敛速度和占用存储空间的大小,经理论和实践证明,改进算法——SCG算法,具有更突出的优势,所以应选择其对应的训练函数“traincgf”。
3 训练样本的形成
次同步谐振发生时,电流的表现因系统的不同和故障的不同而千差万别。为了使检测能取得较高的精确度,实现对次同步谐振的实时监控,必须使得样本尽量完备。通过PSCAD软件,对系统可能发生的故障逐一仿真,从仿真结果中筛选出会诱发次同步谐振的系统故障,进而提取该故障下的数据形成样本,具体操作步骤如下:
(1)故障发生时刻起,对电流进行采样,采样周期为2 ms,采样时间为0.02 s,得到10个电流采样值,令为ai(i=1,2,3,…,10)。
(2)对仿真得到的振荡发散的转矩进行提取,从故障发生时到故障发生后5s这段时间,以0.5 s为步长,将其分为10段,令为p(p=1,2,3,…,10),每段以0.05 s为周期进行采样,分别得到10个采样值,令为bpq(q=1,2,3,…,10)。
(3)计算作为每个时间段转矩的特征值,其中p=1,2,3,…,10。bp可以表现转矩的变化趋势。
(4)最后,建立ai——bp的非线性映射,形成一个训练样本。
以此类推,其他谐振样本按上述操作步骤从相应的系统状态下提取数据,逐一形成。
4 仿真研究
本文在PSCAD/EMTDC平台上建立IEEE第一标准测试系统模型,进行次同步谐振监测方法的仿真研究。被测试的系统结构如图2所示。
在电路参数及串补度固定的情况下,本例会出现次同步谐振的系统状态包括单相短路,两相短路,两相接地短路及三相短路,为了通过ANN精确可靠地对次同步进行监测,需要对此四种情形分别形成样本。
由于在这四种状态下,发电机质块与励磁机质块连接轴的扭振转矩GEN_EX均呈发散趋势,因此提取GEN_EX的表现作为判断依据。设定系统故障发生在3 s时,则采样时间为3~8 s,然后按步骤(1)~(4)逐一形成训练样本。
最后投入BP网络按式(1)~(6)采用函数“traincgf”进行训练,训练结果见图3。图中曲线是平均误差ξ随训练次数(epochs)增加时的变化曲线,由图可见,平均误差是逐渐减小的。经过400次迭代后,误差大约是8.3×10-6。而如果采用“traingd”函数,无论多少次训练都达不到此精度。
由此可见,BP网络的记忆能力非常强大,其实现的非线性映射能达到极高的精度。下面对所建立的神经网络的监测效果进行测试。
以三相短路为例,待采样的电流波形见图4,取出采样区间(3~3.02 s)的电流,如图5所示,以2 ms为采样周期,得到10个采样电流值,记录在表1中。
将采样值输入训练好的网络,得到试验结果即网络输出,统计在表2中。
从输出结果上看,扭矩振荡发散,而事实上也正是如此,扭矩GEN_EX的表现如图6所示,由此可见,作为扭矩的特征值bp,其变化趋势与转矩振荡加剧的趋势是高度契合的,因此特征值bp的变化趋势是可以作为次同步谐振发生与否的判断依据的。基于输出结果,可以判断此时IEEE第一标准测试系统发生了次同步谐振。
仿真研究的结果表明,采用本文提出的基于人工神经网络的次同步谐振监测方法,能达到快速、精确、可靠的监测效果。
5 结论
人工神经网络测评方法 篇7
光学镀膜对现代光学而言非常重要,广泛地应用在光学、材料、生物、宇航、医学等各个领域.膜系的光学特性(如透射率T和反射率R)是由膜系的结构参数决定的.为了高质量的光学膜系的制备,尽可能地确定其结构参数是非常必要的[1]。
光学薄膜的特性主要由薄膜材料,透射率,吸收率,膜厚(光学厚度),基底材料等决定。根据上述条件可以推导出薄膜的光学特性。但是如果要根据复杂的要求设计一个膜系则是相当困难的。
膜系设计最早使用的是试凑法,图解法,以后又逐渐发展出各种解析设计方法[2]。由于膜系设计中各个分量之间的关系,难以用直观的公式表示,因此膜系设计向优化设计方向发展是十分必要的也是必然的[3]。
膜系设计的方法主要有单纯形算法,模拟退火算法,Needles针形法,GA遗传算法。单纯形法属于一种局部优化方法,其最终结果的好坏大部分取决于初始膜系的设计。模拟退火方法虽然能全局优化,但是也有过程不易控制的缺点[4]。Needles针形法是一种自动合成方法,可以从单层膜系进行优化,降低了设计难度和专业性,但是也会陷入局部极值的问题。而遗传算法也有无法自动增加层数的问题。
利用神经网络设计膜系是一种可行的方法,并且具有灵活性等特征。可以根据不同的要求更改目标评价函数,所以能很方便的设计不同种类的膜系。本文主要分成以下几个部分:首先从原理上介绍膜系的设计以及关键的函数,然后介绍神经网络应用于膜系设计的方法,最后利用神经网路设计膜系,并评估其效果。
1 薄膜设计原理
首先导入相位厚度
折射角θj由折射定理所决定。
导纳ηj由下式给定:
单一界面的反射和折射,根据边界条件可写出:
多层界面终K和K+1层应用边界条件得到:
由于各界面切向分量连续,故有:
经过连续线性变换,由Hk+1/EK+1=ηK+1可以得到矩阵方程式:
此时特征矩阵为:
则可以得出能量反射率是:
透射率是:
对于有吸收性质的薄膜,只要将折射系数n更换为n-ik,带入上述的公式中,即可得到吸收薄膜的公式。
2 评价函数
设计光学多层薄膜是通过讨论给定结构参数下薄膜系统的反射率与理想状态的目标反射率之间的偏差,把薄膜设计问题归结为选取结构参数,使得这种偏差达到极小的问题[5]。本文提出的评价函数如下所示:
式(12)评价膜系的整体透过率,式(13)评价膜系的平整程度。可以将两式结合成一个公式,对膜系做一次评价,即:
α和β取决于具体设计对于膜系的要求。评价结果的大小决定了该膜系的性质。
3 人工神经网络训练(ANN)
ANN是对人类大脑的一种物理结构上的模拟,即以计算机仿真的方法,从物理结构上模拟人脑,以使系统具有人脑的某些智能[6]。用遗传算法来设计和训练人工神经网络已被证实能有效地解决很多问题[7]。神经网络的主要特点是对信息的处理具有自组织、自学习,比纳与联想、综合和推广。神经网络的神经元之间的连接强度用权值大小来表示,这种权值可以通过对训练样本的学习而不断变化,而且随着训练样本量的增加和反复学习,这些神经元之间的连接强度会不断增加,从而提高神经元对这些特征的反映灵敏度[8]。
神经网络主要利用输入输出训练样本集进行训练学习,然后每一次学习完后考察学习结果。如果误差范围可以接受,结束训练,如果误差不能接受,则继续学习,直到训练出可以接受的结果。
随机选取不同材料不同厚度的输入样本,计算出对应的评价函数,以得到输出样本。然后将样本送入人工神经网络训练,直到符合误差或者到达训练次数。最后对一组样本检验,验证人工神经网络的误差。
不同数目的训练样本对于训练结果影响很大。如果样本过少,则不能得到好的结果。如果样本过多,则白白浪费了训练时间,浪费资源。
神经网络的网络拓扑结构图1所示。
人工神经网络的建立步骤如下:
(1)建立BP网络结构和输入样本网络结构图,包括层数和每层节点数。并且初始化权值和阈值。
(2)由输入层向输出层向前计算网络输出。
(3)计算误差,计算公式如下:
(4)权值的修正。权值的修正是人工神经网络的自学习部分。标准BP算法本质上是一种梯度向下寻优算法,因此在学习过程中会发生振荡,收敛缓慢。所以需要选择学习因子,过大或者过小都会影响收敛的速度。
(5)输入样本,反复以上步骤,最后到达所需的精度。
流程图如图2所示。
1974年Werbos P在其博士论文中提出了第一个适合多层网络的学习算法,20世纪80年代中期,该算法应用于神经网络的研究,逐渐成为迄今为止最著名的多层网络学习算法——BP算法,由此算法训练的神经网络称为BP神经网络。在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别、数据压缩等,80%~90%的人工神经网络是采用BP网络或者它的变化形式,它也是前馈网络的核心部分,体现了人工神经网络最精华的部分。
BP网络的设计主要包括输入层、隐层、输出层及各层之间的传输函数几个方面。
网络层数:
大多数通用的神经网络都预先确定了网络层数,而BP网络可以包含不同的隐层。但理论上,在不限制隐层节点数的情况下,两层的BP网络可以实现任意非线性的映射。
输入层的节点数:
输入层起缓冲存储器的作用,他接受外部的输入数据,因此其节点数取决于输入矢量的维数。
输出层的节点数:
输出层的节点数取决于两个方面,输出数据类型和表示该类型所需的数据大小。本算法中,输出层的节点数取决于输入层的节点数的维数。
隐层的节点数:
一个具有无限隐层节点的两层BP网络可以实现任意从输入到输出的非线性映射。但对于有限输入模式到输出模式的映射,并不需要无限隐层节点,这就涉及到如何选择隐层节点数的问题,而这一问题的复杂性,使得至今为止,尚未找到一个很好的解析式,隐层节点数往往根据前人设计所得的经验和自己设计的具体情况来确定。一般认为,隐层节点数与求解问题的要求、数目输出单元数多少都有直接的关系。另外,隐层节点数太多会导致学习时间过长;而隐层节点数太少,容错性差,识别未经学习的样本能力低,所以必须综合多方面的因素进行设计。
传递函数:
BP网络中通常使用S(sigmoid)型函数:
本文根据设计了多种训练方式,采用不同的训练样本,分别为100个,200个,250个,300个,350个,400个,800个,1 000个,1 500个,4 000个。点数越多计算的速度越慢,但是精度也就越高。因此我们要在精度与速度之间去一个权衡,得到一个可以满意的训练网络。
膜系设计见表1和表2。
只计算可见光范围内,即380~780 nm范围内的光线。
如果训练中达到要求(goal)精度,那么将停止训练。如果到达训练次数上限依旧没有达到精度,也会停止训练。如果训练次数达到一定数值(max-fail),依旧没有增加性能,那么也会停止训练。在整个训练过程中,没有发现由于无法达到进度而到达训练次数停止训练的情况。
图3为不同样本数情况下,训练所需要的时间,可见点数越多,训练越慢。
随着样本数量的增加,通过训练所达到同样精度的时间也在增加,而训练的样本数的增加也导致了采集样本时候所需要的时间的增加,所以样本数据不要超过2 000为最好。
下面讨论关于训练出来的网络的精确度。比较在不同样本数目下,相同训练条件中所得到的精度之间的差异。通过比较预测误差的方差,来评价神经网络的精度,如图4所示。
图5、图6和图7比较了TFCalc软件和神经网络软件的设计结果,可见尽管TFCalc的设计在平均值上优于神经网络的设计,但是神经网络的评价函数加入了方差的控制,所以在平整度上神经网络明显优于TFCalc的设计。
4 结 论
利用神经网络设计膜系是一种可行的方法,并且具有灵活性等特征。可以根据不同的要求更改目标评价函数,所以能很方便的设计不同种类的膜系。初始结构可以由计算机随机产生,膜系的层数、膜材和膜厚由算法自动优化选择,搜索到的是全局最优解。神经网络也可以用于设计其他膜系,如干涉滤光片,只不过要选择不同的参量作为评价函数,比如高反膜的评价函数要用反射率。选择的评价函数对膜系结构的微小变化敏感时,用神经网络设计才能获得好的结果和高的效率。
参考文献
[1]Zhou Jian,Lin Yongchang.A new method of optical coatingsdesign-needle method[J].Acta Optica Sinica,1997,(10):1445-1449.
[2]林永昌,卢维强.光学薄膜原理[M].北京:国防工业出版社,1990.
[3]Liu Mengxia,Qiang xilin.Method and developing trend in op-tical thin film design[J].Journal of Xi'An Institute of Tech-nology 2000,20(3):194-199.
[4]Fan Shuwei,Zhang Xingzhi.Study of the global optimalmethod self-adaptation simulated annealing-genetic algorithm[J].Optics and Precision Engineering,1999,7(4):234-239.
[5]Wang xia,Wang xiaodong,Lv kui.Optical thin film optimiza-tion design using adaptive real-coded genetic algorithm[J].Chinese Jounral of Quantum Electronics,2004,21(1):1271-1275.
[6]文绍纯,罗飞,付连续.基于遗传算法的人工神经网络的应用综述[J].自动化与仪器仪表,2001,(6):435-439.
[7]Zhang Q W,Wang C.Using genetic algorithm to optimize ar-tificial neural network:A case study on earthquake pre-diction[c].Genetic and Evolutionary Computing,2008:128-131.
人工神经网络测评方法 篇8
数据已成为信息时代的重要资源,数据被采集后在企业之间或企业内部的信息系统中共享,数据量的增加导致高效的基于计算机的分析方法的出现,如智能数据分析,它是指运用统计学、模式识别、机器学习、数据抽象等数据分析工具从数据中发现知识的分析方法。智能数据分析的目的是直接或间接地提高工作效率,在实际使用中充当智能化助手的角色,使工作人员在恰当的时间拥有恰当的信息,帮助他们在有限的时间内作出正确的决定。
人工神经网络是模拟人类的形象直觉思维,在生物神经网络研究的基础上,根据生物神经元和神经网络的特点,通过简化、归纳、提炼总结出来的一类并行处理网络,利用其非线性映射的思想和并行处理的方法,用神经网络本身的结构来表达输入和输出的关联知识。起初,神经网络在智能数据分析中的应用并未被看好,其主要原因是神经网络具有结构复杂、可解释性差、训练时间长等缺陷。但其对噪声数据的高承受能力和低错误率的优点,以及各种网络训练算法的陆续提出与优化,尤其是各种网络剪枝算法和规则抽取算法的不断提出与完善,使得神经网络在智能数据分析中的应用越来越为广大使用者所青睐。用于智能数据分析的方法有很多,而本文着重对基于神经网络的数据分析进行了详细的研究。
2 几种智能数据分析方法的比较
2.1 决策树
一种用树枝状展现数据受各变量的影响情况的分析预测模型,根据对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上对数据进行分类的一种方法。首先通过一批已知的训练数据建立一棵决策树,然后采用建好的决策树对数据进行预测。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,缺点是难于处理关系复杂的数据。常用的方法有分类及回归树法、双方自动交互探测法等。其中分类树主要用于数据记录的标记和归类,回归树主要用于估计目标变量的数值[1]。
2.2 相关规则
是一种简单而实用的关联分析规则,它描述一个事物中某些属性同时出现的规律和模式,由一连串的“如果——则”的逻辑规则对资料进行细分的技术。关联规则一般应用在事物数据库中,其中每个事物都由一个记录集合组成。这种事物数据库通常都包括极为庞大的数据,因此当前的关联规则发现技巧正努力根据基于一定考虑的记录支持度来削减搜索空间。其中的支持度是一种基于用户事物在事物日志中出现的数目的度量。
2.3 遗传算法(Genetic Algorithms)
是一种优化技术,它利用生物进化的概念进行问题搜索,应用算法的适应函数来决定搜索的方向,运用一些拟生物化的人工运算过程,如:选择、复制、交配和突变等进行一代代的周而复始的演化,最终达到优化的目的。它具有强固形与求值空间的独立性。强固形使问题的限制条件降到最低,并大幅度提高系统的容错能力;而求值空间的独立性则使遗传算法的设计单一化,且适用于多种不同性质、领域的问题。
2.4 粗糙集(Rough Sets)
它将知识理解为对数据的划分,每一被划分的集合称为概念,主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来近似刻划处理。利用粗糙集可以解决的问题包括数据的简化,数据相关性的发现,数据意义的评估,由数据产生的决策算法,数据中范式的发现以及因果关系的发现。
2.5 模糊数学方法
客观事物往往具有某种不确定性。系统的复杂性越高,则其精确性越低,也就意味着模糊性越强。在数据挖掘过程中,利用模糊数学方法对实际问题进行模糊评判、模糊决策、模糊识别和模糊聚类,往往能够取得更好的效果。
上述方法存在的不足主要表现在:① 用户驱动,用户参与过多;② 处理变量单一,不能处理定性变量和复杂数据,如非线性数据和多媒体数据;③发现的事实或规则是以查询为主要目的,对预测和决策影响不大。
3 人工神经网络技术
3.1 神经网络概述
神经网络最早由心理学家和神经生物学家提出,旨在寻求开发和测试神经的计算模拟。由于神经网络在解决复杂问题时能够提供一种相对简单的方法,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类,即以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以Hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART模型、Kohonen模型为代表的,用于聚类的自组织映射方法。
神经网络的学习方式有三种[2]:
(1)监督学习。这种学习方式需要外界存在一个“教师”,它可对给定一组输入提供应有的输出结果(正确答案),学习系统(神经网络)可根据已知输出与实际输出之间的差值(误差信号)来调节系统参数。
(2)非监督学习。这种学习不存在外部教师,学习系统完全按照环境提供数据的某些统计规律来调节自身参数或结构(这是一种自组织过程),以表示出外部输入的某种固有特性(如聚类或某种统计上的分布特性)。
(3)再励学习。这种学习介于上述两种情况之间,外部环境对系统输出结果只给出评价信息(奖或惩)而不是给出正确答案。学习系统通过强化那些受奖动作来改善自身的性能。
神经网络常用的学习算法[3]:
(1)误差纠正学习。该学习的最终目的是使某一基于误差信号的目标函数达到最小,以使网络中每一输出单元的实际输出在某种统计意义上逼近应有输出。一旦选定了目标函数形式,误差纠正学习就变成了一个典型的最优化问题,最常用的目标函数是均方误差判据。
(2)Hebb学习。由神经心理学家Hebb提出的学习规则可归纳为“当某一突触(连接)两端的神经元同步激活(同为激活或同为抑制)时,该连接的强度应增强,反之应减弱”。
(3)竞争学习。在竞争学习时,网络各输出单元互相竞争,最后达到只有一个最强者激活,最常见的一种情况是输出神经元之间有测向抑制性连接,这样原来输出单元中如有某一单元较强,则它将获胜并抑制其它单元,最后只有此强者处于激活状态。
3.2 基于神经网络的智能数据分析过程
如下图所示,基于神经网络的智能数据分析过程由数据准备、规则抽取和规则评估三个阶段组成[4]。
(1)数据准备。
拥有数据是进行数据挖掘的必要条件,但仅仅拥有数据还是不够的。因此很有必要在实施数据挖掘之前进行数据准备。所谓数据准备就是对被挖掘的数据进行定义、处理和表示,以使它适应于特定的数据挖掘方法。数据准备是数据挖掘过程中的第一个重要步骤,在整个数据挖掘过程中起着举足轻重的作用。它主要包括数据选择、数据预处理和数据表示等。
(2)规则抽取。
根据设计思想的不同,目前的方法大致可以分成两大类:
一是基于结构分析的神经网络规则抽取方法。这种方法把规则抽取视为一个搜索过程。其基本思想是把已训练好的神经网络结构映射成对应的规则。由于搜索过程的计算复杂度和神经网络输入分量之间呈指数级关系,当输入分量很多时,会出现组合爆炸。因此,此类算法一般采用剪枝聚类等方法来减少网络中的连接以降低计算复杂度。
二是基于性能分析的神经网络规则抽取方法。与上述基于结构分析的方法不同。基于性能分析的神经网络规则抽取方法并不对神经网络结构进行分析和搜索。而是把神经网络作为一个整体来处理,这类方法更注重的是抽取出的规则在功能上对网络的重现能力,即产生一组可以替代原网络的规则。
(3)规则评估。
尽管规则评估的目标依赖于各个具体的应用,但总体说来,可以根据以下目标来评估规则[5]:①寻找抽取规则的最优顺序,使得它在给定的数据集上取得最好的效果;②测试被抽取规则的正确性;③检测在神经网络中还有多少知识未被抽取出来;④检测被抽取出来的规则与训练好的神经网络之间存在的不一致性的地方。
4 结束语
目前,在基于神经网络的数据分析的研究中仍然存在着很多有待解决的问题。首先,基于神经网络的数据分析主要是希望借助神经网络的非线性处理能力和连续属性处理能力,这一点在处理回归估计问题时尤为明显。遗憾的是,目前神经网络规则抽取方面的研究几乎都是针对分类器型网络进行的,回归估计型神经网络的规则抽取几乎是一片空白。如果能在后者的研究上取得突破,将极大地促进基于神经网络的数据挖掘的发展。其次,神经网络规则抽取的工作主要着重于提高抽取出的规则对网络的保真度,即规则是否可以真实地再现网络的功能。然而,在面向数据分析的应用中,规则的可理解性往往更加重要。在一些实际领域中,需要牺牲一定的保真度以获取更好的可理解性。因此,如何在规则的可理解性与保真度之间达成折衷,将是一个有待研究的课题。第三,目前的神经网络模型大多不具备增量学习能力。在训练数据发生变动时,需要用整个训练集重新对网络进行训练。这不仅无法满足数据库中经常发生的增、删、改处理,还使得基于神经网络的数据分析系统必须保存一个极大的训练集。如果神经网络模型具有增量学习能力,则可以较好地解决这些问题。
参考文献
[1]姚卫新,黄丽华.智能数据分析中的异常数据管理[J].科技导报,2004;7:54-56.
[2]张乃尧,阎平凡.神经网络与模糊控制[M].第1版,北京:清华大学出版社,1998:18-19.
[3]涂占新.数据挖掘方法及其应用展望[J].中南财经政法大学学报,2003;2:117-120.
[4]刘钊,蒋良孝.基于神经网络的数据挖掘研究[J].计算机工程与应用,2004;3:172-173.
人工神经网络测评方法 篇9
随着西方发达国家股票市场的兴起, 随着时代的不断进步和变迁, 股票市场逐渐拓展至发展中国家和一些相对落后的国家。对于股票价格进行时间序列预测无论对于投资者, 政策分析者等等都有非常重要的作用, 然而股票价格是一个复杂多变, 难以描述的序列, 影响因素繁杂且有些难以量化, 因此至今学者们仍在探索能更好的描述它的方法[1]。
近几年计算智能技术在时间序列领域逐渐流行, 作为一种新兴的信息处理技术, 计算智能技术现在已经成为重要的分析与预测工具。计算智能技术有普通统计方法所不能比拟的优点, 它的预测更加精准, 并且具有自学习、自组织、自适应的特征和简单、通用、鲁棒性强、适于并行处理的优点[2]。
在上面提到的计算智能技术中, 最有名的当属人工神经网络, 此模型在过去的二十年间有着很快的发展, 因为其在认知的输入和输出的映射的表现公认的非常有效, 甚至在面对一些难以判断的不确切输入输出关系时, 仍表现出很好的拟合行, 因此现在成为了时间序列非线性方法中最常被使用的到模型, 当然也成为了股票价格时间序列预测模型中较为有效的并常被使用的模型之一[3]。
不论是基于哪一种数学模型, 现有的拟合方法往往过于追求样本内的拟合精度, 而忽略了拟合的模型在样本外的表现。在实际应用中, 往往需要更加精确的样本外拟合度。因此本文基于样本外拟合的精度, 分别从长期和短期两个时间维度考虑了神经网络模型预测的表现及其鲁棒性, 得到了一些关于神经网络模型的结论。
二、研究模型介绍
本文将要对智能计算方法中的人工神经网络模型进行分析研究, 下面就该模型的算法进行简单介绍。
神经网络是由大量的神经元按一定的拓扑结构和学习调整方法所构成的。神经元一般表现为一个多输入、单输出的非线性器件。
神经网络代表了一种新的方法体系, 所以它能在实际的应用中表现一些独特的功能[6、8]。一般来说, 神经网络具有如下的四个基本的特点:强大的学习能力;分布式存储信息;并行性, 即并行的计算能力, 可以处理快速实时的信息;非线性, 即可以很好地模拟非线性系统。
神经网络可以通过自身强大的学习能力, 来获取知识, 神经网络性能的改善是随着时间一步步通过某种事先定义的量度来调整自身的参数的 (比如权值) 。一般来说, 神经网络主要有监督学习、无监督学习、强化学习三种。
三、数据选取
在众多关于中国股票市场有效性的研究结果表明, 中国的股票市场是一种渐进有效的市场或是一种半强有效市场, 这样股票价格基本上反映过去信息和公开信息。正是在如此的假设下, 我们运用统计学的方法, 从股票指数 (股票价格加权和) 入手来分析和预测股票市场。选择从1998年12月23号开始的上证综指收盘运用神经网络模型进行了固定样本内模型和滚动样本内模型下的短期和长期的拟合预测。
模型的拟合效果均运用fit=[1-norm (y-yhat) /norm (y-meancy) ]×100计算得出, 其中y代表实际的上证指数数值, yhat代表预测模型输出的数值结果。
四、实证结果
(一) 固定模型下的神经网络模型拟合分析
对从1998年12月23号开始的上证指数收盘价运用MATLAB进行神经网络模型短期拟合预测。首先我们选取前1000个点进行样本内的拟合, 对后20个点进行短期预测, 并依此以步长20向前滚动, 共二十期。
应用MATLAB进行求解, 对样本内1000个点进行拟合, 并按照拟合得到的模型对后20期以20为步长, 向后滚动预测。
同样, 我们选取前1000个点进行样本内的拟合, 对后100个点 (相当于5个月左右的数据) 进行长期预测, 并依此以步长100向前滚动, 共二十期。
并按照短期分析中计算出的公式对后20期以100为步长, 向后滚动预测, 得到的拟合结果如下:
神经网络的拟合度在短期内十分精准, 可以到了80%以上, 有的甚至达到了95%以上, 并且未出现50%以下的拟合度, 然而长期来看, 拟合度的差别非常大, 对于趋势的判断有时很准有时完全颠倒, 预测拟合度的跨度从90%到-90%。波动性非常大, 可见神经网络对于达到一定长度的长期数据 (五年以上) 拟合的鲁棒性很差, 长期来看无法适应不断变化的股市大盘。
(二) 滚动模型下的神经网络模型拟合分析
考虑到固定模型下, 样本和模型的选取都具有偶然性, 下面章节中会将样本内的数据随着样本外预测数据的向前推移, 同步向前推移。因此每一次新的拟合都会有一个参数的更新, 从而形成新的模型, 并用的新的模型对样本外数据进行预测, 得到的拟合结果如下:
短期内, 神经网络模型拟合度仍然十分精准, 可以到了80%以上, 然而长期来看, 由于样本内数据的不断更新, 因此样本外的拟合精度十分稳定, 表现优异, 平均拟合值达到了93%除了一项为60%多, 其他均达到了80%以上。说明在半年的长度范围内, 人工神经网络的拟合度很好, 拟合可靠性较高。
五、结论
本文通过对上证指数1998年后的数据使用人工神经网络进行了短期长期的滚动预测。发现在短期内, 神经网络模型的拟合效果一直很好。而在长期来看, 人工神经网络, 对5年内的数据拟合度很高, 然而更长的时间段内鲁棒性不高, 拟合度下降很快。
摘要:目前对股票价格的分析和预测尽管有大量的分析工具和模型, 本文将要讨论的是近几年非常流行的计算智能技术, 作为对人类智能的模拟, 作为一种新兴的信息处理技术, 计算智能技术现在已经成为重要的分析与预测工具。计算智能技术有普通统计方法所不能比拟的优点, 它的预测更加精准, 并且具有自学习、自组织、自适应的特征和简单、通用、鲁棒性强、适于并行处理的优点。在计算智能技术中, 最有名的当属人工神经网络, 此模型在过去的二十年间有着很快的发展, 因为其在认知的输入和输出的映射的表现公认的非常有效, 甚至在面对一些难以判断的不确切输入输出关系时, 仍表现出很好的拟合性, 因此现在成为了时间序列非线性方法中最常被使用的到模型, 本文将会采用该模型对上证指数进行实证性分析。
关键词:上证指数,人工神经网络,拟合度,实证分析
参考文献
[1]顾岚.时间序列分析预测与控制[M].北京:中国统计出版社.1997.
[2]KuanC.M and White, H.Artifieial Neural Networks:AN econometric Perspective (with discussion) [J].Econometrics Reviews, 1994, (13) :l-143.
人工神经网络测评方法 篇10
葡萄干营养价值丰富,美味可口,受到全国人民青睐。目前,葡萄干的品质检测主要分为外部和内部检测两类,内部检测主要是对其味道、糖分、水分的检测,检测技术已经比较成熟;外部检测方法主要是对颜色、形状、大小及表面缺陷的检测,检测技术不够成熟,仍需进一步研究,如何对大批量葡萄干进行实时检测,成为研究的关键,迅速有效的检测方法对我国的葡萄干进出口贸易有促进作用。目前农产品识别、分级检测技术日趋成熟,检测方法多种多样,其中神经网络技术应用较为广泛[1,2,3],数据挖掘算法[4]、基于稀疏表示的分类算法[5]也在各类识别中应用,识别精度成为比较各种算法优劣的关键。
VPMCD方法是一种基于变量预测模型的模式识别方法,它认为不同类别的系统中,全部或者部分特征之间存在一定的内在关系,根据这种关系建立数学模型,采集研究对象的数据,对模型参数进行训练可以得到预测模型,利用预测模型可以对各类对象进行预测分类[6]。目前,这种方法在滚动轴承故障诊断、机械故障诊断、齿轮故障诊断及其他的一些故障诊断中应用较为广泛[7,8,9,10],在农产品等级检测中尚未应用。试验中尝试采用VPMCD方法对葡萄干进行等级检测。
1 研究对象与方法
1.1 研究对象
以新疆绿无核葡萄干作为研究对象,分别选取三个等级(一级、二级、三级)的葡萄干各100粒,其中,每个等级各40粒作为训练样本,剩余60粒作为测试样本。
1.2 研究方法
设计适宜的照明装置,选择合适的照明条件,采集三个等级葡萄干图像后进行图像预处理,提取出单个葡萄干图像,图1为采集的原始一级葡萄干图像,进行图像去噪、背景分割、轮廓跟踪后,提取出单个葡萄干图像。对所有样本的单个葡萄干图像,提取颜色及形状特征,编写人工神经网络算法进行试验,选择识别率较高的特征组合作为识别参数,利用VPMCD方法进行等级测试。研究流程如图2所示。
2 葡萄干特征提取
2.1 颜色特征
颜色是葡萄干等级识别的最主要特征,一级葡萄干颜色碧绿且着色均匀,试验前需要选择合适的颜色模型,提取葡萄干的颜色特征。HSI颜色模型以人眼的视觉特征为基础,使用色调(H)、饱和度(S)、亮度(I)来表示颜色,与人观察颜色的感觉最相似,因此,在获取了葡萄干的24位的真彩色图像后,利用转换公式,需将RGB模型转换为HSI颜色模型,提取H,S,I三个颜色特征。
2.2 形状特征
形状特征能够反映出葡萄干的大小、外形特征,一级葡萄干往往粒大且饱满,提取合适的形状特征也是分级的关键。试验中,提取了单个葡萄干图像的周长(P)、面积(A)、长轴(L)、短轴(M)、长宽比(W)、圆形度(C)六个基本形状特征。
提取了葡萄干样本的特征数据后,应初步筛选识别特征,由表1中三个等级各40粒葡萄干样本的特征均值可以看出,在长宽比、圆形度特征上,三个等级数据差别甚微,原因在于同品种的葡萄晾制的葡萄干外形较为相似,因此,这两个特征不能作为识别的有效特征,初步选定色调(H)、饱和度(S)、亮度(I)、周长(P)、面积(A)、长度(L)、宽度(M)七个特征参数参与人工神经网络训练识别。
葡萄干样本的各个特征物理意义和取值范围不同,需进行数值归一化处理,使其处于同一量纲之中,试验中采用极值归一化方法处理。设采集样本中有N个葡萄干图像,特征向量的维数为I,第n个图像的第i个特征值为ln,i,将向量li中每个元素的数值归一化到[0,1]范围。极值归一化公式为:
式中:min(li)为采集样本中图像的第i个特征向量li的最小值;max(li)为采集样本中图像的第i个特征向量li的最大值。
3 采用人工神经网络进行特征优选
人工神经网络是模拟生物神经网络进行信息处理的一种数学模型。试验中,采用BP神经网络模型,利用Matlab编写程序,构建了具有一个隐含层的三层网络模型,输入层节点数采用特征参数个数,初步选定为7个,输出节点为3个,对应3个等级的葡萄干,初始学习速率为0.01,目标误差采用0.001。采用双曲正切函数tansig作为隐含层激活函数、对数S型激活函数logsig作为输出层激活函数,网络输出值在0和1之间。
(1)确定识别率较高的网络结构。根据对测试样本的识别准确率,选取识别率较高的网络结构,如表2所示为各种网络结构下样本的识别率。由表2可以看出,输入层为7、隐含层为17、输出层为3时识别率较高,且训练速度也相对较快。
(2)选取最优特征组合。各个特征在识别中所起作用不同,特征少、识别效率高是算法追求的目标。试验中,在确定了网络结构后,通过对不同特征参数组合下识别率的比较,选取最佳特征组合。不同参数组合识别率的比较如表3所示。可以看出,使用色度(H)、面积(A)、长度(L)、宽度(M)4个特征组合识别率最高,训练速度快,因此选择这4个特征作为最终识别特征。
4 基于VPMCD的等级检测算法
在农产品的等级检测中,神经网络、支持向量机(SVM)等检测识别方法没有考虑到对象特征间的相互内在关系。VPMCD方法根据这种关系,对不同类别对象建立不同的数学模型,利用这些数学模型对测试样本特征值进行预测,根据预测结果对农产品进行分级。因此,在处理非线性分类问题时,VPMCD方法避免了神经网络的迭代过程,大大减少了计算量和训练时间。
试验中,对每个训练样本提取色度、面积、长度、宽度4个特征值,根据特征值之间的非线性特性,选用二次交互模型QI[11],建立预测模型;提取每个测试样本特征向量作为测试数据。利用VPMCD方法进行等级检测分为模型训练和模型分级两个过程,具体如下:
(1)模型训练过程:
(1)在三个等级的葡萄干中,共收集n个训练样本(n=120),每一等级分别有nk(k=1,2,3)个样本。
(2)提取训练样本4个特征向量X=[X1,X2,X3,X4]。
(3)对任意被预测变量Xi(i=1,2,…,4),选择二次交互模型(QI)。
(4)令k=1,对于k等级的nk个训练样本中的任意一个,对其每个特征值Xi建立数学模型,得到nk个方程,用最小二乘法对这nk个方程的模型参数进行估计,得到各特征值Xi的预测模型VPMik。
(5)令k=k+1,循环步骤(4),直至k=3结束。此时对各等级葡萄干的所有特征值都分别建立了预测模型VPMik,模型训练过程结束。
(2)模型分级过程:
(1)提取测试样本葡萄干特征值X=[X1,X2,…,X4];
(2)对于测试样本所有特征值Xi(i=1,2,…,4),分别采用VPMik(k=1,2,3)进行预测,得到测试值ik;
(3)在同一等级下,计算所有特征值的预测误差平方和值δk(k=1,2,3),分级时,当预测样本中所有δk第k个最小时,将测试样本识别为第k等级。
5 试验及分析
利用Matlab编程实现了BP神经网络方法、支持向量机(SVM)和VPMCD识别算法。对40个训练样本进行训练,并对60个测试样本进行了识别。识别精度与SVM,BP神经网络识别比较如表4所示,在一级葡萄干识别中,识别精度及识别时间如表5所示。
试验中,BP神经网络与SVM中的多个参数需要经过若干次优化确定,而在VPMCD方法中,训练样本的特征值预测误差平方和最小即为最佳预测模型,分级时就以测试样本预测误差平方和最小来判定属于哪个等级。结果表明,该方法不但识别精度高于其他两种方法,且由于避免了神经网络中结构和类型的选择、迭代学习的过程,SVM中参数寻优过程,运算时间也大大减小,因此,VPMCD方法在葡萄干的等级检测中是一种可行且有效的模式识别方法。
6 结论
采用BP神经网络进行特征优选,对葡萄干提取的9个特征参数进行训练,通过对比识别精度,确定了最佳网络结构及最佳特征组合,选用色度、面积、长度、宽度作为最终识别特征。该文提出一种基于VPMCD对葡萄干进行等级检测的新方法,试验结果显示,提出方法识别率达到100%,将识别结果与使用BP神经网络和SVM识别做了比较,结果表明,VPMCD方法不论在识别率还是训练时间上,均优于其他两种方法。试验证明,VPMCD方法运算时间少、识别精度高,在农产品等级检测中可行且有效,为等级检测提供了一个新途径。
摘要:为了准确鉴别葡萄干等级,提出一种基于人工神经网络和VPMCD的葡萄干等级检测新方法。以新疆绿无核三个等级的葡萄干作为研究对象,提取颜色、形状的特征参数。采用BP神经网络算法,对比各特征组合对识别率的影响,确定了识别率较高的4个特征参数组合。最后应用VPMCD方法进行样本训练并进行葡萄干等级检测。将提出的方法与SVM、BP神经网络识别结果进行对比分析,结果表明,VPMCD算法识别率达到100%,分级效果明显,运算时间少,识别精度高,为农产品等级检测提供了一个新途径。
关键词:葡萄干,等级检测,BP神经网络,VPMCD
参考文献
[1]詹映,罗华平,彭云发,等.BP人工神经网络南疆红枣颜色分级方法的研究[J].食品工业,2015,36(1):165-167.
[2]李国进,董第永,陈双.基于计算机视觉的芒果检测与分级研究[J].农机化研究,2015(10):13-18.
[3]杨眉,魏鸿磊,华顺刚.一种基于神经网络的扇贝图像识别方法[J].大连海洋大学学报,2014,29(1):70-74.
[4]张昭,罗文亮,乔永亮,等.基于数据挖掘算法的竹块颜色分级研究[J].中国农机化学报,2013,34(2):217-220.
[5]向金海,杨申,樊恒,等.基于稀疏表示的烤烟烟叶品质分级研究[J].农业机械学报,2013,44(11):287-292.
[6]杨宇,王欢欢,曾鸣,等.基于变量预测模型的模式识别方法在滚动轴承故障诊断中的应用[J].湖南大学学报(自然科学版),2013,40(3):36-40.
[7]程军圣,马兴伟,杨宇.基于ICA相关系数和VPMCD的滚动轴承故障诊断[J].振动、测试与诊断,2015,35(4):645-648.
[8]贾民平,韩冰.改进VPMCD法及其在机械故障诊断中的应用[J].中国机械工程,2015,26(14):1861-1865.
[9]许有才,万舟.基于条件局部均值分解与变量预测模型的轴承故障诊断方法[J].计算机应用,2015,35(9):2606-2610.
[10]李葵,范玉刚,吴建德.基于MRSVD和VPMCD的轴承故障智能诊断方法研究[J].计算机工程与应用,2016,52(8):153-157.
【人工神经网络测评方法】推荐阅读:
人工神经技术07-02
模糊人工神经网络06-02
人工神经网络评价法07-10
人工神经网络文献综述09-14
人工神经网络BP算法11-13
胶原蛋白人工肠衣的制造方法07-21
人工挖孔桩的施工方法08-04
人工鱼礁07-15
人工防治10-14