BPNN

2024-08-08

BPNN(共3篇)

BPNN 篇1

1.引言

招聘是企业引进人才的主要手段之一, 其效率和准确度对于企业的发展起着至关重要的影响。进入21世纪以后, 随着互联网的快速发展和普及, “互网络招聘”成了众企业争相采取的人才招聘主流方法, 节省了传统招聘所产生的人力物力成本。但正是因为互网络招聘的兴起, 又给企业带来了一个棘手的问题, 即简历的筛选。简历作为一种招聘工具, 向招聘方提供诸如教育背景、基本素质、工作经验等个人信息, 这些信息是可查寻的, 不易造假的 (Becker & Colquitt, 1992) [1], 而且“简历筛选”可以提高招聘效果, 招聘方对应聘人员的第一印象来自他们的简历 (Knouse, 1994) [2]。

人力资源管理的几个模块, 如人员招聘、绩效考核、培训发展和薪酬福利中, 招聘工作往往显得被动, 企业在公布招聘条件后, 应聘者填写形式多样的简历发到企业网站上, 由于简历的样式、 问题、内容等得不到统一, 当企业收到这些简历后, 往往会无从下手, 有很多简历里内容是冗杂多余, 有不少企业不需要的信息, 最终会导致企业无法准确高效的在大量简历当中筛选出企业所需求的人才, 增加企业招聘部门的简历筛选成本[3]。简历筛选工作需要在众多简历中, 不停的阅读并筛选, 可想而知这个工作量是非常巨大的, 既耗时又费力、而且主观色彩强烈, 凭借着大量经验性的感觉去评判应聘者的优劣, 有时甚至还会取其糟粕去其精华, 引进一些对企业没帮助的员工。企业能否合理高效地运用简历、筛选简历就成了招聘成败的关键因素。为解决这种问题, 国内外学者们开展了简历信息筛选方面的研究, 并取得了一定的成果。有利用数据挖掘来提取简历特征以此提高简历筛选的效率的技术[4];结合HMM和SVM的简历信息筛选方法[5];运用贝叶斯分类器的企业简历筛选方法[6];基于离散选择模型的企业简历筛选方法[7]。本文从另外一种角度出发, 试图引用BP神经网络来提高人工筛选简历的效率, 提出主动式简历概念及基于BP神经网络学习模式及筛选方案, 并应用此方案提出一种方便的简历筛选应用。

2.BP神经网络

人工神经网络 (Artificial Neural Networks, 简称ANN) 是反映了人脑基本特征的一个种高度复杂的非线性动力学网络系统。神经网络具有大规模并行、分布式存储、自组织、自适应和自学习的能力, 特别适合用来处理需要同时考虑多个因素和条件的模糊信息[8]。目前具有代表性的神经网络有多层感知器、RBF网络、 SOFM网络等等, 其中应用较广、发展较成熟的当属BP神经网络。

BP神经网络是目一种前馈神经网络, 包含输入层、隐含层、 输出层三个部分[9], 神经网络相邻两层之间的神经元节点通过各自的权值实行全连接[10], 主要特点是信号向前传递, 误差反向传播 (Back- Propagation Algorithm) 学习, 属于有监督学习, 需要一组已知目标输出的学习样本集。

BP神经网络的结构如下图一所示:

在三层BP网络中, 假设输入神经元个数为M , 隐含层神经元元个个数数为为II , , 输输出出层层神神经经元元个个数数为为JJ , , nn为为迭迭代代次次数数, , 隐隐含含层层传传递递函数f (x) 为Sigmoid函数, 输出层传递函数为线性函数。 u和v分分别别表表示示每每一一层层的的输输入入与与输输出出, , ηη 为为学学习习率率, , δδ 为为局局部部梯梯度度。 。 x (n) 为网络的输入信号[11]。

则网络实际输出和期望输出分别为:

隐含层第i个神经元的输出:

输出层第j个神经元的输出:

网络误差为:

当误差信号反向传播时, 首先调整隐含层与输出层之间的权值, 根据最速下降法, 权值修正量表示为:

误差信号向前传播, 对输入层与隐含层之间的权值进行调整, δ 为局部梯度:

标准的BP网络采用最速下降法来修正各层权值, 在训练过程中沿着误差函数不断逼近目标值, 在不断迭代和修正权值过程中可以得到精确的结果。

3.简历筛选方法

3.1主动式简历

在招聘过程中, 使用“主动式简历”方法就可以化被动为主动。顾名思义, 主动式简历招聘指的是企业为招揽某种人才而主动发放统一或定制简历的一种招聘行为。较比传统的广纳简历不同, 主动式简历招聘强调的是简洁、高效、有针对性。因此在实际应用当中, 主动式简历在人才招聘过程中具有获取数据准确率高、有信息针对性的优点。接下来, 本文所要阐述的这种企业简历筛选方法的先决条件就是首先做到简历内容的统一化, 而简历的统一化过程就需要通过“主动式简历”这一方法。即企业主动设计简历, 对外发放统一的简历模板供人们填阅。

3.2主动式简历应用步骤

主动式人才招聘流程如下:

Step1: 根据公司对人才的实际需要情况, 人力资源部门首先要进行岗位及人才的需求分析, 并依据此分析, 制定具体的人才选拔考核的标准 (因素) xi和其权重 ωi ( i ∈ N*) 。

Step2: 按照Step1中的标准, 设计制作相应的报名条件和主动式招聘简历, 简历的最上部是基本信息栏, 如姓名、性别、年龄、 邮箱、通讯地址等等, 其次是正式的问题, 只需要设计与Step1中 “考核标准xi”相对应的问题即可, 其他不相干问题一律不设置, 因为设计简历的时候应遵从精炼、从简、有针对性的原则, 否则即使设计了一些其他问题, 也是对后续的程序步骤是毫无帮助的, 只会增加应聘人员的负担和填阅时间。

比如, 想获取应聘者的“工作经验”信息, 则只需提如下问题即可:

问题:有无“计算机程序员”相关职位或领域的工作 (实习) 经历?

选项:□1年及以下 □2~3年 □4年及以上

Step3: 通过以互联网或各种媒体的方式将设计好的主动式简历和报名条件公开到网络上, 让求职者自行下载填写简历并提交。

Step4: 整合所有收到的简历, 并对其进行初步的筛选和整理, 剔除掉一些不符合规定的简历。

Step5: 将简历上的信息进行整理记录, 并对所有样本进行评分, 把抽象的文字内容, 转化成可运算的具体数值, 得到样本数据Data。具体评分过程非常简单。由第2章的BP神经网络特征的介绍可知, 只需要对问题的选项进行简单的分数设定即可。

如上述Step2中的问题“有无计算机程序员相关职位或领域的工作经历?”为例, 我们只需将它的三个选项依次编码为1、2、3即可。假设应聘者选择了第2个选项, 那么在其“工作经验”这一因素记录为数字“2”即可。

Step6: 依据不同因素xi所对应的不同权重 ωi分配, 多名专家对样本进行综合全面的评估, 评估结果用于后续步骤7中的训练与检测。

Step7: 建立BP神经网络, 利用部分样本对其进行训练, 根据训练后得到的BP神经网络, 检测其准确度。

在准确率符合要求的情况下, 企业就可以摒弃传统的人力筛选的方法, 而是利用这个训练好的神经网络来判断样本的好坏, 最终决定哪些人符合条件进入最后的面试环节。

步骤Step1~7的流程结构如下图所示:

4.应用实测

4.1需求分析

为了让读者更好的理解本文的简历筛选方法, 下面假设、模拟一种简单的企业招人的情形, 以此来测试并阐述本文所提出的筛选方法。

假设:某IT企业要招聘若干名Java程序员。

如若一个公司要招聘Java程序员, 那么不同的公司会有不同的评价标准, 因为不同的企业会有不同的文化、目标及处境。如有的公司在乎程序员的编程能力, 有的公司则非常注重程序员的个人经历, 甚至也有的公司会把程序员的民族或性别放在第一位。

很显然, 在实际情形中, 同样都是招聘一名程序员, 各家企业的要求也都不尽相同。在考量了程序员这个岗位的实际工作需求后, 本文选取了6个对程序员非常重要的因素来开展研究。它们分别是“学历情况”、“外语水平”、“计算机水平”, “工作经历”、 “创新研究”、“荣誉表彰”。其中学历和外语情况看做“基本因素”, 工作经历、创新研究和荣誉表彰这三方面因素归为“能力因素”范畴。

一.“学历情况”方面, 本文参考了《武书连2015中国734所大学综合实力排行榜》中的数据对样本进行学历评估, 其中为高校“人才培养”的总得分;相同高校毕业的研究生与本科生的分数比值为1.5;高中或专科则统一记作1分。

二.“外语水平”方面, 只考虑英语过级情况, 因为一般情况下, 对一名Java程序员来说, 最重要的外语就是英语, 是否掌握其它外语对他的日常业务并没有实质性的帮助, 因此不考虑其他语言。

三.“计算机水平”方面, 下设四个分项, 分别为NCRE (全国计算机等级考试) 、C/C++水平、Java水平、其他软件水平。NCRE一级并不能算作加分项。因为对于一名程序员来说, 其太过于基础。按照应聘人员的软件操作能力的高低进行相应的打分。

四.“工作经历”方面, 下设两个分项, 分别为“工作经验” (应届生查看实习经验) 和“开发经验”。

五.“创新研究”方面, 评判一个人的创新研究能力是一件复杂的事情, 有多种评价方法, 本文为了举例说明方法的可行性, 简化了评判过程, 以发表过的最高级别“学术论文” (第一作者) 的情况来作为评价一个人是否具有研究能力的标准。

六.“荣誉表彰”方面, 以获得的最高级别的各类型的奖项、荣誉证书、奖学金、比赛等情况来作为评分标准。

4.2样本数据

完成需求分析的过程以后, 参照上述3.2中Step2的方法, 制作了相应的简历模板, 挂载到互联网, 供应聘者填写。通过设计发放问卷 (简历) , 最终总共获得了123份样本数据。在对数据初步整理筛选后, 剔掉其中3个不符合规定的样本, 对剩余的120份样本一一进行评分记录, 3.2中Step5方法, 最终得到编号为1~ 120的样本数据。

在这120个样本中, 硕士及以上学历者占28%;本科学历68%、高中及专科4 %;应届毕业生人数占90%;计算机相关专业毕业者人数达到了总样本数的50%。

4.3样本评分

样本评分指的是对已获取的样本进行相应打分 (量化) 的过程, 是整个方法中非常重要的一个环节, 评分是否直观、准确、直接影响整个工作的结果。评分时候最重要的是要力图简单明了、 使人通俗易懂, 才能减轻记分人员的工作难度, 提高记分效率。

结合以上的要求, 本文中的样本评分的具体方法以及对应的评分值如下图三。

下面举一个样本评分实例, 供大家参考。

例:某个样本情况为北京大学硕士毕业、英语6级水平、 NCRE2级、C/C++高级、Java中级、其他软件中级、有1年工作经验、无开发经验、有国家级学术论文、有校级奖项, 则其数据整理结果为:

4.4专家评估

在取得样本数据后, 我们要对每个样本进行评价, 评价结果只有两种情况, 即1或0。1代表合格, 表示通过海选阶段进入面试环节, 0则代表淘汰。

由于我们假设在招聘Java程序员, 所以经过多方面考虑, 我们将各项因素的权重 ω 作如下图四配置。当然在实际应用当中, 企业完全可以按照自己的需求自行设计各项要素及其权重的大小, 并不一定要完全按照本文的权重分配方法。

其中, ω = ω1+ ω2+ ω3= 1;

ω1= ω11+ ω12;ω2= ω21+ ω22+ ω23+ ω24, ω3同理。

样本评价由“专家评估”的方式进行, 本文找到2名IT企业家 (专家) , 让他们按照图四的权重分配情况综合考量每一个样本的优劣情况, 并对所有的样本作出“合格”或“淘汰”的评价。为了进一步模拟企业招聘时的真实场景, 我们假定合格率P=0.2, 即, 专家们需要评选出24份合格样本及96份不合格样本。

4.5测试结果

完成前面的所有步骤后, 用MATLAB (R2014a) 建立BP神经网络, 在合格样本和不合格样本中分别随机选择2/3数量 (80个) 的样本进行训练, 余下的1/3 (40个) 样本用来检测所建网络的准确率。根据对网络的理解和经验, 我们如下设置BP网络的参数, 其余参数均采用默认值。

BP网络测试结果如下。

由“误差下降曲线”的横坐标可知, 此网络进行了8次迭代就实现收敛。误差分布大致呈现正态分布的形状。

将上述网络重复测试了100次后, 预测准确率 (accuracy) 及迭代次数 (epochs) 结果如下图。

由上图可知, BP网络本身具有一定的随机性和不确定性, 所以每次的训练结果都是不一样的, 因此为了更加准确的获得网络的真实运行情况, 我们尝试进行20种不同训练样本的组合, 组合情况完全是计算机随机进行的, 每种组合内再重复50次训练和检测过程, 最终得到1000个网络运行数据组, 其中包括1000组迭代次数、网络预测值、误差值、准确率等等, 得出“预测与期望比较图”和“预测误差图”, 分别如下:

最后再对所有结果分别取平均值, 得出最终的网络总平均迭代次数、误差和准确率。

测试结果表明, 本文所提出的简历筛选方法能够确实有效的替代传统的筛选方法。 测得的网络预测的平均准确率为91.33%, 平均误差为0.0435, 平均迭代次数为8.5次 (收敛较快) 。

5结论

本文所提出的方法解决了企业招聘过程中的简历筛选所面临的无针对性、低效率等问题。筛选精度达到了较高的水平, 从而帮助我们判断样本的优良情况。经过测试发现, 训练好的BP网络可以快速、客观、准确的对样本进行检测分类, 预测的平均准确率达到了90%以上, 平均误差也控制在了0.05以内。

本文提出方法的特色及创新之处:

1) 目前国内的人力资源管理方面的研究中, 关于简历筛选方法方面的研究少之又少, 相关的文献资料也屈指可数。因此本文的研究在简历筛选领域可以说是贡献出了一种新的解决方法和思路, 给人力资源管理中的招聘环节领域提供了宝贵的参考资料, 同时也会呼吁更多的学者投入到当前领域的研究。

2) 将“BP神经网络”这一前沿计算机生物技术融入到了人力资源管理学当中, 有效解决了企业招聘环节中的实际问题。值得注意的是, 是由于BP网络本身具有一定的随机性, 对初始值较为敏感, 每一次运行结果都是不同的, 所以需要反复多次的运行网络, 取平均值来判断网络是否能够准确地对简历进行筛选。

综上所述, 本文所提方法提高了企业简历筛选分类的效率, 节约了企业人力、物力和时间成本, 基本上满足实际应用操作的需求。

摘要:本文从节省人力资源招聘环节中的成本与提高招聘前期简历筛选效率的角度出发, 将主动式简历和BP神经网络作为主要实现手段, 综合简历筛选环节中真实存在的问题的基础上, 提出了一种新的企业简历筛选方法, 有效降低了传统企业简历筛选过程中所产生的人力、物力成本。经过实际测试发现, 本文所提出的方法, 满足相关领域的实际使用需求, 具有快速简历分类筛选能力, 具有高精度、高效率的优点, 适用于各类型企业互联网招聘环节中的简历筛选过程当中。

关键词:简历筛选,主动式简历,BP神经网络,人力资源

参考文献

[1]Becker, T.E., &Colquitt, A.L..Potential versus actual faking of a biodata form:An analysis along several dimensions of item type.Personnel Psychology, 1992, 45, P 389-406

[2]Knouse, S.B..Impressions of the resume:The effects of appli-cant education, experience, and impression management.Journal of Business and Psychology, 1994, 9, P33-45

[3]苏蕙.专家和新手在简历筛选任务上的比较研究[D].上海:华东师范大学, 2005

[4]Maheshwari S, Sainani A, Reddy P K.An approach to extract special skill to improve the performance of resume selection[C].Lecture Notes in computer Science, 2010, 5999, P 256-273

[5]Yu Kun, Guan Gang, Zhou Ming.Resume information extrac-tion with cascaded hybrid model[C].Proceedings of the 43rd An-nual Meeting on Association for Computational Linguistics, Mo-rristown, NJ, USA, 2005

[6]洪海燕.基于贝叶斯分类器的简历筛选模型[J].计算机技术与发展, 2012, 22 (7) , P 85-87

[7]秦嵩, 徐晓林, 王震蕾.基于离散选择模型的简历筛选研究[J], 2012, 20, P 138-142

[8]李雄诒, 许卫华.基于改进BP神经网络的企业盈利能力测评模型及应用[J], 工业技术经济, 2006, 25 (6) , P 92-96

[9]汪克亮, 杨力, 查甫更.改进BP神经网络在企业网络营销绩效评价中的应用[J].商业研究, 2008, 371期, P 64-68

[10]张积洪, 李兴旺.基于多聚合过程神经元的A380客舱内温度预测[J].计算机测量与控制, 2014, 22 (12) , P 3891-3893

[11]陈明.MATLAB神经网络原理与实例精解[M].清华大学出版社, 2013

BPNN 篇2

我国是一个农业大国,同时也是一个农业物害虫高发的国家,由此造成的经济损失巨大。对农作物害虫的发生进行预测,可有效地降低农作物害虫的危害,减少经济损失。但是由于农作物害虫的发生是一种复杂的自然现象,既具有有序的规律性和周期性,又具有不均匀性、差异性、多样性、突发性、随机性和复杂性等特点,使得对害虫灾害发生进行准确预测变得十分困难。

科研人员先后尝试利用回归分析[1]、逐步回归[2,3]、主成分分析[4]、多因子相关分析[5,6]、模糊数学[1,2,3,4,5,6,7,8,9]以及灰色系统分析[10,11]等方法对农作物害虫发生进行预测,但预测精度和效果都不是特别理想。近年来,随着人工智能技术的快速发展,研究人员尝试利用人工神经网络模型构建预测模型[12,13,14,15,16,17],并取得了良好的效果。汪四水等[12]研究人员利用BP人工神经网络原理,结合500pb西太平洋副热带高压和江苏省通州市稻纵卷叶螟发生程度的数据,建立稻纵卷叶螟发生程度预警模型;汪璇等[13]研究人员将人工神经网络、遗传算法和模拟退火技术相结合,提出了一个全新的水稻虫害智能预测模型。这些研究都取得了比较好的预测效果,但都还存在一些不足:一是在农业数据采集过程中存在大量由于人为、设备和仪器仪表精度限制等原因导致的误差,现有预测方法对这些误差一般都忽略不计,从而极大地影响了预测模型的稳定性和准确性。二是利用BP人工神经网络进行预测时,若输入因子少,导致其预测准确性低;若输入因子多,则BP人工神经网络运算量大,导致其预测结果得不到收敛。目前,基于BP人工神经网络建立的预测方法很难有效地解决这一矛盾。

为此,本文采用BP神经网络结合主成分分析构造了农作物害虫灾害发生预测模型。首先,针对农作物害虫发生的影响因子多及提取主要影响因子难度大等问题,将原来有较多的输入变量(影响农作物害虫发生的影响因子)进行主成分分析,利用线性变换得到一组个数较少的、彼此不相关的新输入变量,再用新输入变量作为BP神经网络的输入,从而简化了输入变量,提高了神经网络性能;同时,针对实验数据在收集、整理等环节中存在一定误差,造成数据不准确的问题,本文采用灰色关联度分析方法对实验数据进行处理,从而提高了数据的相关性;最后,对该预测模型进行了试报检验。检验结果表明,BP神经网络模型应用于农作物害虫灾害发生预测具有较高的预测精度和良好的泛化能力。

1 农作物害虫发生预测模型的构建

本文利用灰色关联度分析、主成分析方法以及BP人工神经网络技术,构建了农作物害虫发生预测网络模型,具体构建步骤如下:

第1步,利用灰色关联度分析方法计算原始数据之间的关联度,剔除差异较大数据。

1)对农作物害虫过去发生量的原始数据进行标准化处理,消除各数据间的量纲关系,使数据一致化,并将各指标的属性值统一到(-1,1)范围内。计算公式为

undefined

式中 x′ij—标准化矩阵的第i行第j列的数值;

xij—参与标准化矩阵的第i行第j列的数值;

undefined—参与标准化矩阵的第i列的平均值。

2)计算一级绝对差矩阵。其计算式为

Δi(k)=|X0(k)-Xi(k)| (2)

式中 Δi(k)—绝对差矩阵;

X0(k)—标准化矩阵的参照向量第k个值;

Xi(k)—标准化矩阵第i个向量的第k个值。

3)计算关联度系数矩阵。根据式(2)计算得到的绝对差矩阵Δi(k),计算关联度系数矩阵ζi(k)。其计算公式为

undefined

式中 ζi(k)—关联度系数矩阵;

Δi(k)—绝对差矩阵;

undefined—二级最小差;

undefined—二级最大差;

ρ—分辨系数,ρ∈[0,1],一般取ρ=0.05。

4)计算灰色关联度。根据式(3)计算得到农作物害虫过去发生量的原始数据之间的关联度系数矩阵ζi(k) ,计算出灰色关联度ri。其计算式为

undefined

式中 ri—灰色关联度;

ζi(k)—关联系数矩阵;

N—向量的维数;

第2步,对灰色关联分析法处理后的数据进行主成分分析,计算农作物害虫发生的影响因子的累计贡献率。

1)对农作物害虫发生的影响因子进行标准化处理,消除各数据间的量纲关系,使数据一致化。其计算公式为

undefined

式中 x′ij—标准化矩阵的第i行第j列的数值;

xij—参与标准化矩阵的第i行第j列的数值;

undefined—参与标准化矩阵的第i列的平均值。

2)计算农作物害虫发生的影响因子的相关系数矩阵。其计算公式为

undefined

undefined

式中 rij—标准化矩阵第i行与第j行的相关系数;

xji—标准化矩阵的第j行第i列的数值;

xik—标准化矩阵的第i行第k列的数值;

xj—标准化矩阵的第j行向量;

xk—标准化矩阵的第k行向量转置;

R—相关系数矩阵。

利用标准化后的数据计算影响因子相关系数矩阵,其计算式为

R=(rij)12×12 (8)

undefined(i,j= 1,2…,12;n=7) (9)

3)计算相关系数矩阵特征值、特征向量。经过式(6)和式(7)计算得到相关系数矩阵为R,其求解特征方程为

undefined

式中 R—相关系数矩阵;

λ—特征值;

E—单位矩阵。

得到相关系数矩阵R的特征值λ,每个特征值对应的特征向量为

Ai=(ai1,ai2,…,aip) (i=1,…,n)

计算前h个主成分占所有主成分贡献率。通过式(10)求得q个主成分(q≤n),第i个主成分的贡献率计算式为

undefined

式中 βi—第i个特征值对应的贡献率;

λi—特征值。

在q个主成分中,累计贡献率为前h个主成分占所有主成分的比例的计算式为

undefined

式中 ah—影响农作物害虫发生的累计贡献率;

λi—第组数据的特征值。

第3步,以主成分分析结果为输入因子的BP神经网络模拟,对农作物害虫发生量进行预测。

由于理论上已经证明了3层网络模型对步骤于非线性系统具有较好的建模能力,因此任一连续函数或映射均可由一个3层神经网络实现,所以本文选用3层BP网络构建农作物害虫发生量预测模型。模型包括输入层、隐含层和输出层3个部分。其中,在综合考虑影响斑潜蝇种群数的因素的条件下,将m个主成分作为输入层,输入层有m个神经元(即月年均气温、月最高气温、月最低气温、降雨量、蒸发量及相对湿度等因子);输出层为1个神经元,为预测的斑潜蝇种群高峰期预测发生量;传递函数选择undefined;隐含层神经元数为10个。本模型已将原来有较多的输入变量进行主成分分析,利用线性变换得到一组个数较少的、彼此不相关的新输入变量,再用新输入变量作为BP神经网络的输入,从而简化了输入变量,提高了神经网络的性能。

2 模型的应用及结果分析

本文利用设计的农作物害虫灾害发生预测网络模型,对云南省建水县的主要农作物害虫—斑潜蝇进行发生量预测,以检验模型的应用效果。斑潜蝇又称鬼画符,属于双翅目潜蝇科害虫。大约在1993年由巴西传入中国,目前全国各地均有发生。受危害的作物包括黄瓜、番茄、茄子、辣椒、豇豆、蚕豆、大豆、菜豆、西瓜、冬瓜和丝瓜等22个科110多种植物。预测模型具体计算步骤如下:

第1步,收集待预测的农作物害虫过去的发生量和影响害虫发生的影响因子的原始数据。

在云南省红河州建水县地植保站采集1999-2007年斑潜蝇发生量(植株感染率)历史数据,将各种蔬菜田的采样面积进行加权平均,得到斑潜蝇在蔬菜中的危害程度,采用植株感染率作为危害程度指标,如表1所示。

%

由于第1代斑潜蝇发生量与其发生时的气象信息关系密切,所以选取当地气象台同期观测的月平均气温、极端最高气温、极端最低气温及降水量等6项气象数据作为影响因子数据,如表2所示。

第2步,利用灰色关联度分析方法,计算原始数据之间的关联度,剔除差异较大数据。

首先,对农作物害虫过去发生量的原始数据进行标准化处理,消除各数据间的量纲关系,使数据一致化,计算结果如表3所示。

然后,分别对1级绝对差矩阵、关联系数矩阵及灰色关联度进行计算,得到1999-2007年与平均值的关 联度结果为[0.822 3 0.910 5 0.878 0 0.992 4

0.892 0 0.900 1 0.863 6 0.920 5 0.766 4]。由此发现,1999年和2007年的数据与其它年份数据的相关度差。把这两年数据排除掉,得到进行灰色关联度分析的数据,如表4所示。

第3步,对灰色关联分析法处理后的数据进行主成分分析,计算影响农作物害虫发生的影响因子的累计贡献率。

对标准化后的因素进行主成分分析,得到3个主成分累计方差贡献率达到99.08%,满足累计方差贡献率大于95% 的条件。3个主成分Y1,Y2,Y3的各因素关系式以及主成分的数值如表5所示。

由表5可得,第1个主成分中最大的两项为-0.421 1和0.411 1,是4月份的最高与最低气温;第2个主成分最大的项为0.299 2,-0.596 4和0.548 4,主要是3月和4月份的平均气温;由第3个主成分组成可以看到,主要是3月份的气象因子。由于斑潜蝇发育初期对温湿度的敏感程度较高,4月是斑潜蝇生长的高峰期,所以由主成分分析结果也可以得到相似的结论。因为第1个主成分的贡献率已达到50.47%,影响斑潜蝇发生的12个气象因子提取的3个复合因子Y1,Y2,Y3,累计方差贡献率达到90.59%。

第4步,利用BP神经网络,对斑潜蝇发生量进行预测。

将经过主成分分析后生成的权重最大要素作为输入变量,将标准化后的2000-2005年的第1代斑潜蝇发生高峰期发生量作为输出量,建立一个3层BP人工神经网络模型;然后,利用BP人工神经网络进行训练,并用2006年的数据对预测模型进行检验,得到预测值为60.6,实际发生量为64.9,比较符合实际情况,预测效果较好。神经网络训练过程误差图如图1所示。

3 结论

1)利用灰色关联度分析、主成分分析和BP人工神经网络相结合的方法,构建了农作物害虫发生量的预测模型。该模型利用灰色关联度分析方法,对农作物害虫发生量的原始数据进行处理,剔除掉误差数据,保证了预测模型的稳定性和准确性。

2)利用主成分分析法对BP人工神经网络输入因子进行处理,在保证信息不丢失的情况,减少了BP人工神经网络输入因子个数,有效地解决了利用BP人工神经网络进行预测时存在的如下问题:输入因子过少,导致预测准确性不高;输入因子过多,运算复杂,又导致预测结果得不到收敛。

3)模型具有较强的泛化性,可推广应用到其它病虫害的预测问题上。

摘要:针对农作物害虫灾害发生的差异性、突发性、随机性、多样性和不均匀性等特点,将人工神经网络、灰色关联度分析与主成成分析相结合,提出一个新的农作物害虫发生预测网络模型。首先,针对影响农作物害虫发生影响因子较多的问题,模型通过主成分分析方法将影响因子进行简化处理;同时,为了实验数据的相关性,采用了灰色关联度分析,排除实验与统计等方面的误差;最后,利用BP人工神经网络构建了农作物害虫发生预测模型,并以斑潜蝇为例,进行了试报检验。检验结果表明,模型应用于农作物害虫灾害发生预测具有较高的预测精度和良好的泛化能力。

BPNN 篇3

水环境治理是个巨大的系统工程,其中水质现状评价是其重要的分支之一。如何根据评价指标体系的特征,对水环境质量现状进行评价将是今后水质评价研究的重点。

1 常规水质数学评价模式[1,2,3,4,5]

Jacobs在20世纪60年代提出水体质量评价的水质指数(WQI)概念和公式以来,国内外就不断有文献讨论水质评价的方法。但至今仍缺乏统一的、公认的评价模式。

通过资料分析,综合各类代表性综合评价方法如表1所示。

针对不同的水质评价方法的适用条件,分析各类水质指标的特点,选用模糊评价法和人工神经网络来进行实例研究。

2实例应用

采用BP网络模型实现BP网络方法在水质评价中的应用;采用模糊综合指数法,以取大取小法来确定模糊算子。将两种方法水质评价结果进行比较,具体结果如表2所示。

由两种综合水质评价法得出的结果可以看出:

(1)用BP模型评价的结果比用模糊综合评价的结果差异性要小,如野尤泾桥、巴城工农桥等。

(2)部分水质控制断面丰水期、平水期的水质远好于枯水期。

(3)该地区大部分地表水水质不符合标准,主要污染指标为BOD5、氨氮。

3原因分析

模糊综合评价法在本案例中采用的是取大取小法,即权重与单因子评价结果先取小,再由此结果中取大,突出的是主因子,评价结果很大程度上由主因子来决定。在部分断面指标中,由于主因子的污染程度低,评价结果就偏低;反之则结果偏高。因此,在模糊综合法进行水质评价时权重起到了非常重要的作用,同时由于在此方法中权重的取值不够客观、可量化程度不高,都会直接影响最后的水质评价结果。

BP模型即反向传播网络。它模仿人体的神经网络,通过构建各个层次的神经元,并通过训练样本对每个神经元进行赋值,来达到最终目标。BP网络与模糊综合评价的相同点即都需要对各个指标进行权重的赋值,不同点也可以说BP网络的优点即它的赋值是客观的、可学习的,使得它的评价结果更加科学化、可信。从案例评价结果可以看出,BP模型的评价结果更加统一,更符合实际。

(1)由于部分水质控制断面不同水期的水量变化很大,如在雨季,大量雨水混合着污染物未经处理就直接排入地表水中,造成在丰水期和平水期的污染加重,尤其是面源污染。

(2)通过调查该地区的排水系统及排水方式可知,该地区主要工业区和居民区的排水系统主要采用合流制,收集率较低。工业区主要有化肥厂、屠宰场等,居民生活水平较高。因此,该地区的排水水质指标中有机物指标、氨氮含量很高,尤其到雨季,废水与雨水同排,有很大一部分溢流形成了面源污染,从污染评价结果中就反映为丰水期、平水期的水质比枯水期污染严重。

4结语

通过两种典型水质综合评价方法,对某市的各个典型水质控制断面进行水质现状评价,发现该地区大部分地表水污染严重,超标情况严重为有机物、氨氮。通过分析原因,建议该地区应尽快完善排水系统,进行雨污分流,并提高污废水收集率;污染严重的工业区尤其要加强排水系统的建设,有条件的搬离地表水附近,建立工业区自己的污水处理系统,达标后再排到市政排水系统。

通过对两种方法的评价结果进行分析发现,由于人工神经网络BP模型在水质评价指标因子权重确定上更加科学和客观,同时更注重在水质评价指标系统中的综合性,使得BP模型评价结果可信度更高,更接近实际情况。而模糊综合评价法虽然充分体现了水环境的特点即模糊、灰色的,但由于在权重的确定、模糊算子的确定等方面不够客观,更多依赖于人为因素的不确定性,因此评价结果可比性较差,评价可重复性较低。

摘要:文章通过分析各类代表性综合评价方法的优缺点,结合水质评价对象的特点,优选出模糊综合评价法和神经网络BP模型法。利用实例研究来分析该两种典型水质综合评价方法在水质评价应用上的适用性,同时通过各个代表性地表水水质指标的现状评价结果,来分析地表水体污染情况。

关键词:水质污染,特征分析,模糊综合评价法,人工神经网络,BP法

参考文献

[1]李如忠.水质评价理论模式研究进展及趋势分析[J].合肥工业大学学报(自然科学版),2005(4):369-373.

[2]陈守煜,李亚伟.基于模糊人工神经网络识别的水质评价模型[J].水科学进展,2005(1):88-91.

[3]LOHANI B N,TODINO G.Water quality index forChao Phraya river[J].Environmental Engineering,1984(6):1163-1177.

[4]PRATI L.Assessment of surface water quality by asingle index of pollution[J].Water Research,1971(5):741-751.

【BPNN】推荐阅读:

上一篇:结核病实验室下一篇:伤害教育

本站热搜

    相关推荐