网络预测

2024-08-21

网络预测(共12篇)

网络预测 篇1

摘要:为了提高网络流量预测精度, 根据深度学习理论提出一种基于深度信念网络 (DBN) 的网络流量预测模型。该预测模型由受限玻尔兹曼机 (RBM) 单元组成, 采用逐层无监督贪心算法训练参数, 然后利用反向传播学习算法微调整个网络参数。最后基于该预测模型对收集到的真实网络流量进行预测和分析, 并与传统神经网络预测进行对比研究, 结果表明, 该预测模型克服了传统神经网络容易陷入局部最优、训练时间长及函数拟合度不高等缺点, 具有更高的预测精度。

关键词:网络流量,深度学习,深度信念网络,受限玻尔兹曼机,神经网络,预测

近年来, 目前的网络规模随着计算机网络的迅速发展变得极为复杂和庞大, 网络流量管理日益重要和迫切, 其核心是准确预测网络流量并及时做出调整, 可以有效地改善网络性能和提高服务质量。目前网络流量预测主要有传统统计和智能预测两大类方法。

传统统计方法主要是基于线性回归理论进行预测, 如Sang A等[1]提出的基于自回归 ( AR) 的预测模型, 邹柏贤[2]提出自回归滑动平均 ( ARMA) 的预测模型以及薛可[3]提出的基于自回归求和滑动平均 ( ARIMA) 预测模型, 上述模型是难以准确反映网络流量的非线性变化规律, 使得模型的预测结果不可靠。智能预测方法是将机器学习算法应用于网络流量预测, 人工神经网络算法为目前网络流量预测的主要研究方向。刘杰[4]提出了基于BP神经网络预测模型, 提高了预测精度和灵活性, 但BP算法本身存在收敛速度慢和存在局部极小点的问题。王俊松[5]提出基于RBF神经网络的预测模型解决了BP神经网络本身存在的问题, 赵清艳[6]提出的遗传优化神经网络预测模型, 用遗传算法来优化RBF神经网络的模型参数, 取得比较好的结果。但是RBF模型的不足之处在于需要大量的数据样本才能获得好的效果。

上述预测模型都是基于浅层结构算法的预测模型, 都不能更接近真实反映网络流量数据中复杂的非线性关系。Hinton[7]提出了深度学习理论为上述问题提供了解决思路。深度学习可通过自学习构建一种非线性深层次的网络结构, 能更准确拟合复杂函数。基于深度学习理论, Hinton又提出了深度信念网络 ( DBN) [8], 其是目前研究和应用都比较广泛的深度学习方法, 已经成功应用于多个领域[9]。

综上所述, 为了更好反映网络流量数据之间的关系, 提高预测精度, 本文研究了一种基于深度信念网络 ( DBN) 的网络流量预测模型, 其为非线性深层次网络结构[10]模型, 克服了传统预测模型的不足, 具有更高的函数逼近能力和良好自适应性。

1 网络流量预测原理

网络流量数据是由网络上在线用户的行为而产生, 而用户行为又会随着外界因素的影响而变化, 因而其产生的网络流量既有规律性也有偶然性。网络流量数据本质上是一种时间序列数据。根据流量行为的特性, 不同时刻之间的流量存在一定的非线性关系, 其动力学特性表示为:

其中, n为模型的阶数, 分别为t, t - 1, t - 2, …, t - n时刻的网络流量[5]。

由 ( 1) 式网络流量时间序列动力学特性可知, 通过t, t - 1, t - 2, …, t - n时刻的网络流量可以预测出t时刻的网络流量数据, 它们之间存在复杂的非线性关系f ( ·) 。本文使用深度学习算法进行非线性函数拟合, 并在此基础上提出一种基于深度信念网络的网络流量预测模型。

2 深度信念网络模型

2. 1 模型结构

基于深度信念网络 ( DBN) 的网络流量预测模型由两层受限玻尔兹曼机 ( RBM) 和一层BP神经网络组成。其结构如图1 所示。

深度信念网络 ( DBN) 的核心是受限玻尔兹曼机 ( Restricted Boltzmann Machines, RBM) 单元, RBM是一种典型的人工神经网络, 其是由可视层和隐藏层组成的一种特殊的对数线性马尔可夫随机场 ( Markov Random Field) , 网络中处于同一层的节点之间无连接。一个深度信念网络 ( DBN) 的参数需要预训练和微调训练两个训练过程来确定。

2. 2 预训练

预训练就是网络参数初始化的过程, 通过逐层采用无监督贪心算法方式来[11]初始化各层间的连接权重值和偏置值。在训练过程中, 首先将可视向量的值映射给隐含单元, 然后可视单元由隐含单元重建, 随后将这些新可视单元再次映射给隐含单元, 这样就获取了新的隐含单元。反复执行这种步骤的过程叫做吉布斯采样[12]。下面来分析RBM参数训练过程。

RBM层与层的节点之间相互无连接, 其本质上是一种能量模型, 可视层和隐含层的联合组态能量函数为:

式中, vi和hj分别为可视层、隐含层的节点状态。θ = { w, a, b} 是模型的参数, wij为可视层和隐含层之间连接权重值, bj和ai分别是可视层节点和隐含层节点对应的偏置值。则RBM在状态参数 θ 下的联合概率为:

其中, 是归一化因子, 即h, v分配函数。求Pθ (v, h) 对h的边缘分布:

然后采用最大似然函数最大化Pθ ( v) , 得到RBM的参数并通过随机梯度下降法推导出RBM的权值更新准则:

其中: Edata ( vihj) 是在真实数据集中的期望, Emodel ( vihj) 是模型中定义的期望。

一层的RBM训练完成之后, 把其隐含层节点的相应参数作为输入数据来训练下一层的RBM, 以此类推, 可训练多层RBM, 最终完成整个DBN的预训练过程。

2. 3 微调权值训练

预训练完成后可以初始化RBM每层的参数, 然后使用BP神经网络算法[13]对DBN的所有权重值进行微调训练, 利用输出误差来估计输出层的直接前一层误差, 经过逐层的反向传播学习, 估计获得所有其余各层的误差, 再使用梯度下降法计算更新各节点权值直到输出误差足够小。权值微调算法克服了传统BP神经网络因随机初始化权值参数而容易陷入局部最小和训练时间过长的缺点, 只需要对已知权值空间进行微调, 大大缩减了参数寻优的收敛时间。

3 网络流量预测

3. 1 模型预测流程

基于深度信念网络模型具体预测流程如图2 所示。

首先从网络上收集到的网络流量数据进行归一化处理, 然后将数据集分成训练集和测试集两部分, 使用训练集训练网络流量预测模型参数, 最后使用测试集测试模型预测效果。

3. 2 网络流量数据归一化处理

由于网络流量是多种因素影响的综合结果, 其数据值的变化范围较大, 需要对收集到的网络流量样本数据进行归一化处理[14]来提高模型的训练效率, 将所有的网络流量数据值处理为[0, 1]区间范围的数据, 采用的方法为最大最小法, 其公式为:

模型预测完成后, 还需要对预测的结果进行反归一化处理, 使其恢复成真实的预测流量数据, 反归一化公式为:

式中, xi表示网络流量原始数据, xmax和xmin表示流量数据的最大值和最小值。

3. 3模型评价指标

为了检验模型预测准确度和效果, 采用均方根误差RMSE ( Root Mean Squared Error) 和平均绝对误差MAE ( Mean Absolute Error) 等指标对预测准确度进行衡量, 上述指标定义如下:

式中, yt表示网络流量实测值, 表示模型预测值, n为预报检验的个数。显然, 上述两个评价指标的值越小, 说明模型的预报精度越高。

4 实验分析

4. 1 数据来源

实验数据来源于网络流量文库 ( http: / /news. cs. nctu.edu. tw / innreport / ) 主节点路由器Incoming articles从2014 年9 月1 日到10 月20 日的每小时访问流量, 得到1 200 个流量数据样本, 从而形成一个网络流量时间序列, 如图3 所示。

将前1 000 个流量数据作为训练集建立基于深度信念网络的网络流量预测模型, 其余200 个数据作为测试集进行预测检验。模型训练前需要对网络流量原始数据进行归一化处理。

模型预测前需要确定模型的阶数。在本流量数据样本中的时间粒度为1 小时。网络流量的自相关函数变化曲线如图4 所示。

经过分析, 从图4 中可知, 某t时刻的网络流量数据值与t - 1, t - 2, t - 3, t - 4, t - 5 时刻的网络流量数据值相关性高, 故设模型的5 阶, 即将t - 1, t - 2, t - 3, t - 4, t - 5 时刻的网络流量数据值输入预测模型, 以此来预测时刻的网络流量值。

4. 2 结果与分析

对于图4 的网络流量, 基于深度信念网络预测模型的预测结果和预测误差变化曲线分别如图5 和图6 所示。

从图5 可知, DBN流量预测模型可以很好的跟踪网络流量变化趋势, 预测的网络流量值和实际值比较接近, 偏差小。从图6 可知, DBN流量预测模型预测误差小, 预测误差变化范围波动小。

为了进一步说明基于深度信念网络 ( DBN) 的预测模型的效果, 分别与传统神经网络, 即基于BP神经网络及基于RBF神经网络流量预测效果进行比较, 如表1 所示。

对表1 各个模型评价指标进行分析可知, 基于DBN的预测模型相对于BP神经网络和RBF神经网络的预测误差均有所下降, 预测精度得以提高, 表明DBN网络流量预测模型较好的克服了传统神经网络的缺陷, 提高了网络流量的预测精度, 可以建立性能更优的网络流量预测模型。

上述实验结果分析表明, 基于深度信念网络 ( DBN) 的网络流量预测模型是一种高精度、预测结果可靠的网络流量预测模型。

5 结束语

针对网络流量变化规律的复杂性, 提出一种可以更好刻画数据之间复杂非线性关系的流量预测模型。通过用实际的网络流量数据对预测模型进行实验分析, 发现该流量预测模型能够更好反映网络流量的变化规律, 提高流量预测精度。同时, 深度信念网络在隐含层数量越多、数据量越大情况下效果越好。因此, 下一步研究工作将适当加大深度信念网络的隐含层数量, 并且收集更多网络流量数据作为训练样本, 这样有利于更精确的对网络流量做预测。

网络预测 篇2

随着互联网与智能手机的普及,移动互联网相关工具及网络环境获得了极大地改善与提升。国家课程改革、地方教育基础设施和虚拟化校园建设,使得传统教育模式局限性凸显,网络教育应运而生,被普遍认为具有广阔发展空间。网络教育作为社会的热点话题,很有可能在考研英语中命题,一起来学习下!

一、解读网络教育

网络教育即远程教育,是指使用电视及互联网等传播媒体的教学模式,它突破了时空的界线,有别于传统需要往校舍安坐于课室的教学模式。由于不需要到特定地点上课,因此可以随时随地上课。网络教育是现代信息技术应用于教育后产生的新概念,即运用网络技术与环境开展的教育。网络教育的优势主要有这几点:资源利用最大化、学习行为自主化、学习形式交互化、教学形式修改化、教学管理自动化。网络教育有利也有弊,教学模式单一,对学生学习的主动性以及学生对教学内容的深度、广度把握不准,教学交互性差。

熟知网络教育的`含义以及各项利弊,可以为考生的考研英语作文带来充足的写作语料,同时为各种题型打下牢固基础。

二、相关精彩段落

Higher education:The attack of MOOCs

DOTCOM mania was slow in coming to higher education, but now it has the venerable industry firmly in its grip. Since the launch early last year of Udacity andCoursera, two Silicon Valley start-ups offering education through MOOCs,massive open online courses, the ivory towers of academia have been shaken to their foundations. University brands built in some cases over centuries have been forced to contemplate the possibility that information technology will rapidly make their existing business model obsolete. Meanwhile, the MOOCs have multipliedin number, resources and student recruitment―― without yet having figured outa business model of their own.

【词汇突破】

Dotcom: 互联网

Mania 疯狂,热潮

Venerable 神圣的

Have sth in one‘s grip 掌控某事

start-ups 创业型公司

ivory towers of academia 学术圈的象牙塔

obsolete 过时

in some cases 某些情况下

contemplate 思考,担心

multiplied 翻几番

2012年网络安全7大预测 篇3

Websense安全实验室通过对5,000万以上个实时数据的搜集系统,以及每天可分析10亿个内容的ThreatSeekerNetwork,对网页声誉及网络犯罪者行为进行分析监测。

1、 在网络犯罪者眼里,你的社交网络的账号信息可能比你的信用卡卡号更有吸引力。有些网络罪犯活跃在论坛中专门进行社交网络的账号信息的交易。

社交网络串联着人与人之间的关系与信任,如果网络罪犯成功登陆了你的社交网络帐号,他们便有机会欺骗你的好友。

2、 高级攻击中常用的混合攻击手法将会是通过社交网络“好友”、移动设备或云技术来侵袭你的网络。

高级持续攻击(APT)中,罪犯利用盗来的社交网络账户的聊天功能向目标发起攻击。我们预计在2012年社交网络、移动终端和云安全威胁一并成为持续高级攻击中的主要媒介。

3、 种针对移动设备的攻击威胁你周边的智能手机和平板电脑。

早在几年前,就有人预测了针对移动终端的攻击时代,,大范围的攻击终于在2011年爆发了。。一旦罪犯能够应用移动定位服务来设计各种通过地理定位发起的社会工程学攻击,上当的用户数量将不可计数。

4、 基于SSL/TLS传送的网络流量成为了企业的IT安全盲点

两个因素正让通过SSL/TLS安全通道实现隐私和安全保护来控制不断增加的网络流量。首先是广泛应用的移动设备;其次是大型和常用网站如Google、Facebook、和Twitter会默认地将会话化为https访问模式实现更加安全的传输。但是随着更多的流量涌向加密通道,很多传统的安全防护产品无法正常的检测威胁,也无法检查加密的流量。

5、 需将防扩散措施添加到你的防范策略

多年来防护体系都致力于将网络罪犯和恶意软件拦在门外,但是网络威胁的快速变化和不断更新让传统产品很难抵御。有远见的企业开始实施站外检测最新的威胁,并着手调整防护技术使其能够在系统在被感染的初期及时执行防扩散保护,如:切断相关通讯以缓解数据泄露风险。

6、 伦敦奥运会、美国总统大选、玛雅历法、以及末日预告等,会引起犯罪份子的进行广泛攻击。

犯罪份子会继续利用各种热点新闻来炮制诱饵。当前的新闻散播周期基本已经变成了以天或者分钟计算,而人们对于网络上相关的新闻是没有戒心的,所以犯罪份子就会利用:伪造成合法的新闻服务网站、发布相关微博、社交网络发布更新或者私信、评论相关事件视频或者在论坛发言,以及更多其他手段来骗取用户点开恶意链接。

7、 社会工程学攻击和流氓反病毒软件依然是最大的网络威胁。

伪杀毒软件和流氓反病毒软件的威胁在2011年略微下降,但是2012仍有卷土重来之势。这类威胁除了会像以往一样弹出一个“您已经被感染”的页面外,我们预计2012年有三个新领域会成为假杀毒软件的新领地:伪注册表清理软件、伪应用加速软件、以及模仿流行的云备份系统做出的虚假备份软件。

Websense安全实验室安全研究经理黎浩贤表示:2011年,我们看到了企业安全领域,一切皆有可能。在新的一年里,移动技术,社交网络和云计算技术会进一步被广泛采纳和爆炸式的大发展,我们很快会看到恶意分子利用这一变化。

从各种已知的攻击和数据泄露事件,高级恶意软件的泛滥,共同媒介——Web。几乎所有发生在2011年的攻击都与Web相关,它可能是攻击的媒介,或者指挥控制中心,又或者是数据泄露或恶意份子获取关键IP的通道。当前,Web攻击已经超越浏览器的范畴,当API网页请求的数量达到一定的量值,我们看到有攻击者使用API来传播他们的恶意软件。

社交网络链路预测研究综述 篇4

1 链路预测的早期研究

链路预测早期研究起源于计算机科学领域的数据挖掘方向, 研究的主要思路主要集中在基于马尔科夫链和机器学习。Sarukka用马尔科夫链进行网络的链路预测和路径分析, 重点研究了web网站上用户的浏览路径和访问路径;两年后, Zhu等人将马尔科夫链的预测方法延伸到了万维网的网站预测中, 帮助网站用户进行在线导航;Faloutsos等人从图论、子图的相关概念出发, 提出了基于电路法则的算法, 该算法可以从一个大型网络中快速有效的找到该网络的连接子图。虽然他们的主要工作是图论的相关理论, 但是, 他们关于子图能够清楚的反映社交网络中用户之间的关系等思想对于后面的学者研究链路预测具有很重要的影响。在后来基于概率模型的链路预测研究中, Yu等人基于引文社交网络, 构建了基于元路径的概率模型, 提出了两阶段引用概率学习方法, 通过引文网络数据证明了在引文网络中该方法相对于其他链路预测方法的有效性。

2 基于节点属性的链路预测

在早期的链路预测研究中, 为了达到预测研究的精确性, 大多采用的是基于节点属性的链路预测研究。Lin等人基于节点的属性定义了节点间的相似性, 可以直接用来进行链路预测, 该方法的前提是如果两个节点的相似性越大, 那么这对节点存在链接的概率就越大。

刘伟平和吕琳媛提出基于网络局部随机游走相似性指标的链路预测方法, 该方与基于全局信息的相关算法相比更加有效, 而且计算复杂度也更低, 特别适合较大规模的网络使用, 同时比较适合在大型社交网络使用。傅颖斌等人从社交网络的新浪微博角度考虑, 引入节点的属性特征, 构造了基于随机森林的链路预测模型, 并用新浪微博的数据对模型进行验证, 发现微博属性特征的加入可以明显提高链路预测算法的精确度。

夏凯等人结合节点属性的用户生成内容信息和网络拓扑的网络演化信息, 提出了基于信息融合相似性算法的链接预测指标对含权网络进行链路预测。针对含权网络, 陈巧玉等人考虑到Lin等人针对基于节点的相似性的链路预测忽略了链接的强度, 并且当下的研究难以确定链接的权重问题, 提出了一种基于链接重要性和数据场的链接预测算法。该方法时间复杂度不增加, 准确率提升, 美中不足的是只考虑了两个节点之间的信息。

3 基于网络拓扑结构的链路预测

虽然应用基于节点属性的链路预测研究可以得到比较好的预测效果, 但是在社交网络中, 节点的信息的获得是非常困难的。例如, 为了保护用户, 很多在线社交网络的用户信息都是保密的。此外, 即使可以通过一些方法获取节点的属性信息, 如何甄别获取的节点属性信息是对网络链路预测是否有效, 效果究竟怎么样也是困扰学者的问题。近些年, 基于网络拓扑结构的链路预测越来越受到学者的青睐。与节点的属性信息相比较, 网络的结构信息比较容易获得, 而且获得的信息比较稳定, 也比较可靠。

基于网络拓扑结构的兴起得益于以下两者的贡献:Clauset、Moore和Newman2008年发表在《Nature》上的论文以及Redner发表在《Nature》上的评论文章, 其中Clauset等人提出了利用网络的层次结构进行链路预测, Redner则关注和挖掘网络中丢失的链接。包括我国学者周涛、吕琳媛等在内的瑞士弗里堡小组也较早地发现并研究基于网络结构的链路预测的相关问题, 并取得了一些进展。周涛等人在Liben-Nowe研究的基础上, 用9种基于局部信息的指标对6种现实网络进行了对比, 验证了Liben-Nowe等人研究的正确性, 并且在此基础上提出了资源分配指标 (Resource Allocation Index, RA) 和局部路径指标 (Local Path Index, LP) , 这两个指标准确性高于原来的指标。Yin等人基于Twitter网络的局部结构化信息, 利用决策树和回归模型的链路预测方法来预测两个结点间产生链接的概率。他们充分利用网络结构信息, 分析不同结构特征下用户间产生关注的可能性。

4 结合节点属性和网络拓扑结构的链路预测研究

最近几年, 随着现代计算机技术的进步, 节点属性和网络拓扑结构的相关信息变的相对容易收集, 国内外学者开始尝试将节点属性和网络的拓扑结构结合起来研究各个领域的网络。Popescul等人提出一个结构回归模型, 利用关系特征来对科学文献引用的社交网络链接进行预测, 对早期节点属性和网络拓扑结构的结合研究进行了研究。他们不仅利用网络结构中的引文信息, 还利用了作者信息、期刊信息等节点属性的信息。张斌等人与传统考虑同质网络不同, 以科学知识网络为主要对象, 将科学知识网络中分为同质网和异质网, 从合作网、引证网、二分网对知识网络的链路预测进行了梳理, 并介绍了异质网络的链路预测方法。同样考虑异质网络, 黄立威等人从异质网络出发, 提出一种基于元路径的链路预测模型, 通过组合不同元路径上对象之间连接建立的概率来进行链路预测, 在DBLP和Last.fm两个网络上进行实验, 验证了算法的有效性。王莹等人基于地理位置的社交网络 (Location—Based Social Network, LBSN) 提出签到时间和频率2类新的链接预测特征, 综合考虑用户签到的时间、空间、频率等多种信息, 建立LBSN的链路预测框架, 通过Bright kite网验证了预测准确率的提升。

5 结语

综上所述, 目前社交网络链路预测研究存在预测精度不高, 对象不明确的缺点, 随着现代科技的进步, 节点属性和网络拓扑结构的相关信息变的相对容易收集, 充分考虑社交网络的特殊性, 学者们对链路预测的研究不能仅仅靠节点属性或者网络拓扑结构, 而是把网络节点属性和网络拓扑特征结合起来研究, 不断提高精确度, 为社交网络的实际管理者提供决策依据和参考方案, 帮助制定和完善相关营销策略, 探索如何提升社交网络用户满意度和忠诚度的方法。

参考文献

考研英语作文预测 网络热词 篇5

话题:

网络热词的使用

(1)如今网络流行语频频掀起风潮,热的一塌糊涂。

(2)网络热词是否该在考试作文中被考生频繁使用。

(3)你的看法。

例文:

In such a networked society, people are tend to use hot words on the internet, which has been tagged with fashion and trend. These buzzwords are formed with the popularity of internet, which means that without the internet those works make no sense. But we can’t deny that they do enrich our communication words and contribute a lot in entertaining people. Internet buzzwords are extremely popular in the internet used by netizens, especially in the microblog, even in the students’ examination paper.

网络预测 篇6

Gartner研究副总裁Brian Prentice介绍,2012~2016年,IT领域将会出现的变化主要集中在云计算、社交网络和移动互联,以及产业链变革等领域。

在SNS方面,目前社交网络的竞争日渐激烈,技术提供商的竞争也同样加速。由于微软、IBM、Oracle、Google等大型企业正在大举渗透到社交网络市场,特别是企业级市场,因此,Gartner预测,到2013年,消费者社交网络投资泡沫即将破裂,而企业社交软件公司的投资泡沫也将于2012年破裂。

网络预测 篇7

网络流量预测对于分析和理解网络将要发生的网络行为、指导网络安全检测与控制具有重要的意义,网络流量具有非线性、多时间和多尺度等变化特性,如何建立高精度的网络流量预测模型已经成为研究热点之一。

当前网络流量均基于统计方法进行建模,是通过对预测网络流量过去的数据及资料进行统计和分析,对其未来的网络流量发展趋势进行定量的预测,主要有时间序列法和BP神经网络方法。时间序列预测法因根据事物过去的变化趋势预测未来的发展, 突出时间因素,外界因素不计入影响,在短期且没有相对比较大的变化时预测结果比较理想,但是当外界出现巨变,往往会出现比较大的偏差。因此,时间序列预测法适用于渐进变化的预测对象,没有明显波动,而网络流量受到多种因素影响,具有非线性、多时间和多尺度等变化的特性,因此时间序列法预测精度比较低。BP(Back Propagation)网络是一种按误差逆向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一,具有自组织、自适应、自学习等特点,具有很强的输入输出非线性映射能力,对解决非线性问题有着独特的先进性,成为当前网络流量建模与预测主要工具。但是,由于采用了误差函数按梯度下降的学习算法,极易陷入局部最小值点。此外,BP神经网络学习算法收敛慢,系统鲁棒性差,网络的性能对初始设置值依赖比较大。因此BP神经网络需要进行改进才能更好地应用到实际中。

为了提高网络流量预测精度,提出一种基于遗传算法优化BP神经网络的网络流量预测模型(GA-BPNN)。首先采集网络流量数据,并进行相应预处理,然后将网络流量训练样本输入到BP神经网络进行学习, 并采用遗传算法对BP神经网络参数进行优化, 最后采用建立的网络流量预测模型对网络流量测试集进行预测,并通过仿真实验对模型性能进行测试。

2 BP 神经网络和遗传算法

2.1 BP 神经网络概述

BP神经网络基本思想是网络训练过程由正向传播与误差反向传播两个过程组成。正向传播输入样本由输入层传入经隐层单元处理并计算每个单元实际输出传向输出层,若此时实际输出与期望输出相符,则网络训练成功结束,否则转入误差反向传播。误差反向传播从输出层开始经隐层向输入层逐层返回,根据实际输出与期望输出的误差修改各层单元连接权值。

BP神经网络正向传播与反向传播对各层单元权值修改是一个反复的过程,直到实际输出与期望相符或达到最大的训练次数为止。典型三层BP神经网络的拓扑结构如图1所示。

设wij为输入层第i个神经元与隐层第j个神经元的连接权值。

1)正向传播。输入层 :神经元i的输出值Oi等于输入值Ii对隐层,输出层:

作用函数f为Sigmoid函数,

2)反向传播。输出层实际输出yk与期望dk不一致时,有误差函数:

连接权值的修改按以下公式计算:

BP算法采用梯度下降方向修改连接权值 , 变化权值为:

其中学习率η取值为0<η<1,即对于输出层:

对于隐层:

2.2 BP 神经网络算法实现步骤

(1)初始化 ,对所有联结权w随机生成任意小的值 ,阈值θ的初始值及设定训练次数。

(2)输入训练样本及期望(xn,dm)。

(3)前向传播。计算隐层及输出层j单元输入,单元j输出

(4) 输出层yk与dk不相符按反向误差传播调整权值,从输出到隐层按下式更新权值。

当k为输出层:) , 当k为隐层 :计算。

(5) 转(2)重复执行 ,直到误差满足或达到最大训练次数为止。

标准BP神经网络用梯度下降算法求解, 易陷入局部极小值,在网络训练学习中难以避免学习收敛速度慢及训练过程出现振荡的问题, 为此采用遗传算法优化BP神经网络的参数。

2.3 遗传算法

遗传算法的优化原理是从随机生成的初始群体出发,采用基于优胜劣汰的选择策略选择优良个体作为父代,通过父代个体的复制、杂交和变异来繁衍进化的子代种群。经过多代的进化,种群的适应性会逐渐增强。遗传算法的优化是通过遗传算法中复制、杂交和变异算子的操作来实现的。

(1) 复制是进化个体经过轮盘赌选择 , 使父代的优良个体以较大的概率在子代中得到继承的遗传过程。

(2) 杂交是指父代中个体随机的交换染色体的基因在子代中产生新的个体。

(3) 变异是个体染色体的基因以变异概率发生随机质变的过程。

杂交和变异使后代中产生新个体,复制使父代的基因在子代中得以继承,从而使生物物种在继承的基础上不断进化。它可以避免局部优化从而保证收敛的全局搜索性。

3 遗传算法优化 BP 神经网络的网络流量预测模型

(1) 收集网络流量历史数据 ,并对其进行预处理。

(2) 初始化种群。随机产生一组个体 ,每一个个体包括BP神经网络初始连接权值和初始阈值。

(3) 对个体进行解码 ,根据相关联函数法确定τ、m,并对网络流量数据进行重构,并初始连接权值和阈值作为BP神经网络参数进行网络流量训练, 根据预测结果计算个体适应度值。适应度函数f(x)定义如下:

式中,yi为BP神经网络的预测值,为网络流量实际值,n表示训练样本个数。

(4) 采用最佳保留策略和轮盘赌选择较优的个体进行下一代。

(5) 根据交叉概率选择两个个体进行交叉操作 ,选择最优个体进行下一代。

(6) 根据变异概率选择两个个体进行变异操作 ,选择最优个体进行下一代。

(7) 判断算法结束条件 , 若满足结束条件则返回全局最优个体,若不满足,进化代数加1,并跳转至(3)继续优化。

(8) 将最优个体解码成为BP神经网络的初始连接权值和阈值。

(9) 根据初始连接权值和阈值建立最优网络流量预测模型。

4 仿真实验

4.1 数据来源

实验数据来源于某学校网络中心服务器, 从201年2月1日到2月21日每天网络的每小时访问流量得到480个数据,以前380个数据作为训练集建立网络流量预测模型, 后100个数据作为测试集进行预测检验,具体如图2所示。

4.2 数据归一化处理

BP神经网络模型在训练时对在0-1之间的数据最为灵敏,然而实际网络流量具有突变性,变化幅度较大为了提高训练的效率,对其进行归一化处理,具体为:

最后对网络流量预测结果进行反归一化处理,恢复真实预测值。

式中x表示网络流量原始数据,xmin和xmax表示分别最小值和最大值。

4.3 模型评价指标

为了说明GA-BPNN模型的有效性,在Matlab202环境下进行仿真实验。同时为了使GA-BPNN模型的预测结果具有可比性,采用标准BP神经网络(BPNN)作为对比模型 。模型性 能的评价 指标为均 方根误差 (roomean squared predict error,RMSE) 和平均绝对百分误差(mean absolute percentage error,MAPE),具体定义如下:

式中yt表示网络流量实际观测值,表示预测值。

4.4 结果与分析

4.4.1 不含噪网络流量的预测结果分析

首先采用遗传算法优化BP神经网络参数, 然后采用最优参 数BP神经网络 建立网络 流量预测 模型 ,GA-BPNN、BPNN对测试集的预测结果及预测误差如图3和4所示。从图3可知,GA-BPNN的预测结果与实际网络流量的值相当吻合, 十分接近, 这表明GA-BPNN可用于现代复杂多变、随机的网络流量预测,同时从图4可知 ,GA-BPNN的预测误差相当小 ,可以满足网络流量预测精度的要求。

GA-BPNN与对比模型的预测误差见表1。根据表1可知,相对于对比模型,GA-BPNN预测误差更高,相应的网络流量预测精度更高,这表明,GA-BPNN通过遗传算法对BPNN参数优化和选择,克服BP神经网络等预测精度低的缺陷,GA-BPNN是一种精度高、预测结果可靠的网络流量预测模型。

4.4.2 含噪网络流量的预测结果分析

为了测试GA-BPNN的通用性,对一个含噪的网络流量进行 仿真实验 , 含噪的网 络流量如 图5所示。GA-BPNN的含噪网络流量数据预测结果及预测误差如图6和7所示。从图6和7可知,对于含噪的网络流量,GA-BPNN同样获得 了较理想 的预测结 果 , 这表明GA-BPNN采用遗传算法优化BP神经网络 , 获得了较好的网络流量训练集, 增加了模型的鲁棒性和通用性,拓宽了GA-BPNN在网络流量的应用范围。

GA-BPNN与BPNN对含噪网络流量预测误差见表2。从表2可知,相对于对比模型,GA-BPNN的整体预测性能更优,建立了误差更小的网络流量预测模型,再一次证明了GA-BPNN的优越性。

5 结束语

网络预测 篇8

关键词:网络流量,小波分析,p值,神经网络,流量预测

0引言

随着网络的迅猛发展以及各种网络服务的广泛应用,网络拓扑结构渐趋复杂,网络出现拥塞与突发事件的可能性越来越大,所以越来越需要对网络的性能进行监控与预测。网络流量模型的建立是对网络性能即网络流量的预测,可以在网络出现拥塞之前给出预测。本质上说,网络流量数据是一种时间序列数据[1],可以通过传统的时间序列处理方法对其进行建模和预测。真实环境中的网络流量呈现出相当明显的多尺度特性,如分形、长相关、自相似性和院突发性等,但由于传统的网络流量模型只能处理平稳过程和特殊的非平稳过程,所以在描述网络流量行为时误差较大,如Matkov模型、Poisson模型、自回归(AR)模型和自回归滑动平均(ARMA)模型等,这些模型已不能有效刻画流量的这些特性,寻求新模型方法成为当前网络流量行为研究的一个热点。

1相关工作

近几年,众多学者对网络流量的预测算法进行了改进[2,3,4,5,6],比如文献[2]提出一种基于Gamma小波模型的预测方法,将原始数据分解为高频信号和低频信号,采用Gamma小波模型对低频信号进行建模并获取服从Gamma分布的序列,分别对刚获取的序列以及高频信号采用加权一阶局域法进行预测,重构小波以合成数据。通过实验和数学分析的方法,证实该预测模型能够进行网络流量的短期预测。文献[3]根据实际网络中测量得到的网络流量数据,提出一种改进型Elman神经网络模型——季节性输入多层反馈Elman网络。该模型在网络权值的训练过程中引入混沌搜索机制,利用Tent映射的遍历性进行混沌变量的优化搜索,以减少数据冗余,解决局部收敛问题。实验结果表明,该模型及其算法有效提高了网络的训练速度及网络流量的预测精度。文献[4]提出了一种基于卡尔曼滤波和小波分析混合的流量预测算法,通过对网络流量的线性部分和非线性部分进行区分对待,从而提高预测的准确度和实时性。仿真结果表明,该算法与单一的线性预测算法和非线性预测算法相比,具有较高的预测精度和较好的实时性。然而,上述方法大多采用线性或者非线性的方法进行处理,这种片面性造成预测的准确度和实时性难以保证。鉴于此,将小波变换与偏相关的人工神经网络进行耦合提出了一种基于p值的神经网络预测算法,实验结果表明,该方法的预测准确性要高于传统的方法。

2基于小波的网络流量多尺度分析

通过离散小波变换把一个一维的网络流量信号分解为2个一维信号,分别是时间平移后的近似信号和尺度(频率)上缩放后的细节信号。信号分解的主要过程如下:选定小波尺度函数ϕ0和小波函数φ0以构建带通小波函数基ϕj,k和低通尺度函数基φj,k(文中采用Haar小波的小波模型),这样原始的网络流量信号可以通过小波基的平移和收缩来表示:即近似信号可以通过一系列尺度系数来表示,细节信号可以通过一系列小波系数来表示。小波函数基和小波函数以及尺度函数基和尺度函数的关系为:

设信号为X(k),Vj是由尺度函数基ϕj,k生成的子空间,Wj是由小波函数基φj,k生成的子空间,有Vj=Vj-1♁Wj-1,∀jZ,把此正交依次分解下去,可得到式(2),其中n为分解层数。

Vj=Vj-1♁Wj-1=Vj-2♁Wj-2♁Wj-1=…=

Vj-nWj-n♁…♁Wj-2♁Wj-1。 (2)

通过把信号X(k)投影到每一个逼近的子空间Vj,从而近似信号可以通过下面的关系得到:

Aj(t)=kax(j,k)ϕj,k(t)。 (3)

式中,Aj(t)为第j层的近似信号;系数ax(j,k)表示信号X(t)与ϕj,k的内积。同理,细节信号可以通过下面的关系得到:

Dj(t)=kdx(j,k)φj,k(t)。 (4)

式中,Dj(t)为第j层的细节信号;系数dx(j,k)表示通过信号X(t)和φj,k的内积。基于以上的多尺度分析,网络流量信号可以通过其逼近信号以及相应的细节信号无损地表示出来,即

X(k)=Aj(t)+j=0jDj(t)=kax(j,k)ϕj,k(t)+j=1jkdx(j,k)φj,k(t)(5)

3p值的确定

由于网络流量具有自相似性与相关性,经过小波变换对网络流量信号进行了多尺度分析后,可以将非平稳时间序列分解为多个较平稳的细节信号及一个经过低通滤波而比原序列平滑得多的近似信号,分解后的信号不仅没有丢失相关性而且进行了平滑,所以以分解后的近似信号作为新的预测序列,对其采用AR(p)定阶的偏相关计算,计算其偏相关系数,再基于偏相关系数的截止性来确定p值。计算的主要过程如下:

步骤1:建立AR(p)模型的Yule-Walker估计。偏相关系数φkk可由自相关系数ρ(k)唯一地确定,即

步骤2: 确定ρ(k)的取值。可由式(7)计算所得,其中Xkk时刻的流量值。

ρ(k)=t=1Ν-kXt-kXtt=1ΝXt2。 (7)

步骤3:基于式(6)和式(7),采用求解线性方程组中的Cramer法则得到偏相关系数φkk,并基于φkk的截止性确定P值。

4构建神经网络

基于确定的P值,将P值与神经网络进行耦合,以p+1来划分数据,将其前p项作为输入,后一项作为输出对网络进行训练,从而使得神经网络的输入与输出的选择更加合理,预测的结果也更加准确。具体的步骤如下:

步骤1:确定输入层的输入个数P。当P<3时,为了提高学习的准确性将输入增加到3个。输入输出样本分类如式(8)所示,左边为输入层的P个输入数据,右边为输出数据,以此对整个分解的信号进行学习。其中Ai+pk表示在尺度K下的第i+p个近似信号。由于采用的是自回归的方式来确定输入的个数,所以更好地体现了输入与输出的关系,有利于学习的准确性。

步骤2:确定隐层神经元的数目。如果隐藏层神经元的数目太多会导致运行时间过长,学习时间过长,预测效果不一定最佳。也会导致容错性差,不能识别以前没有看到的样本。因此一定存在一个最佳的隐含层单元数。根据实验来对隐含层单元数进行调整,首先放入足够多的隐含层数目,通过学习将其中不起作用的隐含层单元除去,直到神经网络对网络流量的预测准确率过低,网络不能再收缩时为止来进行动态确定。

步骤3:基于历史的网络流量数据,对网络进行训练,基于流量预测的神经网络训练算法如下:

输入:网络流量序列xk,P值,k=1,2,…,m

输出:基于神经网络的预测值。

步骤1:初始化神经网络,为每个连接权值、阈值赋予[0,1]内的随机值;

步骤2:选取一组输入流量序列样本xk以及P值提供给网络,并计算如下节点信息:使用输入样本xk、连接权值uij及阈值θj计算隐含层各单元的输入gj、输出lj;使用中间层输出lj、连接权值vjt及阈值βt计算隐含层各单元的输入et、输出qt

步骤3: 逐步修正各层误差:利用网络实际输出qt计算输出层各单元的误差dt,并结合隐含层各单元的输出lj来修正连接权值vjt和阈值βt;利用连接权值vjt、输出层各单元的误差dt与中间层各单元的输出lj来计算中间层各单元的误差zj,并结合输入层各单元的输入样本来修正连接权值uij和阈值θj

步骤4:选取下一个训练样本向量对网络进行训练,直到m个样本全部训练完毕。

步骤5: 从上述m个输入向量中重新随机选取样本进行训练直到网络的全局误差小于某一预先设定的阈值或者训练时验证集出现错误的次数超过限制数目(防止拟合过度)。

步骤6:基于训练好的神经网络,隐藏节点和输出节点的激励都取logsig函数,得到输出为:

y=logsig(Vjt*yk+bm+1)。 (9)

式中,bm+1为最后输出产生的误差;yk为隐藏节点的输出,

yk=logsig(uij*xk+bk),k=1,2…m。 (10)

5网络流量预测模型

将通过神经网络得到的预测值,通过小波重构即能恢复得到最终的网络流量预测值。综上所述,提出的网络流量预测模型算法(WPBP算法)的主要步骤如下:

输入:网络历史流量数据。

输出:网络流量预测结果。

步骤1:对历史网络流量序列进行小波多尺度分解,得到一个以逼近信号和细节信号无损地表示信号X(K),如式(5)所示;

步骤2:采用Cramer法则计算X(K)的自相关系数与偏相关系数,根据AR(p)理论求出序列的相关程度p;

步骤3: 根据P值确定合理的输入层数,对网络进行训练,建立神经网络模型;

步骤4:将通过神经网络得到的预测值进行小波重构,最后得到最终的网络流量预测值。

6模拟仿真

采用贝尔实验室从2009年10月3日23点46分开始经过122 797.83 s所采集的数据进行研究,这些流量包括数据、视频、局域网和广域网业务流,数据封装在BC-Oct89Ext.TL中。由于流量BC-Oct89Ext.TL记录的是时间戳与包的长度,为了便于研究对它进行预处理,将其转化成在一定的时间间隔内包到达的个数。这里取时间间隔为10 min,分成了205个时间段。以下用MATLAB进行仿真,将上述处理后的流量导入小波模型中,采用Mallat算法进行小波的分解,小波基为Haar小波。基于分解的尺度特性和时间复杂度的考虑,这里取分解尺度为3。经过处理后的原始网络流量,横轴表示时间间隔为10 min的时间序列,纵轴为到达包数即网络的流量,如图1所示。经过小波分解后尺度为3的近似信号,从图2中可以看出近似信号序列是原始信号的逼近,近似信号序列反映了原始网络流量序列的总体特征,信号曲线更光滑,并且具体很强的自相关性。

对于逼近信号要先确定其自相关程度,即神经网络的输入个数。这里取前150个序列数据,对后50个数据进行预测。

根据自相关和偏相关的理论可以看出近似信号的自相关性是很明显的,由AR(p)定阶的理论可以得出p值为3,为了预测的准确性和降低时间复杂性,这里取p=3+1,由此可以确定神经网络的输入个数为4,输出层为1个。根据式(5)隐藏层的神经元细胞为10,这里a=8。所以采用的是4×10×1的神经网络。设置最大学习次数为1 000次,学习速率为0.000 1,学习最小均方误差0.000 1,设置输入层与中间层的连接权值、中间层与输出层的连接权值初始值为[-1,l]的随机数。

用MATLAB对后55个近似信号时间序列进行的仿真的预测值与真实值之间的比较,如图3所示。

为了提高预测的准确性,这里输入层的输入值采用当时的真实值进行预测。可以看出通过自相关的神经网络的预测基本拟合了尺度信号。预测值与真实值的比较如图4所示。从图4中可以看出预测值基本拟合了真实值。

为了衡量该方法对于实际流量的预测效果以及与传统的预测方法之问的优劣,采用相对均方差(RMSE)作为一种评判标准,它既考虑了误差本身的大小,也考虑了和信号之间的相对关系,通常值越小则预测越准确。其定义如下:

RΜSE=(xt-x^t)2xt2

用传统方法和本算法对近似信号与细节信号的预测对比如表1所示。表1中可以看出该文提出的基于p值的BP算法比传统的预测算法误差要小、准确性高,对近似信号的预测准确性明显优与传统预测算法。对细节信号的预测有待进一步改进。

7结束语

上述将小波与神经网络通过相关性理论衔接,针对实际流量呈现出的相似特性与尺度特性,对流量数据进行小波多层分解。通过相关性确定神经网络输入与输出的关系使流量序列的学习更加有针对性与科学性,通过小波重构得出最终的网络预测值。仿真结果表明,此方法的预测准确性要高于传统的方法。下一步的工作主要是提高细节信号的预测准确性。 

参考文献

[1]洪飞,吴志美.基于小波的多尺度网络流量预测模型[J].计算机学报,2006,29(1):32-39.

[2]孙勇,白光伟,赵露.基于Gamma小波模型的网络流量预测[J].计算机工程,2011,37(9):187-189.

[3]党小超,郝占军,门健.新型Elman混沌神经网络的流量预测[J].计算机工程,2011,37(3):172-174.

[4]李捷,刘瑞新,刘先省,等.一种基于混合模型的实时网络流量预测算法[J].计算机研究与发展,2006,43(5):806-812.

[5]FENG Hui-fang,SHU Yan-tai.A Robust System forAccurate Real-time Summaries of Internet Traffic[J].Sigmetrics Performance Evaluation Review,2005,33(1):85-96.

网络预测 篇9

对于网络使用对用户身心健康的消极影响, 有研究者[9]采用“网络成瘾 ( Internet addiction) ”、“网络依赖 ( Internet dependence) ”等词汇来定义。后继有研究者侧重于强调该行为的非理性和不良后果, 如Beard等[10]提出“问题性网络使用 ( pathological Internet use, PIU) ”的概念, 即指对个体的心理状态、社会行为和家庭生活等方面带来消极影响的网络使用行为。国内学者的研究中也沿用此概念来表述网络活动对青少年身心健康产生的消极影响[11,12,13]。本文通过纵向研究, 探讨前期网络活动对后期青少年问题性网络使用的预测作用, 为引导青少年正确使用网络及减少问题性网络活动带来的不利影响提供参考。

1 对象与方法

1. 1对象被试选自中国科学院心理研究所双生子研究样本库。该样本库在2008—2009年共收集了北京18个区县的1 378对青少年双生子的相关测查数据; 在平均间隔1. 5 a之后, 于2009—2010年对样本进行了追踪, 采集到1 004对双生子数据。本研究从追踪到的第二轮样本中随机抽取1 650人作为被试, 年龄在9 ~19岁之间, 平均年龄为 ( 14.12±2.77) 岁, 其中男生占45.6%, 女生占54.4%。本研究的被试均完成了第一轮网络活动问卷的调查和第二轮问题性网络使用问卷的测试。

1. 2测量工具

1. 2. 1网络活动问卷采用自编的“网络活动问卷”对青少年网络使用状况进行调查。让青少年自评上网时间 ( 包括在工作日和周末平均上网时间) 及上网主要进行的活动等。上网活动采用多项选择, 参考雷雳等[13]的研究, 将网络活动归纳为娱乐、社交和信息3种, 每种活动包括4个小条目。共有12个条目, 包括网络游戏、网上聊天、论坛活动和网上教育与课堂等。

1. 2. 2问题性网络使用问卷问卷改编自Young ( 1998) 的网络成瘾问卷 ( Internet Addiction Scale, IAS) [14], 原问卷共20个项目, 具有较好的信、效度。由于本研究针对的是青少年人群, 从原量表中抽取了13项适于青少年且符合青少年日常生活的项目[15,16]。量表采用4点计分 ( “1—非常不符合”到“4—非常符合”) , 总分为13 ~52分。被试选择最符合自己实际情况的选项。量表的总分越高, 表示被试问题性网络使用行为越严重。本研究中, 该量表具有良好的内部一致性 ( Cronbachα系数为0.883) 。

1. 3数据处理及统计分析采用SPSS 13. 0进行统计处理。通过相关分析考察青少年上网时间、网络活动偏好与问题性网络使用的关系; 通过回归分析考察青少年周末上网时间对问题性网络使用的预测作用。

2 结果

2. 1上网时间与问题性网络使用的关系被试周一至周五平均每天上网时间、周六和周日平均每天上网时间及总上网时间与问题性网络使用均呈正相关 ( r值分别为0.143, 0.246, 0.226, P值均 <0.01) 。其中青少年倾向于在周末长时间上网, 见图1。通过回归分析, 在控制了性别、年龄、工作日上网时间和家庭经济状况之后, 周末上网时间能显著预测问题性网络使用的得分 ( B = 1. 554, Beta = 0. 268, t = 8. 042, P <0. 01) 。见表1。

2. 2网络活动偏好与问题性网络使用的关系对第一轮网络活动偏好的描述统计结果显示, 青少年使用互联网最多的是娱乐活动, 有67. 8% 喜欢玩网络游戏、多媒体娱乐、博客等; 其次是获取信息, 有61. 5%喜欢在互联网上浏览新闻、搜索、网上教育和电子邮箱; 第三是社交活动, 有55.8%喜欢参与网上聊天、即时短信、校友录和论坛。在这些活动类型中, 除了女生参与信息活动比例 ( 68. 2%) 略高于男生 ( 53. 5%) 外, 其他2项活动男生和女生参与的程度均类似 ( 娱乐女生为67. 2%, 男生为68. 5%; 社交女生为55.8% , 男生为55. 7% ) 。

注:变量赋值中, 性别, 男 =1, 女 =2; 实际年龄数值; 工作日/周末每天上网时间, <1 h =1, 1 ~h =2, 2 ~h =3, 4 ~h =4, ≥6 h =5; 家庭经济状况, 很宽裕 =1, 中等 =2, 中下 =3, 比较困难 =4。

通过相关分析发现, 第一轮测试参与娱乐和社交活动的种类越多, 第二轮测试中问题性网络使用得分就越高 ( r娱乐= 0. 192, r社交= 0. 182, P值均 < 0. 01) , 参与信息活动的种类与问题性网络使用没有相关性 ( r信息= 0. 008, P = 0. 748) 。将娱乐和社交活动以2项为划界点, 参与0 ~1项娱乐活动 ( 社交活动) 为低娱乐组 ( 低社交组) , 参与2 ~4项娱乐活动 ( 社交活动) 为高娱乐组 ( 高社交组) , 将被试分为高娱乐高社交组、高娱乐低社交组、高社交低娱乐组和低娱乐低社交组。单因素方差分析发现, 4个组青少年的问题性网络使用得分分别为 ( 23. 63±7. 88) , ( 22. 75±6.89) , ( 21. 57±6. 05) , ( 20. 88±7. 00) 分, 差异有统计学意义 ( F =9.11, P <0.01) ; 事后比较发现, 高娱乐高社交组、高娱乐低社交组的得分高于高社交低娱乐组和低娱乐低社交组 ( P值均 <0.05) 。

3 讨论

本研究发现, 个体上网时间越长, 问题性网络使用的得分越高, 说明个体上网的时间与问题性网络使用关系密切。进一步将上网时间细分为工作日上网时间和周末上网时间, 发现后者更能预测问题性网络使用的发生。可能是因为在周一到周五的工作日, 青少年需要在学校上课, 个体作息很大程度上受到学校作息的约束, 没有时间参与网络活动; 而到了周末, 个体对时间的支配更加灵活, 限制更少。因此, 个体周末上网的时间可能更准确地反映个体上网的意愿。

本研究在对个体网络活动偏好进行分析时发现, 青少年喜欢从事的活动主要是娱乐活动, 其次是信息获取和社交活动。其中娱乐和社交活动的频率与后期发生问题性网络使用有重要关系, 而信息活动与后者无相关。由于青少年上网不是单纯的进行某一项活动, 因此有必要关注娱乐和社交两种活动对问题性网络使用共同的影响。本研究根据青少年活动的类型进行细分发现, 高娱乐高社交组和高娱乐低社交组问题性网络使用的得分高于高社交低娱乐组和低娱乐低社交组, 表明较之于单纯的社交活动, 娱乐活动更可能使青少年沉迷网络。

网络预测 篇10

近年来, 以非线性为特征的人工神经网络 (Artificial Neural Network, ANN) 引起人们的广泛兴趣。人工神经网络具有大规模并行模拟处理非线性动力学和网络全局作用等特点, 能以任意精度逼近任意非线性函数, 同时还具有很强的自适应、自学习及其容错能力[8]。目前应用最广泛的ANN模型是由Rumelhart、McClelland于1985年提出的BP神经网络模型, BP神经网络是一种多层前馈神经网络 (Back-propagation, 反向传播) , 具有抑制与激活神经网络节点, 自动决定影响性能的参数及其影响程度的特点[9], 已在函数逼近、模式识别、分类、数据压缩等领域得到广泛应用。因此, 本文试图运用BP神经网络模型对福建省人口死亡率进行预测, 以期揭示人口死亡率动态变化规律, 掌握人口变化动态, 为经济社会发展和计划生育提供决策支持。

1 研究区概况

福建省位于北纬23°33′~28°20′、东经115°50′~120°40′之间, 地处亚热带, 背山面海, 气候温和, 雨量充沛, 四季常青。福建省地处中国东海之滨, 东隔台湾海峡与台湾省相望, 东北与浙江省毗邻, 西北横贯武夷山脉与福建省交界, 西南与广东省相连, 是中国距离东南亚、西亚、东非和大洋洲最近的省份之一。全省土地面积为12.14万平方公里, 其中山地丘陵占80%以上, 有“八山一水一分田”之称, 森林资源丰富, 是我国南方的重点林区之一。森林覆盖率65.95%, 居全国第一, 有“绿色宝库”之称。福建沿海有属亚热带海洋和大陆架浅海, 是寒暖流交汇地方, 鱼、虾、贝、藻种类繁多, 经济鱼、对虾、扇贝等海珍品资源丰富, 是我国的主要渔区。福建境内山峦起伏, 溪河纵横、山青水秀, 文物古迹众多, 旅游资源十分丰富, 武夷山被联合国教科文组织列入《世界自然与文化遗产名录》。

2 数据来源与处理

本文数据来源于福建省2013年统计年鉴[10], 对福建省1978—2012年的人口死亡率数据进行实证分析和检验, 并对2013—2015年人口死亡率进行预测。由于BP神经网络算法是一种梯度下搜索降法, 存在学习后期收敛速度慢、易于陷入误差函数的局部极小点;对于较大搜索空间, 多峰值和不可微函数不能有效搜索到全局最小点[11]。而Leven-berg-Marquardt优化方法与Bayesian正则化方法 (trainbr函数) 具有很好的推广能力, Leven-berg-Marquardt优化方法进行网络权值和阈值的最优化搜索, Bayesian正则化方法在网络训练过程中自适应地调节性能函数比例系数C的大小, 使其达到最优[12]。因此, 运用改进BP神经网络, 建立福建省人口死亡率预测模型。在进行BP神经网络算法前需对输入、输出节点数据做归一化处理, 即x’=x/xmax, 将输入样本矩阵范围控制在[0, 1]内。式中x为输入、输出节点值, xmax为节点最大值。

3 研究方法

3.1 BP神经网络模型

3.1.1 BP神经网络结构

人工神经网络 (ANN) 是由若干个人工神经元相互连接组成的广泛并行互联的网络, 是一种试图模拟人的神经系统建立起来的非线性动力学系统。神经网络理论的Kolmogrov定理证明[13]:具有n个输入神经元, 2n+1个隐含层神经元和m个输出神经元的3层BP神经网络可任意逼近任何紧致子集上的连续函数。3层BP神经网络结构可用图1表示。

3.1.2 BP神经网络学习规则

BP算法是一种监督式的学习算法, 主要思想就是通过学习样本与输出样本之间的误差乱来不断修正权值, 使网络的输出不断地接近期望的输出, 网络输出层的误差最小。通过连续不断地在相对于误差函数斜率下降的方向上计算网络权值和偏差的变化而逐渐逼近目标, 每一次权值和偏差变化都与误差的影响成正比, 并以反向传播的方式传递到每一层。其核心思想就是将输出误差以某种形式通过隐层向输入层逐层反传, 将误差分摊给各层的所有单元, 修正各单元权值[14]。神经网络算法步骤如下:

1) 网络初始化。给各连接权值分别赋一个区间 (-1, 1) 内的随机数, 设定误差函数e, 给定计算精度值ε和最大学习次数M;

2) 随机选取第k个输入样本及对应期望输出;

3) 计算隐含层各神经元的输入和输出;

4) 利用网络期望输出和实际输出, 计算误差函数对输出层的各神经元的偏导数δo (k) ;

5) 利用隐含层到输出层的连接权值、输出层的δo (k) 和隐含层的输出计算误差函数对隐含层各神经元的偏导数δh (k) ;

6) 利用输出层各神经元的δh (k) 和隐含层各神经元的输出来修正连接权值who (k) ;

7) 利用隐含层各神经元δh (k) 和输入层各神经元的输入修正连接权。

8) 计算全局误差

9) 判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数, 则结束算法。否则, 选取下一个学习样本及对应的期望输出, 返回到第三步, 进入下一轮学习。

3.1.3 网络节点确定

网络输入层节点是系统的自变量个数, 输出层节点数就是系统目标个数, 隐含层节点数的选取较为复杂, 节点数太少, 网络难以识别样本, 容错性降低, 训练能力就会变弱, 无法完成精确预测;节点数太多, 会增加网络的迭代次数, 训练时间变长, 降低网络的泛化能力, 导致预测能力下降, 一般可按以下公式选取[15]: 为输入神经元数, n2为输出神经元数, a为0~10之间的常数。

3.2 灰色预测理论

灰色预测法是一种对含有不确定因素的系统进行预测的方法, 灰色系统是一种介于白色系统和黑色系统之间的一种系统。信息完全明确的系统称为白色系统, 信息完全不明确的系统称为黑色系统, 部分信息已知, 部分信息未知, 即信息不完全明确的系统称为灰色系统。灰色预测通过鉴别系统因素之间发展趋势的相异程度, 并对原始数据的生成处理来寻找系统变动规律, 从而建立预测模型来预测事物未来发展趋势。

3.2.1 GM (1, 1) 模型

GM (1, l) 模型是最常用的一种灰色模型, 它是单变量的一阶线性动态模型, 主要用于外推性预测, 具体建立模型步骤如下[16]:

设时间序列X (0) 有n个观察值, X (0) ={X (0) (1) , X (0) (2) , …, X (0) (n) }, 通过累加生成新序列X (1) ={X (1) (1) , X (1) (2) , X (1) (3) , …, X (1) (n) }, 则GM (1, 1) 模型相应的微分方程为:

式中, a为发展灰数, μ为内生控制灰数。

其中:

求解微分方程, 可得预测模型为:

3.2.2 模型检验

2) 关联度检验。根据关联度计算方法, 计算出 (i) 与原始序列X (0) (i) 的关联度系数, 然后计算出关联度, 一般来说, 当ρ=0.5时, 关联度大于0.6即可。

3) 后验差检验。

计算原始序列的标准差:

计算绝对误差序列的标准差:

计算小误差概率:

令ei=|Δ (0) (i) -Δ- (0) |, S0=0.674S1, 则P=p{ei

若残差检验、关联度检验、后验差检验都能通过, 则可以用所建模型进行预测;否则应进行残差修正。

4 人口死亡率预测实证分析

4.1 人口死亡率样本训练与预测

为对福建省人口死亡率进行验证和预测, 根据2013年福建统计年鉴1978—2012年人口死亡率数据进行建模和预测。影响人口死亡率因素众多, 在建立死亡率预测模型时很难找出所有的影响因素。而人口死亡率历史统计数据是所有影响因素相互作用的结果, 其中隐含包括了这些影响因素对人口死亡影响的规律。因此, 本文先使用单步预测, 然后再将输出反馈给输入端作为网络输入的一部分, 构建滚动神经网络预测模型。将外部因素对人口死亡率的影响规律通过神经网络模型进行表达, 而不需要人为分析影响人口死亡的外部因素, 避免了因选择外部因素不同造成的预测偏差。

以福建省1978—1982年、1979—1983年、…、2007—2012年人口死亡率数据作为网络输入, 1983、1984、…、2012年数据作为理想输出, 即以前5年数据为BP神经网络的输入变量, 以当年数据为网络输出变量, 其中1978—1982年、1979—1983年、…、2002—2006年共25组样本数据对网络进行训练, 2003—2007年、2004—2008年、…、2007—2011年共5组数据为验证样本集, 采用BP神经网络模型预测2013—2015年人口死亡率。本文运用MATLABR2013a中神经网络模块建立人口死亡率预测模型, 根据网络结构, 输入层节点选择5, 输出层节点数为1, 为了缩短训练的时间, 隐含层为1层, 经过反复测试, 节点数设为8, 见图2。

为对样本进行训练, 首先对BP神经网络的相关参数进行设置。BP神经网络创建:net=newff (minmax (P) , [8 1], {′tansig′, ′purelin′}, ′trainbr′) , 设置BP神经网络的隐含层神经元数、输出层神经元数, 隐含层神经元采用曲正切S型传递函数tansig激活函数, 输出层采用线性传递函数purelin, 网络训练算法采用trainbr函数。网络训练参数:设置网络训练次数, net.trainParam.epochs=5000;设置显示当前网络训练误差间隔次数, net.trainParam.show=50;设置网络训练目标误差, net.trainParam.goal=0.001;设置自学习的学习率, net.trainParam.lr=0.001。网络模型参数确定后, 对网络进行训练和测试, 神经网络训练图见图3。从图3可以看出, 网络学习训练到117次时, 就达到了学习精度0.0014253, 其学习速度较快, 训练数据与所设计的网络模型相符, 误差较小, 样本拟合情况理想, 见图4。

根据训练好的网络, 对2008—2012年的人口死亡率进行预测检验, 见表1。从表1可以看出, 改进BP神经网络预报结果相对误差率较小, 最小相对误差率为1.05%, 最大相对误差率为3.75%, 平均相对误差率为2.54%, 并且进一步预测2013年至2015年人口死亡率分别为5.59‰, 5.84‰, 5.67‰。可以看到BP神经网络预测未来人口死亡率还存在一个波动过程, 但是都在5.5%以上, 表明未来一段时间还存在控制人口死亡压力。

4.2 GM (1, 1) 模型

运用灰色系统理论中的灰色预测GM (1, 1) 模型预测人口死亡率, 分析模型精度, 与BP神经网络进行对比分析。以1978—2007年作为原始数据, 通过GM (1, 1) 模型预测得到模型方差比C=0.2613<0.35, P=1.0000>0.95, 后验差检验通过, 表明模型具有较好的预测能力, 预测模型为:

2008年—2012年预测人口死亡率见表2, 从表2可以看出, GM (1, 1) 预测结果相对误差率较大, 最大相对误差率为8.40%, 平均相对误差率为5.91%, 进一步预测未来三年人口死亡率, 得到2013年人口死亡率为5.53‰, 2014年为5.50‰, 2015年为5.49, ‰, 基本在5.50‰左右跳动。

5 结论与讨论

1) 通过BP神经网络模型, 以福建省1978—2007年的人口死亡率数据为训练样本, 2008—2012年人口死亡率为检验样本, 对人口死亡率进行预测检验。结果表明BP神经网络拟合效果理想, 模型训练117次结束, 预测数据的最大相对误差率、平均相对误差率分别为3.75%、2.54%, 预测精度较高。

2) 通过运用灰色预测模型GM (1, 1) 进行预测, 结果表明2008—2012年GM (1, 1) 灰色模型预测人口死亡率与实际死亡率误差为比BP神经网络模型预测误差大, 在建模样本相同的情况下, BP神经网络具有比其他数学方法更好的预测精度。

3) BP神经网络的非线性系统大大提高了模型预测精度, 但是由于BP神经网络算法是一种梯度下搜索降法, 易陷入误差函数的局部极小点, 在某些情况下不能有效搜索到全局最小点。因此在BP算法中采用Trainbr训练函数, 提高模型的泛化能力, 并且对隐含层节点数综合考虑, 增强模型预测性能。

4) BP神经网络用于人口死亡率预测具有其他预测方法所不具有的优越性, 预测结果较为精准, 避免了其他复杂模型难以掌握, 预测精度低的缺点, 在一些地区人口死亡率预测中已得到广泛应用, 说明BP神经网络模型预测结果可靠。

摘要:根据2013年《福建统计年鉴》上收集到的资料, 运用GM (1, 1) 模型以及MATLAB构建3层BP神经网络结构模型, 分别对福建省人口死亡率进行建模预测。结果表明:BP神经网络预测人口死亡率拟合结果优于GM (1, 1) 模型, 最小相对误差率为1.05%, 最大相对误差率为3.75%, 平均相对误差率为2.54%, 拟合结果显示模型可靠。BP神经网络非线性结构系统, 具有预测精度高, 可行性强的特点, 表明BP神经网络可用于未来人口规模预测, 为福建省经济社会发展战略与规划, 调整人口结构, 制定合理的人口决策提供参考。

网络预测 篇11

关键词:BP神经网络;电力负荷;短期预测

中图分类号:TP183 文献标识码:A文章编号:1007-9599 (2010) 09-0000-02

Power Load Short-term Forecasting Based on BP Neural Network

Wang Jing,Yang Xiao

(School of Economics&Management,North China Electric Power University,Beijing102206,China)

Abstract:Load forecasting is an important task in power system.We forecasted short-term load for a region of southern based on BP neural network.Firstly,we introduce the structure of BP neural network,and then we make use of the data to do empirical research by using BP neural network of the region.And we consider the meteorological factors in the design of the BP neural network structure.

Keywords:BP Neural Network;Power Load;Short-term Forecast

一、引言

目前,全国供电紧张,部分严重地区经常缺电,造成许多发电设备不能及时检修,处于超负荷的运转状态。会导致机组老化加速,出现不可预见的事故,造成人员、财产的伤亡。因此对未来电网内负荷变化趋势的预测,是电网调度部门和设计部门所必须具备的基本信息之一。

电力系统负荷预测是电力生产部门的重要工作,通过精确的预测电力负荷,可以经济的调度发电机组,合理安排机组启停、机组检修计划,降低发电成本,提高经济效益。负荷预测对电力系统控制、运行和计划都有着重要的意义。电力系统负荷变化受多方面的影响,包括不确定性因素引起的随机波动和周期性变化规律。并且,由于受天气、节假日等特殊情况影响,又使负荷变化出现差异。神经网络具有较强非线性的映射功能,用神经网络来预测电力负荷越来越引起人们的关注。

二、BP网络理论

(一)BP网络结构

BP神经网络全称为Back-Propagation Network,即反向传播网络,是一种多层前馈神经网络,结构图如图1所示,根据图示可以知道BP神经网络是一种有三层或三层以上的神经网络,包括输入层、中间层(隐层)和输出层。前后层之间实现全连接,各层之间的神经元不进行连接。当学习样本输入后,神经元的激活之经由各层从输入层向输出层传递。之后,根据减少目标输出与实际输出误差的原则,从输出层反向经过各层至输入层,逐级修正各连接的权值,该算法成为“误差方向传播算法”,即BP算法。由于误差反向传播不断进行,网络对输入模式响应的正确率也不断上升。

BP神经网络传递函数不同于感知器模型传递函数,BP神经网络要求其必须是可微的,所以感知器网络中所用到的硬阈值传递函数在BP神经网络中并不适应。BP神经网络中常用的传递函数有正切函数、Sigmoid型的对数或线性函数。由于这些函数均是可微的,所以BP神经网络所划分的区域是一个非线性的超平面组成的区域,是一个比较平滑的曲面,它比线性划分更加的精确。另外,网络才有严格的梯度下降法进行学习,权值修正的解析式分非常明确。

(二)BP网络算法

(1)初始化。给没给连接权值 、 、阈值 与 赋予区间 内的随机值

(2)确定输入P和目标输出T。选取一组输入样本 和目标输出样本 提供给网络。

(3)用输入样本 、连接权 和阈值 计算中间层各单元的输入 ,然后用 通过传递函数计算中间层各单元的输出 。

(4)利用中间层的输出 、连接权 和阈值 计算输出层各单元的输出 ,然后通过传递函数计算输出层各单元的响应 。

(5)利用目标向量 和网络的实际输出 ,计算输出层各单元的一般化误差 。

(6)利用连接权 、输出层的一般化误差 和中间层的输出 计算中间层各单元的一般化误差 。

(7)利用输出层各单元的一般化误差 与中间呈个单元的输出 来修正连接权 和阈值 。

(8)利用中间层各单元的一般化误差 ,和输入层各单元输入P来修正连接权 和阈值 ,计算方法同(7)。

(9)达到误差精度要求或最大训练步数,输出结果,否则返回(3)

三、实证研究

(一)神经网络结构设计

本文以南方某缺电城市的整点有功负荷值,在预测的前一天中,每隔2小时对电力负荷进行一次测量,这样,可以得到12组负荷数据。此外电力负荷还和环境因素有关,文章选取预测日最高气温、最低气温和降雨量气象特征作为网络输入变量。所以设计的网络结构为:15个输入层节点和12个输出向量,根据Kolmogorov定理可知,网络中间层的神经元可以去31个。

(二)输入数据归一化处理

获得输入变量后,为了防止神经元饱和现象,在BP神经网络输入层进行归一化,文章才有如下公式进行变换。

(三)实证分析

中间层神经元传递函数和输出层传递函数分别采用S型正切函数tansig和S型对数函数logsig,因为这连个函数输出区间为[0,1],满足网络设计的需求。

利用以下代码创建一个满足上述要求的BP神经网络。

threshold=[0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1; 0 1];

netbp=newff(threshold,[31,12],{’tansig’,’logsig’},’trainlm’)

其中變量threshold用于规定输入向量的最大值和最小值,规定了网络输入向量的最大值为1,最小值为0,。“trainlm”是为网络设定的训练函数,采用的是Levenberg-Marquardt算法进行网络学习。该方法明显优于共轭梯度法及变学习效率的BP算法,LM算法可大大提高学习速度,缩短训练时间。

使用该地区2007年8月11日到20日的负荷和气象数据作为输入向量,8月12日至8月21日负荷数据作为目标向量,对网络进行训练,再用8月20日负荷数据和21日的气象特征数据来预测21日用电负荷,检验预测误差是否能带到要求。

利用MATLAB进行仿真,经过79次训练后达到误差要求结果。如图2

网络训练参数的设定见下表

从图3和图4中可以看出运用BP神经网络方法很好的预测了负荷走势,并且预测误差较小,负荷工程预测的要求。四、结论

在进行电力负荷预测时,必须考虑气象因素的影响。在不同的地区气象因素对电力负荷的影响不同,因此本文在设计神经网络结构时,结合该地实际情况考虑气象因素。本文研究了BP神经网络在电力负荷短期预测中的应用,根据上述的预测结果可以说明BP神经网络对电力负荷进行短期预测是目前一种比较可行的方法。

参考文献

[1]蒋平,鞠平.应用人工神经网络进行中期电力负荷预报[J].电力系统自动化,1995,6(19):15-17

[2]苏宁.MATLAB软件在电力负荷预测中的应用[J].华北电力技术,2007(8):16-19

[3]康重庆,夏清,张伯明.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2OO4,28(17):1-11

[4]姜勇.电力系统短期负荷预测的模糊神经网络方法[J].继电器,2002,36(2):11-13

[5]田景文,高美娟.人工神经网络算法研究及应用[M].北京:北京理工大学出版社,2006

作者简介:王婧,华北电力大学经济管理学院副教授,研究方向:财务管理,电力市场。

基于人工神经网络的预测模型 篇12

1943年, 心理学家W.S.Mc Culloch和数理逻辑学家W.Pitts建立了神经网络和数学模型, 称为MP模型。他们通过MP模型提出神经元的形式化数学描述和网络结构方法, 证明单个神经元能执行逻辑功能, 从而开创人工神经网络研究的时代。

人工神经网络 (Artificial Neural Networks, 简写为ANNs) 也简称为神经网络 (NNs) 或称作连接模型 (Connectionist Model) 是以计算机网络系统模拟生物神经网络的智能计算为基础, 由大量处理单元互联组成的非线性、自适应信息处理系统, 通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。网络上每个结点相当于一个神经元, 可以记忆 (存储) 、处理一定的信息, 与其他结点并行工作。人工神经网络具有自学习和自适应的能力, 可以通过预先提供的一批相互对应的输入-输出数据, 分析掌握两者之间潜在的规律, 最终根据这些规律, 用新的输入数据来推算输出结果。

二、人工神经网络的特点

人工神经网络虽然与真正的生物神经网络有差别, 但它汲取了部分生物神经网络的优点:在结构上与目前的计算机本质不同, 它由很多小的处理单元互连而成, 每个处理单元的功能很简单, 但大量的简单处理单元进行集体的、并行的活动得到预期的识别、计算具有较快的速度;拥有非常强的容错性, 即局部神经元损坏后, 不会对全局的活动造成很大的影响;记忆的信息是存储在神经元之间的连接权值上, 从单个的权值中看不出存储信息的内容, 它是分布式的存储方式;其学习功能非常强大, 它的连接权值的连接的结构都可以通过学习得到。人工神经网络具有四个基本特征:

(1) 非线性非线性关系是自然界的普遍特性。大脑的智慧就是一种非线性现象。人工神经元处于激活或抑制二种不同的状态, 这种行为在数学上表现为一种非线性关系。具有阈值的神经元构成的网络具有更好的性能, 可以提高容错性和存储容量。

(2) 非局限性一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征, 而且可能主要由单元之间的相互作用、相互连接所决定。通过单元之间的大量连接模拟大脑的非局限性。联想记忆是非局限性的典型例子。

(3) 非常定性人工神经网络具有自适应、自组织、自学习能力。神经网络不但处理的信息可以有各种变化, 而且在处理信息的同时, 非线性动力系统本身也在不断变化。经常采用迭代过程描写动力系统的演化过程。

(4) 非凸性一个系统的演化方向, 在一定条件下将取决于某个特定的状态函数。例如能量函数, 它的极值相应于系统比较稳定的状态。非凸性是指这种函数有多个极值, 故系统具有多个较稳定的平衡态, 这将导致系统演化的多样性。

三、基于人工神经网络的预测模型

因测报本质问题就是一个输入输出系统, 而人工神经网络又可以逼近任意非线性系统, 恰恰显示了处理这类问题的优越性所在。

1. 神经网络的预测步骤

用神经网络对预测因子进行分析处理时, 显示了神经网络在处理大规模非线性系统时的优越性。因其具有通过学习逼近任意非线性系统的能力, 将神经网络用于非线性系统的建模与辨识, 可以不受非线性限制。测报工作在本质上都可以看作一个输入输出系统, 测报过程可分以下步骤。

Step 1针对实际问题, 收集与其相关的测报因子, 并对收集到的这些数据进行简单的预处理。预处理的目的是使这些数据能适合网络的输入, 提高网络的训练速度和收敛性。

Step 2根据待解决问题的特性对网络结构进行初步选择, 选取一定的数据对网络进行训练确定网络模型。

Step 3把待预测的问题的数据作为网络的输入, 所得到的网络输出就是所要求的预测结果, 以后对这些结果进行分析总结。

2. 基于传统神经网络的预测模型

目前研究最成熟应用最广泛的是BP、RBF、以及具有反馈功能的Elman网络模型。

(1) 利用BP神经模型预测

BP网络是目前研究最为成熟、应用最为广泛的模型之一, 一个三层的BP神经网络可以任意精度逼近任意非线性函数, 在测报中得到广泛应用并取得一系列应用成果。

BP神经网络具有较好的自学习、自适应、鲁棒性和泛化性, 但随着应用范围的逐渐扩大, 许多学者也发现其存在很多不足。如固定的学习率或学习过程中出现的瘫痪现象会导致训练时间较长;采用了基于误差和性能指标函数不断减小的标准梯度下降法, 易导致局部极小值;隐层和隐层神经元个数难以确定等。

(2) 利用RBF神经网络预测

RBF网络是一种结构简单、训练简捷、应用广泛的神经网络模型具有结构自适应确定、输出与初始值无关的特性。它的优势在于用线性习算法来完成以往非线性学习算法所做的工作, 同时又保持非线性算法高精度;具有最佳逼近和全局最优等特性。

(3) 利用Elman神经网络预测

Elman神经网络是一种反馈型神经网络, 在前馈网络的隐含层中增加一个承接层, 作为延时算子, 达到记忆目的, 从而使系统具有适应时变特性的能力, 且具有较强的全局稳定性。

三种网络模型在进行预测时, BP模型收敛速度最慢, 预测精度一般;RBF模型收敛速度最快, 但预测精度最低, 可见RBF模型不适合用于预测;Elman模型可以看作是具有反馈效果的BP网络, 得到的预测精度略高于BP模型和RBF模型, 且收敛速度要快于BP模型。

摘要:人工神经网络是一种模拟动物神经网络行为特征, 进行分布式并行信息处理的算法数学模型, 具有非线性、非局限性、非常定性和非凸性。因测报问题本质就是一个输入输出系统, 而人工神经网络又可以逼近任意非线性系统, 对于处理该类问题具有很强的优越性。

关键词:神经网络,预测,信息处理

参考文献

[1]边肇祺, 张学工等.模式识别 (第二版) [M].北京:清华大学出版社, 2000.

[2]孙即祥.现代模式识别[M].长沙:国防科技大学出版社, 2002, 190-234.

上一篇:三维形貌下一篇:建筑施工中的节能技术