预报算法

2024-12-04

预报算法(通用4篇)

预报算法 篇1

引言

20世纪80年代以来,随着国民经济的发展,雾害越来越突出。雾害的研究受到了国家科委及有关省市的特别重视,雾的观测试验得到了很大的发展。

1995年,姜天戟和袁曾任利用美国Neural Ware公司在开发研制Madaline神经网络天气预报系统时采用的美国匹兹堡机场的相同的气象观测数据,以BP算法作为基础,提出了三种不同激活函数组成的神经网络预报模型。

1999年,金龙和陈宁等针对统计天气预报中如何确定集成预报中个子方法的权系数问题,采用神经网络方法进行可预报建模研究。梅钰利用一些常规气象观测数据作为神经网络模型的输入,开展了辐射雾的预报试验。[1]

我国内陆雾以西南为最多,且多属于辐射冷却雾,四川盆地是内陆多雾地区之一[2]。本文试图利用BP人工神经网络方法制作单站雾的预报,尽管雾是一种小概率事件,预报难度较大,但是有益的科学尝试无疑对提高航空气象保障[3]能力具有广泛深远的实用价值。

1 人工神经网络基本原理

人工神经网络有很多种类型,本文采用反向传播人工神经网络,即BP(back.propagation)模型[4]物理概念清晰、通用性好、拓扑结构灵活可变、非线性映射能力强的特点。BP模型由输入层、隐层、输出层组成,隐层可有多层。

本文采用3层BP模型(模型结构图略),各神经元是分层排列的,每个神经元只与前一层的神经元相连接,网络中除输入层单元和输出层单元外,还有不与外层直接联系的中间层单元,称为隐层单元。一般隐层是由多个节点构成的。网络第一层单元的状态只影响下一层单元的状态,也就是每一层单元只接收来自前一层单元的输入信号,并对后一层单元输入,形成前馈式特点(如同1所示)。

其数学模型是:

式中:x、y、z分别为输入层、隐层和输出层矢量(节点向量),ω1、θ1和ω2、θ2表示输入层与隐层和隐层与输出层之间的连接权和阈值,f(x)为网络激活函数。

2 资料及研究方法

2.1 资料

选取的资料为2007年11月~2008年3月天气观测资料和T213数值预报产品资料。温江气象台地面观测资料,包括风向、风速、能见度、温度、露点温度、本站气压等。

在选取预报因子时,本文侧重考虑了以下因素:

(1)雾的生成和消散过程主要受到空气湿度和水气的改变所制约,同时雾的扩散范围和高度要受到水平和垂直环流的影响,再加上成都地区以气团雾(包括辐射雾和平流雾等)为主,在选取预报因子时,将主要考虑涉及以上要素变化的因子。

(2)天气系统主要通过均压场、气压值、温度变化等来考虑。通过气压值、温度变化反映天气系统的移动变化情况;气压值较高、空间气压场均匀、三小时变压较小、温度变化较小表明本站处于强大的高压之中,在冬季易出现辐射雾。

(3)通过水汽辐合、露点温度变化等反映本站的水汽变化,最后选定49个预报因子(略)为人工神经网络的输入节点。本文在样本处理过程中,将各类型雾当作同一雾类,它与非雾日一起构成学习样本。这种处理方法可能增加了网络的学习难度,但应用到实际业务工作时,可能会更方便些,是值得尝试的。

2.2 方法

编写VB语言程序自动从MICAPS数据文件中读取资料。在8°×8°的范围内(99~106°E,26~33°N,1°×1°,共64个格点)每隔一个纬度(经度)选取一个格点,读取T213中期数值预报模式36小时预报的500hPa、700hap和850hPa高度场、散度场,700hPa、850hPa相对湿度、温度场、垂直速度和水汽通量,700hPa涡度,以及地面温度,和海平面气压等15个预报场因子分别用EOF做主分量分析,计算出特征向量,选取前几个特征向量的方差贡献大的作为预报因子。共得出44个主分量。表1为所预报场的前几个主分量的累计方差贡献大小。

3 定量预报神经网络模型的构建

3.1 EOF方法

神经网络预报模型的建立过程,是通过预报因子输入和期望输出之间对应关系的反复学习和训练,不断调整网络输入层与隐层、隐层与输出层之间的连接权值和阈值,找出网络模型的最佳权值矩阵和阈值向量,从而建立起两者之间映射关系预报模型。理论上,取较多的预报因子及较长的训练数据序列,对模型预报效果会有所提高。但网络结构增大,容易产生过拟合现象,同时也影响网络模型的泛化性能和模型的误差函数收敛速度,导致模型的预报能力下降。

本文对预报因子采用EOF方法进行降维去噪处理,减少预报因子的数量并尽可能保留其所带的有用信息,以建立网络结构较小的预报模型。

3.2 构建模型

图型2是一个3层并行分布式人工神经网络连接模型。x1,x2,…,xn为输入神经元;z1,z2,…,zp为隐层神经元;y1,y2,…,ym为输出神经元。每一连接弧连接着两个神经元,并附有一数值Tij作为权值,以权衡神经元xi对zj或zi对yj的影响程度。输入层从外部接受信息并将其传入神经网络;隐含层接受输入层的信息,然后对所有的信息进行处理;输出层接收处理后的信息并将最后结果输出。

BP网络是当前应用最为广泛的一种神经网络模型,它结构简单、状态稳定、计算条件易于满足,可有效地用于非线性函数逼近和基于不规则数据结构的复杂动力系统仿真[5]。

3.2.1 设置训练样本和检测样本

从MICAPS数据中选出温江站2007年11月至2008年3月间的预报场齐全的62天资料为样本,并以这62个样本中的50个样本的T213数值预报模式的36小时格点资料和温江站预报时(当天08点)前一天14时的地面能见度、温度、露点温度、24小时变温和本站气压组成的49个因子的49×50的矩阵为训练样本,其余12个样本的49×12的矩阵为检测样本。其中各输入节点为49,隐含层为10个节点,输出节点为1,输出节点地面能见度的预报量。

3.2.2 隐层节点数的确定

一个具有无限隐层节点的两层BP网络可以实现任意从输入到输出的非线性映射。但对于有限个输入模式到输出模式的映射,并不需要无限个隐层节点,这就涉及如何选择隐层节点数的问题,而这一问题的复杂性,使得至今为止,尚未找到一个很好的解析式,隐层节点数往往根据前人设计所得经验和自己进行试验来确定。隐层节点数太多会导致学习时间过长;而隐层节点数太少,容错性差,识别未经学习的样本能力低,所以必须综合多方面的因素进行设计。根据前人的经验,可以参照以下公式进行设计:

式中:n为隐层节点数;ni为输入节点数;n0为输出节点数;a为1~10之间的常数。对于本文所研究问题,ni=1,n0=1;因此,大致将n限定在10~20的范围内。

3.2.3 采用函数newff创建前馈BP网络

如图3所示,该网络的输入层具有49个输入要素,即我们所选取的49个预报因子,输入层到隐含层的权值和阈值分别为IW{1,1}和b{1};隐含层具有10个神经元节点,均采用tansig(正切S型传递函数,)作为其传递函数,从隐含层到输出层的权值和阈值分别为LW{2,1}和b{2};输出层只有一个输出量。因为我们所需要预报的是单站能见度;由于能见度总是大于0,输出层传递函数采用logsig(对数S型传递函数)。

3.2.4 训练函数的选择

用不同的传递函数或学习函数构造网络,进行试预报,取试预报效果好的网络参数。

训练函数的选取涉及所建网络的收敛速度和精度,因此相当重要。而适用与BP网络的训练函数为数众多,且各有特点,要根据具体问题具体分析,并进行对比实验。将公共训练参数设置如下:

设置最大训练次数:net.trainParam.epochs=10000000;

设置训练目标精度:net.trainParam.goal=0.0001;

分别采用下列训练函数:

Traingdx——学习率可变的动量BP算法;

T r a i n l m——采用L e v e n b e r gMarquardt算法的变梯度反向传播算法;

Traincgf——采用Fletcher-Reeves算法的变梯度反向传播算法;

Trainbr——贝叶斯(Bayesian)归一化算法;

4 预报结果分析及对比试验

本文将先以一个包括一个输入层,一个隐含层和一个输出层的两层BP网络建立预报模型,并在此基础上针对网络结构和训练函数等方面进行对比,以改进其预报性能。

图4~7所示为分别采用以上训练函数的网络的训练误差曲线。

图4~7为采用传递函数为tansig和logsig的误差下降曲线图。

学习图说明:横坐标为学习遍数,纵坐标为总体误差。曲线反映随着学习遍数的增加,误差逐步减小,并趋近于零。

图8~11为采用传递函数为tansig和purelin的误差曲线图

对比实验:

(1)从图4~11的对比可以明显看出采用传递函数为tansig和purelin优于采用传递函数为tansig和logsig。

(2)从图8~11可以知道采用训练函数为Traingdx和Traincgf的效果较好。

(拟合图说明:横坐标为时间,纵坐标为预报量。蓝色(圆圈)为期望输出(目标值,即参加学习的y);红色(X)为拟合值,即用参加学习的x,代入学习好的模型(网络)得的输出值。

试预报图说明:横坐标为时间,纵坐标为预报量。蓝色(圆圈)为实况值;红色(X)为预报值,即用未参加学习的x,代入学习好的模型(网络)得出的值。)

(3)图1 2~1 3为采用传递函数为tansig和purelin的历史拟合图和检测样本试预报图。

图14~15为采用传递函数为tansig和logsig的历史拟合图和检测样本试预报图。对比分析发现采用前一种网络结构模型得出的结果不管在历史拟合还是在试预报方面都要优越于后者。

(4)从表2和表3的对比知道采用Traingdx为训练函数的试预报准确率75%明显高与采用Traincgf为训练函数的准确率66.67%。

以绝对误差<3.5为正确,准确率为:9/12=75%

以绝对误差<3.5为正确,准确率为:8/12=66.67%

(5)表4分析结果表明采用训练函数为Traingdx为最佳。准确率可以达到75%。因此可以取出试预报效果好的网络参数。

5 结语

(1)在构造各预报区的神经网络预报模型学习矩阵输入时,对大量的初选因子采用EOF方法进行处理,浓缩大量有用信息,提取出主分量作为预报因子,起到了显著的降维作用,并减少了节点之间重复信息和噪声输入,使神经网络模型输入节点大大减少,有效减少神经网络模型中存在的较多自由参数,使模型的非线性不稳定得到抑制。

(2)BP神经网络的输入与输出,是非线性的。因此,因子的选好比较困难,从神经元的选取、层面的确定和迭代次数的变化我们也可看出神经网络的预测效能也是有很大的主观随意性的,不同作者在构造神经网络模型时都会因选取的输入、训练次数的不同而得出不同的结果。用不同的传递函数或学习函数构造网络,进行试预报,取试预报效果好的网络参数来建立网络模型,对业务中大量的数值预报产品的释用有较好的实际和参考意义。

参考文献

[1]金龙著.神经网络气象预报建模理论方法与应用.北京:气象出版社,2005.2

[2]唐信英,罗磊,王鸽,等.四川省大雾时空分布特征研究[J].高原山地气象研究,2009,29(3):60-65

[3]黄仪方,肖焕权,李积富.高原重要机场航班延误的气象因素分析[J].高原山地气象研究,2009,29(2):37-40

[4]Rumelhart D E.Parallel distributed processing:Explorations in the microstructure of cognition[M].Cambridge MA:M1T press.1986:101一109

[5]袁志康,张韧,周树道,李宁,赵奇峰.基于人工神经网络算法的某机场雾的模式识别预报.解放军理工大学学报(自然科学版),2002,3(4):82-86

预报算法 篇2

以1960~共41 a的7月和8月西行进入南海海域的.热带气旋样本为基础,采用遗传算法与神经网络相结合的方法,进行了热带气旋强度预报模型的预报建模研究.并根据相同的热带气旋个例,将这种遗传-神经网络热带气旋强度预报模型与气候持续法热带气旋强度预报方法进行对比分析,试验预报结果表明,遗传-神经网络方法具有更好的预报能力.

作 者:姚才 金龙 黄明策 黄小燕 YAO Cai JIN Long HUANG Ming-ce HUANG Xiao-yan 作者单位:姚才,金龙,YAO Cai,JIN Long(广西气象减灾研究所,广西,南宁,530022)

黄明策,HUANG Ming-ce(广西气象台,广西,南宁,530022)

黄小燕,HUANG Xiao-yan(广西南宁市气象局,广西,南宁,530022)

预报算法 篇3

关键词:遗传算法,预测,建模,拟合,精度

预测预报是人们对客观事物发展变化的一种认识与估计。预测预报对人类社会的重要性早己为人们所认识, “凡事预则立, 不预则废”, 说明了人们对预测的重要性的认识。预测可采用的方法很多, 例如, 传统的回归分析方法、基于灰色理论的灰色模型 (Grey Model) , 以及近几年发展起来的遗传算法和人工神经网络模型等。对某个对象系统选择哪一种方法来建立预测预报模型, 关键在于用此方法建立的预测模型的计算值与实际值的拟合程度。

遗传算法 (GA, Genetic Algorithm) 是借鉴生物遗传机制的一种随机化搜索算法, 其主要特点是群体搜索和群体中的个体之间的信息交换遗传算法尤其适用于处理传统方法难以解决的复杂的和非线性的问题, 己在许多领域有广泛的应用, 它将成为智能计算的主要技术之一。

一、遗传算法原理综述

1. 基本术语

遗传算法是遗传学和计算机科学相互结合渗透而成的新的计算方法, 它使用了遗传学的一些概念和基本术语来描述它的计算方法。

生物遗传物质的主要载体是染色体, 最主要的遗传物质是DNA。染色体由基因组成, 染色体中基因的位置称为基因座, 基因所取的值称为等位基因。基因和基因座决定了染色体的特征, 也决定了生物个体的性状。

染色体有两种表示模式, 即基因型 (genetype) 表示模式和表现型 (phenotype) 表示模式。表现型是指生物个体所表现出来的性状。基因型是指与生物个体表现出来的性状密切相关的基因组成。同一种基因型的生物个体在不同的环境条件下表现出来的性状会有差异, 因此, 表现型是基因型与环境条件相互作用的结果。

2. 编译码操作

在遗传算法中, 与染色体相对应的是数据或数组。在标准的遗传算法中, 染色体可用一维的串结构数据来表示, 串的各个位置对应染色体的基因座, 各位置上所取的值对应等位基因。遗传算法对染色体进行处理, 或者称为对基因型个体 (individuals) 进行处理。一定数量的个体组成群体 (population) , 群体中的个体数称为群体大小 (population size) 或群体规模。各个个体对环境的适应程度称为适应度 (fitness) 。

执行遗传算法时有两个必需的数据转换操作, 一个操作是把搜索空间中的参数或解数据转换成遗传空间的染色体或个体, 或者说是把染色体数据从表现型表示转换成基因型表示, 这个过程称为编码操作;另一个操作称为译码操作, 它是同编码操作相反的数据转换操作, 译码操作把染色体数据从基因型表示转换成表现型表示。

3. 算法流程

遗传算法的基本流程如下图所示。遗传算法以群体中的所有个体为对象, 选择 (selection) 、杂交 (crossbreed) 和变异 (mutation) 是遗传算法的三个主要操作算子, 它们构成了所谓的遗传操作 (Genetic Operations) , 使遗传算法具有了其他传统方法所没有的特征。

4. 基本要素

应用遗传算法求解问题, 需要根据求解的具体问题进行下述五个方面的工作, 这是遗传算法的核心内容, 也称为遗传算法的五个基本要素:

(1) 参数编码的格式设定及参数编码

(2) 初始群体的设定

(3) 适应度函数的设计

(4) 遗传操作设计

(5) 控制参数设计, 主要是指群体规模和遗传操作中所需使用的有关控制参数的设定和设计

二、应用遗传算法建立预测预报模型

下面是一个用来说明遗传算法在建立预测预报模型中的应用实例。

例:己知某企业从1985年~2006年各年的资金实际需要量 (万元) 如下表所示, 应用遗传算法建立该企业资金年需要量预测模型。

1. 建模分析

由表给出的1985年~2006年的资金实际需要量, 可作出如下图所示的年资金实际需要量曲线。由此曲线可见, 企业年资金实际需要量的总趋势在增长, 但有准周期性的振荡, 因此, 年资金实际需要量预测模型应考虑曲线总体增长趋势的描述和振荡规律的描述两部分组成。

(1) 企业年资金需要量总体增长趋势的描述。

在一个企业的成长发展时期中, 企业年资金需要量的变化情况可分为发生、发展、成熟三个阶段。在发生阶段, 随着企业基础设施和管理的到位, 年资金需要量增长速度较慢, 并逐渐加大增长趋势;在发展阶段, 随着企业品牌形象的逐步形成, 年资金需要量增长速度较快, 并维持一段时间后进入成熟期;在成熟阶段, 其增长速度将逐渐变慢, 增长趋于饱和。企业年资金需要量的这种总体发展变化规律可采用Logistic生长曲线描述。Logistic生长曲线是下述非线性常微分方程:

的解:

式中各参数在本例中的含义是:Y是年资金需要量, t是时间 (年) , a是年资金需要量增长速度系数, b是企业年资金需要量的极限值, m和c是与a, b有关的参数。

Logistic生长曲线如下图所示, 可用于反映一般处于成长发展时期中的对象系统随时间的生长情况。由于Logistic曲线符合企业年资金需要量随企业打拼发展的变化规律, 所以采用Logistic曲线描述企业年资金需要量的总体增长趋势是比较合适的。

考虑到1985年以前的年资金需要量应对Logistic生成曲线的起点定位及其预测值有“抬高”的影响, 故对Logistic曲线进行如下修改:

(2) 企业年资金需要量振荡规律的描述。

由企业年资金需要量曲线可见, 从1985年~2006年, 实际年资金需要量的变化与Logistic曲线有较大差异。实际年资金需要量曲线有较大幅度的振荡, 是一个多峰曲线。企业年资金需要量出现振荡多峰的原因是复杂的, 但是, 我们这里并不需要去探讨振荡的原因及其各种原因是如何影响预测模型的, 只需要在预测模型中给出振荡规律的大致描述。

由图所示的实际年资金需要量曲线的振荡具有准周期性衰减, 周期性可以用正弦函数描述, 幅值的衰减性可以用负指数函数描述。因此, 考虑到年资金需要量曲线的振荡特征后, 需要对由Logistic曲线表示的年资金需要量总体增长趋势乘以一个振荡修正因子, 即有:

式中, p为相对振荡幅值, h为振荡半周期长度 (年) , u为振荡的初始幅角, g为振荡衰减系数。

上式中含有8个待定参数b, c, d.m, p, g, h和u。我们采用遗传算法求解这8个参数, 从而得出企业年资金需要量的预测模型y (t) 。

2. 采用遗传算法求解模型的待定参数

(1) 编码

把待定的8个参数表示成一维数组x= (b, c, d, m, p, g, h, u) , 数组各元为带符号的十进制数。

(2) 初始群体的随机生成

设群体规模为n, 随机生成初始群体的n个个体xi= (ai1, ai2, ai3, ai4, ai5, ai6, ai7, ai8) , i=1, 2, …, n。个体xi中基因座k上的基因值aik (1≤k≤8) 就是数组xi的第k个元的值。

(3) 适应度函数

待定参数的确定应使得预测模型的年资金需要量计算值y (t) 与年资金需要量实际值y* (t) 的拟合最好, 即从1985年~2006年共22年的计算值y (t) 与实际值y* (t) 的误差累计最小。故建立适应度函数为:

(4) 选择操作

为减小计算的复杂程度, 可直接选择适应度fi最小的个体xi作为优良个体, 对其复制一次, 并淘汰适应度最大的一个个体。对规模较大的群体, 优良个体被选择的次数可多于两次, 并相应淘汰多个劣质个体, 以保持群体规模n不变。

(5) 杂交操作

对配对池MP= (x1, …, xi, …, xj, …, xn) 中的n个个体随机配对进行杂交繁殖。若随机选择xi= (ai1, ai2, ai3, ai4, ai5, ai6, ai7, ai8) 与xj= (aj1, aj2, aj3, aj4, aj5, aj6, aj7, aj8) 配对, 则杂交操作为:

其中, 杂交参数β可以是一个随机数, β的取值范围为0<β<1, a`ik是个体xi与xj杂交生成的后代个体x`k中第k个基因的值, a`jk是个体xj与xi杂交生成的后代个体x`j中第k个基因的值。

(6) 变异操作

本例选取的变异操作的概率为1%, 即每次对群体中的8n个基因随机选择8n×1%个基因进行变异操作。若随机选择基因aik进行变异操作, 则变异后的基因为:

式中, 变异参数η可以是一个随机数, η的取值范围为0<η<1。

(7) 算法终止条件

遗传算法是一种迭代算法, 对生成的后代群体的n个个体继续进行选择、杂交和变异操作, 直至满足算法终止条件。理想的算法终止条件是连续若干代 (例如10代) 不再产生适应度更小的个体, 即不再能繁殖出更优良的个体。这个终止条件是比较严格的, 需要迭代计算许多次。为了减少算法运算的时空开销, 比较一般的终止条件可为:若fi≤ε, 则算法终止, 相应的个体xi即是问题的解。xi中的8个基因值即分别为待定的8个参数值。ε为指定的拟合精度误差。

三、结束语

由上例讨论可见, 为了建立任何一个对象系统的时序预测模型, 只要能先用一个参数待定的非线性函数来大致描述该对象系统的变化规律, 无论这个非线性函数有多复杂, 都可以用一组实际值作为实例, 采用遗传算法来训练模型, 求解出模型的待定参数, 从而建立起这个模型。另外, 适应度函数和算法终止条件能保证建立的模型的计算值与实际值会有很好的拟合精度, 所以基于遗传算法的时序预测模型的建模方法与传统建模方法比较, 前者建立的预测模型会有较高的预测精度, 尤其是近期预测。

参考文献

[1]高岩位耀光付冬梅张蔚:免疫遗传算法的研究及其在函数优化中的应用[J].微计算机信息, 2007, (6) :183~184

[2]吉根林:遗传算法研究综述[J].计算机应用与软件, 2004, 21 (2) :69~73

[3]尹朝庆尹皓:人工智能与专家系统[M].北京:中国水利水电出版社, 2002:286~294

[4]王煦法:遗传算法及其应用[J].小型微型计算机系统, 1995, 16 (2) :59~64

预报算法 篇4

马尾松毛虫发生量、发生期数据来源于潜山县监测数据, 气象数据来源于国家气候中心。试验所用软件为:IBMSPSS Statistics 22, Microsoft Office Excel 2007。

2数据预处理

为了体现马尾松毛虫发生发展时间上的完整性, 在数据处理时, 将越冬代数据与上一年第2代数据合并, 这样就在时间上保持了一个马尾松毛虫世代的完整性, 以便于建模和预测。

2.1发生量数据处理

对潜山县1983—2014年原始监测数据预处理时, 按照“轻”“中”“重”3个强度等级, 分类按世代逐年汇总。

2.2发生期数据处理

在对潜山县1983—2014年原始发生期监测数据按世代逐年汇总, 然后将日期数据转换成日历天, 使之数量化, 以便于建模分析。

2.3气象数据处理

根据《松毛虫综合管理》《中国松毛虫》等学术资料以及近年来有关马尾松毛虫监测预报的学术论文[1,2], 初步选择与松毛虫的发生量、发生期有一定相关性的气象因子, 然后按照精细化管理的“精”“细”“简”相关要求, 选择对当前马尾松毛虫防治实践有着较高指导意义的发生面积和幼虫高峰期作为预报因子, 采用SPSS进行偏相关性的分析, 再次排除相关性较低因子变量, 并排除世代降雨量、幼虫期降雨量、幼虫期极低气温、幼虫期平均气温、幼虫期积温等过时的数据, 以减少过多相关性较低变量对于建模试验的干扰。

此外, 在数据汇总中发现, 第1代与第2代之间的气象数据相差较大, 为了保证试验的精确性, 将第1代与第2代分开建模试验。各世代参加算法试验的变量见表1。

3算法试验

3.1回归试验

使用IBM SPSS Statistics 22和Microsoft Office Excel 2007, 多次选择不同的变量, 采用线性回归、曲线回归、非线性回归、Logistics回归等回归建模试验的比较, 再次排除了部分相关性较低的变量, 最终选择了拟合度较高的线性回归模型, 具体见表2。可以看出, 显著性概率小于或非常接近0.05, 拒绝回归系数都为0的原假设, 算法试验基本满足精细化预报试验要求。

3.2神经网络径向基函数试验

使用IBM SPSS Statistics 22, 经过多次神经网络径向基函数试验, 筛选拟合度高的马尾松毛虫精细化预报模型, 试验结果见表3。可以看出, 采用径向基函数建立的马尾松毛虫预报模型, 基本满足马尾松毛虫预报要求。

3.3神经网络多层感知器试验

使用IBM SPSS Statistics 22, 经过多次神经网络多层感知器试验, 筛选拟合度高的马尾松毛虫精细化预报模型, 试验结果见表4。可以看出, 采用多层感知器建立马尾松毛虫预报模型, R2均大于0.9, 要优于径向基函数与回归方法建立的模型。

3.4时间序列分析算法试验

在算法试验中, 还采用了多种时间序列分析算法, 试验结果的拟合度都较低, 达不到预报模型要求。

4算法选择与组合

一个好的算法, 就是要“化繁为简”, 把复杂的事情交给计算机去做, 最大程度地简化人的操作。因此, 对于马尾松毛虫精细化预报而言, 只需要选择对防治具有较高指导意义的发生面积、发生强度与幼虫高峰期进行预报算法研究。

就目前技术来说, 用于建模的成虫始见期数据, 采用性诱或灯诱获取最易于实现, 而且成本低, 数据可靠性高。发生面积和发生强度, 建模中使用的是上一代数据, 这个数据可以使用高分卫片由计算机自动获取, 必要时采用成本低廉的遥控无人机对重点区域进行遥测, 对高分数据进行校正, 尽量避免使用劳动强度大、成本高、可靠性低的人工地面监测数据。

气象数据可以从国家气候中心直接获取, 包括历史数据和周、旬预报数据[1,2,3,4,5,6,7,8,9,10,11]。

算法与模型的的选择, 应该按照“精”“细”“简”要求, 应用最新数学、系统学成果和分析仿真工具, 采用多种方式进行试验比较, 选择合适的算法。就本次算法试验而言, 对于潜山县马尾松毛虫精细化预报, 采用多层感知器建立马尾松毛虫预报模型较好。

确定预报模型之后, 以Arc GIS为平台, 结合SPSS或MATLAB分析仿真工具, 对有害生物未来发生情况进行精确描述、分析和仿真, 根据仿真结果, 发布生物灾害精细化预报。

参考文献

[1]张国庆.基于生态论的生物灾害精细化预报理论研究[J].现代农业科技, 2014 (19) :146-150.

[2]张国庆.基于TSE分析理论的林业生物灾害精细化预报技术研究[J].现代农业科技, 2014 (19) :153-155.

[3]张国庆.基于系统关键因子分析理论的林业有害生物防治关键期分析技术研究[J].现代农业科技, 2014 (19) :199-201.

[4]张国庆.基于系统健康管理理论的林业生物灾害精细化预报管理研究[J].现代农业科技, 2014 (19) :197-198.

【预报算法】推荐阅读:

短期预报07-14

预报业务07-18

暴雨预报07-19

预报思考10-18

动态预报05-13

短时预报05-23

预报数据06-14

地震预报06-17

观测预报06-21

实时预报06-29

上一篇:骨折的急救下一篇:特许权价值