分布预测(共9篇)
分布预测 篇1
0 引言
在风力发电领域风电功率预测算法一直是研究的热点,各种算法的预测效果也由于实际环境的不同而存在较大的差异。目前,风电功率预测算法主要可以分为物理方法、统计方法和学习方法三大类[1]。其中物理方法是根据数值天气预报得到未来时刻风电场相关气象信息,利用机组的功率曲线预测功率输出;统计方法是从统计学角度对历史数据进行分析,选择合适的统计模型经过一定的数值计算,预测下一时刻的功率;学习方法,主要是指采用人工智能等方法预测下一时刻功率值,相比统计方法计算量大,但预测模型更为准确。在实际应用中经常是几种方法混合预测,从而提高预测精度。
风电功率预测方法也可根据预测的物理量进行分类,一是直接预测风电机组或者风电场的输出功率,二是对风速等气象信息进行预测,再通过相关的功率曲线将风速等信息转换成输出功率[2]。从现有文献研究趋势来看,大多数预测研究是在风速预测基础上进行的。文献[3]指出影响机组输出功率的气象因素主要是风速、风向和空气密度,并采用数值天气预报和动态神经网络相结合的方式对风电功率进行预测,取得良好的效果。文献[4]采用时间序列法对风速进行预测,并将风速预测的结果转化为风电场功率输出,从而实现对功率的预测。文献[5]采用分数差分自回归移动平均模型(fractionalARIMA)对风速进行预测,预测方法简单有效。文献[6]在对风速进行空间相关性分析基础上运用局部递归神经网络进行风速预测,并与其他算法进行了对比,验证了方法的有效性。目前基于风速的间接功率预测方法存在较大的误差,风力机组的功率曲线也是经过相关数据拟合而成的,由于存在拟合的误差,实际输出功率会在一定范围内波动。而且除了考虑风速这个主要因素外,还应该考虑空气密度、温度、地表粗糙度、风向等多种因素的影响,所以现阶段风电功率的预测误差是难以避免的。文献[7]对常用预测算法进行了较为全面的对比分析,指出各种算法的输入数据对最终预测结果有一定的影响,误差会随着预测时间的延长而增大,采用误差频率直方图直观地给出了误差频率分布,但并没有拟合出适合的误差频率分布曲线。文献[2]采用正态分布拟合误差出现的概率,效果不理想。文献[8]采用一种类正态分布模型对误差分布进行拟合,拟合曲线和实际误差分布较为吻合。
合格的预测算法所产生的误差从时域上分析应该属于无规则的白噪声序列,从误差出现频率来看应该呈现出一定的概率分布。在实际预测系统中大量样本所呈现的误差分布可能较为接近正态分布,但在有限样本情况下正态分布往往不能准确地描述实际误差的分布情况。本文采用带位置和尺度参数的t分布(t location-scale distribution)描述误差频率分布,取得了很好的拟合效果。并通过差分自回归移动平均模型、BP神经网络两种常用的预测算法进行误差分析,进一步验证了该分布模型的有效性。
1 数学模型
1.1 误差分布模型
t分布的分布密度函数f(x)可表示为
其中:Γ(·)为伽马函数;v表示自由度,该参数决定t分布的形态。当自由度较小时,t分布与正态分布有明显的区别,当v→∞时,t分布曲线趋于正态分布曲线[9]。正态分布密度函数可表示为
带位置和尺度参数的t分布与普通t分布较为相似,在概率密度表达式上有所区别,如式(3)所示。
其中:u是位置参数;σ是尺度参数;v表示自由度。若记,则y服从自由度为v的t分布[10],带位置和尺度参数的t分布本质上是将标准t分布进行平移和伸缩,图1将t分布和三种带位置和尺度参数t分布相比较,图中曲线的自由度均为5,具体参数如表1所示。可以看出参数u对曲线产生了平移作用,而参数σ则产生了尺度伸缩的作用。
在实际数据拟合过程中,分布曲线的参数可由Matlab使用极大似然估计的方法得出,置信水平为95%。同时该分布随机变量x的95%置信区间为
,其中tinv是t分布的分位数[11]。
1.2 误差分布建立方法
在功率预测中误差可用式(4)表示。
其中:表示i时刻功率预测值;pi表示该时刻的实际值。定义预测百分比误差为
由于ip波动范围很大,很可能在某时刻pi→0,这样得出的百分比误差就会很大,从而失去指导意义。也有方法采用风电场的开机容量P代替pi,即误差相对于风电场开机容量的百分比值。
虽然式(6)不会出现ηi数值过大的现象,但是对于风电功率的波动特性不能很好地体现,相反当ei值较小时由于P值一般较大,从而造成预测百分比误差偏小的现象,使用式(6)无法很好地体现误差变动,因此仍旧采用式(5)计算各时刻的百分比误差,同时限定pi≠0,对于那些由于pi值过小造成百分比误差ηi过大的情况,分析其是否是由于自然或人为等原因造成的功率急剧减小或停机,将这些情况经过综合分析后剔除。此外对于pi<0的情况也进行剔除,在实际运行中风电场有可能输出负功率,也就是吸收能量。这种情况主要是因为机组停机造成的,此时进行误差分析也无意义。因此对于式(5)应加上约束条件pi>0。
图2为预测误差的频率分布直方图。其中横坐标表示误差区间,纵坐标表示在对应误差区间上误差的概率密度。
式(7)~式(9)是风电功率预测中常用的误差指标[12]。绝对误差均值(Mean Error,ME),可衡量预测结果是否无偏。
绝对值平均误差(Mean Absolute Error,MAE),可对预测误差的平均幅值进行评价。
平均相对误差(Mean Relative Error,MRE),可用于不同算法之间的分析比较,应用较为广泛。
2 预测模型和数据分析
以华东某风电场2012年3月1日至4月2日的实测数据为例,对两种不同预测方法产生的预测误差进行分析,数据来源于风电场数据采集与监视控制系统(Supervisory Control And Data Acquisition,SCADA),时间分辨率为15 min。
2.1 差分自回归移动平均模型
在时间序列分析方法中,ARIMA(差分自回归移动平均模型)是比较常用的一种分析方法。而ARMA(自回归移动平均模型)、AR(自回归模型)、MA(滑动平均模型)均可看成ARIMA的特例[13]。将ARIMA差分化后,时间序列即可表示为ARMA、AR、MA模型的一种。通常输出功率和风速都是非平稳的时间序列,首先要经过差分将其变换成平稳序列,再根据相关函数和偏自相关函数确定模型阶数,模型的参数可由最小二乘法估计得出[14]。
选取3月31日为预测日,3月份前30天的数据作为训练数据。由于单纯的统计方法缺少天气预测信息的支持,较适合进行超短期预测,因此将预测的时间间隔也设定为15 min。采用ARIMA方法进行预测,一是功率直接预测,二是首先估计风速的功率间接预测。
图3为直接功率预测误差频率直方图和分布拟合曲线,从图中可看出,带位置和尺度参数的t分布较好的拟合了误差分布。
风电功率的间接预测,首先对风速进行预测,再将风速转化为功率,机组功率捕获可由式(10)表示[15]。
其中:P为风轮输出功率;Cp为风能利用系数;A为风轮的扫掠面积;ρ为空气密度;v为风速。经过功率转换后,间接预测误差的频率直方图如图4所示。
间接预测得到的频率误差曲线位置参数u和尺度参数σ较大,与直接预测的误差频率曲线相比,相对“矮胖”。
2.2 BP神经网络预测
神经网络预测是一种非线性的预测方法,不仅适合超短期风电功率预测,也适用于短期和中长期预测。在众多神经网络模型中,BP(Back Propagation)神经网络是一种应用较为广泛的算法。BP算法的主要思想是误差的反向传播,误差逐层反馈并修正各层神经元的权值,直到得出期望的输出结果[16]。但BP神经网络也有固有的缺点,学习过程收敛比较缓慢、容易陷入局部极小的情况,因此在训练学习中常采用Levenberg-Marquardt算法优化收敛速度和局部搜索性能[17]。
同样选取3月份前30天的数据作为训练样本,数据包括气象信息与风电场实际出力。选用三层网络进行预测,图5为BP神经网络结构图。对3月31日至4月2日的风电功率进行预测。为便于和ARIMA预测比较,同样将上一时刻实测值作为下一刻预测的一个输入项。预测间隔分别为15 min、1 h和3 h。
图6为15 min预测误差频率分布,与ARIMA方法相比,平均相对误差较小,但由于统计了三天的数据,出现粗大误差的概率也增大,图中可看出有超过40%预测误差,但所占比例非常小。分布曲线拟合从形态上呈“高瘦”型。
图7和图8分别是预测长度为1 h和3 h的误差分布图,随着预测时间增大误差也会变大,分布曲线有“矮胖”的变化趋势。通过观察拟合曲线的形态,可直观地了解误差分布情况,便于快速判断预测算法的准确度。
2.3 数据分析
表2是两种预测方法的统计误差,在提前15min的预测中,BP神经网络预测方法各项误差指标均比ARIMA方法要小。随着预测时间增长,各项误差有增大的趋势。
表3为带位置和尺度参数t分布的曲线拟合参数,在进行的5次预测中,u值均为正值,说明预测算法的正向误差较大,但并不代表u值不能为负值,某些情况下同样也会出现负向误差。由于误差区间采用百分比表示,即误差在数值上放大了100倍,因此参数σ也相应变大。自由度v均相对较小,在形态上与正态分布曲线有较大的区别。
式(11)通常用来计算曲线的拟合优度,R2取值范围为[0,1],R2数值越大说明拟合优度越高。其中iy为某误差区间对应的实际概率密度值,为曲线拟合值,为实际的平均值,下标i表示第i个误差区间。
表4将带位置和尺度参数的t分布与正态分布的拟合优度相比较。从表中可看出带位置和尺度参数的t分布均比正态分布拟合优度高,因此比正态分布更适合描述短期风电功率的预测误差。
3 结论
研究预测的误差分布可以评估预测算法的准确度。根据分析得出的结论有:
1)带位置和尺度参数的t分布能有效描述短期风电功率预测误差的频率分布,比正态分布更准确。
2)带位置和尺度参数的t分布各项参数可作为评价预测算法的指标:参数u可表示误差对称轴的位置,以及误差总体是呈正向还是负向;参数σ的相对大小可表示误差是否集中,数值小拟合曲线就会呈现“瘦高”型,算法准确度就比较高,反之准确度就比较低;自由度v可在形态上与正态分布区分开,一般情况下自由度较小,当它变大若超过30,就可认为误差频率分布已接近正态分布。
3)研究预测误差分布的形态和参数,可对预测算法的改进提供统计依据。
分布预测 篇2
辽宁省南部金刚石分布及找矿预测
详细地介绍了辽宁省南部发现的金伯利岩岩体和金刚石砂矿形成地质条件、分布范围,特别是金刚石砂矿成因类型、分布规律及成矿远景区预测.
作 者:张树林 郭阳春 吴德军 ZHANG Shu-lin GUO Yang-chun WU De-jun 作者单位:辽宁省第六地质大队,辽宁,普兰店,116200 刊 名:吉林地质 英文刊名:JILIN GEOLOGY 年,卷(期):2009 28(2) 分类号:P619.24+1 关键词:金伯利岩 金刚石砂矿 分布规律 远景区 辽宁南部分布预测 篇3
关键词:Maxent;GIS;南方红豆杉;保护区;Google Earth;潜在地理分布
中图分类号: S127 文献标志码: A 文章编号:1002-1302(2014)07-0349-03
收稿日期:2013-10-29
基金項目:东北森林植物种质资源专项调查(编号:SB2007FY001)。
作者简介:万基中(1988—),男,硕士,从事基于GIS的野生植物保护与利用。E-mail:yw229628927@163.com。
通信作者:于景华,副教授,硕士生导师,从事野生植物保护与利用。E-mail:yujinghua508@163.com。南方红豆杉属于红豆杉科、红豆杉属常绿乔木,是我国特有一级保护濒危植物,主要分布于长江流域、南岭山脉及其以南各省的山地中,是集观赏、药用和材用为一体的重要资源植物。如今,南方红豆杉的保护形势已迫在眉睫[1]。目前,地理信息系统(GIS)已经为野生濒危植物保护提供了良好的分析环境。利用物种分布模型模拟物种潜在地理分布又成为保护濒危物种必不可少的手段[2],殷晓洁等对辽东栎和蒙古栎的潜在地理分布及其影响因子进行了模拟,但只分析了分布地区和气候影响的阈值,没有对其分布的省(自治区)和保护区进行评估[3-4]。本文通过Maxent模型与GIS相结合的手段[5],利用物种分布区和生长环境模拟南方红豆杉潜在地理分布,探讨影响分布的因素,探究濒危物种的潜在地理分布及其保护建议[6-7]。GIS和Google Earth相结合,提取南方红豆杉在各个省市和保护区的潜在地理分布信息,进一步了解南方红豆杉潜在生境的情况,讨论分布热点的省份和保护区,为未来植物区系调查、野生植物科学管理、生物多样性及其资源保护提供了参考依据。
1材料与方法
1.1物种分布数据采集
南方红豆杉分布数据主要从以下4个途径获得:(1)中国科学院植物研究所标本馆提供的标本资料,102条;(2)各地方植物志的南方红豆杉分布资料,147条;(3)GBIF数据库(http://www.gbif.org/),7条;(4)中国知网(http://www.cnki.net/)查到相关文献,159条[8]。通过Google Earth和Arcgis10.0软件提取上述4个资料源的各个地区几何中心点坐标,输入至Excel,保存成CSV格式,剔除极其相似的地理数据,保证并且每个分布点都有确切的经纬度,最终得到南方红豆杉的分布点共384个。物种分布点基于的中国矢量地图为1 ∶400万,来源于国家基础地理信息系统(http://ngcc.sbsm.gov.cn/),中国保护区地图下载于www.wdpa.org。
1.2环境因子数据获取
地上环境因子数据主要是气候数据。气候数据主要下载于Worldclim免费提供的生物数据(www.worldclim.org),下载19个影响生物分布的气候因子作为地上环境因子数据,分辨率为2.5 arcmin,这些数据主要是温度和降水指标。地下部分数据主要是土壤性质数据,来自于联合国粮食与农业组织(www.fao.org)。上述环境因子见表1。
1.3软件来源
Arcgis 10.0由美国ESRI公司开发;Diva-gis由http://www.diva-gis.org/免费下载;Maxent 3.3.3e由http://www.cs.princeton.edu/~schapire/maxent/免费下载;Google Earth由美国谷歌公司开发。
1.4研究方法
Maxent模型是以最大熵理论为基础,根据物种存在信息,从符合条件的分布信息中选择熵最大的分布区域,作为模拟的最优分布,进而建立潜在地理分布图层将南方红豆杉分布记录数据(CSV格式)和环境变量数据(ASCⅡ格式)导入Maxent软件中,随机选择75%的分布点作为训练子集(随机抽取整个数据的75%作为训练子集),来获取建立最大熵模型的参数,25%作为测试子集(余下的25%),用来验证模型的准确性。环境参数中设置为获取刀切法来获得每个环境因子的重要性,其他参数为软件默认参数。我们将适应区分为4个梯度:不分布区(0~0.25),较差分布区(0.25~0.5),适宜分布区(0.5~0.75),最佳分布区(0.75~1)。通常采用接受者操作特性曲线(ROC)分析法检验模型精度,ROC曲线下的面积(AUC)值的大小来判断模型的准确度。AUC值的评表1环境变量
气候变量因子说明土壤变量因子说明Bio1年平均气温Nutrient availability养分有效性Bio2昼夜温差均值Nutrient retention capacity营养保留能力Bio3昼夜温差与年温差比值Oxygen availability to roots对根的可用供氧量Bio4温度变化方差Rooting conditions生根条件Bio5最热月份最高温Toxicity毒性Bio6最冷月份最低温Workability机械适应率Bio7年温度变化范围Excess salts盐碱性Bio8最湿季度平均温度Bio9最干季度平均温度Bio10最热季度平均温度Bio11最冷季度平均温度Bio12年平均降水Bio13最湿月份降水Bio14最干月份降水Bio15降水变化方差Bio16最湿季度降水Bio17最干季度降水Bio18最热季度平均降水Bio19最冷季度平均降水
nlc202309012241
估一般标准为:预测较差(0.5~0.6),预测一般(0.6~07),预测较准确(0.7~0.8),预测很准确(0.8~0.9),预测极准确(0.9~1)[5]。
通过Arcgis10.0空间分析模块进行区域统计,分别提取各省市和保护区南方红豆杉的潜在地理分布数据,将Maxent所得到ASCⅡ文件通过Diva-gis软件输出为Google Earth支持的KMZ文件,通过Google Earth分析潜在地理分布的真实情况。
2结果与分析
2.1潜在地理分布预测结果
本次模型的训练AUC=0.969,测试AUC=0.965,表明预测效果理想[3-4]。由图1、图2可知,南方红豆杉广泛分布于中国的中南部,最佳分布区面积浙江省最大,福建省次之,安徽、重庆、广西、湖北、江西和湖南等省(区)较小;适宜分布区面积湖南省最大,江西、福建、浙江较大,四川、贵州、陕西、安徽、重庆、广东、广西、湖北、浙江、福建等省(区)次之,云南、台湾、甘肃等省份最小。这与我国南部较大面积的潜在地理分布相比,我国实际保护区的保护面积显得明显不足,如浙江省只有凤阳山、乌岩岭、九龙山3个保护区覆盖了南方红豆杉潜在地理分布,保护面积仅351.31 km2,这与浙江省最佳分区面积相差很大;湖南省保护区没有覆盖最佳分布区,但有大面积的适宜分布区,张家界、索溪峪、永州都、八大公山共覆盖 5 010.79 km2 的适宜分布区,尤其张家界,覆盖了 3 254.24 km2 适宜分布区,这些都为保护野生南方红豆杉创造了有利的条件,此外安徽的清凉峰和广西的猫儿山也有最佳分布区覆盖(图1)。
Google Earth可以清晰地看出南方红豆杉潜在地理分布的真实情况。图3-a表示潜在分布区由沿海地区向内陆地区延伸,南方红豆杉的适应性有逐渐减小的趋势。从图3-b
可以看出,南方红豆杉潜在分布区在浙江省的地形条件,这给我们选择迁地就地保护和人工培育选址提供了有效的借鉴;利用Google Earth可以对物种潜在地理分布进行更加细致的模拟,甚至可以对小地区的生境破碎化的现象进行讨论。图3(3)表示,最佳分布区并不是十分连贯,有生境破碎化的现象。从图3我们观察到南方红豆杉潜在地理分布区与不分布地区的交错地带情况十分复杂。
2.2影响潜在地理分布环境因子分析
Maxent的刀切法可以对每一个环境因子应用刀切法分析,判断不同环境因子对南方红豆杉潜在地理分布的影响。地下部分对物种潜在地理分布的影响效果并不是特别理想,地上部分,影响效果十分明显,其中最冷季度平均温度、最冷月份最低温度、最干季度平均温度对潜在地理分布有较为明显的作用。根据Maxent结果,当最冷月份的最低温度、最干季节平均温度、最冷季度平均温度分别达到0、10、8 ℃时,存在南方红豆杉的概率越大,说明对其潜在地理分布影响最大。
3结论与讨论
利用GIS的定量分析,使评价过程更加系统化、立体化[1-3]。我们使用GIS中的空间分析技术,对南方红豆杉的潜在地理分布信息进行了有效的提取,再通过Google Earth进行展示,使其研究结果更加真实。将GIS与Maxent结合起来,对于我国过去相关研究来说,是一个很好的补充,特别是应用于野生濒危植物保护方面[6]。从图1可以看出,通过Maxent模拟所得的南方红豆杉潜在地理分布,南方红豆杉主要集中在我国华南和西南部分省(自治区),其中浙江省最佳分布区的覆盖面积最大,湖南省适宜分布区面积最大(图2),以这两个省为主,可以加强省内南方红豆杉人工种植,使其经济价值最大化。对于野生南方红豆杉的保护,浙江省已有大面积南方红豆杉繁育基地,其他地区可以借鉴学习。从对重点保护区的分析来看,我们发现针对南方红豆杉地理分布的保护区很少,只有张家界、索溪峪、永州都、八大公山、凤阳山、乌岩岭、九龙山等几处能达到保护南方红豆杉的目的,这和我们庞大的保护区体系相比较,远远不够(图1)。所以,为南方红豆杉建立有效的保护地,可以作为未来的研究方向。这不仅可以应用于南方红豆杉的保护,更可以应用在保护其他濒危植物上。
影响南方红豆杉分布的因素主要是气候因素,所以,我们不论是进行就地保护还是迁地保护,首先要对当地的气候条件进行监测。对于最佳分布区和适宜分布区,我们需要在部
分地区划分保护小区,进行有效的就地保护,不仅如此,这些地区也是迁地保护的适宜地区[1,6-8]。我们需要扩大其保护区的面积,使南方红豆杉的各个种群连接起来,促进其种间交流,避免生境破碎化对南方红豆杉种群造成的不利影响,增加其种群的稳定性[7-8]。对于迁地保护来说,基本可以运用本研究的方法,利用Google Earth对潜在地理分布进行初步评估,将迁地保护的区域划分到适宜区域(图3)。由于Maxent模拟出来的结果是针对大尺的我国地区,如果单纯从图层中来进行划分,未免过于草率。本研究改进了过去我国对于潜在分布的研究成果,利用GIS和Google Earth相结合的方法对潜在地理分布地区进行进一步的评估。
参考文献:
[1]茹文明,张金屯,张峰,等. 濒危植物南方红豆杉濒危原因分析[J]. 植物研究,2006,26(5):624-628.
[2]徐晓婷,杨永,王利松. 白豆杉的地理分布及潜在分布区估计[J]. 植物生态学报,2008,32(5):1134-1145.
[3]殷晓洁,周广胜,隋兴华,等. 辽东栎林潜在地理分布及其主导因子[J]. 林业科学,2013,49(8):10-14.
[4]殷晓洁,周广胜,隋兴华,等. 蒙古栎地理分布的主导气候因子及其阈值[J]. 生态学报,2013,33(1):103-109.
[5]许志东,丁国华,刘保东,等. 假苍耳的地理分布及潜在适生区预测[J]. 草业学报,2012,21(3):75-83.
[6]李先琨,黄玉清,苏宗明.南方红豆杉群落主要树木种群间联结关系初步研究[J]. 生态学杂志,1999,18(3):11-15.
[7]王利松,陈彬,纪力强,等. 生物多樣性信息学研究进展[J]. 生物多样性,2010,18(5):429-443.
[8]杨相甫,李景原,王太霞,等. 河南红豆杉属植物地理分布初探[J]. 河南师范大学学报:自然科学版,2000,28(1):72-74.
利用地震振幅属性预测砂岩分布 篇4
为了搞清该区嫩三段河道砂岩储集层的分布情况, 在准确确定油层、精细落实构造的基础上, 利用地震属性预测砂体发育区, 预测结果与实钻结果十分吻合, 这项工作为研究区黑帝庙油层的勘探奠定了基础。
1 油层确定及构造精细解释
1.1 油层确定
嫩三段黑帝庙油层自上而下分为HⅡ1、HⅡ2、HⅡ3三个油层组。应用三维连片处理后的地震资料, 用声波测井资料制作合成地震记录。制作了区内20余口井的合成地震记录, 确定过井地震剖面地质层位, 准确确了油层顶面反射层位。
1.2 构造精细解释
在层位确定的基础上, 利用Landmark解释系统, 从多视角研究分析油层顶面反射层特征, 进行层位追踪解释。在精细追踪对比断层和层位时, 充分利用人机联作的快速、直观和多功能优势 (三维立体解释、水平切片显示、连井剖面显示、图分析技术等) , 充分注意小断层和小幅度构造的解释, 利用变速成图技术, 完成油层顶面构造图。
2 砂岩储集层分布趋势预测
在上述工作的基础上, 应用地震属性提取技术对嫩三段河道砂岩储集层的横向变化进行定性预测。
2.1 地震属性的定义
地震属性是指那些由叠前或叠后地震数据, 经过数学变换而导出的有关地震波的几何形态、运动学特征、动力学特征和统计学特征的特殊测量值。有些属性可能擅长于揭示不易探测到的岩性变化, 而有些属性可以直接用于烃类检测。
地震属性分析的目的就是以地震属性为载体, 从地震资料中提取隐藏的信息, 并把这些信息转换成与岩性、物性或油藏参数相关的、可以为地质解释或油藏工程直接服务的信息, 从而达到充分发展挥地震资料潜力, 提高地震资料在储层预测、表征和监测能力的一项技术。
2.2 地震属性提取过程
(1) 确定钻井和地震资料的时深关系, 即层位标定;
(2) 层位追踪解释, 确定时窗, 并进行地震属性提取;
(3) 地震属性优化, 优选出用于预测的数量最少的属性组合;
(4) 地震属性分析, 建立地震属性、地质特征之间的统计关系, 从而在密集的地震数据指导下对井间油藏特性进行预测。
本次应用Landmark的PAL模块, 单道分时窗提取出四大类 (振幅类、相关类、频率类及相位类) 20多种属性。应用专家优化方法, 凭着多年的各种地质条件下的地震属性分析经验, 结合钻井、测井资料, 确认在本区振幅类属性可以定性揭示河道砂岩的分布 (图1) , 振幅高值区 (红黄色) 对应河道砂体发育区。
2.3 砂岩储集层分布预测
理论与实践证明:薄互层地质条件下, 砂岩厚度小于1/4波长时, 地震反射波振幅随着砂岩厚度的增大而增强, 在砂岩厚度达到1/4波长时, 地震反射波振幅最强。由此可见, 在砂岩厚度小于或等于1/4波长的情况下, 可以通过振幅的强弱来预测砂岩的厚薄。
研究区三维地震资料黑帝庙油层的主频为40Hz左右, 频宽为8-80Hz。根据调谐原理, 地震可检测地层厚度3-22m。本区储层以砂泥岩互层为主, 砂岩厚度较薄, 多数为2-8m, 个别厚度达到20米, 但是基本落在可检测的范围之内。因此, 在本区利用振幅预测砂岩厚度是可行的。
预测方法是:
(1) 从已知井出发, 用井点处的振幅值与砂岩厚度值进行相关计算, 拟合出反射波振幅值与砂岩厚度之间的关系曲线, 进而导出一个用振幅值计算砂岩厚度值的计算公式。
(2) 用这个计算公式进行外推计算, 得到黑帝庙油层各个砂组的预测砂岩厚度平面分布图 (图2) 。对比分析预测结果与实钻结果, 砂岩厚度误差为1-2米。
3 结论
(1) 地震属性提取技术在研究地区黑帝庙油层的砂岩储集层预测中取得了很好的效果, 所预测的砂岩发育的区域与实钻结果十分吻合, 说明这一储集层预测方法是行之有效的。
(2) 此方法适用用地震资料品质较好、以泥包砂地层结构的地区, 其预测结果有效直观。对于地震资料品质不好的地区, 则首先要采用影像加强、提高信噪比方法处理, 再采用本文方法进行预测。
参考文献
[1]姜秀清等, 地震属性分析技术在不同油气气藏中的应用[J].石油物探, 2004, 43 (增刊) :70-72[1]姜秀清等, 地震属性分析技术在不同油气气藏中的应用[J].石油物探, 2004, 43 (增刊) :70-72
基于泊松分布的需求预测模型设计 篇5
若平均每客户对公司产品在时间0,!t"的需求遵从参数为λt的泊松分布,即在时间0,!t",为满足每客户的需求,生产部门平均对该物料的需求数为K的概率为:
式中
Pk——对某物料需求为K的概率
K——对某物料的需求
t——计算时间
λt——时间0,!t"内物料的客户需求
1 物料需求量计算模型
需求量的确定是整个物料管理的关键问题之一,与需求量相关的参数有:
PN——平均每客户产品需求数(件)
MN——每单位产品耗用材料数(件)
N——客户数量(个)
R——平均需求率(次/天)
T——计算间隔时间(天)
α——计划保障率
λt——客户对公司产品在时间0,!t"的需求
K——生产部门对该物料的需求
RN——单位时间(天)的平均客户需求数
由以上参数,可以计算出单位时间(天)的平均客户需求数RN:
RN=PN×MN×N×R
时间T内物料的客户需求λt:
λt=RN×T=PN×MN×N×R×T
于是该物料的生产需求K就是在保障率α下满足下式的最小整数:
从以上的模型中,我们可以看出,在物料需求量的计算公式中,直接变量只有λt一个,而其决定因素中,PN、MN、N和T都比较容易得到的(其中PN可以由历史数据获得),只有产品的平均需求率R是比较不容易得到的。
2 时间序列法在需求率预测中的应用
对需求率R值的预测可采用时间序列法,计算流程如图1所示:
(1)计算R的季节指数
设Yt为t期的实际值,N为周期数,Mt为t期的预测值,移动平均法的公式为:
式中
Mt——t期的预测值
N——移动周期数
Yt——t期的实际值
移动平均数排除了实际值因季节因素引起的差异和部分随机因素的影响,可以作为长期趋势估计值,即
(2)计算R值的长期趋势
常用的趋势预测模型为线性趋势模型:
式中
——时间序列法预测值
t——时间
a、b——方程的参数
用最小二乘法导出的标准方程组为:
联解这个方程组,就可以求出参数a、b。
3 通过模型对需求量预测
假设某物料2009年7月R的预测值为0.16(次/天),在这一阶段的其他数据如下:T=7;PN=30;MN=1;N=150;α=92%。
根据以上数据,我们可以预测出在2009年该部件的平均每天客户需求数RN:
RN=PN×MN×N×R=30×1×150×0.16=720
订货周期的λt:
查泊松分布表,可得:K=5 139(件)。即在7天的订货周期内,该物料满足92%的保障率的生产需求量预计在5 139件。
摘要:研究的目的是运用有效的方法来提高需求预测的准确性,从而优化物料库存控制,以解决当前困扰生产企业的库存管理难题。通过分析物料的消耗规律,运用管理科学的理论与方法建立了基于泊松分布的物料需求模型,利用时间序列法对主要参数进行科学计算。研究的需求预测方法能够较好地解决库存控制中存在的计划问题,具有较强的可操作性,对提高企业库存管理水平具有很好的指导作用。
关键词:泊松分布,时间序列法,需求预测
参考文献
[1]马庆国.管理统计——数据获取、统计原理、SPSS工具与应用研究[M].北京:科学出版社,2004:182-202.
分布预测 篇6
此外, 电力系统负荷预测模型一般关注负荷时间序列的一阶矩, 即从数学期望层面上讨论, 而综合考虑时间序列的高阶矩预测模型则相对鲜见。这里所建的非高斯分布GARCH模型包含的条件方差方程, 为剖析时间序列二阶矩提供了平台。
1 ARCH模型简介
时间序列建模时常出现波动集聚现象。时序的二阶矩在某个时期密集地出现高值, 在某个时期密集地出现低值。这种异方差现象不可忽视。
1.1 标准GARCH模型
ARCH模型[9,10]通常可用于时间序列模型的随机扰动项建模。
对于模型均值的方程:
如果有
条件方差方程为
vt~i.i.d.N (0, 1) , 即vt服从正态独立同分布;α (B) 为滞后算子多项式;ht为εt的条件方差。需同时满足非负约束条件和二阶平稳约束条件。
GARCH模型[11]为广义自回归条件异方差模型。
引入滞后算子B, GARCH (p, q) 的条件方差为
其中, α (B) 为滞后算子, p≥0, q>0, α0>0, αi≥0, i=1, 2, …, q, θj≥0, j=1, 2, …, p。且满足模型的二阶平稳条件:α (B) +θ (B) <1。
一般参数p、q均取1的GARCH (1, 1) 模型即可描述大量时间序列的波动集聚效应。为和下述GARCH-t和GARCH-GED相区别, 本文称采用正态分布假设的GARCH模型为标准GARCH模型。
1.2 厚尾特征与非高斯条件分布
在很多应用场合, 随机过程的分布具有极厚的厚尾特征[12]。不仅εt的无条件分布是厚尾的, 甚至条件分布可能也是厚尾的。为了进一步增强刻画随机过程的分布厚尾的能力, 可以考虑将式 (1) 中的vt由服从正态分布扩展成为服从尾部较厚的非高斯分布, 如t分布和广义误差分布 (GED) 。
1.2.1 t分布
t分布在自由度为无穷时, 渐近变为正态分布;通常情况下则拥有比正态更厚的尾部。当模型中vt服从t分布时, GARCH-t模型比标准GARCH模型更适合描述具有厚尾特征的时间序列。
1.2.2 GED
GED概括性较强, 其概率密度函数为
当厚尾参数v=2时, GED退化为正态分布, v<2时, GED较正态分布有更厚的尾部。
1.3 ARCH效应检验
判断一个序列 (如模型残差{εt}) 是否存在ARCH效应, 最简便也是最常用的检验方法是拉格朗日乘子检验, 即LM检验。
1.4 模型参数估计
ARCH模型参数的估计方法主要有2大类:极大似然估计 (MLE) 和矩估计 (ME) [13,14,15]。似然函数可求时, 一般倾向于采用MLE。这里采用MLE。
通过最大化条件对数似然函数, 可得标准GARCH模型的参数估计。
当vt服从t分布时, 参数估计变为在自由度k>2约束下使条件对数似然函数最大化问题, 函数形如
当vt服从GED时, 其有待最大化的条件对数似然函数形如
其中, 厚尾参数v>0, 当v<2时, GED拥有比高斯分布更厚的尾部。
2 算例分析
现结合日用电量时间序列传统模型分析ARCH效应, 并在标准GARCH模型基础上建立了非高斯分布GARCH模型。最后, 将非高斯分布GARCH模型、标准GARCH模型以及传统的自回归移动平均 (ARMA) 模型作了综合比较。
2.1 数据
选用南京地区日用电量数据进行时序建模。样本空间为2002年1月至2004年5月。使用所建各种模型分别对2004年6月4个星期的日用电量数据进行预报, 以检验和比较各模型的预测能力。
2.2 GARCH效应分析
用电量时间序列建模均值方程采用乘法模型:
其中, Ttrend、Sday、Iday依次为趋势变动分量、季节变动分量、不规则变动分量。
2.2.1 趋势分量与季节分量的提取
趋势分量利用指数模型刻画, 表达式如下:
季节分量Sday的提取, 采用了文献[1]的日负荷数据广义季节调节技术。至此, 已获取Ttrend、Sday。
2.2.2 不规则分量建模
首先, 使用ADF test、PP test验证了Iday序列的平稳性, 确认ARMA建模前提是满足的。
参考Iday序列自相关函数 (ACF) 和偏相关函数 (PACF) , 比较可行阶的ARMA模型的赤池信息准则 (AIC) 和贝叶斯信息准则 (BIC) , 最终筛选出阶数最为适当的ARMA模型。
经权衡各个模型的AIC、BIC, ARMA (15, 19) 优于其他备选模型, 模型参数估计结果参见表1。
注:C为参数估计的截距项;AR (i) 、MA (i) 分别为滞后i阶的AR项系数、MA系数的参数估计。
本ARMA模型参数均显著, 信息指标良好, 但是如果考察模型残差平方时序的ACF, 可以观察到显著的相关关系, 即残差时序似乎是非独立的。
下面使用LM检验就此问题给出一个相对正式的统计检验。经初步计算, ARCH (1) 效应检验中LM值远高于临界值, ARCH (1) 效应是极为显著的。随后动态调节LM辅助方程的q值, 可以进一步分析ARCH (q) 效应的存在性。
不同q值对应的LM值绘成曲线如图1所示。由图1可见, 所有阶次对应的LM值均比较高 (即从低阶到高阶ARCH效应都是显著的) , 残差非独立。鉴于传统模型的同方差假设是不满足的, 方程残差的条件方差改为时变方差较为合理。
2.3 非高斯分布GARCH建模
残差的这种非独立性一定程度上可以用GARCH模型加以刻画。
模型均值方程定阶方法如前, 在反复比较大量备选模型之后, 可得新模型ARMA (15, 15) -GARCH。
使用MLE估计GARCH-GED、GARCH-t模型的参数 (标准GARCH模型的参数估计亦列于后, 以供比较) 。3种GARCH模型的均值方程参数估计见表2。
标准GARCH模型条件方差方程为
GARCH-t模型的条件方差方程为
同时估计得t分布自由度k=4.366 450, 显然具有比正态假设更厚的尾部。
GARCH-GED模型的条件方差方程为
其中, 厚尾参数v=1.204 462<2, 正符合GED拥有厚尾的情形。同时也为厚尾假设选取的合理性提供了依据。在这个问题上, 2种非高斯分布GARCH模型的结论是一致的。
由表2可见所有模型均值方程参数的显著性情况均良好 (条件方差方程亦然) 。并且本算例中, GARCH采用厚尾分布假设有数理依据, 可通过比较考核非高斯分布GARCH模型的预测能力。
2.4 预测结果
预测模型乘法模型形式为
其中, I!day依次采用ARMA、标准GARCH、GARCH-t、GARCH-GED模型的预测值。
分别使用上述模型进行样本外预测, 将4周数据的预测值和真实值对比, 计算出预测误差, 并归纳其统计特性如表3所示 (用GARCH-GED模型代称TtrendSdayIGARCH-GED模型, 余者类同) 。
其中, GARCH系列模型平均大误差归算方法为
式中j为ARMA模型中预测误差>3%或>4%
的诸点的序号。
通过表3的对比, 不难得出3点结论。
a.从平均误差指标看, GARCH系列模型均稍优于ARMA模型。其中GARCH-GED模型表现最好。
b.对比各种模型的最大预测误差, GARCH系列模型有一定优势。其背景是因为该最大误差是正在波动集聚的状态下出现的。模型的GARCH部分一定程度上捕捉到了这一信息。在大误差 (3%、4%) 抑制这项指标上, GARCH系列模型相对ARMA模型有一定改进, 且本算例中GARCH-GED表现最出色。
c.以GARCH-GED为代表的非高斯厚尾分布假设GARCH模型总的实际预测能力在均值意义上不逊于ARMA模型 (本文算例中略胜一筹) , 在一些统计指标上非高斯分布GARCH模型甚至略优于标准GARCH模型。考虑到厚尾假设模型参数估计中参数的显著性水平, 可以认为非高斯厚尾假设的选取是有理论依据的。
此外, 不容忽视的一点是, 非高斯分布GARCH模型不存在同方差假设问题的建模瑕疵, 从数学严密性角度看, 同样具有较完善的理论背景。
3 结论
基于对负荷时间序列ARCH效应的研究, 在为负荷时间序列建立标准GARCH模型基础上, 从vt角度扩展了GARCH模型, 并建立了非高斯分布GARCH模型 (GARCH-t、GARCH-GED) 。算例表明, 所提出的非高斯分布GARCH模型预测能力良好。
此外, 标准GARCH模型可归于GARCH-GED的一个特例情况 (v=2) 或GARCH-t (自由度k∞) 的极限情况, 非高斯分布GARCH模型 (如GARCH-GED) 比标准GARCH模型具有更为细致地刻画尾部特征的能力, 模型概括性更强, 适用范围更广。
总之, 基于非高斯分布GARCH模型为电力系统短期负荷预测提供了一种思路, 理论层面设计较为完备, 具有一定的实际应用意义。
摘要:提出一种基于非高斯分布的广义自回归条件异方差 (GARCH) 模型的短期负荷预测方法。在论证自回归条件异方差 (ARCH) 效应存在性的基础上, 将标准GARCH模型的正态条件分布假设推广为非高斯条件分布的形式 (t分布、广义误差分布) 。用极大似然估计获得ARCH族各模型的参数估计, 建立了非高斯分布假设GARCH模型 (GARCH-t, GARCH-GED) 。比较了ARMA、标准GARCH、非高斯分布GARCH模型的预测能力, 分析平均预测误差、最大预测误差能力等指标显示GARCH-GED模型表现最出色。算例表明, 基于非高斯分布GARCH负荷预测模型是有效而可行的。
分布预测 篇7
关键词:煤层有效厚度,煤层埋藏深度,瓦斯含量
近年来, 老矿井开采深度增加、新建矿井也主要集中在煤田深部, 煤层中的瓦斯压力、含量均逐渐增大, 造成的瓦斯灾害事故也日益严重[1]。国家安全监督部门对瓦斯的研究与管理给予了极大重视, 但瓦斯的无形性、隐蔽性以及赋存与涌出的复杂性, 使得瓦斯治理始终未取得决定性的突破。因此, 开展对瓦斯含量和突出危险区域的预测, 对指导矿井安全生产将起到重要的作用[2], 具有明显的经济效益和社会效益。
新桥煤矿在2011年之前一直是低瓦斯矿井, 直到2011年瓦斯等级鉴定修订后鉴定为瓦斯矿井。鉴定结果的变化势必对矿井的采掘关系和“一通三防”产生重大的影响。因此, 有必要对新桥煤矿主采二2煤层进行瓦斯地质规律分析, 准确预测煤层瓦斯含量, 做到有的放矢开展瓦斯防治工作。
1 煤层瓦斯含量预测方法
影响瓦斯的关键地质因素包括岩溶陷落柱、岩浆岩分布、褶皱断层、上覆岩层厚度、煤层有效厚度和煤层的埋藏深度等[3]。虽然各个地质构造因素对瓦斯赋存的影响随矿区的变化而变化, 但在同一瓦斯地质单元的诸多影响因素中, 若干主要因素控制着瓦斯在该单元内的总体分布趋势, 其他因素在此基础上对其产生了局部影响。由于岩溶陷落柱、岩浆岩和褶皱断层等具有分布的随机性, 目前还无法对其产生的影响进行定量描述。但是岩溶陷落柱、岩浆岩和褶皱断层具有较好的分布规律, 因而可以对其影响瓦斯赋存规律进行定量描述。
在生产实际过程中, 研究人员通常利用直接梯度法和间接梯度法建立煤层埋深与瓦斯含量线性关系式来对煤层瓦斯含量进行预测[4]。这种预测方法虽然简单、实用, 但由于地质构造和上覆岩层岩性等条件的变化往往造成瓦斯含量梯度的显著差异, 仅考虑埋深单因素的瓦斯含量预测方法具有较大的应用局限性[5]。鉴于基于单因素的瓦斯预测模型在实际应用过程中往往出现不准现象, 可以通过研究上覆岩层中特定岩层厚度、煤层有效厚度和煤层的埋藏深度对煤层瓦斯含量的影响, 借助origin等工具实现多因素逐步线性回归, 从而通过数学方法建立一种优化的瓦斯含量预测方程, 作为一种方便、快捷、可靠的瓦斯含量预测手段[6]。
2 煤层瓦斯含量赋存量测定
2.1 煤层原始瓦斯含量测定依据
煤层瓦斯含量依据国标《煤层瓦斯含量井下直接测定方法》 (AQ1066—2008) 与《地勘时期煤层瓦斯含量测定方法》 (GB/T 23249—2009) 测定。此次测定的瓦斯含量都是选择未受采动影响的原始煤体, 即原始瓦斯含量。
2.2 煤层瓦斯含量测试结果
原中国煤田地质总局147勘探队在地质勘探时期测定瓦斯含量样28个, 其中二2煤层瓦斯含量有效样品25个;其中新桥煤矿反馈测试数据1个。新桥煤矿二2煤层瓦斯含量测试汇总见表1。
3 单因素条件煤层瓦斯含量分布预测
3.1 埋深与瓦斯含量关系预测
根据表1所示数据对煤层埋藏深度和瓦斯含量进行线性回归分析, 瓦斯含量随埋藏深度变化关系如图1所示, 分布函数见式 (1) 。
式中, W为瓦斯含量;h为煤层埋藏深度。
由图1可以看出, 煤层埋藏深度对瓦斯含量影响较大, 相关系数大于0.6;且随着煤层埋藏深度的增大而不断增大。
3.2 顶板岩性
通过表1所示数据对顶板20 m内泥岩厚度和瓦斯含量进行线性回归, 瓦斯含量随顶板20 m内泥岩厚度变化关系如图2所示, 分布函数见式 (2) 。
式中, W为瓦斯含量;L为顶板20 m内泥岩厚度。
由图2可以看出, 顶板20 m内泥岩厚度对瓦斯含量影响较大, 相关系数大于0.6;且随着泥岩厚度的增大而不断增大。
3.3 煤层有效厚度
通过表1所示数据对煤层有效厚度和瓦斯含量关系进行线性回归分析, 瓦斯含量随煤层有效厚度变化关系如图3所示, 分布函数见式 (3) 。
式中, W为瓦斯含量;S为煤层有效厚度。
由图3可以看出, 煤层有效厚度对瓦斯含量影响较大, 相关系数大于0.6;且随着煤层有效厚度的增大而不断增大。
4 多因素条件下煤层瓦斯含量预测模型
多元线性回归分析方法就是把所有m个自变量全部引入回归方程, 不管自变量对因变量是否有显著影响。多元线性回归经常需要从许多自变量中“挑选”出有意义的变量, 建立一个“最优”的回归方程。所谓“最优”的回归方程, 就是包含所有对因变量有显著作用的变量, 而不包含对因变量无显著作用的变量的回归方程。因此, 在回归分析中发展了对自变量进行“筛选”的数学方法, 同时逐步回归分析中也发展了对自变量进行“筛选”的数学方法, 而逐步回归目前被认为是一种较为合理的方法。
选择瓦斯含量y为因变量, 埋藏深度x1、顶板20 m内泥岩厚度x2和煤层有效厚度x3为自变量建立多元性回归方程, 采用逐步回归的方程对自变量进行筛选, 直到建立最优的回归方程。
式中, a为常数项;b、c、d为待定系数。
确定估算系数a、b、c、d的原则是根据最小二乘法原理使剩余差平方和最小, 可求得a=-1.653 6, b=0.008 47, c=0.130 83, d=0.050 8, 具体见表2。由表2可知, 整个式子的标准方差是0.83。由此可见, 方程拟合度较高, 数据预测具有较大可靠性。
则回归方程为:
式中, y为瓦斯含量;x1为埋藏深度;x2为顶板20 m内泥岩厚度;x3为煤层有效厚度。
5 2401工作面瓦斯含量分布预测
2401工作面煤层埋深602~689 m, 工作面煤厚1.49~3.40 m, 煤层顶板20 m范围内上覆泥岩厚度为1.40~4.32 m, 根据多因素条件下煤层瓦斯含量预测模型可知, 工作面煤层瓦斯含量范围为1.40~4.32 m3/t。因此, 从预测结果来看, 工作面煤层内瓦斯含量较低。目前2401工作面正在开采, 在生产过程中对煤层瓦斯相对涌出量进行测试, 其涌出量为1.52 m3/t, 与预测结果一致。
6 结语
通过对新桥煤矿二2煤层瓦斯含量数据以及与其对应的上覆岩层厚度、煤层有效厚度和煤层的埋藏深度进行回归分析, 发现3个因素均与煤层瓦斯含量具有较好的线性关系, 其相关性系数分别达到0.69, 0.62, 0.62, 且随着每个因素的增加, 煤层瓦斯含量具有较大的增长趋势。
在进行多因素条件下煤层瓦斯含量预测时, 相关性系数达0.83, 说明3个因素同时应用时能够较好地预测煤层瓦斯含量。将瓦斯含量预测模型应用于2401工作面瓦斯含量预测, 可得瓦斯含量范围为1.40~4.32 m3/t, 与实际生产过程中测试的瓦斯相对涌出量一致, 预测结果较为准确。
从模型可以看出, 随着煤层厚度等3个因素的增大, 井田瓦斯也在逐渐富集。因此, 建议矿井做好采掘衔接计划工作, 在开采局部瓦斯异常区域时, 除了要及时调整采掘衔接计划, 降低采掘推进速度外, 还要加强适宜的瓦斯探测, 及时采取有效的瓦斯防治措施。
参考文献
[1]李波, 王凯, 魏建平, 等.2001—2012年我国煤与瓦斯突出事故基本特征及发生规律研究[J].安全与环境学报, 2013, 13 (3) :274-278.
[2]林柏泉.矿井瓦斯防治理论与技术 (第二版) [M].徐州:中国矿业大学出版社, 2010.
[3]吉马科夫B.M..为解决采矿安全问题而预测含煤地层瓦斯含量的地质基础[C]//煤炭工业部科技情报所.第十七届国际采矿安全研究会议论文集, 北京, 1980.
[4]彼特罗祥A.Э.煤矿沼气涌出[M].宋世钊, 译.北京:煤炭工业出版社, 1980.
[5]周世宁, 林柏泉.煤层瓦斯赋存与流动理论[M].北京:煤炭工业出版社, 1999.
分布预测 篇8
根据经济和气象上的因素, 研究和分析电力系统负荷变化规律的历史数据, 继而提前推测出电力系统的符合需求, 称之为电力负荷预测。
电力负荷预测的结果直接关系到电力系统运行的安全性和经济性, 精准的电力负荷预测结果可以有效的帮助电力系统调度对未来负荷变化情况做出正确的估计, 继而指导工作人员合理的操作发电机组, 降低发电所消耗的能源及经济支出, 提高发电效率和经济效益。此外, 对电力网络的规划和建设也起着重要的指导作用, 以便提前确定新增发电机组的组装容量、时间、地点等信息[1]。
二、当前电力负荷预测方法存在的问题
电力负荷预测的常用方法有回归分析法、趋势外推法、时间序列外推法、灰色模型法、指数平滑法、专家系统法、模糊预测法、人工神经网络法、小波分析法等[2]。
这些电力负荷预测方法可以分为三类:一类是单纯以历史负荷或电量的数据寻找变化规律, 进而推演出未来的趋势, 如趋势外推法, 灰色模型法等;第二类是考虑历史数据的发展规律、变化特点及其相关因素, 如天气情况、经济形势、宏观调控等, 模糊预测法、神经网络预测法等属于这一类。第三类是组合上述各种单一模型的预测方法进行综合预测的方法, 这种方法近年来已成为研究中的热点。
但是, 这些预测方法仍然是集中式的预测方法, 预测的参考数据往往都是全局的数据, 而很少考虑全局内部各地区之间的不同与变化, 对于管辖范围大、负荷分散、负荷特性复杂的供电公司, 集中式预测方法的预测结果往往存在较大的误差。
三、分布式算法概述
分布式算法具有狭义和广义之分, 狭义的分布式算法就是在两个或多个软件互相共享信息, 这些软件既可在同一台计算机上运行, 也可以在通过网络连接起来的多台计算机上运行。广义分布式算法则是研究把一个需要庞大计算能力才能解决的问题分割成很多小的部分, 然后分配给许多计算机进行处理, 最后再将计算结果综合起来得到最终结果的方法。
分布式算法的核心思想是共享稀有资源、在多台计算机上平衡计算负载、把程序放在最适合运行它的计算机上。分布式算法可以发挥出世界各地成千上万的计算机的闲置计算能力, 其计算结果往往具有庞大的计算量。因此, 基于分布式算法的负荷预测方法可较好的解决电力负荷预测中计算量越来越庞大和复杂的问题, 并具有更好的预测精度。分布式算法具有分布性和并发性的特征, 但是缺乏全局状态知识和时钟框架, 非确定性因素大大提升, 还有可能引发计算密集性、数据密集性、通信密集性和可信计算问题。
四、分布式算法的实现途径
基于分布式算法的电力负荷预测就是将上级供电公司的负荷预测任务分解到下级单位, 各个下级供电公司电力负荷预测工作人员根据本辖区内的负荷情况、经济形式、天气情况、产业结构调整以及影响负荷变化的其它因素, 采用适合本辖区特点的预测算法对电力负荷进行预测, 并对预测结果采取必要的干预措施, 再将干预后的结果发送到上级供电公司, 上级供电公司对预测数据进行求和或修正处理, 最终得到全局的负荷预测结果, 大大提高了负荷预测的准确度[3]。
由于分布式系统执行中存在着较多的非稳定性, 设计一套分布式算法十分复杂和困难。分布式预测策略首先要解决的问题是历史数据和预测结果在上、下级供电公司之间共享和通信的问题。当前, 主要有远程连接数据库、电子邮件和FTP模式三种方式实现。
但是, 由于远程连接数据库的连接实现采用专用的光纤数据传输通道, 成本昂贵, 而目前互联网上各种形式的垃圾邮件和病毒邮件蔓延严重影响了电子邮件传输数据的安全性, 因而均不适合作为分布式预测通讯工具。
FTP文件传输协议是使用最为广泛的互联网通讯协议之一, 当运行FTP协议时, 用户即可连接到服务器上传或下载文件, 同时, FTP模式无需专用通信通道, 是目前进行分布式负荷预测的有效的实现途径。
五、结语
随着电力系统朝着智能化和数据海量化、高维化的方向不断发展, 单台计算机已无法承受电力负荷预测中庞大而复杂的数据计算量, 分布式算法是解决这一问题的有效方法, 有利于提高电力负荷预测的准确度。然而, 基于分布式算法的电力负荷系统的实现仍然较为复杂和困难, 也将是今后国内外学者研究的一个重点方向。
参考文献
[1]肖国泉, 王春, 张福伟, 电力负荷预测[M], 北京:中国电力出版社, 2000;
[2]东晓, 曹树华, 赵磊, 电力负荷预测技术及其应用[M], 北京:中国电力出版社, 1999;
分布预测 篇9
由于风能等可再生能源具有不稳定的特点, 大规模的可再生能源给电网带来了一定压力, 给发电、输电、配电和用电方也都提出了一定挑战。目前国内外学者已经对风功率预测[1,2]进行了大量研究, 主要分为两大类:一类是直接对风功率进行预测;另一类是通过风速预测求功率预测值。但现阶段小时级预测误差平均水平也只有20%~40%, 有较大的提升空间。
对预测误差的分析有利于弥补风功率预测水平的不足, 改善风功率输出特性。文献[3]根据概率分布和最小二乘法的相关理论, 提出了一种基于正态分布的描述风电功率预测误差分布模型的新方法。文献[4]考虑将正态分布与拉普拉斯分布的概率密度函数相结合建立风电出力偏差的概率密度分布。文献[5]基于大量实测数据的分析, 发现可以采用带移位因子与伸缩系数的t分布描述风电功率波动特性的概率分布。文献[6]根据随机波动模型的峰度分析技术, 对风电时间序列存在明显的“肥尾”效应时的条件分布进行了分析。
储能系统ESS (Energy Storage Systems) 是平抑波动最理想的选择[7,8,9]。由于风速的高度随机性, ESS的研究大都集中于其暂态稳定性方面的分析[10,11,12,13], 鲜有对ESS的容量配置的研究[14,15,16], 或是仅通过简单的试验来确定储能容量[17,18,19]。文献[20]就如何用最小的ESS实现风电场长时间稳定输出进行了分析, 对风电机组中ESS的配置功率、配置容量的大小及其对风电机组有功功率输出的优化作用进行了研究, 提出了以风电机组及储能装置的输出功率波动标准差为指标的ESS的功率和容量优化方案。文献[21]利用储能容量成本及风电场输出功率平滑效果辅助判据, 得出风电场储能容量合理的取值范围, 使功率波动达国标而不是全部平抑。
针对现有误差分布在计算方法或拟合效果上存在的不同程度局限性, 本文采用文献[22]分区拟合的思想, 将误差分区, 在每个区间分别拟合后, 加权求和获得全区域的误差分布函数。在此基础上, 对储能容量的模型进行了分析, 考虑了预测误差的影响, 将储能容量表示为缺失容量的函数, 以在满足一定概率水平下平抑风功率预测误差带来的功率波动, 降低ESS的投资。
1 预测误差分布
为更加详尽地分析预测误差的影响, 须给出一种合适的分布模型, 用以较准确描述预测误差的分布特性。文献[3-4]分析了拉普拉斯分布、标准正态分布在预测误差拟合上的应用, 虽在整体上能够表示风电功率预测误差的趋势, 但在部分区段上出现严重不符, 若直接利用其来表示实际数据的概率密度分布情况, 在一定程度上夸大了风电功率预测的误差, 从给出的拟合效果图可以看出在部分区间上的局限性。文献[23]采用直接统计的方法对某地区风电场风能的预测误差进行归类统计, 发现风能预测曲线中预测误差的大小与风能输出功率水平有关, 而与时间没有明显的关系, 因此本文将对样本进行纵向划分。另外, β分布在[0, 1]区间具有良好的性质, 只需适当选择参数, β分布就可拟合各种区间序列分布, 曲线形状从均匀分布到近似正态分布、从对称到不对称, 尤其对于“偏峰”分布具有很强的建模能力[24]。因此, 对于未知分布的数据, 可以通过拟合β分布参数来确定相应的数据处理结果, 省去了判别分布的麻烦。本文根据预测误差的分布特性, 结合β分布的类似特性, 来拟合区间风功率预测误差分布。
本文采用文献[22]分区建模的方法展开研究, 基本思路为:将风功率分割为n个区间, 区间长度决定于试验数据的大小。运用β分布分别对每个区间实测功率进行拟合后, 减去区间平均预测功率, 最后进行求和运算, 得到预测误差的整体分布。进行预测误差分析的具体过程如下[22], 文中P为功率有名值, p为相应功率标幺值。
a.应用β分布计算单个区间i的实测功率分布函数fi (p) , 可表示为:
其中, p为区间i的实测功率值;α、β为分布参数, 与区间功率的方差σ2和均值μ有关, 可表示为式 (2) 。
故有:
b.用fi (p) 减去区间i的平均预测功率得到该区间的预测误差分布函数fi (ε) 。
c.求取全区间分布函数。对各区间误差分布进行求和运算, 将得到全区间预测误差的分布函数f (ε) :
其中, ωi为权重系数, 取决于预测值出现在该区间的概率统计值;fi (ε) 为分布于[-1, 1]区间的β分布, 且fi (ε) ≥0, 故加权求和后不会出现正负相抵消的情况。
上述过程采用了文献[22]分区建模的方法, 将风功率进行纵向分割, 反映不同功率区间的预测水平, 且β分布具有较简单的表达形式, 能够很好地拟合预测误差分布, 本文算例将对文献[22]分区建模方法进行验证。f (ε) 的获得, 在风功率预测值的基础上增加了预测误差的分布, 为进一步掌握风功率波动特性提供了方便, 也为平抑风功率波动的研究提供了所需条件。
2 储能容量
ESS是平抑波动最理想的选择。为满足风电接入后系统的安全、电力供需平衡、电能质量的要求, 借助ESS来抑制风电预测误差, 可使原有的波动性、间隙性变得“可控”。本节介绍一种用于评估储能容量的概率方法, 该方法将ESS容量表示为缺失容量UE (Unserved Energy) 的函数, UE定义为ESS补偿 (吸收或输出) 不足的量EUE, 亦可用所占风电装机总量EW, total的百分比eu表示, 表达式如式 (5) 所示:
该方法的目的在于分析ESS在一定概率水平下能够平抑风功率预测误差导致输出波动的能力。本节将详细介绍ESS容量与误差累计分布函数CDF (Cumulative Distribution Function) 及荷电状态SOC (State Of Charge) 的关系。
2.1 ESS功率的确定
ESS应具有短时间快速响应负荷变化、补偿功率偏移的能力。由于目前储能成本较高, ESS容量的配置变得尤为关键, 因其将会影响到系统的工程造价。若ESS的额定功率PESS等于风电装机功率PW, inst, 即pESS=PESS/PW, inst=1 p.u., ESS可以完全平抑风功率预测误差, 但此时需要较大的储能容量。另外, 对于现有预测方法, 出现预测误差很大的概率非常小, 因此, 一般考虑在满足一定概率水平下减小储能容量, 减少投资成本。
在已知风功率预测误差分布f (ε) 的情况下, 容量缺失量eu P可表示为未能补偿的预测误差的积分量, 表达式为:
其中, 为风功率平均值;PW, inst为风电场装机容量;ε为风功率预测误差;积分式乘的目的是为了方便表示eu P占PW, inst的百分比。该式建立了储能功率与容量缺失量之间的函数关系式。
2.2 ESS容量的确定
ESS容量关系的确定较功率的计算复杂得多, 需要分别对能量吞吐率 (ETR) 与充/放电饱和时间tsat进行计算。
2.2.1 能量吞吐率的计算
能量吞吐率定义为能量吞吐量Etp与总发电量EW, total的比值, 如式 (7) 所示:
其中, Etp是ESS充、放电容量的绝对值之和。本文考虑充、放电量相等, 保持功率平衡的理想ESS。理想状况下的能量吞吐率可表示为:
其中, 为风功率预测平均绝对误差;为风功率平均输出值。考虑到时间段相同, 因此可以用与代替Etp与EW, total。
2.2.2 充/放电饱和时间tsat的计算
将风功率预测误差值作为ESS的输入量, 会得到ESS的SOC。SOC标幺化处理方法见式 (9) :
其中, T为预测周期。SOCN=1 p.u.表示ESS充电至额定状态。
可以通过SOCN的累计概率密度函数FSOC计算tsat, 若ESS的容量减少为ex, 则:
由于FSOC分布特性, 有时通过式 (10) 的简单计算, 并不能得到满意的值, 更加有效的方法是其逆过程。因而ESS容量计算式为:
其中, ex为与给定tsat对应的ESS容量;F-1SOC为FSOC的反函数。式 (11) 建立了充/放电饱和时间tsat与ESS容量ex的关系式。因此, 可以借助SOCN的累计概率密度函数FSOC求取ex。
2.2.3 函数关系的确定
前文介绍了eu与ESS功率PESS、储能系统容量EESS的关系, 其实在EESS减小的同时, PESS也会变化。可采用二维插值法来分析EESS与PESS同时减小时, eu的变化。
ETR0表示ESS可以补偿所有功率波动时的能量吞吐率, 当受某种约束使得ESS容量减少, 缺失容量为eu时的能量吞吐率为ETR0′, 则:
其中, etr′0=ETR′0/ETR0为ETR′0的标幺值。至此, 本文完成了考虑风电预测误差的储能系统容量与缺失量关系的分析, 图1给出了储能缺失容量具体计算的流程图, 主要包括两大步骤:一是容量缺失量eu P的计算, 主要与风功率预测误差分布函数f (ε) 有关;二是容量缺失量eu E (EUE的标幺值) 的计算, 需分别计算SOCN的累计概率密度函数FSOC及能量吞吐率ETR0。结合上述2步可建立eu与PESS、EESS的关系, 可根据容量缺失量, 获得所需储能系统的容量配置。
3 评估指标
由于风功率波动的影响, 在储能容量减少的情况下, 系统可能出现容量缺额 (ES) 现象。当风功率波动值大于储能容量, 或波动变化率大于ESS充/放电速率时, 系统无法提供足够功率时均会出现功率缺额现象。本节提出一种储能容量优化 (减少) 前后系统容量缺额评估指标, 定义为:
其中, k为容量缺额评估指标;ES0、ES′分别为优化前、后系统容量缺额;H为评估周期;ES0 (t) 、ES′ (t) 分别为t时刻优化前、后系统容量缺额。容量缺额受风功率变化率充/放电速率PE及SOC等很多因素的影响, 如图2所示。
容量缺额ES的具体计算过程如下。
若初始荷电量大于等于风能波动量, 即SOC≥ΔPW, 则:
若初始荷电量小于风能波动量, 即SOC<ΔPW, 则:
4 算例分析
本文以某地风电场实测数据为研究对象, 该数据序列时间间隔为3 s。采用先预测风速, 再根据风速-风功率关系得风功率预测值。取2011年7月份数据, 按每15 min提取一个点作为原始数据建立模型, 预测下一时刻的风速。预测模型采用文献[1]提出的组合预测模型。该模型采用时间序列和BP神经网络的组合预测模型, 其中BP模型的输入量由历史数据和时间序列得到的残差值组成。设v1是BP神经网络预测值, v2是ARMA预测值, v0是加权平均的组合预测值, 预测误差分别为e1、e2和e0。组合预测模型为:v0=ω1v1+ω2v2, 其中ω1、ω2是相应的权重, 且ω1+ω2=1, 误差为e0=ω1e1+ω2e2。由组合预测模型得到预测值v0后, 求其相对的风功率预测值, 再与实测值比较, 得到误差量。该组合预测方法所得结果较单一预测方法更令人满意, 具有一定的实用价值。
应用第1节介绍的分区建模的方法, 将本文算例功率区间划分为50个区间, 图3只给出了5个区间 (0.2、0.4、0.6、0.8、1.0 p.u.为5个区间的分割点) 的fi (p) 的仿真波形, 每个区间均为一个具有不同分布参数的β分布函数。表1给出这5个区间的权重系数, ωi取为预测值出现在区间i的概率统计值。用fi (p) 减去区间i平均预测功率得到该区间的预测误差分布函数fi (ε) , 仿真波形如图4所示, 图中ε为标幺值, 后同。值得说明的是, 本文算例中, 将风功率区间等分为50份, 对每个区间进行拟合, 并计算其权重系数, 经求和后获得整个区间的误差分布。整个区间的划分份数会影响最后的拟合精度, 若未达到要求精度, 可增加区间数目。
最后, 由式 (4) 求取全区间分布函数。f (ε) 为分布在-100%~100%之间的函数, 为能更清楚地看到本文所提分区方法在整个区间上的有效性, 图5 (a) 中只给出0~100%之间风功率预测误差的概率密度分布曲线图, -100%~0之间的分布可类似得出。为对比分析, 同时绘制了由历史实测数据计算的误差分布曲线, 图5 (a) 给出本文分区拟合的效果, 图5 (b) 给出文献[4]中提到的拉普拉斯与正态分布的拟合效果, 从变化趋势与跟随效果上看, 特别是在误差分布的“肥尾”特性上, 本文采用的分区拟合方法都有较好的效果。通过算例验证了文献[22]提出的分区拟合方法的有效性, 为进一步分析储能模型提供了所需条件。
根据得到的风功率误差分布, 由式 (6) 仿真计算, 得到pESS随eu P的变化曲线图, 如图6所示。从图中可以根据容量缺失量, 得到对应所需ESS的功率。在本文仿真分析工况下, pESS随eu P的变化幅度非常大, 特别是在eu P (0, 1.5%) 的区间内, pESS甚至出现了直线下降的现象, 由1 p.u.迅速减小到0.4 p.u.。因此, 出于经济性与实用性考虑, 适量地增加eu P, 可以减弱对ESS的苛刻要求。
图7给出了由SOC的累计密度曲线求取ESS容量的过程, 图中SOC为标幺值, 实线部分为累计概率密度函数FSOC的变化曲线, (100-tsat) 与曲线交点的横坐标值便为F-1SOC (100-tsat) , 图中取tsat=20%, 可由F-1SOC求得ex=0.38, 为建立缺失量与储能容量函数关系建立基础。
至此, 算例介绍了风功率预测误差建模的完整过程, 并基于此得到了pESS随eu P的变化曲线图, 给出了由SOC的累计密度曲线求取ESS容量的过程。从仿真结果可以看出, 本文提出的分区拟合方法都有较好的效果;eu P的提出可以减弱对ESS的苛刻要求。
5 结论
本文在对风功率预测误差分析的基础上, 提出一种用于评估储能容量的概率方法, 主要结论如下。
a.采用分区拟合的思想, 将风功率误差区间分成若干小区间后, 在每个区间中应用β分布拟合, 最后加权求和获得全区域的误差分布函数。仿真结果验证了分区拟合方法的正确性。
b.介绍了一种用于评估储能容量的概率方法, 该方法将ESS容量表示为缺失容量的函数, 目的在于分析ESS在一定概率水平下能够平抑风功率预测误差导致输出波动的能力, 同时减少对ESS的要求, 并详细介绍ESS容量与误差累计分布函数、SOC的关系。
c.最后提出一种新的容量缺额指标。
摘要:针对正态分布与拉普拉斯分布用于拟合风功率预测误差较大的不足, 采用分区拟合的思想对误差进行分区, 并在每个区间中应用β分布拟合后, 加权求得全区域的误差分布函数。基于此, 建立考虑预测误差分布的风电场储能容量数学模型, 其中储能容量表示为缺失容量的函数, 并介绍储能容量、误差累计分布函数与荷电状态的关系。提出一种新的系统容量缺额评价指标, 用于比较储能容量优化效果。算例分析结果表明, 该方法可以在一定概率水平下平抑风功率预测误差带来的功率波动, 同时降低对储能系统的要求。