预测功率论文

预测功率论文（精选7篇）

预测功率论文篇1

摘要：本题根据风电功率历史数据, 采用灰色预测方法风力发电机组功率进行短期实时预测, 并提出了采用基于灰色预测的卡尔曼滤波器负荷预测法预测风电功率。

关键词：风电场,功率预测,灰色预测,卡尔曼滤波器

一、引言

风能是一种可再生、清洁的能源, 现今风力发电主要利用的是近地风能。近地风具有波动性、间歇性、低能量密度等特点, 因而风电功率也是波动的。大规模风电场接入电网运行时, 大幅度地风电功率波动会对电网的功率平衡和频率调节带来不利影响。因此, 如何对风电场的发电功率进行尽可能准确地预测, 是急需解决的问题。根据电力调度部门安排运行方式的不同需求, 风电功率预测又可以分为日前预测和实时预测。日前预测是预测明日24小时96个时点 (每15分钟一个时点) 的风电功率数值。实时预测是滚动地预测每个时点未来4小时内的16个时点 (每15分钟一个时点) 的风电功率数值。国家能源局颁布的风电场功率预测预报管理暂行办法中给出了误差统计的相应指标。本文针对某风电场58台机组额定功率为850 kw的风电机组20天 (每15分钟一个预测点) 的历史数据使用灰色预测法进行了该风电场的实时预测。

二、原理分析

灰色系统是既含有已知信息, 又含有未知信息或非确知信息的系统, 灰色模型预测是针对于灰色系统提出的预测方法。GM (1, 1) 模型是基于灰色系统理论的常用预测模型。因为它具有要求原始数据少、不考虑分布规律、不考虑变化趋势、运算方便、短期精度高、已与检查的优点, 得到广泛的应用。

(1) 对功率序列做一次累加 (1……AGO) 生成序列

(2) 按照的指数增长规律, 可知满足下列一阶线性微分方程。

是时间t的函数, 这是灰色方程, 部分数据未知)

(3) 参数估计:记待定, 经离散化出力, 得Ya=BA:使用最小二乘法求出A的近似解, 将近似值代入原微分方程:原微分方程的白化方程)

其中

(4) Xi (1) 的预测值:求解微分方程的近似解

其中

三、实例分析

对于实时监测到的数据 (本文中用到的训练数据和验证数据) , 由于其存在可能的错误和误差, 错误主要来源于本身测量数据有误、采集后传输数据通信信道受干扰是数据有误、人为记录或自动数据录入有误等等, 为了确保数据的合理性, 以便做出最准确的分析, 我们对数据做如下处理:当预测的风电功率小于零时, 令预测值等于零。当风电功率超过装机容量时, 令预测值等于装机容量值。当预测值与前一个值的差值超过了风电功率波动的3倍时, 这时认为该处预测的风电功率值不可信。事实上风电功率波动超过平均波动量的3倍的概率只有3%, 在数学属于小概率事件。接下来, 对原始序列进行归一化和多次叠加, 使得数据复合指数分布。

最后利用matlab软件进行编程, 实现其预测:

四、结语

灰色模型预测的实现只需经过数据的过滤、多次叠加、归一化处理、进行灰色模型预测, 最后逐步还原数据即可完成整个预测, 实现较为简单, 预测的合格率、准确率较高。一定程度上逼近真实曲线, 可以作为风电负荷预测的一种参考方式。

参考文献

[1]傅立.灰色系统理论及其应用[M].北京:科学技术文献出版社, 1992.

[2]丁明, 张立军, 吴义纯.基于时间序列分析的风电场风速预测模型[J].电力自动化设备, 2005.

[3]杨秀媛, 肖洋, 陈树勇.风电场风速和发电功率预测研究[J].中国电机工程学报, 2005, 25 (11) :1-5.

[4]谷兴凯, 范高锋, 王晓蓉, 等.风电功率预测技术综述[J].电网技术, 2007, 31 (S2) :335-338.

[5]洪翠, 林维明, 温步瀛.风电场风速及风电功率预测方法研究综述[J].电网与清洁能源, 2011, 27 (1) :20-66.

[6]屠强.风电功率预测技术的应用现状及运行建议[J].电网与清洁能源, 2009, 25 (10) :4-9.

光伏功率预测技术篇2

光伏发电已经成为继风力发电之后的可再生能源发电的新增长点。2005—2014 年全球光伏发电装机容量平均年增长率高于30%[1], 2014 年全球光伏发电总装机容量已达约186 GW, 欧洲光伏发电量占总发电量的峰值比例达7%[2]。

2009—2013 年中国光伏发电装机容量平均年增长率均超过了100% , 从2009 年的0. 3 GW增长至2014 年的28 GW[3], 仅次于德国 ( 38. 2 GW) , 居世界第二位。中国光伏发电的主要利用模式逐渐从早期分布式离网光伏系统模式发展成大型并网光伏电站模式, 截至2014 年底, 集中并网型光伏电站占光伏发电总装机容量的83. 35%[3]。

由于日照的昼夜周期性, 光伏电站只能白天发电, 是一种典型的间歇式电源; 光伏功率受气象、环境条件影响, 具有较大的波动性和随机性。这些特性使得大规模光伏发电并网对电网造成不良影响。若能及时、准确地预测光伏功率, 将对电网调度及光伏电站运行具有重要意义。

光伏功率预测即根据历史和当前数据对未来一定时段的光伏功率进行预测, 按预测时长可分为超短期光伏功率预测、短期光伏功率预测和中长期光伏功率预测。光伏功率预测精度强依赖于天气模态和气候条件等因素。美国加州地区的统计表明[4], 晴空条件下, 超短期光伏功率预测的方均根误差在8% 以内; 而非晴空条件下的方均根误差高于20% 。有研究表明, 超短期光伏功率预测的方均根误差最小可达到3. 9% , 短期预测的方均根误差可达4. 6%[5]。

国际上已有不少机构提供光伏功率预测和光资源评估的服务, 如AWS Truepower, Clean Power Research, Green Power Labs, Meteo Test瑞士公司开发的Meteonorm软件, 以及法国美迪公司的Meteo Dyn Solar。基于光伏功率预测可拓展开发光伏系统工程设计应用软件, 如瑞士日内瓦大学能源课题组开发的PVSYST软件; 国内如中国电力科学研究院电工所开发的针对光伏功率预测和光伏系统设计的软件。光伏功率预测已开始应用于电力系统运行, 国家电网智能电网调度控制系统 ( 简称D5000 系统) 的新能源监测与调度高级应用中包含了光伏功率预测功能模块。

总体来看, 国外的光伏发电产业较中国起步早, 已经积累了大量的技术成果、工程经验和运行数据;中国目前在光伏功率预测领域的研究稍滞后于欧美发达国家, 仍处于探索阶段。

本文对光伏功率预测的技术体系、研究热点进行了梳理, 以期为中国的光伏功率预测研究与应用提供借鉴和启发。

1 光伏功率预测原理和基本框架

光伏功率预测是以数值天气预报 ( numerical weather prediction, NWP) 数据或/ 和实测数据为基础, 结合光伏电站地理坐标及具体地域特点的参数化方案, 建立预测模型及算法, 实现对未来一定时间段内光伏电站输出功率的预测。

光伏发电从光到电能量的传递路线如图1 所示。

太阳辐照度是决定光伏功率的主要因素, 与光伏功率大致呈线性关系。本节将从光伏功率 ( 或辐照度) 的关键影响因素、光伏功率特性、预测方法、预测模式以及预测精度评价5 个方面对光伏功率预测原理和框架进行介绍。

1. 1 关键影响因素

影响光伏功率的因素众多, 相互耦合。按照太阳能传递和转化过程, 主要影响因素如图2 所示。

辐照度受到气候、气象、地理等因素的影响, 其预测精度直接影响光伏功率预测精度。

气候是某地区长时间尺度的大气一般状态和天气过程的综合表现, 是影响光资源水平的重要因素。

气象是指短时间尺度的大气物理现象, 如温度、云等。气象因素是影响光伏功率的重要因素, 可通过NWP ( 含全球和中尺度模式) 、地面天空成像仪、卫星测量、地面遥感测量等方式获取。不同方式获取的气象数据具有不同的时空分辨率和精度水平, NWP时空分辨率较低、时空尺度较大; 而地基云图对云层的预报时空分辨率较高, 但时空尺度较小。

地理因素如光伏电站的地理坐标、地域环境等, 这些因素对预报的影响较为稳定。

电气效率主要指光伏组件、电站其他电气设备的效率, 前者直接影响光转电环节的能量转换效率, 后者影响电能从光伏组件传送到电网的效率。

电站设计、人为因素也将对光伏功率产生影响。

1. 2 光伏功率特性

光资源和光伏功率具有以下4 个特点。

1) 较强的昼夜周期性和季节周期性。日照昼夜周期性和日—地相对位置周期性变化决定了光伏功率的这一特点, 而风功率则不具有类似特性。

2) 影响因素多、影响机理复杂。地面辐照度和光伏功率受到气候、气象、地理等多种因素影响, 且不同因素在不同环境下对其影响程度不同[6,7]。而风功率则主要取决于风速, 其他因素如风向、温度、气压等, 则影响较小。

3) 波动性和随机性强、变化频率快。电力负荷无法突变, 风功率的波动性强于电力负荷, 主要体现为小时级波动[8], 而光伏功率可在数分钟内实现从满功率到零功率变化, 具有更强的波动性。

4) 数据样本有限、数据条件较差。受限于测量设备和技术, 光伏数据量少、质差, 因此光伏功率预测要解决小样本预测难题。

1. 3 光伏功率预测方法分类

光伏功率预测方法的分类方式很多, 根据预测过程的不同, 可分为直接法和间接法; 根据建模方式的不同, 可分为物理方法和统计方法; 根据预测时间尺度不同, 可分为超短期 ( 0 ~ 6 h) 、短期 ( 6 h ~ 1 d) 和中长期 ( 1 月~ 1 年) 预测法; 根据预测的空间范围大小不同, 可分为单场预测和区域预测。

1. 3. 1 直接预测法和间接预测法

直接预测法是根据光伏功率历史数据直接进行预测; 间接预测法是首先预测地表或光伏电池板接收的太阳辐照度, 再预测光伏功率。两类预测方法的流程如图3 所示。

直接预测法的建模难度较大, 不同时间尺度和工作状态下映射关系的变化可能导致模型性能下降甚至失效。间接预测法在整个预测过程中可能需要建立多个预测模型, 较为复杂。

1. 3. 2 物理方法和统计预测方法

物理方法基于太阳辐照传递方程、光伏组件运行方程等物理方程进行预测, 需要光伏电站详细的地理信息以及气象和太阳辐照数据; 统计方法基于预测模型输入、输出因素之间的统计规律进行预测。

物理方法不需要大量历史数据, 适用于新建的光伏电站, 但需要光伏电站详细的地理信息和组件参数等数据[9], 建模过程复杂, 且难以模拟一些极端异常天气情况和环境及光伏组件参数随时间发生的缓慢变化, 模型抗干扰能力较差, 鲁棒性不强。

统计方法需要从大量的历史数据中获取预测需要的规律, 如光伏电站有功功率与气象数据、历史运行情况之间的规律, 对光伏电站的地理信息和测光资料要求不高。

1. 3. 3 超短期、短期和中长期预测

超短期光伏功率预测可提供功率瞬变信息; 短期预测可用于调度计划制定、负荷跟踪预测、电力市场等领域; 中长期光伏功率预测可用于光资源评估、新建光伏电站规划等领域。

超短期光伏功率预测可采用物理方法和统计预测方法。其中物理方法主要是对云图进行图像处理, 结合NWP或地面观测站数据, 进行光伏功率预测; 统计预测方法主要采用自回归滑动平均 ( ARMA) 算法、人工智能算法、持续预测法等进行预测。

相比之下, 短期功率预测需要气象数据的时空分辨率要求相对较低, 可利用精细化的NWP数据进行预测而不必采用云图数据。

中长期光伏功率预测主要是根据地区历史光资源数据等估计未来较长时间段内的光伏功率。

1. 3. 4 单场预测和区域预测

单场预测是指单个光伏电站的功率预测, 区域预测是指对某个区域范围内的多个光伏电站总出力的预测。

单场预测可为发电运营者提供光伏电站的功率预测信息, 主要应用于光伏电站发电的优化运行与控制; 区域预测可为电网运营商提供某一区域范围内的光伏出力值, 帮助电力调度部门预估光伏功率波动, 制定多种电源协调调度计划, 降低光伏电站接入对电网的不利影响。

区域光伏功率预测的精度往往高于单场功率预测精度[5]。通过区域光伏电站之间的随机误差相互抵消, 预测方均根误差可减少64%[10]。

1. 4 光伏功率预测典型模式

图4 是光伏功率预测的几种典型模式, 分别适用于不同的数据条件、预测时空尺度及精度要求。

1) 模式1

输入气象数据、辐照数据, 建立预测模型。该模式适用于气象、辐照数据可得的情况, 对光伏电站的历史运行数据要求不高。进行大空间尺度预测时, 采用NWP数据较合适;进行小范围局部预测时, 采用地面测量站数据更精确。这一模式多用于短期光伏功率预测, 随着NWP的时空分辨率上升, 模式1也逐渐在超短期光伏功率预测中使用。

2) 模式2

输入光伏电站历史发电量, 建立预测模型。该模式适用于缺少气象、辐照数据但历史运行数据可获得的情况, 可在超短期和短期光伏功率预测中使用。当光伏电站所处地区气候变化不明显时, 未来光伏功率与历史光伏功率具有较强相关性, 该模式可达到较高精度。

3) 模式3:

输入气象、辐照、光伏电站历史运行数据等, 建立预测模型。该模式对输入数据要求最高, 预测结果的精度也较高。

4) 模式4

基于持续预测模型和晴空预测模型的基础预测模式。针对天气预报数据较难获取或新建光伏电站历史数据较少的情况, 使用上述两个预测模型实现光伏功率粗略估计。基础模型算法简单、实现要求低, 但其预测精度较低、适用时空尺度较小, 常作为对照模型, 对比新预测模型的预测效果。

所有预测模式的关键都在于寻找已知变量和数据与未来光伏功率之间的映射规律, 如模式1 需寻找气象因素、地理因素与地面辐照度之间的规律, 模式2 需要寻找历史和未来发电量之间的规律。

1. 5 预测精度评价指标

统一有效的预测精度评价指标有利于不同研究结果之间的比较。假设X为实测值、为预测值、N为样本数据量, 则常用的预测评价指标如下[11]。

1) 方均根误差eRMSE:

2) 平均绝对误差eMAE:

3) 平均误差eMBE:

平均误差可以反映预测系统的系统性偏差。

4) 相关系数ρ:

式中: cov表示协方差; var表示方差。

5) 标准差eSDE:

且有

6) 技术得分 (skill score)

是将新模型与基准模型预测结果进行对比得到评价指标, 常用的基准参考模型有持续预测模型[5], 其计算方式如下:

式中: Mr, Mf, Mp分别为基准预测模型、新预测模型、无误差完美模型的某个预测误差指标。

2 光伏功率预测算法

2. 1 预测技术图谱

光伏功率预测的关键在于确定不同时空尺度下影响光伏功率的主要因素及其作用机理, 并选择恰当的算法建立预测模型。常见的预测技术方法总结如图5 所示。

图5 中: WRF为天气研究和预报模型; MM5 为第5 代中尺度预报模型; GFS为全球预报系统;ECMWF为欧洲中尺度天气预报中心。

图5 中的预测方法基本沿着两条思路展开技术研究。

1) 研究辐照度、光伏功率的关键影响因素, 这是物理方法的思路, 主要方法有基于云图 ( 超短期) 和NWP ( 短期、中长期) 的方法。

2) 学习辐照度、光伏功率历史规律, 这是统计方法的思路, 主要方法有神经网络等智能算法、时间序列法、基础预测法等。

本节按预测时间尺度分超短期和短期光伏功率预测进行方法评述, 中长期光伏功率预测目前研究较少, 此处不再进一步评述。

2. 2 超短期预测

适用于光伏功率超短期预测的方法有基础预测方法、基于云图的预测方法以及基于数据驱动的预测方法。目前NWP时空分辨率普遍较低, 暂不适用于超短期预测。

2. 2. 1 基础预测方法

持续预测方法假设预测时刻气象、辐照等条件与当前时刻一致, 从而采用数据外推方法预测辐照度和光伏功率。这是最简单的预测方法之一, 但精度也较低, 通常情况下, 持续预测在超过1 h的预测中仅作为基准预测方法而非实际应用的工程算法[12]。

晴空预测模型 ( clear sky model) 假定天空中无云, 基于大气辐射传输模型和大气要素进行辐照度或光伏功率预测, 其主要考虑的大气要素有臭氧含量、水汽含量、林顿浑浊度等[13], 主要的预测模型有Solis模型、ESRA模型、Bird and Hulstrom模型、Ineichen模型等[14]。晴空条件下光伏功率波动小, 能够最大限度地反映辐照度的发电效应, 因此常将晴空预测模型作为基本标定模型。

上述两种基础预测模型适用于光伏数据缺失或数据质量较差的情况, 但由于无法考虑辐照度和光伏功率的波动性和随机性, 其预测精度较低, 在天气状况变化剧烈或预测时间尺度较长时预测效果更差, 目前工程应用不多。

2. 2. 2 基于云图的超短期预测

云是影响地面辐照度的主要气象要素, 云层运动是地面辐照度和光伏功率波动性的主要原因[15], 因此, 基于云图的预测方法成为精细化光伏预测的重要技术方向之一。基于云图的超短期预测通过专用设备对云进行测量并完成图像采集, 利用在线图像分析技术分析云层运动情况, 预测云层对太阳光的遮挡情况, 实现地面辐照度和光伏功率预测。基于云图的光伏功率预测误差随着预测时间尺度增加而变大, 实时预测的方均根误差在5% 以内, 而10 min预测的方均根误差则可达20% 以上[16]。

常用的云图有地基云图和气象卫星云图。其基本原理都是在假定云团形状不发生改变、云团移动速度在短时间内保持不变的情况下, 通过连续图像分析得到天空云层的分布位置、云团大小、移动速度等信息。所有的云图都需要进行图像处理识别云团, 通过块匹配技术、交叉相关算法[17]等方法预测云团运动、形成云指数图、预测云团遮挡等操作。其中云指数的提取技术已经较为成熟, 常用于太阳资源研究[17,18]。图6 所示为通过分析气象卫星Mereosat-9 拍摄的云图形成的云层移动矢量图[18], 从中可以清晰地看到云层的运动方向和速度, 从而得到考虑云层遮挡效应后的辐照度数据并进一步预测光伏功率。表1 对基于卫星云图和地基云图的两种预测方法进行了对比。

虽然基于云图的方法为实现精细化预测提供了可能, 但受限于测量设备和方法局限, 仍然存在以下不足。

1) 由于在预测中默认假设短时间内云团的形态、速度保持不变, 因此在云团形态和移动速度剧烈变化时, 该方法无法获得准确预测结果。

2) 云层高度信息获取困难或缺少。云层对地面的遮挡与云层的高度有密切关系, 但云图无法给出云层高度信息, 将不同高度的云层统一处理, 会增加预测的误差。

3) 卫星云图空间分辨率较低, 图上一个像素点对应较大的地面面积, 无法判定小范围内云层情况。

4) 地面天空成像仪拍摄空间有限, 只能获取较小范围内云层信息, 当云层移动速度较快时, 预测时间尺度将大大缩减。

5) 云图图像处理分析需在极短的时间内完成, 对算法速度要求高, 需权衡速度与精度。

为弥补上述不足, 有研究尝试将云图与其他预测方法或数据来源相结合, 共同实现超短期辐照度或光伏功率预测, 如文献[19]将卫星云图的分析数据与地面遥测数据相结合, 共同作为预测模型的输入进行预测; 文献[20-21]利用卫星云图与NWP数据进行提前4 h的超短期光伏功率预测; 文献[19-22]分别将地基云图数据和卫星云图数据、NWP数据相结合进行预测。

国内对基于云图的预测方法研究及应用时间较短, 对云层信息预报能力有限, 仍处在探索阶段。国外在此方面的研究起步较早, 但受限于预测精度和时空尺度, 现阶段工程应用实例不多。

文献[23]介绍了安装在美国San Diego的地基云图分析系统, 在不同时间尺度、不同季节条件下对比基于地基云图的超短期辐照度预测与持续预测的精度, 基于地基云图的预测在30 s预测尺度下整体优于持续预测, 在5 min预测尺度下优势并不明显。

2. 2. 3 基于数据驱动的超短期预测的数学方法

超短期预测算法已被用于电力负荷和风功率预测中, 在光伏功率预测中也有着广泛的应用前景。根据算法原理的不同, 可以分为线性和非线性预测算法以及两种或多种预测算法组合形成的综合算法。

1) 线性预测算法

线性预测算法利用光伏电站的历史数据和外源性气象数据等, 进行多元回归, 预测光伏功率或地面辐照度, 常见的算法有ARMA、自回归积分滑动平均 ( ARIMA) 、外源自回归滑动平均 ( ARMAX) 等。

2) 非线性预测算法

光伏功率与其作用因素之间存在着较强的非线性关系, 单纯采用线性预测算法可能无法获得期望精度。非线性预测算法主要依据多因素与光伏功率之间的非线性统计规律, 实现预测。主要算法有: 神经网络算法[22,24]、支持向量机 ( SVM) 算法[9,25]、卡尔曼滤波算法[26,27]、马尔可夫链算法等。

3) 综合预测算法

综合预测算法是针对辐照度和光伏功率特性, 选择算法进行组合得到的。针对各因素对光伏功率的线性和非线性影响, 将线性和非线性预测算法相结合; 针对云对光伏功率的显著影响, 将云图与智能算法如神经网络算法相结合[24]; 针对光伏功率变化频率快, 文献[28]将AR回归模型和Lucheroni模型相结合, 建立CARDS综合模型, 利用Lucheroni模型处理高频数据; 针对光伏功率的波动性, 文献[29-30]分别将小波分析算法与智能预测算法相结合, 将光伏功率分解到不同频段 ( 能量段) 上分别进行预测; 针对光伏功率的周期性和规律性, 采用相似时段选择算法[25], 利用分类/聚类方法筛选与预测对象具有相同特征和规律的训练样本; 利用光资源的物理特性, 如空间相关性, 将目标光伏电站周边的光伏电站历史数据和目标电站历史数据作为预测模型的输入[31]。

采用综合预测算法时, 需要深度把握光伏发电及光资源特性方可得到恰当的算法组合, 否则可能无法提高预测精度。但目前研究还停留在不同算法间的机械组合, 尚未深入到依据特性组合算法层面。

2. 3 短期预测

2. 3. 1 基于NWP的预测

短期预测一般需要NWP。NWP可以提供光伏功率的关键气象因素及辐照度的预报。NWP模型由一组根据物理规律建立的、用于预测大气状态的微分方程组成, 最大预测时间尺度为10 d[5], 可同时给出风功率和光伏功率预测所需的风速和辐照度信息。根据预测时空分辨率不同, NWP可分为全球和中尺度NWP。全球NWP目前运行在大约15 个气象服务站[12], 如美国国家海洋和大气管理局 ( NOAA) 的GFS及ECMWF, 其空间分辨率一般为16 ~ 50 km, 时间分辨率一般为3 ~ 6 h。中尺度NWP是基于全球天气预报的输出结果和地区特点进行的预报, 相比于全球NWP具有更高的时空分辨率, 其空间分辨率一般为5 ~ 20 km, 甚至可达1 km, 时间分辨率可达15 min ~ 1 h。中尺度NWP模型还可根据地域特点, 利用数据后处理技术对结果进行修正[12]。常用的NWP模型如表2 所示[13]。

通过NWP得到的辐照度可能存在较大误差, 主要误差来源有NWP模型内辐照转化模型 ( RTM model) 、云量预测模型及其他预报变量的误差[32], 一般误差在非晴空条件下比晴空条件下大。

改进NWP精度的常用方法有数据后处理技术, 通过模式输出统计 ( MOS) 方法可以对NWP的输出结果进行修正[12,32]; 时空平滑法, 采用多个网格预测平均值作为一个区域的预测值[10]。

注:GFS*表示GFS的升级;RUC为快速更新循环模型;RAP为快速刷新模型;NAM为北美中尺度预报模型;HRRR为高分辨率快速刷新模型。

现阶段, 很多国家提供了NWP公共服务。与国外先进水平 ( 如丹麦) 相比, 中国的NWP精度较低。

2. 3. 2 常用短期预测算法

用于短期辐照度和光伏功率预测的主要算法有如下几种。

1) 神经网络算法

神经网络算法具有良好的泛化能力和容错能力, 广泛运用于光伏功率预测[33,34]。目前不少研究在神经网络算法基础上, 通过建立组合模型、优化输入神经元结构、改进网络内部算法等来适应实际预测问题。

虽然神经网络算法可拟合复杂的非线性关系, 但高精度的神经网络预测模型需要高精度的输入数据。当样本复杂且分散时, 神经网络可能无法有效学习输入、输出之间的规律, 导致预测精度较低。

2) 分类回归算法

分类回归算法以光伏功率的周期性和规律性为基础, 建立特征指标体系, 划分数据样本, 获得相似日样本[9,35], 根据样本特点建立预测模型, 利用与预测目标时段具有高相似度的样本训练模型进行预测。采用分类回归算法可以有效学习目标时段规律, 提高预测效率和精度。常用的分类回归算法有SVR[36,37]和决策树 ( CART) 等。

分类特征指标体系的确立是这一类方法的关键, 目前这方面尚缺少深入研究。

3) 时间序列算法

用于短期与超短期光伏功率预测的时间序列算法原理相同, 主要有ARMAX[38]、外源自回归 ( ARX) [39]算法等。时间序列预测算法适用于对预测精度要求不高、天气变化不明显的情况。

4) 小波分析算法

小波分析具有多分辨率分析的特点, 在时域和频域都具有表征信号局部信息的能力。近年来, 国内外不少研究将小波分析用于分析和预测光伏功率[29,40], 对光伏功率进行不同频段的分解和预测, 以及异常数据点识别。

由于小波分析并不能直接实现光伏功率预测, 因此小波分析算法往往在组合模型中出现, 用于深入分析变量之间的关系和提高预测精度。

5) 随机森林算法

随机森林是一种统计学习理论, 通过重抽样方法抽取多个样本, 建立决策树, 组合多棵决策树预测最终结果, 其对异常值和噪声有较强的容忍度, 不易出现过拟合问题[41]。随机森林算法在光伏功率预测领域的运用较少, 仅有少量研究尝试建立有差异的回归树实现光伏功率预测[42]。

由于在不同天气模态下光伏数据特点不同, 预测适用的算法不同, 因此后续的研究中可以构建多预测模型森林, 针对实际情况自主选择预测结果的组合。

6) 概率预测算法

概率预测方法能给出下一时刻可能的光伏功率值及其出现的概率, 提供了较全面的预测信息[43]。

目前国内外对光伏功率的概率预测还处于研究起步阶段, 主要尝试将不同概率预测算法套用到光伏功率预测问题[44,45], 在建立适用于光伏功率预测问题的概率预测模型、建立误差评价标准等方面都需要进一步深入研究。

7) 综合预测算法

综合预测算法[46,47,48,49]的基本思想与超短期预测中综合法类似, 是研究热点之一, 但目前针对特定预测环境的组合模型分析较少, 组合模型对预测精度的提升效果有限。

3 提升预测精度方法

3. 1 提升预测精度概述

光伏功率预测强依赖于天气模态数据样本, 其精度在不同天气模态下差异较大。文献[5]指出光伏功率预测的方均根误差 ( 0 ~ 300% ) 与太阳高度角和天空晴朗程度相关, 如图7 所示。

提高预测精度是光伏功率预测的核心问题, 目前研究主要聚焦在通过数据预处理提升输入数据品质以及深度挖掘数据特性提高模型精确性两方面, 前者如坏数据剔除、缺失数据重构、数据归一化和去趋势化等; 后者如数据样本筛选和输入参数优选。

3. 2 光伏数据预处理

光伏数据质量参差不齐, 通信、测量环节的问题都可能导致坏数据产生及数据缺失; 不同类别的数据具有不同的量纲和数值范围, 因此, 对光伏数据进行预处理操作是高精度预测的必要环节。

1) 坏数据剔除

通常依据物理规律或数据采集质量控制要求剔除坏数据。但由于光伏数据本身具有较大的分散性, 对坏数据的定义是一个难点, 定义不准确会导致误判。目前这方面的相关研究不多。

2) 缺失数据处理

当要求数据具有连续性或者数据样本较小时, 剔除缺失数据段会给预测精度带来较大影响, 因而重构缺失数据很有必要。

插值法是最简单的数据重构方法之一, 如采用插值法提高NWP数据的时空分辨率。但由于光伏数据的波动性和随机性显著, 插值法可能无法较好地还原数据序列。文献[50]采用已知数据建立特征空间, 利用SVM分类模型实现历史缺失数据的恢复, 但对用于分类的特征空间分析和论证较少。

辐照度和气象因素都具有较强的空间连续性和相似性, 由此产生了基于空间相关性的数据还原技术。文献[51-52]采用空间相关性理论, 利用目标光伏电站周边光伏电站的数据和主成分分析法, 实现对目标光伏电站辐照度或功率缺失数据的重构。这种方法不仅能还原数据序列, 而且可用于光伏功率预测。但现阶段国内外对光资源空间相关性研究不多, 国外对空间相关性的研究较少考虑光伏电站之间的地理方位关系, 而国内光伏发展起步较晚, 区域光伏电站的数据积累不够, 相关方面的研究还处于探索阶段。

3) 数据归一化和去趋势化

对光伏数据实行归一化操作是为了避免不同数据的量纲和大小范围导致的预测结果不准确问题。

光伏数据序列具有较明显的季节、时间变化趋势, 而统计方法如ARMA等不能适应具有趋势的数据, 需要对光伏数据进行去趋势化操作。去趋势化常通过将辐照度数据标准化或转化为晴空指数进行[53]。

3. 3 数据样本分类筛选

光伏数据样本筛选的研究主要包括光伏数据分类/聚类和预测模型输入参数选择。分类/聚类方法研究是当前研究热点, 常采用“相似日”的概念[54]。光资源特性和光伏发电特性的研究是实现光伏数据样本筛选的基础, 可以用相关性分析和多元回归方法进行特性分析[55]。

3. 3. 1 样本分类筛选

所谓样本分类筛选, 即通过分类或聚类的方法寻找相似样本, 用于预测模型的训练, 不仅可以防止小容量样本的规律性被遮盖, 还可使预测模型对目标样本更有针对性。分类筛选研究可分为以下两类。

1) 将光伏数据按不同的天气类型划分。划分依据通常是季节与天气类型[50,56], 也可用辐照度和云量作为指标[57], 将光伏样本划分为如晴天、阴天、雨天等。此类划分指标选取简单、实现方便, 但划分结果粗糙, 不能给出精确的物理、数学解释。

2) 选择特征指标构造特征空间, 并通过Kmeans聚类、自组织神经网络 ( SOM ) [36,58], 以及SVM[37]和CART[59]等方法实现样本的分类/聚类。选择区分度显著的特征指标和有效的分类/聚类方法是这类研究的重点。特征指标的获取方式有:1直接从NWP中获取, 如温度、云量[58]等; 2提取直接可得参数序列的某个统计指标作为特征指标, 如晴空指数、辐照度三阶导数最大值、辐照度方差、辐照度与理论值偏差值[50,60]等; 3变换直接可得参数, 形成特征指标, 如采用主成分分析法将现有的相互相关的参数转换成互不相关的主成分[61]。

目前研究主要集中在对不同指标和聚类方法的选择上, 有以下两点不足。

1) 对特征空间构造的阐述不足。样本划分合理性的关键在于特征空间构造的正确性, 特征空间的构造需要联系光伏发电的内部物理规律, 选择与光伏功率最显著的变量进行构造。

2) 缺少对光伏数据时序特征的描述。光伏数据往往是一系列具有很强周期性和时序规律性的时序数据, 但现阶段的研究很少涉及时序特性的描述。

现阶段分类/聚类较粗糙, 实现精细化分类是提高光伏功率预测精度的关键, 也是后续研究的重点。

3. 3. 2 输入数据选择

输入数据选择是通过物理分析和数学方法, 选择目标预测条件下的主导因素。

在不同预测时空尺度、天气模态下, 对地面辐照度和光伏功率产生主要影响的因素不同, 直接辐照度、总辐照度、散射辐照度的主要影响因素也不同, 如在长预测时间尺度上气象要素的重要性比短预测尺度小[6]; 对地面直接辐照度影响最明显的因素是云层覆盖率、气溶胶光学厚度、对流层大气成分和平流层大气, 而对地面总辐照度影响最明显的因素是降雨量和太阳天顶角[7]。随着气象研究的发展和测量技术的升级, 还出现了一些与地面辐照度和光伏功率相关的新参量, 如液态水深[62]、空气质量系数[63]、气溶胶光学厚度[64]等。

输入数据选择的方法有多元线性回归法[65]、主成分分析法[66]、相关系数计算法[56,67]、灵敏度分析法、伽马测试 ( GT) 和遗传算法 ( GA) [7]等。

4 结语

中国已实现基本光伏功率预测功能, 建立了多个完整的光伏功率预测模型。但光伏功率与气象等因素作用关系复杂多变, 对其之间的规律性挖掘不够充分; NWP的预测时间尺度和精度尚未达到高精度光伏功率预测的要求, 同时受到光伏数据积累量和限电等原因导致的数据质量问题等制约, 预测精度与国际先进水平仍有一定差距。

光伏功率预测研究现集中在超短期和短期预测上。提高预测精度是当前研究热点, 数据预处理和样本分类筛选是提高精度的有效方法。

以提高中国光伏功率预测精度为目标, 对国内光伏功率预测研究提出以下建议。

1) 加强数据质量控制, 深入数据预处理研究。从测量、传输开始控制数据质量, 选择可靠的传输协议, 并通过数据预处理技术, 利用光伏数据特性, 如空间相关性, 剔除坏数据、还原残缺数据集, 增强数据的完整有效性。

预测功率论文篇3

由于风能等可再生能源具有不稳定的特点, 大规模的可再生能源给电网带来了一定压力, 给发电、输电、配电和用电方也都提出了一定挑战。目前国内外学者已经对风功率预测[1,2]进行了大量研究, 主要分为两大类:一类是直接对风功率进行预测;另一类是通过风速预测求功率预测值。但现阶段小时级预测误差平均水平也只有20%~40%, 有较大的提升空间。

对预测误差的分析有利于弥补风功率预测水平的不足, 改善风功率输出特性。文献[3]根据概率分布和最小二乘法的相关理论, 提出了一种基于正态分布的描述风电功率预测误差分布模型的新方法。文献[4]考虑将正态分布与拉普拉斯分布的概率密度函数相结合建立风电出力偏差的概率密度分布。文献[5]基于大量实测数据的分析, 发现可以采用带移位因子与伸缩系数的t分布描述风电功率波动特性的概率分布。文献[6]根据随机波动模型的峰度分析技术, 对风电时间序列存在明显的“肥尾”效应时的条件分布进行了分析。

储能系统ESS (Energy Storage Systems) 是平抑波动最理想的选择[7,8,9]。由于风速的高度随机性, ESS的研究大都集中于其暂态稳定性方面的分析[10,11,12,13], 鲜有对ESS的容量配置的研究[14,15,16], 或是仅通过简单的试验来确定储能容量[17,18,19]。文献[20]就如何用最小的ESS实现风电场长时间稳定输出进行了分析, 对风电机组中ESS的配置功率、配置容量的大小及其对风电机组有功功率输出的优化作用进行了研究, 提出了以风电机组及储能装置的输出功率波动标准差为指标的ESS的功率和容量优化方案。文献[21]利用储能容量成本及风电场输出功率平滑效果辅助判据, 得出风电场储能容量合理的取值范围, 使功率波动达国标而不是全部平抑。

针对现有误差分布在计算方法或拟合效果上存在的不同程度局限性, 本文采用文献[22]分区拟合的思想, 将误差分区, 在每个区间分别拟合后, 加权求和获得全区域的误差分布函数。在此基础上, 对储能容量的模型进行了分析, 考虑了预测误差的影响, 将储能容量表示为缺失容量的函数, 以在满足一定概率水平下平抑风功率预测误差带来的功率波动, 降低ESS的投资。

1 预测误差分布

为更加详尽地分析预测误差的影响, 须给出一种合适的分布模型, 用以较准确描述预测误差的分布特性。文献[3-4]分析了拉普拉斯分布、标准正态分布在预测误差拟合上的应用, 虽在整体上能够表示风电功率预测误差的趋势, 但在部分区段上出现严重不符, 若直接利用其来表示实际数据的概率密度分布情况, 在一定程度上夸大了风电功率预测的误差, 从给出的拟合效果图可以看出在部分区间上的局限性。文献[23]采用直接统计的方法对某地区风电场风能的预测误差进行归类统计, 发现风能预测曲线中预测误差的大小与风能输出功率水平有关, 而与时间没有明显的关系, 因此本文将对样本进行纵向划分。另外, β分布在[0, 1]区间具有良好的性质, 只需适当选择参数, β分布就可拟合各种区间序列分布, 曲线形状从均匀分布到近似正态分布、从对称到不对称, 尤其对于“偏峰”分布具有很强的建模能力[24]。因此, 对于未知分布的数据, 可以通过拟合β分布参数来确定相应的数据处理结果, 省去了判别分布的麻烦。本文根据预测误差的分布特性, 结合β分布的类似特性, 来拟合区间风功率预测误差分布。

本文采用文献[22]分区建模的方法展开研究, 基本思路为:将风功率分割为n个区间, 区间长度决定于试验数据的大小。运用β分布分别对每个区间实测功率进行拟合后, 减去区间平均预测功率, 最后进行求和运算, 得到预测误差的整体分布。进行预测误差分析的具体过程如下[22], 文中P为功率有名值, p为相应功率标幺值。

a.应用β分布计算单个区间i的实测功率分布函数fi (p) , 可表示为:

其中, p为区间i的实测功率值;α、β为分布参数, 与区间功率的方差σ2和均值μ有关, 可表示为式 (2) 。

故有:

b.用fi (p) 减去区间i的平均预测功率得到该区间的预测误差分布函数fi (ε) 。

c.求取全区间分布函数。对各区间误差分布进行求和运算, 将得到全区间预测误差的分布函数f (ε) :

其中, ωi为权重系数, 取决于预测值出现在该区间的概率统计值;fi (ε) 为分布于[-1, 1]区间的β分布, 且fi (ε) ≥0, 故加权求和后不会出现正负相抵消的情况。

上述过程采用了文献[22]分区建模的方法, 将风功率进行纵向分割, 反映不同功率区间的预测水平, 且β分布具有较简单的表达形式, 能够很好地拟合预测误差分布, 本文算例将对文献[22]分区建模方法进行验证。f (ε) 的获得, 在风功率预测值的基础上增加了预测误差的分布, 为进一步掌握风功率波动特性提供了方便, 也为平抑风功率波动的研究提供了所需条件。

2 储能容量

ESS是平抑波动最理想的选择。为满足风电接入后系统的安全、电力供需平衡、电能质量的要求, 借助ESS来抑制风电预测误差, 可使原有的波动性、间隙性变得“可控”。本节介绍一种用于评估储能容量的概率方法, 该方法将ESS容量表示为缺失容量UE (Unserved Energy) 的函数, UE定义为ESS补偿 (吸收或输出) 不足的量EUE, 亦可用所占风电装机总量EW, total的百分比eu表示, 表达式如式 (5) 所示:

该方法的目的在于分析ESS在一定概率水平下能够平抑风功率预测误差导致输出波动的能力。本节将详细介绍ESS容量与误差累计分布函数CDF (Cumulative Distribution Function) 及荷电状态SOC (State Of Charge) 的关系。

2.1 ESS功率的确定

ESS应具有短时间快速响应负荷变化、补偿功率偏移的能力。由于目前储能成本较高, ESS容量的配置变得尤为关键, 因其将会影响到系统的工程造价。若ESS的额定功率PESS等于风电装机功率PW, inst, 即pESS=PESS/PW, inst=1 p.u., ESS可以完全平抑风功率预测误差, 但此时需要较大的储能容量。另外, 对于现有预测方法, 出现预测误差很大的概率非常小, 因此, 一般考虑在满足一定概率水平下减小储能容量, 减少投资成本。

在已知风功率预测误差分布f (ε) 的情况下, 容量缺失量eu P可表示为未能补偿的预测误差的积分量, 表达式为:

其中, 为风功率平均值;PW, inst为风电场装机容量;ε为风功率预测误差;积分式乘的目的是为了方便表示eu P占PW, inst的百分比。该式建立了储能功率与容量缺失量之间的函数关系式。

2.2 ESS容量的确定

ESS容量关系的确定较功率的计算复杂得多, 需要分别对能量吞吐率 (ETR) 与充/放电饱和时间tsat进行计算。

2.2.1 能量吞吐率的计算

能量吞吐率定义为能量吞吐量Etp与总发电量EW, total的比值, 如式 (7) 所示:

其中, Etp是ESS充、放电容量的绝对值之和。本文考虑充、放电量相等, 保持功率平衡的理想ESS。理想状况下的能量吞吐率可表示为:

其中, 为风功率预测平均绝对误差;为风功率平均输出值。考虑到时间段相同, 因此可以用与代替Etp与EW, total。

2.2.2 充/放电饱和时间tsat的计算

将风功率预测误差值作为ESS的输入量, 会得到ESS的SOC。SOC标幺化处理方法见式 (9) :

其中, T为预测周期。SOCN=1 p.u.表示ESS充电至额定状态。

可以通过SOCN的累计概率密度函数FSOC计算tsat, 若ESS的容量减少为ex, 则:

由于FSOC分布特性, 有时通过式 (10) 的简单计算, 并不能得到满意的值, 更加有效的方法是其逆过程。因而ESS容量计算式为:

其中, ex为与给定tsat对应的ESS容量;F-1SOC为FSOC的反函数。式 (11) 建立了充/放电饱和时间tsat与ESS容量ex的关系式。因此, 可以借助SOCN的累计概率密度函数FSOC求取ex。

2.2.3 函数关系的确定

前文介绍了eu与ESS功率PESS、储能系统容量EESS的关系, 其实在EESS减小的同时, PESS也会变化。可采用二维插值法来分析EESS与PESS同时减小时, eu的变化。

ETR0表示ESS可以补偿所有功率波动时的能量吞吐率, 当受某种约束使得ESS容量减少, 缺失容量为eu时的能量吞吐率为ETR0′, 则:

其中, etr′0=ETR′0/ETR0为ETR′0的标幺值。至此, 本文完成了考虑风电预测误差的储能系统容量与缺失量关系的分析, 图1给出了储能缺失容量具体计算的流程图, 主要包括两大步骤:一是容量缺失量eu P的计算, 主要与风功率预测误差分布函数f (ε) 有关;二是容量缺失量eu E (EUE的标幺值) 的计算, 需分别计算SOCN的累计概率密度函数FSOC及能量吞吐率ETR0。结合上述2步可建立eu与PESS、EESS的关系, 可根据容量缺失量, 获得所需储能系统的容量配置。

3 评估指标

由于风功率波动的影响, 在储能容量减少的情况下, 系统可能出现容量缺额 (ES) 现象。当风功率波动值大于储能容量, 或波动变化率大于ESS充/放电速率时, 系统无法提供足够功率时均会出现功率缺额现象。本节提出一种储能容量优化 (减少) 前后系统容量缺额评估指标, 定义为:

其中, k为容量缺额评估指标;ES0、ES′分别为优化前、后系统容量缺额;H为评估周期;ES0 (t) 、ES′ (t) 分别为t时刻优化前、后系统容量缺额。容量缺额受风功率变化率充/放电速率PE及SOC等很多因素的影响, 如图2所示。

容量缺额ES的具体计算过程如下。

若初始荷电量大于等于风能波动量, 即SOC≥ΔPW, 则:

若初始荷电量小于风能波动量, 即SOC<ΔPW, 则:

4 算例分析

本文以某地风电场实测数据为研究对象, 该数据序列时间间隔为3 s。采用先预测风速, 再根据风速-风功率关系得风功率预测值。取2011年7月份数据, 按每15 min提取一个点作为原始数据建立模型, 预测下一时刻的风速。预测模型采用文献[1]提出的组合预测模型。该模型采用时间序列和BP神经网络的组合预测模型, 其中BP模型的输入量由历史数据和时间序列得到的残差值组成。设v1是BP神经网络预测值, v2是ARMA预测值, v0是加权平均的组合预测值, 预测误差分别为e1、e2和e0。组合预测模型为:v0=ω1v1+ω2v2, 其中ω1、ω2是相应的权重, 且ω1+ω2=1, 误差为e0=ω1e1+ω2e2。由组合预测模型得到预测值v0后, 求其相对的风功率预测值, 再与实测值比较, 得到误差量。该组合预测方法所得结果较单一预测方法更令人满意, 具有一定的实用价值。

应用第1节介绍的分区建模的方法, 将本文算例功率区间划分为50个区间, 图3只给出了5个区间 (0.2、0.4、0.6、0.8、1.0 p.u.为5个区间的分割点) 的fi (p) 的仿真波形, 每个区间均为一个具有不同分布参数的β分布函数。表1给出这5个区间的权重系数, ωi取为预测值出现在区间i的概率统计值。用fi (p) 减去区间i平均预测功率得到该区间的预测误差分布函数fi (ε) , 仿真波形如图4所示, 图中ε为标幺值, 后同。值得说明的是, 本文算例中, 将风功率区间等分为50份, 对每个区间进行拟合, 并计算其权重系数, 经求和后获得整个区间的误差分布。整个区间的划分份数会影响最后的拟合精度, 若未达到要求精度, 可增加区间数目。

最后, 由式 (4) 求取全区间分布函数。f (ε) 为分布在-100%~100%之间的函数, 为能更清楚地看到本文所提分区方法在整个区间上的有效性, 图5 (a) 中只给出0~100%之间风功率预测误差的概率密度分布曲线图, -100%~0之间的分布可类似得出。为对比分析, 同时绘制了由历史实测数据计算的误差分布曲线, 图5 (a) 给出本文分区拟合的效果, 图5 (b) 给出文献[4]中提到的拉普拉斯与正态分布的拟合效果, 从变化趋势与跟随效果上看, 特别是在误差分布的“肥尾”特性上, 本文采用的分区拟合方法都有较好的效果。通过算例验证了文献[22]提出的分区拟合方法的有效性, 为进一步分析储能模型提供了所需条件。

根据得到的风功率误差分布, 由式 (6) 仿真计算, 得到pESS随eu P的变化曲线图, 如图6所示。从图中可以根据容量缺失量, 得到对应所需ESS的功率。在本文仿真分析工况下, pESS随eu P的变化幅度非常大, 特别是在eu P (0, 1.5%) 的区间内, pESS甚至出现了直线下降的现象, 由1 p.u.迅速减小到0.4 p.u.。因此, 出于经济性与实用性考虑, 适量地增加eu P, 可以减弱对ESS的苛刻要求。

图7给出了由SOC的累计密度曲线求取ESS容量的过程, 图中SOC为标幺值, 实线部分为累计概率密度函数FSOC的变化曲线, (100-tsat) 与曲线交点的横坐标值便为F-1SOC (100-tsat) , 图中取tsat=20%, 可由F-1SOC求得ex=0.38, 为建立缺失量与储能容量函数关系建立基础。

至此, 算例介绍了风功率预测误差建模的完整过程, 并基于此得到了pESS随eu P的变化曲线图, 给出了由SOC的累计密度曲线求取ESS容量的过程。从仿真结果可以看出, 本文提出的分区拟合方法都有较好的效果;eu P的提出可以减弱对ESS的苛刻要求。

5 结论

本文在对风功率预测误差分析的基础上, 提出一种用于评估储能容量的概率方法, 主要结论如下。

a.采用分区拟合的思想, 将风功率误差区间分成若干小区间后, 在每个区间中应用β分布拟合, 最后加权求和获得全区域的误差分布函数。仿真结果验证了分区拟合方法的正确性。

b.介绍了一种用于评估储能容量的概率方法, 该方法将ESS容量表示为缺失容量的函数, 目的在于分析ESS在一定概率水平下能够平抑风功率预测误差导致输出波动的能力, 同时减少对ESS的要求, 并详细介绍ESS容量与误差累计分布函数、SOC的关系。

c.最后提出一种新的容量缺额指标。

摘要：针对正态分布与拉普拉斯分布用于拟合风功率预测误差较大的不足, 采用分区拟合的思想对误差进行分区, 并在每个区间中应用β分布拟合后, 加权求得全区域的误差分布函数。基于此, 建立考虑预测误差分布的风电场储能容量数学模型, 其中储能容量表示为缺失容量的函数, 并介绍储能容量、误差累计分布函数与荷电状态的关系。提出一种新的系统容量缺额评价指标, 用于比较储能容量优化效果。算例分析结果表明, 该方法可以在一定概率水平下平抑风功率预测误差带来的功率波动, 同时降低对储能系统的要求。

短期风电功率预测误差分布研究篇4

在风力发电领域风电功率预测算法一直是研究的热点,各种算法的预测效果也由于实际环境的不同而存在较大的差异。目前,风电功率预测算法主要可以分为物理方法、统计方法和学习方法三大类[1]。其中物理方法是根据数值天气预报得到未来时刻风电场相关气象信息,利用机组的功率曲线预测功率输出;统计方法是从统计学角度对历史数据进行分析,选择合适的统计模型经过一定的数值计算,预测下一时刻的功率;学习方法,主要是指采用人工智能等方法预测下一时刻功率值,相比统计方法计算量大,但预测模型更为准确。在实际应用中经常是几种方法混合预测,从而提高预测精度。

风电功率预测方法也可根据预测的物理量进行分类,一是直接预测风电机组或者风电场的输出功率,二是对风速等气象信息进行预测,再通过相关的功率曲线将风速等信息转换成输出功率[2]。从现有文献研究趋势来看,大多数预测研究是在风速预测基础上进行的。文献[3]指出影响机组输出功率的气象因素主要是风速、风向和空气密度,并采用数值天气预报和动态神经网络相结合的方式对风电功率进行预测,取得良好的效果。文献[4]采用时间序列法对风速进行预测,并将风速预测的结果转化为风电场功率输出,从而实现对功率的预测。文献[5]采用分数差分自回归移动平均模型(fractionalARIMA)对风速进行预测,预测方法简单有效。文献[6]在对风速进行空间相关性分析基础上运用局部递归神经网络进行风速预测,并与其他算法进行了对比,验证了方法的有效性。目前基于风速的间接功率预测方法存在较大的误差,风力机组的功率曲线也是经过相关数据拟合而成的,由于存在拟合的误差,实际输出功率会在一定范围内波动。而且除了考虑风速这个主要因素外,还应该考虑空气密度、温度、地表粗糙度、风向等多种因素的影响,所以现阶段风电功率的预测误差是难以避免的。文献[7]对常用预测算法进行了较为全面的对比分析,指出各种算法的输入数据对最终预测结果有一定的影响,误差会随着预测时间的延长而增大,采用误差频率直方图直观地给出了误差频率分布,但并没有拟合出适合的误差频率分布曲线。文献[2]采用正态分布拟合误差出现的概率,效果不理想。文献[8]采用一种类正态分布模型对误差分布进行拟合,拟合曲线和实际误差分布较为吻合。

合格的预测算法所产生的误差从时域上分析应该属于无规则的白噪声序列,从误差出现频率来看应该呈现出一定的概率分布。在实际预测系统中大量样本所呈现的误差分布可能较为接近正态分布,但在有限样本情况下正态分布往往不能准确地描述实际误差的分布情况。本文采用带位置和尺度参数的t分布(t location-scale distribution)描述误差频率分布,取得了很好的拟合效果。并通过差分自回归移动平均模型、BP神经网络两种常用的预测算法进行误差分析,进一步验证了该分布模型的有效性。

1 数学模型

1.1 误差分布模型

t分布的分布密度函数f(x)可表示为

其中:Γ(·)为伽马函数;v表示自由度,该参数决定t分布的形态。当自由度较小时,t分布与正态分布有明显的区别,当v→∞时,t分布曲线趋于正态分布曲线[9]。正态分布密度函数可表示为

带位置和尺度参数的t分布与普通t分布较为相似,在概率密度表达式上有所区别,如式(3)所示。

其中:u是位置参数;σ是尺度参数;v表示自由度。若记,则y服从自由度为v的t分布[10],带位置和尺度参数的t分布本质上是将标准t分布进行平移和伸缩,图1将t分布和三种带位置和尺度参数t分布相比较,图中曲线的自由度均为5,具体参数如表1所示。可以看出参数u对曲线产生了平移作用,而参数σ则产生了尺度伸缩的作用。

在实际数据拟合过程中,分布曲线的参数可由Matlab使用极大似然估计的方法得出,置信水平为95%。同时该分布随机变量x的95%置信区间为

,其中tinv是t分布的分位数[11]。

1.2 误差分布建立方法

在功率预测中误差可用式(4)表示。

其中:表示i时刻功率预测值;pi表示该时刻的实际值。定义预测百分比误差为

由于ip波动范围很大,很可能在某时刻pi→0,这样得出的百分比误差就会很大,从而失去指导意义。也有方法采用风电场的开机容量P代替pi,即误差相对于风电场开机容量的百分比值。

虽然式(6)不会出现ηi数值过大的现象,但是对于风电功率的波动特性不能很好地体现,相反当ei值较小时由于P值一般较大,从而造成预测百分比误差偏小的现象,使用式(6)无法很好地体现误差变动,因此仍旧采用式(5)计算各时刻的百分比误差,同时限定pi≠0,对于那些由于pi值过小造成百分比误差ηi过大的情况,分析其是否是由于自然或人为等原因造成的功率急剧减小或停机,将这些情况经过综合分析后剔除。此外对于pi<0的情况也进行剔除,在实际运行中风电场有可能输出负功率,也就是吸收能量。这种情况主要是因为机组停机造成的,此时进行误差分析也无意义。因此对于式(5)应加上约束条件pi>0。

图2为预测误差的频率分布直方图。其中横坐标表示误差区间,纵坐标表示在对应误差区间上误差的概率密度。

式(7)~式(9)是风电功率预测中常用的误差指标[12]。绝对误差均值(Mean Error,ME),可衡量预测结果是否无偏。

绝对值平均误差(Mean Absolute Error,MAE),可对预测误差的平均幅值进行评价。

平均相对误差(Mean Relative Error,MRE),可用于不同算法之间的分析比较,应用较为广泛。

2 预测模型和数据分析

以华东某风电场2012年3月1日至4月2日的实测数据为例,对两种不同预测方法产生的预测误差进行分析,数据来源于风电场数据采集与监视控制系统(Supervisory Control And Data Acquisition,SCADA),时间分辨率为15 min。

2.1 差分自回归移动平均模型

在时间序列分析方法中,ARIMA(差分自回归移动平均模型)是比较常用的一种分析方法。而ARMA(自回归移动平均模型)、AR(自回归模型)、MA(滑动平均模型)均可看成ARIMA的特例[13]。将ARIMA差分化后,时间序列即可表示为ARMA、AR、MA模型的一种。通常输出功率和风速都是非平稳的时间序列,首先要经过差分将其变换成平稳序列,再根据相关函数和偏自相关函数确定模型阶数,模型的参数可由最小二乘法估计得出[14]。

选取3月31日为预测日,3月份前30天的数据作为训练数据。由于单纯的统计方法缺少天气预测信息的支持,较适合进行超短期预测,因此将预测的时间间隔也设定为15 min。采用ARIMA方法进行预测,一是功率直接预测,二是首先估计风速的功率间接预测。

图3为直接功率预测误差频率直方图和分布拟合曲线,从图中可看出,带位置和尺度参数的t分布较好的拟合了误差分布。

风电功率的间接预测,首先对风速进行预测,再将风速转化为功率,机组功率捕获可由式(10)表示[15]。

其中:P为风轮输出功率;Cp为风能利用系数;A为风轮的扫掠面积;ρ为空气密度;v为风速。经过功率转换后,间接预测误差的频率直方图如图4所示。

间接预测得到的频率误差曲线位置参数u和尺度参数σ较大,与直接预测的误差频率曲线相比,相对“矮胖”。

2.2 BP神经网络预测

神经网络预测是一种非线性的预测方法,不仅适合超短期风电功率预测,也适用于短期和中长期预测。在众多神经网络模型中,BP(Back Propagation)神经网络是一种应用较为广泛的算法。BP算法的主要思想是误差的反向传播,误差逐层反馈并修正各层神经元的权值,直到得出期望的输出结果[16]。但BP神经网络也有固有的缺点,学习过程收敛比较缓慢、容易陷入局部极小的情况,因此在训练学习中常采用Levenberg-Marquardt算法优化收敛速度和局部搜索性能[17]。

同样选取3月份前30天的数据作为训练样本,数据包括气象信息与风电场实际出力。选用三层网络进行预测,图5为BP神经网络结构图。对3月31日至4月2日的风电功率进行预测。为便于和ARIMA预测比较,同样将上一时刻实测值作为下一刻预测的一个输入项。预测间隔分别为15 min、1 h和3 h。

图6为15 min预测误差频率分布,与ARIMA方法相比,平均相对误差较小,但由于统计了三天的数据,出现粗大误差的概率也增大,图中可看出有超过40%预测误差,但所占比例非常小。分布曲线拟合从形态上呈“高瘦”型。

图7和图8分别是预测长度为1 h和3 h的误差分布图,随着预测时间增大误差也会变大,分布曲线有“矮胖”的变化趋势。通过观察拟合曲线的形态,可直观地了解误差分布情况,便于快速判断预测算法的准确度。

2.3 数据分析

表2是两种预测方法的统计误差,在提前15min的预测中,BP神经网络预测方法各项误差指标均比ARIMA方法要小。随着预测时间增长,各项误差有增大的趋势。

表3为带位置和尺度参数t分布的曲线拟合参数,在进行的5次预测中,u值均为正值,说明预测算法的正向误差较大,但并不代表u值不能为负值,某些情况下同样也会出现负向误差。由于误差区间采用百分比表示,即误差在数值上放大了100倍,因此参数σ也相应变大。自由度v均相对较小,在形态上与正态分布曲线有较大的区别。

式(11)通常用来计算曲线的拟合优度,R2取值范围为[0,1],R2数值越大说明拟合优度越高。其中iy为某误差区间对应的实际概率密度值,为曲线拟合值,为实际的平均值,下标i表示第i个误差区间。

表4将带位置和尺度参数的t分布与正态分布的拟合优度相比较。从表中可看出带位置和尺度参数的t分布均比正态分布拟合优度高,因此比正态分布更适合描述短期风电功率的预测误差。

3 结论

研究预测的误差分布可以评估预测算法的准确度。根据分析得出的结论有:

1)带位置和尺度参数的t分布能有效描述短期风电功率预测误差的频率分布,比正态分布更准确。

2)带位置和尺度参数的t分布各项参数可作为评价预测算法的指标:参数u可表示误差对称轴的位置,以及误差总体是呈正向还是负向;参数σ的相对大小可表示误差是否集中,数值小拟合曲线就会呈现“瘦高”型,算法准确度就比较高,反之准确度就比较低;自由度v可在形态上与正态分布区分开,一般情况下自由度较小,当它变大若超过30,就可认为误差频率分布已接近正态分布。

光伏发电功率预测方法研究综述篇5

随着世界经济的快速发展,越来越多的能源被消耗。化石燃料是不可再生的,石油、煤和天然气储采比分别为53. 3年、113年和55. 1年[1]。据英国石油公司( BP) 预测2030可再生能源占全球能源供应的比例将达到30% 。太阳能是最理想的可再生能源之一,在太阳能应用中,光伏发电是最重要的形式之一。

光伏系统可以应用于单个建筑的独立系统、农村的户用光伏系统、偏远地区的大规模光伏发电厂或与其他能源相结合构成的微型智能电网。不管以哪一种形式应用,它都存在发电功率预测的问题。特别是在光伏发电厂和微网系统中,光伏发电输出的预测数据不仅在管理、调度、操作、公共电网和微电网的控制中发挥重要作用,也在系统的优化、能源有效利用、电网的安全和稳定运行中起着至关重要的作用[2,3]。

本研究首先简要介绍光伏发电及其影响因素,着重讨论分析近年来光伏发电功率预测的研究工作,并针对光伏发电预测研究工作存在的问题深入讨论、提出相关建议。

1光伏发电的影响因素

1. 1太阳辐射

光伏系统产生电能的数量几乎是和照射到光伏面板上的太阳辐射量成正比的。研究表明: 太阳辐射量 ( 单位: k W/m2) 减少50% ,光伏面板的输出功率也会降低50%[4]。

地球表面的太阳辐射量对于太阳能系统领域的工程应用和研究来说至关重要。一般来说,入射到光伏面板的太阳辐射由3个部分组成,即直接辐射、散射辐射和反射辐射。

1. 2晴空指数

地球表面的太阳辐射和地外辐射的比率称为晴空指数,晴空指数是一个随机参数,它是年、季节、气候条件和地理位置的一个函数。从定义上,晴空指数也是太阳辐射在地球表面的线性函数。所以晴空指数也是太阳辐射的一个指示器。一些研究人员尝试不同的模型来计算晴空指数以预测太阳辐射[5]。在罗马尼亚的布拉索夫市区,月平均晴空指数被用来预测每月的太阳辐射[6]。也有一些研究人员认为[7]: 晴空指数应该与其他因素,如规范化日照时间一起作为太阳辐射预测的输入数据。

1. 3日照时数

日照时数是指太阳每天在垂直于其光线的平面上的辐射强度超过或等于120 W/m2的时间长度[8]。在一个具体的地理位置,可应用随机模型[9]、模糊逻辑[10,11,12]和神经模糊[13]等方法计算光伏发电系统的日照时数。

1. 4 云

云是影响光伏发电输出功率的主要因素之一。由于遮挡作用,云会大幅度降低达到光伏面板的太阳辐射量; 并且,云的快速移动或变化会导致光伏输出功率的大幅度波动。一片飘过的云团可以在几秒钟内使一个点上的太阳辐射的变化超过60% 。

云对光伏系统的影响和太阳位置改变对光伏系统的影响不同,太阳位置的改变对光伏系统输出的影响具有统一性和相关性,但云的大小、形状、速度和方向都在持续地变化,所以云具有高随机性和不确定性,从而导致被其遮挡的光伏系统输出功率在不断地随机性波动变化。

1. 5温度

太阳能光伏电池的效率随着温度的升高而减少, 因为温度升高会使载流子的迁移率、扩散长度以及少数载流子的寿命变差。硅光伏电池具有很好的吸热性,所以它们的温度会在运行期间显著的上升,从而改变了光伏发电系统的光电转换效率[14]。光伏面板的温度取决于光伏面板的吸收特性、封装结构与材料、散热性、光伏面板工作的地点、大气参数如辐照度水平、环境温度、风速和特定安装条件等。

1. 6风速

风速对光伏电池性能具有重要的影响,因为它影响光伏面板的温度和灰尘积累。风可以加速光伏面板上方的气流流动,而流动的空气可以加快光伏面板的热传递,使面板的温度降低。实验表明,面板的温度是以风速约1. 45 ℃ /( m·s- 1) 的增加而降低的[15]。此外,风也影响光伏电池上的灰尘覆盖层中沉积结构,从而影响覆盖层的透射率[16]。

1. 7灰尘

在户外环境中构建的光伏系统,光伏面板暴露在空气中,天长日久自然会积累灰尘。几项研究表明,积累的灰尘会降低太阳能光伏电池的性能。光伏面板暴露在户外10天后,它的透光率平均降低8%[18],8个月后光伏面板的性能大约降低32%[19]。光伏面板上的沙子堆积将造成光伏发电效率下降17%[20]。谷歌大学的一个对比实验则表明: 灰尘会导致光伏面板输出的电流降低2%[21,22]。

2光伏功率预测的研究进展

2. 1研究现状

光伏发电预测方法主要分为两类: 统计法和人工智能法[23]。统计法包括ARMA、ARIMA、马尔可夫链等,但实际上基于历史数据训练的人工智能功率预测方法也属于统计法。文献[24]总结了2008年之前采用传统模型和人工智能技术进行的光伏系统功率预测研究工作。近年来光伏发电预测研究的最新进展如表1所示[]。由文献列表可见,近年来有关光伏发电预测的研究依然采用马尔可夫链、神经网络、回归分析、支持向量机、最小二乘法等统计分析方法、人工智能方法、相关方法的衍生或融合技术,与文献[24]总结分析的各种方法并无实质性的差别。

2. 2时间尺度

由表1可知,大部分研究的时间尺度是1天左右, 其原因在于:

( 1) 长期预测相对比较容易。长期预测大多是基于光伏电站发电和NWP( 数值天气预报) 记录的历史数据,并通过统计回归可获得一个合理的并且可以接受的预测结果。这种类型的预测通常用于光伏电站的设计、选址和咨询服务,要求精度不高。因此,长期预测很容易实现,一些企业和非营利组织已经开发了光伏发电长期预测的软件。

( 2) 短期预测的重要性和必要性。对于所有类型的光伏应用,如光伏电站、光伏微网、分布式光伏发电系统等,都必须有短期预测模块来支持系统的安全与稳定运行。此外,随着光伏系统的快速发展, 光伏系统短期功率预测的需求也在不断增加并越来越迫切。

( 3) 短期预测能够满足不同时间尺度的要求。当短期预测符合其预期的精确度时,它同样也可以得到中、长期功率预测所需要的结果。

2. 3预测精度

表1中的文献分别使用了下列误差标准: 均方根误差RMSE,平均绝对误差百分比MAPE,最大平均误差MAE,平均偏差MBE,相对偏差,相对均方根误差rRMSE,平均绝对偏差MAD,平均相对误差MRE,均方误差MSE,平均误差,平均绝对误差,归一化误差,平均相关系数R,等等。即使是相同的误差标准RMSE, MAPE,研究结果也呈现出相当大的差异。不同预测方法的均方根误差值如表2所示,其中的均方根误差RMSE存在两种度量方式: 功率和百分比。因为不同文献研究对象的功率容量差异较大,用功率表示的RMSE差异巨大,如其中一篇文献的RMSE是33 W ~ 63 W,而另一篇文献的RMSE却高达0. 1 MW。相对而言,百分比形式的RMSE更具有横向可比性,但依然差距较大,最小的仅2. 39% 、最大的为13. 17% 。同样,如表3所示的平均绝对误差百分比MAPE最小为2. 786 7% 、最大为16. 86% 。

3目前研究中存在的问题分析

由上述文献及分析可知,近年来在光伏发电预测方法上没有突破性的进展及成果,对光伏发电功率预测相关问题缺乏深层次思考与研究。本研究从以下几个方面总结分析光伏发电预测中需要重点关注的问题。

3. 1数据基础

传统的物理预测方法根据太阳能辐射模型、电站模型、光伏转换模型、电路模型和逆变器模型来预测输出功率。但受辐射的不确定性、云的变化、雨水和环境、电池温度等因素的影响,会导致短期预测不够准确。在这种情况下,基于统计和人工智能技术的输出功率预测方法可以综合考虑并补偿上述各种因素的影响。不过,这些方法需要充分的历史数据支持,以供给统计处理和人工神经网络的训练。通常,至少需要光伏系统输出功率一年的连续且完整的数据进行统计回归。神经网络相关的算法不仅需要光伏发电系统的输出功率的历史数据,而且与气象和数值天气预报的历史数据紧密相关。历史数据的缺少会使相关的统计数据和人工智能预测方法无效。同时,不完整的历史数据可能导致很大的预测误差。除了历史数据之外,数值天气预报,如云、风、温度、湿度和降雨等实时数据,也有助于预测的在线训练和调整内部参数以获得更高的预测精度。不同预测方法的误差如表3所示。

除了历史数据的完整性,另一个值得关注的问题是数据本身。数据的采样间隔、准确性、收集、预处理、数值天气预报的选择和本地传感器指标特性等都从不同方面决定着数据本身的特性,也将很大程度上影响预测的准确性。研究表明,更准确的天气预报可以将光伏发电功率预测精度提高10% 左右[34]。

3. 2影响因素

正如表1所示,各种研究文献几乎考虑了所有影响光伏发电功率预测性能的可能因素,但主要的因素是太阳辐射和环境温度、电池温度。实际上,清洁度指数和日照时间是通过改变达到光伏面板的太阳辐射量来影响光伏系统输出功率。虽然在部分文献中没有明确指出,但在光伏发电功率预测中,晴空指数和日照时间也常常作为影响因素之一。灰尘覆盖光伏面板,将减少光伏面板吸收太阳辐射的比例,最终降低光伏面板的输出功率。不同于辐射、云、温度、风速等因素,灰尘对光伏功率输出的影响是一个长期且平稳的过程, 因为灰尘的沉降、积累和自然清除是一个持续且稳定的过程。灰尘对光伏面板性能的影响具有缓慢性和渐进性,不能反映在超短期或短期预测当中,但可以根据其影响特性进行补偿。

风速和云也明显地影响光伏系统的功率输出,但是很少被考虑到,因为它们的属性变化很大且很快,在几分钟内甚至几秒钟内使光伏发电输出具有很陡的斜坡,这超出了大多数人工智能方法处理庞大数据量的响应时间。而在数小时、数天或数周时间水平的短期或中期预测中,这种急剧的变化可以被视为异常而忽视。但是在超短期预测中,影响预测精度的最重要因素是云。云只有很小甚至没有惯性,所以云变幻莫测, 它的形状、大小、速度和方向都在改变。云的变化会立即改变光伏面板接收到的太阳辐射量,并迅速引起光伏系统输出功率的变化。有研究人员采用天空成像仪[59,60]和太阳跟踪摄像头[61]探测和跟踪影响光伏发电输出功率的云朵变化,但其算法的时间分辨率还不能达到预期的精度。

3. 3精度指标

尽管光伏电站已经在世界范围内得到推广应用, 但是从文献分析可以看出: 到目前为止还没有关于光伏发电功率预测的相关标准。作为最大的风电部署国,西班牙拥有严格的风电并网标准,其中包括48 h时间尺度的风电场输出功率预测技术指标,即: 平均误差为20% ,最大误差为30% ; 24 h时间尺度的风电场输出功率预测的平均误差为10% ,最大误差为15%[62,63]。但光伏发电系统还没有类似的具体标准和要求。

其次,在各种文献中有太多的光伏功率预测的性能指标参数,如均方根误差、相对均方根误差、平均绝对误差百分比、平均绝对偏差、平均相对误差、平均偏差错误、均方误差、相对偏差、平均误差、平均绝对误差、平均相对误差、归一化误差、最大平均误差、平均相关系数,等等。这些预测精度指标使用不同的数学模型和判据,因而很难将它们进行统一比较分析,难以形成标准。

3. 4时间响应

时间响应是控制系统中的一个技术术语。虽然很少有文献提到光伏发电功率预测的响应时间参数,但是毫无疑问它在逆变控制、并网控制、电力监视和实时调度控制中具有非常重要的作用。在短期和超短期预测中,响应时间可以在相当短的时间内为控制系统提供准确的决策数据支持,保证系统的性能,并保持高动态品质。光伏发电功率预测的响应时间主要取决于算法。不同的算法及其软件实现决定了执行算法的时间长度,从而决定了预测的响应时间。显然,回归方法的响应时间较短,而基于人工智能技术的方法需要更多的时间进行训练以满足所需要的预测精度和性能。所以在短期/超短期预测中,需要平衡精度和时间响应这两个指标,以满足实际应用的需求。

3. 5评价标准

如果没有长时间的应用测试数据或在相同条件下对比实验、应用验证,仅仅通过算法、仿真结果或孤立的实验结果来评价光伏发电功率预测方法是不严谨的。虽然已有大量有关光伏发电功率预测的研究工作,但在这个领域至今没有统一的预测方法评价标准。随着光伏系统的大面积推广,光伏发电系统的部署、设计和应用需要光伏发电功率预测标准。此外,功率预测标准将为电网接纳光伏系统提供决策依据。光伏领域的工程师和研究人员也需要在报告和研究论文中用一个通用评估方法为读者提供全面、可信的数据和研究结论。

综合考虑各方面的因素,应在光伏发电功率预测的评价标准中明确以下信息:

( 1) 光伏电站相关数据。包括: 1电站信息: 经度、纬度、海拔高度、气候类型等; 2电力系统信息和模型: 光伏面板、逆变器、存储系统、传感器等。

( 2) 历史数据。包括数据源、数据类型、数据采样间隔、数据精度、数据的完整性及合理性。

( 3) 误差指标。包括几种常用的误差计算方法, 如: 均方根误差、平均绝对误差百分比、平均相对误差、最大平均误差和相关系数等。

( 4) 时间尺度和时间分辨率。预测时间尺度可以是小时、天、周或月,时间分辨率可以是秒、分钟或小时。

( 5) 算法复杂度。即,在预测方法中所使用的计算方法和计算资源的成本。

( 6) 时间复杂度。预测方法的时间成本。

( 7) 经济性。预测方法及其实施的经济性分析。

4结束语

全球性的能源形式日趋严峻,太阳能光伏发电将成为最有前景的可再生能源之一。在过去几十年里, 光伏发电系统已经在世界各地得以推广应用。在光伏发电系统应用中,输出功率预测是关键技术之一。本研究对2008年以来有关光伏发电输出功率预测的研究工作进行综述分析,总结如下:

( 1) 大多数的研究工作都针对短期功率预测( 时间尺度24 h) ,研究对象、预测方法及结果差异较大;

( 2) 太阳辐射、环境温度和电池温度是光伏发电短期预测中最重要的因素,而云特别是高层云是超短期预测必须考虑的首要因素;

( 3) 数据是光伏发电预测的必备基础;

( 4) 响应时间是光伏发电短期/超短期功率预测的一个重要指标;

( 5) 到目前为止,还没有被普遍认可的标准用于评估各种预测方法。

从信息流的角度来看,光伏发电功率预测就是采用某种学习计算方法对历史数据信息和实时数据信息进行加工处理,然后给出新的信息: 预测结果数据。即光伏发电功率预测主要分为3个部分: 输入信息、输出信息和信息处理方法。由以上分析可知,目前绝大多数的研究工作都集中在信息处理方法上,即尝试采用各种算法或综合算法进行功率预测; 而对于输入信息本身的研究、对输出结果的可用性和多方位综合评价与分析,缺少系统性的研究与探讨。

结合综述分析,笔者对今后光伏发电功率预测研究提出如下建议:

( 1) 应加强数据的完整性和有效性设计。注重数据采集、处理和存储积累各环节的设计,从数据来源、数据类型、数据精度、数据密度、时间分布、数据关联性等方面保证数据的完整性和有效性,保证预测的准确性和可重复性;

( 2) 应研究制定一种统一的光伏发电功率预测评估评价标准。针对光伏发电功率预测的实际需求,以常用的预测目标参数为考察指标,制定综合的评估评价标准体系;

( 3) 应研究开发适用于具体实际光伏系统的功率预测方法。由于实际光伏系统及其所处地理环境千差万别,普遍适用的功率预测方法是不存在的。以工程应用为出发点和最终目标,以具体系统的特点、历史数据和环境特征为基础,研究适用于具体系统的功率预测方法,使之具有同时具有研究的意义和工程应用价值。

摘要：针对太阳能光伏发电输出功率不稳定的问题,分析了国内外光伏发电功率预测方法的研究现状,总结并提出了今后研究的建议方向,介绍了太阳辐射、晴空指数、日照时数、云、温度、风速和面板积尘等影响光伏发电的各种因素,着重综述了2008年以来光伏发电功率预测尤其是短期预测的研究概况,对光伏功率预测的时间尺度和精度这两个重要指标进行了讨论,分析了数据基础、影响因素、精度指标、时间响应和评价标准等光伏发电预测中需要重点关注的技术难点。研究结果表明,近年来的研究工作主要集中在短期预测,到目前为止对于各种预测方法尚没有被公认的评价标准,难以对各种预测算法进行评估比较。最后结合综述分析,提出了今后光伏发电功率预测研究工作的建议方向。

预测功率论文篇6

有效的风电功率预测, 是保证电力系统安全运行和优化调度的前提, 但风电具有较强的随机性和间歇性, 这无疑增加了预测的许多难度。虽然起步比较晚, 但我国的研究人员在这方面还是做出了许多贡献, 时间序列、灰色模型[1]、神经网络[2]、支持向量机[3]、小波分析等方法得到了较好地运用。部分方法采用了间接预测, 即通过预测风速, 再建立功率曲线求取风电功率。其中的每一步都存在些许误差, 总和之后自然会增大误差。另外, 以上方法都是得到一个或一系列确定的预测点, 用户只能接受这些确定值而没有选择的余地。

云理论是由李德毅院士提出的一种不确定性人工智能方法, 该方法已经成功运用在空间负荷预测[4]、电价预测[5]等多个电力系统的研究领域中。本文给出的云推理模型用云变换将风速等定量数据转换成多个云的定性概念, 并通过挖掘多个云概念之间的关联规则, 找出内部规律, 最后利用云推理得到一系列有稳定倾向的预测值。虽然预测结果是不确定的, 但所有的点都在某个值附近小幅波动, 用户可以利用自身经验或借助其他信息恰当选取其中一个点作为预测结果, 还可以求取所有离散点的期望值作为确定性结果。

1 云模型

云是定性概念和定量数值之间的不确定转换模型。云模型一般由三个数字特征 (期望、熵、超熵) 来描述。云的期望 (Ex) 是最能代表该定性概念的数值;熵 (En) 反映了该定性概念的模糊程度, 它的大小决定了能被该概念接受的范围;超熵 (He) 反映了云的离散程度, 它的大小反映了云的厚度, 是随机程度的体现。比如风速的一个定性概念“较快”及其数字特征如图1所示。

2 云变换

云变换是指把风速、风向、风功率等定量数据转换成由多个云叠加而成的定性概念。首先, 以某风电场10月份的历史数据为依据, 对所有的数据进行归一化处理, 然后求取各类数据的频率分布, 风功率的频率分布如图2所示。

最后采用基于峰值的云变换算法[6], 即

其中:f (x) 为频率分布函数;ri为幅度系数;c (Exi, Eni, Hei) 为变换后的其中一个云概念;num为变换后的云概念的个数;为云变换的最大误差。数据频率分布的局部最高点 (峰值) 是数据的汇聚中心, 将它所对应的横坐标作为某个云概念的期望值。峰值越大, 表示数据汇集越多, 越能反映某个定性概念。

具体的峰值云变换如下, 以风功率为例:

(1) 找到风功率频率分布 (图2) 中的各个峰值位置, 将其对应横坐标定义为云的期望Exi (i=1, 2, …, num) 。

(2) 计算用于拟合原频率分布函数f (x) 的以Exi为期望的各个云概念的熵Eni[7], 并计算云概念的概率密度期望函数作为各个云的分布函数, 如图3所示。

(3) 用不带确定度的逆向云算法[8]求取各个云概念的超熵Hei, 整合之后得到所有云概念的3个数字特征c (Exi, Eni, Hei) , 并最终得到云变换之后风功率的16个定性概念。

用同样的方法可分别得到风速和风向的16个和12个定性概念。但上述变换得到的云概念还比较粗糙, 相邻两个云之间有可能距离太近, 甚至一个云已把另一个云完全包含在内, 造成概念的重复和多余, 所以有必要对云变换之后的概念进行跃升, 使每个云概念的意义更加独立和清晰。

3 概念跃升

所谓概念跃升, 是指将云变换得到的基本概念作为泛概念树的叶结点, 逐步合并距离最近的两个概念, 以得到想要的概念层次。通常有两种方法:用户指定概念个数, 直接跃升;不指定概念个数, 根据人的认知特点 (人们同时只能认知至多72个概念) 自动跃升[9]。这里采用第一种方法, 并考虑云之间的幅度系数影响[10]来进行概念合并, 多次设定概念个数进行实验后, 选取疏密合适的概念个数作为云概念跃升的结果。最终得到风功率的9个跃升概念, 如图4所示。

一般情况下, 可用半云 (或半梯形云) 来描述最接近论域边界的两个定性概念, 相邻概念之间出现交叠, 体现了云模型的不确定性。假设风功率的9个云概念分别为:{极低, 很低, 低, 较低, 中等, 较高, 高, 很高, 极高}, 则它们的数字特征如表1所示。

用类似的方法对风速和风向进行多次概念跃升实验, 从中选取较合适的概念个数, 最终得到相应的5个和9个跃升概念, 分别如表2和表3所示。

4 关联挖掘

4.1 概念隶属判定

概念跃升之后, 需要判定所有的历史数据属于相应类别的哪个概念, 从而精简数据库, 促进关联规则挖掘的成效。概念隶属判定有随机判定法和极大判定法两种方法, 两者都需先求出某个数据对相应云概念的所有隶属程度, 然后, 随机判定法从隶属程度大的前几个概念中随机选择某个定性概念, 而极大判定法选择隶属度最大的那个概念作为隶属概念。选用极大判定法, 以风速的某个待判定数据a为例:首先, 生成以风速概念的Eni为期望, Hei为方差的5个正态随机数Eni'=Norm (Eni, H2ei) (i=1, 2, …, 5) ;然后计算得到a对风速概念的5个隶属程度;最后将最大的µi所对应的概念Ci作为a的隶属概念。

为了便于挖掘规则, 把风功率、风速和风向的定性概念改用阿拉伯数字命名, 则风功率的9个云概念命名为{1, 2, ⋅⋅⋅, 9}, 风速的5个云概念命名为{10, 11, ⋅⋅⋅, 14}, 风向的9个云概念命名为{15, 16, ⋅⋅⋅, 23}。这样, 得到仅包含{1, 2, ⋅⋅⋅, 23}的简化数据库, 如表4所示。

4.2 关联规则挖掘

采用改进的Apriori算法[11]对概念隶属判定后的数据库进行规则挖掘, 总共有500组历史数据, 只要某组数据重复出现2次, 就认为该组数据对关联知识有一定的贡献, 因此设置支持度阈值为0.004, 信任度阈值为0.2。得到30条符合条件的关联规则, 如表5所示。其中第一条规则{1, 10, 20}可以这样理解, 如果风速“很低”, 并且风向为“东北”, 则风功率“极低”。

5 规则发生器

云推理是基于规则发生器的不确定性推理, 而规则发生器由规则前件和规则后件组成。设有定性规则“if A then B”, A和B分别为对应于论域U1和U2的定性概念。把A叫作规则前件, B叫作规则后件。

给定论域中的一个特定点x, 通过正向云算法生成该特定点属于定性概念的确定度y, 称为前件云发生器;给定一个确定度y∈[0, 1], 通过逆向云算法生成论域中满足这个确定度的云滴x, 称为后件云发生器。一个前件云发生器和一个后件云发生器连接起来就构成了一个单条件单规则发生器。规则发生器的前件可以是多个的 (即多维) , 而后件通常只有一个。

本文采用双条件单规则发生器, 即“if A1, A2then B”。其中, A1和A2作为规则前件, 分别代表风速和风向的某个云概念, B作为规则后件, 代表风功率的某个云概念。如果用一个双条件单规则发生器来描述一条关联规则, 那么, 前面挖掘出的30条定性规则便可用30个双条件单规则发生器来描述, 相当于一个组合规则发生器。

6 云推理预测

设预测点前一时刻的风速和风向值为 (x1, x2) , 输入前述组合发生器中将得到30个预测结果, 这显然是不可取的。预测中如果考虑历史数据隐含着的某种历史规律, 那么它体现的是一种整体的预测策略;而若考虑最近数据呈现出的某种当前趋势, 则它体现的是一种局部的预测策略。单纯将历史规律作为预测知识是有些陈旧的, 唯有综合考虑这两种策略, 用当前趋势对历史规律惯性加权, 才能进行较准确地推理和预测。

首先考虑历史规律:把 (x1, x2) 输入每个双条件单规则发生器的前件会得到一个隶属度, 该隶属度体现了 (x1, x2) 对该条规则的激活强度。那么, 我们将得到30个激活强度 (y1, y2, …, y30) 。从中找到最大值ymax, 则对应的规则“if Ai1, Ai2 then Bi”最能反映点 (x1, x2) 所具有的历史特性, 因而该规则的后件Bi可作为相应预测知识的历史规律。

其次考虑当前趋势:越靠近预测点的数据越能反映其当前趋势, 因此, 可选邻近预测点的t个数据, 通过逆向云算法得到当前趋势的云模型Ct。

最后综合考虑历史规律和当前趋势:采用第2节中提到的概念合并算法, 将Bi和Ct合并得到Dt, 从而构造新的预测规则“if Ai1, Ai2 then Dt”进行推理预测。

由以上方法可以得到云推理的组合规则发生器, 如图5所示。具体的算法步骤如下[12]:

(1) 将预测点前一时刻的风速和风向值 (x1, x2) 输入30个双条件单规则发生器的前件 (CGA1, CGA2, …, CGA30) 得到 (y1, y2, …, y30) , 找到最大值ymax所对应的规则“if Ai1, Ai2 then Bi”, 将其后件Bi (Ex B, En B, He B) 作为预测知识的历史规律。

(2) 取邻近预测点的t个数据, 通过逆向云算法得到当前趋势的云模型Ct (Ext, Ent, Het) 。

(3) 综合Bi和Ct得到新的预测知识Dt (Ex D, En D, He D) , 将其作为组合规则发生器的后件CGD-1。构造新规则“if Ai1, Ai2 then Dt”进行预测。

(4) 生成一个期望值为 (En Ai 1, En Ai 2) , 方差为 (H2eAi 1, H2eAi 2) 的二维正态随机数 (E'n Ai 1, E'n Ai 2) 。

(5) 生成一个期望值为En D, 方差为H2e D的正态随机数E'n D。

(6) 若x1≤Ex Ai1, x2≤Ex Ai2, 则预测值

7 预测实例

预测采用我国某风电场10月份的500组历史数据, 每组数据包含风速、风向和风功率三类数据。根据风功率的数据特点, 采用邻近预测点的5个数据迭代地构造当前趋势的云模型Ct1, Ct2, …, Ct24, 再用第5节的云推理方法迭代地预测未来值y'501, y'502, (43) , y'504。虽然云推理属于不确定性推理, 但每个点的预测结果都在某一可靠范围内, 如未来第24个小时的预测结果为{0.3641, 0.3627, …, 0.3398, 0.3587, …, 0.3411, 0.3622, 0.3648, …}。如图5所示。

为了便于分析比较, 运行云推理程序10次, 并取其期望值与ARIMA (1, 1, 1) 模型[13]和RBF神经网络的预测结果进行比较, 如图6所示。

三种预测方法的误差分析如表6所示。可以看出, 无论是最大相对误差、最小相对误差, 还是平均相对误差, 云推理模型都具有一定的优势。其中, 最大相对误差较ARIMA模型和RBF神经网络分别下降了10.93%和56.62%, 最小相对误差分别下降了4.79%和1.74%, 平均相对误差分别下降了4.43%和2.84%。

8 结论

云模型是随机性和模糊性的完美结合。根据风电的特点, 提出了一种基于云推理的短期风电功率预测模型, 通过与ARIMA模型和RBF神经网络比较发现, 该模型具有明显的优势和特点:

(1) 预测结果灵活。云推理预测得到的是一系列有稳定倾向的预测值, 且所有的预测值均在一定范围内小幅波动。用户可以利用多年的经验或借助其它各方面的信息, 在该预测范围内恰当选择预测值, 也可取其期望作为确定性结果, 显示了该模型较强的选择性, 且易与其他知识结合的特点。

(2) 适用于短期预测, 预测误差较小。通过多次运行实验, 并取其期望与其它预测方法比较发现, 该模型的风电功率预测在24小时之内效果较好, 各方面的误差都有不同程度地减小, 具有一定的预测精度。

(3) 扩展性能好。除风速和风向之外, 如能利用气温、气压、降雨量等方面的历史资料, 将云推理发生器的前件从2维扩展到5维甚至更高维度, 将有利于提高预测的效果, 显示了该模型较高的推广价值。

典型风电场风电功率预测误差研究篇7

风电场的出力具有间歇性和难预知性等特点,大量风电接入系统对电网的安全稳定运行构成了影响[1,2]。天气预报的不准确性影响到风功率预测,不准确风电功率预测影响次日的发供电平衡,带来调峰困难[3]。提高风电功率预测精度可以克服电力系统的备用容量设计的保守性,可以提高电力系统的经济性和稳定性[4]。

风电功率预测方法,根据预测物理量可以分为2类:第1类为对风速的预测,然后利用数理统计的方法,对实际风电场的实测风速数据和实测并网功率数据进行数理分析和统计得到确定风电场的风速与功率之间关系特性[5],即由风电机组或风电场的功率曲线得到风电场功率并网[6,7,8,9];第2类为直接预测风电场的并网功率[10,11,12,13,14,15,16,17]。根据所采用的数学模型不同可分为持续预测法、自回归滑动平均模型法、卡尔曼滤波法和智能方法等[10]。根据预测系统输入数据来分类可以分为不采用数值天气预报数据的方法和采用数值天气预报数据的方法。根据预测的时间尺度可分为超短期预测和短期预测。文献[11]基于时间序列法和神经网络法对风速预测进行了研究,这种时序神经网络模型本质上还是以时间序列为基础的,对较长时间的预测效果会比较差。文献[15]研究了基于神经网络的风电场风速时间序列的预测,没有对风电场的并网功率进行预测。文献[16]探讨了风电场的短期风速预测,结合实例阐述了时间序列法在短期风速预测中的应用,但没有给出风电场并网功率的预测。

1 风电场预测误差与概率分布

截止2013年5月,辽宁电网拥有风电场64座,装机容量为5 108 MW,所有风电场都安装了风功率预测系统。

本文首先选取辽宁电网内若干典型风电场的全维数据进行特性分析。采用非限电时期的实际风场出力。以辽宁调兵山风电场数据为例,分析其预测数据的准确度(采样时间分辨率为15 min)。调兵山风电场总装机容量为49.5 MW,单机装机容量为1.5 MW,风机台数为33台,风机型号为UP82/1500,风机类型为上风向水平轴双馈异步发电机,具有低电压穿越能力,机组允许运行的最高频率为51.1 Hz,机组允许运行的最低频率为47.5 Hz,生产厂家是联合动力公司。按要求风电场功率预测系统提供的日预测曲线最大误差不超过25%;实时预测误差不超过15%。全天预测结果的均方根误差应小于20%。

1.1 风电场并网功率的预测值与实际值比较

对比调兵山风电场风电功率预测值与实际风电功率值,由图1可以看出,该风电场的功率预测并网具有一定偏差。

1.2 风电场并网功率日预测误差概率及最大日预测误差

图2显示调兵山风电场的实时风电功率预测误差以及日预测最大误差变化,图3为以5%的误差带宽为限制对图2中日预测最大误差进行概率统计得出的各个误差段的日预测最大误差的概率分布,其中,日预测最大误差,即为一天内该风电场实时预测误差的最大值。

各个误差段的日预测最大误差的概率分布,如图5所示;如实时预测误差<25%的概率占44%,显示该电场实时预测误差并未满足有关国标。

1.3 风电场预测数据的均方根误差

由图6可以看出调兵山风电场的预测结果的均方根误差变化,并以5%的误差带宽为标准对其进行统计,得出各个误差段所占的比例。在图7中为对图6中的各均方根误差所占的百分比做累加分析,可以看出均方根在所有误差中所占的比例,例如均方根误差<20%的预测占79%,该电场的均方根误差不完全满足有关国家标准。

2 辽宁风电场预测数据准确率分析

将辽宁电网的72个风电场ID按照从1开始顺序编号,并对实时预测曲线误差<15%、日预测最大误差<25%、全天预测结果的均方根误差<20%进行统计,如图8所示,可知辽宁省大多数风电场的预测系统提供的预测结果未满足国家有关规定要求。

2.1 风电场风功率预测预报准确率

风电场风功率预测预报准确率定义为:

式中,r1为预测计划曲线的准确率;PMK为K时段的实际平均功率,MW;PPK为K时段的预测平均功率,MW;N为日考核总时段(取96点-免考核点数);Cap为风电场开机量。