统计预报

2024-10-06

统计预报(共3篇)

统计预报 篇1

太阳质子事件 (solar proton events, SPEs) 是太阳爆发过程中能量剧烈释放的一种重要表现。定义为在地球轨道近, 即距离太阳1 AU处观测到的来源于太阳的能量大于10 Me V的质子在连续15 min以上的时间内通量超过10 pfu (part.cm-2.s-1.sr-1) [1]。太阳质子事件的爆发携带着大量带电粒子, 对空间环境和航天事业能够产生很大影响, 因此对其进行准确预报有着重要的意义。

太阳高能粒子的日冕加速机制非常复杂, 目前尚不十分清楚[2], 为质子事件预报带来了一定的困难。但是, 太阳质子事件发生总伴随太阳耀斑和日冕物质抛射 (coronal mass ejection, CME) 事件的爆发, 相关研究表明它们之间有着紧密的联系[3—6]。V.Kurt等人[7]分析了 (1970~2002) 年发生的质子事件数目和太阳黑子数、耀斑、日冕指数的关系, 发现量级>M4的耀斑数目和质子事件数目有很强的相关性。在第22太阳周增加的质子事件的发生率和>M4的耀斑数一致。此外, 质子事件数目和日冕指数的相关性也很强。因此, 太阳质子事件预报模型通常建立在耀斑、CME参量与SPE的统计关系基础上。

早期的预报模型主要基于SPE与耀斑的相关性。美国主要有两个经验预报模式, 一是NOAA空间环境中心发展的预报模式PROTONS, 另一个是由美国空军发展的质子预报模式PPS[8]。PROTONS的输入是实时或准实时的观测, 包括太阳X射线、X射线的峰值通量、耀斑的日面纬度和经度、太阳射电暴数据、地磁活动测量的Ap指数和X射线积分通量。美国空军发展的PPS与PROTONS不同, 它仅使用GOES的X射线峰或积分通量和射电峰或积分通量。近年来, 随着机器学习技术的不断发展, 神经网络技术被应用到质子事件预报研究。英国南汉普顿大学的Partick等人[9]提出了一种基于神经网络的质子预报模型。该模型使用多层感知机预报质子事件有无。模型的输入是来自GOES卫星的太阳X射线和地面观测的太阳射电流量数据。Wang&Gong等人[1011]使用反向传播神经网络建立质子事件预报模型, 输入包括X射线流量、黑子群的面积和分类、射电爆发, 耀斑发生位置等。基于这些参量, 文献[12]选择支持向量机和近邻相结合的方法开发质子事件预报模型, 进一步提高了预报性能。此外, 考虑到太阳活动源自太阳磁场的磁能释放, 文献[13]采用了将太阳光球磁场参量应用到质子事件预报, 并与黑子参量的预报模型进行比较, 结果显示磁场参量模型的预报精度较高于使用黑子参量。

另一方面, 太阳质子事件的爆发和CME有着密切联系。随着CME爆发机制研究的深入研究和相关数据积累, 部分学者已经开展了围绕CME作为预报因子的质子事件预报模型, 并取得了初步的成果[14—17]。

现在研究同时结合太阳耀斑参量和CME参量作为预报因子, 应用统计学习方法建立太阳质子事件预报模型。首先选择计算信息增益率来评价各参量和SPE爆发的重要度, 再应用Logistic回归方法建立质子事件预报模型, 并比较与使用耀斑参量的预报性能, 验证CME参量在质子事件预报中的有效性。

1 数据介绍

太阳质子事件预报模型中所用数据由三类组成:质子事件数据, 耀斑数据及CME数据, 数据的时间覆盖范围从1996年到2005年。

太阳质子事件数据由NOAA的空间天气预报中心 (space weather prediction, SWPC) 收集, 网址为http://www.swpc.noaa.gov/ftpdir/indices/SPE.txt。在质子事件列表中下载, 大部分的质子事件可以联系到耀斑和CME。从中选取70个和二者均关联的质子事件。

太阳耀斑和CME作为预报因子。太阳耀斑选取标准有两个: (1) 软X射线峰值流量大于M1.0; (2) 发生耀斑的同时伴随着CME的爆发。Yashiro等[18]研究了太阳耀斑与CME的联系, 并提供了耀斑和CME的列表 (http://cdaw.gsfc.nasa.gov/pub/yashiro/flare_cme/fclist_pub.txt) 。列表中选择了619个耀斑和CME事件, 现在作为耀斑与CME选择依据。

在描述太阳耀斑的参量中, 考虑三个和SPE相关密切的参量, 分别为峰值流量、爆发时间范围和耀斑维度。这三个参量可由ftp://ftp.ngdi.naaa.gov/STP/SOLAR_DATA/SOLAR_FLARES/FLARES_X-RAY/获得。而CME则选择以下三个参量:CME宽度、CME速度和测量位置角度 (measurement positon angle, MPA) 。这三个参量来源于http://Cdaw.gsfc.nasa.gov/CME_list/UNIVERSA/text_ver/univ_all.txt.

2 预报因子评价

建模的预报因子有上述的耀斑和CME的6个参量组成。为了量化这六个参量与SPEs爆发之际的相关性, 采取计算信息增益率 (gain ratio, GR) 作为评价指标。

信息增益率GR可以表示各属性因子对于SPE的重要度[19]。假定对于数据集D有m个不同的类Ci (i=1, 2, …, m) , Cid是D中Ci类样本的集合, ︱D︱和︱Cid︱分别是D中和Cid中样本的个数。首先定义数据集D的信息熵, 如式 (1) 所示。

式 (1) 中Pi是D中任意样本属于类Ci的概率, 用︱Cid︱/︱D︱估计。

假定按属性A划分D中的样本, 属性A根据训练数据的观测具有v个不同的值{a1, a2, …, av}。可以用属性A将D划分为v个子集{D1, D2, …, Dv}, 其中Dj包含D中的样本, 它们在A上具有值aj, 这些划分对应从节点N生长出来的分支。InfoA (D) 是基于按A划分对D中样本分类所需要的期望信息, 定义式 (2) 度量。

基于式 (2) 和式 (3) , 属性A的信息增益率GR可以描述为

式 (3) 中 , 表示通过将训练集D划分成对应于属性A测试输出的v个划分产生的信息。

计算各属性因子的GR, 得到结果见图1。由图1可以看出, 六个因子中CME宽度和速度的GR值最大, 由此可以看出CME参量作为SPE预报因子是非常必要的。

3 线形Logistic回归模型

线性Logistic回归是统计学中流行的一种方法, 应用于处理回归和预测分类问题。Logistic回归模型是在线形回归的基础上应用Logistic函数, 将训练数据的概率最大化的方法[20]。具体地, 对于给定输入样本x, 建立类别y的一个条件概率, 表示为

式 (4) 中w为权值, 通过权值将输入属性进行线形组合来表示类别, 即建立的线形回归模型。式中函数g (z) 称为logistic函数, 其形式为

logistic函数可以将线形组合的目标值转换为概率, 经过函数转换, 目标取值范围控制在[0, 1]范围内。

和线形回归一样, 需要求出能与训练数据匹配得较好的权值。在线形回归使用平方误差最小化来求出权值, 而logistic回归中使用模型的对数似然 (log-likelihood) 为

现选择使对数似然最大化的权值wi, 通常采用迭代的调整参数w使目标函数l (w) 取得最大值。

应用logistic回归可以处理分类问题, 两类问题的logistic回归边界是在预测概率为0.5处。

它发生在

时。这是关于属性值的线性等式, 形成的预测边界构成样本空间的一个线性超平面, 通过超平面对预测数据进行分类。

在质子预报中应用logistic回归是将预报形式化为两类分类问题, 根据耀斑和CME六个参量 (峰值流量、爆发时间范围, 耀斑维度, CME宽度、CME速度和MPA) 对质子事件进行预测分类, 发生质子事件分为一类作为正例样本, 标识yi=1, 未发生质子事件作为另外一类反例样本, 标识yi=0。

建立预报模型分为以下两个过程。

1) 训练。数据将训练集数据代入式 (3) 建立预报模型, 即求出对数似然最大化的权值wi。训练集由输入数据和输出数据组成。输入数据xi为质子事件的六个参量, 输出数据yi是质子事件发生标识。

2) 预测。对于测试集的预测样本, 将特征参量xi和训练中求出的wi数据代入式 (1) , 计算输出概率值。如果输出概率大于0.5, 预报为质子事件发生, 否则预报为未发生。

4 模型的检测

预报模型数据集包括质子事件70组, 非质子事件70组。由于logistic回归模型要求类数据平衡, 对数据集进行了重采样, 即在非质子事件样本中随机抽取等同于质子事件组成平衡建模数据集。检测采用十折交叉验证, 即将数据集顺序等分为10份, 依次取其中的9份用于训练, 1份用于测试。重复操作10次取平均结果。

logistic回归算法应用Weka (waikato environment for knowledge analysis) 数据挖掘软件, 可由网址http://www.cs.waikato.ac.nz/ml/weka/下载。Logistic回归算法中各参数保持默认的设置。

在对预报结果进行评价时, 采用正确的肯定率 (TP rate) , 正确的否定率 (TN rate) , 虚报率 (FP rate) 和漏报率 (FN rate) 四个参量描述, 见表1。其中TP定义为对正例样本预报为正确的数目, TN为对负类样本预报为正确的数目;FP为对负类样本预报为正类的数目;FN为对正类样本预报为负类的数目[14]。

预报模型分成两类情况:预报因子为耀斑参量的模型和预报因子是耀斑和CME结合的模型。预报结果结果比较显示于表2和表3。

对表2、表3分别计算预报准确率, 结果见表4。表中TP rate为正确的正类样本数和真实的正类样本数的比, TP rate=TP/ (TP+TN) ;TN rate为正确的负类样本数与真实的负类样本数的比, TN rate=TN/ (TN+FP) ;FP rate为虚报率, 定义为错误的否样本数和预报的正类样本数的比, FP rate=FP/ (TP+FP) ;FN rate为漏报率, 定义为错误的肯定样本和真实的负类样本的比, FN rate=FN/ (FP+TN) 。

由表4可以看到, 采用耀斑和CME作为预报因子的预报模型比只采用耀斑的模型的具有更好的预报准确率。模型B的TP rate和TN rate均比模型A得到了提高, 其中TP rate上升的较为明显:从67.15%上升到90%。同时虚报率和漏报率也得到了有效的控制, 虚报率由22.95%下降到14.29%。预报结果说明利用CME参量预报对太阳质子事件短期是有效的, 在今后的质子事件建模中可作为主要考虑的预报因子。

5 结论

基于太阳质子事件与太阳耀斑和CME的密切相关性, 选取描述太阳耀斑与CME的六个参量, 包括耀斑峰值流量、持续时间和耀斑维度、CME宽度、CME速度和测量位置角度作为预报因子, 采用线性Logistic回归方法建立太阳质子事件预报模型。预报模型的实验结果显示耀斑参量加入CME参量后建立的预报模型和耀斑参量的预报模型相比预报精度得到了较大提高, 尤其是对质子事件发生的报准率的明显上升, 说明CME参量对耀斑发生有着重要的影响, 这个结果和节2采用计算信息增益率的得到的CME宽度和速度的重要度最高是一致的。

下一步的质子事件预报研究包括预报因子加入太阳黑子数。预报输出增加预报质子的峰值流量和上升时间等指标。

统计预报 篇2

司诉 讼

理由

是什么?

假日办关于开展2010年“十一”黄金周预报统计工作有关事项的通知

各省、自治区、直辖市假日旅游协调机构办公室:

为全面了解2010年“十一”黄金周期间的国内旅游情况,把握我国旅游业发展动态,全国假日办按照《“黄金周”旅游信息统计调查制度》(以下简称《“黄金周”调查制度》)的要求将北京、上海、天津、重庆、承德、秦皇岛、沈阳、大连、长春、吉林、哈尔滨、南京、无锡、苏州、杭州、宁波、黄山、厦门、南昌、瑞金、青岛、洛阳、武汉、长沙、张家界、韶山、广州、深圳、桂林、海口、三亚、成都、广安、贵阳、遵义、昆明、西安、延安、银川等39个指定重点旅游城市,平遥古城、五台山、千山、周庄、同里古镇、花果山、普陀山、乌镇、千岛湖、九华山、武夷山、福建泰宁、珠海海泉湾、庐山、井冈山、泰山、曲阜三孔、嵩山少林、云台山、武当山、三峡大坝、神农架、南岳衡山、峨眉山、九寨沟、黄龙、玉龙雪山、布达拉宫、华山、敦煌莫高窟、塔尔寺、天山天池等32个指定重点旅游景区纳入本次统计范围,开展预报统计工作。现将本次统计工作的具体要求和有关事项通知如下:

一、关于“旅假日综1表”的填报要求

按照《“黄金周”调查制度》的要求,纳入本次统计范围的39个重点旅游城市和32个重点旅游景区,要在假期前核报“旅假日综1表”。本次填报“旅假日综1表”的要求如下:

(一)直辖市和计划单列市填报三个重点监测的市内景点,其他城市填报两个重点监测的市内景点;各城市填报的监测景点名称和顺序,经全国假日办核准后不得更改。

(二)对于最佳和最大日接待量变动较大(增加或减少10%以上)的监测景点,要求重新核定其最大和最佳日接待量,并将核定的依据和方案一并传真报送全国假日办统计预报中心。全国假日办统计预报中心的联系传真为:010-65201030、65201031、65201032;联系人为:蒋正鸣、赵成;联系电话为:010-65201649,65201612。

(三)请各指定重点旅游城市和景区将核定后的“旅假日综1表”,以传真方式(要求加盖假日办章并经假日办领导签字),于9月15日前报全国假日办统计预报中心。同时,请在传真中附上统计预报签发人、负责人和填报人的姓名、联系电话和传真。

二、9月20日进行“十一”黄金周统计预报模拟测试

为保障假日旅游预报网络系统在假日期间顺利运行,全国假日办决定于

2010年9月20日,组织纳入本次统计预报范围的39个重点旅游城市和32个重点旅游景区,进行一次模拟测试。要求以上城市和景区的假日旅游协调机构于9月20日下午15时--17时,将反映当天实际情况的旅假日综2表--“黄金周”

旅游信息预报表和当地假日期间接待情况概述,通过点击

http://(国家旅游局官方网站)中的“假日旅游预报系统”模块,进行填报提交(进入密码同前)。

三、预报统计工作的具体时间安排

按照《“黄金周”调查制度》的规定,要求各指定重点旅游城市和景区于9月24日至9月30日(“黄金周”前7天至前1天)每天17时前,填报旅假日综2表和假日期间本地旅游情况的总体概述;于10月1日至10月7日每天17时前,填报旅假日综3表和当日接待情况总体概述。要求各指定重点旅游城市于10月8日8时前填报旅假日综5表;要求各省(自治区)于10月8日12时前填报旅假日综6表。

四、关于向中央电视台提供电视资料录像片和向中国旅游网提供资料照片的注意事项

各指定重点旅游城市和景区可根据实际情况,于2010年9月20日前,自愿提供电视资料录像片和资料照片。具体内容是:反映2010年“十一”黄金周期间开展的旅游活动场所的场景(有游客的画面)。供中央电视台选用的录像带规格应是DVCPro或DVCAM制式的带子(请勿用带台标的资料带),时间不超过30分钟。录像带盒内请附上拍摄场记。录像带请邮寄至中央电视台社会新闻部七组,地址:北京市海淀区羊坊店西路京西大厦2层;收件人:熊传刚;邮政编码:100038;联系人:尹霞;电话:010-65201731。资料照片请发至如下邮箱:

xinwenchu@cnta.gov.cn。

特此通知。

统计预报 篇3

1 资料与方法

对2014年龙城地区6个乡镇区域自动站温度和朝阳本站温度资料进行对比分析, 分别计算各镇与朝阳站的高 (低) 温的温度差[2,3]。考虑晴天和非晴天 (非晴天包括多云和降水) 状况下温度差值各异, 将温度差分成晴天和非晴天2类, 分别在晴天和非晴天的情况下求取连续5 d温度差的平均值作为第5天的订正值。在市局预报朝阳站高 (低) 温的基础上加上龙城各乡镇高 (低) 温订正值, 作为乡镇预报的最终结果, 将此方法定义为5 d平均订正法。对预报准确率进行检验, 并分析在不同季节中此方法的可用效果。

2 订正前后预报准确率对比

订正前的预报是指完全应用市局对朝阳站的预报结果预报龙城6个乡镇的温度, 不做任何订正。订正后的预报是指在晴天和非晴天的情况下, 分别对市局预报朝阳站的结果采用5 d平均订正法进行订正。订正前后的预报准确率情况见表1。

(%)

由表1可知, 订正前的预报准确率 (Ts评分) 乡镇平均最高气温为73.4%, 最低气温为57.2%;订正后最高气温为87.1%, 最低气温为69.9%。相比订正前高温准确率平均提高13.7个百分点, 低温准确率平均提高12.7个百分点。其中, 高温准确率西大营子提高27.7个百分点, 低温准确率联合提高29.9个百分点, 订正效果显著。订正后温度预报准确率达到对乡镇预报评分标准 (气温最高和最低气温乡镇平均预报准确率≥60%) 。通过检验可得, 5 d平均订正法在提高乡镇预报准确率方面可用性很高, 但低温预报效果稍差。

3 低温预报的分季节统计

为了分析5 d平均订正法在低温预报方面的效果, 从不同季节入手, 分析该方法的缺陷。根据龙城地区春秋短、冬夏长的季节分布特征, 把龙城区四季划分为春季4—5月、夏季6—8月、秋季9—10月和冬季11月至第2年3月。

在非晴天状况下, 夏季图有1个主误差峰值, 误差集中位于-2~2℃, 预报准确率为93.6%, 预报效果显著;春季和冬季图中有明显的主峰值, 但预报误差分布比较分散, 预报效果较差, 准确率分别为春季54.8%, 冬季48.6%;秋季图中有2个峰值, 且峰值围绕2℃和-2℃分布, 预报误差多分布在-2~2℃之外, 预报效果极差, 准确率仅为38.9% (图1) 。

在晴天状况下, 春、夏、秋、冬季图均有1个主误差峰值, 预报误差分布略有分散, 准确率分别为春季61.7%、夏季82.6%、秋季72.5%、冬季64.4%, 预报效果均好于非晴天状况。

在晴天和非晴天状况下, 分析5 d平均订正法在低温预报方面的效果 (表2) , 可以看出, 在春、秋、冬季低温预报效果较差, 并且在非晴天状况下效果最差, 预报准确率达不到50%, 夏季采用5 d平均订正法预报低温效果较好, 晴天和非晴天状况下准确率均超过80%[4]。通过分析得出, 市局在春、秋、冬季非晴天状况下的指导预报可用性极低, 5 d平均订正法也不可用, 因此需要在此种特殊天气状况下加强新的订正方法研究。5 d平均订正法简单, 只需统计相同天气状况下前5 d的温差, 即可在此基础上订正当天的温度, 在技术条件落后的部分县局推广使用价值较高。

4 结语

(1) 5 d平均订正法在提高乡镇预报准确率方面可用性很高, 高温预报准确率平均达到85%以上, 但低温预报效果稍差。

(2) 低温预报方面, 5 d平均订正法在春、秋、冬季低温预报效果较差, 并且在非晴天状况下效果最不好, 预报准确率达不到50%, 夏季采用5 d平均订正法预报低温效果极好。

(%)

(3) 在春、秋、冬季非晴天状况下, 市局指导预报可用性极低, 且5 d平均订正法也不可用, 在此种特殊天气状况下需加强新的订正方法研究。

参考文献

[1]丁一汇, 任阵海.中国气象事业发展战略研究:气象与可持续发展[M].北京:气象出版社, 2004:133-135.

[2]黄治勇, 张文, 陈璇, 等.湖北省乡镇温度预报方法初探[J].气象, 2011 (12) :1578-1583.

[3]李若楠, 刘畅, 杨冰, 等.抚顺地区气温分布与乡镇温度预报订正方法研究[J].现代农业科技, 2014 (21) :220-222.

上一篇:建筑智能化电气工程下一篇:成本会计教学改革