基于概率分布的风险评估方法研究

2024-12-01

基于概率分布的风险评估方法研究(通用12篇)

基于概率分布的风险评估方法研究 篇1

基于概率分布的风险评估方法研究

风险因素发生概率及其所导致的后果是风险评估过程中的2个重要指标,而这两者往往都具有不确定性.针对定量分析这2个指标困难的.问题,论文研究了基于概率分布的风险评估方法.该方法主要利用Monte-Carlo模拟单项风险因素发生及其所导致的后果,生成受单项风险因素影响的系统目标累积概率分布,再结合控制区间记忆(controlled interval and memory, CIM)模型,分析受多项风险因素综合影响的系统目标累积实现概率分布.最后以某型导弹研制阶段某工作节点的费用风险分析为例进行了应用示例.

作 者:吕彬 杜红梅 陈庆华 L(U)Bin DU Hongmei CHEN Qinghua  作者单位:吕彬,L(U)Bin(中国国防科技信息中心,北京,100036;装备指挥技术学院,研究生管理大队,北京,101416)

杜红梅,DU Hongmei(装备指挥技术学院,试验指挥系,北京,101416)

陈庆华,CHEN Qinghua(装备指挥技术学院,装备指挥系,北京,101416)

刊 名:装备指挥技术学院学报  ISTIC英文刊名:JOURNAL OF THE ACADEMY OF EQUIPMENT COMMAND & TECHNOLOGY 年,卷(期): 17(4) 分类号:N94 关键词:风险评估   蒙特卡洛方法   累积概率分布曲线   控制区间记忆模型  

 

基于概率分布的风险评估方法研究 篇2

关键词:加速度传感器,信号预处理,区间分布概率矩阵,动态手势识别

基于动作传感器的人机交互不受光线遮挡和角度限制,测量单元易于嵌入片上系统,并且更接近于自然交互方式,基于动作传感器的人机交互已成为当前该领域的研究热点[1,2]。业界对基于加速度传感器的动作识别方法开展了大量的研究,基于隐马尔可夫模型[3]、模糊神经网络[4]、模版匹配[2,5]等识别方法被广为关注和研究。但因这些识别方法的算法复杂度偏高,手势识别的动态实时性和识别率不理想,这些方法难以满足手势在线识别的要求。

本文提出一种基于区间分布概率矩阵模型的在线快速手势识别方法,其主要优点是:(1)把大量工作转移到模型建立和模型优化上面,而这些工作完全可以在PC机上完成。(2)在线识别系统中没有大量复杂计算公式、递归运算和模版库的存储,极大地提高了动态实时性;(3)识别率高,实用性强。通过对日常生活中常做的12种单笔画手势[6]动作的在线识别,验证了该识别方法具有很高的人机交互实时性和较强的实用性。

1 手势识别系统整体架构

手势识别系统流程如图1所示,首先利用样本数据在PC机上建立和优化区间分布概率矩阵模型。利用戴在手指上的可穿戴数据采集和发送模块采集手势动作的三维加速度信号,由接收、处理和识别模块对信号进行预处理、提取和检测X、Y和Z轴的观测点数据、输出观测序列,然后利用建立好的区间分布概率矩阵模型进行手势识别,显示识别结果。

2 信号预处理

2.1 动作数据自动检测和归一化处理

通常用户完成一个动态的手势动作会经历三个阶段:开始阶段、动作阶段和停止阶段。利用此特点可在连续的加速度数据流中检测出手势识别过程所需要的动作阶段加速度数据流。

本文设计了一个可通过设置门限阈值自动检测手势动作阶段加速度数据流的滑动窗口。在手势的开始和停止阶段,加速度数据流可用常量表示。在手势的动作阶段,加速度数据流会产生明显的变化。设A(t)=[ax(t),ay(t),az(t)]为t时刻采集的三轴加速度数值。Threshold为设置的门限阈值。将A(t)和前n个采样点逐个进行比较,若‖A(t)-A(t-n)‖≥threshold,则可判断t时刻的采样点A(t)为动作阶段的数据点,这样即可检测包含运动信息的动作阶段的数据点。

在实际数据检测中,设置2个阈值(开始阈值和结束阈值),较大的开始阈值有利于滤除噪声数据,较小的结束阈值可以确保动作阶段数据传输的完整性[7]。

由于人的手势动作幅度不固定,尤其是不同人做同一个手势动作时,加速度数据幅度相差比较大,所以必须对采集的手势动作加速度数据进行归一化处理,以降低手势动作加速度数据幅度变化差异对识别结果的影响,从而可以降低识别难度,提高识别精度。本文采用的是线性函数转换法,yi=(xi-Min Value)/(Max Value-Min Value)其中xi、yi分别为样本中第i个点处转换前、后的值,MaxValue、Min Value分别为样本中的最大值和最小值。

2.2 插值法归整数据采样频率

由于不同人完成同一种手势动作的快慢不同,而且同一个人完成同一种手势动作的快慢也不尽相同,而系统的采样频率是固定的,相同的手势动作如果完成快,则采集的数据点较少;反之,如果完成速度慢,则采集的数据点较多。这样就增加了识别难度,但是,对于同一种手势动作,无论采集到的数据点多少,它的整体变化规律是相似的。为了简化识别过程,降低识别难度,本文通过插值法把一个完整手势动作数据点扩充到同一长度来消除人为速度干扰因素对识别率的影响。

本文采用三次样条插值法[8](简称spline插值)对手势动作数据点进行扩充。三次插值法既保留了分段低次插值多项式的简单、稳定和收敛等优点,又提高了插值函数的光滑性,从而不会造成原始数据失真。插值效果如图2所示。

3 PC机建立区间分布概率矩阵初始模型

3.1 特征区间提取

3.1.1 观测点的选择

在经过本文上述数据预处理之后,所有手势动作加速度数据长度标准化为H0=50。本文选择加速度值作为特征量,所以需要确定一些特定的观测点(即需要确定一些特定的采样点)来提取不同手势的加速度信息。在选择观测点时,尽量做到在同一个观测点处,相同手势动作的加速度数值变化幅度较小。以X轴为例,根据手势在X轴上加速度数据的特征分布,选取K个观测点:O1,O2,…,Ok。

3.1.2 特征区间的定义

设有M个手势,共N个样本(每种手势有N/M个样本),那么在观测点Ok处,由N/M个观测值构成每个手势的分布区间Ω。统计M个手势的区间的分布情况后,确定M个手势的观测值的分布区间ξ,将ξ划分成S个子区间(左闭右开型):R1,R2,…,Rs。子区间就称为M个手势在观测点Ok处的特征区间。

3.1.3 提取特征区间

以本文的12种手势为例,阐述提取过程。随机为每个手势选取了10个样本,在X轴上观测点O1=10处,12种手势的观测值分布如图3所示。根据这个分布统计出加速度最大值和最小值,就可以知道此时所有样本观测值的集中分布的范围ξ。然后再把这个分布区间范围等间隔分为了5个子区间(即特征区间),则12种手势的所有样本(120个)在观测点处的加速度值都会落入这些子区间:R1,R2,R3,R4,R5。

3.1.4 区间分布概率矩阵及模型的定义

同一种手势的不同样本,在同一个观测点处的观测值可能会落入不同的特征区间。以图3为例,在观测点O1=10处,手势11的10个样本观测值落入了R2,R3,R43个特征区间,但是有的区间落入的观测值多(如R2,7个),有的区间落入的观测值少(如R4,1个),从统计学的角度讲,手势11的10个样本在观测点处的观测值落入R2,R3,R43个特征区间的概率不同。不同的手势在观测点O1=10处又有不同的情况。能够表示不同手势和不同样本在同一个观测点处的观测值落入不同特征区间的概率分布情况(下文有详细建立过程)的矩阵称之为区间分布概率矩阵。在X、Y和Z轴上的所有观测点处的区间分布概率矩阵构成了本文手势识别方法的区间分布概率矩阵模型。

3.2 初始模型建立

初始模型建立过程如下:

(1)为每个观测点建立对应的区间分布概率矩阵。以X轴为例,在某个观测点处,M个手势的N个观测值属于S个不同的特征区间。每个观测点处会对应一个区间分布概率矩阵A,例如在第K个观测点处的区间分布概率矩阵为:Ak(i,j),1≤i≤S,1≤j≤M。

(2)区间分布概率矩阵初始化。每种手势的样本数为N0=N/M,假设在第K个观测点处,手势j(1≤j≤M)有n(0≤n≤N0)个样本中的观测值属于第i个特征区间,则Ak[i,j]=n/N0。这样就可以得到第K个观测点处对应的区间分布概率矩阵Ak(i,j),如表1所示。显然满足:。

(3)用以上步骤分别为X、Y和Z轴上各观测点建立区间分布概率矩阵,这些矩阵构成了区间分布概率矩阵初始模型(在X、Y和Z轴上选取的观测点可以不一样)。

3.3 模型优化

为了提高识别率,还需要对各观测点对应的区间分布概率矩阵进行优化训练。在区间分布概率矩阵初始模型已有的N个样本中继续添加新的训练样本。每添加一个新的训练样本,在各观测点处就会生成一个新的区间分布概率矩阵。例如,在X轴上第k个观测点处会生成一个新的区间分布概率矩阵Ak1[i,j]。随着训练样本的添加,各观测点处的区间分布概率矩阵会趋于一个常数矩阵,这时达到了最优模型,此时的区间分布概率矩阵模型可以用到手势的在线识别中。

4 在线识别

在线识别过程如下:

(1)信号预处理和检测各观测点处对应的特征区间。以X轴为例,当某一手势数据输入时,首先经过信号预处理,然后检测X轴上各观测点处观测值对应的特征区间,输出观测序列O={O1,O2,…,Ok}。例如,在第一个观测点处观测值对应的特征区间为R2,则O1=R2。

(2)计算每一种手势在X轴上输出上述观测序列时的概率值。假设在第l个观测点Ol处的观测值属于第i个区间Ri,则手势m在第l个观测点Ol处的观测值属于区间R2的概率为:

则第m个手势输出上述观测序列的概率为:

识别输入手势。若:

则手势m即为要识别的手势动作。

(3)将以上识别过程在X、Y、Z轴上分别实现。

5 实验结果与评价

为了使传感器与测量点之间尽可能地相对稳定,避免因手势的变化引起传感器偏离原始测量位置,使识别结果产生较大误差,本系统中,把数据采集和发送模块做成了一个小巧的戒指,通过无线的方式将采集到的数据实时地发送给微处理器进行处理和识别。实验时,将戒指模块戴到左手或右手食指的第二节,这样,MMA7361L加速度传感器相对于手指的位置是固定的。

实验中选用了30名志愿者,每个志愿者在自己习惯和放松的状态下,以正常的速度匀速执行预定义的12种手势,每种手势重复做10次,实验中随机选取了5次动作进行训练优化模型,其余的5次动作进行测试,共采集了3 600组样本数据。

实验结果如表2所示。平均识别率为97.94%,手腕向下、手腕向上和右旋转的识别率最高为100%,手腕向右的识别率最低为94.7%。为了更好地说明本文的识别方法在识别率和实时效果上比其他算法更具有优势,实验中同时用HMM和DTW算法对这12中手势进行了识别,平均识别率分别为79.08%和85.2%,并且延时比较明显。基于本文识别方法对手势动作的整体识别率较高,实施效果好,说明本文的识别方法能有效实时地完成人机动态交互。

本文通过对加速度传感器MMA7361L采集到的手势动作加速度数据的分析,经过动作数据自动检测、归一化和三次样条插值预处理,最后根据完成相同手势动作得到的三维加速度数据变化规律的相似性,提出一种基于区间分布概率矩阵模型的动态手势识别方法,简化了传统算法识别过程的复杂度,成功地降低了手势识别难度,从而提高了基于加速度传感器手势识别的人机交互实时性,在一定程度上解决了动态实时性与识别率的相互矛盾性。

参考文献

[1]荆雷,马文君,常丹华.基于动态时间规整的手势加速度信号识别[J].传感技术学报,2012,25(1):72-76.

[2]杨先军,王昌喜,潘磊,等.基于三维加速度信息的上肢动作质量评价的研究[J].传感技术学报,2010,23(12):1709-1712.

[3]CARIDAKIS G,KARPOUZIS K.SOM:self organizingmarkov map for gesture recognition[J].Pattern recognitionletters,2010,31(1):52-59.

[4]CHOWHAN S S,KULKARNI U V,SHINDE G N,et al.Iris recognition using modified fuzzy hypersphere neuralnetwork with different distance measures[J].InternationalJournal of Advanced Computer Sciences and Applications,2011,2(6):130-134.

[5]ZHANG S Q,YUAN C,et al.Self-defined gesture recog-nition on keyless handheld devices using MEMS 3D acce-lerometer[C].In Proceedings of International Conference onNatural Computation.IEEE.2008(4):237-241.

[6]JING L,ZHOU Y,et al.A recognition method for one-stroke finger gestures using a MEMS 3D accelerometer[C].IEICE Tran on Information,2011,E94-D(5):1062-1072.

[7]刘蓉,刘明.基于三轴加速度传感器的手势识别[J].计算机工程,2012,37(24):141-143.

基于概率分布的郑州洪涝灾害研究 篇3

摘要:文章通过分析郑州降雨量日值数据,建立模型判定洪涝灾害发生的时间与强度。并通过分布拟合判断出郑州洪涝灾害的发生次数服从参数为9的possion分布;而洪涝灾害每次发生的强度服从Burr分布;洪涝持续时间ξ~IG(4.2904,5.1034),期望为5天。一般来说7、8、9三个月份是大暴雨频发月份。

关键词:非参数检验;分布拟合;洪涝判定

中图分类号:P407 文献标识码:A 文章编号:1009-2374(2013)20-0016-02

1 概述

自然灾害的发生具有一定的突发性和随机性,且有时是难以避免的。进入21世纪,我国洪涝灾害频发,造成损失严重。仅2012年洪涝灾害致死673人,直接损失2675亿元。因此如何应对洪涝灾害以减轻财产损失是我们不得轻视的问题。

本文通过处理郑州多年降雨量数据建立洪涝灾害判定模型,得出21世纪以来郑州洪涝灾害发生的具体情况,通过概率分布来量化郑州洪涝发生的频率、强度、持续时间和多发月份等信息,以便为该地区农业灾害保险定价、农业生产和洪涝灾害防治等方面提供依据。

2 理论与概念

2.1 数据来源

本文选取中国气象科学数据共享服务网,截取郑州站点2000~2012年降雨量日值数据为研究对象。依据气象学中我国气象部门采用的爆雨强度标准,大暴雨是指12小时雨量等于和大于70毫米;特大暴雨指是2小时雨量等于和大于140毫米。

2.2 降雨形成洪涝模型

洪涝灾害主要是由降雨引起的,当降雨量在一段时间内持续过大,降水速度大于排水速度就会引起洪涝灾害。假设降雨速度为v(t)mm/d,而最大排水速度为V,实时排水速度为v0mm/d。则,该地区在t-t0时间段

内雨水累积量为:

(1)

显然当日降雨量较小时,降雨可以及时地通过土壤渗透以及河流排水排出,即v(t)-v0=0时不存在积水情况,更不会存在洪涝灾害的隐患。但当日降雨量非常大或者持续高强度降水时亦即v(t)非常大或者持续较大时,就会发生洪涝灾害。

在t-t0这段时期内,可以把从下雨整个连续多水期分为潜伏、蓄水和排水三阶段。在潜伏阶段(t0~t1),v(t)=v0,不会形成积水;到了蓄水阶段(t1~t2),v(t)>v0,会开始形成积水,且积水的多

少与Δt=(t1~t2)的大小直接呈正相关,积水大于一定值时判定为洪涝,此阶段持续时期越长则发生洪涝灾害越严重;进入排水阶段后降水速度减少至C以下(t2~t3),v0=C,此时期长短则与前期的积水量正相关,直到t3时刻排水结束,积水V=0。

则(1)式可以展开为:

(2)

从(2)式可看出t2时刻V(t)达到最大为:

(3)

于是可以参照此时的积水量Vm来判断洪涝发生的时间和强度。假设观测区排水速度恒为100mm/d,即与大暴雨的速度相当。当积水超过50mm时判定为洪涝,洪涝强度与积水深度有关。求得12年来洪涝灾害发生的结果,见表1。

2.3 分布检验方法

在总体分布情况不明或有些分组数据一端或两端为不确定数值时,用非参数检验。本文选用K-S检验、A-D检验和卡方检验三种常见的非参检验方法。三种检验的值都是越小,实际分布越接近理论分布。

3 关于郑州洪涝灾害的描述

一般大暴雨及洪涝灾害发生的时间、每次发生的强度、发生频率等遵循某种特殊分布。我们试图以某种分布函数来描述这种规律,并通过非参数检验来判断拟合优度。

3.1 洪涝发生频率描述

通过每年灾害发生次数的时序图,可知郑州历年灾害数之间的影响不大。根据郑州2000~2012年洪涝发生次数的原始数据,可知郑州洪涝发生次数的样本原点矩8.923,大暴雨发生次数的样本原点矩18.615。分别运用参数λ=8.92和λ=18.6的泊松分布对洪涝及大暴雨发生的次数进行非参数检验。

洪涝和大暴雨的K-S检验值分别为0.179和0.142,均小于置信水平95%时的临界值0.36,通过检验;二者A-D检验值分别为0.51和0.31,小于置信水平95%时的临界值2.5。因此可认为郑州洪涝灾害及大暴雨发生的次数都服从泊松分布。大暴雨年发生次数X~π(18.6)。洪涝灾害年发生次数Y~π(8.9)。

3.2 暴雨发生月份描述

通过观察大暴雨发生的月份可发现大暴雨发生时间集中在夏季,用常见的有界分布对其经验分布进行拟合都不理想,其中Gen.Extreme Value拟合度最优,K-S检验值0.125,A-D检验值7.74,仍拒绝原假设。故只能通过频数分析来描述大暴雨平均发生次数与月份的关系,详见表2。

4 结论与展望

本文通过建立模型处理易得的降雨量数据,得出郑州13年间洪涝灾害发生的时间和强度等信息。洪涝灾害的发生次数服从泊松分布,并长期持续以大约每年9次的速度发生洪涝灾害,7、8、9三个月份是大暴雨频发月份。因此每年这三个月要特别注意洪涝灾害的防治。

本文对郑州洪涝灾害进行了初步探索,其中有很多需要完善的地方。比如洪涝灾害的发生时间与强度可能会有某种联系,但本文只分别检验各自的统计规律,而这两者很有可能服从某种联合分布;本文只针对洪涝灾害进行研究,其他自然灾害的概率描述也会对农业防灾和保险赔付领域有深刻的价值,所以针对不足有待进一步分析和推广。

参考文献

[1] 周俊华,史培军,方伟华,等.1736-1998年中国洪涝灾害持续时间分析[J].北京师范大学学报(自然科学版),2001,37(3):409-414.

[2] 张俊香,黄崇福,乔森,等.自然灾害概率风险区划与软风险区划的比较[A].中国灾害防御协会风险分析专业委员会第二届年会应用基础与工程科学学报

[C].2006:1-5.

[3] 潘高田,胡军峰.小样本的均匀分布参数的区间估计和假设检验[J].数学的实践与认识,2002,32(4):629-631.

基于概率分布的风险评估方法研究 篇4

引入一类相关负风险和风险过程,负风险和类之间的相关性定义为稀疏相关结构,主要研究类之间的`相关性对破产概率的影响.

作 者:孙红梅 张春生 王过京 Sun Hongmei Zhang Chunsheng Wang Guojing 作者单位:孙红梅,王过京,Sun Hongmei,Wang Guojing(苏州大学数学系,江苏,苏州,215006)

张春生,Zhang Chunsheng(南开大学数学科学学院,天津,300071)

基于概率分布的风险评估方法研究 篇5

网上电子期刊具有时效性强、内容丰富、检索途径多样等优势,利用率非常高。网上电子期刊包括与印刷版同时发行和仅在网上发行的两种,其主要来源渠道有:

(1)出版商和文摘索引服务商提供的期刊检索服务。目前,国际上大多数主要的期刊出版商都建立了全文数字化期刊数据库,并通过因特网提供服务。如美国学术出版社(Academic  Prees)的IDEAL(International  Digital  Electronic  Access  Library)系统(http://www.Idealibrary.com),德国Spring-Verlag出版公司的Link系统(http://www.link.springer.de)等。有的文摘索引服务商则将自己的产品上网,提供包括期刊订购、检索、全文传递等服务。如美国威尔逊公司(Wilson)的Wilson  Fulltext(http://www.  wilson.com)。

(2)网络数据库信息服务商提供的服务。存储在网络服务器上的网络数据库品种多、质量高,大多由信息服务商或大型图书情报机构创建维护,如世界上最早和最大的国际联机检索系统Dialog,美国联机计算机图书馆中心OCLC,中国期刊网等。访问的形式主要有授权直接访问或访问镜像站上的数据库两种。中国期刊网的题录数据库免费供用户检索,可为用户提供6000多种刊物的题录信息。有的数据库服务商不定期地提供某些数据库的免费试用服务。

(3)文献情报部门或学术性机构提供的服务。文献情报部门或学术性机构依托自己或协作单位的馆藏,通过自己的网站提供期刊或其他类型文献的网上检索服务,用户在有的网站检索二次文献信息的同时,还可以订购原始文献,原文可通过E-mail、传真、浏览、下载和联机打印等方式获取。如美国科技信息研究所的科学网(web  of  science,http://wos.  isiglobalnet.com)提供世界三大引文索引SCI、SSCI、A&HCI)的检索。

(4)网络版期刊提供的服务。许多期刊正在网上建立自己的网站,便于读者上网检索或提供免费的电子邮件现刊目录服务。如《中国远程教育》免费为广大读者提供全文阅读、期刊订阅及检索服务;《世界华人名人录》网络版提供网络版的题录和全文;中国经济展望网提供《宏观经济观察》、《宏观经济论坛》等多种网络版期刊的题录和全文,等等。

1.2 网上图书信息

网上提供的图书信息主要包括书目信息和电子图书。

(1)出版商提供的书目信息。国内外许多出版社都设有自己的网站,通过因特网发布其出版物的目录、最新图书内容简介、价格等信息。如高等教育出版社提供新书推荐、教材目录以及书目查询服务等;Academic  Press提供其出版物的目录、最新图书内容简介、价格等信息,带有一定的销售宣传性质。

(2)图书馆、文献情报中心提供的联机图书馆馆藏目录。目前全球至少有15000个大型图书馆的联机目录24小时对外开放。读者通过OPAC可以查询到大量的`书目信息,确定某本书是否在馆,能否通过馆际互借加以利用等。有些联机目录不但提供书目及摘要,还提供其他信息资源,用户可以通过相应的URL地址访问世界各个国家和地区的各种图书馆。

(3)数字图书馆提供的电子图书。数字图书馆是数字化生存时代的重要文化基础设施。用户只需通过鼠标和键盘,记载人类文明成果的图书资料就会方便地进入人们的生活。如超星数字图书馆可为读者提供35万册的PDG格式的数字图书。其会员可随时阅览到最新图书。国内可供读者阅读图书的还有中国数字图书馆、书生之家数字图书馆等。

(4)研究机构提供的电子图书。以香港中文大学中国文化研究所的“古文献资料库中心”和中国台湾的“瀚典”为代表。两网站除部分内容需付费使用外,绝大部分内容可免费在线浏览。

(5)个人或团体网站提供的电子图书。大多数文学类网站属于此类,有的以收藏为主,有的以链接为主。虽然侧重点有所不同,但大多是中外文学名著和眼下一些比较红火的图书,也包括一些网友自己的习作和文摘,一般为全部免费提供给读者阅读。

1.3 网上报纸资源

网上电子报纸时效性强、传播范围广,提供大量时事、专题、经济、政治、法律法规等方面的信息,正逐渐成为新的重要的社科信息源。据不完全统计,自1995年10月《中国贸易报》率先在网上开办电子版以来,到6月,国内已有273家报纸上网提供阅览。以《人民日报》网络版为例,它从每天凌晨0时30分到5时,将每天出版的《人民日报》、《市场报》等17种报刊的全部文字和图片上网发布,还分为“中国”、“国际”、“财经”等9个频道,每天滚动发布国内外新闻1500条,并就新闻热点制作专题。网站还设置了对报刊和频道新闻均有效的信息检索功能,读者很方便就能查到相关资料。

1.4 网上学位论文资源

(1)利用全国性的学位论文数据库提供的信息。许多国家已将学位论文数字化列为重要的项目计划,其中较具规模与成效的,例如:ETD  Digital  Library  Networked  Digital  Library  of  Theses  and  Dissertations(NDLTD)网络博硕士论文数字化图书馆计划。它是一个国际论文资源的电子图书馆计划。通过整合性检索可检索19个单位的

论文;另外更列出许多大学及研究机构博硕士论文的网址。CALIS高校学位论文(文摘)数据库,是中国高等教育文献保障系统的一个子项目,建库的目的是通过对分散在各大学中各类学科的学位文献信息的收集、整理、建库、上网,使原始的论文信息获得升值,为国内外希望获取高校学术信息的用户提供方便的查询途径,起到推动高校教学、科研交流和促进发展的作用。高校学位论文数据库收录包括北京大学、清华大学等全国著名大学在内的83个CALIS成员馆的硕士、博士学位论文,截止到5月21日,已有97所学校申请加入学位论文数据库建库工作,学位论文数据库上网数据已达到约9.7万条。

(2)利用商业出版机构或信息中介者提供的信息。目前已有商业出版机构取得授权,通过正式的出版渠道出版学位论文;有些则是委托代理商接受论文订购。如1983年成立的UMI公司,是美国学术界首屈一指的出版公司,出版物包括自1861年美国的第一本论文到目前所出版的150多万本美加地区博硕士论文,以后出版的已经有PDF形式的论文,可直接使用信用卡订购下载。通过Amazon网络书店订购学位论文,前25页可免费浏览。

(3)利用联机检索系统中的学位论文数据库。一些知名的联机检索系统中都包含大量的与学位论文有关的数据库。如Dialog系统、Questel  Qrbit系统、STN  FizKar/sruhe系统。我国的“中国优秀博硕士学位论文全文数据库”由教育部主管、清华大学主办,是中国知识基础工程(CNKl)继《中国学术期刊全文数据库》等超大型数据库建成后,又一项大规模开发利用我国知识信息资源的重大信息化工程。按照CNKI信息采集范围规定的信息源,它已收录全国有博士招生点的280多家院校的1800多个博士点和3000多个硕士点以来的博硕士学位论文5万多本。并按科学的体系进行了编辑。到20底,加入这一数据库的博硕士培养单位将达到80%以上,年6月2日的《光明日报》称该数据库是目前世界上惟一最科学、最全面的中文全文博硕士学位论文检索数据库。

(4)学术教育单位自建的学位论文数据库。有些大学或资料中心在原有图书馆馆藏目录查询系统之外建立本校的博硕士论文查询系统,部分学校除提供书目及摘要外,另有全文下载功能。如:MIT  Theses  Online麻省理工学院,收录经选择后的博硕士论文,提供论文扫描后之全文。可线上订购全文,包括:纸本、PDF档及微缩片三种形式。《上海交通大学学位论文数据库》,提供多种途径包括摘要和全文的检索能力,可以查到上海交通大学历年的博硕士论文书目资料及摘要,博士论文的全文下载仅限授权用户。

1.5 网上政府信息

政府信息是政府活动的原始记录和产物,它的发展与政府机构本身的扩充及其职能的强化有着不可分割的联系;其文献地位和使用价值也随着综合国力的增强和在国际事务中所发挥的作用,而不断上升和升值。网络政府信息的多少,已被视为一个国家民主程度的表征之一。

在网络发达的美国,据19中期统计,美国联邦政府的4300个网站和215个电脑公报牌已将政府的42个部门机构拴链为一体,在20末已将政府3/4的议事录(transaction)电子化。通过网络,可以查找美国的总统文献,如:国情咨文、经济咨文等;可以通过美国GPO  Access主页、美国国务院网站或美国国务院外交事务网等查找美国国务院的文献资料;还可通过美国商业部的国情普查局、劳动统计局、经济分析局等查找美国的统计资料。

191月22日,中国电信和国家经贸委经济信息中心联合40多家部委信息主管部门在北京召开了“政府上网工程”启动大会,要求年底60%以上的部委和政府部门在163、169网上建立正式网站,到年底则要实现80%以上部委和政府部门建立网站。据2002年7月22日中国互联网络信息中心(CNNIC)第10次中国互联网络发展状况统计报告,全国各级政府部门申请gov.cn域名的已达5864个,“政府上网”已经成为现实。

1.6 电子论坛和电子会议

因特网上设有USENET及Listserv电子论坛,也称新闻讨论小组。USENET及Listserv都是由成千上万个专题讨论小组构成。每个小组是由某一主题参与的文章所构成。USENET与Listserv类似,但是,前者范围更广泛,几乎无所不包,一般不需订购便可参与;而后者较为严肃,而且更趋学术性,通常还需订购方可参与。因特网上用户通过E-mail均可自由参与电子论坛的活动,从中可以获得用任何其他手段都难获得的第一手重要专题信息与资料。因此,它是研究人员及时了解跟踪学科动态与前沿的最有效途径之一,可消除印刷出版物时间滞后的缺点。电子论坛的另一特点是举办国际电子会议。例如,利用Listserv,一些学术团体与组织已成功举办了多次专业性的国际学术会议。参加这些会议,能了解本专业的最新研究发展动态,获取完整的会议论文与资料。

1.7 网络数据库

存储在网络服务器上的文献信息数据库称为网络数据库,多由信息服务商或大型图书情报机构创建维护,品种多,质量高,但基本上都是需要付费才能使用。访问网络数据库的形式主要有直接访问和访问镜像上的数据库两种。目前在网络上运行的著名数据库,如:Dialog系统已拥有600多个集文献信息库、数据信息库、事实信息库和全文信息库于一体的大型专业数据库系统;OCLC  Firstsearch数据库,能为用户提供包括Article  First、Contents  First、ERIC、  Fast  Doc、GPO等14个基础数据库。

1.8 网上其他社科信息

基于概率分布的风险评估方法研究 篇6

为提高分布式并行计算环境下海量空间数据管理与并行化处理的效率,基于并行空间索引机制的`研究,设计一种多层并行R树空间索引结构.该索引结构以高效率的并行空间数据划分策略为基础,以经典的并行计算方法论为依据,使其结构设计在保证能够获得较好的负载平衡性能的前提下,更适合于海量空间数据的并行化处理.以空间范围查询并行处理的系统响应时间为性能评估指标,通过实验证明并行空间索引结构具有设计合理、性能 高效的特点.

作 者:赵园春 李成名 赵春宇 ZHAO Yuan-chun LI Cheng-ming ZHAO Chun-yu 作者单位:赵园春,ZHAO Yuan-chun(山东科技大学地球信息科学与工程学院,山东,青岛,266510;中国测绘科学研究院,北京,100039)

李成名,LI Cheng-ming(中国测绘科学研究院,北京,100039)

赵春宇,ZHAO Chun-yu(武汉大学遥感信息工程学院,湖北,武汉,430079)

基于概率分布的风险评估方法研究 篇7

1 模糊概率分布理论

1.1 模糊概率的概念

传统意义上的“模糊概率”, 实际上是指“主观模糊概率”或“模糊事件的概率”。相应的风险, 称“可能性-概率风险”。换言之, 可能性-概率风险指明了风险事件以某概率值出现的可能性。模糊概率分布是二维论域上的一个模糊集, 并以概率空间为基础进行定义。

1.2 模糊期望值的概念

2 模糊概率在自然灾害的模糊风险中的应用实例

农作物病虫害是我国的主要农业灾害之一, 它具有种类多、影响大以及时常暴发成灾的特点, 其发生范围和严重程度对我国国民经济, 特别是农业生产常造成重大损失。我国农作物常见的有以下种类的病虫害:稻飞虱、白粉病、玉米螟、棉铃虫、小麦锈病、棉蚜、稻纹枯病、稻瘟病、麦蚜、麦红蜘蛛、蝗虫和麦类赤霉病等, 已成为严重影响我国农业生产的重大病虫害。我们利用病虫害中的一个例子, 说明如何用模糊概率分布来表达自然灾害模糊风险。

设mμ是所研究地区历史上最大的病虫害记录。用传统的病虫害风险分析模型可以计算出, 事实上, 这种概率永远不可能较为精确地估计出来。一般是由专家根据经验给出大概的估计。为了确定各县区的空间相互影响因子, 并将各种自然气候条件, 如:气温、气候、风向和风速等纳入到影响因子中, 构建风险分析模型, 为了方便计算, 专家们常常给出诸如“受风向因素影响的概率中等”, “受光照因素影响的概率很大”这样一些模糊估计。如果对各种影响因素的概率都只能进行模糊估计, 相应的模糊集的全体, 就是一个模糊概率分布。

假定专家们给出了下面的模糊估计:“受光照因素影响的概率很大”;“受温度因素影响的概率大”;“受湿度因素影响的概率中等”;“受风向因素影响的概率小;“受天敌数量因素影响的概率很小”;“受人工管理因素影响的概率非常小”。假定“大”、“中等”和“小”是概率论域P={P1, P2, P3, P4, P5, P6}={0, 0.001, 0.01, 0.1, 0.5, 1}上的模糊概念, 并定义为

此处的a/b, a是隶属度, b是概率值。使用集中算子ucos (A) (P) = (uA (P) ) 2, 我们得

很大= (大) 2=0.04/0.1+0.64/0.5+1/1,

很小= (小) 2=1/0+0.64/0.001+0.04/0.0l,

非常小= (很小) 2=1/0+0.41/0.001。

在这种情况下, 所研究病虫害受各因素影响风险可以用表1所示的模糊概率分布表达。

注:mi为各个因素;Pi为概率值;πm (P) 为m发生的概率是P的可能性。

一般情况下, 不同的专家对同一个地区进行研究。往往给出不同的模糊概率分布, 可靠程度如何, 很难断定。如果用某种数学模型, 根据一些资料计算出一个模期概率分布, 则其可靠程度如何不仅与资料的可靠性有关, 而且与采用的数学模型有关。

下面, 我们用公式计算表1给出的模糊概率分布πx (P) 的期望值。E。

首先, 我们分别计算πx (P) 关于x1, x2, …, x6的重心。此处的x1, x2, …, x6是表1中的m1, m2, …, m6。对于给定的离散分布, 我们将原公式改写成:

通过计算, 我们得到

例如,

归一化平均概率分布, 得

例如

因此, 表1给出的模糊概率分布πx (P) 的期望值是

3 结论和讨论

用模糊概率来分析自然灾害的模糊风险, 求出模糊概率分布的期望值, 与给定的期望值进行对比, 能判定自然灾害发生的概率, 从而起到预防灾害发生的作用。它具有很强的解释性, 操作容易, 为建立风险评估模型带来了方便。在计算机模拟试验中, 我们必须对风险模型的稳定性和实用性进行鉴别, 用给出的有限的样本数据计算出的期望值进行计算, 得出在模拟仿真中需要的指标数据, 并具有可靠性。

参考文献

[1]吴从昕, 马明.模糊分析学基础[M].北京:国防工业出版社, 2011.

[2]姚敏著.计算机模糊信息处理[M].上海:上海科学技术文献出版社, 2011.

[3]胡宝清.模糊理论基础[M].武汉:武汉大学出版社, 2011.

[4]王新洲, 史文中, 王树良.模糊空间信息处理[M].武汉:武汉大学出版社, 2009.

[5]王树良.模糊事件的概率测度熵[D].兰州:甘肃工业大学, 2009.

[6]史文中.事件的模糊概率的确定方法[D].兰州:甘肃工业大学, 2009.

[7]黄崇福, 王家鼎.模糊信息分析与应用[M].北京:北京师范大学出版社, 2010.

基于概率分布的风险评估方法研究 篇8

关键词: Excel 生物统计学 二项分布的概率

1.引言

生物统计学是研究数据资料的收集、整理、分析、解释的一门科学[1],也是畜牧、兽医、农学、微生物、医学等领域中不可缺少的统计工具,越来越多的数据分析离不开生物统计学原理。随着计算机技术的发展,已经有更多软件或操作系统被应用于生物统计学,如Excel[2],SAS[3],SPSS[4]等,但是不同统计软件具有不同的统计特点,如Excel统计功能更为简单,适合生物统计学的初学者。SAS统计功能比较宽广些,因其里面统计模块的限制,所以更适合自己编写程序的学者。SPSS的统计功能更为强大,几乎具备了所有统计分析功能,操作相对简单、直观。

2.二项分布

虽然从统计分析来看,SAS和SPSS的统计分析功能略胜于Excel,但是Excel具有其独特的地方,如对一些常用分布的概率计算来说Excel显得简单多了。二项分布是最常见的离散性随机变量的概率分布,核心定义为每次实验只能有两种可能结果。对于二项分布的手动计算公式[1]:

3 利用Excel对二项分布的概率计算

虽然二项分布的概率手动也能计算,但是比较费时费力,因此我们借助Excel计算二项分布的概率就比较简单。例2:已知某种病猪的死亡率为30%,现在有10头病猪,如果不给治疗,问死4头的概率是多少?和死4头及4头以下的概率是多少?

(1)死4头的概率:Excel中选定空格—插入f函数统计BINOMDIST:在其对话框中从上依次输入4,10,0.3,false,具体见图1,其概率为0.2001。

(2)死4头及4头以下的概率:Excel中,选定空格—插入f函数统计BINOMDIST:在其对话框中从上依次输入(4,10,0.3,true),具体见图2,其概率为0.8497。

4.注意问题

在本次教学改革与实践中,已经把各种分布的概率计算纳入《生物统计学》实践教学中,一方面可以让学生针对不同数据清楚其分布类型,针对不同分布类型选用不同Excel函数模块,可以说将课本上所学知识很好地应用于实践数据分析。本文介绍的是二项分布,只有二项分布的概率计算才适用Excel中的BINOMDIST统计函数模块,如果是其他分布的概率计算需要另选其他模块。

参考文献:

[1]张勤.生物统计学.中国农业大学出版社,北京,2009.

[2]王香萍,王文凯,李俊凯,等.EXCEL中关于生物统计中两组平均数的应用方法及探讨.考试周刊,2011,6:180-181.

[3]白俊艳,徐廷生,张小辉.生物统计附试验设计课程考核方式的改革与实践.教育教学论坛,2015,18:247-248.

基于概率分布的风险评估方法研究 篇9

Java RMI主要是指Java实现远程方法的调用,并且基于Java RMI的计算机能够将Java作为根本对象,为系统编程提供简单与直接的环境。Java RMI作为Java语言中的一个调用方法,属于Java,这也就随之产生了关于Java编程语言的安全性以及跨平台性的`内容,并将这两个特性应用在Java RMI的分布式数据库系统的设计当中,对系统的研究与应用具有重要的推动作用。

2.2 Java RMI特征分析

(1)Java RMI具有面对对象的基本属性,能够在Java编程的过程中对其中涉及的代码进行重用,并且这一基本属性也是现代应用领域当中的重要编程技术,在减轻系统运行负担的同时,能够提升系统灵活性。

(2)RMI能够为分布式面向对象计算机提供一个简单直接的环境,并且RMI内部的体系构架也是基于系统内容进行构建,并且在结构的应用过程中需要进行充分的扩展,保证RMI能够添加功能。

(3)RMI具有可移动属性,从而可以实现移动机与服务器之间的互联。

(4)安全机制明显提升,基于Java的RMI具备更好的安全性能,能够保证在分布式数据库系统建设的过程中下载执行模块时保证用户的安全性。

(5)基于Java的RMI,通过使用Java进行编程,能够保证编程工作更加便利,并且由于RMI程序运行过程中较为简单,使得整个程序系统维护过程更加便捷。

3 Java RMI在客户机当中的实现

对于客户端的程序开发之后,首先需要基于Java RMI建立服务器对象,在建立服务器对象之后,客户程序的相应内容可以在主机当中的客户表当中寻找对Java远程对象的调用。但保证该程序能够得到实现的前提是将应用程序转换成为远程接口的类型,在RMI的运行过程中,能够实现客户程序与接口之间的不断交换,不影响对象之间的交换关系。

同时,在客户机方面的运行,需要通过具体程序编写得到实现,在得到与远程接口交换权利的同时,在数据连接池方面实现与数据库的连接,保证对数据库的操作。通过对RMI对象进行重用,能够实现对数据库的重用,利用数据库系统的连接池,提升数据库方面的访问效率。在企业方面,可以应用Java RMI的分布式数据库系统,并且随着Java的扩展而提升企业的经济效益。如企业系统程序当中的一部分程序内容实现通过Java进行编程,通过应用Java RMI可以将Java当中的特性将现有的Java转移到新的应用程序当中,通过此种应用优势,能够保证将Java的充分优势进行发挥[3]。

4 结论

基于概率分布的风险评估方法研究 篇10

关键词:PPP项目,贝叶斯网络,风险概率评估,甘肃特色

1 研究背景

PPP模式, 也称公私合营模式, 是一种新型的项目融资方式, 它是由政府或公共部门与私人部门基于特定项目进行合作的模式, 常应用于公共基础设施建设项目中[1]。首先, PPP模式可以避免政府因为对基础设施建设投入过多的资金而产生的债务危机;其次, 可以充分利用私人企业的商业高效率, 摆脱了由政府主导的基础设施建设的低效率困扰;最后, PPP模式的引进, 促进了政府和地方企业的技术交流, 可以使双方都获益[2]。

随着经济的全球化, 我国应用PPP模式进行基础设施建设取得了很大的进展, 如20世纪80年代的深圳沙角B电厂, 20世纪90年代成都的自来水厂, 广西来宾B电厂等。甘肃省地处西北, 基础设施明显建设滞后于经济建设和社会发展的要求且建设资金短缺, PPP模式为改善这种现状提供了一个很好的途径[3]。但是, 由于甘肃省自身具有很多方面的不足, 导致开展PPP项目的建设存在一些难以避免的风险, 目前甘肃省与其他发达省份相比PPP项目的开展还相对滞后, 故对甘肃省政府开展PPP项目进行风险研究并采取合理的方式规避或解决, 对于加强PPP项目的推广具有很重要的实际意义。

本研究基于贝叶斯网络方法, 对PPP项目全过程中可能对项目成败产生影响的主要风险因素进行归纳分类, 并对各类风险发生的概率进行排序, 并针对发生概率较高的风险提出合理建议。

2 研究方法

研究方法实施步骤如下所示:

整体来讲, 贝叶斯网络是先研究某一般事件的风险概率情况, 再通过结合特殊环境下的各风险因素发生的条件概率, 通过贝叶斯概率计算出特殊环境下该事件的风险概率情况。即通过先验概率, 结合后期调查计算出后验概率的过程。

首先, 通过查阅相关文献, 找到在一般情况下的某事件存在的风险因素, 进行整理分类, 根据风险事件和风险因素之间的“父子”关系构件贝叶斯网络图。设计调查问卷, 问卷采取模糊综分析法描述的形式, 如表1所示, 向专家咨询各风险因素发生的概率, 对答卷者选择的选项所代表的概率范围取中值, 明确各节点之间的逻辑关系, 构建各子节点的CPT。将调查所得的数据导入贝叶斯网络图, 得到各风险状态下风险事件发生的概率, 并将结果反馈给专家检验其合理性和准确性, 并根据专家意见做出修正, 此时得到的结果为先验概率。

其次, 分析在特殊环境下该事件面临的特殊情况, 构件条件概率表, 如表2所示, 该表描述在第一列的特殊情况下第一行的风险因素发生的可能性。假设有k种特殊环境ak (k=1, 2, …) , 由于a1, a2, …, ak之间相互独立, 则风险因素b1发生的概率为

P (b1) 即为一般情况下风险因素b1发生的概率, 将计算得出的根节点发生的概率导入贝叶斯网络, 分别计算出各风险状态下风险事件发生的概率, 此时得到的概率为后验概率。

最后, 将在该特殊环境下的风险状态对风险事件影响的大小进行排序, 找出概率最大的风险状态, 并根据实际情况提出合理建议, 减少风险事件发生的概率。

3 研究方法实际运用

本文将该研究方法应用于对甘肃省政府开展PPP项目进行风险评估, 希望可以使推进甘肃省PPP项目的建设更加顺利的进行。

3.1 构建PPP项目的贝叶斯网络

通过阅读大量PPP项目风险类相关文献[7,8,9,10,11], 总结了14种影响项目成败的主要风险因素, 如表2所示, 本文要站在政府的角度研究10种非政府因素对项目成败的影响。然后通过与5位相关专业老师的讨论, 构建PPP项目的风险贝叶斯网络图。

3.2 构建各子节点的CPT和各风险因素发生的平均概率表

经过分析, 子节点“市场和社会环境方面”, “开发商方面”, “国家宏观调控方面”, “不可抗力”均为“或”节点, 而“项目失败”为“综合”节点。对于“项目失败”节点需要通过对专家进行调查问卷。调查对象是至少有3年以上的PPP相关研究经验的在校工程管理专业大学本科教师。此次问卷共有5人参与, 答卷有效率为100%, 得到如表3所示的条件概率表。

为了得到一般情况下的PPP项目主要风险因素发生的概率, 本研究总结了大量相关文献的数据[7,8,9,10,11], 并未发现争议较大的风险因素, 故历史数据可以作为本研究使用, 具体见表4。

3.3 通过贝叶斯网络进行平均风险概率水平评估

将表3和表4中的数据输入贝叶斯网络中, 通过Netica软件的计算分别得到市场和社会环境方面、开发商方面、国家宏观调控方面、不可抗力方面这四种类型的风险事件导致项目失败的概率, 如图1至图4所示。这里得到的先验概率不针对特定省份, 是一个平均值。

将四种类型的风险事件导致项目失败的概率进行排序, 得到结果如表5所示, 可以得出结论, 在一般情况下, 最有可能导致项目失败的是市场和社会环境, 其次是开发商和国家宏观调控最后才是不可抗力。

3.4 特定省份PPP项目风险概率水平评估

本研究针对的是甘肃省这个特殊省份, 通过对以往研究[12,13]的分析与总结, 得出甘肃省与其他发达省份相比, 政府担保和制定政策方面的缺失、法律体系和金融体系方面的不足、收入保证与收费的批准存在问题、审批体系存在问题和专业机构和专业人员力量不足, 对风险因素的发生概率具有一定的影响。因此在进行风险评估时需要把这五个特点考虑进去, 对专家进行问卷调查的结果如表6所示, 调查对象同表3。该条件概率表描述在第一列条件的影响下各风险因素发生的可能性。

根据表4和表6计算出甘肃省PPP项目各风险因素发生的概率, 如表7所示。

将表7中数据导入贝叶斯网络, 计算可得出甘肃省除政府外各风险事件导致PPP项目失败的概率, 此为后验概率。结果如表8所示。

通过评估结果可以看出, 市场和社会环境对项目的失败影响最大, 其次是开发商和国家宏观调控, 最后是不可抗力。

4 结论与建议

概率统计分布对股票管理分析研究 篇11

关键词:概率统计分布,股票管理,分析

0 引言

概率论研究随机现象的统计规律性, 它在社会经济活动中有着广泛的应用,最常见的是出现于自然科学、工程技术、社会科学、军事和工农业生产中,包含两方面的内容:试验设计与统计推断,数理统计研究样本数据的搜集、整理、分析和推断各种方法。

概率在投资风险方面:几乎所有的投资都是在风险和不确定情况下进行的,在投资环境日趋复杂的现代社会,风险是某一行动的结果具有多样性。一般地说,投资者都讨厌风险并力求回避风险。风险是客观存在的,正视风险并将风险程度予以量化,它广泛影响着企业的财务和经营活动,同时这也成为企业财务管理中的一项重要工作。

在投资活动中,由于投资收益状况的好坏不是投资者所能够决定的,同时投资的收益状况将最终决定整个经营活动的成败,可以用概率统计的原理分析,投资收益状况是一个随机现象,它的好坏是一个“不可控”的过程。

1 三种概率统计分布

1.1 泊松分布。

单位时间内光顾股票的投资者数X是一个随机变量,X服从参数为λ的泊松分布,即X~P(λ),其中参数为λ(λ>0)为随机变量X的数学期望:E (X)=λ。泊松分布的概率分布表达式为:

1.2 二项分布。

设光顾的投资者数为n,则n个人中购买股票的人数y也是一个随机变量,y服从参数为n, p的二项分布,即y~B (n, p),其中p为每个人购物的概率(0<p<1)。二次分布的概率分布表达式为:

1.3 正态分布。

每个投资者在每次购买股票活动中,所花费的金额Z是一个随机变量,Z服从参数为μ,σ2的正态分布,即Z~N(μ,σ2)。其中,μ为Z的数学期望,σ2为方差,即E (Z)=μ,D (Z)=σ2。正态分布的概率密度函数为:

2 三种统计分布的关系

以上分别阐释了三个问题和分布的情况,由于三者之间是相互联系的,因此,可以把它们综合起来进行分析。

由二项分布知,当光顾投资者数为n时,其中的购买股票的人数y服从二项分布B (n, p)。有多少人是随机的,故将泊松分布、二项分布结合起来考虑:设单位时间内光顾的投资者数为X,则X服从泊松分布p(λ),再设光顾的用户购买股票的概率为p,则单位时间内购买股票人数y服从参数为λp的泊松分布,即y~p(λp)。其理由是:设事件Ak=“x=k”=“单位时间内光顾的投资者数为k” (k=0, 1, 2,…)及Bm=“单位时间内购买股票的人数为m” (m=0, 1, 2,…),则由概率统计理论得出:

小结:y服从p(λp),单位时间内光顾的顾客中购物平均购买股票的人数为E (y)=p。由正态分布知,每人购买股票货币款的均值为E (z)=μ,单位时间内光顾的用户购买股票总金额的均值为:w=λpμ元。

3 应用分析

λ、p、μ的具体取值由抽样调查进行分析,它们的极大似然估计量都是,其原始样本资料(x1, x2,…,xn)是分别由不同的调查对象得到的:计算的样本(x1, x2,…,xn)是对某n个单位时间内,每单位时间光顾的投资者数的观察统计值。p的样本(x1, x2,…,xn)是对某n个购买股票与否的观察记录值(i的每个值仅取0或1中的一个)。μ的样本(x1, x2,…,xn)是对来光顾的投资者的某n个人购买股票金额数的观察统计值(其中xi是第i人的购买股票金额,i=1, 2, 3,…,n)。

例如:对某股票市场的经营情况进行统计调查,连续观察了30天到股票市场的人数,求得λ为1500人,对进股市的10000人进行统计调查,得实际购买股票人均额μ=120元,则由此可估计出该股市平均单位时间的销售总额为:w=λpμ=1500×0.38×120=68400(元)。

4 销售偏差率

“销售偏差率”是指过去一段时段内,股市平均单位时间的销售总额相对于月平均预收入总额的偏差幅度大小。销售收入单位时间内收益总额波动越大,那么它的销售偏差率也越大。

例如先锋基金第三季度报告中,销售偏差率为0.67%,比基准收益标准低0.32%。这说明先锋基金在第三季度的投资业绩,与业绩比较基准相比,收益性较好, 而风险较低。这里定义销售偏差率为:

其中,u表示月平均统计调查的人数,v表示预测统计调查人中购买股票货币款的均值。

5 计算机仿真模拟

通过统计数据,从购买股票人均额变化和购买股票人数变化两因素变化对销售偏差率的影响来模拟仿真。

(1)购买股票人均额因素方面。取λ=1500, 100燮μ燮140, u=10000, y=130(预测),p=0.38,用MATLAB软件计算机进行模拟,其结果如图1所示。

(2)购买股票人数因素方面。取1400燮λ燮1600, 120=μ,u=10000, v=130(预测),p=0.38,用MATLAB软件计算机进行模拟,其结果如图2所示。

6 结论

通过图5—1和图5—2两个图对比,可知购买股票人均额对销售偏差率的影响幅度较大,说明购买股票人均额对销售股票的控制力较大。因此,在管理股票销售过程中,应尽量控制股价稳定,避免不必要的股市震荡以及出现短期经济萧条现象。

参考文献

[1]傅祖芸.信息论——基础理论与应用[M].北京:电子工业出版社, 2001:15-27.

[2]李林曙, 施光燕.概率论与数理统计[M].北京:中央广播电视大学出版社, 2002:45-56.

[3]唐昌建.Matlab编程基础及应用[M].成都:四川大学网络教育学院, 2007:46-51.

基于概率分布的风险评估方法研究 篇12

随着经济的飞速发展, 能源问题已经成为人类面临的最严峻问题之一。风能作为清洁可再生能源具有储量巨大、分布广泛且无污染等优点, 使得风力发电技术成为目前重要的研究方向之一[1]。而风电接入改变了传统电力系统的结构参数, 产生了一些新的问题。

风电接入电力系统后的电压稳定一直是专家关注的难题, 因此研究接入风电场后的电力系统静态电压稳定问题是十分必要的。传统的电压稳定分析大多基于确定性模型, 而风电的加入使系统模型中节点注入功率具有不确定性。为了解决确定性分析方法无法考虑随机因素影响的问题, 研究人员提出了基于概率的电压稳定分析方法。

常用的概率分析方法主要有:蒙特卡洛法、解析法、近似法等。蒙特卡洛法[2,3,4]通过大量反复抽样仿真来模拟电压稳定分析中节点功率、设备故障等不确定情况, 但仿真次数较多、耗时较长;解析法[2,5,6,7]是采用数学假设对所研究问题进行线性化处理, 计算效率较高, 其中半不变量法应用较多;近似法[2,8,9]是根据已知随机变量的概率分布, 采用近似公式求取待求变量的统计特性, 其中以点估计法和一次二阶矩法为代表。以上这些概率分析方法均是在假定了不确定参数的概率统计特征的前提下再进行仿真计算, 而不确定参数概率统计特征的准确性会从根本上影响计算的结果。

本文提出对不确定参数进行模糊模拟的可信性电压稳定概率评估方法。该方法不需要假定不确定参数的分布函数类型和参数, 就可以对大规模风电并网后的电力系统静态电压稳定问题进行分析。

1 可信性理论

在电力系统这个复杂的物理系统中, 许多问题同时包含了随机性与模糊性2类不确定因素, 应进行综合性评估。而公理化的模糊性与随机性的综合评估方法就被称为可信性理论[10]。可信性理论是2004年基础数学领域完成的数学分支, 它给出了基于测度论的模糊论的公理化体系, 并提供了随机性与模糊性综合评估的严格数学基础。

下面对可信性理论中的一些基本概念进行简要说明。

给定一个论域Γ, P (Γ) 是Γ的幂集, Pos是一个定义在P (Γ) 上的集函数, 被称为一个可能性测度。若满足下面的2个条件, 则称三元组 (Γ, P (Γ) , Pos) 为可能性空间。

b.对于任意的P (Γ) 的子集 其中I是任意的指标集, 有

基于可能性测度, 文献[11]定义了自对偶集函数Cr如下。

定义1设三元组 (Γ, P (Γ) , Pos) 是一个可能性空间。若定义集函数Cr为:

则称Cr为事件A的可信性测度。其中, A′是集合A的补集。

三元组 (Γ, P (Γ) , Cr) 称为可信性空间[12]。

定义2[12]设三元组 (Γ, P (Γ) , Cr) 是可信性空间。若ξ= (ξ1, ξ2, …, ξn) 是从Γ到实数空间Rn上的集函数, 则称ξ是定义在可信性空间上的模糊向量。特别地, 当n=1时, ξ称为模糊变量。

定义3[13]设ξ1、ξ2、…、ξn是定义在可信性空间 (Γ, P (Γ) , Cr) 上的模糊变量。若对于P上的任意子集B1、B2、…、Bn满足:

则认为模糊变量ξ1、ξ2、…、ξn相互独立。其中, γ表示设定的某一事件。

在可信性测度基础上, 文献[11]给出了模糊变量期望值算子的定义。若满足:

minΔ0乙∞Cr{ξi≥r}dr, 乙0-∞Cr{ξi≤r}drΔ<∞ (3)

则模糊变量ξi的期望值可以定义为式 (4) 所示。

并且, 若满足:

maxΔ0乙∞Cr{ξi≥r}dr, 乙0-∞Cr{ξi≤r}drΔ<∞ (5)

则称模糊变量ξi的期望值是有限的。

参考文献[14], 设ξ是三角模糊变量 (-1, 2, 3) , 计算ξ的期望E[ξ]。

对于任意的0≤r<2, 有:

对于任意的2≤r<3, 有:

对于任意的-1≤r<0, 有:

由模糊变量ξ的期望值定义可得:

由以上的计算过程可得, 对于一般的三角模糊变量、梯形模糊变量的期望值, 有如下的结论:

a.若ξ是三角模糊变量 (r1, r2, r3) , 则ξ的期望值是

b.若ξ是梯形模糊变量 (r1, r2, r3, r4) , 则ξ的期望值是

引理1[15]若ξ、η是定义在可能性空间 (Γ, P (Γ) , Pos) 上期望值有限且相互独立的模糊变量, 则对于任意的实数a和b, 有E[aξ+bη]=a E[ξ]+b E[η]。

可信性理论的相关内容可以参阅文献[12, 16]。

2 基于可信性理论的电压稳定概率评估

2.1 灵敏度分析法

电力系统静态电压稳定分析方法有很多, 其中灵敏度分析法物理概念明确, 计算简单, 易于实现, 在潮流计算的基础上, 只需少量的额外计算, 便能得到所需的指标, 在电压稳定分析研究中得到了广泛的应用[17]。

线性化静态系统功率-电压方程可以表示为:

其中, ΔP为有功注入增量;ΔQ为无功注入增量;JPθ、JP U、JQθ、JQ U为极坐标下雅可比矩阵J的分块矩阵;Δθ为电压相角增量;ΔU为电压幅值增量。

一般而言, 系统的有功和无功变化都会影响系统的电压稳定性, 而因为支路的电抗远大于支路的电阻, 所以母线电压对无功注入Q的变化比对有功注入P的变化更为敏感。为简化计算, 在每个运行点上只考虑Q和U之间的关系[18]。令式 (10) 中ΔP=0, 可得:

其中, JR=JQU-JQθJPθ-1JPU, 称为降阶雅可比矩阵, 它反映了母线电压值的变化ΔU与无功注入的变化ΔQ间的线性关系。

JR矩阵中的第i个对角元素是节点i的U-Q灵敏度[19]。若JR矩阵的对角元素全为正且不是无穷大, 则系统是电压稳定的;若JR矩阵的对角元素不全为正, 则系统是电压不稳定的。

2.2 静态电压稳定可信性指标

可信性理论在电力系统中已得到初步应用[20]。接入风电场的电力系统, 其风速的不确定性影响了静态电压稳定分析结果的准确性。本文针对风速不确定性, 将可信性理论应用到大规模风电并网后的的电力系统的静态电压稳定分析中。

根据灵敏度分析方法, 应用可信性理论, 可建立在可信性意义下各个节点电压的稳定指标:

其中, ξ为风速, f (ξ) 为该风速下JR矩阵的对角元素, 风速ξ即为本文设定的模糊向量。该静态电压稳定指标表示在可能出现的风速为ξ情况下, JR矩阵的各个对角元素f (ξ) 大于0且小于无穷大的可能性为L。L的取值范围为0~1, 反映了不确定因素时JR矩阵对角元素的分布情况;L的值越大, 表明对应节点的电压稳定性越好;反之表明对应节点的电压稳定性越差。若L=1, 表示JR矩阵对角元素一定大于0。若系统中各个节点的L都为1, 说明整个系统具有较好的静态电压稳定性。

2.3 基于可信性理论的电压静态稳定分析计算步骤

对于接入风电场的电力系统, 设其风速为不确定参数, 则JR矩阵的对角元素即可表示为风速的函数。基于可信性理论的静态电压稳定性分析的步骤如图1所示[21]。图中, “∧”表示取小运算;“∨”表示取大运算;σ为连续取样后各个相对时刻的离散风速值;σ (θk) 为θk时刻的风速离散值;ξ为风速连续值;rr为对角元素最大值与最小值之间的一个任意数。

3 算例分析

3.1 IEEE 14节点系统

本文采用的第一个算例是对IEEE 14节点系统进行修改, 在节点1接入一个等值风电机组, 该等值风电机组代表一个30台额定有功功率为2 MW的双馈感应风电机组的风电场 (见图2) , 其中C表示无功补偿设备。根据接入风电场的电力系统运行的实际情况, 风速具有极大不确定性, 将风速设定为不确定参数, 根据风速预测结果, 确定其区间数形式。根据经验值, 无穷大取999[19]。采用MATLAB和PSAT电力系统分析软件进行静态电压稳定分析。

3.1.1 不同模糊隶属度函数对静态电压稳定分析的影响

分别采用三角隶属度函数和梯形隶属度函数来表征模糊数的分布, 并计算在上述2种隶属度函数假设下的对角元素的期望值和均方差, 以及各节点的电压稳定指标。

表1给出了采用三角隶属度函数和梯形隶属度函数计算得到的基于可信性理论的JR矩阵对角元素期望值、均方差和各节点电压稳定的可信性指标。由于节点1连接了一台表示风电场的等值风机, 而风速的变化使节点1的电压稳定性较其他节点略低些。节点1的电压稳定可信性指标值分别为0.672和0.678, 略小于其他节点的电压稳定可信性指标值, 这与实际运行是吻合的。从表1中可以看出, 采用不同的隶属度函数计算所得的对角元素期望值、均方差和电压稳定可信性指标相差很小, 可以忽略。因此, 采用不同隶属度函数对计算结果的影响不大。

3.1.2 抽样次数对结果的影响

为研究抽样次数对计算结果的影响, 以三角隶属度函数为例, 分别对该算例进行了9次、90次、900次抽样计算。表2—4分别给出了不同抽样次数计算所得的JR矩阵对角元素期望值、均方差及各节点电压稳定可信性指标。

显然, 抽样次数越多, 均方差越小, 即计算结果的精度越高。但也发现, 对于该算例, 抽样次数达到90次时已经与抽样900次时的计算结果基本相等, 所以抽样次数可根据系统规模和计算精度进行选取。

3.1.3 与其他方法计算结果的对比

为验证本文方法的有效性, 将本文方法与两点估计法、蒙特卡洛法的结果进行了对比。其中, 基于可信性理论方法选用三角隶属度函数表征, 抽样90次;两点估计法采用正态分布表征不确定参数风速的分布;蒙特卡洛法进行900次仿真计算。图3—5分别给出了应用本文方法、两点估计法和蒙特卡洛法进行仿真得到的JR矩阵对角元素特征根期望值、均方差及各节点的电压稳定可信性指标的对比结果。

从图3、图4中可以看出, 可信性理论法与蒙特卡洛法计算所得的JR矩阵对角元素期望值和均方差都非常接近。一般认为蒙特卡洛法是较接近实际的[22], 所以认为可信性理论较两点估计法更接近实际结果。观察图5中3种方法得到的各节点电压稳定可信性指标可知:对于节点1的可信性指标, 蒙特卡洛法和可信性理论得到稳定指标分别为0.672和0.658, 而两点估计法得到的稳定指标为0.751, 与其他2种方法相差较远, 结果偏乐观。

蒙特卡洛法需要通过大量反复抽样, 对抽样值分别进行仿真计算, 工作量大, 对于实际电力系统而言不可行, 而两点估计法虽然计算量最小, 但其不确定参数分布类型的假设对结果的影响较大 (见表5) 。表5为分别以正态分布和Weibull分布表示风速分布时得到的JR矩阵对角元素期望值、均方差和可信性指标。而在2.1节所述可信性理论中采用不同隶属度函数表征风速时对结果的分布影响较小。因此, 可信性理论法较两点估计法能得到更为稳定的计算结果。

3.2 IEEE 30节点系统

本文采用的第二个算例是对IEEE 30节点系统进行修改, 在节点3、9、12分别接入双馈等值风电机组、异步风电机组和永磁风电机组。这3个等值风电机组分别代表由30台额定有功功率为2 MW的双馈感应风电机组组成的风电场、30台额定有功功率为1.5 MW的异步风电机组组成的风电场和30台额定有功功率为2 MW的永磁同步发电机组组成的风电场。

表6给出了采用三角隶属度函数和梯形隶属度函数计算得到的基于可信性理论的JR矩阵对角元素期望值、均方差和各节点电压稳定可信性指标。其中, 连接了等值风机组的节点3、9、12的电压稳定可信性指标由于风速的不确定性影响较其他节点略低些, 这与IEEE 14节点系统的仿真结果相同, 与实际运行是吻合的。通过对表1和表6中的各节点电压稳定可信性指标对比, 可以看出随着系统规模的扩大和接入风电场容量的增加, 整个系统的电压稳定性得到了提高。从表6中可以看出, 采用不同的隶属度函数计算所得的对角元素期望值、均方差和电压稳定可信性指标相差很小, 所以采用不同隶属度函数对计算结果的影响不大。

为验证本文提出方法的有效性, 同样将IEEE 30节点系统的仿真结果分别与两点估计法、蒙特卡洛法的结果进行对比。其中, 基于可信性理论方法选用三角隶属度函数表征, 抽样90次;两点估计法采用正态分布表征不确定参数风速的分布;蒙特卡洛法进行900次仿真计算。图6、图7分别给出了应用本文方法、两点估计法和蒙特卡洛法进行仿真得到的JR矩阵对角元素特征根期望值、均方差及各节点电压稳定可信性指标的对比结果。

从图6、7中可以看出, 可信性理论法与蒙特卡洛法计算所得的JR矩阵对角元素期望值和均方差都非常接近, 而两点估计法计算所得的结果较上述2种方法有较大偏差。这与IEEE 14节点系统的结果相同, 所以认为可信性理论较两点估计法更接近实际结果。

4 结论

上一篇:各类“会员卡”腐败档案:隐秘性强 缺乏监管下一篇:【精华】委托代理协议书