随机变量函数

2024-11-05

随机变量函数(共10篇)

随机变量函数 篇1

一引言

求二维随机变量函数的密度函数是概率论中的一个重要内容, 由于变量分布的差异性, 如何求又是一个难题, 一般没有统一的公式可循。一般教材中介绍了常用的方法, 即先求分布函数, 然后对分布函数求导就得密度函数, 但计算比较麻烦, 学生掌握困难很大。变量变换法和增补变量法相对于常用方法而言, 计算过程更加简捷。其中变量变换法许多学者都有研究, 而增补变量法甚少提及, 总结多年教学经验发现, 学生难以掌握这部分内容的精髓, 运用起来容易犯错, 特别表现在确定被积函数的积分区域上, 本文针对这个问题理清了一个简单通用的确定方法。

二增补变量法

增补变量法实质上是变量变换法的一种应用:为了求出二维连续随机变量 (X, Y) 的函数Z=g (X, Y) 的密度函数, 增补一个新的随机变量V=h (X, Y) 。先用变量变换法求出 (Z, V) 的联合密度函数pZV (z, v) , 再对pZV (z, v) 关于v积分, 从而得到关于Z的边际密度函数pZ (z) 。

问题: (1) 如何增补新随机变量? (2) 如何确定p (z, v) 中v的积分区域?

第二个问题, (Z, V) 的联合密度函数pZV (z, v) 的解析式中只含有z和v两个量, 对v积分时, 积分上下限一定是关于z的表达式。在二维连续随机变量 (X, Y) 的联合密度函数pXY (x, y) 的非零区域里, 画出函数Z=g (X, Y) 的曲线, 用曲线与非零区域相交点确定积分的上下限。

解:本例题作为示范题, 先记V=Y求出Z=X+Y的密度函数, 再换V=X用同样的方法求出Z=X+Y的密度函数, 如果两次求出的密度函数相同, 即验证方法的正确性。

由例题可以看出, 只要掌握了增补变量和确定积分区域的技巧, 增补变量法是一个极易掌握而且便于计算的方法。

增补变量法将比较难求的多维连续随机变量函数的密度函数, 转化为求变换后的两个变量的联合密度函数, 然后利用联合密度函数与边际密度函数之间的关系, 积分求出要求的变量的密度函数。相对于常用方法, 可简化运算。

摘要:二维连续随机变量函数的密度函数的计算是概率论教学中的一个重点, 更是一个难点, 其中增补变量法是一个简洁明了易掌握的方法, 但学生不能准确确定联合密度函数的积分区域, 本文针对这个问题给出了确定积分区域的方法。

关键词:连续随机变量,密度函数,增补变量法

参考文献

[1]茆诗松、程依明、濮晓龙编著.概率论与数理统计教程 (第二版) [M].北京:高等教育出版社, 2011:169~171

[2]王凡彬、严雳.多维随机变量函数密度的求解方法[J].内江师范学院学报, 2012 (10) :17~19

[3]余本国.一般二维连续型随机变量函数分布的讨论[J].华北工学院学报, 2004 (2) :94~96

[4]李思齐、李昌兴、柳晓燕.二维连续型随机变量函数的分布密度的计算[J].大学数学, 2011 (5) :162~166

[5]唐兴芸、罗明燕.二维连续型随机变量函数的分布密度[J].黔南民族师范学院学报, 2012 (2) :112~115

随机变量函数 篇2

关键词:函数 随机变量 分布函数

中图分类号:O211.6文献标识码:A文章编号:1674-098X(2011)02(b)-0134-01

在实际生活中,我们经常对随机变量的取值落在某个区间的概率感兴趣,因而我们引入了随机变量的分布函数的概念。随机变量的分布函数是一个普通的函数,它完整的描述了随机变量的统计规律,通过它,人们就可以利用数学分析的方法来全面的研究随机变量。

设为一个随机变量,定义

,,

称之为随机变量的分布函数。

显然分布函数有如下的性质,

(1)。

(2)。

(3)是右连续的。

这三条性质中,前两天学生很容易理解,对于第三条性质学生容易感到迷惑,我们可以通过一个实例来让学生从直观上感受一下它的连续性。

例1:设为一个离散型随机变量,其分布律为:

,,。

则易知其分布函数为:

显然在)上是右连续的。

通过这个例子我们可以看出随机变量的分布函数并不总是连续的,而只能是右连续的,那么它右连续的严格证明是什么了,很多学生希望能够也了解它的证明过程,虽然在其证明过程中用到了一点测度论的知识,但通过证明有助于学生加深对随机变量函数的认识,以及对测度论的学习是有帮助的。

定理1:设为一个随机变量,其分布函数为,,则在)上是右连续的。

证明:任取,取显然递减,且。记,显然是递减集列,有

从而

故在点右连续,从而在上右连续。

如果定义随机变量的分布函数为,,类似的可以证明其在上是左连续的。

定理2:设为一个随机变量,若定义其分布函数为,,则在)上是右连续的。

证明:任取,取显然递增,且。记,显然是递增集列,有

从而

故在点左连续,从而在上左连续。

对于连续性随机变量其分布函数不仅是有连续的,而且我们可以证明其分布函数是连续的,即

定理3:设为一个连续型随机变量,其分布函数为,,

则在)上是右连续的。

证明:由于为一个连续型随机变量,故存在一个可积函数,使得

而变上限积分函数是连续的,故的分布函数是连续的。

本文讨论离散型与连续型随机变量的连续性,通过实例让学生感知其连续的情况,并且给出了它的證明,这样有助于学生提高对分布函数连续性的认识。

参考文献

[1]张晓明.关于随机变量分布函数[J].福建工程学院学报,2007,4(2):47~49.

[2]盛骤.概率统计[M].北京:高等教育出版社,2001,12:46~51.

[3]雷发社.概率统计重点难点[M].陕西:陕西科学技术出版社,2004,5:66~69.

[4]孙洪祥.概率论与数理统计[M].辽宁:辽宁大学出版社,2008,2:51~54.

[5]王昭海,杜贵春.关于随机变量分布函数定义的一点注记[J].安康师专学报,2006(2).

随机变量函数 篇3

本研究中推导的算法是一种有效分析算法,用来分析有不确定参数[5]的岩石边坡稳定性。该算法将在以下部分中进行介绍。

1 计算模型的选取

选取的模型为单平面滑动模型[6,7],并有静水压力[8]和地震作用。

假定:

1)滑动面走向与坡面平行或接近平行;

2)滑动面在坡面露出;

3)滑动面的倾角大于该平面的摩擦角;

4)掩体中存在对于滑动阻力很小的分离面,定出滑动的侧面边界。

平面破坏分析:

1)基本假定;

2)滑动面及张裂缝的走向平行于坡面;

3)张裂缝垂直,其充水深度Zw;

4)水沿滑动面进入张裂缝渗漏,张裂缝底与坡趾之间的长度内水压力按线性变化至0;

5)滑动块体重量、滑动面水压力和张裂缝中水压力三者作用线通过滑体中心。

图1显示了这种滑动的类型和它的参数。

对这种类型的滑动,其安全系数的表达式为

式中,Fs是抗滑安全系数[9],Z是张力裂缝的深度,Zw是张力裂缝中水的深度,A是楔形的面积,W是破坏面上楔形岩体的重量,H是整个边坡的高度,U是水对破坏面的向上的压力,Fw是裂缝中水对岩石的水平方向作用力,α是水平地震加速度,c是滑动面上的黏聚力,φ是滑动面的摩擦角,ψp是滑动面与水平面之间的夹角,ψf是坡角,γr是岩石的单位重量,γw是水的单位重量。

在本研究中,等式(1)中的参数被分为两种,固定参数H、ψp、ψf、γr、Z,以及随机参数Zw、α、c、φ,其中随机参数假设相互之间不相关。

2 随机参数的设置

为了解释岩石边坡稳定的不确定性,四个输入参数被定义为随机变量。所选的这四个参数分别是滑动面的摩擦角φ,滑动面上的黏聚力c,张力裂缝中水的深度Zw,地震加速度比值α。摩擦角和表观凝聚力使用截断正态概率分布函数(pdf)来模拟。张力裂缝中水的深度和地震加速度比使用截断指数概率分布函数模拟。应当指出,虽然黏聚力c和摩擦角φ实际上呈现负相关,但数学上为了方便通常认为这两个是不相关变量。有关几何参数和单位重量被视为常数参数。相关函数如下

通过考虑它们的平均值加上或减去标准偏差的四倍范围内的随机变量[式(6)],得到的结果是正常密度曲线下方面积的99.994%被覆盖。在选择初始数据时,对于凝聚力和滑动面摩擦角,应当注意必须遵守下列条件

3 公式推导及Matlab程序对算法的实现

安全系数表达式等式(1)被分解成等式(8),分解后的k10即Fs,而各参数的概率密度分布函数使用等式(2)~式(5)获得。算法推导过程如下所示,在此过程中使用了数学上的二维连续型随机变量分布函数[10,11]

式(9)中,cminA≤k1≤cmaxA。

式(10)中,b1-c1αmax≤K2≤b1-c1αmin。

式(12)中,cotφmax≤k4≤cotφmin。

式(16)中,c1≤k8≤c1+b1αmax。

式(18)中,

使用Matlab编写计算程序,用k1到k10以及fk1(k1)到fk10(k10)[等式(17)],得出安全系数的概率密度函数。然而,fk1(k1)到fk10(k10)的积分并不存在解析解,所以必须数值求解。此外,为了比较,在统一计算程序中也进行了蒙特卡洛模拟确定岩石边坡安全系数。

本研究算法的优越性在于:

1)这是一个几乎准确的方法,并且对随机变量任何分布曲线(例如标准正态分布、指数分布、伽马分布和均匀分布等)都适用;而对于另一些方法如PEM和FOSM(一阶可靠性法),就需要特殊的分布曲线(例如标准正态分布)相配合;

2)该方法的计算时间明显低于蒙特卡洛模拟,因为MC法需要大量的运行计算;

3)在本算法中可以给出参数之间有效的统计和概率关系。

4 算例

上述方法目的是在平面滑动岩石山坡上确定安全系数的概率密度分布曲线,为了验证该方法的效率和准确性,现举一说明性的例子。本例子是Hoek[12]曾经进行概率分析过的一个边坡,是香港秀茂坪的一个坡。此岩石边坡的随机输入变量和确定的一些参数如下给出,图2展示了输入变量的概率密度函数。

如上文所述,等式(1)(计算安全系数的等式)的分子(k7)和分母(k10)中都分别包含有地震的水平加速度α和张裂缝中水深Zw,所以它们是相关的,因此就不能使用等式来得到它们对安全系数的显示关系。为了解决这个问题,k7和k10的概率分布函数(pdf)将分别通过计算得到,并将结果与蒙特卡洛模拟的结果相比较,图3给出了比较图像。为此,生成有100 000个点用于蒙特卡洛模拟。图4给出了本研究算法[等式(16)]和蒙特卡洛模拟得到的安全系数的概率分布图。比较本研究的算法和蒙特卡洛模拟得到的概率密度函数,结果表明符合度较好。

5 敏感度分析

为了评估平面滑动[等式(1)]以及参数的变化对岩石边坡稳定性的影响,本研究使用了蒙特卡洛模拟对此进行敏感度分析。为了达到这个目的,四个随机参数是在其标准偏差(新平均值=旧平均值+3×方差)的基础上计算的。其结果如图5所示。为了评估平均摩擦角的改变所产生的影响,设定其他参数不变的情况下改变摩擦角的大小来观察,当然摩擦角大小有个范围。正如所预期的那样,

摩擦角平均值越大,安全系数的累计分布图像(cdf)就越往右移,这表明摩擦角平均值越大,边坡安全系数就越高。图5还显示了其他参数不变情况下,粘聚力平均值改变对安全系数cdf的影响。再次如预期那样,黏聚力平均值越大,安全系数cdf越往右移。此外,对安全系数的灵敏度分析中还进行评价了地震加速度比值(α)的影响。结果表明对于给定的边坡,安全系数的cdf是随着地震加速度值得增大而降低的。图5还表明,随着张力裂缝中水深度的增,安全系数的cdf在向左移动,也就意味着岩石边坡的失稳概率在增加。综合以上可以看出,滑动面摩擦角对岩石边坡安全系的影响最大。

6 结论

(1)安全系数的概率密度分布曲线呈正态分布。本文算法计算结果曲线与M-C模拟法计算结果曲线相近且计算速率要远远快于后者,表明该方法具有可行性,可作为岩坡稳定可靠性方法的补充并为岩坡稳定提供快速定性的前期评价。

(2)本研究推导的算法特别适用于解析系统响应[3]的问题,它们都基于边坡稳定不确定性的概率算法。

(3)用蒙特卡洛模拟[2]对各个随机参数进行了灵敏度分析。结果表明,对于岩石边坡安全系数的影响来说,滑动面摩擦角是最有效的参数。

(4)通过对张拉裂缝中水深Zw和水平地震加速度α这两个随机变量的敏感性分析得知安全系数随这两个参数的变化而发生变化的趋势合理,且正常情况下,水平地震加速度α对岩坡稳定的影响性强于张拉裂缝中水深Zw对岩坡稳定的影响性。

摘要:考虑到岩质边坡相关参数的随机性,基于连续随机变量函数,假定滑动面摩擦角φ、表面黏聚力c等服从正态分布;张力裂缝中的水深Zw、地震加速度比α等服从指数分布,推导出岩质边坡稳定性安全系数分布公式;并使用Matlab演算模拟;其结果与蒙特卡洛模拟(MC)结果基本一致。敏感性分析显示滑动面摩擦角对于有平面滑动的岩质边坡稳定性影响最大。

关键词:岩质边坡,稳定性分析,不确定参数,Matlab,M-C模拟,连续随机变量

参考文献

[1] Lia A J,Merifield R S,Lyamin A V.Stabilitycharts for rock slopes based on the Hock-Brown failurecriterion International Journal of Rock Mechanics&Mining Sciences,2008;45(5):689—700

[2] 龙海涛,王亚坤,刘洋.边坡稳定性计算中蒙特卡洛法的运用.甘肃水利水电技术,2012;48(4):21—23

[3] Jimenez-Rodriguez R,Sitar N.Rock wedge sta-bility analysis using system reliability methods.Rock Mech Rock Eng,2007;40(4):419 —27

[4] Hoek E,Bray J.Rock slope engineering.3rd ed.London:Institution of Mining and Metallurgy;1981

[5] 韩孝峰,孙树林,阮晓波.等.基于Hock-Brown准则的无限岩坡稳定性概率可靠度分析研究.科学技术与工程,2012;13(8):126 —130

[6] 吴恒滨,何泽平,曹卫文.基于不同水压分布的平面滑动边坡稳定性研究.岩土力学,2011;8:40—48WU Heng-bin,HE Ze-ping,CAO Wei-wen.Stability study of slope with planar failure based on different water pressure distribution.Rock and Soil Mechanics,2011;8:40—48

[7] Goodman RE.Introduction to rock mechanics.2nd ed.New York:Wiley,1989

[8] 沈振中,姜媛媛,王金南.非稳定流作用的岩体边坡稳定非连续变形分析.河海大学学报(自然科学版),2007;35(1):39—41

[9] Hoek E,Carranza-Torres C,Corkum B.Hock-Brown failurecriterion,2002 edition.Proceedings of the North American Rock Mechanics Societymeeting in Toronto,2002;1:267—273

[10] 刘淼.关于二维连续型随机变量函数的推广和应用.长春师范学院学报(自然科学版),2014;2:1—3Liu Miao.About two dimensional continuous random variables function of promotion and application.Journal of Changehun Normal University(Natural Science),2014;2:1—3

[11] 梁青.随机变量和的二维联合分布.海南师范大学学报(自然科学版),2013;6:5—11Liang Qing.Two dimensional Joint Distribution of the Sum of Random Variables.Joumal of Hainan Normal University(Natural Science),2013;6:5——11

生活中的随机变量问题 篇4

同学们应该了解,经济生活包括金融(银行、保险、证券)和实业(设计、取料、生产、物流、销售)两方面.实际应用中,很多基本的不确定量(随机变量)的概率分布是依靠历史(经验与统计数据)来确定的.因此数学不是万能的,实际发生的(历史的、经验的)可量化的(数据)和不可量化的事物才是最重要的.

一、 假如你是保险公司的老板

例1 据统计,一年中,一个家庭万元以上财产被窃的概率为0.01,保险公司设计了一年期万元以上家庭财产保险,参加者需要交保险费100元,若在一年内,万元以上财产被窃,则保险公司赔偿a元(a>100),问a如何确定,可使保险公司获益?

解 设保险公司的收益为ξ,则ξ的分布列为:

所以期望Eξ=100×0.99+(100-a)×0.01=.

令Eξ>0,又a>100,所以100

即将a确定在区间(100,10 000)内(单位:元),保险公司有望获益.

二、 假如你是花店的老板

例2 春节期间,某鲜花店某种鲜花的进货价为每束2.5元,销售价为每束5元,若在春节期间内没有售完,则在春节结束后以每束1.5元的价格处理,据前5年的有关资料统计,春节期间这种鲜花的需求量X服从以下分布:

问该鲜花店今年春节前应进该鲜花20束,30束,40束,还是50束?

分析 售出一束鲜花能获利2.5元,处理一束鲜花则将亏损1元.由于鲜花的需求量X为随机变量,故应求出各种进货量下利润的期望.

解 若进货量为20,则由P{X≥20}=1,得利润的期望E1=1×20×2.5=50(元);

若进货量为30,则由P{X=20}=0.2,P{X≥30}=0.8,得利润的期望E2=0.20×(20×2.5-10×1)+0.8×30×2.5=68(元);

若进货量为40,则由P{X=20}=0.2,P{X=30}=0.35,P{X≥40}=0.45,得利润的期望E3=0.20×(20×2.5-20×1)+0.35×(30×2.5-10×1)+0.45×40×2.5=73.75(元);

若进货量为50,得利润的期望E4=0.20×(20×2.5-30×1)+0.35×(30×2.5-20×1)+0.3×(40×2.5-10×1)+0.15×50×2.5=69(元).

故利润期望的最大值为E3=73.75(元),因此鲜花的最佳进货量为40束.

三、 假如你想投资理财

例3 你有10万元,现有两种投资方案:一是购买股票,二是存入银行.买股票的收益主要取决于经济形势,假设可分三种状态:形势好、形势中等、形势不好(即经济衰退).如果形势好,则一年期可获利40 000元;如果形势中等,则一年期可获利10 000元;如果形势不好,则一年期要损失20 000元.存入银行的收益是利息,假设年利率为8%,即一年期可得利息8 000元.又设年经济形势好、中等、不好的概率分别为30%,50%和20%,试问该投资者应选择哪一种投资方案?

分析 购买股票的收益与经济形势有关(不确定),存入银行的收益与经济形势无关(确定).因此要确定选择哪一种方案,就必须先计算购买股票一年期收益的期望,然后与存入银行一年期的收益进行比较.

解 由题设,一年中购买股票在不同的经济形势下对应的收益与概率如下表所示:

初步看上表,可以得出:如果经济形势好或经济形势中等,则购买股票是合算的;但如果经济形势不好,则存入银行比较好.

下面通过计算来分析:如果购买股票,则其收益的期望E=40 000×0.3+10 000×0.5+(-20 000)×0.2=13 000(元);如果存入银行,则其收益为8 000(元).

因此,按期望收益最大原则,应选择购买股票.

点评 值得说明的是,这里是按风险决策中的期望收益最大准则选择方案,这种做法有风险存在.因为在实际生活中,经济形势好、中等、不好是无法给出准确概率值的.这只是一道理想化、简单化的数学题.

1. 从汽车东站驾车至汽车西站的途中要经过8个交通岗,假设某辆汽车在各个交通岗遇到红灯是相互独立的,并且概率都是.求:

(1) 这辆汽车在首次遇到红灯前恰好经过两个交通岗的概率;

(2) 这辆汽车在途中遇到红灯数ξ的期望.

2. 某大厦的一部电梯从底层出发后只能在第18,19,20层停靠.若该电梯在底层载有5位乘客,且每位乘客在这三层中的每一层下电梯的概率均为,用ξ表示这5位乘客中在第20层下电梯的人数,求随机变量ξ的分布列及期望.

3. 购买某种保险,每个投保人每年度向保险公司交纳保险费a元,若投保人在购买保险的一年度内出险,则可以获得10 000元的赔偿金.假定在一年度内有10 000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10 000元的概率为1-0.999104 .

(1) 求一投保人在一年度内出险的概率p;

(2) 设保险公司开办该项险种业务除赔偿金外的成本为50 000元,为保证盈利的期望不小于0,求每位投保人应交纳的最低保费.

1. (1) P=1-×1-×=;

(2) Eξ=8×=.

2. 依题意,ξ~B5,,ξ的分布列为:

Eξ=5×=.

3. 记投保的10 000人中出险的人数为ξ,则ξ~B(104,p).

(1) 记A表示事件:保险公司为该险种至少支付10 000元赔偿金,则发生当且仅当ξ=0,故P()=P(ξ=0)=(1-p)10 4.

又P(A)=1-0.999104,且P(A)+P()=1,故p=0.001.

(2) 依题意,该险种的总收入为10 000a元,总支出为(10 000ξ+50 000)元,故总盈利=10 000a-(10 000ξ+50 000)(元),总盈利的期望E=10 000a-10 000Eξ-50 000(元).

由ξ~B(104,10-3),知Eξ=10 000×10-3.

离散型随机变量的综合应用 篇5

一.离散型随机变量的概率分布

例1从装有6个白球,4个黑球和2个黄球的箱子中随机地取出两个球,规定每取出一个黑球赢2元,而每取出一个白球输1元,取出黄球无输赢,以X表示赢得的钱数,随机变量X可以取哪些值呢?求X的概率分布.

思路点拨:先分析取两个球可能出现的所有情况,再用随机变量表示,最后由古典概型的概率计算公式求出概率,写出概率分布.

解:从箱子中取两个球的情形有以下六种:2白,1白1黄,1白1黑,2黄,1黑1黄,2黑,

当取到2白时,结果输2元,随机变量X=-2;

当取到1白1黄时,输1元,随机变量X=-1;

当取到1白1黑时,随机变量X=1;当取到2黄时,随机变量X=0;当取到1黑1黄时,随机变量X=2;

当取到2黑时,随机变量X=4.

则X的可能取值为-2、-1、0、1、2、4.

因为

则得到X的概率分布如表1.

点评:求概率分布的关键是准确写出随机变量的取值及其每个值的概率,而求变量取值的概率的关键是理解清楚变量取每个值所对应的随机事件是什么,另外求出随机变量的概率分布后可以用概率分布的相关性质对结果进行检验.

二、离散型随机变量概率分布性质的应用例2设随机变量X的概率分布P(X=

例2设随机变量X的概率分布P(X=(k=1,2,3,4,5),(1)求常数a的值;(2)求P().

思路点拨:根据概率分布的第二条性质可以求出a,再根据随机变量取值表示的事件是互斥事件求出·

解:(1)由a+2a+3a+4a+5a=1,得到;

(2)因为只有满足,所以

点评:概率分布的有关性质是对所求概率分布进行检验或者对有关参数进行求值的依据.,

三、离散型随机变量的均值

例3某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为

商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润,(2)求事件A:“购买该商品的3位顾客中,至少有1位采用1期付款”的概率P(A);(2)求η的分布列及期望Eη.

思路点拨:(1)“至少有1位采用1期付款”的对立事件为“全部都不采用1期付款”,由相互独立的概率公式可求.(2)η的取值为200,250,300,P(η=200)=P(ξ=1)=0.4,P(η=250)=P(ξ=2)+P(ξ=3);P(η=300)=P(ξ=4)+P(ξ=5).

解析:(1)由A表示事件“购买该商品的3位顾客中至少有1位采用1期付款”,知A表示事件“购买该商品的3位顾客中无人采用1期付款”.

P()=(1-0.4)2=0.216,P(A)=1-P()=1-0.216=0.784.

(2)η的可能取值为200元,250元,300元.

η的分布列为

所以Eη=200×0.4+250×0.4+300×0.2.

点评:解答这类问题时,应该首先把实际问题概率模型化,然后利用有关概率知识去分析相应各事件可能性的大小,并列出概率分布,最后利用公式求出相应的概率.

四、离散型变量的概率、方差的综合应用

例4甲、乙两人射击,甲射击1次中靶的概率是P1,乙射击1次中靶的概率是P2,且,是方程x2-5x+6=0的两个实根,已知甲射击5次,中靶次数的方差是,(1)求P1、P2的值;(2)若两人各射击2次,至少中靶3次就算完成目的,则完成目的的概率是多少?(3)若两人各射击1次,至少中.靶1次就算完成目的,则完成目的的概率是多少?

思路点拨:(1)由于射击5次是相互独立的,故甲中靶次数X甲~B(5,P1),从而由,可以求出P1的值,然后利用根与系数的关系把P求出;(2)中靶3次包含甲中2次,乙中1次以及甲中1次,乙中2次两种情况,显然这两类事件互斥;(3)“至少”的对立面为“最多”,故用对立事件比较容易完成本题.

解:(1)根据题意知道X甲~B(5,P1),所以,所以,解得,所以P2=

(2)两类情况:共击中3次的概率为

随机变量的数字特征的应用 篇6

随机变量的数字特征尤其是数学期望在很多领域 (如:在风险决策、就业决策、投资、证券投资、经济决策、利润效益和贝叶斯决策等) 都有非常重要的应用。下面就几种情况分别讨论。

(1) 随机变量的数字特征在经济决策问题中的应用

在经济生活中, 不论是厂家的生产还是商家的销售, 总是追求利润的最大化, 供大于求或供小于求都不利于获得最大利润;但供应量和需求量又不是能预先知道的, 理性的厂家或商家往往根据过去的数据 (概率) , 用数学期望结合其他知识来做决策。

假定某公司计划开发一种新产品市场, 并试图估计其产量。估计出售一件产品公司可获利m元, 而积压一件产品可导致损失n元。另外该公司预测产品的销售量为一随机变量X, 其分布为p (x) 。那么产品的产量该如何确定才能获得最大利润。假设该公司每年生产x件, 尽管x是确定的, 但由于需求量 (销售量) 是一个随机变量, 所以收益Y也是一个随机变量, 它是X的函数:, 于是期望收益为。问题转化为当x为何值时期望收益可以达到最大值。

举一个应用数学期望解决贝叶斯决策的相似性问题.利用损失函数下的先验期望准则来做决策。

原理:对给定的决策问题, 若在状态集Θ上有一个正常的先验分布π (θ) , 则损失函数L (θ, a) 对π (θ) 期望与方差L (a) =EθL (θ, a) , Var[L (θ, a) ]=Eθ[L (θ, a) ]2-[EθL (θ, a) ]2。

分别称为先验期望损失和损失的先验方差, 使先验期望损失达到最小的行动a′, , 称为先验期望准则下的最优行动, 若此种最优行动不止一个, 其中先验方差达到最小值的行动称为二阶矩准则下的最优行动。

例如:某公司购进某种货物可分为大批、中批和小批三种行动, 依次记为a1、a2、a3。未来市场需求量可分为高、中、低三种状态, 依次记为θ1、θ2、θ3。三个行动在不同市场状态下获得的利润如下 (单位:千元) , 问题是寻找最优决策:题干中的矩阵为一个收益矩阵, 现在把它变换为损失矩阵, 即, 在有先验信息的情况下, 即如今公司经理经过专家咨询后认为未来市场对该商品的需求量是中等, 据此公司经理用主观概率给出如下先验分布π (θ1) =0.2, π (θ2) =0.7, π (θ3) =0.1, 用此先验分布算得行动a1, a2, a3的先验期望损失和损失的先验方差。比较先验期望损失大小可得a2 (中等采购量) 是先验期望损失准则下的最优行动。考虑到a1与a2的先验期望损失紧差1.07-0.98=0.09, 而a1的先验方差要比a2的先验方差小的较多, 为避免大的风险, a1亦是可采取的行动。

(2) 现今大多数人都有过购买股票或有价证券的经历, 但其中的大多数人都不是理性的, 那么理性的决策者在购买股票时会怎样做呢?

如何才能把风险降到最小也是很重要的一点。在投资环境日趋复杂的现代社会, 几乎所有的投资都是在风险和不确定情况下进行的, 一般地说, 投资者都讨厌风险并力求回避风险。风险是某一行动的结果具有多样性。风险是客观存在的, 它广泛影响着企业的财务和经营活动, 因此, 正视风险并将风险程度予以量化, 成为企业财务管理中的一项重要工作。衡量风险大小需要使用概率和统计方法, 最常用的知识就是数学期望和方差。

收益的数学期望:

例如:某公司拟对外投资, 现有A公司、B公司和C公司有关股票收益的资料如下表:

下面, 根据上述期望值公式计算A、B、C公司的预期收益率:

在预期收益率相同的情况下, 投资的风险程度同收益的概率分布有密切的联系。A、B公司的预期收益率都是20%, 但相比之下可以发现B公司的预期收益率非常分散, 而A公司的预期收益率较集中, 可认为A公司的投资风险要比B公司小, 由此得如下结论:即预期收益的概率分布越狭窄, 其投资风险越小, 反之亦然。

(3) 总结

以上内容只是随机变量的数字特征在某些领域的相关应用, 虽然还不是很成熟, 面对复杂的经济等问题, 苛求完善是不足取的, 毕竟期望原理正推动着经济学的发展, 为经济学定量化研究, 特别是对不确定决策研究提供了有力的原理工具, 随着经济学和数学的发展, 期望原理的实用性将会逐渐提高。相信随着时代和经济的发展不仅是随机变量的数字特征更多的和统计知识方法有关的研究会应用到越来越多地方, 一定会发挥着不可估测的作用。

参考文献

[1]辽宁, 齐飞.概率论的产生与发展[J].

[2]林少宫, 李楚霖.简明经济统计与计量经济[M].上海人民出版社.

[3]徐建中, 编.证券投资策略与方法[M].上海远东出版社.

随机变量函数 篇7

到目前为止,多变量辨识方法比较多,比如最小二乘算法、随机梯度算法、辅助变量算法、极大似然算法等等,这么多算法究竟哪个计算量更小,收敛性能更好,实用性更强,谁优谁劣究竟如何评判,这是问题的关键。不过理论上很难从多方面判断算法的优劣和实用性,可通过具体的仿真例子为辨识算法的选择作理论上的指导。本文用随机梯度搜索原理或随机逼近原理,研究了遗忘梯度算法,子系统遗忘梯度算法和递阶遗忘梯度算法,并通过仿真比较研究它们的估计精度的高低和收敛性能的好坏,使算法能更好的指导实际的应用。

1 多变量系统辨识模型

一个状态空间描述的多变量系统,化为传递矩阵描述,经过参数化可以化为下列形式的差分方程[1],

(1)式中u(t)∈瓗r和y(t)∈瓗m分别是系统输入和输出向量,v(t)∈瓗m为零均值白噪声向量瓗1和瓗m×r分别是待辨识的系统参数和参数矩阵。

定义参数矩阵θ、参数向量为α、输入信息向量φ(t)和输出信息矩阵ψ(t)分别为

瓗ψ(t)∶=[y(t-1),y(t-2),…,y(t-n)]∈瓗m×n因此,可以得到随机系统辨识模型,

2 梯度辨识算法

辨识模型(2)式既包含一个参数向量α∈瓗n,又包含了一个参数矩阵θT∈瓗m×n0,使得传统的辨识方法,如递推最小二乘算法(RLS)和随机梯度算法(SG)等,不能直接辨识这模型的参数向量和参数矩阵[2]。一种直观的方案是,将该系统重新参数化,得到一个包含参数向量α与参数矩阵θ所有元的高维参数向量∈瓗n+mn0。另一种方案是,把辨识模型(2)式按照输出的数目分解为m个子系统,然后分别辨识每个子系统的参数向量。还有一种方案是,采用递阶辨识原理,直接辨识参数向量α∈瓗n与参数矩阵θ∈瓗n0×m,这种方法计算量最小在这三种辨识方案中,都可以采用最小二乘优化原理和随机梯度搜索原理(或随机逼近原理),来研究相应的辨识方法。限于篇幅,本文只介绍基于随机梯度的辨识方法。下面分别介绍这几种辨识方案和具体辨识算法,并比较各种方法的优缺点。

2.1 随机梯度算法

先引入一些符号。设Im是m×m单位阵:表示Kronecker积或直积,col[X]表示将矩阵X的列按次序排成的向量。

定义扩展的参数向量和扩展的输入输出信息矩阵分别为

瓗。于是辨识模型(2)式可以转化为熟悉的形式,

极小化准则函数可得带遗忘因子的随机梯度算法,简称遗忘梯度算法(FG),

其中(t)是的估计,λ为遗忘因子称为时变收敛因子。算法初始值可取为一个小实参数向量,如(0)=1(mnr+n)×1/p0,p0=106。遗忘梯度算法比SG算法有较快的收敛速度,而且具有克服数据饱和和跟踪时变参数的能力。关于算法的收敛性,可参考文献[3,4]证明。

2.2 子系统随机梯度算法

FG算法虽然比较直观,思路也简单,但是参数向量维数很高,且信息矩阵Υ(t)含有大量的零元素,这使得算法计算量很大。为克服这些缺点,下面研究分子系统的辨识算法,基本思想是将一个多输入多输出系统分为多个多输入单输出子系统,然后分别辨识每个分子系统的参数向量。

令表示向量y(t)的第j个元表示信息矩阵ψ(t)第j行表示信息矩阵v(t)第j个元表示参数矩阵θ第j列。辨识模型(2)式可以分解为m个子系统,

(5)式中第j个子系统的信息向量和参数向量分别为

定义和极小化m个准则函数

可以得到每个子系统的带遗忘因子随机梯度算法,简称子系统遗忘梯度算法(S-FG),

因为在每一个子系统都要估计α向量一次,所以α的估计可取m次估计的平均值,子系统随机梯度法避免了出现大量零元的信息矩阵,参数维数也由原来的n+mn0降低到n+n0,计算量大大减少,所以S-FG算法是优于遗忘梯度算法。

2.3 递阶随机梯度算法

尽管子系统随机梯度算法降低了参数维数,减少了计算量,但是由于每一个子系统都包含参数向量α,所以要(重复)估计m次α,增加了不必要的计算量。而下面要讨论的递阶随机梯度算法,既不包含大量零元,又不必(重复)估计参数向量α,计算量是最小的。

递阶随机梯度算法是基于递阶辨识原理提出的[1]。根据式(2)定义准则函数,

根据负梯度搜索原理,得到估计α和θ的带遗忘因子的递阶随机梯度辨识算法(FFHSG),简称递阶遗忘梯度算法(HFG),

这里α(t)和θ(t)分别是α和θ的估计。

3 仿真实验与算法比较

考虑2输入2输出一阶仿真系统,其中α=-0.8,θT=[2.0,1.0;1.0,2.0]。仿真时,{u1(t)}和{u2(t)}采用零均值单位方差不相关可测的持续激励信号序列,{v1(t)}和{v2(t)}采用零均值方差分别为σ2(1)=0.42和σ2(2)=0.52的白噪声序列,对应两个输出通道的信噪比分别为δns(1)=50.99%和δns(2)=51.51%。用本文三个算法估计这个系统参数,这里由于篇幅所限,只给出λ=0.98时参数估计相对误差误差随t变化曲线如图1所示。

从这个仿真例子的仿真结果,可以得出结论:这三个算法有一个相同点,即随着递推计算步骤的增加,参数估计误差(总的趋势)不断减小,即数据量越大,参数估计精度越高;当λ相同时,S-FG算法收敛最快,FG算法收敛最慢,HFG算法介于二者中间,而且平稳性也介于两者之间;对于很大的t(数据长度),三个算法最终的估计误差曲线相差不大,参见图1,但递阶遗忘梯度算法计算量最小。

4 结论

本文针对多变量系统研究了三个随机梯度型辨识方法,并对这三个算法的性能和特点进行了分析比较。

摘要:针对工业中广泛存在的多变量系统,研究了辨识这类系统的遗忘梯度辨识算法,分子系统遗忘梯度辨识算法和递阶遗忘梯度辨识算法,对这三种算法的计算量进行了比较分析,并给出了仿真例子。

关键词:最小二乘,随机梯度,递阶辨识,多变量系统

参考文献

[1]Feng Ding,Chen Tongwen.Hierarchical gradient-based identification of multivariable discrete-time systems.Automatica,2005;41(2):315—325

[2]方崇智,萧德云.过程辨识.北京:清华大学出版社,1988

[3]丁锋.随机梯度算法的收敛性分析.清华大学学报,1999;39(1):83—86

随机变量函数 篇8

在讲授概率统计课程中随机变量及其分布这一章时,一种常见顺序是:随机变量的分布函数,离散型随机变量及其分布律,连续型随机变量及其概率密度函数[1].这种安排基本合理,但在实际讲授之后往往效果不佳,常出现学生对分布函数的重视程度不够,难以理解概率密度函数概念,易混淆分布函数,分布律和密度函数以及书写时符号混乱等问题.究其原因,主要是对初学者来说:随机变量概念很难理解到位;概率密度函数概念的出现太过突兀;分布函数,分布律,概率密度三者相互之间既有联系又有区别,易造成混淆.

二、问题驱动式解决方案

针对以上症结,在不改变上述顺序的前提下,本文对随机变量及其分布一章的主要知识点采用6个关键问题进行驱动,促进学生主动思考,加深基本概念的理解,区分易混淆概念,使内容层层递进,各部分自然衔接,知识点融会贯通.同时适当融入研究型教学方式,培养学生的思维和创造能力.

以下将按各教学内容详述此问题驱动式教学过程.

内容一:随机变量

随机变量是本章的首个关键概念,它在概率统计中的重要地位和对后续内容的深远影响不言而喻.然而,此前学生关注的一直是各种随机事件的概率计算,如何引入随机变量概念才能让他们认识到其必要性和重要性?为此提出第一个问题:

问题1何为随机变量?为什么要引入随机变量的概念?

从生活实例出发,让学生初步体会随机变量.如生活中常关心的一些量:某城市一个月的降雨量,某银行一天接待的顾客数,这些量的取值看似随机变化,但在多次观察时又呈现某种确定的统计规律.这种变量就是随机变量,对之常关注:(1)变量可能取哪些值;(2)取各值的可能性大小.

接着指出:实际中所关心的对象还有很多也是随机变化的,但它们本身并不是数,如天气状况,疾病化验结果等.为方便用数学工具研究这些对象的变化规律,有必要把非数的试验结果(样本点)数量化.于是自然定义样本空间到实数域的映射:ω→X(ω),把非数的试验结果全部转化为数.此定义在样本空间上的实值函数X(ω)就是随机变量,它与普通函数的区别在于:函数值是由试验结果决定的,故称为随机变量——随机会而取值的变量.通过实例可说明:随机变量的取值情况完整描述了随机试验中的各种随机事件,故今后将研究重点放在随机变量上.此时再给出随机变量的数学定义则水到渠成,解答了学生“为什么要讨论随机变量?随机变量有什么用?”的疑问,并奠定了随机变量在今后学习中的重要位置.

内容二:随机变量的分布函数

在引入随机变量的概念之后,由以下问题自然带入随机变量的分布函数.

问题2随机变量的本质特征在于其可能取值和取值的概率分布情况,用什么工具来描述随机变量的概率分布情况?

直接给出分布函数的定义会稍显生硬,可通过例子引入.

实际中,人们常关心随机变量在某范围内取值的概率.如:产品质量检查时,随机抽取的n件产品中次品件数X不超过3的概率P{X≤3},某公司生产的某一型号液晶电视寿命X在(45000,55000)(小时)之间的概率P{45000<X≤55000}.

若对任意实数x,都存在概率P{ω:X(ω)≤x}=P{X≤x}=F(x),以上问题就迎刃而解(这也解释了为什么随机变量的定义中要求对任意实数x,事件{ω:X(ω)≤x}的概率都是可确定的).这个函数F(x)就是随机变量的分布函数,它可描述随机变量在任一区间取值的概率P{x1<X≤x2}=F(x2)-F(x1),甚至在任意一点取值的概率P{X=x}=F(x)-F(x-0).只要是随机变量就存在分布函数,分布函数可描述任一随机变量的概率分布.

在此讲解分布函数有如下好处:体现了分布函数的重要性和一般性,与本章最后内容:随机变量除了离散型,连续型外还有奇异型前后呼应.

内容三:离散型随机变量及其分布律

问题3对取值离散的随机变量,如何描述其概率分布比较方便?

用一实例引入离散型随机变量及其分布律,并用柱状图或火柴棍图来直观表示.提问:对离散型随机变量来说,分布律和分布函数都可描述其概率分布,哪种描述方式比较直观方便?学生能够自己看出是分布律.在教师引导下讨论总结:分布函数与分布律均可描述离散型随机变量的概率分布,二者可互相转化,只是描述方式不同而已.对离散型随机变量往往选择更直观的工具———分布律.

内容四:连续型随机变量及概率密度函数

很多现行教材都直接给出连续型随机变量及其概率密度函数的定义[1,2],这固然是由于教材限制所致,但若在课堂讲授时也直接抛出此概念,会让学生觉得非常突兀,造成理解和学习上的困难.实际上,离散型随机变量与连续型随机变量有诸多可类比性质[3],故本文的解决办法是由离散型随机变量的分布律进行类推,过渡到连续型随机变量的概率密度.具体为讲完分布律后提出如下问题.

问题4对取值连续的随机变量来说,能否用分布律来直观描述其概率分布?

例:一半径为2米的圆盘靶子,击中靶上任一同心圆盘的概率与该圆盘的面积成正比,若射击均能中靶,用X表示弹着点与圆心的距离.能用分布律来描述X的概率分布吗?

学生会发现不行,因为X的取值是连续的!继续提问:

问题5能否找到类似离散型随机变量分布律的工具来直观描述这种取值连续的随机变量的概率分布?

此处需事先做好两项准备工作.

1. 理解频率直方图.

例:为了解某地区成年男子的身高情况,从该地区所有成年男子中随机抽取100名进行调查.问:如何根据这些数据(略,单位:cm)分析该地区成年男子身高X的分布情况?

用此例讲解频率直方图的做法以及含义.重点在于指出:频率直方图利用将连续取值离散化的手段直观体现了身高X这个取值连续的随机变量的大致分布情况,具有与分布律类似的特征.

2. 基本弄清频率与概率的关系.

因后面学习大数定律时才能明确频率依概率收敛于概率,现只需学生理解随试验次数增多频率会逐渐稳定于概率即可,用抛硬币例子数据进行说明.

现在可向概率密度过渡.在频率直方图中,随机变量在某一区间取值的频率,为该区间上小矩形的面积之和.当样本数据很多,组距很小时,各小矩形会非常密集.设想:n趋于无穷,组距趋于0时,直方图中变量的有限多个离散取值范围将趋于无限多个连续取值,而图中小矩形边缘将逐渐稳定在一条光滑(或分段光滑)曲线附近,设为函数f(x).

与离散型情况类似:分布函数和概率密度均可描述连续型随机变量的概率分布,只是方式不同,二者可相互转化,但概率密度较分布函数更为直观.

内容五:其他类型的随机变量

问题6除了离散型随机变量和连续型随机变量之外,还有其他类型的随机变量吗?

在教师引导下,学生发现此分布函数不符合离散型或连续型变量分布函数的特征,故其对应随机变量既非离散型,也非连续型.这时不能用分布律或概率密度来描述其概率分布,但分布函数仍适用,体现了分布函数的一般性和重要性.

三、总结

如上,通过六个问题逐步带出本章各重要概念和知识点,有利于激发学生自主探索的欲望,使本章内容保持一致性与连贯性,学生对分布函数,分布律,概率密度各概念的理解更深入,应用时不易产生混淆.并利用类推与研究式教学较好地处理了概率密度这个教学难点,其中运用的微积分知识还加强了不同学科知识的融合,提高了学生分析处理问题的能力.

参考文献

[1]徐全智,吕恕.概率论与数理统计[M].北京:高等教育出版社,2010.

[2]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.

随机变量函数 篇9

例1 写出下列随机变量可能取的值,并说明所取值的实际意义.

(1)袋中装有5个同样大小的球,编号为1,2,3,4,5,现从该袋中随机取出3个球,记所取球的最大号码为[X].

(2)连续投掷一枚骰子两次,所得点数之和为[Y].

解析 (1)[X]可能取的值为3,4,5.

[X=3]表示最大号码为3,即取出的球为1,2,3号;

[X=4]表示最大号码为4,即4号球被取出,1,2,3号球中恰好取出两个;

[X=5]表示最大号码为5,即5号球被取出,1,2,3,4号球中恰好取出两个.

(2)[Y]可能取的值为2,3,4,5,6,7,8,9,10,11,12.

[Y=2]表示掷出的点数为(1,1);

[Y=3]表示掷出的点数为(1,2),(2,1);

[Y=4]表示掷出的点数为(1,3),(2,2),(3,1);

[Y=5]表示掷出的点数为(1,4),(2,3),(3,2),(4,1);

[Y=6]表示掷出的点数为(1,5),(2,4),(3,3),(4,2),(5,1);

同理,[Y=7]有6个不同的结果,[Y=8]有5个不同的结果,[Y=9]有4个不同的结果,[Y=10]有3个不同的结果,[Y=11]有2个不同的结果,[Y=12]有1个结果.

点评 学会用随机变量描述试验结果非常重要,它是下一步学习分布列的重要基础.

二、离散型随机变量的分布列

例2 设[S]是不等式[x2-x-6≤0]的解集,整数[m,n∈S].

(1)记“使得[m+n=0]成立的有序数组[(m,n)]”为事件[A],试列举[A]包含的基本事件;

(2)设[ξ=m2],求[ξ]的分布列.

解析 (1)由已知,可求得[S={x|-2≤x≤3}],故[m,n∈{-2,][-1,0,1,2,3}],则[A]包含的基本事件为(-2,2),(-1,1),(0,0),(1,-1),(2,-2).

(2)变量[m]的分布列为

则[ξ]的分布列为

点评 1. 求分布列一般有3个步骤:第一步确定变量的所有取值,第二步求出相应的概率,第三步列表.其中最难的是第二步,它需要综合运用我们此前所学的概率知识;

2. 该题第二问涉及变量函数分布列的求法,关键是通过函数关系找到新变量的取值,新变量每个取值的概率等于原变量相应取值的概率之和.

三、分布列的性质

例3 设随机变量[X]的分布列为[P(X=k5)=ak,][k=1,2,3,4,5.]

(1)求常数[a]的值;

(2)求[P(110

解析 (1)由已知条件得变量[X]的分布列为

故[a+2a+3a+4a+5a=1],解之,得[a]=[115].

(2)[P(110

[P(X=35)=115+215+315=25].

四、超几何分布

例4 在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件.

(1)记取出的3件产品中一等品的件数为[X],求[X]的分布列;

(2)求取出的3件产品中一等品件数多于二等品的概率.

解析 (1)[X]的可能取值为0,1,2,3.

[P(X=0)]=[C37C310]=[724], [P(X=1)]=[C13C27C310]=[2140], [P(X=2)]=[C23C17C310]=[740],[P(X=3)]=[C33C310]=[1120].

故[X]的分布列为

(2)记事件[A1]表示“一等品件数为1,二等品件数为0”,事件[A2]表示“一等品件数为2”,事件[A3]表示“一等品件数为3”.

则所求事件为[A1]+[A2]+[A3], 故所求概率为[P(A1)+P(A2)+P(A3)]=[C13C23C310]+[740]+[1120]=[31120].

点评 1. 求超几何分布的关键在于组合数的计算,理解起来并不困难;

2. 利用分布列求概率关键是要搞清楚所求事件与随机变量之间的关系.

【练习】

1. 一个人有[n]把钥匙,其中只有一把可以打开房门.他随意地进行试开,试过的钥匙放在一旁.记打开房门时,试过的次数为随机变量[X],则[P(X=k)]=( )

A. [kn] B. [1n]

C. [k-1n] D. [AkkAkn]

2. 若离散型随机变量[X]的分布列如下表所示,则[c=] .

3. 有甲、乙两个盒子,甲盒子中有8张卡片,其中2张写有数字0,3张写有数字1,3张写有数字2;乙盒子中有8张卡片,其中3张写有数字0,2张写有数字1,3张写有数字2.

(1)如果从甲盒中取2张卡片,从乙盒中取1张卡片,那么取出的3张卡片都写有1的概率是多少?

(2)如果从甲、乙两个盒子中各取出1张卡片,设取出的2张卡片上数字之和为[X],求[X]的分布列.

4. 袋中有10个白球,[n]个红球(2≤[n]≤9),试求:

(1)当取出2个球时,白球和红球各1个的概率[Pn]及[Pn]的最大值;

(2)当[Pn]最大时,从袋中随机取出4个球,记白球与红球的个数差的绝对值为随机变量[X],求[X]的分布列.

【参考答案】

1. B

2. [13]

3. (1)[3112]

(2)

[[X]&0&1&2&3&4&[P]&[332]&[1364]&[2164]&[1564]&[964]&]

4. (1)[Pn]=[20n(n+10)(n+9)],当[n=9]时,[Pn]取得最大值[1019].

(2)

随机变量函数 篇10

在机械系统可靠性设计过程中,知识、试验条件、时间及经费等因素的限制,使得某些不确定性变量的统计信息不足,这导致不确定性变量的分布类型及分布函数不能被精确给定。这类因信息不足引起的不确定性被称为认知不确定性。不同于随机不确定性,认知不确定性可随信息量或知识的增加而减小甚至消失[1]。因此,在可靠性工程中,认知不确定性和随机不确定性往往共存。研究表明[2],认知不确定性对可靠性分析及设计结果的精度存在较大影响。

为定量描述认知不确定性变量,克服认知不确定性引起的可靠性分析及设计结果精度失真,目前已发展了多种不同类型的建模理论,分为概率建模理论和非概率建模理论,其中,概率建模理论主要为贝叶斯理论[3],非概率建模理论包括可能性理论[4]、证据理论[5]和凸集模型[6]。作为凸集模型特例的区间模型[7]是指在实数轴上规定认知不确定性变量可变区间的上下限。在本文中,基于区间模型描述的认知不确定性变量称为区间变量。在工程应用中,区间变量十分常见。因此,区间变量和随机变量共存条件下的混合型可靠性研究具有重要的学术价值及工程应用价值。

目前已有较多的处理独立区间变量的可靠性分析方法[7,8,9,10,11],但在实际工程中,某些区间变量存在一定的相关性,是非独立的。例如描述结构几何尺寸的区间变量和结构质量的区间变量一般存在相关性,较大的几何尺寸区间变量意味着较大结构质量区间变量,反之亦然。为此,Du[12]针对机构运动副,基于物理关系式推导获得非独立区间变量描述模型———等式与不等式约束条件,提出了一种随机变量和非独立区间变量的混合型可靠性设计方法。Jiang等[13]采用多维度平行六面体区间模型,考虑了区间变量为独立或非独立的情况,提出了一种新的非线性区间规划方法,但该规划方法未考虑系统中同时存在随机变量和区间变量的混合情况。Jiang等[14]引入样本相关系数,考虑非独立概率-区间混合情况,利用矩阵变换将非独立变量转换为独立变量,提出了一种双层迭代算法。姜潮等[15]通过引入相关角的概念定量描述了任意两个变量之间的相关性,将不同变量之间的相关性在一个统一的框架下度量,并构建了一高效求解方法。但上述的可靠性分析方法仍为双层优化问题,影响计算效率。故在非独立区间变量下,提出一种单层可靠性计算方法,提高可靠性分析的计算效率仍是当前可靠性分析方法研究的一大挑战。

为此,本文针对系统输入变量存在随机变量和非独立区间变量的混合情况,基于条件概率法和椭球模型,建立了混合型可靠性分析模型,提出了一种高效的单步可靠性模型及单步可靠性计算算法。利用高维模型表示方法[16](HDMR)解耦随机变量和非独立区间变量,将混合型可靠性分析模型转换为单步求解的可靠性分析模型;基于提出的采样方案,利用二次多项式近似HDMR展式,降低极限状态函数的调用次数,提高计算效率。

1 椭球模型

为描述非独立区间变量,Ben-Haim等[6,17]提出了椭球模型。设为区间变量的矢量,其中NY为区间变量的数量。在复杂机械系统中,区间变量的维度一般较高,非独立关系也不尽相同,如某些区间变量服从正相关关系,某些满足负相关关系,而某些是相互独立的。椭球模型根据不同的非独立关系,将区间变量归入不同的组。

经分组后,Y可表示为,其中,Ng为组的数量,Yi为第i组区间变量矢量,则椭球模型为

其中,S为区间变量可行域;Yic为第i组区间变量矢量的均值矢量,计算式为Yic=(YiL+YiU)/2,YiL和YiU分别为Yi的上下限矢量;Wi为第i个椭球模型的特征矩阵,为正定对称矩阵,它描述了第i个椭球的方向和长宽比。因可行域S由Ng个椭球组成,故该模型也称之为多椭球模型,单个椭球模型的变量不超过3个。

多椭球模型可描述不同非独立关系的区间变量:如当某区间变量是独立的,则椭球模型可退化为区间模型;当两个区间变量存在相关性,则椭球模型可退化为椭圆模型。图1给出了3个区间变量构成的不同几何形状的可行域S:在图1a中,3个变量是相互独立的;在图1b中,Y3是独立的变量,Y1和Y2存在相关性,是非独立的;在图1c中,3个变量存在相关性,是非独立的。

由于各个区间变量的单位不同,区间大小不同,不利于数值计算的稳定性,因此将区间变量Yi转换为量纲一变量Vi,转换关系式为

则分组后的区间变量矢量转换为,多椭球模型相应地表示为

其中,(矩阵Ci为对角矩阵,对角线元素为相应的区间变量均值),为量纲一特征矩阵。

式(3)给出的椭球模型主轴与坐标轴存在角度偏移,为使样本点尽可能多地落在椭球模型可行域内,提高二次多项式近似精度,引入线性变换

其中,Qi为正交矩阵,其列向量为的单位特征向量;Λi为对角矩阵,其对角线元素为相应的的特征值,满足,将椭球模型变换为中心位于坐标原点半径为1的球模型,然后将式(4)代入式(3),则椭球模型可描述为

2 混合型可靠性计算模型

设系统极限状态函数为

其中,为随机变量矢量,随机变量的个数为NX;为区间变量矢量,区间变量的个数为NY。将区间变量的变换关系式代入式(6),则极限状态函数可写为G=g(X,E)。

设G<0时系统失效,则系统失效概率pf可表示为pf=Pr{g(X,E)<0},其中Pr{·}表示概率。因未知区间变量E的概率分布,不能获得准确的失效概率。利用条件概率公式,可得失效概率的最小值pf,min和最大值pf,max的计算公式:

其中,gmax(X,E)和gmin(X,E)分别表示在可行域S内极限状态函数的全局最大值和最小值。

由式(7)和式(8)可见,系统失效概率的最小值和最大值分别为最大极限状态函数和最小极限状态函数的失效概率。这本质上为一个双层循环求解问题:内循环为区间分析,在可行域S内搜寻极限状态函数的极限值;外循环为概率分析,求解最大极限状态函数或最小极限状态函数的失效概率。

双层循环增加了可靠性分析问题的复杂性,会大幅度增加极限状态函数的调用次数。对于复杂机械系统,极限状态函数一般由计算机数值仿真模型(如有限元模型、流体动力学模型等)隐式表述,极限状态函数调用次数的增加,会导致计算效率低下,增大可靠性分析及设计的难度。

为提高随机变量和非独立区间变量混合情况下的可靠性计算效率,本文采用高维模型表示方法,将双层循环问题转化为单步问题,提出了一种单步快速的可靠性计算方法。

2.1 高维模型表示方法(HDMR)

高维模型表示方法是一种用于模型近似的处理方法,它常用于近似高维度输入系统的响应函数。研究表明,低阶的高维模型表示方法可精确描述大部分工程中的极限状态函数[18]。

本节主要介绍如何采用HDMR描述极限状态函数g(X,E)。设Z=(X,E)T,则g(X,E)可写为g(Z)。基于高维模型表示方法,g(Z)可表示为

其中,NZ为Z向量的元素个数,NZ=NX+NY;g0为0阶分量函数,为常量;gi(Zi)为1阶分量函数,表示输入变量Zi单独作用时对输出响应g(Z)的影响;gij(Zi,Zj)为2阶分量函数,表示输入变量Zi和Zj共同作用时对输出响应g(Z)的影响;更高阶的分量函数表示多个输入变量共同作用时对输出响应g(Z)的影响;最后一项表示所有残余的耦合输入变量对输出响应的影响。

切割法(cut-HDMR)是一种确定高维模型各个分量函数的常用方法。在切割法中,首先选定参考点c,再计算经过参考点c的线、平面、体积等切割几何上的响应值,分别确定各个分量函数。实际使用中,参考点c一般选定为输入变量可行空间内最感兴趣的点。

利用切割法,各分量函数可表示为

其中,g(Zi,ci)=g(c1,c2,…,ci-1,Zi,ci+1,…,cl),表示除了分量Zi,其余所有输入变量均固定在参考点c处,它是一个一元函数;类似地,g(Zi,Zj,cij)为二元函数;最后项g12…l(Z1,Z2,…,Zl)由真实响应值和基于高维模型表示方法的预测值的残差确定。

在高维模型表示方法中,1阶、2阶、3阶等分量函数与泰勒级数展开式中相应的分量函数有着本质区别。经证明,高维模型表示方法中的1阶分量函数gi(Zi)是泰勒级数展开式中仅含有变量Zi分量函数的集合;类似地,2阶分量函数gij(Zi,Zj)是泰勒级数展开式中仅含有变量Zi和Zj分量函数的集合。1阶分量函数gi(Zi)可以是非线性的。因此,较截断的泰勒级数展式,任意相应截断的高维模型表示方法的展式具有较高的精度。

2.2 单步可靠性计算模型

若极限状态函数可描述为关于随机变量和区间变量相互分离的两部分函数,则双层循环问题可变为单层问题,提高计算效率。

利用1阶HDMR展式,极限状态函数可近似为

如前所述,1阶HDMR展式gi(Xi)和gi(Ei)分别是泰勒展式内仅含有变量Xi和Yi所有分量函数的集合,因此,相对于1阶泰勒展式,1阶HDMR展式没有限定近似表达式的非线性。这提高了1阶HDMR展式的近似精度。

基于1阶HDMR展式的近似表达式,失效概率的最小值和最大值的计算模型可写为

其中,GGmin和GGmax分别表示在可行域S内极限状态函数的全局最小值和最大值,计算式分别为

由此可见,基于1阶HDMR展式,随机变量和区间变量下的混合型可靠性计算模型已转化为单步可靠性计算模型:首先使用非线性约束优化法求得GGmin和GGmax,再使用常规可靠性分析方法,如蒙特卡罗法(MCS)、一次二阶矩法(FORM)等,求得失效概率上下限。

3 计算失效概率

使用单步可靠性计算模型计算失效概率上下限时,需确定参考点c和各个一元函数表达式。参考点c对可靠性计算结果的精度具有一定的影响。为提高精度,参考点c一般选定为输入变量可行空间内最感兴趣的点。区间变量的可行区间往往较小,区间变量可行区间内的中点可兼顾两个边界点,为此,将区间变量可行区间内的中点及区间变量固定在中点时的最大概率点(MPP)对应的随机变量值设定为参考点c。

最大概率点u*的数学计算模型为

其中,为独立的随机变量矢量,服从标准正态分布,由随机矢量X经Rosenblatt变换获得。

一旦求得MPP,则参考点c为

其中,Φ(·)为标准正态分布函数;为随机变量Xi的分布函数的逆函数。

基于求得的参考点c,使用二次多项式近似表达各个一元函数表达式。设gi(Xi,ci)和gi(Ei,cn+i)的近似式分别为

其中,ai0、ai1、ai2、bi0、bi1和bi2分别为二次多项式的待定系数。

采用最小二乘法求解各个二次多项式的待定系数。在最小二乘法中,对于随机变量Xi,沿过参考点c的Xi轴,在[μi-3σi,μi+3σi]区间内均匀分布k(k=5,7,9)个样本点,如图2所示,其中μi和σi分别为随机变量Xi的均值和标准差。各个样本点的坐标值为μi-3σi,μi-3σi+6σi/(k-1),…,μi,μi+6σi/(k-1),…,μi+3σi。对于变换后的区间变量Ei,沿过参考点c的Ei轴,在[-1,1]区间内均匀分布k(k=5,7,9)个样本点,如图2所示。各个样本点的坐标值为-1,-1+2/(k-1),…,0,2/(k-1),…,1。

将式(20)和式(21)代入式(14)~式(17),可得失效概率的最小值和最大值的计算式分别为

其中,GGmin和GGmax的计算式分别为

因均为显式表达式,则GGmin和GGmax可由现有的非线性优化算法快速求解获得,如二次序列规划算法(SQP);代入求得的GGmin和GGmax,使用蒙特卡罗法(MCS)求解失效概率的最小值和最大值。

一旦最大概率点(MPP)和各个二次多项式系数确定,基于HDMR的混合型可靠性计算方法就无须再调用原始的状态极限函数。这可大幅度提高计算效率,尤其当极限状态函数以隐式的计算机仿真模型表述时,调用一次状态极限函数的用时一般较长。为高效求得最大概率点,已有学者提出了较多的数值算法,如HLRF法[19,20]、iHLRF法[21]等。作为HLRF法的改进,iHLRF法引入了价值函数,在处理非线性度较高的极限状态函数时仍具较好的收敛性,故被广泛应用。为此,采用iHLRF法求解最大概率点。

4 算例

在MATLAB下,编写了提出的单步可靠性算法可执行程序,计算了两个混合型可靠性分析算例,其中第一个算例的非线性较低,输入变量的维度较低,相比于第一个算例,第二个算例的非线性度较高,输入变量的维度也较高,用于验证提出的单步可靠性算法在处理较高非线性和高维度时的计算效率及精度。在算例中,使用调用原始极限状态函数的次数Nc评定计算效率。尽管两个算例的极限状态函数均以显式表达式给出,但都编写成了可执行程序,故对于调用函数,极限状态函数是隐式的。在用于求解最大概率的iHLRF算法中采用向前有限差分法计算极限状态函数关于随机变量的梯度。

4.1 悬臂梁

某悬臂梁末端受外部载荷,其中,水平方向分量为Px,垂直方向分量为Py,如图3所示。当梁末端位移大于末端许用位移D0时,认为刚度失效,则极限状态函数为

其中,L为悬臂梁长度;b和h分别为矩形梁截面的宽度和高度;E为材料弹性模量。

已知,末端许用位移D0=65mm。表1给出了各个随机变量的分布参数及区间变量的特征矩阵,其中,L、b和h均服从正态分布;弹性模量E为独立区间变量,载荷分量Px和Py为非独立区间变量。

为研究不同样本数量对计算结果精度的影响,在使用提出的可靠性计算方法计算失效概率时,令k值分别为5、7和9。表2给出了不同k值时的失效概率结果。为验证计算结果的精度,同时使用了蒙特卡罗法计算失效概率。因蒙特卡罗法仅能计算系统中不确定性都为随机变量的工况,故在使用蒙特卡罗法时,将各个区间变量在可行域内均布取样30个点,对满足多椭球模型约束条件的区间样本点,调用107次原始极限状态函数,计算失效概率,最后挑选出失效概率的最小值和最大值,作为失效概率的上下限。由表2可见,当k值等于9时,计算结果与蒙特卡罗法获得的结果较接近,具有较高的计算精度;根据Nc可知,提出的基于HDMR的单步可靠性计算方法可较少地调用原始极限状态函数,求得较高精度的失效概率上下限值。

4.2 悬臂圆筒

某悬臂圆筒受外部载荷如图4所示:集中力F1、F2,P和扭矩T。当最大等效von-Mises应力σmax超出材料屈服极限σs时,认为悬臂圆筒强度失效,极限状态函数可写为

最大等效von-Mises应力位于悬臂圆筒根部截面上端点,其计算式为

其中,σx为该点处的正应力,表达式为

其中,M为该截面处弯矩,A为截面面积,I为截面惯性矩,τzx为该点的切应力。

表3给出了各个随机变量的分布参数及区间变量的特征矩阵,其中θ1和θ2为独立区间变量,其余不确定性变量均为随机变量。

比较研究了k值对计算结果精度的影响,表4给出了基于提出的方法,令k值分别为5、7和9时的计算结果。为验证计算结果的正确性,在蒙特卡洛法中,将两个区间变量在可行域内均布取样50个点,对满足多椭球模型约束条件的区间样本点,调用106次原始极限状态函数,计算失效概率,最后挑选出失效概率的最小值和最大值,作为失效概率的上下限。由表4可见,k值对该算例的计算结果几乎没有影响,并在k值较小时,失效概率上下限已接近基于蒙特卡罗法获得的值;根据Nc可得提出的基于HDMR的单步可靠性计算方法计算效率高。

5 结语

针对机械系统中随机变量和非独立区间变量共存的常见工况,基于椭球模型,利用HDMR法,提出了单步可靠性计算模型;使用多项式近似,提出了一种快速可靠性计算算法。由算例结果表明:该算法仅利用少量的原始极限状态函数的响应信息,或较少的调用次数,即可快速地计算获得较高精度的失效概率上下限。

在处理极限状态方程关于输入变量在可行区间内高度非线性情况时,基于二次多项式函数近似的高维模型的一阶分量函数可能会存在较大的误差,影响计算精度,提出多项式函数阶数自适应极限状态方程非线性的近似方法是一种可行的改进方法。

摘要:随机变量和非独立区间变量往往共存,两种变量共存不仅导致出现双层优化问题,而且会降低可靠性的计算效率。为解决双层优化问题和提高可靠性计算效率,基于椭球模型描述的非独立区间变量,利用高维模型表示方法(HDMR)解耦随机变量和非独立区间变量,转换双层优化问题为简单的单步求解问题,基于提出的采样方法,利用二次多项式近似HDMR展式,将隐式的单步求解问题转化为显式问题,提出了一种混合型单步可靠性计算方法。算例结果表明,所提出的单步可靠性计算方法具有较高的计算效率和精度;该方法仅需少量的极限状态函数调用次数,即可获得较高精度的计算结果。

上一篇:人性教育下一篇:高职企业财务管理