独立随机变量

2024-11-14

独立随机变量(共7篇)

独立随机变量 篇1

0 引言

在机械系统可靠性设计过程中,知识、试验条件、时间及经费等因素的限制,使得某些不确定性变量的统计信息不足,这导致不确定性变量的分布类型及分布函数不能被精确给定。这类因信息不足引起的不确定性被称为认知不确定性。不同于随机不确定性,认知不确定性可随信息量或知识的增加而减小甚至消失[1]。因此,在可靠性工程中,认知不确定性和随机不确定性往往共存。研究表明[2],认知不确定性对可靠性分析及设计结果的精度存在较大影响。

为定量描述认知不确定性变量,克服认知不确定性引起的可靠性分析及设计结果精度失真,目前已发展了多种不同类型的建模理论,分为概率建模理论和非概率建模理论,其中,概率建模理论主要为贝叶斯理论[3],非概率建模理论包括可能性理论[4]、证据理论[5]和凸集模型[6]。作为凸集模型特例的区间模型[7]是指在实数轴上规定认知不确定性变量可变区间的上下限。在本文中,基于区间模型描述的认知不确定性变量称为区间变量。在工程应用中,区间变量十分常见。因此,区间变量和随机变量共存条件下的混合型可靠性研究具有重要的学术价值及工程应用价值。

目前已有较多的处理独立区间变量的可靠性分析方法[7,8,9,10,11],但在实际工程中,某些区间变量存在一定的相关性,是非独立的。例如描述结构几何尺寸的区间变量和结构质量的区间变量一般存在相关性,较大的几何尺寸区间变量意味着较大结构质量区间变量,反之亦然。为此,Du[12]针对机构运动副,基于物理关系式推导获得非独立区间变量描述模型———等式与不等式约束条件,提出了一种随机变量和非独立区间变量的混合型可靠性设计方法。Jiang等[13]采用多维度平行六面体区间模型,考虑了区间变量为独立或非独立的情况,提出了一种新的非线性区间规划方法,但该规划方法未考虑系统中同时存在随机变量和区间变量的混合情况。Jiang等[14]引入样本相关系数,考虑非独立概率-区间混合情况,利用矩阵变换将非独立变量转换为独立变量,提出了一种双层迭代算法。姜潮等[15]通过引入相关角的概念定量描述了任意两个变量之间的相关性,将不同变量之间的相关性在一个统一的框架下度量,并构建了一高效求解方法。但上述的可靠性分析方法仍为双层优化问题,影响计算效率。故在非独立区间变量下,提出一种单层可靠性计算方法,提高可靠性分析的计算效率仍是当前可靠性分析方法研究的一大挑战。

为此,本文针对系统输入变量存在随机变量和非独立区间变量的混合情况,基于条件概率法和椭球模型,建立了混合型可靠性分析模型,提出了一种高效的单步可靠性模型及单步可靠性计算算法。利用高维模型表示方法[16](HDMR)解耦随机变量和非独立区间变量,将混合型可靠性分析模型转换为单步求解的可靠性分析模型;基于提出的采样方案,利用二次多项式近似HDMR展式,降低极限状态函数的调用次数,提高计算效率。

1 椭球模型

为描述非独立区间变量,Ben-Haim等[6,17]提出了椭球模型。设为区间变量的矢量,其中NY为区间变量的数量。在复杂机械系统中,区间变量的维度一般较高,非独立关系也不尽相同,如某些区间变量服从正相关关系,某些满足负相关关系,而某些是相互独立的。椭球模型根据不同的非独立关系,将区间变量归入不同的组。

经分组后,Y可表示为,其中,Ng为组的数量,Yi为第i组区间变量矢量,则椭球模型为

其中,S为区间变量可行域;Yic为第i组区间变量矢量的均值矢量,计算式为Yic=(YiL+YiU)/2,YiL和YiU分别为Yi的上下限矢量;Wi为第i个椭球模型的特征矩阵,为正定对称矩阵,它描述了第i个椭球的方向和长宽比。因可行域S由Ng个椭球组成,故该模型也称之为多椭球模型,单个椭球模型的变量不超过3个。

多椭球模型可描述不同非独立关系的区间变量:如当某区间变量是独立的,则椭球模型可退化为区间模型;当两个区间变量存在相关性,则椭球模型可退化为椭圆模型。图1给出了3个区间变量构成的不同几何形状的可行域S:在图1a中,3个变量是相互独立的;在图1b中,Y3是独立的变量,Y1和Y2存在相关性,是非独立的;在图1c中,3个变量存在相关性,是非独立的。

由于各个区间变量的单位不同,区间大小不同,不利于数值计算的稳定性,因此将区间变量Yi转换为量纲一变量Vi,转换关系式为

则分组后的区间变量矢量转换为,多椭球模型相应地表示为

其中,(矩阵Ci为对角矩阵,对角线元素为相应的区间变量均值),为量纲一特征矩阵。

式(3)给出的椭球模型主轴与坐标轴存在角度偏移,为使样本点尽可能多地落在椭球模型可行域内,提高二次多项式近似精度,引入线性变换

其中,Qi为正交矩阵,其列向量为的单位特征向量;Λi为对角矩阵,其对角线元素为相应的的特征值,满足,将椭球模型变换为中心位于坐标原点半径为1的球模型,然后将式(4)代入式(3),则椭球模型可描述为

2 混合型可靠性计算模型

设系统极限状态函数为

其中,为随机变量矢量,随机变量的个数为NX;为区间变量矢量,区间变量的个数为NY。将区间变量的变换关系式代入式(6),则极限状态函数可写为G=g(X,E)。

设G<0时系统失效,则系统失效概率pf可表示为pf=Pr{g(X,E)<0},其中Pr{·}表示概率。因未知区间变量E的概率分布,不能获得准确的失效概率。利用条件概率公式,可得失效概率的最小值pf,min和最大值pf,max的计算公式:

其中,gmax(X,E)和gmin(X,E)分别表示在可行域S内极限状态函数的全局最大值和最小值。

由式(7)和式(8)可见,系统失效概率的最小值和最大值分别为最大极限状态函数和最小极限状态函数的失效概率。这本质上为一个双层循环求解问题:内循环为区间分析,在可行域S内搜寻极限状态函数的极限值;外循环为概率分析,求解最大极限状态函数或最小极限状态函数的失效概率。

双层循环增加了可靠性分析问题的复杂性,会大幅度增加极限状态函数的调用次数。对于复杂机械系统,极限状态函数一般由计算机数值仿真模型(如有限元模型、流体动力学模型等)隐式表述,极限状态函数调用次数的增加,会导致计算效率低下,增大可靠性分析及设计的难度。

为提高随机变量和非独立区间变量混合情况下的可靠性计算效率,本文采用高维模型表示方法,将双层循环问题转化为单步问题,提出了一种单步快速的可靠性计算方法。

2.1 高维模型表示方法(HDMR)

高维模型表示方法是一种用于模型近似的处理方法,它常用于近似高维度输入系统的响应函数。研究表明,低阶的高维模型表示方法可精确描述大部分工程中的极限状态函数[18]。

本节主要介绍如何采用HDMR描述极限状态函数g(X,E)。设Z=(X,E)T,则g(X,E)可写为g(Z)。基于高维模型表示方法,g(Z)可表示为

其中,NZ为Z向量的元素个数,NZ=NX+NY;g0为0阶分量函数,为常量;gi(Zi)为1阶分量函数,表示输入变量Zi单独作用时对输出响应g(Z)的影响;gij(Zi,Zj)为2阶分量函数,表示输入变量Zi和Zj共同作用时对输出响应g(Z)的影响;更高阶的分量函数表示多个输入变量共同作用时对输出响应g(Z)的影响;最后一项表示所有残余的耦合输入变量对输出响应的影响。

切割法(cut-HDMR)是一种确定高维模型各个分量函数的常用方法。在切割法中,首先选定参考点c,再计算经过参考点c的线、平面、体积等切割几何上的响应值,分别确定各个分量函数。实际使用中,参考点c一般选定为输入变量可行空间内最感兴趣的点。

利用切割法,各分量函数可表示为

其中,g(Zi,ci)=g(c1,c2,…,ci-1,Zi,ci+1,…,cl),表示除了分量Zi,其余所有输入变量均固定在参考点c处,它是一个一元函数;类似地,g(Zi,Zj,cij)为二元函数;最后项g12…l(Z1,Z2,…,Zl)由真实响应值和基于高维模型表示方法的预测值的残差确定。

在高维模型表示方法中,1阶、2阶、3阶等分量函数与泰勒级数展开式中相应的分量函数有着本质区别。经证明,高维模型表示方法中的1阶分量函数gi(Zi)是泰勒级数展开式中仅含有变量Zi分量函数的集合;类似地,2阶分量函数gij(Zi,Zj)是泰勒级数展开式中仅含有变量Zi和Zj分量函数的集合。1阶分量函数gi(Zi)可以是非线性的。因此,较截断的泰勒级数展式,任意相应截断的高维模型表示方法的展式具有较高的精度。

2.2 单步可靠性计算模型

若极限状态函数可描述为关于随机变量和区间变量相互分离的两部分函数,则双层循环问题可变为单层问题,提高计算效率。

利用1阶HDMR展式,极限状态函数可近似为

如前所述,1阶HDMR展式gi(Xi)和gi(Ei)分别是泰勒展式内仅含有变量Xi和Yi所有分量函数的集合,因此,相对于1阶泰勒展式,1阶HDMR展式没有限定近似表达式的非线性。这提高了1阶HDMR展式的近似精度。

基于1阶HDMR展式的近似表达式,失效概率的最小值和最大值的计算模型可写为

其中,GGmin和GGmax分别表示在可行域S内极限状态函数的全局最小值和最大值,计算式分别为

由此可见,基于1阶HDMR展式,随机变量和区间变量下的混合型可靠性计算模型已转化为单步可靠性计算模型:首先使用非线性约束优化法求得GGmin和GGmax,再使用常规可靠性分析方法,如蒙特卡罗法(MCS)、一次二阶矩法(FORM)等,求得失效概率上下限。

3 计算失效概率

使用单步可靠性计算模型计算失效概率上下限时,需确定参考点c和各个一元函数表达式。参考点c对可靠性计算结果的精度具有一定的影响。为提高精度,参考点c一般选定为输入变量可行空间内最感兴趣的点。区间变量的可行区间往往较小,区间变量可行区间内的中点可兼顾两个边界点,为此,将区间变量可行区间内的中点及区间变量固定在中点时的最大概率点(MPP)对应的随机变量值设定为参考点c。

最大概率点u*的数学计算模型为

其中,为独立的随机变量矢量,服从标准正态分布,由随机矢量X经Rosenblatt变换获得。

一旦求得MPP,则参考点c为

其中,Φ(·)为标准正态分布函数;为随机变量Xi的分布函数的逆函数。

基于求得的参考点c,使用二次多项式近似表达各个一元函数表达式。设gi(Xi,ci)和gi(Ei,cn+i)的近似式分别为

其中,ai0、ai1、ai2、bi0、bi1和bi2分别为二次多项式的待定系数。

采用最小二乘法求解各个二次多项式的待定系数。在最小二乘法中,对于随机变量Xi,沿过参考点c的Xi轴,在[μi-3σi,μi+3σi]区间内均匀分布k(k=5,7,9)个样本点,如图2所示,其中μi和σi分别为随机变量Xi的均值和标准差。各个样本点的坐标值为μi-3σi,μi-3σi+6σi/(k-1),…,μi,μi+6σi/(k-1),…,μi+3σi。对于变换后的区间变量Ei,沿过参考点c的Ei轴,在[-1,1]区间内均匀分布k(k=5,7,9)个样本点,如图2所示。各个样本点的坐标值为-1,-1+2/(k-1),…,0,2/(k-1),…,1。

将式(20)和式(21)代入式(14)~式(17),可得失效概率的最小值和最大值的计算式分别为

其中,GGmin和GGmax的计算式分别为

因均为显式表达式,则GGmin和GGmax可由现有的非线性优化算法快速求解获得,如二次序列规划算法(SQP);代入求得的GGmin和GGmax,使用蒙特卡罗法(MCS)求解失效概率的最小值和最大值。

一旦最大概率点(MPP)和各个二次多项式系数确定,基于HDMR的混合型可靠性计算方法就无须再调用原始的状态极限函数。这可大幅度提高计算效率,尤其当极限状态函数以隐式的计算机仿真模型表述时,调用一次状态极限函数的用时一般较长。为高效求得最大概率点,已有学者提出了较多的数值算法,如HLRF法[19,20]、iHLRF法[21]等。作为HLRF法的改进,iHLRF法引入了价值函数,在处理非线性度较高的极限状态函数时仍具较好的收敛性,故被广泛应用。为此,采用iHLRF法求解最大概率点。

4 算例

在MATLAB下,编写了提出的单步可靠性算法可执行程序,计算了两个混合型可靠性分析算例,其中第一个算例的非线性较低,输入变量的维度较低,相比于第一个算例,第二个算例的非线性度较高,输入变量的维度也较高,用于验证提出的单步可靠性算法在处理较高非线性和高维度时的计算效率及精度。在算例中,使用调用原始极限状态函数的次数Nc评定计算效率。尽管两个算例的极限状态函数均以显式表达式给出,但都编写成了可执行程序,故对于调用函数,极限状态函数是隐式的。在用于求解最大概率的iHLRF算法中采用向前有限差分法计算极限状态函数关于随机变量的梯度。

4.1 悬臂梁

某悬臂梁末端受外部载荷,其中,水平方向分量为Px,垂直方向分量为Py,如图3所示。当梁末端位移大于末端许用位移D0时,认为刚度失效,则极限状态函数为

其中,L为悬臂梁长度;b和h分别为矩形梁截面的宽度和高度;E为材料弹性模量。

已知,末端许用位移D0=65mm。表1给出了各个随机变量的分布参数及区间变量的特征矩阵,其中,L、b和h均服从正态分布;弹性模量E为独立区间变量,载荷分量Px和Py为非独立区间变量。

为研究不同样本数量对计算结果精度的影响,在使用提出的可靠性计算方法计算失效概率时,令k值分别为5、7和9。表2给出了不同k值时的失效概率结果。为验证计算结果的精度,同时使用了蒙特卡罗法计算失效概率。因蒙特卡罗法仅能计算系统中不确定性都为随机变量的工况,故在使用蒙特卡罗法时,将各个区间变量在可行域内均布取样30个点,对满足多椭球模型约束条件的区间样本点,调用107次原始极限状态函数,计算失效概率,最后挑选出失效概率的最小值和最大值,作为失效概率的上下限。由表2可见,当k值等于9时,计算结果与蒙特卡罗法获得的结果较接近,具有较高的计算精度;根据Nc可知,提出的基于HDMR的单步可靠性计算方法可较少地调用原始极限状态函数,求得较高精度的失效概率上下限值。

4.2 悬臂圆筒

某悬臂圆筒受外部载荷如图4所示:集中力F1、F2,P和扭矩T。当最大等效von-Mises应力σmax超出材料屈服极限σs时,认为悬臂圆筒强度失效,极限状态函数可写为

最大等效von-Mises应力位于悬臂圆筒根部截面上端点,其计算式为

其中,σx为该点处的正应力,表达式为

其中,M为该截面处弯矩,A为截面面积,I为截面惯性矩,τzx为该点的切应力。

表3给出了各个随机变量的分布参数及区间变量的特征矩阵,其中θ1和θ2为独立区间变量,其余不确定性变量均为随机变量。

比较研究了k值对计算结果精度的影响,表4给出了基于提出的方法,令k值分别为5、7和9时的计算结果。为验证计算结果的正确性,在蒙特卡洛法中,将两个区间变量在可行域内均布取样50个点,对满足多椭球模型约束条件的区间样本点,调用106次原始极限状态函数,计算失效概率,最后挑选出失效概率的最小值和最大值,作为失效概率的上下限。由表4可见,k值对该算例的计算结果几乎没有影响,并在k值较小时,失效概率上下限已接近基于蒙特卡罗法获得的值;根据Nc可得提出的基于HDMR的单步可靠性计算方法计算效率高。

5 结语

针对机械系统中随机变量和非独立区间变量共存的常见工况,基于椭球模型,利用HDMR法,提出了单步可靠性计算模型;使用多项式近似,提出了一种快速可靠性计算算法。由算例结果表明:该算法仅利用少量的原始极限状态函数的响应信息,或较少的调用次数,即可快速地计算获得较高精度的失效概率上下限。

在处理极限状态方程关于输入变量在可行区间内高度非线性情况时,基于二次多项式函数近似的高维模型的一阶分量函数可能会存在较大的误差,影响计算精度,提出多项式函数阶数自适应极限状态方程非线性的近似方法是一种可行的改进方法。

摘要:随机变量和非独立区间变量往往共存,两种变量共存不仅导致出现双层优化问题,而且会降低可靠性的计算效率。为解决双层优化问题和提高可靠性计算效率,基于椭球模型描述的非独立区间变量,利用高维模型表示方法(HDMR)解耦随机变量和非独立区间变量,转换双层优化问题为简单的单步求解问题,基于提出的采样方法,利用二次多项式近似HDMR展式,将隐式的单步求解问题转化为显式问题,提出了一种混合型单步可靠性计算方法。算例结果表明,所提出的单步可靠性计算方法具有较高的计算效率和精度;该方法仅需少量的极限状态函数调用次数,即可获得较高精度的计算结果。

关键词:椭球模型,非独立区间变量,高维模型表示方法,快速可靠性方法

独立随机变量 篇2

随机变量的许多重要数字特征都与该随机变量的高阶矩有关[1,2],例如,随机变量的标准化量的三阶矩是该随机变量的偏度、标准化量的四阶矩是该随机变量的峰度等,这些高阶矩在金融投资、保险和数据传输中都有着重要的应用[3,4,5]。因此,高阶矩的计算就显得尤为重要。

独立同分布随机变量和的分布及其数字特征是保险和精算领域的重点研究对象之一[6]。精算学中将被保险人的理赔额看作是一个随机变量,由于多个被保险人之间通常是彼此没有联系的,所以保险人在保单存续期内的总的理赔额就可以看作是这些彼此相互独立的随机变量的和。研究这个和的分布及其数字特征对于保险公司而言有着重要的实际意义。

本文选取了均匀分布作为研究对象,利用组合数学中的第二类Stirling数、多项式定理和二项式定理,对独立同U(0,1)和U(a,b)随机变量和的高阶矩进行了计算,得到了相应的计算公式。

1基本概念及引理

定义1[7]若连续型随机变量X的概率密度为

f(x)={1b-a,a<x<b0,

则称X在区间(a,b)上服从均匀分布,记为XU(a,b)。

定义2[8]将n个元素的集合划分成k个块的划分数称为第二类Stirling数,记为S(n,k)。对于1≤kn,有S(n,k)>0;对于1≤n<k,有S(n,k)=0。此外,规定S(0,0)=1;对于k≥1,S(0,k)=0。 换言之,S(n,k)的组合意义就是将n个不同的球分配到k个不加区别的盒子中去,不考虑盒子的顺序,没有盒子为空的分配数,因此有

S(n,k)=1k!i1++ik=nijΖ+,j=1,,k(ni1i2ik)

第二类Stirling数的递推关系式[8]:

S(n,k)=k·S(n-1,k)+S(n-1,k-1)。

根据此递推关系式和第二类Stirling数的初始值,可以计算S(n,k)。

引理1[9](二项式定理) 令n为一正整数,对于所有的xy,有

(x+y)n=k=0n(nk)xn-kyk

引理2[9] (多项式定理) 令n为一正整数,对所有的x1,x2,…,xm,有

(x1+x2++xm)n=n1++nm=nnjΝ,j=1,,m(nn1n2nm)x1n1x2n2xmnm

引理3[6] 若XU(0,1),则

E(Xk)=1k+1;k=1,2,3,…。

引理4[6] 若XU(a,b),则

X-ab-aU(0,1)

2主要结论

定理1 设X1,…,Xm独立同分布于U(0,1),则

证明 根据引理2和数学期望的性质,有

E[(X1+X2++Xm)n]=E[i1++im=nijΝ,j=1,,m(ni1i2im)X1i1X2i2Xmim]=i1++im=nijΝ,j=1,,m(ni1i2im)E(X1i1)E(X2i2)E(Xmim)

根据引理3,有E(Xjij)=11+ij(j=1,,m),所以有

E[(X1+X2++Xm)n]=i1++im=nijΝ,j=1,,m(ni1i2im)11+i111+i211+im=i1++im=nijΝ,j=1,,mn!(1+i1)!(1+i2)!(1+im)!

此处,令1+ij=ij,(j=1,…,m),则i1+i2+…+im=n变成i′1+i′2+…+im=n+m;ijN变成ijZ+,有

E[(X1+X2++Xm)n]=i1++im=n+mijΖ+,j=1,m(n+m)!(i1)!(i2)!(im)!n!(m+n)!=n!m!(m+n)!1m!i1++im=n+mijΖ+,j=1,,m(m+ni1i2im)

根据定义2,知

所以有

定理2 设Y1,Y2,…,Ym独立同分布于U(a,b),则

E[(Y1+Y2+Ym)n]=k=0n(nk)(b-a)k(ma)n-kS(m+k,m)(m+kk)

证明 由Y1,Y2,…,Ym独立同分布于U(a,b),令Xi=Yi-ab-a,(i=1,2,,m),根据引理4,有X1,X2,…,Xm独立同分布于U(0,1),所以有

E[(Y1+Y2+…+Ym)n]=

E[(ma+(b-a)(X1+X2+…+Xm))n]。

根据引理1和数学期望的性质,有

E[(Y1+Y2++Ym)n]=E[k=0n(nk)(b-a)k(X1+X2++Xm)k(ma)n-k]=k=0n(nk)(b-a)k(ma)n-kE[(X1+X2++Xm)k]

根据定理1的结论,有

E[(Y1+Y2++Ym)n]=k=0n(nk)(b-a)k(ma)n-kS(m+k,m)(m+kk)

3计算实例

根据定理1的结论,取m=1,2,3;n=1,2,3,4,得到m个独立同U(0,1)随机变量和的n阶矩,如表1所示。

根据定理2的结论,取a=2;b=4;m=1,2,3;n=1,2,3,4,得到m个独立同U(2,4)随机变量和的n阶矩,如表2所示。

参考文献

[1]于晶贤.一类离散型随机变量高阶原点矩的递推计算方法.科学技术与工程,2010;10(15):3681—3683

[2]于晶贤,李金秋.泊松分布高阶原点矩的两种计算方法.数学的实践与认识,2010;40(21):221—224

[3]王莺歌,江孝感.高阶矩风险与金融投资决策.价值工程,2008;9:7—10

[4]赵晓瑜,谭忠.含有高阶矩的CAPM在保险业的应用.山西财经大学学报,2007;1:106—107

[5]赵国英,向世明,李华.高阶矩在颜色传输中的应用.计算机辅助设计与图形学学报,2004;1:62—66

[6]卡尔斯R,胡法兹M,达呐J,等.现代精算风险理论.唐启鹤,胡太忠,成世学,译.北京:科学出版社,2005

[7]盛骤,谢式千,潘承毅.概率论与数理统计.第四版.北京:高等教育出版社,2008

[8]王天明.近代组合学.大连:大连理工大学出版社,2008

随机变量的数字特征的应用 篇3

随机变量的数字特征尤其是数学期望在很多领域 (如:在风险决策、就业决策、投资、证券投资、经济决策、利润效益和贝叶斯决策等) 都有非常重要的应用。下面就几种情况分别讨论。

(1) 随机变量的数字特征在经济决策问题中的应用

在经济生活中, 不论是厂家的生产还是商家的销售, 总是追求利润的最大化, 供大于求或供小于求都不利于获得最大利润;但供应量和需求量又不是能预先知道的, 理性的厂家或商家往往根据过去的数据 (概率) , 用数学期望结合其他知识来做决策。

假定某公司计划开发一种新产品市场, 并试图估计其产量。估计出售一件产品公司可获利m元, 而积压一件产品可导致损失n元。另外该公司预测产品的销售量为一随机变量X, 其分布为p (x) 。那么产品的产量该如何确定才能获得最大利润。假设该公司每年生产x件, 尽管x是确定的, 但由于需求量 (销售量) 是一个随机变量, 所以收益Y也是一个随机变量, 它是X的函数:, 于是期望收益为。问题转化为当x为何值时期望收益可以达到最大值。

举一个应用数学期望解决贝叶斯决策的相似性问题.利用损失函数下的先验期望准则来做决策。

原理:对给定的决策问题, 若在状态集Θ上有一个正常的先验分布π (θ) , 则损失函数L (θ, a) 对π (θ) 期望与方差L (a) =EθL (θ, a) , Var[L (θ, a) ]=Eθ[L (θ, a) ]2-[EθL (θ, a) ]2。

分别称为先验期望损失和损失的先验方差, 使先验期望损失达到最小的行动a′, , 称为先验期望准则下的最优行动, 若此种最优行动不止一个, 其中先验方差达到最小值的行动称为二阶矩准则下的最优行动。

例如:某公司购进某种货物可分为大批、中批和小批三种行动, 依次记为a1、a2、a3。未来市场需求量可分为高、中、低三种状态, 依次记为θ1、θ2、θ3。三个行动在不同市场状态下获得的利润如下 (单位:千元) , 问题是寻找最优决策:题干中的矩阵为一个收益矩阵, 现在把它变换为损失矩阵, 即, 在有先验信息的情况下, 即如今公司经理经过专家咨询后认为未来市场对该商品的需求量是中等, 据此公司经理用主观概率给出如下先验分布π (θ1) =0.2, π (θ2) =0.7, π (θ3) =0.1, 用此先验分布算得行动a1, a2, a3的先验期望损失和损失的先验方差。比较先验期望损失大小可得a2 (中等采购量) 是先验期望损失准则下的最优行动。考虑到a1与a2的先验期望损失紧差1.07-0.98=0.09, 而a1的先验方差要比a2的先验方差小的较多, 为避免大的风险, a1亦是可采取的行动。

(2) 现今大多数人都有过购买股票或有价证券的经历, 但其中的大多数人都不是理性的, 那么理性的决策者在购买股票时会怎样做呢?

如何才能把风险降到最小也是很重要的一点。在投资环境日趋复杂的现代社会, 几乎所有的投资都是在风险和不确定情况下进行的, 一般地说, 投资者都讨厌风险并力求回避风险。风险是某一行动的结果具有多样性。风险是客观存在的, 它广泛影响着企业的财务和经营活动, 因此, 正视风险并将风险程度予以量化, 成为企业财务管理中的一项重要工作。衡量风险大小需要使用概率和统计方法, 最常用的知识就是数学期望和方差。

收益的数学期望:

例如:某公司拟对外投资, 现有A公司、B公司和C公司有关股票收益的资料如下表:

下面, 根据上述期望值公式计算A、B、C公司的预期收益率:

在预期收益率相同的情况下, 投资的风险程度同收益的概率分布有密切的联系。A、B公司的预期收益率都是20%, 但相比之下可以发现B公司的预期收益率非常分散, 而A公司的预期收益率较集中, 可认为A公司的投资风险要比B公司小, 由此得如下结论:即预期收益的概率分布越狭窄, 其投资风险越小, 反之亦然。

(3) 总结

以上内容只是随机变量的数字特征在某些领域的相关应用, 虽然还不是很成熟, 面对复杂的经济等问题, 苛求完善是不足取的, 毕竟期望原理正推动着经济学的发展, 为经济学定量化研究, 特别是对不确定决策研究提供了有力的原理工具, 随着经济学和数学的发展, 期望原理的实用性将会逐渐提高。相信随着时代和经济的发展不仅是随机变量的数字特征更多的和统计知识方法有关的研究会应用到越来越多地方, 一定会发挥着不可估测的作用。

参考文献

[1]辽宁, 齐飞.概率论的产生与发展[J].

[2]林少宫, 李楚霖.简明经济统计与计量经济[M].上海人民出版社.

[3]徐建中, 编.证券投资策略与方法[M].上海远东出版社.

独立随机变量 篇4

求二维随机变量函数的密度函数是概率论中的一个重要内容, 由于变量分布的差异性, 如何求又是一个难题, 一般没有统一的公式可循。一般教材中介绍了常用的方法, 即先求分布函数, 然后对分布函数求导就得密度函数, 但计算比较麻烦, 学生掌握困难很大。变量变换法和增补变量法相对于常用方法而言, 计算过程更加简捷。其中变量变换法许多学者都有研究, 而增补变量法甚少提及, 总结多年教学经验发现, 学生难以掌握这部分内容的精髓, 运用起来容易犯错, 特别表现在确定被积函数的积分区域上, 本文针对这个问题理清了一个简单通用的确定方法。

二增补变量法

增补变量法实质上是变量变换法的一种应用:为了求出二维连续随机变量 (X, Y) 的函数Z=g (X, Y) 的密度函数, 增补一个新的随机变量V=h (X, Y) 。先用变量变换法求出 (Z, V) 的联合密度函数pZV (z, v) , 再对pZV (z, v) 关于v积分, 从而得到关于Z的边际密度函数pZ (z) 。

问题: (1) 如何增补新随机变量? (2) 如何确定p (z, v) 中v的积分区域?

第二个问题, (Z, V) 的联合密度函数pZV (z, v) 的解析式中只含有z和v两个量, 对v积分时, 积分上下限一定是关于z的表达式。在二维连续随机变量 (X, Y) 的联合密度函数pXY (x, y) 的非零区域里, 画出函数Z=g (X, Y) 的曲线, 用曲线与非零区域相交点确定积分的上下限。

解:本例题作为示范题, 先记V=Y求出Z=X+Y的密度函数, 再换V=X用同样的方法求出Z=X+Y的密度函数, 如果两次求出的密度函数相同, 即验证方法的正确性。

由例题可以看出, 只要掌握了增补变量和确定积分区域的技巧, 增补变量法是一个极易掌握而且便于计算的方法。

增补变量法将比较难求的多维连续随机变量函数的密度函数, 转化为求变换后的两个变量的联合密度函数, 然后利用联合密度函数与边际密度函数之间的关系, 积分求出要求的变量的密度函数。相对于常用方法, 可简化运算。

摘要:二维连续随机变量函数的密度函数的计算是概率论教学中的一个重点, 更是一个难点, 其中增补变量法是一个简洁明了易掌握的方法, 但学生不能准确确定联合密度函数的积分区域, 本文针对这个问题给出了确定积分区域的方法。

关键词:连续随机变量,密度函数,增补变量法

参考文献

[1]茆诗松、程依明、濮晓龙编著.概率论与数理统计教程 (第二版) [M].北京:高等教育出版社, 2011:169~171

[2]王凡彬、严雳.多维随机变量函数密度的求解方法[J].内江师范学院学报, 2012 (10) :17~19

[3]余本国.一般二维连续型随机变量函数分布的讨论[J].华北工学院学报, 2004 (2) :94~96

[4]李思齐、李昌兴、柳晓燕.二维连续型随机变量函数的分布密度的计算[J].大学数学, 2011 (5) :162~166

独立随机变量 篇5

到目前为止,多变量辨识方法比较多,比如最小二乘算法、随机梯度算法、辅助变量算法、极大似然算法等等,这么多算法究竟哪个计算量更小,收敛性能更好,实用性更强,谁优谁劣究竟如何评判,这是问题的关键。不过理论上很难从多方面判断算法的优劣和实用性,可通过具体的仿真例子为辨识算法的选择作理论上的指导。本文用随机梯度搜索原理或随机逼近原理,研究了遗忘梯度算法,子系统遗忘梯度算法和递阶遗忘梯度算法,并通过仿真比较研究它们的估计精度的高低和收敛性能的好坏,使算法能更好的指导实际的应用。

1 多变量系统辨识模型

一个状态空间描述的多变量系统,化为传递矩阵描述,经过参数化可以化为下列形式的差分方程[1],

(1)式中u(t)∈瓗r和y(t)∈瓗m分别是系统输入和输出向量,v(t)∈瓗m为零均值白噪声向量瓗1和瓗m×r分别是待辨识的系统参数和参数矩阵。

定义参数矩阵θ、参数向量为α、输入信息向量φ(t)和输出信息矩阵ψ(t)分别为

瓗ψ(t)∶=[y(t-1),y(t-2),…,y(t-n)]∈瓗m×n因此,可以得到随机系统辨识模型,

2 梯度辨识算法

辨识模型(2)式既包含一个参数向量α∈瓗n,又包含了一个参数矩阵θT∈瓗m×n0,使得传统的辨识方法,如递推最小二乘算法(RLS)和随机梯度算法(SG)等,不能直接辨识这模型的参数向量和参数矩阵[2]。一种直观的方案是,将该系统重新参数化,得到一个包含参数向量α与参数矩阵θ所有元的高维参数向量∈瓗n+mn0。另一种方案是,把辨识模型(2)式按照输出的数目分解为m个子系统,然后分别辨识每个子系统的参数向量。还有一种方案是,采用递阶辨识原理,直接辨识参数向量α∈瓗n与参数矩阵θ∈瓗n0×m,这种方法计算量最小在这三种辨识方案中,都可以采用最小二乘优化原理和随机梯度搜索原理(或随机逼近原理),来研究相应的辨识方法。限于篇幅,本文只介绍基于随机梯度的辨识方法。下面分别介绍这几种辨识方案和具体辨识算法,并比较各种方法的优缺点。

2.1 随机梯度算法

先引入一些符号。设Im是m×m单位阵:表示Kronecker积或直积,col[X]表示将矩阵X的列按次序排成的向量。

定义扩展的参数向量和扩展的输入输出信息矩阵分别为

瓗。于是辨识模型(2)式可以转化为熟悉的形式,

极小化准则函数可得带遗忘因子的随机梯度算法,简称遗忘梯度算法(FG),

其中(t)是的估计,λ为遗忘因子称为时变收敛因子。算法初始值可取为一个小实参数向量,如(0)=1(mnr+n)×1/p0,p0=106。遗忘梯度算法比SG算法有较快的收敛速度,而且具有克服数据饱和和跟踪时变参数的能力。关于算法的收敛性,可参考文献[3,4]证明。

2.2 子系统随机梯度算法

FG算法虽然比较直观,思路也简单,但是参数向量维数很高,且信息矩阵Υ(t)含有大量的零元素,这使得算法计算量很大。为克服这些缺点,下面研究分子系统的辨识算法,基本思想是将一个多输入多输出系统分为多个多输入单输出子系统,然后分别辨识每个分子系统的参数向量。

令表示向量y(t)的第j个元表示信息矩阵ψ(t)第j行表示信息矩阵v(t)第j个元表示参数矩阵θ第j列。辨识模型(2)式可以分解为m个子系统,

(5)式中第j个子系统的信息向量和参数向量分别为

定义和极小化m个准则函数

可以得到每个子系统的带遗忘因子随机梯度算法,简称子系统遗忘梯度算法(S-FG),

因为在每一个子系统都要估计α向量一次,所以α的估计可取m次估计的平均值,子系统随机梯度法避免了出现大量零元的信息矩阵,参数维数也由原来的n+mn0降低到n+n0,计算量大大减少,所以S-FG算法是优于遗忘梯度算法。

2.3 递阶随机梯度算法

尽管子系统随机梯度算法降低了参数维数,减少了计算量,但是由于每一个子系统都包含参数向量α,所以要(重复)估计m次α,增加了不必要的计算量。而下面要讨论的递阶随机梯度算法,既不包含大量零元,又不必(重复)估计参数向量α,计算量是最小的。

递阶随机梯度算法是基于递阶辨识原理提出的[1]。根据式(2)定义准则函数,

根据负梯度搜索原理,得到估计α和θ的带遗忘因子的递阶随机梯度辨识算法(FFHSG),简称递阶遗忘梯度算法(HFG),

这里α(t)和θ(t)分别是α和θ的估计。

3 仿真实验与算法比较

考虑2输入2输出一阶仿真系统,其中α=-0.8,θT=[2.0,1.0;1.0,2.0]。仿真时,{u1(t)}和{u2(t)}采用零均值单位方差不相关可测的持续激励信号序列,{v1(t)}和{v2(t)}采用零均值方差分别为σ2(1)=0.42和σ2(2)=0.52的白噪声序列,对应两个输出通道的信噪比分别为δns(1)=50.99%和δns(2)=51.51%。用本文三个算法估计这个系统参数,这里由于篇幅所限,只给出λ=0.98时参数估计相对误差误差随t变化曲线如图1所示。

从这个仿真例子的仿真结果,可以得出结论:这三个算法有一个相同点,即随着递推计算步骤的增加,参数估计误差(总的趋势)不断减小,即数据量越大,参数估计精度越高;当λ相同时,S-FG算法收敛最快,FG算法收敛最慢,HFG算法介于二者中间,而且平稳性也介于两者之间;对于很大的t(数据长度),三个算法最终的估计误差曲线相差不大,参见图1,但递阶遗忘梯度算法计算量最小。

4 结论

本文针对多变量系统研究了三个随机梯度型辨识方法,并对这三个算法的性能和特点进行了分析比较。

摘要:针对工业中广泛存在的多变量系统,研究了辨识这类系统的遗忘梯度辨识算法,分子系统遗忘梯度辨识算法和递阶遗忘梯度辨识算法,对这三种算法的计算量进行了比较分析,并给出了仿真例子。

关键词:最小二乘,随机梯度,递阶辨识,多变量系统

参考文献

[1]Feng Ding,Chen Tongwen.Hierarchical gradient-based identification of multivariable discrete-time systems.Automatica,2005;41(2):315—325

[2]方崇智,萧德云.过程辨识.北京:清华大学出版社,1988

[3]丁锋.随机梯度算法的收敛性分析.清华大学学报,1999;39(1):83—86

独立随机变量 篇6

在讲授概率统计课程中随机变量及其分布这一章时,一种常见顺序是:随机变量的分布函数,离散型随机变量及其分布律,连续型随机变量及其概率密度函数[1].这种安排基本合理,但在实际讲授之后往往效果不佳,常出现学生对分布函数的重视程度不够,难以理解概率密度函数概念,易混淆分布函数,分布律和密度函数以及书写时符号混乱等问题.究其原因,主要是对初学者来说:随机变量概念很难理解到位;概率密度函数概念的出现太过突兀;分布函数,分布律,概率密度三者相互之间既有联系又有区别,易造成混淆.

二、问题驱动式解决方案

针对以上症结,在不改变上述顺序的前提下,本文对随机变量及其分布一章的主要知识点采用6个关键问题进行驱动,促进学生主动思考,加深基本概念的理解,区分易混淆概念,使内容层层递进,各部分自然衔接,知识点融会贯通.同时适当融入研究型教学方式,培养学生的思维和创造能力.

以下将按各教学内容详述此问题驱动式教学过程.

内容一:随机变量

随机变量是本章的首个关键概念,它在概率统计中的重要地位和对后续内容的深远影响不言而喻.然而,此前学生关注的一直是各种随机事件的概率计算,如何引入随机变量概念才能让他们认识到其必要性和重要性?为此提出第一个问题:

问题1何为随机变量?为什么要引入随机变量的概念?

从生活实例出发,让学生初步体会随机变量.如生活中常关心的一些量:某城市一个月的降雨量,某银行一天接待的顾客数,这些量的取值看似随机变化,但在多次观察时又呈现某种确定的统计规律.这种变量就是随机变量,对之常关注:(1)变量可能取哪些值;(2)取各值的可能性大小.

接着指出:实际中所关心的对象还有很多也是随机变化的,但它们本身并不是数,如天气状况,疾病化验结果等.为方便用数学工具研究这些对象的变化规律,有必要把非数的试验结果(样本点)数量化.于是自然定义样本空间到实数域的映射:ω→X(ω),把非数的试验结果全部转化为数.此定义在样本空间上的实值函数X(ω)就是随机变量,它与普通函数的区别在于:函数值是由试验结果决定的,故称为随机变量——随机会而取值的变量.通过实例可说明:随机变量的取值情况完整描述了随机试验中的各种随机事件,故今后将研究重点放在随机变量上.此时再给出随机变量的数学定义则水到渠成,解答了学生“为什么要讨论随机变量?随机变量有什么用?”的疑问,并奠定了随机变量在今后学习中的重要位置.

内容二:随机变量的分布函数

在引入随机变量的概念之后,由以下问题自然带入随机变量的分布函数.

问题2随机变量的本质特征在于其可能取值和取值的概率分布情况,用什么工具来描述随机变量的概率分布情况?

直接给出分布函数的定义会稍显生硬,可通过例子引入.

实际中,人们常关心随机变量在某范围内取值的概率.如:产品质量检查时,随机抽取的n件产品中次品件数X不超过3的概率P{X≤3},某公司生产的某一型号液晶电视寿命X在(45000,55000)(小时)之间的概率P{45000<X≤55000}.

若对任意实数x,都存在概率P{ω:X(ω)≤x}=P{X≤x}=F(x),以上问题就迎刃而解(这也解释了为什么随机变量的定义中要求对任意实数x,事件{ω:X(ω)≤x}的概率都是可确定的).这个函数F(x)就是随机变量的分布函数,它可描述随机变量在任一区间取值的概率P{x1<X≤x2}=F(x2)-F(x1),甚至在任意一点取值的概率P{X=x}=F(x)-F(x-0).只要是随机变量就存在分布函数,分布函数可描述任一随机变量的概率分布.

在此讲解分布函数有如下好处:体现了分布函数的重要性和一般性,与本章最后内容:随机变量除了离散型,连续型外还有奇异型前后呼应.

内容三:离散型随机变量及其分布律

问题3对取值离散的随机变量,如何描述其概率分布比较方便?

用一实例引入离散型随机变量及其分布律,并用柱状图或火柴棍图来直观表示.提问:对离散型随机变量来说,分布律和分布函数都可描述其概率分布,哪种描述方式比较直观方便?学生能够自己看出是分布律.在教师引导下讨论总结:分布函数与分布律均可描述离散型随机变量的概率分布,二者可互相转化,只是描述方式不同而已.对离散型随机变量往往选择更直观的工具———分布律.

内容四:连续型随机变量及概率密度函数

很多现行教材都直接给出连续型随机变量及其概率密度函数的定义[1,2],这固然是由于教材限制所致,但若在课堂讲授时也直接抛出此概念,会让学生觉得非常突兀,造成理解和学习上的困难.实际上,离散型随机变量与连续型随机变量有诸多可类比性质[3],故本文的解决办法是由离散型随机变量的分布律进行类推,过渡到连续型随机变量的概率密度.具体为讲完分布律后提出如下问题.

问题4对取值连续的随机变量来说,能否用分布律来直观描述其概率分布?

例:一半径为2米的圆盘靶子,击中靶上任一同心圆盘的概率与该圆盘的面积成正比,若射击均能中靶,用X表示弹着点与圆心的距离.能用分布律来描述X的概率分布吗?

学生会发现不行,因为X的取值是连续的!继续提问:

问题5能否找到类似离散型随机变量分布律的工具来直观描述这种取值连续的随机变量的概率分布?

此处需事先做好两项准备工作.

1. 理解频率直方图.

例:为了解某地区成年男子的身高情况,从该地区所有成年男子中随机抽取100名进行调查.问:如何根据这些数据(略,单位:cm)分析该地区成年男子身高X的分布情况?

用此例讲解频率直方图的做法以及含义.重点在于指出:频率直方图利用将连续取值离散化的手段直观体现了身高X这个取值连续的随机变量的大致分布情况,具有与分布律类似的特征.

2. 基本弄清频率与概率的关系.

因后面学习大数定律时才能明确频率依概率收敛于概率,现只需学生理解随试验次数增多频率会逐渐稳定于概率即可,用抛硬币例子数据进行说明.

现在可向概率密度过渡.在频率直方图中,随机变量在某一区间取值的频率,为该区间上小矩形的面积之和.当样本数据很多,组距很小时,各小矩形会非常密集.设想:n趋于无穷,组距趋于0时,直方图中变量的有限多个离散取值范围将趋于无限多个连续取值,而图中小矩形边缘将逐渐稳定在一条光滑(或分段光滑)曲线附近,设为函数f(x).

与离散型情况类似:分布函数和概率密度均可描述连续型随机变量的概率分布,只是方式不同,二者可相互转化,但概率密度较分布函数更为直观.

内容五:其他类型的随机变量

问题6除了离散型随机变量和连续型随机变量之外,还有其他类型的随机变量吗?

在教师引导下,学生发现此分布函数不符合离散型或连续型变量分布函数的特征,故其对应随机变量既非离散型,也非连续型.这时不能用分布律或概率密度来描述其概率分布,但分布函数仍适用,体现了分布函数的一般性和重要性.

三、总结

如上,通过六个问题逐步带出本章各重要概念和知识点,有利于激发学生自主探索的欲望,使本章内容保持一致性与连贯性,学生对分布函数,分布律,概率密度各概念的理解更深入,应用时不易产生混淆.并利用类推与研究式教学较好地处理了概率密度这个教学难点,其中运用的微积分知识还加强了不同学科知识的融合,提高了学生分析处理问题的能力.

参考文献

[1]徐全智,吕恕.概率论与数理统计[M].北京:高等教育出版社,2010.

[2]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.

独立随机变量 篇7

一、以体育运动(投篮、射击)为背景材料

例1甲、乙两个篮球运动员互不影响地在同一位置投球,命中率分别为与p,且乙投球2次均未命中的概率为,(1)求乙投球的命中率p;(2)若甲投球1次,乙投球2次,两人共命中的次数记为ξ,求ξ的分布列和数学期望.

分析:本小题主要研究随机事件、互斥事件、相互独立事件的概率,离散型随机变量的分布列和数学期望等基础知识.

解:(1)解:设“甲投球一次命中”为事件A,“乙投球一次命中”为事件B,由题意得(舍去),所以乙投球的命中率为,

(2)由题设和(Ⅰ)知

ξ可能的取值为0,1,2,3,故ξ的分布列为

ξ的数学期望

规律总结:解决本题的关键是先要弄清楚各个事件,然后再计算离散型随机变量问题即可解决.

二、以知识竞赛为背景材料

例2甲乙两队参加奥运知识竞赛,每队3人,每人回答一个问题,答对者为本队赢得一分,答错得零分.假设甲队中每人答对的概率均为,乙队中3人答对的概率分别为且各人正确与否相互之间没有影响.用ε表示甲队的总得分.

(Ⅰ)求随机变量ε分布列和数学期望;

(Ⅱ)用A表示“甲、乙两个队总得分之和等于3”这一事件,用B表示“甲队总得分大于乙队总得分”这一事件,求P(AB).

分析:本题是以参加知识竞赛为背景,注意本题是一个伯努利概型的问题.

(Ⅰ)解法1:由题意知,ε的可能取值为0,1,2,3,且

所以ε的分布列为

ε的数学期望为

解法2:根据题设可知ε~B(3,),因此ε的分布列为

因为ε~B(3,),所以

(Ⅱ)解法1:用C表示“甲得2分乙得1分”这一事件,用D表示“甲得3分乙得0分”这一事件,所以AB=C∪D,且C、D互斥,又由互斥事件的概率公式得

解法2:用Ak表示“甲队得k分”这一事件,用Bk表示“已队得k分”这一事件,k=0,1,2,3.由于事件A3B0,A2B1为互斥事件,故

规律总结:要能从多个角度来思考问题,同时把握各个事件之间的关系.

三、以取球为背景材料

例3袋子中有1个白球和4个黑球,每次从中任意取一个球,取出的黑球不再放回,直到取出白球为止,求取球次数X的概率分布列.

分析:要求取球次数X的概率分布,需要先写出X的所有可能值,然后求出X的每一个可能取值的概率.

解:X的可能取值为2,3,4,5,则:第1次取到白球的概率为

第2次取到白球的概率为

第3次取到白球的概率为

第4次取到白球的概率为

第5次取到白球的概率为

则X的概率分布如下:

则X的分布列为

规律总结:求概率分布的一般步骤为:(1)写出X可能取值有哪些值;(2)P(X=K)的确定;(3)列出分布列(一般用表格形式);(4)检验分布列(用它的两条性质进行检验).

四、以考试(选题、做题、面试、培训)为背景材料

例4某项考试按照科目A、科目B依次进行,只有当科目A成绩合格时,才可继续参加科目B的考试、已知每个科目只允许有一次补考的机会,两个科目成绩均合格方可获得证书,现某人参加这项考试,科目A每次考试成绩合格的概率均为,科目B每次考试成绩合格的概率均为,假设各次考试成绩合格与否均互不影响,在这项考试过程中,假设他不放弃所有的考试机会,记他参加考试的次数为ξ求ξ的数学期望Eξ.

分析:本题只要求出考试的次数ξ所对应的概率,再结合数学期望公式即可解决.

解:设“科目A第一次考试合格”为事件A1,“科目A补考合格”为事件A2;“科目B第一次考试合格”为事件B1,“科目B补考合格”为事件B2.

由已知得到,ξ=2,3,4,注意到各事件之间的独立性与互斥性,则可得到

上一篇:智慧让课堂如此美丽下一篇:企业货币资金内控问题