即将a确定在区间(100,10 000)内(单位:元),保险公司有望获益.
二、 假如你是花店的老板
例2 春节期间,某鲜花店某种鲜花的进货价为每束2.5元,销售价为每束5元,若在春节期间内没有售完,则在春节结束后以每束1.5元的价格处理,据前5年的有关资料统计,春节期间这种鲜花的需求量X服从以下分布:
问该鲜花店今年春节前应进该鲜花20束,30束,40束,还是50束?
分析 售出一束鲜花能获利2.5元,处理一束鲜花则将亏损1元.由于鲜花的需求量X为随机变量,故应求出各种进货量下利润的期望.
解 若进货量为20,则由P{X≥20}=1,得利润的期望E1=1×20×2.5=50(元);
若进货量为30,则由P{X=20}=0.2,P{X≥30}=0.8,得利润的期望E2=0.20×(20×2.5-10×1)+0.8×30×2.5=68(元);
若进货量为40,则由P{X=20}=0.2,P{X=30}=0.35,P{X≥40}=0.45,得利润的期望E3=0.20×(20×2.5-20×1)+0.35×(30×2.5-10×1)+0.45×40×2.5=73.75(元);
若进货量为50,得利润的期望E4=0.20×(20×2.5-30×1)+0.35×(30×2.5-20×1)+0.3×(40×2.5-10×1)+0.15×50×2.5=69(元).
故利润期望的最大值为E3=73.75(元),因此鲜花的最佳进货量为40束.
三、 假如你想投资理财
例3 你有10万元,现有两种投资方案:一是购买股票,二是存入银行.买股票的收益主要取决于经济形势,假设可分三种状态:形势好、形势中等、形势不好(即经济衰退).如果形势好,则一年期可获利40 000元;如果形势中等,则一年期可获利10 000元;如果形势不好,则一年期要损失20 000元.存入银行的收益是利息,假设年利率为8%,即一年期可得利息8 000元.又设年经济形势好、中等、不好的概率分别为30%,50%和20%,试问该投资者应选择哪一种投资方案?
分析 购买股票的收益与经济形势有关(不确定),存入银行的收益与经济形势无关(确定).因此要确定选择哪一种方案,就必须先计算购买股票一年期收益的期望,然后与存入银行一年期的收益进行比较.
解 由题设,一年中购买股票在不同的经济形势下对应的收益与概率如下表所示:
初步看上表,可以得出:如果经济形势好或经济形势中等,则购买股票是合算的;但如果经济形势不好,则存入银行比较好.
下面通过计算来分析:如果购买股票,则其收益的期望E=40 000×0.3+10 000×0.5+(-20 000)×0.2=13 000(元);如果存入银行,则其收益为8 000(元).
因此,按期望收益最大原则,应选择购买股票.
点评 值得说明的是,这里是按风险决策中的期望收益最大准则选择方案,这种做法有风险存在.因为在实际生活中,经济形势好、中等、不好是无法给出准确概率值的.这只是一道理想化、简单化的数学题.
1. 从汽车东站驾车至汽车西站的途中要经过8个交通岗,假设某辆汽车在各个交通岗遇到红灯是相互独立的,并且概率都是.求:
(1) 这辆汽车在首次遇到红灯前恰好经过两个交通岗的概率;
(2) 这辆汽车在途中遇到红灯数ξ的期望.
2. 某大厦的一部电梯从底层出发后只能在第18,19,20层停靠.若该电梯在底层载有5位乘客,且每位乘客在这三层中的每一层下电梯的概率均为,用ξ表示这5位乘客中在第20层下电梯的人数,求随机变量ξ的分布列及期望.
3. 购买某种保险,每个投保人每年度向保险公司交纳保险费a元,若投保人在购买保险的一年度内出险,则可以获得10 000元的赔偿金.假定在一年度内有10 000人购买了这种保险,且各投保人是否出险相互独立.已知保险公司在一年度内至少支付赔偿金10 000元的概率为1-0.999104 .
(1) 求一投保人在一年度内出险的概率p;
(2) 设保险公司开办该项险种业务除赔偿金外的成本为50 000元,为保证盈利的期望不小于0,求每位投保人应交纳的最低保费.
1. (1) P=1-×1-×=;
(2) Eξ=8×=.
2. 依题意,ξ~B5,,ξ的分布列为:
Eξ=5×=.
3. 记投保的10 000人中出险的人数为ξ,则ξ~B(104,p).
(1) 记A表示事件:保险公司为该险种至少支付10 000元赔偿金,则发生当且仅当ξ=0,故P()=P(ξ=0)=(1-p)10 4.
又P(A)=1-0.999104,且P(A)+P()=1,故p=0.001.
(2) 依题意,该险种的总收入为10 000a元,总支出为(10 000ξ+50 000)元,故总盈利=10 000a-(10 000ξ+50 000)(元),总盈利的期望E=10 000a-10 000Eξ-50 000(元).
由ξ~B(104,10-3),知Eξ=10 000×10-3.
离散型随机变量的综合应用 篇5
一.离散型随机变量的概率分布
例1从装有6个白球,4个黑球和2个黄球的箱子中随机地取出两个球,规定每取出一个黑球赢2元,而每取出一个白球输1元,取出黄球无输赢,以X表示赢得的钱数,随机变量X可以取哪些值呢?求X的概率分布.
思路点拨:先分析取两个球可能出现的所有情况,再用随机变量表示,最后由古典概型的概率计算公式求出概率,写出概率分布.
解:从箱子中取两个球的情形有以下六种:2白,1白1黄,1白1黑,2黄,1黑1黄,2黑,
当取到2白时,结果输2元,随机变量X=-2;
当取到1白1黄时,输1元,随机变量X=-1;
当取到1白1黑时,随机变量X=1;当取到2黄时,随机变量X=0;当取到1黑1黄时,随机变量X=2;
当取到2黑时,随机变量X=4.
则X的可能取值为-2、-1、0、1、2、4.
因为
则得到X的概率分布如表1.
点评:求概率分布的关键是准确写出随机变量的取值及其每个值的概率,而求变量取值的概率的关键是理解清楚变量取每个值所对应的随机事件是什么,另外求出随机变量的概率分布后可以用概率分布的相关性质对结果进行检验.
二、离散型随机变量概率分布性质的应用例2设随机变量X的概率分布P(X=
例2设随机变量X的概率分布P(X=(k=1,2,3,4,5),(1)求常数a的值;(2)求P().
思路点拨:根据概率分布的第二条性质可以求出a,再根据随机变量取值表示的事件是互斥事件求出·
解:(1)由a+2a+3a+4a+5a=1,得到;
(2)因为只有满足,所以
点评:概率分布的有关性质是对所求概率分布进行检验或者对有关参数进行求值的依据.,
三、离散型随机变量的均值
例3某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为
商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润,(2)求事件A:“购买该商品的3位顾客中,至少有1位采用1期付款”的概率P(A);(2)求η的分布列及期望Eη.
思路点拨:(1)“至少有1位采用1期付款”的对立事件为“全部都不采用1期付款”,由相互独立的概率公式可求.(2)η的取值为200,250,300,P(η=200)=P(ξ=1)=0.4,P(η=250)=P(ξ=2)+P(ξ=3);P(η=300)=P(ξ=4)+P(ξ=5).
解析:(1)由A表示事件“购买该商品的3位顾客中至少有1位采用1期付款”,知A表示事件“购买该商品的3位顾客中无人采用1期付款”.
P()=(1-0.4)2=0.216,P(A)=1-P()=1-0.216=0.784.
(2)η的可能取值为200元,250元,300元.
η的分布列为
所以Eη=200×0.4+250×0.4+300×0.2.
点评:解答这类问题时,应该首先把实际问题概率模型化,然后利用有关概率知识去分析相应各事件可能性的大小,并列出概率分布,最后利用公式求出相应的概率.
四、离散型变量的概率、方差的综合应用
例4甲、乙两人射击,甲射击1次中靶的概率是P1,乙射击1次中靶的概率是P2,且,是方程x2-5x+6=0的两个实根,已知甲射击5次,中靶次数的方差是,(1)求P1、P2的值;(2)若两人各射击2次,至少中靶3次就算完成目的,则完成目的的概率是多少?(3)若两人各射击1次,至少中.靶1次就算完成目的,则完成目的的概率是多少?
思路点拨:(1)由于射击5次是相互独立的,故甲中靶次数X甲~B(5,P1),从而由,可以求出P1的值,然后利用根与系数的关系把P求出;(2)中靶3次包含甲中2次,乙中1次以及甲中1次,乙中2次两种情况,显然这两类事件互斥;(3)“至少”的对立面为“最多”,故用对立事件比较容易完成本题.
解:(1)根据题意知道X甲~B(5,P1),所以,所以,解得,所以P2=
(2)两类情况:共击中3次的概率为
随机变量的数字特征的应用 篇6
随机变量的数字特征尤其是数学期望在很多领域 (如:在风险决策、就业决策、投资、证券投资、经济决策、利润效益和贝叶斯决策等) 都有非常重要的应用。下面就几种情况分别讨论。
(1) 随机变量的数字特征在经济决策问题中的应用
在经济生活中, 不论是厂家的生产还是商家的销售, 总是追求利润的最大化, 供大于求或供小于求都不利于获得最大利润;但供应量和需求量又不是能预先知道的, 理性的厂家或商家往往根据过去的数据 (概率) , 用数学期望结合其他知识来做决策。
假定某公司计划开发一种新产品市场, 并试图估计其产量。估计出售一件产品公司可获利m元, 而积压一件产品可导致损失n元。另外该公司预测产品的销售量为一随机变量X, 其分布为p (x) 。那么产品的产量该如何确定才能获得最大利润。假设该公司每年生产x件, 尽管x是确定的, 但由于需求量 (销售量) 是一个随机变量, 所以收益Y也是一个随机变量, 它是X的函数:, 于是期望收益为。问题转化为当x为何值时期望收益可以达到最大值。
举一个应用数学期望解决贝叶斯决策的相似性问题.利用损失函数下的先验期望准则来做决策。
原理:对给定的决策问题, 若在状态集Θ上有一个正常的先验分布π (θ) , 则损失函数L (θ, a) 对π (θ) 期望与方差L (a) =EθL (θ, a) , Var[L (θ, a) ]=Eθ[L (θ, a) ]2-[EθL (θ, a) ]2。
分别称为先验期望损失和损失的先验方差, 使先验期望损失达到最小的行动a′, , 称为先验期望准则下的最优行动, 若此种最优行动不止一个, 其中先验方差达到最小值的行动称为二阶矩准则下的最优行动。
例如:某公司购进某种货物可分为大批、中批和小批三种行动, 依次记为a1、a2、a3。未来市场需求量可分为高、中、低三种状态, 依次记为θ1、θ2、θ3。三个行动在不同市场状态下获得的利润如下 (单位:千元) , 问题是寻找最优决策:题干中的矩阵为一个收益矩阵, 现在把它变换为损失矩阵, 即, 在有先验信息的情况下, 即如今公司经理经过专家咨询后认为未来市场对该商品的需求量是中等, 据此公司经理用主观概率给出如下先验分布π (θ1) =0.2, π (θ2) =0.7, π (θ3) =0.1, 用此先验分布算得行动a1, a2, a3的先验期望损失和损失的先验方差。比较先验期望损失大小可得a2 (中等采购量) 是先验期望损失准则下的最优行动。考虑到a1与a2的先验期望损失紧差1.07-0.98=0.09, 而a1的先验方差要比a2的先验方差小的较多, 为避免大的风险, a1亦是可采取的行动。
(2) 现今大多数人都有过购买股票或有价证券的经历, 但其中的大多数人都不是理性的, 那么理性的决策者在购买股票时会怎样做呢?
如何才能把风险降到最小也是很重要的一点。在投资环境日趋复杂的现代社会, 几乎所有的投资都是在风险和不确定情况下进行的, 一般地说, 投资者都讨厌风险并力求回避风险。风险是某一行动的结果具有多样性。风险是客观存在的, 它广泛影响着企业的财务和经营活动, 因此, 正视风险并将风险程度予以量化, 成为企业财务管理中的一项重要工作。衡量风险大小需要使用概率和统计方法, 最常用的知识就是数学期望和方差。
收益的数学期望:
例如:某公司拟对外投资, 现有A公司、B公司和C公司有关股票收益的资料如下表:
下面, 根据上述期望值公式计算A、B、C公司的预期收益率:
在预期收益率相同的情况下, 投资的风险程度同收益的概率分布有密切的联系。A、B公司的预期收益率都是20%, 但相比之下可以发现B公司的预期收益率非常分散, 而A公司的预期收益率较集中, 可认为A公司的投资风险要比B公司小, 由此得如下结论:即预期收益的概率分布越狭窄, 其投资风险越小, 反之亦然。
(3) 总结
以上内容只是随机变量的数字特征在某些领域的相关应用, 虽然还不是很成熟, 面对复杂的经济等问题, 苛求完善是不足取的, 毕竟期望原理正推动着经济学的发展, 为经济学定量化研究, 特别是对不确定决策研究提供了有力的原理工具, 随着经济学和数学的发展, 期望原理的实用性将会逐渐提高。相信随着时代和经济的发展不仅是随机变量的数字特征更多的和统计知识方法有关的研究会应用到越来越多地方, 一定会发挥着不可估测的作用。
参考文献
[1]辽宁, 齐飞.概率论的产生与发展[J].
[2]林少宫, 李楚霖.简明经济统计与计量经济[M].上海人民出版社.
[3]徐建中, 编.证券投资策略与方法[M].上海远东出版社.
随机变量函数 篇7
到目前为止,多变量辨识方法比较多,比如最小二乘算法、随机梯度算法、辅助变量算法、极大似然算法等等,这么多算法究竟哪个计算量更小,收敛性能更好,实用性更强,谁优谁劣究竟如何评判,这是问题的关键。不过理论上很难从多方面判断算法的优劣和实用性,可通过具体的仿真例子为辨识算法的选择作理论上的指导。本文用随机梯度搜索原理或随机逼近原理,研究了遗忘梯度算法,子系统遗忘梯度算法和递阶遗忘梯度算法,并通过仿真比较研究它们的估计精度的高低和收敛性能的好坏,使算法能更好的指导实际的应用。
1 多变量系统辨识模型
一个状态空间描述的多变量系统,化为传递矩阵描述,经过参数化可以化为下列形式的差分方程[1],
(1)式中u(t)∈瓗r和y(t)∈瓗m分别是系统输入和输出向量,v(t)∈瓗m为零均值白噪声向量瓗1和瓗m×r分别是待辨识的系统参数和参数矩阵。
定义参数矩阵θ、参数向量为α、输入信息向量φ(t)和输出信息矩阵ψ(t)分别为
瓗
瓗ψ(t)∶=[y(t-1),y(t-2),…,y(t-n)]∈瓗m×n因此,可以得到随机系统辨识模型,
2 梯度辨识算法
辨识模型(2)式既包含一个参数向量α∈瓗n,又包含了一个参数矩阵θT∈瓗m×n0,使得传统的辨识方法,如递推最小二乘算法(RLS)和随机梯度算法(SG)等,不能直接辨识这模型的参数向量和参数矩阵[2]。一种直观的方案是,将该系统重新参数化,得到一个包含参数向量α与参数矩阵θ所有元的高维参数向量∈瓗n+mn0。另一种方案是,把辨识模型(2)式按照输出的数目分解为m个子系统,然后分别辨识每个子系统的参数向量。还有一种方案是,采用递阶辨识原理,直接辨识参数向量α∈瓗n与参数矩阵θ∈瓗n0×m,这种方法计算量最小在这三种辨识方案中,都可以采用最小二乘优化原理和随机梯度搜索原理(或随机逼近原理),来研究相应的辨识方法。限于篇幅,本文只介绍基于随机梯度的辨识方法。下面分别介绍这几种辨识方案和具体辨识算法,并比较各种方法的优缺点。
2.1 随机梯度算法
先引入一些符号。设Im是m×m单位阵:表示Kronecker积或直积,col[X]表示将矩阵X的列按次序排成的向量。
定义扩展的参数向量和扩展的输入输出信息矩阵分别为
瓗。于是辨识模型(2)式可以转化为熟悉的形式,
极小化准则函数可得带遗忘因子的随机梯度算法,简称遗忘梯度算法(FG),
其中(t)是的估计,λ为遗忘因子称为时变收敛因子。算法初始值可取为一个小实参数向量,如(0)=1(mnr+n)×1/p0,p0=106。遗忘梯度算法比SG算法有较快的收敛速度,而且具有克服数据饱和和跟踪时变参数的能力。关于算法的收敛性,可参考文献[3,4]证明。
2.2 子系统随机梯度算法
FG算法虽然比较直观,思路也简单,但是参数向量维数很高,且信息矩阵Υ(t)含有大量的零元素,这使得算法计算量很大。为克服这些缺点,下面研究分子系统的辨识算法,基本思想是将一个多输入多输出系统分为多个多输入单输出子系统,然后分别辨识每个分子系统的参数向量。
令表示向量y(t)的第j个元表示信息矩阵ψ(t)第j行表示信息矩阵v(t)第j个元表示参数矩阵θ第j列。辨识模型(2)式可以分解为m个子系统,
(5)式中第j个子系统的信息向量和参数向量分别为
定义和极小化m个准则函数
可以得到每个子系统的带遗忘因子随机梯度算法,简称子系统遗忘梯度算法(S-FG),
因为在每一个子系统都要估计α向量一次,所以α的估计可取m次估计的平均值,子系统随机梯度法避免了出现大量零元的信息矩阵,参数维数也由原来的n+mn0降低到n+n0,计算量大大减少,所以S-FG算法是优于遗忘梯度算法。
2.3 递阶随机梯度算法
尽管子系统随机梯度算法降低了参数维数,减少了计算量,但是由于每一个子系统都包含参数向量α,所以要(重复)估计m次α,增加了不必要的计算量。而下面要讨论的递阶随机梯度算法,既不包含大量零元,又不必(重复)估计参数向量α,计算量是最小的。
递阶随机梯度算法是基于递阶辨识原理提出的[1]。根据式(2)定义准则函数,
根据负梯度搜索原理,得到估计α和θ的带遗忘因子的递阶随机梯度辨识算法(FFHSG),简称递阶遗忘梯度算法(HFG),
这里α(t)和θ(t)分别是α和θ的估计。
3 仿真实验与算法比较
考虑2输入2输出一阶仿真系统,其中α=-0.8,θT=[2.0,1.0;1.0,2.0]。仿真时,{u1(t)}和{u2(t)}采用零均值单位方差不相关可测的持续激励信号序列,{v1(t)}和{v2(t)}采用零均值方差分别为σ2(1)=0.42和σ2(2)=0.52的白噪声序列,对应两个输出通道的信噪比分别为δns(1)=50.99%和δns(2)=51.51%。用本文三个算法估计这个系统参数,这里由于篇幅所限,只给出λ=0.98时参数估计相对误差误差随t变化曲线如图1所示。
从这个仿真例子的仿真结果,可以得出结论:这三个算法有一个相同点,即随着递推计算步骤的增加,参数估计误差(总的趋势)不断减小,即数据量越大,参数估计精度越高;当λ相同时,S-FG算法收敛最快,FG算法收敛最慢,HFG算法介于二者中间,而且平稳性也介于两者之间;对于很大的t(数据长度),三个算法最终的估计误差曲线相差不大,参见图1,但递阶遗忘梯度算法计算量最小。
4 结论
本文针对多变量系统研究了三个随机梯度型辨识方法,并对这三个算法的性能和特点进行了分析比较。
摘要:针对工业中广泛存在的多变量系统,研究了辨识这类系统的遗忘梯度辨识算法,分子系统遗忘梯度辨识算法和递阶遗忘梯度辨识算法,对这三种算法的计算量进行了比较分析,并给出了仿真例子。
关键词:最小二乘,随机梯度,递阶辨识,多变量系统
参考文献
[1]Feng Ding,Chen Tongwen.Hierarchical gradient-based identification of multivariable discrete-time systems.Automatica,2005;41(2):315—325
[2]方崇智,萧德云.过程辨识.北京:清华大学出版社,1988
[3]丁锋.随机梯度算法的收敛性分析.清华大学学报,1999;39(1):83—86
随机变量函数 篇8
在讲授概率统计课程中随机变量及其分布这一章时,一种常见顺序是:随机变量的分布函数,离散型随机变量及其分布律,连续型随机变量及其概率密度函数[1].这种安排基本合理,但在实际讲授之后往往效果不佳,常出现学生对分布函数的重视程度不够,难以理解概率密度函数概念,易混淆分布函数,分布律和密度函数以及书写时符号混乱等问题.究其原因,主要是对初学者来说:随机变量概念很难理解到位;概率密度函数概念的出现太过突兀;分布函数,分布律,概率密度三者相互之间既有联系又有区别,易造成混淆.
二、问题驱动式解决方案
针对以上症结,在不改变上述顺序的前提下,本文对随机变量及其分布一章的主要知识点采用6个关键问题进行驱动,促进学生主动思考,加深基本概念的理解,区分易混淆概念,使内容层层递进,各部分自然衔接,知识点融会贯通.同时适当融入研究型教学方式,培养学生的思维和创造能力.
以下将按各教学内容详述此问题驱动式教学过程.
内容一:随机变量
随机变量是本章的首个关键概念,它在概率统计中的重要地位和对后续内容的深远影响不言而喻.然而,此前学生关注的一直是各种随机事件的概率计算,如何引入随机变量概念才能让他们认识到其必要性和重要性?为此提出第一个问题:
问题1何为随机变量?为什么要引入随机变量的概念?
从生活实例出发,让学生初步体会随机变量.如生活中常关心的一些量:某城市一个月的降雨量,某银行一天接待的顾客数,这些量的取值看似随机变化,但在多次观察时又呈现某种确定的统计规律.这种变量就是随机变量,对之常关注:(1)变量可能取哪些值;(2)取各值的可能性大小.
接着指出:实际中所关心的对象还有很多也是随机变化的,但它们本身并不是数,如天气状况,疾病化验结果等.为方便用数学工具研究这些对象的变化规律,有必要把非数的试验结果(样本点)数量化.于是自然定义样本空间到实数域的映射:ω→X(ω),把非数的试验结果全部转化为数.此定义在样本空间上的实值函数X(ω)就是随机变量,它与普通函数的区别在于:函数值是由试验结果决定的,故称为随机变量——随机会而取值的变量.通过实例可说明:随机变量的取值情况完整描述了随机试验中的各种随机事件,故今后将研究重点放在随机变量上.此时再给出随机变量的数学定义则水到渠成,解答了学生“为什么要讨论随机变量?随机变量有什么用?”的疑问,并奠定了随机变量在今后学习中的重要位置.
内容二:随机变量的分布函数
在引入随机变量的概念之后,由以下问题自然带入随机变量的分布函数.
问题2随机变量的本质特征在于其可能取值和取值的概率分布情况,用什么工具来描述随机变量的概率分布情况?
直接给出分布函数的定义会稍显生硬,可通过例子引入.
实际中,人们常关心随机变量在某范围内取值的概率.如:产品质量检查时,随机抽取的n件产品中次品件数X不超过3的概率P{X≤3},某公司生产的某一型号液晶电视寿命X在(45000,55000)(小时)之间的概率P{45000<X≤55000}.
若对任意实数x,都存在概率P{ω:X(ω)≤x}=P{X≤x}=F(x),以上问题就迎刃而解(这也解释了为什么随机变量的定义中要求对任意实数x,事件{ω:X(ω)≤x}的概率都是可确定的).这个函数F(x)就是随机变量的分布函数,它可描述随机变量在任一区间取值的概率P{x1<X≤x2}=F(x2)-F(x1),甚至在任意一点取值的概率P{X=x}=F(x)-F(x-0).只要是随机变量就存在分布函数,分布函数可描述任一随机变量的概率分布.
在此讲解分布函数有如下好处:体现了分布函数的重要性和一般性,与本章最后内容:随机变量除了离散型,连续型外还有奇异型前后呼应.
内容三:离散型随机变量及其分布律
问题3对取值离散的随机变量,如何描述其概率分布比较方便?
用一实例引入离散型随机变量及其分布律,并用柱状图或火柴棍图来直观表示.提问:对离散型随机变量来说,分布律和分布函数都可描述其概率分布,哪种描述方式比较直观方便?学生能够自己看出是分布律.在教师引导下讨论总结:分布函数与分布律均可描述离散型随机变量的概率分布,二者可互相转化,只是描述方式不同而已.对离散型随机变量往往选择更直观的工具———分布律.
内容四:连续型随机变量及概率密度函数
很多现行教材都直接给出连续型随机变量及其概率密度函数的定义[1,2],这固然是由于教材限制所致,但若在课堂讲授时也直接抛出此概念,会让学生觉得非常突兀,造成理解和学习上的困难.实际上,离散型随机变量与连续型随机变量有诸多可类比性质[3],故本文的解决办法是由离散型随机变量的分布律进行类推,过渡到连续型随机变量的概率密度.具体为讲完分布律后提出如下问题.
问题4对取值连续的随机变量来说,能否用分布律来直观描述其概率分布?
例:一半径为2米的圆盘靶子,击中靶上任一同心圆盘的概率与该圆盘的面积成正比,若射击均能中靶,用X表示弹着点与圆心的距离.能用分布律来描述X的概率分布吗?
学生会发现不行,因为X的取值是连续的!继续提问:
问题5能否找到类似离散型随机变量分布律的工具来直观描述这种取值连续的随机变量的概率分布?
此处需事先做好两项准备工作.
1. 理解频率直方图.
例:为了解某地区成年男子的身高情况,从该地区所有成年男子中随机抽取100名进行调查.问:如何根据这些数据(略,单位:cm)分析该地区成年男子身高X的分布情况?
用此例讲解频率直方图的做法以及含义.重点在于指出:频率直方图利用将连续取值离散化的手段直观体现了身高X这个取值连续的随机变量的大致分布情况,具有与分布律类似的特征.
2. 基本弄清频率与概率的关系.
因后面学习大数定律时才能明确频率依概率收敛于概率,现只需学生理解随试验次数增多频率会逐渐稳定于概率即可,用抛硬币例子数据进行说明.
现在可向概率密度过渡.在频率直方图中,随机变量在某一区间取值的频率,为该区间上小矩形的面积之和.当样本数据很多,组距很小时,各小矩形会非常密集.设想:n趋于无穷,组距趋于0时,直方图中变量的有限多个离散取值范围将趋于无限多个连续取值,而图中小矩形边缘将逐渐稳定在一条光滑(或分段光滑)曲线附近,设为函数f(x).
与离散型情况类似:分布函数和概率密度均可描述连续型随机变量的概率分布,只是方式不同,二者可相互转化,但概率密度较分布函数更为直观.
内容五:其他类型的随机变量
问题6除了离散型随机变量和连续型随机变量之外,还有其他类型的随机变量吗?
在教师引导下,学生发现此分布函数不符合离散型或连续型变量分布函数的特征,故其对应随机变量既非离散型,也非连续型.这时不能用分布律或概率密度来描述其概率分布,但分布函数仍适用,体现了分布函数的一般性和重要性.
三、总结
如上,通过六个问题逐步带出本章各重要概念和知识点,有利于激发学生自主探索的欲望,使本章内容保持一致性与连贯性,学生对分布函数,分布律,概率密度各概念的理解更深入,应用时不易产生混淆.并利用类推与研究式教学较好地处理了概率密度这个教学难点,其中运用的微积分知识还加强了不同学科知识的融合,提高了学生分析处理问题的能力.
参考文献
[1]徐全智,吕恕.概率论与数理统计[M].北京:高等教育出版社,2010.
[2]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.
随机变量函数 篇9
例1 写出下列随机变量可能取的值,并说明所取值的实际意义.
(1)袋中装有5个同样大小的球,编号为1,2,3,4,5,现从该袋中随机取出3个球,记所取球的最大号码为[X].
(2)连续投掷一枚骰子两次,所得点数之和为[Y].
解析 (1)[X]可能取的值为3,4,5.
[X=3]表示最大号码为3,即取出的球为1,2,3号;
[X=4]表示最大号码为4,即4号球被取出,1,2,3号球中恰好取出两个;
[X=5]表示最大号码为5,即5号球被取出,1,2,3,4号球中恰好取出两个.
(2)[Y]可能取的值为2,3,4,5,6,7,8,9,10,11,12.
[Y=2]表示掷出的点数为(1,1);
[Y=3]表示掷出的点数为(1,2),(2,1);
[Y=4]表示掷出的点数为(1,3),(2,2),(3,1);
[Y=5]表示掷出的点数为(1,4),(2,3),(3,2),(4,1);
[Y=6]表示掷出的点数为(1,5),(2,4),(3,3),(4,2),(5,1);
同理,[Y=7]有6个不同的结果,[Y=8]有5个不同的结果,[Y=9]有4个不同的结果,[Y=10]有3个不同的结果,[Y=11]有2个不同的结果,[Y=12]有1个结果.
点评 学会用随机变量描述试验结果非常重要,它是下一步学习分布列的重要基础.
二、离散型随机变量的分布列
例2 设[S]是不等式[x2-x-6≤0]的解集,整数[m,n∈S].
(1)记“使得[m+n=0]成立的有序数组[(m,n)]”为事件[A],试列举[A]包含的基本事件;
(2)设[ξ=m2],求[ξ]的分布列.
解析 (1)由已知,可求得[S={x|-2≤x≤3}],故[m,n∈{-2,][-1,0,1,2,3}],则[A]包含的基本事件为(-2,2),(-1,1),(0,0),(1,-1),(2,-2).
(2)变量[m]的分布列为
则[ξ]的分布列为
点评 1. 求分布列一般有3个步骤:第一步确定变量的所有取值,第二步求出相应的概率,第三步列表.其中最难的是第二步,它需要综合运用我们此前所学的概率知识;
2. 该题第二问涉及变量函数分布列的求法,关键是通过函数关系找到新变量的取值,新变量每个取值的概率等于原变量相应取值的概率之和.
三、分布列的性质
例3 设随机变量[X]的分布列为[P(X=k5)=ak,][k=1,2,3,4,5.]
(1)求常数[a]的值;
(2)求[P(110解析 (1)由已知条件得变量[X]的分布列为
故[a+2a+3a+4a+5a=1],解之,得[a]=[115].
(2)[P(110[P(X=35)=115+215+315=25].
四、超几何分布
例4 在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件.
(1)记取出的3件产品中一等品的件数为[X],求[X]的分布列;
(2)求取出的3件产品中一等品件数多于二等品的概率.
解析 (1)[X]的可能取值为0,1,2,3.
[P(X=0)]=[C37C310]=[724], [P(X=1)]=[C13C27C310]=[2140], [P(X=2)]=[C23C17C310]=[740],[P(X=3)]=[C33C310]=[1120].
故[X]的分布列为
(2)记事件[A1]表示“一等品件数为1,二等品件数为0”,事件[A2]表示“一等品件数为2”,事件[A3]表示“一等品件数为3”.
则所求事件为[A1]+[A2]+[A3], 故所求概率为[P(A1)+P(A2)+P(A3)]=[C13C23C310]+[740]+[1120]=[31120].
点评 1. 求超几何分布的关键在于组合数的计算,理解起来并不困难;
2. 利用分布列求概率关键是要搞清楚所求事件与随机变量之间的关系.
【练习】
1. 一个人有[n]把钥匙,其中只有一把可以打开房门.他随意地进行试开,试过的钥匙放在一旁.记打开房门时,试过的次数为随机变量[X],则[P(X=k)]=( )
A. [kn] B. [1n]
C. [k-1n] D. [AkkAkn]
2. 若离散型随机变量[X]的分布列如下表所示,则[c=] .
3. 有甲、乙两个盒子,甲盒子中有8张卡片,其中2张写有数字0,3张写有数字1,3张写有数字2;乙盒子中有8张卡片,其中3张写有数字0,2张写有数字1,3张写有数字2.
(1)如果从甲盒中取2张卡片,从乙盒中取1张卡片,那么取出的3张卡片都写有1的概率是多少?
(2)如果从甲、乙两个盒子中各取出1张卡片,设取出的2张卡片上数字之和为[X],求[X]的分布列.
4. 袋中有10个白球,[n]个红球(2≤[n]≤9),试求:
(1)当取出2个球时,白球和红球各1个的概率[Pn]及[Pn]的最大值;
(2)当[Pn]最大时,从袋中随机取出4个球,记白球与红球的个数差的绝对值为随机变量[X],求[X]的分布列.
【参考答案】
1. B
2. [13]
3. (1)[3112]
(2)
[[X]&0&1&2&3&4&[P]&[332]&[1364]&[2164]&[1564]&[964]&]
4. (1)[Pn]=[20n(n+10)(n+9)],当[n=9]时,[Pn]取得最大值[1019].
(2)
随机变量函数 篇10
在机械系统可靠性设计过程中,知识、试验条件、时间及经费等因素的限制,使得某些不确定性变量的统计信息不足,这导致不确定性变量的分布类型及分布函数不能被精确给定。这类因信息不足引起的不确定性被称为认知不确定性。不同于随机不确定性,认知不确定性可随信息量或知识的增加而减小甚至消失[1]。因此,在可靠性工程中,认知不确定性和随机不确定性往往共存。研究表明[2],认知不确定性对可靠性分析及设计结果的精度存在较大影响。
为定量描述认知不确定性变量,克服认知不确定性引起的可靠性分析及设计结果精度失真,目前已发展了多种不同类型的建模理论,分为概率建模理论和非概率建模理论,其中,概率建模理论主要为贝叶斯理论[3],非概率建模理论包括可能性理论[4]、证据理论[5]和凸集模型[6]。作为凸集模型特例的区间模型[7]是指在实数轴上规定认知不确定性变量可变区间的上下限。在本文中,基于区间模型描述的认知不确定性变量称为区间变量。在工程应用中,区间变量十分常见。因此,区间变量和随机变量共存条件下的混合型可靠性研究具有重要的学术价值及工程应用价值。
目前已有较多的处理独立区间变量的可靠性分析方法[7,8,9,10,11],但在实际工程中,某些区间变量存在一定的相关性,是非独立的。例如描述结构几何尺寸的区间变量和结构质量的区间变量一般存在相关性,较大的几何尺寸区间变量意味着较大结构质量区间变量,反之亦然。为此,Du[12]针对机构运动副,基于物理关系式推导获得非独立区间变量描述模型———等式与不等式约束条件,提出了一种随机变量和非独立区间变量的混合型可靠性设计方法。Jiang等[13]采用多维度平行六面体区间模型,考虑了区间变量为独立或非独立的情况,提出了一种新的非线性区间规划方法,但该规划方法未考虑系统中同时存在随机变量和区间变量的混合情况。Jiang等[14]引入样本相关系数,考虑非独立概率-区间混合情况,利用矩阵变换将非独立变量转换为独立变量,提出了一种双层迭代算法。姜潮等[15]通过引入相关角的概念定量描述了任意两个变量之间的相关性,将不同变量之间的相关性在一个统一的框架下度量,并构建了一高效求解方法。但上述的可靠性分析方法仍为双层优化问题,影响计算效率。故在非独立区间变量下,提出一种单层可靠性计算方法,提高可靠性分析的计算效率仍是当前可靠性分析方法研究的一大挑战。
为此,本文针对系统输入变量存在随机变量和非独立区间变量的混合情况,基于条件概率法和椭球模型,建立了混合型可靠性分析模型,提出了一种高效的单步可靠性模型及单步可靠性计算算法。利用高维模型表示方法[16](HDMR)解耦随机变量和非独立区间变量,将混合型可靠性分析模型转换为单步求解的可靠性分析模型;基于提出的采样方案,利用二次多项式近似HDMR展式,降低极限状态函数的调用次数,提高计算效率。
1 椭球模型
为描述非独立区间变量,Ben-Haim等[6,17]提出了椭球模型。设为区间变量的矢量,其中NY为区间变量的数量。在复杂机械系统中,区间变量的维度一般较高,非独立关系也不尽相同,如某些区间变量服从正相关关系,某些满足负相关关系,而某些是相互独立的。椭球模型根据不同的非独立关系,将区间变量归入不同的组。
经分组后,Y可表示为,其中,Ng为组的数量,Yi为第i组区间变量矢量,则椭球模型为
其中,S为区间变量可行域;Yic为第i组区间变量矢量的均值矢量,计算式为Yic=(YiL+YiU)/2,YiL和YiU分别为Yi的上下限矢量;Wi为第i个椭球模型的特征矩阵,为正定对称矩阵,它描述了第i个椭球的方向和长宽比。因可行域S由Ng个椭球组成,故该模型也称之为多椭球模型,单个椭球模型的变量不超过3个。
多椭球模型可描述不同非独立关系的区间变量:如当某区间变量是独立的,则椭球模型可退化为区间模型;当两个区间变量存在相关性,则椭球模型可退化为椭圆模型。图1给出了3个区间变量构成的不同几何形状的可行域S:在图1a中,3个变量是相互独立的;在图1b中,Y3是独立的变量,Y1和Y2存在相关性,是非独立的;在图1c中,3个变量存在相关性,是非独立的。
由于各个区间变量的单位不同,区间大小不同,不利于数值计算的稳定性,因此将区间变量Yi转换为量纲一变量Vi,转换关系式为
则分组后的区间变量矢量转换为,多椭球模型相应地表示为
其中,(矩阵Ci为对角矩阵,对角线元素为相应的区间变量均值),为量纲一特征矩阵。
式(3)给出的椭球模型主轴与坐标轴存在角度偏移,为使样本点尽可能多地落在椭球模型可行域内,提高二次多项式近似精度,引入线性变换
其中,Qi为正交矩阵,其列向量为的单位特征向量;Λi为对角矩阵,其对角线元素为相应的的特征值,满足,将椭球模型变换为中心位于坐标原点半径为1的球模型,然后将式(4)代入式(3),则椭球模型可描述为
2 混合型可靠性计算模型
设系统极限状态函数为
其中,为随机变量矢量,随机变量的个数为NX;为区间变量矢量,区间变量的个数为NY。将区间变量的变换关系式代入式(6),则极限状态函数可写为G=g(X,E)。
设G<0时系统失效,则系统失效概率pf可表示为pf=Pr{g(X,E)<0},其中Pr{·}表示概率。因未知区间变量E的概率分布,不能获得准确的失效概率。利用条件概率公式,可得失效概率的最小值pf,min和最大值pf,max的计算公式:
其中,gmax(X,E)和gmin(X,E)分别表示在可行域S内极限状态函数的全局最大值和最小值。
由式(7)和式(8)可见,系统失效概率的最小值和最大值分别为最大极限状态函数和最小极限状态函数的失效概率。这本质上为一个双层循环求解问题:内循环为区间分析,在可行域S内搜寻极限状态函数的极限值;外循环为概率分析,求解最大极限状态函数或最小极限状态函数的失效概率。
双层循环增加了可靠性分析问题的复杂性,会大幅度增加极限状态函数的调用次数。对于复杂机械系统,极限状态函数一般由计算机数值仿真模型(如有限元模型、流体动力学模型等)隐式表述,极限状态函数调用次数的增加,会导致计算效率低下,增大可靠性分析及设计的难度。
为提高随机变量和非独立区间变量混合情况下的可靠性计算效率,本文采用高维模型表示方法,将双层循环问题转化为单步问题,提出了一种单步快速的可靠性计算方法。
2.1 高维模型表示方法(HDMR)
高维模型表示方法是一种用于模型近似的处理方法,它常用于近似高维度输入系统的响应函数。研究表明,低阶的高维模型表示方法可精确描述大部分工程中的极限状态函数[18]。
本节主要介绍如何采用HDMR描述极限状态函数g(X,E)。设Z=(X,E)T,则g(X,E)可写为g(Z)。基于高维模型表示方法,g(Z)可表示为
其中,NZ为Z向量的元素个数,NZ=NX+NY;g0为0阶分量函数,为常量;gi(Zi)为1阶分量函数,表示输入变量Zi单独作用时对输出响应g(Z)的影响;gij(Zi,Zj)为2阶分量函数,表示输入变量Zi和Zj共同作用时对输出响应g(Z)的影响;更高阶的分量函数表示多个输入变量共同作用时对输出响应g(Z)的影响;最后一项表示所有残余的耦合输入变量对输出响应的影响。
切割法(cut-HDMR)是一种确定高维模型各个分量函数的常用方法。在切割法中,首先选定参考点c,再计算经过参考点c的线、平面、体积等切割几何上的响应值,分别确定各个分量函数。实际使用中,参考点c一般选定为输入变量可行空间内最感兴趣的点。
利用切割法,各分量函数可表示为
其中,g(Zi,ci)=g(c1,c2,…,ci-1,Zi,ci+1,…,cl),表示除了分量Zi,其余所有输入变量均固定在参考点c处,它是一个一元函数;类似地,g(Zi,Zj,cij)为二元函数;最后项g12…l(Z1,Z2,…,Zl)由真实响应值和基于高维模型表示方法的预测值的残差确定。
在高维模型表示方法中,1阶、2阶、3阶等分量函数与泰勒级数展开式中相应的分量函数有着本质区别。经证明,高维模型表示方法中的1阶分量函数gi(Zi)是泰勒级数展开式中仅含有变量Zi分量函数的集合;类似地,2阶分量函数gij(Zi,Zj)是泰勒级数展开式中仅含有变量Zi和Zj分量函数的集合。1阶分量函数gi(Zi)可以是非线性的。因此,较截断的泰勒级数展式,任意相应截断的高维模型表示方法的展式具有较高的精度。
2.2 单步可靠性计算模型
若极限状态函数可描述为关于随机变量和区间变量相互分离的两部分函数,则双层循环问题可变为单层问题,提高计算效率。
利用1阶HDMR展式,极限状态函数可近似为
如前所述,1阶HDMR展式gi(Xi)和gi(Ei)分别是泰勒展式内仅含有变量Xi和Yi所有分量函数的集合,因此,相对于1阶泰勒展式,1阶HDMR展式没有限定近似表达式的非线性。这提高了1阶HDMR展式的近似精度。
基于1阶HDMR展式的近似表达式,失效概率的最小值和最大值的计算模型可写为
其中,GGmin和GGmax分别表示在可行域S内极限状态函数的全局最小值和最大值,计算式分别为
由此可见,基于1阶HDMR展式,随机变量和区间变量下的混合型可靠性计算模型已转化为单步可靠性计算模型:首先使用非线性约束优化法求得GGmin和GGmax,再使用常规可靠性分析方法,如蒙特卡罗法(MCS)、一次二阶矩法(FORM)等,求得失效概率上下限。
3 计算失效概率
使用单步可靠性计算模型计算失效概率上下限时,需确定参考点c和各个一元函数表达式。参考点c对可靠性计算结果的精度具有一定的影响。为提高精度,参考点c一般选定为输入变量可行空间内最感兴趣的点。区间变量的可行区间往往较小,区间变量可行区间内的中点可兼顾两个边界点,为此,将区间变量可行区间内的中点及区间变量固定在中点时的最大概率点(MPP)对应的随机变量值设定为参考点c。
最大概率点u*的数学计算模型为
其中,为独立的随机变量矢量,服从标准正态分布,由随机矢量X经Rosenblatt变换获得。
一旦求得MPP,则参考点c为
其中,Φ(·)为标准正态分布函数;为随机变量Xi的分布函数的逆函数。
基于求得的参考点c,使用二次多项式近似表达各个一元函数表达式。设gi(Xi,ci)和gi(Ei,cn+i)的近似式分别为
其中,ai0、ai1、ai2、bi0、bi1和bi2分别为二次多项式的待定系数。
采用最小二乘法求解各个二次多项式的待定系数。在最小二乘法中,对于随机变量Xi,沿过参考点c的Xi轴,在[μi-3σi,μi+3σi]区间内均匀分布k(k=5,7,9)个样本点,如图2所示,其中μi和σi分别为随机变量Xi的均值和标准差。各个样本点的坐标值为μi-3σi,μi-3σi+6σi/(k-1),…,μi,μi+6σi/(k-1),…,μi+3σi。对于变换后的区间变量Ei,沿过参考点c的Ei轴,在[-1,1]区间内均匀分布k(k=5,7,9)个样本点,如图2所示。各个样本点的坐标值为-1,-1+2/(k-1),…,0,2/(k-1),…,1。
将式(20)和式(21)代入式(14)~式(17),可得失效概率的最小值和最大值的计算式分别为
其中,GGmin和GGmax的计算式分别为
因均为显式表达式,则GGmin和GGmax可由现有的非线性优化算法快速求解获得,如二次序列规划算法(SQP);代入求得的GGmin和GGmax,使用蒙特卡罗法(MCS)求解失效概率的最小值和最大值。
一旦最大概率点(MPP)和各个二次多项式系数确定,基于HDMR的混合型可靠性计算方法就无须再调用原始的状态极限函数。这可大幅度提高计算效率,尤其当极限状态函数以隐式的计算机仿真模型表述时,调用一次状态极限函数的用时一般较长。为高效求得最大概率点,已有学者提出了较多的数值算法,如HLRF法[19,20]、iHLRF法[21]等。作为HLRF法的改进,iHLRF法引入了价值函数,在处理非线性度较高的极限状态函数时仍具较好的收敛性,故被广泛应用。为此,采用iHLRF法求解最大概率点。
4 算例
在MATLAB下,编写了提出的单步可靠性算法可执行程序,计算了两个混合型可靠性分析算例,其中第一个算例的非线性较低,输入变量的维度较低,相比于第一个算例,第二个算例的非线性度较高,输入变量的维度也较高,用于验证提出的单步可靠性算法在处理较高非线性和高维度时的计算效率及精度。在算例中,使用调用原始极限状态函数的次数Nc评定计算效率。尽管两个算例的极限状态函数均以显式表达式给出,但都编写成了可执行程序,故对于调用函数,极限状态函数是隐式的。在用于求解最大概率的iHLRF算法中采用向前有限差分法计算极限状态函数关于随机变量的梯度。
4.1 悬臂梁
某悬臂梁末端受外部载荷,其中,水平方向分量为Px,垂直方向分量为Py,如图3所示。当梁末端位移大于末端许用位移D0时,认为刚度失效,则极限状态函数为
其中,L为悬臂梁长度;b和h分别为矩形梁截面的宽度和高度;E为材料弹性模量。
已知,末端许用位移D0=65mm。表1给出了各个随机变量的分布参数及区间变量的特征矩阵,其中,L、b和h均服从正态分布;弹性模量E为独立区间变量,载荷分量Px和Py为非独立区间变量。
为研究不同样本数量对计算结果精度的影响,在使用提出的可靠性计算方法计算失效概率时,令k值分别为5、7和9。表2给出了不同k值时的失效概率结果。为验证计算结果的精度,同时使用了蒙特卡罗法计算失效概率。因蒙特卡罗法仅能计算系统中不确定性都为随机变量的工况,故在使用蒙特卡罗法时,将各个区间变量在可行域内均布取样30个点,对满足多椭球模型约束条件的区间样本点,调用107次原始极限状态函数,计算失效概率,最后挑选出失效概率的最小值和最大值,作为失效概率的上下限。由表2可见,当k值等于9时,计算结果与蒙特卡罗法获得的结果较接近,具有较高的计算精度;根据Nc可知,提出的基于HDMR的单步可靠性计算方法可较少地调用原始极限状态函数,求得较高精度的失效概率上下限值。
4.2 悬臂圆筒
某悬臂圆筒受外部载荷如图4所示:集中力F1、F2,P和扭矩T。当最大等效von-Mises应力σmax超出材料屈服极限σs时,认为悬臂圆筒强度失效,极限状态函数可写为
最大等效von-Mises应力位于悬臂圆筒根部截面上端点,其计算式为
其中,σx为该点处的正应力,表达式为
其中,M为该截面处弯矩,A为截面面积,I为截面惯性矩,τzx为该点的切应力。
表3给出了各个随机变量的分布参数及区间变量的特征矩阵,其中θ1和θ2为独立区间变量,其余不确定性变量均为随机变量。