随机分析

2024-10-14

随机分析（共12篇）

随机分析篇1

1 引言

2007年, 家乐福在国内开创了“农超对接”的先河, 目前, 家乐福已有40多种农超对接的直采产品。与此同时, 预计到2011年年底, 沃尔玛将与100万农户之间实现“农超对接”。农超对接使得农户与超市形成了订单生产, 对农户而言, 既可避免生产的盲目性和资源浪费, 同时也免去了难卖的顾虑, 对超市而言, 能获得稳定的新鲜农产品, 解决了难买的困境。农超对接使得农户供给和超市需求得以充分的匹配, 减少了市场供需的不对称性, 对稳定农产品的价格、减少市场波动、消除农产品蛛网效应起到很好的作用。同时, 农超对接减少了周转的中间环节, 这不仅为供应链压缩了20%～30%的成本, 而且有利于实现农产品从农田到餐桌的全过程质量控制。

农作物生产必然受到生产资料的价格 (化肥、机械、农药等) 、劳动机会成本、自然状况等因素的影响[1,2], 这些因素的随机波动导致了农产品产出的随机性。超市作为销售的终端, 受替代品、互补品的价格、天气变化引起的人的需求的变化等多种因素的影响, 农产品的需求也呈现一定的随机性。Burer等[3]和Cao等[4]研究了需求呈随机分布时农产品供应链的协调机制, 而近年来, 假定产出为随机变量的研究也在发展[5,6]。Yano等对产出为随机变量的批量订购模型进行了总结和概述[7]。以最大化企业效用为目标, Li等得出了产出和需求都为随机的情况下再制造系统的最优收购价格[8]。Guler等[9]和赵霞[10]研究了随机产出和随机需求下的供应链的协调问题。产出和需求的随机性增加了决策主体的风险性, 因此, 面对不同的风险, 决策主体也不得不调整其策略选择。Wang给出了短期生产系统在随机产出和需求不确定情况下的最优订购策略[11], Erdem等也做了类似的研究[12]。Arrow将影响农户选择共享风险的因素分为:共享风险将发生的成本、风险的大小、其他风险与该风险的关系以及决策主体对风险的感知等[13]。Meuwissen等对农业产业风险共担策略的优缺点进行了综述[14]。Xu指出随机产出和随机需求下, 采用期权合同能使供应商规避低需求和低价格的风险, 使制造商规避高价格和低需求的风险[15]。可概括知, 供应链成员间合理的风险分配可以降低供应链的管理成本[16]、减少供应链双重边际[17]、增加整个供应链的利润[18,19]。He等比较了随机产出和随机需求下无风险共担合同和4种产出风险共担合同之间的差异[20], 在此基础上, 通过引入二级市场, He等分析了二级市场的存在与否对供应链决策行为的影响, 结论指出二级市场对供应链的性能起着积极的影响, 同时, 当供应链上存在随机因素时, 合理地处理参与成员面临的风险能提高供应链的性能, 风险的分担和转移能使得成员间的合作更稳定和持久[17]。

本文以单周期的农产品供应和销售作为问题的出发点, 从微观层面探索了农户和超市的友好合作机制, 旨在挖掘适合我国特定农业生产-销售的“农超对接”模式。本文有两个创新点:一是解决了“农超对接”模式中农户面临的“产量不足”和“产量过剩”的产出风险问题, 为农户和超市长期的友好合作提出了指导;二是协调了产出和需求都呈随机分布的农产品供应链。

2 问题提出和变量说明

结合现实情况, 该文提出“农超对接”的合作模式如下:首先, 农户和超市共同协商确定一个合理的批发价ω, 该批发价大小取决于农户和超市的相对谈判能力, 而在我国特定的小农生产模式下, 超市无疑占有相对较强的谈判权;然后超市根据市场调查和自身的判断决定农产品的订购量q, 最后, 农户根据超市的订购量和产出的随机性确定农资投入t.由于产出的随机性导致了农户产出过剩或产出不足的风险, 在传统的合作模式下, 农户将自行处理多余的农产品和补足不足订购量的部分, 这样的合作模式没有解决农户长期面临的“难卖”的困境, 同时农户在供应链中的弱势地位也没有得以缓解, 这样的合作机制没有解决我国农业生产中农户面临的实际问题, 进而导致农超对接模式难以实施。针对以上两种情况, 本文提出了以下两条来解决:①当农户的产出小于超市的订购量时, 农户按实际的产出提供给超市, 超市按实际收到量支付给农户, 对于缺货的部分, 农户不需要给予超市补偿;②当农户的产出大于超市的订购量时, 超市在以批发价ω购买q部分产品的同时, 以低于ω的另一价格ωo购买过剩的产品, ωo的大小也取决于农户和超市的相对谈判能力。

本文中部分变量的符号及含义如下:

p:超市对农产品的单位销售价格, 该价格是超市根据相关的产品的价格、竞争对手的定价、国家的经济政策、超市以往的价格等因素综合确定;

cf:农户投入农资的单位成本;

cs:超市投入的农产品单位成本;

Y:产出随机因子, 为随机变量, 其分布函数为F (y) , 概率密度函数为f (y) , 且E (Y) =μ=1, Yt则表示农户的实际产出;

X:农产品市场需求, 其分布函数为G (x) , 概率密度函数为g (x) ;

πf、πs、πt:农户、超市及整个供应链的利润。

为了保证农户和超市的长期友好合作, 本文引入两个条件:①ω>cf:这是农户与超市合作的必要前提。因为要使农户积极的参与到农超对接的供应链中来, 农户的单位收益应大于其单位成本, 即保证农户在此次合作中有利可图。②cf>ωo:这是为了防止农户恶意过量生产。若cf<ωo, 农户无限生产是最优决策, 但过多的产量必然导致超市销售困难而受损, 因此, 该假设促使农户按照超市的订购量生产。

这两个假设解决了农户消极投入和积极投入而对超市带来风险的问题, 这就使得农户的实际产出尽量接近于超市的订购量, 从而保证了双方的利益。

3 集中式决策

集中式决策下, 农户和超市作为一个决策主体, 整个供应链的利润函数可表示为如下:

$π_{t}^{c} = p E_{X, Y} [\min {Y t, X}] - c_{f} t - c_{s} E_{Y} [Y t] (1)$

集中式决策下, 超市购买的量为农户的实际产出量Yt, 因而, 未来市场的实际需求为农户实际产出量和随机需求的较小者, 为简化计算且不影响实际结果, 这里假设未出售的产品的剩余价值为0。

命题1 集中式决策下, 对产出和需求都呈随机分布的“农超对接”模式, 供应链的最优农资投入tc*应满足:

$\int_{0}^{\infty} \int_{0}^{\frac{x}{t^{c^{*}}}} y f (y) g (x) d y d x = \frac{c_{f} + c_{s}}{p} (2)$

式中, cf+cs表示本供应链生产一单位的产品所发生的总成本, 即单位投入, p表示农成品的单位收益, 即单位产出, 因此 (cf+cs) /p即为单位投入和单位产出比率, 简称投入产出比。由式 (2) , 供应链的最优农资投入tc*是投入产出比率的减函数, 即投入产出比率越大, 供应链的最优农资投入则越小。这是因为投入产出比率在一定程度上可理解为供应链所承担的风险的大小, 在较大的风险下, 超市和农户这两个主体应谨慎从事, 选择较小的投入是正确决策。最后, 将tc*代入式 (1) , 可得集中式决策下整个供应链的利润πc*t (tc*) 。

4 分散式决策

分散式决策下, 由于农户的实际产出和超市的订购量之间存在一定的差异, 如第2节提出的解决机制, 可知在分散式决策下, 农户和超市的利润可分别表示为:

$\begin{array}{l} π_{f}^{d} = ω E_{Y} [\min (Y t, q)] + ω_{o} E_{Y} [(Y t - q)^{+}] - c_{f} t (3) \\ π_{s}^{d} = p E_{X, Y} [\min (X, Y t)] - ω E_{Y} [\min (Y t, q)] \\ - ω_{o} E_{Y} [(Y t - q)^{+}] - c_{s} E_{Y} [Y t] (4) \end{array}$

命题2 分散式决策下, 对产出和需求都呈随机分布的“农超对接”模式, 农户的最优农资投入td*和超市的订购量qd*分别满足:

$\begin{array}{l} \int_{0}^{\frac{q}{t^{d^{*}}}} y f (y) d y = \frac{c_{f} - ω_{o}}{ω - ω_{o}} (5) \\ p \int_{0}^{\infty} \int_{0}^{\frac{x}{q^{d^{*}} h}} h y f (y) g (x) d y d x \\ = ω [1 - \int_{0}^{\frac{1}{h}} h F (y) d y] + ω_{o} \int_{\frac{1}{h}}^{\infty} (h y - 1) f (y) d y + c_{s} h (6) \end{array}$

其中, h=t/q.

式 (5) 中, cf-ωo可表示农户的预期单位损失, ω-cf表示农户的绝对单位利润, 而ω-ωo= (ω-cf) + (cf-ωo) 可理解为农户的预期单位净利润, (cf-ωo) / (ω-ωo) 则是农户预期的单位损失与单位净利润比率, 简称净损失利润率, 该比率越大, 农户面对的风险也就越高, 农户在投入时也就越谨慎, 反应在函数关系上, 也就是农户的农资投入td*是 (cf-ωo) / (ω-ωo) 的减函数。h=t/q, 可定义为农户农资投入对超市订购量的反应系数, 当h>1时, 超市面临的产量过剩的风险增加, 而农户遭受产量过剩导致损失的风险也增加;当h<1时, 超市遭受产量不足的风险增加, 而农户丢失了本可以赚取的利益。因此, 该反应系数越接近1, 对农户和超市越有利。所以, 对超市和农户来说, 及时、真实的信息沟通对双方都是有利的。由式 (6) 可求出最优的订购量qd*, 将其代入式 (5) 即可得农户最终的最优农资投入td*.最后将qd*和td*代入式 (3) 和式 (4) , 可得农户、超市以及整个供应链的利润πd*f (qd*, td*) 、πd*s (qd*, td*) 、πd*t (qd*, td*) 。

5 基于均匀分布下的决策分析及供应链协调

5.1 基于均匀分布的决策分析

由于产出和需求都服从随机分布, 最优的农资投入、订购量以及农户、超市、总利润的表达都是产出分布函数以及需求分布函数的隐性表达, 直接比较其大小无法进行, 所以, 为将结果直观化, 同时不影响结果的正确性以及减少计算的复杂度, 文中将采用很多学者常用的均匀分布来进行数值仿真[9,10,17]。本文取Y～U (a, b) 和X～U (c, d) , 以下是一系列参数的取值:p=9, ω=4, ωo=1, cf=2, cs=1。下面的分析中将分别探讨产出波动和需求波动对各个参与成员的影响。

图1和图2给出了产出波动一定, 需求波动变化对订购量、农资投入、各个成员利润所产生的影响, 图3和图4则给出了需求波动一定, 产出波动变化对订购量、农资投入、各个成员利润所产生的影响。 (注:产出波动ε1= (b-a) /2, 需求波动ε2= (d-c) /2。)

将产出分布密度函数和ε1= (b-a) /2代入式 (5) 可得 $h = 1 / \sqrt{4 ε_{1} (c_{f} - ω_{o}) / (ω - ω_{o}) + (1 - ε_{1})^{2}}$ , 可知, 在cf、ωo、ω一定的情况下, h的大小只与ε1有关, 而与ε2无关。因此, 在产出波动一定的条件下, 需求波动不改变h的大小, 所以此时h恒等于某一常数; 而在需求波动一定的情况下, 产出波波动会影响h的变动, 不难得出, 当ε1< (ω+ωo-2cf) / (ω-ωo) 时, h是ε1的增函数, 当ε1> (ω+ωo-2cf) / (ω-ωo) 时, h是ε1的减函数, 所以h的变化是先增后减。

产出波动一定, 需求波动增大时, qd*增大, 这是因为需求波动的增大带来了市场最大容量的增大, 而对在农产品供应链中处于强势地位、抗风险能力强的超市, 因其对风险持积极态度而增加订购量就不难理解。由于h与ε2的变化无关, 同时t=qh, 所以, td*也将随着qd*的增大而增大, 即超市对需求波动的积极反应通过其订购量而影响农户的农资投入, 进而影响农户的利润。而在集中式决策下, 超市对风险的积极态度是直接影响整个系统的农资投入的, 所以tc*也随着需求波动的增大而增大, 且大于td*.对超市和整个系统来说, 需求波动越大对其越不利, 即πd*s、πd*t、πc*t都将随需求波动的增大而减小。

需求波动一定, 产出波动主要影响农户的决策, 当产出波动增大时, 风险规避的农户将变得谨慎, 故td*变小, 进而使得πd*f也变小。与之前不同, 这里产出波动通过农资投入而影响超市的订购量, 对风险持积极态度的超市而言, 产出波动越大, 单位农资投入后最后的单位产出也变大, 而且, 当产出量大于订购量时, 超市用较低的价格就能购买到农产品, 所以, 当产出波动增大时, 超市的积极态度促使其不采用刺激农户投资的决策, 即订购一个较小的量, 即qd*变小。至于tc*、πc*t、πd*t的变化情况跟h的变化相似, 这应归结于超市和农户双方对产出风险的态度的相互作用效果。

对整个系统来说, 产出风险的增大对整个供应链的利润的影响是不定的, 在一定范围内有利, 在一定范围内不利, 而需求风险的增大将对整个供应链的利润产生不利影响。由图1、图2、图3、图4知, 不管是产出波动、还是需求波动, tc*>td*、πc*t>πd*t始终成立。

5.2 供应链协调

通过5.1节的分析可知, 分散式决策下的最优农资投入和总利润均小于集中式决策下的最优农资投入和总利润, 因此, 对“农超对接”模式的农产品供应链, 研究供应链的协调就显得很有必要。供应链达到协调时应满足以下两条件:①πs=βπct且πf= (1-β) πct, 其中0<β<1; ②πcf≥πdf且πcs≥πds.这里, 将以上两个条件为根据, 使用利润共享合同来分析协调问题。考虑到文中产出和需求都是随机的, 协调过程将变得很复杂, 而且结果不够简明易懂, 因此仍将产出和需求设为均匀分布来分析问题。

命题3 超市通过向农户提供一种基于订购量q的利润共享合同, 能够使得供应链达到协调, 超市决策的订购量应满足:

$q = b Τ - \frac{Τ}{ω - ω_{o}} \sqrt{2 (ω - ω_{o}) (b - a) (ω - \frac{Μ}{Τ})} (7)$

其中, $\frac{Μ}{Τ} = \frac{p (1 - β) [\frac{b (d + c)}{2 Τ} - \frac{a^{2}}{2} - \frac{d^{2} + d c + c^{2}}{6 Τ^{2}}]}{b - a} - (1 - β) c_{s} + β c_{f} ‚ Τ$ 表示系统的预期投入, 0<β<1。

超市通过利润共享合同可使供应链达到协调, 在合同中, 农户将采用集中式决策下的农资投入为自己的投入, 因此, 超市和农户的利润将分别为βπct和 (1-β) πct, β为利润分配系数, 其大小由农户和超市的谈判能力决定。若利润共享合同能被双方所接受, 其必满足:βπc*t≥πd*s和 (1-β) πc*t≥πd*f, 从而可求得 $\frac{π_{s}^{d^{*}}}{π_{t}^{c^{*}}} \leq β \leq \frac{π_{t}^{c^{*}} - π_{f}^{d^{*}}}{π_{t}^{c^{*}}} .$

6 结论

本文以农超对接模式为背景, 提出了在随机产出和随机需求下分担农户产出风险的合作模式, 以促使农超对接模式在我国能迅速地开展。受天气情况等外界不确定因素的影响, 农户投入一定的农资后产出常呈现出一定的随机性, 农户和超市签订的固定订购量合同就给农户带来了产出不足或过剩的双重风险。由于在我国分散式生产的农产品供应链中, 农户应对风险的能力有限, 导致整个供应链合作效率低和稳定性差等问题。为此, 文中采用风险转移的方法来减轻农户面对的产出风险, 即当产量不足时, 农户只需向超市提供实际的产出量, 对于差额部分不需要向超市赔偿;当产量过剩时, 超市以低于批发价的价格购买多出的部分, 以解决农户“难卖”的困境。本文分析了集中式决策和分散式决策下各参与主体的决策行为, 通过算例可知分散式决策下的农资投入和总利润均小于集中式决策下的农资投入和总利润, 而且, 通过对产出波动和需求波动的灵敏度分析可知:需求波动越大对整个供应链越不利, 而产出波动越大对供应链的影响是先有利后不利。本文最后以集中式决策为标杆, 采用利润共享的合同使分散式决策达到了协调。

摘要：以我国“农超对接”模式为背景, 提出了能使农户和超市在随机产出和随机需求下长期友好合作的方案。然而产出的随机性使得农户面临着产量不足或产量过剩的风险, 从农户和超市应对风险的能力出发, 文中提出两点来解决此问题:一是当农户的实际产出大于超市订购量时, 超市以低于批发价的价格收购农户的多余产出, 以解决农户“难卖”的问题;二是当农户的实际产出小于超市订购量时, 农户只需给予实际产出部分, 对差额部分不需向超市赔偿, 以匹配“小农户, 低风险”的状况。文章分析了集中式决策和分散式决策下各个参与成员的决策行为并通过算例进行比较说明, 最后采用利润共享合同使得供应链达到协调。

关键词：随机产出,随机需求,农超对接,供应链协调

随机分析篇2

——随机信号分析基础

本读书报告主要分为三部分：

一、自学计划。

二、理论原理知识。

三、个人总结及心得体会。

一、自学计划。

在研究生第一学期，开设了随机信号分析基础课，这门课程是在信号分析基础上对信号分析与处理的更深一步的学习。11月末，在老师的安排下我们开始进行关于由王永德、王军主编的，由电子工业出版社出版的《随机信号分析基础》（第二版），第5章随机信号通过线性系统的自学。

（1）时间安排

11月末至12月末，每周的周一下午，周四上午设定为学习时间。

（2）目标要求

理解第五章关于5.2，5.3，5.5的相关内容，随时做好学习相关知识的笔记及心得体会。

二、理论原理知识。

在学习本书之前我已经完成了《高等数学》、《复变函数》、《信号与系统》等基础课程的学习。并且在学习第5章之前，学习了前四章的相关知识。

第2、3、4章讨论了随机过程的一般概念及其统计特征。各种电子系统尽管种类繁多，作用各异，但基本上可分为两大类：即线性统计与非线性统计。第五章研究的是现性系统问题并在5.5节开始随机序列通过线性离散系统后统计特性的变化，并介绍随机序列模型的概念与现代谱值的基本思想。以下为关于5.2，5.3及5.5的读书笔记。5.2 随机信号通过线性系统

主要研究输入信号为随机过程时，线性、稳定性、是不变系统的统计特征。5.2.1线性系统输出的统计特征 1.系统的输出

系统的输入输出样本函数之间的关系：Y(t)h()X(t)d，输入随机过程为X(t)，通过系统产生的新过程为Y(t)，对于有收敛的样本函数都可以通过此关系求得输出。

2.系统输出的均值与自相关函数

主要为解决已知输入随机过程的均值和自相关函数，求系统的输出随机过程的均值和自相关函数。

（1）系统输出均值

若X(t)是有界平稳过程，于是

E[Y(t)]E[ mXh()X(t)]d显然mX是与时间无关

h()d的常数。

（2）系统输出的自相关函数

若X(t)是有界平稳过程，则系统的自相关函数为：

RY(t,t) RX(12)h(1)h(2)d1d2RY()通过上面两式可以看出输出的新随机过程Y(t)亦是一个平稳的随机过程。但是实际上时不变随机输入信号时严平稳的，那么输出也是眼平稳的。若输入随机过程是各态历经的，那么输出随机信号也是各态历经的。3.系统输入与输出之间的互相关函数

输入输出的之间的互相关函数为：

RXY()RX()h()d

即输入输出的互相关函数为输入的自相关函数与系统的冲激响应的卷积，可写成

RXY()RX()h()

4.物理可实现系统的响应（1）无限工作时间系统无限工作时间系统是指输入信号x(t)始终作用在系统输入端（即无始信号的情况），不考虑系统的瞬态过程，并且大多数实际应用都是这种情况。若系统输入X(t)为平稳随机过程，则有

Y(t)h()X(t)d0mYmXh()d0

RY RX(12)h(1)h(2)d1d2可以看出只要将前面倒出的关系式中的积分下限“”用“0”代替，即可得到物理可实现系统的各关系式。

这是无限工作时间系统在时间域的关系，但一般情况下对于无限工作时间系统频域法往往更简单。

（2）有限工作时间系统

有限工作时间系统是指输入信号x(t)在t0时才开始加入（也就是输入信号x(t)U(t)的情况）。所以输入X(t)在t0到tt1时刻的输出信号Y(t)为：

Y(t)t1t10X(t1)h()dE[Y(t1)]RYt20t10E[X(t1)]h()d

 0RX(12)h(1)h(2)d1d2以上讨论的都是在时间域范围内，随机信号输入线性系统的响应方法。5.2.2系统输出的功率谱密度主要是给出了系统的功率谱密度与输入的功率谱密度关系。（假设输入X(t)为宽平稳过程，则输出Y(t)也是宽平稳过程，而X(t)和Y(t)是联合宽平稳的。这样在讨论中可以直接应用维纳-辛钦公式。）1.系统输出的功率谱密度

线性时不变系统输出的功率谱密度GY()与输入功率谱密度GX()的关系如下：

GY()GX()H()

H()是系统传递函数，H()被称为系统的功率传递函数。就此关系式书上意见给

22出详细的证明。

2.系统输入与输出之间的互谱密度

互谱密度公式为GXY()GX()H()GYX()GX()H()可以看出，当系统的性能未知时，若可以知道互谱密度就可以确定线性系统的传递函数。3.未知系统辨识精度的分析

由前面的知识可以得出 2XY()111()

可以看出，对于某些频率信噪比小，则相干系数值也小，反之则相干系数值也大。所以用此式可以定量的分析观测噪声对系统辨识的影响。5.2.3 多个随机信号过程之和通过线性系统

在实际应用中，输入一般为多个随机信号的情况是，所以讨论多个随机信号过程之和通过线性系统时很有必要的。假设系统的输入X(t)时两个联合平稳且单独平稳的随机过程X1(t)与X2(t)的和，即

X(t)X1(t)X2(t)

由于系统式线性的，每个输入都产生相应的输出，即有

Y(t)Y1(t)Y2(t)

输出的自相关函数为：

RY()RY()RY()12GY()GY()GY()12

由以上式子可以看出，两个独立的（或至少不相关）的零均值随机过程之和的功率谱密度或自相关函数等于各自功率谱密度或自相关函数之和。通过线性系统输出的平稳随机过程的功率谱密度或自相关函数也等于各自的输出的功率谱密度或自相关函数之和。5.3白噪声通过线性系统

白噪声（white noise）是指功率谱密度在整个频域内均匀分布的噪声。所有频率具有相同能量的随机噪声称为白噪声。5.3.1噪声宽带

理想的白噪声具有无限带宽，因而其能量是无限大，这在现实世界是不可能存在的。实际上，我们常常将有限带宽的平整讯号视为白噪音，因为这让我们在数学分析上更加方便。然而，白噪声在数学处理上比较方便，因此它是系统分析的有力工具。一般，只要一个噪声过程所具有的频谱宽度远远大于它所作用系统的带宽，并且在该带宽中其频谱密度基本上可以作为常数来考虑，就可以把它作为白噪声来处理。例如，热噪声和散弹噪声在很宽的频率范围内具有均匀的功率谱密度，通常可以认为它们是白噪声。5.3.2白噪声通过理想线性系统

1.白噪声通过理想低通线性系统（滤波器或低频放大器）

一个白噪声通过一个理想低通线性系统。相关时间0为：00Y()d12f，表明输出随机过程的相关时间与系统的带宽成反比，即系统的带宽越宽，相关时间0越小，输出过程随时间变化越剧烈，反之，系统越窄，则0越大，输出过程随时间变化就越缓慢。

2.白噪声通过理想带通线性系统（带通滤波器或高频谐振放大器）

一个白噪声通过一个理想带通线性系统。相关时间0为：00Y()d12f，形式与白噪声通过一个理想低通线性系统相同，但是值得注意的是，这里0是表示输出窄带过程的包络随时间起伏变化的快慢程度。即上式表明系统的带快越宽，输出包络的起伏变化越剧烈。反之，带宽越窄，则包络变化越缓慢。

5.3.3白噪声通过具有高斯频率的线性系统

在实际中，只要放大设备中有4~5个以上的谐振回路，则放大设备就具有较近似的高斯频率特性。高斯曲线表示式为

(0)222H()K0e

5.5随机序列通过线性系统 5.5.1自相关函数

随机序列通过一阶FIR滤波器

滤波器的输出自相关函数满足方程：

2bibik, k0,1,,q RY(k)i00 kq qk5.5.2 功率谱密度

在离散型随机信号中，随机序列的功率谱密度为自相关函数的傅里叶变换，RX()DRX(kT)(kTs)

对应的傅里叶变换为：

GX()kRX(kTs)ejkTs

当Ts为1时，上面两式可以改写，即为随机序列的维纳-辛钦定理。pqYnl1alYnlm0bmXnm成为自回归滑动平均（ARMA）系统。它们在描述受白噪声污染的正弦过程等复杂过程时非常有用。

三、个人总结及心得体会。

通过本次对《随机信号分析基础》（第二版），第5章随机信号通过线性系统的自学。首先对我的自学能力加以考验，并得到了充分的锻炼。发现自学过程是非常有意义的，并且使我对知识的理解和更加深刻。

随机作文课教学案例及分析篇3

上课前无意中在《湖州晚报》旅游板块看到一篇题为《暮色西塘》的文章,感觉文笔优美,且韵味十足,因此打算在上课时给学生读一读。

上课开始后,先给学生朗读了此文,学生听后颇为感叹,于是借机分析文章,随机上了一堂作文课。

师:同学们听了此文后,有什么感受?

生:文章古朴,典雅,令人回味。

师:我们附近也有著名的古镇,很多同学都去过,也写过感想,为什么写不出作者的这种味道呢?

(学生茫然不知)

师:那同学们下笔的时候是否确定究竟要写怎么样的东西呢?或者说,假如你们也要写一个古镇,那么你们在写的时候是否明确,你写出来的古镇有什么特点能让读者清晰地感受出来呢?

生:没有。

师:对,这就是为什么我们写出来的文章淡而无味的原因。有许多同学在写景的时候,例如写花,只知道要写花的美,但不知道写花的什么美,究竟是花的袅娜多姿还是花的含苞待放。无的放矢,当然写出来的文章无法感染人。而这篇文章的作者主题明确,因此在写作过程中,在选词用句过程中,也特地选取了一些古朴的词句。那么同学们能否回忆下,哪些描写给你留下了深刻的印象?

生:作者选取了很多古典的景物。

师:例如……

生:灯笼、小村镇、烟雨长廊、酒店和客栈、送子来凤桥、街坊、许愿船等。

师:另外还有吗?

(学生一时答不上来)

师:这里景物的称呼有什么不一样?

生:有古代的味道,好像武侠小说中的景物。

师:对,你们看:小镇称作小村镇;居民也不叫居民,叫街坊;旅店也不叫旅店,叫客栈。这些都是一些古代的称呼,那么作者为什么要这么写?

生:为了渲染气氛。

师:对,大家听了后,有没有一种时空穿梭,回到古代的感觉?

生:有。

师:对!就是这些不起眼的小细节,令文章的氛围大变,也使文章的意境更悠远。这个是文章锤炼字词的长处。除此之外,同学们觉得还有什么值得我们学习的地方吗?

(叫了几个学生回答,都是泛泛而谈,只会说文章好,而不知道文章为什么好)

师:其他同学你们觉得这几位同学的回答怎么样?

生:不好。

师:不好在哪里?

生:都一样。

师:看来同学们挑毛病的本事还是很强的,那为什么找长处的眼睛就没那么亮呢?同学们的回答都是泛泛而谈,没有亮点也没有深度,就如同学们的作文一样,都是流于表面的泛泛而谈,没有新意也不深刻,那么如何让自己的作文有亮点、有深度呢?

生:语言优美。

生:构思新颖。

师:还有吗?你觉得一篇好的文章值不值得你一再去阅读?

生:值得

师:我们为什么要一再去阅读,既然已经知道了文章的内容,为什么还要一再去读呢?

生:有不理解的地方。

师:或者说是值得别人反复思考的地方,是吧?就如同这篇文章中的这几句话:“小巷的商铺前驻足了不少人,分不清多少是游人,多少是街坊。但凡流露欣喜的,便是游人;淡定从容的,应该便是街坊了。活在西塘的人,不会在一个普通的夜晚吟唱溢美的诗篇,西塘就他们而言,是生活,是生命。也就只有我们,惊叹,赞颂,记录,复传播。”作者为何要写“西塘就他们而言,是生活,是生命”。

生:因为西塘是他们居住的地方。

生:因为他们是西塘的一部分。

师:不错,结合后面一句“也就只有我们,惊叹,赞颂,记录,复传播”,可以看出作者的言外之意,西塘人是西塘的一部分,他们从古至今就这么自然而然地融入这幅美景之中,在千年之后,也成为了这幅美景中的一个组成部分,而西塘的古朴典雅也更因西塘人悠闲自在的活动而更显生动起来。那么文章结尾处:“只见远处河上有光点阑珊,近看,原来是点了蜡烛的许愿船。船身用彩纸叠成,五彩缤纷,形状各异,船形,莲花形。船上燃蜡烛一枚,听闻当地人说,当将燃着蜡烛的小船轻放入河,如果蜡烛不熄,自己所许的一个心愿便能传达给上天。美得近乎神话的传说,在这个古老而又静谧的小镇里衍生成了一种意念,一个信仰。远望只只小船燃着烛火飘向远方,不忍去看它何时走到生命的尽头,只因不忍打破这份美丽而又脆弱的虔诚。”这句话中为什么说放许愿船是一种虔诚?虔诚是什么意思?

(学生通过查字典,了解到虔诚的意思:佛教用语,解释为恭敬而有诚意)

生:因为当地百姓把放纸船当成一种信仰,寄托了他们的希望。

生:因为西塘人相信,纸船能实现他们的愿望。

师:那为什么要写这个呢?

生:因为这个是西塘的一种习俗,也是西塘的一部分。

师:结合前面一句“西塘并不需要这些”。我们可以看出,其实作者笔下的西塘人并不在乎游人们的眼光,甚至于根本不在乎有没有游人,不在乎世俗的名利,而只是坚守着他们自己的一种意念、一种信仰。而就是凭着这种意念、这份虔诚,西塘人才将这份古朴一代传一代,完完整整地保持至今,甚至保存到遥远的未来。

(学生频频点头)

师:这些就是这篇文章的亮点,是值得我们一再回味的地方,所以希望同学们在写作文的时候,不要停留于薄薄的一张白纸,而是要努力将笔下的那张薄纸锤炼成厚厚的一叠纸。那么这么值得回味的文章,同学们想不想再听一遍,再和作者一起游览一遍古朴而典雅的西塘?

生:想!

(教师再次朗读《暮色西塘》)

二、案例分析

本堂课只是随机找了一篇文章,通过对文章的分析,穿插写作分析而使学生从读文章中慢慢发现自己的不足之处,然后理清自己平时写作时出现的但又说不清道不明的问题,从而亲身体会写文章时需要努力的方向。从学生的上课反应和课后的反馈情况看,学生收获不少,有许多学生向老师建议,多上一些类似的课。可见学生对于欣赏美文并非毫无兴趣。而作为老师,笔者也对这堂意料之外的课有了不少意料之外的收获。

(一)写作教学的随机性

所谓随机,并不是随便随意之意,而暗含了教师的教学准备应随时随刻的要求。语文教学中的作文教学一直是一个让教师头疼的问题,语文老师常常为了准备一节有效又生动的作文课而煞费苦心。但从这次的课看来,写作教学并非仅仅限于写作课那短短的45分钟,而是贯穿于每一节日常语文教学课,贯通于每一次语言教学中。这就要求语文教师要有随时进行写作教育的准备,对于学生的理解与接受来说,一堂精心准备的写作教学课的效果或许远比不上在每节语文课上提到的几个要点。尤其是将对优美文章的分析和写作教学结合起来,一边挑出文章中写得精彩的细节之处,加以分析;一边引导学生结合自身写作水平以及写作心态作对比,让学生自己来理出自己写作中存在的问题,或许能使学生更易接受,体会也会更深刻些,同时也一定程度地教导了学生如何提高自己的阅读分析文章的能力,尤其是从哪里着手,应该关注哪些方面,等等。

(二)教学材料的广泛性

银行排队系统的随机分析篇4

关键词：排队论,排号机器,银行排队模型,模型比较,最优化

1. 问题的提出

随着对金融服务需求不断提升.然而银行的排队问题经新闻媒体的报道, 便成了摆在各大银行面前既客观又实际的迫切课题。目前, 在缓解银行网点排队压力的建议和对策中, 固然不乏真知灼见, 但是很少有用到数学模型来分析解决问题的。本文将用排队论的知识以及建立排队模型来解决两个主要问题:一是现在银行的排号机器的应用到底带来怎样的好处;二是怎样才能使得排队系统达到最优。

2. 问题的研究

2.1 总体方案设计

首先对银行排队系统进行分析, 其次借助排队论的知识以及合理的假设建立两个排队模型, 即银行引入排号机器前后的两个排队模型。然后根据排队模型的主要数量指标评价这两个模型的优劣, 最后对模型进行最优化讨论。

2.2 假设条件

一般的排队过程有四个基本组成部分:输入过程、排队规则、服务时间、服务机构。

(1) 输入过程

输入是指顾客到达排队系统。顾客流基本满足平稳性、无后效性及普通性, 因而可以假设为Poisson流。

(2) 排队规则

先到先服务, 等待制, 取号限额, 系统容量有限。但通常几乎不发生顾客到达限额的现象, 因此认为容量近似无限。

(3) 服务时间

服务时间具有无记忆性, 即服从负指数分布, 并且每个顾客的服务时间独立。

(4) 服务机构

顾客单个接受服务。

2.3 模型的建立

在银行引入取号机器之前, 顾客到达后在每个窗口前各排一队, 可以假设顾客进入队列后坚持不换, 这就形成c个队列, 它是一个由c个模型构成的排队系统, 而在引入取号机器之后, 它则是一个模型。

2.4 实验数据分析

平均到达率的估计值:

由表1得平均服务率的估计值:

通过拟合检验的方法可以判断平均到达率服从泊松分布, 平均服务率服从负指数分布。

通过实验数据对单路排队模型 (模型) 和多路排队模型 (c个模型) 的计算可知, 在衡量一个排队模型优劣的六个重要参数中, 单路排队相对于多路排队具有显著优势。

2.5 最优化问题

银行排队系统由顾客和银行两方面构成.顾客一方总希望逗留时间越短越好, 因而服务台数越多、服务效率越高越好。这样, 顾客遭受的损失较小, 但银行的服务费用增大了。因为设备的增加, 服务率的提高是有条件的, 因此, 应从双方利益出发, 以费用作为优化指标, 进行综合考察。

3. 结论

(1) 通过对排号机器的引入带来怎样的好处的研究, 我们建立了单路排队模型 (模型) 和多路排队模型 (c个模型) , 分别代表了引入排号机器后和没引入排号机器前的银行排队模型。在衡量一个排队模型的优劣的几个重要的数量指标上计算得知单路排队模型相对多路排队模型有着显著优势, 这也反映了银行引入排号机器对减缓排队压力上有很大的帮助。

(2) 虽然银行引入排号机器后很大程度上减缓了排队压力, 但这样就已经是最优的吗?显然, 还要考虑下最优化问题, 怎样才能使银行所花的成本少并且使顾客满意度高, 因此我们建立了一个总费用函数, 并用边际分析法得出了最优服务台数。从最优化问题得出的结果可以看出银行可以根据等待服务的顾客数和银行的服务效率, 来考虑是否需要增加或减少服务台数来降低总的服务成本。

参考文献

[1]甘应爱, 田丰, 李维铮, 李梅生等.运筹学[M].北京清华大学出版社, 2005.

随机分析篇5

随机振动对星载TDICCD影响分析

研究了星载TDICCD的.成像机理,着重分析卫星扰动引起TDICCD随机振动,造成图像质量下降,给出了典型的振动传递率和可行的振动抑制方法.为了提高TDICCD减振的能力,对TDICCD实施隔振和阻尼抑振控制技术.同时分析了振动控制的基本原理和设计原则,给出了相关的设计.

作者：陈丁跃周仁魁李英才作者单位：陈丁跃(长安大学,西安,710064;中国科学院西安光机所,西安,710068)

周仁魁,李英才(中国科学院西安光机所,西安,710068)

刊名：光子学报 ISTIC PKU英文刊名：ACTA PHOTONICA SINICA 年，卷(期)： 33(10) 分类号：V445.8 关键词：随机振动 TDICCD相机卫星振动抑制

随机分析篇6

关键词随机模糊神经网络；变时滞；全局渐近稳定性

Globally Asymptotic Stability of Stochastic Fuzzy Cellular

Neural Networks with Timevarying Delays

WANG Jingyi， PENG Guoqiang

（College of Mathematics & Econometrics， Hunan University， Changsha， Hunan 410082，China）

Abstract This paper aims at solving the problem of checking the stability of a class of stochastic fuzzy cellular neural networks with timevarying delays. By constructing suitable Lyapunov functional and applying linear matrix inequality（LMI） theory， some sufficient conditions were developed to guarantee its globally asymptotic stability of this kind of neural networks. Two main results were obtained： one considering the globally asymptotic stability of the model， the other regarding its globally asymptotic stability in the mean square.

Key words stochastic fuzzy neural networks； timevarying delays； globally asymptotic stability

中图分类号 O29 文献标识码 A

1 Introduction

It is well known that fuzzy cellular neural networks（FCNN） which integrates fuzzy logic into traditional cellular neural networks brought up by Chua and Yang in 1988 have become a useful tool in a lot of fields like signal processing， pattern recognition， associative memory and image processing[1-3]. Furthermore， time delays are frequently encountered in hardware implementation and they can destroy a stable network and cause oscillations， bifurcation and chaos. Thus， it is of great importance to study the stability of delayed fuzzy cellular neural networks. In actuality， a great deal of studies focusing on this issue have emerged in recent years[4-6].

However， a real system is usually affected by external perturbations and hence should be treated as random. In fact， the synaptic transmission is a noisy process caused by random fluctuations from the release of neurotransmitters and other probabilistic factors. Moreover， a neural network can be stabilized or destabilized by certain stochastic inputs[7]. Accordingly， the study for stability of stochastic FCNNs becomes urgent and consequently some results have been derived[8-11].

The main purpose of this paper is to study the globally asymptotic stability of a kind of stochastic fuzzy cellular neural networks with timevarying delays. We tried to derive our results by applying the linear matrix inequality（LMI） approach， which， to the authors’ best knowledge， has not been used on this kind of systems before. Our conditions for stability are expressed in terms of linear matrix inequalities which can be easily solved by some standard numerical packages.

nlc202309041802

Thus， the proof is completed.

Theorem 2 Under the same conditions of Theorem 1， system （1） is globally asymptotic stable in the mean square.

By the stability results in [7]， the neural network （1） is globally asymptotically stable in the mean square.

5 Conclusion

In this paper， the sufficient conditions have been derived for checking the globally asymptotic stability and the globally asymptotic stability in the mean square of a class of stochastic fuzzy cellular neural networks with timevarying delays by constructing suitable Lyapunov functional and applying LMI approach. Besides， a numerical example has been given to testify the effectiveness of our methods.

References

[1] S HAYKIN. Neural Networks： A Comprehensive Foundation[M].Commun. in Partial Diff Eqns， 1994：105-143.

[2] L O CHUA， L YANG. Cellular neural networks： applications[J].IEEE Trans. Circuits Systems， 1988，35（10）：1257-1272.

[3] T YANG， Y YANG， C WU， et al. Fuzzy cellular neural networks： theory[J].Proceedings of IEEE international workshop on mathematical morphological operations，1996：225-230.

[4] Y LIU， W TANG. Exponential stability of fuzzy cellular neural networks with constant and timevarying delays[J].Phys Letts A， 2004， 323：224-233.

[5] Q ZHANG， R XIANG. Global asymptotic stability of fuzzy cellular neural networks with timevaring delays[J].Phys. Letts. A， 2008， 372：3971-3977.

[6] K YUAN， J CAO， J DENG. Exponential stability and periodic solutions of fuzzy cellular neural networks with timevaring delays[J].Neurocomputing， 2006， 69：1619-1627.

[7] X MAO. Stochastic differential equations and applications[M].Chichester： Horwood Publishing，2007：110-127.

[8] S BLYTHE， X MAO，X LIAO. Stability of stochastic delay neural networks[M].J Franklin Inst， 2001：338-481.

[9] H ZHAO， N DING， L CHEN. Almost sure exponential stability of stochastic fuzzy cellular neural networks with delays[J].Chaos， Solitons and Fractals， 2009：1653-1659.

[10]L CHEN， R WU， D PAN. Mean square exponential stability of impulsive stochastic fuzzy cellular neural networks with distributed delays[J].Expert Systems with Applications， 2011，38：6294-6299.

[11]M Syed ALI， P BALASUBRAMANIAM. Global asymptotic stability of stochastic fuzzy cellular neural networks with multiple discrete and distributed time-varing delays.[J]Commun Nonlinear Sci Numer Simulat， 2010：1155-1167.

ANSYS的随机疲劳分析方法篇7

其中, Gfifj (f) (i, j=1, 2, …q是第i个输入激励和第j个输入激励之间的互功率谱宽度函数。当i=j时, Gf i f j (f) (i, j=1, 2, …q为第i个输入激励的自功率谱宽度函数。Hu i (f) 是第i个输入激励对计算输出点的频率响应函数。是Hu i (f) 的共轭函数。

在结构的随机振动响应分析的问题上, 国内外公司研制了多种以有限元为基础的分析软件, 如ANSYS, SAP2000等。

1 疲劳累积损伤理论

当材料承受高于疲劳极限的应力时, 每一循环都使材料产生一定量的损伤, 这些些损伤时能积累的, 当损伤积累到临界值时就发生损坏, 这表示发生了随机疲劳[], 随机疲劳和确定性疲劳分析在理论上是相同的。对于恒定应力幅的周期载荷作用下的随机疲劳过程, 波动应力的每次循环都在材料中产生小的变化, 产生微小裂缝, 累积损伤不断增多, 直到疲劳失效。结构疲劳损坏过程分为疲劳裂纹的形成, 疲劳裂纹的扩展, 瞬时断裂三个阶段。

现有的疲劳累积损伤理论分为以下几种[1]:1) 线性疲劳累积损伤理论;2) 双线性疲劳累积损伤理论;3) 非线性疲劳累积损伤理论 (Marco-Starkey理论;Henry疲劳累积损伤理论;C o r t e n-D o l a n累积损伤理论) ;4) 基于热力学势的疲劳累积损伤理论;5) 概率疲劳累积损伤理论。

2 ANSYS随机振动分析

结构运动的有限元方程可表达为如下矩阵形式:

式中, M, C, K分别为质量、阻尼、刚度矩阵;分别为节点位移、速度、加速度向量;F (t) 为输入力向量。在式 (1) 中, 令F (t) =0, 得到自由振动方程。在实际工程中, 阻尼对结构固有频率和振型的影响不大, 可忽略阻尼力, 得到无阻尼自振动方程:

设结构做简谐运动, 代入上式, 得齐次方程:

通过解上述特征方程即可得到结构固有频率和振型。

ANSYS随机振动分析可以获得结构随机振动响应过程的各种统计参数 (如:均值、均方根和平均频率等) , 根据各种随机疲劳寿命预测理论就可以成功地预测结构的随机疲劳寿命。

ANSYS的随机振动分析类型包括:直接频率响应通过求解整个模型的阻尼耦合方程, 得出各频率对于外载荷的响应。该类分析是求结构在一个稳定的周期性正弦外力谱的作用下的响应。结构可以具有粘性阻尼和结构阻尼, 分析得到复位移、速度、加速度、约束力、单元力和单元应力。这些量可以进行正则化获得传递函数。

模态频率响应分析和随机响应分析在频域中解决的2类问题与直接频率响应分析解决的问题相同[2,3]。结构矩阵用忽略阻尼的实特征值分析进行了压缩, 然后用模态坐标建立广义刚度矩阵和质量矩阵。

A N S Y S随机振动分析功能十分强大, 主要表现在以下方面:1.具有位移、速度、加速度、力和压力等P S D类型;2.能够考虑α阻尼、β阻尼、恒定阻尼比和频率相关阻尼比;3.能够定义基础和节点P S D激励;4.能够考虑多个P S D激励之间的相关程度:共谱值、二次谱值、空间关系和波传播关系等;5.能够得到位移、应力、应变和力的三种结果数据:1s位移解, 1s速度解和1 s加速度解。

利用A N S Y S计算结构随机疲劳的一般过程是: (1) 计算感兴趣应力分量的统计平均频率 (应力速度/应力) ; (2) 假定68%的时间处于1σ水平, 2 7.4 5%的时间处于2σ水平, 4.3 3%的时间处于3σ水平; (3) 基于期望 (工作) 寿命和统计平均频率, 计算1σ, 2σ和3σ水平下的循环次数; (4) 基于S-N曲线计算疲劳寿命使用系数。

3 结语

A N S Y S的随机振动分析功能十分强大, 能够准确有效地研究结构的疲劳累积损伤问题。

参考文献

[1]刘建伟.疲劳累积损伤理论发展概述[J].山西建筑, 2008, 34 (23) :76～78.

[2]傅志方.振动模态分析与参数识别[M].北京:机械工业出版社, 1990.

混沌映射的随机性分析篇8

混沌序列是一种性能优良的伪随机序列,具有来源丰富,生成方法简单,而且通过映射函数、生成规则以及初始条件便能确定一个加密序列等特点,使得混沌加密受到越来越多的关注,并广泛应用于保密通信领域[1,2,3]。1989年由Matthews[4]最先将混沌理论应用于序列密码。

对于混沌序列随机性的分析,大多是采用统计分析或实验测试的方法[5,6],也有极少数是从推理论证的角度证明了混沌序列的随机性[7]。但是,采用统计分析或实验测试的方法研究混沌序列的随机性时,必须先产生混沌序列,并逐一分析其随机性,计算量庞大,实用性不强;从推理论证的角度证明混沌序列的随机性时,必须先知道混沌映射的不变分布,而大多数混沌映射的不变分布的求解是十分困难的。在文献[8]中提出:度量一个序列的随机性好坏程度的一个尺度就是看其不变分布和一个常数函数是怎样地逼近,或者是看这样的不变分布的变差是怎样的小。所谓变差是指:整个序列中,任意取两个样本做差,然后计算序列中所有样本差的绝对值的均值。

本文通过混沌映射的不变分布的变差来研究混沌映射的随机性问题。求解混沌映射的不变分布主要有三种方法:公式法[8]、直方图法[9]和特征向量法[10]。通过对混沌映射不变分布的变差的研究得出:混沌映射的不变分布的变差越小,说明该混沌映射的随机性越好。

本文着重研究了一般的Logistic映射和超混沌Hénon映射的不变分布。并采用直方图法和特征向量法求解了一般的Logistic映射的不变分布和采用直方图法求解了超混沌Hénon映射的不变分布,最后以图像加密为例设计实现了超混沌Hénon映射的序列密码加密方法。

1一般Logistic映射的随机性分析

我们在文献[11]中分别采用公式法、直方图法、特征向量法三种不同的方法,求解了μ=4时的Logistic映射的不变分布,且得到三种方法产生的不变分布图形是一致的,三种方法在适当的条件下可以通用的结论。

通过观察Logistic映射的Lyapunov指数图知道:当参数μ在3.61547到3.965之间取值时,会在某些点产生分岔,在3.965≤μ<4时,没有分岔。此时的Logistic映射的不变分布无法用公式法求得,这就决定了无法采用公式法来研究Logistic映射的不变分布。因此,本文采用直方图法和特征向量法来研究Logistic映射在区间[3.9655, 4]上的不变分布。

首先,采用直方图法来求解Logistic映射的不变分布,利用直方图法在区间[3.965, 4]上,共做了34幅图。

图1、图2分别给出了Logistic映射在样本区间[0, 1]上,初值x=0.1时,选取105个样本进行统计,得出的在参数μ不同时对应的不变分布图形。

实验中参数μ的选择如下:在区间[3.965, 3.99]上,参数μ从3.965开始,步长为0.001,做了24幅不变分布图,其不变分布变差偏大(如图1所示),随机性不是很好;在区间[3.99, 4]上,从3.99开始,以0.001为步长,取了10个点,进行验证,发现所选点的不变分布的变差均很小(如图2所示),随机性很好。且参数μ越趋近于4时,不变分布变差越小,随机性越好。

其次,采用特征向量法求解Logistic映射的不变分布,同样在区间[3.965, 4]上,做34幅图。

图3、图4分别给出Logistic映射在参数μ不同时,将样本区间[0, 1]等分为M=2000个小区间,使用了2001个样本,得出的不变分布图形。

实验中参数μ的选择同直方图法的选择相同。通过观察,同样有Logistic映射当参数μ在区间[3.99, 4]上时,不变分布的变差较小,随机性较好。

比较直方图法和特征向量法得到的不变分布图形可知,特征向量法得到的不变分布与直方图法得到的不变分布图形是一致的,而特征向量法选用的样本数要少得多。

2超混沌Hénon映射的随机性分析

超混沌Hénon映射公式如下:

在文献[12]中给出了其发散速度与参数的关系、与初值的关系以及它的混沌性与参数的关系,本文将在上述研究的基础上,参照Hénon映射的超混沌状态与参数a、b的关系图,研究超混沌Hénon映射在初值确定的情况下,选择不同参数时的不变分布,进而分析其随机性。

因为超混沌Hénon映射的不变分布无法用公式法求得,且超混沌Hénon映射的转移矩阵很难得到,这就决定了无法采用公式法和特征向量法来研究超混沌Hénon映射的不变分布。因此,本文采用直方图法来研究超混沌Hénon映射的不变分布。

在初值确定的情况下,通过大量的实验,观察Hénon映射在产生超混沌状态时,参数a、b对应的不变分布图形,发现参数a、b在a>1.98时,其不变分布趋于均匀,特别当a接近2,b接近0时,其不变分布变差很小。

图5-图7分别给出Hénon映射在区间[-2, 2]上,初值x=0.01, y=0.2, z=0.0001时,选取105个样本进行统计,得出的在参数不同时对应的不变分布图形。

实验中参数a、b的选择如下:以参数a为标准,b的变化是随着a的变化而随机选取,参数的选取要求产生超混沌且迭代100,000次仍不溢出。在区间[0.2, 1.91]上,参数a从0.21开始,步长为0.1,做了18幅不变分布图,其不变分布变差很大(如图5所示),随机性很差;在区间[1.92, 1.98]上,从1.92开始,按照步长为0.005做了13幅图,其不变分布变差比区间[0.2, 1.91]上相对较小(如图6所示),随机性比区间[0.2, 1.91] 相对稍好;在区间[1.98, 2]上,从1.98开始,以0.002为步长,取了18个点,并对a=1.98时,另外选了6个点进行验证,对a=1.99时,另外选了4个点进行验证,发现所选点的不变分布的变差均很小(如图7所示),随机性很好。且参数a越趋近于2,b越趋于0时,不变分布变差越小,随机性越好。图8中的蓝色区域为超混沌Hénon映射在迭代100,000次以后产生超混沌且仍未溢出的情况下,其不变分布变差很小时,对应的参数a、b的区域图。其中的点为本文采用直方图法验证的点,黑色区域是表示选择相应参数时,序列未迭代到100000次已溢出。

a、b的关系图

也就是说,在图8的浅色区域选择对应的参数a、b时(即由三条直线b=–0.42a+0.84、b=0.25a–0.5和a=1.98所围成的三角形内),Hénon映射是超混沌的、没有迭代溢出且随机性很好,可作为序列密码的种子密钥。

3超混沌序列密码的一个应用实例

图像加密方案首先利用二维广义Arnold猫映射对图像的像素进行置乱,再利用Logistic映射对超混沌Hénon映射生成的数据序列进行扰动,生成序列密码,再对置乱的图像进行加密。

密钥空间的选取由文献[9]得知:Logistic映射参数μ的取值范围为μ∈[3.99,4],初值x0的取值范围为x∈[0,1];超混沌Hénon映射参数a,b的取值范围为a从1.98趋于2、b从-0.005趋于0或从0.0084趋于0(即由三条直线b=–0.42a+0.84、b=0.25a–0.5和a=1.98所围成)的三角区内,初值x0,y0,z0的取值范围为x0,y0,z0均属于[-2, 2]。

混沌数字序列生成的具体生成步骤:

(1) 选择超混沌Hénon映射,输入映射处于超混沌状态的初始条件:初始值(x0,y0,z0),混沌系统的参数值(a,b)。之后由超混沌系统公式(1)迭代按一定间隔选一次取1个维的数据,生成混沌序列{h0(t)},舍去前N次的数据,从N+1次开始作为混沌序列的第一个值{h(t)}。这里可选择超混沌系统的某几维的不同组合方式来产生用于加密的混沌序列。

(2) 解决有限精度问题,根据选择的加扰映射,代入初值lx0,参数μ,同(1)类似,迭代N次后舍去前面的数值,从N+1开始作为扰动序列的值d(t)。

(3) 根据超混沌系统公式由h(t)产生序列{h(t)}的下一个值{h(t+1)},同时产生加扰映射的值d(t+1)。同时根据事先定义好的阈值Y、扰动值m,做如下扰动:

(4)根据公式Γ作判断,将混沌信号{h(t+1)}转化为二进制信号KSi。

(5) 重复(1)、(2)、(3)直到得到需要的经过扰动后克服了有限精度问题的超混沌密码序列。

加密过程

(1) 读入原始图像A。

(2) 用二维广义猫映射Aronld置乱图像,输入猫映射置乱的参数值p, q,置乱的迭代次数n。得到置乱后的图像B。

(3) 加密:根据生成的序列密码,对置乱后的图像B进行加解密。B经过超混沌序列密码KS加密后的最终密文图像为M。假设{Bi}是经Arnold映射置换后得到的图像明文信息序列,{KSi}是超混沌序列密码,{Mi}是加密后的最终密文图像序列。

加密算法设计为:

{Mi}={Bi}Xor{KSi} (3)

(4)解密:先用相同的序列密码KS对密文M进行解密得到像素值B。

解密算法设计为:

{Bi}={Mi}Xor{KSi} (4)

(5)还原图像:用相同的Arnold猫映射对B进行反置乱操作得到原始图像A。

实验结果

取256×256 Lena灰度图像进行实验,密钥初值为:

{p=1, q=1, n=35, N=1000, a=1.995, b=0.0002, hx0=1, hy0=0.1, hz0=0, μ=3.995, lx0=0.32, dert=0.5, dert_m=-0.4;},采用Matlab7.0实验环境,得到图9所示的实验结果。

4结语

基于随机模拟的债券免疫决策分析篇9

债券久期由Frederick.Macaulay提出,又称“麦考利久期”(简记为D),代表了固定收益债券现金流支付时间的加权平均值。 1952年,英国精算师Redington首先提出基于久期的债券免疫理论,并由Bierwag、Kaufman等人发展,直到今天仍被实务界和学术界普遍使用。在不考虑债券的凸性时,其构建的基本要求包括:(1) 构造的资产组合的现值之和等于已有负债的现值之和, 也就是要求资产足够可以抵消负债;(2)构造的资产久期应等于负债的久期,即构造的资产组合相对于市场收益率的敏感性与已有负债是一样的。久期的计算公式如下:

久期实际上就是债券相对于利贴现率的弹性,因此利用久期就可以度量债券的价格相对于利率的波动幅度,从而测量债券的风险。所以债券久期的计算公式又可以表示为(1)式对到期利率求一阶导:

对应的债券久期为:

显然,传统的债券免疫策略是基于马克维茨的投资组合理论,并且是建立在对利率敏感度测量的基础之上的。但是,到期利率始终保持不变这一假设使得资产免疫的效果在面对不确定性的市场变动时,显得极为脆弱。债券价格理论对于到期利率的研究表明其主要受到以下几个因素影响:(1) 市场利率的变化; (2)期限长度;(3)收不到本金或利息的风险;(4)对现金收入流各种不同税收对待的影响;(5)赎回、回售条款的影响。由此带来的或然性风险有6种:市场利率风险、违约风险、提前偿还风险、通货膨胀风险、汇率风险和流动性风险。其中市场利率风险是主要风险。那么,不变的到期利率是不确定的,传统的资产免疫策略就不能完全表示出这种不确定性,但这种不确定性也不能够用概率的正态分布度量出来的,即其均值并不在一个平均值水平上下波动。作者介绍在债券组合免疫模型中采用随机模拟方法对那些存在不确定性因素的债券进行决策的方法,客观地反映了市场的变化,而大量的数据模拟解释了一种概率的结果,这是人们对传统方法中采用固定利率产生怀疑的一个很好解释。

二、随机模拟方法简介

随机模拟法(Stochastic Simulation)是计算机模拟的基础。该方法来源于普丰的随机投针实验。随机模拟建立在中心极限定理论的基础上,假设先生成大量的随机值,每一次生成随机值就完成一次模拟。如果运行了n次模拟,就会生成n个随机值,其均值就是所需要的估计值。

三、债券免疫策略的随机模拟法

在一个高度市场导向的金融中介体系中,到期利率的不确定性是那些能够使公司的偿债能力处于险境中的最重要的一个因素,也是银行和保险公司管理方面的一个至关重要的问题。到期利率的预测一般而言可以采用均值决策法,但是其忽视了预计因素变动的不确定性。还有一种方法是德尔菲决策,但是将会耗用大量的人力、物力。基于Excel的水晶球软件,可以较为方便地实现债券免疫决策的仿真模拟。

1.水晶球软件概述。水晶球软件是由美国决策工程公司开发的随机模拟技术,在Excel电子表格的基础之上,提供了功能丰富的随机模拟方法。该软件较好地利用了Windows的可视化环境,将很多可见即可得的图片、表格、数据集合到了一起,形成了较为专业的技术组合。水晶球软件包的主要模拟技术含有个人电脑的随机模拟程序、时间数据模拟,以及最优化选择技术,可以在处理结果中自动生成随机模拟的最优解。

2.水晶球软件操作方法。

第一步:在Excel单元格中将债券久期的相关决策模型输入;

第二步:利用水晶球软件的“假设定义”功能为变量方格设定既定概率,利用“决策定义”功能定义决策变量;

第三步:在Excel单元格中,将“预测定义”功能的输出变量进行界定;

第四步:在水晶球软件的“运行参数”中设定好需要模拟的次数等具体参数;

第五步:开始进行随机模拟。

笔者举出一个简化的例子说明预测因素不同水平的变化能够影响债券免疫决策的结果。

四、债券免疫案例分析

假设投资人甲在10年后有一笔债务需要偿还,该笔债务的现值为10000元,当前市场的到期收益率r为6%,假设市场上现在有如下两种债券:

债券A:离到期日还有10年,票面利率为5.8%,面值10000元;

债券B:离到期日还有20年,票面利率为9.5%,面值10000元;

投资人甲通过对以前年度债券市场的分析得出到期收益率的一个概率分布,如表1所示:

首先构造出非随机的债券免疫模型,在Excel电子表格中设置相应的表格内容,如图1所示。其中,C11表示债券A的现值计算公式为:=PV ($C $6,C10,$C $4*C9,$C $4),C12表示用10000元现值应购买的债券A的债券面值:=$C$4/C11*$C$4, C15表示债券A的久期值:=DURATION (DATE(2008,1,1),DATE(C10+2008,1,1),C9,$C$6,1),以此类推债券B的设置。为了构造一个在债券A与债券B之间的资产组合作为免疫策略,再定义C16为固定值10表示债务的久期,C14表示应该购买的债券A的比例:=(C16-D15)/(C15-D15),D14则表示债券B的比例:=1-C14。然后,选择到期收益率作为随机变量,按照预计的概率分布,在Excel中利用水晶球软件设置随机单元格,选定运行参数为10万次、置信区间为95%和定义敏感度分析工具,然后进行仿真运算,可以得到债券A购买比例的统计数据(图2)和概率分布情况(图3)的仿真运算结果。

分析图2的随机模拟结果可知,经过10万次模拟运算后, 该债券免疫方案的决策结果为:以33%的比例购买A债券,再以67%的比例购买B债券。A债券购买比例的平均期望值为0.33,并且我们还可以得到关于数据模拟的中位数、众数、方差和峰度等参数值。利用图3还可以进行风险分析,这是水晶球软件提供的随机模拟运行结果的其他有用信息。决策者可以在图3中移动图形中的一个三角图标到不同坐标,就可以较快地计算相应区间A债券购买比例的确定性概率(Certainty),图3中使得免疫策略有效,投资人甲购买A债券比例在0.13到0.41之间的概率为59.773%。对于仿真结果的精确度分析,则可以利用图2中统计表底部的均值标准差(mean standard error)提供的数据, 真实值一般在样本值的附近变动。本案例中是在95%的置信区间内波动, 所以置信区间就是0.33+1.965 ×0.00=0.33到0.33-1.965×0.00=0.33。随机模拟的值在置信度为95%时就是0.33,这主要是由于购买比例在小数点后两位,因此计算结果认为在该精度下没有误差。根据模拟运算的结果就可以计算出需要花费10000 ×0.33=3300元购买相应的A债券, 花费10000-3300=6700元购买相应的B债券。

五、结论

IPO定价机制的随机微分分析篇10

在假定投资者从事新股投资组合并以投资组合效用最大化为目的的基础上,利用随机微分理论并结合Hamilton-Jacobi-Bellman方程所得到的具有随机特征的投资组合问题最优投资策略的定量结果,分析新股定价机制对投资者新股投资份额的影响。同时,根据新股投资份额公式,对新股定价机制进行效率分析,从投资者进行最优化投资决策的角度分析指出以前我国IPO定价机制的缺陷和不足。通过新股投资份额和新股投资风险的单调递减关系,指出我国IPO定价机制在向市场化改革的过程中,由于新股的投资风险逐渐增大,从而使新股投资份额不断减小,必然使一级市场的申购资金逐渐减少,从而逐步加强了投资者的投资理性,有效打通一二级市场,为投资者开辟了新的博弈空间。通过随机微分分析,说明了我国IPO定价机制只有逐步向市场化方向改革,才能为二级市场市场屏蔽风险,使我国的证券市场不断走向成熟,逐步缩小与发达国家之间的差距。

1 IPO定价机制的随机微分分析

1.1 问题描述和假设条件

假设完备的证券市场中,如果投资者的投资满足以下几个条件:(1)在初始时刻t投资者的资金数量Xt=x>0即投资者的初始资金来自个体积累,而不是欠债的形式;投资者在投资过程中Xt≥0(不能借贷)。(2)在任何时刻投资者有权决定把其资金的u(0<u<1)备用于新股投资,以1-u备用于其它风险投资。(3)在下面公式中0刍b刍a或0刍a1刍a2;在t时刻投资者者为了规避风险采用投资组合(风险资产和非风险资产组合或者两种风险资产组合)进行投资,一种资产在t时刻的价格应满足下例微分方程:

其中Wt表示白色噪音,且分别是衡量价格P和噪音变法程度的量。当a>0时,这种投资为风投资,σ=0时为无风险投资,此时。(4)微分方程(1)始终满足相应随机微分方程的存在性条件。

1.2 投资组合中的最优风险投资份额

在满足以上六种假设的前提下,那么对于从事含有新股投资组合的投资者来说,可以从以下方程求得投资者的最优风险投资份额u*:

当投资者采用两种不同风险证券投资组合时,若组合问题存在唯一最优u*时,由(1)式dp=ap dt+σpdW1(t)可得到:

再结合假设3,并解得随机微分方程为:

由于最优控制存在,取效用函数为:

U(X)=logXt=log(x1+x2)其中x1=uXt,x2=(1-u)Xt。

那么效用函数U(X):[0,∞→[0,∞,U(0)=0,即效用函数单调增加,而且符合Hamilton-Jacobi-Bellman方程成立所必须的条件,这样就容易求出投资组合的最优风险投资份额u[7,8]:

若是含有新股的多元风险投资组合(n≥3),同理可得:

1.3 投资者最有投资策略分析

由于一、二级市场之间存在过高价差,新股申购存在无风险的高收益,巨额申购资金低效率盘踞在一级市场,致使一、二级市场资金失衡;新股发行时大家争抢申购,上市后马上抛售套现,巨大规模的短期套利行为,客观上导致了新股发行定价和上市定价的高风险;一、二级市场之间存在巨大的利差,使大量的资金专门在一级市场从事申购,损害了整个社会的资源配置的效率。下面以随机微分方程对投资者的投资行为进行分析。

(1)当σ2=0时,(其中a2=b),就是无风险投资和有风险投资组合下风险资产的最优投资份额。(2)很明显由(4)、(5)可知,u*是关于a1的单调增函数,关于a2的单调减函数,此与投资组合理论是一致的。(3)u*是关于其风险的单调减函数,是关于其它风险的单调增函数。(4)由(2)可知u*符合一般投资组合理论,即投资份额是关于预期收益的单增函数,资分额是关于相应风险的单减函数。只有在较大投资偏好的支配下,才有大较大的投资行为发生,人们在投资中总希望减少自己投资所带来的风险,即风险厌恶投资行为。。(6)在二元风险投资中,若一种投资的风险变得相当大,则对应的投资行为几乎不能发生;反之,若另一种投资的风险变得相当大,在其它因素不变情况下,则投资行为几乎都发生在风险不变的投资上。

如果一级市场和二级市场之间存在过高的、非理性差价,投资者认为在一级市场投资几乎没风险,因此把一级市场投资看成是无风险投资即σ2=0,那么公式(4)变成因此:由上面u*的性质(4)知:a2增大风险投资份额u*必然减小。对于理性的投资者而言,当a2叟a1酆0时,很明显u*=0,那么投资者几乎把资金完全投于到一级市场中。这就完全可以理解在审批制下,一级市场存在巨额申购资金,以致投资者在一级市场投资者“用脚投票”,从而导致二级市场风险增大,由公式(4)可知:u*与σ1成反比,σ1增大,风险资产的投资份额u*减小。不管是风险厌恶型的投资者还是风险喜好型投资者来说,资金投于到一级市场的比例必然增多。

由于二级市场缺泛运行效率,这种发行定价机制难以充分发挥市场的价格发现功能,从而放大了市场的缺陷,降低了市场运行的效率。下面以随机微分方程来对投资者的投资行为进行分析。

由公式(5)

由(2)、(3)可知lσii→m∞ui*=0,(i=1,2,…,n),也就是说投资份额u*是关于自己的风险的单调减函数,是关于其它资产风险的增函数。

由于一级市场和二级市场之间存在过高的、非理性差价减小由于新股初始报酬率减小,也就是说a2变小。投资者的风险投资份额必然u*增大。这就可以使盘踞在一级市场的巨额资金部分释放出来,有利于资源的配制,缓解了一、二级市场存在的矛盾。但是如果a1很大,因而σ1变大,σ可能增大,但对于风险厌恶型的投资者来说,可能更愿意把资金投放到一级市场,当然一级市场会释放部分资金,可能造成一级市场中签率较高,因而出现“水涨船高”的现象。如果a1不大,使u*减小,从而导致二级市场缺泛效率,因而只是缓解了的矛盾,而不能得到彻底解决。

从上面的分析可以看出:在IPO定价机制逐步向市场化的过程中,投资者在二级市场的主导权将逐步向前段延伸到一级市场,不仅慢慢增大了股票上市定价上的话语权,而且有效打通一、二级市场,必然使新股的投资风险σ逐渐增大,从公式(3)可知:σ增大,风险投资份额u*也增大;由于为二级市场屏蔽部分风险,那么二级市场的投资风险必然减小,σj↓,使风险投资份额u*增大;当σ和二级市场股票的投资风险持平时,那么在审批制下一级市场的所有的矛盾便得到了彻底的解决,从而使资金在一、二级市场之间形成良性互动。

2 结束语

论文利用具有随机特征投资组合问题的最优投资策略,分析了IPO定价机制对投资者的投资决策的影响,进而定性分析新股定价机制存在的问题和缺陷。从上面的分析结果,我们可以得出:我国IPO定价制度只有向市场化方向改变,才能提高投资者的投资理性,减小一级市场和二级市场之间存在过高的、非理性差价,缓解了一、二级市场存在的矛盾,使我国的证券市场健康发展,不断走向成熟,逐步缩小与发达国家之间的差距。

参考文献

[1]李选民.中国股票发行定价机制探讨[J].中山大学学报从论,2003,6(70-75).

[2]范军德,黄格非,张剑霞.我国新股发行定价机制的市场化改革[J].中国金融,2004,10(54-56).

[3]黄玲,吴立范.IPO祭——透过市盈率看目前新股发行定价机制[J].股市动态分析,2004,35(9-11).

[4]Bernt,Ksendal.Stochastic Differential Equations An Introduction with Application[M].New york:Springer,1998.1-232.

随机分析篇11

关键词财务管理；违约预测；实证分析；贡献度随机森林；连续属性离散化； WOE变换

中图分类号 F224 文献标识码 A

Abstract The contribution forest model（CRF） was used to research the inner connection between the corporate bonds and its financial index ratio，. The method of discretization and WOE transformation were applied to reduce the dimension of these indexes. The results show that the CRF model's performance significantly outperforms the other models， and the performance of the model on test dataset reaches a accuracy of 90.47%. And the other assessment indexes，AUC statistics， AR ratio and K-S values， are improved by 2.6%， 7.6%， 4.38%. Furthermore， the contribution of variables evaluated its influence on probability of default in a quantitative way， which provides a new point of view to interpret the process of forecast of random forest.

Key words financial management； default prediction； empirical analysis ； contribution andom forest model； discretization； WOE transformation

1 引言

随着金融体系的快速发展，金融市场不断实现快速迭代不断更新，取得显著成就的同时，危机事件却频出不穷.2016年以来国内先后出现多起银行危机事件，先后有中国农业银行39.15亿元票据案件、中信银行9.69亿票据案件、天津银行7.86亿票据案件.上述危机之所以爆发，一个重要原因就是风险管理不当.而信用风险作为Basel新资本协议所强调的重要风险之一，由于其复杂多变，对信用风险的识别、计量往往面临更大的挑战.如何对借债企业的信用风险进行评估、预判其违约概率是信用风险管理的重点内容.因此，建立科学有效的信用风险评估模型，无论是对商业银行增强抵御风险能力，还是对企业管理者宏观审慎的战略决策均有显著意义.

从信用风险的现有研究成果来看，方法体系多分布于传统的统计分析方法、定性评级法、基于期权理论以及现代数据挖掘类方法.其中，最早研究开始于Altman（1968）[1]，认为企业违约可能性的大小与其财务健全与否有直接密切联系，选择五个重要的财务比率，建立了区别倒闭公司与非倒闭公司的Altman模型.Deakin（1972）[2]认为，己经破产、无力偿还债务的公司容易发生信用风险.由于我国目前信用评级机构尚不完善，信用评级数据严重缺失，国内关于企业信用风险的研究多从财务数据中提取特征指标建立相应信用评价模型.Prinzie（2008）[3]将随机森林方法与logistic方法相结合，利用随机森林的构造决策树的思想构建logistic决策森林，提高了logistic模型的估计精度.Yeh等（2012）[4]利用实际金融市场数据，基于KMV模型、随机森林方法、粗糙集理论构建混合KNV-RF-RST模型，评价企业信用风险问题.张奇等（2015）[5]构建了Logit-SVM混合评价模型，提高了模型在训练集上的二分类预测能力.Cui （2015）等[6]充分利用社交媒体大数据，结合BP神经网络模型，构建现代商业银行信用风险评价模型，拓展了传统的信用风险研究指标选择方式.上述研究从不同角度充实了信用风险评价研究，但多数研究都注重模型精度的提高，而忽略了在提高模型精度的同时增加模型的解释能力.如何改进已有的学习算法，在提高模型精度的同时也保证模型的解释能力、量化评估指标的贡献度.基于此，本文采用最优分箱（Optimal Binning，OB）和证据权重变换（Weight Of Evidence，WOE）对数据集进行转变进一步提升模型预测精度，并提出贡献度随机森林（Contribution Random Forest，CRF）方法分解预测函数，在提升预测性能同时也提升了传统RF模型的解释能力.

2 贡献度随机森林模型构建

2.1 随机森林原理回顾

随机森林是Breiman（2001）[8]提出的一种组合分类算法.随机森林通过随机的方式建立多个决策树，利用bootstrap抽样方法从样本数据中抽取k个bootstrap样本Si（i=1，2，…，k），再每次从原始M个自变量中选择n输入变量（nM），由被选择的n个自变量构成随机特征输入向量X，并利用分类回归树（CART）算法建立相应无剪枝的元决策树分类器，最后利用这k个元分类器构成一个组合分类决策系统，最终采用简单投票法做出最终预测.

2.2 连续属性离散化与WOE变换

原始随机森林算法模型虽然分类精度高，但计算负荷大、评估速度慢，在数据集指标维度过大时这一点尤为明显.而对于采用信息熵、Gini指数作为节点分裂标准的随机森林而言，在决策树的生成过程中倾向于选择取值分布广的连续变量，无法有效处理连续变量属性，而通过离散化连续变量，恰可以消除这一影响.根据Fayyad和Irani（1993）[10]的基于熵的连续变量离散化最优分箱方法，以下简称最优分箱（Optimal Binning，OB），其原理和步骤如下：

（5）对分割后的左右子集，重复上述步骤，直至达到最大分组数K.

通过对连续变量进行OB分箱，一方面约束了连续变量的取值维度，使得各变量之间利用信息增益、Gini指数作为节点分裂标准有了可比性，且在一定程度上避免了极端值的影响；另一方面变量取值的降维大大降低了算法的开销.在上述连续变量分箱后，相当于若干个虚拟变量，这就导致原始数据集变量取值过于稀疏，因此需要对分箱后的数据进一步规约，考虑进行证据权重变换（Weight of Evidence，WOE） [10]，对分箱后的变量进行重新编码.

从式（7）可以看出，CRF模型预测值可以分解为各决策树的初始决策值的平均值与各特征变量的平均贡献值之和.CRF模型虽然对随机森林对预测函数进行了分解，但最终对响应变量的预测结果和传统随机森林的投票法完全一致.

3 实证分析

3.1 数据准备与指标体系说明

选取发行公司债券的沪深上市公司作为研究对象，数据来源于WIND金融咨询终端，样本包括截止2016年8月1日已到期债券和已摘牌债券.由于企业的财务状况是企业经营现状的直接反馈，其信用风险亦可从财务指标角度考察，因此从财务指标比率的角度建立信用风险评价模型.参考中诚信、鹏元资信、大公国际等评级机构信用风险评价指标体系，结合刘畅[11]等提出的中小企业信用风险预警指标体系，从资本结构、盈利能力、偿债能力、营运能力、发展能力以及现金流量情况6个方面，遴选以下25项财务比率指标作为信用风险评估候选指标集，见表1.在研究样本中，剔除数据缺失严重的样本，最终初始样本量为230.在230只债券中，已发生违约的债券有28只，记为Bad类，正常债券202只，记为Good类.在数据时间截点选择上，选择债券违约发生前一年或被评级机构降级前一年的财务数据，以此达到建模预警目的.由于现有样本Bad类样本过少，为平衡样本结构，对于债券或主体评级为BBB以下、债券（主体）评级或评级展望被连续降级的也归为Bad类，最后利用SMOTE[12]方法选择每个Bad类样本临近的5个样本合成部分Bad类样本，最终Bad类样本为166.

3.2 模型设定

设定训练集与测试集比例为7：3，分别设定随机森林中元分类器数量为100、200、300、400，设定候选特征数的变化范围为2-25，训练集中各模型的OOB误差如图1所示.

在n=100，候选特征数为 8时，OOB误差达最小值为0.0702；在n=200，候选特征数为 4时，OOB误差达最小值为0.0742；在n=300，候选特征数为 4时，OOB误差达最小值为0.0661；在n=400，候选特征数为 3时，OOB误差达最小值为0.0713 .综合来看，随着模型训练次数的增加，OOB误差逐渐收敛于稳定水平，过高的训练次数范围反而增加计算负荷，而候选特征数不宜过大或多小，因此设定模型元分类器数量为300，候选特征数为4.在实施最优分箱过程中，对连续变量的分组数不宜过大也不宜过小，过大则无法达到降维的目的，过小则区分度不足.设定每次划分带来的信息增益最小阈值为0.01，最大分组数K的变动范围为3—10，不同分组条件下，随机森林模型的准确率情况如表2所示.当分组数等于3时，模型的准确率最低；当分组数等于5或6时，准确率达最大；当分组数大于6时，准确率开始下降.因此，设定最大分组数为5或6为宜，为减小计算负荷，此处设为5.

3.3 模型比较

经过前述OB-WOE变换、预测函数贡献度分解，即得变换后的CRF模型，为评估最优分箱WOE变换对其他模型影响，考察决策树、支持向量机、logistic回归、贝叶斯分类、KNN最近邻分类以及神经网路在最优分箱WOE变换下的预测表现，如表3所示.

在实施最优分箱WOE变换的训练集中，随机森林对Good类样本的准确率为98.39%，相比不变化情况上升了6.07个百分点；对Bad类的准确率为98.17%，上升了8.5个百分点.在测试集中，变换后的数据集对Good类样本的准确率为91.80%，对Bad类的准确率为89.13%，分别上升了2.5、6.5个百分点.由此可见，无论是对于训练集还是测试集，对于随机森林分类方法而言，OB-WOE变换后的数据集能显著提升模型分类效果.对于其他模型而言，提升效果较为明显的是logistic回归、神经网络.其中，logistic回归对于Good类的预测能力的提升效果尤为明显，训练集中由76.45%上升到90.32%，测试集中由76.82%上升到86.36%.对于神经网络而言，无论是测试集还是训练集，其Good类准确率和Bad类准确率都上升了10个百分点以上.究其原因，最优分箱本质是对数据集的一种规约，通过降低自变量取值维度来提炼各样本之间的共性，故对于分类评估模型而言，最优分箱后的数据往往更能提升分类效果.模型准确率只是模型评估的一方面，为综合评估一个信用风险评价模型，还需要从ROC曲线、K-S曲线、CAP曲线等角度综合度量.

3.4 模型总体效应评估

考虑到准确率只是评估模型优劣的一种方法，在信用风险评估研究中还经常从ROC曲线、CAP曲线及K-S曲线三个角度考察模型的曲线性质.其中，ROC曲线是在混合矩阵基础上利用图形综合揭示模型预测的灵敏性和误报率的一种方法，横轴表示误报率（模型错误预测的Bad类占比总Good类比率），纵轴表示灵敏性（模型正确预测到Bad类占比总Bad类比率）.CAP曲线又称累计正确率曲线，CAP和准确性比率（AR）通常广泛用于信用评级领域，通过模型为受评对象计算一个风险评分，将风险评分作为其信用的综合评价，评分越高风险越大，通过求得不同风险评分范围百分比下累计违约的概率部分来刻画CAP曲线.K-S曲线是对模型区分Good类样本和Bad类样本的另一种评估方法，利用评估模型为每个研究样本计算一个违约概率，再将所有样本进行K等分分割，对每部分样本按照违约概率大小进行降序，计算每个样本中违约与正常百分比的累计分布，二者之间的差异就是K-S曲线的构成要素.

如图2所示，从各模型的测试集的ROC曲线来看，在误报率在0.05左右时，变换后的CRF模型对Bad类的覆盖率已达到92%，AUC统计量达0.943，而不变化的CRF模型模型对Bad类的覆盖率约88%，AUC统计量统计量为0.917.对于其他模型，变换前后效果也很明显，其中神经网络模型的AUC统计量有0.653提升到0.872，在误报率为0.1时的覆盖率由0.38左右提升到0.8.综合来看，实施变换后，各模型的优劣次序依次为随机森林、SVM、KNN、神经网络、logistics回归、贝叶斯、决策树，与测试集准确率评估结果基本一致.从各模型的CAP曲线来看，在前40%左右的样本，变换后的CRF模型的CAP曲线贴近理想结果，其AR比例为0.891，不变换的CRF模型的CAP曲线与理想结果有一定差距，最终其AR比率为0.815，说明进行最优分箱变换能提高模型对Bad类的辨识度.从K-S曲线来看，变换后的模型，其K-S值达到0.8204，而不变换的CRF模型其K-S值为0.776 6，处于较高水平，进一步说明进行连续变量的OB-WOE变换能提升模型的分类性能.

3.5 变量重要性与变量贡献度比较

根据式（7）建立变换后的CRF模型，以“11超日债”2013年年度财务数据为例，评估其变量贡献度，并对比随机森林方法下的变量重要性. 在变量贡献度分析方法下，各变量变量贡献度之和为0.802，即说明划分为Bad类的概率为0.802，从而可以认为其风险较高.评级机构在超日债违约后才将其信用等级下调至C级，在某种程度上有一定时滞.而根据变换后的CRF模型，基于“超日债”发债主体2013年年度财务指标数据可判断其违约概率为0.802，在判别“11超日债”为违约过程中，各变量的变量变量贡献度如表4所示.

由（7）式可知，在判断“11超日债”为Bad类过程中，贡献度排在前5位的变量与变量重要性排在前5位的变量重复率为40%；贡献度排在前10位的变量与变量重要性排在前10位的变量重复率为60%；贡献度排在前15位的变量与变量重要性排在前15位的变量重复率为73%；贡献度排在前20位的变量与变量重要性排在前20位的变量重复率为85%.其中吻合度较高的变量为EBITtoSaale、Asset_TR、Gro_profit、TAtoD_R、AR_TR；差异较大的变量为Z_Value、Inventory_TR、EM、LDA_R.这是因为变量重要性是对全部样本共性的提炼，旨在说明在各变量在总体数据集的表现情况，多用于从大量指标中选择有作用的变量；而变量贡献度侧重评估对象个性的描述，旨在说明在判断其为Good类或Bad类过程中，哪些变量发挥的作用相对明显，可用于个体分析判断.从贡献度来看，ROE的贡献度最大，说明从ROE角度相对最能说明超日债的风险情况，其次是EBITtoSaale、GropToRev、NetPro_M等等，这也与实际的财务分析理念一致.企业长期经营战略必须提升其ROE，ROE过低则自有资产利用效率低，偿债压力增大.此外，还注意到贡献排名前12的变量中，其WOE值均为正，说明该分组子集中负例占比总负例的比率大于集中正例占比总正例的比率，即落入该分组的个案更多体现Bad类别的特征.结合 “11超日债”实际财务数据来看，其ROE为-1169.6，EBITtoSaale 为-793.56、GropToRev为-64.317、ROA为-65.783等均远低于平均水平，而其Z_Value为-3.34，远远低于Altman的破产概率预警阈值1.8[1]，从而上述指标在 “11 超日债”的判别过程中区分能力强，对违约率影响显著.

因此，从预测结果分解的维度上来看，CRF模型是对预测过程的一个分解，将“黑盒”的决策过程还原为各变量的贡献度之和，进而衡量在预测过程中哪些变量发挥的作用相对明显，再从财务分析角度予以对比印证，在个案分析层面增加了模型的可解释性.

4 结论

针对传统随机森林方法的“黑盒”弊端提出贡献度随机森林方法，通过变量贡献度视角研究了财务指标与违约率的关系.利用对数据集进行基于熵的最优分箱处理、WOE变换实现数据集约简目的，并进一步构建CRF模型评估变量在个案预测过程中的贡献度，实现预测过程的可解释性，最后基于ROC曲线、CAP曲线、K-S曲线对模型进行评估.经对比分析，实施最优分箱、WOE变换能有效提升各模型的准确率，但仍属CRF模型准确率最高，达90.47%.相比不变换的CRF模型，其AUC统计量、AR比率、K-S值分别提升了2.6%、7.6%、4.38%.在“11 超日债”单个样本评估分析中，变量贡献度和指标重要性排在前5、10、15、20位指标的重复度分别为40%、60%、73%、85%，两种评估方式一致程度高.变量贡献度排名靠前的指标均对违约率影响显著，通过变量贡献度角度分解了随机森林预测过程，量化各项指标的影响大小，增加了模型的可解释性.

参考文献

[1] Altman E I. Financial Ratios， Discriminate analysis and the prediction of corporate bankruptcy[J].Journal of Finance，1968， 12（23）：589-609.

[2] Deakin E B. A discriminate analysis of prediction for business failure[J]. Journal of Accounting Research，1972， 14（10）：167-169.

[3] Prinzie A， Van den Poel D. Random forests for multiclass classification： Random multinomial logit[J]. Expert systems with Applications， 2008， 34（3）： 1721-1732.

[4] Yeh C C， Lin F， Hsu C Y. A hybrid KMV model， random forests and rough set theory approach for credit rating [J]. Knowledge-Based Systems， 2012， 22（33）：166-172.

[5] 张奇，胡蓝艺，王珏. 基于Logit与SVM的银行业信用风险评价模型研究[J]. 系统工程理论与实践，2015， 10（7）：1784-1790.

[6] Cui D. Financial credit risk warning based on big data analysis [J]. Journal of Accounting Research ， 2015， 8（10）：133-141.

[7] 李军，信聪，陈暮紫，杨晓光. 诉讼处置不良贷款违约损失率估计的模型簇[J].系统工程，2015， 11（08）：123-132.

[8] Breiman L. Random forests[J].Machine Learning，2001， 45（1）：145-168.

[9] Fayyad U M， Irani K B. Multi-interval discretization of continuous valued attributes for classification learning[J]. Thirteenth International Joint Conference on Articial Intelligence， 1993， 12（2）：1022-1027

[10]Bill H Y， Mykola T . Modeling exposure at default and loss given default： Empirical approaches and technical implementation [J]. Journal of Credit Risk， 2012， 8（2）：81-102

[11]刘畅，郭敏，莫铌，等. 基于巴塞尔协议Ⅱ内部评级法构建我国商业银行中小企业贷款信用风险有效度量和预警指标体系[J]. 金融监管研究， 2012， 12（7）：26-39.

随机分析篇12

随机早期检测RED(Random Early Detection)算法是最早提出的主动队列管理算法。RED能够在拥塞发生的初期对其进行控制，从而防止了拥塞加剧。研究表明，RED较传统的弃尾(DropTail)算法在保证Internet的稳定、健壮、高效上效果更好。但是该算法不能进行自适应参数调节，而且平均队长不可预测。本文对主要的RED算法进行了深入研究，从理论上分析了其优缺点，并验证了改良算法对网络性能的改善。

1 随机早期检测(RED)算法

随机早期检测(RED)算法的基本思想是通过监控路由器输出端口队列的平均长度来探测拥塞，一旦发现拥塞迫近，用丢弃数据包或对包头置位的方法向连接通报拥塞，使他们在队列溢出之前减少拥塞窗口并降低发送数据速率，以缓解网络拥塞。RED算法能够在维持较低的队列长度的同时容忍一定的突发流量。

RED算法可分为两部分：一是计算平均队列长度，决定网关允许的流量突发的程度，以此来反映拥塞的状况;二是计算包标记的概率以决定在当前拥塞程度下路由器该以多大的概率丢弃数据包。在这两部分中权值w和阈值的设置最为关键。

1.1 平均队列的计算

RED算法在计算平均队列长度avgQ时，采用了类似低通滤波器(low-passfilter)带权值的方法：

其中WQ为计算队列的平均长度时采用的权值，相当于低滤波器的时间常数，决定了路由器对输人流量变化的反应程度，WQ设置得过大会使平均队长不能滤掉突发流，若过小则难以检测到初始拥塞。q为采样测量时实际队列长度，avgQ是平均队列长度。这样由Internet的突发流量或者短暂拥塞导致的实际队列长度暂时的增长将不会使得平均队列有明显的变化，从而“过滤”掉短期的队长变化，尽量反映长期的拥塞变化并据此来计算丢包概率。

1.2 包标记概率的计算

RED设置了两个与队列长度相关的阈值minth和maxth，当有包到达路由器时，RED计算出平均队列长度avgQ。若avgQmaxth，则丢弃所有的包(如图1所示)。

概率P的计算方法如下：

其中，maxp是最大丢弃概率,minth为队列长度的最小阈值，maxth为队列长度的最大阈值，Pb是当前队列实际丢弃概率，count表示上次丢弃分组后收到的分组个数，Pa为Pb的修正概率，是为了保证被丢弃分组间隔的均匀分布，用于避免连续丢包,故以后仅考虑Pa。由于Pa是随着当前队列长度的变化而变动的,该机制的最大适应范围为丢包率在[0,maxQ]流量，当然，实际范围要小得多。概率Pb不仅与avgQ有关，而且还与上一次丢包开始到现在进入队列的包的数量count有关。

2 RED算法的优缺点

相比于DropTail,RED算法基本实现了以下目标：(1)最小化包的丢失和队列延迟;(2)避免了全局同步问题，较大地提高了物理线路的利用率;(3)某个连接的分组被丢弃的概率大致与该连接所占用的带宽成正比，从而保证了一定的公平性。

虽然RED有以上的优点，但是它也存在一些还有待完善的地方：(1)RED的平均队长对于拥塞的程度和RED参数设置十分敏感，从而导致了平均队列长度不可预测，这将引起网络时延不确定;(2)当存在非响应连接时，不能有效地隔离和保护TCP连接。当拥塞发生时也无法保证各个流的公平性，需要依赖用户终端协作与配合才能真正发挥作用;(3)RED网关虽然能够确定一些恶意流(misbehaving flow)，但是并未提出如何控制它们的机制;(4)对于非TCP协议(如基于速率的开环、闭环协议)，RED网关的行为难以确定。

3 RED算法的改进

RED算法是基于平均队列长度进行包的接受和丢弃的，这样做的好处是允许一些短暂的突发业务量。Sally等提出两种RED算法，如表1算法RED-1和算法RED-2)，并对这两种算法进行改进，提出了RED-3和RED-4算法。

RED-1在计算丢包概率时，没有考虑包的大小。首先，count每次包到达时都加1，第二步利用先前的平均队列长度avgQ、最大门限maxth、最小门限minth计算临时概率Pb，接着算出丢包率。而RED-2则考虑包的大小，它在第三步中把包的长度L和包的大小M引入，对临时概率重新计算，加入此步可以更好的计算丢包率。

Pb是计算中临时使用的概率,minth和maxth分别是队列的最大和最小门限值,L是刚到达的包长度,M是包的最大长度,RED-1和RED-2的区别在于第三步。RED-1的优点是count服从均匀分布,这样就避免了droptail中连串丢包现象,从而防止了TCP的全局同步。

Sally等人证明了RED-1服从均匀分布：表2 RED算法改进计算步骤

n是前后两次丢包之间收到的包数据。

TCP的有效吞吐率公式

C是常量，它依赖于所采用的TCP类型;MTU为最大传输单元(Maximum Transport Unit);RTT是往返时间(round trip time);p是丢包率。假设MTU1和MTU2是两个具有相同RTT的TCP流的不同的MTU，为了获得一致的公平性，应该满足,P1和P2分别是两TCP连接各自的丢包率，用L替代MTU1,M替代MTU2,RED-2的改进形式的计算步骤如表2。

RED-3是对RED-2的修改，它在计算最终丢包率时考虑了接受的包大小，RED-4是对RED-3的修改，可以证明RED-4也服从均匀分布，假设n是两次丢包之间收到的包数目(包括丢弃的包)，Li是第i个包的长度。

从理论上说RED-4可以获得最好的公平性，但是要实现完全的公平是很难达到的，RED-4比RED-3的吞吐量略高的原因是RED-4的丢包概率服从均匀分布，这样可以避免全局同步，从而提高链路的利用率。

4 总结

RED算法是主动队列管理算法的代表，目前的改进算法都有各自的优点和有待改进的地方，文章综述了RED算法的基本思想和实现机制。根据TCP的有效吞吐量公式，对Sally等人提出的两种对RED算法进行了改进。对其进行分析表明该算法在获得高吞吐量的同时，能取得更好的公平性。但是值得注意的是，改进算法在完善了RED的基础上大都很难解决自身的参数设置问题，如何解决这个问题有待我们进一步研究。

摘要：随机早期检测RED(Random Early Detection)算法是主动队列管理(Active Queue Management)算法研究的重点之一。它的主要思想是在拥塞发生以前,通过计算队列中包的丢失概率,从而随机丢弃一部分数据包,以达到实现网络拥塞控制的目的。但该算法在应用中仍有不足。该文详细讨论了随机早期检测算法的关键技术问题,研究了对RED算法的改进,并总结了这几种算法的优缺点及其有待改进之处。

关键词：随即早期检测,平均队列长度,丢弃概率

参考文献

[1]FLOYD S,JACOBSON V.Random Earl Detection Gateways for Congestion Avoidance[J].IEEE/ACM Trans on Networking,1993,1(4):397-413.

[2]BRADEN B.Recommendations on Queue Management and Congestion Avoidance in the Intemet[EB/OL].http://citeseer.ist.psu.edu/braden97 recomm endations.Html.

[3]Floyd Sally,Oummadi Ramakrishna.Shenker Scott.Adaptive RED:An algorithm for increasing the robustness of red'S active queue man-agement[EB/OL].http://www.icir.org/floyd/papers/adaptive Red.Pdf.

【随机分析】推荐阅读：

随机时间序列分析模型09-13

随机信号分析西工大10-04

随机信号05-12

随机载荷05-26

随机经济06-11

随机森林06-12

随机游走06-16

随机作文07-30

随机生成08-24

随机算法09-20

>> 查看更多相关文档