正态分布模型

2024-08-09

正态分布模型(精选12篇)

正态分布模型 篇1

摘要:我国是全球最大钢铁生产国和消费国, 同时由于我国矿石资源禀赋特点, 我国也是全球最大的铁矿石进口国, 铁矿石对外依存度很高。因此, 面对不断上涨的铁矿石价格, 在满足钢铁生产矿石需要量的同时, 如何最优化港口库存量, 防止压港, 具有非常重要的意义。本文以为若干个钢厂供应铁矿石的港口为研究对象, 在考虑订货成本、存货成本、缺货成本、特别订货成本的前提下, 计算港口的最优库存量和最小成本, 具有一定的应用价值。

关键词:港口,铁矿石,优化模型

1 引言

2010年我国产粗钢62 665万吨, 比上年增加5 300万吨, 增长9.3%, 产能利用率82%。全年进口铁矿石6.2亿吨, 同比下降1.4%, 铁矿石对外依存度高达62.5%;控制的海外铁矿石资源量仅为9%左右, 进口铁矿石的企业多而分散。虽然目前中国已经成为全球最大钢铁生产和消费国, 同时也是铁矿石最大进口国, 但是在全球铁矿石价格谈判中, 中国钢铁企业处于不利位置。自从2003年加入国际铁矿石谈判以来, 我国在铁矿石定价上毫无话语权, 占世界铁矿石出口65%份额的淡水河谷、力拓和必和必拓在价格谈判中一言九鼎。

2010年, 进口铁矿石价格一路高涨, 从年初的90美元/吨左右上扬至年底的超过140美元/吨。由于铁矿石价格大幅上涨, 中国钢铁行业2010年全年利润预计850亿元左右, 扣除投资收益近80亿元, 主业利润仅770亿元。2010年中国进口铁矿砂平均价格为128美元/吨, 上涨60.6%, 由于进口铁矿砂涨价, 中国钢铁行业为此多支出近300亿美元。2010年中国钢铁行业的利润率仅为3.5%, 低于各行业平均6%的利润率, 在所有行业中垫底。相比之下, 必和必拓2009-2010财年的净利润飙升116.5%, 达到127.2亿美元, 淡水河谷2009年第三季度营业利润为78亿美元, 环比增长69.2%。

近年来, 伴随着港口不断上调的铁矿石现货价格, 二季度协议价格上调的预期也逐步强烈。三大矿山之一的必和必拓日前向钢厂发出了铁矿石最新报价, 由1月份的155美元/吨上涨至168美元/吨 (离岸价) 。如果按照澳大利亚到中国平均海运费7美元/吨计算, 矿石到岸价格将达175美元/吨。

面对不断上涨的铁矿石价格, 在满足钢铁生产矿石需要量的同时, 如何最优化港口库存量, 防止压港, 具有非常重要的意义。本文以为若干个钢厂供应铁矿石的某港口为研究对象, 在考虑订货成本、存货成本、缺货成本、特别订货成本的前提下, 计算港口的最优库存量和最小成本。

2 假设条件

(1) 港口为N个钢厂补充供应铁矿石, 港口两次补货之间的时间间隔为一个循环, 钢厂两次可补货时刻之间的时间间隔为一个周期, 且港口的一个补货循环是钢厂i的补货周期的mi倍。港口有充足的库存满足所有钢厂i的mi个周期的补货要求。

(2) 港口来自钢厂i一个周期总需求Wi, 包括正常补货Yi和特别补货Xi;钢厂i在一循环的第j个周期对港口需求量Wij;港口每个循环末的期望库存水平V。

(3) 港口库存成本主要包括库存订货成本C1、持有成本C2、缺货成本C3, 以及发生缺货时而进行特别订货的成本C4。[1]

(4) 港口和钢厂均采取周期盘点补货策略, 港口和钢厂在它们各自的订货时刻分别向矿石供应商和港口订货并使其期初库存水平分别达到基本库存水平S、si;补货提前期为零[2]。

(5) 第i个钢厂每个周期的的铁矿石需求量ri, ri~N (μiσi2) , 其分布密度和分布函数分别记以fi (x) 和Fi (x) , 不同钢厂之间及同一钢厂不同周期之间的随机需求是相互独立的[3]。

(6) 在港口处发生缺货时, 以常数p的概率造成缺货, 以1-p的概率进行特别订货。

3 模型建立及求解

由假设有:Wi=Yi+Xi, 因为:Yi=min{ri, si}, 故有[4]:

又因为如果Yi

否则Yi=si且Xi>0, 所以有:XiYi=siXi

E[Wi2]=E[Xi2]+2E[XiYi]+E[Yi2]=E[Xi2]+2si (1-μ) ei+E[Yi2], 故可得到Wi的期望和方差分别为:

基于假设, 则所有钢厂对港口在该循环总需求为:

因为港口总的需求是N个独立随机变量的和, 并且一般而言N是足够大的, 故由中心极限定理, 港口每个循环总需求近似服从均值为μ、方差为σ2的正态分布, 即:

P{ri

港口每m个周期 (即一个循环) 被补货至其固定的基本库存水平S, 用 (期初库存+期末库存) /2作为平均库存A的近似值, 即:

所以港口每个循环总期望成本为:

C (S) =C1+C2姨S+0乙s (S-2x) f (x) dxΣ+ (C3p+C4 (1-p) ) s乙∞ (x-S) f (x) dx

设Φ (x) 是标准正态分布函数, 令Φ (zα) =α, 则港口的最优库存水平及相应的库存成本为:

4 仿真计算

假设钢厂铁矿石需求分布服从正态分布N (1 000, 80) , 各客户需求相互独立, 基本参数如下:客户数30;配送中心订货成本7;配送中心单位商品缺货成本5;配送中心单位商品持有成本6;配送中心单位商品特别订货成本10;特别订货率0.5。可计算求得正态分布时的港口最优库存为35 896;总费用297 561。本算例只是表明公式计算的可行性, 实际计算需要收集相关数据。

参考文献

[1]H Schneider, D B Rinks, P Kelle.Allocation of Safety Stocks in a Whole-sale Inventory System Using a Service Level[R].Working Poper, Depart-ment of Quantitative Business Analysis Louisiana State Vniversity, 1989.

[2]A Svoronos, P Zipkin.Estimating the Performance of Multi-Level InventorySystems[J].Opertions Research, 1988, 36 (1) :57-72.

[3]S Chopra, P Meindl.Supply Chain Management:Strategy, Planning, andOperation[M].Upper Saddle River, NJ:Prentice Hall, 2001:78-91.

[4]《运筹学》教材编写组.运筹学[M].北京:清华大学出版社, 2005:346-376.

正态分布模型 篇2

几种预测入侵物种分布模型的比较

摘要:物种的.多样性和生态安全一直是我国重要的基础研究之一,影响着我国经济、社会的发展.详细介绍、比较了几种入侵物种分布模型的优缺点,以期为这几种模型的合理使用提供参考.作 者:姜隽 作者单位:太原市环境保护信息中心,山西太原,030002期 刊:科技情报开发与经济 Journal:SCI-TECH INFORMATION DEVELOPMENT & ECONOMY年,卷(期):2010,20(8)分类号:X171关键词:入侵物种 分布模型 物种预测

正态分布模型 篇3

关键词:SSCI期刊 文献计量指标 分布模型

中图分类号: G250.252 文献标识码: A 文章编号: 1003-6938(2013)06-0073-04

1 引言

学术期刊作为学术成果发表和学术信息发布的重要载体,在科学学理论研究、编辑出版以及科技管理实践中,期刊及其载文的学术质量和影响力日益受到学术系统中诸多主体的重视。期刊的文献计量指标表现高低既是期刊自身高度关注的问题之一,也是投稿者选择投稿对象期刊的主要依据。在一个专业(学科)期刊集合中文献计量指标的总体表现状况,一定程度折射出对应学科的发展水平及其态势。随着我国高等教育国际化战略的深入实施以及人文社会科学“走出去”战略的推进,国内众多高校和科研机构纷纷把发表SSCI和A&HCI期刊论文作为重要的激励手段和科研绩效评价指标之一,这一举措无疑对提高我国人文社会科学研究成果的国际显示度和影响力具有深远意义。但是,科研管理部门往往忽视了这一点,即SSCI期刊的学科、语种、出版国别等分布极为不平衡,而且不同学科指标的表现也存在较大差异[1-2]。为此,深入学科内部,探究不同学科文献指标分布的状况,对于全面了解不同学科和学科期刊群的整体结构和发展特征,指导学者有效投稿、提高科研管理的效率、效能和科学性均具有一定理论价值和现实意义。

2 研究方法与数据样本

科学计量学指标的排序-频度分布模型通常用来探讨不同计量单元指标频度随其位次变化的规律。我国学者梁立明教授及其学生在她主持的国家自然科学基金系列成果中,分别用这一模型对科技指标模型分布及其政策意义进行了富有成效的研究[3-6]。排序-频度分布模型通常呈现负幂分布y=αx-(α>0,>0)或负指数分布y=αe-x(α>0,>0)。前者在双对数坐标中曲线可化为直线,后者在半对数坐标中可化为直线(见图1)。通过判断表征直线斜率大小的值,即可了解某一计量指标分布的相对差异。值越大,指标的相对差异越大,反之则越小。

SSCI是汤姆逊路透公司旗下的Web of Science的一个子数据库,与SCI、A&HCI并称为国际三大索引,是国际最为权威的社会科学数据库之一。主要收录英美等国高质量的54类社会科学期刊文献,少量收录非英语文献。SSCI每年收录的每一学科期刊的总量都做动态调整,并利用其副产品JCR(期刊引证报告)定期发布年度期刊的主要文献指标值,供图书情报部门、期刊编辑、科研管理部门以及社会科学研究人员参考。我们选择JCR中的管理学、经济学、图情学为目标学科,选择2007~2011年共五个年度的指标数据为研究样本,来探讨排序—频度分布模型问题,以期寻找并发现指标分布的差异。

在JCR社会科学版公布的期刊文献计量指标中,人们最为关注的指标是影响因子指标。某一期刊影响因子的大小反映了期刊载文被数据库来源期刊平均引用的程度。经典的影响因子是以两年为引用窗口的,通常又称为加菲尔德影响因子。这一指标在期刊评价和科研管理实践中应用的最为广泛。但是,这一指标在使用过程中,人们逐渐发现,不同学科被引用的峰值时间及其引用周期(引用趋势先升后降的过程)存在较大差异。对人文社会科学来说,基础性学科如历史学、哲学等学科达到引用峰值的时间较长,远超过2年,而对于应用性、交叉性学科如管理学、心理学等达到引用峰值的时间则较短,一般在2年左右。因此,2年并不适合对所有学科领域期刊评价的时间窗口。为此,JCR近年引入了一些新的期刊评价指标,如5年影响因子,来适当拉长评价的时间窗口。本文主要讨论2年影响因子和5年影响因子的排序—频度分布问题。所使用的统计软件均为SPSS17.0。由于本文对于缺省数据不予考虑,所以JCR收录期刊数与报道的文献指标数不完全一致,分别对三个学科领域五个年度的影响因子排序—影响因子频度点列做回归拟合,得出拟合回归方程,并提取值。

3 结果分析

从点列曲线拟合优度看,点列的负指数分布均明显优于负幂分布。因此将这些学科的回归方程两端取自然对数后,曲线化为斜向下的直线,x的系数绝对值亦转化为直线斜率绝对值。表1给出了三个学科的2年和5年的影响因子排序-频度拟合回归方程、拟合优度、样本个数及其值。

单个学科纵向比较看,对于经济学期刊,测度期刊短期和长期影响力的2年和5年影响因子分布有差异。5年影响因子的期刊影响力相对差异要大于2年的期刊影响力差异。随着年份的变化,2年和5年影响因子相对差异都在下降(除2008和2009年未变),越晚的年份相对差异则越小。对于管理学期刊,在五个年度内,2年和5年的值都呈递减态势。对于2007、2008、2011年,5年相对差异大于2年的相对差异,而对于2009、2010年,5年与2年的相对差异相同。对图书馆情报学科,2年和5年的影响因子相对差异呈逐年递减态势,5年影响因子相对差异均比同年的2年影响因子相对差异大。上述结果表明,随着引用时间窗口的拉长,期刊影响的区分度增大,即5年影响因子的差异程度大于2年的差异程度。部分有着持续生命力的文献被引次数将突破2年峰值限制而持续高频被引。可见,我们通常使用的2年影响因子并不是区分期刊影响力的最佳指标。

从三个学科横向来比较,对于2年和5年影响因子,相对差异从大到小排列依次为图情学、管理学和经济学。这说明,相比较而言,经济学作为一个古老的相对成熟的学科,有相对规范的学科研究范式,期刊整体发展较为均衡;图情学是一个既涉及偏定性研究的图书馆学科,又涉及与定量研究、计算机技术、管理信息系统等硬科学的情报(信息)学科,收录的期刊范围相对广泛,这些属于不同子领域的期刊被关注的程度和学科发展水平存在一定差异。前者影响因子普遍低于后者。此外,通过深度分析期刊的出版信息,发现语种差异也导致期刊影响力的较大不同。英美等国出版的刊物在SSCI中的显示度远超过非英美国家母语出版的刊物,即使这些国家以英文出版期刊,其影响力也难以匹敌英文为母语文字的期刊。如2011年《MIS QUARTERLY》的2年影响因子为4.447,而排名最后的巴西出版的葡萄牙文刊物《Informacao & Sociedade-Estudos》为0.015,日本出版的多语种刊物《LIBRARY AND INFORMATION SCIENCE》也仅为0.040。本年度影响因子极差达4.434。5年影响因子的极差达到7.463(MIS QUARTERLY与排名第64位的德文刊物ZEITSCHRIFT FUR BIBLIOTHEKSWESEN UND BIBLIOGRAPHIE之差)。管理学和经济学的情况也与图情学类似,不举例赘述。

nlc202309040705

4 几点启发

4.1 有助于拓展科学学理论研究的空间

自上世纪80年代,以夏禹龙先生的《社会科学学》出版为标志,社会科学学作为大科学学的一个主要分支学科在我国得以播种。但是,相对于狭义的科学学而言,无论从学会建制、研究力量、人才培养、期刊建设等方面,社会科学学的成长性均不能与其分庭抗礼。即使在国外,建制完善的社会科学学也只是初露端倪。科学计量学之父普赖斯认为,科学学就是科学计量学。即用科学的手段来研究科学的整体。如果借鉴这一思想,社会科学学则可视为社会科学计量学。尽管国外科学计量学界研究对象仍以自然科学为主,但是已有包括普赖斯奖获得者格兰采尔、莫德、雷迭斯多夫在内的多位学者对人文社会科学文献的分布、统计与评价指标、被引模式、已有数据库的适用性等问题进行了研究。科学计量学重镇之一的荷兰CWTS的一批学者也在坚持社会科学的计量学方面的特色研究。欧盟委员会、英国经社理事会、加拿大社会科学与人文研究理事会等机构也组织开展了基于社会科学计量学的研究并发布研究报告[7]。

国内社会科学学的研究可借鉴国外思路,从科学计量学入手,利用国内外数据库尤其是国内已有数据库,如中国知网、万方数据库、维普数据库、人大复印报刊资料、全国报刊索引、中文社会科学引文数据库等,开展社会科学的知识体系结构、文献指标分布特征、社会科学的发展规律等问题研究,丰富和夯实我国社会科学学研究领域的研究基础。

4.2 有利于提升社会科学科研管理的合理性

通过计量学方法来了解社会科学文献分布的特征,不仅深化了对社会科学若干学科特征的认识,而且为各级社会科学科研管理部门制订政策与实行管理提供了坚实的理论依据。已有的社会科学管理部门在项目管理、人才遴选、成果评价等方面的工作更多依赖定性方法和经验总结,较少使用社会科学学,尤其是社会科学计量学的研究成果,也不太关注这方面研究的现实意义,这对提升社会科学管理的科学化水平相当不利。以上文研究结果为例,假如用期刊影响因子来评价国际社会科学论文的质量,用2年影响因子评价,论文的区分度就较小;而如果用5年影响因子为衡量指标,则论文区分度大。每个学科都有合理的引文峰值年龄,尤其是人文学科的引用时间要长于社会科学,因此整齐划一的确定评价成果的时间节点无疑有失科学性。这一问题在当前国内的社科评奖中尤为突出。另外,国内社科管理部门均把重奖SSCI论文作为一项激励的措施也值得商榷。且不说社会科学成果蕴涵了意识形态的差别,SSCI数据库主要以收录英美国家期刊为主,以心理学、经济学期刊为主,即使我们在SSCI期刊发表文章了,也不能说这些论文完全代表了我国社会科学研究的最高水平。那些最优秀的社会科学理论研究成果也未必一定发表在SSCI期刊上。当然,如果从提高研究成果的国际显示度的角度来看,这一激励措施还是有一定积极意义的。还有,社会科学成果更多以著作形式表达,期刊论文只占较少比例,这与自然科学显著不同。所以从社科奖励政策设计上就应该较合理地分配好著作、论文、研究报告等成果形式的比例。

4.3 有益于推进社科学术期刊编辑工作的有效性

SSCI期刊在国际学术界的地位,是与期刊主办方、编辑团队、同行评议、出版等各方严谨工作密不可分的。尽管不能说我国社会科学学术期刊进入SSCI期刊阵列是未来期刊努力的一个方向,但是这些期刊在编辑出版方面的经验仍值得我们学习。SSCI期刊审稿方式坚持国际范围的同行评议对于我国社会科学整体质量的提升尤为重要,尽管我国社科期刊界当下最紧迫的改进工作不是国际化审稿,但即使完全实现国内同行专家审稿有时也难以推进。我国社科期刊编辑工作不仅要打造高影响力的名刊,还应在整体提高学科期刊群的办刊质量上有所作为。影响因子不是衡量刊物水平的唯一指标,但都是国际期刊界公认的有效指标。因此,期刊编辑应学习和研究国内外社会科学计量学的最新研究成果,定期关注刊物影响因子的变化,做好同类刊物影响因子的比较和分析,找出差距和存在问题的原因,并寻求改进和提升策略。尤其在选题方面,既要注重选择刊登那些研究学科热点问题的论文,以提升期刊短期的影响力,也应锤炼作者学术坚守的能力,对那些对学科基础理论研究有重要贡献的论文,也应有所偏爱,因为越是这类论文对期刊长期影响力的贡献越大。建立学科期刊群的定期协作交流机制,在选题策划、审稿专家选择、载文量、出版时滞等方面做好分工和协调,逐步缩小学科期刊之间的差距,以整体提升学科的学术研究水平。

参考文献:

[1]姜春林,梁若愚,田文霞.SSCI期刊分布及其对我国社会科学评价的影响[J].科技进步与对策,2008,25(1):139-141.

[2]姜春林. SSCI JCR(2007)图书馆学情报学源期刊解读[J].山东图书馆学刊,2009,(4):68-70.

[3]梁立明,梁立华,孔繁士,等.高等学校科研绩效评估的自报指标与源生指标[J].科研管理,1998,19(6):44-48.

[4]梁立明.科学计量学:指标·模型·应用[M].北京:科学出版社,1995:15.

[5]梁立明,武夷山.科学计量学:理论探索与案例研究[M].北京:科学出版社,2006:109,135.

[6]岳洪江.我国社会科学成果排序——频度分布研究[J].情报杂志,2007,(10):135-137.

[7]蒋颖.国外人文社会科学领域文献计量学的研究进展[J].国外社会科学,2010,(3):28-36.

作者简介:姜春林(1970 - ) ,男,大连理工大学副教授,研究方向:科学计量学、人文社会科学评价和知识产权管理。

正态分布模型 篇4

一、方法建立

第一步:使用M atlab做出样本的频率直方图, 判断数据大致符合何种分布;第二步:利用正态概率纸做正态性检验, 样本数据在概率纸上描点, 若诸点在一条直线附近, 则认为该批数据来自正态总体;若诸点明显不在一条直线附近, 则认为该批数据的总体不是正态分布;第三步:进一步检验该批数据的总体服从正态分布, 采用经典的卡方拟合优度检验法进行验证;第四步:利用数据的正态分布特性进行相关求解。

二、实例分析

通过对某企业的实地调查与统计, 得到其在过去一年255个交易日的日收益额 (单位为万元) 的统计数据如下表1所示。

现做出假设:企业每天结算一次, 保持每天在市场上的投资额为1000万元;影响每天收益额的外界因素基本稳定;所抽取的255个交易日中的收益额为随机抽样;各周期间的收益额相互独立;收益率与收益额呈简单线性关系。

首先使用M atlab做出样本的频率直方图进行直观判断。通过观察, 255个交易日的日收益额的频率直方图近似服从正态分布, 笔者又对比了与该样本同期望、同方差的正态分布图, 见图1。

可知, 该公司255个交易日收益额的频率直方图与其同期望、同方差的正态分布图两者几乎完全契合, 可以初步认为该样本数据服从正态分布。再用正态概率纸对数据服从的分布进行检验, 运行结果如图2所示。

经典的χ2拟合优度检验法进行验证:

1) 原假设:过去一年该公司255个交易日的日收益额的总体服从正态分布, 即H0∶X服从正态分布;备择假设为:过去一年该公司255个交易日的日收益额的总体不服从正态分布, 即H1∶X不服从正态分布;

2) 将整体样本X的取值范围分成t个互不重叠的小区间。由题目所提供的样本值作分割区间:[-∞, -12) 、[-12, -8) 、[-8, -4) 、[-4, 0) 、[0, 4) 、[4, 6) 、[6, 8) 、[8, 10) 、[10, 12) 、[12, 16) 、[16, 20) 、[20, 24) 、[24, 27) 、[27, +∞) , 区间数m=14, 定第i个区间的实际频数为ni, 并计算Pi=F0ti-F0ti-1, i=1, 2, …, 14, 其中t0=-22, t14=32, 根据已经假设的正态分布, 确定理论频数n Pii=1, 2, …, 1 4;

3) 根据定理:若n充分大, 则当H0为真时, 统计量 总是近似的服从自由度为m-r-1的χ2分布, r是被估计的参数个数;其中, n=255, m=14, r=2, 给定显著性水平α=0.05, 则PΣχ2≥χα2m-r-1Σ=α, 查χ2分布表可得:χα2m-r-1=χ02.0514-2-1=19.6751, 即拒绝域为:Ic=Σχ2≥19.6751Σ;

由以上检验可知, X~N 7.4863, 97.0619。可得该正态分布的概率密度和分布函数为:

估计下一周期内的损失数额超过10万元的可能性, 根据样本数据的正态分布性, 即为:

查标准正态分布表, 可得:

即一个周期内损失超过10万元的概率为3.84%。

考虑一个周期内的损失超过10万元的可能性不大于5%的最大初始投资额M。设收益率为r, 收益额为X, 则X=M r, 日收益额X服从正态分布, 初始投资额为一个常数, 故收益率也服从正态分布。

故初始投资额最多为M=1153.27万元。

三、问题推广

四、结语

文章通过对企业历史投资数据的观察与统计, 根据相关理论及历史经验, 认为数据近似符从正态分布。接着通过m atble作图以及卡方拟合优度检验验证了这一猜想, 这是本篇文章的基本立足点之一。基于此结论, 开始对一个周期内, 企业投资风险的相关数据进行预测。最后将其推广到T周期内预测的一般情形。我们通过某企业的2012年的统计数据验证了该套方法的有效性, 同时, 该套方法易于应用到其他任何企业的投资风险预测问题。

摘要:文章主要探究金融投资中的风险掌控问题, 需要根据历史数据, 建立适当的模型, 从而对今后一周期, 两周期, 甚至更一般的情况下的投资风险进行预测。通过对某公司的数据收集, 对其进行实例分析, 建立正态分布拟合模型, 并进行卡方拟合优度检验, 得到相关结论, 进而推广到一般情况。

关键词:投资风险预测,正态分布拟合,卡方拟合优度检验

参考文献

[1]刘小茂, 马林等.资产相对价值的VaR和CVaR风险[J].统计与决策, 2006.

[2]王亮.基于CVAR模型的风险度量[J].统计与决策, 2011.

[3]姜启源, 谢金星, 叶俊等.数学模型[M].高等教育出版社, 2011.

正态分布模型 篇5

需求分布含未知参数时报童模型的实施方法

考虑需求分布未知时的报童模型,假设需求分布的类型已知,但分布函数中含未知参数.证明了直接使用参数的估计量代替参数真实值的实施方法将使报童的期望利润偏离理论上的.最优水平,只能得到一个次优结果.给出了两种修正的实施方法:一是基于大样本理论,通过收集足够多的需求样本数据,不断修正未知参数的相合估计值;另是在小样本下,直接修正未知参数的估计量.

作 者:刘开军 张子刚 LIU Kai-jun ZHANG Zi-gang 作者单位:华中科技大学,管理学院,武汉,430074刊 名:系统管理学报 ISTIC PKU英文刊名:JOURNAL OF SYSTEMS & MANAGEMENT年,卷(期):17(3)分类号:O221关键词:报童模型 参数估计 未知需求

正态分布模型 篇6

关键词 基础设施;工业区位;FC模型

中图分类号 F283 文献标识码 A

1 既有研究及问题提出

新古典经济学家倾向于认为基础设施影响经济产出.这一观点可以从Arrow & Kurz (1969)、 McMillan & Manning(1979)、Barro(1990)、Davoodi &Zou(1998)、Zhang & Zou(1998)以及Gong & Zou(2002)等诸多文献中找到[1-5].韦伯(Weber,1929)研究的基础上,以生产价格为变量研究了区位空间分布的均衡解[6].Krugman(1993)认为企业的区位选择动机主要基于市场可获得性和区域生产优势两个层面来权衡[7].Fujita (1999)认为基础设施空间布局的差异终将存在收益再分配效应,这影响相邻地区邻生产率水平,从而影响了区域间产业结构和福利水平[8].Cohen,J. P. (2007)强调了基础设施的外部效应,从而可以影响外部资本和企业的进出[9].

刘钜强、赵永亮(2010)发现基础设施投资往往被资本化,进而被计算进当地企业成本中,影响其生产率[10].任晓红,张宗益(2010)对交通基础设施与制造业区位选择进行了计量经济分析,发现交通基础设施在工业化初期影响了[11].路江涌、陶志刚(2007)认为交通基础设施将改变区域离心力和向心力之间的力量对比,从而对企业的区位选择产生相反的影响[12].董晓霞、黄季焜(2006)的研究发现交通条件的改进是发展中国家农业生产结构调整的主要动因[13].

但是上述研究过多的从静态角度对基础设施与工业区位分布进行研究.没有基于从区域产业布局由核心向边缘动态发展过程中,探究各经济主体(生产者、消费者、政府)的行为方式对工业区位分布的影响,且过多的分析基础设施的数量而非效率对工业区位分布影响.因此,未来应该是在核心——边缘模型(FC模型)的基础上,研究基础设施数量及效率对工业区分布的影响力.

2 博弈各方行为特征描述:

基于基础设施视角

本文假定存在垄断竞争下的工业部门M、完全竞争的农业部门A、提供和生产基础设施的公共部门G.各部门只使用劳动力一种要素,其中工业部门的劳动力用H来表示,农业部门劳动力用L表示,基础设施提供部门劳动力用J表示.这里存在政府、消费者、企业的三方博弈,基础设施由政府来提供(资源来自于消费者的税收),消费者使用税后收入进行消费,企业雇佣消费者进行生产.

2.1 消费者行为特征描述

正态分布模型 篇7

在衡量波动的非对称性方面,主要有Nelson提出的EGARCH模型,Glosten等提出的GJR模型,Engle提出的AGARCH模型等。Hagurd、GonzalezRivera、Anderson等、Lee,Degennaro、Lubrano、Lanne和Saikkonen等先后扩展了这类模型,在方差方程中引入平滑转移函数,提出了各种STGARCH模型来衡量波动性。STGARCH模型在2个状态之间,还允许中间状态的平滑移动,TARCH模型实际 上是STGARCH模型的特定形式[1]。

在衡量波动的尖峰厚尾性方面,对金融时间序列波动结构特征的的建模效果很大程度上取决于其残差服从何种分布。“有效市场假说”下假设金融资产收益服从正态或高斯分布已无法合理描述、解释金融资产条件收益率经常呈现出现的尖峰厚尾现象。对此很多学者把学生t分布、广义误差分布( GED) 和Skewed - t分布引入到GARCH族模型的研究中,并取得了非常好的研究效果。而国外学者更是提出了一些具有前沿性的Elliptical分布、双曲线分布等来刻画金融资产条件收益率的尖峰厚尾现象,在国内这些分布的应用还不广泛。

在衡量波动的长记忆性方面,Engle和等提出用IGARCH模型来刻画波动的这一特性。该模型的条件方差有一个单位根,这意味者任何对条件方差的影响都将永久持续下去,而无条件方差无穷大,这显然与事 实不符。Bollerslev等[2]提出了FIGARCH模型,其滞后随机误差项以双曲速度衰减,有效刻画了波动的长记忆性而被广泛应用。FIGARCH模型的局限性在于,其信息冲击曲线是对称的,不能反映波动的非对称性。之后他们又进一步提FIEGARCH模型以同时反映波动的长记忆性和对正负信息反应的非对称性。

国内学者也对股市波动的长记忆性从多个角度进行了大量的实证研究,取得了一定的成果。汤果等[3]采用FIGARCH模型对我国股市与纽约股市的长记忆性进行了研究,发现我国股市与纽约股市的区别,弥补了我国FIGARCH研究的空 白。王春峰[4]用传统的R/S分析法对中国股市进行研究,发现中国股市具有显著的长期记忆性。张卫国建立了双长记忆特征的ARFIMA-FIGARCH模型,结果表明深市收益率序列的长记忆性不显著,但波动序列具有显著的长记忆特征。胡平等[5]利用FIEGARCH模型和FIGARCH模型实证分析了上交所的铝、铜、燃料油和天胶四种期货品种波动率的长记忆性和杠杆效应,发现所有期货品种的价格波动率均存在显著的长期记忆性,但其假设残差服从正态分布,无法更好的的刻画金融时间序列常有的尖峰厚尾性。

在总结前述研究成果基础上,发现利用FIEGARCH模型对黄金市场的非对称性和长记忆性进行研究的文献尚不多见。所以本文把FIEGARCH模型应用在黄金市场,并假设残差服从t分布和GED分布,对我国黄金市场的波动进行刻画,而在国内还没有采用FIEGARCH模型对黄金波动进行研究的文献。

1 研究方法与计量模型

FIEGARCH模型由Bollerslev等提出,其主要思想在于把分形差分思想引入了EGARCH模型,可以用来更好 地描述波 动的长记 忆性和杠 杆效应。EGARCH模型用分形差分思想可以表示为

其中: 参数γ1描述正负效应系数体现方差波动项对正负信息的不对称性反应。参数γ2描述放大效应。

当γ1< 0时,在波动大小相同时,利坏消息带来的的波动增幅大于利好消息带来的波动增幅; 当γ1> 0时,在波动大小相同时,利坏消息带来的的波动增幅小于利好消息带来的波动增幅; 当γ1= 0时,在波动大小相同时,利坏消息带来的的波动增幅等于利好消息带来的波动增幅。

通过分形差分自回归多项式[1 - B ( L) ] =Φ( L) ( 1 - L) d来描述长 期记忆性,就得到了FIEGARCH模型的表达式:

FIEGARCH模型的条件方差用指数形式表示,保证了σ2t总是正值,在对模型进行参数估计时,不需要对模型参数进行非负约束。同时,随着zt取值的正负变化,σ2t也会有不同程度的变化,从而更好的体现价格波动[6,7]。

大量的金融实证研究表明,金融市场的价格收益序列具有尖峰厚尾的特征,收益方差序列具有相关性、聚集性和异方差性。而高斯GARCH过程无法解释收益序列通常遇到的尖峰厚尾现象[8]。因此,对于中国黄金市场收益序列的分析客观上要求采用非正态分布进行分析。除t分布外,广义误差分布( GED) 是一种更为灵活的分布形式,通过对参数的调整变化可以拟合不同的情形,包括正态分布,其密度函数形式如下

其中: λ为尾部厚度参数,当ν < 2时,GED分布为厚尾分布; 当ν > 2时,GED分布呈现瘦尾性; 当ν = 2时,GED分布退化为正态分布。

所以本文假设残差服从t分布和GED分布,建立FIEGARCH模型,对我我国黄金市场的波动进行刻画分析。

2 数据选取与分析

2. 1 数据选取与统计特征分析

本文的数据来自于上海黄金交易所的主要交易品种Au99. 99。黄金Au99. 99品种是现货市场的交易品种,但它同时具有T + D等特殊交易机制,使其类似于黄金期货,具有套期保值的特点,所以具有的风险也比较大。所以黄金Au99. 99品种具有一定的代表性。回顾近十年的黄金价格走势,2007年全球金融危机的出现可以说是最近几年价格快速上涨的转折点,所以为了更好的研究近些年我国黄金市场的风险状况,选取2007年1月4日至2014年3月5日,共1 737个Au99. 99品种日交易收盘价数据。其价格走势,如图1所示。

本文对数 据的实证 分析主要 利用Matlab,Eviews软件完成。从图1中可以清晰地看到,从2007年开始黄金价格开始快速的上涨。但是从2011年下半年开始,价格开始大幅度的回落,在整个期间黄金价格波动剧烈,变动幅度较大。

设第t日的收益率为rt,则rt= 100 * ( ln ptln pt - 1) ,pt为AU99. 99品种的日收盘价。则其日收益率序列的基本统计,如表1所示。

Au99. 99黄金品种收益率均值0. 029 159 > 0,中位数0. 061 078 > 0,说明样本为正收益。由于标准差1. 208 614明显大于均值0. 029 159,说明在观察的时间段内日收益率有很大的变化。在正态分布假设下,S( 偏度) = 0,K( 峰度) = 3,而表中数据表明样本的偏度和峰度均显著异于正态分布,且J - B统计量较大,说明了收益分布序列的尖峰厚尾性。其收益率序列,如图2所示。

从图2中可以看到,波动在一些较长的时间内非常小,在其他一些较长的时间内非常大,表明黄金收益率数据存在明显的波动聚集特性。

2. 2 序列平稳性检验

平稳性检验是分析时间序列的重要指标之一。因为使用GARCH模型的一个前提条件是扰动项为平稳过程。可采用ADF检验对数据平稳性进行检验。用Eviews进行ADF检验,如表2所示。

从表2可知,收益率序列的ADF值为 - 42. 69891,且检验的P值为0,所以不存在单位根,这表明样本收益率序列是平稳的。

2. 3 序列自相关性性检验与 ARCH 效应检验

如果时间序列数据在残差之间存在相关性,这将会使变量不能有效的反馈信息。一般采用LQ方法检验自相关性和偏相关性。检验结果,如图3所示。

由于自相关检验中随 机区间的 计算公式为,其中T为样本量。所以从以上序列相关图中可以判断,我国Au99. 99黄金品种收益率序列滞后2期、4期、9期的自相关系数和偏相关系数超出了随机区间的范围[- 0. 047,0. 047],所以拒绝零假设: 随机过程是独立同分布的白噪声过程。通过Eviews软件对AR( 4) 过程的检验和不断试验,均值方程设置为AR( 4) 过程合理。

对此过程拟合出的残差序列作ARCH Test检验,如表3所示

由上表可以判断说明方程残差中ARCH效应是显著的。

下面对残差平方做自相关检验,如图4所示。

图4中序列的自相关系数均较大,在滞后12阶时仍为0. 182,尚未很快趋近于0,其Q统计量也都比较大,相应的概率值均为0. 000,说明残差平方序列存在着明显的自相关,拟合异方差性需要高阶的ARCH模型,也就是说 用GARCH模型来拟 合Au99. 99黄金品种收益率序列效果会更好。

2. 4 收益率序列的杠杆性分析

就大多数金融资产而言,普遍存在的一种现象是: 同等强度的负面消息比正面消息引发的市场波动更大,而新信息导致的价格变动与波动之间呈负相关关系,这种关系被称为杠杆效应。这种金融资产中的杠杆效应,实际反映出的是资产价格的后续波动与外部信息冲击之间的一种非对称性关系。通常而言,负面信息引起的波动更大,这在一定程度上也反映出投资者的风险厌恶特性。

对于杠杆性的分析,现有文献主要采用的模型有EGARCH模型、GJR模型与杠杆SV模型等。本文根据以上自相关性分析,采用AR - EGARCH模型和AR - GJR模型对我国Au99. 99黄金品种收益率序列可能存在的杠杆性进行初步的分析和判断。

EGARCH模型:

残差服从t分布下的方差方程:

残差服从GED分布下的方差方程:

GJR模型:

残差服从t分布下的方差方程:

残差服从GED分布下的方差方程:

从以上各 模型参数 估计结果 可知,我国Au99. 99黄金收益率序列在EGARCH模型和GJR模型下均表现出对信息的不对称反应,及存在杠杆效应。在EGARCH模型中,表征杠杆系数的值都大于0,表明好消息对波动的影响比坏消息大。在GJR模型中表征杠杆系数的值都小于0,同样说明好消息对波动的影响比坏消息大。郑秀田[9]采用EGARCH模型对上海黄金交易所最具有代表性的品种Au99. 95的每日收盘价格数据研究同样表明正的冲击比负的冲击更容易增加黄金市场的波动。

所以可以判断,与发达国家金融市场通常表现出的非对称效应———利坏消息对波动的影响比利好消息大相比,在我国黄金市场,杠杆效应表现为好消息对波动的影响比坏消息大。

2. 5 数据长记忆性性检验

如果一个时间序列具有自相似性,即可被称为具有长期依赖或长期记忆的特征,意味着近期的价格变化将影响远期的价格波动。Hurst提出了一种新的统计量———赫斯特指数( Hurst Exponent) ,对长期记忆性进行测量,运用R/S分析( Resealed RangeAnalysis,即重新标度极差分析) 法来分析分形时间序列。重标极 差 ( R/S ) 分析方法 由Mandebrot( 1974) 将其运用到经济理论上,设时间序列{ xt} ,t = 1,2,…,T,取n个序列观察值的均值为

这里只为说明R/S的具体含义,在实证分析中,可以让n从小到大取值一直到N/2,将总时间序列长度N分成A个长度相同的n,分别计算每个时间序列段的R/S值,然后对A个R/S值求平均,就得到了( R/S( j)n序列。在R/S分析法中,赫斯特指数( 即H值) 是非常重要的统计量。H值与( R/S( j)n序列以及时间间隔长度n之间的具体关系是: ( R/S( j)n= ( an)H,对等式两边取对数,即得ln ( R/S) =Hln n + Hln a,式中a为常数。于是,对 ( R / S( j)n序列进行处理,把lnn作为独立变量,ln ( R/S) 作为因变量,应用上式做线性回归,得出自变量的系数即为赫斯特指数H。当H = 0. 5时,原序列是标准的随机游走过程; 当H < 0. 5时,原序列具有反持久性,具有短期记忆性; 而H > 0. 5时,时间序列为长期记忆性[10]。

利用Matlab软件对R/S分析法进行检验,ln( R/S) 关于ln ( n) 的轨迹图,如图5所示。线性回归方程为ln ( R /S) = 0. 544 6ln ( n) - 0. 088 5. 所以上海Au99. 99黄金品种的Hurst指数为0. 544 6,从而可以认为收益的波动率呈现长记忆性特征。

3 计量模型估计

由以上分析可知,我国Au99. 99黄金品种收益率序列存在尖峰厚尾,杠杆性和长记忆性等特征,而FIEGARCH模型综合考虑了时间序列的杠杆性和长记忆性等特点,所以可对我国Au99. 99黄金品种收益率序列建立AR( 4) - FIEGARCH( p,d,q)模型。对于一般的金融时间序列来说,GARCH( p,q) 类模型均设置p,q = 1即可。本文为了找到刻画我国黄金市场效果最好的AR( 4) - FIEGARCH( p,d,q) 模型,分别设置以下4个不同模型,并分别进行了参数估计,并根据Akaike,Schwarz,Shibata,Hannan - Quinn4个信息准 则进行AR - FIEGARCH模型的定阶。其中信息准则值越小,表示模型拟合的越好。各模型参数估计值如下[11],如表4所示。

通过观察比较,AR( 4) - FIEGARCH( 1,d,0) GED模型的4个信息准则值相比于其他3个模型均较小,所以基于GED分布的AR( 4) - FIEGARCH( 1,d,0) 模型拟合效果最好,且其各参数估计值均比较显著。所以选择对我国Au99. 99黄金品种收益率序列建立AR( 4) - FIEGARCH( 1,d,0) - GED模型。

由AR( 4) - FIEGARCH( 1,d,0) - GED模型参数估计值可知:

分形差分系数d > 0. 5,表明Au99. 99黄金品种具有长记忆性特征,与重标极差( R/S) 分析方法分析结论相同。

GED分布自由度为1. 149227 < 2,说明我国黄金市场收益序列呈现明显尖峰厚尾性。

各模型信息准则值,如表5所示。

EGARCH( Theta1) 用来度量非对称性效应,其值不为0,表明我国Au99. 99黄金品种市场存在杠杆效应,但其值较小,度量杠杆性作用较弱,说明FIEGARCH模型度量我国黄金市场杠杆性存在不足。由于EGARCH( Theta1) 的系数为负,表明在波动大小相同时,利坏消息带来的的波动增幅大于利好消息带来的波动增幅,这与前述采用EGARCH模型和GJR模型得到的结论相反。究其原因,认为有以下几点可能造成这种结论差异。第一: 我国黄金市场与欧美黄金市场相比,存在市场化不足,信息有效性不强,交易活跃度不高的状况。在我国民众的心里黄金是保值增值,抵抗通货膨胀的最有利商品,而且很多普通大众认为黄金永远不会贬值,黄金就是财富的象征,这些认识严重忽略了黄金作为一种金融商品所特有的投资风险属性。现在全球黄金市场持续低迷,但国内却有很多民众会大肆购买黄金。与欧美黄金市场的成熟和市场化相比,把许多在国外金融市场应用研究效果较好的计量模型应用在我国黄金市场难免会出现结论上的差异。第二: 数据是否存在结构突变的可能。在此我们先对我国Au99. 99黄金品种收益率序列做回归,然后用Chow Breakpoint Test检验其是否存在突变点。结果显示我国Au99. 99黄金品种不存在结构突变。第三: 有可能因为长记忆性因子的引入造成了这种差异。具体造成这种差异的原因还有待继续的研究和探索。但不可否认的是我国黄金市场存在杠杆效应。

此模型估计方差与实际收益率,如图6所示,从图6可以看出,AR( 4) - FIEGARCH( 1,d,0) - GED模型整体上较为准确的刻画了黄金市场收益序列波动状况。

4 研究结论

本文主要建立了残差服从t分布和GED分布的AR - FIEGARCH模型,并利用此模型对我国黄金市场收益序列进行了拟合估计,并分析了我国黄金市场的波动特征。主要有以下结论:

( 1) GED分布自由度估计结果小于2,说明我国黄金市场收益序列呈现明显尖峰厚尾性,与J - B统计量结论一致。

( 2) FIEGARCH模型分形差分系数估计值为0. 5左右,表明Au99. 99黄金品种具有长记忆性特征,与Hurst指数分析结果一致。

( 3) 虽然EGARCH模型和GJR模型对Au99. 99黄金品种拟合分析表明其存在杠杆性———好消息对波动的影响比坏消息大,但FIEGARCH模型估计结果只表明了其存在较弱的杠杆特性,且方式为利坏消息带来的的波动增幅大于利好消息带来的波动增幅。由于对FIEGARCH模型估计采用的是BFGS迭代法,造成这种结果的差异可能与数据的质量,估计方法还有我国黄金市场本身特性有关。具体杠杆效应表现为何种形式还有待更为准确的计量方法和模型。

以上结论说明我国黄金市场的有效性不强,市场价格对信息的反应存在非对称性。波动的长记忆性暗示市场中发生的事件和消息对期黄金市场的影响不会马上消失,而可能对市场产生长远的影响。例如2008年美国次贷危机发生,为了实现保值,避免通货膨胀、股市下跌带来的巨额损失,投资者纷纷涌入黄金市场。黄金价格也从此时开始快速上涨,直到2013年由于美国经济复苏美元走强、欧债危机等因素致使黄金价格下跌。波动的长记忆性也表明,黄金市场的波动在一定程度上是可以预测的,这可为投资者确定投资策略,规避风险服务。另外,在建立黄金投资组合中,必须考虑黄金价格收益波动的长记忆性,以建立更加符合实际的统计模型。对监管者而言,出台相关政策时,要考虑到价格波动的长期记忆性和对信息反应的非对称性影响。

总之,本文采用FIEGARCH模型对我国黄金市场波动特征刻画,得到的结论较为理想。

参考文献

[1]邹平.基于STFIGARCH模型的中国股市波动与权证定价研究[D].上海:上海理工大学,2012:1-5.

[2]BOLLERSLEV T,MIKKELSEN H O.Modeling and pricing long memory in stock market volatility[J].Journal of Econometrics,1996,73(1):151-184.

[3]汤果,何晓群,顾岚.FIGARCH模型对股市收益长记忆性的实证分析[J].统计研究,1999(7):39-42.

[4]王春峰,张庆翠,李刚.中国股票市场收益的长期记忆性研究[J].系统工程,2003,21(1):22-27.

[5]胡平,崔海蓉,吴有华,等.我国期货市场波动率长记忆性的实证研究[J].西安电子科技大学学报,2009,19(6):10-14.

[6]赵岩.欧元外汇市场分形特征研究[D].大连:大连理工大学,2008:30-35.

[7]BAILLIE R T,BOLLERSLEV T,MIKKELSEN H.Fractionally integrated generalized autoregressive conditional heteroskedasticity[J].Journal of Econometrics,1996,74:3-30.

[8]黄炎龙.基于Skewed-t分布的FIGARCH模型与VaR的度量[J].应用概率统计,2012,28(2):189-190.

[9]郑秀田.我国黄金市场的波动特征与风险度量研究[D].杭洲:浙江工商大学,2008:31-37.

[10]余顺治.基于R/S方法的我国股市分形特征研究[D].武汉:华中科技大学,2009:12-15.

民机部件故障分布模型分析 篇8

根据咨询通告AC-121-54(可靠性方案)要求,航空公司可以根据可靠性方案收集到的数据适当地调整维修间隔及维修任务,以降低运营成本,提高经济效益。虽然目前各航空公司都制定并实施了相应的可靠性方案,但具体的数据分析还是停留在定性分析阶段, 没能把相关的数据转换成合理的数学模型。本文采用数理统计中的假设检验对飞机部件故障分布规律进行了完整的分析,通过在维修中收集到的部件故障信息, 采用假设检验方法来选择一个最优的故障分布模型, 为研究部件故障分布规律及制定相应的维修措施提供依据。

1故障分布模型

可靠性工程中,航空器材一般常用的连续型故障概率分布为指数分布、正态分布、对数正态分布和威布尔分布。

1.1指数分布

指数分布的可靠度函数为:

其密度函数为:

其中:λ为指数函数的参数,表示指数函数的失效率;t为变量。

指数分布具有无记忆性,即零件工作若干小时后, 仍然和新产品具有同样的可靠性。其应用范围很广, 可适用于许多电子元器件如晶体管等,而且适用于复杂的系统和部件。由于它违背了机械零件的腐蚀、疲劳、磨损等逐步损伤的实际情况,因此在机械零件的故障模型中使用较少。

1.2正态分布

正态分布的可靠度函数为:

正态分布的密度函数为:

其中:Φ(t)为标准正态分布函数,μ和σ 分别为正态分布的均值和标准差,前者可看作是位置参数,后者可看作为尺度参数。

正态分布函数也是比较常见的一个分布函数,具有极其广泛的实际应用背景。它主要应用在机械的磨损消耗、疲劳失效及材料的强度刚度失效过程。在电子元器件的可靠性统计中,正态分布适用于由工作时间长短所影响的实效分布中。

1.3对数正态分布

对数正态分布的可靠度函数为:

其密度函数为:

1.4威布尔分布

威布尔分布的可靠度函数为:

其密度函数为:

其中:η为尺度参数;β为形状参数。

当β=1时,威布尔分布即为指数分布。威布尔分布比指数分布、正态分布有更强的适应能力,当参数不同时,它可以转化为指数分布或正态分布。

2假设检验

参数检验是在确定的分布模型下,利用已知的数据对该分布模型的一些统计参数进行推断。但是,在飞机部件故障分布规律未知的情况下,就不适合使用这种方法了。假设检验正是在分布未知的情况下根据已知数据来确定总体分布的情况,其原理就是先对总体情况作出某些假设,然后通过统计推理来判定是否接受这种假设,这就是拟合经验分布和理论分布的问题。

常用的假设检验有χ2检验、检验t、柯氏(k-s)检验以及似然比检验方法等。考虑到飞机部件故障数据一般属于小子样,因此利用柯氏检验法。柯氏检验法用来验证经验分布与所拟合理论分布之间是否有明显的差异性,不用考虑样本大小。由于柯氏检验要求的是确定的连续型分布函数,所以需要利用极大似然法估计各假设分布的参数。在有多个假设分布通过柯氏检验后,最后采用似然比检验选取一个最优假设。

2.1k-s检验法的具体步骤

(1)给出假设分布模型。假设正态分布H0为:

其中:F0(x)是确定的连续型分布函数。

(2)经验分布函数:

其中:n为统计量的总体个数;i为介于两个顺序统计量之间的个数。X1≤X2≤ … ≤Xn是子样 (X1,X2, …,Xn)的顺序统计量。

(3)计算经验分布和假设分布间的检 验统计量Dn:

(4)建立检验规则。当Dn>Dn,a时,拒绝H0,否则接受H0。其中Dn,a为统计量Dn的精确分布分位点,可查表得到。

2.2似然比检验

当母体F是具有未知参数的连续型随机变量,f是其概率密度函数,考虑检验问题:

(1)正态分布:

(2)指数分布:

为检验这两个假设中H0、H1哪一个成立,提出检验统计量用极大似然比,即:

根据极大似然原理,当W取值较大时,说明分子部分出现的可能性大,因此拒绝原假设H0,接受H1; 反之,当W取值较小时,说明分母部分出现可能性大, 因次接受原假设H0,拒绝H1。

采用似然比检验区分正态分布和指数分布时,其极大似然比统计:

化简得:

其中

所以,统计量Dn可以作为检验的统计量。

3实例

在机务维修过程中收集到液压系统某 个部件的TSN(Time Since New)值,并按照从 小到大排 列如下:259,353,363,779,1 050,1 249,1 442,1 782, 4 182,4 553,4 768,11 484,14 178,15 901,16 447, 17 386,18 969,20 406。

下面应用本文所述方法进行故障分布模型的确定。

3.1假设分布模型以及参数估计

在可靠性统计中常用的连续型分布有以下几种: 正态分布、威布尔分布、指数分布或对数正态分布。采用极大似然法估计各分布的参数,并记录到表1。

3.2模型的有效性检验

根据上述给出的柯氏检验法计算得到检验统计量并列于表1。给定显著性水平α=0.05,查k-s检验临界值表得D18,0.05=0.31。由表1可知威布尔分布的最大偏差Dn=0.555 5>D18,0.05,因此有一部分故障的分布不服从威布尔分布,故障分布可以服从正态分布、 指数分布或对数正态分布。

3.3采用似然比检验确定最优假设

区分正态分布和指数分布,计算统计量为D的观察值D=0.981 7。

给定显著性水平α=0.05,查表得D15,0.05=0.77, D20,0.05=0.71,这意味着部件的故障分布服从于指数分布是合理的。把数据取对数以后可以用来区分指数分布和对数正态分布,结论也是指数分布优于对数正态分布。因此,认为该部件的故障分布服从于指数分布。

4总结

随着科技日新月异的发展,许多新技术新材料不断应用于飞机的设计制造过程中。飞机系统部件的功能日益强大,结构也变得更加复杂。维修理论也由传统的定时维修发展到以可靠性为中心的维修。本文通过可靠性统计建立合理的故障分布模型,为今后制定或修改维修大纲(或维修计划)提供了理论依据。

摘要:在维修过程中,航空公司对部件故障分布模型的确定缺乏一套完善的理论体系。针对这种情况,采用假设检验的方法进行故障分布模型的确定。首先应用极大似然法对函数参数进行估计,接着采用柯尔莫哥洛夫检验方法对分布模型进行有效性验证,最后应用似然比检验对故障分布模型进行确认。通过工程实例分析,认为上述方法是可行的且符合部件故障分布规律。

风电场风速分布模型研究综述 篇9

随着世界各国对环境保护、节能减排、可持续发展等问题的日益关注,可再生能源发电技术越来越受到人们的重视。风能作为一种清洁无污染的可再生能源,已经具有与传统常规能源发电竞争的潜力,越来越多的国家把发展风力发电作为改善能源结构和保护生态环境的一种措施。由于风电具有随机性、波动性和间歇性的特点,使得风电场的输出功率波动很大,当其穿透功率达到一定比例后,将对电网的安全稳定运行带来严重影响[1,2,3]。因此,为了优化电网调度,减少旋转备用容量,提高风电穿透功率极限,满足电力市场交易需要,有必要对风电的分布特性进行研究。

体现风电统计特性的一个重要形式是风速的概率分布特性。按照时间尺度不同,风速分布特性有短、中和长周期之分,而绝大多数研究都涉及中长周期,如年、季或月[4]。中长周期的风速概率分布模型主要应用于风电场风资源评估、风电场规划与建设、发电系统可靠性评估等,它是从长期统计数据出发,用数学统计模型实现对风况的描述。中长周期的风速分布一般近似为正偏态分布,风力愈大的地区,风速分布曲线愈平缓,峰值降低右移,即风力大的地区,大风速所占比例也大。由于地理气候特点的不同,各地域的风速分布规律也呈现多样性。

本文较全面地综述了各种风速概率分布模型的特点,以威布尔分布模型为例,总结了常用参数估计方法的优缺点,并对我国的风电分布特性研究与开发工作提出了一些建议。

2 风速概率分布模型

目前,用于拟合风速概率分布的模型很多,有伽马分布、对数正态分布、瑞利分布、威布尔分布、Burr分布等,其中双参数威布尔分布模型应用最为广泛。下面分别对各种分布模型的概率密度函数、累积分布函数以及其优缺点等进行简要介绍。

2.1 伽马(Gamma)分布模型

风能开发利用中,最早用于拟合风速分布的模型是伽马分布,它考虑风速作为离散的随机变量。伽马分布几乎可以拟合欧洲大陆任何地面的风速分布情况[5],其概率密度函数为[6]

式中,v为风速,单位:m/s;k为形状参数,无量纲;c为尺度参数,单位:m/s;Γ为gamma函数。其数学期望μ和方差σ2与参数之间的关系分别为

伽马分布的累积分布函数为[3]

式中,Γv/c为不完全gamma函数。

2.2 对数正态(Log-normal)分布模型

除伽玛分布以外,早期还常用对数正态分布来拟合风速频率分布,其概率密度函数为[7]

式中,v为风速,单位:m/s;c为变量v对数的平均值;k为变量v对数的标准差。其数学期望μ和方差σ2分别为

对数正态分布的累积分布函数为[7]

由于对数正态分布能从多方位的角度对风速分布进行描述,消除数据中的异方差和避免数据变化带来的剧烈波动,大体上能说明风能资源分布情形,但它趋近于无穷大,永远不可能与x轴、y轴相交,导致在低风速和高风速情形下的风速频率拟合效果较差,目前不提倡采用该分布模型[8]。

2.3 瑞利(Rayleigh)分布模型

瑞利分布也常用来拟合风速分布,它是威布尔分布的一个特例。得到某一特定地点一年或甚至更长时间内的风速数据之后,瑞利分布能够以适当的精度来描述风速的分布情况。它所需要的最重要参数是风速的平均值。当平均风速小于4.5m/s时,瑞利分布的可靠性较差;而当平均风速小于3.6m/s时,瑞利分布根本不适用。瑞利分布的概率密度函数为[9]

式中,v为风速,单位:m/s;c为尺度参数,单位:m/s。其数学期望μ和方差σ2分别为

瑞利分布的累积分布函数为[9]

瑞利分布可以合理地描述一些地方风速的特性,但它并不对所有的地点完全适用。普遍公认按瑞利分布得出的结果与实际情况的误差在10%左右,在缺乏更好的数据情况下,可以使用瑞利分布来估计风能[10]。

2.4 威布尔(Weibull)分布模型

威布尔分布模型对不同形状的频率分布有很强的适应性,能较好地描述风速的分布,因其形式简单、计算方便,目前在工程中的应用最为广泛。其概率密度函数为[11]

式中,v为风速,单位:m/s;k为形状参数,无量纲;c为尺度参数,单位:m/s。其数学期望μ和方差σ2分别为

其累积分布函数为[11]

k反映分布曲线的峰值情况,若风速数据的方差较小,则k取值很高,分布曲线的形状也比较陡。当0

2.5 Burr分布模型

近年来,Burr分布也逐渐成为拟合风速分布的模型,它有较好的拟合效果[13,14],但是计算量较大,计算费时。Burr分布的概率密度函数为[13]

式中,v为风速,单位:m/s;α为形状参数;β和k为尺度参数,单位:m/s。其数学期望μ和方差σ2分别为

Burr分布的累积分布函数为[3]

总之,采用哪种风速概率分布模型,要根据该地区的风资源具体情况而定,因地理气候特点的不同,各地域的风速分布规律也不尽相同。

3 常用的参数估计方法

上述各种风速分布模型,只要确定了相关参数,其具体形式就可以确定出来。目前,用于参数估计的方法主要有最小二乘法、极大似然法、矩估计、最小逼近法等。下面以威布尔分布为例,介绍几种常用的参数估计方法。

3.1 最小二乘估计

早在1978年Justus等[15]采用最小二乘法估计参数,以误差平方和最小为目标寻找一组数据的最佳函数拟合。由式(16)可得

令a=-klnc,b=k,x=lnv,则式(21)可转化为y=a+bx的形式。令

式中,n为采样数据样本总数。

对式(22)求各参数的导数,并令导函数为零,求解正则方程组得到参数k和c的值。文献[16,17]结果表明,采用最小二乘法求解风速概率分布的参数,计算比较方便、简单、易于实现,但是其计算精度不高。

3.2 极大似然法

Ramrez等[18]采用极大似然法,根据子样观察值出现的概率最大的原则,求取母体中未知参数的估计值。由式(16)构造对数似然函数

得到包含参数k和c的方程组,解出k、c值即可。

极大似然法估计虽具有渐近无偏性、一致性、渐进有效性,其计算精度高[19],但是两个方程均为超越方程,且相当复杂,需利用迭代法经编程求解,其结果对初值十分敏感[20]。此外,当k值较小时,迭代不易收敛甚至无解[21]。因此,该法难以作为一个易行、普适的方法予以应用。

3.3 矩估计法

刘鹏等[22]采用矩估计法,认为服从威布尔分布的随机变量的各阶矩仍服从威布尔分布,故可用r阶样本矩代替总体r阶矩,求解由所有以未知参数为自变量的矩方程组,便可得到总体未知参数的估计值,此估计值即为参数的矩估计。双参数威布尔分布的r阶原点距mr为

设s为平均风速样本标准差,珋v为平均风速样本均值,则可以由矩估计定义推导出

式(26)无法直接求出解析解,可通过数值法计算得到k值。矩估计的优点在于它的简单性,意义明确,缺点是不能完全利用样本的信息,但是其精度明显高于最小二乘法、最小误差逼近法[23]。

3.4 最小误差逼近法

吴学光等[24]采用最小误差逼近法,较准确地反映特定风电场的实际风速分布。以式(27)为目标函数进行参数寻优

式中,fi、pi为第i个风速的威布尔分布概率和实际分布概率;ε为容许误差。

首先假定k值,利用式(25)计算c值,并代入式(13)计算fi,由实际风速数据统计出pi,将二者代入式(27),然后判断是否成立。若不成立,如此循环;若成立,则所得的k、c值即为最优估计。

最小误差逼近法一般需编程求解,探求的分布函数可以达到与实测分布在形态上相似,但其结果对于风能特征指标只是理论发电量的计算,计算精度较低[23]。

4 分布模型和参数估计方法的比较

前文所述的各种风速概率分布模型的简要总结见表1。常用的参数估计方法的优缺点比较见表2。

5 结论

基于泊松分布的钢厂备件优化模型 篇10

在维护和修理设备时, 用来更换已磨损到不能使用或损坏零件的新制件和修复件称为配件。为了使生产顺利进行, 缩短设备修理停歇时间, 不因设备故障影响生产, 应事先组织采购、制造和储备一定数量的配件作为备件。备件是设备修理的主要物质基础, 及时供应备件, 可以缩短修理时间、减少停机损失, 供应质量优良的备件, 可以保证修理质量和修理周期, 提高设备的可靠性。因此, 备件管理是设备维修资源管理的主要组成部分, 旨在及时有效地向维修人员提供合格的备件[1]。要做好备件管理重要的是做好备件的计划管理工作, 需要多少备件, 何时需要, 这些都涉及备件的库存数量问题。

另外重要备件对钢铁生产至关重要, 因此必须建立相应的备件管理机构和必要的设施, 并科学合理地确定备件的储备品种、储备形式和储备定额, 做好备件保管供应工作。重点做好关键设备维修所需备件的供应工作。钢铁企业的关键设备对产品的产量和质量影响很大, 因此, 备件管理工作的重点首先是满足关键设备对维修备件的需要, 保证关键设备的正常运行, 尽量减少停机损失。在保证备件供应的前提下, 尽可能减少备件的资金占用量, 这对于备件管理来说也是至关重要的。备件管理人员应努力做好备件的计划、生产、采购、供应、保管等工作, 压缩备件储备资金, 降低备件管理成本。以上问题都涉及备件的库存管理问题。备件管理特别是重点备件管理的统计规律符合泊松分布, 这为计划管理提供了很大的方便[2]。

从以上论述中可以看出, 合理确定钢铁企业备件仓库的库存量非常重要。由于许多备件的消耗无法准确预测, 因此备件管理是一项系统工程, 单纯着眼于某一方面都无法取得明显效果。备件计划管理是备件管理工作的核心, 是组织备件采购和供应的依据, 备件能否做到既及时供应又不造成积压, 关键在备件的计划管理[3]。本文基于泊松分布给出了备件最优库存量计算模型。

2 假设条件

(1) 某备件仓库为N个车间补充供应配件, 备件仓库两次补货之间的时间间隔为一个循环, 车间两次可补货时刻之间的时间间隔为一个周期, 且备件仓库的一个补货循环是车间i的补货周期的mi倍。备件仓库有充足的库存满足所有车间i的mi个周期的补货要求。

(2) 备件仓库来自车间i一个周期的总需求为Wi, 包括正常补货Yi和特别补货Xi;车间i在一个循环的第j个周期对备件仓库需求量为Wij;备件仓库每个循环末的期望库存水平为V。

(3) 备件仓库库存成本主要包括库存订货成本C1、持有成本C2、缺货成本C3, 以及发生缺货时而进行特别订货的成本C4。

(4) 备件仓库和车间均采取周期盘点补货策略, 备件仓库和车间在它们各自的订货时刻分别向供应商和备件仓库订货并使其期初库存水平分别达到基本库存水平S、si;补货提前期为零。

(5) 第i个车间每个周期的的配件需求量为ri, ri~π (λ) , 其分布密度和分布函数分别记为fi (x) 和Fi (x) , 不同车间之间及同一车间不同周期之间的随机需求是相互独立的。

(6) 在备件仓库处发生缺货时, 以常数p的概率造成缺货, 以 (1-p) 的概率进行特别订货。

3 模型建立及求解

由假设有:Wi=Yi+Xi, 因为:Yi=min{ri, si}, 故有:

由Yi的定义,

由Xi的定义,

故Wi的均值和方差如下:

基于假设, 则所有车间对备件仓库在该循环总需求为:

因为备件仓库总的需求是N个独立随机变量的和, 并且一般而言N是足够大的, 故由中心极限定理, 备件仓库每个循环总需求近似服从均值为μ、方差为σ2的正态分布, 即:

备件仓库每m个周期 (即一个循环) 被补货至其固定的基本库存水平S, 用 (期初库存+期末库存) /2作为平均库存A的近似值, 即:。

所以备件仓库每个循环总期望成本为:

设Φ (x) 是标准正态分布函数, 令Φ (zα) =α, 则备件仓库的最优库存水平及相应的库存成本为:

4 仿真计算

假设车间备件需求分别服从泊松分布π (5) , 各车间需求相互独立, 基本参数如下:车间数10;备件仓库订货成本2;备件仓库缺货成本5;备件仓库单位商品持有成本6;备件仓库单位商品特别订货成本50。计算得:备件仓库期初库存41;总费用605。

以上计算可以利用Excel表格快速完成, 也可以利用VBA编制计算小程序, 加快计算的速度和精度。应用该模型可以在备件的日常管理中, 根据数据更新的情况实时进行计算, 是备件管理的好帮手。

参考文献

[1]邹永清.冶金设备备件计划管理工作浅析[J].新疆钢铁, 1998 (2) .

[2]王文军.德国钢铁企业备件的经济性管理[J].中国设备工程, 2002 (6) .

正态分布模型 篇11

作者简介:龚艳冰,博士,副教授,主要研究方向为决策理论及应用。

基金项目:河海大学中央高校基本业务费科研项目(编号:2010B24014);江苏省高校哲学社会科学基金项目(编号:09SJD630008)。

摘要为有效地监测和评估人口发展现代化程度,实现人口、经济、环境协调发展,探索和构建了人口发展程度综合评价模型。针对人口发展过程中存在的模糊性和随机性问题,建立了基于正态云模型和熵权的综合评判模型。借鉴已有理论的基础上,综合考虑人口总量、人口结构等5个方面因素构建人口综合发展现代化程度指标体系,采用熵权法确定各个指标权重,借助于正态云模型定量描述单指标条件下待评价我国人口发展的等级。云模型是表示某个定性概念与定量表示之间不确定性转换的模型,它将概念的模糊性和随机性结合在一起,对解决不确定性问题具有很强的鲁棒性。采用云模型理论实现评语与评估指标值之间的不确定映射,保留了评估过程中的随机性和模糊性。最后,以2000-2009年我国10年人口发展相关指标的时间序列数据,以及2009年全国和四个直辖市的人口综合发展截面数据为例,对人口发展现代化程度进行实证检验,结果表明,该模型比传统的模糊综合法能得到更加合理的评估结果。

关键词人口发展现代化;正态云;评价 

中图分类号C92-03文献标识码A

文章编号1002-2104(2012)01-0138-06doi:103969/jissn1002-2104201201022

我国作为人口众多的发展中国家,人口发展问题已成为制约全面协调可持续发展的重大问题,同时又是影响经济社会又好又快发展的关键因素。当前我国面临的能源、交通、就医、就学、就业、居住、治安等突出问题,尤其是经济社会的长远发展,无不与人口规模、结构、分布及人口管理密切相关,人口发展面临前所未有的复杂局面。为了构建“以人为本”的和谐社会,创新人口服务管理体制与机制,实现人口、经济、环境协调发展,有必要对我国人口发展现代化的现状进行综合评价,为人口发展环境的优化提供良好的理论基础。对我国人口发展环境进行评估,主要目的是对现阶段我国人口发展过程中的主要问题进行分析,进一步明确今后的人口发展思路,科学制定人口发展规划,为实现经济社会发展战略构想创造良好的人口环境。

针对人口发展过程中可能出现或已经出现的与经济和环境不协调的一系列问题,提出判别准则,发布人口发展现代化综合评估等级,有助于在人口发展过程中引起经济环境、生态环境恶化之前,及时地提出相应级别的警报信息,以便及时采取防范和应对措施,化解警情,否则人口发展将导致社会可持续发展水平降低。目前,国内外对于人口发展现代化问题的研究已经取得了一定的研究成果。莫里斯提出的被称为“莫里斯全球估价”模式的物质生活质量指数概念;联合国开发计划署在《1990年人文发展报告》中提出的人文发展指数的概念[1];刘铮[2]提出了涵盖人口过程、人口结构和人口素质等几个方面的人口现代化指标体系;牛文元[3]以系统理论为基础提出了可持续发展战略的人口指标体系;陈友华[4]从生育现代化、人口素质现代化、人口结构现代化与经济现代化等方面建立人口现代化评价指标体系;陈仲常等[5]在此基础上,提出了人口发展熵值-模糊综合评判模型。模糊综合评判模型相对完善成熟,但是隶属函数一旦为精确数值表达后, 就不在有丝毫模糊性了。事实上,在考虑人口发展现代化评价指标的定量描述的不确定性、评价结果等级判定的不确定性时, 既有模糊性又有随机性,如果仅仅考虑模糊性容易造成评价结果的不准确。本文针对上述不足,引入人工智能中的正态云模型,将定性与定量相互转换的云模型引入人口发展现代化综合评价研究中,用于解决人口发展现代化等级评估中模糊性和随机性的问题。

1正态云理论

1.1正态云概念及數字特征

为了处理定性概念中广泛存在的随机性和模糊性,李德毅院士首次提出了用云模型作为不确定性知识的定性定量转换的数学模型[6-9],经过几年的完善和发展,目前云模型已成功应用于智能控制、数据挖掘、大系统评估等领域。云模型是用语言值表示的某个定性概念与其定量表示之间的不确定性转换模型,它把模糊性与随机性这二者完全集成在一起构成定性和定量相互间的映射。

定义1 设U是一个普通集合U={x},称为论域。C是论域U上的概念。论域U中的元素x对C的隶属函数μC(x)∈[0,1]是一有稳定倾向的随机数。概念C的云模型是从论域U到区间[0,1]的映射,有

μC(x)∶U→[0,1],x∈U,x→μC(x)

从云的基本定义出发,论域U中某一个元素与它对概念C的隶属度之间的映射是一对多的转换,而不是传统的模糊隶属函数中的一对一的关系。

定义2 设U为论域,C是论域U上的定性概念,若定量值x∈U,且x是定性概念C的一次随机实现,若满足:

x~N(Ex,En′2),其中, En′~N(En,He2)

且对C的确定度满足:

μ(x)=e-(x-Ex)22En′2(1)

则称在论域U上的分布成为正态云。

正态云模型是基本的云模型,正态分布具有普适性,大量社会和自然科学中定性知识的云的期望曲线都近似服从正态或半正态分布。正态云的数字特征反映了定性概念和定量特性,用期望Ex(Expected Value),熵En(Entropy),超熵He(Hyper Entropy)三个数值来表征,其中:期望Ex是定性语言概念论域的中心值,最能代表这个定性概念的值;熵En是定性概念模糊度的度量反映了在论域中可被这个概念所接受的数值范围,体现了定性概念亦此亦彼性的裕度;超熵He是熵En的熵,反映了云滴的离散程度,如图1所示。

1.2正向正态云发生器

如果在论域U中确定点x,通过云发生器可以生成这个特定点x属于概念C的确定度分布,这时的云发生器称为正向云发生器。正向正态云发生器是从定性到定量的映射,它根据正态云的数字特征(Ex, En, He)产生云滴。其具体算法为[6,9]:

(1)给定熵En和超熵He,生成正态分布的随机数En′~N(En,He2);

(2)利用特定输入值x和期望值Ex计算确定度μ(x)=exp[-(x-Ex)22En′2]。

2基于正态云模型和熵权的综合评估模型

在综合评估中,权重是评估的关键内容,可以采用熵权方法确定,熵权能够客观反映指标权重的大小。因此,将2种方法结合建立基于正态云模型和熵权的综合评估模型,综合评估模型及其建立步骤如下。

步骤1建立评估对象的因素论域U={u1,u2,…,un},建立评语论域V={v1,v2,…,vm}。

步骤2采用熵权方法计算指标的权重W={w1,w2,…,wn}。

步骤3在评估对象的因素论域U与评语论域V之间进行单因素评估,建立模糊关系矩阵R。R中元素rij表示论域U中第i个因素ui对应于评语论域V中第j个等级vj的隶属度。这里采用正态云模型计算评估因素的隶属度。设因素i(i=1,2,…,n)对应的等级j(j=1,2,…,m)的上、下边界值为x1ij,x2ij,则因素i对应的等级j这一定性概念可以用正态云模型表示,其中

nlc202309021003

Exij=(x1ij+x2ij)/2(2)

由于边界值是从一种级别到另一种级别的过渡值,是一种模糊边界,应同时属于对应两种级别,即两种级别的隶属度相等,因此有:

exp[-(x1ij-x2ij)28(Enij)2]=0.5

(3)

即

Enij=x1ij-x2ij2.355

(4)

超熵Heij表示对熵的不确定性度量, 反映出云滴的凝聚程度, 可以通过经验或试验取值,超熵值越小, 云的厚度越小, 反之亦然,本文根据经验选取超熵Heij。

步骤4根据待评价项目的各个指标值,利用正向云发生器,确定出各个指标对应每个等级的云模型隶属度矩阵

Z=(zij)n×m,值得注意的是,由云模型得出的隶属度矩阵不同于传统模糊数学中的隶属矩阵,因此,为提高评估的可信度,需要重复运行正向云发生器N次,计算在不同隶属度情况下的平均综合评估值:

zij=∑Nk=1zkij/N

步骤5利用权重集W与隶属度矩阵Z进行模糊转换得出评价集V上的模糊子集B,

B=W•Z=(b1,b2,…,bm)

其中bj=∑ni=1wizij,j=1,…,m表示待评价对象对第j条评语的隶属度。最后依据最大隶属度原则,选择最大的隶属度所对应的第i个评价等级作为综合评价的结果。

3人口发展现代化程度综合评价

3.1人口发展现代化评价指标体系

人口现代化是人口再生产类型由传统转向现代、人口素质不断提高、工业化与城市化齐头并进、经济发展趋于现代化的发展变化过程,它包含生育现代化、人口素质现代化、人口结构现代化与经济现代化等方面的内容[4]。

考虑到人口发展现代化水平评价的复杂性和资料的可获取性,陈仲常等[5]综合考虑各方面的因素,从人口发展的人口总量指标、人口结构指标;人口素质指标、人口再生产指

标、人口经济活动指标等5个方面建立人口发展现代化水平评估指标体系以及评价标准。显然,这些评价因子具有模糊性和随机性。因此,用云模型的概念和方法建立人口发展现代化综合评估理论和模型,比传统的评估方法更能符合实际情况。表1和表2分别是人口发展现代化评价指标及评价标准。

32人口发展现代化水平计算

本文依据2010年中国统计年鉴资料[10],依据10个指标体系对全国2000-2009年时间序列数据,以及2009年全国和四个直辖市的人口综合发展数据,通过整理并对部分数据进行计算,限于篇幅结果略。

根据建立的人口发展现代化指标体系、评价指标标准,利用公式(2-4)将各个指标所对应的等级用相应的正态云模型表示,如下表3所示。

例如,以影响因素指标——人均GDP($)(U1)为例,利用公式(1)和云矩阵R(如表3)可以建立评价指标标准的正态云隶属度函数,如图2所示。

假定N=100,根据各个方案对应的指标值,利用正向发生器算法产生隶属度矩阵,例如,以北京市为例,将表4中北京市人口发展水平量化数据代入上述等级云模型构成的正向正态云发生器,重复计算100次,计算在不同隶属度情况下的平均综合评估值,结果如表4所示。根据全国10年时间序列量化数据,利用熵权法可得各指标的权重为:

最后,根据步骤5利用权重集W与隶属度矩阵Z进行模糊转换得出评价集V上的模糊子集B,bj=∑ni=1wizij,j=1,…,m表示待评价对象对第j条评语的隶属度。依据最大隶属度原则,选择最大的隶属度所对应的第i个评价等级作为综合评价的结果,如表5和表6所示。

根据2000-2009年人口发展现代化水平正态云综合评判结果,我们可以得出结论:其中2000-2003年我国人口发展现代化水平处于一般水平(2级),从2004-2009年我国人口发展现代化水平处于较高水平(3级)。但是

全国人口发展现代化水平从2级到3级并不是一个简单的跳跃升级,而是一个循序渐进的过程。2001-2005年是国民经济和社会发展第十个五年计划实施阶段,“十五规划”明确提出要以人口问题为出发点,从宏观调控的角度对人口、就业和社会保障统筹规划,继续控制人口数量,提高人口素质;进一步改善就业结构,扩大就业空间,形成以市场为导向的就业机制;重点深化社会保障体制改革,加快社会保障体系建设,基本满足城乡居民多层次保障需求,结果表明通过“十五规划”的建设,我国人口发展现代化水平得到了有效的提高。

依据表5中关于2000-2009年10年来全国正态云综合评价中各级指标的云隶属度值,画出变化折线图(如图3),从图3中人口发展现代化状况隶属于各级的情况来看,隶属于1 级和2级的隶属度百分比自2000 年以来是在逐步降低的,隶属于3、4 级的隶属度的百分比是持续上升的,但是,3级上升的速度明显超过4级,可以预见当3级上升到一定阶段后将会下降,最终4级的隶属度将超过3级。目前,由于4级的起点比较低,所以截至到2009年底我国平均人口发展现代化水平仍然处于较高(3级)的水平,离发达国家人口发展现代化水平(4级)仍有不少差距。

根据2009年全国及四个直辖市人口发展现代化正态云综合评判结果(表6),从综合评价结果可知,北京和上海的人口发展现代化处于最高的4级水平,全国、天津和重庆的人口发展处于3级水平。为了对正态云综合评判结果有一个更加直观的认识,我们把表格中各地隶属于各个等级的云隶属度绘制于一张图中(如图4)。从图中我们可以看出虽然北京和上海的人口发展现代化水平都属于最高的4级水平,但是北京隶属云4级的隶属度所占的比重要更高一些;同样地,全国、天津和重庆的人口发展虽然处于同一水平,但是天津隶属于4级的比重要高于全国和重庆,即天津市的人口发展现代化水平要高于全国和重庆市。

4结论

本文在总结目前人口发展现代化评价方法的基础上,将定性与定量转化的正态云模型引入人口发展现代化水平评价的研究中,并对2000-2009年全国人口发展和2009年全国及四个直辖市人口发展现代化水平进行评价,为人口发展环境的优化提供了一种定量化方法。结果表明,多个影响因子的共同作用下,全国不同时期和不同地区人口发展水平分布有明显的差异,虽然部分发达地区已经达到最高的4级水平,但是全国大部分地区总体人口发展现代化水平处于较高的水平,在人口的综合发展中,人口素质指标、人口再生产指标和人口經济活动方面需要加大投入,全面贯彻落实国家的人口发展战略,使我们国家在经济发展的同时,人口综合发展现代化水平也提高到一个新的水平。

将人工智能中研究模糊性和随机性关联问题的云模型应用于人口发展现代化水平综合评估中,实现评价因素值向评语的不确定映射,使得人口发展现代化水平的评估不仅能够考虑到人口发展状态的模糊性,还能考虑其随机性。将熵权方法用于计算人口发展现代化水平评估指标之间的相对权重,解决了评估中指标权重难以客观地确定的问题。因此,基于正态云模型和熵权的综合评估方法是一种比较客观、科学的综合评估方法。

(编辑:刘呈庆)

参考文献(References)

[1]联合国开发计划署 2005年人类发展报告[R] 2005 [UNDP Development of the Human Race, 2005[R] 2005]

nlc202309021003

[2]劉铮 人口现代化与优先发展教育[J] 人口研究, 1992, (2):1-10[ Liu Zheng Modernization of the Population and the Priority of Education Development[J] Population Research, 1992, (2):1-10]

[3]牛文元 1999中国可持续发展战略报告[M] 北京: 科学出版社, 2000[ Niu Wenyuan The Report on Sustainable Development Strategy in China, 1999[M] Beijing: The Science Press, 2000]

[4]陈友华 人口现代化评价指标体系研究[J] 中国人口科学, 2003, (3):60-66[ Chen Youhua The Research on the Index Assess System of Population Modernization[J] Chinese Journal of Population Science, 2003, (3):60-66]

[5]陈仲常, 杨琳 人口发展熵值-模糊综合评判模型研究[J] 中国人口•资源与环境, 2009,19(5):93-99 [Chen Zhongchang, Yang Lin Research on Model about Development of Population Based on Entropyfuzzy Comprehensive Evaluation[J] China Population, Resources and Environment, 2009,19(5):93-99]

[6]Li Deyi Knowledge representation in KDD based on linguistic atoms [J] Journal of Computer Science and Technology, 1997, 12(6): 481- 496

[7]Li Deyi, Han Jiawei, Shi Xuemei Knowledge Representation and Discovery Based on Linguistic Atoms [J] Knowledge Based Systems, 1998, 15(10): 431- 440

[8]李德毅, 邸凯昌, 李德仁 用语言云模型挖掘关联规则[J] 软件学报, 2000, 11 (2) : 143- 158 [Li Deyi, Di Kaichang, Li Deren Mining of Relation Rules with Cloud Model [J] Journal of Software, 2000,11(2): 143- 158 ]

[9]李德毅, 杜鹢 不确定性人工智能[M] 北京: 国防工业出版社,2005 [Li Deyi, DU Yi Artificial intelligence with uncertainty[M] Beijing: National Defense Industry Press, 2005]

[10]国家统计局 中国统计年鉴2010[M] 北京: 中国统计出版社, 2010 [Nation Bureau of Statistics of China China Labor Statistical Yearbook 2010[M] Beijing: China Statistics Press, 2010]

Comprehensive Assessment on Population Development Degree of ModernizationBased on Normal Cloud Model and Entropy Weight

GONG YanbingZHANG Jiguo

(Business School, Hohai University, Changzhou Jiangsu 213022,China)

AbstractIn order to monitor and evaluate the population development degree of modernization and realize the coordinated development of population, economy and environment, the development of population evaluation model based on the normal cloud model and entropy theory was presented to solve the fuzzy and random problem in the development process of population Using existing theoretical approaches, a total of five assessment indexes were considered, such as gross population, population composition, etc The entropy weight method was used to compute the evaluation factors’ weights, and the normal cloud model was used to describe the grade of development of population under single index The cloud model is a mathematical representation of fuzziness and randomness,it can realize the transformation between the qualitative when the fuzziness and randomness are integrated together,it has strong robustness for the uncertain question The method keeps the random and fuzzy in evaluation Finally, a case study using the method was implemented in the time series data about population development index of China in the past 10 years (2000-2009) and the crosssection data in 2009 to appraise population integrated development condition of the whole nation and of the four municipalities Compared with the fuzzy evaluation method, the model achieves the right evaluation result

Key wordspopulation development of modernization; normal cloud; assessment

基于泊松分布的需求预测模型设计 篇12

若平均每客户对公司产品在时间0,!t"的需求遵从参数为λt的泊松分布,即在时间0,!t",为满足每客户的需求,生产部门平均对该物料的需求数为K的概率为:

式中

Pk——对某物料需求为K的概率

K——对某物料的需求

t——计算时间

λt——时间0,!t"内物料的客户需求

1 物料需求量计算模型

需求量的确定是整个物料管理的关键问题之一,与需求量相关的参数有:

PN——平均每客户产品需求数(件)

MN——每单位产品耗用材料数(件)

N——客户数量(个)

R——平均需求率(次/天)

T——计算间隔时间(天)

α——计划保障率

λt——客户对公司产品在时间0,!t"的需求

K——生产部门对该物料的需求

RN——单位时间(天)的平均客户需求数

由以上参数,可以计算出单位时间(天)的平均客户需求数RN:

RN=PN×MN×N×R

时间T内物料的客户需求λt:

λt=RN×T=PN×MN×N×R×T

于是该物料的生产需求K就是在保障率α下满足下式的最小整数:

从以上的模型中,我们可以看出,在物料需求量的计算公式中,直接变量只有λt一个,而其决定因素中,PN、MN、N和T都比较容易得到的(其中PN可以由历史数据获得),只有产品的平均需求率R是比较不容易得到的。

2 时间序列法在需求率预测中的应用

对需求率R值的预测可采用时间序列法,计算流程如图1所示:

(1)计算R的季节指数

设Yt为t期的实际值,N为周期数,Mt为t期的预测值,移动平均法的公式为:

式中

Mt——t期的预测值

N——移动周期数

Yt——t期的实际值

移动平均数排除了实际值因季节因素引起的差异和部分随机因素的影响,可以作为长期趋势估计值,即

(2)计算R值的长期趋势

常用的趋势预测模型为线性趋势模型:

式中

——时间序列法预测值

t——时间

a、b——方程的参数

用最小二乘法导出的标准方程组为:

联解这个方程组,就可以求出参数a、b。

3 通过模型对需求量预测

假设某物料2009年7月R的预测值为0.16(次/天),在这一阶段的其他数据如下:T=7;PN=30;MN=1;N=150;α=92%。

根据以上数据,我们可以预测出在2009年该部件的平均每天客户需求数RN:

RN=PN×MN×N×R=30×1×150×0.16=720

订货周期的λt:

查泊松分布表,可得:K=5 139(件)。即在7天的订货周期内,该物料满足92%的保障率的生产需求量预计在5 139件。

摘要:研究的目的是运用有效的方法来提高需求预测的准确性,从而优化物料库存控制,以解决当前困扰生产企业的库存管理难题。通过分析物料的消耗规律,运用管理科学的理论与方法建立了基于泊松分布的物料需求模型,利用时间序列法对主要参数进行科学计算。研究的需求预测方法能够较好地解决库存控制中存在的计划问题,具有较强的可操作性,对提高企业库存管理水平具有很好的指导作用。

关键词:泊松分布,时间序列法,需求预测

参考文献

[1]马庆国.管理统计——数据获取、统计原理、SPSS工具与应用研究[M].北京:科学出版社,2004:182-202.

上一篇:智慧型小学语文课堂下一篇:血流分布