指数分布

2024-11-10

指数分布(精选8篇)

指数分布 篇1

摘要:本文采用1 961-2006年全国548站逐日最高、最低气温资料,通过计算气候平均、趋势系数、均方差等,分析了我国极端气温的空间分布特征。结果表明:我国46年以来,极端最低气温、极端最高气温、暖日指数均呈上升趋势,而霜冻指数、冷夜指数均呈下降趋势。空间分布上,我国年、季极端低温均呈稳定增长趋势,北方地区的增暖趋势较南方大,极端低温的增温幅度明显大于极端高温的增幅,极端气温在四季均有增温趋势,冬天最为明显。

关键词:极端气温指数,趋势系数,空间分布

随着人类社会的不断进步,工业化已经完全进入人们的日常生活,飞速发展带来了经济社会高度发展的同时,也给人类生活环境造成的了巨大的负担,温室气体的大量排放致使全球气候变暖,从而导致极端天气频频出现,给人民造成了很大的损失,因此,气候变暖问题已经引起了全世界的高度重视。

在我国,越来越多的学者进入到研究极端天气这一领域,并取得了许多显著的成果[1,2,3,4]。本文利用全国548个测站46年的逐日最低、最高温度、平均温度资料分析了我国年、季极端温度指数的空间分布特征,揭示了过去46年来我国极端气温的变化规律,为深入研究极端气温提供依据。

1资料与方法

本文所用的资料是1 961-2006年我国大陆548个测站的逐日最高温度、最低温度以及平均温度资料。

通过线性趋势分析[5]、计算标准差[2]、Mann-Kendal(lM-K)突变检验[6]的方法对1 961-2006年中国548站逐日最高、最低气温资料进行分析。

2极端温度指数空间分布特征

2.1极端温度指数的空间分布

2.1.1极端最低温度

从图1中可以看出年极端最低温度(左)主要呈纬向分布,由南向北递减。黑龙江以及内蒙古东北部的极端最低温度较低。长江以南年极端最低温度均在1 0℃以上。虽然温度主要受太阳辐射的影响,但地形也有一定的作用,主要体现在青藏高原地区要比同纬度地区温度低。

季极端最低温度空间分布与年极端最低温度分布基本一致,由南向北递减,春季最为明显。各地区夏季(右)最低温度明显比其他季节要高。全国各季温度最低的地区主要分布在黑龙江、内蒙古东北部以及青海省南部。

2.1.2极端最高温度

从图2上看出,年极端最高温度(左)与年极端最低温度分布基本一致,南方温度普遍比北方高,最低温度出现在黑龙江、内蒙古东北部和青海南部青藏高原地区。全国各地最高温度均在0度以上。冬季(中)最高温度大致呈纬向分布,最高温度由南向北递减。其他各季也基本表现出南暖北冷的趋势,但青海南部地区各季温度较同纬度其他地区低。夏季(右)新疆中东部地区温度偏高。

2.1.3霜冻指数

从图3中可以看出,霜冻指数大体从东南沿海向西北内陆递增,长江以南地区因地处热带及亚热带,一年中温度小于0度的天数在30天以内,为全国最少的地区。而全国霜冻天数最多的地区在青海省西南部,可达300天。就全国而言,霜冻天数冬季多,夏季少,除广东、广西、云南和青海部分地区外,其他地区霜冻天数都有明显的季节变化。冬季我国北方大部分地区都是70-90天的霜冻期,夏季除青海部分地区外,全国大部分地区都无霜冻期,春秋两季为过渡期。

2.2极端温度指数的趋势系数的空间分布

2.2.1极端最低温度

图4(左)中可以看出,年极端最低温度在全国范围普遍为正趋势,全国大部分地区通过了0.05的显著性检验,说明全国范围增温明显。北方增温趋势比南方大,东北、内蒙古及西部部分地区趋势系数达到0.7以上,增温趋势显著。各季全国极端最低温度均呈增长趋势,北方增温明显,四季中东北、青海、新疆东南部、云南省西部和内蒙古地区增温都很明显。冬季(中)除了新疆北部、东北部分地区和南方大部分地区外,最低温度增长显著,是四季中增温最明显的季节。

2.2.2极端最高温度

从图5(左)中可以看出全国范围内极端最高温度为正趋势,说明极端最高温度有上升趋势。同极端最低温度相比,极端最高温度趋势系数相对较小,大部分地区极端低温的正趋势要比极端高温的大。极端高温在全国的增温并不明显,只有北方黄河以北和西部青藏高原部分地区增温较明显。冬季(中)全国范围内普遍为正趋势,黄河中上游地区升温显著。夏季(右)江淮地区有负趋势,但没有通过显著性检验。最高温度的升高主要表现在秋冬两季,春夏两季不显著。总而言之,北方地区的增温趋势比南方地区要大。

2.2.3霜冻指数

从图6中可以看出,趋势系数均为负值,说明全国大范围地区霜冻天数减少,全国只有小部分地区未通过显著性检验。高纬地区趋势系数达到-0.8,霜冻天数减少得最为明显。各季霜冻指数趋势系数也均为负值,春秋两季北方地区霜冻天数显著减少,冬季长江、淮河流域霜冻天数显著减少,夏季青海地区减少显著。

2.2.4冷夜指数

由图7(左)可以看出年冷夜指数的趋势系数在全国范围内为负值,只有四川附近没有通过显著性检验,说明在全国大范围内冷夜指数下降明显,高值中心在内蒙古中西部、青海西北部和新疆南部。这些地区趋势系数达到-0.8,冷夜指数下降最为显著。空间上来看,南方地区的下降趋势不如北方明显。从各季冷夜指数的趋势系数图来年,各地的下降趋势不同。春夏两季北方地区冷夜指数下降趋势基本一致,夏季(右)冷夜指数下降趋势相对更为明显,北方大部分地区都通过了显著性检验。冬季(中)东南沿海至京津唐地区冷夜指数下降明显,在长江上游地区、青海北部和青藏高原上也有小片区域通过了显著性检验,下降趋势明显。秋季则是长江黄河上游地区、黑龙江南部、江苏安徽和内蒙古中东部地区下降趋势明显。

2.2.5暖日指数

从图8(左)中可以看出年暖日指数的趋势系数在全国范围内均为正值,说明暖日指数在全国大范围内上升,我国西部地区、内蒙古和河套地区上升趋势明显。内蒙古西部、甘肃和青海地区为高值中心,趋势系数达到0.6。空间上来看,南方地区的暖日指数的上升趋势不如北方显著。从各季暖日指数的趋势系数图来看,各地的趋势系数有正有负,趋势系数为负值的地区暖日指数呈下降趋势,大多数地区下降趋势不显著。冬季(中)贵州地区和四川附近及安徽北部为负趋势;青海西部为正趋势最大值区,上升趋势显著。夏季(右)华北南部和华南大部分地区趋势系数为负值,河南中部暖日指数下降明显;在甘肃西部、青海大部分地区和新疆东南部地区为正趋势,上升趋势明显。

3总结

本文利用1 961-2006年中国548站逐日最高、最低气温资料,通过计算气候平均、趋势系数、均方差等,分析了中国年、季极端气温变化趋势的空间特征。

结果表明:

1)我国近46年以来,极端气温指数增加或减少分布基本是一致的,其中极端最低气温、极端最高气温、暖日指数均呈上升趋势,而霜冻指数、冷夜指数均呈下降趋势。

2)空间分布上,我国年、季极端低温呈稳定的增温趋势,且北方地区的增暖趋势较南方明显,极端低温的增温幅度明显大于极端高温的增幅,极端气温在四季均有增温趋势,冬天最为明显。

参考文献

[1]翟盘茂,任福民.中国近四十年最高最低温度变化.气象学报,1997,5(4),418-429.

[2]任福民,翟盘茂.1951-1990年中国极端气温变化分析.大气科学,1998,22(2),217.

[3]江志红,丁裕国,屠其璞.中国近50年冬夏季极端气温场的年代际空间型态及其演变特征研究[J].应用气象学报,1999,10(增刊),97-103.

[4]叶笃正,陈泮勤.中国的全球变化预研究.北京:地震出版社,1992,4.

[5]施能,陈家其.中国近100年来4个年代际的气候变化特征.气象学报,1995,53(4),431-439.

[6]张喜亮,邱新法,曾燕.江苏省近45年气候变化的时空特征分析.南京信息工程大学硕士论文,2008.

指数分布 篇2

具分布时滞模糊BAM神经网络的指数稳定性

介绍了一类具分布时滞的模糊BAM(bi-directional associative memory)神经网络.通过构造Lyapunov-Krasovskii泛函及利用线性矩阵不等式方法,得到了此类系统平衡点的指数稳定性的`一个充分条件.在设计具时滞的人工BAM神经网络时,全局指数稳定的结果有很重要的意义.此外,给出一个实例说明我们的结果是可行的.

作 者:向红军 王金华 XIANG Hong-jun WANG Jin-hua 作者单位:湘南学院,数学系,湖南,郴州,423000刊 名:模糊系统与数学 ISTIC PKU英文刊名:FUZZY SYSTEMS AND MATHEMATICS年,卷(期):22(3)分类号:O175.7关键词:模糊BAM神经网络 指数稳定 线性矩阵不等式 Lyapunov-Krasovskii泛函 分布时滞

指数分布 篇3

交通拥堵现象的频发,导致机动车在怠速、低速、急加速和急减速等非稳定行驶状态下的时间增加,使机动车排放物大量增加。为量化城市交通网络中机动车的污染物排放量,文献[1]的学者对应用排放因子展开了广泛研究。排放因子(emission factor,EF)是指机动车行驶单位距离后产生的不同排放物的质量,g/km,不仅可以反映某类型车的微观排放特征,也可反映区域内不同交通状况下的宏观排放特征[1]。因此,选择排放因子作为量化机动车尾气控制对策研究的依据。

同时,随着科学技术的发展,依托智能化的交通信息采集技术,实时的道路交通运行状态评估成为热门研究方向。国内外交通管理部门和研究机构展开了大量的交通拥堵评价相关研究,如拥堵指数(congestion index)[2,3]、道路拥堵指数(roadway congestion index,RCI)[4]、出行率指数(travel rate index,TRI)[5]、出行时间指数(travel time index,TTI)[6]、LKDIF(lane kilometer duration index under LOS F)[7]、Tomtom congestion index(CI)[8],交通运行指数(traffic performance index,TPI)[9]等。目前,交通运行指数(以下简称交通指数)在世界各大城市具有广泛的应用,且随着智能交通技术的发展,将来的应用会更加普遍。

在交通与环境的双重压力下,城市交通管理部门和环境保护部门已经开始联合行动,旨在通过采取治污与治堵一体化的措施,在改善交通拥堵的同时也取得节能减排的改善效果,因此,对交通规划、交通政策乃至交通项目节能减排效果进行科学评价的需求日益迫切。但是,由于研究角度的差异,目前尚缺少城市路网拥堵强度和机动车排放的定量关系的研究,尽管部分研究从城市路网着手,但是并没有开展交通拥堵评价指标与城市路网机动车排放强度的关系研究,《道路交通信息服务、交通状况描述》[10]中的交通拥堵评价指标———道路交通运行指数为例进行具体研究。

1 交通指数与机动车排放因子定量关系的分析方法

为构建交通运行指数与排放因子的关系量化模型,以浮动车数据为基础,设计交通运行指数下的速度分布算法。从微观角度,建立单车的速度与排放因子的定量关系模型,从宏观角度,利用不同交通运行指数下的速度分布,结合速度与排放因子的定量关系,以速度为衔接点,建立交通指数与排放因子的关系模型。研究框架见图1。

1.1 交通指数下的速度分布测算方法

依托北京市浮动车交通信息采集系统,可实时获取浮动车平均运行速度数据,以此为基础,利用北京市交通指数测算模型,后台数据处理中心便可测算同一时间粒度下的交通指数TPI[11]。利用已有数据库中的路段速度和交通指数的数据,以时间字段为中间变量进行相关联。考虑到不同道路等级上车辆的运行特性存在显著差异,笔者分道路等级,将同一时间粒度下的路段速度数据和交通指数数据相关联,测算不同速度区间的路段VKT之和占路网VKT总量的比例,建立某一指数条件下速度分布规律计算模型,见式(1)。车辆行驶里程(vehicle kilometers traveled,VKT)是衡量机动车行驶量多少的基本单位,表示的是特定路网中所有车辆的行驶里程之和)。由于在现有的技术条件下,不可能得到每辆车行驶里程的精确值,因此,选用交通量和路段长度的乘积来估算VKT,具体如式(2)所示。由于车辆在次干路和支路上的交通运行状态相似,作为一类分析,统称为“次支路”。

式中:PTPI,RC,v,VKTTPI,RC,v为某一时刻,速度区间v所占的百分比、机动车行驶里程,对于特定的交通指数TPI和道路等级RC;v为速度区间。以5km/h为步长划分速度区间,快速路速度大于等于80km/h的为一个速度区间,主干路和次支路速度大于等于75km/h的为一个速度区间;RC为道路等级,包括快速路、主干路、次支路;nv为速度区间的数量;l为某一时刻,平均速度位于速度区间v的路段编号;Ql为路段l的流量;Ll为路段l的长度;nl为路段的数量。

基于北京市浮动车交通信息采集系统,共获得2013年1月—2014年10月约800万条有效记录,数据以5min为间隔,数据示例见表1。

1.2 速度与排放因子的关系量化模型

在分析交通指数与机动车排放因子关系时,排放因子是一个关键参数。利用基于VSP的排放因子测算方法,分析速度与排放因子的关系[12]。利用车载测试、台架测试和手持式GPS设备,采集机动车排放数据和工况数据。由式(3)可得按照排放标准、道路等级、排放物类型、速度分类的排放因子。

式中:k为以1km/h为步长划分的速度区间;EFES,RC,i,k为排放因子,对于特定的排放标准ES,道路等级RC,排放物类型i,速度区间k;ERES,RC,i,j为第j个VSP bin的平均排放率;VSP binES,RC,j,k为第j个VSP bin的分布值;nj为VSP bin的数目;vk为平均速度区间k的中值。

考虑到交通指数下的速度分布是对路网上各种车型的统计结果,因此,有必要结合实际交通流中各排放标准车辆的构成比例,综合反映道路上速度与排放因子的量化关系。其中速度与CO2综合排放因子的关系曲线见图2。

1.3 交通运行指数与排放因子的关系量化模型

1)基于交通运行指数的排放因子模型。基于对交通指数和机动车排放因子的产生机理的分析,选择速度为衔接变量,将交通指数和排放因子相结合,建立交通指数与机动车排放因子的关系量化模型,见式(4)。

式中,EFTPI,RC,i为交通指数TPI的排放因子,对于特定的道路等级RC,排放物类型i;EFRC,i,v为速度区间v的排放因子;PTPI,RC,v为速度区间v的分布概率,由公式(1)所得;nv为速度区间的数量。

2)交通运行指数与排放因子的不确定性关系。交通指数是从路段到路网不断积聚而形成的综合性评价指标,因此,用交通指数下的速度分布来反映复杂多变的路网交通拥堵状况,存在一定的不确定性。进而导致交通指数与排放因子间关系存在一定的不确定性。为此,在90%的置信度下,统计各交通指数排放因子的置信上限、置信下限,即某一指数的排放因子分布带,使得排放因子处在分布带之中的概率达到90%。并统计了排放因子偏差率,即测算得到的排放因子平均值在其上下浮动值范围的百分比,来量化交通指数与排放因子之间的不确定关系,计算方法如式(5)所示。

式中,为排放因子的平均值;σTPI,RC,i,φTPI,RC,i为排放因子的标准差、偏差率。

2 交通指数下的速度分布聚类

交通指数是从路段到路网不断积聚而形成的综合性评价指标,因此,用交通指数下的速度分布来反映复杂多变的路网交通拥堵状况,存在一定的不确定性。由于交通出行在不同日期、时间段具有规律性、重复性,若根据交通特性相似的日期或时间段对城市交通运行指数的速度分布数据聚类分析,有可能降低交通指数的速度分布不确定性,进而降低机动车排放强度与交通指数关系的不确定性,故拟对各交通指数下的速度分布数据聚类分析。

2.1 影响城市交通网络速度分布的因素

从空间维度和时间维度,分析影响城市交通网络速度分布的因素,主要包括以下几个方面:(1)道路等级。由于物理特征的差异,导致车辆在各道路等级上的交通流特性不同。(2)交通需求。北京从2008年实施机动车按车牌尾号限行的交通管理措施,导致每天出行的车辆存在差异,交通状态存在不同。笔者对全路网在各工作日和周末速度随时间的变化规律进行分析,具体结果见图3。由图3可知,工作日的变化趋势大致相同,周末的变化趋势基本一致。其中星期二、星期三、星期四的变化趋势一致性较高,星期六比星期日更拥堵,同时,在全天24h的行驶速度特性也存在差异。在工作日07:00-09:00时出现早高峰。由于到达目的地为工作单位,目标单一且明确,是刚性需求;在17:00-19:00时出现晚高峰,出行目的多样化,是柔性需求;在周末,10:00-12:00时出现早高峰,16:00-18:00时出现晚高峰。(3)恶劣天气。研究表明雨雪等不利天气对交通流速度及流量有显著的影响[13,14]。(4)开学周。入学、接送孩子等行为导致出行车辆增加,交通需求增加。(5)节假日。在国家法定假日,各工作单位放假,路网中出行的车辆不集中,没有早高峰和晚高峰出行特征。同时,探亲访友、出行郊游、朋友聚会等活动增加,导致额外的交通需求。所以,节假日交通运行状态差别于非节假日。图3为全路网速度随时间变化曲线。

2.2 聚类方案评价指标

为评价各方案的聚类效果,借助于变异系数(标准差与其平均数的比值)的概念,笔者设计了速度分布变异系数(coefficient of variation of speed distribution,CVSD)和排放因子变异系数(coefficient of variation of emission factor,CVEF)2个评价指标,分别用来衡量交通指数与速度分布、交通指数和机动车排放因子关系的不确定性。通过测算各方案的CVSD和CVEF,从而选择不确定性最低、聚类效果最好的方案,对交通指数与速度分布数据聚类分析,为交通指数与排放因子间的关系研究提供数据支撑。

假设满足聚类方案c,对于特定的交通指数TPI和道路等级RC,存在多个速度分布样本。速度区间v的平均概率为μc,TPI,RC,v、标准差为σc,TPI,RC,v,则利用式(6)计算得到速度区间v的变异系数CVc,TPI,RC,v。通过加权集计可得TPI的变异系数,计算方法见式(7)。

式中,

为速度区间v的变异系数、标准差、平均概率值、权重,对于特定的TPI和RC;CVc,TPI,RC为交通指数TPI的变异系数。

1)速度分布变异系数(CVSD)。权重取值为各个速度区间的概率平均值。意指该速度区间概率越大,其重要性越高,见式(8)。

2)排放因子变异系数(CVEF)。权重取值为各个速度区间CO2排放因子所占比率,意指该速度区间CO2排放因子越大,其重要性越高,见式(9)。考虑到低碳已发展成为城市环境和交通管理者的共识,近年来对碳排放的日益关注,笔者选用CO2排放因子为例。

式中:为速度区间v的CO2排放因子,对于特定的RC。

2.3 聚类对速度分布不确定性与排放因子不确定性的影响

结合城市交通网络速度分布的影响因素,针对交通需求稳定的特征,剔除节假日、开学周、恶劣天气数据。为排除夜间及凌晨噪声点数据的干扰,采用06:00-22:00时共16h,以15min为时间粒度的全路网速度数据作为聚类指标,则1d拥有64个指标,可被看作64维欧氏空间中的点。借助Matlab软件开发平台编写程序,利用K-Means聚类方法,结合基于Silhouette测度的最佳聚类数函数[15],对数据进行聚类分析,从而分析不同日期数据的潜在相似规律。

通过聚类分析发现,根据相似性特征数据被分为6组,分别为星期日、星期一、普通工作日(星期二、星期三和星期四)、49限行工作日(车牌尾号为4和9的车辆限制行驶)、星期五、星期六。星期一是工作日的第1d,交通状态区别于其他工作日,早高峰较拥堵;星期五为工作日的最后1d,其晚高峰较拥堵;49限行工作日为较拥堵的工作日。而且由于星期六是双休日的第1d,出行集中,交通状况比星期日更拥堵。

考虑到交通出行的时间特征,在对城市交通指数的速度分布数据按照日期分类的基础上,拟对其再按时间段进行更细致粒度的分类。为此,提出了2个时段聚类方案,方案一为(00:00-12:00时)和(12:00-24:00时),方案二为(06:00-12:00时)、(12:00-22:00时)和(22:00-06:00时)。

通过研究发现,按道路等级、交通规律相似的工作日、周末和时间段(06:00-12:00时、12:00-22:00时、22:00-06:00时)交叉组合分类,快速路、主干路、次支路速度分布不确定性降低了10.1%,13.6%,14.6%,排放因子不确定性降低了10.1%,13.4%,14.2%,降低效果最显著,具体如图4和图5所示。故被选为本研究的聚类方案。

3 交通指数与机动车排放因子间的定量关系及其不确定性

利用交通指数与排放因子的关系量化模型,对不同聚类条件下交通指数与排放因子的关系进行测算(分道路等级、日期、时间段、排放物类型等)。由于篇幅的限制,笔者仅列举了普通工作日交通指数与CO2排放因子的量化关系。在其他日期和时间段交通指数与排放因子的关系变化趋势与普通工作日大体一致,仅相邻指数排放因子的增长率存在差异。

由图6可知,交通指数在(2.0,8.0]时,随着指数的增加,CO2排放因子随之增长,增长速度较为平缓;当交通指数在(0.6,2.0]和大于8.0时,随着指数的增加,排放因子增长趋势变大。

从道路等级来看,同一交通指数,在次支路上机动车排放因子最高,主干路次之,快速路上最低。此外,考虑到实际应用,通过拟合得交通指数与CO2综合排放因子的函数关系式,拟合度均达到99%以上,可靠性较高。

同时,笔者测算了聚类前后交通指数与CO2排放因子偏差率,见如图7。由图7可知,通过所提出的聚类方案,快速路、主干路、次支路的CO2排放因子偏差率均显著降低,分别降低74.0%,80.5%,75.9%。验证所提出的聚类方案的聚类效果。

4 结束语

1)将交通运行指数与速度分布数据,按道路等级、上午/下午/夜间、交通规律相似的工作日/周末交叉组合分类分析,与不分类相比,可使速度分布不确定性和排放因子不确定性显著降低;

2)从道路等级来看,次支路CO2排放因子最大,主干路次之,快速路最小。随着指数的增加,排放因子均随之增长。当交通指数位于(2.0,8.0]时,增长趋势较平缓;当交通指数在(0.6,2.0]和大于8.0时,排放因子快速增加;

3)交通指数数据按道路等级、交通规律相似的工作日、周末和时间段(06:00-12:00时,12:00-22:00时,22:00-06:00时)交叉组合分类,快速路、主干路、次支路的CO2排放因子偏差率均显著降低,分别降低74.0%,80.5%,75.9%。

指数分布 篇4

关键词:侵蚀区,微地形,芒萁,地形湿度指数

我国南方红壤地区占国土面积的1/5,耕地面积占全国的30%,是粮食和经济作物的重要产地,也是仅次于黄土高原的第二大土壤侵蚀退化区[1]。土壤侵蚀在均匀坡面上形成细沟、浅沟、切沟等不同规模的侵蚀沟,以及其它大小不等、形状各异的微地形,微地形造成光、热、土壤温湿度和养分等因素的空间再分配而形成区别于原状坡面的微环境,最终影响植物的生长与分布。国外有关微地形与植被分布格局的研究表明,坡位、地表干扰是植被分布格局的主要影响因子[2,3,4]。在我国,研究主要集中于植物群落的组成、结构与微环境的关系,比如光照、地形、土壤肥力、土壤温湿度等基本因子[5,6,7,8];Hara等人研究发现,坡面上部和坡面下部的坡位差异是影响植被生长的最基本的异质性生境条件[9];路保昌、赵荟等人做了干旱阳坡微地形土壤水分分布研究,并提出在植被恢复与重建时,要充分考虑微地形的土壤水分分布特征[10,11]。土壤水是植物生长所需水的直接来源,制约着植物的生长、分布。同时土壤水分也影响着土壤理化性质,制约着土壤微生物的活动,影响土壤养分的积累[12]。尤其在土壤侵蚀退化区,植被稀少,土层薄,土壤保水保肥能力弱,研究微地形上植被与土壤水分关系就显得更为重要。邓慧平等人的研究显示地形湿度指数与土壤相对含水量具有线性关系[13]。

芒萁(Dicranopteris dichotoma)属里白科芒萁属的多年生常绿蕨类植物,广泛分布于我国长江以南各省区、朝鲜南部及日本[14]。在南方花岗岩及紫色砂页岩的水土流失区广泛分布着大量芒萁,它具有耐酸、耐瘠、耐旱、适应性强等特点。长期研究发现,芒萁是严重退化生态系统中最后退出的草本植物之一,也是治理中最早侵入的草本植物之一,在生态系统退化严重,许多植物难以生长的情况下,芒萁仍能在坡地小沟谷或地势低洼处生长[15]。即便在人工措施引入其它草本治理南方红壤退化区,若干年后都演化成以芒萁为主的群落,因此芒萁在南方红壤侵蚀区生态恢复与重建中具有至关重要的位置。本研究以分辨率高达厘米级的DEM为基础,研究南方红壤侵蚀区微地形上地形湿度指数与芒萁分布格局的关系,主要研究目标是:1)明确南方红壤侵蚀区微地形上地形湿度指数特征和芒萁的分布特征;2)芒萁分布与地形湿度指数特征有何关系。进而为南方红壤侵蚀区微地形的改造、芒萁的快速覆盖和微环境的改善提供科学依据。

1 研究区概况

朱溪小流域(N 25°38′15″~25°42′55″,E 116°23′30″~116°30′30″)是南方红壤侵蚀区水土流失治理的典型代表,位于福建省西南部。属亚热带季风性湿润气候,年平均气温18.3℃,年均降雨量1 737mm。土壤为花岗岩发育的红壤,结构松散,抗蚀性弱,且酸性强,受早期人为因素影响,地带性植被已破坏殆尽,水土流失严重。地貌类型以海拔300~400 m的山丘为主,经长期流水冲刷,坡面形成不同规模的侵蚀沟和复杂的微地形。本研究选取典型侵蚀坡面为实验样区,高程范围在345~363m,坡度范围0~65°,植被以芒萁为主,包括零星的马尾松小老头树。实验样区包括三条芒萁生长沟和三条裸地沟,其中,芒萁生长沟的沟底到沟坡中部附近芒萁成片生长,脊部有芒萁零星散布;裸地沟无植被覆盖。

2 研究方法

2.1 数据的采集

2.1.1 微地形测量

2012年8月利用实时动态差分仪实测820m2实验样区的三维坐标,起伏较大区域布点较密集,点与点距离大约20cm,较平缓区域点与点间距离约40cm,共测3 300多个三维坐标点,利用ArcGIS10.1软件获取分辨率为0.1m×0.1m的DEM。

2.1.2 芒萁取样

2012年8月,对芒萁生长沟的沟底和生长边界进行芒萁生物量采集。三条沟共布设18个采样点,为了尽可能减少对芒萁微斑块的破坏,采用直径为0.35 m的铁皮圆筒按照布设的采样点随机选取样方,将样方内芒萁从基部齐地剪下,称鲜重,后于恒温烘箱103℃杀青1h,60℃烘干至恒重,称量干重。在剪裁前,进行株高和株径数的测量,然后计算不同部位的芒萁密度。其中,生物量指单位面积生物生产的有机物质的(干重)总量,包括地上和地下生物量;株高为土壤表面至植株叶片伸直后的叶尖最高处,不包括干枯部分;密度为单位样方内植株的数量。

2.2 数据处理

2.2.1 坡位划分

坡位借助ArcGis10.1中扩展工具分析套件Land Facet Corridor Designer中的Topographic TPI工具进行提取。主要以地形位置指数和坡度两地参数为判定依据,采用四分类法划分实验样区坡位。

TPI=Z-Z′

式中,TPI为地形位置指数,Z为研究对象高程值,Z′为邻域高程值。

TPI取值与邻域的范围大小及形状密切相关,结合样区实际情况,采用以1m为半径的圆形邻域形状,将样区坡位划分为沟谷、缓坡、陡坡和脊部。相关参数设置[16]见表1(SD代表TPI与邻域像元高程的标准偏差值)。

2.2.2 地形湿度指数

Benen和Kikby提出了地形湿度指数的概念,并将其定义为:

TWI=ln(As/tanβ)

其中,As为上坡面积,即流经地表某点的单位等高线长度上的汇流面积(m2·m-1),反映径流在流域中任一点的累积趋势,β为该点的坡度(°),tanβ为该点的坡角,反映重力使径流沿坡面移动的趋势。

本研究以生成的高分辨率DEM为数据基础,利用秦承志的简化数字地形分析软件和ArcGis10.1软件进行地形湿度指数的计算[17]。

3 结果与分析

3.1 微地形芒萁分布特征分析

3.1.1 不同坡度芒萁分布特征

图5为各坡度土地面积占实验样区总面积的百分比和各坡度上芒萁面积占该坡度面积百分比。可以清楚的看到,坡面上15~20°、20~25°、25~30°三类坡度所占面积最多。在0~5°、5~10°、10~15°三类坡度上芒萁占比最大,分别达到47.46%、54.15%和43.52%。换句话说,就是在0~15°坡面上芒萁分布最为密集。H·沃尔特[18]认为,群落生境的变化可以补偿环境的变化,从而延伸某物种的空间分布,因此,在沟底和缓坡以外发现芒萁也不足为奇。加之坡度45°以上陡坡的土地面积只占总面积2.34%,因此在图5中表现出一个峰值。

3.1.2 不同地形部位芒萁分布特征

由图6可知,实验样区陡坡面积最大,各坡位面积占比大小依次为:陡坡>脊部>沟谷>缓坡。然而就芒萁面积与坡位面积之比可以看出,缓坡(47.72%)>沟谷(31.04%)>陡坡(24.95%)>脊部(12.35%),说明芒萁多趋于缓坡和沟谷分布。

3.2 芒萁生长与地形湿度指数特征

生境因子的差异如光照、土壤温度、土壤养分等会对芒萁生长产生影响。在水肥适宜的条件下,芒萁高度可达1m以上;干热化严重,土壤贫瘠,强光照条件下,芒萁植株低矮,分布稀疏[19]。对于水土流失严重的南方红壤侵蚀区,芒萁生长受到较大的限制,且侵蚀强度越大,芒萁生长越困难。实验样区在长期的水土流失过程中形成数条切沟,芒萁多分布于缓坡和地势低洼的沟底,从沟底向沟坡扩张芒萁生长逐渐稀疏低矮,至脊部几乎无芒萁生长。

株高和密度是植物群落最基本的两大指标,是影响群落生物量的主要因子,对植物的生长环境具有重要指示作用[20,21]。图7所示,沟底芒萁生物量、密度、株高分别为4 500g·m-2、2 200株·m-2、42cm;沟坡芒萁生长边界处分别为2 000g·m-2、1 400株·m-2、25cm。沟底芒萁的生物量为沟坡的2.25倍,芒萁密度、株高也远远大于沟坡。分析原因可能是芒萁生长沟底的土壤温湿度、土壤养分等生境因子更适应芒萁生长,如表2所示,沟谷的地形湿度指数是脊部的7.28倍;加上沟底地势低洼,侵蚀强度相对较弱,土壤相对疏松,有利于芒萁孢子囊的萌发成熟及幼孢子体的生长。

统计模拟值显示,地形湿度指数沟谷>缓坡>陡坡>脊部。

利用土壤湿度实测数据,在ArcGis10.1软件的Zonal Statistics as Table工具分别对无芒萁覆盖区和有芒萁覆盖区的地形湿度指数进行统计建模。统计结果显示,无芒萁覆盖区的地形湿度指数平均值为1.15,芒萁覆盖区的地形湿度指数平均值为2.13。说明芒萁覆盖区的土壤相对湿润。

4 结论与讨论

黄奕龙等[22]对黄土丘陵小流域地形的研究表明不同坡向间以阴坡土壤水分最大。刘迎春等人[23]的研究进一步发现半阳坡上芒萁的长势好于阳坡和阴坡,芒萁属于喜阳植物,阴坡不利于芒萁的生长。本文选择南方红壤侵蚀未治理区半阳坡作为实验样区,研究了沟状微地形上不同坡度、不同坡位的芒萁生长特征和土壤湿度指数特征。

沟状微地形,包括切沟、浅沟、细沟等,是最常见的微地形之一。尤其在严重侵蚀退化地区,地表植被遭到破坏,岩层裸露,原状坡面受强降雨和坡面径流的影响,形成地表起伏、错综复杂的各种沟状微地形。局部地区的地形变化,通过对光照、降雨等资源的再分配而形成局部小气候或微生境,最终影响植被的分布格局[24]。目前国内对土壤水分限制因子的研究主要集中在黄土高原等干旱、半干旱地区[25,26,27,28]。邝高明等对黄土丘陵沟壑区坡面内地表起伏形成微地形的研究发现,各微地形土壤水分顺序为:塌陷>缓台>切沟底>浅沟底>原状坡>陡坎[29];路保昌等采用固定点动态监测的方法,对黄土丘陵区半阳坡各微地形土壤水分进行了对比研究,结果表明半阳坡各微地形土壤水分顺序为:平缓坡>浅沟>陡坡>极陡坡[30]。本文对南方红壤侵蚀区自然恢复状态下沟状微地形的研究显示,地形湿度指数沟谷>缓坡>陡坡>脊部;地形湿度指数芒萁覆盖区域(缓坡和沟谷)远大于裸地,微地形表面土壤湿度大的部位芒萁生物量、密度、株高均远大于土壤湿度小的部位。在一定立地条件下,土壤水分越多,能承载的生物量也就越大。植物的生长发育与其所处的微环境是相互作用的,地形和地表植被共同影响着土壤水分的分布,对南方红壤严重侵蚀地而言,有无芒萁覆盖以及芒萁生长好坏直接决定土壤侵蚀强度。

地形湿度指数以数字高程模型(DEM)为基础,综合考虑了地形和土壤特性对土壤水分分布的影响,在流域土壤水分空间分布的研究中具有重要意义[31]。王洪明等研究小流域尺度上土壤水分与地形湿度指数关系得出,二者的相关程度达到中等相关,且随着土壤水分取样深度的增加,两者的相关性越大[32]。地形湿度指数由于能够准确刻画地形的变化及其对土壤径流的影响,从而在土壤水分分布的空间模拟及分析中得到广泛应用。本研究利用分辨率为厘米级的DEM模拟地形湿度指数,具有极高的精度。

指数分布 篇5

1 对象与方法

1.1 对象

选择2007年4月~2009年4月在石家庄市第四医院进行孕前咨询及确定早孕者(孕60天内),因确定早孕时孕妇体重较孕前体重无明显变化也纳入研究对象。追踪此人群中在该院进行产前检查的健康孕妇资料完整者共312例,年龄21~37岁,平均(27.26±3.2)岁,初中以上文化程度,均为初产妇。

1.2 方法

(1)一般资料:调查研究对象的基本情况(包括年龄、孕产次、文化程度等);(2)人体测量指标及方法:常规测量身高、体重,皮尺量取腰围(WC)。BMI=体重(kg)/身高(m[2])。(3) GDM测定指标及方法:于孕24~28周进行50g-GCT试验,试验前日晚空腹10~12h,次日晨先测空腹血糖,然后将50g葡萄糖化于250ml开水中服下,再测服糖后1h的血糖,若≥7.8mmol/L者,需于次日进行75g糖耐量试验,分别测空腹、服糖后lh、2h、3h的血糖,空腹≥5.6mmol/L,1h≥10.3mmol/L,2h≥8.6mmol/L,3h≥6.7mmol/L,其中有2项异常即可确诊GDM[2]。

1.3 统计方法

采用SPSS13.0软件进行统计分析,以GDM是否发病为因变量,以年龄,孕前BMI,孕前腰围为自变量建立回归模型进行Logistic回归分析。

2 结果

(1)本研究对象312名孕妇中诊断为GDM者共18例,GDM发病率为5.76%。(2)GDM组孕妇平均孕前BMI为(22.6±2.86) kg/m[2],平均孕前腰围为(72.3±6.5) cm。而正常组孕妇平均孕前BMI为(20.1±1.9) kg/m[2],平均孕前腰围为(67.5±5.2) cm,其两数值均较GDM组孕妇为低(P<0.05)。(3)以GDM是否发病为因变量,以年龄、孕前体质指数、孕前腰围为自变量,建立Logistic回归模型,进行Logistic回归分析。结果表明:孕前体重指数高,孕前腰围大以及高龄和GDM的发生有关联,为GDM发病的危险因素。见表1。

3 讨论

GDM是一种多因素疾病,目前高龄、肥胖以及糖尿病家族史是公认的高危险因素。孕前肥胖,尤其是中心型肥胖是GDM发生的重要危险因素,这可能与肥胖者有较高的胰岛素抵抗及葡萄糖耐受不良有关[3],内脏脂肪组织可能通过其产物和某些细胞因子抑制胰岛素信号,或通过胰岛素抵抗素、Randle葡萄糖-脂肪酸循环等导致胰岛素抵抗[4],最终导致血糖异常。

肥胖的标准往往是根据人体的一些测量参数,如BMI,WC等。BMI是估测身体脂肪含量及评价人体超重与否的传统指标。WC与腹内脂肪含量相关性最大,可以较好的反映人体脂肪的分布特征。

多数学者的研究证实,孕前高BMI者患GDM的危险性大大增加,经多因素Logistic回归分析后,孕前高BMI仍是独立的危险因素[5]。Zhang等发现,孕前腰围高增加患GDM的危险[6]。本研究也表明GDM孕妇的孕前BMI及腰围明显大于正常孕妇,说明孕前肥胖,尤其是中心型肥胖是GDM发生的重要危险因素。

孕前BMI及腰围等人体测量参数体现了体脂分布,测量简便、廉价、无创,可以做为GDM的早期预测指标。对于孕前肥胖尤其是中心型肥胖的孕妇应将其列为GDM筛查的重点对象并应加强对此人群的指导和监护,以利于及早识别和诊断GDM,降低母婴并发症的发生。

参考文献

[1] 杨秋红,单瑞芹,赵丽.加强妊娠期糖尿病筛查、管理与围产结局相关性分析[J].中国优生与遗传杂志,2006,14(11) :66~67

[2] 乐杰.妇产科学[M].北京:人民卫生出版社.2004,160

[3] 窦友莲,黄德秀.孕期体重指数及其增长对妊娠结局的影响[J].中华围产医学杂志,2003:6:104

[4] MatsuzawaYJ.The metabolic syndrome and adipocytokines[J].FEBS Letters,2006; 580:2917~2921

[5] 赵伟,王建华,苗汝娟.孕前体重指数与妊娠期糖尿病发病率关系的流行病学研究[J].天津医科大学学报,2002;1:4

指数分布 篇6

关键词:FICARCH模型,波动性,厚尾分布,非对称学生t分布

1 背景介绍

为了研究风险的时变特性, Engle (1982) 开创性地提出了条件异方差自回归过程 (ARCH) 概念, 对其进行了直接扩展, 形成了条件异方差自回归 (GARCH) 模型。 GARCH 模型很好地刻画了金融时间序列的“波动集群” (volatility clustering) 特征, 得到广泛应用。FIGARCH模型是Baillie、Bollerslev、Mikklson 在Engle的ARCH模型 (1982年) 的基础上于1996年提出来的, 来考虑股市或汇率收益序列波动中所发现的长期记忆现象。它的主要应用领域是金融资产, 包括证券、期权、利率等方面。该模型通过采用分数差分算子来替换GARCH模型中的一阶差分算子, 使其比GARCH或IGARCH模型更具有适应性, 比较擅长于反映这类金融资产的异方差特性以及准确地刻画金融波动的长记忆特征, 从提出至今, 它已被许多人成功地应用到证券市场及汇率市场, 尤其在分形市场假说理论 (FMH) 的波动性建模研究中使用最为广泛。

金融时间序列另一特征是“尖峰厚尾” (excess kurtosis and fat tail) , 但基于正态分布的假设却未能予以刻画。Bollerslev (1987) 等人使用厚尾Student-t 分布, Nelson ( 1991) 等人则建议使用Generalized Error Distribution (GED) 分布。鉴于此, 可以假定残差序列服从正态分布、学生t 分布、广义误差分布和非对称t 分布。本文在这四种分布假设下, 比较了FIGARCH 模型对上证指数波动性的预测, 目的在于揭示分布假设对指数波动性测算的影响。

2 FIGARCH模型介绍

文献在GARCH模型设定的基础上, 给出了反映长记忆性最常用的FIGARCH (p, d, q) 模型的表达式:

γt=x′tb+εt

Φ (L) (1-L) dεundefined=ω+ (1-β (L) ) vt (1)

其中, (1-L) d满足二项式展开;undefined和undefined为滞后算子多项式;Φ (L) 和[1-β (L) ]的根均在单位圆外;vt=εundefined-σundefined为零均值不相关的序列, 可以看作不可观测的新息过程。文献指出实际上一元FIGARCH模型就是将ARFIMA模型结构加到残差平方项εundefined之上得到的。由于εt是收益方程中的扰动项, 所以可以看作市场的“信息流”, 它是市场波动性产生的根源。在 (1) 式中, d=0时即为GARCH表达式, 此时扰动对预测期条件方差影响以指数率迅速衰减;d=1时即为IGARCH模型, 扰动对所有预测期条件方差都有显著而持续的影响;当0

3 模型的估计方法

模型中条件残差分布的选择对于模型的拟合效果和解释能力也有很大的影响。研究表明金融时间序列大都呈现尖峰、肥尾的特征, 并且分布可能是非对称的。因此借鉴文献 中做法在考虑常用的正态分布的同时, 引入学生t 分布、广义误差分布、非对称t 分布, 并采用极大似然法分别进行参数估计。选择的条件分布不同, 则模型最大似然估计的似然函数也不相同, 具体形式如下所示:如果假定残差呈条件正态分布, 则其对数似然函数为:

undefined (6)

而当假定残差的条件分布为自由度为v的t分布时, 最大化的似然函数可以写为:

undefined

如果残差服从广义误差分布 (GED) , 则对数似然函数可以写为:

undefined

其中:undefined。v为尾部厚度参数, 参数v控制着分布形式, 不同参数导致不同的分布形式。 当v=2 时, 是正态分布, 当v>2 时, 尾部比正态分布更薄, 当v<2 时, 尾部比正态分布更厚。 由此可见GED分布是一种比较复杂的分布形式。

如果残差服从非对称学生t 分布, 则对数似然函数可以写为:

对于任意一个FIGARCH 模型而言, 由于需要估计的参数很多, 过程也比较复杂, 因此首先有必要对其进行检验, 其中最重要的工作是检验序列所受到的 ARCH 影响是否显著, 即方差所受冲击的影响是否显著, 通常采用LM检验法。对ARCH 类模型参数估计通常可以采用拟极大似然估计方法 (QMLE) , 即假设序列满足条件正态分布的前提下对参数进行估计。而FIGARCH模型经过变换可以转化为GARCH模型, 因此对其参数进行估计时也可以运用QMLE方法。

4 FIGARCH模型对波动的估计和预测结果分析

根据国内外文献对长期记忆分析可知, 波动长期记忆现象和波动机制切换密切相关。为了排除预测期内不可能出现的波动机制的干扰和影响, 选用了交易机制相对比较稳定的1999年1月1日至2006年7月31日的上证指数数据, 并且预留最后一年的数据做预测之用。根据对数据的描述性统计结果可知, 这些数据呈现显著的“尖峰厚尾”特性。采用拟极大似然估计 (QMLE) 方法, 取均值方程为:rt=μ+εt, 对FIGARCH (1, d, 1) 进行估计, 并且残差的条件分布分别取正态分布、广义误差分布、 学生t分布、非对称t 分布, 估计结果见表1。

注:表中参数下面小括号内的数值为采用QMLE估计参数的t统计量, lnL 为对数似然函数值, AIC为Akaike 信息准则, B3为模型估计残差的偏度, B4为模型估计残差的峰度。

从表1中我们可以发现:

(1) FIGARCH (1, d, 1) 模型估计的分整差分程度d都在0.4~0.5 之间, 这说明在该样本期间, 我国股市的波动的确具有强烈的长期记忆特征。

(2) 考虑长期记忆的FIGARCH 模型时, 估计的α和β之和明显减少。采用最大似然准则和最小赤池准则 (AIC) 进行模型拟和优劣判别, FIGARCH模型效果较好, 这表明在研究我国股市波动特征的过程中, 由于强持续性的存在, 采用具有分数积分FIGARCH 模型能更好地反映股市波动的真实情况。

(3) 不同条件分布拟合效果从好到坏依次为: 非对称学生t 分布、学生t分布、广义误差分布和正态分布。而模型预测效果由强到弱依次为:广义误差分布、非对称学生t 分布、学生t分布和正态分布。由结果可以看出, 正态分布的预测效果是最差的, 这与股市中实际收益率呈现显著“尖峰厚尾”特征直接相关, 收益率的“尖峰厚尾”特征相当大地偏离了正态分布。由于t 分布较之正态分布具有更宽的尾部, 因而能更好地描述收益序列的厚尾性问题。在收益率分布函数对我国股市进行波动性预测时, 广义误差分布和非对称学生t 分布是较好的选择。

(4) 非对称学生t 分布假设并未能进一步提高FIGARCH模型预测能力, 我们认为原因可能是1996年2月16日实行的涨停板制度弱化了分布偏度统计特征, 限制了日收益率的最大值和最小值, 对标准差、偏度、峰度等统计指标, 从而对市场风险, 都会产生一定影响。

5 结论

本文首先引入了FIGARCH模型, 并给出了具有不同分布特征的FIGARCH 模型参数估计的概率密度。采用上海证券市场的指数数据, 考察了FIGARCH 模型在不同条件分布下对市场波动性的拟合效果和预测能力。实证结果表明, 不管是模型拟合效果还是预测能力方面, 广义误差分布的分布函数更适合我国股市波动特征的描述。因此, 考虑了长期记忆特征的FIGARCH 模型应用到与波动密切相关的领域之中, 如衍生工具定价、资产定价等等, 也将起到比较好的作用。尽管采用学生t 分布和GED 分布能够比较好地捕捉金融时间序列中常见的厚尾现象, 但是它们属于对称分布, 无法捕捉序列的不对称性。然而偏度对于一些金融实际应用也是相当重要的, 如资产定价模型、组合选择、期权定价等。因此可以考虑将非对称分布 (如非对称学生t分布) 引入到FIGARCH 模型框架中, 因为这一分布同时具有厚尾和偏斜的特征, 曾被引入到GARCH模型中。Lambert和Laurent (2001) 发现非对称学生t 分布比对称分布更适合NASDAQ指数建模, 因此非对称学生t 分布分布可能更适合收益率分布偏度较大的金融市场。

参考文献

[1]Baillie R T, Bollerslev T, Mikkelsen H O.Fractional integrated generalized autoregressive conditional heterosked asticity[J].Journal of Econometrics, 1996, 74:3~30.

[2]Engle, R.F., Autoregressive Conditional Heterosked asticity with Esti mates of the Variance of U.K.Inflation[J], Economet-rica, 1982, 50, 987~1008.

[3]张世英, 樊智.协整理论与波动模型——金融时间序列分析及应用[M].北京:清华大学出版社, 2004.

[4]杜子平, 张世英.向量GARCH过程协同持续性研究[J].系统工程学报, 2003, 18 (5) :385~390.

[5]许启发, 张世英.向量FIGARCH过程的持续性[J].系统工程, 2005, 23 (7) .

[6]李克娥, 陈圣滔.基于不同分布假设的GARCH模型对上证指数风险值预测能力的比较研究[J].太原师范学院学报 (自然科学版) , 2006, (6) .

[7]高铁梅.计量经济分析方法与建模——Eviews应用及实例[M].北京:清华大学出版社, 2006.

指数分布 篇7

1 资料与方法

1.1 资料来源

本研究中的资料来源于美国癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中卵巢癌研究队列子数据库,利用开放的TCGA数据平台(http://tcga-data.nci.nih.gov/tcga) 获得分析用的数据。数据为生存分析中随访研究搜集的原始资料,包括552 例卵巢癌患者的生存时间、是否截尾的信息,以及患者的12 042 种m RNAs、799 种micro RNAs基因的表达数据等。

1.2 资料的前期处理

首先对RNAs数据进行对数转换,接着采用单因素Cox回归分析对12 841 种RNAs进行单因素分析,初步筛选并获得对患者生存有影响的RNAs,即获得卵巢癌相关的可能基因。

1.3 卵巢癌相关基因的预后预测模型

1.3.1多重逐步Cox回归模型

对初步筛选获得的多个可能相关基因,采用多重逐步Cox回归分析,同时分析多个RNAs对生存时间和生存结局的影响,从中再筛选并获得对患者预后有影响的RNAs,建立Cox回归模型。

1.3.2预后指数模型

Cox回归模型中的线性部分βiXi+βjXj+…+βkXk与风险函数h(t)成正比,即风险越大,其值越大,因此Cox回归模型的线性部分反映一个个体的预后,称βiXi+βjXj+…+βkXk=PI为预后指数。预后指数越大,患者风险越大,预后越差;反之预后指数越小,预后越好[6,10]。

1.4 预后指数累计分布曲线拐点分析

以累计频数为横轴,预后指数为纵轴,绘制预后指数累计频数分布图,可以估计频数在某预后指数值上、下,或某2 个预后指数值之间。当样本含量足够大且组距很小时,累计频数分布图就成为累计分布曲线[7]。

曲线拐点的数学定义为,若曲线图形在一点由凸转凹,或由凹转凸,则称该点为拐点,拐点是使切线穿越曲线的点。在平面图中,曲线图形为凸或凹,此时横轴值的变化将引起纵轴值出现相应的变化,该变化量用曲线的斜率来描述,曲线的斜率即函数的一阶导数(横轴变量的增量趋于0 时,纵轴变量增量和横轴变量增量比值的极限)。函数的二阶导数描述函数斜率的变化率,凹、凸形曲线的二阶导数分别为正和负。二阶导数为正,意味着该点的斜率是递增的,即纵轴变量随横轴变量增大而增加得越多,反之则越少。若曲线图形在拐点由凹转凸或凸转凹,即二阶导数由正变成负或负变成正,二阶导数为0的点即为笔者寻找的拐点[11,12]。

当预后指数累计分布曲线存在拐点时,拐点两侧的变量个数都会增多,但在拐点处没有增加;预后指数值在其取值范围内分布有聚集性。求得拐点处的预后指数值,即可对患者的预后类别做精确分类,继而通过比较各组间的生存过程包括生存曲线、生存率,考察基于预后指数累计分布曲线拐点分析的卵巢癌患者预后分类效果。

1.5 统计学方法

采用SPSS 18.0 统计软件进行数据分析,应用多重Cox回归分析,获得预后指数的计算模型;对预后指数的累计分布曲线拟合函数求二阶导数,获得曲线拐点,并应用拐点对卵巢癌患者的预后情况分组;采用Log-rank检验进行组间比较,P ≤0.05 为差异有统计学意义。

2 结果

2.1 单因素分析

对552 例卵巢癌患者的12 042 种m RNAs、799种micro RNAs基因的表达数据,运用单因素Cox回归分析进行单因素分析,初步筛选并获得对卵巢癌患者生存有影响的37 种RNAs,其中34 种m RNAs、3 种micro RNAs。

2.2 多重逐步Cox回归分析

对单因素Cox回归分析初步筛选的37 个可能相关基因的表达数据,采用多重逐步Cox回归分析,同时分析这37 个RNAs对生存时间和生存结局的影响,结果显示,10 个RNAs对患者预后有影响,通过筛选成为卵巢癌的预后因子(见附表)。从而得到预后指数PI的计算公式为:

PI=-0.515(OVGP1.1)-0.439(PRAME.1)+0.724(LYVE1.1)+…+0.557(C1orf 114.1)。

2.3 预后指数的累计分布曲线分析

2.3.1预后指数

分别将10个基因的表达数据代入预后指数的计算公式,得到552例卵巢癌患者的预后指数值。绘制预后指数累计分布曲线,并进行函数拟合,获得Cubic函数曲线(R2=0.986)。见图1。

注:α入=0.05;α出=0.06

PI=3.231×10-8×(频数)3-2.692×10-5×(频数)2+0.009×(频数)-1.983

2.3.2预后指数累计分布曲线拐点

Cubic函数曲线图形自左到右呈由凸转凹,即二阶导数由负变成正,二阶导数为0的点即为笔者寻找的拐点。计算该函数的二阶导数:

PI''=6 ×3.231 ×10-8×( 频数)-2 ×2.692 ×10-5=19.386×10-8×(频数)-5.384×10-5

令二阶导数PI''=0,得(频数)≈278,代入Cubic函数曲线,计算得PI=-0.78,获得点(278,-0.78)即为曲线的拐点。以PI=-0.78 将552 例卵巢癌患者分为高危组和低危组,绘制两组Kaplan-Meier生存曲线(见图2),两条生存曲线无交叉,对两组生存率比较,经Log-rank检验,差异有统计学意义(χ2=46.365,P =0.000)。高危组和低危组患者的中位生存时间分别为1 678 和1 058 d,低危组患者的生存率较高,结果表明,预后指数分布曲线拐点能将卵巢癌患者精确地分为高危组和低危组。

3 讨论

在卵巢癌患者的预后预测中,卵巢癌相关基因即卵巢癌肿瘤分子标志物表达的预测作用不容忽视。近几年来,RNAs与卵巢癌预后的相关性得到较多的关注[3,4,5,6]。本研究基于对12 841 种RNAs表达数据分析,建立多重Cox回归模型,获得反映个体预后的指标———预后指数的计算模型[6,7]。对预后指数累计分布曲线拟合函数求二阶导数,获得曲线拐点[11]。

本研究的预后指数累计分布曲线有一个拐点,依据拐点处的预后指数值将卵巢癌患者的预后分成高危组和低危组。对高危组和低危组卵巢癌患者的生存率进行比较,低危组患者的生存率高于高危组的,中位生存时间低危组患者的为高危组患者的1.6倍(1 678/1 058),显示预后指数分布曲线拐点能将卵巢癌患者的预后进行精确分类,即利用预后指数累计分布曲线拐点分析,对卵巢癌患者预后具有较好的分类效果[6,9,10]。

综上所述,基于卵巢癌相关的RNAs表达数据建立的预后指数模型,结合累计分布曲线拐点分析,能帮助临床医师对卵巢癌患者的预后进行较精确的分类,为卵巢癌患者的治疗和管理提供新的依据。

参考文献

[1]Choi M,Fuller CD,Thomas CR,et al.Conditional survival in ovarian cancer:results from the SEER dataset 1988-2001[J].Gynecol Oncol,2008,109:203-209.

[2]刘侃,陈红晓,张虹.晚期卵巢癌预后相关因素分析[J].现代妇产科进展,2010,19(12):918-921.

[3]蔡晶,王泽华.肿瘤标志物预测卵巢癌预后的价值[J].中国实用妇科与产科杂志,2015,31(3):226-229.

[4]Cao J,Cai J,Huang D,et al.mi R-335 represents an indepen-dent prognostic marker in epithelial ovarian cancer[J].Am J Clin Pathol,2014,141(3):437-442.

[5]Lee CH,Subramanian S,Beck AH,et al.Micro RNA profiling of BRCA1/2 mutation-carrying and non-mutation-carrying highgrade serous carcinomas of ovary[J].PLo S One,2009,4(10):DOI:10.1371/journal.pone.0007314.

[6]孙振球.医学统计学[M].第4版.人民卫生出版社,北京:2015.

[7]方积乾.卫生统计学[M].第7版.人民卫生出版社,北京:2013.

[8]夏耀雄,李文辉,王晓莉,等.新的预后指数模型GPA在肺癌脑转移中的应用分析[J].昆明医科大学学报,2012(6):113-117.

[9]余红梅,何大卫.预后指数在慢性病及肿瘤病人长期生存预测中的应用[J].中国公共卫生,2001,17(8):749-750.

[10]Cox DR.Regression models and 1ife-tables(with discussion)[J].Journal of the Royal Statistical Society,1972,34:187.

[11]陈玉.曲线拐点的判别法[J].高等数学研究,2008,11(5):9-10.

指数分布 篇8

1资料与方法

1.1研究对象

选取2013年1月至2014年12月在我院心内科门诊就诊或住院的未行导管消融的非瓣膜性阵发性AF连续186例患者(AF组),另选84例无AF患者为对照组。入选标准:①心功能正常,排除先天性心脏病、冠心病、心肌病、伴发的瓣膜性心脏病、心脏外科术史、严重感染、严重代谢紊乱、严重肝肾功能不全及急性脑血管病等;②超声心动图检查左房及左心耳无血栓;③年龄≥18岁。所有患者至少有一张AF发作时的心电图。阵发性AF患者登记时都是窦性心律。AF是根据2014年美国心脏协会、美国心脏病协会、美国心律学会(AHA/ACC/HRS)AF指南[3]的定义。入选患者签署伦理委员会批准的知情同意书。

1.2方法

入选的患者,详细记录临床资料、12导联心电图、经胸超声心动图和经食道超声心动图等检查。体质指数(BMI)=体质量/身高2(精确到0.1kg/m2)。全血细胞分析采用流式细胞计数法。标准化体表面积(BSA)=0.0061×身高+0.0124×体质量-0.0099。采用Philipssi E-Elite彩色多普勒超声诊断仪,S5-1探头,频率2~4MHz。Simpson法于心尖左心两腔和心尖四腔心切面时勾画得出左心房面积(A1、A2),并记录二尖瓣瓣环连线中点至左心房顶部的距离(L1、L2)。所有数据取3个心动周期的平均值。计算LAV,LAV=0.85×A1×A2/L,(L为L1、L2中较小者),LAVI=LAV/BSA[4]。所有心脏超声检测均由同一名超声心动图医师完成。采用免疫透射比浊法检测hs-CRP。AF发作次数来自于病历记录和患者自我报告发作超过30秒的AF。

1.3统计学方法

采用SPSS16.0统计软件包分析,正态分布的连续性资料以(±s)表示,组间比较采用t检验;非正态连续性资料以中位数(IQR)表示,组间比较用Mann-Whitney U检验。计数资料采用卡方检验。二分类Logistic回归分析临床参数和AF之间的关系,ROC曲线来评价区分AF和对照的RDW的最佳切点,和LAVI的最佳切点,以P<0.05为差异有统计学意义。

2结果

2.1两组临床资料、超声心动图、实验室参数比较(表1)

共186例符合入选标准的AF患者进入该研究。表1显示:除了AF组LAV、LAVI、RDW和hs-CRP均显著高于对照组(P<0.05)外,两组其余指标比较差异均无统计学意义(P>0.05)

2.2阵发性AF发作次数比较及Logistic回归分析(表2)

⑴AF组1年的发作AF的次数是(3.6±2.5)次。以1年的AF发作次数对阵发性AF患者进行分组,RDW值在1年发作次数≥4次的患者(n=45)明显高于1年发作次数≤3次的患者(n=63),平均值是13.5%vs.13.2%;P<0.05。其他变量在两组间差异无统计学意义。⑵以阵发性AF为因变量,RDW、LAVI和hs-CRP为自变量,进行Logistic回归分析显示:升高的LAVI、RDW和hs-CRP是独立预测非瓣膜性AF发生的预测因子。

2.3 RDW和LAVI对阵发性AF发作的预测价值

受试者工作ROC曲线:RDW的ROC曲线下面积为0.687(P<0.05,95%CI 0.612~0.762),当最佳切点值RDW>13.0%时,预测AF发生的敏感度为63.9%,特性度为57.1%。LAVI的ROC曲线下面积为0.810(P<0.01,95%CI0.748~0.871),当最佳切点值LAVI>16.7ml/m2时,预测AF发生的敏感度为81.5%,特性度为64.3%。

3讨论

许多学者致力于寻找AF发生预测因素的研究。RDW作为血常规检测中的一项常规指标,近年来成为心力衰竭、稳定性冠心病、卒中和心肌梗死患者不良预后的强预测因子[5]。Adamsson等[6]对27124例无AF、心力衰竭、心肌梗死或卒中人群进行了平均6年的随访,发现RDW独立于一些心血管、营养及血液因素的影响,与AF的发生率密切相关。同样,本研究也得出了升高的RDW与AF的发生呈正相关。Agarwal等[7]研究发现,RDW>13%时与较低的心肺健康状态相关,可具有较高心血管疾病预测价值,与本研究RDW>13%时可以预测AF的发生相一致。RDW水平的增加和炎症标记物相关,反映了红细胞内稳态的异常,归因于各种各样基本新陈代谢的异常,如端粒长度的变短,氧化应激,炎症,血脂异常,高血压,红细胞破碎和红细胞生成素功能的改变,越来越多的证据表明,炎症和氧化应激在AF的发生和维持中发挥着重要作用[8]。这些解释了如果RDW增加,AF发生率会增加。因此,RDW可用于作为一个独立的危险因素预测AF的发生。

估测左心房大小的传统方法是使用二维超声心动图和M型超声心动图测量的左房前后径,方法方便简单,但不能准确地反应左心房的大小。我们选用的是LAVI对左心房大小的评价,LAVI可更加客观地反应左心房容积大小,明显缩小了性别,年龄,身高,体重等因素的影响,且变异系数较小,稳定向较高。国外研究提示,外科术前行超声心动图检查测量LAV与心外科术后AF的发生具有一定相关性[9]。Akdemir B等[10]对14例行电复律的AF患者在复律前行超声心动图检查,发现电复律前较低的LAVI是独立的电复律成功的强预测因子。本研究发现LAVI越高越易发生AF。当LAVI>16.7ml/m2时,预测AF发生的敏感度为81.5%,特性度为64.3%。较高的LAVI可以独立预测AF的发生。目前对于LAVI预测AF发生的切点值研究较少,尚无法比较,还有待今后扩大样本进一步分析,可更精确量化指标,为临床提供指导。

本研究为一项单中心研究,目前只有较少的研究进行了RDW和LAVI与AF发生的研究。本研究提示RDW和LAVI对预测AF发生具有较高的敏感性,尚需更大规模的临床前瞻性的研究来进一步验证。本研究样本量小,有一定局限性,未来还要进一步随访患者,进行更深入的研究。

参考文献

[1]Salvagno GL,Sanchis-Gomar F,Picanza A,et al.Red blood cell distribution width:A simple parameter with multiple clinical applications[J].Crit Rev Clin Lab Sci,2015,52(2):86-105.

[2]Guimarães PO,Sun JL,Kragholm K,et al.MURDOCK Horizon 1 Cardiovascular Study Investigators.Association of standard clinical and laboratory variables with red blood cell distribution width[J].Am Heart J,2016,174:22-28.

[3]January CT,Wann LS,Alpert JS,et al.2014 AHA/ACC/HRS guideline for the management of patients with atrial fibrillation:executive summary:a report of the American College of Cardiology/American Heart Association Task Force on practice guidelines and the Heart Rhythm Society[J].Circulation,2014,130(23):2071-2104.

[4]Recommendations for Cardiac Chamber Quantification by Echocardiography in Adults:An Update from the American Society of Echocardiography and the European Association of Cardiovascular Imaging[J].Eur Heart J Cardiovasc Imaging,2015,16(3):233-271.

[5]Isik T,Uyarel H,Tanboga IH,et al.Relation of red cell distribution width with the presence,severity,and complexity of coronary artery disease[J].Coron Artery Dis,2012,23(1):51-56.

[6]Adamsson Eryd S,BornéY,Melander O,et al.Red blood cell distribution width is associated with incidence of atrial fibrillation[J].J Intern Med,2014,275(1):84-92.

[7]Agarwal S.Red cell distribution width,inflammatory markers and cardiorespiratory fitness:results from the National Health and Nutrition Examination Survey[J].Indian Heart J,2012,64(4):380-387.

[8]Emans ME,Gaillard CA,Pfister R,et al.Red cell distribution width is associated with physical inactivity and heart failure,independent of established risk factors,inflammation or iron metabolism;the EPIC-Norfolk study[J].Int JCardiol,2013,168(4):3550-3555.

[9]Nardi F,Diena M,Caimmi PP,et al.Relationship between left atrial volume and atrial fibrillation following coronary artery bypass grafting[J].J Card Surg,2012,27(1):128-135.

【指数分布】推荐阅读:

创新指数10-18

财务指数10-19

指数关系01-15

指数预测05-15

指数体系05-18

指数评价05-23

指数模型06-06

危险指数06-17

指数下降06-18

因素指数06-28

上一篇:整体项目驱动下一篇:神采飞扬