阈值模型(精选6篇)
阈值模型 篇1
摘要:关于经济阈值的含义有经济临界值、经济极值和最小影响变量等不同的理解,运用函数的方法定义经济阈值的概念,拓展了其内涵和应用范围,经济阈值函数具有间断性、跳跃性、可变性的特点,经济阈值效应原理及方法在经济分析中具有广泛的应用。
关键词:经济阈值,阈值效应,数学模型
一、对“经济阈值”含义的不同理解
人们在进行经济分析和研究中,常用到“阈值”或“经济阈值”这一概念。其使用的范围大大超过原来提出这一概念的生物工程学和生态学领域,在经济学研究和经济活动分析中得到广泛的使用,如“经济规模阈值”、“经济增长阈值”、“环境阈值”、“阈值效应”等,但经济学者对“经济阈值”的含义的理解却各不相同。主要有以下三种不同的理解:
1. 经济临界值:
即在两个相关经济要素中,一个经济要素(自变量)对另一个经济要素(因变量)产生质的变化时的数量值。如盈亏平衡时的产量,保本时的价格等,将“经济阈值”理解为因变量发生质的变化的分界点。
2. 经济极值:
即在一定的社会生产技术组织条件下,一定时期内某种经济要素能达到的最大值或最小值。如经济增长阈值,各种资源阈值,生产成本阈值等,将“经济阈值”理解为某种经济要素数量上的极限。
3. 经济函数的最小影响变量:
即在两个相关的经济要素中,一个经济要素(自变量)对另一个经济要素(因变量)能够产生影响或变化的必须的最小变化量或变化幅度[1]。用函数方法表达:设经济要素y为经济要素x的函数,如果Δx<Δxt,则Δy=0;若△x≥Δxt,Δy=△yt,则Δxt定义为x影响y变化的阈值。
上述三种含义各有一定道理和相应的应用,笔者认为采用第三种含义较为合理。主要原因有:(1)更符合阈值的基本含义。阈值的原意为门槛、门限[1]。因为较早地在研究中使用“阈值”概念的是生物学,如阈浓度作为毒性参数,是指毒性引起生物机体某种反应的最小浓度或剂量[2]。较早使用“经济阈值”概念的也是来自于生物工程学,由美国昆虫学家斯特恩(Stem)1959年提出[3],是指“能够引起经济损失的最低出口密度”[4]。都含有一个因素能够影响或作用于另一因素变化的最小值的含义,因此,第三种含义比前两种含义更好地体现了“阈值”的原义,也与大多数学科对“阈值”概念的理解相一致[5]。(2)定义的对象更准确。“经济阈值”是在两个因素相互影响、相互作用的比较中才有意义,且定义的对象应为自变量,第三种含义更能体现这一要求。(3)定义的外延更广。第三种含义能较好地融合前两种含义的合理成分。如在某些经济数学模型中,临界值或极值正好是多个阈值的累积,或是全部阈值之和。即若临界值或极值为x*,则∑Δxt=x*。
二、经济阈值效应及其函数的一般表达式
本文主要讨论按第三种含义确定的经济阈值的函数模型,并把两个经济因素之间受阈值影响的形成的函数关系称之为“经济阈值效应”。
经济阈值效应函数的一般表达式。设两经济要素的函数为y=f(x),使函数值发生变化的x值为函数y=f(x)的临界点,定义从一个临界点到相邻下一个临界点的距离为函数阈值Δxtn,n=0,1,2,……。假定:函数的阈值由实际问题确定,则在阈值存在的条件下对y=f(x)修正如下:
1. 阈值为常量:
设阈值Δxt1=Δxt2=……=Δxtn=……因函数y在x设有达到新的临界点之前,其值保持不变,所以,函数y=f(x)应修正为:
注意:为取不大于的最大正整数。
2. 阈值为变量:
设函数阈值由实际问题确定,阈值依次为Δxt1,Δxt2,……,Δxtn,……;则临界点依次为xt1=Δxt1,xt2=Δxt1+Δxt2,……,xtn=Δxt1+Δxt2+……+Δxtn;那么,函数y=f(x)应修正为当xtn≤x≤xtn+1时:
函数(1)、(2)分别为阈值为常量和变量时的阈值效应函数。不难看出,阈值效应函数具有以下三个特征:(1)间断性,即阈值效应函数是非连续性函数,无论阈值为常量还是变量都是间断函数(如图1、图2所示)。(2)可变性,即阈值的可变性,阈值既可以是常量,也可以是变量,既可呈有规则的变化,也可呈不规则变化,其变化特点由两个因素相互影响、相互作用的内在规律所决定。(3)跳跃性(台阶式)。即阈值效应函数图像为一逐级上升或下降的台阶形状,能更真实更细致地反映经济因素的内在联系。
三、经济阈值效应的应用
如果我们分析和研究任何相互影响、相互作用的两个经济要素之间的联系,就会发现,阈值效应是一种普遍存在的现象和规律,价格、利率、工资、国民收入的变化对产品供求、贷币供求、人力资源供求及消费结构变化无不存在着阈值效应。因此,对经济阈值及其效应的研究应该是经济学特别是数量经济学的基础或起点。以下我们分析经济阈值效应几个例子。
1. 价格的阈值效应。
案例1:房屋租赁、美国某大学城的住房市场需求状况(见表1):
表1中,保留价是指租房人愿支付的月租金,租金是房东可接受的租金,假设可供出房子为30套,月租金低于200元房东将会亏本,不予出租;其中租金高于420元(含420元)的房子为高档房。在不考虑到租金的阈值效应条件下,我们拟合出表1中可租出住房(y)与租金(x)的函数关系为:
若房东把租金降为418元,则可租出房,与实际只租出5套不符。因此,必须考虑阈值效应的影响,对原函数关系进行修改,拟合的函数关系为:
当租金418元时,,与实际相符,说明在考虑到阈值效应的条件下,经济数学模型能较好地符合实际经济状态。
这里虽然是假设地租金的阈值分别为20和10,但更符合市场交易的习惯,人们更多地是按级按类分档定价,较少地采取连续定价,大宗产品、高档耐用消费品、奢侈品交易更是如此。
2. 供给阈值效应。
案例2:在案例1的基础上,需要租房者增加1倍,增加到60人,其保留价和住房偏好仍保持不变,其需求状况(见表2):
分析高档房(月租金420元及以上)出租情况,我们会发现,当只有1套高档房供给时,无疑可以500元/月租金租出,有2套高档房时,第2套仍可以500元/月租金租出,但第3套房只能以(80元/月租金租出,如此类推。其供给曲线(如图3所示):
高档房的租金(y)随着供给量(x)的增加,按阈值Δxt=2的规律逐渐下降。其函数式为
3.需求的阈值效应。
分析案例2高档房的需求情况:当高档房只有一个人愿意租赁时,其价格为420元,有2人租赁时价格仍为420元,随着每增加2人,其价格向上跳一个台阶(20元),如此类推。这是一种比较典型的需求阈值效应。(如图4所示):
其租金的函数(y)为:
以上三种阈值效应其阈值既有设定的,也有根据设定条件计算确定的,实际经济活动中的阈值需要科学地分析,精确地测算才能确定,这正是我们从事经济研究和经济工作的一项亟待完成的基础工作和基本任务。
参考文献
[1]杨建新.论经济学中的阈值及阈值效应[G]//2007年人文学术研究.长春:吉林人民出版社,2007:62.
[2]辞海:缩印本[K].上海:上海辞书出版社,1979:881.
[3]中国农业百科全解:植物病理学卷[M].北京:中国农业出版社,1996:254.
[4]百度百科,http://www.baike.baidu.com/view/270590.
[5]哈尔.R.范里安.微观经济学:现代观点(第1版)[M].上海:上海三联出版社,2006:3.
二元超阈值模型在环境中的应用 篇2
近年来,大气污染呈现加重趋势,出现越来越多的极端污染事件。大气环境中的极值事件就是指那些发生概率很小,但又对人体、植物、动物和气候造成重大影响,甚至是毁灭性影响的事件。目前针对大气环境的研究主要集中在分析单个污染因子或市区总体空气污染的变化特征及趋势[1,2],而对监测指标之间相关关系研究较少[3]。最近,国内也有一些文献研究了多元极值的应用问题,大多应用于金融市场的风险评估[4,5],海洋波浪模型等[6,7,8,9]。在大气环境污染方面的研究尚少。在对二元超阈值模型应用于上海市大气环境指标中,得到了两个大气指标的一个渐进分布,从而对未来大气环境的质量进行分析和预测。
1 尾部相关性分析
极值理论研究的是随机变量取极值时的分布情况,为了更准确地描述二元极值的相关性质,统计学家引进了尾部相关性的度量方法,下面首先给出分布的尾部相关性:渐近独立和渐近相关的定义。
定义1 设随机向量(X,Y)的联合分布函数为F,边缘分布函数分别为F1和F2,Pr为概率。若
存在且非零,则称X和Y渐近相关。反之,若极限值为零,则称X和Y渐近独立[10]。
该定义中的极限可以粗略地理解为当一个变量是极值条件下,另一个变量也是极值的概率。区分变量在极值水平上是相关还是独立,对二元极值的分析是相当重要的,渐近相关意味着两个随机变量的极端值可以同时出现。同理,如果两个随机变量的尾部相关性是渐近独立的,则意味着当一个随机变量取极值时,另一个随机变量取极值的概率是很小的。
χ具有下列性质:0≤χ≤1;对渐近独立变量,χ=0;在渐近相关随机变量中,尾部相关性越强,χ值越大。可见,当两随机变量渐近相关时,χ提供了较好的相关性度量。
但对渐近独立随机变量,χ=0没有提供这种情况下的相关性信息,即不能用χ度量渐近独立变量的相关性强度。因此需要定义另一个指标,以度量渐近独立变量的极值相关性。对于0≤u≤1,定义
及
显然对相互独立的变量,
作为随机变量渐近独立时的相关性度量,
另外,对于二元极值分布,也可以通过Pickands相关函数A(t)来判断随机向量(X,Y)的尾部相关性。文献[10]中给出了尾部相关性度量指标χ与A(t)的关系。χ=2-2A(1/2)。故A(1/2)包含了尾部相关性信息,当两个变量独立时,A(1/2)=1,而当它们完全正相关时,A(1/2)=1/2,因此可以通过非参数估计A(1/2)判断两个随机变量的尾部相关性。
2 二元超阈值模型的建立
二元极值模型是建立在一元极值理论的基础上的,因此,相应于一元极值的建模方法,在二元极值建模中都得到了发展。二元超阈值模型的思路是,先研究一元,再研究边际分布间的相关性,在选定阈值后,将边际分布分成两部分,阈值以下的用经验分布拟合,阈值以上的用广义Pareto分布将经验分布重新分配,得到新的边际分布函数,通过选取合适的相关结构函数,得到二元分布函数,再利用极大似然对参数进行估计。这样得到的数据量充分,且都保持原始数据的特点,是较好的方法。
设X1,…,Xn是独立同分布的随机变量,分布函数为F,令Mn=max{X1,…,Xn},如果存在常数列{an>0},{bn},使得
成立,则称分布函数F属于极值分布H(x)的最大吸引场,记为F∈MDA(H)。
对于一元分布函数F∈MDA(H),H为GEV分布,F的尾部近似为广义Pareto 分布
即对充分大的阈值u,当x>u时,有
参数分别为(ζx,σx,ξx)和(ζy,σy,ξy)。作变换:
Pr(Mn,x/n≤x,Mn,y/n≤y)→H(x,y)。
H(x,y)是非退化分布函数,称为二元极值分布,H(x,y)不能由有限参数形式表示,将任意连续边缘分布变换为标准Frechet分布后,二元极值分布间的差异就取决于相关结构了。二元极值中反映相关结构的主要是指数测度V或相关函数A的估计。为简单起见,只介绍二元极值分布相关函数A的非参数估计。下面给出A的四种非参数估计方法。
方法1:如果(X,Y)服从二元极值分布,边缘分布为标准Frechet分布,那么对于样本(Xi,Yi),i=1,2,…,n;A(t)的一个一致估计量为
方法2:由于Pickands估计量不满足凸性和可微性要求,也不满足An(0)=An(1)=1。为此,文献[12]提出一个估计量
该估计量为Deheuvels估计量。它满足
An(0)=An(1)=1。
方法3:为了解决Pickands估计量的缺陷,文献[13]提出估计相关结构函数A(t)的估计量为
其中
方法4:相关函数A(t)的另一个非参数估计是由文献[14]给出的。(X,Y)服从二元极值分布,令U=exp{-X-1},V=exp{-Y-1},Z=lg(U)/lg(UV),则可证明A的渐近无偏、一致强相合的估计量为
其中,Z(1)≤…≤Z(n)是Z(i)(Z(i)没有相同的)的次序统计量,
上面给出了相关结构A(t)的四种非参数估计方法。由于二元极值分布函数不能用有限参数形式表示,对它的理论研究,特别是在实际中的应用,有时会遇到某些困难,因此有必要提出一些参数模型。二元分布中最重要的信息应该是变量间的相关结构,即相关结构函数,对二元极值分布也是如此,讨论二元极值参数模型,最关心的也是两个极值变量间的相关关系,而这个关系完全由相关结构函数决定。正是由于相关结构函数A是非参数形式,因此二元极值分布没有一般的参数形式。如果有一个参数模型,它能近似的表示整个二元极值分布的大概面貌,特别能包括从独立到完全相关之间的所有情况,模型又比较简单,那么这个模型就是有意义的,但无论如何,这个参数模型也只是所有二元极值分布的沧海中一粟。文献[15]中证明了许多有用的二元极值参数模型,主要分为Logistic型与其他类型。文中指出Logistic模型是应用时最广泛的,包括Logistic模型,负Logistic模型,双Logistic模型,不对称Logistic模型,负双Logistic模型五个模型。
3 上海市大气环境的实证分析
分析一个城市大气环境的质量,需要同时考虑多个环境指标,其中最重要的三个指标是可吸入颗粒物的浓度,二氧化硫的浓度和二氧化氮的浓度。一个城市一段时间的大气环境质量情况由这三个指标共同决定,每个指标的浓度达到很大都会造成一定的危害,而且每个指标之间的复杂关系表现出来的相关性,还会造成额外的危害。为了研究某段时间大气环境是否存在污染,必须研究各个指标浓度之间的相关性。在大气环境的研究中,环境学家为了方便公众对污染情况有个直观的认识,根据空气环境质量标准和各项污染物的生态环境效应及其对人体健康的影响计算出来一个指数,记为API(Air Pollution Index)代表大气指标的浓度,在本文接下来的实证研究中,对大气环境指标浓度的度量均选取API。
3.1 尾部相关性分析
本文选取上海市最近十年的日数据(来自http://www.sepb.gov.cn),从2002年1 月1日到2012年4月5 日每日的可吸入颗粒物,二氧化硫和二氧化氮的API指数三个指标为原始数据进行分析,我们在这里特别关心各个指标极端值的相关性,下面图中是对不同的阈值u,χ(u)及
虽然由于估计量的方差较大,χ(u)与
另外,由于χ=2-2A(1/2),因此A(1/2)中包含了尾部相关信息,当两个变量独立时, A(1/2)=1,而当它们完全正相关时,A(1/2)=1/2,所以可以通过非参数估计来判断两个变量之间的尾部相关性。下面给出几种非参数估计值来判断各个指标之间的相关性。三个指标两两相关性的情况如表1。
通过观察三个变量的非参数估计,每对指标的相关性差别不是很大,但相比较而言,可吸入颗粒物与二氧化硫具有较高的相关性。这也是符合实际情况的,由于我国的能源结构以煤炭为主,因此当前我国的空气污染类型表现为煤烟型污染占据主导地位,而二氧化硫和可吸入颗粒物是燃煤过程的主要产物,也是煤烟型污染的主要代表物,因此,一般而言,大气污染物中二氧化硫和可吸入颗粒物具有较强的相关性,对上海市大气环境质量数据的相关性分析也很好的验证了这一点。
3.2 二元超阈值建模
为了更深入的了解二氧化硫和可吸入颗粒物之间的尾部相关性及其两个指标的走势,需要建立二元极值模型,现采用二元超阈值模型对大气环境的API指数进行实证分析。选取可吸入颗粒物的API指数,二氧化硫的API指数为原始数据建立模型。所选取样本容量为7 496个。选用阈值模型分别对每个指标建模。
首先,根据平均剩余寿命图选取合适的阈值。平均剩余寿命图对阈值的选取是基于广义Pareto分布的平均超出量函数
上式中:u为阈值,E(X-u|X>u)为阈值超出量的期望值,称为平均超出量函数。根据上式可看出e(u)是u的线性函数。由于期望近似为平均值,故根据上式做出阈值u与样本超出量之平均值的散点分布图,当形状参数ξ稳定时,图形近似为直线。换句话说,以阈值u为横轴,以平均超出量为纵轴,该直线的斜率和截距分别为
其次,根据极大似然估计可以得出三个变量的参数估计值(ξ,σ,ζ)分别为(0.439,21.48,0.055)和(-0.268,14.841,0.061)。分别对每个指标进行模型诊断,通过模型诊断图可以判断:可吸入颗粒物的API指数和二氧化硫的API指数均符合阈值模型,可以作为二元超阈值模型的边缘分布样本。
最后,选用常用的一些Logistic型二元极值参数模型,包括Logistic模型,负Logistic模型,双Logistic模型,不对称Logistic模型,负双Logistic模型五个模型来拟合数据,为了从几个参数模型中挑选一个能较好地拟合数据的模型,当模型含有相同个数的参数时,可直接比较似然函数的最大值,判断模型对数据的拟合好坏;当两个模型含有不同个数的参数模型时,一般的做法是对拟合模型的参数个数p,加上一个惩罚项,一个常用的惩罚项是2p,相应的准则称为AIC,即AIC=-l(θ)+2p,其中l(θ)是对数似然函数。通过计算和比较,最终认为不对称Logistic模型最适合,图6显示了Pickands估计的相关结构函数,(文中模型建立中已经给出了几种非参数估计方法,其中方法1为Pickands估计)可以看出非参数估计略有非对称性,这就支持了AIC准则选择的不对称Logistic模型。通过极大似然估计我们得到了参数的估计值, 如表2所示。最终,两个指标的条件P-P图均表明模型拟合的很好。
3.3 结果分析
根据前面的二元超阈值建模,我们可以得到两个指标的尾部联合分布为
F(x,y)=C0.593 5,0.999 4,0.680 8(Fx(x),Fy(y)),
x>120,y>70。
其中
由此可知,每经过1/0.007 46≈134 d就会出现一次中度污染。另外,我们也可以计算得到当可吸入颗粒物的API超过150时,二氧化硫的API超过100的概率,同理,我们可以计算得到当二氧化硫的API超过100时,可吸入颗粒物的API超过150的概率
P(Y>100|X>150)=0.292 21,
P(X>150|Y>100)=0.841 7。
由此我们可以看出两个指标的极值有较强的相关性。尤其是当二氧化硫的浓度很高时,可吸入颗粒物浓度升高的概率相当大。最后,我们计算得到两个指标的API指数同时上升超过200的概率为P(X>200,Y>200)=0,由此可知,上海市大气环境质量近十年没有发生过重度污染的情况,一年中基本会有3 d时间发生轻度或中度污染,因此,总体来说,上海市的大气环境质量还是比较好的。
4 结语
在上面的研究中发现,二元参数模型的选取在二元极值建模中是至关重要的,诸多不同类型的参数模型有着不同的特征,可以描述不同的相关模式,如何选择具体的参数模型尚缺统一有效的方法与标准。另外,多元极值理论中的“维数灾”问题也是一个亟待解决的问题,目前的研究基本限于二元极值模型。
阈值模型 篇3
关键词:二维熵,多阈值分割,均值-梯度共生矩阵,显微细胞图像
1 概述
显微细胞图像分割是医用图像处理中一个十分重要的环节,目的是将图像中具有不同性质的象素区别开来,为图像的进一步分析与理解提供帮助。分析疑似肿瘤细胞图片,针对病变细胞较正常细胞核浆比例增加这一特点,考虑须计算待测图片的核浆比,作为判断疑似肿瘤细胞的参考数据。然而只有实现了显微细胞图片的多阈值分割,即将细胞核、细胞浆及背景区域准确区分,才有可能计算核浆比例,因此显微细胞图像的多阈值分割极其重要。目前已有许多分割方法应用到这一领域,其中直方图阈值法[1]因计算简单、适用性强,深受广大研究者的重视。在阈值的选取方面,利用最大熵[2]确定直方图阈值实现图像分割的方法,运算速度快、抗噪性强、性能稳定,成为倍受关注的一类算法。
起初,人们利用一维熵算法确定直方图阈值,一维熵只能够描述图像某个象素点的灰度信息,并不能够描述该象素点周边的相关信息,当图像的噪声较强时,必然会影响到分割质量。二维熵算法解决了这一难题,它在考虑图像灰度信息的同时,也对邻域相关信息进行分析。大量学者对二维直方图的构建展开研究,如Abutaleb算法[3]选用四邻域中心象素灰度值和四邻域均值构成二维直方图。文献[4]选用四邻域中心象素灰度值和四邻域梯度值构成二维直方图。文献[5]选用中心象素灰度值、中心象素灰度与邻域灰度均值之差的绝对值构成二维直方图。文献[6]选用3×3邻域中心灰度值和四邻域以外的四个象素的灰度均值构成二维直方图。文献[7选用两种方法构造二维直方图,第一种方法利用四邻域中心象素灰度值和其余象素的灰度最大值构成;第二种方法利用四邻域中心象素灰度值和其余象素灰度最小值构成。最终通过实验验证,二维熵算法的确具有良好的分割性能。但这些算法实现的却是单阈值分割,若将其简单推广到多阈值,运算量将急剧增加,很难达到实时性的要求。
本文提出基于均值–梯度共生矩阵模型的最大熵多阈值处理算法,目的是解决噪声显微细胞图像多阈值分割问题。均值–梯度共生矩阵模型是选用图像某象素邻域灰度均值和梯度值构建二维灰度直方图的平面坐标。对矩阵模型采用改进的区域划分方式,实现细胞核、细胞浆、背景、边缘及噪声信息的有效区分,利用最大熵算法确定两组阈值(s1,t*)和(s2,t*),其中t*为均值–梯度共生矩阵模型在传统区域划分方式[4]下利用最大熵算法所确定的梯度坐标阈值,s1和s2为均值坐标阈值。该算法也对传统的求熵过程采取优化措施,使之更加适合于擅长矩阵运算的MATLAB编程语言。
实验结果表明,该算法实现了显微细胞图像的多阈值分割,成功去除了图像的噪声,运算速度相对较快。
2 基于均值-梯度共生矩阵模型的最大熵多阈值算法
2.1 利用均值和梯度值构成共生矩阵模型
选取一幅噪声显微细胞图像,图像的灰度级为256,图像象素灰度值用f(x,y)表示,图像象素3×3邻域内的灰度平均值用g(x,y)表示,图像象素3×3邻域内象素梯度值用d(x,y)表示,对d(x,y)进行归一化处理,归一化处理结果用d1(x,y)表示。
上式中round为四舍五入运算,max为最大值运算。
可利用g(x,y)和d1(x,y)组成二元组(i,j)来表示图像,设count(i,j)为二元组(i,j)出现的频数,p(i,j)为相应的联合概率密度,N为图像总的象素个数。
按传统利用g(x,y)、d1(x,y)和p(i,j)可构成二维灰度直方图,但得到的直方图质量较差。本文尝试将频数count(i,j)使用对数变换,实现低值灰度的扩展和高值灰度的压缩,表示成数学形式为:
pl(i,j)=log(count(i,j))
图1所示,由g(x,y)、d1(x,y)和pl(i,j)组成的二维灰度直方图效果较好。二维灰度直方图的平面图如图2所示,其中g(x,y)和d1(x,y的取值范围均为1~256。
对图2进行分析,图2可看成矩阵,其中坐标(s,t)为选取的阈值,坐标(s,t)将图2分成a、b、c、d四个部分。通常情况显微细胞图像的背景较亮,目标较暗,即图像的目标灰度均值相对较低,而图像的背景灰度均值相对
较高,对于图像的目标和背景区域内部,由于灰度比较均匀,梯度值相对较小,因此a区域对应目标,b区域对应背景,c区域和d区域对应边缘和噪声。上述分析通过图1可以验证,b区为峰值,对应的图像象素点最多,表示背景,a区对应的图像象素点较少,表示目标,c区和d区对应的图像象素点最少,表示边缘及噪声。
2.2 优化传统的最大熵算法确定梯度坐标阈值
由于图2中(i,j)点在图像中出现的频数为count(i,j),p(i,j)为相应的联合概率密度,图像的灰度级为256,则目标和背景区域的概率值分别为:
定义目标和背景区域的二维熵值:
在文献[8]中,令:
则其中在确定ha的过程中由于出现了i,j,s,t四个变量,即需要运四个for循环语句,所以在程序实现的过程中将消耗大量的运算时间。
本文对传统算法做了相应的改进,通过矩阵求和运算来确定a区域和b区域的熵值,这种算法更加适合Matlab编程语言。
分析(1)式,令x(i,j)=p(i,j)log[p(i,j)],则a区、b区的熵值分别为:
熵的判别函数定义为:
当a区域和b区域的熵的和满足最大值时,即真正代表目标和背景的信息量最大,此时对应的(s*,t*)为最佳阈值,(s*,t*)=Arg max(entropy(s,t)),其中t*为最终确定的梯度坐标阈值。
2.3 改进区域划分方法实现多阈值分割
改进二维灰度直方图平面图的区域划分方法,选取(s1,t*)和(s2,t*)两组阈值,将其分成1、2、3、4四个区域,具体划分方法如图3所示,其中t*为2.2节确定的梯度坐标阈值。
分析图3,由于图像的边缘和噪声信息梯度值较大,对应第4区域,图像的细胞核、细胞浆和背景区域梯度值较小,对应1区、2区和3区,通常认为图像是由亮背景上的暗目标构成,所以1区对应细胞核、2区对应细胞浆、3区对应背景。
定义1区、2区的概率值:考虑总的概率之和为1的约束条件,得出3区的概率值为P3=1-P1-P2,对于4区,由于图像边缘和噪声信息的概率值较小,可忽略不计。
根据2.2节定义x(i,j)=p(i,j)log[p(i,j)],则1区、2区、3区信息熵的值分别为:
图像分割后总的信息熵可写为:entropy(s)=H1+H2+H3,其中entropy(s)属于矩阵形式,在程序实现的过程中,循环次数为s,s取不同的值,对应不同的矩阵entropy(s),下面利用Matlab语言编程序来实现这个过程。
满足熵最大时的循环次数为:o=Argmax(max(entropy(s))),根据累加原理,当累加值cum与循环次数o相等时,确定均值坐标阈值s1、s2,下面利用Matlab语言编程序来实现这个过程。
(s1,t*)和(s1,t*)为最终确定的阈值,f1(x,y)为分割结果图像。
3 实验结果与分析
根据本文提出的方法,采用显微细胞图像进行仿真实验,实验结果如图4所示,图4(a)为原始显微细胞图像,加N(0,760)的高斯噪声;图4(b)为Abutaleb算法[3]分割结果图像;图4(c)是利用灰度-梯度共生矩阵模型最大熵阈值处理算法[4]的分割结果图像;图4(d)是利用本文算法得到的分割结果图像。
比较分割结果图像发现:如图4(b)所示,Abutaleb算法具有较强的抗噪性能,但分割结果图像的边界不够清晰,因为Abutaleb算法采用均值作为二维直方图的平面坐标,均值能够平滑噪声,所以分割结果图像具有较强的抗噪性,但是均值在平滑噪声的同时,也平滑了边界信息,从而影响了边界信息的分割质量,另外Abutaleb算法是单阈值分割算法,不能够满足显微细胞图像多域值分割的要求;如图4(c)所示,利用灰度-梯度共生矩阵模型的最大熵阈值处理算法,分割结果图像的抗噪性低,图像边界不清晰,分割效果差,因为该算法利用梯度作为二维直方图的平面坐标,梯度能够锐化边界,同时也锐化了噪声,所以得到的分割结果图像噪声干扰较多,另外该算法也属于单阈值分割算法,不能够满足显微细胞图像多阈值分割的要求;如图4(d)所示,采用本文算法得到的分割结果图像不仅去除了噪声干扰,而且边界清晰,因为该算法在构建二维直方图平面图的过程中,不仅考虑了均值的抗噪性,同时考虑梯度锐化边界的性能,因此得到了良好的分割效果,另外该算法属于多阈值分割算法,成功的将细胞核、细胞浆和背景有效的区分。
分析运算时间,如表1所示。采用Abutaleb算法分割图像4(a),耗时13259s;采用文献[4]算法,耗时193.698s;采用本文算法,耗时269.597s。由于Abutaleb算法利用传统的求熵方法,需要大量的循环运算,所以利用Matlab编程将消耗相当多的运算时间;文献[4]和本文算法利用改进的求熵方法,将信息熵表达式转变成矩阵的形式,使之更加适合于Matlab编程软件,从而提高了运算速度,但由于文献[4]算法实现的是单阈值分割,而本文算法实现的是多阈值分割,因此本文算法运算时间较文献[4]算法有所增加。
表1也描述了各类分割算法的阈值,对图4(a)应用Abutaleb算法得到一组阈值为(184,197),应用文献[4]算法得到一组阈值为(180,0),应用本文算法得到两组阈值,分别为(128,212)和(200,212)。
本文所有数据均是通过matlab7.1编程语言完成。
4 结论
本文提出了基于均值–梯度共生矩阵模型的最大熵多阈值处理算法,并通过仿真实验比较。得出结论,该算法成功的实现了显微细胞图像的细胞核、细胞浆和背景信息的精确区分,而且边缘轮廓清晰,抗噪性能强,运算时间短。因此本文提出的算法是一种非常有效的显微细胞图像多阈值分割方法。
参考文献
[1]Gonzalez R C,Woods R E,Eddins S L.数字图像处理:MATLAB版[M].阮秋琦,等,译.北京:电子工业出版社,2005:305-307.
[2]Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Computer Graphics,Vision and Image Processing,1985,29(3):273-285.
[3]Abutale A S.Automatic thresholding of gray-level pictures using two-dimensional entropies[J].Comput Vision Graphics Image Process,1989,47(1):22-32.
[4]周德龙,申石磊,蒲小勃,等.基于灰度-梯度共生矩阵模型的最大熵阈值处理算法[J].小型微型计算机系统,2002,23(2):136-138.
[5]芦蓉,沈毅.一种改进的二维直方图的图像阈值分割方法[J].系统工程与电子技术,2004,26(10):1487-1490.
[6]张云飞,张晔.利用二维熵自动确定图像分割的阈值[J].哈尔滨工程大学学报,2006,27(3):353-356.
[7]张云飞,张晔.二维直方图创建的新方法实现图像自动分割[J].光电工程,2007,34(1):76-79.
阈值模型 篇4
1材料与方法
1.1 实验材料
5ml医用注射器9个, 小烧杯9个, 固定胶带一根, 塑料泡沫底座一个, 塑料盆一个, 游标卡尺 (精度0.02mm) , 碘海醇注射液 (350mg/ml, GE Healthcare) 100ml, 生理盐水5 000ml, GE公司64层螺旋CT (light speed VCT) 1台。
1.2 步骤及方法
1.2.1 不同碘浓度血管模型的建立 在9个小烧杯中分别用递增量的碘海醇注射液与生理盐水配成CT值依次递增的9组5ml溶液 (表1) , 充分混匀, 装入9个医用注射器中, 依次编号为1~9号, 固定在塑料泡沫底座上。
1.2.2 不同浓度介质的配制 将碘海醇注射液按逐渐递增剂量加入到装有3 300ml生理盐水的塑料盆中充分混匀, 调整成介质密度分别为30Hu、50Hu、75Hu、95Hu、120Hu、135Hu、210Hu的七种介质, 编号为A至G;另两种介质为空气 (CT值=-1 000Hu) 和清水 (CT值=-2Hu) 。
1.2.3 将不同浓度的血管模型分别放入空气、清水、介质A至G中进行螺旋扫描。扫描参数:120kV, 300mA, 转速0.4s/圈, 层厚0.625mm, 螺距0.531, FOV为21cm, 探测器宽度选用20mm。
1.2.4 扫描图像传到AW4.2工作站, 对血管模型图像数据进行VR重组。
1.3 数据测量
1.3.1 游标卡尺测量血管模型标准内径。
1.3.2 阈值调节测量法 将目标血管管径的1/2~2/3作为感兴趣区 (region of interest, ROI) 测量不同介质中血管模型内CT值, 根据获得的CT值计算标准阈值, 在重建的VR图上调节标准阈值调节测量目标血管管径。 (注:标准阈值的计算来源于我们前期工作及房文皓等[5]研究的CTA图像后处理VR阈值与管径的定量关系) 观察视野 (field of view, FOV) 为6.5cm×6.5cm。
1.3.3 用AVA进行测量 进入AVA血管分析模式, 沿血管中心划直线, 软件自动生成血管模型管径剖面图, 自动显示血管内径最大值以及最小值 (mm) , 取其平均值作为血管管径。
1.3.4 由两名医师在不同时间内分别用两种测量方法完成目标血管测量, 各血管模型重复测量三次, 取其平均数值作为测量数值。
1.4 统计学分析
用SAS 8.0统计学软件分析, 血管模型管径数据用均数±标准差表示;两组比较采用配对设计的Wilcoxon符号秩和检验, 以P<0.05为差异有统计学意义。
2结果
2.1 游标卡尺测量血管模型标准内径为:
10.70±0.04mm。
2.2 不同介质中血管模型的密度
相同的血管模型在不同的介质中测量的CT值不同, 随着介质浓度的增高, 同一浓度的血管模型的CT值逐渐降低 (表1) 。
2.3 VR重组血管模型在不同介质中的标准阈值
根据不同浓度介质中血管模型CT值与阈值的方程式:空气中, undefined;清水中, undefined;介质A中, undefined;介质B中, undefined;介质C中, undefined;介质D中, undefined;介质E中, undefined;介质F中, undefined;介质G中, undefined:血管模型CT值, undefined:标准阈值) 分别调节不同介质中的VR图像显示标准阈值 (表2) , 根据阈值调节后VR图像测量血管模型管径 (表3) 。
2.4 AVA测量结果 (表4, 图1、2)
(1) 表示测得的模型管径轴位图形扭曲, AVA测量有最大值及最小值, 取其平均值
2.5 阈值调节测量与自动测量管径的对比
两组测量值比较采用配对设计的Wilcoxon符号秩和检验 (表5、表6) , 经检验这两种方法所测的管径大小差别具有统计学意义, P<0.000 1。阈值调节测量法与真实管径间差异无显著性 (P>0.05) ;自动测量法与真实管径间差异有显著性 (P<0.05) 。
3讨论
CTA技术是临床诊断血管病变的重要手段[4]。血管径线的测量是重要的观测指标, 各种动脉瘤的大小、血管狭窄及痉挛程度等数据将直接影响临床的处理, 直接影响病人预后[5]。CTA自动血管分析软件 (automatic vessel analysis, AVA) 是将迂曲的血管展开在同一个平面上并以血管中央为中心360°旋转显示血管腔及血管壁的二维图像, 对血管壁斑块大小、性质及血管狭窄或扩张程度测量等效果良好[6,7], 同时AVA测量对介入置入支架型号的选择以及支架置放水平的提高有重要意义。
3.1 自动血管分析软件测量会高估血管管径
本研究结果显示:在空气中测量, 随着血管模型浓度的增高, 其管径呈逐渐缩小趋势, 而在其他介质中, 基本趋势是随着血管模型浓度的增高, 管径呈逐渐增大的趋势, 提示运用AVA测量时, 血管周围的介质对测量的结果有影响。在较高浓度的介质中, 较低浓度的血管模型自动测量的管径轴位图是变形的 (图1) , 提示AVA测量较低浓度血管管径会不准确。另一方面, 无论在何种介质中, AVA测量的所有血管模型的管径均大于其真实内径, 提示AVA血管径线测量会高估血管管径 (图2) 。AVA血管管径测量时所有的数值均偏离真实管径可能归咎于血管内对比剂浓度的差异以及测量方法上的不同[8]。AVA血管管径测量方便、快捷, 但准确性不高[9]。我们的研究结果与文献较一致。
3.2 阈值调节测量可准确反映血管管径
VR根据需要调节不同组织的透明度即阈值充分显示血管及其分支, 血管测量运用该后处理技术最准确[10]。本研究采取的阈值调节测量法不同于常规CTA后处理VR显示图像的测量, 通过优化实验设计, 分别测得不同介质中血管模型的CT值, 计算VR图像显示的标准阈值, 根据调节标准阈值后的VR图像进行测量, 运用该法所得模型管径数值均接近真实管径 (图3、图4) , 说明阈值调节测量在一定条件下可以得到血管真实内径。因为CTA后处理中VR显示阈值与血管的密度相关[5], 而血管模型的密度同时受X线束硬化和不同介质的影响。因此, 血管管径的测量既要考虑血管的密度, 又要考虑到周围介质的不同。所以, 根据血管模型密度的实测值调节合适的显示阈值可保证管径测量的准确性。
综上所述, 通过测量CTA血管内CT值调节显示阈值测量血管内径, 可达到精确的血管径线测量, 这种阈值调节测量法较准确反映真实的血管径线。自动软件测量虽然便捷、重复测量容易, 但是夸大了血管管径, 准确性不高。阈值调节测量法在准确性上优于自动软件测量。阈值调节测量的主要缺点是操作误差, 缩小FOV可减少测量误差。如果能改进自动血管分析软件, 在新型自动软件分析中设计根据血管内对比剂CT值自动确定血管边缘进行测量的软件, 是我们下一步研究的方向。
参考文献
[1]吕发金, 谢鹏, 罗天友, 等.数字减影CT血管成像在蛛网膜下腔出血诊断中的价值.中国医学影像学技术, 2007, 23 (1) :45-48.
[2]Ota H, Takase K, Riki maru H, et.al.Quantitative vascu-lar measurements in arterial occlusive disease.Radio-graphics, 2005, 25 (5) :1141-1158.
[3]吕发金, 罗天友, 谢鹏, 等.数字减影CTA图像质量影响因素探讨.重庆医科大学学报, 2007, 32 (3) :271-274.
[4]Liu Y, Hopper KD, Mauger DT, et.al.CT angiographic measurement of the carotid artery:opti mizing visualization by manipulating windowandlevel settings and contrast material attenuation.Radiology, 2000, 217 (2) :494-500.
[5]房文皓, 吕发金, 展群岭, 等.CTA图像后处理技术对血管管径影响的实验研究.中国临床解剖学杂志, 2009, 27 (3) :325-328.
[6]郭岳霖, 刘国瑞, 郑文斌, 等.64层螺旋CT血管分析软件在脑动脉CTA的应用.现代医用影像学, 2008, 17 (3) :113-116.
[7]Bucek RA, Puchner S, Haumer M, et a1.CTA quantifica-tion of internal carotid artery stenosis:application of lu-minal area VS.luminal diameter measurements and as-sessment of inter-observer variability.J Neuroi maging, 2007, 17 (3) :219-226.
[8]Shigeru S, Shigeru F, Tatsuro K, et al.Accuracy of auto-mate CT angiography measurement of vascular diameter in phantoms:effect of size of display field of view, density of contrast medium, and wall thickness.AJR AmJ Roent-genol, 2005, 184 (6) :1940-1944.
[9]Silvennoinen HM, Ikonen S, Soinne L, et a1.CT Angiograph-ic Analysis of Carotid Artery Stenosis:Comparison of Manual Assessment, Semiautomatic Vessel Analysis, and Digital Sub-traction Angiography.AJNR, 2007, 28 (1) :97-103.
阈值模型 篇5
袁道先采用石漠化(Rocky Desertification)概念来表征植被、土壤覆盖的喀斯特地区转变为岩石裸露的喀斯特景观的过程,并指出石漠化是中国南方亚热带喀斯特地区严峻的生态问题,导致了喀斯特风化残积层土的迅速贫瘠化[6]。王世杰指出石漠化以脆弱的生态地质环境为基础,以强烈的人类活动为驱动力,以土地生产力退化为本质,以出现类似荒漠景观为标志[7]。
喀斯特石漠化形成的影响因素是复杂多样的,其中对喀斯特石漠化形成与演化起关键作用的重要因素,被称为喀斯特石漠化的胁迫因子。这些胁迫因子影响喀斯特生态环境变化,并且相互作用、相互制约,其中,每个胁迫因子随着时间和空间变化而变化,当这变化值达到一定程度,会引起石漠化发生质的变化,这个“程度”值被称为石漠化的胁迫阈值(Stress thresholding)。石漠化各胁迫因子相互作用、相互制约,时刻关系着喀斯特石漠化演变。无论在何种石漠化程度,只要有一个胁迫因子的阶段值超越了胁迫阈值的上、下限值,都会引起石漠化类型系统的连锁响应。阈值研究有助于深刻揭示事物发展的规律和本质特征,控制和把握事物发展的趋势,协调系统的运行与功能,而且对于寻求自然—社会—经济复合系统健康运行的阈值区间以便进行调控均具有理论和实践意义。要保持喀斯特生态系统的持续健康,必须研究确定系统存在的阈值,让决策者和公众了解它的价值和重要性。如何诊断喀斯特石漠化的胁迫因子,利用何种技术手段及如何确定石漠化的“胁迫阈值”,这是当前石漠化研究的基础性课题。
本文以广西都安的澄江、高岭、大兴、拉烈、九渡、拉仁6个典型喀斯特石漠化乡镇为研究区,通过回归统计分析和数学模型,先对三个年份各指标数据[8]进行分析,通过数学拟合方法建立胁迫阈值模型,求取胁迫阈值,分析6个乡镇在近20年时间里石漠化程度演变的情况与特点,进而分析石漠化程度演变与胁迫阈值的相关关系,揭示喀斯特石漠化过程及演变的本质。
1 研究区概况和数据来源
都安瑶族自治县位于广西壮族自治区中部偏西,介于东经107°46′-108°31′,北纬23°48′-24°35′之间。处于云贵高原向广西盆地过渡地带,是喀斯特地貌发育最为典型的地区之一。境内喀斯特地貌广泛分布,土地石漠化严重,生态环境较差,经济水平低,财政困难,是资源环境与社会经济发展矛盾比较突出的典型喀斯特贫困县。2005年都安石漠化的分布占全县土地面积的29.17%,占碳酸盐岩出露面积的93.47%,主要分布于南部县城的周边地区、澄江流域地区及北部地区、东部刁江流域区,其中轻度石漠化的比例为17.39%,中度石漠化的比例为8.5%,强度石漠化的比例为3.28%。历年来,这6个乡镇分别为强度石漠化区、中度石漠化区、轻度石漠化区,且这6个乡镇自然条件相对一致,在石漠化发生发展变化上具备可比性,同时,石漠化程度有差别,利于对比研究。
本研究数据主要来源于统计资料以及遥感影像(1988年10月和1999年9月比例尺为1:10000万的Landsat TM数据,2005年10月1:50000的Landsat TM数据)、都安县1996年的土地利用现状图、都安县1:100000土壤图、都安县地貌图和都安县地质图。
2 研究方法
2.1 喀斯特土地石漠化的胁迫因子体系的构建
在石漠化众多的影响因子中,社会、植被、土壤这三大因素是敏感因素,任一方面的变化都牵制其他方面的变化,而这一系列变化决定着石漠化的程度与变化,彼此之间存在着强烈的胁迫关系。因此,我们主要从社会、植被与土壤三方面构建喀斯特土地石漠化的胁迫因子体系,如表1所示。
2.2 指标数据获取
喀斯特石漠化胁迫因子体系中,B层指标的人均GDP、人口密度、土地垦殖率和植被覆盖率等数据能直接从统计资料上获取。本研究中植被覆盖率的计算方法为:
植被覆盖率(%)=[林地+(牧)草地]/土地总面积×100%;人文素质水平、森林层片结构、土层平均状况和土壤养分状况等指标无法直接从统计资料中获取量化数据,采取赋值法对这四个指标进行量化,即由专家遵循相关原则,依据有关统计资料和实际情况对这四个指标进行赋值,主要分Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级进行评价赋分,分值越高说明情况越佳。
2.3 数据标准化处理
为了消除原始数据的数量级以及量纲的不同而造成的影响,需要对原始数据(Xij)进行标准化处理。首先,用公式(1)对原始数据均值化处理:
然后,为了把数据缩小在[0,1]之间,同时体现各指标的贡献程度,用公式(2)把均值化后的数据再乘以各因子权重,即得出标准化数据:
式中,x为指标值,i为研究区序号,j为指标序号,a为因子权重。这样处理后,数据的数值范围在[0~1]之间。各指标的权重赋值(表1)采用德尔菲法(Delphi),德尔菲法是专家会议评估法的一种发展,其核心是通过匿名方式进行几轮咨询征求专家们的意见。评估、评价领导小组对每一轮的意见都进行汇总整理,作为参考资料再寄发给每位专家,供专家们分析判断,提出新的论证意见。如此多次反复,意见逐步趋于一致,得到一个比较一致的且可靠性较大的结论或方案。上世纪50年代,美国兰德公司首次应用德尔菲法,最初主要应用于未来学,之后逐渐扩大到环境、医疗保健、运输等学科中[8]。
2.4 胁迫阈值模型及胁迫阈值
各胁迫因子的理想阈值是通过各胁迫因子自身数据变化规律得出的阈值,该值反映了因子无外界干扰的理想状态下的变化阈值,没有考虑其它因子对其胁迫变化影响,因此,把理想阈值作为一个基准值,据此分析胁迫因子的胁迫变化关系,才能求出都安喀斯特石漠化程度演变的胁迫阈值。石漠化程度演变是由各胁迫因子的变化引起的,胁迫因子之间存在一定的胁迫变化关系,这种胁迫变化关系可以表示为特定的函数关系,如表2所示。
要求出胁迫阈值,必须确定这些因子间的变化函数的具体方程式,采取数学拟合法来确定这些变化函数的具体方程式,即以各胁迫因子为对象,采用回归分析的方法,建立胁迫因子的线性、多项式、对数、乘幂、指数等回归模型,并进行筛选。
3 实证
3.1 都安石漠化程度演变胁迫指标
经过上述处理方法,得出都安1988年、1999年、2005年石漠化程度演变胁迫指标的B层指标标准化数据,见表3。
在对B层指标进行处理的基础上,求出A层指标的综合值,其方法是将A层指标内的B层指标的标准化值累加再乘以A层指标的权重,即:
式中,y为A层指标的综合值,b为A层指标权重值,k为B层指标序列数。
为统一指标的变化方向,在求综合指标值前需要对一些指标进行变向处理,变向处理的公式为:Aij=1-Xji(A为变向处理后的指标值)。依据上述方法,求得各年份A层指标综合值,如表4所示。
3.2 数据变化分析与理想阈值
为了更好地分析各胁迫因子变化规律,依据时空反演方法,把6个地点3个年份的数据统一组合,设为各因子在18个不同时空的表现,即把每个地点3个年份视为单个因子的三个阶段,把6个地点组合,每个因子就具有了在18个时空发展变化的数据(表5),然后通过对各因子的变化折线图分析找出其变化过程中的特征拐点(特征拐点表示一种状态转向另一种状态的转折点)。在EXCEL中按因子分类对18个阶段值进行升序排序,然后绘出各因子的变化折线图,结合数学上拐点的意义,依据以下原则在图上找出变化特征拐点:(1)在石漠化程度的轻度—中度—强度之间的演变顺序中,主要有两个衔接点,这两个点就是石漠化程度之间演变的阈值,而石漠化程度变化是各胁迫因子变化的综合体现,因此在每个胁迫因子变化过程中选两个特征拐点,视为该因子在不同程度石漠化演变中的阈值点,其对应值称之为理想阈值。(2)两特征拐点的转折角必须是在变化折线图上的最大与次大。(3)当出现多个转折角同大时,按照等份对应原则选取特征拐点,即将18个阶段分为三等份(对应三个石漠化程度),则两特征拐点应在第6阶段和第12阶段附近。
根据以上方法与原则,得出各胁迫因子的变化折线及各胁迫因子理想阈值,如表5所示。
3.3 石漠化胁迫因子胁迫变化关系模型
通过比较各方程的决定系数(R2),并通过相关显著性检验(p值),最后确定采用拟合程度最高(最大R2值和最小p值)的最优回归方程为拟合公式,即为胁迫因子胁迫变化关系模型,通过这个关系模型即可求出胁迫因子的变化阈值。采用数学软件MATLAB来实现拟合过程,最后拟合得出最优胁迫变化关系模型(表6)。
表6中是胁迫影响的变化关系模型,利用这些模型可以求各胁迫指标在其他胁迫指标的胁迫影响下的变化阈值。
把表3中各胁迫因子的理想阈值分别代入表6中的变化关系模型,即可求出各胁迫因子的拟合胁迫阈值(表7)。
通过回归分析及数学拟合得出的胁迫变化关系模型求出的拟合胁迫阈值存在一定的拟合误差,因此必须进行误差修订,以得出更准确的胁迫阈值。我们采取以下公式进行修订:
式中,E(y0)为修订后的胁迫阈值,y0为拟合胁迫阈值,查t分布表,α取0.05,k为变化关系模型系数,n为样本数(在此n=18),sx为标准误差,x0为理想阈值,xi为胁迫因子标准化值,x-为胁迫因子18个阶段的平均标准化值。修订后得出都安瑶族自治县喀斯特石漠化胁迫阈值限域(表8)。
3.4 胁迫阈值限域与喀斯特石漠化程度演变
通过胁迫阈值限域即可求出各胁迫因子在不同石漠化程度类型内的阶段值变化范围(表9)。
从表9中可以看出,各胁迫因子的石漠化程度演变的两大胁迫阈值(即轻度石漠化与中度石漠化相互演变的胁迫阈值与中度石漠化与强度石漠化相互演变的胁迫阈值)之间的变化范围是不一样的,这反映各胁迫因子在喀斯特石漠化程度演变中的反应敏感度不同。为了更直观地体现各胁迫因子胁迫阈值上下限的变化域限,我们将表9中的轻度石漠化<—>中度石漠化、中度石漠化<—>强度石漠化的胁迫阈值的上下限分别相减,求出胁迫阈值的变化域,如表10所示。各胁迫因子胁迫阈值上下限的变化域的大小反映该因子在喀斯特石漠化程度演变中的敏感度,变化域越小说明越敏感,也就是越容易因此胁迫变化。从上述图表可以看出,人均GDP(X1)的域限值最大,其次为植物群落结构(X5)、社会综合指标(Y1)、土壤综合指标(Y3)、植被综合指标(Y2)以及植被覆盖率(X6),说明这些胁迫因子相对其它胁迫因子而言敏感度稍低,即这些胁迫因子使石漠化程度类型从量变到质变的过程相对长。
而土地垦殖率(X4)、人口密度(X2)、人文素质水平(X3)、土体结构(X7)、土壤养分状况(X8)的变化域较小,尤其是土地垦殖率(X4)、人口密度(X2)、人文素质水平(X3)这三个因子,说明这些因子十分敏感,容易使喀斯特石漠化发生质的变化。那么我们在规划治理的时候,要十分重视这些胁迫因子的变化发展情况,并采取相应的措施。
4 结语
喀斯特石漠化发展变化是在其系统内各胁迫因子的胁迫作用下发生的。喀斯特石漠化最大变化就是从一个程度类型演变到另一个程度类型,而这些程度类型演变是由各胁迫因子的变化引起的。并非胁迫因子的一切变动都会引起石漠化程度类型的变化,只有当各胁迫因子的变化超越了其胁迫阈值时才会引起喀斯特石漠化程度的演变。胁迫阈值影响胁迫因子对石漠化程度演变的作用。各胁迫因子的石漠化程度演变的两大胁迫阈值之间的变化范围(阈值变化域)是不一样的,这反映各胁迫因子在喀斯特石漠化程度演变中的反应敏感度不同。各胁迫因子胁迫阈值上下限的变化域的大小反映该因子在喀斯特石漠化程度演变中的敏感度,变化域越小说明越敏感,也就是越容易因此胁迫变化;越敏感,就越容易使喀斯特石漠化发生质的变化。阈值运用于生态胁迫因子研究成果比较多,但综合运用于自然—社会—经济复合系统还不够成熟,广西都安瑶族自治县的6个喀斯特石漠化乡镇的石漠化胁迫阈值的典型研究发现,土地垦殖率、人口密度等因子的变化域较小,为进行石漠化规划治理提供了依据,但该方法还需要更多的实证研究来完善。
参考文献
[1]May R M.Thresholds and breakpoints in ecosystems with amultiplicity of stable states[J].Nature,1977(269):471-477.
[2]Bennett A,Radford J.Know your ecological thresholds NativeVegetation Research and Development Program,Land and WaterAustralia,Canberra Thinking Bush 2,2003.
[3]赵慧霞,吴绍洪,姜鲁光.生态阈值研究进展[J].生态学报,2007,27(1):338-345.
[4]Noy-Meir I.Stability of grazing systems:an application ofpredator-prey graphs[J].Journal of Ecology,1975,63(2):459-481.
[5]柳新伟,周厚诚,李萍,等.生态系统稳定性定义剖析[J].生态学报,2004,24(11):2635-2640.
[6]Yuan Daoxian.Rock desertification in the subtropical karst of SouthChina[J].Z.Geomorph.N.F.,1997(108):81-90.
[7]王世杰.喀斯特石漠化概念演绎及其科学内涵的探讨[J].中国岩溶,2002,21(2):101-105.
阈值模型 篇6
1 小波去噪原理
小波变换是一种重要的时频描述方法,具有较好的时频局部化性能。由小波变换理论可知其具备以下特点[2]:
(1)时频局部化。即小外波变换可定位出信号发生突变的时间和位置。
(2)多分辨率。即小波变换可以在不同尺度上刻画信号的局部性能,如边缘和断点等。
(3)选基灵活性。即小波变换可以根据信号本身的特点,选择适当的小波基函数,以便更好地逼近原始信号。
(4)去相关性。信号经小波变换后可以使大部分能量集中在少数几个小波系数上。
与传统的去噪理论相比,小波变换的时频局部化和多分辨率性能够在去除信号噪声的同时,较好地保留信号的突变部分或图像的边缘和纹理信息。随着小波分析理论的逐渐成熟,其应用领域也越来越广泛。小波信号去噪的本质在于根据信号和噪声变换后的系数在不同尺度上具有不同性质这一原理,采用适当的数学方法对含噪信号的小波系数进行处理,其实质在于减少或去掉有噪声产生系数的同时,最大限度地保留信号产生的系数,最后根据小波的性质,把经过处理的小波系数重构以得到去噪后的信号。从数学角度看,信号的小波去噪是一个函数逼近问题,即是如何在由母函数平移和伸缩展开的函数空间中,根据一定衡量准则,寻找对原始信号的最真实的逼近,从而实现原始信号和噪声信号的区分,达到信号去噪的目的。从信号处理角度来看,小波去噪是一个信号低通滤波的问题。因此,小波去噪可以看成低通滤波和特征提取的结合[2,3,4]。
2 小波阈值去噪的一般步骤
一个含噪的一维信号的模型可以表示成
其中,f(i)是真实信号;e(i)是噪声信号;s(i)是含噪信号,i=0,1,…,n-1。
在实际工程中,有用信号通常表现为低频信号或者一些比较平稳的信号,而噪声信号通常表现为高频信号。去噪过程可以按以下方法处理:首先对信号进行小波分解,以3层为例,如图1所示,那么噪声通常包含在cd1,cd2和cd3中,接着对分解后的小波系数进行阈值处理,利用处理后的小波系数重构信号,这样就达到了去噪的目的。
由上可得具体的阈值去噪步骤为[5]:
(1)对带噪声的语音信号进行小波变换,得到不同尺度上的子波信号,将有用信号和噪声分开。这过程中涉及以下几个重要部分:
1)确定小波基及其阶数。小波基的阶数不同,则表现信号局部特点的能力也不同。一般情况下,阶数越高越能很好地表征信号局部特点,但计算量也会相应变大,当阶数>5阶时,小波基阶数的提高对提高表征信号能力的影响较小,因此一般选取阶数约为5~8。
2)确定小波变换的次数。当信号中白噪声的含量较多时,小波变换尺度要大一些,即小波变换次数要多一些,但相应地会增大计算量;相反的当信号中含噪声较少时,小波变换的尺度即变换次数可以少些,计算量也会相应的减少。
3)小波变换。通过选取合适的小波变换参数进行小波变换,就可得到不同尺度上的小波信号。
(2)确定各层小波信号的去噪阈值门限。
(3)选取阈值函数。
(4)小波逆变换。进行小波逆变换将经过阈值处理的小波系数进行信号重构,得到恢复的原始信号的估计值。
在上述的阈值去噪步骤中,合适的小波基、小波分解层数、阈值以及阈值函数直接影响去噪效果,其中阈值和阈值函数的选取至关重要。
3 小波阈值函数
3.1 传统的阈值函数
Donoho提出基于小波阈值的去噪方法,该算法在最小均方差意义下可以达到近似最优。根据其算法可以得出对小波系数处理的软、硬阈值函数。
硬阈值函数为
将小波分解后的系数的绝对值与阈值λ进行比较,小于阈值的点变为0,大于或等于阈值的点保持原值。在硬阈值处理过程中,由于硬阈值函数在整个小波区域内是不连续的,在λ和-λ处存在间断点,因此得到的估计小波系数值连续性差,可能引起重构信号的振荡。
软阈值函数为
软阈值方法处理后,小波系数值虽然连续性好,不存在间断点问题,易于处理,但由于当小波系数较大时,得到的估计小波系数值与原来的小波系数值有固定的偏差,也会给重构信号带来不可避免的误差[6]。此外,软阈值对大于阈值的小波系数采取恒定值压缩,这与噪声分量随着小波系数增大而逐渐减小的趋势不相符。
在式(2)和式(3)中,wj,k表示信号分解的小波系数;表示阈值方法得到的小波系数估计值;λ为阈值
其中,σ为噪声标准差,可以用以下经验公式进行估计
3.2 改进的阈值函数
由于软、硬阈值函数自身都存在一些缺陷,使重构信号存在一定的偏差,并且还会出现振荡,因此需要对阈值函数进行改进,改进的思想是要让小波系数的偏差尽量减小,要在小波空间中连续,还要具有高阶导数,为此,本文引入一种改进的阈值处理函数[7,8]
式(6)中,m、n、k是改进阈值函数的调整因子,它们增强了阈值函数的灵活性。参数m、n决定了阈值函数的形式,参数k的取值在0~1之间,若k取0,则该阈值函数相当于软阈值函数,若k取1,则该阈值函数相当于硬阈值函数。因此,可调节参数k能够克服硬阈值函数的不连续性和软阈值函数在处理小波系数时存在的恒定偏差,同时也保留了软、硬阈值原有的优点。改进的阈值函数具有无穷阶连续导数,为小波自适应阈值的选取提供了基础。改进的阈值函数图如图2所示。
4 自适应阈值选取算法
传统的阈值函数会产生过扼杀现象,在实际应用中效果欠佳。由于噪声具有负奇异性,其幅度和稠密度随尺度增加而减小,但信号则相反。随着尺度级数的增加,由噪声所控制的模极大值的幅度和稠密度会快速减少,而信号的模极大值的幅度和稠密度会明显增大。可见,在同一级尺度上都采用同一阈值显然不合适,因为在较低尺度上,会去除有用信息,在最大尺度上会留下部分噪声[9,10]。
自适应阈值是一种采用最小风险量所对应的小波变换系数作为阈值的自适应阈值选取算法。由巴什瓦定理可知,小波分解后系数的平方具有能量的量纲,因此,将分解后的小波系数平方后排序,给定一个阈值,求出对应的风险值,即得到它的似然估计,进行非似然最小化,得到所选的阈值,这是一种软阈值估计器。其具体算法[11]为:
(1)将每一层的小波变换后的系数经过平方由小到大排列,得到一个向量w=[w1,w2,…,wn],其中w1≤w2≤…≤wn,n为小波系数的个数。
(2)计算风险向量R=[r1,r2,…,rn],则
其中,ri为引入的风险向量元素,将上式多次迭代得出最小的ri,记为r0,并求出与之对应的wi记为w0。
(3)计算阈值λ=σ(w0)1/2,其中σ的求解见式(4)。
按照上述算法将每一级尺度都看作相互独立,计算出一个与之最匹配的阈值进行降噪,最后再用各个尺度上降噪处理后的小波系数来重构信号。
5 仿真实验分析
为验证改进阈值方法的去噪效果,通过Matlab中的Wnoise函数构造一个长度为含噪信号,其噪声标准差为2,然后利用Sym8小波作为小波函数,分解层数为5层,采用改进阈值函数和自适应阈值去噪方法进行去噪,并与传统的软、硬阈值函数去噪方法进行比较,下面给出了信号在3种阈值函数下的去噪效果图。
表1给出了含噪信号经过3种不同阈值函数的信号去噪方法处理后的信噪比和标准差的数据对比。
通过从以上仿真图和数据分析对比表可以看出,采用改进阈值函数和自适应阈值的信号去噪效果要优于传统的软阈值去噪和硬阈值去噪效果,能有效地克服软阈值去噪方法中由于估计值与真实值之间的恒定偏差而带来的去噪误差,也能有效地抑制硬阈值去噪方法中易产生的信号振荡现象,较好地保留了信号的细节部分。
6 结束语
根据小波阈值去噪基本原理,提出了一种改进阈值函数和自适应阈值的信号去噪方法,改进的阈值函数兼顾了硬、软阈值函数的优点,同时又在一定程度上弥补了两种方法存在的不连续、振荡等缺陷。通过仿真实验可以看出,去噪效果无论在视觉上还是在去噪后信号的信噪比上都有了明显的改善,而且较好地保留信号的细节部分,提高了信号去噪的恢复能力。
摘要:根据小波阈值去噪的基本原理,提出一种基于改进阈值函数和自适应阈值的信号去噪方法,该方法兼顾了硬、软阈值函数的优点,同时又在一定程度上弥补了传统阈值去噪方法的缺陷;引入自适应阈值选取算法,有效地解决了在每一级尺度上都采用同一阈值的不足。实验表明,此方法提高了信号的信噪比,去噪效果有明显的提高,克服了采用硬阈值法去噪效果不佳和软阈值法造成信号失真的缺点,充分展示了改进去噪方法的优越性。