可变模糊识别(共6篇)
可变模糊识别 篇1
随着辽宁省社会经济的发展,人口的增长,城市化水平和人民生活水平的不断提高,工农业生产和城乡生活用水不断增加,水资源供需矛盾日益突出。水资源短缺问题己成为制约辽宁省国民经济发展的重要因素,成为老工业基地社会经济持续、快速、健康发展的“瓶颈"[1]。辽宁省水资源安全状况,不仅直接影响资源、环境和生态安全,社会经济安全,甚至影响到粮食安全、国家安全等,因此促进水资源与社会经济的和谐发展具有非常重要的战略意义。2011年,辽宁省水文会议分析总结了“十一五"期间辽宁省水资源、水文能力与水安全等工作进展,并要求全省要按照“十二五"期间辽宁水文确立的目标与任务,不断提升水服务社会能力,提升水资源可持续的发展能力,全面构建“五大服务体系"和“三大保障体系"。水资源安全对辽宁省社会经济可持续发展的制约已引起各级政府部门的高度重视,成为水文学术界和相关管理部门研究的热点[2]。
本文在研究了相关文献资料的基础上,采用迟静静、陈彬对水资源安全的定义:某一区域水资源对其社会、经济、生态环境可持续发展的持续支持状态[3]。近年来,我国对水资源安全的理论研究不少。2003年,韩宇平、阮本清、解建仓等运用多层次多目标决策和模糊优选理论对我国部分省级行政区的水资源安全状况进行了评价[4]。2010年,尹志杰、管玉卉利用分析理论构建了水资源安全综合评价模型,对南京市水资源安全状况进行了综合评价[5]。2012年,高媛媛、王红瑞等应用改进的层次分析法和基于因子分析的聚类分析法评价分析了泉州市近几年的水资源状况,并对2015年和2020年的水资源安全进行了预测[6]。目前,对水资源安全评价分析的方法主要有层次分析法、系统动力学法、集对分析法、物元分析法等。本文采用陈守煜教授针对水资源系统的复杂性与不确定性最新提出的可变模糊识别模型,该方法在水资源安全评价研究中的计算更简便,评价结果更准确[7]。
1 辽宁省水资源安全现状
近年来随着城市人口的增长、城市建设的发展,辽宁省水资源面临着严峻的挑战。辽宁省用水指标与全国平均情况的比较见表1。从表1可知,辽宁省人均日生活用水量、万元GDP耗水量、单位面积农田灌溉用水量均远低于全国平均水平。由此可见,辽宁省的节水工作相对于全国来说做得相对较好。但2009年辽宁省人均水资源量仅为396m3,仅相当于全国平均水平的21.8%,远低于国际最低标准线1000m3。因此,辽宁省水资源严重匮乏,供需问题严重,属于重度缺水省份,水量安全问题迫在眉睫。由表1可知,辽宁省的水质达标河段低于全国平均水平的8%,水质安全状况令人堪忧。
2 可变模糊识别理论的模型
可变模糊识别模型[8]为:
undefined
式中,υA(μ)j为方案集(j=1,2,…,n;n为方案数)综合相对优属度;α为优化准则参数,α=1为最小一乘方准则,α=2为最小二乘方准则;dgj为方案j的距优距离,undefined;dbj为方案j的距劣距离,undefined;ωi为指标i的权重;μA(u)ij为方案j指标i的相对隶属度;p为距离参数,p=1为海明距离,p=2为欧氏距离。
式(1)中,α,p可搭配为以下4种模型:①α=1,p=1,式(1)变为:undefined,相当于模糊综合评判模型。②α=1,p=2,式(1)变为:undefined,此时相当于理想点模型,是又一特例模型。③α=2,p=1,式(1)变为:undefined为sigmoid型函数,可用以描述神经网络系统中神经元的激励函数。④α=2,p=2,式(1)变为:undefined,此时为模糊优选模型。最后计算出4个可变模型的均值,得出安全度。
3 辽宁省水安全可变模糊识别评价
3.1 评价指标体系的构建
在研究水资源安全的过程中,一般将水资源安全系统看成一个由自然、环境、社会、经济子系统耦合而成的复合系统,各个子系统间相互作用,相互影响,因此应综合考虑每个子系统的特征,然后进行分析。据此,本文运用“压力—状态—响应”模式(PSR),根据选取指标的代表性、简明性、可操作性、综合性、可靠性原则构建了水资源安全综合评价指标体系(表2),测定了辽宁省水资源安全的权重。
注:①地均水资源量=水资源总量/土地面积;②水资源供需比=水资源总量/总供水量。
3.2 权值、相对隶属度的确定
在水安全评价指标体系中,各个评价指标所发挥的作用有所不同,因此其重要程度也存在差异,这就需要选择一定的方法,先确定各个指标的权重。本文运用的熵值法是较客观的权系数赋权方法,其优点在于最大程度地利用了评价方案的目标值或属性值来计算各目标的权系数,指标权重具有客观性和综合性,但在极值或负值的情况下也会有一定的缺陷,因此本文选取巴音达拉提出的改进熵值法来确定指标权重[9],计算各准则层下各评价指标的权重,见表2。在进行安全度综合评价时,决策的目标通常分为特征值越大越优、越小越优型两类,相对隶属度是以参考连续系统上的两极和中介的线性变化作为相对统一的参照系来衡量指标对系统的优属度。
相对隶属度计算公式为:
undefined
式中,xij为方案j目标的实际值;undefined为方案集中目标i的最大特征值;undefined为方案集中目标的最小特征值。
3.3 辽宁省水安全现状的评价
根据各项指标,运用可变模糊识别模型,本文计算辽宁省水资源安全结果见表4。水资源安全判断标准是根据国内外相关规定与水资源安全的的相关文献和辽宁省的实际情况,最后结合辽宁省水资源安全多年的平均情况发展水平确定其水资源—社会经济可持续发展评价指标分级标准,见表5。从1—10级分别为极端不安全、严重不安全、中度不安全、轻度不安全、濒临不安全、勉强安全、初级安全、中级安全、良好安全和优质安全。
4 评价结果分析
4.1 辽宁省水资源安全各子系统分析
水资源压力系统:从水资源压力系统的评价结果来看,该系统近十年安全度起伏较明显。总的来说,2000—2005年辽宁省水资源压力呈大幅上升趋势,2005年后的下降趋势明显。受地形气候等因素影响,辽宁省水源主要取决于大气降水,水资源量时间分布不均,2000年是建国以来最严重的干旱年,而这5年辽宁省降水量呈上升趋势,2005年比2000年降水量高出338.8亿m3,人均水资源量上升了1.7倍,地均水资源量上升了1.75倍。辽宁省积极采取水资源保护和政策调控,提高水资源利用率,节约用水,从而使万元GDP水耗下降了71万m3,人均日生活用水量也在降低,说明这5年水量压力在减小。水资源压力系统安全度2005年达到近十年顶峰,属于初级安全。结合各压力指标数据分析原因,2005年全省平均降水量比多年平均多8.9%,属平水偏丰年份。因此,2005年辽宁省的人均水资源量比多年平均高58.4%,地均水资源量也高58.1%,污径比和污水排放量占地表径流量的7.9%,小于其他年份,所以2005年水资源压力安全度比其他年份高。2006—2008年辽宁省水资源压力安全度在勉强安全限度内上下浮动,而在2009年辽宁省水资源压力安全度又有明显下降。2009年辽宁省水资源总量仅为170.98亿m3,比常年低,仅高于2000年和2002年干旱年;污径比是2005年的2.1倍,耕地化肥施用量(折纯)呈逐年递增趋势,2009年高达327.1kg/m2,显然水质压力大幅增加,因此该年的水资源压力安全度大幅下降,濒临不安全。
水资源状态系统:从水资源状态系统看,评价年总体呈上升趋势,2000年辽宁省水资源状态安全度最低,仅为0.361,2007年安全度最高。2000年辽宁省污水排放量为10年最高的28.6亿t,而工业废水排放达标率仅为79.96%,远远低于其他年份,水质达标河段的百分比仅为21.3%,低于多年平均的15%,结合水资源压力系统分析可知,2000年水量和水质均不安全。水资源安全情况直接制约着社会经济的发展,该年辽宁省的GDP仅为GDP最高年份2009年的32%,农田灌溉用水量也较大。根据产业结构可见,该年工业所占比重为多年中较大,这就导致需水量大而可供水量少,进而致使2000年水资源供需比为近年最低值的1.007。2007年辽宁省完成水土流失综合治理面积13.72万hm2,使河流径流量增大。此外,大伙房水库工程建设取得重大进展,“引细入汤"工程全面完成并于当年11月份正式通水,这些使地表水可利用水资源相对丰富,水资源状态安全度径流系数高达0.402。而2009年辽宁省的水资源状态系统安全度有所降低,其原因是2009年平均降水量为309.1mm,比多年均值479mm少35.5%,主要控制站径流比常年大量减少,河道断流严重,全省27座大型水库总蓄水量45.59亿m3,比2008年同期的61.29亿m3少15.70亿m3,致使水资源供需比仅为0.197。值得一提的是,近10年来辽宁省人均GDP呈逐年递增趋势,2009年人均GDP达到近10年的最高值35222.27元/人,比10年前提高了74.3%;而工业废水排放达标量近年来呈上升趋势,2009年却有所下降。辽宁省在经济得到大力发展的同时,水资源的压力也有所增大。
社会响应系统:从表3可知,辽宁省对社会响应系统的评价结果呈整体上升趋势,2001年最低,2006年达到最高值的0.573。2001年辽宁省环保投资仅为723150万元,低于近10年平均水平的1/2。此后,环保投资呈逐年上升趋势,2006年投资额为2538849万元。辽宁省第三产业对水资源压力较小,第二产业对水资源的压力较大,第三产业的比重自2004年以来呈上升趋势。2005年国家提出“加快振新东北老工业基地”的政策,辽宁省第二产业比重开始上升。为了在环渤海竞争中抢占先机,2008年和2009年是辽宁省工业化的“补课阶段",工业总产值分别达到2万亿元、2.8万亿元。因此,辽宁省水资源压力有所增大,该系统安全度有所下降,而社会经济得以发展壮大,自2005年开始人均GDP逐年大幅度增加。根据居民恩格尔系数逐年减小来看,近年来辽宁省居民生活水平呈逐渐上升状态。
4.2 辽宁省水资源安全综合分析
2000—2009年辽宁省水资源安全状况从轻度不安全上升到濒临不安全,再到勉强安全,2005年达到极值,随后4年又呈下降趋势。究其原因,水资源压力系统安全度2000—2005年呈上升趋势,2005年达到最高值0.629,2005年后又开始下降;水资源状态系统安全度2000年最低,2005年为0.548,仅略逊于2007年;社会响应系统安全度2000年为0.440,仅好于2001年,而2005年略低于2006年,居第二位。因此,2005年辽宁省的水资源安全度最高。从产业结构来看,2000—2005年辽宁省第三产业结构比重由2000年的39%上升到41%。由此可见,对水资源污染较大,且耗水量多的第一产业、第二产业比率明显下降,而耗水量较小的第三产业比重上升。2005年之后辽宁省第二产业比重大幅上升,最高达到了52.4%。随着产业结构的变化,水资源的压力也随之变化。辽宁省人口增长速度之快,加上大量外来人口涌入,城镇化进程加快,人们对水资源的需求量加大,从水资源供需呈上升趋势,2005年达到最高值2.83,此后略有下降。随着社会经济的快速发展,2009年辽宁省的人均GDP比2000年增加了2倍,虽然经济增长,耗水量却逐年降低,万元GDP耗水量2009年比2000年降低了65.2%,但总用水量仍呈增加趋势,2009年总用水量是2000年的1.05倍。2006—2009年由于社会、人口、经济的快速发展,但辽宁省水资源压力增大,安全度小幅下降。
5 结论
本文采用可变模糊识别模型对辽宁省水资源安全状况进行综合评价。可变模糊识别模型在基本模型的基础上通过变换参数,组成四个新模型,分别对同一事物进行评价,并取得平均值,以此提高了评价结果的准确度和可信度。因此,基于可变模糊识别模型的评价方法在水资源安全综合评价中具有一定的优越性和较高的应用价值。
本文的研究结果表明,2000—2009年辽宁省水资源安全状况由轻度不安全上升到濒临不安全,再到勉强安全,2005年达到最高值,之后有小幅下降。通过对评价结果的分析可知,要提高辽宁省的水资源安全状况,必须在加大水利工程建设的同时积极调整产业结构,大力发展第三产业,以减轻对水资源的压力;加大科技投入,提高水资源利用率;采取以防为主、防治结合的措施减少对水质的污染,促进水资源与社会经济的和谐发展。
摘要:水资源的安全问题已成为制约辽宁省社会经济可持续发展的重要因素。选取16项评价指标构建指标体系,选取辽宁省2000—2009年的统计数据,采用改进的熵值法确定指标权重,并划分评价等级,运用可变模糊识别模型分别对其指标体系进行逐层评价。结果表明,评价期间辽宁省水资源安全状况较严峻,但总体呈现出改善的趋势。水源安全指标的系统分析显示辽宁省的水资源面临很大压力,但大部分状态和响应指标逐渐改善。提出针对性的改善水资源安全的建议,为辽宁省水资源管理和调控提供决策依据。
关键词:辽宁省,水资源安全,可变模糊识别
参考文献
[1]韩友志.辽宁省水资源可持续发展战略的研究[D].哈尔滨:东北林业大学硕士学位论文,2003.
[2]盖美,赵晓梅,田成诗.辽宁沿海经济带水资源—社会经济可持续发展研究[J].资源科学,2011,33(7):1225-1235.
[3]池静静,陈彬.基于TOPSIS的灰色关联法在水资源安全评价中的应用研究[J].水土保持通报,2009,29(2):155-159.
[4]韩宇平,阮本清,解建仓.多层次多目标模糊优选模型在水安全评价中的应用[J].资源科学,2003,25,(4):37-42.
[5]尹志杰,管玉卉.南京市水资源安全综合评价方法研究[J].水电能源科学,2010,28,(6):16-18.
[6]高媛媛,王红瑞,许新宜,等.水资源安全评价模型构建与应用——以福建省泉州市为例[J].自然资源学报,2012,27,(2):204-214.
[7]陈守煜.可变模糊集合理论与可变模糊集[J].数学的实践与认识,2008,38(18):146-153.
[8]王春泽,崔振才.区域水资源与社会经济协调程度评价研究[J].水文,2004,(6):25-29.
[9]巴音达拉.基于熵值法和景观模型的精河县生态环境质量评价及预测研究[D].乌鲁木齐:新疆大学硕士学位论文,2008.
地下水水质评价可变模糊评价法 篇2
地下水水质现状评价是地下水资源评价和保护的重要内容,通过对地下水水化学资料的分析,可以科学地评价区域地下水体的质量状况。可为防治评价区内水质恶化和制定水资源管理决策方案提供科学依据,对评价区内地下水资源的可持续开发利用和综合管理有很好的指导作用[1]。目前地下水水质评价的方法有很多,主要有属性识别、综合指数法、人工神经网络模型、模糊综合评判法、灰色聚类法等。由于受到诸多因素的影响和制约及方法自身存在的不足,至今仍没有一个广泛认可的评价模型。如综合指数法中权重不好确定和忽略了水质分级界线的模糊性;人工神经网络需要的样本数多, 网络结构的优劣因人而异;模糊综合评判中隶属函数和权重矩阵的构造;灰色聚类法中白化函数的选择和聚类权的确定往往因人而异,造成评价模式难以通用。本文在陈守煜教授可变模糊集理论基础上[2,3,4,5],提出地下水水质评价的可变模糊评价方法。该方法能够科学、合理地处理水质分级界线的模糊性,确定样本指标对各级指标标准区间的相对隶属度,为了增强二元比较分析法确定权重的可操作性,使其应用更为便捷,提出二元比较模糊决策分析简捷方法,以此确定各指标权重;此外,该方法能够通过变化模型及其参数,全面地给出样本的评价等级,提高对样本等级评价的可信度。
1 相对差异函数模型
设X0=[a,b]为实轴上模糊可变集合
根据模糊可变集合
x落入M点右侧时,其相对差异函数模型为:
x落入X区间外时
公式(1)、(2)中β为非负指数,常取β=1,即相对差异函数模型为线性函数。
从以上分析可知,当x=a、x=b时,
2 二元对比确定指标权重方法
二元对比模糊决策分析法是以我国语言与思维习惯为基础,以模糊集的余集定义为求解手段,严格遵循一致性检验条件,针对无结构决策问题而提出的一种有效简便的求解方法。该方法数学理论严谨,多次试验数据表明确定的权重有代表性,依据专业知识确定指标重要性二元对比后即可进行权重的确定。为了增强二元对比分析法确定权重的可操作性,使其应用更为便捷,本文在系统介绍二元比较模糊决策分析基础上,引申出其简捷方法。
2.1 一致性检验
二元比较判断矩阵的一致性问题是非结构决策合理与科学性的基础,被研究的对象组,若在属性排序明确的前提下不需要进行一致性检验;在最重要指标明确时,为简化操作,可以不进行一致性检验,直接按简化方法求解;若各研究对象属性排序模糊不定的情况下,必须进行一致性检验,具体的检验原则可参考文献[6]。
一致性检验后,所得模糊标度矩阵各行和数由大到小排列,此排序即为指标集在满足一致性条件下关于重要性的排序,具体证明可见[7]。
2.2 定性指标权重的确定
指标集D就模糊概念
B称为指标集D关于A对重要性二元比较定量排序一致性模糊标度矩阵,bkg表示指标g与指标k相对于重要性的二元比较。
由于对重要性二元比较定量排序矩阵一致性模糊标度矩阵的对角线元素表示自身的比较,其元素值为0.5,它将元素分为上下两个三角,上三角中的元素值从对角线元素0.5开始,每行元素值自左向右递增,每列元素自下向上递增,因此上三角矩阵自对角线元素0.5开始的每一行元素满足:
由互补性条件[8]得到下三角矩阵,见式(7)。
根据矩阵B构造相及矩阵Φ:
重要性的相对比较是权重的一种测度,按照模糊集的特点测度上限为1,故有序相及矩阵Φ的上三角元素均定义为1,对矩阵Φ每一行取小,即Φ的第一列元素。
式(9)给出了指标集对重要性的相对隶属度向量即非规一化权向量。对其规一化处理,得指标权向量:
按照我国的思维习惯确定语气算子,根据公式(6)的两个边界值0.5与1,在同样与无可比拟之间插入语义逐渐加重的语气算子,相应模糊标度在0.5与1.0之间以线形增值0.05插入模糊标度值。已知模糊标度根据式(9)计算可得相应相对隶属度,为便于应用模糊概念语气算子与模糊标度值、相对隶属度间的关系归入表1。也可根据实际情况,将表1进一步细化。相对隶属度即非规一化权重已知的前提下依据式(10)确定指标权重。
3 地下水水质模糊可变评价方法
3.1 方法的建立
设有n个待识别的水质评价对象
评价对象j的特性用m个指标特征值来表示
则n个评价对象的全体指标特征可用m×n阶矩阵表示
式中:xij为第j个评价对象第i个指标的特征值;i=1,2,…,m;j=1,2,…,n。评价对象依据m个指标按c个级别的指标标准特征值进行识别,则有m×c阶指标标准特征值矩阵
式中:yih为级别h指标i的标准特征值,h=1,2,…,c。
参照指标标准值矩阵和实际情况确定水质评价可变集合的吸引(为主)域矩阵与范围域矩阵
根据各级别的实际情况确定水质评价吸引域[aih,bih]中
根据式(1~3)计算相对差异度,再由式(4)计算指标对h级的相对隶属度矩阵
设m个指标的权向量为
满足
参考连续统上任一点x指标特征值i的相对隶属度
模糊可变评价模型为:
式中:iu′h为评价对象关于等级概念A对吸引性质
通常情况下模型(21)中α和p有4种搭配:
(1)当α=1,p=1时,式(21)变为:
式(21)为一模糊综合评价模型,是一个线性模型,属于模糊可变评价模型的一个特例。
(2)当α=1,p=2时,式(21)变为:
此时式(21)为理想点模型,属于模糊可变评价模型的又一个特例。
(3)当α=2,p=1时,式(21)变为:
式(21)为Sigmoid型函数,可用以描述神经网络系统中神经元的非线性或激励函数。
(4)当α=2,p=2时,式(21)变为:
此时模糊可变评价模型变为模糊优选模型。
由此可见,模糊可变评价模型是一个变化模型,在可变模糊集理论中是一个十分重要的模型,可广泛应用于模糊概念的识别问题。通过不同参数组合,可对评价成果的可靠性进行验证。
由可变评价模型可得非归一化的综合相对隶属度矩阵
将式(30)归一化处理得到综合相对隶属度矩阵
式中:
级别特征值公式为:
3.2 求解步骤
(1)根据已有观测资料及评价标准(依据),确定待评价对象现状指标特征值与指标标准值矩阵X、Y;
(2)参照指标标准值矩阵Y结合实际情况确定水质评价可变集合的吸引(为主)域矩阵与范围域矩阵Iab、Icd;
(3)结合实际情况确定水质评价吸引域Iab中
(4)根据式(1)~(3)计算相对差异度矩阵,再由式(4)计算指标对h级的相对隶属度矩阵Uh;
(5)通过二元比较法确定指标的权向量;
(6)采取不同的参数准则,利用模糊可变评价模型(21),求得综合相对隶属度矩阵并作归一化处理;
(7)求级别特征值矩阵,并据此做出评价。
4 应用实例
4.1 实例应用1
以邯郸市化工区地下水水质资料为例[9],该区主要有镀锌厂、树脂厂和磷肥厂等,共有7个水井测点,每一测点测量水的硬度、SO
mg/L
根据表2可得邯郸市化工区地下水水质的现状指标特征值与指标标准值矩阵X、Y,结合各指标物理意义确定吸引(为主)域矩阵Iab、Icd,其中指标为开区间的吸引域与范围域的确定以相邻指标区间距离作为参考距离。点值矩阵M为吸引域矩阵Iab中相对差异度等于1的点组成的矩阵,按物理意义分析可得。
五项指标重要程度与研究区域厂区结构有关,综合考虑各项因素确定CL-最为重要,以其作为标准与其他各指标进行二元比较分析,得到二元比较判断矩阵并作一致性检验,氟与磷均处于“同样”与“稍稍”边缘,硬度与SO
判断矩阵Iab、Icd与M判断样本特征值xij在Mih点的左侧还是右侧,据此选用不同公式计算差异度矩阵及相对隶属度矩阵,采用不同参数组合根据模糊可变评价模型计算级别特征值,为增强结果的可比性,本次计算考虑了二元比较确定的权重及文献[9]中指标权重两种情况,分别为权重1权重2,取各次评价结果平均情况进行等级评价,等级判断标准H<1.67为I级,1.67≤H<2.5为II级,H>2.5为III级。评价结果见表3。将计算所得级别特征值从大到小排序,邯郸市化工区地下水水质污染程度排序依次为:测点3、测点2、测点5、测点1、测点6、测点4和测点7,可见测点3污染情况最为严重,测点7污染程度较轻。从表中可以看出,两组权重计算所得4组评价结果基本一致,级别特征值稳定在一个范围内,波动较小。不同参数组合下的评价结果稳定,从而说明了可变模糊评价法具有较高的可靠性。
将上述评价结果与文献[10]所采用的属性识别法及综合评价法,文献[9]所采用的改进TOPSIS评价法的计算结果进行比较,比较结果见表4。可变模糊评价法采用4种类型的结果均值作为评判标准,采用该法评价地下水水质是可行的、可靠的。另外,可变模糊评价法用级别特征值体现污染情况,有利于确切掌握水质污染的具体情况,以量化概念表征模糊事物进展程度,更加直观表征水质污染动态。
4.2 实例应用2
基于德州市水利局2004 年对德州市德城区地下水的监测数据[11],选取代表性的3个监测井观测数据进行水质评价,为增强可比性,水质标准分级延用原文中GB/T 14848-93标准,水质相关评价数据见表5。
利用地下水可变模糊评价法进行综合评判,评价结果及结果合理性比较见表6。可变模糊评价法采用4种类型的结果均值作为评判标准,该方法能够通过变化模型及指标权重,合理地确定出样本的评价等级,提高了样本等级评价的可信度。
mg/L
5 结 语
本文利用相对差异函数表征地下水水质样本与评价等级间的吸引特性与排斥特性,系统分析二元对比模糊决策分析法特点的基础上引申出二元对比确定指标权重的简捷方法,使权重确定更简便易行,增强了可操作性,将以上理论与可变模糊集相结合提出了地下水水质评价的可变模糊评价方法,该方法集成理论的严谨性及操作的简捷性于一体。实例应用结果表明,可变模糊评价法在地下水水质评价中的评价是合理的,方法灵活性较强,评价结果可信度高。最后以量化的形式表征水质污染这一模糊事物的进展,有助于管理人员及时掌握水质动态,做出科学决策。该方法计算简便、思路清晰、计算结果合理,可推广到项目决策、识别和各种资源评价等方面,具有广泛的应用前景。
摘要:在可变模糊集理论基础上,结合二元比较确定指标权重方法,提出地下水质评价可变模糊评价方法,该方法能够合理地确定样本指标对各级指标标准区间的相对隶属度,并且能够通过变化模型及指标权重,确定出样本的评价等级,提高对样本等级评价的可信度。将该方法应用于地下水水质综合评价,评价结果表明,由于考虑了模型参数与权重的可变性,评价结果可信度高。
关键词:可变模糊评价,地下水,水质评价
参考文献
[1]苏耀明,苏小四.地下水水质评价的现状与展望[J].水资源保护.2007,23(2):4-9.
[2]陈守煜.工程模糊集理论与应用[M].北京:国防工业出版社,1998.
[3]陈守煜.工程可变模糊集理论与模型-模糊水文水资源学数学基础[J].大连理工大学学报,2005,45(2):308-312.
[4]陈守煜.水资源与防洪系统可变模糊集理论与方法[M].大连:大连理工大学出版社,2005.
[5]陈守煜.复杂水资源系统优化模糊识别理论与应用[M].长春:吉林大学出版社,2002.
[6]陈守煜.求解系统无结构决策问题的新途径[J].大连理工大学学报,1993,33(6):705-710.
[7]陈守煜.复杂水资源系统优化模糊识别理论与应用[M].长春:吉林大学出版社,2002.
[8]陈守煜.符合我国语言习惯的决策思维模式[J].大连理工大学学报(社会科学版),1999,20(2):8-10.
[9]张先起,梁川,刘慧卿.基于熵权的改进TOPSIS法在水质评价中的应用[J].哈尔滨工业大学学报,2007,39(10):1 670-1 672.
[10]舒军龙,潘仲麟.属性识别理论模型在环境质量评价中的应用[J].干旱环境监测,1998,14(4):224-227.
可变模糊识别 篇3
随着国民经济的迅速发展,结构复杂、人员密集的高层建筑逐渐增多,一旦发生火灾就给消防工作带来极大的困扰和危机,也将给人们的生命安全和财产带来巨大损失。高层建筑火灾的性质与一般建筑火灾不同,有着火势蔓延快、人员疏散困难、火灾扑救难度大等特点,于是,高层建筑的火灾风险评价是火灾安全学中的一个热门方向。目前,对于高层建筑火灾风险评估的方法有模糊综合评判[1]、模糊最优归类[2] 、隶属度评判模型[3]、灰色关联法[4]、故障树分析法[5]等,这些方法的评价结果对权值均有一定的依赖。
本文用陈守煜教授提出的可变模糊综合评价模型[6,7,8,9]来评价火灾风险。由于火灾风险评估需要考虑的影响因子较多[1,2],直接运用可变模糊综合评价模型,每个因素权重都相对较小,模型中的各矩阵都特别庞大,为了减小误差和计算量,我们采用二级可变模糊评估模型。
1 风险的可变模糊评价模型
1.1 可变模糊评价模型[6,7,8,9,10,11,12,13]
设论域U,u∈U,以undefined与undefined表示吸引与排斥性质,其隶属度分别为μA(u)与undefined.且undefined,undefined,其差异度函数为undefined。
(1)已知待评对象有m个指标,,其特征向量为undefined,构造C个级别的标准矩阵undefined和范围矩阵undefined,依据对指标i(i=1,2,…,m)的实际情况确定指标i级别undefined的M矩阵。
(2)确定指标的权重向量ω=(ω1,ω2,…ωm)。
(3)设X0=[a,b]为实轴上模糊可变集合undefined的吸引域,X=[c,d]为包含X0的某一上、下界范围域区间。M为吸引域区间[a,b]中DA(u)=1的点值,x为X区间内的任意点的量值,则x落入M点左侧的相对差异函数模型如式(1)-式(2)所示:
undefined
undefined
x落入M点右侧的相对差异函数模型如式(3)所示:
undefined
undefined
式(1)、式(2)中β为非负指数,通常取β=1。
(4)根据公式(5):
μA(u)=(1+DA(u))/2得到各指标的隶属度矩阵[μA(u)ih]。 (5)
(6)根据公式(6):
undefined
其中, u′h为样本关于级别h的非归一化综合隶属度,p为距离参数,p=1为海明距离,p=2为欧式距离;a为模型优化准则参数,一般取a=1或a=2,ωi为指标权重。
(6)由式(3)可得到归一化的综合隶属度uh,应用级别特征公式评价各样本的等级,见式(7):
undefined
1.2 二级可变模糊评价
二级可变模糊综合评价就是将因素分为若干个子系统,每个子系统内包含若干因素,先以每个子系统为对象进行可变模糊综合评价,再以系统为对象,采用线性加权平均进行模糊综合评判。
2 高层建筑火灾风险评估实例
2.1 评价指标及权重
根据高层建筑火灾风险评估的特点,安全性类别为1级表示最安全,2级为安全,3级为较安全,4级为不安全,5级为最不安全。为了便于比较,本文引用文献[1,2]中的同一实例,评价标准值见表1。文献[1]采用的是模糊综合评价模型,文献[2]采用的是模糊最优归模型。
2.2 评价结果
2.2.1 一级可变模糊评价
运用可变模糊理论,由表1数据得到5个子系统的相对隶属度矩阵,见图1。
其中,S1表示安全疏散设施子系统,S2表示阻燃防火结构子系统,S3表示消防施救设施子系统,S4表示报警灭火系统,S5表示管理及其它子系统。由表1中的两组权重得到各子系统的防火评价级别见表2。可见该楼房的报警灭火系统和管理级别相对较低。
2.2.2 二级可变模糊评价
由表1的第一层因子权重,运用模糊线性加权得到该楼房的评价结果并与其他模型评价结果比较如表3。
为了进一步的比较,将第一层各因子和第二层各因子看成同等重要,即权重为:
ω′1=(0.2,0.2,0.2,0.2,0.2),
ω′21=(1/6,1/6,1/6,1/6,1/6,1/6),
ω′22=(0.2,0.2,0.2,0.2,0.2),
ω′23=(0.25,0.25,0.25,0.25)
ω′24=(0.25,0.25,0.25,0.25),
ω′25=(1/3,1/3,1/3,1/3)。
其中,ω′1是第一层因子的权重向量ω′2j(j=1,2,…,5)为子系统j的权重向量,记Ⅲ={ω′21,ω′22,ω′23,ω′24,ω′25},则Ⅲ为第二层因子的权重向量,再和表1中权重进行组合,得到6组权重,评价结果如表4所示。
由表4可知,尽管权重不一样,但评价结果相当稳定,6组不同权重评价结果的最大相对误差为0.058。
3 结语
可变模糊识别 篇4
对振动模糊图像恢复主要面临两个问题,就是振动参数的获取和振动模型的建立。传统的图像恢复方法有逆滤波、维纳滤波、约束最小二乘法滤波、L-R算法滤波等,这些方法都要求已知退化函数的类型,然而实际情况中振动退化类型很难知道[1,2]。目前大多根据模糊图像估计运动的点扩散函数(PSF)来建立振动模型[3],但这些方法只能估计在曝光时间内运动形式不变的PSF,而振动过程中,每一行图像都是独立的,各行的PSF也是独立的,所以振动模糊图像是空间可变的。若用同一PSF对整幅图像进行恢复[4],显然不能得到很好的恢复效果。文献[5]提出逐行法恢复空间可变振动模糊图像;文献[6]考虑振动尺度内多行图像取中心行来逐行恢复恢复图像,但都没有考虑每一行图像受相邻行点扩散函数的影响,因此恢复效果是有限的。
现根据可变振动模糊图像的特点,分析了振动退化的过程,参考文献[7]提出的方法并作改进,检测了振动的方向,建立了振动退化的PSF模型,最后考虑每行图像受相邻行点扩散函数的作用,运用改善的逐行法恢复图像,并使用图像评价指标来验证本文方法的有效性。
1 振动方向的检测及处理图像
1.1 振动方向的检测
图1(a)为静止的清晰图像,图1(b)为振动模糊图像。
利用文献[7]提出的方法对采集的振动模糊图像进行二维傅里叶变换,图像从时域转换到频域。为了提高傅里叶变换的速度,一般采用快速傅里叶变换(FFT)。对图1(b)进行傅里叶变换如图2。
可以看出前面分析的暗纹,为了更加直观和清晰地看出暗条纹的存在,对文献[6]提出的方法作改进,对图2进一步处理,即灰度直方图均匀化,如图3(a)。Radon变换是对亮条纹来做估计的,而振动模糊图像的频谱特征是存在暗条纹,所以必须对图3(a)做反色处理,如图3(b)。
图3(b)边缘都是亮色,对Radon变换有干扰,为了克服边缘亮色对Radon变换的干扰,截取图3(b)中间部分。具体方法如下:图3(b)可以用矩阵表示为:A,获取A的行数、列数:a、b。为了更好的估计振动的方向,截取图像如图4。
对图4进行0~180°Radon变换,变换的最大值对应着垂直于直线的方向就是振动的方向θ。在图5中可以看出需要检测的振动方向θ,其值为50度。
1.2 旋转、截取图像
将图1中按顺时针方向旋转角度θ至水平方向如图6(a),再选取合适的包含目标图像的窗口截取图像,如图6(b)。后续实验只对截取后的图像进行恢复。
2 振动模糊图像的模型
在线性不变空间中,图像退化的过程就是原始图像和退化函数的卷积并叠加噪声,具体形式为
式(1)中f(x,y)为原始清晰图像,h(x,y)为退化函数,n(x,y)为噪声,g(x,y)为模糊图像。由卷积定理可知,空间域两个函数的卷积在频域中表示为它们傅里叶变换的乘积,因此,退化过程在频域可以表示为[8]
如果知道噪声和退化函数可以采用反卷积的过程来恢复图像。
实际振动模糊图像的各行图像在时间上存在叠加性,表现在图像上是空间可变的。因此振动模糊图像是空间可变图像,PSF是随着时间变化的,表现在图像上即为每行图像的PSF都是不同的,上述退化过程不适用。因此必须获取每行图像的PSF。
在采集振动模糊图像时,当曝光时间很短,在一行图像产生过程中可以近似认为运动为匀速直线运动,对于水平方向匀速直线运动,其PSF[9]满足:
式(3)中,L为水平方向振动量。利用检测到的振动方向将振动模糊图像旋转至水平位置确保了振动量的水平。只需利用参考文献[10]中的方法求取振动量L再根据式(3)获取PSF。
3 振动模糊图像的恢复
相机曝光时间内振动如图7所示,第i行图像曝光过程的振动为AiBi,振动量为di,第i+1行图像曝光过程的振动为Ai+1Bi+1,振动量为di+1。第i行和第i+1行有很长一段是重复的,振动量di和di+1也不相同,因此用同一个PSF对整幅振动模糊图像恢复效果不理想[11]。为了使恢复图像更接近真实图像采用考虑相邻行点扩散函数作用的逐行恢复算法对振动模糊图像进行恢复。
去噪后的图像退化模型为
振动过程中,各行的的PSF是独立的,因此将式(4)改写为
式(5)中i代表第i行图像。此时只需求出第i行图像的PSF,进行反卷积运算即可得到第i行的清晰图像。逐行恢复图像后可获得完整的清晰图像[12,13,14]。根据上述分析可知,在振动过程中每一行图像曝光时间内不仅仅包含本行信息,还受相邻行图像信息的影响,只用单独一行恢复图像精度有限。为了获得更好的恢复效果和适用于复杂振动形式的恢复方法,对逐行恢复图像的方法做进一步改善。具体做法如下:恢复第i行图像时,考虑相邻行点扩散函数的作用,分别计算出第i-1、i、i+1行的点扩算函数h(xi-1,y)、h(xi,y)、h(xi+1,y),用第i行模糊图像依次与h(xi-1,y)、h(xi,y)、h(xi+1,y)进行反卷积得到第i行的恢复图像。重复此步骤,依次获取每行的恢复图像,最后得到完整的恢复图像。这样做克服恢复过程中边界处的振铃波纹,同时提高图像的恢复质量。
4 实验结果及分析
4.1 模糊图像恢复
为了验证本文方法的有效性,分别对匀速直线运动和正弦振动模糊图像进行了恢复。
图8为匀速直线运动模糊图像实验结果。图8(a)为匀速直线运动模糊图像,图8(b)为同一PSF恢复的结果,图8(c)为文献[5]中逐行法恢复的结果(没有考虑相邻行点扩散函数的影响)。图8(d)为本文算法恢复结果(考虑相邻行点扩散函数的影响)。
图9为正弦振动模糊图像实验结果。图9(a)为正弦振动模糊图像,图9(b)为同一PSF恢复的结果,图9(c)为文献[5]中逐行法恢复的结果(没有考虑相邻行点扩散函数的影响)。图9(d)为本文算法恢复结果(考虑相邻行点扩散函数的影响)。
4.2 图像品质的评价
为了客观上评价恢复图像的品质以及比较本文算法和其他算法的恢复效果,利用均方差(MSE)和峰值信噪比(PSNR)作为评价标准[15],分别对两种实验的模糊图像和恢复图像进行计算。
表1为匀速直线运动模糊图像和恢复图像的MSE和PSNR值对比。表2为正弦振动模糊图像和恢复图像的MSE和PSNR值对比。从计算结果来看,两种实验情况恢复后的图像评价指标比恢复前都有提高。匀速直线运动模糊情况,用同一PSF恢复、逐行法恢复、本文算法三种方法恢复图像都有提高图像品质。逐行法恢复、本文算法比用同一PSF恢复的恢复效果更好;本文算法恢复效果略优于逐行法。正弦振动模糊情况,是空间可变的模糊图像,用同一PSF恢复并不合理,但仍然有效。逐行法恢复、本文算法恢复都有很好的恢复效果;通过评价指标看出本文算法获取的恢复图像更加清晰,图像品质得到显著提高。
5 结论
可变模糊识别 篇5
径流量预测是水文系统分析的重要内容。径流量复杂多变,且处于动态变化中,每年差异很大,基于经验的传统预测方法已无法满足客观现实需求,由定量分析的数学预测模型是未来径流量预测发展的方向。常用的径流量预测模型很多,其中运用模糊聚类的方法对径流预测,可以克服径流影响因素不稳定条件下的应用范围[1]。这正是本文工作的出发点。常见的模糊聚类模型对径流预测应用有:利用模糊聚类对不同时间分布类型的降雨序列进行分析,可研究人类活动对径流变化趋势的影响[2];在运用交叉组合预测模型中,利用模糊聚类与小波神经网络相结合的方式可对径流预测[3],也可将径流预报因子进行小波分解后代入模糊聚类的方式,构建类别变量特征值与径流预测之间的回归方程来进行预测[4];又可在模糊聚类循环迭代模型的基础上结合离散函数曲线的方法确定最佳聚类数,从而对流域年径流规律进行研究[5];面对自变量较多的数据时,利用聚类分析递阶结合偏最小二乘回归来建立线性模型,对径流量的拟合能力更强[6]。
本文在可变模糊ISODATA预测模型的基础上,引入最佳模糊集划分理论,通过构造拉格朗日约束函数确定最佳聚类数。通过对变系数模型参数滤定和年径流量数值模拟,求取满足精度要求的类别变量特征值与预测对象之间的线性回归方程,并对年径流量进行预报。并以沱沱河站年径流量为例进行预测分析,结果表明该模型较以往传统模糊ISODA-TA预测模型具有更高的预测精度。
1 预报因子最佳模糊集划分
1.1 最佳模糊集划分理论分析
径流量预测模型的对象是气温、降水、流量组成的复杂系统,因此对径流预测是多准则、多层次的综合预测问题,具有一定的不确定性和模糊性,选用模糊数学模糊聚类的方法对年径流量预测具有一定的合理性。
由于影响因素对径流变化的敏感度较高。因此,对年平均相对湿度、年降雨量、年平均气温、年日照时数和年蒸发量五项观测数据在时间尺度上进行模糊聚类,即表示样本属于各个类别的不确定性的模糊程度,建立样本对于类别的不确定性的描述,能客观地反映五项影响因素对径流量的作用[7]。在聚类模型中直接引入聚类指标的权重,建立模糊聚类循环迭代模型,在没有确定指标标准的样本分类情况下,克服模糊评价和模糊识别模型中只能应用有评价标准识别的局限。
1.2 最佳聚类数求解步骤
①待聚类的m个样本,用n个指标特征值向量对其进行聚类,则待聚类的样本可用m×n阶指标特征值矩阵表示为:
其中,aij为聚类样本j指标i的特征值,即
②由于m个聚类指标特征值量纲不同,在进行聚类时要先消除量纲的影响,对指标特征值进行规范化。在模糊聚类中通常有三类指标:
越大越优效益型指标:
中间适度型:,其中
越小越优成本型指标:
将矩阵A规范化,得到相对隶属度矩阵:
③设样本n依据m个指标特征值按照c个类别进行聚类,其模糊聚类矩阵为:
满足约束条件:。其中,uhj为样本j隶属于类别h的相对隶属度;h=1,2,…,c,j=1,2,…,n。
④类别h的m个指标特征值为h类的聚类中心,则c个类别的聚类中心可用m×c阶聚类中心矩阵表示为:
其中,sih为类别h指标i的聚类中心规范化数;0≤sih≤1,i=1,2,…,m,h=1,2,…,c。
⑤考虑不同指标对聚类的影响不同,引入初始指标权重向量:w=(w1,w2,…,wm),满足:,0≤wi≤1。初始指标权重由历年径流实测样本与变量之间相关系数的绝对值归一化来确定:
⑥样本j与类别h之间的差异用广义指标欧式权距离表示为:
⑦样本j隶属于类别h的相对隶属度为uhj,则加权广义欧式距离:
⑧样本j与c个类别的差异综合权衡度量为:
样本与c个类别的差异综合权衡度量为:
其中,α为优化准则参数,p为距离参数。
⑨建立目标函数
构造拉格朗日函数:
满足约束条件
本文首先假设类别数是逐渐增加的,目标函数F是随着类别数的增加而逐步递减,当样本集表现出个很集中的类别时(即最佳聚类个数),目标函数F从1类到类而迅速减少,当聚类数再继续增加时,就是对原本较模糊的群再分开,此时,目标函数F继续减少,但速度非常缓慢,直至C=n(n为样本数),目标函数最小,即F=0。做一条F-C曲线。可变模糊循环迭代分别计算聚类数C从1类到n(n为样本数)。作出F-C关系曲线,若F-C曲线存在拐点,其拐点对应的类别即最佳聚类数。
2 可变模糊ISODATA模型构建
2.1 可变模糊ISODATA模型
可变模糊集理论认为模糊集之间存在相对可变,将可拓集合考虑到模糊迭代中,构造出可变模糊聚类循环迭代模型[8,9,10]。
①可变模糊聚类循环迭代模型变为如下形式:
②通过参数p与α取值的不同组合,公式(5)-(7)组成一个可变的模糊聚类循环迭代模型。设置4种预测模型,如表1所示。
相对于每一个组合可以有不同的迭代结果,通过这些结果的对比可以对模型的稳定性进行评估。
2.2 模型求解步骤
①构造F-C曲线确定最佳聚类数c及给定迭代计算精度ε1、ε2、ε3。
②设初始权重矩阵W(0)=(wi(0))、初始模糊聚类矩阵U(0)=(uh(j0))、初始模糊聚类中心矩阵S(0)=(s(0)ih)。
③将不同参数组合代入公式(7)-(9)运用梯度下降迭代算法分别计算w(l+1)i、u(l+1)hj、s(l+1)ih。
④如果满足对i,j,h≥0,满足:
则迭代结束,输出结果(w(l+1)i)(c)、(u(l+1)hj)(c)、(s(l+1)ih)(c)分别为最优指标权重矩阵W*(c)、最优模糊聚类矩阵U*(c)、最优模糊聚类中心矩阵S*(c),否则令l+1=l,转入步骤③继续迭代。其中c为最佳聚类数,分别对应相应的模型。
⑤计算级别特征值H(k):
其中,H(k)分别对应四种模型的级别特征向量。
⑥构造回归方程:
其中,δy、分别为Y、Hk的均方差
⑦实测样本数据对变系数回归方程进行参数滤定,即对四种模型进行选择。
⑧最后样本实测数据对模拟值进行精度评价。
3 沱沱河站年径流量预测实证分析
3.1 研究区概况
沱沱河被认为是长江源头,发源于青海与西藏边境唐古拉山脉主峰格拉丹东西南侧姜根迪如冰川,冰川海拔5500米。约30条冰川融水交汇后,形成了沱沱河。沱沱河全长358km,流域总面积1.7万km2,流域深居青藏高原腹地,雪线高达5800米,属于高空西风带控制区,气候干寒,多风少雨,天气多变,终年低温。沱沱河流域处于西风带内,沱沱河出唐古拉山区姜根迪如冰川发源后首先向北流,并汇聚其它冰川小溪,在上流处山地里形成一些相当深的河谷,截开祖尔肯乌拉山较低的山岗,流至囊极巴陇附近,部分地方可以达20米深。在葫芦湖附近开始转向东,这一段大约有130千米长,在沱沱河终点已形成深3m,宽20m~60m的大河。青海省沱沱河气象站位于海拔4700多米的唐古拉山麓,是世界上海拔最高的气象观测站。年均降水量283.1mm,年均径流深51.9mm,年均气温-3.2℃~-4.8℃。径流补给来源以大气降水和冰雪融水为主,径流年内分布不均匀。
3.2 数据来源
沱沱河水文站研究资料选取1978-2001年度,根据可变模糊循环迭代理论所必要的数据量,并考虑预测识别模型的需要,将前15个年度数据用于确定模型循环迭代最佳聚类数,后6个年度数据用于模型参数识别检验,最后3个年度数据用于误差精度评价。则预报因子分别为:1978-1992年度15a用于确定模型循环迭代最佳聚类数,各年降水量x1,年平均气温x2,年平均相对湿度x3,年相对日照时数x4,年蒸发量x5。y为1978-1992年15a逐年径流量,选取1993-1998年6a资料用于建立预测模型,1999-2001年3a资料用于检验预测模型精度。各指标实测数据如表2所示。
注:数据节选沱沱河站1958-2001年实地调查资料
3.3 最佳聚类数确定
根据公式(3),计算各预报因子的相关系数:ρ1=0.79,ρ2=0.87,ρ3=0.23,ρ4=0.71,ρ5=0.79。由表2可得预报因子的指标特征矩阵A=(aij)15×5,对于五个指标的权重确定,根据公式(4)结合因子相关度确定初始指标权重W(0)=(0.14,0.16,0.02,0.12,0.01),用公式(5)-(6)对四种模型初始模糊指标权重矩阵w,初始模糊聚类矩阵u,初始模糊聚类中心矩阵s进行循环迭代,收敛精度均设定为εi=0.0001,(i=1,2,3),聚类数从1类到9类,运用拉格朗日约束函数的方法,借助MATLAB计算最佳聚类数实现上述算法,进行最佳聚类数分析,得出结果如表3所示。由图1可以分析得出类别数为c=4时,其位于拐点左右,类别数4应该为最佳聚类数,故根据五个预报因子,对1978-1992年15a资料的沱沱河站预报因子在时间尺度上的划分为4个类别。
3.4 模型预测结果及分析
由公式(1),进行规范化处理,确定得相对隶属度矩阵R,根据公式(2),指标特征值归一化矩阵,得指标特征值归一化矩阵U*
运用公式(7)~(9)确定四种模型最优模糊矩阵W,最优模糊聚类矩阵U,最优模糊聚类中心矩阵S。结合公式(10)得到变系数四种模型级别特征值向量:
H1=(8.325,9.329,8.467,14.831,16.973,17.235)
H2=(15.346,18.378,36.433,28.467,35.378,39.047)
H3=(32.436,40.356,41.842,37.830,31.605,46.930)
H4=(12.213,9.024,11.324,12.486,10.346,19.401)
由级别特征值向量,运用公式(11)构造四种参数条件下类别变量特征值与年径流量之间线性回归方程,将沱沱河站1993-1998年6a的径流量实测数据与各回归方程计算数值拟合效果对比,进而对预测模型进行识别选择。并以均方误差MSE、平均相对误差绝对值MPE以及最大相对误差作为衡量模型精度的评价指标,其值越小,预测模型描述样本数据则越精确。如表4所示。
由表3可看出,四种模型的拟合效果有明显的差别,可见针对沱沱河径流量预测选择可变模糊ISODATA模型选择模型4拟合效果最好,即可变系数α=2,p=2。结合模型4(2-2)的样本特征值和级别特征值的相关系数ρ4*=0.880,满足要求。即构造符合相关性要求的回归方程:
利用上述参数滤定后的变系数模糊ISODATA模型2(2-2)以及传统模糊ISODATA模型,对沱沱河站进行年径流量预测,结果如表5所示。
分析表5可以得到以下结论:
①从整体MSE和MPE、最大相对误差、预测精度和拟合精度上看,可变模糊ISODATA模型(2-2)精度均高于模糊ISODATA模型。可见,可变模糊ISODATA模型是提高预测精度的有效方法。基于模型4(2-2)的沱沱河站年径流量预测结果更趋稳定,结果显示1999-2001年3a的年径流量预测的误差率均低于10%。依据《水文预报规范SL250-2000》评定标准[11],径流预报以实测值的20%作为许可误差,在预测可接受范围内。
②可变模糊ISODATA预测模型在确定最佳聚类数后,通过调整参数少,不易陷入局部极值等优点,可以快速预测,具有较大的计算优势。改进后的可变模糊ISODATA模型预测精度较高,难点是如何确定最佳聚类数和各类参数,本文的可变模糊ISO-DATA模型所确定的结构和参数理论上仅仅是较佳,而非最佳。
4 结束语
本文将可变模糊ISODATA模型与最佳模糊集划分理论相结合,提出了两者有机结合的预测模型。其显著特点是利用最佳模糊集划分理论,通过拉格朗日约束函数确定可变系数的模糊ISODATA模型最佳聚类数。在对变系数模型参数滤定和年径流量数值模拟后,求取符合精度要求的类别变量特征值与预测对象之间的回归方程进行预测。整个模型原理简单,有效地融合了影响年径流量变化因素,具有计算快捷和实用价值,也是对可变模糊ISODATA预测模型的进一步发展。最后以沱沱河站为例进行了验证,计算结果表明该模型预测结果较传统ISODA-TA预测模型准确率高,对短期内的年径流量预测有一定参考价值。
参考文献
[1]刘利平,陈健,张礼平.应用模糊聚类方法制作韩江洪水预测[J].水文,2006,26(1):60-62.
[2]李慧赟,等.基于模糊聚类的丰满上游流域降雨径流变化趋势分析[J].水文,2009,29(3):28-31.
[3]徐谨,等.模糊聚类分析的小波神经网络模型在径流预测中的应用[J].数学的时间与认识,2012,42(18):88-95.
[4]彭勇,王国利.小波、模糊与统计相关结合的径流预测方法研究[J].南水北调与水利科技,2011,9(4):47-50.
[5]李亚伟,等.模糊聚类在流域年径流规律研究中的应用[J].水资源与水工程学报,2005,16(1):28-30.
[6]周鑫,印凡成.基于新偏最小二乘回归法的系列水文资料分析[J].人民长江,2010,41(9):95-97.
[7]孔令燕,夏乐天.混合型模糊聚类分析在洪水分类中的应用[J].人民黄河,2011,1(1):31-34.
[8]陈守煜.可变模糊集理论的哲学基础[J].大连理工大学学报:社会科学版,2005,26(1):53-57.
[9]陈守煜.可变模糊集理论与可变模型集[J].数学的实践与认识,2008,38(18):146-153.
[10]陈守煜.可变模糊聚类迭代模型合理性分析与应用检验[J].大连理工大学学报,2009,49(6):932-936.
可变模糊识别 篇6
房地产是国民经济的基础性产业,对广大人民群众的生活有很重要的影响。其价格是房地产发展走向的重要风向标,对投资者和消费者都有重要的现实的参考价值,因而成为房地产供需双方的关注点。长期的低利率为房地产的开发提供了有利的条件,同时市场上的刚性需求和投资需求的急剧增长,特别是投资需求,使得房地产市场出现求大于供,根据需求供给价格机制原理,这必将导致房价上涨。由此可见,影响房价的因素很多,利用聚类迭代模型对其影响因素进行分析,找出影响较大的类别,为政府的宏观调控提供建议。
目前常用的聚类方法有层级分析法及非层级分析法。1965年札德提出模糊集合概念,以后逐渐发展形成的模糊聚类方法。1974年J.C.Dunn提出了模糊C—均值聚类算法,1981年J.C.Bezdek对其进行了改进和发展,1990年代大连理工大学的陈守煜教授先后提出了以相对隶属函数为基础的模糊识别、决策与模糊聚类理论模型,并在水利领域得到了广泛的应用。本文拟采用陈守煜教授提出的可变模糊聚类迭代模型对影响房地产价格的因素进行聚类分析,找出影响价格的敏感的因素。
一、分析模型的选用
目前对房价影响因素关系的研究主要是应用关联度来衡量因素之间的关系,这类方法具有不可改变的缺点,即公式只能够对一种情况进行分析,不能反映事物的本质。而事物的发展是连续渐变的,它们之间的界限不是绝对清晰的,而是存在着模糊性的。本文采用的可变模糊模型的聚类方法具有既可处理可变性又能处理模糊性因素的特点,既考虑了房价影响因素的可变性,有分析了各个因素之间的相关性,能够更真实客观的反映出结果,找到影响房价最重要的因素,具有实用性。
二、可变模糊聚类分析方法
2.1 指标特征值规格化矩阵的确定
设有待聚类的n个样本组成的集合,可用m×n阶指标特征值矩阵对样本集进行聚类。
式中:χij为聚类样本j指标i的特征值,i=1,2,…,m;j=1,2,…,n。
由于m个聚类指标特征值的物理量纲可能不同,需要对其进行规格化,即要将指标特征值χij变换为对聚类样本关于模糊概念A的指标相对隶属度rij。在模糊聚类中通常有两类指标:
(%1)越大越优效益型指标,也称为正相关指标,即指标值越大,聚类类别排序越前,其规格化公式为:
(2)越小越优成本型指标,也称为负相关指标,即指标值越小,聚类类别排序越前,其规格化公式为:
在式(2)、(3)中maxxij、minxij分别表示样本集指标i的最大、最小特征值。如果j对指标的j相关性不是很清楚,可以使用式(4)进行判别。
其中:y表示指标标准特征值,其他字母符号同前。
经过规格化,矩阵X变换为模糊概念A的相对隶属矩阵,即为指标特征值规格化矩阵R。%
2.2 可变模糊聚类矩阵的确定
设n个样本依据m个指标特征值规格化数按c个类别进行聚类,其模糊聚类矩阵为U。
uhj为样本j隶属于类别h的相对隶属度,h=1,2,L,n,并且满足条件。wi表示各个指标所占的权重。α,P为可变参数,体现了模糊聚类的可变性。通常取α=±1,P=±2,对出现的四类情况进行分别讨论。类别h的m个指标特征值规格化数表示了h类的聚类特征,在模糊聚类中通常称为聚类中心,则c个类别的聚类特征可用m×c阶聚类中心矩阵S表示。
2.3 类别特征值的确定
由于模糊概念在分级条件下具有不适用行,陈守煜教授提出了类别特征值的概念和公式。设已知u0对模糊概念A的级别变量相对隶属度分布列hUμhA(u 0)(h=1,2,L,%c)。级别变量h,以其相对隶属度μ%hA(u 0)为权重,其总和:
称为类别变量的特征值,简称类别特征值。
根据H(u0)可反馈得到相应的级别,据此可对u0作出属于何种类别的判断。为了更细致的应用类别特征值进行判断,给出了判断准则公式[7]:
当1.0≤H(u0)≤1.5,归属于1级;当h-0.5≤H(u0)≤h,归属于h级,偏(h-1)级(h=2,3,L,c-1);当h≤H(u0)≤h+0.5,归属于h级,偏(h+1)级(h=2,3,L,c-1);当c-0.5≤H(u0)≤c,归属于c级。
在实际运用的过程中,由式(7)可知,在一般的情况下,存在四类的可变的情形,因而会产生四组H(u0),在进行类别判断时,取四组的平均值得到,最后依据上述判断准则进行评判。
三、房价影响因素聚类分析的实证分析
基于可变模糊聚类分析方法的基本要求,在依据实际案例对房价影响因素进行聚类分析时,为了减少计算量,本论文只是针对α=2、P=2这一类情况进行讨论,其余三种情况可根据这一步骤进行计算。因此本文从敏感性的角度以河南省安阳市的房价影响因素进行聚类分析,其中所使用到得数据大都是来源于河南统计年鉴以及中国统计年鉴,部分数据来源于安阳房管局网站公布的信息和网上搜集得到的资料分析处理所得。
3.1 敏感性的聚类中心矩阵
房价影响因素对房价的影响的程度是各不相同的,采用敏感性进行分类,分为五类即:很敏感、比较敏感、敏感、不太敏感、不敏感等,规定敏感性的聚类中心矩阵S。
3.2 房价影响因素指标的选取
房价是在市场中形成的,因此市场的基本规律—供需理论对房地产依然起着重要的作用。从供给角度来看,房地产开发投资额反映了市场房地产供给的状况,因此将其作为供给的反映指标。从需求角度来看,城镇居民收入反映了房地产的有效需求,人口密度反映了房地产需求的总量要求,因此,选取这两个指标作为需求的反映指标。
通过查阅2005—2009年河南省统计年鉴,将上述五个指标的样本值整理如表1。
3.3 房价影响因素的指标特征值规格化矩阵的确定
由表1可知,房价影响因素的指标特征值矩阵X,同时由式(4)可求得:1ρ=0.57>0,ρ2=0.4>0,ρ3=0.5>0,ρ4=0.6>0,ρ5=0.5>0,因为ρi>0,所以五类指标均为正相关性指标,采用式(2)对其进行规格化,得到指标特征值规格化矩阵R为:
3.4 不可变模糊聚类矩阵的确定
由于在文章的开始已经将α,P常数化,因此,原来具有可变性质的式(7)已经转换为不可变的模型。根据式(7)以及α=2、P=2可求得不可变模糊聚类矩阵U为:
3.5 类别特征值的求得
由于敏感性分为五类,所以在这里取c=5,由式(9)可知:
3.6 房价影响因素类别判定
由上节的判断准则并且结合该实际案例,我们可以确定房地产价格五个影响因素的类别如下:
没有因素属于第1类、第4类、第5类;属于第2类—比较敏感的指标有X4,即城镇居民收入水平,其他四个指标均属于第3类—敏感的指标。又2.5<2.8983<3,2.5<2.9040<3,3<3.2411<3.5,3<3.0891<3.5在第3类的影响因素中,X1、X5即城市化水平及人口密度偏重于第2类,X3即房地产开发投资,GDP偏重于第4类指标—不太敏感的指标。
四、结论
对影响河南省安阳市的房价的因素进行模糊聚类分析可以看出,在这五个因素中城镇居民收入对房价最为敏感。一般来说,不同地区的收入水平对应着不同的房价。从感性认识上看,北京、上海、天津等发达城市地区因收入水平相对较高,其的房价明显高于其他不发达地区低收入城市的房价,而东部地区的房价也明显高于中西部地区的房价,也说明了居民收入对房价影响的敏感度高与其他因素。这也是符合我们所得出的结论的。
摘要:为了研究各类影响因素对房价的敏感程度,根据事物本身的模糊性以及发展变化性,运用可变模糊聚类迭代模型按照敏感性程度对影响房价的因素进行聚类分析,找出对房价敏感性比较强的一个类别,为政府对房地产进行宏观调控,制定相关政策提供可靠的依据。以河南省安阳市为例进行了实际聚类分析,得出了在该地区对房价敏感性较强的影响因素为城镇居民收入水平的结论。
关键词:房价影响因素,聚类分析,可变模糊,指标特征规格化矩阵
参考文献
[1]计长鹏.发展住宅建设尚需进一步努力[J].建筑管理现代化,1999(2):18.
[2]Zadeh L A.Fuzzy set[J].Information and Control,1968,8:338—353.