风险模糊识别

2024-09-20

风险模糊识别(精选7篇)

风险模糊识别 篇1

0 引言

济南鹊山水库是采用黄河水作为饮用水水源的引黄水库,饮用水安全问题严重。作为黄河下游城市饮用水安全保障技术体系的有机组成部分,针对水源污染特征,开展济南鹊山水库水质风险识别是当地政府必须尽快解决的重要问题,对于我国以黄河为水源的地区的饮用水安全保障也具有重要指导意义。

根据《国家饮用水卫生标准》(GB5749-2006)中的规定[1],采用地表水作为饮用水源地时,使用GB3838-2002中的各项指标对水质进行评价。《中华人民共和国地表水环境质量标准》(GB3838-2002)将地表水环境质量标准基本项目标准值分为5类,不同功能类别分别执行相应类别的标准值。集中式生活饮用水地表水源地应符合二类标准,除24项地表水环境质量标准基本项目外,还有5项集中式生活饮用水地表水源地补充项目,如表1所示,另外还有80项集中式生活饮用水地表水源地特定项目。特定项目主要是针对有机物、农药和重金属,由县级以上人民政府环境保护行政主管部门根据情况选择确定。

根据对鹊山水库的实地调查,可以把水源水质影响因子分为以下几类[2]:(1)化肥、农药施用;(2)禽畜养殖;(3)生活排放;(4)水滞留时间长;(5)黄河流域突发事故。

1 材料与方法

1.1 水质污染风险源识别方法

一定区域的特定风险因子会造成特定类型的水质污染。水质污染风险识别就是要根据观测到的水质污染类型反推造成污染的风险因子。如果两次水质污染是由同一种风险因子引起的,只是在污染的程度上有差别,那么两次污染中发生变化的水质指标的类型是相同的,这些指标变化的相对关系也是相似的,只是各个指标在变化幅度上会有所不同。与此相反,如果两次污染是由不同类型的风险因子引起的,那么两次污染中可能有部分指标的变化幅度是相同,但是发生变化的指标类型以及这些指标变化的相对关系不可能同时相同或相似。因此,水质污染风险识别的依据不是单个或者某几个水质指标的变化幅度,而是依据指标集合内所有指标变化情况构成的风险向量。风险向量可以绘成图1所示的水质风险曲线图,横坐标表示水质指标,纵坐标表示以正常指标为基准的变化幅度。由于同一类型的风险因子各个指标相对其正常基准值的风险曲线是相似的,从图1中可以看出A与C、B与D虽然在指标变化幅度的量级上相似,但他们均不是同一类型;而A与B、C与D虽然在变化幅度上差别很大,但风险曲线形状相似,是同一种类型的污染。因此A、B是由不同强度的同一风险因子引起的污染;而C、D是由不同强度的另外一种风险因子所引起的水质污染。

可以看出,如果水质指标越多,风险曲线越复杂,识别的难度就越大。在分析关键风险影响因子的时候,不可能把所有的影响因素都分析出来,也只能按照主要的特征,找出主要矛盾。所以水源水质风险识别的基本工作步骤是:

(1)确定区域的主要风险因子;

(2)根据风险因子的特征,在所有指标中选择重要的指标,精简研究的范围;

(3)计算受影响指标对于基准值的变化率,并将这些变化率归一化处理,得到风险向量;

(4)根据风险曲线,判断风险的形态,识别主要影响因子。

1.2 水源水质风险属性简约

水源水质指标众多,污染源多样,不同的地区有不同的特点。就某一地区而言,并不需要考虑所有的指标和污染源,这样不仅效率低而且效果不佳,科学的方法是进行属性简约,降低问题的维度。水源水质风险识别属性简约是指根据风险源的特征[3],在所有指标中选择重要的指标,精简研究的范围,突出主要矛盾。粗糙集的理论和方法是知识简约的有效途径。

信息表特征属性简约是识别系统分析中的一个重要内容。属性简约必须要根据保持分类能力不变的原则进行约简,但它必须计算很多不同条件属性子集与决策属性的依赖度,因此存在计算复杂度高,效率低的问题。基于差别矩阵的改进算法可以解决这个问题。该算法首先对差别矩阵进行简化,先得到核;然后在逐步减小的差别矩阵中挑选出现最主要的指标加入,直到成为一个精简集。该算法的正确性、复杂度已得到证明和分析,它大大缩减了识别的过程。

试验区的具体风险因子有5种,水质指标有28种(除去水温),分别按照字母a~z与ρ、θ表示。将它们的关系总结为决策表(表2),其中风险因子与水质指标有明显关系的为1,不明显为0。

采用差别矩阵改进算法[4]对决策表进行属性约简,构成差别矩阵M(C,D)。

在差别矩阵中,出现频率最多的是f。现将f加入简约集,并修改M(C,D),

在差别矩阵中,出现频率最多的是b、d、h、s、t、w。现将b、d、h、s、t、w加入简约集,所以可得简约集{b,d,f,h,s,t,w},这样用于风险识别的水质指标降到7个,大大减少了分析的复杂性。新的精简决策表3。

1.3 水质污染源模糊识别

水源水质污染源识别是一种具有模糊性的多指标模式识别[5,6]。模糊模式识别的方法有两种,一种是根据最大隶属度原则,适合于单个指标的识别;另一种根据贴近度原则,适合于多指标的识别。贴近度是对两个F集接近程度的一种度量,有多种形式。本研究采用基于“格贴近度”的“择近原则”进行识别。

根据模糊数学的原理[7],设有风险向量:

计算数值:

这个数值虽然不完全符合格贴近度的条件,但是用来识别风险曲线图形还是应有效的。

2 结果

2.1 计算标准风险向量

使用简约的水质指标,通过分析,得到5种风险源的标准风险向量:

这5种风险因子的风险曲线如图2所示。

2.2 计算样本风险向量

根据2008-08-22、2008-10-08、2009-03-25、2009-08-05、2009-11-16的2008和2009年5个样本的实测值,把5个样本分别编号为样本1、样本2、样本3、样本4和样本5。计算5个样本与正常基准值的变动率,正常基准值可以取正常状态的多年平均值,这里由于资料缺乏,根据实际情况选取集中式生活饮用水地表水源地应符合的二类标准为基准值。5个样本的实测值如表4所示。

按照计算标准风险向量的方法计算5个样本的风险向量,得:

根据公式(1)计算5个样本与5种风险因子的度,得:

3 讨论

根据5个样本计算出的度,可以得出2008-08-22样本风险向量与标准风险向量中的第三类,即生活排放的贴近度最高,风险曲线对比如图3,所以可以判定此次风险主要来源于生活排放。

2008-10-08样本风险向量与标准风险向量中的第一类,即化肥施用的贴近度最高,风险曲线对比如图4,所以可以判定此次风险主要来源于化肥施用。

2009-03-25样本风险向量与标准风险向量中的第四类,即水滞留时间长的贴近度最高,风险曲线对比如图5,所以可以判定此次风险主要来源于水滞留时间长。

2009-08-05样本风险向量与标准风险向量中的第三类,即生活排放的贴近度最高,风险曲线对比如图6,所以可以判定此次风险主要来源于生活排放。

2009-11-16样本风险向量与标准风险向量中的第三类,即生活排放的贴近度最高,风险曲线对比如图7,所以可以判定此次风险主要来源于生活排放。

4 结语

黄河下游地区广泛采用黄河水作为饮用水水源,这些城市的饮用水安全均存在不同程度的共性问题。本文通过属性简约降低水质指标的维度,大大降低了风险识别的复杂性。采用格贴近度和择近原则形成的济南鹊山引黄水库的风险模糊识别模式,不仅可对示范城市济南饮用水安全保障提供技术支撑,而且对以黄河水为水源的城市具有广泛科技示范作用,可以应用于整个黄河流域及其他有类似水质问题的地区,为引黄水库水源风险预警与管理提供了一条途径。

摘要:针对济南鹊山水库的水源污染特征,通过对水质指标的属性约简,降低了水质指标的维度。并在水质指标属性约简的基础上,利用格贴近度和择近原则对济南鹊山水库进行水源水质风险模糊识别。探讨了地表水源水质风险模糊识别的方法,为黄河下游地区引黄水库风险预警与管理提供了有效途径。

关键词:济南鹊山水库,水质指标,属性约简,风险模糊识别

参考文献

[1]GB 5749-2006,生活饮用水卫生标准[S].

[2]谷秀英,曲兴辉,王立强.平原水库供水水源系统可靠性及风险分析方法[J].水文,2007,27(1):26-29.

[3]熊建秋,李祚泳,邹长武.基于粗糙集理论的地下水水质指标属性约简[J].水科学进展,2005,16(4):494-499.

[4]代建华,李元香.一种基于粗糙集的决策系统属性约简算法[J].小型微型计算机系统,2003,24(3):523-526.

[5]李如忠,洪天求.模糊可靠性理论在河流水质风险评价中的应用[J].中国农村水利水电,2005,(11):21-23.

[6]吴义锋,薛联青,吕锡武.基于未确知数学理论的水质风险评价模式[J].环境科学学报,2006,26(6):1 047-1 052.

[7]杨纶标,高英仪.模糊数学原理及应用[M].广州:华南理工大学出版社,2002.

风险模糊识别 篇2

关键词:农产品供应链,风险评估与识别,三角模糊数

2. 苏州工业园区安华物流系统有限公司,江苏苏州215021)

近年来,全球化的浪潮促使供应链的触角延伸至世界上的每一个角落,农产品行业也不例外,农产品供应链的全球化延伸以及农产品自身的一些特性使得农产品供应链的风险不断增高。一方面,全球化的采购、销售和运输等使得农产品供应链的不确定性和风险分散到全球市场,导致风险管理难度极大; 另一方面,由于农产品的季节性、周期性、易耗性等特点,农产品供应链成为一类对物流、仓储、运输和配送的要求都较高的特殊供应链,其脆弱性更强、运作风险更大、抵御风险的能力更弱、协调更难。

1 主要文献综述

到目前为止,学术界对供应链风险的研究已取得了相当多的成果。比如文献[1] 界定了供应链风险的概念,并从管理的角度探讨风险及风险分担,构建了风险管理的基本框架。文献[2] 至[5] 从多个角度对现有研究成果进行了评述和展望,主要回顾了供应链中风险识别、风险评估和风险管理等的研究现状,分析了现有研究的不足,并指出未来的研究方向。

对于供应链风险分析和评价方法方面,丁伟东等[6]提出了供应链可靠性评估矩阵,通过模糊综合评估的方法计算出各节点企业的风险大小。Hallikas等[7]从风险事件的概率和结果的角度半定量化地研究供应链风险评估。Tobias Schoenherr等[8]则采用层次分析法( AHP) 来评价供应链风险。此外,近年来供应链风险评估领域还涌现出其他一些方法,如OWA算子[9]、支持向量机[10]、金融工具CVaR[11]等。

针对特定的农产品供应链风险方面,Hardaker[12]针对农产品的季节性、多样性、复杂性等特点进行分析,指出了农产品的质量安全问题的根本原因在于农产品供应链自身的高风险性。徐娟等[13]将生鲜农产品突发事件分为3 类,并对这些风险因素进行了分析,引入贝叶斯网络推理算法,构建了生鲜农产品供应链突发事件贝叶斯网络风险评估模型。Diabat等[14]利用解释结构模型( ISM) 建立了一套分析食品供应链的模型,将风险分为5 类并且讨论了风险的缓解措施,最后结合具体实例进行了验证。张东玲等[15]从质量安全的视角,根据农业规范标准建立农产品供应链质量安全风险评估指标体系,建立基于Logistic回归的联立方程模型,给出了供应链质量安全风险评估分析的方法。刘永胜等[16]的综述则从农产品供应链风险因素分析、风险评估指标选取、风险评估方法等3 个方面对近年来农产品供应链风险评估的研究成果进行了分析,指出了目前农产品供应链风险评估研究中存在的主要问题,并给出了农产品供应链风险评估研究未来的发展趋势。

综上所述,供应链风险管理的重要性已经越来越明显,专家以及学者也采用各种各样的方法,从不同的角度来研究供应链风险,并在一些领域内取得了比较丰富的研究成果。但是还有诸多方面需加强: ( 1) 缺乏对供应链风险系统性的研究,供应链网络日益成为一个高风险的复杂系统,以往研究多是针对供应链中某几个实体的运作状况来分析风险,缺乏对供应链衔接阶段风险的研究; ( 2) 缺乏依据风险因素的属性来进行风险评估的研究; ( 3) 实证研究偏少,且方法大多采用的是一些数理定量方法,还不够全面。本文考虑一个3 阶段跨国农产品供应链,以国内生产商为核心企业,充分考虑该供应链的风险和不确定性,构建了一套跨国农产品供应链风险识别框架模型,并识别出内外部和衔接阶段的各个风险因素; 引入模糊三角数,邀请专家依据风险属性进行评分,考虑评估者的风险态度和评估权重、供应链风险属性的权重等,有效降低了评估过程中的主观性; 最后,结合算例对评估模型进行了验证和分析。

2 跨国农产品供应链风险识别框架模型

农产品供应链风险因素识别是风险管理的基础。目前,关于供应链风险因素识别比较早的是Kraljic等[17]的研究,该研究提出一份采购组合管理框架,并考虑了由外部因素所引起的不确定性和供应中断问题。此后,不少专家学者从不同视角构建供应链风险识别框架,如国内学者马士华将供应链风险归纳为内生风险和外生风险; 除此之外,还有很多风险因素识别的研究成果,详见晚春东等[18]的综述。

本文针对一个由国外供应商、国内生产商、国内分销商组成的三级跨国农产品供应链,结合流程图法、情景分析法等方法手段,从整个供应链系统出发,构建了一套多阶段的供应链风险识别框架,如图1 所示。

供应链的链式结构决定了其风险遍布整个系统,所以在识别风险因素时,不能仅仅考虑供应链上各实体产生的风险,也应该将连接各个实体的部分纳入整个风险识别框架中,因为一旦这些链接风险产生,也将导致整条供应链中断或者延迟,本文将这部分风险称为中间风险。中间风险主要涉及国际贸易摩擦、物流运输中断、供需不协调问题等,对中间风险的管理可以有效地协调供需不平衡风险,保证整条供应链的完整。如表1 所示细分了内部、外部及中间这3 大类风险。

3 农产品供应链风险评估模型3. 1 相关定义

它的期望为ERij= ( aij+ bij+ cij) /3Rij的左右期望分别为:

定义2: E{ Ek| k = 1,2,…,p} 为专家数,组成一个多人评估小组; Y{ Yj| j = 1,2,…,m} 为供应链上的风险属性; X{ Xi| i = 1,2,…,n} 为评估空间集,即共有n条待评估供应链; 专家Ek对供应链风险的评价是一个模糊语言评价,可以转化为一个三角模糊数,记为Rkij= ( akij,bkij,ckij) ( i = 1,2,…,n; j = 1,2,…,m; k= 1,2,…,p) 。Rkij表示风险评估专家Ek针对供应链xi∈X( i = 1,2,…,n) 在不同风险属性yj∈Y( j = 1,2,…,m) 上的评估值,以一个三角模糊数表示。因此k个专家对m个风险属性的模糊评价可用下面的模糊决策矩阵R表示:

一般而言,专家群体中各个评估者对风险的态度不同,有风险厌恶者,风险中性的,也有对风险持乐观态度的,以及专家的个人经验、知识水平、经验等也不尽相同,所以在评价供应链风险时对风险属性以及重要性程度的看法也是一个模糊语言,可以采用三角模糊数来表示,本文采用的划分方法如表2 所示[20]。

模糊动态AHP导弹识别算法 篇3

弹道导弹为有效地突破反导防区天基、地基的各种光电设备的探测跟踪,采用了大量现代技术,使之具有多种突防与反识别措施。其飞行中段至再入段初期因飞行时间较长,便于进行跟踪和识别被认为是导弹防御的关键阶段,而中段的威胁目标群中,弹头与伴飞物的飞行速度和弹道轨迹大体相同,不利于速度和轨道参数识别,再加之各种电磁干扰与诱饵,因此单一的陆基雷达探测系统难以进行有效识别,已不能完全满足反导的需求,而天基红外预警卫星系统[1]是除雷达之外对弹道导弹进行监视与识别的另一种重要手段,其各类红外探测器能够获得识别真假弹头的多种特性,因而在弹道导弹目标识别中扮演着重要角色。

在一般情况下,弹道导弹的真弹头约占到有效载荷与容积的80%以上,弹头与诱饵及假目标在质量与形体上存在着较大差异,而不同目标的红外辐射特性又因其质量、形体的差异表现出不同变化规律。因此,导弹预警卫星系统的目标识别,主要是通过其所携带各类红外探测器从背景环境中区分出真假弹头的红外辐射特性差异。通过对各种情报及装备技术资料进行整理分析,本文认为,其中温度变化率、热容差异、辐射强度、灰度特性、运动特性是识别判断的关键因素,它们集中反映了弹头的物理和动力学特性。目前,国外研究弹道导弹在飞行中段及再入段的预警卫星目标识别的相关文章还少有报道,国内研究尚处起步阶段。文献[2]、[3]对预警卫星导弹粗识别与目标综合识别模型做了些有益的研究,但从公布的文献资料来看,预警卫星目标识别主要集中在早期预警(粗识别)和单一的红外识别技术及识别流程上,相关的信息融合算法研究还比较少。对此,本文提出一种信息融合下的多属性决策模型,对上述几种弹头的主要红外属性特征进行分析并作为目标识别特征量,完成了属性权重的动态构建,最后给出了仿真计算与结果分析。

1 弹道导弹目标红外识别原理分析

从中段到再入段初期,弹道导弹会产生如下动作:助推火箭关机,弹体分离,产生诱饵弹及气球、碎片等伴飞物质,再入大气层。这一阶段中,如何对目标群中的真假弹头识别成为预警卫星系统目标识别的重要任务。通过对这一时间段的目标群研究分析,发现以下几种目标红外特性及探测手段可利用目标的质量与形体间的关联来有效识别真假弹头。1)温度变化率。目标的温度变化与其质量存在着一定关系:由于弹头的质量最大,因此在同样外部环境下,弹头的温度变化要比诱饵慢得多[4,5,6],所辐射出的红外信号也比诱饵要强。因此,可采用双色长波红外阵列组成一个辐射比温度计,通过在两个红外谱段测量目标的辐射功率之比值,来消除因目标的表面物理特性不同而带来的发射率的影响,以确定出目标群中各个物体的相对温度高低,记录其变化过程,并进而推导出各个物体的相对质量大小。2)热容差异。当目标群进入中段飞行后暴露于温度极低的外太空环境中以及再入段初期进入大气层,这两个时间段目标温度随时间的变化规律反映了其热量吸收率av与放射率εIR的信息,其中重目标的热量吸收率av与放射率εIR的比值av/εIR,即热容量,比轻目标的变化快[6,7]。因此,通过短波和中波红外探测器测量目标的av/εIR可以有效地识别目标。3)辐射强度。目标表面被认为是具有一定发射率的灰体,其辐射强度由表面温度和发射率决定,而发射率是由目标的材质、质量、表面涂层材料、壳体厚度等因素构成。进入大气层前,目标群温度基本处于平衡状态,而一旦进入大气层后,气动加热将使表面温度迅速升高,一些轻诱饵都将被燃烧掉,剩下的主要是弹头和重型诱饵。它们的速度在100 km以上的高度上几乎无差异,但它们的辐射强度则随着高度的降低出现明显区别[4,5,8]。其中辐射强度变化率单调增加无明显波动,且辐射强度最大者即为弹头。4)灰度特性。目前,随着在低轨天基红外系统(SBIRS-Low)中大规模像元的焦平面阵凝视红外成像器[9]硬件和超高速图像信息处理软件技术等的应用,使红外成像技术对真假弹头的识别更加有效。红外成像可以对飞行中众多目标的红外图像进行分析判断[10],以达到利用目标的灰度特性来识别弹头的目的。例如同样环境下,真弹头温度变换比假目标与诱饵慢,其红外成像灰度上,弹头灰度变化就较为平缓。5)红外识别运动特性。可以通过一系列红外图像检测目标的运动特性。诱饵及假弹头、弹体碎块等在分离抛射过程中由动量守恒而产生的分离前后相对速度的变化。以及再入段初期,受空气阻力和各自质量与形体的影响,再入减速特征差异明显[4,11],而弹头则因形状规则重心稳定,其运动相对平稳且速度最快,根据目标红外运动图像序列,可以识别出真假弹头。

综上所述,以上五种红外特性均能从不同侧面反映出目标间的质量形体差异,但各有其局限性:一是判定时只考虑一个因素或部分因素,其可靠性与准确性不佳;二是各因素在不同时间段,表现效果会有较大变化。而将此五项因素构成决策的综合属性集,可以较全面、准确的反映各目标的红外威胁程度。因此,结合目前相应红外传感器的可靠性与精确性,本文主要综合利用这五个红外特性作为目标识别的依据。

2 模糊动态AHP目标识别模型的建立

目标识别是一个推断和决策的行为,从上节分析可知,如果将每个目标看作一个方案,将各种红外特性分别看作各方案的属性,决策准则是目标红外威胁程度,则多目标识别就成为一个多属性决策的排序问题,实时甄选出威胁值最大的目标,即质量形体威胁最大的目标作为主要威胁目标,即达到目标识别目的。

2.1 总体模型

在此,根据由目标的质量及形体特征引起的红外特性变化规律,将目标群中具有较大质量与形体,可构成“可视的红外目标”的物质分为五类,由此设立方案集(即目标集)A={A1,A2,A3,A4,A5}={真弹头、气球、加热角锥体、重型假目标、弹体碎块},属性集G={G1,G2,G3,G4,G5}={温度变化率、热容差异、辐射强度、灰度特性、运动特性}。基于模糊动态AHP算法的识别排序模型如下图1所示。

由于在本属性集属性中既有定量描述又有定性描述,而且相互之间关系复杂,具有一定的模糊性。而层次分析法AHP是一种新的应用较为广泛的建模方法,利用层次分析数学可把半定性、半定量的问题转化为定量计算,但传统算法中简单利用成对比较法构造判断矩阵比较粗糙,主观随意性大,所以,本文结合模糊动态评判来构造判断矩阵和决策模型可以提高评估精度,增强决策的科学性。

2.2 应用比较法和模糊动态评判法构造属性重要性矩阵

AHP的主要步骤:1)建立层次结构;2)构造判断矩阵并进行一致性检验;3)求解权重向量,综合排序。而在第2步中传统的判断矩阵构造中的两两属性比较法,由于简单采用1—9标度法,构造矩阵比较粗糙,甚至会出现逻辑上不合理的情况,一致性比较差,而且不能求解重要性随时间变化的因素的权值。因此,本文引入模糊动态评判法来构造判断矩阵,具体步骤为:

1)构建两个属性对于目标的相对重要性矩阵。采用专家打分对比法,根据各自的相对重要性给予评分,采用1—9标度法[12],如有属性G1、G2,专家P的打分分别为n1、n2,则G1关于目标的相对重要性指标为ap=n1/n2,而G2关于目标的相对重要性指标为bp=n2/n1。用此方法可以得到任意两个属性关于目标的相对重要性指标,构造出判断矩阵。通常,给出的判断矩阵很难满足完全一致性[13],文献[12]指出当n阶判断矩阵的最大本征值λmax小于相应的临界本征值λ′max时,即认为判断矩阵A具有满意一致性。

2)建立动态因素[13]。如第i个因素相对于第j个因素比较,则可表示为aij Tm=(lij Tm,xij Tm,uij Tm),其中xij Tm为相对重要度即中心值,Tm为时间,lij Tm和uij Tm分别为aij Tm的左右范围。当uij Tm—lij Tm的值越大,判断越模糊;反之,越清楚。设A(Tm)=(a ij Tm)n×n×Tm是模糊判断矩阵,满足:

3)计算判断矩阵权值向量。首先确定时间Tm,采取文献[13]中的方法对判断矩阵(仅针对中心值,而非左右范围)进行微调,使之达到一致性要求。如调整后的一致性判断矩阵为A(Tm)=(a ij Tm)n×n×Tm(Tm已确定),则经过一系列推导,可以得出如下计算公式:

首先,第i个因素满足n个目标的综合程度值(ei)[13]的计算公式为

其次,第i个因素未归一化权重(ωi)[13]如下所示:

式中:α∈[0,1]为决策者的优化度。当α=1时,表示一个决策者的乐观观点;当α=0时,表示决策者的悲观观点;当0<α<1时,表示决策者的观点介于两者之间。

将求出的权重ωi逐层聚合后,进行归一化处理,即可得到归一化权重ωi*。取不同时间段Tm,重复上述步骤,即可求出各个关键时间段上的归一化权重向量WTm=[ω1*,ω2*,ω3*,ω4*,ω5*]T,它表示n个特征属性的相对威胁程度大小。

4)时间Tm与tmn的确定。T为根据导弹各飞行阶段呈现不同的特点而划分的若干连续时间段集合T={T1,T2,...Tm},各Tm对应于相应的归一化权重向量WTm,其间包含预警卫星对目标群的探测时间点tmn,即tmn∈Tm。

结合本模型,参评专家P为天基红外预警卫星所采取的各探测技术手段,决策优化度α为某时间段Tm属性Gi的观测效果权值。所以,本文充分考虑了空间与时间上的信息融合,以降低识别结果的不确定性。

3 算法实现

3.1 属性权重的确定

利用模糊动态法来构建属性相对重要性矩阵A,可以较好地解决五个红外属性特征的相对重要性随时间变化而改变的问题。例如,在导弹飞行中段时期的灰度特性相比运动特性变化明显,易于辨别弹头,因而灰度特性相对于运动特性重要。而到了再入段初期,目标群的运动特性相对于灰度特性变化明显,易于分辨弹头,因而运动特性相对于灰度特性重要性上升。

为了说明动态判断矩阵在整个识别过程中属性相对重要性的变化,本文选取T1为再入段初期一时间段为例,结合目前各相应红外传感器的探测精度,预先制定属性相对重要性矩阵A如表1,并存入数据库。本文限于篇幅,只列出了中心值的判断矩阵,对于矩阵中除对角线以外的值大于1的元素,其左扩展为中心值减去1,右扩展为中心值加上1,对于矩阵中除对角线以外的值小于1的元素,可以按式(1)处理。

通过“本征向量法”[12]求得表1的λmax=5.279,小于五阶矩阵的临界值λ′max=5.45,可以通过一致性检验,以下各表求λkmax方法同。取α=0.5,防御系统方根据式(1)~(3)和表1可实时计算得五个因素在T1的归一化相对威胁权重系数为:TW1=[.0293,.0297,.0082,.0159,.0168]T。

3.2 确定各属性下的判断矩阵

以某型洲际弹道导弹为例进行计算。各属性下目标威胁判断矩阵计算过程不同于属性重要性矩阵A。取观测时间点t1n为再入段初期一时刻(t1n∈T1),各目标在五项属性下的变化情况,目前无法直接得到探测数据,只能依据前面的理论和文献[4]、[5]、[8]及相关情报资料建立的数据库,进行模拟计算仿真,防御系统方再将实时结果两两比较,得出各属性下目标威胁判断矩阵。

例如,对于温度变化率属性G1,经计算五类目标相互之间的威胁性比较矩阵P1,如表2所示。

其中,λ1max=5.293<λ′max=5.45,符合一致性要求。求解

得特征向量Wk=[w1k,w2k,w3k,w4k,w5k]T即为各目标在第k个特征属性下优劣比较的权值向量,

热容差异判断矩阵P2,辐射强度判断矩阵P3,灰度特性判断矩阵P4,运动特性判断矩阵P5(考虑再入减速特性差异)中,各目标相对威胁性比较,如表3、4、5、6所示。

整理后得各目标在五个红外特征属性下的决策矩阵Ct1n=[W1,W2,W3,W4,W5],如表7所示。

3.3 计算各目标的威胁值

目标的威胁值是指目标的红外特性威胁程度大小,据此判断各目标属于弹头的可信度,将其按大小排序后,最大值者即为真弹头。根据前面求得的各属性权重和综合决策矩阵,利用简单的矩阵相乘法则,就可得各目标的红外威胁值(如图1所示),按下式计算:

最终得各目标红外威胁值为

按威胁值大小排序为A1>A3>A4>A2>A5。由排序结果可以看出,A1具有最大红外威胁值,防御系统即判其为真弹头,与仿真系统中攻击方所给情况一致,达到预期效果。其余各目标的红外威胁值与各自目标的真实情况基本一致。

而在T2飞行中段一时期,用上述方法计算出各目标t2n时(t2n∈T2)红外威胁值为

按威胁值大小排序为:A1>A4>A3>A2>A5。通过比较可以看出,两次计算的排序结果基本一致,只是A3,A4的红外威胁值排序发生了变化。这是因为飞行中段时期目标灰度特性相对于运动特性重要,说明在不同时间,各属性的相对权重系数发生了一定变化,从而最终影响了各目标红外威胁值向量Mtmn的计算结果。本例证明该方法的正确性与有效性。本文相对于文献[2]做到了更进一步的弹头目标精识别。

结束语

基于模糊集理论的语音情感识别 篇4

情感是人类一种重要的本能,他同理性思维和逻辑推理能力一样,在人们的日常生活、工作、交流、处理事务和决策中扮演着重要的角色。作为人类交流的主要手段之一,语音信号不仅具有传递语义的作用,同时也是承载说话人个体信息的重要载体,如说话人性别,话者的说话情绪如何等。其中,对语音信号情感的识别研究正日益成为语音信号处理研究的一个热门研究领域,成为人机和谐交互的重要组成部分[1,2,3,4]。

语音情感识别是认知、心理、生理、模式识别等多领域的交叉学科,主要可分为两个方面:识别方法的改进和情感特征参数的改进。目前常用的方法有:主元分析法、神经网络法、隐马尔可夫法(HMM)、矢量量化法(VQ)等[5,6]。如Shirasawa.T等人采用重回归分析、主元分析等方法曾取得了87.1%的平均识别率[7];Muhammad W等人采用的利用神经网络进行情感识别方法也获得了77%~80%的平均识别率[8]。Sinead Mc Gilloway等人采用广义矢量量化方法也取得了一定的成果,但是识别率不高,不合适用于实际用途。Chul Min Lee等人将模糊算法引入情感识别中,对消极的和积极的这两大类情感进行识别,针对不同性别分别得到了63%和73.7%的识别率[9],但是待识情感过于简单,并且没有针对性别对识别结果的影响进行进一步分析。王治平等人则在调整性别差异的基础上采用KNN方法得到了72%~90%的识别率[10]。此外Tsang-Long Pao等人则通过试验论证使用KNN和HMM等方法可达到69%~83%的识别率[11]。在特征参数方面,赵力等人结合情感语句全局结构和时序结构特征,分析语句元音部分特征参数,大大提高了识别率[12]。

本文针对含有欢快、愤怒和悲伤3种情感的语音信号,分析了们的语音情感特征,并根据这些分析,提取了74个能表示情感特征的参数。本文提出了一种基于模糊集理论的情感特征识别方法,利用提取的情感特征,对从10名话者中搜集的100句情感识别语句,获得了较好的平均情感识别率。

1 语音情感特征的分析与提取

1.1 情感的声学特征

在过去的十几年里,针对语音信号中的何种特征能有效地体现情感,研究者从心理学、语音语言学等角度出发,作了大量的研究,但目前关注最多的是韵律特征与音质特征两种类型[15,16,17,18,19,20]。韵律特征通常包括音强(intensity)、音长(length or duration)、音高(pitch)、重音(accent)、声调(tone)和语调(intonation)等语音特征参数。此类特征及其衍生参数在语音情感识别中研究和应用最为广泛。音质特征,主要指语音的音色和语谱方面的特征,因此也被称作是音段特征,反映发音时声门波形状的变化,其影响因素有肌肉张力,声道中央压力以及声道长度张力。例如,在一个语音单位内的元音、辅音、声母、韵母等表现出的特征,以及是否有喘气、声音嘶哑等因素存在。在声源-调制的语音产生模型中,主要指与声道响应相关的语谱包络特征。代表性特征主要有共振峰、倒谱、LPC系数及其衍生参数等。

心理学和语言心理学的研究人员提供了大量的关于语音学和韵律学的研究结果,可以用来作为提取语音情感特征的参考。一般情况下,语音的情感相关性的表示形式可以通过说话人模型或者声学模型来实现。到目前为止,对情感特征参数的有效提取虽然主要以韵律特征为主,但随着研究的深入,另外一些研究者认为,音质特征和韵律特征相互结合才能表达情感,仅有韵律特征是不可能表达情感的[13]。语音音质听觉方面的信息也是常常需要考虑的因素,例如,Alter[14]等人通过对韵律和音质之间关系的研究,发现生气和高兴时的发音在喘气和沙哑等方面是不同的。一些特定元音在结构上的变化直接依赖于情感,而另一些元音则依赖于句子中的位置及话者是否用错了重读模式。Christer Gobl[15]的研究表明声源类型对不同情感也具有一定的可区分性。音质类特征中代表性的有:共振峰,MFCC,LPCC,PLP等。韵律特征和音质特征并不是相互孤立的,通过Pereira等人的研究表明语音信号的韵律特征与三个情感维度(效价维、激活维和控制维)之间的具有一定关联性,其中激活维和韵律特征之间具有明显关联,激活维相近的情感状态具有相似的韵律特征且易混淆。Tato等人的研究发现表明音质类特征对于区分激活维接近的情感(anger和happy)有较好的效果,证实了共振峰等音质类特征与效价维的相关性较强[16]。

1.2 基本情感在谐波噪声比特征上的差异

谐波噪声比(HNR)常用于诊断喉部疾病,临床中嗓音嘶哑是喉部疾病的一个主要先兆,嗓音中谐波噪声比常用来比较客观、定量的评价嗓音的嘶哑程度。近年来在对语音音质特征与情感维度关系的研究中,谐波噪声比被用来作为反映情感变化的音质特征,而音质特征通常被认为与情感的愉悦度关系密切,也就是说谐波噪声比特征应该随着情感在愉悦度上的变化而发生相应的变化。喜悦等在愉悦度上偏高的情感,谐波噪声比值也相对较高,悲伤、愤怒等位于愉悦度负方向的情感在谐波噪声比特征上取值相对较低。

1.3 语音情感特征的向量构造

用于识别和建模的特征向量一般有两种构造方法,全局统计特征和动态特征。由于动态特征对音位信息的依赖性太强,不利于建立与文本无关的情感识别系统,因此在本文中使用了74个全局统计特征,在下面列出,其中前36个特征为韵律特征,后38个特征为音质特征。

特征1-10:短时能量及其差分的均值、最大值、最小值、中值、方差;

特征11-25:基音及其一阶、二阶差分的均值、最大值、最小值、中值、方差;

特征26:基音范围;

特征27-36:发音帧数、不发音帧数、不发音帧数和发音帧数之比、发音帧数和总帧数之比、发音区域数、不发音区域数、发音区域数和不发音区域数之比、发音区域数和总区域数之比、最长发音区域数、最长不发音区域数;

特征37-66:第一、第二、第三共振峰及其一阶差分的均值、最大值、最小值、中值、方差;

特征67-69:250 Hz以下谱能量百分比、650 Hz以下谱能量百分比、4 k Hz以上谱能量百分比。

特征70-74:谐波噪声比(HNR)的均值、最大值、最小值、中值、方差。

其中,在构造频谱能量的分频段特征时,未采用650 Hz-4 k Hz内的能量百分比,虽然这个频段涉及第一共振峰和几乎全部的第二共振峰,但是此频段的能量受到文本内容变化的影响较大,主要随着音位信息的变化而变化。

采用了4 k Hz以上频谱能量特征,根据Pittam等人的研究结果显示,这一部分频段能量的增加能反映激励程度的提高,可用于区分悲伤与愤怒等。

谐波噪声比以往常用于诊断喉部疾病,是衡量说话人嗓音沙哑程度的一个特征。Biemans将谐波噪声比作为音质特征用于评价语音的音质。

2 情感识别实验和结果

2.1 训练方法

实验中,采用线性判别分析(Linear discriminant analysis,LDA)方法进行降维,将74维的原始特征降到10维。线性判别分析又称为Fisher线性判别分析,实验中通过计算各个语音情感样本类别的类内离散度矩阵与类间离散度矩阵,得到LDA变换的投影矩阵,将原始特征向量在以变换矩阵各列为轴的方向上进行投影,得到识别用的特征向量。如前所述,作者把每一个情感语句用一个10维矢量表示。设某一情感类别训练语句计算出的所有原始特征矢量为:(a1na2na3na4na5na6na7na8na9na10n)(n=1,…,N)则模糊集训练步骤如下:

1)将各分量归一化,即,其中原始特征矢量的第i个分量的均值,αimax第i个分量的最大值,αimax第i个分量的最小值(i=1,2,…,10)。

2)根据归一化后的分量值的分布情况,构造隶属函数如下

3)用如下所示的熵Hi表示特征参数所代表的模式的不确定性。

4)确定模糊关系矩阵Φ={σij},即各分量的权重。设现在所讨论的情感标号为j,i为所对应的原始特征分量的下标。

由于总共划分了3个情感集,每一个情感语句用一个10维矢量表示。因此Φ是一个10*3的矩阵

2.2 识别

1)对待识别语句进行特征分析,提取其原始特征矢量V;

2)计算T=V*Φ,显然T是一个3维矢量;

3)比较T分量的大小,分量最大的元素对应的情感类别即为识别结果。

2.3 识别结果

利用上述情感识别方法(方法1),针对100句情感测试语句进行了情感识别实验,识别结果如表1所示。为了进行比较,把利用Mahalnobis距离尺度进行分类识别(方法2)的结果也列在表1中。

%

3 结束语

本文从情感语句的韵律特征等方面,对含有欢快、愤怒和悲伤3种情感的语音信号进行了分析比较,找出了不同情感信号特征的分布规律,并提出了基于模糊判决方法的语音情感类别识别方法。经过对100句情感测试语句识别实验结果表明,使用该识别方法获得了基本上接近于人的正常表现的识别效果。今后的工作主要集中在寻找更有效的情感特征和识别方法上,在更广的范围作进一步的分析和识别实验。

摘要:本文提出了一种基于模糊集理论的情感特征识别方法,实现了对3种情感的识别:欢快、愤怒和悲伤。利用提取的情感语句全局统计特征参数,对从10名话者中搜集的100句情感识别语句,获得了不错的平均情感识别率。

一种模糊识别器的设计方案 篇5

人工免疫系统中最重要的部分就是入侵检测识别器的构造,它的基本构造原理是:通过对正常网络行为信息进行收集分析,提取特征码,一种较为典型的特征码表示方法就是用二进制位串表示,把特征码作为训练过程中的自体集(self集),再通过阴性选择原理的多特征匹配算法产生能够有效识别异常网络行为的成熟识别器。由于机体免疫系统本身就很难仅通过自体耐受产生足够的抗体以覆盖整个抗原(Nonself)空间,也需要不断的进化学习的过程,才能达到相对完善的安全系统状态。显然在人工免疫系统中,识别器的数量和质量都存在着一定程度的局限性, 那么如何在这种局势下来设计较为安全的系统是一个有潜力的研究课题。

模糊集理论为该问题提供了一条有效的解决途径,通过结合计算机安全领域知识构造模糊识别规则,建立了一种不确定性推理机制,以达到免疫的动态覆盖性、多样性以及自适应性等重要特征的培养目标。

1模糊集理论

1.1模糊数学理论

模糊数学理论是一种处理含糊和不精确性问题的新型数学工具,对于当今现代计算机的应用来说,是最有挑战性的领域之一。它在处理大量数据、复杂信息方面有着良好的结果。模糊数学理论的最大优势是无须提供除问题所需处理的数据集合之外的任何先验信息。因此模糊数学理论可以克服传统不确定处理方法的不足,为处理不精确、不完全数据的决策问题提供了更接近人类认知的数学工具。

模糊数学理论提供了一套比较完备的从小样本数据中寻找规律的系统方法,可找到描述正常模型的最小预测规则集。有利于提高检测效率。

1.2系统空间

为了易于分析和理解且实现简单,在通常情况下将系统的某一状态表示为二进制位串,即用特征向量Ui=(uundefined,…,uundefined)ϵ[0,1]l表示,状态空间用集合S⊆[0,1]l表示。

那么子空间自体集Self⊆S, 非自体集Nonself⊆S, 识别器集Detector⊆S。其中self∪Nonself=S, self∩Nonself=ϕ。

2模糊识别器的设计

2.1模糊识别器结构

本识别器从逻辑上可以分为4个主要部分:①模糊识别规则:用于存放IF-THEN规则所组成的知识库,识别器的主体;②模糊化过程:按照一定的原则对数据包提取的特征进行模糊化,用维模糊向量来表示;③模糊推理过程:通过模糊识别规则来评判模糊化了的对象、信息,再正确地将其归入某类模糊子集;④去模糊过程:是一个解模糊的过程,可定义为由上模糊集向清晰点的一种映射,从概念上讲,它的任务是确定一个最能代表模糊集的上的点。

2.2模糊识别规则

模糊识别规则是模糊识别器的核心,它决定着模糊识别器的有效性和实用性。在这里把模糊识别规则称作模糊规则库,图2描述了模糊规则库的构造过程,首先是利用人工免疫思想产生优秀的识别器种群,显然识别器的优秀程度是相对而言的,然后由此识别器种群构造IF-THEN规则所组成的知识库,即模糊规则库。

2.2.1 模糊规则库的构造原则

模糊规则库的构造是基于以下两条原则:

(1)在网络中,正常的用户访问行为特征与优秀识别器的匹配程度较低。这里的匹配程度是指行为特征与优秀识别器种群元素的最大匹配度,即匹配程度=MAX(行为特征 匹配 优秀识别器)。

(2)合法的用户在周期时间内访问的次数较多,即频率较高。

(3)访问安全级别较高的资源的合法用户数量较少,且匹配程度较低。

2.2.2 模糊IF-THEN规则及隶属函数的设计

模糊IF-THEN规则,就是一个用连续函数对所描述的某些句子所做IF-THEN形式的陈述。在文中设计了以下IF-THEN规则:

如果用户行为特征的匹配程度很高,则该用户行为异常的可能性很大 (1)

如果用户行为特征的匹配程度适中且周期时间内访问频率低,则该用户行为异常可能性较大 (2)

如果用户行为特征的匹配程度适中且访问资源的安全级别很高,则用户行为异常可能性较大 (3)

如果用户行为特征的匹配程度低,周期时间内访问频率高,且访问的资源安全级别低,则该行为异常可能性较小 (4)

这里“匹配程度高”,“匹配程度适中”,“匹配程度低”,“频率高”“频率低”,资源安全“级别高”,“可能性较大”,“可能性较小”都用以下图的隶书函数来描述的。

图3(a)中,r的取值和r领域匹配算法中的值是一致的,这主要是为了体现r领域匹配算法的优势,同时也为对比模糊识别器和传统识别器的性能作了基础;图3(b)中,定周期的长短一般是依据普遍的资源访问规律来确定的,对不同的资源本身就存在着不同的规律性,通常,安全级别高的资源被访问的次数显然是较少的,那么为了更加合理地确定周期,就得和资源的安全系统对应起来,分别对不同层面的资源赋予不同的周期,如可以月、周、天、时等为单位;图3(c)中资源的安全系数是相对而言的,一般,重要的资源,其安全系数相对较高,S的取值在这里设为1,即安全系数的最大值;图3(d)反映了用户访问行为的异常程度与前三者之间的关系,这正体现了上文中的IF-THEN规则,其中“匹配程度高”在决定是否异常时占主要因素,这在下面公式(9)中也得以充分的体现。

如果x1用表示匹配程度高,为方便描述,把它称为配度高,x2表示访问频率低,则x3表示资源安全级别高。这里,配度高是定义在图3(a)的模糊集,对应的隶属函数设计如下:

频率低是定义在图3(b)的模糊集,其隶属函数设计为

级别高是定义在图3(c)的模糊集,其隶属函数设计为

undefined (7)

x1,x2和x3的值域分别为U1=[0,13],U2=[0,+∞],U3=[0,S]。文中把特征向量空间的维度设为13,即公式(5)中Vmax的值为13,m和n都是周期内访问次数的临界值,S是被访问资源安全系数的最大值。从上文中的IF-THEN规则可以看出,若某用户行为特征的匹配程度越高,访问频率越低且访问的资源安全级别越高,那么该用户异常可能性就越大。依据此原则建立一个定义在U1×U2×U3中的模糊关系:

N=x1为高且x2为低且x3为高 (8)

N是表示了用户行为异常的一个模糊集合,其隶属函数为

undefined

模糊识别器就是依据隶属函数3.9来进行模糊推理,设定一个阈值α,建立异常行为的模糊集合,即Nα={u|A(u)≥α},A(u)=μN(x1,x2,x3),其中的参数α,m,n,r,S可通过大量的实验数据测试而确定一个最佳取值方案。

2.3模糊推理机制

经过演化训练后,得到更为优秀的识别器种群,设该种群元素的个数为N,并由此构成模糊规则库,那么根据模糊规则识别理论,任何一次用户访问行为则要通过N次检测,方可判断其是否合法,模糊推理机制及其推理过程描述如图4所示。

首先对网络数据包进行预处理,即消除数据噪音,剪掉冗余数据部分;提取能反映数据本质的特征,通常转化为二进制为串的表示方式;接着进行模糊化处理,这个过程是为进行模糊推理提供相应的数据模式;模糊推理机制是依据模糊规则库的前提条件与当前要处理的数据进行匹配,通过隶属函数计算其匹配程度,即根据公式3.9计算的隶属度值,若该值超过设定的阈值α,则证明其匹配程度较高,当前处理的数据符合了异常行为的特征,反之,则认为符合正常行为的特征。

3实验分析

为了比较模糊识别器和单纯通过反向选择算法(Negative Selection Algorithm, NSA)生成的识别器在检测性能方面的差异。选用维度为l=13的状态空间向量,在模拟真实的网络环境下,采取最大原则收集一定数量的自体集,并用二进制字串表示。首先随机生成大量的等维二进制字串,通过NSA算法产生成熟的识别器,再经过大量的数据训练成优秀的识别器种群,记作D1,种群容量N=200。为了方便比较,复制一份同样的优秀识别器种群,并根据上文中的理论及算法构造模糊识别器,记作D2。

那么现在已经获得了传统识别器D1和模糊识别器D2,。为了综合对这两类识别器性能进行对比,在r-领域匹配算法中,r分别取两种不同的值,r=6和r=9。而在模糊识别器参数的设定中,采取均衡法,取α=0.6,m=10,n=30,S=1,实际上,m和n的设定在很大程度上取决于定周期的长短。这样,模糊识别器就对应了两类参数(0.6,10,30,6,1),(0.6,10,30,9,1)。在对容量为2000的未知用户访问行为进行检测,实验结果如图5(a),图5(b)所示。

4结束语

综合模糊数学理论和计算机安全领域知识,将人工免疫科学地运用到入侵检测技术中,其中一个重要的环节就是如何构造更有效的识别器来实现对用户访问行为进行监控。分析了传统识别器生成算法的局限性,提出一种模糊识别器的设计方案,在识别未知行为能达到良好的效果。当然,模糊识别器还存在许多不足之处,由于参数较多,在赋值是有较大的困难,今后的工作将会进一步完善模糊规则库的构造方案及模糊识别算法。

参考文献

[1] Forrest,S.,A.Perleson,L.Allen,and R.Cherukuri:2002,Self-Nonself discrimination in a computer.In:Proceedings ofIEEE Symposium on Research in Security and Privacy.Oakland,USA,pp.202~212

[2] Dasgupte D.Artificial Immune Systems.IEEE Transaction on Evolutionary-Computation,2002,6(3):

[3]罗雪峰.计算机免疫系统中识别器的改进.计算机工程,2004,30(17):149~177

[4]梁意文,张双等.免疫系统识别器的自适应模型.计算机工程与应用,2002,21:170~171

风险模糊识别 篇6

关键词:二值化,算法,车牌识别,模糊识别

随着我国汽车数量的增加,城市的交通状况日益受到人们的关注,智能交通系统ITS(Intelligent Traffic System)随之产生。在此基础上发展的车牌识别LPR(License Plate Recognition)系统在交通系统管理中有着重要的作用,通过它可以检索车辆的重要信息,实现车辆控制、运输安排、停车管理、自动收费、事故处理等功能,给交通系统的自动化管理提供了极大的便利。车牌识别系统包括图像预处理、车牌定位、车牌校正、字符分割、字符识别5大部分。但是由于一天之内光照前度不断变化,道路上车辆运行速度也比较快,且有些车辆车牌沾有污物,影响其清晰度、光洁度,在这种情况下,传统的神经网络算法、模板匹配算法等都体现出了可靠性不强的特点。为了有效解决这些问题,以及更好体现车牌识别实时性和准确性的要求,采用模糊模式识别的算法来识别车牌字符,在保证准确性的前提下,也兼顾了实时性。

1 算法设计与构建

1.1 灰度化

本系统的图像信息采集终端为CCD摄像机,但由于CCD摄像机拍摄的是彩色图像,所含的信息量庞大,不仅不利于存储样本,而且对信息的传输速度也有很高的要求。而在我们实际的识别中,并不需要其彩色信息,所以为便于快速处理,可以利用公式:

将彩色车牌图像转化为灰度图像,如图1所示。

1.2 图像增强

由于拍摄的图像质量受天气、光照等的影响,图像的细节容易变模糊,因此需要进行图像增强。先对灰度化的图像进行3*3的中值滤波,然后对滤波后的图像进行对比度拉伸。

1.3 二值化

图像的二值化可以把灰度图像的256个灰度级转化为黑与白两级,便于车牌目标的搜索,阈值的选择直接关系到图像的后续处理,这里采用迭代算法。首先计算灰度化图像的直方图,选取灰度范围的中值作为初始阈值T0,然后进行迭代:

其中是图像中灰度为l的像素点个数,nl是图像中灰度为l的像素点个数,共有L个灰度等级,迭代到Ti+1=Ti时结束,Ti即为最终的分割阈值T。在本实验中K取0.55可得到较好的结果。实验结果如图2所示。

1.4 边缘检测

边缘检测是一种突出图像边缘,削弱边缘以外图像区域,突出图像轮廓的方法。文中采用Canny算法。Canny算子检测边缘的方法是找图像梯度的局部极大值,梯度是用高斯滤波器的导数计算的。它使用两个阈值来分别检测强边缘和弱边缘,而且仅当弱边缘与强边缘连接时,弱边缘才会包含在输入中。因此,此方法不易受噪声的干扰,能够检测到真正的弱边缘。实验处理后图像如图3所示:

1.5 车牌定位

车牌定位包括上下边界和左右边界的定位。经过上述图像处理之后,车牌区域具有相对集中和规则的纹理特性,并具有连续性。首先把图像水平投影到y轴,在车牌边界对应的水平位置上会出现峰值,峰值最邻近的两个低谷点便是车牌的上下边界。以同样的方式可以得到左右边界。在完成上述步骤后,可以利用车牌长宽之间比较固定的关系进行进一步修正,可以得到车牌的精确位置。

1.6 车牌校正

由于CCD相机拍摄角度的关系,车牌在水平和垂直方向上都会有不同程度的倾斜,但一般而言这个角度不会很明显。车牌的水平方向尺度比垂直方向大很多,在系统中一般只需要对水平方向的车牌倾斜进行几何校正。为了能够较准确快速地测出车牌的倾角,采用Radon变换的车牌矫正算法。由Radon变换检测到倾斜角,然后利用旋转变换的表示如下式的方程式的计算:

对车牌进行水平校正,在运用此算法时可以只对车牌边界部分点集中进行处理,所得到的结果并未下降太大,这样可以大大减少计算量,满足实时性处理的要求。

1.7 字符分割

由于我国车牌上的第二个字符和第三个字符的距离大于其他字符之间的距离,因此可以利用垂直投影找最大峰中心距离的方法,即车牌垂直投影图中两个距离最大的波峰之间的区域即为第二、三个字符的间隔区域,通过此方法可以找到第二、三个字符的分割线。然后由此分割线向两侧逐列进行扫描,当第一次遇到某列为全黑像素时,此列即为字符分割线位置。同理,逐次往后扫描,直到这7个字符都被分割出来。

1.8 字符识别

将车牌字符集中的所有汉字、大写英文字母、阿拉伯数字分别用维模糊矩阵表示为各自模式。以大写英文字母为例,共需建立24个维模糊矩阵,如图5车牌中的字母“R”,用个网格将“R”罩在正中间,对(i,j)坐标的网格,根据“R”字符是否覆盖网格的一半赋值0和1,由此可以得到表示“R”的模糊矩阵RR,用相同的方法可以得到车牌字符集中其他字符的模糊模式。

为了得到较高的准确度同时满足实时性的要求,矩阵维数m和n要根据实际图片情况适当取值。完成以上步骤后,得到了x的维模糊矩阵。

设A,B是论域U上的两个模糊集,若是有限集合,则相对Euchid距离:

相应的N(A,B)=1-M(A,B)表示模糊集A,B的Euchid贴近度。

设论域U上的n个模糊集,,若存在p,使得:

则判定模糊集B识别为Ap类,此原则为择近原则。

依据贴近度原则,比较与模板库中的标准模糊矩阵,可以完成车牌字符的识别。

2 实验验证

2.1实验平台及实验环境

本实验室内硬件平台为双核CPU、2.0G主频、2G内存,软件平台为Win7操作系统、Matlab和Visual C++6.0。室外平台为红外传感器和CCD摄像机。

实验场环境:阴天,车速30Km/h,车牌污损度一般

2.2 实验结果及讨论

本实验共采集了100张车牌图片,字符的平均识别时间为0.34秒。最终车牌识别结果如图6所示。

识别统计结果如表1所示。

从实验结果可以看出,汉字的识别率相对较低,这是由于汉字的笔画较多、字形复杂引起的,大写英文字母和阿拉伯数字误识的主要原因是采集的少量车牌上有污迹,以及易混字符如“B”和“8”等,干扰了它们的识别。当然本实验是在汽车低速(30Km/h)行驶、天气为阴天时拍摄的车牌照片,没有考虑较高车速、光照变化引起的图像模糊,实验是在比较理想的情况下进行的,今后还有必要进一步完善此车牌识别算法。完善后算法构建的系统可以应用到收费站、十字路口交通管理装置等,它可以极大简化人工操作。

参考文献

[1]王洪元,刘忠杰,刘爱萍.基于多特征组合的车牌识别算法.常州大学学报(自然科学版).

[2]袁卉平.基于MATLAB的车牌识别系统的设计研究.工业控制计算机,2010,23(10).

[3]李元金,高维春,王精明.车牌识别技术中字符切割新算法.深圳信息职业技术学院学报.

[4]刘静.几种车牌识别字符识别算法的比较.河北工程大学.

[5]孙前进,徐素莉,孙炎增.基于Radom变换特征提取的步态识别[J].数据采集处理,2010,(2):268-272.

基于模糊判别的面像识别技术 篇7

1 面像识别的价值与过程

在当前计算机模式识别和图像处理领域中,面像识别最为热门。随着社会信息化与移动互联联网发展的同时,需要思考如何能够利用各种终端去快速有效的完成个人身份的自动识别,为此面像识别在理论与实践中都存在重要的现实意义。从应用的角度,面像识别包括面像身份识别和面像身份确认/验证。面像识别的过程可以分为以下面像检测、面像特征定位与面像对比。面像识别技术是一门融合生物学、心理学和认知学等多学科、多技术的新的生物识别技术,可用于身份确认、身份鉴别、访问控制、安全监控、人机交互等。判断该面像的身份信息,得到面像识别的目的。同时当前许多公众误认为面部、虹膜、指纹、掌纹等体表生物识别技术是一种很安全的高科技产品。但是当前复制和伪造生物体表特征也越来越简单,而且成本低廉,假指纹制作工具可以简单通过指纹考勤机、指纹门锁、指纹保险箱等的验证。对于智能硬件来说,有了面像识别技术,就相当于机器人能够认识人,不仅增加了人机交互的方式,更让硬件变得更加智能。随着技术的进一步成熟和社会认同度的提高,面像识别技术将应用在更多的安防领域,不但可以提高社会运行的效率,也可以大大增强公民日常生活的安全性。目前,面像识别中所用的有效的算法有基本元素分析法、线形辨别分析法、奇异点值分解法,局部特征分析法以及各种基于神经网络的算法。面像识别技术具有很高的安全性与广泛的可用性,在安全性要求高的应用场合,面像识别技术要求识别对象必须亲临识别现场,他人难以仿冒。面像识别技术所独具的活性判别能力保证了他人无法以非活性的照片来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。例如,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。

2 基于模糊判别的面像识别技术建立

2.1 面像跟踪技术

在传统应用,面像识别技术的核心实际为“局部人体特征分析”和“图形/神经识别算法”。当前,主流的面像识别系统应用是利用“图形/神经识别算法”“局部特征分析”对面部各器官及特征部位的方位进行分析,提取成数字化信息再与数据库中的样板信息比较、判断、确认,以此鉴定身份。面像跟踪研究的就是如何从动态图片、视频小序列、即时图像、静态图片中找出面像,如果存在面像,则输出面像的性质。面像跟踪就是要在检测到已摘面像的基础上,在处理中继续捕获面像的大小、位置等。在模糊判定中,能够检测平面内旋转的面像,并可以跟踪任意姿态的运动的面像。其中图形/神经识别算法是利用人体面部各器官及特征部位的方法,一般要求判断时间低于1秒。

2.2 面像识别技术

面像识别,属于生物特征识别技术,是对生物体本身的生物特征来区分生物体个体,特指利用分析比较面像视觉特征信息进行身份鉴别的计算机技术。面像识别也是一项热门的计算机技术研究领域,面像追踪侦测,自动调整影像放大,夜间红外侦测,自动调整曝光强度。在面像识别中,需要在处理数据之前必须进行模糊判别,主要方法为降维。在具体应用中,在坐标变换的基础上,寻找A方向,这时也需要转动直线,不断寻找B方向,并保持在一维空间直线上最好的分析能力,获得初步模糊判别的结果。

2.3 面部关键特征定位技术

目前,主流的视网膜识别系统应用是系统用弱红光通过眼的瞳孔进入到眼底视网膜上,再经视网膜血管反射后进入摄像机,对提取出的样板信息进行存储验证、做出身份鉴定。而人眼球视网膜的中央动脉逐级分叉,形成难以计数的叶片,为此眼底视网膜血管图也成为个人识别的生物特征之一。在面像检测的基础上,面部关键特征包括面部特征点的位置,也包括鼻子、眉毛、下巴、额头、眼睛和嘴巴等主要器官的形状信息。比如额头是面部最重要的特征,在模糊判别中,基于区域增长的额头定位技术在面像检测的基础上,从而可以精确快速的定位额头中心位置,形成对于额头的判定。

3 基于模糊判别的面像识别技术应用效果

本实验操作中采用的是A面像库和B面像库。A面像库中含有有姿态、表情变化的10幅图像。B面像库也含有有姿态、表情变化的10幅图像。从每个人的图像集中随机挑选2幅、4幅、6幅、8幅、10幅图片,然后设置好识别模糊判别系统参数,对他们进行特征提取和分类。首先将训练样本降维,结果上述模糊判别步骤,将原样本向量压缩至一维空间,实验结果如表1所示:

通过分析,两个面向图的识别率都比较高,主要是图像投影特征主要反映的是原始模式变化堆大的成分,均方误差最小,而模糊判别特征向量集重点分析能最大程度上忽略外在因素,从而有较高的识别效率。

上一篇:烟草提取液下一篇:辐照企业