加权特征融合

2024-08-19

加权特征融合(共8篇)

加权特征融合 篇1

摘要:针对隐写分析中特征维数过高的问题, 提出一种特征加权支持向量机音频隐写分析算法。利用特征相关性对原始特征进行优化选择, 利用增益比率法计算特征权重, 提出了改进特征加权支持向量机。与常用的C-SVM进行的对比实验表明, 该方法能够有效提高检测率, 降低时间复杂度。

关键词:音频隐写分析,特征融合,特征相关性,加权,增益比率法,支持向量机

0引言

隐写分析技术是信息安全领域的一种新兴技术, 其目的是检测隐写在多媒体中的隐秘信息。在隐写分析系统中, 特征选择和特征加权是决定检测效果好坏的关键步骤。特征选择是根据数据质量与要求, 选择与目标特征相关程度较高的最优特征子集的过程。特征加权就是根据目标函数对于特征的依赖程度赋予特征[0, 1]的权值。汪海涛[1]等人利用信息增益计算特征权重, 有效减小了时间复杂度, 却没有解决信息增益存在的内在偏置。针对上述问题, 提出了一种基于特征融合的加权支持向量机的音频隐写算法。本文结合文献[2]的方法进行降维, 运用增益比率法计算特权重, 提出了一种新的特征加权支持向量机音频隐写算法。通过实验证明了本文算法的有效性。

1 特征选择

在音频隐写分析过程中, 需要对多个域内提取到的高维特征集进行降维, 以减小计算复杂度。针对上述问题, 选择一种基于特征相关性的特征选择法进行选择。算法描述如下:

步骤一:聚类

(1) 、计算E中任意特征之间的相关性:

其中MI (x, y) 为x , y之间的互信息, H ( x) 为x的信息熵, H (x y) 为已知变量y后x的条件信息熵。

(2) 、通过对任意两特征间相关度的计算, 对特征进行聚类。将每个特征看做包含一个特征的子集, 再通过特征相关性进行聚类, 相关特征子集中每个特征至少存在一个相关性大于?1 的特征。

步骤二:选择代表性特征。若特征子集中特征数超过3, 选择与目标特征相关性最强的特征和与其相关性最弱的特征作为代表特征;若相关特征子集中特征小于3, 则选择与目标特征相关性最强的特征作为代表特征。

步骤四:将步骤三得到的代表性特征集再次进行筛选。从代表性特征集中删除与目标特征之间的相关度小于δ2的特征, 最终留下的特征便作为该数据集E的优化特征子集。

2 特征加权

特征加权就是根据每个特征对于分类的贡献大小的不同, 赋予[0, 1]的权值。本文采用增益比率法对特征的重要性进行度量。

增益比率就是该特征的信息增益与该特征分裂信息的比值。信息增益用以衡量特征A与目标函数的相关值。HA用以衡量特征A离散信息时的泛化能力与稳定性。两者比值, 能够更加有效的描述特征的重要性, 一定程度上修正了信息增益对于数值较大的特征的内在偏置。

3 特征加权支持向量机

特征加权支持向量是利用核函数与特征加权矩阵结合得到的特征加权核函数, 代替经典SVM核函数而得到支持向量机。核函数Fp定义为:, 其中线性变化矩阵P是特征的权重ωi (1

( 1 ) 收集初始 特征集

(2) 通过基于特征相关性的特征选择算法, 得出优化特征子集。

(3) 根据增益比率法求出特征子集中所有特征的权值, 组成权重向量:

( 4 ) 根据实验 选择适合 的参数 , 求得最优 解

(5) 构造最优分类超平面。选择ai对应的样本点 (xi, xj) 计算b的值, 并且求的决策函数:

4 实验结果与数据分析

通过Jsteg4.2, F5r11 outguess2.0生成的三组隐藏音频的检测进行评估。每组实验分别以1%、3%、6%、12%的嵌入率进行四组析实验。在每实验中, 随机选择隐写音频和正常音频片段共1000个, 800个用于训练样本, 200个用于测试。采用本文算法对隐写音频进行检测, 得到结果与C-SVM分类器分别对原始子集与优化子集的分类检测率、时间复杂度的对比, 得到结果如表1、表2所示。

表中, HS代表嵌入秘信的软件, rE、rN、rS分别代表音频隐写嵌入率、正常音频检测率、隐写音频检测率, T代表检测时间。

由实验对比可知本文算法相对常用的C-SVM检测算法, 能够有效减小时间复杂度, 提高检测效率。

5 结束语

本文提出了一种特征融合与加权的支持向量机音频隐写算法。通过降维构造了独立性较好的特征子集, 通过加权处理的方式在一定程度上避免了弱相关特征影响分类精度的问题。通过实验证实了该方法在降低时间复杂度、提高分类精度上具有可行性。

参考文献

[1]汪海涛, 张卓, 杨晓元等。基于优化特征加权支持向量机的隐写分析方法[J]。计算机应用与研究, 2013, 30 (7) :07-2105-03.

[2]蒋盛益, 王连喜.基于特征相关性的特征选择.计算机工程与应用[J], 2010, 46 (20) :153-156.

[3]J.Kodovsky, J.Fridrich, Steganalysis of JPEG Images Using Rich Models, Proc.SPIE, Electronic Imaging, Media Watermarking, Security, and Forensics XIV, San Francisco, CA, January 23-25, 2012.

加权特征融合 篇2

摘要:

采用玉树地震QuickBird影像,对不同损毁级别的建筑物进行采样分析,提取不同损毁情况表征纹理特征的灰度共生矩阵中区分度较好的特征参数。比较不同特征融合之后损毁建筑物提取精度。结果表明,灰度共生矩阵中纹理特征参数对不同损毁程度的建筑物具有不同的区分度,光谱特征与纹理特征结合,损毁建筑物识别精度最高,不同的特征参数混淆使用会造成信息冗余,从而降低信息提取精度。在实际工作中,要根据遥感震害机理选取合适的特征组合,提高损毁建筑物的提取精度。

关键词:遥感影像;多特征融合;纹理特征;损毁建筑物

中图分类号:P315-39文献标识码:A文章编号:1000-0666(2016)03-0486-08

0引言

地震具有突发性强、破坏性大的特点,会对人民的生命财产安全造成不可弥补的损失。地震发生后,进行震区破坏程度快速准确的评估,特别是损毁建筑物的快速提取,对震后紧急救援及灾情评估有重要的意义。遥感具有综合、宏观、快速、动态的特点,是震害灾情信息快速获取的重要数据源(赵福军,张磊,2009)。随着遥感技术及影像分辨率的不断提高,遥感影像能够反映更加丰富的空间结构信息和纹理信息,可有效地提取损毁建筑物信息,使得融合影像的不同特征对遥感影像进行精确识别分类成为研究趋势。

损毁建筑物信息的提取方法主要有遥感影像的变化检测和分类技术,包括震前、震后影像对比分析和直接从遥感影像中提取建筑物损毁信息(赵福军,张磊,2009)。国内外学者在此理论基础上展开了一系列的研究,Masashi和Fumio(1998)利用神户地区地震后的TM影像和SPOT影像,采用判别式从遥感影像中提取了损毁建筑物、震后火灾分布及土壤液化等信息;Hajime和Fumio(2000)根據土耳其Kocaeli地震和我国台湾震后影像特征的分布,利用多尺度分割的方法提取震害信息,其参与的特征主要有色调、饱和度、亮度和边缘特征。随着多特征及多源遥感数据的发展,越来越多的研究者将影像的纹理特征、几何形状特征等信息融合进来,提高信息提取的精度;李祖传等(2010)利用高分辨率影像的纹理与形态特征实现对汶川地震倒塌房屋信息的自动提取;吴炜等(2012)将建筑物的光谱特征和形状特征相结合对建筑物进行提取,与单独用光谱特征相比,提取精度较高;徐佳等(2012)综合灰度与纹理特征对高分辨率星载SAR图像进行建筑物提取,提取效果良好;曹代勇等(2001)对遥感影像中建筑物灰度特征和纹理特征进行统计,统计结果表明灰度平均值、灰度标准差和灰度方差3种特征参数是建筑物震害识别和分级的良好指标,同时将震害建筑物遥感评估类型概括为三种;

翟永梅等(2011)提出了一种基于区域的遥感影像差值分割提取技术来快速地对震害信息进行评估,应用效果良好。

近年来,随着高分辨率遥感技术的快速发展,面向对象的方法由于克服了常规的仅依靠像元的光谱统计特征提取相关信息的不足,从而受到广大研究者的青睐。Hofmaane(2001)利用面向对象的方法,以DEM作为一个专题层参与遥感影像的分割,实现了对IKONOS影像中建筑物与道路的提取;赵福军和张磊(2009)利用面向对象的方法对汶川地震震害信息进行提取,取得了较好的结果;王慧敏和李艳(2011)利用面向对象的方法对海地地震灾害造成的损毁建筑物进行提取;龚丽霞等(2013)利用面向对象变化检测的方法提取玉树地震造成的房屋倒塌,同时与主成分分析、直接变化检测方法相比,提取精度较高;范开红等(2014)利用面向分类技术对应急指挥技术系统信息进行产出与模块化,从而更及时地掌握震情、灾情,使得面向对象思想适用于地震应急。上述的研究取得了一定的成果,将建筑物的光谱特征、形状特征、纹理等特征结合起来,提高了建筑物信息提取精度,同样也存在着不足,建筑物的纹理特征、形状特征、光谱特征的结合主要依靠人为经验进行选取,没有一定的规律可循。建筑物的纹理特征、形状特征包含的特征参数繁多,特征参数的选取依靠人为主观经验,要依靠不断的试验进行选取,耗费大量的时间。

如何有效地对损毁建筑物的纹理特征、形状特征、光谱特征等多特征进行融合,快速从繁多特征参数中选取最优参数组合,是震害信息快速准确提取的重点。本文从高分辨率遥感影像中选取不同震害程度的建筑物样本,对其各种特征信息进行统计分析,获取多特征信息的最优组合,快速准确地提取震后损毁建筑物信息。

1建筑物震害图像特征

11建筑物震害分级

不同烈度及破坏强度的地震对建筑物的损毁情况不同。根据《震害调查及地震损失评定工作指南》国家地震局.1993.震害调查及地震损失评定工作指南.和《建(构)筑物地震破坏等级划分》(GB/T24335—2009),建筑物震害等级分为5个级别,分别为基本完好、轻微破坏、中等破坏、严重破坏和损毁。遥感图像提供的是建筑物外形的中心投影信息,遥感图像分级主要依据震后建筑物的整体和细部图像特征,包括图像的几何信息、色调信息和相关信息(陈鑫连,1992)。因光学遥感成像方式的局限性,遥感影像中不能获取建筑物墙体或内部的损毁信息,因此,本文将震害建筑物损毁级别分为3级,轻微损毁、中等损毁和严重损毁。轻微损毁是指采集样本影像中房屋基本完好或少量破坏;中等损毁是指采集样本影像中一半数量的房屋倒塌或破坏;严重损毁是指采集样本影像中绝大部分房屋倒塌或全部倒塌破坏。

12建筑物特征

(1)光谱特征

光谱特征是指不同波段、不同传感器、不同时相遥感影像上地物光谱特征的空间集合,主要包括灰度、色调及颜色等。反映建筑物震害光谱特征的特征参数主要有灰度均值、灰度方差、灰度标准差、最大值和最小值。一般而言,建筑物损毁之后,建筑物的镜面反射变弱、漫反射加强,其灰度均值较大。建筑物损毁程度越严重,其灰度均值越大,而其方差及标准差越小。

(2)纹理特征

本文采用共生概率纹理特征来提取纹理特征,共生概率纹理特征是一种基于统计的纹理描述方法,利用灰度共生矩阵(grey-level co-occurrence matrix,简称GLCM)描述纹理特征。共生概率纹理特征最早由Haralick等用灰度共生矩阵的方法提出(Pesar,Benediktsso,2001)。灰度共生矩阵是像素距离和角度的矩阵函数,它通过计算图像中一定距离和方向的两点灰度之间的相关性,来反映图像在方向、间隔、变化幅度及快慢上的综合信息。反映建筑物震害纹理特征的特征参数主要有均值(ME)、方差(VA)、反差(CON)、熵(ENT)、均质度(HOM)、相异度(DI)、相关性(COR)、角二阶矩(ASM)。

ASM是灰度共生矩阵元素值的平方和,反映了图像灰度分布均匀程度和纹理粗细度。

以上各式中,i,j=0,1,2,3……(N-1),N为图像灰度级数,μ代表均值,σ代表方差,Pi,j代表从图像灰度为i的像素出发,统计与距离为δ,灰度为j的像素出现的概率。

(3)几何形状特征

建筑物的几何特征主要指建筑物的形状以及以几何关系为基础的特征,通常包括建筑物屋顶形状的轮廓线、屋顶轮廓边缘相互之间的夹角、屋顶面积、侧墙棱线等(张明媚,2012)。反映震害建筑物几何形状特征的特征参数主要有面积(Area)、长度(Length)、宽度(Width)、长宽比(Aspect-ratio)、形状指数(Shape-index)、紧致度(Compactness)、矩形度(Rectangular-degree)等。

22最优窗口选择

纹理特征采用灰度共生矩阵来描述。灰度共生矩阵与所选的方向、步长、窗口大小及图像的量化等级有关,因此要根据具体的影像纹理特征来选择生成灰度共生矩阵的参数。根据经验,取0°、45°、90°和135°这4个方向灰度共生矩阵的平均值作为局部图像中心像元位置的灰度共生矩阵。图像的量化等级变化对影像的灰度共生矩阵影响不大,本研究中设定图像量化等级为64。在灰度共生矩阵分析过程中,步长越小越能细致地反映纹理特征,因此本文选取步长为1。对其影响最大的为窗口大小,本文将建筑物震害类型分为3种:轻微损毁、中等损毁和严重损毁,分别统计3种样本在不同窗口大小下的参数特征值,从而选取样本特征参数区分度较好的窗口大小,以标准差、熵为例说明选取最优窗口大小。以4为间隔依次采用3×3到51×51之间的窗口大小,统计计算不同窗口大小的标准差和熵,研究建筑物震害的不同特征值随窗口大小变化的趋势,趋势变化图见图3。由图可知,当窗口大小为11×11时,不同级别损毁建筑物的特征值达到最大,标准差的区分度较好,而熵值特征中,轻微损毁和中等损毁情况混在一起,但两者与严重损毁的区分度较好,有利于提取严重损毁建筑物信息。因此本研究中,灰度共生矩陣计算的窗口大小尺寸选择11×11。

23纹理特征分析

遥感影像不同的纹理特征反映不同的建筑物损毁信息。前人研究表明,将纹理信息与光谱信息结合提取损毁建筑物信息能提高提取精度。通常反映影像纹理特征参数有8个,其全部参与运算必然会造成信息冗余,如何从这8个参数中选取最优的特征参数组合计算,成为研究的重点。本文首先计算不同样本的纹理特征参数,窗口大小取11×11,然后对其进行统计分析,提取出最能反映建筑物损毁信息的特征参数组合。图4为不同级别损毁建筑物样本不同纹理特征参数值的趋势变化曲线,由图可知,建筑物在不同损毁情况下,均值、标准差、均质度、反差、角二阶矩的区分度明显,能很好的区分轻微、中等和严重损毁建筑物信息,可损毁建筑物的提取,而熵的区分度并不特别明显,其值分布在一个比较集中的值范围内,不同损毁程度的建筑物特征混淆在一起,未能较好地区分。因此在本文研究中,纹理特征参数选择均值、标准差、均质度、反差、角二阶矩、熵。

24建筑物震害提取

不同类型或损毁程度的建筑物光谱差异很大,单纯依靠基于光谱的遥感图像分类方法难以将其区分开,面向对象的方法首先将影像按照一定的阈值尺度分割为很多小的对象,然后综合其光谱统计特征、纹理特征、形状特征、相邻关系等因素,将具有相同特征的小的对象构成一个影像对象,最后根据影像对象的不同特征进行分类,打破了仅依靠光谱特征进行分类的局限性。在信息提取的过程中,不同的特征因子对信息提取的贡献不同(Du, Liu,2012),并不是越多的特征融合在一起,其信息提取精度就越高。本文研究中对多特征的不同组合情况进行实验比较,主要包括光谱特征、光谱特征+纹理特征、光谱特征+几何形状特征、光谱特征+纹理特征+几何形状特征。

根据上面的研究,本文纹理特征参数选择均值、标准差、均质度、反差、角二阶矩和熵。几何形状特征的特征参数主要有面积、长度、长宽比、紧致度、矩形度。光谱特征采用原始的四个波段。本文采用相同的分割尺度,融合不同的特征,对其提取精度进行对比。

图5为4种不同特征融合之后损毁建筑物提取结果,在相同的分割尺度下,统计严重损毁与中等损毁建筑物面积,与目视解译的结果进行对比,分析其提取精度,结果见表1

由表1可以看出,光谱与纹理特征相融合之后提取损毁建筑物的Kappa系数最大,同时完好错分为损毁的百分比最低,说明其信息提取效果最好。分析其原因,建筑物在损毁之后,其纹理特征发生了明显的变化,与周围地物的纹理特征具有明显差别,这可从图4中纹理特征变化趋势曲线的区分度得出。而仅仅依靠光谱特征提取建筑物损毁信息,由于存在异物同谱的现象,其信息提取精度最低。建筑物在破坏或倒塌之后,其几何形状特征中的面积、长度、形状指数和矩形度等特征都受到不同程度的影响,建筑物面积变大或者与周围空地(道路)融合一体,建筑物形状受到破坏,很难用具体的参数来表示,同时由于影像分辨率的影响,损毁建筑物易与周围裸地或崩落的碎屑混为一体,同样也会影响提取精度,因此,融合几何形状特征不但没有提高提取精度,反而会降低提取精度。而融合光谱特征、纹理特征和几何形状特征融合之后,损毁建筑物的漏检率最低,同时其完好建筑物错分为损毁的百分比最高。

实验证明,在影像分辨率一定时,影像多特征融合提取损毁建筑物精度与融合信息量并不成正比关系。在提取完好建筑物信息时,其几何形状特征规整,几何形状特征参数能较好地表述建筑物的几何形态分布,融合几何形状特征会提高建筑物信息提取的精度。而在地震发生之后受到严重损毁的建筑物,其形状受到破坏,几何形状特征参数不能很好地赋予其一定的特征值范围,融合几何形状特征并不能提高其提取精度。因此,建筑物信息提取要充分考虑影像分辨率、建筑物分布形态及其内部纹理变化,从而选择最优融合特征。

3结论

本文以玉树地震遥感影像为例,针对遥感影像中建筑物损毁情况,总结分析了不同损毁等级建筑物在遥感影像中表现出的纹理特征、几何形状特征等参数因子。选取不同等级损毁程度的建筑物样本,统计分析其纹理特征参数在不同损毁等级下的变化趋势曲线,同时比较了多种特征融合提取损毁建筑物的提取精度。通过实验与分析,得出以下结论:

(1)表征纹理特征的灰度共生矩阵的8个特征因子,并不是每一个特征因子都对不同损毁程度的建筑物具有很好的区分度,本文通过采样统计分析表明,灰度共生矩阵中均值、标准差、均质度、反差、角二阶矩特征因子对损毁建筑物区分度较好。

(2)并不是特征信息融合越多,损毁建筑物提取精度越高,比较几种特征融合提取损毁建筑物的精度,发现光谱信息与纹理信息融合对损毁建筑物的提取精度最高。地震发生之后,精确地提取损毁建筑物信息,需要全面地考虑其分布形态及纹理变化,有选择性地进行特征融合,常规的将所有信息进行融合的方法可能会降低提取精度。

參考文献:

曹代勇,施先忠,张景发. 2001.遥感图像中建筑物震害信息统计特征研究[J].国土资源遥感,13(1):42-46.

陈鑫连. 1992.地震灾害的航空遥感信息快建评估与救灾决策[M].北京:地震出版社.

范开红,林洋,申源.2014.地震应急指挥技术系统产出信息面向对象分类与应用[J].地震研究,37(2):317-322

龚丽霞,李强,张景发等. 2013. 面向对象的房屋震害变化检测方法[J].地震,33(2):109-114.

李祖传,马建文,张睿等. 2010.利用融合纹路与形态特征进行地震倒塌房屋信息自动提取[J].武汉大学学报,35(4):446-450.

王慧敏,李艳. 2011.面向对象的损毁建筑物提取[J].遥感信息,26(5):81-85.

吴炜,骆剑承,沈占峰等. 2012.光谱和形状特征相结合的高分辨率遥感图像的建筑物提取方法[J].武汉大学学报,37(7):800-805.

徐佳,陈媛媛,黄其欢等.2012.综合灰度与纹理特征的高分辨率星载SAR图像建筑区提取方法研究[J].遥感技术与应用, 27(5):692-698.

赵福军,张磊. 2009.面向对象的遥感震害信息提取方法——以汶川地震为例[J].地震, 29 (增刊):130-138.

张明媚. 2012.面向对象的高分辨率遥感影像建筑物特征提取方法研究[D].太原:太原理工大学.

加权特征融合 篇3

随着医学诊断类影像设备快速发展, 多模态影像图像不断呈现。单模态的影像图像不能提供足够信息, 将不同模态的医学图像进行图像融合, 提供丰富的诊断信息是当前研究的热点和方向。国外学者对多模态图像融合技术也作了相关研究, 如基于Contourlet变换、基于视觉、基于离散小波变换等的图像融合方法。

目前图像融合技术可分为两类[1]:空间域融合与多分辨频率域融合。Contourlet变换是一种多分辨、局域的、多方向的图像表示方法, 是一种二维图像的稀疏表示方式, 具有良好的方向性和各向异性特征, 能更好地将图像中的边缘轮廓信息捕捉到不同尺度、不同方向的子带中, 被有效地应用在图像融合领域[2,3], 本文通过对图像融合技术与Contourlet变换的研究, 提出了一种基于Contourlet变换的CT、MRI医学图像区域方差加权和条件加权融合算法。

1 方法

图像融合的前提是两幅图像已经进行了较好地配准, 本文利用梯度与互信息结合的相似性准则进行了医学图像配准。

Contourlet变换实现结构由拉普拉斯金字塔 (LP) 和方向滤波器组 (DFB) 组成, 该变换是将多尺度分析与方向分析分别进行。用类似于轮廓段的基结构来逼近图像, 采用的基结构是随尺度变化长宽比的条形结构, 具有方向性和各向异性, 能够对图像的线和面有更稀疏的表示。

融合规则:低频子带融合规则:对低频子带系数的融合规则采用区域方差加权分析法。该方法能够保留图像的敏感信息, 因为图像的信息越大, 方差越大, 算法中的加权系数更好地提取了敏感信息, 采用此算法进行图像融合将会比平均算法取得更好的融合效果。

经过Contourlet变换后的高频子带系数包含了图像中有用的细节信息, 包括边缘、区域轮廓等。频子带系数的分布呈现方向特性, 含了很多图像中的细节信息。对高频子带系数进行融合的最终目的就是在融合图像中尽可能保留源图像的清晰细节进行图像表示, 以更多保留图像有用信息。因此, 采用基于主图像的条件加权分析法进行高频子带系数融合。

2 实验结果

利用Contourlet变换可以得到MRI图像的分解示意图。第二层选择k=2, 得到4个方向的梯度信息;第三层选择k=3, 得到8个方向的梯度信息。

利用本文的融合策略对已配准好的CT、MRI图像进行融合, 融合的结果如图3 (c) 所示, 利用平均值的策略进行融合的效果如图3 (d) 所示。

3 结果

本文将Contourlet变换用于CT、MRI医学图像融合, 提出了基于Contourlet变换的区域信息的融合算法。将该算法用于CT、MRI图像的融合实验, 通过主观视觉效果进行评价, 并与传统融合算法进行比较, 结果表明该算法能够有效地融合多源医学图像信息。

摘要:本文针对多模态的CT、MRI图像的融合, 利用Contourlet变换多尺度、多方向的特性, 提出了系数加权的融合算法。对于低频子带, 采用局部信息均值和方差来进行系数加权;对于高频子带, 采用条件加权。将本算法应用于不同模态的医学图像的融合, 有效增加多模态医学图像的互补信息, 提高融合的清晰度。

关键词:多模态,医学图像,Contourlet变换,图像融合

参考文献

[1]郭雷, 李晖晖, 鲍永生.图像融合[M].北京:电子工业出版社, 2008:183-248.

[2]徐苏.基于Contourlet的医学图像融合技术探讨[J].中国医学影像技术, 2011, 27 (11) :2326, 2330.

[3]王昕, 李玮琳, 刘富.小波域CT、MRI医学图像融合新方法[J].吉林大学学报:工学版, 2013, 43 (s1) :25-28.

加权共协矩阵聚类融合研究 篇4

融合方法将不同算法或者同一算法下使用不同参数得到的结果进行合并,从而得到比单一算法更为优越的结果。在分类算法和回归模型中,融合方法的使用已经比较成熟。但在聚类分析领域,聚类融合方法的研究在近几年才开始出现[4]。

当前的聚类融合算法大多不考虑进行融合的成员的质量,当聚类成员存在聚类质量差或者有噪声干扰时,融合结果将受到影响。针对此种情况,本文根据簇内方差对生成的H个聚类成员划分成五类,再根据划分结果确定成员的权重,然后使用基于加权共协矩阵的方法得到更好的融合结果。

1 聚类融合方法概述

聚类融合(Clustering Ensemble/Clustering Combination)的概念是A.Strehl[5]提出:将多个对一组对象进行划分的不同结果进行合并,而不使用对象原有的特征。它的具体表达如下[4]:

假设有n个数据点undefined,对数据集X用H次聚类算法得到H个聚类结果,undefined(以下称之为聚类成员),其中πk(k=1,2,3,…,H)为对第k次算法得到的聚类结果。设计一种共识函数Γ,对这H个聚类成员的聚类结果进行合并,得到一个最终的聚类结果π′,如图1所示

在聚类融合中,先要产生对数据集X的h个聚类成员,然后对这h个聚类成员的聚类结果进行合并。目前研究主要集中在两个方面:

一是如何产生有效的聚类成员;

二是如何设计共识函数对聚类成员进行融合。

2 加权共协矩阵聚类融合算法

2.1 基于共协矩阵的算法

基于共协矩阵(co-association matrix based method)方法的基本思想是把每一次聚类的结果看成是数据重新组织的新模式(pattern),在这个基础之上,数据对象之间的近似度可以由新的特征模式之间的近似度代替。Co-association矩阵用于衡量数据点之间的相似度,其中第i个数据点与第j个数据点之间的相似度为:

undefined

用数学方式表达为:

undefined

其中u、v为任意两个数据点,Ci(u)和Ci(v)表示点u、v在聚类成员Ci中所属的类别。

基于共协矩阵聚类融合算法的空间复杂度为O(n2),时间复杂度为O(kn2),其中n表示数据个数,k表示运行k-means算法的次数。算法的优点是无需对标签向量进行重新标定。缺点是存储空间和计算时间,可以看出算法对于海量数据是不太适合的。

此外,可以看出,基于共协矩阵的融合算法并没有考虑到聚类成员的质量和噪声的影响,因此,本文下面提出了权重的设计,对每个聚类成员赋予权重。

2.2 权重的设计

当前的聚类融合算法大多不考虑聚类成员的质量,而对所有的聚类成员同等看待。本文通过对聚类成员进行简单的有效性评价,进而设计每个成员的权重。

一般来说,评价聚类和选择最优聚类模式的原则有两个:紧密度,即簇中的成员必须尽可能地相互靠近;分离度,簇与簇之间的距离尽可能地远。大多数评价聚类质量的方法都是基于这两个原则。如果处理的数据集结构未知,聚类结果的评价就只能依赖数据集自身的特征和量值。在这种情况下,聚类分析的度量追求两个目标:紧密度和分离度。此外,还要考虑单个簇的大小,以达到均衡较好的解[6]。

本文应用簇内方差对聚类成员进行评价设计权重。

簇内方差即误差平方和最小方差标准,寻求簇内距离最小化。K均值算法的局部最优度量首先基于此概念,定义为[5]:

undefined

C是所有的簇,μk是簇Ck的质心,δ(i,μk)是距离函数,计算数据项i与其对应的簇的中心的距离。簇内方差最小值取决于数据和簇的数目,最优划分得到的簇期望其值尽可能接近零。

按照公式(3)求得各个聚类成员的簇内方差undefined,其中Vi为第i个聚类成员的簇内方差。根据簇内方差的性质,V值越小说明聚类成员的质量越好,因此我们需要对其赋予较高的权重,加大其对融合结果的贡献。具体算法如下:

对得到的簇内方差进行简单聚类成五类,按照值从小到大分别赋予权值w={5,4,3,2,1}。

2.3 算法描述

算法流程如下所示:

第1步 选用某种聚类算法生产H个聚类成员;

第2步 对每个聚类成员ck,k=1,2,…,H,计算它的簇内方差Vk;

第3步 把簇内方差按照某种聚类方法将聚类成员分成五类,按照簇内方差从小到大的顺序分别赋予每类里的聚类成员权值undefined,得到每个聚类成员的权重wk;

第4步 根据计算的权值生成加权共协矩阵;

第5步 使用基于共协矩阵的融合算法得到融合结果。

2.4 与基于共协矩阵的算法的比较

本文提出的算法与现有的基于共协矩阵的聚类融合算法相比,加入了权重的设计,重视到了聚类成员的质量,可以得到更好的融合结果。本文提出的权重的设计方法是根据计算簇内方差对聚类成员进行评价,根据其质量进行划分再赋予相应的权重。

当前的聚类融合算法大多不考虑进行融合的成员的质量,当聚类成员存在聚类质量差或者有噪声干扰时,融合结果将受到影响。权重的设计考虑到了融合成员的质量,可以减少当聚类质量差或者噪声干扰对融合结果的影响。

3 结束语

聚类融合算法对多个聚类结果进行融合,从而得到比单一算法更为优越的聚类结果。然而当存在聚类成员质量和噪声是会产生不良的融合结果。本文对现有的基于共协矩阵的聚类融合算法进行了尝试性的改进,用簇内方差对各个聚类成员进行质量的简单评价,并据此对其赋予权重,生成加权共协矩阵,进而得到融合结果。本文提出的改进算法能较好的处理聚类成员间的质量差异,并能有效的消除噪声对融合的影响,能够得到更好的融合结果。本文主要针对共协矩阵进行了加权设计,此种加权方法能扩展到其他融合算法,但是其最优性有待于进一步研究。

参考文献

[1]PANG-NI NG TAN,MICHAEL STEI NBACH,VIPI N KU-MAR.数据挖掘导论[M].范明,范红建,等,译.北京:人民邮电出版社,2005.

[2]JAI N A K,FLYNN P J.Data Clustering,A Review[J].ACM Computing Surveys,1999,31(3):264-323.

[3]邵良杉,王鹤.蚁群组合算法在证券行业客户细分中的应用[J].计算机系统应用,2008(3):84-86.

[4]阳琳赟,王文渊.聚类融合方法综述[J].计算机应用研究,2005(12):8-14.

[5]STREHL A,GHOSHJ.Cluster ensembles a knowledge reuse frame work for combining multiple partitions[J].Journal of Machine Learning Research,2003,3(3):583-617.

多模型多传感器标量加权信息融合 篇5

本研究针对多模型多传感器系统, 基于标量加权的最优信息融合算法, 给出了一种分布式标量加权最优信息融合Kalman滤波器。在融合中心只需要计算加权标量系数, 避免了加权矩阵的计算, 也避免了集中式估计要求大量观测数据的输入和在融合中心进行大量的滤波计算, 因而可减小在融合中心的计算负担。由于采用分布式的结构, 某些传感器出现故障, 可由剩余的传感器继续融合估计, 避免了集中式估计由于某个传感器出现故障而使整个系统不能工作的缺点, 所以它具有可靠性。

1 标量加权线性最小方差最优信息融合准则

新近文献[5]给出了一种标量加权融合算法, 与一般的矩阵加权相比, 它是一种次优融合准则, 但由于它只需计算加权标量系数, 避免了计算加权矩阵, 从而减小了计算量。特别是当系统状态维数较高时, 可明显减小计算负担。且仍能在总体上改善每个局部估计, 因而它具有工程应用价值。

引理1设为对n维随机向量z的L个无偏估计, 记估计误差为 (i≠j) 相关, 误差方差和互协方差阵分别为Pi2和P2ij, 则标量加权最优 (线性最小方差) 信息融合无偏估计为:

其中最优融合标量系数āi (i=1, 2, …, L) 如下计算:

其中向量ā=[ā1, ā2, …, āL]T, e=[1, 1, …1]T, 矩阵A= (tr P2ij) (i=1, 2, …, L) 相应的最优信息融合估计的误差方差阵为:

且有关tr P02≤tr Pi2, i=1, 2, …, L。

推论1当估计误差不相关时, 即P2ij (i≠j) , 则标量加权最优融合估计为式 (1) , 其中最优系数为:

相应的最小融合方差阵为:

2 多模型多传感器标量加权最优信息融合Kalman滤波器

考虑带L个传感器的多模型离散随机系统

其中:xi (t) ∈Rni为第i个子系统的状态, yi (t) ∈Rmi为第i个子系统的观测, 白噪声w (t) ∈Rri, vi (t) ∈Rmi分别为第i个子系统的系统噪声和观测噪声, Φi, Γi, Hi, Ci为适当维数的常阵。z (t) ∈Rn是待估计的状态向量, 它通常为xi (t) (i=1, 2, …, L) 的公共状态分量所构成的向量, 且n≤min{ni, i=1, 2, …, L}。

假设1 wi (t) 和vi (t) (i=1, 2, …, L) vi (t) 是带零均值的相关白噪声, 即:

其中δtk是Kronecker delta函数。且∑ij∑i。

假设2初始状态xi (0) 与白噪声wj (t) 和vj (t) (i=1, 2, …, L) 相互独立, 且

本研究目标是基于观测 (yi (t) , yi (t-1) , …yi (1) ) (i=1, 2, …, L) , 寻求最优标量权重āi (t) (i=1, 2, …, L) , 最后求得状态向量z (t) 的标量加权最优 (线性最小方差) 信息融合Kalman滤波器。

引理2多模型多传感器系统 (6) , (7) 在假设1, 2下, 第i个子系统有最优Kalman滤波器

其中:为第i个子系统的滤波估计, kfi (t) 为滤波增益, Pix (t+1|t+1) 为滤波误差方差阵。

定理1多模型多传感器系统 (6) , (7) 在假设1, 2下, 第i个与第j个子系统之间有如下递推的Kalman滤波误差互协方差阵

其中:Pxij (t|t) , i, j=1, 2, …, L, i≠j为第i个与第j个子系统之间的滤波误差互协方差阵, 初值为Pxij (0|0) =0。

证:由Kalman滤波器有第i个子系统滤波误差为:

代入上得:

又因为:

将 (19) 式代入 (20) 式, 因为, 所以

, i, j=1, 2, …, L记号⊥表示正交, 则可引出 (17) 式成立。证毕。

定理2多模型多传感器系统 (6) ~ (8) 在假设1, 2下, 有最优标量加权信息融合Kalman滤波器

其中:标量加权系数āi (t) (i=1, 2, …, L) 由引理1中的 (2) 式求, 且最小融合方差由 (3) 式计算, 基于第i个子系统的局部滤波器zi (t|t) 和局部滤波误差互协方差阵Pzij (t|t) 由下式计算:

其中i=j时, 即为滤波误差方差阵Piz (t|t) 。第i个子系统的滤波器, 局部滤波误差方差阵Piz (t|t) 和互协方差阵Pzij (t|t) , i≠j, 分别由 (11) , (16) , (17) 式计算。

证:对 (8) 式两边同时取在线性流形 ( (L (yi (t) yi (t-1) , …, yi (L) ) ) 上的射影运算引出式 (22) 。再由 (8) 和 (22) 引出 (23) 成立。证毕。

3 仿真研究

考虑3模型3传感器跟踪系统

其中:T为采样周期, 状态s (t) , 分别为目标在时刻t T的位置、速度和加速度。假设wi (t) 和vi (t) (i=1, 2, 3) 是相关高斯白噪声, 且满足如下关系:

w1 (t) =λ1w (t) , w2 (t) =λ2w (t) , w3 (t) =λ3w (t) , vi (t) =γiw (t) +ξi (t) , i=1, 2, 3.已知w (t) 是带零均值、方差为Qw的高斯白噪声。ξi (t) (i=1, 2, 3) 是带零均值、方差各为Qξi (i=1, 2, 3) 的独立的高斯白噪声, 且独立于w (t) 。在仿真中取采样周期T=0.1, , Qw=1, Qξ1=1, Qξ2=2, Qξ3=0.5, H1[1 0], H2[1 1], H3[1 0 0], λ1=0.9, λ2=0.95, λ3=0.013, γ1=0.5, γ2=0.8, γ3=0.9取200个采样数据。

仿真结果如下图所示。

在图1中的实线代滤波融合误差曲线, 其他三条虚线分别代表各子系统滤波误差曲线。由图可看出融合误差明显小于单个估计误差。图2中实现亦代表滤波融合估计曲线, 虚线代表子系统滤波估计曲线[6]。

4 结论

在实际应用中, 单传感器往往存在着不稳定性, 而多传感器则可以克服这些不足。本文对多模型多传感器给出了一种分布式标量加权的最优信息融合Kalman滤波器, 给出了局部子系统之间的滤波误差互协方差阵的计算公式。通过实验仿真可看出融合估计曲线位于中间部分, 代表融合估计综合了各子系统的估计信息, 验证了融合算法的有效性。

参考文献

[1]BAR-SHALOM Y.On the track-to-track correlation problem[J].IEEE Trans on automatic Control, 1981, 26 (2) :571-572.

[2]KIM K H.Development of track to track fusion algorithm[C].Proc of American Conference.Troy:Rensselaer Polytechnic Institute, 1994:1037-1041.

[3]CHEN H, KIRUBARAJAN T, BAR-SHALOM Y.Performance limits of track-to-track fusion versus.centralized estimation:theory and application[J].IEEE trans on Aerospace and Electronic Systems, 2003, 39 (2) :386—398.

[4]邓自立, 祁荣宾.多传感器信息融合次优稳态Kalman滤波器[J].中国学术期刊文摘 (科技快报) , 2000, 6 (2) :183—184.

[5]SUN S L.Multi-sensor optimal information fusion Kalman filter with application[J].Aerospace Science and Technology, 2004, 8 (1) :57—62.

加权特征融合 篇6

现代化生产中设备的状态检测技术越来越受到重视 , 人们投人大量精力进行设备故障诊断的研究。传感器的应用 , 使得设备的故障检测得到了发展 , 但在实际应用中 , 单个传感器往往存在一些缺陷 , 如信号采集不全面、不准确甚至错误、信号采集丢失、延时等等 , 因此人们研究出多个传感器的共同应用 , 即多传感器信息采集。多传感器信息融合技术是上世纪80年代形成和发展的一种自动化信息综合处理技术。多传感器的应用 ,可以更加有效、全面的采集信息 , 加速发展了信号处理技术。20世纪80年代初 ,Bar-shalom[1]就研究了带独立噪声的两传感器子系统之间的相关性。多传感器充分利用了多源数据的互补性及电子计算机运算的高速性和智能性 , 大大提高了信息处理结果的质量。随着应用系统日益扩大 , 所需的功能也越来越复杂 , 使用传感器的种类也相应的增多。原来的单一传感器检测技术已不能满足要求,于是对多传感器融合技术的研究也越来越多,文献 [2,3] 在正态分布的假设下分别给出一种极大似然融合准则 , 但融合时计算加权矩阵需要求解一个较高维数的矩阵的逆 , 不便于实时应用。文献 [4] 给出了一种标量加权的信息融合算法 , 但其假设局部状态估计误差不相关 , 这不符合一般情形 , 所以只能获得次优信息融合滤波器。

文献 [5] 针对多模型多传感器系统 , 基于标量加权的最优信息融合算法 , 给出了一种分布式标量加权最优信息融合Kalman滤波器。采用分布式的结构 , 某些传感器出现故障 , 可由剩余的传感器继续融合估计 , 避免了集中式估计由于某个传感器出现故障而使整个系统不能工作的缺点 , 所以它具有可靠性。本文在文献 [5] 的基础上 , 将真实值与信息融合估计值进行比较 , 得到故障诊断系统的残差 , 通过仿真图形中的毛刺 , 进行故障诊断的判断。

2 标量加权线性最小方差最优信息融合准则

文献 [6] 给出了一种标量加权融合算法 , 与一般的矩阵加权相比它是一种次优融合准则 , 但由于它只需计算加权标量系数 , 避免了计算加权矩阵 , 从而减小了计算量。特别是当系统状态维数较高时 , 可明显减小计算负担。且它仍能在总体上改善每个局部估计 , 因而它具有工程应用价值。

引理设为对n维随机向量z的L个无偏估计 , 记估计误差为(i ≠ j) 相关 , 误差方差和互协方差阵分别, 则标量加权最优 ( 线性最小方差 ) 信息融合无偏估计为

其中最优融合标量系数如下计算

其中向量, 矩阵相应的最优信息融合估计的误差方差阵为

且有关系

3 多传感器标量加权最优信息融合Kalman 滤波器

考虑带L个传感器的离散随机系统 , 并在状态空间模型中加入故障干扰f(t), 得到如下 (4)~(6) 式含有扰动和故障的多传感器系统 :

其中 :x(k) ∈Rn是状态向量 ,y(k) ∈Rm是观测向量 ,w(t),vi(t) 分别为系统的系统噪声和第i个传感器的观测噪声 ,f(t) 为白噪声描述的故障信号 , 且A,B,Bf,Ci,Dfi是适当维数的矩阵。下标 (i) 表示第i个传感器 ,L表示传感器个数。

假设w(t) 和vi(t)(i=1,2,…L) 是带零均值的相关白噪声。

为了方便推理及计算 , 本文采用增广的方法 , 将系统扩维增广得到新系统方程如下 :

其中 :BW(t)=BwW(t)+Bff(t),V(t)=vi(t)+Dfifi(t), i=1,2,…L。其它定义假设条件同上给出。在扩维后的系统方程下 , 使用Kalman滤波方法 , 对增广后的系统进行滤波设计 , 从而得到带有故障信息的状态估计 , 并得到相应的滤波器和滤波误差,从而进行残差χ2检验。

定理1增广系统 (7)~(9) 在假设下有最优Kalman滤波器

其中 :为系统的滤波估计 ,kf(t) 为滤波增益 ,Px(t+1 │ t+1) 为滤波误差方差阵。

定理2增广系统 (7)~(9) 在假设下 , 系统有如下递推的Kalman滤波误差方差阵

其中 :Px(t│t) 为系统的滤波误差互协方差阵 , 初值为Px(0│0)=0。

证明 : 首先 , 根据真实值与估计值之差 , 得到滤波误差计算公式

由Kalman滤波器

有系统滤波误差为

其中 :为新息 , 将代入 (17) 得

又因为

将 (18) 式代入 (19) 式进行计算 . 因为

所以记号 ┴ 表示正交 , 则可引出 (16) 式成立。证毕。

定理3增广系统 (7)~(9) 在假设下 , 有最优标量加权信息融合Kalman滤波器

其中 : 标量加权系数由引理 (2) 式求 , 且最小融合方差由 (3) 式计算 , 基于第i个子系统的局部滤波器Z(t │ t) 和局部滤波误差互协方差阵由下式计算 :

PZ(t│t) 为滤波误差方差阵。

证 : 对 (9) 式两边同时取在线性流形 ((L(yi(t)yi(t-1),…,yi(L))) 上的射影运算引出式 (21)。再由 (9) 和 (21)引出 (22) 成立。证毕。

通过滤波得到的状态估计计算残差 , 残差公式表示如下 :

将 (8) 式两边分别取射影 , 并带入 (13) 式 , 可以得到如下的残差计算公式

在不存在故障时 , 系统应满足状态方程式 , 即为X(k) 的无偏估计 , 所以残差 ε(k) 是零均值高斯白噪声向量 ; 当传感器发生故障 , 那么系统就不再满足状态方程式 , 因此残差均值不再为零。故对系统测量信号的均值作假设检验 , 即可判决传感器是否有故障。

4 仿真研究

考虑如下两传感器系统

取系统噪声方差Qw值为1,yi(t),i=1,2是两个传感器的观测信号 ,vi(t),i=1,2是传感器的观测噪声 , 并分别取方差为Qv1=1, Qv2=9。初始值设为x(0)=[0 0]T, 故障诊断仿真结果如下 :

仿真中首先取故障信息为零 , 来验证滤波融合算法。图1中分别给出的是状态的误差方差 , 最下面一条曲线为信息融合后的误差曲线 , 可以看出融合后的误差明显低于单个传感器 , 图2这种 , 中间的红色曲线为融合后的滤波估计 , 从图中可以看出 , 融合后的曲线在两条估计曲线中间 , 综合了两条曲线的值 , 使得滤波估计更加准确 , 从而验证了标量加权算法的有效性。

当没有故障存在的情况下 , 残差几乎为零如图3,当出现异常情况时 , 残差则不为零 , 如图4所示 , 则可以判断出故障。

5 结束语

在实际故障诊断中 , 单传感器往往存在着不稳定性 , 而多传感器则可以克服这些不足。本文对多传感器故障信息模型给出了一种分布式标量加权的最优信息融合Kalman滤波器 , 给出了滤波误差方差阵的计算公式。通过实验仿真看出故障信息可以被成功检测。验证了融合算法的有效性。

参考文献

[1]BAR-SHALOM Y.On the track-to-track correlation problem[J].IEEE Trans on automatic Control,1981,26(2):571-572.

[2]KIM K H.Development of track to track fusion algorithm[C]//Proc of american Conference.Troy:Rensselaer Polytechnic Institute,1994:1037-1041.

[3]CHEN H,KIRUBARAJAN T,BAR-SHALOM Y.Performance limits of track-to-track fusion versus.centralized estimation:theory and application[J].IEEE trans on Aerospace and Electronic Systems,2003,39(2):386-398.

[4]邓自立,祁荣宾.多传感器信息融合次优稳态Kalman滤波器[J].中国学术期刊文摘(科技快报),2000,6(2):183-184.

[5]王金玉,何艳,朱国强等.多模型多传感器标量加权信息融合[J].黑龙江科学,2014,2(1):9-11.

[6]SUN S L.Multi-sensor optimal information fusion Kalman filter with application[J].Aerospace Science and Technology,2004,8(1):57-62.

一种改进的多传感器加权融合算法 篇7

多传感器数据融合是近几年迅速发展的一门信息综合处理技术, 它将来自多传感器或是多源的信息和数据进行综合处理, 从而得出更为准确可信的结论。此项技术的应用不仅可以提高系统的精度和可靠度, 还可以提高系统的量测范围、增加系统的可信度、缩短系统响应时间。在数据融合中, 加权融合算法是较为成熟的一种融合算法, 该算法的最优性、无偏性、均方误差最小等特性在许多研究结果中都已经被证明。加权融合算法的核心问题是如何确定权重, 权重的选取直接影响融合结果。

常用的方法有加权平均法, 加权平均是一种最简单和直观的方法, 即将多个传感器提供的冗余信息进行加权平均后作为融合值。该方法能实时处理动态的原始数据, 但是权重的确定具有一定的主观性, 在实际应用中, 效果并未达到最优。本文采用二次加权的方法, 并引入最优比例权重的概念, 先对单个传感器进行加权, 再对整体进行加权并导出基于改进算法的加权融合公式。通过仿真, 并与加权平均融合算法中采用的等权重融合算法进行比较, 验证该算法的有效性。

多传感器数据加权融合

加权数据融合是多个传感器对某一个环境中的同一特征参数的数据进行量测, 兼顾每个传感器的局部估计, 按某一原则给每个传感器制定权重, 最后通过加权综合所有的局部估计得到一个全局的最佳估计值。

加权平均融合算法

假设在n个传感器的融合系统中, 传感器s1, s2, …, sn对同一个目标进行状态估计, 第i个传感器在第k时刻的局部状态估计值为ˆkix, (i=1, 2, …, n) 。假定ˆkix是无偏估计, 且任意两个传感器局部估计误差之间互不相关。

设各个传感器的权重分别是w1, w2, …wn, 则融合后的状态估计值为ˆkix和权重满足的条件为:

加权平均融合算法通常选用数学平均式, 即将各个传感器的权重选取的近似相等, 设等权重为w, 并根据式 (1) 经过局部融合后的状态估计值为:

改进的加权融合算法

提出改进的加权融合算法采用二次加权的方法, 并引入了最优比例权重的概念, 先对单个传感器进行加权, 再对整体进行加权, 目的是使算法性能达到最优。

单个传感器一次加权

获得观测数据的方法一般是采用单个传感器, 由于传感器的系统方差是固定不变的, 所以减小估计均方误差的唯一方法就是增加观测数据, 而增加观测数据就会使运算量增大并且收敛速度降低, 多传感器数据融合可以解决此问题。但是在多个传感器中, 一个或者更多的传感器在观测噪声很大或是估计值发散的情况下, 进行数据融合, 同样会使融合系统性能不稳定并导致严重的估计偏差。所以, 在进行多传感器数据融合之前, 要对单个传感器的状态估计值进行加权, 使估计值快速收敛目的是为了给融合系统输入稳定的融合数据, 使融合后的估计值达到最优状态。

单传感器加权思想:在某时刻方差最小情况下, 利用此时刻的状态估计值与此时刻观测值与此时刻的状态估计值的和的比值作为权重, 定义它为最优比例权重。用此权重去加权, 目的是校正那些发散或是估计偏差较大的估计值, 使其收敛, 为多传感器数据融合系统提供良好稳定的数据源。

当min PK时, 最优比例权重为

所以单传感器加权公式为:

Wk为在第k时刻方差最小情况下的最优比例权重;vj为t个时刻的观测值与状态估计值之和;为加权后的t个时刻的状态估计值。

多传感器二次加权融合

多传感器数据融合目的是使对目标的估计精度达到更高, 但由于传感器的方差固定不变, 所以, 在进行融合时要考虑传感器的方差对融合权重的影响。设多传感器融合权重为:

因此, 求解αi满足什么条件使得的值最小, 我们可以给出一个带有约束条件的多变量的目标函数:

约束条件:

对目标函数求αi的偏导数:

令函数F (αi) 取得最小值。所以得到:

并由公式 (7) 和 (9) 得到:

将 (10) 代入 (9) , 最后得出多传感器融合权重为:

所以, 由公式 (5) 和 (4) 可以推导出改进的二次加权融合算法公式:

约束条件:

为在第j时刻的融合估计值;αi为融合权重;kWi第i个传感器在第k个时刻的最优比例权重;vji第i个传感器在第j时刻的观测值与估计值之和。

改进的加权融合算法的运算流程及计算机仿真实验

算法的运算流程

1.先对多传感器中的单个传感进行处理, 单传感器对一个目标不同时刻的状态估计值多采用Kalman递归滤波算法, 根据初始的误差方阵P0, 根据递归公式, 可以计算出t个时刻的误差方阵PK (k=1, 2, ..., t) , 计算出mintrace PK的时刻k。

2.开始根据初始值进行递归计算, 根据计算t个时刻的vt, 然后根据第一步的计算, 可以确定k时刻的PK最小, 然后计算出最优比例权重。

3.对发散数据或是估计精度差的数据, 我们根据最优比例权重, 对其进行加权, 根据公式 (4) , 计算出加权后的状态估计值

4.由每个传感器的方差并根据公式 (11) , 可以计算出融合权重αi, 将上一步骤中的经过加权的各个传感器的状态估计值进行融合, 根据公式 (12) , 计算出融合值。

从以上运算流程中可以看出, 对于每个传感器只需在其方差最小的情况下, 就可计算出各自的最优比例权重。然后再根据它们的固定方差, 计算出融合权重。

计算机仿真实验

下面先对单个传感器进行仿真, 分别采用未进行加权和最优比例权重进行加权两种算法进行比较。考虑传感器系统的观测方程为:z (t) =[1, 0]x (t) +v (t) 。目标模型为:用M A T L A B进行5 0步的递归计算, 得出状态估计值, 如图1, 图2所示。

通过仿真, 对图1和图2进行比较可以看出, 采用最优比例权重进行加权处理的单个传感器的估计精度要高于未采用最优比例权重进行加权的单个传感器的估计精度, 此方法可以提高估计精度。

两种算法的仿真比较

考虑三个传感器的二维跟踪系统:

其中T为采样周期, x (t) =[xl (t) , x2 (t) ]T, xl (t) , x2 (t) 和w (t) 各为在时刻t T运动目标的位置、速度、和加速度, 且z (t) 为对x (t) 的观测信号, v (t) 为观测噪声。

设w (t) 和vi (t) 是零均值、方差阵各为σw2和σ2iv的独立高斯白噪声。且

用Matlab进行仿真, 产生200个周期三个传感器跟踪目标的状态估计数据和两种算法的融合数据。

图3是三个传感器的状态估计值及改进的融合算法、平均加权融合算法的估计值与真实值的比较, 图4是改进的融合算法与平均加权融合算法的状态滤波误差曲线的比较。从图3和图4中可以看出, 经过多传感器融合后, 不管用哪种融合算法, 目标航迹较原来单传感器跟踪都有很大的改善。

本文提出的改进加权融合算法的融合效果明显优于单传感器跟踪, 通过图3和图4进行的两种融合算法的融合估计值及方差比较, 也可得出改进融合算法优于平均加权融合算法的结论。

结语

针对多传感器数据融合中, 传感器系统方差较大, 对加权融合会产生不利影响。针对此问题, 本文引入最优比例权重的概念, 利用二次加权的方法, 提出了改进的加权融合算法。在此基础上得出了改进加权融合算法的计算公式, 通过计算机仿真实验, 并与平均加权算法进行比较证明了此改进融合算法的有效性。

参考文献

[1]韩崇昭, 朱洪艳, 段战胜.多源信息融合[M].北京:清华大学出版社, 2006

[2]Chong C Y.Distributed architectures of data fusion, Proc of1st International Conf on Information Fusion[C], LasVegas, NV, 1998:84-91

[3]Chong C Y, Mon S, Chang K C, et al.Architectures and algorithms for track association and fusion, Proc of2nd International Confon Information Fusion[C], Sunnyvale, CA, 1999

[4]Shozo M, Barker W H, Chong C Y.Track association track fusion with nondeterministic dynamic target[J].IEEE Trans onAerospace and Electronic Systems, 2002, 38 (2) :659-668

加权特征融合 篇8

1 特征参数的混合方差优化加权系数法

本系统实验取16阶倒谱系数作为研究对象, 做了以下几组实验: (1) 同一说话人在不同时期说同样的话时的倒谱系数变化; (2) 同一说话人说不同话时的倒谱系数变化; (3) 不同说话人说同样话时的倒谱系数变化; (4) 不同说话人在说不同话时的倒谱系数变化。如图1所示是各组实验的各阶倒谱系数的变化图。

图1中, (a) 、 (b) 、 (c) 为说话人甲“说话”一词在不同时候的倒谱各阶系数分布; (d) 图为说话人甲“美丽”一词的倒谱各阶系数分布; (e) 、 (f) 分别为说话人乙“说话”、“录音”一词的倒谱各阶系数分布。

从大量实验中可以看出: (1) 同一说话人在说不同的话时, 各阶倒谱系数的变化幅度是不同的。变化幅度越小, 则认为该阶倒谱系数的顽健性越好;反之则认为顽健性越差。因为各阶倒谱系数顽健性的差异, 所以为了提高整体语音特征参数的顽健性, 就必须加大顽健性好的阶数的权值, 同时相应地降低顽健性差的阶数的权值。经过这样的处理, 就可以使同一说话人在特征空间差别变小, 即使得类内距离减小。 (2) 同样, 不同人在说同一句话时, 各阶倒谱系数的变化幅度也是不同的。变化幅度越大越利于突出特征, 提高说话人辨别的精度;反之则弱化特征, 降低识别精度。为了使不同说话人在特征空间的差别变大, 即使得类间距离增大, 需要依照变化幅度的不同对倒谱各阶系数进行加权。变化幅度大的, 就加大该阶倒谱系数的权值, 否则降低权值。

类内和类间对各阶倒谱系数所加的权值是不同的, 有些倒谱阶系数对减少类内 (类间) 距离的贡献大些, 但是对扩大类间 (类内) 的距离贡献却很小。因此综合考虑二者的影响, 对两种加权值做乘法, 将积作为对应阶倒谱系数的最后权值。具体类内及类间权值的确定按下面的方法进行。

2 类内权值的确定

特征矢量各维的方差为:

式 (1) 中M为特征矢量的个数, 则整体平均方差为:

式 (2) 中Wik=0表示忽略特征的第k维参数, 故有Wik>0的约束。这里可以将约束表示为:

式 (3) 中c为正常数, 可以设c为1。则优化Wik的问题变为在上式约束下的使F最小的问题。用拉格朗日乘子法解此线性规划问题, 由上述的目标函数式和约束得到无约束的目标函数:

解此无约束优化问题, 可得最佳的权系数为:

式 (5) 中,

Wik为每一特征矢量对应阶数k所加的权重, 它与第i帧中第k维特征参数的方差成反比, 与Gi (帧特征参数均方差) 成正比。很显然, 方差越大, 则权重越小, 反之越大。

3 类间权值的确定

为了增大类间距离, 这里对特征参数的各阶进行加权, 其方法如下:

设xi是第i阶特征参数, 对它进行变换yi=wixi, 其中:

式 (7) 中, N是说话人总数, m是特征向量的个数, T为特征参数的阶数。σni是第n个说话人的第i阶特征参数的标准差。L2mni表示第m个说话人和第n个说话人的第i阶特征参数分布之间重叠的一种度量, 这种方法近似为正态分布。L2mn i由下式给出:

其中µni是第n个说话人第I阶特征参数的均值, εi是一个正常数, 它是根据第I阶特征参数的分布而选取的。图2表示了Lmn i的情况。

4 实验

实验共录制了50个说话人的话音, 25男25女。话音在普通实验室环境下录制, 麦克风的音量在半刻度以上。按照日常说话习惯录音, 没有特殊要求, 内容不限。每个人录制两段话, 前一段话10s用于训练模型, 另外10s用于测试语音。采用频率为22050Hz, 量化位数为16位。

实验结果如表1。

5 结语

实验证明, 采用语音特征参数的混合方差优化加权系数法, 较好地补偿了不同时期说话人自身特征的变化而带来的语音特征参数的时变性, 可提高了语音特征参数的顽健性和系统的识别精度。

摘要:针对语音特征参数受说话人说话内容的不同、年龄、病变等因素的影响而带来的说话人识别精度的降低, 本文提出了特征参数的混合方差优化加权系数法, 经大量实验和研究证明, 该方法能够提高语音特征参数的顽健性, 提高了说话人识别的精度。

关键词:语音特征参数,混合方差,加权系数法

参考文献

[1]王炳锡.语音编码[M].西安:西安电子科技大出版社, 2001.

[2]易克初, 田斌, 付强.语音信号处理[M].北京:国防工业出版社, 2001.

[3]边肇祺, 张学工.模式识别[M].北京:清华大学出版社, 2001.

[4]朱民雄, 闻新, 黄健群, 等.计算机语音技术[M].北京:北京航空航天大学出版社, 2001.

[5] (美) L.R.拉宾纳, B.戈尔德.史令启[译].数字信号处理的原理与应用[M].北京:国防工业出版社, 1984.

上一篇:不规则抗体下一篇:急性结膜炎急诊分析