特征提取方法论文(共12篇)
特征提取方法论文 篇1
0 引言
生物特征识别技术是通过计算机对人体所固有的生理或者行为特征进行的个人身份鉴定, 它是利用人的生理或者行为特征进行的身份识别。目前研究最多的生物特征是指纹和步态特征。
1 国内外研究动态
步态 (Gait) 的基本定义为:“A particular way or manner of moving on foot”。在国内, 许多大学和机构正在进行步态识别技术的研究, 其中处于领军地位的是由归国博士谭铁牛领导的中科院自动化研究所, 其研究取得了令人鼓舞的成果, 如王亮和胡卫明提出的基于统计主元分析的方法, 使用14个相互连接的圆台对人体建模, 通过一定的运动约束, 将人体用一个12维的动态特征向量表示, 通过姿态评价函数对视频中的人体姿势进行恢复, 提取模型参数进行步态识别。韩鸿哲等提出了基于傅里叶描述子的步态识别方法;程琼等通过对步态轮廓展开曲线的分析并和文献[2]中的方法进行了比较, 提出了基于傅里叶描述子和人工神经网络的步态识别算法, 取得了很好的识别率;袁琪等人提出了基于双线性建模隐马尔科夫模型的步态识别算法, 将特性分别看做“内容”和“风格”, 对图像序列以状态确定的连续HMM-EM估计“内容”类型, 引入非对称双线性模型理论对结果建模, 通过SVD和NN聚类实现对“风格”的归类判定。该算法能有效提高判别率, 对未知风格或者内容类型判断有较好的适应性。同时对影响步态识别准确性的其他因素也做了讨论;从多元统计学的角度对实验数据进行分析证明了通过步态进行身份鉴别的可行性。同时, 主成份分析显示, 在VGRF曲线中, 对步态识别起比较重要作用的足部接触地面瞬间的部分也进行了讨论。彭彰等人提出了一种基于肢体长度参数的用于多视角情况下的步态识别算法。首先对某个人的一个步态序列利用动态Viterbi算法得到一个样本姿态序列, 对其多个步态样本姿态序列的对应姿态去平均得到这个人的特征姿态序列, 然后对特征姿态利用主成份分析法处理特征空间, 最后利用最近邻法进行识别, 取得了较高的识别率, 并对体形变化具有较强的鲁棒性;苏菡等人提出了一种新的提取肢体角度的方法, 该方法通过分析侧影宽度变化获取角度信息, 无需对人体建模。
在国外, 同样也有很多的学校和研究机构对步态的识别进行研究。最早识别行人的方法是由Niyogi与Adelson提出的;Cunado等不仅考虑人行走过程中双腿的运动情况, 用链接的钟摆模拟腿部的运动变化, 而且从其倾斜角度信号的频率分量中获取步态特征;Lee采用7个椭圆表达人的侧面二值化图像的身体的不同部分, 每个椭圆用质心等4个特征表示, 加上整个身体图像的质心的高度一共29个特征表示整个人体侧面图像, 通过模板匹配的方法进行步态识别;Yoo等人根据解剖学的知识, 提取除头、脖颈、肩、胸、膝盖和脚踝的位置。然后计算各个位置的运动学特征进行步态的分类识别。近来, 文献[3]从光流图像中提取对应于行走周期的运动图像序列, 然后借助主助特征空间变换获得步态特征;文献[4]提出了一种基于步态图像自相似性的非参数化的方法和一种基于步态的周期和跨距的参数化的方法进行步态身份认证。Nixon等人使用XYT的方法, 将步态视频序列看作一个时间序列, 利用头部和腿部在XT维的模式确定身体运动轮廓线, 并利用5棒模型进行拟合, 归一化后进行识别;文献[5]提出了利用步态序列图像光流的频率和相位信息进行步态识别;文献[6]利用人的二值化图像的侧面外轮廓宽度矢量作为图像的特征, 利用K近邻方法进行步态的分类识别;文献[7]采用运动能量图像和运动历史图像来解释图像序列中人的运动;文献[8]的方法取了4个静态参数用于身份识别, 即体长、躯干长、腿长和步长;文献[9]将人体分成7个部分, 用椭圆对每一部分建模, 对每一帧形成合计29个特定参数。通过图像序列中各帧特征参数获得步态特征;文献[10]将大腿建模为链接的钟摆, 并从大腿移动及旋转得到倾斜角度信号的频率分量中获取步态特征, 以步态参数中的地面支反力作为特征进行识别的研究鲜有报道, 曾有文献对支反力的功率谱密度作为特征参数进行步态识别;文献[11]通过层次化的人体形状及运动模型估计生成具有标准人体比例的通用形状模型;文献[12]综合人体静态与动态生物特性, 结合两种特征表示提高身份识别性能。
2 步态识别各阶段
步态是一种时空运动, 它在空间上表现为在每一帧图像里的运动轮廓;而在时间上, 它体现了这些单个轮廓随着时间的变化过程。步态识别主要是针对含有人的运动图像序列进行分析处理, 通常包括运动图像检测、特征提取与处理和识别分类3个阶段, 如图1所示。
在进行步态识别之前要对图像序列先进行预处理, 将前景目标从背景图像中提取出来。预处理采取何种图像处理技术取决于识别算法想要提取的特征是什么, 但是预处理的结果又极大的影响了后续处理的精度。
2.1 预处理
预处理阶段需要对运动目标的提取, 常用的方法有背景剪除法、时间差分法和光流法。后两种方法都可用于运动摄像机的情形, 对动态环境的适应能力比较强, 但帧间差的结果精度不高, 难以获得目标所在区域的精确描述;光流法则具有相当高的复杂度, 但如果没有特殊硬件的话, 难以符合视觉监控系统实时处理的要求。背景剪除法适用于摄像机静止的情形, 它为静止背景建立背景模型, 通过将当前图像帧和背景模型进行比较, 确定出亮度变化较大的区域, 即认为是前景区域。基于算法复杂性和检测有效性的考虑, 本文采用背景剪除法进行运动区域分割。
首先, 我们使用中值法从图像序列中恢复出背景, 即将输入的连续N幅图像的像素值的中间值作为背景图像的像素值。令{Ik, k=1, 2, …N}代表一个包含N帧图像的序列, 则背景图像b可用以下公式获得:
其中Ik是 (x, y) 处的灰度值, b是背景图像。
运动区域亮度的变化通常是用当前图像与背景图像的差分获得 (如式2) , 但直接差分中阈值的选取比较困难, 尤其是在前景和背景较为相近的情况下。因此我们借用间接差分的方法以提高对噪声的抑制作用, 然后选取合适的阈值进行二值化处理, 最后分割出当前图像中运动的像素:
其中a (x, y) 为前景像素灰度值, b (x, y) 为背景像素灰度值, 选择适当的阈值, 得到二值化的运动目标区域:
这样得到的二值化图像会有小的孔洞, 最后采用形态学算子填充孔洞。
2.2 步态检测
步态识别的基本思想是用知识或者统计的方法对步态建立模型, 比较所有可能的待检测区域与步态模型的匹配度, 从而得到可能存在步态的区域。常用的步态检测方法有:差分图像法、互相关分析法、时空梯度法等。然而, 由于背景图像的动态变化, 如天气、光照、影子及其他干扰等的影响, 使得步态检测成为一项相当困难的工作。
因此许多研究人员目前都致力于开发不同的背景模型, 以期减少动态场景变化对运动分割的影响。例如Stauffer与Crimson利用自适应的混合高斯背景模型, 并利用在线估计来更新模型, 从而可靠地处理光照变化、背景混乱运动的干扰等影响, 在目标运动速度缓慢的情况下亦能较好的完成运动区域的分割, 并可以有效地消除影子的影响;张今瑜等人建立了基于多传感器系统的测量模型, 并分析了步态相位关系。采用鞋底传感器与膝盖关节弯曲传感器的信息融合实现了步态相位识别和COP的在线检测, 取得了较好的测试效果。
2.3 步态特征提取与表示
步态特征提取与表示是步态识别的关键, 可以分为基于模型的方法和基于特征的方法。基于模型的方法是将人用合适的模型表达, 跟踪分析模型的参数, 进行步态的识别。基于特征的方法是直接从人体图像当中提取出步态的特征数据用于步态的识别。
由于输入的步态特征维数较高, 一般都会选择合适的方法来提取低维的步态特征。而主成分分析PCA是一种常用的特征提取方法, 在脸像识别方面是特别强有力的工具。其主要目标是在大的输入空间中寻找合适的特征向量, 并在所有的特征中提取主要特征。子特征选择过程中, 主要将输入空间映射到输出空间, 从而获得输入的特征, 即输入的主分量;而特征提取过程也就是降维的过程, 在该过程中选择主要的特征而舍去其它特征分量。
2.3.1 基于特征的方法
基于特征的方法是特征化人体整个运动模式以得到简洁的运动特征表达。行人运动时人体的轮廓形状随着时间而变化, 一般选取人体侧面轮廓作为研究的特征图像, 人在行走时在足够长的时间内可以认为是一种周期变化的过程, 为了减少计算的复杂程度, 将二维轮廓形状变化转换为一维的距离信号来近似表达这种步态运动的时空变化模式。人的运动区域获取后, 基于连通性的边界跟踪算法用于获取它的轮廓, 同时计算它的质心利用投影质心之间的归一化欧氏距离来度量序列之间的相似度。
2.3.2 基于模型的步态特征提取与表达
基于模型的方法可以分为椭圆模型和线图模型。
椭圆中心和身体质心的连线以及椭圆的结构包含了人体静态结构信息;在步行的过程中, 模型结构的变化反映了步行过程中人体运动的动态信息。例如, 表示头部的椭圆与身体质心的相对位置变化、连线长度变化反映了步行过程中头部的运动特征。
2.4 步态特征提取
步态的识别方法主要分为以下两种:模板匹配方法 (Template Matching) 和状态空间方法 (State Space Approach) 。模板匹配方法是将图像序列转换为一组静态形状模式, 然后在识别过程中和预先存储的行为标本比较。把相似度作为分类的标准, 常采用最近邻算法进行识别。最具代表性的是中科院王亮等提出的基于Procrustes形状分析的步态识别方法。
状态空间方法:定义每个静态姿势为一个状态, 状态之间通过某种概率联系起来。任何运动序列可以看作为这些静态姿势的不同状态之间的一次遍历过程, 在这些遍历期间计算联合概率, 其最大值被选择作为分类的标准。目前, 状态空间模型已经被广泛地应用于时间序列的预测、估计和检测, 最具有代表性的是隐马尔可夫模型 (HMM) 、动态时间规划 (Dynamci Time Warping, DTW) 、神经网络 (Neutral Network, NN) 等, 其中HMM是一种随机状态模型, 是分析时空变化中随时间变化数据的先进技术。
3 结束语
基于步态的身份识别的研究还处于初级阶段, 需要做的工作还很多, 期望下一步工作能提高步态识别的质量、寻求更有效、更可靠的步态特征、更为有效的步态识别算法和分类器, 并且能在更大规模更多视角的数据库上进行算法性能测试, 创建具有一定规模的评估数据库、提高系统的评估方法、按照科学的方法观察影响性能的关键因素、开发潜在的人体模型的静态参数特征以及关节角度的动态特征等, 以便早日实现能够在现实场景中使用基于步态的身份识别系统。
摘要:对步态识别的国内外研究现状进行了详细的论述;介绍了基于步态识别的身份识别过程, 阐述了在步态识别各阶段用到的一些方法;对步态识别的下一步工作进行了探讨。
关键词:步态识别,特征提取,步态图像序列,主成分分析
特征提取方法论文 篇2
介绍了利用改进时序模型提取空间飞行器推进系统特征参数的方法.利用此方法,结合某飞行器推进系统试验的.实测数据,提取出了相应的特征参数,并以此为基础得出了故障判据的阈值.数据回访表明此阈值较领域专家提供的阈值对“泄漏”故障更为敏感,结合多参数辅佐检测,可以很好地完成推进系统的故障检测功能,具有工程实用可行性.
作 者:张纯良 张振鹏 祝刚 作者单位:张纯良,张振鹏(北京航空航天大学,宇航学院,北京,100083)
祝刚(空军第一航空学院,河南,信阳,464000)
特征提取方法论文 篇3
关键词:高分辨率;道路提取;遥感影像
随着遥感技术的发展,越来越多的商业化卫星可以提供相当高分辨率的遥感影像数据,目前已达米级甚至亚米级,目前主流的高分辨率卫星及其空间分辨率如表1所示。这些高分辨率遥感影像为很多应用提供了有利的条件,例如土地资源调查、地理数据更新、土地利用和土地覆盖变化监测等。准确快速地从遥感影像中提取感兴趣信息是遥感的一个热门研究方向。其中,道路信息的提取更是研究热点,因为道路不仅是基础的地理信息,而且为提取其他地物提供了参考[1]。本文分析了道路在遥感影像中的特征,然后对目前在遥感中常用的道路提取方法进行了分析和对比,最后对遥感中道路提取方法的发展方向进行了展望。
1. 道路特征提取的原理
道路在高空间分辨率的遥感影像上,通过人工解译是很容易被识别和提取出来的,这主要是因为道路的物理和几何特性与其他地物有明显的区别,因此,只有明确道路的特征,然后才可以通过计算机进行自动识别。道路的特征可以大体分为两类,一类是物理特征,一类是几何特征[2]。
物理特征主要指道路的成分,通常与其他地物不同,例如,水泥路、柏油路等。在遥感影像上,这一点就体现在辐射特征的不同上,道路的辐射特征与相邻其他地物的辐射特征差异明显,这在一定程度上可以通过监督方法,自动提取出道路。
几何特征包括道路的形状特征、拓扑特征及上下文特征。道路的形状通常为长条状,长度与宽度之比非常大,而且道路的变化较小,即使是弯道,也有曲率的限制。拓扑特征是指道路通常是相互交叉的,以道路网的形式存在。上下文特征主要是指道路上的标志、高速路中间的绿化带以及行人斑马线等[3]。
基于以上特征,我们可以在高、中、低三个层次上进行道路特征提取。低层次主要依赖各种基本要素,包括特征点、线、面,边缘及纹理等,这一层次较少涉及道路的相关知识;中层次是在低层次结果的基础上,对多种特征进行分析、整合、精简等,形成一定的结构化;高层次则要求利用道路的相关知识及规则,从而识别道路。
2. 道路特征提取现状
目前,通过计算机对道路进行提取,大体可以分为两种,一种是监督道路提取,一种是全自动道路提取。
2.1 监督道路提取
监督道路提取主要是采用人机交互的模式。首先,由人工选取道路的起始点和起始方向,然后设置规则,由计算机进行处理识别,通常在识别过程中,还需要进行适当的交互,以此确保识别的精度。这一过程通常包含如下四个步骤:第一,对遥感影像的道路特征进行增强;第二,确定道路的起始点和起始方向;第三,扩展和跟踪起始点,提取道路段;第四,将各个道路段连接,从而形成道路网[4]。
具体方法包含五种:分别是动态规划法、基于模型法、主动试验法、模板匹配法、概率论法和基于知识的方法。
动态规划法通常将识别问题转化为最优化问题,即将道路起始点与其他点之间赋予代价函数,然后计算点与点之间的最优路径。这种方法最早是从低分辨率遥感影像道路提取中发展来的,实验表明,这种方法对于道路边界提取效果一般,但是对道路中心线提取精度较高。
基于模型法即将影像的各种特征通过函数表达出来,然后对该函数求极值从而提取目标。常用的模型有Snakes及其多种改进算法(例如,LSB-Snakes, Ziplok Snakes, Double Snake),Active Contour模型等[5]。
主动试验法是通过选定道路起始点和起始方向从而获得道路的统计模型特征,以此建立决策树;然后,用决策树对道路进行跟踪提取。在高分辨率影像中,通常要假定道路段为矩形,结合主动试验法提取道路中心线。这种方法由于有限制条件,因此对道路中心线的提取效果一般。
模板匹配法即用戶首先选取感兴趣的特征点,然后为这些特征点定义一个特征模板,最后将其他点与特征模板进行匹配,当相似度达到要求的时候即匹配成功。
概率论法将道路的边缘假定为一个随机过程路径,该随机过程是基于统计模型驱动的。通过后验概率判定道路是否被准确提取。
基于知识的方法是通过人工的认识转化为判定道路的规则,以此来提取道路。这种方法的思路是首先提取道路片段,然后将对该道路片段的认识转化为道路识别规则,然后用建立的规则对影像其他部分的道路进行提取。这种方法的好处是在建立规则的时候,可以采用多种特征,而这些特征又不存在冗余,所以该方法不仅准确率高,而且速度快。但是这种方法对于操作人员的专业知识要求较高,不仅要有遥感知识,还要有其他多学科的知识。
2.2 全自动道路提取
全自动道路提取即不加入人工干预,直接设定规则,由计算机自行判断并提取。这类方法包括平行线法、中心线探测法和统计模型法等。
平行线法是从道路的几何特征出发,因为道路边缘可以看成是一组平行线,因此,根据这一特征可以设计一种道路边缘提取算法。这种方法在数学形态学中可以简化为三个过程:一是影像分割及直线提取;二是降低影像分辨率提取道路轮廓;三是根据上一步骤提取的道路轮廓线,从第一步骤提取的直线中确定道路边缘[6]。
中心线探测法即道路中心线检测,通常对影像进行分割,然后在分割的基础上,提取中心线,再结合道路的灰度特征、几何特征对中心线周围的区域进行合并,最终形成道路网。
统计模型法不依赖于某个因素,因此适合道路提取这种相对复杂的地物。可以通过几何概率分布模型,设置窗口,对道路进行检测提取。这种方法对道路有一定的要求,包括道路宽度变化不能太大、局部辐射亮度变化较小、道路曲率较大、背景差异明显、长宽比较大等。当然,一般的全自动道路提取都应该满足这些条件。
3. 遥感影像道路提取展望
目前,利用高空间分辨率影像进行道路提取的研究已经很多,每种方法都有一定的适用性,但是毕竟现实世界中的道路无论从材料还是设计都具有很大的多样性及复杂性,而研究中提到的方法往往只能解决某一种或几种类型的道路提取,并且这些方法的自动化程度、算法效率及精度方面也有较大差异,因此,距离实际应用还有很长的路要走。
首先,对道路特征的挖掘。目前的大部分道路提取算法都只利用了道路的一种或几种较为基本的特征,由此建立的模型也相对简单。那么,对于高空间分辨率的遥感影像而言,道路的纹理特征比中低分辨率影像要明显的多,因此,如何在已有算法中结合高分辨率影像中道路的纹理特征是一个值得研究的方向[7]。
其次,多维模型的建立。遥感影像是二维图像,但是表达的是三维世界,因此,在三维到二维的过程中,必然有很多有用的信息被损失掉。可以考虑,用多幅影像,来构建三维模型,这样可以建立道路与其他地物之间更具体的联系,由此得到适合道路特征提取的多维模型。
再次,多方法嵌套使用。大部分的单一方法都是针对某种类型的道路,当现实情况比较复杂的时候,这些单一方法就不再适用了。因此,如何将多种方法有机地结合起来形成新的方法体系也是一个值得研究的问题。多方法嵌套不仅提高了方法的适用性,也在一定程度上提升了全自动的可能。
第四,结合面向对象的思想。面向对象是将若干像元合并为一个对象,再对对象进行分析研究的方法。这种方法的大致步骤包括以下四步:影像分割得到对象,对对象进行特征提取,将提取的特征组合成模型,根据模型提取道路。这种方法目前在道路提取中已经获得不错的效果[8]。
最后,多学科结合。道路在现实世界中是相当复杂的,因此道路提取涉及很多学科的问题,包括数学、计算机视觉和计算机图形学等。因此,在道路提取的研究过程中,要充分結合其他学科的方法及最新研究成果,将这些方法在更高的层次进行结合,最终可以提升道路提取的精度。
参考文献:
[1] 李光耀, 胡阳. 高分辨率遥感影像道路提取技术研究与展望[J]. 遥感信息, 2008(1):91-95.
[2] 吴亮, 胡云安. 遥感图像自动道路提取方法综述[J]. Acta Automatica Sinica, 2010, 36(7):912-922.
[3] 雷小奇, 王卫星, 赖均. 一种基于形状特征进行高分辨率遥感影像道路提取方法[J]. 测绘学报, 2009, 38(5):457-465.
[4] 朱晓铃, 邬群勇. 基于高分辨率遥感影像的城市道路提取方法研究[J]. 资源环境与工程, 2009, 23(3):296-299.
[5] 唐伟, 赵书河. 基于GVF和Snake模型的高分辨率遥感图像四元数空间道路提取[J]. 遥感学报, 2011, 15(5):1040-1052.
[6] 朱长青, 王耀革, 马秋禾,等. 基于形态分割的高分辨率遥感影像道路提取[J]. 测绘学报, 2004, 33(4):347-351.
[7] 胡海旭, 王文, 何厚军. 基于纹理特征与数学形态学的高分辨率影像城市道路提取[J]. 地理与地理信息科学, 2008, 24(6):46-49.
[8] 胡进刚, 张晓东, 沈欣,等. 一种面向对象的高分辨率影像道路提取方法[J]. 遥感技术与应用, 2006, 21(3):184-188.
玻璃缺陷特征提取方法研究 篇4
在平板玻璃的生产过程中, 由于国内生产技术及生产工艺方面的限制, 平板玻璃中或多或少存在各种缺陷。因此, 研究玻璃缺陷特征的提取方法具有十分重要的现实意义[1,2]。
1 玻璃气泡缺陷的图像及特征
气泡是制作玻璃时常见的一种缺陷。如图1-1为存在气泡的玻璃透照图, 并将图像进行中心线特征信号提取, 如图1-2所示。
2 图像增强
玻璃图像中的缺陷一般会比较模糊, 导致提取缺陷难度加大。为了解决缺陷图像模糊的问题, 可采用图像增强的方法进行处理。
2.1 基于灰度变换的图像增强
玻璃的灰度图像不同于玻璃的黑白图像, 是由不同灰度级表示的图像, 可以间接反映图像的动态范围以及明暗程度等特性。当图像显示为较暗效果时, 是由于图像的灰度值都集中在较低的灰度级别中。相反, 如果图像的灰度值集中于较高的灰度级别中时图像是较亮的。而为了得到一副对比度较高的图像时, 需要覆盖很宽的灰度范围。图2展示了气泡的图像及灰度变化后的图像。
从图2可以看出, 缺陷图像经过灰度变换后, 虽然图像质量有所提高, 但缺陷边缘与背景区别不大, 即对比度不高, 不利于后期的缺陷分割。
2.2 基于形态学的图像增强
图像增强技术可以有效提高缺陷与背景图像的区别, 重点突出缺陷的各类特征, 并有效地提取缺陷信息。本文采用两种方法相结合对图像进行增强处理, 分别为低帽变换方法和顶帽变换方法。
从图3可以看出, 缺陷图像经过形态学变换后, 与灰度变换方法比较, 图像效果更好, 特征更明显。
3 结语
本文采用灰度变换方法和形态学增强方法分别对缺陷图像进行处理, 前者有抑制背景噪声的优点, 但效果不如后者。综上所述, 为了更好地提取和分割玻璃缺陷特征, 本文采用形态学方法进行图像增强。
参考文献
[1]喻宾扬, 王召巴, 金永.玻璃缺陷检测新方法的研究[J].传感器与微系统, 2008 (8) :60-62.
特征提取方法论文 篇5
土壤中酸可提取态重金属释放特征研究
采用模拟酸雨土柱淋洗实验,研究了不同土壤中酸可提取态重金属释放特征.结果表明,随着模拟酸雨pH值下降,土壤中酸可提取态重金属释放强度明显增大,各元素的释放量与酸雨pH值呈显著负相关.Zn释放主要集中在pH4.5~3.5之间;Cu释放主要集中在pH6.5~3.5之间;Cd的`释放没有较集中的范围;而Cr和Pb,不同土壤集中释放的pH值范围不同.不同处理水平对酸可提取态种金属的释放有显著影响.
作 者:邹海明 邹长明 林平官楠 李粉茹 Zou Haiming Zou Changming Lin Ping Guan Nan Li Fenru 作者单位:邹海明,邹长明,林平,李粉茹,Zou Haiming,Zou Changming,Lin Ping,Li Fenru(安徽科技学院植物科学学院,凤阳,233100)官楠,Guan Nan(河南理工大学,焦作,454000)
刊 名:中国农学通报 ISTIC PKU英文刊名:CHINESE AGRICULTURAL SCIENCE BULLETIN 年,卷(期): 22(6) 分类号:S1 关键词:模拟酸雨 酸可提取态 重金属释放图形形状特征提取前的重要工作 篇6
关键词:图形;二值化;前景;分类
中图分类号:TP393 文献标识码:A文章编号:1009-3044(2007)16-31115-02
The Important Works Before Abstracting Graphics’ Characteristic of Shape
LIU Qing,MENG Xiang-zeng,JI Cui-ping
(Shandong normal university,Jinnan 250014,China)
Abstract: Based on expounding the graphics concept, this thesis studies and develops the important works before abstracting graphics’ feature of shape, including proposing the method of changing specific image into graphics by binaryzation, achieving the method of determining the foreground color of graphics automatically, proposing the simple classification system of graphics and achieving automatic classification.
Key words:graphics;binaryzation;foreground;classification
1 图形的概念
图象的特征提取是图象处理领域的一个重要内容,目前的研究主要是低层视觉特征的提取。形状作为图象低层视觉特征之一,较颜色和纹理等更接近人的知觉和语义,但描述也更为复杂。在提取形状特征的实验中所使用的图象具有以下特点:黑白二值图象以便于背景和前景分离,前景由一条或多条封闭的边界曲线及其内部区域组成,形状特征明显且为最主要低层视觉特征。这一点体现在文献中的例图以及各形状测试图库中,我们称这类图象为图形,如图1。也就是说,这里所定义的图形属于位图,研究领域属于图象处理而非计算机图形学。
图1 图形示例
目前,在形状特征研究领域,广大的研究者大都把目光集中在形状特征提取及基于形状特征的图形识别、匹配、检索等方面,这些也无疑是该领域最重要的研究内容。在进行这些研究之前的工作往往被忽视,但这些工作也很重要,它们包括:图象二值化为图形、自动判定图形前景颜色和图形分类。在接下来的部分,将一一阐述我们在这三方面所做的研究。
2 图象二值化为图形的方法
图形的一个重要特点就是黑白二值图象,已存在的形状测试图库虽然都是二值图象,较著名的有MPEG-7 contour shape database Set B 、MPEG-7 region shape database、Foliage、F. Mokhtarian fish database等,但它们为数不多且难以找到。当研究者找不到合适的、足够的图库时,就不得不面对图象二值化的问题。
图象二值化的关键是阈值的选取,经典的方法主要有灰度直方图法、微分直方图法[1]、最大熵法[2]、最小模糊度法[3],近些年很多学者提出了一些改进的方法,但没有哪种通用的方法可以让所有图象的二值化结果都理想,针对一类的图象往往采用特定的方法。我们针对用来获得图形的图象的特点,提出了一种简单有效的方法,取得了良好的实验结果。首先,我们人为的选择背景单一或背景颜色相差很小的那些图象来二值化,然后将彩色图象变为灰度图象后执行二值化。二值化算法思想如下:图象的边框处多为背景,据此取第m行m列点的颜色值及其上下n个值的区域为背景颜色的范围,将背景颜色范围内的点置1即白色,否则为0即黑色,最后将二值化后的图象中极小的连通区域视为噪声置1。第m行m列点容易受噪声影响,可在边框2*m个像素宽度内求灰度均值及此均值上下n个值的区域为背景颜色的范围。我们取m=5,n=12,对1000幅图象进行二值化,采用第m行m列点的方式,正确率达90.2%;采用边框2*m宽度内均值的方式,正确率达94.6%。我们将此方法命名为边框二值化法,此方法简单有效,但只适用于背景颜色较单一和前背景颜色相差较大的情况。
3 自动判定图形前景颜色
图形有的以黑色为前景,有的则以白色为前景,还有一些图形难以确定谁为前景合适,如图2。为了对图形进行后续处理,需要判定其前景颜色。目前研究者一般在选择图库时就人为的统一采用黑色或白色为前景的图形,从而忽略掉判定图形前景颜色的环节。我们提出了让程序自动判断图形前景颜色的方法。
(a)前景为黑色;(b)前景为黑色;(c)前景不好确定
图2 不同前景示例
方法一:图形中黑色和白色,较少的颜色为前景。方法二:图形边框k(k=10)个像素宽度内黑色和白色,较少的颜色为前景。图库中的图形多以黑色为前景,根据我们的边框二值化方法得到的图形也是黑色为前景,所以当黑白相当时,选择黑色为图形前景。对于前景色为白色的,进行反色,以保证前景色为黑色,方便以后的图形描述。我们对MPEG-7 contour shape database Set B中的1400幅图形,其中黑白前景各占一半,利用以上两种方法分别进行实验,实验结果用查全率和查准率表示。其定义用公式表示如下[4]:
准确率(Precision)=正确识别的图像数/应正确识别的图像数
正确率(Accuracy)=正确识别的图像数/所有识别出的图像数
实验结果为查全率分别是81.42%、98.57%,查准率分别是81.46、98.59%。
那些前景判断错误的图形,是由于其主体所占面积比例过大。这里我们选择方法二来求整幅图形前景,因为它既简单正确率又高。
对于主体既有黑色又有白色的图形,也可能主体中背景颜色所表达的形状才是真正的中心,所以要对主体进一步分析。我们认为,如果主体中背景颜色面积占主体面积的四分之一以上,则表示主体中背景颜色所代表的图形有分析的必要。将图形主体中背景的颜色置黑,其它全部置白,得到新的图形。这样对这幅图形的描述,就要添加上新图形的描述部分。图2(a)就是图2(c)的新图形,对图2(c)的描述除了要描述其白色部分的形状特征外,还要加上图2(a)黑色部分的形状特征。
4 图形分类
我们认为,图形根据对象数可分为多对象图形和单对象图形,单对象图形再根据欧拉数可分为实体单对象图形和空心单对象图形(见图3)。图形分类的意义主要体现的两个方面。一是在图形形状描述时,多对象图形主要研究其拓扑结构及将图形分离为多个单对象图形后的分别描述,而实体单对象图形适合基于轮廓的形状描述,空心单对象图形更适合基于区域的形状描述。二是在图形检索时,用户可以直接选择需要检索哪类图形,以提高检索效果。
图3 图形分类
我们实现了程序自动进行图形分类,无需再人为的分类。算法:首先,计算图形对象数,一个对象被定义为一个较大的连通区域,若对象数为1则为单对象图形,对象数大于1则为多对象图形。然后计算图形的欧拉数,欧拉数定义为连通区域数减孔洞数,欧拉数为1为实心单对象图形,欧拉数小于等于0为空心单对象图形。
我们随机选择了120幅图形进行分类实验,其中多对象图形、实心单对象图形、空心单对象图形各40幅。对象数=连通区域数-小连通区域数。小连通区域的面积小于最大连通面积0.1倍。多对象图形、实体单对象图形和空心单对象图形的查全率分别为95%、97.5%和92.5%,查准率分别为92.68%、97.5%、94.87%。
我们在知觉上定义一个对象是根据语义上的一个物体,而不是一个较大的连通区域,所以在分类时会出现错误。
5 结论
实验表明,特定图像二值化为图形、自动判断图形前景颜色和自动对图形分类均取得到了良好的效果。这些前期处理工作,为下一步的图形形状描述、匹配和检索,做好了必要的准备。
参考文献:
[1]Weszka J S. Survey of threshold selection techniques[J]. Vision Graphic Image Process, 1978:259-265.
[2]吴谨,李娟,刘成云等.基于最大熵的灰度阈值选取方法[J].武汉科技大学学报(自然学科版),2004,(1):58-60.
[3]Deluca A, Termini S. A definition of a non-probabilistic entropy in the set-ting of fuzzy set theory[J]. Int Control, 1972:301-312.
[4]何强,何英.MATLAB扩展编程[M].清华大学出版社.2002.6: 293-300.
基于弦变换提取几何特征的方法 篇7
关键词:弦变换,几何特征,反弦变换滤波,特征匹配
0 引言
在人的视觉感知、识别和理解中,形状是一个重要的参数。形状可以认为是目标物体的一种外在视觉的总体感知,是物体的一种外在描述[1]。因此,形状特征的提取具有重要的意义。在计算机视觉和模式识别中,形状是对目标范围的二值图像表示,可以看成是目标的轮廓,它是用于目标识别的重要特征。目前,对于形状特征的描述常用的方法是将形状模型化,即对形状进行分析,提取能表达形状的特征,比如Hough变换[2,3]、不变矩[4,5]、傅里叶描绘子[6]等。但这些方法中一些会受到尺度和旋转等变换的影响,而一些虽然对二维的尺度、旋转等变化具有一定的鲁棒性,但要求封闭的边缘,同时对于相对复杂一点的变化,比如仿射变化,也束手无策。弦变换同样是基于边缘信息提取出的形状特征,但不同的是它不仅仅只对边缘点分析,还结合了由这些点构成的弦的分布信息。此方法是将图像中的目标边缘经过弦变换后得到一个角对的分布图,对于不同的几何形状有着不同的分布模式,即该分布图对于每个形状具有唯一性,因此将它作为形状特征来进行目标形状匹配是可以的,同时这种方法提取的几何特征不但具有尺度、旋转及平移不变性,而且对仿射变换也具有一定程度的鲁棒性。另外,换个角度可以将感兴趣目标的形状的弦空间特征作为模板,对图像进行弦变换的反变换滤波,就能将非目标形状的边缘过滤掉,只留下目标形状的边缘。本文利用文献[7]对传统弦变换的改进,进一步将此特征应用到目标形状的识别当中,并对复杂变换条件下此特征的鲁棒性进行了实验验证。
1 边缘提取
由于弦变换是基于边缘信息得到的特征并且要求边缘是单像素的,因此提取图像的边缘变得至关重要。图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关,因此可以利用图像强度的一阶或二阶导数进行边缘检测。至今,已发展了许多边缘检测器,常用的几种有Roberts算子、Sobel算子、Prewitt算子、Laplacian算子、Canny算子[8]、LoG算子等[9]。其中Canny算子边缘检测的基本思想是在图像中找出具有局部最大梯度幅值的像素点。Canny算子提出了边缘检测算子的3个准则:信噪比准则、定位精度准则、单边缘响应准则,并将其相结合获得最优的检测算子,由此得到的边缘具有较好的连续性以及单像素等特点。这正好满足弦变换的要求,因此本文中采用了Canny算子提取图像边缘。
2 形状特征的提取
2.1 弦变换特征描述
将图像信息转化为特征数据是为了减小图像分析问题中的维数。早前,Tenery[10]认识到使用积分几何将平面图像转换后得到定量的测量标准,可以更好的表述图像特征信息。这种方法将形状转换成可以计量的模式。1972年,Moore[11]受Novikov[12]的影响,提出了一种使用边缘点之间的距离和角度关系的变换,称之为弦变换。对于平面图像边缘函数F(x,y),用一个特征函数来定义弦变换:g(x,y,r,θ)=f(x,y)f(x+rcosθ,y+rsinθ),当F(x,y)是一个边缘点时f(x,y)=1,否则f(x,y)=0。变量x、y、θ和r的意义如图1所示。全局弦长函数fr(r)和全局角度模式函数fθ(θ)的定义如下:
当它们乘以一个归一化常数后,可以分别将其视为角度的概率密度函数和边缘图像中的弦长分布。因此,可以将这些函数作为描绘图像边缘模式的特征描述子。
在Lucas[12]、Chenoweth和Kannape的研究中,对弦变换进行了修改。修改后的弦变换定义不再使用弦长,而是利用弦与两端点的边缘法线所形成的夹角关系,改进后的弦变换几何如图2所示。利用θ1和θ2可以将它们之差的模值θD=|θ1-θ2|及它们的平均θA=(θ1+θ2)/2映射到弦空间。这里的弦空间其实就是由这些角对出现次数的累积而形成的一个直方图,它等效于(θ1,θ2)的离散化概率密度函数。修改后弦变换有一个有趣的特征,即对于各种几何形状,它们角对(θ1,θ2)的累加会聚集在弦角直方图的特定区域,形成不同几何形状的特征。圆、直线、直角和平行线在弦变换直方图中的分布情况如图3所示。根据θD和θA的特性,几何形状在弦变换直方图中的分布应该是在一个三角形的区域里呈现各自的特征。另外,修改后的弦变换忽略了弦长的影响,因此它相对之前的弦变换来说不但具有平移和旋转不变性,还增加了尺度不变的特性。
2.2 反弦变换的几何滤波
如果已知特定的几何形状在弦空间的分布情况,那么完全有可能设计一个弦空间平面的滤波器,边缘图像经它滤波以后可以拒绝不感兴趣的形状边缘,保留感兴趣的形状[7,11]。为了观察几何滤波的效果,则有必要知道弦变换的逆运算,即要知道弦变换空间的每个单元与原始图像像素的对应关系,这就必须将原始灰度值存储在弦变换队列中,然而这种方法需要大量的存储空间,因此在实际应用中是不可行的。因此,为了简化,用另外一种方法来替代:给定一个特定几何形状的弦变换直方图作为模板滤波器,当图像中的弦对映射到这个直方图中某坐标位置时,对应坐标点上的弦变换累加值将作为对应此弦的原始边缘点幅值的加权因子。边缘图像中的各弦都经相同处理后,则可得到一幅新图像。一般,在新图像中的灰度值F′i,j是这样一个函数:F′i,j=α1Fi,j+α2Ci,j+α3Fi,jCi,j,其中:α1强调的是原始图像F的内容,α2强调的是映射到弦空间中位置与当前弦角对映射位置相同的弦对数目Ci,j,α3强调的是前两者之积。一般情况下,取α1=α2=0,α3=1/max(Ci,j)。而对于形状,只要得到边缘信息就可以了,因此进一步简化:如果F(i,j)是边缘点,则Fi,j为1,否则为0。这样得到的新图像则是一个非二值化的边缘图像,其中需要的形状边缘很亮,而其它形状的边缘则很暗,将其二值化后就可以去除不感兴趣的形状边缘,只保留感兴趣的形状边缘。
3 实验结果与分析
3.1 特征相似性比较
至今为止,已经出现了几十上百种相似性度量的方法,其中比较典型的有,绝对差(AD)、平均绝对差(MAD)、平方差(SD)、平均平方差(MSD)、积相关(Prod)及归一化积相关(Nprod)等[13]。本文采用归一化积相关对弦变换特征进行相似度比较。设两个目标形状的弦变换直方图为{C1(θA,θD)}和{C1(θA,θD)},θA,θD=1,2…,n,其中n是角度量化后的最大级数,则它们之间的归一化积相关按如下函数计算:
D的值在0和1之间,它越接近1表明特征越相似,匹配的程度越高。图4给出了一幅有多个不同几何形状目标的图像,以及它们各自的弦变换直方图,其中圆形(目标5)的弦变换特征正好与图3所示的分布对应,各形状相似性比较的结果如表1所示。由前面归一化相关系数介绍可知,系数值越接近表示两目标形状越相似。表1中的结果可以看出,其中目标1与目标2的相关系数值最高,并且是非常接近1,而实际上目标1就是将目标2放大一倍再旋转45°后得到的,都是正方形。因此它们应该被判定为相似,实验的结果也说明如此,这也正好验证了弦变换对缩放旋转的不变性。相比之下,其它目标之间的相关系数就小多了,由此可以看出,相同或相似几何形状之间的弦变换特征差距较小,而不同形状之间的弦变换特征差距很大,因此用目标边缘的弦变换特征进行形状相似性匹配是可行的。
为了进一步说明弦变换对仿射变换也具有一定程度的鲁棒性,下面将对三个不同形状的飞机进行仿真实验(如图5所示),相关性比较如表2所示。利用三种不同类型的飞机在不同状态下呈现出不同形状的目标,将三种飞机分别与这些目标进行弦变换特征的相似性比较,得到归一化相关系数如表2所示。从表2的结果可以看出,同一类型的不同目标之间相似性系数最大且非常接近一。这些不同状态下的飞机目标实质就是这三种飞机经不同仿射变换后的结果,因此实验结果可以说明弦变换特征对仿射变换具有一定程度上的鲁棒性。
3.2 反弦变换滤波
本节分别用圆形、菱形和三角形的弦变换作为模板(见图6)对输入的边缘图像滤波,然后观察滤波后的结果。由图7到图10的实验结果可以看出,输入图像经特定形状的滤波器滤波后,可以保留与之相同或相似的目标边缘,而过滤掉其它不同形状的边缘。
4 结论
几种藏文字特征提取方法比较研究 篇8
藏文是我国藏族人民使用的文字。随着信息化时代的发展,藏文信息处理的需求更加突出,为了更好地搞好藏文字处理工作,继续研究藏文字识别技术知识也是很有理论价值。藏文字特征提取是文字识别中比较重要的环节,本文研究了三种(特征点法、网络点阵图形投影法、方向线索特征抽取、)藏文字特征提取方法的比较。
藏文字特征提取方法
1.特征点法
特征点法是一种较好地利用文字结构规律的特征提取方法。由于藏文字的笔画密度和笔划之间的交叉、连接等结构比较简单,因此特征点法应用到藏文字识别中具有更好的稳定性。
基本思路如是:
(1)藏文字母是由若干个笔划组成的,笔划的类型、连接关系和数目可以用笔划骨架线的端点D、折点Z、分叉点Q来表示。这些点叫做笔划特征点。一般来说,给定某个藏文字的笔划特征点之后,该字就确定了。
图2是藏文字特征点的示意。可以看出笔划的端点和折点就决定了笔划的位置和形状,分叉点则决定了笔划的连接关系。这些特征描述了藏文字的结构,包括笔画数目、类型和位置以及各部件的相互关系。此外背景点可以用来区分相似的字(特别是笔画少的字)。
2.方向线索特征抽取
方向线索是一种比较常用的特征提取方法。其原因是,藏文字丁是一种由辅音字母与元音字母叠加而成的组合体,字母就是构成字丁的部件。而字母又是由笔划组成的,各字母中的笔划之间的连接关系是固定不变。方向线索特征抽取方法很好地描述了一个藏文字在它所占的空间的不同位置笔划的数量关系,从而全面、准确、稳定地代表了该藏文字的组成信息。该方法用两个步骤来提取藏文字的特征:一、提取藏文字符轮廓,二、分块和特征矢量的构成。
3.网络点阵图形投影法
提取f(x,y)的投影值作为文字的特征。
藏文字的每一个字的高度是宽度的一倍,所以输入字符首先被归一化为48×96的点阵,将48×96的点阵分成4×8个12×12的子区域如图4.2,即N设为4、M设为8。N、M的取值越高文字的特征会更准确,但计算量会好大,而且如果取值为超过单数的话比如10则g(x)或g(y)的大值有可能为10,十跟一零会混淆。所以只能取为单数了。
结论
1.特征点法
用特征点来表示藏文字图形是对藏文字字形结构的一种较简练的描述。这种模型具有充分利用藏文字结构信息的优点。从某种意义上说,这种方法也属于模板法:每一类藏文字都用一个由它的特征点所构成的标准模板来代表。这些模板只包含各类藏文字形最有代表性的像素,去掉了绝大多数冗余的像素,因而可大大压缩模板的存储量,但是伴随这一优点而来的问题是识别可靠性将受到影响。具体地说,当不同字体的印刷体藏文文字同时排印在同一页面上时,由于不同字体的同一个藏文字的笔划长短、粗细和位置都有一定的差异,因而采用单一的特征点模板很难适应这种变化。这种方法对单体印刷藏文字的识别率会较高,识别速度也会足够快,对字体相近的字识别效果也会较好。内部笔画粘连的字符的识别适应性较强。不易表示为矢量形式,不适合作为粗分类的特征、匹配难度大。
2.方向线索法
藏文是一种拼音文字,左右拼写,上下叠加;没有像汉字那样的部首、笔划的称谓。但藏文字丁是一种由辅音字母与元音字母叠加而成的组合体,藏文字母有30个辅音字母和4个元音字母。字母就是构成字丁的部件,而字母又是由笔划组成的,各字母中的笔划之间的连接关系是固定不变。因此,每个藏文字丁都有特定的结构,并且这种结构特征可以从层次、局部和细节3个方面反映出来,而方向线素正是刻画这些结构特征的有效手段。但字符内部笔画粘连时误差较大。
3.网络点阵图形投影法
由于藏文字的笔划密度比较小,网络点阵图形投影法法应用到藏文字识别中具有很好效果,它的抗干扰能力也比较强,是一种易于实现的特征提取方法;但是该方法对倾向旋转非常敏感,细分能力差。
运动目标微多普勒特征提取方法 篇9
为了进一步提高对目标微多普勒特征的提取速度,通过分析目标微多普勒在距离-慢时间谱图域的表现形式及其特点,结合正弦曲线的周期性分离雷达回波信号距离-慢时间二维谱图域上的曲线,然后对曲线的角频率、半径、初相以及曲线在频率(距离)轴的位置分别进行提取,来实现对谱图中曲线参数的快速提取,从而获得目标真实的微动信息,最终实现对目标的准确快速识别。最后,通过仿真验证了本文算法的有效性。
1 目标微多普勒特征在谱图域上的表现形式
以雷达为原点,以初始时刻目标和雷达的连线为Y轴建立平面直角坐标系,如图1所示。假设目标以速度V沿与X轴平行方向运动,并且该目标包括两种典型的散射点即:目标主体散射点(包括目标中心O、旋转中心Q和其它非旋转点)、旋转散射点P (其旋转半径、角频率和初相分别为r,ω,θ)。另外,在初始时刻,定义目标中心O、旋转中心Q和旋转散射点P的坐标分别为(xo,yo)、xQ,yQ)和(xP,yP)。
假设雷达发射的线性调频信号P(t)为
式(1)中,rect(t)为矩形窗函数,其值只有在-1/2≤t≤1/2时为1,在t取其它值时为0。fc是载频,Tp是脉冲宽度,μ是调频率。那么在慢时间τ时刻散射点i(i可以表示目标上的任意散射点)的回波信号可写成
式(2)中,Ri+(τ)表示τ时刻散射点i到雷达的距离。以目标中心点O作为参考点,将回波信号与参考信号共轭相乘,同时对其求关于快时间t的傅里叶变换,经过计算以及相应的相位补偿,可以得到在ISAR回波信号距离-慢时间二维谱图域中,旋转点P距离像的峰值出现在[13]
式(3)中,ΔRQ(0)表示在初始时刻目标上旋转中心Q到参考点O的相对距离,同时(0)为旋转中心Q距离像峰值出现的频率位置。从式(3)中可以看出,该公式中第一项是由于目标平动产生的,而第二项则是由旋转点的周期性旋转产生的。这也说明,在峰值出现位置上,旋转点随慢时间在旋转中心附近作正弦规律变化,旋转点对回波信号调制产生的正弦曲线谱变化周期与旋转点的旋转周期相同,而对于目标主体散射点,其与参考点的相对位置是固定的。这也使得目标谱图将由非旋转点产生的直线谱和旋转点产生的正弦曲线谱组成。将正弦曲线的参数提取出来,就能够获得旋转目标的旋转半径,频率和相位信息,即获得目标的微动特征。从而有利于实现目标的分类、识别和成像。
2 正弦曲线参数提取
算法的基本思想是利用目标结构部件旋转或振动部件引起的微多普勒效应在距离-慢时间谱图上表现为正弦曲线形式这一特征,通过将图像空间中的检测问题转换为参数空间的估计问题,提取目标的微多普勒信息。利用不同角频率的曲线具有不同周期这一性质,将距离-慢时间谱图上的具有不同角频率的曲线给分离开来,然后对相应曲线的角频率、半径、初相以及曲线在频率(距离)轴的位置分别进行分析,来实现对谱图上曲线参数的快速提取,从而获得目标真实的微动信息,最终达到对目标的准确快速识别的目的。
为了表述简单,假设在距离-慢时间谱图上微多普勒的表现形式为:
式(4)中r为半径,ω是角频率,且ω=2π/T,T是周期,θ为初相,d为基线(它描述了曲线在谱图中频率(距离)轴的位置,即基线位置)。
由式(4)可知,在距离-慢时间谱图上具有相同频率(距离)的点(在谱图中体现为同一行),必然有符合其周期性。正是利用这一点,将同一行中的点按照所有可能的周期进行排列,并取出所有可能的周期。这样每一行都有一个或一组的排列可能,及其相应的周期。利用每一行得到的周期数据,映射到一维参数ω,这样具有相同角频率的所有排列组合,将被累加器收敛于一个局部最大值。从而获得所有曲线的角频率ω。与此同时,可以获得角频率ω所对应的每一个点。从而将不同角频率的曲线分离开来。
对于式(4)所表述的曲线,如果有f1=rsin(ωt1+θ)+d,f2=Tsin(ωt2+θ)+d,且t2-t1=π/ω,那么必然有d=(f1+f2)/2。首先确定谱图上具有相同频率(距离)的点所在的某f'1行,查找另一f'2行,使得f'1和f'2行上的点在慢时间τ轴的位置相差的慢时间正好是半个周期,那样就生成一个d=(f'1+f'2)/2。利用这一特性,将具有相同角频率ω的曲线上的所有点,映射到参数d上,这样相同角频率ω,且具有相同基线的所有点,将同样被收敛于一个局部最大值。与此同时,由于曲线的基线必然是旋转中心在谱图上的直线谱。而在谱图中检测直线谱很容易,这样仅仅需要比较在直线位置上的累加器数值。从而将相同角频率,却不同基线的曲线分离开来。当然,这样会导致如果两条不同曲线的基线的平均值所在位置正好是直线谱所在位置,这将导致d的误判,此时则需要在计算半径的过程中将这种状况予以排除。
然后依据式(4),做出如下假设:
式中,表示对f求关于t的导数。那么必然有。首先确定谱图上具有相同频率(距离)的点所在的某f'1行,查找另一f'2行,使得f'1和f'2行上的点在慢时间τ轴的位置相差很小。定义差值所组成的数组映射到慢时间上为Δτ,那么:
ω为之前所估计得到的角频率值。这样,在相同角频率、相同基线以及相同半径的点将收敛于一个局部最大值。而在计算d时出现的特殊状况,将不会收敛于一个较大的局部最大值,从而将这种状况排除。这样可以提取出相同角频率和相同基线的半径。
对于初始相位θ,则采用穷搜索的办法,对其所有可能的值进行遍历。即
式(8)中表示让括号内最小的θ值,而()分别表示之前所估计得到的半径、角频率和基线值。这样具有满足()的所有点也会在θ上收敛于一个局部最大值,从而获得初始相位的估计值。
3 算法流程
假设已经获得了距离-慢时间谱图|S(f,τ)|,那么其每列都是慢时间τ时刻的距离像,同时每一行都是频率f所对应的慢时间τ位置。将二位谱图中能量较弱的点置零(本文仿真中将能量小于峰值能量0.25倍的点置零),获得新的二维谱图I(f,τ)。对于参数的提取,具体流程如下:
3.1 分离不同角频率的曲线
分离不同角频率的曲线正是本文的核心部分,其流程如图2所示。这样,所获得的每一个周期T’都有与其相对应的位置数据组D'T'(f'T',T')及对应的行值集合f'r',且其角频率为ω'=2πPRF/T'(其中PRF为脉冲重复频率)。
3.2 提取各曲线的基线
首先将周期T'所对应的行值集合f'T'从小到大进行排序。提取曲线基线的流程如图3所示。
由于旋转中心点在谱图上的位置就是对应的正弦曲线在谱图上的位置,所以可以将直线位置左右的dcount结果加到直线位置所对应的dcount值上,并将其他非直线位置的dcount值置零。累加器dcount的峰值点即为该角频率曲线所对应的基线位置值。并用获得的基线位置值,得到在计算过程中满足该基线位置所对应的频率值f'T'(i)和f'T'(j)。这样就可以分离在不同基线位置,但具有相同周期的不同曲线。
3.3 提取曲线的半径
定义周期为T'、基线位置值为d'所对应的行值为fT'd',那么所对应的位置数据矩阵为D'T'd'(f'T'd',T',d')=D'T'(f'T'd',T')。提取该曲线半径的流程如图4所示。累加器rcount,的峰值点即为角频率为ω'、基线位置为d'的曲线所对应的半径r'。
3.4 提取曲线的初始相位
图5为提取该曲线的初始相位的流程图。累加器Phicount的峰值点φ',就是周期为T'、角频率为ω’、基线位置为d',且半径为r'的正弦曲线所对应的初始相位。
4 仿真分析
仿真中,假设雷达发射带宽为B=300 MHz、时长为Tp=1μs的线性调频信号,且其脉冲重复频率PRF=1 000 Hz,载频fc=10 GHz,对应的波长λc=0.03 m,快时间采样率fs=300 MHz,信噪比SNR=0 dB。假设目标以速度V=300 m/s沿基线平行方向运动,目标中心与雷达相距10 km。目标散射点模型共由7个散射点组成,其中有4个非旋转点和3个旋转点。非旋转点如图6所示。而3个旋转点的旋转中心坐标、旋转半径、旋转频率和初始相位分别如同表1所示。
1)在配置A的情况下,3个旋转点具有不同的旋转频率,但其旋转中心相同,也就是其所生成的微多普勒曲线在谱图上的基线位置相同,同时半径和初始相位也相同。在该配置情况下,其所生成的距离-慢时间谱图(已将能量较小的点置零)如图7(a)所示。从中可以明显看出目标谱图由非旋转点产生的直线谱和旋转点产生的正弦曲线谱组成。
从图7(b)-(d)中,可以明显看出曲线3的基线位置,半径和初始相位,在累加器中,都被映射到一个峰值点。而该峰值的位置,正是该曲线的参数。
2)在配置B的情况下,3个旋转点中,旋转点1和旋转点2具有相同的旋转频率和半径,同时旋转中心也相同,因此其所生成的微多普勒曲线在谱图上的位置相同,然而初始相位不同。其谱图如图8a)所示。
由图8(b)-(d)可以看出,在相同的频率下,基线位置和半径都被映射到一个峰值点,而相位被映射为两个峰值点。说明在该频率下,有两条曲线,且这两条曲线的半径和基线位置相同,但初始相位不同。
3)在配置C的情况下,其谱图如图9 (a)所示。
从图9(b)中可以看出,在该频率下,谱图被映射为两个峰值点,即有两条基线位置不同的曲线。而通过图9(c)和图9(d)可以看出,该曲线可以分别在半径和初始相位域中映射为1个峰值点,最终实现该曲线参数的提取。
表2为在各种配置情况下,从谱图中直接提取出的曲线基线位置、半径、频率和初始相位信息,与表1中所体现出的实际值相比,吻合度是较高的,但仍有一定的偏差,这主要是在算法流程中基本上每个部分都需要有一个阈值,而在仿真中,将每个阈值都给定义为l=6,合理的调节阈值也能提高仿真的准确性;另外,在对相位进行搜索时,步长设置为0.1 rad,这也导致了初始相位检测时的偏差。
同时,为了证明算法能有实现对含旋转部件目标微多普勒特征的快速准确提取,将该算法与文献[13]中的扩展Hough变换方法的耗时进行了比较,如表2所示。从中可以明显看出,直接使用扩展Hough变换使用耗时比本文所提算法高出太多,这主要是因为该算法不同于扩展Hough变换那样需要对曲线的四维参数进行联合搜索,而是对其逐步进行提取,从而缩短提取所需时间,具有良好的应用性,但这必然也会造成准确性降低。
5 结论
特征提取方法论文 篇10
如果能够在保证识别效果的基础上有效降低存储和计算量,使这一技术推广到常见的便携移动设备上,如利用智能手机进行银行转帐时,使用SIM+人脸鉴定的双重保险,将会给人们带来更加安全便捷的数字化服务。为与人脸识别过程相结合,在分析了遗传算法的基本过程和要素后,给出遗传算法在应用于人脸识别时的一种适应度评价方式和三个重要算子,通过实验分析,证实此方法效果明显。
1 基于遗传算法(GA)的人脸特征提取
遗传算法是Holland教授[6]于1975年提出的一种模拟生物体进化的抽象算法,具有“生成+检测”的特性。它利用编码空间代替问题参数空间,以适应函数作为评价依据,以编码群体为进化基础,并对群体中的个体进行遗传操作来实现选择和遗传机制,形成循环迭代,由群体中个体的不断进化逐渐接近问题的最优解。遗传算法的整个进化过程操作是随机的,但它所显现的特性并非完全随机,它在搜索过程中它能有效利用历史信息推测下一代,得到期望性能有所提高的寻优点集。
一般的遗传算法包含五大要素[7]:
1)参数编码(二进制编码、序列编码、树编码、自适应编码、大字符集等);
2)初始群体的敲定;
3)适应度函数的设计;
4)遗传操作的设计(遗传算子:选择、交叉、变异);
5)控制参数的设定。
其中遗传算子的作用就是模拟生物系统中“适者生存”,淘汰不能适应的染色体,把更有益的信息遗传到子代。
在生物模拟系统中,DNA由遗传的染色体构成,染色体在遗传算法中表示为比特序列。其中每个染色体用n位来表示。在执行遗传算法的第一步就是对各类中的每个个体进行编码,即编排单个个体的比特序列。在这里,对染色体的编码是通过获取个体的十进制值后转化为二进制编码来实现的,它是由0和1组成的序列。例如,对于已知的单个个体由8位(n=8)来表示时,则它的染色体为:X=x8,x7,x6,x5,x4,x3,x2,x1。
对群体中个体的染色体进行操作的三个算子:选择、交叉、变异。
选择算子,作用就是选择适应值较好的个体以生成交配池。这里采用轮盘赌(roulette whell)的方法来实现,以保证每个父代都有同等的概率Ps被选择。
交叉算子,在GA中模仿了自然界有性繁殖的基因重组过程,目的是将原有的优良基因遗传给子代。交叉操作一般分为三步:
从交配池中随机抽取出一对要交配的个体。
根据位串长度L,对要交配的一对个体进行长度[1,L-1]的位置交叉;
根据设定的交叉概率Pc(0
设在交配池中随机抽取一对个体:S1=a1,a2,a3,...,aL,S2=b1,b2,b3,...,bL,随机抽取交叉位x∈{1,2,...,L-1},此处以L=5,X=3为例对两个个体右侧部分染色体位串进行交换,得到两个新个体S1’=a1,a2,b3,b4,b5,S2’=b1,b2,a3,a4,a5。
变异算子,模拟的是自然界生物体进化中染色体某位基因发生突变的现象。在GA中,通过设定变异概率Pm随机反转某位的二进制字符值来实现。即,产生一个随机数P,若P
GA(后面提及的GA都是限定遗传算法在人脸识别中的应用)工作流程如下:
2 应用示例
设有L类样本,定义:
训练集X={X1,X2,X3,...XL}
第i个类的子集Xi={x1(i),x2(i),...,xNi(i)}
其中x1(i),x2(i)为i类的第1和第2个训练样本个体(图像),Ni为第i类样本的训练样本总数。所有图像训练样本的总数量N=N1+N2+...NL
1)对所有图像转换为列矢量,即,把每个位置的染色体变为向量。每个向量代表一个个体,位数取决于染色体所代表图像的灰度级,即图像像素的编码。假设一个灰度级为256的图像,其染色体应为8位(28=256),如图1,为一个m×n像素的图像。
2)每个类的初始种群从Ni中产生。因为交叉操作需成对进行,所以当Ni为奇数时,需要取一个测试图像进行配对交叉(仅对属于同一类的所有个体设置进行交叉操作,产生的新个体仍属于此类中)。
3)对每个类中的所有个体设置一个适应度函数,这里采用欧氏距离来衡量。设测试用例为q,与xij(第i类中的第j个个体)的适应度函数为:
4)新生成的类中的每个个体Ni都将符合最低适应度函数。
5)迭代递增+1。
6)如果算法执行超过最大迭代数T,或者群体产生的个体已达到最高适应度值,则认为此测试用例属于该类。否则,转到步骤3。
为说明交叉操作,设有某类中一对将要配对的个体a和b,在第4比特位进行切割交叉,将产生两个新个体c和d,如图2:
3 实验分析
实验使用了剑桥ORL库(共有40人,每人10幅,每幅92×112像素的256灰度级图片),实验机器平台为清华同方X46H型号,使用[8]的方法与遗传算法进行比较,先后进行了10次实验,取平均值得到结果如表1和表2:
从实验结果看,两种方法的识别率比较接近。首先,对比所用时间,两种方法在训练和识别同一组人脸时,在L=40,T<10,Pm<0.01,Pc=0.6的情况下,使用PCA方法的总耗时是GA的十倍。其次,对比存储空间,PCA方法在前期的预处理过程中,占用资源要比GA方法大很多。例如一幅92×112的图像,产生的协方差矩阵大小为10304×10304,如果协方差矩阵所表示的基本像素单元为8字节,那么6幅图像需要占用存储量6×10304^2×8b,相当于4.7GB的存储空间,要比普通的电脑全部内存还大;而GA即使在256灰度级图片上进行编码,存储6幅图像所占用空间为:92×112×6×8×2约966Kb,远远小于PCA。
4 总结
利用遗传算法良好的“生成+检测”特性来寻找优化问题的最优解,并在人脸识别中进行一次有效尝试,实验结果表明在不降低识别率的情况下,无论是计算时间还是所占在存储容量GA都要明显少于PCA。但本方法只适合在非固定用户群使用,这里使用单一的PCA降维方式进行实验对比只是为了更明显分析遗传算法的特点,并非反映PCA方法低效,相反,在固定用户群体的情况下,PCA只需进行一次前期训练即可完成以后的快速识别,这是GA所不能及的。相信在其他优化问题求解上,遗传算法会有更好的拓展空间。
参考文献
[1]王映辉.人脸识别:原理、方法与技术[M].北京:科学出版社,2010.
[2]Turk M,Pentland A.Eigenfaces for Recognition,Journal of Cognitive Neurosicence,1991,3(1):71-86.
[3]Zhao W,Krishnaswamy A,Chellappa R,et al.Discriminant Analysis of Principal Components for Face Recognition,Face Recognition:From Theory to Applications,H.Wechsler,P.J.Phillips,V.Bruce,F.F.Soulie,and T.S.Huang,eds.,Springer-Verlag,Berlin,1998:73-85.
[4]Yang M Q,Ahuja N,Kriegman D.Face recognition using kernel eigenfaces.Proc.ICIP,1:37-40.
[5]Lee J,Moghaddam B,Pfister H,et al.Finding Optimal Views for 3D Face Shape Modeling,Proc.of the International Conference onAutomatic Face and Gesture Recognition,FGR2004,17-19 May 2004,Seoul,Korea,pp.31-36.
[6]Holland J H.Outline for a logical theory of adaptive systems.Journal of the Association fo Computing Machinery,1962,9(3):297-314.
[7]李敏强,寇纪淞,林丹,等.遗传算法的基本理论与应用[M].北京:科学出版社,2002.
特征提取方法论文 篇11
【关键词】Gabor小波;紋理;滤波器;数字图像
紋理特征是所有物体表面所共有的内在特性,包含了关于物体表面的组织结构排列的重要信息以及它们与周围环境的联系。在自然界中,如树木、织物等,均具有各自的紋理特征。在计算机视觉研究中,人们还发现,紋理特征具有一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征,可以从微观上区分图像中不同的物体。因此,紋理特征是经常要提取的特征。最常用的提取紋理特征的方法是灰度共生矩阵法。但这种方法占用内存多,运行速度较慢。而Gabor变换不但具有最小的时频窗,而且Gabor函数与哺乳动物的视觉感受野相当吻合。这一点对研究图像特征检测或空间频率滤波非常有用。恰当的选择Gabor变换的参数,可以出色地进行图像分割、识别与理解。现简单介绍如下:
1.Gabor滤波器的设计
Gabor函数的定义为:
(1-1)
它的傅里叶变换G(u,v)为:
(1-2)
其中, W为高斯函数的复调制频率。以g(x,y)为母小波,则通过对g(x,y)进行适当尺度变换和旋转变换,就可以得到自相似的一组滤波器,称为Gabor小波。
(1-3)
式中,这里表示总的方向数目(n∈[0,K]),为尺度因子,在上式中用来确保其总的能量与m无关。由傅里叶变换的线性特性可知,通过改变m和n的值,便可以得到一组方向和尺度都不同的滤波器。
Gabor小波集的非正交性意味着经滤波后的图像中有冗余信息。可以用下面的方法来减少这些冗余信息。设和分别代表高频和低频的中心频率,设K是方向的数目,S代表多分辨率分解时尺度变化的次数。这样,滤波器设计的策略为:确保Gabor滤波器组的响应在频率上半峰幅值能相互接触,且互不重叠。这样,就可以得到如下计算滤波器参数的公式:
(1-4)
(1-5)
式中:.,图1是经过Gabor小波滤波后的图像,滤波器的从尺度和较度一次增大:
2.紋理特征描述与提取
给定一幅图像I(x,y),它的Gabor小波变换可定义为:
(2-1)
这里,*代表取其共轭复数。假设局部紋理区域具有空间一致性,则变换系数的均值和标准差可代表该区域,用于分类和检索。均值和标准差表示如下:
(2-2)
(2-3)
用和作为分量,可以构成检索用的特征向量,即:
(2-4)
3.总结
Gabor小波变换虽然不是正交变换,但是它是对图像紋理特征的较好选择。经过证明,它比用Harr等正交小波提取的图像紋理特征要好。它的运算速度非常快,以根据需要对不同方向和尺度进行紋理的提取,是提取图像紋理特征的常用方法。
参考文献
[1]周德龙.基于二维Gabor小波变换的角点匹配算法[J].计算机工程与科学,2011,12.
[2]刘晓杰.Gabor小波和LPP相结合的人脸识别方法研究[J].电视技术,2011,23.
作者简介:蓝永(1975—),馆员,现供职于青岛科技大学图书馆,研究方向:数字图像处理,模式识别,数据挖掘。
特征提取方法论文 篇12
关键词:智能交通,时频域特征,特征提取,地磁信号,机场场面
0 引言
由于机场飞机起降架次增多等原因,跑道入侵成为影响飞行安全的重大隐患,预防跑道入侵成为重要问题。目标检测,通常认为是非协作式机场场面活动目标的检测和识别方法,作为跑道入侵防御系统最为基础的系统监视功能部分,能够为目标跟踪和入侵控制提供信息支持[1]。利用地磁传感器(anisotropic magneto resistance,AMR)作为目标检测器,通过其得到场面移动目标磁信号,信号数据中含有丰富的目标信息,在去除信号中的噪声干扰后,如何提取目标特征是本文研究的关键。
目前应用于机场场面的目标特征提取主要是基于视频图像信号和雷达信号[2],但其处理数据复杂,且视频图像的检测方式稳定性不高,易受天气影响。在目标信号的特征提取中,多采用时域特征方法提取目标特征。文献[3]提出利用车辆检测算法获得车辆特征向量,并将所有时域波形归一化进行特征提取,此方法以牺牲目标长度特征信息为代价,有效地减少了计算量;文献[4]根据不同车辆地磁扰动特性,抽象出了相车长、平均能量、归一化方波的波峰波谷数目3类时域信号特征,信号的时域特性虽然能够直观反映信号特征,但是只从信号外观描述信号的特性。而机场场面移动目标包含场面上的车辆和飞机,场面目标种类较多且飞机磁信号具有一定的复杂性,只分析信号的时域特征并不能全面展现信号特性,需要补充信号的频域特征。小波分析作为1种信号的频域部分特征的提取手段,在声信号及振动信号的特征提取中有较好的应用。文献[6]利用小波多变换获得信号的频域特征从而识别水下目标;文献[7]利用小波分析方法提取人体脉象信号特征,取得了良好的识别效果。为此,笔者在前人研究的基础上,提出了1种结合时域特征和基于小波分解的频域特征的机场目标特征提取方法,以机场场面部分车辆和航空器磁信号为样本,利用目标特征区分度测度的方法进行了验证。
1 时域特征提取
1.1 目标长度特征提取
AMR地磁传感器(霍尼韦尔HM5883)具有体积小、灵敏度高、成本低廉的特点。AMR地磁传感器的布置方式如图1所示。在机场跑道及滑行道中线布置2个传感器s1,s2,两者的距离为l。
图1 AMR地磁传感器布置Fig.1 Anisotropic Magneto Resistance layout
目标长度是目标的首要特征参数,要提取目标长度特征,需要获得目标速度。目标感知信号宽度实际上就是目标经过传感器采样节点的时间宽度[3]。目标通过先后通过2个传感器的时间间隔很小,因此,可以认为其匀速通过传感器采样节点,有:
式中:v为目标速度;t1为目标经过s1的时刻;t2为目标经过s2的时刻。则目标长度L为
式中:ts为传感器采集信号的时间宽度。
1.2 感知信号时域规整
同一目标以不同速度经过传感器节点时,其感知信号的时间轴宽度不同。为了消除速度对目标分类识别的影响,必须提取与速度无关的特征量。本文利用基于目标长度的归一化方法规整时域信号。根据目标长度特征对磁信号进行规范化处理,将其转换为相应固定的长度的信号数组,并保留能够做进一步目标特征提取的信息特征。
规定长度为L的目标磁信号的数据点个数为N,对相同长度目标的磁信号向量数组进行归一化[4]。信号归一化的方法为
式中,t(k)为原始的数据,k=1,2,…,Ki,Ki因目标长度的不同而不同;c(i)为信号归一化后第i组数;Δn为归一化后信号第1到N-1组中每组的数据个数;N为原始信号进行归一化后以时间戳形式重分的数据组个数;c(N)归一化后信号的第N组数;Ki-(N-1)·Δn为归一化信号后第N组数的数据个数。
图2为根据目标长度规整后的食品升降车,加油车及机场引导车,塞斯纳550B,空客320及空客340的时域信号,这6种目标为机场场面典型的目标类型。食品升降车与加油车车长相同,其规整后的时域信号数据点个数也相同,而机场引导车及3种不同类型的飞机的长度不一,其规整后的时域信号的数据点个数相应的压缩或扩充,规整后的信号皆保留了原始信号特征信息。
图2 不同车辆与飞机的规整后时域信号Fig.2 Structured time domain signals of different vehicles and aircraft
1.3 峰值特征提取
目标磁信号的变化剧烈程度与目标自身铁磁材料的分布密度有关,尽管不同的移动速度会造成信号采样点个数或者时间宽度的差异,但目标材料的构造及分布却是目标本身属性。构成目标的铁磁性材料的结构越多,磁信号的扰动越强。图3为波音737-800磁信号扰动峰值特性与机身的相对位置,磁信号变化剧烈的部分表明这些地方的磁性材料的分布相较于整架飞机较为集中,分别对应于尾翼与机翼。尾翼结构主要为垂直安定面,方向舵,升降舵等,机翼部分由发动机,起落架及油箱等部分构成。信号的峰值反映了磁性材料相对机身的位置及其分布的密度[5]。
设目标长度为L的感知信号,规整后数据点个数为N,波峰数为m,最大峰值振幅hmax为信号的第nmax点,最大峰值的位置比为nmax/N,最小峰值hmin为信号的第nmin点,最小峰值的位置比为nmin/N。图3中波音737-800的机身长度L=40m,规整后时域信号的数据点个数为N=200,波峰m=3,最大振幅hmax=137,最大峰值位置比nmax/N=0.72,最小峰值hmin=31,最小峰值位置比为nmin/N=0.52。
图3 波音737-800信号扰动峰值特性与相对机身位置Fig.3 The peak feature of Boeing 737-800signal and its relative position to the plane
2 基于小波变换的频域特征提取
2.1 小波变换的基本概念
笔者利用小波变换方法对信号进行时域分析,与傅里叶变换相比较,小波分析具有多分辨特性和良好的时频局部化特性。通过小波函数展开信号,可以在不同尺度上对信号进行分解。
设ψ(t)∈L2(R),如果满足则称ψ(t)为基本小波或母小波,ψ(ω)为ψ(t)的傅里叶变换。将母小波ψ(t)进行某种程度的伸缩和平移,即称为小波基函数。将小波基函数ψa,τ(t)作用于待测信号f(t),与f(t)做内积得到称为连续小波变换[6]。
在实际应用中,连续小波变换需要进行离散化,二进制离散小波取a=2-j,τ=2-jk(j=0,1,2…,k为正整数)。将信号进行二进离散小波变换,可分解成不同尺度下的各个分量。信号f(t)向尺度空间Vj投影后得到j尺度下的近似信号为,式中φj,k(t)为尺度函数,尺度展开系数cj,k=[f(t),φj,k(t)]。信号f(t)向小波空间Wj投影后所得到该空间的细节信号为。其中:小波系数dj,k=[f(t),ψj,k(t)]。
2.2 频域特征提取
霍尼韦尔HM5883传感器连续测量模式的采样频率为75Hz。根据奈奎斯特采样定理,感知信号的频率范围为0~37.5Hz。利用Matllat分解算法3层分解信号,将规整后的时域信号分解成3层细节信号和1个近似信号,即将频率划分为低频0~4.687 5Hz,中低频4.687 5~9.375Hz,中高频9.375~18.75Hz,高频18.75~37.5Hz 4个频带[7],见图4。
图4 信号频带划分Fig.4 Division of the frequency band
感知信号能量的计算公式为
式中:E0为信号总能量;ECA3为近似信号能量值;ECDj为信号f(t)在第j尺度下的小波能量。不同类型目标在各个尺度下小波能量比是不一样的,将归一化后的各阶小波能量值与近似信号能量比作为信号的频域特征向量,即Ei=[ECA3/E0,ECD3/E0...ECD1/E0]。图5为规整后波音737-800与空客320磁信号的db2(Daubechies 2)、db5(Daubechies 5)3层小波分解对比图。db5小波不仅在近似信号和细节信号中具有更高的表现力,且二者的频域特征的区分在db5小波分解中比db2更明显。对比不同小波的分解结果,最终选取db5小波分解信号。
图5 波音737-800磁信号db2与db5的3层小波分解Fig.5 3scales wavelet decomposition of Boeing 737-800magnetic signal by db2and db5
图6所示为食品升降车,加油车及机场引导车,塞斯纳550B,空客320及空客340的规整后时域信号的db5小波3层分解。从各目标类型的频域信号分解中可以看出各目标类型的频域信号在频带中的分布情况。加油车的d1系数波动比食品升降车更为强烈,而机场引导车的d3系数变化比加油车和食品升降车的变化更明显。空客340的d1和d3系数比空客320及塞斯纳550B变化更显著,塞斯纳550B的d2系数波动高于空客320及空客340。
图6 3种车辆及飞机磁信号的3层小波分解Fig.6 3scales wavelet decomposition of 3vehicles and aircraft
3 不同目标特征区分度的测度
通过时域和频域特征提取方法一共抽象出10个特征,x={x1,…,x10},分别为目标长度L(x1)、波峰数m(x2)、最大峰值hmax(x3)、最大峰值的位置比为nmax/N(x4)、最小峰值hmin(x5)、最小峰值的位置比为nmin/N(x6)、近似信号能量比ECA3/E0(x7)、三阶信号能量比ECD3/E0(x8)、二阶信号能量比ECD2/E0(x9),以及一阶信号能量比ECD1/E0(x10)。特征提取的目的是保证目标特征能够与其他类别的目标特征具有足够的区分度从而完成目标类型的最终分类[8]。各类型目标特征的相对距离越大,说明目标特征间的相似度越低,区分度越明显。本文利用目标特征区分度测度方法来衡量目标特征间的相对距离。
设目标类型的集合为A={A1,A2,…,A7},目标各特征权重为w={w1,w2,…,w10},第k类目标的特征值为xk={x1k,x2k,…,xk10},第m类(m≠k)目标的特征值为xm={x1m,x2m,…,xm10}。
式中:xi为所有目标的第i个特征值之和;Dkm为第k类目标与第m类目标特征值的相对距离;D为目标类型集合中所有目标之间相对距离之和。2个特征的相似度的度量计算公式为
式中:Xi为第k类目标与第m类目标的第i个特征值之比,为
且目标特征权重w通过建立单优化模型求得,,目标特征值权重w={w1,w2,…,w10}满足
求得权重wi从而获得各类目标特征与其他各类型目标特征的相对距离Dkm、距离总和D及相似度Skm,得到各类型目标特征的区分度。
4 实验
4.1 实验步骤
笔者以机场场面的部分移动的飞机/车辆磁信号为样本,部分飞机磁信号数据来自于H.Gao[10]与K.Dimitropoulos[11],部分车辆数据于2013年在机场附近采集,利用霍尼韦尔HM5883L型号的AMR地磁传感器作为目标检测器,采用动态阈值法进行滤波。首先利用时域特征提取方法获得待测目标的长度,根据目标长度规整时域信号,在此基础上提取时域部分的峰值特征并利用db5小波3层分解信号提取信号频域特征,将所提取的目标时域特征和频域特征结合共同构成待测信号的全部特征[12]。时频域的特征提取方法一共抽象出10个特征值,根据目标特征区分度测度算法获得各类型间目标特征的相对距离,即依据目标类型建立特征值的分配权重矩阵及目标特征相对距离的单优化模型,计算出第k类目标特征值的分配权重及其与其他目标类型特征的相对距离总和及相似度。图7为特征提取方法流程图。
图7 特征提取方法Fig.7 Feature extraction method
1)时域特征提取。首先为目标长度的获取,以食品升降车为例。设定2只AMR地磁传感器s1,s2之间的距离为l=5m,目标先后经过二者的时间差为Δt=0.58s,并且目标经过其中1个AMR地磁传感器的时间检测域宽度为ts=0.81s,由此得到目标长度,依据目标长度规整时域信号,消除速度对信号检测宽度的影响。
其次为感知信号的峰值特征提取,食品升降车规整后时域信号如图2(a)。可得到波峰数m,最大峰值hmax,最大峰值的位置比为nmax/N,最小峰值hmin,最小峰值的位置比为nmin/N分别为4,145,0.27,69,0.11。
2)频域特征提取。对规整后的时域信号进行频域特征提取。AMR地磁传感器的采样频率为75Hz,利用db5小波进行3层信号分解,信号总能量值为E0=1 548 274.68,近似信号能量值ECA3=1 559 189,第1层、第2层、第3层小波能量值ECD1、ECD2、ECD3分别为4 521.65,1 247.35,405.39,归一化近似信号能量值及各层小波能量值,即将近似信号能量值ECA3和3层小波能量值ECD1,ECD2,ECD3分别与信号总能量E0进行比较,得到食品升降车的磁感知信号归一化近似信号能量比及3层小波能量比为Ei=[ECA3/E0,ECD3/E0,…,ECD1/E0]=[0.9 9 3,0.0 0 2 9,0.000 8,0.000 26],将其作为信号的频域特征,并结合时域特征,得到食品升降车信号特征为x={x1,…,x10}={7,4,1 4 5,0.2 7,6 9,0.1 1,99.3%,0.29%,0.08%,0.026%}。
4.2 实验结果及分析
检测样本的目标类型为机场引导车,食品升降车,加油车,塞斯纳550B,波音737-800,空客320,空客340 7种类型[13]。按照时域频域特征结合的特征提取方法分别对车辆及飞机目标磁信号检测样本进行特征提取。表1为7种目标的时域特征及频域特征。
表1 目标类型时频域特征Tab.1 The time domain futures and frequency domain features of the targets
以食品升降车为例,根据目标特征区分度测度算法分别计算食品升降车时域、频域及时频域特征与另外6种目标时域特征、频域特征及时频域特征距离[12]。根据算法获得食品升降车时频域特征分配权重为w时频={0.15,0.11,0.07,0.05,0.11,0.11,0.01,0.09,0.15,0.15},其时域特征分配权重w时域={0.3,0.2,0.1,0.1,0.1,0.2},频域特征分配权重为w频域={0.05,0.2,0.35,0.4}。表2为对比3种特征提取方法的其他6种目标特征与食品升降车的相对距离。
表2 其他类型目标与食品升降车的相对距离Tab.2 The distance between other target and catering truck
对照表2,在时域特征提取方法中,食品升降车与加油车的目标特征距离为0.013,表明其时域特征极其相似,仅依靠时域特征方法不能很好的区分2种目标类型,而时频域特征提取方法使得其特征距离提高到0.046,2种类型区分度增大。在频域特征提取方法中,食品升降车与波音737及空客320的特征距离分别为0.027,0.026,但在时频域结合的特征提取方法中,食品升降车与二者的特征距离为0.082,0.083,使得食品升降车与这2种飞机有较明显的区分度。
图8为3种特征提取方法的目标类型相似度对比。横坐标目标类型对比中数字1,2,3,4,5,6,7分别表示机场引导车,食品升降车,加油车,塞斯纳550B,波音737-800,空客320,空客340 7种目标类型,1-2即表示机场引导车与食品升降车的对比。对照图8,对7种目标间相似度求平均值,目标间时频特征的平均相似度为0.516,略高于频域特征的0.489,略低于时域特征的0.523,但是时频域特征提取方法使得目标之间的相似度均低于0.79,没有出现不同目标类之间具有极高相似度的情况。食品升降车与加油车时域特征的相似度为0.937,而时频域特征相似度为0.775,加油车与波音737-800的频域特征相似度为0.936,而时频特征相似度为0.759,时频域特征提取方法能够在时域特征区分度不够时,补充信号的频域特征对目标进行分类,反之在时域特征区分度不够的情况下,可补充信号的时域特征对目标进行分类[14]。总体说来,信号的时频域特征综合时域特征和频域特征,其丰富的特征信息能够更全面的反映信号特性,能够有效的平衡及降低各目标间的相似度。
图8 3种特征提取方法的目标相似度对比Fig.8 The comparison of the similarity of 3feature extraction methods between different targets
5 结束语