目标提取算法

2024-09-28

目标提取算法(精选8篇)

目标提取算法 篇1

在远程红外预警、红外搜索系统中, 需要在较远的距离下检测和跟踪目标, 以确保有充裕的反应时间实现对目标的准确栏截。但当红外成像系统与目标的相对距离较远时, 目标的红外成像面积非常小, 通常只有几个像素, 而且能量很弱, 同时红外图像中存在大面积的背景和较强的噪声干扰, 使得目标常淹没于背景和噪声之中, 这使得红外弱小目标的检测非常困难。

本文采取背景抑制方法, 通过将原始图像进行高通滤波、改进中值滤波等处理, 有效地抑制背景杂波, 提高图像的信杂比, 并在此基础上利用八向梯度法对滤波后图像进行阈值检测找出目标点, 以实现对弱小目标的检测。

1 弱小目标检测原理

弱小目标检测的实质就是将图像中的小目标从背景图像中分割出来。由于红外成像除了目标往往存在各种背景物, 如大气云层背景中, 除了有云层外, 还有空间上不相关的噪声;并且小目标成像面积小, 缺乏几何形状、纹理结构等特征, 可供检测识别的信息很少, 这些特征严重影响了对红外弱小目标的检测, 因此, 为了提高信噪比, 突出小目标, 需对图像进行检测前的图像预处理, 包括背景抑制和噪声削减等方法, 以提高对目标的检测概率;经过预处理后的图像再采用目标梯度阈值分割、多特征提取等算法即可实现对弱小目标的检测。弱小目标检测原理框图如图1所示。

2 弱小目标检测过程

2.1 图像背景抑制

利用红外传感器采集的小目标图像, 背景区域比较平坦, 是灰度变化缓慢的低频部分, 具有一定的相关性。而小目标的亮度较背景高, 其灰度处于突变区域, 且与背景不相关, 是图像中的高频部分。由于高通滤波器能有效抑制低频分量, 让高频分量通过, 为此采用高通滤波器来进行全视场的背景抑制, 背景抑制的结果增强了局部弱小目标同时也保留了部分高频噪声。

对于数字图像, 滤波器的脉冲响应函数一般选用卷积模板来表示, 记为矩阵H。在模板系数选择上, 如果矩阵中间权值之和与旁边权值之和相互抵消, 就能有效地去除低频分量, 由于小目标一般都是包含几个像素, 因而取如下模板H:

2.2 改进的中值滤波

中值滤波法是一种非线性变换, 它不仅能保持轮廓边缘的清晰度, 对多种噪声有良好的去噪功能, 而且算法简单, 便于实现。其实现过程如下:

(1) 选择一个有奇数点的滑动窗。如一维处理可选长度为3, 5等的滑动窗, 二维处理可以选择3×3, 5×5等的滑动窗。

(2) 将滑动窗内的点按数值大小顺序排列成序列X。

(3) 将滑动窗中心的点用序列X的中值代替。如长度为5的滑动窗的中心用序列X的第3个值替换, 滑动窗为3×3的中心用序列X的第5个值替换。

由于高通滤波后的图像在保留弱小目标的同时也保留了高频噪声, 为了进一步抑制噪声, 需要对图像再次滤波。由于红外成像系统中热扩散的原因, 目标的成像面积一般大于一个像素。本文选用的改进中值滤波, 以尽可能去除非目标象素点, 满足弱小目标单帧检测概率要求。其实现过程如下:

(1) 弱小目标在红外成通常像上仅形成一个不大于3×3像素的非均匀区域, 因此选择一个3×3的滑动窗。

(2) 将3×3滑动窗内的点按灰度从大到小排列成序列X。

(3) 将滑动窗中心的灰度用序列X的第三个值代替, 即选取灰度第三大的点的灰度作为该点的灰度。

通过改进的中值滤波, 可以去掉孤立的噪声点, 同时又确保保留像素点不小于3的小目标, 避免造成漏警。

2.3 八向梯度法决策

经过对大量复杂云层图像的观察和分析, 发现红外图像中的弱小目标即使在整个图像中强度不是最强的, 但在它所处的小区域中与局域背景的差别较明显, 弱点目标沿各个方向上的梯度均较高, 而背景部分的梯度由于其相关性不具有这一特性, 且边缘仅在某些连续的方向上具有高梯度。

基于以上观点, 这里提出用多向梯度来检测弱小目标的原理。梯度可以定量反应待检测像素点在某一方向上高于其周围像素点数值大小的量, 当多个方向的差异度都大于一定阈值时, 则该像素点为弱小目标;反之, 则为背景。

图像任意一点的梯度为一矢量, 其数学定义如下:

该梯度向量的模为:

式中, m, n为水平和垂直方向的梯度步长, 它的选取与目标大小、系统要求的检测概率和计算时间相关。一般情况下, 对图像中每点梯度的计算方向越多对检测弱小目标越有利, 但计算量会急剧增加, 导致实时性差。综合考虑检测效果和实时性, 本文采用八向梯度来计算, 则定义图像中任意一点f (x, y) 的八向梯度为:

根据阈值判决的方法, 利用式 (5) 将梯度图像G[f (x, y) ]进行二值化处理, 则加阈值的梯度图像g (x, y) 的表达式为:

式中TH为阈值门限, 且TTHH由梯度图像G[f (x, y) ]的均值μ和标准差σ来构造, 如公式 (6) 所示:

式中λ为梯度阈值系数, 一般选取2.0~2.4时, 该阈值分割算法能实现较高的检测概率 (>95%) , 同时又将虚警个数降得较低 (每帧虚警个数可小于5) , 从而达到了检测目的。

3 实验结果及结论

采用原始红外图像, 经高通滤波后、改进中值滤波、八向梯度均值分割后的图像如图2~5所示。

从图2可以看出原始图像经过高通滤波后, 大面积的背景被抑制掉, 但还是保留了大量的高频噪声;经过改进的中值滤波后, 可以看到噪声被进一步抑制, 但降低了图像的信噪比, 不便于目标辨认;再经过八向梯度判决滤除了背景干扰, 获取了正确目标。经过实验及结果分析验证了本文算法是切实有效的。

参考文献

[1]王江安, 肖伟岸.基于双波段的目标红外特征分析[J].激光与红外, 2001, 31 (6) :351~353.

[2]章毓晋.图像工程[M].北京:清华大学出版社, 2007.

[3]宗思光, 王江安.多量级多向梯度海空复杂背景红外弱点目标检测[J].应用光学, 2005, 26 (5) .

手机触摸屏及其目标提取方法 篇2

关键词:手机触摸屏;目标提取;滑动图片操控

中图分类号:TN929.53 文献标识码:A 文章编号:1674-7712 (2012) 16-0014-01

触摸屏技术是手机行业发展的关键技术,同时也是手机行业技术发展的难点。随着手机触摸屏技术的不断发展,传统的手写笔已经被逐渐代替和淘汰,更多的手机用户希望通过用手指代替手写笔,直接触摸虚拟目标的方法来完成人机交互任务。这就要求手机能够通过识别用户的手指动作来实现用户的操作意图。而用户操作手机的特点又有一定的特点,如何适应手机用户的操作特征,提高手机触摸屏的目标提取准确度成为了当前手机触摸屏发展的关键技术。本文结合手机用户触摸操作的具体特征,提出了一种基于滑动技术的图片目标操控方法

一、基于拇指滑动技术的图片目标操控问题阐述

当前这种图片浏览操作控制方式的效率比较低,一般难以满足迅速提高的人机交互需求。在当前的功能操作界面之下,用户的交互式任务的达成面临着操作目标可达性较低的问题。

二、目标提取方法的设计

三、目标提取与图片操控的实现

四、结语

本文在对手机用户单手操作手机触摸屏的特点进行论述的基础上,结合拇指体积较大,容易导致视觉覆盖和定位不精确的问题,提出了基于滑动技术的图片目标操控方法。

参考文献:

[1]李攀.触摸屏手机的目标提取方法研究与实现,2010,04.

[2]李辉.基于MTK平台手机人机交互系统设计与实现,大连理工大学,2008,6.

目标提取算法 篇3

某雷达装备在历次飞行试验中, 记录了大量不同机型目标的飞行数据。这些数据主要用于试验进程中, 与其他雷达进行数据比对和误差分析, 试验结束后, 数据即被删除或长期闲置。如果能将所积累的原始试验数据应用于操作手的训练, 不仅可以增加训练的真实性, 还能使长期失效的宝贵数据资源得以重新利用。

本文以该特体雷达配备的专用模拟训练系统和目标模拟器为基础, 设计了一种雷达真实目标航迹提取算法, 实现了利用装备录取的试验目标数据进行搜索跟踪目标训练的功能。

1 算法设计

1.1 雷达录取数据分析

某雷达装备在每一次跟踪飞行目标时, 均将雷达波束范围内所有目标以及杂波、干扰的信息全部记录下来, 并以txt格式存储在硬盘上。原始数据文件中的每一行都是一个数据记录, 包含9个域:ph, az, r, el, t, u, bwsx, agc, u1, 分别代表目标批号、方位、斜距离、俯仰、时间、目标回波幅度、报文属性、自动增益以及杂波幅度。经过对该装备大量试验数据的分析[2], 可以得到以下的数据特点:

(1) 数据量大。根据装备参数设置的不同, 装备每隔 1~10 ms记录1个数据, 因此约1 h的数据文件大小约为10 MB, 而有时实际试验数据需要记录2 h甚至更长。

(2) 异常点多。装备会因各种原因引起如时间突变、距离异常等数据记录。

(3) 数据杂乱。在跟踪起始和终结阶段, 由于放开能量和干扰多等原因, 数据杂乱, 难以找到规律。

(4) 仅在雷达跟上目标后集中能量阶段, 数据基本都是目标数据, 杂波和干扰较少, 数据规则整齐。

1.2 算法的设计思路

由于该雷达已经配备了专用的操作训练模拟器和目标模拟器, 因此, 只要将装备录取的数据经过处理, 变成与目标模拟器生成的虚拟目标统一的数据格式, 就可以将数据装载在操作训练模拟器上, 由目标模拟软件和主控程序软件进行调用和处理, 从而为操作训练提供真实目标的航迹数据[3]。航迹提取算法的设计思路如图1所示。

由于现有的目标模拟器不能进行目标编批和消批处理, 因此, 读取存于同一个文件的数据, 均认为是同一个目标。所以, 如果将真实目标数据中的干扰点保留, 必将造成跟踪时扫描线随时间在各干扰点和目标之间跳动。因此, 滤除算法应将所有的干扰点也一并滤除掉。

另外, 装备数据一般只含有一个目标的信息, 卡尔曼滤波算法主要用于实时的滤波误差估计和航迹预测, 适合将有用目标从多个目标的航迹中分离出来, 且算法计算量较大。因此, 这里没有采用卡尔曼滤波算法计算。

2 算法的具体实现

2.1 数据滤除

该算法设计目的是保留真实目标航迹点的数据记录, 而滤除杂波、干扰以及异常点。通常情况下, 杂波的回波幅度小于目标的回波幅度, 干扰点迹不能形成较为规则的连续点而总是存在扰动, 异常点可以根据先验知识即可推断得出。根据这些结论, 设计算法如下:

第一步, 将雷达试验中录取的原始真实数据进行数据滤除:

(1) 滤除异常点。如果某条记录的r<500 km或≥0 km, 则将此记录滤除。如果某条记录的t<100 000 000, 则将此记录滤除。如果某条记录的agc不在10~100之间, 则将此记录滤除。

(2) 滤除杂波点。如果某条记录的u<u1, 则将此记录滤除。

第二步, 将滤除后的数据记录按照时间t的升序进行排序。

第三步, 滤除干扰点。将数据记录分组, 组的大小根据测试结果对比, 选取25~40个数据为一组比较合适。连续取出30条数据记录为一组, 遍历这组数据。如果在遍历过程中, 两两相邻的数据之间斜距离的增量绝对值<1 000 m并且时间增量<3 000 ms, 则此数据暂时保留。如果在遍历过程中, 任何两两相邻的数据不能满足上述要求, 则将此组的30条数据全部抛弃并进入下一组。

经过这样的数据滤除, 可能会丢弃一部分在跟踪起始和终结阶段的数据记录, 但所保留的数据能够形成连续航迹的真实目标数据。输出格式是每行一条数据:方位az, 俯仰el, 距离r, 时间t。经过处理后生成的dot文件就是一条可用的真实航线。

2.2 杂波处理

上述滤除算法已将大量真实的干扰和杂波滤掉, 避免了跟踪过程中扫描线的跳动。但是没有杂波和干扰, 目标航迹信息的真实性又有所下降[4]。因此, 需要人为地给真实目标航迹信息里添加杂波信息。杂波利用随机数生成的方法生成, 在方位和距离两个维度上产生均匀分布的随机数, 并通过微小的位置调整使其具有一定的扰动。对生成的随机数杂波只要不进行编批, 就不会扰乱真实航迹的连续跟踪。这样模拟产生的杂波在PPI显示器上即可得到近区杂波较多, 远区杂波较少的效果, 并且具有一定的扰动, 一定程度上接近真实的杂波情况。

2.3 数据调用

将滤除后的数据存储为dot文件, 其数据格式与虚拟目标的数据格式应保持一致, 即航迹数据格式为tr (az, el, m, t) 。使用时程序将数据读入内存, 送入目标模拟器进行航线生成, 再由主控程序调用, 进行编批、显示、跟踪等后续处理。

3 效果分析

选取该雷达装备某年6月24日下午16点21分记录的一个数据文件进行分析。文件名在装备中自动生成为06-24-16-21.txt, 经过前述数据处理后, 形成06-24-16-21.dot文件, 由目标模拟器软件读取, 并经操作手模拟训练了搜索跟踪的全过程, 在操作训练模拟器的PPI显示器上形成了类似于实际雷达的目标航迹, 如图2所示。

在操作手利用训练模拟器跟踪真实目标时, 经常会发生找不到目标或跟踪不稳丢失目标现象, 这是因为实际目标在飞行时, 航线起伏较大, 而且操作手事先对目标航线并不清楚, 这样可增加训练真实性和操作难度。可在目标模拟器的设置界面上加入1个信息窗, 将目标信息实时提供给观察者, 在目标丢失后可以据此重新搜索目标, 如同雷达工作在数引方式, 或有一部协作雷达实时为其提供目标信息一样。

4 结束语

该算法应用于某雷达装备模拟训练系统操作手的培训中, 能够起到虚拟目标所无法替代的培训作用, 使模拟训练系统的真实度增加。随着装备不断参加试验任务, 其录取的实验数据也会源源不断, 且每次的数据均有所不同, 给操作手的训练平台增加了丰富的训练资源。

摘要:针对利用雷达虚拟目标进行搜索跟踪训练的缺陷, 设计了一种雷达真实目标航迹提取算法。该算法应用于某雷达装备的模拟训练系统中, 可充分利用装备录取的试验飞行数据, 在后期进行装备操作手搜索跟踪目标的训练。

关键词:真实目标航迹,模拟训练器,搜索跟踪训练

参考文献

[1]Skolnik M I.雷达手册[M].2版.王军, 译.北京:电子工业出版社, 2003.

[2]王国玉, 汪连栋.雷达电子战系统数学仿真与评估[M].北京:国防工业出版社, 2004.

[3]George W Stimson.机载雷达导论[M].2版.吴汉平, 译.北京:电子工业出版社, 2005.

目标提取算法 篇4

目标检测,也叫目标提取,是一种基于目标的几何特征以及统计特征的图像分割,它将目标的分割和识别合二为一。其准确性和实时性是整个系统的一项重要能力。

现有的目标检测算法[1,2],对于尺寸比较大的图像,为了达到比较合理的缩放尺寸覆盖率,并保证目标能被连续地检测到,缩放倍数需要被细化到很小的单位,然后再对每一层图像利用分类器窗口滑动扫描检测目标,整个过程非常耗时。

本文提出了一种算法,此算法在对图像进行目标检测之前,先将富含信息的感兴趣区域(ROI)提取出来,然后将目标锁定在ROI,对其进行尺度缩放,再进行目标检测。

1 基于感兴趣区域提取的多尺度目标检测算法

1.1 样本创建

下面给出了部分训练样本,如图1所示,图中(a)为正类训练样本,是指经过裁剪的车辆图像,并对尺寸做了规整,(b)为部分负类训练样本,是指其它不含人车辆信息的任意图片,本文选取各种场景下不含车辆的图片作为负类训练样本:

(a)正训练样本(b)负训练样本

图1训练样本(参见游览)

1.2 图像分割算法

图像分割在物体的目标检测及感兴趣区的提取中起着重要的作用。图像分割的目的就是把图像中具有特殊含义的区域与其它不同区域分割出来,这些区域是互不相交的,而且每一个区域都满足特定区域的一致性,严格意义上的分割是指每一个物体都能和它的背景区分开来而成为一个独立完整的区域。但在实际应用中这是很困难的,图像分割也没有统一的标准,也没有通用的分割方法,一般来说,只要能把感兴趣的部分从背景中分割出来就有意义。

基于阈值的分割方法是一种常用分割技术。不管用何种方法选取阈值,一幅原始图像f(x,y)取单阈值T分割后的图像可定义为[3]:

这样得到的g(x,y)是一幅二值图像。其中,T为阈值,对于目标图像的像素g(i,j)=l,对于背景的图像像素g(i,j)=0。如果能确定一个合适的阈值就可准确地将图像分割开来。

如果整幅图像使用同一个阈值,称为全局阈值分割,这种分割方法适用于背景和前景有明显对比的图像。多数情况下,很难用一个统一的阈值将物体与背景分开。但是可以根据图像的局部特征采用不同的阈值,按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,这时的阈值称为为自适应阈值。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值[4,5,6]。

本文要分割的车辆图像背景和车辆本身并没有明显的对比,所以将自适应阈值分割与目标特征相结合,实现感兴趣区域的分割。

1.3 基于突变的感兴趣区域分割[7]

在高分辨大尺寸图像中,目标尺寸跨度较大,对于大尺寸目标,经过二值化以后,目标的细节与背景并不能明显地分开。因此,在阈值分割的基础上,需要进一步提取目标区域。根据目标是车辆的特性,很难在二值图像上将目标区域提取出来。车辆在正常日照条件下,无论外界光线如何变化,车辆底部都会在道路上产生颜色较深的阴影,参考文献[3]。利用车辆的这一特性,在二值化图像中提取车辆底部阴影突变,然后基于突变的长度按100:40的比例取得突变上方宽度,构成的矩形即为ROI。

突变区域的提取,本文参考文献[3]的方法,假设背景像素值为1,那么车辆底部阴影像素值为0。首先对整幅图像从下往上,从左到右扫描,若f(x,y)为突变像素的像素值,(x,y)为突变位置,继续判断f(x+1,y),f(x+2,y)…,f(x+n,y)像素值是否与f(x,y)值相同,如果相同,则继续进行往右检测,直到检测到有一定连续数量的像素与f(x,y)不同,则表明图像突变行结束。记录此时像素的位置(x+k,y),为突变行的右端点。

为了排除噪声点的干扰,根据车辆底部阴影在图像中的长度,设置一定的阈值范围,在这个阈值区间内连续长度的突变才被判定为车辆底部阴影。当突变线确定以后,根据100:40的比例确定ROI。

1.4 多尺度缩放目标检测算法

基于目标的多尺度连续性的方法之目标检测算法流程如图2所示。

图2多尺度目标检测算法流程(参见右栏)

(1)目标位置的确定。利用检测到目标的缩放尺度上的目标位置映射到原图上的位置取均值,即可得到目标在原图中的位置。

横坐标的计算方法:

纵坐标的计算方法:

(2)目标大小的确定。先求出缩放倍数的平均值,以100×40为基数,求目标在原图上的大小。

计算高度:

计算宽度:

基于多尺度目标检测算法的结果如图3所示。

1.5 基于感兴趣区域提取的多尺度缩放目标检测算法的实现

算法流程如图4所示。

本文目标检测的对象具有很高的分辨率,为了得到理想的图像分割效果,在对图像进行ROI提取之前,首先对图像进行滤波,目的是消除图像中的大量细节的信息。具体步骤如下:

(1)局部均值滤波。将车辆图像以3×3的窗口为单元进行扫描,并用像素点的灰度平均值代替3×3窗口内的像素点的灰度值。

(2)阈值分割。将图像分割为输出只有0和1的二值图像。在窗口内,将出现频率最高的像素点的像素值作为阈值,大于阈值的像素点灰度值置为1,小于阈值的像素点灰度置为0。

(3)突变区域检测。突变检测的目的是将感兴趣区域可能存在的区域搜索出来。

将在某个取值范围内连续突变的像素点,标记为突变区域,并按照一定的比例标记出ROI的高度,将ROI标记出来。

(4)ROI的目标检测。在ROI确定之后,对ROI区域进行进一步的多尺度缩放,然后在ROI内滑窗扫描,将分类器用在每一次扫描窗口上,对窗口内的图像分类,根据分类器输出结果得到关于活性值的金字塔式地图CAM。利用邻域抑制和重复点消除法在目标邻域搜索活性峰值点,在活性值金字塔上查找基于连续度的目标,进行最终定位。

2 实验结果及分析

2.1 实验参数设计

本文算法是针对大尺寸图像的目标检测提出来的,为了验证本算法,从采集到的车辆图片库中(880幅车辆图片)选取了图片质量较差的图像样本组成了一个110幅图像的样本库,用于验证本文方法的效果。实验基于Intel p4 3.0GHz的PC机,Window XP操作系统,MATLAB6.5的仿真软件环境。实验图像的尺寸为912×618。

具体实验参数的设置如下:

(1)选用5×5大小的窗口作为均值滤波的窗口;(2)选用出现频率最高的灰度值作为阈值;(3)本文选择的图像缩放倍数为0.6,检测的图像长度为100~300;

(4)突变连续区域的高度按照100:400的比例进行提取,从而确定ROI。

2.2 实验结果与分析

图5是对一幅输入图像进行基于连续度的目标检测的效果图。通过实验过程以及对实验结果的观察,我们知道本文采用的实验方法用了较短的实验仿真时间,也得到了很好的目标检测效果。

3 结论

本文针对大尺寸目标提取耗时的现象,提出了基于感兴趣区域提取的多尺度缩放目标检测算法。对于一幅大小为912×618的图像,直接对图像进行目标检测,需要的时间在1h左右,然而在采用本文的方法进行预处理后,再进行目标检测,实验的时间在20min以内。这种方法在很大程度上缩短了目标检测的时间,同时有效地滤除了大量的背景信息,降低了背景错误检测成目标的概率,提高了目标的准确效果。

参考文献

[1]王洪斌,赵振涌,顾彪.基于全局运动补偿的多运动目标检测方法研究[J].电子技术应用,2011,37(1).110-114.

[2]Haralick R M,Shapiro L G.Computer and RobotVision II[M].Addison-Wesley,1993.

[3]徐国艳,王传荣,高峰,等.车辆视频检测感兴趣区域确定算法[J].北京航空航天大学学报,2009,36(7):781-784.

[4]Roth D.Learning to resolve natural languageambiguities:A unified approach[C]//Proceedingsof the Fifteenth National Conference on ArtificialIntelligence,1998:806-813.

[5]Yang M H,Roth D,Ahuja N.ASNoW-based facedetector.In Solla[J],S.A.,Leen,T.K.,Muller,K.R.,eds.:Advances in Neural Information ProcessingSystems 12.2000:855-861.

[6]CarlsonA.J,Cumby C,Rosen J,et al.The SNoWlearning architecture[R].Technical Report UIUCDCS-R-99-2101,UIUC Computer Science Department,1999.

点特征提取算法探讨 篇5

1 Moravec兴趣算子

Moravec于1977年提出利用灰度方差提取点特征的算子。Moravec算子是在四个主要方向上, 选择具有最大-最小灰度方差的点作为特征点。

第一步, 计算各像元的兴趣值IV (in terestv alue) 。

第二步, 给定一经验阈值, 将兴趣值大于该阈值的点 (即兴趣值计算窗口的中心点) 作为候选点。阈值的选择应以候选点中包括所需要的特征点, 又不含过多的非特征点为原则。

第三步, 选取候选点中的极值点作为特征点。

除了以上方法, 还可以尝试首先利用边缘提取方法提取整个图象的边缘轮廓, 然后在此轮廓内利用以上特征点提取方法提取特征点。

2 Forstner兴趣算子

Forstner算子是从影像中提取点 (角点、圆点等) 特征的一种较为有效的算子。Forstner算子通过计算各像素的Robert梯度和以像素 (c, r) 为中心的一个窗口的灰度协方差矩阵, 在影像中寻找具有尽可能小而且接近圆的点作为特征点, 它通过计算各影像点的兴趣值并采用抑制局部极小点的方法提取特征点。

第一步:计算各像素的Robert梯度。

第二步:计算l×l窗口中灰度的协方差矩阵。

第三步:计算兴趣值q与w。

第四步:确定待选点。

第五步:选取极值点。

3 Moravec程序框图 (如图1)

4 基于Moravec算子的点特征提取效果图

灰度图像效果图如下:

可以看出特征算子对一些反差加大的地物边缘提取的效果较好, 而反差较小的边缘提取效果较差, 这是由阈值窗口大小的选取和算法本身所决定的。

5 结语

Moravec算子是点特征提取算子中的经典算子之一, 后来的很多点特征提取算子都是在它的基础上改进得来的, 掌握Moravec算子的原理和实现方法对理解其他的点特征算子的理解和应用有很大好处。

参考文献

[1]张祖勋, 张剑清.数字摄影测量学[M].武汉:武汉大学出版社, 2002.

人脸识别特征提取算法研究 篇6

特征提取是人脸识别中一个非常重要的环节, 目的是为了降低人脸图像的维数。目前, 常用的基于统计的特征提取方法有主成分分析 (PCA) [1]和线性判别分析 (LDA) [2]等。独立元分析 (ICA) [3]是近年来发展起来的一种新的多维数字信号处理技术, 其基本思想是在最大程度保持信息量的前提下, 从高维数据空间中提取出低维数据的特征分量, 是一种基于人脸全局特征的识别方法。但ICA算法在获取独立分量的过程中需要获取人脸图像的先验知识, 这影响了识别的准确率。有效减少了后续工作的计算量, 取得了较高的识别率。

基于上述讨论, 本文将一个人脸图象矩阵视为一矢量, 通过引入模糊数学中的隶属度概念, 定义矢量隶属函数, 提出一种新的基于隶属度函数的独立成分分析特征抽取和识别方法。有效减少了后续工作的计算量, 取得了较高的识别率。本文称该方法为模糊ICA (Fuzzy ICA) 。

1、独立成分分析的基本理论

ICA最初是对盲信号的分离。利用独立成分分析 (ICA) 方法可以在不知道信号源和传输参数的情况下, 根据输入信号源的统计特性, 仅由观测信号恢复或提取源信号。独立成分分析已经成为盲信号处理中最主要的方法之一, 并在模式识别、数据压缩、图像分析等方面得到广泛的应用。

对于一组盲源信号S= (s1, s2, …sm) T, 有N路观测信号X= (x1, x2, …, xN) T, 每一路都是一维行向量的形式。存在系数 (混合) 矩阵A, 使得独立源信号S与观测信号X可以用线性关系来表示:

式中A∈RN×M, 称为混合矩阵。

存在分离矩阵W∈RM×N, 使其满足下式:

式中WA=I, I为单位阵, Y为统计独立的未知源信号S的最佳估计。

在独立成分分析中求解分离矩阵是关键。目前已提出很多求解分离矩阵的算法。本文采用FastICA方法来实现独立分量的提取【8】, 该方法是基于负熵的固定点算法, 是目前效率较高, 应用较广泛的一种ICA算法。该算法的具体描述为:

(1) 对数据进行中心化处理, 使其均值为零。

(2) 白化数据, 令白化后的数据为z。

(3) 初始化W (0) , 令其模为1, 置k=1;

(4) W (k) =E{zg (W (k-1) Tz) }-E{g′ (

W (k-1) Tz}W (k-1) ;

(5) W (k) =W (k) /||W (k) ||;

(6) 如果不收敛, 令k=k+1, 返回 (4) 继续, 否者输出W (k) 。

其中g (u) =uexp (-u2/2)

该算法最后得到的向量W, 其线性组合WTz给其中的一个独立分量。要计算n个独立分量就要重复上述算法n次, 但每提出一个分量后要从混合信号中减去这一分量。

2、基于Fuzzy ICA的特征提取和识别

2.1 算法设计的基本思想

自1965年Zadeh提出模糊概念以来, 模糊数学已被用于很多领域, 将其应用于模式识别, 形成了模糊模式识别。模糊模式识别方法是利用模糊数学中的概念、原理与方法解决分类识别问题。模糊模式识别将待识别类别、对象作为模糊集和其元素, 因此应根据实际问题需要进行特征提取或特征变换, 建立模糊集的隶属函数, 然后运用有关模糊数学的原理和方法进行分类识别。

2.2 特征提取和识别算法

ICA是PCA从二阶统计分析向高阶统计分析的拓展, 基于数据的高阶统计信息提取数据的独立特征, 能够更好的表示人脸的局部特征。具体算法为:

(1) 特征提取和变换

假设人脸图像训练集样本图像有n类人脸图像, α={α1, α2, …, αn}, 且第i类有Ni个人脸图像。

对人脸图像训练集样本图像α, 首先通过PCA算法对图像进行去二阶相关和降维处理, 然后通过ICA算法对图像进行处理, 获得由独立影像基构成的一个低维子空间:S={S1, S2, …, Sm} (m<n)

计算出此低维子空间的特征向量为:

假设Xj (j=1, 2, …, Ni) 为已知αi类人脸图像矩阵Aj (i) (j=1, 2, …, Ni) 的特征向量, Y为未知人脸图象矩阵C的特征向量, 计算Xj和Y在低维子空间中的投影向量, 即Zj=ST﹒Xj, φ=ST﹒Y。

(2) 建立矢量隶属函数。

模糊集合隶属函数的建立, 无论在理论上还是在应用上都是非常重要的。由于造成模糊不确定性的原因多种多样, 因而模糊集的种类是复杂的。实际应用中, 确定隶属函数的方法有不少, 如专家确定法、统计法、对比排序法等。

在本文中, 我们将模糊数学中建立隶属函数、隶属度的方法引入矢量空间中, 从而定义未知人脸图像矢量归属于αi类的模糊隶属度函数为:

其中, λj为任意实数, ‖﹒‖为向量范数, Zj和φ为 (1) 中得到的特征向量。

(3) 模糊结果处理及人脸分类识别。

使用模糊技术进行分类的结果不再是一个模式明确地属于某一类或不属于某一类, 而是以一定的隶属度属于各个类别。如果分类识别系统是多级的, 这样的结果有益于下一级的决策。如果这是最后一级决策, 而且要求一个明确的类别判决, 可以根据模式相对各类的隶属度或其他一些指标, 如贴近度等, 进行硬性分类。在本文中, 我们利用最大隶属度原则进行人脸分类识别, 即首先计算每个输入人脸图像 (测试样本) 对各类人脸图像的图像隶属度μai, 若, 则判别测试样本为αi类人脸图像。

3、试验结果及分析

试验中采用ORL标准人脸数据库验证该算法, 该数据库包括从1992年4月到1994年4月剑桥大学实验室拍摄的一系列人脸图像, 具体为40个人, 每个人有不同表情或不同视点的10幅图像, 共400幅图像所构成, 倾斜角度不超过20度, 这些人脸图像的分辨率为92×112, 人脸数据库中每个人的图像都是不同角度、不同时间且受一定光线和一些饰物 (如眼镜等) 影响。图1是ORL人脸数据库中部分图像:

本实验使用Matlab7.1在windows XP系统下, 为了更好地证明算法的有效性, 我们随机选取其中10个人, 每人前3幅 (共30幅) 图像作为训练样本, 其余的30幅图像作为测试样本的做法。如此重复10次试验, 最后结果取其平均值。分别采用传统的ICA方法、PCA方法和本文的Fuzzy ICA方法, 进行了人脸识别仿真实验

由图2可知, 识别率随着特征维数的增加而成上升的趋势, 本文的方法识别率高于传统PCA方法和ICA方法, 该方法识别率最高可达95.1%, 但当特征数接近100时, 识别率略有下降的趋势, 说明并不是所有的特征向量都是有效的投影空间, 有些刚好是与人脸本身无关的噪声因素干扰。

4、结束语

本文在研究采用ICA提取的具有局域特点的独立分量表示人脸基础上, 将基于模糊ICA的人脸图像特征提取和识别算法与传统的PCA和ICA人脸识别算法进行了比较, 对ORL标准人脸数据库的测试表明, 该算法的性能优越, 而且识别率较特征脸法更高。但是, 算法的计算量很大, 当样本数很多的时候, 训练时间是个问题。因此, 算法仍需进一步的改进和提高。

参考文献

[1]余晓梅, 徐丹。基于外观的子空间人脸识别方法研究[J], 计算机应用研究。2007, 24 (5) :10-12

[2]Belhumeur P N, Hespanha J P, Kriengman D J.FishedacesIRecognition using class specific linear projection[J].IEEETransaction on Pattern Analysis and MachineIntelligence.1997.19 (7) :771-720

[3]张贤达, 保铮。盲信号分离[J], 电子学报, 2001。29 (12) :1767-1771

[4]王展青, 刘小双等.基于PCA与ICA的人脸识别算法研究[J].华中师范大学学报, 2007, 41 (3) :373-376

[5]邢国。人脸识别中两种特征提取算法的性能比较[J].信息与电脑, 2011, 1 (6) :115-117

[6]龙际珍, 陈沅涛, 邓冬梅.基于模糊隶属度的人脸识别应用[J].计算机应用研究, 2011, 28 (7) :2789-2792

[7]Yuen PC, Lai JH.Face representation using independentcomponent analysis[J].Pattern Recognition, 2002, 35 (6) :1247-1257.

目标提取算法 篇7

1 主颜色描述符及颜色结构描述符

主颜色描述符采用少数几个代表性颜色表征整幅图像的颜色特征。其提取是将RGB颜色空间转换成HSV颜色空间后量化成72维, 求出每种颜色占整幅图像的百分比, 从72维的颜色直方图中提取少数主颜色。

该方法即保持了高效、简洁的特征, 又可以根据图像的颜色信息, 灵活的确定主颜色。

颜色结构描述符采用一个结构元素扫描整幅图像, 统计各种颜色的空间分布信息。其提取首先要将HMMD颜色空间量化成256维, 并累加得出颜色结构直方图。如果选用的维数小于256维, 需要合并维数将256维颜色空间重量化到指定的颜色空间。

颜色结构描述符能够很好地获得颜色的空间分布信息, 但其颜色空间量化和重量化过程较为复杂, 结构元素扫描过程增加了提取时间。

2 空间主颜色描述符

空间主颜色描述符结合主颜色描述符和颜色结构描述符的优点, 获得主颜色的空间分布信息, 计算空间主颜色描述符的相似距离。

其提取主颜色的过程与主颜色描述符的提取过程相同, 最终选取百分比最大的8种颜色作为主颜色, 得到主颜色的表达式

其中:N对应整幅图像的主颜色数目;ci表示颜色;Pci是该颜色对应的百分比。

图像量化之后, 对整幅图像进行逐行逐列扫描, 同时累加颜色结构直方图。结束后, 归一化颜色结构直方图。从颜色结构直方图中, 选取与主颜色对应的维数, 与得到的主颜色一起组成空间主颜色描述符。

最后得到的空间主颜色描述符表示为

其中:ci表示主颜色;qi表示主颜色百分比;hi表示主颜色的颜色结构信息。

3 系统设计

系统的主要模块以下模块组成。

(1) 查询模块。

该模块为用户提供多种查询手段, 支持用户根据不同要求选择不同查询方法。用户可以自主指定查询图片、检索算法和图像库。

(2) 图像预处理模块。

该模块是在提取图像特征之前对图像进行空间转换。并实现图像大小的规整, 图像分割等功能。

(3) 特征提取模块。

该模块是按照用户选择的算法, 提取指定的图像库内图像的特征值。算法包括主颜色描述符、颜色结构描述符和空间主颜色描述符。

(4) 图像匹配模块。

该模块是对查询图像的特征值与数据库的值进行匹配以确定它们的相似性。匹配完成后, 根据相似度进行排序。

(5) 显示模块。

该模块是显示匹配的结果, 包括检索到的相似图像和每幅图像与查询图像的相似度。

(6) 用户反馈模块。

该模块主要是用于选取检索结果中与自己需求最为相近的图像, 加以合适的权值, 进行一次新的检索。可循环进行该过程, 直到找到需求的图像。

(7) 数据库管理模块。

数据库管理模块的功能是维护数据库内数据。

4 结语

该文分析了主颜色描述符、颜色结构描述符及空间主颜色描述符, 设计了一个多种颜色描述符相结合的基于内容的检索系统。该系统使用了多种特征提取算法, 通过动态调节权值的方式, 循环多次检索, 是用户得到需求的图像, 实验表明, 该系统的检索精确度更高。

摘要:分析当前基于内容的检索方法, 设计了基于多种颜色描述符提取算法的检索系统。将主颜色描述符、颜色结构描述符及空间主颜色描述符相结合, 用户可根据需要, 选择合适的算法进行多次检索, 取得更好的检索结果。

关键词:基于内容的图像检索,特征提取,主颜色描述符,颜色结构描述符,空间主颜色描述符

参考文献

[1]王海霞, 覃团发.基于MPEG-7中主颜色提取的改进方法[J].计算机工程, 2005, 31 (11) :185-187.

[2]Hong Shao, Yushu Wu, Wencheng Cui, et al.Image retrieval Based on MPEG-7 Dominant Color Descriptor[A].In Proc.of 9th International Conference for Young Computer Scientists[C].2008:753-757。

[3]Ka-Man Wong, Chun-Ho Cheung, Tak-Sking Liu, et al.Dominant Color Image Retrieval using Merged Histogram[A].In Proc.of IEEE International Symposium on Circuits and Systems[C], 2003 (2) :25-28.

[4]Lai-Man Po, Ka-Man Wong.MPEG-7 dominant color descriptor using merged palette histogram similarity measure[A].In Proc.of International Symposium on Intelligent Multimedia, Video and Speech Processing[C], 2004:651-654.

改进的道路背景提取与更新算法 篇8

迄今为止,国内外诸多专家已经提出了很多算法。比如多帧图像平均法,就是把一段时间内图像序列进行累加,然后再平均得到近似的背景图像,该算法实现简单,计算量较小,但是对于车流量较大的路段,该方法很容易把前景目标混入背景里,提取的效果不甚理想。Gloyer B[9]提出的中值滤波法,在背景像素出现概率较大时,提取的效果很好,但是在背景像素出现概率较小时,该算法就会失效。Friedmand等人提出了单高斯模型[10],即分别获得背景、前景和阴影的高斯分布,并将这3个高斯分布的加权值作为像素的灰度值,然后通过EM算法获得模型参数,但是一般情况下背景都是比较复杂的,所以对背景仅采用一个高斯分布是不够的。因而提出了混合高斯模型[11,12],它是一种自适应的背景建模方法,其核心思想是为每一个像素点建立多个随时间变换的高斯统计模型,但也存在一些缺点:背景模型的收敛速度慢;对光照变化敏感。Surendra[13]算法的原理是把当前帧中的像素点分为前景点和背景点两类。当前帧的背景点的像素值与背景图中的对应点加权平均,作为当前背景中像素值。前景点处则保持原来背景值不变。该算法的核心在于通过直方图统计和经验取值而区分当前帧中的前景点和背景点,但是此算法在前景物体较多,情况复杂时会引入噪声。

在复杂的道路场景,以上方法还是不能消除一些光照及噪声的影响,不能够满足实际的要求。为此,本文提出了一种改进的道路背景提取和更新算法。

1 两种基本背景提取算法

下面介绍两种最常用的背景提取算法,多帧图像平均法和统计中值法。

1.1 多帧平均法

多帧图像平均法的原理是把车辆看作噪声,用累加后进行平均的方法消除噪声,所以可以利用车辆在一段时间内的序列图像求和再平均来得到背景图像。计算公式如下

式中:imagei(x,y)表示第i帧(x,y)点处的像素值,Background(x,y)表示点(x,y)的背景图像,N表示平均帧数。

该算法的特点是计算比较简便。但是发现通过平均法得到的背景图像往往会出现亮度分布不均的现象。这是由于在车流量较大的情况下,该算法会将车辆信息误认为是背景信息,而随着平均帧数的增加,背景的可信度也会增加。由于在实际生活中交通状况是比较复杂的,因此多帧图像平均算法显然不能有效地满足复杂环境的需求。

1.2 统计中值法

统计中值法是一种能有效抑制噪声的处理技术。统计中值法较平均法的优点是它可以克服均值滤波给图像造成的模糊影响,而且在抑制噪声的同时,能保持良好的边缘性,进而获得较为满意的背景。

统计中值法的基本思想是先统计一段时间内某一个像素点的值,然后用这些值的中值作为背景像素。

2 本文算法介绍

分析以上的算法,它们对于比较复杂的场景都有一定的局限性,得出的结果并不令人满意,所以,本文提出了一种新的算法,它克服了场景复杂时道路背景提取困难或者提取结果失真的弊端,能在较短的时间内提取出准确性较高的背景,而且能够消除光照和噪声对于背景的影响,为后续的车辆检测提供了很好的基础。

下文介绍算法的基本思想及具体步骤:

1)图像分块

由于单个像素所代表的信息量比较少,而且很容易受到噪声的干扰,所以把图像分成一个个小块来处理,每个小块包含h×w个像素,这样不仅能够结合周围区域的信息,而且能够抑制噪声的影响。

分块后的图像大小记为

式中:row和col分别代表分块后行的块数和列的块数;H和W分别代表原图像列像素和行像素;h和w分别代表每一块的列像素和行像素。

2)图像拉伸

对于天气情况比较恶劣的视频,如果直接处理,难度比较大,而且准确性不高,所以先对原始图像进行拉伸处理,提高图像的对比度,方便以后的处理。

处理的表达式如下

式中:Current Frame(x,y)表示当前帧(x,y)点处的像素值;min和max分别为拉伸的下界和上界,处理结果如图1所示。

3)对于拉伸图像后的每一块,都进行以下运算

式中:Pre Frame(x,y)表示前一帧(x,y)点处的像素值。记录此时的blo Val(t),按需要本文记录离当前帧最近的N帧。

4)然后根据以下公式判断

式中:Th为阈值,Counter(p,q)表示块(p,q)计数器值。在blo Val(t)大于等于Th的情况下,进行快慢变化的判断,如果为慢变,Counter(p,q)++;如果为快变,则Counter(p,q)=0。

下面介绍具体快慢变化的判断准则:

因为单纯按照一个阈值的大小就决定计数器的值,具有一定的局限性,可能因为一些光照的变化而影响结果的准确性,所以要区分是车辆的影响还是光照的影响(见图2),具体的实现步骤如下:

(1)计算历史blo Val(t)的均值和方差,公式为

(2)如果当前的blo Val(t)超过了阈值Th,但是它所对应的历史均值和方差满足以下公式

式中:λ>0,一般λ=3,base=20。满足公式则表示该块是慢变(光照变化)引起的,否则是快变(车辆经过)引起的。

5)重复步骤3)和步骤4),直到Counter(p,q)达到一定的阈值Ths时,保存此时blo Val(t)的值作为一个参考状态,本文保存距离当前帧最近的两个参考状态,离当前帧比较近的一个记录为blo Val L(s),比较远的一个记录为blo Val F(t),如图3所示。

6)判断Counter(p,q)是否大于Ths,如果大于,并且满足

则令

式中:Counter Peek(p,q)为块(p,q)历史最大值,Thb为阈值。否则重复步骤3)、步骤4)和步骤5)继续进行判断。

7)当Counter(p,q)的值首次大于阈值Tha(Tha>Ths),则将此块当前帧的灰度值保存为初始背景,如图3所示,表达式为

如果Counter(p,q)的值不是首次大于阈值Tha,则转到下一步骤执行。

8)按照加权系数法对该块背景进行实时更新,表达式为

式中:α为权系数,0<α<1。

3 实验结果及分析

本文给出了两种不同的场景对本文的算法进行验证,并与其他背景提取算法进行比较。第一种场景摄于西安市南二环,时间为下午,图像较为清晰,但是车流量大,有光照的影响。第二种场景摄于上海市申江高速公路,时间为晚上,图像质量比较差,光线弱,并且有路灯和车灯的影响。

在第一种场景中(见图4),均值法提取的背景出现了大面积的失真,与实际路面的像素值相差较大;统计中值法对于近景部分的背景基本满足要求,但是远景部分(圆圈所标记的范围)和实际背景不符;本文算法不管是在近景部分还是远景部分,都能提取出较为准确的背景。

在第二中场景中(见图5),由于图像质量的原因,从图中似乎不能明显地看出各种算法提取出的背景有什么不同,鉴于此,这里同时给出了车辆检测的结果,以便于观察对比。均值法检测出的二值图像上方出现了很多干扰,这是由于灯光或者车灯的影响造成的;统计中值法在二值图像上方出现的干扰有所减少,但是出现了一些噪声点不能消除;本文的算法能够消除灯光以及噪声的影响,准确地检测出车辆,提取效果较为理想。

4 总结

上一篇:强化建议下一篇:中医对劳倦的认识