自然特征的跟踪(精选11篇)
自然特征的跟踪 篇1
1目标特征研究的流程
所谓目标的跟踪, 就是从视频中或者观测到的图像中, 根据他的特征, 获取背景中感兴趣的区域, 对其特征进行描述, 然后根据特征匹配去跟踪目标。目标特征研究的流程为:读取视频、混合高斯模型检测前景、进行图像预处理、研究目标大小以及研究目标的颜色。
2目标检测
混合高斯模型使用K个高斯模型来表征图像中各个像素点的特征, 如果新一帧图像所获得后更新混合高斯模型, 最后用当前生成的图像中的每个像素点与所建立的混合高斯模型匹配, 如果成功那么就判定该点为背景点, 反之是前景点。
单分布高斯背景模型表示, 对于一个生成背景图像, 其特定的像素亮度分布必满足其特定的高斯分布, 即对背景图像A, (x, y) 点的亮度满足:
就可以认为 (x, y) 是背景点, 反之是前景点。根据时间的变化背景图像也会慢慢的发生变化, 故要不间断地更新图像的像素点的个数。
3研究运动目标特征
打印出目标每一帧的运动情况, 可以通过目标框左上角的位置以及目标框的宽度和高度来描绘目标的大小, 可以通过数据得到框的大小a。由于目标的移动很平缓, 所以框的大小波动性很小, 这样可以得到目标框大小的平均值, 如果在a左右, 即是检测到的目标框。以下是得到的数据表:
从上面的数据可以得到, X的大小变化为变小, Y的变化不一定变大, 而框的宽度和高度则没有明显的变化趋势, 通过对上面的数据得到目标是向左下方移动, 可以得出框的宽度大小的平均值为49.7, 框的高度的大小的平均值为73.8, 即取出框的中心点的位置, 与下一目标框进行距离匹配, 根据上面方差公式, 得出目标框宽度的方差为4.81, 框的高度的方差为2.76, 目标在移动时候总体趋于稳定。如果检测到的目标框比求出的平均值要小, 即检测到的目标框不是目标, 反之即删除相应的目标框和目标。
研究目标特征, 就是分析目标所表现出来的特性。首先分析目标颜色信息, 可以用MATLAB来画出颜色直方图, H代表色调, V代表亮度, N代表像素个数。其中把H (0~360) 划分9个等级, 其中颜色信息为0~7, 但是要注意的是, Open CV里面是把色调范围规定在0~180, 每一个数字对应的是不同的颜色信息, 而8为灰度信息, 把V (0~1) 划分8个等级, 从1~8亮度信息明显。核心代码如下:
这是通过目标容器每一帧运行中提取数据出来的结果。可以在直方图中取出几组数据, 看是否稳定, 这里10帧的数据, 可以算出在某一色调亮度下的像素个数, 算出其平均值和方差, 选取 (4, 2) , (7, 4) 这几组数据来说明, 主要是由于目标的颜色信息主要是红色和青蓝色为主, 以下为它们的信息表:
通过以上公式以及表格中的数据, 第一组直方图可以得出 (4, 2) 青蓝色的像素个数的平均值为0.02974, 方差大小为1.33×10-5, 这方差非常小, 说明这点为目标上的颜色信息。同理 (7, 4) 品红色也可以作为目标稳定的颜色特征。而 (4, 2) 蓝青色的点的像素个数在十帧的波动范围为0.0221~0.0341, 即如果下一帧得到的目标框内的颜色信息为蓝青色的像素个数在这个范围之内, 那么就可以根据这一特征进行目标跟踪。同理符合实际情况。
从整体来看, 以上数据都趋于稳定, 可以不考虑在区间之外的值, 即可能因为由于人的移动导致背景移动, 或者是人的姿势的变化导致像素个数的变化, 但总体趋于稳定, 故这几组数据可以用来实现目标的跟踪。经过试验证明, 本方法能基本满足要求, 但是还有很多的缺陷。由于视频像素比较清晰和拍摄者的抖动, 导致了产生了不该有的目标框, 但是经过图像的预处理过后, 能解决这些干扰情况。总的来说, 本方法能够比较准确的跟踪目标, 具有实验结果的准确性和稳定性, 并且可以通过研究到的特征, 进行运动物体的跟踪。
参考文献
[1]杨章伟, 等, 编.21天学通Visual C++[M].北京:电子工业出版社, 2009.
[2]布拉德斯基, 克勒.研究Open CV (中文版) [M].于仕琪, 刘瑞祯, 译.北京:清华大学出版社, 2009, 10:1-16, 351-355.
[3]刘慧颖.MATLAB2006a基础教程[M].北京:清华大学出版社, 2007.
[4]姚敏.数字图像处理[M].北京:机械工业出版社, 2006:1-87.
[5][美]冈萨雷斯, 等.数字图像处理[M].北京:电子工业出版社, 2009-12.
[6]魏亮, 李春葆, 编.Visual C++程序设计例学与实践[M].北京:清华大学出版社, 2006.
[7]向世明.visual c++数字图象与图形处理[M].北京:电子工业出版社, 2005.
[8]孙兆林.MATLAB 6.X图像处理[M].北京:清华大学出版社, 2002:175-230.
自然特征的跟踪 篇2
难点——自然条件对农业发展影响。
【自主学习】
【一、世界屋脊 】
1.范围:青藏地区位于我国 部、 以西、 以南,南至国界。
2.地形:青藏高原平均海拔4000米以上,是世界上最高的高原,有“ ”。
“ , ”是青藏高原地形的显著特征。
3。气候:青藏高原具有独特的 气候, 、年温差 ,日温差 。
由于海拔 ,空气 ,日照 ,太阳辐射 。成都和拉萨都位于北纬300附近,但两地1月和7月的气温车别很大,原因是受 因素的影响,拉萨位于 海拔高。气候冬寒夏凉,气温年较差 ,但日较差 ,藏族的传统服装 主要是为了适应青藏高原地区的气温日较差大而设计的。
4。自然保护区:可可西里自然保护区受 干扰少大部分仍保持着原始的生态,
是野生动物的天堂,生长着 、 、 等多种高原特有动物。
5。湖泊:全国最大的咸水湖是 ,高原淡水湖是
6。高原之舟 :高原之舟指的是 ,它的毛 皮 可以保持体温,预防寒冷、体 身 ,可以载负重物。
【二、高寒牧区和河谷农业 】
7。牧区:青藏高原是我国的 牧区,主要的牲畜有 、 、 ,他们都能适应 、 、 等特殊高原环境。
8。河谷农业区:青藏地区发展农业的不利的气候条件是气温较 ,有利气候条件是日照 。主要的农业区有南部的 谷地,东部的 谷地,这些地区发展农业的好处是:气温较 ,土质较肥沃。适合喜
温凉的 、 生长。
9。生活习惯:青藏地区居民的日常主食主要是 ,为了抵御严寒。人们都爱喝 酒,民居多为 。因为青藏高原土层浅薄,林木稀少当地人建造房屋时,往往就地取材,主要以石块为原料房屋墙体 。
【课堂检测】
10。 “高原之舟”是对( )的爱称。
A。藏绵羊 B。骆驼 C。伊梨马 D。牦牛
11。关于青藏地区的叙述不正确的 ( )
A。本区有世界面积最大的高原,自然特征是“高”和“寒”
B。是长江、黄河等大江大河的.发源地
C。地球上超过8000米的山峰,大部分在高原的南部和西部边缘
D。本区有丰富的太阳能资源
12。关于青藏地区自然环境对人们生产生活的影响,叙述错误的是 ( )
A。受自然条件影响,河谷农业是其特有的农业生产方式
B。牧民居住的房子易于拆卸、搬运和安装
C。为抵御严寒,藏族男女老幼都喜欢饮青稞酒,味淡醇香
D。本区以粮食作物为主的地区往往出现在河流灌溉地区、河谷及山麓地带
13。西北地区与青藏地区的分界线大致是 ( )
A。昆仑山和祁 B。秦岭和淮河 C。400毫米年等降水量线 D。横断山脉
14。青藏地区高寒自然特征的形成,主要是( )
A。纬度高 B。地势高 C。离海远 D。寒流影响
15.关于青藏地区的叙述正确的是:( )
①以干旱为主的的自然特征 ②河流较少,多为内流河
③具有丰富的太阳能资源 ④很多山峰终年积雪,冰川广布
平原地区人口自然结构的演化特征 篇3
关键词:平原地区;人口自然结构;性別结构;年龄结构
1、引言
平原地区的海拔一般在0到500米,地面平坦或起伏较小,主要分布在大河两岸和濒临海洋的地区。鄱阳湖平原位于江西省北部,围绕着鄱阳湖,由鄱阳湖水系,包括赣江、修水、鄱江、抚河和信江等河流冲积而形成的平原,属于长江中下游平原的组成部分。面积约两万多平方千米,包括南昌、九江、景德镇、鹰潭、新余和抚州等地区。鄱阳湖平原地区作为我国重要的粮食生产基地,人口较为的密集的平原地区,其人口的自然结构特征的演化在我国多个平原地区中具有典型特征。
人口结构是按照人口的不同标志研究一定地区、一定时点的人口内部结构及其数量的比例关系。按照人口的性别特征,人口结构可分为人口自然结构、人口社会结构、人口地域结构三类。人口的自然结构根据人口的生物学特征即人口的自然属性,主要分为性别结构和年龄结构。自然结构作为最基本的人口结构,对于人口的其他特征研究具有重要的意义。因为人口的自然结构既是人口再生产的必然结果,又是人口再生产的基础和起点,影响着人口的社会属性,从而对一定地区的经济社会的发展产生基础性的影响。而社会经济也从各个方面制约人口自然结构的演化。平原地区的自然环境对平原地区的人口自然结构烙上了平原的特征,而经济社会的不断发展则在加速平原地区人口自然结构的演化。
2、人口自然结构的总体特征
对鄱阳湖平原地区的人口自然结构总体特征选取年平均人口、人口出生率、人口死亡率、人口自然增长率和人口密度五个指标进行分析。我们选取了从2001年至2010年十年间的数据进行分析。如表1所示。
从年平均人口来看,鄱阳湖平原地区的人口保持着稳定的增长趋势。而人口的出生率却在不断下降,人口死亡率呈现出小幅的波动,尤其是近年来出现高低交替的现象。人口的自然增长率总体上呈现下降的趋势,人口密度却保持着稳定的上升,这与平原面积不变而人口稳定增长直接相关。
表1 鄱阳湖平原地区人口自然结构的总体特征
年份年平均人口(人)人口出生率(‰)人口死亡率(‰)人口自然增长率(‰)人口密度
(人/平方公里)
20014167156215.446.069.38251
20024204097514.746.028.72253
20034238326414.075.988.09255
20044268896113.615.997.62257
20054297405313.795.967.83258
20064325186313.806.017.79260
20074353770613.865.997.87262
20084384258213.926.017.91264
20094416131013.875.987.89266
20104447203513.726.067.66267
数据来源:江西统计年鉴2011
3、性别结构演化特征
对于鄱阳湖平原地区的人口性别结构演化呈现出以下的特征。首先,男性的比例始终高于女性,差距不大。其次,男女性别比总体上呈现出先降后升的形态。从2000年较高的108.29%升至2001年的最高109.12%后,快速下降,至2003年创下103.58%的最低,然后又呈现出持续上升的趋势。
4、年龄结构演化特征
对于鄱阳湖平原地区的人口年龄结构,我们将年龄划分为三个阶段:分别是0-14岁为少年,15-64岁为青壮年,65岁及以上为老年。
从历年的数据来看,少年人群的占比不断下降,这也意味着人口出生率不断下降,这与表1中数据是一致的。青壮年人群的占比不断下降,这意味着该地区的劳动力的增量较高;老年人群的占比不断上升,人口的老龄化将成为该地区的一个显著特征,甚至成为经济社会发展不得不面临的严肃问题。
5、结语
本文分析了鄱阳湖平原的人口自然结构演化,其特征可以概括为以下三点:一是该地区的人口呈现缓慢但稳定的增长;二是男女性别比例经历了从高到低再到高的变化;三是少年人群占比在不断下降,而青壮年占比在不断上升,人口老龄化问题不断临近。
鄱阳湖平原地区是我国重要的粮食生产基地,农业长期在该地区的经济中占有重要的地位。因此,该地区的人口自然结构特征是建立在农业文明的基础上的,与农业经济的发展密切相关。然而,从2009年12月国务院批复鄱阳湖生态经济区规划开始,该地区的经济加速发展,此外,2014年建设长江经济带的国家规划正是提上议程,江西省在不断推进昌九一体化,经济发展面临着前所未有的机遇。随着经济结构的改变,人口的自然结构演化也将呈现出新的趋势,而这一点从2010年的数据中似乎有所呈现。值得进一步研究。
【参考文献】
[1] 刘铮.人口理论教程.北京:中国人民大学出版社,1993.
[2] 焦华富.试论煤炭城市人口自然结构的演化特征——以淮南、淮北市为例.经济地理,2011年7月.
[3] 盛广耀.我国三大城市密集区人口结构演化.城市问题,2006年5月.
[4] 江西省统计年鉴2011年
作者简介:赵西桐,河南大学环境与规划学院,地理科学专业。
自然特征的跟踪 篇4
目前目标跟踪算法可以分为两类: (1) 基于模型的方法, 如模板匹配、图像分割和活动轮廓法[1]。以Mean Shift算法和Snake算法为代表, 其中Mean Shift以目标颜色进行建模, 具有较好的实时性和跟踪性能, 但目标颜色与背景颜色接近时跟踪失败;Snake算法基于目标轮廓进行跟踪, 受目标初始形状和位置影响较大, 计算量大不适合实时操作。 (2) 基于运动的方法, 如光流法和特特征点法[1], 现有的基于特征点跟踪算以目标的质心或任意特征点实现对目标的跟踪, 在处理多目标跟踪时效果较差[2]。
本文提出了将检测区按32×32像素点进行分割, 以图像序列多状态转移综合判定前景目标和背景的情况, 完成背景的提取与更新;基于运动的方法, 提出利用目标的亮度和颜色信息, 以及在图像序列中的相对位置来构建代价函数的算法, 进行目标特征匹配与跟踪, 改善多目标情况下的跟踪性能。以商场客流统计为例, 从人体目标运动检测、特征匹配跟踪和计数三方面展开论述。
1 人体运动检测
在客流量统计中运动目标检测有获取目标在场景中的位置信息及获取目标尽可能多的特征信息两个任务。
商场客流统计摄像头常安装于出入口正上方垂直向下摄取图像, 属于静止背景的目标识别, 常用算法有帧间差分法、背景差分法和光流法。
1.1 帧间差分法
帧差法具有运算量小、对光照和阴影等外界因素不敏感的优点。但其缺点也非常明显:无法检测出静止或移动速度缓慢的目标, 相反在目标移动较快时, 检测出来的目标又远大于实际目标;亮度、颜色等特征单一的目标在差分运算后将形成较大的空洞, 造成差分结果不连通, 即便进行图像的膨胀和腐蚀等形态学方面的处理, 也不能消除空洞的影响。图1所示为相邻两帧差分结果信息相对丰富, 而图2 (a) 中目标信息单一, 图2 (b) 差分结果只有目标轮廓, 采用参考文献[3]等改进的差分算法对运动目标进行提取, 结果如图2 (c) 所示。
1.2 背景分块更新算法
背景差与帧间差相比, 检测出的目标内部区域不会出现较大的空洞, 可以将目标完整提取出来, 获取丰富的特征信息, 便于目标的匹配跟踪。
常用的方法包括基于卡尔曼滤波模型、基于高斯背景模型和基于简单概率统计的方法等, 前两种方法实现过程较为复杂, 且算法的实现对硬件要求高。第三种方法在没有运动目标长时间滞留的情况下效果较好, 且运算量不大, 符合实时性要求;在实际应用中, 由于天气、光照等外界条件的变化, 或目标长时间滞留, 影响了背景的准确更新, 由此可能会得到虚假的运动目标, 从而造成误判。
基于概率统计的背景更新方法, 常以一段时间内序列帧图像每个像素做差分运算, 满足预设条件, 则进行背景更新[4]。如图3所示, 按32×32像素大小将检测区域进行分割, 对每个分块图像按照图4所示将其分成初始状态Status0, 当三帧差结果判定图像无前景目标和干扰时, 进入Status1取背景数据BG1;在该状态若有前景目标运动, 则进入Status2;当前景目标消失、图像恢复静止, 则进入Status3取背景数据BG3, 据BG1、BG3差分运算判定进行背景更新, 否则返回Status0。
本文提出的方法可以解决如下两个问题:
(1) 检测区域覆盖面积较大, 若部分区域图像信息长时间做不规则变化时, 将影响整幅图像的背景更新。
(2) 目标滞留造成背景更新错误。
图4中, (1) 采用三帧差分法, 检测图像是否为静止状态, 无光线变化或细微的运动物体, 具体步骤如下:
(1) 每间隔200 ms获取{F1, F2, F3}三帧数据, Fi={fi (x, y) , x∈N, y∈M, i=1, 2, 3}。 (x, y) 为二维视场 (N×M, N为列线, M为行线) 中的一点。
(2) 对应点做差分运算, 与亮度阈值Lum T1比较得到差分图像, i={1, 2, 3}, k={i+1, .., 3}
(3) 对Di (x, y) 进行统计, 得到差分像素点个数:
(4) 对差分像素点个数Cntii=1, 2, 3均小于Cnt T1时Flag1=0, 则图像静止, 否则Flag1=1
(5) Flag1=0时, 判断当前状态, 若为Status0则跳转到Status1;若为Status1则保持;若为Status2则跳转到Status3。在Status1和Status3时将当前{F1, F2, F3}三帧数据取平均分别存为BG1={bgi (x, y) }, BE3={bgi (x, y) }。
图4中, (2) 主要判断是否有前景运动目标存在, 与 (1) 检测图像细微变化不同, 人体运动时帧差结果较大、差分像素点数也较大, 故将步骤 (2) 中的亮度阈值Lum T1修改为Lum T 2=2Lum T 1, 步骤 (4) 中阈值Cnt T1修改为Cnt T 2=10Cnt T 1。当Cntii=1, 2, 3均大于Cnt T2时判定有前景目标移动Flag2=1, 由Status1跳转到Status2。
图4中, (3) 判定是否进行背景更新。
(1) 将在Status1和Status3保存的背景数据做差分运算:
(2) B (x, y) 进行统计得到差分像素点个数
(3) 对BCnt小于Cnt T1, Flag3=0认为Status1和Status3均无前景目标, 则进行背景更新得到新的背景数据BG={bg (x, y) }, 否则返回到Status0
对所有分块区域按照图4方法进行背景更新, 可以得到整个检测区的背景数据。
1.3 光流法
光流法的优点在于能够检测独立运动的目标, 对背景处于静态或是动态的环境均能适用, 但是计算量较大, 无法保证实用性和实时性[1]。
2 人体运动目标跟踪和计数
采用分块更新的方法可准确提取背景信息有效检测出前景目标, 识别人体运动。在此基础上实现人体特征结点的创建、跟踪和计数。
2.1 虚拟检测区
图3中将检测区域划分为3个区域、2条计数线, 分别是:
(1) (3) 创建区, 创建人体特征结点;
(2) 跟踪区, 匹配人体特征信息, 跟踪人体运动;
(4) 出计数线, 当人体从 (3) 区域跨过该计数线时, 出计数值加1, 标注为 (7) 。
(5) 进计数线, 当人体从 (1) 区跨过该计数线时, 进计数值加1, 标注为 (6) 。
2.2 人体特征结点的创建
采用9宫格方法查找背景差结果的连通域[5], 得到图3中 (8) 所示的人体目标的位置、长宽信息, 综合判断其是否在 (1) (3) 区域, 以及长宽大小、比例等信息, 创建该目标Person[i], i为人体目标序号, i=[1:I], I为当前场景下目标个数, 其信息如下:
Person[i].x第i个人中心位置x坐标;
Person[i].y第i个人中心位置y坐标;
Person[i].W人体宽度;
Person[i].H人体高度;
Person[i].Cnt包含的特征方块个数;
Person[i].Dir创建区域。
而该目标的特征信息由Psn Feature[i][m]表示, m表示特征方块序号, m=[1:Person[i].Cnt]
Psn Feature[i][m].x该特征方块x坐标;
Psn Feature[i][m].y该特征方块y坐标;
Psn Feature[i][m].Ymean该特征块Y分量均值;
Psn Feature[i][m].Umean该特征块U分量均值;
Psn Feature[i][m].Vmean该特征块V分量均值;
Y、U、V均值采用算术平均的方法获得。
2.3 特征匹配与跟踪
目标在检测区域内运动轨迹无规律可循, 特别是当人流量较大时, 人体的运动轨迹杂乱。提出以目标特征信息进行匹配、跟踪的算法, 步骤如下:
(1) 获取当前帧数据与背景做差分运算;
(2) 查找连通域, 去除干扰点保存变量为:
Zone[k].x第k个连通域中心x坐标;
Zone[k].y第k个连通域中心y坐标;
Zone[k].Cnt第k个连通域特征方块个数。
k=[1:K], K为当前计算的满足条件的连通域个数, 隶属于第k个连通域的特征信息方块, 表示为变量Zone Feature[k][m], 其中m=[1:Zone[k].Cnt]
Zone Feature[k][m].x第m个方块x坐标;
Zone Feature[k][m].y第m个方块y坐标;
Zone Feature[k][m].Ymean特征块Y分量均值;
Zone Feature[k][m].Umean特征块U分量均值;
Zone Feature[k][m].Vmean特征块V分量均值。
(3) 计算第i个目标与第k个连通域 (k=[1:K]) 的距离和颜色特征差异保存为变量Comp Dist[i][k]和Comp Res[i][k], 并做归一化处理, 构建代价函数, 得到第i个目标与所有连通域的代价函数值Cst Fun[i][k]=0.6Comp Dist[i][k]+0.4Comp Res[i][k]。
(4) 将步骤 (3) 重复I次, 得到I×K的代价函数矩阵Cst Fun;
(5) 由Cst Fun得到与第i个目标最为匹配的连通域, 即满足Cst Fun[i][k]最小的序号k, 用Zone[k]变量更新Person[i]变量, 用Zone Feature[k]更新Psn Feature[i]变量, 完成目标跟踪。
图5所示为采用该算法对走出某卖场出入口的两人进行跟踪的结果。
2.4 计数
Person[i]跟随第i个目标的运动不断被更新, 当满足2.1节所述条件时计数, 之后将Person[i]结点删除, 其他出边界的情况则只删除结点不计数。
3 算法实现和结果分析
TMS320DM648是一款针对多媒体处理和视频安全与监控领域, 基于Veloci TITM超长指令结构的高性价比的单核DSP芯片。结合视频解码芯片TVP5154, 视频编码SAA7015实现了4路PAL格式视频输入, 1路PAL格式视频输出的商场客流统计系统, 其结构如图6所示[6]。
将该系统成功应用于某家电卖场, 其中抽取了2个时间段共7 h, 统计结果如表1所示, 现场人工计数为实际值, 系统计数为检测值。由表1可见统计准确率保持在95%左右, 注意到“正大门”、“通信门”和“数码门”这3个门在2个时间段内系统均多计, 而“服务门”均少计, 说明算法性能稳定, 不会出现忽多计、忽少计的情况。
本文针对基于概率模型的背景更新方法进行了改进, 更新了背景分区域, 提高了背景更新的可靠性和准确性。在此基础上提出了以目标位置、亮度和颜色构建代价函数的特征匹配和跟踪算法, 并将其成功应用于商场客流统计系统, 在TMS320DM648硬件平台同时处理4路PAL视频, 且客流统计准确率稳定在95%。结果表明, 该算法有较好的目标识别、匹配和跟踪能力。
参考文献
[1]赵艳启.运动目标识别与跟踪算法的研究[D].南京:河海大学, 2005.
[2]金鑫.基于改进特征跟踪的客流量统计[J].计算机工程, 2012, 38 (15) :175-178.
[3]丁磊, 宫宁生.基于改进的三帧差分法运动目标检测[J].电视技术, 2013, 37 (1) :151-153.
[4]曹海青.基于全局和局部特征的目标识别研究[J].微型机与应用, 2011, 30 (14) :41-43.
[5]孙抗, 汪渤, 郑智辉.基于局部亮度直方图特征的实时目标识别与跟踪[J].系统工程与电子技术, 2011, 33 (9) :1927-1931.
自然特征的跟踪 篇5
本课选自人教2013新版八年级地理上册第三章“中国的自然资源”第一节“自然资源的基本特征”。在此之前,学生已学习第二章“中国的自然环境”,了解了我国自然环境的概况,通过本节课的学习,可以完善学生对我国自然概况的了解,同时也为后两节“土地资源”、“水资源”的学习打下基础,符合“学习对生活有用的地理”的新课程教学理念。
本课教学主要是让学生了解自然资源的主要类型及其与人类生产生活的紧密联系,了解我国自然资源总量丰富、人均不足且利用不尽合理等基本特征,引导学生正确认识我国资源现状,树立从身边点滴小事做起、节约资源的环保理念。《义务教育地理课程标准》(2011年版)对本节的要求是举例说明可再生资源和非可再生资源的区别,并且还特别说明:“标准”没有面面俱到地列出各种类型的自然资源,教学中应以水、土地资源为案例,引导学生了解我国自然资源总量大、人均少、时空分布不均等特点,进一步认清我国国情,并进行保护与节约资源的教育。可见本节重点有两点:一是区分可再生资源与非可再生资源,二是在正确认识我国资源现状的基础上对学生进行保护和节约资源的教育。
图(表)文并茂、活动丰富是新版教材的一大特色,其中文字部分是教科书的核心内容,图表则是多样化的呈现方式。本节涉及示意图5组、阅读材料2篇、活动设计2个。每组图文都有其自身地位和功能,既体现新课标的要求,又突出重难点,并且在知识运用方面也发挥着重要作用。在教学中,要对地理教材图像进行全局把握和分类,可对教材图像进行深入挖掘,进行适当的补充或弱化,使教材图像功能实现最大化,以期达到以图释文、图文结合之目的。
二、知识结构
本节教材包括“自然资源用得完吗”和“总量丰富,人均不足”两部分内容。教材内容突出两种不同类型自然资源的区别以及中国自然资源的总体特征和使用现状。知识结构如图1所示。
三、图像解读
1.图2、图3——过程演化,突出特征,强化对比
自然资源具有自然和社会两大属性,社会性说明自然资源对人类的价值,可以为人类生产生活所用;自然属性则强调自然资源来源于大自然的特性。在其形成过程中,可再生资源在短期内可更新、再生或再循环使用,如土地、阳光、森林、水和水能等。非可再生资源的形成则要经历漫长的历史过程,相对于人类历史进程,几乎不可再生,用一点少一点,如煤炭、石油和铁矿等。此两类资源的主要差别在于一定时间过程的可逆与不可逆,形成、恢复与循环过程的差异。
图2“可循环使用的土地资源”通过呈现“收割水稻→种植绿肥作物→绿肥犁入农田”这一过程,达到对土地资源循环使用的目的,说明土地资源的恢复再生能力,继而可为人类发展农业生产提供肥力保障,以维系人类生存发展。图3“用一点就少一点的煤炭资源”通过呈现漫长时期生物能在特定条件下经过一系列复杂演化形成煤炭这一过程,说明非可再生资源形成在人类历史时期的不可逆性,虽然为人类发展进程中的巨大财富,但却是用一点少一点。
教学中,建议除了逐图提取信息明确特征外,还可将两组图中关键信息进行对比,如关键词“来年春天”和“几百万年乃至上千万年”、“可循环使用”和“用一点少一点”。通过比较学习的方法,加深学生对可再生资源与非可再生资源之间区别的理解。
2.图4——圆桌会议,突出研讨,强化实效
图4“保障资源供给的讨论”对应本节第二个框题“总量丰富,人均不足”,可通过“地大物博”说明中国自然资源丰富,通过“人口大国的国情”说明人均占有量低。教材还设置了一小段文字材料,列出中国部分自然资源总量和人均占有量在世界的排名,教学中可转文字为数字表格更为直观地呈现出这一特征,同时还可以拓展相关的其它资源类型(如表1)。
由此,进一步明确“总量丰富,人均不足,相对短缺”的资源背景。结合我国经济和人口发展导致资源需求不断上升的现状,不难得出我国面临比较严重的资源供给问题。教学中,可充分利用教材设置的阅读材料“石油进口大国”,辅以拓展图5“1993—2015年中国石油产量和消费量变化走势图(单位:百万吨)”,说明保障资源供给问题的严峻形势。
通过一系列图(表)文引出保障资源供给这一主要问题,但教学重点还在于解决该问题的可行性措施。图4“保障资源供给的讨论”形式是圆桌会议,图中主要展示讨论成果,如一些具体措施“开发新能源、新材料”、“培养节约能源意识”、“改进和提高利用率”等。在细节处理上,图中还有未表达出的一些具体意见和措施,这就给学生留下了思考的空间。圆桌会议这种讨论形式议事不议人,不分上下尊卑,与会者一律平等,共同协商,教师可参考此种形式,调动学生积极性,各抒己见,形成共识,以完善资源保障的措施。
3.图6、图7——案例设计,突出应用,强化认知
教学活动是新版教材的一大特色,利用活动教学也是新课程改革的要求。地理教材中设计了众多活动,每一活动都有其设计意图和教学实际作用,能达到使教学目标不断完善之目的。本节内容设置两个活动,都与前文教材主题相呼应,突出对所学知识的理解和运用,强化对已有知识的认知,同时也能通过活动拓展学生思维,掌握学习方法。
随着人口和经济的发展,人类对于自然资源的需求在不断增加,关于自然资源的合理利用和供给保障也日益成为关注的热点。通过多种形式和手段保障供给和合理利用自然资源,充分发挥和调动公众参与意识,有利于资源的持续利用和人类的长远发展。
(1)图6——生活案例中的资源利用问题。对于非可再生资源,用一点少一点,需珍惜和节约。而对于可再生资源,并非“取之不尽、用之不竭”,图6“可再生资源不合理利用举例”涉及“空荡荡的饮用水货架”、“渔民渔获中见大鱼”等生活案例,直接点明主旨:合理则使其循环可再生,反之导致枯竭。图片运用中,可采用一连串递进式提问法:“图中反映的是哪两种自然资源?”→“属于可再生还是非可再生资源?”→“既然是可再生,为何还会出现图示情况?”→“图中反映了哪些不合理的资源利用方式?”→“通过图文资料和教材文字,可以得出什么结论?”教师最后总结:合理则持续,反之则枯竭。
自然特征的跟踪 篇6
图像的局部特征[4]也是目前计算机图像处理的一个热点, 是许多方法的基础, 对实现目标跟踪有直接的影响, 在寻找每个图像间的对应点和目标特征描述有着重要的作用。在视觉领域刊物和会议上都有特征描述论文发表。同时也被广泛的应用。在实际的三维图像重建和场景恢复中, 当建立每幅图像之间点与点之间的对应关系时, 优秀的局部图像特征描述算子必不可少。在实现物体跟踪算法中, 目前比较流行的算法就是根据局部特征进行跟踪, 这是因为局部特征通常是利用物体局部形状, 这样物体可以存在遮挡、复杂背景等情况下被识别。表示目标的局部特征有很多种, 目标的轮廓特征最容易被感知, 稳定性相对其他特征是最好的, 能够直接描述物体的形状。形状上下文 (Shape Context) 一种基于边界轮廓的表示方法, 能够很好的描述物体的形状特征。
1 Shape Context算法
Shape Context[5]特征是由Serge Belongie于2002年提出的一个形状描述方法。依据以往的学术研究, Shape Context的形状描述比基于边界的形状在理论上能够实现更精确的匹配, 该方法能够很好地表示图像区域的内部特征。并经过大量测试, 在仅有轮廓的匹配信息时, Shape Context仍然可以保证到很高的精确度。
首先, 要获得物体轮廓特征, 利用轮廓上的一系列离散的点就可以表示整个目标轮廓, 提取Shape Context特征。在提取离散点时, 应做到的是使这些提取点能准确反映出物体的轮廓信息, 尤其是物体中形态发生变化部位的重要信息, 并尽量做到提取点集的质心与目标质心能够保持相同位置。在提取目标边缘时, 采用微分算子法, 这种算法通过卷积完成, 这是因为导数算子有使灰度变化突出的作用。将导数算子应用的图像中, 就可以使图像灰度变化较大的点处得到的数值较高, 因此把这些导数值作为对应点的边界强度值, 通过设置阈值的方法, 提取边界点集合。实验证明, 这种方法准确性较高。其次, 就是要提取轮廓采样点。利用均匀采样的方法, 将提取到的轮廓线上曲率最大的点确定为采样的开始点。如果轮廓有不止一个曲率最大的像素点, 则比较曲率最大的点的毗邻点的曲率, 比较毗邻点曲率较大的点所对应的曲率最大点作为起始点, 如果毗邻点的曲率也相同, 则在比较毗邻点, 直到找出较大的相邻像素点为止。找到起始点后, 依次均匀抽样。
Shape Context方法的理论基础是:对任一图像通过上文叙述方法得到的N个离散边界点来说, 其中任意一个点与其他的N-l个点之间都存在对应关系, 可以将这种对应关系看成不同向量, 这N-l个向量包含了有用的的边界信息, 由这N-1个向量就能表示物体的形状特征, 这可以看出, 当N值越大时, 表示目标信息越多, 表示目标的形状也就越准确。在提取到轮廓点后[6], 利用坐标变换得到该点对应的直方图, 对数极坐标直方图能够直观反映基准点与其他点之间的空间位置关系, 从而正确表示物体的特征。
对任一图像, 在提取目标边缘点后, 可以得到一组离散边界点集, 设点集为Pi={p1, p2, …, pn}, 对任一个点pi, 其余点与该点能构成的向量组, 这就能很好的反映该点在目标中的位置信息。
为更直观反映Shape Context特征方法, 引入一种常用的圆形的对数极坐标系, 如图1所示, 图1 (a) 为原图, 图1 (b) 为特征提取结果图。
如图1所示, 整个空间被分成12×5=60个区域, 每个区域所占的大小按从外到里逐渐增强, 这是因为对于某点, 离其近的点比距离远的点有更好的鉴别能力。而在同一个圆弧范围内的区域所占空间相同, 这是因为相同距离的点对基准点的鉴别能力是相同。在本文算法中, 对给定点pi, 在以该点为原点所组成的极坐标系中, 通过统计分布在每个区域中点个数来表示目标的边界特征信息。根据利用不同的点, 可依次计算得到每个点的直方图, 这样物体的边界特征就可以用n×60的矩阵表示。
通过上述介绍可知, 对于给定点pi, 其特征可以用以该点为中心的极坐标系的60个区域中落入每个区域中的像素点个数Qi (k) 来表示, 公式显示如下
式 (1) 中, k=0, …, 60, #操作符代表了落入第k个区域中的不同于点的所有其余点的个数, 通过这种方法能得到有60个分量的直方图值, 逐一计算所有的离散点, 得到n个形状直方图。这样所有物体的形状信息我们都可以量化为一个n×60的矩阵。根据这些点的直方图中分布在不同区域的点数, 就可以建立图像的Shape Context直方图。
对于原图像上的点pi和需要匹配的图像上的点qj, 可以用Cij=C (pi, qj) 表示点pi和qj的ShapeeContext直方图的相似度, 计算公式如式 (2) 所示。
其中, hi (k) 和hj (k) 表示在这两个不同点的第k个标准化的直方图。
2 本文跟踪算法
2.1 Mean Shift算法
经典的Mean Shift[7]目标跟踪算法采用的颜色直方图作为搜索特征, 通过不断迭代使得算法趋向于目标的真实位置, 从而实现目标的跟踪。传统的MeannShift算法在跟踪中优势明显。这些优势[8]主要体现在计算量不大, 基本上可以做到实时跟踪。
假设给定d维空间Rd中的n个样本点xi, i=1, 2, …, n。在x点的Mean Shift向量的基本形式定义为
其中, Sh是一个高维球区域, 半径为h, 满足以下关系的y点的集合
K是落入Sh区域内的所有样本点的个数。
Mean Shift向量[9]表示被采样点的平均偏移量, 不断向样本分布最多的区域迭代, 这也就是概率密度函数的梯度方向。一般来说, 在Sh中, 离x越近的样本点, 对x周围的统计特征关联行越大, 所以将核函数的引入, 并根据每个样本点的位置不同赋予其不同的权值, 经扩展后的Mean Shift向量表示为
Mean Shift算法是一个不断迭代直至达到最佳位置的过程, 如果假设初始点为x, 允许的误差为ε, 则Mean Shift算法按照以下步骤进行:第1步, 计算mh (x) ;第2步, 把mh (x) 付给x;第3步, 如果结束循环, 否则, 继续执行第1步。
2.2 本文跟踪算法
Mean Shift算法方法简单、计算速度快, 在现实得到广泛应用。但与此同时, Mean Shift算法也存在着一些缺点, 这是由于直方图特征[10]在目标颜色特征描述方面略显单一, 缺少空间信息, 对目标变形和遮挡不能实现正确的跟踪。尽管颜色特征是简单可行的, 但颜色特征不能很好地解决跟踪中出现的遮挡问题, 并且在复杂背景下跟踪的效果也不理想。所以, 在目标跟踪领域, 但考虑到其缺点, 在本文算法中用ShapeeContext特征替代颜色特征, 来解决颜色特征缺陷的问题。
在跟踪的起始帧中, 通过人工选定方法来选取要跟踪的目标, 然后对所选取的目标提取轮廓点, 对提取的轮廓点进行抽样, 将所得抽样点按在极坐标分布区域不同分成m块, 分布在不同区块的点进行Epanechnikov核函数加权, 构成图像的Shape Context直方图, 该直方图模型就叫做目标模型, 在后续帧的目标跟踪图像帧上可能包含目标的区域是候选区域。
为了直观反映跟踪算法, 假设现有两个归一化的直方图分别为ha={ha (1) , ha (2) , …, ha (n) }和hb={hb (1) , hb (2) , …, hb (n) }, 则它们之间的Bhatta-charyya距离ρ (ha, hb) 计算公式如下
为使目标模型与候选模型的相似性最大, 即使得Bhattacharyya系数的值最大。由于前面部分的研究已经得出, 对式子进行泰勒展开, Bhatta-charyya系数ρ (y) 可以表示成
式中如果ρ (y) 越大, 表示这两个Shape Context特征直方图相似程度越高, 因此利用Mean Shift算法对公式的第二项进行迭代, 从而得到目标在下一帧图片的位置。
3 实验结果及分析
实验中所用的硬件环境为CPU P (R) 4 2.8 GHz, 内存4 GB, 显存512 MB。软件开发环境为Matlab2010b, 实验数据为多组视频序列。为验证本文算法的稳定性与鲁棒性, 本文从验证平移、旋转不变性、遮挡稳定性和复杂场景稳定性等3个方面进行论证, 经过实验研究, 都表明该算法的稳定性, 受篇幅限制, 以下每方面只列举出一种场景。
3.1 验证平移、旋转不变性
由于平移只是目标位置的平移, 其特征并未改变, 所以平移之前与之后的形状上下文特征相同, ShapeeContext具有平移不变形。通过对轮廓上的点建立极坐标图, 统计周围点落入极坐标图的数量来建立ShapeeContext直方图, 所以旋转之后, 点的位置信息不变, 所建立的直方图也不变。不同形状的目标Shape Context特征也不相同, 对于颜色相似而形状不同的目标能实现良好的跟踪。为验证本文提出跟踪算法对旋转和平移具有良好的鲁棒性, 提取了序列图像中两幅有颜色相似、形状不同的两个物体相互运动、物体角度变化的图片, 图2中方框表示被跟踪的物体, 从图中可以看到, 该算法能实现良好的跟踪。
3.2 验证遮挡稳定性
虽然颜色特征是简单可行的, 但颜色特征不能很好地解决跟踪中出现的遮挡问题, 并且在复杂背景下跟踪的效果也不理想, 而Shape Context特征可以弥补这些不足。图3是一组手遮挡脸的视频序列, 可以看到, 当跟踪人脸时, 图3 (b) 、图3 (c) 图有手遮挡时, 仍能实现良好的跟踪。虽然跟踪出现较小的偏差, 但是跟踪没有丢失。实验表明, 本算法具有较强的抗噪性。
3.3 验证复杂场景稳定性
由于均值漂移算法根据加权的颜色直方图对目标建立模型, 算法容易受颜色相似但颜色空间分布不同的目标干扰。同时由于仅仅根据颜色信息对目标进行跟踪, 容易受背景颜色的干扰。图4为跟踪物体出现遮挡, 且被遮挡物体与跟踪物体颜色相似, 基于空间色彩直方图的方法不能实现很好的跟踪。而从图3中可以看出, 基于Shape Context特征的Mean Shift目标跟踪算法跟踪效果很好, 对遮挡具有良好的鲁棒性。
4 结束语
传统的全局特征在跟踪中容易受到背景信息的干扰, 并且不能很好的处理遮挡问题。本文详细介绍了Shape Context特征, 并且具体讨论了在该的鲁棒性和稳定性。随后, 通过Shape Context特征对目标进行建模, 在Mean Shift算法的框架下进行跟踪, 并在户内外多个视频中对提出的算法进行了验证, 都能实现良好的跟踪, 充分说明本文算法具有良好的鲁棒性, 比基于颜色特征的跟踪算法更能适应复杂场景, 为下一步研究提供了新的思路。
摘要:利用均值漂移进行目标跟踪的算法, 在被跟踪目标出现旋转、尺度变化、噪声干扰等情况下, 无法得到准确的跟踪结果。文中提出了基于当前流行目标跟踪算法和局部特征相结合的算法, 基于局部特征—形状上下文 (Shape Context) 特征的Mean Shift目标跟踪算法。该算法首先提取目标的轮廓信息和特征, 根据采样点之间位置和距离关系建立Shape Context直方图, 最后所有点的Shape Context直方图构成了图像的Shape Context特征, 最后根据Mean Shift算法进行跟踪。实验结果表明, 该算法在跟踪目标出现尺度变化、旋转、噪声干扰和遮挡等情况下能够准确地跟踪物体, 鲁棒性好。
关键词:局部特征,形状上下文,均值漂移,目标跟踪
参考文献
[1]Milan Sonka, Vaclav Hlavac, Roger Boyle.图像处理、分析与机器视觉[M].3版.艾海舟, 苏延超, 译.北京:清华大学出版社, 2011.
[2]李弼程, 邵美珍, 黄洁.模式识别原理与应用[M].西安:西安电子科技大学出版社, 2008.
[3]王辉.复杂场景下多摄像机运动目标连续跟踪研究[D].北京:北京交通大学, 2013.
[4]Belongie S, Malik J, Puzicha J.Shape matching and object recognition using shape contexts[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24 (4) :509-522.
[5]刘翔.基于视频的运动目标检测与跟踪算法研究与应用[D].武汉:武汉科技大学, 2009.
[6]曲明志.基于局部特征和粒子滤波的目标跟踪算法研究[D].长春:吉林大学, 2013.
[7]朱胜利, 朱善安, 李旭超.快速运动目标的Mean Shift跟踪算法[J].光电工程, 2006, 33 (5) :66-70.
[8]胡波, 陈恳, 徐建瑜, 等.基于Kalman预测和Mean-Shift算法的视频目标跟踪[J].光电子·激光, 2009, 20 (11) :1517-1522.
[9]朱英宏, 李俊山, 郭莉莎, 等.基于LBP的尺度不变特征的描述和匹配算法[J].计算机辅助设计与图形学学报, 2011, 23 (10) :1758-1763.
自然特征的跟踪 篇7
关键词:目标跟踪,均值偏移,目标中心,NMI特征
0 引言
实时目标跟踪一直是计算机视觉领域的研究重点,其中跟踪目标的计算复杂度直接影响着实时性。Mean shift算法[1]是一种以目标区域像素概率分布为特征的高效模式匹配算法,它不需要进行穷尽搜索,所以成为目标跟踪中效率较高的一种。传统基于Mean shift算法的初始跟踪窗口是固定不变的,但是在实际目标跟踪中,经常会遇到目标的尺寸随着其离摄像头的远近或自身的畸变而改变的情况。这时初始窗口若不随着目标尺寸相应改变,则会造成跟踪目标的丢失,而且窗口的大小会影响Mean shift算法计算的迭代次数。为了得到自适应更新大小的跟踪窗口,文献[3]中提出采用正负10%的增量简单的估算核窗宽,这个方法对目标尺寸逐渐变小比较有效,但是对于目标尺寸逐渐放大的效果不佳。文献[10]中,Collins对采样图像进行加权和滤波,引入了一个新的尺度核,并在尺度空间中进行Mean shift迭代,从而找到最优的跟踪窗口尺度。但该方法需要收敛到三维空间的极值点,造成计算量加大。同时由于文中采用的是Epanechnikov核,造成算法迭代过程等效于对尺度空间进行平均操作,因此跟踪效果和文献[3]相似。文献[4]利用视频前后两帧进行形心配准,再对目标的角点进行匹配,以此估计刚性物体的仿射模型参数,并由此参数来更新核窗宽,由于依赖于角点匹配,不适合非刚性物体的跟踪,而且形心点的处理比较粗糙。
本文将概率图的圆检测法[5]改进并引用到目标跟踪中来,实时得到跟踪目标的中心。利用Mean shift算法的快速收敛性,计算改变核窗宽后的Bhattacharyya系数,以此选择最优的跟踪窗口大小。同时根据NMI特征在目标尺寸变换、旋转后的不变性[6],识别实时更新的初始跟踪对象,保证中心定位的准确性。
1 基于Mean shift算法的跟踪原理
Mean shift算法是文献[7]提出的一种非参数的密度估计算法,文献[1]将其引用到目标跟踪上来,其跟踪的原理如下:
设{xi}i=1...n是d维空间里的n个点,则以核K(x)和带宽h的x点的密度估计是:
k(x)是K(x)的轮廓(profile)函数,且K(x)=k(‖x‖2),则式(1)可写为:
假设g(x)=-k′(x),则密度估计梯度为:
以提取目标色调值的直方图z为特征,设它的密度分布函数为qz。候选目标的中心位置y处的特征分布为pz(y),利用Bhattacharyya系数来寻找qz和pz(y)最相似的y值,判断式如下所示:
因为式(6)的第一项取决于y0,即由初始位置决定。所以要使式(6)最大,即求第二项的极大值。通过Mean shift算法可得新位置,以后各帧均按此式迭代获得:
2 目标中心定位
2.1 图像分割
为了得到目标的中心,需要对跟踪的目标进行图像分割,并得到较为清晰的目标边缘。
本文根据OTSU算法[8]获得最佳门限阈值。OTUS算法是日本人大津首先提出的,该算法以图像的一维直方图为基础,以背景和目标对象的类间方差最大为阈值判断依据。首先提取每帧图像的色调值H,并将H扩展到0~255之间。其灰度等级为G={0,1,…,L-1},t∈G为选取的分割阈值,H={H1,H2}为分割后图像的两个灰度值级别,则:
其中f(x,y)为坐标(x,y)处的像素灰度。
假设灰度级为i的像素个数为Ni,则一帧图像里的像素总数为:
灰度级为i的像素出现的概率为:
将灰度级分成(c0,c1)两类,若分割灰度阈值为t,则可将像素按灰度分为背景区{0,1,…,t}和目标区{t+1,t+2,…,L-1}两类。
背景的像素比例为:
则背景和目标对象的平均灰度分别为:
背景和目标物体间的方差为:
当方差σ12取最大值时,变量t即为所求的最优门限值。为得到连通清晰的边缘,对二值图像进行一次开启和闭合操作。最后利用Sobel算子对二值图像进行边缘提取,可以得到清晰的目标边缘。
2.2 目标中心定位原理
文献[5]中提出了一种基于圆心存在概率的圆检测方法,该方法利用图像边缘点到中心点的欧式距离以及圆的半径,建立圆心概率分布图来获取中心点位置。此方法计算效率和精确度都很高,但对不规则边缘的图像效果不大。本文将其扩展,能够适应不规则图形的中心获取。
在第k帧图像I的边缘内部搜索中心点(u0,v0),E(xi,yi)表示边缘上的点,则图像中心点(u0,v0)到边缘(xi,yi)的欧氏距离用r标示为:
由于目标的边缘是不规则的,因此需要对r设置一个范围:{rmin,rmax}(rmin表示允许的最小半径,rmax表示允许的最大半径)。用式(9)计算边缘内部每一点(ui,vi)到边缘点(xi,yi)的欧氏距离,若计算的r在预设半径范围之内,则将累加器数组Ai自加1。
根据2.1节中得到的二值图像,计算当前帧图像中目标的面积S。
定义中心定位概率(Probability of Centre location)Pi(u,v),表示存在以(u,v)为中心,目标面积为S,统计边缘像素点数为Ai时的中心概率的大小:
其中,在同一帧图像里,目标的面积S是定值。遍历边缘内部所有点后,得到一个中心定位概率图P(u,v),图中的P(u,v)越大表示在点(u,v)处中心的概率就越大,返回最大值处(u,v)坐标即为中心点位置(u0,v0)。经过大量的实验表明,该方法对目标边缘呈类似的圆形或椭圆形效果最好。图1是经过OT-SU算法和Sobel算子提取后的边缘检测图像,图像大小为570×335。利用中心定位法得到中心标记概率图,最后在概率最大处用十字形标示出中心。该图中心最大概率为0.73,目标中心点坐标是:(311,261)。
实验中的边缘内部通常会存在一定的噪声,此时的面积S比实际要小。根据实验统计发现,中心点处的最大概率在0.4~0.8之间。如果边缘提取得越准确、噪声越少,那么得到的概率图的波峰将会越明显。图1中目标在提取边缘后存在一定的噪声,但从中心定位的效果来看,该算法具有一定抗噪声能力。
2.3 图像的NMI特征
文献[6]中提出了二值图像的归一化转动惯量NMI,它具有伸缩、平移和旋转的不变性。所以在目标的跟踪过程中,可以将其作为一个有效的特征对目标进行识别。
经过2.1节中处理的二值图像的目标重心记为(cx,cy),则:
该目标对象绕重心(cx,cy)的NMI可表示为:
其中,为所有像素值之和。
利用NMI特征进行识别,计算每帧图像连通区域的NMI值,若0.8<<1.2,则判断该目标即为需要跟踪的对象[9],利用中心定位法计算当前的中心位置(cxi,cyj)。
3 算法实现及实验结果分析
3.1 算法实现步骤
结合Mean shift目标跟踪特点,本文的跟踪算法步骤如下:
(1)本文目标区域的跟踪窗口为长方形,记录第k帧跟踪窗口的宽ak、高bk、中心坐标(xk,yk)以及NMIk,同时比较ak和bk的大小。
(3)根据中心定位概率法,定位当前帧目标的中心,并设置跟踪窗口的大小。在前一帧宽和高的基础上,以中心为原点,x轴和y轴方向上两边分别增加Δhai和Δhbi,保留此时跟踪窗的高和宽。
(4)根据不同状态下跟踪窗口的大小,计算在当前定位的中心点处的Bhattacharyya系数的值,以此寻找前后帧目标的最佳匹配,从而得到变化后的窗口大小。
(5)重复步骤(2)~(4),得到每一帧目标的最佳跟踪窗口大小。
3.2 实验结果和分析
在实例采样中,CCD相机的采样速率是30帧/s,摄像窗口大小为570×335。编程用VC++6.0实现,运行环境是Intel双核1.6,内存512MB。
图2和图3(颜色不能显示,请联系作者)是采用文献[3]中Kernel-based算法的跟踪效果图,表1是相应各帧图像的Bhattacharyya系数。实验表明该算法对目标尺寸逐渐减小的情况比较有效,但继续跟踪发现,由于场景中干扰对象的出现以及窗口尺寸不能很好适应目标尺寸实时变化的影响,在第386帧后出现跟踪丢失。图3中红色跟踪窗口是采用kernel-based算法的效果,黄色矩形框为较理想情况下校正的跟踪窗口。以第130帧为初始跟踪窗口图像,在第235帧时跟踪基本丢失。由于该算法只是采用以正负10%的增量简单的估算核窗宽,所以在目标尺寸逐渐增大的情况下,造成尺度定位不明确,而且使得Mean shift算法迭代的中心偏移越来越大,从而造成目标跟踪偏差直至丢失。
图4和图5是采用本文算法的跟踪效果。
在图4的第300帧时,跟踪的窗口仍然能较好地和目标相匹配,较之kernel-based算法,跟踪效果有很好的改善。在图5显示的目标尺寸逐渐增大的实例中,由于中心定位较准确,因此保证了空间定位的准确性,继而根据本文提出的改变窗口尺寸方法,使得跟踪效果较好。表2为采用本文算法的采样示例中心点的坐标和Bhattacharyya系数。
4 结束语
本文针对当前多数使用基于Mean shift算法的目标跟踪不能很好地实时改变核窗宽的特点,提出了一种基于目标中心定位和NMI特征的跟踪算法。在目标跟踪过程中,通过建立二值模型,利用NMI特征识别要跟踪的目标,跟踪过程始终定位目标的中心。结合Mean shift算法的寻优相似度函数,选择最优的核窗宽。目标在移动过程中,其中心点也是在做不规则的移动,本算法正是抓住了这点,以中心点为基点来扩展跟踪窗口。
本算法的目标定位和NMI特征有很大关系,而中心定位还和目标边缘的分布有关。实验表明,即使背景中出现和目标区域的NMI值相近的物体时,本算法也能较好地跟踪目标。
参考文献
[1]Dorin Comaniciu,Visvanathan Ramesh,Peter Meer.Real-Time Track-ing of Non-Rigid Objects using Mean Shift[C]//Proceeings of IEEE Conference on Computer Vision and Pattern Recongnition.South Caro-lina,USA,2000:142-149.
[2]Bradski G R.Computer vision face tracking for use in a perceptual user interface//Regina Spencer Sipple.IEEE Workshop on Applications of Computer Vision.Stoughton:Printing House,1998:214-219.
[3]Dorin Comaniciu,Visvanathan Ramesh,Peter Meer.Kernel-Based Ob-ject Tracking[J].IEEE Trans on Pattern Analysis and Machine Intelli-gence,2003,25(5):564-577.
[4]彭宁嵩,杨杰.Mean-Shift跟踪算法中核函数窗宽的自动选取[J].软件学报,2005,16(9):1542-1550.
[5]张运楚,王宏明,梁自泽,等.基于存在概率图的圆检测方法[J].计算机工程与应用,2006:49-51.
[6]杨小冈,付光远,缪栋,等.基于图像NMI特征的目标识别新方法[J].计算机工程,2002,28(6):149-151.
[7]Fukanaga K,Hostetler LD.The estimation of the gradient of a density function,with applications in pattern recognition.IEEE Trans.on Infor-mation Theory,1975,21(1):32-40.
[8]Otsu N.A threshold selection method from gray-level histograms[J].IEEE Transactions on System Man and Cybernetic.1979,9(1):62-66.
[9]江淑红,王沁,等.基于目标中心距离加权和图像特征识别的跟踪算法[J].电子学报,2006,34(7):1175-1180.
自然特征的跟踪 篇8
随着计算机和图像处理技术的不断发展,利用视频技术进行车辆检测与跟踪逐渐成为智能交通系统等领域中的重要应用。视频车辆跟踪系统通常包括车辆提取,车辆跟踪两个模块。
车辆提取常用的方法有差分法[1]和混合高斯模型(Gaussian Mixture Model,GMM)法[2]。
差分法速度快,但所提取目标通常不完整,容易影响后期跟踪模块性能;GMM利用角点,欧式距离,颜色,形状以及外部轮廓等信息描述目标,使用上述信息匹配完成跟踪,通常需要多项信息结合进行大量运算才能拥有比较理想的性能,实时性较差。跟踪算法常用的方法大体上分为模板匹配,卡尔曼滤波以及基于最优贝叶斯估计的粒子滤波算法[3]。模板匹配算法中最简单的属直接模板匹配,即对视频帧中所有的像素点进行匹配,得到所求车辆区域并标识出来完成跟踪,但该方法存在很大的盲目性,单帧的匹配需要十分巨大的运算量才能完成,就目前的计算机硬件性能很难达到即时处理效果。基于贝叶斯滤波原理的粒子算法[3]采用构造系统状态变量的后验概率密度,采用先前观测结果对最近观测值进行修正,从而获得最优估计最后采用最优估计对模板匹配位置进行筛选,消除直接模板匹配的盲目性,很好地解决了非高斯非线性观测下的车辆跟踪问题,由于在修正和筛选的过程中需在的运算量十分巨大而且存在着粒子退化的致命问题,导致系统的实时性和鲁棒性不理想。卡尔曼滤波法使用高效的递归滤波模型,它能从一系列不完全包含噪声的测量中估计出动态系统的状态,即它不需要后验概率的修正但却能得到更优的预测结果,同时它只需要对已知的状态进行迭代更新即可不断地得到最优预测结,通过预测匹配的位置减少匹配所带来的盲目性和运算量。
为了改善跟踪系统效果,减少运算量,提高实时性。本文设计了一种基于SIFT特征结合区域卡尔曼滤波算法的视频车辆跟踪系统。由于SIFT特征具有信息丰富及对旋转、缩放、亮度等变化保持不变等优点,使用SIFT特征点抽象出目标信息,以一组SIFT特征向量描述目标区域,结合卡尔曼预测算法以各个目标区域的SIFT特征做为输入信息进行独立预测,达到减少匹配信息运算量,提高系统实时性的目的。通过使用实际交通监控视频进行的相关实验测试表明本算法能够有效地减少计算量,同时具有很好的实时性。
2 SIFT特征算法与卡尔曼滤波算法
2.1 SIFT特征算法
SIFT算法[4]是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置,尺度,旋转不变量。SIFT特征是图像的局部特征,其对旋转,尺度缩放,亮度变化保持不变性,对视角变化,仿射变换也保持一定程序的稳定性,同时拥有丰富信息量很适合用于特征的匹配。其算法步骤包括检测并定位尺度空间极值点,指定极值点方向参数同时生成描述向量两步。关键公式有:
其中L(x,y,σ)为二维图像的尺度空间,G((x,y,σ))为尺度可变高斯函数,I(x,y)为坐标,σ为尺度坐标。
其中k为高斯函数中的可变尺度,D(x,y,σ)(为高斯差分尺度空间。
其中θ(x,y)为(x,y)处梯度方向,L所用的尺度为每个关键点各自所在的尺度。
最终由各点处的梯度方向组成该点的128维方向向量即为所求的SIFT特征。
2.2 卡尔曼滤波算法
卡尔曼滤波算法[5]是一个最优化自回归数据处理算法,对于解决大部分问题,他是最优,效率最高同时也是最有用的。自从它被提出以来一直被广泛地应用于图像处理,军事制导等领域。卡尔曼滤波算法包含两个模型:
其中Xk=[xkykdxkdyk]T,(xk,yk)为目标在k时刻的位置,(dxk,dyk)为目标在k时刻的运动速度。观测向量Yk=[xckyck]T,其中xck,yck表示目标位置在k时刻的观测值。Ak,Bk,Ck为常量矩阵,Vk为观测噪声。
3 视频车辆跟踪系统流程
如图1所示,系统首先对读入的视频帧进行预处理工作,如灰度图像转换,滤波噪声消除以及对比度增强处理等。对预处理后的图像进行差分,得到感兴趣区域。对感兴趣区域采用SIFT算法提取区域特征点,使用卡尔曼滤波算法进行位置预测。读取下帧图像,在上述所得的目标最优位置进行相应的SIFT特征提取对比,若SIFT特征点分布相似则设置相应的跟踪标记,否则取消对象跟踪,依此算法得到最终的跟踪轨迹。具体各部分的实现将在第四部中论述。
4 跟踪系统的具体实现
4.1 运动目标提取
采用差分法实现运动目标的提取。
差分方法是基于图像矩阵模型,把视频帧图像(n×m个像素点)用一个n×m的矩阵G进行刻画,通过对量化后的视频帧作差分运算来获得运动目标轮廓的方法。采用当前帧与前一帧相减,计算同一位置像素点之差实现差分:
其中Dt(i,j)为差分后的绝对值,上述公式表示第t帧和第t-1帧(i,j)位置像素值之差,1≤t≤N,,N为视频帧数。Gt(i,j)表示第t帧中(i,j)位置像素点的像素值,1≤i≤n,1≤j≤m。
设置相应的阀值T把两两差分后的图像所得转换为二值图像:
其中B(i,j)为二值化后(i,j)位置像素值。
由于差分法存在着很大的局限性。当目标运动过快时会导致所得到的区域很容易会被分割成两个区域,形成两个不同的目标。对于原本属于同一个目标的区域应尽可能保持完整,由于两块区域通常相隔的距离只有若干像素,因此可以考虑使用膨胀的方法来达到两个区域连通的目的,保证区域的完整性。当目标离摄像头较远时,目标区域显得小而密集会导致在膨胀的过程中形成一个较大的区域,这对于本系统来说是一个很大的干扰因素,同时由于目标过小,特征点过少也允许我们可以舍弃此部分车辆目标,可在膨胀之前采用腐蚀的方法消除过小的区域。
通过先腐蚀后膨胀的方法得到系统所需的感兴趣区域。将感兴趣的区域还原到视频帧中消除背景区域:
基中Gt(i,j)为还原后的图像,B(i,j)为对应二值图像中(i,j)位置的值。
得到运动区域后,计算出各区域的质心坐标信息M(i,j)。
其中i_min,i_max为横向坐标的最小与最大值,j_min,j_max为纵向坐标的最小最大值。
通过上述处理最终得到系统所需的感兴趣区域
4.2 感兴趣区域SIFT特征提取
对上述经过腐蚀再膨胀,二值化处理得到的目标区域还原至原图像帧中得到的感兴趣区域使用SIFT算法进行特征提取。
对感兴趣区域进行采样,使用直方图统计各个像素点邻域像素的梯度方向。通过梯度方向决定关键点的主方向和辅方向,直至所有的像素点检测完毕。此时每个关键点包含有:位置、所处尺度、方向三个信息。
以关键点为中心取窗口,每小格中箭头方向代表此像素的梯度方向,越长说明梯度越大,采用高斯加权方法选取主要影响点。在每小块上计算8个方向上的梯度,形成种子点。为了增强稳定性,通常每个关键点使用16个种子点描述,每个种子点有8个方向的信息,因此共有128个数据,形成128维的SIFT特征向量。如图2所示。
图中中央黑点为关键点,蓝色区域即为使用高斯加权的主要影响点所处范围。经过上述做法即可得到各个感兴趣区域的SIFT特征点,以此完成对车辆目标的抽象化描述。
4.3 车辆跟踪
4.3.1 卡尔曼滤波预测算法
使用4.1中所得到的区域质心坐标作为卡尔曼滤波器的输入,对公式4中的部分变量进行一定的初始化即可完成目标位置的预测。
假设目标以加速度为a(k)进行直线运动,其中则上述的公式(4),(5)可以表示为公式(10),(11):
初始化其中[xpyp]为第一帧中感兴趣区域的质心位置。通过预测算法即可得到目标的最优位置。
4.3.2 目标匹配
当两帧图像中所有的感兴趣区域SIFT特征向理生成后,采用关键点特征向量的欧式距离做为相似性的判定依据。对感兴趣区域中的关键点在对应使用卡尔曼预测得到的位置所在区域优先找出两个与之欧式距离最近的两个关键点。当最近的距离除以次近的距离小于一定的阀值时则接受匹配事实。以此类推直到所有的特征点均完成相应的匹配,从而实现跟踪。
5 实验结果验证
本实验所使用的平台为Matlab 2009b,采用320尺寸每秒15帧共4S的实验视频进行处理,反复处理后得到平均处理速度为117.71ms/帧,即每秒所产生的帧能够在1.79s内完成响应,能够满足实时性处理的要求。
采用320尺寸每秒15帧共4S的4个不同实验视频其处理时间与准确率如表1。
实验中并没有对视频进行特殊的处理,如果采用一定策略对摄像所得固定区域进行加黑处理,即消除视线过远以及过于边缘的区域则可以达到更高的处理速度与跟踪效果。取视频1中的两帧作为举例如图3。
其中图3(a)为视频原帧灰度图,图3(b)为提取的感兴趣区域,图3(c)为SIFT特征提取并进行预测和匹配的示意图,图3(d)为实际多目标跟踪效果图,红色方框代表车辆。
6 总结
本文利用尽可能简单的图像预处理手段与感兴趣区域提取方法,结合SIFT特征提取算法与卡尔曼滤波预测算法,通过预测目标的下帧所在位置进行匹配实现跟踪。
经过实验验证取得了良好的效果,较小的运算量使之具有更好的实时性,SIFT特征的引入也使系统具有了更好的鲁棒性。
参考文献
[1]邵娜,应捷.视频序列中运动目标检测与跟踪方法研究[J].光机电信息,2009(2).
[2]陈祖爵,陈潇群,何鸿.基于改进的混合高斯模型的运动目标检测[J].中国图象图形学报,2007,12(9):1585-1589.
[3]占荣辉,辛勤,万建伟.基于最优采样函数的粒子滤波算法与贝叶斯估计[J].信号处理,2008(2).
自然特征的跟踪 篇9
目标跟踪是计算机视觉领域的关键问题之一,在诸多场合都有应用,例如视频监控、交通监管、人机交互等。近十几年来涌现了大量针对目标跟踪中特定问题的算法,并取得了相应成果。然而由于现实场景中存在各类干扰因素并会进行交叉影响,如突然的运动、光照改变、目标形变、遮挡等,这使得目标跟踪仍然是一项充满挑战的课题。
一个典型的跟踪算法一般包括三大组成部分:外观模型,运动模型以及搜索策略[1,2]。本文的重点在于通过构建一种有效的目标外观模型,使跟踪算法能够应对跟踪中出现的目标形变、遮挡问题,并具有一定的从跟踪异常状态中恢复的能力。根据跟踪算法的外观模型是否考虑目标的背景信息,可以将跟踪算法分为两类:生成式(Generative)算法[3,4,5]和区分式(Discriminative)算法[1,6,7,8,9]。区分式算法在跟踪时充分利用目标及目标附近背景的信息,能够更有效的将目标从背景中区分出来。多示例学习(MIL)算法[1]作为一种区分式算法,能够在线进行目标特征的选取,为目标跟踪算法提供了一类新的解决思路。文献[1]中选择了Haar-like特征来描述目标的外观,当目标形变或遮挡时容易失效;同时原算法对目标时间维度的信息没有进行合理利用,当算法由于遮挡、类似目标干扰等因素而发生跟踪异常后,自行恢复正确跟踪的概率很低。
本文在MIL跟踪框架的基础上,采用了一种改进的基于分布场(DFs)[2]的目标特征描述方法,该特征对目标的局部模糊、遮挡以及轻微形变具有良好的鲁棒性。算法还加入了目标时间维度信息的融合框架,大幅提高了算法在发生跟踪异常之后的恢复能力,同时也可以应对目标形态发生改变的情况。通过对比本文算法和其他先进跟踪算法在多组复杂情况下的视频跟踪结果,可以发现本文的算法具有更为优异的表现。
1 MIL 跟踪框架
作为本文算法的基础,本节简要介绍一下MIL跟踪框架,算法细节可参见文献[1]。当一次新的跟踪开始时,跟踪器在以选定的目标为中心,α为半径的区域内,密集地选取与目标等大的图像块作为目标的正面采样(Positive Samples);以选定目标为中心,半径ζ和β之间的区域,随机地选取若干与目标等大的图像块作为目标的负面采样(Negative Samples)。文献[1]中的算法通过构建基于Haar-like特征的弱分类器集合,并从中选取一定数量最能区分正面采样和负面采样的弱分类器构成目标的强分类器。文献[9]针对如何优化挑选弱分类器过程提出了一种新的方法称为ODFS算法,并在强分类器的更新过程中还加入了高斯分布参数的渐进式更新,使得ODFS算法相比原始的MIL算法更为稳定(文献[9]中第2.2节)。当新的一帧图像到来时,跟踪器以上一帧的跟踪结果为中心,在搜索半径γ范围内密集选取与目标等大的图像块作为候选,通过应用之前得到的强分类器逐一计算,获取当前帧目标的最优匹配结果,即当前帧的目标跟踪结果。之后再重复确立正面采样和负面采样,计算获得新的强分类器,以进行后续的跟踪。
2 基于 DFs 的改进型特征
文献[1]和文献[9]中选用的Haar-like特征集在跟踪算法开始的时候就已经确定,当目标发生形变或遮挡很容易丢失目标。文献[9]通过渐进式更新高斯分布参数一定程度上缓解了这一现象,但是固定的Haar-like特征集难以及时的对目标的外观进行有效描述。本文引入了基于DFs的改进型特征,大幅提高了跟踪器的性能。
文献[2]中介绍了将图像转换为DFs表示的方法,这里将重点介绍本文如何将其改进,并用来替换MIL算法中的Haar-like特征。一幅尺寸为m×n图像T,将灰度空间分为b个区间,可以得到该图像块的DFs表示矩阵d,其尺寸为m×n×b,计算过程可由下式表示
其中:i和j分别表示图像的行、列坐标,Vk 代表第k个灰度区间的取值范围。这里得到的图像DFs表示包含了与原始图像一致的信息,只是将各像素点的灰度值进行了区间划分。当k值确定时对应d中的二维矩阵,可称作DFs的一层(Layer 1)。原文中还需要对每层DFs和特征空间分别进行平滑处理(文献[2]第3节),在文献[2]中证明了由于引入了高斯平滑,DFs表示包含了目标一定程度的不确定性,这使得DFs表示对目标细微形变、遮挡有着良好的抑制能力。本文适当简化了这一过程,只对特征空间进行如下处理
其中:d(i,j)表示原DFs中的一列特征维度量,hσf为一维高斯卷积核,其标准差为σ f。图1给出了将一幅图像转换为本节所述DFs表示的示例。原始DFs中,每个非零点代表原图像中相应位置的像素属于该层对应的特征区间。经过平滑处理之后,每个非零点表示原图像中相应位置附近存在一点属于该层对应的特征区间,这样每层DFs相比原始的DFs包含了不确定信息,使得DFs对图像细微变化更具有包容性。
同时,本文采用了一种有别于其他文献[10]的方法,认为目标正面采样集合中每个图像块的每个DFs层都可以作为一个目标特征,而不是将一个图像块的全部DFs层作为一个特征。根据需要可从正面采样集合中随机选取N个图像块,从而得到M=N·b个目标特征构成特征池。对于单个目标特征与目标正面采样、负面采样以及候选图像块之间的相似度度量,本文也采用了一种有别于文献[2]与文献[10]中类似绝对值差和(SAD)的比较方法,引入了MF函数度量RMF( )[11,12],如下式所示:
其中:d kf和d kS分别表示一个k层特征和一个图像块DFs表示dM对应的第k层,δk(i,j)为第k层DFs上点(i,j)处的梯度向量,计算方法如下:
从式(3)可以看出MF函数度量的取值范围为[-1,1],值越大表示相似度越高。文献[11]和文献[12]对比了多种度量函数,用实验证明了MF函数度量在模板匹配中的优越性能,实验中包括了模板发生形变、光照变化、噪声干扰、以及发生局部遮挡的情况。在本文第4节中,对原始的DFs法和本文改进的方法进行了类似的性能对比测试,实验结果表明通过在DFs法中引入MF函数度量,相比原始的DFs法更具鲁棒性,能够在目标发生形变、光照变化、局部遮挡、噪声干扰时具有更大的几率匹配到正确目标。
算法需要从M个特征中选择最能区分目标正面、负面采样集合的L个特征构建强分类器,具体实现方法可见文献[9]。本文的不同在于由于每次更新强分类器的时候,构建的目标特征池都不相同,所以文献[9]针对固定Haar-like特征池的高斯分布参数渐进式更新在本算法中是没有意义的,这里省略该步骤,将参数设为,并保持不变。
3 目标时间维度信息融合
实际跟踪中由于相似目标干扰、大范围遮挡等情况,不可避免地会发生跟踪到错误目标,即跟踪异常的情况。文献[9]针对MIL跟踪框架,提出了对固定Haar-like特征池的高斯分布参数进行渐进式更新,并通过实验证明了其相比原始MIL算法更具稳定性。本文中由于目标的特征池不是固定不变的,为了结合目标的时间维度信息,这里给出了一种新的时间信息融合方法。
为了融合目标的时间维度信息,本算法保留了Q组之前得到的强分类器,构成一个强分类器集合{h1,h2,...,hQ}。常见的算法依据时间顺序替换集合中的元素,并给予集合中元素时间相关的权重值,类似:
最后的计算结果由下式得到:
假设集合中强分类器的上标序号越大,对应的强分类器越新。这种融合方式在实际中容易遇到两大问题:1) 集合中元素寿命是一定的,由于集合大小限制无法包含目标足够久的时间维度信息;2) 当发生跟踪异常时,新加入集合的错误分类器反而占有更高的权重,导致跟踪器难以从跟踪异常中恢复。
相应的本算法通过两种途径,改善了融合效果。首先认为集合中各元素的权值相等,即新加入的分类器不再具有更高的权值,提高了系统的容错能力。然后在更新集合元素时,替换旧元素采用随机选取的方式,每个元素具有相同的概率被替换。从数学上来说,集合中某一元素在N次更新后,仍然存在的概率为
式(7)表明集合中每个元素的存在概率是随时间指数下降的。这样使得集合能够包含更多的目标历史信息,提高了跟踪器从跟踪异常中恢复的能力。为了进一步使集合中包含目标更久的时间维度信息,同时减少跟踪器在更新强分类器时的运算量,本算法设定每隔W帧进行一次集合的更新。通过调节参数Q和W能够获得不一样的跟踪效果,以应对不同类型的目标。同时对于目标外形几乎不发生改变的情况,可以考虑在Q组分类器中保留一组最初的强分类器,这样能增强特定情况下跟踪算法的稳定性。
4 实验结果与分析
在测试本文提出的跟踪算法之前,先对本文提出的基于DFs的改进型特征在模板匹配方面的性能进行分析。原始的DFs法进行模板匹配时参数按照文献[2]设置,而本文提出的基于DFs的改进型特征则将参数设为σf=1, b=4。实验选用了模板匹配领域的常见数据库(http://www.vision.deis.unibo.it/research/78-cvlab/93-pm-eval)作为测试数据,该数据库包含了目标模板在遮挡、噪声干扰、不同光照条件、图像拍摄角度变化等情形下的待匹配图像,能够全面的评价各匹配算法的性能。本文算法将模板图像DFs表示的每一层作为单独的模板分别进行匹配,结果如表1所示。可见由于改进了相似度度量的方法,并且由于目标图像的灰度分布不同,单独选用某一层最能区分目标和干扰的DFs作为特征相对于原始的DFs表示反而可以取得更好的效果。
实验中测试跟踪算法的视频,部分来自文献[1],这部分视频在文献[2,8–10]中也被作为测试视频使用,其中包括了大多数的复杂情形,如目标遮挡、运动模糊、形变、光照变化等。同时本文还从PETS2001公共数据库中挑选了一段包含目标遮挡、形变以及相似目标干扰的视频,并由作者拍摄了一段存在目标形变、尺寸变化、抖动模糊、遮挡的测试视频。用来对比的算法包括:MIL跟踪器[1],ODFS跟踪器[9],原始的DFs跟踪器[2]以及DFs MIL跟踪器[10](简单的将原始DFs替换MIL算法中的特征)。实验中的算法代码尽量采用原作者主页上提供的源代码,并参考了相应文献中的结果,进行多次实验取平均值以获取公平的测试结果(因为部分算法存在取随机数的过程)。本文算法采用MATLAB R2013a编程实现,其中关键参数设定为b=4 ,Q=5,W=3,构建一个强分类器所需的特征数L≤15 ,其余MIL跟踪框架相关的参数设定可以参照文献[9]。
表2给出了各算法在不同视频上的跟踪结果(正确跟踪帧数的百分比)。从表中可以明显看出本文的算法具有最为优异的表现。在大多数算法都失效的最后两个视频中,本文算法仍然保持了突出的性能。图2和图3给出了这两段视频中的部分跟踪结果,从图中可以明显地看出本文算法对目标的模糊、形变、遮挡等具有良好的鲁棒性,同时在存在相似目标干扰时或大面积遮挡后,仍然能够保持对目标的稳定跟踪。
—Our tracker ----MIL ---ODFS ----DF ---DF MIL
—Our tracker ----MIL ---ODFS ----DF ---DF MIL
5 结 论
本文在MIL跟踪框架的基础上进行优化改进,提出了一种新的性能更为优异的跟踪算法。通过引入基于DFs的改进型特征与目标时间维度信息融合策略,增强了算法应对复杂情况的稳定性。实验结果表明该算法相比其他先进的跟踪算法能够在各种复杂的条件下取得更好的跟踪效果。
参考文献
[1]Babenko B,YANG Ming-Hsuan,Belongie S.Robust object tracking with online multiple instance learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(S0162-8828),2011,33(8):1619-1632.
[2]Sevilla-Lara L,Learned-Miller E.Distribution fields for tracking[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),Providence,RI,June 16-21,2012:1910-1917.
[3]Ross D A,Lim J,LIN Ruei-Sung,et al.Incremental learning for robust visual tracking[J].International Journal of Computer Vision(S0920-5691),2008,77(1/3):125-141.
[4]Adam A,Rivlin E,Shimshoni I.Robust fragments-based tracking using the integral histogram[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition,New York,June 17-22,2006,1:798-805.
[5]MEI Xue,LING Haibin.Robust visual tracking using1 minimization[C]//IEEE 12th International Conference on Computer Vision,Kyoto,Sept 29-Oct 2,2009:1436-1443.
[6]Grabner H,Grabner M,Bischof H.Real-Time Tracking via On-line Boosting[C]//BMVC,Edinburgh,September 4-7,2006,1(5):6.
[7]Grabner H,Leistner C,Bischof H.Semi-supervised on-line boosting for robust tracking[C]//Computer Vision–ECCV 2008,Marseille,France,October 12-18,2008:234-247.
[8]ZHOU Qiuhong,LU Huchuan,YANG Ming-Hsuan.Online multiple support instance tracking[C]//IEEE International Conference on Automatic Face&Gesture Recognition and Workshops,Santa Barbara,CA,March 21-25,2011:545-552.
[9]ZHANG Kaihua,ZHANG Lei,YANG Ming-Hsuan.Real-time Object Tracking via Online Discriminative Feature Selection[J].IEEE Transactions on Image Processing(S1057-7149),2013,22(12):4664-4677.
[10]NING Jifeng,SHI Wuzhen,YANG Shuqin,et al.Visual tracking based on Distribution Fields and online weighted multiple instance learning[J].Image and Vision Computing(S0262-8856),2013,31(11):853-863.
[11]Tombari F,Di Stefano L,Mattoccia S.A robust measure for visual correspondence[C]//14th International Conference on Image Analysis and Processing,Modena,Sept 10-14,2007:376-381.
自然特征的跟踪 篇10
关键词:溧水区;综合自然地理环境特征;旅游产业;发展对策;观光农业
1 前言
简单来说“旅游产业是凭借旅游资源和设施,专门或者主要从事招徕、接待游客、为其提供交通、游览、住宿、餐饮、购物、文娱等六个环节的综合性行业”[1],旅游业属于第三产业。发展旅游产业能够推动地区经济发展,而且还能在带动其他产业发展的同时提供大量工作岗位。近年来,我国旅游业发展迅速,许多地区尤其是在经济欠发达地区希望以其良好的生态环境和良好的旅游资源发展旅游业,促进经济的发展。
溧水区是江苏省南京市的南大门,2013年由县成为区。溧水区与安徽博望镇、溧阳、句容、江宁接壤。由于境内主要是低山丘陵地形,占总地形的72.5%,因此,不利于经济发展。和周边的几个县级市相比,经济欠发达。但是溧水拥有丰富的山水文化资源,山青水秀,风光旖旎,山、水、林、果、湖各具特色,近年来,溧水充分利用独特的自然地理位置和丰富的旅游资源,强力打造旅游产业。目前为止,区内共有3个AAA级旅游景点。本文在溧水区自然地理环境特征的基础上,对溧水区旅游产业的优劣势进行分析,并提出优化措施,希望在此基础上可以为溧水区旅游产业进一步深化和完善提供理论依据。
2 溧水区概况
2.1 溧水区的地理位置
溧水区位于江苏省南京市南部,北纬31°23′至31°48′,东经118°51至119°14′。东部以分界山接溧阳市,南连高淳区,西部与安徽省马鞍山市博望镇隔湖相望,西北与南京江宁区毗连,东北与句容市接壤,地处长江三角洲平原,全区总面积1067平方公里。
2.2溧水自然地理环境的特点
2.2.1 地形与土壤
溧水区位于长江三角洲平原,属于宁镇扬丘陵山区带。境内地形以低山丘陵为主,总体上地势东南高西北低。具体是北部的地势东南高西北低,南部的地势从东北两个方向由高向低递减。境内最高海拔为368.5米。
总地形呈阶梯状。第一阶梯由滨河湖圩区与沟谷地组成。海拔50米至100米为第二阶梯,由低矮平缓丘陵组成。海拔100米以上的低山则组成第三级阶梯。
第四纪时期的沉积层广泛分布在境内,在低山丘陵、坡麓地带和河谷中,分布着酸性黄壤土,其主要是由岩层的风化残积物和坡积物发育而成。土层的厚度不一,洪积土和冲积土主要分布在河口三角洲,境内有少量湖土壤其主要分布在西南部即石臼湖地区。
2.2.2 气候特征
溧水具有典型的亚热带季风气候特征,夏季高温多雨,冬季温和湿润。据气象台数据记录溧水年平均气温15.5度,年平均日照2146小时,年平均降水1037毫米。降水主要集中在夏季。春夏秋冬,四季分明。有些年份夏季会发生伏旱与大暴雨,冬季发生寒潮。
2.2.3 水文条件
溧水境内主要有两大水系,一是石臼湖水系,另一个是外秦淮河水系。东南小部分则属于太湖水系。两大水系的分水岭呈东西走向,横贯溧水中部,使得北部水流入秦淮河,南部水汇入石臼湖。石臼湖属溧水区的只有90.4平方公里。水系内主要的河道有新桥河、云鹤支河等,主河道全长53.57公里。水系汇水面积达到582.54平方公里。溧水是秦淮河源头,境内有三条干河。三条干河依次为一干河长28.3公里, 二干河长25.60公里, 三干河长11.19公里。汇水面积172.98平方公里, 227.10平方公里和64.74平方公里。这两大水系是溧水区主要饮用地表水源,在某种程度上对溧水区的经济发展有一定的限制。
溧水区境内一共有79座水库。可以进行水产养殖。利用水库进行水产养殖发展渔业能够促进溧水的经济发展。
2.2.5 植被与矿产
溧水区受亚热带季风气候的影响,植物种类丰富,以亚热带常绿物种组成为主,由于人类不合理的开发利用,境内植被破坏比较严重。水土流失比较严重。
溧水区含有丰富的矿产资源,主要矿种有金、铜、锗、锶、磷等19个,能源矿有铀矿,地下矿有矿泉水。其中,锶储量最为丰富约占世界的10%。
3 溧水自然地理环境特征对旅游产业的影响
3.1溧水地区旅游业的发展近况
溧水作为南京旅游胜地之一。近年来,观光休闲农业在政府的努力下快速发展,政府正大力发展品牌旅游。溧水建设了一批具有地方特色的休闲农业主题园(景点),并举办和承办各种文化节和农会。如每年承办的梅花节,吸引了大量南京和周边县级市的游客。傅家边的梅子每当成熟时,南京以及周围许多游客都会前来品尝、采购。不但宣传了我区特色农产品,还为我区招商引资搭建了平台,提升了我区的知名度,带动了地方经济文化发展。
3.2溧水自然地理環境对旅游产业发展的有利因素
3.2.1 优越的地理位置
溧水区位于南京南部,交通发达。是华东地区的重要交通枢纽。与安徽、溧阳、句容、镇江接壤促使其旅游市场广阔。政府将旅游确定为支柱产业后,正大力度推进观光农业建设工程,使农业种植不断走向规模化和产业化。
3.2.2 丰富的旅游资源
独特的自然地理环境要素,使溧水区拥有丰富的自然景观、人文资源,特别是东南部乡村的山、水、林、果资源种类齐全,山峦起伏,水系河网纵横交错,地域较广阔,生态观光旅游的发展空间得到扩长。境内有风光迷人的大金山风景区,无想寺森林公园,傅家边科技农业园,东庐山森林公园等。
3.2.3 就地取材方便
溧水观光农业才开始不久,目前发展不是很完美,但溧水具有发展观光农业的优势,使它很有前途。建设观光农业项目可以就地取材,这样项目建设成本会降低,只需要投入少量资金,就能够获得很大利益,比如增加农民就业机会、开辟增收新渠道。将农业和旅游相互结合,农民在旅游活动中可以把农产品以高于市场价直接销售给游客,这样能减少了运输和销售费用,扩大了利润。大力发展观光农业,不仅能够增加从事休闲观光农业农户的收入,而且也能对溧水特色农产品、旅游产品的生产和销售进行有效推动。也能给当地农民创造就业机会。
此外,把农业和旅游结合在一起,引入先进的农业种植模式和栽培技术,形成一种高效生态农业建设模式,不仅有利于现代农业发展,同时也有利于旅游业向更大的空间发展和壮大。
3.3 溧水区的自然地理环境对旅游产业的制约
3.3.1 地形的制约
溧水属于宁镇扬丘陵山区带。受地形影响,经济发达区集中在中部、西南部等地势较低的地方,这里交通发达,各项基础设施完善;而东南部旅游资源丰富,生态环境优美,但是基础配套设施不足,从而限制了旅游业的全面发展。
3.3.2 水资源的制约
石臼湖和秦淮河水系是主要饮用地表水源,在某种程度上对溧水区的旅游产业和经济的发展有很大的限制作用。而溧水区的快速发展又导致了一些水资源的污染。因此,在旅游资源开发过程中,应该注重保护环境,然后再开发旅游资源。
4溧水区旅游产业发展的对策
近年来,全国旅游业正在快速发展。根据分析,溧水区旅游业的发展优势比较明显,但也存在不利因素。溧水区旅游业的发展在于坚持自身优势的同时也应吸取其他景区成功经验,通过加强自身体制,机制创新和市場主体建设,来提高旅游的产业化水平。
4.1 利用独特的自然地理环境,增加旅游的知名度
溧水拥有丰富的山水文化资源,山青水秀,风光旖旎,山、水、林、果、湖各具特色。溧水区应凭借独特的自然地理环境优势,进一步采取措施,提高本区旅游业的知名度,进一步吸引游客。
4.2 因地制宜,发展旅游产业
低山丘陵广泛分布于溧水东南部。可合理利用森林资源开发旅游资源。如在东南部建设经济林基地。西南地势地平,平原较多,面积较广,可以建成具有全区有意义的水果、水产、花卉、蔬菜等土特产生产基地,以此来促进农家乐旅游的发展。
4.3建立品牌旅游文化节
傅家边等景区种植了大量的梅树,每年开春溧水都会成为南京梅花节的分会场。白马镇种植了大量的黑莓,每当黑莓成熟时。当地农户都会举办黑莓节,吸引南京周围游客前来采购。这都是独特的资源优势,我们应该将其继承发展,形成我们的品牌旅游文化节。
5 结语
溧水区发展旅游产业能够促使地区优势资源得到充分发挥,实现经济快速发展。随着对旅游行业的重视,溧水区旅游行业正快速、健康地发展,现在它已成为溧水区的支柱产业之一。溧水区政府应该坚持将“整合资源、完善设施、提升服务、创新机制”作为旅游发展的主要思路从而能够促进旅游产业的健康发展;同时,随着社会主义新农村建设不断向前推进, 进一步改善农村的村容村貌 ,日益完善交通路网等基础设施,为发展旅游产业创造更优越的基础和条件。
参考文献
自然特征的跟踪 篇11
目标跟踪在军事、安防、交通等领域应用极其广泛[1,2],目前是模式识别、图像处理等学科领域的热门研究课题。根据跟踪目标的数量,目标跟踪可分为单目标跟踪和多目标跟踪,两者的处理方式有很大不同。多目标跟踪涉及到目标特征相似或互斥情况,有时还需解决目标遮挡、重叠和分类问题[3,4,5]。单目标跟踪仅需选取目标单个特征即可[6,7]。
传统跟踪算法在视频分辨率低,帧图像模糊或噪声较多时跟踪效果较差。针对此情况,本文选择邻域特征、区域特征、运动方向特征和直方图特征等多个目标特征进行跟踪,并给出了联合特征代价函数以及数据关联运算方法。
1 相关工作
近年来,许多学者对单目标跟踪[4,5,6,7]和多目标跟踪[8,9,10]进行了研究。
文献[7]提出了TLD(Tracking-Learning-Detecting)算法。算法实现目标检测和跟踪同时进行,TLD算法使用NP学习方法检测和纠正跟踪过程中的错误,但NP不适合联合学习,在多目标情况下无法使用该算法。
文献[8]提出了一种基于视频的多目标跟踪算法。算法使用码本模型检测前景,提取每一帧的头部和脚部特征,根据几何约束关系计算目标高度,具有一定精度和鲁棒性。但码本模型仅适用于简单场景中的前景提取。
文献[9]提出标记点处理方法(Marked Point Processes,MPP)。算法能获取所有未知目标的后验概率,得出时空信息;并能识别和了解特定事件变化的外力。
针对复杂、低信噪比背景的红外小目标跟踪问题,文献[10]提出用阈值分割和形态学滤波检测目标,采用邻域轨迹和Kalman滤波跟踪目标,避免了噪声干扰。但跟踪的目标数量有限,也没考虑目标遮挡消失问题。
本文提出一种新的带图像分割的多目标跟踪算法。算法将多个有用的特征用于目标匹配,并设计了总代价函数,给出了代价函数的数据关联计算方法。实验视频结果证明,本文算法能获取良好的目标跟踪效果。
2 目标分割
本文提出的自动分割算法由四个步骤组成,如图1所示。
(1)进行局部双阈值处理;
(2)利用基于直方图反向投影的方法将两个不同阈值处理生成的二值目标掩码进行有效整合;
(3)利用区域和方差阈值移除噪声和干扰目标;
(4)对分割后的目标边界进行精提取。
2.1 局部双阈值处理
Otsu算法[11]是一种常用的阈值确定算法。通过Otsu算法确定的阈值可将直方图分为两类,使合并后的类内方差最小。利用Otsu改进型方法对每个区域选取自适应阈值。对于较暗的目标,阈值的大小需接近背景,位置的大小值为:
式中:τ是Otsu方法获取的阈值;μL(τ)表示直方图中经过阈值τ分类后获取较小的一类;p为偏移系数。利用式(1),通过设置不同大小的p可以获取两个阈值,即τlow=τ-plow(τ-μL(τ))作为低阈值,τhigh=τ-phigh(τ-μL(τ))作为高阈值。通过这两个阈值处理视频帧中的局部区域可获取两个相应的目标掩码Mlow和Mhigh,如文献[12,13]所述,利用一个3×3的中值滤波算子处理两个二值目标掩码。
2.2 直方图反向投影
由于两个目标掩码包含有不同数量的背景像素,所以通过两个目标掩码中像素分布的比较和聚合对分割边界进行精提取[14]。
首先,根据目标掩码的Mlow和Mhigh分别计算出两个灰度级别的直方图Hlow(r)和Hhigh(r)。任何灰度大小r的比例直方图定义如下所示:
其次,将比例直方图反向投影到视频帧域,即BP(x,y)=HR[I(x,y)],,其中,I(x,y)表示(x,y)所处位置的像素灰度值大小。对比例直方图HR(r)的反向投影进行阈值处理,二值分割掩码B(x,y)定义如下:
式中:θBP为范围在0~1之间的一个阈值。
2.3 区域和方差阈值处理
本文算法既利用直方图对掩码进行精确分割,还通过目标的区域和目标内像素值的方差去除区域内大于阈值上限或小于阈值下限的值。对于第k个分割目标Ok内的每个像素点(x,y),通过式(4)对其在前景掩码中对应的像素进行修改。
式中:A(·)表示目标区域;(θAL,θAU)为上边界和下边界内的阈值,用于判断像素点是否保留。
使用每个分割目标内像素的方差对候选目标进行检测。因前景目标拥有比背景或干扰目标更多的纹理特征,导致分割目标的方差可能更大。每个目标像素的方差为:
式中:表示第k个目标内像素的平均值。给定方差,利用式(6)对该目标的前景掩码进行阈值处理。
2.4 形态学处理
通过以上算法提取的前景目标,经常会出现一些噪声。例如,直方图反向投影在对目标边界进行精提取时会生成斑点。本文进一步利用形态学操作精确提取分割边界。首先利用结构元素对目标掩码做开形态学操作;然后进行闭合操作。平滑目标边界不会影响目标外形的细节信息[11]。
3 混合特征匹配跟踪
对目标进行分割后,利用混合特征进行快速匹配。本文所提跟踪算法利用目标整个寿命的时间相关性,而不仅仅是两个视频帧间的相关性。本文跟踪系统流程图如图2所示。
3.1 混合特征匹配
混合特征匹配利用各种有用特征测量目标间的相似性。对于在时间t和t-1处的目标Otj和Oit-1,本文对四个线索进行如下调查。
(1)邻域线索:给定欧式距离,其中xtj和ti分别表示在t时刻时目标j的观测坐标和目标i的预期坐标,利用运动预期方法获取目标预期结果。
(2)区域线索:为了消除区域间的视差问题,通过立体三角形计算目标的深度信息,对目标区域进行相应的归一化处理,使得多目标相对立体相机具有相同的距离。两个连续帧中关联目标间区域的差异十分微小,利用连接组件算法计算目标区域,用A(⋅)表示。时刻t的目标Otj和时刻t-1的目标Oit-1间区域的视差用|A(Otj)-A(Oit-1)|表示。
(3)运动方向线索:给定两个将要进行匹配的目标Ojt和Oit-1,本文用vi,jt=xjt-xit-1表示相应的运动向量。利用向量vi,jt和预定义参考向量vref间的角度θ(vi,jt,vref)表示运动方向,其表达式为:
根据运动趋势或者运动方向可以选取预定义的参考向量。
(4)直方图:本文采用32灰度级直方图间的距离矩阵。
综合以上四个线索,目标Otj和Oit-1间混合特征匹配的相似度如式(8)所示:
在本文所有视频数据的每帧图像上通过收集所有混合特征匹配候选者的特征值,系统计算出标准偏差。
匹配代价定义如式(9)所示:
式中{σ}表示特征的标准偏差。
3.2 Viterbi数据关联
在本文提出的Viterbi数据关联[15]系统中,所利用的立体信息是指匹配目标的立体信息,即视频帧中相同的目标作为一个目标进行观察以执行跟踪,为此,需要计算混合特征匹配代价的总和,即cijstereo(t)=cLij(t)+cRij(t)。其基本思想如图3所示,框架是一种有向图,每个节点在其寿命中都含有单独的框架、开始节点(三角形)和结束节点(正方形)。彩色箭头标记每个框架中的最优路径。从图3可以看出,节点被划分为有序子集N(t)={nj(t)|j=1,2,...,|N(t)|},其中t=1,2,...,T,边aij(t)连接相邻子集{ni(t-1),nj(t)}中任意的配对节点。节点表示一帧中存在的目标,将每个边界设定为cij(t)。一条路径(一系列的边)的总代价为:
其中:
3.2.1 单目标跟踪
对于单目标跟踪,本文利用文献[15]寻找最小代价。利用零代价和初始化一个节点的观察值,根据式(9)获取每个节点nj(t),j=1,2,...,|N(t)|。设定一个节点nj(t)的前身和累积代价分别为:
目标一旦离开视频边界,即到达框架的最后一级,则执行回溯。在最后一级中,以代价最小的节点开始执行回溯,根据事先在每一级中存储的数据遍历第一级以发现最优路径。
3.2.2 多目标跟踪
每个目标的起始帧可能不同,每个节点处的前期和最小代价也可能不同。本文为每个目标创建一个单独的框架进行跟踪,如图3所示。根据式(11)和式(12),利用所有观测值分别对每个目标进行数据关联,其中大多数错误警告都是在分割后处理阶段产生的,因此分割区域通常较小。对观测的位置和区域进行测试以将新目标和错误警告区分开来。因此,仅当目标的预期位置距离帧边界很近时才设定这个目标的跟踪过程结束,这也阻止了因暂时遮挡而引起的目标删除。其实就是为每个目标设置存活时间。图3中给出了目标跟踪总体框架,图中节点在任何阶段都允许包含多个路径。
数据关联中需要更新目标的位置和速度,设定帧t-1时刻第k个跟踪目标的位置和速度分别为xkt-1和vkt-1,当前帧预期的目标位置为。数据关联后,选取代价最小的观测节点更新位置和速度,即:xkt=xj*t,vkt=αvj*t+(1-α)vkt-1,其中,xj*t和vj*t分别表示代价最小观察节点的位置和速度,α表示更新比例。每一帧的数据关联及总结算法如下所示:
4 实验结果与分析
4.1 参数说明及度量函数
视频帧的尺寸为1 280×768像素,帧率为8 f/s。本文利用形态学做开操作时结构元素设定为7×7像素大小的模板(7×7为一个经验值),表1为根据经验设定的形态学操作模板中的参数大小。
为了对多目标跟踪的精度进行评估,本文设计了两种类型错误:假阳性(FP)和假阴性(FN),两种类型错误的权重相同。本文规定了真阳性(TP)的数量并提供了运动目标总的个数。运动目标总的个数(TO)是所有图像帧中目标的总和。主要跟踪(MT)和主要丢失(ML)的分数进而测量有多少跟踪成功或丢失,算法的精度分别定义为:
4.2 单目标跟踪效果分析
图4所示为一段比较模糊的足球比赛视频序列帧。从图4可以看出,比赛双方运动员中的一方穿着相同,很难直接辨识。利用本文算法对图4单目标进行跟踪,并将实验结果与文献[4]提出的粒子群优化算法(PSO-PF)和文献[5]提出的局部背景加权算法(CBWH)进行比较。图4(a)所示为本文算法结果,从图中可以看出,选择的运动员基本定位完整。即使有很多类似特征的运动员,因采用了目标运动方向特征和时间信息,目标也能准确定位,图4(b)和图4(c)分别是CBWH和PSO-PF跟踪结果,可以看出CBWH在第三帧已偏离目标,PSO-PF在第二帧已偏离目标。比较三种算法,本文算法精确性能明显优于CBWH和PSO-PF两种算法。
此外,测试了CBWH算法[5]和TLD算法[7]所使用的部分视频,表2为各算法的跟踪准确率比较。跟踪准确率是指正确分割锁定目标的时间比上总时间。总体来说,本文提出的单目标跟踪算法跟踪准确率高于其他两种算法。
4.3 多目标跟踪效果分析
图5为一段分辨率比较低的鱼类视频序列帧。从图中可以看出,帧背景比较黑暗,图像中目标姿态不断变化。利用本文算法对图5多目标进行跟踪,并将实验结果与文献[9]提出的标记点处理算法MPP和文献[10]提出的多目标Kalman跟踪器进行比较。图5是本文算法与MPP和Kalman的跟踪分割结果图。图5(a)是本文算法结果,可以看出目标基本完全定位,图5(b)和图5(c)分别是MPP和Kalman跟踪结果,其中红色框是漏检的目标。从图5可以看出,本文算法漏检率明显低于MPP和Kalman算法。表3是精度和召回率比较,其中实验总体目标数目设置为90个。从表3可以看出,本文算法精度和召回率明显优于MPP和Kalman算法。
5 结论
本文提出一种基于混合特征匹配的多目标分割跟踪算法,算法可用于低对比度的多目标跟踪。算法中采用的局部双阈值能克服低对比度和噪声对目标跟踪的影响,并利用直方图反向投影进行外形分割结果,利用四种特征进行目标匹配,并设计了总体代价函数以及代价函数的数据关联计算。实验结果表明,本文算法取得了较高的跟踪成功率,具有很好的实际应用价值。
下一步的研究内容是对于不同的场景,如何自适应地选择有效特征进行目标匹配。
摘要:传统跟踪算法在视频分辨率低、帧图像模糊或噪声较多时跟踪效果较差。针对此情况,提出一种混合特征匹配结合Viterbi数据关联的目标跟踪算法。首先,采用直方图反向投影技术对双局部阈值图像中的目标边缘进行有效分割,克服了低对比度问题;然后,将邻域特征、区域特征、运动方向特征和直方图特征作为目标表征特征,建立混合特征代价函数;最后,采用Viterbi数据关联计算代价总和,求得最相似目标。实验结果表明,在帧图像模糊或噪声较多的情况下,目标跟踪稳定且有效,单目标跟踪准确率为0.89,多目标跟踪精度达0.975,召回率达0.920,优于其他几种同类跟踪算法。
【自然特征的跟踪】推荐阅读:
亲近自然写景要抓住特征教案设计10-10
2016安徽教师考编培训地理《南方地区的自然特征与农业》教学设计08-03
特征点跟踪09-16
特征量跟踪算法08-08
感悟大自然的“自然”08-28
大自然的馈赠感恩自然作文08-09
满庭芳 处自然,满庭芳 处自然马钰,满庭芳 处自然的意思,满庭芳 处自然10-27
感受自然的作文800字:走进大自然10-21
社会的自然08-13
自然的方法08-13