车型识别技术(共7篇)
车型识别技术 篇1
1 实例系统开发
近年来, 我国高速公路建设迅速发展, 通车里程不断增加, 高速公路布局也发生了由通道型向网络型的根本性转化。以我国区域高速公路网的交通地理信息展示为上层示例应用, 构造异构的交通地理信息数据源, 基于E述框架开发ITS数据集成系统。如图1所示。
2 运动车型识别技术的研究
2.1 射频识别法
目前该方法多被应用于国外车辆收费系统ETC中。当该方法工作时, 装置于车辆上的发射器用于发送具有代表经过车辆的特征代码, 带有天线的接收器处理接收, 计算终端利用互联网环境收集处理车辆信息最终利用该方法整个体系中目标车辆的综合信息与车辆拥有者进行清算。
2.2 环形感应线圈识别法
该方法就是根据感应数据的不同对不同的机动车进行分类。环形感应线圈识别法属于触碰式被迫检测分类技术, 由于组成不同机动车的金属材质是不同的, 其引起的电磁感应变化也都不一眼, 虽然该方法的资金投入量不多, 鲁棒性好以及受环境干扰较小, 但是在具体应用时, 多数道面下的线圈由于各种外界因素而被破坏, 因此修护需要投入的资源较多。
2.3 压力传感器识法
当机动车通过埋设在道面下的测试器时, 测试器接收压力会形成微小变化, 该方法利用这变化而产生的返回信号分别得到目标机动车的整体重量、平均速度、轴间距等重要的数据, 从而完成对不同类型机动车的分类.压力传感器识别法属于触碰式被迫检测分类技术, 按照利用的测试装置该方法可分为应变测试器、压力测试器和电容器测试器。
3 基于视频的运动车辆检测研究
初步车辆检测:帧差法是视频中检测移动目标最简单直观的方法, 其在视频片段中固定间隔的两帧之间计算像素绝对差, 该差值大于一定阈限的像素就认为是运动物体可能存在的区域, 初步车辆检测的目的是尽可能的从视频帧中经过一系列的图像处理提取运动车辆, 其中最关键的一个步骤是利用帧差法, 得到两帧图像像素差的绝对值, 初步提取运动车辆区域, 其公式应用如下:
4 结语
对初步提取的运动车辆进行区域生长就是一个迭代的过程, 不断使用LBP直方图进行匹配判断, 区域扩展。随着智能交通系统的发展, 车型识别技术占有愈来愈重要的地位, 通过对现有车型识别技术的分析, 本文完成的研究成果, 基于视频的车型分类研究作为是现代智能交通系统的一个非常重要的应用技术, 为交通管理部门对城市交通的车型及道路管理提供技术上的支持。本论文对交通的真实视频数据进行分析和处理, 实现了运动车辆的完整性检测, 支持向量机对跟踪的运动车辆进行实时分类;设计实现首个基于视频车型跟踪分类信息管理的后台信息管理系统, 实现对不同时间段、不同地段的车型数量统计。
参考文献
[1]张瑞娟.基于视频图像的运动目标检测与跟踪算法研究[D].大连理工大学.
[2]戴俊钊, 冷何英.目标识别新算法的研究与应用[J].红外与激光工程:2001, 4:108-111.
一种新的基于模板匹配的车型识别 篇2
基于图像的车型识别主要有:1) 基于特征的车型识别[1,2,3,4,5,6], 如采用Harris角点特征, Gabor特征, 和SIFT (Scale Invariant Feature Transform) 特征等进行车型识别, 但该类方法由于各特征本身的特点, 当存在光照变化、视角变换、遮挡时, 其车型识别率往往大幅下降;2) 基于模板的车型识别[7,8,9], 该类方法虽然取得不错的识别效果, 但通常存在提取难度大, 计算复杂等缺点, 不能达到实时车型识别的要求。
针对车型模板匹配方法的缺陷[9], 本文提出了一种新的基于模板匹配的车型快速识别方法。首先本文通过车型显著区域密集采点和非显著区域稀疏采点的非均匀方式, 建立车型模板, 从而大量减少匹配点数量, 有效减少匹配时间;其次通过梯度扩展, 二进制图形表示, 线性化内存等实现了匹配时的并行计算, 并进行尺寸归一化处理, 减少模板库中模板量, 同时提高了匹配速度和匹配的准确率;最后根据车辆外观等信息, 利用k-means聚类针对不同车型建立子空间, 在此基础上建立分层次的车型模板库, 加速了模板索引的速度, 缩短了车型匹配的时间。实验表明, 本文所提出的方法能有效, 实时地对车型进行识别处理。
1 基于模板匹配的车型识别
本文提出了一种新的基于模板匹配的车型识别方法。该方法具体流程如图1所示。
线下训练部分:1) 计算Harris角点, 获得显著区域, 然后显著区域密集采点, 非显著区域稀疏采点;2) 在采点完成后的图像中, 计算相应的扩展梯度形成车型模板图, 并进行相关二进制编码, 通过余弦相似获得相应梯度响应图, 利用二进制编码值, 保存相应梯度图, 并以此为基础实现模板的并行化匹配;3) 最后利用k-means聚类的方式根据车型外观等不同, 建立有层次的车型模板索引, 记录模板相关信息。
线上匹配:1) 交通场景下获得待识别的车型图像;2) 计算图像车辆的显著区域和非显著区域, 然后非均匀采点获得梯度图;3) 梯度点进行扩展和二进制编码;4) 通过余弦相似获得相应梯度响应图;5) 采用并行计算的方式进行快速查表匹配;6) 获得车型匹配结果, 判断车型, 完成车型检测。其具体实现, 如下章节所述。
1.1 基于显著区域和非显著区域的非均匀点采样
本文采用对车辆显著区域和非显著区域区别对待的非均匀采点方式, 因为实验表明车型重要的判别信息多集中在外围轮廓、挡风玻璃轮廓、窗口区域轮廓等其他可以用来区分不同车型的区域轮廓上, 且大多是梯度方向变化较大的曲线区域上, 所以, 记录模板时只需密集记录这些显著区域上的点, 对于非显著区域采用稀疏采点, 而不是记录车型上所有点, 这样在不影响匹配准确的情况下, 可以显著减少匹配点的数量, 使得匹配速度有很大提高。
基于显著区域和非显著区域的非均匀采样如图2所示, 主要有以下3个步骤:
1) 如图2右下角所示, 首先求取车型轮廓线的Harris角点。
2) 以Harris角点为圆心, 半径6个像素画圆到大小与车型模板图像一样的空白图像上, 再在这张图像上寻找连通域, 从而定位出车辆图像的显著区域。
3) 在获得的关键区域上, 通过扩展梯度和二进制编码形成车型模板图像的梯度图, 该梯度图是显著区域密集采点, 非显著区域稀疏采点的非均匀方式形成点的梯度分布。
1.2 获取模板扩展梯度图预先计算响应表
在上节非均匀采点后, 对采样点求取模板扩展后的二进制梯度图表示, 预先计算响应表响应图, 并以此为基础实现匹配时并行设计。
1.2.1 计算图像梯度点
计算非均匀采样后的图像的RGB颜色空间上该点在3个通道中的最大梯度值。然后通过阈值保留梯度值比较大的梯度点。把求得的梯度, 量化为N (本文N=5) 个梯度方向, 具体梯度方向量化标准如图3所示。然后把各个梯度点领域内出现次数最多的梯度方向作为该梯度点的梯度方向。
1.2.2 点梯度扩展与编码
在得到非均匀采样图形的梯度图后, 其梯度点扩展过程和二进制编码过程如图4所示, 在获得的量化之后的梯度方向图上进行梯度扩展。具体操作是先在量化梯度图基础上对各点在T×T (本文T=3) 邻域内进行梯度扩展 (即每个点含有半径为T/2的邻域内的所有出现的梯度方向) , 然后按照图3的二进制编码方式对各个方向进行表示, 按位“或”操作处理, 获得新的梯度二进制表示。
1.2.3 预先计算图像梯度响应表
获得扩展后的梯度图像后, 使用余弦相似度方法来度量检测车辆和模板的相似性。匹配的过程中, 该梯度点在T×T邻域内所有梯度方向中, 会有一个梯度方向与当前匹配的梯度方向所得到的余弦响应值最大, 那么就认为该梯度方向为最匹配的梯度方向。
因为梯度量化为5个等级, 且对应的是每个长度为5的二进制编码, 其响应是特定的, 所以可以预先计算每一个梯度方向的最大余弦响应值, 由此建立相应的梯度响应表。把这些得到的响应表保存在内存中以供匹配时快速查找。
匹配过程中, 检测图像都是用梯度扩展后的二进制编码表示, 所以可以将这个编码值当作每个梯度响应表的下标值, 进行快速查表。计算每一个响应值的公式为
式中:ζ表示邻域内梯度方向集合形成的二进制编码值;i表示量化的梯度方向 (取值范围为1~5) 。预先计算N=5张梯度响应表T1, T2, T3, T4, T5, 过程如图5所示。
通过查梯度响应表构造出当前被检测图像对应的5梯度响应图, 具体计算5梯度响应表M1, M2, M3, M4, M5过程如图6所示。
1.2.4 梯度响应图的并行计算
为了进一步提高算法的速度, 采用梯度响应图的并行计算。如图7所示, 首先对梯度响应图进行线性化, 形成cell×cell (本文取cell=2) 个梯度响应图的线性化内存。将5张梯度响应图线性化为4 (cell×cell=4) 个行向量, 即4个梯度响应图的线性化内存。
由于低效率的滑动窗口会使得匹配速度变慢, 所以为了提高模板的匹配速度, 通过线性内存实现并行计算, 每次就可以同时计算出多个窗口的模板匹配相似度。在匹配过程中, 根据模板图像中梯度点的梯度方向找到其对应的梯度响应图的线性内存, 然后再根据该梯度点在cell×cell的区域中的位置来计算出它在对应的梯度响应图的线性内存 (是一个行向量) 中的偏移量为
式中: (X, Y) 表示模板图像中的梯度点所在的坐标位置;Width表示当前被检测图像的宽度。则可以将模板图像中所有梯度点对应的梯度响应图的线性内存 (行向量) 都找到, 再计算出各自的偏移量, 最后将所有行向量按偏移量对齐, 把相应位置余弦响应值进行相加求和。求和后的行向量中每个元素即为该检测窗口中模板的相似度, 那么它的最大值处对应的坐标位置就是目标所在的位置。具体计算车型模板匹配相似度图的过程如图8所示。
1.3 K-means聚类获取不同车型空间引入多层检索
为了减少每一次进行匹配时的车型的模板数量, 提高搜素速度, 本方法大致按车辆外观大小等, 通过kmeans聚类进行粗聚类, 获得不同车型空间的划分, 实现两层划分, 建立分层的车型模板库索引。最终形成的第一层模板是车型大类模板, 其包含三类:第一类为卡车、厢式货车、油罐车;第二类为客车、面色车;第三类为两厢汽车、三厢汽车。第二层模板是车型具体模板。匹配时, 先用大类模板进行匹配, 选择匹配率最高的那类, 再用那类对应的车型具体模板进行第二次匹配, 从而匹配出具体车型。部分车型模板库索引建立示例如图9所示。
1.4 尺寸归一化处理
模板匹配算法对图像尺寸很敏感, 所以要对图像尺寸归一化处理。就是将模板库中模板图像和待识别车辆图像均要归一化到统一的尺寸, 具体做法是按照图像实际宽高比进行比例放缩, 放缩公式如下所示
式中:W2和H2表示放缩后的图像宽和高;W1和H1表示放缩前的图像宽和高。通过对各种尺寸的车型模板与提取到的待识别的车辆图像进行匹配实验, 对实验结果进行分析发现。对于提取到的待识别的车辆图像, 放缩后的车辆图像宽度W2取160像素。因为该尺寸下, 获得的梯度特征点数目满足效率和效果的双重要求。对于车型模板图像, 因为要考虑提取车辆时会边缘部分会包含部分非车辆区域, 所以放缩后的车型模板图像宽度W2分别取为155, 145, 135, 125像素。
1.5 车型具体匹配过程
有层次的车型模板库所以建立以后, 对于需要检测的图片进行车辆匹配, 具体过程如下:
1) 对提取到的车辆图像进行图像尺寸归一化处理。
2) 用索引模板快速进行匹配, 从这三类模板中, 选择匹配相似度最高的那类。
3) 用该类对应的车型具体模板进行第二次匹配, 从而匹配出具体车型。如图10所示, 以“厢式货车”为例说明了车型匹配过程。
2 实验结果
本文通过建立车型模板库索引、图像尺寸归一化, 并行计算等处理等方法, 不仅使模板库中的模板量不会因车型种类增多而迅速增长, 而且通过采用非均匀梯度点分布方法来提取车型梯度特征, 使得算法的匹配速度更快。因此, 本系统是可以达到实时性要求的, 在测试过程中, 车型识别的平均每次处理时间为180 ms。本文测试集多为交通场景拍摄的视频和通过网上搜集的交通视频。其中, 使用一半的视频来提取并制作车型模板库中的所有模板, 另外一半视频用于测试集。车型模板库中一共制作了1 125张车型模板, 其中的车型索引模板有260张, 其他模板是车型具体模板。通过在测试集上进行测试, 一共对960辆汽车进行了车型识别, 实验结果如表1所示。
图11所示为在测试集上进行车型识别的部分测试效果, 分别列出了本系统能够识别的7种车型的匹配效果。
图12所示为在测试集上错误识别的例子, 对结果说明并进行相关分析。图12a为三厢汽车被识别成两厢汽车, 这是由于从正面看不到车尾, 导致匹配到了两厢汽车。图12b为面包车被识别成两厢汽车, 这是由于这种车型的面包车与两厢汽车的车型区别太小了, 通过模板匹配算法已经对其没有可分性了。图12c为卡车被识别成厢式货车, 这是由于该卡车是白色的, 而且后面装的货物也是白色的, 所以外形就已经和厢式货车极为相似, 该算法已经对其没有可分性了。
3 结论
本文首次提出了基于显著区域非均匀采点的层次性的车型识别方法。相比于传统的车型识别方法, 本文通过非均匀采点的方式减少模板梯度点数目, 通过梯度扩展和并行计算在增加鲁棒性的同时提高了匹配速度, 通过层次性的二次匹配也极大缩短了车型的匹配时间。本算法取得了不错的检测效果, 但本文算法对于与车型模板相近的测试图像或是无法完全获得完备车型描述的检测图像容易产生错误结果, 以后的工作要进一步完善模板表述以及去除相关干扰, 提高此类型的检测结果。
参考文献
[1]LI J, ZHAO W, GUO H.Vehicle type recognition based on harris corner detector[C]//Proc.International Conference on Transportation Engineering, 2009.[S.l.]:IEEE Press, 2009:3320-3325.
[2]LIM T R, GUNTORO A T.Car recognition using Gabor filter feature extraction[C]//Proc.IEEE Conference on Circuits and Systems, 2002.[S.l.]:IEEE Press, 2002:451-455.
[3]PETROVIC V S, COOTES T F.Analysis of features for rigid structure vehicle type recognition[EB/OL].[2014-01-20].http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.59.1356.
[4]PETROVIC V S, COOTES T F.Vehicle type recognition with match refinement[C]//Proc.the 17th International Conference on Pattern Recognition, 2004.[S.l.]:IEEE Press, 2004:95-98.
[5]NEGRI P, CLADY X, MILGRAM M, et al.An oriented-contour point based voting algorithm for vehicle type classification[C]//Proc.the 18th International Conference on Pattern Recognition, 2006.[S.l.]:IEEE Press, 2006:574-577.
[6]CLADY X, NEGRI P, MILGRAM M, et al.Multi-class vehicle type recognition system[M].Berlin Heidelberg:Springer, 2008:228-239.
[7]PSYLLOS A, ANAGNOSTOPOULOS C N, KAYAFAS E.Vehicle model recognition from frontal view image measurements[J].Computer Standards&Interfaces, 2011, 33 (2) :142-151.
[8]KATO T, NINOMIYA Y, MASAKI I.Preceding vehicle recognition based on learning from sample images[J].Intelligent Transportation Systems, 2002, 3 (4) :252-260.
车型识别技术 篇3
随着智能交通事业的发展,各停车场、收费站、交通等部门越来越需要一套完善的系统来进行管理,以便统筹安排,防止资金的流失和人员的冗余,实践证明,使用车型识别系统,能取得良好的效果。车型识别是智能交通系统中的一个重要组成部分,近年来,车型识别技术已成为国内外研究热点之一。
目前汽车种类繁多,数不胜数。如何从众多的车辆中准确地识别出车型,也给我们带来了一定的困难。实际上,车型识别是典型的目标识别问题,而与目标的检测和识别息息相关的是目标的特征,这就关系到一个特征提取和特征选择的问题。而现有的车型识别方法对使用何种特征缺乏有效的评价机制。如何寻找具有良好描述和分类性能的特征及如何提取这些特征就成为解决车型识别问题的关键[1,2]。为此,利用计算机视觉、模式识别等理论方法,本文提出了一种多特征融合的模糊聚类方法,通过调整各个特征的加权系数来调整特征对分类的贡献,达到快速识别车型的目的。
2 车型特征提取
一般来说,车型识别过程包含以下几个阶段:图像采集、图像处理、车辆分割、特征提取和车型识别。本文着重介绍后面两个步骤。
特征提取是目标识别中一个非常重要的环节,一个识别系统的识别能力与特征矢量的选取有直接关系。选取的特征要求具有高度的代表性、典型性及稳定性[3]。
按照国家标准把车型分为三类:轿车、客车、货车。通常各类汽车的车身侧视图可提供整个车长、顶蓬位置、顶蓬长度及车辆高度等信息。任何车型大致都可以抽象成一个“工”字,如图1所示是轿车、客车和货车三种车型。顶长A是汽车顶篷的长度。车高H是车身从最上到最下的距离。整个车辆长度以顶篷中垂线为界,分成前后两部分,即前底长D1和后底长D2。
由于拍摄图像时,镜头与车辆间的距离、角度都是随机的,因此造成同一车辆,在两次拍摄图像时,上述各参数的绝对大小不相等。这就限制了我们不能用绝对长度或绝对高度等绝对参数作为识别特征[4],而是用这些绝对参数来构成顶长比、顶高比和前后比等相对参数作为识别特征:
(1)顶长比T1。车篷的长度与整个车辆长度之比为T1=A/(D1+D2)
(2)顶高比T2。车辆的车篷长度与其高度之比为T2=A/H
(3)前后比T3。以车辆的顶篷中垂线为基准,车辆的前后部分之比为T3=D1/D2
通过统计大量车型数据可知,对于轿车、客车和货车三类车型大部分满足以下特点:
(1)轿车的特征(T1,T2,T3)
在设计轿车时,考虑到车内空间和舒适性,车篷一般是坐落在车体的中央或者是靠后的位置。轿车的顶长比T1约为0.2~0.5之间,在这个范围之外的轿车比较少见。轿车的顶高之比T2为中,一般为l左右。轿车的前后之比T3在1~2.5之间,低于1的比较少见。
(2)客车的特征(T1,T2,T3)
对于客车来说,车篷的长度所占整个车辆长度的比重较大。因为大部分的客车要尽可能地利用空间,一般会做成类似长方体的形状。例如城市中的公共客车,车篷与整个车身的长度之比T1近似为1。长途客车的车篷与整个车身的长度之比也几乎在0.85以上。客车的顶高之比较大,T2一般在1.5以上。客车的前后比T3为1左右。
(3)货车的特征(T1,T2,T3)
货车一般设计成驾驶室小,而后面的拖斗都比较大,以便能最大容量地装货物。相比之下,货车的车篷与整个车身的长度之比就小多了,T1约为0.1-0.3之间。货车的顶高比T2在0.5-1左右。而货车的前后比T3约为0.1-0.5。
3 多特征融合的模糊识别方法
由于目标实时特征存在着很大的不确定性,根据模式识别理论,聚类分析是用数学的方法,按事物之间的相似性进行区分和分类的过程。在这一过程中没有教师指导,是一种无监督分类[6]。对于车型的分类,所采用的样本不知其所属类别,而是根据样本间的相似度来自动地进行分类,所以适合采用聚类分析方法。经典的聚类算法是一种硬划分,将每一个辨识对象严格地划分为属于某一类。而实际使用中,某些目标并不具有这种严格的属性,它们可能位于两类之间,采用模糊聚类可以获得更好的效果。
3.1 模糊聚类方法
传统的模糊聚类方法都假定待分析样本的各维特征对分类的贡献相同。为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出一种基于特征加权的模糊聚类算法,能够使样本的分类效果更好,而且还可以分析各维特征对分类的贡献程度。
设需要进行聚类分析的样本数据集合undefined,样本分为C个类别,每个类别的聚类中心集合undefined。定义X中的任意样本xi属于类别j的隶属度为uij,隶属度矩阵U为undefined。矩阵U中每一列的元素表示所对应的样本属于C个类别中各个类的隶属度。
为了在众多可能的分类中寻求合理的分类结果,需要确定合理的相似性或相异性聚类准则,这里定义一个含有模糊隶属度的聚类准则目标函数:
undefined
满足约束条件:undefined;undefined;0≤uij≤1;undefined;
undefined为模糊分类矩阵,undefined为C个聚类中心集合,W=(w1,w2,Kwm)是特征权重向量,d为第i个样本到第j类的距离,undefined为模糊加权指数。
3.2 特征权重的优化
最优化的类就是使目标函数取最小值的类,如果一类中的所有样本点都贴近于它们的类中心,则目标函数很小[6]。根据式(1)所定义的目标函数,可以将具有三组变量的目标函数分三个步骤进行优化。
(1)U,V确定时,优化W
目标函数改写为undefined,定义上述带约束的优化目标函数的L氏式为:undefined
令上式对各变量的偏导数式等于0,得
undefined,undefined
计算得到undefined
(2)W,V确定时,优化U
目标函数改写为undefined,定义上述带约束的优化目标函数的L氏式为:undefined
令上式对各变量的偏导数式等于0,得
undefined,undefined,
经计算得到undefined
(3)W,U确定时,优化V
W,U确定时,目标函数undefined。当第k个特征是有序属性时,则可以将目标函数改写为:undefined
令目标函数对各变量的偏导数式等于0,得
undefined
计算得到undefined
当第k个特征是无序类别属性时,由于计算聚类中心点的目的是将目标函数最优化(最小化),所以在这一步中也可以对无序类别属性的所有取值进行搜索,将这个无序类别属性的当前中心点值取为使目标函数取得最小值的那个值。
3.3 特征加权的模糊聚类算法
如果将聚类中心平均点的计算公式undefined代入到隶属度更新公式(3)和特征权重的更新公式(2)中,则可以将分步迭代优化算法扩展应用到同时具有有序属性类型和无序属性类型的数据点集中。具体的算法步骤如下。
(1)从样本数据集合undefined中选择C个初始中心点undefined。选取迭代中止参数ε,令迭代次数t=0,隶属度指数r设为2,特征权重指数q设为2,初始化特征权重向量W=(w1,w2,…wP)T(若无先验知识,则将特征权重全部为1);
(2)如果D(Xi,Vj(0))=0,则令uij(0)=1,否则,根据下式计算隶属度
undefined
其中j=1,2,…,C,i=1,2,…,n,这样可以得到当前的隶属度矩阵undefined
(3)令t=t+1,按照下式来更新隶属度
undefined
其中j=1,2,…,C,i=1,2,…,n。
如果undefined,则步骤(3)和步骤(4)的迭代更新结束,转到步骤(5),否则,继续执行步骤(4)。
(4)令t=t+1,采用下面的公式来更新计算特征权重向量W=(w1,w2,…wP)T
undefined
其中k=1,2,…,m,计算完毕后转到步骤(3)。
(5)根据最终得到的隶属度矩阵分配每个点所属聚类,得到聚类结果。
这种可变加权FCM优化算法只需在初始阶段利用初始中心点集计算特征权重向量和隶属度矩阵,然后就可以在步骤(3)和步骤(4)这两步交错优化特征权重向量和隶属度矩阵。由于这两个优化公式没有出现中心点,所以可以应用到具有有序属性类型和无序类别属性的样本点集聚类中来。
4 实验分析
对于轿车、货车和客车的分类,选取的特征为顶长比、顶高比和前后比(T1,T2,T3)。通过统计大量车型数据,计算不同车型的特征值(T1,T2,T3),其部分样本数据如表1所示。
注:表1是轿车、客车与货车的部分样本数据
设置特征类别数C=3,加权指数r=2(一般经验范围为1.1≤r≤5,取r=2最有意义)[5,6,7]。利用车型特征样本数据对目标分类的结果如图2所示。
由图中对目标进行分类的结果可以看出,根据顶长比、顶高比和前后比三个特征值,利用特征加权的模糊聚类方法可以将运动目标分为轿车、货车和客车三个类型。
为了说明多特征融合的模糊聚类算法的优越性,对实际采集到的150个车型样本数据进行分类识别,将本算法与固定加权的模糊聚类算法得到的结果进行比较,比较结果如表2所示。
5 结束语
本文在车型的有效特征提取与分类识别方面进行了深入的研究,为了考虑样本中各维特征对模式分类的不同影响,本文提出一种基于特征加权的模糊聚类算法,结果表明达到了较好的分类效果。
摘要:车型识别是智能交通系统中的一个重要组成部分。利用计算机视觉、模式识别等理论方法,对车型的有效特征提取与分类识别进行了深入的研究,提出了一种多特征融合的模糊聚类车型识别方法。通过自动调整各维特征的加权系数来调整特征对分类的贡献,结果表明达到了较好的分类效果。
关键词:特征选择,车型识别,特征融合,模糊识别
参考文献
[1]Chen Z X,Wang G Y,Small targets detection under complex background based on targets feature salience,Intemational Joumal ofadvances in Systems Science and applications,2006,9(1):95-100
[2]陈振学,刘成云,常发亮,基于生物视觉显著性的车辆车型识别,计算机科学,2010,37(2):207-208
[3]杨永,骆霞军,王莉利,基于神经网络的汽车车型图像自动识别系统的设计与实现,2010,31(2):56-60
[4]杜华英,基于神经网络的汽车车型识别方法的技术研究,长沙:中南大学,2006.
[5]胡步发,一种基于模糊聚类的自动目标识别算法,福州大学学报,2001,29(3):50-53
[6]李彦鹏,黎湘,王宏强,等,基于模糊聚类分析的目标识别效果评估,现代雷达,2005,27(8):14-17
车型识别技术 篇4
公路收费站根据车辆的类型收取相应的费用,采用自动车型识别系统可大大降低人工识别车型的工作量。学者们在智能车型识别系统领域提出了很多方法。文献[1]和文献[2]采用支持向量机分类车型,该方法以提取车辆侧面图像的特征作为研究对象,不同类型车辆的细节信息不能被提取出,无法精确识别车型。 文献[3]采用背景差分法提取目标车辆的Harris角点, 计算待识别车辆与标准样本Harris角点的Hausdorff距离,选择距离最短的为识别结果,该方法虽然只需研究车辆的某些特殊点,但对噪声没有良好的鲁棒性。 文献[4]以车脸图像灰度共生矩阵的纹理特征量作为标准样本,计算待识别车辆的纹理特征量与标准样本的欧氏距离,选择距离最短的为识别结果,该方法克服了文献[1]~文献[3]的不足。但文献[4]在图像滤波方面没有给出模板的大小和具体的车脸分割方法,这两步图像处理效果的好坏直接影响后续的车型识别。
本文提出 基于灰度 共生矩阵 ( gray level co-occurrence matrix,GLCM)纹理特征的车型识别系统,主要对文献[4]存在的不足加以研究。在图像滤波方面,对高斯滤波、各种参数大小模板的中值滤波进行比较;明确了分割车脸图像的方法。
1基于灰度共生矩阵纹理特征的车型识别系统
基于灰度共生矩阵纹理特征的车型识别系统由车辆图像采集及预处理、车脸分割、纹理特征提取、 最小距离分类器等组成,其结构图如图1所示。
车型识别流程:首先,采集一段在公路上拍摄的监控视频,提取出各帧图像,由于摄像头静止拍摄固定场景,因此在车辆出现期间,背景部分基本无变化, 通过背景差分算法可得到车辆图像;然后,对车辆图像中值滤波,利用车辆图像的水平、垂直积分投影方法分割出车脸图像;接着,对各车脸图像进行标准化, 建立标准车脸图像库,提取标准车脸图像的纹理特征, 建立纹理特征库,用纹理特征库的数据训练最小距离分类器;最后,将待识别的车脸图像的纹理特征量输入最小距离分类器进行识别分类。
2图像采集及预处理
2.1图像采集
本文从公路车辆视频中提取各帧图像,选择一张不含运动目标的图像作为参考;然后计算当前帧与参考图像对应像素位置的灰度差值,若差值不为0的像素数目超过设定的阀值则认为图像中存在运动目标, 否则没有运动目标,将检测出有运动目标的当前帧作为前景图像加以保存(本文视频的帧速率为13帧/秒); 最后将运动目标刚好离开拍摄范围的相连3帧图像的平均图像作为背景图像加以保存。
2.2图像预处理
2.2.1图像灰度化
拍摄的图像一般为24位真彩色图像,其图像像素值由R(红)、G(绿)、B(蓝)3种基色组成。 图像的数据量较大,使处理图像的时间过长,而且提取目标、中值滤波、分割车脸、生成灰度共生矩阵等操作都在灰度图像上实现。因此,需将存储的前景图像、背景图像灰度化,以便后续图像处理能正常进行。 本文采用加权平均法对图像做灰度化处理。
其中:分别表示在(i, j)处像素的红分量、绿分量、蓝分量;f(i, j)表示在(i, j)处像素的灰度值。
2.2.2运动目标提取
背景差分法是获取运动目标的最普遍方法,该方法简单并能完整地提取出运动目标。2幅图像直接相减获得的目标图像
其中,是运动目标图像;是第t帧是运动目标刚好离开拍摄范围的相连3帧图像的平均图像。
2幅图像直接相减,若像素差值出现负数则将其灰度值设置为0,其效果如图2所示。
2幅图像绝对相减所获得的目标图像
图像绝对相减获得的运动目标图像如图3所示。
由图2、图3可见,图像直接相减获得的目标图像噪声小,并且车辆与背景分离良好,有利于下一步的车脸分割。
2.2.3中值滤波
采集图像的质量会受到外界因素干扰,如光照强度、灰尘、空气湿度等。若图像中噪声较大,难以准确确定车脸位置。为降低噪声的影响,采用中值滤波对图像进行处理。实验图像的分辨率为宽320像素× 高240像素,通过调节模板参数比较处理结果,采用3×3模板时能获得较好的降噪效果。
3车脸分割
为减少数据量,提高系统识别速度,本文只研究车脸图像。车脸的具体范围:车辆左右雾灯的外边沿分别作为车脸图像的左右边界;车辆前挡风玻璃的下沿作为车脸图像的上边界;车辆保险杠作为车脸图像的下边界,四边界所围的区域称之为车脸。利用水平、 垂直积分投影的方法分割出车脸。由水平积分投影确定车脸图像的上、下边界,垂直积分投影确定车脸图像的左、右边界。目标图像的水平投影如图4所示,垂直投影如图5所示,分割后的车脸图像如图6所示。
分割后的车脸图像通常大小各异,且明暗程度也存在较大差异,使提取的纹理特征量没有统一的衡量标准。为此,需要将车脸图像缩放成统一大小。经过大量实验,车脸图像大小确定为宽120像素×高50像素。然后对车脸图像进行灰度拉伸、直方图均衡化, 使图像的衡量标准统一。经过一系列处理得到的标准车脸图像如图7所示。按照上述方法,将样本图像全部标准化,建立标准车脸图像库。
4纹理特征
4.1灰度共生矩阵
纹理反映图像的内部结构信息,表示在图像中某方向上相距为d的两像素存在着特定的关系。灰度共生矩阵是一种基于像素间的特定关系来描述纹理的方法。GLCM的每个元素[P(i,j)]表示在方向上, 相距d的2个灰度级分别为i和j的像素出现的概率或次数。若图像灰度级为L,则灰度级i,j=0,1,2,…,L-1。 θ一般取0º、45º、90º和135º;d一般取1、2、3等。
4.2提取纹理特征
本文选择GLCM 5个常见非线性相关的纹理特征作为研究对象:energy(能量)、contrast(对比度)、 entropy(熵)、relativity(相关)、local stationarity (局部平稳性)。
1) energy:是GLCM元素值的平方和,亦称为能量。能量越大,纹理就越粗;反之,纹理就越细。
其中,f1表示图像纹理的粗细程度;p(i, j)表示像素值分别为i和j的2个像素出现的次数或概率;L表示图像的灰度级数。
2) contrast:反映图像的清晰度和纹理沟纹深浅的程度。对比度值越大意味着图像的清晰度越高,纹理的沟纹越深;反之,纹理的沟纹越浅。
其中:f2表示图像的对比度;n = |i - j|。
3) entropy:是图像所具有的信息量的度量。纹理信息也属于图像的信息。熵表示纹理的非均匀程度或复杂程度。熵越大意味着纹理越复杂。
其中:f3表示图像具有的信息量。
4) relativity:反映GLCM的元素在横向或纵向上的相似程度。
其中:f4表示图像在水平或垂直方向有纹理;
5) local stationarity:度量图像纹理局部变化的多少。其值越大,表示局部越均匀;反之,局部变化不均匀。
其中f5表示局部图像纹理变化的大小。
5车型识别
本文用最小距离分类器识别车型。最小距离分类器的原理[4]:任何一个模式类在特征空间中都处于较为聚集的状态,将同类型样本特征量的平均值作为该模式类的中心;计算待识别样本的特征量与每类模式中心的欧式距离;选择距离最短的模式类作为该样本的分类结果。
本文基于灰度共生矩阵纹理特征的车型识别系统对小轿车、SUV、面包车、大客车、小货车、大货车等车型进行了实验,品牌包括大众、丰田、雪佛兰等。以图8实验车脸图像为例,本文设定图像的灰度等级L为256,GLCM的大小为8×8,像元距离d为1。计算4个方向(0°,45°,90°,135°)上的GLCM,其中1个GLCM为
灰度共生矩阵P(i,j|1, 0°)的纹理特征值能量为4406974、对比度为12502、熵为34561.6569、相关为1909、局部平稳性为1632.2393。将这5个特征值按顺序分别作为元素组成一个列向量。按照上述方法, 在所建立的标准车脸图像库中,分别提取每幅图像的纹理特征,建立纹理特征库。
将待识别样本的纹理特征向量与纹理特征库中每类车型的平均纹理特征向量进行距离计算,选择距离最短的为识别结果。3个品牌车的实验结果见表1。
6实验
本文实验系统开发平台为Microsoft Windows7操作系统,前端开发工具采用VS2010,图像处理中应用Open CV函数包。实验中,在公路上拍摄了100幅车辆的正面序列图像,将图像进行处理。在标准车脸图像库中选取15幅车脸图像作为训练样本,85幅车脸图像作为测试样本,正确识别的车型有77幅, 识别率达到90%。
7结论
本文提出的基于灰度共生矩阵纹理特征的车型识别系统稳定、正确识别率高、实时性好,但适用范围窄,例如光照强度等因素严重影响准确度。若光线强烈,车辆的颜色较暗时,前景图像中车辆所在的区域会比背景图像暗,用前景图像减去背景图像所得到的车辆图像不完整,提取的纹理特征量就不能准确地代表该车型,致使识别结果不准确。因此后续还需进一步研究去光照的算法。
参考文献
[1]王慧斌,芦蓉.基于视频的车型特征提取及识别方法研究[J].微型电脑应用,2010,26(10):50-53.
[2]冯超,贺俊吉,史立.基于支持向量机的轿车车型识别[J].上海海事大学学报,2011,32(3):85-89.
[3]周爱军,杜宇人.基于视频图像Harris角点检测的车型识别[J]扬州大学学报:自然科学版,2008,11(1):67-70.
车型识别技术 篇5
车辆声频信号因不同车型的声源特点及结构特征的差异而具有一定的辨识性, 分析车辆声频信号的产生原理, 并选择最具辨识性的特征参数用于车辆的自动分类与识别可与其他手段结合以提高效率及准确率, 更可在特定场合发挥作用。在分析车辆声频信号产生的原理及特点的基础上, 为其建立经典的线性模型, 通过分析比较其各个特征参数, 选取基于线性预测编码 (LPC) 的LPCC倒谱系数作为车辆声频信号的特征参数, 对所采集的四类车辆的声频信号进行分析, 采用聚类分析和判别分析等数据分析方法实现车型的自动分类识别。
2 车辆声频信号模型
车辆声频信号产生于发动机等多个振动源激励连接件, 并主要由车体发出, 可以认为是声源信号经过一个系统产生的输出。如果各声源信号满足加性组合的特征, 则车辆声频信号可以看作是一个信号经过一个线性时不变系统后所得到的输出信号。因此, 车辆声频信号可表示为:
其中, h (n) 为系统的冲激响应, w (n) 为声源信号。
由于信号本身的复杂性及不同车型在结构上的差异性, 在选取车辆声频信号特征时应主要由其系统冲击响应入手。对于系统H (z) , 全极点模型为:
可以用输入输出的差分方程表示为:
其中, {Xt}为一随机过程, {Wt}为一均值为0, 方差为σw2的白噪声过程。
3 车辆声频信号的LPCC倒谱特征
3.1 全极点模型的参数估计
全极点模型的相关矩估计的方法是利用样值序列x1, x2…xN的自协方差函数或自相关函数来进行参数的估计。这里所采用的全极点模型, 若满足条件N→∞, 可以证明其所得估计是最小方差估计, 也是无偏估计。根据Yule-Walker方程, 可得AR模型参数的Yule-Walker估计[1]为:
对k=1, 2, …p分别建立Yule-Walker方程:
称αk (k) (k=1, 2, …, p) 为部分相关系数, 标记为Kk。公式 (5) 中, αj (k) 为第j个参量经过k次迭代后的参数。αj (k) (k=1, 2, …, k) 从k=1开始逐次递推求得, 直到k=p时得到αp (p) 。递推公式为:
对于K1, K2, …, Kp的计算, 可由格形算法完成, 一种可实现的格形结构流图如图1示:
其中en (k) 为Durbin递推算法中第k次迭代后t时刻xt的预测误差, bn (k) 是n-k时刻的预测误差, 参与预测的是 (n-k) +1, (n-k) +2, …n时刻的样值。图1中em (0) =bm (0) =xm, 即第0次迭代的预测误差就是信号样值本身。
3.2 LPCC倒谱系数
由基于Durbin递推公式的格形算法和部分相关系数的格形算法求出车辆声频信号的线性预测编码LPC系数α1, α2, …, αp后, 求LPCC系数h (1) , h (2) , …, h (m) 的迭代算法[2]如下:
这里, 在进行车辆声频信号特征提取时, 选择n=p=12。
4 车辆自动分类识别流程
在完成车辆声频信号LPCC倒谱特征参数的提取后, 采用判别分析和聚类分析[3]的方法对车辆进行分类与识别。这里采用Fisher判别法的线性分类函数 (线性判别函数) , 线性分类函数的一般形式为:
在进行车型自动分类时, 用K均值聚类的方法对其进行分类, 得到每类的矢心, 而后用Fisher判别法将矢心的参数分别代入各个车型的线性分类函数, 根据判别分数的大小确定此类所属的车型。
5 实验结果及分析
实验选取经采集获得的大型货车、农用车、轿车、中型客车共四种车型的声频信号样本共68个作为原始数据, 首先选取了其中最容易辨识的大型货车、轿车、农用车、中型客车这四种车型的声频信号各8个, 依流程计算其12阶LPCC参数及分类函数系数。之后随机抽取四类车辆声频信号样本各5个, 用K均值聚类算法[4,5]对其进行分类, 并求得每个分类的矢心, 建立Fisher线性判别函数并将矢心代入, 所得判别分数如下表:
从分值结果可得结论为:类属1为农用车, 类属2为中型客车, 类属3为轿车, 类属4为大型货车。
对比聚类结果与实际车型归属, 其结果如表2所示:
在车型数量的统计上, 大型货车和中型客车的结果符合实际情况, 轿车和农用车均仅出现了一辆的偏差, 因此从统计的角度看, 该方法是较为准确的。在车型识别方面, 对大型货车和轿车的车型分类识别比较准确, 准确率都达到了80%。
6 结论
实验结果表明, 将车辆声频信号的LPCC特征参数应用于车辆自动分类与识别, 在交通流量总体统计方面准确率较高, 对大型货车、轿车的识别率也较高, 在智能化交通的车型自动分类与识别中具有一定的参考与实用价值。
摘要:为满足智能化交通的需要, 利用车辆声频信号特征进行车型自动识别, 对车辆声频信号进行建模, 以线性预测编码倒谱 (LPCC) 为特征, 采用聚类分析算法划分车型, 并使用Fisher判别法对车型进行识别。实验结果表明此方法可准确和有效的实现车型的自动分类与识别。
关键词:车辆声频信号,LPCC参数,Fisher判别法,K均值聚类算法
参考文献
[1]汤俊.统计信号处理算法[M].北京:清华大学出版社, 2003:141-154.
[2]黄俊钦.随机信号处理[M].北京:北京航空航天大学出版社, 1990.
[3]吴今培, 孙德山.现代数据分析[M].北京:机械工业出版社, 2006:4-8.
[4]边肇祺, 张学工, 等.模式识别[M].北京:清华大学出版社, 1999.
车型识别技术 篇6
目前我国正处于高速公路大发展的时期。越来越多的人认识到发展高速公路事业的重要性, 由于现在通行高速公路的车辆越来越多, 原有的停车收费制式已不能满足高速公路上庞大的通行量, 所以研制一种不停车收费制式已经迫在眉睫。而其中最重要的一点是车型的自动识别, 目前正在实验阶段的是通过车载电子标签发射存贮在卡中的信号对车型进行识别, 但是这种卡相当于一种IC储值卡, 是不记名, 不记车型的, 所以要有一套完善的设施来判断车型, 从卡上扣除相应的金额。目前, 已经对于车型分类这个领域进行了很多研究, 其中最常用的就是应用图像处理、神经网络、和模式匹配的方法。而且也有一些已经投入了使用。但是用图像处理的方式在不停车收费中进行车型分类有一个很明显的难点:图像的采集比较的困难。因为汽车经过收费点时不停, 采集一个高速运动的物体的图像往往得不到想要的结果, 图像的失真度太大, 使对图像特征进行提取的时候得到的误差比较大。故为了提高识别的效率, 本文提出了一种基于一种新的特征提取方法和RBF神经网络的车型分类的方法。
1 特征的提取方法
在此我们提出一种新的车型特征的提取方法:红外线测量车型法[1]。这种方法主要采用红外线测量器, 红外线测量器主要由红外线发射器组和红外线接受器组组成, 发射和接受一一对应, 分别垂直得竖立在收费车道的两旁 (见图1) 。它发出几十束平行的红外线光栅 (光栅间隔不大于38 mm) , 凡是有车辆经过。就会遮挡部分的光束, 从而。就得到汽车的几个主要参数的数据。
对汽车进行大致地分为三类:客车、轿车和货车。提取的特征为顶棚长度和车辆长度的比值, 叫做顶长比;顶棚长度和车辆高度的比值, 叫做顶高比;以顶棚中垂线为界, 前后两部分的比值, 叫做前后。比将提取的特征作为网络的输入向量p={p1, p2, p3}, 其中p1为顶长比, p2 为顶高比, p3为前后比。将车型编码作为网络的期望输出向量T={t1, t2, t3}。所以输入层和输出层的单元数都是3, 而隐层单元数由RBF神经网络确定[2]。
2 RBF神经网络的训练过程
RBF网络的理论基础是函数逼近, 它用一个前向的网络去逼近任意的函数, 网络的输入的数目等效于所研究问题的独立的变量数目, 在这里提取的车型特征顶长比、顶高比、前后比就是作为网络的输入向量X={x1, x2, x3}。中间层与输入层完全连接 (权值=1) , 中间层接点选取基函数作为转移函数, 其中包括一个称为中心的参数向量;结点计算输入向量与中心的欧氏距离, 然后通过转移函数进行变换。输出层的结点是线性组合器, 第j个输出结点的输出为
yj (W, x) =∑WijΦi (‖x-Ch‖, ρh) 。
式中, ‖·‖表示欧氏范数;Ch表示RBF中心;ρh表示宽度, 是一个正数。本文中选择的基函数是高斯函数:
Φ (x, ρ) =exp[- (x-Ch) 2/ρ2]。
RBF网络有两个可调的参数:中心Ch和权值W。调整Ch和W是用k均值聚类方法实时调整中心, 并同时调整权值。
3.1 中心调整算法 (k均值聚类算法)
中心调整算法以聚类最小距离为指标, 将输入数据集分解成k类, 给出k个中心。步骤如下:
(1) 随机选择初始中心Ch (0) , 1≤h≤H, 给出初始学习率α (0) 。
(2) 计算第k步的最小距离
lh (k) =‖x (k) -Ch (k-1) ‖;1≤h≤H。
(3) 求最小距离的结点q
q=arg[minlh (k) , 1≤h≤H]。
(4) 更新中心
Ch (k) =Ch (k-1) ;1≤h≤H, h≠q
Cq (k) =Cq (k-1) +α (k) [x (k) -Cq (k-1) ]。
(5) 重新计算第q结点的距离
(6) 修正学习率
式中Int[ ] 表示取整数。
(7) k=k+1, 返回 (2) 。
2.2 权值的更新算法
输出层的每一个结点或线性组合器是一个权值估计器, 用最小二乘法或其它方法求出。
将权值看作状态向量
Wj (k) =[W1j (k) , W2j (k) , …, Wmj (k) ]T, 1≤j≤m。
设在第k步时中间层的输出向量为
Φ (k) =[Φ1 (k) , …ΦH (k) ]T=[Φ1 (l1 (k) , ρ) , …, ΦH (lH (k) , ρ) ]T。
第k步第j个估计输出为
如实际输出为yj (k) , 则误差为
根据递推最小二乘法, 权值 (状态参数) 的更新如下:
Wj (k+1) =Wj (k) +P (k) Φ (k) ·εj (k) ];
式中, P为误差方差阵, λ为遗忘因子。
3 实验过程
在实验过程中, 采集了三类车型的36对样本, 其中每类车12对样本 (包括多种型号) , 每类车取8对样本进行学习, 另外4对样本用于测试。
(1) 将学习样本P入, 建立网络;
(2) 给定期望输出T;
(3) 仿真。
样本数据、网络期望输出及训练后的网络的实际输出见表1。
4 结论
RBF神经网络适应于样本量比较少的情况, 具有输出-权值线性关系, 同时训练方法快速易行, 不存在局部最小解问题。这些特点均适合来解决车型分类的问题。从表中我们可以看到神经网络的实际输出最大的误差为0.172 (此样本与其他的样本的差值比较大) , 但识别率达到了100%, 这说明当样本的范围比较大的时候仍然可以识别。特别是当测试样本是训练样本的时候, 输出误差小于10-4, 这也是RBF神经网络的一个很突出的优点。本文提出的用RBF神经网络来进行车型分类的方法是一种实用的学习方法, 可以作为不停车收费系统车型识别的参考方法。
参考文献
[1]刘伟铭, 王哲人, 郑西涛.高速公路收费系统理论与方法.北京:人民交通出版社, 2000
[2]飞思科技产品研发中心.MATLAB6.5辅助神经网络分析与设计.北京:电子工业出版社, 2003.
车型识别技术 篇7
高速公路收费系统是智能交通系统 (ITS) 的重要组成部分, 而车型识别不仅是高速公路收费系统的核心内容, 也是进行道路交通流统计、城市交通管理、通行能力调查的重要前提。现有的车型识别方法比较多, 感应线圈以其成本低、性能稳定、精确度较高及在全天候工作稳定性方面有着视频等检测系统无法比拟的优势这些优点, 是目前国内外普遍采用的车型识别检测器[1]。感应线圈是一种基于电磁感应原理的车辆检测器。根据LC振荡电路的原理, 车辆经过感应线圈时会产生频率变化的曲线, 不同车型由于车辆底盘结构、高度等因素的差异使得产生的曲线不同, 这就为车型识别提供了依据[2]。随着国内外模式识别技术的不断发展, 感应线圈车型识别检测器的研究者已相继提出了很多新方法。如柴旭东、张智勇[3]等把神经网络技术应用到车型识别中;刘玉铭[4]、谢宇[5]等则提出车型识别的模糊模式识别方法;李文勇[6]等提出了基于最小二乘支持向量机的车型识别算法。这些方法各具优点和不足, 本文从计算速度和学习训练时间两方面提出了一种基于K均值聚类与Bayesian分类器的车型识别方法, 实验证明了该方法简单而且快速有效。
1 车型识别流程及算法
1.1 方法流程
车型识别的算法流程图见图1。感应线圈采集的频率变化曲线经过数字滤波处理后, 采用K均值聚类算法对波形中的特征值[7] (波峰极大值、峰值位置、平均值、波峰数) 进行聚类, 特征值归类后作为Bayesian分类器算法的输入特征向量, 由Bayesian分类器算法可获得分类器, 从而进行车型识别。其中K均值聚类的特征提取和Bayesian分类器的模式识别算法两部分是本文的重点。
特征向量是车型识别的依据所在, 输入特征向量由感应线圈曲线的特征值组成, 可表示为x={波峰极大值 峰值位置 平均值 波峰数}, 特征向量里每个特征值即对应于K均值算法里面的属性[8], K均值算法就是把每个属性取值聚类, 以此为Bayesian分类器算法做好准备。学习训练过程中的方法步骤如下。
步骤1。提取由感应线圈采集到的频率变化波形的特征值 (波峰极大值, 峰值位置, 平均值, 波峰数) 。
步骤2。对每个属性 (如波峰极大值) 的不同取值采用K均值聚类算法进行聚类。
步骤3。将上一步每个属性的聚类结果 (分为多个类) , 作为Bayesian分类器每个属性的不同取值, 根据Bayesian分类器算法得出车型识别的规律, 工作中便以该规律去识别车型。
1.2 基于K均值算法对特征值进行聚类
在同一类中, 数据对象是相似的, 不同类之间的对象是不相似的。聚类是一种无监督分类, 即没有预定义的类。它既可以作为一个独立的工具透视数据分布, 也可以作为其他算法的预处理步骤[8], 本文将其作为Bayesian分类器算法的预处理步骤。
对于同一个感应线圈检测器, 在车型识别的特征值中, 波峰极大值、峰值位置、平均值、波峰数对于同型车具有相似性, 可以归为同一类。以波峰极大值为例, 在学习训练中, 把大量感应线圈采集不同车型曲线的波峰极大值进行归类。假设有四种车型1型、2型、3型、4型, 在模式识别中对应于波峰极大值分别为较高、高、中、低, 这可以根据K均值算法的步骤对波峰极大值进行归类。
1) 选定几个初始分类, 然后用迭代算法找出使准则函数取极值的最好聚类结果。对于假定4种车型的模式识别, 可归为4类, 初始类 (聚类中心) 分别为Y1, Y2, Y3, Y4。
2) 选定大小距离度量作为样本间的相似性度量;地感线圈采集到的大量波峰极大值组成了从小到大分散的值, 这时必须把这些值离散归类化为4个类, 较高、高、中、低。以各值的大小距离作为相似性度量, 使得算法的收敛速度加快。
3) 以均方差作为评价聚类结果的准则函数;在车型识别模型中, 学习训练过程中采集过来的波峰极大值, 可根据各个值与初始类 (聚类中心) 的距离进行分类, 假定有N个样本, 聚为4类后为{Xi+1, Xi+2, …, Xi+i}, {Xj+1, Xj+2, …, Xj+j}, {Xk+1, Xk+2, …, Xk+k}, {Xs+1, Xs+2, …, Xs+s} (N=i+j+k+s) , 处理的结果是找到一组聚类中心Yi, Yj, Yk, Ys, 使得均方差最小, 即式 (1) 的结果αt最小:
4) 通过用迭代算法找出使均方差最小后, 波峰极大值归类完成, 这时的波峰极大值是离散的。同理, 峰值位置、平均值、波峰数都可以用同种方法归类, 为接下来Bayesian分类器算法做准备。
1.3 Bayesian分类器车型识别算法
用Ai表示第i个属性, C表示决策属性;aik表示第i个属性的第k个取值, cj表示第j类;加上绝对值则表示相应的个数, 如|Ai|表示第i个属性的取值个数;|cj|表示第j类样例个数。
Ω={A1×A2×…×Am}, 是由所有未知类别的可能样本组成的集合;Ωc={A1×A2×…×Am×C}是由所有已知类别的样本组成的集合。D⊆Ωc是训练样例集合。
Ω中的元素x表示为x = <a1, a2, …, am>。Ωc中的元素x表示为x=<a1, a2, …, am, cj>。式中:ai为第i个属性的某个取值。
设x∈Ω是一个类别未知的数据样本, cj为某个类别, 若数据样本x属于一个特定的类别cj, 那么分类问题就是决定P (cj|x) , 即在获得数据样本x时, 确定x的最佳分类。所谓最佳分类, 一种办法是把它定义为在给定数据集D中不同类别cj先验概率的条件下最可能 (most probable) 分类。Bayesian公式
式中:P (cj) 为先验概率, 即某个类的已知概率, 通常可以用样例中属性cj的样例数|cj|比上总样例数|D|来近似
P (x|cj) 为联合概率, 是指当已知类别为cj的条件下, 看到样本x出现的概率。x=<a1, a2, …, am>, 则P (x|cj) =P (a1, a2, …, am|cj) 。P (cj|x) 为后验概率, 是我们所感兴趣的, 即给定数据样本x时cj成立的概率。
Bayesian分类器的实现。设x=<a1, a2, …, am>, 为一个有m个属性的样例, 其最大后验概率为
式中:j∈ (1, |C|) 。朴素贝叶斯分类器基于一个简单的假定:在给定目标时属性值之间是相互条件独立的。也就是说在给定实例的目标值情况下, 观察到联合的a1, a2, …, am的概率正好是对每个单独属性的概率乘积。
把式 (5) 代入式 (4) 可以得到朴素贝叶斯计算公式
式中:CNB为朴素贝叶斯分类器输出的目标值。总之, 贝叶斯学习方法需要估计不同的P (cj) 和P (ai|cj) 项, 也就是它们在学习训练数据上的频率。然后用式 (6) 来分类新实例。
在学习训练中, 车辆检测器采集过来的波形, 经过特征提取, 得到了波峰极大值、峰值位置、平均值、波峰数这些特征值, 通过K均值聚类把特征值归类。特征值就相当于属性, 一个特征值的不同类就是该属性的不同取值, 车辆类型便对应于决策属性。这样, 通过学习训练得到了车型识别的贝叶斯分类器, 工作中就以该分类器进行车型识别。
2 算例及讨论
学习训练过程中, 以波峰极大值为例, 以某个线圈采集到的波峰极大值vp={375 360 350 310 300 280 290 296 295 325 306 304 302 340 360 363 324 333 250 210 230 222 231 205 240 233 210 240 262 246 235 213 210 201 200 233 244 211 97 87 92 86 83 100 103 96 99 94 86 87 93 90 95 84 89 99 63 60 75 74 65 68 69 64 68 72 70 71 76 65 62 67 79 76 74 67 140 135 138 165 150 143 122 111 109 132 126 156 140 165 150 176 180 152 143 166 }, 对应5类车型, 分别为小型客车、大型客车、小型货车、大型货车、拖挂车, 通过K均值聚类算法进行聚类后, 5个聚类中心分别为:352.25、226.30、69.25、148.83、93.18。均方差总和达到最优的曲线见图2。
贝叶斯分类器的输入特征向量为x={波峰极大值 峰值位置 平均值 波峰数}。实验得到了5种典型车型的波形图, 见图3。
以这5种车型波形中的波峰极大值为例, 该属性经过K均值聚类, 聚为五类后分别对应于较高、高、中、低、较低;对于波峰数归类结果为较多、多、少;同理, 平均值、波峰位置同样进行聚类。聚类结果作为Bayesian分类器中对应属性的不同取值。例如从某感应线圈检测器采集到的样本数据中, 选取了小型客车x1这一种典型的车型, 根据采集过来的频率变化值, 画出曲线, 见图4。
该车型聚类后对应的特征向量x1={较高 中 较大 少}。同理, 对于其他车型也可以求得对应的特征向量, 这些特征向量作为Bayesian分类器的输入向量, 再根据Bayesian分类器算法便得到了车型识别规律。
根据以上所述算法, 实验得到了5种典型车型的识别结果, 见表1。
由表3可知, 对于小型货车和大型货车, 识别准确率比较低, 这个是由于2种车型的特征向量比较相似, 容易交叉, 识别难度较大, 也反映了我国货车改装现象严重的事实。
3 结束语
信号的处理对于车型识别的准确率有很大的影响。本文通过对感应线圈采集数据进行数字滤波, 再采用K均值聚类算法归类, 达到对特征值的提取和离散化, 增强了特征值的分类辨别能力。特征值的归类结果为接下来的Bayesian分类器算法提供了输入向量, 而Bayesian分类器算法实现简单, 运算量少, 加快了车型识别速度, 提高了车型识别的可靠性。车型识别实验也验证了该方法的可行性和可靠性。当然, 本文提出的方法还需要进一步完善, 接下来的研究内容有:如何解决不同车型特征向量交叉问题;如何改善属性聚类能进一步提高车型识别准确率。
摘要:不同车型经过感应线圈时, 线圈检测器采集过来信号变化的波形不同, 同类车型对应采集的波形中如波峰极大值、峰值位置、平均值、波峰数等特征值都具有相似性。根据感应线圈采集所得信号的特点, 讨论了一种基于K均值聚类与Bayesian分类器的车型识别方法。学习训练中, 通过K均值聚类算法把不同波形的特征值归类, 再采用Bayesian分类器算法去获得分类器。实验结果表明, 该方法具有较高的车型识别精度。
关键词:感应线圈,K均值聚类,Bayesian分类器,车型识别
参考文献
[1]Ki Y K, Baik D K.Vehicle classification algorithmfor single-loop detectors using neural networks[J].IEEE Transactions on Vehicular Technology, 2006, 55 (6) :1705-1711.
[2]林培群, 徐建闽.感应线圈信号曲线的处理方法及其在车型识别中的应用[J].公路交通科技, 2009, 26 (2) :108-113.
[3]柴旭东, 张智勇.一种应用神经网络技术的车型识别仪[J].计算机自动测量与控制, 1999, 7 (4) :53-55.
[4]刘玉铭, 白明.一种基于模糊模式识别方法的车型识别仪[J].公路交通科技, 2000, 17 (1) :63-65.
[5]谢宇, 康景利, 董巍, 等.智能交通系统中车型分类的模糊模式识别方法[J].北京理工大学学报, 1999, 19 (2) :1570-1574.
[6]李文勇, 陶汉卿.基于最小二乘支持向量机的车型识别算法研究[J].公路交通科技, 2010, 27 (1) :101-105.
[7]Lin Peiqun, Xu Jianmin.Adaptive vehicle classifica-tion based on information gain and multi-branch bpneural networks[C]∥Proceeding of The SixthWorld Congress on Intelligent Control and Automa-tion.Dalian:IEEE Press, 2006:8687-8691.