车型分类论文(精选4篇)
车型分类论文 篇1
1 引言
近年来随着我国经济的迅猛发展,我国的车辆保有数目更是呈现几何级的增长,车辆种类也日趋多样化。为了方便各部门对车辆及交通的管理,及时获得各种交通信息,保证交通通畅,智能交通逐渐成为了研究的热点。交通流检测系统以其安装简单,成本较低,检测范围大和信息丰富等特点在智能交通系统中得到了广泛应用[1]。近年来,检测系统的研究取得了诸多成果,但车型的准确分类一直是智能交通系统中的难点问题。
当前具有车型分类功能的检测器主要包括:电磁感应检测器、压力传感器、超声波检测器以及视频检测器等。但是以上大部分的检测器在实际应用中,还是存在着诸多问题。由于利用压力传感器、感应线圈和超声波方法的系统与特定分类标准息息相关,因此系统的缺点是可移植性差。不仅如此,这些系统需要对路面进行重新铺设,安装不方便,缺乏灵活性,而且由于设备工作环境恶劣,系统的寿命受到了限制。与其他类型的检测器相比,视频检测器具有安装简单、维修方便、投资成本低以及可获信息多等诸多优点,目前已成为智能交通系统研究的热点[2]。当今基于视频的车型分类方法主要有两种:一种方法是直接利用车辆的轮廓或像素的空域分布特征进行分类;另一种方法是从待识别的车辆图像中抽取能够描述该类型的车辆又能区别于其它类型车辆的特征。相比较这两种方法,由于第一种方法算法复杂耗时,不能满足系统实时性的要求,因此在实际应用中,主要采用第二种方法。
本文首先对采集到的图像进行了处理以获取车辆的特征信息,然后综合利用支持向量机(SVM)、聚类分析和BP神经网络,采用投票机制对采集到的车辆进行了分类。
2 车辆特征提取
车辆特征提取是车型分类的基础,它是车型分类成功与否的决定因素。在本文中,对采集到的图像先进性预处理,然后提取其几何特征和不变矩特征作为车型分类的特征输入。根据现实中的应用,本文将车辆分为小型车、中型车和大型车3类。
当一副图像被分割或确定之后,通常希望用一系列符号或某种规则来具体地描述该图像的特征,以便在进一步的识别、分析或分类中有利于区分不同性质的图像,同时也可以减少图像区域中的原始数据量[3]。一般这些表征图像特征的一系列符号被称作描绘子,这些描绘子的特点是它们对图像的大小、旋转和平移变化不敏感。
如果一个区域以内部点的形式给出,那么可以用矩描绘子来描述,它对图像的变换、旋转和大小变化都是恒定的。
设f(x,y)是一个二维函数,可用下式来表示(p+q)阶矩
式中,p,q=0,1,2…。
对于数字图像来说,中心矩由下式表示
由以上各式可得到三阶中心矩如下
利用第二阶和第三阶矩可导出7个不变矩组:
车辆的几何特征包括车辆的长度和高度,由于在图形中很难精确地表示出车辆的实际长度和高度,因此采用了车辆图像的像素区域的长度和高度之比作为车辆的几何特征。
3 车辆分类器的设计
神经网络常用于两类问题:分类和回归。它以具有自学习功能、联想存储功能和高速寻找优化解的优点得到了研究人员的青睐,它的进一步发展更是使得它得到了广泛的应用。聚类分析是数据挖掘中一个很活跃的领域,人们对其的研究也产生了很多聚类算法并且在实际应用中也得到了较好的效果。支持向量机(SVM)是在统计学习理论的基础上发展起来的,相对于以经验风险最小化为原理的传统的统计学习理论,SVM的原理则是结构风险最小化。SVM表现出了很多优于已有方法的性能,迅速引起了各领域的注意和研究兴趣,取得了大量的应用研究成功,并推动了各领域的发展[4]。
3.1 BP神经网络
1986年由Rumelhart和McCelland为首的科学家小组提出的BP神经网络,是一种多层前馈网络,它按误差逆传播算法进行训练,是当前应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入—输出模式映射关系,而无事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层、隐藏层和输出层。
本文设计的网络分类器是一个三层的前馈网络,它的结构为:输入层有n=8个节点,代表输入的8个车辆特征;隐含层有p=4个节点;输出层有q=3个节点,代表3种车辆类型。隐含层和输出层的激活函数采用Sigmoid函数。训练结束后,当输出层的第i个节点的输出值大于0.95而其它节点的输出值小于0.05时,就可以认为该待识别的车辆属于第i种车型。
记输入向量为hi,隐含层输出向量为ho,输出层输入向量为yi,输出层输出向量为yo,期望输出向量为do,输入层与隐含层的连接权值win,隐含层与输出层的连接权值win,隐含层各神经元的阈值who,输出层各神经元的阈值bo,样本数据个数为k=1,2,…,m,激活函数f(·),误差函数为式(6)。
则BP网络算法的步骤如下:
(1)网络初始化
给各连接权值分别赋一个区间(-1,1)内的随机数,设定误差函数e,给定计算精度值和最大学习次数M。
(2)随机选取第k个输入样本及对应期望输出
(3)计算隐含层各神经元的输入和输出
(4)记误差函数对输出层的各神经元的偏导数为修正连接权值who(k)
其中η为学习率。
(5)记误差函数对隐含层各神经元的偏导数为修正连接权值wih(k)
(6)计算全局误差
(7)判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。否则,选取下一个学习样本及对应的期望输出,返回到第三步,进入下一轮学习。
3.2 聚类
聚类分析是一种数据划分或分组处理的重要手段和方法。其操作的目的在于将特征空间中一组没有类别标记的矢量按照某种相似性准则划分到若干个子集中,使得每个子集代表整个样本集的某个或者某些特征和性质。从这个意义上讲,聚类又称为无监督的分类[5]。
J.B.Mac Queen在1967年提出的K-均值聚类算法是到目前为止用于科学和工业应用的诸多算法中一种极有影响力的技术[6]。此算法首先随即选取k个点作为初始的聚类中心,之后计算每个数据对象与各个聚类中心的距离,并且把数据对象分别归类到离它最近的那个聚类中心所在的类;最后计算新调整的类的聚类中心,若聚类准则已经收敛或达到预定条件,分类过程结束。
记簇的数目为k=3,代表车的类型,输入样本数目为n,则K-均值聚类的算法步骤如下:
(1)随机选择k个对象,作为初始的聚类中心Ci,i=1,2,…,k;
(2)选择一个对象x,计算此对象x到各聚类中心的欧氏距离
并把对象x归类到距离最小的那个簇中;
(3)计算每个簇中的平均值,即更新每个簇
(4)计算准则函数
(5)若E无明显变化或者已达到某种条件则结束,否则转回第二步
3.3 支持向量机
支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高位空间,在这个空间中求(广义)最优分类面[7]。对分类线方程进行归一化,即对线性可分的样本集满足
满足上述条件并且使得达到最小的分类面就是最优分类面。此最优分类面可以利用Lagrange优化方法转化为其对偶问题,即在约束条件下对ia求解下列函数的最大值
其中,ai是Lagrange乘子。解此问题得到的最优分类函数是
其中,b*是阈值,可用任意一个支持向量解得。
对非线性问题,可用内积函数转化为高维空间中的线性问题,此时分类函数为
在本文中,选择的内积函数为高斯径向核,即
其中,σ为高斯分布的宽度。
以上多种分类方法已经到了大家的广泛认可,但是由于这些方法的精度不是太高,还不能够广泛的应用到实际中去,使得其没有发挥出应有的效果。如果能够综合利用以上各种方法,使得各类方法能够同时对同一待识别车辆图像进行分类,然后对各自结果同一分析,那么它的精度会不会能够提高很多呢?理论上分析得到,若以上各种方法的精度能够达到或超过某一特定值,则结果是肯定的。这就是本文所讲的投票机制,即各类分类方法对同一待识别车辆图像进行分类,最后对结果进行投票,得票多的为最终结果。
4 结论和实验
实验结果如表1所示。该实验表明,本文的综合利用多种识别方法,能够极大的提高车型分类的识别率。
摘要:随着智能交通的迅猛发展,车型分类技术正得到越来越多的关注。时至今天,已有很多理论和方法为解决车型分类难题扫清了障碍,但是由于精度不是太高,还不能广泛的应用到实际中去。本文综合利用了多种分类计数,采取了投票法的机制,提高了车型分类技术的性能。实验结果表明,该方法使得车型分类技术的精度提高了高达10个百分点。
关键词:车型分类,投票法,智能交通,神经网络,聚类,支持向量机
参考文献
[1]龚文凌,王洪澄,孙敏.视频交通监控系统中运动车辆捕捉算法的研究[J].微型机与应用,2004,3(5):45-46
[2]H Moon,R Chellappa,A Rosenfeld.Performance Analysis of a Simple Vehicle Detection Algorithm[J].Image and Vision Computing,2002,20(1):1-13
[3]阮秋琦.数字图像处理学[M].北京:电子工业出版社,2007:391-395
[4]祁享年.支持向量机及其应用研究综述[J].计算机工程,2004,30(10):6-9
[5]谢维信,高新波,裴继红.模糊聚类理论及其应用[J].中国提示学与图像分析,1996,4(2):113-119
[6]吴晓蓉.K-均值聚类算法初始化中心选取相关问题的研究[C]:(硕士学位论文).长沙:湖南大学,2008
[7]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42
车型分类论文 篇2
车型识别技术应用广泛, 在道路通行车辆信息录,停车场安全管理,电子警察监控,肇事、嫌疑、被车辆的追踪和定位,高速公路自动收费[1]等领域尤其要。目前的研究可以分为两类:第一类是利用压电、 外、环形磁感应线圈等传感器获得车辆本身的参数, 类方法跟踪识别率虽高, 但缺点也非常明显: 施工和装过程比较复杂, 影响正常交通秩序, 主要设备容易坏,维护困难,花费较高等;另一类就是采用的基于图处理的方法[2],检测范围广,设备维护方便,低耗,图像供信息方便, 可视性高。
图像目标识别的关键是特征提取, 可采用尺度不变特征[3]、角点特征[4],矩特征[5]、边缘轮廓特征[6]等方法。 文献中车辆分类计算复杂,耗时较多,并且无法对客车与货车,轿车与SUV进行区分。形状是图像的一个重要特征,人们常常通过形状去识别理解物体,进而分类分级。 车辆种类繁多,样式多样。按用途分为:小轿车、SUV、面包车、皮卡、客车、货车。首先设计了车型识别系统, 然后介绍了分类中的关键算法并给出了实验结果。
2链码技术的应用
2.1链码技术
链码是对线宽为一个像素的细线的轨迹进行描述的编码,链码方法是对轮廓边界坐标序列进行方向编码的方法。顶点链码法用方形点阵的八近邻顶点链码来处理二值图像, 与其他方法相比, 链码表示法可大幅度减少数据,且有利于减少存储空间和提高图像处理速度和匹配效率。一条边界曲线可以由曲线的起始点和该曲线的链码唯一确定。
2.2边界跟踪与链码抽取
车辆轮廓提取得到一条封闭曲线,可视为单连通区域。在跟踪区域边界的同时, 采用顶点链码进项编码。 按逆时针方向沿边界顶点扫描,当前顶点的方向码是到下一顶点的走向,定义为0(0度),1(90度),2(180度),3(270度)。按照几何性质的不同,边界像素顶点可用1,2,3三种代码标记,这就是顶点链码,如图2所示
图像边界 行走方向 为{(x0,y0)b0b1b2bi}, bi{0,1,2,3}。按照表1转换得到边界顶点链码序列, 表示为{(x0,y0)c0c1c2cn},(x0, y0) 为起始顶点坐标, ci{1,2,3}为边界像素顶点链码值。边界码到顶点链码的转化如下表所示:
通常将链码放在一维数组中。它的第一,第二单元存放边界起点的X,Y坐标,第三单元放链码的个数N, 第四单元开始存放链码序列。在图3中,图像为一闭合区域,设P点为边界跟踪起始点,方向码{(0,1)3,0,3,0, 0,1,0,1,2,1,2,2,3,2},利用卡尔曼坐标体系,坐标{(0, 1),(0,2),(1,2),(1,3),(2,3),(3,3),(3,2),(4,2),(4,1),(3, 1),(3,0),(2,0),(1,0),(1,1)}。
3图像特征提取
不同的车型有不同的特征, 特征的数学描述越准确, 图像丢失的信息越少, 在同样的分类器条件下分类效果越好。适合的特征应具有以下四个特点:1数量少; 2独立性;3可靠性;4可区别性。
当车辆驶入收费站入口时,触发埋设在固定位置的传感器。控制CCD摄像头和图像采集卡对运动车辆的侧面进行图像帧摄取。
为了提高运动目标检测的精度, 综合时间差分法和背景差分法两者的优点, 利用迭代均值背景差分和三侦间时间差分相融合的运动目标检测方法[7]提取目标区域。
第一步对交通视频序列,利用迭代均值背景模型法建立背景模型,将当前帧图像与得到的迭代均值背景模型做差分处理,得到一个运动车辆检测区域A ;
第二步, 对第一步使用的当前帧图像, 运用三帧时间差分法对相邻帧进行差分处理,获得另一个运动车辆检测区域B;
第三步将第一步得到的检测结果A和第二步得到的检测结果B进行或运算,得到一个综合的检测结果;
第四步做连通域分析,排除非车辆目标对检测结果的影响;
第五步对第四步得到的检测图像进行预处理,主要方法有:二值化、膨胀、腐蚀。对所得图像进行轮廓提取得一条封闭曲线,然后运用链码技术对所得图像进行边界跟踪与链码抽取,得到边界坐标。数字图像是一个个像素的组合, 每个像素的长宽测量单位都为1 。
3.1长、宽、矩形度
最小外接矩形表征车辆的长和宽,为了减小算法的复杂度,本文采用主轴法:对于任何一个目标区域而言, 惯性主轴是唯一的且不会有精度偏差。此外,最小外接矩形只与目标区域的凸点相关, 而顶点链码中码值为1的点正好是凸点,所以在计算外接矩形时只需计算坐标链中对应的顶点链码值为1的点。其中边界线上横坐标值最大的点为(x1, y1) ,值最小的点为(x2, y2) 。纵坐标值最大的点为(x3, y3) ,最小值的点为(x4, y4) 。
(1) 车长(Length):L (x1x2) ,车宽(Width):W (y3y4)
链码序列绕轮廓一周, 重新回到起始点, 位移为0 。Ni为方向码为i的个数, i(0,1,2,3) 。水平位移N0N20 ,垂直位移N1N30 。视目标区域即为n个横条组成n N1N3,目标区域面积为各横条所包含像素个数的和。垂直方向bi1或bi3 ,横条像素个数为横条上边界方向码为1和3所对应横坐标之差。目标区域视为竖条方法类似。
首先判断方向链码中水平方向和垂直方向的点的个数,选择点数小的方向为积分方向,对于图2,水平方向有8个点(方向码值为0或2),垂直方向的点有6个(方向码值为1或3)以水平方向为例:S=2+4+2=8
(2) 矩形度(Rectangularity):为目标区域与矩形的偏离度: R S/ (LW) 。
3.2拐点的提取与应用
曲线的拐角点是指线上曲率变化足够大的点,本文采用一种基于顶点链码描述曲线的拐点检测方法。车辆轮廓是一凸多边形,拐点为链码为1或3的点。用链码判断拐点,分辨率越低,拐点越少,越容易提取。
选用200万像素,72像素每英寸的CCD摄像头拍摄。 从起始点开始,链码表中连续出现5个ci值为2的首尾两点作为标记点,标记点为di,两标记点之间顶点链码值为偶数值的个数记为M,奇数值个数记为N。标记点是否是拐点, 由标记点与上一拐点和下一标记点间顶点链码奇、偶个数判断。标记点为拐点的五种判定方法如下:
标记点与上一拐点之间M>30,到下一标记点N>30
标记点与上一拐点之间N>30,到下一标记点M>30
标记点与上一拐点之间N>30,到下一标记点N>30
标记点与上一拐点之间M>30,或N>30,并且到下一标记点N为奇数(变向)
判断方4后下一标记点与上一拐点间N>5也设为拐点
离地间隙(Ground clearance) :底盘到地面距离,卡尔曼坐标体系中,纵坐标最大的拐点f与下一拐点纵坐标之差,g(yfyf1)。
综上诉述,得到用svm的四个特征向量:长、高、矩形度、离地间隙。
4构建支持向量机分类器
4.1支持向量机
支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以期获得最好的泛化能力[8,9],避免了神经网络算法[10]存在的计算量大,不可解释,训练时间长等缺点。
最初的SVM是作为二分类模型出现的,而实际中的应用一般为多分类问题。应对方法有两种:一是用一个优化公式将子分类器的参数优化问题一次性求解,此方法因需要优化太多参数导致计算量较大, 精度略差, 实际应用中较少采用;二是组合成多分类器,按不同的组合方式分为:一对一、一对多、有向无环图和二叉树等。 前两种算法训练、测试速度慢, 存在不可分区域, 泛化能力差, 而有向无环图结构不稳定。为克服此类问题, 综合考虑分类速度和分类精度,本文采二叉树结构多分类支持向量机。
车型识别用二叉树分类方法的主要构思是:首先将k种(六种)车型分成两个子类,之后把这两个子类分别划分为两个次子类, 持续划分, 直到所有节点只有一种车型。利用二值svm分类函数在k-1层节点处划分车辆, 就解决了此多分类问题。对于分割顺序采用文献[11]所述, 通过类间样本距离与类内样本分布, 分别将距离最远的类和分布最广的类优先分离出来。
设支持向量为四维向量xi,i (1,2,3,4),对应的期望输出yi{1, 1 }。支持向量机对线性不可分数据的目标函数为:
其中C>0,它控制对错分样本的惩罚程度,C越大表示对错误惩罚的越重,得到的分类面间隔越小,代表松弛变量是训练集中错分样本的上界, w为权值,约束条件为:
其中,b为分类阀值。为了解决这个约束最优化问题,式(3)的拉格朗日对偶形式为:
其中aj,xj,yj分别为ai,xi,yi的对偶形式。
求解上述问题得到的分类决策函数为:
其中ai0、b0为求解式(2)、式(3)的最优解; x为训练样本;K(xi,x)为核函数。
SVM的核函数选取Gauss径向基核函数,即:
其中σ为径向基宽度。
4.2交叉验证法
SVM作分类预测时需要调节相关的参数(主要是惩罚参数C和核函数参数 )才能得到比较理想的预测分类准确率。本文采用交叉验证(Cross Validation)的方法得到最优的参数,有效地避免了过学习和欠学习状态的发生,使得最终对于测试集合的预测得到较理想的准确率。CV是用来验证分类器性能的一种统计方法,基本思想是把将原始数据进行分组, 一部分做为训练集, 另一部分做为验证集。方式是首先用训练集对分类器进行训练, 再利用验证集来测试训练得到的模型, 以得到的分类准确率做为评价分类器的性能指标。
交叉验证的主要步骤为:
原始数据被分成K组(均分),将每个子集数据分别做一次验证集,同时其余的K - 1组子集数据作为训练集,这样会得到K个模型,这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。分类流程图如图4所示。
4.3SVM分类结果分析
本文选取了100个样本,每个样本含四个特征向量。 50%为作为训练集,另外50%为测试集。用训练集对SVM进行训练可以得到分类模型,再用得到的模型对测试集进行类别标签预测。样本的特征分量分布是线性不可分的,由于特征选择得当,并没有出现离群点,需要一个分隔超平面进行分隔。分类准确率为94%,一辆SUV离地间隙较小误判为小轿车,一辆货车和客车长度较小误判为面包车,结果如图5所示。为了选择最佳的分类器参数,通过交叉验证算法进行迭代计算,准确率为98%,分类的准确度得到提高,结果如图6所示。
5结束语
车型分类论文 篇3
车辆声频信号因不同车型的声源特点及结构特征的差异而具有一定的辨识性, 分析车辆声频信号的产生原理, 并选择最具辨识性的特征参数用于车辆的自动分类与识别可与其他手段结合以提高效率及准确率, 更可在特定场合发挥作用。在分析车辆声频信号产生的原理及特点的基础上, 为其建立经典的线性模型, 通过分析比较其各个特征参数, 选取基于线性预测编码 (LPC) 的LPCC倒谱系数作为车辆声频信号的特征参数, 对所采集的四类车辆的声频信号进行分析, 采用聚类分析和判别分析等数据分析方法实现车型的自动分类识别。
2 车辆声频信号模型
车辆声频信号产生于发动机等多个振动源激励连接件, 并主要由车体发出, 可以认为是声源信号经过一个系统产生的输出。如果各声源信号满足加性组合的特征, 则车辆声频信号可以看作是一个信号经过一个线性时不变系统后所得到的输出信号。因此, 车辆声频信号可表示为:
其中, h (n) 为系统的冲激响应, w (n) 为声源信号。
由于信号本身的复杂性及不同车型在结构上的差异性, 在选取车辆声频信号特征时应主要由其系统冲击响应入手。对于系统H (z) , 全极点模型为:
可以用输入输出的差分方程表示为:
其中, {Xt}为一随机过程, {Wt}为一均值为0, 方差为σw2的白噪声过程。
3 车辆声频信号的LPCC倒谱特征
3.1 全极点模型的参数估计
全极点模型的相关矩估计的方法是利用样值序列x1, x2…xN的自协方差函数或自相关函数来进行参数的估计。这里所采用的全极点模型, 若满足条件N→∞, 可以证明其所得估计是最小方差估计, 也是无偏估计。根据Yule-Walker方程, 可得AR模型参数的Yule-Walker估计[1]为:
对k=1, 2, …p分别建立Yule-Walker方程:
称αk (k) (k=1, 2, …, p) 为部分相关系数, 标记为Kk。公式 (5) 中, αj (k) 为第j个参量经过k次迭代后的参数。αj (k) (k=1, 2, …, k) 从k=1开始逐次递推求得, 直到k=p时得到αp (p) 。递推公式为:
对于K1, K2, …, Kp的计算, 可由格形算法完成, 一种可实现的格形结构流图如图1示:
其中en (k) 为Durbin递推算法中第k次迭代后t时刻xt的预测误差, bn (k) 是n-k时刻的预测误差, 参与预测的是 (n-k) +1, (n-k) +2, …n时刻的样值。图1中em (0) =bm (0) =xm, 即第0次迭代的预测误差就是信号样值本身。
3.2 LPCC倒谱系数
由基于Durbin递推公式的格形算法和部分相关系数的格形算法求出车辆声频信号的线性预测编码LPC系数α1, α2, …, αp后, 求LPCC系数h (1) , h (2) , …, h (m) 的迭代算法[2]如下:
这里, 在进行车辆声频信号特征提取时, 选择n=p=12。
4 车辆自动分类识别流程
在完成车辆声频信号LPCC倒谱特征参数的提取后, 采用判别分析和聚类分析[3]的方法对车辆进行分类与识别。这里采用Fisher判别法的线性分类函数 (线性判别函数) , 线性分类函数的一般形式为:
在进行车型自动分类时, 用K均值聚类的方法对其进行分类, 得到每类的矢心, 而后用Fisher判别法将矢心的参数分别代入各个车型的线性分类函数, 根据判别分数的大小确定此类所属的车型。
5 实验结果及分析
实验选取经采集获得的大型货车、农用车、轿车、中型客车共四种车型的声频信号样本共68个作为原始数据, 首先选取了其中最容易辨识的大型货车、轿车、农用车、中型客车这四种车型的声频信号各8个, 依流程计算其12阶LPCC参数及分类函数系数。之后随机抽取四类车辆声频信号样本各5个, 用K均值聚类算法[4,5]对其进行分类, 并求得每个分类的矢心, 建立Fisher线性判别函数并将矢心代入, 所得判别分数如下表:
从分值结果可得结论为:类属1为农用车, 类属2为中型客车, 类属3为轿车, 类属4为大型货车。
对比聚类结果与实际车型归属, 其结果如表2所示:
在车型数量的统计上, 大型货车和中型客车的结果符合实际情况, 轿车和农用车均仅出现了一辆的偏差, 因此从统计的角度看, 该方法是较为准确的。在车型识别方面, 对大型货车和轿车的车型分类识别比较准确, 准确率都达到了80%。
6 结论
实验结果表明, 将车辆声频信号的LPCC特征参数应用于车辆自动分类与识别, 在交通流量总体统计方面准确率较高, 对大型货车、轿车的识别率也较高, 在智能化交通的车型自动分类与识别中具有一定的参考与实用价值。
摘要:为满足智能化交通的需要, 利用车辆声频信号特征进行车型自动识别, 对车辆声频信号进行建模, 以线性预测编码倒谱 (LPCC) 为特征, 采用聚类分析算法划分车型, 并使用Fisher判别法对车型进行识别。实验结果表明此方法可准确和有效的实现车型的自动分类与识别。
关键词:车辆声频信号,LPCC参数,Fisher判别法,K均值聚类算法
参考文献
[1]汤俊.统计信号处理算法[M].北京:清华大学出版社, 2003:141-154.
[2]黄俊钦.随机信号处理[M].北京:北京航空航天大学出版社, 1990.
[3]吴今培, 孙德山.现代数据分析[M].北京:机械工业出版社, 2006:4-8.
[4]边肇祺, 张学工, 等.模式识别[M].北京:清华大学出版社, 1999.
车型分类论文 篇4
高速公路收费系统是智能交通系统 (ITS) 的重要组成部分, 而车型识别不仅是高速公路收费系统的核心内容, 也是进行道路交通流统计、城市交通管理、通行能力调查的重要前提。现有的车型识别方法比较多, 感应线圈以其成本低、性能稳定、精确度较高及在全天候工作稳定性方面有着视频等检测系统无法比拟的优势这些优点, 是目前国内外普遍采用的车型识别检测器[1]。感应线圈是一种基于电磁感应原理的车辆检测器。根据LC振荡电路的原理, 车辆经过感应线圈时会产生频率变化的曲线, 不同车型由于车辆底盘结构、高度等因素的差异使得产生的曲线不同, 这就为车型识别提供了依据[2]。随着国内外模式识别技术的不断发展, 感应线圈车型识别检测器的研究者已相继提出了很多新方法。如柴旭东、张智勇[3]等把神经网络技术应用到车型识别中;刘玉铭[4]、谢宇[5]等则提出车型识别的模糊模式识别方法;李文勇[6]等提出了基于最小二乘支持向量机的车型识别算法。这些方法各具优点和不足, 本文从计算速度和学习训练时间两方面提出了一种基于K均值聚类与Bayesian分类器的车型识别方法, 实验证明了该方法简单而且快速有效。
1 车型识别流程及算法
1.1 方法流程
车型识别的算法流程图见图1。感应线圈采集的频率变化曲线经过数字滤波处理后, 采用K均值聚类算法对波形中的特征值[7] (波峰极大值、峰值位置、平均值、波峰数) 进行聚类, 特征值归类后作为Bayesian分类器算法的输入特征向量, 由Bayesian分类器算法可获得分类器, 从而进行车型识别。其中K均值聚类的特征提取和Bayesian分类器的模式识别算法两部分是本文的重点。
特征向量是车型识别的依据所在, 输入特征向量由感应线圈曲线的特征值组成, 可表示为x={波峰极大值 峰值位置 平均值 波峰数}, 特征向量里每个特征值即对应于K均值算法里面的属性[8], K均值算法就是把每个属性取值聚类, 以此为Bayesian分类器算法做好准备。学习训练过程中的方法步骤如下。
步骤1。提取由感应线圈采集到的频率变化波形的特征值 (波峰极大值, 峰值位置, 平均值, 波峰数) 。
步骤2。对每个属性 (如波峰极大值) 的不同取值采用K均值聚类算法进行聚类。
步骤3。将上一步每个属性的聚类结果 (分为多个类) , 作为Bayesian分类器每个属性的不同取值, 根据Bayesian分类器算法得出车型识别的规律, 工作中便以该规律去识别车型。
1.2 基于K均值算法对特征值进行聚类
在同一类中, 数据对象是相似的, 不同类之间的对象是不相似的。聚类是一种无监督分类, 即没有预定义的类。它既可以作为一个独立的工具透视数据分布, 也可以作为其他算法的预处理步骤[8], 本文将其作为Bayesian分类器算法的预处理步骤。
对于同一个感应线圈检测器, 在车型识别的特征值中, 波峰极大值、峰值位置、平均值、波峰数对于同型车具有相似性, 可以归为同一类。以波峰极大值为例, 在学习训练中, 把大量感应线圈采集不同车型曲线的波峰极大值进行归类。假设有四种车型1型、2型、3型、4型, 在模式识别中对应于波峰极大值分别为较高、高、中、低, 这可以根据K均值算法的步骤对波峰极大值进行归类。
1) 选定几个初始分类, 然后用迭代算法找出使准则函数取极值的最好聚类结果。对于假定4种车型的模式识别, 可归为4类, 初始类 (聚类中心) 分别为Y1, Y2, Y3, Y4。
2) 选定大小距离度量作为样本间的相似性度量;地感线圈采集到的大量波峰极大值组成了从小到大分散的值, 这时必须把这些值离散归类化为4个类, 较高、高、中、低。以各值的大小距离作为相似性度量, 使得算法的收敛速度加快。
3) 以均方差作为评价聚类结果的准则函数;在车型识别模型中, 学习训练过程中采集过来的波峰极大值, 可根据各个值与初始类 (聚类中心) 的距离进行分类, 假定有N个样本, 聚为4类后为{Xi+1, Xi+2, …, Xi+i}, {Xj+1, Xj+2, …, Xj+j}, {Xk+1, Xk+2, …, Xk+k}, {Xs+1, Xs+2, …, Xs+s} (N=i+j+k+s) , 处理的结果是找到一组聚类中心Yi, Yj, Yk, Ys, 使得均方差最小, 即式 (1) 的结果αt最小:
4) 通过用迭代算法找出使均方差最小后, 波峰极大值归类完成, 这时的波峰极大值是离散的。同理, 峰值位置、平均值、波峰数都可以用同种方法归类, 为接下来Bayesian分类器算法做准备。
1.3 Bayesian分类器车型识别算法
用Ai表示第i个属性, C表示决策属性;aik表示第i个属性的第k个取值, cj表示第j类;加上绝对值则表示相应的个数, 如|Ai|表示第i个属性的取值个数;|cj|表示第j类样例个数。
Ω={A1×A2×…×Am}, 是由所有未知类别的可能样本组成的集合;Ωc={A1×A2×…×Am×C}是由所有已知类别的样本组成的集合。D⊆Ωc是训练样例集合。
Ω中的元素x表示为x = <a1, a2, …, am>。Ωc中的元素x表示为x=<a1, a2, …, am, cj>。式中:ai为第i个属性的某个取值。
设x∈Ω是一个类别未知的数据样本, cj为某个类别, 若数据样本x属于一个特定的类别cj, 那么分类问题就是决定P (cj|x) , 即在获得数据样本x时, 确定x的最佳分类。所谓最佳分类, 一种办法是把它定义为在给定数据集D中不同类别cj先验概率的条件下最可能 (most probable) 分类。Bayesian公式
式中:P (cj) 为先验概率, 即某个类的已知概率, 通常可以用样例中属性cj的样例数|cj|比上总样例数|D|来近似
P (x|cj) 为联合概率, 是指当已知类别为cj的条件下, 看到样本x出现的概率。x=<a1, a2, …, am>, 则P (x|cj) =P (a1, a2, …, am|cj) 。P (cj|x) 为后验概率, 是我们所感兴趣的, 即给定数据样本x时cj成立的概率。
Bayesian分类器的实现。设x=<a1, a2, …, am>, 为一个有m个属性的样例, 其最大后验概率为
式中:j∈ (1, |C|) 。朴素贝叶斯分类器基于一个简单的假定:在给定目标时属性值之间是相互条件独立的。也就是说在给定实例的目标值情况下, 观察到联合的a1, a2, …, am的概率正好是对每个单独属性的概率乘积。
把式 (5) 代入式 (4) 可以得到朴素贝叶斯计算公式
式中:CNB为朴素贝叶斯分类器输出的目标值。总之, 贝叶斯学习方法需要估计不同的P (cj) 和P (ai|cj) 项, 也就是它们在学习训练数据上的频率。然后用式 (6) 来分类新实例。
在学习训练中, 车辆检测器采集过来的波形, 经过特征提取, 得到了波峰极大值、峰值位置、平均值、波峰数这些特征值, 通过K均值聚类把特征值归类。特征值就相当于属性, 一个特征值的不同类就是该属性的不同取值, 车辆类型便对应于决策属性。这样, 通过学习训练得到了车型识别的贝叶斯分类器, 工作中就以该分类器进行车型识别。
2 算例及讨论
学习训练过程中, 以波峰极大值为例, 以某个线圈采集到的波峰极大值vp={375 360 350 310 300 280 290 296 295 325 306 304 302 340 360 363 324 333 250 210 230 222 231 205 240 233 210 240 262 246 235 213 210 201 200 233 244 211 97 87 92 86 83 100 103 96 99 94 86 87 93 90 95 84 89 99 63 60 75 74 65 68 69 64 68 72 70 71 76 65 62 67 79 76 74 67 140 135 138 165 150 143 122 111 109 132 126 156 140 165 150 176 180 152 143 166 }, 对应5类车型, 分别为小型客车、大型客车、小型货车、大型货车、拖挂车, 通过K均值聚类算法进行聚类后, 5个聚类中心分别为:352.25、226.30、69.25、148.83、93.18。均方差总和达到最优的曲线见图2。
贝叶斯分类器的输入特征向量为x={波峰极大值 峰值位置 平均值 波峰数}。实验得到了5种典型车型的波形图, 见图3。
以这5种车型波形中的波峰极大值为例, 该属性经过K均值聚类, 聚为五类后分别对应于较高、高、中、低、较低;对于波峰数归类结果为较多、多、少;同理, 平均值、波峰位置同样进行聚类。聚类结果作为Bayesian分类器中对应属性的不同取值。例如从某感应线圈检测器采集到的样本数据中, 选取了小型客车x1这一种典型的车型, 根据采集过来的频率变化值, 画出曲线, 见图4。
该车型聚类后对应的特征向量x1={较高 中 较大 少}。同理, 对于其他车型也可以求得对应的特征向量, 这些特征向量作为Bayesian分类器的输入向量, 再根据Bayesian分类器算法便得到了车型识别规律。
根据以上所述算法, 实验得到了5种典型车型的识别结果, 见表1。
由表3可知, 对于小型货车和大型货车, 识别准确率比较低, 这个是由于2种车型的特征向量比较相似, 容易交叉, 识别难度较大, 也反映了我国货车改装现象严重的事实。
3 结束语
信号的处理对于车型识别的准确率有很大的影响。本文通过对感应线圈采集数据进行数字滤波, 再采用K均值聚类算法归类, 达到对特征值的提取和离散化, 增强了特征值的分类辨别能力。特征值的归类结果为接下来的Bayesian分类器算法提供了输入向量, 而Bayesian分类器算法实现简单, 运算量少, 加快了车型识别速度, 提高了车型识别的可靠性。车型识别实验也验证了该方法的可行性和可靠性。当然, 本文提出的方法还需要进一步完善, 接下来的研究内容有:如何解决不同车型特征向量交叉问题;如何改善属性聚类能进一步提高车型识别准确率。
摘要:不同车型经过感应线圈时, 线圈检测器采集过来信号变化的波形不同, 同类车型对应采集的波形中如波峰极大值、峰值位置、平均值、波峰数等特征值都具有相似性。根据感应线圈采集所得信号的特点, 讨论了一种基于K均值聚类与Bayesian分类器的车型识别方法。学习训练中, 通过K均值聚类算法把不同波形的特征值归类, 再采用Bayesian分类器算法去获得分类器。实验结果表明, 该方法具有较高的车型识别精度。
关键词:感应线圈,K均值聚类,Bayesian分类器,车型识别
参考文献
[1]Ki Y K, Baik D K.Vehicle classification algorithmfor single-loop detectors using neural networks[J].IEEE Transactions on Vehicular Technology, 2006, 55 (6) :1705-1711.
[2]林培群, 徐建闽.感应线圈信号曲线的处理方法及其在车型识别中的应用[J].公路交通科技, 2009, 26 (2) :108-113.
[3]柴旭东, 张智勇.一种应用神经网络技术的车型识别仪[J].计算机自动测量与控制, 1999, 7 (4) :53-55.
[4]刘玉铭, 白明.一种基于模糊模式识别方法的车型识别仪[J].公路交通科技, 2000, 17 (1) :63-65.
[5]谢宇, 康景利, 董巍, 等.智能交通系统中车型分类的模糊模式识别方法[J].北京理工大学学报, 1999, 19 (2) :1570-1574.
[6]李文勇, 陶汉卿.基于最小二乘支持向量机的车型识别算法研究[J].公路交通科技, 2010, 27 (1) :101-105.
[7]Lin Peiqun, Xu Jianmin.Adaptive vehicle classifica-tion based on information gain and multi-branch bpneural networks[C]∥Proceeding of The SixthWorld Congress on Intelligent Control and Automa-tion.Dalian:IEEE Press, 2006:8687-8691.
【车型分类论文】推荐阅读:
车型识别技术06-07
车型数据库06-11
suv竞标车型产品分析12-05
涡轮增压车型保养常见问题和注意事项以及养车成本分析01-08
内容分类论文05-30
对象分类论文08-25
感染分类论文09-03
分类控制论文10-29
缺陷分类论文12-18
论文级别分类12-22