行为特征识别(共10篇)
行为特征识别 篇1
人体行为识别指对人体运动的模式进行分析和识别,是计算机视觉领域被广泛关注的研究热点。异常行为识别是人体行为识别的一个重要研究方向,主要对跳、跑、呼救、弯腰、挥手5种异常行为进行识别。这项研究在智能安全监控领域有着广泛的应用价值。
智能安全监控主要包括检测、追踪、识别和分析4个部分。在分析识别上Haritaoglu[1]等人使用灰度的影像或红外线装置,利用轮廓的信息来定位人体的细部模块,并能处理异常情况的发生。布朗大学的Sidenbladh和Block[2]将人类行为的步骤分成3个部分,并进行了一系列的研究。提出一种以人类为目标的视频监控系统,利用人移动的轨迹特征,来判断是否发生异常行为。实验结果表明本算法可以准确有效地检测行人的各种异常行为、性能稳定。
1 前景目标检测与追踪
1.1 目标检测
目标的检测与追踪是监视系统最重要的部分。传统方法有:连续影像相减法、背景相减法、光流检测法3种。采用渐进式背景构建法。流程图如图1。
首先建立背景模型,然后将目前取得的影像与所建立的背景模型进行相减运算,并设定一阀值,以区分前景与背景的像素点。接着利用形态学运算来去除影像中的伪影及进行前景区域的修补。再使用连通成分将二元化影像中的连结的区域标示成相同的标记。
1.2 目标追踪
在检测出目标后就可以利用追踪模块持续的追踪监控。目标追踪方法有:对比法和预测法。使用文献[3]预测方式的追踪法,利用目标在之前数帧中的移动向量,预测出目标的最小边界矩形在下一帧中的位置与大小,并将目前帧中检测到的目标与预测的目标做比较,以找到目标之间的对应关系。利用目标的位置、大小与颜色特征来设定适当的条件,以找出正确的目标对应关系。
2 异常行为分析
2.1 目标特征的提取
在序列视频影像中要根据目标的移动轨迹取出其可供辨识的特征,判断目标现在的状态是否属于所设定的正常行为范围之内,若不则视为异常行为。把提取的特征分为3种:速度Vi、区域长宽比例lw_ratio、轨迹曲线K。
2.2 行为识别
异常行为包括跑步、跌倒、爬行等等。不符合设定的预设条件,即认为发生异常行为。当目标进入场景后,系统记录目标移动的轨迹特征,判断是否属于正常走路状态。一旦系统根据所提取的移动轨迹特征判断有异常行为发生时立刻报警。
3 轨迹检索
当检测到异常行为时,除了发出警告还得针对特定事件的轨迹做检索,找出资料库里相关信息进行进一步判断。首先利用主成份分析,对提取的轨迹特征做一次特征空间的投影转换,得到一组转换过的特征向量后才能进行后续的1检索。
3.1 取样
在进行轨迹对比前必须保证每一条轨迹对比部分的长度一致。首先找出每一条轨迹的控制点,如图2。
其中i、j为此条轨迹上的控制点,控制点代表的是此条轨迹角度的变化量相对于其他点较大的区段。首先计算每一点和相邻两点之间的角度,如图3。
假设在第i个点到第j点之间要取出n个点,取样公式如式(1):
取出全部所需轨迹点后,接着要将这些点的特征投影到特征空间进行转换。
3.2 主成份分析
主成份分析是一种用来识别一群资料中各种样本的方法,能够强调不同样本之间的相似性以及差异性。可分成六个步骤:(1)选取要做PCA转换的样本。(2)将同一维度的每一笔样本减去其平均值。(3)计算共变异矩阵。(4)计算步骤3得到的共变异矩阵的特征向量及特征值。(5)选取不为0的特征值所对应的向量构成一组特征向量。(6)将步骤2所得到的样本点投影到步骤5得到的主轴上,得到最后的特征,此特征即是之后用来做轨迹对比的输入样本。
3.3 轨迹对比
取得各条轨迹的特征向量后,就是轨迹间的对比。采用文献[4]提出的两种曲线配对的算法进行比较。一种是以最小投影距离为基础的平衡矩阵,另一种是以差异影像为基础的平衡矩阵。
3.3.1 以最小投影距离为基础的平衡矩阵
为精确计算输入轨迹与样本库所有轨迹的相似度首先计
算两者之间的投影距离。假设代表样本库里n条轨迹的特征向量,输入轨迹的特征向量则以表示,T和D在d维空间中的投影距离计算如下:
设定一个合适的阀值d0,若,则判定两者为相似轨迹。
重复上述步骤,直到输入轨迹和样本库里每一条轨迹对比过后停止。如此便可完成轨迹的检索。
3.3.2 以差异影像为基础的平衡矩阵
先计算每一条轨迹本身的差异痕迹,以表示,计算之后可得到样本库里全部轨迹各自的差异痕迹,以表示,要做检索的轨迹差异痕迹以表示。接下来计算LT和LD之间的平方根误差距离:
最后设定合适的阀值d0,若,则判定两者为相似轨迹。上述步骤直到输入轨迹和样本库里每一条轨迹对比过后停止。
4 实验结果与分析
为验证算法的可行性及优越性,整个实验的环境为Intel P4 3.0G,内存1G,使用Visual C++6.0开发。在进行检测之前先建立背景模板,利用背景相减检测出场景中的目标,经图像出理后得到每一个完整的前景区域。部分结果如图4(a)为背景模板,(b)为目标进入,(c)为背景相减结果,(d)为目标形态。
为了计算系统的准确性,输入几段实验视频,分别为正常走路行为和模拟各种异常行为的视频准确度计算的方式一每段视频的每一帧之前的景物状态判断结果为基础。表1为实验样本数目,正常行为的有130帧,异常行为140帧,判断正确率为91.48%。
行为分析实验结果如表2,在两段长度总共为270帧的视频中本算法在各种行为的分类正确率分别为82.93%~91.56%,全部行为的平均分类正确率为90.3%。
利用两种不同的曲线配对算法将欲检索的轨迹和样本库中的轨迹做对比,结果如表3。其中FRR(错误拒绝率)指其为相关联的样本欲被系统拒绝;FAR(错误接受率)指不相关的样本被系统接受,FRR和FAR愈低,表示系统的性能越好。
5 结语
由于人体运动是一个复杂的运动系统,具有很大的自由度和高度的非线性特点,以及关于行为、事件的定义有着不同的概念,如何选择充分有效的表达方式来描述场景中人的行为是非常困难的。提出了一个完整的视频监控系统,首先提取行人移动的轨迹特征,用以训练各种状态的模型,根据模型及其他条件判定是否发生异常行为,最后把每次异常行为发生的轨迹存储并建立索引,作为后续轨迹检索的查询资料。实验表明算法的鲁棒性。
摘要:提出一个以行人为目标的视频监控系统,利用行人的移动轨迹特征来判断是否发生异常行为。利用背景相减法来检测是否有目标的存在,并利用目标的各种信息来追踪行人;建立目标行为模型,利用模型有效地识别目标的各种行为;利用轨迹对比的方式完成相关事件的轨迹检索,并供后续查询。实验表明,本算法可行、性能稳定。
关键词:目标检测,轨迹特征,异常行为,主成份分析
参考文献
[1]I.Haritaoglu,D.Harwood,L.S.Davis.Real-Time Surveillance of People and Their Activities[J],IEEE Trans.Pattern Anal-ysis and Machine Intelligence,2000,22(8):809-830.
[2]H.Sidenbladh and M.J.Black.Learning the statistics of people in images and video,international Journal of Computer Vision.2003,54(1-3):183-209,2003.
[3]F.Bremond and M.Thonnat,Tracking multiple nonrigid ob jects in video sequences[J],IEEE Trans.Circuits and Sys-tems for Video Technology,1998,8(5):575-584.
[4]Z.Li,A.K.Katsaggelos and B.Gandhi,Fast video retrieval based on trace geometry matching[J],IEEE Proc.Vision,Image and Signal Processing,2005,152(3):367-373.
行为特征识别 篇2
1 引言
随着资本市场的深入发展与繁荣,盈余在财务报表中的地位举足轻重,促使一些企业为了追求自身利益最大化,蓄意粉饰报表,虚构盈余,导致上市公司盈余管理行为日益普遍,且在信息传递不对称、尚未成熟的中国市场表现尤为严重。这种上市公司盈余管理行为涉及范围广泛,严重影响会计信息真实性,极大地打击了投资者信心,扰乱了资本市场秩序,阻碍了证券市场的健康发展,中国早期的银广夏、蓝田股份事件到近期的南京高科、华锐风电事件都是盈余管理行为恶果的有力印证。因此,构建科学有效的中国上市公司盈余管理识别模型,对于政府管理部门、投资主体有效应对与防范会计舞弊,促进证券市场交易的公平与规范,具有重要的理论价值和现实意义。
然而,迄今为止,已有学者运用单尾检验法、描述性统计方法、logistic回归模型以及贝叶斯判别分析、神经网络等人工智能模型对上市公司盈余管理行为进行识别。虽然这些方法已经取得了较好的推广能力,被实务界广泛应用,但都存在着前提条件过于苛刻,维数灾难等问题。为了克服以上模型所存在的不足,vapnik等根据统计学理论提出了一种支持向量机的方法来进行模式识别,它是建立在VC维理论和结构风险最小化原理上基础上的一种人工智能方法,能够有效的克服小样本、高维模式、非线性等识别问题,具有良好的学习能力。因此,本文引入SVM模型对我国上市公司盈余管理行为进行识别研究。
此外,上市公司数据之间高度相关,需要通过降维技术对指标进行约减。在多元统计分析中,因子分析是主成分分析的进一步发展,它不是对原有变量进行取舍,而是对原有变量信息重新组合,形成公共因子,既充分考虑了各财务指标之间的内在联系,又有效解决了由于数据之间高相关性特征而引起的信息冗余问题。因此,本文在构建出上市公司盈余管理识别模型的指标体系后,将进一步运用因子分析方法方法对特征指标进行筛选,从而提高模型的学习能力和泛化能力,以期能够进一步提升模型对盈余管理识别的准确性。
2 研究方法
支持向量机的基本思想是寻找一个满足分类要求的最优超平面将两类样本分开。本文首先假定上市公司样本集为(x1,y1),…,(xn,yn),每个特征指标所对应的类别标签yi∈{-1,1},发生盈余管理行为的公司用“+1”表示,未发生盈余管理行为的公司用“-1”表示,要使得两类样本分开,则需运用SVM模型寻找一个使分类间隔δ=|g(x)|/‖ω‖最大的识别函数f(x),并满足0≤yi(ωTxi+b)-1的约束。
其次在样本线性不可分情况,此时SVM需构造一个非线性映射:Φ:x→Φ(x),使得上市公司样本在高维空间中线性可分。此外,还需在SVM原问题的约束中加入软间隔松弛变量,ζi,i=1,…,n以此避免高维空间中少数上市公司离群造成问题无解
于是,运用SVM寻找最优盈余管理识别函数问题则转化为求解以下二次型规划问题:
(1)
接下来,引入拉格朗日乘子法来求解,设0≤αi,λi,i=1,…,n,得到拉格朗日函数:
(2)
由此,通过训练算法构造出上市公司盈余管理行为的识别函数:
(3)
3 研究设计
在财务因素方面,本文根据上市公司进行盈余管理的手段与动机,以及以往文献的研究成果列举出12个财务指标,作为中国上市公司盈余管理行为的识别指标(详见表1)。
表1 12个识别盈余管理行为的财务指标
4 实证结果与分析
4.1 指标筛选
首先本文通过软件计算输入变量的KMO值与Bartlett检验值。结果显示,财务变量的KMO值大于0.5,且Bartlett球形检验的概率P值为0,表示可以进行因子分析。随后经过因子分析,本文约减出5个基本涵盖了12个财务指标的信息的主因子,较为全面地解释上市公司的财务状况,体现出两类样本在财务因素上的差异性。
4.2 盈余管理行为识别模型的构建
SVM识别模型的学习性能是否优越关键在于选择的核函数,而常见的四种核函数中,RBF核函数应用最为广泛,因此,本文选用RBF核函数来构建SVM盈余管理识别模型。
接着,本文以财务指标作为输入变量对训练集进行SVM识别,得到模型的估计结果和检验结果(如表2、表3所示)。
表2 财务指标下的SVM预测结果
表3 财务指标下的SVM检验结果
由表2可知,SVM模型在盈余管理行为的识别问题上已经取得一定的分类效果,而由表3可知,SVM模型不仅有良好的学习能力,更有良好的泛化能力,能够有效地对盈余管理行为进行识别研究。
5 结论
本文以中国上市公司为研究对象,运用因子分析方法提取出能够准确刻画盈余管理行为的财务指标,进而运用SVM模型对中国上市公司盈余管理行为进行识别研究。通过实证分析,本文得出SVM模型能够有效地识别中国上市公司盈余管理行为,从而为政府管理部门以及投资主体提供宝贵决策借鉴。
[1] 陈小悦,肖星,过晓艳.配股权与上市公司盈余管理[J].经济研究,2000,(1):30-36.
[2] Fields,M.A.,Keys,P.Y.The Emergence of Corporate Governance from Wall St.to Main ST.:Outside Directors,Board Diversity,Earnings Management,and Managerial Incentives to Bear Risk[J].Financial Review,2003,(1):1-3.
[3] 姚宏,李延喜,高锐.基于主成分分析的上市公司盈余管理识别模型[J].管理科学,2007,(5):84-91.
[4] 姜金玲,李延喜,高锐.基于logistic的上市公司盈余管理行为识别模型研究[J].经济管理,2008,(19-20):77-82.
[5] 李延喜,高锐,包世泽等.基于贝叶斯判别的中国上市公司盈余管理识别模型研究[J].预测,2007,(3):56-60.
[6] 李双杰,陈星星.基于BP神经网络模型与DEA模型的中国上市公司盈余管理研究[J].数理统计与管理,2013,(3):440-451.
[7] Vapnik V N.The Nature of Statistical Learning Theory[Z].1995.
[8] 宋新平,丁永生.基于最优支持向量机模型的经营失败预警研究[J].管理科学,2006,(1):115-121.
[9] 刘晓亮,丁世飞.SVM用于文本分类的适用性[J].计算机工程与科学,2010,(6):106-108.
[10] Messod D.Beneish.The Detecting of Earnings Manipulation[J].Financial Analysis Journal,1999,(5):24-36.
行为特征识别 篇3
1 快速行为识别算法总体设计
Li等人选取物体类别信息和场景信息来识别静态视频中的人体行为[3]。这种识别方法包含了场景等高层语义信息,同时又没有对运动信息进行分析,因此,计算量大而且识别效果不是很好。本文提出的方法只需要标记出训练视频的行为类别标签。相对于其他方法,本文的识别方法是基于简单特征量信息的。
先介绍局部特征的含义,它是指在视频帧中出现的具有高频率和良好鲁棒性的特征信息,能够提供识别依据的统计数据信息。本文研究的方法就是从单帧视频或少量视频帧的光流特征和边缘特征中总结学习局部特征,从而识别出人体的行为。具体算法流程图如图1所示。
算法分为4个步骤:第一,输入训练视频集合,计算出训练视频集合的输入视频帧的运动特征和边缘特征,具体对应为光流特征和Canny边缘特征。第二,均匀采样图像块,并对每个图像块进行量化,统计生成判别特征集合。第三,采样输入视频的单帧或少量帧,从光流特征和边缘特征方面采样局部特征,统计视频帧中出现每种判别特征的频率,并对其进行编号。第四,利用已学习到的判别特征集合训练分类器,再通过分类器判断当前视频帧中的行为类别。
本文采用EP(emerging pattern)模式挖掘算法来生成分类器,区分各个类别行为的局部判别特征[4]。
2 局部特征的量化方法和判别方法
2.1 量化视频帧中局部特征的方法
EP模式挖掘算法前提需要有可作用的元素集合,因此,先给出编码视频帧中的局部特征并使其成为集合的方法。
图2中给出了计算一个视频帧中光流特征和Canny边缘特征的算法过程。首先,选定图2(c)(d)中的红色框中A×B大小的帧块范围,其中,A=40,B=40。按下列步骤量化视频帧块的特征为一个元素集合:第一,平均分割A×B帧块,其中,单个方格的尺寸为a×b,a=8,b=8。再依据图2(a)所示的方向量化盘,将运动方向量化取值为1~4的整数值。第二,结合每个方格在整个A×B帧块中的相对位置给出该方格对应的运动编码值。以图2(e)(f)中用黄色虚线框标记的方格为例,该方格的相对位置是4,运动方向即对应的光流特征量化为1。所以,该方格的运动编码值为41。同理,可计算出该方格的对应于边缘编码值为43。最终该方格的组合特征量化值为413。若单个方格中的运动幅值或者边缘幅值小于设定的阈值,则将该方格的量化值记为空,在图2中表示为‘X’。第三,依据上述方法,可得出所有方格的组合特征量化值,记为运动-边缘编码值集合,如图2(g)所示。
2.2 局部判别特征的学习方法
对行为进行分类,每个类别的行为都具有相应的特征。总结出这些特征,就可以对行为类别进行判别了。实验中,选取大小为40×40像素的视频帧进行研究,将包含每个行为类别的视频数据称为正例视频集合,从中量化出的局部特征形成正例数据集合;而除此之外的行为类别的视频数据构成反例视频集合,同理,从中量化出的局部特征形成反例数据集合。分别在这两种集合上应用EP算法,利用2.1中的方法进行量化,挖掘出两者的局部特征区别,这些区别就构成了两者的判别特征集合。应用EP模式挖掘算法之前,本文定义了两个阈值,通过调节阈值的大小,就可以控制挖掘出的局部特征的支持率和增长率。支持率具有描述能力,用来保证挖掘出的局部特征有统计意义;增长率用来保证局部特征的判别能力。
以图3给出了判别特征及其在视频帧中的分布情况示意图。图3(a)中,选取视频帧中大小为5×5像素的帧块(图中用紫色高亮标记)进行采样,每个帧块的数值集合的子集合(图中用白色高亮标记)对应一个判别特征实例。这个实例有一定的判别能力,同时还包含了其在整个视频帧中的位置信息。图3(b)(c)中,给出了分别利用光流特征、边缘特征和两者组合成的“光流+边缘”特征来量化视频帧得出的判别特征分布情况示意图,其中,每个像素的亮度反应了该像素点上判别特征分布的个数。3种判别特征的量化方法分别得出各自的有判别能力的行为语义结构。图3(b)中,光流特征通过躯干和腿部动作来判定“跑步”行为,通过手部的上扬动作来判别“挥手”行为,从而区别“跑步”和“挥手”行为。Canny边缘特征通过斜弯的腿部判定“跑步”行为,通过直立的腿部判定“挥手”行为。两者组合成的“光流+边缘”特征有着最好的区分效果,它通过“挥手”行为中的手部上扬动作和“跑步”行为中摆臂动作和腿部斜弯动作,来判定“挥手”和“跑步”两种行为。在图3(c)中,光流特征不能够很好的区分“跑步”和“慢跑”这两种行为。边缘特征是通过腿部的斜弯动作来判定“跑步”行为,通过身体躯干来判定“慢跑”行为的。由于这两种行为的腿部运动幅度不同,“慢跑”行为比“跑步”行为的幅度小,弯曲度也小,所以可以区分开这两种行为。而两者组合成的“光流+边缘”特征则在边缘特征的基础之上,又增加了人手臂的局部特征,故判别的特征更加显著。
3 基于局部判别特征的行为分类识别算法
3.1 单视频帧的行为识别算法
Boosting分类框架具有运算简单和识别准确率高的优点,可以用来从单视频帧中学习行为分类模型[5]。每个判别特征eb的判别分数的计算公式如下:
公式中,b表示行为类别,b∈B对应的Gb(H)。Gb(H)表示强分类器(strong classifier),它是通过弱分类器(weak classifier)来构造的,而弱分类器是通过整合所有学习到的局部判别特征来构造的。eb指学习到的行为类别b的判别特征,H指行为视频帧,Geb(H)指该判别特征所对应的弱分类器。Reb(H)指每个判别特征eb的判别分数,它是通过支持率d(eb)和增长率u(eb)计算出来的,m(H,eb)指判别特征eb在帧H中出现的次数。当Reb(H)>θ时,弱分类器的输出为1,即geb(H)=1;相反的,弱分类器的输出为O;其中,θ的值是通过最小化训练数据分类错误而学习得到的。视频帧的行为标签b*的计算公式如下:
3.2 视频段的行为识别算法
在已有的单帧行为识别算法的基础上,采用同样的训练分类模型的方法,并假设单帧行为分类模型已经训练好的前提下,视频段的行为识别算法步骤如下:
第一,以4为步长,从视频段中采样视频单帧。
第二,提出置信度的概念。因为采样具有的随机性,当采样得到的视频帧中含有较大噪声时,行为识别效果就会变差。从视频帧集合中提取出一个具有较高置信度的子集,并利用该子集中的视频帧来参与最终行为类别的判定。视频帧Hs的置信度conf(Hs)的计算公式如下:
其中βeb(Hs)表示在视频帧Hs中检测到的特征的弱分类器的权重。当conf(Hs)>0.7时,视频帧Hs被认为是置信帧;否则不是。所有置信帧组成的集合记为J。
第三,利用上节的算法对每个采样帧进行行为识别,识别结果记为Gb(Hs)∈{0,1}。
第四,采用投票的方式确定视频片断的行为类别标签,公式如下:
4 实验结果及分析
KTH人体行为数据库是公开的行为数据库,它包括了25个表演者执行6种简单行为,包括“拳击”、“挥手”、“拍手”、“慢跑”、“跑步”和“散步”。每个表演者在简单的背景下表演的这6个动作,分别在4个不同的条件下进行拍摄,包括室内场景、室外场景和摄像机焦距变化等,每种行为包含了96~99段视频序列。图4中展示了KTH数据库视频的样例视频帧。
基于KTH行为数据库来测试行为识别算法的效果。实验中,设定EP模式挖掘的增长率阈值是2,支持率由程序自动调整,并保证每个类别的行为都包含500个判别特征。随机的将所有视频帧依据2:8的比例划分为训练数据和测试数据,将10次测试结果的平均值作为最终的实验结果。
图5给出了在KTH数据库上本文的基于视频帧的行为识别方法与基于时空兴趣点的行为识别方法的结果比较图。从图中可以看出,行为识别准确率随着视频帧帧数的增加而不断提升。但当帧数达到20帧左右的位置时,行为识别准确率基本开始稳定。原因是在KTH数据库中的大多数行为属于重复运动,而运动的周期保持在20帧左右,所以,当帧数达到20以后,行为的判断信息不再增加,行为的识别准确率也就稳定不再增长了。本文的方法在“拳击”、“拍手”、“慢跑”和“散步”4种行为的识别准确率上优于基于时空兴趣点的方法,而在“挥手”和“跑步”两种行为的识别准确率上不如基于时空兴趣点的方法。分析其中原因,是本文的方法没有考虑特征在时间点上的关联性。
5 结语
介绍了基于简单特征量信息的快速行为识别算法总体流程,给出了量化视频帧中局部特征的量化方法和判别方法,在此基础上给出了基于局部判别特征的行为分类识别算法。从实验结果分析得知,本文的算法相较于目前流行的基于时空兴趣点的行为识别方法,具有运算快速和识别准确率较高的优点,且本文的方法是基于单帧视频或少数帧视频的。该算法仍存在待改进之处,需要进一步探索行为视频时空体中更加复杂的行为结构信息。
摘要:人体行为识别技术是利用机器视觉,以人体的生物特征参数为基础,对人的数量、行为和身份等信息进行快速准确分析判断的一种实用技术。该技术可应用于安防监控、安全验证、军事、商业和工业等领域。提出一种基于简单特征量信息的快速行为识别算法,与当前主流的算法相比,有可用更少的训练数据和识别效果更加高效的特点。
关键词:特征量,行为识别,分类器,KTH数据库
参考文献
[1]王蓉,杨宁,李锦涛.单像素人体轮廓提取方法研究[J].科学技术与工程,2014,14(24):252-265.
[2]王杰.视频流中人体的检测与分离[D].西安:西安电子科技大学,2013.
[3]孟凡辉,王浩,方宝富.可扩展梯度直方图人体检测算法研究与实现[J].广西师范大学学报(自然科学版),2011,29(3):168-172.
[4]史东承,冯占君.视频中人体行为分析[J].吉林大学学报(信息科学版),2014,32(5):521-527.
行为特征识别 篇4
关键词:玉米;杂草;识别;纹理特征;灰度矩阵;统计矩
中图分类号: TP391.41 文献标志码: A 文章编号:1002-1302(2014)07-0143-03
收稿日期:2013-11-03
基金项目:河北省保定市科技基金(编号:13ZN021);保定学院科研基金(编号:2013Z04)。
作者简介:王怀宇(1975—),男,河北保定人,硕士,讲师,从事图像处理、数据挖掘研究。E-mail:why_bdxy@163.com。玉米苗期常见杂草包括刺儿菜、藜、马唐、田旋花等。传统除草方法是喷洒除草剂,但田间杂草生长分布呈不均匀、无规律的随机分布,因此大规模药物喷洒不仅造成浪费,也对环境带来不容忽视的污染。随着精准农业的发展和图像处理技术应用的深入,在机器视觉的协助下实现农田中除草剂的变量喷洒成为当今研究热点。如何识别杂草图像是其中最为关键的步骤。当前已经开发出不少识别杂草的有效方法,这些方法往往结合杂草各类特征对其进行识别,包括颜色特征[1-4]、形状特征[5-6]、光谱特征[7-9]等,也有研究结合以上组合特征进行识别,取得了较高的效率与精度。但单独针对杂草纹理特征进行智能识别的研究尚不多见。
纹理特征能够体现出图像灰度或颜色分布的可描述规律,尤其是在被识别目标的形状、颜色等属性均与周边环境相似时,能够以兼顾宏观性质与细部结构的方式取得较好的识别效果[10]。不同作物种类或同种作物的健康苗株与病害植株间在图像纹理特征上有较为明显的区别,因此纹理特征在农作物病虫草害识别研究中能取得较好的识别效果[10]。对于杂草识别来讲,怎样快速提取纹理特征以及如何实现准确的识别率是最关键的问题。本研究以玉米常见杂草图像识别为例,在图像预处理后,对样品的多个纹理特征进行筛选,以支持向量机进行分类,分别进行基于灰度矩阵、统计矩的识别以及结合二者的识别,以期为杂草的快速检测及定向施药提供基础。
1材料与方法
1.1图像采集
北方地区玉米苗期杂草非常常见,一般在播种后便可观察到杂草。据统计,华北地区玉米播种后的8~10 d是杂草出土最集中的时期,12~15 d杂草出土占总量的80%,25 d后达到95%。杂草的出土、生长时间规律与北方地区夏玉米苗期生长节律基本吻合。因此,只有及时除去杂草才能保证玉米产量。研究证实,当玉米生长至3~5叶、田间杂草生长至2~3叶时,是去除杂草的关键时期。本研究在玉米生长至3~5叶时采集田间各类杂草图像,包括刺儿菜、藜、马唐、田旋花。在目标物正上方以640×480像素进行拍摄,杂草图像实例见图1。
1.2图像预处理
1.2.1图像增强为了突出图像特征,削弱某些不重要甚至干扰的信息,首先对原始图像进行增强处理,以提升图像中有价值区域的对比度。图像增强方法分为频率增强法和空间增强法两大类。考虑到图像识别对于实时性的要求,本研究选取效率更高的空间增强法[11],该方法对每个像素的灰度值进行变换,最终实现整体对比度的提升,达到图像增强的目的。
3结论
针对玉米田间杂草的识别问题,提出了根据纹理特征进行智能识别的方法,具有创新性。以灰度共生矩阵和统计矩来描述识别目标的纹理特征,通过支持向量机进行分类识别。结果表明,综合了灰度矩阵与统计矩的纹理特征识别精度超过90%,能满足识别要求。本研究成果有利于减少除草剂喷洒量,有助于实现除草系统的自动化和智能化。
参考文献:
[1]Woebbecke D M,Meyer G E,Von Bargen K,et al. Color indices for weed identification under various soil,residual,and lighting conditions[J]. Transactions of the ASAE,1995,38(1):259-269.
[2]El-Faki M S,Zhang N,Peterson D E. Factors affecting color-based weed detection[J]. Transactions of the ASAE,2000,43(4):1001-1009.
[3]Tang L,Tian L,Steward B L. Color image segmentation with genetic algorithm for in-field weed sensing[J]. Transactions of the ASAE,2000,43(4):1019-1027.
[4]El-Faki M S. Zhang N,Peterson D E. Weed detection using color machine vision[J]. Transactions of the ASAE,2000,43(6):1969-1978.
[5]Guyer D E,Miles G E,Schreiber M M,et al. Machine vision and image processing for plant identification[J]. Transactions of the ASAE,1986,29(6):1500-1507.
[6]Franz E,Gebhardt M R,Unklesbay K B. Shape description of completely visible and partially occluded leaves for identifying plants in digital images[J]. Transactions of the ASAE,1991,34(2):673-681.
nlc202309012230
[7]Franz E,Gebhardt M R,Unklesbay K B. The use of local spectral properties of leaves as an aid for identifying weed seedlings in digital images[J]. Transactions of the ASAE,1991,34(2):682-687.
[8]Lu R,Peng Y K. Hyperspectral scattering for assessing peach fruit firmness[J]. Biosystems Engineering,2006,93(2):161-171.
[9]Goel P K,Prasher S O,Patel R M,et al. Use of airborne multispectral imagery for weed detection in field crops[J]. Transactions of the ASAE,2002,45(2):443-449.
[10]周平,汪亚明,赵匀. 基于颜色分量运算与色域压缩的杂草实时检测方法[J]. 农业机械学报,2007,38(1):116-119.
[11]何东健. 数字图像处理[M]. 西安:西安电子科技大学出版社,2004.
[12]刘立宏,胡可刚,刘立欣. 目标检测中的快速中值滤波法[J]. 吉林大学学报:信息科学版,2004,22(3):232-235.
[13]Haralick R M,Shanmugam K. Texture features for image classification[J]. IEEE Systems Man and Cyberbetucs,1973,3(6):610-621.
[14]Ulaby F T,Kouyate F,Brisco B,et al. Textural infornation in SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing,1986,GE-24(2):235-245.
[15]鄧乃扬,田英杰 .数据挖掘中的新方法:支持向量机[M]. 北京:科学出版社,2004.
[16]Valentini G,Dietterich T G. Bias-variance analysis of support vector machines for the development of SVM-based ensemble methods[J]. Journal of Machine Learning Research,2004,5(7):725-775.
生物特征识别系统分析 篇5
对于一般的生物特征识别系统,生物特征样本是由传感器从用户获得的,传感器输出的信息传送到处理器,处理器提取出独特但可重复的样本。该样本作为一个模板保存在数据库中,和已有的一个或多个数据库中的模板进行比对,以便确认是否有匹配。最终依据模板与模板或模板与特征之间的相似度给出身份判别。
图1 说明了一般生物特征识别系统的信息流以及组成系统的各个子系统:数据采集子系统、数据存储子系统、比对子系统和决策子系统。此图说明了系统的登录过程、辨识过程和验证过程。应指出的是,在任何真正的生物特征识别系统,这些概念的组件可能不存在或可能不直接对应物理组件。例如,质量控制可以放在分割之前或者特征提取之后。
2 系统构成
(1) 数据采集子系统
数据采集子系统采集图像或者通过生物特征传感器采集用户的生物特征。该系统输出图片或生物特征信号作为生物特征样本。
(2) 传输子系统
传输子系统( 不一定显式存在于生物特征识别系统) 在各个子系统之间传送信息。样本、特征或模板使用标准的生物特征数据交换格式进行传输。生物特征样本可能在传输之前被压缩和/ 或加密,并在使用前被解压缩和/ 或解密。一个生物特征样本可能在传输信道中由于噪声或压缩解压缩过程产生信息损失。建议在传输和存储中使用加密技术来保护生物特征数据的真实性、完整性和可信性。
(3) 信号处理子系统
信号处理子系统从生物特征样本中提取显著的特征。该处理可能包括从生物特征信号中定位用户的生物特征( 通常此过程称为分割)、特征提取和质量控制,确保提取的特征是可识别和可重复的。质量控制拒绝接受样本时,信号采集子系统可能会采集新的样本。
在登录过程中,信号处理子系统通过提取到的生物特征创建一个模板。通常登录过程要求通过多个特征产生一个模板,有时模板也只包含一个特征。
(4) 数据存储子系统
数据存储子系统把模板保存在登录数据库中。每个模板与登录用户的其他信息一一对应。应指出的是,在被存储在数据库中之前,模板可能被转换为生物特征识别数据交换格式。模板可能存储在生物特征采集设备中,或便携式存储媒介如智能卡中、个人电脑或本地服务器,或中央数据库中。
(5) 比对子系统
在比对子系统中,生物特征同一个或多个模板进行比对后,相似度将被传送到决策子系统中。相似度表明了特征与模板之间的拟合程度。在某些情况下,特征可能和模板采用相同的存储形式。在验证模式下,输入的特征仅和被声称的库中的模板进行比较,输出一个相似度。在辨识模式下,一些或全部的库中模板将同输入的特征进行比较从而产生多个相似度。
(6) 决策子系统
决策子系统使用多个相似度或一个相似度,对验证或辨识的结果提供一个决策。
在验证模式下,特征与模板是否匹配是由它们之间的相似度是否超过指定阈值决定的。此决策模式可以允许进行多次尝试,确认用户是否为其所声称的身份。
在辨识模式下,当某些相似度超过指定的阈值时,或者某个相似度是所有相似度中最大的k个时,确认对应的登录身份为可能的辨识决策。
值得注意的是, 从概念上讲,如果把多种模态的样本、模板、得分当作一个样本、模板、得分并在决策时采用融合的方式,多模态生物特征识别系统和单模态生物特征识别系统具有相同的处理方式。
(7) 管理子系统( 不包含在概念图中)
管理子系统负责管理生物特征识别系统的总体策略、执行和应用,以及有关法律、司法和社会的限制和要求。说明性的例子包括:
在数据采集后给用户提供反馈信息;
要求用户提交其他信息;
存储和转换生物特征模板或生物特征交换数据;
根据决策系统或相似度的结果提供最终的决策;
设置阈值;
配置生物特征识别系统的采集装置;
控制工作环境和非生物特征识别技术数据的存储;
为最终用户提供隐私保障措施;
与其他系统进行交互。
(8) 接口( 不包含在概念图中)
生物特征识别系统可能会通过API函数接口、硬件接口或者协议接口与外部应用程序或系统连接。
3 系统功能
(1) 登录
登录过程中,系统为使用者生成相应的登录模板并将其存储在系统中。
这个过程一般包括:
数据采集;
分割与特征提取;
质量评价( 如果不合格则重新采集) ;
模板生成( 可能使用多个特征),可能转换为生物特征识别数据交换格式;
测试登录是否成功( 或模板是否可用) ;
若初始登录不合格,可能允许重复登录尝试( 视登录策略而定)。
(2) 验证
身份验证是验证某使用者的真实身份是否与其声称的身份一致。验证的结果可以是接受或者拒绝。如果不是接受错误声明( 错误接受) 或者是拒绝正确声明( 错误拒绝),输出的验证结果被认为是错误的。值得注意的是,某些生物特征识别系统允许一个用户登录多个特征( 例如,一个虹膜系统可能允许最终用户登录左右眼两个虹膜图像,而指纹系统可能最终用户登录两个或两个以上的手指作为备份,以防一个手指受伤的情况)。
验证一般包括以下步骤:
数据采集;
分割与特征提取;
质量评价( 如果不合格则重新采集) ;
比对输入特征与其所声称的身份的对应模板;
判断相似度是否超过确定的阈值;
根据决策策略和比对得分判断是否匹配。
示例:
在一个允许三次尝试的验证系统中,采集失败与错误匹配的任意三次组合会导致一个错误拒绝。如果在三次尝试中,有一个样本被接受并且与声称的身份的模板错误匹配,就会产生一个错误接受。
(3) 辨识
身份辨识的过程是试图确定某使用者是否已经登录在系统中,如果是则确定其身份。辨识提供一个可能为空或只包含一个辨识用户的候选列表。当待辨识用户已登录,并且其登录的身份在候选列表中,识别过程被认为是正确的。
身份辨识通常包括以下步骤:
数据采集;
分割与特征提取;
质量评价;
特征提取(如果不合格则重新采集);
比对输入特征及系统中的待比对模板;
基于是否有相似度最高的k个和/ 或相似度是否超过阈值判断是否有匹配上的身份;
根据决策策略和输出的一组比对得分做出辨识决策。
需要注意的是, 在全自动系统中,被标定的待辨识用户很可能与具有最高相似得分( 提供超出特定阈值) 的模板一致。当有人工操作员时,系统可能会为操作者提供一个包含前r个匹配项的候选列表以便决策。通过人工操作员判断可能的匹配项,从而确定系统的实用性能指标不在本部分的范围内。
同时, 如果所有的待辨识人员均在一个已登录过的辨识系统中,将不会出现错误接受这样的辨识错误。在已知识别闭集的退化情况下,性能测量通常以正确识别率的大小来衡量,该正确识别率与系统返回的候选列表大小相关。
4 结语
现阶段生物特征识别技术的应用和市场增长迅速,由于存在众多不同的技术和应用,给出一般的生物特征识别系统的概括模型是很困难的。本文提出的生物特征识别系统对相应的生物特征识别标准及符合性检测具有参考意义。
摘要:阐述生物特征识别系统的通用原理,分析数据采集子系统、传输子系统、信号处理子系统、数据存储子系统、比对子系统、决策子系统的功能,对相应的生物特征识别标准及符合性检测具有参考意义。
智能识别与行为分析 篇6
一个国家社会治安情况的好坏, 对该国家的经济和社会的发展是有非常大影响的, 监控系统的产生、发展到最后的普及对社会治安的改善发挥了巨大的作用。最初监控系统的使用大都是在发生某些威胁治安的事情发生之后, 对监控系统所拍摄下来的录像进行查找, 这种使用方法既浪费了时间, 也浪费了很多数据, 没有实现真正意义上的预防效果, 但这些问题在当时的社会背景下, 并不十分明显。
近年来, 威胁社会治安的事件屡屡发生, 例如恐怖袭击、暴力伤人、恶性冲突、抢劫强奸、入室盗窃等等, 于是人们对自身安全问题的保障和社会安全的整体改善的呼声高涨。由于传统的监控系统的诸多弊端无法适应社会的发展和人民群众的需要, 监控系统需要进行技术上的改革和创新。在这种社会背景下, 智能识别与行为分析技术应运而生, 并在短时间内快速发展, 并广泛地应用与社会安防领域。
2 智能识别与行为分析技术的实际应用
2.1 智能识别与行为分析技术在交通系统中的应用
随着社会经济的发展, 城市中的机动车数量逐年增加, 违章停车的现象时有发生, 并且成为了城市管理中难以解决的问题之一, 怎样对机动车驾驶员的操作进行规范, 如何对违反交通法规的的行为进行调查取证和违章查处工作, 是监控系统所必须要解决的问题。如果使用传统的监控系统, 发现违章停车现象时, 相关的执法人员调取监控录像时的工作过程是十分负复杂的, 随着城市道路上的监控设施装设的越来越多, 相关执法人员的工作量也日渐增加, 而且长时间、超负荷的工作使得执法人员的身体和精神状态不堪重负, 导致监控录像查看过程中容易出现疏忽、错看、漏看等问题。所以, 怎样更新传统的监控系统, 使之能够进一步有效查处驾驶员的违章操作问题变得尤为重要。
智能识别与行为分析的视频图像监控系统, 有效地解决了违章停车的抓拍问题。该技术的核心部件是红外高速球机, 具有对违章停车的检测、对违章车辆的抓拍、对违章车辆的自动识别等多种功能。对交通拥挤或事故多发地等特殊的地点可以实现对路段的所有车辆的连续监控功能, 在抓拍违章车辆的过程中, 可以清晰地看到违章车辆的外观以及车牌号码, 同时在所抓拍到的车辆图像上自动记录违章车辆的车型、违章操作的时间、违章的地点等信息。智能识别与行为分析的视频图像监控系统采用互联网技术, 可以将记录的数据通过多种渠道传输到远程控制中心, 也可以实现由人工单独提取相关数据。该项技术全天候二十四小时的连续监控和抓拍为执法人员的工作带来了极大的便利, 同时也在很大程度上减少了交通系统中的违章操作。
2.2 智能识别与行为分析技术在森林防火系统中的应用
随着生态环境问题的日益突出以及“退耕还林、还草”、“建设三北防护林”等政策的实施, 我国的林地面积增长迅速, 对森林的防火工作便成了重中之重。一旦防火工作出现问题, 就很有可能出现森林火灾, 造成大片的森林被焚毁, 不但浪费了资源, 同时由于燃烧过程中产生的烟雾, 对环境也造成了极大的影响。森林火灾一旦发生, 其所产生的严重的后果是无法想象的, 所以, 只要监控系统发出警报, 相关人员就要立即采取灭火措施, 如果对火灾发现的及时, 就可以在很大程度上降低森林火灾所造成的损失。传统的森林火灾监控系统, 视频图像主要是还是由人工进行查看、监视的。工作人员在长时间的监视过程中很容易产生视觉疲劳, 一旦视频图像中小的火情没有及时发现, 很容易出现处理不及时的情况, 加剧了森林火灾的破坏力。将智能识别与行为分析技术应用于森林防火系统中, 可以将摄像机拍摄到的视频图像进行算法分析, 从而实现对烟雾、明火等火灾初期的情况进行自动识别, 并在第一时间发出警报, 从而能够让相关部门及时做出反应, 降低森林火灾所造成的损失。
3 智能识别与行为分析技术发展中所遇到的问题
智能识别与行为分析技术虽然在近几年来发展迅速, 但是如果想要实现完全的智能化, 该项技术依然面临许多问题, 主要包括以下几个方面:
3.1 智能分析算法的需要进一步提高
智能分析算法对许多复杂且异常的行为建模困难;选定目标的特征或背景一旦与某些目标的特征背景较相似就很容易产生信息获取困难的情况;监控跟踪的目标一旦被某些物体所遮挡, 就容易产生跟踪目标的很多信息缺少的情况;一旦跟踪的目标拥有较高的移动速度, 就会使在一定程度上降低跟踪目标的有效性。这些情况的产生会导致报告信息出现错误、报告信息的不完整等问题。
3.2 缺乏该项技术使用的针对性
因为每个行业都具有自身的特点, 所以对智能识别与行为分析技术的使用情况也大不相同, 想要满足不同行业的多样化的使用需求, 就要根据每个行业的特点进一步挖掘该技术的不同功能。
3.3 没有一个统一的行业标准
现今的安防设施生产公司大部分是独立地进行智能识别与行为分析技术的开发及相关技术设备的生产, 没有一个统一的、公认的行业标准, 这在很大程度上影响了使用客户对智能识别与行为分析技术系统进一步发展的信心。
4 结束语
智能识别与行为分析技术未来的发展前景无疑是广阔的, 该技术的发展应该依据社会发展的需要, 大胆进行技术创新, 向着应用行业化、集成化、智能化的方向努力迈进。相信经过科学技术的不断发展, 智能识别与行为分析技术的明天会更加美好。
摘要:随着人们生活水平的不断提高, 人们的安全意识也越来越高, 对社会公共安全也越来越关注, 政府部门也加大了对其的资金投入, 智能识别与行为分析技术的发展对社会公共安全的保障起到了十分积极的作用。本文笔者通过对智能识别与行为分析技术的了解和学习, 阐述了智能识别与行为分析技术的产生和发展, 分析了智能识别与行为分析技术在现实社会中的具体应用, 并对智能识别与行为分析技术在今后发展中的应该解决的问题进行了说明。
关键词:视频图像,智能识别,行为分析,应用与发展
参考文献
[1]周杰.智能视频分析技术初探[J].城市建设理论研究 (电子版) , 2012,
[2]刘忠会, 李长福.地基虚拟加载有限元仿真与智能识别系统研究[J].山西建筑, 2011,
基于视觉的人体行为识别研究 篇7
1人体行为识别常用方法
人体活动是一种非常复杂的运动, 由于人体的活动是非常自由的一种存在, 难以预料, 甚至会随着人体衣着打扮各不相同, 直接导致运动着的人体外观产生很大差异, 这就使我们对其研究时产生了很大的困难。在人体行为识别对技能视频监控, 人体运动分析, 自然人机交互, 虚拟现实等等广泛运用的今天, 我们却始终无法找到专门的系统对人体行为进行识别与分析, 如果将人体行为识别看出一个分类问题, 一般的解决方法如下:
1.基于时空的方法
近几年来愈来愈多的学术专家开始对人体行为识别产生了兴趣, 由于这个领域的缓慢发展, 导致了行为识别的部分专家学者开始着力于对基于时空进行研究, 渴望利用时空兴趣点构成集合用以表示人体行为动作, 对于此类研究我们一般都是使用三维立体来表示图像的特征, 希望可以通过泊松方程的求解特性来进行分析, 通过使用计算机对这些特征的提取识别从而取得较好的识别率。这是一种基于空间和时空特征的混合层次模型的人体识别方式, 如果想要提高识别率的话, 是需要我们通过利用模型的静态形状特征的。
2.基于状态空间的方法
基于状态空间的方法是人体行为识别中另一种较为常用的识别方法, 主要的思想是人体的行为集合成一个状态, 通过每个静态的姿势串联在一起。运用一些动态的概念网络将这些状态联系起来, 因为其具有良好的鲁棒性, 因此被广泛的应用在人体行为识别中, 但是计算复杂度高就成为了她的缺点。但是就是在今天, 层级隐马尔可夫的提出, 使得模型对人体行为进行识别并取得了很好的识别效果, 也是因为HMM不能对三个或者以上的独立过程进行有效处理, DBN存在的结构也可以发生任意的改变, 因此达到了降低计算的复杂性的目的。
3.基于人体模型的方法
基于人体模型的方法实质上是需要我们通过对人物身体部位分析来达到识别人体的一些行为方式。需要我们通过人体部位, 包括头, 躯干, 手, 膝, 脚等等部分来准确找出人体运动中存在的一些信息, 从而提高识别系统的识别率。人体模型主要分为两种, 一种是2-D轮廓模型, 另一种则是3-D立体模型, 2-D模型主要是用于智能的监控, 3-D模型的运用, 将人体运动学的先验知识和人体行为这种发展的东西向结合而进行描述和分析。由于人体模型的方法能够在测量中准确的表达出人体运行的相关信息, 所以适合在复杂行为中进行分析与理解。
2基于视觉的人体行为识别的运动目标提取
人体运动检测的主要任务是从图形序列中检测感兴趣的运动目标, 这是基于视觉的人体行为识别中最基础的一个环节如图1所示。虽然实际情况中国由于受到光照, 天气等因素的影响, 会影响其检测的进行, 在对其进行核算研究时, 我们只要一些算法的复杂性, 稳定性和实时性也考虑进取, 从而选取出较为适合的算法, 还是可以适当的改进的。
静态背景和动态背景下的运动检测都是属于运动目标检测的一种, 静态背景下的运动检测, 检测点是不会发生移动, 我们一般将监测点安放在一个固定的点例如银行的路口进行监视的摄像头, 当然对于固定点的选择也是非常关键的。而动态背景下的运动目标检测则是指需要将检测点随着目标移动的, 这样有利于获取到第一手的资料例如装在飞机或者卫星上的监控系统, 运动员运动过程中的跟拍等等, 相对于静态背景下的目标提取, 动态背景下的则更为发杂, 检测算法也更为多变。
3基于视觉的人体行为识别的特征提取
特征提取是计算机视觉和图像处理中的一个概念, 她根据计算机提取的图像信息, 决定了每个图像的点是否属于一个图像的特征。一般我们都是通过对某一模式的组测量值进行变换, 以此来突出该模式具有代表性特征的一种方法, 迄今为止特征没有万能和精确的定义, 因此一个算法是否成功往往还是有它使用和定义的特征来决定的, 在制定的场所提取出的相关特征, 一般来说都是相同的。
1.初级运算
特征提取是图像处理中的一种初级运算, 它是我们在对一个图像进行的运算处理时作出的第一个运算过程, 它需要通过详细的检查每个像素以此来确定该像素是否代表一个特征。组委特征提取的一个前提运算, 输入图像一般通过高斯模糊核在尺度空间中被平滑。
2.寻找特征
特征提取需要许多的计算时间, 且可以使用的时间也是存在限制的, 由于许多计算机图像算法使用特征提取作为其初级计算步骤, 因此大量的特征提取算法被发现, 其提取的特征也是各式各样的。
4结语
基于目标跟踪的群聚行为识别 篇8
关于群体行为识别的研究方法主要有3类: (1) 基于目标的方法。该类方法将群体考虑成由单个目标组成, 群体行为的识别就是在单个目标检测、跟踪的基础上进行识别, 这种方法适用于背景环境较为简单、目标之间没有严重的遮挡的情况。比如, 国内采用的目标提取、多人跟踪方法, 可在简单的场景中同时跟踪十几人, 从而判断是否存在异常情况。 (2) 从整个监控场景的角度分析, 提取场景中特别的信息特征。通常提取的特征有纹理、梯度和光流特征。目前, 国外采用较多的是建立模型的方法, Andrade等人从视频中提取出光流作为特征信息, 并采用基于隐马尔科夫模型 (HMM) 的检测方法检测群体中的紧急或异常事件;Rahmal等人采用纹理作为特征, 建立了异常行为模型, 可识别群体异常行为。 (3) 将上述2种方式结合起来, 既可分析整个监控场景, 又能跟踪单个目标。在该方法中, 可提取纹理光流等特征, 并建立群体异常行为模型, 适用于环境较为复杂的场景, 对外界环境的要求不高, 但是从实际应用的角度看, 其算法过于复杂, 不利于实现。基于目标跟踪的方法, 对视频中的每个个体都有较好的跟踪和状态记录, 既可以判断单个目标的行为, 也可以识别多个目标间的群体行为, 且基于目标识别算法, 相比于现有的视频监控平台而言更容易实现。因此, 本文主要提出了一种基于目标跟踪的群聚行为识别算法。
1 运动目标的跟踪
人体行为分析是指对视频序列中的运动人体进行检测、跟踪、理解和识别其行为。整个处理步骤如图1所示。目标检测、目标跟踪是实现行为理解和识别的基础, 也是需首先研究的任务。
1.1 多传感融合思路的目标跟踪
常用的目标跟踪算法有帧差法、Kalman滤波、模板匹配法和Mean Shift跟踪算法等, 大体上可分为基于运动分析的方法和基于图像匹配的方法。基于运动分析的方法计算速度较快, 但当背景环境较复杂且稳定性较差时, 容易出现跟丢目标的现象;基于图像匹配的方法在目标有平移时可获得较好的处理效果, 对图像噪声和光照变化有一定的鲁棒性。
本文通过结合运动分析与图像匹配方法, 提出了一种多传感融合思路的目标跟踪算法。模板匹配与Cam Shift结合可简洁、快速地跟踪目标, Cam Shift的每一帧可不断调整搜索窗口的大小, 模板匹配的模板大小也会随之改变, 从而增强了匹配的可靠性。同时, Kalman滤波可实现目标位置的预测, 可解决目标运动过快、有少许遮挡引起的问题。主要跟踪步骤如下。
第一步, 确定要跟踪的目标。确定跟踪目标在当前帧中的位置坐标 (n Center X, n Center Y) 、跟踪目标的大小 (n Half Width, n Half Height) 和初始化搜索模板的宽度和高度 (m_Template W, m_Template H) 。
第二步, 初始化模板匹配的模板、Cam Shift跟踪的色彩概率分布图和滤波器。
第三步, 根据前一帧得出的运动目标的位置和大小, 在稍大范围内使用帧差法计算一个新目标的位置, 可用矩形框 (m_Diff Rect) 表示。
第四步, 采用模板匹配跟踪算法, 搜索当前帧中与参考模板最匹配的图像区域的位置 (n Center X1, n Center Y1) ;根据跟踪目标在最近15帧内的运动轨迹信息, 运用Kalman滤波器预测出目标在当前帧中可能出现的位置 (n Center X2, n Center Y2) ;采用Cam Shift颜色跟踪法, 根据前一帧确定的目标窗口的大小和色彩概率分布图, 找出目标在当前帧中的位置 (n Center X3, n Center Y3) 和调整后的窗口大小 (n Half Width, n Half Height) 。
第五步, 计算模板匹配、Kalman滤波和Cam Shift跟踪预测出的运动目标中心位置与帧差法计算出的运动目标中心位置的偏移 (ddist1, ddist2, ddist3) , 剔除与帧差法检测结果相差较大的结果。
第六步, 针对每一种特征得到的目标位置结果, 计算中心目标区域及其周边背景区域的概率分布图像直方图, 根据中心直方图和周边直方图的差异计算每种特征在确定目标位置时所占的权重;实现跟踪过程中的自适应调整权重;使用加权等方法融合步第四步中的位置坐标, 得到当前帧目标跟踪的结果 (n Center X, n Center Y) 。
第七步, 如果Camshift跟踪有效, 则使用Cam Shift跟踪窗口的大小, 并作为新目标的大小, 否则, 以帧差法得到的结果作为新目标的大小。
第八步, 更新跟踪目标的大小、模板匹配的模板和目标区域的颜色概率分布图, 并不断重复第三步至第六步, 以实现运动目标的跟踪。整个流程如图2所示。
1.2 多目标跟踪
采用多线程的方法可实现多目标的跟踪, 每个目标的档案会被记录在目标池中。多目标跟踪流程如图3所示。
视频帧中的每一个前景区域都包含了其中心位置的坐标、长度、宽度、面积和轮廓等数据信息, 可使用最邻近法对帧与帧之间的数据进行数据关联。在目标池中查找中心位置与目标数据n中心位置最接近的一个目标, 如果目标数据n与目标池中所有的位置坐标距离都超过了固定阈值, 则判断该前景区域为一个新目标, 进而在目标池中为该目标建立目标档案, 包括目标位置、目标大小、匹配模板、颜色概率图和最后活跃时间等数据, 并更新目标池。否则, 将使用多传感融合算法对该目标进行跟踪, 跟踪结束后更新目标池。在每一帧结束时, 对整个目标池进行遍历, 查找并删除长时间没有活跃的目标数据后, 开始下一帧的目标跟踪。
图4为对视频中的2个人同时跟踪的效果, 依次为视频中的第170帧、179帧、184帧和190帧, 实现了同时对2个目标的跟踪, 跟踪效果较好。
2 群聚行为的识别
2.1 轨迹拟合
多传感融合目标跟踪方法可以得到目标在每一时刻的位置信息, 连接这些位置坐标可得到目标的运动轨迹。原始运动轨迹是不平滑的, 且不能用一个合理的数学公式表达, 这就需要拟合当前的轨迹, 使其变得平滑, 并能用一定的规律描述。本文中采用二次B样条拟合目标的运动轨迹。
B样条曲线是分段定义的, 可定义1个m+1段n次的参数曲线, 顶点为Pi (i=0, 1, 2……, m+n) 。则:
式 (1) 中:Pi, n (t) 为第i段n次B样条曲线段 (i=0, 1, 2……, m) , Bk, n (t) 为n次B样条基函数, 也称为B样条分段混合函数。
本文为了简化计算复杂程度、提高效率, 使用二次B样条拟合目标轨迹。在二次B样条曲线中, n=2, k=0, 1, 2, 分段表达式为:
采用多特征融合目标跟踪技术, 对视频中出现的多个相互靠近、没有遮挡的人进行跟踪, 得到每个人的运动轨迹 (Cen X[i], Cen Y[i]) ;将目标的轨迹分段, 从当前最新的目标位置开始, 每次向前选取40帧的一段轨迹值拟合为一条曲线, 拟合出的目标运动轨迹结果如图5所示。在图5中, (a) 中的红色曲线为原始轨迹, (b) 和 (c) 中的绿色曲线为经过二次B样条拟合的轨迹。
2.2 轨迹预测
分段二次B样条曲线是一条抛物线, 由m个顶点定义的二次B样条曲线, 实质上是m-2段抛物线 (相邻3点定义) 的连接, 并在接点处达到一阶连续。
基于二次B样条曲线具有的几何性质, 实验中采用了距离当前位置最近的分段二次B样条抛物线模拟目标当前的运动趋势, 以达到预测目标将来的运动轨迹的目的。图6为分别对该段视频中2个目标的跟踪和轨迹预测, 其中, 绿色曲线为前一段时间内目标的移动轨迹;蓝色曲线为使用分段二次B样条抛物线拟合得到的目标预测轨迹。
2.3 目标运动方向的分布特性
在发生群聚事件时, 虽然多个目标的运动方向杂乱无章, 但是, 有向一个共同方向运动的趋势, 即运动区域趋于集中。统计目标的预测轨迹在图像中的分布特性, 可实现目标是否有集中运动趋势的检测。主要步骤如下。
第一步, 将整个图像按照一定的大小均匀划分为多个小块。如果整个视频图像的大小为320×240像素, 划分出的每个小区域大小为20×20像素, 则会产生16×12个小块, 并为每个小块设置一个聚集程度系数Ci, j。
第二步, 在一帧图像中, 统计目标预测轨迹经过各个小块的次数, 有目标地预测轨迹经过某个小块时, 便进行了1次累加, 累加和越高的, 则说明有多个目标将来到达该区域的可能性越大。在此情况下, 可判断在某一帧中是否有多个目标朝一个方向集中运动的趋势, 累加和最高的小块是最可能发生聚集的位置。
第三步, 使用Ostu算法, 对所有小块的累加和进行阈值分割, 并在每一帧中自适应调节找到1个合适的分割阈值Tc。
第四步, 将阈值Tc与每个小块的累加和对比。如果某个小块 (i, j) 的累加和大于阈值Tc, 则表示此小区块是可能发生聚集的位置, 聚集程度系数Ci, j递增;当连续Tf帧某一个小区块都是可能发生聚集的位置, 即聚集程度系数Ci, j≥Tf时, 判断可能会发生群聚事件, 并发出警告。整个实验流程如图7所示。
3 实验结果
该实验中选择的视频是在校园环境中自行拍摄的群聚行为, 视频中目标之间的遮挡不是很严重, 可以实现多目标跟踪。图8为对多目标进行跟踪、轨迹拟合和轨迹预测的结果, 目标的预测轨迹随机分布在各个小块中。
图9为对群聚事件检测得到的结果, 每一行的第一幅图为对目标轨迹进行拟合和预测得到的结果;第二幅图为统计该帧中预测轨迹在图像中分布特性的效果图, 图中像素值越高、图像越亮的小块表示目标轨迹经过此处的次数越多, 此小块发生聚集的可能性也越高。
第267帧、295帧和306帧时图像的第11行9列连续25帧以上累加和超过了阈值, 即C11, 9>25, 判断为已发生群聚事件;第276帧、286帧时第10行第9列和第11行第9列中各有1个小块被标记为白色, 表示正在发生群聚事件。
4 结束语
本文针对日常生活中常出现的群聚事件, 提出了基于目标跟踪的群聚事件识别方法。该方法在场景中运动目标数较少时, 能准确识别群聚事件。然而, 对于背景环境较为复杂且目标过多的情况, 还需要进一步优化目标跟踪算法和识别算法, 这些将在后续的工作中进一步展开。
参考文献
[1]N.Haering, P.Venetianer, A.Lipton.The evolution of video surveillance:an overview[J].Machine Vision and Applications, 2008 (19) :5.
[2]钟徳华, 夏翠艳, 宋启敏, 等.多目标跟踪算法的研究与应用[J].计算机测量与控制, 2008, 16 (2) :846-848.
[3]高峰, 雷志勇, 易娟.基于模板匹配的目标跟踪技术[J].计算机应用, 2008 (10) :34-36.
[4]谢之宇, 蒋晓瑜.基于多线索融合的目标跟踪算法研究[J].计算机技术与发展, 2011, 21 (3) :125-131.
行为特征识别 篇9
关键词:图像处理;特征优选;玉米品质识别;支持向量机
中图分类号: S126;TP391.4 文献标志码: A
文章编号:1002-1302(2015)03-0382-03
玉米籽粒的性状属性能够在很大程度上体现出其品种与品质,因此对玉米种子的形态特征进行提取,对其变化规律进行统计,具有比较重要的意义。传统的方法是采用人工方法进行识别及检测,效率低且准确度不足。随着信息技术在农业的应用逐步深入,当前已有不少研究成果引入图像处理技术对玉米籽粒的外部形态进行分析或统计[1-4],但这些成果多局限于籽粒的体积、密度、质量等常规指标。而玉米种子内部的生理生化特征与其形态特征、颜色特征及纹理特征等均有着密切的关系,这些变量参数较多,参数间又有一定的相关性,如何能够在优化精简指标的基础上保持足够的识别及检测的准确度,是一个亟待解决的问题。本研究首先对提取的玉米籽粒图像进行预处理,然后提取其颜色特征、形状特征及纹理特征等多个属性,以主成分分析的方法对指标进行精简,在保证识别精度的前提下去除冗余信息,降低图像计算复杂度,增加图像分析识别的速率,对品种进行分类与评价。本研究成果为农作物籽粒的无损检测提供了借鉴。
1 材料与方法
1.1 材料
1.1.1 样本采集
以华北地区比较常见的沈玉26、中地77、博诚6等3个品种作为样本,3类种子的外观彼此较类似,色调基本是黄色的。
1.1.2 图像采集设备
设计如图1所示的种子图像采集设备。其中,摄像孔的直径为5 cm,升降杆可以在25~40 cm之间调节,光源为LED灯,以普通尼康数码相机作为采集器件,主光源可以选择LED灯,也可以选择相机闪光灯,本试验选择了8×8阵列LED灯,调节角度之后使图像不存在阴影。
1.2 方法
1.2.1 图像预处理
1.2.1.1 灰度处理
所采集的玉米种子原始图像属于24位真彩图,含有RGB 3个分量。为了使后续处理计算量减少,对其进行灰度化处理,通过3個步骤实现:
(1)分别提取目标图像RGB的具体值;
(2)求出具体的灰度值gray;
(3)令R=B=G=gray,最终实现图像灰度化。
灰度化的图像(部分)如图2所示。
1.2.1.2 中值滤波处理
在对玉米籽粒图像进行处理时,还应考虑到原始图像中可能由于一些外部干扰而掺杂的噪声成分[5]。噪声的存在会对图像质量造成比较直接的影响,进而降低籽粒各类特征的提取准确性[6-7]。因此,本研究在灰度预处理的基础上,继续以中值滤波对图像进行进一步处理。中值滤波的主要原理是,将图像分为不同的窗口S,窗口里的所有像素进行大小排列,将中位灰度值作为该窗口的灰度值。中值滤波已被证实能较为有效地避免图像细节的模糊,并滤除颗粒噪声及脉冲噪声,尽量保持图像边缘的有用信息。本研究将滤波模板定位于3×3,实现样本图像的增强。
1.2.2 图像分割
该步骤将玉米籽粒从图像背景中分离出来,以便于下一步的特征提取及分析。本研究分割图像采用的是阈值法,得到的是玉米籽粒的二值图像。对图像的每一个点,高于该阈值则取1,低于该阈值则取0。通过“试错法”可知,在阈值为0.4时可以较好地分割玉米籽粒目标。图3所示为经过阈值分割之后的玉米籽粒图像样本(部分)。
1.2.3 特征提取
对玉米籽粒样本图像的特征集F进行提取,选择三大类特征:形状特征、颜色特征、纹理特征。
1.2.3.1 形状特征提取
形状特征可以体现玉米籽粒的外形属性。对以下主要形状特征进行提取:
F1:面积——玉米籽粒投影图像包含的像素总数,是体现玉米种子品质的重要参量之一。
F2:周长——玉米籽粒投影图像轮廓线的长度,与F1特征一起来反映玉米种子的大小。
F3:圆形度——玉米籽粒的边缘与标准圆形的相似度,能够体现玉米种子是否规则。
F4:直径——玉米籽粒边界最小外接圆的直径。
F5:延伸度——玉米籽粒最长轴与最短轴的比值,体现玉米种子的形状。
每种玉米品种籽粒随机选取200粒,进行形状特征提取,分别得到5个特征值。以沈玉26为例,其形状特征如表1所示。
1.2.4 特征优选
对籽粒样本提取了大量特征之后,由于指标数目多,且有些指标之间具有较强的相关性,因此如果直接以所有指标进行识别,会由于数据的冗余而降低识别效率。
本研究引入主分量分析法进行特征优选。基本思路是:把待精简的所有指标表示为向量,对所有的特征数据进行降维处理,从而使这些特征属性表示为线性组合,选取前n个对识别效果影响最大的主成分,实现特征的优选。具体步骤如下:
(1)首先使各类特征数据标准化,避免量纲的影响:
2 结果与分析
2.1 玉米品种识别
不同品种的玉米籽粒在各类特征属性的统计值方面有着明显的不同,因此对玉米种子的品质评估前,应对其种类进行识别。结合本研究提取出的玉米籽粒形状、颜色、纹理特征集F∈(F1,F2,…,F30),以主成分分析法提取出其中的10个主成分F∈(F2、F1、F4、F5、F24、F25、F26、F13、F15、F3)来作为识别时所使用的玉米籽粒属性集,对样本进行品种识别。样本来自沈玉26、中地77、博诚6等3个品种,以随机抽取的方式选取50%(各100幅,共300幅)的图像作为构建SVM的测试集,其余50%(各100幅,共300幅)作为测试集。支持向量机的输入为10个主成分。进行玉米品种识别,识别结果如表6所示。
nlc202309031502
由表6数据可知,采用SVM方法对沈玉26、中地77、博诚6等3个品种的玉米籽粒进行种类识别,在训练样本和测试样本均为100的情况下,其识别率均达到较为满意的效果,其中沈玉26的识别率最高,达96%,平均识别率为93.3%。
2.2 不合格籽粒识别
对不合格籽粒进行自动识别,是玉米种子品质评估的重要步骤。不合格粒包括虫咬、霉斑、不完整、杂质(如石子)等等,本研究选取其中一些典型的不合格粒类型,包括霉变、不完整、破碎、石子等几种进行识别。SVM的输入为10个主成分F∈(F2、F1、F4、F5、F24、F25、F26、F13、F15、F3),识别率如表7所示。
由表7中数据可知,对霉变、不完整、破碎、石子等不合格粒以SVM识别,其识别率均较为满意,其中霉变粒识别率最高,达97.2%,石子粒识别率较低,为91.0%,平均识别率为94.5%。
可以证实本研究的特征优选方法能够应用于对玉米种子的品种识别与籽粒等级评估中。
3 结束语
如何能够以无损的方式实现农作物种子的快速准确检测,是我国粮食产业的一个关键问题。本研究在机器视觉下提取玉米籽粒的大量特征,并以主分量分析方法對这些特征进行简化,使识别算法的精度和效率得到提升,对作物种子的品质评估与品种识别具有比较好的借鉴意义。
参考文献:
[1]杨爱国,张世煌,李明顺,等. CIMMYT和我国玉米种质群体的配合力及杂种优势分析[J]. 作物学报,2006,32(9):1329-1337.
[2]杨国虎,欧阳一沁,李 新,等. 外引优异玉米种质形态性状的初步鉴定[J]. 种子,2006,25(9):100-102.
[3]Nelson S O. Dimensional and density data for seeds of cereal grain and other crops[J]. Transactions of the ASAE,2002,45(1):165-170.
[4]闸建文,陈永艳. 基于外部特征的玉米品种计算机识别系统[J]. 农业机械学报,2004,35(6):115-118.
[5]王 静. 基于图像处理技术的烟叶病害自动识别研究[D]. 昆明:昆明理工大学,2011.
[6]齐 龙,马 旭,张小超. 基于BP网络的植物病害彩色图像的分割技术[J]. 吉林大学学报:工学版,2006,32(S2):126-129.
[7]王惠明,史 萍. 图像纹理特征的提取方法[J]. 中国传媒大学学报:自然科学版,2006,13(1):49-52.
[8]刘丽娟,刘仲鹏,程 芳. 玉米生长期叶部病害图像识别预处理研究[J]. 河南农业科学,2013,42(10):91-94.
基于中面的注塑产品特征识别 篇10
产品的设计决定了后续工艺的可行性, 在注塑产品设计前, 需要对产品进行可成形性分析, 以便及早发现产品设计对后续模具设计和成形工艺有何不良影响。由于注塑产品结构的复杂性, 设计者很难逐个检查结构的合理性, 而自动化的成形性分析系统无疑是比较有效的检测手段。编写这种自动化成形性分析系统的关键是此系统能够自动从产品几何模型中提取设计特征。
自动特征识别是CAD向CAPP、CAM传递信息的重要手段, 包括基于面表示和基于体积表示的自动特征识别方法, 这些方法大多面向机械加工特征, 面向注塑产品或包含自由曲面的自动特征识别方法并不多见[1]。
1 注塑产品特征识别现状
与机械加工零件不同, 注塑产品一般由壁厚均匀的几何实体构成, 几何拓扑关系复杂, 用识别加工特征的算法识别注塑产品特征十分困难[2]。
文献[3]提出了一种基于图的注塑产品侧凹特征识别方法, 建立并应用扩展面属性邻接图对凹特征、凸特征及通孔三种类型的侧凹特征进行描述, 采用子图匹配的方式将侧凹特征的子图从产品面属性邻接图中识别出来。
文献[4]提出了一种基于面的自由曲面加工特征识别方法, 该方法能够从一系列复杂的曲面中确定加工区域, 但由于应用领域的差异, 这种方法很难应用于注塑产品的特征识别。
文献[5]提出了一种基于体的特征识别方法, 用于识别注塑产品中的侧凹特征。其创新点在于利用凸分解方法对相交特征进行解释。该方法仍然沿用了加工特征识别的思路, 且仅用于识别侧凹特征。
此外, 文献[6]提出了一种基于CAD模型的STL表示的特征识别方法。该方法根据三角形面片之间的法向量信息, 确定特征区域, 识别相应的特征, 用于计算STL模型与原始CAD模型之间的误差。
2 基于图的中面模型表示
中面模型的概念广泛应用于有限元前处理中。从数学描述上看, 实体模型是流形结构, 即在拓扑结构中, N维拓扑形体只能由有限个 (N-1) 维形体组成;而中面模型是非流形结构, 即N维形体不但可以由有限个 (N-1) 维形体组成, 而且还可以包含 (N-2) 、 (N-3) 、…、0维形体的信息[7]。从几何上看, 中面模型是利用假想的位于三维实体中心位置的二维平面来表示零件的几何模型, 模型中的面不具有封闭性, 不能构成一个体, 并且存在悬面、悬边;而实体模型中的面的集合具有封闭性, 能构成一个体, 不存在悬面、悬边。
基于图的特征识别方法的搜索策略是, 解析CAD模型的面属性邻接图的结构, 并与特征的面属性邻接图进行子图匹配, 以识别特征。以图1所示的L形零件为例, 它包含8个面、18条边, 传统的方法是利用边的凹凸性、边的分裂情况与特征子图进行匹配的。图2是L形零件的面属性邻接图。
对于注塑产品的特征识别来说, 实体模型的面属性邻接图是基于B-rep表达的, 冗余的几何拓扑信息过多。而中面模型实际上是对实体模型进行了降维简化处理:注塑产品在几何外形上一般是壁厚均匀的, 因此可在壁厚方向上, 将三维的实体用二维的面表达, 二维的面用一维的边表达, 这样仅表达其几何外形的“骨架”, 保留必要的信息用于解析图结构或进行子图匹配。
中面模型是非二维流形结构, 边的连接面数量可以为任意值, 且存在悬面和悬边, 因此面与边的关系不满足二维流形拓扑结构, 无法采用面属性邻接图方法表达。本文对其改进后, 提出一种表示非二维流形拓扑结构的方法:面-边属性图。在这种图的结构中, 面和边都作为节点, 面与面之间通过边连接, 边要么作为共享边与多个面连接, 要么仅与一个面连接, 构成图的叶子节点。
以图1所示的L形零件为例, 其中面模型和面-边属性图表达如图3所示。由图3可以看出, 中面模型的拓扑结构比实体模型简洁得多:由10个面构成的实体模型, 在忽略其壁厚信息的中面模型中, 仅2个面就可表达;边的数量也由18条减少为7条。
(a) 拓扑结构 (b) 面-边属性图
3 相关定义
定义1 设中面模型由n条边和m个面构成, 则以面为行、以边为列构成m×n阶面-边属性矩阵, 矩阵元素的值表示相应的面和边的包含关系, 即某个面如果包含某条边, 则相应元素置为1。
以图3所示的L形零件为例, 面-边属性矩阵如下:
矩阵的行信息表明某个面的所有构成边, 包括内边界和外边界, 矩阵的列信息表明包含某条边的所有面。
定义2 为了有效地实现特征识别, 定义边的属性集AE (AE={A1, A2, A3, A4}) :
(1) A1表示边所属的边环号, 说明边是哪一个边环的组成边。边环分为外部边环和内部边环两类。
(2) A2表示边的阶次。说明在中面模型中, 该边被面使用的次数。如果为1, 则表明该边为悬边 (如图3中的E6) 。
当一条边仅有一个端点与面的边环连接时 (如图4中的E1) , 为保证边环的封闭性, 采用图4中的连接方式:在边环的边链表中, 同一条边被使用两次, 但两次使用时边的起点和终点相反。
(3) A3表示边的凹凸性[8]。
(4) A4表示边的封闭性, 0为不封闭, 1为封闭。如果边封闭, 表明该边单独构成了一个边环, 如封闭圆环构成的边环。
4 特征分类和识别
对于注塑产品, 特征的几何形状与功能有密切的关系。本文定义了最为常见的三类特征:面特征、连接特征、加强特征。
4.1面特征
面特征存在的必要条件是:一个面存在内环或内部边。根据内环或内部边的特征, 又可细分为孔特征、凹陷特征、凸起特征和翼面特征。
4.1.1 孔特征
这里指在注塑件侧壁或底面薄壁上的通孔, 其轮廓可以是完整的圆、线段或曲线段围成的封闭曲线构成的异形孔。
孔特征存在的判据是:某个面中包含一个内环 (如图5a中的E5) , 同时该内环的每条边都没有被其他面所共享。如图5b所示, 属于F1面的边有E1、E2、E3、E4、E5, 通过查询边的属性可知E5为内部边, 单独构成内部边界环, 且仅属于面F1, 因此面F1内存在一个孔特征, 其边界为E5。内环可以由多条边组成, 构成各种形状的孔, 通过这些边的几何特征可以判断孔的类型, 如三角形孔、四边形孔等。
(a) 拓扑结构 (b) 面-边属性图
4.1.2 凹陷特征
凹陷特征存在的判据是:某个面存在内环, 且环的每条边均为凸边;同时对于共享这些凸边的面的外边环, 除共享的凸边外, 其余每条边均为凹边。从内部边环开始, 查找所有与其邻接的面, 并查找这些邻接面所包含的外部边界边, 对它们构成的边界环进行判断:是否构成面的外边界环。如果存在边界环没有构成面的外边界环, 则说明凹陷特征存在孔洞, 定义为Ⅰ型凹陷特征;如果都构成了面的外边界环, 则说明该凹陷特征是封闭的, 定义为Ⅱ型凹陷特征。图6a中E5、E6、E7、E8是邻接面的边, 但它们构成的边环不是任何面的外边界, 因此这些邻接面构成了Ⅰ型凹陷特征;用同样的方法可以判断, 图6b中的邻接面构成了Ⅱ型凹陷特征。
(a) Ⅰ型 (b) Ⅱ型
4.1.3 凸起特征
与凹陷特征相反, 凸起特征存在的判据是:某个面存在内环, 且环的每条边均为凹边;同时对于共享凹边的面的外边环, 除共享的凹边外, 其余每条边均为凸边。与凹陷特征类似, 根据边界环是否都构成面的外边界判断是Ⅰ型还是Ⅱ型凸起特征, 如图7所示。
(a) Ⅰ型 (b) Ⅱ型
4.1.4 翼面特征
翼面特征存在的判据是:两个面的共享边是其中一个面的内部边 (如图8中的E1和E2) , 且该边本身不封闭。值得注意的是:一条拓扑边在几何上可能是由多条直线段或曲线段构成的非封闭边, 因此翼面特征可能由多个面构成。根据注塑产品成形的原理, 这些面仅应构成一个翼面特征。在图8a中, E1和E2应合并为一条边, F1和F2应合并为一个面。
(a) 拓扑结构 (b) 面-边属性图
面特征识别算法如下:
(1) 查询面-边属性矩阵, 判断面是否包含内部边或内部边环, 或边在同一个面中使用次数是否为2。
(2) 如果存在内部边环, 则查找该面的相邻面:①如果没有相邻面, 则该边环构成了孔特征, 通过检查边环的几何特征, 可以判断孔特征的类型, 如圆孔、方孔、多边形孔等;②如果有相邻面, 则判断内部边环的凹凸性, 若为凹边, 则存在凸起特征, 若为凸边, 则存在凹陷特征;③对相邻面继续步骤①和②, 直到从某个面出发找到所有的面特征为止;④对于凸起特征, 查找所有相邻面包含所有边的构成的外部边环, 如果存在外部边环没有构成某个面的边界, 则为Ⅰ型凸起特征;反之则为Ⅱ型凸起特征;⑤对凹陷特征执行④的算法, 确定凹陷特征的具体类型。
(3) 如果存在内部边, 则查找与该边相连的边, 将它们合成一条边, 包含这些边的面合并成一个面, 共同构成翼面特征。
由于对面特征进行了递归的识别算法, 因此算法完成后, 可以将面特征所包含的面和边从面-边属性矩阵中删除, 并重构矩阵, 简化后续特征识别算法。
4.2连接特征
连接特征包括T形和X形连接特征。连接特征存在的判据是:一条边连接面的数量大于3, 即在面-边属性矩阵中, 某条边对应的列非零元素之和大于3, 且每条边在每个面的使用次数均为1, 则存在连接特征。如果和为3, 且3个面的夹角为90°, 则为T形连接特征, 如图9所示;如果和为4, 且4个面的夹角为90°, 则为X形连接特征, 如图10所示。
面夹角的计算方法是:计算面的边界边环任意两个相邻边的叉积, 得到面的法向量;将其中一个面的法向量向另一个面的法向量投影, 得到的角度即为这两个面的夹角。
4.3加强特征
在注塑产品中, 加强特征的作用是对产品的壁面或面特征进行加固, 包括肋板特征和支撑板特征。支撑板特征的特点是:在一个面中, 有2条边的阶次为3且相连, 至少有一条边是悬边, 如图11所示;而肋板特征的特点是:至少有3条边的阶次为3且相连, 至少有一条边是悬边, 如图12所示。
在图11a和图12a所示的中面模型中, 括号内的数字表示对应的边的阶次, 计算方法是:在面-边属性图中, 将边与所有面连接的次数相加。如图11b所示的E1, 它与F1的连接次数为2, 与F2连接次数为1, 因此E1的阶次为3。
加强特征识别的算法是:对于模型中的每个面, 得到其边界边环以及每个边的阶次;如果边界边环在某个面上有两条以上边, 则将这些边合并成一条边;如果边环的阶次构成模式是3→3→1, 说明有两个面与加强特征面连接, 存在支撑板特征;如果边环的阶次构成的模式是3→3→3…→1, 说明有超过三个面与加强特征面连接, 存在肋板特征。
5 算法实现及实例
本文提出的算法基于UGNX4.0平台, 注塑产品的设计是利用其三维建模模块实现的。利用软件的中面提取功能, 生成产品的中面模型, 并将其输出为AP203格式的中性文件;由于中面是非二维流形拓扑结构, 利用STEPAP203扩展边界表示法中的类库对中性文件进行几何拓扑构造[9], 生成面-边属性图和面-边属性矩阵;最后利用本文的算法进行特征识别, 输出特征的几何表示。算法实现流程如图13所示。
STEP模型信息复杂而且全面, 在获取中面几何拓扑信息时, 只选择与特征识别有关的信息, 为此, 建立了面向对象的中面模型数据结构, 用于数据存储。其结构如图14所示。
图15所示为测试零件特征识别的实例, 图15a为零件的实体模型, 包括35个面和67条边;图15b为零件的中面模型, 包括17个面和34条边。通过本文提出的算法共识别7个特征, 如图15c所示, 包括:连接侧壁的肋板特征, 由1个平行四边形平面构成;支撑板特征, 由1个三角形平面构成;T形连接特征, 由2个互相垂直的平行四边形平面构成;零件底面上的Ⅰ型凸起特征, 由1个圆台面和1个边界为封闭圆弧的平面构成;Ⅱ型凹陷特征, 由1个圆台面构成;翼面特征, 由1个圆弧面构成;孔特征, 由1个封闭圆弧构成。
以翼面特征的识别过程为例, 通过检索中面模型 (即AP203格式的文件) 底面F2的几何信息可知:有3个圆环和一条不封闭的圆弧 (E1) 位于F2的内部。根据每个圆环的凹凸性和阶次可以进一步判断是否为凹陷特征、凸起特征或孔特征;对于E1, 通过检索所有共享它的面可知其阶次为2, 即除F2外还有F1共享E1, 且构成F1外边环的一部分, 即F1为翼面特征。通过检索F1的几何信息可知它是圆弧面。
特征的几何信息对于下游系统 (如CAM、CAPP系统) 具有重要的价值, 有必要将其从中性文件中提取并输出。以翼面特征为例, 输出格式如下:
Face ID=43 is a FIN with non-planar face;
其中, ID指的是该翼面特征的拓扑实体在中性文件中的标识号。通过解析中性文件, 查找该拓扑实体, 并查找其对应的几何实体, 将相关信息输出。
6 结束语
本文针对注塑产品几何形状复杂和壁厚均匀的特点, 提出了基于中面的特征识别方法。该方法对基于图的方法解析B-rep表达的三维实体模型进行了改进, 用中面模型简化注塑产品的几何形状, 提出了面-边属性图和面-边属性矩阵表达中面模型的拓扑结构, 在此基础上对特征进行了分类并研究了各自的特征识别算法。文中给出的实例表明本文提出的注塑产品特征识别算法的可行性。
进一步的研究工作包括:拓展和细分注塑产品的特征, 并给出相应的特征识别算法, 使其适应更加复杂的几何形状;研究基于中面模型的注塑产品侧凹特征识别方法;研究中面模型中相交特征的识别方法;实现本文提出的特征识别算法与CAD系统环境的集成。
参考文献
[1]花广如, 周雄辉.特征识别的现状与存在的问题及解决方案[J].机床与液压, 2008, 36 (4) :19-22.
[2]Chen Y M, Wen C C, Ho C T.Extraction of Geo-metric Characteristics for Manufacturability Assess-ment[J].Robotics and Computer Integrated Manu-facturing, 2003, 19 (4) :371-385.
[3]邵健, 吕震, 柯映林.基于图的注塑产品侧凹特征识别技术的研究[J].中国机械工程, 2006, 17 (1) :52-55.
[4]Zhang X, Wang J, Yamazaki K, et al.A SurfaceBased Approach to Recognition of Geometric Fea-tures for Quality Freeform Surface Machining[J].Computer-aided Design, 2004, 36 (8) :735-744.
[5]Yin Zhouping, Ding Han, Li Hanxiong.GeometricMould Ability Analysis by Geometric Reasoning andFuzzy Decision Making[J].Computer-aided De-sign, 2004, 36 (1) :37-50.
[6]Belludi N, Yip-Hoi D.High Level Feature Recog-nition Using Approximate and Partial Exact CADModels[C]//Proceedings of DETC’02.ASME2002 Design Engineering Technical Conferences.Montreal, 2002:113-127.
[7]Rezayat M.Midsurface Abstraction from 3D SolidModels:General Theory and Applications[J].Com-puter-aided Design, 1996, 26 (11) :905-915.
[8]李伟平, 谷正气, 邓彪.面向CAD/CAPP/CAM的特征识别技术[J].中国机械工程, 2006, 17 (10) :249-253.
【行为特征识别】推荐阅读:
个体行为特征07-03
思想行为特征07-04
个人行为特征07-28
行为心理特征09-10
行为特征库11-29
消费者行为特征01-08
90后大学生的消费行为特征09-11
关于当代大学生消费行为特征及问题研究09-09
模型特征识别07-22