产品特征提取

2024-06-17

产品特征提取(精选10篇)

产品特征提取 篇1

摘要:基于中文特点,提出一种融合词性标注和统计的产品特征提取方法。该方法利用模式匹配对候选特征词进行裁剪并通过无关词库过滤得到产品特征集。对该方法进行实验验证,实验的数据为通过爬虫技术获得的某天猫服装店服装商品的真实评论信息,实验结果表明了该方法的有效性。

关键词:产品评论,产品特征,特征提取,评论挖掘

1概述

电商的蓬勃发展与规模的迅速壮大,越来越多的人选择网购的同时也导致越来越多产品评论的积累。Web上的评论信息是海量的无结构化数据,企业和客户想要从产品中获得信息只有通过人工阅读的方式进行,而这是一个消耗时间而且容易产生错误的过程[1]。如此处理并没有很好地利用这些数据,既不能及时有效地反馈客户对商品的态度,更难以为企业高层的决策提供辅助,由此“评论挖掘”应运而生。评论挖掘作为非结构化信息挖掘的一个新兴领域,主要涉及网络评论中的情感分析、产品特征提取以及主观内容识别等[2]。与国外比,汉语评论挖掘方法和技术的研究起步较晚,而文化的差异、语言表达方式、词汇语法等差异也注定很多国外的研究成果无法直接应用到中文评论处理上。因此,结合相关文献与研究,本文提出一种简单自动提取出客户评论中的产品特征的方法,实验证明该方法行之有效,可为企业建立评论挖掘系统提供参考。

2 客户评论中的产品特征

产品特征指的是客户、企业、厂方等对产品本身、产品部件、部件的性能或功能上的抽象概括。一般来说,生产商对于产品都会提供一份描述产品各方面功能和性能的说明文件。对于服装产品来说,这份说明除了包括品牌、风格、上市年份、材质等服装的基本属性外,还包括更多的技术细节,但是这些细节客户往往都不太感兴趣。此外,客户评论中对于产品特征的描述是一个开放性的问题,客户可能在产品评论中发表一些企业或厂商根本就没注意到的一些产品特征,而这些特征正影响着广大消费者的购买决策。正因如此,需要从产品评论中提取客户评论中的产品特征[3]。

产品的特征分为显式特征和隐式特征两种[4]。显式特征是直接出现在产品评论中描述产品的性能或功能的名词或名词短语。比如说“好喜欢,尺码挺准,挺合身的”,这里尺码是显式特征。而隐式特征就需要对句子的语义进行理解才能提取出来,并没有在语句中有直接的描述。如“从广州到佛山给我送了5天我就呵呵了”,其实这里指出了产品物流的这个隐式特征。抽取隐式特征需要自然语言的分析和理解技术,但是目前该技术尚不成熟,所以这里所说的产品特征提取是指显式特征的提取。

3 产品显式特征的提取

3.1 人工定义和自动提取

显式产品特征的提取分人工定义和自动提取两类方法。

采用人工定义的方法就是从某特定领域的产品评论库中以人工的方式抽取出产品特征。当产品类型不同或者产品发生改变时,都需要重新构建产品特征集合。这种方法的可移植性、自适应性都比较差,查全率较低。

采用自动提取的方法主要依靠词性标注、句法分析等方法配合其他的提取技术实现。比如利用NLP分词及词性标注技术对客户评论进行解析,从中提取名词或名词短语来作为候选特征词。此方法的优点是处理速度快,但是只依赖词性的提取精确度不高。另外有学者提出基于关联规则挖掘频繁项集并用支持度进行裁剪的方法提取特征词,使用这种方法能提取到高频特征词但对低频特征词提取效果不好[5]。文献[6]提出一种利用互信息(PMI)的特征提取方法。该方法首先提取出频率高于某一阈值的名词或名词短语来作为候选特征词,然后利用搜索引擎计算出候选特征词与产品的互信息,依此确定特征词与该产品的相关性。但是由于是基于搜索引擎的方法,所以在处理的速度上会比其他方法慢许多。

3.2 产品特征提取方法

本文依据中文特点融合多种产品特征提取方法,提出一种简单有效的产品特征提取方法。该方法通过词性标注和统计抽取产品特征候选集,再利用模式匹配对产品特征候选集进行裁剪,最后构建无关词库对产品特征候选集进行过滤,得到产品特征。提取过程如图1所示。

该方法的具体步骤如下:

(1)利用爬虫程序下载服装商品评论。

本文实验数据采用某品牌天猫服装的评论信息,因此需要设计出合适的爬虫程序。网络爬虫是一种自动提取网页的程序,提取的数据是半结构化的HTML结构。

(2)过滤无价值的评论信息并形成商品评论库。

爬虫下载的源文档HTML结构中包含大量的与商品评论无关的内容。如HTML文档的头部和尾部信息、外部资源的链接、客户端脚本程序的定义、文档样式定义等内容,这些内容均属于无价值的内容。另外,由于客户对商品的评论是开放性的,有部分客户会借此做出恶意的推广或误导评论。包含各种联系方式(电话号码、QQ号等)和外部链接的评论基本都属于无价值的恶意评论。

(3)利用中文分词和词性标注工具处理评论库。

通过过滤处理的评论数据组成评论库,评论以句为单位通过分词工具的处理,同时统计计算出词语或短语出现的频率。定义候选词库的数据结构为{A,B,C,D},其中A为词语或短语,B为词性,C为出现频数,D为该词在该句评论中的出现语法模式。如:评论“感觉衣服尺码偏大”,若“尺码”在库中出现10次,则提取结果为{"尺码","/n",10,"/n/n/尺码/a/a"},最后形成由词语和词性标注的有序排列。

(4)抽取候选特征词。

由于产品特征值主要由名词或者名词短语组成,所以本文关注词性标注为名词或名词短语的分词结果并将其抽取为候选特征词集合。每一款服装商品的所有评论都形成各自的候选特征词集。

(5)通过半自动的方法建立停用词库。

为了节省空间、提高提取效率和准确率,需要过滤某些词,这些词称为“停用词”。这些词往往出现频率较高,但却不是产品特征,有的甚至没有什么含义。例如:“给表妹买的,很合身”这样的句式在评论中是很常见的。其中“表妹”一类的人称代词出现的频率较高,而一般的基于概率统计思想的算法往往会将其认为是“高频特征”而错误提取。因此,使用停用词库进行过滤就能较好地解决这一类问题。首先获取其他类型商品的评论信息,按上述方法抽取出这些商品的特征词,最后取这些特征词的交集构建停用词库。但是因为有的特征词如上市时间,物流,外观等属于通用特征词所以需人工挑选出来。

(6)裁剪候选特征词。

通过统计和模式匹配对候选特征词进行裁剪。利用统计的方法选取高频特征词,并在这些已经选取的高频特征词中前后寻找语法模式。然后调整统计的阈值并用语法模式的匹配裁剪以提取低频的特征词。最后通过停用词库过滤得出最终的产品特征词集。

4 数据实验

4.1 特征词集合

由高频特征词以及符合匹配模式的名词组成,最后通过无关词库的过滤的出特征词集合。采用某品牌天猫店中的1132款服装的商品信息和对应的17039条有效评论通过本文方法获取商品特征如下:

其中特征词旁的标号为该词在评论语句中出现的频数,没有标号的词通过匹配模式提取。

4.2 验证与评价

对产品特征提取方法的性能判断,可用查全率和查准率进行评价。产品属性的提取相当于对属性词语的二维分类,即真实属性还是非真实属性、已提取属性和未提取属性的分类。采用列联表(表2)说明如下:

查全率(R)=A/(A+B);

查准率(P)=A/(A+C);

利用人工识别的方法,可做查全率和查准率的计算,并说明上述方法的准确性[7]。以一款男装和一款女装为例,统计结果如下:

某款夏季男装(id:3953xxx0863)

注:K:本文方法正确抽取的产品特征数;M:人工识别的产品特征数;N:本文方法总共抽取的产品特征数;R:查全率;P:查准率。

相对于其他产品特征挖掘方法,本文所提出的方法与其他方法的结果比较如表5所示。以上述两款服装为例,算得查全率和查准率的平均值分别为66.19和85.25。

通过比较,表明本文方法对于商品评论中的特征提取有着较高的查准率,但是明显的查全率偏低,基本保持在66%左右。这主要是由于低频特征词的获取是由匹配模式决定的,个别的产品特征出现频数较少以及网络评论句式的自由化、多样化都给匹配模式的准确构建提出了更高的要求。随着匹配模式的进一步研究与改进,相信将会取得更好的效果,同时这也是本文今后的研究方向。总之,从实验结果来看基于词性标注和统计并利用模式匹配对候选特征词进行裁剪的产品特征提取方法还是比较有效的。

5 总结

产品特征不仅是影响客户做出商品购买决策的重要因素,也是企业为提高产品和服务质量、提高收益的关键。而产品特征提取是产品评论挖掘的重要方面,更直接影响到评论挖掘系统的性能。本文提出的方法能够有效地从商品评论库中提取出商品特征值,并以真实评论数据为实验,表明了该方法的有效性,可为企业构建评论挖掘系统作参考。

参考文献

[1]伍星,何中市,黄永文.产品评论挖掘研究综述[J].计算机工程与应用,2008,4(36):37-40.

[2]李实,叶强,李一军,罗嗣卿.挖掘中文网络客户评论的产品特征及情感倾向[J].计算机应用研究,2010,27(8):3016-3019

[3]郗亚辉,张明,袁方,等.产品评论挖掘研究综述[J].山东大学学报:理学版,2011,46(5):16-23.

[4]王永,张勤,杨晓洁.中文网络评论中产品特征提取方法研究[J].现代图书情报技术,2013(12):70-73.

[5]李培.产品评论挖掘的观点抽取和分类技术研究[D].重庆大学,2009.

[6]桑书娟,王敏.一种结合文档频率和互信息的特征项提取方法[J].电脑知识与技术,2012,08(11):2593-2594

[7]翟东升,徐颖,黄鲁成,赵京.基于产品评论挖掘的竞争产品优势分析[J].情报杂志,2013,32(2):45-51.

图形形状特征提取前的重要工作 篇2

关键词:图形;二值化;前景;分类

中图分类号:TP393 文献标识码:A文章编号:1009-3044(2007)16-31115-02

The Important Works Before Abstracting Graphics’ Characteristic of Shape

LIU Qing,MENG Xiang-zeng,JI Cui-ping

(Shandong normal university,Jinnan 250014,China)

Abstract: Based on expounding the graphics concept, this thesis studies and develops the important works before abstracting graphics’ feature of shape, including proposing the method of changing specific image into graphics by binaryzation, achieving the method of determining the foreground color of graphics automatically, proposing the simple classification system of graphics and achieving automatic classification.

Key words:graphics;binaryzation;foreground;classification

1 图形的概念

图象的特征提取是图象处理领域的一个重要内容,目前的研究主要是低层视觉特征的提取。形状作为图象低层视觉特征之一,较颜色和纹理等更接近人的知觉和语义,但描述也更为复杂。在提取形状特征的实验中所使用的图象具有以下特点:黑白二值图象以便于背景和前景分离,前景由一条或多条封闭的边界曲线及其内部区域组成,形状特征明显且为最主要低层视觉特征。这一点体现在文献中的例图以及各形状测试图库中,我们称这类图象为图形,如图1。也就是说,这里所定义的图形属于位图,研究领域属于图象处理而非计算机图形学。

图1 图形示例

目前,在形状特征研究领域,广大的研究者大都把目光集中在形状特征提取及基于形状特征的图形识别、匹配、检索等方面,这些也无疑是该领域最重要的研究内容。在进行这些研究之前的工作往往被忽视,但这些工作也很重要,它们包括:图象二值化为图形、自动判定图形前景颜色和图形分类。在接下来的部分,将一一阐述我们在这三方面所做的研究。

2 图象二值化为图形的方法

图形的一个重要特点就是黑白二值图象,已存在的形状测试图库虽然都是二值图象,较著名的有MPEG-7 contour shape database Set B 、MPEG-7 region shape database、Foliage、F. Mokhtarian fish database等,但它们为数不多且难以找到。当研究者找不到合适的、足够的图库时,就不得不面对图象二值化的问题。

图象二值化的关键是阈值的选取,经典的方法主要有灰度直方图法、微分直方图法[1]、最大熵法[2]、最小模糊度法[3],近些年很多学者提出了一些改进的方法,但没有哪种通用的方法可以让所有图象的二值化结果都理想,针对一类的图象往往采用特定的方法。我们针对用来获得图形的图象的特点,提出了一种简单有效的方法,取得了良好的实验结果。首先,我们人为的选择背景单一或背景颜色相差很小的那些图象来二值化,然后将彩色图象变为灰度图象后执行二值化。二值化算法思想如下:图象的边框处多为背景,据此取第m行m列点的颜色值及其上下n个值的区域为背景颜色的范围,将背景颜色范围内的点置1即白色,否则为0即黑色,最后将二值化后的图象中极小的连通区域视为噪声置1。第m行m列点容易受噪声影响,可在边框2*m个像素宽度内求灰度均值及此均值上下n个值的区域为背景颜色的范围。我们取m=5,n=12,对1000幅图象进行二值化,采用第m行m列点的方式,正确率达90.2%;采用边框2*m宽度内均值的方式,正确率达94.6%。我们将此方法命名为边框二值化法,此方法简单有效,但只适用于背景颜色较单一和前背景颜色相差较大的情况。

3 自动判定图形前景颜色

图形有的以黑色为前景,有的则以白色为前景,还有一些图形难以确定谁为前景合适,如图2。为了对图形进行后续处理,需要判定其前景颜色。目前研究者一般在选择图库时就人为的统一采用黑色或白色为前景的图形,从而忽略掉判定图形前景颜色的环节。我们提出了让程序自动判断图形前景颜色的方法。

(a)前景为黑色;(b)前景为黑色;(c)前景不好确定

图2 不同前景示例

方法一:图形中黑色和白色,较少的颜色为前景。方法二:图形边框k(k=10)个像素宽度内黑色和白色,较少的颜色为前景。图库中的图形多以黑色为前景,根据我们的边框二值化方法得到的图形也是黑色为前景,所以当黑白相当时,选择黑色为图形前景。对于前景色为白色的,进行反色,以保证前景色为黑色,方便以后的图形描述。我们对MPEG-7 contour shape database Set B中的1400幅图形,其中黑白前景各占一半,利用以上两种方法分别进行实验,实验结果用查全率和查准率表示。其定义用公式表示如下[4]:

准确率(Precision)=正确识别的图像数/应正确识别的图像数

正确率(Accuracy)=正确识别的图像数/所有识别出的图像数

实验结果为查全率分别是81.42%、98.57%,查准率分别是81.46、98.59%。

那些前景判断错误的图形,是由于其主体所占面积比例过大。这里我们选择方法二来求整幅图形前景,因为它既简单正确率又高。

对于主体既有黑色又有白色的图形,也可能主体中背景颜色所表达的形状才是真正的中心,所以要对主体进一步分析。我们认为,如果主体中背景颜色面积占主体面积的四分之一以上,则表示主体中背景颜色所代表的图形有分析的必要。将图形主体中背景的颜色置黑,其它全部置白,得到新的图形。这样对这幅图形的描述,就要添加上新图形的描述部分。图2(a)就是图2(c)的新图形,对图2(c)的描述除了要描述其白色部分的形状特征外,还要加上图2(a)黑色部分的形状特征。

4 图形分类

我们认为,图形根据对象数可分为多对象图形和单对象图形,单对象图形再根据欧拉数可分为实体单对象图形和空心单对象图形(见图3)。图形分类的意义主要体现的两个方面。一是在图形形状描述时,多对象图形主要研究其拓扑结构及将图形分离为多个单对象图形后的分别描述,而实体单对象图形适合基于轮廓的形状描述,空心单对象图形更适合基于区域的形状描述。二是在图形检索时,用户可以直接选择需要检索哪类图形,以提高检索效果。

图3 图形分类

我们实现了程序自动进行图形分类,无需再人为的分类。算法:首先,计算图形对象数,一个对象被定义为一个较大的连通区域,若对象数为1则为单对象图形,对象数大于1则为多对象图形。然后计算图形的欧拉数,欧拉数定义为连通区域数减孔洞数,欧拉数为1为实心单对象图形,欧拉数小于等于0为空心单对象图形。

我们随机选择了120幅图形进行分类实验,其中多对象图形、实心单对象图形、空心单对象图形各40幅。对象数=连通区域数-小连通区域数。小连通区域的面积小于最大连通面积0.1倍。多对象图形、实体单对象图形和空心单对象图形的查全率分别为95%、97.5%和92.5%,查准率分别为92.68%、97.5%、94.87%。

我们在知觉上定义一个对象是根据语义上的一个物体,而不是一个较大的连通区域,所以在分类时会出现错误。

5 结论

实验表明,特定图像二值化为图形、自动判断图形前景颜色和自动对图形分类均取得到了良好的效果。这些前期处理工作,为下一步的图形形状描述、匹配和检索,做好了必要的准备。

参考文献:

[1]Weszka J S. Survey of threshold selection techniques[J]. Vision Graphic Image Process, 1978:259-265.

[2]吴谨,李娟,刘成云等.基于最大熵的灰度阈值选取方法[J].武汉科技大学学报(自然学科版),2004,(1):58-60.

[3]Deluca A, Termini S. A definition of a non-probabilistic entropy in the set-ting of fuzzy set theory[J]. Int Control, 1972:301-312.

[4]何强,何英.MATLAB扩展编程[M].清华大学出版社.2002.6: 293-300.

点特征提取算法探讨 篇3

1 Moravec兴趣算子

Moravec于1977年提出利用灰度方差提取点特征的算子。Moravec算子是在四个主要方向上, 选择具有最大-最小灰度方差的点作为特征点。

第一步, 计算各像元的兴趣值IV (in terestv alue) 。

第二步, 给定一经验阈值, 将兴趣值大于该阈值的点 (即兴趣值计算窗口的中心点) 作为候选点。阈值的选择应以候选点中包括所需要的特征点, 又不含过多的非特征点为原则。

第三步, 选取候选点中的极值点作为特征点。

除了以上方法, 还可以尝试首先利用边缘提取方法提取整个图象的边缘轮廓, 然后在此轮廓内利用以上特征点提取方法提取特征点。

2 Forstner兴趣算子

Forstner算子是从影像中提取点 (角点、圆点等) 特征的一种较为有效的算子。Forstner算子通过计算各像素的Robert梯度和以像素 (c, r) 为中心的一个窗口的灰度协方差矩阵, 在影像中寻找具有尽可能小而且接近圆的点作为特征点, 它通过计算各影像点的兴趣值并采用抑制局部极小点的方法提取特征点。

第一步:计算各像素的Robert梯度。

第二步:计算l×l窗口中灰度的协方差矩阵。

第三步:计算兴趣值q与w。

第四步:确定待选点。

第五步:选取极值点。

3 Moravec程序框图 (如图1)

4 基于Moravec算子的点特征提取效果图

灰度图像效果图如下:

可以看出特征算子对一些反差加大的地物边缘提取的效果较好, 而反差较小的边缘提取效果较差, 这是由阈值窗口大小的选取和算法本身所决定的。

5 结语

Moravec算子是点特征提取算子中的经典算子之一, 后来的很多点特征提取算子都是在它的基础上改进得来的, 掌握Moravec算子的原理和实现方法对理解其他的点特征算子的理解和应用有很大好处。

参考文献

[1]张祖勋, 张剑清.数字摄影测量学[M].武汉:武汉大学出版社, 2002.

产品特征提取 篇4

关键词:叶脉;植物生长柜;颜色直方图;阈值分割;数学形态学

中图分类号: S24文献标志码: A文章编号:1002-1302(2015)01-0373-03

收稿日期:2014-03-06

项目基金:国家自然科学基金(编号:61275169、61178048);国家社会科学基金(编号:BFA110049);天津职业技术师范大学校级基金(编号:KYQD13022);

作者简介:崔世钢(1963—),男,天津人,博士,教授,从事机器人控制、人工智能等方面的研究。E-mial:cuisg@163.com。

通信作者:梁帆,博士,讲师,从事现代农业智能环境控制、医疗信号处理及手术机器人跟踪控制等方面的研究。E-mial:bachelormd10@163.com。随着工业化的不断发展,环境污染及土地资源等已成为蔬菜种植面临的重大问题。LED植物生长柜采用综合环境控制的方法,在立体多层空间内通过高效利用LED光能,最小限度使用水和肥料,为蔬菜提供安全、舒适的生长环境以实现蔬菜的优质高产。

在植物生长柜管理与应用方面,为了能够及时掌握蔬菜的生长情况,根据蔬菜生长速度及营养状况调整植物生长柜环境参数和营养液配置,实现植物生长柜的智能控制,需要对蔬菜叶片特征进行分析。叶片是蔬菜进行光合作用和蒸腾作用的主要器官,通过提取叶片特征能够直观地反映出植物的生长速度及营养状况等信息。在叶类蔬菜的叶片上分布着明显可见的脉纹(即叶脉),一方面为叶提供水分和无机盐、输出光合产物,另一方面支撑着叶片,使之能伸展于空间,保证叶的生理功能顺利进行。叶脉结构表征了叶脉系统在叶片里的分布和排列样式[1-3],叶脉密度和叶脉直径共同决定着叶脉系统的水力导度,直接影响到蔬菜叶片对水分和养分的传输和吸收,而且叶脉关系到叶片的寿命,一旦叶片受到损伤导致叶脉断裂,必将阻碍叶片吸收养分和水分,最终必将导致叶片枯死。

由于蔬菜粗大的叶脉在叶片生长发育过程中发挥着极其重要的作用,本研究从叶脉与叶肉的颜色差异入手,通过手机摄像头采集叶片图像,利用计算机图像处理技术分析提取叶脉信息,从而为衡量蔬菜生长状态、科学管理植物生长柜提供理论依据。

1材料与方法

1.1图像采集

为实现主叶脉与叶肉有效的分割,以实验室自主研发的LED植物生长柜中种植的小油菜作为试验对象。由于植物生长柜中LED灯光分布均匀,在植物向光性的作用下,蔬菜叶片生长较分散,这将有利于图像采集与特征分析。LED植物生长柜环境如图1所示。

为实现叶片信息的无损采集,本试验需要2个人配合拍摄图像。首先选择较为平整的叶片,一人将白色背景纸片贴近叶片下表面,使叶片与背景形成鲜明对比;其次为了避免彩色灯光颜色对图像分析的干扰,选择关闭植物生长柜内LED红色和蓝色光源,只保留LED白色光源;然后由另一人手持手机,使手机摄像头的光轴垂直于叶片所在的平面并保持固定距离对其拍摄;最后将采集的叶片图像传输至计算机,保存为.JPG格式,并作适当裁剪,方便后期图像处理。

1.2颜色模型

区分叶肉与叶脉最直接的方法就是利用2者之间颜色差距。常用的颜色分析模型有RGB模型和HSV模型[4-5]。其中RGB模型是用三维空间中的1个点来表示1种颜色,每个点有3个分量,即R、G、B分别代表该点红、绿、蓝3个通道,取值范围均为0~255;而HSV模型是从色调(hue,H)、饱和度(saturation,S)和亮度(value,V)的角度来分析处理图像的,色调H用一角度量来表示,红、绿、蓝分别相隔120度;饱和度S和亮度V的范围均为0~1。

在蔬菜生长过程中,叶片的颜色会由浅到深发生改变,所以单纯依靠单一的通道参数分析叶片不具备通用性。在叶片的图像分割方面,常用的颜色特征值除了颜色模型的单个分量外,还有超绿、超红等颜色特征,用以下公式表示:

超绿(extress green):EG=2G-R-B;(1)

超红1(extress red 1):ER1=1.4R-G-B;(2)

超红2(extress red 2):ER2=1.4R-G。(3)

通过在公式(1)至公式(3)之间进行数学运算可得到一系列新的颜色值:

NC=0xR+yG+zB<0

xR+yG+zB其他

255xR+yG+zB>255。(4)

1.3图像分割

为了凸显叶脉的图像特征,需要对图像进行目标分割。阈值分割法是最常用的分割技术之一,其基本原理是通过设定不同的特征阈值,把图像像素分为若干类[6]。设原始图像为 f(x,y),按照一定的准则在f(x,y)中找到若干个特征值T1、T2、T3等,将图像分割为几部分,分割后的图像为:

g(x,y)=LN,f(x,y)≥TN

LN1,TN≤f(x,y)

L1,T1≤f(x,y)

L0,f(x,y)≤T1。(5)

通常利用灰度直方图来求双峰或多峰,并选择两峰之间谷底处的灰度值作为阈值。阈值T的选取是有效分割图像的关键,当选取全局阈值T=T[f(x,y)]对叶脉分割的效果不够理想时,可以选择局部阈值T=T[N(x,y),f(x,y)],不仅考虑图像中点的灰度值,同时与点的局部邻域特征相结合,对图像进行分割处理,其中f(x,y)是点(x,y)的灰度值,N(x,y)是点(x,y)的局部邻域特性。

nlc202309011120

1.4形态学处理

数学形态学处理主要以图像的形态特征为研究对象,它通过设计一整套运算、概念和算法,用以描述图像的基本特征,理论虽然很复杂,但是基本思想却简单而完美。数学形态学的基本变换有膨胀、腐蚀、开运算和闭运算[7-9],它利用一个称作结构元素的“探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分之间的相互关系,从而了解图像的结构特征。结构元素通常有线形、圆盘形、矩形等。二维结构元素矩阵由0和1组成,其中数值为1的点决定结构元素的邻域像素在进行运算时是否参加计算。

腐蚀是把结构元素B平移a后得到Ba,若Ba包含于X,则记下a点。对所有满足上述条件的a点组成的集合称做X被B腐蚀的结果,用公式表示为:E(X)={a|Ba∈X}=XθB;膨胀是腐蚀的对偶运算,其定义是把结构元素B平移a后得到Ba,若Ba击中X,则记下这个a点。对所有满足上述条件的a点组成的集合称做X被B膨胀的结果,用公式表示为:D(X)={x|B[x]∩x≠ф}=X⊕B。在数学形态学中,最为重要的2个组合运算是开运算和闭运算。先腐蚀后膨胀称为开运算,即OPEN(X)=D(E(X)) 。开运算可以消除散点和毛刺,即对图像进行平滑。先膨胀后腐蚀称为闭运算,即CLOSE(X)=E(D(X))。 选择适当的元素结构可以通过闭运算将2个邻近的目标连接起来。利用形态学膨胀、腐蚀等组合运算可以实现目标对象的图像填充、边缘提取以及消除孤立点等功能。

2结果与分析

2.1颜色图像分析

对采集到的不同成熟度的叶片图像利用Matlab软件处理。在分别提取图像在RGB空间和HSV空间各个分量的灰度图像以及对应的直方图分布进行分析后发现,虽然不同,叶片的各个颜色分量分布不同,但是对每个叶片而言,R、G、V 3个分量图像中叶脉的形态较清晰,直方图中的波峰和波谷相对其他通道而言对比较明显,但是实际的叶脉分割效果并不是很理想,由此得出仅对单通道进行叶脉提取的可操作性较低。

因此结合颜色直方图,本研究选择将R、G、B 3个通道相互之间组合运算,使其直方图分布呈现明显的双峰型分布(图2),便于寻找阈值以有效地对叶脉进行分割和提取。

2.2叶脉分割

此时,虽然直方图双峰分布明显,但分布范围并不均匀,如果将其集中的灰度值均匀地分布开来,叶脉图像会变得更加清晰。因此,在阈值分割之前先对图像进行灰度调整,增强叶肉与叶脉的对比度,从而使图像的分割效果更为理想。

在阈值分割时,根据直方图中其波谷的位置选择阈值进行二值化处理,将叶肉的像素设置为0,叶脉的像素设置为1,从而使叶肉与叶脉形成鲜明的对比,如图3所示。此时得到的图像包含了叶脉与叶片轮廓,还需进一步处理,其流程图如图4所示。

对比多种结构元素之后,选择半径为2的圆盘形结构元素对叶片整体的二值化图像分别进行了膨胀和腐蚀,然后将二者相减得到叶片轮廓的边缘图像B。再将原叶脉分割图像A减去叶片轮廓图B后,便可得到只含有叶脉形态的图像C。此时图像中仍存在有许多孤立点有待去除或者连接,所以还需要对图像进行开闭等运算,以得到形态结构较为理想的叶脉图像D,如图5所示。

3结论与讨论

本研究提出的基于颜色特征的叶肉与叶脉分割算法,利用RGB颜色空间中R、G、B 3个颜色通道信息进行组合运算,对采集的叶片图像进行颜色特征分析和阈值分割,并与数学形态学处理相结合提取出叶脉图像[10-11]。结果表明,本研究所采用的图像处理方法能够有效地提取出叶脉的特征信息。叶脉在叶片生长过程中发挥着结构性支撑、抵御侵害、传输养分等功能,可以说决定着蔬菜叶片的一切。对叶脉特征提取和分析是研究植物生长柜内蔬菜栽培等农业应用的重要工作之一,为科学管理作物、实现植物生长柜智能化控制以及促进增产增收提供了技术支持。

参考文献:

[1]Blonder B,Violle C,Bentley L P,et al. Venation networks and the origin of the leaf economics spectrum[J]. Ecology Letters,2011,14(2):91-100.

[2]Sack L,Scoffoni C. Leaf venation:structure,function,development,evolution,ecology and applications in the past,present and future[J]. The New Phytologist,2013,198(4):983-1000.

[3]李乐,曾辉,郭大立. 叶脉网络功能性状及其生态学意义[J]. 植物生态学报,2013,37(7):691-698.

[4]韩殿元,黄心渊,付慧. 基于彩色通道相似性图像分割方法的植物叶面积计算[J]. 农业工程学报,2012,28(6):179-183.

[5]李灿灿,孙长辉,王静,等. 基于改进的Sobel算子和色调信息的叶脉提取方法[J]. 农业工程学报,2011,27(7):196-199.

[6]王晓峰,黄德双,杜吉祥,等. 叶片图像特征提取与识别技术的研究[J]. 计算机工程与应用,2006,42(3):190-193.

[7]王征. 一种基于数学形态学的边缘检测方法[J]. 计算机与数字工程,2012,40(2):102-104.

[8]王萍,唐江丰,王博,等. 基于数学形态学的植物叶片图像分割方法研究[J]. 浙江农业学报,2012,24(3):509-513.

[9]谭峰,高艳萍. 基于图像的植物叶面积无损测量方法研究[J]. 农业工程学报,2008,24(5):170-173.

[10]袁道军,刘安国,刘志雄,等. 利用计算机视觉技术进行作物生长监测的研究进展[J]. 农业网络信息,2007(2):21-25.

[11]金秋春,郑小东,童小利. 多方向Top-Hat变换在叶脉特征提取中的应用研究[J]. 计算机工程与应用,2011,47(4):195-197.刘艳,许建民,王永平,等. 可控温度与时间的植物病毒热钝化系统[J]. 江苏农业科学,2015,43(1):376-380.

人脸识别特征提取算法研究 篇5

特征提取是人脸识别中一个非常重要的环节, 目的是为了降低人脸图像的维数。目前, 常用的基于统计的特征提取方法有主成分分析 (PCA) [1]和线性判别分析 (LDA) [2]等。独立元分析 (ICA) [3]是近年来发展起来的一种新的多维数字信号处理技术, 其基本思想是在最大程度保持信息量的前提下, 从高维数据空间中提取出低维数据的特征分量, 是一种基于人脸全局特征的识别方法。但ICA算法在获取独立分量的过程中需要获取人脸图像的先验知识, 这影响了识别的准确率。有效减少了后续工作的计算量, 取得了较高的识别率。

基于上述讨论, 本文将一个人脸图象矩阵视为一矢量, 通过引入模糊数学中的隶属度概念, 定义矢量隶属函数, 提出一种新的基于隶属度函数的独立成分分析特征抽取和识别方法。有效减少了后续工作的计算量, 取得了较高的识别率。本文称该方法为模糊ICA (Fuzzy ICA) 。

1、独立成分分析的基本理论

ICA最初是对盲信号的分离。利用独立成分分析 (ICA) 方法可以在不知道信号源和传输参数的情况下, 根据输入信号源的统计特性, 仅由观测信号恢复或提取源信号。独立成分分析已经成为盲信号处理中最主要的方法之一, 并在模式识别、数据压缩、图像分析等方面得到广泛的应用。

对于一组盲源信号S= (s1, s2, …sm) T, 有N路观测信号X= (x1, x2, …, xN) T, 每一路都是一维行向量的形式。存在系数 (混合) 矩阵A, 使得独立源信号S与观测信号X可以用线性关系来表示:

式中A∈RN×M, 称为混合矩阵。

存在分离矩阵W∈RM×N, 使其满足下式:

式中WA=I, I为单位阵, Y为统计独立的未知源信号S的最佳估计。

在独立成分分析中求解分离矩阵是关键。目前已提出很多求解分离矩阵的算法。本文采用FastICA方法来实现独立分量的提取【8】, 该方法是基于负熵的固定点算法, 是目前效率较高, 应用较广泛的一种ICA算法。该算法的具体描述为:

(1) 对数据进行中心化处理, 使其均值为零。

(2) 白化数据, 令白化后的数据为z。

(3) 初始化W (0) , 令其模为1, 置k=1;

(4) W (k) =E{zg (W (k-1) Tz) }-E{g′ (

W (k-1) Tz}W (k-1) ;

(5) W (k) =W (k) /||W (k) ||;

(6) 如果不收敛, 令k=k+1, 返回 (4) 继续, 否者输出W (k) 。

其中g (u) =uexp (-u2/2)

该算法最后得到的向量W, 其线性组合WTz给其中的一个独立分量。要计算n个独立分量就要重复上述算法n次, 但每提出一个分量后要从混合信号中减去这一分量。

2、基于Fuzzy ICA的特征提取和识别

2.1 算法设计的基本思想

自1965年Zadeh提出模糊概念以来, 模糊数学已被用于很多领域, 将其应用于模式识别, 形成了模糊模式识别。模糊模式识别方法是利用模糊数学中的概念、原理与方法解决分类识别问题。模糊模式识别将待识别类别、对象作为模糊集和其元素, 因此应根据实际问题需要进行特征提取或特征变换, 建立模糊集的隶属函数, 然后运用有关模糊数学的原理和方法进行分类识别。

2.2 特征提取和识别算法

ICA是PCA从二阶统计分析向高阶统计分析的拓展, 基于数据的高阶统计信息提取数据的独立特征, 能够更好的表示人脸的局部特征。具体算法为:

(1) 特征提取和变换

假设人脸图像训练集样本图像有n类人脸图像, α={α1, α2, …, αn}, 且第i类有Ni个人脸图像。

对人脸图像训练集样本图像α, 首先通过PCA算法对图像进行去二阶相关和降维处理, 然后通过ICA算法对图像进行处理, 获得由独立影像基构成的一个低维子空间:S={S1, S2, …, Sm} (m<n)

计算出此低维子空间的特征向量为:

假设Xj (j=1, 2, …, Ni) 为已知αi类人脸图像矩阵Aj (i) (j=1, 2, …, Ni) 的特征向量, Y为未知人脸图象矩阵C的特征向量, 计算Xj和Y在低维子空间中的投影向量, 即Zj=ST﹒Xj, φ=ST﹒Y。

(2) 建立矢量隶属函数。

模糊集合隶属函数的建立, 无论在理论上还是在应用上都是非常重要的。由于造成模糊不确定性的原因多种多样, 因而模糊集的种类是复杂的。实际应用中, 确定隶属函数的方法有不少, 如专家确定法、统计法、对比排序法等。

在本文中, 我们将模糊数学中建立隶属函数、隶属度的方法引入矢量空间中, 从而定义未知人脸图像矢量归属于αi类的模糊隶属度函数为:

其中, λj为任意实数, ‖﹒‖为向量范数, Zj和φ为 (1) 中得到的特征向量。

(3) 模糊结果处理及人脸分类识别。

使用模糊技术进行分类的结果不再是一个模式明确地属于某一类或不属于某一类, 而是以一定的隶属度属于各个类别。如果分类识别系统是多级的, 这样的结果有益于下一级的决策。如果这是最后一级决策, 而且要求一个明确的类别判决, 可以根据模式相对各类的隶属度或其他一些指标, 如贴近度等, 进行硬性分类。在本文中, 我们利用最大隶属度原则进行人脸分类识别, 即首先计算每个输入人脸图像 (测试样本) 对各类人脸图像的图像隶属度μai, 若, 则判别测试样本为αi类人脸图像。

3、试验结果及分析

试验中采用ORL标准人脸数据库验证该算法, 该数据库包括从1992年4月到1994年4月剑桥大学实验室拍摄的一系列人脸图像, 具体为40个人, 每个人有不同表情或不同视点的10幅图像, 共400幅图像所构成, 倾斜角度不超过20度, 这些人脸图像的分辨率为92×112, 人脸数据库中每个人的图像都是不同角度、不同时间且受一定光线和一些饰物 (如眼镜等) 影响。图1是ORL人脸数据库中部分图像:

本实验使用Matlab7.1在windows XP系统下, 为了更好地证明算法的有效性, 我们随机选取其中10个人, 每人前3幅 (共30幅) 图像作为训练样本, 其余的30幅图像作为测试样本的做法。如此重复10次试验, 最后结果取其平均值。分别采用传统的ICA方法、PCA方法和本文的Fuzzy ICA方法, 进行了人脸识别仿真实验

由图2可知, 识别率随着特征维数的增加而成上升的趋势, 本文的方法识别率高于传统PCA方法和ICA方法, 该方法识别率最高可达95.1%, 但当特征数接近100时, 识别率略有下降的趋势, 说明并不是所有的特征向量都是有效的投影空间, 有些刚好是与人脸本身无关的噪声因素干扰。

4、结束语

本文在研究采用ICA提取的具有局域特点的独立分量表示人脸基础上, 将基于模糊ICA的人脸图像特征提取和识别算法与传统的PCA和ICA人脸识别算法进行了比较, 对ORL标准人脸数据库的测试表明, 该算法的性能优越, 而且识别率较特征脸法更高。但是, 算法的计算量很大, 当样本数很多的时候, 训练时间是个问题。因此, 算法仍需进一步的改进和提高。

参考文献

[1]余晓梅, 徐丹。基于外观的子空间人脸识别方法研究[J], 计算机应用研究。2007, 24 (5) :10-12

[2]Belhumeur P N, Hespanha J P, Kriengman D J.FishedacesIRecognition using class specific linear projection[J].IEEETransaction on Pattern Analysis and MachineIntelligence.1997.19 (7) :771-720

[3]张贤达, 保铮。盲信号分离[J], 电子学报, 2001。29 (12) :1767-1771

[4]王展青, 刘小双等.基于PCA与ICA的人脸识别算法研究[J].华中师范大学学报, 2007, 41 (3) :373-376

[5]邢国。人脸识别中两种特征提取算法的性能比较[J].信息与电脑, 2011, 1 (6) :115-117

[6]龙际珍, 陈沅涛, 邓冬梅.基于模糊隶属度的人脸识别应用[J].计算机应用研究, 2011, 28 (7) :2789-2792

[7]Yuen PC, Lai JH.Face representation using independentcomponent analysis[J].Pattern Recognition, 2002, 35 (6) :1247-1257.

语音信号特征参数的提取 篇6

1.1 汉语的音素、音节和音调

我们发现依据人类声音产生的机制, 由于激励方式的不同会形成清音和浊音两种不同的语音。由这两种语音又可以组合成两种不一样音素:元音及辅音。构成语音的最小单位是音素。元音由不相同的口腔形状发声而形成, 辅音的形成由发声的部位以及发声的方法决定。

音节是构成汉语的最小单位。我们所说的音节指的是一个元音加上一或两个辅音所构成的音素的组合。汉语当中包括以下4种音节, 即:元音、元音+辅音、辅音+元音, 辅音+元音+鼻音。一般汉语可以简单划分为声母+韵母两个部分。音节前部分的辅音称之为声母, 元音和元音后面有时候出现的鼻音称之为韵母。汉语可认为是一种声调语言, 根据声调的不同所表达的意思很可能完全不一样, 汉语共有阴平、阳平、上声及去声四种声调。而声调的变化可以看成浊音周期的变化。声调曲线从韵母起始点至韵母的终止点。

1.2 语音信号的数学模型

语音的产生是因为声道激励发生共振, 因为发声过程中声道是振动的, 所以能够用一个时变线性系统来描述。可以用如图1所示描述语音生成模型。

由图1可知一个完整的语音信号模型由激励模型、声道模型、及辐射模型三个子模型串联而成。激励模型由浊音激励与清音激励组成。对清音部分来说, 激励信号等同于白噪声, 而对于浊音部分来说, 因为声带在不断地张开与闭合, 所以会有间隙性的脉冲波产生。共振峰模型是当前广泛使用的一种声道模型。声道的终端是人类口与唇, 速度波通过声道输出, 然而语音信号是一种声压波。

2 语音信号的前端处理

为了得到我们所需要的信号, 须先对模拟语音信号进行数字化, 接着进行预处理与加窗。

2.1 语音信号的数字化

为将模拟语音信号转变为数字信号, 先对信号进行采样与量化。在采样与量化之前, 须进行语音信号的预滤波, 其目的在于:第一, 滤除高频噪声;第二, 防止50Hz的工频干扰。

2.2 语音信号的预处理与加窗

因为语音信号的平均功率受到鼻辐射以及声门激励的很大影响, 因此在语音信号频谱的求取时, 随着频率的增高相应的响应成分越小, 也就是说高频部分频谱比起低频部分来不够精确, 为此我们需要对信号进行预加重。为了平滑频域信号, 使得信号处理的后面阶段对有限长响应不那么敏感, 通常情况下让数字语音信号通过一个低阶的系统。目前广泛使用的是固定的一阶数字滤波器, 即

式中a为预加重系数, 通常取值0.95左右。

因为语音信号的特性是随时间变化的, 而非平稳过程, 但由于人的发音器官的肌肉运动速度比较慢, 因此可以认为语音信号是个局部的短时平稳的信号。因此, 我们对对语音信号进行分帧加窗的处理。通常情况下语音信号帧长取为10ms~30ms, 每秒帧数约为33~100, 分帧可以是连续的, 有可以是交叠分段的, 在语音信号的分析当中常用“短时分析”来表述。我们一般采用窗函数来乘语音信号, 常用的窗函数是Hamming窗。

Hamming窗函数是:

2.3 语音信号的端点检测

端点检测指的是找出语音信号中的各段落的起始点以及终止点的位置。语音信号的时域处理方法包括:短时平均幅度、短时能量、短时过零率以及短时自相关。端点检测一般要用到语音信号的短时能量以及短时平均过零率两中参数。

用En来表示第m帧的短时能量, 其计算式如下:

短时平均幅度Mn的计算式如下:1N-

短时能量En的最主要作用是:区分清音与浊音、区分声母与韵母的分界、无声与有声的分界、连字的分界以及能够用于进行语音识别。

“过零率”指的是在单位时间内信号通过零的次数。短时过零率z (m) 是用来描述频谱的简单有效的方法之一, 计算公式如下:

在短时处理技术中, 描述一个随机信号的其中一个重要特征是自相关函数Rn, 可以用自相关函数区分清音与浊音, 计算公式如下:

短时频域处理作为语音信号处理的基本方法之一。短时频域处理适合缓慢变化的语音信号。第m帧的短时傅立叶变换计算式如下:

3 语音特征参数提取

在完成语音信号的预加重、分帧、及端点检测之后, 下一步关键的是提取特征参数。我们不可能直接识别原始波形, 语音信号需要经过变换, 提取出其特征参数后再进行识别, 特征参数需要满足:反映语音的本质、参数个分量之间耦合尽量小、参数的提取方便等几方面的要求。目前语音识别中线性预测倒普参数LPCC、美尔倒普参数MFCC使两种较为常用的参数。LPCC利用线性预测编码技术求取倒普参数。MFCC则构造人的听觉模型, 以语音信号经过该模型的输出值作为声学特征, 直接利用离散傅里叶变换得到。

3.1 线性预测倒普参数LPCC的提取

线性预测分析是语音特征分析方法之一, 能够有效的解决短时语音信号的模型化问题。LPCC的基本原理:语音信号的每个样值可以通过过去的若干个值的线性组合逼近求得, 也能够用实际语音信号的抽样与线性预测的均方差值最小的方式, 求出一组预测值。

其中a为加权系数, p为线性预测倒普参数的预测阶数。

LPCC系数表示的是语音信号频谱极值点的变化, 用该系数来表征语音信号, 能够获得比较平滑的语音频谱图。

3.2 美尔倒普参数MFCC的提取

MFCC参数与LPCC参数不同, 它考虑了人耳的听觉特性, 先将频谱转变为美尔频标的非线性频谱, 接着再转换到倒普域上。因为MFCC比较地充分考觉特性, 所以MFCC参数有很好的识别性能与抗噪能力。由测试可得, MFCC参数性能在汉语语音识别中要明显优于LPCC参数, 由于人类在对1 000Hz频率以上的声音的感知能力并不遵循通常的线性关系, 它遵循的是对数频率坐标上的线性关系。

首先, 语音信号在经过预处理、分帧加窗后转变为短时信号, 经过FFT变换将x (n) 转化为X (m) , 并计算出其短时能量谱P (f) 。在将P (f) 在频率轴上的频谱转化为在美尔坐标上的P (M) 。接着在美尔频域内将在美尔坐标上加入三角带通滤波器得到滤波器组Hm (K) , 再计算美尔坐标上的能量谱P (M) 通过该滤波器组的输出值。最后在美尔刻度谱上能够采取修改的离散余弦反变换来求取美尔倒普参数:

式中, p为MFCC阶数。

4 结论

本文主要介绍了语音学的基础知识、语音信号的数字化及其特征提取, 为语音模型的训练做了很好的铺垫。在计算机普及的今天能够让计算机识别出人的自然语言是人们一直努力的一个方向, 对计算机直接用语言信息发号施令, 我们的双手才能真正得到解放。

参考文献

[1]胡航.语音信号处理.2版.哈尔滨:哈尔滨工业大学出版社, 2002:256.

[2]刘幺和, 宋庭新.语音识别与控制应用技术.北京:科学出版社, 2008:201.

[3]易克初.语音信号处理.北京:国防工业出版社, 2000, 14:363.

[4]李波, 王成友, 杨聪, 等.基于语音频谱包络抽取的MFCC算法.长沙:国防科技大学学报, 2004.

安全攻击特征自动提取技术研究 篇7

关键词:入侵检测,安全攻击,特征,自动提取

1 引言

随着网络通信技术在飞速发展, 安全攻击日益增多, 新的安全攻击技术和工具层出不穷, 造成了极其严重的威胁和破坏。入侵检测系统 (IDS:Intrusion Detection System) 是一种主动的安全防御设施, 实时地监视和分析用户及系统行为和网络中的流量数据, 从而有效地发现入侵企图或异常现象;记录、报警并作出及时的响应[1]。

基于特征的入侵检测技术是当前应用最为广泛的一种行之有效的攻击检测技术, 它基于攻击特征库中所抽取存放的各种安全攻击特征来实时地发现系统中的攻击行为。因此, 安全攻击特征的抽取是基于特征的入侵检测系统的基础和关键。

在早期的基于特征的攻击检测系统中, 通常采用基于网络安全专家的事后分析的方式来提取攻击特征。这种人工提取安全攻击特征的方法过程长、速度慢, 已经无法适应攻击手段和形式层出不穷的变化形势了。安全攻击特征自动提取技术不需要人工干预, 能够有效地发现新攻击, 并进行自动提取。对攻击特征自动提取技术进行了分析分类和总结。

2 攻击检测技术研究现状

准确及时地检测并阻止各种安全攻击能够有效地保障网络系统安全可靠地运行。攻击行为的检测是防御安全攻击的前提和基础。大量的专家和学者针对网络安全攻击的检测和阻止进行了研究, 其技术和成果主要体现在两个方面:

(1) 基于异常行为的攻击检测机制

基于异常行为的攻击检测机制是从正常的网络行为建模角度出发而提出的攻击检测和防御技术。该领域主要有基于统计的异常检测、基于数据挖掘的异常检测[2]和基于神经网络的异常检测[3]等方法。

基于异常行为的攻击检测的最大问题是, 实际的网络系统复杂且差异很大, 很难准确真实地为众多实际的系统构建合适的模型, 难以在实际的网络环境中应用。

(2) 基于特征的攻击检测机制

大量的网络攻击行为和攻击事件的分析表明[4], 安全攻击行为具有很强的特征性, 基于攻击行为的特征能够有效地发现并阻止网络攻击。因此, 基于特征的攻击检测和防御机制是一种行之有效的攻击检测途径。基于攻击特征的入侵检测技术已经广泛地应用于入侵检测系统和入侵防御系统以及防火墙中。

3 攻击特征的自动提取

3.1 特征自动提取技术

特征是对已知的攻击行为的描述。通常用特征码来表示各种攻击代码的特征。所谓特征码, 是指能够表征和描述某一种攻击行为或攻击代码的一组二进制序列。一旦抽取出某种攻击的特征码, 各种攻击行为的特征码通常都存放在一个统一管理的库中以备攻击检测时进行内容匹配, 这个库称为特征库或模式库, 相应的特征也被成为模式串。基于特征的攻击入侵检测通过模式匹配技术来实时地发现网络中所存在的攻击行为。入侵检测系统就能够借助模式匹配识别出所收集的当前系统的数据中是否包含有待检测的攻击特征, 也就是是否包含有一个或多个模式库中的模式串, 从而准确地识别出攻击。

提取攻击特征分为人工提取和自动提取两种。所谓攻击特征自动提取是指在不需要人工干预的情况下, 自动地发现新攻击并提取出特征码的过程, 其目的是尽可能快速准确地提取出攻击特征码, 解决传统的手工提取在周期长、速度慢、无法有效地防御新攻击等局限性[5]。

3.2 攻击特征描述

攻击特征自动提取的前提是对攻击特征的抽象和描述。当前的攻击特征描述主要有基于网络协议特征的攻击特征描述、基于负载内容的攻击特征描述、基于网络流量的攻击特征描述等方法。

存在大量网安全攻击的根本原因之一是网络协议本身所存在的一些安全问题。大量的网络安全攻击都是利用TCP、IP、UDP、ICMP等协议的安全漏洞来实施的, 因此, 使用网络协议包头的特殊字段的值是可以准确地表征相应的攻击特征的。例如, 著名的针对域名服务器的查询洪泛 (DNS Query Flood) 攻击使用UDP协议的53号端口对域名服务器发起攻击, 因此能够用UDP包头部的目的端口号的值=53来描述这种攻击。

很多安全攻击不是基于协议数据包头部数据的设置来实现攻击, 而是基于内容来实现的。这种情况下, 基于协议头部分析就无法描述其攻击特征了。通常需要考虑数据包的有效载荷, 根据领域专家的经验值来分析数据包的负载数据来描述攻击特征。

很多攻击, 特别是 (分布式) 拒绝服务攻击 (Do S/DDo S:Denial of Service/Distributed Denial of Service) 是通过发送大量的数据包以耗尽系统资源的方式来实现攻击的, 这种情况下就需要分析一段时间内网络流量来描述其攻击特征。

此外, 有的攻击还需要借助关联记录才能准确地描述其攻击特征。

3.3 自动攻击特征提取

自动攻击特征提取能够快速准确地提取新攻击的特征。根据所发现攻击的位置的不同, 安全攻击特征自动提取通常分为基于网络的攻击特征自动提取 (NSG:Network-based Signature Generation) 和基于主机 (HSG:Host-based Signature Generation) 的安全攻击特征自动提取。基于网络的攻击特征自动提取将提取系统部署在网络上, 通过分析网络上的可疑数据来提取攻击的特征码。

3.3.1 NSG方法

基于网络的自动攻击特征提取通常借助蜜罐 (Honeypot) 技术来发现可疑的攻击行为和网络数据。早期的基于网络的自动攻击特征的提取, 如文献[6]和[7], 大多采用提取“最长公共子串” (LCS:Largest Common String) 的方法来实现的。基于LCS的攻击特征自动提取方法的优点是能够在线性时间内完成特征提取, 但是, LCS方法只能实现对单个最长的特征片段的提取, 这使得该方法不能准确地描述攻击。

Atograph和Earlybird按照不同的方法将网络中的可疑数据流划分成固定长度的分片, 然后基于Rabin fingerprints算法来计算分片在所有可疑数据流中出现的频繁度, 再将频繁度高的分片输出为攻击特征[8]。这种方法称为基于固定长度负载出现频率的攻击特征自动提取方法, 其缺点是时间复杂度和空间复杂度都很高, 并且, 该方法难以选取固定长度的大小, 因此无法适应攻击变形的情况。后来Tangy等人将可以数据流中含有多个特征分段的固定长度部分作为关键区域利用两种迭代计算算法来查找这些关键区域[9]。该方法虽然解决了长度大小可选的问题, 但由于算法不能确保收敛, 因此其有效性受到了很大的限制。

2005年, 基于可变长负载出现频率 (Token) 的方法被提出来[10], 该方法一般采用遍历前缀树的算法, 通过提取数据流中频繁度大于一定阀值的所有的Token都被提取出来, 从而实现特征的提取。Vinod等人[11]则提出了基于有限状态自动机 (Finite State Automata:FSA) 的方法, 首先对可疑数据进行聚类, 然后对每一类中的数据流生成一个FSA, 最后将这个自动机转化为攻击特征。

3.3.2 HSG方法

基于主机的自动攻击特征提取系统则是部署在主机上, 通过检测主机的异常行为并利用在主机上所收集的数据来实现攻击特征的自动提取。根据提取时所指导的源程序代码的获知程度, 基于主机的自动攻击特征提取又可进一步地分为白盒HSG方法、灰盒HSG方法和黑盒HSG方法3种。

基于白盒的HSG方法需要攻击程序的源代码, 因此, 适用性比较差。这种方法在实际的系统中很少采用。

基于灰盒的HSG方法通过紧密地跟踪程序的执行过程来发现攻击的存在并且提取其攻击特征。灰盒HSG的实现方式包括基于动态数据流跟踪[12,13]、基于地址空间随机化 (ASR:) 技术[14,15]。基于灰盒的HSG方法不需要程序源代码, 其分析结果也比较准确, 目前大多数商用的HSG系统都是采用这种方法。

文献[16]最早提出了黑盒HSG方法, 称为HACQIT方法。该方法在受保护的程序发生意外崩溃后, 通过将可以的网络请求重新发送给该程序并且判断程序是否会在此因此请求而崩溃来检测出攻击的存在, HACQIT方法将检测到的这种能再次引起程序崩溃的请求称为“坏请求 (bad-request) ”。HACQIT方法的缺点是, 它只定义和发现坏请求, 却没有进一步地判断所有的坏请求中到底哪些才是真正的攻击行为———并不是所有导致程序崩溃的请求都是因为攻击而产生的。

4 结语

基于NMFSC的特征基因提取 篇8

植物体内存在着一些特殊的相互作用的基因,而这些基因能反映每一个非生物压迫。如何能有效地提取出基因,仍然是一个挑战。人们常见的方法有RT-PCR法[1]或Northern印迹法[2],主成分分析(PCA)法,独立成分分析(ICA)法和奇异值分解(SVD)法等。虽然这些方法已经被广泛地应用在基因表达数据领域中,但他们都有一些共同的缺陷,即在处理原始数据的时候,都必须对原始数据进行标准化处理,且允许负成分的存在。而这些负分量在实践中往往毫无意义。为了能更好地提取特征基因,Le和Seung等人首次引入非负矩阵分解(NMF)方法来分解图像矩阵[3]。到目前为止,NMF的许多算法已经被提出来,如SNMF、Fisher NMF和NMFSC[4]。SNMF和Fisher NMF有一个共同的缺点:他们的稀疏性不能被精确控制。而Patrik O. Hoyer提出了可以精确控制的稀疏非负矩阵分解(NMFSC)。NMFSC已广泛地应用到图像处理等领域。为了提高对基因表达数据的处理能力,我们利用NMFSC在植物基因数据集上进行特征基因提取。

1 方法

1.1 NMFSC的数学定义

在文献[4]中,Patrik O. Hoyer详细地介绍了NMFSC算法。对于任意的一个非负矩阵X,能找到两个非负矩阵W和H使得X-WH。其中,W被称为基矩阵,H被定义为基于基矩W的系数矩阵。我们利用欧氏距离作为目标函数,其公式如下:

分别对W和H进行施加约束控制,对目标函数进行优化控制:

其中,wi是矩阵W的第列,hi表示矩阵H的第行。Sw和Sn分别表示矩阵W和H的稀疏程度,这两个参数由用户自己设置。

1.2 NMFSC算法

有关NMFSC的详细的算法[4]如下所示:

(1)对矩阵W和H进行初始化,即随机产生非负矩阵W和H。

(2)如果对H施加约束,矩阵H的每一行元素都为非负值,保持L2范数不变,通过设置H范数来获得稀疏度。

(3)迭代。

a)对H进行施加稀疏约束

b)对矩阵W利用乘法步骤来获得

1.3通过NMFSC提取特征基因

我们对基因表达数据矩阵X进行转置,记为A,则有A=XT。A是一个m×n矩阵,它的每一行表示m个样本中的个基因表达水平,每一列表示一个基因在所有样本中的表达水平。所以,矩阵A可以表示为A~WH,其中,W是一个m×k的矩阵, H是k×n的矩阵,k表示矩阵的秩,k

这里的sj是{hi}的线性组合,sj是矩阵A的行向量,wij是矩阵W的元素。由于矩阵H包含所有的基因且它是矩阵A的样本特征的一部分,所以,我们从基矩阵H中提取特征基因。所以, sj能用hi来代替。通过NMFSC对矩阵A进行分解,得到稀疏矩阵H,从矩阵H中提取出非零的元素,即其对应的基因记为特征基因。

2 实验结果与分析

在本节中,我们将呈现通过NMFSC的方法进行处理数据矩阵得到的实验结果。在这一部分中,我们给出了基因表达数据集,且将实验结果与SPCA方法的结果进行了比较。

2.1 数据来源

基因表达 数据可以 从NASCArrays[http://affy. arabidopsis.info/]中免费下载,其中参考数据有:nascarrays-141,干旱胁迫;nascarrays1 4 0 , 盐压 ; n a s c a r r a y s - 1 4 4 , U V- B光胁迫 ;nascarrays-138,冷压; nascarrays-146,热压;nascarrays-139,渗透压;nascarrays-137,参照组[5]。在这个数据集中,每个样本包含22810个基因,每一个样本对应的数目在表1中列出。吴等人提出了利用GC-RMA软件能够自动调节背景的光噪声。GC-RMA软件得到的结果有待于利用矩阵进行进一步的处理。

2.2 参数的选择

利用NMFSC方法对矩阵进行处理时,稀疏控制约束的参数Sw设为0.5。Sh参数的选择在区间(0,1)之间。我们从22810个基因中粗略地选择500个基因作为特征基因,并将其结果与SPCA的方法进行比较。

2.3 基因本体论(GO)分析

GO术语是一个含有丰富的资源工具,对于一个GO术语,能形成一个相联系的基因产物组,可以搜索共表达性基因。GO Term Finder能在公开的网站中获得。其阈值参数设置如下:基因产物的最小数目为2个,p值最大值为0.01。

表1列出了在根和茎的样本中对刺激的反应( G O : 0 0 5 0 8 9 6 ) 和应对压 力的反应 ( G O :0 0 0 6 9 5 0 ) 。在TA I R集中的背 景频率分 别是6 6 1 9 / 3 0 3 2 4 ( 2 1 . 8 % )和4 0 2 8 / 3 0 3 2 4 ( 1 3 . 3 % )。其中,318表示在选择的500个基因中,有318个基因是对刺激有反应。从表中我们很明显地看出在根的样本中,反应对刺激的应力下,我们的方法优于SPCA。在茎的样本中应对刺激的反应中,除了热压,SPCA方法优于我们的方法,在剩余的5个样本里,我们的方法要优于SPCA。同样,在根和茎的样本中应对压力下,除了反应热压,SPCA的方法优于我们的方法,剩余的11个样本里,NMFSC方法要比SPCA能提取更多的基因。

总之,通过实验和分析可以看出,NMFSC比SPCA能提取更多的特征基因。因此,我们的方法在提取特征基因方面比其他方法更有优势。

(下接19页)

(上接21页)

3 总结

产品特征提取 篇9

关键词:ArcGIS环境;DEM;流域特征

DEM是一种涵盖大量地理信息的实体地面模型,应用广泛。而ArcGIS水文分析模块能够对地形模型进行可视化,提取和分析地形及河流网系是ArcGIS水文分析模块的主要作用,这一强大分析流域特征的功能对DEM处理来说是非常必要的条件。以下笔者就对ArcGIS环境下基于DEM的流域特征提取进行简单阐述。

一、DEM的构建方式

按照区域里全部的高程点数据把多项函数和傅立叶级数拟合成地面高程曲面,换句话说就是应用规则的数学曲面模拟合成不规则的实际地面,接着把这个拟合分成面积差不多相同的不规则区域或者分成正方形规则区域来做分块搜索,按照有限个点来做拟合,让详细的高程曲面得到形成,这便是DEM构建的数学过程。其规则网格模型、不规则三角网模型、等高线模型以及层次模型等都是DEM构建的主要模型。

二、ArcGIS环境下DEM的流域特征提取

(1)水系特征的提取。这种提取方法是在Marks和O’Callaghan提供的坡面径流模拟方法基础之上再应用ArcGIS环境下DEM的水系特征来进行提取。这种方法的应用原理是首先通过网格单元计算出汇水面积,接着把汇水面积临界值的设定进行河网的判定。此方法相当于地表径流的路径判断,这是通过了水文学中汇流概念的使用,并且在这个过程中流路会不断得到生成,所以水系提取过程中的这种方法是比较优等的选择。另外Hydrology菜单中集成了ArcGIS水系特征提取的所有相关命令,相应的函数在使用时能够直接随意调用,尤为方便。

(2)地形特征的提取。脊点、鞍点、谷点、山顶点、凹陷点以及平地点等都是地形特征的主要包括部分。DEM提取地形特征点的利用能够根据一个三乘三或者更大的栅格窗口,经过中心网格和八个相邻网格的高程关系获取准确判断后的信息[1]。

三、流域特征提取的过程

1.洼地的填充处理

在填充洼地前需要计算洼地的深度,对此进行确定洼地是由于采样误差造成的还是真实地标反映,然后可以准确地设置临界值来进行洼地的填充。

每个网格进行扫描时,让这个网格和相邻的其他八个网格的高程进行比较,若相邻八个网格的高程都比中心网格的高程高时,那么中心网格的值就被高程最低的八个相邻网格中其中那个网格的值给赋予。

ArcGIS环境下洼地填充的步骤分别是:点击Hydrology工具箱中FILL,通过使用可以ZLin it的选项来进行确定需要被填充的洼地临界值。

2.水流方向计算过程

水流方向是对于每个网格在水流离开此网格时的指向。流向确定的算法分为多流向算法和单流向算法,单流向算法的水流只从一个网格中流向另一个方向的网格,再按照网格高程对水流方向做出判断,这个算法因为尤其方便简单所以受到了广泛应用。单流向算法中的D8算法是当前最为广泛应用的算法,在D8算法过程中,每一个网格对于水流的方向都会简化正东南西北以及东南、西北、东北、西南这八个方向,并且会用代码表示,其代码分别为1,2,4,8,16,32,64,128进行八个方面的表示。

没有洼地的DEM上都是独一无二的网格水流方向,水流方向编码只取这个网格中8个数字其中的一个。确定水流的流向是利用计算中心网格和邻域网格中最大距离权差距进行判断的。邻域网格和中心网格的高程差除以两个网格之间的距离就是距离权差距,网格之间的距离跟方向是有着密切关联的,若中心网格的方向值在邻域网格中是四个平行于坐标轴的四个方向,如:1,4,16,64……那么规定两个网格之间的距离就是1,另外的方向差距就为根号2,以下是具体的计算步骤:

(1)开启ArcToolbox,(在ArcMap中找到ArcToolbox图标,单击左键即可进入启动。)

(2)进入水文分析模块,在ArcToolbox中找到Analysis Tools工具箱并展开,再把Hydrology工具集打开;

(3)进入F low Direction工具,把计算水流方向对话框打开。

3.计算汇集积累量

汇流积累量在地表径流模拟的过程中是在水流方向数据计算上所得。汇流积累量的大小对于每一个网格来说,都代表其上游有多少网格那么网格的水流方向终究汇流经过此网格,数值越大的汇流积累量,此地区就越容易让地表径流得以形成。汇流累积量越大的网格,汇流能力也会越大;相反,没有汇流累积量的区域也许是流域的分水岭。

4.设置对汇流的临界值

在汇流累積图中,注入网格的所有单位水量的数量都是每一个网格的汇流累积量,某一给定的临界值被网格的汇流量超过时,就可以认为水道上被该网格占据,河系网络提供的重要参数是汇流临界值,也是河道认准的可入范围。汇流的临界值可以通过Hydrology中定义河系的命令进行设置。最开始进行分析的时候,可以从小到大的选择几个临界值,因此便于河系大致范围最可能的观察[2]。

5.提取河流网络

以汇流临界值的设定为标准,通过汇流累积栅格图层被流径处理命令以后提取的河系栅格图层的利用,所有累积量无论大小,其汇流临界值的栅格都可以被定义成河道。

在ArcGIS环境下提取河流网络的步骤:分别把“Input Stream Raster”和“Input F low Direction R aster”当作 F low Direction生成数据和 Single Output Map Algebra生成的栅格数据的输入,矢量化之后的河网文件当作输出文件。

结束语:

本文基于DEM的原理,利用Hydrology工具包对流域特征进行了河网提取实验,表述了如何提取河网的普遍过程,基于时间和经验有限,还有待完善指正。

参考文献:

[1]赵健,贾忠华,罗纨.ARCGIS环境下基于DEM的流域特征提取[J].水资源与水工程学报,2011,17(1):11-20.

[2]王玉富,王翰钊.ArcGIS环境下基于DEM的流域特征提取[J].湖北民族学院学报(自然科学版),2010,28(4):10-14.

数字图像轮廓特征提取过程研究 篇10

数字图像处理泛指从图像获取到图像信息输出的全过程, 包括对已有图像信息的处理, 它具有精度高、成本低、速度快及灵活性好等特点, 使得其在诸多领域得到了广泛的应用。作为数字图像处理的常用技术, 图像增强、图像分割、边缘检测等已经发展的较为成熟【1】, 并经常被结合起来用以处理图像。

轮廓特征提取作为数字图像处理中的一个重要方面, 更是许多有关图像研究的重要中间环节, 目前已有很多相关工作完成【2】。提取出图像中物体的大致轮廓等特征可以用来模式识别【3】、物体判断、数学特征值 (如分形维数【4】) 等的计算。

本文对图像轮廓提取过程及应用到的关键技术进行了研究, 给出照片中河流轮廓提取实例。

2 图像轮廓特征提取的流程分析

对于给定的原始图像, 为了提取出轮廓特征, 需要消除图像中的无用噪声, 同时考虑增强消噪后可能变模糊的图像中对提取有利的特定信息, 在此基础上把图像分割成有意义的区域, 再使用特定算子勾勒出图像的轮廓。下图为图像轮廓特征提取的流程示意:

本文对已有的数字图像, 采用目前常用的空间域和频率域的平滑算法 (如理想低通滤波器) 滤波去噪增强, 然后选择适当的阈值分割法 (如OTSU算法) 分割得到二值化黑白图, 再采用适当的边缘检测算子 (如log算子) 提取图像的轮廓特征, 并对所用技术进行描述。

2.1 图像增强

图像经过增强处理后效果会得到改善, 它的某些特定信息将得到增强。在增强过程中, 不分析图像降质的原因, 处理后的图像不一定逼近原始图像, 即可以是一个失真的过程, 且不能增加原图像得信息。其目的是要增强视觉效果, 针对给定图像的应用场合, 有目的地强调图像的整体或局部特性, 扩大图像中不同物体特征之间的差别, 强调某些感兴趣的特征, 抑制不感兴趣的特征, 满足某些特殊分析的需要。将原来不清晰的图像变得清晰或改善图像质量、丰富信息量, 加强图像判读和识别效果。

根据图像增强处理过程所在的空间不同, 可分成基于频率域的方法和基于空间域的方法。前者是一种间接增强的算法, 把图像看成一种二维信号, 经傅里叶变换将图像从空间域变换到频率域, 然后在频率域对频谱进行操作和处理, 再将其反变换到空间域, 从而得到增强后的图像;后者直接在图像所在的二维空间进行处理, 即直接对每一个像素的灰度值进行处理。基于空域的算法分为点运算算法和邻域去噪算法:点运算算法即灰度级校正、灰度变换和直方图修正等, 目的或使图像成像均匀, 或扩大图像动态范围, 扩展对比度;邻域增强算法分为图像平滑和锐化两种:平滑一般用于消除图像噪声, 但是也容易引起边缘的模糊, 常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓, 便于目标识别, 常用算法有梯度法、算子、高通滤波、掩模匹配法、统计差值法等。

2.1.1 理想低通滤波增强

一般图像的能量主要集中在其低频部分, 噪声和系统中所要提取的边缘信息主要集中在其高频部分, 图像增强的目的是去掉高频干扰又同时保持边缘信息。可以采用低通滤波的方法去除高频干扰来平滑图像。低通滤波是频域滤波增强的一种, 是在变换域空间对图像进行滤波。如上所述, 一般通过某种变换 (如傅里叶变换、小波变换) 将图像从空间域变换到频率域, 然后在频率域对频谱进行操作处理, 再将其反变换到空间域, 从而得到增强后的图像。图像从空间域变换到频率域后, 其低频分量对应了图像中灰度值变化比较缓慢的区域。

以傅里叶变换为例, 频域滤波的主要步骤为:

(1) 对原始图像f (x, y) 进行傅里叶变换得到F (u, v) :假设图想以undefined存储, 则离散傅里叶变换undefined可由如下公式得到

undefinedundefined

(2) 将F (u, v) 与传递函数H (u, v) 进行卷积运算得到G (u, v) :

undefined

(3) 将G (u, v) 进行傅里叶逆变换得到增强图像g (x, y) :

undefinedundefined

故频域滤波的核心在于如何确定传递函数H (u, v) , 一个二维的理想低通滤波器的传递函数如下:

undefined

式中, D0是一个非负整数;D是从点 (u, v) 到频率平面原点的距离, 即:

undefined

理想低通滤波器的含义是指小于D0的频率, 即以D0为半径的圆内所有频率分量可以完全无损地通过, 而圆外的频率, 即大于D0的频率分量则完全被除掉。

2.1.2 Roberts算子锐化

图像滤波平滑往往使图像中的边界、轮廓变的模糊, 为了减少这类不利效果的影响, 这就需要利用图像鋭化技术, 使滤波增强后图像的边缘、轮廓线以及图像的细节变的清晰。经过平滑的图像变得模糊的根本原因是因为图像受到了平均或积分运算, 因此可以对其进行逆运算 (如微分运算) 就可以使图像变的清晰。

Roberts算子又称为梯度交叉算子, 是一种利用局部差分算子寻找边缘的算子。梯度幅值计算近似方法如图2:

(i, j) 为当前像素的位置, f (i, j) 为该点的灰度值, 由如下锐化公式得到表示增强后的图像 (i, j) 位置处灰度值g (i, j) :

undefined

2.2 图像分割与OTSU法

图像分割的目的是把图像空间分成一些有意义的区域, 可以逐个像素为基础去研究图像分割, 也可以利用在规定邻域中的某些图像信息去分割。图像分割比较正式的定义如下:

令集合R代表整个图像区域, 对R的图像分割可以看作是将R分成N个满足以下条件的非空子集R1, R2, …, RN:

(1) undefined;

(2) 对i=1, 2, …, N, P (Ri) =TRUE;

(3) 对∀i, j, i≠j, 有Ri∩Rj=φ;

(4) 对∀i, j, i≠j, P (Ri∪Rj) =FALSE;

(5) 对i=1, 2, …, N, Ri是连通的区域。

对于此定义需要补充的是, 实际的图像处理和分析都是面向某种特定应用的, 所以条件中的各种关系也是需要和实际要求结合而设定的。图像分隔的依据可以建立在图像像素间的“相似性”和“非连续性”两个基本概念之上。像素的“相似性”是指图像中在某个区域内像素具有某种相似的特性, 如像素灰度相等或相近, 像素排列所形成的纹理相同或相近。“不连续性”是指像素灰度的不连续, 形成调变的阶跃, 或是指像素排列形成的纹理结构的突变。故相似性分割就是将具有同一灰度级或相同组织结构的像素聚集在一起, 形成图像的不同区域;非连续性分割就是首先检测局部不连续性, 然后将它们连接在一起形成边界, 这些边界将图像分成不同的区域。图像分割方法又可以分为结构分割方法和非结构分割方法两大类。结构分割方法是根据图像的局部区域像素的特征来实现图像分割, 如阈值分割、区域生长、边缘检测、纹理分析等, 这些方法是假定事先知道这些区域的特性, 或者在处理过程中能够求得这些特性, 从而能够寻找各种形态或研究各像素群。非结构分割法包括统计模式识别、神经网格方法或其他利用景物的先验知识实现的方法等。

图像的黑白二值图像转化是指通过设定某个临界阈值, 大于该临界值时为白, 存储时用1表示, 小于该临界值时为黑, 存储时用0表示, 这样就可以将任意的彩色或者灰度图像转换成黑白二值图像。根据峰值个数以及处理过程的不同, 可以用不同的方法完成灰度图像转换为黑白二值图像的过程, 对于灰度峰值的多少, 可以设定多个不同的临界值。

常用的黑白二值化处理方法有:

1) 单阈值法。对于具有单灰度峰值的图像, 将灰度最大峰值作为临界值F, 并将图像点阵点上的颜色值小于等于某临界值F的像素undefined转换为黑色;大于F的像素值转换为白色。

2) 双阈值法。对于具有两个灰度峰值的图像, 将这两个最大峰值设定为两个不同的临界值F1和F2。当某个像素undefined的像素值介于F1和F2之间时设为白色, 其他情况设为黑色。

大津法 (又称OTSU法或最大类间方差法) 于1979年提出, 它是在灰度直方图基础上用最小二乘法原理推导出来的, 具有统计意义上的最佳分割阈值。Otsu法算法简单, 对光线等具有很强的自适应能力, 在灰度图像目标和背景的自动分割上具有广泛的应用。具体算法如下:

对图像A, 记t为前景与背景的分割阈值, 前景点数占图像比例为w0, 平均灰度为u0;背景点数占图像比例为w1, 平均灰度为u1。

图像的总平均灰度为:

u=w0×u0+w1×u1

从最小灰度值到最大灰度值遍历t, 当t使得值

g=w0× (u0-u) 2+w1× (u1-u) 2

最大时t即为分割的最佳阈值。

对大津法可作如下理解:g实际上就是类间方差值, 阈值t分割出的前景和背景两部分构成了整幅图像, 而前景取值u0, 概率为 w0, 背景取值u1, 概率为w1, 总均值为u, 根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量, 方差值越大, 说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小, 因此使类间方差最大的分割意味着错分概率最小。

2.3 边缘检测

图像的边缘是图像的最基本特征, 集中了图像大部分的信息, 图像边缘的确定与提取对于整个图像场景的识别与理解是非常重要的。物体的边缘是以图像局部特征不连续的形式出现的, 也就是指图像局部亮度变化最显著的部分, 例如灰度值的突变、颜色的突变、纹理结构的突变等, 同时物体的边缘也是不同区域的分界处。图像边缘有方向和幅度两个特征, 通常沿边缘的走向灰度变化平缓, 垂直于边缘走向的像素灰度变化剧烈。根据灰度变化的特点, 常见的边缘可分维阶跃型、房顶型和凸缘型。

当使用一阶倒数的边缘检测算子时, 如果所求的一阶导数高于某一阈值, 则确定该点为边缘点, 这样做会导致检测的边缘点太多。一种更好的方法就是求梯度局部最大值对应的点, 并认定它们是边缘点。通过去除一阶导数中的非局部最大值, 可以检测出更精确的边缘。一阶导数的局部最大值对应着二阶导数的零交叉点, 通过找图像强度的二阶导数的零交叉点就能确定精确的边缘点。通常将Gaussian滤波器和Laplacian边缘检测结合在一起, 形成LOG算法。即先用高斯函数对图像进行平滑, 然后再用拉普拉斯算子进行运算, 得到Laplacian-Gauss算法, 它使用一个墨西哥草帽函数形式:

undefined

这种方法在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点, 这一点可以用拉普拉斯算子将边缘点转换成零交叉点, 然后通过零交叉点的检测来实现边缘检测。所谓的零交叉点就是:如果一个像素出的值小于一θ0, 而此像素连通的各个像素都是大于θ0 (θ0为一个正数) , 那么这个像素就是零交叉点。

与其他边缘检测算子一样, LOG算子也是先对边缘做出假设, 然后再这个假设下寻找边缘像素。但Log算子对边缘的假设条件最少, 因此它的应用范围更广。另外, 其他边缘检测算子检测得到的边缘时不连续的, 不规则的, 还需要连接这些边缘, 而LOG算子的结果没有这个缺点, 对于Log 算子边缘检测的结果可以通过高斯函数标准偏差σ来进行调整。

3 基于MATLAB环境的实验分析

在MATLAB环境下定义函数并编写代码, 对一副照片上的河流轮廓进行提取, 过程如图:

图二是原始彩色照片灰度转化后的图像, 经过低通滤波去噪后得到图三所示图像, 去除了图像的高频噪声, 但略显模糊。对其进行Robert算子锐化调整后可以得到图四所示的增强图像, 图像特征明显变得清晰。大津法 (OTSU) 阈值分割后得到的图五可以看出特征区域和非关注区域的明显对比, 然后由log算子边缘检测提取河流的轮廓, 由图二和图六比较可见提取的效果较为理想。

4 结束语

本文首先介绍了数字图像轮廓特征提取的一般过程, 给出了流程图, 然后详细讨论了数字图像处理的中间环节技术, 并给出了这些技术的部分具体算法, 最后在MATLAB环境下编写代码, 从一副照片中提取出了河流的轮廓, 实验分析结果较为理想。数字图像处理技术应用于图像轮廓的提取, 能够简化一些实验研究工作, 缩短时间提高效率, 如提取的河流可以用于识别和地图绘制, 提取岩石断面轮廓可以用于分形维数计算等等。为了满足不同的需求, 研究者可以对提取过程中用到的技术加以改进或提出新的算法, 如采用不同的边缘检测模型和技术[5], 以达到自己研究所需要的特征和精度。

参考文献

[1]龚声蓉, 刘纯平, 王强等.数字图像处理与分析.北京:清华大学出版社, 2006, 1-84, 168-234

[2]邹柏贤, 林京壤.图像轮廓提取方法研究.北京:计算机工程与应用, 2008, 161-165

[3]魏冬冬, 聂铁铸等.人脸特征提取与识别技术研究.计算机与现代化, 2007, 3:69-76

[4]彭瑞东, 谢和平, 鞠杨.二位数字图像分形维数的计算方法.中国矿业大学学报.2004, 33 (1) :19-24

上一篇:欣赏语文中的美下一篇:我国研究生心理健康