特征提取模型

2024-06-22

特征提取模型(共12篇)

特征提取模型 篇1

0 引言

随着信息技术的发展, 计算机信息检索的对象己经从文本、声音、图像和视频等多媒体数据类型, 扩展到真实丰富的三维模型。三维模型广泛应用于机械产品设计、建筑工业设计、虚拟现实、3D游戏、影视动画等领域。对三维模型检索技术的研究不仅有重要的理论意义和实用价值。

三维模型检索系统可以分为通用领域和专业领域的三维模型检索系统。目前己经出现了基于WEB的通用领域的三维模型检索系统, 用户可以通过网络使用这些检索系统来检索自己需要的模型, 但检索还有一定的局限性。近年来专业领域的三维模型检索系统得到了广泛的应用, 比如生物分子、机械零件、地形匹配等。这些检索与通用领域的三维模型检索系统具有较大的相似性, 但也具有自身的特点。通常而言, 专业领域的三维模型检索系统可以利用专业领域模型的特点、需求等信息, 快速地检索出所需模型。具有如下特点:1) 专业领域信息强。在各自的领域可能需求的精确性不高, 这样可以缩短检索的时间;2) 模型结构复杂度较低, 也比较有规则, 如机械零件模型、工程动画中的常见模型等, 这样在特征提取方面较容易实现。

1 三维模型检索简介

近些年来, 针对文本信息的检索技术日臻完善, 针对二维图像以及影视资料的检索技术迅速投入应用, Google和百度等著名搜索引擎的出现已经改变了人们查找信息的固有方式。相比文字和二维影像的检索, 对于三维模型的检索更具有其复杂性和特殊性。尽管也有数量不多的机构提供模型检索服务, 然而无论是从检索的效率还是结果的准确性等因素上来考虑, 现有的模型检索技术距离高质量的商用水平仍有很大的提升空间。广阔的应用前景吸引了世界各地的研究人员投入大量的时间和精力从事模型检索相关领域的研究和推广, 并逐渐形成了相对统一的三维模型检索的系统架构。如图1所示。

一个完整的三维模型搜索引擎通常包括离线和在线两个并行的部分, 分为数据获取、数据分析与检索匹配三大模块。

离线部分由数据的获取和数据的分析组成, 具体的流程包括:

1) 通过“网络爬行器”等途径获取三维模型;

2) 提取三维模型的特征;

3) 根据特征建立索引等。

在线部分即检索匹配, 具体的流程包括:

1) 用户通过交互界面选择查询方式提交查询;

2) 根据查询方式进入相应的特征提取模块提取相应的特征;

3) 进入匹配模块和索引模块, 返回特征最相近的结果。

这三个功能模块都在模型检索系统中发挥着重要作用, 算法设计的优劣关乎系统整体的检索性能、精确度和有效性。作为检索三维模型文件的界面要能够易于普通用户快速地学习和使用, 使得用户在短暂的时间内能够充分表达清楚自己的检索诉求。检索系统在获得用户提供的特征描述后, 要能迅速从中提取有效信息并与数据库中现存的特征进行比对。

模型检索系统应该对相关的模型提取出相近的特征描述, 同时能够有效地区分不相关的模型。在交互系统中, 特征提取和匹配的计算过程应在较短的时间内完成, 不应使用户感到明显的延迟。寻求更高效准确的特征描述和匹配算法一直是科研人员不断追求的目标和研究的重点。随着三维模型文件数量的急剧扩张, 从超大容量的数据库中快速地提取出查询结果也已成为模型检索中函待解决的问题。因此如何建立高效的索引结构以满足用户对检索效率日益提高的需求也逐渐引起了学术界与产业界的高度重视。

三维模型检索系统研究尽管取得了一定的进展, 但还处于初期阶段, 很多技术稳定性还不够, 三维模型检索技术还有待于进一步的研究。三维模型检索系统发展趋势主要集中在以下几个方面:

1) 现有检索技术一般针对整体特征进行检索, 未来的检索技术应该具备整体和局部检索的功能, 不仅能从同类物体中检索对象, 还要能从异类物体中检索对象;不仅能从几何特征检索, 还可根据物体的颜色, 材质, 粗糙度等属性进行检索;

2) 从检索效果来看, 现有技术还不能满足用户的需要, 开发与三维模型输入格式无关、与模型局部坐标系无关的检索技术成为一个重要的研究方向;

3) 建立一个合理的、权威的、统一的评价体系;

4) 现有检索界面不能满足某些人群的需要, 开发适合通用、专业领域的界面成为一个重要研究方向。

2 三维模型特征提取方法比较

2.1 基于轮廓形状的特征提取

计算并比较三维模型的轮廓特征, 从而获得三维模型的几何相似性, 是基于轮廓形状的几何特征提取算法实现的思想。其中, 三维模型轮廓特征主要包括了顶点以及网格的分布特征。

Osada提出了通过随机采样来获得三维模型的几何特征的形状分布方法。对于从三维模型表面上随即采样到的两个点, 可得到它们之间的欧氏距离 (DZ距离) , 统计通过以上方法而得到的大量的欧氏距离, 可获得三维模型的形状分布曲线。

形状分布直方图算法可以简要概述为:首先使用几何函数来计算三维模型顶点的形状特征, 从而获得形状特征分布直方图, 然后比较直方图的相似距离以获得三维模型的几何相似性。

2.2 基于拓扑形状的特征提取

通过比较三维模型的拓扑结构来获得三维模型相似性, 这是基于拓扑形状的三维模型相似性比较算法的核心思想。其中, 最常使用的拓扑结构信息包括三维模型的分支与连通性等。模型的Reeb图是从连通区域的角度来计算三维模型的拓扑结构。在该方法中首先将三维模型投影到二值图像, 从而作出二值图像的Reeb图, 然后计算Reeb图的基本元素, 包括圆环的个数Nuln (R) 、向上分支个数Num口B) 、向下分支个数Num侧B) 、每个分支的枝权数量Sum。最后, 根据Reeb图的这些基本元素, 计算出Reeb图的特征,

采用基于多分辨率Reeb图的骨架提取方法, 不仅可以描述三维模型的特征, 同时还具备了描述模型的空间拓扑关系的能力。对于局部匹配乃至全局匹配该方法都是较为适用的。

在描述三维模型拓扑结构的方法中, 除了Reeb图以外, 还有中轴线方法。从三维模型骨架的角度来计算三维模型的拓扑结构是中轴线方法的思路。

2.3 基于视觉形状的特征提取

在基于视觉的三维模型相似性比较算法中, 通过比较三维模型在各个方向的视觉图像的形状相似性可以获得三维模型的相似性。

基于视觉相似的特征提取方法的提出是基于这样一个事实:从任意视角来观察两个相似的物体, 它们都应该具有相似性。通过比较三维模型在多个方向的视觉图像的形状相似性来获得三维模型的相似性是基于视觉形状的特征提取方法的基本思想。在该方法中, 首先将三维模型投影到二维视图上, 再从不同模型对应的二维视图提取特征进行相似性匹配计算。在这种算法中, 基于二维轮廓图的比较和基于视觉相似的检索技术是较为典型的例子。

Lomer在预处理阶段, 采用以一组二进制表达的二维图像来对三维模型的特征进行描述的方法, 然后在对应的二维图像之间进行后续的相似性匹配计算, 并且应用了图像检索中关于特征提取的方法。

在基于透视投影的三维模型几何相似性比较算法中, 先将三维模型用正二十面体包围, 而后选取若干个视点对三维模型进行投影, 由此可以画出二值图像的Reeb图, 再通过计算Reeb图的特征从而求出投影图像的拓扑相似距离, 最后可得到三维模型的相似距离。

基于3D模型的ZD轮廓图的比较方法中, 从三维模型正视、俯视和侧视三个固定方向提取出模型的轮廓图, 首先找到这样一个圆, 该圆恰好包括了轮廓图, 将该圆等分成固定数量的圆环, 构成圆环函数, 然后对每个圆环进一步分解, 使其由一系列三角函数的和构成;根据旋转不变频率的振幅, 可计算出每个圆环的特征向量, 最后, 利用所有的圆环特征向量构成模型轮廓图的二维特征向量。

3 三维模型检索系统的设计与实现

3.1 系统硬件和软件配置

本系统采用了普林斯顿大学的标准三维模型数据库, 特征计算使用了OFF文件, 三维模型的显示使用了FLT文件。

机器配置:2.0 Intel P4、512 RAM、Geforce4显卡。

开发工具:Visual studio 2003、Open Scene Graph 2.4。

3.2 三维模型数据库的获取及文件组织结构

普林斯顿大学的三维形状检索和分析研究小组构建了一个三维标准数据库用于检索性能测试。这些三维模型被转化成为统一的文件形式。经过筛选和手工分类, 从中选择出比较有代表性的1814个三维模型用于构造标准三维模型数据库。

这些模型被分为两个集合, 称为训练集 (Training) 和测试集 (Testing) , 其中训练集和测试集中各包括907个三维模型。训练集用于算法不稳定时测试算法, 测试集是算法稳定时与不同算法进行比较时采用的集合。为了对不同算法试验使用一个统一的数据库, 以便于对不同算法的检索效果进行比较。本检索系统采用的三维模型库是从普林斯顿大学形状分析实验室网站上下载的标准数据库。

本系统的数据库共有1110个模型, 分为64类, 每个类别中从0开始顺序编号。三维模型是以文件的形式存放, 对于每个三维模型一共包含4个文件:三维模型文件 (.off) 、三维模型的描述文件 (.txt) 、三维模型的二维缩略图文件 (.jpg) 、用于三维显示的文件 (.flt) , 将其分别存放在不同的目录中。

3.3 三维模型检索系统结构设计

三维模型检索系统主要包括用户检索界面、特征提取、特征匹配、特征向量数据库以及三维模型文件的二维和三维展示的管理, 如图所示。用户使用检索界面进行三维模型检索, 在检索界面中, 本系统采用的是示例查询模式, 在用户选中一个示例模型后, 该模型的相应信息被自动传送到特征匹配模块, 特征匹配模块将接收到的三维模型与三维模型特征向量和索引数据库中的特征信息进行匹配, 从而得出检索的结果, 并将结果返回到用户检索界面, 供用户挑选需要的三维模型。特征匹配模块主要是圆环分割的方法和图像矩的方法。特征匹配模块将接收到的三维模型与三维模型特征向量和索引数据库中的特征信息进行匹配, 从而得出检索的结果, 并将结果返回到用户检索界面。特征提取模块主要是实现在正交主平面的基础上进行特征提取的方法, 从三维模型库中提取三维模型的圆环分割信息和矩信息, 并将这些特征信息保存到三维模型特征向量和索引数据库中。如图2所示。

3.4 三维模型检索系统界面的设计

在检索系统界面中, 左侧显示模型的分类树形结构, 右侧为显示模型的三维窗口。根据数据的组织形式, 用户从“类别”中选择用于匹配的索引三维模型种类, 然后从“模型”下拉菜单中选择需要查找的三维模型。选完之后索引三维模型就会在右侧三维显示, 用户可以与其交互。

为了使模型的显示更加直观, 系统对模型进行了三维展示。首先将OFF文件通过软件Deep Exploration将模型转换为flt格式, 然后用开源的Open Scene Graph和Visual studio 2003编写Active X控件用于模型的三维展示。

在检索界面的左侧树形目录中显示了所有的64个分类的模型文件名, 点击树形目录中的任意模型文件名称, 在右侧的Active X控件窗口中可以方便的从各个角度浏览三维模型。通过鼠标的操作实现对模型的旋转、平移、缩放操作, 并在模型的下方显示模型文件的名称和大小信息。

3.5 三维模型检索结果显示设计

三维模型检索系统采用了示例查询的检索方式。用户可以通过树型目录在三维控件中浏览系统提供的所有的三维模型, 并且从浏览的三维模型中选择一个三维模型进行检索。当检索一个模型时, 在浏览界面中浏览三维模型确定检索目标, 然后将检索结果在结果界面中显示。具体过程是用户点击检索按钮, 系统就会首先对模型进行预处理, 然后自动计算用户选择的三维模型的特征向量, 最后根据计算出的特征向量搜寻特征向量数据库, 计算模型之间的特征距离, 按照距离由小到大的顺序在检索结果显示界面中列出最佳匹配模型的缩略图。用户可以点击缩略图, 在右侧的三维显示窗口中从各个角度观看所选中的三维模型, 并在下侧显示模型的大小信息, 用户可以点击模型的二维缩略图, 然后点击Download按钮来下载所需要的模型。

4 结论

本文设计的三维模型检索系统, 主要从三维模型检索系统的文件组织形式、系统的结构、界面的设计、模型的三维展示等方面进行了介绍, 对提出的特征提取方法进行了实验验证。检索系统通过示例三维展示的方式进行三维模型检索, 即用户通过选择数据库中存在的三维模型进行三维浏览然后查询。系统中的三维模型、三维模型的二维缩略图以及三维模型信息采用文件方式存放, 依靠操作系统的文件管理功能进行管理。此三维模型检索系统的具有简单易操作的特点, 检索结果虽然还有不足的地方, 但总的来看还是比较理想的, 为进一步研究建立了很好的实验平台。

特征提取模型 篇2

用InSAR技术提取数字高程模型的研究

合成孔径雷达干涉测量(InSAR,Synthetic Aperture Radar)是一种获取地面数字高程模型(DEM)和探测地面微小形变的新技术.这里概述了干涉测量的发展历史,介绍了干涉测量的`基本原理,并利用青藏高原库塞湖地区的数据对干涉测量获得地面数字高程模型进行了详细的阐述,最后对生成的地面数字高程模型进行结果分析.

作 者:苗放 梁军 叶成名 杨智翔 作者单位:成都理工大学信息工程学院,成都,610059刊 名:物探化探计算技术 ISTIC英文刊名:COMPUTING TECHNIQUES FOR GEOPHYSICAL AND GEOCHEMICAL EXPLORATION年,卷(期):29(2)分类号:V556.6关键词:合成孔径雷达 干涉测量 地面高程模型 误差分析

图形形状特征提取前的重要工作 篇3

关键词:图形;二值化;前景;分类

中图分类号:TP393 文献标识码:A文章编号:1009-3044(2007)16-31115-02

The Important Works Before Abstracting Graphics’ Characteristic of Shape

LIU Qing,MENG Xiang-zeng,JI Cui-ping

(Shandong normal university,Jinnan 250014,China)

Abstract: Based on expounding the graphics concept, this thesis studies and develops the important works before abstracting graphics’ feature of shape, including proposing the method of changing specific image into graphics by binaryzation, achieving the method of determining the foreground color of graphics automatically, proposing the simple classification system of graphics and achieving automatic classification.

Key words:graphics;binaryzation;foreground;classification

1 图形的概念

图象的特征提取是图象处理领域的一个重要内容,目前的研究主要是低层视觉特征的提取。形状作为图象低层视觉特征之一,较颜色和纹理等更接近人的知觉和语义,但描述也更为复杂。在提取形状特征的实验中所使用的图象具有以下特点:黑白二值图象以便于背景和前景分离,前景由一条或多条封闭的边界曲线及其内部区域组成,形状特征明显且为最主要低层视觉特征。这一点体现在文献中的例图以及各形状测试图库中,我们称这类图象为图形,如图1。也就是说,这里所定义的图形属于位图,研究领域属于图象处理而非计算机图形学。

图1 图形示例

目前,在形状特征研究领域,广大的研究者大都把目光集中在形状特征提取及基于形状特征的图形识别、匹配、检索等方面,这些也无疑是该领域最重要的研究内容。在进行这些研究之前的工作往往被忽视,但这些工作也很重要,它们包括:图象二值化为图形、自动判定图形前景颜色和图形分类。在接下来的部分,将一一阐述我们在这三方面所做的研究。

2 图象二值化为图形的方法

图形的一个重要特点就是黑白二值图象,已存在的形状测试图库虽然都是二值图象,较著名的有MPEG-7 contour shape database Set B 、MPEG-7 region shape database、Foliage、F. Mokhtarian fish database等,但它们为数不多且难以找到。当研究者找不到合适的、足够的图库时,就不得不面对图象二值化的问题。

图象二值化的关键是阈值的选取,经典的方法主要有灰度直方图法、微分直方图法[1]、最大熵法[2]、最小模糊度法[3],近些年很多学者提出了一些改进的方法,但没有哪种通用的方法可以让所有图象的二值化结果都理想,针对一类的图象往往采用特定的方法。我们针对用来获得图形的图象的特点,提出了一种简单有效的方法,取得了良好的实验结果。首先,我们人为的选择背景单一或背景颜色相差很小的那些图象来二值化,然后将彩色图象变为灰度图象后执行二值化。二值化算法思想如下:图象的边框处多为背景,据此取第m行m列点的颜色值及其上下n个值的区域为背景颜色的范围,将背景颜色范围内的点置1即白色,否则为0即黑色,最后将二值化后的图象中极小的连通区域视为噪声置1。第m行m列点容易受噪声影响,可在边框2*m个像素宽度内求灰度均值及此均值上下n个值的区域为背景颜色的范围。我们取m=5,n=12,对1000幅图象进行二值化,采用第m行m列点的方式,正确率达90.2%;采用边框2*m宽度内均值的方式,正确率达94.6%。我们将此方法命名为边框二值化法,此方法简单有效,但只适用于背景颜色较单一和前背景颜色相差较大的情况。

3 自动判定图形前景颜色

图形有的以黑色为前景,有的则以白色为前景,还有一些图形难以确定谁为前景合适,如图2。为了对图形进行后续处理,需要判定其前景颜色。目前研究者一般在选择图库时就人为的统一采用黑色或白色为前景的图形,从而忽略掉判定图形前景颜色的环节。我们提出了让程序自动判断图形前景颜色的方法。

(a)前景为黑色;(b)前景为黑色;(c)前景不好确定

图2 不同前景示例

方法一:图形中黑色和白色,较少的颜色为前景。方法二:图形边框k(k=10)个像素宽度内黑色和白色,较少的颜色为前景。图库中的图形多以黑色为前景,根据我们的边框二值化方法得到的图形也是黑色为前景,所以当黑白相当时,选择黑色为图形前景。对于前景色为白色的,进行反色,以保证前景色为黑色,方便以后的图形描述。我们对MPEG-7 contour shape database Set B中的1400幅图形,其中黑白前景各占一半,利用以上两种方法分别进行实验,实验结果用查全率和查准率表示。其定义用公式表示如下[4]:

准确率(Precision)=正确识别的图像数/应正确识别的图像数

正确率(Accuracy)=正确识别的图像数/所有识别出的图像数

实验结果为查全率分别是81.42%、98.57%,查准率分别是81.46、98.59%。

那些前景判断错误的图形,是由于其主体所占面积比例过大。这里我们选择方法二来求整幅图形前景,因为它既简单正确率又高。

对于主体既有黑色又有白色的图形,也可能主体中背景颜色所表达的形状才是真正的中心,所以要对主体进一步分析。我们认为,如果主体中背景颜色面积占主体面积的四分之一以上,则表示主体中背景颜色所代表的图形有分析的必要。将图形主体中背景的颜色置黑,其它全部置白,得到新的图形。这样对这幅图形的描述,就要添加上新图形的描述部分。图2(a)就是图2(c)的新图形,对图2(c)的描述除了要描述其白色部分的形状特征外,还要加上图2(a)黑色部分的形状特征。

4 图形分类

我们认为,图形根据对象数可分为多对象图形和单对象图形,单对象图形再根据欧拉数可分为实体单对象图形和空心单对象图形(见图3)。图形分类的意义主要体现的两个方面。一是在图形形状描述时,多对象图形主要研究其拓扑结构及将图形分离为多个单对象图形后的分别描述,而实体单对象图形适合基于轮廓的形状描述,空心单对象图形更适合基于区域的形状描述。二是在图形检索时,用户可以直接选择需要检索哪类图形,以提高检索效果。

图3 图形分类

我们实现了程序自动进行图形分类,无需再人为的分类。算法:首先,计算图形对象数,一个对象被定义为一个较大的连通区域,若对象数为1则为单对象图形,对象数大于1则为多对象图形。然后计算图形的欧拉数,欧拉数定义为连通区域数减孔洞数,欧拉数为1为实心单对象图形,欧拉数小于等于0为空心单对象图形。

我们随机选择了120幅图形进行分类实验,其中多对象图形、实心单对象图形、空心单对象图形各40幅。对象数=连通区域数-小连通区域数。小连通区域的面积小于最大连通面积0.1倍。多对象图形、实体单对象图形和空心单对象图形的查全率分别为95%、97.5%和92.5%,查准率分别为92.68%、97.5%、94.87%。

我们在知觉上定义一个对象是根据语义上的一个物体,而不是一个较大的连通区域,所以在分类时会出现错误。

5 结论

实验表明,特定图像二值化为图形、自动判断图形前景颜色和自动对图形分类均取得到了良好的效果。这些前期处理工作,为下一步的图形形状描述、匹配和检索,做好了必要的准备。

参考文献:

[1]Weszka J S. Survey of threshold selection techniques[J]. Vision Graphic Image Process, 1978:259-265.

[2]吴谨,李娟,刘成云等.基于最大熵的灰度阈值选取方法[J].武汉科技大学学报(自然学科版),2004,(1):58-60.

[3]Deluca A, Termini S. A definition of a non-probabilistic entropy in the set-ting of fuzzy set theory[J]. Int Control, 1972:301-312.

[4]何强,何英.MATLAB扩展编程[M].清华大学出版社.2002.6: 293-300.

特征提取模型 篇4

装配模型是产品在计算机上的抽象和描述,虚拟装配模型不仅能描述装配体的几何信息,还能表示装配体中的零部件的尺寸信息,相互关系以及拓扑结构[1]。虚拟装配模型建立的目的是为了构建虚拟环境中所需的装配信息以及更好地管理组织这些信息,为机构仿真提供必要的信息基础。零件装配信息主要指零件装配特征信息,即零件各个拓扑面的组成及各拓扑面的基本几何信息,包括几何面的中心,边界等。

在现有技术中,用许多空间三角形小平面来表示CAD实体的数据模型在三维建模中是很常用的一种方法。这种方法将CAD表面离散化为三角形面片。不同的精度时有不同的三角形网格划分。通常每个三角形面片有4个数据项表示,即三角形的3个顶点坐标和三角形面片的外法线矢量,整个CAD实体数据模型由多个三角形面片的集合表示,数据结构简单,而且与所使用的CAD系统无关。但是这种表示方法只是无序地列出构成实体表面的所有三角形的几何信息,不包含任何三角形之间的拓扑相邻信息。因此当用三角形面片这种表示方法生成的文件重建实体模型会遇到如下两个问题:一是由于导入的三维实体模型是经过三角化处理后的模型,拓扑信息匮乏,只能知道构成模型的点及三角面片信息,而无法得知模型的各个面的拓扑信息;二是构成零件的三角面片数量过于庞大,一个简单的球体模型约为5000个三角面片,而面片之间有着大量的冗余数据,甚至有许多错误和缺陷。因此需要设计一种能对缺乏拓扑信息却又数据量庞大的三维模型进行处理的通用方法。

近年来,对于这个问题的研究一直没有停止,但是主要集中于如何高效地读取STL文件实现拓扑重建,对于三维模型的进一步体素分离缺少研究。为了提高拓扑重建速度,一般都借助于查找表来加快顶点合并,文献[2-6]采用AVL树作为辅助查找表,文献[7]采用红黑树,文献[8]采用散列表。以上方法虽然能高效地建立拓扑关系,但是在虚拟装配系统中对于零件模型不但要进行拓扑重建,更需要精准地提取零件各个几何面的信息,尤其是零件模型的装配特征信息。因此系统中对零件信息精准地提取具有重要意义。

本文通过对三角面片信息进行处理,提出一种通用的数据预处理方法,可以对三维模型进行拓扑重建,实现模型的体素分离,提取三维模型的几何特征。

1 装配特征信息提取

由于CAD系统独立于虚拟装配系统,使用这种零件模型仅仅包含零件的几何与拓扑信息。而虚拟现实技术作为一种高级的人际交互技术,零件的模型是以计算机图形的方式进行处理的,因而在大多数VR系统中零件的模型是多边形面片(包括三角形面片),也就是说CAD与VR的模型是迥然不同,兼容性不强,难以直接从多边形面片表示的零件模型中提取诸如形状特征、尺寸参数、装配约束等信息。在CAD系统中,STL文件即三维实体模型文件经过三角化处理后得到的模型文件,是业界标准文件,这种文件在与VR系统交互中最为常见。

因此要完成零部件的装配特征信息的提取,首先要对三角面片模型进行三角形拓扑关系重建。STL模型中仅仅包含产品的几何位置信息,而且STL数据中包含大量的重复数据。要对STL文件后续处理首先要对STL模型去除冗余数据,提高存储和运算效率。在完成拓扑关键重建之后,通过将模型平面部分的三角形进行合并,完成STL模型的几何体素分离。最终完成装配特征信息的提前。

本文以STL格式文件在OSG环境中通过对STL文件包含的信息处理得到装配特征信息为例,介绍该方法的具体实施步骤。

2 装配特征信息提取步骤

装配特征信息提取过程可以分为以下三步:首先将STL文件导入OSG系统,然后对STL文件中的三角面片进行数据预处理,记录三角面片之间的相邻关系;其次根据“表面搜索算法”分解出基本几何体素;然后建立这些几何体素的基本几何信息,完善装配面信息;最后完成装配特征信息的提取。具体实施步骤如下:

步骤1:首先对三角面片进行数据预处理。三角面片仅仅包含模型的几何位置信息,而且三角形顶点是重复记录的。例如,一个具有13100个三角面片的网格模型,就使用了39300个顶点数据,而实际不重复的顶点仅有6556个,因此数据预处理的主要目的是数据去重和记录三角面片之间的相邻关系,方便后续操作。首先对读入文件,对三角面片顶点坐标进行排序,将重合顶点合并为一个顶点,并将归并后的顶点坐标存入新建的顶点坐标表中。其次建立三角面片对象,根据读取顺序记录每个三角面片的序列号,并为三角面片的三个顶点与顶点坐标表建立对应关系。最后根据相邻规则,为三角面的顶点建立三角面片的相邻关系,记录在三角面片对象中。

步骤2:根据“表面搜索算法”从整体模型中分解出基本几何体素。表面搜索算法大致可以分为两个步骤:第一步,在模型包含的所有三角形中搜索符合相同数学方程的三角形。第二步,判断搜索到的三角形是否有邻接关系,如果有添加到要搜索的表面,如果没有则抛弃。利用三角面片的合并将不同的体素区分开来,三角面片合并是一个递归循环过程。以圆柱面识别为例。

首先选取一个“种子三角面片”找出它邻接的三角面片,然后通过判断与它邻接的三角面片是否满足圆柱面判定规则。圆柱面判定规则定义如下:

设组成圆柱的三角形集合为Ω,则Ω内所有具有相邻边、法矢共面但不平行的三角形组成圆柱面。

若符合规则则相邻三角面片与“种子三角面片”合并。发生三角形合并后,原来的“种子三角面片”扩充为多边形边界,“种子三角面片”成为“种子多边形”。以得到的“种子多边形”边界为依据,寻找相邻三角面片,再重复以上合并步骤,使“种子多边形”不断变大,最终当所有相邻三角形均无法与“种子多边形”并合时,递归停止。这时得到的即是一个装配面。

步骤3:建立几何体素的基本几何信息,完善装配面信息。根据步骤二中得出的装配面,进一步通过具体的装配面规则去得到它的一些基本装配面信息,比如,圆柱面装配时需计算得到它的轴心位置,半径大小,深度等基本信息为装配时实现同轴关系提装配供特征信息。

装配信息提取方法如下:首先合并组成圆柱面的三角形的公共边,得到两个由三角形边界组成的多边形(即圆柱上下端面的圆),然后根据多边形顶点数据,计算出两个多边形的几何重心(圆柱位置参数)、外接圆直径(及圆柱直径)以及由两个几何重心确定的圆柱方向、高度。

3 实现效果

在OSG环境中对凸轮STL文件进行装配信息提取。其中图3是凸轮的三角面片图,整个齿轮模型由上下面,凸轮外廓面,凸轮内圆柱面组成,各个面由三角面片表示而成,图4是与图5是经过对凸轮的外廓面和内圆柱面提取之后的效果图,图4提取出了凸轮的外廓面,图5提取了凸轮的内圆柱面。

4 结论

该方法能将CAD软件制作的通用表面模型格式文件导入OSG环境中,对文件进行分析处理,提取装配特征信息,具有普遍通用性。实践表明,这种方法能够从三维表面模型中提取装配所需用的特征信息,可充分利用现有CAD系统提供的三维模型。重建的装配模型中包含了的参数化几何特征和基本拓扑关系,使重建模型具有很好的实用性。该方法在很大程度上拓展了CAD软件模型文件在OSG环境中的应用。

参考文献

[1]章崇晖,虚拟装配系统的信息管理技术研究[D],华中科技大学,中国优秀硕士学位论文库,2008年5月.

[2]刘金义,侯宝明.STL格式实体的快速拓扑重建[J].工程图形学报,2003,24(4):34-39.

[3]张必强,刑渊,阮雪榆.面向网格简化的STL拓扑信息快速重建算法[J].上海交通大学学报,2004,38(1):39-42.

[4]戴宁,廖文和,陈春美.STL数据快速拓扑重建关键算法[J].计算机辅助设计与图形学学报,2005,11(11):2447-245.

[5]张翔,廖文和,程筱胜,等.STL格式文件的拓扑重建方法研究[J].机械学科与技术,2004,24(9):1093-1096.

[6]侯宝明,刘雪娜.STL实体模型的拓扑重建及其缺陷修复[J].计算工程,2005,31(3):213-214,217.

[7]DAI CHUNXIANG,JIANG YING,HU QINGXI,et al.Efficient topological reconstruction for medical model based on mesh simplification[M].Berlin:Springer-Verlag,2007:526-535.

特征提取模型 篇5

针对遥感成像过程中普遍存在的退化现象,通过遥感成像模拟,揭示了不同退化程度对遥感数据质量的影响,反映了考虑成像退化因素对提高卫星遥感数据信息提取能力的.作用.基于成像退化采用的支持向量机方法对遥感图像地物分类的实验研究表明,这种方法使遥感图像地物分类精度得到明显提高,特别是支持向量机方法与图像恢复技术的结合,效果更为明显.

作 者:王先华 易维宁 杜尚宇 WANG Xian-hua YI Wei-ning DU Shang-yu  作者单位:中国科学院安徽光学精密机械研究所,通用光学定标与表征技术重点实验室,安徽合肥,230031 刊 名:大气与环境光学学报 英文刊名:JOURNAL OF ATMOSPHERIC AND ENVIRONMENTAL OPTICS 年,卷(期): 4(2) 分类号:P407 关键词:遥感   成像退化   信息   提取  

特征提取模型 篇6

关键词:叶脉;植物生长柜;颜色直方图;阈值分割;数学形态学

中图分类号: S24文献标志码: A文章编号:1002-1302(2015)01-0373-03

收稿日期:2014-03-06

项目基金:国家自然科学基金(编号:61275169、61178048);国家社会科学基金(编号:BFA110049);天津职业技术师范大学校级基金(编号:KYQD13022);

作者简介:崔世钢(1963—),男,天津人,博士,教授,从事机器人控制、人工智能等方面的研究。E-mial:cuisg@163.com。

通信作者:梁帆,博士,讲师,从事现代农业智能环境控制、医疗信号处理及手术机器人跟踪控制等方面的研究。E-mial:bachelormd10@163.com。随着工业化的不断发展,环境污染及土地资源等已成为蔬菜种植面临的重大问题。LED植物生长柜采用综合环境控制的方法,在立体多层空间内通过高效利用LED光能,最小限度使用水和肥料,为蔬菜提供安全、舒适的生长环境以实现蔬菜的优质高产。

在植物生长柜管理与应用方面,为了能够及时掌握蔬菜的生长情况,根据蔬菜生长速度及营养状况调整植物生长柜环境参数和营养液配置,实现植物生长柜的智能控制,需要对蔬菜叶片特征进行分析。叶片是蔬菜进行光合作用和蒸腾作用的主要器官,通过提取叶片特征能够直观地反映出植物的生长速度及营养状况等信息。在叶类蔬菜的叶片上分布着明显可见的脉纹(即叶脉),一方面为叶提供水分和无机盐、输出光合产物,另一方面支撑着叶片,使之能伸展于空间,保证叶的生理功能顺利进行。叶脉结构表征了叶脉系统在叶片里的分布和排列样式[1-3],叶脉密度和叶脉直径共同决定着叶脉系统的水力导度,直接影响到蔬菜叶片对水分和养分的传输和吸收,而且叶脉关系到叶片的寿命,一旦叶片受到损伤导致叶脉断裂,必将阻碍叶片吸收养分和水分,最终必将导致叶片枯死。

由于蔬菜粗大的叶脉在叶片生长发育过程中发挥着极其重要的作用,本研究从叶脉与叶肉的颜色差异入手,通过手机摄像头采集叶片图像,利用计算机图像处理技术分析提取叶脉信息,从而为衡量蔬菜生长状态、科学管理植物生长柜提供理论依据。

1材料与方法

1.1图像采集

为实现主叶脉与叶肉有效的分割,以实验室自主研发的LED植物生长柜中种植的小油菜作为试验对象。由于植物生长柜中LED灯光分布均匀,在植物向光性的作用下,蔬菜叶片生长较分散,这将有利于图像采集与特征分析。LED植物生长柜环境如图1所示。

为实现叶片信息的无损采集,本试验需要2个人配合拍摄图像。首先选择较为平整的叶片,一人将白色背景纸片贴近叶片下表面,使叶片与背景形成鲜明对比;其次为了避免彩色灯光颜色对图像分析的干扰,选择关闭植物生长柜内LED红色和蓝色光源,只保留LED白色光源;然后由另一人手持手机,使手机摄像头的光轴垂直于叶片所在的平面并保持固定距离对其拍摄;最后将采集的叶片图像传输至计算机,保存为.JPG格式,并作适当裁剪,方便后期图像处理。

1.2颜色模型

区分叶肉与叶脉最直接的方法就是利用2者之间颜色差距。常用的颜色分析模型有RGB模型和HSV模型[4-5]。其中RGB模型是用三维空间中的1个点来表示1种颜色,每个点有3个分量,即R、G、B分别代表该点红、绿、蓝3个通道,取值范围均为0~255;而HSV模型是从色调(hue,H)、饱和度(saturation,S)和亮度(value,V)的角度来分析处理图像的,色调H用一角度量来表示,红、绿、蓝分别相隔120度;饱和度S和亮度V的范围均为0~1。

在蔬菜生长过程中,叶片的颜色会由浅到深发生改变,所以单纯依靠单一的通道参数分析叶片不具备通用性。在叶片的图像分割方面,常用的颜色特征值除了颜色模型的单个分量外,还有超绿、超红等颜色特征,用以下公式表示:

超绿(extress green):EG=2G-R-B;(1)

超红1(extress red 1):ER1=1.4R-G-B;(2)

超红2(extress red 2):ER2=1.4R-G。(3)

通过在公式(1)至公式(3)之间进行数学运算可得到一系列新的颜色值:

NC=0xR+yG+zB<0

xR+yG+zB其他

255xR+yG+zB>255。(4)

1.3图像分割

为了凸显叶脉的图像特征,需要对图像进行目标分割。阈值分割法是最常用的分割技术之一,其基本原理是通过设定不同的特征阈值,把图像像素分为若干类[6]。设原始图像为 f(x,y),按照一定的准则在f(x,y)中找到若干个特征值T1、T2、T3等,将图像分割为几部分,分割后的图像为:

g(x,y)=LN,f(x,y)≥TN

LN1,TN≤f(x,y)

L1,T1≤f(x,y)

L0,f(x,y)≤T1。(5)

通常利用灰度直方图来求双峰或多峰,并选择两峰之间谷底处的灰度值作为阈值。阈值T的选取是有效分割图像的关键,当选取全局阈值T=T[f(x,y)]对叶脉分割的效果不够理想时,可以选择局部阈值T=T[N(x,y),f(x,y)],不仅考虑图像中点的灰度值,同时与点的局部邻域特征相结合,对图像进行分割处理,其中f(x,y)是点(x,y)的灰度值,N(x,y)是点(x,y)的局部邻域特性。

nlc202309011120

1.4形态学处理

数学形态学处理主要以图像的形态特征为研究对象,它通过设计一整套运算、概念和算法,用以描述图像的基本特征,理论虽然很复杂,但是基本思想却简单而完美。数学形态学的基本变换有膨胀、腐蚀、开运算和闭运算[7-9],它利用一个称作结构元素的“探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分之间的相互关系,从而了解图像的结构特征。结构元素通常有线形、圆盘形、矩形等。二维结构元素矩阵由0和1组成,其中数值为1的点决定结构元素的邻域像素在进行运算时是否参加计算。

腐蚀是把结构元素B平移a后得到Ba,若Ba包含于X,则记下a点。对所有满足上述条件的a点组成的集合称做X被B腐蚀的结果,用公式表示为:E(X)={a|Ba∈X}=XθB;膨胀是腐蚀的对偶运算,其定义是把结构元素B平移a后得到Ba,若Ba击中X,则记下这个a点。对所有满足上述条件的a点组成的集合称做X被B膨胀的结果,用公式表示为:D(X)={x|B[x]∩x≠ф}=X⊕B。在数学形态学中,最为重要的2个组合运算是开运算和闭运算。先腐蚀后膨胀称为开运算,即OPEN(X)=D(E(X)) 。开运算可以消除散点和毛刺,即对图像进行平滑。先膨胀后腐蚀称为闭运算,即CLOSE(X)=E(D(X))。 选择适当的元素结构可以通过闭运算将2个邻近的目标连接起来。利用形态学膨胀、腐蚀等组合运算可以实现目标对象的图像填充、边缘提取以及消除孤立点等功能。

2结果与分析

2.1颜色图像分析

对采集到的不同成熟度的叶片图像利用Matlab软件处理。在分别提取图像在RGB空间和HSV空间各个分量的灰度图像以及对应的直方图分布进行分析后发现,虽然不同,叶片的各个颜色分量分布不同,但是对每个叶片而言,R、G、V 3个分量图像中叶脉的形态较清晰,直方图中的波峰和波谷相对其他通道而言对比较明显,但是实际的叶脉分割效果并不是很理想,由此得出仅对单通道进行叶脉提取的可操作性较低。

因此结合颜色直方图,本研究选择将R、G、B 3个通道相互之间组合运算,使其直方图分布呈现明显的双峰型分布(图2),便于寻找阈值以有效地对叶脉进行分割和提取。

2.2叶脉分割

此时,虽然直方图双峰分布明显,但分布范围并不均匀,如果将其集中的灰度值均匀地分布开来,叶脉图像会变得更加清晰。因此,在阈值分割之前先对图像进行灰度调整,增强叶肉与叶脉的对比度,从而使图像的分割效果更为理想。

在阈值分割时,根据直方图中其波谷的位置选择阈值进行二值化处理,将叶肉的像素设置为0,叶脉的像素设置为1,从而使叶肉与叶脉形成鲜明的对比,如图3所示。此时得到的图像包含了叶脉与叶片轮廓,还需进一步处理,其流程图如图4所示。

对比多种结构元素之后,选择半径为2的圆盘形结构元素对叶片整体的二值化图像分别进行了膨胀和腐蚀,然后将二者相减得到叶片轮廓的边缘图像B。再将原叶脉分割图像A减去叶片轮廓图B后,便可得到只含有叶脉形态的图像C。此时图像中仍存在有许多孤立点有待去除或者连接,所以还需要对图像进行开闭等运算,以得到形态结构较为理想的叶脉图像D,如图5所示。

3结论与讨论

本研究提出的基于颜色特征的叶肉与叶脉分割算法,利用RGB颜色空间中R、G、B 3个颜色通道信息进行组合运算,对采集的叶片图像进行颜色特征分析和阈值分割,并与数学形态学处理相结合提取出叶脉图像[10-11]。结果表明,本研究所采用的图像处理方法能够有效地提取出叶脉的特征信息。叶脉在叶片生长过程中发挥着结构性支撑、抵御侵害、传输养分等功能,可以说决定着蔬菜叶片的一切。对叶脉特征提取和分析是研究植物生长柜内蔬菜栽培等农业应用的重要工作之一,为科学管理作物、实现植物生长柜智能化控制以及促进增产增收提供了技术支持。

参考文献:

[1]Blonder B,Violle C,Bentley L P,et al. Venation networks and the origin of the leaf economics spectrum[J]. Ecology Letters,2011,14(2):91-100.

[2]Sack L,Scoffoni C. Leaf venation:structure,function,development,evolution,ecology and applications in the past,present and future[J]. The New Phytologist,2013,198(4):983-1000.

[3]李乐,曾辉,郭大立. 叶脉网络功能性状及其生态学意义[J]. 植物生态学报,2013,37(7):691-698.

[4]韩殿元,黄心渊,付慧. 基于彩色通道相似性图像分割方法的植物叶面积计算[J]. 农业工程学报,2012,28(6):179-183.

[5]李灿灿,孙长辉,王静,等. 基于改进的Sobel算子和色调信息的叶脉提取方法[J]. 农业工程学报,2011,27(7):196-199.

[6]王晓峰,黄德双,杜吉祥,等. 叶片图像特征提取与识别技术的研究[J]. 计算机工程与应用,2006,42(3):190-193.

[7]王征. 一种基于数学形态学的边缘检测方法[J]. 计算机与数字工程,2012,40(2):102-104.

[8]王萍,唐江丰,王博,等. 基于数学形态学的植物叶片图像分割方法研究[J]. 浙江农业学报,2012,24(3):509-513.

[9]谭峰,高艳萍. 基于图像的植物叶面积无损测量方法研究[J]. 农业工程学报,2008,24(5):170-173.

[10]袁道军,刘安国,刘志雄,等. 利用计算机视觉技术进行作物生长监测的研究进展[J]. 农业网络信息,2007(2):21-25.

[11]金秋春,郑小东,童小利. 多方向Top-Hat变换在叶脉特征提取中的应用研究[J]. 计算机工程与应用,2011,47(4):195-197.刘艳,许建民,王永平,等. 可控温度与时间的植物病毒热钝化系统[J]. 江苏农业科学,2015,43(1):376-380.

特征提取模型 篇7

由于采集系统、存储介质、处理算法及传输设备的影响, 不可避免地会造成视频质量的下降, 如由压缩编码产生的块效应或模糊等失真和由网络传输中误码或丢帧引起的失真等。而视频的质量可以反映出相关系统的性能或传输信道的服务质量。比如, 在通信网络中, 可以根据视频质量评价的反馈信息调节编解码器或信道的参数, 保证系统的服务质量;在工程应用中, 视频质量评估有助于设计符合HVS特性的视频显示系统。因此, 视频质量评价系统对于现代多媒体技术来说不可或缺。

近年来, 出现了很多针对视频及图像的客观质量评价方法[1], 根据其原理主要分为三种: (1) 基于数理统计理论的评价方法:常见的有峰值信噪比PSNR (Peak Signal-to-Noise Ratio) 以及均方误差MSE (Mean Square Error) 等[2], 除此外, 一些学者也提出了其他一些数理统计的方法, 如求平均误差、结构内容、最大误差、加权距离等[3], 这类方法统计原始视频和失真视频在像素层上的绝对差值来评价视频质量, 物理意义清晰, 实现简单、快速, 但评测结果与人的主观感受偏离较大。此外, 仅评价空域的信息, 并不适合有运动序列的视频评价。 (2) 基于HVS特性的仿生理论方法:如Winkler提出一种视频感知失真测度PDM (Perceptual Distortion Metric) [4], 该算法首先对视频信号进行颜色空间转换, 然后进行感知分解, 包括带通和低通的时域滤波及Steerable塔形变换的空间分解, 并利用空-时对比度敏感度函数对每个通道进行加权, 最后经过一个对比增益控制CGC (Contrast Gain Control) 阶段来模拟掩模效应[5], 原始视频和参考视频经过以上同样处理后, 利用LP范数总和二者间的差信号得到最终的失真测量度。这类方法模仿人眼感知机制构建滤波器组, 分析和量化错误信号, 实现对画面的劣化感知和评测, 比如颜色感知、对比度敏感度、掩盖效应等, 然而由于人类对HVS系统的仿生认知十分有限, 造成很多难以解决的问题, 如超阈值、计算复杂度大等, 因此该方法并不具有较好的实用性。 (3) HVS特性的参数提取法:采用“自上而下”的机制, 根据人眼视觉特性, 设计出能代表画面质量的一个或单个特征参数, 用于实现视频质量评测。如边缘特征、纹理特征、模糊失真、块效应等。该类方法计算相对简单, 针对性强, 评价效果好。如Wang等人[6]提出了一种基于结构相似度SSIM (Structural Similarity Index Measure) 的视频质量评价方法, 该方法通过采样窗口分别计算每帧窗口内三个颜色通道的SSIM值, 再加权求和各通道值, 最后根据视频帧的运动信息给各帧赋权值, 从而得到最终的评价测度。第3类方法是视频质量评价技术的发展趋势, 有较好的应用前景和研究意义。

本文模型建立在第3类方法的基础上, 创新点包括:首先文中在提取特征信息时, 在多方面增加了色度的使用, 色度能反映图像的细节信息;其次由于视频各部分特征信息间并不是相互独立的, 利用四元数矩阵奇异值分解的方式, 能将提取的特征信息有机的结合起来, 实现各特征信息的整合;此外, 针对视频库中的多数视频存在块效应问题, 设计了一种帧的块效应加权方式, 进一步提高了实验结果的准确性。本文模型具体实现过程为:从空域和时域两个方面来提取特征参数作为模型的基础数据。空域方面, 根据生理学理论, 当人眼注视物体时, 一般会接收到轮廓和如色彩, 亮度等之类的表面特征, 生理学实验表明, 轮廓首先被人眼确认, 然后才是表面信息[7], 可知轮廓在人眼视觉系统中扮演着更重要的作用。因此, 本文算法将从轮廓和表面两个方面中提取视频特征, 同时侧重于轮廓信息的提取, 分别从亮度和色度提取轮廓信息。时域方面, 视频的时域信息包括场景中物体相对位置的改变以及表面信息如颜色, 亮度等发生的变化, 这些信息同样存在大量的失真, 如抖动, 运动补偿错误等, 而单纯将单帧统计结果合并的方法并不能有效的反应视频在时序上的失真问题, 所以本文算法增加了反映时域失真的帧间残差信息。此外, 考虑到目前常用的几种视频编码均采取分块方式, 如MPEGX和H.26X等, 视频库中的多数视频也存在严重的块效应问题, 因此模型中加入了块效应检测机制。

1 四元数矩阵及其奇异值分解

如引言中所述, 无论是空域信息, 还是时域信息, 各部分特征信息间并不是相互独立的, 而是有机的统一, 传统的方法通常采用加权求和来实现各特征信息的整合, 而很难解释加权系数的理论依据和物理意义;本文利用四元数矩阵奇异值分解理论, 将空域和时域信息的四个部分评价整合成一个整体, 通过整体求解奇异值来提取特征。通过奇异值分解, 可以快速的得到这个四元数矩阵的特征向量, 该特征向量具有很好的稳定性, 同时实验结果表明能反映视频的本质特性。

四元数矩阵中的每个元素都是由一个四元数组成, 四元数也称超复数, 由Hamilton于1843年首次提出[8]。一个四元数q由1个实部和3个虚部构成, 形如:

其中a、b、c和d为实数, 本文将用提取的空域和时域信息填充。i, j和k为虚数单位, 并遵循以下规则:

四元数矩阵可以做奇异值分解 (SVD) , 根据四元数矩阵奇异值分解的定义[9], 对于任意一个秩为r的四元数矩阵A∈HN×M, 必有两个四元数酉矩阵U, V, 使得:

式中, 符号表示共轭转置;U、V分别称为四元数矩阵A的左、右奇异值矩阵, U∈HN×N, V∈HM×M;∑r=diag (σ1, σ2, …, σr) , σi (1≤i≤r) 为实数, 即为A的奇异值。设x= (σ1, σ2, …, σr, 0, …, 0) T, x称为四元数矩阵A的奇异值特征向量。

2 基于HVS特征参数提取的视频质量评价四元数模型

由于当前多数的视频编码方案采用8×8分块方式, 因此本模型也将四元数矩阵建立在分块的基础之上, 即每个四元数矩阵都是一个8×8的矩阵, 通过奇异值分解, 每个小块将得到一个能表示该块特征的奇异值特征向量, 通过比较和分析参考视频和失真视频对应小块的特征向量差异, 得到小块的评价值;然后统计视频帧中每个小块的评价值构成帧的评价值, 同时在帧评价中加入了块效应检测机制;最后由帧评价值形成整个视频的评价结果。其算法流程如图1所示。由于视频帧不一定能割分成完整的8×8块, 同时帧的边缘信息不如中间信息重要, 因此根据8×8的倍数, 忽略视频帧上下左右四个部分的不能完整分割的边缘信息。

算法的求解分为四个步骤进行, 分别为四元数模型构建、块度量、帧度量以及视频整体度量。

2.1 四元数模型构建

模型从空域和时域信息中提取四个特征构成四元数矩阵, 其中空域信息构成四元数的三个虚部, 时域信息构成四元数的一个实部。根据分析, 识别物体是人眼视觉机制的首要目的, 而轮廓信息在识别物体方面扮演着更加重要的作用, 其次是表面信息, 如亮度和色度表示的纹理信息等。模型分别提取亮度轮廓和色度轮廓来作为四元数的两个虚部, 另一个虚部则取亮度来衡量视频的表面信息, 模型从色度和亮度两个方面反映视频的特征信息。另外, 用表示时域信息的帧间残差来构成四元数的一个实部。

(1) 轮廓特征提取

帧图像的质量在很大程度上取决于其轮廓和纹理信息, 研究者发现HVS对于边缘和边缘附近的失真比较敏感[10]。边缘检测的依据主要有两个[11]: (1) 帧图像中两个区域的亮度值有较大的变化; (2) 两个相邻区域之间存在比较明显的差异。目前绝大部分算法仅依据亮度来表达图像的边缘信息, 而在彩色帧图像中, 不同颜色的像素在帧图像中可能有相同或近似的亮度值, 所以, 本文模型同时考虑亮度边缘和色度边缘, 将二者分别作为四元数的两个部分, 来提取边缘轮廓的特征。

模型用梯度算法来计算边缘信息, 因为梯度是边缘检测最常见且简单有效的方法, 且能反映图像的细节反差和纹理变化。本文利用Prewitt算子来计算梯度, 如图2所示, 对于图像中的每一像素P (x, y) , 通过Prewitt算子计算它的“梯度信息向量”G{Gx (x, y) , Gy (x, y) }。其中, Gx (x, y) 和Gy (x, y) 分别由图2所示的垂直边缘算子V和水平边缘算子H得出。

我们定义像素点P (x, y) 的边缘能量为:

其中α为常数, 由于人眼对水平方向的边缘比较敏感, 我们可以通过α来增加水平边缘的重要性。将上述的边缘能量计算分别用点P (x, y) 处的亮度值和色度值代替, 可得到像素的亮度梯度能量Elumi (x, y) 和色度梯度能量Echro (x, y) , 将这两个部分分别作为四元数的两个虚部。

(2) 表面信息

由于人眼对于亮度的敏感性高于色度[12], 亮度层主要反映的是图像的纹理信息, 特别是纹理细节, 而两个色度层 (Cb和Cr) 对纹理的反映较弱, 其图像平坦区域较多, 从图3中可以直观地观察到这个特征。所以在四元数矩阵构建时单独采用亮度信息来作为四元数的其中一个虚部, 算法中将像素点P (x, y) 的亮度值定义为Y (x, y) 。

(3) 帧间残差信息

运动信息近年来已经成为视频质量评价方法必须考虑的因素, 一些文章中用块搜索[13]以及光流场方法[14]来反映运动的强度和方向, 但是增加了算法的计算量、复杂度。本文模型用帧间残差即两帧对应像素点间的差值来表示运动信息, 不仅简单有效, 而且能反映帧间的时间相关性。从图4中可以看出, 间隔为x帧的相邻两帧对应像素点间的差值能反映两帧间像素值的变化, 如在残差图像 (c) 中, 灰色代表0, 反映在该位置上两帧的像素值没有发生改变, 白色和黑色分别代表大于0和小于0, 反映了该位置上像素值的变化情况, 另一方面也能体现视频帧中物体的运动剧烈程度。

一些采用帧间残差的方法[15]都仅使用了亮度的差值, 由于帧间残差不但需要表示边缘特征的变化, 同时也需要反映表面信息的变化, 即帧间的整体差异, 因此在彩色视频中, 帧间色度变化也是一个重要方面, 仅用亮度差值并不能完整的反应其运动及结构变化。本文结合了亮度和色度的差值, 将它们之和作为帧间残差, 定义第T帧像素点P (x, y) 相对于其前第i帧的残差能量T (x, y) 为:

其中, α为常数, YT (x, y) 和CT (x, y) 分别为第T帧像素的亮度值和色度值, i为残差间隔。研究发现, 当残差间隔i取1时, 如果不是场景切换, 绝大部分残差能量都为0, 不能很好地反应时间相关性, 根据实验观察, 为了让残差能反映帧图像在时间序列上的变化程度, 通过实验观察设定残差间隔为3。

(4) 四元数构建

综上所述, 我们将视频的重要特征参数, 即轮廓信息、亮度信息和帧间残差信息, 用四元数的形式建模如下:

其中, α、β、γ和λ为常数, 在实验中保证各个特征参数值在数值大小上保持均衡, 避免不同的特征参数间因为值域的大小差异导致计算失衡。称S (x, y) 为四元数特征矩阵。

2.2 块度量

(1) 块特征值计算

视频帧的每个8×8块将构建一个四元数特征矩阵, 通过奇异值分解 (SVD) , 每个分块的四元数矩阵通过分解得到一个奇异值向量, 然后利用参考和失真块奇异值向量间的欧式距离Di来度量对应的块失真:

其中, sj和分别为原始视频帧和失真视频帧第i块的第j个奇异值, b=8为块的宽度。

(2) 块感兴趣加权

HVS研究表明, 当人眼观察一幅图像时, 只会对其中显著变化的区域发生兴趣, 而忽视那些亮度变化均匀的平滑区域。实验使用像素点亮度的标准差来表示块的变化程度, 标准差越大, 表示块变化越显著, 因此人眼更感兴趣, 其权值也越大;标准差越小, 表示块变化不明显, 则人眼感兴趣程度低, 其权值也越小。块的像素点亮度值标准差di定义为:

其中, m为图像块的大小, 本实验中m=64, xk表示块中第k个像素的亮度值。

此外, 由于光敏感细胞在视网膜的中央凹分布较密, 即人眼对图像中心部分的分辨率最强。因此实验根据块在失真帧中的空间位置不同, 赋予不同的权值, 越靠近中心位置的块拥有更大的权值。空间位置权值ri定义为:

其中, xi0, yi0表示块的中心位置。xc, yc表示原始图像帧的中心坐标, 表示块到图像帧中心的距离;r表示原始图像中所有点到中心坐标距离的最大值, 即像素点距离中心点的最大距离;Br为权值, 一般取0~0.5。

视觉注意力机制和眼球运动研究表明, 人通常只会关注图像的少数区域, 即使时间足够多, 注意力也不会明显转移, 我们用块的像素点亮度值标准差 (表示纹理变化程度) 和空间位置的不同来表示块的重要性[16]。将这两个因素定义为:

Wang在文献[17]中提出与区域能量加权具有相似理论依据的信息加权方法, 文中认为人类感知的信息是从经过有噪声的视觉通道的数理统计图像源中可以提取出的用字节数量化的信息。这种基于噪声通道的信息提取思想已被用在H.R.Sheikh提出的Visual Information Fidelity (VIF) [18]图像质量评价方法中。假设信息源能量为S, 噪声通道能量为C, 人类视觉可以提取的信息量就为:

现在假设原始视频和失真视频中第i个分块的信息源能量分别为oi, , 通道噪声能量是已知的参数C, 那么权重函数为:

定义第i个分块的加权度量值Qi如下:

2.3 帧度量

1) 帧值计算

整帧图像值的计算可采用以下公式:

其中, H和W分别为视频帧的高和宽, b=8为块的宽度, Qmid表示该帧中所有块加权度量值的中间值。

2) 帧的块效应加权

2008初, Symmetricom公司进行了一次有关视频质量的市场调查, 在各类失真视频中, 用户最关注的相关指标[19]包括:块效应15%;视频噪声11%;视频模糊9%;视频颜色问题6%, 因此, 块效应的检测对于视频质量来说非常必要。而本模型的测试数据库中, 多数视频也存在严重的块效应问题, 如图5所示。

本文采用的块效应检测算法, 过程如下:

(1) 如图6所示, 分别将参考视频和失真视频帧划分为8×8小块, 计算其水平和垂直的边缘差值分别为:

其中, H和W分别为视频帧的高和宽, xi和yi分别为小块相邻的像素值。

(2) 整帧图像的平滑度值为:

其中, wh+wv=1, 在本实验中, wh=wv=0.5。

(3) 定义参考视频帧和失真视频帧间的块效应检测权值为:

其中, Fs和分别为参考视频帧和失真视频帧的平滑度值, T为帧平滑度阈值, 当两帧间不存在块效应时, 也存在一定的像素值变化, 而设置平滑度阈值的目的是为了防止将两帧间正常的像素值变化误认为是块效应。

因此第f帧的帧度量值BVQAf定义如下:

2.4 视频整体度量

本文采用所有帧评价结果的加权平均值来表示视频的整体质量评价结果, 如下:

其中, F视频序列的帧数量。

3 实验结果及其分析

实验采用VQEG阶段I FR-TV视频测试库及其性能评价标准。图7列出了实验中所测试的评价模型散点图, 包括了阶段FR-TV测试库中全部625@50视频序列, 共160个。纵坐标代表DMOS, 横坐标表示模型的评价结果。图中每个点代表一个失真测试序列 (共160个) , 曲线为三次多项式回归曲线。

这些模型包括:BVQA_T、BVQA_Y、BVQA_E、BVQA_W1、BVQA_W2、BVQA。其中, 模型BVQA_T、BVQA_E、BVQA_Y、BVQA_YC在四元数的构建上不同, 四元数模型见式 (6) , BVQA_W1、BVQA_W2、BVQA在加权选择方面不同, 具体说明如下:

BVQA_T (a) , Elumi (x, y) 、Echro (x, y) 和Y (x, y) 设为0, 仅考虑帧间残差信息, 点的分布较散。

BVQA_Y (b) , Elumi (x, y) 、Echro (x, y) 和T (x, y) 设为0, 仅考虑亮度信息, 点的分布也较散。

BVQA_E (c) , T (x, y) 和Y (x, y) 设为0, 仅考虑轮廓信息, 从散点图上可看出, 效果比 (a) 和 (b) 好, 说明轮廓特征在视频质量评价中较重要, 同时也体现了轮廓信息在人眼视觉系统中的重要性。

BVQA_W1 (d) , wf_Smooth设为1, 仅考虑块感兴趣加权。

BVQA_W2 (e) , hi设为1, 仅考虑帧的块效应加权。

BVQA (f) , 综合考虑帧间残差信息、亮度信息、轮廓信息、块感兴趣加权以及帧的块效应加权。

与 (c) 相比较, (d) 、 (e) 和 (f) 中点的分布要更加集中, 收敛性较好, 说明本文的加权方法是有效的。

包括PSNR在内的十个模型的散点图可从VQEG的相关参考文献[20]中获得。

表1给出了客观模型的三种性能比较结果。表中P0-P9是VQEG测试的模型, 数据从文献[20]中获得。本文实验的模型的非线性回归采用三次多项式回归, 而VQEG对于P0-P9使用logistic曲线回归, 二者都是VQEG认可的回归方式。可以从表1中清楚发现, 本文提出的视频质量评价模型基本达到P0-P9中的中上水平, 即使仅采用四元数中的部分元素也有不错的效果。从实验测试结果来看, 仅采用轮廓信息的模型BVQA_E比仅采用亮度信息的模型BVQA_Y测试效果好;而采用块感知加权的模型BVQA_W1和帧块效应加权的模型BVQA_W2则明显提高了评价性能。

4 结语

特征提取模型 篇8

小电流接地方式下的配电网发生单相接地故障时,其故障电流的微弱性以及故障电弧的不稳定性和故障形式的多变性,都给故障选线带来了困难,本文通过对电力电缆运行故障模型进行建立以及对其故障特征量进行提取,并进行了归一化处理,构成了一个比较完备的用于验证选线方法的数据库。

1 基于ATP的系统仿真分析及仿真模型的建立

1.1 仿真模型建立及模型参数设置

1.1.1 采样频率的选择

信号采样频率的选取会对采集数据造成一定影响。如果采样频率过高,采集到的数据的相关程度就会增加,故障数据的特征就不是很明显,不利于辨识;而采样频率过低,采集到的数据就很少,这就可能丢失必要的信息,很容易造成故障线路的漏选。

图1为系统的仿真模型示意图,分别提取图1中各线路故障后的暂态分量,进行频谱分析,计算其幅频和相频特性。首先通过各条线路零序电流的频谱分析得到暂态信号的主谐振频率(定义暂态信号中幅值较大、能量较高的信号对应的频率为主谐振频率),进而选取适合本课题使用的采样频率。

1.1.2 仿真模型的搭建及参数设置

本文以某110k V变电站10k V母线的辐射型配电网络为模型搭建仿真平台,其仿真模型示意图如右图1所示。该系统共有6条出线,线路长度分别为5km,10km,12km,15km,20km,30km。变压器低压侧中性点通过开关K与消弧线圈接地,中性点不接地系统和经消弧线圈接地系统分别通过开关K的开合状态来表示,具体参数的设置见表1。

根据以上参数,利用EMTP/ATP仿真软件建立小电流接地系统的仿真模型如图2所示。

2 模型仿真结果及分析

2.1 谐振接地系统,正常运行时,母线端三相电压、电流波形如图3所示。

2.2谐振接地系统,发生金属性接地故障:以在t=0.05s时刻,线路L6在距离母线15km处发生金属性接地故障为例,仿真得到故障线路首端的三相电压及零序电压、零序电流波形如图4所示。

根据图3所示,得出以下结论:

(1)发生单相接地故障后,暂态电流幅值远大于稳态电流幅值;

(2)暂态过程结束后,故障相电压几乎变为零,而非故障相电压升高为线电压;系统中出现零序电压,当暂态过程结束后,其值为电网正常运行时的相电压。

3结束语

通过EMTP/ATP搭建的单母线6条馈线的110k V变电站仿真模型进行仿真试验,仿真试验了小电流接地系统在接地方式、故障初始相角、过渡电阻不同的故障模式下发生故障,同时提取了在不同工况下发生故障时的零序电流和零序电压。

参考文献

[1]罗建民,何正文.电力系统实时仿真技术研究综述[J].供用电,2006,23(5):13-16.[1]罗建民,何正文.电力系统实时仿真技术研究综述[J].供用电,2006,23(5):13-16.

[2]ATP-EMTP Rule Book[Z].Canadian-American EMTP Users Group,Portland,1997.[2]ATP-EMTP Rule Book[Z].Canadian-American EMTP Users Group,Portland,1997.

点特征提取算法探讨 篇9

1 Moravec兴趣算子

Moravec于1977年提出利用灰度方差提取点特征的算子。Moravec算子是在四个主要方向上, 选择具有最大-最小灰度方差的点作为特征点。

第一步, 计算各像元的兴趣值IV (in terestv alue) 。

第二步, 给定一经验阈值, 将兴趣值大于该阈值的点 (即兴趣值计算窗口的中心点) 作为候选点。阈值的选择应以候选点中包括所需要的特征点, 又不含过多的非特征点为原则。

第三步, 选取候选点中的极值点作为特征点。

除了以上方法, 还可以尝试首先利用边缘提取方法提取整个图象的边缘轮廓, 然后在此轮廓内利用以上特征点提取方法提取特征点。

2 Forstner兴趣算子

Forstner算子是从影像中提取点 (角点、圆点等) 特征的一种较为有效的算子。Forstner算子通过计算各像素的Robert梯度和以像素 (c, r) 为中心的一个窗口的灰度协方差矩阵, 在影像中寻找具有尽可能小而且接近圆的点作为特征点, 它通过计算各影像点的兴趣值并采用抑制局部极小点的方法提取特征点。

第一步:计算各像素的Robert梯度。

第二步:计算l×l窗口中灰度的协方差矩阵。

第三步:计算兴趣值q与w。

第四步:确定待选点。

第五步:选取极值点。

3 Moravec程序框图 (如图1)

4 基于Moravec算子的点特征提取效果图

灰度图像效果图如下:

可以看出特征算子对一些反差加大的地物边缘提取的效果较好, 而反差较小的边缘提取效果较差, 这是由阈值窗口大小的选取和算法本身所决定的。

5 结语

Moravec算子是点特征提取算子中的经典算子之一, 后来的很多点特征提取算子都是在它的基础上改进得来的, 掌握Moravec算子的原理和实现方法对理解其他的点特征算子的理解和应用有很大好处。

参考文献

[1]张祖勋, 张剑清.数字摄影测量学[M].武汉:武汉大学出版社, 2002.

直扩信号特征提取技术 篇10

直接序列扩频(DSSS)信号被认为是一种低截获概率信号(LPI),由于具有低功率谱密度发射的隐蔽性、伪随机编码的保密性以及信号相关处理的抗干扰性等良好的性能,被广泛应用于航天测控、导航等多个领域。因此对直扩信号检测和截获技术的研究已成为一个刻不容缓的研究方向,而对于未知扩频码的情况下直扩信号的检测和截获技术一直是一个难题。

从直扩系统的基本原理和信号特征入手,详细分析了信号的相关性、循环平稳特性、频域正交性和准周期性等。根据特征提取的原理分析归纳出其可检测性和可识别性特征,选择出那些能够集中表征DSSS信号波形和频域显著个体特征的参数,研究了噪声对信号特征参数的影响。在此基础上应用时域相关、循环谱、倒谱和高阶累积量等现代数字信号处理技术实现了对DSSS信号特征参数的提取。分析总结了在低信噪比下直扩信号的特征提取方法,并比较了各种方法的优缺点。

1 直扩信号特征提取方法

1.1 时域相关检测法

由于信号和噪声在时域相关域有明显的特征差异,所以可以在相关域完成信号特征的提取。自相关检测是将信号与自身延迟一个时延后的信号做相关处理,或用双通道接收机的输出进行相关,得到扩频信号的自相关函数。一般来说,相关域检测能在一定程度上降低对背景噪声变化的敏感程度,甚至在多频单音干扰下也有良好的稳健性。

接收信号r(t)=s(t)+n(t)的自相关函数为:

Rr(τ)=E{r(t)r(t+τ)}=

E{[s(t)+n(t)]·[s(t+τ)+n(t+τ)]}=

Rss(τ)+Rsn(τ)+Rns(τ)+Rnn(τ)。 (1)

τnNTpn时,由直接序列扩频信号的自相关特性可知,Rss(τ)值很小,即不会出现明显的相关峰;当τ=nNTpn时,Rss(τ)出现明显的相关峰;而噪声在τ≠0时,Rnn(τ)≈0。因而,通过检测输出自相关函数的峰值可检测到扩频信号的存在,检测相邻相关峰之间的时间间隔可以实现对直接序列扩频信号码周期的估计。

1.2 循环谱检测法

循环谱在信号特征提取方面的突出优点是谱分辨能力强,即使在频率轴上的功率谱是连续的,信号特征也以循环谱的形式离散的分布在周期频率轴上,而且,不同调制方式的信号其周期谱分布也不

同。这样,即使信号在时域或频谱域中混叠在一起的特征可能会在循环谱中显现出来,从而更充分的提取信号特征。直扩信号循环谱如图1所示。

由图1可见,直扩信号的循环谱在循环频率α为零和不为零时均有峰值出现,其在循环频率α不为零时出现的非零值,是直扩信号检测和参数估计的依据。要得到信号的循环谱需要大量的运算量,计算结果的数据量也很大。为了尽可能集中地反映信号的特征,缩小选取的数据量,选取DSSS信号循环谱f=0循环频率切面观察发现:其切面集中反应了信号的载频和伪码速率信息。所以,利用谱相关函数可提取调制信号的特征参数;另外,循环谱为谱分析提供了更加丰富的信号分析域,将通常的功率谱定义域从频率轴推广到频率—周期频率双频平面,更明显地表现出了信号的特征。

1.3 倒谱检测法

由于DSSS信号中伪随机序列的周期重复,使信号的频谱具有了准周期性,而噪声则没有准周期性,因此通过提取信号频域的准周期性可以检测到信号的存在,并估计其参数。

倒谱是一种同态信号处理技术,利用信号中某些分量在频率域上的准周期性,对信号的对数功率谱再求功率谱,在伪时域或倒频率域上将这种周期性显现出来,用来分离和提取密集泛频信号中的周期成分。倒谱是从时域到频域、频域到频域、频域到伪时域的3次映射。即

C(τ)=|FFΤ(ln|FFΤ{s(t)}|2)|2。 (2)

倒谱的对数变换可将乘性噪声变为加性噪声,有助于消除乘性干扰。该技术充分利用信号频域上的准周期特性,检测淹没在噪声之中的信号分量,实现信号的检测和参数估计。直扩信号倒谱如图2所示。

DSSS信号的表达式代入上式,即对直扩信号频谱求对数功率谱得到DSSS信号的倒谱为:

C(τ)=|FΤ(ln|FΤ{s(t)}|2)|2=|FΤ(a+bGs(w)+cGs2(w)+dGs3(w)+)|2=|a2πδ(τ)+b2πRs(-τ)+c2πRs(-τ)+|2(3)

式(3)第1项为信号的直流分量,以后各项为信号的自相关函数及多个自相关函数的卷积,由于在第2次傅里叶变换之后取模的平方所以丢失了相位信息,相关结果在其伪码周期的整数倍处出现峰值,而在其他位置相关值较小,因此,倒谱的处理结果中峰值也是出现在伪码周期的整数倍处,通过检测峰值有无判断信号的存在,通过计算峰值间隔可以估计出伪码周期大小。

1.4 高阶累计量检测法

直扩信号的4阶统计量包含扩频码周期和载频信息,而且理论上可以完全抑制任何形式的高斯噪声,因此可以解决二阶统计量不能解决的问题。加噪信号的4阶累积量为:

c4x(τ1,τ2,τ3)=12Ρ2E[c(t)c(t+τ1)c(t+τ2)c(t+τ3)][cos2πf0(τ2+τ3-τ1)+cos2πf0(τ1+τ2-τ3)+cos2πf0(τ1+τ3-τ2)]-Ρ2Rc(τ1)cos(2πf0τ1)Rc(τ2-τ3)cos(2πf0(τ2-τ3))-Ρ2Rc(τ2)cos(2πf0τ2)Rc(τ3-τ1)cos(2πf0(τ3-τ1))-Ρ2Rc(τ3)cos(2πf0τ3)Rc(τ1-τ2)cos(2πf0(τ1-τ2))(4)

由式(4)可以看出利用接收信号的4阶累积量可以检测到直扩信号的周期信息;理论上可以完全抑制高斯噪声(包括有色和白色),所以有更好的检测性能。由于4阶累积量的计算量很大,为了实现工程应用,取其切片。

c4x(0,τ,τ)=12Ρ2[cos4πf0τ]-Ρ2Rc2(τ)(1+cos4πf0τ)(5)

c4x(0,0,τ)=c4x(τ,τ,τ)=-32Ρ2Rc(τ)cos(2πf0τ)(6)

由式(5)和式(6)可以看出,接收信号的4阶累积量切片均包含扩频码周期自相关信息,并且在理论上都可以完全抑制高斯噪声,因此检测和参数估计性能较好。直扩信号4阶累积量切片如图3所示。

2 仿真验证

仿真假设条件如下:① 待检测信号为DSSS/BPSK扩频信号;② 扩频码采用小m序列,扩频码长为1 023。

各种检测方法的性能如表1所示。由以上分析表明,运用时域相关检测法算法简单、检测时间最短,但是其检测性能较差,在带内信噪比为-8 dB时检测概率大于90%;循环谱检测法性能比时域相关检测略好;倒谱检测法在带内信噪比-14 dB时检测概率91%,计算复杂度居中;高阶累积量检测法在带内信噪比-15 dB时检测概率接近90%,但是由于高阶累积量计算的复杂性使得其检测时间较长。

3 结束语

从理论分析还可得出直扩信号的检测不仅和信噪比有关,而且有赖于伪码长度和检测数据长度等因素,在伪码长度不可控的情况下,增加检测的数据长度,能够改善各种方法的检测性能。由于直扩信号的隐蔽性,导致难以检测到长码扩频信号,如何在扩频码很长,接收信号不足一个伪码周期情况下侦察信号是未来直扩信号检测和特征分析的难点和重点。

参考文献

[1]张天骐,周正中,邝育军,等.低信噪比长伪码直扩信号伪码周期的估计方法[J].系统工程与电子技术,2007,29(1):12-16.

[2]钟志,赵雅琴,杨刚,等.一种简单的长码周期估计方法[J].湖南科技大学学报,2006,21(4):75-78.

[3]资晓军,谢丹,易克初.基于四阶累积量的二次谱法检测DSSS伪码周期[J].电子信息对抗技术,2006,21(1):18-21.

特征提取模型 篇11

关键词:ArcGIS环境;DEM;流域特征

DEM是一种涵盖大量地理信息的实体地面模型,应用广泛。而ArcGIS水文分析模块能够对地形模型进行可视化,提取和分析地形及河流网系是ArcGIS水文分析模块的主要作用,这一强大分析流域特征的功能对DEM处理来说是非常必要的条件。以下笔者就对ArcGIS环境下基于DEM的流域特征提取进行简单阐述。

一、DEM的构建方式

按照区域里全部的高程点数据把多项函数和傅立叶级数拟合成地面高程曲面,换句话说就是应用规则的数学曲面模拟合成不规则的实际地面,接着把这个拟合分成面积差不多相同的不规则区域或者分成正方形规则区域来做分块搜索,按照有限个点来做拟合,让详细的高程曲面得到形成,这便是DEM构建的数学过程。其规则网格模型、不规则三角网模型、等高线模型以及层次模型等都是DEM构建的主要模型。

二、ArcGIS环境下DEM的流域特征提取

(1)水系特征的提取。这种提取方法是在Marks和O’Callaghan提供的坡面径流模拟方法基础之上再应用ArcGIS环境下DEM的水系特征来进行提取。这种方法的应用原理是首先通过网格单元计算出汇水面积,接着把汇水面积临界值的设定进行河网的判定。此方法相当于地表径流的路径判断,这是通过了水文学中汇流概念的使用,并且在这个过程中流路会不断得到生成,所以水系提取过程中的这种方法是比较优等的选择。另外Hydrology菜单中集成了ArcGIS水系特征提取的所有相关命令,相应的函数在使用时能够直接随意调用,尤为方便。

(2)地形特征的提取。脊点、鞍点、谷点、山顶点、凹陷点以及平地点等都是地形特征的主要包括部分。DEM提取地形特征点的利用能够根据一个三乘三或者更大的栅格窗口,经过中心网格和八个相邻网格的高程关系获取准确判断后的信息[1]。

三、流域特征提取的过程

1.洼地的填充处理

在填充洼地前需要计算洼地的深度,对此进行确定洼地是由于采样误差造成的还是真实地标反映,然后可以准确地设置临界值来进行洼地的填充。

每个网格进行扫描时,让这个网格和相邻的其他八个网格的高程进行比较,若相邻八个网格的高程都比中心网格的高程高时,那么中心网格的值就被高程最低的八个相邻网格中其中那个网格的值给赋予。

ArcGIS环境下洼地填充的步骤分别是:点击Hydrology工具箱中FILL,通过使用可以ZLin it的选项来进行确定需要被填充的洼地临界值。

2.水流方向计算过程

水流方向是对于每个网格在水流离开此网格时的指向。流向确定的算法分为多流向算法和单流向算法,单流向算法的水流只从一个网格中流向另一个方向的网格,再按照网格高程对水流方向做出判断,这个算法因为尤其方便简单所以受到了广泛应用。单流向算法中的D8算法是当前最为广泛应用的算法,在D8算法过程中,每一个网格对于水流的方向都会简化正东南西北以及东南、西北、东北、西南这八个方向,并且会用代码表示,其代码分别为1,2,4,8,16,32,64,128进行八个方面的表示。

没有洼地的DEM上都是独一无二的网格水流方向,水流方向编码只取这个网格中8个数字其中的一个。确定水流的流向是利用计算中心网格和邻域网格中最大距离权差距进行判断的。邻域网格和中心网格的高程差除以两个网格之间的距离就是距离权差距,网格之间的距离跟方向是有着密切关联的,若中心网格的方向值在邻域网格中是四个平行于坐标轴的四个方向,如:1,4,16,64……那么规定两个网格之间的距离就是1,另外的方向差距就为根号2,以下是具体的计算步骤:

(1)开启ArcToolbox,(在ArcMap中找到ArcToolbox图标,单击左键即可进入启动。)

(2)进入水文分析模块,在ArcToolbox中找到Analysis Tools工具箱并展开,再把Hydrology工具集打开;

(3)进入F low Direction工具,把计算水流方向对话框打开。

3.计算汇集积累量

汇流积累量在地表径流模拟的过程中是在水流方向数据计算上所得。汇流积累量的大小对于每一个网格来说,都代表其上游有多少网格那么网格的水流方向终究汇流经过此网格,数值越大的汇流积累量,此地区就越容易让地表径流得以形成。汇流累积量越大的网格,汇流能力也会越大;相反,没有汇流累积量的区域也许是流域的分水岭。

4.设置对汇流的临界值

在汇流累積图中,注入网格的所有单位水量的数量都是每一个网格的汇流累积量,某一给定的临界值被网格的汇流量超过时,就可以认为水道上被该网格占据,河系网络提供的重要参数是汇流临界值,也是河道认准的可入范围。汇流的临界值可以通过Hydrology中定义河系的命令进行设置。最开始进行分析的时候,可以从小到大的选择几个临界值,因此便于河系大致范围最可能的观察[2]。

5.提取河流网络

以汇流临界值的设定为标准,通过汇流累积栅格图层被流径处理命令以后提取的河系栅格图层的利用,所有累积量无论大小,其汇流临界值的栅格都可以被定义成河道。

在ArcGIS环境下提取河流网络的步骤:分别把“Input Stream Raster”和“Input F low Direction R aster”当作 F low Direction生成数据和 Single Output Map Algebra生成的栅格数据的输入,矢量化之后的河网文件当作输出文件。

结束语:

本文基于DEM的原理,利用Hydrology工具包对流域特征进行了河网提取实验,表述了如何提取河网的普遍过程,基于时间和经验有限,还有待完善指正。

参考文献:

[1]赵健,贾忠华,罗纨.ARCGIS环境下基于DEM的流域特征提取[J].水资源与水工程学报,2011,17(1):11-20.

[2]王玉富,王翰钊.ArcGIS环境下基于DEM的流域特征提取[J].湖北民族学院学报(自然科学版),2010,28(4):10-14.

语音信号特征参数的提取 篇12

1.1 汉语的音素、音节和音调

我们发现依据人类声音产生的机制, 由于激励方式的不同会形成清音和浊音两种不同的语音。由这两种语音又可以组合成两种不一样音素:元音及辅音。构成语音的最小单位是音素。元音由不相同的口腔形状发声而形成, 辅音的形成由发声的部位以及发声的方法决定。

音节是构成汉语的最小单位。我们所说的音节指的是一个元音加上一或两个辅音所构成的音素的组合。汉语当中包括以下4种音节, 即:元音、元音+辅音、辅音+元音, 辅音+元音+鼻音。一般汉语可以简单划分为声母+韵母两个部分。音节前部分的辅音称之为声母, 元音和元音后面有时候出现的鼻音称之为韵母。汉语可认为是一种声调语言, 根据声调的不同所表达的意思很可能完全不一样, 汉语共有阴平、阳平、上声及去声四种声调。而声调的变化可以看成浊音周期的变化。声调曲线从韵母起始点至韵母的终止点。

1.2 语音信号的数学模型

语音的产生是因为声道激励发生共振, 因为发声过程中声道是振动的, 所以能够用一个时变线性系统来描述。可以用如图1所示描述语音生成模型。

由图1可知一个完整的语音信号模型由激励模型、声道模型、及辐射模型三个子模型串联而成。激励模型由浊音激励与清音激励组成。对清音部分来说, 激励信号等同于白噪声, 而对于浊音部分来说, 因为声带在不断地张开与闭合, 所以会有间隙性的脉冲波产生。共振峰模型是当前广泛使用的一种声道模型。声道的终端是人类口与唇, 速度波通过声道输出, 然而语音信号是一种声压波。

2 语音信号的前端处理

为了得到我们所需要的信号, 须先对模拟语音信号进行数字化, 接着进行预处理与加窗。

2.1 语音信号的数字化

为将模拟语音信号转变为数字信号, 先对信号进行采样与量化。在采样与量化之前, 须进行语音信号的预滤波, 其目的在于:第一, 滤除高频噪声;第二, 防止50Hz的工频干扰。

2.2 语音信号的预处理与加窗

因为语音信号的平均功率受到鼻辐射以及声门激励的很大影响, 因此在语音信号频谱的求取时, 随着频率的增高相应的响应成分越小, 也就是说高频部分频谱比起低频部分来不够精确, 为此我们需要对信号进行预加重。为了平滑频域信号, 使得信号处理的后面阶段对有限长响应不那么敏感, 通常情况下让数字语音信号通过一个低阶的系统。目前广泛使用的是固定的一阶数字滤波器, 即

式中a为预加重系数, 通常取值0.95左右。

因为语音信号的特性是随时间变化的, 而非平稳过程, 但由于人的发音器官的肌肉运动速度比较慢, 因此可以认为语音信号是个局部的短时平稳的信号。因此, 我们对对语音信号进行分帧加窗的处理。通常情况下语音信号帧长取为10ms~30ms, 每秒帧数约为33~100, 分帧可以是连续的, 有可以是交叠分段的, 在语音信号的分析当中常用“短时分析”来表述。我们一般采用窗函数来乘语音信号, 常用的窗函数是Hamming窗。

Hamming窗函数是:

2.3 语音信号的端点检测

端点检测指的是找出语音信号中的各段落的起始点以及终止点的位置。语音信号的时域处理方法包括:短时平均幅度、短时能量、短时过零率以及短时自相关。端点检测一般要用到语音信号的短时能量以及短时平均过零率两中参数。

用En来表示第m帧的短时能量, 其计算式如下:

短时平均幅度Mn的计算式如下:1N-

短时能量En的最主要作用是:区分清音与浊音、区分声母与韵母的分界、无声与有声的分界、连字的分界以及能够用于进行语音识别。

“过零率”指的是在单位时间内信号通过零的次数。短时过零率z (m) 是用来描述频谱的简单有效的方法之一, 计算公式如下:

在短时处理技术中, 描述一个随机信号的其中一个重要特征是自相关函数Rn, 可以用自相关函数区分清音与浊音, 计算公式如下:

短时频域处理作为语音信号处理的基本方法之一。短时频域处理适合缓慢变化的语音信号。第m帧的短时傅立叶变换计算式如下:

3 语音特征参数提取

在完成语音信号的预加重、分帧、及端点检测之后, 下一步关键的是提取特征参数。我们不可能直接识别原始波形, 语音信号需要经过变换, 提取出其特征参数后再进行识别, 特征参数需要满足:反映语音的本质、参数个分量之间耦合尽量小、参数的提取方便等几方面的要求。目前语音识别中线性预测倒普参数LPCC、美尔倒普参数MFCC使两种较为常用的参数。LPCC利用线性预测编码技术求取倒普参数。MFCC则构造人的听觉模型, 以语音信号经过该模型的输出值作为声学特征, 直接利用离散傅里叶变换得到。

3.1 线性预测倒普参数LPCC的提取

线性预测分析是语音特征分析方法之一, 能够有效的解决短时语音信号的模型化问题。LPCC的基本原理:语音信号的每个样值可以通过过去的若干个值的线性组合逼近求得, 也能够用实际语音信号的抽样与线性预测的均方差值最小的方式, 求出一组预测值。

其中a为加权系数, p为线性预测倒普参数的预测阶数。

LPCC系数表示的是语音信号频谱极值点的变化, 用该系数来表征语音信号, 能够获得比较平滑的语音频谱图。

3.2 美尔倒普参数MFCC的提取

MFCC参数与LPCC参数不同, 它考虑了人耳的听觉特性, 先将频谱转变为美尔频标的非线性频谱, 接着再转换到倒普域上。因为MFCC比较地充分考觉特性, 所以MFCC参数有很好的识别性能与抗噪能力。由测试可得, MFCC参数性能在汉语语音识别中要明显优于LPCC参数, 由于人类在对1 000Hz频率以上的声音的感知能力并不遵循通常的线性关系, 它遵循的是对数频率坐标上的线性关系。

首先, 语音信号在经过预处理、分帧加窗后转变为短时信号, 经过FFT变换将x (n) 转化为X (m) , 并计算出其短时能量谱P (f) 。在将P (f) 在频率轴上的频谱转化为在美尔坐标上的P (M) 。接着在美尔频域内将在美尔坐标上加入三角带通滤波器得到滤波器组Hm (K) , 再计算美尔坐标上的能量谱P (M) 通过该滤波器组的输出值。最后在美尔刻度谱上能够采取修改的离散余弦反变换来求取美尔倒普参数:

式中, p为MFCC阶数。

4 结论

本文主要介绍了语音学的基础知识、语音信号的数字化及其特征提取, 为语音模型的训练做了很好的铺垫。在计算机普及的今天能够让计算机识别出人的自然语言是人们一直努力的一个方向, 对计算机直接用语言信息发号施令, 我们的双手才能真正得到解放。

参考文献

[1]胡航.语音信号处理.2版.哈尔滨:哈尔滨工业大学出版社, 2002:256.

[2]刘幺和, 宋庭新.语音识别与控制应用技术.北京:科学出版社, 2008:201.

[3]易克初.语音信号处理.北京:国防工业出版社, 2000, 14:363.

[4]李波, 王成友, 杨聪, 等.基于语音频谱包络抽取的MFCC算法.长沙:国防科技大学学报, 2004.

上一篇:趣味字谜识字法论文下一篇:审计治理结构