基于内容的图片检索

2024-12-02

基于内容的图片检索(精选7篇)

基于内容的图片检索 篇1

摘要:现在的时代是互联网的时代, 随着网络资源的日益丰富, WEB上的图片资源也越来越丰富, 图片内容也越来越精彩, 吸引了大量网民对于图片的检索。图片检索技术中最常用的方法是基于文本的图片检索, 是人们检索图片的主要手段, 而基于文本的图片检索技术最核心的技术是图片相关文本的提取, 图片相关文本提取技术会给图片检索的查全率和查准率带来最直接的影响。如何提高图片的检索率, 是当代互联网基于文本的图片检索技术亟待解决的问题。

关键词:互联网,基于文本的图片检索,相关文本,提取文本

现代科学技术的迅速发展给互联网技术与多媒体技术的发展不断带来新的机遇与挑战, 而图片作为承载重要信息的工具, 其数据规模也在不断壮大。但是面对海量的图片, 我们所常用的检索WEB图片的技术和方法还未得到完善, 图片检索的过程经常会遇到各种问题。这是因为基于文本的图片检索技术未充分考虑到WEB的复杂程度以及影响词条权重的种种因素, 通常只对词条进行组织索引, 并使用固定的模式来提取图片中的文本信息, 导致检索结果以偏概全, 提取效果不尽人意。因此, 应对不同布局的图片要采用不同模式的基于文本的图片检索 (包括图片相关文本的提取) 技术, 充分利用图片名信息, 提高WEB图片的检索率。

1 相关技术

WEB图片检索中提取图片信息的技术主要有基于内容的提取和基于文本的提取两种形式。基于内容的提取技术是通过分析图片本身的像素来提取图片表征的一些特性, 并对图片的这些特性建立相应的索引。如此一来, 用户在检索时, 基于内容的提取技术通过比较检索示例图片的相似度特征来衡量各种图片之间的相似性, 并从中挑选匹配度最高的图片返回给检索的用户。基于文本的信息提取技术则以与图片相关的文字信息为检索重点, 并对这些文本信息建立索引, 在获得用户提供的文本信息后, 利用传统的检索文本信息的技术进行组织和查询, 以提供所要检索的图片。

基于内容的检索技术借鉴文本检索技术, 对带检索的图片通常进行预处理工作, 将图片中的可视化信息包括图片的颜色、纹理和形状等提取出来并建立索引, 利用相关的匹配算法查找图片。基于内容的检索技术最大的特点是它可对图片本身包含的信息进行分析, 而不必费心分析图片来源, 这样就可扩大用于检索图片的领域。

基于文本的检索技术则通过分析互联网上的网络资源, 利用HTML文档工具以获取所要检索图片的相关文本信息。利用启发式规则通过分析HTML中的标记来获取所要检索的图片与文字等, 在对抽象的语义和概念的查询方面有很大的优势, 能够有效提高系统的查准率和查全率, 本文将重点讨论基于文本的检索技术。

2 基于文本的图片检索技术

基于文本的图片检索技术要完成的第一个工作就是确定能够描述图片所要表达意思的相关文本, 当然, 人工确定文本有较高的查准率和查全率, 但是面对每天增加的上百万的海量图片, 人工确定文本显然是不实际的。实际的工作情况是:提取图片所在的HTML文档的文本信息作为相关文本。这就要求网页开发人员仔细分析HTML源文件, 在描述图片区域的语言中寻找有关图片的“相关”信息。

2.1 相关文本的定义

图片的相关文本在图片检索过程中为图片进行“代理”工作, 它是与图片所含意义相关的所有文本信息 (包括文件名、图片URL、周围文本、标签文本、网页标题以及栏目名等) 的组合。

2.2 词条的权重

可反映图片内容的各种相关文本的信息的侧重点都有所不同, 一般来说, 图片锚文字要比HTML页面标题的重要性大得多。因此, 基于文本的图片检索技术要建立新颖的权重模式来衡量各种词条的重要性, 以便使图片检索工作更加快捷、准确。

2.3 为图片建立索引

为了方便检索图片, 通常会为每个图片的所有相关文本 (用集合{Li}表示) 建立一组“属性”, 即O1···Ok, 要做到每个相关文本都相应地有一组包含足够信息的属性值来唯一表示本对象Li。这些属性值就是我们所说的索引向量, 为海量图片资源的相关文本寻找属性值的过程便是为图片建立索引的过程。图片的文本索引要尽量做到能够全面并真实地反映图片相关信息, 支持海量图片信息的查询工作, 建立索引是基于文本的图片检索技术的核心。

2.4 为图片嵌入相关的HTML标记

网页开发的语言多种多样, 而HTML语言则是最常用的, 一般都会采用HTML语言生成最后的可供浏览的网页。因此, 如何准确地为图片嵌入相关的HTML标记具有十分重要的意义。与图片相关的常用的HTML标记大约有5种。分别为字符属性标记……, 网页标题标记

, 网页之间或网页与多媒体之间的导航标记……, 图片嵌入标记, 以及定义表格标记

……

3 HTML信息的提取方法

HTML信息的提取方法有三种, 包括基于DOM的提取方法、基于字符串的提取方法以及基于Wrapper的提取方法。其中第一种方法中的DOM是用来对网页文档进行解析和操作的一种对象模型, 现在主要应用于XML文档的处理工作中, 早起则为处理HTML文档服务, 它在HTML文档的组织结构以及各个标记之间的关系的了解方面具有更强的优势, 能够更方便地利用结构信息来提取文本信息, 但是这个过程需要耗费大量时间, 效率不高。第二种方法把HTML文档当做顺序字符串, 检索过程要遍历整个文档, 用字符串匹配方法来获取信息。这种方法效率较高, 但是不能准确提取一些依赖于结构的信息。基于Wrapper的提取方法可以帮助用户准确得到结构类型网页中图片的相关文本信息, 提高了处理能力以及系统检索效率。

从HTML页面信息中提取图片相关文本可包括以下几个内容:提取图片的URL、提取图片的文件名 (可从URL中获取) 、提取图片所在网页的URL、提取图片所在网页的标题和图片链接网页的标题、提取图片超链接URL、提取图片所在网页的栏目名以及提取图片标签等。

4 从图片周围文本中提取图片的相关文本

从分布在图片周围 (上下左右) 并与图片内容含义相关联的文本中也可提取图片的相关文本, 一般图片周围的文本是设计人员对图片所添加的说明。

5 提取图片相关文本的启发式方法

WEB图片一般分为装饰页面的图片和无装饰性的图片两类, 在检索前要排除装饰性的图片, 并根据图片以及周围文本复杂的布局情况按照规则模式、图片组模式、视距距离、语法距离以及短文本优先等准则对图片的相关文本进行提取, 每种准则对应不同的“图片—文本”布局:规则模式准则主要应用于图片与周围文本位于表格中的布局模式;而图片组准则适用于一个说明文本对应多个图片的布局模式;视觉距离准则则要求计算视距距离, 把文本信息赋予多个图片之中视距距离最近的图片;语法距离准则应用的前提是两图片视距距离相等, 这时要把文本信息赋予给语法距离最小的图片;在视距距离和语法距离都相等的情况下则要应用短文本优先准则, 短文本的长度不到长文本的1/X时淘汰长文本, 否则将两文本合并并赋予图片。

6 结语

随着计算机网络的迅速发展, 互联网技术得到全球性范围的普及, 有力地推动了信息检索技术的发展。基于文本的图片检索技术要借鉴发展成熟的文本检索技术, 致力于解决图片内容与文本信息相关度不高的问题, 以更省力、有效的方法来提高图片检索的质量, 将基于文本的图片检索技术的检索效果提高到更高档次, 巩固其在图片检索领域的重要地位, 以更高的查准率、查全率为图片检索提供更好的服务。

参考文献

[1]陈佳.与众不同的以"图"找"图"[J].电脑知识与技术-经验技巧, 2010, 34 (1) :45-46

[2]热依玛依.买买提, 维尼拉.木沙江.基于维吾尔文网页的图片相关文本提取技术研究[J].现代计算机 (专业版) , 2010, 12 (9) :76-77

[3]焦蕾, 殷锋社.图像搜索引擎检索模式分析与研究[J].电子设计工程, 2012, 20 (5) :23-24

[4]康寅, 杨文川.图像表示及在检索系统中的应用[J].软件, 2011, 32 (1) :56-57

基于内容的图片检索 篇2

图1在Google查询“冰岛火山”返回的结果,包含多种主题,以及相似或重复的图片。图中用蓝色方框标出了一组语义重复图片。

1 相关工作

对文字检索结果进行聚类,已经有很丰富的研究工作,比如文献[1]设计了一个对web检索结果进行聚类的接口。随着互联网上图片信息的增多,对于图片检索结果进行聚类的需求越来越迫切。[2]单纯使用原始图像特征符进行图片相似度检查,这种方式使得其只能检测几乎完全相同的图片,对图片轻微的更改就能使这种检测方法失效。互联网上的图片通常都伴随有丰富的文字信息,[3,4]借助围绕图片的上下文文字信息,如链接、标题,来获取语义信息,帮助实现图片聚类。这种方法需要大量的预处理时间对上下文信息进行提取。

随着图像特征符的描述能力越来越强,最近提出的SIFT[5]特征符能很好的描述图片显著区域,并且具有尺度,角度,光线明暗变幻不变特性,在文献[6]进行的特征符评测中获得优异结果。SIFT特征符,在物体识别,图像标注,图像检索等领域有大量成功运用[7,8,9,10,11,12,13,14]。

我们的工作采用SIFT特征符,将图片表示为词汇-文档矩阵集合,在此集合上训练统计主题模型,将图片映射到语义空间模型,然后在此空间中使用K-Means聚类实现相似图片的聚类。

本文剩下章节如下安排:第3节介绍所采用的统计主题模型以及SIFT特征符抽取过程,第4节介绍实验结果,最后在第5节是对方法和实验的总结及展望。

2 LDA

主题模型是一种生成性的概率模型,基于如下观点构建:文档是主题上的概率分布,而主题则是词汇上的概率分布。不同的主题模型做了不同的概率假设。由于主题在词上的概率分布是相关词项上的连贯聚类,因此单个的主题都是可解释的.

LDA模型简介

LDA[15]模型是一种常用的主题模型,由Blei等人于2003年提出.它是一个生成性的三层模型,依次为文档集合层、文档层和词层,将词和文档通过潜在的主题相关联。类似于许多概率模型,LDA中也做了词袋(bag of words)假设,即在模型中不考虑词汇的顺序而只考虑他们的出现次数。LDA模型是一个描述如何基于潜在主题生成文档中词的概率抽样过程,其生成过程如下:

1)选择N,N服从Poisson(ξ)分布,这里N代表文档的长度。

2)选择θ,θ服从Dirichlet(α)分布,这里θ是列向量,代表的是个主题发生的概率,α是Dirichlet分布的参数

3)对N个单词中的每一个:

a)选择主题Zn,Zn服从Multinomial(θ)多项分布。Zn代表当前选择的主题

b)选择Wn,根据P(Wn|Zn;β):在Zn条件下的多项分布。上式中β是一个K x V的矩阵,βij=P(Wj=1|Zi=1),也就是说β记录了某个主题条件下生成某个单词的概率。LDA生成模型过程如图2所示。

LDA模型由文档集合层的参数(α,β)确定,α反映了文档集合中隐含主题间的相对强弱,β刻画所有隐含主题自身的概率分布。随机变量θ表征文档层,其大小代表目标文档中各隐含主题的比重。下面的例子有助于更好理解该模型。假设一个语料库中有三个主题:体育,科技,电影。一篇描述电影制作过程的文档,可能同时包含科技主题和电影主题,而科技主题中有一系列的词,这些词和科技有关,并且他们有一个概率,代表的是在主题为科技的文章中该词出现的概率。同理在电影主题中也有一系列和电影有关的词,并对应一个出现概率。当生成一篇关于电影制作的文档时,首先随机选择某一主题,选择到科技和电影两主题的概率更高;然后选择单词,选择到那些和主题相关的词的概率更高。这样就就完成了一个单词的选择。不断选择N个单词,这样就组成了一篇文档。

构建并使用LDA模型的核心问题是隐含变量分布的推断,也即获得目标文档内部隐含主题的构成信息(θ,z).记(γ,φ)为(θ,z)的后验分布参数,则有更新方程式[16]:

得到隐含变量分布后即可估计LDA模型的参数,其中M是文档总数,d是文档标识,〖φ(d)〗_ni*是由期望步骤得到的最优φ_ni值。

3 SIFT

SIFT算法是Lowe[5]在总结了现有基于不变量技术的特征检测方法基础上,提出的一种基于尺度空间的图像局部特征描述算法,该算法已经在图像匹配、全景拼接和视觉导航等领域得到成功应用。

3.1 检测尺度空间特征点

关键点检测的第一阶段是确定在不同视角中能重复赋值的位置和尺度。可以通过利用尺度空间的连续函数,查找所有尺度中的稳定特征,来检测出关键点的位置。研究表明在在一系列合理的假设之下,高斯函数是唯一可行的尺度空间函数。我们定义图片的尺度空间函数为L(x,y,σ),将高斯函数G(x,y,σ)作为卷积核,图像用函数I(x,y)表示,则有:

其中*是卷积操作符,

为了更有效的检测关键点位置,Lowe[5]使用高斯函数差来检测稳尺度空间中的稳定关键点。高斯差分函数定义如下:

其中k是一个常量。

一种有效的构建高斯差分函数D(x,y,σ)的过程可以通过图3来介绍。初始图像渐增地与高斯函数进行卷积运算,产生一组被常量k分隔的图像,形成尺度空间,堆叠在图像的左边。然后将尺度空间的每一阶分成s段,令k=21/s,所以每一阶中的图像数必须为s+3个,这样极值检测才能覆盖一阶中的所有图像。图中右列显示了将每阶中相邻图像相减产生高斯差分图像的结果。在每一阶图像处理完之后,高斯图像被重新取样,然后开始重复上述处理过程。

为了获得高斯差分函数的局部最大值和局部最小值,每个取样点都要和其周边8个点以及上层图像和下层图像中的9个点进行比较,总过需要比较26个相邻点,如图4所示。

一旦发现了关键点之后,下一步就是确定关键点的位置、尺度、曲率等信息。通过下面的操作可以将候选关键点中低对比度(对噪声敏感)或位于边缘的候选关键点过滤掉。

过滤低对比度关键点如图4所示。

将尺度空间函数D(x,y,σ)泰勒展开:

其中,X=[(x,y,σ)]T为样本点的偏移量。通过求这个函数导数并将其值设为0,可以得到X的极值,将所有的低对比度候选关键点过滤掉。为了得到稳定的特征点,还必须将边缘处具有低对比度的关键点过滤掉。一个在图像边缘的关键点在高斯差分函数的峰值处与边缘交叉处有较大的主曲率值,但在垂直方向曲率值很小,我们可以利用这个性质将边缘处的低对比度候选关键点过滤掉。主曲率值可以通过的Hessian矩阵来计算:。矩阵H的特征值与D的主曲率值是成比例的,我们可以借助Harris和Stephens(1988)年提出的方法,不直接计算矩阵H的特征值,只考虑矩阵H的两个个特征值之间的比值即可。

3.2 定义特征点主方向

基于图像属性为每个关键点赋予一个方向,可以使在后面将要生成的关键点描述符能不受图像旋转的影响。赋予特征点方向的方法很多,下面介绍的方法实验证明结果最稳定。对每幅图像L(x,y),其梯度值m(x,y)和方向θ(x,y)可以通过像素的差值预先得到。

在特征点周围所在的一个区域内,依据样本点的梯度方向生成一个方向直方图,这个直方图用36位来表示360度的方向。

我们将方向直方图中的峰值作为该特征点的主方向。在直方图中一旦最大值被检测到,那么在最大值的80%以内的其他局部峰值也会被创建为具有相同方向的一个特征点。

3.3 生成特征向量描述子

通过前面的步骤,已经知晓了特征点的位置,尺度和方向。这些参数框定了一小块区域,下一步是基于这一小块区域,为每个特征点生成一个描述符,要求该特征符不随各种变化而改变,比如光线变化和视角变化等。

图5特征符计算过程解释了特征点描述符的计算过程。首先围绕着特征点的图像梯度值大小和方向被计算出来。为了达到方向不变性,描述符的坐标和梯度方向随着特征点的方向改变而改变。图中右侧所示是生成的特征点描述符。在每个区域中有8个方向箭头,箭头的长度与梯度值大小相对应。试验证明最好的描述符是4×4的柱状矩阵,矩阵中每个元素占用8个方向位,那么每个特征点的描述符就是一个4×4×8=128位的向量。最后,特征点描述符要作一些标准化以减少光线变化带来的影响。首先,特征点描述符向量要被标准化为单位长度。当图像对比度改变时,每个像素值会被乘以一个常量,同时梯度值也被乘以相同的常量,。当亮度发生改变时,每个像素都会被加上一个常量但不会影响梯度值,因为梯度是通过像素值的差计算得到的。由此得到的特征点描述符不受图像光线仿射变化的任何影响。通过如上步骤,我们获得了图片中的关键信息,这些信息能够很好的描述图片,不受图片尺度,光线变化,视觉角度的影响,是描述图片信息的“关键字”。

4 实验结果

我们在google中使用“冰岛火山”做为检索词,将检索结果用脚本取回,在此过程中,一些无效链接图片,gif和png格式的图片,以及大小超过1M的图片被剔除,总共获得了3000张图片。然后对图片集合抽取SIFT特征符,经过聚类得到词汇-文档矩阵,在此数据集上训练LDA模型,最终得到语义-文档矩阵,经过一个简单的聚类,就可以得到经过归类的聚类图片组,如图6所示。

5 总结

本文对搜索引擎检索结果进行语义聚类,与现有的大量处理文本检索结果的工作相比,本文的工作集中于处理图片检索结果。另外本文将流行的统计主题模型运用于图像处理,不同于以往的基于哈希值比对的做法。通过翔实的实验表明,本方法能有效的按语义关系聚类图片。使用该方法能为用户节省大量的时间,并且节省页面空间以显示更多检索结果。高效准确的图像检索仍面临许多难题,特别是其大规模部署过程中的检索效率,仍是一个待研究的课题,未来的工作中需要对主题模型的大规模分布式实现展开研究。

摘要:图片搜索引擎返回的结果列表中通常包含大量的相似及重复图片。用户需要花费大量的时间从结果列表中遴选所需的图片。如果能对检索结果进行语义聚类,则能为用户节省大量时间,并且节省页面空间以显示更多检索结果。近年来兴起的生成式统计主题模型在文本归纳及分类应用中得到良好应用。通过对图片抽取特征符,把图片表示为类似文本的词汇-文档模型,生成式统计主题模型在图像理解领域也得到广泛应用。文中对使用搜索引擎检索得到的图片进行特征符提取处理,然后通过统计主题模型的学习过程,获得低维的语义空间,然后在语义空间中进行聚类操作,实现将相似的图片归类的目的。实验证明了该方法的优良效果。

基于内容的图像检索综述 篇3

关键词:CBIR,颜色,纹理,形状,语义

随着现代通信技术和多媒体技术的发展及Internet的广泛普及, 数字图像的数量出现了急剧增长。如何从这些海量的图像数据中快速有效地找出需要的信息, 是一个非常有理论价值和实际意义的课题。实际上, 图像检索已经成为目前国内外的一个研究热点。从图像检索发展的历程来看, 主要经历了两个阶段:基于文本的图像检索和基于内容的图像检索。传统的基于文本的图像检索技术是通过关键字或自由文本进行描述, 查询操作是基于该图像的文本描述进行精确匹配或概率匹配。基于文本的图像检索方式简单、易于理解, 但检索时要指明文本特征。由于人工注释图像的主观性和不准确性等弊端, 因此这种传统的图像检索方法并不能满足用户的需求。相对于基于文本的图像检索技术来说, 基于内容的图像检索实现了自动化、智能化的图像检索和管理, 主要利用了图像中的一些可视化信息, 如颜色、形状、纹理等信息作为检索的途径, 从而提高了检索的效率和准确性, 因此得到越来越多人的关注。

1. 国内外的研究现状

迄今已有许多关于内容的图像检索系统面世。国外经典的检索系统有IBM公司开发的OBIc、Virage公司的Virage图像搜索引擎、麻省理工学院 (MIT) 多媒体实验室开发的Photo book、哥伦比亚大学开发的Visual SEEK和详eb SEEK, 等等。相对于国外而言, 国内在基于内容图像检索理论及应用的研究起步较晚, 具有代表性的工作如下:清华大学计算机系结合国家863高科技研究发展项目“Web上基于内容的图像检索研究”, 于1997年研制了一个网络版基于静态图像内容的原型系统。国防科技大学多媒体开发中心设计开发了一个基于内容的视频新闻节目浏览检索News Video CAR。浙江大学从1995年开始进行多媒体图像检索的研究, 开发了基于图像颜色的检索系统Photo Navigator, 并将基于颜色的CBIR技术较为成功地应用于敦煌壁画数据库的研究和开发。云南大学信息学院设计开发了基于内容的商标图像检索系统等。

目前, 基于内容的图像检索技术的研究热点[1]可分为四个方面:一是最初的图像检索研究主要集中于如何选择合适的全局特征去描述图像内容和采用什么样的相似性度量方法进行图像匹配。代表性工作包括:IBM开发的QBIC、MIT多媒体实验室开发的Photobook、哥伦比亚大学开发的Visual SEEK等。二是基于区域的图像检索方法, 主要思想是通过图像分割技术提取出感兴趣区域的特征;代表性工作有:美国加州大学的Netra、伯克利大学开发的Blobworld、斯坦佛大学和宾州大学开发的SIMPLicity。尽管这些方法更加贴近于用户查询的思路, 但由于图像分割的准确性差, 因而导致检索准确率低。上述两个研究热点是以图像为中心的方法, 无须考虑用户的需求。三是利用相关反馈技术, 根据用户需求及时调整系统检基于内容的圈像检索方法研究和实现索, 充分利用特征和相似性度量方法, 进而缩小低层特征和高层语义之间的差距。代表性工作有:美国伊利诺斯大学开发的多媒体分析和检索系统MARS, Picunter等;四是研究如何从多种渠道获取图像语义信息, 如何将图像低层特征与图像关键词结合进行图像自动标注以提高检索准确率, 如利用机器学习理论Bayesian, SVM, 等等。

2. 基于内容的图像检索系统构成

基于内容的图像检索过程[2]为: (1) 预先分析、提取和储存各图像视觉的底层特征; (2) 系统根据用户提交例图采用某种方法提取该图特征向量; (3) 选取相似性比较方法, 将该例图的特征与特征库中的特征进行比较匹配; (4) 将与查询特征相似的图像, 按相似度由大至小排列结果返回给用户; (5) 系统反馈的结果用户可以筛选或者从候选结果中选择一个示例, 经过特征调整后, 形成一个新的查询, 直至得到满意的结果。

3. 基于内容的图像检索常用的关键技术

基于内容的图像检索技术[3]有很多种, 颜色表达的是图像的全局特征, 是图像的主要视觉性质, 在人们对图像的印象中, 颜色占了很大的比重;纹理也是一种全局特征, 它描述了图像的表面性质, 在检索粗细和疏密等方面有较大差别的图像时, 利用纹理特征是一种有效的方法;形状特征更接近于目标的语义特征, 具有一定的语义信息, 可以帮助用户避开不相关的背景或不重要的目标, 直接搜索与目标图像相似的图像。事实上, 基于内容的图像检索方法需要综合颜色、纹理和形状的特征才能获得较好的效果。

3.1 基于颜色特征的检索

颜色是图像检索中最先被采用的特征, 主要方法有: (1) 颜色直方图, (2) 颜色一致性矢量, (3) 颜色相关图, (4) 颜色矩, 等等。

颜色是图像的一种重要视觉特征, 具有旋转不变性、平移不变性等优点, 在基于内容的图像检索 (CBl R) 中应用广泛、性能显著。对此, 人们提出了多种颜色特征提取及表示方法。其中, Swain等人提出的颜色直方图[4]在商用及实验系统中都得到了广泛应用。颜色直方图的比较是最基本方法, 但缺乏图像的空间信息。而CCV方法不仅统计了整幅图像中各颜色的像素值, 还统计了图像中各颜色最大区域的像素值, 效果较好, 但CCV并没有强调各颜色最大区域的形状及与背景的关系, 于是Zachary等人又考虑了图像的边缘信息, 提出了CCV—TEV (Threshold Edge Vector) 算法[5]。颜色相关图法强调同一颜色在图像中的空间距离相关性, 其检索效果比上述几个方法都要好, 但计算量比较大。颜色矩算法主要是采用图像中各颜色的均值和方差作比较, 处理简单, 可用它作为图像检索的初检, 为下一步的细检缩小搜索范围。

Zadeh提出的模糊集合理论[4], 通过隶属函数的概念和方法描述来具有模糊性的过渡过程, 将模糊集合理论及其衍生方法应用于CBl R具有较强的实用性。可以利用模糊C均值聚类算法 (Fuzzy C—Means AIgorithm, FCM) , 对图像色彩在RGB空间中进行模糊聚类, 通过计算每个像素对聚类中心 (即代表性颜色) 的隶属度值来构造模糊颜色直方图, 从而实现彩色图像的分类检索。

目前基于颜色特征的检索已成为检索的一个重要手段, 并提出了许多改进方法。总体来说, 主要分为两类:全局颜色特征检索和局部颜色特征检索。按照全局颜色分布来索引图像可以通过计算每种颜色的像素个数并构造颜色灰度直方图来实现, 这对检索具有相似总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域, 它考虑了颜色的分类与一些初级的几何特征。比如smith等提出了颜色集合方法[6]来抽取空间局部颜色信息并提供颜色区域的有效索引。

3.2 基于纹理特征的检索

纹理是图像的重要特征之一, 通常定义为图像的某种局部性质, 或是对局部区域中像素之间关系的一种度量, 其本质是刻画像素的邻域灰度空间分布规律。纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。

Haley[7]等人使用Gabor小波模型提取了旋转不变性的纹理特征, 该方法具有较高的复杂性。Ojala[8]等人提出了一种具有尺度和旋转不变性的LBP纹理分析方法, 但该方法仅利用了纹理图像的局部特征, 没有考虑到图像的全局信息。Manthalkar[9]等人采用离散小波包分解的方法得到了一种具有旋转和尺度不变的纹理特征, 然而该方法在一定程度上丢失了纹理的方向信息。Pun[10]等人提出了Log-polar方法, 具有旋转和尺度不变的特性, 但它将尺度变量转化为平移变量进行处理, 破坏了信号的频率。Kourosh[11]提出了一种旋转不变性的多尺度纹理分析方法 (RIM) , 利用Radon变换和小波变换得到了一种新的具有旋转不变的纹理特征, 具有较强的抗噪能力, 然而该方法不能同时具备平移和尺度不变性。

统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理。但这种方法没有利用像素相对位置的空间信息, 为了利用这些信息, Haralick[12]等人提出了用共生矩阵来表示纹理特征。该方法研究了纹理的空间灰度级相关性, 构造出一个基于图像像素间方向和距离的共生矩阵, 并且从矩阵中提取出反差、能量、嫡、相关等统计量作为特征量表示纹理特征。Tamura[13]等人基于人类视觉的心理学研究后提出了一些不同的方法来描述纹理特征, 给出了几个不同的描述纹理特征的术语:粗糙度 (coarseness) , 对比度 (contrast) , 方句度 (directionality) , 线性度 (linelikeness) , 规则度 (regularity) , 粗略度 (roug hness) 等。

结构法分析纹理的基本思想是假定纹理模式由纹理基元以一定的有规律的形式重复排列组合而成, 特征提取就变为确定这些基元并定量分析它们的排列规则。Carlucci[14]曾提出一个使用直线段、开放多边形和封闭多边形作为纹理基元的纹理模型, 其排列规则由一种图状语法结构定义。Luand Fu给过一种树形语法结构表示纹理, 他们将纹理按照9x9的窗口进行分割, 每个分解单元的空间结构表示为一棵树。因为实际的纹理大都是无规则的, 因此结构法受到很大限制。

3.3 基于形状特征的检索

形状是刻画物体的本质特征之一, 也是最难提取和描述的图像特征之一[15]。在人的视觉感知、识别和理解能力中, 形状是一个重要的参数。形状特征具有不受目标颜色、纹理、背景变化影响的特点, 它的重要原则是对位移、旋转、尺度变换的不变性。但不同于颜色和纹理等底层特征, 形状特征的表达必须以对图像中物体或区域的划分为基础, 形状特征的提取必须以图像分割作为前提。在二维图像空间中, 形状通常被认为是一条封闭的轮廓曲线所包围的区域。要想进行形状匹配, 首先需要找到一种合适的描述方式。形状特征通常有两种表示方法:一种是基于边界轮廓特征的表示方法, 该特征的描述主要有:直线段描述、样条拟合曲线、傅立叶描述、小波轮廓描述, 等等, 其中最典型的方法是傅立叶描述, 另一种是基于区域特征的表示方法, 如不变矩。前者只用到物体的外边界, 而后者则关系到整个形状区域。无论提取哪一类形状特征, 都必须分割图像。

3.4 基于组合的多特征的检索

图像内容具有各种视觉特征及视觉对象的空间关系等, 而人在观察图像时也不只是观察一个特征, 而是会同时看到图像的颜色、形状等多个组合特征。正如前面所提到的, 不同的特征有不同的矢量表示方法, 即使是同一特征, 如颜色特征也有直方图特征、颜色矩、颜色集等多种特征表示方法。在用单一特征进行检索时, 可能出现非常相似的两幅图, 但在语义上相差很大。而采用组合特征检索法时可以在颜色、纹理、形状等几种查询特征中选择两种或两种以上的特征进行组合检索。基于多特征组合检索便于用户更灵活、更有效地表达检索要求, 提高检索的准确率。该检索方法可分两种情况进行:一种是异步组合检索, 另一种是同步组合检索[16]。

3.5 基于语义特征的检索

基于语义的图像检索需要解决两个方面的问题:一是必须提供高层语义的描述方式;二是必须有将低层图像视觉特征射到高层语义的方法。图像的视觉特征信息和用户视觉数据理解的不一致性, 使得视觉底层特征和高层语义之间存在语义鸿沟。针对这一问题, 许多学者进行了研究, Amoid将图像的知识作用域分为狭义域和广义域两类, Hermes[17]等人使用了相似性技术直接从户外图像中推导场景的自然语言描述, Zhuang[18]等人提出了模糊布尔模型、概率布尔模型。这些方法在不同的场合分别显示了它们在语义表达方面的能力。

基于语义的图像检索方法, 它允许用户在检索过程中用主观感觉来描述图像, 这对于检索者来说, 可以提高检索效率和准确性, 但是“语义鸿沟”的存在, 使得基于语义的图像检索仍面临着很大挑战。

4. 基于内容的图像检索技术的展望[19]

目前, 许多研究关注的是图像的特征提取及检索匹配算法, 虽然方法很多, 但没有一个统一的模型, 需要易用的能对原始特征进行抽取的自动工具和获取逻辑特征的半自动工具用于开发大型、实用的多媒体信息检索系统。另外, 还需要新的特征表示方法, 如基于分形或小波的特征数学表示。目前使用的媒体, 其格式和编码没有考虑到内容, 只是针对颜色、像素、样值来编码。因此, 从这些数据中抽取内容特征非常困难。在基于内容的检索中, 由于检索算法比较多, 需要对各种算法的检索结果进行评价, 以比较其优劣。检索算法的评价方法能够在相同的条件下找出最佳算法, 使不同的检索方法能更好地改进和提高, 以使基于内容的检索方法朝更好的方向发展。

图像检索技术的研究是一个涉及多个领域的综合性课题, 是对计算机视觉技术、数据库检索和管理技术、用户界面技术、数学建模技术、图像分析处理技术、计算机网络技术及人类心理学等各个方面成果的融合, 只有这样, 才能建立一个高效、快速、实用的图像检索系统[19]。

基于内容的图像检索技术 篇4

计算机图像数码技术与互联网技术飞速发展的结合,使人们越来越多的接触到大量的图像信息。如何从浩瀚的图像数据库中快速、准确地找出自己所需要的图像,已成为一个受到广泛关注的研究课题,并成为数字化图书馆等重大研究项目中的关键技术。

基于文本的图像检索技术可以追溯到70年代末,通过对图像进行手工注解,然后利用文本检索技术进行关键字检索。但是基于文本的图像检索方式存在着两大难题:一是手工注解的工作量太大,对于大的图像库需要有完全自动化或半自动化的方法;二是由于图像包含的丰富内涵远非少量文本注释所能表达。为了克服基于文本方法的局限性,基于内容的图像检索技术出现了,这种技术融合了图像理解技术,从而可以提供更加有效的检索途径。

1 基于内容的图像检索方法

20世纪90年代初,研究者们提出了基于内容的图像检索(Content Based Image Retrieval,CBIR)。CBIR使用了可以直接从图像中获得的客观的视觉内容特征,如颜色、纹理、形状等来判断图像之间的相似性,这种方法成了现有图像检索技术研究的主流。CBIR的主要特点是它主要只利用了图像本身包含的客观的视觉特征,图像的相似性不需要人来解释,体现在视觉相似性上。这导致了它不需要或者仅需要少量的人工干预,在需要自动化的场合取得了大量的应用。

2 基于内容的图像检索常用的关键技术

2.1 基于颜色特征的检索

颜色特征是图像最直观而明显的特征,一般采用直方图来描述。颜色直方图法具有运算速度快、存储空间要求低的特点,并且对图像的尺度及旋转变化不敏感,因此得到了广泛关注。目前基于颜色特征的检索已成为检索的一个重要手段,并提出了许多改进方法。总体来说,主要分为两类:全局颜色特征检索和局部颜色特征检索。按照全局颜色分布来索引图像可以通过计算每种颜色的像素个数并构造颜色灰度直方图来实现,这对检索具有相似总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。比如Smith等提出了颜色集合方法来抽取空间局部颜色信息并提供颜色区域的有效索引。

2.2 基于纹理特征的图像检索

纹理特征是一种不依赖于颜色或亮色的反映图像中同质现象的视觉特征,它是所有物体表面共有的内在特性,例如,云彩、树木、砖、织物等都有各自的纹理特征。纹理特征包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。正因为如此,纹理特征在基于内容的图像检索中得到了广泛的应用,主要有Tamura纹理特征、自回归纹理模型、方向性特征、小波变换和共生矩阵等形式。

一般对纹理的检索都采用示例查询(Query by Example)方式。用户给出一个要检索的图像的例子,然后系统按照这个例子查找与它相似的图像,并将相似结果返回给用户,用户在这些相似的图像中确定或在此选择更接近用户查询的图像,最终达到检索的目的。

2.3 基于形状特征的图像检索

物体和区域的形状是图像表达和图像检索中的另一重要的特征。但不同于颜色或纹理等特征,形状特征的表达必须以对图像中物体或区域的划分为基础。通常,形状特征有两种表示方法:一种是轮廓特征的,一种是区域特征的。前者只用到物体的外边界,而后者则关系到整个形状区域。

用户采用该特征进行检索,可通过勾勒图像的形状或轮廓,从图像库中检索出形状相似的图像。基于形状特征的检索方法有两种:一是分割图像经过边缘提取后,得到目标的轮廓线,针对这种轮廓线进行的形状特征的检索;二是直接针对图像寻找适当的矢量特征用于检索算法。

2.4 基于空间关系特征的图像检索

上述的颜色、纹理和形状等多种特征反映的都是图像的整体特征,而无法体现图像中所包含的对象或物体。事实上,图像中对象的所在位置和对象之间的空间关系同样是图像检索中非常重要的特征。例如,蓝色的天空和蔚蓝的海洋在颜色直方图上是非常接近而难以辨别的,但如果指明是“处于图像上半部的蓝色区域”,则一般来说就可以区分天空和海洋。由此可见,包含空间关系的图像特征对检索有很大帮助。

空间关系特征有两种检索方法:一类方法是首先对图像进行自动分割,划分出其中所含的对象或颜色区域,然后根据这些区域对图像索引;另一类方法则简单地将图像均匀划分若干规则小块,对每个图像小块提取特征建立索引。

3 基于内容图像检索的相关反馈

基于内容的图像检索虽然使海量图像的查找更加便捷但其查找的准确率却相对较低,对图像语义级的检索还差强人意。由于人的主观性在图像检索中具有重要的指导性作用,因此把人的作用放到图像检索过程中就显得非常重要。基于这一点,相关反馈被引入基于内容的图像检索中。相关反馈技术最早是在基于文本的图像检索领域中提出来的,它的基本思想是在检索的过程中,通过一种人机交互机制,允许用户对检索结果进行评价,并提交满意程度,然后将用户标记的相关信息反馈给计算机,使其通过不断修改查询表达来得到更好的检索结果。

4 基于内容图像检索中的效果评价

在基于内容的检索中,由于检索算法比较多,需要对各种算法的检索结果进行评判,以比较其优劣。从研究情况来看对于系统的响应时间和吞吐率的评价论述的较少,对检索效果评价更多地放在对检索结果的正确与否,主要使用的是查准率(precision)和查全率(recall)两个指标。

用户在评价算法的时候,可以预先选定含有特有目标的图像作为一组相关的图像,然后根据返回的结果计算查全率和查准率。查全率和查准率越高,说明该检索算法的效果越好。查全率反映系统检索相关图像的能力,而查准率则反映系统拒绝无关图像的能力。

5 结束语

每一幅图像都蕴含着丰富的内容,人们对其的理解也各有不同,因此,如何在人的主观描述与图像的底层特征之间建立映射、如何使计算机对图像相似性的理解和判断趋于人类的思维水平是研究的重点和难点。

基于内容的图像检索技术是一门综合性的交叉学科,其研究有赖于图像理解、图像处理、模式识别、人工智能以及数据库技术等多种学科的不断发展。目前对基于内容的图像检索技术仍然主要集中在颜色、纹理、形状等底层物理特征提取的基础上。由于不同特征有不同的相似性定义,因此有效地融合多个特征来获取图像相似性排序,将是今后一个重要的研究方向。

摘要:为了提高图像资源利用率,快速、有效地查询和检索数据库中的图像,基于内容的图像检索技术(CBIR)便应运而生。本文分析和比较了基于颜色、纹理、形状等图像检索技术的主要方法,讨论了相关反馈技术、检索性能的评价等CBIR研究中的关键问题,同时指出了CBIR研究中存在的问题,以及未来的发展趋势和研究方向。

关键词:CBIR,图像检索,特征,相关反馈

参考文献

[1]田卉,覃团发,梁琳.综合颜色、纹理、形状和相关反馈的图像检索[J].计算机应用研究,2007,(11):292-294,314.

[2]孙即祥.图像分析[M].北京:科学出版社,2005,07:72-85.

[3]冯国光,齐影虹,肖扬波.基于内容的图像检索技术综述[J].科技广场,2007,(03):233-236.

[4]刘砚.基于内容图像检索的相关反馈技术[J].天津职业院校联合学报,2008,(05):128-130.

[5]孟繁杰,郭宝龙.CBIR关键技术研究[J].计算机应用研究,2004,(7):21-24,27.

[6]张毅,赵捧未,刘怀亮,张治国,马志辉.基于语义的图像检索相关反馈技术[J].情报杂志,2006,(10):43-44,47.

基于内容的图像检索技术 篇5

1 图像检索理论

图像经过采样、量化、编码之后, 首先以图像文件的形式存储在计算机中, 然后才能进行图像处理、分析和识别。本文研究的图像为位图文件 (BMP, Bitmap File) , 所以任何处理都可以归结为对像素点的颜色进行处理。在颜色模型上本文的实验系统采用了HSV颜色模型。

按特征查询是基于内容的图像检索系统的基本查询方式, 颜色、纹理和形状是图像最基本的特征, 也是人们研究基于内容的图像检索的切入点, 本文实验系统综合了颜色、纹理和形状三种特征进行检索并且获得了较好的效果。

2 图像检索技术

颜色表达的是图像的全局特征, 是图像的主要视觉性质, 在人们对图像的印象中, 颜色占了很大的比重;纹理也是一种全局特征, 它描述了图像的表面性质, 在检索粗细和疏密等方面有较大差别的图像时, 利用纹理特征是一种有效的方法;形状特征更接近于目标的语义特征, 具有一定的语义信息, 可以帮助用户避开不相关的背景或不重要的目标, 直接搜索与目标图像相似的图像。事实上, 基于内容的图像检索方法需要综合颜色、纹理和形状的特征才能获得较好的效果。

2.1 基于颜色的检索算法

存在众多的CBIR系统颜色信息提取和表示方法, 例如颜色直方图、直方图相交方法、颜色矩方法、基于参考颜色表 (RCT) 的方法、颜色对表示方法等等。但经实验发现直方图不变特征矩函数以及前三阶颜色中心矩函数, 因为它们具有良好的线性不变性, 两种矩函数的结合使用使本文系统检索结果更精确。下文给出直方图不变特征量:

记S (xi) 为图像P中某一特征 (如Hue) 值为xi的像素的个数, undefined为P中的总像素数。对S (xi) 作归一化处理, 即

undefined

图像P的该特征的直方图为:

H (p) =[h (x1) , h (x2) , …, h (xn) ] (2)

式 (2) 中, n为某一特征取值的个数。事实上, 直方图就是某一特征的概率分布。

假设非负函数P (x) 积分为1, 即

∫P (x) dx=1 (3)

否则, 可以对P (x) 进行归一化。把P (x) 看成x的概率密度函数。

x的k阶矩定义为:

mk=∫rkP (r) dr (k=0, 1, …) (4)

k阶中心矩定义为:

uk=∫ (r-m1) kP (r) dr (k=0, 1, …) (5)

从中心矩构造三个矩函数

undefined

式 (6) 定义的三个矩函数对的线性变换具有不变性。若把P (x) 看成图像灰度直方图, 则式 (6) 定义的三个矩函数对图像灰度的线性变换具有不变性。

颜色矩是一种简单有效的颜色特征, 图像的颜色信息主要包含在色彩的低阶矩中, 他们对图像的每个色彩分量分别计算一阶、二阶和三阶中心矩, 分别代表颜色分量的平均值、方差和不对称度。对于k阶中心矩当时可表示如下:

其中, N为像素的个数。类似地, 可以定义另外两个分量的颜色矩。

设查询图像Q和库中图像D, 它们各有r个颜色分量, 他们的三个颜色矩分别是Ei和Fi, σi和ζi, Si和Ti则两图像间的距离为:

其中, ω是用户定义的权值矩阵。通常在HSV颜色空间中进行颜色矩计算, 并且人们通常对色度相似性的要求要高于饱和度和亮度的相似性, 这个要求可以通过设置适当的权值矩阵来实现。另外, 权值矩阵也可以通过相关反馈加以调整, 以求最佳的检索效果。

2.2 基于纹理的检索算法

纹理可认为是灰度 (颜色) 在空间以一定的形式变化而产生的图案 (模式) , 是真实图像区域固有的特征之一 (纹理是一种区域性质) 。常用的纹理模型有:共生矩阵方法 (co-matrix) 、对应于人眼视觉感受的Tamura纹理特征、基于频率域的纹理分析方法以及其它纹理特征检索。本文在提取纹理特征时, 选用了灰度共生矩阵生成的三个不变矩函数, 理由在于它们是较合理的纹理描述符, 并且得到的不变矩对线性变换不敏感。共生矩阵就是用来描述纹理中灰度基元之间空间联系的基础。基于共生矩阵的模型充分利用了纹理中灰度分布的性质。灰度共生矩阵或灰度—平滑共生矩阵也可定义不变特征量, 对灰度的线性变换不敏感。

对于共生矩阵或灰度—平滑共生矩阵[Pij], (l, k) 阶数矩定义为:

(l, k) 阶中心矩定义为:

定义二维直方图的3个不变矩函数

2.3 基于形状的检索算法

形状是刻画物体的基本特征之一, 用形状特征区别物体非常直观, 利用形状特征检索图像可以提高检索的准确性和效率。形状特征通常和目标联系在一起, 因而含有一定的语义信息, 可以有效地对图像中感兴趣的目标进行检索。本文在提取形状特征时, 选用了几何矩描述子方法, 组合二阶和三阶中心矩得到了七个不变矩特征, 这些矩特征都具有平移和旋转不变的特性。

假设f (x, y) 为二值图像, 表示形状区域, 在区域边界上取1, 其他地方取0。

p+q阶矩定义为:

当图像发生平移变化时, mpq也将发生改变。为使mpq具有平移不变性, 定义p+q阶中心矩为:

式中:

(x0, y0) 为形状区域的质心。upq具有平移不变性, 但是upq依然对旋转敏感。组合二阶和三阶中心矩, 可得7个对平移和旋转不变的矩特征, 定义如下

但是上述几种矩特征的定义都不具有尺度不变性。

3 系统功能与实现

3.1 系统设计与实现

在Windows XP平台下, 采用C++Builder6.0语言编写了一个基于内容的图像检索的实验系统。后台采用Paradox7数据库存储图像及其对应的特征信息。实验系统中构建了一个图像库, 选择不同的阈值和权重对检索结果进行了比较和分析, 取得了较为理想的效果。实验系统的检索工作是可视化的, 便于操作和管理。系统主要分为两大模块:存入图像库 (建立图像库) 模块和图像检索模块。主界面如图1所示。

如果用户希望向图像库中添加图像, 在登陆系统后选择“存入图像库”弹出如图2所示。用户在此模块中可以通过“打开图像文件”选择需要存入的图像, 图像库会自动生成编号同时用户输入图像名称。当“确定”后, 图像特征和聚类号会被提取出来, 图像与其特征分别被存入相应的图像库和特征库中。

在图像检索对话框如图3所示, 可以实现基于颜色、纹理、形状和混合四种图像检索功能, 并且在混合图像检索中可以选择不同特征的权值。如果反馈的结果不够满意, 用户还可以更改阈值大小或相似个数的值, 来进行进一步的检索。实验系统能与用户互动, 既使检索过程灵活方便又提高了检索的准确性。

3.2 实验结果分析

实验过程中, 在图像库中存入了200幅图像, 既包括比较相似的图像又包括相差较大的图像, 通过各种方式检索取得了较为理想的效果。在实验中发现, 采用阈值方法处理检索结果, 检索精度较高, 但是当阈值设定过大时, 可能返回大量满足阈值条件却不太相关的图像, 给定阈值过小时可能会检索不到任何图像;而采用给定相似个数法处理检索结果, 会返回确定个数的图像, 保证检索的实现, 但结果不够精确。所以专业用户可以采用阈值法, 而非专业用户对图像库把握不太好时, 建议采用给定相似个数法进行检索。

4 结束语

本系统将三种特征综合起来进行检索, 并可根据不同的需要选择不同的权重值。经过测试, 这种综合检索的方法可以取得良好的检索结果。

今后还将改进图像特征提取算法。特别是改善特征提取方法, 使其更能体现图像各点在空间分布的规律。要实现以多媒体数据库的方式管理图像数据, 这种以多媒体数据库管理的方式有许多优点。一个真正实用的系统需要为用户充分考虑, 良好的人机界面和操作流程是使用户满意的重要因素, 未来的系统准备提供分类浏览和基于内容查询相结合的检索方式。同时, 要保证检索的等待时间不超过用户可以忍耐的极限。另外, 数据挖掘中聚类等思想的引入对大型、超大型图像数据库的检索很有意义, 尤其有利于与相关领域的技术相结合, 这必将促进多媒体数据库的标准化描述。

参考文献

[1]顾燕.基于内容的图像检索方法及其实验系统设计[D].河海大学硕士论文, 2002.

[2]韦娜.基于纹理特征的图像检索技术研究与实现[D].西北大学硕士学位论文, 2003.

[3]李鹏杰, 杨树元.一种基于内容的图像检索系统[J].微电脑应用, 2001, 22 (3) :138-142.

[4]Aki Kobayashi, Toshiyuki Yoshida, Yoshinori Sakai.Image Retrieval by Estimating Parameters of Distance Measure SPIE[Z].2000, 3972:432-441.

基于内容的图像检索技术研究 篇6

图像数据库是目前一个研究热门领域, 怎样对这些图像数据进行快速检索, 则需要用到图像检索技术, 而基于内容的图像检索技术是用于对海量图像数据进行检索的新技术。

1. 基于内容的图像检索系统一般结构

在基于内容的图像数据库中, 首先把被检索图像的颜色、纹理、形状等特征信息提取出来, 然后再与图像数据库中图像的特征信息进行相似性比较, 根据相似度大小输出查询结果, 要求基于内容图像检索技术需要包括数据模型、图像内容获取、人机接口、以及完成检索框架等功能, 以下描述基于内容的图像检索系统的体系结构划分为特征提取和查询两个子系统, 一般框架如图1-1所示:

各个模块的作用分别是:

(1) 预处理:对图像进行一些预处理操作, 包括图像去噪、增强、格式转换、规格化等, 方便后面对图像进行特征提取;

(2) 目标识别:识别出图像中用户感兴趣的区域或对象, 以方便进行特征提取和检索;

(3) 特征提取:这是基于内容的图像检索系统的核心部分。目前使用较多、比较成熟的检索算法大部分是基于图像低层视觉特征的。数据库由图像库、特征库和图1基于内容的图像检索系统一般结构知识库组成。其中特征库是包含提取出的图像的各种特征;知识库包含专门和通用知识, 能实现查询优化和快速匹配。

(4) 查询接口:为用户提供一个友好的查询界面和多样的查询手段, 主要的查询方式有外部图例查询、内部图例查询、草图查询和综合查询。外部图例查询是实例图像来源于图像检索系统的外部, 不是图像库中存储的图像。内部图例查询则是实例图像来源于图像检索系统的图像库中。草图查询是实例图像由用户自己创建。综合查询方法则是综合应用了以上的几种查询方式。

(5) 检索引擎:包含一个有效可靠的相似性测度函数集, 用于对查询图像和图像库中的图像进行相似性度量。

(6) 索引/过滤:对图像库中的图像按某种标准进行筛选, 以提高检索的速度。

2. 特征提取与描述

特征提取是基于内容的图像检索技术研究的核心内容, 是把图像的内容信息提取出来, 据此进行图像检索。图像的特征主要包括低层特征和高层语义特征。低层特征如颜色、形状、纹理是图像的一些定量的特征, 可以通过计算机自动或人机交互的方式提取。而高层语义特征是图像的一种定性的特征, 更接近于智能化的理解, 主要通过人机交互或人工的方式提取。基于语义的图像检索技术是最符合用户要求的检索技术, 它的发展可能是基于内容的图像检索技术走向成熟与实用的关键。但是由于低层视觉特征和高层语义之间存在沟通鸿沟, 难以找到图像语义的有效描述方式、提取图像语义描述的方法以及语义的处理方法, 所以目前应用较多、比较成熟的检索方法都是基于低层特征的。

2.1 颜色特征

颜色是描述一幅图像的最简便而有效的特征, 因为颜色往往和图像中所包含的物体和场景十分有关。而且与其他低层特征相比, 颜色特征对于图像缩放、旋转、遮挡及其他形变有着更强的鲁棒性, 是基于内容的图像检索采用的最早最广泛的低层特征。

(1) 颜色空间介绍

对图像的处理需要在特定的颜色空间中进行, 选择不同的颜色空间就会有不同的处理效果。颜色空间通常可以分为面向硬件和面向视觉感知两类。面向硬件的颜色空间包括RGB、CMY等;面向视觉感知的颜色空间包括HSV、YUV、L*a*b*等。

(1) RGB空间

现有的图像采集设备采集到的信息都是RGB值, 所以RGB空间是最基础的颜色空间, 图像处理中其它的颜色空间也是从RGB空间转换而来。RGB的三个分量R、G、B即是自然界中的三原色, 红色、绿色、蓝色。它是一种与人的视觉系统密切相关的颜色模型。它的模型如图2所示, 三个坐标轴分别代表R、G、B三个分量, 图中坐标为 (1, 0, 0) 、 (0, 1, 0) 、 (0, 0, 1) 的三个点分别对应于红色、绿色、蓝色, 原点对应于黑色, 坐标为 (1, 1, 1) 的点就代表白色。每一幅彩色图像的颜色值都可以用这个模型进行分解。

RGB空间的缺点主要有两个, 一是不符合人的视觉感知心理, 不能与人的视觉特征相匹配, 不够直观;二是RGB空间属于不均匀颜色空间, R、G、B这三个分量存在着密切的关联性, 所以不能通过直接计算两个颜色点之间的距离来表示它们之间的颜色差异。

(2) HSV空间

与RGB空间相比, HSV空间是一种均匀的颜色空间, 而且它与人类的视觉感知相符合。三个分量H、S、V分别是色调、饱和度和亮度。色调 (H) 是指光的颜色, 它与混合光谱中主要光波长相联系。波长不同, 光呈现的颜色就不同。饱和度 (S) 是指彩色的深浅程度, 饱和度越高的, 颜色程度越深, 越低的颜色程度就越浅。亮度 (V) 是指人眼感受到的光的明暗程度。从RGB空间到HSV空间的转换方式如公式2-1所示:

(3) CIE空间

CIEL*a*b*和CIEL*u*v*颜色空间都是两种均匀的、面向视觉感知的颜色模型。这两个颜色空间是CIE (国际照明委员会) 在1931年公布的XYZ空间的基础上得到的。首先对RGB空间做线性变换到XYZ颜色空间, 然后再通过非线性变化到这两个颜色空间。

从RGB到CIEXYZ空间的转换公式如下:

从RGB到CIEL*u*v*空间的转换公式如下:

(2) 颜色特征描述

有关颜色特征的描述一般有两类, 一类是基于全局的, 一类是基于空间分布的。以下介绍几种比较经典的颜色描述方法。

(1) 颜色直方图及其改进算法

颜色直方图是Swain于1991年提出的, 目前仍然是最流行的颜色表示方法之一。颜色直方图通过对不同颜色值的像素点在图像空间中出现的频率进行统计, 定义了图像中各种颜色的分布情况。设一幅大小为M×N图像fxy, fxy表示像素点 (x, y) 处得颜色值, C表示图像所包含的颜色集, 则颜色直方图可表示为:

(2) 颜色熵及其改进算法

颜色熵的描述方法是John Z M最早提出的, 将图像的颜色直方图看做不同颜色像素点的概率密度函数, 根据信息熵的理论得出表达式:n

(3) 颜色聚合向量

传统的颜色直方图和颜色熵的描述方法都是对图像的全局特征进行描述, 丢失了图像的空间分布信息。颜色聚合向量改进了这种不足, 提取的特征中包含了图像的空间分布信息。颜色聚合向量是Pass等人提出的。计算的方法是首先设定一个适当的阈值;然后将直方图中每一个区间中的像素分为两部分, 分别将这两部分的像素组成的区域面积与设定的阈值进行比较, 若某一部分的面积大于设定的阈值, 则将该区域内的像素定义为聚合像素, 若小于则定义为非聚合像素。

设αi表示直方图第i个区间内聚合像素的数目, βi表示非聚合像素的数目, 则图像的颜色聚合向量可表示为:

相比较与传统的颜色直方图, 用颜色聚合向量进行的图像检索可以取得更好的检索效果。

2.2 形状特征

相对于颜色而言, 形状是比颜色和纹理更高层一些的特征。图像的形状特征不会随着光照等外界环境的变化而变化, 是图像比较稳定的特征, 因此研究物体的形状对于图像检索技术的发展十分必要。形状的提取一般有两类方法:一类是先提取图像的边缘点, 由这些边缘点连接成一系列的曲线, 用该曲线表示物体的形状;另一类是通过图像分割等方法, 提取出一些区域, 用这些区域的特征描述形状信息。以下为几种常用提取方法:

(1) 链码表示法

链码表示法的基本思想是将一个正方形的网格放置到物体的边界上, 利用网格对物体边界进行编码。首先设定与曲线起始点最接近的网格点作为编码的起始点 (x0, y0) , 从起始点开始依次将曲线与网格的交点用线段相连, 并标明方向。常用的链码有4-方向链码和8-方向链码。它们的定义如图3所示。

(2) 基于直方图法

基于直方图法有比如距离直方图、边界方向直方图、链码直方图等。距离直方图的思想是通过计算轮廓多边形上的特征点与多边形质心的距离来绘制直方图。首先计算多边形的质心, 建立坐标系, 获得各个像素点的坐标;然后选取适当的特征点和距离计算公式, 开始计算距离;最后由计算的距离画出直方图。其中, 特征点的选取和距离区间的划分是重要的步骤。距离直方图方法的优点是具有平移、旋转不变性, 缺点是不具有尺度不变性。

边界方向直方图方法是先对图像进行边缘检测, 然后在边缘图像的基础上建立边界方向直方图。目前常用的检测图像边缘的算子主要有Roberts算子、Sobel算子、Canny算子等, 其中Canny算子是目前最好用的图像边缘检测算子。边界方向直方图的优点是计算简单, 容易运用, 缺点是不具有旋转不变性。

链码直方图是对链码表示法的一种改进, 将图像的边界用链码描述符标出后, 统计链码串中链码的个数和方向, 由此计算得出链码直方图。链码直方图的数学定义为:

其中, ni表示链码串中方向为i的链码个数, N表示链码串中所有链码的数目。链码直方图使链码描述法具有尺度、旋转和平移不变性。

除了以上两类方法以外, 当图像中物体的数目较少时, 一般只有一个目标物体时, 通常也用物体的几何参数作为形状特征, 如轮廓的周长、面积、离心率、曲率、重心、偏心率等等。这些特征的提取较之以上两类特征来说比较简单, 计算方便。

2.3 纹理特征

有关纹理特征的描述方法主要统计法、结构法、模型法和频谱法等。统计法是根据Julesz发现的人类视觉系统是通过统计特征来区分不同纹理发展起来的, 据此产生了一系列的算法, 比较典型的有灰度共生矩阵法], 能量谱函数法和自相关函数法等。用统计法来描述纹理特征适合于山脉、森林、草地等一类图像。结构法是将纹理分解为若干个纹理基元, 统计每个基元的特征和基元之间的组合规律, 据此作为特征来进行描述。因为纹理特征是多样的而且很多是随机的, 所以很难做到准确的分割每个纹理基元, 因此这种方法的局限性比较大。模型法则是假定纹理的分布是按照某种模型的特征来分布的, 用该模型的特征作为纹理的特征。比较常用的模型有马尔可夫随机场模型、Gibbs随机场模型、分形模型法等。频谱法是将图像的纹理当做二维信号来处理, 计算它的频域特性来进行描述。

基于纹理特征的图像检索已经得到了广泛的应用, 如在医学上识别癌细胞、工业上检测金属的形变和产品的缺陷、遥感图像中的城市、海洋、山脉分析等等。目前对纹理的研究主要还要集中在以下几个方面:有关纹理特征的提取和描述、如何对纹理进行准确的分割、如何由纹理特征恢复出物体原来的形状。这将是以后研究的热点问题。

2.4 空间关系特征

空间关系特征指的是空间对象之间具有的空间上的相互关系。所谓图像中的对象可以用不同的形式来表示。一种是用对象中的某个点来表示该对象, 比如用质心、角点、最小矩形等来表示;一种是用骨架法表示, 就是用对象的大体形状和尺寸来表示该对象。空间关系特征就是指图像中各个对象之间的空间特性。空间关系的类别主要有拓扑、方向、度量三大类关系。拓扑关系是指在拓扑变换下的不变量, 如相接关系、对象间的分离等。拓扑关系具有平移、缩放和旋转不变性, 而且图像中任何两个对象之间只存在一种拓扑关系, 这就使得这种方法有简单易行的优点。方向关系也称方位关系, 它定义的是对象之间的方位, 比如各个对象与X轴的角度关系就是其中的一种表示方法。

2.5 多特征

由于用单一特征难以描述图像丰富的内容, 所以基于单一特征的图像检索效果往往不理想, 综合多种特征则可以更全面的描述图像, 大大提高检索的精度。目前基于颜色特征和形状提取该区域的特征作为图像的特征。

在第二类方法中, 常用的分割方法有对图像直接进行固定分块、全阈值分割和利用颜色特征进行的分割等。这种利用图像的颜色特征进行的分割方法, 因为结合了图像的低层特征, 所以分割效果比以上两种要好, 检索精度要高。这类多特征检索的方法对图像各种特征之间的关系进行了深层发掘和充分利用, 真正实现了图像各种特征之间的关联和融合。

3. 相似性度量

提取出图像的特征后, 用相似性度量来匹配待检索图像与数据库中的图像。当两幅图像特征间的距离小于设定值时, 认为两幅图像相似, 完成近似匹配。相似性度量技术是基于内容的图像检索技术的又一核心研究内容, 算法的性能直接影响检索结果的好坏。不同的匹配方法又有各自的优点和缺点, 要根据图像的特点选择合适的匹配方法。

3.1 单一特征的相似性度量

(1) 欧式距离

欧式距离的的优点是物理意义清晰, 简单易行, 适用范围比较广, 各种特征基本都可以用这种方法比较。缺点是在计算非均匀颜色空间中两个像素点之间的距离时, 欧式距离与人的视觉差异并不一致。

(2) 直方图相交法

直方图相交法是Swain等人于1991年提出的, 其数学描述为:

对其进行归一化处理:

直方图相交法的优点是计算快速、简单, 能很好抑制背景的影响。

(3) Minkowsky距离

Minkowsky距离基于LP范数定义的, 即

(4) 二次式距离

二次式距离表示为:其中, M=[mij], mij表示直方图中下标为i和j的两种颜色之间的相似度。这种度量方法的优点是考虑了不同颜色之间的相似度, 就基于颜色直方图的图像检索来说, 已证明比欧式距离更有效。 (5) Hausdorff距离

Hausdorff距离是是一种定义在两个点集上的最大-最小距离, 设给定的两个点集P= (p 1, p2, ...pm) , Q= (q 1, q2, ...qn) , 则Hausdorff距离的最基本形式是:D (P, Q) =max{d (P, Q) , d (Q, P) } (3-8)

其中, 是从P集合到Q集合的有向Hausdorff距离。是从Q集合到P集合的有向Hausdorff距离。

3.2 多特征的相似性度量

对图像多特征检索的相似性度量主要有两种方法, 同步组合方法和异步组合方法。

(1) 同步组合方法

所谓同步组合方法, 就是先对图像的每个特征分量分别进行相似性度量, 得到的距离分量记为:D1 (x, y) , D2 (x, y) ...D n (x, y) ;然后为每个距离分量距离赋予相应的权值W1, W 2...Wn;最后用这些距离分量的加权和作为最终两幅图像间的距离, D (x, y) =W1 D1 (x, y) +W2 D2 (x, y) +...Wn Dn (x, y) 。基于多特征的图像检索大部分采用的是这种度量方法。

(2) 异步组合方法

异步组合方法, 就是首先针对一种特征做一次相似性度量, 输出相似的图像;然后从第一次输出的图像中针对第二种特征再做相似性度量, 再一次输出相似的图像。依次类推, 上一级输出的图像结果作为下一级特征提取与比较的输入, 直至比较完所有的特征, 输出最后结果。这种度量方法可以逐渐的缩小检索空间, 提高精度。

4. 本文小节

本文主要介绍了基于内容的图像检索系统的一般结构, 然后对基于内容的图像检索的关键技术特征提取和相似性度量等常用方法进行分析, 这些都是基于图像低层次特征内容检索, 随着相关应用领域对图像检索技术要求不断提高, 该技术还需要进一步改善, 而基于图像高层次特征检索如时间、地点等以及集成性检索将成为研究的一个重要方向。

摘要:本文首先介绍了基于内容的图像检索系统的一般结构, 然后详细介绍了国内外被广泛应用的特征提取和描述方法, 主要对几种常用的基于单一特征和多特征的相似性度量方法进行分析。

关键词:图像检索,单一特征,多特征,相似度

参考文献

[1]Igor Marinoviü, Igor Fürstner.Content-based Image Retrieval[J].IEEE, 2008.

[2]Ritendra Datta, Jia Li, James Z.Wang.Content-Based ImageRetrieval-Approaches and Trends of the New Age[J], 2005, 253-262.

[3]孙君顶, 赵珊.图像低层特征提取与检索技术[M].北京:电子工业出版社, 2009.

[4]周明全, 耿国华.基于内容的图像检索技术.[M].北京:清华大学出版社, 2007.

[5]Walter ten Brinke, David McG Squire, John Bigelow.The Meaningof an Image in Content-Based Image Retrieval.710-719.

[6]Esin Guldogan, Moncef Gabbouj.Feature selection for content-based image retrieval[J].SIViP.2008.2:241–250.DOI 10.1007/s11760-007-0049-9.

[7]Wei Huang, Yan Gao, Kap Luk Chan.A Review of Region-BasedImage Retrieval[J].2008.

[8]Swain M, Ballard D.Color indexing[J].International Journal ofComputer Vision, 1991, 7 (1) :11-32.

[9]G.Ciocca, R.Schettini, L.Cinque, Image indexing and retrievalusing spatial chromatic histograms and signatures, CGIV, 2002, pp.255–258.

基于图像内容特征的检索技术 篇7

从20世纪70年代起人们便开始了对图像检索领域的研究, 图像的检索经历了两个阶段:第一阶段是以关键字为基础的检索, 第二阶段是以图像自身的内容为基础的检索。

1 基于文本方式的检索方法

传统图像检索方式检是以文件系统进行的, 当用户查询一幅图像时, 要逐一打开文件进行浏览才能找到其目标图像。该方式始于20世纪70年代, 其一般处理方式就是对图像文件进行关键词或文本标题描述, 必要时再附加一些附加信息, 然后将图像的存贮路径和图像关键词或文本标题建立相应联系。

这种采用对图像建立关键词等文本描述信息的方式已越来越不适应网络信息检索的要求, 主要存在如下局限性: (1) 难以表达图像的空间关系; (2) 有一些图像很难用文字来确切地进行描述; (3) 当图像中包含多个物体时难以用简短的描述全面体现其意义; (4) 文本描述信息是非常主观的, 不同的人对同一幅图像数据可能有不同的理解, 因此当用户在查询时输入关键词和数据库中的关键词不一致或这些关键词根本就不存在时, 将导致查询的失败; (5) 由于媒体信息是发布在Internet网络环境中, 不同国家、不同民族很难用同一种语言对图像进行加注, 而且对图像语义理解的差异很大; (6) 对图像加注文本信息仍由人工完成, 随着图像数据来源日益广泛, 这种方法存在着工作量大, 费时费力, 而且检索界面不够灵活等问题; (7) 对大型图像数据库来说, 全部手工提供文本注释费用是相当昂贵的。

2 基于图像的内容检索方法

从80年代起, 经历90年代的发展, 多媒体技术取得了长足的进步, 尤其是以Internet为代表的分布式的信息发布方式, 使传统的文本方式受到了严重的挑战。为了突破文本检索方式的诸多弊端, 人们又转向研究图像中所包含的内客信息作为图像的索引, 对这方面的研究要归功于模式识别研究者, 其主要的方法是根据图像的颜色、纹理、图像对象的形状以及它们的空间关系等内容特征作为图像的索引, 计算查询图像和目标图像的相似距离。按相似度匹配进行检索, 其目的是试图解决图像数据库系统中手工建立文本标注信息的缺点。作为传统数据库检索的拓展, 基于内容的图像检索系统主要是根据图像的内容进行检索。

2.1 检索的内容特征主要包括:

颜色 (图像颜色的分布, 相互关系、组成等) 、纹理 (图像的纹理结构、方向、组合及对称关系等) 、形状 (图像的轮廓组成、形状、大小等) 、对象 (图像中子图像的关系、数量、属性、旋转等) 。

(1) 颜色检索。颜色具有一定的稳定性, 是基于内容相似性检索的首先特征。基于颜色特征的图像检索主要解决三个问题:颜色的表示、颜色特征的提取和基于颜色的相似度量。计算每一幅图像的颜色直方图, 即每一种颜色在图像像素点中的比例。作为图像的特征矢量加以保存。在查询时, 使用者只需要定义各种颜色之间的比例, 如 (75%) 的橄榄绿和 (25%) 的橘红色, 或者查询者给出一幅模板图像, 从中计算出该图像的颜色直方图。任何一种方式, 匹配过程都是返回直方图与模板颜色直方图最为接近的图像。基于颜色特征的检索方法主要有互补颜色空间直方图、直方图交叉法、直方图距离比较法、二次型距离算法等。颜色的检索一般应用于色彩较为丰富的自然图景的检索中。 (2) 纹理检索。纹理是图像中局部不规则而整体有规律的特性, 基于纹理的检索在区分有相似颜色的区域时是非常有用的 (比如天空和海洋, 树叶和草地) 。各种各样的技术已经被用来计算纹理的相似性, 使用最多的是基于图像的二阶统计量。通过选择点对的相对亮度, 计算出表征图像纹理的测度, 如对比度、粒度、方向性和规则性或者周期性、自由度。分析纹理的常用方法有基于传统数学模型的共生矩阵法、K-L变换、纹理谱分析等方法和近几年出现的基于视觉模型的多分辨率分析、小波方法等。由于难以描述, 对纹理的检索一般采用示例查询方法QBE (query by example) 方式, 也就是从样本集 (即一套预先存储的纹理图像) 中选择所要查询的纹理。使用纹理作为检索的特征, 一般是图像的内容较为丰富, 物体和背景不易分割的情况。 (3) 形状检索。形状是图像的一个显著特征, 而且由形状的特征来区别物体是非常直观的。对形状特征分析的基础是图像边缘的提取。基于形状的检索既包括传统意义上的基于二维形状的检索, 也包括在三维图像中的基于三维形状的检索。常用的形状检索方法主要有两种:针对图像边缘轮廓线进行的检索和针对图形矢量特征进行的检索。目前, 基于内容的图像检索系统较有影响力的有:IBM公司开发的第一个商品化的QBIC检索系统, EXCALIBUR技术公司开发的retrieval ware系统, virage公司开发的virage检索系统等。形状查询的方式包括使用模板图像或由查询者提供模板草图。

2.2 作为传统数据库检索的拓展, 基于内容的图像检索系统主要是根据图像的内容进行检索。

与传统的关系数据库图像系统相比, 主要具有以下一些特点: (1) 图像信息的描述和检索部不精确进行。传统的数据库中, 符号数据可以用基本数据类型精确地表示, 检索匹配是精确匹配。而图像数据是一段二进制数据流, 对图像进行像素和像素的精确匹配不科学。事实上人对两个图像的相似和不相似的判断是根据图像中所包含的内容, 很难将其精确描述, 因此内容的表达是近似的。这种判断与检索的不确定性正是当前信息检索的主要特征, 使信息检索由传统的刚性检索向柔性检索发展。 (2) 图像信息的描述不是唯一的。同一幅图像由于其应用领域和检索用户的差异, 其描述结果可能是完全不同的, 即图像信息内容依赖于其领域知识库。因而在图像描述中不仅要考虑到本领域的需求, 还应该考虑该描述可能的其它需求。随着识别技术的发展还可能采用更新或更好的表达方法。 (3) 检索结果的查准率较低。由于对内容描述的不精确, 因此检索得到的结果可能包含一些不相关的图像。这种情况对基于内容的检索是允许的, 但重要的一点是在检索中不要将相关的图像漏掉, 因而对较低的查准率是可以容忍的。 (4) 应具有很强的交互性。符号数据本身就具有语义信息, 在符号数据命名的过程中就赋予了特定的信息。图像中的内容本身不包含语义信息, 对图像的匹配主要是对图像中的内容特征进行相似匹配。即用户能够参与检索过程以获得用户所希望获取的图像, 用户查询时系统根据用户提供的待查询图像, 抽取必要的特征或者用户直接提供待查询图像的特征, 如指定一种色调或纹理、基本形状, 然后系统按照一定的原则, 在图像特征数据库中进行匹配搜索, 通常查询的结果是一系列图像, 按照相似的程度依次排列。由于语义特征难以提取, 因此基于语义特征的检索有待进一步进行研究。

3 基于内容的图像检索研究的发展趋势

20世纪90年代初, 人们的研究主要集中在图像的颜色、纹理特征和一些简单的形状特征的提取技术上。近年来, 研究图像检索的重点和难点仍然集中在如何使得抽取的低层特征和图像内容所表示的语义特征之间建立良好的联系。由于所拥有的特征并不能很好体现图像真正的语义信息, 以至于检索的结果往往不能令人满意。

图像检索技术的日益成熟不仅将创造出巨大的社会价值, 而且将改变人们的生活方式。因为它与传统数据库技术相结合, 可以方便地实现海量多媒体数据的存储和管理;与传统web搜索引擎技术相结合, 它可以用来检索HTML网页中丰富的多媒体信息。另外, 引入了用户的相关反馈技术来改善用户的查询质量, 使得查询的结果更加贴近用户的需求;近几年, 本领域的研究则逐渐走向更接近人类心理学和人类视觉特点的研究技术, 提出了基于区域、目标物体的分析方法。

在可预见的将来, 图像检索将会在以下领域中得到广泛应用:多媒体数据库、知识产权保护、数字图书馆、网络多媒体搜索引擎、交互电视、远程教育、远程医疗、远程购物、多媒体编辑、遥感和地球资源管理、天气预报以及军事指挥系统、建筑学中的工程图纸识别、商业领域中的注册商标等等方面。

摘要:介绍了基于文本方式的检索方法及其基于图像内容的检索方法。指出了其不足之处, 并对图像检索技术的前景进行了展望。

关键词:文本方式,图像检索,内容检索

参考文献

[1]刘伟成, 孙吉红.基于内容的图像信息检索综述[J].情报科学, 2002 (4) .

[2]王文惠, 周民柱, 万建伟.基于内容的图像检索技术的研究和发展[J].计算机工程与应用, 2001 (5) .

[3]毛力, 张晓林.基于颜色内容的图像检索原理与方法[J].情报科学, 2000 (6) .

上一篇:跟踪模块下一篇:公有经济