检索特征

2025-02-13|版权声明|我要投稿

检索特征(共9篇)

检索特征 篇1

1 概述

基于内容的图像检索,也被称之为图像收索技术,它是计算机视觉技术应用在大容量的图像数据库中,解决数字图像检索的匹配问题。所谓基于内容是指图像检索系统分析的图像本身的内部数据,而不是关键词,标签和图像相关的说明。图形的内容包括颜色,形状,

纹理或任何可以直接从图片本身上提取出的信息。基于以上内容,用图片本身信息来检索图片,可以提供更好的检索服务和更准确检索结果[1]。

2 设计过程

2.1 颜色特征提取

颜色特征提取,直方图距离为查询图像的第一图像的数据库计算即贡献分量单独计算。现在之间的欧氏距离查询图像和图像中的第一个数据库的计算。这欧几里德距离是存放在一个数组。该程序重复其余图像在数据库中通过存储各自的价值。现在数组排序升序和第一8最接近的匹配项显示。

在颜色特征提取方方面,分别计算要查询图像和在数据库中图像的颜色直方图,用来统计统计RGB分量之间的距离。就是这样计算查询图像和在数据库中的匹配图像之间的欧几里德距离的。然后把计算所得的欧几里德距离被存储在一个数组中。计算在图像数据库中的其他图像平且存储它们各自的值。对得出的数据进行升序排列,显示前8个最接近的匹配图像。

2.2 纹理特征提取

在纹理特征提取,对数据库中的所有图像和待检索的图像,提取出它的灰度纹理特征向量[3]。共生矩阵这种技术,不仅可以显示图像强度值也可以显示出强度的分布图。纹理特征检索选择的参数有能量,对比度,熵,逆差额,转动惯量,均值,灰度方差,灰度偏离值,分布均匀程度,局部图像的稳性和均匀性。

计算待查询图像和图像数据库中的第一幅图像之间的欧几里德距离,并把该欧几里德距离被存储在数组中。重复这个过程,直到把剩余所有图像的欧几里德距离都计算出来,并且存储它们各自的到一个数组中。然后把这个数组中的值按照排升序排列,把前8个最接近的匹配图像显示出来。

2.3 联合特征提取[6]

联合特征提取提需要先把在图像数据库中第一图像和查询图像的直方图的距离计算出来。然后同样在数据库中的第一图像和待查询图像之间的欧几里德距离也计算出来,并且把欧几里德距离存储在一个数组中。重复该过程,直到数据库中的所有图像都得到了遍历,而且把所有得到的距离结果存储到一个数组中。

使用的灰度共生矩阵提取出纹理特征向量,为在数据库中的第一图像和待查图像提取纹理特征向量。待查询图像和数据库之中的第一副图像之间的欧几里德距离的计算就可以计算出来了。并且把这个计算出来的欧几里德距离被存储到一个数组中。重复进行这个过程,直到数据库中的所有图像都得到遍历,并且存下他们的欧几里得距离到同一个数组中。

以上存储的数组是为了进一步的运算的。进一步比较数组中存放的欧几里得距离。上述计算阵列之间的欧几里得距离的计算方法。按升序排序,并且前8个显示最接近的匹配。

3 算法

3.1 颜色特征的提取算法

1)把查询图像被输入到系统中。

2)用颜色直方图的方法,然后计算查询图像的直方图距离。

3)用同样的方法,计算在数据库中的第一图像的直方图距离。

4)计算查询图像和数据库中的第一幅图像之间的欧几里德距离。数据库中使用的颜色特征提取图像。

5)存储阵列中的“欧几里德距离”。

6)计算数据库中的下一图像的直方图的距离。

7)重复步骤4,5和6,直到数据库中的所有图像得到遍历。

8)把所有的数组中的的欧氏距离,按升序摆列。

9)显示8个最接近的匹配结果。

3.2 纹理特征的提取算法

1)把待查询图像被输入到系统中。

2)用灰度共生矩阵的方法,计算查询图像的纹理特征向量,并把结果存在一个数组中。

3)用上述的方法,计算图像数据库中的第一幅图像的纹理特征向量,并把结果存在一个数组中。

4)计算查询图像和在数据库中的第一幅图像之间的欧几里德距离。

5)把这个结果存储在一个数组中。

6)用灰度共生矩阵的方法,计算出图像数据库中下一幅图像的纹理特征向量,并将其存储在数组中。

7)重复步骤4,5和6,直到数据库中的所有图像得到遍历。

8)把所有的数组中的的欧氏距离,按升序摆列。

9)显示8个最接近的匹配结果。

3.3 联合特征的提取算法(颜色特征和纹理特征)

1)把待查询图像被输入到系统中。

2)用颜色直方图的方法,然后计算查询图像的直方图距离。

3)用同样的方法,计算在数据库中的第一图像的直方图距离。

4)计算查询图像和数据库中的第一幅图像之间的欧几里德距离。

5)把这个结果存储在一个数组中。

6)用同样的方法,计算在数据库中的第一图像的直方图距离。

7)重复步骤4,5和6,直到数据库中的所有图像得到遍历。

8)所有的数组中的的欧氏距离,按升序摆列。

9)用灰度共生矩阵的方法,计算查询图像的纹理特征向量,并把结果存在一个数组中。

10)用灰度共生矩阵的方法,计算出图像数据库中下一幅图像的纹理特征向量,并将其存储在数组中。

11)计算查询图像和在数据库中的第一幅图像之间的欧几里德距离。

12)把这个结果存储在另一个数组中。

13)重复步骤11,12和13,直到遍历了所有的图像数据库中的所有图像。

14)把所有的数组中的的欧氏距离,按升序摆列。

15)计算存储图像直方图数组和纹理特征向量数组之间的欧几里德距离。

16)综合以上结果,可以得到一个有效的搜索检索结果。同时显示8个最接近的匹配结果。

4 结论

4.1 颜色直方图的方法

下面的出的检索结果是用提取颜色特征的方法得到的。

4.2 纹理特征的方法

以下是基于纹理检索的结果

4.2 联合特征的方法

以下是基于联合检索的结果

5 结论

颜色特征,纹理特征和联合特征是通过本文以上提到的各种发。颜色特征的提取是通过颜色直方图的方法来实现。

对于纹理特征使用了11项的属性,其中包括能量,对比度,熵,逆差法,平均值发,方差,分布均匀度,转动惯量,偏离度,局部平稳性,均匀性。这些属性的综合应用提高了纹理特征检索效果。

联合特征的提取是通过提取颜色和纹理特征,得到的一个综合检索。检索的图像适合于各种的图片格式,特征提取是实现项目的保证。

6 结束语

基于内容的图像检索系统,可以运用于许多方面。在技术领域是会有不断的新的发展。下面将简要呈现图像检索系统。

该系统具有图像旋转不变性。也就是说,这个系统应进一步提高旋转了的图像和没有角点匹配的图像。适用于所有的图像格式和接受不同程度的图像缩放。对于图像的形状特征也可以被认为是作为一个有用的图像特征矢量。该系统可以进一步提高效率,在数据库搜索时,查询图像的用户可以自己选择所需的特征向量或一些特征向量的组合。

摘要:基于内容的图像检索是指在大型图像数据库中寻找相匹配的数字图像的一门机器视觉技术。在该文中用到的基于内容的图像检索技术是建立在图像内容上的提取上的,通过提供更好的索引来达到更准确的检索结果。该文提到的图像检索的内容是指颜色特征,纹理特征和这俩个特征的综合应用。相比较单特征,联合特征可以返回更加优秀的和更加准确的检索结果。

关键词:颜色直方图,联合特征,欧氏距离,灰度共生矩阵

参考文献

[1]Woo Chaw Seng,Seyed Hadi Mirisaee.A Content-Based Retrieval System for Blood Cells Images[C].International Conference on FutureComputer and Communication,icfcc,2009:412-415.

[2]Mohammad Reza Zare,Raja Noor Ainon,Woo Chaw Seng.Content-Based Image Retrieval for Blood Cells[C].Third Asia International Con ference on Modelling&Simulation,ams,2009:332-335.

[3]Fan-Hui Kong.Image Retrieval Using Both Color AndTexture Features[C].Department of Information Science&Technology,HeilongjiangProceedings of the EighthInternational Conference on Machine Learning andCybernetics,Baoding,12-15 July 2009.

[4]Xiangbin Wang,Junmin He,Zhongwei Lv.Texture-based Retrieval of Thyroid Gland SPECT Image[D].School of Life Science and Technolo gy Tongji University,978-1-4244-4134-1/09/$25.00 2009 IEEE.

[5]Subrahmanyam Murala,Anil Balaji Gonde R.P.Maheshwari.Color and Texture Features for Image Indexing and Retrieval[C].Department ofElectrical Engineering,Indian Institute of Technology Roorkee,Uttarakhand,India,IEEE International Advance Computing Conference,2009.

[6]Wei Wang,Motoyuki Suzuki.Texture Retrieval Based on Gray-Primitive Cooccurrence Matrix[Z].Dept InfoScience&Intelligent SystemsFaculty Engineering,The University of kushima,Tokushima,Japan,978-1-4244-6899-7/10/$26.00 2010 IEEE.

[7]孙君项,赵珊.图像低层特征提取与检索技术[M].北京:电子工业出版社,2O09.

[8]张华伟,孙劲光.基于颜色与形状图像检索的研究[J].计算机仿真,2009,26(11).

[9]Guo ZH,Zhang L,Zhang D.Rotation invariant texture classification using LBP variance(LBPV)with global matching,2010,43(3):706-719.

[10]Woo Chaw Seng,Seyed Hadi Mirisaee.A Content-Based Retrieval System for Blood Cells Images[C].International Conference on FutureComputer and Communication,icfcc,2009:412-415.

检索特征 篇2

(2)正确选择各种算符,如逻辑算符,位置算符,截词符,字段限定符等,编制合理的计算机检索式。

(3)分析学科范畴,以便确定所要检索的学科领域,提高查全率。

(4)确定检索年代、文献类型

(5)选择检索方法(常用法、追溯法和循环法)

常用法:顺查法(顺着时间的推移由远及近的查找)

倒查法(由近及远的往前追溯查找)

抽查法(根据学科发展的时代背景,发展的高峰期查找)

追溯法:参考文献法(根据所附参考文献的出处追溯检索)

科学引文法(通过被引用作者查找引用作者的文献)

(6)确定检索的信息源(包括中外文数据库和网络资源等)

基于图像内容特征的检索技术 篇3

从20世纪70年代起人们便开始了对图像检索领域的研究, 图像的检索经历了两个阶段:第一阶段是以关键字为基础的检索, 第二阶段是以图像自身的内容为基础的检索。

1 基于文本方式的检索方法

传统图像检索方式检是以文件系统进行的, 当用户查询一幅图像时, 要逐一打开文件进行浏览才能找到其目标图像。该方式始于20世纪70年代, 其一般处理方式就是对图像文件进行关键词或文本标题描述, 必要时再附加一些附加信息, 然后将图像的存贮路径和图像关键词或文本标题建立相应联系。

这种采用对图像建立关键词等文本描述信息的方式已越来越不适应网络信息检索的要求, 主要存在如下局限性: (1) 难以表达图像的空间关系; (2) 有一些图像很难用文字来确切地进行描述; (3) 当图像中包含多个物体时难以用简短的描述全面体现其意义; (4) 文本描述信息是非常主观的, 不同的人对同一幅图像数据可能有不同的理解, 因此当用户在查询时输入关键词和数据库中的关键词不一致或这些关键词根本就不存在时, 将导致查询的失败; (5) 由于媒体信息是发布在Internet网络环境中, 不同国家、不同民族很难用同一种语言对图像进行加注, 而且对图像语义理解的差异很大; (6) 对图像加注文本信息仍由人工完成, 随着图像数据来源日益广泛, 这种方法存在着工作量大, 费时费力, 而且检索界面不够灵活等问题; (7) 对大型图像数据库来说, 全部手工提供文本注释费用是相当昂贵的。

2 基于图像的内容检索方法

从80年代起, 经历90年代的发展, 多媒体技术取得了长足的进步, 尤其是以Internet为代表的分布式的信息发布方式, 使传统的文本方式受到了严重的挑战。为了突破文本检索方式的诸多弊端, 人们又转向研究图像中所包含的内客信息作为图像的索引, 对这方面的研究要归功于模式识别研究者, 其主要的方法是根据图像的颜色、纹理、图像对象的形状以及它们的空间关系等内容特征作为图像的索引, 计算查询图像和目标图像的相似距离。按相似度匹配进行检索, 其目的是试图解决图像数据库系统中手工建立文本标注信息的缺点。作为传统数据库检索的拓展, 基于内容的图像检索系统主要是根据图像的内容进行检索。

2.1 检索的内容特征主要包括:

颜色 (图像颜色的分布, 相互关系、组成等) 、纹理 (图像的纹理结构、方向、组合及对称关系等) 、形状 (图像的轮廓组成、形状、大小等) 、对象 (图像中子图像的关系、数量、属性、旋转等) 。

(1) 颜色检索。颜色具有一定的稳定性, 是基于内容相似性检索的首先特征。基于颜色特征的图像检索主要解决三个问题:颜色的表示、颜色特征的提取和基于颜色的相似度量。计算每一幅图像的颜色直方图, 即每一种颜色在图像像素点中的比例。作为图像的特征矢量加以保存。在查询时, 使用者只需要定义各种颜色之间的比例, 如 (75%) 的橄榄绿和 (25%) 的橘红色, 或者查询者给出一幅模板图像, 从中计算出该图像的颜色直方图。任何一种方式, 匹配过程都是返回直方图与模板颜色直方图最为接近的图像。基于颜色特征的检索方法主要有互补颜色空间直方图、直方图交叉法、直方图距离比较法、二次型距离算法等。颜色的检索一般应用于色彩较为丰富的自然图景的检索中。 (2) 纹理检索。纹理是图像中局部不规则而整体有规律的特性, 基于纹理的检索在区分有相似颜色的区域时是非常有用的 (比如天空和海洋, 树叶和草地) 。各种各样的技术已经被用来计算纹理的相似性, 使用最多的是基于图像的二阶统计量。通过选择点对的相对亮度, 计算出表征图像纹理的测度, 如对比度、粒度、方向性和规则性或者周期性、自由度。分析纹理的常用方法有基于传统数学模型的共生矩阵法、K-L变换、纹理谱分析等方法和近几年出现的基于视觉模型的多分辨率分析、小波方法等。由于难以描述, 对纹理的检索一般采用示例查询方法QBE (query by example) 方式, 也就是从样本集 (即一套预先存储的纹理图像) 中选择所要查询的纹理。使用纹理作为检索的特征, 一般是图像的内容较为丰富, 物体和背景不易分割的情况。 (3) 形状检索。形状是图像的一个显著特征, 而且由形状的特征来区别物体是非常直观的。对形状特征分析的基础是图像边缘的提取。基于形状的检索既包括传统意义上的基于二维形状的检索, 也包括在三维图像中的基于三维形状的检索。常用的形状检索方法主要有两种:针对图像边缘轮廓线进行的检索和针对图形矢量特征进行的检索。目前, 基于内容的图像检索系统较有影响力的有:IBM公司开发的第一个商品化的QBIC检索系统, EXCALIBUR技术公司开发的retrieval ware系统, virage公司开发的virage检索系统等。形状查询的方式包括使用模板图像或由查询者提供模板草图。

2.2 作为传统数据库检索的拓展, 基于内容的图像检索系统主要是根据图像的内容进行检索。

与传统的关系数据库图像系统相比, 主要具有以下一些特点: (1) 图像信息的描述和检索部不精确进行。传统的数据库中, 符号数据可以用基本数据类型精确地表示, 检索匹配是精确匹配。而图像数据是一段二进制数据流, 对图像进行像素和像素的精确匹配不科学。事实上人对两个图像的相似和不相似的判断是根据图像中所包含的内容, 很难将其精确描述, 因此内容的表达是近似的。这种判断与检索的不确定性正是当前信息检索的主要特征, 使信息检索由传统的刚性检索向柔性检索发展。 (2) 图像信息的描述不是唯一的。同一幅图像由于其应用领域和检索用户的差异, 其描述结果可能是完全不同的, 即图像信息内容依赖于其领域知识库。因而在图像描述中不仅要考虑到本领域的需求, 还应该考虑该描述可能的其它需求。随着识别技术的发展还可能采用更新或更好的表达方法。 (3) 检索结果的查准率较低。由于对内容描述的不精确, 因此检索得到的结果可能包含一些不相关的图像。这种情况对基于内容的检索是允许的, 但重要的一点是在检索中不要将相关的图像漏掉, 因而对较低的查准率是可以容忍的。 (4) 应具有很强的交互性。符号数据本身就具有语义信息, 在符号数据命名的过程中就赋予了特定的信息。图像中的内容本身不包含语义信息, 对图像的匹配主要是对图像中的内容特征进行相似匹配。即用户能够参与检索过程以获得用户所希望获取的图像, 用户查询时系统根据用户提供的待查询图像, 抽取必要的特征或者用户直接提供待查询图像的特征, 如指定一种色调或纹理、基本形状, 然后系统按照一定的原则, 在图像特征数据库中进行匹配搜索, 通常查询的结果是一系列图像, 按照相似的程度依次排列。由于语义特征难以提取, 因此基于语义特征的检索有待进一步进行研究。

3 基于内容的图像检索研究的发展趋势

20世纪90年代初, 人们的研究主要集中在图像的颜色、纹理特征和一些简单的形状特征的提取技术上。近年来, 研究图像检索的重点和难点仍然集中在如何使得抽取的低层特征和图像内容所表示的语义特征之间建立良好的联系。由于所拥有的特征并不能很好体现图像真正的语义信息, 以至于检索的结果往往不能令人满意。

图像检索技术的日益成熟不仅将创造出巨大的社会价值, 而且将改变人们的生活方式。因为它与传统数据库技术相结合, 可以方便地实现海量多媒体数据的存储和管理;与传统web搜索引擎技术相结合, 它可以用来检索HTML网页中丰富的多媒体信息。另外, 引入了用户的相关反馈技术来改善用户的查询质量, 使得查询的结果更加贴近用户的需求;近几年, 本领域的研究则逐渐走向更接近人类心理学和人类视觉特点的研究技术, 提出了基于区域、目标物体的分析方法。

在可预见的将来, 图像检索将会在以下领域中得到广泛应用:多媒体数据库、知识产权保护、数字图书馆、网络多媒体搜索引擎、交互电视、远程教育、远程医疗、远程购物、多媒体编辑、遥感和地球资源管理、天气预报以及军事指挥系统、建筑学中的工程图纸识别、商业领域中的注册商标等等方面。

摘要:介绍了基于文本方式的检索方法及其基于图像内容的检索方法。指出了其不足之处, 并对图像检索技术的前景进行了展望。

关键词:文本方式,图像检索,内容检索

参考文献

[1]刘伟成, 孙吉红.基于内容的图像信息检索综述[J].情报科学, 2002 (4) .

[2]王文惠, 周民柱, 万建伟.基于内容的图像检索技术的研究和发展[J].计算机工程与应用, 2001 (5) .

[3]毛力, 张晓林.基于颜色内容的图像检索原理与方法[J].情报科学, 2000 (6) .

检索特征 篇4

学号学号学号学号::::XXXXXXXXXXXXXXXXXXXX

班级班级班级班级::::XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

摘要摘要摘要摘要::::文章主要研究了信息检索的重要性,信息检索的含义和要素,以及常见的信息检索方法的介绍和信息检索过程中应当注意的问题以及解决方法这几个方面,采用有文献法、个案法、统计法、比较法、行动研究法、调查法和经验总结法等研究方法,来阐述信息检索及其应用。详细全面的介绍,可以让部分不了解信息检索的人能通俗易懂的了解并应用一些常见的信息检索工具。从事实和实际出发,有力的论证了信息检索的重要性以及它的实用性。

关键字关键字关键字关键字::::信息;检索;信息检索;事实检索;检索语言;文献语言

通过学习信息检索这门课,我学会了如何利用web这个庞大的资源库快速便捷地找到自己所需要的信息。信息检索与应用涉及的领域广阔,从中文数据库搜索的介绍到外文数据库搜索的介绍,在这个快速发展的21世纪,各种信息数据在不断的增加,怎样更快速便捷的查找到我们需要的信息,显得日益重要。我们为什么要进行信息检索呢?通过什么方法进行快速的检索来应用检索显得日益重要。我们为什么要进行信息检索呢?一方面,信息检索是获取知识的捷径。美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。另一方面,信息检索是科学研究的向导。美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。此外,信息检索还是终身教育的基础。学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能力、表达能力和组织管理能力。UNESCO提出,教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求

那么,什么是信息检索呢?通过“百度”搜索引擎可以得到解释是:“:信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。总的来说,信息检索就是用一定的方式找到用户所需要的信息(此处通过百度查询信息检索的定义也是一种方法)”。常用的信息检索手段包括(1)手工检索(2)光盘检索(3)联机检索(4)网络检索。信息检索的四个要素是什么呢? 信息检索的前题----信息意识

所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。信息意识含有信息认知、信息情感和信息行为倾向三个层面。信息素养(素质)(Information Literacy)一词最早是由美国信息产业协会主席Paul Zurkowski在1974年给美国政府的报告中提出来的。他认为:信息素质是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。

信息检索的基础----信息源(信息的来源)

信息源的构成 :按文献载体分----印刷型、缩微型、机读型、声像型 ;按文献内容和加工程度分--一次信息、二次信息、三次信息 ;按出版形式分----图书、报刊、研究报告、会议信息、专利信 息、统计数据、政府出版物、档案、学位论文、标准信息(它们被认为是十大信息源,其中后8种被称为特种文献。教育信息资源主要分布在教育类图书、专业期刊、学位论文等不同类型的出版物中)

信息检索的核心----信息获取能力

能力要求:(1)了解各种信息来源(2)掌握检索语言(3)熟练使用检索工具(4)能对检索效果进行判断和评价。判断检索效果的两个指标:查全率=被检出相关信息量/相关信息总量(%); 查准率=被检出相关信息量/被检出信息总量(%)

信息检索的关键:信息利用 社会进步的过程就是一个知识不断的生产—流通—再生产的过程。为了全面、有效地利用现有知识和信息,在学习、科学研究和生活过程中,信息检索的时间比例逐渐增高。获取学术信息的最终目的是通过对所得信息的整理、分析、归纳和总结,根据自己学习、研究过程中的思考和思路,将各种信息进行重组,创造出新的知识和信息,从而达到信息激活和增值的目的。

通过上面对信息检索各个要点的详细阐述,让我们对信息检索有了全面的认识。然而,在现实的生活中,我们可以通过那些工具的检索来帮助我们去得到我们想要的东西呢?例如,我是学习会计电算化专业的,这是一门与经济活动计算与研究紧密结合的学科。要学好,就必须借助网络这个信息平台,查找更多的专业资料。首先我们平时习惯用百度或Google等这些门户网站搜索。此外若要查找专业论文,像万方数据库(偏于理科)、中国期刊网(偏于文科)、重庆维普等这些专业网站会更实用。普遍的有万方数据库(偏于理科)、中国期刊网(偏于文科)、重庆维普等。这些网站提供的都是一些很前沿而且都是经过发表的学术类文章,能够为我们提供很好的信息服务。但这些网站的一般都是要付费的,需要注册登录才能下载相关文章,一般大学图书馆都会每年购买这些网站,为我们的学习研究带来很多方便。下面我详细的介绍一些有关这些专业性的检索网站的一些搜索方法。如果想查找一些中文的期刊资料,可以通过重庆维普中国科技期刊数据库,CNKI中国知网,万方数据库等 重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型的专业化数据公司,是中文期刊数据库建设事业的奠基人。自1989年以来,一直致力于期刊等信息资源的深层次开发和推广应用,集数据采集、数据加工、光盘制作发行和网上信息服务于一体;收录有中文期刊8000种,中文报纸1000种,外文期刊4000种,拥有固定客户2000余家。目前已成为推动我国数字图书馆建设的坚强支柱之一。在以上的数据库中,最为常用也最受大家欢迎的是《中文科技期刊数据库》。《中文科技期刊数据库》还是目前世界最大的连续动态更新的中文期刊全文数据库,积累全文文献728多万篇,分七大专辑:自然科学专辑、农业科学专辑、医药卫生专辑、教育科学专辑、经济管理专辑、图书情报专辑、工程技术专辑 中国知识资源总库(CNKI)《中国知识资源总库》囊括了自然科学、人文社会科学及工程技术各领域知识,拥有期刊、报纸、博硕士培养单位的博士和优秀硕士学位论文、全国重要会议论文、中小学多媒体教辅以及1000多个加盟数据库。主要包括《中国期刊全文数据库(CJFD)》、《中国优秀博硕士学位论文全文数据库(CDMD)、《中国重要报纸全文数据库(CCND)》、《中国企业知识仓库(CEKD)》《中国图书全文数据库》《中国年鉴数据库》《各行业百科数据库》《声像资料数据库 》《《保持共产党员先进性教育》专题数据库》等。万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,覆盖范围:自然科学、数理化、天文、地球、生物、医药、卫生、工业技术、航空、环境、社会科学、人文地理等各学科领域。常见外文期刊有spinger外文期刊、等搜索网站。spinger外文期刊全文数据库收录了近500种学术期刊,内容涉及数学、物理和天文学、化学、医学、生命科学、工程技术、计算机科学、环境科学、地理及经济、法律等学科 EBSCOhost 全文数据库包括:学术期刊集成全文数据库(Academic Search Premier,简称ASP)和商业资源集成全文数据库(Business Source Premier,简称BSP)等九个数据库 对于外文不好的人,可以通过有道搜索引擎下载一个有道词典。有道词典有强大的中外文互译和对照功能。一般的数据库文件,采用的是CAJ和PDF格式,必须下载专门的CAJ和PDF浏览器才可以阅读。常见的数据库有分类检索、初级检索、高级检索和专业检索四种方式。在每种方式的检索结果(包括二次检索的检索结果)里都可以进行二次检索,可以无数次的进行,逐步缩小检索范围,直至检索结果为零。参考文献

[1]【书 名】《信息检索》

【出 版 社】武汉大学出版社 【作 者】黄如花

【开 本】32

【出版日期】2010-05-01 [2]【书 名】《搜索引擎:信息检索实践

【出 版 社】机械工业出版社

【作 者】刘挺

【开 本】32 【出版日期】2010-06-01 【[4]【书 名】《普通高等教育“十二五”规划教材•信息检索与利用》

【出 版 社】科学出版社

【作 者】邓发云、杨忠、吕先竞

【开 本】32

基于尺度不变特征变换的图像检索 篇5

基于内容的图像检索(CBIR)是计算机视觉在图像检索中的一个重要应用。常见的基于内容的检索利用全局内容特征,例如颜色、纹理以及形状中的一种或多种特征来进行图像的检索。这种检索往往忽略了图像内容的局部细节部分,而不能达到很好的检索性能。基于局部特征的检索是通过提取图片中的一些关键点,并通过这些点的相似度来决定两幅图片的相似度。局部特征已经被普遍应用于图像检索中[1,2,3]。因为它们不仅容易计算,具有一定的图像变换不变性,而且对于部分被遮挡的物体也能较好地识别。

1 SIFT描述子构造

SIFT是一种对尺度、旋转、仿射以及亮度变化都有很好的不变性的特征[4,5,6]。SIFT的提出是为了解决Harris的角点检测不具有尺度不变性的问题。 SIFT特征描述子的生成主要包括极值点检测、关键点定位、关键点梯度方向计算以及SIFT描述子4个步骤。

1.1 极值点检测

第一步是在尺度空间上检测极值点。SIFT中使用的是高斯核差分的尺度空间,它近似于归一化的拉普拉斯尺度空间。对于要处理的图片,SIFT先用不同的核对其进行高斯平滑。I(x,y)表示原图,G(x,y,σ)为高斯变换,L(x,y,σ)则为原图经过高斯变换后的图片。如下式:

L(x,y,σ)=G(x,y,σ)*I(x,y)。 (1)

相邻尺度的高斯平面相减后,得到不同尺度的高斯核差分(DoG)的尺度空间。在DoG尺度空间上进行的极值点检测能使SIFT特征具有较好的尺度不变性。DoG可直接通过相邻尺度的高斯面相减而得到。如图1中,左边的是经过不同高斯平滑后的高斯平面,右边是相邻尺度的高斯面相减后得到的高斯差分面(DoG)。计算出高斯差分平面之后,对于其上的某一点,将它与周围的8近邻点以及上下相邻尺度的对应位置的9近邻点(共26个点)进行比较,若该点都大于或都小于这26个点,那么这个点将被选取为极值点。

1.2 关键点准确定位

DoG空间中选取出来的极值点是灰度变化的极值点,包含着图片的结构信息。但这些点还需要进一步的处理,去掉低对比度的点,因为低对比度的点对噪音比较敏感。首先,对DoG尺度空间函数D(x,y,σ)进行Taylor展开;其次,将检测到的极值点x^代入到Taylor展开式中,当算得的绝对值小于某个阈值(0.03)时,则这个点对比度较低,将被舍弃。

由于DoG对边缘有很强的响应,因此检测到的边缘点也要去掉。DoG在沿着边缘方向上的主曲率值会很大,而在与边缘方向垂直方向的主曲率值会较小。令α为沿着边缘方向的主曲率,β为与边缘垂直方向的主曲率。α=γβ,则当γ大于某个阈值(10)时,则作为边缘点舍弃。

过滤掉对比度低的点及边缘的点后,剩下的点即为关键点。由于关键点分布在不同尺度空间的不同位置上,这样可保证SIFT的尺度缩放不变性。

1.3 关键点梯度方向计算

在确定关键点后,为了保证特征的旋转不变性,SIFT通过关键点周围区域的梯度方向分布来表示关键点的方向。在尺度空间的高斯图片L( x,y,σ)中,关键点 ( x,y ) 周围区域的梯度模值m( x,y )和方向θ( x, y )如下:

m(x,y)=(L(x+1,y)-L(x-1,y))2+(L(x,y+1)-L(x,y-1)2,θ(x,y)=tan-1((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)))

然后对关键点周围区域的梯度方向进行直方图统计,以每10°为一个桶,平面上360°角可分为36个桶。根据梯度方向值将其关联到对应的桶中,权值由该梯度的模值大小来确定。SIFT用以关键点为圆心的高斯加权窗口来对梯度模值进行加权。

对梯度方向的直方图统计后,每个关键点的方向被定义为它的梯度方向的直方图统计中最大值的方向以及大小在最大值的80%以内的方向。

1.4 SIFT特征描述子构造

前面的步骤确定了关键点的尺度、位置以及方向,保证了其尺度缩放不变性及旋转不变性。关键点的检测已完成,现在将构造SIFT的特征描述子。SIFT特征是以它周围区域的像素点的梯度来表示。

梯度模值和方向的计算与第3步中计算关键点方向时的梯度计算的方式类似,只是这里选取的桶个数是8。对于以关键点为中心的周围区域16*16的像素点,计算其梯度方向和模值大小,然后以4*4的区域为单位进行方向的直方图统计。于是,原来的16*16区域的像素点被划分成4*4个4*4的小区域,每个小区域由对应的8个方向的梯度模值表示。因此,最终特征向量为:4*4*8 = 128维的。这便是SIFT的特征描述子。

为了保证SIFT特征对亮度变化的不变性,还需要对提取出来的特征向量进行归一化。这样,便得到了一个对于尺度缩放、旋转和亮度变换等具有不变性的特征——SIFT特征。

2 基于SIFT相关特征的图像检索

SIFT特征计算的简单性,对于尺度,旋转等变换具有很好的不变性,使它被广泛应用到图像检索中[7,8,9]。基于SIFT特征的图像检索的QBE过程,实际上是一种特征提取以及特征匹配的过程。它包含2个步骤:特征的提取跟特征相似度的计算。

2.1 特征提取

SIFT特征的提取包括2个阶段:离线的操作和在线的操作。对于庞大的图片集,先离线提取它们的SIFT特征存到数据库中,作为图像检索时的检索数据使用。在线图像检索时,对用户给出的检索图片提取SIFT特征后,与数据集中的特征进行匹配。然后,根据图片匹配的点数进行降序排序,匹配数目越多说明图片越相似。于是,图片的匹配转换成了图片中关键点特征的匹配。

将SIFT特征的提取分成离线和在线2个阶段是很有意义的,因为耗时的SIFT对于在线检索的实时性是很不利的。而如果先离线提取大量图像的SIFT特征,在线检索时只需要处理一幅图片的特征提取以及相似特征的检索及匹配问题。这样能很大地提高检索速度。

2.2 特征相似度计算

对于提取后的SIFT特征,检索过程要计算示例图片的特征向量与数据集中的特征向量的相似性。对于特征空间中的点,2点间相似度度量有2种常用的方法:一种是直接计算点间的距离,距离越小,相似度越大,常用的方法有曼哈顿距离和欧氏距离;另一种是计算给定点的最近距离和次近距离,当它们的比值越小,相似度越大[10]。第2种方法相对而言更准确,因为若2个特征向量匹配时,则它们间的相似度应该远大于它们和其他点间的相似度。因此,文中对于示例图片中特征向量的相似特征的检索采用的是第2种方法。

3 实验结果分析

实验中将基于SIFT的检索应用于3种类型的图片集,主要是通过对不同类型的图片比较SIFT特征进行匹配的效果。图片集包含600幅图片,其中建筑物图、室内图以及商标的图片各200幅。3种图片集的选取出于这样的考虑:室内的图片是为了观察对于室内的物体多且杂乱时,SIFT特征的性能如何。对同一建筑物的不同视角,以此对比同一物体的SIFT特征匹配的效果。对于企业徽标进行的实验主要是讨论SIFT对于相似的抽象图案的匹配结果。表1给出了利用SIFT特征对3类数据集的检索结果。

实验结果总结SIFT特征的特点如下:首先,SIFT特征是一种具有尺度、旋转不变性的局部特征,它对于视角变化(±35°)的图片也能较好的匹配。其次,SIFT特征提取的特征数目与图片的具体内容以及图片的分辨率成正比。最后,SIFT特征很适合用于相似图案的检索,它对同一场景或同一物体不同大小或小视角变化的检索结果也较好。从实验结果中可以看到,SIFT特征仍有它的局限性:一是SIFT的特征向量维数太高,对于较大的图片SIFT特征提取的特征数目很大,使得匹配速度慢;二是SIFT特征仅依靠点来描述物体,对位置等全局信息包含得还不够。

4 结束语

SIFT特征是一种对尺度,旋转变换等具有较好的不变性的特征。它很好地描述了局部信息,因此它在计算机视觉相关的邻域有很好的应用。同时,它也有特征向量维度高、匹配时间开销大以及缺少对全局信息的描述,只适用于对同一物体的匹配的局限性。高维特征向量的问题,可以通过对SIFT特征进行降维减少时间开销,或者通过采用分布式计算,从而提高检索速度。缺少对全局信息的描述,可以把SIFT与其他不同的特征(如颜色、形状和位置信息等)结合起来,提高全局信息的检索精度。

参考文献

[1]SCHMID C,MOHR R.Local Grayvalue Invariants forImage Retrieval[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,1997,19(5):530-534.

[2]MIKOLAJCZYK K,SCHMID C.Indexing Based on ScaleInvariant Interest Points[C]//In Proc.of InternationalConference on Computer Vision,2001:525–531.

[3]KE Y,SUKTHANKAR R.Efficient Near duplicateDetection and Sub-image Retrieval[C]//InternationalMultimedia Conference Proc.of ACM,2004,60(2):869-876.

[4]MORTENSEN E N,DENG Hong-li,SHAPIRO L.A SIFTDescriptor with Global Context[C]//Computer Visionand Pattern Recognition,IEEE Computer SocietyConference,2005:184-190.

[5]EGENHOFER M.IEEE Symposium on Visual Languages[C]//IEEE Computer Society,1996:60-67.

[6]BRUNELLI R,MICH O.Image retrieval by examples[J].IEEE Trans.Multimedia,2000,2(3):164-171.

[7]EAKINS J P M,GRAHAM M E.Content-based ImageRetrieval:A Report to the JISC Technology ApplicationsProgramme[R].In:Institute for Image Data Research.University of Northumbria at Newcastle,Newcastle uponTyne,1999.

[8]汪道寅,胡访宇.基于改进SIFT算法的视频序列图像配准[J].无线电工程,2011,41(2):16-18.

[9]李向阳,庄越挺,潘云鹤.基于内容图像检索技术与系统[J].计算机研究与发展,2001,38(3):344-354.

基于形状特征的图像检索算法研究 篇6

基于形状的检索是基于内容检索的一个重要方面,它能使用户通过勾勒图像的形状,从图像库中检索出形状相似的图像。形状特征是图像目标的一个显著特征,并且对于图形来说,形状是它唯一重要的特征[1]。研究基于形状特征的图像检索对于多媒体数字图书馆、卫星遥感图像、医疗图像的分析和检索等有着重要的意义。

1 形状分析

1.1 形状特征

常用的形状特征有周长、形状参数、偏心率、长轴方向与弯曲能量等[2]。矩描述、综合光密度以及轮廓力矩也可以表示和描述图像形状[3]。

1.2 特征选择

好的特征应具有可区别性、可靠性、独立性,数量少4个特点[4]。通常来说,形状特征有两种表示方法,一种是轮廓特征,另一种是区域特征的。前者只用到物体的外边界,而后者则关系到整个形状区域。

2 一种新的基于形状的图像检索算法

2.1 算法分析

基于形状的检索更多地用于当用户粗略地画出一个轮廓进行检索的情况。这种轮廓可以是用户凭借脑子中的印象徒手画出来的,也可以是通过系统提供的基本绘图工具“拼凑”的。这两种情况都有一个特点,即提供的形状只是欲检索形状的粗略描述,它从大小、方向或整体结构上都可能与真正要查的图形有较大出入。因此,基于形状检索的难点在于寻找能够检索与大小、方向及扭曲伸缩无关的方法。

不变矩和轮廓力矩法具有良好的平移、旋转、尺度缩放不变性及抗干扰性。用图像的不变矩和轮廓力矩作为图像的形状特征索引,使用适当的相似性距离定义,计算出两幅图像的相似性距离,当距离足够小时,就认为两幅图像是相似的。傅里叶算法不仅对噪音具有很好的鲁棒性,而且对几何变换具有不变性,更加适合图像检索的需要。因此提出了不变矩和轮廓力矩法和傅里叶描述符结合的方法。

2.2 不变矩和轮廓力矩法(基于区域内)

二维数字化图像f(i,j)的p+q中心矩定义为

mpq=i=1Μj=1Νf(i,j)(i-i-)p(j-j-)q(p,q=0,1,2,,n)(1)

mpq具有平移不变性,但依然对旋转敏感。组合二阶和三阶中心矩,可得7个对平移和旋转不变的矩特征[5]。定义如下

M1=m20+m02;M2=(m20-m02)+4m112;M3=(m30-3m12)2+(3m21+m03)2;M4=(m30+m12)2+(m21+m03)2;M5=(m30-3m12)(m30+m12) [(m30+m12)2-3(m21+m03)2]2+(3m21-m03)(m21+m03)[3(m30+m12)2-(m21+m03)2];M6=(m20-m02)2[(m30+m12)2-(m21+m03)2]+4m11(m30+m12)(m21+m03);M7=(3m12-m30)(m30+m12[(m30+m12)2-3(m21+m03)2]+(3m21-m30)(m21+m03)[3(m03+m12)2-(m12+m03)2];

将矩特征量M1~M7和轮廓力矩M8=dm/dp合并,就形成了图像的全局形状特征向量,即

S={M1M1M2M3M4M5M6M7M8} (2)

mpq归一化,得到的μpq具有平移、旋转与尺度不变性。

2.3 傅里叶描述符(基于边界的形状特征)

对于边界而言,最重要的是组成边界的点的位置信息。将边界看作是直角坐标系下的点集构成的曲线y=f(x),其中x是横坐标,y是纵坐标。如果对y=f(x) 直接进行傅里叶变换,则变换结果将与x, y 的确切数值有关,不能满足平移,旋转等不变性要求。所以利用曲线本身的内禀参数构造曲线,再作傅里叶变换[6]。主要以曲线的弧长为参数,构造曲线的参数方程

(x(l),y(l))=z(l) (3)

其中l是曲线的弧长,0≤lL,L是曲线全长。

设曲线的初始点为l=0, θ(l)是曲线上弧长为的点的切线方向,定义φ(l)=θ(l)-θ(0),但φ(l)不是一个周期函数。令t=2πl/L,则t∈[0,2π]。定义

φ*(t)=φ(tl/2π)+t,t∈[0,2π] (4)

φ*(t)是[ 0,2π]上的周期函数。此时对r具有平移、旋转、尺度不变性。进行傅里叶变换

φ*(t)=a0+k=1+(akcoskt+bksinkt)(5)

其中,a0=12π02πφ*(t)dtan=12π02πφ*(t)cosntdtbn=12π02πφ*(t)sinntdt(n=1,2,)

定义lk=i=1kδl,得

a0=12π02πφ*(t)dt=1Lφ(λ)dλ+π=-π-1Lk=1mlk(φk-φk-1)(6)

an=2L02π[φ(t)+2πλL]cos2πλnLdλ=-1nπk=1m(φk-φk-1)sin2πnlkL(7)

bn=1nπk=1m(φk-φk-1)cos2πnlkL(8)

其中n=1,2,…。则区域边界r可用序列{a0,a1,b1,a2,b2,…}进行描述。

2.4 算法步骤

(1)计算被检索图像的形状特征,并从图像数据库中获取图像的形状特征索引;

(2)对特征向量进行归一化;

(3)用欧式距离计算归一化后的图像数据库中各图像与示例图像之间的相似性距离;

(4)按序输出检索结果。

3 实验结果分析

图像库中包括简单几何形状,其中星形、心形、圆形、新月形图像10幅。以图1的图像进行实验可以看出,算法对于图像的扭曲形变具有不变性,并对图像的基本形状特性具有鲁棒性,在具有一定形变干扰的情况下,仍得出较好的图像检索结果;且检索结果排列的顺序与人的主观视觉判断大致相同,检索精度较好。

4 结束语

文中提出了一种新的基于形状的图像检索方法,它实现了形状特征的全自动索引。此算法通过提取轮廓的7个不变矩和轮廓力矩,傅里叶描述符来描述图像特征,用图像特征向量的归一化欧氏距离表示图像的相似度,依据上述方法分别计算出待查图像和数据库图像对应分块的相似度,然后对这些相似度取平均值,用此均值来作为2幅图像的相似度。不仅减少了运算量,而且也减少了形状不相关信息对检索结果的不良影响。用星形的图像作为示例图像进行验证,实验结果表明:此方法简单、有效、匹配简单快速,具有一定的实用意义。

摘要:针对图像检索存在性能的不稳定性、相对平移、旋转和尺度变换等问题,提出了基于区域内形状特征的不变矩和轮廓力矩法和傅里叶描述符结合的方法。其中的不变矩和轮廓力矩法具有良好的平移、旋转、尺度缩放不变性及抗干扰性,傅里叶算法不仅对噪音具有很好的鲁棒性,而且对几何变换具有不变性,更加适合图像检索的需要。通过实验可知,该算法对于图像的扭曲形变具有不变性,在具有一定形变干扰的情况下,仍得出较好的图像检索结果;且检索结果排列的顺序与人的主观视觉判断大致相同,检索精度好。

关键词:图像检索,不变矩,轮廓力矩,相似度

参考文献

[1]黄勇,王崇骏,王亮,等.基于形状不变矩的图象检索算法的研究[J].计算机应用研究,2004(7):256-260.

[2]李弼程,彭波.智能图像处理技术[M].北京:电子工业出版社,2004.

[3]Bernier T,Landry J A.A New Method for Representing Matching Shapes of Natural Objects[J].Pattern Recog-nition,2003(36):1711-1723.

[4]边肇祺.模式识别[M].北京:清华大学出版社,1998.

[5]姚玉荣,章毓晋.利用小波和矩进行基于形状的图像检索[J].中国图像图形学报,2000,5(3):206-210.

基于颜色特征的图像检索技术研究 篇7

关键词:CBIR,颜色特征,主色矩阵

Key words:CBIR;color feature;dominant color matrix随着多媒体和网络技术的迅速发展,涌现出了大量的媒体信息。传统的图像检索技术是基于文本的图像检索,但随着图像信息量的几何级增长,其局限性也越来越明显:1)对图像加注文本信息由手工完成,随着图像数据来源日益广泛,这种方法显得费时费力;2)文本描述信息是非常主观的,不同的人对同一幅图像数据可能有不同的理解,因此当用户在查询时输入的关键词和数据库中的关键词不一致或这些关键词根本就不存在时,将导致查询的失败;3)区区几个关键词很难将图像所反映的内容描述清楚;4)由于媒体信息分布在网络环境中不同国家不同民族很难用同一种语言对图像进行加注标识而且对图像语义理解的差异很大

Internet,,。可见传统的基于文本的图像检索技术已经越来越无法满足人们的需要,迫切需要人们提出性能更加完善的图像检索技术来解决问题。因此,基于内容的图像检索技术应运而生。文章将基于颜色特征的图像检索作为文章的研究重点,是对图像检索技术的进一步学习与探讨将具有重要的学习意义和应用前景

1 颜色空间

1.1 颜色空间的选择

恰当的颜色空间的选择是实现基于颜色特征的图像检索的基础。常见的有RGB颜色空间和HSV颜色空间。一般情况下获取的图像都是在RGB空间描述的,但是RGB空间结构并不符合人们对颜色相似性的主观判断,而HSV颜色空间由色调(H)、饱和度(S)、亮度(V)三个分量组成,与人眼的视觉特性比较接近。从人的心理感知来说,HSV空间要比RGB空间更直观,更容易接受。因此,为了更符合人眼的视觉特征,经常需要做颜色空间的转换,将RGB颜色空间转换为HSV颜色空间,转换公式如式1。

1.2 颜色空间的量化

为了节约存储空间和减少计算复杂度,可以对HSV空间按照人的颜色感知进行非等间隔的量化。亮度对人的视觉来说,差别是非线性的。人的视觉系统对色调比对饱和度与亮度敏感。因此,可以采取如下的量化策略:1)按照人的视觉分辨能力,可以把色调H空间分成8份,饱和度S和亮度V空间分别分成3份;

2)根据色彩的不同范围和主观颜色感知可以对饱和度及亮度进行不等间隔的量化,量化公式如式2所示。

3)构造一维特征矢量。按照以上的量化级,把3个颜色分量合成为一维特征矢量,如式3所示:

其中,Qs和Qv是分量S和V的量化级数,这里取Qs=3,Qv=3。因此,式3可以转换为:

这样,H,S,V三个分量在一维矢量上分布开来。根据式4,L取值范围为[0,1,...,71],经过量化,可有效减少计算量,并减弱图像受光照强度的影响。

2 基于颜色特征的图像检索系统算法研究

由于子图像的划分能够比较简单的利用空间位置的性质,因此可以借鉴传统图像分块的方法,对图像的分块进行改进,在利用颜色直方图统计图像颜色组成的基础上,进一步融入图像的空间信息,可以通过图像分块及权重赋值融入图像的空间信息,而且可以进一步实现基于颜色特征的局部区域检索。具体算法求解如下:将目标图像平均划分为16个子块,求出每个子块的直方图;对于分块的颜色直方图利用加权法求出每个子块的颜色信息,把加权的结果作为该分块的主色信息。将4×4主色矩阵作为该图像的颜色特征,在很大程度上减少了计算量和节约存储空间,但是还没有很好的解决直方图无法体现空间位置的问题。因此,从人眼识别图像的特点出发,可以由用户进行感兴趣区域的选择及权重系数的调整操作。同样的,对数据库中的目标图像也可以采取同样的处理方法。即对数据库中的目标图像也按照4×4的分块方法,构造各分块直方图,根据直方图提取出主色信息,构造主色矩阵。最后,根据用户调整的权重系数,按照式5计算示例图像和数据库中目标图像的距离,将距离从小到大排序,距离越小则图像越相似。两幅图Q,P的距离计算公式式5所示。

其中,Qi和Pi分别为查询图像和目标图像的主色矩阵中相应元素值,Wi为各个分块的权值系数。

3 基于颜色特征的图像检索系统的设计与实现

3.1 系统体系结构

基于内容的图像检索系统可以采用如下架构:用户通过选择具有代表性的一幅示例图像构造查询,通过系统查找与示例图像在视觉内容上较为相似的图像集,按照相似度大小排列返回给用户。文章设计图像检索原型系统My CBIR,以实现基于内容的图像检索,系统框架图1所示。

3.2 系统界面与测试

系统界面与测试如图2~图5所示。

3.3 实验数据及结果分析

将检索结果由视觉特征的相似性转化为可以进行具体比较的数据,这里采用图像检索系统常用的两个主要性能指标:查全率和查准率。查全率的主要含义是在一次查询过程中,系统返回的查询结果中的相关图像的数目占数据库中所有相关图像数目(包括返回的和没有返回的)的比例,即:

其中ns为检索到的相关图像数目,n为所有相关图像数目。

而查准率主要指在一次查询过程中系统返回的查询结果中的相关图像的数目占返回图像数目的比例,即:

其中ns为检索到的相关图像数目,nr为检索出的全部图像数目。

查全率是检索系统查找用户所需信息能力的标志,查准率则从一个方面描述了检索系统的查询开销,反映出了系统检索效果的准确程度,一个良好的检索系统,能够保持较高的查全率和查准率。

实验中所采用的图像来自于Corel数据库的1万幅图片,这些图片在内容上有很大差异,可以保证实验结果的客观公正,分别采用直方图相交、欧式距离、主色矩阵三种算法进行测试。实验结果表1所示。

根据表1所示的实验结果,上述实验结果选择五组完全不同类型的图片,采用三种不同的算法进行检索,可以看出对于蝴蝶、汽车这两组实验,采用主色矩阵检索方法,检索结果的查全率和查准率均有明显提高,查全率分别提高了7%和15%,查准率则提高了8%和19%,很明显,主色矩阵的检索效果较为理想;对于游艇、花这两组实验,直方图相交和主色矩阵检索的查全率和查准率相当,为此,除了实验数据的比较,还可以再用人眼视觉对检索效果进行衡量,由于检索出的结果是按照检索方法判断的与示例图像的相似程度进行排列返回,比较图3与图5,可以明显看出,对于直方图相交检索方法,前10幅才检索出了与示例图像相似的全部游艇图片,其中有3幅是不相关的图片,而主色矩阵的检索方法,前7幅就检索出了所有与示例图像相似的全部游艇图片,其中只有1幅是不相关的图片;与欧式距离检索方法进行比较,主色矩阵检索效果的查全率与查准率均高于欧式距离的检索结果,因此,可以认为主色矩阵的检索方法具有较好的检索效果。然而,对于建筑这一组实验,主色矩阵检索方法的查全率和查准率较低,效果不如直方图相交和欧式距离的检索方法。

从实验数据的比较,可以看出:从视觉效果上看,当一幅图像中有出现明显的主体对象时,主体对象颜色相似的图片容易被人眼认为是相似的图片。用直方图相交和欧式距离的检索方法强调的是颜色的整体组成,对于图像中的所有区域的颜色都平等对待,没有将主体对象和背景区域的重要性区分开来,无法突出体现主体对象的颜色信息,不符合人眼观察图片的视觉特性。在主色矩阵的检索方法中,对图像进行了分块处理,通过分块,融入了位置信息,使图像在进行搜索时,不仅实现颜色组成上的相似性,图2 My CBIR测试界面还能体现空间位置上的相似性,提高了检索的准确度。通过人机交互的界面,用户能够根据自身的视觉关注度选择感兴趣的关键区域,能够对关键区域进行权重调整,使检索过程更符合人眼的视觉特性。而当人眼无法观察出特别明显的主体对象,对于感兴趣的关键区域的确定也就比较模糊,如果主体对象形态差异较大,那么颜色的空间分布也就具有较大的差异,颜色的空间位置信息用分块的方式进行定位可能造成较大误差。因此,对于感兴趣区域的选择及系数的调整反而可能对颜色信息的匹配造成干扰,对实验结果造成不利影响。因此,对于背景图,主色矩阵的检索效果不够理想。

根据上述实验结果的分析,可以得出如下结论:1)基于内容的图像检索系统,采用人眼最容易感知的颜色作为图像特征进行提取和匹配是可行的,且能够取得较好的检索效果。2)对于同一幅图像,采用不同的检索方法,能够检索出不同的结果。不同类型的图片,适合不同的检索方法:当图像中有明显的主体对象出现时,主色矩阵的检索方法能够突出主体对象的颜色特征,符合人眼判别相似性的视觉特性,具有较好的检索效果;当图像没有明显的主体对象,或者主体对象占据了图像大部分区域,或者主体对象的颜色与背景区域十分相近时,从人眼的视觉效果看,对感兴趣区域的判断较为模糊,人眼此时更为关注图像的整体颜色信息,那么基于整体颜色分布的直方图相交和欧式距离的检索效果会更好。

本论文围绕基于颜色特征的图像检索方面进行研究。可以预见,随着多媒体信息处理、数据库和计算机网络技术的相互融合发展,针对基于内容的图像检索技术的深入研究,将具有更大的理论价值和广泛的应用前景,其成果对于信息产业的进一步发展将起到积极的推动作用。

参考文献

[1]肖明,王永红,石勇.基于内容的图像检索研究进展[J].情报杂志,2007(1):43-45.

[2]徐庆,杨维维,陈生潭.基于内容的图像检索技术[J].计算机技术与发展,2008(1):126-128.

[3]陈栋梁,周晓君.基于内容的图像检索技术研究[J].计算机与数字工程,2006(35):140-142.

[4]李岚,冯刚.MPEG-7与基于内容的图像检索[J].计算机工程与应用,2002(17):98-102.

[5]吴志红.基于内容的图像检索技术及应用[J].计算机与网络,2006(1):197-198.

[6]梁艳.基于内容的图像检索技术及应用[J].科技信息,2008(20):51-52.

[7]Hafner J,Sawlutey H.Efficient color histogram indexing for quadratic form distance functions[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,1995,17(7):729-736.

[8]Stricker M,Orengo M.Similarity of color images.IS&T/SP IE Conf.on Storage and Retrieval for Image and Video Databases III,1995,24(2):381-392.

[9]Wan X,Kuo C C J.A new approach to image retrieval with hierarchical color clustering,IEEE Trans.On Circuits and Systems for Video Technology,1998,8(5):628-643.

形状和颜色特征的混合图像检索 篇8

基于内容的图像检索 (CBIR) 已经成为信息检索的重要技术, 能够从数量不断增长的图像中快速有效的得到搜索结果, 是当前研究的一个热点。小波分析是当前迅速发展的新领域, 它的多尺度和多方向性使它被广泛地应用于纹理图像分析研究之中, 小波对纹理图像的检索[1]。但是对于彩色图像利用小波变换提取纹理特征, 存在着检索精度不高的缺点, 检索结果很难满足人的视觉相似性。彩色图像经常采用整幅图像的颜色直方图作为特征[2,3], 颜色直方图的优点[4,5,6]是对图像几何变化具有较好的鲁棒性, 缺点是计算量大, 虽然对颜色向量量化后可以减少计算量, 但它不包含颜色的空间分布信息, 不同的图像有可能具有相同的颜色直方图, 这极大地影响了检索效率。本文提出的方法, 利用各个等级颜色的使用率, 作为特征向量, 有效利用彩色图像的颜色信息, 减少了整幅图的颜色直方图的计算量。利用局部欧氏距离寻找与关键图同类的子图像库, 再对各个图像进行小波变换, 提取特征, 输出最终检索结果。实验证明, 用这种方法可以减少直方图的计算量, 同时可减少小波检索输出图像时与视觉无关图像, 有效地提高了图像的检索率, 缩短检索时间。

1 颜色特征

颜色是图像的重要视觉信息, 颜色空间有RGB、HSV、M TM颜色空间。RGB颜色空间简单、直观, 不具有均匀性, 颜色之间的距离与人的视觉感知差异很大;HSV空间对光照强弱变化, 观察角度变化具有一定的鲁棒性, 颜色均匀, 特征比较稳定, 是较好的颜色空间, 被广泛应用于计算机领域。

首先在RGB颜色空间上, 将图像的颜色量化到256级, 量化的方法是:分别提取出RGB三分量的高3、3、2位, 组成一个8位的颜色值, 这样就将图像的颜色值量化为256中颜色.

然后RGB颜色空间转换到HSV颜色空间, 各分量都进行归一化处理, 提取关键图与每个检索图像的局部区域的颜色特征向量, 运用欧氏距离计算公式:

2 形状特征

小波被看作是一种用于多层次分解函数的工具, 数字信号经过小波变换后可以用小波系数来描述, 小波系数体现原图像信息性质, 图像信息的局部特征可以通过处理小波系数而改变。

对图像的H, S, V各个分量进行Dauchechies小波变换, 计算LL频带小波系数的标准方差, i表示第i个分量, 即i= (H, S, V) , 是常数, 调节输出图像的数目.只要有HSV三个分量中有一个能使公式 (2) 成立, 就认为关键图与检索图相差不大.

按照如下公式计算关键图K与检索图S的距离.

其中的W表示各频带 (LL, LH, HL, HH) 第i个颜色分量小波系数的Euclidean距离;分别表示各频带 (LL, LH, HL, HH) 距离的权值;表示个HSV颜色分量距离的权值;

3 算法描述

(1) 计算图像的颜色直方图提取颜色特征;

(2) 对每个图像进行小波变换, 提取形状特征。

(3) 将RGB颜色值转化为HSV颜色值.

(4) 在HSV颜色空间上对图像进行小波变换, 计算LL频带部分的, HSV各颜色分量的小波系数的标准方差.

(5) 按照如下公式 (2) 评判关键图与检索图是否相差太大, 如果相差太大, 则放弃检索本检索图;否则接着进行下边的操作.

其中K为关键图, S为检索图, 为LL频带小波系数的标准方差, i表示第i个分量, 即i= (R, G, B) , 是常数, 调节输出图像的数目.

(6) 按照如下公式计算关键图K与检索图S的距离.

其中的W表示各频带 (LL, LH, HL, HH) 第i个颜色分量小波系数的Euclidean距离;分别表示各频带 (LL, LH, HL, HH) 距离的权值;表示个HSV颜色分量距离的权值;

(7) 相似图像进行排序, 并输出结果

4 实验结果

评价检索算法通常用的指标有:查准率 (RP) 、查全率 (RR) 、检索时间。

查准率指检索有效图像的比率[6], 用于测试系统排除无关图像的能力。查全率指检索有效图像占数据库中所有相似图像的数量的比率, 用于测试系统检索相关图像的能力, 检索时间是指从检索到输出结果所需要的时间, 它反映了算法的执行效率。

在Pentium4 2.7GHz、2GB内存、80GB硬盘的PC机上, 用VC++实现本文算法, 在美国华盛顿大学图像库中, 六类图像中选取100幅图像, 建立图像库, 对本文算法进行了实现颜色检索系统, 效果图如下:

由图4可知, 本文算法 (CwaveHSV) 比RGB空间和HSV空间的的小波检索算法, 从直观上来大部分图像是关键图的相关图, 这明显是具有直方图检索的优点, 但却减少了颜色直方图的计算量。

从检索率和查全率来看, 本文算法 (CwaveHSV) 与RBG颜色直方图检索方法 (RGBH) 、HSV颜色直方图检索方法 (HSVH) 、RGB空间的小波检索算法 (waveRGB) 、HSV空间的小波检索算法 (waveHSV) 进行了对比实验, 实验结果如下:

由图5可以看出本文算法 (CwaveHSV) 的平均检索率较其他算法有了一定的提高, 但在平均查全率较其他算法不占优势, 这也是该算法有待提高的地方。所以应从全面来衡量一个算法。

5 总结

本文提出的方法, 有效利用了彩色图像的局部区域的颜色信息, 减少了计算量, 使小波变换提取的纹理特征检索彩色图像应用更有效, 取得了较好的实验结果。但是每类图像数目不同检索结果是不同的, 对于特定数据库, 需要捕捉特定查询意图, 需要选取不同的检索方法。

摘要:对于彩色图像的检索方法, 传统的颜色直方图检索技术计算量大, 检索时间长, 而小波变换在形状特征检索率并不能满足真颜色图像的直观效果的要求, 因此, 本文提出颜色和形状结合的图像检索, 既计算各个图像的颜色直方图, 又进行小波变换, 提取特征, 进行检索, 实验表明, 该方法能有效缩短检索时间, 提高了检索率。

关键词:颜色直方图,小波变换,图像检索

参考文献

[1]CHA S H.On measuring the distance between histogram[J].Pattern Recongnition, 2002, 35 (6) :1355-1370.

[2]Aibing Rao, Rohini K.Srihari, Zhongfei Zhang.Spatial Color Histograms for Content-Based Image Retrieval[J].Proceedings of the 11th IEEE International Conference on Tools with Artificial Intelligence, Nov.1999:183.

[3]Nikoletta Bassiou, Constantine Kotropoulos Color image histogram equalization by absolute discounting back-off[J].Computer Vision and Image Understanding, 007, Jul, 107 (1-2) :108-122.

[4]Jiann-Der Lee, Li-Peng Lou.Using texture and shape features to retrieval sets of similar medical images[J].Biomed Eng Appl Basis Comm, 2003 (october) , 15:193-199.

[5]Thurdsak Leauhatong, Kazuhiko Hamamoto, Kiyoaki Atsuta, Shozo Kondo.A new content-based retrieval using the Multidimensional Generalization of Wald-Wolfowitz runs test[J].电学论C, 129卷1号, 2009:94-102.

[6]Ying Liu, Xin Chen, Chengcui Zhang, Alan Sprague.Semantic clustering for region-based image retrieval[J].J.Vis.Commun.Image R.20 (2009) :157-166.

[7]GANESAN S A L.Texture classification using wavelet transform[J].Pattern Recognition Letters, 2003, 24:1513-21521.

[8]金海善, 等.基于颜色特征的图像检索算法及实现[J].四川大学学报:自然科版, 2008, 45 (4) :817-820.

[9]陈武凡.小波分析及其在图像处理中的应用[M].北京:科学出版社, 2002.

[10]J.Hafiner, H.S.Sawhney, W.Equitz, M.Flickner.Efficient color histogram indexing for quadratic from distance functions.IEEE Trans.Pattern Anal.Machine Intell.1995.

[10]ohn R.Smith et al.Automated binary texture feature sets for image retrieval.ICASSP, Atlanta, 1996, 4:2339-2242.

基于视觉特征的图像检索重排序 篇9

基于关键字的图像检索起源于上世纪六七十年代,最初主要应用于数据库以便于对图像进行管理。上世纪九十年代初,随着互联网的迅猛发展,网络上的图片信息急剧增长,基于关键字的图像检索成功地应用到了互联网范围。基于关键字的图像检索主要利用从人工标注、图片标题、图片元数据和网页中图片周围的文字中提取的关键字来建立索引进行检索。然而,不同的人对相同图片的理解不一样,而且,有些图片的信息并不能通过文字来全面地描述,所以标注很可能与用户的理解存在偏差。此外,同义词和多义词都给基于关键字的图像检索带来了歧义性,例如苹果,可以表示水果中的苹果,也可以表示苹果牌电脑。由此可见,基于关键字的图像检索虽然在一定范围内能满足用户的需求,但是也存在很大的局限性。因此,上世纪九十年代开始,研究者们就进行了基于视觉特征的图像检索的相关研究工作,到目前为止已经取得了一系列突破性的成果,但是网络范围的基于关键字的图像检索还有待进一步的研究。本文介绍了如何利用图像的视觉特征对基于关键字的图像检索结果进行重排序。

1 相关工作介绍

重排序主要分为相关性重排序和多样性重排序[1],本文中的方法为相关性重排序。相关性重排序是针对检索结果的相关度展开的,而多样性排序是针对检索结果的多样性展开的。相关性重排序的方法中包括有监督和无监督两大类,本文所述方法属于无监督的。聚类是比较常用的无监督重排序算法,如多模态模型[2]和信息瓶颈论[3]的应用,此外图理论[4]也常被用来实现重排序算法。但是这些方法模型建立过程都比较复杂,而且计算量很大,对检索结果的性能也并没有显著性的改善。本文所用的方法是来源于文献[5]中利用网页图片视觉信息对网页进行重排序的思想,将其应用到纯粹的图像检索领域,在基于关键字的图像检索结果基础之上,利用图片的视觉特征信息进行重排序,取得了显著的性能改善。

2 视觉特征介绍

颜色和纹理是图像中最重要的视觉特征,包含了丰富的视觉信息。颜色直方图是一种描述颜色特征的有效方式,而LBP能有效地描述纹理特征,因此本文将以基于关键字的检索结果为基准,对基于这两种特征的重排序结果进行比较分析。

2.1 颜色直方图

研究表明,人眼对色彩很敏感,能识别出成千上万种颜色,因此选择出符合人眼视觉特征的颜色空间就至关重要了[6]。颜色空间有很多种,如RGB、CMY、HSV、Lab等,但是最符合人眼视觉感知特征的是HSV颜色空间,其中H、S、V分别对应颜色的色度、饱和度和亮度值。目前大多数的图像都是基于RGB颜色空间的,因此首先需要将其转换到HSV颜色空间中,转换公式如下[6]:

{V=13(R+G+B)S=1-3(R+G+B)[min(R,G,B)]Η=arcos{[(R-G)+(R-B)/2][(R-G)2+(R-B)2]}(1)

RGB的值都在[0,1]之间,则HSV的值也都在[0,1]之间。

将图像转换到HSV颜色空间后,再对三个通道的值分别进行量化,HSV的量化级数分别为LMN。量化后计算三个通道量化值的加权和,即可得到各个像素的直方图索引。HSV通道的量化值分别为(0,1,2,…,(L-1)),(0,1,2,…,(M-1))和(0,1,2,…,(N-1))。若三个通道的加权系数分别为WHWSWV则直方图的柄数为:

Nbin=(L-1)*WH+(M-1)*Ws+(N-1)*

WV+1 (2)

即每幅图像的颜色特征都可以用一个Nbin维的向量来表示。

2.2 局部二值模式LBP

LBP(Local Binary Pattern)是一种不带参数的运算子,可以用来提取图像的局部特征。Ojala等人最早提出了这种运算子,并且证实了其有效的纹理识别能力[4]。对于给定像素点(xc,yc),LBP为该像素与其周围8个像素的强度值比较结果,用二值模式表示为0和1组成的二值串,如图1所示。LBP的十进制表示形式[7]如下:

LBΡ(xc,yc)=p=0p-1s(ip-ic)2p(3)

其中,ic为邻域中心(xc,yc),in为各个邻域像素的强度值。符号函数s(x)定义为:

s(x)={1ifx00ifx0(4)

由定义可知,对于由光照引起的像素强度值变化,LBP运算子依然能够保持中心像素和周围像素强度值的比较结果不变,因此能抵抗同质光照变化带来的影响。

用LBP运算子对图像中的每个像素都进行比较运算,在每个像素点都将得到一个描述该点邻域特征的二值模式串,用十进制表示即为0~255之间的整数。对经过LBP运算子过滤后的图像进行直方图统计,可得到一个256维的特征向量,此特征向量即为该图像的视觉特征表示。

由于LBP运算子不具有旋转不变形,而且只能提取局部细微的纹理特征,所以在实际应用中存在很大的局限性。为了实现LBP运算子的旋转不变形,Ojala等人在2002年对LBP进行了改进,将LBP运算子过滤得到的二值模式串进行循环位移操作,这样每个像素点都将得到一个二值串集合,然后取其中的极小值,从而实现了旋转不变性。为了提取更多尺寸上的特征,将像素点与其周围半径为R的圆周上均匀间隔的P个像素点进行强度值比较,对于圆周上未落在其他像素点上的位置用其周围像素进行差值得到其像素强度值,这样即可提取更大尺度上的局部特征。其定义[8]如下:

LBPΡ,Rri=min{POR(LBPP,R,i)

i=0,1,…,P-1} (5)

其中,ROR(LBPP,R,i)在P比特位的二值串x上执行右循环位移i次。

对改进后的LBPΡ,Rri进一步的研究发现大部分有用的特征信息都包含在均匀(Uniform)二值模式串中。其中均匀值定义为圆周上二值串中0/1(1/0)变换的次数,对于均匀值不超过2的模式串称为均匀二值模式串,这些模式串有很强的特征描述能力,因此每一种均匀二值模式串都认为是不同的,而对于其他所有均匀值超过2的都作为同一种模式串处理,这样对于一个半径为R的圆周上取P个点的LBP运算子即可得到一个P+2维的特征,其定义如下:

LBΡΡ,Rriu2{Ρ=0p-1s(ip-ic)ifU(LBΡΡ,R)2Ρ+1otherwise}(6)

其中,U(LBPP,R)=|s(ip-1-ic)-s(i0-ic)+∑p=0p-1|s(ip-1-ic)-s(ip-1-ic) (7)

对于一个R=1,P=8的LBP运算子,其均匀二值模式串如图2所示。

3 重排序方法

基于关键字的图像检索利用与图片相关的一些关键字建立索引进行检索,然而,由于图片的元数据、标注和从图片周围的文本中提取的关键字可能与图片内容存在偏差,因此检索结果很可能不尽如人意。尽管如此,基于关键字的图像检索结果中还有相当一部分是和用户期望相匹配的图片,因此可以充分利用这些相关的图片对检索结果进行重排序,以得到更符合用户期望的检索结果。提取所有图片的视觉特征信息,用一个特征向量来表示一幅图片。这样,特征空间中的一个点就对应着一幅图片,而与检索结果相关的图片具有相似性,在特征空间中的距离也就比其他不相关的图片小,利用这一点计算每一个图像点周围的密度即可过滤出与用户期望相关的部分图片,以这些图片为基础可以建立一个目标概念来描述用户期望,从而对检索结果进行重排序[5]。具体实现方法如下。

步骤①:取搜索引擎基于软件自检索返回的结果中前Ntop幅图片,提取其LBP特征f1,f2,…,fNtop,以这些特征空间中的点来代表图像,初始化t=1,由公式(8)求取这些图像点的密度:

Densigy(f)=∑i=1Νtope-∑dj=1|fj-f(i,j)| (8)

步骤②:计算各图像点f1,f2,…,fNtop的密度,按密度大小降序排列,取前Ntop= Ntop-t*step幅图像的特征向量f(t,1),f(t,2),…,f(t,Ntop-t*step),t=t+1。

步骤③:步骤②被重复T次,得到Ntop=Ntop-T*step个图像点f(T,1),f(T,2),…,f(T,Ntop-T*step),由公式(9)求取这些点的加权均值f(T,m),将其作为用户期望的目标概念(Target Concept)。

f(Τ,m)=j=1ΤDensity(f(Τ,j))*f(Τ,j)i=1ΤDensity(f(Τ,j))(9)

由于密度大的点更能描述用户目标概念,因此用密度进行加权后,密度大的点在建立目标概念时发挥更大的作用,从而使目标概念更能描述用户的期望。用户目标概念建立好后,计算出所有基于关键字检索得到的图像与目标概念之间的距离。在互联网范围内,基于关键字的检索结果通常有几千到几十万甚至几百万个,而排序是一项费时的工程,因此若是要对所有检索结果进行重排序必是一项耗时的工程,会影响检索的实时性。在实际应用中,用户往往只对最相关的一些检索结果感兴趣,并且搜索引擎返回结果是都是分页显示的,假设每页显示n个结果,则重排序时只需从关键字的检索结果中找到目标概念的n近邻返回即可。若用户需要浏览下一页显示结果,则在余下的结果中找出目标概念的第二组n近邻返回即可。这样每次只需返回用户希望浏览的结果,能大幅度地降低重排序的时间,使搜索引擎达到更好的实时性。

文献[5]中的方法是利用网页中的图片颜色特征对文本网页进行重排序,重排序时对基于关键字的排序和基于图像颜色特征的排序进行加权和排序得到最终的排序结果。其中,对于不包含图片的网页采用默认值作为颜色特征的排序。本文介绍的方法对文献[5]的方法进行了简化,重排序时只利用图片视觉特征,并引入了加权的概念,不需要再考虑基于关键字的排序。重排序时采用分段排序,将重排序带来的负担均衡给多次浏览结果。本文中所介绍的方法采用的是多种尺度的LBP特征,同时也将其与基于颜色特征的重排序结果进行了比较。

4 实验分析

本文试验中采用了三种尺度的局部二值模式特征LBP8,1riu,LBP16,2riu,LBP24,3riu,并将其与基于颜色特征的重排序结果以百度图片搜索引擎基于关键字的图像检索结果为基准进行比较。试验中颜色特征和目标概念的相关参数设置如表1所示。

颜色特征中最重要的是色度,其次是饱和度,因此将色度的量化值和权重设置为最大,其次是饱和度。实验中,采用了自行车(bike)、公共汽车(bus)、猫(cat)、牛(cow)、马(horse)、飞机(plane)、船(ship)等共7个关键词的百度图片检索结果进行重排序实验,排序前后的相关度度量数据如图3所示。其中对“牛”的检索结果重排序前后对比如图4-5所示(基于LBP243riu重排序)。

尽管在文献[5]中利用网页中图片的颜色特征信息对网页进行重排序,改善了网页检索结果,但是由图3可知,完全基于颜色特征的重排序并不能改善图像检索结果,相反还降低了结果的准确度。同时,随着局部二值模式尺度的增加,重排序结果有所改善,但是继续增大尺寸,并不能继续改善重排序结果。因为传统的局部二值模式能有效地描述细微的纹理,如牛仔裤纹理,木材年轮,动物绒毛等,所以主要用于纹理检测和分类。但是互联网上的图片中包含的物体千差万别,所以需要选择一种合适尺度的局部二值模式来改善整体检索性能。初步实验表明,LBP243riu的性能是最优越的。

试验中对7个关键字检索结果重排序前后的前10,20,30,40,50的平均相关度,其中基准为基于关键字的百度图片检索性能,HSV、riu81、riu162、riu243分别代表利用颜色、LBP8,1riuLBP16,2riuLBP24,3riu等进行重排序后的平准相关度,如图3所示。

进一步的实验表明,增加参数Ntop、T和减小步长参数step并不能显著改善检索结果,甚至会降低准确率,而且增加了计算量,因此本文所选的参数设置是初步试验得出的最优配置。

5 结束语

本文主要介绍了如何利用视觉特征对基于关键字的图像检索结果进行重排序。实验中采用了颜色直方图和局部二值模式相结合的方式提取图像的视觉特征,并取得了较好的实验结果。颜色直方图充分利用了图片的颜色信息,但是由于网络图像中颜色的多样性导致颜色特征的重排序结果不尽如人意,而局部二值模式提取了图片的纹理信息,利用改进后的不同尺度的局部二值模式对检索结果进行重排序均能大幅提高检索结果的准确度。尽管实验取得了理想的实验结果,但是由于时间和工作量的限制,没能对更多检索实例进行实验。因此,在以后的研究中,将会把这种方法应用到更多的实例中进行验证。此外,在以后的研究中可以引入反馈机制将颜色直方图和局部二值模式结合起来,以过滤出包含指定颜色、符合用户特定需求的相关图片,从而达到更精准的网络图像定位。

摘要:主要介绍了在基于关键字的图像检索结果上,利用视觉特征对图像进行重排序。由于关键字对图像的描述存在一定的偏差,所以检索结果难免存在偏差。尽管如此,基于关键字的检索结果中依然有一定比例的图片是与用户期望相关的,利用这一相关性可以建立一个由图像视觉特征描述的用户目标概念,以此作为基准采用分段插入排序对基于关键字的图像检索结果进行重排序,此方法既提高了检索准确率,又能满足实时性要求。文中介绍的方法采用了两种视觉特征,颜色直方图和局部二值模式(LBP)。

关键词:视觉特征,图像检索,重排序,HSV,局部二值模式

参考文献

[1]张静,曲晓杰,冀中,等.基于内容的图像和视频搜索重排序技术综述[J].2011,47(29):171-174.

[2]Wei S K,Zhao Y,Zhu Z F,et al.Multimodal fusion for videosearch reranking[J].IEEE Transactions on Knowledge and DataEngineering,2010,22(8):1191-1199.

[3]Hsu W,Kennedy L,Chang S F.Video search reranking via infor-mation bottleneck principle[C]//ACM International Conference onMultimedia,Santa Barbara,CA,USA,2006:35-44.

[4]Jing Y S,Baluja S.Applying pagerank to large-scale image search[J].Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1877-1890.

[5]Zhou Zhi-Hua,Dai Hong-Bin.Exploiting Image Contents in WebSearch[C].IJCAI’07:Proc.Of International Joint Conference onArtificial Intelligence,2007:2928-2933.

[6]王金荣.基于颜色内容的图像检索技术[D].硕士学位论文,2006.

[7]Timo Ojala,Matti Pietikinen,David Harwood.A ComparativeStudy of Texture Measures with Classification Based on Feature Dis-tributions[J].Pattern Recognition,1996,29(1):51-59.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com

上一篇:教育工作的经验下一篇:提高高中教学效率

付费复制
期刊天下网10年专业运营,值得您的信赖

限时特价:7.98元/篇

原价:20元
微信支付
已付款请点这里联系客服
欢迎使用微信支付
扫一扫微信支付
微信支付:
支付成功
已获得文章复制权限
确定
常见问题