标准检索

2024-09-27

标准检索（共6篇）

标准检索篇1

1 概述

电力工业是国民经济的基础产业, 是具有社会公用事业性质的行业。它为各行各业提供电力, 为人民的日常生活提供电力, 如果供电中断, 特别是电网事故造成大面积停电, 将使各行各业的生产停顿或瘫痪, 有的还会产生一系列次生事故, 带来一系列次生灾害。另外, 供电中断或大面积停电, 会给社会和人民生活秩序带来混乱, 甚至造成社会灾难, 造成极坏的政治影响。

标准是科学、技术和实践经验的总结。为在一定的范围内获得最佳秩序, 对实际的或潜在的问题制定共同的和重复使用的规则的活动, 即制定、发布及实施标准的过程, 称为标准化。电力标准时电力建设和电能生产、变换、传输、销售、使用中必须共同遵守的技术规定和技术管理依据, 其重要性毋庸置疑。目前电力标准共有1300余项, 其中, 行业标准1000余项, 国家标准200余项, 各级电力单位还有多种类型的规范、制度、规定等, 这些海量的标准信息为日常的存档、查阅带来了巨大的不便, 噬需一套电力技术文献全文检索平台, 对国内外电力行业的相关技术标准、规程规范、法律法规等进行全文检索, 将相关技术标准建立数据库进行集中存储, 采用类似百度和Google的检索方式进行模糊检索, 确保在最短的时间内查找到所需要的技术标准。

2 平台建设内容

技术标准是一种重要的科技情报源, 每一篇技术标准都是科学、技术和实践经验的综合成果, 属于特种文献。它既具有一般科技文献的作用, 又具有法律效力;是人们从事科研、生产、设计和检验所使用的技术依据, 因此是科技信息检索中不可缺少的内容。

电力行业是一个技术密集型行业, 经过多年的积累, 各种技术标准及规范非常多, 包括国内、国外的标准, 国内又有不同的部委、行业协会颁发的技术标准, 在供电企业内部又有国网公司、省公司、分公司的技术标准。技术标准在不同的时期又要进行修改完善, 形成不同的版本。

面对如此庞大、复杂的技术资料信息, 相关技术人员查找技术标准非常困难, 在互连网上查找到的资料没有全面性、系统性。给工作带来一定的影响。迫切需要一个将所有电力行业相关的技术标准进行收集、整理、检索的信息平台, 为工作人员提供一个技术标准查询的有力手段, 提供工作效率及质量。

平台以建设一个供电公司内网使用的电力技术文献全文检索平台为目标, 对国内外电力行业的相关技术标准、规程规范、法律法规等进行全文检索, 将相关技术标准建立数据库进行集中存储, 采用类似百度和Google的检索方式进行模糊检索, 确保在最短的时间内查找到所需要的技术标准。

项目的开发将实现电力技术标准的规范化管理, 为技术人员提供了一个技术资料的集中管理平台, 使相关技术人员能够在海量的技术标准中快速查找到所需要的技术资料, 提高了工作效率。

3 平台建设的理论和实践依据

全文搜索引擎通过从互联网上提取各个网站的信息 (以网页文字为主) 而建立的数据库中, 检索与用户查询条件匹配的相关记录, 然后按一定的排列顺序将结果返回给用户。

信息的检索过程主要是利用检索语言对检索提问进行标引, 形成检索提问标识, 再按照存贮所提供的检索途径, 将检索提问标识与文献特征标识进行匹配, 两标识相符或基本相符的则为命中的检索结果。

一个完整的信息检索流程包括:信息源——输入子系统——处理子系统——存储子系统——传输子系统——输出子系统——控制子系统——用户

输入子系统——选择收集特定范围的信息资源、按系统指定款式输入系统

处理子系统——处理加工经过鉴定、选择好的数据和信息, 使其成为易于存储和检索的形式。

存储子系统——将加工处理后的信息按某种规定有序聚积在存储载体上以构成可检文档。

传输子系统——通过计算机与通信线路的连接, 完成信息编码的传递、转接、处理与接受。

输出子系统——根据用户需求有效输出各类最终信息产品。

控制子系统——根据系统内外环境变化, 适时调控, 保障系统的有效输入、有效存储、有效输出等环节的协调运行。

4 平台关键技术

布尔逻辑检索:利用布尔逻辑算符进行检索词或代码的逻辑组配, 是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种, 分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。

截词检索:截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性, 在检索中经常会遇到名词的单复数形式不一致;同一个意思的词, 英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索。

位置检索:位置检索也叫全文检索、邻近检索。所谓全文检索, 就是利用记录中的自然语言进行检索, 词与词之间的逻辑关系用位置算符组配, 对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。

Oracle10G:采用Oracle公司的Oracle10G数据库作为后台数据库。Oracle数据库是一种关系型数据库。它管理性能高, 处理速度快, 能够支持多用户的数据操作和分布式处理。Oracle富有多种表现数据的能力, 如:报表、视图、图像和快照等。内含的SQL*PLUS编程语言支持嵌入式SQL和动态SQL。Oracle采用SQL来实现维护和访问数据库, 通过开放式数据库连接ODBC的中介组件实现与不同客户机连接。

5 结语

平台的应用实现了电力技术标准的规范化管理, 为企业提供了一个技术资料的集中管理平台, 使相关技术人员能够在海量的技术标准中快速查找到所需要的技术资料, 提高了工作效率。随着平台的深化应用, 将依托电力标准的收集、归纳和总结形成电力企业标准知识库, 与检索功能相结合为员工培训、知识传递和优化提供助力, 为企业的新旧人员交替, 日常工作标准化支持和电力知识积累等工作提供信息化保障。

摘要：电力企业作为国有支柱型企业, 其安全稳定的运营关系着我国经济发展以及社会稳定和我国各个企业发展水平的好坏随着我国电力行业的迅猛发展, 电力安全生产的重要性显得尤为突出。保障电力安全生产离不开各类型电力标准的约束和支持它从规划设计、施工安装、运行维修、电力专用设备等多个方面提升电网安全稳定运行水平。本文主要从电力标准信息化管理和检索角度探讨了如何实现电力技术标准的规范化管理, 并为使用者提供了一个技术资料的集中管理平台, 助力海量信息的快速搜寻及定位需求。

关键词：带电作业,三维仿真,带电作业精益化管理

标准检索篇2

2013年第一次升级更新

《水利水电技术标准全文检索系统》自去年开始在我院局域网上运行，日前，对该全文检索系统进行了2013年第一次升级更新。

该系统收录了水利水电工程建设中使用的行业标准、国家标准、法律、法规以及作为历史资料保存的作废标准，共1452项，约8000万字。该检索系统已通过水利部科技成果鉴定。此次升级共新增了37项行业标准，2项国家标准，作废16项行业标准，新增标准为近两年新颁布的最新版本，大家可以直接上网查找自己所需技术标准的全文，欢迎大家查询利用。

进入系统方法：在IE浏览器中输入或在“开始”菜单选择“运行（R）”，输入http://192.168.3.3:8080/，点击确定，即可进入系统（第一次浏览原文时必须首先注册浏览器，点击系统界面左上角“注册浏览器”，注册成功后即可使用）。

详细的检索查询方法请参阅院内网“共享资源”文件夹《水利水电技术标准全文检索系统使用指南》使用手册中第五节和第六节

（五、全文浏览与检索

六、系统使用中应注意的问题）。

技质办（信息中心）

标准检索篇3

因此, MPEG标准化组织提出了一个新的多媒体检索接口标准-MPQF (MPEG Query Format) 。该标准的目标是提供一个对多媒体内容的标准检索接口, 并将成为MPEG-7标准中的一部分。

1 MPEG Query Format概述

1.1 MPEG Query Format的架构

MPQF提供了一个多媒体数据库的标准化访问接口。MPQF的执行和操作是基于一个或多个多媒体存储集上。一个多媒体存储集是一个多媒体内容的无序集合。

MPQF描述的是一个内容检索请求者和一个内容服务提供者之间的查询接口。该接口通过一套准确的输入参数来描述请求者的检索条件和一套输出参数描述检索的返回结果集格式。在MPQF中, 内容服务提供者可以对应一个或多个多媒体数据库。一个内容服务提供者可以同时将查询请求消息提交到多个数据库中, 并将多个数据库返回的结果进行集成后返回给请求者。

MPQF的接口主要分为两类:查询接口和查询管理接口。查询接口具体包括查询输入格式 (Input Query Format) 和查询输出格式 (Output Query Format) 的定义。查询输入格式描述请求者的检索条件, 查询输出格式描述提供者返回的检索结果。查询管理接口 (Query Management) 定义了请求者如何选择服务或服务集成。

1.2 MPQF查询语言 (MPQF Query Language)

M P Q F通过M P Q F查询语言 (M P Q F Query Language) 来定义查询输入/输出接口。MPQF查询语言是基于XML语言的, 采用XML Scheme定义其描述规范。因此每一个MPQF的查询实例都是一个XML文档, 文档的结构定义为MpegQueryType类型。文档的根元素称为MpegQuery元素, 它由一组Query元素和Management元素组成。Query元素是MPQF查询接口的描述主体。

2 MPQF的查询输入接口

2.1 InputQueryType类型定义

Query元素的Input子元素定义了MPQF的查询输入格式 (Input Query Format) , 格式的结构用Input Query Type类型定义。InputQueryType类型提供了一个容器描述用户的查询请求, 容器中包括一个查询条件集合和/或查询结果的输出格式定义以及一个申明部分。InputQueryType类型结构如图1。

2.2 MPQF的查询条件和查询类型

Query Condition元素是Input Query Format中定义用户检索条件的部分, 也是Input Query Format中最核心的部分。其中的Condition元素是表示用户检索条件的主体, Condition元素是一个返回布尔值的的布尔表达式, 表达式由布尔操作符 (Boolean operators) , 比较操作类型 (ComparisonExpressionType) 和Query Type类型组成。所有的类型都返回一个布尔值, 用于表明检索内容是否满足该类型操作定义的条件。

3 MPQF的查询输出接口

MPQF的Output元素定义了查询输入格式 (Output Query Format) , 格式的结构用OutputQueryType类型定义。OutputQueryType类型提供了一个容器描述查询请求返回的结果, 结果不仅包括返回的记录集也包括各种错误或异常信息。

4 结论及展望

多媒体查询接口接口标准MPQF与现有多媒体数据库查询语言相比具有以下优点。

平台无关性。MPQF采用开放的XML语言定义多媒体内容检索的标准查询输入和输出接口。因此开发人员可以编写与平台无关的多媒体检索应用, 提高了软件的可重用性和可维护性。

丰富的内容检索类型。MPQF提供了按属性, 按样例, 按空间-时间关系等多种内容检索类型。

元数据独立性。MPQF将被整合入现有的MPEG-7标准中。但MPQF并不仅仅只支持MPEG-7元数据, 而是支持任何基于XML的元数据如Dublin Core。

内容集成服务。MPQF检索接口允许用户可以同一时间访问多个多媒体数据库进行查询, 对返回的多个结果合并后返回给用户。

由于MPEG-7元数据的广泛使用和MPEG组织的推广, 未来多媒体内容检索的应用将会以MPQF作为标准的查询接口。

参考文献

[1]J.M.Martinez.MPEG-7Overview.ISO/IEC JTC1/SC29/W11N5525, Pattaya, March2003.

[2]Harald Schning.Tamino-a DBMS designed for XML.In Proceedings of the17th International Conference on Data Engineering (ICDE) , pages149～154, April2001.

[3]Nastaran Fatemi, Mounia Lalmas, and ThomasRlleke.How to retrieve mul-timedia documents described by MPEG-7.In Proceedings of the2nd ACM SIGIR Semantic Web and Information Retrieval Workshop, ACMPress, NewYork, NY, USA, 2004.

文献检索作业检索格式篇4

检索题目（中英文）

姓名学号班级成绩

说明

1.自选题目方向，检索年限取近三年。各检索工具尽可能选用同一时间段，以便相互比较。（如果与所选题相关文献较少，年限可设多年）2.编写检索式包括写出：检索方式、检索字段、检索运算符、检索词：如：PubMed数据库：基本检索：stem cell[ti] AND liver 3．每一种检索工具检出的文献，如果超出了5条记录，则填写5篇题录在空栏中。题录包括以下事项：第一著者、文献标题、文献出处（刊名、年、卷期、起止页码）、语种（非英文）。按以下标准格式填写：期刊论文：

陈忠斌，杨静，王华，等，应用抑制性消减杂交筛选流感病毒感染宿主应答基因，中国生物化学与分子生物学杂志，2003，19（2）：156-161 或 Harvey W.Anomalies and curiosities of cardiology and cardiologists.Am J Cardio 1984;53:900-915 书和章节：

冯作化，皇甫永穆，主编。医学分子生物学，武汉：武汉出版社，1998：343-355 或 Weinstein L, Swartz MN.Pathologic properties of invading microorganisms.In: Sodeman WA Jr, sodeman WA, eds.Pathologic physiology: mechanisms of disease.8th ed.Philadelphia: Saunders,1974,457-472.一．中外文题录文献信息检索

说明

根据你的信息调研课题，搜集与课题相关的文献（不一定是完全一致的文献）。1． Pubmed 或 Medline（任选一种)检索年限：数据库名称：检索式：

检出结果：检出记录数

篇，并填写5条文献题录：

2．中国生物医学文献数据库CBM 检索年限：检索式：

检出结果：检出记录数篇，填写5条文献题录：

二、全文数据库

说明

根据你的课题，如果需要尽快获取全文详细内容，可以选择全文数据库进行直接检索。

中文全文数据库（如CNKI-中国期刊网，维普中文科技期刊全文任选一种）检索年限：数据库名称：检索式：

检出结果：检出记录数

篇，填写5条题录：

三、馆藏图书查询

根据你的课题，查询与之相关的馆藏图书5种，列出相关题录信息。

记录数篇，填写5条题录：

四．网络信息检索

1.与课题专业相关的网页：

说明

在Web检索工具的检索栏中，直接输入与课题相关的检索式，如：子宫内膜异位症诱导因素，可以获得相关研究的详细内容的网页。检索工具名称：

检索过程：检出结果：检出记录数98,700 条

填写5条简要信息（网页名称、网址，网址请记录到第二个斜杠为止）：

2.与课题专业相关的医学网站

说明

通过Web检索工具的分类目录查询途径，进入本专业相关类目，如上述课题相关的专业类目可以为“妇产科”，可以检索到一批与专业内容相关的专业网站，在这些网站中包含有专业新闻、重要的专业电子期刊、专业使用的参考工具、讨论组等。另外，专业学会、协会的网站，通常也是重要的专业网站。这些专业的网站信息具有新颖性、专业性、交互性强的特点。（写出网站名称及网址）：

文献分编规范化标准化与文献检索篇5

关键词：文献分类,文献编目,文献检索

在新经济时代的今天, 知识信息的重要性备受重视, 它产生的社会作用和经济效益也越来越大。图书馆作为知识、信息的集散中心, 文献信息资源浩如烟海, 许多读者深感在文献检索时对所需要的文献常常“找不到、找不全、找不准”。其中一项重要的原因就是文献分类不规范、不统一, 文献编目著录的数据格式不标准、不详尽。为提高读者文献检索的效率, 对文献信息进行更加合理、更加科学的分类和编目, 则应从以下几方面着手改进和提高。

文献分类的准确性和一致性

鉴定文献分类质量高低的最主要标志是文献分类的准确性和一致性。文献分类的准确性是指为书在文献分类体系中找到一个准确而恰当的位置;文献分类的一致性是指在某一图书馆中, 执行统一的分类原则和分类细则, 使同类文献集中于一处, 异类文献区别归类, 做到前后一致, 号码固定。分编人员要牢牢把住文献分类的质量关, 保持分类规范、准确、统一, 以提高读者文献检索的效率, 并非易事。这就给文献分类工作提出了更高的要求。

1.严格执行《中国图书馆分类法》的分类原则, 制定适合本馆的分类细则

文献分编人员一定要严格执行《中国图书馆分类法》 (第四版) 、《中国分类主题词表》等分编依据, 要熟悉《中国图书馆分类法》现有的编制特点。此外, 以《中国图书馆分类法》和《中国分类主题词表》为依据, 根据本馆的藏书特色和藏书结构, 制定出适应本馆馆藏情况的分类细则, 并及时对分类细则进行补充, 使之趋于完善, 使分类编目人员有据可依, 让读者进行文献检索时有章可循。

2.熟悉掌握《中国分类主题词表》, 做好文献的主题分析

主题分析是分类程序中至关重要的一环。它关系到同一类文献的分类能否准确而一致, 关系到多学科交叉、新学科等主题的文献能否准确归类。分类编目人员不仅要翻阅内容提要, 还要仔细阅读文献的目录、章节内容, 吃透这类文献要表达的旨意, 才能准确给定其分类号, 反映出主题的实质, 才能便于读者进行检索。

3.严格进行文献的检索查重, 保证文献分类的统一性

分类检索查重是文献分类规范统一的重要保证。尽管利用计算机进行检索查重非常方便, 但由于有的馆内分类人员相互沟通交流较少, 皆按各自分析问题的方法去处理文献。如果相同或相近似的文献在同一时间分散到不同的分类人员手中, 也无法在本馆数据库中检索查重, 这样就会导致同种书被分入不同的类或者一套丛书或多卷书虽分入同一类却没有在同一种次号下分卷, 而使读者检索文献的查全率和查准率大大降低。

因此分类人员一定要加强沟通和交流, 疑问之处要共同探讨, 严格执行分类原则, 严格按照本馆分类细则解决疑难问题。此外, 分类人员查重时, 特别是丛书和多卷书的查重, 不能仅仅只用ISBN号, 而要从著者、题名、丛编名、主题等多方面来进行查重。这样才能尽量减少分类中查错查漏的现象, 有力地保证分类的规范性和统一性, 提高读者文献检索的效率。

文献编目著录的质量保证及规范统一性

文献编目著录不够规范统一, 直接影响了机读目录检索功能的发挥, 影响读者检索的效率。存在问题表现在以下几个方面:一是著录不全。著者是外国人或古代人, 却忽略著录其国籍或朝代;丛书或多卷书在分散著录的情况下, 没有在丛编项中注明其丛书名等信息;文献的修订版、增补版、第二版等信息没有在版权项中著录。二是判断错误。有的编目人员不熟悉或没有掌握《中国文献编目规则》有关规定, 会造成著录数据不统一;有的编目人员按中国人的习惯著录外国著者姓名等等。三是著录符号不规范。著录正题名数据未注意全角与半角的区别, 忽视阿拉伯数字与中文数字的不同, 未注意区分题名中英文或汉语拼音大小写, 空格与标点符号使用不准确, 字段的指示符运用不准确等等问题往往导致读者文献检索失败。

上述问题都严重影响了读者文献检索的效率。要改善这种状况, 就必须重视编目人员的继续教育, 提高他们的专业素质。编目人员首先是学好编目规则;其次, 编目人员要经常向行家请教, 学习这方面的实践经验, 多研究学习这方面的专著;积极参加各种形式的文献编目学习班、培训班、进修班和专题讲座, 学习借鉴同事和同行的先进经验。

提高读者机读目录的检索效率

首先, 培养读者文献检索的意识。对高校图书馆来说, 培养学生利用现代化工具进行文献检索的意识, 首先应注重为学生开设文献检索课的适用性, 强调让学生从理论到实践系统地了解并运用文献检索的方法与技巧, 使其真正体会文献检索对他们学习的作用和价值。其次, 提高读者的文献检索能力。鼓励和支持读者进行文献检索, 可采用宣传专题报告、讲座、专题报告等形式帮助读者了解文献分类体系, 熟悉文献编目的各项内容。要使所有读者熟练掌握计算机文献检索的方法与技巧, 除了大力宣传以外, 还要在检索处放置或张贴文献分类基本大类, 文献著录内容及格式, 以及一些文献检索的细则、方法、技巧, 以便读者检索时参考。这样不仅给读者带来极大的方便, 也将大大提高读者文献检索的效率, 使图书馆的文献信息更好为读者服务, 使图书馆的文献资源在读者的学习和生活中更大地发挥作用。

参考文献

[1]林华.信息时代图书馆编目工作的发展趋势[J].四川图书馆学报, 2002, (4) .

基于镜头检索的视频检索算法研究篇6

由于将一段视频的每一帧都转描述成数学特征向量是非常耗时并且难于计算的, 目前常用视频检索做法是以镜头为最小检索单位, 镜头是视频内的一部分连续场景, 一般以摄像机的一次开关为界限, 一个镜头内的视频帧具有较高的相似度。镜头检索并不是提取一个镜头的特征向量, 而是提取镜头的关键帧的特征向量, 用关键帧代表镜头, 进而计算关键帧的相似度, 从视频数据库中检索得到和待检索关键帧语义相似的关键帧, 这样就找到了相似度较高的关键帧和该关键帧代表的镜头, 视频检索就转换成了关键帧检索。

目前基于内容的视频检索主要包括以下几个研究方向:一、镜头检测, 镜头是视频的基本构成单元, 将一段视频根据拍摄的场景的不同分割成多个镜头是研究的一个重点。二、关键帧提取, 从镜头内检测出当前镜头的关键帧, 从语义上表示该镜头, 并提取关键帧的特征向量从数学上描述该镜头。三、基于内容的图像检索, 在提取完视频的关键帧之后, 视频相似度对比就转变成了关键帧相似度对比, 视频检索就转换成了关键帧检索, 关键帧本质上是一幅图像, 基于内容的图像检索也是研究的一个重要方向。

基于内容的视频检索算法从检索范围上来分有两种, 一种是视频全局检索, 一种是关键帧检索, 全局检索是对视频的所有帧进行检索匹配, 关键帧检索是用一个视频的关键帧代表这个视频, 全局检索的准确率更高, 但是由于视频的数据量很大, 一个30分钟的视频, 在每秒30帧时, 其视频帧数就达到了54000帧, 对如此数量的视频帧进行特征提取, 相似度计算无疑是一个浩大的工程, 所以目前一般采用的是基于关键帧的检索。

视频检索过程中的关键技术中包括镜头检测、关键帧提取和关键帧对比, 应用这些关键技术实现一次完整的视频检索。但是由于每个视频有多个镜头, 每个镜头又存在多个关键帧, 检索过程中计算量很大, 所以本文希望做预处理, 对镜头预先进行分类, 这样在用户检索的过程中, 只要根据自己待检索镜头所属的分类, 只检索对应的分类即可, 可以节省了大量的检索时间。

2. 镜头聚类

视频检索应该以镜头为单位, 将镜头作为视频检索的最小单元, 由于视频检索的计算量很大, 所以在检索之前最好对所有已经分析完毕的镜头进行聚类, 这里本文采用基于网格的聚类方法, 根据镜头的首个关键帧对镜头进行聚类基于网格的聚类方法, 如下图2所示, 将一个二维空间平均分成多个聚类, 根据拿到的对象, 通过算法直接确定物体所属的类, 对于图中属于区域11、12的两个点, 虽然距离很近, 但是根据聚类算法, 两个物体仍然分属两类, 属于边界限制的一种。对于本文的镜头聚类来说, 是将HSV空间向量的距离值分成多个块, 当拿到一个镜头的HSV特征向量时, 可以直接计算出该镜头所属的分类, 基于网格的聚类方法特点是快速, 只有一个特征向量也可以直到其所属的类。

由于空间向量的值的不确定性, 所以空间网格的划分造成一定的难度, 首先利用公式4.2对HSV颜色空间的各个分量进行归一化操作, 保证各个向量的值在0-1之间, 之后利用公式4.4计算, 图2基于网格的聚类这样, 所有视频帧的距离就可以保证在0-1之间, 就完成了视频帧特征向量的归一化, 并进行下一步的网格聚类。本文根据向量到 (0, 0, 0….0) 的距离直接计算向量所属网格, 本文简单的将网格设为100, 即距离 (0, 0, 0, 0, ) 乘以1000后, 距离值在0-10之间的属于类1, 聚类在10-20的属于类2, 依次类推, 确定视频帧所属网格类。

3. 镜头检索算法

在本文中, 将镜头作为检索的最小单元, 用户选择一个镜头, 并检索出相关镜头, 镜头作为检索结果反馈给用户, 用户可以根据检索出的镜头查找出包含镜头的视频。首先用户提交待检索视频, 经过前面的镜头检测算法, 将视频分解成镜头之后, 提供给用户两种检索模式, 单帧检索模式和多帧检索模式。单帧检索是用户由用户选择其中一个镜头, 并选择其中的一个或者多个关键帧进行检索, 当用户选择一个关键帧时, 首先对选择的关键帧进行网格聚类, 计算出待检索关键帧所属的聚类, 然后连接数据库, 从数据库的关键帧表中, 根据聚类结果, 检索出相似度较高的关键帧。例如对关键帧进行网格分析后, 发现该关键帧属于A类, 则从数据库中只对A类的关键帧进行相似度对比计算, 这样就节省了大量的时间, 在计算完毕后, 将这些相似度较高的关键帧列出来, 供用户选择, 用户选择出自己满意的关键帧之后, 根据数据库中的关联关系, 可以在数据库中直接检索出该关键帧对应的镜头和视频, 显示给用户, 即完成了一次视频检索。

当用户选择了多个关键帧进行检索时, 设关键帧用K1-Kt表示, t表示用户选择检索的关键帧数目, 首先根据第一个关键帧K1进行检索, 同样是首先进行网格分析, 得出距离最近的N个检索结果, 之后从N个结果中的第一个开始分析, 设第一个结果视频V有V1-Vm个关键帧, 当前关键帧K1和Vt相似度较高, 则从Vt-Vm循环和K2进行相似度计算找到第一个距离小于阈值t的视频, 如果循环完毕没有找到, 则从检索结果中去除v视频, 如果找到相似度小于阈值T的关键帧Vp, 继续在Vp-Vm中寻找K3, 直到Kt都在V中寻找到, 如果有Ki没有在v中相似度满足阈值, 则将视频V移出检索结果序列。本算法依次查找, 是充分考虑时间轴的影响因素, 在检索完毕后, 对检索结果进行二次排序并显示给用户。

4. 实验结果

对数据库中5000副图片进行分析, 首先要提取这5000副图片的特征向量, 本文选择7维的形状向量、8维的纹理向量和71维的颜色向量, 在提取完5000副图像的特征向量后, 对每一维取最大值和最小值, 然后利用公式对这5000副图像的所有特征向量进行归一化处理, 保证每一维的向量值都在0-1之间。经过统计发现, 98%以上的图片距离向量 (0, 0, 0, 0….0) 的距离在70-130之间。

所以本文就可以从70-130之间进行聚类, 分别以距离10聚类, 对一个镜头内的图片进行分析, 对镜头的内的所有图片进行分析, 设间隔是d, 对镜头的首帧进行分析, 确定镜头首帧所属类, 并查看其余帧所属类, 对10个镜头进行分析, 分别取d=10。第4类图片的截图如图4所示:

通过聚类发现, 例如下图中的5139和5382等, 通过聚类可以有效的将相似的图片聚类在一起, 在检索过程中可以减少对比的数量, 降低检索时间, 但是同一子类的图片之间也存在很大的不相关性, 说明每类之间有较大包容性和相似性。

5. 结束语

本文提出的视频检索算法在电视台视频管理系统中已经得到了很好的应用, 经过长期的实践表明该算法在同类算法中检索速度大大的增加。

摘要：在视频检索过程中每个视频有多个镜头, 每个镜头又存在多个关键帧, 检索过程中计算量很大, 本文提出基于镜头检索的视频检索算法, 并建立一个模型, 用于用户检索视频, 向用户提供单帧检索和多帧检索两种检索模式。通过测试表明本文的视频检索算法能够很好的检索视频内容。

关键词：视频检索,镜头,算法

参考文献

[1]Muneesawang P, Guan L.An interactive approach for CBIR usinga network of radial basis functions[J].IEEE Transactions on Multimedia, 2004, 6 (5) :703-716.

[2]Tang J, Acton S T.A decentralized image retrieval system foreducation.IEEE Information Engineering Design Symposium[C].2003:7–12.

【标准检索】推荐阅读：

文献信息检索课程文献检索参考课题05-24

动态检索05-29

检索算法05-29

语义检索07-04

检索软件07-29

统一检索09-07

查询检索09-27

文件检索09-06

数据检索07-19

优化检索论文05-30