检索方法

2024-10-13

检索方法(共10篇)

检索方法 篇1

面对因特网上大量且无序的信息资源广大读者不知从何下手, 要想快捷、全面而准确地从Internet中检索到相关的信息, 这就要求读者必须具备网络检索的基本知识和技能。长期以来, 如何快速且准确查找某专题信息是图书馆界一直探讨和研究的学术课题。现在我就本人所知的有关专题信息的检索工具和方法简要地归纳如下

1、书目信息

主要通过各种书目型数据库获取, 书目型数据库可用于查明关于某一专题有哪些出版物以及如何获取等信息。书目型数据库主要有联合目录、在版图书书目和网上书店目录以及各类型图书馆公共检索目录。

1.1 联合目录

书目信息检索工具国外主要有联机计算机图书馆中心 (简称OCLC, ) , OCLC联机联合目录数据库Worldcat, 它是世界上最大的书目数据库, 可检索字段有:主题、著者、引文、分类号、语种、出版局、出版地等。国内比较著名的书目检索机构还有CALIS联合目录数据库 (http://162.102.138.230/opac) 和上海图书馆的西文文献联合目录数据库检索系统 (http://www.linet.sh.en/ejex/ex/wx.htm) 等

1.2 在版图书书目

国际上比较流行的在版书目有《在版书目》简称 (BIP) 、《全球在版图书书目》简称 (GBIP) 、《国际在版图书书目》简称 (IBIP) 和英国在版图书书目 (British Books in Print, 简称 (BBIP) 。

1.3 网上书店目录

网上书店最著名的是亚马逊网上书店, 其检索途径可以通过该网页相应窗口获取, 检索字段有著者、书名、出版社、关键词、语种、ISSN号等。国内有当当网上书店、中华读书网等, 其检索方法是按书名、作者、出版社、分类号、语种等不同的检索途径来进行检索。

1.4 各类型图书馆公共检索目录

各类型图书馆联机公共检索目录 (简称OPAC) , 用户检索某个图书馆的OPAC, 只需直接登陆到相应的图书馆网站, 进入“联机公共书目查询”或“馆藏书目数据库检索”等栏目即可实现某一专题的检索。例如:查询清华大学图书馆公共检索目录, 就可以登陆其 (http://www.lib.tsinghua.edu.cn/index.html) 。

2、期刊信息

期刊信息的检索工具有 (以中国为例) :

(1) 、清华同方CNKI的《中国期刊全文数据库 (CJFD) 》 (http://www.cnki.net) , 收录7400多种期刊, 2400多万篇, 浏览器是CAJ, AdrobReader。

(2) 、重庆维普资讯有限公司《中文科技期刊数据库》 (http://www.cqvip.com) , 浏览器是VIP, AdrobReader。

(3) 、北京万方数据公司的《数字化期刊全文数据库》 (http://www.wanfangdata.com.cn) , 浏览器是AdrobReader

(4) 、人大复印资料 (http://www.zlzx.org/) 收录人文社科类期刊论文, 分大类。

(5) 、中国知识资源总库-CNKI系列数据库 (http://caj.jllib.cn/kns50/) 浏览器:CAJ, PDF

3、学位、会议论文信息

这一类检索主要分为5大类:一、PQDD (美国博硕士论文数据库) :是世界著名的学位论文数据库, 收录有欧美1000余所大学涉及文、理、工、农、医等领域的博、硕士学位论文, 浏览器是Adobe Acrobat Reader;二、万方数据库资源系统 (http://hk.wanfangdata.com/) , 《中国学位论文全文数据库》和《中国学术会议论文全文数据库》是万方数据库资源系统的一个分支;三、中国知网 (CNKI) (http://www.cnki.net/index.htm) ;四、中国高等教育文献保障系统 (http://opac.calis.edu.cn/simpleSearch.do) ;五、中国重要会议论文全文数据库: (CPCD) China Proceedings of Conference Fulltext Database, 收录我国2000年以来国家二级以上学会、协会、高等院校等单位的论文集。

4、网页与新闻信息

主要是通过使用搜索引擎查找与该专题有关的信息和要闻。

搜索引擎 (search engine) 是运用特定的计算机程序收集互联网上的信息, 在对信息进行组织和处理后, 为用户提供检索服务的系统。搜索引擎大都提供分类查询, 用户输入关键词进行检索, 搜索引擎从索引数据库中找到匹配该关键词的网页并将检索结果显示与排列。

国外著名英文搜索引擎包括:1、Google http://www.google.com;2、Yahoo http://www.yahoo.com;3、Live http://www.live.com;4、SearchMash http://www.searchmash.com/。

国内著名搜索引擎网址有:1、百度http://www.baidu.com/;2、雅虎http://search.cn.yahoo.com/;3、Google http://www.google.cn/;4、搜狐搜索引擎http://www.sogou.com;5、新浪网http://www.iask.com/

参考文献

[1]赵惠芳:《学位论文信息的检索与获取》[J].现代情报, 2003, (09)

[2]周丽霞:《网络信息检索研究综述》[J].情报科学, 2004, (04)

检索方法 篇2

基于Deform-3D的身管径向锻造工艺数值模拟研究与应用

一、检索文献

1、采用中国知网(/)网站进行检索,进入页面后点击“文献检索”,弹出如图6所示页面,在检索出输入“径向锻造与数值模拟”关键字,选择数据库栏勾选需要的栏目,搜索结果如图7所示。

图6:国家科技图书文献中心检索页面

图7:检索结果

二、注册“重庆市科技文献共享平台”用户

通过重庆理工大学图书资源处进入重庆市科技文献共享平台进行用户注册,点击“注册完成”,登入界面,进行相关操作机索取相关文献资源。具体操作步骤如下图所示:

三、索取文献资料

在上述“重庆市科技文献共享平台”完成注册后,登陆索取相关文献,点击“文献服务”——“索取原文”,填写相关信息,完成后,点击“提交”,向平台发送相关信息要求,具体步骤如下:

其余文献索取方法与上面相同,此次向“重庆市科技文献共享平台”索取的文献有:《身管径向锻造过程解析分析与数值模拟》、《Simulation of 42CrMo steel billet upsetting and its defects analyses during forming process based on the software DEFORM-3D》、《径向锻造三维成形锻透性的数值模拟》、《身管冷径向锻造残余应力的模拟研究》,完成后,点击“我的文献传递”处,查看提交的信息,如图所示;其他部分文献向百度文库也可进行搜索与下载。

四、文献综述

检索方法 篇3

关键词:无线通信;非专利;检索

中图分类号:G306 文献标识码:A 文章编号:1674-7712 (2014) 18-0000-01

在发明专利申请实质审查程序中,检索是一个关键步骤,其主要目的在于找出与申请的主题密切相关或者相关的现有技术中的对比文件,审查员除了要在专利文献中进行检索外,通常还应当对非专利文献进行检索。

近年来,在无线通信领域,以华为、中兴为代表的国内申请人向国家知识产权局提交的PCT国际申请以及发明专利申请的申请量近年来增长迅速,通过对欧洲专利局(EPO)非专利文献资源的研究,2004年EPO检索报告引用的非专利文献资源占全部引用文献的14%,通信领域申请集中H部分类号下非专利文献引用率高达31%[1]。因此,无线通信领域非专利文献检索的重要性日益突显,对无线通信领域的专利审查员也提出了更高的要求。然而,由于无线通信领域申请涉及的标准、协议较多,非专利文献数据库分散、未经过专门标引、协议内容庞杂和用语标识性不强等因素[2],对于非专利文献的检索存在一定的难度,本文的目的在于针对无线通信领域的非专利检索方法进行一些有益的探讨。

一、无线通信领域的非专利资源

通信领域存在诸多标准组织,用于制定行业的技术标准,例如国外的以第三代移动通信技术的演进为研究主线的3GPP标准组织、以局域网和城域网为研究对象的IEEE802标准组织[3],以及国内的中国通信标准化协会(CCSA),无线通信领域相当数量的发明都是对这类标准的改进。

3GPP是由欧洲的ETSI,日本的ARIB和TTC,韩国的TTA以及美国的T1在1998年底发起成立的,3GPP标准组织以第三代移动通信技术的演进作为研究主线,它由很多TSG(Technical Specification Group)构成,每个TSG进一步细分为很多WG(Working Group),每个TSG会制定获得批准的标准TS(Technical Specification),提交对于某一主题的调查或可行性报告TR(Technical Report),作为未来技术规范的基础。TSG的每个WG例行召开一些会议,讨论对于标准的修改,在会议前WG的各个会员将向3GPP的FTP上传自己提交的会议提案(即临时文档Temporary Document)。

IEEE802协会主要开发数据通信标准以及其他标准,IEEE802委员会负责起草局域网草案,并送交美国国家标准协会(ANSI)批准和在美国国内标准化。

CCSA是中国国内企、事业单位自愿联合起来开展通信技术领域标准化活动的团体,开展通信标准研究工作,把通信运营企业、制造企业、研究单位、大学等关心标准的企事业单位组织起来制定标准,把具有我国自主知识产权的标准推向世界,支撑我国的通信产业。

二、具体检索方法

各个公司在参与通信标准化的过程中,通常会预埋相应的专利。与协议相关的专利申请中,为了对协议标准进行改进或增强,提出了相应的技术方案。因此,在对与协议标准相关的专利申请进行检索的时候,必须十分重视相同技术方案的协议标准提案的检索。

在无线通信领域的非专利检索过程中,经常需要使用3GPP、IEEE或CCSA等网站,甚至要结合百度、Google等搜索工具进行检索。下面将结合笔者在实际的专利审查过程中所遇到的具体案例来探讨无线通信领域协议标准的检索方法。

案例:

【基本案情】

申请号:200780011900.4,申请日:2007-2-6,优先权日:2006-2-8。

权利要求1:一种下行链路的信道构成方法,用于无线通信系统,其特征在于,该方法包括以下步骤:

作为传输信道而包含广播信道、寻呼信道、和下行共享信道的步骤;

作为物理信道而包含被映射所述传输信道的下行共享信道的物理下行共享信道的步骤;以及

不使用对各用户单独分配的单独信道,而在多个用户间共享所述下行共享信道的步骤。

【检索过程】

步骤一:通过本申请说明书发明内容部分的记载“另一方面,在使第三代的标准进化的演进(Evolved)UTRA(Universal Terrestrial Radio Access,通用地面无线电接入)中,由于是全部数据都通过分组传输来发送的结构,所以需要重新考虑适于全分组传输的传输信道和物理信道的构成方法和它们之间的映射关系”可以得出初步判断,本申请有可能是基于3GPP协议标准的改进。步骤二:进入3GPP网站(http://www.3gpp.org/)进行检索,点击3GPP主頁中的高级FTP检索入口。步骤三:输入广播信道、寻呼信道、下行共享信道对应的英文缩写BCH、PCH、DL-SCH进行检索。步骤四:二次检索,增加“物理下行共享信道”的英文关键词进行检索,得到的检索结果。

本案例体现了无线通信领域非专利文献检索的一种常用方法,即3GPP协议标准的检索方法,首先通过阅读说明书或者进行专利文献库的检索,了解现有技术的现状及本申请的发明点,然后提取准确的关键词到3GPP网站进行检索,并根据检索结果进行检索策略的调整,最终获得可以评价权利要求新颖性或创造性的对比文件。

三、结束语

在通信技术飞速发展的今天,在坚持以三性评判为主线的全面审查工作的指导思想下,充分拓展非专利文献的检索途径对无线通信领域的审查员来说是提升检索实力的一个重要方向。笔者在发明专利的实质审查工作当中,通过对实际案例的检索,摸索出了一些针对协议标准提案的检索技巧,检索思路和检索过程对于无线通信领域涉及标准的非专利检索具有一定的借鉴意义,有助于提升非专利文献的利用率。

参考文献:

[1]董小灵.EPO非专利文献资源分析[J].审查业务通讯(增刊二),2006.

[2]2011年检索质量提升报告[J].学术研究,2011(05).

[3]吴荻.通信领域特殊非专利文献的获取技巧[J].审查业务通讯,2012(02).

检索方法 篇4

Pro Quest检索系统是美国Pro Quest Information and Learning Company公司开发的信息检索系统。Pro Quest检索平台提供了一组数据库, 涉及商业管理、社会与人文科学、科学与技术、金融与税务、医药学等广泛领域, 包含学位论文、期刊、报纸等多种文献类型。该平台提供文摘题录信息, 大部分文献有全文。该库提供多种索引、全文及全文图像资料库。数据库的主要特点是将二次文献与一次文献“捆绑”在一起, 为最终用户获取文献提供一体化服务, 检索结果为文献的目录、文摘、全文, 在检索文摘索引时可以实时获取全文信息。

2 检索基本方法

2.1 访问入口:Pro Quest检索平台, 或登陆hppt://proquest.umi.com/pqdweb。

2.2 选择检索数据库。

Pro Quest检索系统中每个数据库都涵盖一些有影响的专业领域或某一个出版物, 比如:PHMC医学数据库 (Pro Quest Health and Medical Complete) 收录1446种医学专业期刊, 其中包含1100多种带有完整全文图像的重要的基础医学、临床医学及卫生健康方面的全文专业期刊;药学信息数据库 (Pharmaceutical News Index) 提供了药学新闻、制药研究、药物法规等方面的信息。覆盖了药学、医疗保健、生物技术和医疗设备等方面的专业出版物, 目前出版物有20种。

2.3 选择检索方式。Proquest系统提供了4种检索方式:基本检索、高级检索、主题检索、出版物检索。

2.3.1 基本检索 (Basic) 。

是系统默认方式, 在检索框中输入关键词、词组或检索式进行检索, 也可使用系统支持的各种运算符构造检索式查询。在“Date range”的检索框中选择出版时间段, 如“2005-present”;在“Limit results”复选框中分别显示为:仅显示有全文的文献;显示发表在学术期刊上的文献。选择完毕后, 点击“Search”按钮。需要注意的是, 用于检索的词组超过三个词时须用双引号把检索词括起来。如:“肺癌手术治疗”。

2.3.2 高级检索 (Advanced) 。

高级检索是用于从多个途径组配查询, 此方式功能较强, 可快速查询特定文献。高级检索除了可以在检索框中输入检索词、词组或检索式, 通过下拉列表和链接点也能完成检索框的填写, 它将多个字段组合在一起, 提供精确与快速的搜寻。选择此方法可以提高查全率和查准率。“高级检索”除具有基本检索的全部功能外, 主要增加了以下功能。a.字段选择功能。点击字段选择下拉菜单, 选择要检索的字段:引文和摘要、引文和文章正文、摘要、文章内容、文章篇名、文章类型、作者、公司、分类代码、图象题注、人名、产品名、出版物名、主题。可任意选择检索字段。b.多检索条件增减功能。如果要添加多个条检索条件, 单击“添加一行”, 否则可选择“删除一行”。可任意增减检索条件。c.更多检索选项。显示更多的检索选项, 提供出版物名称、学科、公司、人名、分类代码、等字段的主题浏览功能, 可在系统提供的词库中查找准确的主题词检索。出版物类型、检索结果的排列顺序等。

实例:用关键词查找有关“肿瘤间质血管发生的调控及意义”方面的文献。首先选择Pro Quest Health and Medical Complete在多个字段中分别输入“Vascular endothelial growth factor”血管内皮生长因子;肿瘤间质血管“Stromal blood vessel”及间质“Stroma”三个关键词, 在字段的下拉菜单中都选“引文和摘要”, 表示这三个关键词都在引文和摘要中出现。时间限定在2005-2009年之间, 并发表在学术期刊上的全文文献。点击“Search”按钮。检索结果:共检出5篇符合条件的相关文献。

2.3.3 主题检索 (Topics) 。在无法给出检索词时可采用此方法, 这里

列出了数据库记录涉及的主题, 通过逐层点击主题概念, 获得检索结果。点击系统界面上方“主题指南”按钮, 进入此检索界面。主要有两个功能:a.查找定位主题, 检索某一特定主题的文献在检索框输入一个术语, 点击“查找短语”。检索到的主题词可有“所有主题”、“学科”、“公司”、“人员”、“位置”五大类显示, 可分别点击查看, 找到要检索的主题词。点击主题词下“查看文章”按钮, 查看该主题的文章。b.浏览学科目录, 检索某一特定主题的文献, 点击“browse the subject directory按学科浏览主题”按钮, 显示系统的学科分类。主题树使文章查找非常容易。只需在列表中逐级点击类目查看相关主题词, 直至最后一级, 显示“查看文章”, 可点击查看该主题的相关文献。

实例:用主题检索有关“水污染的治理与改善———细菌”。从主题检索入手, 逐步限定条件, 缩小范围, 检出切题文献。点击“browse the subject directory”主题树中的主题类目“Environment”, 在Environment类下的四级类目中“Water pollution”点击“查看文章”, 共检出1554篇相关文献;进一步限定“Water pollution AND Bacteria”, 检出结果87篇;最后主题限定“Water treatment”水治理, 最终结果11篇。

2.3.4 出版物检索 (Pblication) 。

用于从出版物名称途径检索某报纸、杂志上的所有文章;也可按出版物名称字顺浏览杂志。进入出版物检索界面后, 在检索框中输入出版物的名称或第一个单词, 点击“search”, 可检索到某个具体出版物或含检索词的出版物, 如输入“The American Journal of Medicine”期刊名, 进入该出版物检索。可检索到该刊相关的年、卷、期及全文。也可点击检索框下的“Show all publications”浏览该数据库所包含的所有出版物名称列表。点击出版物的名称后, 可按年、卷、期索引浏览每期全文。

3 系统特点与检索策略

Pro Quest数据库系统的最大特点是实现了一次文献和二次文献的集成, 可随时获取全文信息, 实现文献一体化服务。Pro Quest数据库系统的主题检索, 为用户提供方便。系统提供了多项检索指南, 便于初学者使用。

3.1 实现高查全率。

查全率是定量从对象数据库中检索到相关条目的程度, 高的查全率可节省用户从其它数据库中查找相关信息的时间。在Pro Quest数据库检索中实现较高的查全率, 尽量多采用同义词、近义词构成检索式进行检索。

3.2 实现高查准率。

查准率是检索出的相关性条目数与检出的全部条目数之比。高的查准率可节省用户从检出的所有文档中过滤无用文档的时间。在Pro Quest数据库检索中实现较高的查准率, 可采取: (1) 尽量利用系统提供的限定条件选项, 对检索项目进行多重限定, (2) 在同一检索字段中, 增加检索条件限定, 并以“AND”连接, 实现精确检索。

摘要:主要介绍ProQuest数据库检索系统的检索功能与检索方法。该系统将二次文献与一次文献“捆绑”在一起, 用户使用查找全文十分方便。

关键词:ProQuest,数据库,检索方法

参考文献

[1]肖珑.互联网上的全文数据库与全文服务[J].大学图书馆学报, 2000 (3) :3-8.

[2]胡琼.基于WWW的全文检索系统检索性能探讨[J].情报科学, 2001, 19 (6) :639-642.

[3]肖京华.ProQuest ASTP数据库及其检索技巧[J].大学图书情报学刊, 2003 (3) :40-41.

[4]陈伟.ProQuest数据库及其检索利用[J].现代情报, 2004 (10) :146-148.

检索方法 篇5

一、相关法律、法规

《中华人民共和国民事诉讼法》(内容略)

《关于逾期付款的违约金应依据何种标准计算问题的复函》[1994]10号(内容略)

《关于逾期付款违约金应当依据何种标准计算问题的批复》法复[1996]7号(内容略)

《关于降低金融机构存、贷款利率的通知》〔1996〕156号(内容略)

《关于逾期付款违约金应当按照何种标准计算问题的批复》[1999] 8号(内容略)

《关于修改<最高人民法院关于逾期付款违约金应当按照何种标准计算问题的批复》法释[2000] 34号(内容略)

《最高人民法院关于审理建设工程施工合同纠纷案件适用法律问题的解释》法释

[2004]14号(内容略)

二、关于逾期付款违约金及迟延履行金的区别

在合同违约中,逾期付款是一种最常见的违约行为。依据《中华人民共和国合同法》及有关法律规定,合同对逾期付款有约定的应当按照合同约定承担违约责任。如果合同当事人对于逾期付款的违约责任未予明确约定的,守约方仍可向法院主张违约方承担法定违约金责任,其中逾期贷款承担的违约金是按人民银行规定标准计算的逾期利息,其他逾期付款违约金按最高人民法院司法解释是参照逾期贷款利息标准。

违约方如若在判决书中确定的履行期满仍未支付逾期付款本金及利息,按民事诉讼法的相关规定应承担迟延履行金。

逾期付款违约金计算标准的计算方法

最高法院曾专门就逾期付款违约金的计算问题出台过四个司法解释:

1.1994年3月12日公布的《最高人民法院关于逾期付款的违约金应依何种标准计算问题的复函》(法函[1994]10号)中,将逾期付款违约金的计算标准确定为“应按逾期付款金额每日万分之三计算”。

2.1996年5月16日公布的《最高人民法院关于逾期付款违约金应当依据何种标准计算问题的批复》(法复〔1996〕7号)中,将这一标准变更为“应当按照逾期付款金额每日万分之五计算”。

3.1999年12月9日,最高法又公布了《最高人民法院关于逾期付款违约金应当按照何种标准计算问题的批复》(法释〔1999〕8号),其中规定:“对于合同当事人没有约定逾期付款违约金标准的,人民法院可以参照中国人民银行规定的金融机构计收逾期贷款利息的标准计算逾期付款违约金。中国人民银行调整金融机构计收逾期贷款利息的标准时,人民法院可以相应调整计算逾期付款违约金的计算标准。参照中国人民银行1996年4月30日发布的银发〔1996〕156号《关于降低金融机构存、贷款利率的通知》的规定,目前,逾期付款违约金标准可以按每日万分之四计算”。

4.2000年11月21日,针对中国人民银行的利率调整经常造成最高法的司法解释与现行金融机构计收逾期贷款利息的标准不一致的现象,最高法又出台了《最高人民法院关于修改<最高人民法院关于逾期付款违约金应当按照何种标准计算问题的批复>的批复》,将上述1999年公布的批复中的最后一句,即“参照中国

人民银行1996年4月30日发布的银发〔1996〕156号《关于降低金融机构存、贷款利率的通知》的规定,目前,逾期付款违约金标准可以按每日万分之四计算”删除。也就是说,从这个解释出台以后,逾期付款违约金的计算标准是跟随人民银行公布的金融机构计收逾期贷款利息的标准浮动的。对逾期支付建设工程款违约金标准中国人民银行发布的同期同类贷款利率计息,对其他逾期付款违约金采用逾期贷款利率计算。

现阶段的计算标准及问题

在采取了这种相对“灵活”的标准后,逾期付款违约金的计算标准又分为了两个阶段:

1.2000年11月21日至2004年1月1日,根据《中国人民银行关于降低存、贷款利率的通知》(1999年6月10日)第六条的规定,自1999年6月10日起,金融机构逾期贷款利率降为日利率万分之二点一(折年率为7.56%)。因此,在这期间审理案件涉及逾期付款违约金的,其计算标准均为日利率万分之二点一。

2.2004年1月1日至今,由于2003年12月10日,中国人民银行发出《中国人民银行关于人民币贷款利率有关问题的通知》(银发[2003]251号),其中第三条将逾期贷款利率(罚息利率)由现行的日利率万分之二点一修改为:“在借款合同载明的贷款利率水平上加收30%~50%”。该通知自2004年1月1日起施行。因此,现阶段逾期付款违约金的计算标准从一个确切的数值变成了一个模糊的范围。

由于上述人民银行的通知将以往直接确定逾期贷款利率的方式,改为援引“借款合同载明的贷款利率”的方式。使得在实践应用上出现了一些问题,尤其是当合同中没有约定利率或者是非借款合同的情况下,现行的司法解释就显得操作性不强了。这也给法官在实际审判中带来了难题:一方面,万分之二点一的逾期贷款利率已被明确废止,在名义上已不具备法律效力;另一方面,现行的逾期贷款利率又不具有可操作性。遗憾的是,到目前为止,最高法并未就此问题再出台任何新的司法解释。

目前司法实践中的几种做法

1.仍按日万分之二点一的标准计算。法释〔1999〕8号司法解释中,最高法关于人民法院参照金融机构逾期贷款利率确定逾期付款违约金计算标准的规定,用的措辞是“可以”,而不是“应当”、“必须”。因此,审理案件的法官也可以选择不参照金融机构逾期贷款利率,所以,在现行逾期贷款利率不具有可操作性的情况下,选择一切照旧也不失为一个办法。

2.变通适用现行的逾期贷款利率

在非借款合同中,若当事人没有约定逾期付款违约金标准,则可以人民银行公布的贷款基准利率加收30%~50%作为逾期付款违约金的计算标准。具体而言,截至起诉之日,按违约时间同期的贷款利率加收30%~50%为标准,来计算逾期付款违约金。举个例子,双方约定的最后付款日期是1月15日,但买方到期没有付款,卖方于是在3月15日起诉买方,则截至3月15日,卖方的违约时间是两个月,应该按照中国人民银行公布的现行金融机构贷款基准利率——六个月以内(含六个月)为4.86%加收30%~50%计算违约金。

三、标准表格

最高人民法院关于逾期付款违约金计算标准一览表

新闻视频片花检索新方法 篇6

关键词:新闻片花,时空切片,主色调,纹理特征

1 引言

由于宽带网的普及,越来越多的视频内容被搬到互联网上,如视频点播、数字图书馆等。基于内容的视频数据检索得到越来越广泛的应用[1,2]。然而在一系列视频中,新闻视频的应用范围更广,以江苏电视台为例,“南京零距离”和“甲方乙方”2个精品小栏目的片花重复出现,且位置不固定。传统的方法是利用人工来剪裁素材,然后放到互联网上供用户点播,费时费力,因此如何由计算机自动分割出精品小栏目的片头和片尾是实现高效点播系统的关键,同时片花的准确定位对于新闻视频结构的分析也具有重要意义。

近年来,关于新闻片花检索的研究较少,已有的研究是文献[3]。文献[3]将片花的定位分为2步:首先通过单帧对比得到所有和片花代表帧相似的帧,然后再利用小段视频的组合帧和视频库进行对比,通过连续性分析实现对片花的准确定位。该方法存在以下缺点:由于视频数据量巨大,单帧对比时间复杂度高,并且前提是片花内的各帧比较相似。随着片花制作的多样性,片花各帧也可能有较大差别;其次在通过小段视频定位阶段,区间长度的设置会影响最终定位的精度。

对于电视节目中的片花而言,一般采用动感、渐变、具有动态效果的背景,颜色比较鲜明饱满,持续帧数很短,然而用镜头检测方法检测出的镜头效果并不明显,所以不能通过关键帧检索。综合文献[3]和片花的这种特点,笔者提出了一种新的片花检索方法。该方法分为3个阶段:第一阶段是镜头分割,然后根据待检索片花的长度信息和视觉特征过滤掉不相关的镜头;第二阶段是进行镜头切片合并得到查询结果的候选片段;第三阶段是将候选片段融合为时间切片,然后根据片花切片特点提取其底层特征得到最终检索结果。

2 新闻片花特征提取

2.1 时空切片的定义

时空切片是将具有时间序列的视频内容融合为一个2D图像,实现三维视频到二维图像的转化。时空切片的定义如下:

设视频节奏为θ,原视频中每一帧表示为视频节奏的一条竖线

式中,z∈∈0,1,…,Mθ-1∈,t∈∈0,1,…,Nθ-1∈,Mθ和Nθ分别是视频节奏的高度和宽度,rx和ry是像素取样的方向因子,a和b为每帧的偏移量,ft表示视频帧,M,N分别代表视频帧的宽度和高度。图1表明了视频节奏的构造方式:当rx=ry=1,a=b=0,并且M=N时,得到每帧图像对角线上的像素;当rx=1,ry=0,a=0,b=N/2时,得到每帧图像水平方向中线上的像素;当rx=0,ry=1,a=M/2,b=0时,得到每帧图像垂直方向中线上的像素。

2.2 新闻片花时空切片的特征表达

因为电视台工作人员常在片花的开始和结尾处做一些特殊效果,同一个节目的片花可能在长度和开始结尾处稍有不同,同时切片图像具有较为鲜明的纹理特征,且新闻片花颜色鲜艳饱满,由此本文采用分块主色调和纹理特征相结合的方法进行检索。时间切片的颜色特征采用分块加权主色调[4],本文将时间切片的分块方法见图2。

图2a表示在垂直方向进行分块,当采用垂直采样构造时空切片时采用左、中、右的分块策略。图2b表示在水平方向进行分块,当采用水平采样构造时空切片时采用上、中、下的分块策略。A1,A2,A3分别为分块图像所占的比例,A1+A2+A3=1,根据人类视觉对图像的关注程度集中和片花的特点,A1,A2,A3的取值应满足以下条件:A2>A1,A2>A3。ω1,ω2,ω3为对应分块主色调直方图距离所占的比例,ω1+ω2+ω3=1。纹理特征中,图像的灰度共生矩阵已被理论证明并且实验显示它在纹理分析中是一个很好的方法,广泛用于从灰度图像中提取纹理特征。本文提取了与人类视觉感知特性有明确对应关系的4个特征,包括纹理的一致性,熵,对比度和相关性[5]。

3 检索算法描述

首先采用基于字符串匹配的方法对新闻片花做镜头分割,根据式(1)将每个镜头融合为一个时间切片,然后提取每个时间切片的颜色特征形成查询特征向量,同理对视频库作相同的处理并去掉长度大于片花总长度的镜头。查询片花Q的时间切片序列为q1,q2,…,qn,每个时间切片qi查询得到的相似镜头切片集合为Si=s1i,s2i,…,smi。Ri,R0,…,Rn中所有在时间上连续的切片合并为候选片段,最后再将所有的候选片段融合为切片,这些切片与查询切片的相似度的排列顺序就是查询片段Q的查询结果。具体检索算法如下:

1)用字符串匹配算法[6]进行镜头分割。2)根据长度信息过滤掉不相关的镜头,然后对每个镜头用时间切片融合算法融合为镜头切片qi,提取其底层特征。3)循环:对于每个镜头切片qi,在镜头切片库中检索与其相似的k个相似镜头切片,此处设定一个较小阈值T,检索所有大于T的相似切片,得到镜头切片集合为R=R1,R2,…,Rn。4)根据Ri中镜头切片在视频数据中的顺序排序。5)将集合R中所有的镜头切片根据候选片段合并规则合并为若干个候选片段c=c,c2,…,ck。6)依据每个候选片段ci在视频库中的起始帧和结束帧融合为切片si,根据其视觉特征计算候选片段切片与查询片段的综合形似度。7)结果集S=s1,s2,…,sl的相似片段根据相似度排序输出。

候选片段ci合并规则如下:初始化ci为空,对R中的每个镜头切片,如果其满足时间连续性约束条件,则将其融合到ci中;否则初始化ci+1为空,继续融合下一个镜头切片。时间连续性约束条件为

式中:Tri+1beg是集合R中第i+1个镜头切片的起始时间,Tribeg是集合R中第i个镜头切片的起始时间,Tribeg是集合R中第i个镜头切片的结束时间。条件(1)说明相邻的2个镜头切片在时间上连续;条件(2)说明在时间上不连续的镜头切片也有可能属于同一个候选片段,例如电视台工作人员对某个栏目的片花做一定特效处理后有可能在步骤3)中漏检一个或者多个镜头切片。Tri+1end-Tribeg≤T说明某个镜头切片的持续时间不应大于T,阈值T根据查询片花的长度设定,本文设置为查询片花的总帧数的110%,原因在于对于片花而言,假设某2个镜头切片在同一个候选片段内,而它们之间的相隔时间大于此阈值,那么这2个镜头切片之间存在漏检镜头并且漏检镜头总帧数大于查询片段,此时这2个镜头切片几乎不可能在同一个候选片段内,与假设矛盾,所以将阈值设为查询片花总帧数比较合理。用户可以根据设计情况自行设定。

4 实验结果及分析

实验用的视频数据是来自于江苏城市频道的“1860节目”,视频中包含多个节目片花,分别有3个“甲方乙方”片花和3个“南京零距离”片花,其时空切片如图3所示。从视频中抽取1个甲方乙方片花和1个“南京零距离”片花作为查询片段。实验分析了检索算法中关键参数和不同特征对检索效果的影响,并且与已有研究进行了对比。

需要说明的是本文实验结果的查准率是指片花定位的位置相对于实际位置的偏移程度,偏移程度越大,准确率越低,查全率主要衡量是否检索到所有相似的片花。其中查准率的具体定义如下

式中:offset_beg是指检索到的起始位置相对于其在视频库中位置的偏移程度;offset_end是指检索到的结束位置相对于其在视频库中位置的偏移程度。

图4给出了在检索相似镜头切片时各个阈值对结果的影响。由图可以看出,构造镜头的相似镜头切片集的阈值设为0.4,0.5时,检索的准确度相同并且都达到了90%以上;当阈值设为0.6时,准确度分别为88%和86%,并且不能准确定位出“甲方乙方”的位置。原因在于本文的过滤主要是通过镜头长度过滤,而底层特征过滤只是为了防止构造过多的候选片段,镜头检测方法对片花检测效果不理想,所以较高的阈值会过滤掉片花中某些镜头。由此在构造每个查询镜头的相似镜头切片集时应将阈值设置为较小值以防止漏检某些镜头切片。

表1给出了从“甲方乙方”和“南京零距离”时空切片中提取不同的特征对检索结果的影响。由表看出,在时空切片上用分块主色调和纹理特征相结合的方法取得的效果最好。对甲方乙方而言,用主色调特征取得了100%的查全率,但是查准率是75%,其原因在于该片花与查询片花在尾部有所不同,并且持续时间也有差别,而利用分块主色调和纹理特征的方法可以克服片花在头和尾不同带来的误差。对于“南京零距离”而言,直方图与分块主色调和纹理相结合的方法都取得了很高的查全率和准确率,原因在于该片花在视觉上极为相似,并且片花在持续时间上稍有差别,几乎是完全相同的几个片花视频。

表2给出了当镜头切片阈值设为0.5,采用分块加权主色调和纹理特征相结合的特征提取方法时,该方法与文献[3]比较的实验结果。由表2可以看出,本文的方法明显优于文献[3]提出的方法,原因在于:1)文献[3]是利用单帧对比确定片花的范围,同属一个片花的帧会被分割为几部分。本文利用镜头切片和片花的长度信息首先过滤了很多不相关的长镜头,例如主持人镜头、新闻镜头等,并且切片充分利用了镜头内各帧的信息,区分度更高。2)文献[3]在小段视频对比阶段,由于同一个片花的长度不同,对比区间的设定会影响最后定位的精度。而本文在镜头过滤后通过连续性原则进行合并,不需要设定合并区间。此外,文献[3]利用单帧对比或多帧对比都会极大地提高检索定位的复杂度。

5 总结

笔者根据新闻片花的特点提出了一种片花检索新方法,该方法是基于时空切片的,先根据新闻片花的长度信息和视觉信息进行粗过滤,然后再进行精确定位,从检索速度和效果上都取得了较好的效果。笔者下一步的工作将研究片花的自动提取,同时还可以根据片花的大字幕定格信息作为检索的依据。

参考文献

[1]卢汉清,孔维新,廖明,等.基于内容的视频信号与图像库检索中的图像技术[J].自动化学报,2001,27(1):56-69.

[2]章毓晋.基于内容的视觉信息检索[M].北京:科学出版社,2003.

[3]丁汶涤,王崇骏.基于全局颜色的图像检索算法与实现[J].计算机科学,2004,31(2):142-144.

[4]BEZERRA F N,LEITE N J.Video transition detection using string matching:preliminary results[J].Computer Graphics and Image Pro-cessing,2003:44-45.

[5]HARALICK R M,SHANMNGAM K,DINSTEIN I.Texture feature for image classification[J].IEEE Trans.Systems,Man and Cybernet-ics,1973,3(6):768-780.

浅谈化工文献的检索方法 篇7

1 化工文献定义

当今正处于知识大爆炸的年代,各类信息形成之快、传播之速如潮水一般汇集成无穷无尽的海洋,而文献是构成信息海洋的重要组成部分。化学文献同其它文献一样,是人们从事生产和科学实验的记录。化学文献的数量和递增速度在整个科技文献发展中始终占居着领先的地位。

化工检索是查找化工方面信息的重要方法和手段,它能使人们在浩如烟海的信息海洋中迅速正确全面地查找所需信息。要做到快速检索,首先要熟悉检索的途径和工具。文献检索工具最近几年发展越来越快,数量越来越大,类型越来越多,分类方法也更趋多样化。

2 化工文献分类

文献种类繁多,按其类型划分,有图书、期刊杂志、科技报告、学位论文、会议资料、专利文献、技术标准、技术档案以及产品样本等; 安文献的性质划分,有一次文献、二次文献和三次文献[1]。所谓一次文献指原始文献; 二次文献是将分散的无组织的原始资料经过加工整理、简化、组织等工作,如著录文献特征,摘录内容要点,使成为系统的文献,以便查找与利用。如书目、索引、文摘等,即所谓检索工具; 三次文献是指通过二次文献,选用一次文献内容而编写出来的成果,如专题述评、学科年度总结、动态综述、进展报告、数据手册、百科全书等等[2]。从文献检索来说,一次文献是检索的主要对象,而二次、三次文献则是检索的手段与工具。化工文献的快速检索实际上就是利用由二次、三次文献形成的检测工具/数据库[3]。

3 化工文献检索办法

文献检索需要一定的策略。检索策略,顾名思义,分析课题具体内容及涉及关键词后,确定检索的工具或数据库、检索途径和检索词,为了快速查找确定目标文献,可以安排检索词的前后顺序和逻辑关系[2]。还可以使用专题检索工具及专业数据库,并收集一些专题信息网址,例如常用的万方、中国知网、维普等重要的数据库,利用根据选定的检索系统、数据库的特点,进一步优化主题词、选用检索系统规定的代码、选用常用的专业术语、选用同义词与相关词等技巧综合运用进行查询我们所需要的文献知识。

进行化工文献检索时,推荐使用SCIFINDER检索数据库。SciFinder Scholar是美国化学学会(ACS)旗下的化学文摘服务社CAS(Chemical Abstract Service)所出版的《Chemical Abstract》化学文摘的在线版数据库学术版,它是全世界最大、最全面的化学和科学信息数据库。包含CAPLUSSM、CAS REGISTRYSM、CASREACT&reg、CHEMCATS®CHMLIST®MEDLINE、MARPAT七个数据库。使用SciFinder时,可以使用structure search功能,可以进行单个化合物的检索,也可以进行化学方程式检索,可以进行分子式的检索,还有CAS number的检索和关键词检索。更推荐用SciFinder自带的结构式绘制工具绘图后进入检索界面,点击File-Open后进入SciFinder进行检索。如果搜索反应式时,可以先考虑使用产品或者原材料进行搜索,往往有意想不到的结果。

使用Reaxys进行化工文献检索也是很不错选择,Reaxys是Elsevier ( 爱思唯尔) 公司推出的重磅产品,重新整合Cross Fire Beilstein、 Chemistry专利化学信息数据库、 Patent Chemistry和Gmelin四大数据库,比CA更方便快捷,提供了更多的检索方式,而且容易上手,查询结果会将化合物的合成,理化性质,波谱等分别列出。Reaxys将化学反应和化合物数据检索与合成线路设计功能完美地无缝对接,使科技检索工作更加高效、精准。结构式检索、关键字检索、联合检索等灵活的检测方法和检测手段可以节约大量时间,另外还具有合成路线的智能设计等特色功能为合成课题的设计提供依据。

检索文献也是一个积累的过程。平时注意收集一些与自己相关的数据库全文的权限,如免费链接,一般代理,eproxy的帐号,密码等。同时也要提高自己搜取文献的技能,如google,pubmed等的技能,要做到心中有数,比较熟练,查文献就好办了。有了上述的技能,权限之后,就可以快速检索到需要的文献。

4 合理利用Internet免费化工资源

Internet上化工资源质量参差不齐、数量繁多,但是很多资源是收费或者积分制,给经费不足的或经验不足的化工科技工作者带来较多不便。但是也有一些仅凭会员注册就可以免费使用的数据库较为方便。

4. 1 NIST Web Book

NIST WebBook是美国国家标准与技术研究所数据汇集而成的数据库,网址是http://www.webbook.nist.gov,该数据库包括4 000多种有机和无机化合物的热化学数据,5 000多种化合物的红外光谱,1 300多个反应的反应热,12 000多种化合物离子能量数据,8 000多种化合物的质谱。登录数据库后可通过化学品名称、化学物分子式或者CAS登录号进行查找化合物的各类数据。

4. 2 危险化学药品数据库

危险化学药品数据库是欧洲化学品管理局建设的单一可检索的化学品数据库,旨在列出欧盟进口或使用的每种化学药品,该数据库任何人都可以到这里查找所需化学药品的信息。化学品数据库项目包含了4 300种物质,网址是http://ull.chemistry.uakron.edu/erd),可以通过化学品名称、化学物分子式及登录号进行查询。

4. 3 美国化学会期刊杂志

该杂志是美国化学会(ACS)为全球化学研究机构、企业及个人提供高品质的文献资讯而建立的化学期刊数据库,ACS电子期刊数据库目前包括三十多种期刊,内容涵盖以下领域:药物化学、有机化学、普通化学、工程化学等几十个学科领域,网址是http://pubs.acs.org/jounals/jrhome.htm/。

5 结论

简介科学引文索引及其检索方法 篇8

一、SCI简介

美国科学技术情报研究所 (IST) 的情报学专家尤金·加非尔德于1960年编辑出版了《科学引文索引》 (ScienceCitation index, 简称SCI) , 是一种国际知名的大型多学科引文检索工具。它以3600多种自然科学、技术科学和行为科学期刊作为来源出版物, 每年收录其中的来源文献约50万篇, 每年从中采集的被引文献约为700万篇。依据这些数据形成的引文索引、来源文献索引和来源机构索引, 查询科技论文引证关系的常用数据源。

SCI报道的内容有:农业、生物学、环境科学、工程技术、应用科学、医学与生命科学、物理学、化学等方面。SCI具有两个重要特点:第一, 基于杂志索引的几个基本标准、引文分析、反应在科学技术和生物医学方面被引证文献频率。第二, 增加了更为快捷的检索途径。检索近85%的引文索引, 以密切早期出版物的文献和近期引证了该文献的文献主题关系。使用已知的论文和著作查出引证了这篇文献的近期出版物, 以利于对学科发展的追踪。

二、SCI检索途径

1. 手工检索。

在书本式的检索工具中, 出版物的形式有双月刊、年度累积索引、五年累计索引等刊物。上述出版物均标注有三种索引:引文 (Citation Index) 、来源索引 (Source Index) 、轮排主题索引 (Permuterm Subject Index) 。另外, 还包括辅助索引——团体索引 (Corporate Index) 。每期的SCI分五册出版, 用期号连接, 分别用A~E字母表示。例如, SCI的1992年1A、1992年1B、1992年1C、1992年1D和1992年1E分别为1992年第一期A、B、C、D、E分册。其中A、B和C分册为引文索引, D为来源索引, E为轮排索引。SCI的团体索引被编排在D分册内, 位于来源索引之前。团体索引反应了团体人员的论文被SCI收录的情况。

(1) 引文索引 (Citation Index) 。引文索引按所有被引证文献著者姓名的字母顺序编排, 在此下给出它的文献出处, 依次为出版年代、杂志名称、卷、期、页码等。如ANSARAI——被引证作者ANSARAI

71 MON ATSHEFTE FUR CHEMIE 102 1855

72 SEMIE CHIE ETAT—SOLL 1被引作者所发表的文献

WAGNER C METALL T-B

上述记录说明作者WAGNERC在METALLT-B杂志上发表的文章中引用了作者ANSARAI, 1971年在MONATSHEFTE FURCHEMIE102卷1855页和1972年在SEMIECHIE ETAT—SOLL 1卷的发表文章。

(2) 来源索引 (Source Index) 。来源索引按照来源文献著者姓名顺序编排。其中给出的内容分别为:文献题目、出处、年期页、引证参考文献的数量、ISI杂志的存取号, 如果文献有共同著者, 则在文献的第一作者后引证共同作者 (Coauthors) 。在索引中如有See字样出现, 是交叉索引的第二作者。See的出现是引导读者看第一作者引证的参考文献数目。

团体作者索引 (Corporate Index) 包括地区和机构两部分。其排序是:先美国, 再其他国家。按美国各州及其他国家拉丁字母顺序编排, 以下依次是城市 (同一单位的所属部门按大小依次列出, 如同一大学下有学院、系和实验室等) 。第一作者及原文出处。共著录格式如下 (选1992年D册为例) :沈阳化工学院

People R CHINA

LIAONING

SHENTANG INST CHEM TECHNOL

即为沈阳化工学院的注入形式。

(3) 轮排索引 (Permutern Subject Index) 。轮排索引简称PSI, 是一种通过主题途径查找文献的编排方式。从文章题目中抽出的若干能表达文章内容特征的关键词, 将其分成主要词和配合词, 采用每个关键词各作一次主要词轮排方式, 按主要词顺序排列, 其余的词作为配合词按字顺排在其栏目下, 每个配合词的后面表示了引用著者姓名或出版物名称的缩写。通过轮排索引可以从各个角度查到同一篇文献, 再通过配合词后面标注的作者去“来源索引”, 即可查到论文的篇名、出处及参考文献等信息。

由上可见, SCI具有很强的科学性、实用性、重要性, 因此近年来SCI的查阅量呈上升之势, 随之而来手工检索SCI与联机检索SCI的优缺点日益凸显。手工检索SCI经济, 但费时费力;联机检索方便快捷, 但费用较高。究竟选择哪一种检索方式要根据客观条件而定。下面对联机检索SCI方法作一简介。

2. 联机检索。

SCI联机检索系统有美国的Dialog和德国的STN系统, 均可通过因特网进入。两大系统均有引文索引的机读数据库。数据库有基本索引和辅助索引两部分。在检索中主要查找的内容是被SCI收录和作者所发表的文章被引用方面的内容。由于机读数据库文献记录是原始记录, 其标引的常用索引字段为:著者 (AU) 、题目 (TI) 、出处 (CS) 、被引证文献作者 (RAU) 、文献类型 (DT) 、语种 (LA) 、出版年代 (PY) 、被引证文献出处 (rwk) 。现举例说明:检索沈阳化工学院从1995年到2002在SCI中收录的文献数量。在检索对话框中键入检索策略:bscisearch;s Shenyang inst chem./cs and 110021/cs and 1995-2002/py机器响应:7001 SHENYANG/CS;

摘要:本文就SCI的几种检索途径和检索方法作一阐述, 希冀能为广大的科研工作者有所帮助。

统一视频标记和检索方法的研究 篇9

随着中国电信全球眼业务的发展, 铺设的监控网点越来越多, 海量的视频数据得不到有效的利用。用户只能通过实时观看感兴趣的对象、事件, 或者通过回放来进行人工检索。这种传统耗时的浏览方式已远不能满足人们对视频内容的访问和查询需求, 人们越来越希望能在海量视频库中快速找到自己感兴趣的视频片段。另外, 视频数据只是简单的存放于系统后台, 视频数据没有得到进一步分析, 蕴涵的丰富信息得不到充分利用。如何利用智能信息处理技术, 自动识别出监控视频中发生的一些特定对象或者事件便成为国内外研究的热点问题。

鉴此, 结合全球眼增值业务以及现今已有的视频智能识别方案, 我们提出了一种基于内容的统一视频标记与检索框架。在该框架中, 系统首先识别视频数据中的对象以及事件, 鉴于不同识别算法输出内容的差异性, 系统再对识别的内容进行统一标记处理, 最后用户可以通过匹配规则检索得到相关的视频列表。

2 统一视频标记和检索介绍

2.1 什么是视频标记与检索

基于视频内容的图像检索是一种新的检索技术, 是指直接根据描述媒体对象内容的各种特征进行检索, 它能从数据库中查找到具有指定特征或含有特定内容的图像 (包括视频片段) , 它区别于传统的基于关键字的检索手段, 克服了文本方式的缺点, 融合了图像处理、模式识别、计算机视觉、图像理解、数据库管理等技术。

在基于视频内容的图像检索基础上, 对提取出的指定特征 (例如对对象的颜色、纹理、形状和运动特性;声音空间中的音调、语气、节奏、节奏的改变和位置等特性) 提供有效的标准的描述框架, 采用统一的方法进行标记, 这就是视频标记与检索。

2.2 基本流程

统一视频标记和检索的基本流程如图1所示。

其主要流程包括:

(1) 视频分析处理

这是视频数据处理的第一步, 目的是从非结构化的视频数据中提取一定的视频结构, 譬如将一段长的视频序列结构化为一系列的场景, 然后每个场景里又包含有若干个镜头, 每个镜头中含有一系列的视频帧。这一步为后面的特征提取奠定了基础, 也是最为关键的一步。然后通过运动目标检测、运动估计和目标跟踪等视频分析算法来提取视频底层和中层的时空对象特征, 为高层视频处理中的事件识别提供推断依据。

(2) 标记

对可识别的内容进行视频理解, 并将对象以及事件的相关属性标记为可被搜索的结构化数据。视频理解是指通过分析和理解视频分析层提供的时空对象底层特征来完成对视频事件的识别, 属于视频处理过程中的高级处理部分。而监控视频事件识别主要是指通过分析和理解计算机视觉和视频分析方法 (包括运动目标检测、识别和跟踪) 所获得的视频图像的底层和中层特征, 并在此基础上分析和判断预先描述和定义的监控视频事件模型, 最终完成对监控视频事件识别的过程。

(3) 视频检索

为用户和系统之间建立一个有效的交互手段, 用户利用视频检索得到自己需要的视频内容, 并可以通过视频浏览快速地了解视频内容, 用户还可以通过检索反馈实现对查询结果进一步修正。

2.3 现阶段国内外研究成果

虽然基于内容的视频检索系统的研究起步比较晚, 但是十多年来国内国外在这方面的研究和应用取得了长足的进步。首先是MPEG-7标准的出现, 极大地推动了智能视频检索技术的发展。“多媒体内容描述接口” (Multimedia Content Description Interface) , 简称为MPEG-7。它规范了一组“描述子”, 用于描述各种多媒体信息, 也将对定义其他描述子以及结构 (称为“描述模式”) 的方法进行标准化。这些“描述” (包括描述子和描述模式) 与其内容关联, 允许快速有效地搜索用户感兴趣的资料。MPEG-7将标准化一种语言来说明描述模式, 即“描述定义语言”。带有MPEG-7数据的视频资料可以包含静止图像、图形、3D模型、音频、语音、视频, 以及这些元素如何在多媒体表现中组合的信息。另外, 一些智能视频检索的系统也应运而生。UtopiaCompression智能视频监控与分析系统是一个基于可视化知识发现技术的系统, 它能从大量的监控视频数据中, 自动进行场景识别以及危险事件的检测与识别。IBM的标注工具VideoAnnex可用来分析视频内容, 并产生符合MPEG-7标准的描述, 也可用来给场景人工分配语义标签, 标注关键字和主要物体。VideoQ是一套全自动的面向对象的基于内容的视频查询系统, 是由哥伦比亚大学的图像与高级电视实验室研制的一个原型系统。它拓展了基于关键词或主题浏览的传统检索方式, 提出了全新的基于丰富视觉特征和时空关系的查询技术, 可以帮助用户查询视频中的对象。

总之, 到目前为止, 已有许多高校、科研机构、组织致力于视频检索技术的研究, 视频检索系统在多个领域得到广泛应用。特征提取、标记方法、视频检索算法逐渐丰富。

但视频检索技术是一种综合集成技术, 其一些关键技术的研究虽然取得了一定的进展, 但由于各种理论和相关技术都不尽完善, 所以还有许多问题需要进一步深入研究, 如:提高识别率, 提高速度, 有效的特征提取等。

本文将结合基于内容的视频检索方法和视频标记与检索方法, 提出一种统一视频标记与检索框架, 并介绍这个框架的总体构成以及各主要子模块的功能。

3 统一视频标记和检索框架

将非结构化的视频转换成结构化的视频数据, 视频统一标记与检索系统可以看作是介于信息用户和 (多媒体) 数据之间的一种信息服务系统。用户首先通过人机交互界面提交查询请求, 然后系统将查询条件 (关键字或关键对象的描述) 与中的视频的XML标记文件按一定匹配规则进行匹配, 把满足用户查询要求的结果返回给用户, 用户就可以在众多候选结果中进行选择。如果查询结果不满意, 则可进行查询条件的调整, 再次提交给系统, 系统利用一定的反馈机制, 再次查找, 如此逐步缩小查询范围, 最终得到用户需要的查询结果。

3.1 总体框架

本框架主要分为场景分类, 对象/事件识别, 视频标记, 视频搜索、反馈5部分, 并建立了原始视频库, 知识库, 结构化视频内容库3个数据库, 如图2所示。

系统中标记与检索是两个最重要的部分。视频图像由一组对象表示, 标记部分对对象的低层属性及特征进行描述, 如颜色、纹理、形状等;除此之外, 对对象相应的高层语义也进行分析理解, 从而实现由计算机的数据描述上升到人工智能识别的转化。

正是系统在标记部分做了大量的工作, 才能够使快速检索成为现实。标记的好坏直接影响检索的效率与精度。检索根据标记的内容进行搜索, 能够标记的对象属性及高层语义在检索模块中都能通过关键字进行查询匹配。总之, 标记为检索服务, 检索以标记为基础。

下面对框架的各部分进行描述。

3.2 场景分类

场景分类是本框架中的重要组成部分。

我们知道, 不同的监控视频拥有不同的特点, 例如设置在仓库中的监控摄像头所拍摄的视频处于屏幕长时间不变状态;设置在十字路口的摄像头所拍摄的视频则处于长时间变化状态, 而且出现的移动对象基本都是车辆;设置在学校门口或者其他公共场所的摄像头则主要记录的是以人为主的对象运动。对于这些风格迥异的监控视频, 选用不同识别算法进行对象和事件的识别, 才能达到高效、快速的识别视频的效果。

由此可见, 场景分类是非常有必要的, 可依据全球眼业务的范围, 将经过预处理的原始视频进行分类。

场景分类的主要原则是: (1) 根据室内与室外划分; (2) 根据关注对象不同划分。

3.3 预处理

图像预处理的主要目的是消除图像中无关的信息, 恢复有用的真实信息, 增强有关信息的可检测性和最大限度地简化数据, 从而改进特征抽取、图像分割、匹配和识别的可靠性。预处理过程一般有数字化、几何变换、归一化、平滑、复原和增强等步骤。

预处理部分用于实现对原始视频的预处理功能, 可以采用高斯滤波消除噪声, 采用直方图均衡改善图像质量使图像清晰化等等。这些技术已经非常成熟, 本文不再赘述。

3.4 对象/事件识别

对象/事件识别模块主要实现对特定对象 (如人、人群、车辆) 或者事件 (如打架、徘徊、越界) 进行识别, 该模块的识别范围依赖于视频识别厂商。

现阶段已有许多厂商深入视频识别领域, 虽然各个厂商识别的侧重点不同, 例如人脸识别厂商、车牌识别厂商、特殊事件识别厂商等等, 但总的来说, 越来越多的对象和事件能被计算机准确地识别, 因此, 根据全球眼业务范围, 我们规定一个全球眼监控视频中可能引起用户兴趣的对象和事件的集合, 这一个集合中的各种对象和事件的识别过程由不同的视频识别厂商负责实现, 然后提供数据模型或知识库。本系统需要实现的是通过视频厂商提供的知识库对原始视频进行分析识别, 得到被识别的对象和事件的关键帧和描述, 然后把这些描述通过标记处理模块, 生成统一标记文件。

对象/事件识别模块的输出结果是一个关键帧的集合, 以及若干描述这些关对象和事件的信息。

3.5 视频标记

视频标记指的是根据已经提取的特征信息对原始视频打标签的过程, 其标记内容应体现对象、起止时间、行为、特征等。对象/事件识别之后的输出 (对象/事件的关键帧和描述性信息) 通过标记操作, 生成结构化的XML标记文件, 这些文件与关键帧一起被存储起来, 以备检索之用。

视频标记的关键就是对所描述的对象/事件进行层次化的描述, 为此需要建立描述模型。图3为基于内容的图像层次化描述模型。该描述模式是层次化的, 它描述了视频的一般属性 (元数据) , 同时也描述了视频视觉上反映出来的属性 (对象和事件) 。该模型直接用XML语言进行定义。

例如, 现在要标记视频中的“穿红色衣服的短发男人”这样一个对象, xml标记的结果为:

3.6 视频搜索

通过以上几部分, 系统已经从非结构化数据中提取了结构化的XML标记文件和关键帧, 下一步自然是对这些结构化数据进行搜索, 视频搜索部分即实现该功能。

用户通过终端输入关键字或关键对象, 视频搜索功能根据用户的输入调用不同的匹配规则 (对象匹配规则, 事件匹配规则) 搜索结构化数据库 (即XML标记文件数据库) , 得到一系列符合匹配规则的关键帧ID, 系统通过这些ID查找关键帧数据集合, 最后对这些关键帧排序, 使其符合人们的浏览习惯, 并返回给用户。

针对“视频标记”部分所举例子, 如果用户输入查询条件“红衣短发男人”, 系统将其解析成多个字段:人、男、红衣、短发。在源视频xml文件中搜索所有class=’人’, sex=’男’, color=’red’, hair=’短’的对象, 在用户界面输出关键帧图像并生成包含这些对象的新的xml文件。

3.7 反馈

通过搜索功能得到的搜索结果可能因为多种原因无法得到用户最感兴趣的结果, 例如用户输入关键信息过少, 使得搜索结果过于庞大;或者用户输入的关键信息过于详细, 查找到的匹配结果太少。针对该问题, 本文提供了一种用户反馈机制, 即用户在得到搜索结果后, 可以选取搜索结果中的任意一个或多个关键帧, 进行二次搜索, 通过用户的多次选择和系统的多次匹配搜索, 系统最终将返回给用户一组较为满意的搜索结果。

4 总结

本文结合全球眼业务的实际情况, 借鉴目前国内外统一视频分析和检索的研究成果, 提出了一种统一视频标记和检索的框架, 将对包括全球眼业务在内的中国电信视频类业务的发展起积极的参考和指导作用。

摘要:随着中国电信各类视频业务的发展, 对海量视频数据的后处理、再利用就变得异常重要和急迫。文章介绍了统一视频标记和检索的概念、基本流程以及目前国内外的研究成果, 并提出了一种统一视频标记和检索的框架。

关键词:视频,标记,检索,框架

参考文献

[1] 余卫宇, 谢胜利, 余英林, 潘晓舟.语义视频检索的现状和研究进展.2005, (5)

[2]A.Hampapur, L.Brown, J.Connell, et al.Smart video surveillance:exploring the concept of multiscale spatiotemporal tracking, IEEE SignalProcessing Magazine, 2005, 50 (22) :38-51

[3] 孟倩.基于内容检索的视频数据库数据模型的研究.徐州师范大学学报 (自然科学版) , 2003, 12:59-62

浅谈专利多种追踪检索的方法 篇10

关键词:文献,追踪检索,策略

1 概述

常规的检索策略包括简单检索策略、块检索策略、渐进式检索策略和追踪检索策略。其中, 追踪检索策略是以现有信息为基础, 利用有效线索进行层层抓取, 进而连环突破, 其具有检索时间少、检索结果准确有效的优势。笔者总结了几种追踪检索策略, 通过不同的追踪检索策略, 快速而准确地获得相关对比文件, 并通过典型案例深入地诠释了相关追踪检索策略。

2 追踪检索策略

检索策略是根据被检索对象的特点而制定的检索基本原则和方法。根据具体案情的自身特点, 制定符合此案情的最佳检索策略。追踪检索就是利用文献之间存在的信息关联, 最终检索到目标对比文件, 追踪检索也需要根据案情的特点制定不同的检索策略, 做到因地制宜。针对审查工作中常用的几种追踪检索方法, 笔者对此进行总结与探讨, 其主要包括:利用PATENTICS检索、以申请人为入口的检索、同族专利申请的检索、中间文件的追踪、背景技术文献的追踪等策略。

2.1 以申请人为入口的检索

对于申请人为高校、科研院所以及大企业的专利申请, 由于他们的研究具有一定的连续性, 因此对于有多个申请人的申请应该追踪检索每一个申请人发表的论文, 以免漏检。另外, 有些项目是多个单位合作完成的, 对于这种情况, 应该以该学校或研究所即作者单位为入口, 追踪检索该研究机构历年来发表的与本申请相关的文章。因此, 以此为入口进行的追踪检索是非常必要的。

追踪检索通常采用的方法为包括:在专利数据库中以申请人或发明人为切入点进行检索, 挖掘中间过程文件, 寻找其有用的信息来帮助分类号、关键词的扩展;在非专利数据库例如CNKI、Google Scholar中进行追踪, 以CNKI为例, 提供单篇文献的详细信息和扩展信息浏览的页面称为“知网节”, “知网节”的利用对于日常审查工作中的追踪检索是非常有帮助的。这些扩展信息通过概念相关、事实相关等方法提示知识之间的关联关系, 达到知识扩展的目的, 有助于新知识的学习和发现, 帮助知识获取、知识发现, 帮助我们向“所属领域的技术人员”靠拢;Google Scholar中也提供了引用被引用的浏览方式, 对于我们了解技术发展脉络, 甚至直接命中对比文件有一定的帮助。

2.2 系列申请的检索

系列申请是发明人针对相同发明点进行多个申请, 以期对其发明点进行多方面的保护。鉴于其申请的动机, 我们可以利用系列申请进行快速有效检索。获知一个发明的系列申请可以通过两种途径获得:一是通过E系统的案件信息直接获得, 但其收录可能不完整;二是以申请人为入口, 通过S系统的检索获得。通过上述途径获得本申请的系列申请之后, 因为提案的时间差, 其系列申请存在已经出案的可能, 可以借助系列申请的审查通知书给出的检索报告, 实现快速有效的检索。

2.3 具有同族专利申请的检索

同族专利是指基于同一优先权文件, 在不同国家或地区, 以及地区间专利组织多次申请、多次公布或批准的内容相同或基本相同的一组专利文献。对于同族专利的追踪, 在日常检索过程中也是常用且非常有效的。笔者结合审查实践, 认为进入中国的PCT专利申请, 对于该类申请在深入检索之前, 查阅该申请同族专利的审查状况是非常有必要的。查询同族专利的方法通常有以下两种:

A、通过S系统检索子系统的互联网资源检索平台进入相应国家或地区的主页进行查询。B、在E系统中, 进入案件审查, 通过他局案件信息查询进行同族专利查询, 此种方法由于获取速度较快, 是笔者优先推荐使用的, 但采用该方法也仅能查看美局、欧局、日局的审查过程, 除此外的他局审查过程是无法查看的。

2.4 中间文件的检索

中间文件的检索, 能够有效地帮助我们理解现有技术, 可以为关键词或分类号的进一步扩展提供一些新的思路。但是在日常检索过程中, 时常会有检索到相关文件与本申请的发明构思非常相近, 但日期不能用的对比文件, 在此情形下, 审查员不应直接将其忽略, 继而去寻找新的对比文件, 而应该充分抓住其关键线索, 去挖掘是否有更加合适的分类号或关键词, 或者是去追踪其他相关信息。

2.5 背景技术的追踪

对于背景技术的检索是追踪检索中常用的检索手段之一, 背景技术中出现的文献都是与申请文件中技术方案相关度较高的文献, 背景技术可以帮助我们熟悉申请文件所要解决的技术问题以及申请文件呈现的发明构思。背景技术中有引用文献的, 不妨在检索前先浏览一下申请所涉及的文献, 如本申请针对背景文献进行改进, 则该背景技术文献很可能可以作为评述申请文件的对比文件。对于背景技术文献的追踪, 可以广泛利用现有资源, 例如S系统或其他专业数据库, 例如在先技术数据库 (IP.com Prior Art Database) , 网址为:http://ip.com (外网) 。该数据库为全文数据库, 是IP.com公司创建的在先技术数据库, 收录IBM、微软、摩托罗拉、西门子、联想、诺基亚等公司发表的技术公布, 其他公司、研究机构匿名发表的技术公布、各类非专利文献及专利文献。该数据库的最大特点是数据库中的技术公布在发表时都被电子公证, 以确立其进入公有领域的内容和日期, 是审查工作中尤其可作为通信、光电、电学领域检索现有技术的数据库。

3 结论

上一篇:吉林省农村物流发展下一篇:拓展体育功能