信息检索途径

2024-10-19

信息检索途径(共7篇)

信息检索途径 篇1

无论是传统图书馆的图书、期刊、音像等文献, 还是数字图书馆的各种各样的光盘数据库或在线数据库, 这些信息资源都是事先由专业人员 (或称为信息管理员) 把它们科学地组织起来, 存储在图书馆物理空间或服务器空间里, 以供读者使用。读者如何在浩如烟海的信息海洋里快速找到自己所需要的信息, 这就需要学习一些信息检索原理, 掌握一些信息检索技能。

1 信息检索的概念

广义上的信息检索, 包括信息的“存”和“取”两个方面:“存”, 即把大量杂乱无序的信息加以科学地排列, 使之有序化, 形成检索工具或者检索系统 (检索工具如图书馆馆藏目录、全国西文期刊联合目录、大英百科全书等;检索系统如图书馆网上公共查寻书目系统、清华学术期刊数据库等) 。“取”, 即在有序的信息集合中找出所需的相关信息, 也就是用户必须掌握这些检索工具或检索系统的使用方法去找到自己所需要的信息。

“存”是“取”的基础和前提, “取”就是检索利用, 是“存”的价值实现。本文中指的信息检索是指狭义上的信息检索, 也就是“取”的过程, 即用户利用检索工具和检索系统从有序的信息源中, 查询所需信息的检索过程。

2 信息检索途径分析

所谓检索途径, 是指从哪个角度或哪个方向进行信息检索。在用户检索信息时, 往往是以信息的某一特征作为切入点。一般地说, 文献信息的内容特征和外表特征都可以称为检索的切入点。信息人员在编制检索工具和检索系统时依据信息的特征和检索语言的原理, 为用户建立多种多样的检索途径:分类途径、主题途径、文献名称途径、责任者途径、文献代码途径、引文途径、时序途径、地序途径等等。

2.1 分类途径

分类途径是用户普遍使用的一种方法。分类途径是以科学分类为基础, 结合信息的特征, 运用概念划分的方法, 把知识区分为大小类目, 并用标记符号作为代号, 使其形成一个有系统、有层次、逐级展开的排列表。分类途径又称为分类表。通过分类途径来查找文献是一个传统的、非常重要的途径。就是依照分类法的分类体系从学科角度来查找文献。

分类途径的局限性在于不能集中与事物有关的各个方面的文献信息, 不能有效满足用户检索性课题的需求;同时由于分类体系较为稳定, 一些论述新概念、新事物的文献信息不能及时用新类目加以反映、容易漏检;还由于分类体系的单线排列, 一些边缘学科、交叉学科、相关学科难以放映揭示出来等等。

2.2 主题途径

主题途径是根据信息内容的主题特征进行检索的途径。表示信息所论述和研究的事物、问题、现象的概念叫做主题;用以表达信息主题概念词叫做主题词, 并作为检索标识。在信息检索中, 主题途径使用较为方便。

主题索引是以主题词为标目, 并按主题词字顺排列的索引。按照主题词的选词方式, 习惯上可分为标题索引、单元词索引、叙词索引和关键词索引。

标题索引是主题索引系统中最早出现的一种语言, 所以传统的主题索引实际上就是标题索引。它是经过规范化的标题 (词) 作为文献信息的概念标识, 并运用多种标题形式组成固定搭配。如“经济核算” (主标题词) 、“经济核算——商业” (副标题词) 。标题索引是以事物来集中文献信息, 用参照系统显示关系, 提供字顺系列的检索途径。

2.3 文献题名途径

文献题名途径是根据文献信息外表的名称特征进行检索的途径, 即把文献信息上记录的书名、刊号、篇名等作为文献信息存储的标识和检索的出发点。各类书名目录或索引、篇名目录或索引等, 都是按照其题名字顺组织起来的, 均提供了题名检索途径。

我国古代书目较重要的检索途径就是书名。对于现代文献信息, 在我国图书馆目录体系中, 无论是手工检索还是计算机检索, 书目目录仍然占有较重要的地位。用户只要在记清书名、刊名的情况下, 通过书名、刊名目录就能准确迅速地检索到该书、该刊, 符合特性检索的要求。

文献信息上题名信息, 如书名、刊名、篇名本身就具有客观性和唯一性, 即都是以原文献信息所题的名称为准, 不进行规范处理。

2.4 责任途径

责任途径是依据文献信息责任者的名称特征进行检索的途径。责任者一般指作者、译者、编者等。不仅有个人责任者, 还有团队责任者。许多检索工具或检索系统对这些类型的责任者, 都按其名称字顺编制相应的目录或索引。例如, 图书馆的著者目录, 检索工具或检索系统中的著者索引、机构索引、专利人索引等。

责任者检索途径可以查询到同一著者、同一机构发表的所有文献信息, 但应该注意不同国家姓名的写法和用法。在一些检索刊物或检索系统中, 经常提供责任者途径作为分类途径和主题途径的补充和配合。

2.5 引文途径

引文途径是根据文献所附参考文献或引用文献的特征进行检索的途径。每位论文作者在写作过程中一般都要参考其它一些文章, 或作为理论依据, 或作为比较对象, 或取其数据等等。文献之间的相互利用, 体现了科研人员的相互交流, 也在一定程度上表现了有关文献在内容上的联系。利用引文途径进行检索, 一是依据某一论文后的参考文献或引用文献不断地追索旧文献;二是利用引文索引循环途径检索相关文献。所谓引文索引, 就是从被引论文去检索引用论文的索引。引文索引多用于新兴学科、交叉学科及其它复杂研究课题的文献信息索引。

当前著名的引文索引是美国文献学家加菲尔德创制、美国费城科学情报所编辑出版的《科学引文索引》 (SCI) 和《社会科学引文索引》 (SSCI) 。国内有《中国科学引文索引》和《中文社会科学引文索引》。

此外, 还有文献代码途径, 即根据文献信息的序号或代码进行检索的途径;时序途径, 即根据时间顺序 () 线索来进行文献信息检索的途径;地序途径, 即按照自然区域或行政区划的顺序来进行检索文献信息的途径。

3 结语

在信息“爆炸”的今天, 信息增长速度惊人, 特别是尖端科学、新兴学科信息增长更快, 数量庞大, 类型复杂, 文种多样, 内容交叉重复。为了准确迅速地检索到自所需的信息, 用户必须熟练掌握自己专业领域的常用检索工具和检索系统, 去获取新知识, 了解新信息, 占有新资源, 研究新问题, 这也是防止知识老化的重要方法。用户在进行信息检索时一定要掌握一些常用的检索工具和检索系统, 熟练地使用一些常用的检索方法和检索技巧, 制定正确的检索策略以达到一定的查准率和查全率。

摘要:在信息“爆炸”的今天, 信息增长速度惊人, 特别是尖端科学、新兴学科信息增长更快, 数量庞大, 类型复杂, 文种多样, 内容交叉重复。为了准确迅速地检索到自所需的信息, 用户必须熟练掌握自己专业领域的常用检索工具和检索系统, 本文就图书馆信息检索途径作一个简要的分析。

关键词:信息检索,检索途径,分类途径,主题途径

参考文献

[1]赵美娣, 张冬梅.论计算机查目系统中分类检索途径的作用[J].图书情报工作, 2002 (11) .

[2]夏南强.文献信息检索工具选择[J].华中师范大学学报:人文社会科学版, 1999 (4) .

[3]罗少芬.网络信息检索策略的设计[J].图书情报知识, 2000 (1) .

网络信息检索的途径与策略 篇2

在现代的工作和学习当中,各类的信息检索是必不可少的,以前人们查询信息是通过期刊、杂志、报纸、图书等途径。但随着因特网的出现,特别是近年来的快速发展,对人类传统的信息组织检索和获取方法构成了很大的冲击,使得人们在世界范围内很方便地进行信息交流和资源共享。因此,如何能在因特网上较快地找到所需的专题信息是目前最困扰用户的难题。本文归纳几种常用网络检索专题信息的方法和检索策略。

1 网络信息检索的途径

1.1 基于网络目录的信息检索

因特网上的目录型检索工具一般称为网络目录(Web Directory),又称分类站点目录、专题目录或主题指南、站点导航系统等。网络目录通常是按网络资源的主题性质进行分类,以某种分类体系为依据,将信息资源分为若干主题范畴,然后再细分为各学科专题目录,最后列出具体的相关网站,形成一个又信息链组成的树状结构,即:总目——专题目录——链接——文本。著名的如Yahoo、sina、网易等都提供基于目录帮助的网址。

这种途径是通过引导网络用户的查询概念(而不是确切的词条)来帮助用户找到所需的网络信息。

1.2 基于搜索引擎的信息检索

搜索引擎(Search Engine)是Internet上具有查询功能的网页的统称,它是一种利用网络自动搜索技术,对因特网各种资源进行标引,并为检索者提供检索的工具。基于搜索工具的检索方法接近于通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获取检索结果,并输出给用户。

目前搜索引擎已多达数百种,如Web Search Engine(万维网搜索引擎)、Usenet Search Engine(新闻论坛搜索引擎)、Meta-Search Engine(元搜索引擎)等类型。通用的搜索引擎有百度、Google等。

元搜索引擎,又称多元搜索引擎,它实际上本身不具备搜索索引,而靠其他原始引擎的搜索或索引接口来完成其搜索任务的引擎。元搜索引擎可分为桌面元搜索引擎和在线元搜索引擎,桌面元搜索引擎指直接在用户的计算机上运行,相当于用户自己拥有一个元搜索引擎,一般为一个小软件。在线元搜索引擎著名的有Infospace、Dogpile等。

此外许多专题搜索引擎非常有用,专业搜索引擎又称垂直搜索引擎,是专为搜索高度相关的专业信息而设计的搜索引擎,它通过对网上某一领域的信息资源或行业的内容作了专业和深入的分析、挖掘后,精细分类、过滤筛选,信息定位更精准,虽内容量偏少,但能精确锁定内容。如视频搜索引擎Cblinkx、Tvix等。

这种途径大多是需要网络用户的提出关键词进行检索,并且对各种搜索引擎的功能和用法要有一定的了解和掌握。

1.3 利用其他途径检索

利用上述的两种一般的途径,许多信息的检索结果数量庞大,并且准确度和内容方面不尽如人意。此时,我们还可以考虑一些其他途径,常用的途径有利用商业数据库,这种数据库汇集了大量丰富的与学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛和专家学者等;利用专题信息网,很多信息在专题信息网上查询更加有效,例如查专利,可以取世界知识产权组织专利数据库(PCT)、中国专利全文数据库等;还可利用一些学会站点或虚拟图书馆等等。

这种途径是针对各种专题信息需求进行有效的检索,用户对该领域应该有一定了解,并对此类查询有归纳和积累。

2 网络信息检索的一般策略

网络环境下的信息检索与传统环境下的检索有很大不同,虽然网络信息资源的范围、数量很巨大,网络检索工具及检索方法也是纷繁众多,但用任何单一方式去迅速、准确并相对全面、完整地找到相应资源仍不是很容易。

网络信息检索策略即检索的基本思路,是根据检索要求选择便捷的方法、适当的工具、在适宜的地方查找需要的资料。在进行具体检索策略的基本步骤是:确定检索任务;确定查找的资源的位置;确定检索词并构造检索式;选择适当的检索方法;执行检索;最后评价检索结果,并可以对检索结果进行再次修改检索式精练结果。

选择什么方法、使用何种搜索引擎、利用哪些参考源去查找某类信息或资料是有一定规律可循的,而掌握网络检索规律的前提,是对搜索引擎和有关参考资源的认识和了解,而认识和了解搜索引擎和有关参考资源需要一定的检索经验的积累。

3 网络信息检索的技巧

很多人在进行网络检索时,总会问什么是最好的技巧?有没有快速的方法?其实这些问题往往是用户对搜索引擎的原理不了解,语法不熟悉,特定资源的位置不清楚而产生的。虽然很多资料总结和提出一些检索的常用途径和一般策略,但是具体在检索中却并不如人意。这里本文根据自身工作中的实践列出几点好的技巧,以期有所帮助。

“工欲善其事,必先利其器”。所以,首先掌握搜索引擎的使用方法。如:Google的基本搜索(+,-,OR),学会使用两个关键字进行复杂专题信息检索。检索复杂专题依靠单个关键词查准率很低,要提高查全检准率,需进行详细的主题分析,选择多个关键词构造检索式。

其次,熟悉常用的辅助搜索方法:通配符、大小写、句子、忽略字符以及强制搜索,并尽可能使用一些高级搜索语法,如Google的site、link、inurl、allinurl、intitle等语法。

最重要的一点,对各种类别的资源检索要分类归纳和总结,形成自己的一个检索数据库。比如笔者对论文、期刊、图片、音乐等分别归纳了很多特定的检索工具和站点,并保存下来,当要查询某类资源时方便查找,这主要靠日常积累。这里推荐一个好的站点,中国搜索引擎指南(www.sowang.com),该站点有很多资源和检索工具的分类,并有不少经验心得。

参考文献

[1]沈红玉.网上专题信息的检索[J].牡丹江师范学院学报(自然科学版),2006,2.

[2]王颖.因特网信息资源检索方法和技巧[J].吕梁教育学院学报,2006,2.

[3]吴东辰.国内外几种主要搜索引擎比较[J].福建图书馆理论与实践,2005,4.

[4]赵玉玲,滕飞.试论信息检索途径的多样性[J].重庆图情研究,2007,1.

[5]符绍宏,等.因特网信息资源检索与利用(第二版)[M].北京:清华大学出版社,2005,9.

信息检索途径 篇3

一、现有图书馆的图书检索方式

当前图书馆图书检索方式大概有以下几类:

(一) 篇名检索。

可提供多种检索方式和多个检索点, 包括:关键词 (含在文章题名、期刊名、作者、主题中) 、文章题名、期刊名、论文作者名、ISSN 等。用户可通过给出关键词和对这些检索点的任意组合, 检索到含有该关键词等检索条件的文章题名。系统能够根据读者的要求将所选择的篇名信息发至读者指定的E-mail信箱, 并可将读者索取原文服务的要求通过E-mail发至文献收藏的图书馆。

(二) 刊名检索。

可提供多种检索方式和多个检索点, 包括:关键词 (含在期刊名、出版商、出版地中) 、期刊名、ISSN 等。用户可通过给出关键词或给出期刊全名及对上述检索点的任意组合, 检索到含有该关键词等检索条件的期刊刊名并显示馆藏信息及收藏馆的馆藏代码, 单击期号可显示该期中所有篇名信息。

(三) 刊名目录。

可显示篇名目次库中以刊名首字母开头的期刊刊名目录。单击期刊名称可显示该刊的出版地、出版商等详细信息及馆藏情况, 首字符为非字母的期刊收在“其它”中, 单击期号可显示该期中所有篇名信息。

(四) 馆藏信息。

可显示参加馆西文期刊的馆藏, 包括15, 000 种西文期刊之外 (无篇名目次数据) 的各馆西文期刊的全部馆藏信息。

二、高校学生查找图书的方法

(一) 本校图书馆的纸本图书。

图书馆是高校的文献收藏中心, 为在校大学生查阅资料提供了得天独厚的条件。大学期间最为方便、经济的读书方式便是从本校图书馆借阅纸本图书, 这也是被学生们利用最多的方式。

校图书馆的纸本图书资源一般学科门类齐全、数量丰富, 且图书馆在采购图书的时候往往会特别考虑本校各院系的学科范围, 其学科、专业方面的图书可能会比其他图书馆要全面。查找本校图书馆的书目检索系统 (OPAC) , 通过常用的书名、著者等途径, 查找有无此书, 以及此书的书目信息、馆藏地、分类号或索书号等必要信息, 获得图书的具体收藏位置, 办理借阅手续。云南大学图书馆是综合性的图书馆, 由多个校区的3个各具特色的分馆组成, 各分馆之间实现了图书的通借通还, 并可在网上实现图书的预借、续借等服务, 读者借阅图书的选择更加灵活、多样。

(二) 本校图书馆的电子图书。

除了本校图书馆的纸本图书外, 一般高校图书馆还有电子图书资源, 而这部分电子图书可能比馆藏纸本资源更加丰富, 读者也应该重视这部分资源, 增加获取图书的途径。山东大学图书馆购买了“超星数字图书馆”里的73 万余册电子图书, 亦购买了方正“Apabi 电子图书”和“Apabi 教参类电子图书”两个数据库, 师生可以免费检索、阅览这部分电子图书资源, 作为纸本图书的有效补充, 弥补检索馆藏纸本文献而不得的遗憾。

(三) 网络在线阅读。

随着网络的发展, 有些著者选择了在互联网上发表论文、小说等文献。例如, 《第一次亲密接触》最初就是从网上发表并引发了热议, 最后作者才选择了出版图书。读者可以利用搜索引擎 (谷歌、百度等) 直接检索图书, 找到相关的链接在线阅读, 也可以进入一些专门的读书网站。

(四) 可以购买的资源。

上述查阅图书的方法对高校学生来说多为免费, 学生可以根据文献需求灵活选择。如果这些方法都用过而仍然检索不到所需图书, 或者是认为有些图书确实具有收藏价值而值得购买, 可以考虑去当地书店选购, 也可以在网上选择一些营销书店如当当网、卓越亚马逊等实施邮购。

(五) 其他途径。

还有一些方法可以帮助学生获得所需图书, 例如可以通过一些论坛发帖寻助, 可以联系作者本人或出版商等获取相关信息。这些方法一般比较少用, 但在有些时候却能收到不错的效果, 得到意外的帮助。

三、结语

图书馆应重视图书导读服务和自身具备的教育功能, 利用信息检索课程的教学或通过举办各种形式的讲座等方式, 加强包括电子图书在内的馆藏资源和其他资源的宣传力度, 提高各类文献的利用率, 使学生了解、掌握更多的图书查询途径, 提高其获取图书的能力。

摘要:本文针对大学生在图书馆对现有的图书检索方式已不能满足要求的现状。通过对图书馆图书的检索方法进行了分析, 创新地提出了将这些方法运用到高校图书检索中去, 并分析了其可行性。

信息检索途径 篇4

人的一生都在不断地学习, 然而善于学习比起纯粹地学习更为重要, 善于学习不仅是一种能力, 而且是未来时代的必备要求之一。尤其是在信息时代, 善于学习才能更好地迎接新的挑战, 适应社会的发展与变化。如今, 信息技术日新月异, 生活与互联网紧密联系, 人们可以在网络上搜索大量的信息, 于是“搜商”这一词渐渐出现在人们的视线中并获得了更高的关注度。搜商不仅能帮助人们解决生活中遇到的问题, 还能影响人们的生活水平和生活质量。

1 初步了解信息检索与利用

搜商的含义, 即有效率地搜寻资源、解决问题的素养和能力。搜商的核心是搜索的意识和能力。在《信息检索与利用》的第一节课中, 初次接触到搜商, 了解信息检索与利用这门课程的主要内容和作用, 发现学会了这门课程对我的专业有很大的帮助, 能够解决专业上和学习上的问题。同时我也对搜商产生了浓厚的兴趣, 在接下来的一次次课程中, 揭开了搜商的神秘面纱。在课后实践过程中, 学会利用课堂上学到的知识来解决学习上的困难, 尝试搜商的各种功能得到不同的搜索结果, 更深层次地学习搜商, 提高了搜商能力。

2 信息检索与利用的学习过程

第二节课中, 学习了图书馆信息资源的使用, 原来图书查询不用到图书馆一本本翻阅才能找到想要的那一本书, 为了节省时间和提高效率, 登录学院图书馆主页, 在搜索框中输入相关书籍的书名、作者、索取号来获取书籍的相关信息, 记下索书号和馆藏地点, 就能快速到图书馆找到这本书。在图书馆主页中进入数据库导航, 有中文数据库和外文数据库, 中文数据库有中国知网、读秀知识库、超星数字图书、书生数字图书、方正Apabi电子图书等。中国知网主要是论文和期刊资源, 其他的可以浏览电子图书, 这样就不需要购买书籍或是到图书馆借阅, 直接在网络上打开相关网址, 下载相关阅读器, 就可以阅读想要看的电子书籍。这样, 阅读就不会受到地点、时间、空间的限制, 打开了人们阅读的另一扇“窗户”。

中文数据库里还有超星名师讲堂、新东方多媒体学习库、超星发现等。超星名师讲堂主要是讲师视频, 与浏览电子书相比较, 看视频学习更能让人浅显易懂, 而不显得枯燥无味。新东方多媒体学习库主要是学习英语, 比如英语四级考试, 我就可以到新东方数据库找到学习英语的相关资源, 英语四级的真题及解析答案或是英语高分的攻略技巧。超星发现是检测论文重复率, 有时老师布置论文需要检查论文重复率, 那么就可以到超星发现检测。中文数据库还有其他的功能等待我慢慢挖掘, 除了老师讲解的内容, 还有其他的用途等着我实践与应用, 这也是搜商能快速提高的一种方法。

第三节课中, 老师介绍了中国图书馆分类法, 简称《中图法》, 分为五个基本部类, 22个基本大类, 所有图书是按《中图法》给出的分类号排列。我学会了如何看图书的索取号和图书馆的排架原则, 这样在知道图书的索取号后, 很快就能到图书馆找到这本书, 而不是毫无方向的四处打转, 浪费了大量时间还找不到自己需要的书籍。第四节课的主要内容是中国知网的使用方法和搜索技巧, 先学习了如何进入和登陆中国知网, 其次是搜索方法, 快速而有效地找到自己需要的资源, 比如跟踪名人学者, 找到他们发表的论文以及几种导出论文的方式。最后, 我了解了投搞论文的方法和建设个人数字图书馆, 并尝试建设自己的数字图书馆, 将理论和实践相结合, 对搜商的应用有了进一步的了解。

第五节课是关于期刊论文的撰写, 老师讲了论文的基本构成与要求和参考文献的书写格式以及大雅论文相似度检测。之前我不了解怎样才能写出一篇好的论文, 学了这门课程后, 我知道了论文的构成要素和搜索相关的论文资源, 参考别人的论文成果, 然后自己就可以写出一篇论文了。老师又介绍了中国期刊网, 主要有龙源期刊网、万方数据库和维普数据库。如果想看期刊杂志, 就可以不用到图书馆借阅或将期刊买回来翻阅, 只要自己到这三个数据库, 查询想看的期刊花费少量的资金就可以看到自己喜欢的杂志。还可以在数据库上检测论文相似度, 以前只知道在淘宝上检测论文, 现在学会了多种检测论文的方法。

第六节课主要是电子图书的检索与利用, 可以在网络上阅览电子图书, 一种是在图书网站上检索书籍, 另一种是在图书数据库上检索学术方面的书籍。我学习了如何在超星数字图书高级检索电子图书, 从中进入读秀知识库浏览电子图书, 有效率地搜寻和利用电子资源。另一节课学习了其他数字图书馆的高级检索与中国国家图书馆的图书检索和公开课, 接下来老师讲了百度高级检索技巧, 每一个技巧对我搜索信息有很大的帮助并且节省了一定的时间, 让我有更多的空余时间做自己喜欢的事情。

3 信息检索与利用的心得体会

之前我一直认为在学习知识方面需要读很多的书, 大脑要记住很多的知识, 然而互联网发展, 信息在不断地更新, 我发现需要学习的知识太多, 需要了解的范围太广泛。现在, 我学习了《信息检索与利用》这门课程, 发现自己能够运用一些搜索技巧以及找到解决问题的有效方法。通过课上学到的知识, 运用到生活中, 在图书馆借了一本书名为《我的搜主意比你多》, 作者黄泰山将他搜索的经验与读者分享, 所以我对搜商有了进一步的认识, 发现传统的独立思考效果也会受到限制, 独立思考只有个人的力量, 需要花费大量的时间才能解决问题。有时候没有那么多的时间, 难道就不能解决了吗?我为什么要花比别人多一倍的时间才能完成任务呢?

搜商除了可以帮助我解决问题以外, 还可以提高我的智商、情商和成功的概率。在我的专业领域, 多少接触过一些相关信息, 但我更加需要找到这个领域内最有价值的信息, 而不仅仅是相关信息。在第七节课中, 学会用不同的搜索引擎有效地得到信息资源。而我明白了搜索不仅仅是一件供人利用的工具, 还是检索到有效方法解决问题的路径。掌握了搜索技巧, 我在完成专业作业时, 设置准确的关键词, 利用相应的搜索引擎, 获得自己想要的信息, 快速地完成了作业。不仅在专业领域的学习, 想要提升其他能力, 搜商可以助你一臂之力, 搜索资料认识能力, 学习和研究经典案例, 找到提升能力的方法, 对该领域的最新研究成果、动态发展的了解, 也可以依托搜商获取最新的信息和资源。

4 总结

总的来说, 学习这门课程, 就像拿到一把开启知识库大门的钥匙。无论你欠缺哪方面的知识、技能, 都可以上网寻求帮助, 获得学习资源。在这个有互联网的时代, 每一天都在变化, 信息也在更新换代, 而我们也需要变化, 积累更多的知识, 适应未来的变化发展。搜商的学习不会止步于此, 每天学习一点, 未来收获更多。

参考文献

信息检索途径 篇5

1、书目信息

主要通过各种书目型数据库获取, 书目型数据库可用于查明关于某一专题有哪些出版物以及如何获取等信息。书目型数据库主要有联合目录、在版图书书目和网上书店目录以及各类型图书馆公共检索目录。

1.1 联合目录

书目信息检索工具国外主要有联机计算机图书馆中心 (简称OCLC, ) , OCLC联机联合目录数据库Worldcat, 它是世界上最大的书目数据库, 可检索字段有:主题、著者、引文、分类号、语种、出版局、出版地等。国内比较著名的书目检索机构还有CALIS联合目录数据库 (http://162.102.138.230/opac) 和上海图书馆的西文文献联合目录数据库检索系统 (http://www.linet.sh.en/ejex/ex/wx.htm) 等

1.2 在版图书书目

国际上比较流行的在版书目有《在版书目》简称 (BIP) 、《全球在版图书书目》简称 (GBIP) 、《国际在版图书书目》简称 (IBIP) 和英国在版图书书目 (British Books in Print, 简称 (BBIP) 。

1.3 网上书店目录

网上书店最著名的是亚马逊网上书店, 其检索途径可以通过该网页相应窗口获取, 检索字段有著者、书名、出版社、关键词、语种、ISSN号等。国内有当当网上书店、中华读书网等, 其检索方法是按书名、作者、出版社、分类号、语种等不同的检索途径来进行检索。

1.4 各类型图书馆公共检索目录

各类型图书馆联机公共检索目录 (简称OPAC) , 用户检索某个图书馆的OPAC, 只需直接登陆到相应的图书馆网站, 进入“联机公共书目查询”或“馆藏书目数据库检索”等栏目即可实现某一专题的检索。例如:查询清华大学图书馆公共检索目录, 就可以登陆其 (http://www.lib.tsinghua.edu.cn/index.html) 。

2、期刊信息

期刊信息的检索工具有 (以中国为例) :

(1) 、清华同方CNKI的《中国期刊全文数据库 (CJFD) 》 (http://www.cnki.net) , 收录7400多种期刊, 2400多万篇, 浏览器是CAJ, AdrobReader。

(2) 、重庆维普资讯有限公司《中文科技期刊数据库》 (http://www.cqvip.com) , 浏览器是VIP, AdrobReader。

(3) 、北京万方数据公司的《数字化期刊全文数据库》 (http://www.wanfangdata.com.cn) , 浏览器是AdrobReader

(4) 、人大复印资料 (http://www.zlzx.org/) 收录人文社科类期刊论文, 分大类。

(5) 、中国知识资源总库-CNKI系列数据库 (http://caj.jllib.cn/kns50/) 浏览器:CAJ, PDF

3、学位、会议论文信息

这一类检索主要分为5大类:一、PQDD (美国博硕士论文数据库) :是世界著名的学位论文数据库, 收录有欧美1000余所大学涉及文、理、工、农、医等领域的博、硕士学位论文, 浏览器是Adobe Acrobat Reader;二、万方数据库资源系统 (http://hk.wanfangdata.com/) , 《中国学位论文全文数据库》和《中国学术会议论文全文数据库》是万方数据库资源系统的一个分支;三、中国知网 (CNKI) (http://www.cnki.net/index.htm) ;四、中国高等教育文献保障系统 (http://opac.calis.edu.cn/simpleSearch.do) ;五、中国重要会议论文全文数据库: (CPCD) China Proceedings of Conference Fulltext Database, 收录我国2000年以来国家二级以上学会、协会、高等院校等单位的论文集。

4、网页与新闻信息

主要是通过使用搜索引擎查找与该专题有关的信息和要闻。

搜索引擎 (search engine) 是运用特定的计算机程序收集互联网上的信息, 在对信息进行组织和处理后, 为用户提供检索服务的系统。搜索引擎大都提供分类查询, 用户输入关键词进行检索, 搜索引擎从索引数据库中找到匹配该关键词的网页并将检索结果显示与排列。

国外著名英文搜索引擎包括:1、Google http://www.google.com;2、Yahoo http://www.yahoo.com;3、Live http://www.live.com;4、SearchMash http://www.searchmash.com/。

国内著名搜索引擎网址有:1、百度http://www.baidu.com/;2、雅虎http://search.cn.yahoo.com/;3、Google http://www.google.cn/;4、搜狐搜索引擎http://www.sogou.com;5、新浪网http://www.iask.com/

参考文献

[1]赵惠芳:《学位论文信息的检索与获取》[J].现代情报, 2003, (09)

信息检索途径 篇6

互联网的快速发展和广泛应用, 为人们提供了一个广阔的信息空间, 也为信息检索提供了一个广阔的发展平台。互联网的开放性和自由性使得网络信息资源呈现出数量巨大、异构性、分散性和动态性特征。但由于网络信息时效性强以及互联网缺乏必要的监督和质量控制, 使得大量垃圾信息混于高质量信息当中, 增加了有效信息获取的难度, 影响检索效率。因此, 使用有效的检索工具才能使得网络信息资源为人们所充分利用。

1 网络信息资源点与检索工具

上世纪90年代中期出现的搜索引擎技术目前已经成为检索各类网络信息资源最主要的检索工具。搜索引擎一般工作流程是借助于网络自动搜索软件 (Robot、Spider等) 访问浏览网页并抓取文件, 并通过已浏览的网页中的链接访问更多网页。在抓取网页的同时对页面文件进行分析分解以及索引, 建立索引数据库。当用户在搜索引擎界面输入搜索词后, 搜索引擎对搜索词进行处理, 按照处理后的搜索词在索引数据库中找出所有包含相关内容的网页, 并更具排名算法计算出排名顺序然后按照一定的格式返回到搜索页面。普通的搜索引擎缺点在于返回的检索结果数量巨大, 无关和冗余信息较多, 用户必须从中进行筛选。虽然布尔运算、截词运算、自然语言检索等技术使用大大提高了准确率, 但对用户检索素养要求很高。针对以上问题, 学者把研究对象放到对词意的挖掘上, 探索实现基于概念匹配的检索技术和方法, 基于本体的语义检索成为研究重点。

2 语义检索基本要素和原理

随着人工智能以及自然语言处理的发展, 尤其是语义网技术的兴起, 自上个世纪以来语义检索研究得到了迅猛的发展。虽然对于语义检索在概念上到目前为止没有统一的界定, 但是不同的研究都有一个共同之处就是基于对信息资源的语义处理时限效率更高的检索[1]。本体是语义检索的基础, 其主要任务是对信息资源进行语义表达。

本体 (Ontology) 原本是一个描述客观事物本质的哲学概念, 是对客观存在的一个系统的解释和说明。如今, 本体是一种能在语义和知识层次上描述概念体系的有效工具, 用来描述概念以及概念之间的关系, 通过概念之间的管理来描述概念的语义。本体作为一种最先进的知识表示方式能够充分的描述所以的数据结构, 是推理和关系数据库的结合[2]。概括的讲本体能够在人们和应用系统之间达成对术语含义的共享和共同理解, 通过函数 (functions) 、关系 (relations) 、原则 (axioms) 和实例 (instances) 、类 (classes) 这5种元素表达本体中的知识, 使其具有逻辑推理和语义识别功能, 帮助检索系统跨越目前基于关键词的检索过程中的上述问题以实现语义检索[3]。目前实现网络检索的技术主要有两种:第一种, 依赖于编码处理, 以分类模式来描述信息资源以实现检索的目的;第二种, 是通过全文检索查找文本中包含用户指定的词语的信息源。语义检索的语义信息的提取和处理是基于语义网方法与技术的查询处理与文档标注及索引。基于本体的查询处理包括:查询消歧和查询扩展, 通过消岐, 明确查询的确切所指, 准确反映用户的信息意图, 继而通过加入与其语义相关的其他概念来实施扩展。在对文档进行语义标注与索引的基础上, 先进行实例检索, 再据此返回所有以检出实例标注的文档信息是语义标注文档检索的一种普遍思路。相对于传统的网络检索, 基于本体的语义检索的优势在于体现语义信息, 准确表达用户的查询意图。

3 常见语义检索系统介绍

3.1 一体化医学语言系统 (UMLS) UMLS (Unified Medical Language System)

作为计算机化的情报检索语言集成系统, 是美国国立医学图书馆 (NLM) 主持的一项长期开发研究计划。它不仅是自然语言处理、语言规范化以及语言翻译的规范化工具, 更是实现实现跨数据库检测的词汇转换系统并且还可以帮助用户连接情报源, 包括书目数据库、事实数据库、计算机化的病案记录以及专家系统过程中对于其他的电子式生物医学情报的一体化检索。UMLS包括情报源图谱 (Information Sources Map) 、语义网络 (Semantic Network) 、专家词典 (SPECIALIST Lexicon) ) 和超级叙词表 (Metathesaurus) 四部分。其中超级叙词表是术语、生物医学概念、等级范畴、词汇及其涵义的广泛集成。1997年第8版的超级叙词表收录了739439个词汇, 这些词汇来源于30多种生物医学词表和分类表的能表达33万多个概念的, 词汇量达到空前规模。而语义网络是为超级叙词表中的所有概念提供语义类型及相互关系结构的工具, 是为建立概念术语间相互错综复杂关系而设计的。UMLS的语义网络不仅运用了常规的语义控制手段, 如属分、相关关系控制、语义等级, 同时在语义规范和语义关系分析、延伸等多方面有许多创新。

3.2 语义网 (Semantic Web)

为了能够在网络环境下也同样实现语义检索的功能进而开发研究了语义网的W3C项目。W3C项目是将网络上的数据通过一种方式进行连续和定义, 通过这种定义和连续可以根据人的不同需求实现计算机将数据自动进行整合以及再利用, 从而达到更有利于人机协作的目的。资源描述框架 (Re-source Description Framework, 简称RDF) 是语义网的核心构件。在网络中, 一般用元数据对资源进行描述, 而RDF则是处理元数据的一个基础。RDF认为一个具体的元数据是由属性值 (Statements) 、属性 (Properties) 和资源 (Resources) 构成的三元关系模式[4], 实际上是关于一个特定的资源特定属性的取值声明。使用RDFS语言, 元数据的设计者不仅可以定义所描述资源的类别、属性以及词汇, 还可以定义这些属性或者对象的关系以及对象与属性之间的相互关系, 同时还可以进一步定义这些资源的对象、属性以及属性应用类别和取值条件等, 通过这些定义从而能以计算机理解的标准方式对元数据进行描述语义内容以及元数据的结构关系。

3.3 Word Net

Word Net是一种基于认知语言学的英语词典, 它是由普林斯顿大学的计算机工程师、心理学家和语言学家联合设计的不仅是把单词以字母顺序排列, 并且是按单侧的意义组成的一个“单词的网络”。Word Net将所有的英语词汇按词性分为功能词、形容词、动词、名词和副词五类。动词被组成各种推演关系;名词在词汇记忆中被组成主题的层次;而形容词和副词被组织在N维超空间中。根据Word Net关系分析最大的优势是能在他的单词网里通过相关关系消除歧义, 因为Word Net分析主要是关系分析。Word Net在名词的语义消歧率可以超过60%。

4 结语

从以上三个语义系统来看, 无论是相对封闭的ULMS系统还是开放式的语义网、wordnet系统都具有较强的灵活性和扩展性。相对于常见的关键字信息检索, 语义检索不需要用户使用专业的检索策略, 也不需要语法严谨的检索式, 用户可以将自己的信息需求通过自然语言直接表达出来。语义检索在后台经过大量的计算, 分析用户的用户的语义文档信息, 充分利用各种语义关系消除歧义将用户真正需要的准确的信息资源反馈给用户, 将用户的检索效率提升60—80%。因此, 语义检索无疑是当前信息爆炸条件下最适合的网络信息检索方式。

摘要:互联网给用户的信息检索带来便利的同时也导致大量冗余信息出现, 使得检索效率低下。语义检索通过对用户检索要求的语义分析使得检索效率以及检索准确度大大提升。本文在分析语义检索基本要素和检索原理的基础上, 介绍三种常用的语义检索系统, 体现语义检索在网络信息检索环境下的优势。

关键词:语义检索,本体,语义网

参考文献

[1]黄敏, 赖茂生.语义检索研究综述[J].图书情报工作, 2008, (6) :63-66.

[2]Studer R, Benjamins R, Fensel D.Knowledge Engineering, Principles and Methods[J].Data and Knowledge Engineering, 1998, 25 (1-2) :16l-197.

[3]翁畅平, 沈娟.基于Ontology的个性化语义检索系统研究[J].图书馆理论与实践, 2009 (10) :77-80.

信息检索系统比较研究 篇7

1 信息检索可视化系统的优点及其类型

1.1 可视化信息检索的优点

1) 信息检索的可视化研究就是将文献信息、用户的提问在进行检索过程的同时, 将结果及可视化检索过程中的内部语义关系的转换等展示在一个低维的可视化空间中。可以使用户看到在传统信息检索过程中看不见的图形信息, 即向用户展现各种信息之间的语义关系, 使提问和检索结果以及检索过程中各信息之间的内部语义关系可见, 使得信息能够得到更有效的反馈。

2) 可视化信息检索使得检索结果清晰可见, 不仅让用户对其检索得到的文献分布一目了然, 还有助于用户浏览所检索的文献并进行文献信息分析;另外, 可视化的信息检索使得用户能够了解文献间隐含的语义关系, 从而更好地判断文献间的相关性[2]。

3) 可视化信息检索不仅可以用二维或三维图像显示结果, 还可以把人的视觉及认知过程融入检索过程、算法分析和设计系统当中, 因而减少了用于了解检索结果的聚类或语义分析的时间[2]。

4) 可视化信息检索系统可以通过改变文献的显示方式、改善人机交互功能来提高用户对文献间语义关系的理解, 实现个性化处理, 有助于不同语言背景的用户使用, 使得信息检索更加灵活简洁。

1.2 信息检索可视化系统的类型

1) 基于引文的信息检索可视化系统[3]。从检索系统的功能来看, 对于这种基于引文的信息检索可视化系统的评价, 除了要依据其理论基础外, 还应参照基于引文的检索系统的评价标准以及对可视化系统的评价标准。因该种可视化检索系统的主要特征是运用可视化技术进行知识域分析, 因此在参照信息可视化系统的评价标准时, 还分析检索过程中系统的交互性、可视化的显示形式、可视化的映射方法、用户界面等。

2) 基于知识模型的文本信息检索可视化系统[4]。该系统是通过信息、知识资源的元数据来进行可视化检索的。各种信息检索可视化系统都需确定两个方面的内容, 即系统的可视化对象以及可视化表现形式的内容。合适的可视化对象, 是指文档、网站结点、超链接结构等, 而可视化表现形式是指如几何图形、图表形式及自然物质实物形式等[5]。

2 对比分析基于引文和基于知识模型的信息检索可视化系统

笔者综合分析了基于引文的信息检索可视化系统和基于知识模型的信息检索可视化系统, 主要从系统设计、用户使用等方面着手对这两种系统进行了对比分析, 详细内容见表1。

从表1的对比分析中, 不难看出其各自的优势之处。由于这两类系统还处于原型研究阶段, 均缺少个性化服务及特色服务, 从界面到内容的设计还不够人性化, 帮助功能不够完善, 还需要加强与其他信息检索技术、方式及系统的集成, 以方便用户的最终使用。可以在现有的信息检索系统中通过对检索技术的改进和完善, 以缩短检索时间、增强系统和用户的交互性来满足用户科学研究、交流互动的需求, 并以知识结构图的形式将浏览或检索结果呈现给用户。

3 结论

在信息检索中, 跨语言信息检索终将成为现实, 随着经济全球化的开启, 科技文化早已不能各自为政, 而语言是实现全球化的最大障碍之一, 将可视化技术应用到跨语言信息检索中, 开发出跨语言的信息检索可视化系统将成为以后信息检索可视化系统的主要发展方向, 更好地解决用户在利用信息中的语言障碍问题。

摘要:本文对目前较为流行的信息检索可视化系统进行了简要的比较分析。

关键词:信息检索,可视化,对比分析

参考文献

[1]张进, 袁泽林 (翻译、整理) , 陆伟 (翻译、整理) .信息检索可视化的主流路径[J].图书情报知识, 2008 (5) :24-27.

[2]么新英.传统信息检索与可视化信息检索之比较[J].科技情报开发与经济, 2003, 13 (3) :1-2.

[3]孙巍, 张学福.基于引文的信息检索可视化相关系统比较分析[J].情报理论与实践, 2008 (4) :598-601.

[4]张学福.基于知识模型的文本信息检索可视化研究[J].中国图书馆学报, 2006 (5) :52-56.

上一篇:首尔大学下一篇:区域金融创新