现代信息检索

2024-10-31

现代信息检索(共12篇)

现代信息检索 篇1

现代图书馆作为人类知识储备和检索的信息资料仓库承担了比以往任何时代都更为艰巨和复杂的任务。大学图书馆中提供的现代信息检索服务, 在现代计算机网络信息高级检索出现后, 信息资源进入到了一个资源海量、信息爆炸、数据更新快速冗杂和沙漠化的时代。人们对信息及信息技术的依赖影响了人们的工作、生活乃至个人健康, 导致了人们在信息面前无所适从。信息异化已经成为信息领域之内一个不可回避的客观事实。

1 信息异化的内涵、外延及在现代信息检索中的表现。

信息异化中包括两个关键词:信息及异化。本文中所指的信息是指一切经过人类利用语言、文字、符号、图像等形式加工过的自然信息, 既包括有形的纸质信息等, 也包括无形的电子信息。异化, 指主体在一定发展阶段分裂出其对立面, 变成外在的异己力量。黑格尔曾对此做出过深刻的阐述:“在历史里面, 人类行动除掉产生它们的目的, 在取得的那种结果———除掉他们直接知道欲望的那种结果以外, 通常又产生一种附加的结果。他们满足了他们自己的利益, 但是, 还有潜伏在这些行动中的某些东西, 虽然它们没有呈现在他们的意识中, 而且也并不包括在他们的企图中, 却也一起完成了。” (1) 在马克思看来, 所谓异化, 是指劳动产品作为一种异己的对象同劳动者相对立。“劳动所产生的对象, 即劳动的产品, 作为一种异己的存在物, 作为不依赖于生产者的力量, 同劳动相对立。” (2) 在信息创造传播和使用的过程中, 人是主体, 是发信号者;信息是客体, 是被创造物。所谓信息异化就是指在主体对客体的生产和使用过程中, 由于受到各种因素的干扰导致了信息生产和信息消费之间的矛盾, 使主体丧失了控制信息的能力和原有的内涵, 并为信息所奴役、支配。

信息异化的表现很多, 在现代信息检索中的表现也尤为突出。作为现代信息检索的使用者、操作主体—人, 对现代检索手段产生了盲目的依赖, 面对大量信息时无法自主地对信息进行掌握和支配, 有些人甚至患上了检索强迫症, 心理上奉行信息至上主义, 对信息盲目崇拜, 面对信息时惊慌失措, 生怕自己处于信息竞争的弱势, 担心自己信息量太少, 总是拼命下载资料、收集信息, 离开现代信息检索就会产生信息恐慌, 这些都是被信息奴役的表现。

2 信息异化出现的社会历史根源

信息异化的出现是社会进步发展中一种附加的历史必然结果。现代社会是一个信息爆炸的时代, 但是信息爆炸是指依靠现代科学技术, 作为客体的信息迅猛发展。然而, 作为主体的人的认知能力却不可能在一夕之间也同时跳跃性发展, 所以, 作为客体的信息爆炸性增长和主体人的认知能力的有限就形成了一对不可调和的矛盾, 也就是说知识匮乏已经成了信息爆炸的伴生现象。另一方面, 信息的快速生产超出了人类处理和利用的极限。据统计“目前我国有各类报纸2160余种 (年总发行量达260亿份) , 但是新闻界人士认为, 中国报业在发展中存在着内容重复, 信息量小, 质量不高的大问题” (3) 没有资料的积累, 而偏执于新信息的传递, 社会将只能是无记忆的重复运动, 最终为信息泡沫所淹没。

此外, 人的信息异化是社会压力与个人自我发展压力的结果。现代社会是一个竞争激烈的社会, 竞争是以实力为基础的, 而实力需要积累。个人本身就有发展的需要, 这样在社会压力和个人发展需求的双重作用下, 人们十分关注个人知识、技能、素养的提高, 总是想获得更多信息。这就促使一些人养成了信息癖, 仅仅成为信息的收集者、整理者, 成为垃圾桶。他们整日在网上利用现代信息检索工具搜集各种信息资料, 生怕遗漏了什么重要信息, 他们进行过量过快的阅读, 过量过快的信息收集, 而没有进行思考。于是, 发起信息的人反过来成为信息的奴隶, 被信息支配, 丧失了主体性。

3 图书馆该如何帮助读者对抗信息异化

第一, 要正确认知和妥善处理“人与信息”、“网络虚拟与社会现实”的关系问题, 保持与增强人的主体性, 并有效发挥人的主体性作用。要提高人的修养及加强人的道德观, 提高人文素质。人们要利用信息来表达人类的思想、感情和言论, 更需要做好信息文化工作。如增强自我意识, 拓展人类的文化视野, 突破国界文化的时空界限, 改变文化的传统模式。利用信息丰富人品个性, 提高人的综合素质, 使人们的道德观加强, 人文修养提高。

第二, 由于过量过快的阅读信息, 过多过杂的选择信息, 有些人甚至简单的利用信息, 对信息的思考减少, 只是做了简单的劳动或无用功。针对此种现象, 图书馆的现代信息检索中心应及时根据人们的需要整理信息, 调整、更新、优化信息把有用的信息归类、添加、移动、重组和整合, 把无用的信息删掉, 要促进信息的国内国际交流, 营造一个活泼、个性、开放、宽容的信息环境。

第三, 通过现代信息检索课程帮助读者树立正确的价值观念。由于主体价值观的丧失是信息异化的根源, 因此人们应该树立正确的价值观念, 提倡人文精神, 引导读者遵循人与自然相协调发展的原则, 培养个体责任意识, 自觉抵制各种不良信息的侵扰和诱惑, 分辨信息的真伪与优劣, 通过对信息的正确利用, 为个体的发展创造机会。

参考文献

①黑格尔历史哲学[M]上海:三联书店, 1956:66.

②马克思1844年经济学哲学手稿[M].北京:人民出版社, 1985:49.

③阮海红.信息的异化与信息管理.Journal图书情报工作, 2000, 4.

现代信息检索 篇2

(图与内容无关)

Modern Information Retrieval 现代信息检索学习报告

姓名:

班级:

学号: 教师:

76993082.doc

一,我的感想

在报这课程时,对这门课程并不了解,只是简单的认为信息检索就是翻翻书找找文献等是单纯的查找。但是经过这一学期的课程,我发现每一条信息,每一篇文章都是系统的归类,划分范围类型,而检索的途径也很多种,如有作者途径检索、分类途径检索等,检索式更是分类齐全繁多。

有很多收获,感觉很充实,发现我们的生活中时时刻刻都在检索信息.在老师的指引下,我们对检索工具一步一步地熟悉和应用,对于检索的方法,我觉得不管是在哪个网站检索,最重要的还是关键词的选择。关键词选的“关键”,不仅可以提高检索速度,而且大大提高了检索结果的质量,可以很容易找到自己需要的资料,总之要缩小范围。

二,学习收获

信息检索课是无意间报名的,如不是一个偶然的事件,要不是我找错教室,也许我就会错过了一个真正的学习的机会。根据CNNIC最新统计调查显示,在互联网应用中,信息检索已经排在了第二位,成为仅次于电子邮件的互联网应用。搜索网站可以帮助我们快速便捷地在互联网中进行信息的检索、查询。信息检索对我们来说并不陌生,在这个信息泛滥的年代,很难想象如果一夜之间如果没有了Internet将对我们的生活产生怎样的影响。

以前我在网上找资料基本上处于一种盲目的状态。在百度里输入

76993082.doc

关键词,不少检索出来的东西,基本上用处不大,或者并没有什么依据,只是网友自己的解答。本学期上了信息检索课,我学习到了检索的一些知识,并且也由此及彼地把这些知识应用到信息的检索中。在学习阶段,通过上信息检索课我对信息检索的认识又上升到了一个新的高度。

我觉得信息检索可以应用在我们每个课程中,自己可以给自己觉得有意义的课题,进行一个追踪或者资料的查询,可以把自己学到的知识巩固,并且可以深化自己随着方面的理解。例如在我们的一堂《企业财务管理》课程,老师布臵了一个作业,一个企业并购案例分析,香港巨商李嘉诚之子,李泽楷,盈科数码动力主席与新加坡总理李光耀之子,李显扬,新加坡电信行政争夺香港电讯的收购权。在分析这道题时,就涉及到信息的检索,首先要看看这三家公司的经营情况,还要检索当时参与收购的财团,还有收购的获胜方,收购价格,最终收购后的经营状况等等。最后通过自己查到的这些资料分析为什么盈科数码动力会获胜,但是经营确是赔本的。

通过学习以后发现,信息检索的策略也是非常重要的,我原来误以为一个好的检索策略只能提高查准率,大不了我多查几篇资料,现在发现它还能提高你的查全率,而且对于你从较高层次上把握课题的研究方向、发展脉络是极有帮助的。

附:常用搜索网站信息和基本检索技巧

一,八大搜索网站简单介绍

1、“Google”是功能强大,易用性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。

Google(http://.yahoo.com)支持网页、网站搜索,搜索速度快而且准确性比较高。

4、“网易”网站搜索非常出色,但缺少提示,网易搜索的操作界面不太方便,在使用的过程中也缺少提示。

网易搜索(http://search.163.com)支持网页、网站搜索,网页搜索使用的是百度的搜索技术,除了分页方式以外,其他的返回结果都与百度一样,但推荐的站点比较少。

5、“搜狐”曾是IE默认的中文搜索网站,网站搜索值得推荐,但重复现象较多搜狐的搜索结果中没有标出关键字,查阅起来非常不便。

搜狐(http://search.soho.com)支持网页、网站搜索,在国内享有很高的声誉,曾经一度是微软IE浏览器使用的默认中文搜索网站,在IE浏览器地址栏直接输入关键字即可进行搜索。

6、“慧聪”是出色的 行业搜索网站,但缺少高级搜索功能,死链率也不低,而且搜索结果中重复的网站较多。

长期以来,国内的搜索技术提供厂商很少,百度作为先驱者,占据了大部分份额。到了2002年,国内搜索市场中出现了一匹黑马,那就是慧聪搜索(http://)是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果。天网搜索的FTP服务器文件搜索功能非常强大,而且还为用户整理了一份庞大的热门搜索关键字目录,方便用户浏览和下载所需的文件。二,信息检索技巧

1、选择恰当的关键字

互联网上流传的所有搜索技巧都是在如何确定关键字上做文章,选择一个好的关键字是搜索成功的关键。关键字代表着我们要搜索资料的特征,如果您找不

76993082.doc

到所需的信息,大部分情况是因为在关键字的选择方向上发生了偏移。找出关键字可不是一件简单的事情:首先您需要知道或者估计出目标网页内包含的文字,在脑子里形成一个比较清晰概念,再从中提炼出此类信息最具代表性的关键字。尽量不要选择常用词汇进行搜索,但可以同时使用多个关键字并加入与、或、非等多种逻辑关系进行搜索,这样才能避免返回无关的搜索结果。

a.避免输入及逻辑关系错误 首先我们要避免输入的关键字中有错别字,以及其他错误的操作。不同的搜索网站往往都有各自的特点,在某些搜索网站上,您可以使用“Where can I find software?”这样的自然语言进行搜索;但在某些搜索网站上,您甚至不能成功地使用单个汉字作为关键字进行搜索。另外,在使用多关键字通过与、或、非逻辑关系进行搜索时,不同的搜索网站所采用的逻辑关系表示符号也可能有所不同。所以我们有必要针对不同的搜索网站选择不同的关键字,并在首次使用一个搜索网站时,花一点时间阅读搜索网站的帮助文档,这是非常有必要的。

b.使用多关个键字来提高 检准率 对于大部分的搜索任务来说,一般都能够通过搜索网站找到需要的网页,但是如果不细心选择关键字,搜索网站可能会返回很多并不是您需要的结果。此时,如果您将另外一个跟搜索目标相关的关键字加在一起搜索,返回的结果就会少很多,也更加准确。因此,很多时候我们需要使用多个关键字查询的方法来提高搜索准确率。但需要注意的是,搜索网站对关键字的个数可能会有限制。另一方面,也要注意搜索内容之间的逻辑关系是否合理。

2.句子检索法可有效提高文本检准率

在使用搜索网站时,不少人经常被“关键字”这个名称所限,而忘了关键字可以是一个字、一个词,甚至一句话。例如在搜索小说、文章等文本内容时,最简单的方法,是用文本的标题搜索,但最高效的方法,则是用文中的一句话来搜索,可以让您的搜索效率提高不少。3.文件检索法 利于快速查找文件目标

如果您的搜索目标是一个文件,如一个公司Logo的图像文件,或者一个设备驱动程序的压缩包,您除了可以用公司的名称或者设备的名称进行搜索外,还可以从文件的名称入手。例如,当您在搜索设备驱动程序时,如果选择设备的品牌、型号为关键字时,搜索网站会返回许多无关的信息,这时,如果在这些关键字的后面再加上ZIP或RAR等常见压缩文件扩展名,您会有意外的收获。4。“抛砖引玉”法利于快速查找相关信息 如果您有一个非常喜欢的专业网站,并希望从互联网上找到更多同类的网站,这时怎么选择关键字最有效呢?或许搜索这个网站的内容类型会找到一些不错的站点,例如使用“军事网站”、“医学站点”做关键字,但很多时候这种搜索方法也可能一无所得。实际上最有效的方法是抛砖引玉,用您最喜欢的网站的站点地址作为关键字。因为链接到那个站点的往往是同类站点,用这种方法您肯定能够找到一些相关的网站。

5.中西结合检索法可以很好地完成某些搜索任务

在使用搜索网站时,灵活地结合中文和英文可以很好地完成某些搜索任务。您除了可以将要翻译成中文的英文词汇用作关键字,并指定搜索网站只返回中文网页的结果,尝试将搜索网站当成翻译机器来使用;还可以将中文词汇的一部分翻译成英文,例如您正想将“土豆烧牛肉”翻译成英文,只要您知道土豆的英文,您就可以输入关键字 “土豆烧牛肉 potato”,从互联网上找到含有土豆烧牛肉

76993082.doc 的英文网页。

三,信息检索的应用

本学期选修了现代信息检索课程,觉得很有用,虽然在一开始对于这门课程,到底能够学下什么,到底可以应用多少产生过质疑。觉得现代信息检索,名字叫得听高级,到底学什么不了解,但在这门课程学完后我有了理解。“快速便捷地找到自己所需要的信息”是这门课程的要求,那怎么才能应用与我所学的旅游管理专业上呢?

随着互联网技术的广泛应用,旅游业的网上营销是近期行业内探讨的热门话题,而其中一个重要的推广手段——搜索引擎,在企业中发挥的作用也渐渐突显出来。对搜索引擎以及旅游行业专业人士—— “去哪儿”旅游搜索引擎的了解,综观搜索引擎对推动在线旅游业发展方面所创造的价值,可以让旅游业界人士对运用搜索引擎来最大化收益有个更清晰的理解。

通过对“去哪儿”旅游搜索引擎的了解,可以看整个在线旅游行业的现状,细致分析了消费者利用网络查找及预订相关旅游服务的情况,不但有利于完善和丰富旅游搜索引擎自身的发展,对旅游运营商——航空公司、酒店及旅游代理商了解搜索引擎的及消费者购买流程更是大有裨益。

“去哪儿”的调查发现,使用网上预订的旅客都是旅游常客,进行网上预订的消费者是热衷旅游的人士,26%称在过去一年中他们至少度假4次;虽然中国的网络用户主要是在中国境内旅行,越来越多的中国人计划出国旅行,将近40%的人希望下一次旅行时能够走出国 6

76993082.doc

门。

对于网上旅行者特征的调查,“去哪儿”的报告显示,这部分消费者是属于吸引力很强的人群,73%使用信用卡,22%拥有并驾驶小汽车,88%拥有大学学历。

而对他们的预订方式的调查发现,更多的人愿意使用互联网预订旅行。“去哪儿”的报告显示,一半以上的互联网用户曾经在某个地方在网上购买机票,略低于一半的人曾在网上预订酒店。

从市场应用角度来讲,航空旅游行业对搜索引擎的依赖性是比较强的。我们可以从用户的反馈看到,凡是在网上有旅行预订经历的用户,有97%的人都会通过搜索引擎来寻找旅游产品。这也给航空公司、旅行代理,还有酒店一个很强烈的信号——利用搜索引擎来传达他们的相关信息,是企业推广的有效手段之一。”

关于信息检索的应用有部分摘抄自2007的一个腾讯新闻网的《关于旅游业与搜索引擎的发展关系》,其中还有介绍Google的旅游搜索引擎,但由于Google2010年3月推出中国内地,转至香港,就不做介绍分析。

以上为我对现代信息检索的感想,学习收获,和现代信息检索在游业方面应用的看法,可能不是太全面,或者太狭隘,望何老师见谅和指导。

网络信息检索及其局限性 篇3

关键词:网络信息检索搜索引擎局限性

1 网络信息检索简介

1.1 信息检索的概念 信息检索指的是将信息按照一定的方式组织、存储起来,根据信息用户的需求查找所需信息的过程和技术。信息检索主要通过以下几种途径来获取信息:①传统的信息检索,即利用人工查询的方式,查询图书馆等文献丰富的机构,并获取文献;②联机信息检索,它和传统的信息检索比起来具有广泛性、实时性、完整性和共享性等特点;③网络信息检索,即信息用户利用网络信息检索工具检索Internet信息空间中的各类网络信息资源。

1.2 网络信息检索的原理 概率模型、布尔逻辑模型、模糊逻辑模型是应用比较广泛的几种网络信息检索模型主要有:①概率模型。该模型是在贝叶斯概率原理的基础上提出来的,对词条和文档间的内在联系进行研究之后,通过词条和词条之间和以及词条和文档之间的概率相依性来检索信息。②布尔逻辑模型。根据检索项在文档中的布尔逻辑关系提交查询,搜索工具按照提前组建的倒排文档结构来确定查询结果。③模糊逻辑模型。处理查询结果的过程中引入模糊逻辑比较,同时根据先后次序将查询结果排列出来。

2 搜索引擎

搜索引擎,又称检索引擎,指的是在Internet上运行,通过对信息资源进行检索来提供所需数据的服务系统。当前,大部分人们都利用搜索引擎来检索网络信息。和其他检索工具比起来,它这种检索工具的检准率、检全率远远高于其他检索工具,具有极强的利用价值,且就目前情况而言,它的市场强劲非常广阔。

2.1 搜索引擎的功能 ①模糊检索。对网络资源进行检索时,系统检索用户提供的关键词以及与冠军按此相似的词语,同时返回包含关键词,或这些相似词的检索结果。②布尔逻辑检索。用户可通过NOT、AND、OR进行关键词的搭配检索。③截词检索。截取词条的某一部分来进行检索。在搜索引擎中,用户提供包含“?”、“*”通配符的检索项进行检索。④限定词检索。它用来规定检索项中必须出现或是必须不出现某些关键词。

2.2 搜索引擎的工作原理 搜索引擎的检索机制一般包括数据组织机制、数据采集和标引机制和用户检索机制。

①数据组织据组织机制是对www页面信息进行整合,使其更加简单、规范,同时构建相应的索引数据库。②数据采集和标引机制根据相关规律及一定的方法来搜索网络上的www站点,同时将搜索结果存入搜索引擎临时的数据库内。③索引数据库是信息检索的先决条件,检索结果是否符合要求在很大程度上去觉与索引数据的准确性,数据库质量主要取决于搜索引擎的数据采集及标引机制。④用户检索机制通过相应的方式对引擎的索引数据库进行检索,从中获取有价值的网页或站点。

2.3 搜索引擎的分类 目前的中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎和元搜索引擎。

①目录式搜索引擎,是通过半人工、人工的办法采集信息,组建数据库,编辑对某一web站点进行访问以后由编辑人员在访问以后描述这个站点,同时按照站点的性质、内容对该站点归类处理。②机器人搜索引擎是目前运用较广的搜索引擎。这个搜索引擎采用自动采集软件Robot,对网页信息进行检索,同时将其下载并储存在本地文档库中,然后自动分析文档内容,建立索引。根据用户的检索需求,对索引进行检索,分析出相应的文档并反馈给用户。③元搜索引擎主要通过调用其他搜索引擎的引擎来完成信息检索。它在一个统一的用户界面上,以用户需求为目的,在多个搜索引擎中寻找合适的引擎来检索信息资源。

3 网络信息检索的局限

用户都是通过网络信息检索工具在网络信息资源进行查找自己需要的信息,因此,检索工具的优劣会对检索效率产生很大的影响。近些年,网络信息检索工具的确有所发展,但仍然存在着这样或那样的局限。

3.1 文本信息检索的局限 ①搜索引擎的查全率低。网络信息资源库在持续扩充,信息资源的增长的速度要比搜索引擎采集数据的速度快的多,这会大大降低搜索引擎的检全率。②搜索引擎的查准率低。一是当前的搜索引擎中普遍存在反馈信息;二是信息重复反馈。同一信息源有时在检索结果中产生不同的组成部分,不同的信息源也有相同内容信息出现的情况。③网络信息标引准确度不达标。大部分检索工具标引的准确度都无法达到设计要求,检索工具往往在反馈垃圾信息的过程中也会将部分有价值的信息丢掉,某些情况下,垃圾信息会覆盖所有有价值的信息。④查询方式较少。当前的很多搜索引擎,在查询方式上都过于单一,而且都需要用户提供关键词来查询或采用分类查询的方法。这样,只能就某一关键词或概念进行笼统检索,因此使查询结果相关性很差。⑤检索对象的数据结构单一。由于现在大多网站使用傳统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种数据库非常擅长处理结构化的数据,但对非结构化的数据的处理能力很弱。⑥交互性不够。大部分搜索引擎和用户之间无法建立其很好的交互性,在协作方面比较欠缺,对用户信息很陌生,不对用户查询的信息进行记录,无法对用户的反馈信息进行处理,也就无法与用户之间达成良好的交互来提高检索效率。

3.2 多媒体信息检索的局限 虽然眼下已经存在只针对声音、视频和图像等媒体的检索技术,但仍未研究出能检索多媒体信息的搜索引擎,具体体现在以下几点:①检索效果不好。就目前情况而言,大部分多媒体搜索引擎的查准率都无法满足用户的需求,用户不得不从众多图像结果中自己筛选出所需的信息资源。这很费时,而且有时根本检不出想要的东西。究其原因,一是查询方式少,二是在于对图像的标引深度不到位,所以,必须进一步完善图像检索及相关的索引机制。②用户查询接口单一。科学的多媒体检索系统,人处于主动地位,用户的查询接口直观易用,可提供足够的交互能力,用户能可以对检索参数进行适当的调整之后,将图像的语义感知准确的表达出来,并从中取得较好的结果。当前,多媒体搜索引擎用户查询接口呈现单一的发展趋势,很多引擎仅能通过关键词或提问框进行查询。③信息的自动加工与人工标引不够。目前多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,人工干预虽能提高查准率,但可被人工标引的非常有限,同时,因为人工标引需要付出很多劳动而使检索范围受到限制,因此,当前亟待解决的一个问题是快速标引图像信息,并对其进行合理的分类。

当前,基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。

参考文献:

[1]孙建军,成颖.信息检索技术[M].北京:科学出版社,2004.

博客在现代信息检索教学中的应用 篇4

当前人类社会正处在一个知识经济、科技创新的网络时代, 使得知识、信息加速更新和快速传递, 信息检索应作为当代大学生的一项基本功, 才能在浩瀚的信息面前去伪存真、弃粗存精、扬弃垃圾信息获取有用信息。《现代信息检索》是高等学校普遍开设的公选课, 实践性强、学时有限, 传统教学主要以教师讲授为主, 学生被动接受, 虽然学生要求掌握信息检索技术的愿望强烈, 但教学效果不理想。因此在实际教学中我们除了采用传统的教学手段外, 还采用博客这种新颖的教学工具。将博客运用于现代信息检索课程的教学中, 即提高了教师教学效率, 又提高学生的学习热情, 引导学生协作学习、自主学习, 培养学生的团队精神与创新精神。

博客作为一种新的教学手段, 其应用于现代信息检索教学中主要在以下几方面。

一、在教师备课中应用博客

备好课是上好课的关键和先决条件, 教师能否上好课关键在于是否进行了深入细致的备课。为了取得了较好的教学效果, 我们将博客应用于备课活动。教师根据现行教材和教学大纲的要求, 课前设计好需预习的章节、讲授大纲、重点难点以及课后习题及需要复习的内容, 同时将一些相关的视频和参考材料放在博客中, 学生课前可以通过访问博客了解下堂课的教学内容, 做好充分的预习准备, 提高学习的主动性。另外学生还可以将自己搜集到的相关的资源贴在博客上, 这样有利于丰富教案的内容和表现形式, 实现师生共同完成教案, 减少教师一些不必要的重复劳动, 同时提高学生的参与度, 激发学生学习的积极性。

随着计算机和网络技术的发展, 信息检索技术和方法也发生了巨大的变化。教师要备好课, 必须经常了解新的信息检索技术和方法, 而且高校教师背负着教学与科研双重压力, 精力有限, 要使自己的教学水平和科研能力得到提高, 博客这种方式提供了一个很好的平台。教师可以通过博客及时地记录自己在教学实践中的心得体会来不断反思自己的教学方法是否得当。而经验丰富的教师通过阅读这些信息, 给年轻教师给出自己的意见和建议, 即发布回复信息。同时教师们可将自己学习到的信息检索新技术、碰到的科研问题发布在博客上, 供大家共同讨论, 不断提升自己的专业素养和业务水平。

二、在差异教学中应用博客

现代信息检索教学的面向对象是全体大学生, 他们来自不同的专业, 对信息检索课程教学的内容要求也就不同, 例如化学专业的学生希望对《化学文摘》的检索方法介绍深一点, 生物专业的则希望对《生物学文摘》的检索方法多讲一些实例。但是《现代信息检索》作为公选课, 学生人数很多, 师生双向交流机会少, 教师在这种情况下难以实施差异教学。因而在学时、教学条件等各种因素的限制下, 教师往往只能针对常用的检索技术和方法设计教学方案, 很难照顾到每一个学生的专业特点和喜好, 这样就难以满足所有学生的学习要求。

博客的出现弥补了课堂教学的种种不足, 使差异教学变得容易。教师把各专业检索工具和数据库的检索方法、实例写成一篇篇文章放在博客中, 然后让学生上网进入博客, 根据自己的专业和兴趣去点击相应文章进行学习和参考, 从而满足各专业学生的学习要求。同时利用博客的交互功能, 在教师与学生之间建立了一个相互交流的平台。教师不仅可以通过博客向学生传授知识, 还可通过博客了解每个学生的学习情况, 及时了解到学生个体的差异, 以便在课堂上有针对性地对教学进行调整, 体现了因才施教的教学原则。学生通常很难面对面对教师的教学提出自己的看法, 但是通过博客很多学生能大胆的向教师提出意见与建议, 教师在了解学生的反映后, 可以有意识地调整教学方法, 从而提高了教师自己的教学水平。

三、应用博客进行协作学习

《现代信息检索》是一门实践性很强的课程, 学生必须通过严格的实践训练才能真正掌握和深入理解检索技术的基本理论、方法, 特别是对于复杂的检索课题, 则需要多人协作完成。学生之间通过博客的交流可以培养他们的协作学习能力和反思能力, 而这两种能力在信息时代的今天是非常重要的。

通常, 在实践环节教学中, 将2-3个同学分为一组, 每次实验前教师在博客上只给出实验的目的, 要求各个小组自己在博客上讨论, 完成实验情景的设计, 作好实验准备, 并鼓励小组间的竞争与讨论。博客为学生创建一个开放式的、轻松活泼的环境, 让学生成为教学过程中的主人。

例如:在进行《外文数据库的检索》这一节的教学中, 教师提出检索课题, 要求学生在Springer Link、OVID、EBSCOhost三个外文数据库把相关资料检索出来。在实验前每个实验小组通过博客相互交流, 鼓励学生发表自己的检索途径, 设计本小组的方案, 这种方式充分激发了同学们的学习热情。对于同一个问题, 不同的学生由于其个体的差异会从不同的视角来思考, 这样不仅使学生对检索方法掌握的更加透彻、全面, 而且还可能产生富有创造性的见解。实验结束后, 同学们在博客上可比较各个小组实验方案的优劣, 交流实验的收获及经验, 并可将自己的学习笔记与心得发布在网上。博客给了同学之间相互交流的机会, 从而实现协作式学习, 达到共同进步的目的, 提高学生的分析资料、整理资料的能力, 培养了学生团结协作的团队精神。

四、应用博客丰富教学形式

呆板单一的教学形式已经跟不上现代教育的要求, 丰富多彩的教学形式是提高教育效果的有力措施。利用博客可以丰富课堂教学的活动形式, 有利于转变教学过程, 提高教学效果。教师可以在正常的教学活动中适时地以博客为媒体, 采用个别学习、在线交流、小组讨论等多种学习形式。教学活动的组织形式, 就由传统的课堂教学转变为面向解决问题的探究活动和面向知识运用的实践活动, 适应现代教育改革的需求。博客信息丰富, 学生自己能够获取知识, 教学活动转变为人机互动、生生、师生互动, 使学生有了表现自我的时间与空间, 激发了学生学习的兴趣与欲望, 使学生积极投入到知识求解和问题探究中, 多种不同观点的碰撞与交流, 迸发出学生思维中崭新的思想火花。当然在教学中, 对教师教学资源的准备也提出了更高的要求。

五、在课外答疑中应用博客

学生在日常的学习和生活中, 特别是在写论文的时候需要查找很多资料, 常常会碰到很多与信息检索相关的问题。在课外由于各种客观和主观原因, 师生之间的沟通渠道不一定畅通, 往往很难及时地提出和及时地解答。应用博客可较好地解决这个问题。学生将自己遇到的问题发到教师博客中, 教师则根据问题在博客中给予回答。博客使学生和教师之间的答疑不在受时空的约束, 无论是课堂中还是课余, 只要利用身边已上网的计算机, 学生通过博客可以随时向教师、同学请教, 查看自己感兴趣的问题, 发表自己的见解。作为新的教学工具, 博客还具有区别于QQ, E-mail等其他方式的独到优势。如果学生通过QQ, E-mail向教师提出问题, 那么仅能得到教师的回答, 而且别的学生并不会知道。但是如果问题发在博客上, 等于是公开发表, 每个同学都可以来参与讨论, 那么也许很快同学们就能找到答案, 教师在博客上解答问题后, 每个同学都能对这个问题有所认识。教师还可以把学生提出的问题集中起来放在博客上, 供所有学生查看, 避免了重复回答相同的问题, 节约了时间和精力。

六、应用博客作为课堂教学的辅助管理

教师通过博客发布与教学有关的通知、教学的纲要、学习方法指导, 布置学生作业。学生定期浏览教师的博客, 就可以从中及时了解相关课程的学习进度、实践活动情况。在博客中, 可构建学生的电子档案袋, 记录学生所完成的学习任务的全过程, 其中包括学生自身的创造内容、文档、图片、声音和视频文件等。电子档案袋能够反映出学生的整个学习过程和各个学习阶段的发展过程, 从而作为学生学习评价的参考依据。

总之, 把博客引入到现代信息检索的教学中, 使教学的中心由教师转向了学生, 激发学生获取知识的兴趣, 增进学生的求知欲, 促使学生的动力从外部转向内部, 变被动学习为主动学习, 真正做到根据学生个体差异因材施教, 有利于培养学生探索问题、分析问题和解决问题的能力。博客以其特有的技术特色和功能充分迎合了网络时代学与教的需求, 为教学提供了新的方式与途径, 具有极为广阔的教育教学应用前景。

摘要:近几年来, 博客作为一种新的网络应用模式已经逐步地被引入教育教学领域, 本文结合教学实践, 介绍如何利用博客进行现代信息检索教学。

关键词:信息检索,博客,教学,应用

参考文献

[1]王良辉.博客文化及其教育应用[J].远程教育杂志, 2004, 1

[2]樊爱国, 薛德钧.现代信息检索[M].北京:北京大学出版社, 2006

现代信息检索 篇5

欧洲专利局的esp@cenet 数据库中的法律状态信息,来自于EPIDOS/INPADOC的同族专利和法律状态数据库。该数据库将出现在各国公报上有关法律状态部分的所有信息集中在一起,提供专利申请有效期内所有法律状态信息,以及该专利族其他成员的相关信息。

目前,它包括近五千多万条有关法律状态的事项,每周增加约四万条。对于一件发明的整个有效期的各个重要阶段的事件和通告等都给予描述,包括发明从

专利运营与融资孵化请进入:http://、CL、CH、CA、BR、BG、BE、AU、AT 等全世界 45个国家、地区或国际性组织的专利信息,它不仅能检索法律状态等有效性信息,而且能检索同族专利。

实际上,esp@cenet 数据库中的同族专利信息也来自于EPIDOS/INPADOC 数据库。后者是提供世界范围内检索同族专利信息的最综合性资源之一。它收录了包括1968年以来的69个国家和组织约三千多万条专利文献的著录数据,占1973 年以来全世界公布专利的95%。

随着世界科技水平日新月异的变化,数据库的内容每周都在稳定的增长和更新,目前其每周增加约两万五千条。该数据库对同族专利的处理注重数据的原始化和完整性。它能如实地按照最早优先权报导专利申请,即使专利申请的最早优先权属于那些并未与EPIDOS/INPADOC签订合作协议的国家也给予报道。其报道的优先权国家(地区)和国际

专利运营与融资孵化请进入:http://

_______________________________________________________________________________ 组织可达八九十个之多(包括专利族涉及的国家),报道范围之广,是其他任何一种检索系统不能相比的。

(2)地域性检索方法。

使用欧洲专利局的esp@cenet 数据库检索专利地域性或同族专利时,可以有两种方法。

专利运营与融资孵化请进入:http://

网络信息资源检索工具和技巧 篇6

关键词:信息资源;技巧;检索工具

一、网络信息资源的类型

(1)按人类信息的方式划分为:非正式出版信息(如电子邮件、电子会议)、半正式出版信息(如各学术团体、机构等单位宣传自己的信息)、正式出版信息(如网络数据库、电子图书、电子版报纸、专利)。(2)按信息来源划分为:政府信息、FTP信息资源、用户服务组信息组资源、公众信息资源、商用信息资源。(3)按信息存储的方式划分为:电子邮件型资源、图书馆目录资源、书目与索引资源、全文资料及电子了出版物资源、数据库信息资源。(4)按网络传输协议划分为:WWW,万维网;Telnet,远程登录;TFP,文件传输;用户服务组信息资源;WAIS,数据库索引查询服务。

二、网络检索工具

(1)搜索引擎:网络上提供信息检索服务的工具系统。工作原理为三步:第一步从互联网上抓取网页;然后建立索引数据库;最后在索引数据库中搜索排序。(2)搜索引擎类型:①全文搜索引擎:通过从互联网上提取的各个网站信息而建立的数据库中检索与用户查询条件匹配的记录,按一定的排列顺序结果返回给用户,如Google、百度等。②目录索引类搜索引擎:按目录分类的网站链接列表。③元搜索引擎:一种调用其他独立搜索引擎的引擎,它是对多个独立搜索引擎的融合、调用、控制和优化利用。(3)搜索引擎的检索功能主要包括:单词检索,大小写敏感检索,概念检索,词组/短语检索,布尔逻辑检索与

AND,或OR,非NOT,词间位置限定检索,嵌套检索,截词检索和通配配符检索,多语种检索和检索结果的翻译等。

三、中、英文搜索引擎

(1)垂直搜索引擎:即专业或专用搜索引擎,它专门用来检索某一范围或某一类型信息,追求专业性与服务深度是它的特点。①工作搜索引擎:中华英才网、前程无忧、医药英才网等。②论坛搜索引擎:百度贴吧、大旗网等。(2)图书搜索引擎:Google图书搜索引擎 (books.google.com);百度图书搜索引擎(book.

baidu.com);中搜联盟图书搜索(book.httpcn.com/search)等。(3)法律搜索引擎:我的法律搜索引擎(www.mylaw.com);百度法律搜索(law.baidu.com);中国法律搜索(www.engfish.cn/law)等。(4)软件搜索引擎:华军软件搜索(search.onlinedown.net);天空软件站搜索(www.skycn.com);太平洋软件站(www.pc5566.com);驱动之家(so.mydrivers.com)等。(5)视频搜索:百度视频搜索(video.baidu.com);搜狗视频搜索(v.sogou.com)等。(6)游戏搜索引擎:百度游戏搜索(game.baidu.com);52PK游戏网(www.

52pk.com)等。(7)购物搜索引擎:京东、淘宝、唯品会等。(8)英文搜索引擎:微软Live Search(www.bing.com);Alta Vista(www.al

tavista.com)。

四、P2P搜索

P2P—Peer to Peer,对等网络,网上各台计算机有相同的功能,无主从之分,一台计算机都是既可作为服务器,设定共享资源供网络中其他计算机所使用,又可以作为工作站,没有专用的服务器,也没有专用的工作站。在P2P网络环境中,成千上万台彼此连接的计算机都处于对等的地位,整个网络一般来说不依赖专用的集中服务器。网络中的每一台计算机既能充当网络服务的请求者,又对其它计算机的请求作出响应,提供资源和服务。其特点是:下载的人越多,下载就越快。

五、网络免费学术资源的获取

网络学术资源导航:包括以下几类,一是各种学科专题的免费电子书刊信息和工具导航;二是专家学者信息;三是组织机构信息;四是学术动态与交流信息;五是相差重要链接与搜索工具导航;六是政策与法规、标准、专利等;七是科研成果与产品与市场。

六、信息服务机构的资源

信息服务机构主要包括高校图书馆、科学院文献情报中心、公共图书馆系统、专业学会与协会网站、专业信息资源与服务商等。目前国内主要有三大数据库:清华同方中国知网(www.cnki.net)、重庆维普数据(www.cqvip.com)、万方数字资源系统(www.wanfangdata.com.cn)

七、开放获取资源

(1)OA仓储(Open Access开放索取):中国科学院理论物理研究所镜像站点(cn.arxiv.org);中国预印本服务系统(prep.is

tic.ac.cn);香港科技大学科研成果全文仓储(repository.ust

.hk/dspace);中国科技论文在线(www.paper.edu.cn)。(2)OA期刊:OA期刊是指以电子文献形式通过网络出版的期刊。与传统期刊的区别在于访问方式和访问权限的差异,用户可以通过网络不受限制地访问期刊全文。(3)RSS学术资源与服务:RSS(简易信息聚合)是一种消息来源格式规范,用以聚合经常发布更新数据的网站,例如博客文章、新闻、音频或视频的网摘。(4)网上精品课程库:麻省理工开放课件(www.core.org.cn/Ocw Web);慕课(moocs.org.cn)等。

参考文献:

现代信息检索 篇7

关键词:信息检索,信息技术,课题研究

引言

通过计算机及网络检索获取科技文献信息资源已是当今科研的重要手段。Internet从20世纪70年代产生到现在,已连通全世界150多个国家和地区。截止2008年底,我国已有3500万Internet用户。网上信息涉及商业、通信、教育、科研、图书、工业、艺术等方面。科研人员可以通过Internet方便地检索世界各大学、公共图书馆、研究机构中所关心和需要的科研资料和信息。还可通过Internet进行学术交流,或查阅某人的科研成果。并可在网上与国外的专家进行各种专题讨论。由此可见,使用Internet对网络资源进行检索利用对帮助科研工作者开阔研究视野,提高工作效率,缩短研究周期具有十分重要的作用。

1、计算机检索的发展历程

计算机检索的发展大致经过5个阶段:(1)脱机信息检索。从1954年至60年代中期,脱机信息检索逐步成熟。(2)联机信息检索。从20世纪60年代中期到70年代初,联机检索技术发展成熟。1965年美国洛克希德(Lockheed)研制出DIALOG联机检索软件,向全美提供联机信息检索服务。(3)国际联机信息检索。从20世纪70年代至今,借助国际通讯网络,实现了跨国联机检索,为快速获取全球性科技资料和经济信息提供了便利条件,极大提高了信息的可获得性和利用价值。80年代计算机技术向网络化发展,联机检索进入“黄金时代”。(4)光盘信息检索。20世纪80年代中期,光盘因其存储量大,价格低廉、使用方便,在信息检索领域得到普及和重视。(5)网络信息检索。20世纪90年代以来,Internet已成为世界最大的信息资源库,得到了全球社会各界的广泛关注。随着网上信息量的激增,各种网上检索工具应运而生,计算机检索进入了搜索引擎时代。可以使用户非常方便地操作计算机,获取自己所需信息。

2、计算机信息检索的特点

2.1 计算机检索的优点

在当今信息社会中,计算机检索作为利用全球信息资源的一种先进手段,其管理和决策服务的功能已被越来越多的人们认识利用。与手工检索相比,它具有以下优点:(1)查找迅速,反馈及时,资源共享。(2)检索全面,主题广泛,实时性强。(3)使用方便,功能完善,组配灵活。

2.2 计算机检索的缺点

与其它检索方式相比,计算机信息检索也有不足,主要表现在:(1)数据回溯时间短,一般只提供近、现代文献。(2)系统可靠性有待提高,各种设备如出现故障将造成检索失败,带来时间和经济上的损失。(3)检索费用高,要求检索人员有较宽的知识面、较高的外语水平及对不同检索系统的了解。(4)检索的适应性较差,当用户有明确的信息需求时,利用计算机检索能获得较高的检索质量和效果,但在需求不明朗时,检索效果常常不理想,尤其在互联网上检索时,有时受网络速度和其他原因的影响,检索质量不高。

3、计算机信息检索的途径

计算机信息检索根据其检索方式可分为:联机信息检索、光盘信息检索、网络信息检索。

3.1 联机信息检索

联机信息检索通常称联机检索,是指用户利用终端设备,将信息需求按一定的查询语言和检索命令通过全球通讯网络送到联机检索系统的方式,系统将用户的提问与数据库中存贮的数据进行匹配运算,并把检索结果通过网络反馈给终端用户。联机检索系统通常由中央主机、数据库和通讯网络构成。

3.1.1 国际联机检索

国际联机检索的服务系统和机构在全世界有200多个。世界上最大、最有实力的国际联机检索服务系统为“DIALOG”系统,它始建于1963~1964年间,原为美国洛克希德(Lockheed)导弹和空间公司所属的情报科学实验室,1972年作为国际联机情报检索系统正式对外服务。目前DIALOG系统拥有900多个数据库,其数据库范围涉及自然科学、工程科学、社会科学、商业新闻和工业分析、公司信息和金融数据、报纸新闻等几乎所有领域的信息。文献收藏量达15亿多篇,占世界机存文献总量的60%以上,用户遍及120多个国家和地区的2万多个机构,向全世界提供最全面和权威的信息资源。DIALOG的数据库中,有许多极具代表性和常用的数据库,著名的数据库如CA(化学文摘)、INSPEC(英国科学文摘)、MEDLINE(医学文献数据库)、MATHSCI(数学文献数据库)、BA(生物学文摘)、NTIS(美国政府报告)等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)、SSCI(社会科学引文索引)、AHCI(艺术与人文科学引文索引)等也都可从DIALOG系统中检索;再有世界著名的DERWENT专利数据库以及美国专利、欧洲专利、日本专利等数据库也都可在D I A L O G中查询。DIALOG更有一些全文数据库,如IAC的计算机全文库、《纽约时报》和《华盛顿邮报》的全文库等。

3.1.2 国内联机检索

我国的国内联机检索服务开始于1983年,由中国科技情报所建立的中国第一个国际联机检索终端对社会开放。目前,我国的国内联机检索服务仍以科技信息系统为主。主要有中国科技信息研究所ISTIC—EISS系统、北京文献服务处BDS系统、中国国防科技信息中心、机械信息工程研究院检索系统和中国化工信息中心CHOIC联机检索系统。

3.2 光盘信息检索

光盘以其存储量大、价格低廉、适应型强等优点,成为重要的信息载体。它是一种集激光技术、计算机技术以及通信技术于一体的高技术结晶。它不仅能存储文字、图像等文献信息,还能存储声像娱乐节目、电视、电影、录像等视听信息。与联机检索相比,光盘检索具有价格低廉、容易掌握等特点。联机检索通常采用指令检索,一般用户难以了解复杂的检索指令,而光盘检索通常采用菜单检索,只要逐级展开菜单,做出相应的选择即可实施检索。而且,用户可以直接上机操作,不受联机时间限制。20世纪90年代以来,国内开发的各种中文光盘数据库在信息服务领域发挥了极大作用。在国内影响较大的光盘数据库有《中文科技期刊数据库》、《中国学术期刊(光盘版)》等,国外有美国的《工程索引》、英国的《科学文摘》等。

3.3 网络信息检索

近年来,由于Internet的高速发展和广泛应用,使世界范围内的信息资源交流、共享成为可能。它为人们提供了巨大的并且不断增长的信息资源。人们可以利用Internet提供的各种工具去获取所需信息资源。网络信息检索方法有以下几种:(1)浏览,即在日常的网络阅读、漫游过程中,意外发现有用信息。但这种检索目的性不强。(2)顺“链接”而行,利用超文档链接从一个网页转向另一相关网页,不断扩大检索范围,这种方式有可能在短时间内获得大量相关信息,但也可能偏离检索目标。个人用户在网络浏览过程中可通过创建书签将常用的站点地址记录下来,组织成目录以备今后所需。(3)网络资源指南,专业人员对网络信息资源进行采集、整理、过滤,开发出可供浏览检索的网络资源主题指南,尤其是各专业学科的网络资源指南都可在网上找到。

网络信息检索有如下特点:(1)信息检索空间宽泛。检索范围覆盖了Internet上的所有资源,这是其它信息检索方式所不具备的。(2)交换式作业方式。所有网络信息检索工具都具有交互式作业的特点,能够从用户命令中获取指令,按用户的要求执行相应操作,具有良好的信息反馈功能,用户可以在检索过程中及时调整检索策略以获得更好的检索结果。(3)用户界面友好且操作方便,网络检索采用交互式作业,系统通用的界面和符合大多数用户检索习惯的用户接口都使检索变得简单易行,网络用户不需要太多培训就能上手操作,使用自己熟悉的方式输入查询提问,实现对各种系统数据库的访问、检索。而联机检索则需要学习和记忆一系列检索指令和规则,一般用户只能在专业人员的帮助下使用。

4、信息检索技术在课题中的应用研究

科研课题中的信息检索通常包括以下步骤:分析课题→选择检索系统及数据库→选定检索词→制定检索式→上机检索(同时调整检索策略)→输出检索结果。

(1)分析课题

科研人员应从以下几方面分析课题的要求:课题的主题;课题所涉及的学科范围;课题所需信息的内容及特征;课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等;课题对查新、查全和查准的指标要求。

(2)选择检索系统及数据库

从课题内容的广度与深度、课题专业覆盖面、用户要求的信息类型与时间范围、课题检索经费支持等方面综合考虑,选择检索系统及数据库。

(3)选定检索词

在全面了解待检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,选择检索词,并根据选定的检索系统、数据库的要求,进一步优化检索词。检索词的选择,一般有以下几种方法:优先选用主题词;选用检索系统规定的代码;选用常用的专业术语;选用同义词与相关词。

(4)制定检索式

采用检索技术常用的运算方法制定检索式,用逻辑“与”连接不同概念检索词,用逻辑“或”连接同一概念检索词,用位置算符限制词组或词间相对位置关系,用截词来检索具有相关词干的词。

检索式的制定是否合理,将直接影响到检索结果的成败。在制定检索式时,需要注意以下几点:使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高;使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高;使用逻辑“非”算符可以缩小命中范围,得到更切题的检索结果,也可提高查准率,但使用时要慎重,以免把一些相关信息漏掉。

(5)上机检索

制定完检索式就可以上机检索。检索时,应及时分析检索结果是否与预期目标一致,根据检索结果对检索式做出相应的修改与调整,直到得到比较满意的结果。当检索结果信息太多时,就需要考虑适当紧缩检索式,通过选用概念较专指的检索词(下位词)或进行限定性检索等方法,来减少检出的信息量;反之,信息量太少,则要考虑采用相反的措施。

(6)输出检索结果

根据检索系统提供的检索结果输出格式,选择需要的检索记录以及相应的字段,将结果显示在屏幕上、存储到存储介质上或直接打印输出,至此,完成了整个检索过程。

5、结语

随着对现代信息检索技术的深入研究和在课题研究中的应用,必将不断提高课题研究的质量,从而极大提高科研工作的效率。

参考文献

[1]于光.科技信息资源与网络检索[M].哈尔滨:哈尔滨工业大学出版社.2001.

[2]龚蛟腾.网络信息检索技术现状、瓶颈及趋势分析[J].情报杂志.2004,05.

[3]陈晓金.信息检索技术研究与实践[J].情报资料工作.2008,03.

现代信息检索 篇8

人的一生都在不断地学习, 然而善于学习比起纯粹地学习更为重要, 善于学习不仅是一种能力, 而且是未来时代的必备要求之一。尤其是在信息时代, 善于学习才能更好地迎接新的挑战, 适应社会的发展与变化。如今, 信息技术日新月异, 生活与互联网紧密联系, 人们可以在网络上搜索大量的信息, 于是“搜商”这一词渐渐出现在人们的视线中并获得了更高的关注度。搜商不仅能帮助人们解决生活中遇到的问题, 还能影响人们的生活水平和生活质量。

1 初步了解信息检索与利用

搜商的含义, 即有效率地搜寻资源、解决问题的素养和能力。搜商的核心是搜索的意识和能力。在《信息检索与利用》的第一节课中, 初次接触到搜商, 了解信息检索与利用这门课程的主要内容和作用, 发现学会了这门课程对我的专业有很大的帮助, 能够解决专业上和学习上的问题。同时我也对搜商产生了浓厚的兴趣, 在接下来的一次次课程中, 揭开了搜商的神秘面纱。在课后实践过程中, 学会利用课堂上学到的知识来解决学习上的困难, 尝试搜商的各种功能得到不同的搜索结果, 更深层次地学习搜商, 提高了搜商能力。

2 信息检索与利用的学习过程

第二节课中, 学习了图书馆信息资源的使用, 原来图书查询不用到图书馆一本本翻阅才能找到想要的那一本书, 为了节省时间和提高效率, 登录学院图书馆主页, 在搜索框中输入相关书籍的书名、作者、索取号来获取书籍的相关信息, 记下索书号和馆藏地点, 就能快速到图书馆找到这本书。在图书馆主页中进入数据库导航, 有中文数据库和外文数据库, 中文数据库有中国知网、读秀知识库、超星数字图书、书生数字图书、方正Apabi电子图书等。中国知网主要是论文和期刊资源, 其他的可以浏览电子图书, 这样就不需要购买书籍或是到图书馆借阅, 直接在网络上打开相关网址, 下载相关阅读器, 就可以阅读想要看的电子书籍。这样, 阅读就不会受到地点、时间、空间的限制, 打开了人们阅读的另一扇“窗户”。

中文数据库里还有超星名师讲堂、新东方多媒体学习库、超星发现等。超星名师讲堂主要是讲师视频, 与浏览电子书相比较, 看视频学习更能让人浅显易懂, 而不显得枯燥无味。新东方多媒体学习库主要是学习英语, 比如英语四级考试, 我就可以到新东方数据库找到学习英语的相关资源, 英语四级的真题及解析答案或是英语高分的攻略技巧。超星发现是检测论文重复率, 有时老师布置论文需要检查论文重复率, 那么就可以到超星发现检测。中文数据库还有其他的功能等待我慢慢挖掘, 除了老师讲解的内容, 还有其他的用途等着我实践与应用, 这也是搜商能快速提高的一种方法。

第三节课中, 老师介绍了中国图书馆分类法, 简称《中图法》, 分为五个基本部类, 22个基本大类, 所有图书是按《中图法》给出的分类号排列。我学会了如何看图书的索取号和图书馆的排架原则, 这样在知道图书的索取号后, 很快就能到图书馆找到这本书, 而不是毫无方向的四处打转, 浪费了大量时间还找不到自己需要的书籍。第四节课的主要内容是中国知网的使用方法和搜索技巧, 先学习了如何进入和登陆中国知网, 其次是搜索方法, 快速而有效地找到自己需要的资源, 比如跟踪名人学者, 找到他们发表的论文以及几种导出论文的方式。最后, 我了解了投搞论文的方法和建设个人数字图书馆, 并尝试建设自己的数字图书馆, 将理论和实践相结合, 对搜商的应用有了进一步的了解。

第五节课是关于期刊论文的撰写, 老师讲了论文的基本构成与要求和参考文献的书写格式以及大雅论文相似度检测。之前我不了解怎样才能写出一篇好的论文, 学了这门课程后, 我知道了论文的构成要素和搜索相关的论文资源, 参考别人的论文成果, 然后自己就可以写出一篇论文了。老师又介绍了中国期刊网, 主要有龙源期刊网、万方数据库和维普数据库。如果想看期刊杂志, 就可以不用到图书馆借阅或将期刊买回来翻阅, 只要自己到这三个数据库, 查询想看的期刊花费少量的资金就可以看到自己喜欢的杂志。还可以在数据库上检测论文相似度, 以前只知道在淘宝上检测论文, 现在学会了多种检测论文的方法。

第六节课主要是电子图书的检索与利用, 可以在网络上阅览电子图书, 一种是在图书网站上检索书籍, 另一种是在图书数据库上检索学术方面的书籍。我学习了如何在超星数字图书高级检索电子图书, 从中进入读秀知识库浏览电子图书, 有效率地搜寻和利用电子资源。另一节课学习了其他数字图书馆的高级检索与中国国家图书馆的图书检索和公开课, 接下来老师讲了百度高级检索技巧, 每一个技巧对我搜索信息有很大的帮助并且节省了一定的时间, 让我有更多的空余时间做自己喜欢的事情。

3 信息检索与利用的心得体会

之前我一直认为在学习知识方面需要读很多的书, 大脑要记住很多的知识, 然而互联网发展, 信息在不断地更新, 我发现需要学习的知识太多, 需要了解的范围太广泛。现在, 我学习了《信息检索与利用》这门课程, 发现自己能够运用一些搜索技巧以及找到解决问题的有效方法。通过课上学到的知识, 运用到生活中, 在图书馆借了一本书名为《我的搜主意比你多》, 作者黄泰山将他搜索的经验与读者分享, 所以我对搜商有了进一步的认识, 发现传统的独立思考效果也会受到限制, 独立思考只有个人的力量, 需要花费大量的时间才能解决问题。有时候没有那么多的时间, 难道就不能解决了吗?我为什么要花比别人多一倍的时间才能完成任务呢?

搜商除了可以帮助我解决问题以外, 还可以提高我的智商、情商和成功的概率。在我的专业领域, 多少接触过一些相关信息, 但我更加需要找到这个领域内最有价值的信息, 而不仅仅是相关信息。在第七节课中, 学会用不同的搜索引擎有效地得到信息资源。而我明白了搜索不仅仅是一件供人利用的工具, 还是检索到有效方法解决问题的路径。掌握了搜索技巧, 我在完成专业作业时, 设置准确的关键词, 利用相应的搜索引擎, 获得自己想要的信息, 快速地完成了作业。不仅在专业领域的学习, 想要提升其他能力, 搜商可以助你一臂之力, 搜索资料认识能力, 学习和研究经典案例, 找到提升能力的方法, 对该领域的最新研究成果、动态发展的了解, 也可以依托搜商获取最新的信息和资源。

4 总结

总的来说, 学习这门课程, 就像拿到一把开启知识库大门的钥匙。无论你欠缺哪方面的知识、技能, 都可以上网寻求帮助, 获得学习资源。在这个有互联网的时代, 每一天都在变化, 信息也在更新换代, 而我们也需要变化, 积累更多的知识, 适应未来的变化发展。搜商的学习不会止步于此, 每天学习一点, 未来收获更多。

参考文献

现代信息检索 篇9

1、书目信息

主要通过各种书目型数据库获取, 书目型数据库可用于查明关于某一专题有哪些出版物以及如何获取等信息。书目型数据库主要有联合目录、在版图书书目和网上书店目录以及各类型图书馆公共检索目录。

1.1 联合目录

书目信息检索工具国外主要有联机计算机图书馆中心 (简称OCLC, ) , OCLC联机联合目录数据库Worldcat, 它是世界上最大的书目数据库, 可检索字段有:主题、著者、引文、分类号、语种、出版局、出版地等。国内比较著名的书目检索机构还有CALIS联合目录数据库 (http://162.102.138.230/opac) 和上海图书馆的西文文献联合目录数据库检索系统 (http://www.linet.sh.en/ejex/ex/wx.htm) 等

1.2 在版图书书目

国际上比较流行的在版书目有《在版书目》简称 (BIP) 、《全球在版图书书目》简称 (GBIP) 、《国际在版图书书目》简称 (IBIP) 和英国在版图书书目 (British Books in Print, 简称 (BBIP) 。

1.3 网上书店目录

网上书店最著名的是亚马逊网上书店, 其检索途径可以通过该网页相应窗口获取, 检索字段有著者、书名、出版社、关键词、语种、ISSN号等。国内有当当网上书店、中华读书网等, 其检索方法是按书名、作者、出版社、分类号、语种等不同的检索途径来进行检索。

1.4 各类型图书馆公共检索目录

各类型图书馆联机公共检索目录 (简称OPAC) , 用户检索某个图书馆的OPAC, 只需直接登陆到相应的图书馆网站, 进入“联机公共书目查询”或“馆藏书目数据库检索”等栏目即可实现某一专题的检索。例如:查询清华大学图书馆公共检索目录, 就可以登陆其 (http://www.lib.tsinghua.edu.cn/index.html) 。

2、期刊信息

期刊信息的检索工具有 (以中国为例) :

(1) 、清华同方CNKI的《中国期刊全文数据库 (CJFD) 》 (http://www.cnki.net) , 收录7400多种期刊, 2400多万篇, 浏览器是CAJ, AdrobReader。

(2) 、重庆维普资讯有限公司《中文科技期刊数据库》 (http://www.cqvip.com) , 浏览器是VIP, AdrobReader。

(3) 、北京万方数据公司的《数字化期刊全文数据库》 (http://www.wanfangdata.com.cn) , 浏览器是AdrobReader

(4) 、人大复印资料 (http://www.zlzx.org/) 收录人文社科类期刊论文, 分大类。

(5) 、中国知识资源总库-CNKI系列数据库 (http://caj.jllib.cn/kns50/) 浏览器:CAJ, PDF

3、学位、会议论文信息

这一类检索主要分为5大类:一、PQDD (美国博硕士论文数据库) :是世界著名的学位论文数据库, 收录有欧美1000余所大学涉及文、理、工、农、医等领域的博、硕士学位论文, 浏览器是Adobe Acrobat Reader;二、万方数据库资源系统 (http://hk.wanfangdata.com/) , 《中国学位论文全文数据库》和《中国学术会议论文全文数据库》是万方数据库资源系统的一个分支;三、中国知网 (CNKI) (http://www.cnki.net/index.htm) ;四、中国高等教育文献保障系统 (http://opac.calis.edu.cn/simpleSearch.do) ;五、中国重要会议论文全文数据库: (CPCD) China Proceedings of Conference Fulltext Database, 收录我国2000年以来国家二级以上学会、协会、高等院校等单位的论文集。

4、网页与新闻信息

主要是通过使用搜索引擎查找与该专题有关的信息和要闻。

搜索引擎 (search engine) 是运用特定的计算机程序收集互联网上的信息, 在对信息进行组织和处理后, 为用户提供检索服务的系统。搜索引擎大都提供分类查询, 用户输入关键词进行检索, 搜索引擎从索引数据库中找到匹配该关键词的网页并将检索结果显示与排列。

国外著名英文搜索引擎包括:1、Google http://www.google.com;2、Yahoo http://www.yahoo.com;3、Live http://www.live.com;4、SearchMash http://www.searchmash.com/。

国内著名搜索引擎网址有:1、百度http://www.baidu.com/;2、雅虎http://search.cn.yahoo.com/;3、Google http://www.google.cn/;4、搜狐搜索引擎http://www.sogou.com;5、新浪网http://www.iask.com/

参考文献

[1]赵惠芳:《学位论文信息的检索与获取》[J].现代情报, 2003, (09)

现代信息检索 篇10

互联网的快速发展和广泛应用, 为人们提供了一个广阔的信息空间, 也为信息检索提供了一个广阔的发展平台。互联网的开放性和自由性使得网络信息资源呈现出数量巨大、异构性、分散性和动态性特征。但由于网络信息时效性强以及互联网缺乏必要的监督和质量控制, 使得大量垃圾信息混于高质量信息当中, 增加了有效信息获取的难度, 影响检索效率。因此, 使用有效的检索工具才能使得网络信息资源为人们所充分利用。

1 网络信息资源点与检索工具

上世纪90年代中期出现的搜索引擎技术目前已经成为检索各类网络信息资源最主要的检索工具。搜索引擎一般工作流程是借助于网络自动搜索软件 (Robot、Spider等) 访问浏览网页并抓取文件, 并通过已浏览的网页中的链接访问更多网页。在抓取网页的同时对页面文件进行分析分解以及索引, 建立索引数据库。当用户在搜索引擎界面输入搜索词后, 搜索引擎对搜索词进行处理, 按照处理后的搜索词在索引数据库中找出所有包含相关内容的网页, 并更具排名算法计算出排名顺序然后按照一定的格式返回到搜索页面。普通的搜索引擎缺点在于返回的检索结果数量巨大, 无关和冗余信息较多, 用户必须从中进行筛选。虽然布尔运算、截词运算、自然语言检索等技术使用大大提高了准确率, 但对用户检索素养要求很高。针对以上问题, 学者把研究对象放到对词意的挖掘上, 探索实现基于概念匹配的检索技术和方法, 基于本体的语义检索成为研究重点。

2 语义检索基本要素和原理

随着人工智能以及自然语言处理的发展, 尤其是语义网技术的兴起, 自上个世纪以来语义检索研究得到了迅猛的发展。虽然对于语义检索在概念上到目前为止没有统一的界定, 但是不同的研究都有一个共同之处就是基于对信息资源的语义处理时限效率更高的检索[1]。本体是语义检索的基础, 其主要任务是对信息资源进行语义表达。

本体 (Ontology) 原本是一个描述客观事物本质的哲学概念, 是对客观存在的一个系统的解释和说明。如今, 本体是一种能在语义和知识层次上描述概念体系的有效工具, 用来描述概念以及概念之间的关系, 通过概念之间的管理来描述概念的语义。本体作为一种最先进的知识表示方式能够充分的描述所以的数据结构, 是推理和关系数据库的结合[2]。概括的讲本体能够在人们和应用系统之间达成对术语含义的共享和共同理解, 通过函数 (functions) 、关系 (relations) 、原则 (axioms) 和实例 (instances) 、类 (classes) 这5种元素表达本体中的知识, 使其具有逻辑推理和语义识别功能, 帮助检索系统跨越目前基于关键词的检索过程中的上述问题以实现语义检索[3]。目前实现网络检索的技术主要有两种:第一种, 依赖于编码处理, 以分类模式来描述信息资源以实现检索的目的;第二种, 是通过全文检索查找文本中包含用户指定的词语的信息源。语义检索的语义信息的提取和处理是基于语义网方法与技术的查询处理与文档标注及索引。基于本体的查询处理包括:查询消歧和查询扩展, 通过消岐, 明确查询的确切所指, 准确反映用户的信息意图, 继而通过加入与其语义相关的其他概念来实施扩展。在对文档进行语义标注与索引的基础上, 先进行实例检索, 再据此返回所有以检出实例标注的文档信息是语义标注文档检索的一种普遍思路。相对于传统的网络检索, 基于本体的语义检索的优势在于体现语义信息, 准确表达用户的查询意图。

3 常见语义检索系统介绍

3.1 一体化医学语言系统 (UMLS) UMLS (Unified Medical Language System)

作为计算机化的情报检索语言集成系统, 是美国国立医学图书馆 (NLM) 主持的一项长期开发研究计划。它不仅是自然语言处理、语言规范化以及语言翻译的规范化工具, 更是实现实现跨数据库检测的词汇转换系统并且还可以帮助用户连接情报源, 包括书目数据库、事实数据库、计算机化的病案记录以及专家系统过程中对于其他的电子式生物医学情报的一体化检索。UMLS包括情报源图谱 (Information Sources Map) 、语义网络 (Semantic Network) 、专家词典 (SPECIALIST Lexicon) ) 和超级叙词表 (Metathesaurus) 四部分。其中超级叙词表是术语、生物医学概念、等级范畴、词汇及其涵义的广泛集成。1997年第8版的超级叙词表收录了739439个词汇, 这些词汇来源于30多种生物医学词表和分类表的能表达33万多个概念的, 词汇量达到空前规模。而语义网络是为超级叙词表中的所有概念提供语义类型及相互关系结构的工具, 是为建立概念术语间相互错综复杂关系而设计的。UMLS的语义网络不仅运用了常规的语义控制手段, 如属分、相关关系控制、语义等级, 同时在语义规范和语义关系分析、延伸等多方面有许多创新。

3.2 语义网 (Semantic Web)

为了能够在网络环境下也同样实现语义检索的功能进而开发研究了语义网的W3C项目。W3C项目是将网络上的数据通过一种方式进行连续和定义, 通过这种定义和连续可以根据人的不同需求实现计算机将数据自动进行整合以及再利用, 从而达到更有利于人机协作的目的。资源描述框架 (Re-source Description Framework, 简称RDF) 是语义网的核心构件。在网络中, 一般用元数据对资源进行描述, 而RDF则是处理元数据的一个基础。RDF认为一个具体的元数据是由属性值 (Statements) 、属性 (Properties) 和资源 (Resources) 构成的三元关系模式[4], 实际上是关于一个特定的资源特定属性的取值声明。使用RDFS语言, 元数据的设计者不仅可以定义所描述资源的类别、属性以及词汇, 还可以定义这些属性或者对象的关系以及对象与属性之间的相互关系, 同时还可以进一步定义这些资源的对象、属性以及属性应用类别和取值条件等, 通过这些定义从而能以计算机理解的标准方式对元数据进行描述语义内容以及元数据的结构关系。

3.3 Word Net

Word Net是一种基于认知语言学的英语词典, 它是由普林斯顿大学的计算机工程师、心理学家和语言学家联合设计的不仅是把单词以字母顺序排列, 并且是按单侧的意义组成的一个“单词的网络”。Word Net将所有的英语词汇按词性分为功能词、形容词、动词、名词和副词五类。动词被组成各种推演关系;名词在词汇记忆中被组成主题的层次;而形容词和副词被组织在N维超空间中。根据Word Net关系分析最大的优势是能在他的单词网里通过相关关系消除歧义, 因为Word Net分析主要是关系分析。Word Net在名词的语义消歧率可以超过60%。

4 结语

从以上三个语义系统来看, 无论是相对封闭的ULMS系统还是开放式的语义网、wordnet系统都具有较强的灵活性和扩展性。相对于常见的关键字信息检索, 语义检索不需要用户使用专业的检索策略, 也不需要语法严谨的检索式, 用户可以将自己的信息需求通过自然语言直接表达出来。语义检索在后台经过大量的计算, 分析用户的用户的语义文档信息, 充分利用各种语义关系消除歧义将用户真正需要的准确的信息资源反馈给用户, 将用户的检索效率提升60—80%。因此, 语义检索无疑是当前信息爆炸条件下最适合的网络信息检索方式。

摘要:互联网给用户的信息检索带来便利的同时也导致大量冗余信息出现, 使得检索效率低下。语义检索通过对用户检索要求的语义分析使得检索效率以及检索准确度大大提升。本文在分析语义检索基本要素和检索原理的基础上, 介绍三种常用的语义检索系统, 体现语义检索在网络信息检索环境下的优势。

关键词:语义检索,本体,语义网

参考文献

[1]黄敏, 赖茂生.语义检索研究综述[J].图书情报工作, 2008, (6) :63-66.

[2]Studer R, Benjamins R, Fensel D.Knowledge Engineering, Principles and Methods[J].Data and Knowledge Engineering, 1998, 25 (1-2) :16l-197.

[3]翁畅平, 沈娟.基于Ontology的个性化语义检索系统研究[J].图书馆理论与实践, 2009 (10) :77-80.

国内外信息检索策略比较研究 篇11

[关键词]信息检索 检索策略 比较 综述

决定信息检索效果(information retrieval effectiveness)的因素有系统因素和人为因素,系统因素是与检索系统的收录、设计和技术等相关的因素,是用户无法控制的;人为因素是与用户的个人素质、知识结构、检索经验与检索策略等相关的因素,是可以人为控制的。在人为因素中,信息检索策略(information-seeking strategies,ISSs)又是影响信息检索效果的关键因素,用户能否构造一个最佳的检索策略,将直接影响到信息检索的查全率与查准率[1]。从国内外研究情况来看,信息检索策略是一个内涵十分丰富的概念,它可以体现为与信息检索相关的朝向检索目标的任何计划、方案、措施、动机、方法与技巧。国内外对信息检索策略的认识存在共通点,同时,在研究内容、研究方法以及研究层次上又有着较大的差别。

1 信息检索策略的国内研究概况

1.1 理论研究

国内关于信息检索策略的研究主要集中在理论层次,认为检索策略是为了实现检索目标而制定的计划和方案,或者是所采取的措施和方法。相应的检索策略的内容主要包括需求分析、检索工具选择、检索词确定、检索途径确定以及检索式构造等方面,并以这一检索策略的内容为依据,探讨如何制定科学的检索策略。金秋颖、华薇娜、乔好勤、张岚等[2-5]认为检索策略是为了实现检索目标而制定的计划和方案,或者是所做的安排和部署,包括选择检索系统和数据库、选择检索途径、编制检索表达式等。王征清、成全[6]认为检索策略是在充分分析课题内容实质的基础上,选择检索工具与检索途径、发掘检索点、确定检索词及其相互间的逻辑关系,直到给出检索顺序的最佳实施方案等一系列的科学措施。陈光祚[1]认为检索策略是在分析情报提问实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系与科学的查找步骤以及检索过程中应采用的措施和方法。吴六爱、李霞等[7]认为检索策略是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。吴江文[8]提出了一种结构检索的检索策略,即任務、资源、词、方法和评估5个基本连续的阶段以及7个基本方针——确定任务、找出资源位置、选择检索词、挑选分类法、执行检索、评价结构与重新检索。这些计划或方案的观点是国内关于信息检索策略的普遍观点,并且大都围绕信息需求、检索工具、检索词、检索途径、检索式几个方面探讨如何制定科学的信息检索策略。所不同的是,李莹[9]提出了主题限定检索、分类限定检索与主题分类限定检索三种信息检索策略。从本质上讲,这三种方法是信息组织方法在检索策略中的具体体现。

1.2 实验与实证研究

国内亦有少量关于信息检索策略实验或实证方面的研究,但不够系统深入。有实验研究学生认知方式对数据库检索策略学习的影响,所学习的检索策略由检索方法与关键词放置方法组成[10]。但所涉及的检索策略只是数据库检索方法的某些方面,且重点是研究学生的认知方式对于学习的影响,关于检索策略的研究不够系统深入。亦有关于检索策略实验调查方面的研究,主要是通过发放调查表的方法来研究网络环境下人们对不同类型的问题选择的第一检索策略,所涉及的检索策略有输入地址、主题指南、搜索引擎、输入检索词几种形式[11-12]。这类研究实质上是调查统计方面的研究,并非真正意义上的实验研究。实证研究主要以某些课题或其部分内容为实例,从检索工具选择、检索词提炼、检索式构造几个方面进行实例化分析,如华薇娜[3]基于网络数据库信息检索各环节的实例分析,探讨了网络信息检索策略的设计与实施,黄瑞敏[13]基于科技查新质量评价因素分析,对网络信息检索策略优化机制进行了实例研究。这种实例化的研究基本上没有脱离信息检索普遍观点的内容,即是从检索工具、检索词、检索式等方面举例说明检索策略的设计和优化。

2 信息检索策略的国外研究概况

国外关于信息检索策略的研究则更为全面和深入,在注重理论研究的同时,较多地进行实验和经验性的研究。表达信息检索策略概念的语词主要有search moves、search tactics、search strategies与information-seeking strategies,相应的关于信息检索策略的研究可以分为moves、tactics与ISSs几类。

2.1 Moves

Fidel[14]研究了用户选择检索词的方法,特别详细地探讨了受控词与自由词的选择使用情况,并提出了信息检索策略的moves概念。moves是用户修正检索策略的一系列行为动作,分为操作性moves(operational moves)与概念性moves(conceptual moves)。操作型moves指不改变检索提问原意的行为动作,如使用同意词与词的不同拼写形式、增加数据库等。概念型moves是指改变检索提问原意的行为动作,如使用上位词与下位词。所不同的是,Marchionini[15]将moves定义为使用键盘所显示的概念性行为动作(conceptual act)。 Shiri与Revie[16]则提出了认知movies(cognitive moves)与物理movies(physical moves)。认知movies是用户对词或文献进行概念分析时所产生的行为,物理movies是使用系统时所产生的行为动作。

2.2 Tactics

Bates[17]认为信息检索策略是朝向检索目标获取所期望信息的任何一种步骤,提出了4种类型的检索策略,并进一步设计了29种具体的检索策略。4类检索策略分别是监控策略(monitoring tactics)、文档结构策略(file structure tactics)、检索式策略(search formulation tactics)与检索词策略(term tactics)。其中,监控策略指的是对信息的追踪策略,文档结构指信息的组织结构。Harter与Roger-Peters[18]针对网络信息检索,把101种具体的信息检索策略分为哲学态度与方法、描述问题的语言、信息记录与文档的结构、概念的形成与修改、检全与检准以及成本效率6种策略。Shute与Smith[19]则提出了13种基于知识的检索策略,并根据对主题范围的影响不同分成三大类——宽主题范围、窄主题范围以及变化的主题范围策略。

2.3 ISSs

Marchionini[20]将信息检索策略分为分析型策略(analytical strategies)与浏览型策略(browsing strategies)。分析型策略是面向目标的系统的策略,而浏览型策略是非正式的交互性策略。Belkin、Cool与Koennman等[21]将信息检索策略分为检索词策略(term strategies)、数据库策略(database strategies)、交互策略(interaction strategies)和搜索策略(search strategies)。Pejtersen[22]则提出了三个不同层次的信息检索策略——分析检索型(analytical search)、类比检索型(search by analogy)与浏览型(browsing)策略。Chen与Dhar[23]根据用户的认知过程提出了5种信息检索策略:已知款目的实例化策略(known-item-instantiation strategy)、检索选项启发式策略(search-option-heuristics strategy)、词表浏览策略(thesaurus-browsing strategy)、交互浏览型策略(screen-browsing strategy)與试错策略(trial-and-error strategy)。

Belkin、Marchetti与Cool[24]则提出了描述信息检索行为的信息检索策略的多面分类表,将信息检索策略分为方法(method of seeking)、目标(goal of seeking)、模式(mode of seeking)与资源(resource interacted with)4个方面。Cool与Belkin[25]对这种信息检索策略的模式做了扩展,提出了信息交互的5个方面:交流行为(communication behaviors)、信息行为(information behaviors)、交互对象(objects interacted)、交互的一般方面(common dimensions of interaction)和交互标准(interaction criteria)。Yuan[26]以此为基础,探讨了浏览(scanning)与搜索(searching)两种检索策略所应采用的系统技术与设计。

Xie[27-28]通过研究40个图书馆馆员用户的应用实例,提出了方法与资源作为信息检索策略的两个方面。方法是用户在检索过程中所使用的浏览、检索、追踪、选择、比较、获取、咨询等各种技术,资源包括信息、信息对象以及人。不同的方法与资源交织在一起构成了不同的信息检索策略,相应的信息检索策略的改变分为方法改变、资源改变以及方法与资源同时改变三种情况。在后来提出的信息检索模型中,信息检索策略由交互意图(interactive intentions)和搜索策略(retrieval tactics)两部分构成[29]。交互意图是为了实现当前目标或者搜索任务而必须完成的子目标(subgoals),搜索策略由方法和具有属性的信息实体(entities with attributes)组成。

从moves到tactics再到ISSs,信息检索策略研究是一个不断深化发展的过程。moves体现为一些较为零散的信息检索行为,而tactics已经可以对信息检索策略进行系统的分类,ISSs则能够对信息检索策略进行多面分类。总的来说,在国外关于信息检索策略的研究中,moves类与tactics类注重用户的决定与活动,更倾向于理论层面的研究,而ISSs类则注重用户的动机与方法,更倾向于经验层面的研究[30]。

3 国内外研究的比较分析

从国内外研究情况来看,信息检索策略的内容十分丰富,它包括朝向检索目标且与信息检索相关的任何计划、方案、措施、动机、方法与技巧。但关于信息检索策略的研究,国内外存在一些差异,主要体现在以下几个方面。

3.1 研究内容

国内对于信息检索策略内涵的认识主要集中在“计划和方案”这一普遍观点上,认为信息检索策略是为实现检索目标所制定的计划和方案,研究内容主要集中在主题分析、检索工具、检索词、检索式等方面,与用户信息检索行为相关的动机、方法的研究则较为少见;而国外关于信息检索策略内涵的认识则更为丰富,它可以包括为实现检索目标所采用的任何计划和方案以及措施、方法与技巧,特别是与用户信息检索行为相关的动机、决定、方法等也是信息检索策略研究的重要内容。

3.2 研究方法

国内关于信息检索策略的研究大多处于理论探讨层面,主要从检索工具、检索词、检索式等方面讨论如何制定科学的检索策略,仅有少量实验或实证研究;而国外在兼顾理论研究的同时,更侧重于用户行为的经验研究,许多研究都是以用户参与的实验为基础的,从用户信息检索行为的角度来解读信息检索策略。

3.3 研究层次

国内关于信息检索策略的研究大都处于简单的理论探讨层次,有待进行系统深入的研究;国外研究则较为全面和深入:表现在理论研究层面,问题论述得较为系统,能够对检索策略进行科学分类并提出多种具体详尽的检索策略;表现在实验研究层面,能够提供具体明确的实验设计和方法,对用户信息检索行为有较深刻的认识,研究较为深入和细化。

4. 启示和建议

虽然国内外对信息检索策略的理解不尽相同,研究的侧重点也不同,但信息检索策略的内容主要体现在资源、检索词、检索式以及用户所采用的方法、技巧等方面。它可以表现为宏观的系统的信息检索计划和方案,也可以表现为微观的零散的检索方法和技巧。基于此,笔者认为信息检索策略是为了实现检索目标而制定的关于信息检索的计划和方案以及在信息检索过程中所采取的措施、方法和技巧。

值得注意的是,无论是国内还是国外的研究,资源、检索词与检索式都是信息检索策略的重要内容,国内的研究可以从这几个方面结合实际进行更为深入的探讨;另一方面,实验或实证研究不失为研究信息检索策略的一个较好的方法,从用户信息检索行为的角度来解读信息检索策略更具有现实意义,这也是国内信息检索策略研究有待改进和加强的地方。

参考文献:

[1] 陈光祚. 因特网信息资源深层开发与利用研究[M]. 武汉:武汉大学出版社, 2002:37-39.

[2] 金秋颖,韩颖,王园. 数字信息检索技术[M]. 北京:石油工业出版社,2006:18-20

[3] 华薇娜. 网络信息检索策略的设计与实施的探讨——基于网络数据库信息检索各环节的实例分析[J]. 图书馆论坛, 2008,28(6): 111-114,178.

[4] 乔好勤,冯建福,张材鸿. 文献信息检索与利用[M]. 武汉:华中科技大学出版社, 2008:25-30.

[5] 张岚,张柏秋,于非,等.探讨科技查新中检索策略式的制定[J].现代情报, 2008(10):151-152,157.

[6] 王征清,成全. 信息检索策略研究[J]. 情报探索, 2007(4): 61-64.

[7] 吴六爱, 李霞, 张秀红. 计算机信息检索教程[M]. 兰州:甘肃人民出版社, 2006:51-54.

[8] 吴江文. 一种成功的检索策略——结构检索[J]. 情报科学,2002,20(1):90-92.

[9] 李莹. 查新工作中检索策略的制订[J]. 大学图书馆学报, 1995(4): 38,54.

[10] 馮颖,甘利人,乔德义. 学生认知方式影响数据库检索策略学习的实验研究[J]. 图书情报工作,2011,55(8):34-39.

[11] 黄丽霞. WWW环境下信息检索策略实验调查研究[J]. 中国图书馆学报,2003,29(3):53-55.

[12] 白莉. WWW环境下信息第一检索策略的实验调查研究[J]. 情报科学,2005,23(11):1704-1707.

[13] 黄瑞敏. 网络信息检索策略优化机制实证研究——基于查新质量评价因素分析[J]. 图书馆论坛,2010,30(1):65-67.

[14] Fidel R. Searchers’ selection of search keys: I. The selection routine. II. Controlled vocabulary or free-text searching. III. Searching styles[J]. Journal of the American Society for Information Science, 1991(42):490-527.

[15] Marchionini G, Meadow C, Dwiggins S, et al. A study of user interaction with information retrieval interfaces: Progress report[J]. The Canadian Journal of Information Science, 1991,16(4):42–59.

[16] Shiri A A, Revie C. The effects of topic complexity and familiarity on cognitive and physical moves in a thesaurus-enhanced search environment[J]. Journal of Information Science, 2003,29(6): 517-526.

[17] Bates M J. Information search tactics[J]. Journals of the American Society for Information Science, 1979, 30(4):205-214.

[18] Harter S P, Peters R A. Heuristics for online information retrieval: A typology and preliminary listing[J]. Online Review, 1985,9(5):407-424.

[19] Shute S J, Smith P J. Knowledge-based search tactics[J]. Information Processing & Management, 1993, 29(1):29-45.

[20] Marchionini G. Information seeking in electronic environments[M]. Cambridge: Cambridge University Press,1995:76-121.

[21] Belkin N J, Cool C, Koennman J, et al. Using relevance feedback and ranking in interactive searching[C]//Harman D K. Proceedings of the Fourth Text Retrieval Conference. Washington: Department of Commerce, National Institute of Standards and Technology, 1996: 181–209.

[22] Pejtersen A M. A library system for information retrieval based on a cognitive task analysis and supported by an Icon-Interface[J]. ACM SIGIR Forum, 1989,23(SI):40-47.

[23] Chen H, Dhar V. Cognitive processes as a basis for intelligent retrieval system design[J]. Information Processing &Management, 1991,27(5):405–432.

[24] Belkin N J, Marchetti P G, Cool C. BRAQUE: Design of an interface to support user interaction in information retrieval[J]. Information Processing & Management, 1993, 29(3):325–344.

[25] Cool C, Belkin N J. A classi?cation of interactions with information[C]// Bruce H, Fidel R, Ingwersen P, et al. Emerging Frameworks and Methods. Proceedings of the Fourth International Conference on Conceptions of Library and Information Science. Santa Barbara: Libraries Unlimited, 2002: 1–15.

[26] Yuan Xiaojun, Belkin N J. Investigating information retrieval support techniques for different information-seeking strategies[J]. Journal of the American Society for Information Science and Technology, 2010,61(8):1543-1563.

[27] Xie H. Shifts of interactive intentions and information-seeking strategies in interactive information retrieval[J]. Journal of the American Society for Information Science, 2000,51(9):841-857.

[28] Xie H. Patterns between interactive intentions and information-seeking strategies[J]. Information Processing & Management, 2002,38(1):55-77.

[29] Xie H. Shifts in information-seeking strategies in information retrieval in the digital age: A planned-situational model[J/OL]. [2012-10-13].http://informationr.net/ir/12-4/colis/colis22.html.

[30] Yuan Xiaojun. Supporting multiple information-seeking strategies in a single system framework[D]. New Brunswick: Rutgers University, 2007.

[作者簡介] 张 进,男,1981年生,馆员,信息分析师,硕士,发表论文3篇,参编著作2部。

吴贤奇,男,1974年生,副研究馆员,硕士,发表论文11篇,主编教材2部。

信息检索系统比较研究 篇12

1 信息检索可视化系统的优点及其类型

1.1 可视化信息检索的优点

1) 信息检索的可视化研究就是将文献信息、用户的提问在进行检索过程的同时, 将结果及可视化检索过程中的内部语义关系的转换等展示在一个低维的可视化空间中。可以使用户看到在传统信息检索过程中看不见的图形信息, 即向用户展现各种信息之间的语义关系, 使提问和检索结果以及检索过程中各信息之间的内部语义关系可见, 使得信息能够得到更有效的反馈。

2) 可视化信息检索使得检索结果清晰可见, 不仅让用户对其检索得到的文献分布一目了然, 还有助于用户浏览所检索的文献并进行文献信息分析;另外, 可视化的信息检索使得用户能够了解文献间隐含的语义关系, 从而更好地判断文献间的相关性[2]。

3) 可视化信息检索不仅可以用二维或三维图像显示结果, 还可以把人的视觉及认知过程融入检索过程、算法分析和设计系统当中, 因而减少了用于了解检索结果的聚类或语义分析的时间[2]。

4) 可视化信息检索系统可以通过改变文献的显示方式、改善人机交互功能来提高用户对文献间语义关系的理解, 实现个性化处理, 有助于不同语言背景的用户使用, 使得信息检索更加灵活简洁。

1.2 信息检索可视化系统的类型

1) 基于引文的信息检索可视化系统[3]。从检索系统的功能来看, 对于这种基于引文的信息检索可视化系统的评价, 除了要依据其理论基础外, 还应参照基于引文的检索系统的评价标准以及对可视化系统的评价标准。因该种可视化检索系统的主要特征是运用可视化技术进行知识域分析, 因此在参照信息可视化系统的评价标准时, 还分析检索过程中系统的交互性、可视化的显示形式、可视化的映射方法、用户界面等。

2) 基于知识模型的文本信息检索可视化系统[4]。该系统是通过信息、知识资源的元数据来进行可视化检索的。各种信息检索可视化系统都需确定两个方面的内容, 即系统的可视化对象以及可视化表现形式的内容。合适的可视化对象, 是指文档、网站结点、超链接结构等, 而可视化表现形式是指如几何图形、图表形式及自然物质实物形式等[5]。

2 对比分析基于引文和基于知识模型的信息检索可视化系统

笔者综合分析了基于引文的信息检索可视化系统和基于知识模型的信息检索可视化系统, 主要从系统设计、用户使用等方面着手对这两种系统进行了对比分析, 详细内容见表1。

从表1的对比分析中, 不难看出其各自的优势之处。由于这两类系统还处于原型研究阶段, 均缺少个性化服务及特色服务, 从界面到内容的设计还不够人性化, 帮助功能不够完善, 还需要加强与其他信息检索技术、方式及系统的集成, 以方便用户的最终使用。可以在现有的信息检索系统中通过对检索技术的改进和完善, 以缩短检索时间、增强系统和用户的交互性来满足用户科学研究、交流互动的需求, 并以知识结构图的形式将浏览或检索结果呈现给用户。

3 结论

在信息检索中, 跨语言信息检索终将成为现实, 随着经济全球化的开启, 科技文化早已不能各自为政, 而语言是实现全球化的最大障碍之一, 将可视化技术应用到跨语言信息检索中, 开发出跨语言的信息检索可视化系统将成为以后信息检索可视化系统的主要发展方向, 更好地解决用户在利用信息中的语言障碍问题。

摘要:本文对目前较为流行的信息检索可视化系统进行了简要的比较分析。

关键词:信息检索,可视化,对比分析

参考文献

[1]张进, 袁泽林 (翻译、整理) , 陆伟 (翻译、整理) .信息检索可视化的主流路径[J].图书情报知识, 2008 (5) :24-27.

[2]么新英.传统信息检索与可视化信息检索之比较[J].科技情报开发与经济, 2003, 13 (3) :1-2.

[3]孙巍, 张学福.基于引文的信息检索可视化相关系统比较分析[J].情报理论与实践, 2008 (4) :598-601.

[4]张学福.基于知识模型的文本信息检索可视化研究[J].中国图书馆学报, 2006 (5) :52-56.

上一篇:公路施工质量下一篇:动态无功补偿分析