信息检索最终

2024-07-09

信息检索最终(精选4篇)

信息检索最终 篇1

0 引言

人的一生都在不断地学习, 然而善于学习比起纯粹地学习更为重要, 善于学习不仅是一种能力, 而且是未来时代的必备要求之一。尤其是在信息时代, 善于学习才能更好地迎接新的挑战, 适应社会的发展与变化。如今, 信息技术日新月异, 生活与互联网紧密联系, 人们可以在网络上搜索大量的信息, 于是“搜商”这一词渐渐出现在人们的视线中并获得了更高的关注度。搜商不仅能帮助人们解决生活中遇到的问题, 还能影响人们的生活水平和生活质量。

1 初步了解信息检索与利用

搜商的含义, 即有效率地搜寻资源、解决问题的素养和能力。搜商的核心是搜索的意识和能力。在《信息检索与利用》的第一节课中, 初次接触到搜商, 了解信息检索与利用这门课程的主要内容和作用, 发现学会了这门课程对我的专业有很大的帮助, 能够解决专业上和学习上的问题。同时我也对搜商产生了浓厚的兴趣, 在接下来的一次次课程中, 揭开了搜商的神秘面纱。在课后实践过程中, 学会利用课堂上学到的知识来解决学习上的困难, 尝试搜商的各种功能得到不同的搜索结果, 更深层次地学习搜商, 提高了搜商能力。

2 信息检索与利用的学习过程

第二节课中, 学习了图书馆信息资源的使用, 原来图书查询不用到图书馆一本本翻阅才能找到想要的那一本书, 为了节省时间和提高效率, 登录学院图书馆主页, 在搜索框中输入相关书籍的书名、作者、索取号来获取书籍的相关信息, 记下索书号和馆藏地点, 就能快速到图书馆找到这本书。在图书馆主页中进入数据库导航, 有中文数据库和外文数据库, 中文数据库有中国知网、读秀知识库、超星数字图书、书生数字图书、方正Apabi电子图书等。中国知网主要是论文和期刊资源, 其他的可以浏览电子图书, 这样就不需要购买书籍或是到图书馆借阅, 直接在网络上打开相关网址, 下载相关阅读器, 就可以阅读想要看的电子书籍。这样, 阅读就不会受到地点、时间、空间的限制, 打开了人们阅读的另一扇“窗户”。

中文数据库里还有超星名师讲堂、新东方多媒体学习库、超星发现等。超星名师讲堂主要是讲师视频, 与浏览电子书相比较, 看视频学习更能让人浅显易懂, 而不显得枯燥无味。新东方多媒体学习库主要是学习英语, 比如英语四级考试, 我就可以到新东方数据库找到学习英语的相关资源, 英语四级的真题及解析答案或是英语高分的攻略技巧。超星发现是检测论文重复率, 有时老师布置论文需要检查论文重复率, 那么就可以到超星发现检测。中文数据库还有其他的功能等待我慢慢挖掘, 除了老师讲解的内容, 还有其他的用途等着我实践与应用, 这也是搜商能快速提高的一种方法。

第三节课中, 老师介绍了中国图书馆分类法, 简称《中图法》, 分为五个基本部类, 22个基本大类, 所有图书是按《中图法》给出的分类号排列。我学会了如何看图书的索取号和图书馆的排架原则, 这样在知道图书的索取号后, 很快就能到图书馆找到这本书, 而不是毫无方向的四处打转, 浪费了大量时间还找不到自己需要的书籍。第四节课的主要内容是中国知网的使用方法和搜索技巧, 先学习了如何进入和登陆中国知网, 其次是搜索方法, 快速而有效地找到自己需要的资源, 比如跟踪名人学者, 找到他们发表的论文以及几种导出论文的方式。最后, 我了解了投搞论文的方法和建设个人数字图书馆, 并尝试建设自己的数字图书馆, 将理论和实践相结合, 对搜商的应用有了进一步的了解。

第五节课是关于期刊论文的撰写, 老师讲了论文的基本构成与要求和参考文献的书写格式以及大雅论文相似度检测。之前我不了解怎样才能写出一篇好的论文, 学了这门课程后, 我知道了论文的构成要素和搜索相关的论文资源, 参考别人的论文成果, 然后自己就可以写出一篇论文了。老师又介绍了中国期刊网, 主要有龙源期刊网、万方数据库和维普数据库。如果想看期刊杂志, 就可以不用到图书馆借阅或将期刊买回来翻阅, 只要自己到这三个数据库, 查询想看的期刊花费少量的资金就可以看到自己喜欢的杂志。还可以在数据库上检测论文相似度, 以前只知道在淘宝上检测论文, 现在学会了多种检测论文的方法。

第六节课主要是电子图书的检索与利用, 可以在网络上阅览电子图书, 一种是在图书网站上检索书籍, 另一种是在图书数据库上检索学术方面的书籍。我学习了如何在超星数字图书高级检索电子图书, 从中进入读秀知识库浏览电子图书, 有效率地搜寻和利用电子资源。另一节课学习了其他数字图书馆的高级检索与中国国家图书馆的图书检索和公开课, 接下来老师讲了百度高级检索技巧, 每一个技巧对我搜索信息有很大的帮助并且节省了一定的时间, 让我有更多的空余时间做自己喜欢的事情。

3 信息检索与利用的心得体会

之前我一直认为在学习知识方面需要读很多的书, 大脑要记住很多的知识, 然而互联网发展, 信息在不断地更新, 我发现需要学习的知识太多, 需要了解的范围太广泛。现在, 我学习了《信息检索与利用》这门课程, 发现自己能够运用一些搜索技巧以及找到解决问题的有效方法。通过课上学到的知识, 运用到生活中, 在图书馆借了一本书名为《我的搜主意比你多》, 作者黄泰山将他搜索的经验与读者分享, 所以我对搜商有了进一步的认识, 发现传统的独立思考效果也会受到限制, 独立思考只有个人的力量, 需要花费大量的时间才能解决问题。有时候没有那么多的时间, 难道就不能解决了吗?我为什么要花比别人多一倍的时间才能完成任务呢?

搜商除了可以帮助我解决问题以外, 还可以提高我的智商、情商和成功的概率。在我的专业领域, 多少接触过一些相关信息, 但我更加需要找到这个领域内最有价值的信息, 而不仅仅是相关信息。在第七节课中, 学会用不同的搜索引擎有效地得到信息资源。而我明白了搜索不仅仅是一件供人利用的工具, 还是检索到有效方法解决问题的路径。掌握了搜索技巧, 我在完成专业作业时, 设置准确的关键词, 利用相应的搜索引擎, 获得自己想要的信息, 快速地完成了作业。不仅在专业领域的学习, 想要提升其他能力, 搜商可以助你一臂之力, 搜索资料认识能力, 学习和研究经典案例, 找到提升能力的方法, 对该领域的最新研究成果、动态发展的了解, 也可以依托搜商获取最新的信息和资源。

4 总结

总的来说, 学习这门课程, 就像拿到一把开启知识库大门的钥匙。无论你欠缺哪方面的知识、技能, 都可以上网寻求帮助, 获得学习资源。在这个有互联网的时代, 每一天都在变化, 信息也在更新换代, 而我们也需要变化, 积累更多的知识, 适应未来的变化发展。搜商的学习不会止步于此, 每天学习一点, 未来收获更多。

参考文献

[1]黄泰山.我的搜主意比你多[M].北京:北京大学出版社, 2014:22, 39, 177.

信息检索最终 篇2

随着本科专业的开展,这学期我们学习了一门实践性很强的课程,《文献信息资源检索与利用》,通过观看流媒体课件掌握了信息检索的理论知识、各类文献信息资源知识、了解了信息组织原理、掌握了检索工具的使用,主要有手工检索工具、计算机检索工具,特别是计算机信息检索的利用。还学会如何提出问题,如何选择搜索引擎,用什么样的搜索语言,怎样评价搜索的结果,对那么多的信息要怎样筛选和评价„„这些都在不断的学习中。

根据流媒体课堂对检索工具学习的内容,对检索工具进一步地熟悉和试用,对于文献检索的方法,我觉得不管是在哪个网站检索,最重要的还是关键词的选择。关键词选的“关键”,不仅可以提高检索速度,而且大大提高了检索结果的质量,可以很容易找到自己需要的数据或文献资料,总之要缩小范围,除了关键词以外,还可以检索信息的外表特征,诸如:作者名、文献出处名等。必要时还需明确所需检索的文献信息的类型,诸如:期刊论文、书籍文献、专利文献、会议文献、标准文献等,以此确定检索工具的类型。并且掌握了一点用google搜索的技巧,了解一点指导老师的研究动向,知道了很多很好的“文献库”和与我们专业有关的网站,对英文论文有了接触,以前经常在网上打开一个搜索引擎,有时是用百度有时是用google,试图找到一些想找的东西,结果找是能找到的,但往往花了太多的时间,要不断筛选。学习这门课,有助于更快的达成目的,明白google和百度的各有千秋。百度是个很好的中文搜索引擎,但往往会显示一些完全无关的东西,而在这一方面google就好一点。

最后更深刻的了解了:工具书、电子词典、“十三经”、“二十六史”、《诸子集》,古籍丛书、类书、政书、方志,还有“二十五史”、《百科全书》、《四库全书》、《永乐大典》等等,这些书的基本概念和内容,主要是如何检索这些书。

还有,最主要的是这门课程还教会了我们很多以后要用到的知识,例如,如何写论文的开题,参考文献的格式究竟是如何的等等,这些,都是我们以后写毕业论文的时候要知道的东西,我想以后,并不会有老师专门给我们讲如何写毕业论文的,所以,这个课程,给我一个我们很好的机会,接触毕业论文,接触标准论文的格式是一个不容忽视的问题,还知道写论文要小心翼翼,我现在能写的最多都只是简单的论文,还只是皮毛,论文的创造性、专业性、理论科学性,还要慢慢的学会。

总之,受益匪浅,希望今后可以学到更多的东西,看到一个不断进步的我,一个不断完善的我。

06秋会计本

网络信息检索中的图像检索技术 篇3

基于文本的检索是搜索引擎将网站、网页的内容索引为一系列的关键字, 当用户输入相应关键字后, 系统根据数据库中的倒排文档将关键字映射为网站或网页的地址。图像信息基于文本的检索技术, 即根据图像信息的文件名、路径名、ALT标签等, 将其标注为一系列关键字的描述, 然后通过检索这些描述以达到检索图像信息的目的。这种检索技术很不实用。首先, 由于目前的计算机视觉和人工智能技术都无法自动对图像进行标注, 要由人工完整地标注网络上的所有图像, 不但费时费力, 而且往往是不准确或不完整的;其次, 不同用户对于同一张图像的看法不尽相同, 导致对图像的标注没有一个统一标准;再次, 这种方法将注意力局限在图像的著录特征, 即文字描述上, 不能充分揭示和描述图像中有代表性的画面内容特征。所以基于内容的图像检索技术应用而生。

1 基于内容的图像检索技术

基于内容的图像检索一般是指静止图像的检索。这种图像检索技术通过分析图像的内容, 提取其颜色、形状、纹理等可视特征, 建立特征索引存储于特征库中, 在检索时, 用户只需把自己对图像的模糊印象描述出来 (绘制的草图或通过扫描仪等在线输入的图像) , 就可以通过多次的近似匹配, 在大容量图像库中查询到所需图像。基于内容的图像检索具有较强的客观性。

基于内容的图像检索算法涉及的相关技术比较多, 主要有:图像的分析与特征向量的提取技术、特征向量数据的组织与存储技术、图像数据的组织与存储技术等。

1.1 基于颜色特征的图像检索

颜色特征是图像检索中最基础的一种检索依据, 颜色是人识别图像的主要感知特征之一。在基于颜色特征的检索算法中, 通常用颜色直方图来表示图像的颜色特征。直方图能较好地反映图像中各颜色的频率分布, 横轴表示颜色等级, 纵轴表示在一个颜色等级上, 具有该颜色的像素在整幅图像中所占的比例。直方图可以对整幅图像进行最大匹配度检索。目前关于色彩的索引方法有两类:基于全局色彩的索引与基于局部色彩的索引。

全局色彩的索引就是按全局色彩的分布来索引图像, 计算每种颜色的像素, 检索出具有相同颜色内容的像素的图像。其中最为简单有用的工具是灰度直方图。利用图像的灰度直方图作为特征指标来描述图像, 一般是利用二维直方图, 如红—蓝直方图, 它是红光图像的灰度值和蓝光图像的灰度值的函数。利用色彩直方图进行检索的方法有许多, 如:比例直方图法、累加直方图法等。

色彩直方图还不能为像素在图像中的位置提供线索, 为了尽可能少地丢失信息, 提出了局部色彩方法。局部色彩的索引对象是局部相似的颜色区域, 它考虑了颜色的分类和一些初级的颜色特征。用形状面积、圆度、离心率等来描述形状的特征矢量。

1.2 基于形状特征的检索

形状是刻划物体的本质特征之一, 利用形状来检索可提高检索的准确性和效率。基于形状的检索不仅包括传统意义的基于二维形状的检索, 还包括三维形状的检索。

基于图像内物体形状的检索, 首要问题是采用合适的图像分割算法把不同对象从图像中分割出来, 关键是寻找符合人眼感知特性的形状特征。目前, 较好的方法是采用图像的自动分割方法结合识别目标的前景和背景模型来得到比较精确的形状特征。图像自动分割方法的具体思路是:将图像分块后, 将每个块看成是一幅小图像, 计算每个小图像的颜色直方图特征, 则每个块间的直方图是不一样的, 为分析边缘特征, 将相邻两个块构成一个比较对, 将每个块间的差值记录下来, 同时记录差值在一定范围内的数目, 这样就形成一个颜色特征差值表。图像对象空间位置发生变化, 其特征差值表也就不同。

1.3 基于纹理特征的检索

纹理是指图像在局部区域内可能呈现出不规则性而在整体上却表现出某种规律性。纹理特征是图像中难以描述的特征, 它是一种反映图像像素灰度级空间分布的属性。如果一个物体内部以灰度级变化明显而又不是简单的色调变化, 那么该物体就有纹理。

纹理分析的方法基本可以分为统计法、结构法、模型法和空间法/频率域联合分析法等4类。基于统计的方法是对图像中的颜色强度的空间分布信息进行统计, 主要用于分析像木纹、沙地、草坪等细致而不规则的物体;基于结构的方法将重点放在分析纹理元之间的相互关系和排列规则上, 适用于像布料或砖瓦等一类元素组成的纹理以及排列比较规则的物体;基于模型的方法是假设纹理按某种类型分布, 如Markov随机场模型、分形模型等。基于空间/频率域联合分析法主要包括Cabor变换法和小波变换法等。

1.4 基于知识的图像检索

基于知识的图像检索也是基于内容检索的重要方法之一。图像本身是一定数量的颜色像素点的集合, 人类能够识别出像素点集合的含义是人类以自身的知识赋予图像意义的过程。基于知识的图像检索系统为用户提供知识库, 针对一个图像需求, 搜索引擎依次调入每一幅图像的内容描述, 结合知识库中的相关知识, 以图像需求为目标进行推理, 如果需求目标得到满足, 则确定这幅图像符合检索要求。

2 基于内容的图像信息检索系统

目前, 基于内容的图像检索技术的研究取得了很大的突破, 较有影响力的有以下几个:

2.1 QBIC系统

QBIC (Query By Image Content) 是IBM公司于20世纪90年代研制的图像和动态影像检索系统, 其含意是“根据图像的内容进行查询”。由IBM Almaden研究中心开发, 是基于内容的检索系统的典型代表。QBIC在检索过程中用户无须提供文字检索词 (它也提供关键词检索) , 只要输入以图像形式表达的检索要求, 即可检索出一系列相似的图像。QBIC系统允许使用示例图像、用户构建的草图、选择的颜色与纹理模式、镜头与目标运动等, 对大型图像和视频数据库进行查询。

2.2 Photobook系统

Photobook系统是由美国麻省理工学院 (MIT) 的媒体实验室于1994年开发研制的用于浏览和搜索图像的一套交互式工具, 图像在存储时按人脸、形状或纹理特性自动分类, 图像根据类别通过显著语义特征压缩编码。

2.3 Virage系统

Virage是由Virage公司开发的基于内容的图像搜索引擎。与QBIC相似, Virage支持基于颜色、颜色布局、纹理和结构 (对象边界信息) 的可视化查询, 但Virage比QBIC更进一步, 它也支持由4个原子查询的任意组合, 用户可以根据他们自己的侧重调整4个原子查询的权重。

2.4 CORE系统

CORE是新加坡国立大学开发的一个基于内容的检索系统。其显著的技术特色包括:多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。

2.5 Visual SEEK系统

由美国哥伦比亚大学图像和高级电视实验室开发。它实现了互联网上基于内容的图像/视频检索系统, 提供了一套工具供人们在Web上检索图像和视频信息。用户可以把顶部为红橙黄色区域、底部为蓝绿色区域, 这样的图像作为查询“日出”的草图, 使人们在Web上可以方便地搜索和检索图像和视频。

3 基于内容的图像检索体系结构

基于内容的图像检索系统与传统基于文本的检索系统完全不同。基于内容的检索系统一般通过可视化界面和用户进行频繁的交互, 以便用户能够方便地构造查询和改进检索结果, 用户通过选择具有代表性的一幅或多幅例子图像来构造查询, 然后由系统查找与例子图像在视觉内容上较相似的图像, 按相似度大小排列返回给用户, 即所谓的通过例子图像的检索 (Query By

Image Example) 。

基于内容的图像查询和检索是一个逐步求精的循环过程。其过程及各个模块如下:

3.1 图像的预处理

在特征抽象子模块里, 首先要进行图像的预处理, 包括图像格式的转换, 尺寸的统一, 图像的增强与去噪, 图像的边缘提取, 经过边缘提取获得图像的轮廓特征, 对其进行进一步轮廓清晰化处理等功能, 为图像的特征提取打下基础。

3.2 图像的目标标识

图像预处理后, 要进行图像的目标标识。目标标识为用户提供一种工具, 以全自动或半自动 (需要用户干预) 的方式标识图像中用户感兴趣的区域或目标对象, 以便针对目标进行特征提取并查询。当进行整体内容检索时, 利用全局特征, 这时不用目标标识功能。目标标识是可选的。

3.3 图像的特征提取与表达

图像特征的提取与表达是基于内容的图像检索技术的基础。对图像数据库进行特征提取, 提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的, 即整幅图像, 也可以是针对某个目标的, 即图像中的子区域, 如人的面部特征或指纹特征等。

3.4 图像数据库

作为图像查询的后台基地, 生成的数据库由图像库、特征库和知识库组成。图像库为数字化的图像信息, 特征库包含用户输入的特征和预处理自动提取的内容特征。知识库包含专门和通用知识, 有利于查询优化和快速匹配, 知识库中知识表达可以更换以适用各种不同的应用领域。

3.5 图像的查询接口

在基于内容检索中, 由于特征值为高维向量, 不具有直观性, 因此必须为其提供一个可视化的输入手段。友好的人机交互界面是一个成功检索系统不可缺少的条件, 可采用的方式有3种:操纵交互输入方式、模板选择输入方式和用户提交特征样板的输入方式。另外, 查询返回的结果需要浏览, 应在用户界面提供浏览功能。

3.6 图像的检索引擎

检索是利用特征之间的距离函数进行相似性匹配, 模仿人的认知过程, 近似得到数据库的认知排队, 存在一些不同的相似性测度算法, 检索引擎中包括一个较为有效可靠的相似性测度函数集。

3.7 图像的索引/过滤

索引是用来提供快速、有选择性地存取数据库的一种机制, 它相当于一种映射机制, 将属性的值转换为相应数据地址域的地址集。过滤器作用于全部数据, 过滤出的数据集合再用高维特征匹配来检索。索引用于低维特征, 可以用R树来索引以加快检索速度。

基于内容的图像检索技术为用户提供了一个在网络上搜索感兴趣的图像信息资源的有效手段, 但基于内容的图像检索技术目前还存在许多有待发掘的内容, 因而, 基于内容的图像检索技术也需要随着网络技术、信息技术的发展而发展。

摘要:图像检索是网络信息检索中的重要的组成部分, 而其检索技术却相对滞后。基于内容的图像检索已成为网络信息检索技术的研究热点。本文分析并总结了图像检索的概念, 综述了基于内容的图像检索系统和相关技术。

关键词:网络信息检索,基于内容,图像检索技术

参考文献

[1]何惠芬.图书馆中基于内容的图像数据库检索技术[J].情报杂志, 2002 (7) .

信息检索最终 篇4

传统信息检索与现代信息检索的区别与联系............................................2 【引言】:...............................................................................................2

一、传统信息检索.................................................................................2

二、现代信息检索.................................................................................2

三、传统信息检索和现代信息检索的异同...........................................3

四、国内外研究现状..............................................................................3

五、信息检索的发展趋势......................................................................6 传统信息检索与现代信息检索的区别与联系

【摘要】: 信息检索的发展是随着科学技术的进步而发展的。人类已经 进行了四次信息技术革命,目前正 在进行第五次信息技术革命。信息技术的革命使得信息检索也不断地得到改进,信息检索技术主要有四个阶段:初始阶段、手工检索 阶段、计算机检索阶段、网络检索 时代。信息检索手段分传统信息检索和现代信息检索。传统信息检索是指手工信息检索,现代信息检索包括计算机信息检索和网络信息检索。

【关键词】: 网络信息检索 传统信息检索 信息技术革命 比较研究 计算机检索 手工检索 网络检索 信息检索技术 检索手段 文献信息

【引言】:

一、传统信息检索

传统信息检索-手工检索是利用各种专门用于检索的印刷出版物,即常说的检索工具来查找所需要信息的手段。其检索方法主要有以下几种:(1)直接检索:这是人们最常用的一种查找信息的方法,如去图书馆查阅各种图书、期刊及其他资料,找到需要的信息,需花大量的时间和精力,在过去文献较少时,还能达到目的,而在信息大量产生的年代里犹如大海捞针。

(2)间接检索:就是利用各种检索工具获取线索,再根据线索查找原始文献信息的方法。也就是手工检索。间接检索还分为:1追溯放:通过已知文献所赋的参考文献“由一变十,由十变百“地进行追溯查找有关信息还可以利用各种”引文索引”等工具进行追溯检索。2.工具法:利用各种检索工具进行查找文献,是文献检索最常用的方法。

二、现代信息检索

现代信息检索是指计算机及网络信息检索。计算机检索是以计算机为基础的信息存储检索。它是在手工检索、机械检索及光电检索基础上演变过来的,且在不断地发展。(1)计算机单机检索:是计算机检索的初形式。随着计算机存储介质的发展变化,也在发生不断变化。目前主要有三种方式:计算机磁盘检索,计算机磁带检索和计算机光盘检索。

(2)网络检索:计算机网络检索是近几年来发展起来的,目前它主要有三种形式:图书馆的局域网络的检索,联机检索系统的检索和internet网上检索。

随着计算机技术的普及、通讯及网络技术的发展,现代信息检索技术已不再是图书馆情报专业人员的专长,而是人人都应掌握的基本技能。

三、传统信息检索和现代信息检索的异同

(1)检索语言:检索语言就是检索信息时所使用的信息词汇,在检索语言上,手工检索与计算机检索基本相同,不同的是计算机检索可以使用较多的自然语言,internet网上检索一般使用自然语言。

(2)检索概念的组配:手工检索主要是以人脑进行检索概念的组配,而计算机检索则是利用布尔逻辑、位置逻辑等逻辑运算符进行概念组配,internet网上检索概念组配方式尚不成熟。其中计算机检索的概念组配最为严谨,手工概念组配的检索组配最灵活。

(3)检索途径:检索途径也就是检索入口,是根据信息的某种特征所进行的检索,手工检索与计算机检索的基本检索途径是相同的,如著作、分类、主题等。但计算机检索的检索途径要更加广泛和灵活,可以从年代、题目、文章、语种等途径进行检索,并能进行多途径同时检索。

(4)检索工具的特点:传统检索:

1、检索范围窄

2、检索速度慢

3、检索效率差

4、检索入口少

5、用户负担大

6、工具内容更新速度慢

7、工具体积庞大

8、信息密度低。现代信息检:

1、检索范围广

2、检索速度快

3、检索效率高

4、一种检索输入、多种检索输出

5、检索人性化

6、更新速度快

7、检索界面简洁

8、信息密度大。

四、国内外研究现状

21世纪是信息大爆炸的时代,海量的信息在满足人们工作、生活和研究需求的同 时,也给人们检索和利用信息带来了空前的挑战,快速、准确、有效地检索到所需要信息已成为每一个信息检索者的迫切愿望。满足用户的最大需求不仅要求提高信息检索系统的易用性和信息检索技术,还应充分分析和了解用户的信息检索特点,发现影响用户利用网络信息行为的障碍,有针对性地为用户提供帮助。

(1)中国研究现状

(1-1)研究主题

国内信息检索研究主要集中在用户检索行为特征、基于认知信念的用户信息检索研究、网络环境对信息检索的影响研究、国内外信息检索研究述评、特定情境下的信息检索以及利用特定数据库的信息行为研究等方面,呈现出研究主题涉及范围广、分布分散、深度不够的特点。此外,图1显示,近10年中聚焦消费者群体、学生群体、科研人员、网络用户和旅游群体等5类用户研究的文献就有57篇。虽然也涉及医学用户、老年用户信息检索特征的研究,但主题研究论文仅一两篇,不占研究的主流地位。因此,就研究主题分布而言,国内在上述5类用户研究方面具有一定的深度和规模,其他主题研究明显还不够深入,有待进一步加强.(1-1-1)关于消费者群体的研究 在网络环境下,为应对铺天盖地的商品广告和网络商店,消费者必须要有一定的检索技能,才能查找到自己 需要的商品,并甄别和选择出价格合理的商品。基于消费者信息需求的多样性和检索行为的多元化,选择消费者群体检索行为特征作为切入点的论文较多,共有15篇。其中研究的重点集中在电子商务交易过程中的信息行为、消费者搜索特定商品的策略和行为等方面,如乳制品、房地产、非处方药品信息的搜索特点。在消费用户信息检索特点研究中,研究者比较注重调查研究。例如,唐亮通过调查统计,在研究消费者网络信息搜寻行为及其影响因素的基础上,探讨了风险性感知、复杂性感知、重要性感知、产品知识、网络使用能力、市场敏感度等因素对

消费者信息需求感知的影响,同时对影响消费者选择搜索引擎和门户网站的因素进行探讨。因此,这类研究论文不仅对丰富消费者网络信息搜寻行为的理论有一定的参考价值,而且对于企业根据消费者获取信息的特点调整产品的宣传策略也有一定的借鉴意义。

(1-1-2)关于学生群体的研究

高校中大学生和研究生是检索利用各类信息资源的主体。据统计,大学生群体信息检索的研究论文有11篇,研究生群体的有1篇,由此可以看出,大学生群体信息检索无疑是信息检索研究的重点。学生群体研究主要针对本科及以上学历的学生。研究者主要通过问卷调查和统计的方法,分析高校本科生在网络环境下的信息检索,其中包括信息检索技能、策略、动机和信息素养等对信息检索的影响并提出相关建议。例如石德万等通过实证分析得出“学生查询互联网信息时,主要是通过搜索引擎查找相关的网站,然后再进入网站查找所需信息,其次是根据已有的知识和经验访问已知的网站查找信息”,对图书馆如何应对读者的信息搜索习惯提出了加强文献检索课检索技巧培训、建设信息导航,提高高校图书馆的网络信息服务能力,优化本科生网络信息检索 教育等方面的建议。此外,不少论文通过调查和研究发现影响高校学生网络信息检索的主要因素有基本特征因素如性别、专业、年级、上网频次;网络环境因素如对网络信息与非网络信息的认知比较、网费、对网络的 熟悉程度与检索技巧、用户培训、上网时间与地点等。

(1-1-3)关于科研人员的研究

科研用户一般包括大学的科研工作者、教师、各个科研机构的研究人员以及博、硕士研究生等。这一群体在利用网络数据库时一般具有较强的目的性,即根据科研项目的主题检索科技信息,他们对网络数据库的查准率有较高的要求。由于科研人员的特殊性,即科研工作创新迫使他们需要不断地进行探索,进而导致信息需求的“不确定”

。因此,在研究过程中,他们一方面处于长期存在信息需求的状态,另一方面,需求信息具有一定的模糊性。研究论文针对用户信息需求的特点,结合网络信息检索实践,从认知行为学和心理学的角度探索了科研人员利用web2.0以及各类网上数据库的检索行为。例如胡昌平等通过论述科研人员克服信息查询障碍,借助图书馆工作人员优化检索过程和改善检索结果,揭示了网络环境下高校科研人员的一些重要的检索行为特征,为提高科

研人员以项目为中心的信息利用水平提供了借鉴。因此科研用户检索行为研究不仅对改善网络信息资源的组织方法、导航系统、标识系统,而且对优化搜索引擎也有着很强的现实指导意义

(2)国外研究现状

(2-1)研究方法

国内关于信息检索研究主要采用定性和定量相结合的方法,最常用的是通过问卷调查或者是在线调查采集数据。采集有代表性的样本是获得正确调查数据的重要保证,同时能够保证得出结论的正确性和研究结果应用于实践的可行性。例如刘磊等调查的学校有南京大学(综合类院校代表)、南京理工大学(工科类院校代表)京师范大学(人文类高校代表)、南京农业大学(农林类高校代表)等,涉及的学科专业有法律、国际贸易、英语、汉语言文学、历史、生物、园艺、环境保护、农学、医药、化工、车辆工程、电子信息等学科专业。该项调查内容丰富,调查对象覆盖面宽,有很强的代表性。但有些论文针对医务人员信息检索所做的调查,只选取某一个医院的部分人员作为调查对象,由于样本太小,难免产生片面性结论的弊端。

(2-2)研究主题

在国外近2800篇的论文中,研究领域较广,涉及到检索行为模型研究、不同职业人群的检索行为研究、检索任务对检索行为的影响研究、搜索引擎对检索行为的影响研究等。其主要的主题内容分布如下。

(2-2-1)对不同职业用户群信息检索的研究

国外检索行为的研究中,用户群的信息检索研究是一重要研究领域。在医生、护士、工程师、教师、管理人员、学生群体等研究中,医务人员和学生检索行为则又是其研究的重点。国外关于学生群体的研究较为精细,不仅根据大、中、小学生不同年龄和学习特点展开了信息检索研究,而且根据不同年龄段学生的信息需求、检索技能、检索策略制定、选择检索工具的特点以及学校用户教育在方法和内容等方面的衔接展开了研究。

由于医务人员信息量较大,因此他们对信息检索的依赖性较大。哈伦大学的经过研究,发现医务人员信息检索研究主要涉及3个主题。一是医生信息需求的频率和类型研究;二是医生信息需求的内容研究,包含信息资源利用模式、信息检索耗费时间、信息检索壁垒与信息检索技巧;三是信息资源研究,包括利用资源的数量、信息来源比较、信息资源利用排名、印刷型与电子资源利用比较、PDA的利用、电子数据库和网络利用研究等。

(2-2-2)对不同学科用户群信息检索的研究

学科的差异性必然带来信息需求和检索行为的迥异。该类文献研究主要聚焦在不同学科研究人员的检索方法、信息源以及面临的障碍等。例如,S.Nii Bekoe Tackie和Musah Adams在对VRA.工程师的研究调查中,发现工程师们需要相对简洁、详细且实用的信息,他们检索的动机受所需解决问题的类型的影响,从而更倾向于通过同事间的交流获得信息。因此,他建议扩大图书馆的信息交流空间,提高检索质量来吸引工程技术人员利用图书馆。BradleyM.Hemminger等人通过网上调查,研究网络环境对信息检索的影响,发现越来越多的人对网络资源的依赖性较大,利用图书馆的人日趋减少。这些研究成果提示图书馆,应对网络环境,必须充分运用营销手段努力推销自己,延伸和拓展服务手段,更大范围地覆盖研究人员的信息需求。

五、信息检索的发展趋势

随着网络的飞速发展,网上资源也日新月异,呈爆炸性增长趋势。面对如此浩瀚多样的信息资源,计算机技术,通信技术,信息检索存储技术的快速发展,手工检索的“手翻、眼看、大脑判断”的检索方式已经很难适应当今信息的发展速度,因此,信息检索开始从手工检索过渡到计算机检索。

信息检索,是以科学的方法,利用检索工具和检索系统,从有序的信息集合中检索出所需的信息的一种检索方式,是人类为了合理的分发情报和充分的利用情报而采取的一种重要的交流方式,于是乎,信息检索已经成为现代社会信息化和个汇总应用关系的关键。

在这个高速发展的信息时代,信息就是商品、信息就是财富、信息就是资源、信息就是机会,人人都渴望及时获得有用的信息,如果说信息是人来赖以生存、发展的本能,那么信息检索就是每个人必须具备的一种基本技能。因此,信息检索在这个时代起着举足轻重的作用:1.信息检索是读书治学的基本功。无论是在学习还是在工作期间,都需要进行各种信息检索的培养和训练;2.信息检索是科学研究的组成部分。科学研究首先是从课题调研掌握资料起步的,信息检索有助于掌握本课题的进展动态,开拓思路,避免重复劳动,把研究水平提到新的高度;3.信息检索是科学决策的先导。信息化时代的经济管理、政治控制、艺术创造乃至心理状态的演变等,均受到各种社会信息的影响。适时掌握相关信息才能实现有效的管理。

目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的网络内容。因此,在未来的时代信息检索必将出现信息智能化、个性化、专业化、多样化的检索引擎。

智能搜索引擎是结合了人工智能技术的新一代收索引擎,它使因特网信息检索从基于关键词检索提高到基于知识或概念检索,并对知识有一定的理解及处理能力,能够实现分词技术、同意词技术、概念搜索、短语识别及机器翻译等技术。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预,这意味着用户将彻底从繁琐的规则中解脱出来。在检索服务方面,提高检索质量需求最基本的一点就是判定用户是在寻找快速的回应还是精确地检索结果并分析查询中隐含的“意义范围”,即词语在不同领域的含义。个性化信息检索是指能够为具有不同信息需求的用户提供个性化检索结果的技术。即对不同用户提供的同一种查询词语也能按照不同的用户需求而生成不同的检索结果。从实现原理上看,目前的个性化信息检索的方法主要有三种,分别为基于文本内容分析的方法、基于点击流量的方法和基于超链接分析的方法。基于文本内容分析的方法通过获取用户的查询历史和访问网页等文本信息,甚至有时还能结合用户主动提交的,反应自身兴趣的关键词来得到个性化检索结果。而基于点击流量的分析方法则使用了一些间接反映用户个性化需求信息的方法,往往能更有效地提供个性化检索的服务。再如基于超链接的个性化检索方法,它主要利用修改网页的标准PageRank值来反映用户的个性化信息需求。

面对这样一个新知识、新技术不断涌现、只是新陈代谢频繁的世界,想要一劳永逸的获得知识是不现实的,我们只有终身学习、不断获取、更新知识,才能不被社会所淘汰。要有效、快速的获得和利用最新的信息,就必须掌握信息检索的技能。

【参考文献】:1.周文荣:网上数据库检索[j]情报科学;2001年08期

上一篇:杏鲍菇工厂化生产管理下一篇:民用建筑工程地质勘察