科技信息检索报告

2024-10-13

科技信息检索报告(共11篇)

科技信息检索报告 篇1

科 技 信 息 检 索 实习报 告

姓名 赵克飞 班级 成型133 学号130602336 实习日期 2015年10月8日

[检索课题] 复合材料构件成型模具设计方法 [检索工具] CNKI和网络资源 [检索途径] 主题检索 [方法与步骤]

1、分析研究课题

首先了解课题的基本含义:复合材料构件成型模具设计概念及意义。

可以通过百度搜索,阅读搜索的结果可以了解到:复合材料是由两种或两种以上性质不同而互补的材料所组成的、并被赋予了新特征的材料结构,它具有高比强度、高比模量、良好的抗疲劳性、抗腐蚀性等一系列优点。在飞机上采用高比强度和比刚度的材料意味着可以明显地减轻飞机的结够重量,而减重又是飞机永恒的话题。正因如此,复合材料日益受到国防、军工、以及航空航天等领域的青睐。使用经验表明,复合材料不仅可以大幅度提高飞机结构失效率,而且使飞机具有隐身和气动弹性,其综合性能得到改善和提高;对军用飞机轻型化、隐身、高性能化和小型化起到了至关重要的作用,复合材料现已成为新一代飞机机体结构材料的主要材料之一。

针对目前复合材料构件成型模具在设计过程中存在的问题,研究了复合材料构件成型模具的参数化设计技术,基于CATIA V5R17平台,开发了复合材料构件成型模具的参数化设计软件,用以辅助工装设计人员进行复合材料的构建成型模具的快速设计,提高设计效率。工作概述如下:

⑴分析了现有复合材料构件成型模具的设计方法,针对设计中存在的效率较低的问题在对参数化技术进行研究的基础上,确定了复合材料构件成型模具的参数化设计方案。

⑵研究了企业在复合材料构件成型模具设计中的经验,提炼出成型模具的结构设计流程;对复合材料构件成型模具的结构特征进行了详细的分析,针对成型模具的具体结构设计了相应的参数化驱动方法。

⑶基于CATIA&CAA,开发了复合材料构件成型模具的设计软件,通过输入若干参数,即可实现复合材料构件成型模具的快速设计。

2、选择检索工具

根据学校数字资源现状,选择CNKI中文库

3、选择检索词

选择检索用词的最简单方法是将检索课题在字面上加以切分,经对如前所述的课题切分和删减后,所得关键词为:复合材料、材料构件、材料成型、成型工艺、模具设计

4、CNKI数据库检索

利用高级检索,选择主题词“复合材料”并且“构件”并且“成型”并且“模具”,点击检索,共检出文献21条,结果如下图所示。

(也可以用剩余检索词再进行组合检索)

5、检索结果

选择其中3条,著录如下:

[1]梅立,梅中义,范玉青.复合材料构件计算机辅助成型工艺设计的研究[J].机械工程师,2009,01:118-121.[2]李桂东,周来水.复合材料构件成型模具设计方法[J].南京航空航天大学学报,2009,06:777-782.[3]张富官,安鲁陵,李汝鹏.复合材料构件成型模具的参数化设计[J].宇航材料工艺,2008,06:10-14.

科技信息检索报告 篇2

1. 信息检索的发展沿革

面对浩如烟海、缤纷复杂的信息资源, 如何依照人的主观意愿和客观规律高效获取信息为人所用, 古今中外一直是人类努力寻求的策略方法。早期人类靠认识、记忆和直接传授来利用信息, 当信息量增加到一定规模后, 就出现了简单的编制信息索引, 分类检索方式。这种人工检索方法一直沿用到二十世纪中叶。计算机技术的问世, 为信息检索带来了一场根本性变革, 使古老的人工检索一步跨越到智能检索层次, 大大提高了检索效率。随着全球网络技术的飞速发展, 广泛分布在全球各地、各行业领域的独立分散信息源逐渐融合在一起, 汇成了当今海量的全球化信息资源, 检索技术也由单机程序和局域网模式升格到基于互联网技术的异构跨域搜寻模式。形成了当今信息量膨胀、更新极为快速、获取极为方便、利用也更加充分的信息检索应用新局面[1]。

2. 科技信息分类和数据库

2.1 科技信息分类

科研的实质就是创新, 创新不仅是指推导出新的结果或创造成果, 也包括对以往的科研工作的总结和提炼。从科研工作的进程来看, 首先需要了解前人做了什么工作, 形成了什么成果;第二, 你打算在前人工作的基础上开展什么创新, 什么是该创新的价值所在;第三, 采取怎样的研究方法和路径最有效;第四, 产出或成果通过什么渠道发布扩散, 以实现科研价值。还有一点非常重要, 就是要在避免侵权的前提下充分利用他人的知识和成果。从整个创新进程不难看出, 需要涉及的科技信息可分为参与前的信息和参与后的信息两种。参与前的信息是指获取信息的人没有参与情况下的信息。由于没有人为因素的参与, 这个信息则是客观真实的, 不存在真假的问题, 只是存在着每个人的认知能力和认知水平问题。参与后的信息是指获取信息的人, 参与了信息活动而获得的信息。由于有获取信息的人的参与, 这个信息就会掺入一些人为因素在里面, 就会使获取的信息, 不再是原来状态下的信息了, 这个信息就会或多或少地失去一些客观真实的内容[2]。无论哪种信息, 都需要相关媒介承载。科研工作中经常应用的信息主要来源于图书、期刊、专利文献、会议文献、学位论文、科技报告等, 且又分为中文信息和其他外文信息。在外文信息中, 利用做多、最普遍的是英文信息。

2.2 信息资源分布

信息来源虽然分布广泛, 但为了方便利用, 专业机构和人员通过各种渠道将信息采集汇总, 并依照一定的规则加工成特定的数据形式, 按照数据结构来组织、存储和管理, 形成了供人们使用的各种数据的仓库, 即公共数据库。这些数据库虽然信息量繁杂庞大, 但各具特色, 为不同行业、专业的人提供了查询方便。目前国内知名、影响力大的数据库有维普资讯 (VIP) 万方数据 (WANFANG DATA) 中国知网 (CNKI) 中国专利检索数据库等, 国际著名的数据库包括Science Citation Index (SCI) Social Sciences Citation Index (SSCI) Engineering Index (EI) Science Abstracts (SA) Chemical Abstracts (CA) 等[3]。

3. 信息检索策略方法

信息检索是利用检索工具或检索系统, 采用一定的检索方法查找出符合特定需要的信息的过程。检索效率和检索成果往往由两种重要因素决定:检索工具和检索策略方法。

3.1 检索工具

在浩瀚无边的信息海洋中寻找需要的信息, 必须借助于检索工具。检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合, 是二次文献。目前可供人们使用的检索工具有很多, 不同的检索工具各有特点, 可以满足不同的信息检索的需求。按照著录格式的不同可将检索工具分为以下四种类型。

3.1.1 目录型检索工具

目录型检索工具是记录具体出版单位、收藏单位及其他外表特征的工具。它以一个完整的出版或收藏单位为著录单元, 一般著录文献的名称、著者、文献出处等。目录的种类很多, 对于文献检索来说, 国家书目、联合目录、馆藏目录等尤为重要。

3.1.2 题录型检索工具

题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征 (如文献题名、著者姓名、文献出处等) , 无内容摘要, 快速报道文献信息的一类检索工具。它与目录的主要区别是著录的对象不同。目录著录的对象是单位出版物, 题录的著录对象是单篇文献。

3.1.3 文摘型检索工具

文摘型检索工具是将大量分散的文献, 选择重要的部分, 以简炼的形式做成摘要, 并按一定的方法组织排列起来的检索工具。按照文摘的编写人, 可分为著者文摘和非著者文摘。著者文摘是指原文著者编写的文摘;而非著者文摘是指由专门的熟悉本专业的文摘人员编写而成。

3.1.4 索引型检索工具

索引型检索工具是根据一定的需要, 把特定范围内的某些重要文献中的有关款目或知识单元, 如书名、刊名、人名、地名、语词等, 按照一定的方法编排, 并指明出处, 为用户提供文献线索的一种检索工具。索引的类型是多种多样的, 在检索工具中, 常用的索引类型有:分类索引;主题索引;关键词索引;著者索引等[4]。

3.2 检索策略

检索策略的实质是对检索过程的科学规划。策略的好坏直接影响到检索的效率和结果的满意程度。检索策略包括:选着合适的数据库作为检索途径;选择适当的检索工具;构造能够确切表达信息要求的检索式。好的检索策略能够让检索获得好的查全率和查准率。一般情况下, 提高查全率的方法是降低检索词的专指度, 或增加同义词和近义词检索, 也可以适当降低限制条件。相反, 提高查准率的方法一般是提高检索词的专指度, 设定限制性条件。

3.3 检索方法

检索方法从使用手段上可分为手工检索、光盘检索、联机检索和网络检索。联机检索和网络检索是目前科研工作中最常用的检索方法, 其中又以文献检索为主。文献检索一般有常用法、追溯法和综合法。常用法是以文献发表时间为参数进行查阅, 包括顺查法、倒查法和选择某一特定时段的抽查法。追溯法是依据参考书目信息追查原文, 从而在主题明确的方向上扩大检索面的有效方法。综合法是常用法和追溯法的两者结合。

3.3.1 检索途径

检索途径分为两条, 一是从文献的外表特征进行检索, 如书名、著者、序号等, 二是从文献的内容特征进行检索, 如分类、主题、关键词、分类主题等。

3.3.2 布尔检索

布尔检索是利用布尔逻辑算符进行检索词或代码的逻辑组配, 是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种, 分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式, 计算机根据提问式与系统中的记录进行匹配, 当两者相符时则命中, 并自动输出该文献记录[5]。

例如以“有色金属”和“矿山”两个词的不同逻辑组配为例。 (1) “有色金属”AND“矿山”, 表示查找文献内容中既含有“有色金属”又含有“矿山”词的文献。 (2) “有色金属”OR“矿山”, 表示查找文献内容中含有“有色金属”或含有“矿山”以及两词都包含的文献。 (3) “有色金属”NOT“矿山”, 表示查找文献内容中含有“有色金属”而不含有“矿山”的那部分文献。检索中逻辑算符使用是最频繁的, 对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求, 除要掌握检索课题的相关因素外, 还应在布尔算符对检索结果的影响方面引起注意。另外, 对同一个布尔逻辑提问式来说, 不同的运算次序会有不同的检索结果。日常工作中布尔算符使用正确但不能达到应有检索效果的事情是很多的。

结语

随着网络和信息技术的发展, 信息资源已经越来越深刻地影响到人类社会的方方面面。信息资源对科研工作的作用是有目共睹的, 能否利用好信息资源将直接影响科研活动进程和产出的效率和质量。因此, 掌握信息检索的技能是现代科研人员必备的基本素质之一。

摘要:本文介绍了信息检索技术的发展及对科研工作的支撑作用。针对当前基于互联网的信息资源特征, 描述了科研工作中应用信息检索的策略和方法, 期望对从事科研工作的技术人员有所帮助。

关键词:信息,数据库,检索策略,方法

参考文献

[1]Christopher D.Manning, Prabhakar Raghavan, Hinrich Schutze.信息检索导论[M].北京:人民邮电出版社, 2010.

[2] (美) 詹姆斯.格雷克.信息简史[M].北京:人民邮电出版社, 2013.

[3]田质兵, 王志坚, 谈春梅.科技情报检索[M].北京:清华大学出版社, 2004.

[4]周爱武, 杨学东, 王云.内容检索技术在科技情报检索中的应用[J].安徽科技, 1998 (10) :38~39.

科技信息检索报告 篇3

关键词:Internet;查新检索;手工检索

查新检索工作是信息服务的一个重要组成部分,也是开发和利用信息资源的一种有效途径。查新检索不同于普通的信息检索。普通的信息检索只是用户在数据库中查找与某种情报有关的文献记录的过程。而查新检索则是从事查新工作专业人员以科技文献为依据,运用联机检索系统检索国内外及自建数据库或手工检索馆藏资料等手段索取文献,并运用综合分析和对比等手法,找出其技术创新点,给科研课题或成果一个公正的、客观的、科学的查新结论,从而避免重复研究,提高对科技成果评价的准确性。

一、Internet下的查新检索

随着因特网的迅速发展,网上信息资源如雨后春笋般涌现,由于它们具有更新快,检索方便,内容丰富,节省费用等优点,不少查新机构把网络资源作为查新过程中文献资源的重要补充。

1电子函件传递

电子函件传递是Internet的基本功能之一,主要用于信息交流。在电子函件服务站申请到电子通讯地址和电子信箱后,查新人员即可利用计算机和通讯网络传递多媒体信息,通过Internet进行电子函件的传递,直接向作者、编辑部或收藏单位索取原文,大大缩短了工作时间。

2数据库检索

据估计,Internet上的数据库总量大约有近万个。如此宏大的信息资源为查新工作提供了坚实的文献资源基础。通过数据库检索可扩大检索范围,满足查新需要。要使用数据库检索功能,只要有相应的帐号和口令,就能通过远程登录使用Internet网上对外开放的数据库资源。

3文件传输协议

通过文件传输服务,查新人员可以从服务中心订阅论文预印本的摘要或全文,掌握有关领域的研究动态或成果,从而解决了因检索刊物出版发行和数据库数据更新滞后,导致查新所需文献的时段空缺问题。另外,查新人员若想知道何处的文件传输协议服务器存有自己所要的信息资料,可利用检索工具ARCHIE,查新人员可通过关键词查找散布在世界各地的1000多个文件传输服务器上的信息资源,充分利用文件传输功能,有助于查新质量的提高。

4信息查新工具

为了帮助网上用户更方便地获取信息,Internet还提供了许多功能完善、使用方便的查阅工具,如考查访问服务站、广域信息服务站、环球网等。不仅方便、快捷、准确、价廉,而且有助于保证查新工作的质量。可以说,利用Internet查新将成为查新工作最现代化、最广泛的一种手段和途径。

二、Internet下的手工检索

国内外数据库都处在不断发展、完善时期,不同程度上存在与课题检索要求的年代差和更新周期时间差等问题。特别是国内数据库更是如此。因此,仅靠机检是不能完成课题检索要求的,还必须靠手工检索来弥补机检的空档,补充和完善课题的检索,只有将手工和机检有机地结合起来,才能确保课题查新的检索质量。

1手工检索缩短了数据库更新周期

手工检索虽然不像机检那么方便、快捷,但它是机检的必要补充,是不可缺少的查新检索手段。用户检索文件要求一般都在10年以上,而国内数据库建设都会因当时的特定环境和因素使数据库制作的起始年代受到限制。因此,要完成该项工作,就必须靠手工进行检索。所以说,手工检索是目前弥补和完善国内外数据库年代差和更新周期时间差的最好办法。

2手工检索弥补了数据库遗漏现象

在检索课题中,常会碰到因我们检索的数据库收录文献量有限,特别是专业文献收录不全,组配的主题词输入后显示为零。遇到这种情况,也要靠手工检索书本式各类相关文件进行补充检索。我们在检索课题中,都要根据该课题的内容要求进行书本式专业文摘的检索,起到对专业文献的弥补遗漏作用。

3手工检索填充了数据文摘的空档

国内数据库大都没有文摘,从文摘的提示内容中往往难以得出准确的判断,仍需打印题目后,再提原始文件进行鉴别。实践证明,手工检索与课题相关的专业及综合性文摘,是非常必要的。

4手工检索扩展了文献信息量

科技情报检索实习报告题目 篇4

1.基于FPGA的多路数据采集与处理系统设计 低功耗CMOS运算放大器设计

2.TMS5402 DSP 引导方式研究

基于ADSP的音频信号实时控制

3.基于凌阳单片机的交通灯系统

基于凌阳单片机的台球模拟击球系统

4.误差扩散法在图象二值化表示中的应用

SIP协议机制与H.323协议的比较研究

5.二值算术编码器及其在图象压缩编码中应用的原理探讨 基于软件无线电技术和DSP开发平台的模拟调频的实现

6.基于电话用户线的接入网技术的探讨

计算机课程在线考试系统

7.bbs 论坛的设计

在线网上购物系统

8.在线分类聊天室

库存商品的编码及定位

9.GSM手机定位TOA与E-OTD算法的研究

刘氏高强度公开加密算法的研究

10.计算机网络仿真软件的分析和研究

彩色图象小波变换域的统计分析与编码算法性能改进

11.基于变换域自适应滤波的去方块算法分析与实现 P-SPIHT算法的分析与实现

12.医学CT断面图像的三维重建算法实现

基于RTP/RTCP协议的视频序列图象传输

13.Snake 边缘检测算法在医学图像处理中的研究 流媒体创作系统界面设计

14.FFT/DCT变换的图像压缩设计

Turbo码的Log-MAP译码算法的MATLAB实现

15.基于高阶累积量的盲波束形成算法

基于JAVA的卷积码编、译码演示系统

16.基于JAVA的网上视、音收视收听系统

量子图像处理技术

17.基于小波变换的数字水印技术

图像中特殊边界的检测方法

18.荧光磁粉图像的动态阈值分割算法

同步CDMA中的分组盲线性混合检测器

19.有线远程数据采集

移动IP技术及其应用

20.接入网资源管理信息系统

移动通信中通信定位业务的研究

21.基于Web的光接入网网管解决方案

第三代移动通信IMT-2000及发送和接收技术

22.扩频通信W-CDMA中同步技术的研究

移动通信中的交换接续技术的模拟

23.DS-CDMA移动通信系统的多速率传输技术

室内移动通信覆盖研究

24.CDMA系统导频分配的设计

智能天线在GSM移动系统中应用的探讨

25.波分复用在本地网和城域网中的应用

SYBASE数据库加密方法的研究

26.第三代移动通信系统中切换的研究与设计GSM网络频率规划与优化

27.网络通信与安全问题研究

DCME中传真解调时均衡的自适应算法及实现

28.基于ATM的话音业务

CDMA多用户检测技术的研究

29.纠错编码在移动通信中的应用与研究

移动通信系统中无线分集技术

30.多载波码分多址信号包络特性分析

DSP技术及其在电信网中的应用

31.CDMA系统中的智能天线技术

阴影对移动卫星通信信道的影响

32.基于CDMA技术的高速无线Modem方案研究

移动通信电磁波穿透损耗

33.移动通信中的电磁兼容

GSM无线基站系统的设计与测试

34.无线扩频传输中和数据接入通信终端的研究

微峰窝移动通信干扰性能分析

35.基于ASP的Web数据库的开发及应用

卫星数据网监控系统

36.图像压缩中小波变换的应用

FTP远程数据传输软件

37.小波变换及其在信号分析中的应用

图像信号在互联网上的传输

38.GSM网络优化解决方案

39.基于路由控制的动态IP分配的研究

40.Internet上话费查询系统的开发

41.小容量数字微波通信网管子系统实现

42.窄带CDMA无线网络的规划

科技信息检索报告 篇5

2006年招收硕士研究生考试试题

考试科目:科技文献检索

(总计150分)

一、填空(每空1分,共20分,请将答案写在答卷上)

1.印刷版科技文献的主要类型包括、、、等。

2.科技文献的载体主要有、、、等。

3.请列举四种索引语言、、、。

4.请列举四种国际著名的专业性科技文献检索工具、、、。

5.请列举四种互联网上的主要搜索引擎、、、。

二、名词解释(每题3分,共30分)

1.图书分类法6.EI

2.文献数据库7.SDI

3.灰色文献8.PDF

4.附注索引9.OCLC

5.跨库检索10.CNKIGoogleScholar

三、简答题(每题8分,共40分)

1.科技文献有哪些主要社会功能?

2.什么是参照,有哪些主要参照方法?

3.科技报告有哪些特点,国际最重要的科技报告检索工具是什么?

4.常用的关键词所印有哪些类型?

5.计算机检索有哪些主要技术方法?

四、论述题(每题15分,共60分)

1.简述美国化学文摘(CA)的特色及其主要辅助索引体系。

2.简述计算机检索的主要发展历程。

3.谈谈国内外全文数据库建设的发展现状及其对信息服务的影响。

信息检索实验报告 篇6

实验一

图书检索

1.自命题,利用不同检索途径查出本馆不同学科的图书四种,写出检索过程,记录书名、责任者、索取号和借阅状态。

1)

数据库名称:华中师范大学馆藏书刊检索

检索途径:出版社 检索词:中国邮电出版社

书名:Visual C++开发基于SNMP的网络管理软件 责任者:武孟军, 徐垅屸龑, 任相臣 索取号:TP393.07/1313 借阅状态:在馆

2)

数据库名称:华中师范大学馆藏书刊检索

检索途径:任意词

检索词:自然遗产

书名:世界自然与文化遗产 责任者:郭万平

索取号:K917/0711 借阅状态:在馆

3)

数据库名称:华中师范大学馆藏书刊检索

检索途径:主题词

检索词:数字图像处理

书名:数字图像处理实训教程

责任者:何金国

索取号:TN911.73/2186 借阅状态:在馆

4)

数据库名称:华中师范大学馆藏书刊检索

检索途径:任意词

检索词:青春 书名:说走就走的青春: 每一场旅行都是直抵内心的探险

责任者:汪晓敏

索取号:I267.4/3168 借阅状态:借出

2.查出校外图书馆不同学科图书两种,写出检索过程,记录书名、责任者、出

版者、出版时间。

1)

数据库名称:华中科技大学图书馆

检索途径:关键词

检索词:cocos2d

书名:Cocos2D应用开发实践指南

责任者:斯特劳戈(Strougo, Rod)著

温德里奇(Wenderlich, Ray)著

出版者:北京 : 机械工业出版社 出版时间:2013

2)

数据库名称:馆藏书刊检索

检索途径:关键词

检索词:会计

书名:财经法规与会计职业道德

责任者:会计从业资格考试研究中心 编

出版者:北京 : 地震出版社 出版时间:2014

3.利用图书联合目录查出图书两种,写出检索过程,记录书名、责任者、出版者、2-3个不同地区的馆藏情况。

1)

数据库名称:CALIS联合目录

检索途径: 书名 检索词:马克思

书名:马克思主义哲学

责任者:刘进田 主编;张鸿骊 主编;刘进田...[等] 撰稿;出版者:西安 : 陕西人民出版社

馆藏情况:纸本馆藏:西安建筑科技大学 西京学院

电子馆藏 :无该书电子馆藏信息

2)

数据库名称:CALIS联合目录

检索途径:主题词 检索词:linux 书名:Linux系统管理

责任者:吴绍炜 编著

出版者:北京 : 人民邮电出版社 馆藏情况:纸本馆藏

华中农业大学 武汉大学 湖北工程学院 武汉纺织大学 武汉生物工程学院 武汉东湖学院 中南财经政法大学 电子馆藏 :无该书电子馆藏信息

长江大学

4.自命题,查出两种电子图书,写出检索过程,记录书名、责任者、出版者。命题:会计

1)数据库名称:武汉大学图书馆电子数据库

检索途径: 主题词 检索词: 会计 书名: 会计学原理 责任者:夏益红

出版者:北京工业大学出版社

命题:c++ 2)

数据库名称:华中科技大学图书馆电子数据库

科技信息检索报告 篇7

1 Web信息检索概述

信息检索的种类及概念:

信息检索分为四种:有情报检索、文献检索、数据检索和事实检索。情报检索 (Information Retrieval) 是指将情报 (信息) 按一定方式组织和存贮起来, 并针对用户的需求找出所需要的情报 (信息) 的过程。它又称为“情报存贮与检索” (Information Storage and Retrieval) ;文献检索 (Document Retrieval) 是以文献为检索对象, 从已存贮的文献库中查找出特定文献的过程;数据检索 (Data Retrieval) 是以数据为检索对象, 从已收藏数据资料中查找出特定数据的过程;事实检索 (Fact Retrieval) 即通过对存贮的文献中已有的基本事实, 或对数据进行处理 (逻辑推理) 后得出新的 (即未直接存入或所藏文献中没有的) 事实过程。

2 Web信息检索技术的不足之处

2.1 信息查准率低

很多用户都有这样的苦恼, 就是在搜索引擎的过程当中, 想要输入一个词汇表达一个意思, 但是却出来了成千上万个字相同但是与所输入词汇意思相差不大的网页, 令用户找起来很不方便, 这种选择的范围太广, 导致通常找不到正确的结果, 很多网页与检索的要求的关系很小或者是毫不相关的。这个时候需要一些人工的标引加以处理, 比如说雅虎的人工标引, 查准率比较高, 有些搜索引擎都是采用的自由词机器来自动电脑标引的, 自然效果就不好。然后有了人工标引, 也还是会有一些查准率低的状况, 原因是管理上面不够, 导致查准率也不高。

2.2 数据更新缓慢

现在的信息检索技术很发达, 但是数据更新方面还是有些缓慢。有些过时了的信息还不能及时的删除, 造成信息冗杂, 长期堆积在那里, 造成用户搜索时网页过于繁多又无用, 导致了搜索引擎整体的质量下滑。在这个信息社会, 每天都有成千上万个垃圾信息的产生以及成千上万个新信息的出现, 如果搜索引擎没有及时的整理这些数据、更新这些数据, 那么就会形成许许多多的无效地址和错误的链接, 对搜索引擎的质量造成威胁。

2.3 信息分类不规范

几乎每个搜索引擎均对网点信息按主题建立了分类目录, 但是由于没有一个统一的控制词表, 也未参照任何现行通用的图书信息组织的标准工具, 而是完全由各搜索引擎开发商自行编制, 所以搜索引擎的分类目录差别较大, 而且都存在。类目粗糙、涵盖面窄、划分标准模糊、设置不合理等问题层出不穷。

3 如何解决Web信息检索技术的不足

3.1 实行汉语分词技术

关键词查询的最先步骤是将查询语句分解成若干关键词, 同时对于检索的文档而言也是如此。对英文而言, 一个单词就是一个词, 词与词之间存在空格作为界定符。然而中文就没这么简单, 在汉语中词与词之间没有界定符, 只能人为进行切分。另外, 汉语中存在词的歧义现象, 对一个短句进行分词可能导致多种表达结果, 非智能分词很容易改变查询用户的真正查询要求, 譬如, 查询的条件为“南极企鹅”, 如果不能够准确智能的分词, 同时按“南极”、“企鹅”、“南极企鹅”等3个关键词去搜索, 这样搜索结果的质量将肯定存在问题。因此, 必须根据语词知识库进行总结和归纳, 总结每个词的出现频率以及词之间的关联信息, 就可以从一定程度上减少各种歧义的产生, 提高分词的准确度, 从而准确地表述查询用户的查询请求和文档信息。

3.2 实行同义词技术

实行同义词技术是指两个相同涵义的词, 用户在搜一个词的同时, 计算机没有显示出其同义词, 这样就降低了搜索引擎的查全率, 信息技术公司在提升技术的时候, 应该注意加入同义词的引入, 在客户搜索的时候, 就可以看见这类关键词的其他同义词汇, 增加作者的知识面, 可以搜集到很多有价值的信息, 计算机搜索引擎能够查找到很多与这个关键词所能够联想到的其他意思相近的词, 增加搜索的效率和质量。

3.3 加大数据更新频率

针对不足中提出的数据更新频率不高, 在日常管理当中, 就要加大对于数据更新的重视。经常对过时的信息进行即使删除, 对于旧的、重复的信息和一些无效的地址以及错误的链接进行处理, 使整体的检索的质量得到提升, 大量的网页和网站的变动也能够合理的进行处理, 这样才能够使信息检索技术真正成为一种行之有效的信息搜索技术, 并日益完善和壮大。

Web信息检索技术对于人们和信息之间的距离越来越小, 日益方便着人们生活质量的提高和改善。本文首先通过对信息检索的种类进行了概括, 包括情报检索、文献检索、数据检索和事实检索, 其次说明了信息检索技术的不足之处, 包括查准率不高、数据更新缓慢、信息分类不规范等等, 最后针对不足提出了解决这些问题的思考和建议, 包括实行汉语分词技术、实行同义词技术和加大更新频率。技术在不断的完善, 通过上述的思考建议, 信息检索技术会更加向着人性化、专业化、科学化发展, 为用户提供一流便捷的搜索信息服务, 日益改善着人们的工作和生活。

摘要:在21世纪的信息时代, 信息检索成为了社会各个行业工作当中必备的一部分。有了信息检索技术, 使得信息和人的距离通过网络大大拉近了, 对人们的工作、生活和学习帮助非常大。通过对信息检索技术进行一些概念上的阐述, 概括出现今检索技术存在的不足之处, 包括查准率不高、数据更新缓慢、信息分类不规范等等, 针对不足提出解决这些问题的思考和建议, 比如实行汉语分词技术、实行同义词技术和加大更新频率等, 使得信息检索更加人性化, 更加完善。

关键词:信息检索技术,搜索引擎,数据

参考文献

[1]黄如花.网上电子期刊的利用[J].图书情报工作, 2001 (12) .

[2]陈光祚, 夏立新.我国网络图书现状分析与发展对策研究[J].中国图书馆学报, 2002 (2) .

[3]李家清.开发利用网络信息资源的对策研究[J].图书情报知识, 2001 (1) .

[4]司莉.因特网上的图书馆虚拟文库建设[J].图书情报知识, 1999 (1) .

科技信息检索报告 篇8

系列讲座五月九日开课

图书馆咨询室

从五月八日起我馆将在雁塔校区图书馆三层“科技文献检索室”为理科学生开设《科技文献信息检索与利用》(印刷版和网络版)系列讲座开课,这是根据国家教育部高-字(84)004号文件《关于在高等学校开设〈文献检索与利用〉课程的通知》精神,专为理科学生开设的讲座,旨在培养学生的自学能力,获取信息的能力,研究能力、创造能力和动手能力,具有积极的作用。学生可以根据自己的专业选择有关部分学习,《科技文献信息检索与利用》讲座课分两个层面,一是文献信息资源检索和利用的途径与方法介绍,二是实践指导,这门课程重在实际的资讯查找,重于方法和技能训练,更注重应用能力的培养。我们希望学生能安排好自己的时间参加这个讲座的学习。为了便于学生了解这门课程,我门将主讲教师和授课目录公布出来,请学生们选择。

主讲教师及课程简介:

《科技文献信息检索与利用》课程主讲:张

凡,在图书馆“科技文献检索室”从事科技文献检索读者服务十余年,具有较深的理论根底和多年开设专题讲座的实践经验,在为读者服务的过程中深受读者的欢迎和尊重。

美国《科学引文索引》(Science Citation Index简称SCI)创刊于1961年,由美国费城科学情报研究所编辑出版,SCI收录了世界40多个国家的多种出版物,其中有大约3500多种科学技术类核心期刊,还有会议录、论文集、图书、科技报告及专利文献等。SCI是一部综合性的索引刊物,它收录的文献涉及数学、物理、化学、农业、医学、生物学、环境学、工程技术及行为科学等多种学科。

美国《化学文摘》(Chemical Abstracts, 简称CA)1907年创刊,有美国化学学会化学文摘服务社(Chemical Abstracts of the American Chemical Society简称CAS)编辑出版。CA摘录的文献范围广泛,不仅报道化学化工方面的文献,还涉及到物理、冶金、能源、生物医学、轻工等方面的文献,还收录了150多个国家和地区、56种文字出版的约14000种化学化工期刊以及科技报告、会议录、学位论文、新书、综述及28个国家和地区的专利文献。CA具有报道迅速(一般的报道时差在3—4月),报道准确的特点。此外还具有完善的辅助索引体系,具备多种检索途径,是目前时间上最完善的索引工具之一。

英国《科学文摘》(Science Abstracts,简称SA)创刊于1898年现在由英国电气工程师学会(The Institute of Engineers,简称IEE)、英国计算机协会(The British Computer Society)和物理学会(The Institute of Physics)联合出版IEE下设“国际物理与工程情报服务部”(International Information Services for the Physics and Engineering Communities,简称INSPEC),负责收集、整理、编辑。收录了世界各国的多种期刊论文、技术报告、会议文献、图书、学位论文以及美英两国的专利说明书(1977年以后不收录专利)其中,每年摘录的期刊约有4200种,会议1000多种。

美国《工程索引》(The Engineering Index,简称EI)是世界上著名的,大型的综合性工程技术类的检索工具,它创刊于1884年至今已有122年的历史。它名为索引实为文摘性检索工具,它附有一两百字的指示性文摘,指明文章的目的、方法、结果和应用等方面的情况,不涉及具体的技术细节。文摘条目按其内容分别编排在有关标题词下,标题词按字母顺序排列,《工程索引》报导的文献是经过有关专家精选的,具有较高的参考价值,是世界各国工程技术人员、研究人员经常使用的最主要的检索工具。

印刷版有Ei月刊Ei年刊两种,《工程索引月刊》(The Engineering Index Monthly)创刊于1962年,由美国科学基金会(NSF)资助每月出版一期,报道时差为6—8周,适于查找最新出版的文献资料。《工程索引年刊》(The Engineering Index Annual)年刊虽然出版周期较长,但检索较月刊方便的多,年刊便于回溯性检索。

美国《生物学文摘》(Biological Abstract简称BA)创刊于1926年由美国生物科学信息服务社(BIOSIS)编辑出版。BA现在 半月刊,每月1日和15日出版,全年出版24期。BA摘录报道的范围包括100多个国家和地区的出版机构以20多种文字出版的近万种连续性出版物上的文献。可以概括为以下几个方面:有关生物科学、生物医学和农业科学的理论;有关实验室、临床、野外及现场的原始材料;有关生物学研究的新材料、新方法和新技术;生物科学研究中的主要成果和结论以及对这些成果和结论的解释和评论;有关生物学、医学和农业科学的情报理论和方法;新发现的种属名称、分布情况及新名词的定义。

美国《数学评论》(Mathematical Reviews,简称MR)创刊于1940年,起初由美国数学学会和美国数学协会联合主办,后由美国数学会编辑出版,现在MR有美国、俄罗斯、英国、法国、德国、日本、印度、中国、意大利、波兰、荷兰等多个国家的很多数学组织联合主办。目前MR是世界上最具权威性的数学及相关学科的专业检索工具。MR主要收录期刊论文,此外还收录图书、会议文献等,主题范围包括纯粹数学和应用数学,也包括物理学、运筹学、工程技术、计算机科学和其他学科中包含的数学文献。MR主要收录英文文献将其他文种译为英文。在非英文文献中,特别重视俄文文献的报道,被译成英文的杂志中俄文占百分之九十,其余的则大部分是中文。

MR对世界2400余种连续出版物及图书中的文献进行评论。其中400余种和丰富的实践经验。

数学核心期刊全部收录,而另外1700余重期刊及图书、会议文献等是有选择地进行摘录和评论。为保证质量MR选聘世界各地的数学家提供评论,重点为理论数学,应用数学方面的引文率很高的文献则一般以传统的摘要形式出现。

讲座地点:雁塔校区图书馆三层南侧“科技文献检索室”

本学期《科技文献信息检索与利用》专题讲座课程安排

5月9日

第一讲

科技文献检索基础知识及综合类检索工具介绍

5月23日

第二讲

美国《化学文摘》及其检索方法

6月6日

第三讲

美国《生物学文摘》及生物学文献检索

6月20日

第四讲

《信息检索》课实践考核报告 篇9

一、内容要求:

1、根据自己的学习及工作实践需求自拟一至两个研究性课题;

2、完成对课题的检索需求分析,明确检索五要素;说明检索课题的主题、包括的子问题、涉及的学科领域、检索需求的基本定位、时间范围、地域范围、文献类型、检索目标等;

3、合理选定本研究性课题所有的检索用词,构架检索策略(包括整体的构思、扩检/缩检的策划、引文珠式的应用等);

4、说明本课题检索信息源、检索途径的选择思路(建议中外文相结合、综合应用多途径检索,必须包括CNKI);

5、课题检索实操过程的简要总结说明(建议抓取关键的操作界面,粘贴在文档的相关位置);

6、对本研究性课题的检索做出评价。

二、形式要求:

1、本实践考核应在本课程教学内容完成后,课外集中在四小时之内完成,在闭卷笔试时一并提交;

2、检索方案及实操报告应以打印稿提交(A4纸张,页面设置为上下左右边距均为2,正文字号为宋体5号)。

(提交文档格式附下页)

研究性课题题目:

一、检索方案:

信息检索实习报告(共) 篇10

专业班级

指导老师

完成日期

2010.04.14

成绩

福建工程学院科技文献检索教研室

2010-2011第一学期公选课作业

一、检索准备: 输变电设备防污措施

The measure of prevent the electric power transmission equipment from polluting 检索词分析: 关键词:输变电设备防污;主题:防污措施

定义或概念分析: 输变电设备外绝缘电气性能,除了应满足最高工作电压绝缘要求外,还应具有耐受各种自然环境的污染和侵袭而保证安全运行的能力。随着城乡工业的快速发展,大气中化学及综合污染不断加重,使电力系统输变电设备深受其害,电瓷外绝缘污闪事故亦有增加趋势,严重影响了电网的安全运行及供电可靠性。提高电网设备抗污闪能力,即是输变电设备防污。

检索式: 输变电设备*防污措施 课题所属中图分类法:

二、核心检索系统:

数据库: 中国期刊全文数据库 年限:2000到2011 检出篇数:17 限定类目主题为输变电设备*防污措施 检索式:输变电设备and防污措施 题录(按文献标准著录格式著录)

曾立新

简析输变电设备防污措施

企业研究

2010/20 赵强

输变电设备防污措施简析

四川电力技术

2003/06 郑伟

输变电设备防污闪措施比较和分析

电气应用

2010/05

三、参考文献或相似文献回溯

提供5条文献,按文献标准著录格式著录

[1] 韩子龙.不可忽视绝缘子脏污[J].农村电工 , 1998,(11)

[2] R.Sundararajan!美, N.R.Sadhureddy!美, R.S.Gorur!美, 刘国成.在污秽状态下瓷绝缘子的计算机辅助设计[J].绝缘材料通讯 , 1997,(04)

[3] 贾逸梅,史惠萍.绝缘子的覆冰及覆冰绝缘子的放电特性[J].广西电力技术 , 1995,(03)[4] 邱卫东.加强对绝缘子的检修和维护[J].农村电工 , 2005,(05)[5] 李小建.不同绝缘子绝缘性能的对比试验[J].云南电业 , 2005,(04)

四、电气专业重要网址

网址及该网址的简要介绍(3-5个)1.网址:http:///)检出篇数:13 检索年限:2000到2011 检索词:输变电设备防污措施 题录2条:

1.赵强 四川电力技术

宜宾电业局,四川宜宾,644002 2.(2)白雪莲

杨玲

浅谈输变电设备的防污闪措施

中国电子商务

重庆市南川区供电有限责任公司,408400

九、网络搜索引擎

数据库:万方数据库 年限:1990-2011 检出篇数:23 检索词(式):输变电设备防污措施 题录2条

(1)罗彦宏

刘超 王援军

李有利

陕西电力

输变电设备绝缘子防污闪措施探讨

宝鸡供电局,陕西,宝鸡721004(2)白雪莲

杨玲

浅谈输变电设备的防污闪措施

中国电子商务

十、信息评述

本课题国内外研究现状及评述(课题界定及价值、研究现状、有待解决的问题、课题研究专家、相关成果社会评价)

答:1.随着城乡工业的快速发展,大气中化学及综合污染不断加重,使电力系统输变电设备深受其害,电瓷外绝缘污闪事故亦有增加趋势,严重影响了电网的安全运行及供电可靠性。提高电网设备抗污闪能力,已成为电力行业的一项重要工作。

2.变电站设备加装硅橡胶伞裙是一种既有效又经济的防污闪、防雨闪辅助补救措施,硅橡胶伞裙能增加电瓷设备的爬电距离,有效地阻断电瓷设备上流淌的污水,硅橡胶良好的憎水性能抑制瓷件表面的泄漏电流,表面电弧不易发展。总的爬电距离增加,其污闪电压得到一定程度提高。

3.河北省南部电网2001年2月发生大面积污闪跳闸事故,经济损失巨大,事故教训极其深刻。既有环境大气污染严重、长时间浓雾恶劣气象条件的客观原因,也有各种防污闪技术措施落实不得力的管理原因。

信息检索与搜索引擎课程报告 篇11

期末考试报告

学 期:2016-2017学年第一学期

任课教师:毛存礼 专业年级: 计科133 学 号:201310405339、201310405326、201310405330、201310405325 学生姓名:李然、毛子铭、张倩、黄枫

目录

一、系统概述................................................................................................................................3

二、系统需求分析........................................................................................................................3 2.1功能需求分析....................................................................................................................3

三、程序实现................................................................................................................................4 3.1 爬虫的实现.......................................................................................................................4 3.1.1 对网页进行分析...................................................................................................4 3.1.2编写爬虫................................................................................................................5 3.2索引的实现........................................................................................................................7 3.2.1分词的实现............................................................................................................7 3.2.2索引的建立............................................................................................................8 3.2.3检索索引................................................................................................................9 3.3向量空间模型的实现......................................................................................................10 3.3.1向量空间模型概述..............................................................................................10 3.3.2建立向量空间模型..............................................................................................11 3.4利用Lucene打分机制对文档打分................................................................................13

四、测试......................................................................................................................................14

五、心得体会..............................................................................................................................17

一、系统概述

随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。

用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。本系统基于HTMLUNIT框架,构建爬虫,基于LUCENE框架,构建索引,利用向量空间模型向量化表示文档间的相关性,利用LUCENE给相关文档打分。

二、系统需求分析

2.1功能需求分析

该系统分为四个功能模块:

(1)爬虫模块(2)索引模块(3)向量化表示模块(4)打分模块 具体实现分工如下:

①爬虫模块:该模块采用Htmlunit框架,主要负责爬取网页内容,在本地建立文档库,以便于索引功能模块,将文档库里的文档内容建立成索引。(毛子铭所做)

②索引模块:该模块采用Lucene框架,功能分为两块:一是建立索引,将爬取的内容建立成索引。二是检索索引,即提供给用户检索索引。(张倩所做)

③向量化表示模块:该模块采用向量空间模型,其功能是将查询文本和文档向量化表示,以一种直观的表示方法,展示出文档间的相似度。(李然、黄枫合做)

④打分模块:该模块采用Lucene打分系统,计算查询文本和文档的相似度,并对其文档打分。(李然、黄枫合做)

三、程序实现

3.1 爬虫的实现

3.1.1 对网页进行分析

(1)我们首先,对网页进行分析,昆工新闻上每一则新闻,都有相应的链接,通过点击链接查看相应的新闻。

<1>昆工新闻网页截图

<2>新闻内容截图

(2)在浏览器中,查看新闻网的代码,确定我们所需要的内容并用XPATH表达式定位其内容。

<3>新闻代码截图

3.1.2编写爬虫

(1)在这里,我们使用了HtmlUnit作为我们爬虫的框架,并指定内容,对昆工新闻网进行爬取。

<4> 部分代码展示

(2)编写XPATH表达式,定位所抓取的内容,在爬取过程中,首先要找到新闻的标题,然后,再模拟点击标题的动作,进入新闻页面。

(3)爬取内容,并将其写入文本文档中。

<5> 写入文档

<6>爬取内容

3.2索引的实现

3.2.1分词的实现

(1)在建立索引之前,分词是必不可少的步骤,我们所采用的是基于Lucene框架的IK分词技术分词。

<7> 部分代码展示

(2)对爬取的内容,进行分词测试。

<9>测试

3.2.2索引的建立

(1)索引的建立,我们也是基于Lucene框架建立的倒排索引,分词技术的不同索引的差别也是很大,因此,分词技术的选取一定要合理。

<10> 部分代码展示

3.2.3检索索引

(1)在这里,我们对爬取好的内容,已经建立好了索引,我们分别测试了“宇宙”、“人民”这两关键词进行检索。可以看见,符合“人民”这个关键词的文档有2个,符合“宇宙”这个关键词的文档不存在。

<12> 索引

<13> 索引结果

3.3向量空间模型的实现

3.3.1向量空间模型概述

向量空间模型将文档映射为一个特征向量V(d)=(t1,ω1(d);„;tn, ωn(d)),其中ti(i=1,2, „,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值, 一般被定义为ti在d中出现频率tfi(d)的函数,即。

在信息检索中常用的词条权值计算方法为 TF-IDF 函数,其中N为所有文档的数目,ni为含有词条ti的文档数目。TF-IDF公式有很多变种,下面是一个常用的TF-IDF公式:

根据TF-IDF公式,文档集中包含某一词条的文档越多,说明它区分文档类别属性的能力越低,其权值越小;另一方面,某一文档中某一词条出现的频率越高,说明它区分文档内容属性的能力越强,其权值越大。两文档之间的相似度可以用其对应的向量之间的夹角余弦来表示,即文档di,dj的相似度可以表示为:

进行查询的过程中,先将查询条件Q进行向量化,主要依据布尔模型:当ti在查询条件Q中时,将对应的第i坐标置为1,否则置为0,即:

从而文档d与查询Q的相似度为:

根据文档之间的相似度,结合机器学习的一些算法如神经网络算法,K-近邻算法和贝叶斯分类算法等,可以将文档集分类划分为一些小的文档子集。

在查询过程中,可以计算出每个文档与查询的相似度,进而可以根据相似度的大小,将查询的结果进行排序。

向量空间模型可以实现文档的自动分类和对查询结果的相似度排序,能够有效提高检索效率;它的缺点是相似度的计算量大,当有新文档加入时,则必须重新计算词的权值。

3.3.2建立向量空间模型

(1)将文档的前十五个关键字作为key并将文件的内容作为value存Treemap中

<14> 部分代码展示

(2)求两个词项的并集

<15> 部分代码展示

(3)求两个词项的交集

<15> 部分代码展示

(4)计算文章相似度

<16> 部分代码展示

(5)计算公式:

3.4利用Lucene打分机制对文档打分

(1)在这里,我们是基于Lucene框架,利用其自带打分系统,对查询文本和文档计算它们的相似度,再进行打分。

Lucene打分公式如下:

(2)计算查询文本(TermQuery)与文档的相似度进行打分。

(3)在查找“人民”这两个关键词后出现两个相关文档,它们分别的得分为0.47782254和0.3901917,这说明第一个文档更符合查询

<17> 打分

四、测试

<18> 测试截图1

<19> 测试截图2

<20> 测试截图3

<21> 测试截图4

<22> 测试截图5

<23> 测试截图6

<24> 测试截图7

<25> 测试截图8

<26> 测试截图9

五、心得体会

此次报告要求实现第一个信息检索系统,涉及到多线程编程、排序、网络爬虫等多项技术。多线程是提高效率的一个非常重要的途径,比如计算机并行计算等,本次实验完成了多线程的任务,对网络间通信以及搜索引擎如何实现向海量用户在很短时间内提供服务有了更深刻的认识。通过实验我也认识到了多线程编程的边缘。在下一步的研究学习之中有很大助力。

在此基础之上建立检索,通过对于索引的检索,一方面可以加深对于索引的深层认识,另一方面又可以是我们运用知识与学习知识相结合,可以使我们学的更好,运用的有理可循。

上一篇:三年级一班中队工作总结下一篇:苏州园林 情境教学设计