档案信息检索

2024-10-13

档案信息检索(精选8篇)

档案信息检索 篇1

当20世纪的尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》》(Being Digital)一书中,向人们描述着数字时代对我们生活方式、工作方式以及思维方式带来的各种冲击时,人类文明已经真实地迈进了21世纪,数字化信息时代的大潮朝着我们扑面而来。人类社会开始步入网络化信息时代,信息也因此成了信息社会高速运转必不可少的重要因素。信息社会的发展没有充沛流畅的信息就无从谈起,而随着信息社会的不断发展,人类社会对档案信息的需求自然也与日俱增,进而使作为档案信息获取与利用之间重要联系桥梁的档案检索工作发生了深刻变化。档案检索工作的水平已成为衡量档案工作现代化水平的重要标志之一,自动化、数字化、网络化逐渐成为信息时代档案检索工作的发展方向,同时也成为社会发展的必然趋势。

一、信息时代档案检索工作面临的新挑战

1. 亟须转变陈旧的档案信息存储观念。

随着信息技术、办公自动化技术和网络技术的广泛应用,档案信息将不再仅以纸张为主要存在形式,档案信息的存储将越来越向数字化与电子化发展。机读文件和机读档案大量出现,使档案信息的存储以数据库为主,档案信息的传递也以数字流的形式进行。因此,传统的档案信息检索和存储观念必须更新,要尽快充分利用计算机、扫描仪等现有技术和设备将馆藏档案信息数字化,建成各种专业性、综合性档案信息库,从而有利于档案检索工作的进行。

2. 落后的信息检索技术手段有待更新。

传统的信息服务手段主要利用目录、索引、文摘等检索工具,操作技术落后,服务质量不高,对档案信息资源只能做简单的加工处理,与现代档案信息检索手段相比,整体服务水平是浅层次的。而信息时代的档案信息服务要求网络化,信息高速公路要将单个档案馆与世界各地的档案馆、图书馆、情报中心、公共查询系统与信息用户的计算机系统连接起来,即实现信息的共享。信息共享是档案检索工作要实现的一个目标,也是档案部门向社会提供利用的目标之一。当然,这里所说的信息共享决不是针对所有的档案信息,有些档案信息是不能公开的,是要求保密的,在此应特别指出。

3. 档案工作人员素质需进一步提高。

提高档案信息服务水平和质量的关键在于有一支熟悉档案业务并精通计算机、网络技术,能进行软件系统维护的档案专业人才队伍。现有人才队伍素质参差不齐,从事和开展档案信息咨询、网络检索、信息分析、市场调研的高素质档案信息服务的人员缺乏,势必影响档案信息开发与服务的质量与水平。

4. 档案检索工作需要尽快建立标准化体系。

《中华人民共和国标准化管理条例》指出:“标准化是组织现代化生产的重要手段,是科学管理的重要组成部分。在社会主义建设中推行标准化,是国家的一项重要技术经济政策。”这充分阐明了标准化的地位和作用。目前,档案检索工作还未达到完全的网络化、电子化,各种检索方式不尽相同,因此在档案检索工作的建设和不断完善中,标准化规范体系的建立势在必行。可以说,这是信息时代档案检索工作现代化取得高质量成果的必要条件和坚实基础。

5. 档案保密和档案安全受到挑战。

网络环境下,影响档案保密和档案安全的主要因素:一是人为因素,档案部门档案安全意识和保密意识不强,往往会在自己的档案网页上发布信息,对发布的信息缺少严格的审查和管理;二是技术问题,当前电脑病毒横行,加上黑客的恶意攻击,使得档案信息的安全和保密受到威胁,这必须引起我们的高度重视。档案检索工作在这方面要首先做好相关链接工作,以保证档案信息的保密与安全。

二、信息时代档案检索工作的重要意义和作用

我们之所以重视档案检索工作说到底是为了更好地做好档案工作,进而更好地向社会提供利用。由于信息时代和知识经济时代的到来,知识和信息已成为经济发展的首要资源,而且这引起了全球经济增长模式和发展观念的变化。这对信息管理属性日益增强的档案部门无论在管理上,还是服务上无疑都提出了巨大的影响和挑战。传统服务方式已经不能适应新的档案事业的发展要求。面对数量骤增的档案信息及不同的档案信息服务对象,档案检索工作如何才能更快、更有效地提供服务,事关档案部门提供利用的质量。

当前,档案渐渐由静态向动态转变,成为信息资源的重要载体之一。档案信息是信息最原始的形态,在日常考查、借鉴、决策、科学研究和技术成果应用等方面都起着不可替代的作用。而作为“海里捞针、沙里淘金”的手段,档案检索工作所拥有的现实意义自然不可同日而语。其具体表现如下:

1. 档案检索工作是档案部门向社会提供服务的开门钥匙。信息时代,网络化、数字化的档案检索系统的开发利用,可以塑造良好而鲜明的档案馆形象。档案部门形象是社会公众对档案工作的总体评价和认定,是档案文化的综合体现和外在反映。一般来讲,档案部门应具有:一是能够为社会公众提供档案信息支持的良好的社会形象,这是社会信息化过程中档案部门应具备的形象;二是高效、舒适、健康、优美的阅档氛围,以及敬业爱岗、热情待人的良好的服务形象;三是以知识管理为手段,合理地组织与开展经营活动的管理形象;四是坚持共同的档案价值观的良好群体形象。

2. 在全球信息化浪潮推动下,档案工作呼唤新的信息服务模式——全方位、多层次、网络化服务,提供面向档案利用者的档案检索服务,形成对全社会开放利用的服务平台。在不断完善和开发档案检索系统的过程中,促使档案部门由被动服务方式向主动服务方式转变,另外也增强了档案部门、档案人员的信息意识、,使档案部门、档案人员不断扩大服务范围,拓宽服务领域,力求面向社会各行各业和每一个公民,最大限度地开发利用档案信息资源,实现档案信息服务的社会化。进而使以保存和提供档案信息为目的,承担档案信息管理和服务职能的档案机构重新定位,使得档案事业的社会地位日益提高,档案工作具有日益广泛的发展前景。

3. 档案工作虽然最终要方便用户,使得用户更快、更准地获得档案信息,但首先必须要求档案人员熟悉和掌握档案检索工具。电子、网络型检索工具的发展与完善,促进了档案工作者角色的重新调整。信息时代,档案工作者不仅要懂档案专业知识、计算机知识,同时还要精通网络技术、多媒体技术及具备信息处理和分析能力。有人认为,未来的档案工作者要同时充当电子工程师、信息决策专家、信息教育家三重角色,此话不无道理。因为未来的档案工作者不仅要运用网络为用户提供档案信息,还要选择并使用适当的检索方法,找出适当的信息提供给用户,因而信息决策判断能力是档案工作者必须具备的。而且未来的档案检索工作将由检索服务转变为指导检索,也就是指导使用者如何更有效地检索,而绝非代替使用者联机输入档案指令及操作计算机。面对这样的要求与挑战,档案工作者应不断自我学习及接受继续教育,从而跟上时代步伐。

4. 引发档案教育界除重视专业知识培养外更要加快知识更新,培育既有档案专业知识又具有计算机等相关知识的复合型人才,从而加速计算机等现代技术在档案工作中的应用。

5. 服务利用工作是档案信息化建设的重点,而为利用者提供高效的信息服务,其关键就在于深化档案检索工作。反过来,档案检索工作的数字化、网络化最终会推进档案信息的网络化建设。改变原有的、单一的档案管理方式与服务方式,借助和依托网络这种新的信息传递方式与信息服务手段,实现主动的超时空的信息服务,使档案工作充分融入社会发展的大环境之中。

总之,档案信息能否有效地得到开发利用,很大程度上取决于档案信息的质量以及档案信息传递技术。所以,确保档案信息的质量,积极运用现代科学技术全面地传递信息,是开发利用档案信息的主要途径。档案检索工作是档案信息开发利用的基础工作,也是档案信息管理的手段之一,随着档案信息化建设的全面发展与深化,档案检索工作这一环节日益趋向独立,并越发显现出其独特的地位与作用。

参考文献

[1]赵屹.档案信息网络化建设[M]北京图书馆出版社,2003.

[2]俞晓燕.浅论信息时代的档案检索工作[J].浙江档案,1998(8).

[3]李继红.信息化进程中的档案工作.档案学通讯.1997(6).

档案信息检索 篇2

摘要:

文章主要研究了信息检索的重要性,信息检索的含义和要素,以及常见的信息检索方法的介绍和信息检索过程中应当注意的问题以及解决方法这几个方面,采用有文献法、个案法、统计法、比较法、行动研究法、调查法和经验总结法等研究方法,来阐述信息检索及其应用。详细全面的介绍,可以让部分不了解信息检索的人能通俗易懂的了解并应用一些常见的信息检索工具。从事实和实际出发,有力的论证了信息检索的重要性以及它的实用性。关键字:

信息;检索;信息检索;事实检索;检索语言;文献语言

通过学习信息检索这门课,我学会了如何利用web这个庞大的资源库快速便捷地找到自己所需要的信息。信息检索与应用涉及的领域广阔,从中文数据库搜索的介绍到外文数据库搜索的介绍,在这个快速发展的21世纪,各种信息数据在不断的增加,怎样更快速便捷的查找到我们需要的信息,显得日益重要。我们为什么要进行信息检索呢?通过什么方法进行快速的检索来应用检索显得日益重要。我们为什么要进行信息检索呢?一方面,信息检索是获取知识的捷径。美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。另一方面,信息检索是科学研究的向导。美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。此外,信息检索还是终身教育的基础。学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能力、表达能力和组织管理能力。UNESCO提出,教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求

那么,什么是信息检索呢?通过“百度”搜索引擎可以得到解释是:“:信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。总的来说,信息检索就是用一定的方式找到用户所需要的信息(此处通过百度查询信息检索的定义也是一种方法)”。常用的信息检索手段包括(1)手工检索(2)光盘检索(3)联机检索(4)网络检索。信息检索的四个要素是什么呢? 信息检索的前题----信息意识

所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。信息意识含有信息认知、信息情感和信息行为倾向三个层面。信息素养(素质)(Information Literacy)一词最早是由美国信息产业协会主席Paul Zurkowski在1974年给美国政府的报告中提出来的。他认为:信息素质是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。

信息检索的基础----信息源(信息的来源)

信息源的构成 :按文献载体分----印刷型、缩微型、机读型、声像型 ;按文献内容和加工程度分--一次信息、二次信息、三次信息 ;按出版形式分----图书、报刊、研究报告、会议信息、专利信 息、统计数据、政府出版物、档案、学位论文、标准信息(它们被认为是十大信息源,其中后8种被称为特种文献。教育信息资源主要分布在教育类图书、专业期刊、学位论文等不同类型的出版物中)

信息检索的核心----信息获取能力

能力要求:(1)了解各种信息来源(2)掌握检索语言(3)熟练使用检索工具(4)能对检索效果进行判断和评价。判断检索效果的两个指标:查全率=被检出相关信息量/相关信息总量(%); 查准率=被检出相关信息量/被检出信息总量(%)

信息检索的关键:信息利用 社会进步的过程就是一个知识不断的生产—流通—再生产的过程。为了全面、有效地利用现有知识和信息,在学习、科学研究和生活过程中,信息检索的时间比例逐渐增高。获取学术信息的最终目的是通过对所得信息的整理、分析、归纳和总结,根据自己学习、研究过程中的思考和思路,将各种信息进行重组,创造出新的知识和信息,从而达到信息激活和增值的目的。

通过上面对信息检索各个要点的详细阐述,让我们对信息检索有了全面的认识。然而,在现实的生活中,我们可以通过那些工具的检索来帮助我们去得到我们想要的东西呢?例如,我是学习会计电算化专业的,这是一门与经济活动计算与研究紧密结合的学科。要学好,就必须借助网络这个信息平台,查找更多的专业资料。首先我们平时习惯用百度或Google等这些门户网站搜索。此外若要查找专业论文,像万方数据库(偏于理科)、中国期刊网(偏于文科)、重庆维普等这些专业网站会更实用。普遍的有万方数据库(偏于理科)、中国期刊网(偏于文科)、重庆维普等。这些网站提供的都是一些很前沿而且都是经过发表的学术类文章,能够为我们提供很好的信息服务。但这些网站的一般都是要付费的,需要注册登录才能下载相关文章,一般大学图书馆都会每年购买这些网站,为我们的学习研究带来很多方便。下面我详细的介绍一些有关这些专业性的检索网站的一些搜索方法。如果想查找一些中文的期刊资料,可以通过重庆维普中国科技期刊数据库,CNKI中国知网,万方数据库等 重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型的专业化数据公司,是中文期刊数据库建设事业的奠基人。自1989年以来,一直致力于期刊等信息资源的深层次开发和推广应用,集数据采集、数据加工、光盘制作发行和网上信息服务于一体;收录有中文期刊8000种,中文报纸1000种,外文期刊4000种,拥有固定客户2000余家。目前已成为推动我国数字图书馆建设的坚强支柱之一。在以上的数据库中,最为常用也最受大家欢迎的是《中文科技期刊数据库》。《中文科技期刊数据库》还是目前世界最大的连续动态更新的中文期刊全文数据库,积累全文文献728多万篇,分七大专辑:自然科学专辑、农业科学专辑、医药卫生专辑、教育科学专辑、经济管理专辑、图书情报专辑、工程技术专辑 中国知识资源总库(CNKI)《中国知识资源总库》囊括了自然科学、人文社会科学及工程技术各领域知识,拥有期刊、报纸、博硕士培养单位的博士和优秀硕士学位论文、全国重要会议论文、中小学多媒体教辅以及1000多个加盟数据库。主要包括《中国期刊全文数据库(CJFD)》、《中国优秀博硕士学位论文全文数据库(CDMD)、《中国重要报纸全文数据库(CCND)》、《中国企业知识仓库(CEKD)》《中国图书全文数据库》《中国年鉴数据库》《各行业百科数据库》《声像资料数据库 》《《保持共产党员先进性教育》专题数据库》等。万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,覆盖范围:自然科学、数理化、天文、地球、生物、医药、卫生、工业技术、航空、环境、社会科学、人文地理等各学科领域。常见外文期刊有spinger外文期刊、等搜索网站。spinger外文期刊全文数据库收录了近500种学术期刊,内容涉及数学、物理和天文学、化学、医学、生命科学、工程技术、计算机科学、环境科学、地理及经济、法律等学科 EBSCOhost 全文数据库包括:学术期刊集成全文数据库(Academic Search Premier,简称ASP)和商业资源集成全文数据库(Business Source Premier,简称BSP)等九个数据库 对于外文不好的人,可以通过有道搜索引擎下载一个有道词典。有道词典有强大的中外文互译和对照功能。一般的数据库文件,采用的是CAJ和PDF格式,必须下载专门的CAJ和PDF浏览器才可以阅读。常见的数据库有分类检索、初级检索、高级检索和专业检索四种方式。在每种方式的检索结果(包括二次检索的检索结果)里都可以进行二次检索,可以无数次的进行,逐步缩小检索范围,直至检索结果为零。参考文献

[1]【书 名】《信息检索》

【出 版 社】武汉大学出版社 【作 者】黄如花

【开 本】32

【出版日期】2010-05-01 [2]【书 名】《搜索引擎:信息检索实践

【出 版 社】机械工业出版社

【作 者】刘挺

【开 本】32 【出版日期】2010-06-01 【[4]【书 名】《普通高等教育“十二五”规划教材•信息检索与利用》

【出 版 社】科学出版社

【作 者】邓发云、杨忠、吕先竞

【开 本】32

【出版日期】2010-03-走到茶几边,我认出了外婆的杯子,但是哪一个才是妈妈的杯子呢?突然之间,我觉得,自己真得太不了解父母了。当妈妈为我倒水时,我却不知她的杯子是什么样的;当妈妈为我夹我喜欢吃的菜时,我却没想过他们是爱吃淡一点,还是浓一点。。。2009年到了,意味着过去一年的逝去和新的一年的到来。妈妈为我操劳了一整年,仔细想想,现在的我也应该为她做一点点事了。

于是,我决定先将茶沏好再找杯子。学着爸爸平时沏茶的顺序,我先从茶柜里找出了一罐普洱茶,再往烧水的壶里加入水放在电茶炉上烧,接着,我将爸爸已经掰好的普洱茶片拿了两片放在盖碗里,等了一会,水开了,我小心地将水注入盖碗,将盖盖上,把盖碗里第一遍的茶水滤掉,然后再次注水,盖上盖,焖一会才两手并用地将茶水倒入茶海里,因为第一次自己动手,盖碗的烫手是我所没想到的,手忙脚乱的我弄得茶几上一片片的水渍。重复几次这样的程序后,我先帮外婆倒了一杯茶,因为外婆特别喜欢喝茶。当外婆从厨房走出来的时候我已经把茶都给倒好了,这时,外婆才告诉我哪一个是妈妈的杯子。

妈妈起床了,我双手捧着水杯送到她的面前,就像捧着一颗温热的心。妈妈一愣,随即脸上露出了微笑,她一手接过水杯,伸出另一只手将我拉进了她的怀里,那手轻轻柔柔地在我的头上抚摸着,接着妈妈在我的脸上深深地亲了一口。虽然妈妈经常亲我,但这一刻的亲吻却最让我感到幸福。我抬起头对妈妈说:“妈妈快喝吧,要不茶要凉了。”妈妈仰起了脖子,张着嘴巴,“咕咚,咕咚”地喝了几大口。看她那甜蜜蜜的样子,仿佛微苦的普洱茶也是蜜一般甜。

我记得在我小学的时侯,就读过一首曹值的七步诗:“煮豆持作梗,辘毂以为汁;秸在釜下燃,豆在釜中泣;本是同根生,相煎何太急”。那时只知其大意,只知道曹操的长子曹丕继位,他在一些奸臣的影响下,担心他的同胞弟弟曹值篡位,便逼迫曹值在七步之内作出一首诗来,否则处死;结果他的弟弟就在七步之内写出了流传至今的“七步诗”。当时这首诗对曹丕也是一种极大的潮讽。

几个世纪过去了,社会和生活都发生了极大的变化;应该说人的素质也应有所提高;一个人生活在世上,是离不开亲情、友情和爱情的;有人说:打架亲兄弟,上阵父子兵,但是,兄弟姐妹的团结并不是真对与他人打架斗殴,在生活上,事业上应是不可或缺的照应;俗话说“一根筷子容易断,十双筷子断就难”;可见,团结是一种力量,只有团结才有攻不破的堡垒。

然而,就在生活优越的今天,兄弟姐妹往往因为一点小事,一点利益而你争我斗,反目成仇,甚而相残;我和我的朋友在聊天时有时聊及这个问题,有人这样评论:一个人生活在世上,如果不顾亲情,对兄弟姐妹甚至父母于不顾,那他在这个社会上和任何人都不要谈“情”字,特别是友情。

树大分枝,各自成立家庭后,在生活中一些小事是难免发生的,但要看你怎样去对待,把金钱和利益看的太重,那麽,你就会值亲情于不顾;看淡名利,注重亲情才是做人的底线;争则不足,让则有余,在利益和金钱面前,我们何不礼让一点,做一个有道德、有素质、有亲情的人呢?

家和万事兴,团结是一种力量,让我们团结友爱,和睦共处,为个人的事业、为家庭的生活、为国家的兴盛而看重亲情、友情、爱情;把金钱和利益看淡一些吧!人过留名,雁去留声,希望在几十年之后,当你离开这个世界的时侯,留给后人的不是唾泣,而是美愉。

今天是她父亲的生日,她要回家和父亲一起过生日.我很理解她的想法,更理解她的思念之情.是的,她父亲已经六十多岁了,为了子女的成长与幸福,含辛茹苦,真的的不容易.话说过来,人一辈子真的很不容易.人年老时非常希望能够和子女在一起,即使不能在一起,哪怕一个电话甚至一个短信,父母也已经很知足了.我由于长期在外,很想念爸爸妈妈.想起过去,心里真的很辛酸,父母亲为了我们的成长真的付出了很多,然而他们现在又生活得怎么样呢?想起过去的一幕一幕,我心里很难受!我很希望做做子女的我们,踏踏实实地做好每一件事情,不让父母担忧,这是最基本的我们应当做的事情.谈到这里我不由自主地想起一部电影《我的兄弟姐妹》,这是一部关于亲情的影片,暂且不管故事的真实性,主要考究它的内涵.主人公齐思甜和哥哥齐忆苦、妹妹奇妙、弟弟齐天生活在一个不富裕却充满温馨和爱的家。然而在一个暴风雪的夜晚,他们的母亲旧病复发,咳得吐血了。父亲背她去医院,却出了意外,他们俩都亡故了。次日,另一家人搬进了四个孩子的家。性格刚强的哥哥无法忍受这个新家庭的种种,无奈地带着弟弟妹妹离开了家。他们开始四处奔波,寻找落脚之处。当实在没有能力照顾弟弟妹妹的时候,他把妹妹齐思甜送给一对正要出国的夫妇;把弟弟送给他的舅妈一家;又把小妹妹带到一对老人家中请他们收养。他自己和弟弟妹妹们便各奔东西……20年后,齐忆苦在北京当上了出租车司机;齐思甜出国受到良好的教育,成了音乐家;齐天成为东北大学学生;齐妙却当上了舞厅小姐。在北京的音乐会上,思甜蓦然回首的瞬间,音乐霎时凝固了。他们四人拥抱在一起,泪水顺着另一支悠扬的乐曲落下,听众的掌声久久不息……终于,他们有了一次永久的重逢。

齐思甜的父亲是一个音乐教师,他们一家人都生活在音乐的天堂里,这也为后来思甜成为音乐家打好了基础。父亲说:“人生路上有许多困难的事情,只要有音乐在,你的灵魂便不再寂寞。”这位父亲是伟大的,他乐观开朗,以身作则。尽管他和蔼可亲,但同时又是一个严厉的父亲。有一回,齐忆苦偷邻居家的鸡蛋,是为了满足妹妹小小的心愿。而他却因此挨了父亲的鞭子,还罚他站在雪地里很久。在父亲被分配到别的地方边劳动边教音乐时,他对这“莫须有的罪名”并没有悲愤倒下,而是瞒着家人当搬运工挨家挨户送木材,还干各种各样的粗活。他也没有一丝怨言,还对孩子说:“我没事。”懂事的孩子们也拿起了工具,帮父亲干活。他哼着小调,阳光幸福地洒在他们脸上。

可见,这位父亲是多么伟大,他以他的行动告诉了孩子们音乐的重要性及如何面对生活的苦难。

那么,又是一种什么样的力量,使后来的四个孩子重逢,使他们欢聚,使他们接受心灵的洗礼?

毋庸置疑,是亲情。

寒冷的冬天,四个孩子依偎在车站。他们在为下一餐饭而担心着。“哥,我饿。”、“哥,我冷。”、“哥,我想回家……”弟妹们的话刺痛了哥哥。他说:“只要我还有一口气,就不让你们受委屈。”事实上他也这么做了。如果不是亲情,他又何必活得如此累呢?他又怎能忘记,那一晚,父母临走时对他的嘱咐:“你是哥哥,要照顾好弟弟妹妹。”

生活改变了许多人和事,也改变了他们。但是,亲情是始终不渝的。最小的妹妹齐妙长大后竟成了舞厅小姐!她离开原来的家后,养父母去世得早,加上无人看管,就开始堕落下去了。她在20年后与齐思甜相遇时,大言不惭地对她说她满足于当前腐朽昏暗的生活方式。但是自那以后,她回忆起以前的一点一滴,又不免伤感和懊悔。她发现自己对不起所有爱她的人,她的良心受到了谴责。于是,亲情的归来使她的精神方面的巨人复活了!她的灵魂才得以解放。亲情给人以新生,亲情又犹如一支镇心剂。

亲情是心中的太阳,照耀着我们;亲情是温柔的春风,抚摸着我们;亲情如绵绵的春雨,滋润着我们。

亲情是雪,晶莹剔透;亲情也可以是雷,惊天撼地。

亲情可以是灯,温暖柔和;亲情也可以是微弱的烛光,不亮却很辉煌。不管怎么说,亲情一定是无价的宝藏。

没有了亲情,世界变得荒芜、凄凉;没有了亲情,生命则无法繁衍后代;没有了亲情,生活就单调枯燥;没有了亲情,人间也成了地狱。

亲情是沟通两代之间思想交流的桥梁,是一条连结两颗心的纽带。“兄弟姐妹原是天上掉下的水花,谁也不认得谁。但落在地下后,结成一体,结成冰,化成水,就永远也分不开了。”

“临行密密封,意恐迟迟归”,是亲情。“我在这头,母亲在那头”,也是亲情。

档案信息检索 篇3

关键词:综合档案馆,图书馆,信息检索,影响因素,比较

一、本质属性因素比较

一般来说, 档案馆保存的档案资料都是我国各个历史阶段中涉及政治、经济、科技等领域的信息记录, 并且以保存党政机关的相关档案为中心任务, 这些保存的信息资源都是我国历史上的珍贵遗产以及丰厚的文化累积。从档案的基本定义来分析, 档案是一种作为国家机构、社会以及个人三个方面参与到社会活动中而产生的有价值意义的记录形式。所以, 从本质上来说, 档案就是一种最原始的记录, 它具有真实性和有效性, 并且十分重视其产生的历史根源和文件之间的联系性。保存在档案馆内的信息资源有很多部分是与国家的政治、军事等方面相关, 所以它的保密性很强, 而且严格地限制了它的开放性。信息资源本身的特殊属性也决定了如果要在档案馆内进行信息资源的利用, 不仅要满足信息资源的利用, 也要兼顾这些信息资源的隐私和安全等问题, 要恰当地平衡好信息资源的利用和隐私之间的内在关系, 于是这在一定程度上使档案馆在信息检索时更要求复杂和多样等特点[1]36。正因为档案具有原始性的特征, 所以就意味着每一份档案资料在各个历史时期内和不同的社会领域中都具有其特定的价值, 这是无可替代的, 具有唯一性。

图书馆内的情报信息是经过专业人员的多次整合, 促使这些信息都能一定程度上符合人类的需求量。图情资源的核心部分是知识和情报, 并要求其具有共享的特性, 同时也尽量地做到满足用户的信息要求, 而且它具有时效的限制性。图书馆内的情报信息可以说是一种社会大众化的信息, 图书本身就是供给人们阅读的, 并且也作为知识传播的有效途径, 所以它基本上都不会被限制利用, 除却极少部分的机密情报, 大部分都是面向社会化的。所以图书馆要求工作者要做到把用户的需要作为服务的最终目的, 并且每个人都有权力去获得这些信息。这种服务目标正是体现了在信息检索的过程中是通过用户来驱动的, 并且把用户的需要作为根本的工作重心, 注重用户对信息的需求。这些本质的属性促使图书馆的数据管理要实现特色化。

二、利用者因素比较

1. 利用者类型的比较。

档案的利用者主要指从事政治、经济等社会活动中需要借助档案里保存的信息资源的个人或者是群体。一般来说, 可以把档案利用者自身的工作性质和职业来进行分类, 可以划分为四种类型。其一是组织管理人员, 这些人主要服务于一些党政机关以及事业单位等为了社会活动的需要而阅览档案;其二是从事于理论研究的人员, 这些人员主要是为了进行深层次的研究活动而需要档案的资料;其三, 工程技术者, 主要是因为在工程项目中进行的研究活动中需要档案中保存的信息资源来作为参考或者是考证;其四, 一般用户, 这是为了解决自身面临的问题。在这些不同社会职位的人员之中, 组织管理人员就是档案馆利用者中主要的群体, 正是因为他们在进行方针、措施、规章等的制定过程中, 需要科学性地进行统一, 所以就要借助档案来完成。另外, 一般用户也是档案重要的利用者, 特别是从事于历史的专家或者是学者, 他们的工作中因为要进行编史或者是对某一个专题深入的研究, 所以他们对档案中保存的信息、资料具有很强的依赖性, 这些档案资料也为他们的工作提供了有效的帮助。

图书馆根据利用者获取信息的目的来划分, 包括如下五种类型:其一是学习型利用者, 这类的用户集中表现为大中小学生骂他, 他们的根本出发点就是为了完善和辅助系统知识, 或者是这些用户因为信息、知识处于不断更新的状态, 所以要继续学习, 也有的是为了综合提高自身的文化素质而需要图书馆的信息资源;其二是欣赏型利用者, 这是为了个人娱乐、精神等方面的需要而需要信息;其三, 研究型利用者, 这些利用者专门从事于研究或者是教学学者, 包括教育者、各个行业的专业人士;其四, 生产型利用者, 指在生产的工作中面临的一些困惑或是文艺需要通过知识进行辅助的人员, 主要有科研工作者、企业家等;其五, 生活型利用者, 这些用户是为了更好地解决生活中面临的种种问题[2]75。

2. 利用者信息需求特点的比较。

通过对档案利用者和图书馆用户之间进行比较, 可以得知两者之间存在一定的差异性, 相同地, 档案用户和图情用户在信息的需求上也形成了各自的特征, 主要表现在如下方面:其一, 档案用户侧重于需求信息的原始性, 而图情用户则需求能获得较为全面的信息内容;其二, 档案用户要求信息具有真实性的特点, 而图情用户则倾向于信息的快速化。档案用户通常利用档案来考究事实, 验证事实, 为了还原历史的真实性, 他们需要档案提供的信息都是真实的、原始的。图情用户则更加注重信息的实用效果, 信息的出处并没有过多的限制, 所以他们就不需要花费过多的时间去查找信息的来源;其三, 档案用户对信息的需求量表现出阶段性的特征, 而图情用户在需求上主要表现为连续性。促使图情用户对信息的需求主要是因为他们受到内部因素的影响, 国家对其的干预并不明显, 所以在对信息资源的利用中, 主要表现出平缓的特征;其四, 档案用户与图情用户在利用的限制因素上也具有差异性。因为档案是机密的信息资源, 有些档案关乎党和国家的利益, 所以档案馆中对档案的利用和时间都有限制, 这就约束了利用者对信息的需求范围。图书馆内的信息本身就是供于社会大众的信息, 所以对于它的利用范围并不是十分广泛, 而且它极少被限制, 这就促使图情用户能获得更加广泛的信息。

三、社会环境因素比较

1. 政策、法规方面的影响因素。

相关的政策、法规主要是面向档案馆中的信息的利用和开放而实行的, 国家对档案管理规定的内容是国家对其进行宏观调控的表现。虽然国家制定的《档案法》中明文规定了档案要在规定的时期内对社会进行开放, 但考虑到档案本身包含的数量、种类、价值等方面问题中都存在一定的出入, 所以在开放的时候就很难掌控档案信息的保密工作, 所以在面向社会开放期间, 档案馆一般会采取相关的限制措施, 并在一定程度上保证了档案信息的过渡开放。所以国家对档案期限的规定也约束了档案利用者对信息的需求程度。相较于图书馆来说, 国家对其采取的政策制约是很少的, 图情资源是一种公共的知识传播手段, 它的共享性范围很广, 并且它并不保存与国家相关的机密信息, 所以国家正常的变化也不会给图书馆的检索带来很大的影响。

2. 经济方面的影响因素。

社会经济因素主要指相关的经济制度、经济发展模式等, 经济是保证社会发展的基础, 并且经济也在一定程度上决定了社会上对信息的需求量, 同时也影响了档案和图情信息等的开放程度。首先, 由于市场经济体系的确立促进了信息化的扩展, 档案信息和图情资源是两种保存社会信息的有效方式, 所以它们要进行利用或者是开发也需要以市场信息为依据, 并积极地开发信息产品, 为社会上的信息用户提供有效的服务。同时对档案信息和图情资源进行整合, 并使其转换为有效的社会生产力, 从而在一定程度上带动经济的发展, 而且也能获得社会经济力量的支持。其次, 随着知识经济在全球范围内进一步的扩张, 社会中的各种信息资源已经成为促进经济向前发展的后备力量, 当前, 是否能有效地传送知识和信息成为带动社会经济发展的驱动力, 决定了我国竞争力水平。档案信息保存了我国机密的信息和文件, 它不同于其他的信息资源, 档案信息发挥的作用是其他信息无法代替的[3]66。所以, 综合档案馆应推动档案信息的开发, 并进一步的完善档案中保存的数据信息, 同时也提升档案信息的检索功能, 这样就能有效的提高档案工作在社会上的地位。在图书馆中进行的数据库建设也为社会经济的发展发挥了积极的作用。

3. 用户信息意识和观念方面的影响因素。

用户自身的信息意识主要指人们在脑海中存在的对社会性的价值、功能等方面的认识水平。信息意识可以反映出人们对信息的判断和利用的程度范围, 集中表现为人们对信息的认识程度。可以说, 信息意识是用户进行信息利用的基本意识概念, 也是进一步开发信息的基础和前提。所以用户所处的社会环境和自身的认识程度的变化都不会促使用户产生信息的保护意识。站在社会总体的意识水平来分析, 情报的意识则在人们的脑海中保存了更深层的意识, 用户自身的图情意识水平要比档案意识更加强烈。基于档案及其相关部分的特殊性质, 再加上档案机构践行的保存观念, 在潜意识中就给档案机构增添了一把心里的枷锁, 所以也一定程度上促使档案用户在档案的利用过程中都怀有一种敬畏的心理特征, 另外, 档案馆中设置的多种权限也促使用户在准确的情况下提出了自己的档案利用需求, 这在一定程度上就缩小了用户对于档案的利用意识。所以只有当档案用户通过其他途径都无法获得有效信息的时候, 才会决定去档案馆查询信息资源, 换句话说, 档案馆内的信息资源是用户获取有效信息的最后方法。与档案馆相比较, 图书馆的书籍和资源则更倾向于社会化, 并没有笼罩上政治化的因素, 而是单纯地作为社会化的信息的获取地, 图书馆内的信息资源能得到最大范围的利用, 也是一种可以作为共享的信息资源[4]53。

伴随着信息化的快速发展, 促使信息资源亟待进一步的整合, 特别是随着网络化信息环境的建立, 已经促使信息的利用以及服务方式逐渐呈现出统一性的特征, 各个信息服务领域也出现了相互渗透的发展趋势。当前, 档案馆和图书馆已经得到最大范围的建设, 保证了信息资源的进一步开发利用。从社会实践性出发, 图书馆保存的信息范围已经超过了面临安全、机密等问题的档案馆。

参考文献

[1]李镜园.图书馆与档案馆网络参考咨询服务比较研究[J].科技情报开发与经济, 2011, 21 (31) .

[2]丁建琴.浅析图书馆与档案馆合并模式[J].兰台世界, 2011 (30) .

[3]周彩英.图书馆与档案馆信息资源开发比较研究[J].中国档案, 2011 (10) .

档案检索系统中的多级著录研究 篇4

关键词:档案检索,多级著录,信息化

面对浩如烟海并且不断增长的档案信息资源, 建立一个高效、完备的档案检索系统就成为充分开发与利用档案信息资源实现档案信息化的关键环节。

一、实行档案多级著录的意义

实行档案多级著录是对档案全宗理论的具体体现。档案是以全宗理论为基本理论原则的, 那么档案著录就必须体现全宗理论, 只有这样才能使档案著录反映出档案作为系统而存在的本质与特点。档案多级著录是按照“全宗整理级别结构模式”实行的, 它反映了档案全宗是一个不可分散体系的档案的本质与特点, 因而档案的多级著录是对全宗理论的具体体现。

实行多级著录可以提高检索效率。传统的单级著录, 不能体现由全宗到类别, 再到案卷, 最后到文件之间的这种逻辑关系。如果在检索到一份文件的同时, 还想知道它所在的案卷、类别、全宗的信息, 就必须再进行三次检索。然而, 实行档案多级著录后, 就可以建立起各著录级别之间必然的逻辑联系, 这样只通过一次检索, 就能获得由文件到全宗的全部信息, 从而提高了检索速度, 节约了检索成本。另外, 由于档案多级著录技术能够对档案整体及相关信息予以提供, 因此它有利于利用者尤其是远程利用者判断检索结果是否真正符合自己的需求, 还能够进行梯度检索, 方便地在各个著录级别的档案检索结果之间进行快速浏览与转换等等。这样也就提高了档案检索的全面性、准确性与方便性。所以, 实行档案多级著录有利于检索效率———“全、准、快、便、省”的提高。

二、我国档案多级著录状况

目前, 我国的档案著录标准中只包含了文件级和案卷级著录规则, 而没有类别级和全宗级的著录规则, 因此也就没有对档案多级著录作出规定。这就从客观上导致了我国的档案检索系统基本上都没有采用多级著录技术的状况。如果利用我国的档案检索系统检索档案, 只能检索到文件著录条目信息或案卷著录条目信息, 并且文件级著录条目和案卷级著录条目之间也没有建立起相互的连接关系。所以, 我国的档案检索系统总体上还缺乏系统性, 还处于一种“只见树木, 不见森林”的状态。相比之下, 国外许多国家在档案检索系统中都采用了多级著录技术, 典型的就是美国ARC (Archives Research Catalog) 检索系统。

然而, 目前国内正在大力推进档案信息化建设, 许多档案检索系统的设计却没有将多级著录考虑在内, 这是和国际档案检索系统的发展不相符的。因此, 国内档案界应加快对多级著录的研究与实践, 使我国档案检索系统的建设跟上国际步伐。

三、我国实现档案多级著录的必要性与可行性分析

1. 实现多级著录是顺应我国档案信息化建设发展的必然要求。

档案信息检索系统建设是档案信息化建设系统中的一个子系统, 其建设的好坏关系到信息化建设的成败。随着档案信息资源建设快速推进和档案网络的蓬勃发展, 带来了大量数字档案信息资源, 直接到档案馆去查检档案的行为会越来越少, 人们更多的是通过互联网来远程检索档案。这就要求检索的高度系统化, 既能让用户方便快捷地检索到所需档案, 又尽可能地为用户提供全面、准确的档案信息, 让用户即使离开了档案馆咨询人员的实时帮助, 也能很容易地确认自己所需的档案。因此, 只有在档案检索系统中集成多级著录技术, 才能适应远程档案检索。所以说, 实现档案多级著录是顺应档案信息化建设发展的必然要求。

2. 实现档案多级著录在我国切实可行。

首先, 我们有可参考的现存标准。《国际档案著录规则 (总则) 》核心部分包含了多级著录规则的内容, 它为我们实行多级著录提供了很好的依据标准。其次, 我们有可供借鉴的实践经验。国际上许多国家已经实现了档案多级著录, 这为我国实现档案多级著录提供了广泛的实践经验, 同时我们还可以吸收国内图书情报界的一些有益经验。再次, 我们有相当数量的档案工作人员, 包括检索系统开发人员, 这为检索系统的实现提供了人力资源保障。以上这些都为我国实现档案多级著录创造了条件。因此, 实现档案多级著录在我国是切实可行的。

四、依据国际档案著录规则建立档案多级著录条目

1. 按照国际档案著录规则形成多级著录条目格式。

《国际档案著录规则 (总则) 》中包含了档案多级著录规则, 将其与我国实际结合, 形成我国档案多级著录规则。由于在现有国家行业标准之中没有“著录级别”这一项, 而为了便于集成, 笔者就案卷级与文件级的著录规则, 依据国家著录标准并增加了“著录级别”项。

2. 按照多级著录条目格式建立多级著录条目。下面以“上海公共租界工部局”为例来进行多级著录。

相应全宗级的著录条目为 (图1) :

上海公共租界工部局下设总办处, 其全部档案为一个类别。其相应的类别级著录条目为 (图2) :

相应案卷级的著录条目为 (图3) :

相应的文件级的著录条目为 (图4) :

以上各个级别的著录, 可以根据档案馆的实际能力, 选择简要级次或详细级次, 其详简级次的著录项可根据《国际档案著录规则 (总则) 》和《家档案著录规则》进行选择。

在我国, 实现档案多级著录是切实可行的, 也是迫切需要的。但要真正将这样的系统在我国档案信息机构中建立起来, 还有很长的路要走。特别应该指出的是, 我们应加快对多级著录的理论研究, 制定出我国具体的相关标准, 这样我国的档案检索系统建设才能有条不紊的顺利进行。

参考文献

[1]张琪玉.档案信息检索[M].解放军出版社, 2000.

[2]上海市档案馆指南.中国档案出版社, 1999.

[3]国际档案著录规则 (总则) .国际档案理事会, 1994.

[4]国家档案著录规则DA/T18-1999.国家档案局, 1999.

基于个性化的档案检索方式研究 篇5

关键词:个性化检索,关键因素,档案检索,变革

现阶段, 网络的发展给人们带来了海量的数据, 用户希望可以更加需要快捷、高效地获取信息, 且用户之间信息需求的个体差异性日益显著。而个性化的检索可以更好地理解用户喜好和需求, 针对不同用户的不同特点, 同一用户不同的检索需求和检索环境, 进行查询匹配然后返回不同的结果反馈, 从而提高检索的快捷、高效性, 提供更好的用户检索体验。

一、个性化检索内涵与特点

“个性”一词来源于拉丁语Persona, 其原意是指古罗马时代在舞台上的演员所佩戴的假面具, 它代表的是剧中人的身份。信息时代为人们的个性化赋予了更丰富的含义, 它表示区别于他人, 独有的特色, 如:个性化需求, 个性化服务等。人们由于不同的身份背景, 不同的兴趣爱好, 不同的行为方式都会产生不同的信息需求。

个性化检索, 即基于用户个性化喜好和习惯, 根据不同用户不同的检索需求进行内容的匹配和搜索结果的呈现。在搜索过程中融入个性化元素, 包括根据用户特征和记录的检索历史进行个性化结果呈现以及个性化信息推荐。对于用户, 根据用户的个性化行为以及偏好等对搜索结果优化, 例如:购物搜索中的价格、地域等偏好等, 形成千人千面的效果;对于系统, 系统记录分析用户的搜索历史, 形成用户搜索行为习惯, 对不同的用户进行分类分配, 当用户进入搜索界面时, 根据用户的行为习惯信息呈现出相应推荐信息等。

对于人们的需求而言, 人们并不仅仅局限于根据关键词匹配找到他们需要的东西。更多的是信息层次上更深层的东西———知识。知识是对某个主题确信的认识, 并且这些认识拥有潜在的能力为特定目的而使用。结合用户的行为特征、个人信息以及关系群体等, 挖掘其中富含规律的信息, 在用户搜索的同时, 以特定的方式呈现给用户, 将会使用户发现更多意想不到的知识。而个性化检索正是让用户获取知识、创造知识、发现知识的一个很好的渠道。

个性化检索有以下主要几个特点。

1.“相关度”个性化。

每个人都有自己概念下的“相关度”, 每个用户都有自己的一套独特的相关度计算方法。针对传统唯一的相关度方法检索的结果信息对不同用户的价值不一样, 即相关度的度量不一样。从而用户检索的满意度就不一样, 根据用户个人信息, 明确用户个性化的相关度算法, 从而返回检索结果, 才能更好地满足用户检索需求。

2. 用户参与信息数据库的建立。

传统的检索词检索没有针对性的记录用户的浏览历史, 用户再次输入相同的检索词时, 返回的是一样的结果, 没有用户检索历史信息的呈现, 更没有从用户检索历史记录中获取用户特征对检索结果进行相关性改进。个性化检索中用户特征信息以及用户历史行为信息都是很重要的用户信息, 用户信息量越大, 系统对用户数据进行数据挖掘而获得的用户的特征、喜好越准确, 检索结果的呈现和信息的推送也就更加准确, 是个性化检索不可缺少的重要数据。

3. 用户交互性更强。

根据用户的特征以及历史记录而返回的检索结果和推送信息并不能完全满足用户检索需求, 此时用户的结果相关度反馈是很必要的, 用户针对检索出的结果进行显式或隐式的相关性判定, 并将判定结果返回给系统, 系统进一步修正和完善用户特征, 用户模型是动态的, 更新的, 用户的反馈信息正是反映了用户需求和习惯的多变性, 系统和用户一起更新数据。

二、个性化检索实现的关键因素

1. 用户兴趣模型建立的数据采集。

用户兴趣模型是实现个性化检索的基础和核心要素之一, 是开展个性化检索的前提条件, 模型质量高低将直接关系到系统提供的个性化检索质量。用户模型的建立主要依靠的数据指的是用户数据, 包括用户提供的数据, 如:用户标签等个人信息, 还包括用户的检索行为历史, 如:检索档案历史以及个人收藏等数据信息构成用户数据。准确全面地获取用户信息是实现个性化检索的基础和关键。

2. 用户数据的挖掘。

数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。而对于当今现在信息爆炸的时代, 信息量的巨大不容怀疑, 因此需要根据大量的用户信息得到更确切的规律, 获得用户内容喜好及个人检索习惯, 为准确匹配用户需求提供了基础, 从而更好地理解用户的个性化需求, 进行合理的数据匹配, 实现个性化检索。

3. 个性化推荐技术的改进。

关于个性推荐技术混合方式力求扬长避短获得最佳推荐效果, 如:加权、混用、切换等。常见的有:基于协同过滤与内容过滤相互混合推荐。这是由于个性化推荐技术方法多种多样, 每种方法都或多或少地存在着优缺点, 没有哪一种是全能的、完善的, 结合使用才能真正具有完整、强大的功能, 进行相关度更高的用户信息推荐。

4. 呈现形式个性化、多样化。

档案的检索不仅仅限于文档, 还应拓宽文件类型, 如:图片、音频等, 个性化检索的返回结果也应加入个性化因素, 提供多种呈现风格供用户选择, 从而对枯燥单一的档案检索加入新鲜多元的呈现元素, 界面风格简单大方并加入用户个性化元素, 良好的界面设计以及多样检索结果呈现, 定会给档案的检索带来更好的用户体验。

三、档案检索现状扫描

档案检索最初是基于人工录入、检索、排序的目录式检索, 查全率较低;之后产生了机遇关键词的检索, 返回结果信息多, 查准率不高;另外, 用户的技术水平、教育背景、对搜索引擎的理解程度等等都限制了检索词的质量, 也造成了检索效率不高。随着社会的进步, 档案的数量不断增加, 对利用的需求也逐年提高, 档案的社会作用明显增强, 提高档案的查全率和查准率是档案利用的重中之重。

但是档案的检索目前只局限于传统的检索方式, 是将手工检索与计算机检索简单的结合起来的检索方式, 建立新的检索方式将是实现档案利用的途径, 个性化的检索方式势在必行。

四、个性化检索为档案检索带来变革

个性化检索更能够理解用户检索需求, 建立用户数据库并进行动态更新, 采用数据挖掘得出用户特征和需求的差异性, 根据用户的喜好展现返回结果, 应用于档案检索将大大提升了用户检索的需求匹配度和满意度。且个性化的展现形式使得档案检索更具有趣味性和智能性, 使得枯燥的历史档案更能走近用户, 使用户的检索体验更好。也使得档案的提供利用不再是纸上谈兵, 真正为普通百姓服务, 为整个社会提供利用, 充分发挥了档案留史咨政的作用。这是档案工作者乃至整个社会的所有信息工作者应该努力的方向。

参考文献

[1]徐萍.网络信息资源特点及对用户的影响[J].湖南农业大学学报, 2007 (10) .

[2]谭磊.一种个性化移动搜索技术的研究[D].湖南出版社, 2010.

档案信息检索 篇6

一、我国省级档案馆网站的检索功能现状分析

笔者以中华人民共和国国家档案局网站上的“友情链接”,访问了其所链接的31个省级档案馆(2016年6月份访问)。被访问的档案网站包括18个省(其中台湾省除外,山西、新疆、黑龙江、广东四省档案网站均无法正常浏览),5个自治区,4个直辖市。我们以网站“提供什么档案检索资源”“怎样去检索”“检索的结果怎么样”为中心线索,从检索资源、检索方式、检索帮助和指导、检索结果处理方式四个方面对省级档案网站的档案检索功能进行调查分析。

(一)检索资源。档案网站提供的检索资源是公众获得满意的档案检索服务的基础。通过调查发现:一是档案网站的可检索的资源量少。除北京、天津等网站外,90%的档案网站档案信息资源较少。部分网站档案检索版块只是虚设,无法打开浏览。二是检索提供的资源类型单一。目前档案检索中现行文件的全文检索内容较多,档案全文检索较少,且局限于文字类档案;最后,档案检索范围局限在站内检索,大部分无法实现馆际合作。

(二)检索方式。检索方式直接影响公众的利用效果。在访问的27个省级档案馆中88%的档案网站首页设有“检索”“高级检索”项,还专门设有网上查档版块,19%的网站仅有简单的检索。部分档案网站的检索方式过于简单,而有的则过于专业化。例如高级检索方式下有“档号”“题名”“责任者”“保管期限”等多种检索项,难以理解,易用性较差。

(三)检索帮助和指导。检索帮助和指导是帮助公众了解档案网站中可供查询的档案资源有哪些,怎样去检索查询的一个必要的说明和解释。调查的档案网站中大多的网站没有就网上检索相关操作进行解释说明。调查中仅有4%的网站提供查档帮助,且网站的档案信息分类完善。如北京、天津、湖南等地档案网站提供了可查询档案信息资源的相关说明,也介绍了检索条目如何填写,且这些网站均建有分类检索。

(四)检索结果处理方式。网站呈现的检索结果呈现方式也是影响公众评价检索功能的重要因素。就目录检索结果而言,大部分档案网站只是简单罗列检索结果;就全文检索结果而言,大部分网站不能实现浏览内容的缩放操作。15%的网站提供档案预约、在线申请查档等服务,但是要求用户身份验证、注册,再填写查档申请,等待批复,对于查阅档案极为不便。浙江省档案网站在检索结果中可以选择结果订制、默认排序、相关度排序等,而且检索结果中有偿使用的档案信息需要注册。

二、优化档案网站检索功能的建议

我国档案网站的建设存在着诸多不足,尤其是网站的检索功能,档案工作者任重而道远。

(一)树立以人为本的服务理念,建立服务型的网站。总体看我国档案馆网站建设仍旧未打破“重宣传,轻利用”的局面,档案网站的服务功能定位不清。而档案网站的定位直接关乎档案检索功能的优劣。档案工作者从树立以人为本服务理念着手,将公众的档案信息需求放在第一位,同时加强自身职业素质。

(二)丰富网站档案资源,实现档案资源共享。网站档案信息资源是实现公众检索档案的基础。目前我国各个省级档案馆在档案数字化方面仍需大量投入,网站整体服务效果较差,档案资源的共建共享已经迫在眉睫。

首先,加快档案信息资源的数字化,丰富网站档案资源。通过档案馆数字化的建设,利用网站为用户提供更多的检索资源、多样友好的检索方式。其次,对档案网站资源进行整体规划,整合相关的文件档案数据库,消除各档案馆之间的信息孤岛,实现资源共享。同时加强馆际间的合作,实现共同开发,实现档案资源利用效益最大化。

(三)完善网站的档案检索工具,提升网站检索服务能力。首先,增加网站检索途径,设置个性化检索方式。网站可以针对不同的利用需求和利用习惯设置扩充检索功能,比如模糊匹配和精确匹配、同义词、推荐检索词、分类查询等增加到高级检索中。或者有条件的网站可以借鉴电子商务网站的信息技术设计出个性化的检索方式设计优化现有的网站档案检索功能。

其次,提供档案检索帮助和指导,帮用户提高检索效率。档案网站应为公众有效使用检索系统网站应提供检索资源和检索操作的相关说明,同时可以借助社交媒体的即时性,及时为用户解决检索过程中出现的问题。

最后,优化检索结果处理方式。网站根据利用者信息处理需求的不同和使用的习惯与爱好不同,在检索结果显示内容和方式上增强可选功能。对于检索到的结果,做好后续服务的衔接,如网上预约调卷,全文复制、保存、下载、打印等服务。

摘要:本文以省级档案网站为调查对象,分析出网站的检索服务整体水平较低,档案馆需树立服务意识,丰富档案信息资源,完善档案检索工具。

关键词:省级档案馆网站,档案检索功能,检索工具

参考文献

[1]锅艳玲,段伟峰.完善我国档案网站检索功能之研究[J].浙江档案,2012(4).

[2]刘斌.完善我国档案网站检索功能之研究[J].兰台世界,2013(8).

[3]赵山山.浅谈我国档案网站网上检索功能现状与未来建设[J].档案管理,2009(3).

档案信息检索 篇7

关键词:用户交互,行为分析,检索系统

随着检索技术的发展, 用户的差异性逐渐在网络检索行为中得到重视, 网络检索系统逐渐从资源整合扩展到差异化的用户需求整合。在信息检索研究中, 也开始从用户交互角度考虑网络信息资源检索机制和机器学习功能, 开发针对特定用户组的检索系统和个性化的信息导航。

一、用户行为分析

1. 用户交互研究。

用户交互研究是通过研究用户与检索系统对信息需求的生成、表达、传递、处理和反馈的全过程来改良检索系统的检索效率, 或者建立面向用户的网络检索工具的研究方法。从理论背景来看, 用户交互研究整合了用户认知研究、系统学习理论、社会信息学和信息检索, 通过用户信息检索的心理需求, 用户需求表达, 人机交互 (HCI) 中的沟通、学习与反馈, 跨语言和跨文化环境的社会影响, 提高检索系统的信息识别和匹配来提高检索效率的研究机制。从研究方法上看, 用户交互研究的出发点是用户特征, 以用户为中心开展的面向用户需求的适应性系统改良, 形成对检索过程的反复匹配和精炼。目前, 用户交互研究主要集中在用户检索交互行为、用户认知、系统学习与反馈等几个方面, 逐渐形成了基于统计的用户需求调查研究方法、基于用户认知的知识概念映射方法、基于系统相关反馈的智能学习以及推理方法等典型的研究方法。

2. 信息检索过程中用户行为因素。

信息检索过程中的用户交互行为主要包括用户需求表达和系统反馈两个过程, 两者相互作用, 通过系统对用户需求的反馈, 能够改进和提高用户对检索认知及检索需求表达的准确性。因此, 用户交互行为涉及用户的信息认知和表达能力、系统功能、用户社会文化背景等相关因素。信息素质直接影响用户信息查询的关键词的表达和查询方式的选择。具体而言, 用户信息素质差异主要反映在信息表达差异和用户检索行为的差异上。用户信息表达与用户知识背景相关, 即信息认知能力, 也与对检索系统的熟悉成都和应用技巧相关。在认知能力上, 许多用户在构造检索提问表达式时, 常常并不清楚自己所需信息的具体特征。而在检索技巧上, 用户在检索工具选取、检索入口词的选取和高级检索方式中都存在差异。因此, 网络信息检索用户交互一方面应该提高用户的基本信息素质;另一方面应该通过分析研究用户的信息素质, 在系统层面建立与用户素质相适应的使用与查询方式, 更好地适应用户的查询行为等信息素质。

3. 用户行为分析调查实例。

通过Excite、AlltheWeb.com、Alta Vista和Google等搜索引擎1997年到2003年的查询数据, 在网络公共查询中, 大约2/3的用户习惯一次检索到位, 超过6/7的用户不会使用两次以上的查询检索, 平均检索查询次数是1.6次;只有大约8%的用户接受或者利用模糊检索来获取信息, 使用布尔代数和专业查询的用户大约占总用户数量的1/18, 但检索语言错误非常多。在用户检索行为研究中, 尤其在非搜索引擎的浏览查找中, 记忆、操作印象和检索路径存储都是影响信息检索效果的因素。

国内方面, 据余慧佳等人在《基于大规模日志分析网络搜索引擎用户行为研究》一文的结论, 通过对搜狗搜索引擎的用户行为分析, 对于85%的查询, 用户只翻看搜索引擎返回结果的第一个页面, 这与英文用户行为分析的结果一致。但中文用户行为只有0.73%使用了高级检索的功能, 说明中文用户更注重搜索引擎使用方法的简便。另外, 检索用户提交的查询中, 重复率很高, 即少数查询出现总数占总查询数的绝大多数。

二、用户行为分析在档案系统设计中的应用

1. 检索系统界面的设计。

档案检索系统的用户界面是人与计算机之间传递、交换信息的媒介, 是用户使用计算机检索系统的第一印象。首先, 检索界面应尽量简单明晰, 例如Google和百度的首页都是非常简单明了。档案检索系统也应该尽量采用这种方式。即在页面的主要部分只提供检索输入框, 其他功能模块尽量少, 减少对用户查询的干扰。同时在检索方式上面也提供高级检索功能, 分别针对不同的用户。一方面能够为专业用户提供尽可能多的、必要的检索方式, 使用户从档号、题名、关键词、归档时间等不同角度进行检索。另一方面, 也提供“浏览式”检索。即用户可能没有或是无法清楚地表达信息需求。因此, 除了提供直接输入检索提问的方式或是选择方式之外, 还应能提供分类浏览方式, 使用户在浏览的过程中理清尚无精确范围的信息需求, 或是产生特定的信息需求。用户在进行检索时, 组织自己的问题是分步骤逐步提出的, 并非一开始就有明确的概念范围, 而且查询中用户的需求还可能不断变化。因此, 每一个步骤应是独立有效的, 也就是说系统能对任务进行任意方式的组合并能保存和再利用检索策略。检索结果应按照相关度排列, 并为用户提供相关问题的链接, 使用户可以获得更多的信息, 同时为用户提供检索结果再利用功能。

2. 关键词的使用。

要想提高关键词检索效率, 选择恰当的关键词才能够准确描述信息, 提高数据库信息的命中率。用户要根据自己的具体信息需求, 将几个概念进行组合, 以便能系统、全面地检索出自己所需的信息。根据用户行为分析调查的结果, 一般用户进行检索时, 关键词的长度不超过3个词的查询占了总查询数的93.15%, 平均长度为1.85个词, 这说明用户输入的查询通常都比较短, 而且平均长度与Craig Silverstein等人分析的英文查询长度结果的2.35个词相比更短, 这说明中文搜索引擎需要用户有更多的分析和经验, 才能更加准确地返回用户需求的信息。

3. 使用用户提示。

目前, 大多数搜索引擎都提供了通过相关词提示帮助用户优化查询, 明确用户的信息检索需求。档案检索系统的设计可参考常用搜索引擎所采用的提示方法, 给用户检索以适当的指引, 帮助用户获得相应的信息。在技术实现上, 可通过基于查询日志的相关词获取方法和基于文本集合的相关词获取方法。基于查询日志的相关词获取方法是从用户角度出发, 基于用户的历史查询记录, 依据的是词与词之间的相似度。其局限性是, 用户往往只点击排列在前面的结果记录, 统计过程中忽略了大量排在后面的网页, 如果排在前面的网页不符合用户的信息需求, 会大大降低相关词提示的质量。基于文本集合的相关词获取方法, 没有考虑用户的历史查询记录, 仅仅针对当前检索行为从结果文献中抽取关键词, 会出现大量偏离用户信息需求的不相关词, 无法表达概念相关的关键词。但它不依赖于用户的查询日志, 技术比较成熟, 依据的是文献之间的相似度。因此, 将这两种方法结合起来能提高相关词提示的性能。而关键词相关提示也表明了当前系统查询的热点, 一般提示词的选出是系统根据用户总体查询量来进行排序和分类的。

4. 提高系统响应速度。

提高检索系统的响应时间是改善用户检索体验的一个主要方面。据研究表明, 1/10秒的响应会让用户觉得系统是立即响应;1秒以内还是认为系统没有中断, 但是已经注意到系统延迟;而10秒则是保持注意力的极限。因此, 系统的响应时间不能超过10秒。在用户浏览网页时, 应通过显示文件的大小、进度条或者其他形象化的方式等方式让用户可以预测等待的时间。

在技术上, 目前真正意义上的搜索引擎, 基本都是对被检索对象的所有文字建立索引, 然后再对这些索引进行检索。北京大学档案馆在这方面采用Oracle数据库, 使用Oracle的全文检索方式提高系统响应速度。Oracle Text和搜索引擎基本相同, 但是当用于对数据库的检索时, Oracle Text的优势就体现出来了, 因为它是完全集成在Oracle Text数据库中的, 所以文本索引的创建和管理变得更加容易, 性能更好, 并可通过SQL查询实现无缝搜索;Oracle还增加了许多额外的服务, 使用户可以根据搜索条件, 更方便、快捷的访问数据库。Oracle Text提供了强大的文本检索功能, 很适合大型文献资料库的全文检索。当然Oracle Text也有一些局限性。比如日期、数字、嵌套式列表以及对象列不能索引;不支持复合索引, 而只能对其中的一列进行索引。档案系统采用哪种技术可以从自身的需求定位和经济成本出发, 采用适合自己的技术手段, 提高响应速度。

检索交互的本质是人和机器的相互学习, 人对机器的学习体现在用户的信息素质上, 而机器对人的学习则反映在检索系统的设计上。检索系统学习机制的设计, 主要有两大类:一类是行为识别, 通过对特定用户的检索行为特征进行归纳, 设计个性化的检索系统, 缩减用户的检索步骤;另一类是逻辑推理, 利用检索信息内容的关联, 提供用户检索决策支持, 提供推理机和Push服务。

总之, 对检索系统用户交互的分析, 能使网络信息检索系统在资源展示的内容与形式、界面设计、检索式编制、资源粒度、网站构建、系统对检索词的处理都得到不同程度的关注与改进。

参考文献

[1]叶峰.我国数字用户信息行为若干问题分析[J].图书馆论坛, 2007 (6) .

[2]夏晓慧.网络下用户信息需求的分析研究[J].农业图书情报学刊, 2006 (1) .

[3]裴雷.信息检索中用户交互行为及其影响因素[J].图书情报工作, 2007 (8) .

语言文字知识在档案检索中的运用 篇8

一、档案著录中的文字规范化

档案著录是档案馆(室)编制检索工具时,对档案的内容和形式特征进行分析、选择和记录的过程。著录的最后程序就是将反映单份文件或案卷内容和形式特征的著录项目用规范汉字或有关符号记录成条目。因此,著录使用的文字是否规范,直接影响着检索工具的质量以及档案利用的效率。

《档案著录规则》规定:著录用文字必须规范化。档案著录时, 应使用规范的简化汉字。规范汉字是指符合新中国成立后国家有关部门发布的汉字整理方面的字表和权威字书中规定的汉字。汉字整理方面的字表主要有:《简化字总表》、《第一批异体字整理表》、《现代汉语通用字表》、《部分计量单位名称统一用字表》等。不规范汉字包括两个内容:一个是不符合国家发布的汉字整理的字表规定的汉字,例如国家已经简化的繁体字以及已经整理的异体字、旧字形等;另一个是错别字。要正确使用规范汉字,必须掌握国家发布的汉字整理的有关字表,并能切实纠正错别字,不能随心所欲,根据自己的喜好去书写。作为档案著录人员,既要有认真负责的态度,也要掌握必要的规范汉字知识。

二、档案主题标引中的语法规则

在档案主题标引中,主题词的组配是关键和难点。主题标引的质量取决于组配的质量。主题词的组配,是运用主题词的语义关系和逻辑性质,通过不同主题词之间的语法限定或逻辑组合,把两个或者更多的主题词组合在一起,来表达档案文件的复杂概念和某一个完整的主题。主题词在组配时,必须符合两个要求:第一,主题词的组配要受到语法规则的支配,不是单纯的文字拼凑。任何一种语言必须通过语法的组织和控制才能变成有意义的语言,语法关系就是词在组配之间的相互关系,主要是词与词之间的联合关系、偏正关系、主谓关系、动宾关系。如概念限定组配,就是通过主题词概念之间,一个概念对另一个或几个概念从时间、空间、专业范围、职能等方面进行限定或修饰,语法上构成偏正关系。第二,主题词之间必须有逻辑关系,避免单纯字面组配。如“红蜻蜓皮鞋”这一复杂的主题概念,不能用“红蜻蜓”和“皮鞋”两个主题词组配,因为“红蜻蜓”和“皮鞋”两个主题词在概念上没有逻辑关系或语法关系,前者是昆虫,后者是一种商品,若用字面组配,在检索时会出现混乱。检索“蜻蜓”这一主题时,会把“皮鞋”检索出来,而检索“皮鞋”这一商品时,又会把“蜻蜓”检出。因此,正确的概念组配应是“红蜻蜓牌商品———皮鞋”。

组配的结果,要求概念清楚、确切,含义专一,避免产生歧义。但是,词语在组合时,由于语法结构关系或语义关系、语序等因素的影响,会产生歧义现象,如“进口机电产品”存在偏正和动宾两种结构关系,“母亲的回忆”中“母亲”可能是施事也可能是受事,“两个工厂的劳模”中“两个”限制的可能是“工厂”,也可能是“劳模”。因此,进行主题词组配时一定要避免这种歧义组配,使表达的概念准确、专一。

三、人名卡片目录中的汉字排序问题

人名卡片目录(或索引),是将档案馆(室)所藏档案中涉及的人名情况经过简要著录,集中排列而成的一种目录。人名卡片目录的条目须按一定的顺序进行系统排列。现在常用的排列方法是按姓氏笔画的多少或按姓名的汉语拼音字母顺序。

笔画法是我国传统的人名排列方法,但是,姓氏中同笔画数的很多,如“张、何、陈、余、邱、邵、芦、苏、吴、闵、员、宋、沈、肖、杜、孝、杨、李、时、严、吝、来、辛、邰”都是七画。这就要求编目人员必须掌握笔画法排序的有关规定:先按笔画数从少到多排列,同笔数再按笔形顺序排列,起笔笔形相同的,再按第二笔的笔形顺序排列,依次类推。关于笔形的顺序,1964年汉字查字法工作组推荐了一种“札”字法,即“横、竖、撇、点、折”。笔画有主笔形和附笔形的区别。主笔形是一般的写法,附笔形是笔画在不同位置或部件中出现的各种不同变形。例如“提”是“横”的附笔形,“竖钩”是“竖”的附笔形,“捺”是“点”的附笔形。但是,同笔数、同笔形顺序的字,应该怎样排列呢?国家语言文字工作委员会1999年10月1日发布、2000年1月1日实施的《GB13000.1字符集汉字字序(笔画序)规范》规定了同笔画数、同笔形顺序字的定序规则:(1)主笔形先于附笔形,折点数少的先于折点数多的,折点数相同的,按折起笔的笔形顺序,折点数、起笔形都相同,依折笔后的笔形顺序定序。(2)按笔画组合关系定序:相离先于相接,相接先于相交。(3)按结构方式定序:左右结构先于上下结构,上下结构先于包围结构,字形比例小的先于字形比例大的。按照以上规定,前面24个姓氏的正确排序应该是“孝、严、芦、苏、杜、李、杨、来、肖、时、吴、员、邱、何、余、吝、辛、闵、沈、宋、张、陈、邵、邰。”同姓的按名字的第一个字排列,依次类推。这样,笔画法排列人名就有了统一的顺序。

按姓名的汉语拼音字母顺序排列人名,排检速度快,准确率高;不受简、繁字的影响;符合国际上大都按音序排检的习惯。但是,姓氏中有一些同音字,如“严、闫”、“张、章”、“曲、屈”,无法按音序法排列。解决这个问题的办法是音序法辅以笔画法,即按笔数由少到多排列,同笔数的按起笔笔形的横、竖、撇、点、折顺序排列,笔数和起笔都相同的按第二笔的笔顺排列,依次类推。这样,基本可以解决人名按拼音字母排序的问题。

上一篇:刺血疗法下一篇:高校青年人才