数字文献

2024-06-29

数字文献(共12篇)

数字文献 篇1

随着信息技术的发展, 数字技术对社会生活的普遍介入, 人们接受信息能力的不断发展和提高, 电子文献资源建设茁壮地成长起来。其较强的覆盖面与传播速度影响着人们对信息的获取方式与利用效率。尤其在图书馆工作中, 文献载体部分由纸质资源转变成数字资源, 随着比例的加大, 使我们不可避免地进入到复合图书馆时代。如何摆正纸质文献与电子资源的关系, 怎样把握两者在图书工作中的地位和作用, 达到两者互补共存、发挥各自优势, 两种资源合理配置、协调发展, 是我们应该认真对待的问题。

一、纸质文献回顾总结

纸质文献历史久远, 并有着几千年的文化积淀, 又称为传统文献资源, 属于实体馆藏, 主要形式有图书、期刊、报纸、图片、画册等, 其中图书、期刊、报纸对人类保存和传播知识信息起到了巨大的作用。它更符合人类阅读习惯, 无附加条件, 在任何有光线的地方均可阅读, 具有随意性和直观性。纸质文献资源的主要特征是文献信息内容以纸为载体, 以印刷为手段记录文字信息。我们的先人经过长期的生产实践活动, 发明了造纸术和印刷术, 人们长期以来形成的固定阅读习惯很难在短时间内改变, 即使在信息网络飞速发展的今天, 纸质文献仍是高校图书馆收藏的主要文献形式, 也是资源建设的主要部分。其主要有以下几个特点: (1) 阅读习惯的延续性。长久以来, 我们所获得的各项信息和知识都是通过传统文献。一些重要和珍贵的图书会作为人类文化遗产永远保存下来, 人们不会轻易放弃纸张印刷的出版形式。 (2) 携带随机性、保存持久性。纸质文献便于携带, 阅读方便, 随机性强, 具有观念的一览性, 一般不受阅读场所限制, 阅读无需辅助工具设备。 (3) 维护知识产权。纸质文献不具有涂改性, 可长久保存, 避免了数字资源的复制性、篡改性, 为捍卫作者的知识产权有一定贡献。

二、电子文献的认识

互联网和现代化传播技术的日渐普及和广泛应用为数字图书馆的建设提供强大的技术支持, 网络以其信息资源承载量大、传输速度快、传播范围广以及超时、跨界等特点日益受到广大读者的青睐。同时, 电子文献是一种新兴的文献, 它是信息社会文献载体形成、发展、进化的必然产物, 是以磁、光、电为介质, 以数码方式将文字、图形、声音等多种形式的信息存储磁、光、电等介质上, 通过计算机或具有类似功能的设备阅读使用。数字资源改变了传统信息资源的传播及利用方式, 对传统图书馆的经营方式、服务理念, 尤其是馆藏建设都带来了巨大的冲击。

电子文献的优越性: (1) 传播速度快, 范围广。世界上任何一个角落在网络环境下只需要几秒钟便可以得到所需的文献信息。 (2) 不受时空限制。数字化图书馆不受时空限制的远程高速特点及强大的检索查询功能使资源共享成为现实。 (3) 具有高度的整合性, 便于各种媒介信息的一体化。 (4) 能集成多元化信息。电子文献可以运用多媒体技术, 做到图、文、声并茂, 三维立体显示, 全面地再现信息的真实性。 (5) 交互性能强。由于数字信息存储在计算机能够识别的介质上, 因此随着计算机软件的更新与性能的日益提高, 用户逐渐具有更多主动性。

电子文献的的不足: (1) 阅读的不便利性。数字资源的使用和阅读必须借助于相应的信息技术设备, 必须有电源, 必须通过一系列特殊装置才能阅读。 (2) 图书馆数字资源建设的标准繁杂。数字资源的种类和形式多样, 给统一的计量和统计工作带来了很大的困难;数字资源的共享标准、协议制定困难, 这在一定程度上影响了资源共享。 (3) 在学术地位方面存在的问题。由于数字资源目前还缺乏统一的管理机制, 其信息的权威性、准确性、深度性变化莫测, 很难接受任何形式的同行评议或内容审查, 导致人们对数字资源学术权威性产生疑虑。 (4) 信息源复杂性。电子文献的信息来源比较复杂, 各种正式出版物和非正式网络信息交织在一起, 缺乏有效的统一管理机制, 信息安全和信息质量得不到有效控制和保证。

三、复合图书馆时代的到来

可以看到电子文献尽管具有诸多的优越性, 它迎合信息时代快节奏的工作方式和生活方式, 给人们带来极大的方便, 这些是纸质文献无法比拟的。但纸质文献以自身的价值和特点仍然受到人们的喜爱, 并弥补了电子文献的不足与局限。因此21世纪将是纸质文献与电子文献互为补充、彼此并存、整体结构比例逐步调整的世纪。电子文献代表着科学技术的发展方向, 它逐步渗透到人们的生活、学习环境当中, 随着科技的进步, 它所存在的脆弱性问题将逐步改观, 在文献收藏体系中的比例逐渐加大。复合图书馆就是在此大背景下产生出来的, 其有效地利用了纸质文献与电子文献的优缺点所建立的一种新型图书馆模式。

1. 复合图书馆的概念。

最早使用“复合图书馆”一词的是英国图书馆专家苏顿 (S·Sutton) 。他于1996年在一篇题为“未来的服务模式与功能的融合:作为技术人员、著作者和咨询员的参考馆员”的文章中, 将图书馆分成连续发展的四种形态:传统图书馆、自动化图书馆、复合图书馆和数字图书馆。苏顿提出“复合图书馆”的概念后, 立即得到英国电子图书馆计划主任路斯布里奇的赞赏。他在1996年11月修改了提交给电子图书馆发展计划工作小组的文件, 采纳了“复合图书馆”的提法, 并把这一概念介绍给广大的图书馆界, 使这一术语得到推广。

复合图书馆是以传统图书馆为基础, 实现传统图书馆与数字图书馆的共存互补与有机结合;是实体加虚拟, 围绕信息存储的物理场所和信息空间, 应用信息技术、数字技术、网络技术与传统技术, 根据版权法的规定, 对印刷型、电子型和网络信息资源进行收集、组织、转化、管理, 实现一体存取, 为信息用户提供馆内服务和不受时空限制的网络服务的机构。复合图书馆包括以下三个方面:一是信息载体多样化, 即在复合图书馆中, 传统印刷型文献资源与数字化信息资源互补并存。二是操作分工化, 使图书馆手工操作和自动化操作技术方法得到全面展现, 原有面貌获得改观, 也减轻了图书馆工作人员的劳动强度。三是管理服务集成化, 即强调对图书馆不同来源的技术和资源进行整合, 实现对传统文献资源与数字化信息资源的集成管理和服务。三是功能复合化, 即复合图书馆是传统图书馆与数字图书馆有机结合, 是优势互补的统一体。

2. 复合图书馆特点。

复合图书馆的诞生, 标志着传统图书馆、数字图书馆以其自身的特点、功能、作用、优势共同发展。它不是单独存在的形态之一, 是复合图书馆的另一组成部分, 在相当长的阶段里它与传统图书馆并存。传统图书馆是数字图书馆的母体, 数字图书馆是在传统图书馆基础上产生的, 并生成了图书馆系统又一分支, 与传统图书馆结合, 共同构建复合图书馆。其主要特点是:

⑴文献信息资源的多元化。传统图书馆主要收藏纸质文献, 而数字图书馆收藏的是电子文献, 在满足读者需要方面两者都有自己的局限。复合图书馆是传统图书馆与数字图书馆的整合, 文献信息来源丰富, 文献信息载体形式多, 既包含有传统的文献信息实体馆藏, 又包含有电子书刊及虚拟馆藏, 是电子文献和虚拟网络空间的电子信息资源。文献信息载体的多元化是随着社会的进步和科技的发展而产生的。复合图书馆必然以越来越多的数字化制品作为馆藏的发展趋势, 文献信息载体的演变过程, 也是一个多种载体长期共存、共同发展、互为补充的过程。作为图书馆工作对象的多种载体形式的文献信息, 是复合图书馆所表现出的最基本特征。

⑵综合业务技术, 提高服务质量。图书馆的最终目的是运用信息知识服务于社会, 满足读者的需求, 一切为读者着想。因此, 千方百计方便读者, 提高读者服务质量, 是图书馆首先要考虑的问题。作为现实存在的复合图书馆, 既保留和发展了传统图书馆的基本业务, 如珍贵文献的保存, 纸质文献的采、编、流阅、检索、摘编等, 同时也广泛开展了基于数字图书馆形式的电子阅览、远程检索、数据库建设等业务。传统图书馆与数字图书馆各有自己的优势和不足。两者有机结合于一体, 建立复合图书馆, 就可以实现传统服务与网络服务的一条龙。这样, 读者既可以使用传统文献, 也可以使用数字化文献;既可以亲自到馆查阅、借书, 也可以在单位或家里通过网络利用图书馆;既可以从图书馆获得系统、全面的知识信息, 又可以从网络上获得最新信息和资料。在一定意义上实现了各类信息资源共建、共知、共享。

⑶工作人员能力复合化。复合图书馆在某种程度上缓解了传统图书馆员的危机感和生存压力, 但并不意味着他们可以不思进取。恰恰相反, 未来的图书馆———复合图书馆需要大量的复合型人才。就是既要有图书馆学、情报学的基本技能, 又要有现代的信息技术、网络技术基础。复合图书馆人员结构的特性, 体现在数量上, 是图书馆专业技术队伍中的复合型人才比例在大幅提高。在质的变化上即传统的图书馆专业技术人员保留了传统图书馆的专业技术基础, 又逐步掌握了现代信息服务的技能, 专业面在拓展, 适用性更强, 由于工作的“复合”实现了工作人员素质的复合。那些拒绝接受计算机技术、数字技术及复合图书馆系统的人, 最终将被淘汰。

⑷体制和功能的一致性。复合图书馆是一个整体, 是图书馆发展过程中一种独立的形态, 传统图书馆与数字图书馆的复合, 不论是多元的载体形式, 传统和现代的工作方式, 还是机构的多元化, 人员的复合化, 均统一于复合图书馆这一整体。它遵循的是一致的工作原理和工作机制, 以服务社会, 提高国民素质, 促进经济发展为一致的目标, 仍然是一种非营利性的社会公益机构, 履行保存文化遗产, 促进知识信息交流的职能。由此可见, 数字图书馆的缺点正是传统图书馆的优点, 而传统图书馆的缺点正是数字图书馆的优点, 两者是共存互补、相互结合, 从而构成了世纪图书馆发展的新模式———复合图书馆。

在纸质文献与电子文献的长期互补期内, 广大读者既有对电子文献的需求, 又有对纸质文献的需求, 作为一个现代化的图书馆, 必须有数字化的前瞻性和敏感性, 未雨绸缪地推进相关工作, 做好电子信息资源的整合和服务。与此同时, 对纸载体期刊、图书的收藏也不能削弱, 这方面的服务也决不能放松, 特别是教学所需要的古籍、经典性原著以及各学科发展阶段中有代表性的、年代久远的文献, 在未能全部对其进行数字化处理之前, 还要十分珍视, 并注意充分发挥其作用。为了节约经费保证重点, 应调整文献采访的对策, 以适应网络条件下的新情况, 避免只把人力、物力投向数字图书馆, 而轻视纸质文献资源的投入和服务。在两者交融的基础上下工夫, 利用现代技术改造传统模式, 提高纸质文献的利用率。把馆藏文献信息资源和网络信息资源有机结合, 根据信息需求对纸质信息资源、网络信息资源和电子信息资源进行整理与组织, 形成科学的资源配置, 优化馆藏、建立起高校图书馆的文献保障体系。

参考文献

[1]张新.电子文献与纸质文献之比较[J].医学信息学杂志, 2007.

[2]赵艳红.电子文献与纸质文献的共享与互动[J].长春理工大学学报, 2004 (9) .

[3]杨忴.纸质文献和数字资源和谐发展的思考[J].焦作大学图书馆, 2007 (1) .

[4]彭运南.对我国数字图书馆工程启动的思考[J].江西图书馆学刊, 2000 (4) .

[5]初景利.复合图书馆的概念及发展构思[J].中国图书馆学报, 2002 (3) .

[6]张爱萍.论图书馆的新模式——复合图书馆[J].科技情报开发与经济, 200 (3) .

数字文献 篇2

地方文献是某一地区人类文化发展到一定阶段的必然产物,地域性是它最鲜明也是最本质的特征,具有很高的参考价值和实用价值,同时更具有得天独厚的优势与不可替代的特殊作用。社会主义市场经济的健康发展使人类社会对地方文献资源的需求量日益增加,对其专业性、数字化的要求更高。深入开发地方文献资源,已成为公共图书馆地方文献工作面临的新课题。

图书馆在长期的发展中不仅积累了大量的地方文献信息资源,还掌握了组织知识、管理知识的多种经验和方法。但是如何组织与管理好新型的地方文献信息资源,已成为图书馆的当务之急。为此,图书馆要广泛应用现代信息技术,将地方文献信息资源建成数字化、网络化的学术信息,以系统、高效、多样的地方文献数据库进行有针对性的服务。

馆藏历史文献数字化实践初探 篇3

[关键词]历史文献;数字化;实践

[中图分类号]G253 [文献标识码]A [文章编号]1008-0821(2010)05-0049-04

Preliminary Exploration on Digital Practice

of Collection of Historical DocumentsLiu Congming

(Library,Tsinghua University,Beijing 100084,China)

[Abstract]In this paper,the causes of the issue of duplication on digitization of historical documents were analyzed,and following the principles such as cooperation,themes and characteristics to avoid redundant construction were proposed.By comparison,a detailed analysis between two digital modes was given,and the corresponding digital processes by some examples was discussed.A digital process which is appropriate to historical documents combining with the digital practice of Tsinghua university library collection of historical documents were summarized.At last to improve and perfect the digital process was pointed out.

[Keywords]historical documents;digitization;practice

历史文献是文献的重要组成部分,也是图书馆的重要馆藏。不仅具有重要的学术价值,还具有较高的文物价值。长期以来存在着“藏”与“用”的矛盾,网络环境下这一矛盾日益突出。图像处理技术、存储技术以及信息检索技术的发展与完善为有效解决这一矛盾创造了良好的技术条件,为馆藏历史文献的数字化提供了坚实的基础。

1 历史文献数字化选题策略分析

历史文献的数字化并不是将所有的历史文献都数字化,更不可能同时将其数字化,必须对历史文献进行筛选,所以资源的选择问题是历史文献数字化首要解决的问题。从近年来历史文献数字化实践来看,多数图书馆主要是将具有馆藏特色、较高保存价值以及使用频率高的历史文献进行了数字化。例如美国国会图书馆,在上世纪90年代启动的“美国记忆”项目,就是将其馆藏的反映美国200年来历史和文化的历史文献进行数字化[1]。又如,1997年,国家图书馆将其具有馆藏特色的地方志、拓片、甲骨文等历史文献进行数字化,之后逐步形成以自建资源为主的特色历史文献资源库。

自上个世纪末历史文献大规模数字化以来,在规模和数量上取得了相当显著成绩,但同时也出现了一些影响历史文献数字化发展的问题。例如,在古籍数字化进程中的一个比较突出的问题是缺乏统一规划,项目集中在一些大型丛书或现成的汇编之上,而一些虽有价值但需要花费较大力气开发的古籍项目则鲜有人顾及[2]。如此的重复建设不但造成了资源的浪费,更不利于历史文献的开发、研究与利用。选题重复问题是学者们早就提出的需要注意的问题,但由于多种原因,确实出现了一些重复数字化的问题,例如多家齐上图像版《四库全书》[3],而且多数没有进一步的深层次开发,只是简单的重复建设。笔者认为,资源选题重复问题主要集中在《四库全书》、《四部丛刊》等大部头的历史文献。之所以重复,首先由于这部分历史文献属于热门文献,利用者研究者较多,无论是商业机构还是收藏机构都希望将其数字化;其次这部分历史文献数量大规格比较统一,数字化难度较小比较容易统一模板。针对这种情况有学者建议与其大家都争着搞《四库全书》,不如规避重复,另辟蹊径,打造特色精品,填补空白[4]。通过笔者多年的实践分析认为,在历史文献数字化选题时应采取以下策略:

11 主题原则

历史文献不同于一般的传统资源,各个图书馆收藏的种类范围有所不同。根据馆藏特点积极开展主题建设,不仅避免了历史文献数字化选题重复问题,同时也在一定程度上兼顾了数量较少但用户需求的历史文献。清华大学图书馆根据馆藏历史文献的特点,积极开展主题建设,收集了中国古代机械史典籍以及清华大学中国工程发明史编辑委员会抄录的卡片等历史文献,建成“机械史数字图书馆”[5]。将馆藏的中国古代重要水利典籍、民国时期水利著作以及有关中国水利史的研究论著等历史文献数字化,建成“水利史数字图书馆”[6]等主题鲜明的历史文献数字资源库。

12 特色原则

围绕特色进行历史文献数字化,在避免重复建设的同时还可建设特色数字化资源。北京大学图书馆具有丰富的善本古籍、普通古籍、金石拓片等珍贵的历史文献,充分考虑馆藏历史文献的特点,逐步将这些历史文献进行数字化,并建设成为包括古文献目录、图像、全文数据库在内的“秘籍琳琅——北京大学数字图书馆古文献资源库”,以便用户通过网络检索、浏览[7]。

13 合作原则

广泛开展合作是解决历史文献数字化选题重复问题的有效途径。在历史文献数字化过程中,如果能够广泛开展国内外合作,统筹规划,可以有效避免选题重复问题。2002年,由浙江大学和中国科学院研究生院共同牵头的CADAL项目[8],为国内众多高校图书馆馆藏历史文献的数字化提供了建设平台。各个参建图书馆,首先按照标准格式填写拟数字化清单,然后由指定图书馆进行资源查重,并返回正式数字化清单。按照剔除重复的正式清单进行数字化,有效地避免了资源的重复建设。

遵循主题原则、特色原则进行历史文献数字化建设,在一定程度上可以避免资源的重复建设,但也需要注意整个过程的标准规范问题,以及数字资源的发布利用平台的选择等相关问题,否则由于标准的不统一,将会给资源的整合造成不必要的困难,甚至需要重新进行数字化。在一定程度上,广泛开展合作更加有利于历史文献的数字化。

2010年5月第30卷第5期馆藏历史文献数字化实践初探May,2010Vol30 No52 历史文献数字化深度开发问题

解决了历史文献数字化的选择问题之后,摆在我们面前的便是历史文献的深度开发问题。加强历史文献数字化的深度开发,意味着对资源开发者在技术和思路上提高了要求,这将有效地限制诸多数字产品开发商的一拥而上、匆忙上阵,从而减少因低水平重复建设造成的浪费[9]。对目前正在进行的历史文献数字化工作具有现实指导意义[3]。

历史文献数字化的深度开发就是充分利用现有的数字化技术,从形式到内容多方面对历史文献进行数字化,不仅从利用形式上下功夫,更应该从历史文献的内容上进行深层次挖掘。有学者认为,今后至少可从三方面进行深度开发:提供基于超文本的立体阅读环境,建立强大的智能化检索系统,提供科学、准确的统计数据和信息分析[9]。因为历史文献数字化目的和作用,不仅是通过数字化减少研究人员查找历史文献的时间,更是利用先进的数字化技术,提供深层次的知识与内容服务。近年来南京农业大学,以重要的农业典籍《齐民要术》为主要信息源,搜集与其相关的综合性信息,如多个版本典籍、作者信息、相关著作、期刊论文、会议论文、学位论文、报纸资料等,以建设专题特色数据库的方式呈现给用户。其目的是尝试建设一个农业古籍数字化模型[10],从而进行古籍数字化基于知识层次的深度开发与利用。清华大学图书馆在历史文献数字化深度开发方面做了一些尝试,在“清华大学水利史数字图书馆”[6]历史文献资源库建设时,不仅将有关水利史的历史文献进行数字化,同时将这些历史文献中有关黄河、运河的全图提炼出来形成图像资源库,并对其进行标题、名称、来源等项目著录,研究者无需在原始文献中查找,可以直接使用,目前已经完成清代黄河全图79幅和运河全图107幅。

3 历史文献数字化操作主体问题

在馆藏历史文献的数字化操作时,操作主体将直接决定并影响历史文献数字化的整个过程,目前主要存在以数字化加工机构为主体的外包模式,以图书馆为主体的自建模式以及二者共同为主体的混合模式。

31 外包模式

在馆藏历史文献的数字化操作时,将全部数字化工作外包给数字化加工机构,以数字化加工机构为主体的外包模式,是早期图书馆数字化操作时的一种选择。外包模式具有一定的优越性,譬如,无需购买数字化设备以及引进专业人员,仅需支付数字化的费用;只需少许人员与外包单位人员配合即可,由于长期从事数字化工作,数字化效率较高;承担较少的风险,无需承担技术升级更新的费用。但也存在诸多不足之处,作为历史文献的拥有者,无法在资源数字化过程中积累经验;无法介入数字化过程,在质量和数字化流程中控制较少;相关标准规范必须事先制定,临时调整困难;数字化服务提供方对资源与用户需求了解少;文献资源必须进行传递与交接,需要完善的交接流程。

32 自建模式

近年来随着图书馆人才技术力量的发展,有些图书馆根据自身特点,开始以图书馆自身为主体,并承担全部的数字化工作,形成独具特色的自建模式。自建模式具有一定的优势,譬如,能够在建设过程中积累丰富的技术与管理经验,为资源数字化的研究提供第一手依据;能够完全控制整个数字化流程,及时调整数字化过程的标准、规范,为数字化建设打下良好的基础;能够确保原始资源与数字资源的安全,确保数字化流程的正常进行;能够直接参与到资源制作的全过程,能够对资源数字化的各个环节进行质量控制。然而自建模式也有一些不足,在数字化之前就需要对设备与软件进行大量调研;数字化技术与经验需要不断积累,数字化开始阶段数字化效率较低;需要大量资金的投入以及人员的管理。清华大学图书馆,2003年依托CADAL项目组建了资源数字化中心,几年来,参与并完成“水利史”、“机械史”、“清华文库”等多项历史文献数字化项目。在积累了比较丰富的历史文献数字化经验的同时,形成了一条完善的数字化生产线,目前拥有4台FB6080E零边距扫描仪、1台AV3800高速扫描仪、1台PS7000页面向上扫描仪。近期将再次启动CADAL项目的二期历史文献数字化项目的建设。

当然,在历史文献的数字化操作时,还有一些图书馆将部分特殊文献的数字化工作外包,其余文献的数字化工作自己承担,形成数字化操作的混合模式。

在讨论历史文献数字化操作主体时,有学者认为主要有三类机构,即大学教学和研究机构;各类图书馆,尤其是大学图书馆;各种商业性机构[11],并分析认为主体多元化是数字化工作中的混乱现象之一。通过清华大学图书馆馆藏历史文献数字化实践,笔者认为,由于历史文献的特殊性,多数历史文献比较珍贵,而且由于历时较久,不太适合打包装运,比较适合采取以图书馆为主体的自建模式。外包模式比较适合数字化规模巨大,资源交接相对简单的项目。至于混合模式,在操作时需要考虑标准规范的统一,否则容易造成标准的不统一,给资源的整合带来不必要的困难。其实随着历史文献数字化的深度开发,究竟谁是历史文献数字化工作的主体,自然不需要争论,因为历史文献数字化深度开发需要多方专家学者的力量才能逐步得以实现[9],图书馆作为专业的历史文献研究机构,不仅拥有丰富的历史文献,同时又有众多历史文献的研究者,理应在历史文献数字化工作中扮演重要角色,成为历史文献数字化工作的主体,至于科研机构主要是利用这些数字化资源进行研究,而一些商业机构也只能是历史文献数字化工作中数字化加工服务的提供者和参与者。

4 历史文献数字化操作流程问题

在某种程度上数字化的流程设计取决于操作模式的选择。下面讨论几种典型的数字化流程。

41 适用于外包模式的数字化流程

美国国会图书馆在实施数字图书馆项目时,将数字化流程划分为以下6个步骤[12]:(1)资料准备;(2)签订数字化合同;(3)数字化加工;(4)质量检查;(5)存档;(6)组织成用于Web输出的材料。

该流程是典型的外包模式下的数字化流程,正如“美国记忆”项目负责人里基•欧韦在项目介绍时所言,将数字化外包给数字化服务机构,选择这些承包人的标准是成本和成品质量,而不是转换方法[13]。由此可见该流程主要关注数字化成本与数字资源的质量问题,至于如何数字化以及数字化过程的技术与经验问题就不去过问,对于采取外包模式的单位是一个不错的参考。

42 适用于自建模式的数字化流程

国内一些机构将数字化流程总结如下,主要包括文献整理;扫描;OCR识别(如果需要实现全文检索,可采用OCR技术);图文编辑;图文质量;重新装订以及备份等环节,并要求支持工序反馈,形成一个质量控制系统[14]。该流程比较全面地考虑了数字化过程涉及到的每一个环节,比较适合自建模式的数字化。在扫描环节采用高速扫描仪,也就是要将文献拆分与重新装订,但由于历史文献不仅珍贵,而且纸质比较脆,在数字化时不宜进行拆装,可见历史文献的数字化不太适合该流程。当然对一些适宜拆装的现代文献,如此操作可以提高数字化效率。

我们在历史文献数字化实践中,总结形成下面的数字化流程,主要包括以下5个环节(见图1):

(1)资源选择:主要进行历史文献的选择与查重工作;

(2)资源扫描:采用适当的扫描仪将历史文献进行扫描;

(3)图像处理:主要包括前期图像处理(包括图像纠偏、去污等),图像格式的转换(由于不同用途需要的图像格式等不同);

(4)资源制作:主要进行目录制作、元数据著录、电子书制作,为资源的发布利用准备;

(5)后期处理:主要是针对合格的数字资源进行存储与备份,对于适合发布的资源进行发布利用。

从该数字化流程图可以看出,我们在数字化流程设计时比较注重数字化过程中具体的环节以及数字资源的质量控制问题。操作人员能够完全控制整个数字化过程,可以对每一个环节进行跟踪,并对数字化环节及时调整。当然,我们还有需要改进的地方,比如在流程设计中没有将数字化成本考虑进去,以及还需要将用户反馈环节列入其中,构成一个比较完善的数字化流程。

图1 数字化流程图

5 结 语

历史文献数字化是一个实践问题,从数字化选题到数字化操作都需要我们在实践中摸索与总结。历史文献通过数字化,一方面,可以减少对原始文献的接触使用,有利于历史文献的长久保存,实现了它的文物价值;另一方面,有利于历史文献的开发利用,实现了它的学术价值。历史文献数字化不仅解决了历史文献面临着“藏”与“用”的矛盾,同时也为历史文献的开发、研究打开了新的思路。

参考文献

[1]About the Collections(American Memory from the Library of Congress)[EB/OL].http:∥memory.loc.gov/ammem/about/about.html,2009-12-10.

[2]吴家驹.中文古籍数字化的进展与主要成果述评[J].南京师范大学文学院学报,2004,(9):178-183.

[3]李国新.中国古籍资源数字化的进展与任务[J].大学图书馆学报,2002,(1):21-26.

[4]潘德利.中国古籍数字化进程和展望[J].图书情报工作,2002,(7):117-120.

[5]清华大学机械史数字图书馆[EB/OL].http:∥elib.lib.tsinghua.edu.cn:9080/machined/htm/index.jsp,2009-12-17.

[6]清华大学水利史数字图书馆[EB/OL].http:∥hstc.lib.tsinghua.edu.cn/waterdb/index.jsp,2009-12-10.

[7]北京大学数字图书馆古文献资源库读者检索系统[EB/OL].http:∥rbdl.calis.edu.cn/pages/Introduction.htm,2009-12-10.

[8]高等学校中英文图书数字化国际合作计划[EB/OL].http:∥www.cadal.zju.edu.cn/index.action,2009-12-10.

[9]徐清,等.古籍数字化资源的深度开发[J].图书情报工作,2007,(3):95-97.

[10]曹玲.农业古籍数字化整理研究[D].南京农业大学,2006.

[11]陈得媛.古籍数字化工作统筹协调机制的构建[J].中国图书馆学报,2009,(5):47-51.

[12]彭绪庶,蒋颖.资源数字化标准问题研究[M].北京:北京图书馆出版社,2005:182.

[13]肖燕.图书馆职业英语系列•图书馆职业英语阅读[M].北京:国家图书馆出版社,2009:184.

古籍文献数字化建设探讨 篇4

一、古籍文献数字化建设存在的问题

1. 古籍文献分类方法繁多

古籍文献浩如烟海、内容庞杂, 概括起来可分为经、史、子、集四大部分;但是, 建立古籍文献数据库采用何种分类法一直是争论的焦点。在手工编目时期, 各图书馆便采用不同的分类法, 如《中图法》、《四库法》、《人大法》、《刘国钧线装书分类法》等。甚至有的馆咳出现了同馆数法的现象, 如在线装书中, 善本书利用《四库法》分类, 善本书以外的线装书利用《中文普通线装书分类表》进行分类。目前图书馆界专家学者的意见主要有两种:一种主张利用《中图法》, 一种主张利用《四库法》。古籍文献分类的不统一, 给古籍文献数据库的共建共享带来很大的困难。《四库法》集中国古代图书分类法之大成, 有较完善的分类体系, 在学术研究方面可以达到“辨章学术, 考镜源流”的目的。但其分类较粗, 类目较少, 尤其是近代出现的一些科技方面的图书利用《四库法》就存在无法入类的问题。《中图法》科学性强, 编制技术先进, 体系完备, 且不断修订, 适应科学技术发展的需要, 也适合广大读者的检索习惯。但由于古籍文献常常是文史哲不分家, 因而有的古籍不能恰当地按《中图法》进行分类。对古籍编目而言, 两种分类法各有千秋, 也各有利弊。笔者认为, 在古籍文献数据库建设工作中, 对一部古籍文献, 既著录《中图法》的分类号, 也著录在《四库法》中的类目, 形成两个完整的分类检索体系, 使古籍分类更趋完善, 更能满足读者的阅读需要。

2. 古籍文献数字化产品的保存风险问题

古籍文献数字化建设是一项非常复杂巨大的系统工程, 其成果数字化古籍产品无疑是众多专家学者的心血结晶。因此, 古籍文献数字化的保存相当重要。据笔者了解, 目前全国关于数字化古籍保存风险的讨论甚少, 更谈不上制定古籍文献数字化产品的保存规范。众所周知, 传统古籍存在单独实体, 平时能够总体把握实体的损毁情况。数字化古籍储存在硬盘、光盘或其他载体中, 由于长期的物理和化学过程也会造成载体的物理劣变、机械磨损或毁坏;不可预料的自然灾害 (如火灾、洪水、地震等) 以及数据保存人员的变动等均可造成难以逆转的数据丢失。

3. 古籍文献数字化建设中的重复投入问题

前人留下的古籍文献数量繁多, 而且比较分散, 因此仅靠一个单位或组织进行古籍数字化工作是不现实的。目前中国的古籍数字化工作缺乏统一的机构协调指导, 加上开发单位, 尤其是一些急功近利的商业机构加入到古籍数字化队伍中, 造成热点项目重复建设, 冷门项目无人问津的现象。要避免古籍数字化过程中的重复投入, 就应该走协同合作之路。可成立全国性的古籍数字化建设领导小组, 将与古籍有关的教学研究机构、收藏机构以及进行古籍数字化工作的商业机构纳入管理范围, 多家参与联合共建, 以统筹规划古籍数字化建设工作。

4. 古籍文献数字化的人才培养问题

在古籍数字化过程中, 最重要的工作是要在录入文本前对古籍进行整理。古籍整理人员不仅要掌握中文古籍文献的分类、版本鉴定、编目, 而且还要会编制数据库, 懂得计算机网络、多媒体等现代信息技术, 能利用现代化的科技手段来研究古籍文献。而目前较为普遍的现状是古籍整理专业人员不懂信息技术, 而信息技术人员对古籍知识又缺乏一定的了解。国家图书馆陈力研究馆员曾提到该馆进行“数字方志”项目时, 由于录入人员水平有限, 将大量的异形字、异体字和简繁字视为不同的汉字加以录入, 不仅增加了录入工作量, 更对检索系统产生重大影响, 同时也阻碍了数字化古籍“知识发现”功能的实现。古籍数字化对从事古籍整理的研究人员提出了更高的要求, 为确保古籍数字化工作的顺利进行, 图书馆要加强古籍数字化专门人才的培养, 目前业界急需一批既精通古籍知识又能熟练运用信息技术的复合型人才。

二、古籍文献数字化建设发展对策

1. 成立古籍文献数字化建设领导小组

古籍文献数量庞大, 且分散各地, 仅由一个单位或组织来负责完成某一专业领域的古籍数字化建设是非常困难的, 需多方合作才能进行。而目前国内古籍数字化工作尚缺乏全国性的权威机构统一协调和指导, 导致各开发单位各自为政, 热点项目重复建设, 冷门项目无人问津等现象。如1998年光盘版的《四库全书》在国内至少出现了三种, 造成大量人力、物力和财力的浪费。为此笔者建议, 要由国家古籍保护中心、全国古籍整理出版规划小组和全国高校古籍整理研究工作委员会联合成立古籍文献数字化专门领导小组, 负责审批全国范围古籍文献数字化建设的选题和立项工作, 加强宏观调控和指导, 剔除重复的古籍文献数字化项目和意义不大的古籍数字化项目, 将有限的资金用于有意义的重点的古籍数字化建设项目, 减少古籍文献数字化的重复建设、资金浪费等问题。

2. 加大古籍文献数字化建设的开发力度

古籍文献不同于一般的文化遗产, 它的艰涩难懂和“深闺秘藏”使其在研究开发和利用等方面都存在一定的局限性。近年来, 国家有关部门与省市和部分高校图书馆做了大量的古籍文献数字化建设工作, 如山东省图书馆于1996年至1998年4月完成的善本书目的回溯建库工作;上海大学图书馆在1996年将善本古籍以图像形式扫描, 制作成全文光盘;国家图书馆建立了《二十五史艺文经籍志目录电脑检索系统》, 为读者提供现代化的古籍目录检索手段, 但大量的古籍文献仍处于象牙塔之巅。因此, 要加大古籍文献的宣传和开发力度, 广纳资金, 扩大古籍文献数字化建设范围, 积极拓宽古籍文献的开发利用渠道, 充分发掘古籍文献的价值与财富, 以更好地传播中国文化。

3. 注重古籍文献数字化建设的人才培养和管理

古籍文献数字化建设工作是一项艰巨而复杂的系统工程, 它不仅要求研究人员要掌握古籍文献的分类、版本鉴定、编目, 还要会编制数据库, 懂得计算机网络、多媒体等现代信息技术, 即需要既懂古籍文献整理又精通计算机网络技术的专门人才。对这些专门人才的培养, 可以通过调整高校相关专业人才培养目标和培养方案得到解决。如可在古典文献学专业中加大现代信息技术和计算机知识的内容和深度, 也可在图书馆学专业、古典文献学专业中适当吸收计算机专业人才攻读硕士研究生。另外, 对在职的图书馆工作人员则可通过参加各种形式的培训方式来提高古籍文献工作人员的业务水平。

古籍文献是中华民族的宝贵精神财富, 也是人类文明的瑰宝。数字化的古籍, 不仅可以加快数字图书馆建设的步伐, 有效地传承了中华民族的优秀文化遗产;而且可以为不同需求的读者提供快捷方便的信息服务。尽管古籍文献数字化建设工作中尚有很多问题亟待图书馆界同仁研究和探讨, 但可以想象, 在不远的将来, 古籍文献数字化建设工作将发生实质性的变化, 读者足不出户就可以查阅自己所需要的古籍文献, 实现真正意义上的古籍文献资源共享。

摘要:古籍文献数字化是网络环境下古籍文献整理的新方式, 探讨了古籍文献数字化建设存在的主要问题并提出了古籍文献数字化建设发展对策。

关键词:古籍文献,数字化建设,对策

参考文献

[1]王发社.古籍数字化的几点思考[J].图书馆论坛, 2006, (3) :121-122.

[2]龚娅君.古籍文献数字化建设的几点思考[J].现代情报, 2008, (12) :95-96.

[3]刘春金, 吕瑛, 王劲松, 郑红月, 杨炯声.中文古籍数字化现状分析[J].江西图书馆学刊, 2008, (2) :112-114.

图书馆数字文献练习题 篇5

1、利用我馆书目查询数据库完成以下练习题:(注意:书的种数和本数是不一样的,一种书一般图书馆会采购多本,一条结果记录就是一种图书信息。)

(1)请问《孤星血泪》是谁的作品?他是哪国人?列举出三种该作者的其它著作。

(2)分类号是“G22”的是关于哪方面内容的图书?(通过主页左方的分类查询链接)馆藏有多少种?

(3)请检索2000年以后出版的图书中姓“李”的作者并且是有关于“影视”方面的图书共有多少种,并写出检索条件以及与本人学号尾数相同的记录编号的图书书名、作者、价格,该书目前的借阅状况?是否已借出?馆藏分布情况如何?同时查出我馆收藏有该作者的著作种数是多少?

(4)请用题名途径检索有关“信息检索”的书籍,要求分别用“前匹配”、“任意匹配”和“精确匹配”条件来进行检索,分别查出相应的检索结果。

2、进入我的书斋进行相应的了解和使用。(通过网上续借链接进入)

3、查阅自己的借阅情况。

4、进行一次网上续借操作。

5、了解我馆的其他服务

二、CNKI练习题

1、熟悉CNKI的全文数据库界面及其组成。

2、认真查看帮助信息。

3、下载相应的阅读器,并进行安装。

4、操作练习题。(备注:若题目中未有具体的时间要求,则检索时,时间范围选择1994至今)(1)利用中国学术期刊全文数据库,在自己的学科专辑中检索2001年以来“国家自然科学基金”资助的与所学专业相关的论文。

(2)在医药卫生科技专辑中检索有关吸烟与肺癌关系方面的文献。

(3)在信息科技专辑中查找,在《光学学报》上发表的并参考了朱士群老师文章的文献。(4)在基础科学专辑中检索:查找大气物理学家黄荣辉发表的文章中引用曾庆存的情况;检索黄荣辉发表的文章中自引的情况。

(5)查找Internet技术在教学应用方面的相关文献。

(6)查找“中小企业”以外的有关“电子商务与网络营销”的文献。(7)查找赵长林撰写的“课程改革”以外的所有教育类文献。(8)在社会科学2辑中检索G250类的文献数量。

(9)在所有专辑中检索董景荣老师历年来发表文献的情况,并查出该老师以第一作者身份发表任一文章的第一篇参考文献的题名及其作者。(10)在所有专辑中查找,在《重庆师范大学学报》上发表的并参考了牟映雪老师文章的文献。(11)统计2005年重庆师范大学的教师和学生发表的以‘课程改革’为主题,但篇名里没有出现‘课程改革’这一词汇的文献数量。

(12)查找论述广告与文化方面的文献,但不包含传统文化。

(13)查找论述红学中贾宝玉和林黛玉关系方面的文献,且标题中应包含爱情一词。

三、其他数据库练习题

1、维普数据库操作练习题。(备注:若题目中未有具体的时间要求,则检索时,时间范围选择1989至今)

(1)从期刊导航途径查找一种与你专业或你感兴趣的相关的期刊杂志,并试着以PDF格式下载。

(2)日本的茶道艺术与文化和中国的茶文化有着源远流长的关系,请查找有关对二者进行比较分析的文章。

(3)查找我校自己学院的某一位教师的论文收录情况。

2、万方数据资源操作练习题:

(1)利用学位论文全文库查找电子商务环境下信息安全管理方面的文献2篇。(2)通过我校的“万方数字资源系统 之博硕论文(本地镜像)数据库”,查找与你所学专业相同的一篇毕业论文。并试着对文章内容进行复制粘贴。

数字文献 篇6

关键词:数字图书馆 文献计量分析 CNKI 可视化

中图分类号: G250.76;G250.252 文献标识码: A 文章编号: 1003-6938(2013)05-0072-06

1 引言

数字图书馆是对图书馆的虚拟化,不仅可以实现纸质图书、期刊文献的电子化,而且极大地促进了文献信息的跨时间、跨区域交流。因此,数字图书馆是图书馆服务的一次革命性转变,从根本上突破了传统图书馆的时空限制[1]。自从20世纪90年代初美国科学家首次提出数字图书馆这一概念以来,数字图书馆的相关技术研究就迅速进入学术研究的视角,我国从1994年开始对该领域的相关理论和技术进行研究[2]。本文基于CNKI中国期刊全文数据库,拟从论文文献的年代分布特征、高被引论文的期刊分布、高产作者分布和高频关键词分布等角度分析国内数字图书馆领域的研究现状,强调数字图书馆相关技术的研究价值和研究方向,从而为国内的研究学者提供一定的参考,为促进数字图书馆领域的快速发展提供数据支撑和理论支持,以推进数字图书馆研究的进一步突破。

国内已经发表了一些和数字图书馆文献计量分析相关的文献,从这些文章的研究内容来看,《近十年我国数字图书馆学术论文的计量分析》对2000~2010年数字图书馆领域发表的2062篇学术论文进行了作者、主题、时空分布分析[3], 《以用户为中心的数字图书馆个性化服务研究的文献计量分析》从年代分布、主题分布以及作者分布角度分析了2002~2011年的997篇期刊文獻[4],《国内近十年数字图书馆领域研究热点分析——基于共词分析》基于1999~2008年CNKI数据库收录的1356篇学术论文重点进行了关键词共词分析[5],《基于Web of Science的数字图书馆研究论文定量分析》统计了1993~2004年SCI和SSCI数据库收录的819篇文章的时间、期刊、被引频次、作者分布情况[6],《近6年我国数字图书馆研究论文定量分析》对1996~2001年间24种图书馆学情报学期刊发表的618篇文献进行较为全面的论文年代、主题、来源期刊和作者分析[7],《1999~2008年我国数字图书馆研究论文的计量分析》则选取了1999~2008年间CNKI收录的13727篇论文进行了较为系统的核心作者群、高产作者群、关键词分析[8]。

可见,这些研究主要局限在2008年以前的论文分析,缺少对我国数字图书馆近期成果的分析。另一方面,多数论文的分析主要针对某一个方面,如仅以关键词进行共词分析或仅针对国外文献的分析,为了弥补现有文献的不足,本文针对2008~2012年CNKI中发表的数字图书馆论文展开分析,以帮助学人了解我国数字图书馆领域最新研究状况,促进我国数字图书馆研究与实践更加健康快速发展。

2 数据来源和处理方法

CNKI中国期刊全文数据库是我国收录学术信息最为全面的数字资源。选择CNKI作为数据来源分析我国数字图书馆的研究可以较为全面地把握该领域的研究现状。但是由于《数字图书馆论坛》、《情报学报》等期刊并没有收录在CNKI中,一定程度上影响到研究数据的完整性。为了弥补中国期刊全文数据库期刊收录方面的不足,本文基于万方学术期刊全文数据库对《情报学报》、《数字图书馆论坛》两本期刊进行了全面的数据调研。两种期刊在2008~2012年间共收录数字图书馆方向的文章267篇,其中《数字图书馆论坛》的载文量达到245篇。

考虑到研究国内数字图书馆发展现状的时效性、精准性和全面性的要求,本文在CNKI中国期刊全文数据库和万方学术期刊全文数据库中,将主题字段“数字图书馆”和中图分类号字段G250.7进行检索或运算,发文年代限制为2008~2012年,同时选用期刊全文数据库将文献类型限定为论文类型,共检索得到有效文献数20152篇。

本文主要采用文献计量学方法以及共词分析法进行研究。文献计量学方法是基于数学、统计学等学科,对文献进行定量分析的方法。而共词分析法则是一种利用专业术语(通常选择关键词)进行共现分析,以揭示内容结构特征的文献统计学方法。

本文使用的辅助软件工具是一种基于.NET平台和c#高级程序语言的文献题录信息统计分析工具SATI。这种统计分析软件可以实现导入并处理EndNote格式、NoteExpress格式及NoteFirst格式的国内文献题录信息和HTML格式的WoS国际文献题录信息。同时还可以利用该软件进行数据格式的转换、字段信息的抽取、词条频次的统计和知识单元共现矩阵、词条频率逐年分布矩阵及文档词条矩阵的构建[9]。

3 定量分析

3.1 文献年代和学科分布

通过一个研究领域的文献年代分布研究,可以分析出该领域的研究走势。根据文献增长规律特征,一个领域在研究初期文献量呈指数增长,发展到鼎盛时期增长变缓,成熟后数量会逐步下降。为了考察数字图书馆研究的成长性,本文统计了2008~2012年CNKI收录的数字图书馆的期刊论文(见表1)以及其年化分布趋势图(见图1)。

由表1可以看出,2008~2012年我国数字图书馆领域每年的发文总量都在3600篇以上,2008至2009年的发文量更是突破了4000篇。但是2009年以后每年的发文量呈现出明显的下滑趋势。由图1可以发现,2009年是2008~2012年数字图书馆发文量最多的年度。自2009年之后发文量出现明显下滑。本文查阅文献[10]后发现,在2000~2008年期间,数字图书馆文献一直处于上升期,但后几年的上升出现了缓慢情形,因此2009年应该是数字图书馆发展的顶峰时期。技术的发展标志着将会有新的技术取代数字图书馆,就像10多年前图书馆自动化被数字图书馆所取代一样,所以在未来的数字图书馆发展历程中,云图书馆技术也许会取代数字图书馆技术。

nlc202309030515

数字图书馆的发文情况还可以从学科角度深入分析。每年数字图书馆领域发文的学科分布除了可以了解热点发文年限,还能够更深入地着眼于其多学科性质和重点学科的研究。基于CNKI中国期刊全文数据库的学科统计功能,图2形象直观地显示了2008~2012年图书情报与数字图书馆和计算机软件及计算机应用学科的发文情况。根据CNKI学科类别载文量的统计,这两个学科的总发文量是每年最多的,占全年数字图书馆领域发文量的90%左右,因此选择这两个学科进行分析具有一定的代表性。

从图2可以看出,2008~2012年图书情报与数字图书馆学科的发文量比较稳定,基本保持在3500篇左右。但是计算机软件及计算机应用学科的发文量变化波动比较明显。尤其是2010年以来,在数字图书馆领域发表的研究论文有所下降,2012年的发文量甚至不足500篇。从学科角度可以看出,数字图书馆的技术问题已基本解决,计算机领域在探索并考虑如何用新的技术和理念取代数字图书馆,这也和数字图书馆的成熟以及论文数量的下滑形成呼应。

3.2 代表性期刊分布

代表性期刊分布可以有效地引导研究者的阅读方向,研究者可以反复研读和参考这些业内的权威期刊,在把握现有学术成果的基础上获取学术灵感和潮流化的研究主题。表2直观地显示了CNKI中国期刊全文数据库数字图书馆领域篇均被引排在前20位的核心期刊以及通过万方数据库检索得到的《情报学报》和《数字图书馆论坛》两种期刊。这里的篇均被引频次指标,是通过期刊2008~2012年数字图书馆领域的总载文量和这些论文的总被引量相除得到的。

由表2可以看出,这22种期刊都是图书情报领域期刊,大多数是图书情报领域的核心期刊。这些期刊的数字图书馆论文的篇均被引频次基本在两次以上,最高的甚至达到10次左右。另外根据CNKI的期刊发文量统计,仅仅2008~2012年,数字图书馆领域载文量在115篇以上的期刊就有40种,其中包含了《医学信息学杂志》、《中国科技信息》、《科技咨询》、《农业图书情报学刊》等多学科方向的各种期刊。

这些数据有力地证明了数字图书馆研究是图书情报学科的一个重要领域。图书情报学期刊非常重视数字图书馆领域的论文发表。同时数字图书馆研究也受到其他学科相关领域的重视,具有实用性和多学科性的研究特征。

3.3 高产作者分析

高被引文献的作者一般都是具有一定学术影响力的学者。这些专家学者在自己的专攻领域或多或少都有一定的建树,所以他们的学术研究成果比较具有说服力和权威性。因此,了解他们的知识结构和主攻方向显得尤为重要。基于2008~2012年的统计数据,数字图书馆领域的高被引文献作者的基本情况如表3所示,其中篇均被引频次指标是通过CNKI高发文量作者的详细发文情况列表,统计出发文总量和被引总量,然后相除得到的。

根据表3,这些学者五年来的发文量基本都在10篇以上,篇均被引頻次保持在4次以上。他们所从事的工作、职务基本都是大学教授或是图书馆研究员。从这些数据可以发现,这些专家学者在数字图书馆研究领域已经取得相当的成绩,已经有学者大量参考和引用他们的学术成果。另外还可看到,武汉大学、中山大学以及中国科学院国家科学图书馆是高度重视数字图书馆领域的研究机构。因此,重视这些专家学者的论文发表成果以及密切关注这些研究机构的研究动向,将有助于数字图书馆相关技术的研究突破。

3.4 国家基金项目资助情况分析

针对某一具体研究主题的基金项目资助情况分析,尤其是国家级项目的支持情况分析,可以挖掘出相应主题的学术地位以及受重视程度。基于CNKI中国期刊全文数据库的基金项目统计功能,表4统计了2008~2012年国内数字图书馆领域国家级基金项目数量变化情况。

从表4的统计数据来看,尽管国家级基金资助项目的总量出现一定的波动:2009~2011年三年来国家基金支持的论文发表总量明显下降。但从2008~2012年的总体发展趋势来看,国家对数字图书馆研究的支持并没有大幅度削减,尤其是2012年,发表论文的总量又重新回升至120篇。这些数据表明国家并没有减少在数字图书馆研究领域的投入,数字图书馆领域仍然是国家较为关注的前沿研究方向。

国家自然科学基金和国家社会科学基金是国家支持基金中的两大具有代表性的基金项目。从表4的统计数据可以看出,国家社会科学基金支持的论文发表总量要显著高于国家自然科学基金。这一定程度上是由社会科学和自然科学的学科性质决定的。在数字图书馆领域,自然科学关注更多的是技术的实现,而社会科学则更多地从管理角度着手进行研究。因此,自然科学基金支持的论文发表量的下降并不说明数字图书馆研究重视度的下降,因为要在现有完善的技术层面上取得突破需要更多时间和精力的投入,以及更有新意的选题。

3.5 高频关键词分析

关键词往往是文章的核心切入点,对文献关键词进行分析可以全面把握文献的内容结构,同时还可以推断出某一具体学术领域的研究热点和方向,给予研究者在学术选题方面一定的参考,更好地着眼于前沿研究主题。表5统计了国内数字图书馆领域使用频次在160次以上的关键词并且进行了关键词的简单整理:将同义的关键词进行合并,同时将“管理”、“服务”等不具实际含义的关键词排除。

根据表5的统计数据,可以简单地概括出2008~2012年数字图书馆领域的研究热点。云计算、数据库构建、知识产权保护、知识服务、个性化服务、元数据、信息资源共享、数据资源管理等主题一直是2008~2012年备受欢迎的研究主题。另外高校图书馆作为数字图书馆的一种,也成为学界较有影响力的研究热点。当然,仅仅从关键词频次的角度来推断某一具体研究领域的研究热点还是远远不够的。研究关键词之间的共现关系,构建出关键词内容之间的网状关系结构对于分析相应主题领域的研究热点是个很好的补充。因此,本文使用ucinet和sati软件对五年来被引频次在10次以上的文献关键词进行两两共现关系统计,构建出使用频次在8次以上的四十个关键词共词矩阵,并通过ucinet的可视化制作软件利用有向性指针呈现出来,如表6所示,其中节点数字分别表示关键词频次降序排列的序号。

nlc202309030515

根据共现知识图谱(见图3)可以看出,数字图书馆处于网络节点的中心位置,其中介中心性最大,是网络中最重要的节点,其他节点围绕中心节点紧密联系[11]。根据图3中有向性指针的标注情况,一些重要的共现关键词显而易见。基于高频关键词统计表和知识图谱可以归纳出2008~2012年数字图书馆领域的研究热点:

(1)数字图书馆技术的发展在很大程度上推动着学术成果的交流,因此知识服务成为数字图书馆领域研究的一大热点。知识服务的研究重在服务模式的构建和个性化服务的研究。

(2)云计算、RFID、开放存取技术这些新兴技术是数字图书馆研究过程中重要的技术支撑。从知识图谱可以看出,在进行数字图书馆具体技术研究时,这些新兴技术往往被同时涉及。云计算的研究强调数字图书馆的移动性,而开放存取技术的研究注重一个重要概念——机构知识库,以便推动信息共享空间的进一步扩展,RFID技术的研究则着眼于现有的网络环境。总之,对于新兴技术的研究也是数字图书馆领域研究的热点主题。

(3)数字图书馆的研究内容涉及方方面面,高校数字图书馆、移动数字图书馆、泛在数字图书馆、手机图书馆都是较受关注的研究领域。无论是手机图书馆、移动图书馆、还是泛在图书馆都强调在3G网络环境下,跨越时间和空间的限制对图书馆信息资源的共享。而高校数字图书馆更偏向于个性化信息共享服务和图书馆联盟方式的研究。

(4)数字图书馆最重要的是数字资源管理,因此信息资源整合、信息资源的共享、特色数据库的构建成为数字图书馆领域研究的一大热点,这些数据服务研究趋向于一种趋势——网络环境下的图书馆联盟建设,尤其是高校图书馆。至于具体技术的实现,有些专家学者将其与云计算技术紧密联系在一起。

4 结语

在信息化时代,数字图书馆作为一个新兴的研究主题一直备受学界关注。本文选取了2008~2012年度CNKI中国期刊全文数据库和万方学术期刊数据库的文献数据,并对其进行年代、学科、高产作者、代表性期刊、高频关键词、项目基金支持情况以及热点研究等方面的定量分析,用数据说话,客观地揭示了五年来数字图书馆领域的发展现状和研究热点,以便给予研究专家一定的学术参考,从而取得更大的学术突破,进一步推动国内数字图书馆的研究进展。

从2008~2012年五年的文献数据来看,2009年是数字图书馆发文的峰值年,发文量是五年来最高的,此后的文献量呈现出明顯的下滑趋势。因此,2009年是数字图书馆研究过程中的重要转折点。在这种文献背景下,数字图书馆的研究很有可能出现研究角度转移的趋势,就像10多年前图书馆自动化被数字图书馆所取代一样。另外,数字图书馆的研究是一种理论和实践的完美结合。图书情报学科主要着眼于理论方向的研究,许多研究成果刊载在本学科的核心期刊上,而计算机软件及计算机应用学科则更多关注数字图书馆技术层面的研究。从这两个学科每年的发文量可以看出,随着数字图书馆实现技术的逐步完善,理论方向的研究开始处于主导地位。当然,数字图书馆研究的不断突破离不开一批专业知识深厚、投入全部研究精力的专家学者的支持。更为重要的是,国家对数字图书馆研究也表现出高度重视,每年由国家基金项目支持的论文数高达百篇左右。

综上所述,专攻数字图书馆研究的专家学者如果对选择的主攻方向始终满含自信,并着眼于当前数字图书馆的研究热点,从中找出新的突破点,不仅能够实现个人研究的飞跃,还能从宏观上推动国内数字图书馆研究的发展进程。

参考文献:

[1]苏新宁,李思舒.我国数字图书馆研究十年:概况统计分析[J].数字图书馆论坛,2011,(5):2-11.

[2]苏新宁,夏立新,胡守敏等.我国数字图书馆研究十年:基于科研项目分析[J].数字图书馆论坛,2011,(5):12-19.

[3]刘成山,张秀君.近十年我国数字图书馆学术论文的计量分析[J].现代情报,2011,(3):113-116.

[4]张小平,张争,杜媛鲲.以用户为中心的数字图书馆个性化服务研究的文献计量分析(2002年~2011年)[J].农业图书情报学刊,2012,(11):47-52.

[5]董伟.国内近十年数字图书馆领域研究热点分析——基于共词分析[J].图书情报知识,2009,(5):58-63.

[6]周静怡,孙坦.基于Web of Science的数字图书馆研究论文定量分析[J].情报科学,2005,(10):1521-1525.

[7]王惠翔,高凡.近6年我国数字图书馆研究论文定量分析[J].图书情报工作,2002,(5):37-40.

[8]邱均平,王明芝.1999-2008年国内数字图书馆研究论文的计量分析[J].情报杂志,2010,(2):1-5.

[9]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012,(1):50-58.

作者简介:杨彭(1992-),女,南京大学信息管理学院情报学专业本科生。

议民国文献的数字化 篇7

1 民国文献的数字化

国内对民国文献所采用的保护方式普遍沿用古籍保护的原生性与再生性两种方式。但由于民国文献先天纸质的脆弱, 加上又是双面印刷, 其保护与修复工艺至今尚在探索中。因此在还没有找到安全、高效、经济的原生性保护手段之前, 相比较而言, 数字化无疑是民国文献再生性保护的最佳选择。

目前, 对于大部分图书馆馆藏纸质载体民国文献的数字化制作方法有两种:

第一种是通过光学字符识别软件———OCR汉字识别软件, 把民国文献的信息资源内容录入计算机, 制成文本等文件类型;

第二种是通过缩微影像技术与扫描仪设备将民国文献的信息内容扫入计算机, 制成图像型文件资料[2]。

通过这两种基础性的文献数字化信息的整理、存储、传输, 不仅节省人力成本, 提高工作效率, 提高图书馆现代办公自动化程度, 更重要的是适应了计算机技术、网络通讯技术等数字化技术在图书馆建设的大规模应用的时代需要。

民国文献的数字化主要包括3个方面, 即民国文献组织管理的自动化、内容的数字化、传输平台的网络化[3]。

2 民国文献数字化存在的问题

随着民国文献数字化越来越被国人所重视, 许多民国文献馆藏机构也相继开展民国文献数字化建设, 但由于缺乏资金或相关经验等因素, 民国文献数字化建设还存在一定的问题亟待解决。

2.1 文献扫描加工质量良莠不齐

将民国文献完全数字化至少要经历两个流程:一是将, 扫描后的图片进行两次校对, 然后制成PDF文档, 刻录成光盘保存;二是, 将图书的目录、版号、出版时间、出版社等信息录入电脑, 然后对所有图片、录入信息进行一一核对。此项工作繁琐但技术性很强, 每个环节都要一丝不苟, 但由于扫描加工人员未经专门培训等原因, 致使文献扫描加工过程中出现诸多问题。

2.2 民国文献检索系统错误繁多

以上扫描加工的质量问题最直接的后遗症就是导致重图民国文献检索系统错误繁多, 如书名、出版时间录入有误, 一些文章有目录但无全文内容等等。

2.3 扫描时未注重保持书刊原貌, 图片扫描精度不高

由于经费和技术的限制, 民国文献数字化过程中未能完全扫描书刊全貌, 致使读者无法在阅读的过程中感受到民国文献的时代色彩, 另外, 扫描仪器分辨率的局限性使得图片无法精确呈现, 也是数字化过程中亟待解决的难题。

2.4 文献损毁严重[4]

虽然在数字化的过程中, 对民国文献采取了一定的保护措施:如扫描前将图书作区分, 针对有复本的图书, 只选择其中一本拆开做分页扫描, 扫描后再重新装订等, 最大限度的减少对民国文献的损毁, 但是效果仍不如人意, 部分图书在经过扫描加工后仍出现不同程度的破碎。

3 民国文献数字化的建议

3.1 转变文献保护观念

民国时期被学术界认为是中国“第三个诸子百家时代”, 文化与学术发展上承晚清西学东渐的遗绪, 此时的众多著名学者秉承传统中国文化, 吸纳西洋现代文明精神, 是学术发展的黄金时期, 民国文献不乏学术珍品。因此, 我们应转变文献保护观念, 将民国文献纳入新善本之列。

3.2 加强民国文献保护研究, 原生性保护与再生性保护并重[5]

为避免我国悠久的文献历史在我们手中出现民国时期的断层, 图书馆界应转变观念, 予民国文献保护工作以充分重视, 将原生性保护与再生性保护并重, 既要保护民国文献的原貌, 也要使其传承下去。

3.3 制定民国文献数字化的统一标准

民国文献数字化建设应建立统一的标准, 避免因该机构情况不同而导致的质量参差不齐。

3.4 资源共享, 避免重复加工造成的文献损毁和人财浪费

应由权威部门出面建立全国民国文献数字化加工指导小组, 统一指导协调各馆开展民国文献的数字化工程, 在统一标准的基础上对各馆已经完成的民国文献数字化资源进行清理, 建立共享资源数据库, 避免重复建设。

3.5 注重工程质量, 力争一步到位[6]

由于民国文献的数字化不可避免地会对原始纸质文献造成一定程度的损毁, 数字化后的纸质文献很大部分再次利用非常困难, 并且也将投入大量的人力和资金, 因此应该在项目立项之初慎重考虑, 高标准地制定技术标准, 注重加工质量, 切忌为了进度而牺牲质量。

4 讨论

民国文献数字化是传统图书的扩展, 既具有传统图书馆的收藏、保护、提供服务功能, 又提供集成化的、深层次的、数字媒体的远程数字图书馆服务, 是传统图书馆功能的补充和延伸[7]。S

参考文献

[1]郑春汛.民国文献的价值与保护对策研究[J].图书馆理论与实践, 2008 (4) :40-42.

[2]张丁, 王兆辉.民国文献数字化建设的历史必然性[J].数字与缩微影像, 2010 (2) :26-27.

[3]张丁, 王兆辉.试论民国文献的数字化建议[J].数字与缩微影像.2011 (1) :22-23.

[4]万华英.重庆图书馆民国文献数字化建设述评[J].四川图书馆学报, 2011 (6) :35-38.

[5]荣洪涛.重视民国文献保护:兼与民国前文献保护比较[J].图书馆理论与实践, 2010 (9) :9-12.

[6]刘晓景.重庆图书馆民国文献数字化实践[J].图书馆界, 2012 (4) :65-67.

浅析馆藏文献数字化发展 篇8

一、馆藏文献数字化及其意义

所谓馆藏文献数字化一是指通过购买电子文献, 下载网络资源等方式获取数字化文献信息, 增强馆藏文献数字化程度;二是指在图书馆内部将非数字化馆藏文献数字化。一般来说, 馆藏文献的数字化, 既可以很好地保存传统文献, 又能使被数字化的文献成为其他馆的虚拟馆藏, 成为整个信息网络中的共享资源;既可以丰富虚拟图书馆的信息资源, 又能促进整个社会对信息资源的开发和利用。具体来说, 它的意义主要有以下几个方面:

(一) 利于保护馆藏文献。

馆藏文献数字化可以降低原件丢失和损失的风险。古老的文献、照片都可以转换成数字化文献, 避免读者直接使用原件, 以减少或避免原件丢失的机率, 同时也可以扩大原始文献的利用范围。此外, 馆藏文献数字化还可以对已经受到损伤的原始文献起一定的修复和补偿作用, 还可以解决纸张脆化或变质文献的保护问题。

(二) 利于提高文献的利用率。

馆藏文献数字化在可以满足用户对文献的多种需求的同时, 还可以通过在线陈列, 充分地向读者介绍馆藏, 使读者充分地了解馆藏, 以提高馆藏的利用率。

(三) 利于开展研究。

馆藏文献数字化后, 可以产生较原件可靠而功能性更强的数字资料, 所以它有利于开展文献或科学研究, 从而扩大科学研究范围。例如:对手稿字迹的鉴别, 对图画、照片的放大浏览等等。

(四) 利于图书馆的科学管理。

馆藏文献数字化可以提高图书馆的科学管理水平, 为读者和用户提供更好的信息服务。首先, 数字化文献可以支持传统图书馆的多种需求, 为开展特色服务创造条件;第二, 图书馆既能用较低的费用和风险对馆藏文献进行拷贝, 也可以有效地开展馆际互借等活动;第三, 馆藏文献数字化后, 可以节省图书馆的存储空间, 也有利于书刊的科学化管理和维护。

(五) 利于开展有偿服务, 提高图书馆的经济效益。

馆藏文献数字化后, 可以刻录到光盘上自用或商业发行, 或制作成网络版放在服务器上共远程检索服务。通过电子商务系统, 便于在线有偿服务与订购, 这样可以增加图书馆的经济收入, 扩大图书馆的社会影响, 还有利于开发馆藏资源, 产生出具有经济效益和社会影响的信息产品。综上所述, 尽管馆藏文献数字化只是现有图书馆馆藏形式的一种转换, 但它却涉及信息管理、信息保存、信息服务和信息研究等方面的一系列变化和发展。作为信息资源建设工作的重要内容, 馆藏文献数字化具有重要意义。

二、馆藏文献数字化中需要注意的几个问题

(—) 重复建设问题。如前所述数字化文献的最大特点是有利于资源共享。所以数字化建设中的重复问题就显得特别重要。图书馆一方面要根据本馆信息资源建设的目标、馆藏特色和用户需要进行馆藏文献数字化建设。因为不可能把馆藏所有文献数字化。另一方面, 图书馆还要考虑其他图书馆、特别是成员馆的馆藏数字化进展情况, 考虑全国文献资源的整体布局和建设状况, 使本馆馆藏文献的数字化有利于一个地区、一个国家甚至国际文献资源数字化建设和发展的要求, 成为整个文献信息系统的一部分。所以, 要特别注意把那些具有长期保存价值的、符合本馆用户需要的、急需保护的“特色馆藏”作为重点, 并有计划地进行数字化, 建立具有本馆特色的数据库。这样才能优化馆藏结构, 提高馆藏利用率, 避免重复建设, 提高社会文献资源的保障水平和开发利用程度。

(二) 标准化问题。

馆藏文献数字化涉及文献信息描述、组织和检索等多个方面, 要实现资源共享, 就必须统一标准, 加强兼容性, 尽可能实现数字化中的标准化。

(三) 馆员素质问题。

馆藏文献的数字化也给馆员素质提出了新的要求。图书馆工作者已不是仅限于对传统纸张文献的收集、整理、组织、管理等工作, 而是将会面临更多的信息载体和信息服务方式, 将要学会掌握更多的信息技术。总之, 现代的图书馆工作者应当是信息专家和信息工程师, 是信息系统的设计者, 也是信息用户的导航者。

(四) 图书馆工作者应积极引导读者正确阅读。

在数字化文献信息日益增长, 人们对数字化文献信息的依赖性越来越强, 特别是青少年的印刷品阅读质量和数量每况愈下的趋势下, 图书馆工作者应责无旁贷地成为书本阅读的导师和顾问, 而不仅仅是我们所强调的网络信息导航者和信息技术掌握者。图书馆员应该首先认识到书本阅读, 特别是印刷品的经典著作阅读永远是人类思维、品格、精神、审美、成长进步的阶梯, 永远是人类精神财富来源的不可替代者。信息技术固然为人类的信息保存、处理、传递和利用带来了极大的便利, 但它永远不能代替书本阅读。

摘要:当今时代信息技术迅猛发展, 文献信息数字化为信息保存、传播和利用带来了巨大的变革, 但同时数字化文献在文献保存价值和阅读利用方面存在的局限也不容忽视。

论数字化文献的保护与传播 篇9

关键词:数字化,保护,传播

一、数字化文献的特征

与数字化文献相比, 传统文献的印刷运输以及贩售过程浪费了大量的时间, 影响了文献的及时性, 读者不能在第一时间获取内容。数字化文献虽然可以使读者快速及时地获取文献, 但是由于数字化更容易更改、复制使其对于文献保护的要求显著提高。

所谓数字化文献就是文献的电子版, 电子版不仅是我们通常理解的电脑文档还有磁带、光盘、磁盘等利用计算机专有的输入法二进制数字代码进行录入。

现在计算机迅猛的发展, 使数字化文献的表示方法多种多样。例如, 计算机程序、多媒体文档、照片、视频、数据库等通过数据环境进行传播的文件。

数字化文献在载体为计算机传统的、比较实在的、看得见摸得着的物理载体时, 计算机载体对打的优点就是信息存储量大, 制作简单、成本较低、检索简便快捷, 但是容易修改造成版权流失, 风险性高。

二、数字化文献的传播模式

除了以上提到的光盘、磁带等就是电子版, 可以通过网络随意下载的文档格式。最简单的就是直接下载通过电脑必备的文档软件即可查看的文档。例如, word等.exe、hlp等;次之就是需要通过网络浏览器打开的电子档。例如, HTML、SHTM、ASP、JSP等格式;还有就是需要下载专门的阅读器才能进行阅读的文献。例如, pdf、caj、pdg、ceb、lit等。

现在随着智能化手机的发展, 部门文献已经可以在手机上进行阅读和传阅了, 除了掌上电子书等智能化手机都能下载的软件外还有一些专用的软件, 如只能在kindle阅读器上使用的亚马逊.azw文件格式、pdb格式只能在邦诺公司内部使用。

数字化文献之所以种类繁多, 科学技术发展水平的提高是必要原因, 同时推动科学技术发展的经济水平的提高以及人们版权保护意识的提高对文献保护要求的改变。多变的格式就使部分人员不能进行相关文献的检索, 为他人文献访问设置了限制。使文献版权得到保护, 但是毕竟只供内部使用的文献较少, PDF、CAJ等阅读文件大家都可以在网上下载, 所以文献的保护效果并不理想。

文献在传播过程中都需要签订相应的协议。据了解一般的协议有IP地址的协议, 可以更加了解数据来源的地址方法的TCPIP协议、以XEROX、S Network System (XNS) 协议为基础的获取网卡地址的IPX/SPX协议。网络文献的传输前提都需要有相关的协议作为支持, 计算机网络技术水平的发展使得原有的协议被新型的协议所取代, TCP/IP、HTTP、PPP这些协议, 这些协议的产生使数据化文献的传输更加方便快捷, 有利就有弊, 它的出现也是一把双刃剑, 使数据的安全性受到的威胁更大。

三、数字化文献的风险

侵权行为的界定存在的必要就是通过法律的手段来判断某种行为是否属于侵权, 有依据在问题出现的时候才可以准确地进行判断谁是谁非。世界上关于知识产权方面的有关规定曾明确指出识别作品、作品的作者、拥有作品一切权利中的一项与此文献相关信息数字代码以及信息的复印件等都是文献权利管理的信息。美国对于文献权利管理信息的内容更加完善与齐全, 除了上述所说之外将超文本链接涵盖在内。

超文本链接、图形链接是超链接的组成部分。图书馆常采用图形链接, 其方法是把他人的图放到图书馆网页上, 并且会把图案来源隐藏, 这种行为就是修改他人文件的行为被认为侵犯了他人权利。超文本链接 (H ypertext link) , 是指从一个文本文档指向其他文本文档或从文本锚点 (anchor) 指向某已命名位置的链接 (1ink) 。这种方式进行复制时只需要复制者一个人就能完成不需要被复制者配合即可。这种行为之所以不被认为是侵权行为是因为这种行为不能使复制者将文件占为己有, 而是暂时的将文件使用一下, 一旦电脑关机文件就会不复存在, 而且这种文件不能固定在实质的载体上。图书馆使用的文件就是这种条件, 所以图书馆使用的文件的行为不属于侵权行为。

四、数字文献的安全保护措施

数字文献的保护措施就是使数字文献所有者的权利得到保证, 防止其权利受到非法侵害。主要措施如下:

(1) 身份认证技术。数字文化在传输过程中文献所有者进行身份认证使文献所有权得到保证, 可以明确文献的归属。身份认证技术是对文献发布者的保护同时也是对文献使用者的限制, 现有的身份认证技术有口令认证、智能卡认证、密钥认证、生物特征识别认证。口令认证是时下最普遍的的认证方式而且最容易实现, 成本低使用简便但是安全指数低;智能卡认证方式是PNI和智能卡相结合的认证方法, 两种结合就是双层保护, 安全指数要高些;密钥是由系统统一发出的, 这种方式属于一把钥匙开一把锁的形式。生物特征几乎都是每个人独有的不可复制的, 指纹、瞳孔、声色认证等方式更安全更可靠。

(2) 加密技术。加密技术使文献数据的获取更加复杂, 客观的保护了文献的安全, 他主要是在文献的传输过程以及存储过程中设置程序代码, 防止内容被拷贝。

(3) 数字指纹。所谓的数字指纹是身份认证的一种途径, 要求数据购买者在购买时输入自己的相关信息, 保护了数据购买者的消费者权益, 同时也可以使数据所有者对文献内容进行时时监督, 掌握动向, 一旦发现侵权行为可以及时制止, 快速找到作案人员, 进而达到对文献保护的目的。

参考文献

[1]胡莹华.数字档案馆知识产权保护研究[D].武汉理工大学, 2010.

[2]牛奉高.数字文献资源高维聚合模型研究[D].武汉大学, 2014.

数字文献 篇10

1. 传统图书馆文献采访的方式

随着数字时代的网络飞速发展, 网络销售、网上书城日益盛行, 给公共图书馆的传统采访方式带来了前所未有的冲击, 出现了多渠道的文献采访形式。但由于种种原因, 目前大部分县级馆仍然停留在传统的文献采访方式上, 主要体现在以下几方面。

1.1 出版社或供书商直接发货的方式

一些县级公共图书馆, 由于人员、经费等原因, 往往由出版社或供书商直接发货, 各馆只是提供一个或多个大类的书籍采购意向, 很少能够细致到具体的某一本书, 这样的方式虽然方便快捷, 但存在弊端。一方面, 县级馆由于技术原因, 查重系统等不尽完善, 导致内容重复, 如时下越来越多的读者关注健康养生问题, 这一需求的传达使我们在采购过程中有了一个大方向, 但因为不能现场采购, 对书籍的内容、纸质和是否与现有馆藏重复等无从把关。供书商大部分都是从自身利益出发, 在相同书名下, 往往会选择成本较低的丛书, 导致很多纸质或印刷质量差的书籍被采购进来。严重影响读者的使用率, 有的书放在架上几年都无人问津, 造成资源的浪费。近几年, 我馆每年都新增大量图书, 本应该吸引更多读者, 但事实并非如此, 读者在书架上左挑右挑, 最终发现适合自己的并不多。读者反映, 新书虽多了, 但大部分内容没新意, 这一问题从侧面反映出文献采访工作存在的问题。这个问题如得不到解决, 将直接影响图书馆的文献资源建设, 以及图书馆的服务质量。

1.2 采访人员现场采购的方式

近年来, 随着网络环境的发展, 文献采访的渠道变得多元化, 越来越多的出版商、新华书店等会定期举办图书展销会, 给采访人员提供了一些现场采购的机会。我馆每年参加由江苏省凤凰集团举办的四季馆藏会。现场采购的优势从中凸显, 首先, 采访人员在现场采购之前, 可以进行网络调查、读者需求调查, 筛选出需要采购的书籍, 避免采购的盲目性和重复性。其次, 现场采购可以及时发现高质量的著作和最新的畅销书, 方便采入, 从而大大提高文献质量。再次, 可以现场翻看样书, 如果发现样本有误可以及时调整, 对于一些多卷连贯不齐全的图书可以补全。当然, 现场采购也存在一些弊端, 由于学识和精力有限, 加上时间的限制, 采访人员面对品种繁多的出版物, 虽然有了更多的选择, 但有时也让人无从下手, 毕竟采访人员不可能对所有图书都全面了解, 因此, 不可避免会出现遗漏和重复现象。

1.3 读者参与的互动采购方式

目前各地公共图书馆会定期举办一些读者座谈会, 征集读者意见, 让读者推荐他们最喜爱的书籍, 同时数字时代下各地方图书馆, 大部分都建有自己的网站, 采访人员可以通过网站征求读者意见, 这样就将传统的读者座谈会与现代网络调查相结合, 让读者充分表达自身的文献需求, 采访人员将这些大众喜爱的通俗读物和科普读物进行采集、筛选, 最大限度地满足服务读者的需求。网络调查的优点在于随着网络读者的不断增加, 信息需求随之更新, 这样便于采访人员与时俱进地了解读者的文献需求。

2. 数字时代文献采访的特点

2.1 采访形态多元化

数字时代, 文献采访的形态发生了巨大变化, 我们要在采访传统纸质馆藏的基础上采访一定数量的电子馆藏。传统文献采访形式, 主要通过订购纸质文献, 供读者借阅。可数字时代下, 面对读者的多样化需求, 文献采访工作已经包含一定数量的电子文献。图书馆对于这些电子文献可以通过下载或购买等方式从而对其拥有使用权或所有权, 以实体形态存储于馆藏资源中。

2.2 采访方式多样化

传统文献采访是凭借征订书目, 向书店或书商订购, 操作方式主要是人工操作, 环节多, 费时间。网络环境下, 采购人员根据本馆计划, 只需在网上书城填写订货清单并选择支付方式。网络采购简化了订购流程, 使采访工作由手工操作的繁琐向网络操作的简便转变, 减轻了劳动强度, 节省了采访人员的时间, 缩短了文献采访的周期, 提高了工作效率。

2.3 采访对象多重化

数字时代, 大量信息在网络上发布和传递, 图书馆作为一个公益平台对于收集、筛选、传播和交流信息有着至关重要的作用。其采访对象随时代的发展有了新的变化, 网上书城亦如雨后春笋益盛, 与传统出版社或供书商供货相比更方便快捷, 冲破了时空界限, 提高了采访速度。

3. 文献采访工作在数字时代下的对策

随着数字时代的到来, 信息传播手段变得丰富多样, 各种信息传播平台盛行, 如微信、QQ、腾讯微博等, 已日益成为普通民众日常获取信息的渠道。因此, 要做好数字时代的采访工作, 就必须跟上时代发展步伐, 制定一系列的对策。

3.1 采访渠道必须优化

随着网络的发展, 图书馆的藏书已逐步从现实馆藏转向现实与虚拟馆藏并重。以往, 通常以购买、交换等方式收集获取文献资源。如今, 图书馆早已借助网络平台, 获取高于本馆原先数以万计的文献信息资源, 获取方式方便快捷。因此, 工作人员除进行传统方式的文献采访外, 还可以借助网络平台进行文献搜索和采访。当然不排除一些相对落后的基层馆, 由于计算机网络尚未完全覆盖, 通信技术相对欠发达, 工作人员的相关技术跟不上发展, 对数字时代下的网络采访渠道反应有些迟滞。因此, 基层馆要跟上时代步伐, 必须在网络采访方面下足工夫。首先, 要适时调整藏书计划和馆藏结构, 在数字馆藏快速发展的形势下, 基层馆必须认真规划, 给数字文献资源确立基本地位, 以此推动文献网上采访的开展。其次, 要不断加大网络采访力度。

3.2 采访人员的综合服务能力必须优化

文献采访中必要的读者需求调查、馆藏结构调查、出版信息筛选等各个环节的工作, 对采访人员的能力有了新的要求。随着现代采访技术的发展, 图书采访人员的综合能力应不断提高。首先, 采访人员要有较高的思想政治素质, 只有这样, 才能把握政治大方向, 才能在市场经济中经受考验。其次, 采访人员必须具备丰富的知识和超强的实践能力。能够对多种类型的文献信息进行高质量地选择、评估;能够妥善处理好电子文献和纸质文献的经费比例;处理好现实馆藏和虚拟馆藏的比重关系:能熟练掌握计算机和网络技术在图书馆中的应用, 有效开展网上采购和网上信息资源采购工作。为此, 我馆在2014年5月安排两名采编人员, 参加省图书馆连续出版物及编目规则为期4天的培训。努力在当今纷繁复杂的采访环境下, 提高采访人员的素质, 更好地为文献采访工作服务。作为一个县级图书馆, 我们要加大力度, 通过培训、自学等方法, 让采访人员更好地掌握有关知识特别是加强计算机网络等专业知识的学习, 提高各项操作技能。在数字时代下, 图书馆的采访工作要取得长足发展, 需要建立明确的人才培养计划和方向。一方面, 通过形式多样的学习和培训。对在职人员进行与现代网络发展相适应的能力和素质培训。另一方面, 各馆之间可以进行互动学习, 学习彼此的先进技术, 取长补短。

3.3 网上采访平台必须优化

信息技术已被广泛使用, 县级图书馆应跟上发展的步伐, 走上信息化道路。其中, 最首要的是构建网络采访平台。因为目前网上书店随处可见, 图书供应商有什么新书, 会及时在网上发布;我们有什么需求, 也可以在网上公开。我馆为适应数字时代的飞速发展、更好地服务读者, 近年来采购了大量的数字阅读资源, 主要源包括龙源期刊、方正阅读、儿童之路、方正电子书 (馆内) 、上业百科 (馆内) 、时夕乐学网 (馆内) 等数字阅读资源。2014年我馆实现了WIFI免费全覆盖, 方便读者。同时, 我馆于2014年4月21日正式引入方正阿帕比二维码移动借阅系统, 读者只需用手机在馆内的阅读机上扫一扫, 就可以下载大量精品电子图书, 从而可以随时随地阅读。该系统打破了传统的图书借阅模式, 第一时间为读者提供全方位的服务, 得到了广大读者的认可和好评。

3.4 馆际联盟采访形式必须建立

在科技和经济飞速发展的今天, 加强馆际协作, 从而达到采访资源共建共享的目的是非常必要的, 这样可以有效缓解经费不足的问题, 避免盲目的重复采访。面对琳琅满目的文献采访信息, 任何一家图书馆都不可能做到面面俱到, 只有加强各馆之间的互动互访, 团结协作, 放眼未来, 才能获得长足发展。如本馆在馆藏编目时借助国家图书馆的编目数据, 大大节省编目时间, 加快了新书与读者见面的速度, 得到了广大读者的好评。

总之, 数字时代下文献采访工作质量直接关系图书馆的稳健发展, 各馆只有不断创新, 开拓思路, 才能跟上时代发展的脚步, 打开采访工作的新格局, 确保图书馆与时俱进, 从而最大限度地满足读者的不同需求。

摘要:随着互联网在中国的迅速猛发展, 给各行各业带来了新的挑战。图书馆也不例外, 数字时代给传统文献采访工作带来了空前冲击。本文对数字时代下图书馆文献采访工作现状及在新环境下的对策进行了探讨。

关键词:文献采访,数字时代,特点,对策

参考文献

[1]杨之光.网络环境下图书馆采访工作的思考.图书馆学刊, 2008 (4) .

[2]王流芳.基层图书馆的文献资源建设模式探索.图书馆杂志, 2007 (6) .

[3]赵文斌.网络环境下图书馆文献采访工作探讨.丝绸之路, 2009 (12) .

[4]梁映红.谈谈县级图书馆文献采访工作的优化, 改革与开发, 2010 (8) .

[5]吴漂生.网络环境下文献采访工作.图书馆学刊, 2014 (1) :20.

[6]金桃.图书采访工作的新特点与优化.理论观察, 2005 (10) :20.

[7]李明.网络环境下图书采访工作浅谈.全国新书目, 2007 (2) :15.

[8]刘春月.新形势下图书采访工作的特点和对策.吉林财税高等专科学校学报, 2006 (12) :15.

[9]金桃.网络环境下图书馆采访工作的新特点.才智, 2011 (1) :25.

[10]张亚.公共图书馆地方文献采访原则.河南图书馆学刊, 2009 (8) :15.

[11]刘孝荣.公共图书馆文献采访模式的探讨.科技情报开发与经济, 2014 (1) .

数字文献 篇11

关键词:图书馆;二次文献;数字化

中图分类号: G250.7 文献标识码: A 文章编号: 1673-1069(2016)31-79-2

0 引言

二次文献的主要类型有目录、索引、文摘性数据等,具有可检索性、系统性和汇集性特点,可为查找一次文献提供线索,是图书馆资料工作的重要内容。它是在整理、浓缩、提炼大量零散、无序的一次文献的基础上,依据相应的逻辑顺序和科学体系对其进行编排存储,形成便于用户检索的工具性文献。传统资源模式下,应用二次文献可以大大节省查找一次文献花费的时间,是图书馆工作者提供文献资料服务和读者查询文献的重要工具。现如今,二次文献的作用受计算机网络和全文数据库兴起的影响而受到质疑,其被关注率急剧下降。然而,二次文献作为一种索引工具有着其独特的优势,对于有效开发一次资源具有不可替代的作用。因此,在此种形式下如何确保二次文献的生存与发展,是目前图书馆工作者必须重视的问题。

1 二次文献数字化面临的挑战

1.1 检索作用的价值受到挑战

因为一次文献数量众多而且多处于无序的分散状态,如果使其脱离了目录、索引,将导致用户无法获取原文。由于二次文献具有可以帮助用户快捷、准确地获取一次文献的强大检索功能,因而受到广大用户的青睐。但是,数字化时代下,相关人员开发与运用的全文检索系统集中了大量的文献资料,克服了过去“文、检分离”的问题,实现了一体化。此外,有些信息系统本身就具有强大的检索功能,例如,CNKI、维普数据等学术刊物类及书生之家等图书类本身就具有强大的检索功能,用户只需要借助计算机在上述平台上进行一些简单操作,便能快速获取自己所需的文献资料,这样使得利用二次文献工具进行检索的效用失去实用价值。

1.2 用户检索方式发生变革

过去用户大都应用二次文献检索工具查询某方面的相关文献资料。但是,随着社会进步和科技的飞速发展,文献形态也得到了相应的发展,现在供读者参考的文献形态有印刷版、电子版和网络版。现在读者首先考虑的是使用哪种文献数据库能够在海量的数据中既准确又快捷地查找到自己所需的文献及相关信息。当今时代,许多高校和科研院所的图书馆同时集中了图书数据库、电子图书、中外文期刊全文数据库等各种文献数据库,能够满足教师以及学生对科研文献资料的需求。现在,大部分年轻人运用数字化一次文献查阅科研资料,由于其操作便捷、简单易懂,很多用手工检索的科研人员也开始接受并运用网络版进行检索,对二次文献的使用造成了严重影响。

1.3 弥补原始文献不足的功能正逐步被弱化

在原始文献资料不充分时,应用二次文献可以满足用户对于文献的基本需求。过去,受地域的限制,人们在查找原始文献时非常困难,特别对外文资料的获取更加困难。如果通过邮寄会需要大量的资金和花费很长时间,因此,为满足基本需求,只能通过二次文献来获取部分信息。后来,原始文献的获取随着全文数据库的开发变得非常容易,外文资料也不例外。例如,能够提供千余种期刊全文检索的CNKI等全文数据库及收录了上千种外文期刊原文的Elsevier外文全文数据库,它们基本能够满足科研人员对文献资料的需求,降低了使用二次文献的功能和频率。

2 加强二次文献资源建设的对策

2.1 传递文献,共享资源

当前阶段,由于利用文献传递服务能够满足用户对于文献信息多元化、层次化的需求,因而在国内得到了快速发展,它是指以有效的方式和合理的费用将用户所需文献的复制品直接或间接地传递给用户。如今,各种各样的电子数据库是实现图书馆资源共享的重要途径。

2.2 重视二次文献的开发利用

不管是高校还是科研院所,任何一个图书馆都不可能购买所有形式的文献资源。而利用二次文献可以降低馆藏成本,实现文献的经济有效利用,因此要重视开发利用二次文献。文献建设的重要内容是保证教学和科研的需要,越是前沿性和深入性的科研课题,其相应的文献资料就越少,如果购买印刷版或是运用一次文献,既不科学又不经济。因此,利用二次文献工具进行收集和利用文献资料,是经济有效的途径。

2.3 探索全文数字系统的盲区,进行优势互补

任何全文数据系统都是依据一定的基本原则和收录范围进行文献收集工作,所以,其对文献的收集必定存在盲区。例如,国内的全文数据库只收录公开发表的学术性论文,而较少收录交流资料、内部刊物以及会议文献;由于国外商业运行模式与国内存在很大的差异,导致中国全文数据库系统不能收录一些重要的学术期刊,致使相关人员查找不到一些高水平的论文;上述这些问题给二次文献的生存与发展提供了机遇,图书馆工作者应深入探索全文数字系统的盲区,努力将二次文献与全文数据库系统进行优势互补,形成自己的特色,其必定还有广阔的生存空间和发展前景。

3 图书馆二次文献数字化的发展趋势

3.1 规模化集成资源,更好地实现资源共享

作为当代图书馆的工作者,应该将种类繁多而且内容丰富的二次文献资源进行规模化的集成,这样有利于实现资源共享,为读者提供一个整体服务的有效载体和平台,使读者能够最大限度地利用和共享信息化平台所提供的文献资料。

3.2 加强挖掘文献内容,充分揭示文献

图书馆工作者在提炼和制作二次文献过程中,必须遵循还原文献核心内容和本质的原则,因为二次文献是揭示原始一次文献的重要基础资料。工作者要依据各种文献的内容和特征,对著录项及服务平台中的检索内容和显示字段进行科学合理的设置。此外,工作者应考虑设置一些能反映特殊文献特点的著录字段,以方便读者检索。

3.3 加强二次文献数据库的扩展整合功能

通过综合运用互联网和超文本技术,链接不同的信息资源,整合原本相互独立又互为联系的信息资源与服务,就可以实现对二次文献数据库的扩展与整合。进行文献检索时,用户只需通过一个数据库,就可以便捷地查到并获取自己所需要的文献资料。要想对数据库进行扩展整合,必须要提供以下几种功能:一,提供与原始文献的链接;二,链接海量的网络资源;三,提供与图书馆馆藏进行链接的地址;四,链接其他相关的数据库。

4 结束语

二次文献是读者检索、报道和积累文献资料的有效手段,它可以全面、系统地为用户提供某个学科或专业在一定范围内的文献检索线索。在网络信息技术时代,图书馆工作者应该结合现代化的信息技术,拓展对网络文献的开发和利用程度,将整理和记录的馆藏电子文献中的题录和摘要增加到数据库中,通过现代网络技术提供给远程用户,帮助其检索资料。总之,传统二次文献与其他非纸质二次文献在今后将长期共存、共同发展。在数字化信息时代,由于传统二次文献的应用较为广泛,且不受设备条件和空间的限制,它将会更快速、优质地向前发展,影响也会更加广泛。

参 考 文 献

[1] 王秀军.数字化时代图书馆的二次文献工作[J].图书馆学刊,2011,11:71-72.

[2] 韩春磊,贾颖.数字化时代下国内公共图书馆二次文献资源的发展现状及趋势[J].中国科教创新导刊,2012,13:255-256.

[3] 成红.网络环境下专业图书馆二次文献的开发与利用[J].图书馆论坛,2011,02:120-122.

浅谈古籍文献的数字化之路 篇12

我国的古籍历史悠久, 数量繁多, 浩如烟海, 内容极其丰富, 制作工艺精良, 是我国文化遗产中的一份宝藏, 在整个人类文化史上占有重要地位。古籍文献同其它物质一样, 总是处于不断地运动变化之中, 在经历数十年乃至数百年的光阴, 自然老化、脆化、虫蛀、酸化是其必然趋势。古籍破损从量变发展到了质变, 就很难使其恢复原貌, 因此对古籍文献进行数字化处理相对于现代书籍而言, 显得更为急迫。

自20世纪90年代起, 以计算机和网络为代表的现代信息技术的飞速发展在人文、社会科学中的一个重要表现就是传统纸质文本向电子文本的转化, 那便是纸质书刊的数字化。近年来我国各地的数字化图书馆建设日益兴盛, 使得古籍文献的数字化得到越来越多图书馆和博物馆的重视。为了顺应时代发展的要求, 更好地保护古籍文献, 更好地利用古籍文献, 做好古籍文献的数字化建设意义重大。

二、古籍文献数字化的涵义和意义

传统古籍指的是在1911年以前手抄、印刷的文献著作或经后人整理成册的文献, 也包括民国时期出版的图书和古人所著的线装书和大部分的精平装丛书。这些古籍文献往往具有非常重要的文化价值和极高的史料价值, 是中华民族五千年的文化积淀, 是中华民族传统文明的进步与传承, 也是我国各图书馆的重要组成部分, 对弘扬民族文化和建设社会主义精神文明具有重要作用。

古籍文献数字化是指利用现代信息技术将古籍文献转换成图片、视频等形式, 并以电子数据的方式进行存储和管理。数字化后的古籍文献经过整理归类再配合检索软件, 便可通过网络进行有偿或无偿发布, 也可以再次印刷出版。

古籍文献的数字化完美地解决古籍保存与使用之间的矛盾, 使得古籍的阅读、翻检都大为便利。古籍电子版本可无限制地复制, 成为取之不尽、用之不竭的资源;四通八达的计算机网络, 可使古籍文献实现即时共享, 避免了运输和分配的问题。

古籍文献的数字化是古籍整理发展的方向, 顺应这种变化, 是时代向古籍整理工作提出的新要求。21世纪的今天, 信息技术的迅速发展使我们依托于网络便可解决古籍文献的传承与利用。

三、我国古籍文献数字化的现状

古籍的数字化最早是从计算机技术发达的美国开始的。20世纪70年代末, OCLC和RLIN先后推出了《朱熹大学章句索引》、《王阳明传习录索引》、《戴震原善索引》等数据库, 到20世纪80年代以后, 中国的台湾、香港和大陆才相继开始了中文古籍文献的数字化项目。台湾地区古籍数字化项目:1984年, 台湾中央研究院开展的“史籍自动化计划”, 开发了《二十五史 (全文资料库) 》、《阮刻十三经注疏》等项目扩展成为包括多种经典古籍在内的“翰典全文检索系统”。1989年, 台湾中央研究院又提出了“数字典藏计划”, 古籍数字化包括善本古籍、金石拓片、古籍附图、台湾古籍文献藏经阁都有一定的影响。1993年, 元智大学罗凤珠教授最早开发出“《红楼梦》网络教学研究数据中心”、《全唐诗》、《全宋词》古籍资源库。其后, 台湾汉学研究中心制作的“善本丛刊影像先导系统”、中华电子佛典协会的!在线及期刊报纸等。

香港古籍数字化项目:1989年起, 香港中文大学中国文化研究所开展有关中国传世典籍数据库的研究工作, 中国文化研究所还正式成立“古文献数据库中心” (CHANT Center) , 并先后推出《先秦两汉古籍逐字索引丛刊》及《汉达古籍数据库检索系统》。

大陆古籍数字化项目:90年代中期以后, 国家图书馆制订了一个庞大的古籍特藏文献数字化计划, 如碑砧菁华、西夏碎金、敦煌遗珍、数字方志以及甲骨文、永乐大典等。北京大学《中国基本古籍光盘库》, 计划收录古籍1万种。迪志文化出版有限公司、上海人民出版社推出了文渊阁《四库全书》全文检索版。书同文数字化技术有限公司推出了《四部丛刊》的全文检索版。国学公司推出了《国学宝典》等系列产品。

四、古籍文献数字化的方法与途径

梅州市剑英图书馆现有古籍文献约2000种共3.9万册, 地方类的古籍文献约200种共450余册。现阶段主要对清代梅州 (嘉应州) 建立以来的梅州地方志文献进行整理、数字化后再出版和网络发布, 为更好地保护古籍文献, 让读者更好地利用古籍文献提供新的思路。本文通过对地方类古籍文献的数字化扫描、图像处理和再出版 (网络发布) 这三个方面的实践, 着重探讨古籍文献数字化的方法与途径, 旨在强调根据其自身条件选择适当的数字化方法。

1. 数字化扫描

我馆的做法是通过“佳能EOS 550D (配18-55mm IS镜头) 配合LCS-A2C非接触性彩色扫描一体机”将纸质文献转换成JPEG格式的图像文件, 再借助Adobe Photoshop对其进行图像处理, 最终用于再出版和网络发布。这种方式让数字化后的文献与原文献保持一致, 读者不但可以阅读与原文献一致的内容, 还可以查阅到图像文件的牌记、凡例、序跋、印章、书口、边栏、鱼尾、书耳以及笔迹等。这种做法有4个优点和3个缺点。优点:第一、设备经费投入不高;第二、设备操作简单;第三、以这种方式数字化后的文献真实直观, 与原文献基本一致;第四、使用这种方式制作的再版物 (网络发布) 阅读体验极佳。缺点:第一、数字化扫描效率较低、进度较为缓慢;第二、原始图像处理操作繁琐需消耗较大的人力资源, 由于原始图像文件的字体颜色深浅不一、噪点杂色凌乱、版面大小多种多样较难实现批量处理操作, 为保证质量只能逐张处理;第三、不利于检索, 由于文字是通过JPEG格式的图像文件存储于计算机中, 无法检索文献中的内容, 检索深度有限。

2. 图像处理

我们将原始的JPEG图像文件加载到Adobe Photoshop中, 依次进行去色、曲线调节、噪点清除等操作, 将原始图像文件中的底纹杂色、污点进行清除, 并加深字体颜色形成便于阅读的“白纸黑字”的图像文件 (见下图) 。对于一些图像弯曲、文字模糊不清的还可以对其进行图像扶正、字体修复处理, 这里要重点提醒的是对于那些模糊不清的文字必须是有着十足把握确认的文字, 若无十足把握者便不宜修复, 以免造成错误修复。这样处理后的JPEG图像文件其字体、图像、版式等便与原文献基本一致, 最大程度上地保持原汁原味。

从上图中可以看出原始JPEG图像文件字体暗淡、噪点杂色凌乱阅读体验不佳, 对于一些中老年读者在查阅时会显得特别吃力。而经过处理之后的图像文件字体清晰、版面整洁阅读体验极佳。

3. 再出版和网络发布

对于再出版我馆以保证最佳阅读体验为首要原则, 将多种文献整合为一册。建议是将处理后的图像文件按照1:1的比例印刷, 使得再出版物与原始文献保持着的相同大小, 其阅读体验将大大高于原始文献。对于一些版框、字体较小的文献可适当放大, 而版框、文字较大的则可以适当缩小。

在网络发布方面我馆的做法是直接将处理后的图像文件上传至图书馆网站。通过新建一个“地方志古籍”专栏把整理好的图像文件上传到专栏中, 免费向读者开放。我馆“地方志古籍”专栏的建设不仅实现资源共享, 还大大提高古籍文献的利用率。

五、古籍文献数字化存在的问题及发展方向

1. 古籍数字化存在的问题

(1) 复合型人才匮乏

古籍文献数字化建设的关键是人才。古籍文献数字化是传统学术方法与现代信息技术的完美结合, 它需要一批既懂得古籍整理又精通计算机技术的人才。而当下愿意从事图书馆古籍文献整理工作的年轻人非常稀缺, 特别是具备古籍文献整理知识又能熟练掌握现代化信息技术的复合型人才更为匮乏。当前现代化信息技术日新月异, 新技术、新概念的不断涌现让老一辈的古籍整理专业人员难以适应, 而年轻的计算机技术人员又缺少古籍知识, 使得从事图书馆现代化古籍文献整理工作的专业人才“断层”问题尤为突显。

(2) 数字化文件格式数量繁多且重复建设

目前我国古籍文献数字化数量庞大、种类繁多且重复建设, 由于没有统一的规划, 相关机构和公司各自为战, 自行开发数据库并制定数字化文件格式。这就造成数字化文件种类繁多, 格式不统一, 出于保护各自版权的需要, 绝大部分资源都需要安装专用阅读软件才能使用, 不利于用户使用。也导致数据库间的数据无法进行交换, 也就无法实现馆际间资源共享。

(3) 检索技术急需完善

现阶段的检索技术均是基于对文本形式的关键字进行文献检索, 而数字化格式多种多样, 除了文本形式还有图形、图像、音频、视频等多种格式。如果文字是通过JPEG格式的图像文件存储于计算机中的话, 那么传统的基于关键字检索方式便无法检索文献中的内容, 检索深度有限。也就无法满足用户获取信息的要求。

2. 古籍数字化未来发展的趋势

(1) 建立规范、统一的古籍数字化标准迫在眉睫

规范、统一的数据库形式是数据库的生命所在。要建立全国统一的数字化古籍数据库, 实现馆际合作、资源共享就必须有统一的数据格式要求。如果没有规范、统一的数字格式, 数据库间就无法进行交换, 无法真正实现馆际资源共享。那么建立规范、统一的古籍数字化标准就显得尤为重要, 只有这样, 才能建立起一个能真正为学术服务的公共古籍文献数据库, 给读者的使用和研究带来更大便利。

(2) 更加高效的数字化技术

目前的数字化途径是通过扫描仪采集静态图像存储于计算机中, 再通过专用软件转换成文本、图像。这种操作方式效率低下且扫描清晰度、精度不高, 同时也需要消耗巨大的人力资源。新数字化技术应该从软硬件两方面同时升级, 在硬件方面扫描仪应有更高的清晰度、精度、扫描速度、扫描幅面等指标, 必须绝对避免数据收集不全、图像信息遗失等。

(3) 更加强大的检索系统

现阶段的检索技术均是基于对文本形式的关键字进行文献检索, 而新检索系统应具备可对图像中的文字进行检索的功能。在此我们可以大胆的设想:基于对文字内容的图像信息检索主要通过统计分析图像中的像素点计算文字模型, 然后与字库进行匹配得出与之最匹配文字, 最后将检索信息按照匹配程度依次反馈给用户, 从而达到对图像的检索。

(4) 馆际合作、资源共享

馆际合作、资源共享是当今图书馆行业的一个重要课题, 最初的馆际合作是从统一编目、馆际互借开始的, 随着图书馆事业的不断拓展, 数字古籍资源共享也慢慢变成馆际合作的重要项目。图书馆之间相互分享各自的资源, 可以在一定程度上避免数字化的重复建设, 减少人力、物力的浪费。使古籍数字化成果在最大范围提供服务利用, 真正实现古籍数字化资源的共建共享。

古籍文献资源数字化工作是要扎扎实实的、持续不断的进行, 无论是从项目规划还是到社会资源的共建共享, 都需要以协作和开放的精神来开展工作, 不仅在标准与规范上需要协作与开放, 在古籍数字化的体系结构上需要协作与开放, 在项目的规划与实施上更需要协作与开放, 才能使中华民族的文化遗产得到全面的继承与弘扬。

参考文献

[1]赵捷, 芦晓, 张金治.地方文献数字化的实现方法与途径.数字与缩微影像, 2007.2.

[2]牛惠萍, 张琳.对我国古籍数字化相关问题的研究.当代图书馆, 2006.3.

[3]赵晓星.古籍文献数字化浅析.科技情报开发与经济, 2007.6.

[4]朱晰.浅谈博物馆古籍文献数字化.山西博物院学术文集, 2011.

[5]刘家真.馆藏文献数字化的原则与方法上.中国图书馆学报, 2001年05期.

上一篇:灌溉管道下一篇:燃料消耗