档案数据备份论文

2024-11-07

档案数据备份论文(精选12篇)

档案数据备份论文 篇1

前不久, 德国科隆城市档案馆突然坍塌。作为德国最大的历史档案馆之一, 科隆城市档案馆藏有65 000宗各类历史档案, 包括科隆、普鲁士王国以及莱茵河流域的文字、图片等资料, 还有不少包括马克思、恩格斯著作手稿在内的名人手迹和作品原本等, 其中不少档案已超过千年。根据相关报道, 该馆馆藏档案几乎没有进行任何数字化备份。这就意味着此次倒坍导致了相当数量的原始档案彻底损毁。正如在档案馆任职多年的埃尔伯特·伊尔纳所说:“我们损失的是摆放在总计18公里长档案架上的德国历史。”所以, 笔者从德国科隆城市档案馆坍塌事件对档案数据异地备份问题谈谈个人的看法。

一、档案数据异地备份的概念及原理

档案数据异地备份是指为避免档案遭受火灾、地震等不可抗力因素破坏, 而采取将数据备份存储在远离事故可能发生地的一种安全措施, 它是最基础的容灾备份机制, 是化解档案安全潜在威胁的极为有效措施。其备份过程原理如下:

档案数据从本地产生, 经复制再传输到异地备份中心存储。通常, 业界将数据异地备份分为四个等级。

零级:本地备份。这一级实际上没有灾难恢复能力, 它只是本地数据备份, 本地保存, 没有送往异地。

一级:本地磁带备份, 异地保存。在本地将重要数据备份, 然后送到异地保存。灾难发生后, 按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置、易于实现。但当数据量增大时, 存储介质管理的难度增大, 当灾难发生时, 存在大量数据难以及时恢复的问题。

二级:热备份站点备份。在异地建立一个热备份站点, 通过网络进行数据备份, 即通过网络以同步或异步方式, 把主站点的数据备份到远程站点。

三级:异地备份中心。在相隔较远的地方分别建立两个数据中心, 它们都处于工作状态, 并进行相互数据备份。

二、档案数据异地备份是档案保护的一剂良方

随着我国档案数字化进程的不断加快, 档案数据存量的不断增加, 档案实体与档案数据的同地存储必然带来极大的风险性, 再严密的安全制度、再稳妥的技术措施, 也难以消除不可抗力因素 (如地震、火灾等) 对档案安全构成的威胁。因此, 异地备份档案数据成为化解威胁的最有效措施。自汶川地震以来, 国家档案局要求重新启动重要档案异地备份制度。在2008年12月19日召开的全国档案局长馆长会议上, 杨冬权指出, “在危害档案安全的突发社会事件和自然灾害频发的今天, 我们必须强化风险防范意识, 提高灾害应对能力, 采用新的手段, 重新实施重要档案异地备份制度, 在不同的地方存放重要档案的重份或缩微品、光盘等复制品。”、“对重要档案实行异地备份, 特别是安全系数较低的电子文件, 一定要普遍实行异地备份。”笔者认为, 对档案进行异地数据备份, 是确保档案安全的极为有效措施, 必将成为今后档案信息安全工作的发展趋势之一, 理由如下:一是从安全角度来看, 档案数据异地备份极大增加了档案保管的安全系数, 即使实体档案遭受毁灭性损毁, 其新载体形式依旧存在。二是从空间需要来看, 与实体档案异地备份相比, 档案数据异地备份所占空间小, 因此, 备份站点的选择和建立都比较灵活。三是从备份效率来看, 由于数字档案的不断产生, 决定了档案数据异地备份必然是动态的, 与实体档案的备份效率相比, 借助网络传输技术对产生的数字档案进行备份, 可极大地提高档案数据的备份效率。四是从成本来看, 虽然数据异地备份价格不菲, 但是与档案彻底毁灭所带来的各种损失累加起来相比, 是微不足道的, 尤其对地质灾害多发地区的档案部门来说, 采取这一手段是可行的。五是从档案的提供利用来看, 建立档案数据异地备份中心, 可进一步开展提供利用工作, 形成档案部门特别是档案馆的“镜像”, 极大地提高档案服务经济社会发展、服务民生的效率。六是从国际档案界的工作趋势来看, 档案数据异地备份已成为国际上公认的最为安全的档案保护策略, 开展这项工作有利于使我国档案安全管理水平与国际接轨。

三、制定科学合理的异地备份策略

1. 异地备份站点的选择。

虽然数据异地备份是保护档案免受毁灭的有效措施, 但是如果异地备份站点也同样遭受突发灾害、事件, 保护目的就达不到了。因此, 异地备份选点尤为重要, 应召集相关专家对选点地区进行风险分析。异地备份场所, 以“相距300公里以上, 不属同一江河流域、同一电网、同一地震带的地方”为宜。

2. 异地备份站点的建设。

这项工作需要考虑的因素很多, 如备份/恢复数据量的大小, 应用数据中心和备份数据中心之间的距离和数据传输方式, 灾难发生时所要求的恢复速度, 备份中心的管理及资金投入等因素。其中, 技术因素无疑是最关键的部分。一般来说, 异地备份站点建设, 主要涉及到互联技术、远程镜像与快照技术, 以及存储虚拟化技术。互联技术是指把数据产生地与备份地之间连接起来的技术。目前, 主要有两种方式。一种方式是光纤通道连接, 因光纤通道连接可以提供很高的性能, 所以成本较高。另一种方式是新兴的IP互联技术, 包括FCIP、IFCP、ISCSI等。远程镜像是指把磁盘 (或磁盘子系统) 中的数据完全复制到另一磁盘 (或磁盘子系统) 中, 数据在两处的存储方式完全相同, 数据镜像首先应用于本地操作, 由于异地备份对距离的要求, 便发展成为远程镜像技术, 即生产站点与冗余站点的数据存储方式一致。而快照技术是在某时间点对磁盘系统中数据的扫描, 它不包含所有数据信息, 但是用户通过快照与时间信息可以完全得到该时刻的完整数据。存储虚拟化技术则为异地备份提供了一种灵活的解决方案, 原因在于虚拟化方案在“虚拟”的各类设备之间可以实现备份功能。存储虚拟化技术不仅可改善数据管理和提高利用率, 还可以实现更高层次的管理功能。利用虚拟化特性, 数据管理工具就可以更好地处理快照、复制、按需配置容量等工作。

3. 建立行之有效的管理机制。

一是档案部门的各级领导要高度重视异地备份工作, 定期听取工作汇报, 及时解决工作中出现的难题, 确保备份工作顺利进行。二是采取切实有效的措施, 确保档案信息安全, 杜绝数据丢失、泄密事件发生。三是加强人才队伍培养, 以适应实际工作需要。四是档案数据异地备份是档案界面临的新课题, 档案部门自身没有成功经验可供借鉴, 因此“取它山之石攻玉”尤为重要。档案部门可以采取引进人才、进行实地考察、聘请专业公司等方式来做好这项工作。五是克服麻痹思想, 做好异地备份日常维护工作, 经常性地对现行方案可行性进行评估和实地测试, 使异地备份站点真正成为档案数据的避风港。

档案数据备份论文 篇2

档案信息数据库是在计算机存储设备上合理存放的、可以共享的、具有共同存取方式和一定组织方式的、相互关联的档案信息数据的集合。“相互关联”、“共同存取方式和一定组织方式”、“共享”是档案信息数据库本质的三个要素。数据库中储存的是一系列相互关联的档案信息数据,而不是杂乱无章的数据。这些数据包括档案题名、责任者、分类号、主题词、内容摘要等,还包括全文、图像、声音、影像等。这些相互关联的数据是经过调查、试验、统计、整理和归纳后得到的,并经合理分类和规范化处理之后,以记录的形式存储。

二当前档案信息数据库建设的关键问题

(一)明确数据库建设目的对于档案信息数据库建设,主要用于档案目录、全文、多媒体等实体信息,明确建设档案信息数据库是为了检索、建立档案信息管理系统的需要。

(二)实现档案目录数据库建设

档案目录数据库的建设是数据库建设的第一个目标。信息化建设的切入点和工作重心,首先是抓好目录数据库的建设。目录数据库可以比较全面地反映档案信息,有助于实现全方位的、动态的、完整的档案信息服务。

在档案目录数据库建立的基础上,可以考虑建立档案目录中心,实现一定范围内档案内容互补和档案信息资源整合,更大限度地发挥档案效益。

三档案信息数据库建设步骤

(一)档案信息的收集

档案信息的主要来源是传统档案的数字化和电子文件。除此之外,档案机构和管理部门也是数值数据和事实数据的重要来源。在建立相应的数据库时,必须确定档案信息的收集范围和来源,按要求进行全面地收集。

档案信息主要来源于两个方面:一是对各种以传统载体形式存在的档案信息进行数字化处理后形成的数字副本,二是直接通过计算机生成和处理的、并由档案机构进行收信归档的电子文件。

(二)档案信息前期处理

这是一项基础工作,为数据库提供经过加工处理的数据。主要是将档案的内容特征和形式特征著录、标引出来。著录标引必须达到规范化、标准化的要求。这是建立数据库的必要过程,也是保证检索质量的前提条件。

1、档案信息数字化

数字化是指把一切信息都变成只用O和1这两个数字组成的、用不连续的数位表示的二进制代码。档案信息数字化是指为了使纸质档案、音像档案等以传统载体形式承载的档案信息能够通过计算机进行管理的提供利用,而利用高速扫描技术、数据压缩技术等信息处理手段,将其进行转换处理,形成数字信息,并以数字代码方式存储起来。这些数字信息可以通过计算机进行操作处理,通过网络进行传输。纸质档案、音像档案等各种载体的档案都可以以文本文件格式、图像文件格式,音频文件格式或视频文件格式转换成数字信息。

2、电子文件的收集归档

随着计算机技术与办公自动化技术的结合,诞生了一个新生儿一电子文件。电子文件一经产生其信息就是以数字代码形式表达。所以在功能上电子文件等同于经过数字化处理的文件。由此,直接在计算机中生成和处理的电子文件是重要的档案信息来源。

(三)数据录入

将档案信息前处理的结果转化成机读数据。录入过程需要较严格的校对审核。如审查字段的数据形式是否正确;字段长度与确定的结构长度是否符合;各种标识符号是否有误等。这其中可能包括对不同格式的数据进行转换。

(四)数据库的完善

由于计算机硬件能力奇迹般地不断更新,计算机技术爆炸般地迅猛发展,数据库系统发生着剧烈的变化。虽然它的基本组成部分仍然是数据、软件和硬件,但是它们的范围、规模和复杂性都大大地扩展了。数据库是信息资源存储和开发利用的基础,是信息资源共享的先决条件,是信息系统的核心。因此把数据库建设作为当前档案信息发布的核心工作,档案数据库建设越有成效,档案信息管理与服务也就越有保证。

四档案信息数据库建设对档案管理工作的影响

档案信息数据库建设,意味着在信息社会中档案管理工作开始涉及各类相关的技术问题,档案工作开始大规模引进现代技术。从长远看,档案信息数据库建设的发展就是档案信息化建设的推进,其间涉及数字档案信息的形成、收集、归档、整理、鉴定,存储、保管、保护,检索、传递、利用、统计、销毁等全过程。档案信息数据库建设将对相应的档案管理工作产生各种影响,使之在一定程度上发生某些变化。

(一)内部调整:相关档案业务环节的调整

1、简化整理工作

整理工作是采用一系列方法使档案有序化,解决档案的零乱与管理和利用的系统化要求之间的矛盾,便于档案实体管理与查找利用。由于采用计算机自动化检索,可以方便地找到指定的文件,过细的整理工作已失去存在的意义,而且整理过程中对档案的装订加工也是对档案载体和原始性的一种损害。为此必须简化整理工作使之简明实用,档案整理只要做到在充分尊重文件形成的自然形态的基础上保持文件之间的内在联系,不必强求外观上的整齐划一,而且整理工作的重点应放为档案计算机检索系统或管理系统做好数据准备上。

以“件”为档案整理,是从传统的档案管理向数据库环境下的档案管理过渡的一种衔接,它符合电子文件的形成和发展规律,有助于计算机辅助档案管理,有助于实现电子文件的归档。在以“件”为单位对档案进行整理的过程中,作为文件向档案转化的一个环节,“立卷”已是名不符实,在归档这一环节,只是进行介质归档。当档案管理中电子文件达到相当比例,技术应用发达到一定程度,电子文件的归档与整理将合而为一。

2、深化检索工作

在数据库环境下,档案信息检索这一工作环节日趋重要。它决定了数字档案信息的著标引及存储,因此要进一步深化档案检索工作,为利用者提供高效的信息服务。

3、研究和实现数字档案信息的保管保护工作

数字档案信息的保管保护,不同于以往任何载体档案的保管保护。由于数字档案信息的存储载体占用空间较小,利于档案库房管理。但是,数字档案信息的存储载体在其保管条件上又有不同于纸质档案的特别要求,包括必须存放在专用库房中,对库内温湿度进行严格控制。配置防尘、除尘,防磁场和电场的设施。对于使用设备必须严格防范计算机病毒,传统的裱糊、杀虫等纸质档案保护手段已失去意义。这些数字档案信息的存储、管理都是档案保管保护工作的新课题。解决这些新课题既要建立新的管理理论、标准和方法,又要采用先进技术手段。

(二)外部重组:文档一体化及其实现

要更好地实现档案信息数据库建设,档案管理工作不仅仅限于内部进行一些适当的调整,它还必须向前端的文件工作扩张,这就使得实现文档一体化的要求变得更为迫切。

档案数据备份论文 篇3

在新的形势下,各级对档案的管理工作提出了新的更高要求,加强档案登记备份工作具有特殊的现实意义。

1.档案登记备份工作可以提供法律凭证。

档案登记备份制度是基于保障电子文件安全而设立的一种制度。档案具有历史文化研究价值和法律凭证价值,特别是档案的法律凭证价值,是整个社会信用体系的基石。近年来,随着社会信息化进程的加快,档案载体形式大量电子化,而电子文件的环境依赖性、易修改性决定了其原始性即凭证价值更易被破坏,从而引起社会对档案法律凭证价值的置疑,直接影响企业经营活动、影响政府公信力、影响社会稳定。通过登记备份,各级档案部门作为非利益相关的第三方,对档案的原始性、真实性提供鉴证,通过确保档案的真实性来保障其法律凭证价值,可以有效化解矛盾纠纷,降低社会交易成本,提高相关部门行政效能。

2.档案登记备份工作可以保障重点领域的档案安全。

档案是一种重要的信息资产,是规范企业经营行为、加强廉政监督的基础性台帐,直接影响一个地区的经济社会有序运行和一个单位工作的正常运转。当前,民生领域和重点经济领域的档案安全问题十分突出,一些单位或部门人员频繁变动或相关人员责任心不强,档案散失、损毁的现象时有发生。进入信息化时代,电子文件、信息数据库等领域的不安全因素更是被成倍放大,一些政府职能部门、公益性事业单位建立的业务和民生数据库更是关乎国计民生,任何损毁散失都会发生重大的社会问题。通过档案登记备份工作,各单位、各部门因突发事件而导致档案受损或引发纠纷时,档案部门可利用备份数据,为其提供档案数据恢复或可靠性认证服务,以确保电子文件和数字档案的安全。

3.档案登记备份工作可以实现档案信息资源集约化管理与利用。

近年来,随着信息化建设飞速发展,经济社会许多领域已完成手工管理向信息化管理的转变,政府对信息化的投入也日益加大。同时各个部门、各个领域在信息化建设中都普遍存在各自为为政,各建一套系统、各存一套备份的现象,存在重复投资等问题,同时信息系统特别是备份系统的分散管理也存在诸多不安全因素。通过档案登记备份工作,在各级国家综合档案馆建立区域性电子文件和数字档案备份中心,可以将各个部门、各个领域的备份中心统一建在各级国家综合档案馆,从而实现各单位各部门不需单独分建,既可以节约政府投资,又可以发挥档案部门专业管理、专业服务的优势,促进当地经济社会发展。

二、档案登记备份工作现状与存在的主要问题

随着《关于开展电子文件和数字档案登记备份工作的通知》下发,各级对档案登记备份工作的重要性有了更加深刻的认识,有力推进了档案登记备份工作的顺利开展。但在看到成绩的同时,还必须清醒地认识到,当前档案登记备份工作还处于刚刚起步阶段,与信息化条件下档案登记备份管理的要求还有相当差距。

1.档案登记备份工作还有待于进一步规范。

近些年,随着各级对档案登记备份工作重要性认识的不断提升,档案登记备份工作也被提上重要议事日程,档案登记备份工作也在有条不紊地进行。但由于档案登记备份工作刚刚推开,许多程序还不十分流畅,一些重要档案(电子档案)形成与管理情况调查、档案数字化转换和电子文件备份导出等工作准备不足,存在明显漏洞。有些单位没有将需要纳入登记备份范围的电子业务数据、电子公文和档案数字化成果,在移交前生成备份包或导出到脱机载体(同步生成唯一认证信息),没有做好备份载体(包)的登记、管理工作,导致档案登记备份工作进展缓慢。

2.档案登记备份管理水平还有待于进一步提高。

档案登记备份工作是档案管理工作的重要组成部分,也是信息化建设的重要组成部分。特别是档案登记备份工作主要针对电子文件和数学档案,它要求充分利用计算机等多种手段,在办公自动化基础上,逐步实现在线档案登记备份工作。档案登记备份工作不仅仅是一项单纯的计算机操作,而是需要具有一定技术性、业务性和网络技术知识的专门人才来维护、管理与运行,这就为从事档案管理工作人员的素质提出的新的更高的要求。因此,必须要积极开展档案信息化知识技能培训,进一步提高档案管理工作水平。在加强档案管理人员档案业务培训的同时,要着重加强计算机业务知识培训,重视新时期档案人才培养。同时,要充分发挥档案中介服务机构的作用,吸引社会力量参与电子文件和数字档案登记备份工作。

3.档案登记备份工作有待于加大推进力度。

档案登记备份工作程序性强、规范性要求高,而对于大多数单位的档案管理工作,仍然采用年度归档的方式,文件归档、登录、统计、备份等一系列环节性的工作,仍旧采用手工操作。尤为突出的是有些单位的档案员通常由机关办公室人员兼职,档案管理人员接受过高层次专业学习和系统教育的人员不多,甚至有人没有接受过短期培训就直接上岗,业务能力差,人员变动频繁,有的管理人员对计算机知识掌握甚少,很难应对档案登记备份的要求,档案登记备份工作跟不上时代发展的要求。档案登记备份工作是基于数字化、信息化条件下的档案管理工作,对工作条件要求较高,既需要计算机、网络等硬件的配套,更需要软件系统的支持。而有些单位和部门对档案登记备份工作重视不够,在硬软件建设上的投入不足,一定程度上影响了档案登记备份工作的扎实推进。

三、加强档案登记备份工作对策探讨

新的形势下,积极探讨加强档案登记备份工作的有效途径,有利于搞好档案登记备份工作,全面提升档案管理水平。

1.健全完善档案登记备份制度。

档案登记备份工作是一项系统工程,涉及到方方面面。各单位作为保障档案(电子档案)安全和有效的第一道防线和第一责任部门,应当逐步建立健全相应的档案登记备份制度,规范各种档案登记备份行为。档案登记备份的数据形式多样,包括电子公文、业务电子数据、档案数字化成果等;涉及面广,对各单位档案、信息技术和业务部门等都有一定要求。因此,各单位在开展档案登记备份工作前,应统一部署,明确主管部门,安排专项经费,做好协调,责任到人,并将此项工作纳入本单位岗位责任制考核。要认真学习相关文件内容,正确把握电子文件内涵、软硬件环境要求、归档和备份要求,正确把握传统档案数字化基本规范、标准。同时,要结合当地实际,制定切实可行的电子文件管理、档案数字化和登记备份工作制度,使档案登记备份工作常态化、规范化、标准化。

2.要正确把握档案登记备份工作的程序。

相关档案登记备份实施方案都明确规定了档案登记备份工作的程序,一般包括填写材料、生成备份载体、报送与移交、受理与审核、反馈等程序,并明确规定了每一程序的具体要求。一要严格执行程序。避免“重档案登记备份实体轻程序”,努力维护登记备份工作的严肃性、权威性。二要正确理解每一道程序的内容要求。档案登记备份工作实施方案,对档案登记备份每一道程序的设计,都充分考虑到了电子文件和数字档案的可读性、真实性、完整性,有特定的作用和意义。档案登记备份过程中必须认真对待、正确把握每一程序的具体要求。三要做好程序执行过程中形成的文件建档工作。档案登记备份每一道程序实施过程中都会产生相应的文件。这些文件既是所报送的登记备份档案的内容、数量、可读性等特征的信息记录,也是档案登记备份工作过程的记录,对于备份档案管理、灾难恢复、原始性认证,都具有重要作用。程序执行文件的建档管理,既是行政监管规范、有效的重要体现,又是行政监管规范、有效的重要保证。

3.正确把握档案登记备份形式。

档案登记备份对象主要有档案数字化成果、电子公文和电子业务数据三种数据形式。档案登记备份应根据不同数据形式的不同特点,采用不同的备份形式。档案数字化成果,宜采用脱机、光盘形式进行登记备份。经数字化加工的档案数字图像,一般数据容量比较大,适宜刻录到光盘上进行登记备份。电子公文,按照相关规范要求归档,一般采取光盘形式进行登记备份。电子业务数据一般采取打包寄存方式进行登记备份。变动比较频繁、数据量较大的电子业务数据,采取专线在线传输方式进行登记备份;数据量不大且变动不多的电子业务数据,可采取光盘、磁带等脱机移交方式进行登记备份。

基于高校数字档案数据备份的研究 篇4

一、高校档案数据受损原因分析

(一) 逻辑故障。

1.软件技术不成熟。当前各个高校电子档案管理系统还处于发展阶段, 很多档案管理系统都停留在相对落后的技术层面, 难以进行更新维护, 导致软硬件的支持不兼容, 往往产生错误结果, 造成系统崩溃, 导致档案数据的损坏。2.计算机病毒。目前计算机病毒已经发展到不仅破坏系统程序, 而且对储存在计算机存储设备中的所有数据进行更改、删除或窃取。3.软件程序的误操作。系统管理员和维护员的错误操作导致数据删除, 这种情况一般不是主观人为的, 多是一种行为过失, 一般是没有按照规程操作、执行错误操作命令造成的。4.系统升级造成技术过时。系统的不断升级改造, 会使原有系统过时而被淘汰, 原有系统的档案数据就可能因为无法识别而变得毫无意义。因此, 系统升级造成的系统档案数据无法读取信息的问题十分严重, 各个高校的数字档案馆也在尽力提高系统间的兼容性。

(二) 物理故障。

1.硬件系统原因。计算机硬盘如果出现故障就会导致档案数据丢失, 硬盘是故障发生率比较高的设备, 一旦发生故障, 内部数据就很难恢复, 因此, 如果事先没备份, 硬盘数据就会全部丢失。2.自然灾害原因。档案数据面临的灾害风险包括火灾、水害、气象灾害和地质灾难, 突发性的灾难对档案的破坏往往是毁灭性的, 一场大火会在瞬间将档案烧为灰烬, 一场地震瞬间将一切夷为平地, 为了降低档案安全危险, 高校档案馆必须进行数据备份。

二、数据库备份需要注意的几个问题

一是备份介质的选择。备份介质一般是要选择较耐久的材质, 使数据在当前技术条件下可以维持更长的可读时间。一般在档案数据备份中, 使用较多的是移动硬盘和光盘。要想使数据在当前技术条件下可以维持更长的可读时间, 应使用标准的软件和文件格式存储, 用不同的存储技术制作档案数据库的备份。如, 可以将备份数据在服务器或工作机上复制1份、移动硬盘保存1份、光盘刻录1份, 避免因某种存储介质出现问题后导致数据丢失。二是异地的选择。异地备份, “异地”的选择是很关键的, 最好选择两地不在同一个地震带, 不在一个大河流域。同时还要考虑人力、物力、财力等因素。三是备份的时间选择。可以每学期末进行1次完全备份, 因为高校档案工作周期性强, 每年暑假前主要接收上一年度的档案, 寒假前整理1批档案, 所有这些档案的录入都会在假期前完成, 之后不会发生变化, 比较稳定, 所以此时进行备份避开了档案查询高峰期, 又可以将整个学期的档案数据完整保存;也可以每月进行1次备份, 这就需要用到差量备份的方法, 进行1次完全备份后, 每月可以通过远程桌面连接FTP进行1次差量数据备份;也可以每周进行1次目录数据备份。四是数据备份后的定期检查。随着科技的不断发展, 数据存储载体和保存格式不断变化, 高校档案数据备份为了确保数据的长久保存和利用, 档案数据载体不同于以往的纸质载体, 备份后的档案数据在一定期限内必须进行数据读取和还原的专门技术检查, 发现问题要及时解决和抢救。随着技术的发展, 如果出现更好的保存载体和保管格式, 这些备份数据还需要重新转换格式和更换载体。

三、高校档案数据备份的策略

(一) 安全备份。

每天对整个操作系统和应用程序生成的数据进行备份, 当数据丢失时, 只要用灾难发生前一天的备份数据就可恢复。该备份的优点是简单直观, 缺点是每天都对系统进行安全备份, 因此在备份数据中存在着大量的存储空间, 增加了存储和管理成本, 所需要的数据量较大, 备份时间较长。

(二) 差量备份。

先进行一次安全备份, 然后只要把与第一次完全备份新增加或改变的数据进行备份即可。如, 星期一管理员对系统进行完全备份, 星期二系统内就多了1卷档案, 于是管理员只需将这份档案备份下来即可。这种备份的特点是无需每天做完全备份, 可以节省存储介质空间, 备份需要的时间短。

(三) 增量备份。

复制上次备份后发生变化的文件。备份软件将检查文档位, 以确定文件是否被修改, 以及是否需要备份。如果文件的文档位表明为新文件或已修改, 文件将被复制到备份设备, 之后文档位将清除。这种备份不足之处是各磁带间的关系像链子一样, 其中任何1盘磁带出了问题, 都会导致整条链子脱节。

(四) 合并式备份。

主要针对文件系统, 利用上一次全备份的介质以及历次的增量备份, 重新计算生成的新的全备份, 目的是为了降低进行全备份时对服务器和网络资源的占用。

总之, 由于突发社会事件和自然灾害等原因, 现代社会上档案安全问题频发, 高校档案管理人员一定要加强自身的风险预警意识, 提高处理突发事件的能力, 根据高校档案管理的实际情况, 采取有效的方法和策略, 尽最大努力确保高校档案数据的安全, 以保证高校教育工作的正常进行。

参考文献

[1].徐惠琴.现代高校数字化档案备份探析[J].兰台世界, 2011.6

浅谈档案利用数据统计与实际效益 篇5

一、当前在档案信息资源开发和信息反馈工作中存在的主要问题

1、局限于档案利用数据统计,不求档案的实际效益。档案行政管理部门,每到资料归档后要求基层档案馆(室)编制归档件数年报,了解档案利用情况时,只需统计几个利用数据,如利用人数、利用档案卷(册)数、页数及复印数据数等,而不了解通过档案信息资源的开发与利用,而所获得的社会效益和经济效益。收集统计档案利用数据,虽然亦能反映档案的利用情况,但这是表面现象,说明不了档案给社会和经济建设带来的价值和作用。也就是说,统计几个数据只能揭示表现现象,而不能揭示档案利用的实质,即实际效益。这是各级档案部门普遍存在的一个问题。

2、在档案馆查(借)阅利用时,只要求填写其利用目的,不求深层次了解,失去档案利用信息反馈的机会。

在通常情况下,利用单位和利用人来档案馆查(借)阅档案时,均需填写一份登记表。登记表除需填写利用单位、利用人姓名和证件号码外,就是还要说明利用目的。而利用者在填写利用目的时都较简单,如“工作参考”、“提供产权依据”等等。由于不作深层次了解,利用结束亦就了结,而失去了档案利用信息反馈的机会。档案信息资源的开发与利用,可分两个阶段。第一阶段,又可称初级阶段,即利用者到档案馆查(借)阅档案或档案馆主动为利用者提供档案,这时只反映档案利用情况;第二阶段,又可称为高级阶段,即档案通过利用者在工作、学习、生产等社会实践中的利用,不同程度会产生一定的社会效益和经济效益,也就是体现了利用档案的作用和价值,通过信息反馈而求得。而要取得这种信息,事先必须有所了解和掌握,即在利用时有目的地作些深层次了解,并一一记录在案,以利日后跟踪调查。

3、有了利用实例,不求汇集编发重返社会。

有些单位虽也注重档案利用信息反馈工作,收集有价值的档案利用实例,但只是作为档案目标管理认证和达标的材料,因此收集后就将实例束之高阁,不汇编发表,重返社会,影响档案信息资源的开发与利用。如果将利用实例编发,不但会促进档案的开发利用,使社会和全民更加认识档案、了解档案,使档案的使用价值得到进一步发挥,而且可大大提高档案馆的社会地位和知名度。

二、档案馆应在了解和掌握档案利用实际效益上下功夫。综观各地各级档案馆都能够把每年档案资料查阅利用情况反映出来,即某某年查阅有多少人次、多少卷(册)档案,但该年数百人次、数百卷(册)档案,有什么社会效益和经济效益呢?却一无所知或知之不多。为此,笔者认为档案馆查阅利用情况需要了解和统计,但更重要的要从了解和掌握档案利用实际效益上下功夫,即了解其查阅利用目的和所产生的社会效益和经济效益。要想取得成果,除了要求利用者主动反馈信息外,档案馆亦可进行跟踪调查。调查收集档案利用实际效益,主要有以下六大作用:1、有利于了解档案的价值和作用。《档案法》第二条称:“本法所称的档案是……对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录。”但了解档案是否具有保存价值,最重要的一点是要提供利用。如果档案不再利用,最有价值的档案也就失去保存的意义。而只有通过档案的利用和开发,才能了解档案的价值。不少单位和领导,为什么对档案工作不够重视和支持,主要一个原因是档案部门长期处在“封闭”状态,单位和领导也认为档案不能给本单位出效益、出成果。其实无数事例证明,这完全是一种偏见和误解。有保存价值的档案,一般都具有利用价值,但其价值的大小,必须通过利用,一旦利用一定会产生一定的社会效益和经济效益。

2、有利于档案的鉴定工作。众所周知,档案的保管期限定为永久、长期、短期三种,档案到了规定的保管期限,就要组织鉴定,确定其销毁还是延长保管期限。而档案的价值是鉴定时必须考虑的一个重要因素。档案利用频率高、周期长,即使已到规定的保管期限,也应继续延长其保管期限;反之,档案利用率较低,保存价值不大,即使未到规定的保管期限,亦应降低其保管期限。通过调查收集档案利用的实际效益,大大有利档案的鉴定工作。

3、有利于了解和掌握档案利用信息,进一步拓宽档案利用工作的渠道,最大限度地发挥档案的价值和作用。通过实际效益的调查和收集,可以进一步了解社会和市场对档案利用的需求和利用者的心理,从而改进我们的服务形式,拓宽利用渠道,使更多的利用者了解档案,熟档案,利用档案,为社会主义现代化建设服务。如果我们不重视调查和收集档案利用的实际效益,档案利用渠道就无法拓宽,亦影响档案价值作用的充分发挥。

4、有利于编发档案利用实例,加大档案宣传工作力度。通过调查和了解收集档案利用的实际效益,取得一个又一个的利用实例,充分体现档案的保存和利用价值,并筛选、整理,编印成小册子,下发至基层和领导,使他们了解档案的作用,这要比空喊几句档案工作重要强得多。尤对不太了解档案、不熟悉档案价

值的同志来说,更是一个实际的宣传和教育,使他们通过例证,了解档案,支持档案工作。

5、有利于档案馆业务工作实绩的体现。档案业务工作的内容很多,而开发利用档案信息资源应该是业务工作的“主体工程”,因为,收集和管理档案的根本目的,是为了利用,否则就失去保存档案的意义。而要衡量一个馆(室)的工作与实绩,在业务工作上,开发利用档案信息资源最能说明问题了。用户通过利用你的档案,获取了社会效益和经济效益,这就是你工作的实绩。如果既统计利用数据,又注意了解档案的实际效益,那你的实绩就有血有肉。

三、开发利用档案信息资源,获得档案实际效益的基本做法

1、认真做好查(借)阅登记工作。查(借)阅登记是各馆在档案查(借)阅时必须做的一项工作。在登记时,一要认真负责,按项目一一填写清楚,必须填写的项目不要漏填;二要把查(借)阅档案的利用目的,填写清楚,不可填写得太简单,而应填明作那一项工作参考,填明具体内容和将起到的作用和效益,这样便于提供实际效益的线索和确定有否必要进行跟踪调查等。

2、建立用户联系制度。档案在查(借)阅时,一般不会产生效益,而要通过实践,才能反映出档案的实际价值,产生一定的社会效益和经济效益。因此,为了及时取利用信息,可以建立用

户联系制度,即把用户的姓名、单位地址、联系电话和邮编等一一登记在册,以便与用户联系。档案馆亦可把自己的联系人和联系电话告诉用户,以利用户及时反馈信息。同时,也可定期召开用户座谈会,以利加强与用户联系,改进我们的工作和服务方法,更好地为社会和用户服务。

3、分发档案信息反馈表。即在用户查(借)阅档案后发给一张档案利用信息反馈表,主要内容包括利用单位、利用人、时间、案卷名称和获取的社会效益、经济效益。特别是效益要写得具体一点,应有时间、地点、人物和具体事例。

4、及时编发档案利用社会效益、经济效益实例。反馈的信息仍要通过编辑再重返社会,这样既可进一步宣传档案的作用和价值,又可使社会各界进一步了解档案、熟悉档案,来利用档案。特别要将实例送给有关部门(单位)的领导,使他们认识档案作用,支持做好档案工作。如果把反馈的信息收藏起来,便失去了反馈工作的实际意义。

档案数据备份论文 篇6

【关键字】档案工作;管理理论;数据库;计算机

信息管理技术是一种新型的科技技术,并在短期时间内得到了极为广泛的传播,这种性质反映在档案管理工作中,就表现在传统管理技术与现代管理手段的冲突,纸质为主要形式的档案载体与计算机的电子信息之间的矛盾。现代档案管理既保留着原有的档案管理模式,又在不断创新发展现代化的管理模式,这就导致档案管理理论在一定程度上不适应现有的发展趋势,为档案的数据库建立与信息建设带来很大影响。

一、档案管理理论对档案数据库建设的重要性

档案管理是一项极其繁琐复杂的工作,在面对复杂的档案信息管理时,计算机可以充分展现出它自身所具有的优越性。根据这一特点,电子数据库的重要性获得了广泛的关注,数据库的建设随着互联网技术广泛运用得到了空前的利用空间。计算机技术引入文献管理之后,由于先进的手段及快捷的检索,使数据库的制作渐渐完善起来。档案数据库建设是以档案的自身管理为依据,包含了数据库建设和应用发展的需求,将包含档案实体信息、管理信息、应用环境信息在内的各种类型数据按照特定数据模式进行组织的數据集合。档案数据库是多种档案信息系统正常运转的重要组件,是档案信息化重要的基础工作之一,档案管理理论对档案数据库建设起着重要作用。

二、档案分类理论对档案数据库的建设起着导向作用

档案管理的基本目的是要使档案有序化,包括档案实体管理和信息管理的有序化,档案数据库的建设也同样是为了更好的达到这个目标,因此,档案的分类理论领导着档案数据库的建设方向,是档案数据库建立的基础理论依据。一般档案管理理论中的分类理论可以分为逻辑主义和历史主义两种形式。逻辑主义即指对档案的分类要按照档案的内容相似度进行归类划分,体现出档案的逻辑性。历史主义则是指在档案归类时,要将档案成立的时间顺序进行区分归类,以便同一时期的档案可以更好的还原历史现状。这两种理论形式为档案数据库的建立提供了整体框架依据,指明了建设方向。

一般来说,对档案的实体管理基本采用了历史主义的分类方法,大体都按全宗进行排架整理;而档案内容信息的管理则可以同时采用两种方法,一般以逻辑主义分类方法为主。在档案数据库建设中,一般是在来源单位层次上建立实体数据库,实际上是将一个全宗(一般是档案室层次)或全宗群(一般是档案馆层次)作为建库范围,同时利用视图、索引等数据库对象对内容实施逻辑管理,使档案管理理论中的“二元主义”得以在数据库建设中融合。

三、全宗原则及其理论发展对档案数据库建设发挥指导作用

档案管理基本理论认为档案的实体管理必须维护和尊重档案的本质特性,必须采用历史主义的方法,遵守全宗原则,这一思路对于档案数据库的建设具有重要的指导作用。

首先,全宗原则是档案实体分类的基本方法,是人们经过理论分析和实证研究之后得出的宝贵经验。以全宗为基本单位建设档案数据库,数据库内容反映的是一个现实的实体单位的历史记录,保证了档案数据具有一个坚实可靠的立足点,这是单纯地依靠逻辑分类方法所达不到的。其次,全宗原则及其理论是以历史主义的理论方式进行指导档案分类的,这就在某种程度上保护了档案归类时的完整性和原始记录性。在建立档案数据库时,这种理论指导方式可以大大提高数据库的整体性和成套性,对于还原档案的本质有着重大的意义。依据全宗理论进行档案数据库建设,有利于数据库的建设与维护工作。

全宗原则是指导档案数据库建立的基本原则和方法,但在社会的发展进程中,全宗原则并不能使档案数据库毫无障碍的顺利建设实施,也有很多问题是全宗原则的理论指导无法解决的。因此,新形势下发展的全宗原则对档案数据库的建立还有着其他的影响。如档案之间存在的差异性使得档案数据库建立时面临更加复杂的局面,同一全宗的档案存在着不同的类别,如果采取建立相对独立的档案数据库而非全部由同一个数据库进行管理,就可以很好的解决这种复杂的局面。另外,随着社会需求的多样化,全宗原则的概念已经逐渐拓展,并非只是单单指传统的狭义全宗原则,如果某项专业在建立档案数据库时打乱传统的全宗整体性,经过一定规律的组合后得出一个新的全宗单位,在这个新的全宗单位的基础上建立起来的档案数据库更能很好的为专业服务,那么这些自由组合的全宗理论也是可以成为档案数据库建立的理论基础的。

四、逻辑主义分类思路适合档案数据库的内容管理

逻辑分类方法在实体分类中的应用效果并不良好,而在档案的内容分类上却发挥着很大的作用。逻辑分类法在档案数据库的内容管理中有着非常普遍的应用。我们知道,档案的实体整理必须按照其形成时的本来面貌去管理,但档案内容信息是极为丰富多彩的,人们对这些内容的需求也是多样化的,但和现实世界中档案实体的排序只能有一种一样,在数据库中我们一般通过有限的基本表来反映档案实体的记录信息。我们绝没有必要根据用户的每一个需求重建数据库,在表达逻辑需求方面,数据库拥有强大的管理手段,我们可以依据我们感兴趣的特征(或特征组合)通过索引、视图、查询等数据库对象很方便地对档案数据库进行逻辑重组,好像魔方一样,可以变换出我们需要展现的内容。而且在计算机环境中,由于软硬件屏蔽了许多对用户无关的内容,使得用户可以像操纵基本表一样操纵视图,就好像档案实体真的是按照我们指定的特征进行分类一样。

五、电子文件管理理论为档案数据库的未来发展提供营养

随着社会科技的进步,电子文件逐渐成为当前人们应用最为广泛的档案保存方式。电子文件的信息记录具有更强的多样性和全面性,保持电子文件的真实完整是未来档案数据库工作中的重要内容。而要想使档案数据库在电子文件管理环境中发挥良好的作用,则需要电子文件管理理论提供支持。为确保档案数据库中电子文件的真实可靠、完整安全、长期可读提供保障,档案数据库不能像传统方式那样,在档案文件接收完毕、文件的真实性有案可查的情况下开始数据建设,而是要在第一时间规划完毕,伴随文件生命周期进行动态跟踪,将各个环节需要记录的数据各就其位,构成一个完整的数据链条,为该文件的描述、利用、验证、保存等提供信息。

六、结语

大数据时代的档案数据整合研究 篇7

随着网络技术和计算机软件技术的快速发展, 越来越多的行业引入了云概念, 将传统的单一独立系统变成可以数据集成共享的统一系统, 在云计算系统中, 云计算成为当前研究的热点, 其通过海量的信息将数据的量变转换为系统的质变, 从而解决日常生产运营的各类问题, 相关文献将其成为“ 大数据”。 随着大数据时代的到来, 商业、 工业以及其他国民经济领域将逐渐依赖于大数据的分析和决策。 大数据时代的档案数据的整合也成为档案管理部门研究的热点和关键点。 档案数据的整合包括数据的存储、 数据的挖掘以及数据的保护。 档案管理将通过档案数据整合实现大数据的处理。 本文将结合实际工作经验, 对大数据时代的档案数据整合进行分析和研究。

二、 大数据时代的档案数据整合

( 一) 相关概念及技术应用

当前大数据渗透到人们生活的各个方面, 而在档案管理方面其甚至突破了原来的简单衔接实现的资源共享和工作协同, 而是将现有的大数据视角下的所有与档案相关的数据信息资源进行整合, 通过大数据、档案信息以及整合进行集成方面的剖析。 在大数据时代的档案数据整合通过对网络技术、 计算机技术以及数学算法运算等技术手段, 借助社会组织单元之间的协同合作, 将分布零散在不同的领域, 不同的行业的大数据资源通过一定的规则进行联接, 实现了一个具有程序化、 一体化和科学合理化的管理整体。 因此, 大数据时代的档案数据整合应用的技术主要包括: 系统集成技术; 计算机网络信息安全技术; 数据分类、 检索和索引技术; 数据存储与数据压缩技术。

( 二) 大数据时代的档案数据整合实务

我国自引入档案大数据整合以来, 各地对档案信息化进行了颇有成果的探索, 构建了一定规模的技术设备和管理系统, 而当前由于体制方面的、 管理方面的不够成熟还存在着各自开发、 各自成系统的情况, 这导致数据接口不一、 数据共享难, 对于大数据时代来说, 单一的共享原则上不算共享。 而如上所述, 由于技术应用环境的不同, 当前多数信息系统处于一个无统一管理、 无全共享的环境。 后台数据库更是由于开发者的独立开发和数据接口设计的不一导致数据库的数据结构等技术方面共享出现难题。 实际工作中, 我们更愿意将其联接成一个可以简单、快捷的数据库群, 实现大数据的自由、 高效的流动与交互, 从而实现系统的有序化和统一化。 从这一点上来讲, 大数据时代的档案数据整合必须实现技术上的信息整合。

与技术整合相对应的是管理方面的整合, 这也是档案数据整合的核心部分。 大数据时代的档案数据整合工程是一个复杂的管理工程, 不仅需要档案资源整合技术的支持也需要科学管理方面的整合, 营造与其相匹配的管理环境。 因此实践中必须有统一的管理协调单位对整个整合工作进行统一调配和管理, 并与此同时实现整个数据整合工程的监督管理体系的监理, 对工程的实施进行监督。 最后树立合理的数据整合观念意识, 实现对数据整合工作的智力支持, 与此同时, 制定相应的规章制度, 促进相关组织单元的互相交流和学习。

最后, 面对当前越来越严峻的网络安全隐患, 档案数据的整合在大数据时代也有其自我的要求。 此处的网络数据安全方面的考虑也可以称为安全整合。 安全整合在于对档案馆 ( 室) 内部所已整合的、 待整合的、 正整合的大数据进行有效的保护, 使其不容易从外部进行非法的篡改、 破坏和泄露, 确保相应数据的完整性、 机密性和真实性。 另一方面必须确保档案信息的完整性, 对身份认证、 信息加密以及访问控制等软件信息完整性进行有效整合, 确保档案数据的资源不被篡改和盗窃。

( 三) 大数据时代的档案数据整合模式

按照当前大数据的具体需要和相关规范标准, 当前大数据时代的档案数据整合必须解决三个主要问题, 分别是数据采集与处理、 数据基础技术问题和数据分析应用问题。 因此, 大数据时代的档案数据整合模式可以通过设计相应的三个层次进行实践设计, 一是数据融合处理; 二是平台融合; 三是服务融合。 数据融合通过统一的数据接口标准对当前存在的档案信息系统及其相关的信息系统进行异构异地数据的存取和开放。 因此, 数据的接口标准及相关开放规范是数据资源融合的基础和关键。 这个过程是一个较为统一的管理过程, 相关管理部门在权衡数据资源利益与开放资源收益方面必须有较好的处理方式, 相关文献指出解决大数据利用带来的价值分配问题需要法律及相关的行业标准和制度依据。 再之, 数据融合归根到底必须构建一个能够统一管理、 具有层次化的数据中心管理平台, 对来自包括档案信息系统在内的各个数据主体和行业数据进行统一管理和价值分配。

其次, 对于平台融合而言, 基础设施是上述大数据管理的基础, 也是数据融合的重要手段。 大数据时代的档案数据融合也是一种信息技术问题, 其必须在实际工作中解决包括数据采集、 数据处理、 数据分析、 数据安全以及数据存储共享等多个现代信息技术关键问题。 因此平台融合讲到底还是技术融合, 如何利用现有的网络技术、 计算机技术、数据库技术、 数据挖掘技术、 机器学习技术、 云技术等多种新技术进行数字资源平台的搭建是平台融合的关键问题, 也是大数据时代档案数据整合的核心所在。

最后, 大数据的利用和开发目的在于为决策者、 管理者以及其他服务享受者提供一站式综合服务, 因此服务融合的主要目标在于如何对现有大数据的分析和利用。 实践中, 服务融合更多指的是以大数据和平台为实现基础, 进行数据采集、 分析和共享等, 为特定的用户提供特定的服务, 实现最终数字资源融合。

三、 结束语

档案数据作为采集具有历史价值和实现现有价值的数据信息, 其为社会经济发展提供了较好的基础数据和生产要素支持。 大数据时代下的信息化建设也是我国当前信息化建设的一个重要组成部分, 因此, 大数据时代下的档案数据整合是具有较强实践意义的一个工程, 既是大数据时代信息化的实质要求也是当前档案信息化建设的重要内容。 因此, 我们必须利用当前的关键技术, 在大数据时代的环境下抓住机遇, 挖掘大数据背景下的数据资源, 对档案信息进行整合, 使档案数据能够安全、 便捷面向大众, 促进自我价值的提升和行业的进步。

参考文献

[1]孙玉玲.大数据时代数字出版产业的发展趋势[J].出版发行研究, 2013.

[2]马建光, 姜巍.大数据的概念, 特征及其应用[J].国防科技, 2013.

数字档案备份初探 篇8

一、数字档案备份研究现状

我国数字档案备份工作起步较晚, 以“数字档案备份”作为检索词, 对已有学术数据库进行搜索, 获得文章3352篇, 这些文献涉及到经济、建筑、气象、计算机、法律等40个学科。其中研究重点包括备份技术、模式、载体等各个方面。通过对这3352篇文章进行分析, 得到以下结果:我国最早提到对数字档案备份是来源于1977年颁布的《无线电广播技术维护制度和管理办法 (草案) 》, 并且于1998年首次提出了电子时代档案的保护。以“数字档案备份”and“方式”为检索词进行检索得到1871篇文章, 我们会发现在2001年前只有零星几篇文章, 2001年美国911事件和2008年汶川地震成为档案学者对数字档案备份工作研究的时间转折点, 文献数量呈几何级增长。在这1871篇文献中, 对引用次数较高的文献进行查阅, 得出具有代表性的观点。孙晓霞、王洁在其《数字档案备份中心的备份模式及其选择》中将档案备份分为两种方式。基于不同空间范围:原地备份、异地备份。基于不同建设方式:自建模式、共建模式、外包模式。赵生辉、侯文希在其《政府信息资源灾备体系建设模式综述》中将数字档案灾备分为两种。基于灾备范围的分类:本地灾备、异地灾备、区域灾备和分布式灾备。基于建设方式的分类:自建、互助、共享和外包。

二、影响数字档案信息安全的因素分析

数字档案开放利用和其他各种不确定因素的威胁, 使得数字档案在长期安全保存中存在诸多的问题, 社会各界越来越多地关注和研究数字档案的安全问题。

随着各国政府积极推动办公无纸化这一措施, 越来越多的档案文件开始通过计算机网络来进行传输、保存。计算机在对档案收集、整理、保存、利用等方面产生积极效果的同时, 也由于计算机在硬件、软件、环境、人员等方面存在的风险给数字档案安全带来了不小的安全隐患。总体来说, 数字档案安全受到以下方面的威胁:

(一) 自然灾害。

自然灾害对人类社会带来的破坏力是惊人的。地震、洪水、台风、火灾这些灾害具有范围广、破坏力强的特点, 往往在人们意料之外给档案文件带来毁灭性的打击。例如在2008年发生的汶川大地震, 强烈的地震波无情地吞没无数生命的同时, 它摧毁房屋, 使得灾区大量的档案库房坍塌损毁, 档案文件或被水浸泡或被乱石掩埋。胶片、硬盘、光盘这些新型材质, 因对火和水的高度敏感性, 使其在遇到水灾、火灾时, 会变硬变脆甚至粘连在一起, 如果不及时抢救, 将导致严重的后果。据估算, 建国以来, 全国各级档案馆因火灾而导致300万份档案损毁。

(二) 硬件故障。

墨菲定律告诉我们, 会出错的事总会出错。档案是“前世赖之可以告古, 后世赖之可以告今”的宝贵历史材料, 我们并不希望它只能保存10年、20年, 而是千年甚至永久。高密度的现代数字档案存储介质在长时间高速运行的时候发生故障是无法避免的, 硬盘驱动器损坏、服务器故障、电源中断等等因为质量、环境等因素导致的故障, 会给档案机构造成无法弥补的损失。根据EMC公司在年初发布的报告中我们不难发现, 在2014年的12个月中, 因为数据丢失和宕机而造成的直接经济损失达到惊人的1.7万亿美元, 这相当于制造业大国德国近一半的GDP。而从2012开始, 数据丢失比例增长4倍的同时, 令人伤心的是, 有超过2/3的企业并不认为自己能够恢复这些数据。调查的同时, 我们得到Kroll Ontrack公司最新的调查数据, 结果显示在EMC的报告结果中, 惊人的72%的数据丢失是由硬件故障导致的。

(三) 人为入侵。

如果说因为自然灾害、硬件故障而导致的数据丢失还给数字档案所有者留有恢复余地的话, 那么来自人为入侵、破坏而导致的数字档案、数据的丢失将是难以弥补的。这方面的破坏主要包括计算机被盗取、存储服务器网络遭到黑客入侵, 数据被篡改、删除。

(四) 软件因素。

我们这里指的软件因素包括相对于硬件设施而言的操作软件故障和操作、维护数据存储系统的档案管理人员。软件故障大多是指存储系统设置不正确、存储系统更新不及时给数据存储系统正常运行带来困难。数字档案保管机构的操作人员是数字档案的直接接触者, 其自身素质影响着存储的数据是否安全。在日常管理中, 常见的由于操作错误而导致的误删除占到各类问题的80%左右。数字档案的安全存储始终要坚持“三分技术、七分管理”的原则, 这说明了规范管理是确保档案信息安全的重要因素。

(五) 数字档案存储介质的不稳定。

现代新型的存储介质使单位密度上能够存储的数据量成倍增长, 但其使用寿命却远不及传统的纸质载体和缩微胶片。一般而言, 光盘的保存期限为5~100年、磁带的保存上限为30年, 磁盘的实际寿命只有5~10年, 这还不包括因为日常误操作而导致介质损坏、保存环境不达标造成存储介质腐坏。根据日本国会图书馆对2003年前入馆保存的电子文献进行调查发现, 69%存在利用困难的文献中有12%是由于存储介质导致的。

(六) 数字档案存储格式的不稳定。

网络、计算机、信息系统是数字档案的基础, 也是影响数字档案安全的主要因素。随着计算机技术的飞速发展, 平均每3个月就有一种计算机语言面世, 而语言间是不存在沟通互换的。数字档案是基于一种语言存储在其对应的信息系统中的, 随着时间的推移, 这个特征会给数据档案的正常读取带来困难。

三、数字档案备份方式

(一) 数字档案备份的基本分类方法。

1.根据备份介质分类: (1) 磁盘备份。现今我们选择磁盘进行备份主要包括了内部的硬盘和外部的磁盘阵列。硬盘具有读写速度快的特点, 是进行实时备份的最佳选择, 然而数字档案备份的首要前提是保证数据安全稳定, 硬盘由于在运行中容易出现故障, 决定了其只适用于小范围的实时备份系统。之后出现的磁盘阵列技术保留了前者的高速持续读写这一特点, 又增加了利用冗余信息的方式使磁盘失效时不会使访问数据受损主要有RAID0、RAID0+1、RAID5三种, 后三者配合热插拔技术可以实现数据的在线恢复, 是未来数字档案的主要存储介质。 (2) 磁带备份。磁带备份技术由于价格低廉、存储量大、易于保管是目前产量最大和用途最广的存储方式。磁带是出现最早的存储介质, 其标准化程度高, 目前技术最成熟的DLT8000磁带机读写速度可以达到30M/S, 适合大型档案馆、数字中心保存数字档案。但是, 磁带的数据结构是成线性排列, 不利于档案信息检索。 (3) 光盘备份。光盘是以塑料为盘基, 金属为涂层, 记录光信息的存储介质。比起硬盘, 以光盘为备份载体可以节省大量资金, 又可以通过光盘库技术将多张光盘组合起来, 实现信息的海量存储, 并且具备硬盘的高速读写功能。但是, 以金属为存储介质的光盘, 会因为金属的氧化而造成数据丢失。目前好的光盘能够保存20年左右, 不好的只能保存2年, 不能够满足数字档案的长时间安全存储。2.根据空间范围分类: (1) 本地备份。本地备份是指在档案馆所在地进行数据备份, 在本地建立容灾备份中心, 这种建设方式只能保证主服务器数据在遭到人为破坏后保证业务流程的连续性, 但是在遇到区域性自然灾害时不能够发挥作用, 只能作为异地备份的补充。 (2) 异地备份。异地备份方式主要包括了三种:一是远程异地备份, 是指将数据档案备份到不属于同一地震带、同一电网、同一河流流域、同一海岸线的区域, 确保在灾难发生时, 数字档案不被丢失。二是互助备份, 是指两个不用地理环境的政府通过签订协议, 将数字档案传输到对方系统中进行存储, 这种方式不需要另外建设库房, 以最小的投资, 最大限度地提高了档案馆的容灾能力。三是区域备份, 区域备份是指区域政府为了保护区域内数字档案的信息安全, 通过政府出资建设区域备份中心, 提供给区域内用户使用, 实现数字档案集中备份管理。3.根据建设方式分类: (1) 自建模式。自建模式是档案馆依托自身力量建设的数字档案备份体系, 这种模式要求了档案馆需要具备足够的资金、专业的技术人员, 建设难度大, 后期维护困难。但是这种方式能够最大程度满足自身数字档案备份的需要、安全性高。适合于大型的国家档案馆。 (2) 共建模式。共建模式是两个或两个以上档案馆共同出资建设。优点是节省财力物力人力, 缺点是多家档案馆共同管理可能会导致职权不明确、责任认定不清楚。是目前国内政府档案机构使用范围最广的一种方式。 (3) 外包模式。外包模式是指将数字档案备份工作交由专业的服务提供商来解决, 由提供商来分析数字档案的方式, 给出最佳的备份方式和服务。这种方式的优点是投资少, 缺点是不能保证数据的保密性。适合于小型并且对保密性要求不高的企业。

四、基于云存储的数字档案备份策略

随着信息社会的来临, 信息作为人类发展与进步的动力, 在人类社会中扮演的角色越来越重要, 它已然成为继物资、能源的“第三大动力”, 其载体形式也由过去单一的纸制、胶片保管存储发展到近来最热门的数字化档案备份与存储。为了有效地开发利用档案信息资源, 最大地发挥档案的价值, 世界各国都在积极利用现代化技术和设备建设数字档案备份中心, 但总体来说, 由于数字档案馆需要占用大量土地资源、后期的设备维护、人员经费开支等诸多因素都影响了数字档案备份中心的建设, 中小型企业在巨大的资金压力下, 对数字档案备份中心的建设只能是望而却步, 使其只能在大型企业集团、国家政府中得以利用, 对数字档案的系统延续造成破坏。本人在借鉴他人研究成果并结合实际工作中遇到的问题, 基于现有云技术的推广以现有几家云存储工具为例, 对未来云环境下数字档案备份工作提出见解。云存储是由云计算技术延伸过来的新型概念, 是一种新型的存储技术。云存储利用云计算技术的集群应用、网络技术和分布式文件系统等功能, 将大量的网络存储设备通过并行协同软件集合起来, 共同向外部提供数据存储和业务访问功能。简单来说, 云存储就是将需要存储的资源放到“云”上供人存取, 使用者可以在任何时间、任何地点, 通过连接到网络的授权设备对数据进行操作。

(一) 云存储的不利因素。

1.数据的隐私保护。使用本地建设来进行数字档案的备份虽然耗资巨大, 但是在对数据档案的隐私保护方面是有保证的, 新型的云端存储是将数据放到网络之上, 在获得极大便利的同时, 将失去对数据的物理地址控制, 所有的数据访问权限交由云提供商处理, 意味着数据的保管责任部分转移, 给数据隐私保护带来隐患。2.数据的安全保护。数字档案的存储是为了尽量保证数据零损毁。当需要进行网络数据恢复时, 云端数据因为种种原因丢失, 云存储提供商只能进行赔付, 但并不能为用户找回数据。微软曾在2009年冬天, 因为SIDEKICK故障, 导致用户不能访问邮箱、日历等一系列服务一个星期, 微软随后表明因为管理人员忘记进行备份操作, 导致数十万用户数据永久丢失。国内的盛大云磁盘在2012年因为位于无锡的物理机本地磁盘损坏导致用户数据丢失, 造成巨大损失。

(二) 云存储的优势。

1.节约成本。云存储技术的应用对数字档案备份成本的影响是巨大的。一般来说, 传统的数字档案备份中心建设需要耗费巨大的资金, 而档案部门在企业部门中一向是处于末位。传统的数字档案备份对存储介质的要求极为苛刻, 必须兼容系统的要求, 而存储技术的发展是迅速的, 云存储的利用可以使得档案部门在不需要购买设备的情况下, 享受到优质的服务。云存储提供商大多采用的更加环保绿色的节能技术, 包括通过对太阳能的利用, 冷却水的循环, 支持基于性能加速技术的低能耗串口盘作为存储载体, 可以实现高速的网络备份, 整体能耗远低于传统的数字备份传输。2.可靠持续性服务。传统的数字档案备份中心系统管理中, 档案操作人员往往需要同时操作不同的存储设备, 使用不同的存储设备需要档案操作人员了解每个组件的具体性能和操作方式, 使得工作复杂而繁重, 不利于数字档案的安全备份保管。云存储提供商依托自身多机房部署保证数据访问稳定, 通过冗余备份应用系统保证可以在极短的时间内还原业务系统, 大大缩减了灾难后的数据恢复时间, 提高灾难恢复的效率。相比于传统的数字档案备份中心容量扩容, 云服务商提供的云存储采用并行存储管理系统, 当使用者需要对容量进行扩大时, 不再需要对存储服务器进行配置和调试, 降低了因为配置错误而造成的服务器宕机, 威胁到数字档案备份工作的进行。3.提高竞争力。通过使用云存储, 利用最新的虚拟化和管理创新, 在提升效率的同时简化基础结构。根据微软公司提供的数据, 云存储成本大约只占到SAN存储的四分之一。IDC的报表介绍到, 一家典型商业机构的数据存储量每年平均增长50-60%, 但只有其中一小部分数据需要经常使用。SAN/NAS等完全本地化的数据存储对于此类数据存储比较昂贵。

对于中小型企业来说, 市场规则总是在不断变化, 企业需要实现精益并保持精益, 减少不必要的投入, 而在必要时迅速扩展。云服务商提供的云存储服务现已提供数据分析服务, 在随时随地处理业务的同时, 帮助企业在竞争中领先。

在当今的企业环境下, 人们的最新标准是要用较小资源做更多的事, 充分利用每一笔投资是大势所趋。

综上所述, 传统的存储技术在面临信息时代数据量的爆炸式增长暴露出局限性的时候, 使用云存储能够解决其中一些难题, 表现出一定优势。但是, 由于现阶段云存储还不是很成熟, 其存在的各种问题是开展数字档案备份工作不得不考虑的问题。

摘要:本文对数字档案备份的必要性和主要备份方式进行了比较全面的分析, 在此基础上论述了基于云存储的数字档案备份策略。

档案与档案信息化数据的保护探析 篇9

1 档案的大致分类

档案是对一些事实和过程的纪录文件。可以说明文件的原始性也保存了文件的记录性, 是再现事实的一个重要依据。其中个人档案可以说是个人的生命轨迹轮廓, 用人单位可以通过其来了解所需要招收的人才情况的重要途径, 在进行竞选等政治活动时也是必不可少的部分。为了工作与生活, 每个人都需要和社会上的单位、部门等进行交流和接触, 由于工作以及社会、生活的需要而必须建立起的个人档案, 其重要性绝不可忽视。没有档案的人不便于被单位或企业所了解和认识, 对于个人生存十分不利。除了属于个人的个人档案之外, 档案还大致包括:民生政务类档案 (包括企业政务公开、部分公民在参与选举或者进行申诉等方面) ;社会保障类档案 (包括个人在单位就业、获得职称、工资福利情况、收入情况、生育保险、养老保险、技能培训等方面) ;国企转制类 (包括国企转制后企业的资产评估、流向以及职工安置等各方面处理事项的记录) ;教育卫生类档案 (包括教育收费、学生的学籍管理和招录信息, 居民健康、居民医保、患者处理、食品药品安全管理等方面) ;工商管理类档案 (包括企业及个体各工商户在登记注销等方面) ;民政司法类档案 (包括婚姻情况、军队入伍退伍情况、收养情况、残疾人、低保、法律援助等方面的档案) 。这些档案和广大居民群众的自身利益关系匪浅, 是构件和谐社会的基本条件。

2 现今档案管理中存在的问题

2.1 对档案管理的重视度不够

档案在管理过程中, 由于本身数量较大, 导致管理工作量较大, 并且工作环节十分繁琐。并且相关管理人员对于档案的管理过程并不重视, 管理单位也容易出现缺少相应的管理设备和软件、管理人员分配不足、经费下发不到位等情况, 使得档案管理难以保质保量地进行。

2.2 管理机制不畅

部分档案在各类问题上涉及的方面较为广泛, 由于不同类别的档案需要部署到不同的管理部门进行管理。就现行的管理机制而言, 不同的管理部门对档案的管理方法各不相同, 使得相关部门沟通困难, 在进行档案整合等工作时很难顺利进行。

2.3 档案管理制度尚未完善

根据目前档案管理管理的基本手段, 大部分类别的档案管理方式由各自的主管部门所指定, 导致不同类别的档案收集范围和保护形式、保管期限都各不相同。在群众对档案需求时, 不同类别的档案的数字化程度和获取方法都各不相同, 导致在取用档案时产生很多繁琐的程序。

2.4 档案数据标准不一

目前, 档案数字化进程中存在着大量的问题, 例如在对档案目录进行数据录入时, 部分案卷目录和该卷内的文件目录无法正常对接, 对日后案卷的检索调阅工作带来很大的阻碍;在对档案进行扫描存档时, 由于设备问题导致保存像素过低, 产生的图像模糊不清的情况, 让档案在提取后无法正常使用。另外, 数字化档案的管理缺乏统一有序的标准。在档案管理部门中, 对于档案的管理包括处理各机构所上传的电子档案文件, 需将其分类归档管理, 并对部门内部已有的档案进行整合。在对各机构所上传的档案进行管理时, 最好的方案是对电子文件采用自然归档, 使其和文档进行一体化的管理, 而大部分管理部门的管理系统分为办公自动化和档案管理两套系统, 并且不同单位的管理系统也各不相同, 由于这些因素而产生的各类差异导致档案数据在传递时难以转换, 这样一来对电子文件进行归档时就会出现相关的难题。

3 相关管理手段与对策

3.1 对实体档案加强管理

将相关单位的档案管理机制和档案管理软件进行统一, 实行整体有序的管理方式, 实现档案管理由管理型工作向服务性工作转变, 保证群众在使用档案和提取档案时能够更加方便快捷, 便于日常生活的使用。同时在对档案管理过程中, 加强管理的规范性和标准性建设, 采用相应的制度将不同档案标准不一的现象彻底改善。档案行政管理部门通过自身对责任的传达与分发, 督促各部门在档案的形成、整理和保管的过程中按照相应的制度进行操作, 使得档案的管理过程能够有序统一, 管理规范, 形成良好的档案资源整合共享环境。另外, 在对相关部门管理制度方案进行统一后, 对于档案管理要做相应的宣传, 争取上级各部门以及政府对于档案管理工作有相应的重视与支持, 能够加大资金投入量, 解决在档案管理过程中产生的更换落后设备, 新建库房等资金问题。

3.2 重视档案信息化加工工作

实体档案由于数量巨大, 在管理过程中所消耗的时间也较多, 通过为这些档案建立电子档, 能够很快捷地将这些档案方便地送到需求人员手中, 这些电子档案在接受检查时的全面率和准确率高达99%, 不仅精确方便, 也便于档案的存储和归类, 所以在后续的工作过程中, 档案数字化应该作为保护与利用档案的重心来完成。

3.3 加强档案数据的保护

由于档案的信息化设计的专业面广、过程较为复杂, 在实施时有一定的难度。外联工作的保护是其重要的第一步, 从立项起, 通过选择国内知名度高有实力且诚信的外包单位来对档案进行管理, 能够很好地保证档案的安全性。由于目前档案信息化的形成度不高, 社会中各机构和各部门对信息化档案的认知程度各不相同, 而档案部门若不实行相同的体制, 就会导致档案在管理过程中出现数据资源和业务流程差异过大, 无法形成完成的互联状态, 从而出现管理漏洞, 造成档案信息的外流的情况。此外, 相关部门还需要加强档案管理内部的整体性, 对管理部门内部的资源进行整合, 优化内部管理网络、资源结构和相关设备, 满足档案需要被大量利用的特点。

电子档案在存储过程中有数据密集、传播快捷等特点, 导致电子档案一旦失效、丢失、泄漏, 将会带来很大的损失与风险。对此管理部门应当要在档案管理方面贯彻未雨绸缪的思想, 在处理高密度, 大规模的档案信息管理时, 对管理技术要严加监督, 保证资源的安全, 同时和政府部门、各档案所属社区都保持一定的联络, 形成严格的管理机构对档案的安全进行管理。最后, 加快完善相关管理制度和规定, 强化管理人员的责任心, 制定相应的技术措施, 对各种突发事件做好预防, 提高抗风险能力, 使得整个档案管理过程处于可控制状态。

参考文献

[1]朱娴.从个人信息保护标准到档案信息伦理的思考[J].兰台世界, 2013 (8) :19-20.

[2]王瑞芳.档案信息化及其服务过程中个人隐私权保护问题[J].科技创新导报, 2012 (27) :251-251.

[3]高山, 夏季.浅论信息化条件下如何改进档案管理工作[J].陕西林业, 2011 (6) :27.

档案异地备份工作探析 篇10

一、加强对档案异地备份重要性的宣传

宣传是向人们传播档案异地备份工作的有关信息、思想, 从而影响人们行为的过程。具体而言, 就是向广大档案工作者宣传和档案异地备份工作相关的法规与政策, 对其进行思想教育, 向社会宣传档案异地份工作, 以增强社会意识的一种舆论引导和舆论监督性质的工作。宣传工作的目的是通过宣传动员、教育和激励档案工作者, 使他们积极投身于档案异地备份事业的建设和发展。同时, 通过宣传扩大档案异地备份工作的影响, 增强社会意识, 使社会各个方面均能关心、重视和支持这项工作, 使得档案异地备份工作与其他工作协调发展, 并有效地服务于社会主义现代化建设事业。第一, 开展档案保护理念普及化的宣传。深入宣传档案异地备份保护工作, 以及通过利用这项工作所实现的社会效益和经济效益, 以便更好地了解认识这项工作, 并从中得到启发或线索。在更大范围内向社会传播异地备份的理念, 传播异地备份的知识, 使异地备份工作能为更多的人所理解和认识, 并支持异地备份工作, 为这项工作的开展创造一个宽松的环境。第二, 寻求社会帮助。档案异地备份应该属于社会服务工作, 并不是只有档案馆、档案工作人员参与, 应该积极寻求社会帮助和合作。各地档案管理部门应当根据本地区的地质、气象特征, 结合自身的实际情况, 加快档案异地备份保存的实施, 努力调动社会广泛的人力、物力, 选择合适的方式进行档案的异地备份;为了确保全部档案的安全保管, 要积极寻求地质专家、气象专家、建筑专家等社会精英的沟通与合, 并积极寻求政府机构的帮助与协作, 开展文献遗产保护合作, 制定一个全面的多元化合作的保护策略。

二、建立档案异地备份长效机制

档案异地备份工作需要充分调动社会各界积极性, 需要建立一套长效机制来解决实践中的问题。首先, 档案异地备份工作的实施必须坚持全面、系统的指导思想。在某些情况下应当注意一些档案工作之间的相互关系, 使它们协调配合地得到贯彻执行。其次, 档案异地备份工作需要依靠有关方面的努力才能顺利实施。一方面, 要靠有关单位或部门运用有效的方法和政策手段、经济手段和行政手段来保证;另一方面, 要依靠有关部门和单位做好实施标准的宣传、解释和教育工作, 提高实施档案异地备份工作的意义。在实施过程中, 还应定期组织有关异地备份的科学性、合理性的讨论与研究工作, 不断推动我档案异地备份的开展

三、挖掘馆藏档案价值, 解决资金短缺问题

档案部门在实施档案异地备份工作中, 资金问题突出。因此, 档案部门应当采取各种办法解决资金短缺问题。第一, 努力结合馆情, 创造自身价值。首先, 发挥档案价值的扩展率, 挖掘特色档案资源, 筹集资金。档案价值的扩展率是指随着时间的推移, 可能与档案发生关系的人群逐渐增大, 档案利用者及其需求范围扩大, 从而导致档案价值的升值。档案部门可以通过建立特色档案资源, 向社会上人员或相关的单位提供租借查阅服务, 为备份工作筹集资金。其次, 档案馆工作人员主动提供向各单位尤其是企业提供档案收集、鉴定、整理、保管、统计检索的服务, 提供优质高效的服务, 吸引企业了解档案异地备份工作, 并支持异地备份工作。最后, 加强宣传, 提高社会档案认识, 呼吁社会支持异地备份工作。第二, 积极争取财政支持。由于档案部门是非盈利性的社会服务单位, 很难依靠自身积累满足可持续发展中异地备份工作的经费需要, 因此异地备份的工作更需要积极依靠政府, 以为这项工作的顺利开展提供可靠的保障。

参考文献

[1] .刘冰一.实施档案异质异地备份的研究与思考[J].中国档案, 2010.6

[2] .赵亚婷.我国档案异地备份保存探讨[J].档案管理, 2010.3

[3] .赵生辉.档案灾备需求的特殊性探析[J].档案管理, 2010.4

[4] .宁文档.居安思危防患未然——首对城市互建重要馆藏档案数据异地备份基地的实践与启示[J].中国档案, 2010.8

[5] .陈梅.从城建档案管理脉络延续的视角论档案异地保存体系的建设[J].城建档案, 2010.3

地质资料档案异地备份问题研究 篇11

【关键词】地质档案;异地备份;问题;措施

一、地质资料档案异地备份的必要性

地质资料档案在保管过程中,由于各种不确定的因素会对档案资料的安全带来较大的威脅,在一些不可抗力及人为因素影响下会出现地质档案受到损害的情况,同时还有计算机犯罪、计算机病毒、计算机软硬件故障、人为操作失误等人为因素而导致地质资料档案受到无法弥补的损害。因此为了确保地质资料档案的安全,则需要对地质资料档案实施异地备份保管,这不仅是确保地质档案管理的重要手段,而且是提高地质档案防灾及减灾的重要措施。在地质档案安全备份管理工作中,需要对火灾、虫灾、盗窃、温湿度等破坏进行有效的防范,同时还要对战争、地震、洪水、群体性事件等对地质资料档案带来的大范围破坏进行必要的防范。通过对地质资料档案原件进行加工复制成各种载体的信息,实施异地备份,不仅可以有效的对各类风险进行防范,而且能够防止各种敌对势力对我国核心地质档案信息进行窃取,有效的预防和降低各种灾害对地质资料档案所带来的损害,地质资料档案异地备份也是档案部门消除档案安全隐患的重要保障。

二、地质资料档案异地备份存在问题

(一)认识不足及缺乏健全的机制。由于一些突发性及地域性灾难发生效率不高,这也使部分档案管理人员觉得对地质资料档案进行异地备份可能永远也用不到,同时还担心异地备份过程中会导致馆藏档案失去自身的特色,因此在思想上对异地备份工作缺乏重视。同时地质资料档案馆与馆之间缺乏健全的协调机制,这就导致不同级别及地区在具体对地质资料档案异地备份保管工作进行实际操作中存在较大的难度。另外,当前地质资料档案的图文数字化程度处于较低的水平,这也给地质资料档案的异地备份工作带来了不利影响。

(二)资金缺乏。地质资料档案异地备份工作的开展需要投入大量的资金,不仅需要增加相应的设备,而且档案异地备份过程中也需要增加人员,这就需要人力、物力和财力的投入。但当前地质资料档案管理经费普遍不多,而且在档案管理工作不断深入的新形势下,档案管理成本不断增加,即现有的经费都很难维持当前档案各项工作的顺利开展,因此地质资料档案异地备份资金缺乏,如果得不到国家财政资金的支持,地质档案异地备份工作很难顺利开展。

(三)异地备份选址。异地备份选址是非常关键的一项工作,尽管我国地域辽阔可以为地质档案异地备份提供良好的场所,但近年来各种地质灾害发生较为频繁,这也给地质资料档案异地备份选址工作带来了较大的难度。在异地备份选址工作中,不仅需要对所选城市的地理环境特点、人力、物力和财力等多种因素进行考虑,同时还要与城市的综合因素进行有效的结合,确保所选异地备份场所要与原档案尽量不处于同一江河流域、同一电网及同一地震带内,确保所选择异地备份地址事地质档案所需要的环境地理条件相一致,具有适宜的温度和湿度,能够具有较好的防磁、防水及防光措施,从而有效的确保地质资料档案的安全。

三、地质资料档案异地备份的措施

(一)提高异地备份的认识。实施地质资料档案、异地备份,需要提高地质资料档案工作者的风险意识、忧患意识和责任意识,克服侥幸心理。加强理论研究,自觉把异地备份建设作为确保地质资料档案安全的底线工程,以使地质资料档案的异地备份工作顺利开展。

(二)搞好地质资料档案异地备份的保障设施。为确保地质资料档案、异地安全备份工作能稳步长期地运行,不仅要加大经费投入,还要有一定的物质基础保障,充分发挥异地备份基地的技术设备与人力资源,挖掘地质资料档案馆人力与物力资源,积极引进先进技术和先进设备。充分利用馆藏资料,争取项目经费,加快地质资料图文数字化工作,提高地质资料档案异地备份综合防护能力。

(三)做出科学论证。开展地质资料档案异地备份工作,必须提前对各项计划及气候环境、地质环境及基础设施等因素进行科学论证。同时在对整个异地备份中还需要格外注意的备份方案的论证,避免实施方案出现疏漏。其次是技术论证,包括保管技术、存储技术等各种地质资料档案安全技术的研发与使用,都要根据各地质资料档案馆的实际备份状况,对、异地备份过程与备份环境进行安全考虑,最后对该项技术的应用进行相关的科学论证。

(四)落实备份制度。地质资料档案进行异地备份,不仅需要进行深入的调研,而且要做好部署工作,缺乏完善的地质资料档案备份策略,明确规定备份的范围、技术、介质和方式,而且馆际之间需要互为备份制度,互为对方提供备份库,通过制定完善的地质资料档案异地备份方案,并确保方案得以实施。在异地备份方案实施过程中,双方需要就各自的权利与义务、备份档案的交接、保管及安全等相关事宜进行协调,并签订协议,确保地质档案信息的安全。

(五)加强标准体系建设。实施地质资料档案、异地备份工作,必须做好与科学规划同步进行的标准体系建设。当前。各类型载体如:纸张、照片、声像以及其他新型载体地质资料档案的标准、异地备份库的建筑选址、建设标准等方面还存在不少空白。为区分不同情况,周密制定并抓紧构建地质资料档案、异地备份的标准体系,用标准约束行为、保证质量、促进落实。

四、结束语

近年来,由于各种地质灾害发生较为频繁,这给地质资料档案带来了无法弥补的损失,因此各级地质档案管理部门,需要根据自身的实际情况,并与各地区的地质和气象特征进行结合,从而做好地质资料档案异地备份保存工作,实现对地质档案的安全管理,使地质档案能够更好的在社会和经济发展中发挥重要作用。

参考文献

大数据思维下的档案资源数据挖掘 篇12

一、基础:从海量档案到大数据的转换

1. 档案具有大数据特征。

现有的档案资源显示出大数据的特点。据统计,早在2008年,我国各级国家档案馆共保存档案1.93亿卷,2011年各级国家档案馆馆藏达3.3亿卷,预计2020年各级国家档案馆馆藏将达到6亿多卷。海量是大数据的必要条件,如此海量的档案资源里蕴含着重大的价值,可谓手里握着金库。那么如何实现对海量档案进行大数据分析呢?首要的第一步就是实现档案的数据化。这里有一个重要的概念:数据化,与我们以前所说的数字化有本质的不同。

2. 数字化与数据化的辨析。

数字化与数据化的差异是什么?从2004年开始,谷歌一直在实施一个计划,最初谷歌做的是数字化文本,即把所有版权条例允许的书本内容进行数字化,为此,谷歌与全球最著名的图书馆合作,并发明了一个能自动翻页的扫描仪,每一页被扫描然后保存为高分辨率的数字图像。当纸质的内容变成数字图像,任何人都可以通过网络方便地进行阅读。这种数字化文本存在两个缺陷,第一是数字化文本需要用户知道自己要找的内容在哪本书上,即检索存在问题。第二是谷歌获取的图像只能依靠人的阅读才能转化为有用的信息。为克服上述缺陷,谷歌使用能识别数字图像的光学字符识别软件来识别文本的字、词、句和段落,这样书本的数字化图像就转化成了数据化文本,这个改进带来的具体好处体现在,不仅人类可以使用这些数据化文本,计算机也可以分析和处理这些数据文本。数字化带来的价值是无法与数据化的价值相比拟的,可以想象,如果把中国所有档案馆里的档案都转变为计算机可以分析的数据文本,再通过数据分析,我们将从档案大数据中得到很多未知的知识和价值。

数据化和数字化的概念。“数字化”和“数据化”目前仍没有统一的定义,比较权威的被广泛认可的定义分别是由尼葛洛庞帝(Negroponte)提出的数字化的概念和维克托迈尔—舍恩伯格(Vktor Mayer-Schonberger)关于数据化的表述。尼葛洛庞帝在《数字化生存》(Being Digital)一书认为数字化是从原子到比特的转变,具体来说就是指将模拟信息转换成电脑可以处理的用0和1表示的二进制代码[4]22。大数据权威专家维克托迈尔—舍恩伯格认为量化是数据化的核心,数据化是指把“现象转变为可制表分析的量化形式的过程”[1]104。数据化后的信息既可以被人类所阅读,又可以被计算机进行分析。

数据化和数字化之间的关系。“数据化”是近两年随着大数据的发展才逐渐被人们从“数字化”概念中逐渐分离并提出来。最初“数字化”和“数据化”是混为一谈的,数据化的提出不是对数字化的否定,而是在对数字世界认识逐步深化的基础上,对数字化理论的拓展与推进[5]346。可以说数字化带来了数据化,但是无法取代数据化。之所以提出并明确数据化的概念,并强调数据化的意义,是因为单纯讨论数字化,我们已经无法回答一些重要问题。

3. 从数字化档案转变为数据化档案。

我国档案界探讨最多的是档案的数字化,在理论和实践方面都取得很多成果。国家在档案数字化方面出台了《电子文件归档与管理规范》和《纸质档案数字化技术规范》两个重要的标准规范。在实践中,我国档案数字化主要做了两方面工作:一是档案目录信息的数字化,即建立档案目录数据库,严格规范档案信息的著录标引,科学选定档案目录的数据库结构;二是档案全文信息的数字化,即采用扫描录入的方式将档案全文按照原貌逐页存储为图像文件并为其编制目录索引,或是经OCR(光学字符技术)识别后采用文本格式存储档案内容,辅之以全文检索数据库[6]55。可见,我国在档案数字化过程里已经无意识地进行了部分档案的数据化,尽管所占的比例很小。为了从数字化档案转变为数据化档案,我们下一步要做的就是在数字化档案的基础上,使用数据识别技术进一步把数字化档案识别为数据化档案。把纸质的和电子图像等非数据化档案资源通过数字识别软件转变为数据化档案是构成档案大数据的重要数据来源之一,这将是一个庞大工程,也是档案工作者在大数据时代的重要使命。另外,电子文件和电子档案的归档和收集,也是档案大数据的另一个重要数据来源之一。综上所述,对非数据化的档案进行数据识别和电子文件与电子档案的收集归档是形成档案大数据的两个重要方面,见图1所示。

二、档案资源数据挖掘:从数据到新知识的蜕变

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程[7]2。对数据化的档案资源进行数据挖掘,从而找到蕴藏在档案中的价值,这一过程可以说是从数据到新知识的蜕变。管理大师彼得·德鲁克(Peter Drucker)在对计算机系统的描述中写道:“迄今为止,我们的系统产生的还仅仅是数据,而不是信息,更不是知识。”从数据到知识的跨越,人类走了半个世纪,而这个跨越依靠的就是数据挖掘。档案资源里蕴含着很多宝贵的知识和经验,通过档案资源的数据挖掘,可以为我们的政府、企业、公共服务提供运作和决策方面所需的重要信息。

数据挖掘技术在商业方面应用较早也最广泛,现在已逐步推广到保险、制造业和电信等行业。在档案学领域,关于大数据的研究也逐渐展开,档案学领域对于大数据主体的研究正处于初始阶段。目前的研究从研究对象上可分为两类,一是对档案使用者进行数据挖掘的研究,二是对档案本身进行数据挖掘的研究。档案用户分析近几年研究较多,例如在《构建档案用户数据分析引擎研究》一文中提出了大数据时代档案馆建立用户数据分析引擎的基本架构,指出了当前档案馆部署用户数据分析引擎需要进行的主要工作。对档案本身进行数据挖掘主要集中在医疗档案领域,例如《利用健康档案数据筛选糖尿病高危人群的决策树模型建立》论述了利用居民健康档案,建立糖尿病预测模型,建立社区新型糖尿病高危人群筛选模式。用户分析的目的在于提高档案服务的水平,而档案资源数据挖掘目的在于从档案中获取知识和规律,这才是档案数据挖掘的重点,档案数据挖掘应该针对档案资源进行重点研究分析。

在研究档案资源数据挖掘中,档案工作者应该做什么呢?有些档案工作者会觉得无从下手。首先,我们需要了解,一个数据挖掘过程,一个从数据到知识的过程,需要哪些步骤,见图2。

从数据到知识的数据挖掘过程,有两个关键步骤。第一,要么有明确的目标想从这些数据中获取到什么样的知识,要么需要有大数据思维。所谓大数据思维,是指一种意识,认为数据一旦处理得当,能为千百万人急需解决的问题提供答案,目标或大数据思维是数据到知识的关键。第二,有了目标或大数据思维后,接下来就是采取什么数据挖掘技术实现目标。数据挖掘技术有很多,通常可分为两大类,一类是统计型,主要方法有相关分析、聚类分析、判别分析和概率分析等;另一类是人工智能,通过学习大量的样本集训练出需要的模式或参数[8]45。

在上述数据挖掘过程中有三个关键因素,分别是数据、思维和技术。这三者被一些大数据专家称为大数据价值链。档案工作者手里拥有大量数据,但却不一定有创新思想或大数据思维可以从数据中催生出知识,而有了创新思维或大数据思维,如果不懂得数据挖掘技术也是徒劳的,所以档案资源的数据挖掘需要创新型的人才和技术型人才,也要有数据的处理和组织人才,这是一个复杂的综合各个学科知识的过程。

身处大数据时代的今天,档案管理必须与时俱进,如果依旧保持原来的工作方法,势必会被拥有新的档案观的行业取代。滴滴打车软件和传统出租车行业的冲突就是鲜活的例证。档案工作者必须拥有数据思维,树立档案就是数据的意识,进一步转变工作的方式方法,将档案管理推入更辉煌的发展阶段。

摘要:大数据是档案管理未来发展的重要机遇,研究如何将大数据引入实现档案管理领域有重要意义。通过数据化与数字化的辨析,提出通过数据化而不是数字化可实现档案资源的大数据转变,提出数据到知识的转变过程和大数据价值链为档案资源的数据挖掘提供有益参考。

关键词:大数据,数据挖掘,档案资源,数据化

参考文献

[1]维克托迈尔-舍恩伯格肯尼思·库克.大数据时代—生活、工作与思维的大变革[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013.

[2]李小晨.大数据时代背景下的档案管理探讨[J].云南档案,2013(6).

[3]兰祝刚,等.大数据时代下的档案工作[J].中国档案,2013(9).

[4]尼古拉·尼葛洛庞蒂(Nicholas Negroponte).数字化生存[M].胡泳,范海燕译.海口:海南出版社,1997-2.

[5]王荔.新媒体·新观念·新生活:2008全国新媒体艺术系主任(院长)论坛[M].上海:同济大学出版社,2008.

[6]王学平.浅议我国档案数字化建设实践与发展策略[J].档案学通讯,2011(6).

[7]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.

上一篇:网络克隆技术下一篇:施工质量和安全