自动编目

2024-10-03

自动编目(通用5篇)

自动编目 篇1

1 概述

在企事业规范化管理标准体系中, 管理标准、技术标准、工作标准等都是非常重要的, 针对其必须编制各类相应的支撑材料, 如企事业单位制度汇编、技术文档等。这些文档的格式规范都有着各自严格的标准。员工在编写文档内容的同时, 还要花费大量的时间进行文档排版, 排版样式多且字体、段落、题注、图表、页眉页脚之类都有相应具体的规定, 但因使用的排版软件不同或者因繁琐的计算机命令操作不能达到标准的要求等问题, 导致排版规范性不强, 直接影响到单位管理质量的好坏。

Microsoft Word是目前最常用的文字处理系统, 大部分人能利用其对文档进行一些比较简单的编辑。但对于结构比较复杂的长文档的撰写和编辑是个比较繁琐的过程, 排版效果总是不尽人意。目前, 基于Microsoft Office Word库进行Office二次开发的排版软件也应需而出, 但是大多数都只是实现一些比较简单的短文档的排版, 相对于复杂的长文档的排版系统非常少。而且这些系统对用户在使用系统前仍要进行预先的排版或文档内容的手动分解等操作, 不能达到内容和模板分离的效果。

本论述提出的方案是将文档的内容和模板完全分离, 利用关系数据库存储文档内容和式样信息, 从而使文档的作者仅注意文档内容的编写。项目采用模型驱动开发快速的构建系统框架, 重点利用递归下降分析法对文档内容进行多级树型编目识别, 采用新词自动发现技术完成主题词的识别及格式纠错, 并通过内容映射的方式实现排版功能。

2 系统总体设计

2.1 系统总体结构

功能模块总体结构见图1所示。

2.2 功能模块划分

项目的主要功能模块包括:固定文档排版模板、格式模板模块、格式校正模块、文档排版模块。

2.2.1 固定文档排版模板

本模块主要针对封面、封底等格式固定且比较单一, 设计相应的模板文件, 并保存在程序固定的路径下。用户只需输入相关资料, 系统就会自动生成一个规范的文档。

2.2.2 格式模板模块

本模块的功能是管理各类文件的标准格式模板, 其子模块包括:新建模板模块、选择模板模块、修改模板模块、保存模板模块。

(1) 新建模板模块:指将文档的格式标准从模板文件中抽取出来, 形成标准化的模板, 并可以进行编号存储。这里采用递归下降分析法对模板文件语法进行分析, 以段落为单位依次提取文章标题、摘要、关键词、目录、各级标题及正文等格式信息, 以及页面设置、页眉、页脚、字体、行间距等信息, 并保存。

(2) 选择模板模块:根据文件名称从标准样式库中查询, 并得到相应的样式表。在以后的论文校验和排版工作中, 可以直接应用标准样式库的导出数据, 从而提高系统效率。

(3) 修改格式模块:规范格式信息中, 样式包括一般有:题目、作者、摘要、关键字、标题、正文、参考文献等。通过样式表可以调整各样式之间的顺序、也可以删除、添加和修改样式, 最终对格式模板中的样式重新整合。修改样式中能实现样式的转换, 如文本和表格间的转换, 竖文本框和横文本框的转换等。

(4) 保存模板模块:修改标准模板完毕后, 将结果保存入库。

2.2.3 格式校正模块

(1) 文档框架标题的识别。待排文档可能存在框架结构不正确的问题, 如缺少标题、章节不全、标题顺序错乱等, 这需要通过系统识别后为用户给出相应的错误提示, 用户根据提示信息补充或调整源文档内容。

(2) 文档内容分解入库。文档框架结构校正完毕后, 将文档内容按编目级别关系分解后导入数据库相应的表中。

2.2.4 文档排版模块

(1) 非规范性标题的自动校正。非规范性的标题中可能包含全/半角符号、数学公式、化学分子式、大小写英文等主题词, 它们有各自特定的格式, 对其进行识别后进行格式校正。如Microsoft Word 2003是一个主题词, 需要套用统一的一个样式, 而且单词的首字母大写且数字为半角。

(2) 自动文本段落的重排。删除行首行尾空格、多余空行、连续重复行、段间留空行、段前留空格、标点修正、清除网页干扰码、全半角字符转换等的快速段落重排功能。

(3) 多种格式文档的生成, 根据用户的需要可以生成如word、wps、pdf等有各类格式的最终文档。

3 关键技术

本项目采用模型驱动开发 (MDD) 快速的构建系统框架, 建立起快速原型, 并借助模型的仿真和执行, 来模拟目标系统的运行行为。其中, 利用了代码自动生成技术中的纯代码生成技术, 通过UML图直接转换为开发的源代码。

(1) 采用基于LL (1) 文法的递归下降分析器对文档范文或待排文档内容进行识别。将文档的内容以树型多级编目为单位, 从头到尾按顺序载入分析器, 并在操作过程中进行样式识别 (类型有标题、正文、图片、表格、摘要、关键字、参考文献等) , 然后进行文档内容和样式的分离, 最终将样式信息存入数据库进行存储。由于是从语法底层进行识别, 可以解决数据的程序结构化限制, 支持多格式模板文档的识别。

(2) 文档框架标题的识别。待排文档可能存在框架结构不正确的问题, 如缺少标题、章节不全、标题顺序错乱等, 这需要通过系统识别, 给出相应的错误提示。这里同样采用递归下降分析器完成对待排文档的扫描, 基于文档设置了级别属性 (标题、摘要、正文等) , 动态生成XML模型, 通过XML中的置标来识别这些语义信息, 通过定义XML结点之间的关系等来表示各部分内容与整个文档的关系, 再通过XML向关系数据库的映射, 验证关系, 如果某个XML结点与数据库中的信息不匹配, 则给出错误信息提示。

(3) 关系数据与XML数据的转换技术。在本体和XML的模式规范 (DTD/XML Schema) 之间建立对应转换关系, 通过对XML模式规范 (DTD/XMLSchema) 的定义把本体提供的概念和属性映射为XML的元素及属性标记, 形成了XML文档同本体概念模型的融合。XML文档从而可被用于表示非结构化信息并且同预先设计好的领域模型相匹配, 并且还能反映出领域观念和语义关系 (见图2所示) 。

(4) 采用新词自动发现技术实现非规范性标题的自动校正。待测文档中的主题词都是文档中具有实际意义的有效词, 其具有特定的格式标准, 采用新词自动发现技术对有效词进行识别, 在利用XML模型中的样式信息对其进行比较及校正。通过形式化的方法确定主题词对应的概念, 对主题词进行过滤, 确定其为有效词。其核心算法为正向最大匹配算法, 可以实现对待排文档中主题词的识别以及排版过程中主题词的自动纠错问题。

(5) 内容映射排版技术。XML可以实现数据交换的透明性, 易于数据集成与数据交换, 可以很方便地转换为其它数据格式。数据库中文档的分解内容结合XML文档中样式信息集成在一起映射到指定的新文档中, 生成符合该特定文档格式标准的最终结果文档。其中, 采用“反规范化及合并”方法, 完成关系数据库到XML的映射, 实现多格式文档的生成。

4 系统的特点

4.1 操作的简单性

人性化的界面设计, 用户无需培训即可使用。

4.2 完整的纠错性

校正模块在完成了文档框架标题的纠错后, 在文档排版模块中对非规范性标题进行检测及自动校正, 使纠错工作更为充分。

4.3 灵活的格式转换

文档内容的不同输出格式间的转换。如文本表格间的转换、横竖文本框间的转换。

5 结束语

本规范性文档自动排版系统可以帮助用户屏蔽不同文档格式和软件的差异, 提高内容和式样编辑效率, 减轻排版负担。无论提供什么格式的文档范文, 或所制定的文档格式有什么样的变化, 系统都可以进行制定, 而且用户无须了解文档排版格式要求, 只需在编辑器中编辑文档的内容, 最后系统将对应的内容进行自动校正和排版。本项目适用于各企事业单位, 具有很好的推广意义。

参考文献

[1]王树峰.基于立体视觉方法的图像三维模型重建研究[D].南京航空航天大学, 2008.

[2]Tao Li, Qionghai Dai, Xudong Xie, An Efficient Method for Automatic Stereoscopic Conversion, [D]Visual Information Engineering, 2008.VIE 2008.5th International Conference on.

[3]刘劲浩.SQL Server 2008更上一层楼[M].程序员, 2008.

[4]李悦, 李平立, 龚健.一种自动排版方法及系统CN102103592A 2011.6.

[5]马兰.XML语义及其应用研究[D].中国科学院研究生院硕士学位论文, 2004.

[6][美]Eric Evans.赵俐, 盛海艳, 刘霞, 等, 译.领域驱动设计[M].人民邮电出版社, 2010.

[7]Louden K C.编译原理及实践[M].冯博琴, 等, 译.北京:机械工业出版社, 2004.

自动编目 篇2

1 心理素质的挑战

1.1 对职业发展感到困惑迷惘

从国内来看, 编目外包、编目社会化等浪潮不断袭来, 不少图书馆已经减少了本馆的编目员数量, 转而由数据公司的编目员来处理常规编目业务, 编目工作面临着被边缘化的危险。有些馆长认为编目工作已不再是图书馆的主要业务工作[2]。例如一些高校图书馆采编部只分配一位馆员负责采购与编目工作, 外包商加工的图书一到馆就直接开包上架, 只对图书进行物理加工验收而已, 空有一身专业编目知识学无所用。对未来的职业发展感到困惑迷惘。此外, 编目文献知识不断的更新学习, 编目员倍感压力山大。

1.2 工作繁琐形成职业倦怠

大部分高校图书馆对书目质量严格把关, 抽取每一副本进行验收工作, 其工作量大, 各环节操作规则较多, 程式化明显, 缺少变化, 很容易让人感到枯燥。诸如文献分类、著录规则、索书号标准等, 都对编目工作具有限制性, 在一定程度上, 阻碍了编目员的创造性发挥, 工作积极性降低;部分编目员受传统图书馆观念的影响, 不能马上融入到新的工作氛围中, 对现代编目员的职责、权利、义务等缺乏清晰、积极的认识, 造成角色定位模糊, 焦虑心理突出, 职业倦怠现象变得日益突出[3]。

1.3 工作环境产生压抑心理

相对于阅览室优美宁静、整齐舒适的环境, 要验收典藏图书杂乱的堆满了整个采编部, 采编馆员活动范围非常小, 视觉上的压迫产生压抑感;另外不被同事和读者理解, 也是编目员心理压抑的因素。读者会吐槽, 编目员一分钟还验不了一本书吗?新书上架怎么这么慢?甚至图书馆的同事不懂验收书目的流程, 也一味觉得编目员工作轻松, 只是核对标题、责任者、出版商和出版时间而已。

2 身体素质的挑战

身体素质, 通常指的是人体肌肉活动的基本能力, 是人体各器官系统的机能在肌肉工作中的综合反映。编目工作是一项长期的脑力兼体力的技术性工作, 对编目员的身体素质有着巨大考验。图书业务未外包时, 对图书物理加工可以时常改换姿势和活动身体。图书业务外包后, 编目员成了单一审校书目数据的机器, 保持坐姿, 眼睛紧盯电脑屏幕, 往往忘记起身运动, 患上了“电脑职业病”。电脑职业病表现为颈部转动时常有声响, 容易“僵颈”, 感到有硬块及压痛感, 局部有刺痛感, 严重时甚至会出现头痛、视力模糊、注意力减退, 上肢有麻痹及疼痛等神经受压现象;大批量的用手拿书, 编目员集体抱怨手酸、手胀;还有长期使用键盘或移动鼠标, 导致长时间重复同一动作以及磨擦, 编目员手指腱鞘厚化和发炎, 一活动就引起剧痛及局部出现肿胀。

3 应对新挑战的蜕变

3.1 克服焦虑障碍和抓住机遇加速自身发展

编目工作发生改变是图书馆事业进步拓展的表现, 不以人的意志为转移, 作为编目审校只有与时俱进, 才能跟上时代发展的步伐。从另一个角度看, 发展也是一种机遇, 它可以调动起编目审校的危机意识, 使他们不再故步自封, 而是以开放的心态关注编目领域的变化, 不断适应新环境[4]。

3.2 把控外包商书目数据质量减少工作量

图书馆每年中标的外包商有所不同, 对于与图书馆新合作的外包商, 应在合作合同中提出书目加工细则, 条件允许的情况下, 可以对外包商的编目员进行培训, 避免出现先之前外包商所发生过的问题。如笔者所在馆书目数据参照CALIS遵循著录标准《专著出版物国际标准书目著录》 (International Standard Bibliographic Description for Monographic Publications, 简称ISBD (M) ) , 虽然在合作合同中规定了图书书目数据要遵循CALIS标准, 外包商无视中标合同规定, 直接套录国图联合编目中心的书目数据, 给编目员增加了很多无谓的工作量。另外外包商加工的第一批图书, 编目员要逐一字段审校, 将不符合标准的事项及时反馈, 避免下次出现同样的问题。外包商聘请的编目员既不需要考取CALIS的中文图书编目合格证书, 也不需要高学历, 大专以下文凭皆可, 套录数据时无法套录到的606、690字段, 直接按照图书上编辑主题词和分类号著录, 在笔者平时审校的21941条书目数据中, 分类号不正确的3629条, 错误率达16.5%, 所以编目员要重点核对书目数据690字段, 以保证整个图书馆的数据资料统一。

3.3 掌握工作方法提高工作效率

首先, 要掌握文献学、目录学知识。如书的历史, 书的构成要素, 书的不同装帧, 懂得知识组织的意义和作用, 掌握分类法、主题法的内涵和结构;其次熟悉文献著录规则, 理解著录项目的含义, 学习MARC编制原理, 熟练使用编目格式规范;再次学习和掌握知识组织所需要的其他知识。然后通过实际书目审校工作, 积累工作经验, 掌握工作方法, 提高工作效率。如审校一条书目数据, 核对606、690字段耗费时间最多, 熟记一些常用的分类可以事半功倍, 另外购买使用中国国家图书馆开发的《分类主题词表Web2.1版》, 不仅可以大大提高690字段审校的速度, 还提高了分类号的准确率。

3.4 学习新技术保持竞争力

编目文献内容、规则以及技术日新月异, 编目员除了要完成日常工作量外, 还要充分合理地利用自己的时间跟踪编目领域的最新发展趋势, 积极努力地学习与编目工作相关的最新技术知识。例如国家图书馆在2016年举行了中国图书馆分类法与分类主题词表标引规则应用技能培训班, 介绍了中图法五版新增了1630多个类目、修改了5200多个类目、停用与删除了2500多个类目、补充了新主题与新概念、增加了复分与仿分标记等。分类法与主题词表作为重要的文献组织工具, 编目员必须要与时俱进及时跟进。

3.5 加强身体锻炼

身体是编目员的本钱, 预防腰、颈椎等电脑职业病, 要保持良好的生活习惯, 选择合适的工作姿势, 休息时要尽可能多动一动, 定时站起来做做工间操, 活动活动四肢、颈椎和腰部, 养成良好的保健习惯。

4 结束语

高校图书馆编目业务外包目前还不是很成熟, 但是我们欣喜地看到它在不断发展中, 需要编目员员来规范引导它不断进步。我们要以积极的心态正视编目业务外包的优缺点, 找出对策完善其中不尽如人意之处, 不仅图书馆享受到编目业务外包的益处, 编目员也蜕变成蝶。

摘要:编目业务外包在高校图书馆的广泛实行, 编目员的工作重心和在图书馆的地位有所改变, 本文就编目员面对的挑战以及蜕变展开分析, 与图书馆同仁共勉。

关键词:院校图书馆,编目工作,职业技能,素质

参考文献

[1]王晓丹, 郑朔, 曾家琳.高校图书馆外包图书编目数据审校及验收[J].中华医学图书情报杂志, 2010 (11) :45-46/49.

[2]贾延霞, 赵秀君.编目员的未来:编目员的职责拓展研究[J].图书馆建设, 2011 (7) :31-33/37.

[3]王维.高校图书馆编目员职业倦怠现象初探[J].图书馆工作与研究, 2008 (8) :95-97.

图书编目业务外包研究 篇3

一、编目业务外包类型及产生原因

1. 编目业务外包的类型。

编目业务外包是指图书馆编目部门把原来完全由自己从事的编目流程外包给书商来完成。目前, 国内常把编目业务外包分为部分外包和全部外包两种类型。

部分外包是图书馆把图书编目流程中的一个或几个环节交给书商完成, 其余环节由本馆工作人员完成。全部外包是图书馆把整个编目流程全部外包给书商完成, 自己只做一些数据核对和书目数据库维护工作。

2. 编目业务外包产生的原因。

(1) 文献购置经费大幅增加。近年随着我国经济持续增长, 图书馆文献购置经费也呈现较快增长趋势。特别是高校图书馆, 为了迎接高校本科教学工作水平评估, 纷纷加大购书经费投入。文献购置经费的大幅增加, 使得图书馆短时间内进书量暴增, 直接造成图书馆编目人员捉襟见肘。

(2) 专业技术人员匮乏。目前图书馆普遍存在专业编目人员匮乏的状况, 有些图书馆甚至没有专业编目人员。尤其近年大量民办大学和专升本院校纷纷兴起, 这些院校大多先天条件不足, 无论硬件还是软件, 均离高等教育要求甚远, 这些院校图书馆也大多人员少、专业水平不高、没有能力快速有效地分编大量新书。

(3) 书商自身发展需要。当前, 书商间的竞争日益加剧, 传统业务已经很难满足自身发展需求。多数书商更新观念, 转变角色, 从图书馆角度出发, 分析图书馆工作中面临的困境, 根据图书馆实际需求, 拓展新业务。书商推出的图书编目外包业务应势而生, 既帮助图书馆解决实际困难, 同时也满足了自身发展需求。

二、编目业务外包优点与可行性分析

1. 编目业务外包优点。

(1) 经济实惠、节约成本。据统计, 图书馆单独编目, 从CALIS编目中心套录每种图书需0.3元, 计算上人工费、校对修改数据费等费用, 分编每种图书合计需要15~20元, 而委托书商编目则是免费的。相对于自编图书所消耗的人力、物力、财力, 编目业务外包经济实惠, 节约成本。

(2) 弥补不足、促进转变。图书馆文献编目, 既有技术含量高的分类、标引等工作, 又有简单繁琐的贴磁条、盖章等工作, 消耗了图书馆有限的人力资源。编目业务外包有效克服了专业分编人员少的困难, 弥补自身智力资源的不足, 同时减少工作人员简单重复劳动, 节约人力资源。节省下的人力资源可充实到读者服务、参考咨询等服务一线, 使得图书馆能集中精力提高服务质量和水平, 促进图书馆服务理念更新和职能转变, 加快图书馆转型。

(3) 缩短周期、提高效率。编目业务外包缩短了图书从采购到上架的周期, 减少了新书与读者见面时间, 既满足了读者对文献资源时效性的需求, 又提高了新书利用率。以我馆为例, 外包前一批图书从采购到上架一般需要1.5个月, 外包后此周期时间缩短到1个月, 同时每年加工入藏图书数量也大幅提升, 工作效率提高。

2. 编目业务外包可行性分析。

编目业务外包是图书馆观念更新、管理创新及编目工作社会化等因素共同作用的结果, 它同时满足了图书馆和书商两方面的需求, 有其产生、发展的基础。

从图书馆角度出发, 编目业务外包有效解决了图书馆面临的诸多矛盾, 如编目成本与效益的矛盾, 文献数量、类型的增加与编目人员匮乏的矛盾, 文献时效性与编目滞后的矛盾等。

从书商角度出发, 与图书馆相比, 在编目业务上, 书商有自己的独特优势, 这些优势如下。

(1) 时间优势。书商可以在第一时间对图书进行编目加工, 相比传统把书运到图书馆后再分编, 省略了编目流程中的多个环节, 减少了图书积压时间, 缩短了图书从采购到流通的周期。

(2) 效率优势。书商实行公司化运作管理模式, 有严格运作机制和管理制度, 注重工作效率, 始终把利益与效率挂钩, 这种运作模式在图书馆是很难实现的。

(3) 成本优势。图书分编只是书商图书订购业务的一项配套业务, 书商可以同时为多家用户服务, 下载一条数据可为多家用户使用, 再配合自身科学合理的工作流程, 相比图书馆自编图书, 成本大大降低。

(4) 制度灵活。根据调查发现, 书商有着灵活的用工制度, 可根据业务量多少, 适时调整人员数量, 实施“按需配置”。

书商的诸多优势是图书馆所不具有的。图书馆作为事业单位, 除了正常分编工作, 还要兼顾其他基础业务部门的工作, 在人员安排上不能顾此失彼。在有限的人力资源基础上, 按时按质按量完成日常分编工作存在一定困难。因此, 综合考虑图书馆实际需要和书商自身优势, 编目业务外包有了立足之本。

三、编目业务外包存在的问题

编目业务外包因其优点突出而迅速发展壮大, 为多数图书馆所利用。但在实际运用过程我们发现其问题还很多, 很多规范、流程还有待于进一步完善。在实际工作中发现的问题如下。

1. 编目人员专业水平问题。

图书馆编目人员经过长时间的业务实践和对新技术、知识的不断学习, 大都能熟练掌握编目技术, 熟悉本馆藏书体系和特色。但书商的编目人员良莠不齐, 且稳定性差, 加之书商不愿在人员专业技能培训上花费过多精力, 因此专业技术人员少, 业务技能水平不高, 很多工作人员没有经过专门培训就匆匆上岗, 造成编目质量差、错误率高。

2. 图书加工质量问题。

书商一般实行计件制工作模式, 图书加工人员往往只追求高速度、多数量, 忽略了图书加工质量, 如书标、条码粘贴不牢、不按要求贴, 书标位置不一, 馆藏章盖错位置, 磁条不隐蔽等问题常有发生。

3. 多家书商协调问题。

目前, 多数图书馆合作书商都不止一家, 每家书商都有自己的运作模式和工作流程, 虽然图书馆的编目要求相同, 但由于缺乏及时有效沟通, 还是经常出现同种图书重复购置, 书标、磁条、馆藏章等位置不一, 财产号重复, MARC编目字段选择不一等问题, 给图书馆后期验收、入藏、上架等环节带来困扰。

4. 编目数据质量问题。

(1) 数据交换困难。书商和用户使用的编目系统不尽相同, 编目数据在不同编目系统中导入导出时常出现编目字段对应错误, 造成部分著录项目丢失。更严重的是一些数据在相互编目系统中无法读取, 数据交换无从谈起。

(2) 数据标准不统一。书商的编目数据大多套录CALIS联机编目中心的, 而联机编目数据又出自不同成员馆, 各馆由于文献的不确定性和处理文献时的主观性, 造成数据标准不统一。各馆编目数据往往著录格式、著录字段选择、著录详简程度都不相同, 书商由于缺乏足够的时间和缺少专业编目人员加以甄选, 往往只是提供一条数据了事。即使校验人员发现问题, 也常会出于人力、成本等因素考虑蒙混过关, 把标准控制包袱扔给用户。

(3) 分类主题标引不准确。书商经过专门培训的分类主题标引人员很少, 不少人员根本没有分类主题标引概念, 只是一味照抄CIP在版编目的分类主题标引, 或照搬相似和近似文献的标引, 缺乏对文献本身的分析。分类标引中经常出现归类错误或上下位类混淆现象, 特别是一些专业特色的分类要求经常得不到体现。如我馆要求《遥感技术基础》归类到测绘学, 分类号取P23, 而书商不考虑用户需求照搬CIP在版编目, 分类为TP7。主题标引中经常正式词和非正式词混用, 或望文生义随意摘取标题词作为主题词。如《遥感图像处理与应用》一书, 书商选取主题词为“遥感—图像”, 正确主题词为“遥感图像—图像处理”。

(4) 数据著录不规范。数据著录不规范和错误率高是书商数据著录面临的最大问题, 数据著录过程中经常出现下列错误:著录过于简单, 字段缺漏严重。书商为达到多快省的目的, 在著录上尽可能简略, 而工作人员为追求高工作量, 忽视著录质量。编目人员由于缺乏专业知识, 不了解MARC字段每个字符代表的含义, 字段著录混淆, 错误率修改率高。多卷书、连续出版物的集中著录与分散著录不规范。已有集中著录的数据再做分散著录的数据, 该做集中著录的数据却做了多条分散著录的数据。同类书排架号一致性差。如GIS实际应用类图书经常没有按用户要求集中归入测绘类, 而是分散归入不同类目上, 忽略了分类的连续性、归类合理性, 特色图书的排架一致性也得不到满足。索书号一般是分类号加种次号、分类号加著者号、分类号加流水号和分类号加年代号等几种形式, 书商由于对各馆索书号排架规则不熟悉, 经常给错索书号或索书号重复。

四、编目业务外包的质量控制

编目业务外包优势明显, 但问题众多, 如何扬长避短, 有效利用书商资源, 是图书馆全体同仁需要思考解决的问题, 下面就如何做好编目业务外包的质量控制谈几点浅见。

1. 甄选合适的书商。

图书馆在选择合作书商之前, 要注重对其资质的审查, 选取一些资质好、实力强的书商承担外包业务。合作前, 必须对书商的加工流程、技术力量、人员素质和专业水平等条件做详细了解, 要实地查看、检验其业务能力。采用招标的方式选择书商, 通过彼此间的比较、竞争选到相对好的书商。

2. 选择合理外包形式。

每个图书馆自身馆情不同, 可根据本馆人员状况、业务能力水平选择全部外包、部分外包、异地外包和本地外包等不同形式。图书馆编目工作中既有查重、贴标、盖章、典藏等简单辅助工作, 又有分类主题标引、MARC字段著录、书目数据维护等复杂技术工作。图书馆可根据实际需要, 把编目中的全部或几个环节外包出去, 充分协调利用好本馆资源和书商资源。

3. 制订详细业务要求。

无规矩不成方圆, 在与书商合作时, 要制订详细的业务要求。业务要求的内容写入合同中, 以合同的形式约束书商加强自身编目质量监控, 规范编目流程。

4. 加强过程监控。

对于本地外包方式即书商到图书馆内加工文献的方式, 图书馆可派专业馆员全程监控书商编目流程, 发现问题及时纠正。对于异地外包方式即书商在异地加工文献, 全部加工完成后再交由图书馆验收, 图书馆不能放松监控, 要不定期联系书商, 了解编目加工进展情况, 随机抽验部分编目数据的准确率, 远程监控书商编目加工流程。

5. 强化验收环节。

目前, 多数图书馆采用异地外包方式加工图书, 这种方式从发出订单到最终图书验收, 图书馆都无法直接接触到图书, 前文中提到的许多问题都是在验收环节发现的, 因此图书馆必须强化验收环节工作, 不能仅点点图书数量, 要制订统一的验收标准, 按要求逐项查验。同时做好编目加工问题的汇总与反馈工作, 以避免类似问题重复出现。

五、结论

关于编目外包业务的思考 篇4

一、编目外包的方式

1、赠送随书数据

书商通过借助国家图书馆的联机编目中心、CALIS联机编目中心数据进行套录或采用CIP数据中心的数据, 进行CNMARC (中文图书) 和USMARC (西文图书) 编目。然后将图书馆定购的图书数据免费配置相应的编目数据。这种方式应是目前最为常见、简单的外包业务。

2、套录随书数据

各馆编目人员将书商提供的随书编目数据转入本馆的编目数据库中进行套录, 修改错误字段, 输入本馆信息并且追加相对应的图书条码, 简化著录工作。此项外包业务应用得也较为广泛, 各馆会根据随书数据的质量和本馆的具体情况决定是否采用。

3、委托书商分编

书商派专人对图书馆所购图书进行分类、编目, 图书馆对所购图书验收后直接上架。目前, 除非时间紧迫或缺少必要的分编条件, 这种外包方式一般不常用, 出现的后续问题也较多。

二、编目外包的优势

1、提高工作效率

由于图书馆的采购量剧增和编目专业技术人员的缺乏, 图书的积压现象普遍存在。采用编目外包的形式, 极大的缩短了图书与读者的见面时间。一般情况下, 图书馆的采编部门, 最多十几人, 最少的只有一两个人, 如果一次进书量较多, 图书的上架时间也必然较长。而外包商的录入工作人员可多达上百人, 他们的采编中心与全国联机目录相连, 数据的标准化、准确性和实效性都有保障。就大大节省了图书在采编部门所耗用的时间, 使图书馆工作人员从繁重的事务中解脱出来, 大大提高了图书馆工作效率。

2、降低图书成本

外包商的服务具有规模经济的特点, 他的服务专业性强、效率高, 因此, 他们提供的服务通常能够享受较大的优惠和节省庞大的人事开支。例如, 一个图书馆如果将本馆员工的工资、福利、设备损耗、行政支出等项目都记入成本的话, 一本书从加工到面向读者的成本会在无形中提高, 但是如果采用图书外包的方式, 图书馆不仅可以节省员工的工资、设备损耗等支出, 还可以享受书商提供的打折优惠, 这样, 节省的开支还可用于再投入, 改善服务和环境, 从而更好的提升图书馆的整体实力。

3、节省人力资源

图书馆的采购量逐年加大, 可是采编人员由于编制的限制不可能相应增多。一些图书馆的专业技术人员不足的问题, 随着采购量的加大显得更加严峻了。利用图书外包, 书商可以将书籍从采购到上架进行全程服务, 这样不仅解决了图书馆专业技术人员缺乏的难题, 还可以使采编部门精简人员, 只需留下负责采访和数据验收的人员, 其他人员可以集中精力从事本馆的核心业务和读者服务工作, 从而提高图书馆的服务质量和层次水平。

三、编目外包的问题

1、图书编目质量良莠不齐

随书赠送的数据, 质量有着明显的区别, 影响了图书著录速度。如果委托外包商进行全程的外包服务, 部分外包商的工作人员责任心不强, 缺少图书馆员以馆为家的主人翁精神, 他们在急于完成任务的情况下, 可能会将不同类书录入同一个MARC数据之下, 造成MARC数据与图书条码混乱的问题;分类时有的图书不查重直接录入, 从而造成同种书不同分类号, 或是重号的严重错误。因此, 一些图书所出现的错误, 很可能直到借阅时才会被发现。

2、图书馆员的创造性和积极性被削弱

图书的分类编目工作是一项专业性很强的繁杂工作, 需要有一定业务能力的专业人员负责, 他们不仅要懂得图书馆专业知识, 还要经过在本岗位的长期实践和经验积累才能够胜任。编目员的水平直接关系到本馆的数据建设质量。但是, 随着外包商分类、编目的服务程度加大, 图书馆对书商的依赖程度也逐渐提高。采编部门被一次次精简, 采编专业人员的分流使编目员不能在岗位上不断实践和学习, 削弱和打击了他们的学习积极性和创造性。

四、应对措施

1、挑选信誉良好的书商

书商的选择直接关系到图书加工的质量。由于图书市场竞争激烈, 有些书商, 为了招揽客户, 将价格降得很低, 但服务过程中却会以次充好或者偷工减料。最终导致双方都蒙受了巨大的损失。因此, 如何科学地选择供货商, 是图书馆业务外包的重要内容。一方面, 在选择外包商的过程中, 不能一味地追求价格的最小化, 要充分的掌握对方的采购能力, 服务质量, 工作人员的素质水平和信誉度;另一方面, 要签订一份详实的合同, 规定书商的加工标准和要求细则, 要能够保障图书编目数据的质量;最后, 要强化图书的验收工作。在各个环节上都要严格把关, 发现问题, 立即要求整改。

2、重视培养自己的专业技术人员

随着编目外包工作的逐步深入, 采编部门不断精简, 影响了技术人员的积极性和创新性。然而, 图书馆如果缺少自己的采编专业人员, 一旦中断外包业务, 图书馆的日常工作将面临瘫痪;同时, 图书外包出现的质量问题, 需要自己的业务人员修改;由“非购买”方式获得的图书或者内部资料需要自己的技术人员著录等, 因此, 图书馆不能缺少自己的专业技术人员, 要根据自身开展外包业务的现状, 确定人员数量, 重点培养, 使他们成为采编业务的全能人才和业务能手。

摘要:本文首先介绍了图书外包业务的发展和图书馆编目工作采用外包业务的几种方式。接着分析了采用编目外包业务给图书馆带来的优势和问题。最后提出对应问题的解决方法。

关键词:图书馆,编目,书商,外包

参考文献

[1]唐顺妹:《福建农林大学图书馆图书加工外包探讨》, 《农业图书情报学刊》, 2006:2。

[2]饶思军:《浅谈图书馆业务外包的实现》, 《科技情报开发与经济》, 2004:6。

北约物资编目系统数据标准分析 篇5

北约物资编目系统由几十个北约和非北约国家共同使用维护,总共管理着1830万种物资品种、3680万种产品,以及280万个生产商和供应商信息。该系统通过对物资统一分类、命名、编码、定义和描述,为物资数据传输、交换、管理等环节提供一整套强制的标准和统一的服务,同时也是与之相关的信息系统的基础数据标准,是多语言的国际环境中高效管理物资的通用标准。快速识别、避免重复、节约成本,实现用最经济的方式实施最好的物资保障。

2 组织管理

北约国家编目理事小组(AC/135)协调、管理编目事务;北约保障局承担北约编目系统保障任务,包括依据北约国家编目理事小组的决策创建和实施文件、与编目系统用户交换数据等;每个北约国家成立国家编目局,负责维护本国所有的编目数据记录、支撑文档等,并对数据交换和物资编目服务进行授权。此外,还有很多非北约国家通过签署受赞助协议,加入了北约编目系统,分为一级受赞助国家、二级受赞助国家、其他国家。总计有75个国家和地区加入了北约编目系统。

北约出版本了一系列文件,例如,AC/135手册、联邦物资识别指南(Federal Item Identification Guide,FIIG)、物资识别指南(Item Identification Guide,IIG)、北约编目手册(A-Cod P-1)、北约多语种补给品分类手册及物资名称目录(A-Cod P-2/3)、北约后勤参考号总目录(NMCRL)等,对标准、操作流程、分工合作、责任义务等与编目相关的方方面面进行了详细的规定,并配套开发了相应的软件工具、邮件系统、数据库等。所有这些为北约编目工作的顺利实施提供了可靠的保证。

3 数据标准分析

对大量的物资、零部件等进行管理,而且是几个十不同语种的国家合作、共建共用,大量的数据交换、查重、审核,必须借助于统一的数据标准、合理的数据结构、强制的行为规范、高效的操作流程,否则必然陷入一片混乱。下面重点从技术角度对其数据的标准、结构等进行探讨。

北约使用基本名称(Basic Name)、物资属性代码(Master Requirement Code,MRC)、适用性主键(Applicability Key)、核准名称(Approved Item Name,AIN)、参考号(Reference Number)、北约储备代码(Nato Store Number,NSN)等一系列概念来规范物资命名、描述、分类、编目等。通过规范的物资属性来描述物资、标识物资,并为同种物资分配规范的编码和名称,为物资数据的采集、传输、交换、处理提供了基础性支撑。

联邦物资识别指南(以下简称指南)由美国国家编目局进行维护,是北约物资编目系统的重要基础文件,是编目数据标准、系统设计的基础性文件。指南包括基准名称(使用FIIG代码进行标识)/核准名称索引、属性要求、适应性主键、补充的技术和供应管理数据、应答表、参考图纸、技术数据表等内容,对物资的命名、描述(包括属性名称及属性值)等进行了详细的规定。

3.1 基本名称

基本名称,是一个名词或短语,用来命名物资,不包含任何应用特征。例如,以常见的计算机为例,有电脑、PC机、电子计算机等多个名称,通过基本名称规定其只能命名为计算机,那么就可以从根本上避免物资名称的混乱。每个基本名称分配统一的标识代码(FIIG代码),如计算机的标识代码为A30800,同时对基本名称对应物资的定义进行了明确的规定。

3.2 物资属性

指南为每个基本名称定义了一套属性,用于描述该物资的物理、性能指标。每个属性都进行了详细的标准化规定,包括名称、代码(4个大写字母)、定义、模式代码、属性值要求等,甚至对填写属性值时的提示信息都进行了规定。必须使用规定的属性、按照每个属性规定的要求来描述物资。这些属性填写的信息是识别物资品种的依据,信息不同就意味着是不同的物资品种,同时这些属性也是物资管理所必须了解的信息。如计算机,共规定了几十个属性,如表1所示。

3.2.1 模式代码

每个属性使用模式代码(一个大写字母)规范其属性值填写的方式、值的类型等,如,模式A表示编码后的字符串型;模式B表示数值型;模式D表示代码型,必须从指定代码表中选取对应的代码;模式G表示明文字符串型;模式H表示多个代码表组合型;模式J表示数值型与代码型组合表示;模式L表示图号等特殊代码;模式E是比较特殊的模式,当按照属性的模式要求无法填写时使用E模式,可以填写除A、G、L之外的任何模式。

3.2.2 代码表

有些属性要求从代码表中选择属性值,如模式D、J、H等,这些属性都对应着一个或多个代码表。如表1中提到了“电源”属性,模式D,其对应一个包含两条记录的代码表:内置的(BH)、外置的(BJ)。其属性值只能在BH、BJ中进行选择。

3.2.3 次级说明代码表(Secondary Address Code,SAC)

次级说明代码表是一种特殊的代码表,用于对某一属性进一步说明,如,描述锤子的材质时,由于锤头、锤柄使用不同的材质,需要分别描述,如,锤头为铁,锤柄为木,其中的锤头、锤柄就是锤子材质属性的次级说明代码表的内容。

3.2.4“和”与“或”

有时在描述属性时,需要用到“和”与“或”,指南规定,使用$$表示“和”,使用$表示“或”。如表1中提到的电源,如果其电源是外置、内置两种类型都有可能,那么其属性值即为BH$BJ。

3.3 适用性主键

指南为每个基本名称定义的属性,是用于描述该种物资所有规定属性的最大集合,对于具体的物资品种,多数时候只填写其中部分属性。为了规范属性选择、便于使用,指南定义了多个不同的属性子集,使用适用性主键(一个大写字母)来标识。用户对物资进行编目时,只需要选取选适用性主键对应的属性子集即可。同时,也给物资查询、统计、对比等应用带来方便,提高了效率。

适用性主键对应的属性,有两种标识:X表示属性值须填写,AR表示根据指南的要求、与其他属性的关联关系、属性要求等情况确定是否填写。

3.4 核准名称

基本名称加上相应的修饰限定词,就形成了核准名称,也就是标准的、在物资编目系统中使用的名称。每个核准名称对其对应的物资都有明确的定义,并且分配由5位数字组成的物资名称代码(Item Name Code,INC)。如计算机加上相应的修饰限定词,就形成了气象数据计算机(00425)、导航计算机(00426)等核准名称。

此外,对于每个核准名称,还规定了其对应的俗名,也就是用户熟悉的、常用的、但不标准的名称,如导航电脑,可以认为是核准名称导航计算机对应的俗名。

核准名称的属性,依据其对应的基本名称、选用合适的适用性主键对应的属性子集。

特殊情况下,也可以非核准名称来描述物资,但是要求必须使用英语,非核准名称统一使用77777作为其物资名称代码。

为了实施高效管理,依据用途,对物资分类进行了明确的规定,使用大类(FSG,代码为两位数字)、小类(FSC、代码为4位数字)两级嵌套的方式,大类包含小类,每一个核准名称属于具体的小类。每个小类包含、不包含哪些范围的物资都进行了明确的规定。

3.5 北约储备代码

规定好了物资名称、描述物资使用的属性,为不同的物资产品按标准要求填写属性值,由编目系统审核后,分配一个统一的编号(13位数字),也就是北约储备代码,相当于该物资产品的身份证号。统一的代码、标准的描述方式,为物资采购、运输、储备、供应等各环节带来了极大的方便。

3.6 物资描述类型

所谓物资描述类型,也就是区分不同的物资产品的方法。共计有7种方法,以使用的优先顺序进行排序,如表2所示。

表2中提到的参考号,是北约物资系统中一个重要概念,参考号是单独或连同其他参考号一起被用来标识物资的任何编号,可以是供应商零件号、供应商图纸号、北约物资标识号等多种类型。

4 结语

系统地介绍了北约物资编目标准、规范、文件等相关内容,其数据组织与管理的规范性、科学性,对于大型电子商务网站、大型公司、物流管理、后勤物资管理等具有很好的指导和借鉴意义。

参考文献

[1]麦苏嘉,蒋逸宏.美军联邦物资编目系统剖析.军用标准化,2011,6.

[2]涂睿,张高扬.北约物资编目研究.军事物流,2013,11.

【自动编目】推荐阅读:

编目数据06-03

自动回路07-15

自动质控07-16

自动套扎07-17

自动原则07-18

自动策略07-18

自动纠偏07-18

自动舱门07-21

自动配置05-10

自动装料05-16

上一篇:猪圆环病毒病诊治下一篇:用爱心点亮学生的心灵