数据录入规范(精选11篇)
数据录入规范 篇1
提起“二·八”理论, 相信大家都有体会, 在软件应用上, 这一现象更为普遍, 因为一般的人只要掌握如何用就行, 不要深究, 而作为主管部门或汇总人员, 就要对“八”的部分要研究, 从而给自己的工作带来便利。比如:工作中经常会遇到报表的处理、汇总, 由于数据来自不同部门或班级, 因填报人理解不一样, 填写的内容随意性比较大 (比如:填写工作单位, 有的用简称、有的用全称, 还有人还会加上省、市) , 从而造成数据的不一致性, 给以后的统计、汇总工作带来很多困难, 因此, 有必要制作模板对录入的数据进行必要的限制。Excel中提供的“数据有效性”就能很好地解决这样的问题。
一、采用下拉列表方式规范录入数据
让数据统一的最简办法就是采用下拉列表录入。以录入性别为例:
A、选中需要使用下拉列表方式的单元格, 比如性别列。
B、依次单击菜单项:“数据”->“有效性”, 弹出如图1所示对话框, 在有效性条件的允许中, 选择“序列”, 在来源中输入下拉列表内容 (比如男, 女) , 各条目间用逗号分开, 点击“确定, 即可实现图2的功能!
表格中, 一般一列内容是相同的属性, 选择时可以先选中整列 (不知行数) , 然后设置数据有效性, 做完后再取消表头部分的有效性, 方法是点击“全部清除”。
技巧1
上述方法只是实现了下拉列表功能。实际工作中, 下拉列表中的内容是在实际应用时再填入的, 部分内容是根据用户填入的表格内容变化的, 比如:用户能根据自己的需求, 自动添加选项。我的方法是将下拉列表内容部分写入另一工作表, 交给用户时将其隐藏, 过程如下:
A、将下拉列表条目添加于另一工作表中的某一列, 比如学历。
B、选中添加的列表内容, 给相应单元域取名 (如取为学历) , 如图3。
原因:在有效性中添加来源时不可以添加其它工作表中的区域, 因此须动用另一武器:给单元格命名。
C、在数据有效性对话框中引用刚才的单元格名称 (如图4) 。在来源中填“=学历”。
注意:如果想以后动态增减条目, 可选中整列 (去除标题行) 命名或多选几行以备扩充。
技巧2
实现下拉列表的相互关联。如填写职称 (职务) 时, 与人员的身份有关, 比如职员的职称与教师的职称系列是不一样的, 这样选择职称时要根据身份来定。实现的方法是:首先定义代码表;然后根据身份定义相应的职称列表 (分别取名, 名称与下拉表中的内容相同) , 如图5, 然后在“数据有效性”的来源中定义的公式为=IF (F8=″″, 空值, IF (F8=″教师″, 教师, IF (F8=″管理人员″, 管理, 工人) ) ) (如图6) 。因为技术工人与普通工人的职称系列相同, 所以将其列为默认。
二、对数据范围进行限制
在表中录入数据时, 很多数据都有一个范围的限制, 比如:年龄、学生考试成绩等。对这类问题, 很多人是用条件格式来标记错误, 其实你也可以用数据有效性规则直接对数据进行限定。方法是:
A、选中需要使用下拉列表方式的单元格, 比如年龄列。
B、依次单击菜单项:“数据”->“有效性”, 弹出图7所示对话框, 在有效性条件的允许中, 选择相应数据类型 (整数) , 在数据中选择介于, 最小值与最大值分别填16, 60。
C、选中“出错警告”选项卡 (如图8) , 填入出错信息。
D、数据越界时, 即可出现如图9所示提示。
技巧:自定义数据格式。
在我们的报表中, 有些数据是根据某种定义规则编列的, 比如:考试号、学籍号、职工编号等, 如我们定义的职工编号必须以一个字母打头、后接一个三位数, 我们可以这样定义:
A、选中需要使用下拉列表方式的单元格, 比如职工号列。
B、依次单击菜单项:“数据”->“有效性”, 弹出如图10所示对话框, 在有效性条件的允许中, 选择自定义, 在公式中填入=AND (LEN (A2) =4, UPPER (LEFT (A2, 1) ) >=″A″, UPPER (LEFT (A2, 1) ) <=″Z″) ;意思为长度为4, 首字符必须为A~Z的字母。
同样的方法, 也可以对时间、日期、字符长度 (如身份证) 等进行有效性设置, 以尽可能的使上报的数据符合我们预期的要求。
最后, 为了保证用户不能随意更改工作表的相应设置, 应对工作表代码部分作隐藏并保护工作表或工作薄 (根据实际需要) 。
数据录入规范 篇2
一、起草说明
网络和各种电子设备在现代社会人们的生活和工作中发挥着极其重要的作用。一旦发生法律纠纷,电子数据因其带有大量的涉案信息具有重要的证据价值。涉及电子数据证据的案件数量大幅增加,电子数据证据的重要性在办案过程中日益凸显。在此背景下,2012年我国在刑事诉讼法和民事诉讼法修订时均已将“电子数据”列入法定的证据种类。企业应当根据电子数据证据的特性,准确掌握取证、举证、质证等规则,以便更好地应对挑战。实际上,企业在电子数据取证实践方面往往存在困难,在维权中往往不知道如何取证才能使电子数据具有可信度和证明力。在此背景下,上海交通大学知识产权研究中心起草了《企业电子数据事务规范》。
制定本规范的指导思想是:第一,坚持从我国的立法现状和司法实践出发,针对企业实际需要,旨在提高企业电子数据事务管理的水平、提高企业法务人员办理电子数据事务的能力。第二,针对当前对于电子数据业务的认识水平以及现行法律法规的规定,注重企业法务人员办理电子数据证据业务与公安机关、司法机关、公证机构、鉴定机构工作的衔接和配合。第三,详略得当,突出重点,既不失可操作性又不显得过于琐碎。
本规范主要内容如下:第一章总则,阐明制订本规范的依据,电子数据证据的概念、分类,相关概念的解释、办理电子数据证据业务应当遵循的原则等。第二章内部电子数据管理规范,主要包括企业工作人员在日常业务工作中对电子数据的操作规范和企业内部对电子数据的保密和管理规范。第三章内部电子数据取证规范,主要包括企业电子数据证据的取证方式与流程、临场保护与外围调查、电子数据证据等的收集与固定等内容。第四章企业电子数据取证公证注意事项,主要包括企业配合公证处开展电子数据证据公证业务时在材料准备和实际操作方面应注意事项。
二、规范目录
第一章 总则
第二章 内部电子数据管理规范
第一节 员工日常电子数据操作规范
第二节 内部电子数据保密和管理规范
第三章 内部电子数据取证规范
第一节 电子数据证据的取证方式与流程
第二节 临场保护与外围调查
第三节 电子数据证据等的收集与固定
第四章 企业电子数据取证公证规范
三、规范正文
第一章 总则
第1条 制定规范的目的和依据 为了指导企业高效专业地处理与电子数据证据相关的法律业务,提高企业应对电子数据证据所带来法律风险的能力,根据有关实体法与诉讼法的规定,结合电子数据证据的特点,制定本规范。
第2条 电子数据、电子数据证据的定义及作用
2.1电子数据是借助于信息技术生成、修改、删除、存储、传递、获取等形成的一切数据。电子数据包括电脑文档、手机文档、电子邮件、即时通讯记录、博客、微博、网页历史记录、IP地址、手机短信、通话记录、传真记录、信令数据、电子签名、电子痕迹等。
2.2 当电子数据用于证明案件事实时,即为电子数据证据。电子数据证据主要存在于电脑、移动存储设备、移动通信设备、互联网服务器等电子设备或存储介质中。电子数据证据可以依据不同标准区分为文档文件、图形文件、多媒体文件、程序文件与数据库文件等,单机数据与网络数据,静态数据与动态数据,数据内容、附属信息、关联痕迹与系统环境信息等。
第3条 电子设备的定义 本规范所称的电子设备,是指由电子元器件组成,且应用一定的处理系统用于生成、修改、删除、存储、传递电子数据的设备,主要包括台式电脑、笔记本电脑、平板电脑、掌上电脑、服务器、手机、数码照相机、数码摄像机、打印机、复印机、传真机、电话机、扫描仪、导航仪、路由器、电视机顶盒、手机基站等。
第二章 内部电子数据管理规范 第一节 员工日常电子数据操作规范
第4条 员工应当遵守国家法律法规等规定的行为,不得实施破解企业软件、访问不安全网站、以各种形式的手段对企业网络实施监听或者破坏等行为。
第5条 员工日常业务电子数据操作规范 5.1员工根据企业设立权限,实施信息浏览、修改或删除等合乎权限的行为,不得未经许可随意泄露企业内部信息,其中包括不得在企业共享磁盘中发布任何不得共享的信息。
5.2员工不得使用外部邮件系统处理和工作相关的电子邮件,且不得将该邮件转发至个人邮箱。
5.3员工不得随便打开可疑链接、图片、程序等,对于包含以上内容的邮件,直接删除,如有必要打开,咨询IT部门。
5.4员工未经许可,不得从互联网下载、员工个人硬盘传送或者以其他方式将任何软件安装至企业电脑。
5.5员工应使用企业设备与客户进行数据交换,不得使用私人设备处理与工作相关的数据。如不能在本企业处理工作,则尽量避免在公共场所处理与工作相关的数据。
5.6与客户交换的文件,纸质档应附有回执、电子档应附有已阅读回执,确定客户真实获得。
第6条 员工日常电子数据安全操作规范
6.1员工因工作需要与外部交换信息,事先应与对方签订保密协议。因工作需要有电子数据交流时,必须确认对方身份,防止数据外泄。
6.2员工与他人交换消息,无论他人是否为企业内部员工或是外部客户等,传输过程中必须使用数字签名以确保信息的不可否认性。如果技术允许,在传输前根据数据的秘密性,对数据进行不同程度加密,或者传输只允许阅读的版本。确保传输的文件的每一页抬头和页尾处标注企业信息,最好传输PDF版本。
6.3员工在企业内有事需暂时离开电脑时必须锁屏,且不得将密码告诉他人;应定期修改密码,确保自己为该电脑的唯一使用人,特殊情况除外。
6.4非因工作需要并经上级主管许可,在企业电脑上不得安装任何具有破解、侦查、监视等功能的软件。
6.5如果企业电脑遗失,应在第一时间通知IT部门及部门数据安全联系人,尽量防止损失的扩大。
第7条 对于违反企业内部计算机数据安全规章以及有关规定的员工,企业可根据损害结果对相关员工实施警告、处罚、终止劳动合同等不同程度的处罚措施。
第二节 内部电子数据保密和管理规范
第8条 企业电子数据保密等级分类要求
日常工作中,应将电子数据根据保密等级分类,区分不同等级的数据,实施不同的保护措施。不同等级的电子数据,实施浏览、删除或修改等行为,必须有相应的权限。数据的分级可以根据实际情况进行调整。
第9条 企业内部数据备份要求
9.1对企业系统自动生成的任何文件,禁止人为修改,且定期存储在固定位置。具体操作如下:
(一)企业根据需要应定期备份电子数据,确保数据均备份至企业内部服务器上,特殊情况除外。根据数据的机密程度不同,将其备份在不同的空间。如有必要,可延请公证处定期备份并公证。
(二)备份执行过程应记录,包括备份的主体、对象、时间、路径、理由等,形成电子文档,一并存储。
9.2各部门必须确认关键数据的存储、相关责任人,及时根据数据类别采取不同保护措施,定期审核保护措施落实程度,并形成相关报告存档。
第10条 企业内部数据管理安全部门设置 设立专门管理数据安全的部门,其他不同部门分别设立部门内的数据安全协管员。要根据可能发生的数据安全事件,制定相应的应对措施。
第11条 企业内部数据安全管理规范
11.1企业电脑如出现问题需维修或护理,不得由企业IT部门之外的人员实施。便携式处理设备上必须安装有不少于一种防盗设施。
11.2企业电脑必须设置多重密码,除本人外不得将密码告诉他人,定期进行密码重置,特殊情况除外。
11.3定期对员工、尤其是新进员工做数据安全的培训,提高数据安全意识。11.4在技术允许前提下,对企业所有电脑进行标号、特定化、唯一化,以便对从企业系统出具的任何文件的修改处都可显现修改所使用电脑的代称,落实相关修改的责任人。
11.5企业有权对所有员工所持企业电脑的数据进行监控与检查。
第三章 内部电子数据取证规范 第一节 电子数据证据的取证方式与流程
第12条 企业开展电子数据证据取证工作的方式及要求
12.1 企业可以根据案件需要采取如下方式开展电子数据证据取证工作:(一)自行开展电子数据证据取证工作;
(二)聘请鉴定机构开展电子数据证据鉴定工作;(三)申请公证机构进行电子数据证据保全;
(四)申请公安、检察院、法院、仲裁机构等进行电子数据证据的收集和保全;
(五)请求网络运营服务商等第三方进行电子数据证据的固定与保管。12.2 采取12.1中第(一)、(二)、(五)种方式开展电子数据证据取证的,可以申请公证机构进行全程录像公证、全程文字记录公证或者提存镜像报告公证等。
12.3 采取第12.1中
(一)、(三)种方式开展电子数据证据取证的,可以借助专业的电子数据取证设备或软件,或者寻求鉴定机构等专业技术服务机构提供的电子数据证据收集、固定等相关技术服务。
12.4 采取第12.1中
(二)、(三)、(五)种方式开展电子数据证据取证的,可以协助鉴定机构、公证机构或者第三方确定电子数据证据的取证范围和制定方案。
第13条
申请公证机构进行电子数据证据公证
13.1 电子数据证据公证主要包括电子数据证据的内容公证(包括网页公证、电子邮件公证、聊天记录公证、手机数据公证等)、电子数据证据的存储位置以及软硬件环境公证、电子数据证据的文本公证、电子取证行为公证、镜像复制的行为公证、电子数据证据及取证报告的提存公证等。
13.2 企业根据诉讼需要申请进行电子数据证据公证的,可以与公证机构商定公证项目。
第14条
申请鉴定机构进行电子数据司法鉴定
14.1 电子数据司法鉴定是一种提取、保全、检验分析电子数据证据的专门措施,也是一种审查和判断电子数据证据的专门措施。它主要包括电子数据证据内容一致性的认定、对各类电子设备或存储介质所存储数据内容的认定、对各类电子设备或存储介质已删除数据内容的认定、加密文件数据内容的认定、计算机程序功能或系统状况的认定、电子数据证据的真伪及形成过程的认定等。
14.2 企业根据诉讼需要委托鉴定机构进行电子数据证据司法鉴定的,可以与鉴定机构商定鉴定项目。
第15条
自行开展电子数据证据取证工作的流程
企业自行开展电子数据证据的取证工作,主要包括临场保护、外围调查、电子数据证据等的收集与固定以及电子数据证据的检验分析、审查判断等环节。
第16条
自行开展电子数据证据取证工作的记录 企业自行开展电子数据证据的取证工作,应当对取证过程进行记录,并签字和注明时间。
第二节 临场保护与外围调查
第17条 对电子设备的场所与环境进行临场保护的任务 发现电子设备中可能存在涉案电子数据证据的,应当视不同情况及时采取相关措施,对电子设备所在的场所、所接入的网络环境进行控制与保护。
第18条
对电子设备的场所与环境进行临场保护的要求 进行临场控制与保护时,可以采取措施避免或者防止任何人采取可能导致原始电子数据证据发生改变的任何操作。
第19条
对电子设备的场所与环境进行外围调查
19.1 进行临场控制与保护时,可以及时开展外围调查,对有关的当事人陈述、证人证言、书证等进行收集、固定;必要时还可以对电子设备的购买记录、领用记录、归还记录以及使用情况等进行收集、固定,并制作相关笔录,请有关人员签字确认。
19.2 发现电子设备正在运行、且继续运行可能会导致涉案电子数据证据灭失或受损的,应当根据具体情况采取切断电源、断开网络、屏蔽信号等相应的应急措施。必要时,可以自行对易丢失电子数据证据进行紧急收集与固定。
19.3 发现电子设备正在显示或生成涉案电子数据证据的,应当采取拍照、录像等方式,对屏幕显示的内容进行记录,并在记录中签字和注明时间。
第三节 电子数据证据等的收集与固定
第20条
企业制定电子数据证据收集与固定的方案与计划
20.1 企业自行开展电子数据证据的取证工作,必要时可以在具有专门知识的人的协助下,制定电子数据证据收集与固定的方案与计划。
20.2 上述电子数据证据收集与固定的方案与计划主要包括:(一)现场获取的目的和范围;(二)锁定目标设备及其范围;
(三)现场数据收集人员的分工与责任;
(四)进行电子数据证据现场获取所需携带的取证设备、取证软件;(五)现场获取采用的技术规范;
(六)电子数据证据现场获取的具体方案;
(七)电子数据证据现场获取的应急措施或替代方案。第21条
制定电子数据证据收集与固定方案的合法性要求
制定电子数据证据收集与固定的方案与计划时应当注意取证手段和方式的合法性,不得通过窃取、入侵等非法方法取证。
第22条
开展电子数据证据取证的先行取证要求 企业自行开展电子数据证据的取证工作,必要时可以自行或者建议先行提取电子设备上的指纹信息等生物样本。
第23条
开展电子数据证据取证的镜像复制要求
23.1 企业自行开展电子数据证据的取证工作,具备条件的应当制作原始存储介质的镜像复制件,并对原始存储介质进行封存,避免或者防止原始电子数据证据发生任何改变。制作镜像复制件的,以一式两份为宜。
23.2 因客观原因不能封存原始存储介质或制作镜像复制件的,可以采取写保护方法对电子数据证据进行收集与固定,并妥善保管原始存储介质。
第24条
制作镜像复制件的安全性与完整性要求 24.1 企业制作原始存储介质的镜像复制件,应当确保原始存储介质的安全及其中数据的完整性。
24.2 因客观原因不能封存原始存储介质或者不能保证电子数据证据的完整性的,应当说明事由及可能产生的影响。
第25条
封存电子设备、存储介质的注意事项 企业封存电子设备、存储介质的,应当注意记录反映其特定性的标识信息(包括序列号、识别码、用户标识、品牌、厂商、型号、容量等),并注明或者告知妥善保管的注意事项。
第26条
制作镜像复制件的注意事项
26.1 企业制作镜像复制件,可以交由或者聘请具有相关资质或能力的专业人员实施,并记录反映其中电子数据证据完整性的校验信息。
26.2 必要时,可以将含有校验信息的镜像复制报告提交公证处,进行提存公证。
26.3 因客观原因无法产生校验信息的,可以及时采取适当的措施对原始存储介质进行封存以保证其数据完整性。
第27条
对电子数据附属信息、关联痕迹、系统环境信息数据的收集与固定要求
27.1 企业自行开展电子数据证据的取证工作,可以一并收集与固定与电子数据有关的附属信息、关联痕迹、系统环境信息数据。
27.2 这些附属信息、关联痕迹、系统环境信息数据主要包括:(一)存储介质的状态,确认是否存在异常状况等;(二)电子设备中正在运行的进程;(三)用户操作产生的临时文件;(四)日志文件;
(五)操作系统信息,包括系统版本号、注册所有者、安装日期、管理员与用户帐号、登录次数、最后一次关机时间等;
(六)尚未永久存储的电子数据;
(七)共享的网络驱动器、文件夹信息和共享设置选项信息;(八)网络连接信息,包括拨号信息、VPN、无线网络连接及其连接的名称、网络映射信息等;
(九)保证数据独立于电子数据存储介质的软硬件信息;(十)备份数据以及所有者、备份时间等相关信息。第28条
对互联网上电子数据证据的收集与固定
28.1 对于来源于互联网上的电子数据证据,企业可以申请公证机构进行公证保全,或者申请人民法院进行诉前或仲裁前证据保全。
28.2 申请保全的,应当遵守民事诉讼法的相关规定,同时应当依据中国公证协会《办理保全互联网电子证据公证的指导意见》的有关规定进行保证。
第29条 对交互式设备中电子数据证据的收集与固定
29.1 对于交互式电子设备中电子数据证据,可以固定和保全本方电子设备的电子数据证据,也可以固定和保全对方当事人、第三方(如通讯网络服务商等)电子设备中的电子数据证据。
29.2 固定和保全对方当事人、第三方持有的电子数据证据的,可以采取以下两种途径:
(一)通过联系对方当事人或第三方查询并固定相关的电子数据证据,必 要时申请公证机构对取证过程进行公证;
(二)通过向人民法院申请诉前证据保全的方式,向对方当事人、第三方调取相关的电子数据证据。
29.3 向人民法院申请调查令或诉前证据保全的,可以向法院提交存储电子数据证据的电子设备或者存储介质的准确地点。
第30条
保管、转移、使用电子设备、存储介质及电子数据证据的注意事项
30.1 电子设备、存储介质及其电子数据证据的保管、运输应当做好防磁、防震、防热、防潮等措施,避免造成设备、介质损坏或者数据变化。除以上一般保护措施外,对于有网络连接的移动通讯设备还可以采取信号屏蔽等特殊保护措施。
30.2 在保管、转移或使用电子数据证据及其上述载体时,可以同步制作相应的保管记录、转移记录和使用记录。
第四章 企业电子数据取证公证规范
第31条 公证机构的选择
企业申办电子数据取证公证,可以选择企业住所地、行为地或者事实发生地的公证机构。为保证电子数据的证据效力,企业应当优先选择具有“电子邮件保管箱”业务的公证机构。
第32条 企业进行电子数据取证公证需准备的相关证明材料
36.1 主体证明材料:提供营业执照复印件、法定代表人身份证明文件(境内居民提供身份证、境外居民提供护照);委托办理的,需提供委托办理公证的授权委托书、代理人身份证明文件。
36.2 利害关系证明材料:企业开展电子数据取证公证工作,应当根据公证对象的不同,提供以下证明材料:
(一)对企业内部SAP系统生成的产品手册、内部电子确认函、采购单等电子数据公证的,需提供上述SAP系统由本企业所有或使用的证明材料;
(二)对企业与客户沟通所使用的电子邮箱中内容公证的,需提供邮箱由企业所有以及邮箱中内容与企业业务有利害关系的证明材料;申请保全其员工使用的用于公务的电子邮箱内的邮件,应当提交其与该员工签订的有关公务邮箱仅用于公务的书面约定,或者经该员工书面同意,或者由该员工亲自操作提取、固定相关电子邮件;
(三)对企业业务往来的电子传真、光盘、电子照片公证的,需提供上述电子数据与企业业务有利害关系的证明材料。
第33条 企业进行电子数据取证公证需准备的相关取证设备 电子数据取证公证在本地或本单位设备上进行的,应当事前准备好方便公证的电子数据存储、显示设备,并预先对取证设备进行清洁性检查。
第34条 企业进行电子数据取证公证的公证场所 对企业内部SAP系统生成的产品手册、内部电子确认函、采购单等电子数据公证的,可在企业内部进行取证行为公证;对网页等实时数据取证、电子邮箱取证公证的,应当使用公证机构的计算机或者无利害关系第三人的计算机。
第35条 企业申请电子数据取证公证时,应配合公证人员履行以下告知义务:
(一)当事人申请保全的内容不得侵犯他人通信秘密、个人隐私,申请保全 的方式不得违反法律、法规的禁止性规定;
(二)实名制邮箱的注册人或者非实名制邮箱的密码持有人申请办理保全电子邮件公证的,应当保证其申请登录邮箱保全电子邮件的行为不会侵犯他人的通信秘密、个人隐私;
(三)决定是否采纳公证人员提出的提取、固定证据的方法、操作程序以及使用的设备建议。
第36条 企业指定人员在开展电子数据取证公证时,应当注意以下事项:
(一)向公证人员提出最终决定的公证方式和公证对象,向公证人员提供书面操作形式;
(二)提取的电子证据需要附在公证书之后的,建议公证人员使用一次性刻录光盘并采用终结方式刻录。
首个云数据中心建设规范发布 篇3
云计算作为未来新一代信息技术与IT应用方式变革的核心、我国战略性新兴产业发展的重点领域,已经成为当前信息技术产业发展和应用创新的热点。大规模、高等级、服务化、节能型的云计算数据中心即是云计算技术的典型应用实践,更是新一代IT应用与云计算服务的关键支撑平台,因此成为云计算产业发展的排头兵,掀起了一场云计算数据中心建设与传统数据中心云化的热潮,为云计算产业发展提供了良好的基础设施保障。
云计算推动数据中心建设呈现“绿色改造、云化加速、产业融合、模块建设”四大特点
据不完全统计,目前超过20个城市将云计算作为重点发展产业,相继出台了产业发展规划、行动计划,鼓励建设示范试点工程,制定了土地、税收、资金等方面的优惠政策。在云计算的驱动下,数据中心大集中的发展趋势将进一步加快,第三方数据中心市场将快速发展,数据中心产业化发展成为大势所趋。目前数据中心建设呈现出四大特点:业务发展驱动传统数据中心加入绿色改造与重建行列;新技术应用推动下一代数据中心云化进程;产业融合化趋势明显,企业战略合作和联盟更加紧密;模块化数据中心建设模式在行业内迅速推广。
云计算促进数据中心发展呈现“区域布局集聚化、建设集约化、应用虚拟化”三大趋势
我国大国大市场的优势明显,无论人口基数,还是网民规模都位居全球第一,随着两化融合、三网融合、物联网等应用的纵深推进,数据中心需求潜在巨大。随着各地数据中心建设的热潮,数据中心的发展也正在发生变化,呈现三大趋势:从布局上,总体向富能源、高纬度地区转移;从云环境下对数据中心的需求上,呈现建设集约化、管理智能化、平台开放化、建设与运营服务标准化趋势;从数据中心应用上,数据中心网络虚拟化将成重点,自动化、智能化管理将成为数据中心高效运行的支撑,数据中心绿色节能技术应用将更加深入。
云计算数据中心建设面临“选址有风险、设计不规范、应用不充分、扩展难实现”等巨大挑战
数据中心由各种软硬件设备组成,由于这些设备所产生的能耗巨大,管理和维护复杂,使得数据中心在能源效率、降低成本、灾难恢复、业务连续性、空间拓展、智能管理等方面面临重大挑战。同时,由于中国云计算数据中心建设缺乏相关标准和规范,造成云计算数据中心的建设出现定位不清晰、规模评估不恰当、选址有风险、设计不规范、应用不充分、扩展难实现、能效标准低、运维成本高等问题。云计算数据中心的建设亟待引导和规范,这是数据中心得以健康发展,形成规模化、产业集群化发展的前提。
云计算数据中心建设亟待从“整体规划、基础设施、基础架构”等关键环节进行规范
农业保险数据规范研究 篇4
我国是个农业大国,是自然灾害尤其是农业灾害发生频繁且灾情严重的国家之一。为加强“三农”工作,加快现代农业发展,近年来,党中央、国务院高度重视农业保险的发展,十六届三中全会、十七大、十七届三中全会、2004年以来连续9年的中央一号文件、国家“十一五”发展规划、国务院《关于保险业改革发展的若干意见》等都对发展农业保险提出了明确要求。在社会各界关注、财政补贴力度不断加大、农民逐步认可以及保险公司承保能力不断增强的有利形势下,我国农业保险取得了跨越式发展,保费收入、保障程度、保险覆盖面逐年增加,保费规模已上升至亚洲第一位,全球第二位,成为全球最重要、最活跃的农业保险市场之一。
目前,我国农业保险业务形成了种植业保险、养殖业保险、森林保险三大类。2014年,中央财政保费补贴试点已扩展到全国所有省(市、自治区),补贴险种包括玉米、水稻、小麦、大豆、棉花、花生、油菜、马铃薯、青稞、森林(商品林和公益林)、橡胶树、能繁母猪、奶牛、育肥猪、藏系牦牛和藏系羊、糖料作物等十多个主要粮棉油作物和部分地方特色险种。2014年,全国农业保险保费收入325.43亿元,共计提供风险保障16,320亿元,承保农作物面积11.76亿亩、森林面积27.98亿亩。目前,农业保险补偿已成为农民灾后恢复生产和灾区重建的重要资金来源,保险的风险保障和经济补偿作用日益凸显,在服务“三农”、支持社会主义新农村建设中发挥了积极作用。
在充分肯定我国农业保险成绩的同时,也应该清楚地看到,当前我国农业保险仍处于探索试验阶段,建立农业保险数据规范,有利于行业农业保险数据的采集、积累、整合,为农险数据分析利用打下坚实的基础,提高农业保险业务数据的共享和分析利用率,从而有针对性地制定相关农业保险政策、深度开发利用农险数据、实施农业保险监管等,推动农业保险的信息化水平,促进农业保险的科学发展。
2 农业保险数据标准化现状分析
(1)国内技术发展趋势与现状
在中国保监会大力推动下,全国金融标准化技术委员会保险分技术委员会(以下简称“保标委”)于2005年9月正式成立,我国保险业标准化工作由此进入快速发展时期。“十一五”期间,在保标委的大力推动下,保险业认真研究行业现状与发展趋势,同时充分借鉴国内外标准化建设经验,围绕保险业又好又快发展这一主题,按照“总体规划、突出重点、急用先行”的原则,明确目标、重点攻关、稳步推进,做了大量的基础性、创造性工作,已制定了若干符合中国保险业发展需要的数据标准。但我国目前还没有针对单一险种建立起一套规范、完整的数据标准,产品细分的数据定量分析、信息共享还远远不够。
(2)国内现有工作基础
《农业保险数据规范》由人保财险牵头制定。人保财险作为国有大型保险骨干企业,近年来始终把发展农业保险作为服务“三农”、支持社会主义新农村建设的着力点,积极推动农业保险又快又好发展。2007年至2014年人保财险连续8年引领农险市场,市场份额均在50%以上。2014年,人保财险农业保险保费收入达171.45亿元,市场份额52.68%,保费规模已跃居全球第三、亚洲第一,仅次于美国农村社区保险公司(RCIS)和美国雨雹农作物保险公司(R&H,LLC)。目前,人保财险已开发各类农业保险产品300余个,业务范围基本覆盖了所有省(区、市),充分发挥了保险业参与社会主义新农村建设的主渠道作用,彰显了人保财险作为中国内地最大非寿险公司的市场引领地位。
人保财险在保险承保、理赔、产品研发、业务系统开发和再保险等核心技术领域处于国内非寿险业领先水平,在长期的业务实践中积累了大量的数据管理和业务管理经验,尤其是在农业保险领域具有领先的服务能力和技术优势。一方面,人保财险总部拥有一批具有丰富经验的农业保险、保险精算、数据统计分析与应用等领域的专业技术人员,曾独立或参与制定《车辆保险数据交换标准》《保险基础数据元目录》《保险基础数据模型》《运行维护规范》等多个行业标准,农业保险数据规范的制定也将充分吸收以往经验。另一方面,人保财险拥有遍布全国的机构网点,形成了强大的保险销售和服务网络,可为数据规范的应用和推广提供坚实的实践基础,为投保客户提供专业、优质、高效的承保、理赔等保险服务。
(3)国际单一险种标准化现状
美国是目前世界上农业保险市场最为成熟发达的国家。以美国为例,美国政府和保险公司长期以来高度重视农险业务基础数据的采集和管理工作,由相关政府部门统一管理产品开发和定价,有长时间序列的数据积累。据了解,美国目前尚未建立国家层面专门的农险行业数据规范标准,沿用保险行业的总体标准,只是通过出台《农作物保险手册》《再保险标准协议》等一系列基础性的农险行业业务规范文件,对业务流程、投保数据等内容就进行了明确规定,这在一定程度上也很好地起到了数据管理规范的作用。因此,《农业保险数据规范》作为我国农险领域专业的险种数据规范,不仅是我国在农业保险领域探索专业的险种数据规范方面的一个尝试,也是在国际领域的一个创新性尝试,具有很好的现实意义。
3 农业保险数据规范框架研究
3.1 农业保险数据规范框架
农业保险数据规范框架研究的整体思路,依赖于对农业保险核心业务流程的梳理与整合,同时结合该规范所能产生的经济效益与社会效益,力求做到在满足监管需要、实现整体数据分析的同时,降低公司管理成本,提高经营效率。
农业保险数据规范框架将定义以下内容:农业保险数据元标准、农业保险代码标准及农业保险采集标准。涉及农业保险领域承保、理赔及再保险三个主要业务环节,适用于农业保险领域相关报表的规范、相关系统设计、数据库开发和数据交换格式的设计等业务活动以及行业监管部门、财产保险公司、农业保险公司、再保险公司、经纪公司,以及其他政府部门亦可参考。本文确定的农业保险数据规范框架(如图1所示)。
3.2 农业保险数据规范在保险标准化体系中与其他标准的关系
在保险标准化体系中,由于农业保险与其他财产险相比特异性较大,原保险基础数据元以及保险业务代码集并未涉及农险部分,农业保险数据规范是保险标准化体系向单一产品线精细化进深的重要组成部分。
此次规范的制定结合农业保险的业务特点,归纳整理农业保险业务专用数据元、代码及采集标准。同时为了保证农业保险业务体系的完整性,引用了部分原保险基础数据元通用部分数据元。因此,在整个保险标准化体系机构中,农业保险数据规范位于保险术语、基础数据元等基础标准化之上。农业保险数据规范与其他标准关系如图2所示。
3.3 农业保险数据规范框架内容
(1)农业保险数据元标准
根据国标GB/T18391《信息技术数据元的规范与标准化》中对数据元的定义,制作农业保险数据元采集表。整体结构上,根据其所在业务环节,分为标的数据元、客户数据元、承保数据元、理赔数据元及再保数据元5个部分,每个数据元集合的数据元将涵盖被描述对象在农业保险业务流程中的信息化特点。
具体数据元在抽取的过程中,以农业保险业务流程和功能分析为基础,通过建模分析、确立重点对象,通过对象类的特性以及相关表示的分析、归纳和整理,提出所需的数据元。同时结合“自下而上”的数据元提取方法,对各主体数据库等相关数据资源的数据在分析、梳理基础上,归纳整理出各自体系的数据元。对初步收集的准数据元进行反复的筛选、归并,按照各分类分别再加工,综合整理,形成农业保险数据元集。每个数据元实体由7个属性进行详细描述,分别为中文名称、英文名称、同义词、定义、表示、值域、备注。
数据元分类及整体结构如图3所示。
(2)农业保险代码标准
在上述数据元整理的基础上,对于值域可穷尽并可以进行标准化编码的数据元,结合相关标准对其进行分析,反复地比较、筛选、归并,依据代码标准编写原则形成农业保险代码标准。
每个代码标准实体由5个属性进行详细描述,分别为中文名称、定义、表示、编码方式、备注。
(3)农业保险数据采集标准
参考《农业保险统计制度》及保监会农业数据上报要求等,以保险数据基础模型、系统数据结构为原型,对农业保险业务经营管理活动中涉及的主要数据对象进行整理和汇总。从现有报表和相关资料中收集各种数据,数据来源涉及承保、理赔、再保等主要业务环节,覆盖了农业保险活动业务主要流程,定义农险主题区域的数据采集标准。
其中,承保环节包括农业保险承保信息表、农业保险批单信息表;标的部分包括农业保险标的信息表、养殖险标的信息表、种植险标的信息表、林木险标的信息表、农业保险种植/养殖场信息表;理赔环节包括农业保险立案信息表、农业保险赔案信息表;再保环节包括农业再保险合约业务信息表、农业再保险临分业务信息表。
4 问题及建议
自2007年政策性农业保险试点开办以来,除人保财险和中华保险两家综合性保险公司外,目前已经有22家保险公司不同程度地参与农业保险经营。但是由于长期缺乏专业领域制度,加之产品开发时间不同、公司管理流程不同、体制不同等原因,造成各农业保险主体产品特性、业务流程差异大,难以进行深入的数据分析。因此,农业保险数据规范在建立过程中,既要充分考虑农业保险发展的历史沿革,又要考虑农业保险未来的发展,兼顾实用性与前瞻性,方可全面真实地反映农业保险经营情况,建立保险行业第一个专业的险种数据规范。
参考文献
[1]裴光,庹国柱.农业保险统计制度研究[M].北京:中国财政经济出版社,2009.
[2]JR/T 0033—2007,保险基础数据元目录[S].
[3]JR/T0048—2009,保险基础数据模型[S].
[4]JR/T 0034—2007,保险业务代码集[S].
[5]GB/T 15191-2010,贸易数据交换贸易数据元且录数据元[S].
数据录入规范 篇5
大数据不仅改变了我们的价值思维,也将改变中国的经济格局。以前的贵州省,俨然是有如桂林山水甲天下一样的美景,旅游是贵州省的标签,但是整体经济发展并不好。现如今,云计算和大数据的时代,让贵州抓住了机会,“云上贵州”成为新的代名词,成为全国关注的焦点,经济“弯道超车”成为可能。抢滩大数据,架设新引擎
前不久,贵阳国际大数据产业博览会的盛景历历在目,不仅受到国家高度重视,企业广泛参与,更不乏BAT、甚至国际化巨头的身影。
从客观条件来讲,贵阳特殊的地形、气候因素,温度较为适宜,而且不适合发展化工、重工等产业,推进大数据产业的建设是时代大势所趋。从深层次讲,贵州是全国率先开放政府数据的城市,尽管全国很多地方政府都在推动大数据产业的建设,但贵州省却是第一个以全省之力推动其发展的地区,因此获得了阿里巴巴、富士康等大企业的大力支持。
如今,数据中心集群地、中国数谷、数博会、数交所、大数据战略重点实验室、全城公共免费Wi-Fi无线热点等先后落地,为贵州的经济发展架设了新引擎。看清价值,政府推动数据公开 中国已经来到转型期的关键时期,政府致力于通过实施“互联网+”行动计划,利用互联网、大数据、云计算为大众创业、万众创新提供平台数据和服务支撑。国务院副总理马凯在贵阳国际大数据产业博览会上指出,大数据已经成为新时代最具价值的宝藏之一。某种程度上说,谁拥有了大数据谁就拥有了未来。
数据在哪?统计显示,随着电子政务建设的不断发展,各级政府积累了大量与公众生产生活息息相关的数据,掌握着全社会信息资源的80%,其中包括3000余个数据库,数据“金矿”已经形成,亟待挖掘。
但是,长期以来,这些信息大多处于不对外公开状态,难以体现数据的价值。比如,部门之间、上下级之间的政府信息相互割裂,不共享,形成一个个“信息孤岛”,不仅制约了政府社会治理水平,也让百姓深受其苦,甚至出现了老百姓跑断腿证明“我妈就是我妈”的笑话,引起总理震怒。
清华大学经济学博士研究生冯煦明表示,人们往往只把公共信息公开和提高政府透明度联系起来。但实际上,开放公共数据的意义远不止此。如果埋藏在档案馆的文件中,数据永远只能是一堆数据;如果放在开放平台上,就有可能被深度挖掘,变成有用的信息,使社会运行更加高效。
认识到大数据的价值,国家领导人多次公开表态推动政府数据开放。自去年3月“大数据”第一次出现在《政府工作报告》中以来,就被李克强在不同的场合多次提及。仅去年就有6次国务院常务会议的议题与大数据运用有关。李克强总理曾表示:“不管是推进政府的简政放权,放管结合,还是推进新型工业化、城镇化、农业现代化,都要依靠大数据、云计算、所以,它应该是大势所趋,是一个潮流。”
紧接着2015年5月,国务院办公厅印发《2015年政府信息公开工作要点》,提出积极稳妥推进政府数据公开,为政府大数据的公开提供了政策支撑。政府大数据公开在行动
据了解,我国正在积极推动加快建立政府信息采集、存储、公开、共享、使用、质量保障和安全管理的技术标准方面的工作。
近日,国务院办公厅印发《关于运用大数据加强对市场主体服务和监管的若干意见》,明确工信部、国家标准委员会、国家发改委、质检总局、网信办、统计局等多部门建立大数据标准体系,研究制定有关大数据的基础标准、技术标准、应用标准和管理标准等工作,计划将于2020年前出台并实施。
中国工信部部长苗圩在贵阳国际大数据产业博览会上说,工信部将编制实施软件和大数据产业“十三五”发展规划,支持软件企业和工业企业跨界融合、协同创新,在基础软件等重点领域突破一批核心技术,并加快安全可靠信息系统建设,全面提高信息安全保障综合能力。在近日召开的大数据产业“十三五”发展规划编制工作组会议上,贵阳大数据交易所作为规划编制组成员单位参加了会议,并在会上就大数据清洗工作等内容提出了建议,受到了工作组其他成员的高度认可。随着国家在部署运用大数据优化政府服务和监管、提高行政效能上的不断加强,地方政府对于开放数据的态度正在逐渐转变,步伐也在不断加快,北京、上海等全国多个地方政府均在一定程度上开放了政府数据,起到了引领和示范作用。开放数据,交易放大价值
政府数据不仅要开放,也要自由流动,如同银行货币,只有加速其流动,才能创造巨大的效益,促进经济增长。阿里巴巴董事局主席马云称大数据是未来最重要的“能源”。然而,如何让大数据通过转换,成为真正意义上的资产,让大数据资产在更大范围内合法规范化的商品交易和流通,才能体现数据的真正价值。
从过程来讲,数据的产生、收集是第一步,数据的分析、处理是第二步,将处理的数据进行交易,放大数据的价值是第三步,也是最核心的一步。大数据作为资产,必须经过清洗、分析、建模、可视化之后,才能进行交易,才具有价值。
贵阳大数据交易所总裁王叁寿曾表示,如今,大数据就像空气一样无处不在,深入渗透到社会生活的各个领域。但是,这些数据还需要进一步的加工才能发挥价值。他打了个比方,数交所的交易数据加工出来的商品,就像调鸡尾酒一样,几种酒调和在一起,融合后再卖给客户,这是交易所的价值。数据交易,规范化运作先行
提到数据,消费者往往非常敏感,尤其是将数据明码标价进行变现,实现互联互通,让消费者产生了很多疑问:有没有一个规范化的平台,确保数据交易的合法、安全、可靠?值得一提的是,以大数据产业为制高点,贵阳大数据交易所(下称“数交所”)成为国内首家数据交易中心。
从企业性质上,它既不是公益组织,也不是行政服务部门,而是100%市场化运营的商业机构。面向全国乃至全球提供数据交易服务,通过电子交易,利用大数据交易系统撮合客户之间的大数据产品交易。数据品种覆盖了政府、医疗、金融、企业、电商、交通、社会等30多个领域。
从运营模式上,数交所采用会员制,对会员的资质审查除了卖方数据合法性与价值,还会约束买方会员的数据使用准则,确保不能滥用。目前,已有天弘基金、京东、华为、软通动力、中国人寿、中国联通等150余家会员单位,预计到年底发展为1000多家会员,将进一步放大数据交易的价值。
另外,数交所只针对B2B,不针对B2C,不开展个人的会员交易。而且交易的数据不是底层数据,而是通过清洗格式等技术标准完成的交易数据,让它变成一种商品,不存在侵犯个人隐私的问题。据悉,数交所的所有交易环节都在法律法规和政府监管下进行,交易所也成立了专家委员会,不仅监管大数据来源的合法性,也对大数据购买后是否被滥用做了很多约束。
贵阳大数据交易所总裁王叁寿强调,数交所是一个资源聚合平台,不是一种简单的业务,而是生态圈的圆心。围绕大数据交易所,将衍生出大数据资产评估、大数据融资单方、大数据信用等很多产业链。结语
数据录入规范 篇6
关键词:清水江文书;描述元数据;著录规范
中图分类号:G250.74
文献标识码:A
文章编号:1674-621X(2015)03-0059-04
清水江文书是流传于黔东南清水江流域苗族侗族地区特有的古代乡村文献,数量巨大,据有关专家保守估计散藏在乡村村民家中的清水江文书约30万件。对清水江文书这类多以纸质单件留存的古文献,最有效的保护方式是进行数字化保存。清水江文书数字化,需要建立系列标准和规范。目前有多家收藏单位分别在建设清水江文书数据库,如不规范建设,会导致开发的数据库不能兼容和正常使用,并会带来管理的新问题,还会造成人力和物力的大量浪费。清水江文书整理与开发研究团队为了建立一个通用并可实现异构多级管理的数据库,特探讨清水江文书数据库建设的系列标准,其中包括清水江文书数字对象描述元数据标准。清水江文书数字对象描述元数据,是指用来描述或标识清水江文书信息资源的数据,用于描述或识别清水江文书内容和外观特征,对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体位置与获取方式、制作与利用方法等。元数据标准是数据库建设的重要标准。为了满足我国数字图书馆建设规范的要求,清水江文书元数据设计特参考我国数字图书馆规范建设研究项目“专门数字对象元数据标准规范”系列成果,并结合清水江文书的特有属性,探讨和研究制定清水江文书数字对象描述元数据标准和著录规范。
一、清水江文书描述元数据基本框架的设定
作为一个数字对象描述元数据的设定,首先要明确其描述的对象和著录单位。本标准描述的对象即是清水江文书。清水江文书产生于明清至民国,主要包括卖契、财产析分合同、佃契、典契、借契、拨约字、宗族与婚姻文书、政治与法律文书、土地管理与赋税文书、军事与治安文书、民间信仰习俗、教育与科考、山场座簿与田土清册以及杂类。清水江文书的著录单位为每一份契约合同或文告。其数据信息的描述元数据应由核心元素、资源类型元素、个别元素三部分组成。
我国数字图书馆建设标准的数字对象描述复用Dublin Core的15个元素做为核心元素集,清水江文书描述元数据复用7个核心元素(Core ele-ment),它们分别是:题名、主要责任方式、其他责任方式、日期、出版者、附注、主题,由于清水江文书的特殊性,在复用这7个核心元数据时,变异调整为:文书题名,文书主体责任人,文书其他责任人,契约日期或文告时间,文告发布者,附注为对特定文书信息的附注,主题为文书类型的关键词。
清水江文书类型核心元素(Local Core ele-ment)参照我国数字图书馆建设标准设计为:载体形态,即为文书的物质载体、色彩、尺寸;收藏历史,包括获得方式和印记;馆藏信息。
个别元素作为清水江文书中的扩展信息进行记录。
二、清水江文书描述元数据设置及著录定义
1.题名
名称:题名;标签:Title;定义:契约文书的正题名及说明;术语类型:元素;元素修饰词:自拟题名、其他题名。
(1)自拟题名(文书签订时间+文书主体+文书类别)。名称:自拟题名;标签:Self;定义:文书不具有题名时,标引人员根据具体文书自行拟定的题名;术语类型:元素修饰;修饰:题名;注释:从文中拟定题名,按照(文书制定时间+契约文书主体+文书类别)拟定。
(2)其他题名。名称:其他题名;标签:Other;定义:清水江文书题名的其他替代写法或规范名称之外的其他名称;术语类型:元素修饰词;修饰:题名。
2.主要责任者
名称:主要责任者;标签:Creator;定义:契约主体人(卖方,其次买方)、官府文告发布者、文书责任实体;术语类型:元素;元素修饰词:责任者说明、责任方式。
3.其他责任者
名称:其他责任者;标签:Contributor;定义:契约签署的中人、凭中、担保人;术语类型:元素;元素修饰词:责任者说明、责任方式。
4.日期
名称:日期;标签:Date;定义:立契时间或文告时间;术语类型:元素。
(1)年号纪年。名称:年号纪年;标签:LunarDate;定义:明清皇帝年号纪年,且年号纪年前加上朝代:如“清”;术语类型:编码体系修饰词;修饰:日期。
(2)公元纪年。名称:公元纪年;标签:Grego-rian Calendar Date;定义:以耶稣诞生元年的太阳历纪年法;注释:国际通用的纪年法;修饰:日期。
5.出版者
名称:出版者;标簦:Publisher;定义:契约文告的发布者或发布主体;术语类型:元素。
6.附注
名称:附注;标签:Description;定义:契约文书中需要说明的问题。
(1)缺字附注。名称:缺字附注;标签:Description Quezi;定义:记录和描述扫描的契约文书缺少的文字描述;术语类型:元素修饰词;修饰:附注项。
(2)责任者附注。名称:责任者附注;标签:Description Creator;定义:对签约责任人或公告的实体需要进行的说明;术语类型:元素修饰词;修饰:附注项。
(3)相关文献附注。名称:相关文献附注;标签:Description Relation;定义:与契约文书有关联的文献说明。
7.关键词
名称:关键词;标签:Keyword;定义:不同种类的契约、文书;术语类型:元素。
8.载体形体
nlc202309011918
名称:载体形态;标签:Physical Description;定义:契约文书的载体形态;术语类型:元素;注释:此项著录契约文书的载体、色彩、开本或规格。
9.收藏历史
名称:收藏历史;标签:Collection History;定义:清水江文书的流传历史以及相关的内容;
注释:此项著录契约文书的收藏沿革、获得方式、购买价格等。
10.馆藏信息
名称:馆藏信息;标签:Location;定义:资源所属机构或提供资源的机构信息;注释:该项著录契约文书的收藏机构,如契约文书典藏号。
三、清水江文书描述元数据著录规范
为了准确地描述清水江文书,课题研究组拟定了《清水江文书数字对象描述元数据及著录规范》,其规范注释为:
1.清水汪文书题名无数据著录规范
清水江文书题名元数据是核心元素中的第一个。清水江文书的题名著录原则为:文书如有题名原则上照录;文书没有题名时,拟定题名。题名拟定的规范按照“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则拟定。其中立契人为契约的主体,契约的种类按契约分类标准:卖契、佃契、典契等拟定。契约文书签订时间,按原契或文告时间照录。以下面的契约为例。
契1.立卖鱼塘人橱朝旺、朝举兄弟二人,夸因家下要钱使用,无从得处,自愿将到庙皆祖遗鱼塘二大房分落,外一边分为五股,自己出卖问到本房杨含珍兄弟二人承买为业,五股卖自己面分一股一半,议定价钱伍佰文正,其钱亲手领明,并无包卖他人分寸在内,自卖之后不得异言,如有不清,自前理落。今欲有凭,立有卖字为据。
亲笔 杨朝旺
凭中 龙广书
道光二十九年十一月十五日立卖
这份契约没有题名,按“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则,拟定的题名为“道光二十九年十一月十五日杨朝旺、杨朝举立卖鱼塘契”
2.主要责任方式元数椐著录规范
立契人或文告人是契约文书的主要责任人,并进行元数据著录,符合数字对象描述的元数据著录规范。清水江文书的主要责任者可以是个人、家族、团体,或者官府文告发布者。同一责任方式著录不超过三个,多余三个著录为“某某等”。不同责任方式之间用分号。
如上契约为例:责任主体为“杨朝旺,杨朝举卖方”
3.其他责任方式元数据著录
在清水江文书数据库元数据著录规范中,是把契约文书中的“凭中”等作为其他责任人,有其特殊的意义。契约的签订,必有中人,曰“凭中”。清水江流域,民间各种契约活动的签订一定有中人参加,并在他们的介绍和参与下,当事者商定契约的内容,确认各自的意思并写下契据、文书。在契约文书签订中,中人有不可替代的作用,在交易双方中起中介,包括寻觅适当的交易伙伴,参与议定价格,监督和证明契、价的两相交付以及不动产中的临场踏清界址等。被选着中人的人在家族中是有一定的地位和声望,当事的各方都信任,并且大部分中人在契约签订过程中还分取定的担保金。所以在拟定的元数据著录规范中,把“凭中”作为责任人著录,在数据库中提供检索。上例中的其他责任人著录为“龙广书凭中”。
4.日期元数据著录
日期元数据是清水江文书数字对象描述的核心元素,每份契约文书都书写有日期。清水江契约文书中书写的日期除民国后期有些采用公元纪年的外,明清时期书写的日期一般是使用年号纪年时间或农历时间。契约日期在文书中起作重要的作用,清水江文书中的契约既是长期有效契约、同时又有时间段的限制。例如典契、佃契、杉木买卖契等。特别是“佃山栽种林木契”,林木从栽种到发卖,周期很长,契约中除了规定双方的权益外,还明确标注木质长大发卖后,土地要归还原主。像这样一类的契约,时间就有一定的约束力。所以契约文书日期是契约文书中的重要内容,在元数据著录规范中明确规定契约文书日期采用照录的原则,同时设立公元日期对应参照,并作为检索项。
5.出版者元数据著录
清水江文书对此项的元数据进行了变通,并且是作为一个可选择的著录项。因文书中的绝大部分是私人契约,并大量由个人收藏,一般是不被公开和发布的,也就不存在出版者这一项的内容。但清水江文书中有定量的官府文书,官府文告的发布者应可作为出版者著录,对此项元数据核心元素进行了保留和变通。
6.附注项元数据著录规范
附注项是清水江文书元数据中的核心元素,对于附注项的著录规范是,凡契约文书需要说明的都加以说明。例如文书缺字附注的说明、文书释义说明、红契白契的说明、官契或私契的说明、单契或粘连契的说明等等。契约文书的附注项是一个非常灵活,并且提供大量信息的特殊项。例如下面的这一张契约:
契2.立典柴山沙(杉)木人扬俨然,今因要银取用,无从得处,自己将魁杞屋背柴山沙(杉)木壹块出典,问到岳寨秦现澋承议作价银壹两伍钱铜钱整。山内除有沙(杉)木陆根、南(楠)木壹根、青岗木壹根不典,大小沙(杉)木细柴任从典主,日后欲禁伍年,不限远近俻得原本价赎约,夸欲有凭,立典是实。
于飞代笔
道光十二年七月初四
同治二年二月杨大吉照契转典与杨业兴耕种,立转典是实。
同治三年扬业兴照契转典扬事权耕种是实。
大吉笔
这份契约现保存在杨事权后人手中。从契纸字面文字可看到,立典所指的魁杞屋背柴山沙(杉)被两次转典,什么原固原土地权人没有赎回这块杉山,笔者不得而知。但从对契约的著录来讲,这张契纸实际是三份典契,且地产权最后属于杨事权。所以附注项就要对三次转典进行说明。
7.关键词
关键词的著录采用抽取文书种类进行著录,每份文书选取2-4个关键词不等。例如:契2关键词:柴山杉木契,土地契,典契。
8.载体形态元数据著录规范
载体形态是清水江文书类型核心元素。“清水江文书”按载体区分,有纸契、布契、石契、皮契。在数据库中的扫描件基本上是纸契扫描件。对于纸契在载体形态项标注是:纸契;多少页;长X宽cm;毛边纸或绵纸或别的材质。石契是以照片的形式在数据库中呈现,对契约文书载体的描述,首先指明载体的类型:石契;碑文的长宽厚度;碑文位置。
9.收藏历史
收藏历史著录文书收藏沿革,注明获得方式。在元数据著录规范中,明确著录契约文书的收藏沿革、获得方式、购买价格;如果是扫描件,需著录从何处对原件进行扫描。
10.馆藏信息的著录规范
对馆藏信息的著录规范,著录原件现收藏地、馆藏号或收藏农户姓名。
清水江文书数字对象描述元数据的设计和著录规范,对元数据集的核心元素进行了定义和规范,并实际运用于数据库建设中。在实际著录时,清水江文书是一个较为复杂的复合对象,需要利用大量的地方知识,才能进行完整的描述。同时该文由于篇幅的关系,对清水江文书中数字对象描述的扩展元素没有论及。
数据录入规范 篇7
1 应用ERP系统所存在的业务数据规范问题
1.1 系统基础数据未按规范维护
基础数据, 是企业ERP系统应用的基础, 也是系统相关运算逻辑正确执行的关键, 因此, 正确、规范化地维护系统基础数据是系统正常、高效应用的基础。但是在实际应用过程中, 存在以下基础数据维护问题。
1.2 BOM等主数据未及时、正确维护
BOM主数据在企业ERP系统中占据着至关重要的作用, 对于MRP运算结果的正确性, 物料采购计划的正确性, 车间生产计划的顺利编制影响巨大。
除此之外, 维护BOM主数据往往还存在着严重的及时性问题。比如企业进行MRP运算时, 根据运算结果日志获悉相关成品所对应的BOM主数据未及时维护, 导致无法及时下达物料采购计划, 严重影响物料采购交期, 产品生产交货交期。
因此, 企业在应用ERP系统时, BOM主数据的正确性、及时性成为制约ERP系统深入应用的绊脚石, 需引起重点关注。
1.3 组织架构未正确维护, 或调整不及时
企业ERP系统应用的重要目标之一, 在于基于系统快速、正确地获取业务分析报表, 帮助管理人员做出正确的决策。而报表数据的正确获取, 与系统组织架构数据维护的正确性息息相关。
但是大多数企业管理人员在应用ERP系统时, 忽视了组织架构数据正确、及时化维护的重要性。比如, 在企业组织架构进行调整时, 并未及时进行调整ERP系统内对应的组织架构数据, 导致报表获取数据时, 因组织架构问题导致数据的合并汇总异常。
1.4 日常业务操作数据作业过于随意化
1.4.1 账物不符
ERP系统应用的基本原则之一, 就是确保账实相符。但大多数企业在应用ERP系统时, 却忽视了这一基本原则, 日常工作中操作业务数据过于随意, 导致很多数据不准确。
比如, 仓库管理人员在应用ERP系统库存管理模块时, 输入物料凭证往往与实际货物移动的日期相差很多, 基本上都属于事后记账的方式, 不利于仓库材料“货龄”分析。
1.4.2 后台调整业务操作数据
企业在应用ERP系统的过程, 是不断优化、完善的过程, 在应用的过程中同样也会伴随着系统问题的产生。ERP系统逻辑严谨, 任一操作可能均会伴随着诸多数据的变化。
但是部分企业系统管理人员, 在处理ERP系统BUG问题时, 不遵循分析、解决问题原则, 而过于注重数据库操作, 依靠技术手段后台调整业务操作数据, 导致表面上解决了系统问题, 却对数据的正确性带来巨大隐患。
2 ERP系统应用过程中业务数据规范策略
2.1 梳理企业业务数据维护流程, 制定业务数据维护制度
企业在推进ERP系统应用过程中, 应该努力梳理业务数据维护流程, 并制定科学、合理、严谨的业务数据维护制度。
2.1.1 参考行业经验, 高效完成业务流程梳理及制度制定
ERP系统, 必须高度吻合行业发展的特性, 同样业务数据的正确维护离不开行业化经验。因此, 在梳理业务主数据维护流程及制定主数据维护制度时, 可以考虑参考行业内已有的经验, 快速、高效地完成此项工作。
2.1.2 结合自身特色, 优化完善业务流程及维护制定
行业化经验, 为企业梳理主数据维护流程提供了基础, 但是流程及制度在企业内得以深入地应用, 必须结合企业自身的特色。因此, 在企业应用完善ERP系统过程中, 同样离不开主数据维护流程及维护制度的优化完善。
2.2 组建业务主数据监察部门, 统一监督、规范业务数据
任何业务流程及管理制度在企业内部的真正落地, 都离不开有效的监督与管控。为了使得ERP系统主数据维护流程及管理制度在企业内深入推广, 组建业务主数据监察部门意义重大, 能够对企业的业务数据规范化统一监督与管控。
2.3 组建监察部门, 并赋予执法权
部分企业在推进ERP系统时, 也组建了监察部门, 但却未赋予相应的执法权, 以至于无法对企业应用ERP系统中所出现的数据规范性问题给予责任鉴定并做出处罚决定。
2.4 将数据规范化列入企业业务考核指标内
企业在应用ERP系统时, 可考虑建立统一的业务数据管理管理平台, 并不断健全企业ERP系统基础数据管理机制, 对所有的业务数据进行统一地管理。在制定公司信息化考核指标时, 将关键业务节点的系统操作及可能存在违规的异常操作纳入考核范围内, 并将考核指标落实到相关部门及人员, 制定相应奖惩制度, 责任到岗、考核到人, 循序渐进地定期检查考核指标达标率。
参考文献
[1]郭颖.ERP应用考核系统分析[J].硅谷, 2013 (16) .
数据库设计规范及设计技巧研究 篇8
企业信息在收集时,常常对企业信息收集提出来高效化和高质化的要求,这也正式企业信息数据库建设的目的。企业信息的收集工作对于一个企业发展来说起着至关重要的作用,它能够更好地确定顾客的市场需求,提高企业产品的市场竞争能力,是一个企业健康发展的重要历程。所以企业信息化的基础正是以企业数据信息的收集能力为基础的。所以,数据库设计工作的建设,直接的对一个企业的信息化建设起着十分重要的作用,也会对一个企业在未来的发展产生影响。
伴随着我国经济文化的不断发展,我国企业信息化也在不断地扩大,一个企业信息的收集工作已经成为了这个企业发展的重要历程,也是一个企业信息化建设的重要组成部分。企业信息文化的收集和分析工作将会对这个企业产生巨大的影响。一个企业想要依靠信息化实现健康的发展,企业的信息收集及处理能力是一个基础性的工作。企业信息收集工作会对企业的信息化建设,企业的效益产生很大的影响。企业信息化建设的优劣与企业的数据库设计有着密切的关联,在数据库建设质量保证的前天下,企业的信息化的建设意义才能够真正地体现出来,才具有更多的意义。
近年来,关于数据库信息化建设的许多问题都浮现了出来,且不说为企业带来多少效益,还已经影响到企业的正常运转,这种问题出现的原因可能是因为数据库建设人员不够重视,数据收集时的信息错误以及数据库设计人员的能力欠缺等原因是引起企业信息化建设存在问题的主要根源。
为了使企业的各项工作能够更加方便地检索到相关信息而对企业的信息进行了收集和数据库设计建设工作,相反这也对数据库的设计工作提出了更高的要求,增加了数据库建设的难度,因此数据库建设的管理人员如何准确地把握企业信息的现代化建设和企业信息收集工作之间的关系具有十分重要的意义。
因此,如何处理好企业信息的收集工作和企业信息化建设之间的关系是每一位数据库的建设人员都应该思考和研究的问题,怎样在最短的时间内给企业带来最大的方便的问题是每个建设者的出发点。企业信息收集工作的智能化和高效化对于一个企业来说是至关重要的,它是企业信息化建设的一座重要的基石和纽带。
企业数据库信息的建设工作是与企业信息每个阶段的收集工作是息息相关的,会对企业信息收集的方向和进行程度造成一定的影响,是一个企业是否开展信息收集的一个决定性结论,它对企业的信息化建设和企业信息收集是一个重要的协调者和衔接者。因此,在以企业数据库设计的规范化前提下,才能更好地体现出企业信息收集得高效性和智能化,只有这样,企业信息化建设和企业的收集工作的智能化才能更好地显现出来,才能更好满足市场的要求和企业的需求。
2 规范化设计的主要流程
2.1 数据库的概念设计阶段
1)初始化进程
初始化进程就是首先要对主要的目标和要进行的范围进行描述,并以目标的建模计划、计划的组织团队、在建设中所使用的原材料进行收集、来对建设进行约束和规范。通过分析调查资料得出调查结果,并对采集到的原始数据进行输入输出等工作,并形成基本的数据资料表,在初始化进程阶段,最重要的是对原材料的收集。
2)定义实体阶段
定义实体是从第一个阶段收集的材料中对大部分的实体进行标识,并依据表示物的术语和相关的“代码”符号,能够找出相对应的实体,两者之间形成相对应的关系。
3)定义联系阶段
在IDEFIX分析模型中,往往只允许存在着二元联系模式,而n元之间的联系,则必须建立起n个二元之间的联系。使用实体联系矩阵来辨别实体之间的二元关系,并以相应的规章和业务需求为依据,并结合于实际的相应情况,来分析出关系的名、关系的势等来确定相应的关系类型,如:分类关系、非确定关系、标识关系和非标识关系等。
4)定义码阶段
定义码就是在上一个阶段的基础之上,去除非确定的关系,并引入交叉实体,并通过标识候选码的属性,来对主选码进行确定分析。找出可信的确定关系,并作出进一步的实体分解,使键基视图体现出来。
5)定义属性阶段
定义提取说明性名词,这能够确定开发属性表和确定属性的所有者关系。通过定义和检查非主码区属性的问题,来确定非主码属性是依赖于主码属性的一种关系。此时,会得到改进后的全属性视图IDEF1X模型,而此视图符合于第三范式的关系理论。
6)定义其它规则和对象阶段
对属性的长度、精度、空缺值、约束规则等进行定义,并对角色、序列、视图等对象信息进行定义。
2.2 逻辑结构进行设计阶段分析
这个阶段主要是通过对上一个阶段的概念结构转换成一种数据模型即为某个数据库管理系统的支持类型,并对这个类型进行优化。通过选择最为合适的表达结构概念的数据模型来确定逻辑结构,以选出最为合适的数据库刮泥系统。将实体之间的属性和他们之间的联系转换成相应的关系模式即为E-R图的关系转化模型。
2.3 数据库的物理建设阶段
为了实现数据库满足企业的需求,而对数据库进行了物理设计,这会对数据库的使用性和方便性产生一定的影响。结合分析各项的要求因素,把逻辑数据模型转换成物理结构,以方便后续检索功能的进行,来评估数据库设计的是否合理。
3 数据库建设中的技巧分析
在数据库地建设时,要满足市场的需求切实的提高数据库的质量和工作时的效率,这就要求要做好市场充足的调查,真正的理解市场的需求,以此来满足市场对数据库的要求。除了对数据库市场有着一定的调研基础外,还要对数据库业务的相关流程有着清楚的理解,这样会切实的提高工作的效率和质量。符合企业发展的数据库建设,可以解决对公司之间的沟通问题,也使得由于不清楚公司的需求而产生的数据库建设不合理的情况。这样会形成一种共赢的良好的局面。E-R图和数据字典的创建。实体之间的相互关系可以通过E-R图体现出来,实体对象和其所对应的关系属性可以用逻辑表来进行描述即为数据字典。专业化和规范化统一能够最大限度地发挥E-R图和数据字典的作用,更好地为企业服务。
4 小结
企业数据库的规范化建设能够提高企业信息数据收集时的效率。我们要加强对数据库信息化建设对企业发展的重要认识,并对数据库进行规范化处理,因为只有这样才能最大限度地使数据库建设发挥相应的效益。
摘要:随着我国现代化进程的不断加快以及社会经济文化水平的不断提高,我国的信息文化产业已经得到了长足的进步与发展。一个企业信息的收集能力,是这个企业文化产业产业链的重要的组成部分,是企业形成社会信息化的基石,一个企业收集信息的能力,对于企业数据库建设的质量和数据库收集时的效率有着至关重要的作用。因此,企业信息收集质量的提高,以满足企业的需求,是现今一个企业发展的重要里程碑。我国的社会信息市场发展得越来越快,企业信息数据库的建设也体现出许多新的局面,如数据库的智能化和复杂化可以说是现代数据库最好的体现。本文分析了在企业信息收集中数据库的设计工作所起到的重要作用,深入分析和探讨了数据库在设计时如何更好地对数据库进行规范化、智能化进行设计。
数据录入规范 篇9
关键词:信息公开,数据平台,融资
经济活动的本质其实就是使用价值的交换, 而交换是社会活动的一种, 经济活动在其漫长的演化发展过程中, 是基于“信任”这种社会情感产生的, 经济活动发展到今天, 市场这支“无形的手”在时时刻刻分配着主要的社会资源和服务, 公平、互利、诚信成为市场经济的基本特征和内涵要求, 作为市场经济活动的“细胞”---企业, 在其健康发展的道路上, 不偏离市场经济的基本特征和内涵要求, 关键在于行政能力的监督, 因此丰富和发展行政监督手段, 对于规范企业经营活动, 维护市场秩序, 促进经济发展至关重要。
一、企业信息公开大数据平台的定义
基于国家工商总局构建的企业信用信息公示系统, 拓展大数据实时巨量收集、智能分类、系统比较、决策分析等功能, 在云计算技术支持下, 实现企业、协会、政府部门和用户的多方实时链接, 在权限的要求下进行申报、填写、查阅、监控等操作, 构建起开放性的企业信息公示平台。运用大数据平台建立企业信息公示平台, 本质要求是建立起数据实时、客观、可查的企业信誉机制, 为创造良好的市场环境提供信息支撑, 是丰富和发展经济管理的手段创新, 是转变政府服务职能的具体表现。
二、企业信息平台建设的现实紧迫性
改革开放三十多年来, 我国无论在经济规模还是质量上都有了长足的进步, 特别是市场经济条件下, 企业的发展只能完全衔接于市场这根指挥棒, “做大、做强、走出去”是企业发展的固定模式, 企业信息平台能够很好的服务于企业, 促进企业提高经营管理能力, 也是时代发展的必然需要。
(一) 企业搏击市场经济的“身份证”
在市场经济高度发达的今天, 商业风险是无处不在的, 经济实体在挑选项目、合作伙伴时必然会建立起防控风险的信用评估政策, 这种对客户的信用政策, 成为企业竞争的有效手段之一, 而要建立这种信用评估体系, 关键在于有足够的客观信息支撑, 而运用大数据技术依托官方的企业信息平台能够提供全方位、多角度的对方企业信息, 能够实现目标群的对比信息, 特别是信用信息, 能够很好的降低商业风险, 这些单个企业相关方面的集成信息, 就是其搏击市场经济的“身份证”。
(二) 企业破解融资困局的“通行证”
国务院颁布《企业信息公示暂行条例》其中一个主要目的, 就是通过企业信息公示, 特别是信用评级, 来有效解决中小微企业融资难的问题, 十八届三中全会也特别强调推动金融改革, 鼓励中小银行设立, 发展普惠金融, 因为只有这样才能从根本上解决中小微企业融资难、融资贵的问题, 才能更好的促进实体经济的发展, 而“为什么借”是融资的头号问题, 企业平台的信息公示功能, 特别是信用评级功能是说服他方借钱的重要依据和理由, 是融资的“通行证”。
(三) 融入信息时代浪潮的“荣誉证”
每个时代都有其鲜明的特征, 在信息技术迅猛发展的今天, “互联网+”是我们这个时代最为鲜明的特征, 能够具有时代特征对于企业来讲, 是企业实力的一种体现, 也必然是一份荣誉, 结合大数据平台通过云计算技术进行多方实时链接的企业信息平台, 是典型的“互联网+”模式, 虽然不是服务于某个具体的企业或者产品, 但却是创新运用于经济管理当中, 对于政府和行业协会是一种管理手段的创新, 对于企业来讲是实力展示手段的创新, 是融入信息时代浪潮的“荣誉证”。
三、建设相关要点
企业信息平台因为其“互联网+”模式的时代性和先导性, 在一定程度上还是处在探讨和摸索阶段, 开放的平台和层级管理、大数据的需要和细微信息的录入、苛刻的要求和服务的本质, 这些看似矛盾, 却又融合在一起, 相互依存, 相互实现, 因此必须慎重对待, 严格要求。
(一) 信息构建的模式要求
企业信息平台, 在建立企业信誉体系的本质要求下, 关键是运用大数据模式采集、规整各类企业信息, 以国家工商总局构建的企业信用信息公示系统为基本载体, 根据《企业信息公示暂行条例》的注册信息登记信息公示、企业年度报告公示、政府行政信息公示三大块和政府抽查、企业信用等级为完全开放式公示, 还应将企业季度业务信息、企业季度财务信息进行非完全式公布, 用户经企业允许可以进行查阅, 企业法定代表人和主要高管的个人档案以及诚信记录由政府部门、企业共同进行非完全式公布, 由于涉及个人隐私, 经企业和个人允许可以进行查阅, 特殊条件下经法院同意也可进行查阅。
(二) 建设的主体要求
企业信息平台在建设上的必须明确好两个个方面的内容, 即系统主体几方参与建设, 等级内容区分两个方面, 关键在于各项信息数据的全域、全时、对应生成, 保持信息平台拥有实时的巨量关联数据。
系统主体参与方, 政府、协会 (企业) 、用户三方方参与。由政府部门牵头, 在国家工商总局构建的企业信用信息公示系统的基础上, 依托互联网公司提供大数据技术, 共同建设企业信息系统平台, 日常由互联网公司协助电子政务中心, 进行平台运行维护等方面的技术支持, 各类型的账户口令由电子政务中心负责分发。政府部门端口应根据实际需要, 按照功能管理进行分发, 工商、税务、财政、人社、安监、政法、质检、规划、住建、银监等部门为基本账户, 银行、担保、保险等金融机构账号口令, 也规整我政府端口;协会端口, 按照行业分类统筹的原则进行账户口令分配, 企业账户由行业协会认证, 企业账户与行业协会分类信息链接;用户, 按照利益申请的原则, 向电子政务中心申请和分发账号。
等级内容区分。一级账号为电子政务中心, 即平台技术建设维护方, 按照法规要求可以更改各型数据;二级账户为政府行政部门、协会 (含企业) , 主要申报、生成各种行政类信息 (含企业信用等级评定信息) 、企业信息、金融信息, 无权更改各类信息, 其中协会负责企业信息的分类规整和初审;三级账户为用户方, 只能浏览查阅各类信息, 对于非完全公开内容的信息, 需经对方同意才有权限查阅。
(三) 数据的权威性要求
数据的权威性是企业信息平台的生命, 没有真实客观的数据, 就不能符合企业信息平台建立的初衷, 平台就没有实际意义, 因此必须在法律法规的基础上, 采取多种手段, 确保各种数据是真实的、客观的。
一是加强法规建设。制定严格的操作规程, 明确信息录入申报的要求和标准, 对于虚假信息的录入方和审核者要进行追责, 在法律法规层面保证有法可依, 并严格执行确保有法必依。
二是分类检查监督。根据《企业信息公示暂行条例》要求, 工商部门按照公平规范的原则, 根据企业注册号等随机摇号, 确定抽查企业, 组织对企业公示信息进行检查。协会作为企业信息采集的组织方, 应该把好信息的初始关, 企业对于政府类行政信息有异议的, 应通过协会与对应政府部门或金融单位进行核实沟通, 经双方同意, 可向电子政务中心申请更改或补录。
数据录入规范 篇10
1) 交通科学数据整合集成离不开标准。
交通领域科学数据分布广泛,类型多样,采集手段各异,并且综合了公路、水运、铁路、民航等多种运输方式,使数据共享工作的展开面临极大的挑战。数据资源如何分类,如何描述其内容、结构,如何规范数据单元,如何定义数据的特征等问题是在交通科学数据共享工作开展前就应解决的首要问题[1]。
2) 交通科学数据共享工程的管理和建设需要标准。
交通科学数据共享工程庞大、复杂,需要投入很多的人力、物力、财力来确保整个工程的合理、有序、高效运行,包括对数据共享的管理,共享系统运行管理,规范系统建设和数据中心建设的程序和方法。所有这些规章及规范构成了交通科学数据共享工程运行管理机制的重要环节。
3) 交通科学数据共享的服务依赖标准。
交通科学数据共享的最终目标是将整合加工的数据资源,通过现代信息技术手段,向社会提供服务。标准化程度的高低直接决定服务质量的好坏,从数据的采集、加工、存储到数据的汇交、分发、应用,都必须依据标准,自上而下使整个交通行业的数据共享服务规范化,推动和促进科学数据共享的广度和深度。
2 交通科学数据共享标准规范体系框架
交通科学数据共享标准规范体系是在国家及交通领域相关政策法规的支撑下,在科学数据共享运行管理机制的保障下,依据国家科学数据共享工程颁布的一系列指导性标准[2,3],同时考虑公路、铁路、水运、民航等领域在数据描述、共享系统建设与管理、共享服务等方面的标准化需求综合研究制定的。
标准规范体系框架总体分3个层次,即指导类标准、通用类标准和领域专用标准。其中通用类标准又分为数据类、管理与建设类和服务类3个类别的标准。
交通科学数据共享标准规范体系建立原则如下:
1) 科学性。标准化的最基本原则,是采用所述标准的有关应用系统和技术系统安全、可靠、稳定运行的根本保障。
2) 系统性。是标准体系中各个标准之间内部联系和区别的体现,应做到内容全面和层次合理。
3) 先进性。充分利用现有先进技术,积极等同或等效采用国家标准、国际标准。
4) 可扩充性。既要考虑目前的技术和应用发展水平,也要对未来的发展趋势有所预见。
3 标准规范体系主要内容
3.1 指导类标准
国家科学数据共享工程中给出的定义是指与标准的制定、应用和理解等方面相关的标准。在本体系中,它应能阐述交通科学数据共享标准化的总体需求、概念、组成和相互关系,以及使用的基本原则和方法等。除包括国家科学数据共享工程中颁布的系列指导类标准之外,还包括《交通科学数据共享概念与术语》等交通领域指导类标准。
3.2 通用类标准
通用类标准是指交通行业在公路、铁路、水运、民航等领域具有共性的标准。遵循这些标准,能够实现交通各领域数据规范化的定义、描述、加工、整合、存储及交换无歧义理解。主要通用类标准有:
1) 数据类标准。如《交通运输科学数据共享元数据内容》、《交通运输科学数据共享数据元目录》、《交通运输科学数据分类与编码》、《交通运输科学数据共享数据模式》、《交通运输科学数据图式表达目录》、《交通运输科学数据共享数据交换格式》等。
2) 管理与建设类标准。如《交通运输科学数据共享管理办法》、《交通运输科学数据汇交管理办法》、《交通科学数据共享网建设规范》、《交通科学数据共享数据中心建设规范》、《交通科学数据共享网运行管理规定》等。
3) 服务类标准。如《数据加工规范》、《元数据检索和提取协议》、《交通运输科学数据质量控制》等。
3.3 领域专用标准
领域专用标准即根据通用标准制定的、满足特定领域数据共享需求的标准,具体反映某领域数据特征的数据类标准,如《公路水运领域共享元数据内容标准》,即可在《交通运输科学数据共享元数据内容》标准的基础上,结合公路水运所拥有的数据资源特征,进行扩展和细化。
4 体系中重点标准的剖析
交通科学数据共享标准体系中的各专项标准,以国家科学数据共享工程颁布的系列指导性标准为依据,在深入学习数据共享理论和广泛调研行业资源需求的前提下,借鉴科学数据共享工程中其他试点单位的先进标准编制经验,结合交通领域资源特色,遵循急用先行的原则,研究制定。从数据分类编码、元数据内容、数据元、数据汇交管理、数据质量控制等方面入手,逐步丰富、完善,满足交通科学数据共享的需要。
4.1 数据分类与编码标准
数据分类与编码标准编制目的在于准确地识别和有效地管理交通运输科学数据,保证其在科学数据共享工程范围内组织、存储及交换的一致性。交通行业已存在各种各样的分类对象和分类习惯,如何最大程度的统一分类思想,既尊重现有的应用系统和信息系统对交通资源的分类方式和用户的检索习惯,又要兼顾科学数据共享对资源分类的各种要求,最终保证交通领域产生的各种科学数据资源有类可归,是该标准在研究制定过程中面临的一大难题。
交通科学数据资源分类采用线分类法,其中,大类划分为公路、铁路、水运、民航和综合运输。在每一大类之下划分若干中类,每一中类下划分若干小类,共计43个中类和247个小类,按照国家科学数据共享工程统一的编码规则对各类逐级进行编码。
交通运输科学数据中类的划分主要参考GB/T 13745—92《学科分类与代码表》中有关交通运输行业的类目设置,以及《中国图书资料分类法》中类目的设置,对较成熟的类目基本沿用,其他中类类目则根据科学数据的内容特征、行业特点等确定。而小类的划分以学科分类体系为主要依据,兼顾行业数据的来源、存在形式、形成过程、未来需求和方便检索的原则,力求类目设置完整、数量均衡。
4.2 元数据内容标准
元数据是关于数据的数据,是对数据和数据集合的规范化描述。交通科学数据共享元数据内容标准定义了完整描述交通领域具体数据或数据集时需要的数据项集合、各数据项语义定义等[3]。它提供了有关交通运输科学数据的标识、内容、分发、数据质量、参照、数据模式、图式表达、扩展、限制和维护等信息。
交通科学数据共享元数据内容标准在科技部颁布的《科学数据共享工程元数据内容》标准的基础上,在包含其核心元数据的前提下,裁减参考元数据并新建凸显交通资源特征的实体和元素编制而成。在定义和描述元数据时采用3种方式:摘要表示、数据字典描述和UML 图描述[4]。
依据本标准,交通行业各数据资源拥有单位对各自的在线或离线资源进行标引并著录,提交元数据至交通科学数据共享网(以下简称“共享网”)数据管理后台,管理员审核相关元数据内容的真实性、可靠性、安全性,经审核合格的元数据给予发布。目前,交通科学数据共享网已著录元数据2 000余条,并将核心元数据提交国家科技基础条件平台,通过资源整合接口,在平台门户上即可跨平台检索到交通科学数据元数据。
4.3 数据元目录标准
数据元是用来描述数据的最基本单元,是数据建模的基本元素,更微观的保障了“共享网”数据资源的共享与交换。《交通科学数据共享数据元目录标准》解决了“共享网”科学数据资源生产、管理、服务中,相同概念的数据元,由于命名、定义、分类标识、表达格式、数据类型、表示方法等不一致造成的混乱,对内,可作为交通科学数据资源采集、加工、处理环节工作人员的操作规范;对外,可使参与到交通科学数据共建共享的相关责任方,根据本标准对交通科技信息资源进行汇交、分发、服务和应用。
《交通运输科学数据共享数据元目录》在公路水运领域参考行业基础数据元集标准,从中选取部分科学数据共享所需的数据元,但描述方式仍然遵守科技部颁布的《数据元标准化原则与方法》的要求。铁路、民航领域、部分公路和水运领域的数据元无正式行业标准可依,因此按照自下而上的方法,提取行业现有业务系统、应用系统中的数据元,并梳理领域数据资源,兼顾未来资源整合需求进行数据元目录的编制,最终形成总的交通科学数据共享数据元目录。
总之,《交通科学数据共享数据元目录》的制定,为交通运输科学数据共享工程中涉及的数据元提供了统一标准,保证了相同概念的数据元在语义上的无歧义理解,提高建库质量,促进数据加工的规范化、标准化,推动了交通领域科学数据在各个层面上的集成与共享。
5 结 论
1) 交通科学数据共享标准规范体系是一个开放的体系,在科学数据共享活动进行过程中,可以根据具体的应用情况,随时补充制定对数据共享的建设、管理、服务等方面有价值的标准或规范。
2) 交通科学数据共享标准规范体系是一个动态稳定的体系,它所包含的某些专项标准正处于动态稳定的状态中,需要根据其在共享工程中的应用效果,结合行业技术专家和国家科学数据共享工程标准规范编制专家的意见,不断的进行修改完善,最终达到稳定成熟。
3) 构成交通科学数据共享标准规范体系的每项标准,都具有重要的作用和价值。
4) 交通科学数据共享标准规范体系建设是一个复杂而漫长的过程。我国新组建的交通运输部整合了原交通部、原中国民用航空总局的职责以及原建设部的指导城市客运职责,并负责管理国家邮政局和新组建的国家民用航空局。目前,交通科学数据共享资源对象仅包含公路、铁路、水运、民航4个交通运输领域,今后,交通邮政运输也必将纳入到交通科学数据共享工程范围中。因此,现有的交通科学数据共享标准规范体系的具体内容,还有待进一步的研究和深化[5],相信随着交通科学数据共享工程的不断推进,必将使交通科学数据共享标准规范体系建设逐步走向成熟。
参考文献
[1]徐枫.科学数据共享标准体系框架[J].中国基础科学,2003(1):44-48
[2]国家信息中心.科学数据共享工程动技术标准.SD/T1003—2004科学数据共享概念与术语———第1部分:概念(征求意见稿)[S].北京:国家科技部,2005
[3]国家信息中心.科学数据工程共享技术标准.SDS/T2112—2004科学技术共享工程技术标准(征求意见稿)[S].北京:国家科技部,2005
[4]王辉,林垚.周紫君.基于元数据的交通运输科学数据共享平台设计[J].交通与计算机,2008,26(2):87
数据录入规范 篇11
一、从宏观角度分析
1.统一特色库建设规范。建库前进行全面系统的调查研究,对准备建设的特色数据库进行科学论证的基础上,严格采用相应技术标准或规范作为建库的必要条件。特色库的开发与工业类软件开发的实质是相同的,有多种开发的流程模型,一般为自顶向下、自底向上、瀑布式、螺旋渐进式等。这就要根据自身的实际情况来选取最适合自己的一套标准流程[3]27。党史党建数据库开发的规范步骤如下:
宏观:规划及需求分析———开发平台的选取
微观:数据加工及录入———特色库发布测试———维护与支持
当确立这样一个开发数据库的规范及标准后,整个建设思路就显得明朗清晰,为后续如何选定特色库开发平台做了清晰的指引。
2.数据库开发平台的选用标准。如何选取特色库开发平台,是整个建库工作的核心,必须通过引入相应的技术规范及标准,在众多平台中找出最符合的才能最终选定。专题特色数据库建设的技术规范是实施特色资源共享的核心。当前的许多专题数据库在建设上存在着诸如“数据格式不规范、著录标准不统一”等典型问题。因此,应选取通用、规范的标准和协议,架构上采用模块化,且便于灵活部署的开发平台,来确保实现专题特色库文献资源共享[4]53。
现阶段开发平台所遵循的标准与规范主要包括“OAI/ODL组件接口协议;Z39.50协议;Portlet规范;SAML标准;Open URL开放链接标准;LDAP标准;Ca]is United Query and Resultset统一检索接口规范;web Services组件封装规范等。通过引入上述开发平台技术规范及标准,将具体指标对号入座,就不难确定选取何种数据库开发平台。事实证明以“非结构化的特色库开发系统”作为建库平台,能从容面对大量文献类非结构化数据的处理,较易实现海量非结构化信息资源的全文检索与管理,满足特定用户的实际需求[5]81。同时,在实际运用中,客户端 / 服务器(C/S)标准模式与浏览器 / 服务器(B/S)标准模式将会同时存在,这也是本特色库的一个重要特色之一,在安全可靠的基础上,能满足不同类型用户的实际需求。
3. 特色库质量反馈评价标准。在对特色库进行质量跟踪的同时,还要建立对特色库利用效率评价标准、特色库质量评价标准、特色库宣传利用评价标准等,而这些都能推动特色库进入逐渐成长、良性互动、可持续发展的有利境地。根据COBl T (Control Object《Infonnmion and w.1ated Technology)对标准规范的定义,将评价标准限定在特色数据库系统建设过程上。并结合武汉大学图书馆王梅老师在《索引数据库质量评价标准的探讨》一文中提到对专题特色数据库质量评价应从项目管理、服务功能、数据加工、系统平台、元数据标引这五个方面来进行,同时还推出16个二级指标标准,因此,建立特色数据库评价指标标准体系是很有必要的[6]59。
二、从微观角度分析
特色库建设的规范及标准是指建库环节中具体所采用的那些标准与规范手段,是特色库建设的根本保证。现今的特色库标准化建设还处于探索阶段,具体在数据采集、传递、加工以及信息检索等各个步骤上,积极遵循国际、国内通用的数据格式标准、数据著录标准、规范控制标准、数据标引标准及规范协议已是大势所趋[7]46。本文力求通过建立党史党建专题特色库,以实现对党史党建特色文献资源整合,并通过互联网资源共享的形式来提供专题信息服务[8]54。
1.元数据标准规范。元数据作为一种标准编码体系,是进行知识组织和资源开发的工具,因此它在特色库建设中的作用是决定性的。目前特色库开发所使用的元数据标准大致分两块:一是直接引用国际、国家及行业标准,来制订相适应的著录规则标准来实现;二是利用其他相关元数据的成功经验、来建立新的适合于自身元数据标准[5]80。如:中国高等教育文献保障系统CALIS所制定的各类元数据标准规范,包括《CALIS数字对象唯一标志符命名标准》和《描述型元数据及其著录标准》。特别是《描述型元数据及其著录标准》所涉及的会议论文、古文献论文、期刊论文、学位论文等描述元数据标准。另一个重要环节就是元数据集的选择和制定要充分考虑到和标准元数据集的兼容性过渡度问题,如何处理以实现增强数据交互能力和共享程度的目标。
2.著录、标引标准及规。要实现信息资源准确、高效的检索,完成不同类型、不同特色库中同类资源的无缝关联与检索,信息的著录及标引质量显得至关重要,这将直接影响到专题库的检索效率和质量。因此,要严格参照相关的国内外及部委的著录标准,选择标引方式,规定标引深度,处理好标引的分散与关联等问题。元数据著录的标准化问题是完善用户查询信息资源点,是实现信息链服务的基石。当前国内在专题特色库建设上,主要表现为标引不够规范[4]53。基于同一特色库的所有元数据,既有用任意词或关键词来做标引,又有用主题词来做标引,而大量的同义词之间却没有做合适的关联,因而存在漏检、误检、效率低下的问题。
采用标准分类法和主题词表形成严格的知识组织体系,是特色库建设领域中的又一标准模式。但在实际建设过程中,部分较为特殊的专题库并没有合适主题词表、也没有现成的、标准的分类体系,这就需要建设者来根据自身特性,参照所属学科分类体系来编制相应的主题词表与专题分类表,以实现相对规范且符合用户习惯的分类组织体系和主题浏览与检索机制[6]60。
专题特色库的著录标引应该遵循有关国际标准和国家标准,元数据标引格式规范和一系列相关标准。例如《我国数字图书馆标准规范研究》中,该指标就是考察各类专题特色库建设过程中对相关标准的执行情况。它是进行著录标引质量控制的规范性文件,还是考察对标准规范的理解程度的依据。又如党史党建专题特色库的元数据著录规则在制定前,就要确定各类型核心元数据标准,对于不属于现行标准中的文献类型重新定义,包括著录的详简级次以及对特殊符号的处理等都要统筹兼顾[9]29。
3.数据、接口规范与技术标准。一个成功的特色库开发系统必须要具备统一的技术接口标准支撑。数据规范———包括:标识符、特色库集合等的命名规范、GBK编码、BIG5编码、Unicode字符集、国际标准的交换格式(IS02709)等。接口规范———包括:OAI/ODL组件接口协议;SAML标准;Portlet规范; 统一检索接口规范、ODLMAP协议规范、数字对象交换协议规范、安全通信规范、Openurl服务编码标准、openurl资源库编码标准、登录认证接口调用规范、后台管理接口调用规范等。技术规范———包括:Open URL开放链接标准、LDAP标准、WebServices组件封装规范、CNMARC标准、Dublin Core标准、支持Z39.50协议标准、XML文件格式规范,以及美国、日本、德国联合开发的s IN模式规范等[7]46。
在把握以上标准与规范的基础上,建议采取以下措施:一是使用超星公司研究的PDG文档资料扫描存储系统、清华同方的专业数据库制作管理系统,可兼容各高校图书馆普遍使用的c NMARC标准和Dublin Core标准,支持Z39.50协议标准和XML文件格式,以及美国、日本、德国联合开发的s IN模式。以实现标准、规范建库。二是特色库的数据要完整、准确、稳定。要能正确反映数据的真实性、及时性,减少各种失真和误差,争取最大程度地覆盖主题范围内的所有信息,连续、及时反映信息发展的轨迹,还要在特色库结构、数据著录规范和数据参照系的确立中充分论证,以维护系统数据规范的连续性和质量的稳定性。
4.数字加工与发布标准。采用标准化的开发设计是建设高质量特色库的前提与保障。经过近二十年发展,我国在专题特色库建设方面先后出台了一系列标准与规范。如中国高等教育文献保障系统CALIS就对数字加工与发布标准进行了规范。制定了特殊描述型元数据规范的通用规则,对古文献系列,论文系列,图书系列,音视频资料系列以及网络资源系列的著录都给出了加工及发布标准规范。其规定文字类型元数据必须采用TXT、DOC、XML等格式;图片数据采用JPG、GIF、PDF等格式;视频图像数据采用AVI、FLASH、RM等格式;音频数据采用WAV、MP3等格式。对于非通用格式的,应能实现与通用格式之间无损转换。这一系列标准的制定,为特色数据库的建设提供了依据,也为实现信息资源共享提供了基础保障[4]54。
5.各类检索标准的运用。检索标准的引用是一个讲究科学规范的过程,是最终能否实现用户需求的重要手段,数据库综合检索性能是否完善,各类检索手段是否快捷高效,检索入口是否实用,这些都是衡量特色库成功与否的重要标准。实践证明,实现全文检索的强大功能需支持结构化和非结构化数据的统一管理。在此基础上,能提供丰富的全文检索手段,包括支持多种检索运算符,支持各种逻辑组合检索、正文内容与外部特征的多字段复合检索、相关词扩展检索、二次检索、导航分类检索、西文字段支持前方一致检索等功能;能提供类似同义词典的检索功能,能实现较高的查准率和查全率;支持对检索结果多维排序;特别是能实现对多媒体类包括声、像、图、文等进行关联检索和排序功能。
在了解上述各项检索标准的基础上,结合建库实际情况进行规范选取,包括数据库系统选择、检索方式及功能、检索语言技术、检索记录、检索结果发布等。标准的本质是统一,它是对重复性事物和概念的统一规定;标准的任务是规范,它的调整对象是各种各样的客体。党史党建专题特色库建设开发无论是宏观上,还是微观上都必须以标准化和规范化原则为指导。只有标准化、规范化的特色库才具有生存和发展空间。它不仅能保证数据库的常规性能,更有利于实现真正意义上的网络信息资源共享,实现建库的最终目的。
摘要:信息化条件下,加强党的领导,就是要构建现代化网络党史党建阵地,为了更好地开展网络党史党建工作,开发具有良好规范与标准的党史党建数据库已是大势所趋的一项艰巨任务。对建设党史党建数据库的规范及标准这两个突出问题,可以从不同的角度,即宏观与微观的角度来作出较为系统的阐述。
【数据录入规范】推荐阅读:
数据库录入10-19
测土配方施肥数据管理系统数据录入处理10-22
数据库规范06-14
数据中心机房安全规范10-05
数据库规范化理论10-07
数据库模式规范化11-09
多媒体数据库建设规范09-14
英文录入08-14
信息录入09-02