数据规范(通用11篇)
数据规范 篇1
1 引言
我国是个农业大国,是自然灾害尤其是农业灾害发生频繁且灾情严重的国家之一。为加强“三农”工作,加快现代农业发展,近年来,党中央、国务院高度重视农业保险的发展,十六届三中全会、十七大、十七届三中全会、2004年以来连续9年的中央一号文件、国家“十一五”发展规划、国务院《关于保险业改革发展的若干意见》等都对发展农业保险提出了明确要求。在社会各界关注、财政补贴力度不断加大、农民逐步认可以及保险公司承保能力不断增强的有利形势下,我国农业保险取得了跨越式发展,保费收入、保障程度、保险覆盖面逐年增加,保费规模已上升至亚洲第一位,全球第二位,成为全球最重要、最活跃的农业保险市场之一。
目前,我国农业保险业务形成了种植业保险、养殖业保险、森林保险三大类。2014年,中央财政保费补贴试点已扩展到全国所有省(市、自治区),补贴险种包括玉米、水稻、小麦、大豆、棉花、花生、油菜、马铃薯、青稞、森林(商品林和公益林)、橡胶树、能繁母猪、奶牛、育肥猪、藏系牦牛和藏系羊、糖料作物等十多个主要粮棉油作物和部分地方特色险种。2014年,全国农业保险保费收入325.43亿元,共计提供风险保障16,320亿元,承保农作物面积11.76亿亩、森林面积27.98亿亩。目前,农业保险补偿已成为农民灾后恢复生产和灾区重建的重要资金来源,保险的风险保障和经济补偿作用日益凸显,在服务“三农”、支持社会主义新农村建设中发挥了积极作用。
在充分肯定我国农业保险成绩的同时,也应该清楚地看到,当前我国农业保险仍处于探索试验阶段,建立农业保险数据规范,有利于行业农业保险数据的采集、积累、整合,为农险数据分析利用打下坚实的基础,提高农业保险业务数据的共享和分析利用率,从而有针对性地制定相关农业保险政策、深度开发利用农险数据、实施农业保险监管等,推动农业保险的信息化水平,促进农业保险的科学发展。
2 农业保险数据标准化现状分析
(1)国内技术发展趋势与现状
在中国保监会大力推动下,全国金融标准化技术委员会保险分技术委员会(以下简称“保标委”)于2005年9月正式成立,我国保险业标准化工作由此进入快速发展时期。“十一五”期间,在保标委的大力推动下,保险业认真研究行业现状与发展趋势,同时充分借鉴国内外标准化建设经验,围绕保险业又好又快发展这一主题,按照“总体规划、突出重点、急用先行”的原则,明确目标、重点攻关、稳步推进,做了大量的基础性、创造性工作,已制定了若干符合中国保险业发展需要的数据标准。但我国目前还没有针对单一险种建立起一套规范、完整的数据标准,产品细分的数据定量分析、信息共享还远远不够。
(2)国内现有工作基础
《农业保险数据规范》由人保财险牵头制定。人保财险作为国有大型保险骨干企业,近年来始终把发展农业保险作为服务“三农”、支持社会主义新农村建设的着力点,积极推动农业保险又快又好发展。2007年至2014年人保财险连续8年引领农险市场,市场份额均在50%以上。2014年,人保财险农业保险保费收入达171.45亿元,市场份额52.68%,保费规模已跃居全球第三、亚洲第一,仅次于美国农村社区保险公司(RCIS)和美国雨雹农作物保险公司(R&H,LLC)。目前,人保财险已开发各类农业保险产品300余个,业务范围基本覆盖了所有省(区、市),充分发挥了保险业参与社会主义新农村建设的主渠道作用,彰显了人保财险作为中国内地最大非寿险公司的市场引领地位。
人保财险在保险承保、理赔、产品研发、业务系统开发和再保险等核心技术领域处于国内非寿险业领先水平,在长期的业务实践中积累了大量的数据管理和业务管理经验,尤其是在农业保险领域具有领先的服务能力和技术优势。一方面,人保财险总部拥有一批具有丰富经验的农业保险、保险精算、数据统计分析与应用等领域的专业技术人员,曾独立或参与制定《车辆保险数据交换标准》《保险基础数据元目录》《保险基础数据模型》《运行维护规范》等多个行业标准,农业保险数据规范的制定也将充分吸收以往经验。另一方面,人保财险拥有遍布全国的机构网点,形成了强大的保险销售和服务网络,可为数据规范的应用和推广提供坚实的实践基础,为投保客户提供专业、优质、高效的承保、理赔等保险服务。
(3)国际单一险种标准化现状
美国是目前世界上农业保险市场最为成熟发达的国家。以美国为例,美国政府和保险公司长期以来高度重视农险业务基础数据的采集和管理工作,由相关政府部门统一管理产品开发和定价,有长时间序列的数据积累。据了解,美国目前尚未建立国家层面专门的农险行业数据规范标准,沿用保险行业的总体标准,只是通过出台《农作物保险手册》《再保险标准协议》等一系列基础性的农险行业业务规范文件,对业务流程、投保数据等内容就进行了明确规定,这在一定程度上也很好地起到了数据管理规范的作用。因此,《农业保险数据规范》作为我国农险领域专业的险种数据规范,不仅是我国在农业保险领域探索专业的险种数据规范方面的一个尝试,也是在国际领域的一个创新性尝试,具有很好的现实意义。
3 农业保险数据规范框架研究
3.1 农业保险数据规范框架
农业保险数据规范框架研究的整体思路,依赖于对农业保险核心业务流程的梳理与整合,同时结合该规范所能产生的经济效益与社会效益,力求做到在满足监管需要、实现整体数据分析的同时,降低公司管理成本,提高经营效率。
农业保险数据规范框架将定义以下内容:农业保险数据元标准、农业保险代码标准及农业保险采集标准。涉及农业保险领域承保、理赔及再保险三个主要业务环节,适用于农业保险领域相关报表的规范、相关系统设计、数据库开发和数据交换格式的设计等业务活动以及行业监管部门、财产保险公司、农业保险公司、再保险公司、经纪公司,以及其他政府部门亦可参考。本文确定的农业保险数据规范框架(如图1所示)。
3.2 农业保险数据规范在保险标准化体系中与其他标准的关系
在保险标准化体系中,由于农业保险与其他财产险相比特异性较大,原保险基础数据元以及保险业务代码集并未涉及农险部分,农业保险数据规范是保险标准化体系向单一产品线精细化进深的重要组成部分。
此次规范的制定结合农业保险的业务特点,归纳整理农业保险业务专用数据元、代码及采集标准。同时为了保证农业保险业务体系的完整性,引用了部分原保险基础数据元通用部分数据元。因此,在整个保险标准化体系机构中,农业保险数据规范位于保险术语、基础数据元等基础标准化之上。农业保险数据规范与其他标准关系如图2所示。
3.3 农业保险数据规范框架内容
(1)农业保险数据元标准
根据国标GB/T18391《信息技术数据元的规范与标准化》中对数据元的定义,制作农业保险数据元采集表。整体结构上,根据其所在业务环节,分为标的数据元、客户数据元、承保数据元、理赔数据元及再保数据元5个部分,每个数据元集合的数据元将涵盖被描述对象在农业保险业务流程中的信息化特点。
具体数据元在抽取的过程中,以农业保险业务流程和功能分析为基础,通过建模分析、确立重点对象,通过对象类的特性以及相关表示的分析、归纳和整理,提出所需的数据元。同时结合“自下而上”的数据元提取方法,对各主体数据库等相关数据资源的数据在分析、梳理基础上,归纳整理出各自体系的数据元。对初步收集的准数据元进行反复的筛选、归并,按照各分类分别再加工,综合整理,形成农业保险数据元集。每个数据元实体由7个属性进行详细描述,分别为中文名称、英文名称、同义词、定义、表示、值域、备注。
数据元分类及整体结构如图3所示。
(2)农业保险代码标准
在上述数据元整理的基础上,对于值域可穷尽并可以进行标准化编码的数据元,结合相关标准对其进行分析,反复地比较、筛选、归并,依据代码标准编写原则形成农业保险代码标准。
每个代码标准实体由5个属性进行详细描述,分别为中文名称、定义、表示、编码方式、备注。
(3)农业保险数据采集标准
参考《农业保险统计制度》及保监会农业数据上报要求等,以保险数据基础模型、系统数据结构为原型,对农业保险业务经营管理活动中涉及的主要数据对象进行整理和汇总。从现有报表和相关资料中收集各种数据,数据来源涉及承保、理赔、再保等主要业务环节,覆盖了农业保险活动业务主要流程,定义农险主题区域的数据采集标准。
其中,承保环节包括农业保险承保信息表、农业保险批单信息表;标的部分包括农业保险标的信息表、养殖险标的信息表、种植险标的信息表、林木险标的信息表、农业保险种植/养殖场信息表;理赔环节包括农业保险立案信息表、农业保险赔案信息表;再保环节包括农业再保险合约业务信息表、农业再保险临分业务信息表。
4 问题及建议
自2007年政策性农业保险试点开办以来,除人保财险和中华保险两家综合性保险公司外,目前已经有22家保险公司不同程度地参与农业保险经营。但是由于长期缺乏专业领域制度,加之产品开发时间不同、公司管理流程不同、体制不同等原因,造成各农业保险主体产品特性、业务流程差异大,难以进行深入的数据分析。因此,农业保险数据规范在建立过程中,既要充分考虑农业保险发展的历史沿革,又要考虑农业保险未来的发展,兼顾实用性与前瞻性,方可全面真实地反映农业保险经营情况,建立保险行业第一个专业的险种数据规范。
参考文献
[1]裴光,庹国柱.农业保险统计制度研究[M].北京:中国财政经济出版社,2009.
[2]JR/T 0033—2007,保险基础数据元目录[S].
[3]JR/T0048—2009,保险基础数据模型[S].
[4]JR/T 0034—2007,保险业务代码集[S].
[5]GB/T 15191-2010,贸易数据交换贸易数据元且录数据元[S].
[6]GB/T 18391.4-2009,信息技术元数据注册系统(MDR)第4部分:数据定义的形成[S].
数据规范 篇2
一、运抵报告和分拨、疏港分流货物、物品运抵报告只;
1、申报报文;1)空运:集装箱(器)编号、集装箱(器)尺寸和类;2)水运:集装箱货物和散杂货物填写不同的数据段,;
2、删除报文;1)空运:只填写申报地海关代码、航班航次号、总提;2)水运:只填写申报地海关代码、航班航次号、运输;
二、原始舱单、预配舱单有主要数据申报、其他数据申;
1、数
中国海关舱单数据填制规范
一、运抵报告和分拨、疏港分流货物、物品运抵报告只有申报和删除报文,不提供修改报文
1、申报报文
1)空运:集装箱(器)编号、集装箱(器)尺寸和类型、重箱或者空箱标识代码、封志号码,类型和施加封志人数据段不填写;
2)水运:集装箱货物和散杂货物填写不同的数据段,集装箱货物只填写集装箱信息数据段,散杂货只填写提单和货物信息数据段。
2、删除报文
1)空运:只填写申报地海关代码、航班航次号、总提运单号、分提运单号(条件)、其余数据项不填;
2)水运:只填写申报地海关代码、航班航次号、运输工具代码,集装箱货物只填写集装箱号,散杂货只填写总提运单号、分提运单号(条件),其余数据项不填写。
二、原始舱单、预配舱单有主要数据申报、其他数据申报、增加、修改和删除报文
1、数据项之间存在关联关系的,其中一个数据项填写,另外的数据项必须也要填写。
? 件数,包装
? 通讯方式类别代码,通讯方式号码
? 托运货物价值,金额类型代码
? 前一海关单证号、前一海关单证类型代码
? 收货人具体联系人名称、收货人联系号码、通讯方式类别代码
? 通知人名称,通知人地址(街道,邮箱)? 中间承运人标识,中间承运人联系号码,通讯方式类别代码
? 危险品联系人姓名,危险品联系人联系号码,通讯方式类别代码
2、修改报文
空运:舱单传输人、航班航次号、总运单号、更改原因代码、分运单号(条件),托运货物序号(条件)必填:其中,运输方式代码,运输工具代码、承运人货物分批到/发货标识和运输工具名称不能修改。
水运:舱单传输人、航班航次号、运输工具代码、更改原因代码、分运单号(条件),托运货物序号(条件)和集装箱号(条件)必填。其中运输方式代码、运输工具名称、集装箱号不能修改。
3、删除报文
空运:舱单传输人、航班航次号、更改原因代码、总提运单号和分提运单号(条件)必填,其余不填写。
水运:舱单传输人名称、航班航次号、运输工具代码、总提单号、变更原因代码、分单号(条件)必填,其余不填写。
4、更改原因代码只有在修改和删除报文中填写,其他不填写。
5、暂时进出空集装箱传输
重箱与暂时进出空集装箱不得在同一提单号项下向海关传输电子数据。进出空集装箱提单中的托运货物序号、货物包装种类、货物件数、货物简要描述、货物描述补充信息、货物毛重、危险品编号、唛头、海关手续代码、海关税则编号、原产地代码、唯一托运编号不填。
三、分拨货物、物品申请数据项和疏港分流申请只有申报和删除报文,没有修改报文
1、申报报文
分流分拨申请报文以总提(运)单为单位,不填报集装箱信息段。
2、删除报文
空运:航次航班号、总提单号必填,其余不填。
水运:运输工具代码、航班航次号、总提单号必填,其余不填。
四、理货报告只有申报和删除报文,没有修改报文 ? 集装箱货物和散杂货物填写不同的数据段,集装箱货物只填写集装箱信息和残损信息数据段,散杂货只填写提单信息数据段。
? 残损类型代码和残损范围代码之间存在关联关系,其
中一个数据项填写,另外的数据项必须也要填写。
五、装载舱单只有申报和删除报文,没有修改报文;装载舱单以总提(运)单为单位,向海关传输数据。
六、出口落装改配申请
1、水运方式:集装箱信息数据段没有发生变更的,集装箱信息数据段不需填写。
2、空运方式:货物信息数据段没有发生变更的,货物信息数据段不需填写。
3、总提运单号、集装箱信息数据段和货物信息数据段没有发生变更的,新总提运单号数据项不需填写。
4、总提运单号、集装箱信息数据段和货物信息数据段三者有一项发生变更的,新总提运单号数据项(有分提运单号的也要填写)需填写。
5、分提运单号发生变更的,新分提运单号需填写。
七、国际转运准单中进、出境总(分)提运单号、货物信息数据段、集装箱编号均需填写。
八、在传输原始舱单、预配舱单时,未在港口代码表(UN009)中列名的境外港口,其编码规则为该港口所在的国家代码(2位)+999;境内港口(CN003)由港口所属的直属海关负责维护,其编码规则为CN+3位英文大写缩写,且在全国范围不得重复。
九、所有填制项中不得出现“<”、“&”符号,如有实际需要,请填写对应的转义符“<”、“&”。
十、报文中不允许出现空节点,如
十一、舱单报文报文头定义说明
1、报文头示例
2、节点说明
MessageID:报文编号,由企业自定义,要求与其它企业同类型报文不得重复,最大长度为64位,由字母、数字、特定符号组成,并不得出现除“-”、“_”“/”等以外的特殊符号,且符号不得作为报文编号的开头与结尾;
FunctionCode:功能代码,可参照《中国海关舱单数据模型1.2版本(代码集)》
三亿文库3y.uu456.com包含各类专业文献、中学教育、各类资格考试、外语学习资料、幼儿教育、小学教育、高等教育、1420091120报文数据项填制规范(终稿)等内容。
其中,原始舱单、预配舱单主要数据申报使用代码“9;MessageType:报文类型代码,请参照《中;编码规则:MT(Manifest)+1位业务类型;水号;暂时进出境集装箱报文编码规则为:MT(Manif;SenderID:发送方代码,使用企业在海关备案;ReceiverID:接受方代码,填写接收报文的;SendTime:报文发送时间,采用精确到毫秒的;Ve
其中,原始舱单、预配舱单主要数据申报使用代码“9”,其他数据申报使用代码“0”,不使用代码“2”。
MessageType:报文类型代码,请参照《中国海关进出境舱单报文类型编码表》
编码规则:MT(Manifest)+1位业务类型代码+1位运输方式代码(1:水运;2:空运;3:公路;4:铁路)+2位流 6 水号
暂时进出境集装箱报文编码规则为:MT(Manifest)+TE(TransportEquipment)+2位流水号
SenderID:发送方代码,使用企业在海关备案的代码,备案规则为:4位关区代码+9位企业组织机构代码+50位自定义扩展字符,由字母和数字组成,并不得出现除“-”、“_”“/”、“@”、“.”、“*”等以外的特殊字符,且符号不得作为结尾。
ReceiverID:接受方代码,填写接收报文的4位关区号。8
SendTime:报文发送时间,采用精确到毫秒的时间格式,格式为CCYYMMDDHHmmssfff。
Version:报文版本号,目前版本为1.0。
SRN:0001 9
首个云数据中心建设规范发布 篇3
云计算作为未来新一代信息技术与IT应用方式变革的核心、我国战略性新兴产业发展的重点领域,已经成为当前信息技术产业发展和应用创新的热点。大规模、高等级、服务化、节能型的云计算数据中心即是云计算技术的典型应用实践,更是新一代IT应用与云计算服务的关键支撑平台,因此成为云计算产业发展的排头兵,掀起了一场云计算数据中心建设与传统数据中心云化的热潮,为云计算产业发展提供了良好的基础设施保障。
云计算推动数据中心建设呈现“绿色改造、云化加速、产业融合、模块建设”四大特点
据不完全统计,目前超过20个城市将云计算作为重点发展产业,相继出台了产业发展规划、行动计划,鼓励建设示范试点工程,制定了土地、税收、资金等方面的优惠政策。在云计算的驱动下,数据中心大集中的发展趋势将进一步加快,第三方数据中心市场将快速发展,数据中心产业化发展成为大势所趋。目前数据中心建设呈现出四大特点:业务发展驱动传统数据中心加入绿色改造与重建行列;新技术应用推动下一代数据中心云化进程;产业融合化趋势明显,企业战略合作和联盟更加紧密;模块化数据中心建设模式在行业内迅速推广。
云计算促进数据中心发展呈现“区域布局集聚化、建设集约化、应用虚拟化”三大趋势
我国大国大市场的优势明显,无论人口基数,还是网民规模都位居全球第一,随着两化融合、三网融合、物联网等应用的纵深推进,数据中心需求潜在巨大。随着各地数据中心建设的热潮,数据中心的发展也正在发生变化,呈现三大趋势:从布局上,总体向富能源、高纬度地区转移;从云环境下对数据中心的需求上,呈现建设集约化、管理智能化、平台开放化、建设与运营服务标准化趋势;从数据中心应用上,数据中心网络虚拟化将成重点,自动化、智能化管理将成为数据中心高效运行的支撑,数据中心绿色节能技术应用将更加深入。
云计算数据中心建设面临“选址有风险、设计不规范、应用不充分、扩展难实现”等巨大挑战
数据中心由各种软硬件设备组成,由于这些设备所产生的能耗巨大,管理和维护复杂,使得数据中心在能源效率、降低成本、灾难恢复、业务连续性、空间拓展、智能管理等方面面临重大挑战。同时,由于中国云计算数据中心建设缺乏相关标准和规范,造成云计算数据中心的建设出现定位不清晰、规模评估不恰当、选址有风险、设计不规范、应用不充分、扩展难实现、能效标准低、运维成本高等问题。云计算数据中心的建设亟待引导和规范,这是数据中心得以健康发展,形成规模化、产业集群化发展的前提。
云计算数据中心建设亟待从“整体规划、基础设施、基础架构”等关键环节进行规范
绿色数据中心能效测评规范 篇4
关键词:数据中心,能效测评规范,综合能效比EER,吞吐量
0 引言
“绿色”一词如今已成为世界性的流行词, 建设绿色节能的世界环境更是在全球范围内达成了广泛的共识。政府也更加重视绿色节能的问题, 在国内的各个行业都大力推行了绿色节能的产业方针。长久以来, 耗电量巨大的数据中心一直都是政府及企业首席信息主管们的心头之痛。根据美国节能联盟 (Alliance to Save Energy) 资料显示, 以目前的增长速度继续下去, 如果数据中心的能效保持不变, 那么互联网数据中心的电费和用电需求将在不到10年的时间内翻倍, 如果按照这样的速度发展下去, 越来越多的企业将面临“买得起, 用不起”的尴尬境地。根据伯克利构架国家实验室的报告显示, 在2005年到2010年之间电费的支出差不多增长了一倍。而且由于全球“能源危机”的呼声愈演愈烈, 能源也在变得更为稀缺和昂贵, 不断攀升的能源成本正在逐渐成为企业的巨大负担, 如何有效降低能耗支出, 已经成为政府、企业首席信息主管们急需解决的问题。在如此严峻的形势下, 打造“绿色数据中心中心 (以下简称IDC) ”已迫在眉睫。
1 能耗性能比测试与计算方法
1.1 IDC机房交换机/路由器
1.1.1 综合能效比计算方法
路由器与交换机产品设备的能效受设备的配置、业务流量大小、设备的应用环境等因素的影响比较大, 因此采用产品综合能效比的方法评价路由、交换机的设备能效水平, 充分考虑到产品的配置及流量的影响。
综合能效比计算方法如下:
IDC路由器、交换机能效比计算中n参数的选取说明:
n参数据的选取:IDC应用为路由器的一种应用场景, 因此将产品综合能效评价方法中的配置选为一种 (n=1) , 选择一种网络中典型应用的设备模型作为此类设备的能效考核标准;综合功耗P的计算方法:
对于给定的一种配置模型, 设备的综合功耗的计算方法如下式所示:
a, b, c为系统在不同负荷下的为u1, u2, u3时的权重系数。
其中:
u1%、u2%、u3%分别为100%、30%、0%;
a、b、c分别为0.1, 0.7, 0.2。
Pu%测试在64字节下进行。
设备吞吐量T的计算方法:
对于给定的一种设备配置模型, T为被测设备在IMIX模型下能够达到的吞吐量, 依照NLANR对互联网真实的统计分析得出的模型进行测试。在NLANR推荐的IMIX分布模型中, 需要将长度为64字节、594字节和1518字节的数据包混合在一起发送给被测设备。这三类数据包数量混合的比例依次为64字节:594字节:1518字节=7:4:1。
其中:
T64、T594、T1518分别是被测设备分别在帧长64字节、594字节、1518字节下的吞吐量。
T64、T594、T1518按以下公式的定义计算得出:
其中:
Rx1:被测设备每秒传输处理的最大上行的数据速率。
Rx2:被测设备每秒传输处理的最大下行的数据速率。
X:数据包长度
Y:包开销长度
1.1.2 测试设备配置要求
(1) 对于机架式设备, 每种类型端口 (10/100M、GE、10GE) 都需要选择其中包转发率最大的业务单板进行测试, 主控板也要选择包转发率最大的。
(2) 在不影响设备的基本性能和功能的前提下, 在测试中可以去掉冗余的可插拔模块或让某些模块停止工作, 包括备用电源、备用主控板等。
(3) 所有端口要求均处于工作状态。
(4) 对于同时支持AC和DC电源的设备, 可任意选择使用哪种电源。
(5) 对于POE设备, 不使能POE供电功能。
(6) 网线采用标准5m网线。
(7) 被测端口使用本规范推荐的光模块。
(8) 测定过程中不允许改变被测设备的硬件配置, 以及通过命令关闭相关功能。
1.2 服务器及其他计算机设备
1.2.1 机架式服务器
机架式服务器的能耗比测试采用SPECPower的测试方法。
服务器配置
操作系统:企业版Windows2003 64bit R2+SP2
或企业版Windows2008 64bit+SP1
测试软件:SPECPower_ssj2008
风扇的配置:常温下的自然调速。
电源的配置:根据实际应用原则, 若有交流和直流两种电源, 应都进行测试, 若有冗余设计, 电源应备份卸载与操作系统无关的程序。
该组网包括被测服务器系统SUT、控制和采集系统CCS、功耗分析器和温度传感器。控制和采集系统主要用来监视及调控被测试系统的负载水平和记录测试数据;功率计则用于测试被测服务器的功耗, 记录测试过程中的所有采样数据;温度传感器则记录不同负载水平下的测试环境温度。
1.2.2 刀片式服务器
刀片服务器的测试环境与机架服务器相同。
2 设备管理要求
2.1 基本要求
系统能提供系统各单元、模块、运行状态、温度、功耗等信息的监控和告警功能, 便于系统维护。
设备采用风扇调速, 风扇转速随温度变化散热效率, 风扇调速优选PWM调速, 降低系统噪音, 提高风扇寿命。
设备支持机框或单板级的功耗检测, 机框级的功耗检测误差<3%。
设备支持分级节能控制模式, 根据不同的业务特性, 通过用户配置能够实现设备节能。
支持风扇的智能调速, 根据实际单板温度进行风扇转速调节, 实现节能和降噪。
对于AC/DC供电的系统, 设备支持功率管理, 能够根据设备单板负载, 实现模块关闭等功率调节手段, 支持节能。
支持单板的掉电节能控制, 对于业务没有开通的业务单板, 支持远程的上、下电控制, 从而支持节能。
2.2 划分吞吐量等级的测试方法
一些可以提供最大吞吐量下能耗结果的基准测试, 在原理上也支持驱动系统工作在不同的负荷等级。由于不同工作负荷等级下服务器设备的能耗会不同, 在这类基准测试中, 应该通过允许通过驱动程序令系统工作在零到最大吞吐量之间的若干中间点上, 来增加测试的准确性。
基于吞吐量的基准测试需要有以下几个步骤:
(1) 系统做好测试准备;
(2) 基准工作程序启动环境监测;
(3) 有必要的话, 启动初始化校验程序来确定最大吞吐量;
(4) 计算中间测试目标点;
(5) 重复操作:
(1) 工作程序启动基准测试工作在吞吐量X处。X的初始值为最高目标吞吐量, 每次操作都减少一定的量直到零吞吐量点, 即“动态闲置 (Active-idle) ”点;
(2) 等待30秒 (或者基准测试所需的同步和达到稳态的时间) ;
(3) 工作程序启动能耗测量;
(4) 工作程序收集能耗和性能的测试数据;
(5) 工作程序结束测试数据的采集;
(6) 等待30秒 (或者基准测试所需的同步时间) ;
(7) 基准部分完成;
(8) 工作程序至少等待10秒 (或者按照同步的需求) ;
(6) 工作程序停止环境监测;
(7) 工作程序对能耗性能数据进行后处理。
2.3 确定目标最大吞吐量
最大吞吐量是决定吞吐量步长的依据, 因此确定最大吞吐量是一个关键需求。当然, 原始的基准测试一般也将确定最大吞吐量作为在运行步骤的一部分, 但可测能耗的基准测试是在原始的基准测试的改进, 所得到的结果也可能会与先前的基准有所不同。有多种方法可以测最大吞吐量。只要保证基准的测试与测试之间使用同一种方法, 每一个方法都是可用的。有如下的几种方法可供选择:
(1) 启动基准测试以高负荷运行一次, 将测试数据作为最大吞吐量;
(2) 启动基准测试高负荷运行三次, 将第二次和第三次的平均值作为最大吞吐量。或者是启动基准测试高负荷运行多次, 以最后两次的测试结果取平均值作为最大吞吐量;
(3) 高负荷运行基准测试多次。当工作程序认为本次测试结果低于上次时, 再次运行基准测试, 并且计算最后三次的平均值作为最大吞吐量;
(4) 将最大吞吐量设置为任意值。
尽管以上的任意一种方法都可以使用, 仍然建议基准驱动程序采用上述方法的前三种用于正式的基准测试。这三种方法都可用自动化的方法来确定目标最大吞吐量。当然, 基准驱动程序也可以支持另一些算法, 包括之前提到的最后一种方法, 这样可以在工程或学术需要的情况下, 通过多次设定相同的最大吞吐量来获得可控和可重复的测试。
3 能源之星标准与测试方式
能源之星计划于1992年由美国环保署 (EPA) 启动, 目的是为了降低能源消耗及减少发电厂所排放的温室效应气体。此计划并不具强迫性, 自发配合此计划的厂商, 就可以在其合格产品上贴上能源之星的标签。最早配合此计划的产品主要是计算机等信息电器, 之后逐渐延伸到电机、办公室设备、照明、家电等等。能源效与电源管准则 (Energy Efficiency and Power Management) 只有符合以下所之要求事项的计算机, 才具有能源之星资格。
3.1 能源之星对设备的要求
第一期要求事项 (Tier 1 Requirements) -2007年7月20日开始生效。
电源供应器的能源效要求事项:
使用在计算机的内部电源供应器:在评定输出 (rated output) 的20%、50%与100%时之效至少80%, 且在100%评定输出时的电因数 (Power Factor) ≥0.9。
使用在计算机的外接式电源供应器:必须具备能源之星资格或是符合能源之星单一电压交流-交流与交流-直流外接式电源供应器之要求事项中有关无负载与操作模式时之能源效规定, 有关能源之星规格标准与合格产品清单, 可得www.energystar.gov/powersupplies网页。
3.2 操作模式能源效要求事项
桌面计算机项目的待机准则 (Idle Criteria) :针对测定待机态用电量之目的, 桌面计算机 (包括整合式计算机、桌上型衍生服务器与游戏主机) 必须要具备以下所定义之A、B、C类别资格。
A类 (Category A) :所有符合B类或C类定义的桌面计算机, 在考量能源之星资格准则时将被视为是A类产品。
B类 (Category B) :要取得B类产品之资格, 桌面计算机必须具备多核心处器或是具备超过一个个别处器, 且最少具有1G的系统内存。
数据中心机房管理制度规范 篇5
(试行)
第一条 定期检查、整理设备线路,检查硬件运行状态。定期查看软硬件运行日志记录,并做好数据和配置备份。
第二条 严禁在设备上随意安装、拆卸硬件或更改设备连线,严禁随意进行硬件安装。
第三条 严禁在机房设备上进行试验性质或与工作无关的任何操作。
第四条 对机房设备进行位置、配置调整前须提交申请,经信息中心同意后,由专业技术人员进行操作,并做好详细记录。
第五条 对重要设备配置更改前,须做好数据备份和备品备件准备工作,并在专用测试服务器上验证通过后进行操作。
第六条 机房内服务器不得擅自安装与系统无关的软件;软件安装前须对安装文件进行病毒检测,发现病毒后及时清理,并做好记录;不得擅自在服务器上使用U盘、外存储设备;定期对服务器系统的杀毒软件进行升级;每月对服务器进行安全扫描和漏洞修补,并做好记录。
第七条 根据实际情况,实时调整机房内相关安全设备的防范策略,并做好记录。第八条 每季度对机房精密空调室外机组和过滤网进行一次冲洗,每年对精密空调全部电器控制系统和制冷、除湿及进出水道进行一次全面检查。
第九条 定期检查机房供配电、消防设备运行状态,确保其正常运行。
机房安全管理制度
(试行)
第一条 机房钥匙、门禁卡配发由信息中心管理,不得私自配制或借给他人使用。来访人员因工作需要进入机房须经信息中心同意后由机房管理人员陪同进入,并做好记录。任何人未经许可,严禁在机房内随意触摸设备、拍照或录像。
第二条 每日定期检查机房内烟感、温感、声光报警器、安全出口指示标志、气体灭火设备及消防控制线路,确保其运行正常。
第三条 机房内严禁存放和使用易燃易爆物品,严禁吸烟和携带使用明火,严禁在消防设备周围堆放杂物。
第四条 气体消防系统灭火设备应设专人管理(消防运维单位),任何人不得擅自操作、更改消防系统工作状态、设备位置。每月定期进行钢瓶间设备巡检,发现过期或低压失效的消防设备,应及时进行维护更换。
第五条 每季度定期检查机房配电柜、UPS设备、精密空调的运行状况,监测输入输出电流、电压是否正常、有无异常噪音及声、光报警。监控电池间运行环境。
第六条 每日定期对机房的设备和线路进行安全检查,发现故障、老化、破损、绝缘不良等不安全因素,必须及时报修,并做好记录备案。
第七条 严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭架各种供电线路。
第八条 防雷接地系统按国家有关部门的管理要求,每年由防雷中心对机房防雷系统进行一次全面的安全技术检测。
机房值班管理制度
(试行)
第一条 机房执行7*24小时人员值班。白班8:00-20:00,夜班20:00-次日8:00,值班人员须提前30分钟到达工作岗位完成工作交接。
第二条 机房值班人员负责全面保障机房安全,防火防盗,确保设备正常运行,防止事故的发生。
第三条 交接班时须进行巡检。巡检范围包括:机房监控区、设备区、供配电区、电池室、气体消防钢瓶间等;巡检内容包括:服务器、网络、环境、电源、精密空调、消防系统等,并做好巡检记录。发现异常情况立即按照相关故障处理流程进行处理,同时认真填写《机房值班日志》,并及时报信息中心领导。
第四条 值班人员必须熟悉掌握所有设备的工作原理、操作方法,并熟悉应急预案、应急流程及应急措施。
第五条 任何人不得擅自更改设备及系统配置,如需更改配置,须经信息中心批准,并记录存档。
第六条 工作期间须配戴工作牌。来访人员经信息中心许可后,由值班人员陪同方可进入机房,并做好来访记录。
第七条 妥善保管机房钥匙、门禁卡。严禁将密码、文档资料、资产信息等泄露给无关人员。
第八条 值班期间不得擅离岗位,不得从事与工作无关的事情。
第九条 中心带班人员须每日进入机房进行巡查,对当日故障事件负责督导处理,并检查当天值班情况。
第十条 保持机房内设备设施整齐、洁净。严禁携带与工作无关的物品进入机房和监控室,严禁在机房内饮食、抽烟。
数据规范 篇6
关键词:清水江文书;描述元数据;著录规范
中图分类号:G250.74
文献标识码:A
文章编号:1674-621X(2015)03-0059-04
清水江文书是流传于黔东南清水江流域苗族侗族地区特有的古代乡村文献,数量巨大,据有关专家保守估计散藏在乡村村民家中的清水江文书约30万件。对清水江文书这类多以纸质单件留存的古文献,最有效的保护方式是进行数字化保存。清水江文书数字化,需要建立系列标准和规范。目前有多家收藏单位分别在建设清水江文书数据库,如不规范建设,会导致开发的数据库不能兼容和正常使用,并会带来管理的新问题,还会造成人力和物力的大量浪费。清水江文书整理与开发研究团队为了建立一个通用并可实现异构多级管理的数据库,特探讨清水江文书数据库建设的系列标准,其中包括清水江文书数字对象描述元数据标准。清水江文书数字对象描述元数据,是指用来描述或标识清水江文书信息资源的数据,用于描述或识别清水江文书内容和外观特征,对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体位置与获取方式、制作与利用方法等。元数据标准是数据库建设的重要标准。为了满足我国数字图书馆建设规范的要求,清水江文书元数据设计特参考我国数字图书馆规范建设研究项目“专门数字对象元数据标准规范”系列成果,并结合清水江文书的特有属性,探讨和研究制定清水江文书数字对象描述元数据标准和著录规范。
一、清水江文书描述元数据基本框架的设定
作为一个数字对象描述元数据的设定,首先要明确其描述的对象和著录单位。本标准描述的对象即是清水江文书。清水江文书产生于明清至民国,主要包括卖契、财产析分合同、佃契、典契、借契、拨约字、宗族与婚姻文书、政治与法律文书、土地管理与赋税文书、军事与治安文书、民间信仰习俗、教育与科考、山场座簿与田土清册以及杂类。清水江文书的著录单位为每一份契约合同或文告。其数据信息的描述元数据应由核心元素、资源类型元素、个别元素三部分组成。
我国数字图书馆建设标准的数字对象描述复用Dublin Core的15个元素做为核心元素集,清水江文书描述元数据复用7个核心元素(Core ele-ment),它们分别是:题名、主要责任方式、其他责任方式、日期、出版者、附注、主题,由于清水江文书的特殊性,在复用这7个核心元数据时,变异调整为:文书题名,文书主体责任人,文书其他责任人,契约日期或文告时间,文告发布者,附注为对特定文书信息的附注,主题为文书类型的关键词。
清水江文书类型核心元素(Local Core ele-ment)参照我国数字图书馆建设标准设计为:载体形态,即为文书的物质载体、色彩、尺寸;收藏历史,包括获得方式和印记;馆藏信息。
个别元素作为清水江文书中的扩展信息进行记录。
二、清水江文书描述元数据设置及著录定义
1.题名
名称:题名;标签:Title;定义:契约文书的正题名及说明;术语类型:元素;元素修饰词:自拟题名、其他题名。
(1)自拟题名(文书签订时间+文书主体+文书类别)。名称:自拟题名;标签:Self;定义:文书不具有题名时,标引人员根据具体文书自行拟定的题名;术语类型:元素修饰;修饰:题名;注释:从文中拟定题名,按照(文书制定时间+契约文书主体+文书类别)拟定。
(2)其他题名。名称:其他题名;标签:Other;定义:清水江文书题名的其他替代写法或规范名称之外的其他名称;术语类型:元素修饰词;修饰:题名。
2.主要责任者
名称:主要责任者;标签:Creator;定义:契约主体人(卖方,其次买方)、官府文告发布者、文书责任实体;术语类型:元素;元素修饰词:责任者说明、责任方式。
3.其他责任者
名称:其他责任者;标签:Contributor;定义:契约签署的中人、凭中、担保人;术语类型:元素;元素修饰词:责任者说明、责任方式。
4.日期
名称:日期;标签:Date;定义:立契时间或文告时间;术语类型:元素。
(1)年号纪年。名称:年号纪年;标签:LunarDate;定义:明清皇帝年号纪年,且年号纪年前加上朝代:如“清”;术语类型:编码体系修饰词;修饰:日期。
(2)公元纪年。名称:公元纪年;标签:Grego-rian Calendar Date;定义:以耶稣诞生元年的太阳历纪年法;注释:国际通用的纪年法;修饰:日期。
5.出版者
名称:出版者;标簦:Publisher;定义:契约文告的发布者或发布主体;术语类型:元素。
6.附注
名称:附注;标签:Description;定义:契约文书中需要说明的问题。
(1)缺字附注。名称:缺字附注;标签:Description Quezi;定义:记录和描述扫描的契约文书缺少的文字描述;术语类型:元素修饰词;修饰:附注项。
(2)责任者附注。名称:责任者附注;标签:Description Creator;定义:对签约责任人或公告的实体需要进行的说明;术语类型:元素修饰词;修饰:附注项。
(3)相关文献附注。名称:相关文献附注;标签:Description Relation;定义:与契约文书有关联的文献说明。
7.关键词
名称:关键词;标签:Keyword;定义:不同种类的契约、文书;术语类型:元素。
8.载体形体
nlc202309011918
名称:载体形态;标签:Physical Description;定义:契约文书的载体形态;术语类型:元素;注释:此项著录契约文书的载体、色彩、开本或规格。
9.收藏历史
名称:收藏历史;标签:Collection History;定义:清水江文书的流传历史以及相关的内容;
注释:此项著录契约文书的收藏沿革、获得方式、购买价格等。
10.馆藏信息
名称:馆藏信息;标签:Location;定义:资源所属机构或提供资源的机构信息;注释:该项著录契约文书的收藏机构,如契约文书典藏号。
三、清水江文书描述元数据著录规范
为了准确地描述清水江文书,课题研究组拟定了《清水江文书数字对象描述元数据及著录规范》,其规范注释为:
1.清水汪文书题名无数据著录规范
清水江文书题名元数据是核心元素中的第一个。清水江文书的题名著录原则为:文书如有题名原则上照录;文书没有题名时,拟定题名。题名拟定的规范按照“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则拟定。其中立契人为契约的主体,契约的种类按契约分类标准:卖契、佃契、典契等拟定。契约文书签订时间,按原契或文告时间照录。以下面的契约为例。
契1.立卖鱼塘人橱朝旺、朝举兄弟二人,夸因家下要钱使用,无从得处,自愿将到庙皆祖遗鱼塘二大房分落,外一边分为五股,自己出卖问到本房杨含珍兄弟二人承买为业,五股卖自己面分一股一半,议定价钱伍佰文正,其钱亲手领明,并无包卖他人分寸在内,自卖之后不得异言,如有不清,自前理落。今欲有凭,立有卖字为据。
亲笔 杨朝旺
凭中 龙广书
道光二十九年十一月十五日立卖
这份契约没有题名,按“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则,拟定的题名为“道光二十九年十一月十五日杨朝旺、杨朝举立卖鱼塘契”
2.主要责任方式元数椐著录规范
立契人或文告人是契约文书的主要责任人,并进行元数据著录,符合数字对象描述的元数据著录规范。清水江文书的主要责任者可以是个人、家族、团体,或者官府文告发布者。同一责任方式著录不超过三个,多余三个著录为“某某等”。不同责任方式之间用分号。
如上契约为例:责任主体为“杨朝旺,杨朝举卖方”
3.其他责任方式元数据著录
在清水江文书数据库元数据著录规范中,是把契约文书中的“凭中”等作为其他责任人,有其特殊的意义。契约的签订,必有中人,曰“凭中”。清水江流域,民间各种契约活动的签订一定有中人参加,并在他们的介绍和参与下,当事者商定契约的内容,确认各自的意思并写下契据、文书。在契约文书签订中,中人有不可替代的作用,在交易双方中起中介,包括寻觅适当的交易伙伴,参与议定价格,监督和证明契、价的两相交付以及不动产中的临场踏清界址等。被选着中人的人在家族中是有一定的地位和声望,当事的各方都信任,并且大部分中人在契约签订过程中还分取定的担保金。所以在拟定的元数据著录规范中,把“凭中”作为责任人著录,在数据库中提供检索。上例中的其他责任人著录为“龙广书凭中”。
4.日期元数据著录
日期元数据是清水江文书数字对象描述的核心元素,每份契约文书都书写有日期。清水江契约文书中书写的日期除民国后期有些采用公元纪年的外,明清时期书写的日期一般是使用年号纪年时间或农历时间。契约日期在文书中起作重要的作用,清水江文书中的契约既是长期有效契约、同时又有时间段的限制。例如典契、佃契、杉木买卖契等。特别是“佃山栽种林木契”,林木从栽种到发卖,周期很长,契约中除了规定双方的权益外,还明确标注木质长大发卖后,土地要归还原主。像这样一类的契约,时间就有一定的约束力。所以契约文书日期是契约文书中的重要内容,在元数据著录规范中明确规定契约文书日期采用照录的原则,同时设立公元日期对应参照,并作为检索项。
5.出版者元数据著录
清水江文书对此项的元数据进行了变通,并且是作为一个可选择的著录项。因文书中的绝大部分是私人契约,并大量由个人收藏,一般是不被公开和发布的,也就不存在出版者这一项的内容。但清水江文书中有定量的官府文书,官府文告的发布者应可作为出版者著录,对此项元数据核心元素进行了保留和变通。
6.附注项元数据著录规范
附注项是清水江文书元数据中的核心元素,对于附注项的著录规范是,凡契约文书需要说明的都加以说明。例如文书缺字附注的说明、文书释义说明、红契白契的说明、官契或私契的说明、单契或粘连契的说明等等。契约文书的附注项是一个非常灵活,并且提供大量信息的特殊项。例如下面的这一张契约:
契2.立典柴山沙(杉)木人扬俨然,今因要银取用,无从得处,自己将魁杞屋背柴山沙(杉)木壹块出典,问到岳寨秦现澋承议作价银壹两伍钱铜钱整。山内除有沙(杉)木陆根、南(楠)木壹根、青岗木壹根不典,大小沙(杉)木细柴任从典主,日后欲禁伍年,不限远近俻得原本价赎约,夸欲有凭,立典是实。
于飞代笔
道光十二年七月初四
同治二年二月杨大吉照契转典与杨业兴耕种,立转典是实。
同治三年扬业兴照契转典扬事权耕种是实。
大吉笔
这份契约现保存在杨事权后人手中。从契纸字面文字可看到,立典所指的魁杞屋背柴山沙(杉)被两次转典,什么原固原土地权人没有赎回这块杉山,笔者不得而知。但从对契约的著录来讲,这张契纸实际是三份典契,且地产权最后属于杨事权。所以附注项就要对三次转典进行说明。
7.关键词
关键词的著录采用抽取文书种类进行著录,每份文书选取2-4个关键词不等。例如:契2关键词:柴山杉木契,土地契,典契。
8.载体形态元数据著录规范
载体形态是清水江文书类型核心元素。“清水江文书”按载体区分,有纸契、布契、石契、皮契。在数据库中的扫描件基本上是纸契扫描件。对于纸契在载体形态项标注是:纸契;多少页;长X宽cm;毛边纸或绵纸或别的材质。石契是以照片的形式在数据库中呈现,对契约文书载体的描述,首先指明载体的类型:石契;碑文的长宽厚度;碑文位置。
9.收藏历史
收藏历史著录文书收藏沿革,注明获得方式。在元数据著录规范中,明确著录契约文书的收藏沿革、获得方式、购买价格;如果是扫描件,需著录从何处对原件进行扫描。
10.馆藏信息的著录规范
对馆藏信息的著录规范,著录原件现收藏地、馆藏号或收藏农户姓名。
清水江文书数字对象描述元数据的设计和著录规范,对元数据集的核心元素进行了定义和规范,并实际运用于数据库建设中。在实际著录时,清水江文书是一个较为复杂的复合对象,需要利用大量的地方知识,才能进行完整的描述。同时该文由于篇幅的关系,对清水江文书中数字对象描述的扩展元素没有论及。
数据规范 篇7
1 应用ERP系统所存在的业务数据规范问题
1.1 系统基础数据未按规范维护
基础数据, 是企业ERP系统应用的基础, 也是系统相关运算逻辑正确执行的关键, 因此, 正确、规范化地维护系统基础数据是系统正常、高效应用的基础。但是在实际应用过程中, 存在以下基础数据维护问题。
1.2 BOM等主数据未及时、正确维护
BOM主数据在企业ERP系统中占据着至关重要的作用, 对于MRP运算结果的正确性, 物料采购计划的正确性, 车间生产计划的顺利编制影响巨大。
除此之外, 维护BOM主数据往往还存在着严重的及时性问题。比如企业进行MRP运算时, 根据运算结果日志获悉相关成品所对应的BOM主数据未及时维护, 导致无法及时下达物料采购计划, 严重影响物料采购交期, 产品生产交货交期。
因此, 企业在应用ERP系统时, BOM主数据的正确性、及时性成为制约ERP系统深入应用的绊脚石, 需引起重点关注。
1.3 组织架构未正确维护, 或调整不及时
企业ERP系统应用的重要目标之一, 在于基于系统快速、正确地获取业务分析报表, 帮助管理人员做出正确的决策。而报表数据的正确获取, 与系统组织架构数据维护的正确性息息相关。
但是大多数企业管理人员在应用ERP系统时, 忽视了组织架构数据正确、及时化维护的重要性。比如, 在企业组织架构进行调整时, 并未及时进行调整ERP系统内对应的组织架构数据, 导致报表获取数据时, 因组织架构问题导致数据的合并汇总异常。
1.4 日常业务操作数据作业过于随意化
1.4.1 账物不符
ERP系统应用的基本原则之一, 就是确保账实相符。但大多数企业在应用ERP系统时, 却忽视了这一基本原则, 日常工作中操作业务数据过于随意, 导致很多数据不准确。
比如, 仓库管理人员在应用ERP系统库存管理模块时, 输入物料凭证往往与实际货物移动的日期相差很多, 基本上都属于事后记账的方式, 不利于仓库材料“货龄”分析。
1.4.2 后台调整业务操作数据
企业在应用ERP系统的过程, 是不断优化、完善的过程, 在应用的过程中同样也会伴随着系统问题的产生。ERP系统逻辑严谨, 任一操作可能均会伴随着诸多数据的变化。
但是部分企业系统管理人员, 在处理ERP系统BUG问题时, 不遵循分析、解决问题原则, 而过于注重数据库操作, 依靠技术手段后台调整业务操作数据, 导致表面上解决了系统问题, 却对数据的正确性带来巨大隐患。
2 ERP系统应用过程中业务数据规范策略
2.1 梳理企业业务数据维护流程, 制定业务数据维护制度
企业在推进ERP系统应用过程中, 应该努力梳理业务数据维护流程, 并制定科学、合理、严谨的业务数据维护制度。
2.1.1 参考行业经验, 高效完成业务流程梳理及制度制定
ERP系统, 必须高度吻合行业发展的特性, 同样业务数据的正确维护离不开行业化经验。因此, 在梳理业务主数据维护流程及制定主数据维护制度时, 可以考虑参考行业内已有的经验, 快速、高效地完成此项工作。
2.1.2 结合自身特色, 优化完善业务流程及维护制定
行业化经验, 为企业梳理主数据维护流程提供了基础, 但是流程及制度在企业内得以深入地应用, 必须结合企业自身的特色。因此, 在企业应用完善ERP系统过程中, 同样离不开主数据维护流程及维护制度的优化完善。
2.2 组建业务主数据监察部门, 统一监督、规范业务数据
任何业务流程及管理制度在企业内部的真正落地, 都离不开有效的监督与管控。为了使得ERP系统主数据维护流程及管理制度在企业内深入推广, 组建业务主数据监察部门意义重大, 能够对企业的业务数据规范化统一监督与管控。
2.3 组建监察部门, 并赋予执法权
部分企业在推进ERP系统时, 也组建了监察部门, 但却未赋予相应的执法权, 以至于无法对企业应用ERP系统中所出现的数据规范性问题给予责任鉴定并做出处罚决定。
2.4 将数据规范化列入企业业务考核指标内
企业在应用ERP系统时, 可考虑建立统一的业务数据管理管理平台, 并不断健全企业ERP系统基础数据管理机制, 对所有的业务数据进行统一地管理。在制定公司信息化考核指标时, 将关键业务节点的系统操作及可能存在违规的异常操作纳入考核范围内, 并将考核指标落实到相关部门及人员, 制定相应奖惩制度, 责任到岗、考核到人, 循序渐进地定期检查考核指标达标率。
参考文献
[1]郭颖.ERP应用考核系统分析[J].硅谷, 2013 (16) .
数据库设计规范及设计技巧研究 篇8
企业信息在收集时,常常对企业信息收集提出来高效化和高质化的要求,这也正式企业信息数据库建设的目的。企业信息的收集工作对于一个企业发展来说起着至关重要的作用,它能够更好地确定顾客的市场需求,提高企业产品的市场竞争能力,是一个企业健康发展的重要历程。所以企业信息化的基础正是以企业数据信息的收集能力为基础的。所以,数据库设计工作的建设,直接的对一个企业的信息化建设起着十分重要的作用,也会对一个企业在未来的发展产生影响。
伴随着我国经济文化的不断发展,我国企业信息化也在不断地扩大,一个企业信息的收集工作已经成为了这个企业发展的重要历程,也是一个企业信息化建设的重要组成部分。企业信息文化的收集和分析工作将会对这个企业产生巨大的影响。一个企业想要依靠信息化实现健康的发展,企业的信息收集及处理能力是一个基础性的工作。企业信息收集工作会对企业的信息化建设,企业的效益产生很大的影响。企业信息化建设的优劣与企业的数据库设计有着密切的关联,在数据库建设质量保证的前天下,企业的信息化的建设意义才能够真正地体现出来,才具有更多的意义。
近年来,关于数据库信息化建设的许多问题都浮现了出来,且不说为企业带来多少效益,还已经影响到企业的正常运转,这种问题出现的原因可能是因为数据库建设人员不够重视,数据收集时的信息错误以及数据库设计人员的能力欠缺等原因是引起企业信息化建设存在问题的主要根源。
为了使企业的各项工作能够更加方便地检索到相关信息而对企业的信息进行了收集和数据库设计建设工作,相反这也对数据库的设计工作提出了更高的要求,增加了数据库建设的难度,因此数据库建设的管理人员如何准确地把握企业信息的现代化建设和企业信息收集工作之间的关系具有十分重要的意义。
因此,如何处理好企业信息的收集工作和企业信息化建设之间的关系是每一位数据库的建设人员都应该思考和研究的问题,怎样在最短的时间内给企业带来最大的方便的问题是每个建设者的出发点。企业信息收集工作的智能化和高效化对于一个企业来说是至关重要的,它是企业信息化建设的一座重要的基石和纽带。
企业数据库信息的建设工作是与企业信息每个阶段的收集工作是息息相关的,会对企业信息收集的方向和进行程度造成一定的影响,是一个企业是否开展信息收集的一个决定性结论,它对企业的信息化建设和企业信息收集是一个重要的协调者和衔接者。因此,在以企业数据库设计的规范化前提下,才能更好地体现出企业信息收集得高效性和智能化,只有这样,企业信息化建设和企业的收集工作的智能化才能更好地显现出来,才能更好满足市场的要求和企业的需求。
2 规范化设计的主要流程
2.1 数据库的概念设计阶段
1)初始化进程
初始化进程就是首先要对主要的目标和要进行的范围进行描述,并以目标的建模计划、计划的组织团队、在建设中所使用的原材料进行收集、来对建设进行约束和规范。通过分析调查资料得出调查结果,并对采集到的原始数据进行输入输出等工作,并形成基本的数据资料表,在初始化进程阶段,最重要的是对原材料的收集。
2)定义实体阶段
定义实体是从第一个阶段收集的材料中对大部分的实体进行标识,并依据表示物的术语和相关的“代码”符号,能够找出相对应的实体,两者之间形成相对应的关系。
3)定义联系阶段
在IDEFIX分析模型中,往往只允许存在着二元联系模式,而n元之间的联系,则必须建立起n个二元之间的联系。使用实体联系矩阵来辨别实体之间的二元关系,并以相应的规章和业务需求为依据,并结合于实际的相应情况,来分析出关系的名、关系的势等来确定相应的关系类型,如:分类关系、非确定关系、标识关系和非标识关系等。
4)定义码阶段
定义码就是在上一个阶段的基础之上,去除非确定的关系,并引入交叉实体,并通过标识候选码的属性,来对主选码进行确定分析。找出可信的确定关系,并作出进一步的实体分解,使键基视图体现出来。
5)定义属性阶段
定义提取说明性名词,这能够确定开发属性表和确定属性的所有者关系。通过定义和检查非主码区属性的问题,来确定非主码属性是依赖于主码属性的一种关系。此时,会得到改进后的全属性视图IDEF1X模型,而此视图符合于第三范式的关系理论。
6)定义其它规则和对象阶段
对属性的长度、精度、空缺值、约束规则等进行定义,并对角色、序列、视图等对象信息进行定义。
2.2 逻辑结构进行设计阶段分析
这个阶段主要是通过对上一个阶段的概念结构转换成一种数据模型即为某个数据库管理系统的支持类型,并对这个类型进行优化。通过选择最为合适的表达结构概念的数据模型来确定逻辑结构,以选出最为合适的数据库刮泥系统。将实体之间的属性和他们之间的联系转换成相应的关系模式即为E-R图的关系转化模型。
2.3 数据库的物理建设阶段
为了实现数据库满足企业的需求,而对数据库进行了物理设计,这会对数据库的使用性和方便性产生一定的影响。结合分析各项的要求因素,把逻辑数据模型转换成物理结构,以方便后续检索功能的进行,来评估数据库设计的是否合理。
3 数据库建设中的技巧分析
在数据库地建设时,要满足市场的需求切实的提高数据库的质量和工作时的效率,这就要求要做好市场充足的调查,真正的理解市场的需求,以此来满足市场对数据库的要求。除了对数据库市场有着一定的调研基础外,还要对数据库业务的相关流程有着清楚的理解,这样会切实的提高工作的效率和质量。符合企业发展的数据库建设,可以解决对公司之间的沟通问题,也使得由于不清楚公司的需求而产生的数据库建设不合理的情况。这样会形成一种共赢的良好的局面。E-R图和数据字典的创建。实体之间的相互关系可以通过E-R图体现出来,实体对象和其所对应的关系属性可以用逻辑表来进行描述即为数据字典。专业化和规范化统一能够最大限度地发挥E-R图和数据字典的作用,更好地为企业服务。
4 小结
企业数据库的规范化建设能够提高企业信息数据收集时的效率。我们要加强对数据库信息化建设对企业发展的重要认识,并对数据库进行规范化处理,因为只有这样才能最大限度地使数据库建设发挥相应的效益。
摘要:随着我国现代化进程的不断加快以及社会经济文化水平的不断提高,我国的信息文化产业已经得到了长足的进步与发展。一个企业信息的收集能力,是这个企业文化产业产业链的重要的组成部分,是企业形成社会信息化的基石,一个企业收集信息的能力,对于企业数据库建设的质量和数据库收集时的效率有着至关重要的作用。因此,企业信息收集质量的提高,以满足企业的需求,是现今一个企业发展的重要里程碑。我国的社会信息市场发展得越来越快,企业信息数据库的建设也体现出许多新的局面,如数据库的智能化和复杂化可以说是现代数据库最好的体现。本文分析了在企业信息收集中数据库的设计工作所起到的重要作用,深入分析和探讨了数据库在设计时如何更好地对数据库进行规范化、智能化进行设计。
数据规范 篇9
关键词:信息公开,数据平台,融资
经济活动的本质其实就是使用价值的交换, 而交换是社会活动的一种, 经济活动在其漫长的演化发展过程中, 是基于“信任”这种社会情感产生的, 经济活动发展到今天, 市场这支“无形的手”在时时刻刻分配着主要的社会资源和服务, 公平、互利、诚信成为市场经济的基本特征和内涵要求, 作为市场经济活动的“细胞”---企业, 在其健康发展的道路上, 不偏离市场经济的基本特征和内涵要求, 关键在于行政能力的监督, 因此丰富和发展行政监督手段, 对于规范企业经营活动, 维护市场秩序, 促进经济发展至关重要。
一、企业信息公开大数据平台的定义
基于国家工商总局构建的企业信用信息公示系统, 拓展大数据实时巨量收集、智能分类、系统比较、决策分析等功能, 在云计算技术支持下, 实现企业、协会、政府部门和用户的多方实时链接, 在权限的要求下进行申报、填写、查阅、监控等操作, 构建起开放性的企业信息公示平台。运用大数据平台建立企业信息公示平台, 本质要求是建立起数据实时、客观、可查的企业信誉机制, 为创造良好的市场环境提供信息支撑, 是丰富和发展经济管理的手段创新, 是转变政府服务职能的具体表现。
二、企业信息平台建设的现实紧迫性
改革开放三十多年来, 我国无论在经济规模还是质量上都有了长足的进步, 特别是市场经济条件下, 企业的发展只能完全衔接于市场这根指挥棒, “做大、做强、走出去”是企业发展的固定模式, 企业信息平台能够很好的服务于企业, 促进企业提高经营管理能力, 也是时代发展的必然需要。
(一) 企业搏击市场经济的“身份证”
在市场经济高度发达的今天, 商业风险是无处不在的, 经济实体在挑选项目、合作伙伴时必然会建立起防控风险的信用评估政策, 这种对客户的信用政策, 成为企业竞争的有效手段之一, 而要建立这种信用评估体系, 关键在于有足够的客观信息支撑, 而运用大数据技术依托官方的企业信息平台能够提供全方位、多角度的对方企业信息, 能够实现目标群的对比信息, 特别是信用信息, 能够很好的降低商业风险, 这些单个企业相关方面的集成信息, 就是其搏击市场经济的“身份证”。
(二) 企业破解融资困局的“通行证”
国务院颁布《企业信息公示暂行条例》其中一个主要目的, 就是通过企业信息公示, 特别是信用评级, 来有效解决中小微企业融资难的问题, 十八届三中全会也特别强调推动金融改革, 鼓励中小银行设立, 发展普惠金融, 因为只有这样才能从根本上解决中小微企业融资难、融资贵的问题, 才能更好的促进实体经济的发展, 而“为什么借”是融资的头号问题, 企业平台的信息公示功能, 特别是信用评级功能是说服他方借钱的重要依据和理由, 是融资的“通行证”。
(三) 融入信息时代浪潮的“荣誉证”
每个时代都有其鲜明的特征, 在信息技术迅猛发展的今天, “互联网+”是我们这个时代最为鲜明的特征, 能够具有时代特征对于企业来讲, 是企业实力的一种体现, 也必然是一份荣誉, 结合大数据平台通过云计算技术进行多方实时链接的企业信息平台, 是典型的“互联网+”模式, 虽然不是服务于某个具体的企业或者产品, 但却是创新运用于经济管理当中, 对于政府和行业协会是一种管理手段的创新, 对于企业来讲是实力展示手段的创新, 是融入信息时代浪潮的“荣誉证”。
三、建设相关要点
企业信息平台因为其“互联网+”模式的时代性和先导性, 在一定程度上还是处在探讨和摸索阶段, 开放的平台和层级管理、大数据的需要和细微信息的录入、苛刻的要求和服务的本质, 这些看似矛盾, 却又融合在一起, 相互依存, 相互实现, 因此必须慎重对待, 严格要求。
(一) 信息构建的模式要求
企业信息平台, 在建立企业信誉体系的本质要求下, 关键是运用大数据模式采集、规整各类企业信息, 以国家工商总局构建的企业信用信息公示系统为基本载体, 根据《企业信息公示暂行条例》的注册信息登记信息公示、企业年度报告公示、政府行政信息公示三大块和政府抽查、企业信用等级为完全开放式公示, 还应将企业季度业务信息、企业季度财务信息进行非完全式公布, 用户经企业允许可以进行查阅, 企业法定代表人和主要高管的个人档案以及诚信记录由政府部门、企业共同进行非完全式公布, 由于涉及个人隐私, 经企业和个人允许可以进行查阅, 特殊条件下经法院同意也可进行查阅。
(二) 建设的主体要求
企业信息平台在建设上的必须明确好两个个方面的内容, 即系统主体几方参与建设, 等级内容区分两个方面, 关键在于各项信息数据的全域、全时、对应生成, 保持信息平台拥有实时的巨量关联数据。
系统主体参与方, 政府、协会 (企业) 、用户三方方参与。由政府部门牵头, 在国家工商总局构建的企业信用信息公示系统的基础上, 依托互联网公司提供大数据技术, 共同建设企业信息系统平台, 日常由互联网公司协助电子政务中心, 进行平台运行维护等方面的技术支持, 各类型的账户口令由电子政务中心负责分发。政府部门端口应根据实际需要, 按照功能管理进行分发, 工商、税务、财政、人社、安监、政法、质检、规划、住建、银监等部门为基本账户, 银行、担保、保险等金融机构账号口令, 也规整我政府端口;协会端口, 按照行业分类统筹的原则进行账户口令分配, 企业账户由行业协会认证, 企业账户与行业协会分类信息链接;用户, 按照利益申请的原则, 向电子政务中心申请和分发账号。
等级内容区分。一级账号为电子政务中心, 即平台技术建设维护方, 按照法规要求可以更改各型数据;二级账户为政府行政部门、协会 (含企业) , 主要申报、生成各种行政类信息 (含企业信用等级评定信息) 、企业信息、金融信息, 无权更改各类信息, 其中协会负责企业信息的分类规整和初审;三级账户为用户方, 只能浏览查阅各类信息, 对于非完全公开内容的信息, 需经对方同意才有权限查阅。
(三) 数据的权威性要求
数据的权威性是企业信息平台的生命, 没有真实客观的数据, 就不能符合企业信息平台建立的初衷, 平台就没有实际意义, 因此必须在法律法规的基础上, 采取多种手段, 确保各种数据是真实的、客观的。
一是加强法规建设。制定严格的操作规程, 明确信息录入申报的要求和标准, 对于虚假信息的录入方和审核者要进行追责, 在法律法规层面保证有法可依, 并严格执行确保有法必依。
二是分类检查监督。根据《企业信息公示暂行条例》要求, 工商部门按照公平规范的原则, 根据企业注册号等随机摇号, 确定抽查企业, 组织对企业公示信息进行检查。协会作为企业信息采集的组织方, 应该把好信息的初始关, 企业对于政府类行政信息有异议的, 应通过协会与对应政府部门或金融单位进行核实沟通, 经双方同意, 可向电子政务中心申请更改或补录。
数据规范 篇10
1) 交通科学数据整合集成离不开标准。
交通领域科学数据分布广泛,类型多样,采集手段各异,并且综合了公路、水运、铁路、民航等多种运输方式,使数据共享工作的展开面临极大的挑战。数据资源如何分类,如何描述其内容、结构,如何规范数据单元,如何定义数据的特征等问题是在交通科学数据共享工作开展前就应解决的首要问题[1]。
2) 交通科学数据共享工程的管理和建设需要标准。
交通科学数据共享工程庞大、复杂,需要投入很多的人力、物力、财力来确保整个工程的合理、有序、高效运行,包括对数据共享的管理,共享系统运行管理,规范系统建设和数据中心建设的程序和方法。所有这些规章及规范构成了交通科学数据共享工程运行管理机制的重要环节。
3) 交通科学数据共享的服务依赖标准。
交通科学数据共享的最终目标是将整合加工的数据资源,通过现代信息技术手段,向社会提供服务。标准化程度的高低直接决定服务质量的好坏,从数据的采集、加工、存储到数据的汇交、分发、应用,都必须依据标准,自上而下使整个交通行业的数据共享服务规范化,推动和促进科学数据共享的广度和深度。
2 交通科学数据共享标准规范体系框架
交通科学数据共享标准规范体系是在国家及交通领域相关政策法规的支撑下,在科学数据共享运行管理机制的保障下,依据国家科学数据共享工程颁布的一系列指导性标准[2,3],同时考虑公路、铁路、水运、民航等领域在数据描述、共享系统建设与管理、共享服务等方面的标准化需求综合研究制定的。
标准规范体系框架总体分3个层次,即指导类标准、通用类标准和领域专用标准。其中通用类标准又分为数据类、管理与建设类和服务类3个类别的标准。
交通科学数据共享标准规范体系建立原则如下:
1) 科学性。标准化的最基本原则,是采用所述标准的有关应用系统和技术系统安全、可靠、稳定运行的根本保障。
2) 系统性。是标准体系中各个标准之间内部联系和区别的体现,应做到内容全面和层次合理。
3) 先进性。充分利用现有先进技术,积极等同或等效采用国家标准、国际标准。
4) 可扩充性。既要考虑目前的技术和应用发展水平,也要对未来的发展趋势有所预见。
3 标准规范体系主要内容
3.1 指导类标准
国家科学数据共享工程中给出的定义是指与标准的制定、应用和理解等方面相关的标准。在本体系中,它应能阐述交通科学数据共享标准化的总体需求、概念、组成和相互关系,以及使用的基本原则和方法等。除包括国家科学数据共享工程中颁布的系列指导类标准之外,还包括《交通科学数据共享概念与术语》等交通领域指导类标准。
3.2 通用类标准
通用类标准是指交通行业在公路、铁路、水运、民航等领域具有共性的标准。遵循这些标准,能够实现交通各领域数据规范化的定义、描述、加工、整合、存储及交换无歧义理解。主要通用类标准有:
1) 数据类标准。如《交通运输科学数据共享元数据内容》、《交通运输科学数据共享数据元目录》、《交通运输科学数据分类与编码》、《交通运输科学数据共享数据模式》、《交通运输科学数据图式表达目录》、《交通运输科学数据共享数据交换格式》等。
2) 管理与建设类标准。如《交通运输科学数据共享管理办法》、《交通运输科学数据汇交管理办法》、《交通科学数据共享网建设规范》、《交通科学数据共享数据中心建设规范》、《交通科学数据共享网运行管理规定》等。
3) 服务类标准。如《数据加工规范》、《元数据检索和提取协议》、《交通运输科学数据质量控制》等。
3.3 领域专用标准
领域专用标准即根据通用标准制定的、满足特定领域数据共享需求的标准,具体反映某领域数据特征的数据类标准,如《公路水运领域共享元数据内容标准》,即可在《交通运输科学数据共享元数据内容》标准的基础上,结合公路水运所拥有的数据资源特征,进行扩展和细化。
4 体系中重点标准的剖析
交通科学数据共享标准体系中的各专项标准,以国家科学数据共享工程颁布的系列指导性标准为依据,在深入学习数据共享理论和广泛调研行业资源需求的前提下,借鉴科学数据共享工程中其他试点单位的先进标准编制经验,结合交通领域资源特色,遵循急用先行的原则,研究制定。从数据分类编码、元数据内容、数据元、数据汇交管理、数据质量控制等方面入手,逐步丰富、完善,满足交通科学数据共享的需要。
4.1 数据分类与编码标准
数据分类与编码标准编制目的在于准确地识别和有效地管理交通运输科学数据,保证其在科学数据共享工程范围内组织、存储及交换的一致性。交通行业已存在各种各样的分类对象和分类习惯,如何最大程度的统一分类思想,既尊重现有的应用系统和信息系统对交通资源的分类方式和用户的检索习惯,又要兼顾科学数据共享对资源分类的各种要求,最终保证交通领域产生的各种科学数据资源有类可归,是该标准在研究制定过程中面临的一大难题。
交通科学数据资源分类采用线分类法,其中,大类划分为公路、铁路、水运、民航和综合运输。在每一大类之下划分若干中类,每一中类下划分若干小类,共计43个中类和247个小类,按照国家科学数据共享工程统一的编码规则对各类逐级进行编码。
交通运输科学数据中类的划分主要参考GB/T 13745—92《学科分类与代码表》中有关交通运输行业的类目设置,以及《中国图书资料分类法》中类目的设置,对较成熟的类目基本沿用,其他中类类目则根据科学数据的内容特征、行业特点等确定。而小类的划分以学科分类体系为主要依据,兼顾行业数据的来源、存在形式、形成过程、未来需求和方便检索的原则,力求类目设置完整、数量均衡。
4.2 元数据内容标准
元数据是关于数据的数据,是对数据和数据集合的规范化描述。交通科学数据共享元数据内容标准定义了完整描述交通领域具体数据或数据集时需要的数据项集合、各数据项语义定义等[3]。它提供了有关交通运输科学数据的标识、内容、分发、数据质量、参照、数据模式、图式表达、扩展、限制和维护等信息。
交通科学数据共享元数据内容标准在科技部颁布的《科学数据共享工程元数据内容》标准的基础上,在包含其核心元数据的前提下,裁减参考元数据并新建凸显交通资源特征的实体和元素编制而成。在定义和描述元数据时采用3种方式:摘要表示、数据字典描述和UML 图描述[4]。
依据本标准,交通行业各数据资源拥有单位对各自的在线或离线资源进行标引并著录,提交元数据至交通科学数据共享网(以下简称“共享网”)数据管理后台,管理员审核相关元数据内容的真实性、可靠性、安全性,经审核合格的元数据给予发布。目前,交通科学数据共享网已著录元数据2 000余条,并将核心元数据提交国家科技基础条件平台,通过资源整合接口,在平台门户上即可跨平台检索到交通科学数据元数据。
4.3 数据元目录标准
数据元是用来描述数据的最基本单元,是数据建模的基本元素,更微观的保障了“共享网”数据资源的共享与交换。《交通科学数据共享数据元目录标准》解决了“共享网”科学数据资源生产、管理、服务中,相同概念的数据元,由于命名、定义、分类标识、表达格式、数据类型、表示方法等不一致造成的混乱,对内,可作为交通科学数据资源采集、加工、处理环节工作人员的操作规范;对外,可使参与到交通科学数据共建共享的相关责任方,根据本标准对交通科技信息资源进行汇交、分发、服务和应用。
《交通运输科学数据共享数据元目录》在公路水运领域参考行业基础数据元集标准,从中选取部分科学数据共享所需的数据元,但描述方式仍然遵守科技部颁布的《数据元标准化原则与方法》的要求。铁路、民航领域、部分公路和水运领域的数据元无正式行业标准可依,因此按照自下而上的方法,提取行业现有业务系统、应用系统中的数据元,并梳理领域数据资源,兼顾未来资源整合需求进行数据元目录的编制,最终形成总的交通科学数据共享数据元目录。
总之,《交通科学数据共享数据元目录》的制定,为交通运输科学数据共享工程中涉及的数据元提供了统一标准,保证了相同概念的数据元在语义上的无歧义理解,提高建库质量,促进数据加工的规范化、标准化,推动了交通领域科学数据在各个层面上的集成与共享。
5 结 论
1) 交通科学数据共享标准规范体系是一个开放的体系,在科学数据共享活动进行过程中,可以根据具体的应用情况,随时补充制定对数据共享的建设、管理、服务等方面有价值的标准或规范。
2) 交通科学数据共享标准规范体系是一个动态稳定的体系,它所包含的某些专项标准正处于动态稳定的状态中,需要根据其在共享工程中的应用效果,结合行业技术专家和国家科学数据共享工程标准规范编制专家的意见,不断的进行修改完善,最终达到稳定成熟。
3) 构成交通科学数据共享标准规范体系的每项标准,都具有重要的作用和价值。
4) 交通科学数据共享标准规范体系建设是一个复杂而漫长的过程。我国新组建的交通运输部整合了原交通部、原中国民用航空总局的职责以及原建设部的指导城市客运职责,并负责管理国家邮政局和新组建的国家民用航空局。目前,交通科学数据共享资源对象仅包含公路、铁路、水运、民航4个交通运输领域,今后,交通邮政运输也必将纳入到交通科学数据共享工程范围中。因此,现有的交通科学数据共享标准规范体系的具体内容,还有待进一步的研究和深化[5],相信随着交通科学数据共享工程的不断推进,必将使交通科学数据共享标准规范体系建设逐步走向成熟。
参考文献
[1]徐枫.科学数据共享标准体系框架[J].中国基础科学,2003(1):44-48
[2]国家信息中心.科学数据共享工程动技术标准.SD/T1003—2004科学数据共享概念与术语———第1部分:概念(征求意见稿)[S].北京:国家科技部,2005
[3]国家信息中心.科学数据工程共享技术标准.SDS/T2112—2004科学技术共享工程技术标准(征求意见稿)[S].北京:国家科技部,2005
[4]王辉,林垚.周紫君.基于元数据的交通运输科学数据共享平台设计[J].交通与计算机,2008,26(2):87
数据规范 篇11
一、从宏观角度分析
1.统一特色库建设规范。建库前进行全面系统的调查研究,对准备建设的特色数据库进行科学论证的基础上,严格采用相应技术标准或规范作为建库的必要条件。特色库的开发与工业类软件开发的实质是相同的,有多种开发的流程模型,一般为自顶向下、自底向上、瀑布式、螺旋渐进式等。这就要根据自身的实际情况来选取最适合自己的一套标准流程[3]27。党史党建数据库开发的规范步骤如下:
宏观:规划及需求分析———开发平台的选取
微观:数据加工及录入———特色库发布测试———维护与支持
当确立这样一个开发数据库的规范及标准后,整个建设思路就显得明朗清晰,为后续如何选定特色库开发平台做了清晰的指引。
2.数据库开发平台的选用标准。如何选取特色库开发平台,是整个建库工作的核心,必须通过引入相应的技术规范及标准,在众多平台中找出最符合的才能最终选定。专题特色数据库建设的技术规范是实施特色资源共享的核心。当前的许多专题数据库在建设上存在着诸如“数据格式不规范、著录标准不统一”等典型问题。因此,应选取通用、规范的标准和协议,架构上采用模块化,且便于灵活部署的开发平台,来确保实现专题特色库文献资源共享[4]53。
现阶段开发平台所遵循的标准与规范主要包括“OAI/ODL组件接口协议;Z39.50协议;Portlet规范;SAML标准;Open URL开放链接标准;LDAP标准;Ca]is United Query and Resultset统一检索接口规范;web Services组件封装规范等。通过引入上述开发平台技术规范及标准,将具体指标对号入座,就不难确定选取何种数据库开发平台。事实证明以“非结构化的特色库开发系统”作为建库平台,能从容面对大量文献类非结构化数据的处理,较易实现海量非结构化信息资源的全文检索与管理,满足特定用户的实际需求[5]81。同时,在实际运用中,客户端 / 服务器(C/S)标准模式与浏览器 / 服务器(B/S)标准模式将会同时存在,这也是本特色库的一个重要特色之一,在安全可靠的基础上,能满足不同类型用户的实际需求。
3. 特色库质量反馈评价标准。在对特色库进行质量跟踪的同时,还要建立对特色库利用效率评价标准、特色库质量评价标准、特色库宣传利用评价标准等,而这些都能推动特色库进入逐渐成长、良性互动、可持续发展的有利境地。根据COBl T (Control Object《Infonnmion and w.1ated Technology)对标准规范的定义,将评价标准限定在特色数据库系统建设过程上。并结合武汉大学图书馆王梅老师在《索引数据库质量评价标准的探讨》一文中提到对专题特色数据库质量评价应从项目管理、服务功能、数据加工、系统平台、元数据标引这五个方面来进行,同时还推出16个二级指标标准,因此,建立特色数据库评价指标标准体系是很有必要的[6]59。
二、从微观角度分析
特色库建设的规范及标准是指建库环节中具体所采用的那些标准与规范手段,是特色库建设的根本保证。现今的特色库标准化建设还处于探索阶段,具体在数据采集、传递、加工以及信息检索等各个步骤上,积极遵循国际、国内通用的数据格式标准、数据著录标准、规范控制标准、数据标引标准及规范协议已是大势所趋[7]46。本文力求通过建立党史党建专题特色库,以实现对党史党建特色文献资源整合,并通过互联网资源共享的形式来提供专题信息服务[8]54。
1.元数据标准规范。元数据作为一种标准编码体系,是进行知识组织和资源开发的工具,因此它在特色库建设中的作用是决定性的。目前特色库开发所使用的元数据标准大致分两块:一是直接引用国际、国家及行业标准,来制订相适应的著录规则标准来实现;二是利用其他相关元数据的成功经验、来建立新的适合于自身元数据标准[5]80。如:中国高等教育文献保障系统CALIS所制定的各类元数据标准规范,包括《CALIS数字对象唯一标志符命名标准》和《描述型元数据及其著录标准》。特别是《描述型元数据及其著录标准》所涉及的会议论文、古文献论文、期刊论文、学位论文等描述元数据标准。另一个重要环节就是元数据集的选择和制定要充分考虑到和标准元数据集的兼容性过渡度问题,如何处理以实现增强数据交互能力和共享程度的目标。
2.著录、标引标准及规。要实现信息资源准确、高效的检索,完成不同类型、不同特色库中同类资源的无缝关联与检索,信息的著录及标引质量显得至关重要,这将直接影响到专题库的检索效率和质量。因此,要严格参照相关的国内外及部委的著录标准,选择标引方式,规定标引深度,处理好标引的分散与关联等问题。元数据著录的标准化问题是完善用户查询信息资源点,是实现信息链服务的基石。当前国内在专题特色库建设上,主要表现为标引不够规范[4]53。基于同一特色库的所有元数据,既有用任意词或关键词来做标引,又有用主题词来做标引,而大量的同义词之间却没有做合适的关联,因而存在漏检、误检、效率低下的问题。
采用标准分类法和主题词表形成严格的知识组织体系,是特色库建设领域中的又一标准模式。但在实际建设过程中,部分较为特殊的专题库并没有合适主题词表、也没有现成的、标准的分类体系,这就需要建设者来根据自身特性,参照所属学科分类体系来编制相应的主题词表与专题分类表,以实现相对规范且符合用户习惯的分类组织体系和主题浏览与检索机制[6]60。
专题特色库的著录标引应该遵循有关国际标准和国家标准,元数据标引格式规范和一系列相关标准。例如《我国数字图书馆标准规范研究》中,该指标就是考察各类专题特色库建设过程中对相关标准的执行情况。它是进行著录标引质量控制的规范性文件,还是考察对标准规范的理解程度的依据。又如党史党建专题特色库的元数据著录规则在制定前,就要确定各类型核心元数据标准,对于不属于现行标准中的文献类型重新定义,包括著录的详简级次以及对特殊符号的处理等都要统筹兼顾[9]29。
3.数据、接口规范与技术标准。一个成功的特色库开发系统必须要具备统一的技术接口标准支撑。数据规范———包括:标识符、特色库集合等的命名规范、GBK编码、BIG5编码、Unicode字符集、国际标准的交换格式(IS02709)等。接口规范———包括:OAI/ODL组件接口协议;SAML标准;Portlet规范; 统一检索接口规范、ODLMAP协议规范、数字对象交换协议规范、安全通信规范、Openurl服务编码标准、openurl资源库编码标准、登录认证接口调用规范、后台管理接口调用规范等。技术规范———包括:Open URL开放链接标准、LDAP标准、WebServices组件封装规范、CNMARC标准、Dublin Core标准、支持Z39.50协议标准、XML文件格式规范,以及美国、日本、德国联合开发的s IN模式规范等[7]46。
在把握以上标准与规范的基础上,建议采取以下措施:一是使用超星公司研究的PDG文档资料扫描存储系统、清华同方的专业数据库制作管理系统,可兼容各高校图书馆普遍使用的c NMARC标准和Dublin Core标准,支持Z39.50协议标准和XML文件格式,以及美国、日本、德国联合开发的s IN模式。以实现标准、规范建库。二是特色库的数据要完整、准确、稳定。要能正确反映数据的真实性、及时性,减少各种失真和误差,争取最大程度地覆盖主题范围内的所有信息,连续、及时反映信息发展的轨迹,还要在特色库结构、数据著录规范和数据参照系的确立中充分论证,以维护系统数据规范的连续性和质量的稳定性。
4.数字加工与发布标准。采用标准化的开发设计是建设高质量特色库的前提与保障。经过近二十年发展,我国在专题特色库建设方面先后出台了一系列标准与规范。如中国高等教育文献保障系统CALIS就对数字加工与发布标准进行了规范。制定了特殊描述型元数据规范的通用规则,对古文献系列,论文系列,图书系列,音视频资料系列以及网络资源系列的著录都给出了加工及发布标准规范。其规定文字类型元数据必须采用TXT、DOC、XML等格式;图片数据采用JPG、GIF、PDF等格式;视频图像数据采用AVI、FLASH、RM等格式;音频数据采用WAV、MP3等格式。对于非通用格式的,应能实现与通用格式之间无损转换。这一系列标准的制定,为特色数据库的建设提供了依据,也为实现信息资源共享提供了基础保障[4]54。
5.各类检索标准的运用。检索标准的引用是一个讲究科学规范的过程,是最终能否实现用户需求的重要手段,数据库综合检索性能是否完善,各类检索手段是否快捷高效,检索入口是否实用,这些都是衡量特色库成功与否的重要标准。实践证明,实现全文检索的强大功能需支持结构化和非结构化数据的统一管理。在此基础上,能提供丰富的全文检索手段,包括支持多种检索运算符,支持各种逻辑组合检索、正文内容与外部特征的多字段复合检索、相关词扩展检索、二次检索、导航分类检索、西文字段支持前方一致检索等功能;能提供类似同义词典的检索功能,能实现较高的查准率和查全率;支持对检索结果多维排序;特别是能实现对多媒体类包括声、像、图、文等进行关联检索和排序功能。
在了解上述各项检索标准的基础上,结合建库实际情况进行规范选取,包括数据库系统选择、检索方式及功能、检索语言技术、检索记录、检索结果发布等。标准的本质是统一,它是对重复性事物和概念的统一规定;标准的任务是规范,它的调整对象是各种各样的客体。党史党建专题特色库建设开发无论是宏观上,还是微观上都必须以标准化和规范化原则为指导。只有标准化、规范化的特色库才具有生存和发展空间。它不仅能保证数据库的常规性能,更有利于实现真正意义上的网络信息资源共享,实现建库的最终目的。
摘要:信息化条件下,加强党的领导,就是要构建现代化网络党史党建阵地,为了更好地开展网络党史党建工作,开发具有良好规范与标准的党史党建数据库已是大势所趋的一项艰巨任务。对建设党史党建数据库的规范及标准这两个突出问题,可以从不同的角度,即宏观与微观的角度来作出较为系统的阐述。
【数据规范】推荐阅读:
数据录入规范05-28
数据库规范06-14
地图数据保密规范12-22
数据中心机房安全规范10-05
数据库规范化理论10-07
数据库模式规范化11-09
多媒体数据库建设规范09-14
关系数据库中的规范化08-07
规范汉字规范写10-29
书写规范、解题规范论文07-03