地理信息元数据

2024-10-12

地理信息元数据(共12篇)

地理信息元数据 篇1

摘要:地理信息元数据是关于地理相关数据和信息资源的描述信息.本文通过对地理信息元数据确定的原则, 元数据的主要内容与设计, 元数据的组织与管理模式几个部分, 浅谈地理信息元数据设计应注意的方面。地理信息元数据的设计使用, 帮助人们有效地定位、评价、获取和使用地理相关数据。

关键词:地理信息元数据,元数据的设计,管理模式

随着“数字地球”, “数字中国”的付诸实施, 空间信息飞速扩长, 如何有效管理、使用、共享这些异构、多源、海量数据的问题日益突出, 地理信息元数据以其描述性、开放性、简易性而逐渐得到认可[1]。元数据是关于数据与信息资源的数据, 即关于数据与数据集的内容、质量、状况和其它特性信息, 是实现数据高效组织、管理、维护、快速检索、访问、存取的核心和关键技术之一[2]。地理信息元数据是关于地理相关数据和信息资源的描述信息。地理信息数据内容繁杂且数据量庞大, 建立地理信息元数据是对其进行管理及共享的有效可行方法[3]。它通过对地理空间数据的内容、质量、数据格式、数据采集时间和其他特征进行描述与说明, 帮助人们有效地定位、评价、获取和使用地理相关数据[4]。

1 地理信息元数据确定的原则

建立元数据集合, 是帮助人们理解和使用元数据所描述的数据对象, 以实现空间数据的标准化为目的, 以实现数据的共享为前提[5]。元数据的选择和组织必须遵循一定的规则, 以全面描述数据对象, 并方便用户使用。地理信息元数据的确定需要遵循以下的原则。

1.1 完整性

元数据设计中需要挑选出一些最重要的元数据, 构成核心元数据集。核心元数据是有效描述数据特征的最小元数据数据集合, 它应该完整地描述数据集最重要的信息。

1.2 准确性

各个元数据元素应该从某个侧面准确地描述数据集合的某些特征。在确定核心元数据内容的时候, 需要对相关领域的理论与技术有全面的了解, 准确而简洁地将描述数据集主要特征的数据元素整合起来。

1.3 结构性

地理信息元数据之间具有复杂的联系, 应根据实际其结构联系进行合理组织, 以便对元数据进行修改或扩展时不破坏其整体结构。

1.4 与其它标准的一致性

由于元数据也是其他标准的高度概括, 在制定元数据时, 应调研相关领域现有的国家标准与国家、行业准则, 尽量采用已颁布的标准。

2 地理信息元数据的主要内容

目前, 地理信息元数据还没有一个统一的全球性标准。通常采用以下几方面的内容。

(1) 标识信息。它是唯一标识数据集的元数据信息。通过标识信息, 用户可以对已有的数据集有一个总体的了解, 如数据集的名称、发布时间、版本、空间范围、表示方式、空间分辨率、信息类别、数据集的联系信息、数据集法律和安全限制等。

(2) 数据质量信息。它数据集质量的总体评价, 包括数据集在数据完整性、逻辑一致性、位置精度, 时间精度 (时间表示的精确程度、现势性、有效性) 、属性精度 (数据集属性分类的正确性、属性值的精度和正确性) 等方面的综述以及说明数据质量的保证措施, 以及数据源、数据处理过程、数据志等说明信息。

(3) 空间参照系统信息。它是对数据集使用的空间参照系统的说明。

(4) 内容信息, 描述数据集的主要内容, 包括实体和属性信息。

(5) 分发信息, 描述有关数据分发者的信息及获取数据的方法。

(6) 核心元数据参考信息。包括核心元数据参考信息, 用户可以了解到核心元数据内容的现势性等。

3 地理信息元数据的设计

元数据设计过程中, 通常根据实际应用的需要, 参照已有元数据标准确定元数据体系。近年来, 西安市城市建设快速发展, 地理信息元数据是空间数据交换的基础, 也是空间数据标准化与规范化的保证。西安市勘察测绘院为了提高生产管理质量, 更好的满足城市发展的需要, 在地形图的生产中也加强了在元数据方面的管理。下面以我院生产为例, 简要说明地理信息元数据的设计。

(1) 元数据标准主体组成, 如表1所示。

(2) 元数据结构。以目前我院地形图数据的生产管理为例, 地形图元数据结构, 如图1所示。

(3) 元数据的录入。以我院地形图数据信息录入为例, 如图2所示。

(4) 元数据的更新和维护。元数据随地图数据的变化而变化, 元数据的更新管理主要通过版本管理来实现, 这样数据管理者可对历史数据及最新数据进行全面的管理。

(5) 元数据的质量保证。元数据的数据质量是数据质量的一个部分, 也是数据质量的基础。在元数据库建立、更新、维护的全过程中, 必须保证元数据质量。扩展的标准要进行一致性测试, 元数据操作工具应具备保证质量功能, 有条件的应进行质量评价[6]。

4 地理信息元数据的组织与管理模式

4.1 元数据的逻辑组织可采用如下方式

(1) 按照元素性质来组织。这是通常的元数据组织方式。由唯一标识一个数据集、说明其空间和时间范围、状况、法律限制和保密限定所需的信息的元素构成标识信息子集等。

(2) 按照功能来组织。主要方法是将元数据分成描述性元数据、结构性元数据、功能性元数据三类, 分类进行组织。

(3) 按照重要程度来组织。按照元素使用的频繁程度或者重要性差异, 将元素分成核心元素和一般性元素, 其中核心元素是所有类型的数据所共有的。如英国Dublin元数据核心元素模型和澳大利亚、新西兰元数据核心元素模型都是如此[7]。在区分核心元素与一般元素的基础上, 又对核心元素按照不同的侧面进行分类。

4.2 元数据的管理模式

空间数据飞速增长, 我们通过建立若干分布的、相对独立的元数据仓储, 它们分别对应于不同的部门或地区, 然后通过元数据交换标准实现信息共享和分布异构系统的集成[8]。从业务需求来看, 元数据管理系统用于存储、管理和共享各种元数据, 一个良好的系统应具备集成性、可扩展性、可制定性和开放性等基本特征[9]。鉴于MOF和XMI的特点和发展经验, 我们基于MOF和XMI设计了空间元数据的管理模式, 如图3所示。

5 结语

随着计算机技术和GIS技术的发展, 已经积累了大量的地理信息数据, 要实现数据的管理和共享就必须依赖于空间数据和属性数据以外的一种特殊数据。地理信息元数据能够帮助生产单位有效的维护和管理数据, 提供有关数据生产单位的各种有关信息, 供用户查询, 帮助用户了解数据, 提供有关信息, 以便用户处理和转换有用数据, 采用元数据也可以便于数据的共享。我们在生产管理中, 应根据相应的规范, 并且结合自身的生产需求做好元数据的录入, 管理工作。通过我院元数据在基础地理信息系统中的建立与运行, 说明元数据的功能是稳定的, 应用起来也比较方便, 能够在城市基础地理信息系统中发挥重要的作用。我们将进一步改进与完善工作细节, 开发研究元数据扩展的必要性和扩展的基本方法, 更好的提高工作效率, 使地理信息元数据在地理信息领域的应用中拥有更为广阔的前景[10]。

参考文献

[1]周新忠, 余木良, 陶亮, 等.关于地理空间元数据技术发展趋势的理论探讨[J].测绘科学, 2007 (2) :172-175.

[2]赵汗青, 郭刚.地理空间信息元数据模型[J].测绘通报, 2002 (z1) :19-23.

[3]滕连泽, 刘洪斌, 武伟, 等.地理空间元数据管理的研究[J].农业网络信息, 2005 (8) :39-41.

[4]沈体雁, 程承旗.地理元数据技术系统的设计与实现[J].武汉测绘科技大学学报, 1999 (4) :326-330.

[5]牛晓琳, 季民, 赵志刚, 等.基于元数据管理的数据共享研究[J].船舶电子工程, 2006 (1) :71-74.

[6]祝方雄.城市地理信息系统中元数据标准的研究[J].城市勘测, 2001 (3) :37-41.

[7]罗英伟, 邢彭龄.基于XML的地理信息元数据系统[J].计算机学报, 2005 (7) :1205-1212.

[8]王继周, 李成名, 林宗坚, 等.面向共享的空间元数据管理框架研究与设计[J].国土资源遥感, 2003 (3) :67-70.

[9]邵学军, 施吉化, 李景毅, 等.基于模型驱动元数据集成体系结构研究与设计[J].计算机工程与应用, 2006 (15) :156-160.

[10]崔丽美, 谢节, 杨联安, 等.基于X M LSchema地球系统科学数据的元数据扩展机制[J].测绘学报, 2005 (3) :246-251.

地理信息元数据 篇2

对数据仓库、元数据等进行了简单介绍,并针对地理信息系统中元数据的作用、内容进行了阐述,在此基础上,对地理信息系统中元数据的管理方法提出了建议.

作 者:刘越 刘国忠 LIU Yue LIU Guo-zhong 作者单位:刘越,LIU Yue(吉林省地理信息工程院,吉林,长春,130051)

刘国忠,LIU Guo-zhong(国家测绘局第二大地测量队,黑龙江,哈尔滨,150086)

国内外科学数据元数据研究进展 篇3

关键词:科学元数据 科学数据 元数据标准

中图分类号: G254.36 文献标识码: A 文章编号: 1003-6938(2014)06-0102-07

Research Progress of Scientific Metadata at Home and Abroad

Abstract The value and role of research data has gain growing academic attention and recognition. The functions of metadata highlight in many aspects, such as data organization, management, and sharing. This article reviews domestic and foreign research progress of scientific metadata, including the functional requirements of scientific metadata, the development of scientific metadata standards, the application of metadata in data curation, data sharing, and the application of ontology technology in scientific metadata.

财会信息资源元数据标准的研究 篇4

一、概念介绍

1. 元数据及元数据标准内涵

元数据是专门用来对相关数据特征和属性等进行描述的一种信息数据, 在各行各业中具有着重要的作用价值。当前我国元数据的应用范围已经逐渐广泛, 其具有以下几个作用:第一, 元数据能够为不同种资源提供有效的检索工具, 从而能够更快的对各项资源进行充分的利用, 利用云数据资源将不同的社会资源信息和内容进行快速的整合和检索。第二, 元数据能够对许多数据进行共同管理, 从而实现相关信息的资源的描述。在元数据对数据进行管理过程中能够将不同数据的内涵信息进行记录, 从而实现高速的数据追踪和识别功能;第三, 元数据具有建立数据库的作用。因此, 元数据能够更好的促进用户快速将有效信息进行筛选, 加以利用。

元数据标准主要是指对一些列数据进行管理时所建立的标准。在应用元数据的过程中通过设定合理的元数据标准帮助对其数据内容和信息等进行综合性的管理, 从而实现信息系统化、专业化管理和应用。元数据标准内容中将其分为三个不同的层次内容, 即核心层、领域层和应用层。在核心层内是对信息进行标注审核的主要部分, 在领域层内主要是根据信息数据对其进行分类储存和管理, 在应用层次上主要是对信息内容进行整体整合和应用, 从而有效的使用元数据, 应用于人们日常工作和生活中。

2. 财会信息资源元数据标准

财会信息资源元数据标准主要是指多种经济类的数据和信息资源等进行综合的管理的一种电子文档建立方式。财会信息资源元数据标准的应用是企业在其长期会计工作处理过程中的主要标准内涵, 能够对当前我国企业会计信息资源等进行不同形式和信息类型之间的合理、快速转换, 方便财会人员的工作, 提高企业财务管理中的工作效率。此外, 财会信息资源元数据标准能够更好的对企业内部财会信息资源进行分类储存和管理, 从而方便用户对企业相关财会信息资源进行检索和计算。

现阶段我国政府在对国家经济建设过程中也需要依靠企业财会信息资源元数据标准对企业内部财会资源进行调查和管理, 这项工作内容的工作量很大, 工作人员在对其工作内容中的财会信息资源进行检索的过程中可以利用元数据标准对其进行快速检索以寻找到相关信息的内容从而提高了政府对我国企业财会信息资源的管理, 从整体上对我国企业的经济情况等进行宏观调控, 从而促进我国经济建设的不断发展, 完善当前我国财会信息环境。

二、财会信息资源管理的要求

随着我国企业信息化建设的不断发展, 企业内部内部系统中存放着大量的信息数据, 这些信息数据是企业在其建立和发展过程中重要的信息资源。由于企业信息资源管理系统最初建立过程中受到技术手段和环境因素等的影响, 其系统本身的建立上存在缺陷。后期, 随着我国信息技术手段的逐渐改善, 在全局系统管理上逐渐对其进行集成管理, 在这过程中企业管理人员发现对大量信息进行管理会伴随着企业的发展而逐渐增加其工作难度。根据当前我国网络环境在其建设过程中对各种信息资源的管理, 企业财会信息资源管理提出了新的要求:第一, 能够对企业财会信息进行集中储存。第二, 在应用过程中能够快速对信息内容进行检索。第三, 针对信息内容能够进行整理和模型建立, 从而快速的对企业内部财会信息进行管理。根据以上要求, 我国企业财会信息管理中逐渐开始应用新的技术手段对其进行统计和处理, 其中元数据标准的应用正好符合我国财会信息资源管理的要求。

三、财会信息资源元数据标准的必要性

1. 实现企业会计信息资源利用

财务会计资源元数据标准的应用能够有效的对企业会计信息资源进行可利用, 实现企业用户的快速检索。我国企业和相关政府部门在对内部财会信息资源进行利用过程中需要对其财会信息资源的可应用程度进行处理, 从而合理的利用现阶段企业内部的财务会计应用范围对其进行资源应用。这样能够更好的提高企业决策者的决策效率, 从而促进我国企业的长期发展。采用财会信息资源元数据标准够企业和政府部门能够对其资源进行针对性的查询和使用, 为其提供可靠的决策依据。此外, 应用财会信息资源元数据标准后能够对企业员工在制作内部财务信息报表的过程中提高工作人员的整体工作效率, 从而实现企业会计信息资源利用。

2. 构架企业业务系统和决策系统

财务会计信息资源元数据标准在企业内部应用的过程中能够进一步对当前我国企业系统进行构建, 从而使企业业务系统和决策系统更加完善, 促进我国企业的长期发展。我国企业和政府在日常工作过程中需要对相关业务信息进行统计和整合, 从而对业务经营范围和类型等进行处理和调整, 以促进我国企业业务的长期发展, 使其实现企业经济价值。此外, 我国财会信息在日常工作过程中还承担着为企业决策者提供有力的财务数据基础, 从而促进我国企业在其发展过程中的长期发展, 实现我国企业决策系统的建立。由此不难看出财会信息资源元数据标准的建立能够构架企业业务系统和决策系统, 对其信息资源进行特定的整合和管理。

3. 实现企业财务信息资源的长期保存

近几年由于我国经济的快速发展, 企业在市场环境中对相关企业内部资源进行整合和管理过程中需要不断的对企业内部财会信息资源进行更新, 从而使企业能够更加的适应当前我国的市场环境, 使其在发展过程中具有可持续性。而通过建立财会信息资源元数据标准, 使我国企业实现了财务信息资源的长期保存, 改变了传统单一资源保存中出现的相关内容和处理过程信息资源丢失的现象, 成为了企业财会信息储存的有力工具。财会信息资源在其生存过程中决定于信息资源自身的价值。企业的财会信息价值一直是企业长期发展的关键, 其价值意义较为优秀。因此, 在为进一步保障我国企业财会信息价值, 在其储存过程中必须对其进行各种文件形式的转换, 而采用元数据标准能够使其转换过程中保证信息的完整性和真实性, 促进企业财务信息资源的长期保存。

4. 保障财务会计信息的资源质量

应用企业财会信息元数据标准能够保障财务会计信息的资源质量, 从而使企业的决策者和工作人员能够更加准确的对其企业内部数据和发展趋势进行规划和管理, 实现企业的长期发展。企业在对财务信息进行统计过程中往往会采用统计报表的方式对其进行统计, 随后使用单一的系统对其进行录入和管理, 在中间环节中会产生数据异常的现象, 这样会严重影响数据的完整性, 降低财务会计信息的资源质量。而应用元数据标准后能够对其数据录入和管理过程中对其异常现象进行分析, 及时进行补救, 从而提高数据保存的质量。由此不难看出, 财会信息资源元数据标准能够保障财务会计信息的资源质量, 具有普遍应用的必要性。

四、改善企业财会信息资源元数据标准应用措施

1. 加强对元数据标准的认识

在改善企业财会信息资源元数据标准应用过如何能够加强元数据标准的认识成为改善企业财会信息资源元数据标准应用的主要方式, 具体的改善措施如下:第一, 在企业财会信息资源处理过程中对其有效利用率进行改善, 以提高企业对元数据标准的认识, 使其在实际应用过程中充分的认识到元数据标准的应用效果;第二, 企业财会信息资源处理过程中人员进行培养, 以促进其对元数据标准的认识。例如, 企业可以通过定期对其员工进行培训, 从而使员工深入的了解到元数据标准的价值。

2. 完善元数据标准系统建立

在对元数据标准系统进行建立过程中首先, 需要对企业应用元数据标准的目标进行建立, 从而确定元数据标准系统建立的方向, 对其进行针对性建立;其次, 在进行系统建立过程中需要对企业财会信息资源进行整合, 通过分类建立的方式使元数据标准能够更加系统的对其进行收集和处理, 从而形成具有应用价值和特殊性的标准系统建立层次;最后, 在系统建立过程中企业引进优秀的系统建立和管理人员实现企业元数据标准系统的专业化建立, 提高其应用效率。

3. 建立元数据标准管理系统

元数据标准管理系统的建立能够更好的对企业的财会信息资源进行管理。因此, 在其建立过程中需要针对财会信息资源的内容对其进行管理系统的建立。首先, 在建立过程中对财会信息资源的特殊性进行处理和确定, 完善元数据标准管理机构的行为规范性;其次, 对元数据标准的实际应用过程进行规范处理, 从而实现不同类型信息资源的元数据标准, 满足企业不同管理需求;第三, 在元数据标准制定过程中制定单位元数据管理, 实现责任制管理, 提高元数据标准管理价值。

4. 建立审计及税务部门税务分析

在建立审计及税务部分税务分析能够更有效的对财会信息进行获取。在建立过程中企业营改与监督管理部门、审计部门、税务部门等对其进行元数据标准的检索, 实现企业信息化管理。审计部门在对企业财会信息资源进行审核过程中能够完善企业信息资源中存在的漏洞, 从而将元数据标准进行完善, 更好的使其服务于企业的财会信息资源中。通过建立审计及税务部门税务分析的方式, 改善企业财会信息资源元数据标准应用, 使元数据标准在企业应用过程中实现其应用价值。

五、总结

通过本文的研究进一步了解到财会信息资源元数据标准的应用能够改善企业财会信息资源的管理, 为企业决策者提供更好的依据, 促进企业的长期发展。未来在其完善上可以从加强对元数据标准的认识、完善元数据标准系统建立、建立元数据标准管理系统和建立审计及税务部门税务分析四方面对其进行完善。

摘要:近几年随着我国经济的不断增长, 各种新型信息技术也逐渐被应用于各行各业中。财会人员对企业内部财务信息进行整合和记录一直是财会人员工作的主要内容, 也是最为繁琐的一项工作内容。随着我国信息技术的不断发展, 开始在该领域中应用元数据标准对其数据进行管理。因此, 本文中对当前我国企业财会信息资源元数据标准进行研究, 以期通过本文的研究能够提出有效的措施改善企业财会信息资源元数据标准应用。

关键词:财会,元数据,元数据标准

参考文献

[1]邹思杨.浅析会计信息化标准体系构建[J].时代金融, 2015, 05 (01) :205-206.

[2]陈薇.财会信息资源元数据标准问题探讨[J].经营管理者, 2015, 11 (02) :38.

[3]徐颖.财会信息资源元数据标准问题分析[J].现代商业, 2015, 09 (03) :182-183.

[4]周亚青.有关财会信息资源元数据标准的研究[J].中小企业管理与科技 (下旬刊) , 2013, 03 (04) :61-62.

[5]嵇俊康, 劳知雷, 魏文翠.会计数据采集中的元数据标准探讨[J].会计之友 (下旬刊) , 2010, 02 (02) :53-56.

元数据方案实施意见 篇5

DC元数据方案是一个非常灵活且及具扩充性的方案,然而对于各馆合作的同一个项目,原则上应该制订一些 统一规则,例如元数据元素的增删取舍以及限定方式等,当然也可以由各馆自定,这样会在一定程度上影响到互操作性。制订统一规则的难点是必须经过各馆统一一 致的详细讨论,这是一项耗时费力的工作,必须由项目组负责协调组织。

首先必须说明的是,根据项目技术组的结论:

DC只是提供互交换性的中间层,虽然是必需的,但不一定要物理存在,物理层为第二层即MARC或TEI Header,通过自动转换动态获得,或重新抽取均可;

元数据的表达只有在HTML4.0及XML中才能采用RDF方式实现,鉴于目前HTML3.2普遍采用,本项目完成时前者也不一定能完全取代后者,据此本实施意见仍旧考虑了在HTML3.2中利用“META”方式表达元数据元素的方法;

本文涉及许多规则,如DC、RDF等,至今仍然是草案,尚处在不断的变动中,未承诺任何版本兼容性,是否能够得到广泛支持尚不得而知;

本文作为本项目工作小组的研究报告,根据以上会议精神,将对项目元数据方案进行进一步的描述和限定,为便于实际实施,特进行实例描述。

目录

一、DC元素定义及其限定

二、RDF框架及其含义

三、实施实例及说明 DC在HTML2.0/3.2中的应用

DC在HTML4.0中的应用

DC的扩展应用

RDF与DC的应用

四、实施建议

一、DC元素定义及其限定

关于DC的历史影响、结构框架以及为何选用DC作为最小元数据集合的原因本文不再赘述,请参见文末所附的参考资料:

下文给出DC十五个元素的中文基本定义,原文定义请参见其主页: http://purl.org/metadata/dublin_ core。

DC元素基本描述

以下是对DC元数据元素集的参考定义,关于进一步的描述或任何已经定义的限定,请见下列地址: http://purl.org/metadata/dublin_core。在以下的描述中,为便于进行语义上的理解,每个元素都有一个描述性的名称,同时为便于在一定的编码体系中使用,每个元素都有一个正式的标签(Label)。尽管HTML之类的环境并不区分大小写,我们还是建议在实际使用中按照下文所定义的标签大小写来进行书写,以免在转换或移植到其它环境时发生冲突或歧义,如在XML中。(参见 http://中嵌入上述代码特别有用,因为在非缩写格式中,”上海科文工作室”将被作为显示字符析出,而在缩写格式中则无这样的问题。同样例五中的描述可缩写成如下格式: CARD:Name=”John Smith” CARD:Email=”smith@home.net” CARD:Affiliation=”Home, Inc.” />

四、实施建议(未完成)实施建议如下:

首先我们认为在语法结构,使用惯例上没有必要将DC进行中文化处理,而沿用国际通用的英文描述方法。对DC的基本定义也没有必要进行重新修订,以利于信息与国际上的交流。以DC为基本框架

以HTML2.0/3.2格式为主

地理信息元数据 篇6

关键词 教学资源描述 元数据 RDF

中图分类号:G642 文献标识码:A

0 引言

信息化是教学改革的重要组成部分,在教师课前备课、课中授课、课后复习等教学环节中充分利用互联网络的便捷性和计算机展示技术的多样性,已形成广泛的共识。而目前已建成的各类网络教学资源,由于建设形式多样,技术不统一,缺乏必要的建设指导规范和标准,共享率及利用率普遍比较低,无法对已建的各类教学课件资源进行有效的检索查询,极大地制约着教学资源的实际使用,也阻碍着多媒体教学工作往深层次的优化。本文研究教学资源的共性语义描述,在都柏林核心元数据的基础上,实现对教学资源的扩展元数据规范定义,给出适用于Web实现的RDF框架描述。

1 元数据及RDF框架

元数据(Metadata),一般认为是描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来实现如存储位置、历史数据、资源查找、文件纪录等功能。元数据能为各种形态的数字化信息单元和资源集合提供规范、普遍的描述基准和方法,对资源的组织和管理具有重要作用。网络教学资源的元数据的主要目的是描述网络教学资源的属性信息,用来快速地识别资源、评价资源、追踪资源、过滤资源和使用资源,是教学资源的特征属性数据。

资源描述框架(Resource Description Framework,缩写 RDF),是万维网联盟(W3C)提出的一组标记语言的技术标准,以便更为丰富地描述和表达网络资源的内容与结构。RDF 定义一套可描述知识概念和实例的规范标准,专门用于表达网络资源的元数据,在语义表达和交换上更灵活。它提供了一种用于表达信息,并使其能在应用程序间交换而不丧失语义的通用框架。RDF用形如 (classes—properties—values)类似于面向对象(类—属性—值)的三元组来描述Web 上的各种资源和它们之间的关系,并提供了固有的语义单元。应用领域专用的类和属性需要通过对 RDF 的扩展来定义,这种扩展通过RDF Schema来实现,RDFS不提供实际的应用程序专用的类和属性,而是提供了描述应用程序专用的类和属性的框架。

2 网络教学资源元数据框架设计

网络教学资源元数据是构建基于Web的学习门户的基础数据规范,主要解决异构类型多的网络学习资源的整合以及系统间的通信规范,可促进网络教学资源的高效配置和综合利用。框架设计核心元数据规范、知识点元数据规范、图像通用元数据规范、动画通用元数据规范、音视频通用元数据规范,核心元数据规范是框架的核心,遵循柏林核心元数据规范扩展。

3 核心元数据规范

核心元数据规定了网络统一学习服务门户所需的核心元数据、各元素的语义定义,以及学习资源的信息标识、内容、管理和维护等描述信息。

(1)标识符

URI:http://www.***.com/core/terms/identifier

中文名称:标识符

英文名称:identifier

定 义:资源的唯一标识

数据类型:字符串

值 域:自由文本

(2)名称

URI:http://www.***.com /core/terms/title

中文名称:名称

英文名称:title

定 义:资源的名字或称谓

数据类型:字符串

值 域:自由文本

注 释:必选项,最大出现次数为1

(3) 创建日期

URI:http://www.***.com core/terms/create_time

中文名称:创建日期

英文名称:create_time

定 义:资源最初的创建日期

数据类型:日期型

值 域:日期,按GB/T 7408执行

注 释:必选项,最大出现次数为1

(4) 最新修改日期

URI:http://www.***.com /core/terms/last_modify_time

中文名称:最新修改日期

英文名称:last_modify_time

定 义:最近一次修改资源信息的日期

数据类型:日期型

值 域:日期,按GB/T 7408执行

注 释:必选项,最大出现次数为1

(5) 描述

URI:http://www.***.com /core/terms/description

中文名称:描述

英文名称:description

定 义:资源内容的综述性介绍

数据类型:字符串

值 域:自由文本

注 释:必选项,最大出现次数为1

(6)关键字

URI:http://www.***.com /core/terms/keywords

中文名称:关键字

英文名称:keywords

定 义:用于描述资源主题的通用词、形式化词或短语

数据类型:字符串

值 域:自由文本

注 释:必选项,最大出现次数为N

(7)访问控制

URI:http://www.***.com /core/terms/view_control

中文名称:访问控制

英文名称:view_control

数据类型:字符串

值 域:1或2

注 释:必选项,最大出现次数为1

(8) 创建者

URI:http://www.***.com /core/terms/creator

中文名称:创建者

英文名称:creator

定 义:创建资源对象的主要责任人或组织机构

数据类型:复合型

可 选 性:必选

最大出现次数:N

4 结论

本文分析并实现了网络多媒体教学资源的元数据框架,定义了框架的核心元数据、各元素的语义定义。该框架通用性高,便于资源的管理和共用。

参考文献

[1] 孙默.网络多媒体教学资源建设中的问题与对策.中国电化教育,2011.7.

[2] 张靖.基于XML/RDF的MARC元数据描述研究.微计算机信息,2007.36.

地理信息元数据 篇7

标准化是使信息系统的开发和推广实现规范、科学、统一这一体系的关键之一, 是一项非常具有基础性的工作, 同时, 标准化工作也是连接不同领域之间前提, 它为信息系统的相互资源共享, 相互业务合作提供了基本的保障。但是这也就要求了环境统计部门应该增强指导和调整环境各个领域的信息化建设, 为满足信息标准的要求, 例如基本功能、数据模型、业务流程和编码等。基本信息——数据元标准化和环境信息系统的智能化都应包含在国家环境信息的标准化范畴当中。各国政府开始越来越来重视环境保护的投入和管理, 尤其是注重环境保护信息的管理和维护, 并且制定了一系列环境信息相关的标准, 许多其他国家的标准化研究机构集中在环境信息数据字典和数据集规范的研究, 并积累了许多丰富的经验。如美国国家环境保护局 (EPA) 、英国环境厅 (Environment Agency) 和澳大利亚环境部在环境保护信息方面管理和规划。我国在环境信息化建设中也制定了环境信息行业标准, 如我国在2014年12月25日发布了《环境信息数据字典规范》并于2015年3月1号实施, 统一了环境领域的数据元及其属性, 给环境系统内的数据交换、共享提供了可参考的依据, 也为环境信息平台的实现奠定了基础。

当前, 以整理数据项为主的方法还是在相关领域内被广泛应用的方法, 但是这种标准化的方法也存在许多不足之处。例如统计调查表中根据不同的业务单位、业务内容产生许多业务表单, 这些表单会产生许多重叠的信息, 使统计工作增添了许多负担, 而且有些数据集的内容互相包含, 不便于分类统计, 数据的定义、表达格式也都不尽相同。当面对一个包含大量数据的信息源想利用其建立一个信息采集系统的时候, 我们就要清楚地确定出哪些概念可以作为我们定义数据元的基础, 哪些数据元概念中的特性可以作为派生的通用数据元特性, 哪些数据元特性可以被应用数据元继承。明确了这些内容后再对数据元进行标准化工作。

因此, 数据元的标准化应该采用自底向上的方法, 从底层逐步规范信息以后信息采集的数据项, 再在其基础上利用归类好的数据集构建概念数据模型。利用建立类的层次结构和规范数据类型提炼出抽象后的数据元素, 在概念数据模型的约束下建立数据规范, 定义类的属性, 最后建立元数据规范以达到对相关数据元的语境、相互关系的详细描述。通过这样标准化的方法, 可以实现对每个数据元的概念、定义、描述、分类、表示、注册等一系列属性制定统一的标准。从根本上实现了不同部门和不同领域之间的互通互联互享, 避免了资源的浪费重复利用。

从分析数据项到构建概念模型, 这种数据标准化的方法可以准确地将标准化对象定位在类的属性上, 保障了数据标准化进程的稳定和开放。实际生活中随着采集方法或业务领域的不断扩大, 值集也会随之更新变化, 但是类和类的属性在概念上和结构上会是稳定不变的。而面对不断增长的领域知识, 则可以利用不断地更新类的属性和属性对应的值域来得到体现;面对值集的更新, 则可以体现数据标准化在内容上是开放的和可持续的。这样稳定的结构和开放的内容保证了数据标准应用场合或用户需求的不断改变。同时, 在概念模型的约束下, 对象类的逐层划分也就体现了特定类的属性是有限的, 因此数据标准化的对象是可进行有限管理的。

建立数据标准则是构建环境信息系统的重要组成部分, 想要全面了解全国工业企业污染源的各种信息, 实现跨部门、跨系统、跨地域的共享信息平台, 建立统一的标准是解决这一目的的最好途径。

摘要:中国人依然处在环境污染高风险期和能源资源消耗高增长期, 想要改善环境质量必须发挥信息化的支撑和引领作用, 在国家信息化发展的大潮中, 必须要跟随环境信息化建设的逐渐推进, 环境信息化的水平在逐步加强, 要保障环境的监管能力和服务能力。我国的环境统计信息主要来源于各类的统计调查, 然而调查表式和指标也随着统计调查制度的改变而改变, 为统计工作增加了困难。随着信息技术的发展, 元数据和数据元的理论与技术是支持信息资源有效开发利用的重要信息技术之一。

关键词:环境,信息化,数据元,元数据,规范

参考文献

[1]魏宏, 章建方.数据元在电子政务标准体系中的概念与实践[J].信息技术与标准化, 2004, (5) :15-17.

元数据与RSS个性化信息服务 篇8

个性化信息服务既是一种个性化服务, 又是一种信息服务。它旨在以用户的需求为策略, 以内容为管理核心, 允许用户根据自己的兴趣获取定制服务, 以提供智能化的、高效的信息服务。

通过建立基于元数据的用户信息, 个性化信息服务就能对信息进行快速组织, 并递送给真正需要它的用户。实际上, RSS是一种简单的RDF/XML格式, 用于为整合客户端内容提供选择性的、汇总过的Web内容。作为一个符合XML标准的应用, RSS实现了“拉”信息向“推”信息方式的转变, 它使得我们可以按照自己的喜好和需求订阅来自多种渠道的信息源, 这实际上就是在享受一种个性化服务。

2 RSS的元数据

元数据的目标是描述Web内容的特征, 因此需要定义基本的描述元素, 如:URL、标题、日期等, 并给出相应的语义。RSS规范描述了XML元素的一个简单子集, 它致力于建立标准和开放的频道描述框架 (Channel Description Framework) 和内容收集机制 (Content Gathering Mechanism) , 它没有定义复杂的元素和属性, 而是在定义核心框架和基本元素的基础上, 通过XML-namespace机制复用其他元数据集来扩展自己的元素和功能。

RSS将网站看作一系列频道 (channels) 的组合, 每个频道包含一系列资源 (items) , 因此通过对频道及所含资源的描述可实现对作为资源集合的网站的描述。这个利用RSS元数据描述的网站内容汇总文件称之为一个RSS feed。RSS feed由内容提供者的网站发布和推广, 再通过内容整合者的前端集成使用。RSS feed通常由4个主要元数据组成:、、, 以及一些附加的元数据。其中元素包含: (1)是与频道内容对应的包含了完整内容的网页URL; (3) 是与频道内容有关的简单描述; (4) 元素指定了与一个频道对应的图像; (5) 元素用于呈现一个HTML表单字段, 以便提供用户的输入; (6) 元素指定频道中的一个内容项, 比如新闻文章的大标题, 它的超链接指向频道提供者网站上的完整内容。

3 元数据在RSS个性化信息服务中的应用

通过RSS可以建立一个规范化的用于描述Web资源的元数据集。各个站点只需按照这一标准, 编写描述自己资源的RSS文档, 就可以被用户订阅, 提供及时的个性化的信息服务。另一方面, 在规范化描述自己的资源后, RSS前端必须将众多的RSS文件资源进行信息集成: (1) 主动从网络抓取RSS文件; (2) 从站点提交的RSS发布文件被动获得RSS文件。然后通过某种方式将所得的资源站点的信息元数据存储在数据库中, 并编制索引方便用户查询, 如图1所示:

首先, RSS前端对获取的RSS资源文件进行解析, 因为RSS是基于RDF/XML的, 所以可以用DOM或者SAX解析器来解析, 解析后抽取其中符合规范的元数据, 将其对应存入数据库中。抽取的过程应该经过元数据规范性的判定。因为在channel中包含了符合规范的RSS元数据, 所以主要根据channel、item、image、textinput等几个元素来抽取相关的元数据。然后将元数据集成, 并编制索引以方便用户的查询或者进一步处理。由于关系数据库优异的查询速度和灵活的存储结构已被广泛接受, 所以在集成的时候, 可以将RSS通过一个转换器转换为关系表进行存储。

以下是一个RSS文件的例子:

将例子中的元数据抽取后, 存入对应的数据库中, 即转换为以下列出的一些关系表, 如表1、表2和表3所示:

由此, RSS个性化信息服务中元数据的应用可归纳为以下几个方面:

(1) 信息编目。定期搜索、更新网络上的可用信息资源, 与用户兴趣相关联, 构建信息产品的元数据目录, 使信息用户可以显示和访问该目录。

(2) 信息用户描述。为信息用户建立用户信息模型, 建立模型的元数据描述包括用户自定义的需求信息和兴趣偏好。用户提交RSS订阅后, 即可定期收到所关心信息内容的产品目录。

(3) 消息传输。用RDF/XML描述的元数据可以方便地在异构平台上进行解析。

4 结束语

RSS技术真正体现了“将特定的信息提交给特定的用户”这一个性化服务宗旨。元数据技术为网络信息资源的存储、检索、定位和交换提供了统一的格式, 从资源描述的角度为RSS个性化信息服务提供了解决方案。

摘要:RSS技术旨在“将特定的信息提交给特定的用户”, 为网络个性化信息服务开辟了一条新路径, 其中, 元数据技术从资源描述的角度为RSS动态的信息服务机制提供了解决方案。

关键词:个性化,元数据,RSS,信息服务,XML

参考文献

[1]吴振新.RSS元数据在门户网站建设中的应用[J].现代图书情报技术, 2004 (10) .

[2]陈艾东, 张路桥, 甘刚.RSS元数据的信息抽取集成技术[J].微处理机, 2007 (3) .

[3]林媛康, 唐鸣亮, 吴月宽.基于元数据的个性化信息服务[J].信息技术与信息化.2007 (1) .

[4]宗校军, 沈轶, 廖晓昕.基于Web元数据的定题信息采集[J].系统工程与电子技术, 2007 (2) .

[5]王力.基于元数据的WEB信息描述方法的应用研究[J].微计算机信息, 2007 (6) .

[6]陆伟, 寇广增, 魏泉.Web环境下的内容抽取及RSS发布[J].情报杂志, 2005 (9) .

[7]袁莹, 边馥苓.RSS技术在地图服务中的应用研究[J].武汉大学学报 (信息科学版) , 2006 (8) .

地理信息元数据 篇9

科研管理信息系统是实现科研组织为管理好本单位科研过程与相关要素的信息系统。近年来,随着技术的不断进步以及科研管理业务的增加,科研管理各级部门已建成了一批具有相当规模的不同资源类型、不同学科的数据库,形成了一个庞大的、分布式的、系统异构的、资源类型多样的数据库群。科研管理信息资源产生于科研机构管理活动的各个环节和部门,信息资源由相关机构分权管理、储存地点分散、搜寻不易,使得对科研管理信息进行综合管理与共享变得十分困难[1]。随着数字科研工程的开展,数字化、电子化和网络化的科研资源信息将会得到迅速地积累和增长。因此,如何充分利用、共享、交换和整合这些海量级、呈爆炸式增长的科研管理信息资源,实现信息资源的共享,依据信息属性对信息资源进行采集、分类、加工处理和存储,实现信息资源的有序组织,使之能更好地服务科研人员、科研过程与科研管理,便成为急需解决的问题。科研管理信息资源的核心元数据的建设是解决上述问题的关键。

元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据(structured data)。元数据通常用来描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关的信息,是实现数据有效发现、管理、共享、交换和整合的重要手段。元数据的重要作用可以从数据资源和服务两个方面来看。就数据资源而言,科研管理信息资源可以利用元数据标准和技术描述及对外发布其现有的数据资源,提高数据的可用性和被利用率;可以通过元数据记录有关数据的建立、结构以及维护等方面的信息,数据管理者可以通过这些元数据对数据资源进行有效的管理,数据使用者也可据此了解数据资源的一些背景资料;元数据的使用能够在一定程度上消除数据资源之间的语义独立性和异构性,帮助实现数据资源的整合和交换。而服务是向需求对象提供一种或多种价值的功能的活动或行为,它使得数据资源得以被访问、管理和向用户提供增值应用。数据资源元数据和服务元数据两者分别属于不同层面上的元数据规范,但对于数据资源而言,二者可共同为数据资源的充分利用奠定良好的基础。

二、元数据标准及其研究进展

现有的研究中,还没有科研管理信息资源元数据研究,但是已有些相关的元数据标准可以作为借鉴。目前可以用于借鉴的元数据标准主要有都柏林核心元数据标准、中国科学院科学数据库核心元数据标准和政务信息资源目录体系元数据标准[2]。

都柏林核心元数据标准(Dublin Core Metadata Element Set,简称DC)由美国OCLC和NCSA(National Center for Supercomputing Applications)发起,国际性合作项目Dublin Core Metadata Initiative设计,由参与合作项目的机构共同维护修改[3,4]。最初的目的是为了网络资源的著录与发现,由于DC元素简单易用,加之OCLC(Online Computer Library Center)的大力推广,它已发展成为一种可用于描述任何信息资源(“任何具有标识的对象”)的元数据标准。都柏林核心元数据产生于1995年,目前的最新版本为Version 1.1,根据DC1.1版本,DC由15个基本元素构成,这15个元素可分为资源内容描述信息、知识产权描述信息、外部属性描述信息三大类。

中国科学院科学数据库核心元数据标准是由中国科学院计算机网络信息中心制定的用于建设中国科学院科学数据库的核心元数据标准,于2003年5月发布了1.0版本。随后,标准规范工作组对1.0版本进行了修改,形成了标准的1.1版本,并于2003年8月正式发布使用。2004年,标准规范工作组在继续跟踪国际上元数据研究的发展趋势,结合科学数据库核心元数据标准1.1版推广应用的总结和用户的反馈,形成了元数据2.0版。中国科学院科学数据库核心元数据标准主要包含数据集描述信息等七个方面。

政务信息资源目录体系以国家统一的电子政务网络为基础,通过构建覆盖中央、省、市、县的多级政务信息资源目录体系技术总体架构,采用元数据对共享政务信息资源特征进行描述,形成统一规范的目录内容。2007年由中华人民共和国国家质量监督检验检疫总局和中国国家标准化管理委员会联合发布了政务信息资源目录体系核心元数据标准。政务信息资源目录体系核心元数据标准主要包括资源内容描述信息、资源管理信息、资源获取方式信息三个部分[5]。

尽管各组织对元数据的划分有一定的差异,但他们所包含的内容却具有很大的相似性。表1为上述元数据标准内容之间的对比分析,从表1中展示的内容可以看出,虽然几个标准都是从某个方面对数据进行描述,标准之间有者一定的差异,但是都基本涵盖了数据的主要方面[6]。

三、科研管理信息资源核心元数据确定的原则和主要内容

1. 科研管理信息资源核心元数据确定原则

元数据是描述数据集结构化与非结构化数据,是对于信息系统与信息工程以及信息表达对象最深刻最全面理解的体现。而核心元数据又是描述数据集所需的基本元数据的集合。因此,科研管理信息核心元数据的确定需要遵循以下几个原则[7,8]:

(1)实用性。在建设科研管理信息资源目录元数据标准时,既要考虑数据资源单位的数据资源特点以及工作的复杂、难易程度,不能选取太多我元数据元素,过于复杂不便实际使用;又要充分满足工程建设以及用户的需要,不能过于简单。在复杂与简单之间取得平衡,才能不能真正满足各种用户的需求,同时实现共享系统的最大效益。

(2)准确性。科研管理信息内容涉及到人力资源、科研项目、综合财务、科研条件、国际合作、院地合作、知识产权、评估评价、基本建设等内容。因此,在确定核心元数据内容时,需要准确而简洁地将科研管理信息资源数据集主要特征的数据整合起来。

(3)结构性。由于核心元数据内容存在着复杂的逻辑结构关系,因此,需要用模型表示其中的逻辑关系,以便对核心元数据进行修改或扩展时不破坏整体结构,并且作为核心元数据实现的概念模型[3]。

(4)一致性。由于元数据是对其他标准的高度概括,在建设元数据时,应参考相关领域现有的国际标准与国家、行业标准,尽量采用国内外先进标准。

(5)前瞻性。标准不但要满足现阶段科学数据共享建设的标准化需求,更应该考虑将来一定时间内由于科技发展等原因可能产生的标准化需求,这样制定出的标准才会更有生命力。

2. 科研管理信息资源核心元数据主要内容

科研管理信息资源核心元数据内容是主要以都柏林核心元数据DC(Dublin Core)和《中国科学院科学数据库核心元数据标准2.0》为标准,并扩展少量具有科研管理信息资源目录特色的元素,对科研管理信息资源的每一条记录进行描述,形成科研管理信息资源目录核心元数据标准。

科研管理信息核心元数据主体包括描述信息、元数据参考信息二个主要复合元素模块,且二者均为必选模块。此外,还包括联系信息一个辅助模块,此模块不可单独使用,供其它模块的特定元素在需要的时候进行引用。

(1)描述信息。描述信息模块是记录数据集基本信息模块,是一个必选模块。通过使用描述信息模块,建设单位可以对数据集的基本属性信息进行详细描述,例如数据集名称、简介、创建者、来源等,数据集用户可通过浏览这些描述信息对数据集形成一个总体了解。

(2)元数据参考信息。元数据参考信息模块是关于数据集元数据本身状态的信息,为必选模块,包括元数据标准名称、元数据创建日期、元数据联系信息等内容。通过该模块,一方面,数据集用户可以了解到与元数据记录的建立有关的信息,另一方面,元数据参考信息将有助于元数据维护人员进行元数据的修改与维护。

(3)联系信息。联系信息模块记录与数据集有关的联系信息。该模块不可单独使用,而是被主要模块的有关元素引用。

四、科研管理信息资源核心元数据的设计方法和框架结构

科研管理信息资源核心元数据的建设,主要是为了对已有信息资源进行规范和重新组织,实现信息资源的共享,通常是用在科研管理信息资源管理平台中。元数据作为科研管理信息平台的重要组成部分,起到规范整理资源的作用。

1. 元数据在平台中工作流程

科研管理信息资源平台的系统工作流程为:数据提供者向科研管理信息资源库提供数据,再根据元数据标准提取元数据,并进行分类,再把元数据注册到元数据注册管理系统,存入科研管理信息资源元数据库中。使用者通过元数据目录服务系统进行查询,获取所需科研管理信息资源相关数据。系统工作流程如图1所示。

2. 科研管理信息资源核心元数据工作原理

数据从数据源到数据仓库的过程中需要经过ETL(抽取、转换、加载)操作,在数据仓库之中数据得到集成,从数据仓库到数据集市的过程中也需要进行相应的ETL操作,从数据集市到数据报表实际上是为服务提供数据。在这个数据集成的过程中,数据需要进过不同的数据源、ETL操作、数据表格的存储(Database tables)以及数据中心所能提供的服务,而这一切都需要元数据进行描述,在数据仓库之中需要建立元数据信息库(Metadata Repository)对数据集成的整个流程进行管理。元数据工作原理如图2所示。

3. 科研管理信息资源核心元数据工作流程

元数据制定与使用分为三个层次,首先,元数据开发人员根据都柏林核心元数据DC(Dublin Core)和《中国科学院科学数据库核心元数据标准2.0》,建设科研管理信息目录体系核心元数据,产生元数据标准;然后,编目员把元数据标准应用到科研管理信息资源,产生元数据记录;最后,用户利用元数据记录发现科研管理信息资源。元数据工作流程如图3所示。

五、结语

科研管理信息资源元数据标准是对分散的科研管理信息资源进行整理的重要工具,在科研管理需求的信息资源的基础上,通过遵循统一的元数据标准规范,对已有信息资源进行规范和重新组织,实现信息资源的共享,最终满足用户在大量科研管理信息资源中准确、全面、迅速、方便、经济地获取所需信息内容的各种要求,是科研信息资源管理的重要目标。本文在都柏林核心元数据标准、中国科学院科学数据库核心元数据标准和政务信息资源目录体系元数据标准基础上,结合科研管理信息资源的特点,整理出科研管理信息资源核心元数据主要内容,并分析了其在科研信息资源管理平台中的作用以及其工作流程,为有效管理各类信息资源提供重要参考。

摘要:随着信息技术的不断发展,科研管理信息系统已经实现了业务的信息化。然而这些系统无法进行信息交流,导致了“信息孤岛”的现象。业务间关联使得科研管理需要进行数据交换,因此有效解决数据集成问题具有重要的现实意义。而元数据中包含的数据结构和语义说明信息是数据集成的重要信息,因此元数据建设是数据集成关键技术。本文以都柏林核心元数据DC(Dublin Cord)、中国科学院科学数据库核心元数据标准2.0和政务信息资源目录体系为主要参考依据,结合科研管理信息资源的特点,研究确定了科研管理信息资源核心元数据主要内容,并分析了其在科研信息资源管理平台中的作用以及其工作流程。

关键词:科研管理信息,数据仓库,元数据

参考文献

[1]胡永健,周寄中.科技资源信息元数据质量审核方法研究[J].管理评论,2011,(23):41~47.

[2]吴显义.我国元数据研究现状分析[J].情报科学,2004,(22):4~7.

[3]吴建中.DC元数据[M].上海:上海科学技术文献出版社,2000.

[4]Guimaraes,T.Information Resources Management:Improving the Focus[J].Information Resource Management Journal,1998,DOI:10.4018/irmj.1988100102.

[5]李霖,郭仁忠,桂胜.电子政务信息资源目录体系建设及案例[M].北京:科学出版社,2009.

[6]刘嘉.元数据:理念与应用[J].中国图书馆学报,2001,(5):32~36.

[7]Fox,C.,Levitin,A.and Redman,T.The Notion of Data and its Quality Dimensions[J].Information Processing and Management,1994,(30):9~19.

地理信息元数据 篇10

关键词:元数据,管理信息系统,用户需求,灵活性,可扩展性

1 引言

传统的管理信息系统开发大多从建立数据表结构开始, 然后根据数据表的内容设计窗体并完成各窗体访问数据库的代码编写。这种模式的开发过程, 一方面无法包含项目的全部需求设计, 例如系统的状态无法统一设计, 最终导致每个程序员都可以直接操控系统的状态, 导致整个系统状态运行混乱;同时还非常容易将实体表和关系混合在一起, 造成分析者视觉混乱, 无法正确分析出系统的真正基本实体;另外还会导致软件系统以数据库为中心的编码架构, 进而产生传统过程化编程风格, 难于维护和拓展, 甚至性能低下。

元数据主要描述管理信息系统的数据结构及其界面显示模型。在系统的开发过程中, 通过建立一个元数据管理表管理元数据内容, 通过界面静态生成法和动态生成法, 探讨了基于元数据开发管理信息系统的优缺点。

2 结构

根据系统开发的需要, 本系统大体分为三层结构:模型层、驱动层和应用层。

其中, 模型层主要包括:界面模型、业务流程模型及数据模型。界面模型主要描述界面元素各种物理属性, 如位置信息、大小信息、布局方式、对齐方式、间距控制、垂直间距、字体信息、颜色设置、图片信息;业务流程模型主要描述业务功能相关的各种操作及相互之间的关系;数据模型描述系统中各种资源相关的数据属性及逻辑关系。上述模型的描述全部通过元数据的方式存储在元数据管理表中。

驱动层包括:界面代码生成引擎、业务操作代码生成引擎和数据库操作代码生成引擎。界面代码生成引擎根据界面模型元数据通过中间件技术在运行期生成系统界面;业务操作代码生成引擎根据业务流程模型元数据通过中间件技术完成系统业务功能;数据库操作代码生成引擎根据数据模型元数据在运行期动态生成查询语句和数据操作语句, 实现与数据库的交互访问。

应用层则是在以上两层的基础上, 根据各个功能模块组成的系统单元。

3 实现

3.1 元数据管理

本系统基于Access进行开发, 为方便管理元数据, 特建立元数据表, 元数据表结构如表1所示。

其中, 元数据编码采用层次码, 将数据库中的各表按逻辑关系进行区分, 其部分数据如表2所示。

3.2 实现思路

静态界面生成法的基本思路是:按照元数据表中的内容, 根据Delphi源程序文件的格式自动生成单元文件和窗体文件, 并将生成的这些文件引用到工程文件中, 然后通过手工调整界面元素, 再对源文件进行编译, 生成可执行文件。

Delphi是以工程为中心来开发应用程序的, 即每个应用程序都是一个工程, 由一个或多个文件及工程文件组成。组成工程的几种文件包括:工程文件、单元文件、窗体文件、资源文件、工程选项及桌面配置文件、中间编译单元、备份文件、包文件等。与界面相关的文件主要包括单元文件和窗体文件, 但作为一个完整的工程项目, 在工程文件中对所包含的单元文件要进行指定。因此, 与静态界面生成法相关的文件主要包括工程文件、单元文件和窗体文件。

为保证上述3个文件的自动生成, 首先建立一个文件基类, 并在此基础上派生3个文件类, 如图1所示。

文件基类的定义如下:

其实现代码如下:

3.3 工程文件生成

工程文件以关键字program标识, 工程文件的扩展名为.dpr。为实现工程文件的自动生成, 将工程文件分为4大部分。第一部分为文件的头部, 内容较少且没有什么变化, 详情见头部初始化函数InitialHead;第二部分为单元引用部分, 主要是将工程中引用的文件全部罗列出来, 因此, 在静态界面生成过程中每生成一个单元文件, 就要加入到工程文件的单元统战部分;第三部分可以称为窗体生成部分, 若需要将静态生成的窗体在程序运行时自动创建, 则需要将生成的界面窗体置于窗体生成部分;第四部分为结尾部分, 该部分比较简单, 而且是不变的, 只有两个语句, 详情见工程文件类的文件尾部初始化函数InitialFileEnd。

建立的工程文件类TProgramFileClass, 其定义如下:

其实现代码如下:

3.4 单元文件生成

工程文件以关键字unit标识, 工程文件的扩展名为.pas。单元文件的主要任务是申明本窗体中引用的各个控件, 并实现相关的功能, 文中仅对界面生成的各个控件进行申明。从单元文件的实现过程来说, 可以将单元文件切割为三部分。第一部分为单元文件引用Delphi自带或本工程生成的有关文件, 变化相对较少;第二部分为控件申明部分, 当在窗体中添加一个控件时, 需要在控件申明部分进行申明;第三部分为文件的结尾部分, 变化也较少。为实现单元文件的生成, 建立单元文件类TUnitFileClass, 其定义如下:

其实现代码如下:

3.5 窗体文件生成

窗体文件的扩展名为.dfm, 它的主要功能是控制窗体中各控件的排列布局, 每当添加一个控件时, 需要在适当的位置对该控件的属性进行描述。由于描述控件布局的参数较多, 若全部以参数的形式调用函数的话, 会显得比较复杂, 为此, 建立一个数据结构TComponentParameter, 其定义如下:

为实现窗体文件的自动生成, 建立窗体文件类TFormFileClass, 其定义如下:

其实现代码如下:

3.6 主控程序的实现

主控程序负责读取元数据表中的内容, 并通过上述类的接口, 实现相关界面元素的自动生成, 其实现流程如图2所示。

其实现代码如下:

4 总结

地理信息元数据 篇11

〔关键词〕元数据;仓储整合;资源整合;统一检索

〔中图分类号〕G250.73 〔文献标识码〕B 〔文章编号〕1008-0821(2012)10-0046-04

“我们淹没在信息的海洋中,却饱受着知识的饥渴”这句话恰到好处的形容了我们所面临的信息环境[1]。随着计算机技术和网络技术的迅猛发展,图书馆所面临的信息环境发生了巨大的变化,馆藏资源除了传统的印刷型文献以外,还包括数字图书、数字期刊以及网络资源等不同类型的资源。由于这些资源分布于不同的数据库当中,每种数据库的构建方式、支持平台都不尽相同,同时数据的组织形式、管理模式以及存储格式也不尽相同,这就出现了数据库之间的异构性问题。不同的数据库之间知识关联程度较低,而且内容交叉重复。当用户检索文献时,由于各数据库的检索界面和检索方法都不一样,用户需要在不同的数据库之间进行切换和重复操作,无法实现“一站式”的便捷检索,同时查准率、查全率也难以得到保障。因此,如何有效地对数字资源进行集成、重组、整合,建立具有关联性的资源体系,以解决“数字信息孤岛”,提高数字资源的利用率成为图书馆迫切需要解决的问题[2]。

1 国内外资源整合系统的介绍

20世纪90年代,国外图书馆和IT界就开始了有关数字资源整合方面的相关研究[3]。相继开发出一些功能完善、应用成熟的数字资源整合系统,如ExLibris公司开发的SFX、MetaLib和DigiTool等产品,探索出一套完整的数字资源整合解决方案[4];Iunovative Innovativefaces公司的MAP(Millnenium Access Plus)系统,通过WebOPAC的搜索功能及Innopac Milennium版的管理模块将馆内的各类型的电子资源整合到一套资源存取管理工具中[5]。此外,还有UnionSearch Platform、ENCompasswith Link Finder Plus、WebFeat、Ilink、Chameleon iportal、Iport、Zportal、Xdierctory and Xflow、Uportal等系统,在国外也有很广泛的应用[5]。特别是由ProQuest的Serial Solutions部门开发设计的Summon服务系统,近年来引起了业界的广泛关注,获得了由软件和信息协会(SIIA)颁发的2011年的CODIE奖,被誉为最好的企业检索解决方案[6],成为北京大学图书馆数字资源整合的3个备选系统之一[7]。

我国图书馆探索数字资源整合研究始于2003年,之后逐渐受到关注。在理论研究方面,《电子图书馆整合检索之理论与实践》(台湾的陈昭珍学者所著)是我国第一部数字资源整合方面的著作,该书分析了图书馆进行数字资源整合的必要性以及整合模式,介绍了Z39.50协议在数字资源整合中的应用,并对今后的整合检索发展趋势作了一些前瞻性的展望[8]。李家清的《信息资源整合》、贾宏的《数字图书馆网络信息资源整合及其技术分析》,以及马文峰主持的国家基金项目“数字资源整合的理论与方法”,都对数字资源整合理论进行了深入的探讨。在应用实践方面,由于相关研究起步较晚,目前国内相对成熟的数字资源整合系统并不多,具有代表性的有清华同方的异构统一检索平台USP(Union Search Platform)、北京拓尔思(TRS)的资源整合门户(TRS IIP)和参考链接系统(TRS Info Linker)[1],还有超星的读秀和Medalink(百链)系统等。

2 资源整合案例——以沈阳航空航天大学图书馆为例 近几年,沈阳航空航天大学图书馆(以下简称我馆)加大了数字资源的引进和自建力度。目前,我馆以各种形式开通的中外文数据库达到了28个,自建专题数据库5个,数据存储达到42.6 TB,此外还开通了多个免费的数据库,形成了以引进数字资源为主、自建数据资源为辅的类型多样、内容广泛的馆藏数字资源体系。2011年,我馆成功申报了中央财政支持地方高校发展专项基金项目“辽宁省航空航天专题数字资源共享平台建设”,以此为契机,为了提高我馆数字资源的利用效率,把异构资源统一检索平台作为项目建设的重点工作,进而实现数字资源的深度整合。

2.1 资源整合系统的选择

数字资源整合是在各种数字资源自主性、分布性、异构性的基础上,运用各种集成技术和手段将各类数字资源集成在统一的利用环境下,实现“一步到位”的检索,让用户极其方便的利用各种数字资源,为其节省宝贵的时间和精力[9]。数字资源整合需要借助相对成熟的软件系统,整合系统的选择就显得至关重要。对于国外的资源整合系统,考虑到成本高、空间距离远以及技术支持响应速度慢等因素,首先被排除掉,不作为备选方案。国内的资源整合系统,理论上有两种实现统一检索的资源整合方式,即通过抽取元数据的深度资源整合和通过技术层面的外挂式资源整合。我馆重点调研和试用了清华同方的异构统一检索平台USP、超星的读秀和Medalink(百链)两个系统。

清华同方的USP采用了双层的B/S结构体系,包括用户注册和引擎配置模块、统一检索模块以及检索结果显示模块三部分[10]。它的工作原理是分析异构数据库的各个字段,进行字段间的映射,再把用户的检索请求转换成能被不同数据库接受的检索表达式,通过数据库厂商提供的数据接口并发检索本地或互联网上的多个数据库,最后对检索结果进行去重、排序,并以统一的格式将检索结果输出到结果页面上。USP的检索过程相当于代替用户同时登陆多个异构数据库进行检索并把检索结果返回给用户。如图1所示。

图1 USP检索原理

读秀和Medalink学术搜索,是由超星公司研制开发的基于海量元数据及全文数据的中外文知识搜索和文献传递系统。读秀学术搜索是全球最大的中文文献资源服务平台,Medalink整合了国内高校图书馆购买的100多个外文数据库的元数据,也被称作“外文读秀”[11]。元数据是关于数据的who、what、when、where、why and how,是“关于数据的数据”[12]。读秀和Medalink的工作原理是将所有可利用的异构数据库内资源对象的元数据记录导入到一个新的数据库中,归并、查重、处理后重新生成全文索引,当用户提出检索请求时,为用户提供指向数字资源的超链接。如图2所示。

图2 元数据检索原理

我馆自2011年3月开始,先后对上述两个资源整合系统进行了全面、深入的试用,覆盖了我馆的馆藏书目、28个商业数据库以及5个自建数据库。对于本地资源,主要测试、评估对数据的映射、收割和导入,以及对信息的揭示和资源获取的速度等方面;对于外网资源,进行了对元数据索引中数字资源规模、质量的考察,以及与我馆所购数字资源覆盖程度的比对。通过试用对比发现,基于跨库检索模式的资源整合系统,仅仅通过建立一个代理界面来接受用户的检索请求,并将这些请求转换成相应的数字资源系统方法和检索语言,并将各个资源系统返回的检索结果进行排序和整合[13]。这种整合模式,尽管技术简单、操作方便,而且不占用大量的存储空间,但是限于目前计算机的处理能力和网络宽带等因素,需要很长的时间才能将检索结果返回到用户统一操作界面,浪费了用户大量的时间,同时检索结果的去重、查全率和查准率并不能得到有效的保障。而基于元数据仓储的资源整合系统,通过对元数据的聚合,为资源整合打下了一个实际的同构基础。经过收集、转换后,不仅数据格式统一、结构清晰,而且可以按照用户的需求建立多种分类体系,甚至可以实现对数据更高级的组织和管理。另外,在整合资源规模,特别是外文资源方面,超星的资源整合系统远远好于清华同方的系统,也更适合于我馆,可以很好的弥补我馆外文文献的不足,所以,我馆选择了与超星合作,进行数字资源统一检索平台的建设。

2.2 资源整合的目标

采用了基于元数据仓储的数字资源整合模式,整合资源包括本地资源和远程访问资源,其文献类型有纸质图书、电子图书、电子期刊、会议论文、学位论文、报纸、专利、标准、互联网免费资源等。为用户提供统一的检索界面,实现“一站式”的获取服务。检索结果的输出不但速度快、无重复,而且要实现文献类型的聚类以及多角度的导航。利用OpenURL(开放链接) 解析功能,实现检索结果与OPAC系统、数据库全文、网站网页地址、参考咨询以及馆际互借等服务的无缝链接,让用户通过最恰当的途径能够获取目标内容和服务。允许用户采用选择、排序、二次检索等方式处理检索结果,保证用户能够方便、灵活地保存和输出检索结果(下载、打印、E-mail发送等)。

2.3 中心数据库仓储数据的建设

元数据的抓取要通过数据收割工具,将不同文献系统中的数据收割、转换、装载到数据仓库中,数据抓取共分为3个步骤:第一步是本馆已经收集完整的图书元数据、中文期刊元数据以及外文期刊元数据,直接通过Z39.50协议存储到元数据库中;第二步是本馆未收集到的元数据部分,通过OAI-PMH协议的收割元数据工具,收割支持OAI-PMH协议的开放资源的元数据,将其更新并存储到元数据库中。OAI-PMH元数据收割取协议(OAI Protocol for Metadata Harvesting,OAI-PMH),简称OAI协议,是一个在分布式的网络化环境下获取特定元数据信息的标准协议,该协议通过定义一个标准的接口,使服务器能够将其存储的元数据信息有选择地提供给外部应用程序或其他服务器[14];第三步是对于不支持OAI协议的数据库,提供基于网页分析的元数据抓取工具Spider,可以抓取不支持OAI协议的元数据存储到元数据库中。

元数据的处理要借助于智能查重排序分析、OLAP分析以及报表工具等数据分析预处理工具,对关系表实施映射合并处理,提前建立索引,通过相关的事实表、维表用以支持多维业务试图,从而实现对仓储数据的多维分析,以建立标准的元数据格式;元数据存储在中心元数据库中,主要分成索引目录、关系映射数据库,各自发挥着不同的作用。索引目录被用于检索,而关系映射数据库则被用于元数据与原文之间的关联;元数据仓储通过提供OAI-DP服务,可以实现其它应用系统调用并返回XML格式的结果。资源调度系统与元数据仓储进行集成,能够提供调度任务的分发记录;元数据自动更新工具,可以实现对元数据实时更新和发布。元数据的应用流程如图3所示。

元数据收割、抓取元数据查重、索引处理元数据统一检索资源调度获取全文图3 元数据的应用流程

2.4 统一检索系统的建设

元数据以统一格式存储之后,为了搜寻方便,需要建立一个元数据搜索引擎。搜索进程不断监听新的搜索任务,一旦发现有新的搜索任务,则向指定的数据提供者URL发出带不同命令行参数的OAI请求,并得到相应的响应结果,这就是搜索引擎的基本工作过程[15]。其算法选择如下:首先为这些元数据创建一系列索引表,按照题名、创建者、日期、主题等元数据信息的集合形式排列。当用户有检索需求时,输入一个关键字,搜索引擎会到一系列索引表中进行搜寻, 如果搜寻到符合条件的检索信息,会把与此有关的元数据信息全部抽取出来,以提高查全率;同时,为了提高查准率,需要对索引关键词进行筛选。利用过滤器对关键词实施筛选,要从已经标准化的元数据中进行提取,将其格式信息完全过滤掉,进而获得关键字,而不是全部元数据信息,接下来,把通过关键字形成的索引表传送给搜索引擎,再根据索引进行搜寻,搜寻到的结果就是元数据当中的关键字,而这部分关键字则对应着元数据十分完整的信息,用户利用关键字可以很方便地找到元数据对应的数据资源信息,整个检索过程即索引列表——关键字——元数据——资源数据。

资源整合系统支持快速检索和高级检索,支持对文章内容的全文检索;支持多面搜索,即检索一种文献类型资源时,还可以显示出其它文献类型资源信息;同时通过自然语义分析,调整用户检索词的分词体系以达到精确检索、智能检索的目标。系统利用聚类缓存技术及数据库集成技术,使得检索结果的反馈时间以秒级计算。检索结果的输出支持统一格式显示,不但能够实现排序、合并及去重,还能够实现对检索结果的多角度聚类和分组。如图4所示。

图4 沈阳航空航天大学图书馆统一检索界面

2.5 资源调度系统的建设

资源调度系统是帮助图书馆及用户在检索与原文获取之间建立链接的系统,主要解决图书馆文献服务中上下文敏感帮助和原文链接服务。该系统是基于OpenURL标准的多级调度系统,能够自动更新调度知识库,允许自定义本地调度规则并定制个性化调度服务[16]。资源调度系统采用了动态脚本技术来制定调度规则,这样便于增加新的资源与服务,能更有效地实现资源与服务的调度。同时支持向第三方提供资源注册的接口、标准,便于数据商对资源注册信息进行批量更新。

OpenURL是一种开放式的链接框架结构,可以将信息源、信息服务和用户需求很好地融合在一起。OpenURL全文链接同时附带有元数据信息、资源地址信息,利用维护链接解析器,依照相应规则动态生成开放链接的“URL”,一对一、一对多地实现资源之间的链接,并对资源之间的关系进行动态的管理。资源调度遵循着就近最快原则,即对不同资源设立权重,根据客户端来源情况判断优先调度最快资源;遵循自动传递优先于人工传递原则,对于常用资源实现自动传递,自动传递无法判断的需求自动转到人工传递。3 结 语

数字资源整合是信息社会发展的必然,是实现信息共享的前提,是提供优质化服务的基础[17]。基于元数据仓储的数字资源整合系统,具有强大的资源整合功能、完善的数据集成功能、高效的后续服务功能,为用户提供了方便、快捷的“一站式”服务。当然,基于元数据仓储的数字资源整合方案也存在着一些问题,如元数据存储需要占用大量的硬件空间、数据更新可能不及时等,但是总体来看,它还是现阶段比较优秀的数字资源整合方案。

参考文献

[1]闫志红.我国高校图书馆数字资源整合模式研究[D].重庆:重庆大学,2008.

[2]屈冠军.基于实现跨库检索的数字资源整合技术探讨[J].图书馆,2009,(6):86-88.

[3]Anna Coleman,Paul Bracke,Subramaniam Kathik.The Integration of Non—OAI Resources for Federated Searching in DLIST,an Epfints Repository[J].D—Lib Magazine,2004,(10).

地理信息元数据 篇12

1 数据库操作自动化型元数据

无论是对数据库的信息系统还是对数据仓库的信息系统, 对数据库的操作都是最最核心的部分。对于数据库自动化型元数据给出以下概念:信息系统中实现数据操作动态化、智能化、个性化、交互化的元数据。动态化既包括数据表空间内容进行修改后的动态变化, 也包括用户操作集管理、用户管理、数据表空间结构等一些动态修改。智能化涉及到输入、输出、综合查询等信息系统中所包含的各个层面。个性化主要指的是针对不同用户的要求、权限设定不同的输入输出界面。交互化既包括系统之间的交互也包括系统内部的交互。

2 数据库操作自动化型元数据的特点

从文件系统开始到数据仓库技术这一整个的发展过程中元数据始终贯穿其中, 在信息系统的应用、开发中元数据发挥的作用举重若轻。作为一类元数据, 数据库操作自动化型元数据具有以下几方面的特点:

2.1 可重用性

这一特点是元数据在系统中发挥的主要功能, 元数据通过为系统提供可以重复使用的程序包和工具, 从而减小工作量。

2.2 可扩展性

一方面元数据驱动应用具有很强的自身扩展性, 另一方面元数据可以非常方便的加入到新的领域或者应用之中。如:为了扩展一项新的系统功能, 不须要技术人员改变程序代码, 只须要在原有操作树中添加新的组件功能。

2.3 可互相操作性

在需要存取多个元数据先关信息结构上开发综合借口, 或者应用统一接口在多个系统中, 这样可以大大降低交互操作相关的工作量, 从而提升整个系统的工作效率。例如:一个公司的办文管理、行政监督、领导决策等操作都可以建在一个相同的操作集上, 这样在系统中这些操作就有了一个统一的交互接口。

3 数据库操作自动化型元数据在信息系统中的应用研究

无论是通过理论还是经过实践, 现都已经证实了元数据发挥着重要的作用在实现数据复杂并且规模大的系统的过程中。为了充足的体现在实际操作系统中数据库操作自动化型元数据的表示与应用, 该文参照系统功能实现方面的角度将数据库操作自动化型元数据进行分类, 主要对以下三方面的应用进行详细论述。

3.1 实现系统交互的元数据

信息系统全部解决方案中第一需要解决的问题就是如何实现系统之间的交互, 在处理系统之间交互操作问题时元数据的作用、元数据在操作交互过程中的表示都是目前专家们研究的热点问题。传统的系统交互方法降低了系统的高效性、灵活性、通用性, 为解决这个问题, 我们在信息系统中引入了可视化动态映射的一种方式来表示和管理系统交互的元数据, 该方式方便扩展、便于存取, 且后期维护简便, 只需要维护映射表。通常, 在系统之间发生交互时, 此时应用程序会自动选调与之相对应的属性映射表, 数据转换算子作为一个媒介完成数据的交换功能。在系统中表示交互元数据采用映射表的方式, 体现了元数据可扩展性强、表示方法简单的特点

3.2 管理和维护基础数据的元数据

基础数据是系统实现功能的依据, 这样高效灵活的管理基础数据就成为了系统设计的一个主要目标, 所以我们引入了元数据管理机制的概念。在这个机制中所有与基础业务有关联的元数据最终都采用面向对象三元组的方式来表示, 采用这种元数据的管理和表示方式, 一方面可以大大降低数据库访问的工作量, 另一方面可以实现动态表管理, 这样就方便了系统之间元数据重用和共享的实现。

3.3 控制数据流转的元数据

在信息系统中, 不仅要对数据进行管理, 而且还有一个更主要的是控制数据流 (包含系统和用户两个数据流) 。从用户操作的角度出发, 不同的用户权限不同, 且操作各异。如果将用户的数据操作规则以及操作信息在程序中固化, 那么当用户的规则或者操作变化时, 程序就不可避免的需要变动, 所以提出了控制数据流转的元数据。元数据集就像一个可以扩展的大树, 每一个元数据在树的每一个节点的表示方式采用可变数组的方式。

4 结论

该文提出了数据库操作自动化型元数据, 并对这一概念进行了描述, 同时总结了这一概念的特点, 最后从信息系统开发实践这一角度对数据库操作自动化型元数据在信息系统中的应用进行了详细的阐述。最终表明:在信息系统中引入数据库操作自动化型元数据, 一方面可以很大程度上提升整个信息系统的通用性、灵活性, 另一方面还能够提高信息系统开发的效率。

摘要:近几年来, 随着互联网技术的快速发展以及数据仓库技术的不断进步, 元数据相关方面的研究受到越来越多的学术专家的关注。作者以自己系统开发的实践经验为基础, 在通过对元数据理论的深入研究, 提出了信息系统中数据库操作自动化型元数据的基本概念, 并对它的特点进行了概括, 最后介绍了数据库操作自动化型元数据在信息系统中的应用。

上一篇:张家界国际森林公园下一篇:基于消息的模型