空间数据库构建研究

2024-09-30

空间数据库构建研究(通用12篇)

空间数据库构建研究 篇1

在产业集群发展过程中,需要对产业集群的发展状况进行及时地分析和评价,并作出合理的决策。然而,目前在产业集群发展分析和评价方面,缺乏强有力的信息系统支持、对海量产业集群数据的有效管理以及以地域特点为核心的区域经济分析方法和机制。因此迫切需要研究和采用新的数据组织和管理机制,合理高效地构建面向产业集群分析与评价的数据库管理系统和决策支持系统。

基于GIS的空间数据库是目前信息领域中广泛应用的一项技术,它具有界面风格人性化、信息表达更加形象直观、操作简便等特点,实现了文本、图形图像信息相结合的定位、查询、检索模式。通过空间数据库可以将抽象的数据与空间位置建立联系,用户可以在地图上直接对数据库的内容及相关的图表进行形象化、直观化的查询,通过建立专题地图,用饼图、直方图等来表示统计数据,帮助人们加深对信息的理解,使企业管理者和政府部门能够更容易的做出正确决策。

本文从产业集群的实际需求出发,考虑到空间数据的复杂性,采用大型关系数据库Oracle与ArcGIS相结合,结合空间数据库搜索引擎等相关技术,解决产业集群技术信息空间数据库中海量数据的存储、索引、管理、查询、处理及分析挖掘等问题。

1 基于GIS的空间数据库研究现状与问题

1.1 基于GIS的空间数据库研究现状

1)GIS技术现状:GIS技术是近年来发展迅速的一门信息技术,许多计算机领域的新技术,如面向对象技术、三维技术、图象处理和人工智能技术都逐渐应用到GIS系统的开发中,并在水利、气象、林业等领域得到了广泛应用,在空间数据组织模型、分布式多级服务器工作协同工作机制、时态GIS、TB级空间数据仓库、空间元数据库、跨平台支持、三维空间建模及可视化等关键技术研究和基础软件开发等方面取得一定成果。

2)空间数据库技术:空间数据库系统是描述、存储和处理空间数据及其属性数据的数据库系统。空间数据库是随着地理信息系统的开发和应用而发展起来的数据库新技术,这种技术与应用紧密结合,大多数作为地理信息系统的基础和核心的形式出现。由于传统数据库在空间数据的表示、存储和检索上存在许多缺陷,从而形成了空间数据库这一新的数据库研究领域。它涉及计算机科学、地理学、地图制图学、摄影测量与遥感、图像处理等多个学科。

空间数据库管理系统的主要功能是提供对空间数据和空间关系的定义和描述;提供空间数据查询语言,实现对空间数据的高效查询和操作;提供对空间数据的存储和组织;提供对空间数据的直观显示等。空间数据库管理系统比传统的数据库管理系统在数据的查询、操作、存储和显示等方面要复杂许多。

Oracle Spatial是Oracle公司推出的一种不需要中间接口而直接使用数据库操作系统来存储和管理空间数据的空间数据库组件。在空间数据的管理中,Oracle Spatial处于业内领先的地位。目前在Oracle Spatial数据库系统中已经成功实现了对空间数据的管理。

1.2 基于GIS的空间数据库的应用现状与关键问题

目前,空间数据库的成果大多数以地理信息系统的形式出现,虽然已经在环境和资源管理、土地利用、城市规划、森林保护、人口调查、交通、税收、商业网络等领域得到广泛应用。但在构建过程中,仍存在一些技术难点和问题,主要表现在:

1)多数据格式与空间数据集成:空间数据库所涉及数据信息既包括地理信息,也包括技术信息、经济信息等其他数据信息,来源多种多样,而且格式不统一。数据的管理和维护需要规范不同数据库数据格式。另外,空间数据具有多语义性、多时空性和多尺度,较为复杂。如何将属性数据和地理数据较好的集成是空间数据库构建的一个难点。

2)海量数据与多格式数据的存储管理:产业集群技术信息与地理信息包含的数据量非常庞大。在传统空间数据的存储与管理模式中,数据量越多,文件就会越大,数据的处理就会越复杂,其存储、检索、管理也就越困难。由此可见,采用以往传统的存储机制管理海量数据,显然已经不能满足要求。如何解决海量数据存储管理也是空间数据库构建的技术难点之一。

3)数据抽取与导入技术:空间数据库涉及庞大的数据量,如何将数据源导入到空间数据库,如何根据空间数据的特点建立空间字段,将空间属性导入相应的字段,进行元数据表的更新和空间索引的建立,同时保证空间数据库的安全性和一致性,也具有较高的技术难度。

2 基于GIS的产业集群空间数据库设计与实现

2.1 基于GIS的产业集群空间数据库设计

产业集群空间数据库的技术路线如图1所示。数据库按功能分为数据库管理系统和数据库维护系统。其中管理系统包括数据的编辑录入、转换更新和数据库接口设计;数据库维护系统包括用户与权限管理、系统备份与恢复等子系统。

2.2 基于GIS的产业集群空间数据库实现方法

在基于GIS的产业集群空间数据库设计的基础上,采用oracle spatial进行空间数据库的开发,通过oracle spatial实现了海量空间数据集成管理,并且解决了多源空间数据无缝集成以及空间数据的多重表达等问题。Oracle Spatial通过对象-关系模式来进行空间数据的存储,把所有空间要素对象化,将空间几何数据和属性数据一同存储在数据库中,并且每一个空间对象对应数据库中的一行。主要通过元数据表、空间数据字段SDO_GEOMETRY和空间索引来共同管理空间数据,并在此基础上提供了一系列空间查询和空间分析的函数,让用户可以专注于进行更深层次的地理信息系统开发,降低了系统开发的成本。

2.2.1 基于OpenGIS的空间对象设计与实现

产业集群空间数据库的数据都存储在空间字段SDO_GEOMETRY中。SDO_GEOMETRY是按照OpenGIS规范定义的一个对象,其创建方式如下所示。

CREATE TYPE sdo_geometry AS OBJECT(SDO_GTYPE NUMBER,SDO_SRID NUMBER,SDO_POINT SDO_POINT_TYPE,SDO_ELEM_INFO MDSYS.SDO_ELEM_INFO_ARRAY,SDO_ORDINATES MDSYS.SDO_ORDINATE_ARRAY);

其中SDO_GTYPE表示几何图形类型,如图2所示。

SDO_SRID用来存放系统ID,进行系统维护使用,Number型结构;

SDO_POINT定义为一组变长数组,存储点的X、Y和Z坐标;

SDO_ELEM_INFO定义为一组变长数组,解释如何存储坐标;

SDO_ORDINATES定义为一组变长数组,存储组成空间图形的坐标。

2.2.2 基于GIS的产业集群空间数据库元数据管理

空间数据包含多个图层,且具有不同的比例尺,因此,为了高效地管理和查询空间数据,Oracle Spatial提供了一个全局表SDO_GE-OM_METADATA_TABLE来管理系统中的所有空间数据表的元数据。O-racle Spatial对空间数据的管理和组织体系结构图如图3所示。

元数据视图的基本定义为:

其中TABLE_NAME:为含有空间数据的数据表的表名。

COLUMN_NAME:包含用户创建的空间数据表中类型为SDO_GE-OMETRY的列名。

DIMINFO:是一个按照空间维顺序排列的SDO_DIM_ELEMENT对象的动态数组。

SRID:用于标识与几何对象相关的空间坐标参考系。

安徽汽车产业集群Oracle Spatial空间数据库的元数据表存储了有关安徽汽车企业空间数据的数据表名称、空间字段名称、空间数据的坐标范围、坐标参考信息以及坐标维数说明等信息。用户通过元数据视图(SDO_GEOM_METADATA)访问元数据表[2]。

2.2.3 基于空间索引的数据查询

Oracle将空间索引功能引入数据库引擎,是Spatial的一个关键特征。空间索引是根据空间准则把搜索限制在指定数据空间内的一种机制,从而可以大大提高空间数据查询和分析的效率。Oracle Spatial提供了R-tree索引和Quad-Tree(四叉树)索引,安徽汽车产业集群Oracle Spatial空间数据库采用R-tree建立空间索引。

R-tree索引是通过定义每一个对象的最小外接矩形(Minimum Bounding Rectangle,MBR)来匹配空间几何实体的,对于指定的图层,R-tree索引实际上就是该层上所有几何实体的分层MBR索引[3]。分层索引结构如图4所示。

创建R-tree索引是用CREATE INDEX语句:

CREATE INDEX[schema.]ON[schema.](column)INDEXTYPE IS MDSYS.SPATIAL_INDEX;

2.2.4 多源空间数据的导入

产业集群信息的基础数据源为集群属性数据和图形数据,以及地形图、政区图等地图信息,主要包括:

1)基础地理信息,包括地形、行政分区、交通(铁路、公路)、居民地、水系、公园景区、医院、银行等。

2)集群专题信息统计,包括集群中企业分布统计数据;

3)集群经济信息统计,包括集群全年工业总产值、新产品产值、出口交货值、从业人员等统计数据。

其中MapInfo格式矢量地图可以利用MapInfo公司提供的上载工具EasyLoader将数据上载到Oracle数据库中[4]。将来地图数据发生了变更,也只需要通过EasyLoader的刷新表功能,即可将发生变化的地图数据在Oracle数据中更新[5]。该工具提供了命令行上载与窗口上载两种方法。该工具在底层通过调用OCI(Oracle Call Interface)把数据写入数据库。EasyLoader上载示意图如图5所示。

3 基于GIS的空间数据库系统开发与应用

在研究基础上,本文以安徽省企业产业集群为应用对象,构建了安徽省汽车产业集群空间数据库管理系统,实现属性信息与地图信息的方便集成和修改,可以直接形成空间数据库,并开发了相应的平台和工具,供系统查询、统计和分析所用。

3.1 基于GIS的空间数据库管理系统开发

空间数据库具有数据种类丰富、存储量大、结构复杂等特点,对数据进行高效存储与管理是数据库建设乃至将来整个系统能够高效运行的关键环节,为此开发了专用的空间数据库管理系统。

基于GIS的空间数据库管理系统是基于C/S体系结构的,系统开发工具为Microsoft Visual C#;空间数据库采用Oracle9i,运用ArcGIS Server进行地图发布,采用MapInfo Professionalo进行地图的编辑和属性数据的编辑,采用EasyLoader for Oracle将地图数据上载到Oracle中。

该系统以数据库为支撑,实现对空间数据和属性数据的存储、访问和管理,并为其他应用系统提供数据服务,其主要功能包括图形数据入库、图形数据编辑、可视化显示、属性数据入库、属性数据管理、空间数据和属性数据关联建立、数据的输出、查询统计和打印输出等。

3.2 安徽省汽车产业集群空间数据库应用

实现空间数据和属性数据的一体化存储和管理是数据库构建及GIS应用系统高效运行的关键,在利用空间数据库管理系统解决该关键技术问题的基础上,开发了安徽省汽车产业集群信息服务平台。

该系统采用Oracle Spatial作为空间数据库服务器,MapInfo作为地图信息和空间对象信息服务器,通过ArcSDE数据库引擎技术实现系统功能应用与空间数据库的分离。

系统通过将属性数据与空间数据结合,实现基于空间数据的信息查询、统计分析、对比监测、空间分析、专题应用等功能,同时提供开放式的对外服务接口,实现多格式数据的交换功能。系统通过各类信息的可视化显示以及多样化的图形显示,为决策者提供更全面、直观的依据,提高其通览全局的决策能力。

4 总结

本文对产业集群空间数据库构建中的关键技术进行了研究与开发,提出产业集群属性信息与地理信息的集成原则,开发产业集群空间数据库中属性信息与GIS的集成的配套软件工具,实现属性信息与地理信息的方便集成和修改。通过汽车产业集群信息服务平台,面向集群内部、集群间企业和社会提供区域内较为全面的支撑技术信息服务,以推动制造业产业集群快速和可持续发展,不断提高我国制造业的自主创新能力和信息化水平。

摘要:论文针对产业集群发展需求,对基于GIS的空间数据库研究和应用现状进行了分析,给出了基于GIS的空间数据库设计方案,解决了空间数据库构建过程中的多源、海量数据的集成与组织、多维数据查询与索引问题。以安徽省汽车产业集群为例,利用Oracle Spatial作为后台空间数据库支持,以ArcGIS Server作为开发平台,集成开发基于GIS的安徽汽车产业集群信息空间数据库管理与维护系统。

关键词:产业集群,地理信息系统,空间数据库

参考文献

[1]中国汽车产业咨询网.http://www.auto-sinomind.cn/index.aspx.2009.8

[2]史森,夏丽丽.Oracle数据库开发指南[M].北京:清华大学出版社,1998.

[3]Oracle Corporation.Oracle Spatial8.1.6 Documentation[A].User's Guide and[Z].2000,9.

[4]梁鸿,丁仁伟,郑红霞.Oracle Spatial空间数据库的设计及应用[J].测绘科学,2005,6(3):91-93.

[5]张凡,吕汉兴.使用MapX组件实现地理图形与数据库的结合[J].计算机应用研究,2000,(10):4-6.

空间数据库构建研究 篇2

城市基础空间数据更新研究

城市基础建设的加快对空间数据的更新提出了更高的要求,本文基于笔者多年从事空间数据库建设的相关工作经验,以空间数据更新为研究对象,研究探讨了空间数据据更新的原则,方式和内容.全文既是笔者长期工作实践得到的技术经验总结,同时笔者也进行了一定的.理论升华,相信对从事相关工作的同行有着重要的参考价值和借鉴意义.

作 者:毛海亚 作者单位:广州城网信息发展有限公司,广东广州,510070刊 名:科技资讯英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):“”(9)分类号:P2关键词:空间数据库 更新 方法

空间数据库构建研究 篇3

关键词:电子书包;个人学习空间;平衡设计

中图分类号:G434            文献标志码:A          文章编号:1673-8454(2015)04-0068-04

当前,世界各国都在积极推进本国的教育信息化进程,都在努力营造适合本国教师与学习者发展的个性化学习环境,以促进师生的发展。2011年,我国颁布的《教育信息化十年发展规划(2011-2020年)》明确提出“三通两平台”是教育信息化 “十二五”的核心目标。[1]其中“网络学习空间人人通”是重要的内容之一,而个人学习空间(PLS)是“网络学习空间人人通”建设的关键组成部分。个人学习空间(PLS)整合了虚拟学习环境(VLE)和个人学习环境(PLE),是作为协调教与学的第三方空间被提出的,作用于他人指导和自主学习之间寻求平衡, [2]是实现个性化学习的基础和保障。通过文献调研,我们发现有关虚拟学习环境和个人学习环境实现载体的设计、开发已经比较成熟,但关于个人学习空间的讨论和现实载体的研究则相对缺乏。目前,电子书包由于其移动性、按需服务、个性化等特点,能够实现个性化学习、泛在学习和个人学习空间的构建,正受到国内外众多专家和学者的关注。

基于电子书包的个人学习空间构建在理论和实践上都表现出较大的可能性。本文试图在介绍电子书包的功能特性和个人学习空间本质特征的基础上,阐述基于电子书包的个人学习空间实现的可能性,并论述在个人学习空间中他人指导和自主学习的平衡机制。

一、电子书包内涵及功能特性

1999年新加坡德明中学率先进入电子书包时代,揭开了电子书包在教育领域应用的序幕。随后,日本、韩国、美国、马来西亚等国为推动本国教育信息化,都在积极开展电子书包的试点研究工作,而我国分别于2000年和2011年启动了两轮电子书包的试点研究。国际著名的非盈利组织新媒体联盟(New Media Consortium,NMC)与美国高校教育信息化协会主动学习组织(The EDUCAUSE Learning Initiative)从2010年-2013年发布的《Horizon报告》中指出,电子书、平板电脑在当前和未来几年将对教育产生积极的影响。电子书包这一新的教育媒体形式,将作为资源的电子书和作为载体的平板电脑集于一体,成为当前新媒体在教育领域中应用的代表。

1.电子书包的涵义

有关电子书包的定义尚没有统一的定论,学者祝智庭等[3]从硬件、教育内容和服务平台三个方面阐述了对电子书包的认识,并将电子书包划分为“虚”、“实”两种隐喻,认为应将其内涵真谛从以往关注“实”的硬件设备转换到关注“虚”的应用服务层面。王斌等[4] 认为电子书包可以视为一种以网络、移动设备为基础,促进学习者有意义学习的软件为架构,动态开放教学资源为灵魂,支持移动学习甚至终身学习的数字化学习空间。而国外有学者认为,电子书包是一个计算机支持的数字化协作学习空间,它以网络为环境基础,支持师生、生生间的同步或异步交流与资源共享;[5] Christina Brodersen等[6]认为电子书包是一种支持非正式学习的通用网络设施,学习者可以使用基于蓝牙、无线网络等技术的设备,随时随地登录、退出电子书包,管理自己的数字资源。

综合国内外的观点可以看出,电子书包是一个具有高度集合特性的系统,以网络、移动终端为基础架构,以优质的学习资源和软件为服务核心,支持正式、非正式学习以及个人学习空间的构建,能够促进个性化学习甚至是终身学习的实现。不可否认的是随着新媒体技术的发展,对于电子书包的认识也将逐渐深入、全面。

2.电子书包的功能特性

有关电子书包的功能探讨已经出现于文献之中,如学者祝智庭[7]等提出了“媒体—功能”二维建构和“核心、可选、拓展”三级配置的电子书包系统功能建模;而刘繁华[8]等从移动功能和教育教学功能两方面阐述了电子书包的系统功能;也有学者从管理者、教师、家长、学习者的角度分析了电子书包在应用过程中所发挥的作用,并以此来阐述电子书包的功能。[9] 本文将从电子书包所支持的学习方式和类型对电子书包的功能进行描述,如图1所示。

电子书包支持正式学习、非正式学习、个性化学习和终身学习。电子书包的教育教学功能贯穿课前、课中以及课后,支持自主学习、协作学习以及探究学习,满足个性化学习和终生学习的需求。作为新兴的教育媒体,电子书包在构建个人学习空间上表现出极大的优势,将发挥着他人指导和自主学习的双层作用。

二、个人学习空间的涵义及特征分析

网络技术的发展催生了虚拟学习空间的诞生,从而突破了传统教学时空限制,使得学习者之间交流的时间和空间不受限制。当前的虚拟学习空间主要表现为两种类型,一种是以教师控制为主的虚拟学习环境,如Moodle、Blackboard等虚拟学习平台;一种是以学习者自主活动为主的虚拟个人学习环境,如微博、Blog、Wiki等。以教师控制为主的虚拟学习环境忽视了学习者的主动性和主体性特征的发挥,影响了学习者个性化能力的发展;在以学习者为主的虚拟学习环境中,由于学习者缺乏必要的自我控制能力,往往造成无法达到预期教学目标的后果。因此,构建一个可以整合他人指导和自主学习,连接正式学习和非正式学习,体现其引导性、符合个性化发展需求的数字化学习空间就显得极为迫切。通过文献调研,结合实践认识,笔者将从以下几个方面阐述个人学习空间的特征,以便大家对个人学习空间有一个整体的认识:

1.独立性

在网络学习环境中,不同的学习个体、学习群体有不同的学习空间,由于个体空间、群体空间所涉及到的一些话题、活动、资源具有其空间的私密性,对个人、群体表现出隔离的状态。具有独立性的学习空间表现出自我交流和群体内部交流的特性,是个体自我反思能力提高和群体本体化发展的重要条件,是学习者对学习环境产生依赖感的前提条件。

2.开放性

社会建构主义强调知识建构的社会性、共建性,知识不是个人的产物而是集体共建的结果。无论在线上还是线下,社交永远是学习者不断发展的主要方式,社交的过程是个体、群体对外开放的过程。个人学习空间的开放有助于从纵深两个维度来建构知识,即知识的数量和知识的深度都能有所拓展。

3.控制性

个人学习空间的控制性表现在两个方面,一方面是学习者的自我控制,另一方面是他人的监控。如在某一单元的学习中,学习者会积极参与学习活动,跟进教学进度,完成教学任务,表现出自我监控和管理的能力,然而在虚拟学习环境下,学习者的这种能力是比较薄弱的。而他人的监控表现为提供学习反馈,提供学习支持支架和模板,规定学习时间等。

4.过程性

对于学习者来说,对学习过程的数据进行分析往往比学习结果的数据分析更为重要。因为学习结果具有静态、单一、片面的特性,无法对学习者的整个学习活动的表现进行全面描述。而记录学习者学习过程的数据并对其进行分析是学习者个性化学习的重要手段,也是学习分析技术的关键环节。个人学习空间可以保留学习者学习过程的所有数据,提供过程数据的智能分析诊断,从而满足学习者的个性化需求以及按需提供学习支持。

三、基于电子书包的个人学习空间构建的可行性分析

通过对电子书包和个人学习空间的特征进行分析,可以发现电子书包作为最新的教育产品,可以满足概念性的个人学习空间在现实环境中的实现。电子书包由组织机构提供,但主要是由学习者自主控制,符合个人学习空间独立性、开放性、控制性和过程性的要求。因此,利用电子书包作为个人学习空间的现实载体具有较强的可行性和实践意义。表1表示的是基于电子书包的个人学习空间的架构。

基于电子书包的个人学习空间具有结合他人指导和自主学习的特性。在该空间中学习者拥有私密的独立模块,如接受个性化的学习资源,撰写自己的学习反思、数字化笔记,当然学习者有权利开放这些私密的模块,而个人学习空间的独立性在于保护学习者的隐私,有助于学习者产生归属感;通过师生、生生的在线交流、家校互通以及随时随地的社会化学习,促进了知识的社会化构建,拓展了个人学习空间;电子书包的智能评测、教师监控、学习支架与模块以及学习者自主管理权限等满足了学习者自我控制和他人指导相结合的要求,而这类要求是有效学习发生的关键条件;学习过程、记录学习体验记录以及学习过程支持是实现个性化教学的重要手段,通过对学习者学习路径、知识点、反思、情感体验等整个学习过程的记录,分析学习者的学习风格以及学习者的知识掌握情况,从而制定出符合学习者个体需求的教育服务。

基于电子书包的个人学习空间将资源和服务进行整合,将学校教育和家庭教育进行结合,满足了个性化学习和有意义的接受学习,突出了学习者的主体性和个性化,实现了“网络学习空间人人通”的建设。

四、电子书包作为个人学习空间的运行机制探讨

任何一个系统,机制都起着基础性、根本性的作用。[10]个人学习空间具有协调教与学,实现他人指导和自主学习之间平衡的特点。 [11]可以说,如果无法协调教与学,不能在他人指导和自主学习之间寻找一个平衡点,那么个人学习空间便可能转变为虚拟学习环境或者个人学习环境。因此,如何寻求教与学、他人指导和自主学习的平衡点,解决个人学习空间运行机制是什么的问题,对于个人学习空间发挥其应有的教育教学功效具有重大意义。

1.个人学习空间中他人指导和自主学习的内在关系分析

教与学活动的目的是实现教学目标、完成教学任务,本文从这个视角来阐述教与学之间的平衡关系。因此,笔者以新版的布鲁姆教学目标分类为依据,对两者之间的关系予以阐述,如图2所示。

布鲁姆教学目标的分类规定了从低阶能力目标到高阶能力目标,不同的目标等级对学习指导者和学习者的教与学的要求是不同的。图2中的横坐标表示学习者的自主学习强度,纵坐标表示他人指导的强度,而坐标中的弧线表示教学目标的等级。从图2中可以看出,处于低阶能力目标的记忆目标主要是对一些事实性知识进行记忆,信息加工的环节比较少,学习者基本上通过自主学习即可完成教学目标,因此学习者自主学习强度较大,而他人指导的强度比较小。随着教学目标等级的不断升高,学习者的自我信息加工的活动越来越多,对所要掌握的程序性知识或者策略性知识的要求也越来越高,但是作为学习者,又缺乏这方面的知识和能力,因此他人指导的强度呈快速上升的趋势。处于目标等级最高的是创造目标,是高阶能力目标的集中体现,参与创造性的活动是所有学习活动中对学习者要求最高的一个层次。因此,在学习者进行自我创造的过程中,需要搭建支架提供帮助,这种帮助不是对一般事实的讲解,而是方法、策略甚至是思维转变的指导,对于指导者和学习者都有很高的要求。可以明确的是,在不同等级的教学目标实现的过程中,他人指导和自主学习是一个“你退我进,此消彼长”的过程,从而形成了两者之间的动态平衡。在图2中,创造这一目标的点也是一个“阈”,表示的是超过这一点无论他人的指导强度如何增加,学习者的自主学习活动发生的几率几乎很小。也就是说学习者对没有任何先前经验和知识基础的新内容进行理解、运用、分析、评价和创造的行为是难以发生的,违背了建构主义学习理论所阐述的“知识构建的一个基础是基于先前的知识经验”的基本常识。

2.个人学习空间中他人指导和自主学习的动态平衡设计

从他人指导和自主学习的关系上看,偏向任何一方都会导致个人学习空间的性质发生改变。如果以他人指导为主,如教师安排学习时间、指定学习内容等会影响学习者主体性的发挥,个性化学习无法得到保障;而如果以自主学习为主,由于学习者缺乏必要的自我监控能力,易导致其偏离学习目标进而无法完成学习任务。因此如何在他人指导和自主学习之间达到动态平衡是解决该问题的关键。笔者认为,个人学习空间自身的控制性(监控功能)和过程性(记录、分析功能)为解决这个问题创造了可能,整个过程如图3所示。

(1)对学习者进行前端分析和学习过程监控

在网络学习环境下所进行的学习主要以活动的形式展开,因而教学目标便转化为学习活动目标。为使学习活动顺利地展开,教师有必要对学习者的个性特征进行分析,设计出适合学习者的学习活动,这一过程突出了教师的主导作用,而这种主导作用是关键的,也是必要的。在学习者参与学习活动的过程中,系统自动记录学习者的学习行为,如登录平台的次数、参与讨论的次数、参与的学习模块、寻求学习支持的次数等;同样系统也会自动记录学习者在线学习内容,如学习者浏览的内容、回复他人的内容、反思性文本等。

(2)分析记录数据,动态调节他人指导和自主学习的比例

依据所搜集的数据进行学习分析,参照预设的教学目标,从而权衡他人指导和自主学习的比例。如教学要求是学生能够对概念进行识记,通过对学习者有关概念知识的文本信息进行分析,若发现有较高的正确率,那么说明学习者对于概念性知识的掌握不需要其他外力的帮助;但是如果教学要求是学习者能够进行创新活动,而从行为数据分析表明学习者寻求教师支持的次数比较多,文本数据分析发现学生的思维混乱,有关判定、关联、转换 [12]的言语信息很少,说明此时教师需要主动介入学习者的学习活动,为学习者提供学习帮助。

五、结束语

个人学习空间的构建对于实现个性化学习、协作学习甚至是终身学习具有重要的意义,而电子书包作为教育信息化发展新阶段的产物,在构建个人学习空间上表现出极大的优越性和可行性。本文通过对电子书包和个人学习空间的特性进行分析,阐述了基于电子书包的个人学习空间的可行性,并根据新版布鲁姆教学目标分析个人学习空间的运行机制。随着新媒体技术的发展,构建个人学习空间的实现载体将越来越多,相信在不久的将来相应的研究会越来越丰富。

参考文献:

[1]关于印发杜占元同志在教育信息化试点工作座谈会上的讲话的通知[EB/OL]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s5892/201207/139233.html.

[2][11]祝智庭,管珏琪,刘俊.个人学习空间:数字学习环境设计新焦点[J].中国电化教育,2013(3)1-6.

[3][7]祝智庭,郁晓华.电子书包系统及其功能建模[J].电化教育研究,2011(4):69-76.

[4]王斌,朱守业,刘苗苗.电子书包发展中相关问题的探讨[J].电化教育研究,2011(9):88-84.

[5]G. Chabert, J.Ch. Marty, B. Caron, T. Caron, L. Vigonllet, C. Ferraris.The Electronic Schoolbag: A CSCW Workspace. Presentation andEvaluation[J].Al & Society-AIS,2006.

[6]Christina Brodersen,ent G.Christensen,Kai Gronbak,Christian Dindler,et al: eBag—a Ubiquitous Web Infrastructure for Nomadic Learning[R].World Wide Web Conference Series-www, 2005.

[8]刘繁华,于会娟,谭芳.电子书包及其教育应用研究[J].电化教育研究,2013(1):73-76.

[9]黄明燕.混合学习环境下电子书包应用模式初探[J].现代教育技术,2013(1):8-31.

[10]宋海艳.泛在知识环境下的图书馆学科服务模式与动力机制研究——基于学习空间融合服务的探索[J].情报理论与实践,2010(7):58-62.

[12]钟志贤.教学设计的宗旨:促进学习者高阶能力发展[J].电化教育研究,2004(11):15-17.

空间数据库构建研究 篇4

农业普查的目的是为研究制定经济社会发展规划和科学决策提供依据, 为农业生产经营和社会公众提供统计信息服务。2006年底开始的第二次农普在完成了普查准备和现场调查阶段之后, 目前也已经基本完成普查数据的处理阶段, 接下来的任务主要是进行资料开发, 包括普查数据的深度挖掘分析, 最终实现普查成果。

农业普查具有范围广、密度大等特点, 这也使得普查数据量大, 数据指标多。现有的农普数据处理系统能很好地完成对数据组织统计功能, 如增加了制度定义功能的Apras农普数据处理系统, 以及用于农普数据的统计报表处理系统Sarp。在根据一定的统计需求体验过这些系统之后, 发现它们存在以下弊端:

① 目前的系统在使用上具有普遍性, 对于局部地区的特殊统计需求不能一一满足;

② 系统组织数据方式没有突出数据要点, 不能正确有效地反映出农普的重点内容;

③ 系统中的农普原始数据和数据处理结果与用户交互性较差, 存在不易操作且不直观的特点;

④ 比较偏重数据的组织处理, 缺乏对农普数据的分析模块, 因此不能充分发挥数据的统计意义。

另外, 农普数据在不同地区还未形成统一的规范, 所以在分析预测和交互直观上还没有成熟地应用, 农普数据的深层价值也因此得不到发掘。地理信息不仅增强了数据的直观性, 而且提高了统计数据的实用程度。在社会统计普查, 尤其是覆盖面广、数据量大的农业普查中应用地理信息显得十分必要, 对增强农业普查的科学性和数据处理的有效性具有重要意义。在地理信息的支持下, 农普空间数据分析能够有效提取数据的隐含信息, 利用复合的空间模型表达统计信息的分布、行为特征, 有利于地区整体农业的发展。

因此在对农普数据处理工作和农普总体方案认真分析后, 结合该地区的农普特点和统计需求, 我们在该系统的设计上着重强调以下几点:

① 在实现基本数据统计的基础上, 加大对地区普查特殊统计需求的实现比重;

② 找出与该地区普查重点内容相关指标数据进行组织处理, 让结果数据更加有效地反映农普内容;

③ 引入地理信息, 将农普数据视为包含地理要素的空间数据, 即能提高用户对数据的把握程度, 又能使结果数据更直观, 更具有可比性;

④ 利用空间分析模型, 对结果数据进行重点分析预测, 扩展系统对数据的处理范围, 为今后的农业发展提供数据参考。

其中第①、②点为系统运行的基础, 为③、④点提供数据保障;而③、④点作为系统的重点, 更能体现本系统的特色所在, 有效地实现农普数据处理与分析的一体化, 也是有别于现有农普数据处理系统的创新之处。

本文介绍结合地理信息的农业普查空间数据处理与分析平台的构建过程, 包括对农普原始数据的组织处理, 重点突出数据与地理信息的结合, 以及通过方法模型对结果数据进行分析预测;并选取农普相关内容作案例说明, 着重体现平台结合地理信息和空间分析模型的实现效果。

1农普空间数据组织功能设计

经过对现有农普数据处理系统的利弊分析之后, 我们需要对该平台作进一步详细的设计。在结合该地区农普数据的结构和内容的同时, 考虑空间数据组织过程中需要的各种数据要素。

1.1数据的结构与内容

此次农普数据中共有五种普查对象类型, 分别为:①住户、集体户;②单位;③村;④乡;⑤小区。根据全国不同地区普查工作的需要, 各地可制定各种对象类型的补充表使普查信息更加符合地区特点。

这些对象的普查表组成了本平台的基础数据表, 各表以地址码为标识指标, 各表之间也以地址码指标进行关联, 方便同一普查区跨表指标的连接查询。对于农普指标我们还建立了两套不同的分类方式:一类是按数据表分类, 即根据普查对象类型和数据表名定位指标;另一类则是按指标集分类, 即根据指标集类型和指标集名定位指标。对于表中的属性指标, 我们还建立了相应的属性值表, 包括属性值代码及属性名称。这些属性值表对农普数据起到过滤作用。

1.2数据组织提取详细设计

农普数据的组织提取包括数据元素的组织和数据生成编辑两部分。其中数据元素的组织包括普查区选取、农普指标选取和过滤条件选取;而数据生成编辑包括目标数据的提取生成、结果数据表编辑和地图图例的生成。如图1所示。

1.2.1 数据生成的三要素

根据该地区农普数据的结构特点, 提取出数据组织的三要素, 将原始数据组织成易于展示操作的数据立方体, 其中三大要素包括:

1) 普查区的选取 此要素是限定普查区的范围;其中一种方式是将各普查区按隶属关系组织成树, 勾选树节点即可选中相应普查区;另一种为查询对象选取, 这里将普查区作为一种查询对象, 主要指地图上以乡镇为单位的选区和选区内的村级普查区;用户可根据喜好选择不同的选取方式。普查区缺省值为整个地区。

2) 普查指标选取 此要素指定查询指标;这里提供按数据表和按指标集两种分类方式, 对表归属不明确的公共指标, 则只按数据表选取;指标数据类型包括数值型和字符型两种;指标的选取可以通过双击指标列表或点击添加按钮来实现, 并限制指标的重复选取, 对不同分类方式选取的指标这种限制也同样有效。

3) 指标过滤条件设置 此要素将对所查询的数据作再次限定, 展示符合过滤条件的明细或汇总数据信息;这里提供对所有指标的过滤, 并允许指标的重复设置过滤规则。过滤指标包括数值、枚举、字符三种类型, 一般的, 对数值型指标进行数值过滤;对存在分类属性值表的字符型指标进行枚举下拉选取过滤;不存在分类属性值表的字符型指标则提示没有对应的属性值表, 并对其进行字符输入值过滤;另外可以调整规则的先后顺序, 设置各规则之间的关系, 以及规则的合并、解散。

1.2.2 结果数据生成和处理

在设置好数据立方体的三要素之后, 即可实现结果数据的提取生成。由于各种普查对象类型数据地址码的编码规则不同, 对象间的地址码不存在等值现象, 故在数据生成过程中普查指标和过滤指标的选取应遵循对象独立原则, 即:一次查询包括的数据指标和过滤指标只能属于同一普查对象类型的数据表或指标集, 各数据表之间以地址码为关联指标。数据表结构应满足:不论展示方式是汇总还是明细, 都应包括普查区名称字段, 以指示普查指标数据所属的普查区。

对于生成好的结果数据表, 还可作进一步的处理和编辑操作。利用数据表控件自带的过滤功能以及平台实现的数据表编辑功能, 通过对结果数据的再过滤, 行列合并编辑、行列间运算等处理, 满足用户的数据最终展示和分析的需要。

1.2.3 关联地图、生成图例

地图图例的生成必须要以数据为基础。对地图上的对象而言, 数据表中必须要有一个对象的代码字段与其对应。该平台是将生成的结果数据以乡镇或选区为单位关联到地图中, 通过新建地图图层, 利用不同的图例非常直观地展示数据表各字段数据。平台还可对图层进行有效管理, 不论是各普查单位的横向数据对比, 还是普查区内各种农业指标的构成, 都能得到有效的展示。

2农普空间数据分析模型

经过数据的组织提取, 我们可以得到基于原始数据表的空间数据;对农普空间数据的处理分析包括完备化处理和格数据的空间分析。前者利用空间数据的分析方法为缺失的空间数据进行缺值估计, 为后者提供完整的数据信息;后者利用空间分析模型对空间格数据作进一步分析, 提取产生新的认识。该平台提供了能够提取农普指标影响因素和分析不同普查区域层次关系的方法模型, 模型分类如图2所示。模型所需的数据从数据组织模块和地理信息中获取, 模型的输出结果可形成地理信息。

2.1空间数据的完备化处理

农普数据不包含时间序列, 同一数据指标在不同区域的数据中出现缺失, 可以利用区域间的空间相关性, 采用一定的插值方法对数据作估值补充。

这里我们采用一种权重系数方法, 将各普查地区视为数据点, 通过对已知数据点进行加权求和得出代估点的数据。该方法中的权重和已知数据点的人口密度以及此数据点与代估数据点的距离相关。我们称其为人口密度距离比插值法。

对于有m个数据点的目标区域, 同一数据指标的已知点数为n, 其中m>n;假设代估点的指标值ve, 其计算公式为:

ve=j=1nwjvj (1)

其中vj (j=1, 2, …, n) 表示已知的n个数据点的值, wj (j=1, 2, …, n) 即为各已知点的权重系数。

将人口密度pj/sj和距离dej的比值写成权重函数得到公式:

f (pj, sj, dej) = (pj/sj) /dej2 (2)

其中pj (j=1, 2, …, n) 和sj (j=1, 2, …, n) 分别为已知点的人口数量和面积大小, dej (j=1, 2, …, n) 为已知点 (xj, yj) 与估值点 (xe, ye) 之间的地理重心距离。

则有权重系数如下所示:

wj=f (pj, sj, dej) /k=1nf (pk, sk, dek) (3)

在一般情况下, 通过公式 (1) — (3) 我们就能对数据缺失点进行缺值估计。

为了防止在距离为零时权重函数取无限大, 以及避免使用距离太远的数据点, 我们要限定dej最大值和最小值。设dmin为可考虑的最短距离, dmax为可考虑的最长距离, 我们对权重函数f作如下改进:

f (pj, sj, dej) ={ (pj/sj) /dmin2ddmin (pj/sj) /dej2dmin<d<dmax0ddmax

(4)

经过改进的权重函数当遇到两个区域地理重心重合时, 也会考虑到其他数据点与代估点的相关性, 同时也消除了因距离太远而相关性较小的数据点的作用, 在保证数据估计值质量的情况下, 减少计算量。

2.2空间数据的统计分析

2.2.1 数据分布规律的直观展示

对不同地理区域的相同数据指标做统计图表, 用户将会很直观地把握其中的分布规律, 并能根据这种直观规律制定采取初步的规划或措施。本平台中的统计图表作为数据组织与数据统计分析的一个接口, 除了二维数据表之外, 还包括体现大小对比特征的柱状图, 体现趋势变化情况的折线图, 以及体现结构比重特征的饼状图。

2.2.2 指标影响因素的提取预测

农普数据各指标变量之间存在相互的统计因果关系, 这种因果关系的强弱可以帮助用户找出主要原因, 采取有针对的措施。空间回归分析模型通过对目标指标有影响的数据指标集作回归分析, 我们称这个指标集为自变指标集, 称目标指标为因变指标, 自变指标集中的指标与目标指标可互为因果变量;提取其中自变指标对因变指标的影响权重, 从而得出对目标指标影响较为显著的数据指标集。这里采用多元线性回归分析方法。

在回归分析之前, 结合该区域的经济状况、文化教育、基础设施等因素考虑, 获取主要的影响因素添加到自变指标集中。一般的, 同属于一个普查对象类型的指标之间相互影响更加显著, 同属于农业经济一个方面的指标之间也具有较为显著的影响。

经过完备化处理补全各个数据点的数据, 保证对应指标的数据单位统一。但由于各个指标的数据量纲等级不同, 其数据在数值上存在较大的差距, 这会导致回归分析得出的系数不理想, 从而失去回归系数的参考价值。因此在平台的回归分析过程中, 我们要标准化空间数据的各个数据项:

X˜i=Xi-X¯Si=1, 2, , n (5)

其中X¯表示n个空间样本同一个数据项的均值, X˜i表示指标变量Xi标准化后的数值, S则为指标变量Xi的标准差, 其表达式为:

S=i=1n (Xi-X¯) 2/n (6)

通过标准化处理的空间样本数据消除了量纲的影响, 能够较为真实的分析出各自变指标对目标指标的影响权重。其多元线性回归分析方程用矩阵表示为:

其中包括n个空间样本, m个自变指标;Y˜i表示第i个空间样本的标准化因变指标变量, X˜ij为第i个空间样本第j个标准化自变指标变量, wj则为第j个自变指标变量的标准化回归影响权重系数, i=1, 2, …, n;j=1, 2, …, n

2.2.3 区域层次类别的分析发掘

按照空间样本的一项或多项数据进行层次划分或类别归类, 不仅能突出不同层次或类别的样本之间的比较, 而且有助于农业经济的均衡发展。空间数据的多元聚类分析可以很好地实现我们的目标。除了各样本的多元数据指标之外, 样本的空间地理位置也是聚类分析考虑的重要因素, 因此在定义空间样本间的距离时要综合考虑数据指标和地理位置的影响。

我们采用系统聚类法, 其中以空间样本作为聚类的对象, 以欧氏距离定义空间样本点或类之间的重心距离。各类的地理位置重心为所含样本点地理位置重心的平均值, 同属一类的各样本聚类属性值的平均值作为该类的属性值。先设各空间样本点自成一类, 并对所有属性值作标准化处理, 如公式 (5) 、 (6) 所示, 得标准化后其中任意两类X¯i= (p˜¯i, q˜¯i, x˜¯i1, x˜¯i2, , x˜¯im) X¯j= (p˜¯j, q˜¯j, x˜¯j1, x˜¯j2, , x˜¯jm) , (p˜¯, q˜¯) 表示类的空间二维坐标, x˜¯k (k=1, 2, , m) 表示样本第k个属性指标的标准化平均值, 它们之间的欧氏距离定义为:

d (X¯i, X¯j) =[ (p˜¯j-p˜¯i) 2+ (q˜¯j-q˜¯i) 2+k=1m (x˜¯jk-x˜¯ik) 2]1/2 (8)

利用系统聚类的最短距离法, 将欧氏距离最短的两个类合并成新类, 并重新计算新类空间地理重心和属性值的平均值作为下一轮判断提供数据, 直到所有样本聚成一类为止。在整个聚类过程中, 我们可设定重心距离的等级, 若按照整数级设定则具有相同整数部分的距离等级相同, 可视为距离相同。如果在某一步合并时不止有一个最短距离时, 则对应的类可同时合并。此外我们还可设定聚类分析的最终返回类别的个数, 以此限定循环计算的次数。

3普查主要内容案例体现

第二次农普的主要内容包括:农业生产经营、农村劳动力及就业、农村基础设施和社会服务、农村居民生活等方面的情况。这里我们以农村居民的生活质量为例, 得出不同普查地区生活质量的区别以及影响生活质量的主要因素。

将与农村居民生活质量相关的数据指标分为四大类, 分别为:

1) 人口面积, 包括各乡镇的总人口、总面积以及不同属性的人口数;

2) 公共设施, 包括与居民生活关系密切的交通、购物、储蓄、健身等设施的情况;

3) 医疗教育, 包括各乡镇图书馆、文化站和医院卫生所的情况;

4) 收入、投资、消费, 包括各乡镇资产总额、收入情况以及生活消费情况。

利用平台的数据组织提取功能生成相关数据表, 对于缺失的数据我们利用数据的完备化方法进行处理, 这里对已存在的数据进行完备化, 以便验证处理结果的有效性。我们以上述第四类中的居民拥有住宅面积和居住住房建筑面积为例, 如表1所示。

其中d表示各普查区与缺值区域的距离, p/s为各区的人口密度, S1、S2表示各普查区原始数据的值, 我们估计镇10的S1和S2。镇10的估值Sw, Sw均通过其他乡镇原始值的加权求和得出。对S1和S2的估值误差分别为:8.5%和2.8%, 可以满足数据分析的要求。

用同样的方法对其他相关指标的缺值情况作完备化处理, 为分析提供完整且较为可靠的数据。为了对各普查区居民生活质量作层次划分, 接下来通过系统聚类法, 综合考虑上述四类指标作最短距离聚类分析, 得出如图3所示的层次聚类树, 并将聚类情况映射到地图中, 如图4所示。

图4中白色区域为该地区的街道办事处, 即该地区政府所在区域, 不在普查范围之内。通过聚类分析我们可以将乡镇普查区分成五类, 图中区域颜色的深浅表示该普查区域农村居民生活质量的好坏, 从中我们可以得出一个规律:离政府所在区域越近的区域, 其居民的生活质量就越好, 这样就可以根据各普查区与政府所在区的距离对生活质量进行定量分层。

根据聚类分析的结果, 我们可清晰地看出该地区不同普查区域的层次区分。但是还不能定量居民生活质量的影响因素, 所以我们还需要用到空间数据的回归分析。先对数据进行标准化处理, 再通过回归分析得出相关指标的影响权重系数, 即显著因子, 如表2所示。

此回归分析的R方差值为0.974, 回归的结果较为理想。从图中可以得出:企业从业人员数、通公交车的自然村、电脑等自变量对生活质量的影响较为显著, 而受教育程度初中以下的人数具有较大的负影响系数, 说明此项人数越多的地区, 相应的生活质量也较差。

通过空间回归分析可以定量分析指标的影响因素, 同时在影响因素中增加经济普查、人口普查的数据, 分析不同普查数据之间的关联, 有利于区域经济的均衡发展。

4结论和启示

本平台的设计充分融合了农业普查数据与地理信息数据, 充分利用地理信息的空间数据图形可视化和分析功能, 构建了一套完整的数据处理流程和数据挖掘方法。空间分析模型和空间数据挖掘方法的引入使处理后的数据在直观展示之余, 变得更加有效、更加有价值。总的来说, 改平台还有以下可以改进和扩充的方向:

1) 基于目前我国组织进行的二次普查所获得的数据, 无法有效建立农业普查数据的时间序列模型, 充分利用时间维度上的信息;我们在分析过程中采用的模型和方法仅仅基于截面数据和空间数据, 这决定了分析内容存在一定的局限和不足, 所能够深刻揭示数据内部存在的规律的范围也较小。

2) 普查数据中对普查区的划分细化到普查小区, 而在地图上对地理信息的划分只细化到村级单位, 对于具有村级行政管理职能的农场地图上也没有标明。所以对地图选区对象进行数据查询时结果会存在一定偏差, 尤其是对任意选区的查询, 该平台会统计出与选区存在交集的所有村级单位的相关普查数据。

3) 本文构建的空间数据分析平台不仅仅可以运用于区域农业普查, 对数据库进行适当升级修改后, 也可运用于全国范围;同时本平台亦可加入经济普查人口普查的全部或部分数据, 方便分析区域的劳动力结构和农业产业结构与宏微观经济数据的参照, 为区域的农业和农村的结构优化提供数据与决策支持。

参考文献

[1]Michael F Goodchild, Bradley O Parks, Louis TSteyaert.EnvironmentalModeling with GIS[M], OXFORD UNIVERSITY PRESS.1993.

[2]王劲峰, 等.空间分析[M].北京:科学出版社.2006.

[3]崔铁军.地理空间数据库原理[M].北京:科学出版社.2007.

[4]Mickey Yost.Data Warehousing and Decision Support at the NationalAgricultural Statistics Service[J].United States Department of Agricul-ture.2004.

[5]Aalders I H, Aitkenhead M J.Agricultural census data and land usemodeling[J].Computers, environment and urban systems.2006.

空间数据库构建研究 篇5

航测空间数据生产及入库相关技术研究

本文笔者基于多年从事航测的空间数据生产经验,研究探讨了相关生产流程及其中所涉及的关键技术,文章首先对空间数据产品的模式和基本特征进行了详细的阐述,而后给出了基于航测的空间数据生产流程,最后结合笔者工作经验,重点探讨了流程中所涉及的.关键技术,全文既是笔者长期工作实践基础上的经验总结,同时也是在实践基础上的理论升华,相信对从事相关工作的同行有着重要的参考价值和借鉴意义.

作 者:梁锦潮 作者单位:广州市城市规划勘测设计研究院,广州,510060刊 名:科技资讯英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):2009“”(32)分类号:P2关键词:航测 空间数据 生产流程 关键技术

空间数据库构建研究 篇6

法人单位基础信息库(以下简称“法人库”)是我国电子政务领域的四大核心信息资源基础数据库之一,随着电子政务建设向“资源整合,业务协同”的方向迈进,法人库的重要性已愈加明显,日益受到有关方面的重视,全国各地也纷纷开展相关的建设和研究工作。

在建设法人库、特别是后续应用法人库的过程中,大量政府部门的业务系统、数据中心需要从法人库中获取数据,如果向这些系统不加区分地提供全部数据,不仅会加重系统、网络的负担造成资源的浪费,也会埋下信息安全和信息外泄的隐患,换言之,只有解决了法人库信息的有效提取问题,才能谈的上后续的法人库数据分发和应用,这是所有的法人库建设单位、应用单位都面临的一个共性问题。为此,北京市相关政府部门针对这一问题,结合北京市法人库建成应用中的突出问题,协同开展了系列研究和实践工作,取得了可以工程化的系列研究成果,其中较有特色是利用空间信息提取法人库的区域数据,特别撷取该成果的目的也是为了抛砖引玉,意在为促进我国电子政务领域的建设和自主科技的发展尽些绵薄之力。

概括来说,北京市法人库于2009年完成一期工程建设,该库以法人单位的组织机构代码为唯一索引,整合了市工商局、市编办、市民政局三个登记源头部门80余万家法人单位的22项基础信息,覆盖了在北京市级及区县级登记注册的全部企业法人单位、事业法人单位、社团法人单位、民办非企业法人单位和基金会法人单位,其中数据量最大的企业法人登记数据能够进行每天更新,相关政府部门通过部署在北京市电子政务外网上的电子政务基础设施“北京市政务信息资源共享交换平台”(以下简称“共享交换平台”),可以较为及时准确地获取法人库中的基础信息。

北京市法人库建成后,需要向全市各区县提供服务,在此过程中首先需要提取区县的属地数据,在此过程中,提取北京经济技术开发区的属地数据是一个典型的特殊需求。北京经济技术开发区(以下简称“开发区”)是北京市的国家级经济技术开发区,跨越大兴、通州、朝阳三个行政区,开发区管委会作为主要行使经济管理职能的政府管理机构,希望及时获取属地法人单位的基础信息,以便在此基础上建成包含属地扩展信息的开发区法人库,对于北京市的18个区县行政区,可以按照企业所在地的行政区划代码从市法人库中提取信息,但由于开发区不是独立的行政区划,因此,需要寻找特殊方式进行数据提取,经过分析研究,最终利用空间信息成功地提取出了市法人库中开发区的属地数据。

一、数据提取方式

可以将这种新的提取方式归纳为“利用空间信息的三层数据过滤提取方式”,所谓“三层过滤”,即坐标判定过滤、地址判定过滤、差异点判定过滤,图1显示了这种数据提取方式的全过程。

(一)首层数据提取方式

首层数据过滤提取通过对单位地址的空间坐标进行分析来完成。进入共享交换平台中的法人库数据,会根据应用需求,与“北京市政务地理空间信息共享服务系统3.0”(以下简称“空间服务系统”)中的空间数据进行地址匹配,如地址匹配无误,则会附加上该法人单位的北京市地方坐标信息。

共享交换平台在分发处理新的法人库数据之前,会首先利用开发区规划部门提供的开发区区域边界坐标数据,判定该法人单位与区域边界的空间拓扑关系,如果单位坐标投影在开发区边界之内,则将该法人单位数据标识为首层过滤出的需向开发区提供的数据。

(二)后两层数据提取方式

上述法人库数据与空间服务系统数据地址匹配过程中,单位地址信息不完整、空间数据库信息现时性不足等因素会导致法人单位最终缺乏坐标信息,这种情况会造成首层数据过滤出的属地数据量少于实际数据。

为此,对于首层数据过滤出的法人库剩余数据,还需要进行第二层数据过滤,这层数据过滤通过对单位地址特征值进行分析来完成。为进行第二层数据过滤,共享交换平台会利用开发区规划部门提供的开发区街道名称和空间服务系统地址库数据,对首层数据过滤后的单位进行地址比对,如果该单位地址所在地址属于开发区管界,则将该法人单位数据标识为第二层过滤出的需向开发区提供的数据。

在实践中,我们发现,开发区规划边界、规划街道的数据与现实的开发区管界数据存在一定程度的偏差,为了精确查找这部分数据,还需要将这些偏差数据提取出来,形成差异点数据,也可称为兴趣点数据,我们可以利用这些周遍兴趣点地址信息和坐标信息进行的数据过滤进行第三层数据过滤,将过滤出来的数据标识出来后,全部数据提取过程即告结束。

(三)提取结果的标识

值得注意的是,在整个数据提取过程中,所进行的数据结果标识过程非常重要,通过这种元数据标识,可以大大提高法人库数据提取过程的灵活性和数据的复用性,后续应用系统通过利用这些元数据,可以方便地定位信息、开展应用。

二、交互架构、关键子过程及实现原理

在实际工程部署中,上述方式的实现涉及到多个大型信息系统的交互,其交互的总体架构见图2。

上述提取方法中,空间分析、地址分析是两个关键子过程,可以充分利用现有成熟的数据库技术加以实现。

(一)空间分析过程及实现原理

空间分析主要包含两项工作:一是根据开发区规划局提供的原始空间边界,利用空间信息服务系统中的航空遥感影像库、卫星遥感影像库和地址库数据,识别出属于开发区管界且跨越规划边界的建筑物和院落,据此对原始空间边界数据进行调整,形成用于判定企业是否属于开发区的判定边界;二是利用法人单位的组织机构代码、注册地址与北京市空间数据库进行数据关联,通过空间信息服务系统数据接口获取法人单位的北京市地方坐标,并完成该坐标与判定边界的空间拓扑关系运算。通过空间分析,可以知道该法人单位的坐标是否在开发区边界内。

在开发过程中,主要有两类技术实现路径:一类是利用数据库的空间功能,如Oracle Spatial加以实现;一类是利用专用的GIS系统,如ArcGIS加以实现。经过对比,北京市法人库的空间分析最终是采用Oracle Spatial实现的。除无需新购专门的GIS系统外,直接利用已经部署了大量应用的现有Oracle数据库,较易于与其它系统功能进行集成,同时,使用Oracle数据库自带的SHAPE数据类型、空间元数据、空间索引及空间数据入库工具,可以方便地开发将判定边界数据入库的应用程序,最后,空间拓扑分析直接运行SQL语句就可以完成,经测试,采用这种方案,在小型机部署环境下,10000对坐标构成的封闭边界内的坐标判定响应时间稳定在毫秒量级,可以满足定期批量处理和数据更新的业务需求。

(二)地址分析过程及实现原理

地址分析也需要完成三项主要工作:一是对原始地址进行解析,从中提取街道、楼宇、门牌号信息,并与空间信息服务系统中的标准地址库进行数据关联,将原始地址转换成内容和格式规范的、可供数据比对用的规范地址;二对开发区规划部门提供的街道信息进行解析,通过与空间信息服务系统中的标准地址库进行数据关联,从中提取出规范的、用于数据比对的街道信息库;三是比对法人单位的地址是否在开发区街道库中。通过地址分析,可以知道该法人单位按地址划分是否在开发区管界内。

完成地址分析,除必需使用数据库技术外,核心是使用分词技术,如原始地址为“北京市开发区荣华中路18号”,利用分词技术,就可以将识别转化为“北京经济技术开发区荣华中路18号”的规范名称,进而判定该地址属于开发区管界。目前,分词技术种类繁多,但由于缺乏合适的商用产品,在实际开发过程中借鉴了各类研究成果,其中也包括开源的分词方案。

三、应用效果及前景展望

在实际应用中,已经利用这种方式实现了市法人库数据向北京经济技术开发区管委会信息系统的持续数据提取和分发,已累计筛查出5413家属于开发区属地管理的法人单位,其中,首层数据过滤筛查数据为1702家,占总数的31.4%,次层数据过滤筛查数据为3711家,占总数的68.6%,第三层数据过滤待周遍兴趣点数据确定后也可进一步发挥作用,实际效果比较令人满意。

在电子政务建设中,各类非空间基础库信息与空间库信息进行融合已是大势所趋,利用空间信息,实现针对特定区域的非空间基础库信息提取将极大地方便各类应用的开展,今后在电子政务领域将会发挥重要的基础作用。

(一)可以满足法人库提取更多区域性数据的需求。

以北京市为例,范围较大、区域组成复杂的如一区十园的中关村科技开发区,区域组成简单的如北京市18区县各自设立的经济技术开发区,以至于空间范围有限的街道、社区,都可以利用这种方式从法人库中获取所需的数据。

(二)可以满足跨行政区法人库数据融合的需求。

如在规划跨行政区经济区的发展,如环渤海经济区、长三角经济区、珠三角经济区时,都需要了解特定区域内的企业总量和规模,需要从多个行政区的法人库中提取信息,在此方面只有充分利用空间信息才能完成数据的提取。

(三)可以满足人口库等更多基础库提取数据的需求。

人口库等非空间信息库也存在着提取特定区域信息,向各类政务系统进行共享的巨大需求,并且数据量会更大、运算会更复杂,完全可以借鉴法人库的做法进行优化提升。

通过多方努力,北京市有关部门牵头,通过产学研的协作机制,当前已经在利用空间信息提取法人库数据方面取得了阶段性的实用成果,目前配套的关键技术还在不断改进完善,我们也希望,随着有关部门对电子政务建设重视程度的不断提高、对自主产权技术的持续投入,电子政务的众多参与者们能够在这个领域分享到更多、更好、更适用的应用成果。

GML空间数据库系统研究 篇7

关键词:GML,空间数据,数据库系统

0 引言

GML是开放式地理信息系统协会(Open GI S Cons ort i um,OGC)制定的、基于XML的地理信息编码规范,它中立于任何厂商、任何平台,为地理信息包括地理要素的空间与非空间特性信息的建模、传输和存储提供了统一的框架。它的出现为空间数据的共享和互操作提供了很好的解决方案,同时也给Web GI S技术的发展开辟了新的道路[1,2]。随着GI S应用的不断深入以及互操作技术的不断发展,GML的应用和研究也将不断展开。相信在未来的几年内,随着数字地球、数字区域、数字城市、基于位置服务的不断实施,GML数据将成为空间数据的主流格式。随着GML格式的空间数据的大量涌现,如何有效地管理和存储大量的GML空间数据,以实现快速的查询就成为我们迫切需要解决的问题。

1 GML及其数据模型

GML3.0提供了一套核心模式和一个基于对象/属性(Obj ect s/pr oper t i es)或要素/属性(Feat ur es/pr opert i es)的简单语义模型,大大增加了GML描述地理空间数据的能力。同以前的版本比较,GML3.0提供了更加丰富的模式组件,下面介绍三种主要模型。

1.1 要素模型(Feat ur e Model)

一个GML要素是在选定的论域内有意义的对象,包括空间和非空间属性,如道路、河流、人口、交通工具或者行政边界。要素模式f eat ur e.xsd提供了创建GML要素和要素集的框架,它定义了抽象和具体的要素元素及类型。和以前版本相比,增加了一些新的要素类型及属性,如BoundedFeat ur eType、Feat ur eAr r ayPr oper t yType、Envel opeWi t h-Ti mePer i odType等,并通过元素引入了几何模式geomet r yBasi c2d.xsd和时态模式t empor al.xsd中的定义和声明。

1.2 几何模型(Geomet r y Model)

GML3.0版本提供了丰富的几何定义模型,而GML2.x版本中只给出了一个几何定义模型(geomet r y.xsd),GML3.0共给出了5个几何模型:geomet r yBasi c0d1d.xsd、geomet r yBas i c2d.xs d、geomet r yPr i mi t i ves.xs d、geomet r yAggr egat es.xs d和geomet r yCompl exes.xs d,其中geomet r yBas i c-0d1d.xs d的部分类型和元素是为了兼容以前的GML2.x版本,geomet r yBasi c2d.xsd、geomet r yAggr egat es.xsd、geomet r yPr i mi t i ves.xs d、geomet r yCompl ex.xs d完全是由新的类型和元素组成。

1.3 拓扑模型(Topol ogy Model)

GML对空间对象的拓扑描述是GML3.0新增的一个内容,使得GML能更真实地描述现实地理世界。因为在现实地理世界中,每个地理空间对象并不是孤立存在,彼此之间总是存在着这样或那样的关系。基本拓扑对象按空间维数可以划分为四类:节点(Node)、边(Edge)、面(Face)和拓扑实体(TopoSol i d),空间拓扑关系是由这些基本拓扑对象和它们之间的关系来描述的,基本拓扑对象表达的对应的基本几何对象是:Poi nt、Cur ve、Sur f ace和Sol i d。

2 GML数据库系统实现方式及其问题

本文根据存储格式的不同将GML数据库分为两类:基于传统空间数据库的GML空间数据库和基于XML本原数据库系统的GML空间数据系统。

2.1 基于传统空间数据库的GML数据库

不管采用那种数据库来管理GML数据,首先要面对的问题就是存储。因为采用的存储模型的不同导致索引结构的不同。关系数据库是基于元组的,而GML数据是基于文档的。要使用关系数据库来存储GML数据必然存在的问题就是数据转换。也就是说GML数据在传统关系数据库系统中存储的关键是要将XML模式映射为关系模式,主要有以下几种映射方式:大对象存储方式、通用模式映射方式、将XML模式或DTD映射为关系模式方式、从XML实例数据提取关系模式。

这种管理方式需要在GML模型和传统关系数据库模型之间来回转换。主要存在以下问题:(1)来回转换费时;(2)数据结构的经常性变化;(3)损失部分信息。

2.2 本原GML数据库系统[2,3,4,5]

本原GML空间数据库定义如下:

(1)本原GML空间数据库是专门设计用于存储和管理GML文档或GML文档片段(如要素)的空间数据库,以GML文档或GML文档片段作为数据库的存储单元进行操作和管理;

(2)本原GML空间数据库为GML文档或GML文档片断,如单个的地理要素(而不是文档中的数据)定义一个逻辑模型,并且根据该模型存取文档,模型包括元素、属性、PC-DATA和文件的次序;

(3)本原GML空间数据库以GML文档或GML文档片断(如要素)作为其基本(逻辑)存储单位;

(4)本原GML空间数据库对底层的物理存储模型没有特殊要求,它可以建在关系型、层次型或面向对象的数据库之上,或者使用专用的存储格式;

(5)本原GML空间数据库系统支持GML数据模型、GML空间数据类型和空间操作算子,支持GML查询语言、查询处理和查询优化,支持GML索引(包括空间索引和XML索引)。

本原GML空间数据库具有如下特点:

(1)GML数据是一种基于XML编码的空间数据,是一种典型的半结构化的、层次树状结构的空间数据。本原GML空间数据库是专门针对GML半结构化层次树状的空间数据特点而设计开发的,以GML文档或GML文档片断(如要素)作为其基本(逻辑)存储单位,以GML文档或GML文档片断(如要素)作为处理对象,可以随时提取GML文档或GML文档片断,一般以数据集为单位来管理数据,将具有相同模式的GML文档存储在同一个数据集中。而传统的空间数据以关系表形式存储在传统的关系或对象关系数据库中;

(2)GML查询语言也是针对GML空间数据的特点而设计开发的,不仅可以实现传统的空间查询,而且可以实现基于GML文档结构的查询,而传统的SQL查询语言针对规则的二维关系表,不适合半结构化GML空间数据的查询;

(3)GML空间索引包括传统的空间索引和XML索引,而传统的空间数据库只需要空间索引;

(4)本原GML空间数据库可以应用XML的所有技术。

3 结束语

GML的出现很好地解决了地理空间数据的网络传输以及共享的问题,成为事实上传输标准。因此,尽管其出现的时间比较晚,但是已经成为研究人员的热点问题。数据库系统是管理GML空间数据的最佳方式,虽然实现的方式多种多样,本文希望通过讨论找到最优的数据库系统来管理GML空间数据,加速GML的发展。

参考文献

[1]兰小机,闾国年,张书亮,姜永发,陈方林.GML3.0在城市道路网络建模中的应用研究[J].计算机应用研究,第8期.

[2]兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J].测绘科学,2005,30(5).

[3]兰小机,胡川,谢旭阳,龙文星.基于Petri网的面向对象型空间数据库概念设计模型[J].大地测量与地球动力学,2007,(12).

[4]胡川,龙文星.基于ArcGIS的大比例尺地图符号制作研究[J].测绘标准化,2007,(9).

城市空间数据库更新模式研究 篇8

1 城市空间数据库更新需求分析

城市空间数据库数据更新的主要需求如下:

1) 不同尺度的基础空间信息对现势性的要求各不相同。例如1∶500-1∶1000基础空间数据应用于规划审批、房产发证、宗地确权等业务, 需要实时的更新;1∶2000基础空间数据往往用于交通管理、公共安全、宏观经济分析、城市总体规划等业务, 对现势性要求略低;1∶5000以上小比例基础空间数据可按年度更新。

2) 不同的数据库类型对更新模式要求也有所不同, 例如:DOM和DEM数据库一般按年度进行区域整体更新, 地下管线数据库则要求实时更新。

3) 需要根据具体情况选择合适的更新方法[1]。针对比较重要的数据, 如:道路、桥梁、人行天桥等, 应尽快更新, 此时可采用PDA室外更新图形, 室内更新数据库的方法;对于城市新的开发区可采用全站仪内存记录的方法来进行测量;对于地籍边界、管线特征点等信息的更新可采用PDA无线通讯的方法实时地对数据库进行更新。

4) 城市各部门, 特别是基于空间信息的应用部门 (城市规划/国土/房产等) , 希望共享一个统一的城市空间数据库。目前受技术条件限制, 一般采用多个独立的空间数据库副本, 形式上可能不同, 但其内容完全相同。

5) 对于城市空间数据库, 一要进行及时更新以保持其生命力, 否则就是一个死库;二是要进行应用开发, 以充分挖掘它的价值。前者属于数据生产部门的工作范畴, 十分看重采集更新工艺流程的连贯性和生产组织实施的便利性。后者属于管理和应用部门的工作范畴, 看重的是现有数据的分析与使用, 要求保持一定的稳定性。

2 数据组织与更新方式分析

2.1 数据组织方式

城市空间数据库是一个无缝连接的海量数据库, 无论是初始建库, 还是建成后的更新维护工作, 都需要许多作业单位并行作业 (例如需要分区承包给不同单位进行作业) 才能满足数据库建设与维护的要求, 这就需要采用合适的方式将空间数据库化整为零, 以便于生产组织与管理。

1) 图幅方式

分幅方式是传统的城市基础数据常见的组织方式, 这种方式将整个城市切割成若干规格统一图幅 (例如50 X 50) , 简单实用, 管理方便, 容易实施。但更新时需要考虑与相邻图幅的接边关系, 而且相邻图幅之间跨边界的空间实体被强行截断、整体性被破坏。

随着大型空间数据库技术的不断应用, DLG数据库 (1:500-1:2000基础地形数据库、地下管线数据库等) 很少采用分幅方式, 但它依然适合DOM数据组织。

2) 网格方式

“网格方式”是人们在数字化生产实践中, 为克服分幅方式的缺点提出的数据组织方式, 做法是:按自然界线 (界线、道路、水系) 将空间数据库的覆盖区域划分成相互连接又不重叠的若干独立网格, 使各网格之中的空间要素地理独立而完整, 最大限度避免接边带来的麻烦。如果网格边界设计得当, 可以将任意大的海量空间数据分解为若干互相独立的图块单元, 既可以按文件库形式管理, 也可以采用空间数据库进行管理, 是当前DLG数据库建设应优先采用的数据组织方式。

2.2 数据更新方式

2.2.1 区域整体更新

区域整体更新按规模可分为两种:

1) 大规模区域整体更新:

三到五年一个周期, 进行大面积的修测和补测。更新区域通常是行政区单元 (权属单位) 。区域整体更新成本较高, 更新投入由地方财政安排, 一般用在区域空间要素变更很大、数据现势性很差的情况下。

传统的城市基础数据更新主要采用这种方式, 一般只能做到年度级现势性水平。另外, 这种方法周期较长, 往往更新工程还没有结束, 已更新过的地方又发生了变化。显然这种方式难以满足当前城市信息化对数据现势性的要求。

2) 小范围区域整体更新:

利用竣工测量或其他方法对区域内发生变化的某组织单元 (图幅或网格) 进行的更新, 这种方法适用于区域空间要素变更较小的情况。例如城市建筑物竣工引起的空间实体变化等。目前一些城市已将竣工测量纳入到城市基础数据更新的环节中, 不仅大大降低城市基础数据更新成本, 而且提高了更新的时效性。

2.2.2 增量更新[2]

地理空间数据更新的实质是空间实体状态改变的过程, 即实现由现实世界中的现状实体转变为数据库中的现状实体, 及由数据库现状实体转变为数据库历史实体两个状态的转变。因此地理空间数据更新不是简单删除替换。

以上两种方法, 都是以分块为单位进行的新旧数据替换, 许多没有发生变化的数据无法分辨, 不能保留历史数据, 或者为保存历史版本产生大量数据冗余。为克服这个缺点, 近年来业界提出“增量更新”更新模式。它采用面向对象数据模型存储空间要素, 空间实体相互独立而完整 (实体之间拓扑关系是隐含存在的, 一般在分析时临时建立) , 原则上对单个实体增加、删除、修改不影响其他要素实体, 因此历史数据只需要保留发生变化的要素 (即增量信息) 。

“增量更新”是今后的发展方向。但技术上比较复杂, 存在一定的技术风险。另外, 面向对象数据模型实体间不能共享公共点和边界线, 需要重复存储, 因此在变更编辑过程中要充分照顾到原有地物边界, 对生产作业要求较高。

3 基于网格管理的二级增量更新模式

对现势性要求较低的中小比例尺空间数据库可以采用多种方式 (“整体更新”或“局部更新”) 进行更新, 不再详述。本文针对1∶500-1∶1000基础空间数据库更新特点, 提出“基于网格管理的二级增量更新模式”, 主要内容如下:

3. 1 二级缓冲数据库

为兼顾生产更新与管理应用的双重需要, 同时考虑到多个应用空间数据库副本并存的现状, 本文提出“二级缓冲数据库”的更新模式[3], 将生产和应用完全剥离, 兼顾了更新维护的及时性与管理应用的稳定性。如图1所示:

1) 第一级是完全面向生产的本地生产库, 由生产单位负责, 按工作区初始建库, 以在线更新方式实施更新维护, 更新完成后通过“更新管道”向应用数据库传送更新数据。

2) 第二级是面向管理和应用的应用数据库, 以网格 (3.2节将详细描述) 为单位进行更新管理, 包括:按网格为单位向本地生产库下载初始建库数据, 接收经本地库整理好的增量数据并对相应网格实施更新。可以在非工作时间自动调度完成, 不影响数据库应用。

3) 一二级数据库均采用“增量更新”方式:

“增量更新”是目前最先进的更新模式, 它只更新已经发生变化的要素, 通常可归纳为:增加/删除/修改三类, 而且可以最少的数据冗余保存空间数据库的历史状态。

3.2 网格管理

1) 网格规模

网格划分实际上在建库时根据自然地理情况确定, 一般设计成两级:网格的面积依不同的比例尺数据有所不同, 一般二级网格0.5km2为宜。

一级网格按行政区域界线设计;

二级网格按道路、水系的各个自然边界设计;

2) 超长地物处理

电力线等超长地物可能跨越多个网格, 考虑到此类数据在专题管线数据库中已有详细的描述, 因此可以按网格边界断开表示, 以保证网格封装的独立性。

3) 网格管理的实现:

网格管理是空间数据库更新的一项重要功能, 通常可通过在应用数据库中建立“网格索引图层”实现, 功能包括:

●网格查询;

●网格数据下载;

●数据上传;

3.3 增量更新技术

增量更新技术是核心部分, 目前相对较成熟的有基于时态的增量更新技术 (例如EPS2008) 。该技术借鉴时态GIS思想, 将时间属性作为空间对象必须的基本属性, 在时间维上, 将无序的更新业务, 统一成先后有序的更新事件, 妥善解决了更新冲突问题, 允许离线状态下的多个更新业务的相互独立进行。同时采用增量方式管理历史数据, 数据冗余小, 信息记录全, 支持历史回溯与动态回放。

该技术主要包括如下内容:

1) 时间参考系;

2) 事件管理;

3) 冲突检测与处理;4) 历史回溯;

4 实验验证

为验证本模式的适宜性, 选择福州市区代表性强的杨桥西路、工业路一带约5km2区域1∶500数据作为“试验田”, 采用ArcGIS 9.2+Qracle10g建立应用空间数据库[4], 按照相同建库标准, 采用SQL Server2005 + EPS2008建立本地生产库更新系统, 数据来源采用相同区域内最新的dgn图幅数据, 经过EPS软件转换成edb格式进行叠加更新。

实验时应用数据库和本地生产库遵循如下约定:

1) 所有实体对象的扩展属性, 添加“更新时间”字段, 作为数据判断更新的依据;

2) 统一使用全球Guid作为空间实体对象唯一标识[5];

3) EPS2008平台进行的任何编辑操作都要准确记录时间信息;

4) 大致按0.5Km2 划分为若干网格;

5) 为简化试验程序, 本地库更新完成后, 将相应网格增量信息转换为三个 (删除、增加、修改) ArcGIS_mdb格式文件, 供应用数据库同步处理。

实验结果表明:“基于网格管理的二级增量更新模式”达到了预期效果, 而且具有如下优点:

1) 将应用库与生产库分离, 成果相对独立稳定, 系统效率和安全性较高;

2) 更新工艺可与生产部门实际生产紧密结合, 有利于提高生产效率;

3) 采用“网格管理”方式将海量数据“化整为零”, 界线清晰、责任明确, 组织管理方便, 技术风险较小。

5 结论与展望

流畅、完备的城市基础空间数据库更新体系建成后, 完全有条件实现城市基础空间数据库的动态更新:

1) 政府职能部门可以通过竣工验收的方式建立城市空间数据库常态化更新机制, 把数据更新工作落实到日常工作中, 达到及时更新的目的。

2) 网格管理和增量更新技术是实现空间信息动态更新的关键技术, 将在城市空间数据库建设与维护中发挥重要作用。

3) 随着各种先进测量仪器和技术的不断发展, 进行城市基础数据更新的技术手段越来越灵活, 可以广泛地采用GPS、数码摄影测量等方法, 必将大幅度改善或提高城市空间数据库系统现势性。

参考文献

[1]邹进贵, 潘正风, 虞晖, 隗剑秋.城市基础地理信息系统数据更新方法的研究[J].地理空间信息, 2005, 3 (6) :4-5.

[2]周晓光, 陈军, 朱建军.基于事件的时空数据库增量更新[J].中国图像图形学报, 2006, 11 (10) :1431-1438.

[3]陆绍波, 王伟安.空间数据变更管理机制[J], 地理信息世界, 2005, 3 (5) :55-55.

[4]操震洲, 李清泉.基于ArcSDE和ArcGIS Engine的版本管理系统的设计和实现[J].测绘与空间地理信息, 2006, 29 (1) :76-78.

空间数据库构建研究 篇9

文章分析了长期困扰城市空间数据库建设的“更新冲突”问题,及城市空间数据库的更新需求与方式。通过对面向要素的并发更新冲突模型的研究,利用所学的专业软件结合有限的数据来验证模型,该模型可以发现并发冲突,从而解决数据更新问题,达到预期研究目的。通过采用时态GIS的思想,可以有效地建立实用更新系统,使面向要素的城市空间数据库并发更新冲突得到实现,数据的现势性也得到很大的提升,在技术层面上为基础测绘的可持续动态更新提供了重要的支撑。

1 城市空间数据库更新需求与方式分析

1.1 数据更新需求

(1)基础空间数据信息所采用的比例尺不同,对现势性也有不同的要求。例如:用于规划审批、宗地确权和房产开发等业务的基础空间数据采用1:500~1:1000的比例尺,对实时更新要求最高;用于城市总体规划、公共安全和交通管理等业务的基础空间数据采用1:2000的比例尺,实时更新要求略低于大比例尺数据;小比例尺数据的比例在1:5000以上,可以按照年度进行更新。

(2)数据库类型不同,对更新模式也有不同要求。要求实时更新的有地下管线数据库等,而一般可按年度更新的有DEM和DOM数据库等。

(3)城市各个部门,尤其包括国土资源、城市规划以及房产等对空间信息更为依托的部门,有着共享统一的城市空间数据库的需要。但由于技术条件等客观原因,各相关部门大多有一套自己部门内部的数据库副本,这些数据库副本有着不同的形式、相同的内容。

(4)按照一切从实际出发,具体分析和采用适当方法解决不同的问题[1]。针对城镇道路、各种桥梁等比较重要的数据,应该进行快速更新,采用的方法包括PDA室外更新图形和室内更新数据库;针对管线特征点和地籍边界等数据,采用的方法为PDA无线通讯技术;针对城市新的开发区等数据,采用的全站仪内存记录的方式。

(5)而对于城市空间数据库,一方面,应对其保持实时更新,否则它将发展成一个死库;另一方面,为了充分挖掘其价值应不断进行应用开发设计。前者看重的是便利地进行生产组织实施和连贯的进行工艺流程的采集更新,工作范畴属于数据生产部门;后者十分看重现有数据的分析及应用,并要求有一定的稳定性,工作范畴属于数据管理和应用部门。

1.2 数据更新方式

(1)区域整体数据更新。按规模可分为两种:1大规模区域整体更新:周期一般三到五年,大面积进行补测和修测,以及部分复测,通常以行政区单元(权属单位)为更新区域。一般在数据现势性很差和区域空间要素变更很大的情况下,更新所需成本较高,更新投入方面由地方财政统一安排。这种方式被传统的城市基础数据更新工作广泛采用,而它的现势性水平也只能达到年度级。难以满足当前城市信息化对数据现势性的要求是它的不足之处,由于更新周期较长,往往本轮更新还在进行的时候,已经更新过的地方又发生了变化,导致了这种不足。2小范围区域整体更新:通常以某组织单元(图幅或网格)为更新区域,更新是以利用竣工测量或其他方法。这种方法经常适用于区域内空间要素只有较小的变更,如城市中建筑物竣工导致的空间实体变化等。竣工测量这一小范围区域的更新方法,不仅使城市基础数据的更新成本大大降低,更为重要的是使得更新的时效性得到提高。因此,竣工测量已经被一些城市所接受并纳入到城市基础数据更新的环节中。

(2)增量数据更新[2]。地理空间数据更新,包括两个状态的转变:1将现状实体从现实世界中转变到数据库中。2将数据库中的现状实体转变为历史实体,其实质是空间实体状态转变的过程。因此,地理空间数据更新不是简单地新增、修改、消亡。

2 城市空间数据中的更新冲突问题

城市空间数据库更新方法有很多,常见的是城市规划测量和竣工测量,但时常会出现因并行作业引发“更新冲突”现象,这主要是由于规划测量与竣工测量受城市规划部门的约束。假如某市有个房地产开发项目,为了满足需要,要将两块相邻的建设用地同时进行数据更新,暂且称之为A地块和B地块,A和B在同一时段内获得了部分区域重复的图幅,后完成数据更新工作的B的成果必然会覆盖先完成数据更新工作的A的部分成果。对于这样的问题,一般会想到采用“锁定-修改-释放”的传统策略来解决,先将A项目涉及到的区域锁定,待其完成后再“解锁”其余项目,理念上该策略是可行的,但实际上该策略会导致工作无法正常进行。如果A项目更新周期过长,这样B项目更新却无法完成,导致其无法进行下个工作。

3 面向要素的并发更新冲突模型

被GIS描述的现实世界随着时间的推移不断变化,但当空间对象在时间上变化缓慢且变化的历史过程无关紧要时,处理时间变化的影响时可采用离散的“数据更新”方式。当前针对城市空间数据“更新冲突”问题的并发更新冲突模型,有以下主要思路:

3.1 区域更新要素

例如某勘测院要对某区域开展空间数据修测,这将导致该区域空间对象的更新,本文称之为一个区域更新要素。更新要素有四个基本要素:1要素标识:要素编号。2区域范围:可采用闭合多边形表示。3开始时间(Ts):可采用数据下载的时间表示。4结束时间(Te):可采用数据上传的时间表示。在时间轴上,要素之间是相互重叠的、并发的。

3.2 空间要素的时间表达

为使空间对象具备时态特征,需要在地物要素类表(或属性表、)中记录如下信息:1全球唯一标识Guid。2有效时间Tv。3删除时间Td。4版本信息Vn。有效时间和消亡时间最好采用要素时间,但由于它的特性,确定采用系统用来记录数据变化的时间(即事务时间),即区域更新要素的结束时间。

3.3 空间要素的变化类型

单个实体的变化类型可归纳为以下四种:新增、修改、删除、永久消失。假设空间数据库包括现势库和历史库两个部分,其操作为:1新增:愿数据库无对应要素信息,新增要素信息入现势库。2修改:将原数据库对应的要素数据转入历史库,在现势库更新对象的最新数据信息。3删除:在现势库注销被更新的要素时间、版本号,并将更改要素转入历史库。4永久消失:直接删除原对象,无须转入历史库。时空数据库更新操作是单个实体的变化类型的基础,多个实体之间的变化可以转化成对单个实体的操作来实现[3]。

3.4 数据库并发更新

数据库的更新指的是将作业区域内采集到的地理数据信息重新入库。根据采集到的数据情况,数据库的更新包括以下三个方面:1数据的新增。2数据的修改。3数据的删除。假设某个更新区域,在同一段更新周期内A工作组先对该区域更新,然后B工作组也在相同更新周期内对该区域进行更新,这种情况下两者更新产生的冲突称为并发更新冲突。区域更新以现势库为基准作为基本条件,在同一更新周期内,一个更新事件可以是多个更新要素的总的作用,因此我们以两个更新事件为例进行讨论,同时也可以应用在多任务更新模式。通过对并发更新冲突的研究,作以下并发更新冲突分类总结,例如,对某一区域进行更新时,更新周期内同时出现A、B两个事件。A、B两部分是独立的工作区域,由于时间的落差性,在更新周期内,交集部分的地理要素的位置特征、地物类型等可能出现变化,故而这重叠部分的数据更新可能产生冲突问题。在地理数据入库前,就必须对冲突情况进行分析和处理。以下的具体讨论,将针对并发冲突产生的数据更新问题。

4 模型验证

4.1 并发更新流程

利用Arc Engine9.2二次开发的组件,依据直接嵌入到EPSW2008平台中的“SDE管理”菜单命令,实现了数据生产平台EPSW2008平台和后台数据库管理平台Arc SDE的无缝衔接和集成[4]。利用“SDE管理”菜单中的相应命令,并进行SDE图层管理、用户管理和数据初始入库,完全可以实现基于要素的并发更新[5]。为了实现测量服务规划的思想,通过初步研究并发更新冲突并借鉴前人的成果,设计了冲突模型更新流程图如图1所示。

5 结束语

衡量基础空间数据的使用价值的大小,它的现势性是重要参考标志之一,其附加值随着现势性越好而越高。当前,如何保证数据的现势性,已成为GIS界面临的重大挑战,GIS研究与应用的热点也逐渐包含了数据更新。通过分析,主要研究结论可归纳为以下几点:(1)根据城市空间数据库更新需求,提高数据的现势性是当前的重要任务。(2)在研究建立实用面向要素的并发更新模型的途径中,发现采用时态GIS的思想是一种有效方式。(3)通过论证:城市空间数据“更新冲突”问题可以通过本文研究的更新冲突模型得到有效解决。(4)实现了面向要素的城市空间数据库并发更新冲突,在技术上为可持续动态更新基础测绘提供了重要支撑。文章基于特定的工程实验数据,探讨存在的更新问题,其中的冲突检测环节是由软件完成的,但是冲突数据的符号和记录条处理还无法实现自动化,这在更新工艺中还有待提高。文章的研究成果将在城市空间数据库建设中发挥积极作用。

参考文献

[1]商瑶玲,王东华,李莉.论全国1:250000数据库的建设与更新[J].地理信息世界,2003,(11).

[2]苏山舞,于荣花,等.全国1:1000000数据库建设与更新[J].地理信息世界,2003,(2).

[3]王育红,陈军.异质空间数据库更新中的冲突分析[C].//2004年两岸四地地理信息系统发展研讨会论文集(光盘版),香港,2004.B-02.

[4]刘勇,李成名.城市基础空间数据库更新方法研究[J].测绘科学,2006,(4):103-105.

空间数据库构建研究 篇10

关键词:海洋管理,基础数据,地理信息,信息系统

随着社会的发展, 海洋在我国政治、经济及国防等方面的重要性越来越突出。科学有效地管理海洋对于我国海洋事业的长远发展将具有重大意义, 不仅要高度重视海洋的开发和利用, 而且要加强海域使用的科学化管理和海洋生态环境保护, 维护国家海洋权益, 促进海洋经济持续、快速发展。

先进的科学技术是海洋管理综合能力提高的重要支撑基础之一, 海洋空间基础数据库建设是海洋管理综合能力建设与发展的重要内容之一;而海域管理基础地理信息系统作为海洋空间基础数据的关键技术支撑和核心组成部分, 具有重要的建设性作用。连云港市海域管理基础地理信息系统利用先进的计算机科学技术和数据库管理技术, 更加科学、有效地为海洋行政主管部门提供管理决策信息。

1 现状调查

连云港市海洋行政主管部门在对海洋管理空间基础设施数据建设不断完善的过程中, 已经在地理信息系统 (GIS) 技术的应用方面取得较大成绩, 包括建立了采用Microsoft SQL Server、基于ArcIMS平台开发的海域管理动态监视监测管理信息系统, 成立了实施全市海域管理相关测绘工作的连云港市海籍管理调查测量站, 初步形成了以3S技术为代表的现代化测绘技术体系等, 其中内、外业一体化测图及数字化工作均已初步形成规范和良性的发展工作态势。随着海域空间基础数据库建设的不断完善和人员专业素质的不断提高, 以GIS作为主要技术支撑的海洋管理综合能力将得到飞跃性的提高。

2 系统建设目标与内容

空间基础地理数据设施主要包含数据交换网络体系、基础数据集、法规与标准以及机构体系等4个方面的内容。基础地理数据以及基础地理信息系统是空间基础地理数据设施的核心组成部分[1], 海域管理空间基础地理数据库和海域管理基础地理信息系统是海洋管理基础设施的重要组成部分。

海域管理空间基础数据库建设以坚持科技创新、改善海洋行政管理环境、提升海洋管理综合能力、促进海洋产业结构优化升级和实现海洋可持续发展为目的, 按照国家海洋行政管理统一的数据标准和规范, 建立整个市、县共享的海洋空间数据信息平台, 实现各部门、各层次之间信息的交流和共享以及在此基础上的信息综合管理和分析[2]。

根据海域管理工作的实际需要, 海域管理空间基础数据库建设的主要内容确定为以下几个方面[3]30。第一, 研究建立全市统一的海域空间数据生产、管理和更新的组织体系和管理机制, 制定关于海域管理数据的规范和技术质量标准, 研究基础网络和相应平台的集成及应用方案。第二, 建立健全多尺度、多数据源的海洋空间数据库, 为海洋行政管理各部门提供海洋管理相关的空间地理信息数据, 促进数字海洋等信息化建设。第三, 建立空间基础数据库集成和分发服务中心, 依托专用数据通信平台 (如海域专网) 建立空间基础数据的管理和发布机制, 为沿海各县、区海洋行政管理部门和海洋经济管理部门等提供地理信息支持, 进一步完善市、县、乡海域使用动态监视监测三级联动管理的信息化建设。第四, 开展空间基础信息共享平台在海洋功能区划、海域使用管理、海洋环境管理和海洋渔业管理等各方面的应用, 通过应用发挥海洋空间基础地理信息数据库在海洋行政管理中的基础作用, 并逐步完善空间基础数据。第五, 其他内容, 包括共享框架标准以及地理信息编码标准规划等。

3 系统总体设计方案

根据连云港市海域管理空间基础地理信息系统建设的原则, 以及数据库系统建设的主要需求和任务, 结合系统需求分析报告, 海域管理基础地理信息系统建设主要是由空间数据库、技术标准、系统管理和应用等方面构成, 其系统体系结构如图1所示。

考虑到所要建设数据的多样性、复杂性和零散性等特点, 先将数据按照分类进行格式、坐标等的统一, 将空间数据和属性进行关联, 然后根据数据库建设的相关标准进行入库前的准备工作。GIS应用系统通过空间数据库引擎与SQL Server进行连接, 按照入库标准把各种数据进行入库操作, 完成入库工作。

3.1 海域管理空间数据体系建设

空间基础信息系统的数据体系是一个多尺度、多数据源、多时态的空间数据集合[4], 它能够完整地描述其管理范围内海洋及海岸带自然和社会形态的地物地貌信息以及它们的基本属性信息, 并以此为基础显示和分析海域使用、海洋环境、海洋经济等各类海洋空间信息。

结合相关海洋行政管理现行的工作和管理体制, 兼顾数据生产、使用和更新, 参照国家相关行业标准[5] (包括GB/T13923—1992国土基础信息数据分类与代码, 国家海域使用动态监视监测管理系统数据库标准规范等) , 通过整理, 把海洋行政管理空间基础数据分为九大类, 基础数据库及专业数据库的建设主要围绕这九大类数据进行, 具体见表1所示[3]33。

3.2 海域管理应用系统建设

3.2.1 系统设计原则

1) 可扩展性

对所有操作的内容进行动态读取, 适应不同规范和标准的数据, 考虑到代码移植的方便和简单, 使用COM接口方式进行开发。

2) 可定制性

通过用户自定义入库规则和自定义检查内容, 对数据的入库和数据的检查灵活设置。

3) 界面友好

用户界面的设计应使程序易于理解和使用, 程序灵活可靠。

3.2.2 系统设计内容

基础空间数据的入库管理, 包括不同坐标系统数据的统一、不同数据类型的数据统一、无缝拼接, 并分层次分类型进行管理;空间数据更新;数据检查;影像数据的入库与管理;数据输出和专题图信息管理。

在系统进行入库操作的时候, 首先加载用户定义的数据入库规则, 在用户选择需要入库的数据中获取需要入库的内容, 并进行分类;对已经入库的数据可以进行图形的属性检查和拓扑检查, 在检查过程中系统需要参照标准来对数据进行分析和检查;同时也可以对数据库中的数据进行更新和编辑修改等。系统功能结构见图2所示。

4 应用

根据连云港市海洋信息化建设规划, 该系统已经完成了连云港市海域管理基础地理数据库的部分建设内容, 包括海域使用功能规划数据, 海岸线数据, 海岛数据, 等深点、等深线和等深面数据, 港口航道数据, 保护区数据, 海域使用现状数据, 海岸线附近道路、湖泊、居民地数据等的转化、统一和入库工作。系统同时还提供了查询操作等丰富功能。

5 结束语

连云港市海洋与渔业局结合自身的行政工作基础、业务状况和人员素质等客观条件, 规划开展海域管理空间基础数据库项目的建设, 利用多种新技术手段, 建立一个多尺度、多数据源的海洋空间基础数据库, 同时建立起数据管理、更新、共享与安全机制和标准化体系, 这些正是积极践行海洋行政管理体制改革和管理方式创新的体现。该系统在海洋管理的各个方面已经得到了初步应用, 效果明显, 在系统应用的过程中将不断改进, 更好地为海洋管理工作作出贡献。

参考文献

[1]周卫, 孙毅中, 盛业华, 等.基础地理信息系统[M].北京:科学出版社, 2006.

[2]万艳, 张珞平.海洋管理信息系统的应用[J].海洋环境科学, 2004, 23 (2) :51-54.

[3]连云港市海洋与渔业局.连云港市海洋管理综合能力建设项目实施方案[R].2008.

[4]李宗华.数字武汉空间数据基础设施建设[J].地理信息世界, 2006 (6) :80-82.

大数据安全防御模型构建研究 篇11

大数据是指携带巨量信息的高增长率和多样化的信息资产,正处蓬勃发展阶段,怎样保证其安全可靠是一个亟待解决的问题。病毒探测、主动防御等传统安全防护体系,无法适用大数据的可靠性管理[1]。大数据安全防御的重点是构建可行的防御模型。本文基于大数据可靠性需求,提出一种动态安全算法,构建了大数据安全防御模型。

大数据安全防御模型的构建

安全架构层次设计。本文将大数据安全架构划分为以下4个层次:

数据拆分层,主要按照数据拆分策略对大数据进行分布式管理,通过聚类算法对所获取的数据集进行分类和预处理。

数据分析层,主要分析预处理之后的大数据,分析目标包括可疑病毒、非法任务等。发现的风险因素会被立即隔离。

数据包装层,主要实现大数据的有效封装。封装时要充分考虑信息的加密需求,确保封装后数据的隐私性、准确性和安全性。

客户应用层,主要是大数据的使用者和分析报告的上传者。

安全防御体系的定义。本文以粒子群算法为基础,构建大数据安全防御体系。

首先为计算出大数据的信任度,提出以下4个定义:

定义1:如果信任度的起始与个体最好值 相等,则进行迭代操作的时候不再改变;假若信任度的起始值比上一值更优,则根据粒子群算法的规则,以起始值替换上一值: 。

定义2:为提升寻优效果,引入进化度θ: ,当经过多次迭代且θ=1时,表示寻优能力已经符合要求。

定义3:粒子群所有成员的个数以 表示,因此可以把动态因子的耦合度以 表示,耦合度的大小与数据的分散程度有关,当耦合度接近于1的时候,证明局部最优解已经形成。

定义4:结合以上3个定义,能够将动态信任因子表示为:

基于上述研究成果,为描述大数据安全防御行为,提出以下5个定义:

定义5:假若大数据可靠度处在信任因子范围内,则可以视为大数据是强安全的,表示为:

定义6:假若大数据可靠度处在信任因子范围内,但对于其他的访问者处在“开放访问”状态,则被视为弱安全,表示为:

定义7:在合法性方面,假若大数据处在最高合法水平,并且对于其他的访问者处在“不可访问”状态,则大数据被视为强合法状态。表示为:

定义8:假若大数据处在最高合法水平,并且对于其他的访问者处在“验证访问”状态,则大数据被视为弱合法状态。表示为:

定义9:假若大数据处在“开放访问”状态,则大数据被视为不合法状态。表示为:

最后,客户的操作请求与大数据可靠度间的关系表示为:

安全防御体系证据分析。为保证大数据的“强安全”与“合法状态”,假设大数据服务信息系统共拥有m台服务器,在m台服务器中,提取n台作为构建安全防御体系的数据样本。进一步假设,从n台服务器所获取的样本数据α∈泊松分布,则这些样本在服务器输入端以排队的方式等候处理和传输,等候时间为1/α[2]。如果一段数据信息的等候时间超时,则可视为信息已被丢弃。此时会生成一个反馈信息,通知信息的发送者重发信息。结合马尔科夫定律,在这种数据传输环境中,可靠度不足的信息识别是符合遍历准则的[3]。

安全防御模型实现流程。综上所述,完整的大数据可靠性防御模型实现流程为:

安全防御的初始化过程,新任务加入等待队列。如果轮到该任务进行处理,便将其信息从数据存储区提取出来,按照数据预处理策略进行分布式管理和数据集分类。

当判定数据为有效信息之后,将任务提交数据拆分层进行信息拆分处理。在信息拆分之前,系统预置了信息判定单元,这个单元的功能是对所有的信息处理过程引入来自云端的可靠性监控。

如果信息中所含有的任务之和能够进行分解,使之成为n个子任务,则分割函数可以表示为:

将拆分形成的子任务提交数据分析层进行分析处理。如果子任务信息已经在任务数据库中存在,则判断为重复任务,将其删除以保证数据库的低冗余。

分析处理完毕的子任务,提交到数据包装层。依据其独有的索引代码,形成哈希表,将其重新连接为一个整体的任务单元,并进行加密封装,之后传输至客户应用层。

判断是否存在下一个需要处理的任务;如果存在,则转至第一步。

本文提出的大数据安全防御模型,基于动态安全算法,能够克服传统网络安全管理体系不足,在信息安全受到威胁之前定位和清除隐患。该模型成功实现了基于云计算环境下的大数据安全隐私保护,符合大数据可靠性管理要求,具有较高推广价值。大数据时代,现有的数据隐私保护技术还不够完善,需要从科研和技术层面加大对云平台的大数据安全隐私保护的研究。

空间数据库构建研究 篇12

近年来, 国际空间活动日趋频繁, 世界各国日趋重视空间卫星轨道资源工作。卫星轨道资源的维护和安全保障工作是为支撑我国航天系统建设和航空航天事业快速发展提供的必要保障, 空间碎片作为航空航天设备在空间轨道中安全工作的潜在威胁, 加强空间碎片方面的研究和监测工作是保障空间轨道资源安全的有效技术手段。对空间碎片监测数据库管理系统研究是当前以大数据产业软件技术手段为抓手, 指导做好空间碎片监测工作的重要方法和重要组成部分。

普遍意义上讲, 空间碎片是人类遗留在空间的废弃物, 包括完成任务的火箭箭体和卫星本体、火箭喷射物、在执行航天任务过程中的抛弃物、空间目标碰撞产生的碎片等。随着空间碎片数量的增多, 空间碎片严重威胁航天器的安全运行和人类太空活动的开展, 空间碎片监测、预警受到各国的广泛重视。

近半个世纪, 人类进行的空间发射超过4, 000次, 送入空间并曾经被跟踪观测的物体超过29, 000个, 大约还有三分之一也就是9, 000多个仍遗留在空间沿轨道飞行。目前可被地面观测设备观测并测定其轨道的空间物体近万个, 大约有5%~6%是工作的卫星, 其余94%都是空间碎片。[1]见图1。

2 空间碎片监测工作

2.1 监测工作的重要意义

卫星轨道资源的安全保障是空间航天事业健康发展的基础要素。截至2016年初, 全球在轨卫星1, 305颗, 其中美国549颗, 欧盟201颗, 中国141颗, 俄罗斯131颗。预计未来15年, 全球要发射约1, 600颗卫星。这些卫星将承担更多任务, 对影响其安全的空间碎片环境的监测预警会提出越来越高的要求。为了保障航天事业可持续发展, 必须解决空间碎片的监测预警问题。

“十三五”期间, 我国将计划实现宇航发射120次, 包括载人航天、探月以及北斗导航等重大工程, 届时, 我国在轨航天器将超过200颗。我国月球计划需要考虑空间碎片的影响。按照飞行计划的安排可以知道, 月球探测器要飞抵月球, 需要经过空间碎片密集的近地轨道和地球同步轨道区域, 虽然停留时间并不长, 但是空间碎片撞击的高风险性, 迫使在月球探测器的发射时机的选择和近地飞行过程中也需要考虑空间碎片问题。

我国载人航天计划将在未来的几年内完成交会对接、航天员出舱活动, 并发展长期在轨运行的空间实验室。交会对接和航天员出舱的时机和位置的选择, 空间实验室的长期运行安全都必须考虑到空间碎片风险问题。

2.2 我国空间碎片监测工作情况

从2000年开始, 我国加大了空间目标研究的力度和投入, 国防科工委成立了空间碎片研究管理组, 制订了《空间碎片行动计划》, 并广泛参与国际机构间空间碎片协调委员会 (IADC) 组织的研究和实验活动。

空间碎片监测系统按平台分主要有地基监测系统和天基监测系统。自“十五”计划实施以来, 我国的空间目标探测手段有了大幅改善。通过重点建设, 我国大力发展了以光电和大型相控阵雷达为主的地基监测系统, 有效支撑了我国的各项航天活动。特别是2015年6月8日, 国家航天局空间碎片监测与应用中心在中科院国家天文台挂牌成立, 标志着我国空间碎片监测、预警、应对突发事件以及国际合作有了实体依托单位。该中心的成立有利于推进我国空间碎片技术发展, 提升空间碎片管理和服务能力, 保障航天器在轨运行安全, 维护我国外空发展权益。

随着我国监测技术的发展, 对空间目标的监视手段将逐步从地基发展到海基、空基, 并逐步向建立连续的空间监视网方向发展。

3 监测数据库系统

3.1 空间碎片监测数据库

在空间碎片监测工作中, 对空间碎片环境进行科学准确的研究描述, 是有效指导开展空间活动的重要保证。空间碎片监测数据库作为支撑空间碎片环境监测的核心基础, 是空间碎片监测工作的重要软件手段, 也是科学提高空间碎片监测效率, 指导空间碎片预测工作的重要组成部分。

根据当前监测能力, 目前对空间碎片环境的描述主要有两种方式:一是对于可准确探测的大尺度空间碎片, 采取适当的编码方法建立可跟踪、定轨的空间目标尺寸、速度、轨道等特征信息的数据库, 结合精确的轨道预报模型为空间活动各种应用提供指导依据;二是对更广泛尺度的空间碎片, 即部分未能编目入库的空间碎片, 应采用适当的数学方法建立空间碎片环境的短期工程模型和长期演化模型。[2]

3.2 监测数据库管理系统

空间碎片监测数据库管理系统 (Database Mana-gement System) 是在基于空间碎片日常海量监测数据, 综合操纵和管理数据库的软件, 用于建立、使用和管理各基础数据库, 并通过对数据库进行统一的管理和控制, 以保证数据库的安全性和完整性。监测技术人员通过监测数据库管理系统访问数据库中的数据, 数据库管理人员也通过数据库管理系统进行数据库的维护工作。它可使多个基于数据采集、存储、分析、挖掘方面的应用程序和用户不同的方法, 在同时或不同时刻去建立、修改和询问数据库。数据库管理系统提供数据定义语言DDL (Data Def inition Lang uage) 与数据操作语言DML (Data Manipulation Lang uage) , 供用户定义数据库的模式结构与权限约束, 实现对数据的采集、入库、追加、删除等操作。

监测数据库管理系统的主要功能如下:

(1) 数据定义:监测数据库管理系统提供数据定义语言DDL, 供用户定义数据库的三级模式结构、两级映像以及完整性约束和保密限制等数据约束。DDL主要用于建立、修改数据库的库结构。DDL所描述的库结构给出了数据库的框架, 数据库的框架信息被存放在数据字典中入库。

(2) 数据组织、存储与管理:监测数据管理系统要分类组织、存储和管理各种监测及分析数据, 包括数据字典、用户数据、存取路径等, 需确定以何种文件结构和存取方式在存储级上分析挖掘数据, 并实现数据之间的联系。数据组织和存储的基本目标是提高存储空间利用率, 选择合适的存取方法提高存取效率。

(3) 数据库的运行管理:监测数据管理系统运行控制和管理功能包括, 多用户环境下的并发控制、安全性检查和存取限制控制、完整性检查和执行、运行日志的组织管理、事务的管理和自动恢复, 支撑各数据库子系统的正常运行。

(4) 数据操作:监测数据管理系统提供数据操作语言DML, 供用户实现对数据的入库、追加、删除、更新、查询等操作。

(5) 数据库保护:数据库中的空间碎片监测数据及分析数据是维护空间轨道资源安全的战略资源数据, 数据的保护和安全至关重要。监测管理系统通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等来多维保障数据安全。

(6) 数据库维护:该功能主要包括数据库的数据采集、载入、转换、转储、数据库的重组合重构以及性能监控等功能。

根据监测工作方式, 数据库管理系统采用的是关系型数据库, 常用的有I BM DB2, O r a cle, M ic rosof t SQL Se r ve r, My SQL。当前, 监测数据库管理系统根据监测业务数据特点, 多采用Oracle商用数据库系统。基于空间监测业务特点, 本设计的空间碎片监测数据库管理系统结构图详见图2。

空间碎片监测数据库是空间碎片监测数据库管理系统的核心, 它是根据空间碎片数据特点, 综合利用数据管理软件, 构造适应数据挖掘分析和工作需要的数据模式, 通过优化的数据库和应用系统, 满足监测技术人员有关碎片数据存储、分析、回放等应用需求。

同时, 系统总体建设的原则是高效、安全稳定、可维护性、易扩展性、界面友好等等, 并能根据实际需求变化和事业发展需要, 满足“中国制造2025”等战略中空间资源安全保障的需求。

3.3 空间碎片编目数据库

空间碎片编目数据库是通过各类监测设备获得空间碎片参数信息的基础数据库。近年来, 各国逐渐重视发展空间碎片编目工作, 通过软硬件设施投入加大空间目标监测网能力建设, 逐渐建立了空间目标编目数据库。空间碎片作为空间目标存在的一部分形式, 空间碎片编目数据库可参考国际通行的空间目标编目数据库建设方法进行建立。

以目前国际上采用较多的空间目标编目方法为例, 可参考北美防空司令部 (North American Aerospace Defense Command, NORAD) 在space-track网站上公布的T LE数据格式, 它包括了空间碎片的轨道根数和其他相关信息, 由两行69字符的数据组成。[2]示例见表1。

其中, 作为数据库的信息项, 各入库信息应以统一时间参量为基准。域1.11是BSTAR大气阻力相关项, 可参考SGP-4模型使用的大气阻力项B*, 其表达式为

式中, CD是大气阻力系数;ρ0是空间碎片所在位置的大气密度;A是空间碎片的横截面积;m为空间碎片质量。B*描述了空间碎片受大气阻力影响的程度, 其值越大则收到大气阻力影响越大, 在空间运动中的可变性越强。

在空间碎片数据库的设计中, 针对数据库管理系统的特点, 不同的功能模块通过不同的数据表结构来实现系统的各项功能。例如, 碎片监测数据库包含天基监测数据表、地基监测数据表等, 其中, 天基监测数据表是基于天基监测系统获得的监测数据, 可用于保存监测中获得的空间碎片尺寸、速度、密度或通量等分布信息数据。

同时, 编目数据库的更新工作至关重要, 它直接决定着数据库的数据分析、挖掘及应用等工作的有效性。在实际工作中, 由监测站点获得监测数据后, 在将数据传向处理中心之前, 可先进行新监测与编目数据库中的根数信息进行关联, 通常可至少将80%的监测信息得到相关关联, 以大大减少中心的关联数量, 使得中心后级处理认证的过程相对加快, 避免一定的数据处理瓶颈。

4 对我国空间资源安全工作的启示

空间轨道资源是国家空间航天事业发展的战略资源, 也是国际进入空间、感知空间、利用空间的基础条件, 监测并预警空间碎片是保障空间目标在轨安全和国家空间基础设施安全有序运行的必要技术手段。

当前, 从维护我国空间轨道资源安全的高度, 着重做好空间碎片监测数据库系统等基础软件系统建设至关重要。我们以积极推进空间碎片数据库规范标准化工作为抓手, 加强监测研究和数据积累, 提出基于科学统计模型的空间碎片环境预测方法, 着重加强对重点轨位、重点空间一定范围内空间碎片海量监测数据的采集、挖掘、提炼和分析工作, 用全面、精准的数据推动空间碎片环境预测工作, 完善空间目标环境监视体系, 为我国航空航天活动保驾护航。

参考文献

[1]吴连大著.人造卫星与空间碎片的轨道和探测.北京:中国科学技术出版社, 2012

上一篇:工业强市下一篇:风险和不确定性