浅析GIS多源数据集成模式论文(精选3篇)
浅析GIS多源数据集成模式论文 篇1
[摘要] 地理信息系统的迅速发展和广泛应用导致了空间数据多源性的产生,为数据综合利用和数据共享带来不便。本文探讨空间数据多源性的产生和表现,指出多数据格式是多源空间数据集成的瓶颈;分析和评价了多源空间数据集成的三种模式,并展望了多源数据集成的发展方向。
一、多数据格式是多源空间数据集成的瓶颈
1、空间数据多源性的产生和表现
空间数据多源性的产生和表现主要可以概括为以下几个层次:
(1)多语义性
地理信息指的是地理系统中各种信息,由于地理系统的研究对象的多种类特点决定了地理信息的多语义性。对于同一个地理信息单元(feature),在现实世界中其几何特征是一致的,但是却对应着多种语义,如地理位置、海拔高度、气候、地貌、土壤等自然地理特征;同时也包括经济社会信息,如行政区界限、人口、产量等。一个GIS研究的决不会是一个孤立的地理语义,但不同系统解决问题的侧重点也有所不同,因而会存在语义分异问题。
(2)多时空性和多尺度
GIS数据具有很强的时空特性。一个GIS系统中的数据源既有同一时间不同空间的数据系列;也有同一空间不同时间序列的数据。不仅如此,GIS会根据系统需要而采用不同尺度对地理空间进行表达,不同的观察尺度具有不同的比例尺和不同的精度。GIS数据集成包括不同时空和不同尺度数据源的集成。
(3)获取手段多源性
获取地理空间的数据的方法有多种多样,包括来自现有系统、图表、遥感手段、GPS手段、统计调查、实地勘测等。这些不同手段获得的数据其存储格式及提取和处理手段都各不相同。
(4)存储格式多源性
GIS数据不仅表达空间实体(真实体或者虚拟实体)的位置和几何形状,同时也记录空间实体对应的属性,这就决定了GIS数据源包含有图形数据(又称空间数据)和属性数据两部分。图形数据又可以分为栅格格式和矢量格式两类。传统的GIS一般将属性数据放在关系数据库中,而将图形数据存放在专门的图形文件中。不同的GIS软件采取不同的文件存储格式。
2、多源空间数据集成的迫切性
随着Internet网络的飞速发展和普及,信息共享已经成为一种必然的要求。地理信息也不例外,随着信息技术以及GIS自身的发展,GIS已经从纯粹地学技术系统的圈子跳了出来,正和IT行业完全融合,人们对空间信息的需求也越来越多。GIS要进一步发展,必须完全融入大型MIS(管理信息系统)中。1998年美国副总统戈尔提出数字地球的概念,更是将地理信息技术推到了最前沿。然而地理信息要真正实现共享,必须解决地理信息数据多格式、多数据库集成等瓶颈问题。随着技术发展,GIS已经逐步走向完全以纯关系数据存储和管理空间数据的发展道路,这为GIS完全和MIS无缝集成迈出了重要的一步。但因为GIS处理的数据对象是空间对象,有很强的时空特性,获取数据的手段也复杂多样,这就形成多种格式的原始数据,再加上GIS应用系统很长一段时间处于以具体项目为中心孤立发展状态中,很多GIS软件都有自己的数据格式,这使得GIS的数据共享问题变得尤为突出。
空间数据作为数据类型的一种,同普通数据一样需要走过从分散到统一的过程。在计算机的发展过程中,先是数据去适应系统,每一个系统都为倾向于拥有自己的数据格式;随着数据量的增多,数据库系统应运而生;随着时代的发展,信息共享的需求越来越多,不同数据库之间的数据交换成了瓶颈;SQL(标准结构化查询语言)以及ODBC的出现为这一难题提供了比较满意的解决方案。但是空间数据如何引进这种思想,或者说将空间数据也纳进标准组织和标准协议进行规范和管理,从而使空间数据共享成为现实。
二、GIS多源数据集成模式比较
由于地理信息系统的图形数据格式各异,给信息共享带来了极大的不便,解决多格式数据源集成一直是近年来GIS应用系统开发中需要解决的重要问题。目前,实现多源数据集成的方式大致有三种,即:数据格式转换模式、数据互操作模式、直接数据访问模式。、数据格式转换模式
格式转换模式是传统GIS 数据集成方法(图1)。在这种模式下,其他数据格式经专门的数据转换程序进行格式转换后,复制到当前系统中的数据库或文件中。这是目前GIS系统数据集成的主要办法。目前得到公认的几种重要的空间数据格式有:ESRI公司的Arc/Info Coverage、ArcShape Files、E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的dgn格式等等。数据转换模式主要存在的问题是:
(1)由于缺乏对空间对象统一的描述方法,从而使得不同数据格式描述空间对象时采用的数据模型不同,因而转换后不能完全准确表达源数据的信息。
(2)这种模式需要将数据统一起来,违背了数据分布和独立性的原则;如果数据来源是多个代理或企业单位,这种方法需要所有权的转让等问题。美国国家空间数据协会(NSDI)确定制定了统一的空间数据格式规范SDTS(Spatial Data Transformation Standard),包括几何坐标、投影、拓扑关系、属性数据、数据字典,也包括栅格格式和矢量格式等不同的空间数据格式的转换标准。许多软件利用SDTS提供了标准的空间数据交换格式。目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模块,Intergraph公司在MGE产品系列中也支持SDTS矢量格式。SDTS在一定程度上解决了不同数据格式之间缺乏统一的空间对象描述基础的问题。但SDTS目前还很不完善,还不能完全概括空间对象的不同描述方法,并且还不能统一为各个层次以及从不同应用领域为空间数据转换提供统一的标准;并且SDTS没有为数据的集中和分布式处理提供解决方案,所有的数据仍需要经过格式转换复制到系统中,不能自动同步更新。、数据互操作模式
数据互操作模式是OpenGIS consortium(OGC)制定的规范。OGC是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理方法的一个非盈利组织。GIS互操作是指在异构数据库和分布计算的情况下,GIS用户在相互理解的基础上,能透明地获取所需的信息。OGC为数据互操作制定了统一的规范,从而使得一个系统同时支持不同的空间数据格式成为可能。根据OGC颁布的规范,可以把提供数据源的软件称为数据服务器(Data Servers),把使用数据的软件称为数据客户(Data Clients),数据客户使用某种数据的过程就是发出数据请求,由数据服务器提供服务的过程,其最终目的是使数据客户能读取任意数据服务器提供的空间数据。OGC规范基于OMG的CORBA、Microsoft的OLE/COM以及SQL等,为实现不同平台间服务器和客户端之间数据请求和服务提供了统一的协议。OGC规范正得到OMG和ISO的承认,从而逐渐成为一种国际标准,将被越来越多的GIS软件以及研究者所接受和采纳。目前,还没有商业化GIS软件完全支持这一规范。数据互操作为多源数据集成提供了崭新的思路和规范。它将GIS带入了开放式的时代,从而为空间数据集中式管理和分布存储与共享提供了操作的依据。OGC标准将计算机软件领域的非空间数据处理标准成功地应用到空间数据上。但是OGC标准更多考虑到采用了OpenGIS协议的空间数据服务软件和空间数据客户软件,对于那些历史存在的大量非OpenGIS标准的空间数据格式的处理办法还缺乏标准的规范。而从目前来看,非OpenGIS标准的空间数据格式仍然占据已有数据的主体。
数据互操作规范为多源数据集成带来了新的模式,但这一模式在应用中存在一定局限性:首先,为真正实现各种格式数据之间的互操作,需要每个每种格式的宿主软件都按照着统一的规范实现数据访问接口,在一定时期内还不现实;其次,一个软
件访问其他软件的数据格式时是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件,也就是说,用户必须同时拥有这两个GIS软件,并且同时运行,才能完成数据互操作过程。
3、直接数据访问模式
顾名思义,直接数据访问指在一个GIS软件中实现对其他软件数据格式的直接访问,用户可以使用单个GIS软件存取多种数据格式。直接数据访问不仅避免了繁的数据转换,而且在一个GIS软件中访问某种软件的数据格式不要求用户拥有该数据格式的宿主软件,更不需要该软件运行。直接数据访问提供了一种更为经济实用的多源数据集成模式。
目前使用直接数据访问模式实现多源数据集成的GIS软件主要有两个,即: Intergraph 推出的GeoMedia系列软件和中国科学院地理信息产业发展中心研制的SuperMap。GeoMedia实现了对大多数GIS/CAD软件数据格式的直接访问,包括:MGE、Arc/Info、Frame、Oracle Spatial、SQL Server、Access MDB等(图2)。SuperMap 2.0则提供了存取SQL Server、Oracle Spatial、ESRI SDE、Access MDB、SuperMap SDB文件等的能力,在以后的版本中将逐步支持对Arc/Info Coverage、AutoCAD DWG、MicroStation DGN、ArcView等数据格式的直接访问。
三、多源空间数据格式集成的展望、文件方式和数据库方式
传统的空间数据往往采用文件方式,随着技术的进步,逐渐将属性数据移植到数据库平台上;随着技术发展,图形数据也可以和属性数据一起存放在关系数据库中。文件方式对数据管理安全性较差,存在着属性和图形分开管理的问题,不适合网络共享发展的需要;数据库方式则实现了空间数据和属性数据一体化存储和管理,便于开发两层、三层甚至多层网络应用系统。从发展趋势来看,纯关系数据库方案取代文件方案是发展的必然趋势,这也是IT发展的主流趋势。随着对信息量需求的增大以及信息需求种类增多,数据仓库的建立,将是GIS文件系统向数据库系统发展的主流。、OpenGIS、SDTS与DLG/F
OpenGIS是目前的主流标准,但SDTS并不会停滞不前,相反笔者认为SDTS将会与OpenGIS走向一体化。SDTS 可以为OpenGIS提供一个转换和存取空间数据的标准,该标准是不依赖任何一种特定GIS软件格式的,该标准中利用头文件描述格式的方式使得数据服务者不必专门提供格式说明,而数据客户也不必专门学习该格式,只需读取SDTS头文件就可获得数据服务者提供的数据格式。笔者认为利用SDTS做数据标准,利用OGC作数据互操作的标准(例如空间SQL标准),简单地说就是如果说SDTS提供了数据格式的头文件,而OGC标准则提供了读写这个头文件的标准方法。如果再采用数据库作后台,利用空间数据引擎,空间数据引擎按照SDTS存取空间数据,按照OGC标准对客户软件提供操作接口,这将是空间数据集成的理想解决方案。USGS还提供了一种称作DLG/F的标准,该标准设计了空间数据在数据库中的动态存储结构,利用该结构可以将拓扑关系动态记录下来,同时可以让用户添加自定义的空间数据类型。怎样利用DLG/F完善SDTS和OpenGIS也将是OpenGIS以及SDTS发展的方向。、统一空间实体编码
多源空间数据据格式集成还有一个很重要的方面就是如何处理不同数据库对空间实体采用的编码方式不同的问题。从理论上来说,一个系统对同一空间实体的编码应该是唯一的,实际上由于不同领域从不同视角对同一空间实体编码并不一样,甚至会出现不同空间实体具有相同编码的情况,这些编码放在同一系统中,就会出现空间实体标识的严重问题。从目前来看,OpenGIS和SDTS都是基于地理特征(Feature)定义空间实体的,但都还不能真正提供一个通用的空间实体编码体系。
参考文献
1.On spatial database integration, Thomas Devogele ,Geographical Information Science, 1998,12(4)
2.Issues and prospects for the next generation of the spatial data transfer standard(SDTS), DAVID ARCTUR, DAVID HAIR,GEORGE TIMSON, etc, Geographical Information Science, 1998,12(4)
3.Towards integrated geographic information processing,DAVID J.ABEL, BENG CHIN COOI, KIAN-LEE TAN etc, Geographical Information Science, 1998,12(4)
4.A framework for the integration of geographical information systems and modelbase management , DAVID A.BENNETT, Geographical Information Science, 1997,11(4)
5.Overcoming the semantic and other barriers to GIS interoperability , YASER BISHR, Geographical Information Science, 1998,12(4)
浅析GIS多源数据集成模式论文 篇2
随着地理信息系统 (GIS)的广泛应用,产生了大量的GIS数据,成为当今信息社会的一笔宝贵财富。但由于GIS数据具有来源广泛性、数据格式多样性、时态性和多尺度性等特征[1],给数据的集成和共享造成了很大的困难,而GIS数据格式的多样性是数据获取与管理的主要障碍。
市政管线行业类型众多,包括自来水、排水、煤气、燃气、电力、电信、电视等。由于各行业采用的地理信息系统开发平台不同,选用的数据库软件各异,直接导致了市政管线地理信息系统对其它格式数据源获取和管理的困难。而事实上,一个市政管线系统要想发挥其空间分析的功能则必须共享其它系统或其它行业管线数据。如何充分利用现有GIS数据,共享社会的信息资源,是GIS应用中亟待解决的问题。
1 管线多源数据集成现状与特点
目前,应用GIS系统对多源异构数据的集成主要采用数据转换、数据直接读取、地理数据互操作三种模式(如图1),但这三种模式在一定程度上都存在缺陷。
1.1 数据格式转换
数据格式转换是传统GIS实现地理数据共享的主要方法,这种方法通过专门的数据转换程序经过两到三步转换实现。①首先将GISA系统的内部数据格式转换成本系统的数据交换格式。②再把GISA的数据交换格式转换成GISB的数据交换格式。③最后将GISB的数据交换格式转换成GISB系统使用的内部数据格式。有些数据转换将第二步和第三步合并,即将GISA的数据交换格式直接转换成GISB的内部格式。通常这种数据转换不是由单个数据转换程序完成的,需要调用多个数据转换程序才能实现。公认的数据交换格式有ESRI的E00、AutoDesk公司的DXF、MapInfo公司的MIF、美国的空间数据转换标准(SDTS)等。由于转换软件趋于最低公用标准,所以转换中造成了源数据部分信息丢失,需要后期大量的数据处理才能使用。
1.2 数据直接读取
直接访问是指在一个GIS软件中实现对其它软件数据格式的直接访问,用户可以使用单个GIS软件访问多种数据格式。目前实现直接数据访问的GIS软件不多,最具代表性的是Safe公司的FME,能直接读取100多种GIS格式的数据文件。另外超图的SuperMap和Intergraph的GeoMedia也可以实现对大多数GIS/CAD软件数据格式的直接访问[2]。直接访问提供了一种更为经济实用的多源数据共享模式,但当宿主软件的数据格式发生变化,数据访问软件不得不重新研究该数据格式,提供升级版本[3]。
1.3 地理数据互操作
地理数据互操作是指通过规范接口自由处理所有种类地理数据的能力和在GIS软件平台通过网络处理地理数据的能力。开放的地理数据互操作规范—OpenGIS(Open Geo-data Interoperability Specification)是由OGC(Open GIS Consortium)提出的有关地理信息互操作的框架和相关标准规范。OGC标准将计算机软件领域的非空间数据处理标准成功地应用到空间数据上,为多源数据集成提供了崭新的思路和规范[4,5,6]。但要完全依靠各个GIS软件支持地理数据互操作规范来实现多源数据的集成和共享还不现实,而且尚有大量未遵循这种规范的历史遗留数据。因此,目前地理数据互操作还不具备成为主流数据共享和集成方式的条件。
通常GIS的图形数据里只存取要素的空间数据,如果将大量复杂的属性数据也存储在图形数据里则会给数据的频繁存储操作带来极大的困难,所以大型的GIS系统都是将属性数据存放到数据库中,用标识字段通过程序将两者关联起来。虽然通过数据格式转换、直接读取和地理数据互操作都能实现或部分实现对GIS数据的集成和共享,但他们的共享对象是GIS空间数据,忽略了对GIS属性数据的共享。我们要进行空间分析,不仅需要对象的图形信息,其属性信息经常也是必不可少的。如市政管网系统的集成不仅需要体现管线管点空间位置的图形显示,更需要它们的属性特征才能进行空间决策和网络分析。因此只有同时共享GIS的空间数据和属性数据,才是真正意义上的GIS数据集成,并满足行业GIS应用的需要。本文在空间数据直接访问技术的基础上提出属性的转入和关联机制,解决了空间数据和属性数据在应用系统中的集成管理和应用分析难题。
2 多源GIS数据关联集成技术
多源GIS数据关联集成技术TAIG(the Technology of Associating and Integrating multi-GIS-data)是一种通过空间数据直接读取引擎和属性数据导入引擎将地理数据集成到GIS系统中,并且通过空间和属性关联机制实现对多源数据的集成管理和空间操作的技术。
2.1 TAIG的体系结构
2.1.1 数据来源层
它是各种空间数据和属性数据存储的数据文件和数据库,通过数据导入层和关联层提供给操作层使用。TAIG技术提供了对多种格式的空间数据和属性数据的转换和读取,包括MapInfo(Tab文件和Mif文件)、ArcInfo(Shape文件,Coverage文件和E00文件,SDE数据库)、CAD(dwg文件和dxf文件),Microstation的Dgn等等。该技术支持几种主流的关系型数据库管理系统,属性数据引擎提供了属性表在Access、Oracle和SQL Server之间的导入导出接口。
2.1.2 数据导入层
它主要由空间数据直接读取引擎和属性数据导入引擎组成。空间数据直接读取引擎可以利用现有的数据直接访问软件来实现,如FME和SuperMap的SDX都提供了对多种空间数据格式的访问接口,实现对大多数主流GIS空间数据的转换。属性数据导入引擎为要素属性数据的导入提供了通道,可以实现对Microsoft Access,SQL Server和Oracle数据库中数据表的导入,在数据表的导入过程中对数据表的名称和字段进行映射处理,使之更符合集成环境的需要。
2.1.3 数据关联层
GIS的空间数据(定位数据)表示现象的空间位置,一般以坐标数据表示。而GIS 的属性数据(非定位数据)表示事物的特征,例如数量、级别和名称等[7]。空间数据和属性数据通过标识字段关联共同指向地理事物,标识字段除了具有关联作用以外,它的编码规则通常还体现了行业之间或行业内部的分组分类信息。如市政管线GIS系统中可用管网设备编码作为标识字段,其编码生成规则为地区编码+设备编号(几何类型编码+行业编码+行业内部设备标识)+该设备的累计标识[8]。例如:设备编码为“705111200040000001”的要素标识地图上输入的南京市排水行业的第一个泵站。编码的位数和具体含义如下:
7051地区编码(南京市)1几何类型12
行业编码0004排水行业第4种1:管点2:管线 (排水) 点设备(泵站)
设备(排水行业泵站)编号0000001地图中输入的第一个泵站
为了使数据更好地融入本系统,参与系统的空间操作和空间分析过程,当空间数据和属性数据分别导入集成系统后,数据保留了原有的标识信息,TAIG的数据关联引擎按照系统新的数据组织和编码方式,并根据原有标识信息重新生成标识字段和标识值(如图3)。通过这种方式处理得到的数据不仅具有空间表达和属性表达,同时新的标识信息由于体现了当前系统的行业分组分类信息,为实现后期的数据操作提供了保证。
2.1.4 数据操作层
TAIG技术不是将多源数据简单的堆砌和叠加,由于该数据集成模式是空间数据和属性数据的全要素集成,数据读取后又进行了重新生成标识信息的再处理,因此,这些数据在新系统里可以被编辑、渲染和进行空间分析,通过系统二次开发可进行数据集成分析和功能扩展。在市政管线集成系统里的操作组件主要包括以下五类:
(1) 地图渲染组件 通常的GIS数据集成仅注重空间位置的共享,而数据原有的地图符号系统则被忽略。各种地图符号都用简单点、线、面代替,地图符号蕴涵的地理信息全部丢失,这不仅影响GIS地图的形象化表达,也给GIS操作者理解地图数据带来困难,而对管点符号特别丰富的市政行业则更是尤为如此。地图渲染组件的主要功能就是通过建立符号中间对应表,解决GIS空间数据转换后地图符号系统的共享和渲染问题。其实现
流程如下:GISA格式数据转换成GISB格式后,将GISA格式数据中的地图符号复制到GISB格式的地图符号库中,再根据这两种地图符号库符号编码的对应关系建立符号对应表,使GISB格式空间数据与GISB格式地图符号库关联,通过符号化模块对GISB格式空间要素符号化(如图4)。由此实现空间数据转换后地图符号的表现形式保持不变。
(2) 图形处理组件 它可以对地图要素进行添加、删除和移动等图形操作功能。在管线集成系统里,图形处理组件的作用主要体现在两个方面:①编辑现势数据。城市的管线数据几乎每月甚至每天都在发生着变化,集成的数据也许已不能反映管线目前的真实状况。利用图形处理组件可以添加新管线,删除废弃管线,以保持数据的现势性。②设计规划数据。当管线部门规划新的管线时,可以利用图形处理组件在地图上设计设备和管线的位置、走向、埋深,分析新管线和周边已有管线之间是否存在冲突,对管线布局的合理性进行科学分析。
(3) 查询统计组件 它提供各种查询统计方式,并对满足条件的要素进行提取显示。查询方式主要有点查询、SQL查询、矩形查询、多边形查询、图幅查询等,查询结果是满足条件的一条或多条管点或管线记录。统计方式包括矩形统计、多边形统计、按图幅统计、按行政区统计等,统计结果是在这个条件范围内的各行业管点和管线的类型和数量(或长度)。
(4) 拓扑分析组件 拓扑关系是指拓扑变换下的拓扑不变量,如空间目标的相邻和连通关系,以及表示线段流向关系等。在市政管线行业,物质在网络中流动不能有“自己的意愿”,在某个确定的时间里,物质沿着管线的流动方向是确定的。可见,管线具有明显的拓扑特征。拓扑组件主要包括拓扑生成组件和拓扑分析组件两大类,其中拓扑生成组件是根据行业的设备管线参数自动或半自动地生成拓扑关系(流向),拓扑分析组件是根据物质流向进行一些与拓扑有关的空间分析,如连通性分析、爆管分析、关阀分析等(如图5)[9]。
(5) 空间分析组件 它是根据管线类型、管线起止点埋深、管线起止点高程、管径、管点类型等信息对管线水平方向和垂直方向上的空间位置关系进行分析,包括横断面分析、纵断面分析、纵投影分析、交叉口分析、覆土深度分析、缓冲区分析等。横断面分析可以得出穿越断面的行业管线,以及它们的埋深、相互之间的垂直距离或水平距离等信息;交叉口分析主要是验证两条相交管线的净距是否满足规范要求;覆土深度分析是分析管线的埋设深度是否达到规定标准。如图6中显示选定区域中第6条记录的雨水管的起点覆土深度为0.61米,小于国家标准规定的雨水管最小覆土深度0.7,不符合国家标准。
2.2 TAIG的特点
2.2.1 多格式数据直接访问
由于避免了数据格式转换,减少了在数据集成中的信息丢失,TAIG为综合利用不同格式的数据资源带来了方便。GIS用户在使用数据时,可以不必关心数据存储于何种格式,真正实现格式无关数据集成。
2.2.2 数据符号的共享
以往GIS数据集成的研究重点集中在数据的空间位置信息,数据符号信息的共享没有得到应有的重视。地图符号作为地图的语言,作为GIS表达地理信息和空间概念的主要形式,对GIS数据表现和数据理解都是至关重要的。TAIG采用符号中间对应表机制使GIS数据集成过程包含了地图符号信息,保证了数据符号的共享和显示,丰富了集成数据的表达。
2.2.3 多源数据的复合分析
集成多源GIS数据不仅是为了在同一环境下浏览多行业的数据,更重要的是将这些数据应用于空间分析和决策支持。由于TAIG根据集成环境的数据模型对集成数据进行了重新关联处理,使得新集成数据和集成环境拥有一致的数据组织与表达方式,并实现了对多源数据的多种复合分析。
3 结 语
多源GIS数据的集成不仅是空间位置信息的集成,还是符号信息的集成,更是行业功能的集成。多源GIS数据关联集成技术通过将集成的GIS数据融入到现有GIS体系,恢复原有符号表达,并实现对数据的查看编辑、查询统计、拓扑分析、空间分析等高级分析功能,真正实现了由图形到属性再到功能的一体化集成。
参考文献
[1]李军,周成虎.地理信息特征分析[J].地理科学,1999,19(2):158-162.
[2]宋关福,钟尔顺,刘纪远,等.多源空间数据无缝集成研究[J].地理科学进展,2000,6(2):110-115.
[3]宋国民,贾奋励.地理空间数据共享机制研究[J].测绘学院学报,2002,19(2):134-136.
[4]黄裕霞,Frank Hoffmann,陈常松,等.GIS互操作的实现途径评述[J].地理研究,1999,18(1):105-112.
[5]黄裕霞,陈常松,何建邦.GIS互操作及其体系结构[J].地理研究,2000,19(1):86-92.
[6]http://www.opengis.org/[EB/OL].
[7]乌伦,刘瑜,张晶等.地理信息系统——原理、方法和应用[M].北京:科学出版社,2001.
[8]陶陶,李艳娜,张书亮.面向地理信息共享的AM/FM/GIS核心语义模型[J].测绘科学,2005(6):49-52.
浅析GIS多源数据集成模式论文 篇3
关键词:多源性;地理信息空间(GIS);数据集成
引言:当前科技不断进步,GIS对应的实际使用范围也在逐渐扩张,进一步完成了从传统军事、国民经济建设到个人、地理信息的转变。此外人们对于地理空间数据的要求不断提升,趋向于大范围、高精度及现势性好的地理信息。当前我国使用较高的高精度地理空间数据还是属于保密性产品,大家知道较多的地理空间数据还是存在大量数据权限方面的约束,而测绘部门所生产的数据无法满足客户的所有需求,所以用户在生产数据时,需要基于自身部门特殊的需求进行数据生产。这种特定式的数据生产行为,在增加生产成本的同时,对人、物力都造成了极大的伤害,并且阻碍了数据共享的发展。
1.多源性地理信息空间数据的产生及表现
1.1多语义性与多时空性。GIS研究对象特征的多样性直接促使地理信息存在多语义性。就某一地理信息单元而言,其显示生活中具备的集合特征存在一致性,不过其对应的语义存在多样性,如气候、地理位置、海拔等自然特征;同时,还包含经济社会信息。GIS的不同使得问题解决的方向与侧重点存在差异性,自然就出现语义差异。GIS还具备非常强的时空特性。某一GIS中的数据源可能出现同一时间不同时空的数据序列,还可能出现不同时间同一时空的序列数据。
1.2数据获取方式与储存方式的多源性。GIS在获取地理空间数据时具备多样化的特征,如现有系统、遥感手段、图表、GPS等。获取方式的差异性,促使数据的储存格式及提取方法都存在不同。另外由于GIS自身特性的影响,应用系统在长时间内会以某一项目为中心孤立发展。此外,很多GIS软件具备独特的数据格式。
2.多源性地理信息空间数据集成与融合的区别
多位多源性地理信息空间数据集成,其实就是基于逻辑或物理等方式下的有机集中行为,将来源、投影方式、比例尺、格式及坐标系统等存在区别的地理空间数据进行整合,进而完成地理信息共享行为。经由集成行为处理之后的地理空间数据从本质上而言并未发生改变。将多源性地理信息空间数据集成与融合进行比较发现,融合主要指基于某种特殊的应用需求,如处于同一地区但来源不同的空间数据,运用某种特定的方法,对特定属性数据进行重组,进而对地理空间实体精准度进行完善,使数据生产质量与效率进行提升。就本质而言多源性地理信息空间数据集成与融合并非两个独立性的个体。但集成作为融合的基础,是融合发展过程中不可缺少的重要环节。
3.多源性地理信息空间数据集成方法及完善意见
3.1数据的格式转换。数据格式转换模式作为传统意义上的GIS数据集成方法。基于该模式环境下的数据转换主要是结合专门的数据转换程序实施转换工作,同时,在转换之后可直接将其复制与系统内部数据库或文件。目前,使用频率非常高的空间数据格式如下:Maplnfo公司推出的MIF格式;AutoDesk公司推出的DWG格式以及DXF格式;ESRI公司推出的E00格式等。基于当前多源性地理信息空间这一环境,数据格式转换方式中存在的主要问题,可以概括到以下三点:第一,由于空间环境缺乏统—性的描述,导致在描述过程中,大量的数据格式所采用的数据模式存在非常大的差异性,从而使得转换行为发生后无法全面、精准的获取源数据的信息;第二,该模式要求数据必须完整统一,因而不能遵守数据分布本身具备的独立性原则;第三,若数据是从各个不同企业与单位处获取,那就会引发信息所有权转让等的问题。美国国家空间数据协会也可以称之为NSDI,其通过建立统一的空间数据格式规范,利用SDTS为越来越多软件创造了更为标准的数据交换格式空间。就当前情况而言,ESRI为ARC/INFO带来了SDTSEXPORT与SDTSIMPORT两种不同的模块。同时Intergraph企业在MGE等产品系列的生产过程中,不断融入能够支持SDTS矢量格式的各种内容。SDTS的产生,可以进一步完善数据格式缺少统一空间对象描述基础的不良现象。但就以目前SDTS的发民情况来看,能够知道其还有较大的进步空间。SDTS的主要问题是不能较为完全的概括空间对象使用的各个描述方式。
3.2数据的相互操作。GIS相互操作主要是基于分布计算与异构数据库等状况,GIS用户互相理解从而实现获取信息的透明性。在数据互操作实施的过程中,OGC(OpenGIS Consortium)针对这一方法构建了统一的规范性标准,进而促使同一系统的多元化空间数据格式支撑行为成为一种可能。基于OGC所指定的标准威严,可以将数据源来源软件成为数据服务器,而使用该软件的用户则称之为数据客户,而数据客户需要使用某一数据时,主要就是将数据请求发出,之后由数据服务器传递到用户手上,其目的是使得数据客户可以读取数据服务器中的任意空间数据。此外OGC标准对OpenGIS协议进行了深入思考,完善了空间数据服务及空间数据客户软件,但是在数据格式处理方面仍存在缺陷。针对多源数据集成模式来说,数据互操作规范行为能够促使新型模式的产生,不过上述模式在使用上仍存在较大的局限性。要想进一步完善数据间的互操作环节,就必须在各个格式对应的宿主软件内,按照统一格式完成数据访问接口工作,但就当前形势而言,实现起来还有较大难度。其次,某一软件访问其他软件数据格式,要通过数据服务器实现,而这一服务器则是被访问数据格式的宿主,换言之,数据客户实施该项操作之前需要同时拥有上述两个GIS软件,实现同时运行,进而实现数据互操作。结束语:由于地理信息系统发展速度不断提升,使得多源化地理空间数据产生出来,对数据共享与综合化利用这一目的的实现造成了影响。笔者为了降低多源化空间数据下的数据生产成本,全面提升生产效率,提出了多源性空间数据集成这一想法,合理运用这—方法能够有效的降低数据获取费用,促使地理信息产业得到进一步发展。
【浅析GIS多源数据集成模式论文】推荐阅读:
多源数据11-07
多源遥感数据11-03
多源图像融合09-13
多源治疗仪08-16
软件设计模式浅析论文09-01
房地产楼盘营销力策划模式浅析经济学论文07-04
《微信》用户数据浅析07-03
德国医学教育模式浅析07-09
基于机载激光雷达数据的地形图成图技术浅析05-09