地理信息Web服务论文

2024-06-30

地理信息Web服务论文(精选12篇)

地理信息Web服务论文 篇1

1 引言

Web技术的飞速发展将地理信息系统带入一个崭新的发展阶段,地理信息技术与Web技术的结合,推动了地理信息以更快的步伐部门化、产业化和大众化。另外,分布式计算技术的发展,特别是Web 服务的出现,为地理信息服务的广泛共享提供了技术支撑。GIS经历从封闭、孤立式单机GIS到网络化的地理信息共享,并进一步迈向空间信息Web服务。空间信息Web服务指的是基于地理空间定位属性描述的Web服务。GIS的功能与分布式计算功能联系起来,就产生了Web制图和WebGIS,进而与Web服务技术结合,就产生了基于Web的地理信息服务。

可以认为在计算机网络环境下,根据行业标准和接口所建立起来的地理信息服务,它可以让人们使用计算机网络技术自由地访问分布于不同地方的各种地理信息及服务,比如地图、图像、数据集服务、地理空间分析和报表生成等。目前对地理信息网络服务具有不同的名称:地理信息web服务(GeoInformation Web Service-GI Web Service)(Alameh N., 2003; Bernard L., 2003; C.Granell, 2004; E.Klien; 王泽根, 2006; Einspanier U.,2003…)、地理空间web服务(GeoSpatial Web Service)(L.Chen,2004; J.T.Zhang, 2005; 吴斐, 2005; Peng Y.2007…) 、GIS Web服务(GIS Web Service)(Sun Y.F., 2005; Aditya, 2003…)、网络地理信息服务(承继成, 2000; 安杨, 2004…)等,它们的含义都大同小异,在本文中使用地理信息web服务(Geo Information Web Service)。地理信息Web服务不仅是一些协议的集合,也不仅是独立应用实体的集合,它是一个集应用逻辑、网络技术、工作流管理、知识表示、逻辑推理、和信息集成等技术为一体的新兴应用模式。工业界、学术界从不同的侧面对地理信息服务进行研究,从理论及实际应用的角度为其提出了一系列新兴的实施技术和改进策略。

本文试图从Web服务的基本概念和体系架构、地理信息Web服务的标准规范、平台研究以及其应用领域出发;对地理信息Web服务的现实应用背景,对地理信息web服务的组合、服务链及其相关技术进行分析;特别是针对目前的新兴技术-网格技术与地理信息Web服务的结合、主动地理信息Web服务进行探讨。

2 Web服务架构

万维网联盟(The World Wide Web Consortium,W3C)对Web服务作了如下的定义:Web服务是一个通过UR1L 识别的软件应用程序,其界面及绑定能用XML 文档来定义、描述和发现,使用基于Internet 协议上的消息传递方式与其他应用程序进行直接交互。Web服务采用了大量的标准化技术,充分利用了现有的网络技术、标准或者协议,建立在高文本传输协议(HTTP)、Web服务描述语言(WSDL)、简单对象访问协议(SOAP)和统一描述、发现、集成(UDDI)等标准以及XML等技术之上。Web服务的体系架构,如图1所示,该架构由3个参与者和3 个基本操作构成,3 个参与者分别是服务提供者、服务请求者和服务代理,而 3个基本操作分别为发布、查找和绑定。服务提供者将其服务发布到服务代理的一个目录上。当服务请求者需要调用该服务时,它首先利用服务代理提供的目录去搜索该服务,得到如何调用该服务的信息;然后根据这些信息去调用服务提供者发布的服务。当服务请求者从服务代理得到调用所需服务的信息之后,通信是在服务请求者和提供者之间直接进行,而无须经过服务代理。在Web服务架构的各模块间以及模块内部,消息以XML格式传递,从而允许在不同平台上以不同语言编写的各种程序以基于标准的方式相互通信。

3 地理信息Web服务标准规范研究

在地理信息Web服务规范的研究方面,目前比较有代表性的是国际标准化组织委员会的ISO/TC211标准和OGC组织的OWS规范。

国际标准化组织ISO/TC211技术委员会在IS019119草案中对地理信息服务的相关概念作了如下的定义:

服务:通过一个接口来访问操作的集合,允许用户通过触发其行为来获得响应的结果。

操作:从一个对象请求获得的交互的规范,从而影响对象的行为。

接口:操作的实现,包括对给定的分布式计算技术的交互的语法。

互操作:不同的功能单元之间以某种方式进行交互、执行程序、传输数据。而且,这种方式要求用户不需要对这些单元的特性了解很多或者可以不了解。

为了支持灵活的体系配置,信息技术体系结构通常为多层的分布式体系,ISO/TC211委员会提出了一种4层逻辑结构的框架体系,如图2所示。该框架体系的逻辑结构是由服务以及相关的接口所组成,物理结构则是由一些组件以及相关的执行服务的接口所组成。这些组件则是宿主于特定的硬件系统平台或者网络节点之上。

在该体系结构中,地理信息服务分为六类:人类交互服务,信息处理服务,通信服务,模型/信息管理服务,工作流/任务服务,系统管理服务。其中,人类交互服务通过显示与输入媒介和适当的人机对话来负责与用户的物理交互;通信服务负责将不同的层联系在一起,作为层与层之间联系的桥梁;用户处理服务负责用户的功能请求的响应;业务处理服务负责多用户对通用服务以及特定服务请求响应;模型信息管理服务层负责数据的物理存储和管理;对于流任务服务层,可以认为它是一系列的服务的特定的处理流程;系统管理服务层与多层体系结构是垂直的,责系统的管理服务。

开放地理空间信息联盟(OGC)为了更好地将地理信息服务的概念扩展到网络上来,以Web service的方式提供服务,OGC建立了OpenG1S网络服务(OWS)研究计划。OWS指的是一个基于开放标准的Web地理空间服务框架,这个框架允许无缝集成Web地学处理和位置服务。OWS的目的是提供一个厂商无关的互操作框架,该框架可以对各种地理数据、传感器感知的信息、位置信息和地学处理等数据和功能进行基于Web的发现、存取、集成、分析、利用和可视化等操作。

OGC于2000年4月制定了第一个WMS服务规范版本1.0,其后分别于2001年6月和2月陆续推出WMS的1.1和1.1.1版本,目前的版本是2004年8月推出的1.3。而WFS服务规范起始于2002年5月推出的1.0.0,并维持至今。WCS规范扩展了WMS的服务接口以支持图层(Coverage )概念的地理位置和属性信息服务,始于2003年2月份,目前的版本是2003年8月份颁布的1.0.0。围绕这三种地理信息服务,OGC制定了相应的服务以支持或扩展以上服务,包括坐标转换、数据格式转换、地理编码、图层样式描述、事务处理支持、服务注册支持等。根据服务的内容可以大致分为数据处理服务、数据或地图服务、用户接口服务等。OWS处于Request for Comments (RFC)阶段的OGC最新成果是Web Processing Service (WPS)协议,2005年OGC发布了WPS(V4.0)讨论稿,WPS致力于实现GIS功能的服务化调用。

目前有很多大型软件都实现了OWS规范,如ESRI的ArcIMS支持 WMS和WFS规范;MapInfo 的MapXtrem支持WMS、WFS规范;国内的GeoStar支持WMS、WFS、WCS规范;SuperMap iServer支持WMS、WFS、WCS、WPS等多种规范;MapGIS-IMS支持WMS、WFS、WCS规范等。WPS规范由于目前处于讨论阶段,还没有实现该规范的成熟软件,但是一些大型项目还是实现了该规范,并且应用于多个行业,如:PyWPS项目,它最早实现WPS规范,它主要是调用Grass自带的栅格或矢量功能来进行地理信息操作,包括缓冲区分析、网络路径分析等功能。52north Incubator工作组基于开源API实现了地图制图综合处理基本模块的WPS;加拿大的AAFC(Agriculture and Agri-Food Canada)实现了WPS及服务链,将ET(Evapotranspiration)模型封装成WPS,并以输出日可能ET的WMS;欧洲的AWARE EU项目和ORCHESTRA项目都实现了WPS及其服务链,并分别应用于水土流失预测、水资源管理等领域以及评估自然灾害损失(如水灾、森林火灾等)和决策支持。

4 地理信息Web服务平台及应用研究

4.1 地理信息Web服务平台研究

地理信息Web服务服务平台软件研究方面,目前有代表性的有ESRI Geography Network、微软的MapPoint、基于.Net平台的Terra Server影像数据服务、ESRI和MapInfo基于Web Service构建GIS软件等。

ESRI早在2002年就提出了g.NET战略思想,把GIS系统的构建方式和应用从Intranet方式推动到了Internet方式。ESRI在2004年秋天发布的ArcGIS 9中提供了基于WebServices思想的服务体系,该服务体系同时支持.NET和J2EE两种体系平台上的开发和应用。

微软的MapPoint Web 服务是一个基于订阅的 Web 服务。MapPoint Web 服务简化了将地图信息和相关功能集成到应用程序中的工作,并提供以下的基于位置服务(LBS):基于地址、兴趣点、经纬度的位置服务,位置相关背景(如地图和地址)服务,路径选择服务,邻近搜索服务,距离计算服务等。

2001年10月,芬兰启动NAVI项目,旨在管理基于位置服务的活动,其中芬兰测绘局采用OGC制定的标准地理信息服务规范开发了一个空间数据和地图服务系统-NAVImap,成功实现了网络管理分布在各个定位服务上的信息。

另外,MapInfo公司推出了MapXtreme2004和MapXtreme For Java 4.7分别是支持.NET和J2EE平台体系的Web应用地图服务开发平台;我国的超图公司2004年推出了它的面向Web服务的新一代Web地理信息服务开放平台SuperMap IS .NET 5,它基于Microsoft .NET技术和SuperMap Objects组件技术开发,设计全新的面向服务的技术体系结构,提供更灵活的二次开发方式和更强的并发访问能力;吉奥之星推出了GeoSurf 4.0的网络GIS Java开发套件,它是一套基于J2EE的平台软件,在GeoSurf 4.0中包含GeoSurf客户端组件、GeoSurf应用服务器、GeoSurf空间数据处理服务器和Geo Surf部署管理工具等几个部件。灵图公司的Sm@rtIMS是一套基于Web的应用组件,用户可以通过Web方式简单易用地得到地理信息服务;福建省空间信息工程研究中心的SircWeb网络服务平台,则可以允许用户将其集成到自己的应用系统中。

4.2 地理信息Web服务的应用研究

随着科技发展和社会进步,遥感影像、电子地图等地理信息的网络服务由于其方便快捷、直观可视化的特点,日益受到国内外公众的关注,并广泛应用于各个领域,如资源管理、资源配置、城市规划和管理、灾害管理和评估等(Jonathan L.Goodall et al,2007; C.Farcy,2005;C.Kiehle,2006;A.Friis-Christensen,2006);OGC的Web服务体系结构已经成功的运用在德国、加拿大、美国的空间数据基础设施的建设中(Bernard L, 2002;David J.Maguire,2005);建立于2003年的基于Web服务的空间信息门户‘www.geodata.gov’,也是Web服务技术在空间信息领域的成功应用(Winnie S.M.Tang,2003);Ben Domenico开发的基于标准规范的地理信息服务被用于地球科学数据系统的互操作中(Ben Domenico et al,2006);Liping Di基于OGC提出的WCS开发IPODAS(Interoperable,Personalized,On-demand Geospatial Data Access and Services)系统,实现了多源遥感数据的互操作(L.P Di,2005);马林兵提出了一个基于可重用Web Service技术在全球范围内解决GIS数据集成和共享问题的新方法,并应用于城市交通管理信息系统中(马林兵,2003) 。

国际上相继推出的Google Earth、Virtual Earth 3D、GeographyNetwork、Geospatial One Stop著名地理信息服务平台;欧盟的INSPIRE Prototype、数字挪威中的GeoNorg 、印度的NSDI India Prototype以及英国的NG-DF;国内的一些网站,如51ditu、人人网、图形天下等为公众提供了城市地理信息网络服务。

目前,我国适应全球信息化建设的发展趋势,也启动一系列的以"数字省"、"数字城市"、“数字行业”为核心和目标的信息化工程。国家科技部于2002年做出了加强科技基础条件平台建设的战略部署,推动实施了"科学数据共享"项目,旨在形成国家科学数据共享服务体系,实现跨地区、跨学科、跨部门的分布式科学数据共享,避免国家在数据资源建设方面投资的巨大浪费,为提升我国科技创新能力发挥重大的作用。在“数字奥运”框架的基础上建立的奥运官方网站,其提供地理信息的观众服务,为奥运期间世界各国游客和运动员的衣食住行提供基于地图、位置的信息服务。

我国的国家空间数据交换中心、武汉大学的空间信息网络服务技术及产业化、福建省空间信息工程研究中心的城市空间信息网络服务平台-SircWeb等提供的地理信息服务已被应用于城市信息化建设中。

5 地理信息Web服务的相关技术研究

5.1 服务链及服务组合关键技术

在ISO/TC211和OGC联合推出的IS019119服务体系结构中给出了服务链的定义:地理信息服务链是指地理信息服务的序列,在该序列每个相连的服务对中,第一个服务的行为是产生第二个服务行为的必要条件。一个地理信息服务链系统应该具有服务的发现、组合、执行能力,用户无需拥有和维护GIS数据和系统,只要能够连接到网络环境,就可以使用该系统查找、发现、组合所需服务,完成特定功能。地理信息服务通过注册中心注册,地理信息服务链用户在服务链系统的帮助下查找注册中心,发现符合要求的服务,组合服务,地理信息服务链系统负责执行服务流程,并将结果返回给用户。

OGC和ISO/TC21 I对地理信息服务链做了初步研究,提出了地理信息服务链三种类型(透明链、不透名链和半透明链),给出了地理信息服务的分类体系,为地理信息服务链的研究奠定了基础。其中的透明链要求用户负责组织服务链,调用服务,透明链实现简单,但对用户专业知识要求高;不透明服务链将若干服务集成为一个单一服务,用户不知道服务链内部信息,将服务链当作一个独立服务使用,这种方式用户控制能力差,灵活性低;半透明链要求用户预先定义服务链,将服务链的流程定义送入工作流引擎,由工作流引擎负责执行,返回结果。

在上述基本定义、研究框架下,众多学者从不同方面对服务链及服务组合做了研究:

在服务链的支撑技术方面:Nadine Alameh对GIS服务链的类型以及各种类型的服务链的实现技术作了初步探讨( Alameh N, 2002 );Lars Bernard指出对服务链的研究需要解决空间信息和操作的表达、服务和数据的目录、服务能力描述、服务语义转换、语义匹配算法和匹配程度这六个问题( Bernard L, 2003);Trias Aditya通过本体词汇描述服务,对基于本体描述的透明工作链作了初步的研究(Aditya T., 2003)

服务链的框架研究:Leonid Stoimenov提出了基于Agent Wrapper和mediator技术的语义的GIS互操作框架( Stoimenov L, 2002);U.Einspanier指出现有服务链模型缺乏流程描述和执行规则的描述能力,并提出采用BPEL4WS作为服务链描述的解决方案( Einspanier U., 2003);Luo Chen等(L.Chen et al, 2004)提出一个描述地理web 服务组合和动态构造服务链过程的概念框架与数据结构-服务链表(SCG),在这种框架下,通过表结构的转化能够实时逐渐地建立服务链,因此扩展了服务组合过程的机动性;Sun Yanfeng (Y.F.Sun et al,2005)为了提高服务组合的有效性和可靠性, 提出一个地理网络信息服务组合的补偿机制,解决了更新某个服务时,能够保证服务组合的连贯性和可执行性。

基于工作流技术的服务组合方面: 基于工作流的动态服务组合的主要思想是基于特定的组合应用逻辑利用工作流的概念建立通用服务组合模型,通过对通用服务组合模型的实例化形成一条可执行的服务链来满足应用需求。Weske等在1998年明确提出了空间信息工作流(Geo-Workflow)的概念。他详细阐述了工作流和空间应用的关系。将工作流管理系统应用到地理研究领域的方法,提出一个科学工作流管理系统WASA在空间分析领域的应用,该系统具备了空间建模和自动执行的能力。Jianting Zhang通过扩展kepler科学工作流系统的类型检查机制提出了助于用户更有效地组合地理信息Web服务,使用名叫kepler的科学工作流环境,通过扩展他的检验机制来验证地理信息web服务的组合,让用户在使用地理服务时无需知道地理数据类型之间的复杂关系,而能有效地构造地理空间处理工作流。贾文钰等提出了一种基于工作流技术的动态GIS 服务链的实现方法,该方法使用抽象GIS 服务组合服务链,由GIS 服务动态选择机制将抽象服务映射到具体服务,并结合工作流技术,将工作流描述语言描述的GIS 服务链流程送入工作流引擎,由工作流引擎管理和监控服务链的运行(贾文钰等, 2006)。刘书雷等提出基于空间信息服务的特点和动态服务组合的应用实际,提出了基于工作流的五阶段动态服务聚合实现机制(刘书雷等, 2007);G.Hobona等提出基于业务流程执行语言(BPRL)的工作流方法来组织OGC和OGSA对地理信息Web服务(G.Hobona et al, 2005)。C.Kiehle等实现了OGC地理信息Web服务组合的业务逻辑,并在地下水脆弱性分析中得到了运用(C.Kiehle, 2006)。

基于地理信息语义的服务组合: 对于地理信息本体语义的研究,国内外的相关学者给予了很大的关注, 景东升分析了语义网络服务的服务轮廓、服务模型和服务基点,提出了基于OWL-S和Agent的地理信息服务的框架和地理信息语义服务内容,讨论了基于智能体的地理语义查询体系框架:以地理缓冲区服务为例进行了语义网络服务的表达、服务描述和组合(景东升, 2005);吴斐等通过引进本体及其语义服务,提出了基于服务本体的地理空间信息语义服务框架,并以缓冲区分析为例进行了地理空间信息Web服务的语义表达和组合研究;安杨等提出采用“概念层-应用层”两个层次来描述地理信息服务,将服务发布后,通过对服务描述中输入输出等参数和用户需求中功能描述的测度来判断服务与用户需求的匹配程度,从而进行服务发现(安杨等, 2004);Sirin 等提出了基于地理信息语义和SOA的自动组合地理空间Web服务的方法,探究了地理空间Web服务与地理空间信息内容语义以及将该语义形式化成地理空间本体,开发了地理空间领域的3种本体:数据类型、服务类型及其关联,在SOA框架内使用这些语义方案。OGC标准的web服务与非标准的web服务都被用来语义分析、本体设计以及组合。数据类型本体的媒介RDF结构在服务消息间能够很好地降低请求的方案(Sirin et al, 2003)。

以上是一些地理本体概念、地理信息、分类和本体驱动的地理信息系统等方面开展了研究,为地理本体理论和应用奠定了基础,但系统性、实用性尚待提高。因此,在自动组合服务是服务的功能语义需要加深考虑,如OGC WCTS服务实现几何操作,无需转换输入数据的内容和标题就能改变空间坐标参考系统。第二是空间推理。由于在服务组合是考虑到一些空间以及临时的约束,对地理数据的空间特征完整的考虑,如拓扑关系是需要的。将地理空间推论引入web领域是一个充满挑战的领域第三是AI计划,已经有很多人致力于使用AI来自动组合web服务(Srivastava and Koehler, 2003; Rao and Su, 2004;Peer, 2005)。

基于Agent技术的服务组合: 不同领域的专家对Agent有着不同的理解和定义,分布式GIS中引进Agent技术,是为了要降低分布式地理信息系统的复杂性和建设难度,解决网络地理空间信息服务功能以及GIS应用领域中的协作问题,同时也为了改善分布式地理信息系统的服务能力和服务效率。空间Agent能够很好地适应开放式的网络环境,提供粒度适宜、且易于装配与组合的地理信息服务(李琦,2002)。空间Agent 的按需装配特性使得该模式能够把各种地理信息功能以多种方式动态地装配来,以不同粒度为数字城市的应用提供所需的地理信息服务。法国Bourgonge的ISIS(Interoperable Spatial Information System)提出的基于Agent的集成框架有一个语义协调器用于支持GIS语义的互操作,能动态地解决语义冲突,使之具有透明性、灵活性和可扩充性。Song Yu等综合了Agent和Web Service技术,提出了动态地理信息服务框架原型及其实现的关键技术,使用WSDL来描述地理信息Web Service Agent,使用基于本体的语义来扩展UDDI; O.B.Kwon 提出一个上下文整合的Web服务机制来提供自治和智能的服务(O.B.Kwon,2006)

除上述主流的地理信息Web服务组合技术之外,G.Fenza等采用了模糊集作为数学模型描述多粒子信息与服务描述结合,来提高服务的查找效率(Giuseppe Fenza et al, 2006)

C.Kiehle 等提出了一种面向对象的地理信息服务组合方法,它是一种半自动组合服务的方法(C.Kiehle et al, 2004);Y.L Wen提出了对象设计(design with object (DwO))的服务组合方法,这种方法交面向对象的方法更有优势,它在刻划服务变化时设计的对象无需直接改变服务本身,也无需隐藏信息(Y.L Wen et al,2007)。

5.2 基于网格技术的地理信息Web服务

网格是新一代的信息基础设施,信息高速公路 Internet 是信息传输的信息基础设施;而网格计算的基础设施 Grid 是信息处理(包括信息传输)的信息基础设施。网格是用来解决资源的真正共享,使各结点大量闲置的计算资源和存储资源得到统一支配和使用。网格还试图解决目前的信息孤岛问题,在所有 Web 服务器之上建立有机的联系,不再需要用户自行游历,去搜集、筛选和整理所需的有用信息。网格不是重新架构,而是在现有的网络基础上的一个延伸。

面向Web Services的开放网格服务体系结构是目前对于网格可行研究的一个方向(R.Prodan et al, 2003;Xiaobo Yang et al, 2004; J.Mark Pullen, 2005; P.D'Onorio et al, 2007)。广义开放的面向Web Services的框架GIS结构应用的结合是网格技术发展的重要趋势,顺应这一趋势,以实现对地理信息Web服务为中心的开放网格服务体系结构OGSA(Open Grid Services Architecture, 2002年2月IBM与Globus )是目前最新的一种网格体系结构,也是开放格网GIS服务得以实现和运行的基础平台。OGSA在We Service服务概念的基础上定义了网格服务的概念。网格服务是特殊的Web服务,具有特定功能的网络化实体。它定义了一组接口这用于解决服务发现、动态服务创建、服务生命周期管理、通知等与临时服务有关的问题。

OGSA注重实现对地理信息服务的共享。从对GIS数据资源的共享到对地理信息服务的共享,将资源、信息、数据等统一起来,非常利于实现灵活的、一致的、动态的地理信息共享机制,从而为分布式GIS系统管理提供了标准的接口和行为。由于OGSA将一切都看作是服务,因此网格GIS就是可扩展的开放GIS服务的集合。开放地理信息Web服务可以通过不同的方式聚集起来满足远程用户的需要,远程用户也可以部分地根据它们的操作和共享的地理信息服务来定义。简单地说,开放Web地理信息服务=接口+行为(XML描述)十GIS服务数据。OGSA得到商业化GIS软件公司,例如ESRI、MapInfo的支持,并且初见端倪。GIS领域采纳互联网标准和协议,如XML,可以将松散结合的GIS网格和地理信息处理服务结合起来,形成地理信息服务

网格在地理信息服务中的应用得到了国外很多组织、专家和学者的重视,国际对地观测卫星联合会(CEOS) 于2001 年开始了在GRID 的构架下,如何实现卫星数据和地理数据全球范围内的共享的原型研究(杨崇俊, 2003)。国际对地观测卫星联合会的Bill Johnston 先生提出了基于OGC Web Service 的GRID 构架,把OGC Web Service 与GRID 结合起来,这是指OGC 所规定的组件同时就是GRID 的界面组件,如:数据发现界面组件;数据获取界面组件;储存资源发现界面组件;数据储存界面组件;计算资源发现界面组件;模型执行界面组件等。这样一来,GRID 对用户就是透明的,,用户可以利用网络上的各类信息资源实现综合制图等GRID 是在Internet 环境下主要提供计算和数据管理服务;Web Service 主要提供描述、传输、管理、应用服务。

网格技术与地理信息Web服务结合应用研究方面,Z.F.Shen 等提出了基于Grid GML的分布式中间件架构与web服务技术的结合很好地解决了资源的有效共享、高性能处理能力等GIS问题(Z.F.Shen et al, 2004);M.richards等采用网格计算、数据融合、数据挖掘、地理信息Web服务等技术对城市实时污染数据进行监控、分析、建模和制图(M.richards et al, 2006);中国教育科研网格ChinaGrid基于Web服务的参考架构,将分布在教育和科研网上自治的分布异构的海量资源集成起来,实现资源的有效共享,消除信息孤岛,提供服务,形成了高水平低成本的服务平台。

国家“十五”高技术研究发展(863)计划中信息获取与处理技术主题重大项目-“基于SIG对资源环境空间信息共享与应用服务”课题研究开发了基于SIG对资源环境空间信息共享与应用服务平台,实现了服务发现、资源绑定与聚合、异构系统的集成、空间信息的在线共享与分布式协同处理。

Web Service 与GRID 的结合能提供动态和强有力的计算和数据环境,对数字地球、数字城市、公众空间信息服务和电子政务等重大应用目标将会产生全面的和重大的影响

5.3 主动式地理信息服务技术

主动服务在Web服务框架模型、基础协议的基础之上,增加识别用户需求和处理功能,使用户能够根据特定需要选择合适的服务,使服务能够自动适应用户的需求(韦理,2005)。主动服务的提出是为了主动收集、组织、分类和管理发布的服务以及在应用层面上为用户创建服务资源视图(M.Zhong, 2007)。主动服务的研究依靠相关的工业标准和Internet上已有的服务资源,并引入服务的主动发现、定制、加载与使用机制,支持新服务、新应用的按需创建,为用户发现、定制和运行能够满足用户需求的服务,从而改变当前用户只能被动地使用现有服务的应用模式,以应对人们对Internet应用需求的不断发展和变化(C.Collet et al, 2000; B.Paillassa et al , 2001; M.Treiber et al, 2007)。这种新应用模式称为internet中的主动服务。

主动式空间信息服务的思想就是要让地理信息服务系统具有主动服务能力,并以统一、方便的机制来实现主动空间数据获取、处理、发布等服务。也就是在分布的空间数据预处理、提取、集成、融合、发布、接收和应用等一系列节点上添加主动服务机制,一旦节点从外部获得需要处理、发布的数据或者系统内部的状态达到一定条件就能够自动处理和发布数据而不需要人工干预。既强调主动性,也强调“统一机制”的实现,也就是把主动功能用一种统一的方法与原有的地理信息服务功能集成在一个系统中来实现。系统中提供一个自动“监视”模块,它主动、不间断地检测规则中包含的事件是否发生,一旦有事件发生,就主动触发执行相应的服务。这种地理信息系统就可以主动履行预先设定的服务,也可以把复杂的演绎推理和实施处理等功能以统一的机制实现。

主动空间信息服务的内容包括主动空间信息获取、集成、更新、处理、存储、分发等(王泽根等, 2006),王泽根,华一新,杨艳梅等提出主动空间信息服务的概念,主动空间信息服务是网络条件下解决空间信息服务不同节点及其服务对象的分布性和空间信息服务的实时性要求之间的矛盾而提出的。为满足主动空间信息服务的需求,提出主动式地理信息系统的概念,并就主动式地理信息系统的体系结构、实现途径和关键技术进行了研究。樊博等在政务智能系统中采用面向主动服务模式,实现了主动空间信息服务(樊博, 2006)。

6 地理信息Web服务存在的问题与发展趋势

随着Internet的普及和网络通信技术的飞速发展,地理空间信息处理与应用方式也逐渐产生变化,地理信息Web服务发展成为地GIS发展的新的支撑技术之一。地理信息服务的网络化、服务组合的自动化、智能化等为地理信息Web服务的发展和研究提供了广阔的应用前景。

但就地理信息Web服务的研究与应用方面,存在很多有待解决的问题:

(1) 标准方面:国际上已有众多的标准化组织在研究制定地理信息网络服务的标准问题。如W3C,OpenGIS,ISO/TC211等。这些组织制定和颁布了众多的有关地理信息网络服务的各类标准,这些标准在推动地理信息网络服务发展方面起了重要作用。但是,如何规范和协调这些组织之间的活动和作用,并进一步研究和制定更多更好的标准,是地理信息网络服务发展所面临的主要问题。

(2) 效率安全问题:GIS服务链的执行效率、服务的安全性。

(3) 服务的收费标准和机制还需要进一步的研究。

(4) 与网格技术结合的研究才刚起步,尚未构建整体的系统框架,解决目前空间信息应用中的问题。

(5) 智能化问题:地理信息网络服务所面临的最重要的问题之一是智能化问题。目前的研究没有很好地将服务语义描述与服务流程建模、执行结合起来,难以根据用户需求进行有效的动态服务选择和匹配;主动服务可以解决未来Web服务的智能化、个性化与综合化问题,但关于主动服务的研究才刚刚起步,还有很多问题有待进一步研究。

总之,与地理信息Web服务关的基础理论和方法的研究较少,没有形成完整的服务体系,典型的空间信息网络服务也比较少见;在服务语义表达的研究方面,语义网(Semantic Web )及本体(Ontology)的研究是一个重要的方向; 对目前新兴的地理信息服务网络形式中成熟的体系进行实践,网格技术、Agent策略、异构分布式技术等与地理信息网络服务的结合,以及这些技术衍生出来的对地理信息服务系的功能应用进行实例开发的研究;对于Web技术体系的系统化研究,地理信息Web服务体系结构有待进一步优化和丰富;现在一些研究者提出的地理信息服务组合技术,还只是初步性的探索,没有形成规范的空间信息服务组合模型。对Web技术的系统化研究对地理信息服务的框架构建至关重要。目前新的Web技术包括网格计算、计算机网格式服务(Grid Services )、异构分布式阵列式web服务器.Agent软件技术等。如果地理信息服务搭建在通信机制良好、协议规范、交互通畅的网络上,这是保证地理信息服务运行成果的基础。

7 结束语

Web服务给GIS的地理信息服务提供了一个新的集成思路,即在不改变原有系统的基础上,通过构建基于XML的系统间的标准通信协议实现系统间数据和功能的互操作,在Internet这样的时空范围内,各取所需构建具有复杂结构的多层系统,这种系统能将网络中各处的众多的应用程序进行集成,大大提升应用程序的价值。将Web服务的思想引入GIS,一方面可以很好地解决多年来GIS在互操作实现方面所面临的困难,另一方面,方便GIS融入其他应用系统和与其他应用系统集成。

地理信息Web服务的研究虽然取得了较大的成绩,并且被广泛应用于多个领域,但是在标准规范、智能化、安全效率、服务体制、与新兴技术结合等方面还有待进一步研究。

摘要:从地理信息Web服务研究的不同侧面对其进行了综述,阐述了Web服务的基本概念及其架构,概括了当前地理信息Web服务的标准规范、平台及应用研究情况,分析了地理信息Web服务组合及服务链的相关技术-工作流技术、地理信息语义技术、Agent技术等,网格技术与地理信息Web服务的结合以及最新提出的主动地理信息Web服务等研究内容,并对这些技术进行了总结,结合已有的成果,指出其存在的问题并展望其未来的研究方向。

关键词:地理信息Web服务,服务组合,网格,主动服务

地理信息Web服务论文 篇2

断开服务器连接

用户的Internet信息服务器连接到网上之后,如果因为某中原因不再希望网上其他用户访问自己的服务器,可断开该服务器的连接。例如,某一时期,网络中的病毒特别多或且厉害,用户应断开服务器的连接,以防不测。

要断开服务器的连接,在控制台目录树中,双击“ Internet信息服务”节点,展开该节点。然后右击服务器节点,从弹出的快捷菜单中选择“断开”命令,出现确认信息提示框之后,单击“是”按钮即可。

连接服务器

服务器被断开之后,用户可根据需要随时连接服务器,继续通过该服务器发布网络信息。例如,因网络病毒而断开连接的服务器,在网络病毒得到遏制之后,可重新建立连接。要连接服务器,在控制台目录树中,右击“Internet信息服务”节点,从弹出的快捷菜单中选择“连接”命令,打开如图14 - 3 6所示的“连接到计算机”对话框,在“计算机”文本框中输入要连接的Internet信息服务器的计算机名,单击“确定”按钮即可。

备份和还原服务器配置

在服务器的维护过程中,用户很难保证自己的修改和设置都是正确的,都有可能或多或少的犯一些操作错误,导致服务器不能正常运行;另外,访问者的非法操作和恶意攻击也有可能导致服务器遭受破坏。这时,就需要一种方法来恢复服务器系统的正常运行,备份和还

原服务器配置无疑是一种最好的办法。在服务器正常时,对其配置进行备份;当服务器出现错误时,再还原服务器配置备份数据,可快速排除服务器的故障。不过,还原服务器配置是一项非常耗时的操作,它将覆盖所有当前的设置并导致全部服务的停止和重新启动。要备份和还原服务器配置,可参照下面的步骤:

1. 在控制台目录树中(见图14 - 4 ),双击“Internet信息服务”节点,展开该节点。然后右击服务器节点,从弹出的快捷菜单中选择“备份和还原配置”命令,打开“配置备份/还原”对话框,如图14 - 3 7所示。

2. 如果要创建备份,单击“创建备份”按钮,打开如图14 - 3 8所示“配置备份”对话框,在“配置备份名”文本框中输入备份文件名,然后单击“确定”按钮返回到“配置备份/还原”对话框。

3. 如果要还原以前的服务器配置备份,在“备份”列表框中选择备份文件,然后单击“还原”命令,出现信息提示框后,单击“是”按钮即可。

设置服务器属性

服务器的属性直接决定着用户的服务器的性能。用户要想使自己的服务器充分地发挥信息服务的功能,必须合理的设置服务器的属性。要设置服务器属性,可参照下面的步骤:

1. 在控制台目录树中(见图14 - 4 ),双击“Internet信息服务”节点,展开该节点。然后右击服务器节点,从弹出的快捷菜单中选择“属性”命令,打开服务器属性对话框,如图14 - 3 9所示。

地理信息Web服务论文 篇3

关键词: 自动识别系统; 远程识别与跟踪; 船货信息; 实时动态; 辅助决策分析

中图分类号:TP273.5;TP391.9文献标志码:A

Vessel-cargo symmetric information platform based on Web-AIS

KE Ranxuan1, WANG Xiaoqin2, QI Mingyao3, PENG Guojun1

(1.Navigation Institute, Jimei Univ., Xiamen Fujian 361021, China;

2.COSCO Xiamen International Freight Co., Ltd, Xiamen Fujian 361011, China;

3.Graduate School at Shenzhen, Tsinghua Univ., Shenzhen Guangdong 518052, China)

Abstract:In order to improve information processing efficiency and accuracy of vessels and cargoes, a vessel-cargo information platform based on technology integration of Web and Automatic Identification System (AIS) is constructed. Vessel message, cargo message and port information and so on are processed according to the basic data coming from AIS and future Long Range Identification and Tracking(LRIT) system. By the help of this platform, ships’ owner can be aware of vessels’ movements promptly and track supply of cargoes; and shippers and charterers can find suitable information about vessels, vessels’ movements and ship owners, etc. The platform has practical significance to visibility of vessel-cargo information, real-time movement administration and auxiliary decision analysis.

Key words:automatic identification system; long range identification and tracking; vessel-cargo information; real-time movement; auxiliary decision analysis

0 引 言

1915年,美国人阿奇•萧首先提到物理配送(Physical Distribution)的概念.随着科学技术的不断发展和物流需求的改变,物理配送的概念逐步演变为物流(Logistics)的原型,从物理配送到物流原型再到目前的物流,含义已发生根本改变.按照中国物流术语标准[1]定义:物流是以最小的总费用,按用户要求将物质资料从供应地向需求地转移的过程,主要包括运输、包装、装卸、配送、流通加工和信息处理等活动.

海上货物运输是承运人按货主或代理人要求,利用船舶将货物运输到目的港的行为,属于典型的物流活动.现代科学技术的发展,尤其是信息技术的迅速发展,极大地促进航运管理技术的进步.作为传统航运管理技术与企业资源规划(Enterprise Resource Planning,ERP)技术相结合的典范,现代航运管理被认为是航运企业在降低物资消耗、提高载运效率以外的重要利润源泉.[2]在航运供应链的“四流”,即物流、商流、资金流和信息流中,船舶及货物的信息流被提升到前所未有的高度,信息获取与处理的实时性和准确性关系到航运管理的成败.

建立基于自动识别系统(Automatic Identification System, AIS)的船舶跟踪平台,有以下优点:(1)有助于租船人和货方及时查询船舶位置,有效配货并对照租约条款计算相关费用,合理调整退租或起租时间;(2)有助于租船人及货方跟踪船舶情况,了解货物运输进程(类似陆地的GPS跟踪车辆),由此跟踪货物.基于AIS的船舶跟踪范围有限,有效跟踪距离为离岸20~50 n mile,如远洋航行,须借助卫星通信方式进行跟踪;(3)有利于船舶信息的传输,实现物流高效化[3];(4)可提高船舶运营效率,有助于安排航行计划和组织货源等.

1 船货信息对称是航运信息流的关键

(1)船舶租赁业务的开展主要通过经纪人进行.由于船货信息不对称、不透明,航运企业和货主须付出大量的佣金成本,且船找货和货找船的周期很长.另外,经纪人本身也会面临船货信息不充分的问题.这些都导致船舶租赁成本大增,效率低下,市场混乱.

(2)准确、对称的船货信息在海事、海商案件中非常重要,货物、船位以及航速等信息能给各方提供直观的证据,节约采集证据的时间,有助于多方协商.如在伦敦和北京仲裁的海事案件中,由滞期费计算引发的争议所占比例最大,如果租船人通过AIS船舶动态监控系统发现船长在船舶抵港前就发出NOR(装/卸货备妥通知书,关系到装卸货时间的起算),就可与船舶所有人进行必要交涉;如果船舶所有人通过AIS船舶动态监控系统发现船长过早提交NOR,也可提醒船长补交有效的NOR,有利于明确滞期费的起算时间,达到规避业务风险、消除争端、平衡各方利益、维护诚信的海运秩序的目的.

(3)船舶经营人或船舶所有人掌握正确的船货信息,可有效地组织船舶调运,减少运输时间(降低油耗);其次,通过掌握准确的船舶信息,可更好地组织船队经营和管理,使调度更有效,预约引航员和船舶(或货物)检验员的时间更可靠,减少延迟和等待的时间,节约成本.

2 网络技术与AIS技术在航运信息中的应用分析

2.1 网络是航运信息化的支撑技术

在传统航运管理中,由于意识不到信息管理对航运管理的促进作用,往往只重视硬件设施的投资,而轻视或忽视软件系统的投资和应用.大多数中国航运企业在信息收集、加工、处理、运用能力,船货统筹策划、精细化组织与管理能力方面都存在不足,严重制约中国航运业的发展.

互联网的普遍使用为航运企业解决上述问题提供了契机,船货信息能以低廉的成本即时传递,通过完善的信息管理平台及时安排船货计划,促使航运业的信息化升级.

在网络航运中,起决定作用的不再是载运设备的处理能力,而是船货信息流平台.与传统航运相比,网络航运呈现出以下特点:

(1)网络航运各节点普遍实行信息化管理.货主、承运人、代理、租船人和码头的各部分连接成为1个有机整体,每个参与的环节构成航运系统的1个节点,单个节点的信息化是航运信息平台系统信息化的基础.数据经过筛选和加工变成有效的信息,再经过消化吸收转化为生产力.船货信息化管理对船和货的信息进行分析、挖掘,使船和货的信息匹配准确,趋于对称,最大限度地利用有效信息对船货活动进行指导和管理.

(2)网络技术具有无限的开放性.整个网络系统构建在开放网络上,所有的信息节点都通过网络互相连接,互换信息,协同处理业务.基于互联网的开放性,节点的数量可以无限多,每个节点可与其他任何节点发生联系、快速交换数据,某个节点的变动不会影响其他节点,整个系统具有无限的开放性和拓展能力.

(3)网络环境中的船货信息流在整个物流过程中起导引和整合作用.船货的信息流贯穿于航运商务活动的始终,并引导商务活动的发展.在紧密联系的网络系统中,每个节点回答上游节点的询问,向下游节点发出业务请求,根据上、下游节点的请求和反馈提前安排船舶以及货物的运输过程.船货信息流在运输过程中起事前测算流通路径、即时监控输送过程以及事后反馈分析的作用.在环环相扣的航运过程中,虚拟的场景和路径简化了操作程序,极大地减少失误和误差,使每个环节之间的滞留时间大幅降低.

(4)网络具有明显的规模优势.网络使各个分散的节点构成1个紧密联系的有机整体,在1个相当广泛的区域内发挥作用.系统不以单个节点为中心,而将功能分散到多个节点进行处理,各节点交叉联系,形成网状结构.大规模联合作业提高工作效率,降低系统的运行成本,也降低系统对单个节点的依赖性,抗风险能力明显增强.如果某个节点出现意外,其他节点可很快进行替补.

2.2 AIS技术

AIS是由国际海事组织(IMO)、国际电信联盟(ITU)以及国际电工委员会(IEC)联合订立的适用于船舶通信的系统.借助GPS,配置AIS设备的船舶能自动将其准确船位信息传输到海运管理中心,并且与航道上及水域中其他配置AIS设备的船舶交换船位信息.这样,每艘船舶的船位信息可以被连续追踪,其运动轨迹(包括航速和航向)显示在由计算机生成的水域地图上.海事管理部门也可通过AIS向船舶广播相关数据,如当地风速、风向、水位、潮、流、冰区环境、下一个水闸情况以及其他与航行安全相关的信息.

AIS技术的应用对船舶安全航行和监管起巨大的推动作用.AIS发布的信息对港航部门和航运企业都至关重要,是建立船货信息对称的1个有效渠道.AIS可系统广播船舶的IMO编码、呼号和船名、船的长度和宽度、船的类型等静态信息,同时传输船位、国际协调时、对地航向、对地航速、航迹向、航行状态、转向速率、横倾角(选用项)、纵倾和横摆(选用项)等动态信息,还有船舶吃水、危险货物类型、目的港和预计到达时间、航行计划等与航次有关的信息以及与安全有关的短消息.

2.3 网络技术与AIS技术的集成

异构性是系统集成的根源,不同系统存在异构,导致各系统无法实现有效交互,因此,必须进行系统集成.船货信息流记录船舶和货物在空间和时间上的位移,对地理空间和时间具有较大的依赖性.本文提出网络技术与AIS技术的集成,即建立基于Web-AIS技术的船货信息对称服务平台,对船货信息流的可视化、实时动态管理和辅助决策分析等具有重要意义.鉴于AIS广播式发布可能带来的不安全因素,IMO已要求缔约国船只配置对远程识别与跟踪(Long Range Identification and Tracking, LRIT)进行研究.由于LRIT系统尚未推广,本文仅针对AIS技术的应用进行研究,暂不对LRIT系统在船货信息流中的应用进行研究.

基于Web-AIS技术的船货信息对称服务平台可理解为从动态空间分析以及可视化管理角度出发,以网络技术为基础,辅以AIS动态信息和电子海图地理信息技术等,进行船货信息流作业和辅助决策的实时、动态的管理信息系统.

网络技术与AIS技术的集成,构建船货信息对称服务平台需经过AIS信息提取、数据库建设、网络信息系统的实现、信息挖掘和分析应用等过程,关键在于数据集成和功能集成.数据集成主要包括AIS信息的集成和网络电子海图数据的集成;功能集成主要根据船货信息对称服务操作模式对其功能进行规划和重组.

3 基于Web-AIS技术的船货信息对称服务平台框架结构设计

配置AIS的船舶在开阔水域可自动获取过往船舶的信息;在限制水域,不仅可获取同样配备AIS的他船信息,还可收到相关航行信息和港口信息.AIS采用开放式系统互联(Open System Interconnection,OSI)模型,采用信号发射距离在20 n mile以上的甚高频(Very High Frequency, VHF)设备作为信息传输通道,因此,可使用AIS接收其他船舶动态信息.由于AIS采用OSI工作模式,具有较强的兼容性和扩展性,可实现与因特网的连接,共享信息.Web-AIS系统是船货信息对称服务平台的基础系统,实现AIS信息的集成和网络电子海图数据的集成,Web-AIS系统架构见图1.岸基AIS数据接收模块通过1台或多台AIS数据接收设备,实时获取周围几十海里范围内船舶自动播发的AIS报文数据.系统采用Winsock通信机制,将解析好的船舶信息发布至公共网络,通过AIS数据交换服务,实现AIS数据服务器实时接收AIS传送的船舶信息.

Web-AIS系统采用B/S和C/S相结合的架构,数据更新部分及系统维护部分采用C/S结构,船货信息网络发布采用B/S结构.3层结构的B/S模型是当前网络应用程序的主要开发模型,将系统划分为客户机、网络应用服务器和数据库服务器.[4]B/S结构通过平衡客户机/服务器间的数据通信,利用服务器的高性能处理复杂的关键性应用,降低网络数据流量,简化客户端的运行环境,降低软件的维护费用.

Web服务器负责接收浏览器用户请求、负载平衡和服务管理,并接收应用服务器的处理结果,再传回客户端浏览器;应用服务器接收电子海图、AIS数据操作应用请求,调用相关处理功能模块向数据库发送请求,并接收数据库发回的数据,经相应功能模块处理后将结果传回Web服务器;数据库服务器负责数据的存储和管理.[5]客户端浏览器,如IE 5.0或其他浏览器软件,为用户提供接口,将用户的请求通过HTTP协议发送至Web服务器并接收最终的处理结果.

对实时、大量的船舶AIS信息进行组织处理,确保信息流正确、及时、高效和通畅是构筑船货信息对称服务平台成败的关键.目前,基于船舶动态并针对船货信息一体化对称服务的综合航运信息平台发展规划研究正处于起步阶段,尚没有1个比较完善的范例可供借鉴.[6]

专家学者已认可传统物流体系结构并提出物流信息系统的总体框架(LogisticsInformation System Architecture,LISA),认为物流信息系统总体框架包括3个组成部分:业务层、管理控制层和战略管理层.[7]

应用上述Web-AIS系统,本文提出船货信息对称服务平台,见图2.

该平台支持实时、多种类型和格式的AIS船舶数据和模型,并提供对不同数据的操作功能;考虑到AIS信息的空间性和时间性特点,提供基于电子海图或其他类型空间数据的用户视图;提供针对船舶进出港的地理分析和空间分析功能;提供针对船舶信息与货物信息匹配分析的对称服务功能,建立模型分析以及辅助决策机制,杜绝船舶不对称的虚假信息功能;采用面向对象的思想,使平台具有良好的可继承性和可维护性,使用者可透明地操作;提供标准的程序接口和通信服务机制,支持与其他系统的数据交换和功能调用,具备可拓展性.

从信息系统的角度,基于Web-AIS技术的船货信息对称服务平台概念结构纵向上可分为管理层、作业层、用户层,横向上可分为数据层、功能层、用户层.从分布式信息系统的设计角度,纵向结构遵从横向结构,采用身份认证的方式进行层次划分,图2为平台的框架结构.

其中,辅助决策支持[8]部分包括全局或局部船货信息优化、船货信息一致性校验、各级用户地理分析、运输能力模型分析、船舶载运资源优化、靠离码头计划分析、货物装卸方案分析、代理事务优化、仓储能力分析、仓库选址模型以及中转仓库优化方案等;船货信息管理部分包括船舶资源管理、货物流通服务支持系统、货物资源查询检索、信息发布系统、在线商务交易、仓库可视化管理、货物跟踪监控、海关报关通关系统、商品检疫系统以及银行支付系统等;企业内部管理[9]部分包括企业内部资源管理、财务管理子系统和人力资源子系统等.

从上述3个部分的构成可知,Web-AIS技术涉及辅助决策支持和船货信息管理的大部分内容,企业内部管理完全可从信息系统中分离.[10]

4 基于Web-AIS技术的船货信息对称服务平台应用

通过Web-AIS平台,船舶的实时位置可通过因特网及时发布给有权限的用户.本文以厦门港某航运企业使用的基于Web-AIS船舶信息查询系统为例.船舶的基本信息,包括静态的船长、船宽、船名以及动态的航速、航向都可经由AIS监控系统得知.对货方而言,满载船舶的实时位置即为货物的实时位置,可借由Web-AIS实现物流跟踪,而空载船舶的实时位置可帮助货方判断船舶是否合适运输其货物;对船方而言,Web-AIS可提供监控便利,船舶调度更为有效;对承租人而言,船舶的真实位置关系到NOR的提交是否有效,而NOR的提交直接影响滞期费和速遣费[11]的计算;对港口当局而言,船舶动态信息影响船舶的进出港、靠离泊的调度以及装卸货的安排;对海事监管部门而言,船舶的航迹、航向和航速可成为海事证据和海事调查的即时数据.

厦门外轮代理有限公司(以下简称外代)通过使用Web-AIS平台系统,有效地跟踪埃塞俄比亚航运公司所属件杂货船舶“特克兹”轮的动态方位和船舶信息,在船舶抵港前通报信息和需求,及时沟通船货信息,协调航运企业、货主、码头、理货公司和绑扎服务单位等部门,使各方形成良好的互动配合,圆满完成代理任务,得到船、港、货各方的赞许,体现外代“专家型代理、人性化服务”理念,也展示便捷高效的厦门港口信息化服务.

5 结束语

船货信息历来是航运企业、码头、货主及租船人等航运从业者关心的重要信息,是航运物流管理成败的关键.AIS系统的广泛应用为船货信息的实时采集、处理和分析提供可能,本文从AIS数据的网络化应用、船货信息的对称服务角度,结合航运物流的本质,对基于Web-AIS技术的船货信息对称服务平台作概要论述,将网络技术和AIS技术应用于航运船货信息管理中,从根本上改变传统航运的管理方式,具有广阔的应用前景.

参考文献:

[1]黄有方. 港口现代物流发展策略[J]. 上海海运学院学报, 2004, 25(2): 41-45.

[2]黄有方. 加快发展港口物流, 大力提升服务能级[J]. 港口科学发展, 2007(1): 15-17.

[3]戚铭尧. 基于GIS的物流信息平台框架结构研究[J]. 中国物流与采购, 2002(2): 20-26.

[4]吴洪庆, 段成华. 一种物流信息系统体系结构的探讨[J]. 计算机应用研究, 2002, 19(1): 47-52.

[5]KARACAPILIDIS N I, PAPPIS C P, TSOULFAS G T. A Web-based collaborative decision-making tool for Life Cycle Interpretation[C] //

Advances in Life Cycle Engineering for Sustainable Manufacturing Businesses, Berlin:

Springer, 2007: 35-41.

[6]刘兴景, 戴禾, 杨东援. 物流共用信息平台系统分析[J]. 交通与计算机, 2001, 1(1): 56-60.

[7]郭梯云. 数据传输[M]. 北京: 人民邮电出版社, 1990: 125-142.

[8]王侃, 张金隆. 基于GPS/GIS的物流公共信息平台[J]. 武汉理工大学学报: 信息与管理工程版, 2007, 29(2): 49-53.

[9]孙桂岩, 刘文浩. 公用物流信息平台与物流决策支持[J]. 铁道货运, 2008(1): 33-39.

[10]王泽来, 宋利军, 冯志勇, 等. 支持四方物流的Web服务集成平台的设计与实现[J].计算机工程与应用, 2009, 45(7): 215-219.

[11]IJIOUI R, EMMERICH H, CEYP M. Supply chain event management: innovation in logistics services[C] // Strategies & Tactics in Supply Chain Event Management, Berlin: Springer, 2008: 235-240.

地理信息Web服务论文 篇4

关键词:XML,WebGIS,地理信息标记语言

1 引言

万维网地理信息系统 (Web GIS) , 指的是地理信息在网络环境下进行获取、存储、传输、分析及显示的计算机信息系统。地理信息则主要指用来对地球表面的空间位置及空间位置关系进行的描述。这些空间数据既包括带有空间位置特性的图形、图像数据, 也包括与此相关联的文本数据。Web GIS的目的在于通过互联网来为地理信息提供一个平台, 用户使用浏览器就可以轻松获得信息系统中的数据及相应的功能服务。国际学术界称地理信息系统为Web GIS的主要原因在于目前大多数的客户端应用使用了WWW协议。而这样一种新形式, 无论是在理论研究领域, 还是实际应用方面都仍处于发展阶段。但是, 迅速发展的网络环境为Web GIS提供了广阔应用前景。

2 当前Web GIS存在的问题

经过多年的发展, Web GIS无论从理论、技术、产品还是应用上均取得了巨大的进步。这种进步与推广在GIS方面得到了广泛的应用, 利于其发展与更好的应用, 同时, 极大的推动了地理空间领域的更广泛的普及。不同产品之间内部空间数据相互保密, 使得不同系统间数据难以兼容。以下几点为Web GIS目前所面临的问题:

2.1 异构空间数据的互操作较难实现

目前, 尽管存在着大量的Web GIS系统, 但是这些系统都针对特殊的GIS设计问题, 即当Web GIS出现单独应用, 无法有效的进行互动以及互相访问的情况时, 用户无法利用人性化操作对所有的站点进行快速高效的操作, 只能对一个站点进行孤立式的处理, 导致效率以及质量的极大降低, 这样就极不利于数据库的高效使用。同样的, 用户也难以将两个或多个空间数据库中的数据进行整合。究其原因, 主要是因为Web GIS系统的封闭性。虽然互联网上的地理信息在持续增长, 但是, 行业内技术和数据格式的保密, 使得这些信息的读取、显示只能依靠特定的运行环境、支撑环境。总之, 整个行业内相互独立、没有沟通、没有协调的现状, 不但不利于行业的发展, 也难以满足互联网上信息资源共享的需求。

2.2 跨平台的数据访问难以实现

常见的对象模型有微软的DCOM, 也称分布式组件对象模型;还有对象管理集团的CORBA, 也称公用对象请求代理程序体系结构;以及或Sun的RMI, 也称远程方法调用。利用这些结构进行设计开发, 给开发者提供了丰富的本地模型资源, 同时, 也可以将服务放置在远程系统上。然而, 这些系统拥有一个相同的问题, 很难将其在互联网上进行扩展。其原因在于, 这种应用程序需要客户端和系统提供的服务间紧密耦合。换句话说, 这种系统的稳定性并不是很好, 一旦某一端出现异常, 另外一端则会出现崩溃的现象。因此, Web GIS需要一种更为通用的模型, 能够将分布式对象模型进行抽象概括, 进而实现跨平台的数据访问。

2.3 开发、调试、维护的难度大

从开发者的角度出发, 一个结构清晰并且能够稳定运行的Web GIS, 整个系统的创建、测试和设置流程需要借鉴和使用合适的工具和模型。然而, 由于缺乏有效的规范, 当前在应用方面, 并没有成功的工具以及设计模型供研发人员进行参考, 同时, 考虑web自身的一些特点, 逻辑与其内容可以进行相互的调用, 因此针对Web GIS的应用来说, 以一种有效、连续的方式对其进行设计、开发、维护等是很难实现的。

2.4 功能资源不共享

随着工作强度的不断提高, 如何有效的提高工作效率, 简化操作流程, 成立GIS发展的一种趋势。传统的GIS在资源共享方面无法实现有效的利用, 很多资源只能被单独共享, 无法得到其他系统的调用, 导致资源的浪费, 效率极大的降低, 造成人力以及物资的巨大浪费。

以上几点是Web GIS系统中存在的一些问题, 这些问题中有些是GIS软件所特有的, 有些的是Web软件所独有的。这就要求我们在解决Web GIS系统中的问题时, 需要从这两个方面同时考虑。

3 XML语言

3.1 XML语言

XML (e Xtensible Markup Language) 语言, 称之为可扩展标记语言, 它不像HTML那样只有固定的形式。XML是一种元语言, 它能够用于描述其他语言。开发者或者信息提供者能够根据自己的需求, 自行定义标记及其属性名, 同时, 在XML中也可以添加描述法。这也就是说, 在XML文件中, 其结构能够复杂至任意的程度。此外, 将XML应用于Web的应用软件开发为开发者提供了众多好处, 如高灵活性及强大的功能性。

3.2 XML特点优势

(1) 以简单的形式即可描述复杂的数据

XML文档这种纯文本、结构化的形式, 对于描述复杂的空间数据信息是十分适合的。

(2) 能够用于集成不同格式的数据

不同Web GIS系统中数据的互操作及共享是传统方法中的一个难点, 而使用XML则可以轻松实现, 即集成不同数据源的数据。

(3) 描述不同应用所得的数据

扩展性强和灵活性高是XML主要的特点、优势, 正是基于这两点使得XML能够有效描述出不同类型应用软件所使用的不同格式数据。另一方面, 鉴于XML中数据是自我描述的, 这也使得这些数据不经过内部描述即可被交换和处理, 同时也可以检查其结构的正确性。

(4) Web上数据发布方便

作为一种开放式的、基于文本的文件格式, XML可以像HTML一样通过目前的网络通讯协议在网络中进行传递。

(5) 可扩展性良好

在XML中, 用户可以自己定义、添加新的标志。而这一点恰恰满足对于复杂的空间地理信息规范化描述的需求, 也能保证在Web上对数据进行有效的访问和高速的传输。

4 结语

21世纪是信息的时代, 是网络的时代。随着互联网技术的飞速发展, 更多的开放的、跨平台、标准化的技术将影响、改变我们的生活。XML和数据库相结合带来了巨大的影响, 也是关注的焦点。而基于XML的地理信息系统也必将蓬勃发展。

参考文献

[1]王兴玲, 基于XML的地理信息Web服务研究[D].中科院遥感应用研究所, 2002.学位论文.

[2]郭婧, 地理信息Web服务研究与实践[D].解放军信息工程大学.2007.学位论文.

地理信息Web服务论文 篇5

试析基于Web2.0的图书馆信息服务的特点及其影响

阐述了Web2.0的含义,探讨了基于Web2.0的图书馆信息服务的.特点以及Web2.0对图书馆信息服务产生的影响.

作 者:颜映君 YAN Ying-jun  作者单位:汕头市图书馆,广东汕头,515041 刊 名:科技情报开发与经济 英文刊名:SCI-TECH INFORMATION DEVELOPMENT & ECONOMY 年,卷(期): 19(12) 分类号:G251.5 关键词:Web2.0   图书馆服务   信息服务  

地理信息Web服务论文 篇6

关键词:就业信息服务;语义Web;本体

中图分类号:TP391 文献标识码:A文章编号:1007-9599 (2011) 08-0000-01

College Graduates Employment Information Service System Ontology Construction Research Based on Semantic Web

Cui Xinhui,He Zhiqiang

(Hebei Finance University,Baoding071051,China)

Abstract:This paper describes the current lack of employment information service platform,pointed out the benefit of applying semantic Web technology to the employment information platform,and analyses the overall framework of semantic web for employment information platform.It introduces the resource ontology function,development process and related operations.

Keywords:Employment Information Service;Semantic Web;Ontology

一、本体模型的基本概念

本体为知识库的建立提供一个基本的结构和一套概念及术语来描述某一领域,并且获取该领域的本质概念结构,这些都是通过本体分析完成的。然后,知识库就可以运用这些术语来表达现实或者虚拟世界中的正确知识,本体分析就是明确知识的结构。知识处理较为可行的方案是Berners Lee提出的语义Web结构。

在高校就业信息系统中,由于该系统要为人才的供需双方提供服务,因此一方面系统要存储并发布毕业生的有关信息,以方便用人单位的检索;另一方面要存储并发布企业招聘信息,方便学生查询。因此,在高校就业信息系统中需要为毕业生和用人单位创建本体。

二、语义网就业信息服务平台框架

就业信息服务的核心内容是存储各种人才的供需信息,并提供良好的资源访问和信息检索方式,方便企业用户或毕业生进行信息查看和检索;同时还要便于用户对资源的管理,系统能够根据用人单位的用人热点给毕业生以提示,或根据毕业生的特点推荐用人单位等。就业信息服务平台的规划如下:

毕业生通过注册可以将信息发布到就业信息服务平台中,在后台数据库中保存,企业也可以将企业信息和招聘信息发布到平台中。注册用户经过登录后即可维护自身相关的信息资源,企业用户可通过企业入口登录,管理企业信息,如企业所属行业、企业性质、员工构成、人才需求等相关信息;学生用户登录后可维护自身相关信息如所学专业、取得的行业资格、特长、对职位的期望等等。管理员主要进行系统的整体维护和用户的管理等基础维护性工作。企业和学生可以在资源本体的基础上,实现高效率的信息交互和检索。

三、本体的构建

(一)基本思路

资源本体是语义Web建设的关键,是各类资源重用和共享的桥梁,构建就业信息资源本体主要需要考虑如下问题:

1.将资源自身的信息以元数据表示。元数据是关于数据的数据,目的是提供数据的含义,元数据可包括资源名称、类别、存储位置、内容等,元数据通常用XML和RDF进行描述。

2.建立资源本体词汇表。它定义了领域知识的特定术语及其关系,在本体词汇表中,必须明确指明各术语的概念,确定术语之间的约束关系和映射关系,反映出资源的结构和它们之间的联系。

(二)本体概念设计

1.决定高校毕业生就业本体的服务领域及其使用范围。该本体本校高校毕业生就业问题所涉及的相关内容,成熟后可以此为基础再扩展到省内高校就业信息系统。该本体需要解决毕业生对就业的需求、用人单位对毕业生的需求,本体有哪些类、那些属性,以及供需双方的信息如何匹配的问题。

2.确定高校就业本体词汇。高校毕业生就业本体的建设在包含对人才关键观测点的同时符合相关教育部相关规范。所采用的词汇以毕业生就业所需的基本资料为基础,再结合用人单位及相关领域的需求。系统设计的毕业生就业本体中主要的类别有学生(student)、用人单位(enterprise)、高校(university)、学生所在院系(department)、专业(speciality)、企业主管部门(Authorities)、地址(address)、单位(unit)、企业单位招聘信息(employinfo)等。

3.定义领域类别及决定类别、子类别的阶层关系。系统的本体间类别的关系比较简单,类别student、speciality、address、department为毕业生就业中一般类别;另外Authorities、university、comprise为unit的子类别。

(三)创建毕业生就业本体

根据前述对建立应用领域的本体论方法和概念设计的讨论,建立高校就业领域本体,再将现实世界的内容作为实例加入到高校就业系统本体论中。该本体以RDF/XML描述逻辑为基础,利用Protege3.2应用程序作为本体的设计和开发工具,建立毕业生就业本体。其中,有关毕业生的部分本体描述过程如下:首先定义命名空间,然后对基本概念进行定义定义属性,具体代码省略。

四、本体的操作

在创建完本体之后,系统要根据本体进行信息资源的组织与查询,我们选用Jena作为本体操作的工具,它提供了丰富的API能帮助我们对本体进行创建、读写和检索等操作,具体代码省略。

五、总结

将语义web应用到就业信息服务中,能够弥补现有平台资源分散、检索结果不精确的不足,能够在现有的基础上有效的提高人才供需双方的沟通透明度。在本文的基础上我们已经完成了本体模型的构建,接下来将在现有就业信息服务平台的基础上逐步探索实施。在我们开展的小范围实验过程中发现这种方法是有很大的发展空间的,在未来必将改变就业信息系统的应用状况。

参考文献:

[1]Antoniou G,van Harmelen F,陈小平.语义网基础教程[M].北京:机械工业出版社,2008

[2]颜端武,丁晟春,李岳蒙.基于语义Web和Jena插件的语义检索系统实验研究[J].情报理论与实践,2006,3

[3]金智勇,李天健,吕何新,叶时平.基于OWL S的高校毕业生就业平台分析[J].计算机应用研究,2007,2

地理信息Web服务论文 篇7

1 智能交通信息服务系统

1.1 智能交通信息服务功能

智能交通信息服务(ATIS)系统,是智能交通系统的重要组成部分,也是发展智能交通系统的基础和关键技术。智能交通信息服务主要功能有三类:(1)静态信息。主要包括与交通管理相关的城市基础地理信息、道路交通网络基础信息、车辆保有量信息和交通政策法规信息等。(2)动态信息。主要是网络交通流状态特征信息、交通紧急事故信息、环境状况信息和交通动态控制管理信息等。(3)关联信息。主要是旅游、购物、娱乐、体育、火车信息、民航、公交以及物流货运等信息。

1.2 智能交通信息服务系统框架

智能交通信息服务系统是智能交通的重要内容。信息服务系统可将智能交通系统所需要的各种信息,集成在一个公共的信息平台上。从而实现面向公众的交通网。它可以为交通管理者和广大交通参与者提供丰富及时的交通信息服务。

智能交通信息服务系统主要包括两方面内容,即交通信息处理支持平台和交通信息发布平台。系统结构架构如图1所示。

(1)智能交通信处理支持平台

智能交通信息有静态信息、动态信息和相关联的信息,这些信息,既有如道路交通网络,车辆保有量,公交、民航、港口等汇集来的结构化数据信息,又有象电子地图、交通紧急事故和实时天气情况等非结构化的信息。对这些数据都需要采集、处理、融合、储存、分析、汇总,才能提供给用户。智能交通信息处理支持平台,以多层应用架构的方式,将各种异构数据集成到公共平台上,提供各种交通信息服务的功能。

(2)智能交通信息发布

智能交通信息服务系统,把各类交通信息集成在一个统一的信息平台上,通过这样的平台发布各类交通信息和供用户访问实现交通信息的查询功能。实际上,交通信息发布方式分为面向个体的查询和面向群体的发布两种情况。

面向个体的查询,可通过互联网和移动通信等查询乘车路线、交通状况、天气信息及所需要车辆的位置等。面向群体的发布,可通过电视或交通广播发布交通状况、天气状况、交通事故、道路运行条件和特殊情况等信息。

信息发布采用的主要设备有自助查询终端、LED电子显示屏、移动网络通信设备等。

2 Web服务组合

Web服务简化了复杂的软件应用方式,已成为面向服务体系架构(SOA)中最成功、最流行的形式。

随着Web服务技术的越来越成熟,使得这一技术应用在各个领域内,组合Web服务,可以将单独的Web服务整合成具有新的更强大功能的增值服务的能力。

2.1 Web服务基本架构

Web服务是在网络上实现了一定功能的应用软件,其体系结构是一个面向应用的架构,该架构是由3部分组成,即服务提供者、服务请求者和服务代理。这3部分,通过发布、查找和绑定3个基本操作,完成Web服务,其基本架构如图2所示。

通常,由服务提供者将其能提供的服务,发布到服务代理的一个目录上;当服务请求者使用服务时,通过查找操作,利用服务代理提供的目录去搜索所需要的服务。查到该服务后,根据需要去调用服务提供者发布的服务。

服务请求者从服务代理处已经得到所需服务的信息后,服务请求者与服务提供者之间要绑定,即可直接通过服务提供者调用Web服务,不用再经过经过服务代理。

2.2 Web服务组合

Web服务组合的基本思想是把可以共享的单一的Web服务,通过调用,创建并组成出新的、功能更强大的服务,来满足用户的需求。

典型的Web服务组合的实现框架如图3所示。该实现框架包含2种角色(服务请求者和服务提供者)和5个部件(翻译器、组合管理器、执行引擎、服务匹配器和服务库)来协同完成Web服务的组合工作。

Web服务组合的执行过程如下:

(1)首先由服务提供者提供服务,通过图3中的服务注册中心(服务代理)服务器进行服务注册,这是进行服务组合的先决条件。

(2)服务请求者要使用服务,需要提交自然语言的需求描述,该描述经过翻译器翻译后,从自然语言转换成计算机能够识别的语义信息,传递给组合服务管理器。

(3)服务组合管理器根据服务请求者提交的描述,进行服务的组合,最后把生成的组合方案传递给执行引擎。

(4)执行引擎把上一步服务组合管理器提交的组合方案进一步传递给服务匹配器,服务匹配器查询服务注册中心服务器中现有Web服务的描述信息,进行和需求信息的匹配,最终选定合适的Web服务,并将选定的结果反馈回执行引擎。

(5)执行引擎根据服务匹配器选定的服务序列,调用相应的Web服务,并把最终的执行结果传递给服务请求者。

如何进行Web组合?方法很多。智能交通信息服务,除了一般信息发布外,需要即时任务求解的Web服务组合。即时任务求解的Web服务组合是为解决用户即时提交的一次性任务,它是根据完成该任务的需要,去查找、选取、调用若干服务进行自动组装。

3 基于Web组合技术的智能交通信息服务系统

智能交通系统已被公认为解决当前世界范围内存在的交通拥挤、事故频繁等问题的有效途径,它大大提高了交通管理和服务的水平。智能交通信息服务系统是智能交通的重要组成部分。

智能交通信息服务的方式分两种:智能交通信息发布方式和智能交通信息查询方式。

(1)智能交通信息发布方式。这种方式主要是通过电视、调频交通广播、互联网、手机短信、车载终端、公共场所LED信息显示屏等来发布信息,该方式称为接受式信息服务。

(2)智能交通信息查询方式。信息查询是用户获得交通信息的一个重要途径,用户可根据自己的需要,通过Internet或移动通信等进行查询,实现对交通信息的需求,这是一种请求式的信息服务方式。

目前,我国一部分城市基本上实现了单向的信息发布,即接受式信息服务;对于可进行信息查询的请求式信息服务实现还有困难。主要问题在于:

(1)交通使用者要查询的,多数不是一般发布的信息,都是临时性的、不确定性的,特殊需要的请求,他们没有Web服务组合方面的知识。

(2)已经开发的应用系统,分属不同部门,由各部门开发、管理,没有一个统一的平台,所能提供的服务功能也是单一的,且是分散的。

智能交通信息服务系统,除了考虑发布信息的多样性和广泛性外,还要有针对性,即针对不同的用户,信息发布的要求也是不同的,特别是交通使用者的随机需求,如何能自动地、高效地满足这种交通信息服务的需求?这就需要所开发的系统能够实时动态的把交通信息,提供给有特殊要求的使用者,以利于其出行,是当前智能交通信息服务迫切需要解决的问题。Web服务技术特性,使其成为解决这一问题的有效途径。

Web服务组合是调用若干单独的Web服务,按照一定的业务逻辑进行组装形成组合服务,并通过执行该组合服务而达到业务目标的过程。智能交通信息服务系统,利用Web服务组合技术,可实现广泛与多样性的交通信息发布,还能根据特殊用户的要求,通过访问系统,查询所需要的交通信息。基于Web服务组合的智能交通信息服务系统框架如图4所示。

4 结束语

该系统除了能完成发布交通网络信息、交通管制信息、交通气象信息,城市公交、火车、飞机、轮船等一般交通信息和查询外,还有发布车辆定位信息服务,可提供查询车辆地理位置的服务,用于车辆调度及车辆定位服务。如客户需要了解某车辆的位置,客户首先发出请求,系统根据客户的车辆编号,调用GSM通信服务,取得车辆的实际位置,再调用地图显示服务,返回给客户。

基于Web服务组合的智能交通信息服务系统,可以自动发现、匹配和组合一种灵活的满足交通使用者个性化需求的信息服务。

参考文献

[1]倪晚成,刘连臣,吴澄.Web服务组合方法综述[J].计算机工程,2008,34(4):79-81.

[2]李景霞,侯紫峰.web服务组合综述[J].计算机应用研究,2005(12):4-7.

[3]王笑京,齐彤岩,蔡华.智能交通系统体系框架原理与应用[M].北京:中国铁道出版社,2004.

[4]DUSTDAR S,SCHREINER W.A survey on Web Services composition[J].International Journal ofWeb and Grid Services,2005,11(1):1-30.

[5]吴朝晖,邓水光,吴健.服务计算与技术[M].杭州:浙江大学出版社,2009.

[6]廖军,谭浩,刘锦德.基于Pi2演算的Web服务组合的描述和验证[J].计算机学报,2005,28(4):635-642.

地理信息Web服务论文 篇8

行政区域界线是法定的行政界线,由大量的历史习惯线、部分法定线和一些争议线组成,部分地区由于界线不清,致使边界争议不断发生,影响了这些地区的社会稳定和经济发展。民政部门勘界工作中形成了大量的成果资料,内容涉及标绘行政区域界线的地形图、界桩照片、界桩登记表、界桩位置略图、界线协议书、勘界技术设计以及其他文字资料,数量极其庞大,来之不易, 属于宝贵的历史文献。目前界线管理工作主要采用档案管理方式,这样的资料只能手工检索,频繁查阅。既费时费力,又不利于档案管理,难以满足用户对勘界成果资料综合、系统分析的需求。而且资料容易破损,资料维护工作量大,手工检索速度慢, 资料不能供多人同时使用,工作效率低下。传统的人工管理方法和手段,已经远远不能满足现有规模的管理和迅速发展的需要, 实现科学的、规范的、现代化的管理是必由之路。

Web技术的飞速发展将地理信息系统带入一个崭新的发展阶段。地理信息技术与Web技术的结合,也推动了地理信息部门化、产业化和大众化的进程。由于政府工作很大一部分涉及到民政、土地、林业、水利等地理信息各个方面,由此,互联网地理信息系统(简称Web GIS)在电子政务中的应用就显得尤为重要,行政区划信息管理工作是国家政权建设的一个重要方面。所谓“电子政务”,就是政府机构运用信息及通信技术打破行政机关的组织界限,应用现代信息和通信技术,将管理和通过网络技术进行集成,在互联网上实现政府组织机构和工作流程的优化重组,超越时间和空间及部门之间的分隔限制,向社会提供优质和全方位的、规范而透明的、符合国际水准的管理和服务。信息化发展的趋势,对界线、地名管理等行政区划信息的管理也提出了新的要求。为了保存和科学管理这些勘界成果,需要综合运用计算机技术、GIS技术,建立数字化的地理信息和行政区划管理系统。

1国外发展现状

虽然各国国情不同,开展电子政务建设的基础和政务环境有差别,但是电子政务建设却有着共同的规律和目的,那就是通过采用现代“电子手段”,达到降低政务工作成本,提高政务工作效率和服务水平,最终达到提升一个国家的综合实力和人民生活水平的目的。从世界范围来看,各国为提高其国际竞争优势,迎接新的挑战,均积极致力于信息化建设,并将发展“电子政府”、实现“电子政府”放在首要位置。典型的如美国政府的“电子政府计划”、白宫网站建设、第一政府网站建设(FIRSTGOV)、日本政府的“E一JAPAN战略”、新加坡的电子政府建设、电子英国、 阿联酋的电子政府计划等。

自2001年《电子政务标杆管理:联合国所有成员国电子政务水平的调查报告》开始至2014年的十四年间,联合国经济和社会事务部(United Nations Department of Economic and Social Affairs)已针对全球电子政务发展状况发布了8份调查报告。《联合国电子政务调查报告》致力于展示成功的电子政务策略案例, 提倡繁荣、平等与和平的可持续发展纲领,推介以行政改革和可持续发展为目标的开创性实践措施。该报告以这一报告在全球范围内得到了广泛的认可,是世界上唯一一份评价193个联合国成员国电子政务发展状况的报告,是决策者了解本国电子政务优势和不足从而制定有效策略的工具,成为评估公共行政部门电子政务服务水准的权威标杆。从具体国家来看,韩国专注电子政务创新并一直发挥其领导作用,2014年仍居排名榜首位;与2012年相比,澳大利亚(第2名)、新加坡(第3名)的全球排名都有了很大的提升。从不同大洲来看,欧洲凭借最高的区域电子政务指数(EGDI)保持领先地位,法国(第4位)、荷兰(第5位)、 英国(第8位)和芬兰(第10位)等国表现突出;美洲紧随其后,美国(全球排名第7位)领导美洲电子政务;韩国继续保持亚洲电子政务领跑者的地位;突尼斯(全球排名第75位)领导非洲电子政务。

2国内发展现状

近年来,我国对信息化和电子政务工作高度重视,党的十六大明确提出“推行电子政务、提高行政效率”,十六届三中全会进一步强调“要发展电子政务,提高政府的服务和管理水平”。党的十七大又提出了“推行电子政务,强化社会管理和公共服务”。 2011年12月,工业和信息化部印发《国家电子政务“十二五”规划》提出了“十二五”时期中国电子政务的发展目标、方针和应用重点。2014年2月27日,中央网络安全和信息化领导小组成立, 组长由国家主席习近平亲自担任,旨在统筹协调涉及经济、政治、 文化、社会及军事等各个领域的网络安全和信息化重大问题,建设网络强国。《2014年联合国电子政务调查报告》显示,中国的电子政务发展指数(EDGI)为0.5450,位列第70名,与2012年相比上升8个位次,是近五年来排名最靠前的一次,表明中国电子政务在这段时间里取得了较大的发展与进步。

目前,我国电子政务发展的基本特征大体可以归纳为五个方面:一是电子政务建设的战略部署己经完成;二是电子政务建设的战略目标、战略任务越来越明确;三是电子政务建设的整体思路越来越清晰;四是对电子政务建设规律的认识越来越深刻;五是电子政务建设的实践成效也越来越突出。

我国省、县两级陆地行政区域界线的勘定试点工作始于20世纪80年代末,正式勘界从1996年起,历时5年,完成了全国陆地(不含港澳界)68条、62300多公里的省级行政区域界线和41.6万多公里的县界勘定,成为法定的行政区域界线。2003年, 由民政部开发完成的全国省级行政区域界线信息管理系统正式启用,系统包括全国陆地除港澳地区外长达6.23万公里的68条省界的地形图、界桩的详细位置,以及勘界协议书等相关信息。 借助行政区域界线信息管理系统,不仅可以最快速地提供省界位置、争议区地形地貌等基础数据,有效解决边界争议,还可以通过信息资源共享,广泛应用于国土资源的普查、土地资源的动态监测和减灾防灾等领域。

3目前存在的主要问题

地理信息系统(GIS)通过计算机技术、信息技术和测绘技术,实现对地理信息以及与地理空间数据相关的多种专题信息技术的采集、集成处理、存储管理、查询分析、高效可视化以及制图等功能,已经广泛应用于社会各个领域,并取得了巨大的社会经济效益。地理信息系统是一门集多种学科为一体的边缘学科, 它在多种信息的集成处理和可视化方面具有无法比拟的优势。行政区域界线勘定和界线管理工作直接与空间位置有关,采用地理信息技术将大大提高行政区域界线勘定和界线管理的工作效率,为领导决策及时提供科学依据,为行政区域界线管理信息化、高效化以及管理的规范化和现代化有重要的现实意义。

但是传统GIS,开发出的功能操作只能为专用的应用服务, 不能被其他系统调用。功能资源不能共享,无法实现异构空间数据互操作,无法实现跨平台,开发、调试和维护困难。这不利于行政区域界线管理信息的共享,不适应电子政务的发展。

近几年随着网络技术的发展,给电子政务的发展带来了许多新的机遇。但是在电子政务发展过程中也遇到了许多新的技术问题,由于一直没有统一的标准来规范政府各部门间的合作行为, 使得异构应用系统的交互发展成本过高,而且只能适用于特定的环境。此外,政府职能服务化的发展也需要能够支持迅速查询、 定位和调用应用服务的机制。因此,为了充分发挥电子政务的潜力,使用户能够轻易发现、使用政府部门的服务,使政府各个部门间能迅速建立安全可靠的合作伙伴关系,可以将新一代的分布式计算体系结构-----Web服务技术框架体系应用于电子政务系统。该体系适用于电子政务体系结构,从而使Web不仅成为信息共享的平台,而且成为服务共享的平台。

4 Web服务在电子政务中的应用

电子政务是一个综合的信息系统,它能够有效地处理机关内部的流程、协作、信息利用和交流,即首先实现政府内部办公自动化,并在此基础上将服务的对象从政府机关内部扩展到其它机关、企业和社会公众(即信息发布和动态交互式信息服务)。其服务对象既包括政府机关内部,也包括其他政府机关、企业和社会公众;处理对象包括政府机关内部信息、可在一定范围内交流的信息和可以公开发布的信息(政务公开);处理方法是机关内部处理流程模拟、协作,信息发布,受理各类申请、投诉、建议和要求。既有信息的发布和接收,也有交互式的处理。从电子政务的基本思想来看,电子政务的各级政府可能分布在一个广阔的空间里,这要求信息系统有远程通信的能力。当今随着政府之间的信息流动加快,政府之间的合作关系也更为灵活、松散,就对信息系统提出了松散耦合的需求。另外,各个政府部门应用的开发平台和语言可能都不相同,这时需要将这些不同平台下使用不同编程语言开发的应用程序集成为一个相互协调互动的Web应用。Web服务体系使用SOAP协议在实现应用与服务之间的通信,用WSDL文件对服务进行标准的描述。SOAP和WSDL都是基于XML的,这保证了XML的跨平台操作。同时,SOAP一般使用标准的HTTP协议,可以透明地穿越政府防火墙。Web Services可以在Web上发布,发布的服务可以在UDDI上进行注册以便被检索使用,满足了政府之间松散耦合的要求。

5基于WEB服务的境界GIS

Web技术的飞速发展将地理信息系统带入一个崭新的发展阶段。地理信息技术与Web技术的结合,也推动了地理信息部门化、产业化和大众化的进程。当前,网络技术在分布式技术的基础上,向网格技术延伸,给Web创造了新的契机,也使得地理信息系统有从系统向服务转变的趋势。地理信息Web服务是Web服务技术与地理信息系统技术结合的产物,是GIS领域的一个重要研究方向。

由于政府工作很大一部分涉及到民政、土地、林业、水利等地理信息各个方面,由此Web GIS在电子政务中的应用就显得尤为重要,行政区域界线管理工作是国家政权建设的一个重要方面。所谓“电子政务”,就是政府机构应用现代信息和通信技术, 将管理和通过网络技术进行集成,在互联网上实现政府组织机构和工作流程的优化重组,超越时间和空间及部门之间的分隔限制,向社会提供优质和全方位的、规范而透明的、符合国际水准的管理和服务。信息化发展的趋势,对界线、界桩管理也提出了新的要求。为了保存和科学管理这些勘界成果,需要综合运用计算机技术、GIS技术,建立数字化的地理信息和界线管理系统。

互联网地理信息系统(简称Web GIS)是GIS技术随着Internet的出现而发展起来的。它使GIS从专业人员手中解放出来,成为与广大人民群众的生活息息相关的科技成果,用户通过Internet可以浏览访问Web GIS站点中的空间数据,并进行各种空间信息检索和空间分析。基于Web服务的行政区域界线管理系统将大大提高行政区域界线勘定和界线管理的工作效率,为领导决策及时提供科学依据,对行政区域界线管理信息化、高效化和现代化有重要的现实意义。以地理信息为基础的境界管理信息系统的建立,将分布在不同地域空间、不同平台和多源不同数据结构的地理信息按照系统化、结构化、一体化的运行机制进行数据组织、管理,实现信息查询、分析、信息成果的发布,适时提供各种空间和动态的地理信息,用于管理和决策支持。境界管理地理信息系统不仅可以为民政部门解决边界争议、有效管理行政区域界线并更好地保管勘界成果服务,而且可以提高业务的服务水平和竞争能力,提高管理水平;可以对境界进行实时变更和更新,处理和协调境界关系,快速进行行政区划图的更新,避免重复劳动,从而提高工作效率;还可以为政府的计划、建设、国土资源、林业、水利、公安、司法等部门进行信息化管理提供法定的基础数据,在土地、林业、农业等国土资源的普查、土地资源的动态监测和减灾防灾等方面有着广泛的应用前景。真正实现网络环境下信息共享和知识的发现,推进GIS社会化的应用。

6结束语

地理信息Web服务论文 篇9

关键词:气象,WEB服务,C/S,ASP.net,Oracle

随着国民经济的持续增长,我国民航业目前正处于一个快速增长时期。保证民航业安全快速增长,同时提高社会满意度是各飞行相关部门共同的目标。对航空气象而言,如何提高气象信息服务提供的及时性、准确性、有效性成为这项工作中的一个重要环节。而目前我们在信息服务建设方面相对滞后,对外服务采用的是数套系统并存的方法,这其中有已经沿用了近十年的C/S模式,还有落后的拨号网络连接方式。这些信息提供方法存在气象信息资料收集难、资料种类少、故障率高、维护困难等情况,已经很难满足用户的需要。为了解决以上问题,本文对原有气象信息服务系统进行技术改造,在原有数据库的基础上设计了一套基于WEB的民航气象服务系统,该系统能够克服原系统的缺点,改善对外服务水平,减轻维护工作量,具有良好实际效果。

1 西北空管局气象信息服务现状

1.1 目前气象服务用户及相应信息提供手段1)内部局域网用户

目前我局内部使用气象局域网共有预报、填图、管制、航空公司、签派等用户。他们均通过楼内综合布线或光纤与气象局域网服务器连接,通过气象服务平台(客户端程序)从气象局域网服务器上查询资料。

2)外部局域网用户

海南航空公司是唯一一家外部局域网用户,他们通过单模光纤接入气象局域网,同样使用客户端程序从气象局域网获取资料。

3)外部代理服务器方式用户

东方航空公司的气象资料提供方式较为特殊,他们通过我数据库机房代理服务器上的搬运工程序将气象资料从我一期数据库和局域网服务器上转存到其FOC数据库上,然后其工作人员通过自己的服务程序查阅资料。

4)外部数据库用户

陕西四航站目前通过拨号方式登录一期数据库系统,使用数据库客户端软件检索数据库资料。

1.2 当前信息服务方式存在的问题

1)数据源复杂

目前气象服务数据源包括一期数据库、局域网服务器,再加上自动观测、卫星、雷达、广域网等气象资料提供源,整个系统非常庞杂。

2)信息调用方式较为落后

在信息的调用过程中还存在着拨号方式,传输速率低,图形资料传输困难。

3)维护量大,不易提高对外服务质量

由于对外服务系统整体较为复杂,维护量大,排故环节多,再加上用户分布较为分散,在对外服务的及时性方面会造成一定影响。

4)提供资料种类较少,预报员工作量较大

由于目前对外服务系统提供资料种类有限,在实际工作中,预报员承担着部分资料传输任务,工作量增大。

5)局域网系统故障率较高

虽然目前局域网系统经过改造,但是由于原先专用服务器发生故障,目前对外服务使用的过渡服务器负载有限且原系统部分数据源(例如航填收报机)老化,经常会影响服务。

2 新方案的选择

2.1 使用客户端程序方案介绍[1]

使用客户端程序方案沿用的是传统的二层C/S架构。在这种数据库应用体系中,客户端与数据库完全分开,在客户端运行了大部分服务,如数据访问规则、业务规则、合法性校验等[2]。每一个客户端都存在数据引擎,并且每一个客户端都与数据库服务器建立独立的数据库连接(DB Connection)。这一方案通过开发新一代客户端服务程序,利用现有网络,直接从二期数据库系统读取数据其模型如图1所示。

这种体系的数据应用系统的优势在于:开发周期较短,能够适应大部分中小型数据库应用系统的要求。

但是,这一方案也存在着一些缺陷,主要体现在以下两个方面:

1)可扩充性:对于数据库服务器端,每建立一个数据连接,就会占用大量的系统资源,当数据连接达到一定数量时,数据库服务器的响应速度与处理速度将大打折扣。

2)可维护性:在这种系统中,业务规则通常置于客户端应用程序中。如果业务规则一旦发生变化,就必须修改客户端程序,并且为每个客户端进行相应的升级工作。

2.2 WEB服务方式解决方案介绍[3]

WEB服务方式解决方案采用三层C/S体系结构,即在客户端与数据库之间加入了一个“中间层”。这种设计将业务规则、数据访问、合法性校验等工作都放到了中间层进行处理,客户端不直接与数据库进行交互。这一方案具体而言是通过架设WEB服务器,使用户通过现有网络向WEB服务器发出查询请求,WEB服务器在收到查询请求后向数据库检索相关数据,然后将处理结果返回到终端用户WEB浏览器上。其模型如图2所示。

这一方案最大的好处是维护方便,程序的更改,系统的维护在服务器端就可以完成,同时大大减轻了数据库服务器的访问压力。

2.3 两种方案的选择

综合以上分析,对两种方案进行各项评价指标的对比,见表1。

通过对比分析,我们认为虽然使用WEB浏览服务方式可能在开发环节上存在了一些困难,比如缺乏开发经验,没有专用的WEB服务器等。但是WEB服务方式在维护和改进及扩展方面具有客户端方式不可比拟的优势,并且WEB服务方式在服务行业的应用也是今后发展的方向。因此,综合考虑,我们决定采用WEB浏览方式。

3 系统设计

3.1 系统设计思想

根据这套系统建设的出发点,确定此次开发工作的指导思想是:对内整合资源,对外改善服务。

对内整合资源要求我们对各类气象资料无论从采集、存储还是提供等各个环节都要力求统一、简单、有效。减少不必要的环节和设备,排除不稳定和故障多发系统在工作中的应用,以增强自身的保障能力。

根据解决方案,要求我们根据三层C/S气象服务模型开发出连接客户浏览器和二期数据库服务器的中间层,也就是完成气象服务网站的开发工作,并且从资源整合角度出发,要充实二期数据库资料。

对外改善服务要求我们在系统设计方面要立足于用户,从用户使用的角度出发,开发出的系统无论是在功能上还是使用便利性上都能最大限度地满足最广泛用户的需要。系统的设计要求能给用户带来最大的便利性,从而实现只要用户会上互联网,就能够轻松查阅飞行气象资料。我们在功能设计方面,除了满足以往客户端服务系统具备的报文查询打印、实时自动观测资料显示、雷达图、卫星云图资料显示等基本功能之外,还要求实现高空风与温度预告图和重要天气预告图资料的显示与打印功能。

3.2 系统功能模块划分及结构设计

对气象服务系统的功能进行分析后,划分出航空气象报文查询模块、自动观测资料显示模块等六个模块,结合面向对象和三层结构的设计思想,设计出每个模块的页面,见图3。

3.3 开发软硬件环境

本系统是在原有二期气象数据库系统基础上开发的,通过前期市场调研,及目前互联网技术的发展水平,将系统开发环境分为硬件环境和软件环境,其中硬件环境包括客户端、WEB服务器、数据库服务器,软件环境包括WEB浏览器、网页开发工具及oracle数据库。具体参数见表2

3.4 关键技术

1)ASP.NET3.5的使用

ASP.NET 3.5是微软下一代集成开发工具Visual Studio 2008的一个组成部分[4]。与ASP不同的是,ASP.NET提供了

大量的控件,这些控件能够轻松的实现一个交互复杂的Web应用功能。在ASP.NET 3.5中集成了大量的控件,在开发中我们对这些控件从效率和效果两个方面进行了认真选择,采用了一些对本系统实用价值较大的控件,如登录控件Login,图像控件Image等。

2)ODP.NET控件的使用[5]

ODP.NET是oracle公司针对自身数据库系统开发出的数据访问控件,因此它在访问ORACLE数据库要比ASP.NET 3.5中的ADO.NET更具效果,因此在此次开发中,事关数据访问,全部采用的是ODP.NET组件,从而保证了数据访问效率。

3)BLOB数据的访问

在此次开发中,BLOB数据(二进制大对象binary large object)的访问是一个开发难点,由于图形资料大都以这种数据类型存放,因此这个问题的解决对系统的开发显得尤为重要。在此次开发中,我们通过SqlDataReader对象的GetBytes方法按字节方式访问一个列的数据[6],同时与FileStream对象组合,将BLOB对象保存到WEB服务器上一个文件中,从而成功地解决了这个难题[7]。

4)辅助程序的开发

由于这套系统完全以二期数据库服务器为数据服务源,因此应当保证数据库资料的完整,为了解决数据库缺乏部分本地资料(自动观测、雷达图、卫星云图)的问题,我们先后修改编译了自动观测资料处理程序,编写了卫星云图资料入库程序,修改了雷达传送程序的相关参数,将本地资料文件格式修改为数据库能够识别的格式并进行处理。

4 结论

气象web服务系统的程序开发已基本完成,目前正处于试用阶段。根据目前试用情况看,这套系统运行比较稳定,功能上能够满足设计要求。可以预见,这套系统的应用将极大的改进我中心对外服务水平,无论在提高用户满意度还是减轻内部相关服务人员和维护人员工作量等方面都将产生良好的效果。

参考文献

[1]王玲.基于B/S架构的文档管理系统的设计与实现[D].南京:南京理工大学计算机应用系,2007.

[2]刘滔.基于BS架构的民航气象信息综合服务系统[D].上海:上海交通大学信号与信息处理系,2009.

[3]陈齐亚,黎巍.民航气象WEB服务系统改造可行性报告[R].西北民航空管局气象中心,2006.

[4]兰多夫,加德纳.Visual Studio2008高级编程[M].北京:人民邮电出版社,2009.

[5]姚世军,柴育梅.ODP.NET访问ORACLE的方法[J].计算机系统应用,2004(3).

[6]郝刚,袁永刚,齐艳.ASP.NET服务器控件开发技术与实例[M].北京:人民邮电出版社,2005.

地理信息Web服务论文 篇10

近年,Web服务因其平台独立、松耦合等特性,其相关应用和研究得到了广泛的关注。而标签是含有一定信息量的相关性较强的短语或者词组,是互联网内容组织的一种方式,现在已被广泛的应用于Web服务的标记中。标签的简短性、强关联性使得它可以用作特征词,用于描述Web服务,以帮助人们快速准确的理解该Web服务; 也可以用于服务的分类和聚类,从而提高同类服务的发现[1,2],或是应用到如推荐系统中[3];同时可以用作参数添加到搜索引擎的排名算法中去,从而帮助提升搜索引擎排名性能[4,5]等。

现在已经存在一些系统可以自动的为Web服务提取标签,但是几乎所有的方法都主要基于WSDL文档[2,3,5,6]。WSDL文档虽然是描述Web服务最标准的资料,但是除去WSDL文档中type、message等固定类型包含信息之外,其他信息的数量和长度却很有限。WSDL文档中的描述信息一般以自然语言形式出现,能有效的说明和解释Web服务,但是WSDL中此类信息的平均长度较短[7]。WSDL文档中描述信息短和少,其他类型信息的固定性和有限性,使得当人们使用它作为信息源来进行Web服务标签挖掘时,方法和有效性都受到了一定程度的限制。Lijie Wang等人曾经利用互联网上的资源为Web服务扩展描述信息,但是扩展的描述信息只用于描述信息的增加[7]。

在本文中,设计实现了一个支持多信息源的Web服务标签挖掘系统,该系统利用搜索引擎得到服务相关的网页,结合WSDL和服务相关网页经过标签挖掘模块的挖掘,得到了最终的标签并将其显示在我们的网站( websuite. info) 上。

2 系统的设计与实现

本文中设计实现的Web服务标签挖掘系统的结构如图1所示。本系统从总体上分为三个层次,分别是界面展示模块、标签挖掘模块和信息获取模块。

信息获取模块主要是完成为本文中的支持多信息源的Web服务标签挖掘系统提供信息源,本文将与服务相关的网页作为标签挖掘的扩展信息源,信息获取部分是实现整个服务标签挖掘系统的基础,同时为标签挖掘模块提供数据; 标签挖掘模块是整个标签挖掘系统的核心,使用信息收集模块获取的WSDL文档和服务相关的网页,分别对这两种信息源进行特征提取、生成备选文本段等操作,再经过标签提取和分类整合等步骤,得到了最终的标签; 界面展示模块是成果显示部分,完成了将本标签挖掘系统得到的标签组合集成到服务搜索引擎中的功能,同时补充了诸如标签添加与删除、利用标签过滤搜索结果等功能。

2. 1 信息收集模块

在本文设计实现的Web服务标签挖掘系统中,信息收集分为两部分。第一部分是收集服务的WSDL文档,第二部分是从互联网上获取与目标Web服务相关的网页。

( 1) 收集服务的WSDL文档。在与项目相关的数据库中已经存储了WSDL文档,因为它被作为Web服务信息的一部分显示到网站( websuite. info) 上,所以项目组利用爬虫从各大服务搜索引擎和服务注册网站中爬取到该文档并存储到数据库中。

( 2) 服务相关网页收集。Web服务相关的网页通常包含该Web服务的访问地址,即该服务对应的WSDL文档中的URL或者ENDPOINT的URL。在本文中,以WSDL文档中的URL是否出现在网页中作为判定该网页与目标Web服务相关与否的依据。通过搜索引擎的搜索得到相关的网页。

2. 2 标签挖掘模块

从图1的支持多信息源的Web服务标签挖掘系统的结构图可知,标签挖掘模块主要分为两大部分: 第一部分是信息预处理,第二部分是标签生成。

2. 2. 1 信息预处理

信息预处理部分将完成对在信息收集部分得到的WSDL文档和相关网页的处理,以生成备选的可用于进行Web服务标签挖掘的文本。信息预处理主要分为三部分: 第一部分是从WSDL文档中抽取服务特征;第二部分是对收集到的网页进行过滤和提取有用信息; 第三部分是利用之前两部分得到的信息,生成标签挖掘的备选的文本段。

2. 2. 1. 1 WSDL 文档特征抽取

WSDL中的元素种类较多,通常包含如type、service、documentation、operation等种类的元素,如图2所示。在WSLD文档中,type元素定义了数据的简单和复杂类型,message元素是对输入和输出操作的简短介绍,operation元素即该Web服务要完成的功能,service name可以有效体现该服务的功能特性,里面的documentation( 即文本描述信息) 可以帮助人们快速理解和掌握该服务的应用规则等。

为了更全面准确的体现Web服务特征,本文中的Web服务标签挖掘方法将从service name( 服务名称) 、type( 类型) 、message( 消息) 、operation( 操作) 和documentation ( 文本描述信息) 5个部分进行内容抽取,该操作借助WSDL解析工具 - WSDL4J[8],即Web Service Description Language for Java Toolkit,是一个专门用来解析WSDL文件的JAVA接口。利用WSDL4J逐个对message等五个域进行解析,从而得到了这五个域所包含的内容。

对从WSDL文档中抽取出的内容进行一些基本的词法和语言处理,其过程如图3所示。

基本的词法和语言处理过程为按照一定的切分标准对WSDL的内容进行切分,再经过去停用词、提取词干、计算权重值等通用的文本处理办法,得到了从WSDL中提取出的特征项的文本资料。

在本篇文章中,采用TF - IDF作为计算单词权重值的方法。即

公式( 1) 中,tfk表示关键词k在文档中出现的频率,即:

公式( 2) 中,timesk和Nwords分别代表了关键词k在当前文档中出现的次数及该文档中单词总数。

此外,idfk为关键词k的倒文档频率( Inverse Document Frequency) ,计算公式为

在公式( 3) 中,Ndocuments表示数据集中文档的总数,Ncontain表示包含关键词k的文档的数量。

图 3 基本词法和语言处理过程

2. 2. 1. 2 网页信息处理

对网页信息的处理主要分成两部分: 网页过滤和网页文本抽取。网络过滤部分的主要作用是过滤掉重复的网页,然后进行内容的提取。在提取部分主要分为两块,一块是抽取指定标签下的内容,另外一块是将得到的内容按照一定的标准进行去重和分类。

网页过滤部分,我们从网页的内容和URL来判断两个网页是否重复,主要判断标准是部分相同或者完全相同。过滤收集到的网页,得到无重复的相关网页集合。

网页内容倾向于描述、解释性的自然语言。而网页中的这种描述性、解释性的自然语言一般以段落等形式出现( 在其他标签中出现的信息长度有限,价值不高) ,本文中,认为html中的段落一般为3大类标签:div、table( 含tr、td) 和p。

DOM( document object model DOM,文档对象模型) ,定义了如何获取、修改、添加或删除HTML元素。针对html中标签相互包含的结构,我们利用html Parser将网页解析成对应的DOM树并抽取目标标签下的文本内容( 这些内容便是我们需要的提取的文本内容) 。

抽取流程为首先,利用html Parser将HTML解析成DOM树,接着从树的根节点开始遍历,如果节点包含文本的长度少于三个单词则删除,如果该节点代表的标签不是目标标签中的任何一种,则跳过此处节点,否则抽取节点下的所有文本内容并保存起来,遍历下一个节点直至整棵树遍历完毕。抽取流程见图4所示。

在图4中,目标标签是指在本文中要抽取内容的目标标签( div、table和p) ; PTS是Page Text Segment( 网页文本段) 的缩写,即从服务相关网页中抽取出的网页文本内容。

内容抽取后,需要对得到的内容进行分类去重等操作。一般认为,如果一个文本段距离目标URL( 上文中提到的该Web服务的访问地址,即该服务对应的WSDL文档中的URL或者ENDPOINT的URL,本文中以该URL作为搜索服务相关网页的关键词) 越近,则这一段与目标服务的相关性越大[9]。具体的,如果一个文本段落含有目标URL,则为它赋予较高的权重,反之亦然。分类是指按照其是否包含目标URL,将其分配到不同的集合中去,而去重是指对于内容完全相同或者部分相同的PTS进行的处理。分类和去重过程如图5所示。

在图5 PTS的分类和去重流程图中,集合C是指包含目标URL的PTS集合,集合N代表着不包含目标URL的PTS集合。

2. 2. 1. 3 备选文本段生成

经过了前面的WSDL文档特征抽取和网页信息处理两部分,得到了从WSDL中抽取的Web服务特征信息和从相关网页中得到的文本PTS。本部分主要完成功能: 1网页PTS的处理; 2相似度计算; 3挑出候选标签挖掘文本。整个处理流程如图6所示。

( 1) 网页PTS的处理。由于网页和WSDL不同的结构特点,我们利用不同的方法从PTS中抽取特征,但是前部的处理步骤( 例如切词、去停用词、提取词干等方法相同) 跳过。权重值计算如公式( 4) ,公式( 5) 。

同上,为PTS中的每个单词计算权重,其中Weight*k代表加上了集合Weightset元素后得到的新的权重值。从属于包含URL的PTS的集合权重值较高。

( 2) 相似度计算。向量空间模型在自然语言处理[10]、信息检索和过滤[11]等领域有着广泛的应用。因为它忽略了每个文本文档中特征项出现的先后顺序,而且利用了几乎全部的文本内容,使得计算更加全面,所以本文采用它计算网页文本PTS和Web服务特征信息之间的相似度。

将文档集合中的所有文档和用户查询表示成n维空间的向量形式,将对文本内容的处理简化为向量空间中的向量运算。具体做法: 1表示: 将每个文本文档表示为一个n维的向量,每一维对应一个特征项( 在本文中即一个词汇) ,每一个特征项用ti表示,d = ( t1,t2,t3,…,tm) ; 2对于含有m个特征项的文本d = ( t1,t2,t3,…,tm) ,用权值wk表示特征项tk在文本d中的重要程度,简记为d = ( w1,w2,w3,…,wm) ; 3特征项对应权值的计算采用公式TF - IDF方法,即公式( 1) 和公式( 2) 。4相似度计算: 将每个文本文档表示为以特征项的权值为分量的向量,d = ( w1,w2,w3,…,wm) ,通过计算两个文本文档向量之间夹角的余弦来计算它们之间的相似度,见公式( 6) 。

通过计算从WSDL中抽取出来的特征值与从PTS中得到的单词的相似度,得到了各个PTS对应的值,按照超过50% 的相似度的标准留下的PTS则可以作为标签挖掘的备选文本。

2. 2. 2 标签生成模块

本文将从WSDL中提取的特征项,以及从备选文本段中得到的特征项作为服务的标签。标签生成的流程图如图7所示。

利用两个信息源得到的特征项作为标签,统计每个服务统计出现次数最高的K个值( 本文基于现实网站的呈现,选择了5个) 对应的特征项,作为部分信息和对应服务绑定显示,统计所有服务出现次数最多的K个值( 本文基于显示网站的呈现,选择了28个) 对应的特征项,在网站的主页上显示成标签云的形式。至此整个标签挖掘的过程完成。

2. 3 界面展示模块

基于语义化业务生成环境( 863计划项目) 的子模块,本系统针对项目中近2万个服务进行扩展了信息源的标签挖掘,得到的结果同时发布到了网站websuite. info上。

2. 3. 1 标签呈现

单个服务带有从其对应的WSDL文档中抽取的以及从网页中得到的标签,显示的效果如图8所示。

2. 3. 2 标签云

标签云是由所有服务的标签数量按照从高到低排列得到的。效果图如图9所示,标签字体的大小表示了该标签在所有服务中出现次数的多少,越大的则次数越多,反之亦然。

另外,系统还利用标签实现了诸如过滤结果的功能等,在这里不一一显示了。

3 结束语

本文针对目前Web服务标签挖掘技术普遍仅依赖WSDL文档和现有标签,或是利用了网页信息但是只做了初步处理的局限性,提出一种利用互联网的网页进行服务标签提取的方法。该方法通过对WSDL中URL进行搜索和反向链接的搜索,获得与目标Web服务相关网页; 再对该网页内容进行了较为充分的利用和处理: 利用DOM结构提取网页内容,包含目标URL的文本段,利用VSM计算与目标Web服务相似度,从而确定可供标签挖掘的候选文本段。通过网站呈现,可以看出我们的方法可以有效的为Web服务挖掘出更丰富、质量更高的标签。

基于Web服务的数据集成框架 篇11

关键词:企业应用集成; 数据集成; Web服务; 可扩展框架

中图分类号:TP311.13;TP311.5

文献标志码:A

Data integration framework based on Web Services

WANG Zhongyu1,2, ZHONG Hua2, HUANG Tao1,2

(1. Dept. of Computer Sci. & Tech., Univ. of Sci. & Tech. of China, Hefei 230027, China;

2. Tech. Center of Software Eng., Institute of Software, Chinese Academy of Sci., Beijing 100080, China)

Abstract: To provide more convenient interfaces for users and third party and extend the functions of data integration product, the Web Services Based Data Integration (WSDI)framework is proposed, of which the structure and key technologies are detailed. WSDI can improve the internal management and extension ability for data integration product. It is applied in the data product integration product named OnceDI, and good effect is achieved.

Key words: enterprise application integration; data integration; Web Services; scalable framework

0 引 言

数据集成的主要作用是在企业应用集成中处理和管理分布的数据资源,为上层应用提供一致和高质量的可用数据.它在企业应用集成中发挥着越来越重要的作用.数据集成产品涉及面非常广泛,主要包括如下相关技术:(1)跨操作系统、跨数据源的数据抽取(Extraction)、转换(Transformation)和装载(Loading),即ETL;(2)数据档案和质量管理,即记录管理集成过程中数据的变化、来源等档案信息;(3)企业间的电子数据交换(EDI);(4)联邦数据库,集成多个局部数据源为一个虚拟的数据源,支持局部数据源对用户的透明;(5)数据复制,数据集成过程中保证分布数据变动的一致性;(6)适配器,为访问异构数据源提供连接支持;(7)应用集成技术(Enterprise Application Integration,EAI);(8)建模和元数据管理.

其中,ETL通过跨操作系统、跨数据源之间的数据抽取、转换和装载的方式实现分布数据的集成.[1]中科院软件所数据集成中间件OnceDI就是这样的产品.ETL产品在现今的企业数据集成中应用面最广,与业务结合也最紧密.但是,仅仅具有ETL功能的数据集成产品,往往只能实现企业用户一次需求的开发任务,缺乏多层次的接口;在与已有系统的集成方面也很难提供强大的支持.同时,在数据集成产品的内部,为了加强其功能和作用,单一的自行开发跟不上客户日益扩大的需求,还需要借助第三方的其他EAI产品(如基于BPEL的流程管理等)共同完成任务.

Web服务(Web Services)是基于一组标准Internet协议的分布式计算组件,具有开放、面向Internet、标准化接口等特点,能够实现松散耦合的与平台无关的应用系统交互与协同,是企业应用集成的理想平台.Web服务技术能够较好地解决ETL技术面临的问题,为数据集成产品提供标准的开发接口和良好的扩展性.一般的数据集成产品提供消息队列,FTP和E-mail等多种传输方式,通过与Web服务的结合,还可以提供跨防火墙传输的HTTP SOAP传输方式.另外,基于Web服务的数据集成产品对于用户和第三方应用而言,具有良好的透明性,实现模块的更换和升级不影响客户应用的调用,保护客户的已有投资.

结合数据集成中间件OnceDI的技术基础,提出基于Web服务的数据集成(Web Services Based Data Integration,WSDI)框架.

1 WSDI:基于Web服务的数据集成框架

作为数据集成框架,需要提供如下基本功能:(1)数据访问能力,提供一组通用的、可扩展的数据访问接口,对各类数据资源和应用系统进行访问,获取数据或提供数据;(2)数据处理能力,对参与集成的数据资源进行灵活处理,如格式转换、冲突处理、内容过滤等;(3)公共服务能力,提供用户管理、数据源管理、传输渠道管理、压缩、加密等公共服务.

WSDI框架分为3个层次,分别为应用接口层(Application Interface Layer)、处理层(Handler Layer)和服务层(Service Layer).同时,将每层封装为若干不同的服务,在不影响应用用户调用的情况下,为每个不同的服务配置不同的调用处理链和应答处理链,从而不影响服务层的具体实现(见图1).

1.1 应用接口层

应用接口层为用户提供集成数据资源和应用系统的接口,同时提供SOAP样式和REST(Reprsemtational State Tranfer)[2,3]样式(在第2节中介绍具体的实现细节)的Web服务.

图 1 WSDI框架的层次结构

两种样式的Web服务都提供标准的WSDL框架服务描述.SOAP样式服务的调用通过标准的SOAP消息,REST样式的Web服务的调用则通过URI(Universal Resource Identifier)定位资源[4],例如:

http://www.mydomain.com/webService/xml?

ServiceName=TaskMgmt

&AccessID=[your aceess ID]

&operation=getTransInfo

&responseGroup=request,small

其中ServiceName表示调用的服务名称,AccessID表示调用用户的访问号,operation表示调用该服务的操作名称,responseGroup表示返回结果(xml文件格式)的数量和数据种类等.

1.2 处理层

处理层采用处理链的机制,将每个消息装配成一个链表进行处理.在Web服务中实现可能需要调用多个处理类,用来提供处理请求/响应前面或后面的服务.这样做有如下优点.

(1)透明性:处理层的存在对于用户是透明的,访问代码不会受到影响,用户也无需知道处理的请求/响应的额外处理过程.

(2)可扩展性:未来新的处理类可以继续添加,只要实现handler的接口

init ()

destroy()

getHeaders()

handleRequest()

handleResponse()

handleFault()

(3)可配置:可以通过预先的配置,改变处理链中各处理类的次序和是否使用.具体需要实现的处理类在第2节详细描述.

1.3 服务层

服务层为WSDI框架提供的一系列基础服务大致可分为两类.

(1)封装原有数据集成产品管理模块API得到的各类Web服务[1],包括:①数据源管理,分布异构数据源的新增删除、增量设置、数据库设置等管理;②流转管理,多服务器间数据流转过程的新建和管理;③会话管理,对登陆用户无操作超时的设置和管理;④插件管理,包括对数据源插件、渠道插件以及其他处理插件的加载和管理;⑤任务管理,任务的增加删除和修改等.

此外还有渠道管理、日志管理、用户管理等多个管理服务.这类基础服务接收到外部用户的调用请求后,将参数转给内部,调用具体的API完成操作.

(2)未来为了新的需求而实现的Web服务.独立分开的Web服务适合新需求的扩展,并以松散耦合的方式实现集成与协作.在第2.1节中谈到的通过soapMQ服务实现HTTP SOAP传输方式的例子,正是这种情况.

WSDI框架的组成结构见图2,分为处理链、服务管理和WSDI管理器3个部分.

图 2 WSDI框架的模块结构

处理链管理负责Web服务调用的请求或应答的处理,主要包含请求处理链和应答处理链,涉及如下模块:

(1) 访问权限管理,负责用户的认证、服务权利级别、优先级别等参数的判断和设置;

(2) 调用档案记录,服务于WSDI Manager,记录该请求的情况,并改变运行行为,如处理链中处理类的次序和增删;

(3) Web服务调用指派,将请求指定到具体服务;

(4) 其他自定义的处理类,例如限定同一IP的访问数量,URI的正确性检查等;

(5) 应答档案记录,服务于WSDI Manager,记录该应答的情况;

(6) 其他自定义的处理类.

WSDI 管理器负责监控和调度WSDI框架中运行的各个服务和行为:运行时服务管理的重配,WSDI Manager对运行环境进行监控,根据环境的变化(如CPU或者内存的利用率)和服务名称的不同,选用不同的配置策略和运行行为,如处理链中处理类的增删和调用顺序等.

服务管理模块API封装成的Web服务,包括数据源管理、安全管理、配置管理、日志管理、许可管理、流转管理、会话管理、插件管理、任务管理等,以及其他一些扩展服务.

2 WSDI框架的关键技术及实现

目前对于Web Services的实现有2大途径:一个是REST样式;另一个是SOAP样式.两者的最大区别[5]在于:REST样式的Web服务面向资源,它简化和统一操作接口,用户可以通过URI定位所需的一个或一组资源,对这些资源的操作由HTTP标准限制,关键操作只有GET,POST,PUT和DELETE,分别对应于资源的获取、修改、新建和删除;SOAP样式的Web服务是面向操作的,更关心服务提供者可以提供的多种具体且详细的操作和功能,对远端服务的调用和返回消息都需要以SOAP消息格式封装.两者各有其优势和缺点,关键看应用场合.目前,Amazon同时提供SOAP样式和REST样式的Web服务,而85%的使用都是REST样式的Web服务.

在WSDI框架中,针对不同的应用场景,分别采用SOAP样式和REST样式的Web服务.

2.1 HTTP传输方式的实现

传统的数据集成产品一般采用消息队列,FTP和E-mail 3种传输方式[2],为了能让数据穿过防火墙,适应不同的网络部署环境,希望通过增加HTTP传输方式解决该问题.为此,总体上利用已有的消息队列(如IBM MQSeries)传输方式,将消息队列管理器中的消息作为SOAP消息的附件,向网络中远端的WSDI服务器发出SOAP请求.而远端的WSDI服务器中响应该请求的服务soapMQ,再解开附件,发送到自己的消息队列管理器中.

图3显示为实现HTTP传输时,WSDI框架中的部分组成.

图 3 实现HTTP传输方式时的WSDI框架内部组成结构

响应SOAP请求的处理步骤如下:(1) 在WSDI Manager中配置soapMQ服务的响应处理链;(2) 编写处理类,主要任务有判断附件有效性;判断附件大小以及指派给响应服务soapMQ;(3)编写soapMQ,主要任务是解开SOAP消息和得到OnceMQ消息,发送到本地OnceMQ.

发送SOAP请求的处理步骤如下:(1) 将OnceMQ消息以附件形式打包成SOAP消息;(2) 调用远端WSDI server中的服务soapMQ,等待结果.

利用已有的消息队列传输方式,通过SOAP消息的封装,以HTTP协议实现跨防火墙的数据传送,同时也兼有消息队列“发送一次且可达”[2]的特性,提高简单HTTP数据传输的可靠性.

2.2 REST样式服务的实现

这里主要探讨图1 WSDI框架中服务层具体服务的实现方式.

HTTP传输方式的实现中,将二进制的消息队列管理器中间的消息作为附件发送,其实质不是面向资源的,因此不能用REST样式实现.除此以外,WSDI框架中其他的基础服务调用可以分为2种:一种是对数据集成服务器的远程操作,其涉及到的参数不多;另外一种是对数据集成服务器元数据的读取或集成后数据源的访问等资源型的只读服务.这两种都采用REST样式.为此,需要做以下几步工作[4]:(1) 定义服务的WSDL描述;(2) 定义各REST样式服务response的返回格式,以xml schema实现;(3) 编写服务代码.具体实现的步骤如下:

(1) 制定服务资源所在的URI,比如

http://www.mydomain.com/webService/xml?

ServiceName=TaskMgmt

&AccesID=[your aceess ID]

&operation=getTransInfo

&responseGroup=request,small

(2) 按照需求以HTTP GET,PUT,POST,DELETE发出.

(3) 处理服务返回的xml格式的结果.

REST样式的Web服务为WSDI带来诸多便利[6],如:服务实现代码开发难度降低;用户应用代码开发难度降低,代码可读性提高;省去SOAP消息的封装和解开,使得服务的性能、可扩展性和独立性都有所提高.

2.3 SOAP样式与REST样式的实现性能比较

为了比较REST样式服务和SOAP样式服务性能的差别,进行如下实验.服务端是一个加密和解密的方法,两者使用同一个代码实现.客户端是独立的Java程序,分别用两种协议对服务端的方法进行调用.每一种协议循环调用n次,然后取平均值.比较结果见表1.

服务端用的是Resin 3.0.13和Tomcat 5.5.9,从表1可见,REST样式的服务从性能上远优于传统的SOAP样式服务,因而,为满足企业级数据集成服务的需求,本文提出的WSDI框架采用REST样式实现底层调用服务.

3 相关工作

为了更好地提高数据集成产品的集成能力和扩展性,很多企业和组织采用不同方式对自己的数据集成产品与Web服务进行结合.Oracle Application Server BPEL Process Manager(Oracle AS BPEL流程管理器)中提供数据集成、数据转移、数据转换、业务活动监控以及对企业间(B2B)协议的支持.Pervasive公司为数据集成产品提供Web服务方式远程调用的支持.BEA liquid data for WebLogic为集成后的数据视图提供Web服务访问接口来方便用户访问.以ESB(企业服务总线)产品闻名的CapeClear公司利用自身ESB集成方案的优势,将传统ETL产品中批量任务处理的作业方式增强为按需响应实时处理的作业方式,加强了数据集成的实时处理能力.

4 结束语

结合数据集成中间件OnceDI,提出基于Web服务的数据集成框架WSDI,对原有数据集成产品进行改进,通过与Web服务结合,为用户和第三方应用提供更方便的接口支持,同时也为数据集成产品的功能扩展提供良好的框架.目前,WSDI框架已经在政府信息交换平台中得到应用,实现对关系数据库,Lotus notes以及Excel等数据资源的集成.

基于Web服务实现的透明性,第三方的Web服务编排软件(比如Oracle的BPEL Server)可以通过普通Web服务编排方式,将多个WSDI框架中的开放服务和WSDI框架外的Web服务整合成一个新的服务并发布,从而实现更负责的应用集成功能.

进一步的工作中将继续完善WSDI框架,提供基于Web服务的数据流转、数据质量管理、数据冲突处理等功能,并结合企业应用集成EAI中的其他模块[6],通过Web服务和XML接口的方式实现有效集成[7],发挥数据集成工具在整个EAI中的数据提供者的作用.

参考文献:

[1] 中国科学院软件所软件工程技术中心.数据集成中间件OnceDI技术白皮书[EB/OL].[2004 - 04].http://www.once.com.cn/product/di.jsp.

[2] FIELDING R T.Architectural styles and the design of network-based software architectures[D].USA:Univ of California,2000.

[3] ROGER L. Building Web Services the rest way[EB/OL].[2003 - 01 - 03].http://www.xfront.com/REST-Web-Services.html.

[4] Amazon E-commerce Service WSDL/API version documentation[M/OL] http://www.amazon.com/gp/aws.

[5] SNELL J. Resource-oriented vs activity-oriented Web Services[EB/OL].[2004 - 10].http://www-128.ibm.com/developerworks/webservices/library/ws-restvsoap/.

[6] 岳宇,程景云.关于企业应用集成EAI若干核心技术[J].计算机辅助工程,2004,13(1): 50-54.

[7] 鲁慧娟,雷毅, 王君.基于XML的集成中间件的设计[J].计算机辅助工程,2005,14(1): 71-74.

地理信息Web服务论文 篇12

农业信息技术是实现农业高速、健康和可持续发展的重要推动力, 是一门新兴的边缘应用学科, 是农业科学和信息科学相互交叉渗透而产生的新领域。基于语义的Web服务发现技术是其中的一个重要组成部分。随着语义Web服务技术在农业信息系统中的广泛应用, 如何从海量的Web服务资源中快速查找出需要的一个或者多个Web服务, 来满足客户需求, 是亟待解决关键问题。

语义Web服务是语义Web与Web服务的结合体, 通过对Web服务进行语义封装可实现Web服务的自动化发现、调用、互操作、组合、执行和监控。普遍存在的问题是:多数基于语义的Web服务发现方法都是建立在全新的语义Web服务模型和描述语言的基础上, 如OWL-S[1,2], WSMO, WSML[3,4]等, 造成这些方法的应用实施难度较大。另外, 很多服务发现系统的实现需要用户输入有关Web服务请求的详细信息, 增大了系统应用的复杂度。

针对上述问题, 本文提出一种轻量级的语义Web服务发现模型。该模型采用语义Web服务描述语言WSDL-S[5]来描述Web服务, 其好处是WSDL-S与WSDL (Web服务描述规范) 兼容, 并且只需在现有大量的基于WSDL的Web服务描述文档中添加一些扩展的XML element和Attribute, 就能达到语义标注的效果。本文重点分析发现模型中各个模块的时间性能, 并实验验证了模块和词典匹配模块分别匹配成功的情况下有很好的Web服务发现准确率和召回率, 该模型可应用在农业信息化等领域。

1 轻量级语义Web服务发现模型设计

本文提出的基于查询语句的轻量级语义Web服务发现模型如图1所示。

工作流程是:在系统启动之初, 先由WSDL-S文件处理模块将文件库中所有WSDL-S文档定义的Web服务名、操作名、输入输出参数名以及相关的领域本体名等信息集中存放在一个数据结构wsdl_information中, 然后用户在服务查询界面上输入Web服务请求的查询字符串, 经查询预处理模块按照一定规则规范化后提交给服务匹配模块。匹配模块首先进行查询语句关键字与领域本体库中各个本体词汇的直接匹配, 如果没有相匹配的领域本体, 则调用词典模块, 利用同义词词典WordNet[6]查找查询关键字的同义词, 之后再进行本体匹配;如果匹配成功, 则本体匹配模块内的学习机制就会把关键字的同义词写进相应的本体文件, 以扩充文体词汇, 方便下一次用户查询。一旦获得了匹配的领域本体名, 接下去本体匹配模块会查找数据结构wsdl_information中存放的领域本体信息, 以确定用户查询对应的Web操作名。反之, 如果本体匹配不成功, 就要调用第2个匹配子模块—词典匹配模块, 用查询语句的关键字直接与存储在wsdl_information中的Web操作名进行单词匹配;如果不成功再次启动词典模块, 在WordNet中查找同义词, 然后再与Web操作名进行匹配;最后, 由WSDL-S调用预处理模块检查调用相关Web操作的输入条件是否满足, 并执行后续的补充操作[7]。

2 本体匹配模块中的自学机制

首先, 本体匹配模块将用户输入的查询字符串匹配服务请求所涉及的领域本体;然后, 用领域本体名确定对应的WSDL-S文件 (列表) 。该模块的重点是匹配领域本体名, 其具体步骤是先用查询语句中的关键字去匹配领域本体库中的各个本体模型, 匹配的顺序是概念、对象和谓词。

匹配过程中, 介词不参与匹配, 但是介词却可以帮助推断出服务请求的上下文信息。如从查询字符串“flight from Boston to Chicago”中能推测出介词from和to之间的内容是两个地址信息, 其中from后面的是源地址, to后面的是目的地址。假如flight域的本体模型结构如图2所示, 则能够确定该查询字符串涉及的领域本体名是flight。如果上述基于查询语句关键字的匹配没能确定领域本体名, 则调用外部的词典模块。利用同义词词典WordNet查找查询语句关键字的同义词, 然后使用同义词进行本体模型的匹配, 以确定领域本体名。

考虑到一词多义的情况, 为了确保查询到的领域本体最大限度地与用户的查询语句相关, 需要深入分析以下4种可能存在的同义词匹配情况:

1) 查询语句关键字和同义词都不能匹配任何一个本体模型;

2) 查询语句关键字能匹配某一个本体模型, 但是同义词不能匹配任何一个本体模型;

3) 查询语句关键字不能匹配任何一个本体模型, 但是同义词能匹配某一个本体模型;

4) 查询语句关键字和同义词都能匹配某一个本体模型。

在上述第3种情况下, 为了提高用户查询语句的匹配率, 需要添加一个学习模块, 通过自学机制把查询语句的同义词也添加到相应的本体文件中, 然后再重新生成本体模型, 以便于以后相似查询语句本体模型匹配率的提高。而其他3种情况则不需要调用学习模块。

3基于轻量级语义Web服务发现模型的农业信息原型系统实现

在原型化实现农业信息Web服务发现模型的过程中, 主要涉及到农产品 (Farm-produce) 、农产品价格 (Farm-price) 、天气 (Weather) 以及地域 (Location) 等领域本体。领域本体用本体编辑工具Protégé来创建, 并存储在MySQL数据库中, 本体文件选用OWL语言描述, 本体词汇的查询和操作使用OWL API。WSDL-S文件是在WSDL编辑器的基础上添加语义标注而生成的。词典模块利用JWNL[8]提供的接口来操作同义词词典—WordNet。Web服务调用模块利用Axis[9]工具提供的相关Java类来调用选中的Web服务。整个原型系统的开发使用Eclipse作为开发平台。

4 实验及结果分析

4.1 实验准备

为了测试系统中各个模块的时间性能以及该发现模型的准确率和召回率在不同情况下的变化, 输入503个不同长度的查询语句, 涉及的领域有Farm-produce, Farm-price, Weather和Location, 其相关的领域本体存储在本体库中。实验运行于IBM R60上, 软硬件配置为:1.66-GHz Intel T2300处理器;1G内存;Microsoft Windows XP操作系统。实验结果的记录和分析使用Eclipse的插件TPTP。

4.2 实验结果与分析

图3显示的是系统各个模块花费的平均处理时间。其中:1代表WSDL-S文件处理模块;2代表查询预处理模块;3代表是词典模块;4代表本体匹配模块;5代表词典匹配模块;6代表相关检查模块。从实验结果看, 系统中最花费时间的模块是WSDL-S文件处理模块和词典模块。但由于WSDL-S文件处理模块只在系统启动之初被调用一次, 因此该模块执行的快慢并不会影响系统性能。那么, 整个系统的性能瓶颈就在于词典模块的执行时间。该模块主要用来在WordNet中查找查询语句关键词的同义词 (synonym) 、上位词 (hypernym) 和下位词 (hyponym) , 以扩充领域本体的词汇。数据分析的结果表明, 词典模块的大部分时间花费在了为每一个查询语句关键词查找同义词时调用JWNL的接口上。

为了进一步详细分析本体匹配模块和词典匹配模块在不同情况下对系统性能的影响, 下面主要测试经本体模块单级匹配成功、词典模块单级匹配成功以及经本体与词典两级匹配成功的前提下系统准确率和召回率的变化。假设D代表WSDL-S文件库中提供的Web操作的个数, Qi代表第i个用户查询, RQi代表WSDL-S文件库中与第i个用户查询Qi有关的Web操作的个数。由于RQiD, 所以DRQi代表与用户查询无关的Web操作个数。接下来, TQi代表原型系统返回的与第i个用户查询Qi对应的Web操作个数, GQi代表系统返回的与第i个用户查询Qi有关的Web操作个数。二者的关系用公式GQi=TQiRQi表示。因此, 第i个用户查询发现Web操作的准确率Pi=GQi/TQi, 召回率Ri=GQi/RQi

实验结果如表1所示。表1记录的是系统分别在经过本体模块单级匹配成功、词典模块单级匹配成功以及经过本体和词典两级匹配成功的情况下Web服务发现的召回率和准确率。实验结果显示:在词典模块单级匹配成功时, 系统的准确率和召回率是最低的, 因为词典匹配没能很好地利用语义信息;在本体模块匹配成功时, 系统地准确率和召回率就大大提高, 这是因为本体匹配模块有效地利用了语义和领域信息;最后, 经过本体匹配和词典两级匹配成功的情况下, 系统的准确率和召回率进一步得到提高, 因为那些在OWL本体文件中得不到匹配的查询关键字又经过了一次词典匹配, 所以匹配效率要高一些。

比较分析这3组数据发现 (见图4所示, 其中1代表词典匹配模块, 2代表本体匹配模块, 3代表词典和本体匹配模块) , 在整个语义Web服务发现模型中, 本体匹配模块对于系统准确性的提高起着至关重要的作用。如果没有本体匹配模块, 则系统准确率和召回率会下降23%左右。相反, 词典匹配模块对于系统性能的提高却无关紧要, 如果去掉词典匹配模块, 则系统准确率和召回率会下降1%左右。

5 结论

目前, 大多数基于语义的Web服务发现方法应用难度大, 使用不方便。为此, 本文提出一种基于用户查询语句的轻量级语义Web服务发现模型, 并在农业信息化领域做了原型系统的实现。农业信息用户只需输入简单的查询语句, 经过预处理、领域本体的匹配、词典级匹配以及一些优化措施, 最终自动查找到相关的农业Web服务操作。

实验结果表明, 本体匹配模块对于系统服务匹配准确性的提高起着至关重要的作用, 并且自学机制的使用在自动扩充本体词汇的同时也增加了系统的准确率和召回率。

实验结果充分证明了本文提出的轻量级语义Web服务发现模型的可行性和有效性。该模型在农业信息化领域的应用将为农业信息用户提供便利、快捷和效益。

摘要:针对现有多数语义Web服务发现方法应用实施难度大和对终端用户输入信息的完整性依赖度高的问题, 提出一种基于简单查询语句的轻量级语义Web服务发现模型。该模型将用户输入的查询语句经过领域本体匹配、基于WordNet同义词典匹配等步骤, 自动发现并调用相应的Web服务操作。实验结果表明, 采用该服务发现模型能够有效提高服务发现的准确率和召回率, 进而可推广应用到基于语义Web服务的农业信息化中。

关键词:农业信息化,Web服务发现,WordNet,自学机制

参考文献

[1]Anon.The OWL Services Coalition.OWL-S:semanticmarkup for Web services[EB/OL].[2006-11-08].http://www.daml.org/services/owl-s/view/.

[2]Wang X, Vitvar T, Kerrigan M, et al.A QoS-aware selec-tion model for semantic web services[C]//The 4th Interna-tional Conference on Service-Oriented Computing, 2006:12-24.

[3]Keller U, Lara R, Polleres A.WSMO Web service discover-y[EB/OL]. (2004-08-15) .http://www.wsmo.org/2004/d5/d5.1/v0.1/20041112/d5.1v0.1_20041112.pdf.

[4]Stollberg M, Keller U, Fensel D.Partner and service discov-ery for collaboration establishment with semantic Web serv-ices[C]//IEEE International Conference on Web Services, 2010:480-494.

[5]R Akkiraju, J Farell, J A Milleret, et al.Web service seman-tics-WSDL-S[EB/OL]. (2005-04-03) .http://www.w3.org/2005/04/FSWS/Submissions/WSDL-S.htm.

[6]邵东伟, 王俊发, 吴贵福, 等.国内外农业信息化建设对佳木斯地区的启示[J].农机化研究, 2010, 32 (8) :246-248.

[7]阮佳彬, 杨育彬.基于本体词汇的三维模型语义检索[J].计算机科学, 2009, 32 (2) :152-154.

[8]Bwalenz, Didion J.JWNL-Java WordNet Library[EB/OL]. (2010-05-14) .http://jwordnet.sourceforge.net.

上一篇:离婚诉讼能否撤销下一篇:高职教育市场营销