XML和Web服务

2024-06-04

XML和Web服务(共8篇)

XML和Web服务 篇1

1 引言

在传统的电子商务中,企业通过程序员们采用“独立解决方案”来构造电子商务系统,当企业面临新的电子商务模式和遇到新的需求的,由于各个系统的异构性,使得信息交互、资源利用困难而产生瓶颈,造成“信息孤岛问题”。因此,企业系统间的异构数据交换和集成便成为亟待解决的问题。在用户层次上,需要同时访问和处理不同网络节点的多个异构数据库的数据时,希望屏蔽各个节点和层次上的异构特性,希望只需要通过查询,最终得到一个综合的结果。为了解决这些问题,第三阶段的动态电子商务孕育而生。

2 动态电子商务的概念

由于在互联网上采用了得到业界广泛支持的开放标准具有与生俱来的动态和跨平台性。在实时条件下,应用可以被动态地集成。其特点是软件按照商务的过程造型,设计成可重用且允许贸易伙伴、承包商、顾客和供应商等连接商业流程而进行跨企业的交易处理的柔性组件。而We b服务是动态电子商务的核心技术。所以,给动态电子商务下了如下的定义:“动态电子商务是着重于BtoB的综合性和基础设施组成上的下一代电子商务,通过调节internet标准和通用基础设施为内部和外部企业创造最佳效益”。

3 动态电子商务的优势

早期的静态式Web根本达不到与客户和企业交流的功能,而交互式的Web技术(如,CGI)由于非跨平台性,使得企业内部和外部的集成仅能用专用的交换协议技术和接口实现(如IBM的GWAPI, Micros oft的IASPI),开发成本高,效率低下,难以发展更广阔的合作伙伴和市场空间。而应用动态电子商务,企业可以及时寻找商业合作伙伴,并将各种软件集成新的解决方法,缩短了业务重组时间,也减少企业对企业(BtoB)的应用集成开发的费用和实施的时间,导致新的商业模型出现,提高了争力,拉开了商业对手的竞争差距。

4 什么是web服务

We b服务基于开放的标准,因此,它的实现独立于具体的编程语言和操作系统,开发者得以用基于功能的方式来访问发布在网络上的应用程序, 而不是基于程序如何运行和程序如何编写。Web服务通过定义一组可以通过internet调用的相关的商业逻辑,从而可以使某企业将其电子商务应用程序的功能以公开的、统一的方式提供给企业的商业合作伙伴调用。这样异构实时数据交换和无缝的应用集成成为可能也避免了重复开发。进而提高生产管理效率,最终实现企业效益的提高。其实,Web服务已超出了软件组件的范畴,它为企业提供了一种方法,使他们能够跨越网络彼此连接应用来进行动态电子商务,而与应用、设计、运行环境无关,Web服务为企业及合作伙伴开发业务解决方案提供了一系列新的可能性。

5 Web服务的核心技术

We b服务是动态电子商务的核心技术,而XML开放标准却是We b服务技术的基础,所有的We b服务的描述、注册、查找、调用都基于XML格式的消息进行。

XML: (e Xe ns ible Markup Language,可扩展置标语言)是由W3C发布的一种标准。正是为了解决由于电子商务交易中存在的异构系统数据传输问题,XML应运而生。它是目前全球范围内描述数据和交换数据的一种开放式的统一的标准方式,可以使用XML将不同数据格式的数据进行转换,从而达到异构数据间无缝交换的目的。具有易于设计,编写容易, 设计正式,可读性强,跨平台性,自描述性,可扩展性,可效验性,保证信息的层次性描述,能够实现分布式的电子商务应用的交互的高灵活性等特点,可以畅通无阻地通过任何Internet协议在网络上传输。

6 Web服务的架构

We b服务通过We b服务描述语言(WSDL)来描述,通过简单对象访问协议(SOAP)来访问,在商业注册中心(即服务代理者)—通用描述发现和集成(UDDI)中发布,这样开发者和应用程序可以搜索并定位到该服务。它的这种设计模式被称作面向服务的架构(SOA),包括3个清晰的角色定义:服务提供者、服务请求者、服务代理,具体操作为:

服务提供者需要向服务代理注册所提供的服务描述如服务的功能及访问接口等信息,即为发布;服务请求者根据服务代理提供的规范接口,查找特定种类的服务。对于服务请求者,可以是在设计时为了程序开发而检索服务的接口描述;也可以是在运行时为了调用而检索服务的绑定和位置描述;最后需要调用服务,在绑定操作中,服务请求者使用服务描述中的绑定细节来定位、联系和调用服务,从而在运行时远程调用或启动与服务的交互。

7 基于Web服务的动态电子商务解决方案

该模型给整个internet上的商业运作和系统集成提供了一个全新的解决方案,它不是围绕某类型的系统模型或者架构的技术,而是一个针对应用集成这个难题而发展的革新技术。企业的核心商务功能用We b服务封装成组件之后,这些商务功能可以很方便地在企业之间共享,连接和交易处理一起能够满足动态系统集成的要求。这意味着需要把Web服务的动态性质延伸到更复杂的交易处理系(下转第206页)统、工作流程、商业流程管理和合作系统上面。如图(二)所示,所有的企业内部的应用系统在对外接口上都用统一的对象模型:Web服务封装。所有的Web服务挂接在Web上,同时,通过UDDI服务注册中心发布自己的商务服务。任意的服务请求者通过再UDDI注册中心发现合乎自己要求的服务,找到服务提供者,然后通过internet远程调用该服务。有时客户向某个Web服务器发送请求时,需要面向一个或多个Web服务,从而出现许多逻辑层,最终使获得的信息合并到复合页面,返回给客户,完全屏蔽了中间复杂的数据处理的过程。企业间的操作也可能需要调用多个Web服务来实现某一业务形成工作流。把各个需要用的Web服务从已定的运输商中排列运载次序,高效的完成整个任务,实现业务流程一体化。

8 总结

We b服务在软件开发的思维模式,对软件界的生态,对企业界完成异构系统集成的模式等方面做出了具有颠覆性的突破,Web服务表现出的技术的融合以及采用的开放标准必将促成动态电子商务的成功。有了Web服务,企业能将他们的信息建设成果透过新的渠道向外界扩展,使用更多元化的交易将业务流程自动化,创造出更弹性更有效的业务模式来增进效率。它将会带动软件、硬件和服务等各方面的发展,创造出更广阔的市场。

摘要:基于Web服务和XML技术和它的服务模式使电子商务的发展取得了历史性的突破, 它不仅改变了软件服务在开发上的思维模式和在互联网上的呈现方式, 其对异构系统的集成和技术的融合必将推动动态电子商务更快的发展。

关键词:Web服务,XML,动态电子商务,数据交换,集成

参考文献

[1]IBMdeveloperWorks/WebServiceZone, IBM的Web服务技术资源中心.

[2]杨曼, 徐东平.基于Web服务的动态电子商务的研究[J].计算机工程与设计, 2006.

[3]阳娣兰.XML/Web服务技术及其在动态电子商务中的应用[J].科技资讯, 2006.

[4] (加) 李劲.动态电子商务的Web服务[M].北京:清华大学出版社, 2002.

XML和Web服务 篇2

关键词:B2B电子商务;Web服务;安全;服务质量

中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)16-30987-02

Analysis of Security and Quality of Service for Web Services in B2B E-commerce

HE Shan,WANG Bo

(School of Economics and Management,Southwest Petroleum University,Chengdu 610500,China)

Abstract:B2B e-commerce can significantly profit from the interoperability offered by Web services. However enterprises require the Web services with built-in quality of service and security features. A solution is proposed to resolve the security issues involved by the communications between Web services, based on widely accepted standards. Furthermore, this paper designed the mainlines of an architecture that aims to manage the QoS of Web services and to select services according to the consumers' needs.

Key words:B2B e-commerce;Web Services;Security;Quality of Service

1 引言

WEB服务实现了异构平台和分布式环境中WEB应用的协同工作,对B2B电子商务中跨组织的业务流程提供了有力的支持 。业务伙伴间的商业通信有较多的约束和要求,特别是在安全性、可靠性和可信度等方面 。新一代的WEB服务必需有更高的安全性和品质要求,因此不仅需要定义其功能,还要定义如何传递服务。企业在创建WEB服务时应充分考虑到灵活性、易扩展性和开放性的要求 ;同时,真实的企业还有一些实际的约束,如需充分利用现有设施,服务的提供必需遵循统一的过程、规则和策略,必需和企业的规模、业务目标相适应等。下面将分析B2B中企业如何更好地提供满足安全和品质要求的WEB服务。

2 WEB服务安全

2.1不同层次的安全措施

在任何商业应用中安全都是需要重点考虑的因素,尤其是当可以从公网上访问应用系统时。B2B中商业伙伴通过WEB服务可以获取和企业后台系统自动交互的功能,因此对企业的信息系统而言对外提供WEB服务可能会面临严重的安全威胁 。下面从四个层次来考虑针对WEB服务的安全措施。

(1)传输层。根据选定的传输层协议来采取相应的措施,如采用证书或基本认证(用户名口令)的形式;

(2)消息层。将WS-security系列规范和安全声明标记语言(SAML)两者结合起来使用,在多层体系结构中传递安全凭证并在每个组件中进行有效性验证 ;

(3)服务层。WS-Policy规范提供了通用语法来描述针对某一具体服务的安全措施;同时为了监控服务使用者的权限,企业需保存和维护业务伙伴信息以及访问控制列表;

(4)治理层。指明了通用的指导文件和整体策略,具有战略性和长期性的特点。

在选择安全措施时,一定要考虑到B2B的关键是互操作性,最终的解决方案必需建立在广为接受和成熟的标准之上以确保互操作性。

2.2网络约束

通过为业务伙伴提供WEB服务,企业信息系统的开放性得到了提高。信息系统总是位于专用网络中,这个网络通常被认为是一个可信和安全的环境。从公网访问公司内网的每个入口都必需严格控制。非军事区DMZ是由防火墙、代理服务器和严格的治理策略所构成的区域,用来保护公司内网。应尽量减少非军事区的数量,并限制运行于其中的应用程序的数目。企业可以把非军事区的管理外包给第三方。

任何对外提供WEB服务的企业都试图通过建立安全架构来保护它的信息系统免受威胁。因此公司的信息系统必需随着新的B2B组件和治理策略的使用而不断发展。

2.3案例分析

在本案例中,考虑B2B电子商务中常见的一种情况:假定企业A是一个大集团公司下的一个子公司,它并不能控制其专用网的边界。集团公司负责管理所有的DMZ,和外部世界的每个连接都必需经集团公司的验证。

2.3.1 系统架构

对于DMZ的设计有三种可能的方案:

(1)企业A自行建立DMZ并承担所有管理责任;

(2)企业A把B2B组件部署在集团公司的DMZ中,集团负责基础架构的维护,而企业A则负责提供业务逻辑;

(3)重用集团公司已经部署的中间件,由集团负责对外提供WEB服务。

对三种方案进行比较和权衡,考虑如何能迅速满足企业的需求。方案1对企业而言灵活性最好,缺点是根本没有利用现有的设施,成本太高,开发周期较长。方案2使企业有较多的灵活性,XML消息传输路径短,组件可以个性化;主要问题是缺乏重用性,如集团公司的另一个下属单位需要对外提供WEB服务时又得添加新的组件到DMZ中。方案3利用了已有的人员和设施,没有为专网增加新的入口,不同的下属单位都可以用同样的方式来处理,更有利于系统的扩展。所以总的看来,方案3最为合理的。于是方案3被选中,即重用已有的基础架构,如图1所示。反向代理服务器和集成服务器已经在运行中,并由集团公司负责管理。反向代理服务器用于把WEB服务通过互联网发布给远程业务伙伴,它会过滤传入的请求,然后仅把正确的传送给中央集成服务器;集成服务器则负责把传入的消息路由到合适的后台WEB服务。

2.3.2采用的安全措施

企业A和业务伙伴之间在传输层所采用的协议是包括了客户服务器证书验证的SSL协议。每个业务伙伴都需要有一个合法的证书并在指定的时间提供给集团公司,而集团公司必需建立和维护公钥基础设施(PKI)。SSL协议确保了从发送端到接收端消息的完整性,双方都通过证书来验证对方的身份。在消息层,业务伙伴需在发出的SOAP请求中插入邓氏编码,以便集成服务器能够检查请求者的身份。在服务层,企业A必需提供业务伙伴信息和访问控制列表给集团公司,这样集团公司才能重新配置系统平台。当有消息传入集成服务器时,就会自动检查业务伙伴是否有权进入请求的服务。在治理层,集团公司则不用修改任何策略。

图1 企业提供Web服务的架构

2.3.3讨论

在这个案例中有几点值得进一步讨论。

(1)对于传输层措施的依赖。对于XML消息和Web服务而言,还需要基于消息内容的安全性,以适应多节点架构和消息型的通信,例如如何根据消息的重要程度实施不同级别的安全措施,如何实现消息的部分加密。SSL只提供了一个整体的解决方案,考虑了XML数据结构的更细粒度的解决方案则还未实现。另外对于每个SSL连接都需要独立地验证请求者的凭证,不能通过相互关联来实现单点登录。

(2)消息层的安全。根据WS-Security规范,业务伙伴间发送的每条消息都可由发送者进行数字签名,以确保内容不会被篡改。XML加密规范可以对选择的节点进行加密,防止数据被未经授权的人员查看。SAML验证陈述可以被加入XML消息中,应用系统可以通过检查消息中的陈述来辨别客户的身份以及是如何、何时被验证的。

(3)服务层的自动化。在本案例中企业A和集团公司分别拥有业务知识和基础架构。当前,企业是以人工的方式和集团公司共享知识,而不能自动修改Web服务提供的方式。将来的情况应是,企业A通过集团公司提供的内部服务来管理服务的提供:开放/关闭服务,修改服务的配置或访问控制列表。

3 Web服务的服务质量

3.1服务质量标准

对于Web服务,不仅要发布其功能,也需要规范其非功能属性。Web服务的服务质量(quality of service,QoS)通常是指和非功能属性相关的可观测到的参数,如响应时间。服务质量已成为一个判定服务提供者是否成功的重要因素 。针对Web服务的QoS标准和服务的执行有关,通常包括可实现性、可扩展性、可访问性、完整性、准确性以及可靠性等 。

在竞争激烈的商业环境中,服务质量成为区分提供相同Web服务的不同公司的一个主要因素。正式的合同,也称作服务品质协议(SLA),被用来更精确地定义提供的服务的检测标准;服务提供方和消费方通过它约定了对某一服务的期望值,并且指明了哪些事务需要执行以及如何执行 。双方还可以就各个指标的执行情况约定奖惩条款。因此服务提供者必需清楚地知道自己的IT基础设施是否能满足SLA里承诺的条款。为了选择满足用户QoS要求的最佳的Web服务,首先需要根据提供的QoS对Web服务进行分类,然后再验证它们的QoS参数。

3.2影响服务质量的因素

业务交易不仅涉及安全,还有可靠性和可信度的问题。许多因素降低了提供给客户的Web服务的质量,这些因素包括Web环境和服务提供者的环境。Web环境影响包括流量模式的变化,拒绝服务攻击,网络基础设施故障,Web协议的缺陷,Web本身的安全隐患以及带宽的减小等。服务提供者环境主要涉及连接的数目,提供的服务,服务器主机平台以及服务器的计算能力等。

3.3 Web服务的QoS属性

WSDL从语法上描述了Web服务的签名,但并不涉及任何语义方面的内容,例如QoS。一些新的规范正在制定中以便集成Web服务的属性和QoS约束,如DAML-S、WSLA、QoS proxy,QoS Broker等。这些规范阐明了如何根据客户的服务质量要求来选择Web服务,但仍然有些地方还未充分考虑:

(1)在会话中控制和验证选定Web服务的SLA中声明的QoS;

(2)把违反SLA的情况都记录在数据库里并告知双方;

(3)管理提供的QoS,Web服务和Web环境。

为了满足这些要求,将通过第三方组件来解决QoS的相关问题。

3.4解决方案

解决方案是基于服务质量管理器组件的,如图2所示。

图2 服务质量管理总体架构

在此方案中考虑了下面的情况:

(1)根据服务质量合同中客户的要求获取Web服务。合同储存在一数据库中,而服务提供者则在UDDI注册中发布所能提供的服务;

(2)调用Web服务后,服务品质管理系统将比较提供的服务质量和要求的端到端服务质量,实现不间断地检测,当有违反约束的情况发生时通知服务质量管理器。服务品质管理系统实际上是监测服务质量的探测器的集合;

(3)把客户应用程序和选中的Web服务绑定,当服务质量下降时首先告知服务提供者,以便对相关属性进行调整;如果服务质量仍然在降低,服务质量管理器就会通知客户;

(4)当服务未遵守QoS约束时,征得客户同意后维护和调整Web服务的使用。调整是根据能得到的计算资源来找出客户和Web服务间交互的最佳情况来进行的。

4 结论

针对B2B电子商务中Web服务的安全问题,提出了基于通用标准的解决方案,由集成服务器和前置的反向代理服务器构成,负责由内网向Internet提供Web服务。另外,为了管理Web服务的服务质量和根据客户需求来选择服务,本文还设计了服务质量管理的总体架构。在实施QoS解决方案中,还涉及到服务业务合同的设计,标准、语言以及协议的选择等具体的问题,这也是将来的工作要研究的问题。

参考文献:

[1]佘名高,贾秀峰.基于Web服务的企业应用集成[J].计算机技术与发展,2007,17(5):55-58.

[2]Simson Garfinkel.Web安全与电子商务[M].北京:清华大学出版社,2005.

[3]汪卫星,甘诚智.基于WEB Service的电子商务系统安全策略[J].2006,(488):180-181.

[4]Etban Cerami. WEB服务精髓[M].北京:中国电力出版社,2005.

[5]张玉华.基于WEB Service的电子商务安全研究[J].理论月刊,2007,(5):91-93.

[6]王萍, 侯红. 基于QoS的WEB服务动态组合模型[J].计算机工程与设计,2007,28(10):2494-2497.

[7]J. O'Sullivan, D. Edmond. What's in a service? Towards accurate description of non-functional service properties[J]. Distributed and Parallel Databases, 2005, 12(3): 117-133.

[8]苏爱华,张国清.基于SLA和WEB服务技术的服务质量监测系统[J].计算机工程与应用,2006,(11):157-160.

XML和Web服务 篇3

随着计算机网络技术的发展,农业专家系统应用技术在网络化、智能化、尤其是集成化方向不断加强。不同的农业专家系统在开发过程中使用的推理机制较为相似,而不同地区、不同品种的作物,其知识库的结构是不同的。如果能够有效解决不同系统知识库的共享问题,使不同平台、异构的专家系统可以进行集成,就能避免现有的农业专家系统重复开发现象[1]。但是,现有的农业专家系统由于其自身的特点,在系统之间的互操作和信息共享方面仍存在一些局限性:

1)由于各专家系统的异构性,不管是使用了微软的DCOM,OMG的CORBA或JavaRMI技术,都需要统一的运行平台提供基本的网络服务和系统服务。服务的客户端与系统提供的服务本身之间必须进行紧密耦合,不同平台的专家系统进行集成需要复杂的接口交互,系统的集成和维护代价很大。

2)数据源所依赖的应用系统、数据库管理系统及操作系统的不同妨碍了各农业专家系统之间的信息交互。从整体上看,这些应用系统模块由于缺乏统一的架构规划,运行独立、数据大多自采自用、对外接口复杂多变。由于这种应用分割的存在,多个应用系统之间往往存在数据的冗余以及功能的重叠,形成“信息孤岛”。

1 Web服务和农业专家系统集成方案1.1 Web服务体系结构

1.1 Web服务体系结构

Web服务是近年来提出的一种新的面向服务的体系结构。其中,定义了一组标准协议,用于接口定义、方法调用、基于Internet的构件注册以及各种应用的实现。由于Web服务采取简单的、易理解的标准Web协议作为组件界面描述和协同描述规范,完全屏蔽了不同软件平台的差异[2],因而特别适合于种类繁多的农业专家系统集成。当应用系统需要一种Web服务时,通过Internet在Web服务的注册机构中查找分布在Web站点上的Web服务后,自动与服务绑定并进行数据交换,不需要进行人工干预[3]。其工作原理如图1所示。

1.2 Web服务核心技术

Web服务是一个面向服务的环境,从体系结构上看,服务提供者、服务请求者、服务代理者通过3种基本操作有机地联结在一起协同工作。3种基本操作用Web服务技术组件实现,Web服务的组件基本部分包括HTTP,XML,SOAP,UDDI,WSDL[3],如图2所示。

1) XML: XML(可扩展标记语言)是3W公司制定的作为Internet上数据交换和表示的标准语言,是一种允许用户自己定义自己的元语言,特别适合在Internet环境下的多点数据交换环境下使用。它是Web Services的基础语言。Web Services的基础协议SOAP等都是由它衍生出来的。XML语言的主要特性体现在4个方面,即结构化、自描述性、可扩展性和浏览器自适应性。利用这些特性,XML把数据序列转化成一个可以传递的形式,并且使得它能够容易地在任何平台上被解码,对于系统之间的数据交换起到了很大的作用。正是由于XML语言出色的数据表示能力,它与Web服务紧密地结合形成了XML Web服务模型。

2) UDDI(统一描述、发现及集成): UDDI标准定义了Web服务的发布与查找的方法。UDDI提供了一种基于分布式的商业注册中心的方法。UDDI注册中心由UDDI规范的一种或多种实现组成,它们可以相互操作以共享注册中心数据,形成了UDDI业务注册中心。

3) WSDL(Web服务描述语言): WSDL是一种基于XML的语言,用于描述Web服务的接口和功能。

4) 作为Web服务的核心SOAP(简单对象访问协议):提供了一个基于XML的形式在分布式环境中交换结构化信息的机制。它通过提供一个有标准组件的包模型和通过在模块中对数据编码的机制,来定义一个简单的表示应用程序语义的机制。

1.3 基于 Web 服务的农业专家系统集成架构

本文提出了一种基于Web服务的农业专家系统集成方案。在该方案中,农业专家系统既是一个独立的农业信息平台,又是一个动态的、分布式和面向服务的系统框架。在新的框架中,农业专家系统中的方法、函数被封装为Web服务,通过UDDI注册并发布。其它的农业专家系统作为Web 服务的请求者,可通过UDDI进行查询,找到需要的内容,获得服务的WSDL信息,并自动生成代理类,形成服务的调用[5]。调用过程如图3所示。

调用过程包括以下步骤:

1) 应用程序执行代理代码中的函数,向它传递合适的参数;

2) 代理接收到调用,使用用户指定的参数格式化将要发送到Web服务的请求;

3) 函数调用从代理发送到Web服务;

4) Web服务使用代理提供的参数执行其可以通过Web调用的函数,并以XML格式构建结果;

5) 来自Web服务结果数据返回给用户处代理;

6) 代理分析来自Web服务的XML,获取生成的各个值;

7) 应用程序从代理函数处获得需要的值。

因此,客户端应用程序只需调用代理类方法,而不需直接操作冗长复杂的SOAP信息。在客户端应用程序来看,XML Web服务调用似乎就是对本地方法的调用,根本不用考虑该函数的系统异构性,但实际上这一调用对象可能是Internet上任何位置的XML Web服务[2]。

2 XML在异构数据集成中的应用

2.1 基于XML的异构数据集成方案

在基于 Web 服务的农业专家系统集成方案中,各个应用系统所使用的数据库运行的环境以及数据格式、语义等可能存在很大的差异。数据在各应用系统中进行传递的时候通常要进行转换,把XML作为应用系统之间数据交换的格式,克服了异构带来的障碍;从数据交换规范的角度来看,XML可作为各异构平台之间的数据标准。基于XML的数据交换大概描述是:信息发送方在数据被发送之前,把数据封装到XML结构中,这样数据可以被容易的处理,重新格式化。接收方接收到以后,再转化为自己所需要的格式。XML作为一种用来描述数据的标记语言,具有对数据进行统一描述的强大功能,同时可扩展性、结构化语义以及平台无关性的特点,充分满足了互联网和分布式异构环境的需求,成为网络数据传输和交换的主要载体。

XML是一种半结构化的数据模型。XML的诸多特性使得它可以描述不规则的数据,能够集成来自不同数据源的数据,可以将多个应用程序所生成的数据纳入同一个XML文件。系统实现基本框架如图4所示,共分为4层。

1) 数据源层:

该层提供系统数据,包括数据库、文本文档、Web数据等多种数据形式。

2) 通信层:

完成各类数据源与XML数据模型的转换,即图4中的专用接口模块。在这里,用XML描述集成数据,用XML文档和格式文件DTD表示集成模式与数据源之间的映射。XML数据模型与数据库的转换主要体现在XML的DTD和数据库数据模型的相互转换。从DTD转换到数据库模型的原理如下:一是从DTD生成一个关系模式,并在此基础上建立关系数据库;二是对DTD中的每一个元素,产生关系数据库的一个表和一个主键列;三是对每一个有混合内容的元素,产生一个独立的表,用来存储PC-DATA,并通过父表的主键与父表相连;四是对元素类型中的每一个单一值的属性,即对只具有PCDATA内容的按顺序出现的子元素,产生一个单独列,该列应该可以允许为NULL类型;五是对有多个值的属性和可以出现多次的PCDATA类子元素,需要创建一个单独的表来存储这些值,并通过父表的主键与父表相连;六是对每一个包含元素或混合内容的子元素来说,通过父表的主键把父元素与子元素连接起来。从数据库模型到DTD的转换相对容易一些,分为3步:对一个表,创建一个元素;对表中的每一列,创建一个属性或是一个只有PCDATA内容的子元素;根据表中的每一个主键/外键关系,创建该表元素的子元素。

3) 数据集成层:

该集成系统为用户提供根据特定集成应用而设计的一个虚拟集成视图。据不同用户的不同需求,可定义不同的XSL样式表,来屏蔽一些对象或对象的属性,改变对象的显示形式,提供不同的用户视图。

4) 应用层:

用户应用界面。

2.2 使用浏览器显示XML文档

调用Web服务返回的XML文档,可以被其它计算机系统读取,也可以在浏览器中直接显示出来,可以使用XSL文档为它指定多种显示形式。在笔者参与开发的《基于Web服务的保护地蔬菜栽培专家系统》中,调用webCropManner Web方法会返回以下XML文档:

可以在文档的第一行下面加入以下一行代码为该XML文档指定XSL格式文档[38]:

其中,“<xsl:value-of select="蔬菜栽培/栽培方式/蔬菜名称"/>栽培方式</h3>”指明将文档中“栽培方式”元素中的“蔬菜名称”子元素作为标题名称显示。“<xsl:for-each select="蔬菜栽培/栽培方式">”指明将栽培方式元素中的内容按照给定的表格形式显示出来[39,40,41]。其显示结果如图5所示。

3 结论与展望

介绍了 Web服务技术体系以及它在解决异构应用系统集成方面的优势,应用XML技术解决了农业专家系统集成中的异构数据集成问题,并且结合具体的应用实例探讨了XML和Web服务技术在农业专家系统中的应用可行性。Web服务提供一个中立的平台来集成应用程序,从而被用于集成不同的应用系统。农业专家系统的开发人员在项目设计的过程中采用先进的、低成本的农业专家系统集成方案,积极地尝试应用XML和Web服务技术,从而将组件的重用提高到一个新的水平 — 多个用户可以同时使用相同的组件,而且可以跨组织共享组件,提高开发效率。

摘要:阐述了Web服务在异构系统集成方面的优势,应用XML技术解决异构数据集成,并给出了使用多种方法显示XML文档的实例。针对农业专家系统中的互操作和信息共享问题,提出了基于XML和Web服务的农业专家系统集成思想。

关键词:农业专家系统,异构系统集成,异构数据集成,XML和Web服务

参考文献

[1]王明霞,蒋文科,郭卫,等.基于Web服务的农业专家系统集成方案研究[J].河北农业大学学报,2004,27(6):105-111.

[2]崔伟.基于XML和Web服务数据集成的研究[J].计算机与数字工程,2007,35(2):27-31.

[3]顾天竺.基于XML的异构数据集成模式的研究[J].计算机应用研究,2007,24(4):94-96.

[4]Russ.ASP.NET Web服务高级编程[M].北京:清华大学出版社,2003.

XML和Web服务 篇4

某省交管部门的中心数据库存储着省内各个城市的交通违章记录数据,交管部门通过公布Web服务,供其下属城市进行访问,进一步构建各类应用程序。出于对Web服务调用过程中数据安全性的考虑,需要对Web服务的安全性进行研究。

2 Web服务

Web服务本质上就是一个应用程序,它向外界暴露出一个能够通过Web进行调用的API,使得开发人员能够实现应用程序的互操作,并且是跨编程语言和操作平台的。在开发和调用Web服务时,主要涉及到几个关键的协议和技术:XML、SOAP、WSDL、UDDI。

3 XML加密

本系统所使用的XML加密(XML Encryption)方式是W3C制定的标准。加密后,不会破坏原有的XML文档格式,只是相关内容会被密文替换。

XML加密主要有三种:加密XML文件、加密对XML元素以及加密XML内容。本文将主要讨论对XML的元素进行加密的方式来实现Web服务的安全性。

3.1 对XML的元素进行加密

3.1.1 Encrypted Data元素

对XML元素实现加密是借助Encrypted Data元素完成的。该元素的层次结构如图1所示。

图中Encrypted Data元素是被加密对象的根元素。其子元素Encryption Method中描述具体点加密方法。子元素Key Info中存放对称密钥,Key Info元素的子元素Encrypted Key存放被保存的密钥的信息。要加密的数据包含在Cipher Data元素的子元素Cipher Value中。

3.1.2 对XML元素进行加密

对XML元素进行加密的步骤。

1)从原文档中使用xpath找到要加密的元素。

2)对该元素的内容使用keyinfo中的对称密钥和Encryption Method中的加密方法进行加密。

3)对上一步中的对称密钥使用公开密钥进行加密。

4)将加密后的数据以及加密后的对称密钥保存在Encrypted Data元素中。

5)将要加密的元素替换为Encrypted Data元素。具体加密流程如图2所示。

3.1.3 对XML元素进行解密

对XML元素进行加密的步骤。

1)在加密后的XML文档中找到元素Encrypted Data。

2)通过公开密钥解密对称密钥。

3)通过解密后的对称密钥对数据进行解密。

4)将解密后的元素替换掉Encrypted Data元素。

4 具体实现

4.1 实现思路

以下为请求一个Web服务操作后返回的XML文本内容:

其中fkje表示罚款金额,dsr表示违法人,hphm表示号牌号码。

如果想要将XML文件中的元素进行加密,就需要用元素取代元素,加密后的信息以Base64格式编码后存放在元素中。加密后的文件内容如下代码所示:

4.2 核心代码

4.2.1 加密

1)加载要加密的surveil.xm文档,并选择要加密的hphm元素:

2)设置秘钥名称以及与rsa算法的映射关系:

3)使用第2步映射表中定义的密钥hphm元素进行加密:

4)使用Encrypted Data元素替代hphm元素:

4.2.2 解密

1)加载已被加密过的surveil.xm文档:

2)设置秘钥名称以及与rsa算法的映射关系:

3)对文档中的Encrypted Data元素进行解密,并得到解密后的XML文档内容:

4.2.3 运行结果

通过解密,在客户端可以得到解密后的XML字符串,然后即可通过相应的XML操作实现对相应违法内容的查询并通过界面进行显示。在图3中输入车辆识别代号,然后点击查询,此时通过调用相关Web服务方法并解密返回的XML元素内容得到违法详细信息。在图4中对所查车辆的违法信息进行显示。

5 结束语

本文通过对XML元素进行加密的方式保证了Web服务的安全性。下一步可对加密算法进行进一步的研究。

摘要:Web服务使开发人员能够建立一种面向服务的、平台无关的、分布式的应用程序架构,另一方面Web服务使用XML在网络中进行数据交换,如何提高Web服务的安全性则成为需要解决的关键问题。本文论述了基于对XML文件中的元素进行加密的策略,从而保证了Web服务安全性。

关键词:Web服务,加密,XML

参考文献

[1]李霞.一种Web服务通信安全的优化方案[J].计算机科学.2012,39(8):59-61.

[2]贺正求.Web服务安全问题研究[J].计算机科学.2010,37(8):32-39.

XML和Web服务 篇5

对用户进行身份验证是Web服务实现安全性的第一步。它的原理主要是首先检查用户的凭据,然后根据某种规定的原则来验证那些凭据的有效性,以便能分辨出用户的身份是否合法。Windows平台本身提供了一些内置的身份验证机制,通过其自带的IIS服务器配合Web.config文件可以使用多种身份验证机制:但是,对互联网而言,利用SQL数据库执行自定义身份验证显然要灵活和方便得多。可以将自定义的凭据(用户名、密码等)传递给Web服务,让Web服务内部的程序逻辑验证用户身份。要将身份验证等额外数据信息发送到Web访问,SOAP头是一种较为理想的方式。

SOAP协议是一种在分布式环境中进行信息交换的基于XML的轻量级协议,由封包(envelope)和编码机制(encoding mechanism)组成。在SOAP协议与HTTP协议结合使用的情况下,Envelop元素作为根元素是由必选的Body元素和可选的Header元素组成。Header元素作为SOAP消息Envelope元素中的第一个子元素,其中包含一些不与特定消息直接相关的附加消息,紧接着的Body元素中则包含特定消息的具体数据。

2 基于角色安全授权

通过身份验证的合法用户是否能够执行所请求的操作或得到所需的资源,这取决于该用户所拥有的权限。而授权则是先判定该用户是否拥有所需权限并根据情况授予其系统资源的访问能力。NET技术支持的授权主要有:Windows NT安全功能、基于角色安全功能、代码访问安全功能以及ASP.NET应用程序中配置授权。在商用的Web应用程序中常常使用角色来强制策略。

经过验证的用户信息被封装到身份(Identity)对象中,Web服务可以使用Windows身份类型和通用身份类型。由于程序逻辑需要通过执行数据库查找来对用户身份进行验证,本文选用基于自定义身份验证方法的通用身份类型。角色(Role)定义了应用程序中一组在安全设置方面拥有相同权利的用户。由相关身份对象表示的用户身份和与用户相关联的角色一起组成了主体(Principal)对象。.NET下基于角色的安全性就是通过生成主体信息供当前线程使用的方式来支持授权的。

3 加密

身份验证和授权的使用能够防止未经授权的用户访问系统资源,但SOAP协议封装是建立于HTTP协议之上的,而HTTP协议中的信息默认以明文方式传输。包含在SOAP头中的身分信息如果以明文方式传输容易被中途截获,所以为了确保数据传输的安全必须使用加密技术。

数据加密标准(data encryption standard,DES)曾被美国国家标准局(NBS,现为国家标准与技术研究所NIST)确定为联邦信息处理标准,自从1977年正式作为标准公布以来,得到了广泛的应用,成为最重要的对称密码算法。三重数据加密标准(3DES)密钥的长度增加到112位或者168位,可以有效克服穷举攻击,并且增强了抗差分分析和线性分析能力。在.NET Framework的命名空间System.Security.Cryptography中提供了抽象类TripleDES作为三重数据加密标准算法的基类,实现方法如下:

设计一个加密函数,能够将明文的用户凭据字符串(p_strEncrypt)加密为密文并以返回值的形式获取。

4 结束语

利用微软的.NET平台可以快速、高效地为企业架构XML Web服务,实现分布式计算。但同任何Web应用程序一样,为防止意外或故意误用Web服务,XML Web服务需要采取安全保护措施。本文根据XML Web服务自身的特点,从身份验证、授权、加密等三方面确保了XML Web服务的安全性。

参考文献

[1]微软公司.XML Web Service开发[M].北京:高等教育出版社,2004.

[2]吉杰,林洽欣.用三重DES加密.NET数据库连接字符串[J].计算机工程与设计,2007,28(4).

[3]钱权,严家德.Web Service的安全机制[J].计算机工程,2007,33(22).

XML和Web服务 篇6

关键词:Web Services,SOAP,UDDI,WSDL,数据交换

0、引言

Internet的发展使得人们对B/S架构的系统更加青睐, 其为用户提供统一的浏览界面。具有易维护、节省投资、跨地域广等优点。然而, B/S架构的系统也有其自身的缺陷, 如数据处理的方便性, 系统操作的安全性等。而这些正是C/S架构系统的优势。本文正是借助于Web Services技术把两种架构的系统无缝的结合起来, 充分发挥各个系统的优点。大大减少了"信息孤岛"。

1、Web Services的工作原理

Web Services[1]是自包含的、模块化的应用程序, 它可以在网络 (通常为Web) 中被描述、发布、查找以及调用。Web Services是基于网络的、分布式的模块化组件, 它执行特定的任务, 遵守具体的技术规范, 这些规范使得Web Services能与其他兼容的组件进行互操作。

Web Services体系结构基于三种角色[2]:服务提供者、服务请求者和服务注册中心之间的交互。它们之间的交换流程为[3]:

(1) 服务提供者定义Web Services服务描述并把它发布到服务注册中心 (UDDI) ;

(2) 服务请求者使用查找操作来从服务注册中心 (UDDI) 获取服务描述, 绑定服务;

(3) 服务请求者调用服务提供者的服务;

Web Service的提供者、消费者和服务注册中心三者之间的关系如图1所示:

2、Web Services协议

Web Services主要是有以下几种Internet开放性的标准构成:

(1) WSDL:WSDL[4]为一个约定, 说明发送到Web Services的SOAP消息以及如何交换这些消息。

(2) SOAP:SOAP[5]是以XML格式编码, 包含请求服务器的方法调用和返回到客户机的数据。

(3) UDDI:UDDI[6]描述企业提供的服务, 公布其希望以何种技术规格与其他企业交易。

3、Web Services的优势

Web Services之所以成为未来网络发展的方向, 其主要具有以下几个特点[7]:完好的封装性;松散耦合;应用程序集成;使用协议的规范性。

Web服务建立在传统Web编程模型的松散耦合特性之上, 并将这种特性运用于其他的应用程序。

Web服务和传统的Web应用有三个主要区别[8]:

(1) Web服务采用SOAP消息而不是传统Web的MIME (Multipurpose Internet Mail Extensions) 消息;Web服务的传输协议并不仅仅采用HTTP;Web服务提供了信息产生和使用时的元数据描述。

(2) Web服务并不制定传输协议。

(3) Web服务是自描述的。它提供了信息产生和使用时的元数据描述, 这种消息交换模式表达了Web服务具有的行为, 使用的物理传输协议和逻辑访问地址。

4、Web Services的体系结构

Web Services是一个通用数据交换平台, 它对外提供统一的编程接口。外部系统通过使用SOAP/HTTP与之交互。下图2是Web Services的体系结构。

数据交换适配器:数据交换适配器是Web Services与外部系统的接口, 用于内部的数据集和外部数据源之间的桥接以便接收和提交数据。

XML文档解释器:负责提供XML格式解析和XML中间格式转换功能。

数据路由:数据路由包括两项基本内容:寻径和转发。寻径即判定到达目的地的最佳路径, 由路由选择算法来实现。

安全服务:数据安全是Web Services的一个重要组成部分。它建立基于PKI的完善的安全体系, 能确保数据交换过程中具有良好隐藏性和完整性。

数据交换中心:数据交换中心是Web Services的核心部分。数据交换中心通过标准化的Web Services接口为每个数据交换节点提供服务。

5、具体应用

随着能源利用情况的紧张, 节约能源降低污染, 美化环境。同时加大政府对用能企业的监控力度, 设计实现了能源利用情况网上申报系统 (B/S) 和企业节能减排管理信息系统 (C/S) 。这样设计的系统充分发挥了两种架构的各自优点, 也为两个架构系统的整合应用带来了困难。针对这种局面我们设计了Web Services的中间件功能, 实现两个系统的无缝连接。

下图3是两个系统的应用结构图 (上接第102页)

企业能源利用情况网上申报系统为赣州市各地区的用能企业提供统一的能源申报界面, 企业只需通过浏览器登录到赣州节能网进行申报即可。企业能源管理系统将企业申报的数据通过Web Services接口进行调用。将远程数据本地化, 并加以利用处理。

目前该系统正在实际运营当中, 通过Web Services技术有效地融合了两个系统的资源方便了用户的操作, 又满足了数据安全的要求。

6、总结

系统集成是软件技术发展的重要方向, 针对传统的基于共享中心数据库的集成方法的不足, 本文提出了基于Web Services的系统集成, 并开发了基于Web Service的异构数据交换平台介绍了Web Service的详细结构和具体应用。并将C/S与B/S有机的结合起来形成一个整合的C/B/S系统。

本文作者创新点:采用XML Web Services等技术实现异构信息融合。从而达到对异地用户数据申报信息的管理。

参考文献

[1].陈大伟基于Web Service的EDI系统的设计和实现[D].中国海洋大学, 008:11.

[2].陈晓纪任永昌基于Web Service的企业资源管理平台的研究与应用[J].中国管理信息化, 008.

[3].钟慧玲黄晓宇蔡文学周殷华一个基于Web Service的数据交换平台[J].微计算机信息, 007.

[4].CHRISTENSEN E, CURBERA F, MEREDITH G, et al.Web service ef-inition language (WSDL) 1.1[EB/OL].http://www.w3.org/TR/2001/NOTE-wsdl-20010315, 2006.

[5].DON B, EHENBUSKE D, KIKAVAYA G, etal.Simple object access roto-col (SOAP) 1.1[EB/OL]. (2000-05) .http://www.w3.org/TR/soap/, 2006.

[6].Tom Bellwood, Luc Clement, David Ehnebuske, et al.;UDDI version 3.0published specification.[M];www.uddi.org;2002.

[7].贾素玲王强XML技术应用[M].北京:清华大学出版社, 2007:215.

XML和Web服务 篇7

关键词:XML,WEB开发,WEB应用

一、引言

Web服务经常从它的组件技术的角度来进行描述。XML以及HTTP各自组成了Web服务体系的一部分, 它们都发挥了重要作用。让我们看看XML技术对Web服务平台的贡献。

二、XML在WEB开发中的重要性

1、标准化

与其它Web服务技术相比, 标准化是XML特色之一。XML提供了Web服务应用程序之间传输数据的标准格式。万维网联盟 (W3C) 管理XML标准并发布给全球的XML技术提供者, 这就确保了XML产品的兼容性。除了XML引擎和产品外还有XML文法 (grammar) 。每一个XML语法都是一种在某个特定问题领域进行数据格式化的标准方法。遵循并采用XML文法, 你就可以使两个应用程序间通信的数据格式标准化。

2、接口协议

从编程的角度出发, 接口在没有暴露实现的情况下提供了编程结构。如果使用DTD (文件类型定义) 和大纲 (schema) , 那么XML就有类似的特性。DTD和大纲都用来描述XML文档的结构以及XML文档的建立规则。可以用一个 (或者多个) 相关DTD (或者大纲) 组织这样的规则集合, 我们称之为XML文法。XML文法不仅可以用于应用程序之间通信的标准化, 还可以为开发者提供一个接口协议。换句话说, 开发者在创建一个需要使用XML文档结构的应用程序时, 他不需要知道文档是如何实现的 (即实际的XML文档) 。DTD以及大纲描述了文档的结构, 它们可以作为开发的接口协议。对DTD的任何改动同时也改变了协议。

3、简化

XML文档的另一个重要方面就是它的简化特性。这里并不是XML的实现很简单, 而是说XML的概念和方法简单。例如, XML是基于文本文档的, 这就简化了打开XML文档并查看其内容的过程。用XML简化Web服务模型很方便, 这一点也很重要。Web服务天然就比单独的XML要复杂。假设XML和CORBA同样复杂, 而且其它Web服务技术的复杂度相同, 那么Web服务技术就会变得非常笨重。但是通过使用简单的搭积木的方法, 如XML、SOAP等等, 我们可以控制Web服务的复杂度在一个可以容忍的范围之内, 这样用它创建的应用程序不至于难以控制。

4、封装

封装是在开发Web服务的时候尤重要。从本质上来说, 封装指的是获得一个或者多个数据块 (chunks of data) 并把它们集合成一个简单对象的概念。封装与集合 (aggregation) 类似, 但是它们之间有一个重要的差别, 即封装一般意味着它没有外部依赖性。你可以创建带有外部依赖性的XML文档;但是在事务Web服务模型 (transactional Web services model) 中, 利用封装会显得更加明智。通过设计包装了依赖性的XML解决方案, 你一般都可以消除事务处理过程 (交易) 中的问题。强迫在交易中定位外部数据并使其与XML数据一致的方法是有害的, 尤其是在外部数据常常发生变动的情况下。如果把数据封装到XML文法中去, 就交易获得正确的数据。

三、XML在WEB中的应用

1、XML用于交换数据

通过使用XML, 可以在互不兼容的系统间交换数据。在现实世界中, 计算机系统和数据库通过互不兼容的格式来容纳数据。对开发人员来说, 其中一项最费时的挑战一直是在因特网上的系统之间交换数据。通过将数据转换为XML, 可以极大地降低这种复杂性, 并创建可被许多不同类型的应用程序读取的数据。

通过使用XML, 可以在因特网上交换金融信息。在不久的将来, 预计会有很多关于XML和B2B的应用。XML会成为企业间交换金融信息的最主要的语言。XML可被用来共享数据通过使用XML, 纯文本文件可用于共享数据。

3、XML可用于存储数据

通过使用XML, 纯文本文件可用于存储数据。也可使用XML将数据存储于文件或数据库之中。可以编写从数据仓库中存储信息的应用程序, 而普通的应用程序就可被用来显示这些数据。

4、XML可以将HTML与数据分离

XML和Web服务 篇8

随着现代科技的发展和网络时代的到来,一种新的监督形式应运而生,这就是网络监督。从网络监督问世之日起,就表现出特有的新鲜活力和巨大威力。要实现网络反腐与制度反腐进行有效对接,关键是要加快整合各种反腐资源,形成互相配合,互相支撑的查办案件力量,加快形成多角度、全方位、立体式的反腐倡廉格局[1]。从长远来说,网络监督要与其它手段一起形成合力,使其积极作用得到充分发挥,网络反腐也才能走上正确的轨道。因此,建立网络监督情报快速反应平台,可以及时利用网络情报信息,筛选腐败犯罪线索,同时能掌握舆论的主动权,使社会舆论朝着有利于维护社会稳定大局、有利于事件妥善处置的方向发展。

1 构建网络监督平台的关键问题

网络监督平台就是网络舆情信息采集系统,是新形势下的一种重要网络情报资源搜集手段,由舆情分析、舆情收集、分类和预警等过程组成。在具体的工作过程中,使用数据挖掘技术来实现网络舆情信息收集和分类。网络监督平台具有广阔的应用前景,但其平台的构建与开发也存在一些关键性技术问题。

(1)半结构化数据结构

Web上的数据与传统的数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据而且按照一定的组织有规律地集中或者分布存放,结构性很强;而Web上的数据非常复杂,没有特定的模型描述每一站点的数据,都各自独立设计并且数据本身具有自述性和动态可变性,因而Web上的数据不是强结构性的。但与此同时Web页面又是有描述层次的,单个网站也是按照各自的结构构架的,从而具有一定的结构性。因此,Web上存在的数据既不是完全结构化的也不是完全非结构化的,而是介于两者之间,一般称之为半结构化数据[2]。显然,面向Web的数据挖掘比面向单个数据仓库或者其他结构化数据集的数据挖掘要复杂得多。

(2)异构数据源问题

Web信息的获取渠道通常是多方面的,如应用数据库、页面html元素、Web服务器日志等,渠道的多样性反映了Web信息的数据源是异构的,对其数据加工处理也比较复杂。平台与异构数据源以及异构数据源间必须采用一种标准语言进行交互,才能有效地进行Web数据挖掘。

2 基于XML的Web数据挖掘

XML(eXtsible Markup Language)由若干规则组成,这些规则可用于创建标记语言,并能用一种被称作分析程序的简明程序处理所有新创建的标记语言[3]。XML能增加结构和语义信息可使计算机和服务器即时处理多种形式的信息。因此,运用XML的扩展功能不仅能从Web服务器下载大量的信息,还能大大减少网络业务量。以XML为基础的新一代WWW环境是直接面对Web数据的,不仅可以很好地兼容原有的Web应用而且可以更好地实现Web中的信息共享与交换。XML可看作一种半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取。

如图1所示,通过结合智能Spider技术和基于XML的数据析取技术,达到从Web网页上析取结构化数据的目的。

根据以上处理模型,将Web数据挖掘分为以下几个步骤:

(1)利用智能Spider从互联网上获得目标Web网页,这些网页可能是HTML文档或XML文档。

(2)将HTML格式的Web页面通过转换器转换成良构的XML格式。

(3)将良构的XML文档送往数据检验器和数据集成器进行检验和集成。

(4)通过C#语言中的ADO.NET将提取出的XML数据写入关系数据库,以备进一步进行文本数据挖掘。

HTML-XML转换器的实现是研究的关键,转换过程必须保证生成的文档是良构的,不存在任何二义性或错误,将获取的Web页面转换成XML格式不但可以满足上述要求,而且还可以通过已有的XML工具对转换后的XML文档作进一步的处理。以下是用c#实现的HTML-XML转换器的部分源代码:

3 构建网络监督平台

根据网络监督的特点,基于XML的Web数据挖掘技术,构建了网络监督平台的系统框架,使网络监督用户能够从浩瀚的网络环境中挖掘到自己需要的舆情信息。主要由三个子功能平台组成,如图2所示。

(1)垂直搜索平台。

利用智能Spider从Web文档中取回网页,调用XML数据集成模块,把有效网页信息文本序列化后按XML格式暂时存储在服务器硬盘上,等服务器空闲时再转存到信息数据库中以便从中挖掘。

(2)Web文本挖掘平台。

用于发现网页文本中的模式、规则或趋势,其目标是从非结构化或半结构化的文本信息中提取需要的舆情信息和知识,它主要由四部分组成:文本元信息提取模块、文本分析器、索引模块和索引库。

(3)监督预警平台。

通过舆情预警、舆情监测、舆情报告等手段,为网络监督部门领导和监察员提供经过总结的有针对性的舆情分析报告,实施报警和预测等相关操作,达到辅助决策的目的。

4 系统实现

网络监督平台系统采用三层体系结构的MVC模式设计实现。使用MVC模式的目的是实现客户、应用和数据之间的分离,使广大用户能够通过Web获取其需要的挖掘结果。客户端采用浏览器技术,其特点是减少了客户端维护和配置工作。应用服务器端用于实现数据预处理和数据挖掘等应用功能,这将有利于集中管理和维护升级。数据库服务器端用于实现XML集成数据存储和用户个人信息存储[4]。

4.1 系统平台搭建

系统采用的配置如下:

(1)客户端用户界面使用ASP.NET技术,实现界面的自然、友好、个性化的特点。

(2)应用服务器端以Windows 2003 Server+.NET2.0 Framework作软件支持平台,使用C#作为主要的编程语言实现系统的垂直搜索引擎和Web数据挖掘功能,并将垂直搜索引擎抓取的Web文档序列化为XML结构化文档存入数据库中[5]。

(3)数据库服务器端采用SQL Server 2005,它不仅具有数据仓库功能,而且具有完备的全文检索功能。SQL Server 2005支持XML,可以在关系数据表中存储XML文档,也可以从关系式数据中产生XML文档,以实现对XML数据的集成。

4.2 系统性能分析

本系统实现了根据舆情分析引擎处理后的结果生成报告,提供信息检索功能,根据指定条件对热点话题、倾向性信息进行查询,并浏览信息的具体内容,以提供决策支持。

网络监督平台针对全球中文博客、论坛、新闻资讯等进行深度数据挖掘分析,在第一时间把握网络舆情,及时发现负面言论信息,提高危机处理效率,全面掌控、监督网络舆论情报环境。系统具有如下优点:

(1)情报全面:覆盖互联网95%的中文社区,并每5分钟扫描一遍整个互联网,自动发现并收录新论坛、新博客,真正做到全方位立体式监督。

(2)监测精准:能有效清除垃圾信息与不相关信息,提高网络舆情监督搜索查准率,查准率是指搜索引擎搜索得到的有效页面和全部页面的数量比。以搜索火车票实名制热门话题为例,本系统的搜索查准率为86.3%,比通用搜索引擎(Google)的查准率72.8%要高出13.5%。

(3)性价比高:数据的抓取与处理全部由系统自动化完成,将非XML文档权威页面转换为XML文档,最终对集成的XML数据进行数据挖掘,提高了数据挖掘效率,降低了服务成本。

5 结束语

本文介绍了基于XML的Web数据挖掘技术及其在网络监督情报预警中的应用,并给出了网络监督平台系统框架图,最后对系统平台的实现和性能分析做了详细地阐述。通过Web挖掘技术能实现网络信息的深层次利用,高效实现网络监督。

参考文献

[1]毕竟.试论高技术传播时代的舆情预警[J].新闻记者,2006(4).

[2]Well V,Kersl R.Ethical issues in Web data mining[J].Ethic and Information Technology,2004(6):120-135.

[3]Extensible Markup Language(XML)1.0(Fifth Edition),W3C Recommendation[EB/OL].http://www.w3.org/TR/REC-xml,2008.

[4]崔建群,何炎祥,郑世珏,等.基于XML的Web数据挖掘关键技术的研究[J].计算机工程,2006,32(20).

上一篇:高职学生心理健康教育下一篇:理论和思路