服务匹配(精选7篇)
服务匹配 篇1
1 引言
面向服务体系结构(SOA)是网络环境下分布式应用系统的概念模型,在这个模型中松散耦合的系统组件在网络上被描述、发布和调用。实现SOA的主要方式是基于WSDL/UDDI的Web服务技术,Web服务的关键是服务的发现,基于语法级的服务描述语言和基于关键字的服务匹配算法导致了服务查准率低。语义Web服务综合了语义网技术和Web服务技术的优点,通过扩展UDDI,加入领域本体库,为每个注册服务添加语义信息等技术能够为Web服务的自动发现、执行、解释和自动组合提供有效支持。
本文首先介绍了基于推理的OWL-S/UDDI语义Web服务匹配算法,针对其同一级匹配结果间不能进一步区分的问题,提出了一种基于本体概念相似度计算的语义Web服务分级匹配算法。
2 相关技术概述
2.1 本体
目前较为公认的本体定义是Rudi Stuger于1998年提出的:“本体是共享概念的明确的、形式化的规范描述[1]”。通俗地讲,本体是为了让计算机对现实世界某一领域中的概念及概念间的关系有明确、一致的理解而进行的形式化、规范化的描述。本体的优点在于它能指导人们对某一领域的知识达到一致的认识和理解,并使用计算机进行描述和逻辑推理,从而达到语义Web的目标。
2.2 Web服务描述语言
实现语义Web服务的关键步骤是对Web服务进行语义描述。OWL-S是一种描述Web服务的本体语言,其前身是DAML-S,它为Web服务提供了核心的标记语言结构,用于精确描述Web服务的属性和能力,这些描述能被计算机无二义性的解释理解,从而实现服务的自动发现、执行和组合。这个描述至少包括三个方面语义:ServiceProfile提供服务的抽象描述,如服务实体、服务可以实现的功能,以及服务的性能参数等;ServiceModel描述Web服务如何执行,包括服务执行的先后顺序、过程流程等;ServiceGrounding描述了如何调用Web服务,描述具体的绑定信息,例如服务地址、通信协议及消息格式等。
2.3 OWL-S ServiceProfile
OWL-S Profile描述服务的三个基本方面:服务提供者的信息、服务的功能和服务的其他特征。ServiceProfile第一组属性描述Web服务提供实体,包括提供者名称(ServiceName)、描述文本(textDescription)和联系信息(ContactInformation)。ServiceProfile第二组属性描述服务功能,这是最本质的部分,表达了服务性能的两个方面:一是从信息流角度:输入信息Inputs和输出信息Outputs;二是从状态流角度:服务所需的前置条件Precondition以及服务执行后的结果Effect。ServiceProfile第三组属性描述服务的其他特征,包括服务分类ServiceCategory和服务等级QualityRating(提供服务质量信息)等。
本文将ServiceProfile作为广告发布在服务注册中心,并利用ServiceProfile的信息进行服务匹配。同时,服务请求也将ServiceProfile作为表达服务查询条件的语言,从而使服务匹配能够更加方便。
3 基于语义的Web服务匹配算法
3.1 基于推理的OWL-S/UDDI服务匹配算法
基于推理的服务匹配是利用本体概念间的包含关系来判断服务的请求方和发布方的匹配程度。Massimo Paolucci等于2002年首先提出了一种基于DAML-S的服务匹配算法[2],利用DAML-S的Service Profile对服务的输入、输出、前提、效果(IOPE)进行匹配。该方法定义了四种匹配程度(以输出匹配为例,设outR为请求者的一个输出,outA为服务发布者的一个输出):
1)Exact:当outR与outA相同或outR是outA的直接子类(subClassOf)时,结果为Exact。
2)Plug-In:如果outA包含outR,也就是说outA可能完全满足outR。
3)Subsume:如果outR包含outA,即outA能部分满足outR但不是完全满足。
4)Fail:在outR和outA之间没有任何包含关系,匹配失败。
随后,LeiLi等人对上述四种匹配类型进行了补充,在Subsume和Fail之间添加了Intersection,即outR与outA的交集是可满足的(outR∩outA≠Φ,但outR不包含outA),说明outA有可能满足outR的部分功能。从上述介绍可以看出,基于推理的OWL-S/UDDI服务匹配方法将服务间的匹配程度分为5个等级:Exact Plug-In Subsume Intersection Fail,但在同一等级内部无法进一步区分匹配度。
3.2 Web服务描述模型
在介绍匹配算法之前,先创建服务描述模型,将服务描述为:WS=.其中S是基本描述,是服务的公共属性,包括服务分类、服务名称,文本描述等。F是服务功能描述,即服务功能包括输入与输出,前提与结果等。NF是非功能的属性描述,如服务质量(QoS)。
3.3 Web服务匹配算法的分级匹配过程
算法的基本原理:服务请求者先提供一个OWL-S文档,对其所需服务进行描述。在预处理阶段,通过服务分类匹配(可通过属性ServiceCategory来判断)去掉不属于请求服务分类的注册服务,将分类符合的服务放入候选集中,首先进行基本描述匹配,经由基本描述匹配筛选的候选服务再参与功能匹配,合格的服务再进一步参与QoS非功能属性的匹配。下面详细介绍各部分的匹配过程。
3.3.1 基本描述的匹配
服务的名称和文本描述是已经在Web服务本体中的概念实体、概念属性以及概念间的关系,所以其计算的基础是概念间语义相似度。对于本体库中概念以及概念间上下位关系(subClassOf)形成的概念树,可用2个不同节点之间的距离来衡量节点概念间的相似度。因服务匹配的要求,定义概念树中节点的距离如下:
定义1概念树定义为一棵有向树,对于树中的每一条有向边
定义2对于概念树中的任意2个节点Vi,Vj的距离distance(Vi,Vj),定义为:
1)如果Vi与Vj为树中相同节点,则distance(Vi,Vj)=0
2)如果从节点Vi没有路径到达Vj,且从节点Vi也没有路径到达Vj,则distance(Vi,Vj)=∞
3)如果从节点Vi有路径到达Vj,则distance(Vi,Vj)为从Vi到达Vj的路径的长度。
4)如果从节点Vj反方向有路径到达Vi,则distance(Vi,Vj)为Vj从到达Vi的路径长度的负数。
定义3概念树中2个节点所表示的概念相似度函数定义如下,设结点Vi表示的概念为Cvi,结点Vj表示的概念为Cvj。
根据上式可算出广告服务与请求服务在服务名称(service name)和文本描述(text_description)两个方面的相似度。然后综合得到基本描述相似度如下:
其中AS是广告服务,RS是请求服务,Simsn(AS,RS)是服务名称的相似度,Simtd(AS,RS)是文本描述的相似度。SimBasic(AS,RS)的结果是0到1之间的实数值。其中wi是用户自定义的权值。
基本描述匹配算法描述:
3.3.2 服务功能的匹配
在这个阶段,使用基于WordNet和HowNet通过语义相似度的计算方法来计算请求服务与广告服务的匹配相似度。
WordNet是一个以同义词集合为单位来组织信息的语义词典,是基于英文的词汇语义网络系统。它为英语词语相似度的计算提供了便利。目前基于WordNet的相似度计算方法很多,如res、lin和jcn等方法使用WordNet中的上下位关系计算相似度;hso、lesk和vector等方法使用WordNet中包括上下位关系的所有关系计算相似度[3]。
为了在使用WordNet中所有信息关系的同时充分使用上下位关系,本文在计算英文信息的相似度时选择两个典型的方法:lin和lesk,其中对方法lin进行改进,再分别计算得到概念相似度Slin和Slesk,然后取Slin和Slesk的加权和作为英文概念最终的相似度值。
方法Lin是利用概率的方法计算两个概念的相似度。
在这里结合概念树中路径的方法,对Lin计算方法进行一些改进,得到下面公式。
在寻找词义Cvi和Cvj的共同上位词时,通过路径的方法,设定了一个系数αl/2。其中α是一个介于0和1之间的常数,用来调整随层次加深,相似度随之递减的程度,表示在某个同义词层次结构中,寻找词义Cvi和Cvj的共同上位词的最大路径。由于Cvi和Cvj两个词义,故乘以1/2。
HowNet是一个用以揭示概念与概念之间以及概念所具有属性之间的关系的常识知识库,是目前最完善的汉语语义知识词典。本文设汉语概念的语义相似度为Sch,使用刘群[4]等人提出的基于HowNet的语义相似度计算方法可得到汉语概念相似度值。最后对英文概念相似度值和汉语概念相似度值加权平均得到公式(4):
其中μi是用户自定义的权值。μ1+μ2+μ3=1,0≤μi≤1,i=1,2,3
设Ains表示广告服务输入参数的集合,Rins表示请求服务输入参数的集合,Aous表示广告服务输出参数的集合,Rous表示请求服务输出参数的集合,Aprs表示广告服务的前提条件参数的集合,Rprs表示请求服务前提条件参数的集合,Aes表示广告服务影响参数的集合,Res表示请求服务结果影响参数的集合。在这里需注意的是这四个参数都是本体中的概念而不是原子数据类型。基于公式(4),函数SimIOPE(AS,RS)可计算服务的功能性特征(IOPE)的匹配度,其参数是广告服务(AS)和请求服务(RS),其结果是0至1之间的实数值。
服务功能的相似度计算公式如下:
其中α1、α2、α3、α4分别是输入集、输出集、前提条件集、结果影响集的权值,
α1+α2+α3+α4=1,0≤αi≤1,i=1,2,3,4.权值可由用户决定,如果用户没有对权值的要求,则可采用默认的平均权值,即视这四个方面同等重要。
功能匹配算法描述:
由于PR和IO的匹配算法相似,在这里只对IO匹配加以说明。
3.3.3 非功能属性QoS的匹配
功能性的匹配只满足了请求服务方静态的常规要求,这些常规要求相对固定。而如果用户想要获得高质量的Web服务,还需要用一些非功能的属性来量化其服务功能,这就是Web服务的QoS(Quality of Service),文献[5]中Joge Cardoso给出了服务质量评价模型中应包括的因素,具体包括费用(cost)、时间(time)、可靠性(reliability)。这里再增加信誉度(Credit)因素。
函数SimQoS(AS,RS)计算广告服务AS和请求服务RS的QoS相似度。可通过分别计算AS和RS的QoS中各维相似度的几何距离来计算。函数返回一个0至1之间的实数,返回值越接近1,说明AS和RS越相似。
服务质量匹配算法描述:
4 算法性能分析
在评价服务匹配算法效率方面,通常用查准率和查全率来衡量一个Web服务匹配算法的好坏。查准率是指查询返回符合查询条件的Web服务数量与查询返回Web服务总数量的比率;查全率是指查询返回符合查询条件的Web服务数量与测试样本集中符合查询条件的Web服务数量的比率。查准率和查全率越高,服务匹配算法越好。为了验证本文匹配算法的有效性,设计了一个原型系统WSMS(服务匹配系统),本文选取医学诊断专家系统本体文件及100个可用于查询疾病诊疗方案的Web服务,对于本文算法和OWL-S/UDDI匹配算法进行仿真性能测试,测试结果如表1所示。
由此可见,本文算法综合考虑了服务的基本描述、服务功能和服务质量三个方面的相似度,具有较高的服务发现效率。
5 结束语
本文分析了基于推理的服务匹配算法的局限性,提出了一种基于本体概念相似度计算的服务匹配算法。实验结果表明该算法能过滤掉大多数不相关服务,缩小服务匹配范围,提高了服务匹配效率。下一步将完善算法和原型系统,考虑在语义网中存在多个异构本体情况下进一步改进服务匹配算法。
摘要:针对基于推理的OWL-S/UDDI匹配算法在同一级结果间不能进一步区分匹配度导致查全率和查准率不高的问题,提出了一种基于本体概念相似度计算的服务匹配算法,该算法分别按服务的基本描述、功能和非功能(QoS)三个层次进行匹配,提高了服务匹配效率。
关键词:语义,Web服务,OWL-S,服务匹配
参考文献
[1]Rudi Stuger,Richard Benjam ins V.Knowledge Engineering:Principles and Methods[J]..Data and Knowledge Engineering1998,25(2):161.
[2]Massimo Paolucci,Takahiro Kawamura,Terry R Payne.Semantic matching of Web services capabilities[C].In Proceedings of the First International Semantic Web Conference(ISWC).
[3]余晓峰.面向译文选择的双语语义词典自动构建研究[D].哈尔滨:哈尔滨工业大学,2005:30-42.
[4]刘群,李素建.基于《知网》的词汇语义相似度计算[J].Computational Linguistics and Chinese Language Processing,2002,7(2):59-76.
[5]Cardoso J.Bussler C.Semantic Web Services and Processes:Semantic Composition and Quality of Service[C].On the Move to Meaning-full Internet Computer2002.
服务匹配 篇2
近年来,随着Web服务相关标准的持续完善和支持Web服务开发的软件平台的不断成熟,Internet上的Web服务数量正在不断增长。Web服务发现的任务就是从Internet上数量庞大的服务群中找到满足用户需求的服务,其核心在于一个性能良好的服务匹配算法。目前的Web服务匹配算法主要分为语法级和语义级两类[1,2],语法级服务匹配利用基于关键字的精确匹配算法对服务请求和服务广告进行匹配,其查准率和查全率均无法达到令人满意的效果。对此,国内外学者展开了针对语义Web服务匹配算法的研究,文献[3]提出一种基于DAML-S (DARPA Agent Markup Language-Service)的经典服务匹配算法。该算法通过对本体中概念的包含关系的推理,给出服务请求和服务广告之间的匹配等级,通过返回不同匹配等级的服务提高了服务的查准率和查全率,但其最大的缺点在于不能反映出服务之间的精确匹配度。对此,文献[4,5]通过定义不同形式的语义距离来计算本体概念间的相似度,以一种量化的数值形式反映出相同或不同匹配等级之间概念的细化匹配程度,从而反映出服务之间的精确匹配程度。总体来说,这类方法的性能比语法级服务匹配算法有了较大提升,但它们只注重用于服务匹配的领域本体概念间的子类关系,忽略了概念间存在的其它多元关系,导致概念的语义不能被完整地反映出来,影响了算法的匹配性能。
本文利用本体概念间的多元关系(重点考虑了部分/整体关系、同义关系和子类关系)定义了一种语义距离,通过该语义距离计算出概念间的语义相似度,并在此基础上提出了基于语义相似度的Web服务匹配算法。最后,通过与文献[4]中算法的对比,并以实验验证了本文算法的可行性和有效性。
1Web服务本体语言OWL-S
语义描述是实现语义级服务匹配和语义Web服务发现的重要前提。目前,Web服务语义描述规范中最具有代表性的研究成果是OWL-S[6](Web Ontology Language for Services)。OWL-S是一种基于本体论思想构建的Web服务上层本体,如图1所示。从Service Profile、Service Model和Service Grounding三个方面对服务进行刻画。Service Profile描述一个服务能够做什么;Service Model描述一个服务是如何工作的;Service Grounding描述如何访问一个服务。
Service Profile主要通过其子类Profile来刻画一个服务的相关信息,包括服务的基本描述信息、功能描述信息和一组服务属性。其中,功能描述信息包括服务的输入参数集、输出参数集、前提集和结果集IOPEs(Inputs、Outputs、Preconditions、Effects)。Profile并未直接提供描述IOPEs实例的规范,所有的IOPEs实例都是在Service Model中创建,Profile只是通过hasInput、hasOutput、hasPrecondition和hasEffect属性指向IOPEs实例。
Service Model主要用来描述服务的内部流程。在Service Model中,Web服务被建模为一个过程。过程共分为三类:原子过程、简单过程和复合过程。所有的IOPEs实例都是在过程中创建。
Service Grounding描述了访问一个Web服务的具体细节,例如协议、消息格式、序列化、传输、寻址等。
2基于语义相似度的Web服务匹配
本文基于OWL-S规范描述Web服务,通过服务功能参数集的匹配实现Web服务匹配。
定义1 Web服务WS(Web Service)是一个四元组,WS=(SI, SO, SP, SE),SI、SO、SP、SE分别是Web服务的输入参数集、输出参数集、前提集和结果集。
定义2 服务请求WSR(Web Service Request)是一个四元组,WSR=(RI, RO, RP, RE),RI、RO、RP、RE分别是服务请求的输入参数集、输出参数集、前提集和结果集。
服务请求方和提供方通常都会采用领域本体来描述服务功能参数集中的参数[3,4,5],所以参数间的相似程度就可以直接通过本体概念间的相似程度来进行衡量。本文假设服务请求方与服务提供方采用共同的领域本体来描述服务功能参数集中的参数。本文的基本思想为:通过计算本体概念间的语义相似程度来反映出与概念相应的功能参数间的相似程度,进而计算出WS与WSR的匹配程度。
2.1本体概念间的语义相似度
领域本体描述了特定领域中的概念和概念与概念之间的关系。概念间存在着的关系复杂多样,除了子类关系外,还存在着其它多种关系,这使得在实际中本体概念的组织形式并不完全是一个树型结构,而是一个网络结构[7,8]。其中,子类关系构成网络中的主关联,体现了网络中概念的层次结构;其它关系则构成了网络中的辅关联。图2是一个本体的网络结构示意图,网络中的结点对应于概念,连接结点的边对应于某种关系,本文重点考虑了概念间的部分/整体(part of)关系、同义(equivalent class)关系和子类(sub class of)关系,对其余类型的关系不加区分。
本体概念间的语义相似度可以通过语义距离来衡量[4,5,9]。语义距离的定义并没有统一的标准,一般而言,两个概念间的语义距离越小,它们的语义相似度越高,反之则越低。
2.1.1 语义距离
本文利用本体概念间的多元关系来定义语义距离。从图2容易看出,任意两个概念间可能存在着多条路径(本文中提到的路径均指无环路径),每条路径又包含n(n>0)条边。本文首先给出一个关于边的权值计算式weight(edgei)。该式的计算与边所表达的关系类型和边在网络中所处的层次深度有关:
其中,edgei是某条路径所包含的第i条边,type(edgei)是边(关系)类型系数,H(edgei)是边在网络中所处的层次深度。
不同的边(关系)类型对weight(edgei)产生的影响不同,所以有:
定义3 边在网络中的层次深度H(edgei)等于它所连接的两个结点中层次较浅的那个结点在网络中所处的层次深度。
例如在图2中,连接结点C1和C5的边的层次深度等于C1的层次深度,即H(edge)=Min{H(C1), H(C5)}=1。
设:CS与CR是领域本体中任意两个概念,CS用于描述SI(SO/SP/SE)中的一个参数,CR用于描述RI(RO/RP/RE)中的一个参数。通过2.1节可知,子类关系构成了本体网络中的主关联,因此,任意两个概念CS与CR都可以通过一条全部由表达子类关系的边所构成的路径连接起来。
定义4 连接任意两个本体概念的路径中,全部由表达子类关系的边所构成的路径称为标准路径。
定义5 任意两个本体概念CS与CR之间的语义距离是连接它们的某条路径上所有边的权值总和:
(2)
显然,语义距离取标准路径时的权值满足:
本文在这里约定:
当CS与CR之间除标准路径外,其余路径的权值均≥2时,CS与CR的语义距离取标准路径的权值;
当CS与CR之间除标准路径外,还存在其它路径的权值<2时,CS与CR的语义距离取所有路径权值中的最小值;
综上所述,可以得出:CS与CR的语义距离distance(CS, CR)<2。
2.1.2 语义相似度
根据语义距离计算本体概念间的语义相似度:
其中,α>1,是一个可调节参数。
进一步研究发现,式(3)不能区分下列情况,例如在图2中,CS=C2和CR=C14的语义相似度与CS=C14和CR=C2的语义相似度相同。但主观上,当CS是CR的直接/间接父类、或H(CS)<H(CR)时,其相似度应该高于CS是CR的直接/间接子类、或H(CS)>H(CR)时的相似度。为体现这种区别,定义了一个系数β:
其中,H(*)是概念所处的层次深度。式(3)变为:
例:取α=2,对图2而言有,Sim(C2,C2)=1,Sim(C9, C10)=1,Sim(C2,C14)=0.83,Sim(C14,C2)=0.73,Sim(C14, C15)=0.90,Sim(C17,C18)=0.87,Sim(C14,C18) =0.55。
2.2基于语义相似度的Web服务匹配算法
根据定义1和2,将服务请求(WSR)和Web服务(WS)之间的相似度定义为:
通过式(5),WS与WSR的相似度计算转化为Sim(SI,RI)、Sim(SO,RO)、Sim(SR,RP)和Sim(SE,RE)的计算,分别表示WS与WSR的输入参数集、输出参数集、前提集和结果集之间的相似度。
Web服务匹配算法描述如下:
输入:服务请求(WSR)和Web服务(WS)库;
输出:满足请求的服务列表。
1) 设定匹配阈值threshold。
2) 如果服务库不空转步骤3),否则转步骤10)。
3) 从服务库中取出一个服务,将服务库中的服务个数减1。
4) 设:SI={Si1,…,Sin},RI={Ri1,…,Rim},Sij和Rii分别是SI和RI中的任一参数,1≤j≤n,1≤i≤m;构造相似度矩阵M:
其中,Sim(Sij,Rii)是SI中第j个参数与RI中第i个参数的语义相似度,通过式(4)计算。
5) 从M中选出一个最大值并将其记录在数组value [Min(n,m)]中,删除该值所在的行与列得到新的矩阵M’;重复此操作直到记录Min(n,m)个值为止;如果出现最大值相同的情况,以行号为先后顺序进行选择,行号越前优先权越高。
(注:SI与RI中的参数个数不一定相等,因此要对两个参数集中的参数进行两两配对,步骤4)~5)的目的在于实现参数的两两配对)。
6) Sim(SI,RI)
其中,value数组取自步骤5)。
7) 计算Sim(SO, RO)、Sim(SR, RP)和Sim(SE, RE),方法与Sim(SI, RI)相同。
8) 利用式(5)计算Sim(WS,WSR)。
9) 如果Sim(WS,WSR)≥threshold,将该服务记录在用户服务列表中,转步骤2)。
10) 如果服务列表不为空,返回给用户。
11) 结束。
3实验结果与分析
软硬件环境:P4 2.66 GHz CPU,768 M内存,Windows 2000,JDK 1.5 ,Eclipse 3.0。
测试服务集:OWL-S Service Retrieval Test Collection Version 2 (OWLS-TC V2)[10]。OWLS-TC V2是基于OWL-S规范构建的服务测试集,共包含576个Web服务。本文选取其中旅游领域包含的106个服务作为本次实验的测试服务集。
领域本体:利用本体编辑器Protégé 3.4.2,在OWLS-TC V2提供的与旅游相关的本体基础上补充了一些类和关系,构建起领域本体。领域本体中涉及到的关系包括子类关系、同义关系和部分/整体关系等。
文献[4]中提出的算法将经典算法[3]中的逻辑匹配巧妙地转换成了相似度匹配。算法中的匹配等级既保持了经典算法中匹配等级的合理性,又提供了精确的数值匹配度,因此本文选择与文献[4]的算法在性能上进行一些比较。
分别从地图、旅馆、天气和目的地几个方面对服务集进行了查询。实验中,本文算法的匹配阈值threshold分别取为0.2、0.4、0.6、0.8,文献[4]算法的匹配精度也分别取为0.2、0.4、0.6、0.8。实验结果如表1所示。
由于OWLS-TC V2中所有Web服务的功能信息中只包含了输入集/输出集的信息,不包含前提集/结果集的信息,所以在实验过程中,本文算法中的式(5)改为:
文献[4]算法和本文算法的平均查全率分别为73%和84%,平均查准率分别为81%和79%,两种算法的平均查准率相近,本文算法的平均查全率较高。分析得知,文献[4]的算法只注重用于服务匹配的领域本体概念间的子类关系,忽略了概念间的其它多元关系,导致概念的语义不能被完整地反映出来,从而影响了算法的查全率。本文算法在对服务进行匹配时利用了本体概念间的多元关系,因而在整体性能上较好。
4结语
服务匹配算法是Web服务发现的核心技术。本文提出的基于语义相似度的Web服务匹配算法,利用本体概念间的多元关系定义了一种语义距离,在此基础上,给出概念间的语义相似度计算方法,进而通过计算与服务功能参数集中参数相应的本体概念间的语义相似度实现了Web服务的匹配。实验的结果表明,与文献[4]中的算法相比,本文提出的算法具有较好的整体性能。本文主要针对服务的功能匹配进行了研究,但没有考虑到服务的QoS属性,所以下一步工作是研究服务的QoS匹配,以使服务匹配算法进一步完善。
参考文献
[1]廖祝华,刘建勋,刘毅志,等.Web服务发现技术研究综述[J].情报学报,2008,27(2):186-192.
[2]吕庆聪,周集良,杨帆,等.普适计算机服务匹配技术研究[J].计算机科学,2009,36(11):182-185.
[3]Paolucci M,Kawamura T,Payne T R,et al.Semantic Matching ofWeb Services Capabilities[C]//Proceedings of the First InternationalSemantic Web Conference(ISWC).Sardinia,Italia,2002:333-347.
[4]彭晖,史忠植,邱莉榕,等.基于本体概念相似度的语义Web服务匹配算法[J].计算机工程,2008,34(15):51-53.
[5]黄志成,李华.改进的语义Web服务匹配算法设计与实现[J].计算机工程,2009,35(20):88-90.
[6]Martin D,Burstein M,Hobbs J,et al.OWL-S:Semantic Markup forWeb Services[EB/OL].[2004-11-22].http//www.w3.org/Submission/OWL-S/.
[7]顾金睿,王芳.关于本体论的研究综述[J].情报科学,2007,25(6):949-956.
[8]刘汉兴,林旭东,田绪红.基于本体的自动答疑系统的研究与实现[J].计算机应用,2010,30(2):415-418.
[9]姜华.一种基于本体的概念语义相似度计算研究[J].计算机应用与软件,2009,26(7):143-145.
服务匹配 篇3
近年来,随着云计算、物联网等技术的成熟,一种面向服务的网络化制造新模式—云制造应运而生。云制造技术能够实现各类制造资源智能化管理和经营,为制造业由生产型向服务型转变,提供了一种新的思路[1]。在云制造模式下,用户能够根据需求,随时随地、动态、敏捷地使用云端制造资源池中的制造资源,充分体现了“分散资源集中使用,集中资源分散服务”的制造理念[2,3]。
云制造服务资源匹配是实现云制造的核心技术之一,它是指在云制造环境下,将用户个性化的需求与功能多样、种类繁多的云制造服务进行匹配[4],以寻求最能满足需求的制造服务。国内外许多学者对服务资源匹配进行了大量的研究。文献[5]利用本体概念之间的包含关系,确定输入输出语句的匹配度,从而确定服务请求和服务资源的匹配等级(共四个等级)。此方法时效性强,但对于同一等级的服务匹配不能细致区分。文献[6运用语义描述语言来定义语义距离,以实现近似服务匹配。因人工建立的语义距离会增大不确定性因素和工作量,所以此方法可靠性和实用性比较差。文献[7]使用过程本体进行查询请求和Web服务的描述,提出一种基于过程本体的服务发现方法。此方法极度依赖所建立的过程模型,方法实现的难度较大。文献[8]建立了制造工艺约束信息模型和匹配资源能力信息模型,提出一种制造资源能力对于制造工艺要求的匹配程度评价和计算方法,用以解决虚拟企业联盟中制造资源和制造工艺的匹配问题。文献[9]采用Web本体语言对网络化协同产品开发资源进行描述,利用扩展UDDI的方法进行资源的语义级别匹配。
综合上述,当前大多数的匹配研究都是从技术的整体角度出发,虽然能够实现全局的资源匹配,在资源匹配的模型、定性描述等方面研究得较为深入,但在具体的资源匹配过程、量化的匹配算法方面的研究还不够充分,并且大部分研究方法的时效性、实用性、实现难易度都不能令人满意。因此本文从产品研发过程中设计人员发出的设计需求入手,首先分析云制造服务资源的分类,并引入本体对云制造服务资源进行语义描述。在此基础上,建立云制造环境下需求和服务的匹配模型,从基本信息、功能属性、服务质量三个层次对设计需求和服务资源的匹配进行定量研究。
1 云制造环境下设计需求和服务资源的匹配模型
1.1 云制造需求的分类
云制造服务资源与客户的需求任务密切相关,按照客户在使用平台时的任务种类,将云制造需求分为三类,包括:云设计需求,云制造需求和云购买需求[10]。云制造需求是客户通过给平台提供制造加工所需的信息(工艺过程,工艺参数等),平台返回零件或产品。云购买需求是指客户通过提供产品信息(价格、材料等),直接在平台上购买产品。云设计需求是指客户通过提供一系列需求和指标,如应用环境,工作压力,大小,使用寿命等,要求平台提供设计说明书、3d模型或者包括参数,工艺过程等可直接制造加工的文件包。这类客户群不需要对相关机械、产品研发知识很了解,仅仅需要知道满足的工况条件以及工作任务或者外观需求等。此类需求与服务资源的匹配度是本文研究的对象。
1.2 云制造服务资源的分类
借鉴以往对制造资源分类的研究成果,如文献[8,11],以及产品设计对资源的需求,本文将面向产品研发的云制造资源分为三大类,分别为:软件资源、知识资源和人力资源。其中,软件资源是指在产品设计中用到的软件。知识资源包含产品研发过程中用到的所有的非物质技术资源。
1.3 基于本体的需求和服务匹配框架
面向产品研发的云制造服务匹配过程主要包含三个参与角色,需求方、服务提供方和云制造平台,需求方和服务方分别通过云制造平台发布自己的需求和服务,云制造平台对用户需求和服务资源进行语义匹配,返回给需求方最合适的资源。面向产品研发的云制造服务语义匹配框架如图1所示。该框架由两大模块组成,分别为产品研发云制造服务本体库和云制造服务语义匹配模块,具体分析如下:
1)产品研发云制造服务本体库
针对云制造平台上的服务功能各异、种类繁多,缺乏统一的定义和描述方法的现状,构建产品研发云制造服务本体库,通过本体库提供领域内的共享概念知识,使需求和服务间的概念能够在语义层次上进行匹配。产品研发云制造服务本体使用OWL语言描述,能够规范地描述领域概念、概念的实例、概念的属性等。其中,属性是包含同义词、性能参数、作用等。如图2所示为面向汽车零部件研发的云制造服务的顶层本体片段(因篇幅所限,只列出部分概念)。
2)云制造服务语义匹配模块
语义匹配模块根据本体库提供的概念语义信息,将需求描述和服务描述中对应的信息进行语义匹配,确定信息间的语义匹配程度。该模块包括三个部分,服务和需求描述、语义匹配引擎、匹配结果排序。其中,语义匹配引擎是产品研发云制造服务语义匹配的核心部分,该引擎所执行的语义匹配方法及具体算法将在下一节中详细研究。
需求和服务描述需参照图3,规范化描述的需求单元和服务单元是语义匹配的基础。基本信息为需求或服务的名称和同义词;功能属性包含需求或服务的输入、输出,以及条件和效果。输入/输出属性主要描述服务实现其功能所需要哪些输入并将产生哪些输出,而条件/效果属性描述服务能够被执行的前提条件是什么,执行后将产生什么样的效果。服务质量包含了时间、成本和诚信度。
2 设计需求和资源服务的语义匹配实现流程
云制造服务语义匹配方法包含基本信息匹配、功能属性匹配和服务质量匹配三个阶段。每层设定由用户根据需求设定合适的阈值,并计算每层的相似度,与设置的阈值对比。相似度小于阈值的服务资源被过滤掉,并且不能进入到下一层次的匹配。最后按照三个阶段所占权重对各匹配度加权求和,获取需求与服务的综合匹配程度。
若产品研发云制造需求为Q=<QB a s i c,QI O P E,QQos>,产品研发云制造服务为P=<PBasic,PIOPE, PQos>,则设计需求与服务资源的匹配度形式化表示如下:
w1,w2,w3分别为三阶段相似度的权重。满足:
2.1 基本信息匹配
云制造服务名称和同义词都引用自领域本体中的概念,因此基本信息的匹配度可通过本体概念间相似度来度量。根据语义距离和语义相似性存在反向度量关系,可通过计算C1,C2间的语义距离来获取概念C1,C2的相似度,如式(3)所示。
领域本体可被看作一个is-a类型的层次概念树,即只存在所谓的上位/下位关系。则C1,C2间的语义距离表示为连接它们最短路径上的m条边的权值w的总和(每一条边的两端都为父子关系),如式(4)所示:
从信息量的角度来阐述,本体概念所处层次越深,其所含的信息量越多,本文借鉴文献[12],利用父子本体概念间没有共享的信息量来衡量父子概念间的语义距离,即:
n为父概念的直接子概念的数量,I(cip)和I(ci)分别为概念层次结构树中父概念cip和其子概念ci的语义信息量。而语义信息量的计算公式为:
其中p(c)为任一实例属于本体概念c的概率。p(c)的计算本文借鉴文献[13]的研究,利用领域本体本身作为统计源,根据其层次结构来计算各概念节点的出现概率值。并约定:
概念root为本体根节点。最后对上述公式进行代入和约简可得,概念Ci及父概念Cip的语义距离为:
概念C1,C2间的语义相似度为:
2.2 功能属性匹配
产品研发云制造服务平台的功能属性包含输入、输出、条件和效果。需求P和资源Q的功能属性综合匹配度为各属性匹配度的加权和(η1、η2、η3、η4为各属性权重,如未特别强调,本文中的所有加权和的权重都相等),如式(10)所示。
输入/输出属性引用自领域本体中的概念,如“设计参数”、“设计说明书”,同样采用基于本体概念的相似度的计算方法(参考式(9))。而条件/效果属性中的参数是约束条件表达式,不是本体中的概念,无法使用语义相似度来衡量其匹配程度。此类约束语句主要由个体词和谓词组成,如:最高车速为130~150(km/h)中,个体词为“最高车速”和“130~150(km/h)”,而“为”是谓词。在进行匹配运算之前,首先要对约束语句进行拆解,约束条件可如下表述:
云制造需求( 或服务) P / E属性约束条件={Object,Predicate,Paremeter}
第一个个体词(Object)和谓词(Predicate)来自于产品研发的云制造本体中的类、属性、实例等,可以采用基于本体的语义相似度算法来计算匹配度(参考公式(9))。第二个个体词(Paremeter)为数值型约束条件,采用数值区间相似度算法。具体计算方法见公式(11),式中使用缩写Pa代替Paremeter。
Pa1为需求的数值区间约束,Pa2为服务资源的数值区间约束。当且仅当Object匹配度超过给定阈值,且Predicate精准匹配时,才对Paremeter进行相似度计算,三者加权求和作为整条语句的匹配度。需求P和资源Q的P/E属性约束条件相似度可参考式(12)。
2.3 服务质量匹配
服务质量匹配是云制造服务资源中的重要评价指标,参数包括服务的时间、成本、诚信度。这类指标主要是数值参量,计算参考数值匹配算法,如式(13)所示。
如,当服务的时间和成本低于需求所要求的时间和成本,则匹配度为1,反之为0。同样的,需求P和资源Q的服务质量的综合匹配度为各指标匹配度的加权和。
3 实例验证
结合汽车零部件产品研发云制造服务平台,对以上方法的可行性和有效性,进行实验验证。下表分别列出了设计需求A和服务资源B、服务资源C的具体描述。并设定各层次的匹配阈值分别为0.75,0.7,0.65,权重分别为0.2,0.6,0.2。
采用本文的匹配方法,对上述需求和资源进行匹配。以A、B为例。
第一阶段是基本信息匹配。同义词统一为无,因此只需要对名称进行匹配,采用基于本体的概念相似度的匹配方法。如图4所示为变速器领域的本体片段,(用来运算的本体模型一般为4~5层,以待匹配的两个概念中的较深层次作为最底层)。图中本体概念旁边的分数为实例属于该概念的概率,或者是该概念出现的概率,父子概念连线上的数据表示权重或者是两个概念间的语义距离(具体算法参考式(8),其中“传动系”为根节点,它的出现概率为1,语义信息量为0。以此类推。
由式(9)可得:
第二阶段是功能属性匹配。输入输出均来自于本体概念,采用基于本体的概念相似度的匹配方法,结果为完全匹配,均为1。条件效果匹配首先对约束语句进行分解,得到{Object,Predicate,Paremeter}。其中对象和谓词精准匹配,对Paremeter采用数值区间相似度算法,以此加权求和获得整个约束语句的匹配度。仅以条件1为例,可得:
对所有的功能属性(输入、输出、条件、效果),加权求和可得:
第三阶段,服务质量匹配度为:
最后,加权求和,A、B综合匹配度为:
根据描述信息,结合各层次的匹配方法,计算A、C各层次的匹配度。结果如表2所示,服务资源B匹配度大于服务资源C,并得出了具体的匹配度,验证了该方法的有效性和可行性。
4 结论
基于云制造设计任务和资源服务的匹配需求,提出云制造服务多层次匹配算法。在分析云制造服务类型的基础上,利用本体描述语言对云制造服务进行语义描述,建立了云制造需求与资源服务的匹配模型。并将模型的匹配过程分为基本信息匹配、功能属性匹配和服务质量匹配三个阶段,给出了每一层的具体匹配内容和相似度算法。试验结果表明该方法能够有效区分不同云制造服务资源与需求的匹配程度。下一步研究主要集中在对用自然语言描述的需求和服务描述的解析,以及匹配算法的优化等方面。
服务匹配 篇4
语义Web服务是近年来Web服务领域热门的研究方向之一。通过向Web服务中添加语义信息,来实现分布服务组件的自动发现和组合,以满足动态的、可扩充的、经济的企业应用集成(EAI)和电子商务的需要,是语义Web服务的目标。在语义Web服务发现方面,本体概念的引入提升了服务的语义表达能力和发现能力,改变了传统Web服务发现基于关键字查询的语义描述不清,查全、查准率低等缺陷。
目前比较公认的本体定义是Rudi Stuger于1998年提出的:“本体是共享概念模型的明确的、形式化的规范描述[1]”。通俗地讲,本体是为了让计算机对现实世界某一领域中的概念及概念之间的关系有明确、一致的理解而进行的形式化、规范化的描述。本体的优点在于它能指导人们对某一领域的知识达到一致的认识和理解,并使用计算机进行描述和逻辑推理,从而达到语义Web的目标。
本文首先介绍了目前语义Web服务匹配的两种主要方法(基于推理和基于相似度计算),分析了各自的优势和不足。并在这两种方法的基础上提出了一种改进的服务匹配策略,即在推理过程中的某些情况下使用相似度计算。该策略在一定程度上综合了两种方法的优点,具有精确的匹配能力和在最坏情况下仍有较好的运行效率。
1 目前的两种语义Web服务匹配方法
1.1 基于推理的服务匹配
基于推理的服务匹配是建立在领域本体概念间的层次关系之上的,使用描述逻辑进行推理匹配的方法。Massimo Paolucci等于2002年首先提出了一种基于DAML-S的服务匹配方法[2],利用DAML-S的Service Profile对服务的输入、输出、前提、效果(IOPE)进行匹配。该方法定义了四种匹配程度(以输出匹配为例,设outR为请求者的一个输出,outA为服务提供者的一个输出):
(1) Exact:当outR与outA相同或outR是outA的直接子类(subClassOf)时,结果为Exact。
(2) Plug-In:如果outA包含outR,也就是说outA可能完全满足outR。
(3) Subsumes:如果outR包含outA,即outA能部分满足outR但不是完全满足。
(4) Fail:在outR和outA间没有任何包含关系,匹配失败。
随后,Lei Li等人对上述四种匹配类型进行了补充,在Subsumes和Fail之间添加了Intersection,即outR与outA的交集是可满足的(outR∩outA≠ ∅,但outR不包含outA),说明outA有可能满足outR的部分功能。从上述介绍我们可以看到,基于推理的服务匹配方法将服务间的匹配程度分为几个等级:ExactPlug-InSubsumesIntersectionFail,但在同一等级内部无法进一步区分结果的匹配度。
1.2 基于相似度计算的服务匹配
基于相似度计算的服务匹配通过计算两个本体概念之间的相似度(一个介于0和1之间的数值)来得到更精确的匹配结果。目前计算概念间相似度的方法主要有基于几何距离、基于属性和基于信息容量等几种。
基于几何距离的相似度算法的基本思想就是用两个概念在本体有向图中的几何距离来衡量语义相关度,距离越短则相关度越高;基于属性的相似度算法[3]是根据比较个概念间相同的和不同的属性的多少来确定二者的相似度的。两个概念间相同的属性越多,不同的属性越少,则他们越相似;基于信息容量的相似度算法[4]的基本思想是两个概念的相似度由他们共同拥有的那部分概念所决定。由于每个概念都是由其祖先概念结点继承而来,继承了祖先结点的信息,因此两概念间的相似度可由他们最近的共同祖先结点所包含的信息容量来确定,共享的信息越多,则相似度越大。
1.3 两种匹配方式的比较
从精度方面:基于推理的匹配方法将服务间的匹配程度分为五个等级,但某些情况下(Plug-In、Subsumes和Intersection)同一级别内部不能进一步区分结果的匹配程度。而基于相似度计算的匹配方法可以清楚地区分这种差别。
从运行效率方面:基于推理的服务匹配的一个好处是可以在匹配之前对本体库进行预处理,为每个概念建立匹配等级列表 (具体方法在第三部分中详细介绍),从而将计算的复杂性转移到预处理阶段。匹配时只需在列表中查找对应的概念,可获得线性的时间复杂度;而基于相似度计算的服务匹配算法本身就比较复杂,加之不能进行类似的预处理,算法的复杂性全部集中在匹配阶段,如基于几何距离的最短路径算法,在最坏情况下(本体规模很大,概念间相似度却很小或根本不匹配)会有糟糕的响应时间。
2 基于推理和相似度计算的服务匹配策略
从上面分析可以看出,两种服务匹配策略各有优势和不足。因此我们考虑将两种发现策略相结合,提出一种基于推理和相似度计算的服务匹配策略,该策略的基本思想是:在大多数服务匹配情况下(精确匹配或不匹配),不需要计算服务的相似度,因此可先采用简单的基于推理的匹配方法得出服务的匹配等级,对于不是Exact和Fail的情况,再采用相似度算法计算服务的相似度。通过对本体库进行预处理,为每个概念维护Exact列表、Subsumes列表和Intersection列表,从而将基于推理方法的计算复杂性转移到预处理阶段,提高匹配阶段的运行效率。下面是算法的具体步骤(步骤中相似度计算的算法采用了文献[4]中提出的一种基于信息容量的相似度算法)。
2.1 预处理阶段――构建匹配等级列表
对于每个新加入领域本体的概念n:
for 每个领域本体中的概念m:
其中ExactList为精确匹配关系列表,SubsumesList为包含关系列表,IntersectionList为交集关系列表。exact(n,m)、subsumes(n,m)、intersection(n,m)分别为判定相应关系的方法。
2.2 概念语义相似度计算semMatch
其中,findInExactList(),findInSubsumesList(),findInInterse-ctionList()为在相应的匹配等级列表中查找相应概念的方法。
2.3 整体匹配算法
整体匹配对两服务中的每对输入、输出进行相似度匹配,返回结果中包含输入的语义相似度(simIn)和输出的语义相似度(simOut),分别为所有输入和输出概念对相似度的平均值。
3 一个服务匹配实例
我们采用“书籍”领域本体作为服务匹配的一个实例。由图1和2.1可知Literature Books的ExactList为(Literature Books,Essay,Novel,Poetry Anthology,Biography),SubsumesList为(River Novel,Nouvelle,Short Story),IntersectionList为NULL。当一个请求查询要求输出为Literature Books,而服务提供者提供的输出为Education Books时,采用上述算法将首先在本体库中Literature Books的匹配等级列表里查找Education Books项,在搜索ExactList、SubsumesList、IntersectionList都没有找到结果之后,匹配程序将返回两服务的输出匹配度为0,即输出匹配失败。而当请求查询要求的输入为Nouvelle而服务提供者提供的输入为Book时,匹配程序首先在Nouvelle的匹配等级列表里查找Book项,Nouvelle的SubsumesList为(Literature Books,Book),在SubsumesList中找到了Book项之后匹配程序进入相似度计算环节,并返回两服务的输入语义相似度。
4 算法性能分析
为了检验算法的改进效果,我们从互联网上选择了一个较大规模的领域本体pizza.owl (http://www.co-ode.org/ontologies/pizza/2006/07/18/pizza.owl)来进行匹配的测试。该本体由Manchester大学开发,包含了pizza领域的166个相关概念,比较适合进行算法的性能测试。
首先介绍一下测试方案:
方案一:单纯计算输入/输出相似度,不结合包含关系推理。
方案二:结合推理机制计算服务的输入/输出相似度,但不进行预处理(建立概念间的包含关系列表)。
方案三:结合推理机制计算输入/输出相似度,并在预处理阶段建立概念间的包含关系列表和匹配度列表。
从试验的结果可以看出,在不使用推理机制时,方案一的时间开销随着待匹配概念间语义距离的增大而急剧上升,在最坏情况下(两概念语义距离很大且相似度为0)的匹配效率很低;而结合推理机制后,由于排除了相似度为0的最坏情况,所以最坏情况下的时间开销有所降低。然而推理机制本身有一定的开销(判断是否插入、包含、交集关系),因此当本体规模很大时,反而可能出现速度变慢的情况;而第三种方案,无论在正常或最坏情况下,时间开销总是最小的,这是因为建立了概念间包含关系和匹配度的预处理列表,匹配时只需在列表中进行查找即可,从而把开销控制在线性时间以内。
5 结束语
在本文中我们提出了一个基于推理和相似度计算的语义Web服务匹配策略,该策略在一定程度上综合了现有两种服务匹配策略的优点,具有精确的匹配能力和在最坏情况下仍有较好的运行效率。该策略作为我们设计的语义Web服务匹配模型SWSMatchmaker的一部分,负责对服务的I.O.进行匹配;同时我们还在该模型中加入了对服务的P.E.(前提和效果)的匹配策略,进行全面的语义匹配。该模型目前正在开发和实现中。
参考文献
[1] Rudi Stuger,Richard Benjamins V.Knowledge Engineering: Principles and Methods[J].Data and Knowledge Engineering.1998,25(2):161.
[2]Massimo Paolucci,Takahiro Kawamura,Terry R Payne.Semantic matc-hing of Web services capabilities[C].In Proceedings of the First Inter-national Semantic Web Conference(ISWC),volume2342of Lecture Notes in Computer Science,2002:333347.
[3] Tversky A.Features of similarity [J].Psychological Review,1977,84(4):327.
服务匹配 篇5
1 基于语义Web服务匹配的相关概述
基于语义Web服务匹配在其中加入了服务本体概念, 所以基于语义Web服务匹配在描述信息是具有清晰、准确的语义。语义Web模型是提供服务本身内部的流程信息, 和执行与服务相关的控制结构和数据流, 这些流程会在Web服务组合和执行时用到, 这些工作能够帮助发现Web服务是否符合请求者的要求。也能更加深入的去分析Web服务的可实施性。
1.1 语义Web服务匹配的现状
语义Web服务匹配是将用户的服务请求和Web服务数据库中的信息进行比较, 找出符合服务请求的语义Web服务信息。针对如何找出匹配的语义Web服务信息, 现阶段主要依据利用本体自身概念的逻辑包含关系进行推理实现匹配关系, 以及根据本体概念的语义相似度量进行相似度的匹配方法。例如:卡内基梅隆大学的Massimo Paolucc等提出的弹性匹配算法;基于本体属性的相似度算法;基于本体两个概念的几何距离来提出的语义相似度算法等运算方法。
1.2 基于语义的Web服务匹配排序模型的设计思路
在构建语义的Web服务匹配模型前, 应该通过研究相关的研究工作资料, 找出现有的语义Web服务匹配排序机制算法中存在的问题和不足。语义Web服务匹配模型的基本构架由八个部分组成, 根据语义描述的服务请求描述模块, 用于注册服务的服务注册模块, 用于存储本体信息的信息库, 用于搜索提取待匹配信息的信息提取模块等阶段的构建。
2 基于语义距离度量模型的语义Web服务匹配结果排序机制
随着语义Web服务匹配的发展, 在服务时对搜索结果的排序操作要求也越来越高。通过对各个研究工作概括和整理相关研究工作的资料, 探讨出一种基于语义距离度量模型的语义Web服务匹配结果排序机制, 运用这种基于语义距离度量模型来对在进行语义Web服务搜索时的匹配结果进行自动的排序操作, 这样能更加便捷、快速的完成Web服务的搜索工作。下文主要简单的介绍语义距离度量模型的相关知识和如何进行运用语义距离度量模型来对搜索结果排序, 以及加权语义距离度量在语义Web服务匹配中的运用。
2.1 语义距离度量模型
语义距离度量模型 (Semantic Distance Metric Model, 简称为SDMM) 是一种与“语义”信息本身定义具有相关信息的定义对象间的各种相关关系之间形成的一种三维空间可计算模型。利用本体的定义、实例、属性之间的语义联系:等价、包含和关联定义, 这三个向量可对应轴Veql、Vsub、Vrel, 利用这三个向量轴就能构成语义距离度量模型。语义距离度量模型是利用度量本体的定义、实例、属性与语义距离关系之间的三维空间可以计算的模型, 表达式为:SDMM=
2.2 基于语义距离度量模型的匹配结果排序
在语义距离度量模型 (SDMM) 中, 对象转换运算符 (→) 为其运算符, (→) 表示从语义距离度量模型的任意一个本体对象向另一个本体对象之间的转换函数。例如:从Ci向Cx转换可以记作Ci→Cx, 这样转换后就得到了一个集合Sx。在对对象进行求值算子Vx时, assign是作为语义距离度量模型中的算子, assign表示的是从坐标原点Ci→Cx所得的集合Sx中任意取一个元素, 语义距离度量模型的转换可由图2表示。
基于语义距离度量模型的语义Web服务匹配结果排序主要是根据语义Web服务所关系的本体对象的语义对象距离, 也就是说是本体定义对象在语义距离度量模型中的相互转换的操作序列之间的度量, 例如:在语义距离度量模型中Cm→Cn, 在计算语义距离时可利用公式 (1-1) 进行计算。
(1-1) 公式分为三个部分, 分别表示Cm→Cn在等价语义关系轴Veql上的操作, Cm→Cn在包含语义关系轴Vsub上的操作, 以及Cm→Cn在关联语义关系轴Vrel上的操作, 因此从概念Cm到概念Cn的转换距离度量实际上就是转换操作序列的三元组的度量。在这个过程中, 只是根据本体自身的概念, 属性作为一切推理的依据, 将本体中的所有对象映射在唯一的坐标点上, 再根据公式计算。
2.3 加权语义距离度量
因为语义Web服务匹配具有不同的服务要求类型和语义Web服务匹配要与上下文联系起来, 所以对语义Web服务匹配结果距离度量要运用加权的方式进行处理。在基于语义距离度量模型的语义Web服务匹配排序机制中, 可以给基于语义距离度量模型中的各个坐标轴的方向量赋予不同的权重值, 依靠权重值得到不同的加权语义距离度量, 从而进行语义Web服务匹配的排序。例如:有两个语义Web服务匹配距离对象Cm和Cn, 经过赋予不同的权重值后, 加权语义距离度量的计算表达式可以如公式 (1-2) 所示。
也可以根据不同的语义Web服务匹配内容, 在语义距离度量模型的三个方向的向量的语义距离度量权重值的设置可以有不同的方法, 甚至在实际的运用实例中可以将其中一个向量的权重值设置为0, 这就只需要考虑剩下的两个向量对语义距离度量的影响。
3 总结
语义Web服务匹配结果的排序机制在随着语义Web服务的搜索研究工作的不断深入的过程中, 已经成为了一个不可或缺的研究专题, 也在不断的研究运用不同的相似度度量模型和计算方法。而由于语义Web服务匹配搜索具有海量的信息, 运用不同的运算方法和不同的度量模型就有可能出现不同的Web服务匹配结果, 这就有可能影响到语义Web服务匹配搜索的准确性。本文在这些的基础上提出一种较科学的基于语义距离度量模型的语义Web服务匹配排序机制, 并且还依据不同的Web服务匹配搜索提出了对语义距离度量模型的方向轴赋予加权值的方法。但是怎样将语义信息完全统一的放入语义空间模型中并且进行一个统一的度量, 以及语义距离度量模型是否对不同的语义Web服务匹配搜索都适用, 这些都是以后研究工作的重心以及最需要解决的问题。
摘要:随着社会科技的进步和发展, 现在人们也越来越重视信息共享, 而开放的Web环境也成为了人们获取海量信息的主要来源。人们的需求也就让人们对语义Web服务技术不断地深入研究, 所以现在网上语义Web服务的数量也就快速的增加。本文主要提出了基于语义距离度量模型的语义Web服务匹配排序机制, 根据这种排序机制, 依据语义Web服务的语义相似度量对语义Web服务匹配结果进行排序。
关键词:语义Web服务,语义Web服务匹配,语义距离度量模型,语义Web服务组合
参考文献
[1]马应龙, 金蓓弘, 冯玉琳.基于进化分布式本体语义Web服务动态发现[J].计算机学报, 2013, 8 (11) :603-614.
[2]汤杰.语义Web服务组合的研究与实现[J].燕山大学学报, 2013, 11 (11) :120-121+125.
[3]方欣.基于语义的Web服务匹配研究[J].达宁大学学报, 2013, 2 (3) :156-157+159.
[4]杨易超.基于语义的Web服务匹配模型的研究与实现[J].电子科技大学学报, 2013, 2 (20) :178+180+185.
服务匹配 篇6
关键词:云制造,动态集成,过程追溯,制造资源匹配
0 引言
随着市场化和全球化逐步深入, 跨行业、跨地域的制造企业及资源相互联系, 逐步成为一个大规模的、复杂的制造网络, 以响应客户定制化的生产服务需求。制造服务协同使企业资源和能力在广域范围内充分共享, 促进企业专业化和服务化。云制造服务是实现制造服务协同的重要技术支撑[1]。
云制造基于物联网、信息系统、云计算等技术, 对各种软硬件制造资源进行互联、感知与获取, 形成一种制造资源按需使用的新型生产服务环境[2]。制造资源的服务能力是云制造领域最重要和最核心的研究内容之一, 由此, 刘士军等[3]提出了一种基于四叉树的云制造资源多维属性区间搜索方法。罗永亮等[4]针对云制造模式下制造能力, 构建了制造能力多维信息模型。黄沈权等[5]基于客户需求分离点将云服务按需供应模式分为按需提供、按需组合、按需设计和按需研发四类模式。为满足云制造背景下海量数据处理的效率要求, 张金广等[6]将语义相似度算法应用到云制造背景下的服务匹配中。魏乐等[7]提出了一种基于可信评价的制造云服务选择方法。
然而, 上述研究主要围绕制造任务展开云制造资源的搜索, 但如何控制云制造资源虚拟化过程, 并建立有一定普适性的云制造资源服务能力评价机制, 目前还缺乏系统的探讨。因此, 本文基于制造资源的不同形态, 提出了云制造资源动态集成框架, 研究基于RFID的云制造服务过程追溯机制, 建立了云制造资源服务能力多目标评价体系, 并通过评价指标加权和计算云制造资源优先值, 为制造任务匹配最优云制造资源节点。
1 制造服务协同中云制造资源集成
1.1 基于云计算的云制造资源动态集成模型
云制造资源是企业完成产品整个生命周期所有生产活动的物理元素的总称[2]。这些制造资源按照其存在形态可划分为硬件资源和软件资源。硬件资源包括工装夹具、量具、加工测量设备等。软件资源是指产品制造过程中所涉及的各种应用软件、产品模型, 图纸、工程数据库、技术文件等信息。
目前, 云制造资源的组织架构包括A S P (Application Service Provider) 、Web服务和制造网格三种。ASP强调制造资源能自身实现基于Web的应用及集中控制, 制造网格 (Manufacturing Grid) 需要智能调度算法完成对分布式资源的配置, 而Web服务多采用接口技术, 以封装的应用服务的形式实现虚拟制造资源的集成和共享。因此, 需要考虑不同制造资源的形态提出切实可行的动态集成技术。
云制造服务过程中包括了云制造资源提供者、云制造资源消费者和第三方云制造服务商三类群体。其中, 云制造资源提供者 (如外协企业) 本身拥有制造资源, 希望以出租/转让制造资源的形式获取最大化的收益;而云制造资源消费者 (如核心企业、委托加工单位) 并不拥有特定的制造资源, 希望以较低的成本换取资源提供者的资源, 在有限的时间内, 充分发挥制造资源的使用效率;第三方云制造服务商则通过集成、调配不同云制造资源提供者的资源, 为云制造资源消费者提供高质量的制造服务, 获取一定的利润。
基于上述分析, 如图1所示, 云制造资源动态集成框架可基于云计算架构, 结合ASP、WEB服务和制造网格的思想, 为每个云制造资源提供者提供一个云端接口, 维护各自的制造资源 (这些资源被虚拟化为结构化数据, 分别存储在云端的不同位置) 。对于云制造资源提供者的遗留系统, 将其中的应用模块封装为服务, 整合到制造云中。在此基础上, 提供一组支撑云服务, 作为制造资源优化调度与组合的基础。图1描述了实现制造资源配置的云服务过程:
1) 客户、第三方云制造服务商或制造企业在云制造资源服务平台上进行注册, 得到服务标识, 并描述服务需求, 如订单号、时间、周期、地点等。
2) 建立云制造服务认证库, 让云制造在一个服务进程的生命周期中完成。云制造服务认证包括的信息有: (1) 云制造资源提供商身份; (2) 云制造资源提供企业服务能力; (3) 制造资源登记; (4) 当前制造记录; (5) 生产计划库更新信息。
3) 初始化云制造服务生命周期, 按云制造服务生命周期协议进行云制造资源提供商与第三方云制造服务商的协商匹配, 注册服务返回满足客户需求的服务句柄。
4) 基于云服务生命周期协议进行客户需求和云服务节点之间的协商, 创建服务实例, 同时赋予订单记录、企业认证记录和服务协同记录等属性以实时监控。
5) 第三方云制造服务商创建云制造服务, 并查询各云服务节点, 并按云服务生命周期协议进行各种制造资源查询及远程调配。
6) 将服务状态返回客户, 显示在线激活信息来保持资源节点的服务。
1.2 基于RFID的云制造资源追溯
显然, 由于其软硬件制造资源物理特性不同, 其虚拟化过程存在明显的差异。从制造资源集成机制来看, 对于软件制造资源, 基于Agent、CORBA和Web服务技术和统一的产品数据交换标准 (如STEP标准) , 可以进行较深层次的资源共享, 实现云制造操作。但对于测试仪器、加工设备等硬件制造资源, 由于技术和管理原因, 互操作难度较大。因此, 在云制造过程中, 如图2所示, 针对硬件制造资源所提供的信息, 可通过RFID设备的配置与监控, 获取产品制造过程中的RFID数据, 并进行产品制造RFID数据的过滤和整合, 然后根据制造工艺指令, 将产品制造RFID数据封装为RFID事件。RFID事件检测组件负责发现大量并发的RFID事件, 并将其转入待处理云制造事件缓存 (buffer) 池中。
RFID事件调度组件查询工艺规则库中的工艺处理规则或条件, 对所有待处理事件进行加权优先级处理和调度, 生成事件处理优先队列。根据事件处理优先队列, RFID复杂事件处理组件依次将RFID事件与企业的制造任务单进行自动匹配, 完成RFID应用的业务操作或错误报警提示。同时将产品制造过程的RFID事件上传并存储到RFID业务事件数据库, 提供云制造全过程的状态追溯。
2 云制造资源服务的匹配
2.1 云制造资源服务能力评价体系的构建
衡量制造任务与云制造资源之间的匹配度, 这需要有一个客观的评价指标体系, 在此基础上选择最优云制造资源服务方案。首先, 确定满足制造任务需求的云制造资源节点集合为:
建立评价云制造资源服务能力的指标集为
如图3所示为该评价指标体系。该评价体系以云制造资源服务是否满足交货时间T, 产品质量Q、制造总成本C和制造服务水平S为评判标准。
在该评价指标体系中, T, Q, C, S指标关于制造任务目标的重要性是不同的。通过两两比较做出权重分析, 并构造各个指标相对重要性程度的判断矩阵, 其方法如下:
对上述n个评价指标V= (V1, V2, ..., Vn) , 要求它们对评价目标的影响或权重, 则取两个因素Vk与Vl, 用wkl表示Vk与Vl对评价目标的影响之比。wkl可用客观赋权法给定评价指标间的权值。全部比较结果用矩阵W=[wkl]表示, 则称W为判断矩阵。
在给出判断矩阵后, 求取矩阵W的标准化特征向量并使标准化特征向量满足归一化条件
2.2 云制造资源节点优先值计算
通过评价指标加权和计算各云制造资源服务节点Si在评价指标体系Vj下对应的优先值Yij。对于评价指标可划分为极大型和极小型两类。某些指标对制造服务能力而言, 其值越大越好, 称之为极大型指标;而其他某些指标其值越小越好, 称之为极小型指标。
对极大型指标, 令:
对极小型指标, 令:
上式中:i =1, 2, ..., m, j=1, 2, ..., n, max xj, min xj分别为Vj指标的最大值和最小值。Xij表示候选云制造资源节点Si在评价指标Vj下的重要度, 该量可以通过专家决策打分法决定。
最后, 根据云制造资源节点在不同目标准则下的优先值及该目标准则的权值, 计算该云制造资源节点Si总的优先值Yi:
3 应用实例
为验证云制造资源服务匹配与过程追溯的的可行性和有效性, 本文针对某机车制造企业S295柴油机气缸体协同制造过程进行了云改造, 并进行了实例验证。
该汽缸部件制造过程需要外协, 制造任务有4个云制造资源节点S (S1, S2, S3, S4) 可供选择。根据专家决策法评价各云制造资源节点在指标T, Q, C, S准则下的重要值, 其结果以矩阵表达为:
同时, 比较T, Q, C, S之间的相对权重, 并构造判断矩阵W :
求解判断矩阵W的标准化特征向量, 得出T, Q, C, S准则的权值分别为:
通过评价指标加权和分别计算各云制造资源服务节点Si在评价指标体系V (T, Q, C, S) 下对应的优先值Yi T, Yi Q, Yi C, Yi S。显然, 服务质量准则Yi S和产品质量Yi Q为极大型指标, 而时间Yi T和成本Yi C为极小型指标。因此, 对S1的优先值Y1有:
针对对该企业所提交的制造任务, 同理计算其它候选云制造资源节点的优先值, 则分别为:
显然, 有Y4Y1Y2Y3, 因此, 对于该制造任务选用云制造资源节点S4为工作节点。
4 结束语
复杂产品的生产活动所涉及的各种软硬件制造资源类型繁多, 给云制造的实现带来很多困难。考虑不同制造资源的形态, 建立云制造资源动态集成框架, 通过RFID技术追溯云制造服务过程, 以评价指标加权和计算云制造资源优先值, 可以为制造任务匹配最优云制造资源节点, 并保证制造企业之间的有效协同。
参考文献
[1]马军, 薛晓飞, 罗国富, 李宏伟.基于Agent的可重构协同制造服务链建模及其应用研究[J].机械科学与技术, 2012, 31 (10) :1654-1659.
[2]李伯虎, 张霖, 王时龙等.云制造——面向服务的网络化制造新模式[J].计算机集成制造系统, 2O10, 16 (1) :l-7.
[3]刘士军, 曲本科, 武蕾, 孟祥旭.自组织云制造资源聚集框架与多维属性区间搜索方法研究[J].计算机辅助设计与图形学学报, 2012, 23 (3) :299-307.
[4]罗永亮, 张霖, 陶飞, 张雪松, 任磊.云制造模式下制造能力建模关键技术[J].计算机集成制造系统, 2012, 18 (7) :1357-1366.
[5]黄沈权, 顾新建, 陈芨熙, 方水良, 杨青海, 周宏明.制造云服务的按需供应模式及其关键技术[J].计算机集成制造系统, 2O13, 19 (9) :2315-2324.
[6]张金广, 李锋刚, 张磊.云制造背景下的服务匹配算法[J].计算机技术与发展, 2013, 23 (3) :41-44.
服务匹配 篇7
随着知识经济社会的发展, 知识的需求越来越个性化, 知识的供给也越来越多样化。现实的知识服务过程中, 如图书出版、专利技术转化、知识咨询等实际知识服务问题, 如何使知识需求方和供给方双边主体进行有效的匹配, 将知识进行合理的转移, 对促进知识创新、实现价值创造具有着重要意义。知识供需双方由于资源、信息的不对称, 会考虑通过中介机构的专业化知识服务以实现双方的有效匹配。目前关于知识服务中双边匹配的研究已引起了一些学者的关注, 但研究成果不够丰硕。Klerkx等[1]针对全球农业市场环境下需求驱动的产业链中供给方与需求方的供需双边匹配问题, 从知识商业服务中介的视角考虑了供需双方在农业技术知识、服务、资源等多个属性下的匹配机制和匹配效应。Hoppe等[2]从经济博弈的角度分析了中介 (Broker) 在创新知识服务中的作用, 并建立了知识供需双边匹配的均衡模型。Janssen等[3]研究了基于Internet的供给与需求实时匹配机制, 定义了匹配规则和多属性效用匹配方法并计算了匹配分值, 基于此建立了中介支持的供需匹配系统。 张振华和汪定伟[4]提出了电子中介处理多属性交易时双方的满意度函数, 以最大化供需双方满意度为目标建立了多目标匹配优化模型。 知识服务中知识供需双方的匹配满意度评价指标之间往往存在关联, 即一种评价指标可能会影响另外其他的评价指标, 匹配满意度评价信息之间存在非可加性, 即相互关联、并不相互独立;同时考虑到现实中匹配主体的目标可能是供给方和需求方满意度最高等, 此时, 涉及的效率矩阵中的元素很难用精确的数值来描述, 而用语言信息也更为方便、合适[5]。传统的考虑语言满意度评价信息的多属性决策方法具有很大的局限性, 基于此, 本文考虑了知识服务中匹配主体给出语言关联性信息的情形, 提出了使用基于语言Choquet积分算子的多属性决策方法来获得匹配满意度, 并建立了基于知识服务中介的双边匹配模型, 从而为解决知识服务中的双边匹配问题提供了重要的决策支持。
1 知识服务中的双边匹配决策问题描述
知识服务的供需双边匹配过程中, 通常存在着三方主体, 知识服务的需求方、供给方以及服务中介。知识服务的需求方是指需要获取知识的机构或个人;知识服务的供给方则以需求为导向, 提供相应的知识服务内容, 如大学、政府研究机构、研发实验室、咨询公司等等。知识服务的需求方和供给方可通过专业的服务中介形成匹配关系:知识服务的需求方和供给方将需求信息和供给信息提供给服务中介, 服务中介将进行必要的多属性决策分析, 并根据分析的结果, 给出合理的供需匹配方案。
设知识服务的需求方为D={d1, d2, …, dn}, di表示D中的第i (i=1, 2, …, n) 个需求方;知识服务的供给方为S={s1, s2, …, sm}, sj表示S中的第j (j=1, 2, …, m) 个供给方。
知识服务需求方对知识服务供给方进行满意度评价时需要考虑的匹配满意度评价指标集为C={C1, C2, …, Ch}, 其中Cp表示第p (p=1, 2, …, h) 个评价指标, 评价指标之间并不相互独立, 存在着关联性;知识服务供给方对知识服务需求方进行匹配满意度评价指标集为R={R1, R2, …, Rf}, 其中Rq表示第q个评价指标 (q=1, 2, …, f) , 评价指标之间并不相互独立, 存在着关联性。知识服务中的双边匹配过程可用图1进行描述, 需要根据服务需求方对供给方的考虑关联性评价指标的语言评价信息, 以及服务供给方对需求方的考虑关联性评价指标的语言评价信息, 由中介给出合理的匹配决策分析结果。个体di和个体sj之间的连线表示有向的两个权值, 这两个权值的含义分别代表di对sj的匹配满意度和sj对di的匹配满意度。双边匹配的目的就是确定连接di与sj的匹配关系, 使不同主体的满意度 (权值) 尽可能达到最大[6]。
针对服务的需求方对供给方的评价指标Cp, 以及服务的供给方对需求方的评价指标Rq, 设L={l0, l1, …, lT}表示一个预先定义好的语言评价集, 这里, L是由奇数个元素构成的有序集合, 其中li∈L是第i个语言短语, i=0, 1, 2, …, T, T+1为L的粒度 (L中的元素个数) 。本文考虑的L是一个7粒度的语言评价集, 即L={l0=AP (非常差/非常不满意) , l1=VP (很差/很不满意) , l2=P (差/不满意) , l3=M (中等/一般) , l4=G (好/满意) , l5=VG (很好/很满意) , l6=AG (非常好/非常满意) }。记服务需求方di对供给方sj的语言评价矩阵为Ap=[apij]n×m, 其中apij表示di对sj针对Cp的语言评价信息, apij∈L;服务供给方sj对需求方di的语言评价矩阵为Bq=[bqij]n×m, 其中bqij表示sj对di针对Rq的语言评价信息, bqij∈L.
本文要解决的问题是:针对知识服务中供需双方之间存在的相互交叉、相互关联的语言满意度信息, 提出使用语言Choquet积分算子来解决知识服务中的供需双边匹配决策问题, 并建立了多目标模型来获得优化匹配结果, 使知识服务供需双方的匹配满意程度尽可能达到最大。
2 基于语言关联性信息的决策分析方法
2.1 Choquet积分
1954年, 法国著名数学家Choquet首先提出了容度的相关理论, 这是最早对于非可加性测度的系统研究。随后, 日本学者Sugeno为解决指标之间存在关联而不具备可加性的多属性决策问题, 提出了模糊测度的概念[7]。Schmeidler[8]开创性地将Choquet积分应用于解决基于关联信息的决策分析问题。随后, Grabisch[9,10]将Choquet积分作为一种灵活的集结算子应用于多指标决策分析问题。现实问题中, 事物的指标或属性往往相互依赖、相互关联, 并不相互独立。下面, 将对Choquet积分的基本概念进行简要介绍。
定义1 设X={x1, x2, …, xn}为非空经典集合, 其中xi表示第i个元素; 函数μ是从X的幂集P (X) 到[0, 1]上的函数, 若满足:
① μ (∅) =0, μ (x) =1;
② ∀A, B∈P (X) , A⊆B且有μ (A) ≤μ (B) ,
则称μ是X上的模糊测度。如果X是无限的, 则要加上一个连续性条件。
定义2 对于任意的A, B∈P (X) , A∩B=∅, 如果模糊测度μ满足
则称μ为λ模糊测度。
λ=0表示μ (A) 和μ (B) 具有可加性, 即A和B之间没有关联;λ≠0表示μ (A) 和μ (B) 具有非可加性, 即A和B之间存在关联。具体地, 当λ>0时, 有μ (A∪B) >μ (A) +μ (B) , 即A和B具有相乘作用, μ是超可加的;当λ<0时, 有μ (A∪B) <μ (A) +μ (B) , 说明A和B具有替代作用, μ是次可加的, 二者的作用会相互重复。
以上三种情况完全描述了实际决策中属性指标及专家偏好存在不同类型的相互作用的现象。
如果有限集合X= (x1, x2, …, xn) , 对任意的i, j=1, 2, …, n, 且i≠j, xi∩xj=∅, 那么
由式 (2) 可知, 对任意的A∈P (X) , 有
对于单个元素xi, μ (xi) 称为xi的模糊密度函数, 它表示元素xi的重要程度, 此时可简记为μi=μ (xi) 。因为μ (X) =1, 根据式 (2) , 可由如下方程式确定唯一的参数λ:
定义3 设X是一个非空经典集合, X= (x1, x2, …, xn) , f是定义在X上的非负实值函数, μ是X上的一个模糊测度, 函数f关于μ的离散Choquet积分算子定义为
其中, (·) 表示函数f在X上的一个转置, 使得f (x (1) ) ≤f (x (2) ) ≤…≤f (x (n) ) 且A (i) ={x (i) , …, x (n) }, x (0) =0。
2.2 基于语言Choquet积分的模糊满意度测评
决策者在进行指标的定性描述时, 使用语言评价信息往往更为方便、合适[11]。知识服务中双边匹配的目标可能是供需双方的匹配满意度最高等, 使得语言信息非常适合表达供需双方的评价信息。可设定语言评估标度L={lα|α=1, 2, …, t}, 其中lα表示一个语言变量, 且满足下列条件:
① 若α≥β, 则lα≥lβ;
② 存在一个负算子neg: neg (lα) =lβ, 使得β=t+1-α;
③ 若lα≥lβ, 则max (lα, lβ) =lα;
④ 若lα≤lβ, 则min (lα, lβ) =lα.
语言标度L可以由7个元素 (即语言短语) 构成, 即L={l0=AP (非常差/非常不满意/非常不重要) , l1=VP (很差/很不满意/很不重要) , l2=P (差/不满意/不重要) , l3=M (中等/一般/一般) , l4=G (好/满意/重要) , l5=VG (很好/很满意/很重要) , l6=AG (非常好/非常满意/非常重要) }。
为了避免语言决策信息的丢失并便于计算, 可将原有的离散标度L={lα|α=1, 2, …, t}扩展成连续的语言标度
对于任意的两个语言变量lα, lβ∈
① lα♁lβ=lβ♁lα=lα+β;
② vlα=lvα;
③ (v1+v2) lα=v1lα+v2lα;
④ v (lα♁lβ) =vlα♁vlβ.
进一步, 可给出基于Choquet积分的语言集结算子[13]。
定义4 设语言评估标度
式中,
综上, 可进一步给出基于语言Choquet积分的模糊满意度测评步骤。
步骤1: 知识服务的需求方di (i=1, 2, …, n) 利用语言评估标度L对供给方sj (j=1, 2, …, m) 针对匹配满意度评价指标Cp (p=1, 2, …, h) 进行测度, 得到sj在指标Cp下的语言评估值集合D={D1ij, D2ij, …, Dhij}, Dpij为di对sj针对第p个评价指标的评价值 (Dpij∈L) 。进一步, 可以得到di对sj的语言决策评价矩阵为
步骤2: 知识服务的供给方sj (j=1, 2, …, m) 利用语言评估标度L对需求方di (i=1, 2, …, n) 针对匹配满意度评价指标Rq (q=1, 2, …, f) 进行测度, 得到di在指标Rq下的语言评估值集合E={E1ij, E2ij, …, Efij}, Eqij为sj对di针对第q个评价指标的评价值 (Eqij∈L) 。进一步, 可以得到sj对di的语言决策评价矩阵为
步骤3: 确定C中指标的模糊密度函数μ (Cp) (p=1, 2, …, h) , 根据式 (4) 确定其相应的参数λ1.
步骤4: 确定R中指标的模糊密度函数μ (Rq) (q=1, 2, …, f) , 根据式 (4) 确定其相应的参数λ2.
步骤5: 利用LC算子对di给出的针对sj在指标Cp下的语言评估值信息
式中,
步骤6: 利用LC算子对sj给出的针对di在指标Rq下的语言评估值信息Eqij进行集结, 得到sj对di的指标综合语言评价值Eij (q=1, 2, …, f;i=1, 2, …, n;j=1, 2, …, m) 。
式中,
步骤7: 利用获得的Dij和Eij可作为决策分析依据, 进一步构建多目标优化模型。
3 优化模型与求解
根据以上分析获得的di对sj的指标综合语言评价值Dij, 及sj对di的指标综合语言评价值Eij, 可以建立一个使知识供需双方满意度最大的决策模型, 尽量使得匹配双方都达到满意的结果。
引入0-1变量xij, 其中, xij=1表示匹配主体di与另一方匹配主体sj匹配, xij=0表示匹配主体di与另一方匹配主体sj不匹配。为了解决知识供需主体的双边匹配问题, 可建立如下的多目标优化模型:
在上面的模型中, 式 (6a) 和式 (6b) 是目标函数, 其含义分别是尽可能使知识服务需求方di对知识服务供给方sj的综合语言评价值最大, 以及尽可能使知识服务供给方sj对知识服务需求方di的综合语言评价值最大;式 (6c) 是约束条件, 表示di至多与一个sj相匹配;式 (6d) 是约束条件, 表示sj至多与一个di相匹配。
用α (Dij) 表示Dij的语言评估标度的角标值, 例如, 当计算得出Dij=l3.83, 则α (Dij) =3.83。用β (Eij) 表示Eij的语言评估标度的角标值, 例如, 当计算得出Eij=l5.22, 则β (Eij) =5.22。为求解模型 (6) , 可构造如下优化模型:
对于构造的模型 (6) 和模型 (7) , 有下面的定理。
定理1 若X*=[x*ij]n×m是模型 (7) 的最优解, 则它也是模型 (6) 的最优解。
证明 由于X*是模型 (7) 的最优解, 则有
因此, 对模型 (6) 的求解可转化为求解模型 (7) 。进一步, 针对模型 (7) 中的多目标线性优化模型, 可以通过使用线性加权的方法, 将式 (7a) 和 (7b) 加权并转化建立一个新的单目标函数。设定权重参数ω1、ω2, 可将上述多目标优化模型转化为如下的单目标线性规划模型:
单目标线性规划模型 (8) 的目标函数和约束条件均是线性的, 可通过线性规划的方法进行求解。因此, 可以使用优化软件包或遗传算法编程来求解该优化模型。
4 实例分析
中国西安高新区的某专利技术服务中介公司, 主要提供高校与企业间在电子通讯领域发明专利技术供需匹配的知识服务, 拟撮合不同的知识服务供需匹配主体进行合理的匹配。该中介公司收到4个专利需求企业 (d1, d2, d3, d4) 和5个专利供给高校 (s1, s2, s3, s4, s5) 的相关信息, 企业对知识服务的供给方高校进行满意度评价, 主要考虑的指标包括专利技术主题领域的市场前景度 (C1) , 专利技术的潜在价值 (C2) , 专利技术的复杂程度 (C3) , 拥有专利技术团队的技术水平 (C4) , 引进专利技术的价格 (C5) ;高校对知识服务的需求方企业进行满意度评价, 主要考虑的指标包括专利技术的转让收益 (R1) , 企业的技术水平 (R2) , 专利技术转化的速度 (R3) 。表1中为企业对高校的满意度多指标语言评价信息, 表2中为高校对企业的满意度多指标语言评价信息。
知识服务供需双方的匹配满意度评价指标之间并不是完全独立的, 往往会存在关联的情形, 如专利技术主题领域的市场前景度 (C1) 和专利技术的潜在价值 (C2) 是存在关联的评价指标; 企业的技术水平 (A2) 和专利技术转化的速度 (A3) 是存在关联的评价指标, 等等。根据前文给出的方法, 针对评价指标集C={C1, C2, …, Ch}, 专家给出的各指标的模糊密度分别为μ (C1) =0.3, μ (C2) =0.1, μ (C3) =0.15, μ (C4) =0.15, μ (C5) =0.2;针对评价指标集R={R1, R2, …, Rf}, 专家给出的各个指标的模糊密度分别为μ (R1) =0.4, μ (R2) =0.3, μ (R3) =0.2。根据式 (4) 可分别计算得出λ1=0.3, λ2=0.37。
根据给出的基于语言Choquet积分的模糊满意度测评步骤, 利用LC算子进行运算, 可进一步得出di对sj的指标综合语言评价值Dij, 其中,
D12=l2.96;D13=l4.23;D14=l2.67;D15=l2.47;D21=l2.48;D22=l2.83;D23=l2.87;D24=l3.67;D25=l2.75;D31=l2.36;D32=l2.44;D33=l3.93;D34=l2.78;D35=l2.75;D41=l2.69;D42=l1.75;D43=l3.30;D44=l2.56;D45=l3.72
E21=l3.40;E31=l2.20;E41=l2.52;E12=l2.72;E22=l2.74;E32=l2.74;E42=l3.30;E13=l4.30;E23=l3.00;E33=l2.74;E43=l2.74;E14=l3.52;E24=l4.30;E34=l2.74;E44=l3.04;E15=l3.40;E25=l3.52;E35=l2.40;E45=l4.04.
进一步, 可得到关于α (Dij) 和β (Eij) 的数值矩阵为
依据建立的双边匹配的多目标优化模型 (6) , 按照给出的方法将模型进行转化, 设定两个目标函数的权重参数ω1和ω2均为0.5, 可将模型转化为单目标线性规划模型 (8) , 采用优化软件包或遗传算法进行求解, 可得到该问题的最优解:x11=0;x12=0;x13=1;x14=0;x15=0;x21=0;x22=0;x23=0; x24=1;x25=0;x31=0;x32=1;x33=0;x34=0;x35=0;x41=0;x42=0;x43=0;x44=0;x45=1。即专利需求企业d1与专利供给高校s3相匹配;专利需求企业d2与专利供给高校s4相匹配;专利需求企业d3与专利供给高校s2相匹配;专利需求企业d4与专利供给高校s5相匹配。
为了观察不同的ω1和ω2的取值对匹配结果的影响, 下面进行灵敏度分析, 表3所示的是不同的ω1和ω2取值及其相应的最优匹配结果。
5 结论
本文针对知识服务中考虑关联性指标的知识供需双边匹配决策问题, 给出了一种基于语言Choquet积分的决策分析方法。该方法考虑了语言满意度评价指标存在关联而不具备可加性的决策问题, 并依据决策分析结果, 通过建立多目标优化模型, 通过模型的转换和求解得到匹配结果。实例分析表明该方法具有可操作性和实用性, 对于知识服务中存在的大量现实决策问题具有重要的理论指导价值。