词汇语义图

2024-06-25

词汇语义图（共3篇）

词汇语义图篇1

0 引言

语言是人类社会最重要的交际工具和进行思维的工具,是人们进行沟通和交流的各种表达符号。人们在日常生活中运用语言交谈、交际的实质就是在用语言交流语义。语义(semantic)是一个涵义较广泛的概念,它既可指一个词语的意义,也可指话语的内容。自然语言处理有多个层次,其中的语义层就是研究如何从一个句子中的词的意义,以及这些词在该句的语法结构中的作用来推导出该句的句义。计算机理解自然语言的基础是语义分析,从自然语言处理的很多应用领域来看,不论是信息检索、信息抽取、自动文摘、人机交互,还是自动翻译和问答系统,为了能确定语言所要表达的正确含义,首先需要理解语言,然后才能进行后续的操作与分析得到最终的结果。

1 中文信息处理中语义研究的必要性

由于没有严格意义上的形态和缺乏曲折变化,因此汉语是一种意合语言和语义型语言,对语义的依赖性很大要比英语等大得多。和英语等语言相比,句法分析对句子的作用与贡献比那些语言等要小得多,语义分析对汉语理解来说,语义分析就显得尤为重要;实践证明,在句法分析过程中仅仅借助语法知识是不够的,还需辅助另外两种基本的知识源,它们是语义知识和词语搭配知识[1],这些汉语的研究结果最终需要在计算机上进行形式化。因此近年来,为了发展中文信息处理事业,计算语言学家们都把研究视线和重点转移到语义上,不断掀起了语义研究的研究高潮。从自然语言处理的发展与现状来看,正是由于句法分析在实际应用中得不到令人满意的效果,研究者们才逐渐转向语义研究,提出了各种语义研究的方法和语义学理论。

2 语义研究的现状

当人们使用计算机分析自然语言时,最先接触到的是语音和文字,然后是语法,最后就是语义和语用。如果说语法分析的目的是为了找出句子各个部分以及各部分之间的结构关系,则语义分析的目的则是为了解释各部分(词、词组及句子)在句子中的意义。在自然语言的计算机处理中,对自然语言语义分析的需求推动了现代语义学理论的发展。目前已有的语义学理论有结构语义学、解释语义学、生成语义学、格语法、逻辑—数理语义学、情景语义学、概念依存理论和优选语义学等。

多年来,从事自然语言理解研究的学者们追求的主要目标是对句子进行正确的语义分析。然而,经过了多年的努力,并没有实现真正意义上的语义理解,目前取得的效果并不理想。现有的语义研究主要集中在浅层语义分析和大规模语义知识库资源的建设上,前者又被称作语义角色标注,它是对深层语义分析的一种简化,它只标注与句子中谓词有关的成份的语义角色,如时间、地点、工具、方式、施事和受事等等。由于现有自然语言处理技术以及统计学习技术的成熟,使浅层语义分析得以实现。后者是有关语义研究的基础性问题,经过多年的探索与建设,一批初具规模的语义资源日趋完善,例如中科院董振东先生开发的知网(HowNet)、黄曾阳先生创立的概念层次网络(HNC)理论的语义知识库和北京大学计算语言学研究所的语言知识库是已有研究成果的杰出代表。

3 概念图的相关知识

知识是人们在实践中把获得的信息关联在一起所形成的一种信息结构。知识表示是人工智能学科研究的主要问题之一[2]。目前出现了不少的知识表示方法,例如一阶谓词逻辑表示法、产生式表示法、框架表示法、语义网络表示法和面向对象表示法等,这些方法各有特点,但是这些方法的共同缺陷是能力还很有限,不能确切地表达语义,因此需要引入一种新的知识表示方法。概念结构(Conceptual Structure) 是在1984年由美国的计算机科学家Sowa在首先提出的一种新的知识表示方法,为人工智能研究中的知识表示问题带来了一种新的研究思路[3]。概念图(Conceptual Graph)是基于概念结构思想的一个语义模型[3]。概念图是一种以图形表示的一种有向连通图,它包括概念结点和概念关系两种结点,关系是通过概念和概念之间的弧来体现的。概念结点表示问题领域中的一个具体的或抽象的实体,用一个矩形表示;概念关系结点指出一种涉及一个或多个概念结点的关系,概念关系结点用椭圆表示。

概念图的形式化定义为:其中ConceptSet表示概念结点的集合,RelationSet表示关系结点的集合,T表示弧的集合。例如,句子“张萍正在认真地写作业。”的概念图表示结果如图1所示。

4 概念图在语义研究中的应用

概念图这种知识表示方法可在语义表示和应用实现的不同层面上使用。在语义表示上,可以将概念图可以看作是一个专门的交流语言,供来自不同领域但有着共同认知的专家们使用。在应用实现层面上,在复杂知识系统中,概念图可以作为其中的不同模块,例如数据库、推理、人机交互和学习模块等之间公共表示方法的抽象基础。

自从概念图的理论被提出来后,很多研究者的经过积极的探索与尝试,将它应用到不同中文信息处理研究领域,例如,知识工程、信息检索等,在自然语言处理方面尤其语义理解方面具有广泛的应用。不少研究者基于概念图进行了研究与探索,并取得了一些成果,经过笔者的归纳与整理,概念图在语义研究中的应用分为以下两类:

(1)基于概念图思想的直接应用:这种类型的应用主要是在语义的层面上进行,以概念图为知识表示方法,首先是将自然语言文本、信息、概念、句子形式化后转化为概念图,然后通过语义相似度计算和概念图的匹配,计算概念相似度和关系相似度,进行相关反馈、语义检索、信息抽取、查询扩展、词语相似度计算等应用。例如,为了解决关键词搜索问题,朱海平博士以概念图作为语义表示的方法,研究了基于概念图匹配的语义搜索[5]。针对目前信息检索存在的不足,陈锐提出了基于概念图的信息检索模型的查询扩展方法,以概念图和知网为基础,通过概念图的匹配实现信息检索,有效地提高了信息检索结果的查全率和查准率[6]。卜文娟提出一种利用概念图计算问句相似度的方法,并在此基础上实现了中文FAQ问答系统[7]。张晓孪针对汉语语义计算结果不准确的问题,提出了一种基于概念图的汉语语义计算方法,把自然语言文本转化为概念图,通过概念图的匹配实现语义相似度计算,改善语义计算的效果[8]。

(2)改进经典概念图思想的再应用:将传统的概念图思想进行改进,提出含权概念图、模糊概念图、内涵概念图、递归概念图和扩展概念图的概念,并将其应用在主观题自动阅卷、逻辑推理、网页聚类、文本标引和词义识别应用中。例如,刘培奇将模糊度用模糊集合表示, 提出一种改进的模糊概念图知识表示方法,在此基础上,重点研究了模糊概念图的推理机制和算法[9]。王军提出了将概念图所表示的知识转化为描述逻辑知识库的方法及此方法的正确性证明,利用描述逻辑已有的可判定自动推理算法判断概念图的一致性和包含关系的方法,证明了这些方法的正确性[10]。何夏燕提出了基于内涵概念图的词汇间语义相似度计算方法,并将此方法应用于网页聚类中[11]。已有的这些研究成果弥补了经典概念图研究中的不足,为概念图在知识表示领域中的实际应用提供了扎实的理论基础。

5 下一步的研究方向

概念图理论从提出至今近三十年,取得了令人瞩目的研究成果,在语义检索、信息抽取、逻辑推理等计算机领域得到成功的应用,并且逐渐被人们所重视。然而概念图作为概念结构的核心内容之一,仍有许多挑战性问题需要解决和继续研究。

(1)基于概念图的深层语义分析:

在不久的将来,人们对于自然语言理解的最终目标是真正的深层次的语义分析,以期进行自动的知识获取、推理等等。因此在未来的研究将在已有的浅层语义分析的基础上,利用概念图进行深层的语义分析。

(2)细化语义知识颗粒度:

在语义关系的描述上,共性方面已经比较完善,为了更详尽地描写概念的内涵的个性特征,今后在语义资源建设上,将更详尽地描写概念的内涵,关注概念在语境中的具体表现。

(3)扩展概念图在中文信息处理中的应用领域:

将已有的概念图研究成果和方法与其他句法、语义分析技术相结合,进一步扩展概念图在中文信息处理中的应用领域。目前正在研究基于含权概念图的语义相关度研究和基于概念图的问答系统中答案抽取的研究,这些都是对概念图应用的探索。

6 结束语

从事自然语言理解研究的学者们越来越认识到在研究的过程中语义理解的必要性和重要性,深刻的意识到仅仅从语法上进行自然语言的理解是远远不够的,语义理解是自然语言理解的基石。尤其对于汉语来说,语义分析是自然语言理解研究的一个突破点、出发点,在自然语言理解中占据着非常重要的地位。人工智能领域中绝大多数知识表示方法都直接或间接地涉及到概念结构,概念结构是人类认知能力的重要来源,现代的知识表示方法会越来越重视概念结构。概念图是一种能与自然语言进行互译的知识表示方法,能完全描述自然语言所表达的意思。未来对概念结构和概念图的进一步的深入研究必将对汉语语义理解方面的难题的探索与解决产生重要贡献和促进作用。

摘要：语义分析是计算机理解自然语言的基础,是自然语言理解研究的一个突破点和出发点。从事自然语言理解研究的学者们追求的主要目标是对句子进行正确的语义分析。概念图是支持概念结构思想的一个具体的语义模型,是以图形表示的一种有向连通图。文中分析了中文信息处理中语义研究的必要性和现状,阐述了概念图在语义研究中的应用,并提出了下一步的研究方向。

关键词：概念图,知识表示,自然语言理解,语义分析

参考文献

[1]李琼,李志.面向中文信息处理的语义研究概况[J].江西科技师范学院学报,2009(5):71-75.

[2]张仰森,黄改娟.人工智能教程[M].北京:高等教育出版社,2008.

[3]张蕾,李学良.概念结构及其应用[D].西北工业大学博士论文,2001.

[4]贺文,危辉.概念结构研究综述[J].计算机应用与软件,2010,27(1):156-159.

[5]朱海平,俞勇.基于概念图匹配的语义搜索[D].上海交通大学博士论文,2006.

[6]张晓孪,王西锋.基于概念图的汉语语义计算的研究与实现[J].计算机工程与应用,2011,47(10):120-123.

[7]陈锐,张蕾.基于概念图的信息检索的查询扩展模型[J].计算机应用,2009,29(2):545-548.

[8]卜文娟,张蕾.基于概念图的中文FAQ问答系统[J].计算机工程,2010,36(14):29-31.

[9]刘培奇,李增智.模糊概念图知识表示及其推理机制研究[J].计算机应用研究,2010,27(6):2119-2122.

[10]王军,王继军,甘丹,等.基于描述逻辑的概念图推理[J].计算机科学,2008,35(8):176-179.

[11]何夏燕,陆汝占.基于汉语概念图的词汇语义相似度计算[D].上海交通大学硕士论文,2010.

浅析词汇语义变化的原因篇2

词汇语义的变化包括语义扩大、语义缩小和语义转移等形式，关于语义变化的形式已有很多相关研究，本文不再赘述，本文将重点分析词汇语义变化的内外因尤其是内因。

一、词汇语义变化的外因

本文认为词汇语义变化的外因主要由社会因素、历史因素和外来词影响三方面构成。

（一）社会因素

随着人类社会不断进步与发展，新事物、新观念层出不穷。为了表达这些新事物、新观念人们有时会创造新词，但大多数情况下人们不会这样做而是将新的语义赋予旧词。如果一有新事物出现就造一个新词，那么词汇量就会越来越大，加重人们记忆的负担，同时也不符合人们做事的经济原则。而通过赋予旧词新意的方式人们能在较短的时间内将其记住。比如，mouse(老鼠)一词用来指电脑的“鼠标”，head(头)用来指“领导”或“头目”等，这样人们就可以节省记忆词形的时间，只需将新的语义记住即可。

（二）历史因素

历史因素指词汇的形式不变，而其所指改变引起语义的变化。随着历史的变迁，人类的认知水平不断提高，许多词语被人们赋予了新的语义。例如：pencil一词源于拉丁语指“小尾巴”或“小毛刷”类似于中国毛笔，而现在虽然这种笔的材料已被铅和木头代替，但人们仍用pencil一词表铅笔。

（三）外来词影响

在许多语言中都或多或少存在一些外来词，为了区分语义相近的本土词汇和外来词汇，人们往往会在本土词语义上作一些改变以示区别。例如：pig, sheep和cow在古英语中他们分别指动物“猪”、“羊”和“牛”或“猪肉”、“羊肉”和“牛肉”。但后来由于法语词pork, mutlon和beef传入了英语中，特指“猪肉”、“羊肉”和“牛肉”，因此人们为了区别，就将pig, sheep和cow用来只指动物“猪”、“羊”和“牛”。

二、词汇语义变化的内因

语义是人类赋予词汇的，人们在赋予某个词汇语义时往往会先考虑该语义与这个词汇是否有关联，因为关联性越大越便于人们熟悉和记忆。语义变化也一样，为何增加、减少或完全改变某个词的语义都是人类为了交际方便和需要，将要增加、减少或改变的语义与该语言中的词汇进行比照，最终挑选出最佳词汇的结果。而这整个过程都是由人类的认知思维完成的。因此认知思维在创造新词和词汇语义变化过程中起着决定性作用。

在认知语言学中，认知指包括感知觉、知识表征、概念形成、范畴化、思维在内的大脑对客观世界及其关系进行处理从而能动地认识世界的过程，是通过心智活动将对客观世界的经验进行组织，将其概念化和结构化的过程。在概念形成和推理过程中，人的生理构造、身体经验及人的感知觉能力(观察、选择、注意力)和人的想象力(图式组织、心理意象、隐喻和转喻认知方式)扮演了重要角色[3]。在人的认知思维中，对语义变化起决定作用的主要是隐喻思维。

这里所讲的隐喻并不是人们传统意义上的修辞手法，而是一种思维方式。隐喻的本质是通过一种事物来理解或表达另一种事物[1]。隐喻这种抽象的认知能力来源于对两个概念的“相似”的认识[3]。隐喻不仅是词汇发展的动因，还是语言结构组成的动因之一，例如，人们实际上是通过源范畴money(金钱)来思考和概念化目标范畴time(时间)的，所以我们日常生活中才有以下表达：

(1) You’re wasting my time.%你在浪费我的时间。

Can you give me a few minute?%能给我几分钟吗?

How do you spend your time?%你怎样利用你的时间呢?

We are running out of time.%我们没有时间了。

这些例子中wasting, give, spend, running out本是用于描述money(金钱)的，time(时间)作为一种抽象的概念，人们为了能形象理解把握它，于是将对它的认知模式转向与之相似的具体事物money(金钱)上。因此这些描述money(金钱)的词也就自然而然用到了time(时间)上。隐喻思维对词汇语义变化的作用主要通过以下几种方式完成：

(一) 通过建立人体部位与其他事物的相似链接

人类在发展过程中首先认识的是自我，为了理解其他事物，几乎人体的所有部位都已经被人们不知不觉用到隐喻中。吴静[4]指出由于人本身是一个具有三维空间的实体，比如有边界、上下、左右、前后和内外等，因此为人们认识世界万物提供了最好的参照。例如：face(脸/面)是人最明显的部位也是最受他人关注、最易给人留下深刻印象的部位。后来人们将其特征影射到其他事物上用以表示其他事物最明显、最引人注意的部分，便有了face of a mountain(山面)，face of a building(墙面)，face of a watch(表面)等表达，汉语中也有“桌面”、“地面”、“画面”等。类似的例子还有：

(2) hands%%%of a watch, of an altimeter/speedometer

(3) arm%%of a chair, of the sea, of a tree, of coat or jacket, of a record player

(4) eye%%of a potato, of a needle, of a hurricane, of a butterfly, in a flower

(5) mouth%%of a hole, of a tunnel, of a cave, of a river

(6) lips%%of a cup, of a jug, of a crater, of plate

(二) 通过建立已知事物与未知事物的相似链接

人们为了表达新事物，往往会先找新事物与已知事物之间的联系，以便找到最便利、最形象的表达方式。一些日常用语进入计算机领域就是例子之一。比如，run(运行)指机器等在工作，windows系统在工作这一情景就需要有合适的词来描述，于是人们将它与生活中的已知现象进行比较，发现它与机器工作相似，于是便用run一词表示Windows系统在工作。类似例子还有：

(7) menu:click the menu

(8) crash:the system has crashed

(9) file:save the file to disk

(10) e-mile:send an e-mile

(三) 通过建立具体域与抽象域的相似链接

为了使抽象的事物更易于理解，人们习惯于用具体的事物来表示它们。在这个过程中人们会首先找出抽象域和具体域之间的相似性，然后建立二者间的相似链接。李国南[2]认为当人们谈论抽象概念时，通常会从具体领域找词语来表达。尤其是在解释一些科学概念或技术术语时特别常见。赵艳芳[3]举了一些例子：苏格兰物理学家麦克斯韦尔(J.Maxwell)用lines of force, dance of molecule形象地解释了磁力的形状和分子的运动;著名丹麦物理学家玻尔(Niels Bohr)发现电子绕原子核运行，恰似行星绕太阳运行一样，于是在此基础上应用轨道运行的隐喻(orbit metaphor)建立了原子结构理论(atomic structure theory):Atoms are solar systems.生物学家将基因叫做镶嵌体或马赛克(mosaic)，将DNA分子描述为spirite stairway(螺旋体)或zipper(拉链)。在解释DNA决定生物传代中细胞的遗传特性时，科学家用信息传递的概念说明遗传概念：生物密码(biological code)，遗传信息(genetic message)，传递信息(transmit information)，密码转译(code translation)，密码编排(editing)，密码编码(encoding)，密码解读(reading)等。

（四）通过建立一个经验域与其他经验域的相似链接

这种情况往往出现在以经验域是人们非常熟知的而其他经验域比较生疏或陌生的情况，通感就是典型例子之一。例如：light(轻的)本来是表示重量的词，人们把它用到视觉(ligh color(浅色))、听觉(light music(轻音乐))等感官上。类似例子还有：

(11) heavy:heavy news, heavy food, heavy weather

(12) sharp:sharp outline, sharp ears

本文对词汇语义变化的原因进行了简单分析，打破了将词汇语义变化的原因归结于社会历史因素或词汇内部结构特征的疆域，为研究语义变化及其原因提供了新的思路，同时也为广大师生理解语义变化提供了新的参考。

摘要：词汇作为一个系统, 可以从共时和历时两个角度对该系统进行观察。传统语言学的研究主要是从共时角度对单个词语的考释, 本文将从历时的角度分析词汇语义变化的原因。词汇语义变化和万物变化一样是内外因共通作用的结果。本文认为词汇语义变化的内因是人的认知思维尤其是隐喻思维, 外因是社会历史因素、外来词等。

关键词：词汇语义变化,内外因,认知思维,隐喻

参考文献

[1]George Lacoff&Johnson Mark.Metaphors We Live by[M].Chicago:The University of Chicago Press, 1980.

[2]李国南.科技语言中的隐喻[J].中国科技翻译, 2003, (4) .

[3]赵艳芳.认知语言学概论[M].上海外语教育出版社, 2001.

基于本体的UML类图语义推理篇3

关键词：本体,UML类图,形式化,描述逻辑

0 引言

UML[1,2,3]是一种形式化建模语言, 可以对具有静态结构和动态行为的系统进行建模。作为一种通用的建模语言, UML越来越多地用于大型系统的建模, 但复杂系统的建模往往需要进行严格的形式分析和验证以保证其正确性。UML是半形式化的———其语法结构采用了形式化的规约, 但其语义部分则是用自然语言描述的, 缺乏准确的语义[4], 难以对模型进行语义推理验证和检查。

为了提高UML的语义精确性, 许多组织和学者提出了很多形式化UML的方法。如:英国的p UML组 (precise UML group) [5]试图给出一种相对治本的方法, 其目标是运用浅显的数学知识对UML元模型进行形式化, 从而将UML发展为一种精确的 (形式的) 建模语言。此外, 还有研究人员利用形式化语言:Z语言、Object-Z语言、COOZ语言、B语言、PVS、XYZ/E、RAISE等对UML类图进行形式化, 以提高模型的准确性。

本文在详细分析对比领域本体与UML模型之间相似性的基础上, 提出了一种基于本体的UML类图形式化方法, 通过本体的推理实现对UML类图的语义检查。由于本体与UML类图模型有着极为相似之处, 并且, 本体能在语义和知识层次上描述信息系统, 因此, 把UML类图模型转换为本体, 通过对转换后的模型进行推理, 可以检查出模型中存在的语义问题, 从而提高了建模的效率。

1 UML类图与领域本体的对比分析

类是任何面向对象系统的核心, 因此, 类图成了最常用的UML图[3]。系统的结构由一组通常称为对象的部件构成。类描述系统中不同对象的类型, 而类图则显示出这些类以及彼此之间的关系。

一个类图主要包括三部分:类名、属性和操作 (方法) 。并且, 类与类之间还存在着各种各样的关系, 包括:依赖、关联、聚合、组合以及泛化 (继承) , 这些类之间的关系依照顺序依次增强的。两个类之间的依赖, 说明一个类的对象暂时使用另一个类的对象。关联则意味着一个类的对象在一段时间内使用另一个类的对象。关联关系包括关系的方向性、角色以及基数等三个要素。方向性指关联关系是从源类指向目的类, 在不同的关系中源类和目的类具有不同的角色, 并具有1对1或1对n的数量关系。关联关系的语义为源类对象中包含目的类对象或对象引用, 因此只有当两个对象的类之间存在关联关系时, 这两个对象之间才可能会发消息。聚合是整体—部分关系, 聚合关系可以看作特殊的关联关系。组合是比聚合还强的关系 (尽管它们的工作方式非常相近) 。泛化是一种更一般描述和更具体描述之间的分类关系。

本体最早是一个哲学上的概念, 从哲学范畴上讲, 本体是客观存在的一个系统的解释和说明, 关系的是客观现实的抽象本质。在人工智能界, 本体最流行的定义是Gruber给出的即“本体是概念模型的明确的规范说明[6]”。后来, Borst在此基础上给出了本体的另一个定义即本体是共享概念模型的明确的形式化的规范说明。通过分析上述定义, Studer认为其包括四层含义:概念模型、明确、形式化和共享。Perez等人认为本体可以按分类法来组织, 他归纳出本体包含5个基本的建模元语。这些建模元语分别为:类、关系、函数、公理、实例, 通常也把class写成concept。概念的含义很广泛, 可以指任何事物, 如功能、行为、策略等等, 实例代表元素;从语义上讲, 概念就是对象的集合, 实例就是概念;关系代表了在领域中概念的交互作用, 形式定义为n维笛卡尔乘积的子集:R:C1×C2×…×Cn, 关系主要分为四类, part-of (概念之间整体与部分的关系) 、kind-of (概念之间的集成关系) 、instance-of (概念的实例与概念之间的关系) 、attribute-of (概念是另一个概念的属性) ;函数是一类特殊的关系;公理代表永真断言。

通过比较可以容易看出, UML类图与本体两者具有高度的相似性[7], 如:UML类图中的类名对应本体建模元语中的类或概念, 关系对应建模元语中的关系, 对象对应于建模元语中的实例, 属性和操作 (方法) 对应于建模元语中的函数, 但UML类图中的函数和本体建模元语中的函数有些少许差别, 例如, 为证实一个Student (一个Student必须至少选学一门课程) 的身份, 一个方法/函数get_course () 可能被声明或定义。本体中的函数一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F:C1×C2×…×Cn-1→Cn。例如mother-of就是一个函数, mother-of (x, y) 表示x是y的母亲。UML类图与本体最大的不同之处在于:本体有公理, 具备推理能力, 可以进行自身推理;而UML类图是形式化语言, 不能进行自身的推理。由于其语义的非形式化特点, 所以, UML类图所描述的系统模型往往会隐藏一些错误, 而自己不能检查出来。因此引入本体以弥补对象模型的缺陷。类图与本体之间的对应关系如表1所示。

2 UML类图与本体的转换

本体与UML类图有着许多相似的特性。基于两者的相似性, 建立UML类图到本体的转换, 将UML的类图模型转换为形式化的本体模型。本体作为一种模型需要使用具体的语言表示, 本文选择描述逻辑作为其描述语言, 同一阶谓词逻辑相比, 描述逻辑具有可判定性, 描述逻辑也已经成为其它本体表示语言 (如OIL、OWL等) 的逻辑基础, 而且, 描述逻辑也可以对象模型进行形式化[8]。最后通过对转换后的本体进行推理, 以检查出UML中存在的语义问题。

定义1一个UML类图模型是一个四元组C= (Cn, Cp, Cr, Cm) , 其中:Cn表示类名, Cp表示类属性, Cr表示类之间的关系, Cm表示多重性。在此只考虑UML类图的静态特性, 由于类的方法属于动态性的知识, 不予考虑。

定义2一个DL (Description Logic) 本体模型是一个二元组O= (N, A) , 其中, N=Concepts∪Properties∪Relationships表示一个有限的标识符 (identifier) 集, A表示一个有限的公理序列, 每个公理由作用于标识符的若干构造算子 (如, ∪, ∩, , , 等) 而实现。

显然, 很容易进行UML类图到DL本体之间的转换, UML类图中的Cn、Cp和Cr可直接转换为DL本体中的N, UML类图中的Cn、Cp、Cr和Cm通过一些构造算子可以构造成为DL本体中的公理。

下面通过一个具体实例来说明两种模型的转换:

根据上述规则, 图1可以转换为DL本体:

N是类、属性和关系的集合, A是包含公理和等价公理的集合。Employee, Name, supervise () 等直接映射为领域本体中的概念, 属性, 关系的集合;通过构造子、∩、∪构造SupervisorEmployee、TeacherEmployee、Supervisor≡Employee∩supervise.Graduate等领域本体中的公理。

3 UML类图语义推理

本文主要借助描述逻辑中的Tableau算法对转换后的本体模型进行推理, Tableau算法通过构造一棵关于概念C的Tableau树来计算C的可满足性。该算法的基本思想是:首先, 将不是NNF (Negation Normal Form) 范式的概念通过使用“德·摩根规则”转换为NNF范式, 初始化树T (T仅包含一个根节点) , 然后反复使用转换规则扩展树T, 直到各分枝出现矛盾或者无规则可用。有关描述逻辑的Tableau的算法详细介绍可参阅文献[9]。目前, 已经出现了很多的本体推理机系统, 其中最新的、应用最广泛的和最具代表性的有:Racer, Pellet, Fa CT。Racer是德国Franz Inc公司开发的一个采用描述逻辑作为理论基础的本体推理机, 不仅可以当作描述逻辑系统使用, 还可以用作语义知识库系统;Pellet是美国马里兰大学MNDSWAP项目组专门针对OWL-DL开发的一个本体推理机, 基于描述逻辑表实现;Fa CT是英国曼彻斯特大学开发的一个描述逻辑分类器, 提供对模式逻辑的可满足性测试。

下面就利用Tableau算法对图1进行推理, 图1中的概念Employee有两个分类, 分别为概念Supervisor和概念Teacher。如果图1能准确地描述现实世界, 那么概念Supervisor和概念Teacher应该是不相交的, 即SupervisorTeacher是可满足的 (satisfiable) 。如果SupervisorTeacher成立, 则Supervisor∩Teacher≠。也就是说, {Employee∩supervise.Graduate}∩{Employee∩supervise. (Bachelor∪Graduate) }是可满足的, 整个推理过程如下:

到此已经不能对树T再使用任何转化规则 (transformation rules) 了, 算法结束。树T的节点和边分别为:

由于C (x1) 含有冲突 (clash) , 所以概念{Employee∩supervise.Graduate}∩{Employee∩supervise. (Bachelor∪Graduate) }是不可满足的, 即Supervisor∩Teacher=, 原假设SupervisorTeacher不成立, 因此图1需要修改, 修改后的图形如图2所示。

归纳总结基于本体的UML类图语义推理的一般过程如下:

(1) 找出类图中的概念、关系、属性等直接转化为对应领域本体中的概念、关系和属性。

(2) 利用⊆, ∪, ∩, ﹁, ∀, Ǝ等构造算子根据类图的概念层次关系和属性构造对应中的公理。

(3) 借助描述逻辑提供的Tableau算法对转换后的本体模型进行推理。初始化树T, 将不是NNF范式的概念通过使用“德·摩根规则”转换为NNF范式。

(4) 反复利用上述规则扩展树T, 直到各分支出现矛盾或无规则可用为止, 修改类图。

4 结论

UML作为一种图形化建模语言, 其语义描述是非形式化的, 且缺乏推理能力, 不能对其所建模系统进行语义检查, 使得所建立的模型存在不一致等问题, 影响了建模效率。本文提出了一种基于本体的UML类图的形式化方法, 通过本体提供的推理能力, 对UML类图进行推理, 从而检测出隐藏在UML类图中的不一致等问题, 以达到精确建模的目的, 提高了建模效率。

参考文献

[1]Grady BoochJ, ames Rumbaugh, Ivar Jacobson.The Unified Modeling Language User Guide SECOND EDITION[M].Addison Wesley Pro-fessional, May 19, 2005.

[2]Kim Hamilton, Russell Miles.Learning UML 2.0[M].O'Reilly, A-pril, 2006.

[3]邵维忠, 蒋严冰, 麻志毅.UML现存的问题和发展道路[J].计算机研究与发展2, 003, 40 (4) :509-516.

[4]Evans A, Kent S.Core Meta-modeling Semantics of UML:The pUML Approach[DB].http://www.cs.york.ac.uk/papers/pumlun199.pdf, 2005.

[5]Borst P, Akkermans H.An Ontology Approach to Product Disassembly[C]//EKAW 1997, Sant Feliu De Gu5xols, Spain, October:15-19.

[6]Dencho N Batanov, Waralak Vongdoiwang.Using Ontologies to CreateObject Model for Object-Oriented Software Engineering[M].In:Shar-man, Raj, et al.ONTOLOGIES:A Handbook of Principles, Conceptsand Applications in Information System, Chapter 16.New York:Springer, 2007.

[7]Daniela Berardi.Using DLs to reason on UML class diagrams[C]//Proc.Workshop on Applications of Description Logics.2002.

【词汇语义图】推荐阅读：

词汇语义化09-16

语义场理论词汇教学07-01

工程图学常用英文词汇08-28

运用思维导图辅助英语词汇教学07-17

语义类型06-05

语义数据06-06

语义变化06-07

语义模型06-17

语义比较06-20

语义检索07-04