本体空间

2024-09-23

本体空间(精选3篇)

本体空间 篇1

1 概述

空间关系是指地理实体之间存在的一些具有空间特征的关系[1],主要包括拓扑关系、方向关系和距离关系3大类。方向关系是在一定的方向参考系统中从一个空间对象到另一个空间对象相对于基本参考方向的指向,描述对象在空间中的某种排序。方向关系可以进行定性描述和定量描述。定量描述方法使用方位角等比率量表精确地给出空间对象间的方向关系值。定性描述方法是用顺序量表概略地描述方向关系,如东南西北等。

空间推理(Spatial Reasoning,SR)是指利用空间理论和人工智能技术对空间对象进行建模、描述和表示,并据此对空间对象间的空间关系进行定量或定性的分析和处理的过程[3,4,5,6,7,8,9]。目前,空间推理被广泛应用于地理信息系统、机器人导航、高级视觉、自然语言理解等方面,受到了国际GIS及相关学术界的高度重视。随着研究的深入,近年来人们逐渐认识到,空间关系本质上是定性的[2],空间推理本质上也是定性的[3]。因此,定性空间推理作为表示和处理空间知识的一种有效方法,近几年受到普遍重视。

定性空间推理的方法主要有基于谓词逻辑的推理[5]、基于代数的推理[6,7,8]、基于产生式规则的推理[9]、组合表推理[4]以及基于语义网的推理等,这些方法在进行空间知识表示和处理时,普遍缺乏空间知识的共享和重用。

在空间知识表示和处理时引入地理本体,研究基于地理本体的空间方向关系定性推理方法,并实现了基于地理本体的空间方向关系定性推理原型系统。

2 地理本体的逻辑结构

本体最早是一个哲学的范畴,是客观现实的一个抽象本质。地理本体是有关地理科学领域中共享概念模型的明确的形式化规范说明。在地理本体概念中,“共享”体现的是共同认可的知识,反映的是地理科学领域中公认的概念集,针对的是团体而不是个体;“概念模型”是通过抽象出客观现实中的相关概念而得到的模型,其表示的含义独立于具体的环境状态;“明确的”是指所使用的概念及使用这些概念的约束都有明确的定义;“形式化规范说明”是指计算机可读的。

地理本体的逻辑结构可以表示七元组:

C表示类(概念),指一组共享某些相同属性的个体。

R表示概念之间的语义关系,诸如概念之间的相交、不相交、等价等关系。

H表示概念之间的层次关系,主要是指父类-子类关系(sub Class Of),也可表示超集-子集关系。

P表示属性,属性分为对象属性(Object Property)和数据属性(Datatype Property)。对象属性把两个个体关联起来,表示个体之间的关系;数据类型属性把一个个体和一个数值关联起来,表示个体到数值之间的关系。比如河流的“汇入”属性、“连接”属性都是对象属性,而河流的“名字”属性,“长度”属性都是数据属性。

PR表示对属性的限制,主要是对属性取值的类型,范围以及最多最少个数等的限制。

PC表示属性的特征,就是属性本身具有什么样的特性。在OWL可以声明属性具有传递性、对称性、函数性(属性只有一个唯一的值)、反函属性或者是其他属性的逆反属性。

I表示个体,个体是类的实例,可以用属性关联起来,比如说长江、黄河、汉江都是河流这个概念的个体。

3 空间方向关系定性推理

3.1 空间方向关系模型

使用投影模型中的井字空间作为方向关系表示模型,并在郭平[4]的D14的基础上进行改进,提出了基于井字空间的方向关系模型D10。

令RE(正东),RS(正南),RW(正西),RN(正北),NW(正西北),SW(正西南),SE(正东南),NE(正东北),SA(同位)为基于井字空间的方向关系,改进的方向关系定义为:

通过目标空间对象与NW、SW、NE、SE、NORTH、EAST、SOUTH、WEST、SA之间的交的结果来描述它与源空间对象之间的方向关系,如果都不匹配则为nil。

3.2 地理本体推理机

由于目前的推理机都是针对一般的信息本体的,无法对地理本体中专有的概念和属性进行解析和推理,也没有专门地地理本体推理工具。想要对地理本体进行推理,只有通过在已有的推理机中加入自定义的地理概念规则,使得推理机可以理解地理概念、属性及其特征,从而支持地理知识的推理。支持自定义规则的本体推理机的典型代表就是Jena。

规则在Jena中被定义为一个Rule对象,它的语法格式如下:

根据空间方向关系D10模型构建了106条规则,分别表示了方向关系中的传递性、互逆性以及相互组合的结果。这些自定义规则与Jena推理机绑定,使之满足空间对象之间方向关系推理的需要。

例如:a在b北边,b在c北边,那么可以推理出a和c的关系是北、东北或西北,可以将其编辑成为以下内容:

3.3 推理过程

按照地理本体的逻辑结构构造地理本体,并将GML数据源中的地图数据无损地转换成符合地理本体要求的应用本体,所进行的推理都是建立在应用本体的基础之上的。

在推理机导入本体的过程中,会将整个应用本体转换成一个等价的RDF图,具体步骤如下所示:

(1)解析本体文件,得到本体模型。

(2)利用RDFS、OWL等推理规则计算第一步得到的本体模型的语义闭包。

(3)在第二步的基础上计算自定义规则的语义闭包。

(4)返回第三步得到的语义闭包。

每一个本体中的对象都对应于图中的一个节点,而对象两两之间的关系就对应于图中节点之间的连线,由于空间关系的特殊性,这个连线是有向的。因此推理的过程,本质上就是结合规则查找从一个节点到另一个节点的路径的过程。如果能够找到,则将连线的值(即关系)返回,如未找到,则表明根据目前本体中已有的信息无法定性获得这两个对象的关系。

经过Reasoner推理,不但能够查询出RDF图模型明确声明的信息,而且根据Ontology中的公理、定理、规则、实例数据可以得到其中隐含的信息。推理产生的RDF图模型只能够保存在内存中,因此隐含关系也只能保存在内存中,供本次的查询推理使用。为了提高系统的相应效率,可以对用户的查询日志进行分析,将经常使用的派生语义关系存储在数据库中以备重复使用。

在推理的过程中,Ontology起到了关键的作用,它提供了领域的知识,明确地表达了领域概念及其之间的关系,使得推理机能够实现语义上的推理。

4 原型系统

基于地理本体的空间方向关系定性推理原型系统的总体框架如图1所示。

基于地理本体的空间方向关系定性推理原型系统的总体框架共分为3层,分别是数据层、处理逻辑层、表示层。

(1)表示层:提供图形用户界面,实现地图基本操作(放大、缩小、漫游、测距)、空间对象选择、推理结果输出展示等功能。

(2)处理逻辑层:是整个系统的核心,实现地图操作、空间方向关系定性推理,主要包括:

数据格式转换:利用XSLT(e Xtensible Stylesheet Language:Transformations)语言编写格式转换程序,将地理标记语言GML描述的地图数据源转换为网络本体语言OWL描述的地理本体,存储在本体库中。

方向关系预写模块:在本体中写入一些空间对象的方向关系,在这些关系的基础上进行定性推理。

自定义规则维护模块:采用基于自定义规则的地理本体推理。

定性推理模块:采用典型的本体推理机Jena进行地理本体推理,将自定义规则与推理机绑定,采用混合推理模型。用户请求查询两个空间对象之间的关系时,推理机首先在应用本体中查找这两个空间对象,如果有任何一个对象并不是本体中的实例,则直接退出,并返回错误提示信息;如果能够找到这两个空间对象,则将这两个空间对象实例化为Jena中的两个Resource对象。

本体修复模块:OWL DL是基于描述逻辑的,因此总能保证推理的可判定性。因此本体修复模块最主要的作用就是对已有的应用本体进行修改,保证应用本体的描述语言是OWL DL。本体修复模块通过对本体文件进行一些简单的修复工作(诸如添加类型声明等),便可以将一些原本属于Full级别的本体文件降为DL级别,从而保证了本体推理的可判定性。然后再将修复过后的本体文件提交给语义推理模块进行推理。

(3)数据服务层:提供地图数据源、本体的存储管理场所。

4.1 地理本体构建

采用斯坦福大学开发的免费、开源、基于Java且提供了可安装插件易扩展环境的本体编辑器Protégé3.1.1来构建地理本体。空间方向关系采用D10模型。

4.2 定性推理

在定性推理模块采用Jena推理机提供的支持自定义规则Generic rule reasoner的混合推理模型,建立Model的部分代码如下:

当用户请求查询两个空间对象之间的关系时,推理机首先在应用本体中查找这两个空间对象,如果有任何一个对象并不是本体中的实例,则直接退出,并返回错误提示信息;如果能够找到这两个空间对象,则将这两个空间对象实例化为Jena中的两个Resource对象。如:

在推理机导入本体的过程中,会将整个应用本体转换成一个等价的RDF图,每一个本体中的对象都对应于图中的一个节点,而对象两两之间的关系就对应于图中节点之间的连线,由于空间方向关系的特殊性,这个连线是有向的。因此推理的过程本质上就是结合规则查找从一个节点到另一个节点的路径的过程。如果能够找到,则将连线的值(即关系)返回,如未找到,则表明根据目前本体中已有的信息无法定性获得这两个对象的关系。

4.3 实验结果

在图2基于地理本体的空间方向关系定性推理原型系统中,选择源空间对象Washington(Province)、目标空间对象180(Major Highway),点击“计算”按钮,系统就会在后台进行计算,将两个对象实例化为Jena中的Resource对象,然后调用Jena推理机进行推理,得出两个对象之间的方向关系为南或东南,而根据常识直观判断可知,目标对象是在源对象的南部,因此推理结果是正确的。

5 结语

目前,已经实现了基于地理本体的空间方向关系定性推理系统原型,但是还仅限于Jena自定义规则Generic rule reasoner的混合推理模型。其他Reasoner类型的推理模型、其他空间关系(如拓扑关系、距离关系)的定性推理是下一步工作的重点

摘要:围绕基于地理本体的空间方向关系定性推理进行研究,给出了定性推理系统总体框架,并对方向关系模型、自定义规则、地理本体、定性推理进行详细探讨。

关键词:方向关系,地理本体,定性推理

参考文献

[1]陈述彭,鲁学军,周成虎.地理信息系统导论[M].北京:科学出版社,1999:26.

[2]NM Gotts,JM Gooday,AG Cohn.A connection based approa-ch to commonsense topological description and reasoning[J].The Monist:An International Journal of General PhilosophicalInquiry,79(1).

[3]郭庆胜,杜晓初,闫卫阳.地里空间推理[M].北京:科学出版社,2006.

[4]郭平.定性空间推理技术及应用研究[D].重庆:重庆大学,2004.

[5]D.Randell,Z.Cui and A.Cohn.A spatial logic based on regionsand connection[C].Proceedings of the 3rd InternationalConference on Knowledge Representation and Reasoning,Morgan Kaufmann,1992:165-176.

[6]Allen JF.Maintaining Knowledge about Temporal Intervals[J].Communications of the ACM,26(11),1983:823-843.

[7]Freksa C.Using orientation information for qualitative spatialreasoning[M].Heidelbery:Springer Berlin,1992.

[8]Rohrig R.A theory of Qualitative Spatial Reasoning based onorder relations[C].Proceedings of 12th American Conferenceon AI(AAAI-94),1994:1418-1423.

[9]孙玉国.拓扑空间关系描述与2DT-String空间关系表达[D].武汉:武汉测绘科技大学,1993.

[10]刘亚彬,刘大有,王飞.定性空间表示和定性空间的研究与发展[J].计算机科学,2003,30(3):65-67.

本体空间 篇2

关键词:地理本体,空间数据服务,语义推理,服务资源检索

1 地理本体在空间数据服务中的作用

空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它可以用来描述来自现实世界的目标,然而空间数据的多源性、多语义性、多时空性、多尺度性以及表示方法的多样性等特点造成了不同数据之间的多维异构性,这对空间数据的综合应用及系统间的交流造成了极大的不便,造成了目前的空间数据服务的智能化程度较低的现状。

本体的出现为空间数据的语义表达和推理提供了有效的手段,现阶段本体在异构数据集成、智能数据检索、数据挖掘抽取等方面发挥了重要的作用,取得了一定的应用效果。但在领域知识的形式化表达、时空推理分析、潜在语义的发现等方面仍没能很好地发挥本体技术的语义表达和解析能力的优势。本文将在空间信息服务网络环境下,尝试将本体引入到空间数据服务检索中,通过示例展示对领域知识的表达和推理方法,试图为地理本体的应用提供思路和参考。

2 地理本体在空间数据服务中的应用

本体知识库所能提供的语义知识不仅仅是行业术语以及概念间的层次关系,更重要的是这些术语间的语义关联。地理本体可通过语义属性和推理规则表达反映地学领域知识的潜在语义关联,可解决目前因为语义关系而造成的空间数据服务的无法精确选择、空间数据服务中的过多依赖人工交互、关键词查询中的匹配错误等问题。

2.1 地理本体在空间数据服务中的应用

将地理本体引入到OWS(OGC Web Service体系)中,通过建立面向空间数据服务的多层地理本体和基于本体技术的空间数据服务机制,实现在多源空间数据服务过程中的智能化和精确化,可解决目前因为语义关系而造成的空间数据服务的无法精确选择、空间数据服务中的过多依赖人工交互、关键词查询中的匹配错误等问题。

基于本体的空间数据服务资源发现技术主要研究在不同的数据源服务之间,如何利用基于本体的语义逻辑,来搜索和定位到最适合于用户真实需要的数据源服务。在基于Web服务的数据服务系统中,传统注册中心能够管理的仅仅是服务注册信息,也就是WS-DL中必需的信息。这些信息的结构是无差别的,不仅对于数据源是无差别的,甚至对于数据源和计算资源之间也是无差别的。基于本体的改进,就将这种资源发现过程复杂化,查询的请求会被推理机基于已经构建的本体体系来进行推理,推理的结果将大大有助于准确定位用户最终需要的某个数据资源。

当用户提出空间数据服务请求时,首先根据服务要求进行基于语义的分析和匹配,待确定针对特定空间数据资源的具体应用本体后,才通过空间数据资源的接口获得具体的资源数据和服务,使得空间数据服务处理过程是基于语义的,便于多源空间数据服务的集成和互操作。

2.2 地理本体应用举例

地理本体在空间数据服务中数据检索的应用中,地理本体知识库的建立和完善是重点,是语义分析和推理的重要依据,直接关系到应用的效果,需要采用与领域专家交互的反复改进和完善过程,目前存在较多的本体建立方法,此处不再累述。下面将通过一个典型案例来反映地理本体在空间数据检索中的应用技术。

用户通常能看到图像的来源(遥感卫星数据)和基本属性,能了解到具体应用所需要的图像特性,但不能直接建立应用和遥感卫星间的关联,下面的实例将采用基于语义的本体技术,来解决应用和卫星间的语义相关性推理分析。

(1)建立一个实验本体,包含有:image、satellite和application三个类(概念),image类的主要语义属性有:分辨率resolution、图像文件大小size、图像反映区域area,satellite类的主要语义属性有:卫星类型kind、传感器名称sensor、轨道orbit,application类的主要语义属性有:应用领域field、应用时间time。

(2)定义这些类间的语义关联,包含有:反映应用关系的applyTo语义关系、反映数据来源的getFrom语义关系、反映使用关系的getUse语义关系,使用OWL描述如下所示:

(3)编写语义推理规则,本实例使用Jena推理机进行语义推理,用于表达遥感应用和观测卫星间潜在语义关系的语义推理规则如下所示:

该推理规则所反映的语义含义为:若某个image实例存在与某个application实例对应的applyTo语义关系,并且该image实例存在与某个satellite实例对应的getFrom语义关系,则可推断出该application实例存在与该satellite实例对应的getUse语义关系。

(4)添加各类的实例,设定各实例的语义性,以及各实例间的applTo和getUse对象间语义关系,具体对象属性设置如图1中实线所示(实线表示预先描述的语义信息)。根据上面定义的语义规则,可以分析并发现图1中虚线对应的getUse语义关系的存在(虚线表示经过推导产生的潜在语义关联),下面将使用Jena推理机制,实现这些虚线所表示的对象关系的自动推理产生。

基于此本体库的语义推理演示页面如下所示,其信息检索过程如下:

首先是图像的数据类型属性查询页面,可以通过该页面检索到需要查看的image信息;

查询成功后,可以查看到image实例的全部数据类型属性信息和对象属性关系;

点击具体applicatin实例或satellite实例的超链接可以打开对应实例的属性信息显示页面,若点击application1超链接,则打开application1的属性信息页面,如图2所示,可以看到getuse对象属性对应到satellite1和satellite2;

若点击application2超链接,则在打开的application2的属性信息页面中,如图3所示,可以看到getuse对象属性对应到satellite3。

图3 application2实例的信息显示页面

通过演示页面可以看出,经过Jena基于规则进行的语义推理,推导出了图1中虚线所示的GetUse对象属性,获得了预期的语义推理效果,实现了领域专家知识与程序代码的分离和形式化表达。

同样可依据相同的方法,定义更多类的对象属性,并设定相应的推理规则,即可完成同义关系、近义关系、反义关系等概念间关系的分析,还可对时空关系和领域知识进行形式化描述和推理,以及经过组合后更复杂的基于语义的空间数据检索推理。

3 结论

地理本体在地理信息科学中应用受到业内人士的重视,基于本体的地理信息表达和服务具有独到的优势,解决了地理信息的知识重用、知识共享、智能化、和网络化推广等问题,具有广泛的应用前景。本文在调研和分析国内外地理本体的研究现状基础上,分析了现阶段地理本体在领域知识的形式化表达、时空推理分析、潜在语义发现等方面存在的问题,尝试在空间信息服务网络环境下,将地理本体引入到空间数据服务检索中,给出了空间信息领域知识的本体形式化描述和推理方法,通过典型案例对地理本体应用的具体技术进行了说明。地理本体中的语义关联描述和发现技术将在本体应用中发挥重大的作用,本文对该问题进行了探索性的研究,进一步的研究工作包括有:复杂领域知识的形式化表达、空间信息的时空综合化推理、地理本体在网络环境下的应用模式等。

参考文献

[1]邓志鸿,唐世渭,张铭等.Ontology研究综述[J].北京大学学报(自然科学版),2002,38(5):730-738.

[2]黄茂军.地理本体的关键问题和应用研究[M].合肥:中国科学技术大学出版社,2006:19-27.

[3]陈建军,周成虎,王敬贵.地理本体的研究进展与分析[J].地学前缘,2006,13(3):81-90.

[4]黄茂军,杜清运,吴运超等.地理本体及其应用初探[J].地理与地理信息科学,2004,20(4):1-5.

本体空间 篇3

地理信息系统(Geographic Information System)中,以形式化本体描述地理语义关系在各种相关应用中日益普遍,例如GIS数据的融合、查询以及最优路径查找和地理知识发掘。作为GIS的一个组成部分,地理空间聚类分析也可以考虑集成本体,例如将地理信息背景知识注入到标准的聚类算法中,以提高聚类算法的智能化。将地理背景知识(如行政区划、河流阻碍和土地类型等)和聚类分析操作用户作为环境条件,进行基于背景知识的推理,用以指导和监督聚类过程,使聚类结果更加合理。

地理空间数据挖掘[1]是在空间数据中抽取得到隐含的空间关系和空间知识,发现未显示的空间特征和模型。空间分析是这一工作的重要组成部分,也是GIS的本质所在。GIS通过空间分析功能,获取隐藏在地理数据之中的信息和关系[2]。空间分析最早从测绘学中发展起来,其在很多相关领域的应用都推动了空间分析的发展。例如生物学中要研究某物种的分布,流行病学有时要用到地图来研究传染病的传播情况,营销学要进行最佳商业网点的选址等。传染病学中GIS空间分析的一个著名案例是对1854年发生在英国伦敦地区的霍乱疾病的控制。在控制过程中,John Snow博士针对霍乱患者在地图上的空间分布进行分析,确认了引发霍乱的病源,同时也证实了霍乱是通过水而非空气传播,其空间分析如图1所示。

空间聚类分析(Spatial Clustering Analysis)[2]是地理空间数据挖掘的主要手段之一,已广泛应用于各类学科,例如地理学、地质学、城乡规划学及公共卫生等诸多领域。空间聚类是基于空间的分布关系,将地理空间中相类的对象分在同一集合(cluster),将不相类的对象分在不同的集合中。通过空间聚类方法,既可以发现隐含在地理空间数据中的分布规律,又可以与其它数据分析方法结合使用,发掘出更深层次的地理知识。同时,空间聚类分析是数据挖掘的重要组成部分,有的挖掘方法要以空间聚类为初始条件,例如在进行空间叠加分析前,需要知道地理实体聚类。地理信息科学如今已进入大数据时代,数据挖掘与知识发现更凸显出其重要作用,空间聚类技术的应用价值也日益显现。

1 DBSCAN聚类算法及约束问题

DBSCAN(Density-Based Spatial Clustering of Appli-cations with Noise)[3]是一个比较有代表性的基于密度的聚类算法。该算法采用地理空间对象的密度连接可以判断发现任意形状的聚集类,具体而言即存在于一个类中的每个对象,包含在其给定半径领域的对象应大于或等于一个给定的最小数量。

DBSCAN算法中的几个定义如下:

E领域(neighborhood of a point):存在对象p半径为Eps内的区域D称为该对象的NEps(p)领域,形式化定义为NEps(p):{q∈D|dist(p,q)<=Eps}。

核心对象(core objects):存在对象p的E领域内样本数大于等于MinPts(领域中包含的最小值),则给定对象p为核心对象。

直接密度可达(directly density-reachable):在聚类样本集合D中,如果对象q在对象p的NEps(p)领域之内,且p为聚类定义中的核心对象,则对象p直接密度可达对象q。

密度可达(density-reachable):对于聚类样本集合D,存在一串样本序列对象p1,p2,p3,...pn,其中前后两个对象可直接密度可达,则设存在p1密度可达qn。

密度相连(density connected):对于聚类样本集合D中任意一对象o,存在有一对象p到对象o密度可达,且存在另一对象q到对象o也可密度可达,则对象q与对象p是密度相连,如图2所示。

但是,传统没有地理语义约束的DBSCAN算法与实际环境中的空间聚类应用之间存在差距,因为在实际应用中会遇到地理空间环境中特有的约束问题。如,某集团在武汉地区进行经营扩张,需要增加若干分店,为了能够对增加的分店进行合理选址,某集团决策部门希望将分店位置选择在客户集中的核心位置,这就需要对区域居民进行聚类分析。具体就武汉的地理环境而言,武汉三镇被长江和汉水分隔,则该河流阻碍的约束条件不能被忽略,如图3(a)所示。如果忽略了长江和汉水的空间约束条件,空间聚类分析后就会获得如图3(b)所示的聚类结果,这显然不合常理,被河流阻隔所约束的合理的聚类结果应该是如图3(c)所示。因此,在实际应用中,DBSCAN算法为了实现其可用性,应当基于空间约束条件进行聚类。而本文所提出的方法是基于本体表达约束关系集成DBSCAN,可以解决这一问题。

除了空间障碍物的约束,DBSCAN算法也很少考虑地理信息的背景约束,往往导致聚类结果和实际情况不符。如在分析教育机构的聚类情况时,教育机构具有从属不同学区的性质,因而很可能将虽然空间距离很近但学区从属关系不同的对象归为同一聚类,如图4所示。

2 本体与地理本体

2.1 本体

本体(ontology)是哲学上的传统概念,从本体论的基本概念出发,哲学上将本体定义为“对世界上客观事物所进行的系统描述”[4]。它依赖于所采用的表达语言,按照表示和描述的形式化分类,可以分为非形式化、半形式化和完全形式化这3类。在计算机中,以本体表达语言表达的本体形式化程度越高,越有利于计算机进行智能地自动化处理。本体技术涉及逻辑描述(Description Logics)和推理(reasoning)两大相关技术。GIS也是计算机技术的应用领域之一,因此,地理信息知识的本体表达也包含在其中。

RDF(资源描述框架)是描述资源的一项标准(W3C的推荐标准)。可以将RDF考虑成由结点和箭头构成的图。一个简单的RDF结节属性如图5所示。

2.2 地理本体

从哲学中的本体论延伸到不同的具体学科领域,地理信息科学中本体论的目标是确定领域内的概念和个体,并明确它们之间的相互关系,提供对该领域知识的描述,并可通过逻辑推理获取地理信息领域的知识。表达对地理目标域的描述是地理信息本体的突出特征,主要涉及地理概念、类别、关系和过程的研究。而地理信息本体的含义体现在通过对地理概念及关系进行明确的形式化定义,应用于基于语义的地理信息本体集成系统[5]。

将本文所述形式化地理信息本体定义为ontology:(C,R,F,A,I),该表达式中C表示地理信息概念的集合,R表示关系的集合,F表示函数的集合,A表示公理的集合,I表示个体的集合。

3 本体描述的知识库

3.1 DBSCAN算法中的地理本体

本文方法是利用OWL形式化定义DBSCAN算法中的地理本体,其目的是建立知识库,进行约束条件下的DBSCAN聚类分析。OWL是常用的一种表达本体的语言(Ontology Web LanguageL),其基础是描述逻辑。利用OWL编写本体能够清晰明确地描述地理信息领域内概念的含义及这些地理信息概念之间的相互关系。其设计思路是面向对象的路线,按地理空间中类和关系(空间关系和非空间关系)的形式描述地理知识,即一个本体由类和关系构成。对于普通本体而言,要表达的语义关系主要是part-of、kind-of、attribute-of、instance-of 4种。但对于地理本体而言,除了表示地理概念的非空间特征关系外,更为重要的是要表示地理概念中的空间特征关系,OWL语言表达的地理本体在处理具有地理空间特征的问题时必须进行扩展[6]。

本体建立是基于本体知识库表达地理空间的约束条件进行聚类的基础。本文建立与DBSCAB相关的地理本体,其它本体暂不考虑。描述逻辑的地理信息本体中的类(class)、空间和非空间属性(Spatial property)对应描述逻辑中的概念(concept)、空间和非空间关系(Spatialrela-tion)。类以及类之间的层次关系即为TBox中的概念公理和关系公理,类的实例和关系的实例即为ABox中的实例(个体),除了这两个普通本体的关系,地理本体的类需要增加空间关系公理,具体到DBSCAN算法还应该增加约束公理(constraints axiom)。

针对DBSCAN中的约束条件,用N3 格式定义聚类空间中的地理对象及其关系。地理对象的本体分为两类:基础要素本体和POI(兴趣点)本体。地理本体关系在DBSCAN算法中分为4 类:拓扑关系、方位关系、距离关系和约束关系。

3.2 DBSCAN算法中的本体构建

针对DBSCAN算法中使用的地理数据的概念及关系,按照一般本体构建方法,建立其本体结构如图6所示。

地理本体除了part-of、kind-of、attribute-of、instance-of几种关系外,还应定义表现空间关系及DBSCAN约束关系,如图7所示。

通过上图定义可知,DBSCAN算法本体中所包含的空间约束关系”hasConstraint”包括障碍约束、行政区划约束等。本文所述的主要是待分析POI对象集与基础地理要素之间的约束关系,该关系集合可根据算法具体约束要求进行扩展。

3.3 聚类分析对象的个体对象及其约束定义举例

为了提高本体的推理与检索效率,本文采用国际上流行的标记格式Notation3表达本体。Notation3(N3)基于简约的非XML串行RDF模型,比通常基于XML在语法上更紧凑、更易读。

被长江阻隔的两个类别为POIFEATURE/金融机构/ATM的POI点,以a点和b点为例,利用N3格式的owl表达如图8所示。

定义a、b两点为:

可以看出,个体a、b分别根据其空间位置定义了与长江的“方向关系”。通过规则1进行推理可得出两对象是否被约束(被长江所阻隔)。

[rule1:(?feature1 :left_to:长江)(?feature2 :right_to :长江)-> (?feature1 :hasConstraint?feature2)]

如图5中不同行政区从属小学个体约束关系可表达为:

通过规则2进行推理可得出两对象是否被约束(属于不同学区)。

[rule2:(?feature1 :hasBelongDistrict ?a)(?feature2 :hasBelongDistrict?b)notEqual(?feature1,?feature2)notE-qual(?a,?b)-> (?feature1 :hasConstraint?feature2)]

4 本体约束下的DBSCAN空间聚类算法

聚类算法是非监督类的方法,而非监督类的聚类分析方法往往因为缺乏指导性的知识,而使分析结果不合理。本文利用本体论方法构建知识模型用以指导DBSCAN算法进行空间聚类。在原DBSCAN基础上,对算法进行聚类时,通过对地理本体库中的本体及约束规则进行推理,以判断当前数据是否有相互约束关系。如果被约束(两地理空间对象被水系阻隔或从属不同行政区),则进行相应处理(如将两对象距离设置为大于Eps)。本体表达约束的DBSCAN算法框架如图9所示。

利用本体论进行基于约束条件的聚类分析,实行上就是以地理领域知识作为指导,进行半监督聚类分析。

5 空间约束下DBSCAN聚类应用实例

基于本文方法创建DBSCAN算法实验原型,通过互联网上的地图服务获取地图数据,在C# 中自定义DB SCAN类,读取owrl格式的规则文件对owl本体库数据进行推理生成约束条件,在约束条件下根据用户输入参数进行地理空间聚类分析,最后将分析结果显示在电子地图上。其设计思路如图10所示。

设置限定聚类区域为“武汉”,限定POI分析类别为“小学”,Eps设置为2 000m,Minpts设置为3,demo测试结果如图11、图12所示。

从图12可以看出,虽然以空间位置上的欧几里得距离为评价标准,c点与b点之间的距离比a点与b点之间的距离大,但由于地理本体语义规则中“汉水”的障碍约束条件,b点被划分到了c所属的6聚类中,而不是归到“汉江”对岸a点所属的0聚类中。

6 结语

利用地理本体描述的背景知识辅助DBSCAN聚类分析的目的是为了得到合理的空间聚类分析结果。以本体论为指导思想,建立基于地理空间聚类应用的本体库,定义约束规则,经过规则推理得到地理信息实体对象之间的约束关系,在约束条件下进行聚类分析。由开发的原型程序可知,在由本体描述的空间约束条件的辅助指导下,程序得到的聚类结果能够合理地揭示潜在地理数据之间的关系。故此,笔者认为在实际应用中,诸如聚类分析等的空间分析功能集成本体论方法有助于合理地挖掘地理空间信息。例如,建立人口密度等本体知识库对学校的空间分布进行聚类分析后,对教育资源的合理布局有着辅助作用(新建的学校选址在学校聚集度低而人口密度高的区域)。目前,本文只是初步实现了利用本体表达约束条件进行空间分析的功能,未来工作应进一步深入到有关地理信息语义网方面,并结合智能计算,提高空间聚类分析效率。

参考文献

[1]李德仁.论空间数据挖掘和知识发现[J].武汉大学学报:信息科学版,2001,26(6):491-492.

[2]HAN J W,KAMBER M.Data mining:concepts and techniques[M].Morgan Kaufmann Publishers,2000.

[3]ESTER M,KRIEGER H P,SANDER J,et al.A density-based algorithm fordiscovering clusters in large spatial databases withnoise[C].Proc.of the 2nd Int’l Conf.on Knowledge Discovery and Data Mining,1996.

[4]STUDER R,BENJAMINS V R,FENSEL D.Knowledge engineering:principles and methods[J].Data and Knowledge Engineering,1998,25(1/2):161-197.

[5]苏里,朱庆伟,陈宜金,等.基于地理本体的空间数据库概念建模[J].计算机工程,2007,6(12):75-80.

【本体空间】推荐阅读:

本体本体07-11

安全本体05-20

本体因素05-29

体育本体06-07

本体课程06-11

机械本体08-04

本体研究09-01

旅游本体09-05

本体思考09-17

本体异质结05-08

上一篇:操纵控制下一篇:四位一体机制