粒度模型

粒度模型（通用4篇）

粒度模型篇1

0本体（Ontology)

目前对于Ontology的定义使用最多的是:Ontology是共享概念模型的形式化规范说明。概念模型(conceptualization)指通过抽象出客观世界中一些现象的相关概念而得到的模型。可以将概念作为一个具有固定长度的字符串来表示，如表一所示。

在表一中，*表示概念的外延，其它的则表示概念的内涵。

采用内涵+外延来表示概念，内涵表示概念中明确的层次信息，外延表示概念中非明确的层次信息。内涵越大，概念越明确;相反地，外延越大，概念越不明确。

Ontology中的公理代表永真断言(assertions)，也可以将它看作为Ontology中的约束。公理主要包含两个方面:属性公理和关系公理[1]。

从语义上分析，Ontology中的实例表示的就是对象，而概念表示的则是对象的集合，关系对应于对象元素的组的集合。概念的定义一般采用框架结构，包含概念的名称、与其它概念之间的关系的集合、以及用自然语言对概念的描述。概念中的关系主要有4种:Part-of、kind-of、instanceof以及attribute-of等。Part-of表示的是概念中部分与整体的关系;kind-of表示概念之间的继承关系，相当于面向对象中的父类与子类的关系;instance-of表示概念的实例与概念之间的关系，类似于面向对象中的对象与类之间的关系;attribute-of表示某个概念是另一个概念的属性，例如概念“身高”可以作为概念“人”的一个属性。

1 信息粒度原理

对于一个问题，有时需要在不同的粒度层次上对问题进行求解，因此需要研究不同粒度世界的关系。

设R表示由论域X上一切等价关系组成的集合，可以定义如下等价关系，也就是粒度的“粗”和“细”。

定义1.1.设R1,R2∈R，如果对于任意的x,y∈X，都有xR1y=>xR2y，那么就称R1比R2细，记做R1≤R2。

存在如下的定理[2]:

定理1.1.R在定义1.1中所定义的“≤”关系下形成一个完备半序格。

这个定理在粒度计算中是一个非常重要的定理，根据这个定理可以得出:Rn≤Rn-1≤…≤R1≤R0。

从这个序列可以得出，此序列和一棵n层树是相对应的，因此，可以得出:

推论1.1.粒度的表示在某些情况下可以采用概念层次树来表示，因此，将Ontology中的分类体系构造的概念层次结构应用于粒度的表示是可行的。

2 构造基于Ontology的粒度计算模型

目前ontology在概念分类中的应用还没有一个统一的分类标准，导致在实际的应用中无限制地使用包含关系对概念进行分类，使得概念分类的一致性和合理性得不到很好的控制。Guarino等人在文献[3]中对概念分类做了深入的研究，并提出了Ontology驱动的建模方法，在理论上为建模提供了一个通用的模式。

对于粒度计算中的分类问题，由于在很多情况下，人们难以用精确的方法来描述不同类别样本属性的差异，或者是不同类别样本之间的界限不够明显，等价划分就难以表示这种问题。本文采用非等价划分方法，使得分类的精度接近理想的状态。

定义2.1(粒的定义):假设存在一个概念φ，属于概念φ的所有元素记作φ的意义集m(φ)，表示为m(φ)={x∈U,x|≈φ}，其中U表示论域;|≈是一种公式可满足性符号。将m(φ)称作一个粒。

在粒度的形成过程中，允许出现模糊的估计与类比，所以得到的信息粒是模糊的。因此，这里采用zadeh在文献[4]中所使用的模糊粒度概念来对粒进行划分。

定义2.2(粒的划分):元素x以程度λ[5]隶属于粒度G，其中x是论域U中的一个对象，x的值是概念中对象所对应的实例。形式化表示为:

g={u∈U:x的值u，(v(x)=u,v是u上的赋值符号)是以程度λ隶属于概念φ}。很显然，o<λ

定义2.3(粒的大小):L(m(φ))=Card(m(φ))/Card(U)，其中L(m(φ))表示粒m(φ)的大小程度;Card(m(φ))表示粒m(φ)中包含的元素个数;Card(U)表示论域的元素总数。

在进行分类时，自然会面临这样一个问题:为什么考察两个对象时把它们看作是同一个类别而不把它们看作为两个类别，这时定义它们之间的不可分性、近似性、相似性就显得尤为重要。

定义2.4假设有两个对象G1,G2，它们的交为Gc=G1∩G2，那么它们之间的相似度定义为:

其中n(G1)，n(G2)，n(Gc)分别代表对象G1,G2,Gc中的个体数。

定义2.5对于两个对象G1,G2，若它们之间的相似度定义为sim(G1,G2)，它们之间的距离记为d(G1,G2)，则这两个对象之间的相似度定义为:

其中α是动态因子，可以根据实际情况来进行选择。

这里的对象是指概念中的词语，词语距离有两种常见的计算方法:一种是利用大规模的语义库进行统计，另一种方法主要是根据同义词典来计算。

3 结束语

本章给出了概念的形式化表示，并将Ontology的概念层次结构应用于粒度计算中，采用概念的相关性和相似性对粒度之间的相似性进行定义，构造了基于Ontology的粒度计算模型。模型一旦建立，就可以进行粒度之间的合成与分解操作。但是这种模型还存在一定不足:如何定义一种函数或者是某种逻辑公式来更好地反映粒度之间的关系以及粒度空间各层之间的关系还有待进一步的研究。

参考文献

[1]王晓东,高宏卿.基于ontology的问题检索建模[J].计算机工程,2004,30(19):28-29,103.

[2]张铃,张钹.模糊商空间理论(模糊粒度计算方法)[J].软件学报,2003,14(4):770～776.

[3]N.Guarino Semantic Matching:Formal ontologi-cal Distinctions for Information Organization,Extraction,and Integra2tion.In:Pazienza M T,eds.Information Extraction:A Multi-disciplinary Approach to an Emerging Information Technolo2gy,Springer Verlag,1997:139-170.

[4]L.A.zadeh.Towards a theory of fuzzy informa-tion granulation and its centrality in human reason-ing and fuzzy Iogic[J].Fuzzy Sets and Systems,1997,19(l):111～127.

[5]刘清.Rough集与Rough推理[M].北京:科学出版社,2001.

数据仓库模糊粒度模型的研究篇2

模糊粒度模型在决策支持及信息管理系统的局势分析中发挥着重要作用。人们在解决问题时, 能从几个不同的粒度世界去分析和观察同一个问题, 并且很容易从一个粒度世界转到另一个粒度世界。为了描述这个现象, 建立了一种商结构的形式化体系, 给出了一套解决信息综合、启发式搜索、路径规划和推理等领域问题的理论和算法, 并已有一些研究和应用。目前, 关于模糊粒度模型的研究有Pawlak的“粗糙集理论”、Zadeh的“模糊集理论”和张铃等提出的基于上空间粒度计算, 有许多学者在模糊粒度计算领域进行了研究、以不同粒度求解问题的商空间模型已在模糊粒度领域引起了同行的关注, 其着重点是研究不同粒度世界之间相互转换、相互依存的关系, 及研究不同粒度问题之间的转换以及确定粒度模型与模糊粒度模型之间的关系。

本文提出利用学籍管理系统中的有关数据基本表, 进行分析、综合, 先建立确定粒度模型;再将确定粒度模型转换成模糊粒度模型, 利用模糊粒度模型对信息管理系统中的信息进行分析、研究, 实现数据仓库联机分析处理。

2. 定义和符号

Zadeh于1979年在文献中提出了模糊粒度的概念, 文中定义信息粒度为一个命题:X的值程度A隶属于模糊子集G包含于U, 其中X是U上的变量, X的值是U上的一个实体, 写成:g=X is G is A, 形式上被记成:g={∈U:X的值 (V (x) , V是U上的赋值符号) 是以程度A隶属于模糊子集G包含于U}, 很显然A∈【0, 1】。以模糊集的观点, 此处的A是模糊隶属度函数U|G;而以辑学观点, 此处的A是所建立的命题的模糊针织或概率。

通过二元关系定义子粒。设S= (U, A, V, f) 是信息系统, B:V→U二元关系, 其中U是所讨论对象的全集, A是属性集, V是属性值集, f是信息函数。用B定义粒是如下形式:g={u∈U:uBp, p∈V}显然g是清晰还是模糊完全取决于B的特性。设有两个关系B和D, 如果B包含于D, 则按B将全域划分的粒比按D将全域划分的粒更细, 在这种情况下, 也可以将不同大小的粒度分成不同粒度层, 并在不同层上进行各自分别处理。

在实际应用中, 如果粒度太细, 搜索空间庞大, 容易陷入组合

爆炸的情况;如果粒度太粗, 又会失去一些有用的信息, 因此需要从已知知识合成不同粒度知识。

设 (X1, P1, f1) 、 (X2, P2, f2) 是 (X, P, f) 的商空间, X1, X2对应的等价关系分别为R1, R2。

定义1:X1, X2的合成空间X3, 其对应的等价关系为R3。X3是X1、X2的细粒度合成空间, 满足R (x, y) ≡ (R1∩R2) (x●y) .

用划分来表示合成;设划分X1={a1}、X2={b1}, 则X1和X2的合成X3={a1∩b1|a1∈X1, b1∈X2}.X1和X2的积X3=X1●X2对应于等价关系R1∩R2的划分, 可以证明R1∩R2是一个等价关系。

定义2:X1, X2的合成空间X1, 对应的等价关系为R1, X1是X1、X2的粗粒度合成空间, 满足R1 (x, y) ≡ (R1∩R2) ● (x, y) 。其中 (R1∪R2) ●是 (R1∪R2) 的传递闭包, 用划分便是合成设x1和x2的和对应于传递闭包 (R1∪R2) ●的划分, 记x1=x1+x2可以证明 (R1∪R2) 是一个等价关系。

粒度和等价关系有着密切的关系。本节主要是对粒度合成技术在实际应用中的推广和补充, 即如何从已知知识合成粒度知识, 并能方便地从几个不同粒度世界去分析和观察同一个问题, 从而降低问题求解的复杂性。

3. 模糊粒度模型的建立方法

以高校学籍管理系统为例, 在学籍管理系统基础上建立数据库, 并利用高校学籍管理系统中的信息数据导出数据库中低粒度表;再导出数据仓库中的高粒度表;最后根据隶属度函数分析, 得出模糊粒度表;将高校学籍管理系统中的关系表中大量的数据进行分析、综合, 并且对导出的模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

模型建立过程如下图所示:

注:该成绩表中有30条记录, 分别是该班级30名学生数据仓库这门课程的成绩。下面由数据库中的学生成绩表 (低粒度表) 导出对应的确定粒度表 (高粒度表) 。

注:按照上面学生成绩表中的学生成绩将其成绩划分成优、良、中、及、不及五个等级, 五个等级对应的成绩分布如上表中成绩分布所示, 其对应的人数如上表所示, 总人数30人。

下面由确定粒度表 (高粒度表) 导出模糊粒度表, 如下表所示:

注:上面模糊粒度表的人数比例是从我自己观点出发, 根据隶属度函数计算所得, 该人数分布成正态分布。考虑到管理层不同的管理人员或决策者出发点不同, 可能会出现不同的人数比例计算结果, 但是有一点肯定不会改变, 即就是他们计算得出的人数比例分布一定成正态分布, 并且他们大多数人计算出得人数比例基本相同, 出入不大。这就突出了模糊粒度模型在信息管理系统应用中有很大的弹性, 比较灵活, 有利于数据仓库联机分析处理更好地进行, 从而大大地减轻了管理人员的负担。尤其在Oracle数据库中, 由于数据信息量大, 记录条数比较多, 通常会出现数据繁杂, 信息爆炸现象。但是将模糊粒度模型应用到大型信息系统中去, 会有效地避免信息爆炸现象。

模糊粒度模型的建立过程:

Ⅰ用适当的数学方法对问题进行描述

在数据仓库模糊粒度模型的建立过程中, 引用概率论和统计学对信息管理系统中的信息数据进行计算、分析, 由于该模型是模糊的、不确定的, 因而使用隶属度函数对模糊粒度表中数据进行计算, 得出结果后检验其是否符合正态分布规律 (一般分布规律) 。

Ⅱ采用各种数学方法和计算机工具求解模型

本文在信息管理数据模糊粒度模型的基础上, 设立了辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥了决策作用, 同时也对模型进行了求解。

Ⅲ模型建立步骤和方法

本文在学籍管理系统的基础上, 由系统中的基本表导出确定粒度表, 进而得出模糊粒度表;利用隶属度函数对模糊粒度表中的信息数据进行计算、分析, 检验检验其是否符合正态分布规律, 再将各模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

4. 应用和分析

在信息管理系统和智能辅助决策IDSS中, 根据粒度化历史数据变动情况和查询统计要求, 可使业务流程数据与决策信息形成有效流转, 在信息管理数据模糊粒度模型基础上, 设立辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥辅助决策作用。假设某粒度级因素项的数据量为X, 关联因素项数据量为Y, 数据挖掘分析结果项为Z, 那么建立辅助决策数学模型, 假若, X与Y的增长量分别为dx、dy, 就对应一个分析结果项变化量dz, 其关系为积分方程:

在上式中, 把指标临界值分别设为x=x0, y=y0, z=z0, 各粒度级因素项的数据量分别设为x1, x2, ……xn;各关联因素项数据量分别为y1, y2, ……yn;各数据挖掘所获得的分析结果项分别为z1, z2, ……zn。这些值, 有的情况是离散值, 但大多数情况是连续值或分段连续值, Z为积分曲线。

上面辅助决策数学模型是建立在模糊粒度模型的基础上, 它可以有效地自动对信息管理系统中的数据信息进行处理、衡量, 从而大大地减轻了管理人员和决策者的负担。

数据仓库模糊粒度模型应用到信息管理系统中, 它可以对现实中一些模糊的问题或者决策者难以驾驭的问题进行处理。由于实际应用中信息往往是不完全、不精确或不确定的, 有时很难对粒度粗细进行划分。在现实生活中, 比如天气情况“晴”、“多云”、“阴”等都很难有个“界限分明”的不相交的分类, 有时甚至连相交与否都说不清, 只能模糊地进行分类。从上述分析可知, 现在的数据仓库联机分析处理大多是基于静态、确定、有限、历史的数据仓库集进行研究的, 而对当今信息系统中数据信息的流动性、快读变化性、无限性和不确定性的特点, 目前的联机分析处理技术需要重新考虑、选择, 甚至再研发。而数据仓库模糊粒度模型完善了这一方面的缺陷, 使得数据仓库联机分析处理能够很好地对信息管理系统中的信息数据进行处理, 给决策者大大地提供了方便。

5. 结束语

本文提出数据仓库模糊粒度模型, 并将其应用于学籍管理系统。针对实际问题, 将数据仓库模糊粒度模型进行了推广和应用。首先提出了粒度的概念, 并介绍了粒度的等级划分, 阐述了粒度和等价关系之间的紧密联系, 将粒度合成技术在实际应用中进行了推广和补充, 引入确定粒度模型的概念, 在此基础上, 建立了数据仓库模糊粒度模型。将确定粒度模型与模糊粒度模型进行了比较, 充分体现了模糊粒度模型的实用性和优越性。

通过本文的讨论, 基于模糊粒度模型理论方法是采用概率统计方法研究粒度的计算方法, 那么它就可以有效地应用于信息管理系统中进行统计和分析, 既可以使得数据仓库联机分析处理更好的进行处理, 又可以大大地降低问题的复杂性, 从而减轻决策者和管理人员的负担。

参考文献

[1]W.H.Inmon, building The Data Warehouse Third Edition[M]John Wiley﹠sons, Inc.2002

[2]Zhang L.Zhang B.The Quotient Space Theory Of Problem Solving Fundemental Information.2003.59 (2-3) .287-298

[3]W.H.Inmon, building The Data Warehouse.Practice Hall, 1992

[4]W.H.Inmon, R.D.Hackathorn《Using The Data Warehouse》[M].John Wiley﹠sons.Inc, 1994

粒度模型篇3

1 多重粒度模型的建立

1.1 多重粒度的提出

确定系统的数据粒度是数据仓库逻辑模型设计的重要步骤。而要确定合理的数据粒度，首先需要粗略地估算将来数据仓库的数量级。数据仓库数量级的一个简单粗略估算方法是：设在概念模型中出现的表的个数为N，对于每个表i(0

其中，T是数据在数据仓库存在的周期。通常轻度综合的数据在数据仓库中存放的周期是5～10年。α是考虑由于数据索引和数据冗余而使得数据量增大的冗余因子，上式的含义是数据仓库数据量=(表的记录大小+主关键字大小)×记录的数量/单位时间×存储时间×冗余因子[3]。

一般来说，对于不同的数据量将采用不同的数据粒度策略，在数据量较小的环境下，采用单一的数据粒度，即直接存储细节数据并定期在细节数据基础上进行综合。由于数据仓库是进行DSS分析用的，绝大部分都是基于一定程度的综合数据查询的，因而在数据仓库中，采用多重粒度来分析数据是必不可少的[4]。

数据仓库临时表中用来存的记录随着时间的累积，数据量将不断增多，面对大规模的数据，要想从中得出用户需要的数据，必须建立一种有效地措施来方便、快捷地查询所需数据。在许多情况，建立简要记录数据量可以显著降低，按照数据的细节程度划分原则通过把许多记录聚集为一个记录，方便用户从大量数据查询和分析。当然根据相同的细节可以创建多个简要记录，按照不同的需求可以对数据仓库中的数据细节程度进行划分，比如按照不同时间记录进行划分、不同部门(地区)记录的划分、不同车型的划分、不同运输线路的划分等等。

在企业设备管理数据仓库表中，面对大量的数据信息，建立多重粒度可以按照企业中不同身份人员的操作需求不同，将数据划分为细节数据和综合数据(轻度总结、高度总结)，划分的粒度的高低将会满足不同类型人的需求，以提高设备管理的系统性能和成本。

1.2 数据粒度划分模型算法

在数据仓库数据中，对于数据的划分提出一种新的基于粒度划分模型的算法。在论域U的一个划分π={Xi|1≤i≤m}对论域提供了按照某种属性(比如时间中的周或者月)的简单粒度观点，划分中的每个块Xi都是一个粒子，且满足：

每个Xi均为非空，且划分π={X1,X2，…，Xn}

对所有的i≠j,Xi∩Xj=ф

∪{Xi|1≤i≤m}=U

如果划分π1的所有块都包含在划分π2的块中，称划分π1是π2的细化，记作π1≤π2。细化关系是一个偏序，满足自反性、对称性和传递性，它定义了一个划分格∏(U)。∏(U)包含了论域的所有可能的粒度划分，空集提供了最粗的划分，全部的属性定义的划分是最细的划分，粒度之间的转换通过增加删除属性来实现。

进行粒度划分时，首先根据所在数据仓库中建立的表，建立数据索引来索取数据，针对不同数据采取分类索引，即通过所建表的行来组织，每个索引中的每一行总有一个索引项，用户在进行查询时，根据查询的内容来定位数据到底属于哪个粒度的“片区”，不同粒度级别的数据将用于不同类型的分析处理，在此区间进行分析处理，以提高查询效率。

1.3 多重粒度模型的设计

数据仓库中的粒度化的数据是重用性的关键。这是因为她可以由众多用户以不同方式使用。数据仓库的粒度化数据包含了整个企业的活动和事件的历史。并且数据粒度级别足够详细使得整个企业的数据位满足不同需要而进行重构。通常数据仓库可以使得不同部门从它所希望的角度来观察数据。数据仓库粒度化所带来的好处除了可以从不同角度观察分析数据之外，另一个好处就是可以利用数据仓库粒度化划分的数据进行一致性的协调，从而对两个部门或多个部门的不同分析结果的差异进行解释[1]。

在数据仓库中的数据分为4个级别：早期细节级、当前细节级、轻度综合级和高度综合级。源数据经过综合后，首先进入当前细节级，并根据具体需要进行进一步综合，从而进入轻度综合级乃至高度综合级，老化的数据将进入早期细节级。数据仓库中存在着不同的综合级别，这就是“粒度”的直观表现[2]。

数据仓库通常在同一模式中使用多重粒度。数据仓库中，可以有今年创建的数据粒度和以前创建的数据粒度。这是以数据仓库中所需的最低粒度级别为基础设置的。例如，可以用低粒度数据保存近期的数据和汇总数据，对时间较远的数据只保留粒度较大的汇总数据。这样既可以对设备信息进行细节分析，又可以利用汇总数据对设备运转趋势进行分析，这里的数据粒度划分策略就需要采用多重数据粒度。

数据仓库中的数据在时间维上按什么来汇总数据。为确保DSS分析员做分析时能得到他们需要的数据，我们考虑按照时间维来考虑数据，首先考虑的是在详细数据的基础上以较低级别来汇总数据(如以交易日为单位)，那么做年度数据分析时，系统必然要消耗很大资源。但如果在较高级别上汇总数据(以年为单位),则极有可能需要向下挖掘数据来分析其月或者日的数据。所以DSS分析员必须通过和用户交流来确定数据粒度级别[7]。在石油钻井设备管理数据仓库中，我们采用多重粒度设计方案，数据仓库中包括详细数据、按月汇总数据、安照季度汇总、按年汇总数据等。

2 多重粒度模型在石油企业设备管理中的应用

在石油运输企业车辆设备管理中，车辆设备管理数据仓库基本上涵盖了从“车辆购入”到“车辆报废”过程中的全部数据信息，管理人员希望尽可能多地掌握不同分公司、中队车辆的基本档案信息、运行信息、行使里程、油耗量等运输信息，更换设备、维修、报废、小修、大修等维修信息，以及车辆行驶里程与油耗之间的关系、司机驾驶的车辆固定周期内维修次数等信息。

在石油企业设备管理系统中以运输车辆为例，整个运输公司运输管理过程是以每个车辆(配件)为单位的，我们建立了临时表来存放车(配件)的运输记录，在车辆管理期间，管理员可以对每辆车的运输记录情况进行浏览和修改，这个临时表按照整个石油企业的车辆100辆计，如果平均每月一辆车对应有20个不同部门使用，按照每个部门使用情况的不同统计，假设一辆车平均每月共有1000个运输记录，则这个临时表将有近100×20×1000=200000条记录，如果采用单一粒度级别设计，也就是是说如果直接存储细节数据并定期在细节数据基础综合的这样的设计不仅大大耗费存储空间，而且也会影响访问的效率。

在石油企业设备管理中，大量数据需要进行挖掘、分析，而管理人员分析的数据和关心的数据层面也有所不同，这就涉及到数据仓库中数据存储的粒度问题，即数据仓库中记录数据细化程度的问题。数据仓库单元中的细节程度是设计数据仓库的最重要的方面。建立数据仓库粒度模型对于回答企业中不同中队、分公司、总公司管理人员所需资源有着重要的影响，可以辅助管理人员科学制订相关决策和管理，更好地实现降低费用、提高监控力度、增加安全性等应用目的。

在石油企业设备管理数据仓库中以基于时间的粒度为划分模型，在车辆运输记录数据仓库中划分车辆运输任务日志数据，作为每个中队的管理部门人员来说，关心的是中队所辖区域的每月设备的运转状况，故按照时间粒度中的月属性，划分数据仓库的数据，将其的相关运输记录信息综合成每月的记录进行划分，划分结果如表1所示。

通常分公司管理部门人员可能想了解生产线上设备各个季度设备运转的汇总，我们在处理相应数据记录的时候，按照时间粒度中的季度属性来划分划分结果如表2所示。

企业总公司管理部门人员可能想了解生产线上设备各个年份设备运转的汇总，往往很少对单个事件按进行了解，总公司财务部门也可能更想了解不同年份的设备创收情况，可能都是针对某个数据集合进行处理[6]，我们在处理相应数据记录时，按照时间粒度的年份属性来划分结果，如表3所示。

当然,按照不同需要也可按照时间的周属性、旬属性等等来划分数据仓库中的数据记录,这里就不再赘述。无论是企业中队人员、企业分公司管人员还是总公司数据仓库管理人员所需要的数据尽管有略微的不同,但是所有这些数据都是紧密相联的。数据仓库粒度化数据可以将其中的数据进行一致性的协调,从而对两个部门或多个部门的不同分析结果的差异进行解释。

在石油企业设备管理数据仓库数据中,对于上边提出一种按照时间粒度划分模型算法。论域U也就是所有车辆运输日志记录,对于车辆运输记录以月份划分提出简单的力度观点,划分中的每个月就是一个粒子,每个粒子满足以下条件:(1)每个粒子都为非空;(2)对于每个划分,比如1991年1月份和2001年2月份没有公共的交集;(3)所有这些划分的集合应该是车辆运输记录的全部集合。

当然按照季度划分、年份等划分均应满足以上条件。如果月份的划分记录π1的所有块都包含在按照年份的划分π2的块中,称划分π1是π2的细化，记作π1≤π2。这个细化关系是包含了论域的所有可能的粒度划分,全部的属性定义的划分是最细的划分,粒度之间的转换通过增加删除属性来实现。

这种数据不同细节的划分就是数据仓库中的数据存储粒度。在时间粒度上，OLAP往往对时间相隔较远的数据要求粒度较粗，对时间相隔较近的数据要求粒度较细。对于设备的库存量、使用情况等可以采取样本数据库保存设备情况的抽样快照,而对于运输设备运输情况、设备为公司的盈利状况和时间段相关的处理则采取普通的细节粒度和综合粒度结合的方式。此后，DSS分析员在确定数据粒度级别时必须针对不同的需求确定不同的粒度等级。在石油运输企业设备管理数据仓库中采取多重粒度划分。数据仓库事实表中存放数据时存放多重粒度数据，按照粒度划分的算法来划分出来的多重粒度的数据可以方便快捷地供管理人员分析决策用。

3 结束语

选择合适的粒度级别是数据仓库建设好坏的重要内容。在设计数据粒度时,通常须重点考虑各种因素。粒度的确定实质上是在对业务模型做深入了解的基础上，对业务决策分析、硬件、软件和数据仓库使用方法的一个折衷。随着原始数据的积累,数据库的信息量越来越大,单一的粒度级已经不再适合使用，而是需要使用多重粒度级来提高查询的效率,以便更好地满足用户的决策分析需要[5]。

参考文献

[1]W.H.Inmon.数据仓库[M].王志海,林友芳,等,译.北京:机械工业出版社,2003.

[2]王珊.数据仓库技术与联机分析处理[M].北京:科学出版社,1999.

[3]林宇.数据仓库原理与实践[M].北京:人民邮电出版社,2003.

[4]李志刚,马刚.数据仓库与数据挖掘的原理及应用[M].北京:高等教育出版社,2008.

[5]黄玉明,毛宇光.数据仓库中多重粒度划分的层次编码解决方案[J].计算机发展与技术,2008(10).

[6]许学军.数据仓库中数据的粒度划分[J].阜阳师范学院学报:自然科学版,2006.

[7]李静.数据仓库中的数据粒度确定原则[J].计算机与现代化,2007(2).

粒度模型篇4

粒度计算GrC(Granular computering)是近几年来研究的热点内容,它以姚一豫提出的粒计算三元论(即多视角、多层次粒结构和粒计算三角形)为基本研究框架,从哲学、方法论、信息处理三个侧面进行结构化思维、结构化问题求解、结构化信息处理的深入探究,并吸纳、提炼及抽象各个学科中粒处理思想以期建立系统的、与具体学科知识无关的粒计算原理,从而指导人类问题求解和实现机器问题求解[1]。传统的观点将粗糙集理论、模糊理论及熵空间理论视作粒度计算的主要模型,但随粒度计算的发展与研究表明,粒计算不仅仅是文献[2]所认为的“信息处理方向的一种新的概念和计算范式”。其也不限于目前研究较多的粗糙集模型,模糊集模型,熵空间模型三种具体模型[3,4]。

在现实世界的信息处理中,由于粗糙集理论思想新颖、方法独特,其已成为一种重要的粒度计算模型,并已在机器学习与知识发现、数据挖掘、决策支持与分析得到广泛应用[5]。粗糙集理论与应用的核心基础是从近似空间导出的一对近似算子,即上近似和下近似,但经典的Pawlak模型中的不分明关系是一种等价关系,限制了粗糙集模型的应用,因此如何推广定义近似算子成为了粗糙集理论研究的一个重点[6]。自文献[7]最早将粗糙集理论从划分推广到覆盖,文献[8]定义了覆盖近似空间中对象的最小描述,并从内涵和外延的角度研究了覆盖近似空间中概念的近似含义,文献[9]基于对偶原则定义了两组覆盖粗糙近似算子,并研究了它们在不同邻域系统中的性质。Eric C.C. Tsang等对覆盖粗糙集的上近似进行了研究,提出了一种介于文献[7]覆盖上近似和文献[8]上近似之间的覆盖上近似算子,还有很多学者对此做出了重要贡献,上述研究使得覆盖粗糙集理论研究取得了重大的进展且得到了更广泛的应用。

覆盖粗糙集理论作为粒度计算的组成部分,其所在的覆盖粒度空间的知识如何统一表示,覆盖粒度空间的数据建模的核心粒化机理如何建立,覆盖粒度空间的合成、分解和转换如何进行,如何刻画覆盖粒度空间的多层次结构及描述其粒度结构的度量等问题为进一步研究粒度计算具有重要的意义。本文首先定义了覆盖近似空间中元素的相容类,在此基础上定义了相容关系,并由此相容关系定义了相容类中元素之间的相容度,给出了覆盖粒度空间下元素的矩阵表示,由此定义了覆盖粒度空间中基本运算,拓展了覆盖粒度空间的合成运算、分解运算和转换运算,并诱导出覆盖信息粒的概念,给出了相应的性质和结论,进一步定义了覆盖粒度空间的三种偏序关系,通过证明以此揭示了覆盖粒度空间的层次关系,最后定义了覆盖粒度空间的信息粒度、粗糙度和粗糙熵,研究了在覆盖粒度空间中多层次的粒度结构中的各种关系。上述工作无疑对于粒计算的多层次粒结构理论的进一步完善具有重要的意义。

1 覆盖粒度空间

经典的粗糙集理论是基于论域上的等价关系,由等价关系所诱导的论域上的划分来对知识进行分类,Pawlak称之为论域上给定的一个知识基。而现实世界中实际问题里往往不存在等价关系,取而代之的是覆盖相容关系或更为一般的关系,因此基于覆盖粒度空间的研究更为重要和必要,文章对覆盖粒度空间采用矩阵加以表示,将相容关系视作覆盖粒度空间的知识基,覆盖粒度空间的知识表示看作向量的表示形式,从而将其扩展到覆盖粒度空间的知识表示。

关于粗糙集、覆盖及覆盖粗糙集模型概念参见其他文献,这里不做赘述。

定义1[10] 设(U,C)为覆盖近似空间,对∀x∈U,称{x}C=∪{C′|x∈C′∧C′⊆C}为x的相容类。显然{x}C包含了与x具有不同关系的元素的集合。

定义2 设(U,C)为覆盖近似空间,定义相容关系如下:RC={(x,y)∈U×U|{x}C∩{y}C≠∅}。用SC(xi)={xj∈U|(xi,xj)∈RC}表示在覆盖C下所有与对象xj具有相容关系的对象的集合。由于对于∀xi∈U,xi∈SC(xi)≠∅且 $\underset{x_{i} \in U}{\cup} S_{C} (x_{i}) = U$ ,那么SC(xi)构成U的一个覆盖,即相容关系RC构成U的一个覆盖。

在覆盖近似空间(U,C)中,可用 $\frac{U}{R_{C}} = {S_{C} (x_{1}), S_{C} (x_{2}), \dots, S_{C} (x_{| U |})}$ 表示U的一个分类。

定义3 设(U,C)为覆盖近似空间,那么U中元素x、y在覆盖C中的相容度可定义为:

$ρ_{C} (x, y) = \frac{| {x}_{C} \cap {y}_{C} |}{| {x}_{C} |} \cdot \frac{| {x}_{C} \cap {y}_{C} |}{| {y}_{C} |} = \frac{| {x}_{C} \cap {y}_{C} |^{2}}{| {x}_{C} | \cdot | {y}_{C} |}$

定义4 设(U,C)为覆盖近似空间,RC表示U上的相容关系,则RC的关系矩阵:

$Μ (R_{C}) = [\begin{matrix} r_{11} & r_{12} & . . . & r_{1 n} \\ r_{21} & r_{22} & . . . & r_{2 n} \\ . . . & . . . & . . . & . . . \\ r_{n 1} & r_{n 2} & . . . & r_{n n} \end{matrix}]$

式中rij=ρ(xi,xj)∈[0,1]表示元素xi和xj相容度。

定义5 相容关系RC关于矩阵的一些运算为:

1) RC1=RC2⇔RC1(x,y)=RC2(x,y);

2) RC=RC1∪RC2⇔RC=max{RC1(x,y),RC2(x,y)};

3) RC=RC1∩RC2⇔RC=min{RC1(x,y),RC2(x,y)};

4) RC1⊆RC2⇔RC1(x,y)≤RC2(x,y)。

由上述相容关系RC可诱导出一个覆盖粒度族集,称为覆盖粒度空间。

定义6 设(U,C)为覆盖近似空间,由RC所诱导的集合族C(PC)=(NRC(x1),NRC(x2),…, NRC(xn))称之为覆盖粒度空间,其中NRC(xi)=x1(ri1)+x2(ri2) +…+xn(rin),NRC(xi)是由xi所诱导的覆盖信息粒,rij表示xi和xj相容的程度,”+”表示元素的并,覆盖信息粒NRC(xi)的基数为|NRC(xi)|= $\sum_{j = 1}^{n}$ rij。

在覆盖粒度空间里rij揭示了元素xi与xj之间的相容程度,|NRC(xi)|揭示了元素xi与其他元素相容程度的总体度量,为刻画两个覆盖粒度空间的粗细关系和层次关系,可以通过偏序关系加以描述。

本文约定:C(U)表示U上所有的覆盖粒度空间的集合。

定义7 设C(PC)、C(QC)∈C(U),其中C(PC)

= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=

x1(pi1)+x2(pi2)+…+xn(pin),且C(QC)=(NQC(x1),

NQC(x2),…, NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)

+…+xn(qin)。定义二元关系⪯:C(PC)⪯C(QC) ⇔NPC(xi)⊆NQC(xi),i≤n⇔pij≤qij,i,j≤n,简记为PC⪯QC。称C(PC)比C(QC)更精细。同样的思想可定义严格精细的偏序关系。

显然,(C(U),⪯)是一个偏序集。

2 覆盖粒度空间的基本运算

覆盖粒度空间的运算为粒度空间粒化机理的数据建模提供了知识依据,进一步构建了人类基于覆盖粒度空间的推理基础,其中包括精确粒空间算子拓展到覆盖粒度空间以进行覆盖粒度空间之间的合成、分解与转换。

定义8 设C(PC)、C(QC)∈C(U)是两个覆盖粒度空间,C(U)上的四个算子∩、∪、-和ζ定义为:

1) C(PC)∩C(QC)={NPC∩QC(xi)| NPC∩QC(xi)

=NPC(xi)∩NQC(xi)};

2) C(PC)∪C(QC)={NPC∪QC(xi)|NPC∪QC(xi)

=NPC(xi)∪NQC(xi)};

3) C(PC)-C(QC)={NPC-QC(xi)|NPC-QC(xi)

=NPC(xi)∩～NQC(xi)};

4) ζC(PC)={ζNPC(xi)|ζNPC(xi)=～NPC(xi)}。

上式中,xi∈U,i≤n,～NPC(xi)= x1(1-pi1)+x2(1-pi2)+…+xn(1-pin)。

以上四个覆盖粒度空间算子可以看作是覆盖粒度空间的交、并、差和补运算,实质是覆盖粒度空间的细化、粗化、分解和计算覆盖粒度空间的补空间,是传统等价粒度空间的精确粒度空间所定义的四个算子的自然推广。

通过定义可知,∩和∪算子用于把两个覆盖粒度空间合成一个新的覆盖粒度空间,用∩可得到一个更细的粒度空间,用∪可得到一个更粗的粒度空间,-算子用于分解覆盖粒度空间为更细的粒度空间,算子ζ可得到一个覆盖粒度空间的补空间。

定理1 设∩和∪是C(U)上的两个粒度算子,则有:

1) 幂等律C(PC)∩C(PC)=C(PC),

C(PC)∪C(PC)=C(PC)。

2) 交换律 C(PC)∩C(QC)=C(QC)∩C(PC),

C(PC)∪C(QC)=C(QC)∪C(PC)。

3) 吸收律 C(PC)∩(C(PC)∪C(QC))=C(PC),

C(PC)∪(C(PC)∩C(QC))=C(PC)。

4) 结合律 (C(PC)∩C(QC))∩C(RC)

=C(PC)∩(C(QC)∩C(RC)),

(C(PC)∪C(QC))∪C(RC)

=C(PC)∪(C(QC)∪C(RC))。

证明:通过定义显然。

定理2 设∩、∪和ζ是C(U)上的三个粒度算子,则有:

1) ζ(C(PC)∩C(QC))=ζ(C(PC)∪ζC(QC))。

2) ζ(C(PC)∪C(QC))=ζ(C(PC)∩ζC(QC))。

证明:通过定义显然。

定理3 设∩、∪和ζ是C(U)上的三个粒度算子,则有:

1) 若C(PC)⪯C(QC),则ζC(QC)⪯ζC(PC)。

2) C(PC)∩C(QC)⪯C(PC),

C(PC)∩C(QC)⪯C(QC)。

3) C(PC)⪯C(PC)∩C(QC),

C(QC)⪯C(PC)∩C(QC)。

证明:通过定义显然。

3 覆盖粒度空间多层次的粒度结构

在一个覆盖粒度空间中描述其不确定性,偏序关系起着重要作用。

定义9 设C(PC)、C(QC)∈C(U),其中C(PC)= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin),且C(QC)=(NQC(x1),NQC(x2),…, NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。定义二元关系⪯1:C(PC)⪯1C(QC) ⇔|NPC(xi)|≤ |NQC(xi)|,i≤n,其中|NPC(xi)|= $\sum_{j = 1}^{n} p_{i j} ‚ | Ν_{Q_{C}} (x_{i}) | = \sum_{j = 1}^{n}$ qij,简记为PC⪯1QC。

定理4 设C(U)是U上的覆盖粒度空间集合,则(C(U),⪯1)是一个偏序集。

证明:设C(PC)、C(QC)、C(RC)∈C(U),

C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),

C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),

C(RC)=(NRC(x1),NRC(x2),…,NRC(xn))那么有:

(1) 对∀xi∈U,有|NPC(xi)|=|NPC(xi)|,则PC⪯1PC,即⪯1满足自反性。

为了进一步刻画覆盖粒度空间的层次结构,可定义新的偏序关系。

定义10 设C(PC)、C(QC)∈C(U),其中C(PC)= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin),C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。定义二元关系⪯2:C(PC)⪯2C(QC)⇔对于C(PC),存在C(QC)的一个序列C′(QC)使得|NPC(xi)|≤|NQC(x′i)|,i≤n,其中C′(QC)=(NQC(x′1),NQC(x′2),…,NQC(x′n)),简记为PC⪯2QC。

定理5 设C(U)是U上的覆盖粒度空间集合,则(C(U),⪯2)是一个偏序集。

证明:设C(PC)、C(QC)、C(RC)∈C(U),

C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),

C(QC)= (NQC(x1),NQC(x2),…,NQC(xn)),

C(RC)= (NRC(x1),NRC(x2),…,NRC(xn)),那么有:

(1) 对∀xi∈U,有|NPC(xi)|=|NPC(xi)|,则PC⪯2PC,即⪯2满足自反性。

(2) 若PC⪯2QC且QC⪯2PC,有PC⪯2QC⇔对于C(PC),存在C(QC)的一个序列C′(QC),其中C′(QC)=(NQC(x′1),NQC(x′2),…, NQC(x′n)),有|NPC(xi)|≤|NQC(x′i)|,i≤n。QC⪯2PC⇔对于C(QC),存在C(PC)的一个序列C′(PC),其中C′(PC)=(NPC(x′1),NPC(x′2),…, NPC(x′n)),有|NQC(xi)|≤|NPC(x′i)|,i≤n。因此 $\sum_{i = 1}^{n} | Ν_{Ρ_{C}} (x_{i}) | \leq \sum_{i = 1}^{n} | Ν_{Q_{C}} (x^{'}_{i}) | = \sum_{i = 1}^{n} | Ν_{Q_{C}} (x_{i}) | \leq \sum_{i = 1}^{n} | Ν_{Ρ_{C}} (x^{'}_{i}) |$ 。另 $\sum_{i = 1}^{n} | Ν_{Ρ_{C}} (x_{i}) | = \sum_{i = 1}^{n} | Ν_{Ρ_{C}} (x^{'}_{i}) |$ 故i≤n时 $\sum_{i = 1}^{n} | Ν_{Ρ_{C}} (x_{i}) | {= \sum}_{i = 1}^{n}$ |NQC(x′i)|成立,即⪯2满足反对称性。

定理6 偏序关系⪯是偏序关系⪯1的一个特例。

证明:设C(PC)、C(QC)∈C(U)且PC⪯QC,其中C(PC)=(NPC(x1),NPC(x2),…,NPC(xn)),C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),且NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin), NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。

由PC⪯QC知NPC(xi)⊆NQC(xi),i≤n⇔pij≤qij,i,j≤n,故对∀i≤n都有|NPC(xi)|≤|NQC(xi)|,其中|NPC(xi)|= $\sum_{j = 1}^{n} p_{i j} ‚ | Ν_{Q_{C}} (x_{i}) | = \sum_{j = 1}^{n} q_{i j}$ ,证毕。

定理7 偏序关系⪯1是偏序关系⪯2的一个特例。

显然可得偏序关系⪯是偏序关系⪯2的一个特例。

4 覆盖粒度空间多层次的粒度结构

粗糙集模型的信息粒度表示了粒度空间信息粒大小的某种平均度量,可以用来刻画粒度空间的分类能力,同样在覆盖粒度空间中覆盖信息粒度也具有相同的含义,也能够用来刻画覆盖空间的分类能力。

定义11 设C(PC)∈C(U),C(PC) = (NPC(x1),NPC(x2),…,NPC(xn)),那么PC在覆盖粒度空间中的相容信息粒度为 $G Κ (Ρ_{C}) = \frac{1}{n}$ $\sum_{i = 1}^{n} \frac{| Ν_{Ρ_{C}} (x_{i}) |}{n}$ ,其中|NPC(xi)|是相容信息粒NPC(xi)的基数。

定理8 设C(PC)、C(QC)∈,若C(PC)⪯C(QC),则GK(PC)≤GK(QC)。

证明:由C(PC)⪯C(QC)知NPC(xi)⊆NQC(xi),i≤n⇔pij≤qij,i,j≤n,故对∀i≤n都有|NPC(xi)|≤|NQC(xi)|,其中 $| Ν_{Ρ_{C}} (x_{i}) | {= \sum}_{j = 1}^{n} p_{i j} ‚ | Ν_{Q_{C}} (x_{i}) | = \sum_{j = 1}^{n} q_{i j}$ ,故而 $\frac{1}{n} \sum_{i = 1}^{n} \frac{| Ν_{Ρ_{C}} (x_{i}) |}{n} \leq \frac{1}{n} \sum_{i = 1}^{n} \frac{| Ν_{Q_{C}} (x_{i}) |}{n}$ 即有GK(PC)≤GK(QC),证毕。

显然在其他偏序关系下有类似结论。

定理9 若C(PC)∈C(U),GK(PC)+ζGK(PC)=1。

证明:由定义10知:

$\begin{array}{l} G Κ (Ρ_{C}) + ζ G Κ (Ρ_{C}) = \frac{1}{n} \sum_{i = 1}^{n} \frac{| Ν_{Ρ_{C}} (x_{i}) |}{n} + \frac{1}{n} \sum_{i = 1}^{n} \frac{| ~ Ν_{Ρ_{C}} (x_{i}) |}{n} \\ = \frac{1}{n^{2}} \sum_{i = 1}^{n} \sum_{j = 1}^{n} p_{i j} + \frac{1}{n^{2}} \sum_{i = 1}^{n} \sum_{j = 1}^{n} (1 - p_{i j}) = 1 \end{array}$

证毕。

定义12 设C(PC)∈C(U),C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),那么PC在覆盖粒度空间中的粗糙度为:

$E_{r} (Ρ_{C}) = - \sum_{i = 1}^{n} \frac{1}{n} \log_{2} \frac{1}{| Ν_{Ρ_{C}} (x_{i}) |}$ 。

定理10 设C(PC)、C(QC)∈C(U),若C(PC)⪯C(QC),则Er(PC)≤Er(QC)。

证明:由C(PC)⪯C(QC)知NPC(xi)⊆NQC(xi),i≤n⇔pij≤qij,i,j≤n,故对∀i≤n都有|NPC(xi)|≤|NQC(xi)|,其中 $| Ν_{Ρ_{C}} (x_{i}) | = \sum_{j = 1}^{n} p_{i j} ‚ | Ν_{Q_{C}} (x_{i}) | = \sum_{j = 1}^{n} q_{i j}$ ,再由定义11可知:

$\begin{array}{l} E_{r} (Ρ_{C}) = - \sum_{i = 1}^{n} \frac{1}{n} \log_{2} \frac{1}{| Ν_{Ρ_{C}} (x_{i}) |} = \frac{1}{n} \sum_{i = 1}^{n} \log_{2} | Ν_{Ρ_{C}} (x_{i}) | \\ = \frac{1}{n} \sum_{i = 1}^{n} \log_{2} \sum_{j = 1}^{n} p_{i j} \leq \frac{1}{n} \sum_{i = 1}^{n} \log_{2} \sum_{j = 1}^{n} q_{i j} \\ = \frac{1}{n} \sum_{i = 1}^{n} \log_{2} | Ν_{Q_{C}} (x_{i}) | = E_{r} (Q_{C}) \end{array}$

证毕。

定理11 设 $\frac{U}{R} = {X_{1}, X_{2}, \dots, X_{m}}$ 是一个等价粒度空间,则R的相容信息粒度退化为粗糙熵 $E_{r} (R) = - \sum_{i = 1}^{m} \frac{| X_{k} |}{n} \log_{2} \frac{1}{| X_{k} |}$ 。

证明:对于等价关系R,若R(x,y)=1且R(y,z)=1则R(x,z)=1,即rij=1或0,i、j≤n。令Xk={xk1,xk2,…,xksk},k≤m,其中|Xk|=|[xkl]|=sk且 $\sum_{k = 1}^{m} s_{k} = n$ ,因此:

$\begin{array}{l} - \sum_{i = 1}^{m} \frac{| X_{k} |}{n} \log_{2} \frac{1}{| X_{k} |} \\ = - \sum_{i = 1}^{m} (\frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{k 1}) |} + \frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{k 2}) |} + \dots + \\ \frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{k s_{k}}) |}) \\ = \sum_{i = 1}^{m} (\frac{1}{n} \log_{2} | Ν_{R} (x_{k 1}) | + \frac{1}{n} \log_{2} | Ν_{R} (x_{k 2}) | + \dots + \\ \frac{1}{n} \log_{2} | Ν_{R} (x_{k s_{k}}) |) \\ = \frac{1}{n} \log_{2} | Ν_{R} (x_{1}) | + \frac{1}{n} \log_{2} | Ν_{R} (x_{2}) | + \dots + \frac{1}{n} \log_{2} | Ν_{R} (x_{n}) | \\ = - (\frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{1}) |} + \frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{2}) |} + \dots + \\ \frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{n}) |}) \\ = - \sum_{i = 1}^{n} \frac{1}{n} \log_{2} \frac{1}{| Ν_{R} (x_{i}) |} = E_{r} (R) \end{array}$

证毕。

上述结论表明等价知识库中的粗糙熵是覆盖粒度空间中相容信息粒度的一个特例。上述偏序关系⪯、⪯1、⪯2不仅刻画了覆盖粒度空间的多层次粒度结构,而且对于揭示相容信息粒度的本质具有更加深刻的描述。

5 结语

粒计算是一种粒化的思维方式及方法论,是一种独特的基于多层次与多视角的问题求解方法。它借助粒、层、序等概念,为人类解决复杂问题提供了一个通用模型,通过粒可以将问题进行粒化,从而获得多层次的描述与理解。覆盖粗糙集理论作为经典粗糙集理论的扩展近年来得到了研究者们广泛关注,然而对于覆盖粗糙集理论的研究多集中在其构造方法、公理性质和结构度量的研究,将其规范的纳入粒计算范畴、描述其在覆盖粒度空间中统一的知识表示、基本运算,进一步刻画其在覆盖粒度空间中的层次关系,揭示覆盖粒度空间的多层次粒度结构的本质工作更有意义。

摘要：针对覆盖粒度空间中的知识表示、基本运算、层次结构及粒度结构度量问题进行分析与研究。首先,定义覆盖近似空间中对象的相容类,构造覆盖粗糙集模型的相容关系,定义相容类中对象之间的相容度,由此相容关系诱导出覆盖粒度空间的概念。其次,给出覆盖粒度空间下对象的矩阵表示,定义覆盖粒度空间中基本运算,并诱导出覆盖信息粒的概念,从而对覆盖粒度空间中粒度的大小进行了度量。接着,定义覆盖粒度空间的三种偏序关系,以此揭示覆盖粒度空间的层次关系。最后,定义覆盖粒度空间的信息粒度、粗糙度和粗糙熵,研究在覆盖粒度空间中多层次粒度结构度量的各种关系。研究结果统一了覆盖粒度空间下信息粒度的相关度量,从而为粒计算的多层次粒结构理论进一步的完善提供依据。

关键词：粒度计算,覆盖粗糙集,偏序关系,粗糙熵,覆盖粒度空间

参考文献

[1]苗夺谦,李德毅,姚一豫.不确定性与粒计算[M].北京:科学出版社,2011:132-135.

[2]Bargiels A,Pedrycz W.Granular Computing:An Introduction[M].Boston:Kluwer Academic Publishers,2002:125-130.

[3]Pawlak Z.Rough Sets[J].International Journal of Information and Computer Sciences,1982(11):341-356.

[4]Zadeh L A.Towards a theory of fuzzy information granulation and its centrlity in human reasoning and fuzzy logic[J].Fuzzy Sets and Sys-tems,1997,19:111-127.

[5]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246.

[6]王国胤,张清华.不同知识粒度下粗糙集的不确定性研究[J].计算机学报,2008,31(9):1588-1598.

[7]Zakowski W.Approximation in the space(U,Ⅱ)[J].Demonstratio Mathematica,1983,16(3):761-769.

[8]Bonikowski Z,Bryniarski E,Wybraniec U.Extensions and intentions in the rough set theory[J].Information Sciences,1998,107:149-167.

[9]Yao Y Y.On generalizing rough set theory[C]//The9th International Conference on Rough Sets,Fuzzy Sets,Data Mining,and Granular Computing,Chongqing,2003:44-51.

【粒度模型】推荐阅读：

粒度分析10-19

粒度设计05-08

粒度计算06-05

知识粒度07-31

粒度检测08-03

服务粒度09-10

数据粒度09-14

粒度分布11-12

产品粒度11-25

颗粒粒度分布08-26

>> 查看更多相关文档