数据粒度

2024-09-14

数据粒度(精选9篇)

数据粒度 篇1

1. 引言

模糊粒度模型在决策支持及信息管理系统的局势分析中发挥着重要作用。人们在解决问题时, 能从几个不同的粒度世界去分析和观察同一个问题, 并且很容易从一个粒度世界转到另一个粒度世界。为了描述这个现象, 建立了一种商结构的形式化体系, 给出了一套解决信息综合、启发式搜索、路径规划和推理等领域问题的理论和算法, 并已有一些研究和应用。目前, 关于模糊粒度模型的研究有Pawlak的“粗糙集理论”、Zadeh的“模糊集理论”和张铃等提出的基于上空间粒度计算, 有许多学者在模糊粒度计算领域进行了研究、以不同粒度求解问题的商空间模型已在模糊粒度领域引起了同行的关注, 其着重点是研究不同粒度世界之间相互转换、相互依存的关系, 及研究不同粒度问题之间的转换以及确定粒度模型与模糊粒度模型之间的关系。

本文提出利用学籍管理系统中的有关数据基本表, 进行分析、综合, 先建立确定粒度模型;再将确定粒度模型转换成模糊粒度模型, 利用模糊粒度模型对信息管理系统中的信息进行分析、研究, 实现数据仓库联机分析处理。

2. 定义和符号

Zadeh于1979年在文献中提出了模糊粒度的概念, 文中定义信息粒度为一个命题:X的值程度A隶属于模糊子集G包含于U, 其中X是U上的变量, X的值是U上的一个实体, 写成:g=X is G is A, 形式上被记成:g={∈U:X的值 (V (x) , V是U上的赋值符号) 是以程度A隶属于模糊子集G包含于U}, 很显然A∈【0, 1】。以模糊集的观点, 此处的A是模糊隶属度函数U|G;而以辑学观点, 此处的A是所建立的命题的模糊针织或概率。

通过二元关系定义子粒。设S= (U, A, V, f) 是信息系统, B:V→U二元关系, 其中U是所讨论对象的全集, A是属性集, V是属性值集, f是信息函数。用B定义粒是如下形式:g={u∈U:uBp, p∈V}显然g是清晰还是模糊完全取决于B的特性。设有两个关系B和D, 如果B包含于D, 则按B将全域划分的粒比按D将全域划分的粒更细, 在这种情况下, 也可以将不同大小的粒度分成不同粒度层, 并在不同层上进行各自分别处理。

在实际应用中, 如果粒度太细, 搜索空间庞大, 容易陷入组合

爆炸的情况;如果粒度太粗, 又会失去一些有用的信息, 因此需要从已知知识合成不同粒度知识。

设 (X1, P1, f1) 、 (X2, P2, f2) 是 (X, P, f) 的商空间, X1, X2对应的等价关系分别为R1, R2。

定义1:X1, X2的合成空间X3, 其对应的等价关系为R3。X3是X1、X2的细粒度合成空间, 满足R (x, y) ≡ (R1∩R2) (x●y) .

用划分来表示合成;设划分X1={a1}、X2={b1}, 则X1和X2的合成X3={a1∩b1|a1∈X1, b1∈X2}.X1和X2的积X3=X1●X2对应于等价关系R1∩R2的划分, 可以证明R1∩R2是一个等价关系。

定义2:X1, X2的合成空间X1, 对应的等价关系为R1, X1是X1、X2的粗粒度合成空间, 满足R1 (x, y) ≡ (R1∩R2) ● (x, y) 。其中 (R1∪R2) ●是 (R1∪R2) 的传递闭包, 用划分便是合成设x1和x2的和对应于传递闭包 (R1∪R2) ●的划分, 记x1=x1+x2可以证明 (R1∪R2) 是一个等价关系。

粒度和等价关系有着密切的关系。本节主要是对粒度合成技术在实际应用中的推广和补充, 即如何从已知知识合成粒度知识, 并能方便地从几个不同粒度世界去分析和观察同一个问题, 从而降低问题求解的复杂性。

3. 模糊粒度模型的建立方法

以高校学籍管理系统为例, 在学籍管理系统基础上建立数据库, 并利用高校学籍管理系统中的信息数据导出数据库中低粒度表;再导出数据仓库中的高粒度表;最后根据隶属度函数分析, 得出模糊粒度表;将高校学籍管理系统中的关系表中大量的数据进行分析、综合, 并且对导出的模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

模型建立过程如下图所示:

注:该成绩表中有30条记录, 分别是该班级30名学生数据仓库这门课程的成绩。下面由数据库中的学生成绩表 (低粒度表) 导出对应的确定粒度表 (高粒度表) 。

注:按照上面学生成绩表中的学生成绩将其成绩划分成优、良、中、及、不及五个等级, 五个等级对应的成绩分布如上表中成绩分布所示, 其对应的人数如上表所示, 总人数30人。

下面由确定粒度表 (高粒度表) 导出模糊粒度表, 如下表所示:

注:上面模糊粒度表的人数比例是从我自己观点出发, 根据隶属度函数计算所得, 该人数分布成正态分布。考虑到管理层不同的管理人员或决策者出发点不同, 可能会出现不同的人数比例计算结果, 但是有一点肯定不会改变, 即就是他们计算得出的人数比例分布一定成正态分布, 并且他们大多数人计算出得人数比例基本相同, 出入不大。这就突出了模糊粒度模型在信息管理系统应用中有很大的弹性, 比较灵活, 有利于数据仓库联机分析处理更好地进行, 从而大大地减轻了管理人员的负担。尤其在Oracle数据库中, 由于数据信息量大, 记录条数比较多, 通常会出现数据繁杂, 信息爆炸现象。但是将模糊粒度模型应用到大型信息系统中去, 会有效地避免信息爆炸现象。

模糊粒度模型的建立过程:

Ⅰ用适当的数学方法对问题进行描述

在数据仓库模糊粒度模型的建立过程中, 引用概率论和统计学对信息管理系统中的信息数据进行计算、分析, 由于该模型是模糊的、不确定的, 因而使用隶属度函数对模糊粒度表中数据进行计算, 得出结果后检验其是否符合正态分布规律 (一般分布规律) 。

Ⅱ采用各种数学方法和计算机工具求解模型

本文在信息管理数据模糊粒度模型的基础上, 设立了辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥了决策作用, 同时也对模型进行了求解。

Ⅲ模型建立步骤和方法

本文在学籍管理系统的基础上, 由系统中的基本表导出确定粒度表, 进而得出模糊粒度表;利用隶属度函数对模糊粒度表中的信息数据进行计算、分析, 检验检验其是否符合正态分布规律, 再将各模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

4. 应用和分析

在信息管理系统和智能辅助决策IDSS中, 根据粒度化历史数据变动情况和查询统计要求, 可使业务流程数据与决策信息形成有效流转, 在信息管理数据模糊粒度模型基础上, 设立辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥辅助决策作用。假设某粒度级因素项的数据量为X, 关联因素项数据量为Y, 数据挖掘分析结果项为Z, 那么建立辅助决策数学模型, 假若, X与Y的增长量分别为dx、dy, 就对应一个分析结果项变化量dz, 其关系为积分方程:

在上式中, 把指标临界值分别设为x=x0, y=y0, z=z0, 各粒度级因素项的数据量分别设为x1, x2, ……xn;各关联因素项数据量分别为y1, y2, ……yn;各数据挖掘所获得的分析结果项分别为z1, z2, ……zn。这些值, 有的情况是离散值, 但大多数情况是连续值或分段连续值, Z为积分曲线。

上面辅助决策数学模型是建立在模糊粒度模型的基础上, 它可以有效地自动对信息管理系统中的数据信息进行处理、衡量, 从而大大地减轻了管理人员和决策者的负担。

数据仓库模糊粒度模型应用到信息管理系统中, 它可以对现实中一些模糊的问题或者决策者难以驾驭的问题进行处理。由于实际应用中信息往往是不完全、不精确或不确定的, 有时很难对粒度粗细进行划分。在现实生活中, 比如天气情况“晴”、“多云”、“阴”等都很难有个“界限分明”的不相交的分类, 有时甚至连相交与否都说不清, 只能模糊地进行分类。从上述分析可知, 现在的数据仓库联机分析处理大多是基于静态、确定、有限、历史的数据仓库集进行研究的, 而对当今信息系统中数据信息的流动性、快读变化性、无限性和不确定性的特点, 目前的联机分析处理技术需要重新考虑、选择, 甚至再研发。而数据仓库模糊粒度模型完善了这一方面的缺陷, 使得数据仓库联机分析处理能够很好地对信息管理系统中的信息数据进行处理, 给决策者大大地提供了方便。

5. 结束语

本文提出数据仓库模糊粒度模型, 并将其应用于学籍管理系统。针对实际问题, 将数据仓库模糊粒度模型进行了推广和应用。首先提出了粒度的概念, 并介绍了粒度的等级划分, 阐述了粒度和等价关系之间的紧密联系, 将粒度合成技术在实际应用中进行了推广和补充, 引入确定粒度模型的概念, 在此基础上, 建立了数据仓库模糊粒度模型。将确定粒度模型与模糊粒度模型进行了比较, 充分体现了模糊粒度模型的实用性和优越性。

通过本文的讨论, 基于模糊粒度模型理论方法是采用概率统计方法研究粒度的计算方法, 那么它就可以有效地应用于信息管理系统中进行统计和分析, 既可以使得数据仓库联机分析处理更好的进行处理, 又可以大大地降低问题的复杂性, 从而减轻决策者和管理人员的负担。

参考文献

[1]W.H.Inmon, building The Data Warehouse Third Edition[M]John Wiley﹠sons, Inc.2002

[2]Zhang L.Zhang B.The Quotient Space Theory Of Problem Solving Fundemental Information.2003.59 (2-3) .287-298

[3]W.H.Inmon, building The Data Warehouse.Practice Hall, 1992

[4]W.H.Inmon, R.D.Hackathorn《Using The Data Warehouse》[M].John Wiley﹠sons.Inc, 1994

[5]G.Bell and J.N Gray The Revolution yet to happen, Beyond Calculation Spring Verlag, 1997

数据粒度 篇2

(2)研究加热温度保温时间及循环热处理对奥氏体晶粒大小的影响。

(3)从晶粒大小的观点出发确定合理的热处理加热规程。

二、.实验内容 用直接腐蚀法利用比较的方法对奥氏体晶粒进行测定。

三、实验步骤

(1)将已热处理好的试样进行磨光制成金相试样。

(2)将制成的金相试样,用相应的腐蚀剂将晶界腐蚀出来。然后在 100 倍的显微镜下观察,如晶界不清楚,试样可经二次或三次腐蚀、抛光重复操作。

(3)用比较法或弦计算法测定晶粒的大小,最后确定级别。

四、对实验报告的要求

1、描述试验过程。

影响硫铵结晶粒度因素的控制 篇3

【关键词】硫铵;结晶;粒度

前言

硫酸铵装置是炼化公司丙烯腈生产的配套装置,用来处理丙烯、氨氧化法生产丙烯腈的副产物硫酸铵溶液。本装置生产采取减压蒸发等操作,使丙烯腈装置来的稀硫酸铵溶液增浓到过饱和,实现回收结晶硫酸铵的目的。

1、硫铵结晶原理

硫铵的结晶主要由反应、过饱和溶液的形成、晶核的产生和晶体的成长几个阶段组成。随着反应的进行,形式过饱和溶液,达到一定过饱和度时,析出固相微观晶粒,这是晶核的形成过程,接着是晶核的長大也称为晶体的生长过程。由于晶液的流动,晶体之间及晶体与设备之间的摩擦、碰撞,液体对晶体表面的冲刷,又产生新的晶核,称为二次成核。通常晶核的形成和晶体的成长是同时进行的。在结晶过程中,无论是晶核的形成,还是晶核的生长,都要消耗溶液中的溶质,均以一定的过饱和度为推动力。每一粒晶体都是由一粒晶核生长而成的,在一定条件下,如果晶核成核速率越大,晶核的生成量越多,溶液中有限的溶质要同时供应大量的晶核生长,晶核的生长速率就越慢,结果导致大量的细小结晶;反之,晶核的生成量越少,结晶粒度就会长得越大。可见,晶核的生成速率和晶核的生长速率是此消彼长的关系,如能控制这两种速率,便可控制结晶的粒度。

此外,结晶条件对产品的粒度也有很大的影响,如温度、搅拌、酸度、杂质等都以一定的方式影响结晶过程。

2、影响硫铵结晶粒度的因素

根据结晶原理分析,影响硫铵结晶粒度的因素,归纳起来,主要有以下几项:

(1)母液的搅拌程度(2)饱和器工作温度(3)母液的酸度和加酸制度(4)母液的晶比(5)母液中的杂质

母液的搅拌程度和饱和器工作温度变动不大,可以说近似恒定;母液的酸度、晶比随时间呈周期性变化,控制不当,对结晶粒度将产生很大影响;母液中的杂质,在量的变化上比较敏感,一旦发生,对生产的影响很大。所以,母液的酸度、晶比、杂质含量,是生产控制的重点。

3、影响因素的控制

3.1母液酸度

母液酸度对硫铵结晶的影响一是酸度的高低对结晶形状的影响,二是酸度的频繁变动破坏了结晶的正常生长条件。在一定条件下,随着母液酸度的提高,母液的介稳区减小,硫铵晶形从多面体颗粒转变为细长易碎的六角棱柱形,同时,母液黏度增大,阻碍晶体的正常生长;过低也不行,虽然硫铵结晶在pH5~6的弱酸性介质中生成较大的圆形晶体,但是使氨的吸收效率下降,还易造成饱和器堵塞,而且当母液酸度低于3.5%时,因母液密度下降易产生泡沫,使饱和器操作恶化。为避免这些影响,必须在酸性介质中进行结晶,正常生产时,母液酸度保持在 4%~6%为宜。酸度对结晶粒度的影响还表现在定期向系统大加酸时,母液酸度大幅度提高,使母液中的晶种消失,破坏了结晶的正常生长条件。再次结晶时,在较高饱和度下发生初级成核,使母液中的细小结晶增多。因此要生产大颗粒结晶硫胺,应减少大加酸的次数,尽量延长饱和期的稳定操作时间。

3.2母液晶比

对饱和器中晶比的控制,是控制硫胺结晶粒度的重要措施。从结晶原理可以知道,如能控制成核速率和晶核的生长速率便可控制晶体的粒度。然而,在生产中这两种速率是极不易控制的,无论是爆发式的初级成核,还是因摩擦碰撞产生的二次成核都很难控制,生成的晶核总是过量。过饱和度的高低,在一定温度下取决于母液中晶核的数量。当母液中存在足量晶核时,新生成的硫胺溶质完全用于晶体的生长,过饱和度趋于稳定,晶体处于稳定的生长环境中。生产中采用控制晶比的办法来控制过饱和度,达到控制晶体粒度的目的。晶比的大小直接影响结晶的粒度。晶比过大时由于摩擦碰撞机会增多,大颗粒结晶被破碎,使二次成核量增大,晶体成长速率减慢,晶体粒度减小,并使母液搅拌阻力增加,导致搅拌不良,同时减少了氨与硫酸反应所需的容积,不利于氨的吸收,还易加重堵塞情况;晶比太小可能出现晶核量少,使过饱和度升高,产生大量的初级成核,使结晶粒度减小,晶比太小,使取出次数增加,缩短了晶体的生长时间,同样使晶体粒度减小。因此,母液中必须控制一定的晶比,以得到大颗粒硫胺。

晶比的控制原则应是:避免初级成核,适当控制二次成核,尽量延长晶体的生长时间。对晶比的控制,除在量上控制晶比外,还要对结晶的形状、色泽进行观察,预测饱和器内结晶情况,结合实际取出结晶粒度进行判断,调节。如果发现晶液中结晶细小,且取出晶粒也小,则应考虑是否酸度过高,还是晶比高低不当,成核过多所致。

3.3杂质

硫铵母液中杂质的种类和含量,取决于所采用的工艺流程、硫酸质量、用水质量和设备的防腐质量。母液中所含的可溶性杂质主要有铁、铜铝、砷等各种盐类,主要来自硫酸、设备腐蚀和工业用水,这些离子吸附在硫铵结晶的表面,遮盖了结晶表面的活性区域,使结晶成长缓慢;金属离子对硫铵晶体的生长有较大影响,尤其是铁离子影响最大,即使在母液中含量极少,也会使晶体生长速率显著下降。母液中的杂质不仅影响硫铵的晶形和晶体成长,而且还使单位时间内晶体体积总增长量小于饱和器中硫铵生成量,打破固液平衡,不仅使晶体强度降低,同时形成大量针状晶核,破坏正常操作。因此,必须在工艺、设备等方面采取有效措施,从根源上减小杂质的进入。

参考文献

数据库细粒度访问控制技术研究 篇4

目前多数信息管理系统、Web应用程序等将对数据的访问控制包含在应用程序代码中。虽然这种方法被广泛使用,它存在许多的不足。比如在应用程序内部为每个用户授权,不仅增加应用程序的代码量,而且如果授权策略进行了修改,会导致应用程序本身大量代码的修改;使用该数据库信息的所有应用程序都要分别在其代码中实现访问控制安全策略;应用程序的代码量越大,产生漏洞的可能性就越大,导致非法用户穿越应用程序的检查直接访问数据库。因此,针对数据库层面的访问控制是解决对数据访问进行控制的根本。

现在对于数据库的访问控制有更高的需求,越来越多的应用需要对数据访问进行更细粒度的访问控制,而大多数数据库提供的是表级,字段级或者视图级的访问控制,只有某些商业的数据库会提供记录级更细粒度的访问控制,比如DB2,Sybase,Oracle。从实现机制上,它们大多数基于对查询请求的修改,即根据访问控制的要求在用户请求中加入条件谓词,从而替换原有的用户请求提交给数据库进行处理。虽然这些技术在某些情况下会存在一些问题,但却可以完成对绝大部分数据的访问控制。本文详细介绍了实现数据库细粒度访问控制的查询修改技术的工作原理,分析了该技术存在的问题,研究了该技术的改进方法Truman模型及NonTruman模型,比较分析了它们的特点和不足。

1 查询修改技术

关系数据库中的查询修改技术在1974年由Michael Stonebraker和Eugene Wong等人提出[1],2002年Oracle技术白皮书中说明Oracle VPD实现了查询修改技术[2]。查询修改技术的主要思想是将一个提交给数据库的用户请求修改为另一种形式,该形式是符合用户访问权限的请求,将修改后的请求提交给数据库进行处理,数据库就仅仅返回那些用户授权可访问的数据。它为每个用户定制访问控制策略,从而实现了为用户授权,以此作为访问控制的依据。

该技术使用查询语言来定义访问控制策略并表示用户访问请求。该语言的具体结构如下:

其中Range就相当于SQL语句中的from,target-list相当于Select,而qualification就相当于Where。因此该查询语言可以用SQL语句来代替。

下面举例说明使用查询语言来分别表示数据查询请求和访问控制策略。假如存在如下的关系表:

假如用户要查找所有工作在一楼的员工信息,使用查询语言来表示查询请求如下:

假如有一条访问控制策略,只允许小王看到自己的信息,使用查询语言来表示该策略如下:

查询修改技术对用户请求的修改是根据算法实现的,假设对于用户u,对他的访问控制策略集合可以表示为:I={I1,…,Ik},其中每条策略Ij都通过查询语言的形式表达,可以使用特殊关键字比如:ALL、NO ACCESS以及一些功能函数比如AVE()等。则查询修改算法描述如下:

对出现在用户请求R中的每个元组变量X,都按如下步骤计算:

在R的目标列(target list)和条件(qualification)中找到X中所有的字段,将该集合称为S。

在该用户的访问控制策略中找到所有与R命令相同的并且目标列中包含S中元素的策略,将他们表示为IR={I1,…,Ij},把他们的条件表示为Q1,…,Qj。

从集合IR中删除Ij,其中Ij的目标列字段包含了其他策略的目标列中的字段。

将请求R中的条件替换为Qand(Q1and…Qj)。

下面举例说明算法的执行步骤。例如,定义对于用户A能看到所有的工资信息,只要它的查询请求的目标列或者条件中不出现name和department字段。另外,如果不出现salary字段他可以看到除了员工B以外任何员工的name,manager信息。而且,他可以看到所有比经理工资高的员工的name,manager,salary字段。最后,他能看到营业额比平均营业额高的所有部门的全部字段。那么用查询语言描述该策略如下:

此时,假设A向数据库提交了查询Adam经理的请求,用查询语言表示如下:

根据算法,将A提交的请求修改为:

根据实际情况不难验证该算法的正确性。但是同时该技术有一个缺点就是因为对用户请求的修改是透明的,因此导致了查询返回的数据信息与用户请求的数据存在不一致。例如:访问控制策略定义用户C只能看到自己的工资信息,用查询语言表示如下:

如果此时数据库收到C提交的请求,要访问公司的平均工资,用查询语言表示该请求:

根据该算法修改后的查询语句为:

这样数据库返回的就是C本人的工资了,这会给C一个错误的信息,使他认为自己有权访问公司的平均工资,并且自己的工资恰好就是公司的平均工资,从而造成误解。

该方法的另一个特点就是对字段和记录控制的程度不一样。可以通过条件限制过滤出用户有权访问的记录,而对于字段,如果用户的请求中包含了不可访问的字段,则直接将该请求拒绝,而不是将允许用户访问的字段返回。另外对于修改后的查询语句,其条件中可能嵌套有多层查询,造成增加查询语句的复杂度,从而增加修改后查询语句的处理时间。

2 杜鲁门模型(Truman Model)

通过为每个用户生成不同的关系视图可以实现访问控制,但是当用户量大的情况下,为每个用户制定视图工作量也很大,并且当授权策略变化时,可能会影响到许多视图,这给视图的管理带来了麻烦。为此,提出了动态授权视图,即带参数的授权视图。带参视图与正常的关系视图类似,只是在视图的定义中带有一些类似于用户号,时间,用户位置等的参数。这些参数根据不同的用户和不同的访问被赋予不同的值。因此,对于同样的参数视图可根据执行环境的不同产生在同一数据库上的不同结果。仍然使用上面的例子,假设只允许用户查看自己的工资信息,这可以用带参视图表示如下:

在这里user-name以参数的形式出现在视图的定义中。该试图还可以带有其他的一些参数比如时间,用户地址等。当一个用户请求对数据库访问时,这些参数就会被实际的值所代替,从而形成带参视图的实例,真正决定用户访问范围的是这些带参视图的实例。

Shariq Rizvi等人[3]在基于动态授权视图的基础上提出了数据库访问控制的杜鲁门模型。杜鲁门模型的思想就是为数据库中的每个关系表都建立一个授权视图,该视图定义了用户可以从该表中获得的数据范围,当用户请求访问某个关系表中的信息时,将语句中的表替换成相应的带有参数授权视图,通过获取相关参数动态形成用户查询,用户请求在数据库执行之前被透明的修改,从而确保了用户不能获得授权视图之外的信息。

杜鲁门模型使用带参视图而不是固定的访问控制策略,因而比查询修改技术在授权上更加灵活;针对关系表制定授权视图而不是为每个用户都维护授权视图,大大简化了视图的管理。由于其实质都是对用户请求的修改,因此杜鲁门模型也存在用户请求数据与数据库返回信息不一致、对字段和记录控制的程度不同的问题。

3 无杜鲁门模型(Non-Truman Model)

为了改进细粒度访问控制中的查询修改技术,改善杜鲁门模型的不足,2004年Shariq Rizvi等人提出了Non-Truman模型[3]。该模型中,要对用户的查询请求进行有效性检查,没有通过有效性检查的请求,将直接被拒绝并告知用户无此访问权限;如果通过了有效性检查,就正常执行用户的查询请求而不需要进行修改。这里的有效就是指用户的请求可以只通过包含在授权视图中的数据进行回应。授权视图对用户可以是透明的,用户的查询请求只针对数据库关系表。数据库管理员可以为每个访问策略生成一个授权视图,每个授权视图都是检查用户查询请求有效性的依据。

该模型定义,一个用户查询q是无条件有效的当且仅当存在一个查询q’,q’仅仅根据授权视图来回答请求,但是在任何情况下返回的结果都与q相同。然而也有一些查询,它的有效性依赖于数据库的当前状态,该模型将其归为有条件有效查询。比如对于下面的请求:

Select avg(grade)From Grades Where student-id=11;

当用户的ID号为11时,这个请求就是无条件有效的。再比如,假设当课程的参加人数大于10个学生时允许访问该课程的平均成绩。那么对于请求Select ave(grade)from Grades where course-id=101的有效性就依赖于数据库的状态了。

另外该模型还定义了用于判断无条件有效和有条件有效的规则集,根据这些规则可以推断出用户查询的有效性。Non-Truman模型避免了杜鲁门模型因修改查询语句带来的不一致性,也给授权带来了灵活性。但是,根据规则来推理查询有效性的机制较复杂、实现困难,并且在某些情况下查询有效性判决算法并不能做出合理的判断。

4 存在问题及未来研究趋势

对本文重点研究的三种数据库访问控制机制进行比较分析,如表1所示:

这三者实质上都是通过修改用户查询请求实现细粒度访问控制的方法,基于查询修改的访问控制方法特点如下:

1)对用户请求的透明修改导致数据库实际执行的查询语句与用户请求的不一致,造成系统返回数据与用户实际期望不一致,造成用户对返回信息的误解。Non-Truman模型能够预先检查用户请求的有效性,拒绝不合法的用户请求,或者告知用户访问这些数据需要满足的约束条件,解决了这一问题。

2)对查询语句的重写,会造成语句执行的效率降低。例如,将查询语句中的数据表替换为对应的视图,一方面视图的复杂性造成查询语句执行的效率下降;另一方面,修改后的查询语句可能存在冗余,为了优化查询的执行还需要对修改后的查询语句进行简化,这也会消耗部分查询执行时间。Non-Truman模型对于无效的用户查询不予执行,从而避免了查询语句重写带来的查询效率降低问题,但是用户查询的有效性检查同样会带来效率的降低。

虽然Non-Truman模型避免了修改用户请求带来的问题,但检查查询语句的有效性还存在很多尚未解决的问题。用于检测查询有效性的推理规则的完备性和有效性还需要进一步测试,对于复杂情况下比如嵌套查询的有效性判定、大量请求出现时的处理性能以及该方法的完整实现都需要进行深入研究。

随着数据库技术的快速发展,面向对象的数据库系统、面向语义的数据库系统等新型数据库逐渐被普遍应用,对这些新型数据库系统的访问控制也是未来需要深入研究的问题。

5 结束语

随着信息技术的快速发展,数据库系统的细粒度访问控制显得尤为重要。本文详细介绍了实现数据库细粒度访问控制的查询修改技术的工作原理,分析了该技术存在的问题,重点研究了Truman模型及Non-Truman模型,比较分析了它们的特点和不足,并且对未来的研究方向进行了总结。

摘要:数据库系统担负集中处理大量信息的任务,目前越来越多的应用需要对数据访问进行更细粒度的访问控制,不仅仅是表/视图级的控制,而是进一步对单个记录的访问进行控制。本文详细介绍了实现数据库细粒度访问控制的查询修改技术的工作原理,分析了该技术存在的问题,重点研究了Truman模型及Non-Truman模型,比较分析了它们的特点和不足,并且对未来的研究趋势进行了总结。

关键词:数据库,细粒度,访问控制,查询修改

参考文献

[1]Michael Stonebraker,Eugene Wong.Access control in a RDBMS by query modification.ACM CSC-ER,1974.

[2]The Virtual Private Database in Oracle9ir2:An Oracle Technical White Paper.http://otn.oracle.com/deploy/-security/oracle9ir2/pdf/vpd9ir2twp.pdf.

数据粒度 篇5

运用筛析法和日本产光透式离心粒度分析仪(SA-CP3),结合热释光(TL)年代学,对大连市七顶山黄土粒度进行高分辨率分析.结果表明:黄土粒度成分偏粗,粒级集中在4~6φ(26.39%~48.33%)的粗粉砂级,粘粒含量少(0.05%~2.44%);马兰黄土粒级集中在2~4φ和4~6φ,其中粗粉砂比细砂含量稍多;离石黄土集中在4~6φ的粗粉砂粒级范围内.采用沉积物粒度参数的综合统计分析得出:中更新世以来本区黄土与内陆风成黄土沉积环境存在明显差异,本区黄土沉积是以近源为主、远源为辅的双物源沉积模式.

作 者:张威 李云艳 李丽 ZHANG Wei LI Yun-yan LI Li  作者单位:辽宁师范大学,城市与环境学院,辽宁,大连,116029 刊 名:资源与产业  PKU英文刊名:RESOURCES & INDUSTRIES 年,卷(期):2008 10(3) 分类号:P532 关键词:黄土   粒度分析   沉积环境   七顶山  

★ 安塞黄土丘陵区紫外辐射分布变化特征

★ 人教版九年级上册化学《元素》教案

★ 富钴结壳中贵金属元素的特征

★ 山西省大宁县黄土崩塌滑坡地质灾害发育特征与防治措施

★ Cd 胁迫对白菜生理特征及元素吸收的影响研究

★ 高松山金矿地质特征及找矿标志

数据粒度 篇6

1 多重粒度模型的建立

1.1 多重粒度的提出

确定系统的数据粒度是数据仓库逻辑模型设计的重要步骤。而要确定合理的数据粒度,首先需要粗略地估算将来数据仓库的数量级。数据仓库数量级的一个简单粗略估算方法是:设在概念模型中出现的表的个数为N,对于每个表i(0

其中,T是数据在数据仓库存在的周期。通常轻度综合的数据在数据仓库中存放的周期是5~10年。α是考虑由于数据索引和数据冗余而使得数据量增大的冗余因子,上式的含义是数据仓库数据量=(表的记录大小+主关键字大小)×记录的数量/单位时间×存储时间×冗余因子[3]。

一般来说,对于不同的数据量将采用不同的数据粒度策略,在数据量较小的环境下,采用单一的数据粒度,即直接存储细节数据并定期在细节数据基础上进行综合。由于数据仓库是进行DSS分析用的,绝大部分都是基于一定程度的综合数据查询的,因而在数据仓库中,采用多重粒度来分析数据是必不可少的[4]。

数据仓库临时表中用来存的记录随着时间的累积,数据量将不断增多,面对大规模的数据,要想从中得出用户需要的数据,必须建立一种有效地措施来方便、快捷地查询所需数据。在许多情况,建立简要记录数据量可以显著降低,按照数据的细节程度划分原则通过把许多记录聚集为一个记录,方便用户从大量数据查询和分析。当然根据相同的细节可以创建多个简要记录,按照不同的需求可以对数据仓库中的数据细节程度进行划分,比如按照不同时间记录进行划分、不同部门(地区)记录的划分、不同车型的划分、不同运输线路的划分等等。

在企业设备管理数据仓库表中,面对大量的数据信息,建立多重粒度可以按照企业中不同身份人员的操作需求不同,将数据划分为细节数据和综合数据(轻度总结、高度总结),划分的粒度的高低将会满足不同类型人的需求,以提高设备管理的系统性能和成本。

1.2 数据粒度划分模型算法

在数据仓库数据中,对于数据的划分提出一种新的基于粒度划分模型的算法。在论域U的一个划分π={Xi|1≤i≤m}对论域提供了按照某种属性(比如时间中的周或者月)的简单粒度观点,划分中的每个块Xi都是一个粒子,且满足:

每个Xi均为非空,且划分π={X1,X2,…,Xn}

对所有的i≠j,Xi∩Xj=ф

∪{Xi|1≤i≤m}=U

如果划分π1的所有块都包含在划分π2的块中,称划分π1是π2的细化,记作π1≤π2。细化关系是一个偏序,满足自反性、对称性和传递性,它定义了一个划分格∏(U)。∏(U)包含了论域的所有可能的粒度划分,空集提供了最粗的划分,全部的属性定义的划分是最细的划分,粒度之间的转换通过增加删除属性来实现。

进行粒度划分时,首先根据所在数据仓库中建立的表,建立数据索引来索取数据,针对不同数据采取分类索引,即通过所建表的行来组织,每个索引中的每一行总有一个索引项,用户在进行查询时,根据查询的内容来定位数据到底属于哪个粒度的“片区”,不同粒度级别的数据将用于不同类型的分析处理,在此区间进行分析处理,以提高查询效率。

1.3 多重粒度模型的设计

数据仓库中的粒度化的数据是重用性的关键。这是因为她可以由众多用户以不同方式使用。数据仓库的粒度化数据包含了整个企业的活动和事件的历史。并且数据粒度级别足够详细使得整个企业的数据位满足不同需要而进行重构。通常数据仓库可以使得不同部门从它所希望的角度来观察数据。数据仓库粒度化所带来的好处除了可以从不同角度观察分析数据之外,另一个好处就是可以利用数据仓库粒度化划分的数据进行一致性的协调,从而对两个部门或多个部门的不同分析结果的差异进行解释[1]。

在数据仓库中的数据分为4个级别:早期细节级、当前细节级、轻度综合级和高度综合级。源数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级。数据仓库中存在着不同的综合级别,这就是“粒度”的直观表现[2]。

数据仓库通常在同一模式中使用多重粒度。数据仓库中,可以有今年创建的数据粒度和以前创建的数据粒度。这是以数据仓库中所需的最低粒度级别为基础设置的。例如,可以用低粒度数据保存近期的数据和汇总数据,对时间较远的数据只保留粒度较大的汇总数据。这样既可以对设备信息进行细节分析,又可以利用汇总数据对设备运转趋势进行分析,这里的数据粒度划分策略就需要采用多重数据粒度。

数据仓库中的数据在时间维上按什么来汇总数据。为确保DSS分析员做分析时能得到他们需要的数据,我们考虑按照时间维来考虑数据,首先考虑的是在详细数据的基础上以较低级别来汇总数据(如以交易日为单位),那么做年度数据分析时,系统必然要消耗很大资源。但如果在较高级别上汇总数据(以年为单位),则极有可能需要向下挖掘数据来分析其月或者日的数据。所以DSS分析员必须通过和用户交流来确定数据粒度级别[7]。在石油钻井设备管理数据仓库中,我们采用多重粒度设计方案,数据仓库中包括详细数据、按月汇总数据、安照季度汇总、按年汇总数据等。

2 多重粒度模型在石油企业设备管理中的应用

在石油运输企业车辆设备管理中,车辆设备管理数据仓库基本上涵盖了从“车辆购入”到“车辆报废”过程中的全部数据信息,管理人员希望尽可能多地掌握不同分公司、中队车辆的基本档案信息、运行信息、行使里程、油耗量等运输信息,更换设备、维修、报废、小修、大修等维修信息,以及车辆行驶里程与油耗之间的关系、司机驾驶的车辆固定周期内维修次数等信息。

在石油企业设备管理系统中以运输车辆为例,整个运输公司运输管理过程是以每个车辆(配件)为单位的,我们建立了临时表来存放车(配件)的运输记录,在车辆管理期间,管理员可以对每辆车的运输记录情况进行浏览和修改,这个临时表按照整个石油企业的车辆100辆计,如果平均每月一辆车对应有20个不同部门使用,按照每个部门使用情况的不同统计,假设一辆车平均每月共有1000个运输记录,则这个临时表将有近100×20×1000=200000条记录,如果采用单一粒度级别设计,也就是是说如果直接存储细节数据并定期在细节数据基础综合的这样的设计不仅大大耗费存储空间,而且也会影响访问的效率。

在石油企业设备管理中,大量数据需要进行挖掘、分析,而管理人员分析的数据和关心的数据层面也有所不同,这就涉及到数据仓库中数据存储的粒度问题,即数据仓库中记录数据细化程度的问题。数据仓库单元中的细节程度是设计数据仓库的最重要的方面。建立数据仓库粒度模型对于回答企业中不同中队、分公司、总公司管理人员所需资源有着重要的影响,可以辅助管理人员科学制订相关决策和管理,更好地实现降低费用、提高监控力度、增加安全性等应用目的。

在石油企业设备管理数据仓库中以基于时间的粒度为划分模型,在车辆运输记录数据仓库中划分车辆运输任务日志数据,作为每个中队的管理部门人员来说,关心的是中队所辖区域的每月设备的运转状况,故按照时间粒度中的月属性,划分数据仓库的数据,将其的相关运输记录信息综合成每月的记录进行划分,划分结果如表1所示。

通常分公司管理部门人员可能想了解生产线上设备各个季度设备运转的汇总,我们在处理相应数据记录的时候,按照时间粒度中的季度属性来划分划分结果如表2所示。

企业总公司管理部门人员可能想了解生产线上设备各个年份设备运转的汇总,往往很少对单个事件按进行了解,总公司财务部门也可能更想了解不同年份的设备创收情况,可能都是针对某个数据集合进行处理[6],我们在处理相应数据记录时,按照时间粒度的年份属性来划分结果,如表3所示。

当然,按照不同需要也可按照时间的周属性、旬属性等等来划分数据仓库中的数据记录,这里就不再赘述。无论是企业中队人员、企业分公司管人员还是总公司数据仓库管理人员所需要的数据尽管有略微的不同,但是所有这些数据都是紧密相联的。数据仓库粒度化数据可以将其中的数据进行一致性的协调,从而对两个部门或多个部门的不同分析结果的差异进行解释。

在石油企业设备管理数据仓库数据中,对于上边提出一种按照时间粒度划分模型算法。论域U也就是所有车辆运输日志记录,对于车辆运输记录以月份划分提出简单的力度观点,划分中的每个月就是一个粒子,每个粒子满足以下条件:(1)每个粒子都为非空;(2)对于每个划分,比如1991年1月份和2001年2月份没有公共的交集;(3)所有这些划分的集合应该是车辆运输记录的全部集合。

当然按照季度划分、年份等划分均应满足以上条件。如果月份的划分记录π1的所有块都包含在按照年份的划分π2的块中,称划分π1是π2的细化,记作π1≤π2。这个细化关系是包含了论域的所有可能的粒度划分,全部的属性定义的划分是最细的划分,粒度之间的转换通过增加删除属性来实现。

这种数据不同细节的划分就是数据仓库中的数据存储粒度。在时间粒度上,OLAP往往对时间相隔较远的数据要求粒度较粗,对时间相隔较近的数据要求粒度较细。对于设备的库存量、使用情况等可以采取样本数据库保存设备情况的抽样快照,而对于运输设备运输情况、设备为公司的盈利状况和时间段相关的处理则采取普通的细节粒度和综合粒度结合的方式。此后,DSS分析员在确定数据粒度级别时必须针对不同的需求确定不同的粒度等级。在石油运输企业设备管理数据仓库中采取多重粒度划分。数据仓库事实表中存放数据时存放多重粒度数据,按照粒度划分的算法来划分出来的多重粒度的数据可以方便快捷地供管理人员分析决策用。

3 结束语

选择合适的粒度级别是数据仓库建设好坏的重要内容。在设计数据粒度时,通常须重点考虑各种因素。粒度的确定实质上是在对业务模型做深入了解的基础上,对业务决策分析、硬件、软件和数据仓库使用方法的一个折衷。随着原始数据的积累,数据库的信息量越来越大,单一的粒度级已经不再适合使用,而是需要使用多重粒度级来提高查询的效率,以便更好地满足用户的决策分析需要[5]。

参考文献

[1]W.H.Inmon.数据仓库[M].王志海,林友芳,等,译.北京:机械工业出版社,2003.

[2]王珊.数据仓库技术与联机分析处理[M].北京:科学出版社,1999.

[3]林宇.数据仓库原理与实践[M].北京:人民邮电出版社,2003.

[4]李志刚,马刚.数据仓库与数据挖掘的原理及应用[M].北京:高等教育出版社,2008.

[5]黄玉明,毛宇光.数据仓库中多重粒度划分的层次编码解决方案[J].计算机发展与技术,2008(10).

[6]许学军.数据仓库中数据的粒度划分[J].阜阳师范学院学报:自然科学版,2006.

[7]李静.数据仓库中的数据粒度确定原则[J].计算机与现代化,2007(2).

数据粒度 篇7

粒度计算GrC(Granular computering)是近几年来研究的热点内容,它以姚一豫提出的粒计算三元论(即多视角、多层次粒结构和粒计算三角形)为基本研究框架,从哲学、方法论、信息处理三个侧面进行结构化思维、结构化问题求解、结构化信息处理的深入探究,并吸纳、提炼及抽象各个学科中粒处理思想以期建立系统的、与具体学科知识无关的粒计算原理,从而指导人类问题求解和实现机器问题求解[1]。传统的观点将粗糙集理论、模糊理论及熵空间理论视作粒度计算的主要模型,但随粒度计算的发展与研究表明,粒计算不仅仅是文献[2]所认为的“信息处理方向的一种新的概念和计算范式”。其也不限于目前研究较多的粗糙集模型,模糊集模型,熵空间模型三种具体模型[3,4]。

在现实世界的信息处理中,由于粗糙集理论思想新颖、方法独特,其已成为一种重要的粒度计算模型,并已在机器学习与知识发现、数据挖掘、决策支持与分析得到广泛应用[5]。粗糙集理论与应用的核心基础是从近似空间导出的一对近似算子,即上近似和下近似,但经典的Pawlak模型中的不分明关系是一种等价关系,限制了粗糙集模型的应用,因此如何推广定义近似算子成为了粗糙集理论研究的一个重点[6]。自文献[7]最早将粗糙集理论从划分推广到覆盖,文献[8]定义了覆盖近似空间中对象的最小描述,并从内涵和外延的角度研究了覆盖近似空间中概念的近似含义,文献[9]基于对偶原则定义了两组覆盖粗糙近似算子,并研究了它们在不同邻域系统中的性质。Eric C.C. Tsang等对覆盖粗糙集的上近似进行了研究,提出了一种介于文献[7]覆盖上近似和文献[8]上近似之间的覆盖上近似算子,还有很多学者对此做出了重要贡献,上述研究使得覆盖粗糙集理论研究取得了重大的进展且得到了更广泛的应用。

覆盖粗糙集理论作为粒度计算的组成部分,其所在的覆盖粒度空间的知识如何统一表示,覆盖粒度空间的数据建模的核心粒化机理如何建立,覆盖粒度空间的合成、分解和转换如何进行,如何刻画覆盖粒度空间的多层次结构及描述其粒度结构的度量等问题为进一步研究粒度计算具有重要的意义。本文首先定义了覆盖近似空间中元素的相容类,在此基础上定义了相容关系,并由此相容关系定义了相容类中元素之间的相容度,给出了覆盖粒度空间下元素的矩阵表示,由此定义了覆盖粒度空间中基本运算,拓展了覆盖粒度空间的合成运算、分解运算和转换运算,并诱导出覆盖信息粒的概念,给出了相应的性质和结论,进一步定义了覆盖粒度空间的三种偏序关系,通过证明以此揭示了覆盖粒度空间的层次关系,最后定义了覆盖粒度空间的信息粒度、粗糙度和粗糙熵,研究了在覆盖粒度空间中多层次的粒度结构中的各种关系。上述工作无疑对于粒计算的多层次粒结构理论的进一步完善具有重要的意义。

1 覆盖粒度空间

经典的粗糙集理论是基于论域上的等价关系,由等价关系所诱导的论域上的划分来对知识进行分类,Pawlak称之为论域上给定的一个知识基。而现实世界中实际问题里往往不存在等价关系,取而代之的是覆盖相容关系或更为一般的关系,因此基于覆盖粒度空间的研究更为重要和必要,文章对覆盖粒度空间采用矩阵加以表示,将相容关系视作覆盖粒度空间的知识基,覆盖粒度空间的知识表示看作向量的表示形式,从而将其扩展到覆盖粒度空间的知识表示。

关于粗糙集、覆盖及覆盖粗糙集模型概念参见其他文献,这里不做赘述。

定义1[10] 设(U,C)为覆盖近似空间,对∀xU,称{x}C=∪{C′|xC′∧C′⊆C}为x的相容类。显然{x}C包含了与x具有不同关系的元素的集合。

定义2 设(U,C)为覆盖近似空间,定义相容关系如下:RC={(x,y)∈U×U|{x}C∩{y}C≠∅}。用SC(xi)={xjU|(xi,xj)∈RC}表示在覆盖C下所有与对象xj具有相容关系的对象的集合。由于对于∀xiU,xiSC(xi)≠∅且xiUSC(xi)=U,那么SC(xi)构成U的一个覆盖,即相容关系RC构成U的一个覆盖。

在覆盖近似空间(U,C)中,可用URC={SC(x1),SC(x2),,SC(x|U|)}表示U的一个分类。

定义3 设(U,C)为覆盖近似空间,那么U中元素xy在覆盖C中的相容度可定义为:

ρC(x,y)=|{x}C{y}C||{x}C||{x}C{y}C||{y}C|=|{x}C{y}C|2|{x}C||{y}C|

定义4 设(U,C)为覆盖近似空间,RC表示U上的相容关系,则RC的关系矩阵:

Μ(RC)=[r11r12...r1nr21r22...r2n............rn1rn2...rnn]

式中rij=ρ(xi,xj)∈[0,1]表示元素xixj相容度。

定义5 相容关系RC关于矩阵的一些运算为:

1) RC1=RC2⇔RC1(x,y)=RC2(x,y);

2) RC=RC1∪RC2⇔RC=max{RC1(x,y),RC2(x,y)};

3) RC=RC1∩RC2⇔RC=min{RC1(x,y),RC2(x,y)};

4) RC1⊆RC2⇔RC1(x,y)≤RC2(x,y)。

由上述相容关系RC可诱导出一个覆盖粒度族集,称为覆盖粒度空间。

定义6 设(U,C)为覆盖近似空间,由RC所诱导的集合族C(PC)=(NRC(x1),NRC(x2),…, NRC(xn))称之为覆盖粒度空间,其中NRC(xi)=x1(ri1)+x2(ri2) +…+xn(rin),NRC(xi)是由xi所诱导的覆盖信息粒,rij表示xixj相容的程度,”+”表示元素的并,覆盖信息粒NRC(xi)的基数为|NRC(xi)|=j=1nrij

显然,对于一个覆盖粒度空间C(PC)=(NPC(x1),NPC(x2),…, NPC(xn)),若rii=1与rij=0,ji,i,jn,则|NRC(xi)|=1,称PC为覆盖恒等关系,此时覆盖粒度最细,若rij=1,ji,i,jn,则|NRC(xi)|=|U|,称PC为覆盖全域关系,此时覆盖粒度最粗。

在覆盖粒度空间里rij揭示了元素xixj之间的相容程度,|NRC(xi)|揭示了元素xi与其他元素相容程度的总体度量,为刻画两个覆盖粒度空间的粗细关系和层次关系,可以通过偏序关系加以描述。

本文约定:C(U)表示U上所有的覆盖粒度空间的集合。

定义7 设C(PC)、C(QC)∈C(U),其中C(PC)

= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=

x1(pi1)+x2(pi2)+…+xn(pin),且C(QC)=(NQC(x1),

NQC(x2),…, NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)

+…+xn(qin)。定义二元关系⪯:C(PC)⪯C(QC) ⇔NPC(xi)⊆NQC(xi),inpijqij,i,jn,简记为PCQC。称C(PC)比C(QC)更精细。同样的思想可定义严格精细的偏序关系。

显然,(C(U),⪯)是一个偏序集。

2 覆盖粒度空间的基本运算

覆盖粒度空间的运算为粒度空间粒化机理的数据建模提供了知识依据,进一步构建了人类基于覆盖粒度空间的推理基础,其中包括精确粒空间算子拓展到覆盖粒度空间以进行覆盖粒度空间之间的合成、分解与转换。

定义8 设C(PC)、C(QC)∈C(U)是两个覆盖粒度空间,C(U)上的四个算子∩、∪、-和ζ定义为:

1) C(PC)∩C(QC)={NPCQC(xi)| NPCQC(xi)

=NPC(xi)∩NQC(xi)};

2) C(PC)∪C(QC)={NPCQC(xi)|NPCQC(xi)

=NPC(xi)∪NQC(xi)};

3) C(PC)-C(QC)={NPC-QC(xi)|NPC-QC(xi)

=NPC(xi)∩~NQC(xi)};

4) ζC(PC)={ζNPC(xi)|ζNPC(xi)=~NPC(xi)}。

上式中,xiU,in,~NPC(xi)= x1(1-pi1)+x2(1-pi2)+…+xn(1-pin)。

以上四个覆盖粒度空间算子可以看作是覆盖粒度空间的交、并、差和补运算,实质是覆盖粒度空间的细化、粗化、分解和计算覆盖粒度空间的补空间,是传统等价粒度空间的精确粒度空间所定义的四个算子的自然推广。

通过定义可知,∩和∪算子用于把两个覆盖粒度空间合成一个新的覆盖粒度空间,用∩可得到一个更细的粒度空间,用∪可得到一个更粗的粒度空间,-算子用于分解覆盖粒度空间为更细的粒度空间,算子ζ可得到一个覆盖粒度空间的补空间。

定理1 设∩和∪是C(U)上的两个粒度算子,则有:

1) 幂等律C(PC)∩C(PC)=C(PC),

C(PC)∪C(PC)=C(PC)。

2) 交换律 C(PC)∩C(QC)=C(QC)∩C(PC),

C(PC)∪C(QC)=C(QC)∪C(PC)。

3) 吸收律 C(PC)∩(C(PC)∪C(QC))=C(PC),

C(PC)∪(C(PC)∩C(QC))=C(PC)。

4) 结合律 (C(PC)∩C(QC))∩C(RC)

=C(PC)∩(C(QC)∩C(RC)),

(C(PC)∪C(QC))∪C(RC)

=C(PC)∪(C(QC)∪C(RC))。

证明:通过定义显然。

定理2 设∩、∪和ζC(U)上的三个粒度算子,则有:

1) ζ(C(PC)∩C(QC))=ζ(C(PC)∪ζC(QC))。

2) ζ(C(PC)∪C(QC))=ζ(C(PC)∩ζC(QC))。

证明:通过定义显然。

定理3 设∩、∪和ζC(U)上的三个粒度算子,则有:

1) 若C(PC)⪯C(QC),则ζC(QC)⪯ζC(PC)。

2) C(PC)∩C(QC)⪯C(PC),

C(PC)∩C(QC)⪯C(QC)。

3) C(PC)⪯C(PC)∩C(QC),

C(QC)⪯C(PC)∩C(QC)。

证明:通过定义显然。

3 覆盖粒度空间多层次的粒度结构

在一个覆盖粒度空间中描述其不确定性,偏序关系起着重要作用。

定义9 设C(PC)、C(QC)∈C(U),其中C(PC)= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin),且C(QC)=(NQC(x1),NQC(x2),…, NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。定义二元关系⪯1:C(PC)⪯1C(QC) ⇔|NPC(xi)|≤ |NQC(xi)|,i≤n,其中|NPC(xi)|=j=1npij|ΝQC(xi)|=j=1nqij,简记为PC⪯1QC

定理4 设C(U)是U上的覆盖粒度空间集合,则(C(U),⪯1)是一个偏序集。

证明:设C(PC)、C(QC)、C(RC)∈C(U),

C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),

C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),

C(RC)=(NRC(x1),NRC(x2),…,NRC(xn))那么有:

(1) 对∀xiU,有|NPC(xi)|=|NPC(xi)|,则PC⪯1PC,即⪯1满足自反性。

(2) 若PC⪯1QCQC⪯1PC,有PC⪯1QC⇔|NPC(xi)|≤|NQC(xi)|,in,QC⪯1PC⇔|NQC(xi)|≤|NPC(xi)|,in,因此有|NPC(xi)|≤|NQC(xi)|≤|NPC(xi)|,即:

|NPC(xi)|=|NQC(xi)|,故in时|NPC(xi)|=|NQC(xi)|成立,即⪯1满足反对称性。

(3) 若PC⪯1QCQC⪯1RC,有PC⪯1QC⇔|NPC(xi)|≤|NQC(xi)|,in,QC⪯1RC⇔|NQC(xi)|≤|NRC(xi)|,in,因此有|NPC(xi)|≤|NQC(xi)|≤|NRC(xi)|,即|NPC(xi)|≤|NRC(xi)|,故in时⪯1满足传递性,证毕。

为了进一步刻画覆盖粒度空间的层次结构,可定义新的偏序关系。

定义10 设C(PC)、C(QC)∈C(U),其中C(PC)= (NPC(x1),NPC(x2),…, NPC(xn)),NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin),C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。定义二元关系⪯2:C(PC)⪯2C(QC)⇔对于C(PC),存在C(QC)的一个序列C′(QC)使得|NPC(xi)|≤|NQC(xi)|,in,其中C′(QC)=(NQC(x′1),NQC(x′2),…,NQC(xn)),简记为PC⪯2QC

定理5 设C(U)是U上的覆盖粒度空间集合,则(C(U),⪯2)是一个偏序集。

证明:设C(PC)、C(QC)、C(RC)∈C(U),

C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),

C(QC)= (NQC(x1),NQC(x2),…,NQC(xn)),

C(RC)= (NRC(x1),NRC(x2),…,NRC(xn)),那么有:

(1) 对∀xiU,有|NPC(xi)|=|NPC(xi)|,则PC⪯2PC,即⪯2满足自反性。

(2) 若PC⪯2QCQC⪯2PC,有PC⪯2QC⇔对于C(PC),存在C(QC)的一个序列C′(QC),其中C′(QC)=(NQC(x′1),NQC(x′2),…, NQC(xn)),有|NPC(xi)|≤|NQC(xi)|,inQC⪯2PC⇔对于C(QC),存在C(PC)的一个序列C′(PC),其中C′(PC)=(NPC(x′1),NPC(x′2),…, NPC(xn)),有|NQC(xi)|≤|NPC(xi)|,in。因此i=1n|ΝΡC(xi)|i=1n|ΝQC(xi)|=i=1n|ΝQC(xi)|i=1n|ΝΡC(xi)|。另i=1n|ΝΡC(xi)|=i=1n|ΝΡC(xi)|ini=1n|ΝΡC(xi)|=i=1n|NQC(xi)|成立,即⪯2满足反对称性。

(3) 若PC⪯2QCQC⪯2PC,有PC⪯2QC⇔对于C(PC),存在C(QC)的一个序列C′(QC),其中C′(QC)=(NQC(x′1),NQC(x′2),…,NQC(xn)),有|NPC(xi)|≤|NQC(xi)|,inQC⪯2RC⇔对于C(QC),存在C(RC)的一个序列C′(RC),其中C′(RC)=(NRC(x′1),NRC(x′2),…,NRC(xn)),有|NQC(xi)|≤|NRC(xi)|,in

因此对于C′(QC),总存在C(RC)的一个序列C″(RC),满足|NQC(xi)|≤|NRC(xi)|,其中C″(RC)=(NRC(x″1),NRC(x″2),…,NRC(xn))。故对于C(PC)存在C(RC)的一个序列C″(RC)满足|NPC(xi)|≤|NRC(xi)|,in成立,即⪯2满足传递性。综上知(C(U),⪯2)是一个偏序集,证毕。

定理6 偏序关系⪯是偏序关系⪯1的一个特例。

证明:设C(PC)、C(QC)∈C(U)且PCQC,其中C(PC)=(NPC(x1),NPC(x2),…,NPC(xn)),C(QC)=(NQC(x1),NQC(x2),…,NQC(xn)),且NPC(xi)=x1(pi1)+x2(pi2)+…+xn(pin), NQC(xi)=x1(qi1)+x2(qi2)+…+xn(qin)。

PCQCNPC(xi)⊆NQC(xi),inpijqij,i,jn,故对∀in都有|NPC(xi)|≤|NQC(xi)|,其中|NPC(xi)|=j=1npij|ΝQC(xi)|=j=1nqij,证毕。

定理7 偏序关系⪯1是偏序关系⪯2的一个特例。

证明:设C(PC)、C(QC)∈C(U)且PC⪯1QC,其中C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),C(QC) =(NQC(x1),NQC(x2),…,NQC(xn)),由PC⪯1QC知|NPC(xi)|≤|NQC(xi)|,in成立。也即存在一个序列满足|NPC(xi)|≤|NQC(xi)|,in,证毕。

显然可得偏序关系⪯是偏序关系⪯2的一个特例。

4 覆盖粒度空间多层次的粒度结构

粗糙集模型的信息粒度表示了粒度空间信息粒大小的某种平均度量,可以用来刻画粒度空间的分类能力,同样在覆盖粒度空间中覆盖信息粒度也具有相同的含义,也能够用来刻画覆盖空间的分类能力。

定义11 设C(PC)∈C(U),C(PC) = (NPC(x1),NPC(x2),…,NPC(xn)),那么PC在覆盖粒度空间中的相容信息粒度为GΚ(ΡC)=1ni=1n|ΝΡC(xi)|n,其中|NPC(xi)|是相容信息粒NPC(xi)的基数。

定理8 设C(PC)、C(QC)∈,若C(PC)⪯C(QC),则GK(PC)≤GK(QC)。

证明:由C(PC)⪯C(QC)知NPC(xi)⊆NQC(xi),inpijqij,i,jn,故对∀in都有|NPC(xi)|≤|NQC(xi)|,其中|ΝΡC(xi)|=j=1npij|ΝQC(xi)|=j=1nqij,故而1ni=1n|ΝΡC(xi)|n1ni=1n|ΝQC(xi)|n即有GK(PC)≤GK(QC),证毕。

显然在其他偏序关系下有类似结论。

定理9 若C(PC)∈C(U),GK(PC)+ζGK(PC)=1。

证明:由定义10知:

GΚ(ΡC)+ζGΚ(ΡC)=1ni=1n|ΝΡC(xi)|n+1ni=1n|~ΝΡC(xi)|n=1n2i=1nj=1npij+1n2i=1nj=1n(1-pij)=1

证毕。

定义12 设C(PC)∈C(U),C(PC)= (NPC(x1),NPC(x2),…,NPC(xn)),那么PC在覆盖粒度空间中的粗糙度为:

Er(ΡC)=-i=1n1nlog21|ΝΡC(xi)|

定理10 设C(PC)、C(QC)∈C(U),若C(PC)⪯C(QC),则Er(PC)≤Er(QC)。

证明:由C(PC)⪯C(QC)知NPC(xi)⊆NQC(xi),inpijqij,i,jn,故对∀in都有|NPC(xi)|≤|NQC(xi)|,其中|ΝΡC(xi)|=j=1npij|ΝQC(xi)|=j=1nqij,再由定义11可知:

Er(ΡC)=-i=1n1nlog21|ΝΡC(xi)|=1ni=1nlog2|ΝΡC(xi)|=1ni=1nlog2j=1npij1ni=1nlog2j=1nqij=1ni=1nlog2|ΝQC(xi)|=Er(QC)

证毕。

定理11 设UR={X1,X2,,Xm}是一个等价粒度空间,则R的相容信息粒度退化为粗糙熵Er(R)=-i=1m|Xk|nlog21|Xk|

证明:对于等价关系R,若R(x,y)=1且R(y,z)=1则R(x,z)=1,即rij=1或0,ijn。令Xk={xk1,xk2,…,xksk},km,其中|Xk|=|[xkl]|=skk=1msk=n,因此:

-i=1m|Xk|nlog21|Xk|=-i=1m(1nlog21|ΝR(xk1)|+1nlog21|ΝR(xk2)|++1nlog21|ΝR(xksk)|)=i=1m(1nlog2|ΝR(xk1)|+1nlog2|ΝR(xk2)|++1nlog2|ΝR(xksk)|)=1nlog2|ΝR(x1)|+1nlog2|ΝR(x2)|++1nlog2|ΝR(xn)|=-(1nlog21|ΝR(x1)|+1nlog21|ΝR(x2)|++1nlog21|ΝR(xn)|)=-i=1n1nlog21|ΝR(xi)|=Er(R)

证毕。

上述结论表明等价知识库中的粗糙熵是覆盖粒度空间中相容信息粒度的一个特例。上述偏序关系⪯、⪯1、⪯2不仅刻画了覆盖粒度空间的多层次粒度结构,而且对于揭示相容信息粒度的本质具有更加深刻的描述。

5 结 语

粒计算是一种粒化的思维方式及方法论,是一种独特的基于多层次与多视角的问题求解方法。它借助粒、层、序等概念,为人类解决复杂问题提供了一个通用模型,通过粒可以将问题进行粒化,从而获得多层次的描述与理解。覆盖粗糙集理论作为经典粗糙集理论的扩展近年来得到了研究者们广泛关注,然而对于覆盖粗糙集理论的研究多集中在其构造方法、公理性质和结构度量的研究,将其规范的纳入粒计算范畴、描述其在覆盖粒度空间中统一的知识表示、基本运算,进一步刻画其在覆盖粒度空间中的层次关系,揭示覆盖粒度空间的多层次粒度结构的本质工作更有意义。

摘要:针对覆盖粒度空间中的知识表示、基本运算、层次结构及粒度结构度量问题进行分析与研究。首先,定义覆盖近似空间中对象的相容类,构造覆盖粗糙集模型的相容关系,定义相容类中对象之间的相容度,由此相容关系诱导出覆盖粒度空间的概念。其次,给出覆盖粒度空间下对象的矩阵表示,定义覆盖粒度空间中基本运算,并诱导出覆盖信息粒的概念,从而对覆盖粒度空间中粒度的大小进行了度量。接着,定义覆盖粒度空间的三种偏序关系,以此揭示覆盖粒度空间的层次关系。最后,定义覆盖粒度空间的信息粒度、粗糙度和粗糙熵,研究在覆盖粒度空间中多层次粒度结构度量的各种关系。研究结果统一了覆盖粒度空间下信息粒度的相关度量,从而为粒计算的多层次粒结构理论进一步的完善提供依据。

关键词:粒度计算,覆盖粗糙集,偏序关系,粗糙熵,覆盖粒度空间

参考文献

[1]苗夺谦,李德毅,姚一豫.不确定性与粒计算[M].北京:科学出版社,2011:132-135.

[2]Bargiels A,Pedrycz W.Granular Computing:An Introduction[M].Boston:Kluwer Academic Publishers,2002:125-130.

[3]Pawlak Z.Rough Sets[J].International Journal of Information and Computer Sciences,1982(11):341-356.

[4]Zadeh L A.Towards a theory of fuzzy information granulation and its centrlity in human reasoning and fuzzy logic[J].Fuzzy Sets and Sys-tems,1997,19:111-127.

[5]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246.

[6]王国胤,张清华.不同知识粒度下粗糙集的不确定性研究[J].计算机学报,2008,31(9):1588-1598.

[7]Zakowski W.Approximation in the space(U,Ⅱ)[J].Demonstratio Mathematica,1983,16(3):761-769.

[8]Bonikowski Z,Bryniarski E,Wybraniec U.Extensions and intentions in the rough set theory[J].Information Sciences,1998,107:149-167.

[9]Yao Y Y.On generalizing rough set theory[C]//The9th International Conference on Rough Sets,Fuzzy Sets,Data Mining,and Granular Computing,Chongqing,2003:44-51.

寒岭铁矿粒度特征 篇8

这类型铁矿一般来说规模较大, 产状简单。在辽宁省条带状铁矿主要分布在辽南台背斜的中部及背斜的西北部, 这一代均有规模不同的矿体出露。关于条带状铁矿过去都统称为鞍山式铁矿, 但是在鞍山式标准产地鞍山一带, 这种铁矿在矿物组分、矿石类型、伴生围岩、矿层厚度及矿层数目上都不相同, 这些差别可以认为是当时沉积物质成分与沉积环境的不同所致。

工作区位于辽宁省辽阳县东40km处, 行政区划属于辽阳县寒岭镇。工作区距本溪至辽阳市级公路距离约4km, 南距本溪至辽阳铁路的寒岭车站约10km。

1 矿体特征

矿区范围之内根据以往地质勘查成果和近期工作的情况, 铁矿体Fe1规模和特征:Fe1铁矿体呈层状产出, 分布于整个矿区。地表出露于矿区北部山体上, 向南埋藏于沟谷下。矿层总厚0-55米, 一般宽30-45米。单矿层厚度一般10-20米。倾角10-55°。矿石类型有赤铁矿, 磁铁矿。矿体TFe1-HP平均品位36.00%, 矿体TFe1-MP平均品位29.08%。Fe1矿层产状为较缓的向斜构造。矿层的底板为角闪质片岩类, 顶板为石英片岩类, 夹有矿石呈钢灰色, 风化后黄褐色。赤铁矿稍显红色。矿石呈不等粒变晶结构、花岗变晶结构、鳞片变晶结构。按颗粒大小可分为粗粒、细粒、极细粒三种, 铁矿物粒度一般在0.295-0.056毫米, 石英粒度也多在这之间。矿石构造有块状、条带状和条纹状三种。

组成铁矿石的矿物成分以石英、磁铁矿为主, 其次赤铁矿, 其他尚有角闪岩、阳起石、透闪石、云母、绿泥石、黄铁矿、黄铜矿、金红石等。矿石中Si O2含量平均47.42%、P平均0.046%、S平均0.063%、Mn平均0.047%。

2 构造

矿区内的褶曲为一向南缓倾斜的向斜构造。断裂构造较发育, 分布在靠近矿区的北部, 向斜构造的北翼。

3 工作方法

本次工作共测试了15件样品, 均匀地分布在铁矿层内, 具有相当的代表性。

本次粒度测试根据原鞍钢矿山公司提供分级标准分14级, 粒度测试方法采用垂直铁矿条带 (纹) 方向顺尺线测法, 在物镜 (10×) 、目镜 (12.5×) , 放大125倍条件下, 以随遇粒度截距为粒径, 分别记录在不同粒级中, 算出个粒级体积含量和累计体积含量。

4 实验结果

本次共测试15件铁矿石标本, 测铁矿5229粒, 石英3537粒。从图中可以看出, 寒岭铁矿属于细粒不均匀型矿石, 铁矿物粒度主要分布在21~147μm之间, 铁矿物平均粒度43.85μm, 脉石粒度主要分布在21~104μm之间, 脉石平均粒度为40.04μm, 铁矿物和脉石矿物粒度分布较不均匀, 符合对数正态分布, 铁矿物正累积曲线大于50%的级别在56μm以上, 略偏于细端, 且大于74μm的粒级含量为36.54%;而小于21μm的粒级含量为8.16%。

脉石矿物 (石英) 正累积含量达50%所对应的粒级为43~56μm, 比铁矿小一个粒级, 且大于74μm为17.39%, 而小于21μm只有7.08%, 脉石粒度同样较细。

5 结论

寒岭铁矿属于细粒不均匀型矿石, 铁矿物粒度主要分布在21~147μm之间, 铁矿物平均粒度43.85μm, 脉石粒度主要分布在21~104μm之间, 脉石平均粒度为40.04μm, 铁矿物和脉石矿物粒度分布较不均匀, 符合对数正态分布。脉石矿物 (石英) 正累积含量达50%所对应的粒级为43~56μm, 脉石粒度同样较细。

参考文献

[1]沈保丰, 杨春亮, 翟安民等.中国前寒武纪矿床时空分布[J].矿床地质, 2004, 23 (增刊) .

[2]宋瑞祥.中国矿产资源报告:1996[M].北京:地质出版社, 1997, 1308.

[3]姚培慧.中国铁矿志[M].北京:冶金工业出版社, 1993, 1662.

[4]沈其韩.华北地台早前寒武纪条带状铁英岩地质特征和形成的地质背景[A].程裕淇.华北地台早前寒武纪地质研究论文集[C].北京:地质出版社, 1998, 130.

[5]沈保丰, 宋亮生, 李华芝.山西省岚县袁家村铁建造的沉积相和形成条件分析[J].长春地质学院学报, 1982, (增刊) .

[6]黄崇轲, 白冶, 朱裕生, 等.中国铜矿床[M].北京:地质出版社.

磷尾矿粒度分布的研究 篇9

关键词:磷尾矿,粒度,碳酸钙,碳酸镁

贵州是我国磷矿主要分布区之一, 但是贵州磷矿品位不高, 特别是随着开采力度的加大, 磷矿趋于贫化[1]。为了满足后续磷矿加工的要求, 一般采取浮选的方法富集磷矿。富集磷矿获得磷精矿的同时也产生大量的尾矿。由于利用价值低, 磷尾矿作为一种工业废弃物被长期堆积, 对环境造成危害。而尾矿中含有较高的碳酸钙、碳酸镁和氟磷酸钙等物质, 应对其加以利用。所以对尾矿基本物性的探究对实现尾矿的综合利用有着重要的意义。

1 仪器和试剂

全自动干法激光粒度仪 ( winner3003) , 电子天平, 箱式电阻炉 ( BLMT - 1800A) , 温度数显磁力搅拌器 ( S10 - 3) 。

0. 02 mol / L EDTA溶液, 1 ∶ 3 三乙醇胺溶液1∶ 1氨水, p H = 10 的氨- 氯化铵缓冲溶液, 20% 氢氧化钠溶液, k - b指示剂, 氯化铵。以上试剂均为分析纯。

样品来自贵州瓮安福泉矿区的磷尾矿, 在110℃ 风干, 研细后装入样品袋备用。采用EDTA滴定法测定磷尾矿中钙镁等的含量[2], 结果见表1。

%

2 尾矿的粒度测定

2. 1 以水为介质测量

将未煅烧磷尾矿及不同温度下煅烧的磷尾矿在激光粒度仪中进行粒度分析。实验结果见表2及图1。

由图1 看出: ①未煅烧的尾矿表现为两个峰, 第一个约在2 μm处, 第二个在50 μm处, 而在600℃ 下煅烧的尾矿, 由于磷尾矿基本不分解, 所以粒度分布图同未煅烧的基本不变。②在700℃下煅烧的失重为9% , 在20 ~ 40μm这个地方出现一个缺口, 表明在700℃ 时此粒度下的尾矿有分解, 在2 ~ 20 μm的粒度分布有所上升, 可能是由于分解后的氧化镁水解而导致。③在750℃ 和800℃ 下煅烧的尾矿粒度分布基本一致, 在4 μm前800℃ 的频率比750℃ 略高, 在4 μm后的比750℃ 略低, 这是由于800℃ 煅烧是的分解比750℃ 的更彻底, 在测定其粒度是由于碳酸盐成分的水解后氢氧化钙解离在水中, 氢氧化镁以沉淀形式存在且表现出粒度在4 μm左右。

%

2. 2 以乙醇为介质

尾矿700℃ 煅烧后由于尾矿中碳酸盐部分已完全分解, 得到的氧化钙和氧化镁会在水中水解变成氢氧化镁沉淀, 影响沉淀结果。为消除水解干扰, 用乙醇为介质进行对照, 结果见表3 及图2 。

%

由图2 看出: ①通过观察, 未煅烧尾矿在水介质和乙醇介质中的粒度分布基本走势相同。在乙醇中的后一个峰比在水中向前移动了约10 个μm, 这是由于在不同的介质中尾矿的润湿程度不同所引起。②由磷精矿与800℃ 下煅烧的尾矿粒度相对比看出, 两条粒度频率分布基本相同。但在小于3 μm的部分800℃ 下煅烧的频率比磷精矿的频率高, 这是由于氧化镁水解后生成的氢氧化镁分布在这里所引起的。③由未煅烧的尾矿和磷精矿粒度频率比较, 磷精矿可看成一个峰, 且峰所在的位置跟尾矿第一个峰的位置一致, 都是在约3 μm处, 但是频率比尾矿大了很多, 在尾矿的第二个峰的位置磷精矿的频率大幅减少。这是由于尾矿中的碳酸盐被烧去二氧化碳后加入铵盐将钙镁变成离子后在尾矿中少部分不被反应的磷精矿所引起的。

3 结论

1) 尾矿中磷精矿和碳酸盐的分布都为0. 6 ~ 120μm, 尾矿煅烧后磷精矿的粒度分布为0. 6 ~73 μm。

2) 尾矿中磷精矿与碳酸盐是结合或附着在一起的, 当碳酸盐被煅烧放出二氧化碳, 整个骨架崩解, 导致磷精矿显现出其真实粒度所以出现了一个磷精矿的单峰。也就是说, 磷精矿和碳酸盐在所有粒度都有分布, 不能用简单的筛分将磷精矿与碳酸盐分离。

参考文献

[1]孔繁振.磷矿浮选尾矿煅烧铵盐法综合回收镁、磷试验研究[D].贵阳:贵州大学, 2008.

上一篇:相亲交友类节目下一篇:中孕引产