模糊数据库

2024-08-11

模糊数据库（精选9篇）

模糊数据库篇1

传统的关系型数据库只能对精确数据进行表示和处理, 对于自然语言中的模糊概念通过其条件组合和扩展是无法实现查询的。而模糊关系数据库查询就能够实现这一点。这种方法同样是建立精确的数据库, 只是将传统的关系型数据库语言本身进行模糊化扩展, 在模糊范围内进行精确查询。这种方法操作简单, 查询结果明显。

1. 模糊基础理论

1.1 模糊集合

模糊集合通过隶属度描述了对象类属和性态的不确定性, 并且通过相关的隶属函数, 确定隶属规律, 从而为数学找到了一种精确刻画处理模糊的方法。

定义1:隶属函数

设一个对象组成的论域为U, 则在论域U上的一个模糊集定义为一个隶属:

上述式子把U中的元素映射到[0, 1]中的实数。记为, 其中论域U中元素x隶属于模糊集的程度称为, 简称x对的隶属度。设F (U) 为论域U上的所有模糊集的全体, C (U) 为论域U上的所有特征函数的全体, 则, 为隶属函数的简称。

当论域U是离散的有限点集{x1, x2, …xn}时, 把

直接记为

例如, 设论域U=[0, 100], “年老”用模糊集来表示, “年轻”用模糊集来表示。已知

相应的曲线如图1所示:

由图可知, , 也就是说, “70岁”属于“年老”的程度为0.94。又, , 因此可认为“60岁”是“较老的”。

定义2:凸模糊集

设F (Rn) 中的一个模糊集用来表示, 若对任意的, 截集

都是凸集, 则称是一个凸模糊集。

凸模糊集与非凸模糊集如图2所示。

如果一个凸模糊集的隶属函数在论域中只有一个极大值且达1, 则称其为一个模糊数。

1.2 模糊集上的一般运算

在数据库中, 所有的数据都是分类存在的, 类型多种多样, 既可以系统定义的内在类型, 又可以定义的其他抽象数据类型。抽象数据类型的定义必须从以下两个方面进行注意: (1) 一个数据集合就是指属于该数据类型的数据的数据结构, 从而使得该数据类型的数据构成范围被划定出来; (2) 可在该数据类型上实施各种运算的定义。

设CA (x) 和CB (x) 分别表示集合A和B的特征函数, 其中x∈U, 则他们交集、并集和补集分别为:

那么。F (U) 的运算定义如下所示:

定义3:设分别为模糊集的隶属函数, 运算定义如下:

当模糊集合变为普通集合时, 那么这些运算就与普通集合的运算是一样的。

1.3 模糊语言和模糊算子

人们通常进行交流时使用自然语言来进行, 而这些自然语言充满了模糊性。对模糊值的程度进行区分和刻画, 从而使自然语言的模糊性进行量化, 模糊值的描述常常用自然语言的一些修饰词来进行, 例如, “可能”、“大概”、“较”、“近似”、“趋近”、“稍微”等。这些词与一些单词同时用, 使得这些单词原来的意思被调整和修饰, 因此可以把这些词看做是一个算子。

2. 模糊查询实现方法

在关系数据库中, 标准的查询语言是SQL, 其对于多层复杂的信息查询都能够完成。但是SQL只能表示和处理精确数据, 也就是说, 必须是明确的数据才可作为WHERE的查询条件, 对于自然语言的模糊概念根本没有办法表达。因此, 在含有模糊算子的查询语句中, 对模糊概念的描述采用模糊逻辑理论中的模糊单词、模糊隶属函数和模糊算子来进行, 对查询关键词和所查询的属性值的接近程度进行描述采用贴近度的概念来进行, 并且通过数学算式将模糊化的概念转换为响应的SQL语句进行查询。

2.1 数值属性的模糊查询

在某个公司员工进行查询, 查询“一个高个子年轻女子”, 来对相关的查询条件的转换进行说明。“高个”、“年轻”的隶属函数为:

模糊查询的一般过程为:当用户把查询条件输入进去之后, 只要能够把其中关键模糊词的隶属函数找到, 对于整个数据库中的所有记录都与它进行匹配, 进而隶属度被计算出来, 与给定的阈值的记录相比, 隶属度只要是不小于, 那么就说明这个结果是能够满足用户的查询条件。模糊语言的精确查询主要是通过利用正向法和反向法将带有模糊语言转换为标准的SQL来进行, 从而最终完成相应的查询。

(1) 正向法

从字面上可以看出, 正向法就是从条件到结尾, 也就是说, 按查询条件, 将即将要查询的字段值代入相应模糊谓词的隶属函数中, 然后把相应的隶属度计算出来, 从而得到相应的隶属度表。接着对总隶属度阈值进行设定, 再查询隶属度表。

如果在查询条件中模糊词存在n个, 则假定预设总隶属度阈值为α, 根据实际的数据, 对每一个查询对象计算每一个模糊词的隶属度, 则表示如下:

其总隶属度计算方法是:

AND语义:M=min (y1, y2, …, yn) =min (α1, α2, …, αn)

OR语义:M=max (y1, y2, …, yn) =max (α1, α2, …, αn)

若M≥α, 则对于查询条件当前记录能力满足, 那么就加入结果集中。

针对查询来说, 设定阈值α=0.5, 则对应操作为:

SELECT*FROM Person WHERE总隶属度≥0.5 and性别=“女”

由此可见, 正向模糊查询方法较为简单, 并且对于隶属度能够直接得到。但在实际操作中, 有些数据库是非常庞大的, 数据较多, 如果对数据库表中的每个记录都进行隶属度计算, 也就是说要对数据库中的所有数据记录都要扫描一遍, 这样明显使得运算量较大, 也要花费很多时间, 查询速度明显受到影响, 并且需要把记录的隶属度信息存储在一个临时表中。

(2) 反向法

所谓反向法其与正向法正好相反, 已知一个隶属度阈值, 对该隶属度阈值的字段的取值范围进行计算, 然后将原来字段应该满足的“模糊”条件, 用该取值范围来取代, “模糊”查询利用精确查询的方式来实现。

基于前面的查询, 设定阈值α=0.5, 则对应操作为:

SELECT*FROM Person WHERE高≥170 and年龄≤30 and性别=“女”

用反向法实现相对来说是很复杂的, 由于它是已知阈值反向计算隶属函数, 但是它比正向法好的优势就是在于它不必对每个字段都进行扫描, 不需要计算每一个的隶属度, 并且不需要新的隶属表的形成, 它能够直接转换成标准的SQL形式。因此, 一般采用反向法在计算机开发模糊查询系统中实现模糊查询。

以上两种查询方法, 虽然他们的操作过程差距较大, 但是其具有共同的结果和目标。正向法操作较简单;反向法无需增加隶属度字段, 可以直接进行, 但是实现起来较复杂。

2.2 字符属性的模糊查询

关系数据库可以实现对字符属性的模糊查询, 主要利用SQL的LINKE函数和字符串匹配运算符来进行。也就是说, 它能够支持通配符%和_, 通过通配符就可以对这些字符串进行模糊查询, 但是在实际查询中, 很有可能不知道字符串的值, 这样就给查询带来了一定的困难。另外, 在现实生活中, 我们很习惯用缩称, 不管是地名还是单位名称, 例如, “西北工业大学”简称“西工大”, “西安工业大学”也简称“西工大”等等, 因此, 比较那些设置不同长度的字符串, 是不能对这些缩成进行模糊查询的。

定义4设字符串为A、B, A中有n个字符, A贴近于B的贴近度用d (A, B) 来表示, 按照从左到右的顺序, 集合A中的每个元素在集合B中出现的有效次数和记为m, 则d (A, B) =m/n。

定义5, 它满足贴近度的定义。A与B的贴近度用表示, 即A与B的贴近度为A贴近于B的贴近度与B贴近于A的贴近度中的最大者。

通过上述两个定义, 可以把两个字符串的贴近度计算出来, 因此可以模糊查询字符串的缩称。模糊查询的一个特例就是精确查询, 当d (<字符串1>, <字符串2>) =1.0, 则说明<字符串1>中的字符依次的出现在<字符串2>中, 即<字符串1>是<字符串2>的一个缩称。

d (S1, S2) 的计算方法为: (1) 将S1分解为单个有效字符, 这是查找字符串的第一步。在分解前, 要确定第一个字符是单字节还是双字节字符, 如果是单字节字符, 就按2个字节截取, 如果是双子节字符就用2个字节截取。字符串S1被分解为u1, u2, …, un。 (2) 对字符串S2中是否包含第一个字符u1进行判断, 如果在字符串S2中包含字符u1, 则包含的字符数加1, 并从字符串S2中最左边把包含u1的部分去掉, 对S2剩余部分进行第二个字符u2的相同处理, 直到把所有的中判断完毕为止。 (3) 对单向贴近度d (S1, S2) 进行计算。在实际应用中, 可以编写一个子程序来对两个字符串的贴近度进行计算, 主要根据上述计算防范来进行, 用户可以给定一个阈值, 从而查询结果能够满足用户的需求。

3. 总结

模糊理论应用于数据库的查询, 在实际中的应用拓宽了信息查询的应用范围, 从而得到更完善的查询信息, 是关系数据库的查询功能进一步得以提高。在实际应用中, 模糊关系数据库查询虽然目前还存在一些不足之处, 但是其前景非常广阔。

摘要：模糊关系数据库查询在传统的关系型数据库语言本身在模糊范围内进行精确化查找, 其要优于传统的关系数据库查询。本文主要对“模糊基础理论”、“模糊查询实现方法”进行了分析。

关键词：模糊,关系数据库,查询

参考文献

[1]胡皓, 罗景青.基于模糊理论的查询技术研究[A].2006北京地区高校研究生学术交流会——通信与信息技术会议论文集 (下) [C], 2006.

[2]蔡银珊.基于关系型数据库的数字属性关键词的模糊查询[J].赤峰学院学报 (自然科学版) , 2009, (12) .

[3]张业明, 魏修亭, 刘勇.关系数据库的SQL模糊扩展及模糊数据存储[J].山东理工大学学报 (自然科学版) , 2006, (05) .

模糊数据库篇2

提出一种处理测量数据的模糊方法,将测量结果用模糊数进行表示,提出用梯形模糊数表示测量结果及其不确定度,并对其进行仿真,得到较好的效果.

作者：李筠沙定国作者单位：李筠(上海理工大学光电学院,上海,93)

沙定国(北京理工大学光电工程系,北京,100083)

数据库模糊查询技术应用篇3

1 模糊集合理论

1.1 模糊集合

所谓在论域U上的一个模糊子集A是指:∀u∈U,都有μA(u)∈[0,1]与之相对应,并且称为u属于模糊子集A的隶属度。即由映射:

确定论域U的一个模糊子集A。

μA(u)=1,表示u完全属于A;μA(u)=0,表示u完全不属于A;0<μA(u)<1,表示u隶属于A的程度。

设A为论域U上的模糊集合,∀α∈[0,1],Aα={u∈U|fA(u)≥α}⊆U,称模糊集合A的α截集,称α为置信度,即对于普通集合Aα有∀u∈U当A(u)≥α时,说明在α水平下u属于模糊集合A,记为u∈Aα,反之u∉Aα。

1.2 隶属函数

隶属函数是对模糊概念的定量描述,正确地确定隶属函数,是运用模糊集合理论解决实际问题的基础。隶属函数的确定过程允许存在一定的主观意识,可以根据实际统计数据特征从几种典型模糊分布曲线中选择最为贴近的一种作为隶属函数,经过实践效果的检验进行了调整,即通过“学习”进行修改和完善,以得到更为确实的隶属函数形式。典型的模糊分布有阶梯型、指数型、正态型、线型、幂函数型、正弦型等。

1.3 语言变量

1971年Zadeh提出模糊语义定量理论并定义了“语言变量”的概念,其算子的一般数学描述为:

L=(U,T,E,N)

其中:U是论域,即语言主体的全体;T是语言值的模糊集合;E是构成语言的所有字母和符号序列的集合;N是E对U的模糊关系。对于T中值x的语义是U上的模糊子集M(x),则U中的元素y对M(x)的隶属度可表示为:μM(x)(y)=μN(x,y)。例如:设论域U=[1,100]是学生成绩集合,T为成绩的模糊集合,E={优秀,良好,中等,一般,较差}。

1.4 语气算子

在模糊理论中将自然语言中的如“比较”、“非常”、“稍微”等词看作是一种算子,称为语气算子Hλ,从程度上来限制模糊语义,在不同等级上改变模糊语义的隶属度,如模糊语义“高”可表示为“非常高”、“比较高”,“有点高”等。语气算子是一个变换,即:HλA(x)=A(x)λ,当λ>1时称Hλ为集中化算子,λ<1时称Hλ为散漫化算子,一般将H4代表“极”,H2代表“很”,H1.25表示“相当”,H0.75代表“比较”,H0.5代表“有点”,H0.25代表“稍微有点”。

1.5 模糊化算子

自然语言中常将“大约”、“近乎”、“差不多”等具有模糊意义的词放在一个精确词或语言变量之前,表示一个模糊的范围,如“某学生计算机成绩大约80分左右”,称为F化算子。可实现对精确语义的模糊化和模糊语义的模糊化。其中对于模糊语义的模糊化算子的一般形式可表示为:

对∀x∈U,

其中A是模糊集合,μA(y)是y对A的隶属度,E是U上的相似模糊关系,相似函数μE(x,y)表示为:

式中δ>0为参数。

2 模糊SQL

SQL(Structured Query Language)作为现在大多数系统都支持的语言,已经成为标准的数据库语言。而关系数据库也是使用最为广泛数据库形式,那么针对关系数据库使用SQL并对其进行模糊扩展也就具有重要意义。对数据库查询进行模糊扩展,模糊SQL一般形式可以表示为:

其中T是一个精确或模糊关系;Ci表示T上的属性;fc是一个模糊条件,可以包含模糊关系运算符(如“约等于≈”、“远远大于>>”等)、模糊谓词(is)及连接词(AND、OR);α∈[0,1]称为阈值,由于查询条件是模糊的,因此查询结果也是一个模糊集合,集合中每个结果对于查询条件fc的满足程度即匹配度不同,设置阈值α的作用是使查询结果中匹配度大于α的记录作为结果输出。

2.1 简单模糊查询

例1:存在一个学生关系(student)如表1。

在表1中查找“计算机成绩较好的学生”,模糊SQL可表示为:

SELECT姓名,计算机

FROM student

WHERE计算机is good

WITH 0.5

对于关系上的元组,计算属性“计算机”关于“”的匹配度,隶属函数可表示为:

计算关系student中每个元组的“计算机”属性值关于模糊条件对应隶属函数的匹配度见表2。

最后根据阈值α得到结果集合中匹配度大于等于0.5的有第2、3、7、8四个元组。

2.2 复合条件模糊查询

查询条件中可以使用AND、OR等连接词交多个查询条件组合形成复合查询条件,如在学生关系中“查找英语成绩较差但总分较高的学生”,模糊SQL表示为:

SELECT姓名,英语,总分

FROM student

WHERE英语is fail and总分is good

复合查询条件中涉及关系中的多个属性,这时就需要分别计算每个元组的相应属性值针对模糊条件的匹配度,进而计算综合匹配度,当连接词分别为AND和OR时综合匹配度的计算方法为:

其中mi表示元组R的第i个属性值对于模糊项隶属函数的匹配度。

2.3 模糊查询转换为精确查询

上述简单模糊查询和复合模糊查询在对关系数据库进行操作时需要对表中所有记录进行计算,表中记录多时会影响查询效率,为减少计算量可以在查询前将模糊条件转换为精确条件,将大大提高查询效率。将模糊条件转换为精确条件可以使用隶属函数及α截集求得模糊条件中属性值的区间,那么精确查询条件也就得到。如例1“计算机成绩较好的学生”中的“较好”可根据隶属函数和α求得其对应值区间为,则模糊查询可转化为:

SELECT姓名,计算机

FROM student

WHERE计算机BETWEEN 75 AND 95

在关系student中查询结果为2、3、7、8四个元组,同例1结果相同,接下来对四个元组计算匹配度,得到最终结果,结果仍与例1相同,但效率却比例1要高。

3 结束语

在数据库模糊查询中,将自然语言中模糊概念与数据库中的精确概念建立了联系,从而使查询语言得到了扩展,本文针对这一理论介绍了简单模糊查询及复合模糊查询的处理方法并做了验证,同时介绍了模糊查询转换为精确查询的方法。以上查询方法还可以扩展到多表查询、子查询等,而关系中的属性值的隶属函数和模糊中的阈值也可根据实际需要进行调整。

摘要：该文介绍了模糊集合理论相关知识及其在关系数据库查询中的应用,针对SQL语言的SELECT语句进行了模糊扩展。分析了简单模糊查询、复合模糊查询、将模糊查询转换为精确查询的方法并通过实例进行了验证。

关键词：关系数据库,模糊查询,隶属函数,阈值,匹配度

参考文献

[1]陈逸菲.基于模糊理论的关系数据库查询技术研究[D].南京:南京信息工程大学,2005.

[2]杨纶标,高英仪.模糊数学原理及应用[M].广州:华南理工大学出版社,2004.

[3]申玉静,周爱华.基于模糊数据库的数据查询设计[J].北京:计算机教育,2007(12):126-128.

模糊数据库篇4

基于模糊神经网络的数据通信子系统全局故障诊断

基于模糊神经网络理论,提出一种基于模型构建的.数据通信子系统(DCS)全局故障诊断方法.全局故障诊断模型的输入空间由故障征兆集组成,诊断过程由全局故障诊断规则实现,输出空间由故障类别集组成.基于对DCS系统结构的分析,选取了一些关键设备信息作为故障征兆信息.将故障征兆信息中的物理向量分析转化为算术数值判断,创建决策矩阵,构建全局故障诊断规则,实现了故障类别综合判定,从而完成全局故障诊断模型构建.以工程实例中的DCS典型故障类别为验证对象,对全局故障诊断模型进行了试验验证.该方法丰富了DCS故障诊断方法,总体精度可达到91.29%.

作者：高军武 Gao Junwu 作者单位：永济新时速电机电气有限责任公司,永济,044502刊名：现代城市轨道交通英文刊名：MODERN URBAN TRANSIT年，卷(期)：“”(3)分类号：U2关键词：轨道交通数据通信 DCS 故障诊断模糊神经网络

模糊数据库篇5

关键词：SQL,存储过程,模糊查询

一、引言

随着信息时代的到来和Internet技术的发展, 数据库查询已成为人们日常生活中不可缺少的部分。尤其是对于企业来说, 数据库的精确查询显然不能满足它的各种查询要求, 这会导致企业效率的不足。而现有查询技术主要是以传统数据库系统为基础, 仅对精确数据进行访问和处理。然而在客观世界中, 模糊概念和现象大量存在, 也就有大量非理想化或模糊的查询操作。为了克服传统查询的局限性, 需要提出一种更具“智能化”、能对模糊查询要求快速定位的新技术。本文只是从众多模糊查询中提出一种——利用存储过程实现模糊查询。

二、相关概念

1. 模糊的概念

目前主流的数据库是关系型数据库, 它是以布尔逻辑为基础的, 所以对于一个查询条件, 数据库中的一条记录要么满足要么不满足。

但是人类语言的一个很大特点就是具有模糊性、不确定性、不精确性, 比如在数据库中查找“一个年轻的高个男子”, 在这个条件中“年轻”和“高个”是模糊的概念;另外在许多情况下, 用户对查询并不要求给出一个精确匹配的结果, 只要求结果在一定程度上满足条件即可。这些特点应该在数据库的表达、设计以及查询功能上得到一定的体现。

模糊数据表达所要解决的问题是在传统的关系模型的哪些方面引入模糊性, 从而使得现实世界中的某些不确定或不精确信息在数据库中得到反映。在传统的关系数据库中, 有三个基本的亦是隐含着的假设:

(1) 在任一关系 (表) 中的每一元组 (行) 中的每一个属性 (字段) 的值是其值域中的单个元素。例如, 若年龄的取值域是[0, 200], 则张三的年龄必须是[0, 200]中的一个元素, 如21。

(2) 在任一关系 (表) 中的每一个元组 (行) 都完全隶属于该关系 (表) , 即每一出现在表中的行都与表所表达的概念完全相符。

(3) 属性 (字段) 的取值域中的任意两个元素都被认为相互间完全不同。比如年龄值域[0, 200]中的21和22就被认为是完全不同的两个值。针对上述三种假设的不同程度上的模糊扩展, 则形成不同的模糊数据表达模式。

模糊查询是指通过使用模糊集合或具有模糊特征的语言词对数据库进行查询。也就是说, 查询标准或查询条件可包含模糊集合或语言词, 而数据库本身则可以是传统 (非模糊) 数据库, 也可是模糊数据库。目前国际上做的较多的工作主要集中在对传统数据库的模糊查询上。

模糊关系数据库的设计和传统关系数据库一样, 旨在获得合理的数据库模式 (Schema) , 进而避免可能出现的数据冗余和修改异常。

2.2SQL数据库的模糊查询

SQL Server数据库可以用SUBSTRING函数来实现模糊查询, SUBSTRING函数返回一个字符串的子串 (从n1开始, 共n2个字符) 。其格式为:SUBSTRING (string fromn1 to n2)

如:

SELECT SUBSTRING (CUSTNAME FROM1 FOR 10) FROM CUS-TOMER

其意为返回CUSTNAME的头10个字符。但SUBSTRING函数只能实现一定字段的模糊查询, 而且本身区分大小写, 需在程序中增加代码以提高其模糊度, 程序代码较长, 比较烦琐, 用SQL的Select查询命令则可以很容易地实现数据库的查询。

在Select命令的Where子句中使用“LIKE”关键词和“%”通配符就可以做到模糊查询。下面语句在my_database数据库的Product表中查找ProductName字段的值含有“Sa”字符串的所有记录。

Use my_database

Select*From Product

Where ProductName LIKE“%Sa%”

G O

这种模糊查询虽然简便但效率不足, SQL Server数据库还提供了一种叫做Stored Procedure (存储过程) 的数据库对象, 用户可以将一些常用的命令过程以存储过程的形式存储起来, 需要运行这些存储过程时, 只要输入存储过程名即可。这样不仅简化了操作, 而且提高了效率。存储过程名的选取应符合SQL Server的命名规则, 当它以“#”开头时, 表示一个临时存储过程, 它只在应用程序运行时存在, 程序结束后, 被自动删除。

下面的语句创建一个名字为#query的临时存储过程:Create Procedure#Query

Select*From Product

Where ProductName LIKE“%Sa%”

三、数据库模糊查询的ASP实现方法

一般来讲一个个简单的利用存储过程实现模糊查询分以下五步部组成:

1. 建立存储过程

在SQL中的Northwind数据库中为employess表新建存储过程:CREATE PROCEDURE Employees_Sel@lastname nvarchar (20)

A S

select lastname from Employees where lastname like‘%’+@lastname+‘%’

G O

2. 窗体设计

(1) 新建ASP.NET Web应用程序, 命名为WebSql, 选择保存路径然后点击确定。

(2) 向窗体中添加一个Label、一个Textbox和一个Button按钮, 然后再添加一个DataGrid控件, 右击DataGrid控件选择属性生成器, 然后在打开的窗口中选择列, 去掉自动创建列前的对勾, 再向选定列中添加一个绑定列将页眉设为LastName, 将数据字段设为LastName点击确定。

3. 创建中间数据层

右击解决方案, 选择新建-项目-类库, 名称为ClaSQL, 选择保存路径然后点击确定。在打开的类库中添加以下代码:

4. 引用中间数据层

在ClaSql项目上右击, 选择生成, 然后在WebSql项目的“引用”上右击, 选择添加引用, 再选择项目, 将ClaSql项目添加到选定的组件框中, 然后点击确定。

5. WebForm1.aspx窗体代码设计

打开WebSql项目下的WebForm1.aspx文件, 双击Button按钮打开代码窗口, 完整的代码如下:

由于存储过程具有存储过程允许标准组件式编程、存储过程能够实现较快的执行速度、存储过程能够减少网络流量以及存储过程可被作为一种安全机制来充分利用等的优点, 所以任何一个设计良好的数据库应用程序都应该用到存储过程, 但是其中也存在着许多安全隐忧, 因此在对数据库操作中应尽量采取一些措施, 如使用储存过程要使用复杂账户的密码、对每个不同账户只设置相应的插入或删除等权限以及对数据库的操作应该尽量将其封装到中间层 (类库) 中等等, 这样即可以实现代码的重用, 也方便以后的进行修改。

四、小结

通过对三种SQL模糊数据库的查询比较, 总结出利用存储过程实现模糊查询的可取之处, 并给出了实现方法, 方便了企业数据库的查询, 提高了效率。对于存在的不安全因素也给出了可行性建议。今后还需对模糊数据的操作和完整性约束等方面进行研究。

参考文献

[1]何新贵:模糊数据库系统[M].清华大学出版社, 1994年12月

[2]刘应明任平:模糊性——精确性的另一半[M].清华大学出版社, 2000年12月

[3]苏啸:数据库原理与SQL Server2000教程[M].北京工业大学出版社, 2002, 256～271

[4]李兰友杨晓光:ASP.NET实用程序设计[M].北京交通大学出版社, 2005, 95～176

模糊数据库篇6

1建立模糊检索的意义

1.1方便性

在当前的信息时代中,尽管计算机应用技术的普及已经基本实现,但对于数据库信息检索的建立与研究,我们仍要为部分不熟悉检索技术的用户考虑。而模糊检索能够帮助这部分对于检索技术尚不熟悉的用户方便、快速地查找到许多有效的信息。其不仅为他们提供了有效的技术支持,更提供了优质的技术服务。

1.2易用性

模糊检索更符合人们的自然语言习惯,其与传统的数据库信息的精确检索相比,对人类自然语言的采用,更符合人们的检索习惯。同时,模糊检索中对大量自然语言标引的应用,能够进一步提高用户检索信息的全面性,以及系统操作的简单性与灵活性。

1.3对精确检索进行补充

对于数据库信息的精确检索,其需要用户检索内容的明确与精准,从而保证检索目录的准确性与全面性。但是,如果在精确检索中输入的检索词过少,就会出现一定的信息漏检,而模糊检索则能够对这一问题进行补充与弥补,从而保证信息检索系统的有效性与全面覆盖性。

2模糊逻辑关系下数据库信息检索的建立

2.1模糊检索系统的结构构造

对于模糊逻辑关系下的数据库信息检索系统,其需要用户在系统知识库的逐步引导下,根据自身的实际需求,提出需要查询信息的模糊检索短语。对于系统知识库的引导方式,我们可以采用提问式的方法,以帮助用户快速构造出适合模糊查询的短语。紧接着,系统以用户输入的模糊查询短语为基础,对其进行词义理解与分析,从而将其转换为相对应的模糊集合。

数据库中的模糊检索模块的建立、优化是模糊检索技术的重点环节,这一模块的主要任务就是经过知识库对用户输入的自然语言短语的理解、分析,以其为基础,快速建立检索机制,以迅速地从系统的数据库中进行关联度的计算与模糊匹配,并进行检索结果的输出,从而将最终的信息检索内容呈现给用户。

2.2模糊检索的具体实现

①截词检索模式建立。

截词检索,与字面意思相同,其是对用户输入短语的字面进行基本分析,从而利用短语字面的匹配程度来进行数据库信息的搜索与整合,并输出检索结构的方式。这种方式下的检索结果虽然具有较高的全面性,但由于其仅仅是利用字面匹配程度对数据库信息进行检索的,因此,其还是拥有较高的错检率的。比如说,检索内容中会出现某些词语组合相同,但却拥有不同意义的检索结果。

②智能检索方式的构造。

对于模糊检索技术中的智能检索方式,其是利用对各种词语进行收集,建立相关的词语、语义理解网络,完成计算机词语表格的构建,同时还需保持计算机词语表格的同步更新,以及关系数据库的连接。这一方式下,模糊检索技术在用户输入模糊查询短语后,对其进行关系数据库中词语的匹配检验,再将具有相关性的词进行数据库的信息检索,从而将检索内容进行整合输出给用户。

3模糊逻辑关系下数据库信息检索的优化

3.1用户检索入口界面的优化

从数据库的基本检索功能出发,对于用户检索入口界面的设计,应该设置一个检索式的判断检索程序。这一程序要对用户的模糊检索短语的输入进行最基本的判断,即当计算机模糊检索对其的理解、分析存在歧义时,程序要自动地弹出相应的对话框,从而引导用户对模糊检索短语的意思进行进一步地细化,以提高数据信息检索的有效性、全面性以及正确性。

3.2多种信息技术的采用

基于模糊逻辑关系下的数据库信息检索系统的高效运行,离不开多种计算机信息技术的采用与运行,像是现代软件工程技术、智能信息处理技术等等。

比如,在信息系统的知识库中,数据信息的管理与组织整合是模糊检索技术的关键环节之一,而对于这些知识库中的信息词语、短句的管理、整合,从而按照模糊词语进行的分类、存储,以及其的定时更新、删减、添加等,可以利用人工智能技术、信息处理技术等多种现代信息整合技术来完成。

4总结

模糊逻辑关系下的数据库信息检索技术对人类自然语言的应用能够在一定程度上使得其更符合当今人们的检索习惯与方式,同时具有更为优秀的便利性、易用性以及全面性。模糊检索技术的实现从最为基本的截词检索模式正逐步地向更为高效、全面、准确的智能检索方式发展,其对于数据库信息内容检索的精确程度与全面覆盖率有着积极的提升作用。同时,对于模糊逻辑关系下的数据库信息检索系统的建立,使得我们更加注重系统构建的细节问题,从而进一步优化了信息检索系统的性能,以确保其为用户提供更为优质的服务,以及信息、知识的有效利用。

摘要：数据库检索是信息管理系统的重要基础,而模糊逻辑关系下的数据库检索又是信息检索技术中的一个极为重要的分支,其对于系统的非精确信息检索能力有着积极的提升作用。本文从模糊数学的角度出发,对基于模糊结合论与自然语言理解的信息检索方式进行研究,并通过对数据库信息的精确检索与模糊检索的比较,提出模糊逻辑关系下,优化模糊检索效率的建议,进一步提高检索效率,从而提高信息的利用率。

模糊数据库篇7

1模糊搜索实现的目标

模糊搜索要达到的目标是用户不需要关心数据库的结构,任意输入一串字符或者数字,只要数据库中包含该信息,通过该方法就能够找出该信息包含在哪个表,那个字段里,进而可以进行更为详细的查询。模糊搜索可以实现以下几个目标。

(1)大小写不进行区分。

(2)要实现前后模糊查询。

(3)字符与数字不区分的模糊查询。

(4)与数据模型无关的模糊查询。

2工作原理

ORACLE数据库中有许多元数据表(系统数据字典[1]),描述数据库中各种实体对象的属性和数据库运行的动态参数,其中user_tab_columns表[2],记录着该用户模式下所有表和视图的属性信息,user_views表记录着视图的相关属性信息,首先判断要搜索的信息的数据类型,如果是字符串型就查询各个表中字符串型字段,如果是数据型就查询各个表中数值型字段。根据这个原则,先对user_tab_columns表进行查询[3],剔除user_views中含有的字段属性,得到所有相关的表和字段名组合,然后按照表和字段进行循环,构造相应的查询语句,查询出满足条件的表名、字段名和属性值,形成一个结果数组,然后输出到表格控件中,再对表格控件的行级别定义信号槽机制,点击相应的行时候,就触发对该表的详细内容查询。

3OCI接口使用

OCI(Oracle Call Interface)是ORACLE提供的C语言编程接口,是开发ORACLE数据库应用软件的较好的工具。用它开发出的应用程序比用Pro*C/C++和ODBC、ADO等运行效率高。使用OCI的步骤描述如下:

(1)定义并初始化所需句柄。

OCI的主要句柄关系(如图1)有envhp、srvhp、errhp、svchp、authp、hndlp、stmthp等。

(2)连接数据库。

OCIInitialize,初始化OCI程序环境;OCIEnvInit,初始化OCI环境句柄;OCIHandleAlloc;分配各种句柄OCIAttrSet,设置各项参数;OCISessionBegin,创建并开始会话;OCIAttrSet,设置会话参数类型;OCIHandleAlloc,分配OCI_HTYPE_STMT型陈述句柄。

(3)操作数据库。

OCIStmtPrepare。准备事件处理;OCIBindByPos、OCIBindByName(OCIDefineByPos)绑定(定义)变量;OCIStmtExecute,执行SQL语句;OCITransCommit(OCITransRollback),提交(回滚)当前事务。

(4)断开数据库。

OCISessionEnd,结束会话;OCIServerDetach,断开与服务器的连接;OCIHandleFree。释放已分配的各句柄。

(5)提取出错描述信息。

OCIErrorGet。上述各函数若执行失败,都可以使用该函数来提取出错信息的ORACLE描述。

4模糊搜索的QT实现

Qt是一个跨平台应用程序和UI开发框架[4],本模糊搜索的界面部分使用QT实现,其中查询结果使用QT的TableWidget显示,类似电子表格的风格。源代码在LINUX、QT4.6环境下编译,由于本文的篇幅限制,只列出核心代码,如下:

5结束语

本文提出了一种Oracle数据库模糊搜索的方法,介绍了该方法的工作原理,并使用QT、OCI接口给出了该方法的实现代码。该模糊搜索方法,可以实现在未知的数据模型系统中,不需要准确的提供搜索条件,就能达到对数据库全库搜索目的,把相关的信息全部搜索出来,提供类似搜索引擎功能,可以应用在企业信息查询系统中,为用户提供模糊、通用的查询工具,也可以应用此方法作为分析未知的数据模型的辅助工具。

参考文献

[1](美)Kevin Loney等著,蒋蕊等译,Oracle 9i DBA手册,电子工业出版社,2002.

[2](美)Kevin Loney著,张立清,尹志军译,Oracle Database 10g完全参考手册,清华大学出版社,2006.

[]3(美)Richard J.Niemiec著,王海涛,鹿凡译,Oracle 9i性能调整,清华大学出版社,2004.

数据仓库模糊粒度模型的研究篇8

模糊粒度模型在决策支持及信息管理系统的局势分析中发挥着重要作用。人们在解决问题时, 能从几个不同的粒度世界去分析和观察同一个问题, 并且很容易从一个粒度世界转到另一个粒度世界。为了描述这个现象, 建立了一种商结构的形式化体系, 给出了一套解决信息综合、启发式搜索、路径规划和推理等领域问题的理论和算法, 并已有一些研究和应用。目前, 关于模糊粒度模型的研究有Pawlak的“粗糙集理论”、Zadeh的“模糊集理论”和张铃等提出的基于上空间粒度计算, 有许多学者在模糊粒度计算领域进行了研究、以不同粒度求解问题的商空间模型已在模糊粒度领域引起了同行的关注, 其着重点是研究不同粒度世界之间相互转换、相互依存的关系, 及研究不同粒度问题之间的转换以及确定粒度模型与模糊粒度模型之间的关系。

本文提出利用学籍管理系统中的有关数据基本表, 进行分析、综合, 先建立确定粒度模型;再将确定粒度模型转换成模糊粒度模型, 利用模糊粒度模型对信息管理系统中的信息进行分析、研究, 实现数据仓库联机分析处理。

2. 定义和符号

Zadeh于1979年在文献中提出了模糊粒度的概念, 文中定义信息粒度为一个命题:X的值程度A隶属于模糊子集G包含于U, 其中X是U上的变量, X的值是U上的一个实体, 写成:g=X is G is A, 形式上被记成:g={∈U:X的值 (V (x) , V是U上的赋值符号) 是以程度A隶属于模糊子集G包含于U}, 很显然A∈【0, 1】。以模糊集的观点, 此处的A是模糊隶属度函数U|G;而以辑学观点, 此处的A是所建立的命题的模糊针织或概率。

通过二元关系定义子粒。设S= (U, A, V, f) 是信息系统, B:V→U二元关系, 其中U是所讨论对象的全集, A是属性集, V是属性值集, f是信息函数。用B定义粒是如下形式:g={u∈U:uBp, p∈V}显然g是清晰还是模糊完全取决于B的特性。设有两个关系B和D, 如果B包含于D, 则按B将全域划分的粒比按D将全域划分的粒更细, 在这种情况下, 也可以将不同大小的粒度分成不同粒度层, 并在不同层上进行各自分别处理。

在实际应用中, 如果粒度太细, 搜索空间庞大, 容易陷入组合

爆炸的情况;如果粒度太粗, 又会失去一些有用的信息, 因此需要从已知知识合成不同粒度知识。

设 (X1, P1, f1) 、 (X2, P2, f2) 是 (X, P, f) 的商空间, X1, X2对应的等价关系分别为R1, R2。

定义1:X1, X2的合成空间X3, 其对应的等价关系为R3。X3是X1、X2的细粒度合成空间, 满足R (x, y) ≡ (R1∩R2) (x●y) .

用划分来表示合成;设划分X1={a1}、X2={b1}, 则X1和X2的合成X3={a1∩b1|a1∈X1, b1∈X2}.X1和X2的积X3=X1●X2对应于等价关系R1∩R2的划分, 可以证明R1∩R2是一个等价关系。

定义2:X1, X2的合成空间X1, 对应的等价关系为R1, X1是X1、X2的粗粒度合成空间, 满足R1 (x, y) ≡ (R1∩R2) ● (x, y) 。其中 (R1∪R2) ●是 (R1∪R2) 的传递闭包, 用划分便是合成设x1和x2的和对应于传递闭包 (R1∪R2) ●的划分, 记x1=x1+x2可以证明 (R1∪R2) 是一个等价关系。

粒度和等价关系有着密切的关系。本节主要是对粒度合成技术在实际应用中的推广和补充, 即如何从已知知识合成粒度知识, 并能方便地从几个不同粒度世界去分析和观察同一个问题, 从而降低问题求解的复杂性。

3. 模糊粒度模型的建立方法

以高校学籍管理系统为例, 在学籍管理系统基础上建立数据库, 并利用高校学籍管理系统中的信息数据导出数据库中低粒度表;再导出数据仓库中的高粒度表;最后根据隶属度函数分析, 得出模糊粒度表;将高校学籍管理系统中的关系表中大量的数据进行分析、综合, 并且对导出的模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

模型建立过程如下图所示:

注:该成绩表中有30条记录, 分别是该班级30名学生数据仓库这门课程的成绩。下面由数据库中的学生成绩表 (低粒度表) 导出对应的确定粒度表 (高粒度表) 。

注:按照上面学生成绩表中的学生成绩将其成绩划分成优、良、中、及、不及五个等级, 五个等级对应的成绩分布如上表中成绩分布所示, 其对应的人数如上表所示, 总人数30人。

下面由确定粒度表 (高粒度表) 导出模糊粒度表, 如下表所示:

注:上面模糊粒度表的人数比例是从我自己观点出发, 根据隶属度函数计算所得, 该人数分布成正态分布。考虑到管理层不同的管理人员或决策者出发点不同, 可能会出现不同的人数比例计算结果, 但是有一点肯定不会改变, 即就是他们计算得出的人数比例分布一定成正态分布, 并且他们大多数人计算出得人数比例基本相同, 出入不大。这就突出了模糊粒度模型在信息管理系统应用中有很大的弹性, 比较灵活, 有利于数据仓库联机分析处理更好地进行, 从而大大地减轻了管理人员的负担。尤其在Oracle数据库中, 由于数据信息量大, 记录条数比较多, 通常会出现数据繁杂, 信息爆炸现象。但是将模糊粒度模型应用到大型信息系统中去, 会有效地避免信息爆炸现象。

模糊粒度模型的建立过程:

Ⅰ用适当的数学方法对问题进行描述

在数据仓库模糊粒度模型的建立过程中, 引用概率论和统计学对信息管理系统中的信息数据进行计算、分析, 由于该模型是模糊的、不确定的, 因而使用隶属度函数对模糊粒度表中数据进行计算, 得出结果后检验其是否符合正态分布规律 (一般分布规律) 。

Ⅱ采用各种数学方法和计算机工具求解模型

本文在信息管理数据模糊粒度模型的基础上, 设立了辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥了决策作用, 同时也对模型进行了求解。

Ⅲ模型建立步骤和方法

本文在学籍管理系统的基础上, 由系统中的基本表导出确定粒度表, 进而得出模糊粒度表;利用隶属度函数对模糊粒度表中的信息数据进行计算、分析, 检验检验其是否符合正态分布规律, 再将各模糊粒度表进行分析、综合, 从而建立一个科学的数据仓库模糊粒度模型。

4. 应用和分析

在信息管理系统和智能辅助决策IDSS中, 根据粒度化历史数据变动情况和查询统计要求, 可使业务流程数据与决策信息形成有效流转, 在信息管理数据模糊粒度模型基础上, 设立辅助决策数学模型和相关指标临界值, 使系统自动报警, 充分发挥辅助决策作用。假设某粒度级因素项的数据量为X, 关联因素项数据量为Y, 数据挖掘分析结果项为Z, 那么建立辅助决策数学模型, 假若, X与Y的增长量分别为dx、dy, 就对应一个分析结果项变化量dz, 其关系为积分方程:

在上式中, 把指标临界值分别设为x=x0, y=y0, z=z0, 各粒度级因素项的数据量分别设为x1, x2, ……xn;各关联因素项数据量分别为y1, y2, ……yn;各数据挖掘所获得的分析结果项分别为z1, z2, ……zn。这些值, 有的情况是离散值, 但大多数情况是连续值或分段连续值, Z为积分曲线。

上面辅助决策数学模型是建立在模糊粒度模型的基础上, 它可以有效地自动对信息管理系统中的数据信息进行处理、衡量, 从而大大地减轻了管理人员和决策者的负担。

数据仓库模糊粒度模型应用到信息管理系统中, 它可以对现实中一些模糊的问题或者决策者难以驾驭的问题进行处理。由于实际应用中信息往往是不完全、不精确或不确定的, 有时很难对粒度粗细进行划分。在现实生活中, 比如天气情况“晴”、“多云”、“阴”等都很难有个“界限分明”的不相交的分类, 有时甚至连相交与否都说不清, 只能模糊地进行分类。从上述分析可知, 现在的数据仓库联机分析处理大多是基于静态、确定、有限、历史的数据仓库集进行研究的, 而对当今信息系统中数据信息的流动性、快读变化性、无限性和不确定性的特点, 目前的联机分析处理技术需要重新考虑、选择, 甚至再研发。而数据仓库模糊粒度模型完善了这一方面的缺陷, 使得数据仓库联机分析处理能够很好地对信息管理系统中的信息数据进行处理, 给决策者大大地提供了方便。

5. 结束语

本文提出数据仓库模糊粒度模型, 并将其应用于学籍管理系统。针对实际问题, 将数据仓库模糊粒度模型进行了推广和应用。首先提出了粒度的概念, 并介绍了粒度的等级划分, 阐述了粒度和等价关系之间的紧密联系, 将粒度合成技术在实际应用中进行了推广和补充, 引入确定粒度模型的概念, 在此基础上, 建立了数据仓库模糊粒度模型。将确定粒度模型与模糊粒度模型进行了比较, 充分体现了模糊粒度模型的实用性和优越性。

通过本文的讨论, 基于模糊粒度模型理论方法是采用概率统计方法研究粒度的计算方法, 那么它就可以有效地应用于信息管理系统中进行统计和分析, 既可以使得数据仓库联机分析处理更好的进行处理, 又可以大大地降低问题的复杂性, 从而减轻决策者和管理人员的负担。

参考文献

[1]W.H.Inmon, building The Data Warehouse Third Edition[M]John Wiley﹠sons, Inc.2002

[2]Zhang L.Zhang B.The Quotient Space Theory Of Problem Solving Fundemental Information.2003.59 (2-3) .287-298

[3]W.H.Inmon, building The Data Warehouse.Practice Hall, 1992

[4]W.H.Inmon, R.D.Hackathorn《Using The Data Warehouse》[M].John Wiley﹠sons.Inc, 1994

统计数据质量的模糊综合评价篇9

随着科学技术的进步,统计在各领域中的地位越来越重要,统计数据质量的高低对于决策和我们的社会实践活动有着直接的影响。高质量的统计数据可以帮助我们做出更加科学的决策,有利于生产的发展和社会的进步,否则的话结果也是可想而知的。近来统计数据质量的评价已经成为人们关注的热点问题,也有了一些研究成果[1,2,3]。

客观世界中的许多问题都表现出一种界线不清晰的不确定性,这主要是人类的思维具有概括性、语言表达具有模糊性、逻辑具有一定的定性特点的缘故,人们在评价这类事物时,往往难以准确的描述它们,因而也就很难确定其特征。这种界线不清晰的不确定性就是所谓的模糊性,模糊不确定性现象不满足排中律,表现为模糊的亦此亦彼性,它们不能使用传统集合论和二值逻辑来描述,必须运用模糊集合理论加以研究才能奏效。另外,模糊技术模仿了人的思维和处理问题的方式,可以以较低的代价获得令人满意的结果,因而得到了越来越广泛的应用。不管是客观信息还是人为因素造成的模糊性,当它在评价问题中占有重要地位时,便构成了模糊综合评价问题。在统计数据质量的评价问题中,因为许多评价指标具有模糊性的特点,因此,运用模糊综合评价方法进行评价效果更为理想。目前。运用模糊综合评价方法评价统计数据质量的文献并不多见。

1 统计数据质量模糊综合评价模型

模糊综合评价可以用来对模糊信息进行全面和定量的评价,能够有效地提高判断的准确性和决策的科学性。要正确评价一个具体对象,首先要对其若干因素给出评语,然后再进行综合。为了表达上的简洁,我们仅介绍单因素模糊综合评价模型。模糊综合评价一般可归纳为以下几个步骤:

1.1 确定评价对象的因素集

因素就是评价对象的属性或指标,有些场合也成为参数指标或质量指标,它们综合反映出评价对象的质量,人们根据对象的因素对其进行评价。因素集可表示为

对于统计数据质量模糊综合评价问题,我们取X={及时性,统计数据的客观性,统计方法的科学性}。

1.2 确立权重集

由于对X中各因素有不同的测度,需要对每一个因素按其重要程度给出不同的权重,它可表示为X上的一个模糊子集,A={a1,a2,…,an},

其中ai={1,2,…,n}是因素xi对A的隶属度,通常规定

权重的确定在模糊综合评价中是至关重要的,因为权重集确定的恰当与否会直接影响到综合评价的最终结果。权重集的确定方法有很多种,诸如客观赋权法、主观赋权法、组合赋权法和交互式赋权法。下面介绍几种具体的常用方法。

(1)专家调查法

首先,请有关专家或具有丰富经验的相关人员若干个,请他们对因素集中各元素独立地给出自己认为最合适的权重向量

然后,对每个因素进行单因素统计,具体步骤是:

(1)对于因素xi(i=1,2,…,n),在其权重中找出最大值Mi和最小值mi,即

(2)选取适当的正整数k,有下述公式

计算出把权重分成k组的组距,并将权重由小到大分成k组。

(3)计算落在每组中权数的频数和频率。

(4)根据频数和频率的分布情况,确定第i个因素的权数ai,从而得到权重集。

(2)继承方法

对某种评价对象的个因素的权重,根据历史数据有某种方案,设为A1,对于目前的情况时间和空间上的改变可能会有新的权重分配方案A2,而A1是大量经验的积累,A2具有较现实的合理性,因此可以采用加权方式给出新的权重分配方案

其中,α可根据情况选取一个适当的数值。

(3)二元对比倒数法

对因素集中的各元素两两比较,根据它们对实现目标的贡献的大小从1到7赋值,如aij=7意味着因素xi比xj极端重要。令aji=1/aij,这样可得到对比矩阵A=(aij),对比矩阵的主对角元都是1。再用优势积累法,即求同一行元素之和,得到权向量,

再归一化即可得到所需要的权重集。

1.3 建立评价集

评价集是由对评价对象可能作出的评价结果所组成的集合,可表示为

对于统计数据质量模糊综合评价问题,我们取Y={质量高,良好,一般,差}。

模糊综合评价的目的就是通过对评价对象综合考虑所有影响因素,从评价集中获得一个最佳的评价结果。首先从单因素出发进行评价,确定评价对象对评价集中各元素的隶属度。

建立一个从X到Y的模糊映射,

由此可得到单因素评价矩阵

1.4 综合评价

因素集和权重集确定以后,按照模糊矩阵的乘法运算,可得到模糊综合评价集B,即B=A莓R.记B=(b1,b2,…,bm),它是Y上的一个模糊子集,其中

最后利用最大隶属度原则或加权平均等原则就可得到综合评价的结果。以上我们介绍的处理问题的一般原则,具体问题可结合具体情况与模糊数学理论采用不同的具体方法来处理,不可能说一种方法适用于所有的情况。譬如合成算子模型我们采用了取大取小模型,这种模型运算简单,但因丢失了不少信息,致使评价结果比较粗糙,该模型不适于因素太多或太少的情形。比较常用的合成算子如:M(•,∨),也就是,也就是,等等,这些合成算子各自都有各自的优势和劣势。具体应用那个模型可根据具体情况来定,也可以应用多个模型,作出多个结果在进行加权平均得到期望的结果。总之,具体应用时要根据具体情况选用适当的模糊技术,这样才能取得另人满意的效果。

2 算例分析

对于某统计数据质量的评价,我们给出权重集A=(0.2,0.5,0.3),评价矩阵采用专家评分方式给出:

那么

求出评价指标bj(j=1,2,…,m)后,一般根据最大隶属度原则,把与最大的评价指标相对应的评价集元素作为评价结果。当然,也可以根据具体情况应用加权平均法或模糊分布法来进行评价。我们本例的评价结果为该统计数据质量良好。

3 结论

本文利用模糊综合评价方法,给出了统计数据质量的评价体系和评价原则,各种评价指标可以根据具体情况的不同采用不同的模糊技术处理。较之确定性方法,运用模糊综合评价方法评价统计数据的质量,准确度更高,并且具有更为理想的可靠性。

参考文献

[1]谭洪章.统计数据质量问题研究[J].重庆工业管理学院学报,1998(3):49-52.

[2]陈健,王军.对提高统计数据质量的几点思考[J].淮阴工学院学报,2001(5):63-64.

[3]刘延年.如何评价统计数据的质量与可靠性[J].统计研究,2002(8):61-63.

[4]朱训生.工程管理的模糊分析[M].上海交通大学出版社,2004.

[5]王新利.模糊综合评价法在项目投资决策中的运用[J].财会月刊,2009(6):57-58.