农业信息模糊查询系统(精选7篇)
农业信息模糊查询系统 篇1
0 引言
21世纪是一个信息化的网络世界。Inernet对经济的发展和科技交流有着重要的推动作用。同样,农业科研、教育和生产都离不开正确、快捷与高效的信息传递[1]。现有查询技术主要是以传统数据库系统为基础,对精确数据进行访问和处理。然而在客观世界中,模糊概念和现象大量存在,也就有大量非理想化或模糊的查询操作。为了克服传统查询的局限性,需要提出一种更具“智能化”和能对模糊查询要求快速定位的新技术[2]。
1965年,美国控制论专家L.A Zadeh提出了模糊集合理论[3]。这一理论几乎对所有的数学分支都产生了重要影响,其应用遍及各个领域。1979年,Buchles等人建立了模糊数据库理论,在数据库理论与技术中使用模糊理论。该理论希望克服传统数据库难以表达和处理模糊信息的缺点[4]。
1 传统数据库系统的查询技术
传统数据库要求用户的查询条件必须与数据库记录严格匹配。如果数据库表中有符合用户查询的记录,结果才能返回给用户;当用户查询条件与数据库记录不一致时,用户只能得到无此记录的结果。
1.1 模糊单词和隶属函数
单词为表达概念的最小单位,如天、地、大、小、深与远等。其中,“天”与“地”是明确单词,而“深”与“远”则是模糊单词。在模糊集合中,通常使用隶属函数表示模糊单词。例如,“年老”与“年轻”两个模糊集的隶属函数分别为[5]
1.2 模糊语言算子
自然语言中有一些通过改变语气而改变语义的词,如“非常”、“大概”与“偏向”等,这些词在模糊推理中都可作为语言算子。
1.2.1 语气算子
如“极”、“很”、“非常”和“比较”等,放在另一些词前面,可以修饰这些词的肯定程度,叫语气算子。数学描述是(HA)(x)=[A(x)]λ。当λ>1时,叫集中化算子;当λ<1时,叫散漫化算子。例如,表述“青年人”的集合为
已算得28岁和30岁的人对于“青年人”的隶属度为μA(28)=0.74,μA(30)=0.5。加上算子“很”,取n=2,则μ很年轻(x)=[μ青年人(x)]2。根据上面的公式可以算出28岁和30岁对“很年轻”的隶属度为μ很年轻(28)=0.54,μ很年轻(30)=0.25。
1.2.2 模糊化算子
“大概”、“近乎”与“大约”等词是另一种算子。它放在一个单词前面,可以把该词的意义模糊化,故称为模糊化算子。通常令
例如,“大约2m”的隶属函数可表示为
1.2.3 判定化算子
“偏向”和“倾向于”等词也是一种算子,其作用为化模糊为比较粗糙的判断,称为判断化算子。其数学描述为
(PA)(x)=P[μA(x)]
例如,用前面“青年人”的定义,则“倾向年轻”就可采用上述判定化算子P(x)。其结果如图1所示。
2 基于数据库系统的模糊查询
2.1 模糊查询的扩展SQL表达
SQL在模糊方面的扩展,主要是使WHERE后查询条件能容纳模糊单词和3种主要算子。其形式为
式中fi—字段名;
Vi—属性值或字段名。
例如,若查询“年纪比较年轻,工资在1000元左右的教师情况”,其相应命令为SELECT*FROM TEACHER WHERE年龄=“比较年轻”∩基本工资=“大约1000元”。
2.2 模糊查询的实现
模糊查询经形式化查询语言—扩展SQL表示以后,其实现的关键在于如何将其转化为标准的SQL形式。扩展SQL向标准SQL的转化主要有两种方法。
2.2.1 反向法
即给定一个隶属度阈值,计算该隶属度阈值相应字段的取值范围,再用该取值范围取代原来字段应满足的“模糊”条件。例如在前例中,假如[较年轻](x1)>=0.5,即隶属度阈值为0.5,[大约1000](x2)>=0.5,18≤x1≤42,950.18≤x2≤1040.81。对应的操作为:SELECT*FROM TEACHER WEHRE年龄≥18 AND年龄≤42 AND基本工资≥950.18,AND基本工资≤1040.81。
2.2.2 正向法
即按查询条件,将要查询的字段值代入相应的隶属函数,计算出隶属度表。然后设定总隶属度阈值,再对隶属度查询。例如在前例中,总隶属度=∩(年龄隶属度,工资隶属度),这里取“∩”=MIN。则对应的操作为:SELECT*FROM TEACHER WHERE总隶属度>=0.5。
正向法的特点是操作简单、方便;反向法的特点是无需计算每个字段相应的隶属度,不需生成新的隶属度表,而直接转化为标准的SQL形式。
3 ASP.NET环境下实现模糊查询
3.1 ASP.NET概述
ASP.NET是目前流行的一种动态网页开发技术,它是ASP的升级版本。在ASP.NET框架下,可以采用VB.NET、C#、Jscript等语言编写网上应用程序[6]。
3.2 模糊查询网页的设计
查询功能的实现分为3部分,即input.aspx、show.aspx和detail.aspx。input.aspx户输入查询条件;show.aspx显示查询结果;detail.aspx显示详细信息。查询页面如图2所示。
3.3 模糊查询源代码
4 结束语
农业信息化是农业现代化的必要条件。如何通过网络查询到更加准确与全面的信息,将直接影响到我国农业向国际化标准靠拢的目标。本文介绍了模糊查询的相关理论,并且通过编程实例实现了ASP.NET环境下的模糊查询。如何推广模糊数据库理论在实际中的应用,需要进一步努力。
参考文献
[1]谢宝妹.因特网上的中文农业信息资源[J].科技情报开发与经济,2003(5):20-21.
[2]朱蓉.基于模糊理论的查询技术研究[J].计算机应用研究,2003(5):8-10.
[3]Zadeh,L A.Fuzzy Sets[J].Information and Control,1965(8):338-353.
[4]刘增良.模糊技术与应用选编[M].北京:北京航空航天大学出版社,1996.
[5]朱剑英.智能系统非经典数学方法[M].武汉:华中科技大学出版社,1999.
[6]胡淑礼.模糊数学及其应用[M].成都:四川大学出版社,1994.
[7]Kaufmann.A Introduction to the theory of fuzzy Subsets[Z].[S.L.]:Academic Press,1975.
[8]李洪兴,汪培庄.模糊数学[M].北京:国防工业出版社,1994.
农业信息模糊查询系统 篇2
1 农业信息资源开发与利用评价指标体系构建
农业信息资源是农业资源的抽象, 是农业自然资源和农业经济技术资源的信息化。 从内容上看, 农业信息资源至少应该包括反映农业生产所必须的自然资源信息、社会经济信息以及人际交往信息三大类。 所以本文以农业信息资源评价体系作为目标层, 分为3 级指标体系 (见表1) , 选取农业生产中的自然信息资源、社会信息资源、人际信息资源三个一级指标, 自然信息资源包括天气信息、土壤和水分信息、病虫害信息这三个二级指标, 社会信息资源包括农产品市场信息、技术信息和法规政策三个小指标, 人际资源信息包括邻里消息和自身经验两个二级指标。
2 基于AHP的模糊综合评判
2.1 层次分析法 (AHP)
层次分析法是美国匹兹堡大学教授Saaty在上世纪70 年代提出的, 是指将一个复杂的多目标决策问题作为一个系统, 将目标分解为多个目标或准则, 进而分解为多指标 (或准则、约束) 的若干层次, 通过定性指标模糊量化方法算出层次单排序 (权数) 和总排序, 以作为目标 (多指标) 、多方案优化决策的系统方法。 主要步骤如下:
2.1.1 建立层次结构模型。 在分析实际问题的基础上, 将有关因素按照不同属性自上而下的分成若干个层次, 同一层的因素对上一层因素有影响同时受到下一层的因素的影响。 最上层为目标层 (通常只有一个因素) , 最下层一般为目标层或方案层, 中间可以有一个或多个层次, 叫做指标层或准则层。 当指标层过多时 (多于9 个) 应进一步分解为指标层 (心理学家认为, 分级太多会超越人们的判断能力, 既增加了判断难度, 也容易因此产生虚假数据) 。
2.1.2构造判断矩阵。判断矩阵的构建采用专家打分法, 咨询专家对同一层上的不同指标对上一层因素的重要性进行评定, 结果可由“1~9标度法”表示。现以目标层A到准则层B为例, 根据专家打分所建立的判断矩阵如下:
2.1.3 求解判断矩阵。 现以准则层B中的相关指标对于目标层A的权重计算为例, 本文利用和积法求解, 具体步骤如下:
第二是按行求和并归一化。将矩阵每一行进行求和运算, 得到向量Z=[1.8581 0.8527 0.2892]T, 然后将进行标准化, 得到准则层B对目标层A的权重,
2.2 模糊综合评价法对农业信息资源的定量评价
模糊综合评价法是以模糊变换理论为基础, 以模糊推理为主的定性和定量相结合, 精确与非精确相统一的分析评判方法, 引入隶属函数来描述客观事物差异的中间过渡的模糊数学方法, 它根据模糊数学的隶属度理论把定性评价转化为定量评价。
本文采用农村调研的方式获得相关指标评价集。 首先根据相关指标集设计问卷, 然后下乡走访调查, 由于乡下受教育程度偏低, 所以我们采取了聊天式的调研方法, 事后根据村民口述完成问卷。 本次问卷调查有效问卷为314 份, 按照百分制统计法统计, 相关指标对农业生产的影响评价具体情况见表2。
由表3 可得出一级综合评判结果 (见表4) 。
从评价结果可以看出, 蚌埠市X村农业信息资源对农业生产影响很小的可能性为5.8%, 影响一般的可能性为13.55%, 影响很大的可能性为80.65%。 按照最大隶属度原则, 在这三个等级的隶属度中, “80.65%”数值最大, 因此评价结果为蚌埠市X村农业信息资源对农业生产有很大影响。
3 结果分析及相关建议
由于不同的农业生产方式决定了所需信息资源的种类, 所以不同种类的农业信息资源对不同的农业生产方式所产生的影响是不同的, 但总的来说, 农业生产离不开农业信息资源。从上述评价结果来看, 按照最大隶属度原则, 自然信息资源、社会信息资源和人际信息资源都对农业生产产生了很大影响。
从上述评价来看, 社会信息资源对农业生产也有很大影响, 其中村民们对农产品市场比较关注。通过调查得知, 大部分村民家中的农产品都是等商贩上门收购, 几乎没有从其他渠道出售农产品, 而农产品价格也都是商贩给的, 自己很少去了解其他地方的农产品价格。村镇有关部门可以从多种渠道联系买家, 组织村民统一出售, 将村民们的利益最大化。培育农业信息市场, 应提高农民信息意识, 扩大农业市场信息需求, 增加投入, 加大开发研究力度, 提高农业信息产品质量。
技术信息在调查中所显示的影响力不是很大, 主要是由于地域的限制, 农作物大部分是水稻、玉米等没太多技术性的品种。至于一些养殖方面需要技术支持的农业生产活动, 村民们一般都是自己买书回来看, 更多的是从其他养殖户那里获取技术信息, 村里或镇上的农技站并没有提供有用的帮助, 这就导致了一些生产问题不能及时解决, 给村民带来了经济损失。对此, 村镇上的农业技术推广站应发挥自身作用, 为农民提供技术指导。
最后, 人是农业生产的主体, 自身的农业经验绝对是影响农业生产的重要因素, 不过有些村民过于依赖自身经验去进行农业生产, 对外界新的生产方式和农业信息并不在意, 不能及时更新自己所拥有的信息资源, 导致农业生产出现问题或进展缓慢。 因此农民应该从多种渠道获取新的农业信息资源等。
摘要:农业信息资源的开发和利用水平对农村信息化建设有着重要影响。根据农业信息资源的建设内容, 构建了3个一级指标, 8个二级指标的评价指标体系, 采用AHP-模糊综合评价法对安徽省蚌埠农村地区的农业信息资源开发与利用水平进行了综合评定, 评价结果将为农村信息化建设提供政策依据。
关键词:农业信息资源,AHP,模糊综合评价
参考文献
[1]秦磊磊.农业信息资源现状和发展方向[J].农业信息网络, 2006 (2) :75-79.
[2]井元勋.浅谈我国农业信息资源开发的重要意义[J].农村实用科技信息, 2012 (1) :88.
农业信息模糊查询系统 篇3
随着信息化时代的到来,越来越多的企业准备实施企业资源计划(Enterprise Resources Planning, ERP)系统或类似的信息系统,以合理计划与配置所有资源,提高企业竞争力。据美国生产与库存控制学会(APICS)统计,企业成功应用ERP后库存下降30%~50%;延期交货减少80%;采购提前期缩短50%;生产能力提高10%~20%[1]。到2003年为止,我国已有千余家企业购买了MRPⅡ/ERP或类似的信息系统,但应用成功率只有10%~20%,局部应用成功率为30%~40%。信息系统供应商选择是企业信息系统建设项目至关重要的环节[2]。只有采用科学合理的决策方法,才能避免盲目选型,为项目成功打下良好的基础,所以对信息系统供应商选择方法的研究很有必要。
本文将三角模糊层次分析法和模糊评价方法结合,建立综合评价模型,并应用于企业信息系统供应商选型。本文提到的模糊层次分析法仅指三角模糊层次分析法。
2 模糊层次分析法和模糊评价法的在信息系统供应商评价中的适用性
2.1 常用的供应商评价方法
常用的供应商评价方法有线性规划法、决策树法、经济批量法、数据包络分析法等[3],这些方法要么主观性太强,要么需要大量的先验数据,计算过程过于复杂。故本文使用一种新的综合评价方法。
信息系统供应商是一种特殊的供应商,他们不仅供应产品,而且侧重在供应前后的相关服务,还有企业自身和供应商等多方面内容,既有内外部因素,也有短期目标和长期规划,而且有些因素很难直接进行量化评价。对于信息系统的评价,出现了不少的方法,有的学者提出基于熵权的TOPSIS评价方法[4],文献[5]利用了层次分析法(AHP)方法,还有学者结合AHP和DEA方法进行选型[6],还有人利用模糊积分给出了评价框架来计算排名[7]。此外有学者结合了TOPSIS和ANP方法进行了评估[8],但操作比较复杂,不易理解和处理。
2.2 本文提出的方法在信息系统供应商评价中的适用性
T.L.Saaty在20世纪70年代提出层次分析法(Analytic Hierarchy Process, AHP)[9],AHP法由于理论简单,操作容易,且具有实用性,应用领域广泛,因此,Narasimhan认为[10]AHP法非常适用于解决供应商评价问题,可用于确定准则权重与供货商排序。它有以下优点: (1) 一般评估准则的系统方法使采购经理人员更易产生主观性; (2) 使按步循序的方法量化,使供货商评选问题简化; (3) 虽然主观性不能避免,但可通过评选来降低主观性; (4) 供货商准则权重与排序可由计算机运算得到。
AHP方法作为一种定性与定量结合的决策方法,得到了迅速的发展。由于客观事物的复杂性和人们对事物认识的模糊性,如何使AHP方法更客观、更确切地反映所研究的问题,一直是大家关注的课题。1983年荷兰学者Van Loargoven提出了用三角模糊数表示Fuzzy比较判断的方法[11],并运用三角模糊数的运算和对数最小二乘法求得元素的排序。1994年我国的常大勇教授提出了利用模糊数比较大小的方法来进行排序[12]。模糊评价法是以模糊数学为基础,应用模糊合成的原理,将一些边界不清、不易定量的因素定量化,进行综合评价的一种方法。
本文从实际应用出发,采用的模糊AHP方法保留了AHP方法的优点,对文献[12]提出的方法进行了一些补充,并结合文献[13]和模糊评价方法,运用到多层(两)层指标体系中,提出了一个多级综合模糊评价模型。先利用三角模糊AHP方法给出各级指标的权重,再利用模糊评价方法,通过相关专家对某个待评信息系统供应商各指标进行打分,得到一系列评价矩阵;最后用模糊评价法来处理评价矩阵,得到某个待评信息系统供应商的评价结果。
3 基于模糊层次分析和模糊评价的多级综合评价模型
3.1 模糊层次分析法
3.1.1 准则指标评价体系
由于供应商选择所涉及的因素很多,使得供应商评选成为一项多准则决策。Mohanty和Deshmukn[14]认为影响供货商评选决策的主要准则是价格、质量、交期与服务。具体到信息系统供应商选择的问题,信息系统的选择涉及多方面内容,既有内部、外部因素,也有短期目标和长期规划等众多指标因素的影响。本文据此进行了综合分析,并参考有关文献[2,5,7],给出6个一级准则,每个一级准则还有3~4个二级准则,基本概括了各个方面的因素,最终建立了层次模型(见图1)ㄢ
3.1.2 三角模糊数概念、隶属度及其运算
定义1设M为三角模糊数,记为M=(l, m, u),则M的隶属度函数um (x), R→[0, 1]可以表示为:
三角模糊数的运算有加法、乘法、倒数、数乘运算等,这里不多叙述,详见文献[12]。
定理1:M1=(l1, m1, u1), M2=(l2, m2, u2)为两个三角模糊数,则有M1≥M2的可能性程度定义为:
d为M1, M2交点横坐标。可以证明其等价于:
3.1.3 模糊判断矩阵建立
对于k-1层次的某一因素(准则),与之相关的第k层全部个因素进行两两比较时采用三角模糊数定量表示,即模糊判断矩阵中的元素是,一个以mij作为中值的闭区间,而mij就是AHP方法中比较判断所采用的1~9中的整数[9]。模糊矩阵A仍为正负反矩阵,即。令mij-lij=uij-mij=δ, δ为常数, 则根据定理1不难证明, 当0<δ<1/2时, mij取相邻两级标度时, μ (d) =0, 没有完全反映人们认识上的模糊性;当δ>1时, 模糊度过大, 置信度下降;常大勇证明1/2<δ<1比较适宜[13]。
关于三角模糊数判断矩阵的一致性检查问题,目前在相关文献中无行之有效的方法,本文采用一种近似方法[15]加以判定。
3.1.4 计算模糊综合程度值和指标权重值
为第t个专家给出的模糊数, nk为第k层的因素个数。根据公式:
求得第k层次的综合三角模糊数,由此得到第k层全体因素对第k-1层次的所对应因素的综合判断矩阵。再根据公式(3)求出模糊综合度值:
再根据定理1计算:
然后计算指标Ci的权重:
可得各指标权重,之后再对以上的权重向量进行归一化即可,仍记为Wi (Ci)ㄢ
3.2 模糊层次分析法与模糊评价法结合
模糊评价方法,即:, W为各因素的权重,E为根据相应因素集和评语集由专家评价得到的评价矩阵。
由上节模糊层次分析法可得到各个指标的权重。建立评语集G(很满意,满意,一般,不满意),可以运用Delphi法等调查统计方法,对各个(比如4个)方案的相应指标评价得评价矩阵,然后采用模糊评价方法:,相当于利用Ei对权重进行修正。再将各因素的隶属度组成的关系矩阵Bi组合,得B=(B1, B2, B3, B4, B5, B6) T。其中W (k) i上标表示层次码, 下标表示相对上一层次中的因素码。再参照前面由模糊AHP法确定的一级指标权向量并进行模糊合成, 即可得到该供应商的最后评价结果:
G是一个向量,其4个分量均在0~1间,分别表示(很满意,满意,一般,不满意)的程度。最后可以利用最大隶属度原则来判断选择供应商。
4 信息系统供应商评价方法实例计算
4.1 实例简介
国内某中型企业要购买和实施信息系统,有包括SAP、Oracle、用友、金蝶等4家国内外软件公司的信息系统供应商可供选择,企业聘请了有关专家、咨询顾问,加上企业自身技术骨干组成了信息系统选型小组,负责选型工作,分为3组,给待选4个供应商打分。
4.2 指标体系
由以上3.1.2的分析,可得指标评价体系(见图1)ㄢ
4.3 计算指标权重
以功能满足程度指标为例,其4个二级指标的三角模糊判断矩阵见表1ㄢ
利用(2)式求出模糊综合度矩阵(见表2)ㄢ
利用MATLAB编程求解,易得:CR=CI/RI=0.051 9<0.1,通过一致性检验。
再用(3)、(4)、(5)式计算各指标权重。归一化得到4个评价指标相对功能满足程度的权重:W=(0.534 3 0.280 90.163 0 0.021 8)即W1 (2)。同理不难得出:W2 (2), W3 (2), W4 (2), W5 (2), W6,其中,Wi (k)上标表示层次码,下标表示上一层中的因素码。
4.4 模糊合成矩阵
由10个专家给待选4个供应商打分,评判对6个一级指标的各个因素的满意程度,得到由各二级指标隶属度组成的模糊评价矩阵:
已经计算出第i个指标的权重。然后利用Bi=W2 (2)塥Ei, i=1,…,6,可得Bi,令:B=(B1, B2, B3, B4, B5, B6) T,将各因素隶属度组成的关系矩阵E1~E6与利用模糊AHP求得的权向量W2 (2)分别按照上述合成方法进行模糊合成,即可得评价结果:
以上结果表明,该待选信息系统供应商对于本企业而言,评价很满意的占48.27%,评价满意的占23.98%,评价一般的占20.91%,评价不满意的占6.86%,根据最大隶属度原理可得结论:该待选信息系统供应商最后评定等级为“很满意”。同理可依次对其他待选供应商进行评判,确定它们对评语集G的隶属度,最后根据最大隶属度原理比较确定最终方案。
5 总结
农业信息模糊查询系统 篇4
关键词:远程康复,信息采集,模糊控制,智能控制
1 引 言
远程康复是一项现代信息及通信技术与康复医学相结合的多学科交叉课题,它可以被定义为:在综合运用通信、远程感知、远程控制、计算机、信息处理等技术的基础上,实现的远方康复医疗服务[1]。
国外在此方面的研究出发点各有不同,归纳起来,主要是将远程康复系统当作一种通信手段,来消除辅助器具评价专家与远方残疾人士之间的空间障碍,对如何把远程康复系统本身作为一种辅助器具评价诊断系统,促进康复医学的发展等方面,虽有所提及,但尚未作实质性研究[2,3,4]。 国内在这方面的产品,仅见深圳残联自行研制开发的全国第一个残疾人远程康复系统的报导,该系统着眼于专家和病人的沟通与交流,使残疾人在网上可以向专家进行康复咨询,得到康复方面的建议。
从目前国内外的发展情况来看,各方的研究都有较大局限,均处在起步阶段。因此进行远程康复系统的研究具有重要的意义。
远程康复系统中,信息采集系统是其主要的组成部分,如何远距离对信息采集系统进行有效控制,其实现效果的优劣,实现速度的快慢,对整个系统的性能起着关键性的作用。由于远程康复信息采集系统是多变量、非线性的时变系统,很难建立整个同步控制系统的精确数学模型。因此就需要利用一种有效的控制方法——模糊控制。
2 远程康复信息采集控制系统的构成
远程康复信息采集控制系统示意图如图1所示。该系统就是一个辅助摄像用的机器人,它可以接受指令以某条空间曲线为路径来观察患者。此控制系统主要由两个功能模块来实现,一是现场站点的PC机,通过Internet来接收远方站点的控制命令,经过模糊控制算法处理之后,再通过RS 232串口传给单片机处理系统,来控制小车、云台、摄像机的运动。另外现场站点的PC机还可以将从摄像机采集到的图像信息根据要求进行处理,再通过Internet以适当的方式呈现给远方站点,供远方的康复专家和辅助设计厂商诊断、设计之用。二是单片机控制系统,主要用来控制小车、云台、摄像机的运动,使其能够到达合适的方位,以便远方康复专家不受时空限制、实时地观察患者的身体状况,进行远程诊断和评估。单片机控制系统还可以对检测电机到位等传感器的信号进行处理,并将控制模糊控制系统执行单元的情况反馈给远方站点。简单来说,此模糊控制系统主要实现自动控制装载信息采集装置的小车、带动摄像机的云台和摄像机的运动,根据要求采集实时视频或图像信息,供诊断和辅助产品设计之用[5]。
3 远程康复信息采集系统的模糊控制设计
3.1 信息采集系统的模糊控制策略
本系统的输入变量为:小车到目标的转向角,小车到目标的距离,云台距离目标的高度,摄像机与目标的方向角和距离,一共6个输入变量。输出变量为:小车舵电机的运行速度、方向,小车驱动电机的运行速度、方向,带动云台上下运动的电机的运行速度、方向和云台的四个转向一共10个输出变量。所以该信息采集系统初步控制对象就有6个输入变量和10个输出变量,属于多输入-多输出结构的模糊控制器[6,7,8]。
通过模糊解藕将此多输入-多输出模糊控制结构转化为单变量模糊控制器来进行设计。下面以控制小车驱动电机的速度为例来详细说明模糊控制规则的建立。
小车驱动电机采用步进电机,其速度是通过改变驱动信号的脉冲频率来控制的。因此,对小车驱动电机速度的控制采用单变量二维模糊控制器,输入量为小车到目标距离的误差e以及小车到目标距离误差的变化率ec,输出变量为控制脉冲的频率f。在模糊控制的具体实现方法上,采用模糊查表法,其原理如图2所示[9]。
对每一次采样得到的误差e和误差变化率ec进行量程转换,即乘以比例因子k1和k2,然后进行量化,将输入的物理信号值转换为输入论域上的点,就可以通过查询控制作用表得到输出控制量。它是输出论域上的点,再乘以比例因子k3进行量程转换,就得到所需要的控制脉冲频率值f。控制作用表是输入论域上的点到输出论域上的对应关系。它已经是经过了模糊化、模糊推理和解模糊的过程,可以离线计算得到。查表法结构简单,实施方便,资源开销少,在线运行速度快[10]。
误差e、误差变化量ec和控制量f的基本模糊子集为{NB(负大偏差),NS(负小偏差),0(零),PS(正小偏差),PB(正大偏差)}。在系统中,小车到目标距离误差e的论域为E,小车到目标距离误差变化率ec的论域为EC,输出控制量f的论域为F。根据系统的实际状况,将其大小量化为5个等级,分别为{-3,-1,0,+1,+3},选择如图3所示的隶属函数曲线,控制器可完成对输入变量的模糊化。
模糊输入变量再由模糊控制规则进行推理决策,得到模糊输出语言变量{NB(负大),NS(负小),0(零),PS(正小),PB(正大)}。同样道理,经过模糊控制器推理的输出结果也必须变换成实际的校正量,调节控制小车驱动电机速度的脉冲频率,完成对小车速度的控制。
为了简化编程,便于实时控制,本系统将控制规则表格化。模糊控制器按表1所示的控制状态表进行控制。
误差E,误差变化率EC的量化因子k1和k2的选取对控制系统的动态性能的影响很大。k1决定了系统的响应速度,k1越大系统的响应越快,但超调也越大,过渡时间就越长。k2影响系统的超调,k2选取越大,系统的超调就会越小,但系统的响应时间就会越长。k3为模糊控制器的总增益,选取过小会使系统的动态响应过程变长,而选择过大会导致系统震荡。
其他控制量的控制规则和上述小车驱动电机速度的控制类似。
3.2 信息采集控制系统的软件设计
目前,模糊控制器构造有三种技术:采用传统的单片机或微型机作为物理基础,编制相应的软件实现模糊推理和控制;用单片机或集成电路芯片构造模糊控制器,利用配置数据来确定模糊控制器的结构形式;采用可编程门阵列构造模糊控制器。由于远程康复系统现场站点需要一台微机作为接收远方的控制命令和处理来自摄像机的图像信息并通过Internet来传送信息,所以为了充分利用和节省资源,我们采用微机作为物理基础,编制相应的软件实现模糊推理和控制。
模糊控制的上位机软件设计主要就是模糊控制算法的设计和实现,同时也包括微机与单片机的串口通讯部分和与Internet接口部分的设计实现。其程序流程如图4所示。
该部分主要实现对信息采集系统的模糊控制功能。系统运行前,该上位机程序首先要进行初始化,设置串口,为系统正确运行做好准备。当远程控制命令通过Internet传送到现场站点的PC机,经过模糊控制算法的处理,再经串口将命令下达给单片机控制系统来执行。此控制过程不需要现场站点的人员来操作,完全采取远程控制,这样远程专家就能很方便地根据需要控制信息采集系统的运行,同时也方便了现地医师或病人家属,减少了由于远程专家和现地医师或家属的交流障碍而引起的操作错误[2]。
4 结 语
本系统利用模糊控制技术解决了对远程康复信息采集系统的远程智能控制,使位于远方的康复专家和辅助设计师能够通过Internet方便地遥控现地的信息采集系统以合适的方式和角度准确、实时地进行数据信息的采集,供诊断和辅助产品设计之用。试验证明,该控制系统达到了我们的设计要求,能够远程实时地进行三维视觉信息的采集。
参考文献
[1]Cooper R A,Fitzgerald S G,Boninger M L,et al.Telereha-bilitation:Expanding Access to Rehabilitation Expertise[J].Proceedings of the IEEE,2001,89(8):1 174-1 191.
[2]Lynch B.Historical Reviewof Computer Assisted CognitiveRetraining[J].Head Trauma Rehabil,2002,17:446-457.
[3]Rosen M J.Telerehabilitation[J].Neuro Rehabilitation,1999,12:11-26.
[4]Schatz P,Browndyke J.Applications of Computer-basedNeuro psychological Assessment[J].Head Trauma Reha-bil,2002,17:395-410.
[5]任郁苗.远程康复信息采集系统的模糊控制[D].西安:西安交通大学,2005.
[6]刘曙光,魏俊民,竺志超.模糊控制技术[M].北京:中国纺织出版社,2001.
[7]诸静.模糊控制原理与应用[M].北京:机械工业出版社,1995.
[8]闻新,周露,李东江,等.模糊逻辑工具箱的分析与应用[M].北京:科学出版社,2001.
[9]杨威.基于DSP的工程车四轮转向控制系统的研究[J].矿山机械,2006.34(9):48-50.
[10]王红梅,司癸卯,焦生杰.工程机械四轮转向控制系统研究[J].工程机械,2005,36(2):17-20.
农业信息模糊查询系统 篇5
随着信息产业的飞速发展,信息系统项目的合理性、有效性和实用性备受关注,信息系统风险评估成为信息化项目风险控制的重要组成部分。信息系统风险评估主要是通过严格的评价程序、科学的评价指标和客观的评价方法,对项目的实际绩效进行公正的评价,以促进信息资源的优化配置。
信息系统风险日趋复杂,风险评估重点也从起先的操作系统、网络环境扩展到整个宏观环境和管理体系。而确定评估要素之后,采用何种评估方法具有举足轻重地位。针对我国实际情况,信息系统风险评估工作主要依靠一些定性或定量的评估方法。定量评估方法是指运用数量指标来对风险进行评估,主要包括层次分析法、模糊综合评判法、BP神经网络法等。定性评估方法主要依据知识和经验分析系统情况并做出判断,包括安全检查表法、专家评价法、矩阵分析法等。以上方法各有利弊,如层次分析法简便实用,但受专家经验和知识限制,主观性强;BP神经网络法虽减少了人为主观因素影响,但是需要大量已知训练样本;安全检查表法简便易行,但检查表大多不够深化[1]。
本文针对评估信息的模糊性和灰色性,提出基于灰色模糊综合评判的信息系统风险评价模型,从定性到定量的综合集成方法。该模型建立评价指标递阶层次结构,给定评价因素集、评语集、评价因素权重集和评判矩阵,进行模糊运算,最后得到综合评价结果。在系统数据较少和条件不满足统计要求的情况下,该模型的实用性则更加突出。
1 信息系统风险评估指标体系构建
评估指标体系是指评估对象所涉及的各种影响因素的集合。国外发达国家已初步建立了信息系统评估认证体系,并陆续发布了一系列相关标准、指南和规范,如:BS 7799(ISO 17799)标准建立了信息安全管理体系文档,以及如何进行安全控制,但它仅提供原则性建议,如何与实际情况相结合等问题尚未涉及。SSE-CMM模型(Systems Security Engineering Capability Maturity Model,系统安全工程的能力成熟度模型)系统地解决安全工程的组织和实施等问题,不足之处在于过程域相对独立,不利于指导风险评估活动。OCTAVE(Operationally Critical Treat,Asset,and Vulnerability Evaluation,可操作的关键威胁、资产和薄弱点评估)方法既强调安全技术,又强调安全管理,但需要多人参与,评估流程比较繁琐。
目前,比较完整且可行的IT风险控制标准是COBIT(Control Objectives for Information and Related Technology,信息及相关技术的控制目标)标准。COBIT的设计是为了帮助管理者在不可预见的IT环境下对风险和投资控制加以平衡,获得安全可控的信息技术服务,并向内外部客户提供产品和服务,同时,审计人员可以使用该标准并向组织的内部控制管理提出建议。表1是COBIT在规划组织阶段对信息系统风险的评价和管理标准。
COBIT主要关注风险的控制目标和控制手段,因此需考虑风险管理的主体和义务、风险容忍程度、根本原因分析、定量或定性的风险测量等,概括起来分为三个部分:活动、流程和信息技术:
(1)活动:侧重于风险管理活动,参与人员应包括IT部门高管和IT服务的关键用户。此外,风险评估报告也很重要,它可以协助风险管理人员及时发现风险并采取科学合理的纠正措施。正规的风险评估文档要包括风险评估方法的描述、风险的披露和确认、未识别风险及相应披露。
(2)流程:主要是指风险评估的途径和步骤,简单地说,就是先发现风险再拟定修正方案。已发现和尚未发现的风险应在风险评估报告中都应有所体现。制定修正方案是为了确保已发现的风险的负面影响要控制在可容忍程度内。
(3)信息技术:可以协助风险的测量和确认,但不恰当的信息技术同样会带来风险,譬如互联网环境下的信息安全漏洞会让用户面临信息泄露的风险,这就要求风险评估应把信息技术作为对象之一。高质量的信息系统既可以实现IT目标,又能够保护IT资产。
通过实施COBIT标准的信息系统风险评价和管理,可以增强管理人员对风险控制的感知,风险管理工作实现系统化和量化,实施难度大大降低。另外,COBIT模型实现了企业战略与IT战略的互动和融合,形成了持续改进的良性循环机制,为企业提供了具有参考价值的解决方案,从而有效降低和规避风险。
2 信息系统风险评估的灰色模糊综合评价模型
2.1 信息系统风险评估的模糊性和灰色性
所谓模糊性,是指客观事物在归属和状态上的不分明性。在评价过程中,信息系统越复杂,模糊性越大;评价因素越多,综合评判就越模糊。此时,模糊数学方法可以弥补统计数学的不足。
所谓灰色性,就是“认识的不完全性”或“未确定性”。信息系统风险研究中的很多因素很难用确切的数学语言来描述,这些信息是不完全的,不确切的,也就是说,评价信息是灰色的。
信息系统风险评估中这两个特性都存在,那么将模糊性和灰色性同时考虑是合理的,这比只考虑其中之一更能反映客观实际。因此本文将信息系统风险评估与模糊性和灰色性同时联系起来。
2.2 模型的理论基础[3]
灰色系统理论是从信息的非完备性出发,研究和处理复杂系统的理论。它对系统某一层次的观测资料加以数学处理,在更高层次上了解系统内部的变化趋势、相互关系等。
模糊数学以“模糊集合”论为基础处理不确定性问题,是描述人脑思维处理模糊信息的有力工具。模糊集合不是简单地扬弃概念的模糊性,而是尽量如实地反映人们使用模糊概念时的本意。
从定位到定量的综合集成方法是将有关专家意见、数据和信息与计算机有机结合起来,把科学理论和人的知识结合起来,构成了一个系统。此方法的成功在于发挥这个系统的整体优势和综合优势。
2.3 灰色模糊综合评判
根据评价因素的特点,灰色模糊综合评价方法在考虑专家评判信息的不完全性的同时,利用灰色聚类理论得到灰色统计量,进而构造出灰色模糊矩阵,最后采用灰色模糊算法测算出信息系统的风险大小。建模具体步骤如下:
(1)建立递阶层次评价因素集。评价因素集是信息系统风险因素的集合。设评价因素集为U={U1,U2,…,Un}。评价因素很多时,由于归一性,权重值必然很小,这会弱化权重值较小的评判因素作用,因此将众多因素按某些属性分成几类,先对每一类各因素综合评判,然后在各类之间进行高一层次综合评判,就形成了递阶层次风险评估指标体系,见表1。
(2)建立评语集。评语集是各种风险评价结果的集合。设风险评语集为0~1,见表2。
(3)建立评价因素权重集。评价因素权重集表示各评价因素与风险之间的灰色模糊关系,即各因素关于上一层准则的权重和灰度。设评价因素权重集=[(a1,v1),(a2,v2),…,(an,vn)],其中ai称为的模部;vi称为的灰部。各权重值ai满足归一化要求,即。
由于信息量很难用数值来衡量,所以,使用一些描述性语言来对应一定的灰度范围,如按信息的充分和明确程度分成以下几类:{很充分,较充分,一般,比较贫乏,很贫乏},分别对应灰度值{0~0.20,0.21~0.41,0.41~0.60,0.61~0.80,0.81~1.00}[4]。
(4)确定评判矩阵。评判矩阵表示评价因素集与评语集之间的灰色模糊关系,即评价因素对评语集中各元素的隶属度和灰度。设评判矩阵:
其中:uij为隶属度,表示模糊关系,应归一化处理,即为灰度,表示灰色关系。
(5)进行综合评判。模部运算采用代数积算子M(·,+),灰部运算采用有界积M(⊙,+)算子。灰色模糊评判结果为:
(6)评判结果处理。灰度描述信息的不充分和不可信程度,因此,可以将评判结果转化成三参数区间数集合形式:
然后,对各区间数进行排序,具体方法如下:[5]
设两个三参数区间数;cl,cu为的取值边界,c*为其中取值可能性最大的数值,用分布函数fc(x)表示在其余各点取值可能性的大小,且,fc(x)的最简单形式是一次线性函数;对亦然。当cl=dl,c*=d*,cu=du同时成立时,则。不妨设,记大于的可能性为。对中各区间数按照上述方法两两比较,排序可能性矩阵为:
其中:pij表示第i个区间数大于第j个区间数的可能性大小。通过此矩阵可以看出两两方案的比较结果,然后按照是否pij≥0.5进行排序。
灰色模糊综合评价方法用灰度来表示和衡量评判结果的可信性,较高的灰度可以证明评判等级的真实性,帮助决策者进行科学判断,而较低的灰度则表示评判结果存在不合理性,应重新度量。由此可见,灰色模糊综合评价方法比模糊综合评判方法更加合理科学。
3 算例
某物流公司计划实施信息系统项目,邀请多位专家和教师进行风险评估。表1表示评价因素集,表2表示评语集,表3是用专家意见(Delphi)法得到的评价因素权重集和评判矩阵,其中一、二、三级指标的灰度分别为0.30、0.20和0.10。
由灰色模糊算法得:
同理可得={(0.046,0.150),(0.192,0.150),(0.303,0.150),(0.078,0.150)};而b3参数区间为[0.258,0.305,0.348],b4参数区间为[0.324,0.381,0.438],则b3和b4的参数区间有重叠。
得:fc(x)=-540.83x+188.21
排序可能性矩阵:
因此风险等级为“微小”。此时公司领导会对此项目充满信心,该项目可以获得大力支持并取得理想效果。
若用模糊综合评判方法,得B={0.046,0.192,0.303,0.381,0.078},评判结果可能为b4所属的风险等级“微小”。又,,则最终评判结果B为b3所属的风险等级“一般”[6]。此时,公司领导会对此项目持犹豫和怀疑的态度,非常有可能取消该项目。
由上可见,灰度值和排序可能性矩阵有助于决策人员正确理解综合评判信息的可信度,做出科学决策。
4 结束语
本文从风险控制和管理角度确定信息系统风险评估指标体系,将灰色模糊综合评判方法应用于风险等级计算;这一方法是针对评价过程的非线性特点而提出的,利用模糊数学中的模糊运算法则和灰色聚类理论进行量化综合,从而得到可比的量化评价结果。
信息系统项目许多因素具有不确定性,只用风险发生概率和损失强度来确定风险期望损失,掩盖了风险特征,易导致错误和偏差。灰色模糊综合评判信息系统风险的方法针对风险和评判信息的模糊性和灰色性,不仅得到了信息系统风险等级,同时也说明其相对可信程度,为用户评估风险等级,发现主要风险因素,实施风险内部控制和管理提供了有效方法和途径,有利于及早明确信息系统项目建设的主要风险并采取针对性措施,以达到成功降低和防范风险的目的。
摘要:针对信息系统风险的信息不完全性和概念不明确性的特点,从风险控制角度构建一个递阶层次结构的风险评估指标体系。以灰色系统理论、模糊数学和从定性到定量的综合集成方法为理论基础,建立灰色模糊综合评判模型;并采用灰色模糊算法计算信息系统项目的风险等级,最后借助排序可能性矩阵对评价结果进行修正。通过算例分析可知,该模型的实验结果更客观。
关键词:风险评估,指标体系,灰色模糊综合评判,信息系统项目
参考文献
[1]刘向升、程卫民、匡开宇、杨发喜、王刚:《信息系统的风险评估方法研究》[J];《网络安全技术与应用》2006(11):33。
[2]ITGI.COBIT4.1[EB].www.itgi.org,2007:64-66.
[3]徐维祥、张全寿:《一种基于灰色理论和模糊数学的综合集成算法》[J];《系统工程理论与实践》2001(4):114-115。
[4]陈雯、张强:《第三方物流客户服务绩效的灰色模糊综合评价模型》[J];《模糊系统与数学》2007(4):151。
[5]卜广志、张宇文:《基于灰色模糊关系的灰色模糊综合评判》[J];《系统工程理论与实践》2002(22):141-144。
农业信息模糊查询系统 篇6
随着信息系统的建设与发展, 信息系统的安全问题变得越来越严重, 信息系统安全技术的研究已经成为信息技术研究的一个热点, 安全性也成为一个信息系统的重要特性和重要评价指标之一。我国各界人士也越发意识到信息系统安全的重要性。1994年国务院颁布的《中华人民共和国计算机信息系统安全保护条例》第9条规定“计算机信息系统实行安全等级保护。安全等级的划分标准和安全等级保护的具体办法, 由公安部会同有关部门制定。”等级保护的核心是对信息系统特别是对业务应用系统安全分等级、按标准进行建设、管理和监督。
等级保护过程中评价标准在信息系统安全评估过程中的指导作用不容忽视, 而在评估过程中使用何种方法, 使评估结果更具科学性和准确性也同样重要。评估方法的选择直接影响到评估过程中的每个环节, 甚至可以左右最终的评估结果。信息系统安全等级评估的方法有很多种, 概括起来可分为三大类:定量的评估方法、定性的评估方法和定性与定量相结合的评估方法。本文采用模糊综合评价法, 该方法基于模糊数学的思想, 是一个定量和定性相结合的评价方法, 考虑被评判事物相关诸多因素, 通过正确分析评价, 并对该事物做出总的评价。模糊综合评价方法的使用在一定程度上克服了评估时由于主观因素造成的误差, 并且能很准确的评估出系统的安全程度。
1 模糊综合评价思想
模糊综合评价是一个通过专家打分, 设置权重, 将多因素评价问题转换成单因素评价问题, 并可以实现多层次评价的方法。
1.1 建立多层次多因素评价指标体系
评价指标体系是指评价对象所涉及到的各种影响因素的集合。建立评价指标体系时, 要实现指标与评价目标的一致性、同体系内指标的相容性、各评价指标相对独立性的原则, 并按照可测性、完备性和可行性的原则进行设计。评价指标体系的变量设置不宜过多, 否则使评价与计算的工作量变得过大, 但同时要保证主要影响因素没有被遗漏, 做到可行性与完整性的结合。
设总评价因素集合为S={S1, S2…, S10}其中 (见表1) :S1:物理安全;S2:网络安全;S3:主机安全;S4:应用安全;S5:数据安全及备份恢复;S6:安全管理制度;S7:安全管理机构;S8:人员安全管理;S9:系统建设管理;S10:系统运维管理。
设各子评价因素集合S1={S11, S12…, S110}为二级指标, 其中 (见表2) :S11:物理位置的选择;S12:物理访问控制;S13:防盗窃和防破坏;S14:防雷击;S15:防火;S16:防水和防潮;S17:防静电;S18:防湿度控制;S19:电力供应;S20:电磁防护。同理S2, S3, S4, S5, S6, S7, S8, S9, S10也可以得到。
每个评价子集具有不同的评价项目, 以S12:物理访问控制为例给出说明, S10={u1, u2, u3, u4}:
u1:机房出入口应有专人值守, 鉴别进入的人员身份并登记在案;
u2:应批准进入机房的来访人员, 限制和监控其活动范围;
u3:应对机房划分区域进行管理, 区域和区域之间设置物理隔离装置, 在重要区域前设置交付或安装等过度区域;
u4:应对重要区域配置电子门禁系统, 鉴别和记录进入的人员身份并监控其活动。
因此, 信息系统等级保护安全评测是一个具有三级指标的评价体系。
1.2 建立评价因素权重集合
上述每个层次的因素在进行评估时, 各因素在该层评价体系中所起作用大小和所占地位轻重的量度, 称为权重。权重以矩阵的形式表达为F={a1, a2, …, am}, 其中ai表示权重, 满足且。
求权重是综合评价的关键, 通常根据经验设置权重的方法可能出现主观偏向性误差, 本文选用一种定量和定性相结合的方法, 即层次分析法解决这个问题。该方法首先对评价各因素进行两两比较, 初步形成权重比, 由于要对众多因素比较, 还必须使权重比保持一致, 难度很大, 甚至要求有点太苛刻, 因此, 可以确定这种不一致的允许范围, 但是前提是此前相应矩阵要进行必须的一致性检验。层次分析法是一种行之有效的确定权系数的方法, 特别适宜于那些难以用定量指标进行分析的复杂问题。它把复杂问题中的各因素划分为互相联系的有序层, 使之条理化, 根据对客观实际的模糊判断, 就每一层次的相对重要性给出定量表示, 再利用数学方法确定全部因素相对重要性次序的权系数, 在一定程度上克服了其设置权重的主观偏向性误差, 由此方法得出测评指标体系结构图, 如表1、表2。
1.3 建立评语等级集合
指标的测量采用李克特量表的方法, 利用语义学标度分为五个测量等级:好、较好、一般、较差、差。设V={v1, v2, v3, v4, v5}={好, 较好, 一般, 较差, 差}为评语等级集合。为了便于计算, 这里将主观评价的语义学标度进行量化, 并依次赋值为5、4、3、2、1。主观测量是用五级语义学标度, 所设计的评价定量标准见表3。
1.4 进行单因素评价
测评组专家对每个测评项从评语集合中选择一个评语作为个人的评价结果, 运用模糊统计的方法将参与评价的各位专家按定义的评价集V={v1, v2, v3, v4, v5}给各测评项 (评价因素) 划分评语等级, 并依次统计各评价因素uij属于各评语等级vj (j=1, 2, 3, 4, 5) 的频数mij, 记rij=mij/n (n为专家的数量) 。
则rij表示评价因素uij隶属于vj (j=1, 2, 3, 4, 5) 等级的程
度;又记, 所以Ri构成了评价集合上的一个模糊集合, 所有的测评项 (因素) 构成一个模糊关系矩阵R。如果以第一层S12={u1, u2, u3, u4}为例, 则
1.5 模糊综合评价
在每个层次上综合考虑各因素在评语集合上的所得结果, 则称为综合评价。例如, 以第一层为例S12, 则有:
2 应用实例
下面以S12:物理访问控制的评价过程为例来说明模糊综合评价的方法。
对于第一层S12评价中, 由评价因素集S12={u1, u2, u3, u4}和V={v1, v2, v3, v4, v5}评语集得到单因素评价集如下:
u1=机房出入口应有专人值守, 鉴别进入的人员身份并登记在案:
u2:应批准进入机房的来访人员, 限制和监控其活动范围:
u3:应对机房划分区域进行管理, 区域和区域之间设置物理隔离装置, 在重要区域前设置交付或安装等过度区域:
u4:应对重要区域配置电子门禁系统, 鉴别和记录进入的人员身份并监控其活动:
则有
通过层次分析法得出权重为:
模糊综合评价如下:
归一化为
B12= (0.24, 0.24, 0.28, 0.16, 0.08)
综合评价表明, 该信息系统在物理访问控制方面, 评价好的比例为0.24, 较好的比例为0.24, 一般的比例为0.28, 较差的比例为0.16, 差的比例为0.08;采用李克特量表的方法, 好-5, 较好-4, 一般-3, 较差-2, 差-1, 则该信息系统在物理访问控制方面得分为:
因为2.5
研究表明, 在实施对信息系统安全等级的管理和监察中, 采用一个科学、合理和可操作的评估方法是一项非常重要的工作。当然, 盲目的选择测评工具而忽视评估指标的系统分析, 是当前评估工作中需要解决的问题。
参考文献
[1]GB17859-1999.计算机信息系统安全保护等级划分准则[S].
[2]信息系统安全等级保护实施指南-送审稿 (修订版) Vl.1.2006.
农业信息模糊查询系统 篇7
当前, 高校新生信息录入工作过程长, 信息量大。借助相关软件虽可解决部分问题, 但仍存在数据录入效率低、准确性不高的问题。如何提高新生信息录入效率, 进一步提高信息录入准确率, 已成为广大辅导员与班主任关注的问题。本文应用语音技术, 介绍基于模糊ISODATA的方言识别系统及学生信息系统以及学生信息系统的构建, 提出一种采用语音录入新生信息的方法。
1 模糊ISODATA算法
设被分类对象集合x={x1, x2, x3, …, xn}, 其中每个样本xi均有m个特性指标, 即xi={xi1, xi2, xi3, …, xim}, 将样本u分成c类 (2≤c≤n) , 设c个聚类中心向量为
为获得一个最佳的模糊分类, 需使以下目标函数取得最小值[1]:
其中rik∈[0, 1]表示第k个数据在第i类里的隶属度。vi表示第i类聚类中心, i=1, 2, …, c;q为加权指数, q∈[1, ∞) ; (dik) 2=‖xk-Vi‖2, 表示样本xk与聚类中心向量Vi的距离, 在具体应用中有多种常用的距离计算方法, 本文采用广义欧式距离[2]。
文献[3]指出, 使J (R, V) 为最小时的rik值及Vi值为:
运用迭代运算, 可求出最佳分类, 过程如下:
(1) 选定分类数c, 2≤c≤n, 它表示振动故障之间的接近度, 取一初始模糊分类矩阵R (0) ;
(2) 对于R (0) , 计算聚类中心向量
其中
(3) 修正模糊分类矩阵R (0) :
(4) 比较R (h) 与R (h+1) , 若对取定的e>0, 有max{‖rvk (h+1) -rvk (h) ‖}
以上算法得到的模糊分类矩阵R (h+1) 和聚类中心V (h) 是相对于分类数c、初始模糊分类矩阵R (0) 、误差e和加权指数q的最优解。
由上述方法获得的最优解是相对于某一分类数c、初始模糊分类矩阵R (0) 、误差和加权指数q而言的, 若调整c、R (0) 、q, 则可以得到许多局部最优解。要想从这些最优解中选出最佳解, 可以用分类系数Fc (R) 和平均模糊熵Hc (R) 来判别。
(1) 定义分类系数
(2) 定义平均模糊熵
文献[3]指出, 分类系数F越接近1, 平均模糊熵H越接近于零, 表示聚类效果越好。
2 语音识别技术
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高新技术。语音识别是一门交叉学科。近几十年来, 语音识别技术取得显著进步, 开始从实验室走向市场。预计未来10年内, 语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。清华大学对语音识别的研究成果处于世界领先水平。根据学生信息系统业务的特点, 本文结合ISODATA算法, 组织搭建了方言识别系统。再利用微软语音识别引擎, 语音识别应用程序接口SAPI, 完成了学生信息系统中语音识别的功能。
3 基于ISODATA模糊聚类方法的方言识别系统设计
汉语方言分类方法较多。使用方言或略带方言的普通话录入信息时难免产生语音识别结果的误差。为了将这种误差减至较低水平, 学生信息系统在进行具体的语音识别前, 增加了一个环节:语音录入人员的方言识别。
3.1 汉语方言分类
目前, 对汉语方言分类较为普遍的分类方法是将其分为六类或七类。本文以分成6类为例, 这六类即:吴方言、闽方言、粤方言、客赣方言、湘方言及官方方言[4]。
3.2 语音识别技术中常见参数
目前, 语音识别技术中, 常用到的参数有:基音周期、短时频谱、短时自相关函、短时能量、短时平均幅度、短时过零率、倒谱及线性预测编码[5]。
3.3 方言识别流程和系统结构
方言识别系统设计如图1所示。系统从前台获取语音数据, 并不立即做语音匹配。而是先利用其子系统ISODATA方言识别系统进行方言识别。系统从前台获取语音数据, 经特征提取, 得到相应语音特征数据结构。将特征数据与方言特征值做ISODATA分类, 取分类数等于方言种类数, 本例中方言种类数是6, 即分类数c取6。经归类, 若所获取语音特征值与某一种方言的特征值归于一类, 则可判定该语音为此类方言。若该语音与超过一种方言归于一类或不与任一种方言归于一类, 则从方言语音数据库中更换一套方言语音特征值数据, 再与其做ISODATA分类, 直至分类次数大于预先设定的最大分类次数MAX, 或着所获取语音特征值与某一种方言的特征值归于一类。本例中取最大分类次数设为3。若不能识别出方言类型, 则依次与各方言数据库匹配。其中, 方言语音特征数据库的确定依据是数字语音专家知识。模糊ISODATA方言识别系统工作流程如图2所示。
4 基于ISODATA模糊聚类方法的方言识别信息系统
基于ISODATA模糊聚类方法的方言识别系统的学生信息系统结构如图3所示。基于SOA架构, 系统分为用户环境、业务服务管理器及业务服务层三大组成部分。
(1) 用户环境:供用户登录、使用学生信息系统的各项功能。
(2) 业务服务管理器:业务服务管理对学生信息系统的各项业务进行了管理, 并与用户环境和业务服务层通信。语音识别系统负责将语音信号识别送入业务管理层。方言识别系统是语音识别系统的子系统。
(3) 业务服务层:业务服务层包含用户数据库, 学生信息系统业务及与外系统的接口。
5 结束语
本文提出了基于模糊ISODATA分类的方言识别技术在学生信息系统中的应用, 建立了高校学生信息系统。初步实验表明, 基于ISODATA算法的方言识别系统可较大程度地避免信息录入工作人员存在的地方口音对语音识别的影响。与传统学生信息系统相比较, 该学生信息系统在新生信息录入的效率和精确率上均有了较大幅度的提高。系统若能增强语音识别功能, 拓展语音业务, 并将系统识别过的语音添加进相应数据库, 将进一步提高系统语音识别的效率及精确率。
参考文献
[1]钱夕元, 邵志清.模糊ISODATA聚类分析算法的实现及其应用研究[J].计算机工程与应用, 2004 (15) .
[2]李世勇.工程模糊数学及应用[M].哈尔滨:哈尔滨工业大学出版社, 2004.
[3]吴慧英, 帅仁俊.汽轮发电机组转子振动故障的模糊聚类分析[J].上海交通大学学报, 1999 (8) .
[4]李小凡.汉语方言分区方法再认识[J].方言, 2005 (4) .