专家分类

2024-06-17

专家分类(精选5篇)

专家分类 篇1

前言

遥远的感知, 解释为运用现代光学、电子学探测仪器, 不与目标物相接触, 从远距离把目标物的电磁波特性记录下来, 通过分析、解译揭示出目标物本身的特征、性质及其变化规律。遥感技术的特点归结起来, 主要有三点: (1) 涉猎范围广, 可以进行大范围探测, 精准高效。 (2) 高光谱、高分辨率, 可以满足大多数研究要求。 (3) 多分辨率影像结合, 从不同角度描述问题。 (4) 全天候, 高时间分辨率。 (5) 斜视、立体观测等全方位观测。遥感技术是目前国土资源调查中最常规的方法, 很多方面也是其他技术无法比拟的。

土地覆盖研究是关系全球生态建设、经济建设、民生建设的重要组成部分, 也是现阶段遥感技术研究的重点。随着科学技术的发展, 遥感技术的应用使得地表覆盖类型的研究从人工解译发展到计算机解译。遥感影像通常是通过像元的亮度值和灰度值来反应地物的空间差异。遥感影像解译是利用计算机来分析不同地类的光谱特征和空间信息, 按照一定的规则来划分影像。早期应用最多的人工解译, 工作量大, 比较耗时, 但是精度却是最高的。李英利[9]等利用XML的简洁和灵活特性, 将高分影像目视解译为乔木林、灌木林、绿化林地、人工那个幼林等十多种类型。接下来是基于光谱的计算机自动分类, 是人们根据不同的亮度值将地物进行分类, 常用于中等分辨率大范围的分类。李素[10]结合南京市的具体情况, 利用中等分辨率遥感影像, 通过混合相元分解获取亚相元尺度上土地覆盖组分丰富度图像。基于专家知识树的决策树分类, 除了可以利用光谱信息之外, 还可以结合其他遥感影像源, 比如DEM、土地规划图。Paul V.Bolstad[11]在TM数据基础上加上地质地形专题信息, 提高了土地利用分类精度。针对高分辨率影像发展的面向对象特征提取, 是利用影像分割与合并技术, 来充分利用高分辨率影像的优势。孙艳霞[12]应用均值方差法、最大面积法方法, 结合理论研究理念, 获取高分影像的最优分割尺度, 采用面向对象方法进行分类, 为高分分类可行性提供依据。地物的识别与地表的反演, 主要利用微量元素来反演, 由于肉眼无法判断某种元素含量多少, 比如地表温度、水体叶绿素、土壤重金属含量等, 可以通过不同波段繁衍出含量, 进而做变化检测。黄金国[13]等对鄱阳湖叶绿素a浓度进行反演, 得出BP网络反演模型试验精度高于统计回归构建遥感反演模型。地形信息提取, 利用光学影像可以从立体像对中提取出地形信息。本文, 主要介绍通过DEM数据和TM数据结合, 来分类山地植被, 区分陡坡和缓坡、朝南和朝北。

1. 研究区概况及图像预处理

本文选取詹姆斯敦的一小块山体作为研究区, 詹姆斯敦以山地为主, 全境只有一条街道, 山体走势明显。从USGS上下载TM影像和DEM数据, 均为30m分辨率。TM数据具备较高空间分辨率, 可以满足一般地物信息提取。王建平[14]等人用TM卫星影像反演悬浮物、CODMn、溶解氧、总磷、总氮和叶绿素浓度, 反演结果相对误差在0.25左右。本文对TM影像多光谱信息进行预处理。

辐射校正是指对由于外界因素, 数据获取和传输系统产生的系统的、随机的辐射失真或畸变进行的校正, 消除或改正辐射误差而引起的影像畸变的过程[1]。图像滤波是一种图像增强的一种方法, 目的是提取和突出图像空间信息, 压抑或去除无用的信息[2]。

2. 决策树规则定义

基于知识的决策树分类是基于遥感影像数据及其他空间数据, 通过专家经验总结、简单的数学统计和归纳方法等, 获得分类规则并进行遥感分类[3]。分类规则易于理解, 分类过程也符合人的认知过程, 最大的特点是利用的多源数据。规则定义有两种方法, 经验总结和样本统计。刘晓娜利用TM和Modis数据, 提取了中缅交接处的橡胶树, 并分析其生长情况[7]。吴健生运用QUEST决策树方法得出, 在地形复杂的山地地区, 针对TM影像数据, 选择基于QUEST决策树分类能够有效提高土地利用分类结果精度[8]。

根据研究区域现状, 将地表覆盖类型分为水体、裸地、无数据和背景、缓坡植被、陡坡朝南植被、陡坡朝北植被。根据遥感影像结合谷歌地球, 均匀选取影像上的水体、裸地、缓坡植被等样本, 通过分析样本光谱信息, 总结如下:根据ndvi区分植被和非植被, 当ndvi小于等于0.3时, 为非植被, 大于0.3时为植被;由于多光谱数据的第四波段, 近红外波段, 处于水体强吸收区, 用来区分水体和裸地及背景。根据研究区具体情况, 当b4大于0小于20时, 判为水体, 大于等于20时, 判为裸地;等于0时, 判为背景。结合DEM数据, 坡度大于等于20时, 为陡坡, 小于为缓坡。坡向大于90小于270时, 为朝南, 其次为朝北。决策树构建如图1所示。

3. 分类结果

按照规则, 对影像进行分类, 结果如下图2左图所示。可以明显看到, 随着山体走势, 植被的颜色变化。浅绿色为缓坡植被, 深蓝色为朝南陡坡植被, 深绿色为朝北陡坡植被。运用envi的3D查看效果, 可以旋转观察山体植被分布, 截取一部分如下图2右图所示。山体植被分布较多, 占总研究区的百分之三十以上, 陡坡朝南植被比朝北植被数量多。

4. 总结

决策树分类方法, 是基于二叉树分支的思想, 将不同的地物一层一层, 按照特性不同, 分离开来。与研究人员对地物的了解程度紧密相连, 根据不同波段的组合, 进行实验验证, 最终得出结论。本文根据ndvi大小, 比较精确的区分了山体植被的缓坡与陡坡, 朝南和朝北。并充分利用DEM的立体特性, 展示地貌的三维状况。在以后的研究中, 可以考虑结合高分数据, 综合利用多种分类方法, 来提高分类精度。也可以在分类算法和波段组合方面进行更深入的研究, 达到提高分类精度的目的。

参考文献

[1]陈趁新, 胡昌苗, 霍连志, 等.Landsat TM数据不同辐射校正方法对土地覆盖遥感分类的影响[J].遥感学报, 2014, 18 (02) :320-334.

[2]周雨薇, 陈强, 孙权森, 等.结合暗通道原理和双边滤波的遥感图像增强[J].中国图象图形学报, 2014, 19 (02) :313-321.

[3]钱育蓉, 于炯, 贾振红, 等.基于决策树的典型荒漠草地遥感分类策略[J].西北农林科技大学学报:自然科学版, 2013, 41 (2) :159-166.

专家分类 篇2

植物分类学是一门有着悠久历史的学科。几千年来, 人们在生活和生产实际中, 观察了植物的形态与结构, 植物的生活习性, 并加以比较, 找出其共同点和不同点, 把它们分成不同的种类。植物分类学不仅要识别物种, 鉴定名称, 而且还要阐明彼此间的亲缘关系, 研究物种的起源、演化过程和趋向, 因此它是一门既有实用价值, 又富有理论意义的基础科学, 在开发和利用植物资源上起着重要的作用。

由于植物种类繁多, 分类系统非常庞大, 应用工具书查找检索分类非常复杂, 书籍多种版本, 一般非专业人员很难进行分类。本文提出了基于产生式规则的植物分类专家系统, 不仅能帮助人们快速、准确地识别植物种类, 而且为进行植物分类的用户提供了一个专家水平上的咨询信息, 使专家知识成为人类共同的财富, 从而普及和掌握植物分类知识, 最终对植物资源进行开发和利用。

1. 植物分类的方法

植物分类学是研究植物进化过程及其在自然中位置的一门科学, 那么植物分类学不可避免地成为一门既有本身特色又吸收其他各门学科的综合性学科。植物分类学相关的学科很多, 包括形态学, 解剖学, 地理学, 古植物学, 孢粉学, 遗传学, 细胞学, 化学, 血清学, 统计学等等, 植物分类学正是吸收了各个学科的最新成果将其综合后形成的学科。

植物种类繁多, 在我国仅高等植物就有35000多种。为了分类各植物类群, 人们根据植物类群范围大小和等级高低给它一定的名称, 这就是分类的等级单位。了解和掌握分类的等级单位是分类学必须具备的基本知识。植物分类学设立了多种分类等级和单位。将庞大的植物种类, 按其亲缘关系远近形成分类系统, 分类学上是以"种"作为基层等级或基本单位的, 同一种植物, 以它们特有的相当稳定的特征与相似的"种"区别开来。把彼此近似的"种"组合成为"属", 又把相似的"属"组合成为"科", 依据同样的原则由小到大最后归于植物界。

按照国际植物命名法规的缩写, 有关绿色植物命名 (包括真菌) 共包括以下主要分类阶元:门、纲、目、科、属、种、变种和变型。

2. 专家系统的组成

专家系统是一种智能计算机程序, 使用知识与推理过程解决十分困难的问题。它一般由知识库、推理机和人机接口等组成。

(1) 知识库:它存储从专家那里得到的专门知识, 是专家所积累经验的信息数据库, 专家系统就是基于知识库中所存知识的智能系统。该知识库中包括事实和经验两种数据

(2) 推理机:这是专家系统的核心部分, 它具有很强的推理能力, 能够根据知识库中的知识推导出一定的结论;能够执行各种任务, 进行各种推理或搜索等功能。正是由于这一能力, 使得专家系统不同于一般的进行简单储存知识的资料库。

(3) 人机接口:专家系统与用户之间基于声音、文本、图画、影像等的接口, 它把获得的信息或命令进行识别, 同时把产生的结果传递给用户, 不同专家系统接口的复杂程度可能差别很大。

(4) 解释程序:它可解答用户对专家系统的行为询问, 并能对推理结论解答"为什么"、"如何"等一系列针对性的问题, 同时还可对知识库或推理机进行调试。

(5) 知识获取接口:这个接口具有对知识库进行知识补充、编辑增删等操作的功能, 技术要求较高。

(6) 综合数据库:相当于数学中"黑板"的功能, 用于暂时存放推理过程中产生的中间结果或事实等, 必要时还可超过用户, 补充相关知识。所以此库中的知识是处于动态中的, 而知识库中的知识则是相对静态的。

上述各组成部分的工作联系如图l所示:

3. 基于产生式规则的植物分类专家系统

3.1 植物分类的层次模型

根据植物分类的等级关系, 抽象出植物分类的层次模型。层次模型的前后之间具有继承关系, 即上一层分类结果是下一层分类的必要条件。

植物是按着植物体及其各个器官的结构、特征、性状、质地分类的, 因此将植物性状与植物种属之间抽象出一种对应关系TZ模型。设TZ表示一种T到Z的关系。即TZ={<Ti, Zj>丨Ti∈T, Zj∈Z}, 它表示分类集合T中的一个元素与性状集合Z中的一个子集的对应关系。其中T是分类集, Z是性状集。下面给出两个TZ关系实例:

TZ1: (绣线菊属) , [单叶, 骨突果1-2个]

TZ2: (珍珠梅属) , [羽状复叶, 骨突果5个]

3.2 产生式规则的知识表示

根据植物分类知识的结构特点, 采用产生式规则的知识表示方法。这种表示方法自然、简单, 精确、又容易存取, 具有较好的表达形式, 易于修改维护。

植物分类知识库的表示如下:

3.3 专家系统的设计

专家系统的建立一般有知识获取, 知识表达的选择、专家系统的建立三个步骤。一般情况下, 植物分类方面的专家不是开发专家系统的计算机工程师, 所以在知识获取这一环节中, 工程师与专家间一定要事先沟遇, 使工程师存储在计算机中的知识能正确表达出专家的意见, 这是建立一个成功专家系统的前提。在知识表达选择中, 可根据专家系统设计的方法进行。

在基于产生式规则的专家系统中, 有一个用来构成系统的知识库形成规则集, 在植物分类专家系统中, 可以为每一种植物建立一个产生式规则, 规则头是植物名称的断言, 而规则则是体现这种植物所具有的特征。

在知识库的设计中, 将各种知识以具体植物种类为单位整合成一个模块, 如对植物分类这一对象来说, 可将相关的判断性、经验性、控制性等知识装入某一模块中, 则知识库中就有许多相对应的模块。同时, 在专家知识或用户需求发生变化时, 只需对某一模块进行修改即可。

在植物分类专家系统的推理机中有一个解释程序, 用以选择和激活各模块, 解释程序的工作可分为三步, 首先用知识库中的数据元素和规则模式进行分配;如果可被激活的规则等大多于一个, 则运用冲突消解策略选择一个规则;再利用选定的规则找出植物分类的结果。

3.4 专家系统的实现

植物分类专家系统的实现, 依赖于计算机一定的前台语言和后台系统的支持。程序设计语言是开发专家系统的最基本工具。其中, Lisp和Prolog这两种人工智能语言常用来开发专家系统, VB、DEPHI等也是构造专家系统的常用语言。而后台的操作平台在现行的Window 2000、XP系统中均可实现。

在植物分类专家系统中, 产生式规则的数目决定了知识库的规模, 植物种类繁多, 系统初始实现时可先对一个地区、一个省份的植物种类进行设计, 然后再逐步扩展到更大范围, 在知识库中添加更多的规则, 使得植物分类专家系统得以扩展完善。

4. 小结

本文首先对植物的分类方法和专家系统进行了详细阐述, 设计了植物分类的层次模型, 提出了基于产生式规则的植物分类专家系统的设计方案。该系统的采用将使得植物分类的结果更加准确、高效, 具有一定的工程应用价值。

摘要:本文首先阐述了植物分类的方法和专家系统的组成, 在植物性状与种属之间的对应关系的层次模型基础上, 采用了基于产生式规则的植物分类知识表示, 提出了植物分类专家系统的设计方案。该系统的使用将使得植物分类结果更加准确、高效, 具有一定的工程应用价值。

关键词:产生式规则,专家系统,植物分类

参考文献

[1].胡伟, 李霞等.基于专家系统和神经网络集成的植物智能分类系统[J].宜宾学院学报, 2005, 12:69-72.

[2].罗燕琪, 陈雷霆.专家系统中知识表示方法研究[J].电子计算机, 2001, 4:25-31.

[3].王正军, 程家安等.专家系统及其在害虫综合治理中的应用[J].江西农业学报, 2000, 12 (1) :52-57.

[4].杨珺.基于虚拟植物生长模型的分布式农业专家系统研究[J].微电子学与计算机, 2006, 23 (A) :229-230.

[5].蔡自兴, 徐光佑.人工智能及其应用.北京:清华大学出版社, 2003

专家分类 篇3

核电领域的知识比较专业, 而且涉及的知识方向比较多, 也比较深入。正因为如此, 核电企业中往往会有些对核电相关各个领域的专家, 而其他的员工则对相关领域的了解不是那么的深入和透彻。对于对某个领域比较了解的专家用户来说, 可以很快速地通过搜索引擎查询、定位到自己专业领域的知识;而对于普通用户来说, 往往不能很准确地描述自己所要搜索的内容, 或者不能从搜索结果中迅速找到比较有价值的, 自己所需的内容。因此, 普通用户使用搜索引擎时对于关键词的盲目性比较大, 搜索到自己所需内容准确率比较低, 效率也比较低。

为了解决普通用户使用搜索引擎查询时效率低下的问题, 提高知识在企业中的共享速度, 可以在普通用户输入关键字进行搜索时, 提供与该关键字相关领域的专家用户的浏览记录推荐给普通用户进行使用。由于专家用户在某些领域的专业性和权威性, 他们比普通用户更能够快速地从搜索结果中找到有价值的信息进行浏览, 这些信息对普通用户来说有很重要的参考价值。

一﹑分众分类研究

分众分类又叫做“通俗分类法”、“大众分类法”、“民众分类法”、“自由分类法”[1,2], 英文为Folksonomy, 是由Folks和Taxonomy组合而创造出的新词汇, 由Tomas Vander Wal于2004年提出[2]。Folks表示一群人、一伙人;Taxonomy是指分类法, 是信息架构中的重要部分;由这两个单词和在一起组成的Folksonomy则是指一种社群参与人运用自由定义标签 (tag) 方式进行协作分类的活动[3]。分众分类中用户可以提交自己定义的标签, 通过用户群体定义标签的频率来决定信息的组织方式, 而不是使用传统的严格分类标准, 因此整个分类过程都是完全自发的, 更为方便、灵活, 在当下非常流行的社会性网络服务中得到广泛应用。

分众分类法的概念于2004年8月被Thomas Vadener Wal提出后, Adam Mathes和David N Sturtz等人发表了重要论著, 主要关注在对分众分类概念的普及和推广上;到了2005年, 对分众分类的研究方向转移到了应用领域, Tony Hammond、Terrell Russell等人发表综述和论文, 围绕分众分类的发展背景、定义、与传统分类法之间的关系、工作原理, 以及对认知权威性的发现和定义上都分别进行了论述;2006年关于分众分类的研究则侧重于对分众分类法系统构建的研究, Elaine Peterson、Adam Seldow、Chi-Lung、Trant J等人分别在文章中通过回顾传统信息组织方法在实现流程及其不足, 并在教育、图书馆等特定领域引入分众分类, 并充分将分众分类与Web 2.0进行结合;2007年, 对分众分类的研究重点转移到了分众分类的本质和索引方向, Thomas Gruber[4]、Jakob Voss[5]等分别在分众分类的社会性, 及其对人工索引方向进行了探讨;2008年分众分类的研究重点转移到了分众分类的使用范围上, James Sinclair[6]发表论文讨论了分众分类的使用范围, 上海交通大学的一部分同学[7]则探讨了将分众分类法用于个性化搜索中;2009年的研究主要在于对分众分类的改进上, Jeff Z.Pan[8]等人发表论文提出在基于分众分类搜索扩展的标签系统中减少模糊性的方案, Trant[9]则发表了对steve.museum的研究结果;2010年对分众分类的研究主要关注在个性化搜索方面, Fabian Abel[10]、David Vallet[11]等人均对分众分类在搜索中的作用进行了研究;2011年对分众分类的研究围绕在基于分众分类的推荐上, 并开始将研究方向与云计算进行结合, Jens Illig[12]、Iván Cantador[13]等人发表的文章都将重点关注到基于分众分类的推荐上, 而Wen-Chung Shih[14]则将e-Learning内容检索的基于分众分类的模糊索引创建与云计算环境进行结合。

目前, 分众分类法分为两种, 一种是面向所有使用互联网大众的“广义型”模式, 另一种则是面向某一特定类型用户的“狭义型”模式[2]。

广义型分众分类 (Broad Folksonomy) 面向的是互联网上的所有用户, 用户在知识结构和兴趣方面都有着巨大差异[15]。每个用户根据自己的认知, 使用自己的语言对社区中现有的或尚未添加内容提供独特的标签, 每个内容或每种分类都能够使用相当多的标签来进行描述, 会产生大量的各种各样、多种描述内容的标签, 建立起内容广泛的平台, 为用户提供一个较大的信息或知识范围进行信息的浏览和查询。

狭义型分众分类 (Narrow Folksonomy) 与广义型分众分类最大的不同之处在于用户的特质上[2]。狭义型分众分类针对某一特定领域有着类似的知识结构和兴趣的用户提供某一特定领域或专业的信息和知识共享平台。社区中的用户都是基于对同一领域或专业的内容感兴趣加入, 内容的提供者本身可能就是这个社区中的用户, 为自己上传的内容标注一个标签, 并希望社区中与自己存在着相同兴趣的用户共享相关信息或资源。从一定程度上来讲, 狭义型分众分类构建的已不再是面向大众的分类体系平台, 而是在较为狭窄的范围内为具有相同或相似兴趣的用户提供共享专业化信息或知识的平台, 因此也无需数量庞大的用户, 这样更有利于在社区中进行知识共享的实现。

二﹑基于分众分类的知识推荐算法

对于一般的知识管理系统来说, 其知识推荐功能是构建在专家数据库的专家地图上的, 因此系统中专家知识推荐的准确性是和专家数据库中的专家数据有着密切的关系[16]。专家数据往往是由企业中专门的员工来维护, 而不是企业中各个领域的专家, 在管理上具有很大的主观性和盲目性, 并且不具备很好的灵活性和时效性, 这样会导致专家数据不够准确, 直接影响到其他非专家用户的使用。

考虑到核电企业搜索引擎系统的特点, 本文可以将狭义型分众分类与专家知识推荐进行结合, 以提高专家知识推荐的准确性和用户的使用体验。基于分众分类的专家知识推荐逻辑图如图1所示:

与典型的狭义型分众分类不同, 核电企业搜索引擎系统的专家知识推荐中没有使用传统意义上的标签。根据使用搜索引擎的特点, 用户使用关键字来对自己感兴趣的文档资料进行搜索, 因此当用户点击搜索引擎的某个返回文档进行浏览时, 就表明该用户对这个文档感兴趣, 并且该关键字能够表明该文档的某个特征, 因此可以将关键字看作是文档的标签。在内容来源上, 核电企业搜索引擎系统会自动从各个数据源抓取各种数据、文档等信息作为相关搜索结果返回给用户, 所以用户无需自己上传内容。

作为专家知识推荐, 专家用户需要在某个领域具有权威性, 但专家用户的专业性、权威性仅仅只是集中在其所熟悉的领域上, 范围很小。出于研究或者应用的考虑, 专家用户偶尔需要搜索非自己专业领域的资料, 而专家用户并不是这些方面的专家, 其身份和其他普通用户一样, 若把这种情况下专家用户浏览的文档也当作专家用户的推荐信息, 那么专家知识推荐的准确性就会受到影响。

为了解决这个问题, 可以让专家用户创建个性化档案, 输入自己所擅长领域的关键词, 可以作为其专业领域的标签。当然, 每个专业领域的某个定义常常会有多种表述方式, 如分众分类就有大众分类、社会性分类、Folksonomy等多种叫法, 因此专家用户输入的专业领域的关键词的同义词也应该作为专家用户的兴趣标签。为了确保所记录的专家用户的行为轨迹其所熟悉的那个领域的内容, 需要限制只有当专家用户使用自己的个性化档案中的关键词及其同义词进行搜索, 才能对其浏览内容进行轨迹记录。

用户并不是传统意义上的上传自己感兴趣的内容, 并创建对该内进行描述的标签, 并通过标签与其他用户进行分享的方式;而是专家用户通过输入关键字, 使用系统中的搜索引擎的返回结果发掘与自己专业领域相关且感兴趣的文档, 并将关键字作为该文档的标签, 并在其他用户通过搜索该关键字或其同义词来得到专家知识推荐的方式来分享信息。

图2是面向核电企业搜索引擎系统的基于分众分类的知识推荐算法的逻辑图:

根据核电企业搜索引擎系统中知识管理的特点, 普通用户和专家用户都常常需要使用搜索引擎查询信息, 专家数据库中的专家数据完全可以由专家用户自己提供和管理。系统中用户的创建可以由系统管理员完成, 在创建时定义该用户是否为专家用户。系统管理员可以根据该用户在企业中的级别, 从事该行业相关领域的年限等具体信息来判断用户是否具有专家用户的资格。因此, 基于上述思想提出的面向核电企业搜索引擎系统的基于分众分类的专家知识推荐算法除了具备上述的基于分众分类的知识推荐的优点以外, 还具有在核电企业中这个具体的专业领域的实用性, 这是其他知识推荐算法所不具备的。

三﹑基于分众分类的核电企业专家知识推荐算法的实现

要想实现面向核电企业搜索引擎系统的基于分众分类的专家知识推荐, 首先需要记录专家用户的行为轨迹。其流程图如图3所示:

用户首先需要创建自己的个性化档案, 对于专家用户来说, 专业领域的关键词能够表明专家所熟悉和感兴趣的领域, 相当于专家专业领域的标签。当用户使用搜索引擎搜索文档资料, 浏览搜索结果中的某些文档时, 说明用户认为该文档与其输入的关键字相关, 也即关键字可以看作是对该文档的标签。考虑到普通用户和专家用户对专业领域的了解程度的差异, 仅认为专家用户对文档的浏览记录是有价值的。当有用户浏览某个文档时, 需要判断该用户是否是专家用户, 如果不是专家用户则不对本次浏览轨迹进行记录;如果是专家用户, 但专家浏览的不是自己所擅长领域的文档, 也不进行记录;只有当专家用户浏览自己专业领域的文档时, 才将该专家用户的ID、本次搜索的关键词和所浏览文档的编号存储进数据库中。

在专家用户的轨迹记录完成后, 即可根据专家的浏览记录为普通用户进行专家知识推荐。图4显示了知识推荐的流程:

当普通用户在搜索框中输入自己感兴趣的关键词进行搜索时, 系统就可以为该用户提供专家知识推荐。由于普通用户对所搜索的关键词相关领域的知识不是很熟悉, 可能会对所要搜索的内容描述不是很准确, 加上很多专业词汇存在同义词现象, 因此需要先对关键字进行分词, 并获得分词后的同义词信息, 以帮助普通用户获得相关领域的尽可能多的相关信息。使用关键词及其同义词在数据库中进行模糊搜索, 得到相关专家用户的轨迹信息, 即文档编号, 对这些编号按照访问次数进行降序排列。一般可以认为, 被访问次数越多的文档, 其价值也越高。最后根据这些文档编号, 在系统中获取文档的相关介绍信息, 并最后以搜索结果展示给用户。

四﹑结语

传统的知识推荐算法一般都是以用户对知识评分或聚类技术等来为用户进行知识推荐;基于分众分类的专家知识推荐, 则由专家用户使用标签来对知识进行标注, 其他用户在获取知识时, 则可以根据这些标签来得到相关的知识推荐。由于分众分类方法中标签是由用户自己创建, 因此与传统的方法相比, 其灵活性更好, 更符合用户的使用习惯和思维习惯。除此以外, 基于分众分类的知识推荐算法由于实现起来比较简单, 系统结构也不复杂, 往往都有比传统知识推荐算法更好的效率。

本文根据分众分类的思想, 结合核电企业搜索引擎系统的特点, 提出了一种面向核电企业搜索引擎系统的基于分众分类的专家知识推荐方法, 不采用传统的分众分类中用户上传自己感兴趣的内容并自定义标签对其进行标注的方法, 而是另辟蹊径, 认为搜索引擎系统的用户可以将关键词作为标签, 以搜索引擎系统搜索出的结果作为自己感兴趣的内容。

专家分类 篇4

关键词:专家系统,昆虫分类鉴定,决策算法,推理策略

1 引言

昆虫在分类学上属昆虫纲,其数量庞大、种类繁多,是动物界中最大的一个类群。目前世界已知昆虫大约有多100万种,占据了动物界的80%,中国约有12万到15万种,每年还有5千到1万的新种被发现。

在传统的昆虫分类鉴定工作中,一般是先收集昆虫标本,然后是鉴定标本。首先确定大类,大类确定以后,依靠相关的、较新的权威性专业专著作进行进一步的鉴定,直至鉴定出种类为止。然而,在实际工作中,对标本进行鉴定时,将会出现许多问题。如没有较新的权威性分类学专著作,难以收集、整理和查阅昆虫信息等。同时也不利于对所收集昆虫资料的资源共享及对外交流。较之传统分类鉴定方式,构建一种新型的、基于计算机技术、信息技术、网络技术等技术的昆虫分类信息查询专家系统,把人从繁琐的纸质资料中脱离出来,能极大地提高对昆虫的检索、分类及鉴定的效率,降低工作量。同时,在专家系统相关理论指导下构建的系统,具有昆虫专家学的知识和经验,使用户能获得专家级别的指导,保证昆虫鉴定的科学性、准确性。

2 昆虫编码

我国目前尚未建立昆虫分类代码的国家标准。为了系统设计的需要和昆虫分类学研究的需要,需要设计一种符合昆虫信息化需求及能为后续研究应用服务并能得到推广的昆虫编码。本系统设计的昆虫编码,主要针对《云南森林昆虫》及相关权威网站的已经研究并被认可的分布在云南的森林昆虫,按照昆虫的目、科、属、种等的拉丁名字母顺序进行排序编码,根据昆虫的分类阶元,设计出存储容量适中的编码,为以后新昆虫的发现预留足够的编码位置。同时,该编码还能推广应用到所有昆虫,具有标准化的基础。

2.1 昆虫编码的原则

昆虫编码的设计,必须依据编码的一般设计原则,使用相关设计原理进行编码设计。同时,设计出的编码必须符合信息化的要求,要在数据库技术的指导下,设计出符合数据库存储、操作需求的编码。本系统的昆虫编码设计符合以下原则:

2.1.1 唯一性

编码的设计必须唯一,这符合数据库设计的实体完整性原则,是昆虫编码的基本要求。每一个目、科、属、种等都必须有唯一的编码,从而保证存储在数据库中的每一个元组数据都是可识别和唯一的。

2.1.2 简单性

编码的结构应尽量简短,能以尽量精炼的编码结构包含尽量丰富的内涵,以减少代码的差错率和节省存储空间,应能方便地从昆虫的编码中读出其他诸如目、科、属等信息,提高程序的执行效率。

2.1.3 规范性

昆虫编码的代码类型、结构和格式必须规范、统一,同一阶元的昆虫信息编码方式应该相同。

2.1.4 可扩展性

昆虫编码必须具备可扩充的能力,要能适应同类编码对象(如新的种、属等)不断增加的需要,必须对新增的编码对象预留足够的编码空间,以适应不断扩充的需要。

2.1.5 适用性

昆虫编码应方便记忆、管理,同时昆虫的编码应对昆虫的分类鉴定有益。

2.2 昆虫编码设计

本系统的昆虫编码采用层次编码法,根据云南森林昆虫详细的分类阶元:目、亚目、总科、科、亚科、族、亚族、属、亚属、种,昆虫种的编码共分为十层,由昆虫所属的亚属、属、亚族等上级的编码组成,每一个昆虫种编码由21位阿拉伯数字组成。因为亚种实际上并不是种下面的一个分类阶元,一个亚种是种的变形,可以算是单独的种,在本系统昆虫编码中不对亚种进行编码。同时,对于缺省的阶梯,可以用数字0填充代替,方便以后补充替换。编码过程主要是先对云南森林昆虫的十四个目进行编码,使用阿拉伯数字01、02、03、……、14依次表示蜱螨目、鞘翅目、双翅目、……、缨翅目等十四个目,其位于昆虫种编码的第一、二位,构成了昆虫种编码的第一层。然后用阿拉伯数字01、02、……、99表示每个目下面的亚目,其位于昆虫种编码的第三、四位,构成了昆虫种编码的第二层;同时,亚目的二位数字编码+所属目的编码构成了完整的亚目编码,如蜻蜓目的编码为12,蜻蜓目所包含的差翅亚目的层级编码为01,则完整的差翅亚目编码为1201。其他编码层级依此类推。

3 系统知识库构建

3.1 知识库总体结构

本系知识库统由昆虫信息数据库和分类检索信息库组成。昆虫信息数据库主要存储昆虫相关信息,是知识库的重要部分,用于基于逻辑的推理。分类检索信息库是昆虫专家知识库的核心,是根据昆虫特征及二项式分类检索表,结合专家系统、二叉树和决策树等相关理论知识,利用数据库技术构建而成,是昆虫分类信息查询专家系统的主要部分。

3.2 检索信息库优化

分类检索信息库是知识库的核心,是知识的主要来源,和昆虫信息数据库构成专家系统的知识库。本系统对于分类检索信息库的构建,使用昆虫编码及其他数据表的特殊组织结构方式,把所有的二叉检索表构建为一张数据表,有关昆虫的所有分类检索信息都存储在这张表内。有利于系统开发、运行和维护,对于将来知识的扩充也非常方便,只需在数据表中追加信息就能实现,极大地提高了系统的扩展性。可根据原始的昆虫二项式检索表,分析形成直观的原始二维数据表格,结果如表1所示。

然后在原始检索表的基础上,把各种昆虫、各个阶元的检索表都整合在一张数据表中,以适用于大型系统的构建需求。结果如表2所示。

其中sn为层级编码和检索表序号构成的新检索序号,character为昆虫特征,conclusion为特征所对应的结论,cid为结论的标识字段,id为检索对象的完整编码,intro是对该元组的说明。

4 二叉树

4.1 昆虫分类二叉树

以昆虫分类二项式检索表构造的树形结构,与二叉树结构是类似的。可以把昆虫分类鉴定与二叉树理论结合起来,构造昆虫分类鉴定二叉树。现以等翅目昆虫的分科二项式检索表为例,构造等翅目分科检索类二叉树结构。其实,构造的昆虫分类二叉树是一用于分类的决策树。

4.2 昆虫分类二叉链表

根据昆虫二项式检索表结构与二叉树的相似性及对昆虫二项式检索表的二叉树结构分析,把树二叉树二叉链表的左右指针域分别替换为昆虫分类鉴定中用于分类的特征属性,分别指向下一级序号或者是某个具体的结果,当某一结点的左右孩子即特征1、特征2都为NULL时,则表示该结点为某一具体的分类鉴定结果。由此,可以得出与二叉链表相似的昆虫分类二叉链表。

4.3 昆虫二叉树遍历

二叉树遍历的基本操作是结点访问,对于昆虫分类二叉树遍历也是对每个昆虫二叉树结点的访问,读取每个结点的信息,用于专家系统的推理判断。

5 系统的实现

系统界面是用户与应用系统的接口,是其相互间进行交互的语言环境,一个优秀的系统至少得具备美观、友好、易操作等要求。本系统简洁、美观,易操作且易扩展。下面对主要的系统功能做介绍。

5.1 昆虫检索

系统的检索功能主要分为:按中文名称检索、按拉丁名检索、按昆虫分布地点和按昆虫特征检索。

5.2 二叉鉴定

昆虫二叉鉴定功能是基于规则的推理决策算法的实现,是专家系统二叉树和决策树理论的体现,也是系统的主要鉴定功能。此功能模块是根据昆虫二项式检索表,结合二叉树和决策树的相关理论,构造为系统知识库,然后通过系统动态提取知识库中昆虫的特征信息,然后以类似二项式检索表结构的形式显示出来。然后用户通过系统所展示的昆虫二项式结构的特征,与所持有的昆虫资料进行对比判断,选择符合昆虫特征的选项,然后点击下一步进行之后的鉴定,直到能得出结果为止。

5.3 属性鉴定

属性鉴定是基于逻辑的决策算法的体现,也是专家系统的重要鉴定功能,系统通过对特征、分布、寄主和习性几个特征进行属性条件组合,然后根据推理规则在知识库中进行条件判断,如果有结果,将会把结果都列在上方。用户可以根据鉴定出的结果和手中的昆虫资料进行对比,如果符合则说明鉴定出结果;如果鉴定出的结果很多,不能让用户满意,用户可以重新输入鉴定条件,然后点击“在结果中鉴定”按钮,系统将会在上次的鉴定结果中依据新的条件进行鉴定。

6 结论

本系统具有昆虫信息查询、浏览、鉴定、知识库维护等主要功能,界面简洁、美观,易于使用和掌握。通过本系统的开发和使用,把昆虫鉴定工作从繁琐的纸质资料从解脱出来,方便了广大的昆虫专家和昆虫爱好者,也满足了社会信息化发展的趋势和要求。

参考文献

[1]唐祖庭.昆虫分类学[M].北京:中国林业出版社,1987.

[2]张小斌.基于数字化的生物分类鉴定及知识集成研究[D].浙江大学,2007.

[3]云南省林业厅,中国科学院动物研究所主编.云南森林昆虫[M].云南:云南科技出版社,1987

[4]陈乃中,沈佐锐.一种计算机昆虫检索系统的制作方法[J].植物检疫,2003,17(1):20-21.

[5]严蔚敏,吴伟民.数据结构(C语言版)[M].北京:清华大学出版社,2007.

专家分类 篇5

2016 年1 月18 日,中国物资再生协会在北京召开了《废弃电器电子产品分类》和《废旧手机网络交易规范》的专家审定会,中国物资再生协会刘强常务副会长主持会议, 中国电子节能技术协会、中国标准化研究院资源与环境分院、 工信部信息中心、环保部固体废物管理中心、清华大学环境学院、中国环境科学研究院、中国文化办公设备制造行业协会、中国家用电器协会、北京京环城市矿产资源开发有限公司等来自科研院所、协会和龙头企业的专家出席了会议。

此次审定通过的两项行业标准由中国物资再生协会与中国家用电器研究院、格林美股份有限公司、大冶有色博源环保股份有限公司、四川省中明再生资源综合利用有限公司、青岛新天地生态循环科技有限公司、山西天元绿环科技有限公司、四川长虹电器股份有限公司等单位共同制定。

中国电子节能技术协会黄建忠副会长兼秘书长作为标准审定组组长主持了标准的审定程序。会上,格林美股份有限公司和深圳淘绿信息科技股份有限公司分别对《废弃电器电子产品分类》和《废旧手机网络交易规范》的编制情况作了汇报,专家组对以上两项标准进行了认真的讨论和审议,认为以上两项标准均具有普遍的适用性和较强的可操作性, 对规范再生资源回收行业有重要的指导意义,有利于促进我国再生资源回收行业健康、 有序发展。最后,与会专家一致同意《废弃电器电子产品分类》和《废旧手机网络交易规范》两项标准通过审定,审定会圆满完成。

【专家分类】推荐阅读:

专家判断10-16

玉米专家05-29

专家热06-01

专家教师06-03

专家服务08-13

专家研究08-15

专家经验08-15

专家技术08-23

外国专家09-22

专家评标09-29

上一篇:历史成本计量下一篇:歌词同步论文