专家研究

2024-08-15

专家研究(通用11篇)

专家研究 篇1

0 引言

网络的发展使得信息的获取变得越来越便利。Google等搜索引擎可以检索成千上万的信息, 这为寻找和获得知识带来了很大的便利。那些写在纸上, 记录在案的知识, 称为“显性知识”, 相对地, 仅存在于人脑中, 没有写成文字的知识, 称为“隐性知识”[1]。隐性知识占到了所有知识的80%。正是由于这么多知识并未用书面形式表达, 所以需要一种方法, 能够找到掌握这些知识的专家, 通过和专家面对面或邮件等方式的交流, 获得那些未成文的隐性知识。

另一方面, 有时候只知道自己遇到了问题, 但是不知道如何明确的表达问题, 在这种缺少“关键词”的情况下, 就算这些知识已经被记录在文档中了, 也很难通过搜索引擎找到所需要解决问题的方法。这种时候就需要找到专家, 向他们描述问题, 并寻求帮助。

以上寻找专家的目的, 是为了寻求帮助, 获得知识和解决问题的方法。而有时候寻找专家并不是为了以上目的, 可能是需要寻找能够胜任某些工作的专家。比如对于企业, 要招聘一些专家加入他们的团队, 寻找特定领域的专家预测一下项目的可行性和发展前景, 抑或是让专家对已经完成的项目进行评估等。在学术界, 也会寻找特定领域的专家评审别人的论文, 寻找相关领域的专家进行项目合作等。因此专家寻找是一个很重要的课题, 有着广泛的应用前景。

早期的专家寻找系统主要通过将不同数据库整合成数据仓库[2], 让人们更容易地找到专家。这些系统包括惠普的CON-NEX, National Security Agency的KSMS, 微软的Spu D等[3]。它们有个共同特点, 都要靠人工判断自己的技能, 输入关键词以被检索。这样的工作既费时又费力。更可怕的是, 数据建立起来后, 不会实时更新, 而人们也常常忘记手动更新, 时间一长, 这样的数据已经无法描述当前人员的擅长领域和技能等。因此需要能自动初始化并实时更新专家信息的专家寻找系统。

所谓专家寻找就是给定一个检索关键词, 找出与这个特定检索关键词相关的专家。这需要估计候选专家与检索关键词之间的联系紧密程度, 从而给出一个排好序的专家列表, 越靠前的候选专家越有可能是与这个检索关键词相关的专家。但是候选专家不同于文档内容, 不能直接表示成诸如向量等可供检索用的单元。候选专家信息通常出现在文档中, 因此可以把候选专家与检索关键词之间的紧密度估计建立在所能获得的文档证据上, 通过信息检索的方法, 自动初始化并更新专家信息。

专家寻找的方法主要分两类, 一类模型复杂速度较慢, 主要用于离线的专家寻找。另一类速度较快, 适用于在线的专家寻找。本文主要讨论在线专家寻找。在线专家寻找方法中, Balog, K.等人提出了一种基于简介描述的方法[4], 通过已有文档为材料, 为每个候选专家建立个人简介文档, 描述其擅长领域、技能等。当检索关键词出现时, 只要检索简介描述文档就能给出一个候选专家列表。此方法不依赖于检索关键词, 不能及时更新, 且需要很大存储空间为每个候选专家建立个人简介文档。之后Balog, K.等人[5]将语言模型应用于专家寻找, 不但实现了实时的查询而且不需要过大的存储空间, 取得了不错的效果。杨柳等人[6]对语言模型中检索关键词与候选专家在文档中的距离和顺序关系进行了研究, 提出了顺序核函数提高了专家寻找的准确度。Rosen-Zvi, M.等人[7]通过改进的主题模型, 作者主题模型, 增加了作者因素提高了专家寻找的准确度。而清华大学开发的专家寻找系统Arnet Miner[8], 基于进一步改进的主题模型, 作者会议主题模型, 也取得了不错的效果。

上述方法各有优缺点, 语言模型计算速度快, 可以实时检索, 而主题模型可以通过隐变量“主题”更加精确的建模文档。但是它们有一个共同的缺点, 考虑的因素过于单一。本文提出了一个专家寻找模型融合框架, 能够考虑专家寻找中的不同因素, 并且可以融合不同的模型, 提高专家寻找的精确度和鲁棒性。实验中使用了多种方法为专家寻找模型融合框架的各部分进行打分, 并应用于不同类型的数据库, 计算机文献数据库DBLP[9]与生物医学文献数据库MEDLINE[10], 以此证明该融合框架的效果与鲁棒性。

1 专家寻找模型融合框架

专家寻找问题的主要方法是对于候选专家与检索关键词的相关性给出一个分数, 通过这个分数对候选专家进行排序从而找出专家。与普通信息检索问题不同的是, 候选专家并不是文本信息, 无法用普通的文本表示方法诸如向量等表示。候选专家通常以作者、引用等形式出现在文档中, 因此只有通过文档等作为桥梁将候选专家与检索关键词进行关联。

1.1 影响专家寻找的因素

现有的方法如语言模型、主题模型等着重于计算文档与检索关键词间的相关性, 考虑因素过于单一。除了这一因素之外, 在为每个候选专家打分时, 还有其他因素需要考虑。

假设有两个文档di和dj, di的作者为ai1、ai1和ai3, dj的作者为aj1和aj2, 两个文档内容相似, 与检索关键词的相关性差不多, 可能现有的方法会认为与之相关的5位作者有着相同的分数。但是如果两篇文档被引用次数不同, di比dj获得更多的引用, 那么显然dj的作者应该获得更高的分数。又或者检索关键词是“Data Mining”, dj发表在Data Mining专业性较强的杂志上, 而di发表在较普通的杂志上, 那么dj的作者应该获得更高的分数。总之在专家寻找过程中, 应该考虑文档本身的属性, 它们会对专家的评判产生重要影响。

另一方面, 文档di拥有3位作者, 文档dj拥有2位作者, 每位作者对于文档的贡献度也是不同的, 比如作者ai1提出了模型、想出了新算法, 而ai2在其指导下进行了实验, 那么ai1应该获得比ai2更高的分数。

由于上述原因, 只考虑单因素的专家寻找方法不能很好地区分不同文档, 不同作者的相关性。因此本文提出了一种专家寻找模型融合框架, 该融合框架可以在对专家打分时考虑多方面的因素。

1.2 融合框架的设计

专家寻找模型框架 (如图1所示) 的目的是为了对候选专家与检索关键词间的相关性进行打分 (Score (e, q) ) 。由于它们之间没有直接联系, 可以通过中间结点形成一条通路为其建立关系。这些中间结点通过不同的关联方法连接起来, 并且每个结点有自己的属性。候选专家与检索关键词之间可以同时存在几条不同的通路。因此计算Score (e, q) 的问题就转化为计算各结点以及结点间相关性的分数:

其中Scoren表示结点的分数, Scorer表示节点间相关性的分数, μi表示第i条通路的权重, nij表示第i条通路的第j个中间结点。

对于结点分数Scoren, 通过属性计算:

其中attrijk表示结点nij的第k个属性, ωijk为该属性在结点nij的分数中所占的权重。由于目标是计算候选专家与检索关键词间的相关性分数, 所以不需要对候选专家与检索关键词做过多先验假设, 可以简单地将Scoren (e) 和Scoren (q) 设置为常数1。而如果希望引入先验的专家权威度信息, 也可以对Scoren (e) 使用不同的分数。

节点间相关性的分数Scorer通过关联方法计算:

其中relijk表示结点nij与nij+1间的第k个关联方法, λijk为该关联方法在相关性分数中所占的权重。

式 (1) ~式 (3) 可以通过不同的中间结点建立候选专家与检索关键词之间的联系并进行打分。

目前在线专家寻找系统通常使用文档作为桥梁建立候选专家与检索关键词间的关系。所以可以用文档作为专家寻找模型融合框架的中间结点 (如图2所示) , 将Score (e, q) 的计算转化为3个独立的步骤: (1) 计算候选专家与文档之间相关性的分数 (Scorer (e, d) ) 。除了作者可以作为与文档相关性的证据之外, 文档中引用别的文档的作者或者提及某些专家的工作成果亦可作为候选专家与文档间相关性的证据。 (2) 计算文档自身的分数 (Scoren (d) ) 。文档被引用的次数可以作为打分的依据, 引用次数越多代表文档自身质量越高、越重要。也可以通过PageRank[11]算法对引用关系打分。而文档发表杂志的专业性、影响因子、发表会议的类型、重要性也可以作为打分依据。 (3) 计算文档与检索关键词之间相关性的分数 (scorer (d, q) ) 。检索关键词在文档中的出现频率是一个重要的因素。判断文档与检索关键词是否具有相同的主题也是一种打分依据。还可以通过同义词字典对关键词进行扩展更好的进行打分。

2 融合框架的实现

本文实现了两种专家寻找模型融合框架, 分别应用于不同的数据集, 计算机领域的文献数据库DBLP和生物医学领域的文献数据库MEDLINE。DBLP记录数量比MEDLINE少, 且只包含文档题目、作者等信息, 杂志信息不太完整。相比之下MED-LINE不但包含题目、作者、完整的杂志信息外, 还包含了文档摘要的信息。另外生物医学领域的文档通常具有比较多的作者, 而且生物医学的亚领域相较于计算机领域更加复杂繁多。考虑到上述诸多的不同, 通过对融合框架不同部分采用不同的打分方法可以更有效地寻找不同领域的专家。

2.1 候选专家与文档的分数

候选专家与文档之间相关性的分数 (Scorer (e, d) ) 可以表示成对每篇文档, 候选专家的权重, 也即给定文档d, 产生候选专家的条件概率p (e|d) 。不同类型的文档可能对于候选专家给出不同的权重。比如, 对于计算机领域的文档, 通常情况下每篇文档的作者数量不是很多, 因此使用均匀分布, 即产生所有作者的条件概率相同是一个比较好的选择。而对于生物医学领域的文档, 作者比较多, 因此比较好的方法是只考虑每篇文档的第一作者和最后一个作者, 忽略中间作者。

2.2 文档的分数

文档的分数 (Scoren (d) ) 可以有不同的计算方法。最简单的方法就是视所有文档同样的重要, 即每篇文档拥有相同的分数。另外可以用文档所属杂志的SCI影响因子作为文档的分数。目前可以获得的SCI影响因子从1997年到2011年。因此1997年至2011年之间的文档影响因子与当年杂志的影响因子相同, 1997年前的影响因子设置为0, 2011年以后的影响因子用最近五年平均数近似。文档被引用次数也可以作为文档的分数, 但是引用次数的信息获取较困难, 所以本文暂时不使用引用次数的信息。

2.3 文档与检索关键词的分数

文档与检索关键词之间相关性分数 (Scorer (d, q) ) 通常用给定文档, 产生检索关键词的条件概率 (p (q|d) ) 来表示。由于本文需要实现在线的专家寻找系统, 因此选择使用语言模型和主题模型这两个可以快速计算出结果的方法。

在语言模型中:

其中, p (t) 是单词t出现在整个文档集中的概率, 而p (t|d) 是单词t出现在文档d中的概率。通过平滑因子λ来调节两者之间的权重。

对于主题模型, 可以使用LDA[12]或者PLSA[13]。通过隐变量“主题”计算出p (q|d) :

其中k表示主题集K中的一个主题, p (k|d) 为文档d产生主题k的概率, p (t|k) 为主题k产生单词t的概率。

语言模型直接对出现在文档中的检索关键词进行计算, 而主题模型通过“主题”对文档建模, 然后计算检索关键词, 两者各有千秋。适当的结合两种模型, 可以更加平滑地计算文档与检索关键词的关系, 公式如下:

其中PLM (t|q) 通过语言模型计算得到, 而PTM (t|q) 通过主题模型计算得到。μ是一个0到1之间的数, 用来调节语言模型和主题模型之间的权重。

2.4 模型融合

获得上述三部分的分数后, 可以通过式 (1) 计算出候选专家与检索关键词间的相关性分数 (Score (e, q) ) , 然后对不同候选专家进行排序。式 (7) 为框架的一种融合方式:

其中p (e|d) 表示用均匀分布对文档与候选专家的关系进行打分, 即文档所有作者的分数相同, 都是表示文档的作者数。cd表示文档重要性使用均匀分布进行打分, 即每篇文档重要性相同, 因此是一个常数。最后一部分表示文档与检索关键词的分数, 用语言模型与主题模型的组合方法 (式 (6) ) 计算得到:

式 (8) 为框架的另一种融合方式。考虑到第一作者和最后一个作者的重要性, p (ef1|d) 表示文档与候选专家关系时, 仅考虑了第一作者和最后一个作者, 而忽略其他中间作者。wd是文档重要性, 使用文档所属杂志影响因子表示, 即IFd+1, 其中IFd表示影响因子, 加1是为了避免影响因子为0时, 整个打分公式的乘积为0。最后一部分与式 (7) 相同, 也是使用语言模型与主题模型的组合方法计算文档与检索关键词的分数。

3 实验与分析

以下部分通过基于DBLP和MEDLINE数据库的实验验证专家寻找模型融合框架的有效性, 以及其融合各模型的能力。对于上述每个数据库, 本文给出一组检索关键词。通过各种方法检索出与每个检索关键词相关的文档和候选专家, 然后对候选专家进行打分并排序。

3.1 数据集

DBLP数据库是计算机领域最大的数据库之一。截止目前为止, DBLP记录了约2 200 000篇计算机领域的论文。对于其中的每条数据, DBLP给出了文档的题目、作者等信息。

MEDLINE数据库是生物医学领域最大的数据库。MED-LINE收录了从1948年开始, 5 600多种生物医学相关会议、杂志中约21 000 000篇论文。对于其中的每条记录, MEDLINE给出了文档的题目、摘要、作者和发表的杂志或会议等信息。

3.2 评价标准

专家寻找的评价一直是个难题, 不同的人会有不同的意见。对于DBLP, 本文采用了清华大学[14]的一个标准。该标准中一共有七个检索关键词, 对于每个检索关键词, 他们从Libra、Rexa[15]和Arnet Miner中查找排名前30的专家, 然后将他们放到一起。接着一个研究人员和两个研究生对于该检索关键词的候选专家进行人工评判。对于每个候选专家, 有四个等级的分数3, 2, 1和0分, 分别代表着这个候选专家是该检索关键词的顶级专家、专家、可能的专家或者不是专家。最后, 只考虑那些分数在2分以上的候选专家, 并把他们作为该检索关键词的标准。七个检索关键词的详细信息如表1所示。

MEDLINE没有现成的评价标准, 因此本文参照DBLP的评价标准制作了MEDLINE的评价标准, 选取了10个有代表性的检索关键词。对于每个检索关键词, 通过BMExpert、e T-BLAST[16]和Go Pub Med[17]查询相关专家, 并将每个系统的前20个专家收集到一起, 做人工评价。对于每个专家, 请了七位生物医学领域的研究者分别进行打分, 最后形成标准。详细统计信息如表2所示。

3.3 对比方法

实验使用了两个对比方法。第一个对比方法是由Balog, K.等人提出的语言模型[5], 在实验中用“LM”表示。第二个对比方法是由Lu, Y.等人提出的使用PLSA和LDA主题模型寻找专家的方法[18], 在实验中用“PLSA”和“LDA”表示。

3.4 评价方法

本文使用两种方法评价实验结果, 分别是P@n和AP (average precision) [19]。

P@n是在前n个输出结果中正确输出结果 (即正确专家) 的比例。P@n也被称作精确度 (Precision) 。在实验中, 取n=10和n=20, 因此可以用P@10和P@20表示。

AP (average precision) :表示平均精确度, 计算公式如下:

其中P@i是前i (

P@n能够评价前n个结果中出现了多少正确的结果。而AP可以评价前n个结果中正确结果的位置, 如果输出结果中正确的结果排名越靠前, AP的值就会越大。

3.5 实验结果

对于DBLP数据库, 使用式 (7) 进行打分, 结果见表3-表5。对于MEDLINE数据库, 使用式 (8) 进行打分, 结果见表6-表8。式 (7) 和式 (8) 中的主题模型分别使用PLSA与LDA, 用“框架1”和“框架2”表示, 其中主题个数设置为15个, μ设置为0.5。

3.6 结果分析

表3-表5是DBLP上的实验结果。可以看出总体上框架2方法的效果最好, 框架1次之, 这说明融合框架的效果要优于对比的语言模型和主题模型方法。

表3为DBLP上P@10的结果。框架2在所有7个检索关键词中都达到了最高值。LM的效果次之, 框架1有4个检索关键词达到最高值, 平均值排在第三。PSLA与LDA效果相对较差。

表4为DBLP上P@20的结果。框架2无论在单个检索关键词还是平均值上, 效果依然是最好的。框架1平均值排在第二, 且有4个检索关键词达到最高值, 比LM的3个多。LM的平均值排在第三, LDA第四, PLSA第五。

表5为DBLP上AP的结果。在AP结果的表现中, 框架2的结果依然排在第一, 平均值达到了66.40%, 并且在7个检索关键词中有3个是最高值。其次是框架1, 平均值为64.78%, 比LM的63.31%高。另外LDA的效果略好于PLSA。

DBLP上的实验结果显示, 框架2无论在整体还是单个检索关键词上都表现出很好的效果, 框架1次之。在一些结果中, 比如P@10中LM的平均值比框架1高, LM在单个检索关键词上比如Semantic Web高于框架1和2, 主要原因是DBLP仅提供了文档的标题信息, 没有摘要, 由于单词数量太少, 导致主题模型的效果没有很好的发挥, 所以组合了语言模型与主题模型的框架1和2会在少数几个检索关键词上比LM差一些。

表6-表8是MEDLINE上的实验结果。总体来说也是框架2的效果最好。相比于DBLP, 在MEDLINE中框架1和2的表现都比DBLP中更好, 主要原因是MEDLINE提供了摘要, 为主题模型的分类提供了更多的语料。

表6为MEDLINE上P@10的结果。框架2和1分别排在第一和第二, 平均值达到了76%和71%。其中框架2在所有10个检索关键词中都取得了最高值。LM排在第三, LDA和PLSA虽然还是没有LM好, 但是由于有了摘要信息, 它们的效果也得到了提高。

表7为MEDLINE上P@20的结果。无论P@10还是P@20, 框架2的结果中, 所有10个检索关键词都是最高值, 框架1的结果也比较好, 平均值排在第二, 且在P@10中有5个最高值, 在P@20中有6个最高值。

表8为MEDLINE上AP的结果。框架2在所有10个检索关键词中, 有8个取得了最高值, 平均值71.26%排在第一, 框架1有2个取得了最高值, 平均为69.53%排在第二。LM平均值为66.29%排在第三, 有3个取得了最高值, 其中两个是并列。LM在structural bioinformatics的结果上比框架1和2都要好, 这是因为评价标准是基于现有专家寻找系统检索后人工评价的结果, 可能会遗漏一些专家, 比如框架1和2找到的“Bertini I”是该领域的专家, 但却不在评价标准中。LDA比PLSA略好, 平均分别是59.88%与56.04%。

通过以上实验结果, 可以看出本文提出的融合框架在两个不同类型的数据库上都取得了很好的效果, 相较于现有的语言模型以及主题模型有不少的提高。特别是框架2在不同的评价方法下都取得了最高值。

本实验验证了在专家寻找模型融合框架中对不同的因素打分, 效果比只考虑单因素的模型更好。这说明融合框架确实能够有效地结合专家寻找的不同因素, 并且它们不但在平均值上有很好的表现, 在单独的各个检索关键词上也表现不俗, 说明该框架鲁棒性也很好。

4 结语

本文提出了一个专家寻找模型融合框架, 该框架通过中间结点的属性以及结点间的联系对候选专家与检索关键词之间的关联度进行打分。并且以文档作为中间结点, 实现了融合框架。然后通过不同类型的数据库DBLP与MEDLINE上的实验验证了融合框架的效果和鲁棒性。

在今后的研究中, 会进一步扩充专家寻找模型融合框架中间结点的种类, 使其适用于更多类型的专家寻找。

于今:科学发展的研究专家 篇2

他以年轻学者少有的战略眼光、民族责任和深邃的洞察力,游弋于多个领域和学科之间,不遗余力地做着有利于人的发展和社会发展的事情——他为我国民族文物保护工作起到了至关重要的作用。他受命起草的2008年《关于汶川震区抢救羌族等民族文物倡议书》、2010年《关于玉树震区民族文物抢救和修复的倡议书》和2009年《关于圆明园被掠夺文物在法拍卖的声明》三份倡议和声明,在国内外引起广大反响,被专家学者称为近百年以来第一次由中国非政府组织发出声音,认为是中国政治文明建设和社会体制改革中具有“里程碑”意义的三个事件。

2009年,他赴25个省市区107个市县区旗镇乡村调研,深入基层贯彻宣传用科学发展观指导少数民族文物保护工作,积极倡议与宗教等部门密切配合,将文化遗产调研与宗教交流有机地结合起来,共同保护和利用好少数民族文物,推动宗教寺庙在文物保护中发挥其作用。

他关心公益领域,服务社会。2010年他只身L赴震后玉树灾区深入调研,每天行驶在海拔4000米、往返300多公里被震毁的山路上,5天的时间里三次遭遇了高原反映、车状事故、山体滑坡等生命危险;现场用短信倡议抢救震毁寺庙,募集捐赠物资现金132万元;所撰写的“玉树震区专项调研报告”,得到中央领导的批示,以及有关部委、青海省的重视。

他倡议发起创办的“百人科学奖励专项基金、中国发展百人奖、中国发展百人奖学金、主人翁资助计划、百仁公益基金、大学生假期基层挂职”等公益项目,六年来始终倡导为“人的发展”和“社会的发展”服务,做“为人民服务”的学问,已经成为全国知名的教育扶贫、培养研究生、科研奖励公益品牌,受到社会各界广泛好评。

本刊曾就科学发展观的主题专访过他,采访中,当记者问及他的信仰时,他略加沉思后说,成长环境和多年来理论研究工作,我已经对马哲有着深厚的感情。

他是如此矛盾,表面看来豪放粗犷如漠北冽冽风沙,却也会在不经意之间露出江南细雨般的丰富内敛——“我时常在想,和多灾多难的祖国和前仆后继的先辈相比,我那么一点点磨难、委屈、痛苦、等待又算得了什么呢?”。这个成就斐然的“非专业”的青年学者用“政治型学者”的身份,见证了一名士大夫“穷则独善其身、达则兼济天下”的人生格言,用他的笔,他的行动表达着对国家的拳拳真心。

责任编辑陈晰

著名农村问题研究专家——贺东航 篇3

简历。1989年福建师范大学历史专业本科毕业, 1995—1998年厦门大学中国近现代史专业硕士研究生, 1998—2006年在厦门大学公共事务学院工作任助教、讲师。其间:2000—2004年在厦门大学历史系中国近现代史专业攻读博士学位。2004—2006年到华中师范大学政治学研究院博士后流动站在职从事博士后研究。这一期间的主要学术旨趣为国家与社会关系、以及现代国家构建的“中国模式”和“中国经验”。2007年调至华中师范大学工作, 学术旨趣转向农村集体林权制度改革, 致力于从“三农”视角研究我国的“三林”问题, 是国内较早研究我国农村集体林权制度改革的学者之一。

学术兼职。曾任福建省外来员工教育事业促进会常务理事, 现任中国政治学会理事、湖北省政治学会副秘书长、国家林业局中国农村林业改革发展研究基地常务副主任、黄冈师范学院政法学院兼职教授, 被中国林业经济研究会、湖北省林业局、海南省林业局、湖北省荆门市林业局、福建省三明市林业局聘为咨询专家。

科研项目。独立承担或主持多项科研项目。系国家社会科学基金重大项目《中国集体林权制度研究》 (项目编号:09&ZD045) 首席专家、国家林业局重大委托项目《中国林改百村跟踪观察项目》首席专家。其他主要有:集体林权制度改革后的中国乡村治理状况研究———对闽赣14个林改试点县的实证调查 (国家社科基金项目) ;中国林改百村调研观察项目 (国家林业局委托项目) ;中国现代国家的构建与成长 (教育部人文社科规划项目) ;集体林权制度改革背景下的失山林农抗争与维权研究——以闽赣两省为例 (复旦大学社会科学高等研究院) ;集体林地流转及政府监管制度研究 (福建省三明市林业局委托项目) ;湖北省集体林权制度改革研究 (湖北省社科规划项目) ;《森林法》修订与集体林权制度改革研究 (华中师范大学中央高校基本科研业务费专项资金项目) ;武汉城乡一体化研究 (汉阳区人民政府委托项目) ;闽南安社会主义新农村建设的对策研究 (福建惠安县人民政府委托项目) ;地区发展均衡的政治学研究:宏观和中观的视角 (华中师范大学“银桂计划”项目) ;地方社会、政府与经济发展 (福建省晋江市人民政府委托项目) ;中国农村的经济增长与社会变迁———福建晋江东石镇肖下村调查 (福建省晋江市人民政府委托项目) ;完善厦门市外来人口管理研究 (厦门市湖里区殿前街道委托项目) ;厦门岛外城乡一体化政策与体制性问题研究 (中共厦门市委委托项目) ;闽南乡镇企业的发展与社会变迁1970年代至1990年代 (厦门大学校级科研项目) 。参与教育部《十一届三中全会以来党内民主建设与基本经验研究》和教育部课题《国外高校人文社会科学发展报告2008?政治学》等多项课题研究。

博士学位研究生专家信 篇4

被推荐考生姓名

报考院(系、所)

报考学科、专业

推荐人姓名

工作单位

职 称 职 务

与考生关系

通信地址

电子邮件 电话

清华大学研究生招生办公室

年 月 日填表您认识考生的方式、认识的时间和了解程度,对考生思想品德、道德修养方面的介绍:

对考生学术水平、科研能力、研究成果、知识结构、外国语水平等的.介绍:

考生的特长和弱点,从硕士生学习阶段和考生从事科研工作的情况看,该考生是否具有创新的潜力,有无继续培养的前途,对考生报考清华大学博士生的意见:

推荐人签名

年 月 日 非常感谢您的推荐,请将推荐书填写、签名、密封后,直接寄往清华大学研究生招生办公室,

博士学位研究生专家推荐信

泰戈尔研究专家与民间诗社 篇5

当日回到家里,急忙上网查询,终于在浙江大学网站上见到讣告:

中国共产党党员,原浙江大学中文系教授、浙江省比较文学与外国文学学会顾问、杭州市亚太文化研究会会长华宇清先生,因突发脑溢血,医治无效,于2009年11月2日下午2时55分逝世,享年72岁。

在我的印象中,华宇清教授是个从不摆出大学教授架子的知识分子,他真诚待人,和蔼可亲,笑容可掬,谦逊低调。他敬畏学问,一丝不苟;奖掖后进,不遗余力。在他的眼里,只有可敬的长者、可爱的学生,只要人家有一点长处,就予以肯定和表扬,从无恶言厉色的时候。

我与华教授相识于1984年。当年,我正在一所中学任代课教师,业余编写《慈溪书话》和《三北名人录》。当时的大学教授,在人们的心目中是何等的人物,简直是学问和真理的化身!当知道杭大教授华宇清先生是慈溪老乡时,20岁的我不知天高地厚地给他写信,征集他的材料。华先生很快给了回信——

童银舫同志:

您好!

收到您的信,十分高兴!您在教学之余,还研究地方文史,并已取得了不少成果,这是要向您祝贺的。

《金果小枝》,手头已无书,待再版后,一定给您寄上一本。明年还有三本书可出版,到时也一定赠送。

编撰《慈溪名人传》很好,但我不算名人,可不必考虑。

近日正筹备全国性的讨论会,实在忙,恐您挂念,先给您寄上一信,待后我们详谈吧!

祝好!

华宇清

1984.10.3.晚

这是华先生给我的第一封信,笔迹秀丽端谨,语言朴实又谦逊,竟然一连用了七个“您”字,让我终身难忘,并且影响我以后的处事态度。

1985年,我和本县几位文学青年组织了一个文学社团——七叶诗社,斗胆聘请了慈溪籍的三位文学家作为诗社的名誉社长和顾问,名誉社长是崇寿镇人、中国社会科学院外国文学研究所研究员、研究生院外文系教授、“九叶诗人”袁可嘉先生;两位顾问,一位是鸣鹤镇人、北京图书馆研究员、版本学家、诗人路工先生,另一位是白沙镇人、杭州大学中文系副教授、外国文学专家华宇清先生。华先生十分支持我们的诗社,1985年12月14日,他在来信中说:

印度诗人泰戈尔说:“果实的事业是尊贵的,花的事业是甜美的,但是让我做叶的事业吧,叶是谦逊地专心地垂着绿荫的。”你们成立七叶诗社,就是做叶的事业,一片片小小的绿叶,它植根在肥沃的土壤上,必将以它的生命的光辉,启示着人们为着崇高的事业而奋斗!

袁可嘉先生是老九叶诗社的著名诗人,他任您们的名誉社长,这是非常理想的,在他的鼓励和关怀下,您们的诗社一定会很快的发展。他最近来信,对您们的诗社非常关心,说“此事关系培养新生力量”,他是乐意担任名誉社长的。路工先生担任您们的顾问也很合适,至于要我担任顾问,实在不敢当,但我一定支持您们!

今寄上《金果小枝》上册,赠给诗社的同志们!

1986年10月24日,他又专门来信:

您们寄来的七叶诗刊都收到,我每期都读了。诗友们的诗,感情都很真实,有不少诗写得很清新。从近几期的诗歌看,诗人们的进步很快,诗歌的思想倾向更健康了,正如黄江风、黄梅峰在第十期编后语中所说:“值得庆喜的是,诗友们都从花草丛中走来,跑到太阳下沐浴了,朝着大海的波涛拼进了。”

我很希望有机会和诗友们见见面,大家一起交流思想,谈论诗歌欣赏和创作。

但是令人遗憾的是,诗社在受到经费毫无保障(完全自费)、联系方式落后和成员意见不一等制约下,勉强维持了一年光景,编印了十一期社刊,终于不了了之。现在想来,我除了感激袁可嘉、路工和华宇清先生三位乡贤前辈的无私帮助,也为我们的幼稚无能、半途而废而深感愧疚和惋惜!

我不懂外国文学,无法对华宇清教授在外国文学研究上的成果进行评述。但他在上世纪80年代初期出版的《金果小枝》一书,却是当时广大文学爱好者梦寐以求、千方百计借阅传抄的一部热门书。这部书初版于1982年12月,大约在次年春上市,初版为平装本,印数26500册,但一上架就被争购一空,1985年重印时,又出版了精装本。本书的副题为《外国历代著名短诗欣赏》,共收了33个国家100多位作家的诗500余首。“所选的短诗,大部分是特请著名翻译家、专家、教授从各语种的原文选译的”(《金果小枝》后记),华先生自己也翻译了一些。书中除了对各国不同时期、不同流派、不同风格的作家作了简要的介绍外,他对每首诗都以“随感”的形式作了简析,往往一语中的,给读者以点拨和启发。华教授的老师、著名学者孙席珍教授在序中称本书“破除了门户之见,不拘一格,见好花便予采撷,见佳果随即拾取,看来意在使读者开拓眼界,一尝新味,我认为这也不失为本书的一个特色”。

我每次拜访华教授,他总是跟我谈泰戈尔,他说泰戈尔是亚洲第一位诺贝尔文学奖获得者,是亚洲第一个受世界公认的学者,泰戈尔作为中印文化民间使者,对中印文化的民间交流起到了重要作用。有一次,华教授特别兴奋,说他的一部学术专著《真实与神秘——泰戈尔研究》即将出版,另一部《泰戈尔传》也将在台湾出版。他还谈了中国古代著名思想家老子对泰戈尔哲学体系的影响。

我陆续收到华教授编的有关泰戈尔的书。如《泰戈尔散文诗全集》(浙江文艺出版社,1990)、《吉檀迦利——泰戈尔散文诗选》(浙江文艺出版社,1991)、《泰戈尔诗歌精选》(北岳文艺出版社,1994)、《泰戈尔诗选(导读版)》(浙江文艺出版社,2001)等,有的还有精装本、豪华本。他在信中还说将出版《泰戈尔研究论文集》、《泰戈尔中短篇小说精选》,翻译《泰戈尔自叙》,成为一个系列。他的这些著作中,《泰戈尔散文诗全集》获第一届全国优秀外国文学奖和第五届全国图书“金钥匙”奖。

华宇清教授甘于寂寞,一心扑在学术上,不愿张扬,更不屑炒作。1994年12月9日,他在信中说:“在学术上要搞出一个体系是很难的,我正在努力。我只想默默地工作,不想宣传。因为与老一辈专家如袁可嘉、季羡林等是不能比的,我非常钦佩他们,我们的功底与他们差得太远,所以只有老老实实地学习才好。”当时他已是杭州大学中文系的教授,全国有名的外国文学专家了。

记得2002年6月,华教授在回乡为他的89岁老母建造新居时曾破例接受家乡媒体《慈溪日报》的采访,但他照例不谈自己的学术研究,只谈家乡的变化、童年的往事和对朋友的思念、对老母的孝心,害得记者花了不少精力搜集他的材料和著作,然后写成《不愿张扬的华宇清教授》公诸报端。记者在文中说:“虽然华教授学术成果累累,但家乡并没有很多人知晓,这是因为他不愿张扬,喜欢低调自己。他不喜欢记者采访他,也不愿媒体宣传他,但他喜欢跟晚辈交流。他从不摆架子,总喜欢以诚相待,以朋友的身份和人交谈。他是位谦虚、热情、和善又风趣的老人。他思路敏捷,语言跳跃飞快,往往在说甲的时候,又说到了乙,然后又延伸到丙,和他在一起,总让人受益匪浅又让人快乐无穷。”记得那天他来我的书斋,直夸我的书比他还多,说一个人能坐拥书城,宠辱皆忘,是人生一大快事。同时,能有几个志趣相同的朋友相往来,谈天说文,交流读书心得,彼此获得精神上的愉悦和满足,是可遇而不可求的。未经此道者,难以体会,所以更显得珍贵。

华教授极重乡情、人情、友情,凡是与他有过交往的人,无论是同事、学生还是素不相识的读者,他总是热情相待,有求必应。他曾在家里设宴招待我,甚至他回家乡时与学生、亲友相聚时,也是他掏腰包作东,弄得我们很不好意思。有一次——1998年3月15日,他来慈溪讲课——辅导外国文学,附近几个县市的电大自大考生都慕名前来,课堂坐了好几百人,连走廊都挤满了。他操着家乡的口音,连续讲了三个多小时,把课程重点都罗了一遍。据说效果极佳,许多考生后来都取得了满意的成绩。那天中午,他回绝了主办单位的宴请,叫了几个学生、朋友聚餐,事先申明由他买单,反客为主,其乐融融。

铁路信号故障诊断专家系统研究 篇6

目前, 集通铁路公司管内各站均已安装2006版或2010版微机监测系统, 该系统在一定程度上提高了铁路电务设备的维修先进性, 很多故障可以通过人工查看曲线、分析数据等监测系统提供的功能, 通过人工分析定位故障点, 解决故障。但是微机监测系统的应用在一定程度上也存在很多弊端, 如需要人工分析数据、人工给出故障解决方案、监测的数据很多, 但并不是所有数据均能应用、瞬间故障不能捕捉等问题。针对微机监测系统的各种问题, 笔者研究了铁路信号故障诊断专家系统, 该系统设计的目的是在分散的、孤立的、断续的数据中发现关联的、综合的、连续的事物变化规律。用高效、高水准的计算机实时智能分析替代人工数据分析, 最大限度地提高微机监测数据的利用率[1]。因此信号故障诊断专家系统是根据微机监测数据捕捉到的各种异常信息来动态分析信号设备变化趋势的智能分析系统。

1 系统设计目标

1) 预防事故。通过对微机监测的实时数据进行跟踪分析, 可以发现设备变化规律、变化趋势, 为状态抢修提供科学依据, 是信号故障诊断专家系统的基本任务。

2) 提高故障处理效率。系统根据专家提供的故障检测与诊断领域的知识构成知识库, 借助推理机, 进行推理, 对故障进行检测和定位, 使技术人员加快故障诊断的过程。

3) 提高维修管理水平。该系统通过总结故障统计分析中发现故障处理规律、设备应用规律、维修管理规律, 为信号维修决策及职工教育提供帮助。

2 系统结构

信号故障诊断专家系统的核心是建立专家分析系统, 根据信号设备原理, 在计算机中虚拟信号设备, 然后输入实际设备的实时数据, 让专家分析系统来实时跟踪、分析信号设备的实际变化情况[2,3]。系统基本由三部分组成:信号知识库、站场仿真、故障处理。系统结构见第100页图1。

1) 信号知识库。信号知识库主要构成包括:专家系统所需的铁路基础数据、字符、图符;各种行业标准、规范;信号专业技术标准、设备标准、器材标准;专家、现场技术人员经验;专家系统各种标准等[4,5]。

2) 基础数据及处理。基础数据包括:道岔数据、轨道电路数据、信号机数据、区段数据、进路联锁表、微机监测数据等, 通过提取其他系统信息及人工录入的方式, 经过数据的校验, 组成了系统仿真及故障处理的基础数据。

3) 故障处理。信号知识库通过对提取的异常数据进行对比、分析、推理, 给出故障范围, 定位故障点, 提出故障解决方案, 并将相应的故障设备变化在站场中展示, 给出报警。

3 系统功能

1) 站场仿真。信号故障诊断专家系统的站场仿真就是通过软件设计反映信号设备、信号控制系统的真实工作情况。通过提取轨道电路、道岔、信号机等设备数据, 将以上各设备状态真实反应在计算机上。

2) 模拟量实时分析。模拟量实时分析的任务是通过模拟量分析捕捉设备瞬间故障, 发现设备的变化趋势, 是提供状态抢修的重要依据。

3) 故障显示。当故障发生后, 系统在故障窗口内不仅显示故障提示, 还直接显示故障位置的图纸, 给出报警。

4) 故障分析报告。信号专家系统将故障分为:故障和异常两种, 故障是导致信号设备产生故障现象或可能影响信号设备使用;异常是没有导致信号设备产生故障现象或暂时不会影响信号设备使用的故障。

专家系统对故障和异常进行详细记录, 并根据详细记录, 提供24 h内的设备变化情况的分析报告。分析报告中给出故障原因、故障处理方案及维修维护注意事项等[6]。

5) 维修分析报告。有许多异常, 不需要立刻解决;还有一些异常, 不能立刻说明问题的, 需要时间进行观察。系统对这些异常进行连续追踪分析, 提出维修指南, 进行有针对性的维修工作, 提高维修效率。

6) 其他功能部分。该系统还包括基础数据更新、知识库自学习、网络存在与打印等功能, 这些功能使系统更具有扩展性和活力, 为现场维修人员提供人性化的操作。

4 结束语

信号故障诊断专家系统的设计目的是最大限度的提高了微机监测数据的利用率, 方便快捷的为维护人员提供信号设备运行状态、故障处理方案, 提供设备及运用质量数据分析报告, 实现设备应用质量的动态监测分析, 缓解维修人员工作压力, 又保证了运输安全。但是该系统还有很多不足, 如:对知识库进行推理分析的模型、知识库中知识的正确性, 有待进一步研究。

参考文献

[1]沈宇.智能分析系统在高速铁路信号系统中的应用[J].铁道通信信号, 2012, 48 (1) :26-28.

[2]常栓定.TJWX-2000型微机监测系统研究与分析[J].铁道工程, 2007, 4 (2) :16-18.

[3]王民湘.铁路信号微机监测智能分析与设备运用管理系统[J].铁道通信信号, 2011, 47 (5) :21-22.

[4]徐扬.模糊模式识别及其应用[M].成都:西南交通大学出版社, 1999:180-182.

[5]章卫国, 杨向忠.模糊控制理论与应用[M].西安:西北工业大学出版社, 1999:120-123.

一种评估专家系统的研究 篇7

关键词:评估树,专家系统,评估,飞行器,数据库,规则,知识库

0 引言

高速航天飞行器在试飞过程中, 航天工作人员通过航天测控系统[1]所测的大量参数和图像进行监视, 分析和推理, 最后得出飞行器飞行状态的结论。该过程复杂且容易出错, 需要以一种更加智能和高效的评估模式替代。专家系统[2]是用专家知识解决复杂问题的智能计算机程序, 它是具有大量专门知识和经验的程序系统, 它利用人工智能技术和计算机软件技术, 进行推理和判断, 模拟人类专家解决问题的过程, 解决那些需要人类专家处理的复杂问题。因此, 本文通过分析飞行器状态评估的数据和评估流程, 提出一种基于评估树模型的评估型专家系统设计。主要针对飞行器任务评估知识的表示以及推理过程中的效率和不确定性的处理等方面进行了研究和设计。该系统采用产生式知识表示方法, 建立以数据库为基础的知识库。利用评估树[3]的方法对飞行评估过程进行分类, 找出各个飞行过程中的关键动作及其依赖的评估参数, 利用评估树转换成专家系统的推理规则。在推理过程中, 采用不确定性推理, 通过已有事实, 启发式知识和规则, 对当前飞行状态进行推理, 得出飞行状态评估结果, 并给出评估结果的可信度。该系统能够即时完成飞行状态的相应评估, 能够得到具有价值的评估结果和详细解释, 具备一定的故障诊断功能, 有利于飞行任务知识的积累和飞行评估效率的提高。

1 评估专家系统的结构

飞行器任务评估专家系统总体设计如图1所示, 主要包括人机接口, 推理机, 解释程序和知识库管理程序组成。用户通过人机接口将推理目标和证据 (基本评估项) 添加到推理机, 推理机通过知识库中的知识进行推理, 将推理出的评估项放入全局数据库中, 并记录推理过程。解释程序通过全局数据和知识库知识对评估结论、评估过程以及系统当前的评估项状态做出解释。用户比较关心的是评估结论的解释, 系统采用解释树的形式直观地逐层显示, 当评估项出现异常时, 查看其解释其实也是对该异常的故障诊断。

2 基于评估树的知识管理

2.1 评估项分析与评估树的建立

评估项表述了被评估的系统在特定条件下各种对象的性质、状态或者关系的真实值。任务评估系统的知识库中的各条规则之间一般都是有联系的, 而且这种联系常常表现为一个规则的后件是另一个规则的前件。评估树分析法就是根据这种联系, 采用down-top的方法, 首先是以评估总的目标 (评估项) 为基础, 然后从总的目标逐级向上分析相关的小目标, 并根据彼此的逻辑关系, 用关系符号 (与或门) 来连接上下两层的评估项。

这里采用扩展的评估树分析法, 就是上下两层的评估项, 除了可以用与或关系连接外, 还扩展了其他的3种关系:非, 多数投票, 标准关系。评估树的基本符号如表1所示。

非关系表示后件评估项的值与前件的值相反;多数投票关系表示前件评估项值为1的个数超过一半, 后件评估项的值才为1;标准关系表示一般的前件约束关系, 它有一个参数值, 表示前件的值只有满足这种关系, 后件评估项的值才为1。

树形结构设计的好处是规则之间结构清晰, 层次分明。用评估树表示飞行状态评估规则如图2所示。

2.2 评估知识表示

知识表示模型有很多种, 在传统的表示法中, 常用的有框架, 语义网络或产生式规则等方法, 并在一些项目中广泛应用[4,5,6,7]。评估树主要表示因果关系, 因此, 这里借鉴MYCIN模型的确定性因子CF (certainty factors) 模型[8], 采用扩展的产生式表示法来表示知识。扩展的产生式规则的一般表示方法如下:

CFi为规则Ri的确定性因子 (置信度) , 表示前件与后件的充分必要的程度。LS为规则前件的集合, RS为规则的后件集合。基于评估树的分析法, 树中的节点可以转换成评估项, 而父、子节点之间的关系则可以被转换成知识库中的规则。图2所示的评估树可以转换得到x1等7个基本评估项, y1等8个中间评估项。转换的7个规则如下表2所示。

2.3 知识的数据库管理

基于数据库的知识库管理是将数据库 (DB) 与知识库 (KB) 集中到一个大型应用系统中实现统一的操纵和管理[9]。因此, 本文提出采用基于数据库的评估知识的表达构造整个专家系统的知识数据库。这里将介绍几个重要的表:评估项表 (Assess Item) , 规则表 (Rule) , 前件/后件表 (LRs) , 见表3、表4、表5。

专家系统主要运用value (值) 属性进行推理。评估项的值存在3种状态:0 (异常) , 1 (正常) , 2 (不确定) 。置信度表示评估项值状态的可信程度。

关系表示前件约束的关系, 一般是与, 或, 非, 标准等的关系。评估知识存在一定的不确定性, 因此, 其中的置信度是表示该规则的前件与后件之间的充分必要程度。

规则id标示规则, 来源于Rule表的id字段;评估项id来源于Assess Item表的id字段。字段flag表明表中的规则和评估项的关系。若为flag为1, 表示评估项作为规则的前件, 否则, 表示评估项作为规则的后件。

3 推理机设计

3.1 推理过程分析

任务评估系统的推理机制采用启发式的正向推理结构[10]。通过对基于规则推理技术的研究和分析, 这里给出基于规则的启发式推理机制。其推理流程如图3所示:

1) 推理开始时, 设定推理目标;

2) 由知识库中的规则, 通过rete算法, 建立rete匹配网络;

3) 添加已知证据 (基本评估项) , 并将其加入rete网络;

4) 得到规则匹配集合;如集合为空, 推理失败结束;否则, 在元知识指导下对规则进行冲突消解;

5) 执行规则, 将规则后件加入rete网络;

6) 判断评估目标是否已出现, 如出现, 推理成功结束;否则, 转4) 。

推理机的性能主要受规则前件匹配算法及其搜索算法的影响, 因此, 这里采用rete匹配算法, 并且采用内存数据库辅助完成推理机的设计和实现。这样可以充分应用内存数据库方便的数据管理及其高速索引算法, 进一步增强推理机性能。

3.2 冲突消解策略

冲突消解是指同时有多条规则前件满足的情况下, 从其中选择一条规则来执行的过程。这里采用元知识的启发式冲突消解策略, 利用规则的优先级priority, 置信度credit以及前件个数left Count等参数信息, 通过综合评价函数来对规则的执行排序。

表6列出了3个参数的情况。参数Left Count的取值范围假设为[1, n], 当n超过10的情况可以按照10来处理。因此, 将综合评价函数定义为:

推理机将优先选择S (r) 值大的规则执行。若有多条规则的S (r) 值相同、且最大时, 推理机判断其priority参数, 优先取值大的规则执行;若同时priority参数也相同, 推理机将从中随机选择一条规则来执行。

3.3 推理的不确定性处理

不确定性推理是从不确定的初始证据出发, 通过运用相关的不确定知识, 最终推出后件的置信度值。在不确定性推理中, 知识和证据都具有某种程度的不确定性, 这里主要讨论不确定性的测度以及推理过程中不确定性的传递算法。

本文提出的系统中知识采用置信度CF (H, e) 作为不确定性的测度。CF (H, e) 表示由证据e得到假设H的不确定性因子。设规则的一般格式为:P≥Q, 则计算CF (Q, e) 的基本公式为:

本文在将评估树转换为规则时, 根据规则前后件的关联程度, 领域专家为规则给定一个置信度的值, 即上式中的CF (Q, P) 。规则前件的置信度CF (P, e) 由专家或者证据判断程序根据已知证据e的情况给定。规则后件的置信度CF (Q, e) 是通过基本公式或者置信度传播公式计算得来。

对于置信度的传播算法, 这里给出一组简单的传播公式。假设规则为R, 置信度为CFrule, 其前件有n个评估项, 分别为F1, F2, …, Fm, …, Fn, 它们的可信度分别为:CF1, CF2, …, CFm, …, CFn。设F1, F2, …, Fm为n个前件事实中的值为1的m个事实。规则后件为Fx, 其可信度为CFx, 规则前件之间的关系为Relation。CFx计算方法如表7所示。

4 结语

本文针对飞行器飞行任务评估的特点, 基于评估分析树技术提出了一种评估专家系统设计方案, 并对知识表示及推理等方面作了详细地分析和介绍。结合产生式表示法和数据库知识管理技术, 采用启发式不确定性正向推理模型, 增强专家系统的知识表达与管理能力, 提高了评估推理效率。通过实践表明, 该评估专家系统运行良好, 评估迅速, 维护方便, 能够有效可靠地完成飞行任务评估。

参考文献

[1]夏南银, 张守信, 穆鸿飞.航天测控系统[M].北京:国防工业出版社, 2002.

[2]张煜东, 吴乐南, 王水花.专家系统发展综述[J].计算机工程与应用, 2010, 46 (19) :43-47.

[3]陈文伟, 陈晟.知识工程与知识管理[M].北京:清华大学出版社, 2010.

[4]黄洪, 任卫红, 余达太, 等.基于故障树的等级测评专家系统模型研究[J].计算机应用研究, 2010, 27 (1) :204-208.

[5]孟祥朋, 李决龙, 张炎文.基于专家系统的建筑自动化系统故障诊断[J].计算机工程, 2011, 37 (21) :273-278.

[6]伍丽峰, 陈岳坪, 聂小东, 等.基于面向对象和数据库技术的机床选择专家系统[J].机械设计与制造, 2011 (10) :71-73.

[7]黄建, 胡晓光, 巩玉楠, 等.高压断路器机械故障诊断专家系统设计[J].电机与控制学报, 2011, 15 (10) :43-49.

[8]林晓强, 常国岑, 杨凡, 等.态势评估专家系统的知识库研究[J].火力与指挥控制, 2008, 33 (7) :64-66.

[9]康雪峰, 周洪玉, 李振加.基于数据库技术的面向对象知识表示[J].哈尔滨理工大学学报, 2001, 6 (3) :1-3.

专家研究 篇8

所谓烧结就是在粉状铁物料中配入适当数量的熔剂和燃料, 在烧结机上点火燃烧, 借助燃料燃烧的高温作用产生一定数量的液相, 把其他未熔化的烧结料颗粒粘结起来, 冷却后将铁矿粉烧结成多孔质块矿, 作为炼铁原料[1]。

专家系统 (Expert System) 是人工智能领域中的一个重要分支。所谓专家系统, 实际上是以知识库为核心进行问题求解的计算机程序, 即基于知识的智能系统。烧结过程控制专家系统, 根据烧结过程控制的特点, 采用数学模型和知识模型相结合的控制方法, 以知识模型为主的控制策略[2]。

2 控制模型建立

烧结生产工艺流程分为原料准备及运输系统、配料系统、烧结机系统和成品贮运系统。控制系统[2]的主要功能是连锁控制烧结生产各系统的工艺设备, 管理控制配料槽、返矿槽、混合料槽、铺底料槽及环冷机矿槽料位。自动配料控制, 在原料准备及运输系统中对各种含铁料在精矿库通过圆盘给料机做一次配料, 混合后由配料系统控制混匀铁料、白云石、石灰石、生石灰、焦粉、煤粉、冷返矿、热返矿和灰尘等物料的下料量。控制对混合料的自动加水, 通过在恒定负压下测定通过料层的空气流量来监测料层的透气性。点火炉燃烧自动控制, 并根据沿台车横向设置的雷达料位计测定的料位平均值, 对料层厚度的横向和纵向进行自动控制。按最后几个风箱废气温度来计算烧结终点, 调整台车速度使终点控制在倒数第几个风箱上, 控制烧结过程的终点。以及控制烧结机、圆辊给料机和环冷机的速度, 主抽风机及主电除尘系统。电气传动及其自动控制的内容大致是各电气装备的启动、停止、顺序控制及连锁。

3 燃料比率控制模型的研究

3.1 概述

燃料比率控制模型 (FRC) 是I级控制模型。用于烧结混合料中燃料比率的在线控制。

模型为了保持烧结混合料中碳 (C) 含量的稳定, 考虑了燃料中的碳含量和湿度。并且根据燃料B控制返矿量。因此, 在模型中不同的燃料百分比对应不同的返矿量。

燃料控制是在配料室中, 两个燃料仓的三个下料口 (#12、#13A、#13B) 来实现的, 通常使用两个下料口。所以, 模型需要考虑到两个下料口之间的延时和料流变化。根据仓号大者为最后的调整仓。

燃料比率控制模型的控制方案是:燃料A、燃料B分别单独控制, 根据二级系统下传的数据 (配比、碳含量、水含量等) , 对燃料A和燃料B下设定值, 并且根据返矿的实际下料量对燃料B的设定值进行调整。

模型输入参数:

混合料总料量、配料室燃料A实际下料量、燃料A湿度测量值、燃料A碳含量的分析值、配料室燃料B实际下料量、燃料B湿度测量值、燃料B碳含量的分析值、返矿总量、过程延时。

一级控制系统模型输出:配料室中燃料A和燃料B的设定值的依据

一级控制系统控制变量:烧结混合料中C的含量、返矿量

3.2 参数说明

参考文献

[1]傅菊英.姜涛.朱德庆.烧结球团学[M].长沙:中南工业大学出版社, 1996.

[2]马竹梧.冶金原燃料生产自动化技术[M].北京:冶金工业出版社, 2005:153-232.

[3]王万森.人工智能原理及其应用[M].电子工业出版社, 2000:118-124.

专家系统的汽车故障诊断研究 篇9

专家系统 (Expert System, ES) , 也称基于知识的系统 (Knowledge Based System, KBS) , 是人工智能 (Artificial Intelligence, AI) 的一个新的分支, 也是发展最快的一个分支。ES实际上是AI计算机程序系统, 它能利用目前大量人类专家的专门知识和方法来解决现实生活中某些复杂的重要问题。

1.1 母科学创立期 (1965年前)

1956年夏, J.Mc Carthy, M.L.Minskey, C.E.Shanon, N.Lochester等人在美国新罕布什尔州的Darmouth大学举行研讨会, 共同探讨用机器模拟人类智能行为的各种问题, 并在会上首次正式使用“Artificial Intelligence”这一术语, 标志着一个新兴学科———人工智能 (AI) 的诞生。

1.2 初创期 (1965~1971年)

1965~1968年, 斯坦福大学计算机系的Feigenbaum及其硬件小组开发出启发式DEN-DRAL系统, 用于解释化合物结构。于是, AI的一个新的研究领域———ES诞生了。其后, 各个领域的各类ES如雨后春笋, 纷纷出现。

1.3 成熟期 (1972~1977年)

20世纪70年代ES趋于成熟, 先后推出了一批卓有成效的ES, 在诊断 (医疗、机电、故障) 领域尤为突出。

1.4 扩展期 (1978年至今)

随着ES的逐渐成熟, 其应用领域迅速扩大, 所处理问题的难度也不断增加。ES从原来的解释型、诊断型逐渐扩展到设计型、规划型、教育型和预测型等。同时, 为加快ES的开发速度, 人们先后研制出一批用于建造和维护ES的工具系统。当前, ES的研制正方兴未艾。

2 汽车故障诊断专家系统的建立

汽车故障诊断专家系统主要由人机接口、知识获取子系统、知识库、信息采集模块、动态数据库、推理机和解释模块等组成, 总体结构采用模块化技术, 将推理机、知识库、解释系统和知识获取系统等作为独立的模块, 这样既符合结构化程序设计的思想, 便于程序的调试、维护和系统功能的扩充, 又利于知识库的维护管理和保证推理机制的独立性, 为以后在此基础上进行系统升级、扩充提供了可行性。

2.1 知识库

知识库是专家系统的核心, 其主要功能是存储和管理专家系统的知识。为了更好地对知识库进行管理和维护, 知识库分成两部分, 即实例库和规则库。2.1.1实例库。实例是指以前成功解决过的问题或案例。根据汽车的结构特点, 实例库下设3个子库 (发动机库、底盘库、汽车电器库) , 每个子库又分为若干个小块, 每个小块对应一张表。例如, 汽车电器库分为电器仪表系统、照明与灯光信号系统、汽车空调系统、汽车门窗防盗系统、安全气囊系统、汽车音响系统6个小块, 也就是说, 汽车电器子库包含6张表。每张表记录该块的所有故障诊断实例, 每个诊断实例看作是一条记录, 诊断实例所需要的参数为一个字段。2.1.2规则库。规则是表达由一定的前提推出确定的结论的知识, 故障诊断中的规则一般都是领域专家从长期的实践经验中得出的规律性的结论。汽车故障诊断专家系统的规则库包括以下几个方面:a.结构和功能知识:这类知识描述了汽车的各部分结构及它们之间的连接关系。按照汽车的结构和功能, 将诊断知识分块化, 在诊断过程中可以根据任务调用相应的诊断知识, 加快诊断知识的搜索。为了描述这类知识, 采用一种类似框架结构, 即“诊断基元”的概念。所谓“诊断基元”, 是指指定层次上可以诊断且需要诊断的最小单元。对它的诊断要依据其输入信息或中间状态信息来完成。b.专家经验知识:车故障诊断所需要的主要部分, 用于识别汽车运行的状态和诊车的故障, 在汽车故障诊断专家中使用“产生式规则”来描述库中专家的专门知识和经验是故障树分析法来获取的, 专家启发经验是专家们在长期的实践中积累起来的, 在不确定的诊断问题求中, 专家经验显得尤为重要。c.过程性知识:过程性知识主是指:a.诊断中某些最基本的诊断任务;b.复杂计算方面的知识;c.述情况之外的有确定顺序关系的作。在汽车故障诊断专家系统中, 知识主要采用C语言中的子程或函数形式来表达。由于允许在过程中调用各种子过程, 甚至调用自从把过程知识表示成层次嵌结构, 只要调用接口不变, 局部知识的更新并不影响全局知识的表示。过程性知识表示, 具有模式化层次性的优点, 推理时可以求值的推理方式。障诊断知识库中的实例库和并不相互独立, 相反它们是有眼的。

2.2 推理机制。

推理机制决定了诊断效率的高低以及对知识处理水平的高低, 实现从已有的事实和知识得出新信息的功能, 从而揭示出蕴含在已知信息中的关于故障性质的描述。汽车故障诊断专家系统采用融合实例与规则的推理方法, 推理机制包括“诊断基元”的推理和“产生式规则”的推理两部分。2.2.1诊断基元推理:诊断基元推理的目的是找出发生故障的功能部件, 它采用正向推理的控制策略, 根据用户提供的初始故障现象或推理所得的中间结果, 找出一个或多个与该现象和事实相吻合的预选诊断基元形成假设, 然后由用户输入的信息、数据库中提供的数据及诊断基元结构之间本身所具有的继承关系, 找到最底层的诊断基元, 最后一级的诊断基元作为本次推理的结论, 开始下一级的推理。2.2.2产生式规则推理:产生式规则推理的目的是找出故障点, 即进行故障定位, 它是在诊断基元推理的基础上, 根据故障树中的各事件及获取的规则进行推理, 寻找故障原因, 完成故障最终定位。产生式规则的推理采用正反向推理的控制策略。

诊断专家系统的推理机由两个模块组成, 诊断基元推理控制产生式规则推理的运行, 产生式规则推理又调用诊断基元推理模块, 两种推理方式混合使用, 互相控制, 使推理机制更符合专家的思维过程。通过构造这样的推理机制, 减少了盲目推理, 使推理效率明显提高。

2.3 解释模块

在汽车故障诊断专家系统中, 通常结论与得出这个结论的推理策略以及关于这个结论合理性的评价需来自不同性质和类型的知识源。用到的浅层知识只能通过推理过程中对规则的跟踪向用户提供解释, 所以用户不能从根本原理上接受推理结论, 降低了结论的可信度。为了能对用户提供比较详尽的解释, 必须用到领域的深层知识。

2汽车故障诊断专家系统的运行

知识的获取、管理与维护:

汽车故障诊断这一特定领域的特点, 决定了故障诊断知识库要管理的知识具有多样性、复杂性以及模糊性等特点。另外, 要管理的知识量是庞大的, 而且故障诊断的每一步都离不开知识库的支持。因此, 知识库中知识的获取方式、知识的一致性维护和完整性检查等都是非常重要的。

汽车故障诊断专家系统知识的获取主要采取两种方式, 一是直接存入领域专家的知识, 二是专家系统自主生成的知识。a.知识的存入:知识的存入是将经过汽修领域专家认可的知识输入到故障诊断知识库中。输入知识时, 由知识工程师将汽修领域专家提供的内容严格按照知识输入的格式或要求, 规范地将相关知识输入到知识库中制定的位置。b.知识的生成:汽车维系服务用户在利用专家系统进行故障诊断时, 将每一次成功的案例进行审查, 将典型可用的案例升级为实例库中的知识;运用专家系统中的知识挖掘机制再对实例库中的实例进行研究, 挖掘出“准规则”存放在临时库中, 领域专家对这些规则进行逐一检查, 合格的即生成为规则库中的知识。

总之, 为了充分发挥该支持体系的作用汽车在诊断系统也采用了大容量的存储器, 以实时记录车辆运行状态, 记录故障发生前后的各种运行参数, 以便维修时用于分析故障发生的原因

参考文献

[1]刘克龙等.一种新型的综合型安全系统研究[J].软件学报, 2000.[1]刘克龙等.一种新型的综合型安全系统研究[J].软件学报, 2000.

专家研究 篇10

关键词:专家系统;Jess;规则;可信度;不确定性推理

中图分类号:TP18 文献标识码:A文章编号:1009-3044(2007)16-31102-02

Reasoning Research Based on Jess in Expert System

YANG A-qin,GAO Shu

(College of Computer Science & Technology,Wuhan University of Technology,Wuhan 430063,China)

Abstract:The paper introduces development platform for expert system -Jess,and applies Jess to early warning expert system for maintenance errors in civil aviation.Maintenance errors in the system are represented in the form of rule, and the reasoner adopts the method of Rule-Based uncertainty reasoning to forecast and control possible occurrences of maintenance errors effectively, and thus guarantees the safety of the fligt.

Key words:expert system;Jess;rule;uncertianty reasoning

1 引言

随着计算机技术和人工智能技术的飞速发展,专家系统也有了新的重大发展,出现了一种新技术――基于Java的规则引擎技术,如:JBoss Rules、JLisa等开源项目和JRules、Jess等商业产品都是基于Java的规则引擎技术产品。Jess是1995年由美国Sandia国家实验室分布式系统计算组成员Ernest J. Friedman-Hill用JAVA语言开发的专家系统内核。Jess非常小巧、灵活,并且是已知规则引擎中最快的。本文针对Jess在民航机务维修差错预警专家系统中的应用进行研究。

2 Jess的概述

Jess(Java Expert System Shell)是一个扩展CLIPS的基于Java平台的规则引擎。它以CLIPS的设计原理为基础进行编写,除继承了CLIPS的优点外,还具有许多自己独特的特征,如支持正向和逆向推理,可以在系统运行环境下直接调用Java的类库等。

尽管Jess可以作为一个独立程序运行,但是常常把Jess库嵌入到Java代码中,通过使用Jess的API或Java规则引擎API(由javax.rules包定义)来实现Jess相应的功能。

Jess提供了一个交互式的、命令行的开发环境,也可以使用文本编辑代码成为脚本,以批处理方式装入Jess引擎。开发Jess脚本文件的工具很多,可以采用任一款文本编辑器,或以插件的形式附加到Eclipse平台来构建Jess的集成开发环境[1]。

2.1 Jess的基本组成与知识表示

Jess的核心也是由事实库(也称为工作内存)、规则库、推理机三大部分组成,并采用产生式规则作为基本的知识表达模式。

(1)事实:在Jess中,事实分为三类:有序事实(Ordered facts)、无序事实(Unordered facts)、对象事实(Object facts)。每个事实都有一个模板(template),而每个模板有一个模板名和一系列槽(slots)组成。事实根据模板获取它的事实名称和一系列槽列表。创建模板可以使用deftemplate结构或defclass函数。其中有序事实类似于仅有一个多槽(multislot)的有无序事实。对象事实可通过defclass函数和definstance函数定义,对象事实相应类的定义由Java语言书编写,编译通过后即可动态地加入系统中。对象事实相似与Java Beans。对象事实的槽对应Java Beans中的属性,因而具有Java Beans的一些特性。

(2)规则:在Jess中,规则的表达形式沿用了CLIPS的语法结构,Jess也支持面向过程的编程方式,它提供了一些语句来控制规则后件的操作流程,如使用if…then…else和while…do…语句[2]。Jess定义规则使用了defrule函数,规则的前件由与事实匹配的模式组成,不能包含函数调用,规则后件由函数调用组成。

3 Jess的推理引擎

Jess支持前向和逆向推理两种方式,Jess的规则引擎利用著名算法Rete的改进形式根据知识库进行规则匹配来提高规则条件匹配效率。Rete算法其核心思想是将分离的匹配项根据内容动态构造匹配树,以达到显著降低计算量的效果[3]。

4 基于Jess的民航机务维修差错预警推理的研究

4.1 不确定性推理

对待一般规则e-> h,使用确定性因子描述规则强度,定义为CF(h,e) 。原始证据的确定性因子由用户在系统运行时提供,非原始证据的确定因子由不确定性推理算法得出,在实际应用中,规则强度的值由领域专家主观给出。通常使用如下算法:

(1)若已知规则强度CF(h,e)和前提可信度CF(e),则结论h的可信度为:

CF(h)=CF(h,e)×CF(e)

(2)若前提条件e是子条件ei的逻辑组合,则:

CF(e)=CF(e1 AND e2 AND … AND en)=min{CF(e1),CF(e2),…,CF(en)}

CF(e)=CF(e1 OR e2 OR … OR en)=max{CF(e1),CF(e2),…,CF(en)}

(3)若系统中有两个规则得到同样的结论,每个结论都会有一个可信度,则该结论的可信度是:(设CF1(h),CF2(h)表示从不同的规则得出的某个结论的两个可信度)

①当CF1(h)和CF2(h)≥0时:

CF(h)=CF1(h)+CF2(h)-CF1(h)×CF2(h)

②当CF1(h)和CF2(h)≤0时:

CF(h)=CF1(h)+CF2(h)+CF1(h)×CF2(h)

③否则:CF(h)=CF1(h)+CF2(h)

若有多个规则得到同样的结论,则可反复使用如上公式[4]。

4.2 Jess在机务维修差错预警系统中的进行不确定性推理的实现

由机务维修差错引起的航空灾害经常发生,且航空维护、修理是确保航空公司安全、准点运营的重要因素,同时,机务维修差错的发生很多是由人为因素引起的,人为因素引起的差错是不可以预料的、模糊的、层次不穷的、不确定的,因此利用Jess进行基于规则的不确定性推理方式,根据专家的经验知识进行快速而准确地推理,分析和识别出引发差错或不安全事件的诱因,并给出相关的对策,以避免同类差错或隐患的再次发生,消除机务维修系统的隐形失效,切断不安全事件发生链,从而提高维修质量,保障飞行安全。

4.2.1 Jess推理部分的组织结构

机务维修差错预警专家系统中有关Jess推理部分的组织结构如图1所示。

图1 Jess推理部分的组织结构

4.2.2 知识库的组织

知识库由事实库和规则库组成。在航空维修差错研究中,针对差错,分析差错的诱因,提供差错预控对策,把这些差错信息整理成规则形式来描述和表示,且这些规则应具有典型性和概括性,利用Jess实现不确定性推理。系统采用JavaBean的形式将事实和结论封装成类,对类的成员的操作不以成员方法的形式完成,而是以规则后件的形式完成,例如对于可信度的计算以规则后件的形式完成。定义的JavaBean类中CausationBean存储各种诱因,ConclusionBean存储可能导致的差错和相应对策,其中 CausationBean定义如下:

import java.io.Serializable;

public class CausationBean implements Serializable

{private String m_name = "";//诱因名

private float m_cf=0.00f;//诱因事实的可信度

public float getCf() { return m_cf; }

public void setCf(float f) { m_cf = f; }

public String getName() { return m_name; }

public void setName(String s) { m_name = s; }}

ConclusionBean定义如下:

import java.io.Serializable;

public class ConclusionBean implements Serializable

{private String m_error = "";//差错

private String m_measure = "";//预控对策

private float m_cf=0.00f;//结论的可信度

public float getCf() { return m_cf ;}

public void setCf(float f) { m_cf = f; }

public String getError() { return m_error; }

public void setError(String s) { m_error = s; }

public String getMeasure() { return m_measure; }

public void setMeasure(String s) { m_measure = s; }}

4.2.3事实模板的定义与事实

在使用Java Beans之前,首先要定义相关联的模板。而注册Java Beans是为了生成相应的模板(deftemplate),Beans的属性对应与模板的槽。利用defclass函数可以通知Jess自动生成一个特定的模板来表示特定类型的Java Beans,如。

(defclass causation examples.rules.CausationBean)

(defclass conclusion examples.rules.ConclusionBean)

在Jess中等价的模板为:

(deftemplate causation (slot cf) (slot class) (slot name) (slot OBJECT))

(deftemplate conclusion (slot cf) (slot class) (slot error) (slot measure) (slot OBJECT))

因为每个对象类都继承java.lang.Object,getClass()是java.lang.Object的方法,所以以上模板有槽“class”。槽“OBJECT”是由Jess添加的,它是与模板关联的Bean的引用。

definstance函数功能是向事实库中加入Java Beans对象事实。由于Java Beans有支持java.beans.PropertyChangeListeners特性,如果只要Bean属性发生改变,都需通知Jess,则需在definstance函数中,指定为dynamic,否则指定为static。若definstance指定为static,Java Beans对象的属性发生改变,Jess不会被通知,若需Java Bean对象属性随之发生改变,Jess中对应的对象事实的槽值也需要更新,可以使用update函数。update函数就是通知Jess更新相关联的对象事实更新槽值。

4.2.4 应用实例

在Jess中,使用defrule构造型来定义规则。根据本系统的实际情况,一条规则主要由规则前件,规则后件,规则前件的可信度,规则强度(前件对后件的支持度),结论的可信度和判断是否结论成立的阈值组成。

例如,规则库有如下规则,其规则前件由两个存在“与”关系的子条件组成,它们分别为 (causation(name "时间和人力不足") (cf?c0))和 (causation(name "工作交接不清") (cf?c1)),这两个子条件的可信度分别是变量?c0和?c1,根据3.1节第二种情况可知,规则前件的可信度为?c0和?c1中最小值;此规则的规则强度为0.8,则规则后件(结论)的可信度为0.8乘以规则前件的可信度;结论成立的阈值为0.5,如果结论的可信度大于阈值,结论成立,否则结论不成立;实现上述规则的Jess代码如下:

(defrulepppp001

?fact1 <- (causation(name "时间和人力不足") (cf?c0))

?fact2 <- (causation(name "工作交接不清") (cf?c1))

=>

(bind ?c2(* 0.8(min?c0?c1))

(if(> ?c20.5)

then

(bind ?sb2 (new examples.rules.ConclusionBean))

(definstance conclusion ?sb2 static )

(call ?sb2 setError"未安装所需的设备/零件" )

(call ?sb2 setCf?c2 )

(call ?sb2 setMeasure "1.增加维修人员,减少时间上的压力.2. 严格执行工作交接班制度,工作交接要有文字记录.")

(update ?sb2)

(printout t "事实: " (fact-slot-value ?fact1 name) "、" (fact-slot-value ?fact2 name) crlf)

(printout t "应用了规则pppp001 (规则强度为0.8):" crlf)

(printout t "条件1:" (fact-slot-value ?fact1 name) crlf)

(printout t "条件2:" (fact-slot-value ?fact2 name) ";" crlf)

(printout t "推出结论:" (call ?sb2 getError))

(format t ",可信度为:%.2f%n" ?c2 crlf)

(printout t "相应措施:" (call ?sb2 getMeasure) crlf crlf)))

本系统还利用了Java Swing 组件和jess的API函数来编写Jess推理过程中涉及到的用户界面,其中涉及到的jess API主要类有:jess.Rete、 jess.swing.JTextAreaWriter 、 jess.awt.TextReader。jess.Rete表示规则引擎,jess.swing.JTextAreaWriter 和jess.awt.TextReader作为Jess推理过程所需的输入输出流。通过界面输入事实到事实库中,如:工作交接不清,可信度为0.89和时间和人力不足,可信度为0.85。Jess推理的实现效果如图2所示。

5 结束语

Jess引擎是根据事实和规则来推理,且推理速度是已知规则引擎中最快的。把Jess应用到机务维修差错预警专家系统中进行不确定性推理,能有效地控制同类差错或隐患的再次发生。结合其它推理技术,如基于案例推理、基于模型推理等技术来研究航空机务维修差错预警专家系统也是目前研究的方向。

参考文献:

[1]http://www.jessrules.com/jess/docs/index.shtml.

[2]基于Java规则引擎的汽车发动机故障诊断专家系统研究与开发[J]. 交通与计算机.2005(23),5.

[3]张渊,夏清国.基于Rete算法的JAVA 规则引擎[J]. 科学技术与工程. 2006(11),6.

[4]高曙,王群,罗帆.民航机务维修差错及其预警专家系统构建[J].武汉理工大学学报(交通科学与工程版).2007(31),2.

专家研究 篇11

国务院2010年6月颁布的《国家中长期人才发展规划纲要 (2010-2010年) 》 (以下简称纲要) 明确提出, 为了加强人才工作基础性建设, 推进人才工作信息化建设, 建立人才信息网络和数据库, 政府需要积极支持社会各方力量建设完善面向市场的各类专业人才数据库和人才管理系统[1]。文本将构建一个可操作性强的实际人才评价应用平台, 该平台可以依托各期刊数据库, 自动化处理和分析文献信息, 构建各领域的专题文献库, 基于该库通过识别、筛选出各个研究领域的杰出专家, 各领域专家库的建成不仅有助于领域研究者加深对同行的了解, 而且有助于科研管理部门和社会大众把握各领域研究人员分布情况和遴选相关专家。

1 平台构建意义

1.1 对科研管理部门的科技管理决策支持

通过对专题文献库进行科研合作网络和引文网络的分析, 可以发现某学科领域的核心专家群体, 发现国家或机构研究人员的合作模式及规律, 综合运用文献计量学、社会网络分析等指标对科学家个人, 甚至扩展应用到对科研机构、学术期刊、科研项目进行学术水平的评价, 从而为科研管理部门的人才引进、项目论证、科研团队组建、科技资源配置等决策提供定量依据。

1.2 创新人才评价方法论体系

评价理论框架本身具有跨学科特征, 所涉及的学科领域主要有决策学、管理学、政策学、行为学、经济学、计量学、工程学、社会学、心理学和逻辑学等, 设计和实施科学的评价活动需要跨学科的方法, 需要不同专业领域理论的整合和综合应用[2]。在评价过程中采取了多学科方法的融合, 综合运用了以下各种方法:综合评价方法 (如层次分析法、模糊综合评判法) 、统计学方法、文献计量学方法 (如引文分析) 、社会网络分析方法 (如中心性分析等) 、心理测量方法等。

1.3 人才评价活动的科学化、智能化

在评价过程中充分利用先进的信息技术是提高评价活动效率和准确性的必然要求, 受到了科学评价界的广泛关注。本网络平台要解决海量数据的获取途径和处理、分析方法的创新以及过程的自动化问题, 实现各类数据库的数据自动采集、整理和目标关系矩阵的生成与运算, 从而实现数据处理完全自动化, 大大提高研究效率和结果的准确性, 为科学研究的深入开展创造条件。

2 系统分析与设计

2.1 系统体系结构

本系统选择的开发平台是LAMP (Linux/Apache/MYSQL/PHP) 。此开发平台具有开源、免费、跨平台、低成本的优势。这是一组常用来搭建动态网站或者服务器的开源软件, 4个部分具有很高的兼容度, 共同组成了一个强大的Web应用程序开发平台[8]。本系统采用了三层架构 (3-Tier Application) , 将整个业务应用划分为:表现层、业务逻辑层、数据访问层。区分层次的目的是为了降低层与层之间的依赖, 更利于系统功能的扩充, 并有利于各层逻辑的复用。部分功能采用了Ajax技术, 实现了异步数据传递, 使得页面无需刷新实现局部更新, 既减轻了服务器的负担, 又提升了用户体验[3]。

2.2 数据库设计

本项目数据库设计综合考虑了数据库存储优化和查询效率优化两方面的需求, 对数据库的关系表结构进行了相应的优化处理。比如优化查询语句、试验联接、并、子查询等寻找最佳查询语句, 文本检索时为了性能考虑少用LIKE关键词通配符匹配, 而考虑采用全文本搜索 (FULLTEXT) 。为经常检索的表字段建立合适的索引, 为表结构设计选择正确的数据类型等[4]。后台数据库的设计采用免费、开源数据库管理系统MYSQL, 并采用可视化的管理工具Navicat for MySQL来实现数据库的开发与管理。系统包括以下核心关系表:管理账户表、评价指标表、期刊表、论文表、主题词表、关键词表、共词表、专家表、作者对表等。

2.3 系统功能设计与实现

本系统主要包括信息采集、文献信息分析与挖掘、专家库三大模块。

2.3.1 信息采集

信息采集功能主要完成以各文献数据库 (目前, 本系统的数据源主要来自CNKI中国学术文献网络出版总库、ISI Web Of Knowledge, 以后将逐步扩展) 为数据源的自动采集、入库, 并完成数据的标准化处理, 自动建立各领域的专题文献库, 以符合深入分析与评价的需要。首先选定特定的研究领域, 构造检索式完成信息检索, 通过期刊系统的数据接口将检索结果导出为txt格式的文本文件, 然后按照分析需求解析并截取题录信息各字段内容存入数据库 (专题文献库) 。

2.3.2 文献信息分析与挖掘

文献分析主要包括基本文献分析和高级文献分析。基本分析功能实现对某领域文献库的基本分析, 主要完成基于传统的文献计量学的一些基本统计, 比如论文总数、合著论文数、作者总数、合著作者人数、合作度、合作率、词频统计与分析、作者发文数分布、期刊发文分布、机构发文分布、发文时序分布等, 还包括一些基本的社会网络指标 (包括网络节点数、边数、平均度、网络密度、节点度分布) 的统计。这些基本统计运算逻辑通过本系统的统计业务类实现了封装。统计分析结果的可视化则采用第三方绘图组件包JPGraph实现。高级文献分析模块的实现通过调用基本统计分析后生成的数据 (如词频统计生成的核心关键词表、关键词、作者的共现分析生成的共词表和作者对表) 生成相应的矩阵, 然后调用本系统的分析业务类所封装的矩阵算法进行分析处理, 得出有意义的社会变量。本模块可以将生成的各种矩阵数据 (专家合作矩阵、专家潜在合作矩阵等) 导出为Excel格式、UCINET专用的数据语言文件 (DL file) 格式, 可以方便地导入SPSS或UCI-NET进行更深入的数据分析与挖掘。

2.3.3 专家库

专家库主要实现识别并筛选指定研究领域的专家, 构建各领域的人才库, 并进行评价和各种分析。包括专家识别与筛选、专家地图、专家检索和专家评价输出4个子模块。

(1) 专家识别与筛选。通过分析专题文献库 (作为专家数据源) , 提供各种组合筛选条件 (发文数、期刊级别及影响因子、被引用频次、H指数、社会网络中心性指标等) 并由用户定制, 然后根据用户定制条件从专题文献库提取专家基本信息 (如姓名、单位、研究专长领域等) 并计算该专家的相关特征数据, 包括发文指标 (发文数、第一作者发文数、个人独著发文数) 、引文指标 (被引用频次、高被引论文数、H指数) 、社会网络指标 (度中心度、中间中心度、结构洞约束系数) 等, 经过评价模型运算后将和评价数据一起存入该领域专家库。专家库会按照综合排名进行列表输出, 点击每一个专家条目则进入该专家主页。

(2) 专家地图。专家地图是专家库系统的一个用于可视化展示的功能, 其基于专家库的各种数据, 通过Google Maps API实现了地理信息和专家信息的有效整合, 实现了专家相关信息的可视化展示。专家地图是通过google地图加载专家基本信息 (姓名、所在机构、研究领域等) 和评价信息 (发文数、引用次数、度中心度等指标的原始数据及其排名) , 通过google地图这个媒介直观呈现本学科领域专家的地域分布, 使得专家的相关信息得以可视化展示。

(3) 专家检索。主要包括两部分:第一部分是专家库的多途径关键字 (包括按题名、作者、机构、关键词、摘要、全文等) 检索, 通过关键字匹配实现精确或模糊检索, 输出该专家基本信息和相关文献列表;第二部分是作者合作关系网络检索与可视化呈现 (作者间的合作关系和潜在关系的揭示) , 可以任意指定一对作者, 系统可以输出他们之间的所有最短路径, 包括联系他们的作者及其文献信息, 这是基于图论的Dijkstra算法并作出改进后实现[5]。

(4) 专家评价输出。基于构建的各领域专家库实现专家的综合评价与单项指标评价, 各种评价结果便于科研管理部门和相关领域研究者全面了解和把握本领域的专家绩效、学术水平和影响力。本模块包括指标库管理、评价模型运算等功能。指标库管理包括专家评价指标库的增、删、改、查等基本功能。其中, 评价指标库的权重生成采用了层次分析法 (AHP) 实现, 层次分析法的算法封装在了系统的评价业务类中。评价模型运算通过调用评价指标库的指标及其权重数据, 同时调用评价业务类的评价算法实现各一级指标排序和综合排序, 并自动生成各种评价报表, 包括各个二级指标的单项排名和综合排名。

3 结语

本文搭建了一个专家评价网络信息服务平台, 目的是通过该平台满足科研工作者和科研管理部门的关于领域专家的各种信息需求。平台依托各期刊数据库, 实现了自动化的文献信息处理和智能化的分析挖掘, 能对目标研究领域的学科知识结构进行一定程度的揭示, 并运用社会网络分析方法对科研工作者 (潜在) 合作关系的网络结构进行挖掘, 以发现核心作者群体及其相互联系。同时, 本文提出了一个实用的科研人才评价体系, 综合运用文献计量学、社会网络分析的指标进行专家评价及排名, 并通过Google Maps API实现专家的地域分布及相关评价信息的可视化展示。关于专家个体内在特性的各种心理特质、道德水准的衡量, 由于采用的测量及评价方法属于间接测量和心理映射, 所以并没有纳入综合排名计算中, 而是作为单独的模块提供, 作为用户单位在择人、用人方面测试评价使用[6]。

参考文献

[1]中央人才工作协调小组办公室, 中共中央组织部人才工作局.国家中长期人才发展规划纲要 (2010-2020年) 学习辅导百问[M].北京:党建读物出版社, 2010.

[2]邱均平, 文庭孝.评价学理论、方法、实践[M].北京:科学出版社, 2010.

[3]叶新伟.PHP+Ajax Web2.0编程技术与项目开发大全[M].北京:电子工业出版社, 2008.

[4]BEN FORTA.MySQL crash course[M].Beijing:Posts&Telecom Press, 2009.

[5]周益民, 孙世新, 田玲.一种实用的所有点对之间最短路径并行算法[J].计算机应用, 2005, 25 (12) :2911-2922, 2934.

上一篇:播发平台下一篇:评价式教学