关联计算

2024-05-10

关联计算(精选10篇)

关联计算 篇1

随着计算机在人们生活中的日益普及,越来越多的人接触到了网络,并通过网络进行学习、娱乐、工作。可以说,在现代化的生活中,计算机在人们的生活中有着重要的地位。但是,随着网络带给人们便利的同时,计算机网络的安全问题也渐渐暴露出来,尽管我们现在使用的计算机中有着多种的防毒软件、防火墙的保护措施,但是计算机用户的信息还是存在着被入侵、盗用的风险,因此,更为合理、先进的入侵检测系统的开发及应用是现代计算机发展的迫切要求,也是保障用户安全的有力措施。

1 网络入侵检测技术

在计算机的防入侵系统中,计算机的入侵检测技术可以说是防火墙的坚实后盾,这一技术对计算机的安全防护具有重要的意义。在以往的入侵检测技术中,传统的入侵检测方法对与其模式特征相匹配的入侵方式具有较为灵敏的检测度,检测的准确性较高。但是,相对于未知类型的入侵而言,这一检测方法就表现出较大的缺陷。对计算机入侵检测的研究是从上个世纪80年代开始的,并逐渐成为了人们研究的重点内容。目前,使用的最为广泛的入侵检测技术仍然是与传统的入侵模式相匹配的检测技术。这种方法的检测准确性较高,但在飞速发展的计算机技术中,针对于新的入侵方法的检测技术还有待更新。本文中将针对于关联规则进行入侵技术的研究。

2 关联规则算法

关联规则是指,从现有的数据中挖掘各种数据之间的关系,这一关联规则的提出是在上世纪,并且在当时的商业系统中有所应用,这一规则的提出和应用为其以后的发展奠定了基础。关联规则的定义有以下的几种类型:关联规则可以用一个集合的形式来表示,例如:假设有一个集合M{m1,m2……mn},M是一个含有数据项的集合,称为项集。若集合N是一个数据事务集合,任意一个数据集合都含有数据事物A,并且每个A都有独特的标志,这个标志就是ITD标识。集合A真包含于集合M,其中的项集也真含于M,并且各项集无交集,这样就可以得到各项集之间的关联规则。在计算机入侵检测系统中引入关联规则是为了找出各个数据之间的关系,同时也是对集合与集合之间进行区分的一种方式。

在关联规则中,还涉及一个支持度,简单来说,支持度是指集合N其中所包含的各项集的事物数与集合N之间的比值,换句话说就是各项集在集合N中出现的概率。

在关联规则中还有一个十分重要的概念就是置信度。关联规则中的置信度和概率论中所说的置信度概念相近。关联规则中的置信度也可以用条件概率符号表示。

3 关联规则在计算机入侵检测中的应用

3.1 基于关联规则的入侵检测体系结构的建立

现在使用的较为广泛的入侵检测系统是在关联规则的基础上建立的,这一系统的实现可以通过检测模型的构建来实现,这一模型的主要的工作过程如下:首先,这一模型需要从网络环境中进行数据收集,接下来对收集到的数据进行干预处理,随后将处理过的数据进行转移,将它们放到数据库中,然后利用入侵检测模型对这些数据进行相应的入侵检测和行为判断。如果检测系统能够准确地将这些数据判断为入侵行为,系统就会直接进行下一步的入侵处理,如果这一模型不能够将其检测为入侵行为,则需要对这些数据进行详细的记录,以便于日后的处理,其模型如图1与图2所示。

3.2 基于关联规则入侵检测系统地运行

上文对基于关联规则建立的入侵检测系统模型进行了详细的介绍,下面将对这一模型的入侵检测系统的运行方式进行详细的介绍,它的运行过程中涉及的模块主要有数据采集模块、数据处理模块、AFP检测代理模块以及决策相应模块等几部分。

数据采集模块进行的主要是数据采集的工作,换句话说就是,在入侵检测系统收集到的众多信息中,数据采集模块会对其中具有用户行为代表性的数据信息进行筛选,例如,系统会根据用户对某一网页的浏览次数或者是某类信息的关注程度对这类信息进行筛选,而用户涉及较少的信息内容则可以不进行关注。入侵检测系统中进行的数据采集过程是依托于计算机强大的数据支持,因此,只要信息收集过程中收集到的数据足够准确、可靠,并且信息的来源范围足够广,相关入侵行为在计算机中被检测出的可能性就越高。

数据处理模块是对入侵检测系统中采集模块采集到的数据进行处理的地方。在数据采集的过程中,由于信息量较大且来源广泛,因此采集到的数据可能会存在不完整、繁冗或是相关性差等特点,因此,这些数据需要在数据预处理模块中进行加工处理。数据的预处理模块会对原始数据中不完整的部分进行补充,对与系统中的关联规则无关的数据进行清除,然后将上述处理过的数据放到数据库中进行储存,然后将处理好的数据向下一模块传递。

AFP检测模块主要是接收来自于预处理模块的数据并对其进行进一步的处理,首先,AFP模块会根据这些数据的类型以及用途将其分为两个集合,一个是训练集,另一个是测试集。对于被分配到训练集中的数据来说,系统会对其进行关联规则的挖掘,以便于对其中的不同来源、不同属性的数据进行分类,而归属到测试集中的数据则需要与规则库中的规则数据进行相应的比对,从而有效的判断出这一数据是否为入侵行为,被判断为入侵行为的数据需要接受下一环节步骤的处理。

对入侵行为进行处理的环节就是我们所说的决策响应环节,这一环节是对关联规则模块挖掘出的规则,在相关系统的配合和指导下进行入侵行为检测。我们可以将系统响应的方式分为主动和被动两种,如果系统中的响应模块无法准确的判定入侵行为,则需要将这一情况报告给计算机的安全员,由人为进行干预处理,具体的处理方式由安全员进行判断。

4 入侵检测发展趋势展望

在现代计算机技术的发展中,每天的网络数据是十分庞大的。随着现代化的基于数据挖掘技术的操作系统日益的复杂,现阶段的网络流量数据也非常的大,对数据的审计速度也有了一定的提高。对系统中出现的异常程序和存在的入侵行为进行准确地分辨并将结果快速的传输到处理器中,是今后对计算机网络技术开发中需要高度关注的问题。今后,数据挖掘中的关联规则在计算机中的应用将有助于对用户特征进行识别,并对用户的安全性进行一定的记录,在今后的安全事件中进行自动识别。

5 结语

综上所述,计算机网络在人们的生活中有了越来越高的地位,因此,入侵检测方法也应该朝着多样化的方向发展。就入侵检测技术的发展现状而言,对于入侵检测技术并没有一个统一的安全性能评价标准,目前所开发的各种检测方法和产品中也都存在着一定的缺陷。所以说,在关联规则基础上建立的全面的入侵检测方法是计算机入侵检测技术发展的一个重要方向。

摘要:当今社会中,计算机网络技术成为了人们生活中必不可少的一部分,因此,网络环境的安全问题也逐渐成为人民群众最为关心的问题。随着人们对计算机的使用越来越频繁,计算机暴露的问题也越来越多,计算机中针对于传统入侵方式的检测技术已经不能够满足现代社会的需求,因此,如何有效地进行入侵检测并及时的控制,是计算机技术发展的重点。对此,本文将结合入侵检测技术的发展现状和趋势,对关联规则基础上的计算机入侵检测方法进行介绍。

关键词:关联规则,计算机,入侵检测

参考文献

[1]林涵.基于关联规则的计算机入侵检测方法[J].经贸实践,2015(11):176.

[2]侯君华.基于关联规则的计算机入侵检测方法[J].才智,2014(10):341.

[3]杜旭光.基于多维关联规则的入侵检测方法研究[D].燕山大学,2014.

[4]高苗粉.入侵检测方法的研究现状[J].电脑知识与技术,2013(33):12.

[5]王国栋.入侵检测方法浅析[J].科技创新导报,2008(5):02-03.

关联计算 篇2

第一章 总则

第一条 为保证投资管理有限公司(以下简称“企业”)与关联方之间的关联交易符合公平、公正、公开的原则,确保企业的关联交易行为不损害企业和非关联合伙人的合法权益,根据《中华人民共和国合伙企业》(以下简称《企业法》)、《企业会计准则—关联方关系及其交易的披露》等有关法律、法规、规范性文件及《企业章程》的有关规定,制定本制度。

第二条 企业与关联方之间的关联交易行为除遵守有关法律、法规、规范性文件和《企业章程》的规定外,还需遵守本制度的有关规定。

第二章 关联方和关联关系

第三条 企业关联方包括关联法人和关联自然人。第四条 具有以下情形之一的法人,为企业的关联法人:(一)企业的投资者创办的企业;

(二)由前项所述法人直接或间接控制的除企业及其控股子公司以外的法人;

(三)由本制度第五条所列公司的关联自然人直接或间接控制的或担任董事、高级管理人员的,除公司及其控股子公司以外的法人;

(四)企业根据实质重于形式的原则认定的其他与企业有特殊关 系,可能造成企业对其利益倾斜的法人。

第五条 具有以下情形之一的自然人,为公司的关联自然人:(一)企业的投资者;(二)公司的执行合伙事务人;

(三)本制度第四条第(一)项所列法人的董事、监事及高级管理人员;

(四)本条第(一)、(二)项所述人士的关系密切的家庭成员,包括配偶、父母及配偶的父母、兄弟姐妹及其配偶、年满 18 周岁的子女及其配偶、配偶的兄弟姐妹和子女配偶的父母;

(五)公司根据实质重于形式的原则认定的其他与企业有特殊关系,可能造成企业及其利益倾斜的自然人。

第六条 具有以下情形之一的法人或自然人,视同为公司的关联人:

(一)因与企业的关联人签署协议或作出安排,在协议或安排生效后,或在未来十二个月内,具有本制度第四条或第五条规定情形之一的;

(二)过去十二个月内,曾经具有本制度第四条或第五条规定情形之一的。

第七条 关联关系主要是指在财务和经营决策中,有能力对企业直接或间接控制或施加重大影响的方式或途径,包括但不限于关联人与企业存在的股权关系、人事关系、管理关系及商业利益关系。

第八条 关联关系应从关联方对企业进行控制或影响的具体方 式、途径及程度等方面进行实质判断。

第三章 关联交易

第八条 关联交易是指企业与关联方之间发生的转移资源或义务的事项,包括但不限于:

(一)购买或销售原材料、燃料、动力;(二)购买或销售产品、商品;(三)提供或提供劳务;(四)委托或受托购买、销售;(五)代理;(六)租赁;

(七)提供财务资助(包括以现金或实物形式);(八)担保;

(九)管理方面的合同;(十)研究与开发项目的转移;(十一)许可协议;(十二)赠与;(十三)债务重组;(十四)与关联方共同投资;

(十五)根据国家有关部门的规定认为应当属于关联交易的其他事项。

第九条 企业关联交易应当遵循以下基本原则:(一)符合诚实信用的原则;(二)不损害企业及非关联合伙人合法权益原则;

(三)关联方如享有企业合伙人大会表决权,应当回避表决;(四)有任何利害关系的合伙人,在投委会对该事项进行表决时,应当回避;

(五)公司投委会应当根据客观标准判断该关联交易是否对企业有利。必要时应当聘请专业评估师或财务顾问;

第十条 企业应采取有效措施防止关联人以利益输送方式干预公司的投资,损害企业和非关联合伙人的利益。

第十一条 企业与关联人之间的关联交易应签订书面合同或协议,并遵循平等自愿、等价有偿的原则,合同或协议内容应明确、具体。

第十二条 企业应采取有效措施防止合伙人及其关联方以各种形式占用或转移企业的资金、资产及其他资源。

第四章 关联交易的决策程序

第十三条

企业与关联方签署涉及关联交易的合同、协议或作出其他安排时,应当采取必要的回避措施:

(一)任何个人只能代表一方签署协议;(二)关联方不得以任何方式干预企业的决定;

(三)投委会审议关联交易事项时,关联合伙人应当回避表决,也不得代理其他合伙人行使表决权。关联合伙人包括下列合伙人或者具有下列情形之一的合伙人:

1.交易对方; 2.在交易对方任职,或在能直接或间接控制该交易对方的法人单位或者该交易对方能直接或间接控制的法人单位任职的;

3.拥有交易对方的直接或间接控制权的;

4.交易对方或者其直接或间接控制人的关系密切的家庭成员(具体范围以本制度第五条第四项的规定为准);

5.交易对方或者其直接或间接控制人的董事、监事和高级管理人员的关系密切的家庭成员(具体范围以本制度第五条第四项的规定为准);

6.企业认定的因其他原因使其独立的商业判断可能受到影响的人士。

(四)合伙人大会审议关联交易事项时,具有下列情形之一的合伙人应当回避表决:

1.交易对方;

2.拥有交易对方直接或间接控制权的; 3.被交易对方直接或间接控制的;

4.与交易对方受同一法人或自然人直接或间接控制的; 5.因与交易对方或者其关联人存在尚未履行完毕的股权转让协议或者其他协议而使其表决权受到限制或影响的;

6.根据国家有关部门规定认定的可能造成企业对其利益倾斜的法人或自然人。

第十四条 公司投委会审议关联交易事项时,由过半数的非关联合伙人出席即可举行,投委会会议所做决议须经非关联合伙人过半数 通过。出席投委会的非关联合伙人人数不足4人的,企业应当将该交易提交投委会大会审议。

当出现是否为关联合伙人的争议时,由出席投委会会议过半数合伙人通过决议决定该合伙人是否属关联合伙人,并决定其是否回避。

第十五条 投委会大会审议有关关联交易事项时,关联合伙人不应当参与投票表决,其所代表的有表决权的股份数不计入有表决权股份总数。

关联合伙人明确表示回避的,由出席合伙人大会的其他合伙人对有关关联交易事项进行审议表决,表决结果与合伙人大会通过的其他决议具有同样法律效力。

当出现是否为关联合伙人的争议时,由出席合伙人会议的过半数合伙人通过决议决定该股东是否属关联合伙人,并决定其是否回避,该决议为终局决定。

第十六条

企业不得直接或间接向任何个人提供借款。第十七条

企业为不存在控制关系的关联方提供担保的,不论数额大小,均应当在投委会审议通过后提交合伙人大会审议。

第十八条 企业与关联方发生的金额在100万元至500万元之间的关联交易由投委会批准。前款交易金额在500万元以上的关联交易由合伙人大会批准。

第十九条 企业与关联法人发生的金额在500万元以上,且占企业最近一期经审计的经济资产规模5%以上的关联交易,由企业合伙人大会批准。第二十条 不属于投委会或合伙人大会批准范围内的关联交易事项由企业办公会议批准,有利害关系的人士在企业会议上应当回避表决。

第二十一条 投委会对需合伙人大会批准的关联交易是否公平、合理,是否存在损害企业和非关联股东合法权益的情形明确发表意见。

第二十二条 投委会对关联交易事项作出决议时,至少需审核下列文件:

(一)关联交易发生的背景说明;

(二)关联方的主体资格证明(法人营业执照或自然人身份证明);(三)与关联交易有关的协议、合同或任何其他书面安排;

(四)关联交易对企业和非关联合伙人合法权益的影响说明;(五)中介机构报告(如有);(六)董事会要求的其他材料。

第二十三条 合伙人大会对关联交易事项作出决议时,除审核第二十六条所列文件外,还需审核下列文件:企业投委会以决议的形式对需合伙人大会批准的关联交易是否公平、合理,是否存在损害企业和非关联合伙人合法权益的情形发表的书面审核意见。

第二十四条 合伙人大会、投委会、企业办公会议依据《企业章程》和议事规则的规定,在各自权限范围内对企业的关联交易进行审议和表决,并遵守有关回避制度的规定。

第二十五条 需投委会或合伙人大会批准的关联交易原则上应 获得投委会或合伙人大会的事前批准。如因特殊原因,关联交易未能获得投委会或合伙人大会事前批准既已开始执行,企业应在获知有关事实之日起六十日内履行批准程序,对该等关联交易予以确认。

第二十六条 关联交易未按《企业章程》和本制度规定的程序获得批准或确认的,不得执行;已经执行但未获批准或确认的关联交易,公司有权终止。

第二十七条 企业不得为本制度第二章规定的任何关联法人或者自然人提供担保。

第五章 关联交易的管理

第六章 其他事项

第二十八条 有关关联交易决策记录、决议事项等文件,由投委会秘书负责保管,保管期限为十年。

第二十九条 本制度未尽事宜,依照国家有关法律、法规、其它规范性文件及《企业章程》的有关规定执行。本制度与有关法律、法规或《企业章程》的有关规定不一致的,以有关法律、法规或《企业章程》的规定为准。

第三十条

本制度由企业投委会负责解释。

关联计算 篇3

摘 要:关联规则挖掘是挖掘研究领域的一项重要技术,高职院校教学管理系统产生海量数据,这些数据中隐藏着大量有价值的信息。文章采用改进的Apriori算法对高职院校计算机专业学生成绩进行关联规则分析,挖掘出课程之间的相关性,为高职院校更科学的制定教学计划提供有力的决策支持,进而提高教育教学质量。

关键词:关联规则;高职院校;计算机专业

中图分类号:TP393 文献标志码:A 文章编号:1673-8454(2014)20-0075-03

一、引言

随着高职院校快速发展,规模不断扩大,造成高职院校在课程设置、教学内容、学生管理、招生就业等方面面临严峻的考验,传统的教学管理理念已经不能够适应高职院校发展的需要,但是,许多高职院校在专业课程设置上都是在以往的专业课程设置基础上结合教学实际情况简单的进行修改,很少高职院校在专业课程设置上听取企业的建议或者遵循市场对人才的需求,导致课程应该在哪个学期开设或者是否继续开设等方面存在不少问题。

目前,基本上所有的高职院校都是采用基于WEB的教学管理系统对学生成绩信息进行有效管理,随着时间的推移,教学管理系统将产生海量的数据,大量的数据没有被充分的利用,因此,如何利用关联规则挖掘技术发掘隐藏在海量学生成绩数据背后有价值的信息或者规则,如课程之间的联系,学生成绩与课程之间的联系等等,为教师授课、学生学习、教育管理决策提供有用的理论指导。

二、关联规则挖掘和改进的Apriori算法

1.基本概念

数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的过程。[1]关联规则挖掘是从大量数据中挖掘出有价值的、描述数据项之间相互联系的有关知识。[2]关联规则是数据挖掘研究领域的一项重要技术,其目的是从数据库中挖掘出不低于预先给定min-support阈值和min-confi阈值的关联规则。[3]

关联规则描述为:设I={i1,i2,……,im}为M个项目集,D为交易数据集合,其中事务T是I项目子集(T?I),对应的每一个事务交易都有唯一的标识TID。关联规则形如X?Y的逻辑蕴涵式,其中X?I,Y?I,且X∩Y=ф。如果事务数据库D中有s%的事务包含X∪Y,则称关联规则X?Y的支持度为s%,若项集X的支持度记为support(X),规则的信任度为support(X∪Y)/ support(X)。[4]也就是:

support(XY)=P(X∪Y)

confidence(XY)=P(Y/X)

2. Apriori算法

Apriori算法是关联规则挖掘中重要的算法之一,它的核心思想是采用逐层搜索的迭代的方法通过多次扫描数据库D来找出所有的频繁项集。其算法描述如下:

L1={频繁1—项集};

For(k=2;Lk-1≠ф;k++)do begin

Ck=apriori_gen(Lk-1);//新的潜在频繁项集

for all transactions t∈D do begin

Ct=subset(Ck ,t); //事务t中包含的潜在频繁项集

for all candidates c∈Ct do

c.count++;

end;

Lk={c∈Ck|c.count≥minsup}

end;

Answer=YkLk;

Apriori算法虽然简单明了,容易实现,但是存在许多不足之处,一是对数据库D扫描次数过多,二是会产生大量的中间项集。针对这两个问题,笔者对Apriori算法做了相应的改进,将整个数据库进行分段,挖掘过程只需在段内进行,接着各子数据库挖掘结果汇总,最终刷选出关联规则。

三、关联规则挖掘在高职院校计算机专业课程设置中的应用

高职院校计算机专业课程包括有图像处理、网页设计、动画制作、网站制作与维护、C语言程序设计等。采用改进的Apriori算法对计算机专业课程进行分析,分析流程包括数据选择、数据刷选、数据转换、数据挖掘及结果分析。

1.数据准备

本研究选取某高职院校计算机专业10级到12级学生成绩表作为数据源,挖掘课程之间的关联性。为了减少冗余数据,将一些对专业课程影响较小的字段删除,删除了思政类、人文类、体育类和公共基础课成绩,最终选取了《图像处理》、《网页设计》、《动画制作》等15门专业基础、专业骨干、专业核心课程学生成绩作为研究对象。

2.数据筛选

采集的数据往往存在数据冗余、数据不完整性等现象,不能直接进行挖掘,需要对数据进行筛选处理。例如对于学生成绩表中含有学生的电话、地址、出生年月等字段,一一进行删除;对于学生成绩表中的学生退学、转学等记录一一删除;对于学生成绩表中缺考的信息,采用忽略元组的方法删除;对于个别空缺值,采用人工填充的简单方式,其填充值为该字段的中值;对于补考、重修通过的学生成绩,采用替换的方式填充为50分,便于数据转换。经过数据筛选的数据如表1所示。

3.数据转换

从表1中可以看出,每一条元组代表一名学生的课程成绩,表中成绩都是采用0-100的数值表示,如果直接进行数据挖掘,难以取得满意的结果,所以,需要对每一条元组对应的属性值进行量化,如采用区间量化,使每名学生每门课的成绩值落入到特定的区间,最终转换成离散属性。因此,本文将学生各门课程成绩分为优秀、良好、中、及格、差五等,分别用A、B、C、D、E表示,90-100分为A类,80-89分为B类,70-79分为C类,60-69分为D类,60分以下为E类,同时,为了便于书写,本文将表中各属性的字段名用英文字母替代,其中KC1为《图像处理》、KC2为《网页设计》,KC3为《动画制作》、KC4为《网站制作与维护》、KC5为《C语言程序设计》等等,数据转换后如表2所示。

4. Apriori算法的应用

要对上述学生课程成绩进行课程关联规则挖掘,本文采用的算法运行的硬件平台:Intel 酷睿2双核 E7500、2GB内存,软件平台:Windows XP、SQL Server 2000、SPSS Clementine。经过数据转换的学生成绩数据已经满足Apriori算法对数据的要求,可以直接使用Apriori模型进行挖掘。为了能够得到准确有效的课程关联规则,经过反复验证处理,将最小支持度设定为30%,最小置信度设定为60%。部分挖掘结果如图1所示。

5.挖掘结果及分析

上面挖掘出来的98条结果并非每条关联规则都有意义,我们对某些无价值的关联规则进行处理,无价值关联就是一门课程的成绩在A、B、C、D类中的其中一类能够同时推出另外一门课程的成绩为A、B、C、D类中的两类或者两类以上的规则。例如,《图像处理》成绩为A的学生可以推出《网页设计》课程的学生成绩即为A或者C等,这类规则就没有意义。关联规则分析主要有两个参考依据:支持度与置信度,若数据集中D有C比例的事务T满足“包含A事务的同时包含B事务”,则称规则A→B具有C置信度,置信度的高低代表关联规则强弱,置信度越高,关联越强。

通过整理98条,剩下64条有价值的规则,分析这些关联规则,得到部分主要的关联规则如下:

规则1:C语言程序设计=A→网页设计=A,置信度为69.2%,图像处理=A、C语言程序设计=A→网页设计=A,说明C语言程序设计、图像处理是网页设计的前导课程,因此,在课程设置中,网页设计排在C语言程序设计、图像处理课之后。

规则2:动画制作=A→网页设计=C,置信度为70.5%,通过查看课程的安排学期发现,网页设计课程安排在动画制作课程的前面,导致动画制作课程为优秀的学生,网页设计课程的学生不一定为优秀,因此,动画制作课程应该安排在网页设计的前面。

以下几条规则的含义相似,不在详述。

规则3:网页设计=A、C语言程序设计=A→网站制作与维护=A,置信度为85%。

规则4:数据结构=D、C语言程序设计=D→数据库技术=D,置信度80.3%。

规则5:C语言程序设计=A、操作系统=A→网站制作与维护=A,置信度76.5%。

规则6:计算机基础=A、计算机组装与维护=A、C语言程序设计=A→信息系统分析与设计=A,置信度82%。

从以上规则可以看出,C语言、数据结构对于计算机专业的学生来说是一门基础课,比较重要。笔者通过分析某高职院校计算机专业课程设置是否合理,简单的得出计算机专业课程体系,其中基础课程为计算机基础、计算机组装与维护、计算机网络技术、办公自动化高级应用、图像处理、动画制作、C语言程序设计等,骨干课程为数据库技术、网页设计、操作系统、网站制作与维护等,核心课程为动态WEB技术、信息系统分析与设计等。

四、结束语

高职教育是培养符合市场需求的高技能型人才,通过关联规则挖掘算法,能够有效地挖掘出课程之间的关联关系,为高职院校课程设置、教学计划和教学方案提供有力地决策支持,也为学生学习提供方向性指导意见。

参考文献:

[1]J Han, M Kamber. Data Mining:Concepts and Techniques[M]. San Mateo, CA:Morgan Kaufmann, 2001.

[2]付沙,周航军.关联规则挖掘Apriori算法的研究与改进[J]. 微电子学与计算机,2013(9).

[3]孙志刚,朱小冬,王毅刚.基于改进关联规则的维修专业组合与优化模型[J].计算机应用研究,2013(2).

[4]屈展,陈雷.一种改进的APRIORI算法在电子商务中的应用[J].西安石油大学学报(自然科学版),2012(1).

关联计算 篇4

一、关联规则以及入侵检测简介

(一) 关联规则简介

关联规则的可以用一个集合来表示, 例如:假设集合A{a1, a2……, am}, 集合A是一项含有数据项的集合, 这个集合又称为项集。设集合B为一个数据事务集合, 每个数据集合都含有数据事务C, 且每个C都有唯一的标识, 这个标识称之为TID标识。集合C真含于集合A, 其中项集E、F, E真含于A、F真含于A, 并且E和F相交为空集, 这就可以得出E、F的关联规则。设立关联规则的目的是为了找出不同的数据集合之间的关系, 也是为了更方便的识别集合与集合之间的关系。

在关联规则中还有一个概念是支持度, 支持度是集合B中包含项集E的事务数与B之比, 以此可以理解为E在集合B中出现的概率, 表示为Pr (E) , 关联规则E、F关系式的支持度就可以表示为Pr (E∪F) 。例如:一个集合的长度为G, 这个项集就可以称之为G阶项集, 若假定一个最小支持数I, 如果G阶项集的支持度Pr (I) 大于或者等于最小支持数I, 就可称G为大项集, 这个大项集又可以表示为G阶频繁项集的集合, 数学表达式为Lg。

置信度概念也是关联规则中又一重要概念, 那么什么是置信度呢?该置信度概念与概率论中的置信度概念相似。例如:关联规则E、F的支持度为Pr (E∪F) , 那么规则关联式E、F的置信度就是Pr (E∪F) /Pr (E) =support (E∪F) /support (E) , 这个公式表示数据事务库A中同时包含单项数据E和F的可能性, 关联规则的置信度也可以用条件概率符号进行表示, 具体的数学表达式为Pr (F/E) 。

(二) 入侵检测简介

入侵是指用户的计算机网络遭到非法用户地攻击, 导致用户计算机内部的资料丢失、泄漏, 或者整个计算机网络处于瘫痪状态。入侵检测即是非法用户攻击计算机网络, 被安全系统所检测到的过程, 检测系统从计算机网络或者系统中的关键环节监测信息, 之后将所收集的信息和样本进行比较, 以此鉴定计算机是否有被入侵的行为和迹象。入侵检测是一项复杂的检测过程, 涉及到计算机、网络安全等多个领域的内容。

二、关联规则在计算机入侵检测系统中地应用

(一) 基于关联规则的入侵检测体系结构地建立

基于关联规则的入侵检测体系结构可通过设计一个WAFP入侵检测模型来实现, 其主要工作过程为先从网络中采集所需要的数据, 之后对所采集的数据进行第一步干预, 并将干预过后的数据转入到数据库中去, 之后用WAFP检测模型对入侵行为进行判断, 若是模型判定出入侵行为是事实, 则要交给模型的处理环节进行处理, 若不是入侵行为则要记录其信息详情, 以便后续处理。

(二) 基于关联规则入侵检测系统地运行

基于关联规则的入侵检测系统的模型就是上段文章所描述的, 那么其具体的运行过程又是通过什么模块来实现的呢?入侵检测系统运行是主要依靠数据采集模块、数据预处理模块、WAFP检测代理模块以及决策响应模块。

数据采集模块, 顾名思义是一个信息收集的过程, 即是从入侵检测系统的信息网络中收集到能够体现用户行为的信息。例如:用户对特别文件夹的浏览次数、用户对重要信息的浏览次数, 而对于用户所浏览的无关信息可以不用关注。入侵检测依靠的是强大的数据支持, 只要所收集到的数据够可靠、够准确, 那么信息收集范围越广, 入侵行为被发现的概率也就越高。

数据预处理模块是对数据采集模块所收集到的数据进行处理的模块。主要工作内容是将采集模块中收集到的原始数据进行进一步处理, 原始数据的特点是信息不完整、数据冗余、含有与关联规则无关的噪声等等。检测系统对这些原始数据是无法进行甄别的, 就要需要数据预处理模块进行干预。数据预处理模块的工作内容是将原始数据所缺失的部分进行数据赋值和信息填补工作, 处理之后的数据就可以统一放在一个数据库中存储, 之后再将整理好的数据传递到下一模块。

WAFP检测模块的工作内容对来自预处理模块的数据进行处理, 检测模块先将预处理模块处理好的数据分为训练集和测试集两个集合, 对于训练集中的数据进行关联规则挖掘, 主要目的是对不同属性产生的不同数据进行分类;而测试集中的数据则是要跟规则库中的规则数据进行对比, 以此判定该数据是否符合入侵行为, 若是入侵行为则需要系统的相关环节进行处理。

上段所提到的系统相关环节即是决策响应环节, 决策响应环节是对关联规则模块挖掘出的规则, 在相关系统地指导下进行入侵行为检测。例如:响应模块检测到入侵行为, 响应模块中的某个单元就会做出相关的防护措施, 根据入侵检测系统的不同, 我们可以将响应的方式定义为主动响应和被动响应, 若响应模块无法判定入侵行为, 则需要将其报告给计算机安全员处理, 由安全员进行判断。

结语

总而言之, 基于关联规则法的计算机入侵检测方法是维护计算机网络安全的主要手段之一。本文所有研究的内容具有针对性和专一性, 工程师在建立计算网络入侵检测体系时, 应根据入侵行为的相关性进行分析, 建立较为合理的入侵检测体系, 同时在系统运行之后还应定期地对检测系统进行维护, 避免新的问题出现。

摘要:计算机入侵检测是维护网络安全的重要手段, 当计算机系统检测到入侵行为时, 这就要求响应环节做出尽快地响应, 并记录出本次入侵的类型, 为网络安全保驾护航。由于大多数入侵行为具有关联性、特征性, 所以计算机入侵检测系统地建立就依靠这种特征。本文主要研究了基于关联规则的计算机入侵检测方法的相关内容, 并在文章的最后部分介绍了入侵检测体系是如何运行的。

关键词:关联规则,计算机,入侵检测,应用,建立

参考文献

[1]张新有, 曾华燊, 贾磊.入侵检测数据集KDD CUP99研究[J].计算机工程与设计, 2010, 31 (22) :4809-4812.

[2]蔡伟贤.关联分析在入侵检测中的研究与应用[D].广州:广东工业大学, 2011.

关联理论与旅游翻译的关联 篇5

摘要:“关联理论”涉及话语认知,对翻译过程研究及翻译实践具有与“功能目的论”相近的指导意义。在旅游资料的翻译中,译者须遵循“最小—最大”原则,通过“明示”和“推理”实现译文与译文读者的“最佳关联”,达到“最佳语境效果”。尤其在旅游语篇的编译中,“关联理论”是行之有效的。

关键词:关联理论;旅游语篇;翻译

中图分类号:H315.9

文献标识码:A文章编号:

16721101(2016)06009505

Abstract: Relevance theory, a theory of discourse perception, is as of great value as Skopos Theory to the study of translating and the process of translation. In the translation of texts for tourism, the translator must comply with the principle of “minimal effort + maximal effect” and realize “maximal relevance” between the target text and the target reader through “ostentation” and “inference” in order to achieve “the best contextual effects”. In the editing and translation of texts for tourism, relevance theory is particularly practical.

Key words: relevance theory; texts for tourism; translation

旅游资源的对外译介涉及译者对原文的认知和译文读者对译文的认知这两个过程,因此借用有关话语认知的“关联理论”(theory of relevance)对其加以阐释是可行的。也就是说,关联理论与旅游翻译之间存在着较强的关联。在此,有必要先就关联理论的基本思想及与普通翻译的关联进行梳理。

一、关联理论与翻译

在话语认知理论看来,对话语的理解是一种包含“明示”(ostentation)和“推理”(inference)两个方面的“认知过程”(cognitive process),是一个涉及“信息意图”(informative intention)和“交际意图”(communicative intention)的“明示-推理过程”。“明示”指说话人把信息意图明白地展示出来,而“推理”指听话人根据说话人的“明示”行为,结合“语境假设”(contextual assumption)求得“语境效果”(contextual effects)而获取说话人的交际意图这一过程,其重要依据就是“获取信息和语境的最佳关联。寻求最佳关联实际上就是人们在语言交际活动中自觉遵守一条原则——关联原则……最佳的关联性来自最好的语境效果;人们对话语和语境假设的思辨、推理越成功,话语的内在关联就越清楚;话语内在的关联性越清楚,人们在思辨和推理过程中无须付出太多的努力,就能取得好的语境效果,从而正确理解话语,使交际取得成功。”[1]说话人的意图能被听话人识别,是因为双方对认知环境具有共识。交际的成功取决于双方对彼此的认知环境达成“互明”(mutually manifest),话语取得了“最佳语境效果”(optional contextual effects),即信息和语境之间实现了“最佳关联”(optional relevance)。

依据“认知原则”,人类认知倾向于同“最大关联”(maximal relevance)相吻合,因为“人类的认知过程……往往力求以最小的心理投入获取最大的认知效果。要达到这一效果,人们必须重点关注那些看来对他们最具关联性的信息。”[2]30依据“交际原则”,每一个交际行为本身都应具有“最佳关联”,其关联的程度取决于话语所具有的语境效果和处理话语时所付出的努力。关联性和语境效果“二者之间成正比关系,即在同等条件下,语境效果越大,关联性就越强。”[2]26-27在同等条件下,认知努力和关联性成反比,即付出的努力越多,话语的关联性就越弱;相反,关联性越大,取得的语境效果就越大。让听话人以最小的心理投入取得最大的语境效果,这是关联理论的重要原则(“最小—最大”原则,或“效度第一”原则),对于应用翻译具有重要的指导作用。

在关联理论看来,翻译是一种交际行为:译者既要充分利用自己认知语境中的各种信息推导出隐藏于原文明示信息背后的隐含意义(交际意图),找到原文信息与语境假设的最佳关联,在认知上获得“最佳语境效果”,同时又要以译文读者的认知能力和心理期待为标准,围绕“最佳关联”对译文进行取舍,为译文读者提供“最佳语境效果”,将原文的交际意图和相关信息正确地传递给译文读者。由于原文作者和译文读者的认知环境有所不同,译者应根据“最小—最大”的原则对译文进行相应处理,使译文读者从译文语境中获得“最佳语境效果”。寻求译文与译文读者的最佳关联性,使译文提供“最佳语境效果”,这是翻译成功的决定性因素。德国学者古特(E. A. Gutt)指出,“对于翻译所要传达的内容及传达的方式,关联原则有着重要的制约。因此,假如有人问在那些方面译文预期的阐释应该类似于原文,答案是:在使译文与读者充分相关的方面——也就是说,在提供充分语境效果的方面;假如有人问译文该如何表达,答案是:表达的方式应该是让译文提供预期的阐释,而没有让读者付出不必要的推理努力。……这两项制约条件决定了译文应该在哪些方面类似于原文——仅仅在有望使译文与译文读者充分相关的那些方面。这些条件还决定了译文应该内容明了,表述自然,不应理解起来不必要地困难。”[3]107在古特看来,译文的内容要与译文读者产生充分的关联,提供充分的语境效果,形式也应让其无须付出不必要的努力,即译者应时刻以寻求“最佳关联”作为指针,这就是关联理论“最小—最大”原则对翻译的启示。“效度第一”的原则尤其适应于应用翻译,因为应用体裁重在传达信息意图和交际意图,而非语言形式,这一特点与关联理论的“最小—最大”原则不谋而合,而寻求“最佳语境效果”即实现实用体裁的预期功能。

二、“明示”、“推理”与旅游翻译

就旅游资源的对外译介而言,它涉及相连的两个“认知过程”。首先,译者需要对原文“明示”信息(如旅游资源的客观信息)背后的交际意图(对潜在游客的“呼唤”)进行“推理”,这一过程的成功依赖译者的认知能力,并且表现在译文当中;接着,译者以恰当的方式将原文信息表述出来后,译文读者需要对译文明示信息背后的交际信息进行推理,这一过程的成功很大程度上依赖译文提供的“最佳语境效果”。这两个过程的连接点就是旅游文本的译文本身,即整个对外译介的过程仰仗译者以恰当的形式将自己从原文中获取的信息意图和交际意图传达给译文读者,其译文须对译文读者的认知语境做出正确的假设,为译文读者提供“最佳语境效果”,达成最大限度的认知互明。

原文作为话语,一般包含有“明说”(explicature)和“隐含”(implicature)两种表述,前者传递的是信息意图,即表层信息,读者可从中获得语境假设,而后者传达的是交际意图,即深层信息,是话语行为的最终目的。对于旅游文本,“明说”就是对旅游资源“事实”的描述,“隐含”则是旅游资源管理者对读者发出的“呼唤”。原文作者和原文读者处在同样的文化语境中,即拥有共同的认知语境,因此原文的“明说”信息和“隐含”信息都能比较便捷地获得“最佳语境效果”,实现“最佳关联”;为简洁起见,有些不言自明的信息不必和盘托出,成为话语之外但共知的背景信息,这对于“局内”人士并不构成交际的障碍,反而成为机智、幽默的所在和良好文体的特征。这种情形在旅游文本中十分普及。

但是,译文读者和原文作者处在不同的文化语境中,拥有的背景信息很不相同,对原文“隐含”信息的识别存在较大困难,甚至因“文化缺损”(cultural default)对原文“明说”信息的理解都会出现错误,因而对其实现“最佳关联”,忠实地传达原文的交际意图,是一项艰巨的任务。例如:

有一个真实的传说,秦王派卢、侯二臣来这烟霭缭绕的云山寻找长生不老药,未遂,卢、侯二臣最后隐居云山。秦王当然不知道卢、侯二臣不归的原因,其实道理再简单不过,正是云山的神奇、幽美、诡异、静谧成了卢生、侯生的挽留客。古人况且如此,那么崇尚大自然美的今人应更不在话下了。既然有古人之鉴,今人还需未雨绸缪,提防无妨。其实,云山原始次森林密布,一峰紧连一峰,峰峰祥云环绕,景观众多,宛如人间仙境一般,又岂能有挡阻得住凡人隐居这六九福地之理?而且云山乃是国家级森林公园,应为全国属有,你又以何种阻挡之名?尽管如此之说,“乐不思蜀”这一现象仍不可推崇,更不可多取。何故?因为“乐不思蜀”最易使人见异思迁,忘记了过去就意味着背叛未来,这岂又不成了“前事不忘,后事之师”之古训的叛逆?

——《不要轻易登云山》第五段原文为湖南省武冈市某作家为推广云山所写的一篇美文,刊于何处不可考。在此向原作者致谢。

原文表述“呼唤”功能的技法有二:1.陈述云山超凡脱俗的旅游资源;2.劝说游客“不要轻易登云山”(原文标题),欲擒故纵。前者是“明示”信息意图,其“呼唤”功能是自然具备的,因而是直接的;后者是“推理”交际意图,其“呼唤”功能是带有修辞性的,因而是人为和曲折的。但在这一段落,“明说”的信息几乎荡然无存,似乎通篇都是在劝阻,都在和“呼唤性”背道而驰。

倘若译者将原文当作哲理散文,忽视语境效果,不顾译文与未必都是美文爱好者的译文读者的最佳关联,那么其忠于原文形式的译文很可能会被误解,取得与原文交际意图截然相反的效果:

A real story says that the first king of Qin (221 B.C.—206 B.C.) dispatched 2 courtiers, Lu and Hou, to the cloud-veiled Yushan for elixir of life. They failed to accomplish their mission and thus lived here in seclusion, while the kin

g wondered why they didnt return. In fact, it was Yunshans unusual beauty, mystery and serenity that made them stay for a life. The ancients stayed here! Modern people admiring the beauty of nature wont lag behind, will they? Certainly, its no harm for modern people to take precautions and plan ahead. Because Yunshan is blanketed with primitive second-growth forests, and its dense peaks are veiled by clouds.

With its numerous scenes, it looks like a fairyland. How can the ordinary refrain from living here in seclusion? Moreover, Yushan, a National Forest Park, belongs to the whole nation. How can you keep them off it? Though, reluctance to leave it is still not advisable and thus is not advocated here. Why not? Because it may well make people forget about themselves, and the forgetting of the past equals the betrayal of the future. Isnt it a rebellion against the old saying that the following should draw lessons from the foregoing?

原文“明说”的是云山让人“乐不思蜀”,“见异思迁”,甚至“看破红尘”,因而来云山旅游,像古人那样隐居于此,是“不可推崇”的。倘若译者不考虑原文内容在译语文化语境中的接受的可行性,无视话语交际的“最小—最大”原则,那么译文读者获知的交际意图很可能是原文的表层含义——不要来云山。这岂不背离了“发起人”(initiator)的交际意图,枉费了原文作者欲擒故纵的苦心吗?

原文“隐含”的交际意图与“明说”恰恰相反——表面上劝人“不宜来云山”,但深层的含义却是云山旅游资源的品质非同一般,可谓“超凡脱俗”,让人“流连忘返”(原文第二段末尾句),因此去云山旅游要做好充分的时间预算,而且“至少你不宜一个人去”(原文末尾句),要多邀亲朋好友同去。倘若不把原文当作哲理散文,而当作旅游宣传文本,那么为避免对原文交际意图的误解,译者大可实行“最小—最大”原则,对原文进行编译,将“隐含”信息化为“明示”信息,并改变语言形式,以获得“最佳语境效果”:

…Since the ancients stayed here, can modern admirers of nature be far behind? Youd better plan ahead, because Yunshan is so charming and has so many scenes that you may stay here longer. Naturally you may well stay here in seclusion. Besides, we may not keep people off a national forest park. Though, your reluctance to leave it is not appreciated, because you should ultimately go back to society.

此处译文浓缩了原文的大意,简化了原文的表述形式,并将“隐含”意图做了“明示”处理,使译文读者能“以最小的心理投入获得最大的语境效果”,懂得原文的深层意图。为了增强关联性,使译文读者轻松地领会原文交际意图,译文首句还模仿了英国诗人雪莱(P. B. Shelley)《西风颂》末尾的名句,按照原文大意和译语语境写道,“既然古人来了,今人还会远吗?”而且为了突出对译文读者的“呼唤”,译文的句子多以“你”为主语或话题,避免了原文读者对象不够明确的缺点。这样,译文就成了行之有效的“你”型文本。

三、“最佳关联”与旅游翻译

对于原文的“隐含”信息,译文采取“‘归化性明示”还是“‘异化性明示”[4],这是由“翻译目的”(Skopos)决定的。对于原文的篇章结构和文体风格,在应用翻译中是不必“忠实”地传达的,因为这些要素和处在译语文化语境中的译文读者“关联性”很弱,有可能加大译文读者对原文交际意图的领会的难度。为了实现翻译目的,有必要根据原文的交际意图和译文读者的期待,用基于译语文化身份的表达方式(如上文对雪莱名句的套用)来改编原文,对原文中与交际意图直接相关的信息予以“明示”,通过产生“最佳关联”来实现交际意图。也就是说,“并非所有信息在任何语境中都会产生语境效果。作为解决办法的指导方针,也就是说‘对对于语境最重要的那些成分的聚焦,就直接来自关联原则;意思就是,译者应当把在那一特定语境中产生最佳关联的信息表达出来。”“

译文文本中的‘矫揉造作常常要求译文读者付出无端的认知努力:兴许是因为从原语中推理而出,或者是因为译语掌握不到位,译者使用的表述可能要求读者付出超过最佳关联所要求的努力。”[3]120在古特看来,译者应当从原文中提取在译语语境中具有“最佳关联”的信息,略去很少能产生“语境效果”因而没有明显实际意义的信息,删繁就简,使原文的交际意图突显出来。对原文信息的适当取舍可以防止译文臃肿不堪、言不达意、矫揉造作,符合关联理论中的“最小—最大”原则。

对于编译的原则,关联理论和“目的论”是相通的。为了顺应新的交际环境和译文读者的心理需求,译者应将自己置于译语文化语境中,换成译文读者的角色,根据译本的预期功能决定翻译策略,对原文的信息进行适当调整和改写,使译文既能连贯自如地传达原文的交际意图,又能让读者付出最少的认知努力。依据新的交际语境筛选原文的信息,实现“最佳关联”,防止译文的“造作”和累赘,这是应用翻译过程中常见的现象。例如:

如要登云山,来之前①尽可能多邀几个旅伴,以免你遇到孤寂或迷路时担惊受怕之苦;②临行前要记住与家人打个招呼,尽量把旅期多说几天,以免你迷恋于云山数天数夜仍不舍归去,让家人担心和牵挂;③一定要带足你的盘缠,云山之地物产资源十分丰富,它距湘西南集散商品贸易重镇──武冈市仅4公里,该市不仅商品琳琅满目,而且土特产在外来人中十分吃香,免得你玩兴甚高倾尽袋囊无路费可归;④最好还带上相机,待你尽兴归来之后,让你感觉到你与云山的拥抱,并非融为一体,而是一次跋涉,一次洗涤,一种亲近,一种激进。而且从照片上你可以分得出什么是仙境,什么是尘世,什么是梦幻,什么是永恒──教你清醒头脑,回归真实自我……

——《不要轻易登云山》第七段

原文以散文的笔法罗列了来云山旅游应注意的四个事项(序号为笔者添加),但行文不够简洁,有古特所说“矫揉造作”(unnaturalness)之嫌。关键是,这些信息基本上是老生常谈,少有新意,因而少有值得在译文中保留的价值,而且更要紧的是,有些建议在译语文化语境中很可能被误解:1.在云山容易“迷路”,独自旅游让人“担惊受怕”,因此去云山旅游很危险;2.“尽量把旅期多说几天”有欺骗家人之嫌,似乎游客都巴不得离开家人,不负责任地去外地逍遥;3.武冈的旅游商品一定贵得离奇,会把游客宰得“无路费可归”;4.“带上相机”的建议纯属多余,哪个游客不会留下“到此一游”的纪念?况且末尾句铺陈较多,华而不实,经不住逻辑推敲,没有什么信息性可言。

倘若译者无视译文与译文读者的“最佳关联”,那么“语境效果”就可想而知了:“不要……登云山,”更不要“一个人去。”把乏味的“信息型”文本写成生动活泼的旅游散文,这样的妙笔可能令原文作者心中窃喜,不想在译语文化语境中却显得无聊和累赘,而且由“明示”信息得出的结论居然与“隐含”的交际意图截然相反,这恐怕会令原文作者和发起人惊诧万分。此时,实现“语境效果”的重任落在了译者的肩上:

Prepare yourselves for a tour here. Firstly, come with fellow tourists. Secondly, remember that your tour may last longer than you expect. Thirdly, leave pocket money for local produce, which puts up a dazzling array in Wugang. Lastly, take a camera with you: the photos will remind you of the soul-purifying tour.

此处译文精炼地概括了原文的主要信息,突出了原文的交际意图,实现了与译文读者的“最佳关联”。文体上,译文由原文的曲折“呼唤”(欲擒故纵)转变成了直接“呼唤”(祈使句),行文简练、明晰,没有堆砌、牵强之嫌,“信息意图”和“交际意图”均容易为适应了应用体裁的译文读者接受。作为旅游文本,此处译文“忠实”的是原文深层的“交际意图”(“呼唤”功能),而非表层的“信息意图”和语言形式。因为,“翻译是一种交际行为。”[5]

译者是“翻译要求”(translation brief)的执行者[6]。“翻译目的”的效度取决于译者如何协调原文意图与译文读者的期待之间的关系,即效度与后两者的一致成正比。译文对原文信息和形式的改编必须实现与译文读者的“最佳关联”,才能获得最佳“语境效果”,从而实现对原文“功能”上而非形式上的忠诚。事实上,“关联理论”和“功能目的论”是相通的,对于旅游资源的对外译介均具有很强的实际指导意义。参考文献:

[1]何自然.语用学与英语学习[M].上海:上海外语教育出版社,1997:139.

[2]Sperber D, Wilson D. Relevance: Communication and Cognition[M].Shanghai: Shanghai Foreign Language Education Press, 2001.

[3]Gutt E A. Translation and Relevance: Cognition and Context[M].Brookland: St. Jerome Publishing, 2000.

[4]贾文波.应用翻译功能论[M].北京:中国对外翻译出版公司,2005:282-285.

[5]Nord, Christiane. Translating as a Purposeful Activity: Functionalist Approaches Explained[M].Shanghai: Shanghai Foreign Language Education Press, 2001:22.

[6]Trosborg, Anna. Text Typology and Translation[M].Shanghai:Shanghai Foreign Language Education Press, 2012:29.

关联计算 篇6

1 关联规则挖掘算法概述

关联规则的主要作用就在于在挖掘数据库数据的过程中,找出数据库中大量项集之间的关联性。简单而言,关联规则是借助于数字的量化,挖掘出对事件发生造成影响的一系列因素中,某种因素的出现对另一种因素的出现所带来的影响程度。关联规则的形式化定义主要可描述为:设I={i1、i2、i3...im},是由对学生计算机基本操作能力带来影响的诸多(m)个不同因素所构成的一个数学集合。将事务的集合设置为D,也就是学生的成绩数据库为D,其中各个事务代表着每个学生的成绩信息,其属于数据项I的一个子集。其主要目的是为了将二者之间的关联规则找出来,如“X→Y”,其中X、Y均包含于I中,X∩Y≠0,则代表X中条件记录能够如果能够得到满足,则Y也预定能够得到满足。

关联规则挖掘算法的作用实现一般都是借助于两个阶段:一是要将支持度比最小支持度大的项集找出,形成频繁集;二是借助于频繁集将关联规则分析总结出来。而在第一阶段中,频繁集的形成一般都是通过传统的Apriority算法来实现,其是对数据库进行多次扫描之后,借助于连接和剪枝操作进行一系列的递推之后才能够得以形成。

2 基于关联规则下计算机基本操作能力的影响因素分析

2.1 准备数据。

以杭州师范学院护理系一年级学生第二学期计算机应用基础课程的成绩作为本次考察对象。在结合现代社会中企业就业需求的基础上,将打字速度、Windows XP操作系统等几种使用较为频繁的办公自动软件当做影响计算机基本操作能力的主要因素进行分析和研究,将学生各个方面的成绩详细记录下来。然后将学生计算机基本操作能力定义为课程的期末考试成绩,对其进行综合型评估,找出各个影响因素之间所存在的关联性。

2.2 采集数据及数据的预处理。

通过金山打字通软件对所使用数据中的打字速度进行统计,将二十分钟内每个学生打字的平均速度记录下来。不管是Windows XP操作系统和Word2003,还是Excel2003、Power Point2003以及课程期末考试成绩的采集,均都运用各自统一的考试系统,运行环境完全模仿软件的实际环境,以所规定的时间安排学生进行实际上机测试,由考试系统自动阅卷来对学生的成绩进行评价,整个过程下来后,能够让学生对计算机基础操作的掌握能力得到真实呈现。而针对于部分缺值记录,则借助于该字段中其余记录的平均值来当做其替代值。

在通过Apriori算法挖掘频集之前,向离散化出来所获取到了数据样本[1]。然后结合相关企业的人才应聘中,对打字速度的要求,将学生的打字速度划分为四个等级,A为60字/分钟、B为45~59字/分钟、C为25~44字/分钟、D为<24字/分钟;其次按照实践经验将其他操作课成绩同样划分为四个等级,A为≥90且≤100、B为≥80,≤89、C为≥60,≤79、D为≤59。

2.3 将学生计算机基本操作能力成绩的数据挖掘库构建出来。

将储存在Excel文件中的相关原始数据信息,通过Microsoft SQL 2008所具备的数据导入和导出功能,将所有学生计算机基本操纵能力的成绩制作成xls文件,将其导入到SQL Server数据库中。

2.4 开发环境的设计。

SQL Server2008的前端开发软件运用VB6.0,来挖掘出其所存在的关联规则。在实际操作过程中,先借助于VB6.0环境下的数据库关联器,通过ODBC方式和SQL Server相连接。其次,将ODBC数据源创建出来,然后对VB6.0中的“可视化数据管理器”命令进行执行,将学生计算机基本操作能力的成绩数据库通过ODBC的方式打开,最后将连接VB和SQL Server数据库。

2.5 频繁项集和关联规则的形成。

借助于Apriori挖掘算法,分析计算机基本操作能力有关的一系列因素中成绩不合格的项,从而将对操作能力的提升造成影响的相关因素以及各个影响因素之间的互联关系程度挖掘出来,如表1所示。

3 结论

如果将最小置信度设置为0.3,则强关联规则为第2、4、6、7、8、10。通过分析得出,首先,2、4表示打字速度较慢的学生中,绝大多数都在windows模块和word模块中也不合格,这个实际情况基本一致。打字速度测试主要是借助于金山打字通软件,而其又是在windows环境下进行,因此如果无法对windows操作做到熟练掌握,在打字时就会发生一系列问题,如无法添加、切换输入大和标点错误等,从而也就会对其打字的速度和正确率造成影响[2]。而word作为一种应用软件,具备其它软件的大多数基本操作,而且也属于文字处理软件,word操作不熟练,也会影响到学生使用金山打字软件,进而也就会降低打字速度。

其次,7、8、10显示,如果学生windows模块和word模块不熟练,则其期末成绩不及格的几率更大。在计算机应用基础课程的操作教学中,windows模块是最先接触的部分,而且其属于系统软件,是对后续三种软件进学习的重要基础,因此如果不熟悉它的操作环境,则必然会对学生的期末成绩造成影响[3]。而word是常用的软件之一,为了让学生能够更快的适应工作岗位,在期末考试中对其考察的内容较为广泛,所在份额较大,如不熟练则势必会影响学生的期末成绩。

摘要:随着现代科技的不断发展和进步,计算机技术的使用越发普及,直至今日,计算机及其应用技术已然成为了现代人们日常生活和工作中不可或缺的重要组成部分。而在当下的信息社会背景下,当代大学生是否具有熟练的计算机操作技能,特别是一些较为常运用到的办公自动化软件,已经成为的不可或缺的重要就业标准之一。本文以当下高校非计算机专业学生设立计算机应用基础课程为基础,检验的分析了关联规则挖据算法,并在此基础上将处理后的样本数据从Excel工作表中导入到SQL Server2008,使得数据挖掘库得以生成,对计算机基本操作能力的影响因素进行深入分析,希望能够为我国高校计算机教学效率的提升带来一定帮助。

关键词:关联规则,计算机基本操作能力,影响因素

参考文献

[1]李彬,王凤彬,秦宇.动态能力如何影响组织操作常规---一项双案例比较研究[J].管理世界,2013,8:136-153,188.

[2]江小英,周静.中学聋生网络交往情况的调查与分析[J].中国特殊教育,2010,9:63-67.

关联计算 篇7

关键词:语义关联度,文章网络,布局信息,维基百科,隐含狄利克雷分布,谷歌

0 引言

语义关联度研究是信息检索、人工智能等领域的基础性研究课题之一,有着重要的研究价值。

传统的语义关联度计算方法包括单纯的对大型语料库进行统计分析,不涉及到相关的背景知识[1,2],或者使用人工构建的带有少量外部知识的词典资源[3,4]。近年来出现了很多利用Wikipedia计算语义关联度的方法。维基文章间丰富的链接关系构成的文章网络及文本内容能提供大量明确定义的语义知识。虽然Wikipedia是数以百万计的用户协作编写的百科全书,内容覆盖广泛,有研究表明,其内容的准确性与由专家写成的大英百科全书相差无几[5]。与传统背景知识库相比,Wikipedia内容的结构化和准确性使其成为更好的语义关联度计算背景知识库。但现有的基于Wikipedia计算语义关联度的方法还存在着一些不足: 1) 着重于链接网络和维基分类树而忽视文本内容;2) 没有考虑Wikipedia存在的缺陷,如更新滞后、覆盖度有限等,没有引入相应的内容进行补充。

针对这些缺陷,本文提出了一种改进的基于Wikipedia词汇语义关联度计算方法WGR,主要贡献如下:

( 1) 引入了维基文章页面布局信息,在使用Wikipedia计算关联度时可以更准确地描述词语-文章的关联性。

( 2) 对维基概念的输入链接( Backward Links) 和输出链接( Forward Links) 分别应用不同的处理方法,从而在Wikipedia内容处理中既应用了维基文章的文本内容,又考虑了多层输出链接。

( 3) 引入Google搜索资源,经过分类器筛选后进行LDA建模从而计算关联度,最后综合Wikipedia和Google资源的结果得到WGR语义关联度。

1 相关研究

现有的语义关联度计算方法主要区别在于利用了不同的背景知识。较早的基于人工语义词典如Word Net和Roget的方法[6],其准确性受限于人工词典的容量和更新情况。其后出现的基于语料库的方法,通过对大量文本集合进行统计分析得到比较全面的背景知识库,其中LSA算法[7]是准确率较高的算法之一,但其需要对语料库进行大量预处理。

Strube和Ponzetto[8]首先开始利用Wikipedia计算语义关联度,所提出的WikiRelate算法将基于Wordnet的方法进行修改后应用到Wikipedia上,取得了和基于Wordnet相近的准确度。Gabrilovich和Markovitch[9]提出的ESA算法是目前准确率最高的语义关联度计算方法之一,该方法采用向量空间模型对维基文章进行建模,不仅可以比较词汇的语义关联度,还可以比较文本内容之间的语义关联度。Milne和Witten[10]提出的WLM算法,采用向量空间模型处理Wikipedia文章网络链接,结合NGD距离( Normalized Google Distance)[11],算法开销低于ESA,且取得了较高的准确率。孙琛琛等[12]提出的WSR算法,引入带权重的链接,并借鉴TF-IDF定义链接权重,从而分析文章网络的多层次结构,最后结合维基分类树计算关联度,算法开销远小于ESA,也取得了较高的准确度。李赟等[13]利用中文维基百科进行语义相关词的获取及其相关度分析。

Radinsky等[14]提出的TSA算法将Wikipedia资源和纽约时报的文章结合使用。使用了纽约时报从1863 年至2004 年的文章存档,先将每个词转换为一系列包含这个词的维基文章的集合,通过维基概念在纽约时报文章中分布的相似性计算原始词的语义关联性。

文献[15]使用LDA对Wikipedia数据集进行建模,将词语描述成高维向量,向量由两部分组成: 词语与上下文临近词的关联度组成的向量,LDA模型输出的对词语的主题表达向量,通过计算高维向量的余弦距离得出语义关联度,也取得了较好的准确度。

2 基于Wikipedia语义关联算法WGR

本文提出的WGR语义关联度计算方法整体流程如图1 所示。该算法主要包括两个部分: 首先是利用Wikipedia数据集的语义关联度计算WikiRel,将待计算语义关联度的词语映射成维基概念后,对每个维基概念所处文章网络中的输入链接和输出链接采用不同的方法计算,计算过程中结合维基文章的页面布局信息,更精确地描述词语-文章关联性。其次是利用Google搜索结果的语义关联度计算GooRel,取得每个待计算关联度的词语在Google搜索中的结果集,使用分类器筛选后进行LDA建模,计算词语各自主题向量的余弦距离。最后综合两个部分得到WGR算法。

2. 1 基于Wikipedia数据集关联度计算WikiRel

已有的基于Wikipedia的关联度算法[8,9,10,11,12,13]大多只考虑文本内容或文章网络。为了综合考虑文章网络和文本内容,本文采用不同的方法对入链和出链进行处理,其中入链( Backward Links) 即目标概念出现在某个维基概念的描述文章中; 出链( Forward Links) 即目标概念的描述文章中出现了某个维基概念。最终取二者的加权和得到WikiRel关联度。

2. 1. 1 维基页面布局信息

图2 为维基文章页面示例,维基文章中的首段通常是对该文章所描述维基概念的概要说明; 在维基页面中显示为蓝色字体的即锚文本; 文章中被加粗为黑体或斜体表示强调说明,如图中的”Apple Computer,Inc”和”Fortune”; 此外,Wikipedia编辑过程中,会附加相关的图片资源进行辅助说明,如图2 中图片下方文字说明。

页面布局信息可以使用正则表达式从维基文章编码中提取。例如,在维基文章编码中,被两个单引号、三个单引号包起来的分别渲染成黑体、斜体; 附图描述为‘[[Image: < filename >| Ac | < caption > ]]’,参数< caption > 即为图片描述; 超链接在编码中有两种形式: ’[[< article name > | < anchor text > ]]’和’[[< article name > ]]’,取前者的anchor text和后者的article name为锚文本。

2. 1. 2 维基页面间的链接信息

Wikipedia中存在着多种链接,不同的链接所能体现的概念间语义关联是不一样的。本文对不同链接使用经验初始权值如表1 所示。

2. 1. 3 使用目标概念入链改进的ESA算法BLRel

ESA算法[9]包括三个步骤: 把词语转换为概念向量; 计算向量中每个元素的相关性权重; 计算两个概念向量的余弦距离。考虑到在维基文章中很多词语只起到辅助描述、组成句子的作用,并不能反映其与对应的维基概念有语义关系,本文只对出现了目标概念作为锚文本的维基文章计算相关性向量。在取得所有包含以目标概念为锚文本的维基文章后,去掉分类、消歧等不需要的功能页面,以及正文内容过短的文章,然后进行文本预处理。

本文在ESA算法的第二步进行改进,将TF-IDF与维基页面的布局信息相结合,词语-维基概念相关性计算如下:

其中is Bold、is Italic、is Anchor、is Image、is First Para分别代表词语是否在页面中为黑体、斜体、锚文本、位于图片描述中、处于第一段,若是则取值为1,否则取为0。

对于式( 1) 中的参数设定本文通过回归分析进行拟合。将式( 1) 作为拟合方程,本文使用了最小二乘法( OLS) 、次序对数回归( OLR) 和支持向量回归( SVR) 三种分析方法,以对比拟合结果对语义关联度计算结果的影响。具体训练集通过人工标注获得,从Wikipedia数据库中随机抽取100 篇文章,这些文章至少都包含一个黑体词语、三个以上可以正确链接到其他维基页面的锚文本、至少三个字的图片描述文字、一个以上的文章段落。然后再从每篇文章中选出30 个词语进行人工相关性标注,选择的过程要覆盖到所有的布局信息,人工标注由三个人分别独立完成,取三个人的标注结果平均值作为最终结果。对于标注结果存在歧义或无法给出标注结果的词语全部剔除,最终得到了1 750 个词语。

2. 1. 4 使用目标概念出链的关联度计算FLRel

本文借鉴pfibf[16],结合布局信息定义了维基概念间链接权值。对于目标概念的输出链接,计算三层输出链接向量的余弦距离得到FLRel关联度。

( 1) 链接权值设置

设a、b为源概念和目标概念,a → b的权值:

其中,w( a → b)0是a到b初始权值; ∣a→ b∣是从a到b链接数量, ∣y→ b∣是任意概念到b的链接数目; N表示Wikipedia中总的链接数目,log计算的值为任意一条链接指向目标节点的反比例值。

( 2) 语义关联度计算

结合式( 1) ,链接的初始权值定义如下:

将式( 3) 代入式( 2) ,再对源概念的所有输出链接计算权重,概念输出链接如图3 所示,a、b为源概念结点,输出至c、d的为第一层,输出至e为第二层,至f为第三层。根据源概念结点构建出每层输出链接向量,最后计算每层向量余弦距离。

在计算第二层链接矩阵时,a→e的权重为w(a→c)×w(c→e)×0.9,0.9为关联性传递衰减系数,第三级链接以此类推。对其中某层链接而言,源概念的语义关联度描述为:

其中,M( a) 、M( b) 分别为源概念a,b的输出链接权重向量。最终FLRel关联度计算为:

其中,Similarity1、Similarity2、Similarity3分别为1、2、3 层链接的余弦距离,α、β、γ 为对应的权重系数,且 α + β + γ = 1,其具体值通过实验多组不同的权值,在 α = 0. 67,β = 0. 21,γ = 0. 12 时,FLRel取得了最高的准确率。

2. 1. 5 WikiRel关联度计算

综合BLRel和FLRel,使用Wikipedia数据集计算得到WikiRel关联度为:

其中 δ + ε = 1,本文 δ = 0. 55,ε = 0. 45。

2. 2 基于Google资源的关联度计算GooRel

本文将Google搜索资源作为Wikipedia之外的扩充背景知识库。对于一组待计算语义关联度的词,首先取得各自在扩充知识库中的网页结果集,再使用分类器过滤主题不相关的结果,接着对网页内容使用LDA进行建模,最后通过计算两个词语-主题分布向量的余弦距离得到GooRel关联度。

2. 2. 1 Google外部资源

虽然Wikipedia是目前规模最大的在线百科全书,但也存在缺陷: 首先,其还在不断完善各种新词条,已有内容也保持着更新维护,内容覆盖度有限; 其次,由于其需要保证内容的公正客观准确性,维基文章中不能涉及过多的时事信息,且其内容的更新存在滞后性。针对这些缺陷,本文利用Google搜索对背景知识库进行扩充,Google资源的优势包括能在技术上尽可能快的找到新出现的网页,由PageRank计算出网页排名,根据与搜索请求关联性的高低给出搜索结果。

2. 2. 2 扩充背景知识库构建

由于对每个词都单独取实时搜索结果会导致关联度计算的时间开销太大,本文通过结合Wikipedia分类结构和Google搜索构建离线扩充背景知识库。Wikipedia中主要的主题分类包括Agriculture、Arts、Culture、Environment、Geography、Health、History、Humanities、Humans、Language、Law、Mathematics、Medicine、Nature、People、Politics、Professional studies、Science、Sports、Technology,使用Google搜索获得与这些主题相关的排名最靠前的50 个网站( 不包括仅为单个网页的搜索结果) ,继而去抓取这些网站中最新的文章,最后按照其所属的分类进行存储,即构成GooRel计算的背景知识库。

2. 2. 3 LDA主题模型

LDA[17]是一种主题概率模型,可以得到文档集中每篇文档的隐含主题概率分布。LDA概率图模型如图4所示,其中α和β表示语料级别的超参数,θ表示文档主题的概率分布,φ表示特定主题下词的概率分布,M表示文档集的文本数,K表示文档集的主题数,N表示每篇文档包含的特征词数。

给定一个词 ωi和一个隐含的主题tj,模型返回 ωi归属于主题tj的概率mij( j = 1,2,…,k) ,对词 ωi,最终的模型输出结果为:

其中,k为隐含主题的数目。

本文采用Gibbs采样估计当前采样词wi的主题tj的后验分布,迭代完成输出主题-词参数矩阵  和文档-主题矩阵 θ 。

2. 2. 4 GooRel关联度计算

对于一组待计算语义关联度的词,首先将其分别映射到扩充知识库的分类上,取出各自对应的结果集; 其次,因为对应的分类结果集中可能包含主题不相关的网页,采用朴素贝叶斯分类器进行筛选,其中训练集通过Wikipedia获取,使用主题词对应维基文章以及文章中所链接的相关维基概念,以及See Also链接文章,构建出每个词的分类训练文本集,去掉主题不符的网页。如果某个词对应的结果集在筛选后网页数量少于3000 个,通过取对应词在Google中的实时搜索结果进行扩充,同时将这些搜索结果也添加到扩充知识库对应的类别中。

最后,对上述消歧完毕的网页文本内容使用LDA进行主题建模,建模过程中的参数估计采用Gibbs采样,迭代次数为1000次,其中主题数量K从10,20,…,一直迭代到200,取得到最优结果的情况; 其中 α = 50 /K,β = 0. 01。最后,对待计算语义关联度的词语 ωi和 ωj的所有网页数据通过LDA计算出分布tr( ωi)和tr( ωj) ( 参见式7) ,计算余弦相似度得到这对词语的语义关联度:

2. 3 WGR语义关联度计算

WGR关联度计算综合WikiRel和GooRel两种方法,对于给定词对 ωi和 ωj,二者的语义关联度计算如下,其中 λ = 0. 66,μ=0.34。

3 实验及分析

3. 1 实验环境与数据集

本文实验环境如下: Windows Server 2003 系统,配置双核3. 5 GHz CPU和32 GB内存。

实验所用的Wikipedia数据来自其官方网站下载的数据集,数据集是2013 年5 月3 日进行的备份。实验所使用的Google扩充背景知识库通过Java编写的爬虫软件抓取搜索结果及网页,平均每个类别收集了接近10 000 个网页,对每个网页的预处理包括取出网页body主体文本内容,剔除特殊符号、HTML标签、停用词以及出现频率极低的词后进行存储。

本文选择最常用的Word Similarity-353 测试集[18]作为语义关联准确率评测数据集。

3. 2 实验结果及分析

在测试集上对本文提出的算法( WikiRel、GooRel、WGR) 进行实验,采用Spearman等级相关系数评估语义关联度计算准确度,实验结果及分析如下。

3. 2. 1 WikiRel参数分析

WikiRel关联度计算中,计算词语-维基概念相关性时实验了三种方法OLS、OLR和SVR对式( 1) 中的参数进行拟合,三种拟合方法对应得到的WikiRel计算结果如表2 所示。

从表2 可以看到,使用最小二乘法( OLS) 取得了最好的计算结果。支持向量回归( SVR) 结果稍差,而使用次序对数回归( OLR) 结果最差,因为其对式( 1) 中参数的返回值导致很多词语-维基概念相关性结果为0。最小二乘法( OLS) 对式( 1) 的参数分析结果如表3 所示。

从表3 可以看到,TFIDF、is Bold、is Italic 、is Anchor、is Image是显著属性,TFIDF值的权重最高,is Bold黑体、is Italic斜体表示强调,体现着一定的关联性。is Image( 图片描述) 和is Anchor( 锚文本) 所能体现的关联性较弱,部分维基文章中的图片和概念主题并不相关,锚文本也是如此,部分链接的添加只是起到引导作用,并没有实际的语义关联。而段落结构( is First Para) 的权重最低,其对词语-维基概念相关性的影响要弱于文字样式。

3. 2. 2 WGR算法评测

WGR算法关联度评测结果如表4 所示。

( 1) WGR与传统方法对比

如图5 所示与传统使用人工语义词典的方法相比,WGR采用Wikipedia作为背景知识库,同时借助Google结果资源,准确性取得了较大提高。

( 2) WGR与现有使用Wikipedia的方法对比

图6 为WGR与WikiRelate、ESA、WLM的对比,也取得了更好的准确率。WikiRelate把在传统词典知识集上使用的方法应用到Wikipedia的层次分类树上; WLM利用Wikipedia文章网络,但其没有区别对待各种链接,并且只考虑与源概念结点直接相连的链接,虽然WLM算法也应用了Google资源,但仅仅是考虑词语的共现频率。ESA算法利用了所有维基文章的文本内容,但仅以TF-IDF值作为词语-概念相关性权值,而且要对几乎所有的维基文章进行预处理来计算词语-概念相关性的倒排索引,计算量非常大。

图7 中LDA所指代的方法为文献[13]提出的使用LDA对Wikipedia文章集进行建模,结合输出的矩阵计算语义关联度,取得了较好的准确度,验证了使用LDA模型处理文档集合计算语义关联度的可行性。本文中提出的GooRel方法,对每个词所使用的文本资源集合覆盖度和时效性更好,取得了和文献[13]方法相近的结果。虽然TSA算法的准确度比WGR稍高一点,但其采用1863 年至2004 年,超过130 年的纽约时报文章存档作为外部资源,这些资源根本无法通过常规途径获取到。

( 3) GooRel结果分析

图8 中横坐标为每个待计算关联度的词对应的搜索结果中参与LDA建模的网页数量。为了验证外部资源对GooRel语义关联度计算的影响,实验中,在清除掉歧义结果页面后,对每个词分别取前500,1000,…,直到5000 个结果网页进行建模。每个词所采用的网页数量对结果的影响如图8 所示,随着参与主题建模的网页数量的增加,准确度不断提升,但在网页数量到达3500 时,提升效果渐趋稳定。

4 结语

关联计算 篇8

1 对计算机知识延展与关联的认知

所谓知识延展,指在知识的宽度、范围上向外延长、拓展。计算机知识的延展性在于计算机程知识都有其宽度、范围,并且随着IT技术的发展不停息的延长与拓展,就像大树的年轮。例如程序设计课程中的C语言:C→C++→.NET中的C#,Java语言中的Java→JDK→J2SE→J2EE→J2ME等;又如数据库课程知识的延展:数据库原理→各种DBMS技术→数据仓库→数据挖掘→Newsql等等;计算机知识的延展性不应理解为它的发展史,意义在于应该让同学们了解每门课程知识的来龙去脉,以利于掌握旧知识,引入新知识。例如C++是C的扩充,它是为了适应面向对象程序开发方法应运而生的。C#是一种最新的、面向对象的编程语言,它使得程序员可以快速地编写各种基于Microsoft.NET平台的应用程序,.NET平台是当今各种信息系统的主要开发平台。Java是高效的跨平台开发语言,它能够被应用在信息网络的平台上编写互动性及强的Applet程序。它的延展JDK能使程序员具有良好的开发环境与平台;J2SE延展是环境平台的拓广、它更快速。J2EE延展可以用来实现企业级的面向服务体系结构和当今最流行的Web 2.0应用程序开发环境;J2ME延展为在移动设备和嵌入式设备(比如手机、PDA、电视机顶盒和打印机)上运行的应用程序提供一个健壮且灵活的开发环境等。计算机知识中还有一种思想、方法的重要延展,比如操作系统API的思想方法,在许多个行业中都能通用(比如软件开发,比如通信)。需要说明的是,知识的延展并不需要我们在教学过程过于深入,四年时间很短,但我们认为这是必需的,它能为同学们指明方向,以至于毕业后,对新环境、新技术不会有太大的陌生感。

关联指的是知识之间都存在互相贯连。承如上面的例子,虽然Java与C分属不同的开发技术,但它们又有一定的关联。Java是一个纯的面向对象的程序设计语言,它继承了C++语言面向对象技术的核心,Java舍弃了C++语言中容易引起错误的指针(以引用取代)、运算符重载(operator overloading)、多重继承(以接口取代)等特性,增加了垃圾回收器功能用于回收不再被引用的对象所占据的内存空间,使得程序员不用再为内存管理而担忧;Java平台是基于Java语言的平台。这样的平台目前非常流行,因此微软公司推出了与之竞争的.NET平台以及模仿Java的C#语言等等。通过这样对知识关联的讲解,提高了同学们学习软件开发技术的兴趣,以及对未来技术的选择有一个自己的判断。还有一种是计算机课程知识关联,比如数据库管理系统与高级程序设计语言关联;操作系统与编译原理关联;数据结构与高级程序设计语言关联;计算机原理与操作系统关联等等。其实每一门计算机课程都具有极强的开放性与系统性,每门课程中都存在关联,我们在教学过程中应强调关联,这样能使同学们对知识的理解不至于孤立。如今有许多毕业生出去后,爱说的一句话是大学四年我似乎什么都没学到,其实最大的根源在于这种系统化认知能力的缺失。强调关联也即强调专业系统化认知能力的培养。

2 对计算机知识延展与关联的教学认知

我们应该认识到,计算机教学不应只是传授、接收知识的过程,而是师生多向、互动的、开放的交流的过程,而这种多向、互动的、开放的交流过程意味着更多的不确定性和生成性。正是交流过程中的这种不确定性和生成性,才会产生知识的延展与关联。因此我们必须注重师生交流环境的打造,如课堂交流,课外课程QQ群、电子邮件、论坛以至现今流行的微博等等。只有在深度交流中,知识的延展与关联才能得到真正的实现。

对知识延展与关联的教学也不只是单纯的引导教学,我们在教学过程中应该从学生已有或现有的知识体系中,通过具有开放性、延展性的提问方式逐步引出新的知识,要让知识从学生的思想当中流淌出来,而不是我们灌输进去。因此,我们要充分地了解学生的知识储备程度和面对新问题具有的可扩展的程度,从而使提问的延展性得到合理的发掘。比如在数据库教学中,并行处理问题,可提问如果并行处理用户数到达上亿,MSSQL能胜任吗?通过实验,显然费劲,引出新知识:Oracle数据库管理系统,Oracle主要是大用户量下的并行处理能力极强,因为Oracle提供了“无阻塞查询”功能。Oracle是当今社会上大型企业机关(银行、电子商务、证券、公安)首选的数据库管理系统,它安全、可靠、更胜任互联网时代的需求。根据此问题,还可引导学生在时空上做拓展性的延伸,联系现实或环境谈出新的认识不同的看法。比如课外可进一步延伸到“Windows+sql-server”与“Linux+Oracle”的学习与讨论。此外,提问的延展与关联方法还有很多:比如结合所学知识,从学生的爱好处延展,然后提出问题;结合所学知识,从计算机知识体系的不同角度中延展与关联,然后提出问题;以及从开发方法、对比中延展与关联等等。

3 结束语

教学过程中,仅仅具备知识延展与关联的意识还远远不够,要做好知识的延展与关联,往往还要涉及到课程设计是否细致周密、课堂安排是否紧凑合理(不要随意延展问题)、软硬件环境是否配套、实践能力如何延展关联等等诸多方面的具体问题。计算机知识的延展与关联是一项系统工程。总之,我们只有充分注重计算机知识的延展与关联,才能培养出社会需要的计算机专业合格人才。

参考文献

[1]http://baike.baidu.com/view/1818194.htm.百度百科,延展.

关联计算 篇9

近年来,随着大数据、云计算等新技术的出现,教育资源公共服务平台的建设逐渐引入了云计算的应用,学习资源的数量几何级倍增。如何精准地把资源投放到资源用户成为云环境下个性化学习资源推送的一个重要问题。

云计算学习资源推送概念

随着云计算的不断发展,资源过载、资源隐晦、资源迷向等问题逐渐成为亟须解决的问题。在浩如烟海的“信息云”中,用户虽然是“身在云端”,但寻找感兴趣的信息却变得愈加困难,他们根本无法有效地发现自己所需的信息资源并加以选择和吸收。此时,推送技术为解决个性化学习资源获取难这一问题提供了可行之径。云计算学习资源推送是在“云”上通过一定的技术标准或协议定期传送用户需要的学习资源的一项新技术,它根据用户的兴趣搜索、过滤信息,并将其定期推给用户,帮助用户高效率地发掘有价值的信息。

资源推送对象分析

中小学电脑制作的对象主体是学生及教师。电脑制作作为一项培养学生动手创新能力的信息技术活动,学生的天性、学生对作品表现出来的天真浪漫自然要得到充分体现。学生是电脑制作活动中的主体,他们的兴趣特长、年龄年段等信息是学习资源云平台预定义数据项最先收录的。指导教师一般由信息技术教师与美术、语文等相关学科的教师组成。信息技术教师在辅导工作中, 可以担任活动信息获取、指导学生解决技术问题等工作。美术教师既对辅导电脑绘画有专业特长,也可以对动画、网页、电子刊物等进行美术指导。语文教师对辅导电子刊物较擅长,所以如何理解活动主题及如何写好“作品创作说明”可由语文教师进行辅导。

推送资源类型分析

1.电脑绘画

运用各类绘画软件或图形、图像处理软件制作完成的绘画作品。此类作品所对应的推送学习资源素材为各种主题的图标、图示、图例等图片以及图形图像处理软件,推送素材主要是.bmp、.jpg、.psd等格式的学习资源。

2.电脑动画

运用各类动画软件,通过角色绘制、 音效处理与动画制作,完成二维或三维的电脑动画作品。此类作品所对应的推送学习资源素材为Flash动画源文件、3Dmax动画源文件,以及相关主题的图片,推送素材主要是.fla、.swf、.max、.jpg、.bmp等格式的学习资源。

3.网页

使用语言或网页制作工具编制的阐释某个主题或传递某类信息的作品。此类作品涵盖各类多媒体素材,在学习资源推送上主要以内容主题推送图文素材、 音视频流媒体素材为主,推送素材主要是.txt、.doc、.jpg、.bmp、.fla、.swf、.wma、.mid等格式的学习资源。

4.电子刊物

运用各类文字、绘画、图形、图像处理软件,创作的电子报或电子刊物。 此类作品所对应的推送学习资源素材为Power Point和Word文件,以及相关主题的图文,推送素材主要是.txt、.doc、.ppt、.jpg、.bmp等格式学习资源。

如何推送资源

1.预定义模式推送

在中小学电脑制作中,“云”端首先获取教师和学生的初始化信息,根据用户信息初步推送个性化学习资源,该类资源推送为预定义模式,这是一种有目的性、自动化的资源推送模式。

在第一次使用教育资源云平台时, 对象为教师的用户须在云平台注册时提供个人相关资料,主要是教师所教学科、所学专业、所教年段以及兴趣爱好等数据项,以此保存记录教师的原始信息。同时,教育资源云平台会根据教师的基本信息推送相关学科、专业、年段及感兴趣的学习资源。对象为学生的用户在第一次使用教育资源云平台时, 注册录入的则是学段、年级、学习特长、 兴趣爱好等数据项,教育资源云平台会根据学生的基本信息推送相关学段、 年段、学习特长及感兴趣的学习资源。

预定义模式提供的信息具有针对性,信息技术、科学、语文、美术等学科教师在辅导过程中可根据各自的学科优势,扬长避短,精准获取活动初步学习资源,继而用于辅导学生进行资源的整合和再加工。同时,不同年龄段的学生也可结合自己的特长,初步确定自己所要学习的项目。当然,在教育资源云平台的推送过程中,教师和学生可根据组别及作品类型,有目的性地修改完善注册数据项,如学生在活动中期通过勾选类型资源或类别作品后,按需获取电脑制作相关学习资源进行后期的电脑作品创作。

2.云平台智能推送

教师和学生在云平台检索电脑制作相关资源时,教育资源云平台不仅可以记录用户浏览次数,智能分析用户的使用习惯及使用需求,而且能够根据资源的格式,资源内容,资源涉及学科、学段、年段等信息,在浏览者下次登录时根据最近日期浏览的资源显示并推送相关此类资源,或在浏览者下次登录时根据历史浏览资源次数按多到少的顺序显示并推送此类相关资源。例如,在教师辅导学生“远离毒品,珍爱生命” 的电脑动画制作时,在平台上频繁搜索这一方面的素材,平台根据用户的浏览点击数,对资源进行数据分析。当用户下一次登录时,云平台不仅能够将这一题材的素材显示出来,还能够智能推送相关的资源。

3.按主题推送

电脑制作中,作品主题思想的设置非常重要,没有思想的作品就如同没有中心的文章。教师和学生须发挥主观能动性,结合学生的生活与学习热点,引导学生积极观摩、学习优秀作品,并从中得到启发挖掘出创造性思想。教育资源云平台能够收录大量的优秀作品,并按照作品主题内容进行分类,设置主题大类标签,每个大类标签的主题再逐级细化为小类标签主题。当教师及学生在搜索需要的主题作品时,云平台借助主题标签“云”端巧妙地向用户推送相关主题作品。例如,学生在创作以“未来的汽车”为主题的电脑绘画时,构思未来汽车具有自动获取能源、多功能、 多用途等特点,挖掘出“环保”“科技”的思想火花,并通过平台分类标签,选择对应的主题标签“绿色环保”“科技创新”,这样即可获得云平台推送的相关主题资源。

结论与反思

关联方关系及关联方交易审计 篇10

由于关联方交易的一方可以对另一方的财务以及经营状况产生较大影响, 所以大多是幕后交易和非正常交易。关联方交易的隐蔽性和非公平性对证券市场和资本市场的发展产生了不良影响。

大部分上市公司与其关联方之间都存在着各种形式的紧密的资金往来, 近年来利用关联方关系进行地下交易的事件已引起了社会各界的高度重视, 相应地, 关联方交易审计已经成为审计领域的一个难点。

一、关联方交易审计风险的成因

1. 关联方交易隐蔽性的特点导致其审计风险很大。

现代关联方交易形式多种多样, 而且涉猎范围非常广泛, 给关联方交易提供了便利的条件。企业业务发展的宽泛性以及各种新的经济业务层出不穷, 使得关联方交易可以轻易地发生而不为外部人所发现, 因而即使是专业的审计人员也存在着一定的固有风险。

2. 现代审计方法中有一些固有的缺陷。

现代审计中应用抽样技术, 是一种风险导向审计。抽样技术本身就具有固有风险, 以样本的特征来估计总体的特征, 总会产生误差, 审计抽取的样本量越大审计的风险越小。由于会计师事务所审计是有偿审计, 需要在规定的时间内完成任务而且有成本上的考虑, 所以会计师事务所往往认可承担一定的风险。而在审计过程中, 一定程度上要依赖审计人员的专业判断, 这种主观判断也存在一定的风险。这两者就加大了关联方交易审计的风险。

二、关联方交易审计的重点

根据实质重于形式原则, 在关联方交易中应看重交易的实质, 发现反常现象要深入调查研究, 弄清楚关联方交易对财务状况、经营成果和现金流量的影响。笔者认为主要应关注以下几个方面:

1. 购销业务。

比如说购销价格反常、售后短期内又回购、低价销售给不必要的中间企业、贷款未还清又赊欠等购销业务。又如集团公司为了保证其上市子公司的利润, 在销售产品后让客户把销售款打给自己的子公司, 从而造成子公司利润的虚高。在账面上就造成集团公司先把货物销售给子公司再由子公司销售给客户的假象。如果购销价格与市场价格相差很远, 则注册会计师有理由怀疑存在关联方交易。这时应做进一步的审查, 查看企业的相关资料, 比如有关票据、合同、协议等以及其他与定价有关的文件。购销价格与市场价格进行比较时, 要注意销售商品的关联方与对比企业应是相同地域、相同时间, 使价格更加具有可比性。

2. 应付科目以及坏账相关科目。

资金拆借利率与市场利率相差较大、借给不具备偿还能力的企业、逾期不还等行为都可能造成应付账款和坏账类科目的错误。比如集团公司把资金借给下属子公司之后对外宣称子公司无力偿还, 对此账款计提坏账准备, 然后再逐步对此坏账进行注销, 从而使得集团公司的资金转移到子公司的名下, 子公司利润虚高, 达到操纵子公司利润的目的。注册会计师遇到这种情况, 应重点关注资金占用费的占用情况, 是否偏高或者偏低, 以及借出资金无法收回而分期核销的情况。

3. 管理费用科目。

公司之间进行交易时, 除了实物交易之外, 往往还有一些咨询、劳务等服务。在这些服务中, 就容易出现价格不合理及对不存在或无法实现的咨询服务付费等情况。例如集团公司向其下属子公司销售货物, 其价格明显高于国际市场同类产品价格, 企业把高出的部分归为技术服务费。这种费用就是企业杜撰出来为了应付账面而设置的科目名称, 实际上该子公司并未提供任何技术服务。这种“挂羊头卖狗肉”的做法, 很容易在关联方交易中混淆视听, 损害股东和其他利益相关者的权益。

4.“财务费用”科目以及相关的“投资收益”、“其他业务收入”科目。

利息收入一般归入“财务费用”科目, 租金等收入归入“其他业务收入”, 投资收益归入“投资收益”科目。上市公司为了粉饰业绩, 使财务报表看起来更加完美, 会让子公司或关联企业先支付高额的投资收益、租金和利息等, 以增加利润, 在资产负债表日前后发生这一状况尤其应该注意。

5. 非货币性资产交换的相关业务。

发生易货业务时, 容易出现实质与形式明显不符的交易, 有关联方关系的双方可以在对资产的评估中做些手脚, 使得一方获利而外人无法察觉, 从而增加一方的利润。

6. 当期发生的资产重组业务以及投资方案。

是否有新的关联方形成, 或者解除关联方关系。资产重组的关联方为了改善公司资产的质量或者提高关联方资产的质量, 将优质资产与不良资产进行置换, 通过不等价的交换操纵利润。在这一过程中比较常见的做法是, 子 (母) 公司将不良固定资产、存货或者长期投资卖给其母 (子) 公司, 这样可以提高投资报酬率, 利用买卖的价差获取利润。注册会计师在审查时应着重关注相关资产的估价, 检查被审计单位的所得税申报表以及其他相关的资料。

三、关联方交易审计的程序

关联方交易审计与其他一般审计相比具有更大的风险性, 所以注册会计师在审计时要更加提高警惕, 以免出现审计偏差。为此, 关联方交易审计应怎样进行引起了广大注册会计师的关注, 也成为亟待解决的课题。

1. 识别关联方。

注册会计师通过对以前年度工作底稿的复核, 确认已经经过识别的关联方名称。同时还可以询问管理当局对于关联方的看法, 复核投资者所记录的关联方和从股权登记机构获得的关联方名单。最后查看股东会和董事会的会议记录, 询问前任注册会计师, 复核所得税申报单以及其他相关信息。

2. 识别关联方交易。

首先, 复核管理当局提供的关联方交易信息。其次, 了解被审计单位与关联方交易的内部控制情况, 这是其中关键的部分。注册会计师要警惕异常的交易, 比如价格异常、实质与形式不符, 未予记录的交易等。最后, 就是需要进行一些常规审计中也需要运用到的审计程序, 如执行交易和余额的细节测试、查阅股东会和董事会的会议记录、复核异常交易、复核对债权债务关系的询证函回函、复核对银行的询证函回函、复核投资交易等。

3. 检查已识别出的关联方交易的审计程序。

第一, 审计商品和其他资产的购销业务, 确定其定价政策是否得到合理应用, 检查发票、合同等原始票据。第二, 审计关联方相互提供劳务的状况, 同样查看其价格是否出现异常。第三, 审计融资状况。第四, 查看担保、抵押和租赁情况。第五, 审查开发项目的转移业务。

4. 审计关联方及其交易的披露是否充分和适当。

首先, 查看被审计单位会计报表附注中是否有以下几项内容:企业所持股份或权益及其变化, 企业经济类型或性质、名称、法定代理人、注册地、注册资本以及变化情况、主营业务等。其次, 查看是否披露关联方交易的性质、类型和交易要素, 如交易的金额、未结算的金额、定价政策等。第三, 审查被审计单位对合并问题的披露是否恰当。最后, 审查其他应披露的相关事项。

5. 重点审计。

在审计过程中要对明显不公平的交易进行重点审计, 并且向被审计单位管理当局索取关联方交易的相关文件, 以明确会计责任和审计责任。

6. 根据审计结果形成相应的审计意见。

根据上述分析, 确定是出具无保留审计意见还是保留意见、拒绝意见、否定意见的审计报告。

四、关联方交易审计风险防范措施

1. 审计之前对被审计单位进行全面了解。

在关联方交易审计中, 会计师事务所及其注册会计师稍有不慎就会成为审计诉讼中的“替罪羔羊”。要避免这一情况最根本的办法就是在审计之前认真审查被审计单位的行业背景、企业财务状况、外部经营状况以及总体发展前景。只有在这一过程中保持谨慎的态度, 才有可能在后面的审计中减少压力, 避免为了一己私利而使整个会计师事务所背负诉讼中产生的财务压力以及名誉损失。除了公司状况之外, 审计人员还应该具体了解被审计单位管理层的情况, 如管理层的可信赖程度、企业中管理机构的设置情况等。这有利于审计人员对审计中所承担的风险有一个大致的了解, 以做好充分的准备。审计诉讼中, 很大一部分都是发生在经营状况不良而导致破产的企业之中, 所以对于经营状况不佳的企业更要深入调查, 避免因此而陷入舞弊的泥潭。在这一阶段中也许会花费不少成本, 但是根据历史来看, 只有在这一部分下足了工夫, 才能在之后的审计工作中大展拳脚并全身而退。审计之前完成对企业状况的了解之后, 就可以签订审计业务约定书了。

2. 审计时严格遵守审计程序, 降低检查风险。

在审计过程中, 固有风险和控制风险都是不可改变的, 而在关联方关系及其交易审计中, 固有风险和控制风险都比较高, 所以在检查风险这一部分, 更应该注重其降低的途径和方法。

在审计工作的计划阶段, 需要执行初步的分析程序, 了解审计的内控制度以便于对其风险有个大致了解, 并充分了解被审计单位所在环境以便于进行风险评估, 然后确定其重要性水平, 制定总体审计策略和具体审计计划, 开展初步业务活动, 确定审计的重点。

在审计工作的实施阶段, 进行整体调研, 确定完整的关联方对象, 严格按照审计程序进行控制性测试和符合性测试程序。特别是在现代交易中频繁出现的关联方交易非关联化的情况下, 审计人员应该特别注意, 要遵循实质重于形式原则, 避免一些关联方“隐身”。比如上市公司A与其子公司B在购销业务中, 本来一笔交易就可以完成的非货币性资产交换业务, 分解加入一个无关公司C, 这就变成了出售资产和购入资产两笔业务, 以逃避企业会计准则的约束。这样就有机会增加公司利润, 避免作为关联方交易来审计。用实质重于形式的原则确定关联方对象之后, 再看关联方交易的审查和披露是否规范、真实和公允。对于关联方交易的审查, 要特别对关联方交易中的定价问题予以重视。在关联方交易的披露中, 要重点查看关联方交易在企业财务报告及其附注中的披露是否符合重要性和充分性的原则, 这样可以详细了解关联方交易对于会计报表的影响程度。

3. 注重与管理当局的沟通。

与管理当局的沟通是审计程序中的重要一环。审计人员得到的大部分资料都是管理当局提供的, 管理当局配合与否直接决定了审计的成败。审计人员在审计之前对企业管理层的背景调查时已经对管理层有个大致的了解, 要保持沟通, 与管理当局建立良好的关系, 明确会计责任与审计责任。无论在审计的计划阶段还是实施和报告阶段, 都应该争取管理层的配合。特别是涉及法外事项的关联方交易应该及时向管理当局表明双方责任。在审计的报告阶段, 应该向管理当局反馈关联方交易涉及的重大调整事项, 与管理当局进行沟通, 以便进行恰当处理, 并且根据沟通和处理情况, 出具恰当的审计报告。

4. 提高审计人员素质。

审计人员的素质在关联方交易审计中要求很高, 由于关联方交易审计的特殊性, 对审计人员的专业判断能力、分析能力都有较高的要求。这些素质体现的不仅仅是专业知识, 更是经验的积累。专业判断能力贯穿审计过程的始终, 分析能力在审计实施阶段尤为重要。另外, 法律对于关联方交易的处理和披露还有一定的漏洞, 这部分更是需要审计人员进行合理判断。对于法律和会计准则没有明确要求的事项, 审计人员应该根据审计情况和企业实际来决定是否需要披露。

综上所述, 本文通过对关联方关系的分析, 结合关联方交易的经济背景, 关联方交易审计在理论和实践上都是一个突破。同时, 通过对关联方交易审计风险的成因进行分析, 归纳出审计中重点关注的部分。当然, 在关联方交易审计风险的降低在考虑获取材料真实性和完整性以及审计人员自律性的基础上, 还要通过严格执行关联方交易审计的程序来实现。此外, 还需要注重审计之前对被审计单位的了解以及与管理当局的沟通等。

参考文献

[1].张继勋.审计学.北京:清华大学出版社, 2008

[2].刘华.审计治理规范与案例.上海:复旦大学出版社, 2007

[3].丁朝霞.案例通略——由内审案例透视审计方法与技巧.中山:中山大学出版社, 2006

[4].王应华.关联方关系及其交易审计中应关注的几个问题.中国注册会计师, 2005;89

【关联计算】推荐阅读:

关联波动07-16

关联效应07-17

意义关联05-14

关联关系05-15

智能关联05-17

政府关联05-22

关联准则05-22

关联加权05-28

空间关联05-29

关联监控06-09

上一篇:奶牛流行病下一篇:继母