关系约束

2024-08-16

关系约束(精选8篇)

关系约束 篇1

0 引言

针对抗震救灾坏境中宏观任务的下达,任务的分解细化过程,研究一种任务的分解机制[1,2,3]。该机制首先依据任务的具体状况定义任务的唯一标识、开始时间、生命周期及任务重要度,实现对任务的初始化标识。其次定义任务间的约束关系[4,5,6],包括同步、串行、父子关系以及同步下受时序和资源约束等,确定任务之间的相互联系,为执行任务分解做好准备。然后,研究一种基于任务分解树的算法:建立一棵空的任务树,将任务节点放入任务队列中,依据任务间的约束关系从任务队列中提取并放入任务树的适当位置,直至任务队列为空,这样最终依据任务间约束关系通过任务分解树的方法实现对任务的分解。

1 任务的四要素

任务可以分为复杂任务和简单子任务,为了更好地完成某个目标,其对应的任务应该进行分解和调度,以保障更好更快地完成。

定义每一个任务为一个四元组[7,8]G = ( ID,Begin,Time,I)

① 其中ID代表每一个任务的名字,不同的任务具有不同的ID,且不可相同;

② Begin代表任务的开始时间,因为任务的分解与调度中常有时序约束,所以要考虑不同任务的开始时间;

③ Time代表任务的持续时间;

④ I代表任务的重要度。所谓重要度指当遇到突发情况时,每个节点的紧急情况可能各不相同,重要的节点应优先考虑处理,不同的任务可能具有不同的重要度。

2 任务的关系约束

定义如下几种关系约束:

① 同步执行任务集P = { T1,T2,T3} ,即任务T1、T2、T3 可以同步地执行,主要是对于同层的节点,如图1 所示。

② 串行执行任务集S = { T3,T4,T5} ,即任务T3、T4、T5 必须逐个执行。 用集合表示为如图2 所示。

③ 父子关系任务集F = { T5,T6,T7} ,即任务T5 可以进一步分解为T6、T7。表示T5 是T6 和T7的父节点,父子关系任务集中,父节点可能全面的包含子任务或是部分包含,全面包含指的是子任务全部完成,父任务才可执行,用集合表示为: T = { T5,A{ T6,T7} } ,如图3 所示。而部分包含指的是完成部分子任务后即可开始执行父任务,用集合表示为T = { T5,O { T6,T7 } } ,如图4 所示。用方框置于外侧是表示这是一个任务分解模块,T5 是由T6 和T7组成的。

④ 同步执行的任务可能受到时序或资源的约束,若两个任务A、B。A在时间或资源方面需在B之前完成,则定义如下。所以对1 中任务集{ T1,T2,T3} 进一步完善,若T1 对T3 有时序约束约束,则定义。

综合分析上述情况可以把任务分解表示在一个大的集合内。

待执行任务,表示在一个大的集合内可以直观地看出几个任务之间的关系与层次。

根据上述定义可以得出任务分解树,如图5所示。

其中T1 对T3 有时序或资源方面的约束,在图中用T1 - 3 来表示这种约束关系。T3、T4、T5 是串行执行的。T6、T7 全包含于T5。针对不同任务节点的重要度,可以对任务分解图进一步优化,节点的重要度可以开始时由更高层级直接指定,若没有指定,则依据节点重要性的算法来衡量。假设图5 中高层级指定了T3 的重要度高于T2,则在出现紧急情况时优先考虑T3。若没有指定,以节点重要性的角度去考虑,T3 节点的度数高于T2,所以T3 重要度大于T2( 以节点的度来衡量重要性) ,根据以上两种情况,可以把任务分解树优化。

3 基于任务树的任务分解

在进行任务调度时,首先要考虑节点间的时序约束,其次当在进行任务调度出现紧急情况时,同层中左边节点的重要度大于右边,所以优先处理左边节点出现的情况,这种任务分解树看上去直观,且考虑的更加全面。

基于任务树的任务分解算法[9,10]步骤如图5所示。

步骤1: 初始化任务树节点置为空,把每项任务定义为任务树中的节点,并把节点间的相互约束关系置于节点关系表中;

步骤2: 为每个节点分配唯一的ID,初始化任务的开始时间Begin和预估执行时间Time,根据需要判断是否初始化重要度I,若需要则给定相应等级,否则置为空;

步骤3: 设置一个队列,把所有任务节点置于队列中,首先输出代表源节点的节点S;

步骤4: 从队列中依次输出每个任务节点;

步骤5: 输出的节点是否需要进一步分解,若是则符合父子约束关系,在任务分解树中生成该节点的子节点,其层次为父节点加一,并由父节点指向子节点。若不是则跳转到7;

步骤6: 判断父节点是全包含还是部分包含,若是全包含则所有子任务执行完成才认为父节点完成,是部分包含则部分子任务完成,父任务就认为完成;

步骤7: 以节点任务表中的约束判断输出的节点是否符合同步执行约束,若是则任务分解树中节点间层次相同并假设层次为n,且由n - 1 层节点同时指向它们。若不是则跳转到步骤8;

步骤8: 以节点任务表中的约束判断输出的节点是否符合串行执行约束,若是则任务分解树中任务节点的层次逐步递增,且层次低的节点指向层次高的节点,若不是则跳转到步骤9;

步骤9: 按节点重要性算法计算未置初值的任务节点的重要度,判断是否需要优化,若是则跳转到步骤10,不是则跳转到步骤11;

步骤10: 同层中把没有时序约束且重要度高的节点i( 包括它的子节点) 不断左移,直到其左侧节点对i有约束则停止,所有节点优化完跳到步骤11;

步骤11: 重复执行步骤3,直到队列中节点为空,生成任务分解树。

4 实例验证

假设某次抗震救灾补给灾区运输车加油,由于搭建基地就只有一个,所以每个运输车按串行补给,总补给任务称为S,假设有n辆运输车,表示为B1、B2…Bn则n辆车之间的关系为串行关系,也就是当第1 辆车加油完毕后,第2 辆车才能加油。

步骤1: 对任务进行初始化标识,定义唯一标识为S,任务分为两类,即运输油A和加油B,开始时间为ts,生命周期为T,任务重要度为非常重要;

步骤2: 定义任务间的约束关系,只有运输油到的情况下,才能加油。因此对运输油任务A对加油任务B有时序约束。在运输加油任务中,由于加油基地只有一个,所以只能一个一个进行加油,因此加油任务A为同步关系; 运输油任务B可以并行进行;

步骤3: 建立一棵空的任务树S,将任务节点( 任务A和任务B) 放入任务队列中,依据两个任务间的约束关系( 任务A对任务B有时序约束) ,从任务队列中提取并放入任务树的适当位置,任务分解树如图6 所示。

5结束语

为保证抗震救灾环境下任务的执行,提出了救灾网络任务分解方法。文中提出的几种约束关系,考虑到了任务和任务间,总任务和子任务间的关系。而重要度的提出也是考虑到作战任务的特殊性,所谓重要度是指任务节点分主次,当出现紧急情况时优先考虑重要度高的任务,这可以保证在救灾环境下作战任务能最大限度地不受其他因素的影响。

参考文献

[1]肖增良,乐晓波.基于与或依赖图的多Agent系统任务分解算法[J].计算机工程与设计,2009,40(2):267-272.

[2]钟琪.基于启发式算法的任务分解策略[J].煤炭技术,2010,30(12):25-29.

[3]秦娜,乐晓波,刘武.基于Petri网模型的JSP粒子群优化调度[J].计算机应用,2008,28(8):2167-2169.

[4]White J E.Mobile Agents In:Bradshaw,Jeffrey eds.Software Agents,Menlo Pork[M].California:Press/The MIT Press,1996.

[5]Lange D B.Mobile Objects and Mobile agents:The Future of Distributed Computing[C]∥Proc of the European Conf on Object Oriented Programming’98.Brussels,1998:49-52.

[6]杨学会,王精业.基于任务分解的作战仿真研究[J].系统仿真学报,2006,18(10):18-21.

[7]刘波,罗军舟.大规模网络管理中的任务分解与调度[J].通信学报,2010,42(6):48-51.

[8]刘波,罗军舟.网络管理中多agent的半在线调度算法[J].计算机研究与发展,2006,27(3):65-72.

[9]王红霞,刘治国,潘成胜.分布式网络管理中的任务管理与任务调度的研究[J].沈阳工业学院学报,2009,30(11):15-19.

[10]金黎黎,孔令富.协同设计环境中任务分解与调度的研究[J].计算机工程与设计,2009,25(2):22-25.

关系约束 篇2

幼儿园教学活动中常会存在这么一个问题 :幼 儿受约束过多,一整天自由活动时间少,幼儿间相互交流的机会不多。同时又造成幼儿难于管理、易吵闹,出现难组织及“一放既难收”的现象。引起此原因的一方面是幼儿园比较重视保育工作、安全工作,及幼儿园一日活动安排结构紧凑、规矩多。如看幼儿半日活动安排:晨间活动(拍球)----晨谈-----早操----活动一---

活动二-----户外活动(体游“老狼老狼几点了”)-----午餐,若仔细观察你会发现孩子能自由地交流,做些自己喜欢的民间游戏根本不可能,教师也一直辛苦地牵着幼儿的鼻子走,从而出现教师喊累,幼儿总有使不完的劲想发泄的情况;另一方面更是由于教师本身没协调好对幼儿自由与约束的关系,没有在活动间为幼儿创造科学的自由时间,尽量弥补活动安排的缺陷。自由与约束的协调是成人学习、工作、生活正常开展所必须的心理条件。孩子也一样,也有自己的思想感情,需要自由地交流以达到心理情感的满足及平衡,他们同样需要有个自由的空间。这道理人人都懂,然而幼儿园教育中常常存在这问题!

为什么幼儿园活动中有部分孩子总是“难耐寂寞”、“调皮好动”呢?教育学家告诉我们,孩子一进入幼儿园,他的精力迅速发酵、膨胀,如此时没有充分的发泄场合,或没有加以正确的引导,孩子的精力就会过剩。这部分过剩的精力就将自找出路,其中一部分就会转化为“破坏 ”。可见孩子与成人一样也需发泄。一部分孩子的调皮也正说明了他们有旺盛的精力,需寻渠道解决.

卢梭指出:“自然教育的原则是自由,要求教育者只需创造出一个能促进儿童自然发展的适当环境,然后放手让儿童发挥本身的积极性,通过活动和个人经验,认识生活、进行学习、健康成长.”皮亚杰也指出:“要让儿童通过比较自由、积极的活动主动掌握知识、发展智力。”为什么样教育家们频频指出自由教育的原则,关 键在于孩子心理自由的情况下往往会有一种由内部指引的创造性的心理状态去积极地吸取环境。“一切有成效的活动必须以兴趣为先决条件。”尽管现代幼儿教育中我们已注意到了在教育活动中尊重孩子,以孩子为主体,主张“以人为本”。然而在一日活动中我们是否都做到了呢?我们是否为孩子的精力有正确的“用武之地”?

工作中,我们不难发现,当你让孩子在几个环节间允许孩子有充分的.自由活动交流的机会后,孩子往往会易于静下来,并易较长时间专注某一活动;相反,如果你烦躁地要求幼儿静下来,长时间约束幼儿“静”,孩子们会“不听使唤”,尽心安排的活动也会失去吸引力,这也是动静交替的原理之一。孩子有自己的思想感情需要满足,以促进心情舒畅,同时也为教师对幼儿的情绪激发奠定感情基础。心理学研究表明:大脑的潜能在心情愉快,精神放松的状态下,能够得到有效的释放和开发,因为良好的心境条件下,大脑神经会分沁一种激素,使人产生快感,增进大脑活动。因此自由活动所带来的轻松恰恰能促进幼儿的学习。压抑对 孩子身心、学习都不利。因此可见在组织活动中协调好自由与约束的关系是很重要的。

日常生活中,当你换一种眼光,用一颗童心去观察儿童,你会发现儿童在自由活动中所表现出来的交往能力是不可忽略的、令人惊叹的,及所体现的画面可以说是成人生活的缩影,是饶有趣味的“小社会”。关键在于教师是否能体会到。

关系约束 篇3

中国实行改革开放后, 30多年来在经济及社会发展方面取得了长足的进步。同时, 在经济发展特点上突出反映出热衷于粗放型扩张而轻视研发投资、自主创新能力的培养的问题。从相关统计数据来看, 我国的固定投资长期居高不下, 在90年代以来平均达到解决40%, 在2003年到2005年间连续三年超过40%, 而世界平均水平只有20%。另一方面, 在研发方面的投资经费支出一直水平较低, 2004年用于研发的国内生产总值仅为1.23%, 而发达国家为2.46%, 世界平均水平为2.29%。造成这种现象的原因是什么呢。本文试图从微观角度解析这种现象的原因, 研究如何促进中国企业加快自主创新、加强独立创新能力。

本文通过研究认为, 从微观视角来讲, 中国企业的投资尤其是研发方面的投资具有周期长、效益见效慢、成本高、不确定因素强等特点, 使得企业缺乏从事研发投入和研发活动的积极性。同时, 在目前信贷市场不健全的情况下, 研发投资和外延扩张型投资相比, 在资产抵押性质上所产生的效果差异较大, 影响企业的银行借贷融资能力, 为解决企业的融资瓶颈, 不得不偏好抵押能力强的外延扩大型投资, 而忽视对研发方面的投资。

要解决目前这一现状, 缓解融资约束对企业投资的不良影响, 需要我国在金融体系上加强建设, 开放私募股票市场及风险投资, 活跃融资市场, 扩大融资渠道, 为企业融资及研发投入提供金融支持。

二、融资约束与资产抵押对企业投资的相互影响

企业的发展需要大量的资金支持, 仅仅靠企业的自有资金是很难实现企业资金流的正常运转的, 同时还会增加企业运行的成本, 因此企业通常需要借助社会资金尤其是银行的资金支持才能获得更好的发展, 但是企业的融资受到银行等金融中介机构的各种条件的制约和限制, 也就是融资约束, 因此为了获得一定的资金支持, 企业的投资受到融资约束的限制, 并影响企业的投资方向。

(一) 企业投资构成及其比较

一般来说企业投资构成由两部分组成。第一, 扩大企业外部规模的实物投资, 包括厂房、生产设备、占地面积等;其二, 为提高企业自身发展实力、进行自我创新发展的研发投资。

这种投资企业所实现的资产功能主要有:

首先, 实物投资, 作为生产要素, 为企业的生产提供一定的支持作用。具体来说, 实物资产的投入能够扩大企业生产规模, 增加企业生产能力;研发投资所带来的无形资产如企业生产技术和管理水平的提高, 能够促进企业生产效率的提高, 以及企业盈利能力的增强。其次, 企业投资所带来的资产能够在进行借贷时作为负债融资的抵押物, 为企业的负债融资提供担保和抵押功能。

对于实物投资和研发投资在进行融资借贷时, 所起到的作用是有一定差异的:第一, 两种投资所形成资产其性质是不一致的, 实物投资形成场地、厂房、机器设备等实物资产, 比较适合做贷款抵押物, 而研发投资形成的是知识资本及知识产权等的软资产, 不具备实物形式, 不适合做贷款抵押物。第二, 两种投资所产生的风险特征也不不一样, 实物投资是在现有技术水平的前提下进行的生产规模的扩张, 因为企业对于现有技术和市场较为熟悉, 因此风险较低, 获益前景较为固定和可靠, 企业面临的风险较低, 投资阻力较小;但研发投资是一种创新行为, 收益前景并不固定, 存在的风险较大, 不确定性较强, 但是一旦成功所获得的收益较大。

(二) 企业实物资产投资、无形资产投资与银行贷款之间的融资关系

企业生产的现金流动压力决定了企业必须借助银行的资金支持才能更好的运转。同时, 银行为实现资金的效益, 需要企业进行借贷以实现盈利。企业管理者一般先制定投资计划, 然后向商业银行提交贷款申请, 在进行企业利润分割时, 企业具有完全的谈判力量, 因此在签订贷款契约时, 企业管理者会提出一份贷款契约, 商业银行有权选择是否接受, 且契约中明确规定, 企业必须按时还贷款, 否则银行有权获得企业的抵押财产, 并宣告企业破产。企业和银行必须按照贷款契约进行约定行事。但是企业生产的现金流量是外部人无法查看的, 企业管理者存在转移现金流量的可能, 为防止企业逃避债务, 商业银行在向企业进行借贷时一般要求企业进行资产抵押或者有第三方进行担保。

由于资产专用型及交易成本等因素, 如果企业不能按时还贷款, 银行获得的只是企业资产的一部分价值。且根据企业投资类型的不同其抵押能力是不同的。首先如厂房、场地、设备、机器等固定资产, 能够较为容易进行资产评估, 且有着非常强大的二级市场。其次, 如研发投资所带来的无形资产, 其价值难以估计, 很难出售, 因此在资产抵押方面不具有相当大的吸引力, 因此银行更愿意接受事物资产作为抵押资产。也就是说, 在企业资产中, 实物资产比起无形资产更容易吸引银行的资金注入。

因此, 企业虽然一方面能够获得银行的贷款支持, 解决资金压力, 但会受到银行在资产抵押方面的限制, 为了获得更多的银行贷款, 企业不得不加快实物投资, 而抑制研发投资等无形资产的投资。

(三) 完善资本市场下的企业投资

为研究融资约束对企业投资的影响, 我们假设企业投资有着完美的资本市场状态, 在这种市场状态下, 企业投资不受融资约束, 融资渠道较多, 因此企业为实现最优化的利益获得会选择是增加实物投资还是研发投资, 从而增加了对研发投资的几率, 且在为实现最优化的利益获得时, 企业不仅会增加实物投入, 而且同时会增加研发投入, 从整体上全面提高企业效益获得。

三、融资约束对企业投资行为的影响分析

下面引入融资约束来分析企业的投资行为。由于银行对实物抵押偏好的融资约束, 使得追求利润最大化的企业在外延扩大型实物投资及研发投资方面都低于社会最优水平。但融资约束对两种投资的影响程度有一定的差别, 其在资产抵押能力方面的差异将产生两方面的影响。第一, 资产抵押能力差异扩大了研发投资的机会成本。第二, 资产抵押能力差异减少了实物投资的机会成本, 从而提高了实物投资的水平。总体来说, 资产抵押能力的不同, 使得融资约束对研发投资的产生的负面影响要高于对外延扩大型实物投资的影响。因而所产生的经济促进效应非常明显:由于研发投资所产生的资产抵押能力较弱, 企业会选择增加外延扩大型实物投资从而增强其从银行的借贷能力, 最终实现企业的发展和利润的增加。

目前中国在金融体系方面还欠发达, 从而对企业的投资行为产生实质性影响, 随着中国的股票市场也获得了较快的发展, 近来的股权分置改革也为资本市场的优化和完善提供了有力条件, 但是目标中国金融体系中还是以商业银行为主导, 且在今后相当长的一段时间内, 商业银行还将继续占据大部分金融资源, 因此在此金融背景下, 企业的投资仍然面临资金压力和困境, 大部分企业还必将依靠商业银行。商业银行的负债契约的收益特性决定了商业银行不喜欢投资风险, 即使承担风险, 也必须通过资产抵押或者第三方担保来降低其风险程度, 因此企业投资所形成的资产抵押能力仍然会对企业的融资产生影响, 从而使得融资约束对企业投资产生重要影响。

为解决这一问题, 从短期来看一是需要商业银行提高甄别能力, 在控制好风险的基础上适当增加信用贷款。二是从长期来看, 需要我国大力发展风险投资、私募股票市场等多层次资本市场, 以创造更为健全的金融环境。

四、结论

本文指出中国企业投资目前存在的重视外延扩张型实物投资忽视研发资本投资的现象, 分析了这一现象存在的原因, 即企业在进行银行贷款时需要面对的资产抵押及融资约束, 指出实物抵押比起研发资本带来的无形资产抵押更容易获得银行的青睐, 由此造成企业投资的扭曲。我国商业银行需要在控制好一定风险的基础上增加风险贷款, 同时从长期来看, 我国需要发展和健全资本市场, 大力发展风险投资、私募投资市场, 为企业投资发展创造更好的金融环境。

摘要:本文通过引入企业资产抵押能力差异因素, 分析了中国企业企业目前热衷于增加资源投入的粗放型规模扩张而忽视研发投入和自主创新能力的投入的原因, 研究了融资约束对企业投资的影响。银行的融资约束会使得企业资产抵押能力差异通过抵制研发投资、重视实物来进行扭曲性投资选择, 使得企业产生投资扭曲的重要原因是外延扩大型投资比起研发投资更加有利于轻松获得银行的资金贷款, 通过抵押方式摆脱融资约束, 且能够不断扩大企业规模, 要解决这一问题需要从短期和长期两个方面展开, 一是从短期来看需要提高商业银行的识别能力, 在控制好风险的基础上适当增加信用贷款。二是从长期来看, 需要大力扶持和支持风险投资、私募股票市场等多层次资本市场的发展, 为企业的融资创造更好的金融环境。

关键词:融资约束,资产抵押,企业投资,研发投资

参考文献

[1]李湛.对中国上市公司债务期限影响因素的实证研究—基于面板数据的因子分析和回归分析[J].广东金融学院学报.2009 (2)

[2]周勇.荷兰节能减排五项最有效政策工具及在中国的应用[J].城市发展研究.2009 (6)

[3]钱雪松.融资约束、资产抵押与企业投资[J].广东金融学院学报.2008, 23 (2)

关系约束 篇4

为此,本课题小组在单频网重叠区域覆盖特性、网络拓扑结构、台站间距等研究的基础上,继续研究单频网两个发射台站在保护间隔内最高覆盖效率下发射台站ERP、高度和台站间距之间的约束关系。

1 台站间距与覆盖半径的关系

如图1所示,O1和O2是发射台站,发射参数均相同,台站间距为d,覆盖半径均为r。图中灰色部分是无法覆盖的“边缘区域”,阴影区域是2个发射台站覆盖的重叠区域,则2个圆围成的图形面积为理论有效覆盖面积,与两圆相切的矩形面积为理想条件期望到达的目标覆盖面积,则覆盖效率为两圆围成的面积与其相切矩形面积之比。

下面将分析覆盖效率最高时,单频网中相邻两个发射台站覆盖半径、台站间距之间的关系。

定义域有意义要保证。值域有意义要保证

如果令,其中x≥0.5。

如果令,其中0≤x≤2。

E覆盖效率与的函数曲线如图2所示。

当时,即两圆相切/重合时,E覆盖效率值最小,为0.785 4;当=0.93时,E覆盖效率值最大,为0.842 8;当=1时,E覆盖效率值为0.842 5;当>10时,E覆盖效率下降变化趋于缓慢,并趋于恒稳。综上所述,当两圆相切时,覆盖效率最小,为0.785 4;随着两圆圆心逐渐靠近,覆盖效率快速增大;当=0.93时,覆盖效率达到最大峰值,为0.842 8;随着两圆圆心继续靠近,覆盖效率开始迅速下降,当>10时,下降变化趋于缓慢,并逐渐趋于恒稳;当→∞时,趋于最小值,为0.785 4。

E覆盖效率与的函数曲线如图3所示。

当=0/2时,即两圆重合/相切时,E覆盖效率值最小,为0.785 4;当=1.07时,E覆盖效率值最大,为0.842 8;当=1时,E覆盖效率值为0.842 5。综上所述,当两圆相切/重合时,覆盖效率最小,为0.785 4;随着两圆圆心逐渐远离,覆盖效率逐渐增大;当=1.07时,覆盖效率达到最大峰值,为0.842 8;随着两圆圆心继续远离,覆盖效率又开始逐渐下降,直到两圆相切时,回到最小峰值。

因此,台站规划设计时,尽可能地将台站间距与覆盖半径之比设计为1.07时,覆盖效率可达到最大峰值;尽可能地设计台站间距是覆盖半径的2倍,以免覆盖效率达到最小值。

根据上述研究结果:以北京市区20频道播出的中国移动多媒体广播CMMB为研究对象,2个相邻发射台站的台站间距d拟选10.7 km,则覆盖效率达到最大峰值时,最佳覆盖半径r为10 km。

2 最小中值场强

以北京市区20频道播出的中国移动多媒体广播CMMB信号为研究对象,根据国际电联推荐的最低中值场强电压推导法[1]以及GY/T 220.7—2008标准中的终端指标参数[2],推导出其高速车载移动接收应用场景下的最小中值场强Emed为64.5 dBmV/m(33 dBmV/-78 dBm)。

3 电波传播模型

在单频网规划过程中,推出了很多电波传播模型,用于预测电波的传播情况。现有广泛适用的电波传播模型有ITU-R P.1546模型、ITU-R P.526模型和日本的Okumura-Hata传播模型[3]。ITU-R P.1546模型适用于开阔和低起伏的丘陵地区场强的预测;ITU-R P.526模型适用于山区场强的预测;Okumura-Hata传播模型适用于人口稠密的大城市地区,多被移动通信规划时采用。

同样,以北京市区20频道播出的中国移动多媒体广播CMMB信号为研究对象,根据北京市区的覆盖环境,本文选用Okumura-Hata模型中城市应用场景电波传播模型,采用Okumura-Hata模型预测的空间损耗L(dB)[3]如下:

式中:f(MHz)为工作频率,ht为发射天线有效高度,α(hr)为有效天线修正因子,α(hr)=3.2×(lg 11.75hr)2-4.97,hr为接收天线高度(hr=3 m);d(km)为发射天线和接收天线之间的水平距离;Ccell为小区类型校正因子(Ccell=0);Cterrain为地形校正因子(Cterrain=0)。

4 台站高度与有效辐射功率ERP的关系

在上面研究结果的基础上,下面接着以北京移动多媒体广播CMMB(20频道)为研究平台,研究城市环境下,2个相邻发射台站达到最高覆盖效率时,发射台站高度h(m)与有效辐射功率ERP的关系。

要满足覆盖半径为10 km处的最低中值场强为64.5 dBmV/m(33 d BmV/-78 d Bm)时,发射台站台站高度h(m)与有效辐射功率ERP的关系。

h取值0~500 m时与ERP(W)的关系如图4所示。

基于现实考虑,h取值10~300 m时与ERP(W)的关系如图5所示。

从图4、图5可知:

1)发射机有效辐射功率ERP(W)与台站高度h(m)成反比关系,发射台站高度h越高,需要的发射功率ERP越低;

2)随着高度的增加,所需的ERP变化趋于平稳。

h取值0~500 m时与ERP(h)函数斜率y的关系如图6所示。

有效辐射功率ERP与台站高度h的函数斜率,表征了随着高度h的增加,ERP随之降低快慢的关系。由此图可以看出:

1)斜率是负值,从负无穷大趋近于0,再次验证了要满足覆盖半径为10 km处的最低中值场强,随着高度的增加,所需发射功率越低的结论;

2)当发射台站高度高于250 m时,所需的ERP变化趋于平稳,增大很小的发射功率,即可满足覆盖需求;

3)当发射台站高度低于100 m时,随着高度的增加,所需的ERP快速降低,所需的ERP变化比较快,增大很小的高度,就可让所需的发射功率快速降低下来。

5 结论

本文以中国移动多媒体广播CMMB技术体制作为研究平台,以北京市播出的中国移动多媒体广播CMMB为研究对象,通过理论分析、推导研究获知:

1)单频网中相邻2个发射台站覆盖半径与台站间距之间的相互关系如下:

当2个发射台站覆盖范围相切/重合时,覆盖效率最小,为0.785 4;随着2个发射台站的台站间距逐渐增大,覆盖效率逐渐增大;当台站间距d与覆盖半径r之比为1.07时,覆盖效率达到最大峰值0.842 8;随着2个发射台站的台站间距d继续增大,覆盖效率又开始逐渐下降,直到2个发射台站覆盖范围相切时,回到最小峰值。

因此,台站规划设计时,尽可能地将台站间距d与覆盖半径r之比设计为1.07时,覆盖效率可达到最大峰值;尽可能地避免台站间距是覆盖半径的2倍,以免覆盖效率达到最小值。

2)单频网中相邻2个发射台站覆盖效率最高时,发射台站有效辐射功率与发射台站高度之间的相互关系为:

(1)单频网中2个发射台站在最高覆盖效率的情况下,发射台站高度越高,所需的有效辐射功率越低。

(2)当拟建的发射台站高度低于100 m时,对所需的有效辐射功率较为敏感,随着高度的增加,所需的有效辐射功率快速降低,也即选址时100 m以下的发射台站选址设计,增大很小的发射台站高度,就可以节省很大的发射功率;换个角度讲,同一发射功率,较小的高度变化即对覆盖效果产生较大的影响,不容忽视。因此,100 m以下的发射台站寻址,尽可能地选择高度较高的发射台站。

(3)当发射台站高于250 m时,所需的ERP变化趋于平稳,随着高度的增加,增大很小的发射功率即可满足覆盖需求;即同一高度下,较小的发射功率变化对覆盖效果影响很大,不容忽视;换个角度讲,当发射台站高度高于250 m时,继续增加发射台站高度已不能明显地节省发射功率。因此,发射台站设计时,不要一味地追求发射台站的高度。

6 小结

本文通过研究单频网中2个相邻发射台站覆盖半径与台站间距的相互约束关系,并在此基础上,研究了覆盖效率最高时发射台站高度与有效辐射功率之间量化函数关系,为发射台站的选址设计、高度设计提供理论依据和借鉴指导。

参考文献

[1]夏治平,孟祥昆.移动多媒体广播(CMMB)——覆盖计算中的最低中值场强推导[J].广播电视信息,2008(8):75-77.

[2]GY/T220.7—2008,移动多媒体广播第7部分:接收解码终端技术要求[S].2008.

关系约束 篇5

与软件开发的需求分析类似,信息安全产品或系统特别需要进行安全需求的定义。安全需求是进行安全产品的设计、开发和评估等过程的重要依据。保护轮廓PP(Protection Profile)就是对一类安全产品进行安全需求标准化定义的文档。保护轮廓是指满足特定用户需求、与一类TOE(Target of Evaluation,评估对象,即作为评估主体的信息安全产品及其相关的指南文档)实现无关的一组安全需求[1,2,3]。这些安全需求来源于CC(Common Criteria,通用评估标准)[1,3],是安全产品设计、开发和评估的依据。目前,多种类型安全产品的保护轮廓[4,5]已研制出来,并得到了测评机构的认证,成为实际可引用的保护轮廓。但是,由于大多由专家凭经验研制,使得保护轮廓的开发成为一项复杂而模糊的工作,保护轮廓的生成具有很大的随意性。对保护轮廓的评估也缺乏明确的标准,降低了保护轮廓的使用价值。因此,研究保护轮廓的开发方法是很有意义的。

1相关工作

目前国内外关于PP开发的研究工作主要可以划分为指南型、工程型、指导与强制型等三种类型。

指南型开发技术主要可见ISO/IEC所发布的《Guide for the Production of Protection Profiles and Security Targets》[2]。这是PP开发的基本依据,是在对CC进行透彻分析的基础上,和对一个阶段以来PP开发工作的总结基础上,给出的PP开发所需要遵循的原则和步骤指导。工程型开发技术的代表性工作是由美国Arca System公司的Jeffrey R.等人提出的将SSE-CMM(系统安全工程-能力成熟度模型)应用到PP的开发过程[11,12],从而有助于在预算许可范围内开发出高质量的PP,其主要贡献在于对PP开发过程的控制。指导与强制型开发技术的代表工作是隶属于美国NIST和NSA的PPRB(PP审阅组,PP Review Board)所开发的基于基本安全环境和中级安全环境下的PP开发一致性指导手册[9,10]。两个手册的主要内容如下:1)规定了在相应安全等级环境下PP必须强制性包含的安全保证组件;2)提供了在相应安全等级环境下PP应该包含的最起码的安全功能组件;3)提供了开发PP和跟踪PP开发过程所需的方法,即跟踪表格,同时也提供了这些表格模板。

指南型开发技术对PP基本概念分析透彻,给出了PP各部分的基本要求和基本联系,可以指导开发较为通用的PP。工程型开发技术使用工程方法对PP开发过程进行很好的控制,但是这是偏重于进度和成本控制的。指导与强制型开发技术的优点是对于符合美国政府认可的PP的开发有章可循。三种方法都是手工进行PP开发的。在本文中,我们提出了一个基于逻辑关系和约束的PP生成模型。与上述方法相比,其优点是可以做到PP的半自动化生成,开发的PP比较通用,对PP开发人员的要求也相对较低。

2PP构成与约束

2.1PP结构

PP具有较为规范的概念和结构[1,2,3]。一个完整的PP包含引言、安全环境、安全目的、安全需求和基本原理等部分,其核心部分是安全需求。CC定义了一个安全需求的集合,包括安全功能需求和安全保证需求。这些需求以“类—子类—组件—元素”的层次组织,组件为选取安全需求的最小单位。从原始的TOE基本安全要求很难直接定义出完整的安全需求,此时,安全环境和安全目的就作为原始的TOE安全要求同安全需求之间的桥梁而定义。因此,PP生成方法主要围绕这三部分进行研究。

2.2PP的约束条件

(1) PP的基本要求

一个合格的PP应该是完备的、一致的、技术合理的。技术合理针对具体的TOE及其环境考虑。对于PP生成方法来说,要使PP符合完备性和一致性两个原则:

原则1:完备性原则。PP的完备性要求其中所定义的安全需求能够解决TOE所有的安全问题,即安全需求是充分的,同时所定义的安全需求都可以追溯到至少一个TOE的安全问题,即安全需求是必要的。

原则2:一致性原则。PP的安全需求满足所有组件依赖关系,同时在内容上没有重复。

(2) 组件之间的关系

组件之间存在两种关系:依赖关系和从属关系。

依赖关系:当一个组件本身不够充分而需要依赖于其他组件的功能,或依赖于与其它组件的交互才能正确发挥其功能时,就产生了组件之间的依赖关系[1,2,3]。CC给出了每个组件的依赖关系,根据一致性原则,PP中的安全需求必须满足组件之间的依赖关系。

从属关系:在同一子类内,如果一个组件相对另一个组件提供更多的安全,那么该组件相对另一个组件来说是有层次的[1,2,3],层次关系就是从属关系,即前者从属于后者,前者层次较高。从属关系专门指同一子类的不同组件之间的层次关系。由于从属的组件之间存在功能或内容的重复,因此根据一致性原则,必须排除从属的组件。

(3) 评估保证级要求

CC对安全保证需求定义了7个评估保证级(EAL),规定每个PP都必须包含一个EAL,用以表明所定义的安全功能需求可达到的可信度级别。每个EAL级都定义了一定安全需求的集合,PP开发者将根据安全等级等因素选择一个合适的级别,在需要的情况下也可包含进额外的需求,形成该EAL级的增强。CC没有定义安全功能需求的安全等级,因此功能需求的选择同保证需求相比,具有更多需要考虑和研究的因素。

3PP生成原理分析

PP的生成过程是各组成部分的定义过程。各部分之间不是独立的,有着复杂的联系,这些关系形成了基本原理部分。因此,PP的生成应围绕各部分之间的关系来展开。

3.1PP生成过程和方法

各部分之间的关系用图1来描述。

PP的核心生成过程主要有三步:

第一,定义描述TOE安全环境的,对资产的威胁的集合、组织安全策略集合以及有关环境的假设的集合。

第二,根据步骤1中建立的集合,定义出TOE安全目的集合和环境安全目的集合。

第三,定义IT安全需求集合。(1)从CC的安全功能要求中选择合适的安全组件并进行适当的操作,构成安全功能集合;(2)从CC的安全保证要求中选择合适的安全组件并进行适当的操作,构成安全保证集合。这两个集合中的元素,应该能够支持第二步中定义的安全目的集合中的每一个安全目的元素,从而解决第一步中定义的每一个安全问题。

为满足PP的完备性和一致性原则,安全需求的选择将分两步进行:首先根据安全目的到安全需求的映射关系对每个安全目的从CC中选择能满足该目的的安全需求;然后对选择进来的需求,基于依赖关系和从属关系进行穷举处理。

3.2其他需要考虑的条件

在进行安全需求组件的选取过程中,需要注意以下方面:

(1) PP的种类 PP所适用的TOE的类型反映TOE主要的安全功能和用途。如操作系统、防火墙、数据库管理系统、入侵检测系统和公钥基础设施等。考察CC中的11个安全功能组件类,并非所有的TOE都需要全部安全功能。不同类型的TOE在安全功能上各有侧重,在同一安全功能的强度要求上也有所不同。

(2) PP的安全等级要求 安全等级的划分有利于设计和开发出所需要的安全系统,同时有利于评估工作的开展。CC规定每个PP必须对安全保证需求定义一个EAL级,但对安全功能需求的安全级别定义没有强制规定。尽管如此,通常情况下每个PP都会潜在地确定一个安全等级,用以表明该PP所适用环境中的潜在威胁等级和PP所提供安全功能的强度级别,这样会给组件的选取带来极大的方便。

4PP生成模型

4.1模型描述

根据上面对PP生成原理的分析,可以给出一个PP生成模型,如图2所示。其中预定义PP数据库里存储的是根据CC要求和对目前已通过认证的PP的分析归纳,根据PP的种类的安全强度要求,总结出的PP中各组成部分的映射关系,而总控制模块通过同各工作模块进行交互来控制整个模型的工作流程。

具体步骤如下:

(1) 通过选择PP的种类和安全等级,自动生成一个原始的PP,此PP包括多个子数据库:安全环境总集包括威胁集、组织安全策略集、假设集;安全目的总集包括TOE安全目的集、环境安全目的集;安全需求总集包括安全功能需求集、安全保证需求集。这个原始PP的各子数据库集之间有明确的映射关系,其元素的选取原则和映射关系都是预先存储在预定义数据库中的。

(2) 根据对原始的TOE及其环境的安全特点、要求等进行分析,使用环境定义模块对预定义的安全环境总集进行相应的修改,可以添加、删除或修改威胁、组织安全策略和假设。

(3) 根据步骤(2)中的修改,对于添加的安全环境元素,如果在预定义数据库中已经有其到安全目的元素的映射,则通过安全目的定义模块将相应的安全目的元素添加进来;如果预定义数据库中预先没有此安全环境元素,或者这个安全环境元素是经过了修改的,则通过安全目的定义模块定义支持此安全环境元素的安全目的,并存入PP对应的数据库中。

(4) 根据步骤(3)中的修改,对于添加的安全目的元素,或者经过修改的安全目的元素,如果在预定义数据库中有其到安全组件的映射关系,则通过此映射关系将应该选择而没有选择的组件添加进来;如果在预定义数据库中没有相应的映射关系,则选择相应的安全组件来满足此安全目的。

(5) 使用一个实现组件间从属关系和依赖关系的自动算法,对前几步得到的PP核心部分进行处理,以实现组件之间的一致性。

(6) 根据需要,可以多次执行步骤(2)至(5),以使生成中的PP核心部分达到一个稳定的状态,此时,这个PP的核心部分应该是完备的、一致的。

(7) 从数据库中自动生成此PP的基本原理。

4.2模型的分析讨论

(1) 基于统计分析

通过分析研究各类通过评估的PP[4,5]发现,在绝大多数情况下,对于某一类PP而言,其安全环境集合中的元素是可以穷举的,相应的,安全目的集合也是可以穷举的;所以,完全可以通过分析和吸取已获得评估和广泛使用的PP的内容,来创建安全环境元素集合以及安全目的元素集合,并且建立安全环境元素和安全目的元素之间经过广泛承认和论证的关系,从而使得对于某一安全等级的某类PP,其基本的安全环境集合、安全目的集合以及它们之间的关系可以自动建立。

(2) 基于PP的生成原理分析

根据PP的生成原理,可以通过对当前PP中安全环境元素、安全目的元素和安全需求元素之间的映射关系,来自动检查出当前PP中不一致的地方,并在一定程度上可以进行自动纠正;此外,对于选取的安全组件,可以根据组件之间的从属关系,自动消除多余的组件,根据组件之间的依赖关系,自动将需要而未被选取的组件选择进来。因为自动化处理步骤是根据CC的要求进行的,所以生成的PP符合完备、一致和技术合理的要求,因此,基本原理也是可以自动生成的。

(3) 自动化程度分析

在这个模型中,生成一个PP的大部分工作都可以自动地进行,不过仍然有不少工作需要手工完成,其中最主要的就是对选取的组件可能进行的细化、选择、赋值和重复操作。对于满足同一安全等级的不同PP,其选取的组件可能大部分是相同的,但是根据TOE的特性和环境的要求,对同一个组件却可能采取不同的操作,这需要进一步的研究。

4.3组件处理的自动化

(1) 数据结构

每个组件具有唯一的标识即组件名,可将其作为组件在数据库中的存储形式。将CC中的组件依赖关系结合每个组件从属关系表中所示的从属关系存储进数据库,数据库结构为:

其中源组件项按CC中的顺序保存所有功能组件和保证组件名;包含标志位用不同的符号标识该组件“已包含”或“未包含”进PP,初始化时复制CC组件数据库为临时工作数据库,将此临时数据库中已被PP选择的主要组件的包含标志位置为“已包含”;而依赖组件项保存相应源组件直接依赖的组件名;可选标志位用不同的数值标识该依赖关系是可选依赖还是必选依赖,且具有并列关系的同组可选依赖组件具有相同的数值,非同组的可选依赖组件具有不同的数值;从属组件项保存直接从属于源组件的组件名。每个项中只包含一个组件,如果一个源组件依赖或从属于多个组件,则将其拆分。

(2) 算法描述

当上述临时数据库生成完毕,就可以使用自动化组件处理算法来对临时数据库进行处理,这主要分成两个部分,分别使PP中的组件满足对依赖关系和从属关系的要求,如图3和图4所示。最后,根据处理完毕的临时数据库,再生成相应的PP数据库。

(3) 关于组件依赖和从属关系的处理

组件的依赖关系在CC中有明确的要求,对于直接依赖的情况,我们的算法可以按照CC的要求直接处理,而对于可选依赖,当面临任选一个待选组件时,究竟选哪一个更好,仍然需要进一步研究。对于组件的从属关系,其实现也非常简单,可直接排除不需要的从属组件。以上仅考虑直接依赖和直接从属于的组件关系。对于一个组件依赖多个组件以及从属于多个组件时,其拆分规则是:如果存在1对n的关系,则简单地将1对n的关系转化为n个1对1的关系,并且根据CC的规定,这种转化是正确的。

4.4PP生成模型的应用

我们把PP生成模型用于生成符合GB17859[6]要求的操作系统的PP,可以完成很大一部分核心工作。GB17859和相关《技术要求》[7,8]对于安全功能要求和安全保证要求都按5级进行了划分,每一级都对计算机信息系统的安全功能和安全保证要求进行了完整的描述。应用以上模型,我们生成了一个多级操作系统的PP,并进行了组件依赖性包含的验证。该PP的安全等级定义为我国计算机信息系统安全保护等级划分准则中的第三级(安全标记保护级)以上。通过对该保护等级的研究,相应的评估保证级定义为EAL4+级。

5结论

本文提出的PP生成模型可提高PP开发的效率和质量,并为自动化生成打下基础。其本质上是根据CC的要求,从目前大量经过评估和验证的PP中提取针对各种应用产品和环境要求的PP模板,以这些模板作为符合基本要求的基础PP,用户可以作进一步的完善和改进,以适应应用需求。虽然安全组件在CC中进行了标准化定义,文中安全环境和安全目的却是主要根据统计分析结果而得到的。安全环境和安全目的没有统一的标准,影响着PP的自动生成。今后将力求在安全环境和安全目的的规范化方面有所突破,促进PP生成的自动化。

摘要:提出一个基于逻辑关系和约束的保护轮廓生成模型。通过分析保护轮廓的组成结构、生成原理,总结了保护轮廓的内在逻辑关系和约束条件,给出了保护轮廓生成过程和相关自动化处理算法。最后,讨论了生成模型在安全保护等级划分准则要求下的应用。

关键词:保护轮廓,逻辑关系,约束,通用评估准则,GB17859

参考文献

[1]ISO/IEC 15408:1999(E).The International Organization for Stand-ardization.Common Criteria for Information Technology security Evalu-ation.

[2]Information Technology-Security Techniques-Guide for the Productionof Protection Profiles and Security Targets.ISO/IEC TR 15446,2003.

[3]GB/T 18336-2001.信息技术,安全技术,信息技术安全性评估准则.

[4]COTS Security Protection Profile-Operating Systems,v1.0.US Depart-ment of Commerce,Technology Administration and National Institutesof Standards and Technology,2003.

[5]Validated Protection Profile.http://niap.nist.gov/cc-scheme/pp/in-dex.html.

[6]GB/T17859-1999.计算机信息系统安全保护等级划分准则.

[7]GA/T390-2002.计算机信息系统安全等级保护通用技术要求.

[8]GA/T 388-2002.计算机信息系统安全等级保护操作系统技术要求.

[9]Consistency Instruction Manual for Development of US Government Pro-tection Profiles for Use in Basic Robustness Environments,v3.0.Na-tional Security Agency and the National Institutes of Standards andTechnology,2005.

[10]Consistency Instruction Manual for Development of US Government Pro-tection Profiles for Use in Medium Robustness Environments,v3.0.Na-tional Security Agency and the National Institutes of Standards andTechnology,2005.

[11]Jeffrey R Williams,Karen M Ferraiolo.Protection Profile Process Im-provement.Arca Systems,1999.

关系约束 篇6

中文信息处理是计算语言学的一个重要分支,它在我国的信息化建设中起着越来越重要的作用,其信息处理的能力直接关系到它在网络社会和网络经济中的国际竞争能力。

现在人们一般把中文信息处理的进程分为三个大阶段: 字处理、词处理和句与篇章处理。目前,我国在字、词处理方面已经取得了突破性进展,汉字识别技术、语音识别与合成技术、汉字字形技术、现代汉语自动分词和词性标注技术等,各项研究成果都已投入实际应用。中文信息处理正在向句与篇章的处理阶段艰难迈进。这一阶段的主要目标是“怎么让计算机处理、理解自然语言中一个句子和篇章的意义,怎么让计算机生成一个符合自然语言规则的句子和篇章”( 许嘉璐,2000) 。国内外很多高等院校和科研机构都在努力攻克句处理的难关,例如哈工大信息检索研究所运用中心词驱动的短语结构语法( HPSG) 、功能合一文法( FUG) 、词汇功能文法( LFG) 、依存语法及配价语法设计各种句法分析器,就句法和语义自动分析的诸多问题进行深入研究,力求把这些知识转换成计算机可读的形式语言。

复句是复杂的句子,是汉语语法的重要实体单位,它表达的语义信息丰富而复杂,在信息处理领域具有很多值得研究的内容。关系词( 又称关系标记、关联词) 在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要课题( 邢福义,2001) 。但是,复句关系词的计算机自动识别是一个难题: 一方面,关系词构成形态灵活,可以是副词、连词、助词、超词形式;另一方面,一个词有时充当关系词,有时又不充当关系词( 吕叔湘2004) 。例如:

( 1) 不管是刮风下雨,还是下雪结冰,他都不改自定的时间表,提前半小时赶到工地。

( 2) 不管李登辉如何改变身份,谁都知道他是政界人物。

例( 1) 中的“是”是关系词,它引导的分句与“还是”引导的分句构成并列句式; 而例( 2) 中的“是”仅仅作为句子成分,不是关系词。

另一方面,关系词的语法语义类别多样,概括起来主要有同形异类、同形异构和同形异义等三类,这种多样性造成歧义现象复杂。例如关系词“也”,它既可以和“即使”搭配,充当假设关系词; 也可以和“虽然”搭配,充当让步关系词; 还可以和“也”搭配,充当并列关系词; 和“不仅仅”搭配,充当递进关系词。再如,句式“不是不A,就是B”有两种结构,一种是“不是”与“就是”搭配,分句形成选择关系,如“不是不理睬,就是哼一声”; 另一种是“不是”与“就是”搭配,分句间没有直接的逻辑关系,如“她不是不知道累,她就是愿意多干一会儿”。

这些给计算机自动识别关系词带来很大困难,计算机不但需要一定的技巧来处理超词形式的关系词,而且还需要克服分词及词性标注的不准确性带来的误差。

从中文信息处理的角度全面考察语料库中关系词的用法,系统地总结和揭示关系词多样性的意义因素,探索复句关系词自动识别的理论、方法和实现措施,具有十分重要的意义。

( 1) 有助于促进机器翻译的研究。对复句而言,关系词形成的复句格式对复句语义起着制约的作用。因此,在机器翻译的过程中,准确把握关系词的意义和用法,掌握关系词搭配构成的格式的逻辑意义,是保证翻译准确性的一个重要条件。如果关系词的类型判断有误,句子的翻译就会与句子的原意相差甚远。比如,“不是/就是”是一个常见的关系词对,当它们表示选择关系时,可以翻译成“either…or”,如“这次旅行,不是去桂林,就是去云南”,对应的译文为“This journey we either go to guilin or to yunnan”; 当“不是”取否定义时,则应翻译成“not…but”,如“不是我不想买,就是太贵了”,可以翻译成“It’s not I don’t want to buy,but it is tooexpensive”。不过这只是字面上的翻译,如果计算机正确掌握了“不是不A,就是B”在取否定义时的等价格式“不A,是因为B”,那么译文就会让人更好理解,如上例可以翻译成“I don’twant to buy,because it is too expensive”。

( 2) 有助于推进中文信息处理向句与篇章处理阶段发展。从中文信息处理的角度,研究复句关系词自动识别,不仅能够为复句层次结构的计算机自动识别提供基础,而且能够为计算机处理复句的逻辑语义奠定基础,为进一步研究计算机自动识别复句,直至识别汉语句子和篇章奠定理论与实践的基础,为计算机处理自然语言服务。

关系词是复句中标示关系的一个重要构件,它在很大程度上影响着分句的语义,也影响着复句层次关系的识别。例如关系词的句法语义信息虽然能够标示分句间的句法关联和语义关系,但关系词搭配形式本身却不能确定分句间结合成不同结构层次的先后顺序。例如:

( 3) 这次试验虽然成功和失败都有可能,但是由于无论是成功还是失败,都会产生不小影响,因此要及早制定对策。

例( 3) 有4个分句和6个复句关系词,每个分句都有关系词,其中第二分句出现3个关系词。即使计算机掌握了关系词的搭配关系,知道“虽然”与“但是”搭配,“由于”与“因此”搭配,“无论”与“都”搭配,但这些关系词的搭配关系如何构成复句的层次结构,就需要研究关系词不同隐现形式对复句层次关系识别的影响,揭示关系词的句法特征与分句间的层次组配顺序的制约关系,从而针对关系词不同隐现形式和分句层次组合顺序,采用“分而治之”的处理策略,为最终解决复句层次关系的自动识别提供方法。

二研究基础

复句和复句关系词历来是语言学家研究的热点问题,学术界对复句和复句关系词的研究成果很多,代表性著作有邢福义的《复句与关系词语》《汉语复句研究》《汉语的复句系统和复句句式》等,范开泰的《关联词语》,林杏光的《复句与表达》,王维贤的《现代汉语复句新解》,陈中干的《现代汉语复句研究》,郭志良的《现代汉语转折词语研究》,马清华的《关联成分的语法化方式》,马明艳的《“要不是”句式的三维考察》,周有斌的《“不是A,就是B”句表述对象的数量及作用》,李敏的《“十五”以来汉语复句研究的新进展》,储泽祥的《汉语因果复句的关联标记模式与“联系项居中原则”》,宗守云的《“倒是”转折句的语义模式》,等等。

关于复句和复句关系词的信息处理的研究,主要集中在最近十多年,而且已经成为语言学家和信息学家所共同关注和研究的热点内容。鲁松、宋柔( 2001) 从机器翻译的角度,研究判定汉语描述型复句分句间的内在联系的形式化处理方法,给出了完整的关系判定规则,并提出采用中心分句动态判定方法来解决部分复句处理规则局部性的问题; 鲁松、白硕( 2001) 以复句的层次关系研究为对象,将多重复句的层次结构形式化为层次关系树,并采用上下文无关文法表示多重复句,提出一种基于具有预测机制、自底向上、部分数据驱动的确定性移出—规约算法来处理多重复句的层次关系。高维君( 2000) 将机器学习应用于汉语复句关系词的歧义辨别,提高了汉语复句关系词语识别的正确率。李晋霞、刘云( 2003) 在复句本体研究成果的基础上,探讨了二重复句的自动分析; 洪鹿平、张霄军( 2008) 通过确定逗号的功能来判断复句的切分点,将复句转化为分句的有序集,在此基础上,采用条件随机场( CRF) 来判定分句间的语义关系。还有邹嘉彦( 1998) 使用机械匹配的方法来确定关系词语和复句关系,并进行语料篇章关系词的标注。

尹蔚、罗进军( 2007) 以“是p,还是q”有标选择复句中关系标记的识别为例,总结出制约有标复句合用型关系词的自动识别的四条规律: 语序制约律、相互制约律、句法空间制约律、亲密度制约律。罗进军( 2008) 又根据关系标记与句法语义环境的关系,将关系标记分为强式关系标记和弱式关系标记,并讨论了关系词的识别流程。

以上研究均为本文从应用角度研究复句关系词的自动识别提供了坚实的语言学基础和丰富的语料素材。但是从中文信息处理角度分析,这些研究还存在一些不足:

( 1) 从考察范围来看,重视个案研究,忽略了系统研究。由于语料库中语料的数量巨大,且关系词在语言现象中灵活多样,从个人精力的角度来讲,个案研究当然是很多学者选择的出发点。但是,要想实现计算机对自然语言的处理,系统而全面的研究则是必需的。比如,很多研究都涉及关系词的歧义问题,但没有研究给出每一种关系词的所有可能的歧义现象。

( 2) 从研究方法来看,重描写,轻解释。其一,很多研究中讨论了关系词的连用现象。比如,表转折和让步的连用( “然而 + 即便”———然而即便如此,这种“结义”的神圣光环亦未能完全掩饰其本身固有的阴影) ,表转折和转折的连用( “然而 + 却”———其情节极其简单,然而/却耐人咀嚼) 。但是,F( 然而 + 却) 与F( 然而) + F( 却) 的关系如何,却没有明确的说明和解释。其二,扩展现象,如“无论是谁,无论他做了多大的贡献,都不能徇私枉法,都不能把个人利益置于国家利益之上”中的“无论……无论……都……都……”是搭配“无论……都……”的双向扩展,那么,搭配的关系词可以如何扩展,不能如何扩展,则没有解释说明。而这些知识恰恰是计算机处理自然语言所需要的。

( 3) 从可操作性来看,很多研究都是从理论上进行的定性研究,是从人的角度出发总结出来的一些规则、规律,而有些规律带有一定的模糊性,计算机操作起来很困难,因为计算机需要的是实际可行的定量知识。

20世纪70年代以来,国际上以乔姆斯基为代表的新一代语言学派的生成语法理论,以及以生成语法理论为基础的孟德鸠语法、广义的词组结构语法、词汇—功能语法、关系语法等为西语系的理解与翻译提供了规则化、形式化的理论。美国学者W. C. Mann和S. A. Thompson于20世纪80年代初创立了篇章生成和分析的理论———修辞结构理论( Rhetorical StructureTheory,简称RST理论) ,该理论从小句之间的关系入手,小句之间的关系组成高一层次,然后再由更大的语言单位之间的语义关系组成篇章。RST理论用关系形式描写语篇不同层级的修辞结构,是一套比较完整和成熟的理论体系,是篇章理解的重要理论。Pollard与Sag于1987年提出的中心词驱动短语结构文法( head-driven phrase struture grammar,简称HPSG) 关注的是具体的、表层的结构,它包含表层对象、基于约束和词汇主义等三方面内容,它不像生成语法那样存在多层句法结构,而只有单一的句法结构,所以HPSG的整个架构是建立在约束机制上,语法规则、语法原则和词项描述都是通过约束来实现的。

90年代,美国宾夕法尼亚大学研制了宾州树库( Penn Tree Bank) ,在此基础上扩展成宾州标注树库( penn discourse treebank) 。它采用框架分析的思想,增加功能标记,突出中心依存关系,标注句子中主要句法成分的语法功能,其中有大量人工总结的匹配规则; 可以提取有用的句法、语义信息和更丰富的规则机制,标注了关联词及其论元( 谓词) 。

汉语复句关系词是复句中用来联结分句、表明关系的词语,从逻辑语义的角度分析,复句关系词具有三个特点: 一是在词类系统中,复句关系词不属于特定的类; 二是在语法单位中,复句关系词不处于固定的级; 三是在造句功能上,复句关系词不具有划一性,有的只表明复句关系而不作句子成分,有的既表明复句关系,同时又兼作某个句子成分。

正是因为复句关系词的这三个特点,使得计算机在处理复句关系词时需要综合考虑句法、语义、语境以及逻辑关系等多种因素。由于汉语的特殊性,特别是汉语复句关系词的特殊性,使得国外的生成语法理论,以及在生成语法理论为基础的孟德鸠语法、广义的词组结构语法、词汇—功能语法、关系语法等一系列的西文研究理论和研究方法,不能简单地直接应用到汉语复句关系词的自动识别的研究中。

目前,基于规则的应用技术已经广泛应用到包括中文信息处理、金融、管理等各个研究领域和社会的各行各业。虽然国内外基于规则的应用已经取得了丰硕的成果,但将规则应用于复句关系词自动识别的研究与应用现在却仍是空白。因此,从计算机处理自然语言的角度来研究关系词的句法语义特征及其统计特征,从定性分析过渡到定量分析,使得总结的规律、规则具有可操作性,是本文研究的核心问题。

三规则的约束类型

在研究计算机自动识别现代汉语复句关系词的过程中发现: 一方面,复句关系词自动识别过程中,很多问题都可以通过规则来解决; 另一方面,根据复句关系词的各种特征及其约束条件制定一系列的相应规则,将其组织成规则库,用来保存和管理各种规则,并将其作为系统知识库的一个重要组成部分,以提高复句关系词自动识别系统的可行性和有效性。

基于已构建的汉语复句语料库和复句关系词本体知识库,挖掘出关系标记在复句中充当关系词的特征规律,再将特征规律整理为规则,据此建立相应的关系标记规则库,是研究关系词计算机自动识别方法和策略的关键。在研究中发现,在各个关系词对的规则的约束条件中,既有共同的约束特征,也有各自独特的约束特征,即影响关系标记识别的因素很多,使得识别过程需要综合形式语法、事理逻辑、句法语义的复杂计算。而在语料中发现,当关系标记位置相邻时,可直接标识或简化其识别过程。例如:

( 4) “电热褥”不仅能驱寒解乏,消除潮气,而且还是理想的家用医疗器具。

( 5) 弗兰克斯认为,布什“有领袖的天分”,而且还是一位平易近人的领导人。

( 6) 只要到北戴河他就要下水,而且还是浪越大越往浪里面钻。

以上例句中都有连用关系标记1“而且还是”,当“而且”“还是”位置相邻时,大部分如例( 4) 句式“不仅/不但( 是) ……,而且还是……”。在这种句式下,“而且”为关系词且为递进关系,“还是”不做关系词,但“还”为关系词。也有一部分如例( 5) ( 6) ,“而且”单独出现,前面没有与之搭配的前呼标记2,这种情况下,“还是”表现出两种功能: 一是如例( 5) ,既表递进,又兼句法成分; 二是如例( 6) ,只表递进。分析研究发现,当“而且”“还是”之类的关系标记对紧邻出现时,可以根据一定的约束条件判断其是否为真正的关系词。

在整理各个标记对的规则时发现,所有规则的约束条件都表现出不同的特征,有的与句法相关,有的与字形相关,有的与位置相关。通过归纳,我们总结出12种约束类型:

1) 字面约束

字面约束是指在字形、字面特征上的约束,主要出现在判断关系标记后面是否出现书面停顿符号、某个符号是否为指定的符号、关系标记A与关系标记B是否紧邻共现等情形。例如:在标记对“虽说……可是……”的约束条件中,条件“‘可是’紧跟‘那’‘这’后”属于字面约束,在规则库中表示为“这/那 > 可是”; 约束条件“End( clause( 其次) ) ! =‘其次’”也属于字面约束,表示标记“其次”所在分句的最后一个词语不等于字符串“其次”。

2) 分句位置约束

分句位置约束是指关系词所在的分句是否紧邻,或者分句的索引号之差是否满足一定的值。它反映的是复句语流中分句之间的位置特征。分句位置约束用函数D( ) 来描述。例如:对标记序列“首先……其次……最后”,分句位置类型的约束条件“D( C1,C2) = 1∧D( C2,C3)= 1”表示索引号为C1的分句与索引号为C2的分句的距离为1 ( 即紧邻) ,索引号为C2的分句与索引号为C3的分句的距离为1,概括地讲,就是标记“首先”“其次”“最后”所在的三个分句紧邻。

3) 关系标记位置约束

关系标记位置约束是描述关系标记是否处于同一分句的约束。对于搭配的关系标记对,若它们处于同一分句,则属于紧缩句,系统将不进行处理。关系标 记位置约束用函数same Clause( ) 来描述。例如,对标记序列“不仅……而且…… 也…… ( 更) 何况”,有一条规则为:

same Clause( “而且”,“也”) ∧D( “也”,“( 更) 何况”) > 3→R( 不仅) = true∧R( 而且) =true∧R( 也) = true∧R( ( 更) 何况) = true

其中,same Clause( “而且”,“也”) 表示标记“而且”与“也”处于同一分句。

4) 标记类型约束

标记类型约束主要考察两个关系标记是否具有相同的逻辑语义类型。这类约束主要出现在判断是否有包孕结构的情形。例如,在考察“不仅……还……”时,有一个约束条件“X,Y之间不包含不同类型的前关系标记”,其表达式为:

该式中same Type的解释为,其中HSi是一个同类标记集。这里,概念“同类标记集”与“标记群”既有联系,又有区别。“标记群”是由具有相同的语义类别的关系词搭配对形成的集合,而“同类标记集”是指由具有相同语义类别的关系词形成的集合。对于标记序列“不是……而是……”,在标记群中它是一个元素〈不是,而是〉,而在同类标记集中它是两个元素〈不是〉,〈而是〉。

5) 句法约束

句法约束是指约束条件与句法结构相联系。它主要出现在判断某些关系标记后面是否有某些特殊的句法结构的情形。例如: 在考察“只要……就……”时,有一个约束条件“只要 >mp”,表示关系标记“只要”后紧接数量名词短语。

6) 极性约束

极性约束主要考察分句之间的极性特征。例如在考察标记序列“只要……就……而……”时,其规则为:

其中,约束条件“P( 就,而) = - 1”表示“就”所在的分句与“而”关涉的分句的极性相反。

7) 词性约束

词性约束是指在分词准确的情况下,某个词的词性是否为特定的词性。如在考察“只要……就……”时,有一个约束条件为: Pos( 就) =‘p’,表示“就”在分句中为介词。

8) 分句数目约束

该约束主要考察复句中分句的数量是否满足特定约束。该约束用函数Num( ) 来描述。如在考察“也……( 更) 何况”时,其规则为:

其中,Num( MYM) = 2表示当前考察的复句的分句数应该为2。

9) 语义约束

语义约束是指在语义层面的约束,在复句分析中,主要表现为分句之间的语义关联度的约束。如在考察“不仅……甚至……而且”时,其规则为:

Num( MYM) > 3 + ~ same Clause( “不仅”,“甚至”) ∧ ~ same Clause( “甚至”,“而且”) ∧D( “不仅”,“甚至”) > 1 + SR( 不仅,甚至) < SR( 甚至 - 1,甚至) →R( 不仅) = true∧R( 甚至)= true∧R( 而且) = true

其中,约束条件SR( 不仅,甚至) < SR( 甚至 - 1,甚至) 属于语义约束。SR( ) 是表示语义关联度的函数,SR( 甚至 - 1,甚至) 中,“甚至 - 1”表示“甚至”所在分句的前一分句,SR( 甚至- 1,甚至) 表示“甚至”所在分句与前一分句之间的语义关联度。

10) 句式约束

句式约束是指分句之间在句式特征上的约束。如在考察“不仅……而且……只要……就……甚至”时,其规则为:

D( C1,C2) = 1∧D( C2,C3 ) = 1∧D( C3,C4 ) = 1∧D( C4,C5 ) = 1 + S ( Intro( “就”) ) = S( Intro( “甚至”) ) →R( 不仅) = true∧R( 而且) = true∧R( 只要) = true∧R( 就) = true∧R( 甚至) = true∧( ( C1,C2) ,( C3,( C4,C5) ) )

其中,S( Intro( “就”) ) = S( Intro( “甚至”) ) 是一个句式约束,表示“就”与“甚至”引导的成分的句式特征相同。

11) 关系标记的隐现约束

关系标记的隐现约束是指某些关系标记的出现制约其他关系标记的出现。

在规则库的设计中,采用了两个函数用来描述关系标记的隐现约束特征,分别为Without( ) 和exclude( ) 。Without( A,B) 表示关系标记A与B之间没有其他的关系标记,exclude( A)表示在A所在的分句中,除了关系标记A以外,分句内无其他关系标记。

12) 逻辑语义约束

逻辑语义约束是指分句之间在逻辑语义上的约束,主要表现为逻辑语义类型约束和逻辑语义距离约束。在规则库的设计中,用函数Logic S( ) 来描述逻辑语义类型的约束特征,用函数logic D( ) 来描述逻辑语义距离的约束特征。例如:

( 7) 与其说“四个坚持”是统帅、是灵魂,是一切经济工作的生命线,还不如说,经济建设的顺利推进、市场经济的健康发展,是“四个坚持”的统帅、灵魂和生命线。

在例( 7) 中,“是统帅”的分句编号为C1,“是一切经济工作的生命线”的分句编号为C3。虽然C1与C3在物理位置上并不紧邻,但它们在逻辑上是紧邻的,即logic D( C1,C3) = 1,且Logic S( C1,C3) = 并列。

四结语

关系词在汉语复句中起着重要作用,是汉语语法、语义研究的重要课题,但是关系词的计算机自动识别是一个难题: 一方面,关系词构成形态灵活,可以是副词、连词、助词、超词形式;另一方面,关系词的语法语义类别多样,歧义现象复杂,概括起来,主要有三类,即同形异类、同形异构和同形异义。

本文分析了计算机自动识别复句关系词的研究意义和研究基础,重点研究规则的12类约束条件,并给出了具体的实例。在此基础上,还将进一步研究规则的制定方法和表示方法,研究“基于规则的关系词自动识别”系统的规则库的基本结构,为深入研究计算机自动识别复句关系词和复句的方法,以及自动识别汉语句子和篇章的方法奠定基础。

摘要:关系词在汉语复句中具有重要的作用,是汉语语法、语义的重要研究内容,在信息处理领域具有很高的研究价值,但复句关系词的计算机自动识别是一个非常困难的问题。本文从中文信息处理角度,研究“基于规则的关系词自动识别”系统中规则的约束条件,为进一步研究计算机自动识别复句的方法以及自动识别汉语句子和篇章的方法奠定基础。

关系约束 篇7

粗糙集理论是一种处理不精确、不相容和不完全数据的数据工具, 利用基本粗糙集理论对决策系统进行数据约简, 目前已经有很多方法并在实际应用中取得了很多成果。经典粗糙集是以完备信息系统为研究对象, 以等价关系 (满足自反性、对称性、传递性) 为基础, 通过等价关系对论域分成互不相关的等价类, 划分越细, 知识越丰富、信息越充分。然而, 这些研究主要是在等价关系下的信息系统进行的。在实际问题中, 有许多信息系统由于各种原因 (如噪声、信息缺损等) 是基于优势关系的, 或者说是准则问题, 属性值是有序的。最初Greco、Matarazzo及Slowinski对此提出了比较有价值的观点, 将原来的粗糙集理论拓展到了基于优势关系下的粗糙集理论方法与研究, 即我们称之为DRSA (Dominance-based Rough Sets Approaches) , 即建立一种特殊的有序的二元关系。目前, 有不少学者对这一问题进行了大量的研究, 并且取得了相当的成绩。本文在前学者研究的基础上, 引入约束的概念, 量化给出的优势关系, 领域专家给出实际的约束值, 使得知识规则在实际问题分析中更具有实用性、有效性和合理性。

1相关概念及约简模型

定义1 称一个六元组Ι= (U, AD, F, G, C) 为一个目标信息系统, 其中 (U, A, F) 是信息系统, A称为条件属性集, D称为目标属性集, C为约束集即:

U={x1, x2, …, xn}是有限对象集;

A={a1, a2, …, ap}是有限条件属性集;

D={d1, d2, …, dq}是有限目标属性集, 且AD=Ø;

F={fkUVk, kp}是UA的关系集合, Vkak, akA的有限值域;

G={gkUVk′, k′≤q}是UD的关系集合, Vk′是dk′, dk′∈D的有限值域;

C={ca1, ca2, …, cl, …, cap, cd1, cd2, …, cm, …, cdq} 是条件约束集, 集合中的元素由领域专家给出。

定义2 设Ι= (U, AD, F, G, C) 为目标信息系统, 对于BA, 令:

RB={ (xi, xj) ∈U×U|fl (xi) -fl (xj) ≤cl, ∀alB, clC}

RD={ (xi, xj) ∈U×U|gm (xi) -gm (xj) ≤cm, ∀dmD, cmC}

RBRD称为目标信息系统Ι的带有约束的优势关系, 此时该信息系统称为是基于约束的优势关系下目标信息系统。

定义3 设Ι= (U, AD, F, G, C) 为基于约束的优势关系目标信息系统, 若RBRD, 则称该基于约束的优势关系目标信息系统是协调的, 或该目标信息系统在优势关系下是协调的, 否则是不协调的。

Ι= (U, AD, F, G, C) 为目标信息系统, RB, RD分别为属性集A和目标属性集D生成的U上的基于约束的优势关系, 对于BA, 记:

U/RB={[xi]BxiU}, U/Rd={D1, D2, …, Dr}

μB (x) = (|D1[x]B||U|, |D2[x]B||U|, , |Dr[x]B||U|)

γB (x) =max (|D1[x]B||U|, |D2[x]B||U|, , |Dr[x]B||U|)

其中[x]B={yU (x, y) ∈RB}。我们称μB (x) 为论域U上的关于属性子集B的基于约束的分布函数, γB (x) 为论域U上的关于属性子集B的基于约束的最大分布函数。

定义4 设Ι= (U, AD, F, G, C) 为目标信息系统, 若xUμB (x) =μA (x) , 则称B是分布协调集, 且B的任何真子集不是分布协调集, 则称B为基于约束的分布约简。

定义5 设Ι= (U, AD, F, G, C) 为目标信息系统, 若xUγB (x) =γA (x) , 则称B是最大分布协调集, 且B的任何真子集不是最大分布协调集, 则称B为基于约束的最大分布约简。

定义6 设Ι= (U, AD, F, G, C) 为不协调目标信息系统, 记:

Dμ*={ (xi, xj) μA (xi) ≤/ μA (xj) }

Dγ*={ (xi, xj) γA (xi) >γA (xj) }

fak表示属性ak关于对象x的取值。定义:

Dμ (xi, xj) ={{akA|fak (xi) >fak (xj) } (xi, xj) Dμ* (xi, xj) Dμ*

Dγ (xi, xj) ={{akA|fak (xi) >fak (xj) } (xi, xj) Dγ* (xi, xj) Dγ*

Dμ (xi, xj) 与Dγ (xi, xj) 分别为xixj的基于约束的分布与最大分布可辨识属性集。矩阵Mμ= (Dμ (xi, xj) xi, xjU) 与= (Dγ (xi, xj) xi, xjU) 分别称为该目标信息系统的基于约束的分布辨识矩阵和最大分布辨识矩阵。

定义7 设Ι= (U, AD, F, G, C) 为不协调目标信息系统, MμMγ分别为基于约束的分布和最大分布辨识矩阵, 记:

Fμ=∧{∨{akakDμ (xi, xj) }, xi, xjU}

=∧{∨{akakDμ (xi, xj) }, xi, xjDμ*}

Fγ=∧{∨{akakDγ (xi, xj) }, xi, xjU}

=∧{∨{akakDγ (xi, xj) }, xi, xjDγ*}

FμFγ分别为该信息系统基于约束的分布和最大分布辨识公式。

由上述定义, 给出基于约束的优势关系下的目标信息系统的算法模型:

输入:一个基于约束的优势关系下的目标信息系统 Ι= (U, AD, F, G, C) 的信息表。

输出:信息系统 Ι= (U, AD, F, G, C) 的所有基于约束的分配约简。

Step1 对xU, 计算μA (x) , γA (x) ;

Step2 计算 Dμ*, Dγ*, 生成Mμ, Mγ;

Step3 计算Fμ, Fγ, 得到基于约束的约简规则。

2实例分析

在电信运营中, 网络质量是衡量一个企业服务的重要因素, 如何提高一个企业的服务水平, 是争取客户挽留客户的重要方面。电信网络质量评价指标一般由以下六个属性描述:C1, C2, C3, C4, C5, D分别表示网络负载能力、业务范围、信息传输时延、中心局址、拥塞标志、电信网络质量。通过对江苏电信的数据采集, 得到一个决策信息表 (篇幅关系未列出) :论域中的个体有2000条网络线路, 网络负载能力离散化取值为0 (一级) 、1 (二级) 、2 (三级) 、3 (四级) 、4 (五级) ;业务范围离散化取值为0 (超过20个) 、1 (小于20大于15) 、2 (小于15大于10) 、3 (小于10大于5) 、4 (小于5) ;中心局址离散化取值0 (超过20km) 、1 (小于20km大于15km) 、2 (小于15km大于10km) 、3 (小于10km大于5km) 、4 (小于5km) ;信息传输时延离散化取值为0 (长) 、1 (较长) 、2 (中等) 、3 (短) 、4 (较短) ;拥塞程度离散化取值0 (不能处理) 、1 (严重) 、2 (比较严重) 、3 (中等) 、4 (较好) 、5 (好) ;电信网络质量离散化取值为0 (很好) 、1 (好) 、2 (较好) 、3 (中等) 、4 (较差) 、5 (差) 。对上述实际的离散值的含义及划分由领域专家给出。每个属性值是有序的, 给定约束值为{1, 1, 1, 1, 1, 1}时, 由上述算法模型得到该决策规则为九条, 近似质量为0.62;给定约束值为{2, 2, 2, 1, 3, 2}时, 由上述算法模型得到该决策规则为六条, 近似质量为0.69;即在领域专家给定约束下, 由传统的优势关系下得到的规则更加简练、合理, 具有实际应用的说服力, 从而为企业决策提供依据。

3结论

在基于优势关系下的分布约简算法中引入约束机制, 对优势关系进行一定的量化, 约束值由相关领域专家根据实际行业应用经验定义给出, 从而能够在实际应用中定义相关的概念并提高获取规则的有效性、实用性及合理性, 指导企业作出正确的决策。

参考文献

[1]张文修, 等.粗糙集与概念格[M].西安:西安交通大学出版社, 2006.

[2]张文宇, 等.数据挖掘与粗糙集方法[M].西安:西安电子科技大学出版社, 2007.

[3]王国胤.Rough集理论与知识获取[M].陕西:西安交通大学出版社.2001.

关系约束 篇8

自Mittal等[1]正式提出产品配置的概念以来, 针对新产品开发策划和产品创新设计中产品配置理论及方法的研究一直没有停止过, 包括配置知识建模、方案求解以及针对特定产品或领域的产品配置器实现等。其中, 孙伟等[2]基于Tiihonen等[3]提出的产品配置本体概念, 结合本体及其规则推理最新研究技术, 提出了对应的产品配置知识表达及推理实现方法;罗妤等[4]延续Jiao等[5]关于产品族与产品配置设计的思想, 提出了基于多维关联规则的产品族配置方法;Tseng等[6]利用CBR技术提出了一种产品BOM配置方法;延鹏等[7]提出了将QFD和产生式规则相结合的客户需求映射方法, 以得到满足客户需求的产品模块化配置方案集;徐剑等[8]通过递进式配置过程中的知识反馈提出了配置知识动态维护方法;Burneika[9]面向PDM系统的产品配置器提出了一种产品配置数据模型;肖刚等[10]以具有板结构特征的产品为研究对象, 提出了基于相似历史实例的产品配置方法。以往研究中, 零部件相似实例求解和约束规则驱动往往是分开的, 前者由于过早地确定零部件的唯一解而造成整体可选方案遗漏, 后者则容易由于规则维护的复杂性和不完整性而使得配置方案难以聚焦, 需要很多人工干预, 而且这些方法都难以直接在配置结果中区分出待新设计、改型设计和直接引用的零部件。

本文利用灰相似关系理论的案例推理算法, 提出了一种多维关联约束驱动的新产品初始配置方法。

1 基于多维关联约束的物料库模型

1.1 基于单层BOM的物料库构建

物料库是描述构成产品所需的所有部件、零件、辅料及它们属性特征的集合。物料库中每个物料的特征用属性表描述, 零部件间的上下级隶属关系用物料关系表描述。物料属性表记录所有物料库中所有物料的属性和属性值, 物料库中每个物料都有多个属性, 而每个属性又有一个具体的属性值。同类物料有相同属性, 但属性值不同。物料库是所有物料类型的集合, 其中物料属性集合可表示为Fc={Fcj} (j=1, 2, …) , Fcj表示为c类物料通过共j项特征属性进行描述;同类物料中多种物料的属性与属性值可表示为fcj={fckj} (j=1, 2, …;k=1, 2, …) , fcjk表示c类物料的第k个实例的第j项特征属性取值。

对于部件而言, 物料库还需要记录其对应的附属零件、部件的隶属关系。为了节约数据存储空间和追踪物料被哪些部件引用的情况, 采用单层BOM的方式来记录部件中物料间的隶属关系, 即部件作为父件与其子件 (下级小部件或零件) 存在父子隶属关系, 小部件又与下级零件存在父子隶属关系, 因此, 只记录每一层的父和子隶属关系, 构成单层BOM的数据存储结构。从子件和父件的隶属关系看, 可以是单子、单父的隶属关系, 也可以是单子多父的隶属关系, 如一个零件被多个部件引用。

物料库中物料属性表、物料关系表与部件单层BOM树状层次结构间的映射关系如图1所示。因此, 物料库中存储有构成产品所需的各类部件、零件和辅料。

1.2 物料库中零部件间的多维关联约束规则

一个产品由多个零部件组成, 这些零部件之间存在功能、性能、结构尺寸、装配位置、配合公差、质量、成本等多个方面的匹配关系。如一个发动机与一个自动变速器之间要实现完全匹配, 则必须在上述各个特征属性方面完全匹配, 这是强关联约束;如发动机和自动变速器之间部分特征属性能匹配, 另一部分特征属性不能匹配, 这是弱关联约束;如发动机和自动变速器之间的所有特征属性都不匹配, 则它们就是不关联约束。还有一种关联约束关系是当用了某一个部件, 就一定不能用另一个部件, 如电喷发动机中用了电子燃油喷射部件, 就不能用化油器, 这就是相斥关联约束。物料库中零部件间的多维关联约束规则和可配置判据如表1所示。

2 多维关联约束驱动的新产品初始配置模型

在构建好多维关联约束的物料库后, 新产品初始配置就是按新产品结构化功能技术特性要求, 从物料库中查找所需的零部件, 并按产品下属各级零部件层次结构、隶属关系和可配置判据进行配置。新产品的初始配置步骤如下: (1) 将新产品功能技术特性分解为产品下属一级部件的功能技术特性 (由企业技术专家完成) , 并按一级部件的重要度自顶向下排序; (2) 先按重要度最高的部件功能技术特性, 通过灰相似关系的粗糙集约束搜索算法, 从物料库中搜索出满足相似条件的部件, 配置到新产品BOM树上的部件位置; (3) 然后依次按照其他部件的功能技术特性, 用相似搜索算法从物料库中搜索出对应零部件, 若该零部件与已配置到产品BOM结构树上的部件满足可配置判据要求, 则配置到新产品BOM结构树上 (第n个部件的配置需与前n-1个部件作可配置判据遍历, 满足可配置判据的部件则配置到新产品上, 不满足可配置判据的部件则不能配置到新产品上) ; (4) 依附件随主体部件配置, 当主体部件可配置时, 则依附件也可配置, 反之, 则不可配置; (5) 当从物料库搜索不到所需的零部件时, 就在新产品BOM树上直接创建新零部件去设计。其配置过程如图2所示。

3 多维关联约束驱动的新产品初始配置算法

3.1 零部件库及其配置约束关系描述

零部件库为产品配置提供基础数据支撑, 包含了来自既有产品或供应商候选配件清单的所有零部件信息, 并对部件、零件、辅料的属性特征变量及相关参数, 以及零部件与零部件之间的配置约束关系进行了描述。

零部件属性描述如下:

其中, P1、P2、P3分别表示部件、零件、辅料描述信息表;P_ID表示零部件编码;P_Ver表示零部件版本;P_Type表示零部件类别;P_Name表示零部件名称;P_Cost表示零部件成本;P_FV表示功能特征, 往往与配置需求对应;P_PV表示技术属性特征, 包括几何、颜色、材质等特征;P_ComponetSet表示零部件结构特征, 由母件Mon_P、子件Sub_P和结构关系特征RV (如数量、位置等) 组成, P_ComponetSet= (Mon_P, Sub_P, RV) 。

另外, Ri= (P_a, P_b, P_r) 表示零部件P_a、P_b之间配置约束关系P_r, 包括排斥、弱相关、强相关、依附等配置约束关系。

3.2 基于灰相似关系的产品初始配置算法

新产品初始配置就是针对分解后的新产品功能技术特性要求, 从零部件库查找出对应匹配或近似匹配的零部件, 并形成最佳配置方案, 以匹配新产品整体功能技术要求。配置过程中, 按照新产品功能技术特性排序, 逐一从零部件库查找可匹配的零部件候选集合 (包括完全匹配和超过80%匹配) , 然后根据配置约束规则, 排除与前置求解零部件相冲突的候选项, 逐步形成候选方案, 最后按零部件评价指标权重进行综合差异度计算, 确定总体最优方案。

步骤1确定待求解的零部件及其功能技术特性。

根据新产品功能模块划分和功能技术特性分解, 确定最终待配置的零部件及其重要度、零部件技术特性及其重要度。

(1) 待配置零部件集合为P={p1, p2, …, pn}, 其中n表示待配置的零部件数量, 而零部件pi的重要度为w (pi) , 且

(2) 每个待配置零部件对应一个功能技术特性向量, 零部件pi的功能技术特性向量为

其中, si表示零部件pi的功能技术特性数量, x0, q (pi) (q=1, 2, …, si) 表示零部件pi的第q个功能技术特性要求, 其重要度为wq (pi) , 且

步骤2从零部件库中查找pi的相似零部件实例。

相似实例检索算法很多, 综合检索效率和检索效果质量等因素, 本文采用基于加权灰相似度的案例检索算法[11]进行相似案例的检索, 即:首先利用各特征属性的灰相似度来表示实例属性的局部相似度, 然后根据各功能技术特性的重要度权重, 对各局部相似度加权平均得到实例与目标需求的综合相似度, 最后, 将综合相似度大于给定阈值β的实例放入结果集E (pi) 中作为配置推理候选实例。具体检索过程如下:

(1) 设零部件pi的候选案例集合为:, 其中, li为pi的候选实例数, 则X (pi) 可表示成为li×si阶的行为矩阵:

(2) 原始数据规范化处理:为了避免不同量纲的影响, 采用向量归一化方法将属性值转换为[0, 1]区间的值, 得到pi归一化后功能技术特性向量x′0 (pi) 及候选案例行为矩阵X′ (pi) 。其中:

(3) 计算pi与其第p个候选实例xp (pi) 在第q个功能技术特性上的局部灰色关联系数 (即关联相似度) :

(4) 根据相似度和距离间的转换关系[14], 将pi与其第p个候选实例xp (pi) 在第q个功能技术特性上的关联相似度转换为关联距离:

(5) 根据欧几里德距离公式, 计算在si维空间上pi与其第p个候选实例xp (pi) 间的相似距离:

(6) 根据相似度和距离间的转换关系, 计算pi与其第p个候选实例xp (pi) 间的综合灰色相似度:

(7) 如果sim (x1 (pi) , xp (pi) ) ≥β, 则认为pi的候选案例xp (pi) 符合目标需求配置相似性要求, 将其放入相似案例检索结果集合E (pi) 中。

步骤3将新查找零部件的候选项与已有零部件候选项组合, 并进行配置约束关系判断 (满足可配置判据要求) , 形成新的零部件组合。

判断由步骤2得到的匹配零部件pi的相似零部件集合E (pi) , 若E (pi) =Ф (无可匹配的相似零部件) , 则直接创建待新设计零部件^pi纳入候选方案, 并重复步骤2进行后续零部件查找;若E (pi) ≠Ф, 则继续对其中每个候选项与已有零部件候选项的方案集合Ri-1进行配置约束关系判断, 并形成新的方案集合Ri。

(1) 设Ri-1={r (i-1) (1) , r (i-1) (2) , …, r (i-1) (m) }, 其中r (i-1) (k) (k=1, 2, …, m) 为p1, p2, …, pi-1的配置结果项组成有效配置方案 (其中p1, p2, …, pi-1两两间不互斥) 。

(2) 取零部件pi的候选项pij∈E (pi) , 与r (i-1) (k) 中p1, p2, …, pi-1的配置结果项逐一进行配置约束关系判断。 (1) 若pij与r (i-1) (k) 中任意p1, p2, …, pi-1配置结果项相斥, 则pij与r (i-1) (k) 冲突, 不能组成新的配置方案; (2) 若pij与r (i-1) (k) 中任意p1, p2, …, pi-1的配置结果项都不相斥, 则pij与r (i-1) (k) 不冲突, 可放入新的p1, p2, …, pi-1, pi方案集合Ri中; (3) 若r (i-1) (k) 与E (pi) 中的任意pij都冲突, 则在不符合条件 (4) 的情况下, 删除r (i-1) (k) ; (4) 若E (pi) 中的任意pij都与Ri-1中的任意r (i-1) (k) 都冲突, 则创建待新设计零部件与Ri-1中r (i-1) (k) 逐一组合形成Ri (方案个数不变, 还是m) ;

同时, 在不冲突的情况下, 若pij与r (i-1) (k) 中任意p1, p2, …, pi-1配置结果项弱相关, 则标注为需要调整匹配;如果是依附关系, 则继承对应零部件的标注;如果没有相关关系, 则忽略;只有全部强相关, 才说明与r (i-1) (k) 完全匹配, 可直接使用;另外, 既有零部件与任意待新设计零部件的关系默认为强相关。

步骤4重复步骤2、步骤3, 完成所有零部件的查找, 形成最终产品配置方案。按各零部件重要度权重进行综合匹配度计算, 确定最优配置方案。

若P={p1, p2, …, pn}最终只有一个候选方案, 即Rn={r (n) (1) }, 则直接将其作为新产品初始配置结果进行输出;若Rn的候选方案个数大于1, 则最终根据各零部件重要度权重进行综合匹配度计算, 确定最终产品配置方案。综合匹配度 (相似度) 计算公式为:

其中, sim (r (n) (k) ) 表示第k个产品总配置方案的总体匹配度, 表示第k个产品总配置方案中零部件pi的匹配度。

4 算例及验证

自卸车作为一种工程用车, 往往根据客户需求及用车环境确定其车型型号, 并对车架、车身、车厢、发动机、驾驶室、变速箱、燃油箱、驱动桥、卸货装置、空调、轮胎等零部件进行选配, 以及其他零部件的改型。针对某客户订单需求, 通过技术专家分解得到各零部件技术性能要求, 从既有零部件库中检索到相应的相似零部件及其综合灰相似度, 如图3所示。

以发动机为例 (这里为了简化计算, 取其中6个实例及部分特征属性作演算) , 经数据规范化处理和归一化后的各特征属性值见表2。

按式 (2) 计算各发动机实例的属性特征灰关联相似度, 得到对应的发动机实例关联相似度矩阵为

按式 (3) 将各实例属性特性灰关联相似度转换为各属性关联距离, 得到对应的发动机实例关联距离矩阵为

最终按式 (5) 得到各实例与需求灰色关联距离分别为[1.0801、10.3870、0.7050、0.5745、0.4918、2.5097];按式 (6) 得到各实例与需求的综合灰相似度分别为[0.4807、0.4189、0.5865、0.6351、0.6703、0.2849]。选取其中第4、5个实例作为发动机候选实例继续进行配置方案, 通过与发动机相关的配置约束规则确定对应的依附组件 (如发动机悬置、加速传动装置、冷却系统、离合器操纵机构、燃油箱总成、进气装置等) , 并约束其他关联组件的选配 (如供油系管路、变速器及换挡操纵机构) 。以此类推, 经逐项配置得到所有可配件的相似零部件及其配置方案, 同时也得到各配置方案与客户需求的综合匹配度 (表3) 。经验证, 方案6在各重要零部件都满足产品功能技术特性要求的情况下, 需要进行的改型设计较少, 方案综合成本最优。

5 结语

如何将目标新产品功能技术特性快速转化成新产品初始结构配置对新产品开发策划非常重要, 本文提出的基于灰相似关系和多维关联约束的新产品初始配置方法, 针对新产品功能技术特性要求, 根据灰相似关系查找候选零部件相似实例, 通过多维关联约束驱动的物料库和可配置判据判断进行迭代匹配, 得到最终产品结构组合、匹配度排序、零部件清单及不同产品配置间的特征差异。经实例验证, 通过本方法可以快速将产品功能技术特性要求转换为产品结构配置, 最大化地重用已有零部件设计资源, 并快速定义出需改型和新设计的零部件。

摘要:为了解决新产品开发策划中将目标新产品概念模型中的结构化功能技术特性快速转化成新产品初始结构配置的问题, 建立了多维关联约束的零部件资源库模型, 针对分解后的新产品功能技术特性要求, 根据零部件灰相似关系从零部件库查找出对应匹配或近似匹配的候选实例, 按照零部件对产品总体功能技术作用的重要度排序, 通过多维关联约束驱动和迭代匹配, 逐步形成各零部件的总体候选方案, 并根据综合匹配度确定最终匹配方案及其待改型设计和新设计的零部件。最后, 通过一个实例对所提出的方法进行了验证。

【关系约束】推荐阅读:

法律约束07-14

安全约束07-21

目标约束05-12

仿真约束05-26

运行约束06-10

有效约束06-25

条件约束06-28

约束理论07-07

约束资源07-08

参数约束07-08

上一篇:水平固定管论文下一篇:临床效用