Agent方法

2024-09-24

Agent方法(通用9篇)

Agent方法 篇1

摘要:面向Agent软件工程是软件工程领域重要的新技术。面向Agent软件工程研究有效的面向Agent的软件方法和支持方法的工具, 用以开发高质量的复杂软件产品—多Agent系统。本文详细的研究了面向Agent软件工程方法和面向Agent软件工程工具, 并对AOSE的方法进行了详细的分析。

关键词:AOSE,Prometheus,SONIA,AUML

0 引言

面向对象的计算思想强调直接从待解的问题域出发, 认为现实世界是由具有本质特征的事物组成, 可以根据这些本质特征将其抽象为系统的基本单位—对象, 通过对象间的分工和合作构成现实世界运行, 并利用封装、继承等机制来构建计算系统。而面向Agent的计算是一种基于Agent社会观的新兴计算模式, 其思想是从人类、事物和环境的现实世界出发, 强调事物的属性是动态的, 且在很大程度上受到与其密切相关的人和环境的影响, 将影响事物的主观和客观特征相结合, 并抽象为系统的基本单位—Agent, 通过Agent的协商、合作来实现系统的整体目标。

与面向对象的思想不同, Agent通过引入心智属性, 一方面将人类主观意识与客观世界紧密结合, 另一方面使得Agent对环境的感知在经过一系列的心智活动后, 能相应地调整其解决问题的意图和策略。因而面向Agent方法更贴近客观世界的真实情况, 更准确地反映了客观世界事物之间的深层联系及其静态和动态特征的本质和根源, 更接近人类解决问题的一般方法和习惯。

1 面向Agent软件工程方法

面向Agent软件工程 (Agent—Oriented Software Engineering AOSE) 研究有效的面向Agent的软件方法和支持方法的工具, 用以开发高质量的复杂软件产品—多Agent系统 (MAS) 。AOSE的方法是基于Agent交互和组织关键抽象集问题域和计算域建立模型的原则和活动集。AOSE方法可以分为形式化和非形式化两类。

(1) 形式化方法:形式化方法以数理逻辑作为模型语言。认为形式方法的过程由系统规范、系统实现和系统验证三个阶段组成。系统规范是说明Agent系统的框架。目前最成功的框架是用时序模态逻辑表示的规范, 两个著名的逻辑框架是Cohen-Levesque的意图理论和Rao-Georgeff的BDI模型。系统实现将抽象规范转换为具体的计算系统。系统实现有解释执行和编译两种方法, 解释执行是指给定用逻辑语言L描述的系统规范S, 将S作为执行规范, 直接解释S以产生Agent行为;编译是把Agent规范通过自动编译过程将抽象的规范转换成具体的计算模型, 编译后的系统执行很少或根本不需要进行符号推理。系统验证用来确定计算系统是否正确地实现了规范。系统验证可分为公理验证和模型检查两种方法。

(2) 形式化方法的主要问题在于以下几点:

(1) 时序模态逻辑的可能世界语义存在逻辑全知问题, 认为Agent具有无限的推理能力, 而实际的Agent无法满足这种要求。

(2) 可能世界语义缺乏现实基础, Agent状态的抽象表示与具体计算模型没有直接的联系。

(3) 对交互、组织的形式化描述问题研究不足。

(3) 非形式化方法:非形式化方法以图、表、文本等作为模型语言。相对于形式化方法, 非形式化方法的研究比较活跃。以下是集中非形式化方法的介绍。

(1) Prometheus是基于功能分解的方法, 使用文本和AUML作为模型语言, 其过程分为系统说明、结构设计、细节设计三个阶段。Prometheu的目标是为开发者提供一个包括全部开发活动的、迭代的、具备模型一致性检查能力的方法。Prometheus将待求解问题划分为Agent系统和环境两部分, 将从环境的输入信息称为感知, 将Agent系统对环境的影响称为行动。

(2) ODAC使用RM-ODP (开放分布过程参考模型) 的框架和模型, 以UML作为模型语言, 其过程分为分析、设计和实现三个阶段。ODAC的目标是以标准化的方法有效降低由复杂软件系统的分布性而产生的开发难度。RM-ODP是由ISO和ITU-T共同制定的开发分布式系统的结构框架, 包括对象模型和结构模型两部分, 结构模型含有企业、信息、计算、工程、技术等六个视图, 其中企业视图由企业对象、对象社会等组成, 计算视图描述交互等分布式计算结构。ODAC的设计和实现阶段目前仍在发展中。ODAC的主要问题是没有区分Agent与对象, 使用UML作为模型语言不能充分描述AOSE的关键抽象集。

(3) SONIA的目标是使用独立于设计的一般性分析方法和自底向上识别Agent的设计过程, 以自然的方式开发Agent系统。SONIA分析阶段使用问题域术语为模型语言, 设计阶段没有指定模型语言。SONIA的主要问题是没有建立组织模型, 分析与设计阶段使用不同的模型语言, 不利于分析模型到设计模型的平滑转换。

(4) 将已提出的非形式化方法划分为以下三类:

(1) 基于Agent和多Agent技术的方法。该类方法将Agent作为与传统对象不同的新抽象, 如Gaia、SONIA等。

(2) 基于面向对象技术的方法。该类方法将Agent作为复杂对象, 扩展OO技术以表示Agent的复杂行为, 如Prometheus、ODAC、Ma SE等。

(3) 基于知识工程的方法。该类方法着重于对Agent使用知识的识别、获取和建模, 如MAS-CommonKADS。

(5) 非形式化方法研究存在的主要问题是:

(1) 没有形成较一致的Agent、交互、组织建模原则。

(2) 求解结构是固定的, 不能体现Agent灵活的问题求解能力。

(3) 没有对Agent本身具备的独立控制线程的控制机制建模。

(4) Agent模型达不到系统级抽象程度和粒度的要求。

(5) 使用自顶向下的分解还原方法而不是复杂系统要求的综合集成方法。

2 面向Agent软件工程工具

2.1 Agent统一模型语言 (AUML)

统一建模语言 (Unified Modeling Language, UML) 是一种图形化的表示语言, 最初用于标准化对象类的设计, 后来被扩展为支持面向对象系统中所涉及的所有部件。如组件、包等。Odell, Parunak和Bauer提出了AIP (Agent Interactions Protocols) 的三层表示模型。在UML的基础之上进行了扩展。扩展后的模型被定义为AUML (Agent UML) 。在AUML中。对UML中的其本元素作了适当的改变, 主要包括:包 (Packages) 、模板 (Templates) 、序列图 (Sequence Diagrams) 、合作图 (Collaboration Diagrams) 、活动图 (Activity Diagrams) 和状态图 (Statecharts) 。OMG和FIPA (Foundation of Intelligent Physical Agent) 都支持扩展UML作为Agent统一模型语言 (AUML) , 主要扩展工作包括:

(1) 扩展包和模板描述交互协议。

(2) 扩展UML中的类图、对象图以允许Agent承担多个角色。

(3) 扩展动态模型中的顺序图、协作图、状态图等支持并发描述, 使UML能够描述Agent的复杂交互行为。

(4) 扩展部署图支持描述Agent的移动性。AUML研究存在的主要问题是扩展工作集中于描述Agent的描述。

2.2 开发工具

开发工具大多基于Java语言, 如ZEUE, JACK等利用Java语言的解释执行、支持分布式计算、平台无关等特性满足复杂软件系统开放、分布、异构的要求, Java环境是多线程的而且内置多线程控制, 支持Agent的多线程运行。

3 结束语

面向Agent软件工程是软件工程领域重要的新技术, 发展有原则的非形式化Agent系统开发方法是Agent技术被广泛使用的根本。Agent理论和技术源于人工智能领域, 在AI的研究中Agent的对应物是人, MAS的对应物是人类社会, 人和人类社会是社会学的研究对象;AOSE的目标是建造具备正确性、可维护性等质量因素的高质量多Agent系统, 社会学是研究人类社会良性运行和协调发展的条件和机制的综合性具体社会科学;MAS本质上是自底向上建造的系统, 人类社会本身也是自底向上形成的复杂系统;面向Agent编程范型是一种计算的社会观点, 而人类社会是开发者最为熟悉和理解的社会, 因此我们认为以社会学理论为原则的非形式化Agent系统开发方法是AOSE的下一步发展方向。

参考文献

[1]Lin Padgham and Michael Winiko.Prometheus:A brief summary.Technical note, available from the authors.2003.

[2]Weiss G.Multi-Agent Systems:A Modern Approach to Distributed Artificial Intelligence[M].Cambridge, MA:The MIT Press.2005.

[3]M E Bratman1 Intentions, Plants, and Practical Reason[M].Cambridge, MA:Harvard University Press.1987.

[4]Rao A S, Georgeff M P.BDI Agents:From Theory to Practice[A].Proc of the 1st Int’l Conf on Multi-Agent Systems (IC2MAS295) [C].1995.

Agent方法 篇2

基于多Agent单元的柔性知识管理系统

在分析了知识管理柔性问题后,有针对性地提出了基于多Agent单元的柔性知识管理系统,并详细介绍了各Agent单元的`功能.该柔性知识管理系统具有高度的智能性和可扩展性,可以有效提高知识管理系统柔性.

作 者:宋迪 Song Di  作者单位:东南大学,管理工程研究所,南京,211189 刊 名:价值工程  ISTIC英文刊名:VALUE ENGINEERING 年,卷(期): 27(11) 分类号:C931 N39 关键词:多Agent单元   柔性   知识管理系统(KMS)  

Agent方法 篇3

20世纪90年代以来, 制造业不断面临新的挑战和压力, 社会需求与世界市场发生了重大变化。需求的多样化使得制造业向着多品种、小批量的方向发展, 具体表现为:①市场和商务竞争的全球化;②客户需求多样化和个性化;③产品生命周期缩短;④交货期成为主要的竞争因素。这些挑战使得现代制造业及制造技术朝着高度自动化、精密化、敏捷化、柔性化、网络化、信息化、集成化、虚拟化、精益化、绿色化、创新性和全球化的方向发展[1], 从而使企业能快速响应市场, 尽可能地满足个性化市场的需求。

1多Agent系统及其在制造中的应用

多Agent系统 (Multi-Agent System, MAS) 理论与技术为分布式网络化制造的实现提供了有效的机制和理想的解决方案。它着重研究一组拥有分布知识的Agent (通过网络实现互联互通) , 如何就各自的知识、意图、策略、规划和行为进行协商、协调与协作以完成共同的任务。MAS的特点体现在每个Agent的自主能力和多Agent间的协同能力。

1.1 基于MAS的制造系统

基于MAS的制造系统, 一方面能保证制造系统控制的柔性与自适应性, 另一方面简化了系统的结构, 降低了系统通信与控制的复杂性, 有利于解决制造系统各种异构信息的集成问题, 提高制造系统的可扩展性和可重用性。其中, 制造资源Agent是软硬件相结合的自主实体。制造资源是制造系统的基本组成单位或者是由基本资源构成的单元, 是指物理上存在的制造设备。

1.2 制造资源Agent化

制造资源Agent[2]是相应制造资源的代表, 通常是一个软件程序, 运行在一台计算机上, 这台计算机通过RS232或其他形式的接口与制造资源相连。系统结构中的制造资源Agent由资源管理Agent进行统一管理和信息的维护与更新。当制造资源的状态发生变化时, 制造资源Agent要及时获取信息并通知资源管理Agent, 记录其动作、状态等信息。同时, 资源 管理Agent负责所有制造资源Agent的图形化显示, 根据本地制造资源数据库中的信息, 利用图形显示模块可以列出所有制造资源Agent, 查询某个制造资源Agent的工作日志、作业集合等。完善的车间资源管理可以大大提高车间运行效率和资源利用率, 从而缩短产品的开发周期。制造资源Agent结构模型如图1所示。

制造资源经过Agent化, 具有Agent的反应性、主动性和社会性。图2是经过逻辑抽象了的制造资源Agent化结构图, 不同Agent之间使用KQML协议通讯。

(1) 思维模块Agent:

通过从信息接口及知识库所获取的信息与知识, 对目标任务作出判断、规划、推理等思考, 监测任务的执行情况, 从而进行操作与控制, 并与其他Agent进行交互与协作。

(2) 知识库:

主要包括领域知识和数据、协作知识和数据及模型。

(3) 数据库:

主要用于Internet/Intranet网络服务通讯。

(4) 服务层:

通过相关协议与其他Agent进行分布式协同作业。

(5) 基础层:

由Internet/Intranet网络、数据库系统等软硬件平台构成的分布计算环境。

2数控设备Agent化模型

从本质上讲, 任何规模、任一层次的制造系统都是由若干个完成不同任务的环节组成。各环节在独立完成自身任务的同时, 又相互协作, 共同完成制造任务, 因此, 可以说制造系统实现制造资源向产品转化的整个制造过程是一个典型的多Agent协同求解过程。实现集成首先需要将企业建模为多Agent系统。

2.1 数控设备Agent化模型

把制造系统的基本单位视为一个元Agent, 对它们进行Agent化, 为提高其对外交互与合作能力提供一种新的思路。数控设备Agent-元Agent是一个具有一定推理、决策能力的智能实体 (软件计算程序) , 能够独立、自主地根据其周围环境信息、当前状态和能力进行规划、推理、决策并作出适当的反应。在这样的关系转化中, 数控设备是元Agent的实体, 而数控设备Agent则具有与外界通讯和交互合作的能力。也可将数控设备Agent和其所代理的数控设备一起当作一个元Agent, 且一个元Agent也可以代理一台或数台数控设备。数控设备Agent模型如图3所示。

数控设备Agent的代理功能既能大大增强数控设备的对外交互能力, 又可以将数控设备有关处理外部事宜的智能和能力移植给它的Agent, 从而使数控设备不必花费额外时间来处理涉外事宜, 保证了数控设备对实时性的要求。更重要的是, 通过将数控设备Agent化, 可以有效地降低构成制造单元/系统的复杂程度和提高各个数控设备间的耦合度, 极大地提高制造单元/系统的开放性、可靠性和动态可重组性, 为实现制造企业设备级的集成奠定坚实的基础。

数控设备Agent通过实体接口与其所代理的数控设备进行通讯, 其通信能力可以通过具体的程序加以调整, 达到有源开放, 是其可扩展性和可重用性的具体体现。

2.2 Agent的封装

封装的核心思想是在为外部软件提供Agent协作功能的同时尽可能少地扰乱已有的软件接口, 封装Agent通过对外部代码的Agent化扩展了Agent的能力。图4为Agent化封装模型。封装Agent允许其他Agent连接到Web Services, 其他Agent把命令传给封装Agent, 封装Agent调用底层的Web Service, 其基本功能是在ACL消息格式和外部软件系统能理解的命令格式之间进行翻译。

2.3 数控设备Agent化及其实际应用

生产车间的制造资源包含有设备资源 (加工中心、CNC机床、传送运输设备AGV、机械手等) 和人的智力资源等等[3]。要建立基于Agent的调度系统, 就必须对这些资源进行Agent化处理, 构建相应的资源Agent与之相联系。

通过实际应用分析, 本文提出了如图5所示的基于数控设备Agent化方法的远程监控系统结构图。该系统由3个主要部分组成:现场检测子系统 (即力信号采集和视频采集系统) 、数控设备Agent交互系统和信息反馈监控中心管理系统。

基于Agent技术的远程工况监控系统可以有效地监控工件质量及设备运行状况。在现场监测过程中, 通过实时地监测相关件的动态监控画面, 可以很直观地对检测过程进行监控, 提高了系统的自动化程度。更主要的是通过相关的信号处理环节, 实现了直接获取现场加工设备生产过程中因刀具的磨损等产生的不良后果, 以便及时地停止作业, 并进行相关设备资源的调度和合理分配, 防止因设备故障及零部件不合理分配而导致的生产效率低下, 这在很大程度上保证了工程的安全性并提高了生产的效率。

本系统相关应用部分采用VC++作为设计语言, 通过相关接口的设计, 使整个系统具备较好的开放性。本系统是以深圳大学三号驿站数控加工中心车间为对象模型建立的, 试验证明效果良好。如果需要扩展到其他类似的工程领域, 只需设计好新的子系统的数据采集模块与通信接口, 这使本系统具有良好的扩展能力。

该远程监控系统的设计实现了如下的目标:①可靠性;②实时性;③通用性。为制造业柔性制造及响应市场快速变化提供了新的思路。

3结束语

对于敏捷、灵捷制造系统, 采用分布式智能Agent技术, 利用Agent的智能性和自治性等特征, 使得每个Agent都具有一定的判断和决策能力, 并通过Agent之间的谈判与协商实现生产任务的分配, 可以有效地识别冲突和解决冲突, 这样有利于实现生产过程的敏捷性, 是今后网络化制造系统的发展方向。

制造设备是制造系统最为基础的组成要素之一, 而数控设备又是制造设备的组成单元, 是基础中的基础。要研究分布式网络化制造系统, 就必然要研究制造设备Agent, 尤其是数控设备Agent。正是在这样的背景下, 本文着重于构建结构合理、功能比较全面的数控设备Agent, 以满足基于多Agent建立分布式网络化制造系统模型的需要。本课题的研究不仅具有一定的理论意义, 也具有重要的实际应用前景。

摘要:首先介绍了多Agent系统及其在制造系统中的应用。通过基于MAS的制造系统中制造资源Agent化过程, 总结出一种数控设备Agent化模型, 并开发出应用于生产实践的远程监控系统。

关键词:MAS,制造资源Agent,数控设备Agent

参考文献

[1]程涛, 胡春, 吴波, 等.分布式网络化制造系统构想[J].中国机械工程, 1999, 10 (11) :1234-1239.

[2]陈幼平, 王洪海, 朱志明, 等.制造设备全能Agent及其构建技术的研究[J].计算机工程与应用, 2003 (25) :50-53.

Agent方法 篇4

【中文摘要】随着Internet的发展,网络教学得到了越来越广泛的应用。学生可以不受时间和空间的限制,进行网上学习。网络教学相比传统教学模式,更能培养学生信息获取、加工、分析、创新、利用、交流的能力。因此,越来越多的院校将网络教学作为自身教学的一种延续,而警察院校作为培养末来警察的基地,其教学对象和内容都具有一定的特殊性,其网络教学平台应突出警察职业能力的培养,应具有更高的安全性,这对网络教学系统提出了更高的要求。本文结合江西警察学院的教学特点,引入人工智能中的多Agent系统,建立基于多Agent技术的网上教学系统。所做的工作主要有以下几项:(1)公安院校教学模式的改革研究。为了构建教、学、练、战一体化的教学模式,在教学过程中要突出公安职业化教育,突出实战教学,提高学生的职业素质水平,全面调整教育观念、教育体制和教学内容,努力培养具有扎实的专业技能和过硬实战本领的公安专业型人才。(2)多Agent技术的研究。Agent技术已经成为公安教学研究的一个热点,设计系统的总体框架和系统的工作流程,为系统的每一个参与者设计了一个Agent功能模块,同时也为系统设计了一些具有管理功能的Agent模块来管理系统的协同运行,以...【英文摘要】Along with the development of the Internet, network teaching has been applied more and more widely.Students can conduct online learning without being limited by time and space.Compared with the traditional teaching mode, network teaching can more effectively train students’ ability of information acquisition, processing, analysis, innovation, utilization, communication.Therefore, more and more colleges have adopted network teaching as a continuation of teaching in class.However, police colleges, as the...【关键词】警察院校 多Agent技术 网络教学

【英文关键词】Police Colleges Multi-agent Technology Network Teaching 【索购全文】联系Q1:138113721 Q2:139938848 【目录】基于多Agent技术的江西警察学院教学平台的设计与实现摘要6-7

Abstract7-8

第1章 引言1.1.1 研究背景11-1811-1212-131.1 现状分析11-131.1.2 国内外公安院校教学模式特色分析1.2 公安警察院校信息化建设分析13-18

1.2.1 公安警察院校信息化建设的特点14-15院校网络化教学系统的不足15-16系统可采取的措施16-1818-28

1.2.2 传统公安警察1.2.3 优化公安网络教学

第2章 多Agent技术概述

2.1.1 Agent的定义

2.1.3

2.3 2.1 Agent技术概述18-21与特征18-192.1.2 Agent的基本结构19-20

2.2 多Agent系统21-23Agent的运行原理20-21

基于多Agent技术的网络教学系统 23-28Agent网络教学系统结构23-25的功能25-28设计28-3728-30

2.3.1 基于多

2.3.2 基于多Agent教学系统

第3章 基于多Agent公安院校网络教学系统的3.1 公安院校教学系统模型分析与设计3.1.1 系统模型的需求分析28-303.1.2 系统模型的总体设计3030-34

3.2 公安院校教学系统模块的详细设计

第44.1 系3.3 公安院校教学系统的工作流程34-37章 基于多Agent公安院校网络教学系统的实现37-67统硬件环境和软件环境的介绍37-38现38-67

4.2 系统主要模块的实

4.2.2 公安教4.2.1 安全访问的实现38-46学资源Agent模块的实现46-5151-57

4.2.3 学生Agent模块的实现

4.2.5 管4.2.4 教师Agent模块的实现57-63

第5章 总结与展望理员Agent模块的实现63-6767-70675.1 总结67-685.1.2 系统特点67-68

致谢73

5.1.1 主要研究内容5.2 展望68-70

Agent方法 篇5

关键词:Agent,软件工程,建模,体系结构

20世纪90年代末以来, Age nt理论和技术得到不断成熟和应用, 现有的面向过程和面向对象的软件工程方法已不能解决Agent系统的设计与分析问题, 人们迫切地希望能够从一些具体的Agent技术和特殊的成功案例中抽取出一般性的、具有普遍意义的原理、方法、过程和模型等, 从而提供一种系统的手段以指导软件系统的工程化开发。在此背景下, 许多学者将Agent的概念、理论和技术引入到软件工程领域, 并与软件工程的思想、原理和原则相结合, 产生了基于Agent的软件工程这一新颖的研究方向。

一、Agent定义和特点

在软件工程领域较为人们所接受的Agent的定义是:Agent是一个处于特定环境中, 能感知并灵活、自主适应环境, 可以代理设计者或使用者实现一定任务的具有较高自治能力的计算机实体;其根本目标是接受另外一个实体 (可以是人、Agent、系统等) 的委托或请求并为之提供帮助和服务, 能够在该目标的驱动下主动采取包括社交、学习等手段在内的各种必要的行为, 以感知、适应并对动态环境的变化进行适当反应。它具有以下特点:自主性。社会性。反应性。主动性。以及移动性、自适应性、协作性、自利等特性。

二、Agent与对象的比较

Age nt的概念可以看作是面向对象概念的一个延伸, 它是对现实世界的更高层次上的抽象。以下简要概括了Agent与对象的区别:

对象可以看作是一个被动的实体, 只能由外部的消息控制。外部的消息快递可激活其内部的方法, 对象方法的变化可以改变属性特征及其行为。Agent是一个活动的自治实体, 具有自主性, 具有自己的目标和行为, 可由外部激励或内部状态而启动, 能理解信息并控制自己的行为。Agent与对象的不同导致了我们在对Agent的心智构件———信念、愿望和意图进行建模和设计时难以采用应用面向对象的方法学。

三、两种基于Agent的开发方法和体系结构

不同于其他软件工程技术, 面向Agent软件工程的研究借鉴和集成了其他学科的知识和研究成果, 包括社会学、组织学、认知科学、经济学等, 从而为复杂系统的开发提供更为自然、抽象的技术手段。下面我们对两种较为主流的方法进行探讨:

(一) Gaia方法学

Gaia方法学是把多Age nt系统看作一个由相互作用的不同角色组成的计算组织, 它不仅支持Agent的群体智能及其组织结构, 而且支持Agent的内部结构。在Gaia系统中, 角色是主要组成部分, 角色有职责, 权限, 活动和协议等属性。

Gaia方法中Age nt的体系结构:各种服务作为一个组件能够被动态的装卸, 每个服务以两种角色存在, 一种是协调者的角色, 另一种是客户角色, 服务部署层来决定唤醒那一个服务角色。系统管理服务发现在它附近的设备、协调设备加入系统和管理系统。事件服务管理系统中设备之间事件的通讯。本地服务融合系统中来自不同设备的本地信息, 对整个系统提供设备的信息。安全服务主要由两部分组成:授权和存取控制。服务交互层被用作内部个人空间的通讯。

Gaia也存在一些缺点, 比如Gaia没有处理系统中有多个Age nts共享同一个目标的情况, 对多Agent系统的处理有一定的困难。

(二) Tropos方法学

Tropos方法学使用了代理 (Age nt) 、目标 (Goal) 、规划 (Plan) 、资源 (Resource) 和其他不同知识层次的概念等基本原语, 采用了战略依存模型 (Strategic DependencyModel) 。这个模型把参与者 (Agents, Roles, Positions) , 目标 (Goal) 和参与者之间的依存关系 (ActorDependency) 作为在需求工程早期阶段建模的原始概念。在i*中主要有四种依存关系:目标依存、任务依存、资源依存、软目标 (性能、安全性等) 依存, 如图1:

Tropos把参与者和目标作为最基本的概念应用到了软件开发的全部过程中, 它主要支持软件开发过程的以下五个阶段:1) 早期需求, 这个阶段的输出包含相关参与者和它们对应的依存关系的组织模型;2) 后期需求, 在运行环境、相关的功能和质量范围内描述未来的系统;3) 架构设计, 根据子系统的概念定义全局架构;4) 详细设计, 此阶段, 根据输入、输出、控制和其他相关的信息更具体地定义每个架构部件;5) 实现, 根据详细设计实现系统。

基于Agent技术的Tropos方法同样具有缺点, 此方法缺乏对社会结构和环境的描述, 而且因为支持工具的限制, 其作为一种适合描述的概念更为合适。

四、结论与展望

基于Agent的软件工程提供了有别于当前主流技术 (如面向对象软件工程) 的概念、思想、方法、语言和工具等来支持复杂系统的工程化开发, 代表了一种新的软件开发技术和范型。近年来的研究趋势表明, 面向Agent软件工程将与其他计算机技术之间具有密切的关系, 一方面, 这些研究方向试图将A-gent理论和技术用于其特定问题的解决 (如资源和服务的发现与协同) , 从而对面向Agent软件工程提出了明确甚至是新的要求;另一方面, 通过与这些计算机技术相结合, 拓宽了面向Agent软件工程的应用领域和范围, 为面向Agent软件工程与各种主流技术相结合, 走向大规模、工业化应用提供了应用背景。

参考文献

[1]毛新军, 常志明, 王戟等.面向Agent的软件工程:现状与挑战[J].计算机研究与发展, 2006.

[2]张琳, 钱丽萍.基于Agent的软件工程方法与实践[J].北京建筑工程学院学报, 2006.

Agent方法 篇6

关键词:Agent,创新网络,入侵检测,网络安全

0 引言

随着网络信息技术的快速发展,多Agent的创新网络被广泛应用于各个领域,人们通过多Agent的创新网络进行信息传输和数据存储,多Agent的创新网络的实时信息传输和大容量数据云存储的功能为用户带来极大便利的同时,也为网络攻击者进行信息窃取提供了方便,网络的安全问题受到了人们的极大关注。目前,在由多个代理用户组成的创新网络中,由于网络连通性和路由链路带宽性,导致多Agent的创新网络在数据分发过程中容易出现周期性漏洞和链路反馈溢出,为网络病毒的入侵提供了时隙,需要研究多Agent的创新网络的入侵检测方法,有效实现对病毒的拦截和识别,提高网络安全性能,相关的算法研究受到人们的极大重视。

近年来,对多Agent的创新网络入侵的检测逐渐进入人们研究视野,传统方法中,对网络入侵检测的方法主要有基于幅频分析的入侵检测算法、基于小波分析的入侵检测算法、基于EMD分解的入侵检测算法和基于非平稳信号视频分析的入侵检测算法等[1⁃3]。根据上述算法原理,进行网络入侵检测取得了一定的成果,其中,文献[4]提出了一种多用户MIMO⁃OFDM系统信道信息全反馈策略,进行多Agent的创新网络的病毒入侵检测,将不同用户信息在相互重叠但彼此正交的子载波上同时传输,使每个用户对网络入侵信息的子载波予以反馈,提高检测性能,但是随着Agent用户的增大,系统开销量急速增大,难以实际应用。文献[5]提出了一种基于比特反馈的多Agent用户下的创新网络入侵信息调制机制,从每个子载波信道仅反馈有限的信道信息到发送端实现多Agent用户下的创新网络的入侵特征的分集调度预处理,大大降低了系统反馈链路开销,但该方法存在一定的局限性。文献[6]提出了一种基于信道质量门限的多Agent代理协议MIMO有限反馈方案实现入侵检测,该方案仅在信道质量满足设定值时,才将用户信道反馈给发送端,实现对网络入侵的准确拦截,当用户数较大时,该方案会一定程度上降低多用户分集增益,且受信道状态变化影响较大,降低了网络入侵的准确检测概率。

针对上述问题,本文提出一种基于局部特征尺度的多Agent下创新网络入侵检测方法,最后通过仿真实验进行了性能测试,展示了本文设计的多Agent代理创新网络入侵检测方法的优越性能。

1 多Agent创新网络结构分析与入侵信号模型构建

1.1 多Agent创新网络结构分析

为了实现对多Agent创新网络入侵的准确检测,首先建立多Agent创新网络结构的结构模型,在给定跨平台网络应用支撑层下,多Agent创新网络的结构图采用一个无向图模型G=(V,E)描述,多Agent创新网络的连通图G,V表示网络节点集,V2表示任意两点边集,其中参考节点v为网络代理业务层中任一节点即v∈V,在N条链路中选择质量较好的路由链路边e作为网络中节点负载边即e∈E,对Agent创新网络入侵源在进行网络震荡的包络分析:网络入侵过程为一个非平稳的随机信号植入过程,网络入侵信号的传输模式表示为Ts=KbTf,针对网络节点的负载迁移,利用GS描述攻击对象的结构,网络监测区域是一个边长为M的正方形区域,Agent创新网络的每个簇头节点帧分为N×N单位阵,通过邻居节点多源分布式病植入,实现对Agent创新网络的接入服务的中断,达到网络撞库攻击和拖库攻击目的[7⁃9]。根据上述分析,绘制多Agent创新网络结构下的网络入侵节点分布图如图1所示。

依据图1中多Agent创新网络结构下的网络入侵节点分布情况,在跨平台网络环境中构建多Agent创新网络的病毒入侵模型:假设Agent创新网络的攻击分布式特征位于网络入侵节点分布图的中间层为GZ,GZ=(VZ,EZ),GZ⊆GS。根据链路估计器的分布式模型对攻击链路估计,同时根据入侵节点迁移LEEP帧数确定数据转发时间,采用路由引擎、转发引擎和链路估计器对入侵节点的数据进行收发,并对路由表转换,根据上述分析,建立多Agent创新网络入侵检测总体构架模型如图2所示。

1.2 多Agent创新网络入侵的信号模型构建

在上述进行了多Agent创新网络的入侵的节点分布特征分析和检测系统总体模型的基础上,进行入侵检测的信号处理,建立在噪声背景干扰下Agent创新网络入侵信号模型,假设多Agent创新网络的入侵系统是一个三维连续的MIMO系统,利用网络入侵特征目标函数,将多Agent创新网络的入侵信号转化为一个时变非平稳的随机信号,利用式(1)建立多Agent创新网络入侵的单分量信号模型:

式中:f(t)为多Agent创新网络入侵的单分量主频特征;s=(c-v)/(c+v)为局部特征分解尺度因子;τ为信号的幅值在时频域上进行特征分解的时延,τ=2R/c。利用单分量信号模型获取网络入侵信号的时间和频率之间的关系,进行时频分析,建立时间⁃频率联合分布特征分解模型,获取代表网络入侵信号的伸缩变化的多Agent创新网络入侵的归一化尺度参量,并将g(t)代入,利用式(2)获取网络入侵信号的Hilbert谱:

利用网络入侵信号的Hilbert谱对网络入侵特征的数据序列进行分析,假设多Agent创新网络入侵过程中端点处信息的幅度为A,通过三次样条插值对输入的网络入侵信号进行幅度调整,在噪声干扰下,将H(ω,t)代入,利用式(3)获取网络入侵信号波形:

式中:a(θi)为频谱幅值;n(t)为干扰项,表示一组色噪声向量。假设有M个全方位攻击的网络入侵信号对Agent创新网络进行病毒植入,将网络入侵信号波形输入到频谱的包络端,利用式(4)对网络入侵信号进行特征分解:

完成网络入侵信号的特征分解后,将ωk按照拟合信号的上下包络vk和ek进行局部特征分解。通常多Agent创新网络的入侵信号是短数据信号,采用一个多项式来定义多Agent创新网络入侵信号的瞬时频率q,令q为多项式的阶数,当满足条件:q≥p,且为偶数时,利用式(5)建立多Agent创新网络入侵的信号模型:

式中:多Agent创新网络入侵的相位Φ(t)为均匀时间采样的;τ为时延;ck为分数。以此为基础,进行信号滤波和特征提取,达到入侵检测的目的。

2 网络入侵的抗干扰处理和检测算法改进实现

2.1 网络入侵的抗干扰处理

在上述进行了多Agent创新网络入侵的信号模型构建的基础上,进行网络入侵检测模型设计,本文提出一种基于局部特征尺度的多Agent下创新网络入侵检测方法。在多Agent创新网络中,网络病毒入侵信息隐藏在合法信号中,受到的噪声干扰较大,在信号模型中表现为色噪声干扰,在信噪比较低的情况下难以实现准确的特征提取,需要进行网络入侵的抗干扰滤波处理,本文设计二阶格型匹配滤波器进行干扰抑制,滤波器结构如图3所示。结合图3,进行入侵信号的滤波抗干扰处理,采用局部特征尺度匹配方法进行网络入侵的匹配滤波检测,实现网络入侵检测算法的改进,具体实现过程如下:

假设在多源入侵下多Agent创新网络入侵的复包络信号模型为:

式中:v表示信号的包络插值曲线性;u(t)为双向延拓极大值;ωc为载频(单位为rad/s)。对于存在色噪声干扰下的网络入侵信号,采用宽带波动镜像延拓方法,利用式(8)获取干扰滤波处理后输出的入侵信号的指向性增益:

根据指向性增益获取多Agent创新网络入侵下的单频脉冲响应输出,对输出的干扰抑制前的入侵信号进行EMD分解,将c(v)代入,利用式(9)获取多Agent创新网络入侵的包络特征分解结果:

采用基于镜像的信号双向延拓法得到多Agent创新网络入侵的单频脉冲信号,在t时刻进行幅值衰减匹配滤波,多Agent创新网络入侵的信号过滤模型:

通过幅值调制,化简得:

式中:A(t)为信号的残余量;f0为初始频率,k=B/T为多Agent创新网络入侵状态特征参量的瞬时频率,B为调频信号带宽。通过上述处理,实现了网络入侵的抗干扰抑制,提高了入侵检测输出的信噪比,为提高信号检测性能奠定基础。

2.2 入侵检测算法改进实现

在上述对网络入侵信号进行二阶格型匹配滤波处理的基础上,采用局部特征尺度匹配分解方法进行入侵检测优化设计。在局部特征尺度匹配分解过程中,采用信号包络幅值前向搜索和后向搜索方法,进行局部特征匹配,网络入侵检测的包络幅值搜索过程示意图如图4所示。分析图4可知,多Agent创新网络入侵的局部特征尺度匹配分解的终止条件可以是以下两个之一:当多Agent创新网络入侵信号的幅值能力cn或者信号的残余量rn小于搜索阈值时停止分解;或当信号残余量rn已经为一个单调函数,即继续分解也不可能再分解出更多的局部特征分量。进行频率调制和幅度调制,求解多Agent创新网络入侵信号的非高斯函数极限幅频特性,抵消多Agent创新网络入侵信号的畸变效应,利用式(12)对剔除畸变效应后的入侵信号瞬时频率进行筛选:

在设定的筛选循环次数下,采用类柯西收敛准则进行网络入侵检测的迭代控制,利用式(13)描述入侵检测的信号指标集:

通过上述检测过程可见,多Agent创新网络入侵信号的包络线失真容易产生信号边界控制误差,降低了检测性能,本文采用局部特征尺度匹配将f在时频域D上进行频谱偏移修正,利用本征波特参数对网络入侵信号的输出频率f进行分解:

式中:为多Agent创新网络入侵在包络线上的匹配滤波投影;Rf是投影后的残差信号,将分解出的固有模态函数投影在D中与模式幅度函数进行匹配,实现对Rs的分解,通过k次分解后,实现入侵检测,利用公式(15)获取检测到的入侵信号输出特征:

综上分析,结合局部大波动的筛选终止条件,实现网络入侵检测,得到采用本文方法进行入侵匹配检测的过程图如图5所示。

3 仿真实验结果与分析

为了测试本文设计的基于多Agent的创新网络入侵检测方法的性能,进行仿真实验,仿真实验的硬件环境采用个人PC机,配置参数为:CPU 3.0 GHz,12 GB内存,操作系统为Windows 7。采用Matlab 2011数学仿真语言进行算法设计与实现,采用DDE、TCP库、Active X库进行多Agent的创新网络入侵病毒数据的模拟,系统主程序的编写采用嵌入式Linux内置TCP/IP协议设计多Agent的创新网络链路结构模型。根据上述网络模型设计,进行数据采样,设定多Agent的创新网络中的入侵数据样本数为1 024,对创新网络的收到包数记数值为10 000次,LEEP帧发送者对应的邻居表样本数为2 990,Agent的创新网络入侵信号的中心频率测试为f0=1 000 Hz,单跳传输的离散采样率为fs=10f0=10 k Hz,发送数据的源节点带宽B=1 000 Hz,采样点N=201,其中T=N/fs,匹配滤波器的自适应步长参数μ=0.000 2。首先选取色噪声干扰信噪比为-10 d B的情况进行入侵检测仿真。首先进行原始的入侵信息采样,采用二阶格型匹配滤波器进行干扰抑制,通过4次特征分解匹配,得到输出的网络入侵信号局部特征尺度匹配分解结果如图6所示。

分析图6可知,采用本文算法进行入侵检测,得到特征分解的虚假分量幅值较小,可以进一步提高门限,有效实现对入侵信号的特征提取和识别。采用本文方法和传统方法,进行多Agent创新网络入侵信号的幅值检测,得到检测结果如图7所示。分析图7可知,采用本文方法进行网络入侵检测,具有较好的幅值响应性能,旁瓣干扰得到有效抑制,提高了检测精度,进一步,采用10 000次蒙特卡洛实验进行检测性能分析,得到检测性能曲线见图8。由图8可见,采用本文方法进行网络入侵检测,准确检测概率(Pd)高于传统方法。

4 结语

本文提出一种基于局部特征尺度的多Agent下创新网络入侵检测方法,仿真实验结果表明,采用本文方法进行网络入侵检测,准确检测概率高于传统方法,性能可靠稳定,保障了网络安全。

注:本文通讯作者为佘朝晖。

参考文献

[1]张宗飞.基于量子进化算法的网络攻击检测特征选择[J].计算机应用,2013,33(5):1357-1361.

[2]陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015,42(4):68-71.

[3]张陶.计算机网络安全的入侵检测技术分析[J].山东工业技术,2016(1):136.

[4]PATCHARAMANEEPAKRON P,ARMOUR S,DOUFEXI A.Coordinated beamforming schemes based on modified signal-toleakage-plus-noise ratio precoding designs[J].IET communications,2015,9(4):558-567.

[5]YANG Yunchuan,SUN Cong,ZHAO Hui,et al.Algorithms for secrecy guarantee with null space beamforming in two-way relay networks[J].IEEE transactions on signal processing,2014,62(8):2111-2126.

[6]HUANG Lei,ZHANG Jing,XU Xu,et al.Robust adaptive beamforming with a novel interference-plus-noise covariance matrix reconstruction method[J].IEEE transactions on signal processing,2015,63(7):1643-1650.

[7]张辉.自体集网络攻击检测中的高效寻优算法仿真[J].计算机仿真,2013,30(8):297-300.

[8]章武媚,陈庆章.引入偏移量递阶控制的网络入侵HHT检测算法[J].计算机科学,2014,41(12):107-111.

Agent方法 篇7

相关资料显示[1],仅2011年国内机场起降航班比2010年增长14. 3% ,共计553. 2万架。然而频繁出现的航班延误,对机场和航空公司造成了巨大的经济损失。据统计[2],机场地面服务调度失误是机场航班延误的主要原因之一,飞机地面服务是机场调度的重要环节。

软件Agent技术可以追溯到Hewitt’s Actor Model,其目标是解决大型复杂问题[3]。复杂问题的解决依赖于每一个Agent积极、主动、独立、高效地完成自己的任务。并且多Agent系统( MAS) 具有社交能力,每一个Agent通过Agent语言进行交流合作,以表现出目标导向行为[4,5]。

Dantzig和Ramser于1959年首次提出带有时间窗车辆路径问题VRPTW( vehicle routing problems with time windows)[6,7]。 VRPTW属于强NP问题,机场地面服务车辆调度问题可以看作VRPTW。

MAS所具备的复杂问题求解特性能力比较适合机场服务车辆调度问题的特性,因此,本文尝试将MAS与启发式方法中的最近插入法结合并改进,使其能够满足机场地面服务时间窗和车辆容量限制以及多样性的需求,从而实现对带时间窗非满载机场地面服务车辆多回路作业问题的求解。

1问题描述及模型建立

1. 1问题描述

机场地面服务主要通过一些不同类型的服务车辆在飞机起飞前完成包括加油、加水、货物行李装卸、配餐、清洁等一系列飞机地面保障服务,以保障后续飞行任务正常进行。如图1所示。

抽象出主要服务流程图,如图2所示。

1. 2多Agent模型

MAS的主要思想是将一个实体解决的复杂问题划分为多个实体解决的小问题。因此可以将上述复杂服务划分为多个小的任务,并且分配给多个Agent以解决上述复杂服务。

( 1) Flight Agent( 飞机需求控制) :

A. 飞机需要哪些服务,服务涉及车辆

B. 每个飞机的每个服务时长,需求量转化统一

C. 每个飞机的每个服务作业的最晚开始时间

D. 飞机的位置信息

E. 与Manager Agent进行信息交互

( 2 ) Manager Agent ( 总体控制)

A. 根据Flight Agent的需求信息调配Truck Agent

B. 根据Truck Agent的服务信息控制Flight Agent

( 3 ) Truck Agent ( 服务车控制) :

A. 服务车的当前位置信息

B. 服务车的当前运载能力

C. 服务车的当前服务状态

D. 计算服务车的服务次序

( 4 ) Message Agent ( 消息控制) :

A. 各个Agent之间的通信信息

B. 数据库的并发控制

其结构如图3所示 。

1. 3地面服务车辆模型

根据机场地面服务车辆的定制需求、时间约束以及空间约束建立如下服务车辆模型:

将服务中心与停机位以点i( i = 0,1,2,…,n) 表示,服务中心编号为0。以c( c = 1,2,…,m) 表示服务种类。以qci表示停机位i对服务c的需求量。以uc( uc= 1,2,…,pc; c = 1,2,…,m) 表示提供服务种类c的车辆数。以luc表示服务车辆uc的最大载货量。以dij表示停机位i和停机位j之间的距离。以tucij表示服务车辆uc由停机位i到停机位j的时间。以Suci表示服务车辆uc由到达停机位i的时刻。以Wuci表示服务车辆uc停机位i等待时间。以ric表示为停机i位对服务种类c的需求时间。开始时间需在一定的时间范围[aic,bic]内,其中aic表示服务类型c的最早开始时间,bic表示服务类型c的最晚开始时间,因此aic≤ suci≤bic。如果服务车辆uc到达停机位i的时间早于aic则服务车辆uc需等待,晚于bic则停机位i的服务c需延迟。

定义变量:

目标函数:

约束条件:

在上面模型中,式( 1) 为目标函数,Z1表示服务车辆总运行距离最短,并且满足所有约束条件; 式( 2) 为目标函数,Z2表示对于服务类型c由服务中心发出的服务辆车最少,并且满足所有约束条件; 式( 3) 表示服务车辆绝对不允许超载; 式( 4) 表示停机位的服务类型c只能由一辆车来完成; 式( 5) 表示对于停机位点服务类型c必定有某一服务车辆来自另一停机位点完成其服务,其中只有一辆服务车完成其服务; 式( 6) 表示对于停机位点服务类型c必定有某一服务车辆去向另一停机位点完成其服务,同时只有一辆服务车完成其服务; 式( 7) 能够避免出现与非服务中心相分离的路线; 式( 8) 表示从到达停机位i到停机位j时服务车辆uc所用的总时间; 式( 9) 表示停机位的服务类型c开始时间范围。

2算法的基本原理

2. 1 MAS调度基本原理

MAS负责整个服务流程的调度。因此对各个Agent的主要责任进行明确分配。

Flight Agent: 责任是循环地监控停机坪的上的飞机对各个服务的需求。一是当有新的飞机到达时会统计该飞机的需求服务类型、服务需求量统一转化、服务最早开始时间、服务最晚开始时间; 将该统计信息发送给Message Agent,同时发送给Man- ager Agent一条新增信息。二是接收Manager Agent发送来的服务完成信息。

Manager Agent: 主要责任一是当收到Flight Agent发来的新增信息时,会发送一条查询信息给Message Agent,将所有未完成的服务分类统计,将该统计信息发送Truck Agent。二是对已过最晚开始服务时间的停机位发出警告信息给Truck Agent。三是对Truck Agent发送过来的服务完成信息进行统计,并将统计信息发送给Message Agent和Flight Agent。

Truck Agent: 主要责任一是根据Manager Agent发来的信息计算服务次序。二是统计所有服务车辆的状态信息并将该信息发送给Message Agent。 三是发送给Manager Agent已完成的服务信息。

Message Agent: 主要责任是根据其他Agent的发来的需求信息进行消息、 数据库的维护。如图4所示。

解释:

A: 新增飞机服务的统计信息

B : 新增信息

C : 查询信息

D : 未完成服务的统计信息

E : 已完成服务的统计信息

F : 已完成服务的统计信息

G : 已完成服务的统计信息

H: 所有服务车辆的状态信息

2. 2服务车辆调度基本原理

Rosenkrantz和Stearns在1977年提出一种启发式算法: 最近插入法。被用于解决旅行商问题TSP。

由最近插入法,可得:

它表示把停机位pk插入到停机位i和停机位j之间路径长度的增量。

要解决复杂的机场地面服务车辆调度问题,不仅需要在插入点时考虑服务车辆的载货量约束,同时还要考虑服务点时间窗的约束。

以sucj表示服务车辆uc从到达停机位i时刻到达停机位j的时刻:

若sucj< aic,则服务车辆uc在j处等待; 若sucj< bic,则停机位处服务任务需要推迟。

特别地,各停机位服务的初始开始时间为:

以EFcj表示服务车辆抵达停机位j的时间比原路径上服务车辆到达停机位j的时间的提前量( 或推迟量) ,在连接停机位i和停机位j所在的路径后。因此EFcj可由下式得出:

从上式可以看出,EFcj> 0时,连接后停机位j的服务种类c开始时间推迟; EFcj< 0时,连接后停机位j的服务种类c开始时间提前; EFcj= 0时,连接后停机位j的服务种类c开始时间不变。

由于机场地面服务要求,所有服务不允许推迟。因此在调度算法中服务车辆必须早于bic; 即: sucj≤bic。

3算法的实现步骤

3. 1 MAS算法步骤

MAS算法解释( 如图5所示) :

A: 检测输入服务信息包括停机位、服务类型、服务数量( 统一转化) 、最晚开始时间

B: 接收停机位服务信息分类整理包括格式化服务信息并发送数据给Mes- sage Agent、发送新增信息给Manager Agent

C: 写入数据库

D: 接收新增信息

E: 服务信息分类统计

F : 读取数据库

G : 计算服务顺序

H: 判断是否有晚于最晚开始时间还未开始的服务

I : 统计车辆信息

J : 写入数据库

3. 2服务车辆调度算法实现步骤

1) 找到离停机位p0i距离最近的停机位pm,形成一个子回路,T = { p0,pm,p0} 。

2) 在剩余的停机位中,寻找一个离子回路中某一停机位最近的停机位pk。计算子回路和pk的总货运量Luc,若Luc> Luc, 则转调步骤1) 寻找其他回路; 否则,继续步骤3) 。

3) 计算将pk插入到子回路计算各个路径长度的变化量, 并将这些变化量定义为数组,令M = { h( i,j) } 。

4) 将M中h( i,j) ,由小到大的顺序排序。

5) 若M = Ø则转到步骤1 ) 。否则,取出M中的第一项h ( i,j) ,将pk插入到停机位i和停机位j之间,如果suck∈[akc, bkc]则继续步骤6) ; 否则M = M - h( i,j) ,转调步骤5) 。

6) 计算EFcj,如果EFcj≤0则转调步骤7) ; 否则M = M - h ( i,j) ,转调步骤5) 。

7) 计算服务车辆到达各停机位的新时间,将停机位pk加入到子回路中,用两条新的路径( i,k) ,( k,j) 代替原来的路径( i,j) 。

8) 直到所有的停机位都加入到子回路中,否则跳转到步骤2) 。最终得到的多条子回路即是问题的解。

4应用举例

有20( i = 0,1,2,…,20) 个停机位( 0为服务中心) ,每个停机位最多有6( c = 1,2,…,6) 项服务任务,各项服务的需求量qci( 单位: t) ,服务时间yic( 单位: m) 以及要求每项服务开始执行时间范围[aic,bic]( 单位: 时刻) 由表1给出。这些服务由服务中心发出最大容量luc( uc= 1,2,…,pc; c = 1,2,…,6) 都为20 t不同类型的服务车辆来完成。服务中心与各个停机坪间的距离dij( 单位: km) 由表2给出。假设服务车辆的平均行驶速度为30 km / h,行驶时间与距离成正比,则停机位i到停机位j的行驶时间为tucij= dij/30。本文服务车辆调度方法与一对一调度服务对比,结果由表3、表4给出。表中字母意义见第2、3节地面服务车辆模型。

由结果可见该调度方法能够实现机场在高峰时期对地面服务车辆的调度。并且所用车辆总数平均减少65. 5% ( 其中服务1使用车辆数减少63. 6% ,服务2使用车辆数减少63. 6% ,服务3使用车辆数减少66. 7% ,服务4使用车辆数减少66. 7% ,服务5使用车辆数减少66. 7% ,服务6使用车辆数减少66. 7% ,) ; 服务车辆总运输距离平均减少48. 3% ( 其中服务1所用车辆运输距离减少49. 6% ,服务2所用车辆运输距离减少50. 8% ,服务3所用车辆运输距离减少48. 2% ,服务4所用车辆运输距离减少38. 4% ,服务5所用车辆运输距离减少53. 3% ,服务6所用车辆运输距离减少48. 6% ) 。

5结语

Agent方法 篇8

随着科技的极大进步, 国际交流与竞争日益增强。基于经济发展和军事航天业的需要, 国内外对机器人技术的研究越来越重视。美国、日本、韩国曾在机器人研究方面制定专门的研究计划。我国也在国家高技术研究发展计划、国家自然科学基金、国家科技重大专项等规划中对机器人技术研究给予了极大重视[1]。机器人技术是未来高技术、新兴产业发展的基础之一, 对于国民经济和国防建设具有重要意义。

装配和检测机器人系统是众多机器人研究方向的一支, 也是工业机器人, 用于工件拆装, 包括物流、装配、测量、视觉检查、速度约束、碰撞检测等多个方面[2]。不仅可应用于工业生产, 服务于经济建设, 随着技术的进步, 机器人智能化、高精度、高速、网络化的特点将使其应用于日常生活, 甚至航天、军事作业等领域。目前, 工业机器人广泛应用于汽车工业的点焊、弧焊、喷漆、热处理、搬运、上下料、装配、检测等工业。在物流、码垛、食品和药品等领域, 工业机器人也正逐步代替人工从事繁重枯燥的包装、码垛、搬运等作业。但往往仅限于单一的简单作业, 而随着工业产品复杂性、精密性的提高, 对生产过程也提出了更高要求。高效与成本使得装检作业机器人这种一体化, 复杂控制的需求越来越突出。

不同的作业环境和需要, 使得某些装检作业任务过程复杂, 步骤繁琐, 由单个机器人难以完成, 必须借助多个各自具有一定智能的机器人协作实现, 其中运用多Agent相互协调配合的思路构建系统是一种业界长期研究的热点。这种复杂任务作业机器人是由多个异构Agent组成的机器人系统, 此系统要完成一整套的装配和检测作业任务, 必然会遇到多Agent间的任务分配, 相互协作机制的问题[9,10,11,12]。在实际应用背景中, 系统与其他具有较大灵活性与自由度的机器人 (比如足球机器人) 不同, 该机器人系统需要完成超精密的 (配合精度在10um级) 作业需求, 按照严格的操作规程完成特定的作业任务。需要极高的准确性、安全性, 同时要保障一定的高效性。另外, 这一复杂系统涉及到系统控制、计算机、仿真、人工智能等学科知识, 难以用单一的控制软件来全面刻画与实现。目前的多Agent系统大都是控制系统与仿真系统分离, 本文在多Agent系统中引入平行控制的思想, 将实际作业系统与人工系统融合, 通过实际与人工之间的虚实互动, 以平行执行的方式对装检系统的运行进行有效地控制和管理[3,6]。

1 平行控制

1.1 ACP方法

ACP方法中, A是指人工系统 (Artificial Systems) , C是指计算实验 (Computing Experiments) , P是指平行执行 (Parallel Execution) 。ACP是指人工社会、计算实验、平行执行的有机组合[4], 即:

ACP=Artificial societies+Computational experiments+Parallel execution

ACP方法是将人工的虚拟空间Cyberspace变成我们解决复杂问题的新的另一半空间, 同自然的物理空间一起构成求解“复杂系统方程”的完整的“复杂空间”。ACP方法分三步完成:首先, 利用个人工社会或人工系统对复杂系统进行建模;一定意义下, 可以把人工社会看成是科学“游戏”, 就是用类似计算机“游戏”的技术来建模;然后, 利用计算实验对复杂系统进行分析和评估;一旦有了针对性的人工社会, 我们就可以把人的行为、社会的行为放到计算机里面, 把计算机编程一个实验室, 进行“计算实验”, 通过“实验”来分析复杂系统的行为, 评估期可能的后果;最后, 将实际社会与人工社会并举, 通过实际与人工之间的虚实互动, 以平行执行的方式对复杂系统的运行进行有效地控制和管理。

1.2 平行控制

平行控制是在ACP方法的基础上, 实现实际物理过程与人工计算过程之间的平行交互, 即Physical vs.Cyber系统之间的Parallel[3,4,5]。如图1所示, 平行控制是将实际问题向虚拟空间扩充之后, 通过虚实互动完成控制任务的一种解决问题的方式。

平行控制思想的核心就是针对复杂系统, 构造其实际系统与人工系统并行互动的平行系统, 目标是使实际系统趋向人工系统, 进行借助人工系统使复杂问题简单化, 以此实现复杂系统的控制与管理。裝检作业机器人系统要进行部件控制、视觉识别、操作仿真等关键环节, 各种作业的协调控制与管理是整个系统的关键, 引入平行控制的思想后, 虚拟出视觉识别系统、操作仿真系统、修正系统几个虚拟系统, 通过实际系统与虚拟系统的交互来完成整个过程作业, 并保证系统的安全、可靠、高效。

2 平行控制系统

2.1 系统结构

整个系统由实际作业系统和人工作业系统组成, 通过实际作业系统与人工系统的平行交互来实现整个系统的总体协调控制, 如图3所示。其中人工作业系统包括视觉识别系统、仿真系统和修正系统。

视觉识别系统可对部件进行扫描定位、方向识别、工件测量、完整性检查等。可以帮助实际作业系统处理部件位置方向识别、操作臂定位、移位错误修正、部件检查等问题[14,15]。如拧紧机构需要持工具对一个特定工件进行拧紧操作时, 首先需要移动至目标件位置, 然后后通过视觉系统识别目标件的特征方向, 确定基本特性和方向后用作业工具配合进行拧紧。视觉识别系统不仅能够保证系统顺利进行, 而且能够完善系统对于精密度的要求。

仿真系统能够进行各个操作步骤的仿真, 在仿真系统运行某个步骤或作业无误后, 再进行实际作业系统的操作, 确保了实际作业系统的安全性。另外, 仿真系统服务与系统学习功能, 与修正系统一起寻求更高效、安全的作业方案。

修正系统在系统遇到故障时, 可通过学习算法对故障进行诊断, 并寻找更好的解决方案。修正系统维护一个方案库, 该方案库存储相应故障的解决方案, 一旦人工作业系统或实际作业系统遇到故障, 即向修正系统申请解决方案, 修正系统首先在方案库中寻找相应的解决方案, 若有, 则首先通过仿真系统模拟解决故障, 如成功则使用此方案处理故障, 如不成功, 重新寻找解决方案;若方案库中没有相符合的解决方案, 则修正系统通过修正算法或人工参与的方法生成新的解决方案, 在新方案得到验证后将其存入方案库。

在此系统结构基础上, 利用平行系统可以实现[4,5,6,8]:

对有关人员和系统的学习培训。人工系统在此过程中主要被用作学习和培训。通过人工系统与实际系统的连接互动, 可以使有关人员快速熟悉了解系统, 也可使系统通过学习更加完善。

对相关操作和决策的实验的分析。人工系统在此过程中主要被用来进行计算实验, 分析相关操作的优化程度, 实验多种决策的效率和合理性。

对实际系统管理和控制。人工系统试图尽可能地模拟实际系统, 对其行为进行预估, 从而为寻找对实际系统有效的解决方案或对当前方案进行改进提供依据。进一步, 通过观察实际系统与人工系统评估的状态之间的不同, 产生误差反馈信号, 对人工系统的评估方式或参数进行修正, 减少差别, 并开始分析新一轮的优化和评估。

2.2 系统控制方法

将复杂系统中的单个作业单元抽象为不同功能的Agent。其中视觉、仿真、修正及实际作业等几个平行系统均涉及多个Agent。根据角色和完成任务的不同, 多个Agent具有不同的角色和功能, 其中负责任务接收并分配的Agent称为管理Agent。通过管理Agent的控制进行平行作业任务分解。首先任务被管理Agent分解为多个大的指令序列, 指令序列进入仿真Agent进行安全性及合理性验证, 未经过验证的指令均是虚指令, 虚指令经过验证后成为实指令, 下达至实际作业系统进行操作执行。系统结构如图4所示。

仿真系统可有多个仿真程序, 各自处理一个相对独立的虚指令序列, 多个虚指令序列验证后, 依次进入实指令序列 (如图5) , 多个仿真程序并行执行, 提高了虚指令处理速度, 减少了因虚指令未验证完, 实际系统等待的时间。

2.3 Agent协作方法

本文系统中的工作Agent的思维方式和行动都是独立的, 其不依赖于其他工作Agent, 当管理Agent调度一个虚指令进入实指令序列时, 将公布竞争消息, 所有工作Agent会读取此消息并参与竞争, 通过指令竞争来达到Agent间的相互协作, 保证系统安全并实现效率最大化。

工作Agent间通过竞争函数score (ag, task) 来实现竞争[7], 确定由哪个Agent完成此指令任务。竞争函数score (ag, task) 表示某Agent对于接受指令task的评分。此评分与以下几个因素有关[13]。

因素1 Agent的状态usable (ag) :Agent的状态是影响其竞争的关键因素, 若设备处于损坏状态或正在执行其他任务, 则都不可再执行其他指令, 直到其被修复或完成其它任务, 处于空闲状态。

因素2 Agent的能力向量⋃task。只有具有相应能力的Agent才能完成某项任务。

因素3历史竞争成功次数runn (ag, task) :ag是否曾承担过task这项任务将对系统的安全有影响, 我们认为承担过此任务的Agent会更有经验。

因素4历史执行此任务失败次数failn (ag, task) :ag执行task任务历史失败次数越多, 此Agent承担此任务的安全系数越低, 相应的竞争函数得分应更低。

因素5运行成本cost (ag, task) :表示ag执行任务task所需要的资源成本。

其中risk (ag, task) 为ag执行任务task的风险系数。

将竞争得分score (ag, task) 作为竞争任务的主要依据, 算法如下:

步骤1:管理Agent发布虚指令序列中首位的任务竞争消息;

步骤2:等待所有工作Agent提交竞争得分score (ag, task) , 若score (agi, task) =0, 即目前没有任何工作Agent可接受此任务, 则将此指令挂起;

步骤3:管理Agent将所有的竞争得分按从高到低排序, 共有m个Agent得分最高;

步骤4:若m=1, 则给task分配此得分最高的Agent, 转到步骤6;

步骤5:若m>1, 则根据Max (runn (agi, task) ) 决定哪个Agent竞争成功;

步骤6:管理Agent向竞争成功的工作Agent发送成功消息, 并准备将此虚指令转入实指令序列;

步骤7:结束。

此竞争机制的引入旨在保证系统的安全性, 提高系统的执行效率。此竞争方法用于虚指令向实指令的转化, 当虚指令不违背指令序列且通过竞争函数能够找到执行此指令的Agent, 则虚指令才转化为实指令, 进入执行阶段, 此阶段的验证既保证指令执行顺序, 又保障了执行的安全性和高效性。

2.4 故障处理

在系统运行过程中, 可能存在如突然断电、工件未到位或者工件错位导致碰撞等情况。为了确保系统的安全精确, 修正子系统可对这些故障进行处理, 以保障整个系统的鲁棒性。修正子系统维护一个方案库, 当系统遇故障时, 首先分析故障类型, 查找方案库, 看是否有对应的解决方案。若没有, 则通过修正算法或人工参与的方法生成新的解决方案;若有, 则选中方案库中对应的解决方案。在仿真子系统中运行该解决方案, 仿真模拟解决故障, 如果成功, 则使用该方案处理故障。另外, 如果该方案是方案库中没有的新方案, 则更新方案库, 将此方案存入方案库。如果仿真子系统中模拟处理故障不成功, 则重新查找方案库寻找解决方案, 故障处理流程如图6所示。

在查找方案库时, 如遇不止一种解决方案时, 根据方案等级排序, 首次选择等级较高的方案。如果不能解决故障, 再依次尝试其他方案。对于方案等级的设置, 可以依据方案使用次数、方案建立时间等多种方法。

当遇到方案库中没有相应的解决方案时, 系统提供两种生成新方案的方法:一种是算法自动生成, 实现了系统的自动化。对于算法的优化, 可以提高修正方案的效能;另一种生成新方案的方法是人工参与, 这种方法为安全高效地处理较复杂的故障提供可能。

2.5 平行控制虚实交互

仿真子系统根据模型环境、任务流程计算并建立人工作业系统的工序模型、潜在故障环境, 作为实际作业系统任务操作的参考基础, 从而为“虚实”互动对实际作业系统进行平行管控提供基础。仿真子系统可以作为装载作业的实验室, 对各种装载作业流程和装载过程中出现的故障进行试验, 寻找合理的工序流程和故障方案, 从而保障实际系统的安全高效运行。

视觉识别子系统提供另一个虚实互动的接口, 主要为实际作业系统、仿真子系统和修正子系统服务, 提供工件坐标定位、角度识别、完整性检查、大小测量等功能。视觉识别子系统采集实际环境中的任务状态信息反馈给人工系统, 使得人工系统的环境更加接近实际系统, 通过这种“虚实”互动提高了人工系统对于实际作业系统的参考价值。

3 验证过程

本文从某项目任务中的装培和检测系统中截取一段作业对系统进行了实验。子任务是要完成小车装载需要拆检的部件运至指定位置, 并对部件进行拆解封盖。该任务在完成过程中首先要小车承载部件运动到制定位置, 然后在此位置上进行拆解操作。执行这段任务的过程中需要用到小车、三维运动平台、视觉、拧紧等机构, 这些机构需要在智能体的控制下独立且相互协调下完成任务, 作业过程中所需要的Agent如表1所示。

此段作业分为五个小任务, 每个小任务由多个Agent协作完成:

(1) 小车将需要拆检的部件运至指定位置。

Car Move To (x, y, z)

(2) 利用三维位移Agent和拧紧Agent将螺母拧松, 此期间需要视觉Agent进行定位配合 (图7) 。若初次定位错误或有偏差, 此间还需要修正Agent进行形成修正方案, 对误差进行调整。

Twist (nut, 4, loosen)

(3) 利用三维位移Agent和拧紧Agent将四个压板拨开, 使其不再阻挡缸盖打开。此步骤也需要视觉Agent的定位协作。

Twist (plate, 4, loosen)

(4) 视觉Agent识别提手的方向后, 利用三维位移Agent将盖子提起放至指定位置。

3D-ag Move To (x, y, z)

利用3.3中的agent之间的协调方法, 在此段作业中系统运行状态如表2所示。

对于多Agent间如何协作, 以第2步中拧紧机拧松螺母为例。视觉定位四个螺母位置后, 管理Agent先后公布4条虚指令Twist (nut, 4 (i) , loosen) , 各Agent首先竞争拧紧第一个螺母的指令, 根据竞争函数式 (1) 和 (2) 各Agent计算自己的竞争得分, 因为只有twist-ag才具有拧紧能力, 因此其他Agent的score值均为0, 而四个拧紧Agent具有此能力, 根据实际历史数据计算, 它们的得分分别为:0.1, 0.1, 0.1, 0.1。因为四个拧紧Agent尚未有过故障, 没有执行失败的记录, 且均处于空闲状态, 因此得分相同。因此根据历史执行此任务的次数 (40, 39, 23, 25) 决定由第一个拧紧Agent执行第一个螺母的拧紧操作。拧紧第二个螺母竞争时, 第一个拧紧Agent的usable (ag) 为0, 所以选择的是第二个拧紧Agent, 同理, 执行第三、四个螺母拧紧操作的分别为第四, 第三个拧紧Agent。

4 结论

面对目前大数据、物联网、云计算等数字化的现实背景, 为多机器人系统联合控制完成复杂任务提供了更广泛的途径, 要求控制系统从理论到工程必须进一步加快向计算化、网络化、智能化方面的发展与深化。本文提出的基于平行控制的异构多Agent机器人系统控制方法就是这方面的一个尝试, 应用平行控制的思想建立一个装检作业平台, 通过人工系统与实际系统的交互, 使电脑的计算能力与人脑的灵活能力有效结合, 实现了一个复杂系统的合理管控。

摘要:复杂系统控制过程往往需要人综合控制系统、仿真系统, 以及人在回路综合实现。构建基于多agent机器人系统及其实现策略, 是多机器人系统研究和解决现实问题的热点。本文基于多部件综合作业机器人项目, 针对不同作业机器人, 提出一种异构多Agent机器人系统控制方法, 此方法引入ACP理论的思想, 将平行控制方法应用于机器人综合作业平台, 通过人工系统与实际系统的虚实互动, 使电脑的计算能力与人脑的灵活能力有效结合, 实现了一个复杂系统的合理管控, 为多机器人协作完成实际复杂控制系统提供了一种保证系统可靠性基础上提高效率的可供借鉴的理论和实现方法。

Agent口碑辩论模型研究 篇9

商务谈判在全球经济发展中显得日益重要。借助分布式和灵活、自治等人工智能优势,Agent能帮助谈判方更好更快达成一致,因此Agent谈判已经成为商务谈判的研究重点和热点之一[1]。

传统的Agent谈判研究采用博弈论[2]和启发式[3]的方法,要求Agent具有完全谈判信息,难以适应动态谈判环境。融入了辩论的Agent谈判(以下简称为辩论)允许Agent 在谈判过程中提供自己接受或者拒绝提议的论据,并通过辩论的方式影响对手的谈判偏好[4,5,6,7],因此能较好解决该问题。

口碑是指信息传递者与信息接收者之间,通过面对面或经由电话所产生的信息沟通行为[8]。口碑的传播过程就是信息交流的过程。由于口碑具有高可信度、双向、更具活力和信息受干扰的影响小等诸多特点,因此在Agent辩论中具有相当重要的作用[9,10,11]。

相关研究中,文献[4]提出了Agent辩论中常用的威胁、奖励和申辩的形式化模型;文献[5]基于经济学中的多属性效用理论,借助对信念修正算子这一工具的计算和比较,对信念进行量化和排序,提出了一种辩论式的多Agent多议题协商方法;文献[6,7]对文献[4]的研究进行了改进,提出了一种较为有效的算法。文献[9,10,11]对人与人之间的口碑及其传播进行了量化研究,并提出了相应模型。文献[12]提出了一种基于Agent的模拟方法,对新产品的口碑如何在消费者的信息网络中传播进行了建模和仿真;文献[13]对口碑在Agent社会网络中的学习方面进行了一定程度的研究,提出了相应的模型;文献[14,15]结合博弈论、定位理论和启发式的方法,通过对口碑传播开始节点的选择,提出了作为负面口碑的谣言如何在Agent社会网络中传播的相应模型。

纵观以上文献,都还没有系统研究口碑传播对Agent辩论的影响。因此,本文拟在文献[4]的基础上进行研究,提出Agent口碑辩论模型,并对其进行验证。

1 Agent口碑辩论模型

Agent口碑辩论模型着重考虑口碑在Agent辩论中的效用,而效用的有效性需要通过一定的评价机制来说明。因此,为更好阐述该模型,同时保证模型的整体性,先将模型划分为描述和评价两个主要部分,从这两个角度对模型进行阐述。此外,在建立该模型之前,还应先对口碑进行分类,将其分为正面口碑和负面口碑:正面口碑可以给Agent辩论带来促进双方合作的正面效应,负面口碑则会给Agent辩论带来阻碍双方合作的负面效应。并且,根据谈判中的议题不同,还可以对正面口碑和负面口碑进一步分类。例如,对于价格口碑,可以分为正面价格口碑和负面价格口碑两种。

1.1 模型的描述部分

为更好阐述模型,先假定2个Agent之间即AgentaAgentb正在就某商品交易进行谈判,但前者的提议与后者的期望相差较远,谈判陷入了僵局。此时,为了节约谈判成本,提高谈判效率,实现合作,AgentaAgentb提出带有辩论的提议,辩论中除了包括文献[4]所提出的辩论策略外,还包括其他Agent对Agenta的口碑,该辩论提议可形式化表示为:

P(ab)={a,b,s,w}

该模型中,各元素的解释如下:

(1) a表示辩论方,即Agenta;

(2) b表示被辩论方,即Agentb;

(3) P(ab)表示AgentaAgentb提出的辩论;

(4) s表示AgentaAgentb提出的辩论策略,例如奖励或威胁等,且ssb

由于整个辩论过程是交互和对称的,因此Agentb也可能向Agenta提出相应的带有口碑的辩论。即:

P(ba)={b,a,s,w}

也就是说,模型的描述部分具有一定的通用性。但是,模型中的变量所属集合需要作相应修改,即ssa

1.2 模型的评价部分

以上讨论的是在2个Agent之间谈判出现僵局时,其中一个Agent为促进双方合作而做出的考虑口碑的辩论提议,但该模型应同样适用于多个Agent之间的辩论。而在多Agent辩论中,为体现该类辩论的有效性,需要对如何对该类辩论评价进行量化和分析比较,即模型的评价部分。

为简化研究,假定Agenta,Agentb,Agentc正在就某商品交易,Agenta,Agentb为该商品的买方,Agentc为卖方。Agenta,Agentb的购买条款都与Agentc的销售期望相差较远,Agenta,Agentb又都希望Agentc尽快同意其购买条款,因此Agenta,Agentb都向Agentc提出带有口碑的辩论。

此时,Agentc同时要对AgentaAgentb所提出的辩论做出比较和选择。以AgentaAgentc的辩论为例,相应的评价为:

E{P(ac)}=E(aλ(a)+E(sλ(s)+E(wλ(w)

该评价中,各元素的集合均属于Agentc,并且:

(1) E{P(ac)}表示在AgentcAgenta所提出的辩论的评价值;

(2) E(a),λ(a)表示AgentcAgenta本身的评价值和相应的权重值;

(3) E(s),λ(s)表示AgentcAgenta所提出辩论中的策略的评价值和相应的权重值;

(4) E(w),λ(w)表示AgentcAgenta所提出辩论中的口碑的评价值和相应的权重值。

由于本文的研究重点在于考虑Agent的口碑辩论模型及评价,因此,重点研究该评价部分中的E(w)值该如何计算。为此,先对Agent口碑辩论力度进行定义:

定义1 Agent口碑辩论力度 在Agent辩论过程中,其中一方Agent采用考虑口碑的辩论方式促使另一方Agent尽快与其合作,该Agent为评价此辩论而对该口碑进行量化,计算的值称为Agent的口碑辩论力度,即上述评价中的E(w)。

同理,关于E(w)的计算,以交货期、价格和质量三方面因素为例,可得具体计算公式如下:

E(w)=E(dλ(d)+E(pλ(p)+E(qλ(q)

(1) E(d),λ(d)表示AgentcAgenta在交货期口碑方面的评价值和相应的权重值;

(2) E(p),λ(p)表示AgentcAgenta在价格口碑方面的评价值和相应的权重值;

(3) E(q),λ(q)表示AgentcAgenta在质量口碑方面的评价值和相应的权重值;

在上述计算公式中,如该项口碑为正面口碑,相应的评价值为正,如该项口碑为负面口碑,相应的评价值为负。此外,该部分对Agentb也同样适用,即具有通用性,而且除交货期、价格和质量外,如考虑其他因素,也可根据此评价部分同理相加得到。

2 算例和分析

为验证以上模型的有效性,假定以上Agent谈判场景中,Agenta,Agentb,Agentc所提出辩论的策略中包括奖励和威胁两种,辩论的口碑中包括交货期、价格和质量三个指标,算例中拟定的值为1—10之间的整数,权重拟定的值为0.1-1之间的一位小数。

首先,拟定AgentcAgentaAgentb的各项口碑评价值及相应权重值,见表1和表2所示。

AgentcAgenta所提出辩论中的口碑辩论力度为:

E(w)=3×0.5+6×0.3-5×0.2=2.3

AgentcAgentb所提出辩论中的口碑辩论力度为:

E(w)=4×0.4+5×0.2-4×0.4=1

在此基础上,假定AgentcAgentaAgentb自身的评价在于以往交易次数,同时假定Agenta提出的辩论中的策略为奖励,Agentb提出的辩论中的策略为威胁,给出相应的评价值和权重值,见表3和表4所示。

AgentcAgenta所提出辩论的评价值为:

E{P(ac)}=3×0.3+2×0.2+2.3×0.5=2.45

AgentcAgentb所提出辩论的评价值为:

E{Ρ(bc)}=2×0.5+3×0.3+1×0.2=2.1

可见E{P(a→c)}≻E{P(b→c)},Agentc认为Agenta提出的口碑辩论比Agentb提出的口碑辩论说服力度大,因此选择Agenta完成交易。结果表明,Agenta辩论成功,Agentb辩论失败。

3 结 语

以往研究虽然在口碑传播方面做了相当的研究工作,但计算较为复杂,不利于Agent辩论功能的充分发挥,也较难得到验证。相比之下,Agent口碑辩论模型更进一步考虑了Agent如何模拟人类理性思维谈判,而且模型复杂程度低,但通用性和实用性强,同时更具一般性。本文所提出的模型是对口碑在Agent辩论中的作用及影响的初步探索。下一步将进一步考虑时间等其他因素对Agent口碑辩论模型的影响。

摘要:基于辩论的Agent谈判能提高Agent在动态环境下的谈判效率,保证谈判效果。口碑则能强化辩论效果。为保证模型的整体性,将对Agent口碑辩论模型的阐述分为描述和评价两个部分;对口碑进行分类,结合形式化理论,提出Agent口碑辩论模型的描述部分;提出口碑辩论力度的概念,并对其进行量化,提出Agent口碑辩论模型的评价部分;最后通过算例对模型进行验证。

上一篇:创新教学思路与模式下一篇:产后出血的防治及护理