动态路径规划(精选9篇)
动态路径规划 篇1
建筑物内发生重大突发性事故(如火灾、爆炸以及人员拥挤踩踏等)将给事故现场人员的生命安全带来极大的威胁。在现有的物质设施基础上,选择最优撤离路径,动态调整疏散方案是避免和减轻人员伤亡的有效途径。目前,我国的建筑设计防火规范对安全疏散楼梯的数量、到达楼梯的距离、楼梯的宽度、防排烟设施、内部装修材料等都做了明确的规定。但是由于火灾等突发事件具有极强的不确定性,造成建筑疏散结构的重大改变在所难免,确定动态的安全疏散路径具有十分重要的意义。
笔者以系统优化理论为指导,以动态规划为手段,建立安全疏散路径和人员分流的网络模型,对安全疏散预案的制定提供技术支持。
1 动态规划原理及模型
动态规划是解决多阶段决策问题的优化方法。建筑安全疏散过程中,随着时间或空间的变化会出现人员拥堵、道路障碍、烟气毒气扩散等情况,造成疏散不畅或中断,所以疏散过程会被人为划分为若干个相互联系的阶段,每个阶段都要做出一定的决策,即多阶段决策过程。解决安全疏散问题即是在不同阶段采用不同的决策方案,决策方案的全体称为疏散策略,其目的是疏散总过程最优。
动态规划最优性原理:作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。
R Bellman方程见式(1)。
undefined (1)
式中:fk*(i)为在第k步中点i到终点的最短路径;dk(i,j)为由点i到达点j的距离。
式(1)说明点i到终点的最短路径是这样选定的:使j到达终点的路径是点i到达终点路径的一部分,并由条件dk(i,j)+fk+1*(j)取最小选定。
动态规划的求解步骤是:由最后阶段的各种状态取其最优决策开始计算,直到初始阶段各种状态的最优决策为止。
2 建筑安全疏散问题的提出与基本假设
建筑内发生突发事件时,人员自救至关重要。有效的疏散计划对于减轻灾害或事故损失,保证人民生命财产安全具有重要意义。疏散计划是应急预案的重要内容之一,研究疏散路径、人员分流以及动态疏散引导的数量化,将会使疏散更加合理、有效、安全。
基本假设:以全体人员安全撤离作为动态调整网络总体目标;根据突发事件和建筑结构特点人为划分疏散阶段,定义状态,状态与状态间的连接即为通路,未必与实际疏散通道一一对应;建筑安全出口在疏散网络图合并为一个,室外即为安全;网络模型中所示权重,代表通过安全疏散路线的综合代价,用无量纲数字表示,对于无量纲数字的确定,在多种文献中均有论述,如文献[1]~文献[4];人员训练有素,状态一致。
3 最优疏散路径的选择
3.1 问题描述
某三层商业楼,有三个疏散楼梯可供逃生,一层有两个安全出口。每层均为敞开式大厅。发生突发事件,需要对人员进行疏散,寻找安全疏散路线。
3.2 建立模型
疏散以建筑内全体人员全部撤离为目的,故以三层最远端人员(甲)撤离为目的,建筑中其他人员的行动通过对行为人甲的影响(如人员拥堵影响撤离速度)表现出来。因为建筑内为敞开式营业厅,假设没有造成疏散拥堵,故仅将楼梯和安全出口作为节点考虑,构造网络模型如图1所示。
在图1中,A点表示疏散起点,位于三层某点;B1、B2、B3是三层楼梯下端点(位于二层地面),A与Bi的连线值表示人员穿行于大厅与通过三层楼梯的代价;C1、C2、C3是二层楼梯的下端点(位于一层地面),Bi与Cj的连线值表示人员穿行于二层大厅与通过二层楼梯的代价;安全出口有两个,分别为D1、D2,Ci与Dj之间的连线值为从二层楼梯下端到安全出口外的代价;E为安全出口外端,意味安全。
疏散过程可以看作如图1所示的多阶段决策过程。寻找最优疏散路径以疏散代价之和最小为目标。
3.3 动态规划方法求解
由图1表示的最短线路问题中,可将线路网络分成4个阶段,即A至Bi(i=1,2,3)为第一阶段,Bi(i=1,2,3)至Ci(i=1,2,3)为第二阶段,Ci(i=1,2,3)至Di(i=1,2)为第三阶段,Di(i=1,2)至E为第四阶段。
求解是从后向前逆向进行的。第四阶段有两条路:f4(D1)=d(D1,E)=3,路线是Di→E;f4(D2)=d(D2,E)=4,路线是D2→ E。第三阶段见式(2)。
undefined
这说明由C1到终点E的最短距离为7,其路线是C1→D1→E;同理,计算得C2到终点E的最短距离为11,其路线是C2→D1→ E;由C3到终点E的最短距离为10,其路线是C3→D1→E。
第二阶段见式(3)。
undefined
同理计算得f2(B2)=18,f2(B3)=19,相应的疏散路线是B1→C1→D1→E,B2→C1→D1→E以及B3→C3→D1→E。
第一阶段见式(4)。
undefined
说明从A点进行安全疏散,最优路线为路线是A→B1→C1→D1→E,最短距离为19。
在实际应用中,任意点的疏散路线都可以类似考虑。
4 人员优化分流
以某三层公共阅览室为例,其二、三层平面示意图如图2所示。
图2中S区域为天井,人员只能从天井四周疏散,图书馆一楼为敞开式大厅,在一楼疏散只需考虑从楼梯口到安全出口的行走距离因素即可。
如果在阅览室满员时疏散必然会在楼梯处发生拥堵,所以撤离时疏散楼梯的应用,即人员的合理分流至关重要。一般情况下,每一层楼梯人员的疏散相对独立,就近选择疏散楼梯,直到发生拥堵才会考虑选择其他路径,会造成时间的浪费。制定疏散预案,从开始时刻优化人员分流可以大大提高疏散效率。
案例中建筑有两个疏散楼梯,假设二楼人员就近选择楼梯疏散。由于两个阅览室的人员数目不均等,如果再选择就近疏散,三层人员会在二层楼梯处与二层人员会合,出现两部楼梯上人员密度失衡的情况。故考虑人员分流的行动应从三层开始,建立网络疏散图,优化疏散预案。
4.1 初始节点的处理
从图2可知,三层有两个阅览室,每个阅览室有两个出口。在疏散中,每个阅览室被人为划分为两个空间(动态),以每个空间距离出口最远端的距离为疏散起点,那么三层共有4个疏散起点Ai,i=1,2,3,4,而疏散以最后一人撤离为目标,所以设定一个虚拟初始节点,连接4个疏散起点,之间连线上的距离是该疏散起点的疏散代价与4个节点的最大疏散代价之差。即疏散以undefined为评价指标,那么初始节点S与各节点Ai之间的连线值为Z*-Zmin(Ai,E),i=1,2,3,4。
4.2 人员分流的处理
设综合报刊阅览室n人,其中流向电梯一n1人,则流向电梯二n-n1人,根据阅览室情况,该阅览室人员有k种划分;科技及外文阅览室m人,其中流向电梯一m1人,则流向电梯二m- m1人,该阅览室人员有l种划分。设三层楼梯下端与二层汇合处为节点Bj,j=1,2,从节点Ai到Bj的连线值dj(x,y)(j=1,2)表示相应路段上的疏散代价,x、y为两个阅览室流向每个电梯的人员数,对应着人员分流方案。
4.3 人员会合的处理
三层电梯下方出现两层人员会合的情况,人员密度增加,速度变慢。二层待疏散人员也存在疏散初始节点的问题。为此,在网络模型中引入虚拟节点Ck,k=1,2,设置在Bj的后面,意味着三层人员排在二层人员后面疏散,这样不影响对整个建筑人员疏散时间的评估。Ck与Bj间连线值表示三层人员等待二层人员撤离所付出的代价。
4.4 动态疏散引导
由于动态规划是由最后阶段的各种状态取其最优决策开始,直到初始阶段各种状态的最优决策为止。所以在安全疏散时,从开始救援的安全点开始,依次向里考虑,安排疏散路径,遇到瓶颈或故障点可以及时进行调整,确定的疏导方案是与实际相契合的。
(1)临时故障点的处理。
设dk(i,j)表示疏散节点i和j之间的距离,如果突发事件导致两点间的道路中断,则将dk(i,j)的值改变为+∞,由于求解从后向前,在dk(i,j) +fk+1*(j)取最小的过程中,经过j点的路径自然会被删除,从而不需改变网络结构图就能够动态调整疏散路线。
(2)临时救援点的处理。
在突发事件发生时,人们可以从建筑底部安全出口撤离,但是对于高层建筑,面对突发事件如火灾、毒气时,全部人员从底层撤离耗时太长不切实际,避难层、顶部的应用变得尤为重要。这时在网络图中安全出口的数量明显增加,疏散距离也会成倍缩减。此外在救援中,抢先救援人员可能根据实际情况增加外部救援点,那么在网络图中就会增加新的终点,与临近节点的距离改变为零,相邻区域的节点间的距离也会相应减小,新的疏散路线也会产生。
5 结束语
动态规划方法能够有效解决多阶段决策问题的求解问题。安全疏散路径选择和人员优化分流可以作为多阶段决策问题来处理。笔者构造网络模型,利用动态规划方法解决该类问题,为科学制定和评估消防疏散预案提供新的思路。
摘要:针对建筑安全疏散预案的设计问题,将动态规划设计方法分别应用于最优路径的选择和人员分流的预案设计中,在合理构造安全疏散网络模型的基础上,依据动态规划的原理进行科学计算。实验证明该方法能够定量分析人员分流问题,动态调整网络模型,有效地适应疏散中遇到的变化。
关键词:动态规划,安全疏散,网络模型
参考文献
[1]肖国清,温丽敏,陈宝智,等.毒气泄漏时的最佳疏散路径[J].东北大学学报,2001,(6):674-677.
[2]李引擎,肖译南,张向阳,等.火灾中人员安全疏散的计算机模型[J].建筑科学,2006,(1):1-5.
[3]崔喜红,李强,陈晋.大型公共场所动态引导人移动路径设计方法[J].中国安全科学学报,2008,(11):48-54.
[4]孔维伟,刘栋栋.北京复兴门地铁火灾时人员安全疏散研究[J].北京建筑工程学院学报,2009,(4):29-32.
[5]孙宽.基于运输模型的安全疏散方案优化方法探讨[J].安全与环境工程,2010,7(3):74-77.
[6]杨海潮,孙冰.基于PERT和最短路理论的人员疏散最优化[J].消防科学与技术,2011,30(2):103-105
[7]张海卿,闫明仁.安全疏散中人的行为研究及模糊综合评价[J].消防科学与技术,2010,29(3):252-255.
[8]刘伟,邢志祥,常建国.针对不同人员特征的安全疏散模拟[J].消防科学与技术,2010,29(4):297-300.
动态路径规划 篇2
为保证某一设备的正常运转,需备有三种不同的零件 E 1 , E 2, E 3
。若增加备用零件的数量,可提高设备正常运转的可靠性,但增加了费用,而投资额仅为8000 元。已知备用零件数与它的可靠性和费用的关系如表1 所示。
现要求在既不超出投资额的限制,又能尽量提高设备运转的可靠性的条件下,问各种零件的备件数量应是多少为好?要写出计算程序。
解:
设投资顺序为 E1,E2,E3,阶段编号逆向编号,即第一阶段计算给E3 投资的效果。设ks 为第 k 阶段的剩余款,kx 为第 k 阶段的拨款额,状态转移方程为k k kx s s 1,目标函数为)1()1()1(max3 2 1P P P f ,其中1P,2P,3P 分别为 E1,E2,E3 增加的可靠性 第一阶段:对 E3 的投资效果 决策表:
s1x1 0 2 3 4 *1x
f1 0 1
0 1 1 1
0 1 2 1 1.1
1.1 3 1 1.1 1.21.2 4 1 1.1 1.2 1.7 4 1.7 1 1.1 1.2 1.7 4 1.7 6 1 1.1 1.2 1.7 4 1.7 7 1 1.1 1.2 1.7 4 1.7 8 1 1.1 1.2 1.7 4 1.7
第二阶段,对 E2 的投资效果 由于 E1 最多只需 3000,故 52 s 千 决策表:
s2x2 0 3 5 6 *2x
f2 5 1.7 1.32 1.51.5 6 1.7 1.44 1.5 1.9 6 1.9 7 1.7 2.04 1.65 1.9 3 2.04 8 1.7 2.04 1.8 2.09 6 2.09 第三阶段:对 E1 的投资效果 决策表: s3x3 0 2 3 4 *3x
R3 8 2.09 2.09 1.8 0.7 0,2 2.09 回溯:有两组最优解(1)x3=0,x2=3,x1=2,maxf=2.09(2)x3=1,x2=3,x1=0,maxf=2.092 层次分析法练习:你已经去过几家主要的摩托车商店,基本确定将从三种车型
中选购一种,你选择的标准主要有:价格、耗油量大小、舒适程度和外观美观情况。经反复思考比较,构造了它们之间的成对比较判断矩阵。
三种车型(记为 a , b , c)关于价格、耗油量、舒适程度和外表美观情况的成对比较判断矩阵为:
(1)根据上述矩阵可以看出四项标准在你心目中的比重是不同的,请按由重到轻顺序将它们排出。
(2)哪辆车最便宜、哪辆车最省油、哪辆车最舒适、哪辆车最漂亮?(3)用层次分析法确定你对这三种车型的喜欢程度(用百分比表示)。
解:
(1)由重到轻依次是价格、耗油量、舒适程度和外表美观情况(2)C 车最便宜,A 车最省油,A 车最舒适,B 车最漂亮(3)a、建立层次模型:
目标层:选择哪种车 准则层:价格
耗油情况
舒适度
外表美观度 方案层:A 车型
B 车型
C 车型 b、成对比较阵题目当中已给出 c、计算权向量并做一致性检验 运行结果得到权向量为 w=(0.5820,0.2786,0.0899,0.0495),CR=0.0734<0.1,通过一致性检验 d、计算组合权向量。
由运行结果得知方案层对目标层的权重向量为(0.4091,0.4416,0.1493)
则可得出结论应该选购 B 车型 附(代码):
clc a=[1,3,7,8
1/3,1,5,5
1/7,1/5,1,3
1/8,1/5,1/3,1];%一致矩阵 [x,y]=eig(a);eigenvalue=diag(y);lamda=max(eigenvalue);ci1=(lamda-4)/3;cr1=ci1/0.9 w1=x(:,1)/sum(x(:,1))b1=[1,2,3;1/2,1,2;1/3,1/2,1];[x,y]=eig(b1);eigenvalue=diag(y);lamda=eigenvalue(1);ci21=(lamda-3)/2;cr21=ci21/0.58
w21=x(:,1)/sum(x(:,1))b2=[1
1/5
1/2;5
7;2
1/7
1];[x,y]=eig(b2);eigenvalue=diag(y);lamda=eigenvalue(1);ci22=(lamda-3)/2;cr22=ci22/0.58 w22=x(:,1)/sum(x(:,1))b3=[1
5;1/3
4;1/5
1/4
1];[x,y]=eig(b3);eigenvalue=diag(y);lamda=eigenvalue(1);ci23=(lamda-3)/2;cr23=ci23/0.58 w23=x(:,1)/sum(x(:,1))b4=[1
1/5
3;5
7;1/3
1/7
动态路径规划 篇3
随着机器人技术的不断发展, 移动机器人在工业生产、军事、服务、科学探索等领域得到了广泛的应用。在移动机器人相关技术的研究中, 路径规划一直是热点和核心课题。路径规划是指按照一定的技术标准 (如距离、时间、能量) , 搜索一条从起始点到目标点, 并能避开障碍物的最优或次优的安全路径。根据对环境信息的掌握程度, 路径规划可分为环境信息完全已知的全局路径规划和环境信息完全未知或部分未知的局部路径规划。此外, 还可以根据目标、障碍物的运动与否分为动态路径规划和静态路径规划。早期的路径规划研究大都在静态环境下, 主要方法有:可视图法、自由空间法、A*搜索算法等。然而, 随着机器人应用领域的扩大和现代工业环境的变化, 要求机器人能适应更加复杂和多变的工作环境。动态环境的路径规划问题随之成为机器人路径规划研究的重要方向, 常见的方法有:人工势场法、神经网络法、遗传算法、模糊逻辑法等。
近几年, 人们对动态路径规划的研究朝着智能化和多元化方向发展。文献[1]采用模糊遗传算法解决自主移动车辆在非结构空间和变化环境中的导航问题。通过避障行为的在线学习, 该系统能够不断更新知识库从而动态地适应不断变化的新环境。文献[2]分析了差动轮式移动机器人的运动学和动力学特性, 提出了一种基于传感器的混合式路径规划算法。该算法通过模糊控制器和瞬时目标引导机器人沿障碍物边界向目标运动, 利用多项式产生弯道处的光滑路径, 对于非完整约束机器人全局收敛。文献[3]利用调和函数和混合边界条件建立势场, 通过有限元法解决局部微分方程。该算法能够处理外形复杂的障碍物和边界, 并用于移动机械手和车辆的动态路径规划。文献[4]引入虚拟面板的概念并提出了基于运动学的反应式导航算法。通过虚拟面板移动障碍物被映射为静态障碍物, 碰撞检测和路径规划过程都得到简化。文献[5]提出了人工协调场的概念, 将吸引力、排斥力和协调力结合起来有效克服了传统人工势场法常遇到的局部最小和抖动问题。在蚁群算法的基础上, 文献[6]提出了一种采用模糊推理评估路径的优化算法。该算法记录蚁群经过的节点, 计算时间比一般蚁群算法节约10%左右。文献[7]提出了一种嵌入式神经网络算法。该算法无需检测机器人或神经节点的位置也无需建立环境地图, 适用于救援机器人的路径规划。文献[8]提出了生物激励神经网络算法, 机器人的运动空间是由神经网络组成的拓扑状态空间, 机器人向神经元活性最大的位置运动。该算法能够适应动态不确定环境, 无局部最小且计算复杂度低[8,9]。文献[10]在神经网络方法的基础上结合距离传播模型提出了一种高效的动态路径规划方法, 该方法将抽象的神经元活性转化为更直观的距离信息。
本文在移动机器人路径规划研究中引入了混沌理论。混沌理论的一个基本问题, 当混沌有害时需要对其进行削弱或抑制称为混沌控制;当混沌有用时可以对其进行强化或有目的的产生混沌称为混沌反控制[11]。混沌反控制主要用于保密通讯、密码学、脑科学、激光物理等领域。随着混沌理论的发展其应用领域不断扩大。在机器人研究中, 人们结合混沌理论对人工势场法、遗传算法等原有的路径规划方法进行了改进和优化[12,13]。本文提出了一种基于混沌反控制并具备一定预测能力的导航算法。该算法通过在路径规划的关键位置即目标运动方向不明的位置控制机器人混沌运动, 待目标运动趋势明朗后再进行路径规划, 可以减少随机选择造成的非最短路径的出现。此外, 该算法针对目标振荡运动且速度大于机器人的情况进行了分析。通过目标运动趋势的短期预测, 机器人可以在速度较慢的情况下成功追踪到目标。
1基本原理
本文所研究的动态路径规划算法是以神经网络和距离传播模型为基础, 用拓扑地图描述机器人的运动空间。拓扑地图由自由栅格和障碍物栅格组成, 栅格顺序编号并且只与临近栅格相连。对于编号为i的栅格, 定义Bi为与i相邻的自由栅格的集合, dij代表i和j两个自由栅格间避开障碍物的最短距离。xi (n) 代表n时刻目标到i栅格的最短无碰距离, xi (n) 的定义如下[10]:
(1)
其中D表示一个足够大的距离, f (i, n) 定义为:
自由栅格i仅存储它到相邻栅格的距离dij (j∈Bi) 以及它到目标点的最短距离xi (n) 。
为简化分析过程保证算法的可行性, 对机器人及其运动空间做出以下假设:
1) 目标和障碍物的位置是实时更新的, 并且更新的频率远小于整个系统更新的频率。
2) 机器人位置和速度已知, 目标和障碍物的位置和速度可以实时探测到。
3) 目标、障碍物、机器人都只能从一个栅格点向另一个栅格点作直线运动, 只有到达栅格处才能改变运动方向。
在地图和假设的基础上, 距离信息从目标点向起始点逐层传播称为距离传播过程。距离传播过程从目标点开始向相邻自由栅格扩展, 每个自由栅格保存此点到目标的最短距离值, 直至传到起始点构成一条从起始点到目标的最短路径。传播结束后, 机器人从起始点沿最短路径前进。运动过程中如果目标或障碍物位置发生改变, 重新进行距离传播。设机器人所处环境如图1所示, 其中2、6、7、14、15为障碍物栅格, 其余为自由栅格。1为目标位置, 4为起始点, 水平或竖直相邻栅格间距1。初始时刻x1 (0) =0, 其他自由栅格点xi (0) =D。传播第一步x5 (1) =1, 第二步x9 (2) =2, x10 (2) = 2.414。以此类推, 第五步x4 (5) =5.828, 所有自由栅格传播完毕。从目标位置到起始位置的最短距离为5.828。机器人从起始点开始回溯最短路径, 沿4→8→11→10→5→1运动, 最终到达目标位置。
静态环境下, 经过距离传播所获得的路径为最优路径。动态环境下, 则可能产生非最优或次优路径。尤其当距离相等时, 路径的随机选择可能造成非最短路径和“尖点”的出现。一种最简单的路径选择如图2所示。其中机器人初始位置在1, 目标位于6。经过距离传播过程可以生成两条最短路径1→2→6 (路径1) 和1→5→6 (路径2) 。静态环境下这两条路径都是最优路径。但如果目标运动, 选择不同的路径会有不同的结果。如果选择路径1, 而目标恰向9运动, 机器人只能沿1→2→6→9 (路径3) 运动, 显然是走了弯路。但如果选择路径2, 最终路径为1→5→9, 这条路径比路径3缩短了17%的距离。因此, 动态环境下目标运动的不确定性会造成路径规划的差异。如果在明确其运动方向的情况下再进行规划, 能够有效缩短路径长度。
2混沌与预测
针对动态环境中容易出现非最优路径的情况, 在距离传播的基础上增加了混沌反控制和预测环节。根据机器人和目标的速度关系, 将动态环境中的运动分为:机器人速度大于目标的常规运动, 小于目标的振荡运动以及小于目标的非振荡运动三种。由于第三种情况下机器人追踪到目标的几率很小, 因此本文只对前两种运动进行研究。
2.1常规运动
机器人速度大于目标时作常规运动。为了明确路径规划的关键位置, 定义栅格中心附近且下一时刻即将到达中心的位置为临界位置。当机器人和目标都恰好位于临界位置时容易出现非最优路径, 因此是规划路径的关键位置。本文所提出的动态路径算法控制机器人在关键位置混沌运动直到目标离开且运动方向明确。根据机器人运动空间的第3条假设, 目标运动方向确定后, 其下一步即将到达的栅格也可以确定, 再将该栅格作为距离传播的起点重新规划路径。采用混沌反控制的方法可以减少由于目标运动不明确而造成的非最优路径的出现。还可以避免使用延时控制所造成机器人的频繁启动和停车。而且混沌运动不同于混乱和无规律运动, 它具有随机性、遍历性和规律性的特点, 因此能够使机器人在运动中完成等待功能。
应用混沌理论中经典的广义Lorenz系统[8,9], 方程如下:
(3)
其中x、y、z表示三个方向的位移, σ为普朗特数, γ为瑞利数, b为几何因子。设γh=σ (σ+b+3) / (σ-b-1) 为霍夫分岔点。当0<γ<1时, 原点为Lorenz系统唯一稳定的平衡点。γ=1时, 系统发生叉式分岔。1<γ<γh时, 有不稳定的平衡点 (0, 0, 0) 和两个稳定的平衡点
由于本文研究二维空间的路径规划, 选x和z两个方向, 其位移变化矢量表示为:
其中s为正常数, 用于调节混沌运动的强度。混沌吸引子在x-z平面的相图如图3所示。
2.2振荡运动
除了常规运动, 本文还研究了目标振荡运动且速度大于机器人的情况。这种情况下如果只是盲目追踪而没有对目标运动趋势的分析和预测, 机器人很难追到目标。因此解决振荡问题的关键是通过分析运动轨迹预测目标的短期运动趋势, 将追踪问题转化为相遇问题。
设目标最近经过的四个栅格依次为1、2、3、4。
判断目标在振荡运动后, 将
2.3算法流程
本文所提出的动态路径规划算法的工作流程如图6所示, 其中VR表示机器人速度, VT表示目标速度。机器人在检测到目标位置后, 判断自身是否位于临界位置。如果不在临界位置按原定路线前进, 若恰好处于临界位置进一步判断机器人与目标速度的大小。VR>VT时, 若目标位于临界位置则机器人混沌运动;若目标不在临界位置则通过距离传播重新规划路径。VR<VT时, 判断目标是否振荡运动。如果振荡运动, 推断其运动趋势进而实现机器人对目标的追踪。否则进入常规运动流程。一个流程完成后, 如果追踪到目标程序结束, 否则进行下一次循环。
3算法仿真
通过与原始距离传播算法的比较, 说明增加混沌反控制和预测环节的新算法在动态环境中的有效性。图7中, 水平或垂直栅格间距为1, 目标以0.35/秒的速度运动, 机器人速度为0.42/秒, 障碍物静止不动。机器人和目标分别从 (2, 2) 和 (4, 1) 同时开始运动, 红线和蓝圈分别代表它们的运动轨迹。经过原始的距离传播, 机器人的运动路线如图7 (a) 所示。当机器人运动到 (6, 5) 的临界位置时, 目标恰运动到 (5, 6) 的临界位置。原始算法此刻仍然以 (5, 6) 为目标栅格, 机器人向其运动并最终在 (6, 7) 附近追踪到目标。从图中可以看出, (6, 5) 和 (5, 6) 两处均出现尖点, 所规划路径并是最佳路径。图7 (b) 中采用增加了混沌和预测的新的动态算法。当运动到 (6, 5) 临界位置后, 机器人混沌运动直到目标越过临界点向东运动。随后, 机器人向 (6, 6) 运动并成功在其附近追踪到目标。从图7 (b) 可以看出, 采用动态算法规划的路径中没有出现尖点为最优路径。整个追踪过程中, 采用原始算法机器人运行距离为10.95耗时26.5秒, 使用新的动态算法运行距离为8.32用时20.4秒。因此, 采用新的动态算法使机器人追踪运动目标的距离和时间都明显缩短。
目标振荡运动且速度大于机器人的情况如图8所示, 其中机器人和目标速度分别为0.3 /秒和0.5 /秒。图8 (a) 至 (e) 使用了新的动态算法。目标第一次振荡时机器人不在临界位置因此无法改变方向。图8 (d) 中, 机器人在临界位置检测到目标振荡运动, 经过预测机器人向北运动。图8 (e) 中, 追击问题转化为相遇问题机器人成功捕获目标。采用原始算法追踪目标的过程如图8 (f) 所示, 直到目标停止在 (8, 11) 位置机器人仍未能追到目标。因此, 新的动态算法能够使机器人在速度小于目标的情况下追踪到目标。
文献[8]中用神经网络算法的Hopfield模型和分流模型规划相似环境的机器人路径。在目标速度快于机器人且振荡运动情况下, 使用Hopfield模型无法追踪到目标。但如果衰减率合适, 使用分流模型能够规划出成功路径。与本文提出的改进算法相比, 神经网络算法虽然能够实现机器人追击速度较快的目标, 然而如何针对不同环境选择合适的模型和参数仍是一个有待解决的问题。
4结论
在神经网络和距离传播模型的基础上, 本文提出了一种基于混沌反控制并具有一定预测能力的动态路径规划算法。通过控制机器人在关键位置进行混沌运动, 减少了由于目标运动不明确造成的非最优路径和尖点的出现。针对目标振荡运动的情况增加了预测环节, 使低速机器人追踪高速目标成为可能。通过与原始距离传播算法的比较, 新的算法在动态环境中能够规划出更合理的路径, 具有更好的适应性。
摘要:针对移动机器人在动态环境中常遇到的非最优路径问题, 提出了基于混沌反控制并具有一定预测能力的路径规划算法。算法结合神经网络和距离传播模型, 无需先验知识并且能适应动态不确定环境。通过在关键位置控制机器人进行混沌运动, 可以减少等距情况下随机选择所造成的非最优路径出现的几率。在目标振荡运动且速度快于机器人的情况下, 通过分析目标的轨迹和方向可以预测目标的短期运动趋势, 进而实现有效追踪。仿真结果表明该算法对于减少非最短路径和路径中的尖点具有一定的作用, 对于追踪速度较快的目标也有较大的成功率。
规划企业成长路径 篇4
杰克•韦尔奇说:“直面现实,不要把头埋在沙子里。”。那么企业在面对这个充满着巨大机遇和挑战的世界时,应该有着怎样审慎的思考,以便更好的规划自己的崛起之路,把握各个阶段的发展策略。
第一阶段:高筑墙 广积粮
万事开头难,绝大多数的企业在成立或发展初期都是作为中小企业参与社会竞争的。由于先天的原因,往往存在这样或那样的缺陷和不足,比如资金、技术、智力等资源的缺乏,服务和渠道体系的不完善等。在这样的情况下,盲目参与大范围的市场竞争,就更加放大了企业的先天性不足,而且若战略意图暴露,引起竞争者的打击和排斥,处境就会举步维艰。
一坛酒倒在河里,一点酒味都没有,但倒在碗里就会酒香四溢。所以企业在起步阶段切记好高骛远,应该有多大能力办多大事,踏踏实实,专注于区域市场,进行市场聚焦。虽然全国性企业在资金、技术、智力等资源上占有绝对优势,但他的棋盘铺的太大了,力量就不可避免的被分散,在各个区域市场就不再有压倒性的统治地位。于是只要你专注于区域市场深耕细作,提高服务水平,完善渠道体系,对有限消费者的需求快速反应,就不怕强龙来摆尾!就像封建时代的诸侯,高筑墙,广积粮,凭天时地利割据一方,就算皇帝老儿也没奈何。
与此同时,企业应该清醒看到自己的不足,补强自己的短板,为进一步的发展做好准备。在硬实力方面,要积极地整合利用自己和社会的资源。资金不足,就去融资,银行不贷给你,就去借助于投资机构;智力资源不足,就多向别人请教学习,尤其是你的竞争对手;技术不行,就去和别人合作,利用别人的技术。蒙牛有句口号:“98%的资源都是整合的,
”,不在于你有多少资源,而在于你利用了多少资源;在软实力方面,企业愿景和文化的塑造,管理水平的提高,都要积极认真的践行。
第二阶段:转折点
当企业经过第一阶段的积累以后,一般已成为区域市场中的佼佼者,属于较为强势的地方品牌,在区域市场上占有较大的市场份额。这时候,企业的处境会微妙,既已到了转型的关键时期。因为区域市场空间有限,再固守于此,就会遭遇发展瓶颈。而且企业经过第一阶段的积累,已经有能力走出去,参与更大范围的市场竞争,不进则退,企业要想继续发展,走出去已是不二选择。
参与大范围市场争夺的企业一般都是具有强势品牌的大型企业。他们在价值链的各个环节都相对比较成熟,具有明显的竞争优势。而地方企业刚一进入全国性竞争市场就想与它们直接竞争无异于以卵击石。这时候有两条路对于新进入者是较为安全的。
(一)侧翼竞争策略。孙子兵法说,“进而不可御者,冲其虚也。是说进攻而敌人不可抵抗,是因为冲击的是敌人的薄弱处,想要对你打击也力不从心。在市场竞争极度激烈或者市场中存在消费者需要空白点时,走此路线较为安全,因为市场竞争极度激烈,你只有另辟蹊径,避开竞争,才能生存下来求得发展。或者是市场中存在消费者需求空白点,若你能填补这个空白,你也就相应的获得了一大片市场。柒牌男装提出了“中华立领”这一新概念,引导了一个新的服装品类的诞生,得以迅速壮大;广药集团发现了人们由于生活节奏的加快,经常熬夜上火,需要一种能降火降燥的饮品,而市场上并没有相应的饮品来满足人们的这一需求,即使有这样的产品也没有好好的被推广,占领消费者的心智,于是他们强势推出了王老吉中药凉茶,弥补了这一消费空白点,取得了极大的成功!地板行业中,生活家率先提出纯手工制造,生活家•巴洛克仿古地板随之一炮而红。
动态路径规划 篇5
作为一个重要研究领域,移动机器人路径规划能够寻找一条起点至终点的最优路径使之安全到达目标。依环境信息预知程度不同,路径规划可分为所有信息预知的全局路径规划、至少部分信息未预知的局部路径规划[1]。
由于难于预知环境中的全部信息,实际中必须依赖传感器所得有限信息实时规划路径,因此局部路径规划成为该领域的研究热点。常用局部路径规划方法主要有人工势场法[2]、改进矢量场图法[3](improved vector field histogram,VFH+)、模糊逻辑算法[4]、人工神经网络方法[5]等。然而上述方法均未考虑动态障碍物的影响,在动态环境中可能导致碰撞并严重影响路径效率,因此动态未知环境中的路径规划问题引起了众多学者关注。席裕庚等[6]提出了基于滚动窗口的路径规划方法,该方法通过场景预测,以滚动方式在线规划。Ko等[7]在建立势场时引入了障碍物速度。韩永等[8]引入了速度势场改进人工势场法。上述方法多假设物体速度已知,而在实际中障碍物速度难于准确获得。因此需综合考虑障碍物速度估计方式及其带来的不确定性。
本文以高斯分布噪声描述物体运动速度及速度估计过程中的不确定性。采用自适应无色卡尔曼滤波[9](unscented kalman filter,UKF)对障碍物进行跟踪,以获得物体运动速度及其概率分布,并据此提出一种新的路径规划算法:①预测可能碰撞位置构建危险区域,并依其概率分布进行扩充;②搜寻可供通行的最优自由路径,引入风险函数评价碰撞风险;③以模糊控制器计算机器人线速度、角速度,获得所需轮速。该算法较充分地考虑了障碍物速度及其不确定性的影响,在动态环境仿真及实验中均表现出良好效果。
1 环境建模
现对本文方法作如下假设:
(1)机器人等效为点,障碍物依安全半径rs膨化处理。以机器人中心为原点建立机器人坐标系,正前方为90°,逆时针为正,角度范围(0°,360°]。后文坐标默认为此坐系中坐标。
(2)机器人能够感知路径目标坐标(rT,ϕT)。障碍物平动,对视野范围内障碍物传感器可提供如下信息:
Oi(oi,ϕil,ϕir) (1)
oi(roi,ϕoi) (2)
其中,中心oi的极坐标roi、ϕoi分别表示障碍物i到机器人的最小距离、i的中心角度;ϕil、ϕir分别为i的左右边界角。式(1)描述了一扇型障碍物区域Oi(图1),它表示了膨胀后障碍物i的碰撞威胁,oi表征了该区域的位置。定义危险区为可能碰撞的区域(对静态障碍物i,其危险区等价于Oi),定义与危险区无相交的扇区为自由扇区,约定本文涉及的长度单位均为m,角度单位为度。由于常用传感器的不可穿透性,对物体的观测往往只及一面,因此假设符合实际。
2 障碍物速度信息获取
实际中障碍物速度信息通常无法直接获取,只能依赖传感器信息进行估计。然而传感器存在噪声,速度估计模型也存在误差。因此以高斯分布噪声描述传感器噪声及速度估计过程中的误差,并采用一种基于自适应UKF滤波器的机动目标跟踪算法,获得物体运动速度及其概率分布。
2.1 速度估计数学模型
对动态障碍物本文采用如下相对速度进行描述:径向速度vL(m/s,远离为正)表征障碍物距离的变化率;角速度ω(rad/s,逆时针为正)表征障碍物角度的变化率。则动态障碍物i可进一步描述为障碍物区域:
ODi(Oi,vLi,ωi) (3)
设t0时刻机器人从位置R0(记机器人坐标系R0)经时间步长Δt运行至t1时刻位置R1(记机器人坐标系R1),如图2所示。另设R0处对障碍物i观测得Oi,此时对应坐标系R1处对i的观测为O′i。则不难由Oi的中心oi映射至坐标系R1中得到O′i的中心o′i,坐标变换关系如式(4)所示。式中,roi、ϕoi为oi的极坐标;r′oi、ϕ′oi为o′i的极坐标,xoi,yoi为oi在R0坐标系的直角坐标,X′oi,Y′oi为o′i在R1坐标系中的直角坐标。xd、yd、θd分别为R1在R0坐标系中的x、y轴坐标以及坐标系R1相对坐标系R0的旋转角度,此三者依机器人运动模型不难由下式得到
式中,dl、dr为Δt时间内机器人左右轮位移;Rd为回转半径;D为机器人左右轮距(易得dl=dr的情况)。
设在坐标系R0中测得i从Oi0移动至Oi1,如图2所示。进一步设在Δt时间内障碍物匀速运动,则对Oi1显然有
其中,vLi0、ωi0为t0时i的相对径向速度、相对角速度;roi0、ϕoi0为中心oi0的极坐标;roi1、ϕoi1为oi1极坐标;函数G(·)表示将弧度转化为度,G-1(·)表示度转化为弧度。依式(4)将坐标系R0中的oi0、oi1分别映射至t1时刻坐标系R1得o′i0(r′oi0,ϕ′oi0)、o′i1(r′oi1,ϕ′oi1),进而得到当前时刻障碍物速度为
2.2 不确定性分析
以
(1)传感器噪声影响观测所得oi坐标。以高斯观测噪声
(2)轮子打滑、编码器随机噪声等影响dl、dr。以高斯控制噪声
(3)障碍物可能发生机动及前述速度估计模型存在误差影响估计。以高斯模型噪声
2.3 基于UKF的目标跟踪
考虑到前述模型的严重非线性,本文采用一自适因UKF滤波器跟踪障碍物估计其速度。针对障碍物i有状态及观测模型如下:
其中,状态变量
依UKF算法[9]由tk-1时刻状态
2.4 基于协方差匹配技术的自适应调节器
上述模型中噪声
则模型噪声方差为
δQk=KkCkK′k+δik-(δik|k-1-δQk-1) (11)
i0=k-w+1
式中,w为平均窗口宽度(本文取w=5);Kk为tk时刻更新步骤中的卡尔曼增益矩阵;δik|k-1为
3 重构环境危险区
静态障碍物的障碍物区域即为其危险区。然而对动态障碍物而言,潜在碰撞区而非当前障碍物区域。因此对动态障碍物,本文通过预测潜在碰撞区以获得环境中真实的危险区分布。
设tk时刻对动态障碍物i有障碍物区域ODik(
且依
其中,δoik、δivk、δiwk分别为
由于tD后碍物区域预测位置
即得i在tD后与机器人的碰撞危险区域Oipred(roipred,ϕoipred,ϕilpred,ϕirpred)。其中,roipred、ϕoipred为危险区Oipred中心极坐标,ϕilpred、ϕirpred为Oipred左右边界角。δ(1,1)oiD、δ(2,2)oiD分别为δoiD主对角线的第一、第二个元素。参数α决定区域扩充范围及tD后障碍物i包含于Oipred的概率P(i∈Oipred),概率P(i∈Oipred)由下式计算:
其值由概率知识不难选取,本文取α=1.3使该概率约为0.8。图4为障碍物0经t0、t1时刻运动后,扩充所得危险区O0pred。
方便起见,后文中对所有危险区统称障碍物区域,即对动态障碍物i障碍物区域Oi实际上指扩充后的危险区Oipred。
4 环境信息压缩
由于传感器所得数据信息量大,不利于快速路径规划,因此采用数据压缩实现以一最优自由路径角及风险值来表征进行规划所需的信息[10]。
4.1 搜索自由路径
定义自由路径如下:由极点发出射线,若未与任何障碍物区域相交则称该射线为一自由路径,其与极轴夹角ϕ称自由路径角,以下简称其自由路径ϕ。令ϕs代表最优自由路径,并以一风险函数评估机器人切入ϕs过程中的碰撞风险Dg。
若路径目标正处于某自由路径上,则ϕs=ϕT。否则需另行搜寻最优自由路径。本文将分两步搜寻:搜索最优自由扇区,并从中确定若干备选自由路径ϕci(i=1,2,…);再于ϕci中以一代价函数寻优求取ϕs。
4.2 评估风险
机器人在切入ϕs中,可能发生碰撞。其风险与90°~ϕs范围内的最近障碍物区域距离romin、该障碍物径向速度vL有关。图5中机器人切入ϕs需经Oi所在扇区。为保安全性,机器人运动路线需控制在扇区A内,A满足:角度ϕ∈[90°,ϕs],距离r∈[0,romin]。可知:romin越小,vL越小(接近速度越高)则碰撞风险越高,因此构造风险函数如下:
其中,Dg∈[0,1]为风险值,vLI为可忽略该障碍物影响的径向速度阈值(本文取vLI=0.2m/s),即若vL>vLI/k5则障碍物快速远离可忽略。rmax为最大识别距离(本文取rmax=4m)。一般取权值k4>k5即使障碍物距离的影响更大(本文分别取k4=1、k5=0.5)。
5 轮速计算
传统方法多采用比例导引法计算轮速,效率不高。本文采用模糊控制器模拟人的驾驶经验计算轮速。记θs为ϕs与90°间最小夹角,则机器人运动受Dg与θs的影响如下:θs增大,即ϕs尚远,则机器人应减小线速度、增大角速度加速切入ϕs,反之则减小角速度,维持较高线速度;Dg增大,即切入ϕs风险增加;应降低线速度,增大角速度,以减小回转半径;反之应增大机器人线速度,减小角速度以维持运动平稳。此外当θs很小时应维持较高线速度、较低角速度以避免震荡。
因此本文模糊控制器以θs、Dg为输入,以归一化线速度vu、归一化角速度ωu为输出。则由下式易得机器人角速度ωR、线速度vR:
其中,vRmax、ωRmax为设定最大线速度(m/s)、最大角速度(rad/s)。
6 仿真研究
本文使用Webots软件进行仿真,并与VFH+方法进行对比。其中vRmax=1m/s,ωRmax=1rad/s,其余参数均依前文说明取定。仿真效果如图6~图9所示。
图6、图7中障碍物1以左右轮速8rad/s、5rad/s圆周运动。本文方法预测出无需调整运动方向,机器人不会进入危险区,因而获得理想路径。图7给出了仿真运行至1.74s时的相对位置、预测危险区及所得ϕs方向(箭头方向)。而VFH+算法由于仅依赖障碍物当前位置进行判断,引发机器人不必要的避碰行为导致更长路径。表1给出了仿真中的路径长度与到达时间。
图8、图9中障碍物1以左右轮速均8rad/s直线移动。使用本文方法机器人在1.344s前均试图在障碍物前方抢先通过(ϕs方向如图中箭头)。1.344s后,由于未能抢先通过,因此依据预测危险区位置立刻改变运动方向从O1背后绕过(3.52s时ϕs方向如图中箭头)并到达目标。而传统VFH+方法由O1位置判断,始终认为从障碍物前方通过最优,因而导致碰撞,无法到达目标。
7 实验结果及分析
由于诸多实际因素干扰,实验中本文方法优势不如仿真中明显。实验机器人自身直径0.45m,配备Pentium Ⅳ 3.0GHz CPU,256MB内存,实验中vRmax=0.5m/s,ωRmax=0.7rad/s。
在图10静态环境实验中,机器人距目标1.45m,5个直径0.45m圆柱形障碍物依图示放置。机器人移动路径如图中白色圆形所示,其中箭头指向机器人正前。表2给出了与VFH+方法的实验数据对比。VFH+在接近障碍物时存在较长时间慢速调整,其到达时间、路径长度分别为13.27s、4.788m。而本文方法由于采用了模糊控制器更好地计算了轮速,因而到达时间更短。图11为动态环境中的实验示意图,其中机器人与路径目标(球)、障碍物分别相距1.6m、1.4m。障碍物以左右轮速0.46m/s、0.5m/s向前运动,轨迹如图中灰色圆点所示。机器人运动轨迹如图中白点所示(箭头为机器人朝向)。实验中本文方法能够预测碰撞危险区,因而首先企图从障碍物前通过,失败后则从障碍物背后绕过到达目标,而使用VFH+方法则发生碰撞。
实验中,本文算法表现出较好的实时性。跟踪一个物体时平均耗时30ms,随跟踪数目增加,耗时比例增加。原因在于本文算法的主要运算时间均耗费于速度估计阶段。
8 结论
本文提出一种改进的局部路径规划方法,采用自适应UKF滤波器跟踪障碍物获得障碍物运动速度及其概率分布。通过预测危险区并依其不确定性进行扩充,重构环境威胁区分布,使得本文方法得以适应动态环境及其不确定性的影响。
参考文献
[1]张捍东,郑睿,岑豫皖.移动机器人路径规划技术的现状与展望[J].系统仿真学报,2005,17(2):439-443.
[2]樊晓平,李双艳,陈特放.基于新人工势场函数的机器人动态避障规划[J].控制理论与应用,2005,22(5):703-707.
[3]Ulrich I,Borenstein J.VFH+:Reliable Obstacle A-voidance for Fast Mobile Robots[C]//Proceedings ofthe 1998 IEEE International Conference on Roboticsand Automation.Leuven.Belgium:IEEE,1998:1572-1577.
[4]Huang B,Cao G,Fei Y,et al.Fuzzy Controller forthe Autonomous Mobile Robot Path Planning[J].Jour-nal of Computational Information Systems,2007,3(1):1-8.
[5]张明路,彭商贤,曹作良,等.用于移动机器人避障的人工神经网络和模糊逻辑控制技术[J].中国机械工程,1997,8(2):21-25.
[6]席裕庚,张纯刚.一类动态不确定环境下机器人的滚动路径规划[J].自动化学报,2002,28(2):161-175.
[7]Ko N Y,Lee B H.Avoidability Measurein Moving Ob-stacle Avoidance ProblemandIts Use for Robot MotionPlanning[C]//Proceedings of the 1996 IEEE/RSJ In-ternational Conference on Intelligent Robots and Sys-tems,IROS.Osaka,Japan:IEEE,1996:1296-1303.
[8]韩永,刘国栋.动态环境下基于人工势场的移动机器人运动规划[J].机器人,2006,28(1):45-49.
[9]Hide C,Moore T,Smith M.Adaptive Kal man Filte-ring Algorithms for Integrating GPS and Low Cost INS[C]//PLANS-2004 Position Location and Naviga-tion Symposium.Monterey,CA,United states:Insti-tute of Electrical and Electronics Engineers Inc.,2004:227-233.
动态路径规划 篇6
关键词:神经动态规划,最优路径,子问题,Matlab仿真
为了减轻交通压力, 人们越来越关心交通系统的智能化进程。智能交通系统主要的研究方向之一就是动态路径诱导系统, 它可根据外出的人们的需求, 为驾驶员提供最新的路况信息和最佳路径选择, 以此避免交通拥堵现象的发生, 从而优化交通状况, 最终使交通时时地保持一个合理的动态分配。目前, 最优路径选择的方法有很多, 但是真正需要解决大型问题时, 计算机需要搜索的选择范围太大, 传统的动态算法基本上无法处理。1995 年, 神经动态规划算法被提出, 该算法把复杂的问题分成若干子问题, 这些子问题被拆分后更容易解决, 使计算过程大幅简化, 且更容易被计算机处理。采用这种方法, 可准确、快速、实时、稳定地选择出最优路径, 值得推广。
1 神经动态规划概述与核心思想
在解决多阶段决策问题时, 动态规划大致思想为:将非常繁琐的原始问题分解为若干个阶段, 这些阶段看似不相关, 却是相互联系的子阶段, 在找到上一阶段的解决方法以后才能处理下一个阶段, 依次求出每个阶段的解, 最后得到全局最佳的解。多阶段决策问题具备很强的顺序性, 同时每个阶段所使用的解决方法也是随着阶段的变化而变化, 所以“动态”意义就得以体现。其中交通网中最佳路径的求解就是典型的多阶段决策问题。
在路径优化中, 动态规划是一种非常经典的计算方法, 但在处理实际问题的时, 我们肯定会遇到缺少一个完整信息或者维数灾等一系列问题, 所以, 引进神经网络对动态规划具有较大的解决实际问题的意义。神经动态规划如图1 所示。
2 基于神经动态规划算法的最优路径实现
(1) 将原来的问题分解成很多个小问题, 即子阶段, 并且找到每个子阶段的最优解决办法。求解多级问题的步骤为:根据每个问题的特点, 划分子阶段。在划分子阶段时, 必须按照一定的规则, 比如根据执行决策的时间、空间的顺序等。本文用x来表示子阶段变量。
(2) 求解状态和状态变量。每个子阶段具体的起始位置可以依靠自然状态来指导, 其中客观条件阶段性数目的状态是自然状态中的一种, 它传达每个子阶段的关键信息, 此外, 一组或者无后效性的变量同样可以用来表示状态变量。本文用Hx来表示第x级的状态变量。
(3) 求解原问题决策变量和集合。从目前阶段到下一个阶段状态选择时, 决策者需要做出恰当的决策, 决策变量的范围称为集合。本文用Dx表示决策集合, 用Ux表示决策变量。
(4) 研究状态转移的方程。假设状态转移方程是:Hx+1=Tx (Hx, Ux) 。次方程式中Tx不定, 根据具体问题才能确定, 如果Hx确定, 一旦变量Ux确定, 那么第x+1 阶段状态变量 (Hx+1) 也将确定。
(5) 研究指标函数。因为n和vi的递进性和可分离性, 所以很容易找到指标函数n和vi之间的关系, 显然, 指标函数的求解也相对简单化。
(6) 动态规划函数的基本方程。边界条件为;
3 仿真结果
将上述模型, 在Matlab仿真软件上进行模拟仿真, 分解原始问题并确定各个子阶段的最佳方案, 将这个问题用网格的形式如图2 进行表示:A为起始地点, E为目标地点, 从起始地点到目标终点有很多路径, 假设经过每个节点需要一定的运输成本, 在Matlab仿真软件上进行仿真后依据动态规则算法的要求, 设定好相应的算法模型以及相应的计算公式, 这样便可以找到最优路径。
由图2可以非常清楚的看出, 成本最低的路线为:, 成本都是110。仿真结果可以看出神经动态规划算法具有较多优点:得到清晰运算结果;很容易找到全局的最优路径;可以找到一组完善的解, 有利进一步的分析。
4 结语
我们在使用神经动态规划算法来探索最优路径的时候, 具有很多优势, 首先其具有稳定、可靠的步骤, 过程并不复杂, 但是给予我们的结果十分清晰明确, 且适用于现实生活。使用这种动态规划算法解决复杂的问题时, 可以非常容易找到解决方案, 而且效率很高。当然, 该算法也有一定的局限, 但只要我们不断地改进完善, 日后继续研究神经动态规划算法, 相信一定可以攻克更多的局限, 能够使其更好地被应用。
参考文献
[1]谬慧芬, 邵小兵.动态规划算法的原理及应用[J].中国科技信息, 2006 (23) :32.
动态路径规划 篇7
近年,网上购物迅速发展成为人们购物的重要模式。物流配送是电子商务活动中重要的一环。合理选择配送路径,对加快配送速度、提高服务质量、降低配送成本及增加经济效益都有较大影响[1]。如何提高商品配送效率是诸多物流企业关注的重点。因此,选择合理优化的路径对物流企业提高企业竞争力和服务水平至关重要。
20世纪50年代,美国数学家Bellman为研究最优控制问题提出动态规划法[2,3]。该种方法成为一种通用的算法设计技术来求解多阶段决策最优化问题。文献[4]利用图的广度优先搜索与动态规划法相结合求解关键路径;文献[5]应用动态规划法研究物流配送的最短路径,但不能对于不同时刻下的同一区域进行路径的动态选择。
本文中,对于物流配送路径选择问题建立数学模型,在考虑路径长度基本因素下,在基本的动态规划法基础上进行改进,增加路况,等影响因子随机调整路径权值,提出一种较高效率、切实有效的物流配送路径动态选择算法。
1 动态规划法的基本思想
1.1 适用于动态规划法求解的问题的特征
1)能够分解为相互重叠的若干子问题;
2)满足最优性原理(也称最优子结构性质):该问题的最优解中也包含着其子问题的最优解。
1.2 动态规划法的求解过程[6]
动态规划法是求解多阶段决策最优化问题的技术之一,其基本思想是把多阶段决策的复杂问题划分为多个子问题(通常,这些子问题之间相互重叠),每个子问题对应决策过程的一个阶段。如图1所示,Si(i=0,1,2,…,n)是问题求解过程中的各个状态,Pi是依据当前状态做出的相应决策。
各个子问题之间有重叠,这种重叠关系可以在抽象的动态规划函数中表现出来。因此,求解子问题的解后,并填入表中,当在后续阶段需要再次求解此子问题时,可以通过查表获得该子问题的解而不用再次求解,从而避免了大量重复计算。
动态规划法的求解过程如图2所示。
从图2可知,动态规划法利用问题的最优性原理,以自底向上的方式从子问题的最优解逐步构造出整个问题的最优解。动态规划法的三个阶段:
(1)分段:将原问题分解为若干个相互重叠的子问题;
(2)分析:分析问题是否满足最优性原理,找出动态规划函数的递推式;
(3)求解:利用递推式自底向上计算,实现动态规划过程。
2 物流配送路径问题的数学模型
2.1 问题描述
现某一个物流企业有配送中心A,要求送达的配送目的地是M1,M2,…,Mn。配送中心与各个配送目的地,配送目的地两两之间有路可达。要求从配送中心A出发,将货物配送到各个目的地,最终回到配送中心。要求合理安排配送的路线和行车时间,且相应的配送费用最小。
以上描述的问题符合最优性原理。证明如下:
设s,s1,s2,…,si,s是从s出发的一条路径长度最短的简单回路。
假设从s到下一个城市s1已经求出,则问题转化为求从s1到s的最短路径,显然s1,s2,…,sp,s一定构成一条从s1到s的最短路径。
否则,设s1,r1,r2,…,rq,s是一条从s1到s的最短路径且经过n-1个不同城市,则s,s1,r1,r2,…,rq,s将是一条从s出发的路径长度最短的简单回路且比s,s1,s2,…,si,s要短,从而导致矛盾。
2.2 建模前的假设
为了便于建立物流配送路径选择的数学模型,使得该模型有一定的实用性且不会过于复杂,假设问题满足以下条件:
(1)到达每个配送目的地的长度不超过配送车辆一次配送的最大可行驶距离;
(2)存在路径,可以使得每个配送目的地经过且只经过一次;
(3)各个配送目的地采用同样的运输手段;
(4)运输费用与运输路径成正比,即单位成本固定;货物应当在可接受的时间范围内运送到。
2.3 建立模型
根据以上描述可知,物流配送路径选择问题的模型如下:
d(s,V')表示从物流配送中心s出发,经过所有配送目的地V'一次且只一次,最后回到出发点s的最短路径长度。
动态规划函数:
2.4 物流配送路径选择的动态规划法
设顶点之间的代价存放在数组c[n][n]中,动态规划法求解问题的填表过程如下:
从以上应用动态规划法填表求解过程可知,表格中的数据安置从左往右逐列求值。在表格的右上角d[0][2n-1-1]即物流配送问题的最短路径。根据最短路径的求解过程,依次倒推,求得最短路径上的配送顺序,即得到问题的最优解。
3 实例
假设物流企业的配送中心S,现需要从S出发将货物分别配送到目的地A、B和C,然后回到S,以进行下一次货物配送。各地点之间的距离,如图3所示。
根据动态规划法,进行填表求解。
假设n个顶点用0~n-1的数字编号,首先生成0~n-1个元素的子集存放在数组V[2n-1]中,设数组d[n][2n-1]存放迭代结果,其中d[i][j]表示从顶点i经过子集V[j]中的顶点一次且仅一次,最后回到出发点0的最短路径长度。
从S出发经点A、B、C然后回到S的最短路径长度是:
d(S,{A,B,C})=min{cSA+d(A,{B,C}),cSB+d(B,{A,C}),cSC+d(C,{A,B})}
这是最后一个阶段的决策,而:
d(A,{B,C})=min{cAB+d(B,{C}),cAC+d(C,{B})}
d(B,{A,C})=min{cBA+d(A,{C}),cBC+d(C,{A})}
d(C,{A,B})=min{cCA+d(A,{B}),cCB+d(B,{A})}
这一阶段的决策又依赖于下面的结果:
d(B,{C})=cBC+d(C,{})d(C,{B})=cCB+d(B,{}))
d(A,{C})=cAC+d(C,{})d(C,{A})=cCA+d(A,{})
d(A,{B})=cAB+d(B,{}d(B,{A})=cBA+d(A,{})
而d(A,{})=cAS=5(A→S)d(B,{})=cBS=6(B→S)d(C,{})=cCS=C(C→S)可以直接从图3得到,填入表1的第2列。
由此,可以得到如下,并将其填入表1的第3列至第5列:
同理,得到以下数据并填入表1的第6列至第8列:
最后,得到表1的最后一列:
所以,从顶点S出发的物流配送最短路径长度为10,最优的选择路径是S→A→B→C→S。
由于在物流配送过程中,时间、天气等不确定因素的影响,道路的拥堵通畅情况随时会发生变化。假设配送目的地B位于市中心,上下班高峰时间与B相通的道路通常会比较拥堵。虽然相关道路的长度没有发生变化,但这会延误到达其他目的地的配送时间。因此,引入道路拥堵因子x,在不同时刻随机调整相关道路上的权值,x的取值范围为(0,10]。x=1表示通畅情况下的道路拥堵因子;x<1表示道路状况被提高后的拥堵因子,优于通常情况;x>1表示道路比较拥堵情况,该值越大,道路状况越糟糕。拥堵因子x的引入可能会使得最终选择的物流配送路径距离增加,但是以运输高成本能换取大部分客户的满意度,保证企业的良好信誉。
假设图3中各边的取值为道路通畅情况下的权值,即此时拥堵因子x=1。在上下班高峰时刻,AB段和SC段发生拥堵,提高拥堵因子x,设x=4。调整后如图4所示。
在图4上,再次应用3.4动态规划法,得到表2。
由表2知,在AB,SC段发生拥堵情况下,最优的配送路径长度是17,对应的路径是S->A->C->B->S。
4 算法仿真
引入拥堵因子的动态规划法在Visual Studio.Net环境中使用C#语言进行编程仿真。
将前面描述的实例作为测试程序输入。程序运行后,得到图5。图5中左右两个子图对比同一配送问题在不同路况下的物流配送路径最优解。左图表示在路况良好时(拥堵因子x=1)最优的配送路径;右图中AB和SC发生拥堵,用虚线表示,黑色加粗的箭头所指是此时(拥堵因子x=4)最优的配送路径。
仿真结果表明,引入道路拥堵因子后的改进动态规划法可以根据实时的路况信息,随机调整拥堵因子,在车辆已经出发的情况下,动态调整实时的物流配送路径的最优解。
5 结语
在物流配送路径选择问题中,引入拥堵因子随机调整物流配送路径的权值,改进动态规划法,求解实时的物流配送的最优路径。此算法的改进对于物流企业提高配送效率,提高用户满意度有一定的实际应用价值。
参考文献
[1]郎茂祥,胡思继.用混合遗传算法求解物流配送路径优化问题的研究[J].中国管理科学,2002,10:51-56.
[2]王晓东.算法设计与分析[M].北京:高等教育出版社,2003.
[3]Thomas H Cormen,Charles E Le.Introduction to Algorithms[M].MITPress,2005.
[4]刘芳,王玲.基于动态规划思想求解关键路径的算法[J].计算机应用,2006(6):1440-1442.
[5]蒋琦玮,陈治亚.物流配送最短路径的动态规划方法研究[J].系统工程,2007(4):27-29.
动态路径规划 篇8
近年来,随着市场经济的不断深入以及人们生活水平的不断提高,服装连锁经营在我国有了很大的发展,品牌服装的销售量日益增加,连锁门店市场的竞争越来越激烈[1]。在电子商务出现以后,由于电子商务突破了时空限制、新媒体对服装全方位的展示、低的交易成本与低库存、较少的中间环节所带来的交易费用的优势等,给连锁服装门店的经营带来了新的挑战[2,3]。在人们日益追求服装个性化、高增值服务的时代,在原材料与人力资源成本挖掘的空间越来越小的情况下,服装连锁企业越来越关注作为企业第三利润源泉的物流的作用[3],通过降低物流成本、加快配送速度、优化配送路径等措施来提高企业的竞争力。
在优化配送路径方面,人们做了很多工作。20 世纪50 年代,美国数学家Bellman等人在研究多阶段决策过程的优化问题时提出了动态规划法。动态规划法解决了线性规划和非线性规划无法处理的多阶段决策问题[4]。后来,试图将图的广度优先搜索算法、蚁群算法与动态规划法结合求解关键路径问题[5,6,7,8,9],或者简单使用动态规划法研究物流配送的最短路径[10,11],但所有这些方法都无法对时变环境下的路径进行随机选择。
本文根据动态规划的基本思想,通过对传统动态规划模型的改进,将服装物流配送过程中因道路、天气、车辆状况等引起的突发事件考虑到模型中,提出了一类高效实用的服装物流配送路径优化方法。通过该模型的应用,服装连锁企业可以得到尽量优化的配送路径,对降低配送成本、提高服务质量、提高企业经济效益具有重要的意义。
1 动态规划法简介
1.1 动态规划法的基本思想[4]
美国数学家Bellman等人在研究多阶段决策过程的优化问题时,通过将多阶段过程转化为一系列单阶段问题,然后逐一求解,创立了解决多阶段过程的动态规划方法,即通常所说的Bellman最优性原理。动态规划算法的基本思想是将待求解问题分解为若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。因此,为了运用动态规划法,所考虑的问题: (1)必须能够分解为相互重叠的子问题; (2) 满足最优子结构的特性———子问题的局部最优将导致整个问题的全局最优; (3) 无后效性———当前状态是此前历史的总结,此前的历史只能通过当前的状态去影响未来的决策。
1.2 动态规划法的求解过程
在多阶段决策过程中,将决策过程分为n个阶段,每个阶段所作的决策用Pll,=1,2,…,n,表示,设Sii=,0,1,2,…,n,为问题求解过程中的各个状态,根据动态规划法的思想[11],可以用图1 表示多阶段决策过程。
这里,决策Pl不是任意确定的,它依赖当前面临的状态,又影响以后的发展。
各个子问题之间的重叠关系通过状态转移方程(或动态规划函数)来表现。为了避免重复计算,将子问题的解填入表中。
动态规划法利用最优性原理,采用自底向上的方式,先求出子问题的最优解,然后逐步求得整个问题的最优解,其求解思路如图2所示。
因此,使用动态规划法进行决策,需要将原问题分解为若干个相互重叠的子问题,进行分段决策;然后根据最优性原理,分析问题,建立状态转移方程(或动态规划函数);最后采用自底向上的求解方法,求出问题的解,从而实现动态规划过程。
2动态规划法在服装配送路径优化中的应用
2.1服装配送路径优化的动态规划模型
服装运输需要考虑服装存储、装卸、流通加工、配送等诸多因素,我们在此只考虑服装配送中的路径选择问题。设某服装企业有一配送中心A,有若干客户M1,M2,…,Mn。各客户的空间位置与需求已知,配送中心到各客户之间是可达的,运载能力给定。车辆从配送中心A出发,完成若干节点(客户) 的配送任务,最终回到配送中心A。要求合理安排最短配送路线与合适行车时间,且配送费用最省。
假设从节点s出发有一条最短回路s,s1,s2,…,sn,s。如果从节点s到节点si是所需要的,那么现在需要求出从节点si到节点s的最短路径,显然这条路径是存在的,假设为si,…,sp,s;反之,如果存在另外一条最短路径si,r1,r2,…,rq,s,则回路s,s1,s2,…,si,r1,r2,…,rq,s比s,s1,s2,…,sn,s更短。因此问题的描述符合最优性原理。
为了构建简单实用的服装运输车辆配送路径选择的数学模型,假设:
(1)配送车辆满足一次配送要求;
(2) 配送点是可达的;
(3)完成一次配送所采用的运输方式相同;
(4)单位成本固定;
(5) 配送时间在可接受的范围内。
因此,从服装配送中心s出发,假设有s0,s1,s2,…,sn个配送点,令,V'为V的子集,则根据动态规划法,从配送中心s出发经过V'中所有配送节点一次(且仅一次),然后回到配送中心s的最短路径长度,即服装配送路径最优化问题可用下式来表达:
这里,,表示符合条件的最短路径长度。
状态转移方程为:
其中,lik表示节点i到节点k的路径长度,lks表示配送点k到配送中心s的路径长度,e为突发事件影响因子,正常情况下,e=1。
2.2 服装配送路径优化的算法实现
用数组l[n][n]存放顶点之间的距离(这里n为配送点的个数),动态规划法的填表过程可用以下算法实现。
(1)初始化
(2)迭代
(3)信息更新
对中的每一个元素,有:
(4)输出最短路径长度
由以上实现算法可知,所求最短路径,即的值。按照此过程进行倒推,即可得到问题的最优解。
3实例
假设某服装企业要从其配送中心S将服装送往其连锁店A、B、C、D,然后再回到配送中心S,以便进行下次送货,其含权路线如图3所示。
根据动态规划法,首先进行填表。为了方便计算机编程,对n个节点进行编号,假设各节点编号为0~n-1,则数组V的大小为2n-1;将迭代结果存于数组中,则根据状态转移方程(2)可知,从配送中心S出发经连锁节点A、B、C、D,然后回到配送中心S的最短路径长度为:
(1)最后阶段的决策
(2)中间阶段的决策
由式(3)所做出的最后阶段决策依赖于下面的决策。
式(4)所做出的决策由下式(5)决定。
式(5)所做出的决策由下式(6)决定。
由图3及式(2)得到:
将相应的数值填入表1的相应位置。
由式(6)可得:
由式(5)可得:
将所得数值填入表1中。
由式(4)可得:
将所得数值填入表1中。
最后由式(3)得到表1的最后一列数值:
所以,从服装物流配送中心S出发的服装物流配送最短路径长度为27,最优路径为S→C→B→A→D→S。
服装连锁企业一般位于人口稠密、交通拥挤的市中心,另外受天气(如广东、福建等沿海地区的台风,北方的雾霾)和道路维护等的影响,在服装配送过程中,随时都会发生道路拥堵、车辆故障等突发事件,而且这种突发事件一旦发生,毫无疑问会延误对其他连锁店的配送时间。因此,在使用动态规划法设计服装物流最短路径时,必须考虑这些因素的影响。假设突发事件的影响因子为e,其取值为0刍e≤10,若e=1表明道路通畅、能见度正常,e刍1表明道路、天气等优于正常情况,e酆1表明道理拥堵、能见度低,此值越大,说明情况越糟。
假设图3中各边的权重是e=1时的情况,CB段和DS段因道路维护造成拥堵,使得突发事件影响因子e酆1,令e=5,则图3调整后得到图4所示。
对图4使用上述动态规划法,得到表2。
由表2可知,当CB段与DS段发生突发时间造成拥堵时,有两条最优路径可选,即S→C→D→B→A→S或S→B→D→C→A→S,且最优路径长度均为28。遇到这种多路径可选的情况,可根据车辆积载情况、配送的具体情况合理选择,在此不作详细讨论。
4 结论
根据动态规划的基本思想,在考虑天气、路况、车况等突发因素的情况下,引入突发事件影响因子,提出了改进的动态规划算法,并通过实例,演示了所提算法求解连锁服装物流配送的最短路径的过程,对降低连锁服装企业的配送成本、提高服务水平和企业经济效益具有一定的实用价值,同时也可以将此算法推广应用到其他行业。
摘要:连锁服装配送中路径的优化对提高连锁服装企业的服务水平、降低成本、提高企业效益具有重要意义。根据动态规划的基本思想,结合连锁服装物流配送过程中的路径选择问题以及时变因素,引入突发事件影响因子,提出了适合连锁服装物流配送过程中改进的路径优化算法。通过具体实例,验证了该方法在连锁服装物流配送的路径随机选择中的实用性和可行性,并可将此算法推广到其他物流配送的路径选择中。
动态路径规划 篇9
关键词:信息系统,动态评价,偏最小二乘路径模型,统计检验,改进
随着国民经济和信息化建设的发展, 信息系统已经广泛应用到从城市到农村的社会各个领域, 用现代信息科技支持着各个组织的不同任务目标。组织对信息系统的日益依赖使得信息系统绩效成为了组织管理者关注的重要问题, 通过绩效评价帮助掌握信息系统的内在价值。对信息系统的绩效评价是一个复杂的社会过程, 对它的研究已经从经济学、计算机科学、心理学等角度展开[1]。但是先前的研究[2]大都集中在信息系统某时点上的绩效评估, 很少对信息系统绩效的时间变化进行研究。然而, 在多元化的经济时代信息技术、组织业务流程、目标的易变性导致信息系统所处的内外环境易变, 动态评估作为信息系统的一种重要的反馈学习手段就变得非常必需和重要, 它可以帮助组织发现信息系统与当前组织环境不相适应的潜在要素, 从而改善信息系统绩效、提高信息系统技术对组织目标的贡献。
1 信息系统绩效的动态评价
1.1 绩效动态评价的含义
随着信息化建设的深入推广, 信息系统在各组织内的应用程度逐渐增加, 及时、必要的信息系统评价就显得非常的重要。信息系统评价在广义上包括了信息系统在整个生命周期中计划、开发、交付实施不同发展阶段的评价。在信息系统所处不同阶段的评价活动就构成了信息系统全过程的动态评价机制[1];在这些评价活动中, 它们的评价指标是不相同的, 根据信息系统所处阶段的不同而各有侧重, 它们的作用是对每个阶段的反馈和总结, 从局部到整体帮助信息系统设计目标的实现。
这里所研究的信息系统绩效的动态评价是指信息系统在同一发展阶段中展开的多次评价而构成的阶段性动态评价机制。这种阶段性动态评价具有特定性, 通常情况下所使用的评价指标是相同的, 它的作用是反映某阶段中信息系统的状态及其变化, 从而改善该阶段对应的信息系统绩效。同时阶段性动态评价的发生通常是由事件或时间间隔驱动的, 当某阶段中的内或外环境发生改变或达到时间间隔长度时, 就触发阶段性的多次评价, 以克服信息系统绩效表现的滞后性[3]、确保实现该阶段对应的信息系统目标。图1为动态评价的一般步骤。
1.2 评价方法
信息系统评价的指标体系随着信息系统评价的研究得到了不断的发展和完善:从单独的财务、经济管理、行为科学的角度到综合性的指标体系;从单一的实施阶段的评价指标到全过程生命周期多阶段的评价指标体系[4,5]。这些指标大都具有定性描述、抽象程度各异、指标体系庞大的特点。因此根据信息系统评价指标的特点, 大部分研究[2]所采用的基础评价方法为模糊综合评法和层次分析法, 同时单一的评价方法往往无法解决评价中遇到的所有问题, 评价方法发展为几种基本方法的结合使用, 如层次分析法与模糊综合评判法结合产生了模糊层次分析法、小波变换与人工神经网络相结合产生了小波神经网络、灰色评价法与层次分析法结合产生了灰色层次分析评价。但是这些方法中权重的确定一般都为专家的主观给定, 同时缺乏对指标间与指标层级间的有效关系的说明, 因此对某时点的信息系统的绩效评价引入偏最小二乘 (Partial Least Square) 路径模型, 这个模型可以建立不同抽象度的评价结构和路径因果关系、克服评价中权重给定的主观性以及指标体系中的多重共线性对评价结果的影响。对不同时点评价结果的差异比较, 就需要从不同时点的评价模型的结构和评价分值两个角度进行分析, 常用的是统计检验方法验证性分析不同时点评价结果的差异。
2 偏最小二乘路径评价模型
偏最小二乘 (Partial Least Square) 路径模型是结构方程建模估计技术的一种, 是由Herman Wold在1985年提出来的。近几年, 该方法得到了迅速的发展和应用[6,7,8], Goodhue[6]研究了在信息系统评价中PLS方法与样本大小及模型的统计效力之间的关系;Moores[7]等人用PLS路径分析模型研究了信息系统用户的自我效能的特点。可以发现偏最小二乘路径模型能够克服传统结构方程建模方法的“不确定解”和“违背分布假设”等问题, 能够通过逐步迭代的方法解决大量指标之间存在的多重共线性影响, 并且能很好的支持小样本数据, 因此本文将引入PLS路径模型对信息系统绩效进行评价。
在路径模型中无法直接获取信息的有关变量称为潜变量, 能够直接测量并且能够反映某一潜变量的一个侧面的变量称为显变量。因此结构方程由两个方程组构成:表示潜变量与显变量关系的测量方程组, 称为外部模型, 如公式 (1) 。
undefined
其中, ξj为第j潜变量, xjh为属于第j潜变量的第h显变量, undefined是第j个潜变量受它的第h个显变量影响的边际强度称为权重系数;Mj是与第j个潜变量对应的显变量的指标集;δj是残差。如果外部模型采用反射方式把隐变量看作是主动的, 显变量是被动的, 并且受到所属隐变量的影响, 则隐变量对它的某个显变量影响的边际强度, 称为负荷系数。
反映潜变量内部关系的结构方程组, 称为内部模型, 如公式 (2) 。
undefined
其中, βji表示第i个潜变量对第j个潜变量直接影响的边际强度称为路径系数;Hj是对第j个潜变量产生影响的其它潜变量的指标集, vj表示干扰因素。
路径模型建立后利用PLS算法来估计模型中各个参数, 进而求解出整个结构方程模型。PLS算法原理是:外部、内部方程按一定方式进行循环迭代, 使得在一定条件下所有参数的估计会达到收敛状态, 并且使所有方程的残差方差最小。PLS算法一般包含三个部分[9]。第一部分为外部模型估计, 对外部模型每一个隐变量可以用对应的显变量的线性组合来逼近。对比公式 (1) , Yj为潜变量ξj的外部估计, 表示为公式 (3) , 其中undefined为外部模型中的权重。
undefined
第二部分为内部估计, 潜变量ξj由与之相关联的其他潜变量ξi的估计值Yi来估计, 记为Zj如公式 (4) , 其中eji为内部权重, 为Yj和Yi的相关系数的符号函数值。
Zj=∑eji·Yi (4)
第三部分为对权重undefined的估计, 一般有两种估计方法, 其一为显变量xjh关于Zj的协方差系数, 其二为Zj关于显变量xjh的回归系数向量。最后对权重向量undefined进行迭代计算, 直至满足收敛条件。
3 动态评价实例分析
3.1 评价设计
由于信息系统交付实施阶段较其他阶段的持续时间长, 更易受到内外环境改变的影响;在这一阶段进行信息系统绩效的动态评价更具有意义和代表性。因此, 以某路桥管理公司的桥梁管理信息系统 (CBMMS) 为评价对象, 对其在交付阶段的绩效展开动态评价分析。
CBMMS在2005年11月开发完成并交付使用, 作为售后服务的一项内容, 在2006年7月对用户满意度进行了问卷调查。调查问卷的问项设计是一个基于用户满意度的信息系统评价指标体系[10], 如图2所示;问卷发放对象共39人包括32名一般用户、5名管理层用户以及2名领域专家, 收到有效问卷共39份。大约在一年半后, 该公司所负责管理的特大型桥梁数量增加了2座, 小桥增加了2座。于是在2008年1月触发进行了第二次绩效评价。调查问卷的问项内容不变;问卷发放对象仍为39人, 但在第一次调查中的一般用户中有2人离开, 但是接替工作的另外2人到第二次调查时已使用该系统1年时间, 因此对评价结果的影响甚微。
3.2 评价模型及结果
问卷调查的量表测量属性通常由内部一致性信度、内敛效度进行评价, 以验证本文所使用的量表是否适当而充分[9]。潜变量与所属的显变量之间的内部一致性信度是通过由综合信度CR (Composite Reliability) 来衡量, 内敛效度是指测量同一概念不同问项之间的相关度, 是由各潜在变量的AVE (Average Variance Extracted) 以及相应可测变量的负荷系数来衡量的。两次评价的各显变量的负荷系数、权重、各自的t统计量以及潜变量的CR和AVE值, 如表1所示。
*t统计量的值大于3.57时置信度p<0.001
从表1可以看出, 在两次评价中所有潜变量的综合信度CR都超过了临界值0.707 (研究表明综合信度的临界值是0.70) [9], 说明所有变量的信度较高, 因此保留了全部问卷调查表中的问项。两次评价的所有显变量的负荷系数都高于临界水平0.60, 并且两次评价的所有潜在变量的AVE值都大于0.50 (研究表明AVE的临界值是0.50) , 说明变量的内部收敛度都很高。表明了评价所使用的问卷调查的量表测量属性通过了检验是有效的。
然后根据基于用户满意度的绩效评价指标体系进行路径建模, 路径模型如图3所示, 其中箭头代表变量间影响的路径, 箭头指向表示其影响关系的方向, 箭头连线的虚实表示路径在检验后的存在性, 椭圆框表示模型中的潜变量。潜变量“系统技术水平”在这个路径模型中为内生变量。
经过PLS进行模型参数估计以及使用Bootstrap (自助再抽样) 方法, 并以150次自助再抽样为基础计算标准误差, 得到先后两次绩效评价的路径模型的参数及t检验统计量 (原假设为路径系数不显著) , 分别为图3和图4 所示。箭头连线上的数字表示路径系数和括号内的再抽样t统计量, 各潜变量下方为可决系数R2值。路径系数反映了潜在变量之间影响的方向和影响的程度;R2值反映了结构模型中, 内生潜在变量能被前面潜在变量解释的程度, 也反映了模型的预测能力。
(*置信度p<0.001)
(*置信度p<0.001)
下面对所得的路径模型进行分析。在第一次绩效评价中, 所有路径系数的显著性均通过了检验。在对用户满意度的综合评价的直接影响中, “信息服务质量 (ISQ) ”对其的影响最大, 表现为“ISQ-EUS”的路径系数最大;在“系统技术水平 (STL) ”的直接影响中, “管理绩效”所受的影响最大, 表现为“STL-ME”的路径系数最大。在第二次绩效评价中, 路径“T-EUS”没有通过系数显著性检验, 说明在一年半后“系统的学习培训 (T) ”并不显著影响综合评价;除此之外的路径系数均通过了显著性检验。在对用户满意度的综合评价的直接影响中, “管理绩效 (ME) ”对其的影响最大, 表现为“ME-EUS”的路径系数最大;在“系统技术水平 (STL) ”的直接影响中, “信息服务质量 (ISQ) ”所受的影响最大, 表现为“STL-ISQ”的路径系数最大。
最后对两次评价结果差异进行分析及统计检验。路径系数的变化表现为模型结构关系的变化, 这种变化常常采用统计检验方法中的Smith-Satterthwait检验[7], 对于各变量的评价分值的变化则采用异方差均值t检验。用这两种检验分别对不同评价结果在路径结构和得分均值上的差异进行统计验证, 路径系数变化及检验结果如表2所示, 各变量的评价得分的均值及检验统计量如表3所示。
置信度:*p (双尾) <0.05, ** p (双尾) <0.01, *** p (双尾) <0.001
由表2可以看出, 除了两条路径“T-EUS”、“ISQ-EUS”外其余路径的系数均明显发生改变, 表明了潜变量之间的影响程度发生变化。其中路径“ME-EUS”的系数显著增加, 说明该信息系统的“管理绩效 (ME) ”随着时间的变化对综合评价的影响加大, 被调查者对“管理绩效 (ME) ”的关注增加;路径“STL-ME”、“STL-T”、“STL-ISQ”的系数显著减小, 说明该系统的“系统技术水平”随着时间的变化对其他潜变量的影响或支持明显减小了。
置信度:* p<0.05, ** p<0.01, *** p<0.001
潜变量的评价得分由所包含的显变量的评价分值与表1中所对应的权重进行加权平均而得。由表3可以看出, 指标“系统的容易使用性 (EU) ”和“系统的学习培训 (T) ”在两次评价中的得分均值没有明显变化, 表明系统用户对这两个指标的评价在均值上没有显著区别;而其余各变量的均值在第二次评价时均有所减小, 表明系统用户对这些变量对应的指标的评价在均值上显著降低。
3.3 差异性分析及改进建议
下面将分析在距离第一次评价的大约一年半后导致了动态评价的显著差异性的原因。首先, 如先前所述该桥梁管理公司管辖的桥梁数量增加导致了该公司的养护管理工作增加, 因此对该信息系统在数据管理和信息分析的支持需求增加、对提高桥梁管理绩效的急迫要求, 这就表现为指标“管理绩效”对综合评价的影响显著增加, 在第二次评价中的得分均值显著减小。其次先进桥梁故障检测设备的使用产生了视频、音频等新的数据形式, 以及日益提倡的网络级的桥梁养护管理使得桥梁管理、财政、天气等单位的横向合作的跨平台业务大大增加, 这些就表现为“系统的信息扩展性 (IE) ”、“系统对管理控制的支持度 (MC) ”、“系统对业务流程支持的充分性 (AB) ”的评价得分的显著减小。同时信息技术的发展, 对地理信息系统GIS、决策支持系统DSS的了解和熟悉, 很大程度上可能会产生使用新技术的潜在需求, 表现为“信息技术的先进性 (AIT) ”的评价得分的显著降低。值得注意的是上述从实际环境变化找出的显著变化的指标, 对应着表3中较大的t统计量数值。可以发现, 在异方差t均值检验中那些较大的统计量值所对应的指标的评价分值的差异性也越显著, 反映了对该指标改进的急迫性;这就指出了动态评价差异性分析和系统改进的方向和内容。
因此从实际环境变化的分析以及绩效动态评价的结果显示都表明了该桥梁管理系统急需从“系统的信息扩展性 (IE) ”、“系统对管理控制的支持度 (MC) ”、“系统对业务流程支持的充分性 (AB) ”、“信息技术的先进性 (AIT) ”四个方面加以改进。
4 结论
在信息系统的生命周期中, 建立以偏最小二乘路径模型为基础的阶段性的动态评价模型可以克服权重确定、多重共线性、数据分布对信息系统绩效评价的影响, 从而发现所处当前阶段下信息系统绩效的状态变化、原因和改进方向, 帮助信息系统更加贴合组织目标和任务, 提高信息技术对组织的贡献度。对触发动态评价的方式仅仅给出了简单的事件或固定时间间隔的方式, 动态评价的触发机制将是进一步研究的内容。
参考文献
[1]郝晓玲, 肖薇薇.信息系统绩效全过程评价体系研究[J].情报科学, 2006, 24 (8) :1223-1227.
[2]刘先红.信息系统评价研究论文的统计分析[J].科技管理研究, 2008, 3:96-99.
[3]于秀艳.信息系统绩效动态评价的权重确定方法研究[J].情报杂志, 2007, 1:115-116.
[4]张玲玲, 佟仁城.企业信息系统项目综合评价指标体系探究[J].中国管理科学, 2004, 12 (1) :95-100.
[5]仲秋雁, 陆牡丹.企业信息系统的复杂性研究[J].科技管理研究, 2004, 1:67-69.
[6]DALE GOODHUE, WILLIAM LEWIS, RON THOMPSON.PLS, Small Sample Size, and Statistical Power in MIS Research[C]//Proceedings of the 39th Hawaii International Conference on SystemSciences, 2006:1-10.
[7]TREVOR T MOORES, JERRY CHA-JAN CHANG.Self-effica-cy, overconfidence, and the negative effect on subsequent perform-ance:A field study[J].Information&Management, 2009 (46) :69-76.
[8]QURESHI I, COMPEAU D.Assessing between-group differencesin information systems research:a comparison of covariance and com-ponent-based SEM[J].MIS Quarterly, 2009, 33 (1) :197-214.
[9]罗海成.顾客忠诚的心理契约机制实证研究[J].管理评论, 2006, 18 (1) :57-63.