迭代模型

2024-11-14

迭代模型(精选9篇)

迭代模型 篇1

1引言

高性能通信编码-“Turbo码”的出现极大地促进了Turbo解码和迭代处理方法在通信领域的应用。由于许多频率选择性衰落信道非常复杂,如浅水水声信道,经典的判决反馈均衡器在这些信道的通信系统中性能有待提高。于是人们利用Turbo解码和迭代处理方法提出了联合迭代均衡和解码的概念[1]。基于这种概念,Turbo均衡、硬迭代判决反馈均衡器、软迭代判决反馈均衡器和分步迭代判决反馈均衡器等接收机模型先后出现了。

Turbo均衡器用迭代的方法处理信道检测器和信道解码器输出的软信息,这种方法在具有符号间干扰(ISI)的信道中具有很好的性能。Turbo均衡在某些噪声环境和信道条件下已获得一定的应用,并具有高达5dB的增益[2,3]。但是,在符号间干扰较长的情况下Turbo均衡的计算量会非常巨大,同时在复杂信道中对信道的误估计将使其性能很糟糕。

自适应判决反馈均衡器能够自动地调整均衡器系数,以使指定的性能指数最优化,并能自动补偿信道特性的时变。为了进一步提高均衡器的性能,人们把均衡器和解码器结合起来发明了几种迭代均衡的结构模型[4]:硬迭代判决反馈均衡器、软迭代判决反馈均衡器、分步迭代判决反馈均衡器等。这些基于判决反馈均衡器(DFE)的迭代均衡器相对Turbo均衡器具有较小的计算量,因此更适于处理较长符号间干扰的信号。

本文先给出以上几种均衡器的模型,并进行描述和分析,然后对它们进行比较和总结。

2Turbo均衡和迭代判决反馈均衡器的模型

(1)Turbo均衡器。

频率选择性离散信道可以描述为一个码率r=1的定义在实域或复数域的卷积编码器,所以信道编码器和ISI信道的组合可以看作一个串行级联系统,如图1,该性统可以象Turbo解码一样进行迭代处理。

来自信源的比特流{b}经过编码和映射后生成基带信号{d}。{d}经过外部交织器生成已交织信号{e},{e}和训练序列tn一起构成发射符号序列{z},并通过传递函数为h(t)的离散信道进行发射。接收端以符号速率进行采样后获得信号序列{y}。{z}和{y}可分别表示为:

undefined

T代表转置,A为训练序列长度,R为交织器长度。Wn为离散加性高斯白噪声(AWGN),其均值为0,方差为σ2。接收端{y}送入均衡器和信道估计器,均衡器采用软输入软输出LOG-MAP准则[5],根据卷积码的网格进行前向、后向计算。信道估计器首先根据训练序列进行软输入信道估计[6],然后丢弃训练序列,利用训练序列的收敛结果继续进行信道估计,并把信道信息送给均衡器。

均衡器输出的符号似然信息{e’}经外部解交织后进入解码器,根据LOG-MAP准则进行解码。解码器输出的比特似然信息经过处理后得到对应的符号概率信息{p’},并进行外部交织,然后送入信道估计器和均衡器进行迭代估计和均衡。经过若干次迭代后通过解码器输出信息比特。

(2)硬迭代判决反馈均衡器。

传统的判决反馈均衡器由前馈滤波器、反馈滤波器和逐符号判决器组成,反馈滤波器的输入为逐符号判决器输出的已判决符号,如图2中虚线框所示。若Ik为从信道接收的信号,undefined为对前馈滤波器对第k个信息符号的估计输出,undefined为判决器输出的第k个判决结果,cj 为均衡器系数,则判决反馈均衡器的输出为undefined。

判决反馈均衡器的性能决定于其先前判决的符号的正确率,只有正确的符号才能使均衡器的系数获得优化,相反,错误的判决反馈会导致更多的错误输出,即形成错误传播。通过改变接收机的结构,基于迭代处理方法,利用上一次迭代处理时解码器的输出信息重新进行均衡和解码可以有效地减小这种错误传播。

图2给出了硬迭代判决反馈均衡器的结构图,在第一次均衡和解码时,硬迭代判决反馈均衡器利用其自身的逐符号判决器对前馈滤波器的输出进行硬判决,该判决输出直接输入均衡器的反馈滤波器。之后,如果进行迭代,解码器的硬判决输出经过交织后送给均衡器的反馈网络,此时均衡器的逐符号判决器不工作。迭代过程利用解码器的增益获所获得的较小误码率的输出来代替均衡器的逐符号判决器输出,从而改善均衡器性能。当然,均衡器的反馈错误传播由于解码器输出仍可能存在误码而不会完全消除,但是,无疑会大大减小。

(3)软迭代判决反馈均衡器[7]。

软判决比硬判决具有较高的增益,为了进一步提高迭代判决反馈均衡器的性能,用解码器的软判决输出代替其硬判决输出无疑是一种很好的选择,图3给出了这种软迭代判决反馈均衡器的结构模型。

假设在高信噪比时,噪声和残存的符号间干扰在前馈滤波器输出的符号序列中呈高斯分布,且其方差未知。则可容易求得在k时刻undefined的先验信息undefined。

其中vk为接收机接收到的符号,sm 为符号集中的第m个符号,σ2为估计信号序列undefined的方差,dundefined为估计信号序列的第k个符号与信号集中第m个信号的欧氏距离,HΔ为与k时刻方差有关的常数。这样可以利用估计信号序列的软信息和解码器输出的软判决构成软迭代判决反馈均衡器。

这种均衡器结构和硬迭代判决反馈均衡器的最大区别在于其逐符号判决器的不同。为了向反馈滤波器提供硬判决值,这种新的判决器要利用估计序列的软信息和解码器输出的软判决信息,并进行硬判决。这种方法减小了均衡器的反馈滤波器中错误传播的概率,并提高了整个通信系统的性能。这种新的判决器由两部分组成:一个判决检测器和方差估计器[7]。图4给出了这种判决检测器的结构图。

(4)分步迭代判决反馈均衡器。

分步迭代判决反馈均衡器主要是针对判决反馈均衡器反馈滤波器的错误传播提出来的,它对较短的接收信号数据块进行一次或多次处理,前一个数据块作为下一个数据块的训练序列。由图5可以看出这种均衡器的结构模型和图2中硬迭代判决反馈均衡器完全相同,只是把图2中一次处理的较长的数据包分成若干较短的数据块。

这种处理方法也是首先处理训练序列,然后再处理各个短数据块。一个短数据块的解码器输出的bit概率信息经过转换,形成符号概率信息,进行硬判决后进行交织,这些已交织符号作为下一个短数据块的训练序列对均衡器的参数进行训练,经过训练后的均衡器再对下一个短数据块进行处理。由于可以使均衡器系数得到更好的训练和优化,这种把长的数据包分成短数据块的方式可以很好地减小反馈滤波器的错误传播。当然,这种均衡器也可以对每个短数据块进行多次迭代处理。

在分步迭代判决反馈均衡器结构中,解码器所对应的编码可以是分组码、卷积码、级连码或Turbo码等。考虑到长的数据包被分成短的数据块,交织长度的缩短对Turbo码的性能影响很大,所以通常用卷积码。实际应用中短数据块的长度对判决反馈均衡器和解码器的性能都有直接的影响,所以适当地选择短数据块的长度是非常关键的。

3分析和对比

以上给出的Turbo均衡和几种迭代判决反馈均衡器各有特点。从其计算的复杂性来看,如果采用相同的编码和解码方法,则Turbo均衡计算量最大,分步迭代判决反馈均衡器和软迭代判决反馈均衡器次之,硬迭代判决反馈均衡器计算量最小。Turbo均衡中把符号间干扰信道作为卷积编码器,该卷积码的约束长度等于符号间干扰长度,所以其计算量以符号间干扰长度为指数呈幂指数增长,较长的符号间干扰将使计算量变得难以承受。分步迭代判决反馈均衡器中每一个短的数据块都要作为下一个短数据块的训练序列,所以判决反馈均衡器在一次迭代中要对每一个短数据块处理两次,所以增加了判决反馈均衡器的计算量。软迭代判决反馈均衡器由于增加了方差估计器和前馈滤波器输出符号的概率计算,所以相比硬迭代判决反馈均衡器的计算量要大。软迭代判决反馈均衡器和分步迭代判决反馈均衡器的计算量的比较只有针对特定的判决反馈均衡器(DFE)和编解码方法才有意义。

以上所有均衡器的结构模型的设计目的都是为了减小反馈滤波器中的错误传播,从而提高均衡器的性能。尽管Turbo均衡在高斯白噪声信道情况下具有非常好的性能增益,但是对于复杂信道由于其信道估计器的不准确性使得Turbo均衡器的性能非常糟糕[8],所以大多数情况下Turbo均衡都不太适用。由于分步迭代判决反馈均衡器和软迭代判决反馈均衡器都是对硬迭代判决反馈均衡器的改进,所以二者的性能都要比硬迭代判决反馈均衡器好。软迭代判决反馈均衡器主要利用了软判决比硬判决增益大的特点,而分步迭代判决反馈均衡器通过逐步训练均衡器系数的方法来提高增益,在实际应用中应选择好短数据块的长度。

总之,在实际应用中应根据实际信道的特点、编码方法、所能承受的计算量和所要求达到的性能来选择合适的迭代判决均衡器结构模型。

参考文献

[1] C.Douillard,M.Jezequel,C.Berrou,A.Picart,P.Didier,A.Glavieux.Iterative cancellation of intersymbol interference:Turbo e-qualization.European Transactions on Telecommunications,September 1995.507~511

[2] W.Ryan.Concatenated codes for class IV partial response channels.IEEE Trans.On Commun.,Mar.2001.49,445~454

[3] T.Duman and E.Kurtas.Comprehensive performance investigation of turbo codes over high density magnetic recording channels.Globecom 99,1999.1b,744~748

[4] F.Blackmon,E.Sozer,M.Murandian,J.Proakis,M.Salehi.Performance Comparison of Iterative/Integral Equalizer/DecoderStructures for Underwater Acoustic Channels.Oceans 2001.pages 2191~2200,MTS 0-933957-29-7

[5] Xuan Li,Wen-tao Song,Han-wen Luo.Joint Turbo-Equalization and TTCM for Frequency Selective Channels.Vehicular Tech-nology Conference.2001.VTC 2001 Spring.IEEE VTS 53rd.Volume 2.6-9 May 2001,pages:1259~1263 vols.

[6] Seongwook Song,Andrew C.Singer,and Koeng-Mo Sung.Soft input channel estimation for turbo equalization.IEEE Trans.onsignal processing.52(10):October 2004,2885~2894

[7] Mohamadreza Marandian,Masoud Salehi.LowComplexity Iterative Decision Feedback Equalizer for8PSK Modulation in Time Dis-persive Channel.IEEE International Symposium on Volume 1.30 Sept.-3 Oct.2001 pages:A-102—A-106 vol.1.

[8] E.M.Sozer,J.G.Proakis,F.Blackmon.Iterative Equalization and Decoding Techniques for shallow water Acoustic Channels.Oceans 2001,pages 2201~2208,MTS 0-933957-29-7

渐进迭代式开发 篇2

当从一开始需求就不清晰或客户希望所感兴趣之系统存在引入新技术的可能性时,则使用IID方法。基于一系列最初的假设,开发候选的所感兴趣之系统,然后对其进行评估以确定是否满足用户需要或需求。若不满足,则启动另一轮演进,并重复该流程,直到交付的系统满足利益攸关者的要求或直到组织决定终止这项工作。

多数文献一致认为IID方法最适用于较小的、不太复杂的系统或系统元素。这种方法的重点在于灵活性以及当风险可接受时允许所选事件从序列中排除。以这种方式的剪裁突出了产品开发的核心活动。

IID方法区别于计划驱动方法的特征是速度和适应性。当市场战略经常强调“上市时间”或速度至上时,更适合的准则是“速度”,它既考虑了速度的大小,又考虑了方向。通过让客户加入工作层级团队,项目接收“团队工作方向优先满足用户最高需求”的持续反馈。这种方法的一个缺点是面对经常改变方向的客户时,这种反应式项目管理可能产生不稳定和混乱的项目。一方面,这种方法避免由于错误假设引起的巨大投资损失;另一方面,对战术观点的强调可能产生短期或局部解决方案的优化。

当需求在生命周期的早期就是已知的,但为了允许最新技术的引入或需要或需求的潜在变化而渐进地实现功能开发时,IID本质上也可是“计划驱动的”。

一种特定的IID方法论被称为演进式开发,在研究与开发(R&D)环境中很常用。图1阐明这种方法如何被用于NASA航天飞机隔热瓦的演进之中。

迭代模型 篇3

1 材料与方法

1.1 扫描方案

采用256排螺旋CT(GE Revolution CT)对模型进行扫描,包括20 cm水模及QA模型。根据技术手册要求,以120 k V、315 m A条件扫描20 cm水模,测量CT值标准差(standard deviation,SD)、低对比探测能力(low contrast detec tability,LCD)。以120 k V、315 m A条件扫描QA模型,以调制传递函数(modulation transfer function,MTF)为评价指标测量空间分辨率。测量结果与技术手册推荐值对比,合格即可进行后续研究。再以120 k V、200 m A条件分别扫描20cm水模及QA模型,测量SD、LCD及MTF。

20 cm水模扫描参数:扫描类型,轴向;探测器范围80 mm,旋转时间1 s,管电压120 k V,管电流315/200 m A,扫描视野,小体型;高分辨率模式,关闭;图像层厚5 mm,显示视野22.7 cm,重建类型为标准。

QA模型扫描参数:扫描类型,轴向;探测器范围160 mm,旋转时间1 s,管电压120 k V,管电流390/200 m A,扫描视野,小体型;高分辨率模式,关闭;图像层厚1.25 mm,显示视野15 cm,重建类型为骨骼加强。

1.2 图像重建

扫描获得的原始数据以不同迭代算法比例(ASi R-V%)重建11套图像,包括ASi R-V 0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%。其中ASi R-V 0%即FBP图像。不同百分比表示迭代重建所占权重,比如ASi R-V 50%的图像是由FBP图像与ASi R-V图像1∶1混合而成。测量并记录不同迭代比例重建图像的SD、LCD、MTF。针对每个指标,扫描3次,求平均值。

2 结果

2.1 测量结果与技术手册推荐值

以120 k V、315 m A条件扫描20 cm水模及QA模型,结果均符合技术手册要求。水模扫描图像见图1,QA模型扫描图像见图2。

2.2 测量结果

2.2.1 SD

不同扫描条件下,SD测量结果见图3。结果显示随着ASi R-V比例增加,噪声水平显著下降。ASi R-V 50%、ASi R-V 100%较FBP的SD分别降低约32%、58%。

2.2.2 LCD

不同扫描条件下LCD测量结果见图4。结果显示随着ASi R-V比例增加,噪声水平显著下降,因此密度分辨率随之明显提升。ASi R-V 50%、ASi R-V100%较FBP的LCD分别提高约12%、21%。

图1 20 cm水模扫描图像,用于测量SD、LCD

图2 QA模型扫描图像,用于测量MTF

图3迭代比例对SD的影响。随着ASIR-V%增加,SD降低

图4迭代比例对LCD的影响。随着ASIR-V%增加,LCD提高

图5迭代比例对MTF的影响。随着ASIR-V%增加,MTF略有提高。A.200 m A;B.315 m A

2.2.3 MTF

不同扫描条件下,MTF的测量结果见图5。结果显示,随着ASi R-V比例增加,MTF50、MTF10略有升高。ASi R-V 50%、ASi R-V 100%较FBP的MTF50的MTF50分别提高约2%、5%。

3 讨论

随着迭代算法逐渐取代解析算法,对新算法的研究成为CT技术发展的方向之一。算法对图像质量的影响是研究的主要内容。对于重建算法的评价主要包括降低噪声的能力、提高密度分辨率的能力以及对空间分辨率的影响。

SD是指均匀物质扫描图像中各点之间CT值的上下波动,也可解释为图像矩阵中像素值的标准偏差[9]。本研究结果显示,随着ASi R-V比例增加,SD水平显著下降。

密度分辨率又称为低对比分辨率或LCD,是在低对比度条件下分辨物体微小差别的能力[10]。随着ASi R-V比例增加,SD水平显著下降,因此密度分辨率随之明显提升。

空间分辨率又称为高对比分辨率,是在高对比度条件下区分相邻最小物体的能力。既往研究表明,随着迭代比例增加,空间分比率随之下降;也有研究表明随着迭代比例的增加,空间分比率不下降甚至有所改善[11,12,13]。既往研究中对于空间分比率的测量多是通过扫描线对模型,主观计数的方法,此方法主观因素影响大,可靠性、重复性较差。本研究利用MTF客观评价图像的空间分辨率,观察空间分辨率随ASi R-V比例增加的变化规律。结果显示,随着ASi R-V比例增加,MTF50、MTF10略有升高。

2008年推出的ASi R通过建立统计噪声模型,并利用迭代的方法对噪声加以校正和抑制,得到更清晰的图像。ASi R技术可以显著降低图像的噪声,改善图像质量,与FBP算法相比,扫描剂量降低约50%。继ASi R之后,2011年推出的MBIR除建立噪声模型外,还建立了系统光学模型。体素、X射线光子初始位置和探测器几何因素均通过模型进行模拟。MBIR真实地还原了X射线从投射到采集的过程。与FBP技术相比,MBIR技术可以降低67%~82%的辐射剂量[14,15,16]。各模型中计算量最大的是光学模型,其可以提高重建图像的空间分辨率。2014年推出的ASi R-V技术在迭代过程中去除了光学模型,采用更为先进的噪声模型,同时纳入了被扫描物体模型和物理模型,使得可以在与ASi R相近的重建速度下获得与MBIR相似的图像质量,故命名为ASi R-V。

本研究结果显示,在120 k V、200 m A扫描条件下,ASi R-V 50%、ASi R-V 100%较FBP的SD分别降低约32%、58%,LCD提高约12%、21%,MTF50提高约2%、5%。ASi R-V重建算法在降低噪声、提高密度分辨率的同时,还能改善空间分辨率。

本研究的局限性为:①全部数据来自20 cm水模或QA模型,而性能模型不能完全模拟人体的多样性和复杂性。②本研究只应用120 k V,且仅选择高低两档管电流,未应用80 k V、100 k V等其他扫描条件。③噪声、密度分辨率、空间分辨率均是评价图像的客观指标,而客观指标不能完全反映图像质量。如当选择ASi R-V比例超过70%时,尽管各指标得到改善,但图像会出现蜡像状伪影或斑点状伪影,主观评价反而下降。④本研究未考虑图像重建速度,而重建的快慢也是临床应用中的重要指标。

总之,本研究的客观测量数据表明ASi R-V重建算法可以显著降低图像噪声、明显改善密度分辨率,且空间分辨率略有提高。

摘要:目的 通过模型研究,客观评价多模型迭代重建算法(ASi R-V)对CT图像质量的影响。材料与方法 在不同条件下,分别扫描20 cm水模型和QA模型。以不同迭代权重,对原始数据进行重建。迭代比例选择从ASi R-V 0%即滤波反投影(FBP)到ASi R-V 100%,间隔10%。比较不同迭代水平图像的噪声、密度分辨率及空间分辨率。结果 与FBP图像相比,随着ASi R-V比重增加,图像噪声水平明显下降,密度分辨率明显提高,而空间分辨率略有提高。在120 k V、200 m A扫描条件下,ASi R-V 50%、ASi R-V 100%较FBP分别降低标准差约32%、58%,提高低对比探测能力约12%、21%,提高调制传递函数50约2%、5%。结论 基于模型的ASi R-V不仅可以显著降低噪声、明显提高密度分辨率,而且略提高空间分辨率。随着迭代比例增加,改善效果增加。

参验:迭代创新的关键 篇4

参——把脉产品创新的方向 成功的产品创新需要创新者具备从数据中领悟、反思、洞察的本领和定力。

首先,参悟产品创新的机会,解决创新什么的问题。在互联网时代,以产品为王、为客户创造价值、抓住客户痛点等理念,已经成为产品开发的基本法则。然而,如何才能抓住新的产品机会,则需要创新者在“参”字上下功夫。马化腾指出:“从第一个产品QQ,到现在腾讯平台上的大量产品,用户需求和用户体验一直是腾讯的重中之重,但用户需求和偏好瞬息万变,95后、00后的需求是什么?我们每天都在研究。”

其次,参悟外部环境的变化,解决产品创新过程的动态调整问题。一项产品创新,往往起源于外部新的信息,包括客户需求信息、新的技术信息、行业发展信息、政府政策信息等。互联网时代是信息爆炸的时代,也是信息瞬息万变的时代,对于创新者来讲,必须对外部信息的变化时刻保持洞察力和警惕性,根据外部信息的变化适时调整产品创新的方向,以及内外部资源的匹配方式。

最后,参悟内外部资源的匹配,解决创新如何实现的问题。一方面,企业不能把自己看作一个封闭系统,完全依赖于自身的资源和能力进行创新。另一方面,企业完全崇拜外部技术、过度模仿竞品的开发思路也行不通。创新者需要立足于自身资源和能力的现状,以及对外部技术发展方向和可用资源的判断,在内生和外生资源之间把握一个合适的度。

验——验证产品创新的方向 “验”是指将通过

“参”初步确定的产品开发愿景转化为可证伪的基本假设,借助用户数据、工业大数据和物联网数据等,基于科学的实验方法,对其可行性进行实时验证。

首先,要找到验证产品或商业模式的核心指标。用户被定义为互联网时代产品开发的第一要素,企业的产品、资源和能力都要紧紧围绕用户这一核心去布局。验证产品服务的用户群是否准确,关键是验证创新者所定义的用户痛点是否准确。围绕用户痛点的方向和大小会产生一系列绩效指标,创新者要基于用户数据和科学的实验手段,实时验证这些绩效指标。

其次,验证产品功能,解决产品创新的爆点问题。创新者在锁定用户群、用户痛点之后,需要快速开发出能够解决客户痛点的产品,并对其有效性进行验证。基于精益创业的MVP(最小可行产品)思想已经成为目前验证产品功能备受推崇的方法。MVP强调根据用户需求所开发的产品原型不必复杂,重在体现产品的核心功能。

最后,验证产品创新的资源和能力匹配,解决产品创新的基本保障问题。资源和能力是产品创新的基本保障,在验证了产品的客户群和功能之后,如何合理配置资源和能力,是缩短产品进入市场时间,在短期内提升竞争力和利润水平的基本保障。在资源匹配上,企业只有基于历史经验和当前产品开发实际进行合理匹配,并形成基本的法则和惯例,才能够上升为企业的能力,才能够为成功的产品创新提供保障。

我们强调参验要贯穿于产品创新的始终,通过参与验之间的持续互动和迭代,不断逼近真实的用户痛点和有效的解决方案。参验需要以开放的形式展开,如果参与参验的人员具有多元化的技术、知识和管理背景,将有利于从不同角度反思和验证产品创新中出现的问题,更容易找到解决问题的方案。通过参验获得的每一次认知循环的结果都要付诸具体的创新行动之中,以起到指导创新实践的作用。

迭代模型 篇5

1.1教育游戏研究现状

教育游戏是“将生命的体验与乐趣变为学习的目的与手段的一套工具和方法论” (祝智庭, 2005) ;是“通过设计、开发、管理合适的技术情景和资源, 以促使学习者的生活体验与自身发展相融合为目标的理论与实践” (张琪等, 2006) 。它是一种“实现发现式探究”、“促进学习”、“激发学习动机”、“定制学习体验”的高级认知工具。目前, 游戏发展的广阔前景深化了教育界与游戏界专家学者的交流与合作, 用游戏的感性迎合学习主体的心理特征, 用教育的理性不断地把学习主体引向理性, 不仅能磨合传统教育中教育内容和教育主体之间的错位, 而且有利于游戏产业 (尤其是网络游戏产业) 摆脱目前经济价值很高, 但社会价值为负的尴尬局面。

国内外专家学者从教育游戏的发展、基本理论、设计和开发以及学科应用等多个不同的角度开展研究。在国内, 尚俊杰等人认为“轻游戏”是教育游戏的希望和未来, 并尝试直接将游戏的内在特征与课堂教学相结合, 提出“课堂教学游戏=教育软件+主流游戏的内在动机”, 进一步强调课堂的重要性、游戏的辅助性;周伯华、张文兰等学者对教育游戏从理论角度进行了解读与剖析 (教育游戏的理论基础、本质、价值等) ;宋敏珠、章苏静提出了EFM教育游戏设计构建的模型等。国内大多数研究主要集中于理论探讨和设计反思, 而在开发方面的成果较少。与此不同的是, 国外的专家学者更倾向于对教育游戏的设计、开发和学科应用, 比如Alejandro Echeverría等人提出了协作性课堂游戏设计与整合的框架;大型多人在线游戏模型 (Massive Multiplayer Online Gaming, 简称MMOGs) 研究比较成熟, 将其应用于教学获得了很多比较成功的案例, 比如Quest Atlantis、River Cit等。这些案例中的社会支持系统 (文字系统、社会系统和导航系统) 被整合到环境中, 为学生的学习搭建脚手架, 这样学生可以同时和很多系统进行交互;Heinz Susaeta等人也依据多人在线角色扮演类游戏 (MMORPGs) 模型设计出了基于课堂的多人呈现角色扮演类游戏 (CMPRPG) 模型。运用游戏 (如物理运动与游戏的结合的exergame) 、仿真、沉浸式世界和基于网络的情景等技术进行职前教师的教育显然已经成为一种研究热点。

1.2课堂游戏化教学模型的提出

笔者在《信息技术教学论》这门课程的实施中, 设计了一个课堂游戏化教学, 该游戏结合实际课堂还原游戏的教育本质, 取得了很好的教学效果。对其进行反思总结与理论升华, 建构了课堂游戏化教学模型。为了达到游戏模型再利用及提高游戏模型存在价值的目的, 课堂游戏化教学模型必须要有能够解释其提高课堂有效性的教育模式支持。本文的目的是要基于教育模型和游戏模型确保所有有着师范生背景的学生在协作学习的课堂环境中都是积极的参与者和创造者, 并且, 教师可以实时跟踪学生发展状况, 并引导学生进行习得与反思活动。基于此, 笔者在“理论基础—教学设计—实践应用—模型建构”的基础上提出了三轮迭代师范生课堂游戏化教学模型。

2三轮迭代师范生课堂游戏化教学模型

参考Alejandro Echeverría等人提出的课堂游戏的设计和整合框架, 该模型从实践出发, 研究和改进课堂游戏化教学的设计思路与实施方案, 力求解决教师在利用游戏教学过程中的难点。该模型的构建强调实践的重要性, 将已经在实践中取得良好效果的教学活动, 提炼成对教学设计者有指导意义的课堂游戏化教学模型。见图1。

2.1三轮迭代游戏教学模型建构

要想真正成为一个健全的躯体, 还要有反复的行为事件和思维。Diana Laurillard (2002) 认为, 教学基本上是一种对话活动, 教师和学生围绕着某一特定主题或目标迭代进行着对话。所以, 游戏教学也不例外地应该是一个迭代的过程。笔者根据实践经验提出了三轮迭代的游戏教学模型。

第一轮是教师根据设计的课堂教学游戏, 实施游戏教学, 引导学生体验游戏并让学生在游戏的过程中潜移默化地接触所要学习的教学内容。这个过程中可能会伴随着学生的反思, 学生的深度反思更加能够促进教学的效果。

第二轮是教师将所要达到目标的内容结合游戏进行教学活动, 采取课堂游戏与教学内容相结合的方法, 意在让学生关注游戏和内容之间的联系, 让学生明确教学内容, 实现教学目标。

第三轮是教师指导反思, 教师引导学生进行反思, 让学生将自己的反思进行共享, 由学习者之间进行互评。教师也针对相关疑惑给出解释和评价, 继而让学生根据理论的学习所得加上游戏体验的揣摩来进行实践——进行课堂教学游戏设计。然后再进行共享和互评, 加强课堂教学游戏设计这个薄弱环节的巩固。

还有一个关键的蕴涵于模型的每一个角落, 且任何时间都可能发生的因素——反思。反思可能贯穿每一个要素, 衔接每一个环节, 产生于每一个阶段。在使用游戏教学的过程中, 教师的作用非常重要, 他应该努力去推动学生进行协作学习、探究式学习和进行总结、反思等活动 (Hawley et al1997) 。

2.2组成元素建构

模型的主体是课堂教学游戏的两个主要脉络, 一个是教育维度, 一个是游戏维度, 游戏维度既支持着教育维度, 又受到教育维度的制约, 两个维度相辅相成。好的课堂游戏就是要将这两个维度完美地契合。当然还需要有一个稳定的能够激励学习者、维持游戏更好地实现教学效果的动机因素。核心的设计必须辅以软硬件的支持, 例如游戏所需要的道具、场地以及相关的软件, 当然整个教学游戏设计在讲求实用的同时也要给予美的享受, 所以整体设计不能忽略美学这个元素。

2.1.1 教学目标 (表1)

教育游戏的目的就是完成教学目标, 即通过游戏让学生接触、理解、体会或掌握信息、知识、技能、方法等。基于模糊、分形理论的教学目标, 不能像一般教学过程那样明确, 而应适当含糊正常态教学目标与非正常态教学目标之间的边界。换言之, 课堂教学中的那些教学目标, 是不能也不宜直接转移到教育游戏中去, 这样效果往往适得其反, 而适当进行改头换面, 经过模糊或分形“包装”, 似是而非效。

2.1.2 课堂游戏化教学动机

课堂游戏化教学要根据参与主体的特征来满足他们的需要。笔者根据马斯洛需要层次理论, 把课堂的游戏化教学的动机进行了阐释, 见表2。

2.1.3 教学环境

课堂教学环境就是学校教学活动中所必需的诸客观条件和力量的综合。教学环境可以分为物理环境和社会文化环境, 物理环境是教学赖以进行的物质基础和物理条件, 物理环境存在不同地区的经济、政治和文化差异。作为课堂游戏化教学的设计者, 教师必须立足已有教学条件展开教学, 不同的物理环境可能要进行不同的游戏化教学设计。物理环境是在教学过程中的固有环境, 然而教学的成与败很多时候取决于社会文化环境。社会文化环境是课堂中师生互动和生生互动的基本要素及状况的总和, 它大体包括师生互动与师生关系、同学互动与同学关系、课堂目标定向、课堂规则与秩序等。游戏化教学环境分类见图2。

游戏化教学中, 创造良好的社会文化环境就必须要遵循“创造良好的学习氛围”、“使学生处于愉快的状态”、“学生是学习的主体”、“及时反馈, 适时使用激励机制”等原则。教师和学生之间要建立一种平等、民主、互相尊重的关系, 教师要善于掌握学生的心理特点, 在精神上给予支持和鼓励, 理解和尊重学生的意愿, 注重培养学生的良好品德, 同学之间要团结、协作, 且要拥有良好的学习心态。

2.1.4 教学内容

不同知识类型的教学内容在游戏中的体现形式, 见表3。

2.1.5 游戏元素

游戏化教学的元素见表4。

2.1.6 组织策略、管理策略和传递策略

在游戏的实施阶段, 从教师的角度分析课堂是处于传授型教学系统的, 瑞格鲁斯将传授型教学系统的教学策略分为:组织策略、管理策略和传递策略。组织策略是指教育游戏应该按照何种方式组织、次序应该如何安排以及具体教学活动应如何安排的策略;教育游戏以什么样的媒体形式、按照什么样的顺序传递给学习者以及游戏过程中如何开展有效地交互活动, 游戏的参与者如何将游戏传递给观众等等, 都是传递策略要考虑的重点;管理策略考虑的是在游戏过程中应该如何恰当运用组织策略和传递策略, 从而达到预订的游戏效果。

2.1.7 教师主导、反思性观察

游戏是教学内容的载体, 是教学展开的“实验室”, 在游戏之后, 教师要对游戏的各个要素以及游戏中涉及到的策略等进行剖析, 并与当前所要传授的知识建立联系。游戏中的知识转移到实际的应用中, 教师起着重要的作用。教师主导整个教学内容的讲述, 在讲述中充分考虑学生中心地位, 引导学生对游戏的过程以简单回忆或者视频再现的方式进行反思性观察, 在反思性观察中引发学生思考、总结知识点、提高问题解决能力、增加学生的情感体验。

2.1.8 教师引导、形成性评价和总结性评价

在该教学游戏中, 教师主导和教师引导要根据实际的教学情况, 灵活地运用, 在某一个阶段要以一种方式为主导。形成性评价和总结性评价可以为游戏提供及时和深入的反馈, 对游戏的完善起到重要作用。形成性评价是在游戏运行过程中, 为使游戏效果更好而对游戏的组成要素、游戏规则、组织策略等进行的评价。形成性评价的主要目的是为了明确游戏运行中存在的问题和改进的方向, 及时修改或调整活动计划, 以获得更加理想的效果;总结性评价是为了解教学活动的最终效果进行的评价, 借以对整个游戏活动的实施与效果做出全面的评定。

3课堂教学游戏案例——《将奋斗进行到底》

Hatton和Smith (1995) 通过分析师范生的反思日记, 提出了反思水平的划分方法。在本游戏教学的研究阶段, 笔者结合该划分方法和实际教学情况对学生的反思内容进行了数据分析。为了保证信度, 实行合作评判制, 在分析过程中由两个研究者分别对相同的日志进行内容评判, 对有争议的日志由第三位研究者进行判定, 最终达成一致。其分为4个维度, 即描述性作品、描述性反思、对话性反思和批判性反思。在“游戏实施”这第一轮过后, 一共获取了40个学生样本的反思日志, 从1~40进行编号, 如果学生样本的反思覆盖了两个维度, 那就以高维度作为反思的层级。从下表可以看出, 其中有2人进行了描述性作品, 11人进行了描述性反思, 18人进行了对话性反思, 9人进行了批判性反思。可见, 此次的课堂游戏教学促进了学生的积极反思, 并且有67.5%的学生进行了相对比较深层的反思。从学生的反思角度可以看出, 此次课堂游戏的设计与教学达到了很好的效果, 见表5。

4结语

具有优秀教学效果的教学实践有足够的理由上升到理论层面, 本研究通过实践中推导出三轮课堂游戏教学模型, 让师范生在参与游戏的过程中既掌握知识, 又锻炼自己的设计思维能力, 推进了其在实践中的反思和应用。通过该模型的多次实践应用总结如下:

(1) 苏霍姆林斯基主张让学生“带着一种高涨的、激动的情绪去从事学习和思考”, 并建议教师要积极地创造使学生情绪高涨的环境, 引起学生积极的情绪。在第一轮的“游戏实施”阶段, 67.5%的学生对游戏化教学进行了对话性反思和批判性反思, 很好地激发了学生的好学精神并积极引导学生课堂的积极情绪。

(2) 三轮迭代课堂游戏化教学模型提供了充分的空间让师范生建构教师课堂游戏活动的实践性知识。学习是学习者主动建构内部心理结构的过程, 它不仅包括结构性知识, 也包括大量非结构性的经验背景。67篇有效反思日志中, 其中36篇 (53.7%) 对课堂上的结构知识进行了反思再构建;52篇 (77.6%) 日志中提到了“以后”、“值得借鉴”、“启发”等对非结构性经验表征的关键词。

(3) 布鲁纳的发现主义主张让学生主动地去发现知识, 而不是被动地接受知识。此模型不仅引导学生去发现课堂游戏活动的过程, 还让他们发现他们自己头脑里想法的过程, 引导学生去发现知识, 培养学生的设计思维能力。通过反思可以看出, 学生在课后可以主动地对教学内容进行比较、探讨与辩证分析。

设计一个课堂游戏教学案例很困难, 需要考虑到教学内容和游戏的契合度, 能否高效地达到教学目标, 从社会角度选择热门电视剧做背景是否为最佳契合等很多问题。教学效果也可能受到学生的自我创造力和异质的限制。该游戏模型的出发点是培养师范生对游戏教学模型的迁移能力, 然而在游戏效果说明上没有数据论证学生是不是可以将这个游戏模型应用到以后的教学中, 这需要对接受这个游戏模型的教师进行实验研究或者跟踪观察。

摘要:以实际课堂为原型, 构建活动类游戏设计与实施的三轮迭代课堂游戏化教学模型。详细说明了该模型的组成元素与实施过程, 并以《将奋斗进行到底》为案例结合学生日志进行分析, 说明该模型有助于学习者对结构性知识和非结构性经验的习得, 同时能够促进学习者的深层次反思, 并培养学习者的创新精神。

关键词:三轮迭代,游戏化教学,教学系统,教学策略

参考文献

[1]张琪, 陈琳.我国教育游戏研究述评与展望[J].开放教育研究, 2009 (5) .

[2]ALEJANDRO ECHEVERRIA, CRISTIAN GARCIA-CAMPO, MIGUEL NUSSBAUM, et al.A framework for the design and in-tegration of collaborative classroom games[J].Computers&Edu-cation, 2011 (57) .

[3]SUSAETA H, JIMENEZ F, NUSSBAUM M, et al.From MMOR-PG to a classroom multiplayer presential role playing game[J].Ed-ucational Technology&Society, 2010 (3) .

[6]张希希.对活动教学理论若干问题的探讨[J].西南师范大学学报:人文社会科学版, 2001 (3) .

[8]陶侃.教育游戏发展中的“吸收裂痕”与缓解策略[J].中国电化教育, 2009 (2) .

迭代模型 篇6

总体最小二乘[1]认为平差模型中观测向量和系数矩阵同时含有误差, 并对其进行改正。针对系数矩阵含有误差的平差问题, 在理论上总体最小二乘较最小二乘更为严密。总体最小二乘的经典解法是奇异值分解法 (SVD) , 但由于其计算复杂且不利于编程, 测量学者提出了一些基于平差模型的迭代解法[2~7], 并对其实际应用作了一些研究[8~10]。在测量数据处理中, 线性拟合是总体最小二乘一个最重要的应用, 但总体最小二乘的常规解法 (即奇异值分解法和迭代解法) 都无法顾及线性回归中系数矩阵的常数列而是对其进行了改正, 这对线性回归模型来讲是不合理的。文献[5]以直线必须通过数据点的中心, 才能使其偏差最小为约束条件, 推导了一种求解线性模型的总体最小二乘算法, 虽然该算法提高了线性回归的逼近精度, 但仍然存在偏差。文献[7]通过将数据中心化后再采用奇异值分解法对回归参数进行解算, 则分离了系数矩阵的常数列, 得到的参数估值合理可靠。但其缺陷是计算复杂难以编程实现。鉴于此, 本文在基于平差模型的基础上, 推导了一种求解线性回归参数的总体最小二乘算法, 该算法易于编程实现。算例分析表明其可靠、合理。

1 总体最小二乘常规解法

1.1 SVD解法

线性回归模型为[1,2,6]:

式中:Δ观测量y的真误差, ak为回归参数, 当同时考虑到自变量xk也含有误差, 此时系数矩阵A中的元素含有误差, 则式 (2) 变换为总体最小二乘的平差模型:

采用奇异值分解 (SVD) 法将式 (2) 变换为:

求得参数估值为[1,2,6]:

式 (4) 中, n为非固定列对应参数的个数, σ2n+1为增广矩阵[A L]的最小特征值。其单位权中误差计算公式为σ02=σ2n+1/ (m-n-1) , 其中m为观测个数, n+1为参数的个数。

SVD解是将系数矩阵中所有元素看成是含有误差的, 这对线性回归模型来讲是不合理的。而且SVD解法较为复杂, 不利于测量数据处理的编程实现。

1.2 常规迭代解法

总体最小二乘的迭代解法为[2]:

进行迭代解算时, 首先按最小二乘法计算参数的初值X (0) , 然后根据式 (5) 反复迭代直到‖X (i+1) -X (i) ‖<ε则停止计算输出参数值, 单位权中误差按σ0=V/ (m-n) 计算。迭代解法最大的优点是充分运用到测量平差模型, 其迭代格式简单易于编程。但常规的总体最小二乘迭代解法都是将系数矩阵所有元素看成是含误差的, 这对线性回归模型也是不合理的。

2 线性回归参数的总体最小二乘迭代解法

2.1 算法推导

根据前文所述, 有必要建立基于总体最小二乘的线性回归模型和解法, 线性回归数学模型为:

可将式 (6) 进行等价转换为:

表示为矩阵形式为:

设v=vec (EA) , vec表示向量拉直运算, vec (EA) 即将矩阵从左至右逐列拉直成一列向量。在不考虑权重时, 根据总体最小二乘原理, 相应的误差期望和方差为:

式 (9) 中, 为矩阵的克罗内克积, Im和In分别为m和n阶的单位矩阵, 相应的其平差准则为:

根据式 (8) 与式 (10) 构造拉格朗日目标函数:

式 (11) 中, k为 (n+1) ×1的拉格朗日乘数;, In+1为n+1阶的单位矩阵。根据拉格朗日函数求极值的必要条件, 将式 (11) 分别对v、x求导并令其等于0, 化简整理后可得:

由式 (12) 的第一式可得:

式 (13) 中, vec-1表示vec的逆运算, 即将矩阵重新构造为m× (n+1) 的矩阵。

将式 (12) 的第一式代入到式 (8) 中, 并顾及, 整理后可得:

根据式 (11) 第二式和式 (14) 则可得:

根据式 (15) 即可得到参数^x的表达式:

根据上述推导, 其参数解算步骤如下:

(1) 对回归参数附初值^x (0)

(2) 按式 (17) 计算k值和新的回归参数值

(3) 重复步骤 (2) , 直到‖x (i+1) -x (i) ‖<ε, 则停止迭代

按上述迭代方法即可求得式 (7) 的方程, 相应的线性回归方程的参数解:

2.2 单位权中误差评定

根据线性回归模型式 (7) , 当同时考虑自变量误差即采用总体最小二乘求取回归参数值时, 其单位权中误差的计算公式为:

根据上文的迭代解再结合式 (12) 可得:

则按本文的推导, 其单位权中误差计算公式为:

在计算线性回归单位权中误差时, 按常规的总体最小二乘解法算得的结果比按式 (19) 计算的结果要小, 这与实践是不不相符的。因为, 常规的总体最小二乘解法没有顾及线性回归模型中系数矩阵常数列。而本文推导的解法从理论上比常规总体最小二乘解法更严密, 究其原因, 是因为按常规总体最小二乘解法对线性回归模型的单位权中误差评定有误, 下面则具体进行讨论。

按常规总体最小二乘法将线性回归系数矩阵中的常数列也进行了改正并参与精度评定, 其改正后的模型可表示为:

其单位权中误差评定公式为:

从式 (22) 可以看出, 其将常数列的改正值看成是自变量的改正值, 这显然是不对的。从改正模型来看, 应该将常数列的改正值归入到因变量的改正值中, 则变量的改正值为:

按式 (24) 进行改正值修正后, 再按式 (19) 进行单位权中误差的评定。如此得到的结果才与线性回归模型相符。这也解释了前文提出的疑问, 同时也表明不能单一以单位权中误差来评定一种平差模型和算法的优劣。因为它们的单位权中误差评定方式不一定都相同。

3 算例分析

3.1 算例1

运用文献[6]例5~10的数据, 用三个点 (1, 2) 、 (2, 6) 、 (6, 1) 来拟合一元线性回归方程。运用本文的解法得到的参数估值为6、1。这与文献[5]中将数据中心化后再采用奇异值分解法得到的结果相同, 而按常规总体最小二乘的奇异值分解法和迭代解法得到的参数估值皆为6.74、0.99。这是因为总体最小二乘的常规解法将系数矩阵的常数列也进行了改正, 得到的结果有偏差。而本文的解法则将系数矩阵的常数列分离开不加改正, 计算得到的参数估值较之可靠。

3.2 算例2

为进一步验证本文方法对线性回归模型的统一性和可靠性, 运用MATLAB模拟一平面方程。设平面方程为:z=1.5+x+2y, 在x和y没有误差时求得z的值上加上均值为0, 方差为0.005的随机误差, 组成观测值。然后分别对x和y添加均值为0, 方差为0.03的随机误差, 组成新的观测值, 如表1所示。分别采用最小二乘法 (LS) 、常规总最小二乘法、本文解法解算线性回归方程的参数值, 并按文中所述的单位权中误差评定公式计算其单位权中误差, 结果如表2所示。

从表2中的参数估值结果不难看出, 采用本文的总体最小二乘解法解算的回归参数值与真值最为接近, 而常规的总体最小二乘解法由于将线性回归模型中的系数矩阵中的常数列也进行了改正导致其结果与真实值有偏差, 最小二乘法由于没有考虑到线性回归自变量的误差即系数矩阵元素的误差, 计算的结果与真值偏差最大。这也可以从其单位权中误差中得出, 本文的总体最小二乘解法所得单位权中误差最小, 常规总体最小二乘解法次之, 最小二乘法最小。需要指出的是, 如果按常规总体最小二乘的单位权中误差计算公式得到的单位权中误差为0.0227, 比本文方法得到的值要小, 这就会误以为按常规总体最小二乘解法解算线性回归参数得到的精度比本文要高。其实不然, 这是因为其针对线性回归模型的单位权中误差计算公式有误, 通过本文的纠正得出的值才符合其实际。这也可以通过参数的估值结果与真值的比较中看出。

4 结束语

本文给出了一种线性回归参数估计的总体最小二乘算法, 该算法即能同时考虑线性回归自变量的误差即平差模型系数矩阵元素的误差, 又能顾及线性回归中系数矩阵常数列即对常数项不加改正。这弥补了常规总体最小二乘解法针对线性回归模型解算的不足, 且对基于总体最小二乘的线性回归单位权中误差进行了探讨, 纠正了针对线性回归模型的常规总体最小二乘单位权中误差评定的偏颇。

摘要:根据线性回归模型的特点, 推导了一种解线性回归参数的总体最小二乘算法。并对其单位权中误差的评定进行了探讨, 通过理论推导表明按常规的总体最小二乘解法求得的线性回归单位权中误差与实际不符, 并对其进行了纠正。通过算例分析且与常规的总体最小二乘解法进行比较, 结果表明了算法的正确性和可靠性。

关键词:总体最小二乘,线性回归,平差模型,迭代解法,奇异值分解

参考文献

[1]GOLUB G H, VAN L C F.An Analysis of the Total Least Squares Problem[J].SIAM J Numer.Anal, 1980, 17:883~893.

[2]鲁铁定, 周世健.总体最小二乘的迭代解法[J].武汉大学学报 (信息科学版) , 2010, 35 (11) :1351~1354.

[3]孔建, 姚宜斌, 吴寒.整体最小二乘的迭代解法[J].武汉大学学报 (信息科学版) , 2010, 35 (6) :711~714.

[4]许超钤, 姚宜斌, 张豹等.基于整体最小二乘的参数估计新方法及精度评定[J].测绘通报, 2011, (10) :1~4.

[5]邱卫宁, 齐公玉, 田丰瑞.整体最小二乘求解线性模型的改进算法[J].武汉大学学报 (信息科学版) , 2010, 35 (6) 708~710.

[6]丁士俊, 姜卫平, 杨颜梅.整体最小二乘线性回归模型与算法[J].测绘通报, 2012, (12) :8~10.

[7]邱卫宁, 陶本藻, 姚宜斌等.测量数据处理理论与方法[M].武汉:武汉大学出版社, 2008.

[8]陈义, 陆珏, 郑波.总体最小二乘方法在空间后方交会中的应用[J].武汉大学学报 (信息科学版) , 2008, 33 (12) :1271~1274.

[9]陆珏, 陈义, 郑波.总体最小二乘方法在三维坐标转换中的应用[J].大地测量与地球动力学, 2008, 28 (5) :77~81.

迭代模型 篇7

经皮冠状动脉介人治疗(Percutaneous Coronary Intervention,PCI)[1,2]已经成为冠心病的主要治疗手段,广泛用于临床。随着CT技术的不断发展尤其是64层螺旋CT应用于临床后,冠状动脉支架置入术方面的价值已经得到了临床的证实。目前冠状动脉CT血管造影(Computed Tomographic Angiography,CTA)已经成为支架术后复查的首选无创性检查。但是,由于CT的部分容积效应以及金属支架的线束硬化伪影影响,对支架内管腔的准确评估仍存在一定困难,尤其对小于3.0 mm的小管径支架显示不理想[3]。2010年美国心血管计算机断层扫描学会(SCCT)冠状动脉CTA专家共同提出,由于容积重叠伪影和线束硬化伪影的限制,只有80%的3 mm和33%的<3 mm的支架可被评估[4]。因此,冠脉支架对冠脉CTA提出了重大的技术挑战。

西门子第3代双源CT(Force)在图像重建时采用高级的基于模型的迭代重建(Advanced Modelled Iterative Reconstruction,ADMIRE)技术。ADMIRE是继第二代基于正弦图的迭代重建(Sinogram-Affirmed Iterative Reconstruction,SAFIRE)算法之后的一种更为先进的重建模式。相较于SAFIRE算法,ADMIRE算法的数据分析技术更为复杂,它使用了加权的滤波反投影(Filtered Back Projection,FBP)算法[5,6],在CT成像时,可以降低图像的噪声,提高图像质量。本实验目的在于分析不同级别的ADMIRE对于冠脉支架显示的影响。

1 资料与方法

1.1 临床资料

选取2016年3月~2016年6月行冠状动脉CTA检查的33例冠状动脉支架植入术后患者,所有患者均无碘对比剂过敏史、严重心功能不全、严重肾功能不全、严重心律失常,并未行冠状动脉旁路移植术。所有患者均采用Turbo Flash扫描模式。所有患者在检查前均签署知情同意书。

1.2 仪器与方法

采用Siemens第3代双源CT进行CTA检查。扫描前患者无需进行呼吸训练。扫描范围自气管分叉至心脏膈面下1 cm左右。准直器为192 mm×0.6 mm。管电压由CARE k V自动调节,参考管电压(Ref k V 100);管电流由CARE Dose4D自动调节,参考管电流(Ref m As 280/圈)。Turbo Flash模式的螺距为3.2。

Turbo Flash模式扫描方案:感兴趣区(ROI)设定在升主动脉根部,触发阈值为100 HU,延迟4 s后启动Flash扫描。心率<70 bpm,触发时相为R-R间期的60%,心率>70 bpm,触发时相为R-R间期的40%。

注药方案:采用MED TRONAG双筒高压注射器,经右侧肘正中静脉注射碘普罗胺(370 mg I/ml),根据每公斤体重0.8 m L/kg计算注药总量,注药速度为3.5~5.0 m L/s。尾随注射40 m L生理盐水,以4 m L/s速率冲刷。

扫描结束后,分别采用ADMIRE 1~5级别进行图像重建。所有图像均传至西门子Syngo.via后处理工作站进行图像的主观评分和客观测量。

1.3 图像质量分析

图像质量分别从主观和客观两方面进行分析,比较各组图像之间的差异。主观评价由两位有丰富冠脉CT诊断经验的放射科医生进行,包括管腔内以及支架结构显示的双盲评估。所有图像均在窗宽1200 HU和窗位650 HU下评价[7]。采用Likert五分制[8]:1分。图像质量很差,管腔受伪影影响无法观察到内部情况,支架结构模糊不清;2分。图像质量差,虽能看到管腔但清晰度很低,受放大伪影影响严重,支架模糊,不能够诊断;3分。图像质量中等,可以观察到管腔内部,但受图像噪声和伪影影响边界不清;4分。图像质量好,腔内的CT值略高于正常水平,但对管腔内评价无影响,虽有些许模糊但可以观察到支架细小结构;5分。图像质量优秀,腔内CT值在正常水平,边界清晰,支架细小结构锐利分辨清楚。

客观评价:客观评价由一位阅片医生在不知重建级别的前提下分别对支架腔内衰减值、支架内径、图像噪声、信噪比(SNR)及对比噪声比(CNR)5个方面进行评价。支架腔内衰减差异用于评估支架放大伪影对管腔内显示的影响,其定义为有支架处与无支架处管腔内CT值的差异。无支架处CT值通过测量支架两端CT值取平均值获得;有支架处CT值为轴位选取3个不同平面测量取均值,测量时ROI要尽量大,放置于支架内腔的中心且避开支架壁。

选取主动根部层面测量CT值(定义为CT管腔),ROI面积1 cm²。选取左冠脉开口层面,测量左主干血管周围组织的CT值(定义为CT组织),ROI面积为0.2 cm²,以测得CT值的标准差作为背景图像噪声。支架腔内衰减差异=有支架处CT值均值-支架内远端CT值均值,SNR=CT管腔/噪声,CNR=(CT管腔-CT组织)/噪声。

1.4 统计学分析

主观评分采用Kappa检验分析两位医生评分的一致性。所有定量分析数据均表示成均值±标准差(x-±s)的形式。不同组间客观评价参数均值的统计学差异采用方差分析ANOV进行检验,之后对存在差异的参数进行均数的两两比较(q检验SNK和LSD法)。所有统计结果均采取P<0.05为差异具有统计学意义,统计学分析借助SPSS 22.0软件实现。

2 结果

2.1 主观定性评估结果

两名阅片医生之间图像质量的评估一致性较好(Kappa=0.836)。不同级别ADMIRE重建组主观评价结果中,ADMIRE 1组评分最低,ADMIRE 4和5组评分一致且最高。不同级别ADMIRE重建后冠脉支架的显示情况见图1。

2.2 客观定量评估结果

统计学分析结果见表1~5,图2。

(1)支架腔内衰减值分析。支架腔内衰减值在ADMIRE 1组最低(160.97±143.856),ADMIRE 5组最高(204.15±181.433),但是5组间没有统计学差异(P=0.832,>0.05)。

(2)支架内径测量值分析。支架内径测量值ADMIRE1组最高(30.06±5.567),ADMIRE 5组最低(28.61±6.280),但是5组间没有统计学差异(P=0.898,>0.05)。

(3)图像噪声分析。ADMIRE 1为(28.18±14.253),ADMIRE 5为(12.82±5.282)。随着ADMIRE级别的增高,图像的噪声呈显著递减趋势。经过统计学分析,ADMIRE4组和ADMIRE 5组之间无显著性差异(P=0.061,>0.05),分别与另外3组间有显著性差异(P<0.05)。

(4)SNR以及CNR分析。ADMIRE 1组的SNR、CNR均值分别为(27.02±32.383)、(30.20±39.174);ADMIRE5组的SNR、CNR均值分别为(69.05±51.748)、(75.96±52.636)。随着ADMIRE级别的增高,图像SNR以及CNR呈显著递增趋势。ADMRE 1~4组间没有显著性差异(P>0.05),分别与ADMIRE 5组间存在显著性差异(P<0.05)。

3 讨论

冠状动脉支架术后的并发症(如支架再狭窄、支架断裂、支架内血栓形成等)的发生率高达10%~46%,因此,对冠状动脉支架植入术后进行无创、精确的随访观测成为临床工作越来越重要和不可或缺的部分。但是由于金属支架伪影的干扰,对图像质量提出了更高的要求。

多个研究表明,采用迭代重建(Iterative Reconstruction,IR)可以降低图像噪声,减少射束硬化伪影,对评估冠脉支架有一定价值[9,10,11,12,13,14,15]。西门子第3代双源CT的ADMIRE重建技术是一种更为先进的迭代重建模式,对冠状动脉支架的显示及腔内准确的评估提供了新的技术支持。本实验的研究结果一方面进一步验证了迭代重建技术对于噪声的抑制作用;另一方面定量的分析了不同级别的ADMIRE对噪声的抑制水平有所差异,ADMIRE 4和5对于图像噪声的抑制水平最佳,且没有统计学差异。使用ADMIRE 4和5重建后,能够有效的减少金属支架伪影的干扰,在支架显示方面有很大的提高,图像的噪声有了明显的降低,图像信噪比及对比噪声比更高。因此,更有利于对冠脉支架的显示及评估,为临床提供更多的信息,有利于冠脉支架术后的随访观察。

不足之处:(1)有文献报道,支架成像的图像质量还与支架材料以及药物情况有着明显的关系[16,17]。在本实验中由于样本数量的限制,没有对不同材料的支架进行分组,因此对于此方面的研究未做统计学分析。在今后的研究当中,扩大样本量,对不同材料的支架进行分组,进一步验证本实验的结果是否适用于所有材料的支架;(2)本实验所收集的病例,大部分支架位于前降支及右冠脉,支架的直径大多在3 mm左右。只有2枚支架位于对角支,支架直径在2.5 mm以下,对于2.5 mm以下支架术后的病例收集困难,因此对于2.5 mm以下支架显示的研究有待体模实验进一步证实。

4 结论

迭代模型 篇8

目前针对装载机的轨迹跟踪控制问题已经取得一定程度的进展。柳波,等基于模糊自整定PID控制实现了装载机自动铲掘时的轨迹控制问题[1]。龚捷,等在考虑作业阻力补偿的情况下,基于计算力矩法设计装载机铲掘作业的轨迹跟踪控制器,实现铲斗轨迹跟踪控制[2]。

自适应迭代学习控制整合自适应控制和迭代学习控制的优点,基于PD反馈控制器增益自适应调节,迭代学习控制器修正控制力矩,该算法具有快速的渐进收敛性能[3]。拉格朗日法与牛顿-欧拉法是机构动力学建模的两种常见方法,封闭形式的拉格朗日方程是控制器设计和综合的有效工具,而递推形式的牛顿-欧拉方程则是实时控制、求解逆动力学问题的有效方法[4]。采用牛顿-欧拉法推导了装载机工作装置的二自由度动力学模型,在matlab环境下设计自适应迭代学习控制器并进行稳定性证明,对装载机工作装置的轨迹跟踪问题进行仿真控制,以期达到高精度追踪。

1 基于牛顿-欧拉法的动力学方程

将装载机工作装置机器人化处理,视为平面二连杆操作臂机构,建立如图1所示的D-H坐标系。设定动臂与车架铰接点为O0,铲斗与动臂铰接点为O1,铲斗斗尖位置为O2,分别以O0、O1、O2为原点建立坐标系O0x0y0z0、O1x1y1z1、O2x2y2z2。

图1中,θ1、θ2分别为动臂和铲斗相对于车架和动臂的转角;l1=lO0O1、l2=lO1O2分别为动臂和铲斗长度;m1、m2分别为铲斗和动臂的质量;假定动臂和铲斗的质心处于连杆O0O1、O1O2的中心位置。

1.1 牛顿-欧拉动力学方程

根据旋转关节的运动推导关节力矩的过程可细分为外推法和内推法两个步骤。外推法采用牛顿欧拉方程,按连杆编号从小到大的顺序逐次计算连杆的速度和加速度;内推法则按连杆编号从大到小的顺序计算连杆间的力、力矩[5]。运动学方程如下。

外推法求解过程:i=0,1,…,n

内推法求解过程:i=n,n-1,…,1。

式中:iωiiωi˙iviibi˙为连杆i的角速度、角加速度、线速度、线加速度相对于坐标系{i}的表达式;i+1iRi+1iR为坐标系{i}和{i+1}之间的姿态变换矩阵,且i+1iRi+1iR=I;iΖ^iZi轴方向上的单位矢量;iPi+1为节点i到节点i+1的矢量;iPCi为节点i到连杆i质心位置处的矢量;CiIi为连杆i质心处的惯性张量;mi为连杆i的质量;为连杆i质心上的惯性力和力矩相对于坐标系{i}的表达式;为连杆i-1作用在连杆i上的力和力矩相对于坐标系{i}的表达式;τi为关节i上的旋转力矩。

1.2 装载机工作装置的动力学计算

以图1中装载机工作装置的二连杆机器人操作臂为研究对象,推导其牛顿-欧拉动力学方程。假设装载机铲斗斗尖处不受力的作用f3=0,n3=0;车架固定不旋转有ω0=0,ω0=0;计及重力因素[6]的影响,在式(1)中令vi+10=G-Gy0g=9.8m/s-2。相邻坐标系之间的姿态变换矩阵为(其中ci+1=cos(θi+1)),(si+1=sin(θi+1))。

i+1iR=[ci+1-si+10si+1ci+10001],ii+1R=[ci+1si+10-si+1ci+10001],i=0,1(3)

连杆在坐标系{i}中的惯性张量为:

根据平行移轴定理[7]得到以刚体质心{C}为原点的坐标系与{i}坐标系间的转换式

{iΙxx=CiΙxx+m(yc2+zc2)iΙyy=CiΙyy+m(xc2+zc2),iΙzz=CiΙzz+m(xc2+yc2)iΙxy=CiΙxy-mxcyc,iΙxz=CiΙxz-mxczc,iΙyz=CiΙyz-myczc(6)

式(6)中pc=[xcyczc]T表示连杆质心在坐标系{i}中的位置矢量。

将式(3)—式(6)代入式(1)和式(2)计算装载机工作装置的动力学方程如下(式子太长未列出)。

C1Ι1=[0000m1l1212000m1l1212],C2Ι2=[0000m2l2212000m2l2212](7)

ijk分别为坐标系O0-x0y0z0中的单位向量

{1ω1=θ˙1k1ω˙1=θ¨1k1v˙1=gs1i+gc1j1v˙C1=(-l12θ¨1+gs1)i+(l12θ¨1+gc1)j2ω2=(θ˙1+θ˙2)k1ω˙2=(θ¨1+θ¨2)k2v˙2=(l1θ¨1s2-l1θ˙12c2+gs12)i+(l1θ¨1c2+l1θ˙12s2+gc12)j2v˙C2=(l1θ¨1s2-l1θ˙12c2+gs12-l22(θ˙1+θ˙2)2)i+(l1θ¨1c2+l1θ˙12s2+gc12+l22(θ¨1+θ¨2))j1Ν1=m1l1212θ¨1k1F1=(-m1l12θ¨1+m1gs1)i+(m1l12θ¨1+m1gc1)j2Ν2=m2l2212(θ¨1+θ¨2)k2F2=m2(l1θ¨1s2-l1θ˙12c2+gs12-l22(θ˙1+θ˙2)2)i+m2(l1θ¨1c2+l1θ˙12s2+gc12+l22(θ¨1+θ¨2))j(8)

{τ1=(m1l123+m2l223+m2l12+m2l1l2c2)θ1¨+(m2l223+m2l1l2c22)θ22¨-m2l1l2s22θ22-m2l1l2s2θ1θ2+m2gl22c12+(m12+m2)gl1c1τ2=(m2l223+m2l1l2c22)θ1¨+m2l223θ2¨+m2l2s22θ12+m2l2gc122(9)

2 工作装置轨迹的自适应迭代学习控制

2.1 问题描述

考虑实际中存在不确定性、摩擦及外部干扰的影响,式(9)描述的装载机工作装置动力学方程可写为

Μ(qi(t))qi¨(t)+C(qi(t),qi¨(t))qi¨(t)+G(qi(t))=τi(t)+di(10)

式(10)中:qi(t)=θi(t),i=1,2,t∈[0,T]为时间变量,i∈Z+为迭代次数,qiRn,qiRn,qi¨Rn表示第i次迭代的关节角度、角速度、角加速度量。M(qi)∈Rn×n为惯性矩阵,C(qi,qi)qiRn表示科氏力和离心力量,G(qi)∈Rn为重力项,τi(t)∈Rn为作用在关节位置处的控制力或力矩,di∈Rn为未建模动态和扰动。

2.2 收敛性分析

控制目的是∀t∈[0,T]及∀i∈Z+,设计有界的自适应迭代学习控制器τi(t)来保证qiRn,qiRn,qiRn有界,且当i→∞时,qi(t),qi(t)收敛到理想的参考位置qd(t),qd(t)。为实现控制目的,给出以下基本假设:

(A1) qd(t)为可实现的关节参考轨迹角度。

(A2) 对于∀t∈[0,T]及iΖ+qi(t),qi(t),qi(t)di(t)有界。

(A3) ∀i∈Z+,初始条件满足:

qd(0)-qi(0)=qd(0)-qi(0)=0

且满足如下4个基本特征:

(B1) M(qi)∈Rn×n为有界正定对称矩阵;

(B2)Μ˙(qi)-2C(qi,qi)Rn×n为对称矩阵,且ωΤ(Μ˙(qi)-2C(qi,qi))ω=0,ωRn;

(B3)G(qi)+C(qi,qi)qd(t)=ψ(qi,qi)ξΤ(t),ψ(qi,qi)Rn×(m-1)为已知矩阵,ξ(t)∈Rm-1为未知向量;

(B4)qi,qit[0,Τ]iΖ+||C(qi,qi)||kc||qi||||G(qi)||kg,kckg均为正实数。

定理 定义关节位置跟踪误差和速度误差分别为:ei(t)=qd(t)-qi(t),ei(t)=q˙d(t)-q˙i(t),采用控制律

{τi(t)=ΚΡei(t)+ΚDei(t)+φ(qi,qi,ei(t))θi(t)(11a)θi(t)=θi-1(t)+ΓφΤ(qi,qi,ei(t))ei(t)(11b)

式(11)中:θi-1(0)=0φ(qi,qi,ei)Rn×n,且φ(qi,qi,ei)=[ψ(qi,q˙i)sgn(ei)],矩阵KPKDΓ均为对称正定矩阵,则ei(t)、ei(t)有界,且

limiei(t)=limiei(t)=0,t[0,Τ]

证明 第i次迭代时,构造Lyapunov函数

Wi(t)=Vi(t)+120tθi(t)Γ-1θi(t)dτ(12)

式(12)中,设定θi(t)=θ(t)-θi(t)θ(t)=[ξΤ(t)β]Τ,θ^i(t)=[ξ^iΤ(t)β^i(t)]Τ为θ(t)的估计值,由假设(A1)、和基本特征(B1)知,

||Μ(qi)qd-di||ββ>0

Vi(ei˙(t),ei(t))=12eiΤ˙(t)Μ(qi)ei˙(t)+12ei(t)ΤΚpei(t)(13)

由于θi¯=-θ+θi-θi+1+θ=-θi+θi+1,

θi+1=θ¯i+θi,则

θ˜i(t)Γ-1θ˜i(t)-θ˜i-1(t)Γ-1θ˜i-1(t)=-2θ¯iΤ(t)Γ-1θ˜i(t)-θ¯iΤ(t)Γ-1θ¯i(t)(14)

2.2.1 Wi(t)的非递增性证明

ΔWi=Wi-Wi-1=Vi-Vi-1-120t(θ¯iΤΓ-1θ¯i+

2θ¯i-1Τ(t)Γ-1θ¯i-1(t))dτ (15)

式(15)中θ¯i=θi-θi-1。由于0tV˙(t)dτ=Vi(t)-Vi(0),即Vi(t)=Vi(0)+0tV˙(t)dτ,

又由于

{Vi˙(t)=eiΤ˙(t)Μ(qi)ei(t)+12eiΤ˙(t)×Μ˙(qi)ei˙(t)+eiΤ˙(t)ΚpeiVi(ei˙(t),ei(t))=Vi(ei˙(0),ei(0))+0t[eiΤ˙Μ(qi)ei+12eiΤ˙Μ˙(qi)ei˙+eiΤ˙Κpei˙]dτ(16)

由式(10)和特性(B2)和特性(B3)得

{eiΤ˙Μei=eiΤ˙Μ(qd-qi)=eiΤ˙Μqd-eiΤ˙(-Cqi˙-G+τi+di)12eiΤ˙Μ˙(qi)ei˙=eiΤ˙Cei˙=eiΤ˙C(qd˙-qi˙)=eiΤ˙Cqd˙-eiΤ˙Cqi˙(17)

由已知得

eiΤ˙(Μ(qi)qd-di)β||eiΤ˙||=eiΤ˙βsgn(ei˙)ψ(qi,qi˙)ξΤ+βsgn(ei˙)=[ψ(qi,qi˙)sgn(ei˙)][ξΤβ]Τ=ϕ(qi,qi˙,ei˙)θ(18)

Vi(ei˙(t),ei(t))=Vi(ei˙(0),ei(0))+0teiΤ˙(Μ(qi)qd-di+C(qi,qi˙)qd˙+G(qi)+ΚΡei-τi)dτVi(ei˙(0),ei(0))+0teiΤ˙(ψ(qi,qi˙)ξΤ+ΚΡei+βsgn(ei˙)-τi)dτVi(ei˙(0),ei(0))+0teiΤ˙(ϕ(qi,qi˙,ei)θ+ΚΡei-τi)dτ(19)

将控制律式(11a)代入式(19),得

Vi(ei˙(t),ei(t))Vi(ei˙(0),ei(0))+0teiΤ˙(ϕ(qi,qi˙,ei)θ˜i-ΚDei˙)dτ(20)

据式(11b)得:θ¯iΤ(t)=(ΓϕΤei˙)Τ=eiΤ˙ϕΓ,有

由假设(A2)得Vi(ei(0),ei(0))=0,将式(21)代入式(15),有

ΔWi=-Vi-1+Vi-120t(θ¯iΤΓ-1θ¯i+2θ¯iΤΓ-1θ˜i)dτ-Vi-1+0teiΤ˙(ϕθ˜i-ΚDei˙)dτ-120t(eiΤ˙ϕΓϕΤei˙+2eiΤ˙ϕθ˜i)dτ-Vi-1-120teiΤ˙(ϕΓϕΤ+2ΚD)ei˙dτ0(22)

Vi-1、ΓKD均为正定阵,ΔWi≤0,因此Wi为非递增数列,得结论如下:若W0有界,那么Wi必定有界。

2.2.2 W0(t)的连续有界性证明

由式(12)和式(20)得

W0˙(t)e0Τ˙(ϕ(q0,q0˙,q0)θ˜0-ΚDe0˙)+12θ˜0ΤΓ-1θ˜0(23)

由于θ-1(t)=0,根据控制律式(11b)得

θ0(t)=ΓφΤ(q0,q0,e0)e0(t),有

W0˙(t)-e0Τ˙ΚDe0˙+(θ^0Τ+12θ˜0Τ)Γ-1θ˜0=-e0Τ˙ΚDe0˙-12θ˜0ΤΓ-1θ˜0+θΤΓ-1θ˜0(24)

因为θΤΓ-1θ0Κ||Γ-1θ0||2+14Κ||θ||2,Κ>0,可得

W0(t)-β1||e0||2-β2||θ0||2+14Κ||θ||2(25)

(25)β1=λmin(ΚD),β2=12λmin(Γ-1)-Κλmax2(Γ-1),Κλmin(Γ-1)2λmax2(Γ-1)

W0(t)14Κ||θ||2t[0,Τ](26)

因为θ(t)连续有界,推出W0(t)亦连续有界。

2.2.3 Wi(t)的连续有界性证明

Wi(t)可表示为Wi(t)=W0+j=1iΔWj

则由式(15)可得

WiW0-j=1iVj-1W0-j=1iVj-1W0-12j=1iej-1ΤΚΡej-1-12j=1iej-1Τ˙ΚΡej-1(27)

(j=1iej-1ΤΚΡej-1+j=1iej-1Τ˙ΚΡej-1)2(W0-Wi)2W0,Wi(t)

limiei(t)=limiei(t)=0,t[0,Τ],定理得证。

3 仿真研究

对于式(10)所示的装载机工作装置的动力学方程及式(11)所设计的控制器,仿真研究如下。设置动臂、铲斗质量分别为m1=1 793.080 7 kg、m2=2 706.447 8 kg;动臂、铲斗长度l1=2.668 2 m、l2=1.262 1 m。对式(10)描述的系统,可写为

[m11m12m21m22][θ1θ2]+[c11c12c21c22][θ1θ2]+[G1G2]=[τ1τ2](28)

式(28)中,m11=m1l123+m2l223+m2l12+m2l1l2c2;m12=m2l223+m2l1l2c22;m21=m2l223+m2l1l2c22;

在matlab环境下编制m函数[8],创建装载机工作装置的自适应迭代学习simulink主程序框图如图2所示。其中,ctrl为控制器子程序,adapt为自适应律子程序,plant为被控对象子程序,input为指令输入子程序。

设定式(11)的PD控制器参数KP=KD=diag[100,100],自适应律参数Γ=diag[150,150,150,150,150],迭代次数为5,仿真时间设定为1 s。干扰项di(t)=[dmsint dmsint],dm为幅值为1的随机信号。对装载机工作装置动臂、铲斗分别施加q1d=sin(2πt),q2d=cos(2πt)的关节位置指令信号,取被控对象初始状态为x(0)=[0 2π 1 0]T,得到动臂、铲斗的跟踪控制仿真结果如图3—图6所示。

图3显示5次迭代时动臂和铲斗的关节位置追踪情况,期望值与迭代值之间存在误差,且随着迭代次数增加,误差越来越小;图4显示5次迭代后动臂和铲斗有极好的速度追踪效果;

图5、图6分别显示了动臂和铲斗的关节位置跟踪误差和速度跟踪误差图,位置和速度跟踪误差随迭代次数逐渐减小。

4 结论

在运用牛顿-欧拉法对装载机工作装置进行动力学分析的基础上,针对其不确定性和外部干扰性, 采用自适应迭代学习控制策略对其进行轨迹跟踪仿真实验。仿真结果表明,该控制器能保证系统在一定时间内稳定地减小跟踪误差,追踪性能良好,充分验证了该算法的有效性和可行性。

摘要:在理想情况下用牛顿-欧拉法建立装载机工作装置的二自由度动力学模型,考虑实际情况中存在的建模误差和扰动干扰,设计自适应迭代学习控制器对其进行轨迹跟踪控制研究,基于Lyapunov函数证明了跟踪误差的稳定性和收敛性,在matlab环境下对所设计的控制器进行仿真研究。仿真结果表明,所设计的控制器对装载机工作装置有极好追踪效果,验证了该算法的可行性与有效性。

关键词:装载机,工作装置,牛顿-欧拉方程,自适应迭代学习控制,轨迹跟踪

参考文献

[1]柳波,黄杰,等.滑移装载机自动铲掘轨迹控制研究.武汉理工大学学报,2010;32(23):107—115

[2]龚捷,鲍金峰,等.基于计算力矩法的装载机工作装置轨迹控制.机械工程学报,2010;46(13):141—146

[3]刘松国.六自由度串联机器人运动优化与轨迹跟踪控制研究.浙江大学学位论文,2009

[4]刘美华,常文森,等.机械手的显式递推牛顿-欧拉动力学及其分散自适应控制的并行方案.国防科技大学学报,1988;10(4):45—55

[5]田志祥,吴洪涛.闭环双臂空间机器人的动力学建模与仿真.华南理工大学学报(自然科学版),2011;39(8):42—47

[6]贠超,等译.机器人学导论.北京:机械工业出版社,2006

[7]张继元.机构分析与综合的解.北京:人民交通出版社,2007

迭代模型 篇9

非脆弱控制是处理控制器中含有不确定性的有效方法,已成为控制界研究热点,目前研究主要集中在鲁棒控制、切换系统、时滞系统等方面[10,11,12,13,14,15]。对迭代学习的非脆弱控制研究还很少见。杨胜跃等人[16]从学习的整个过程来考虑迭代学习控制的最优化问题,即以整个过程输出误差的最小化为目标,以控制增量的二次型作为罚函数,得到一类迭代域内二次性能函数,基于线性矩阵不等式(LMI)的方法,讨论了不确定离散线性系统的保性能迭代学习算法及其优化方法。文中基于文献[16]的迭代域内性能函数,针对离散线性系统给出了一种非脆弱保性能迭代学习控制及其优化方法,保证了学习的收敛性,具有较好的跟踪效果和较小的保守性。

1 问题描述

考虑线性时变离散系统

式中,状态变量x(i)∈RN,输出变量y(i)∈Rm,输入变量u(i)∈Rr,A(i),B(i),C(i),D(i)为相应维数的系数矩阵。

由式(1)导出迭代域内误差模型

ek+1(0)=ek(0)+C(0)[xk+1(0)-xk(0)]+D(0)u˜k(0)(2a)ek+1(i)=ek(i)+C(i)Φ(i-1,0)[xk+1(0)-xk(0)]+C

(i)j=0i-1Ψ(i-1,j)u˜k(j)+D(i)u˜k(i),i1(2b)

将误差模型式(2)表示成批量形式

Ek+1=Ek+GU˜k+Λwk (3)

式中Ek=[ekΤ(0),ekΤ(1),,ekΤ(Ν)],U˜k=[u˜kΤ(0),u˜kΤ(1),,u˜kΤ(Ν)]分别表示批量形式的输出误差及控制增量,wk=xk+1(0)-xk(0)表示相邻两次迭代初始定位差。

Λ=[CT(0),ΦT(0,0),CT(1),ΦT(1,0)CT(2),…,ΦT(N-1,0)CT(N)]T

下面定义一个迭代域内二次性能函数为

J=k=1[EkΤQEk+U˜kΤRU˜k] (5)

其中,Q=blockdiag(Q1,Q1,…,Q1),R=blockdiag(R1,R1,…R1)分别为N+1项Q1和R1组成的分块对角矩阵,Q1和R1为正定矩阵,因此QR也是正定矩阵。

为推导文中的主要结果,首先给出如下引理。

引理1[17] 给定适当维数的矩阵M,H,E,FX,其中X>0,FTFI,则

(1) 对于任意ε>0,有

HFE+ETFTHT≤εHHT+ε-1ETE

(2) 对于任意ε>0,且X-εHHT>0,有

(M+HFE)TX-1(M+HFE)≤MT(X-εHHT)-1M+ε-1ETE

2 非脆弱保性能迭代学习算法的设计及其优化

由于迭代学习控制一般假定初始定位误差wk=0,因此式(3)可以写为

Ek+1=Ek+GU˜k (6)

对于式(6)设计非脆弱状态反馈控制器如下

U˜k=(Κ+ΔΚ)Ek (7)

其中K称为控制器增益,ΔK称为控制器参数变化,其参数变化具有以下两种类型:

类型1:ΔK不依赖于控制器增益K(加法不确定性),即ΔK=L1F1M1;

类型2:ΔK依赖于控制器增益K(乘法不确定性),即ΔK=L2F2M2K

其中L1,L2,M1,M2为具有适当维数的已知常数矩阵,F1和F2为未知矩阵,且F1ΤF1≤I,F2ΤF2≤I

将非脆弱控制器式(7)带入式(6),导出的闭环系统为

Ek+1=(I+GK+GΔK)Ek (8)

定理1 对于式(6)和性能函数式(5),若存在矩阵K和正定矩阵P,使得对所有非零的Ek满足

ETk[(I+GK+GΔK)TP(I+GK+GΔK)-P+Q+(KK)TR(KK)]Ek<0 (9)

U˜k=(Κ+ΔΚ)Ek为式(6)的一个非脆弱保性能迭代学习控制,并且J<J*,其中性能上界J*=E1ΤPE1,E1表示第1次迭代时的输出误差。

证明:选取适当Lyapunov函数Vk=ETkPEk,则

Vk+1-Vk=Ek+1ΤPEk+1-ETkPEk=ETk[(I+GK+GΔK)TP(I+GK+GΔK)-P]Ek<-ETk[Q+(KK)TR(KK)]Ek

因此式(7)在迭代域内是二次稳定的

-E1ΤPE1=k=1(Ek+1ΤPEk+1-ETkPEk)<-k=1ETk[Q+(KK)TR(KK)]Ek=-k=1[ETkQEk+ETk(KK)TR(KK)Ek]=-k=1[EkΤQEk+U˜kΤRU˜k]=-J

J<ETkPE1,证毕。

有了如上定理,非脆弱迭代学习控制可由定理2给出。

定理2 式(6)在类型1非脆弱控制器作用时,对于给定的ε0>0,如果存在ε1>0及矩阵W和正定矩阵X,使得以下LMIs成立

(2)ε2L1L1Τ-R-1<0 (11)

那么U˜k=(Κ+ΔΚ)Ek是式(6)基于类型1的非脆弱保性能迭代学习控制,此时控制器增益K=WX-1。

证明:根据定理1,可以得出

[(I+GK+GΔK)TP(I+GK+GΔK)-P+Q+(KK)TR(KK)]<0 (12)

由矩阵Schur补[19]的性质,式(12)等价于

式(13),可以改写为

[-Ρ-1(Ι+GΚ)(Ι+GΚ)Τ-Ρ+Q+ΚΤΡΚ]+[0GΔΚ0ΚΤRΔΚ]+[00(GΔΚ)Τ(ΔΚ)ΤRΔΚ]+[000(ΔΚ)ΤRΔΚ]0(14)

现在把类型1的ΔK=L1F1M1代入式(14)得到

[-Ρ-1(Ι+GΚ)(Ι+GΚ)Τ-Ρ+Q+ΚΤRΚ]+[GL1ΚΤRL1]F1[0Μ1]+[0Μ1]ΤF1Τ+[GL1ΚΤRL1]+[000(L1F1Μ1)ΤRL1F1Μ1]0(15)

根据引理1和F1ΤF1≤I,式(15)成立的充分条件是下面的式(16)成立,即存在ε1>0和ε2>0,使得

整理得到下式

再由矩阵Schur补的性质,式(17)等价为

将式(18)左乘以和右乘以diag(I,P-1,I,I,I,I,I),可以得到

X=P-1,K=WX-1,由式(19),从而得到了式(10),证毕。

定理3 式(6)在类型2非脆弱控制器作用时,对于给定的ε1>0,如果存在ε2>0及矩阵W和正定矩阵X,使得以下LMIs成立

(2)ε2L2L2Τ-R-1<0 (21)

那么称U˜k=(Κ+ΔΚ)Ek是式(6)基于类型2的非脆弱保性能迭代学习控制,此时控制器增益K=WX-1。

证明:与定理2完全类似。

在定理2和定理3中,对于已经给定的ε1,非脆弱保性能迭代学习控制不具有唯一性,如下定理给出其最优化设计方法。

定理4 对于系统(6)和定理2或定理3已经给定的ε1,如果以下优化问题minε2,W,Xtrace(Ρ),约束条件式(10)或式(19)成立,且ε2>0

存在一个最优解(ε˜2,W˜,X˜),那么U˜k=(W˜X˜-1+ΔΚ)Ek就是式(6)基于性能函数式(5)的最优非脆弱保性能迭代学习控制。

证明:根据定理1,J<E1ΤPE1,在统计学中,假设E1是零均值随机向量,并且数学期望E{E1ET1}=I,因此,性能函数的数学期望E(J)<E{E1ΤPE1}=trace(P)。所以如果存在一个最优解(ε˜1,W˜,X˜),就称U˜k=(W˜X˜-1+ΔΚ)Ek为就是式(6)基于性能函数式(5)的在统计学上的最优非脆弱保性能迭代学习控制。

3 仿真举例

为了说明以上结果的有效性,不妨给定ε1=1考虑下面二阶系统

{x(i+1)=Ax(i)+Bu(i)y(i)=Cx(i)+Du(i),i[0,1,2,,Ν]

其中。系统初始状态x(0)=[0.2 0.1]T,期望输出,yd(i)=[i2/100-i+0.2 i2/500-i+0.1]T,L1=L2=0.000 3I,M1=M2=0.000 2I,Q=I,R=3I,F1=F2=0.003I,X有形如δI的形式,其中δ>0,I为42阶单位阵。

(1) 对类型1的非脆弱控制,根据定理4,应用LMI工具箱中的mincx来进行求解,得到ε˜2=2.8153×10-4,δ˜=0.1591,从而确定出最优非脆弱保性能迭代学习控制。此时,性能上界J*=2.920 9×104。计算第k次的累加性能函数Jk=l=1k[ElΤQEl+U˜lΤRU˜l]与输出误差平方和ETkEk,可以得到,如图1和图2所示。从图1中可以看到,在第8次迭代以后,JkJ*已经达到非常接近的理想效果,这说明了算法的有效性。

(2) 对类型2的非脆弱控制,根据定理4,应用LMI工具箱中的来进行求解。得到ε˜2=2.4158×10-4,δ˜=0.1591,从而确定出最优非脆弱保性能迭代学习控制。此时,性能上界J*=2.920 8×104。 计算第k次的累加性能函数Jk=l=1k[ElΤQEl+U˜lΤRU˜l]和输出误差平方和ETkEk,可以得到,如图3和图4所示。从图3可以看出,在第8次迭代以后,JkJ*已经达到非常接近的理想效果,这说明了算法的有效性。

4 结束语

【迭代模型】推荐阅读:

迭代程序10-20

迭代函数06-08

迭代方法07-10

迭代增强08-16

线性迭代08-31

迭代算法10-25

优化迭代11-27

迭代学习12-10

迭代控制01-09

设计迭代02-02

上一篇:整改有效性论文下一篇:淡化原因