交互式多模型(共9篇)
交互式多模型 篇1
1 引言
有线数字电视(CADTV,cable digital television)项目风险与CADTV价值链上所有的利益主体相关,包括内容提供商、系统集成商、CADTV项目运营商、设备供应商等。为了在整体上最大限度地降低CADTV项目风险,应该把各类风险因素交付给能够最有效地应对该类风险的利益主体,即寻找各类风险因素的最佳风险承担者,也就是建立合理的CADTV项目风险分担方案。在各个利益主体风险分担方案基础上,确定CADTV价值链上的利益分配,从而体现风险承担者的预期收益与所承担风险相匹配的原则。所以, 确定CADTV项目风险分担方案, 不仅仅是CADTV项目中风险管理的关键内容,还是CADTV价值链上各个利益主体分配利益的根据之一。一方面风险分担在CADTV项目风险管理中具有基础性作用,另一方面我国CADTV项目风险分担研究中面临以下三个较为独特的问题:
(1)由于CADTV产业处于初始阶段[1,2,3],各类专家的关于风险和风险分担的经验也处于自身探索之中,并不定完整,也就是没有那个专家(或者那类)能够完全准确地刻画CADTV项目风险因素之间的重要性,因此只能借助于多个领域的群体专家共同确定风险分担方案。
(2)由于CADTV项目风险在本质上是多个利益主体[4,5]之间的博弈,最终的风险分担方案是各个利益主体之间交互妥协的结果,所以,在风险分担评价中应该考虑反映不同利益实体之间的交互与妥协过程。
(3)在国内,CADTV需要确保政府“言路”在CADTV平台上的畅通,CADTV项目是政府主导下的市场运作模式[3],这与国外以企业自主主导下的市场运作有本质性的区别,政府是CADTV项目的主要受益者之一,也是主要风险承担者之一。
为了解决上述三个问题,论文提出一种多专家交互式的CADTV项目风险分担模型,该模型分为四个步骤:步骤Ⅰ:建立CADTV项目风险分担框架,包括确定风险因素指标体系、权重以及相应的风险承担者;步骤Ⅱ:根据领域专家的风险分担向量计算风险分担综合向量;步骤Ⅲ:根据风险分担综合向量,各领域专家修改其风险分担向量;步骤Ⅳ:返回到步骤Ⅱ,直至最终的风险分担综合向量收敛到预定值。多专家交互式的CADTV项目风险分担模型框架如图1所示。
2 CADTV项目风险分担框架
在对全国59个CADTV项目的问卷调查数据的基础上,运用SPSS软件[6]对风险因素进行因子分析[7,8,9]识别出9大风险因子,分别为业务模式、技术方案、信息内容、项目管理、市场状况、外部协作、产业政策、社会环境和技术设计,9个风险因素记为{r1,r2,…,r9}。其中,业务模式包括业务模式框架、与SP的协作模式、客户关系管理模式、产品营销模式和企业制度等方面的内容;技术方案包括数字电视标准、 技术规范和施工技术方案等方面内容;
信息内容包括新业务开发、信息制作能力和信息内容整合等方面内容; 项目管理包括组织和实施方案、人力资源管理和工程管理等方面的内容; 市场状况包括金融支持和潜在竞争者等方面的内容; 外部协作包括项目监理和产业价值链整合能力等方面的内容; 产业政策包括管理体制、法规、税收与收费等方面的内容; 社会环境包括消费习惯和公众参与程度等方面的内容; 技术设计包括技术设计方法和技术设计过程等方面的因素。在识别CADTV风险因素的基础上,通过运用交互式的MACBETH[10]方法确定了9大风险因子的权重,权重记为{w1,w2,…,w9}。
在CADTV项目发展过程中, CADTV价值链上的主要利益相关者都是项目风险的承担者,包括以下8个风险承担者[4,5]:政府、CADTV运营商、CADTV内容提供商、CADTV设备提供商、CADTV系统集成商、CADTV项目资金提供方、CADTV项目监理方、CADTV项目承建方,上述8个风险承担者记为{b1,b2,…,b8}。
根据CADTV项目的风险因素指标体系、权重,以及相关风险承担者,建立CADTV项目风险分担框架,如图2所示。
3 风险分担综合向量的计算
假设参与评价的专家(或专家小团队)数量为8, 分别代表8类风险承担者的利益诉求, 记为{e1,e2,…,e8}。对于防止风险ri而言, 专家ej初次所确定的风险承担者bk应承担的风险责任为a0i,j,k,向量AE0i,j={a0i,j,1,a0i,j,2,…,a0i,j,8}称为专家ej对风险因素ri的风险分担向量,且满足
所有专家的风险分担向量组成一个8×8的风险分担矩阵Ai.
由于不同专家对风险ri的风险分担向量不同,需要合成8个专家的风险分担综合向量,综合向量是对8个专家意见有效综合,应该和其它专家的风险分担向量的相似度最大,而两个向量之间接近度可以用它们之间的夹角余弦表示[11]。所以,风险分担综合向量应该是使得它与其它8个专家的风险分担向量的夹角余弦之和最大的向量。
构造出初始风险分担综合向量AE0i={a0i,1,a0i,2,…,a0i,8},使得它与8个专家的风险分担向量的夹角余弦之和最大。设AE0i与第j个专家的初始权重向量的夹角为θ0i,j,夹角余弦为:
为此,建立如下优化模型M1来求解初始风险分担综合向量AE0i:
4 各领域专家风险分担向量的调整及其收敛性证明
4.1 领域专家对风险分担向量进行调整的策略
领域专家调整风险因素i的风险分担责任的方法: 各专家把各自风险分担向量中的元素与风险分担综合向量中的元素分别进行比较,然后依据比较的结果对风险分担向量进行调整。假设经过n轮交互式的风险分担向量调整以后,专家ej关于风险承担者bk应该承担风险责任为ani,j,k,关于风险承担者bk在风险分担综合向量中的责任为ani,k,若ani,j,k<ani,k,则专家ej应该提高bk的风险责任,反之,则应该降低其风险责任,而且提高或者降低的幅度不超过|ani,j,k-ani,k|,且确保调整后的风险分担向量满足RW1.
设AEni和AE
终止交互式过程的判定条件可以设定为: 若该距离d(AEni,AEn+1i)小于某一事先设定的正实数ε,即d(AEni,AEn+1i)<ε.上述交互过程是一个不断收敛的过程,即经过若干轮调整以后,交互过程的终止判定条件一定能够满足。
4.2 交互过程的收敛性证明
风险分担综合向量求解过程的收敛性定理: 对于任意给定的一个极小值ε,一定存在一个最优解AEn+1i满足终止判定条件d(AEni,AEn+1i)<ε.
证明 首先证明最优解的存在性。由初始风险分担综合向量AE0i的求解方法可知,AE0i是模型M1的一个可行解。又根据模型的约束条件可知,目标函数的可行域φ0有界,所以目标函数一定存在最优解。
对于AE0i,其可行域φ0可以表示为:
根据AE1i,j(j=1,…,8)运用M1获得另一个可行解AE1i,
可行域φ1可以表示为:
所以有φ1⊆φ0.如果d(AE0i,AE1i)≥ε,则用AE1i取代AE0i,再次调整风险分担向量后获得风险分担综合向量AE2i,若其可行域记为φ2,则同理可以推导出φ2⊆φ1.这就说明,只要不满足终止条件d(AEni,AEn+1i)<ε,则用AE
4.3 CADTV项目整体风险分担向量的计算
风险因素ri的最终的风险分担向量AEn+1i,确定了各个风险承担者对风险因素ri所分担责任。对于CADTV项目整体风险, CADTV项目风险承担者bk所承担的风险责任rbk可以表示为:
所以, CADTV项目利益主体的对项目整体风险的分担向量RB={rb1,rb2,…,rb8}。
5 CADTV项目风险分担向量的计算过程及其结果
风险因素的权重向量为{0.25,0.15,0.21,0.1,0.06,0.05,0.1,0.05,0.03},模型M1可以运用软件Lingo9.0软件进行求解。以风险因素r1为例说明最终风险分担向量求解过程,a01,j,k如表1所示。
当ε=0.05时,在表1的基础上经过4轮迭代后才满足d(AE31,AE41)<ε,获得风险因素r1的风险分担综合向量AE41={0,0,0,0.1,0.61,0.22,0.07,0},其它风险因素的最终风险分担综合向量分别为: AE32={0,0.12,0.35,0.4,0,0,0,0.13}, AE23={0,0,0,0.45,0,0,0.55,0}, AE34={0,0.37,0.24,0,0.25,0,0,0.14},
AE26={0,0,0.34,0,0.66,0,0,0},
AE08={0,0,0,0,1,0,0,0},
所以, CADTV项目利益主体的对项目整体风险的分担向量RB={0.02,0.06,0.09,0.20,0.29,0.18,0.13,0.03}。
6 结束语
有线数字电视项目风险分担既是有线数字电视项目风险管理中的基础性问题,也是有线数字电视价值链整合中基础性问题。国内有线数字电视的公益性和不成熟性决定了在有线数字电视风险分担中必须集成各个领域中不同利益主体的意见和诉求,也就是需要通过多专家交互的形式集成各个不同领域专家意见。基于有线数字电视项目风险分担中这一基本特征,论文提出了一种多领域专家交互式的有线数字电视项目的风险分担模型,该模型是一个循环迭代的过程,并且在数学上证明了该模型的收敛性。最后给出了一个CADTV项目分担的计算示例,以说明和验证该模型。
摘要:有线数字电视项目风险分担评价是有线数字电视风险管理中的基础性问题。由于目前国内有线数字电视项目的公益性和探索性,国内有线电视项目风险分担评价需要采取多人交互式的评价过程,论文提出了一种多领域专家交互式的有线数字电视项目的风险分担模型,并且证明了该模型在交互过程中的收敛性,最后给出了一个计算示例。
关键词:风险分担,数字电视,交互过程收敛
参考文献
[1]李丹.中国推进有线电视数字化的根本出路[J].新闻与写作,2007,(5):34.
[2]樊俊荣,马天擎.我国有线电视数字化进程中的制约因素及对策[J].中国有线电视,2005,(19/20):1880~1882.
[3]国家广电总局.全国有线电视数字化进展的情况通报[J].广播与电视技术,2007,(3):16~19.
[4]李贵孚.我国有线数字电视产业链研究[J].工业技术经济,2007,26(3):124~126.
[5]裴世兰,邱洪伟.我国有线数字电视利益相关者分析[J].中国传媒科技,2006,(4):55~58.
[6]柯惠新等.调查研究中的统计分析法[M].北京:北京广播学院出版社,1996.
[7]李先来,范佳.基于因子分析法的研发资金控制预警模型研究[J].湖南工程学院学报,2006,16(4).
[8]景劲松.复杂产品系统创新项目风险识别、评估、动态模拟与调控研究[D].杭州:浙江大学,2004.
[9]马林.基于SCOR模型的供应链风险识别、评估与一体化管理研究[D].杭州:浙江大学,2005.
[10]Bana e Costa C A,De Corte J M,Vansnick J C.MACBETH[Z].LSE OR Working Paper,2003.56.
[11]董雨,王国华,熊立.多层次交互式确定权重方法的改进[J].中国科学技术大学学报,2005,35(4):576~582.
微课程的一种交互设计模型 篇2
关键词 微课程 学习资源 教学设计 网络课程
中图分类号:G64 文献标识码:A
1微课程定位和设计理论来源
1.1微课程定位
关于微课程的概念,国内外学者从广义到狭义,从要素到功能,从过程到结果,从设计到评价等不同的视角和应用情境,提出50多种定义。内蒙古鄂尔多斯市的李玉平老师认为,微课程创造了一种5分钟学习模式;上海师范大学的黎加厚教授认为,微课程是时间在10分钟以内,有明确教学目标、内容短小、能集中说明一个问题的小课程;华东师范大刘名阜博士认为微课程应是一种适应现代快节奏,适合移动学习、泛在学习、碎片化学习等而围绕某个教学主题精细化设计的讲座长度不长于10分钟的内容精、容量小的新型课程形态。这些概念都是将微课程作为课程孤立地看待,当借助网络媒介进行传播时,呈现的却是一种资源形态,导致在设计上只关注课程内容上的教学活动,缺乏在网络资源交互方面的教学活动,通过网络可以实现学习者与学习者的交互、学习者与教师的交互、学习者与学习资源的交互。关于微课程概念本文不做讨论,但它有以下特点:当作为课程属性时,具有知识点单一、知识点不可再分、自足性等特点,当作为网络资源属性时,具有容量小、时间短、交互性、可移动性、开放性等特点。
1.2设计理论来源
本文微课程交互设计理论根据是认知负荷理论,该理论是由澳大利亚新南威尔士大学的认知心理学家约翰?斯威勒于1988年首先提出的[8]。主要是关于工作记忆的研究,认为:工作记忆的容量是有限的,长时记忆在本质上是无限的;将学习内容积极理解和消化,将工作记忆转换和存储在长时记忆中;如果超过了工作记忆的资源,那么学习将会无效。其中影响认知负荷的基本因素有三个:个体的先前经验、学习资源内容以及学习资源组织和呈现方式。认知负荷理论经过20多年的发展,已经成为继建构主义理论之后又一个对教学设计起重要指导作用的心理学理论,研究方向正从传统学习领域转向网络学习领域。按认知负荷的不同来源,可以把认知负荷分为三类:内部认知负荷、外部认知负荷和相关认知负荷。内部认知负荷依赖信息材料的内在难度,有多少组成成分和它们之间是如何影响的。当信息材料的组成成分很多,且它们之间的相互作用很复杂时,内部认知负荷会非常高。外部认知负荷依赖信息的设计方式,资料组织的方式和呈现的方式。当信息的设计与呈现方式不够好时,用户必须从事与信息无关的认知加工,外部认知负荷会增高。
2微课程设计分析
微课程并非是传统网络课程切片化后的组合,每个微课程的“微”主要体现在短小精悍且开放,与网络课程全面系统且较封闭有明显不同之处,相同之处都要体现交互性。微观(Micro)、中观(Meso)、宏观(Macro)早已作为描述教学产品和教学设计的视角。在设计教学技术产品时,微观视角的设计指向于产品本身,宏观层面的设计则考虑产品在更大情境中的影响和应用。宏观、中观、微观的设计使得教育产品设计的粒度逐渐递减。传统的教学设计模型致力于开发大单元的教学。微观设计主要指设计和制作小单元的教学,用于制作小的多媒体教学产品内容,比如短小讲座(Micro?Lecture)、Podcast和互动模拟等。它的内容设计基于组块(Chunk)的理念,将相关信息组成知识模块。模块内容大小与信息的复杂度直接相关。
3微课程交互设计原则
根据上述设计分析,微课程设计既是微观设计,又是宏观设计。当作为微观设计,既要体现微课程的课程属性,又要体现“微”特点,因此作为微观设计要遵循以下原则:第一,课程内容完备,微课程内容能够体现教学目标、教学内容、教学活动,甚至教学评价。第二,知识点不可再分割,不能划分成更小的知识点,即方便课堂教学内容的再组合,也方便学习者自学时根据个体先前经验选择不同学习路径。
当作为网络学习资源进行宏观设计时,即体现微课程单元的交互性,又要体现微课程群的智能性,因此作为宏观设计要遵循以下原则:
(1)微课程单元设计上要能够“学”“测”“评”一体化,每个微课程单元是一个相对独立的个体,是一次完整的学习交互体验。
(2) 在功能设计上要体现泛在学习,既可以利用移动终端随时随地的主动有选择学习,又可以被动“推送”到移动终端进行强化学习,形成泛在学习交互环境。
(3) 重点信息清晰可辨,尽量通过界面设计体现出课程群的组织结构和语义关系。
(4) 微课程群层次具有纵深性,满足不同等级学习者的学习需求,能提供深层学习。
(5) 开放微课程资源,允许学习者参与到微课程资源的建设,以协同和协作的方式提升微课程质量;未来的网络学习资源可能是一种开放的架构,在教师完成微课程资源的初始建设后,学习者在使用过程中对微课程资源进行评价和完善,使用集体协作的建设方式。
(6) 允许学习者以微课程资源为桥梁进行交流评价。
交互式多模型 篇3
关键词:交互式多模型,粒子滤波,声源跟踪
在机动目标跟踪领域,交互式多模型(interact-ing multiple model,IMM)[1,2]是在第一代多模型算法的基础上引入模型之间的交互而得出的。经典IMM算法采用卡尔曼作为滤波器,而卡尔曼滤波器只能处理线性系统、高斯噪声情况下的跟踪,这就导致IMM算法应用的局限性。因为粒子滤波算法 (particle filter,PF)[3]解决了非线性系统、非高斯噪声情况下的跟踪问题,所以该算法成为近年来IMM研究的热点之一。
粒子滤波是基于蒙特卡罗仿真的递推最优贝叶斯估计。其基本思想是:通过寻找一组在状态空间中传播的随机样本对概率密度函数进行近似,根据样本均值及其对应的权值计算状态变量的估计值[4,5]。
为了将IMM算法应用在非线性、非高斯的环境下,Boers和Driessen[6]将IMM与PF结合,构建了交互式多模型粒子滤波(interacting multiple model parti-cle filter,IMMPF)。IMMPF算法在模型的交互和融合方面与原有的IMM算法相同,改进的地方在于滤波器由原来的卡尔曼替换为粒子滤波。相比于IMM算法,IMMPF算法能够在非线性、非高斯的跟踪情况下得到状态输出的最优解。
1基本的IMMPF算法
系统的状态转移方程和观测方程可以表示为
式中,X(k) 表示k时刻模型mk的状态向量;F和G分别为状态转移矩阵和过程噪声输入矩阵;W表示过程噪声。对于不同的模型,状态转移矩阵F 、过程噪声输入矩阵G以及过程噪声W是不相同的。 Z(k) 表示相应的观测向量;H表示观测矩阵;V表示观测噪声。
假设系统中模型个数为M ,mk= 1,2,⋯M 。系统模型之间的转移概率由马尔科夫链表示,即
一般来说,在整个声源运动过程中pij是恒定不变的 。 若已知初 始状态X( )0 ,初始模型 概率以及各个时刻观测值Z(k) ,就可以估计出k时刻的状态估计X(k) 。
假设k - 1时刻各个 模型的模 型概率为第i个模型在k - 1时刻的状态估计和相应的协方差分别表示为Xi(k - 1) 和Pi(k - 1) 。交互式多模型粒子滤波算法主要分为以下四步。
(1)输入交互
k - 1时刻模型的交互概率为
式中,归一化因子为
交互后模型j在k - 1时刻的输入为
交互后模型j在k - 1时刻状态变量的协方差为
(2)模型匹配滤波
预测k时刻粒子状态可表示为
式中,Fj为模型j的状态转移矩阵;Gj和Wj分别为模型j的过程噪声输入矩阵及过程噪声。
预测观测值如下
Hj为模型j的观测矩阵。
粒子的残 差为,且
其中,R是观测噪声的协方差。
归一化后的权值为
k时刻模型j的状态估计为
k时刻模型j协方差估计为
(3)模型概率修正
预测观测值的均值:
残差协方差为
(4)交互输出
2改进的IMMPF算法
为了提高IMMPF算法的跟踪精度、降低算法的运算量,相关学者从不同的角度对IMMPF进行了改进。改进算法大致可以分为三类:
(1)基于马尔科夫转移概率的修正
经典的IMMPF或IMM算法一般假设马尔科夫转移概率为固定值且是一阶的。一阶的马尔科夫转移概率容易造成滤波的精度不高。为了提高跟踪的精度,JIAN LAN等[7]将二阶马尔科夫转移概率引入到IMMPF算法中,文献通过实验证实采用二阶马尔科夫转移概率的IMMPF算法与原有算法相比,跟踪精度更高。封普文等[8]为了打破转移概率为固定值的限制,利用后验信息对马尔科夫转移概率矩阵进行修正,提出一种马尔科夫转移概率矩阵在线更新算法。IMMPF算法的模型集是有限的,在跟踪强机动目标时容易出现发散的现象。文献[9]提出一种机动性检测的PTHMM算法。该算法将目标的机动性作为观测量,马尔科夫转移概率矩阵作为隐藏状态,建立隐马尔科夫模型,利用维特比算法计算出模型转移概率权值,进而动态修正转移概率矩阵。
马尔科夫转移概率矩阵是交互式多模型粒子滤波很重要的一个参数,其精确与否将直接决定交互后每个滤波器输入状态变量的精确度,进而影响整个算法的精确度。
(2)基于模型概率的修正
模型概率作为决定最后输出结果的一个参量, 其对最终的输出结果也起着至关重要的作用。模型概率类似于粒子滤波中权值,对并行运算的每个滤波器的输出结果加权融合得到最终的输出结果。对模型概率进行修正也能提高算法的跟踪精度。
在IMMPF算法中,模型概率的计算只是利用了新息和模型概率的预测值,没有利用当前时刻的状态协方差。文献[10]综合利用状态协方差的信息、 新息和模型概率的预测值等信息,提出基于模型概率修正的交互式多模型算法。朱军祥[11]基于模糊推理算法对模型概率进行了修正。修正后的算法将较小的模型概率设置成零,使与当前运动状态匹配程度更高的模型概率变大,进而降低模型之间的竞争, 提高跟踪的精度。
(3)滤波算法的改进
IMMPF算法在解决非线性、非高斯问题时,能够获得最优解。但当目标处于线性运动时,IMMPF算法的跟踪精度要低于IMM算法。文献[12]对滤波部分作了改进,其在滤波部分综合使用了卡尔曼滤波和粒子滤波。当状态方程是线性时滤波器匹配卡尔曼滤波器,当状态方程是非线性模型匹配粒子滤波。虽然粒子滤波在解决非线性、非高斯问题时具有无可比拟的优势。文献[13]为解决粒子滤波退化问题,提出一种改进的残差重抽样算法。算法不再单独求取每个粒子的复制次数,而是对粒子权重与总的粒子数的乘积累积求和后再取整,也就是求得累积粒子复制次数,最后输出粒子,保证重采样前后粒子数目不变。文献[14]通过改变目标状态方程的似然函数来调整粒子的权值,使得采样粒子更有效。文献[15]将无迹粒子滤波运用到IMM算法。无迹粒子滤波的重要性抽样函数考虑了当前时刻的量测信息,采样得到的粒子更接近真实后验概率密度函数,从而使滤波结果更加精确。
3IMMPF算法在声源跟踪的仿真结果与分析
声源跟踪实质上是一种非线性滤波,运动模型是影响跟踪效果很重要的一个因素。IMMPF的运动模型可以包含多种运动形式,因此可以跟踪随意运动的目标。声源跟踪作为目标跟踪的一种应用场景,将IMMPF算法应用在声源跟踪当中一方面丰富了声源跟踪的理论,另一方面也拓展了IMMPF算法的应用领域。下文的论述是对IMMPF算法在声源跟踪的应用进行了仿真实验。
3.1实验仿真环境
实验在一个5 m×4 m×3 m的房间内进行,房间的混响通过IMAGE模型仿真获得。实验中选取房间混响为300 ms,信噪比为30 d B的一段语音信号进行仿真分析。
实验采用匀速、左转弯和右转弯三种模型对声源的运动轨迹进行模拟仿真。实验中观测时间间隔T = 0.064 s,初始模型概率均为1 3 ,模型转移概率矩阵,粒子数N = 200 。匀速模型 、左转弯以 及右转弯 三个模型 对应的过 程噪声协 方差Q1= 0.01,Q2= 0.1,Q3= 0.1 ,观测模型 噪声协方 差R = 0.01 。 三种模型 初始状态 协方差分 别为 、P1(0)=diag(10- 6× [400,100,400,100])、P2(0)=diag(10-6×[100,100,100,100])、P3(0)=diag(10- 6× [100,100,100,100])。 初始状态 设定为[0.8; 0.4; 0.2; 0.3] ,转弯速率为1.13°/s。
运动轨迹:
整个声源运动时间持续100 s,主要经历五个阶段
(1)0~20 s匀速直线运动;
(2)21~45 s声源以1.13°/s的速率作 左转弯运动;
(3)46~60 s目标继续作匀速运动;
(4)61~85 s声源以1.13°/s的速率作右转弯运动;
()匀速运动。
3.2实验仿真结果分析
实验仿真结果如图1所示。由图1可以看出, IMMPF算法在匀速运动阶段能够得到较好的跟踪效果。当声源处于转弯运动时,跟踪结果与真实轨迹稍有偏差。转弯模型是影响跟踪精度的一个很重要的参量,对转弯模型的优化有助于提高跟踪的精度。
4结论
IMMPF算法融合了IMM和PF各自的优点,在解决非线性、非高斯情况下的状态估计具有明显的优势。与此同时也要看到,IMMPF算法作为最近几年刚被提出的算法,其算法本身还不够成熟,在声源跟踪的应用也只是初步的尝试[16]。如要完善IMMPF算法在声源跟踪的应用,仍有许多问题亟待解决。
交互式多模型 篇4
关键词:交互认知复杂性学习模型;教学软件设计;模式
中图分类号:G436 文献标志码:A 文章编号:1673-8454(2014)20-0021-04
20世纪末,通过将各种非线性成分的建构介绍到传统的线性教学设计方法中,科学领域的复杂理论逐渐融入到教学系统开发模型,对ID理论来说,适于考虑这种把非线性作为具有动态本质的学习和思维的固有特征的学习理论。所以提出一个源自于复杂性理论观的模型,这个范式是基于交互认知复杂性学习的假设。交互认知复杂性学习模型提供了一个对学习的教育学解释,模型的目的是将其作为教学设计理论的心理基础。
一、交互认知复杂性学习模型
从系统科学的角度看,教学系统设计(ISD)的四代发展可表述为“线性循环—流程图—阶段内循环、阶段外线性—动态交互网络”的演变过程。前三个阶段,基本上是设计、开发线性教学程序或是对线性教学程序的完善和补充,我们把它归结为线性教学系统设计。最后一个阶段,美国明尼苏达大学坦尼森教授在认识到了还原论、线性思维重视部分,忽视认知系统各要素之间互动关系给教学系统设计所带来的局限性的基础上,将混沌理论引入教学系统设计的研究中,提出了线性与非线性相结合的认知要素等重要观点,最终形成了交互认知复杂性学习模型。
交互认知复杂性学习模型的特点是:第一,该模型必须能够描述认知的线性和非线性的元素;第二,该模型必须解决高级的内部心理过程(如解决问题、决策制定、问题确定和创造性)中的内容知识和认知策略的互动问题;第三,该模型必须包括作为认知系统整体的成分之一的情感元素。[1]
交互认知复杂性学习模型的主要成分为:第一是作为理论基础的复杂理论。该理论融合了北美认知理论与欧洲认知复杂性理论。第二是学习目标,主要参照加涅的学习结果分类对将要学习的内容进行目标分类。第三是教学规则,也就是针对于各个学习目标形成的教学策略。
该模型的基本子系统包括以下内容:感觉接受器(感觉记忆)成分、执行控制成分、情感成分、知识库成分以及内部认知处理能力,[1] 如图1所示。该模型指出认知系统的两个主要信息来源:外部和内部。外部信息通过标准的感觉机制进入认知系统,而内部信息则是不同系统成分与认知能力之间积极互动的结果。外部行为是通过感觉记忆成分的输出而得到展示的。
需要注意的是,该模型并不是一个传统的信息加工模型,而是一个高度动态的、交互的系统,不同成分之间是持续整合的。在多种非线性状况的情境中,认知是一个动态的现象,随着情境变化而变化,以难以预知的方式进行着自我调节、重构和建构,并非一个确定性的线性的信息加工过程。认知系统中的子系统以无数种方式变动和适应。
坦尼森等人引入科学领域的复杂理念,提出一个非线性教学系统设计模型,不把学习看做是从感觉记忆到短时记忆到长时记忆的线性加工过程,而是一个具有高度灵活性和适应性的模型。交互认识复杂性学习模型强调各种成分的积极认知加工和与环境的相互影响,取代那种脱离其整体关系对学习要素进行研究的简化方法。学习和认知中情感成分的重要性伴随着知识贮存和提取的一般要素而得以实现。模型另一个独特的地方在于内部认知过程对于利用已有知识和建构知识都发挥了作用。
关于交互认知复杂性学习模型的应用方面,还是教学设计中的问题解决、决策制定、问题确定和创造性。提高学习者的学习效果,优化教学策略,从而达到教学目标。
二、交互认知复杂性学习模型的应用
首先是目标具体化,这是每个教学设计者所需要明确的内容。教学目标的具体化是对教学和学习的目的加以明确的过程。将目标具体化还需要详细分析所要求学习的目标的类型,我们参考了加涅的学习结果分类,即:言语信息、智慧技能、认知策略、运动技能、态度。[3]根据分类来进行目标的细化分类,并根据分类的特征进行模块化的学习方法设计。例如,教学的目标是学习新的概念知识,我们可以根据学习者的特征采取直接叙述或是例子描述等方法。
其次是对于学习环境的考虑,教学有多种形式,不仅包括传统大班式集体教学,也有一对一式,不仅包括学生在学校的学习,也包括了企业员工的培训等等。环境复杂多样,没有一个固定单一的教学设计能够适应如此复杂的环境。根据不同的学习需要,教学设计者必须采用不同的教学方法,制定出合适的教学格式。
最后在教学过程中涉及到学习者的认知过程。基于交互认知复杂性学习模型的教学中,我们不能忽视交互性,整个模型中交互性是一个教与学的信息不断反馈交流的过程,其中不仅仅是教师与学习者之间的交互,也包括学习者与学习环境间的交互,学习者之间的交互,学习者自身的内部交互。
三、基于交互认知复杂性学习模型的教学模式设计
教学的过程不可能是一个线性的过程,教学设计也不是一个单一的一成不变的过程,在适合的心理学基础与丰富的教学经验的糅合下,具有丰富经验的教师能够设计出对于他本身的教学情况最适合的教学。在此我们尝试将认知复杂性作为心理学基础进行教学设计的探讨,将教学方法融合进入教学软件中,实现教学软件能够灵活提供学习者学习方法。我们将教学方法一一分开,分为几个不同的模块,通过对模块的组合来实现不同的学习方法。
由以上分析的交互认知复杂性学习模型的特点与应用方式来看,该模型适合于模块化的软件开发方式。通过将学习目标进行分类,我们可以将教学模块进行以下分类,言语信息对应的教学方式为讲解式教学模块,智慧技能对应的是练习式教学模块,认知策略对应于复杂动态教学模块。其中复杂动态教学模块主要以复杂情境下解决实际问题的教学方式为主。学习态度对应的则是问题导向式的教学,通过灵活的问题引导学习兴趣。以上四个模块组成为教学模块,在进行教学设计时不需要学习所有的模块,只需对教学模块进行组合形成教学规则即可,设计者可以是学习者或者是教师,对于教学模块的选择则是根据学习者自身的情况来选择。每个教学模块都应与交流模块相连接,以便学习者能在学习过程中及时互动。
该教学软件应适用于不同的科目,对于不同的教学内容只需按照模块的需求将教学资源放入其中,学习者可以灵活地选择教学模块从而制定出自己的学习方法。讲解式教学模块内容主要以教学视频、文字为主,以陈述性知识的讲解为主。练习式教学模块以练习、模拟操作等内容为主,学习者需要在具有一定知识背景下完成实例练习。问题导向式教学模块根据教学内容设计问题,具有引导学习的作用,以具有情境的简单例子问题为主,问题应有启发性。复杂动态教学模块属于对教学资源要求最高的模块,它主要包含模拟复杂情境下的问题、案例等,同时也包含角色扮演和综合性较强的实际问题,问题解决应使学习者得到较大的能力提高。复杂动态教学模块则是加强学习者对新学知识的理解和应用能力。四个模块进行动态链接,使用者可以根据教学目标来确定教学格式。不同的教学方法形成不同的教学格式,例如,第一是传统的讲解,练习方式属于结构化的线性的教学方式;第二是基于建构主义的发现学习法,通过工具来建构内容;第三是与前两者都不同的方式,学习者直接通过模拟环境中的资源来自主寻找所需内容自主学习的方法。下面我们就对教学软件进行模拟应用,阐述上述三种教学方法的实际应用进程。
四、模拟应用
下面是运用结构法、认知建构法和发现法的三种不同教学方法例子。在针对于程序设计的教学设计中,我们选择的教学目标是程序设计中的语句循环的学习。具体需要掌握的语句有 for、do…while、while…do。
1.结构法是传统的线性的教学:内容结构化
结构法较多运用于概念的习得。由于学习该门课程的对象是大学生,具有一定的理解能力和自我学习能力,因此在方法上选择了传统的结构法,这样直接将各个语句的含义和规则直接呈现给学生。
目标:学习并掌握各个循环语句。
目的:学生能够理解各个语句的含义。(文字信息)
学生能够理解各个语句的语法规则,并能够阅读简单的循环程序。(智慧技能)
学生能够在简单的问题环境下灵活运用各个语句写出自己的程序。(情境性技能)
教学格式:
如图2,每个教学模块都具有双向性,即每个模块间具有交互性。使用该教学格式的学习者的特征我们进行如下假设:第一,学习者没有学习过循环语句,对程序设计进行入门学习。第二,学习者对于循环语句已有初步了解,但是理解有误。我们在学习目的中详细列出了每个认知子系统需要学习的具体目标。基于每个认知子系统的学习目标我们得出了相应的教学格式、顺序(见图2),讲解式教学主要针对陈述性知识,练习式教学主要针对程序性教学,问题导向教学主要针对情境技能。前三个模块的执行根据学习者的具体情况略有不同,对于完全的新手我们需要从讲解式教学或以问题引导入手,而对于已有概念雏形的学习者,从练习式教学入手再逐步加强对概念理解的方式更为适当。因此针对于不同的学习者要进行适当的选择。
最后在学习者已经能够完成前面三个模块的学习之后进行复杂动态教学,即在一个复杂环境下尝试能够运用所学的知识。在这个例子中就是学习者在一个特定情境下进行灵活运用循环语句。这样通过完成具体的教学步骤直到达成学习的目标。
2.认知建构法
这里的认知构建法是学习者进行的高水平的认知活动,通过学习者自身依靠已有的知识经验对将学的知识进行自我构建的方法。在我们给出的循环语句的学习例子中学习,可以尝试让学习者用自己的语言进行循环语句的描述,通过用自己的方式解决具体实例问题构建一个循环语句。教师通过分析学习者构建的内容来简化提炼,引导其理解将学的语句的具体含义和用法。认知构建法使得学习者一开始就能随着问题积极进入学习,自主实验自己的想法,这种方法对于理解与实际问题联系性较强的问题相当适合,但需要教师的及时指导,问题需要当场解决,否则学习者容易自己走进误区。
目标:学习并掌握各个循环语句。
目的:提高自我构建循环语句描述相应问题的能力。目的分类同上。
教学格式:给出具体问题,学习者自主使用自己的自然语言描述解决该问题。教师引导得出所学内容。
图3给出的是程序语言学习的认知构建法,允许学习者通过自然语言进行问题描述,学习者在对问题描述的过程中理解语句的含义和运用场合,再从自然语言向程序语言提炼的过程中,自我代入程序语言设计者的心理环境能够直观地理解程序语言的形成,快速掌握程序语言的概念基础。这种方法需要学习者有一定的逻辑思维能力和相应的知识构建能力,有时间仔细思考和探索。由于整个过程中学习者自我构建不一定能够形成正确的思路,因此需要教师的引导,在此过程中对于教师的能力要求较高,需要能够在学习者的构建过程中通过分析学习者的表现给出相应指导。总体来说,通过认知构建法进行学习,学习者能具体地深刻地理解所学内容,并且能够很好地掌握所学知识。这种方法对于学习者的能力和教师能力要求较高,因此更适合于专业研究性的学习。
3.发现法
发现法要求学习者具有一定的特定内容的知识背景,通过延展已有的知识发现新内容,进而达成对新内容的学习。这种学习方式适于自主学习,拥有较强自主学习能力的学习者在面对问题时,自主尝试解决。在解决问题之后再通过反馈以确认他们是否正确的理解了新知识。
目标:学习并掌握各个循环语句。
目的:探索性自主学习循环语句的用法。目的分类同上。
教学格式:面向问题的教学,在问题导向的基础上辅助以复杂动态教学。
图4给出的是发现法学习的简单结构描述,其中问题导向与学习者知识建构之间的交互应当是多次的、深度的,交互所要达到的目的应当是学习者自主得出相应问题的解决方案。针对上面给出的目标,在发现法的应用上要求学习者已经具备一定的程序知识,如了解类C代码或数据结构等,有能力进行发现学习。通过不断的尝试解决给出的问题,学习者进行知识建构,在知识库中建构出他们应该具有的陈述性知识与程序性知识。
之后通过反馈确认是否为正确解决方案,解决方案是否能够简化等等。期间复杂动态教学用于进行辅助问题导向教学,提出的问题由浅入深,根据学习者的能力提出适合与发现学习的问题。最后,教学需要达到的是学习者在不断的解决问题的过程中建构了新的知识内容,并在反馈过程中确定学习者掌握了该项知识。
五、结束语
在运用交互性认知复杂性学习模型时,首要考虑的是如何选择一个能与学习理论和学习目标相呼应的教学方法,使教学方法符合学习者心理特征并且具有针对性,提高学习效率。在该模型中应用到的复杂理论则要求我们在应用该模型时能够从多方面考虑教学方式和学习过程,而不仅仅是一个由短时记忆到长时记忆的线性过程。交互认知复杂性学习模型对于教学模式并没有特定的模式格式,而是重在强调其学习者自身内部的交互性与外部环境的交互性。在教学设计的过程中,选择、设计适合的教学模式要根据具体的情况多方面考虑。在交互认知复杂性学习模型中,对于复杂的学习情境我们用境脉与复杂动态策略,通过境脉概念化将问题具体化,之后提出解决方法。通过灵活运用教学软件选择教学策略,教学设计者则可以联系他们的教学实践与心理学相融合,提出具有个人特色的教学模式。
参考文献:
[1]罗伯特.坦尼森等著,任友群等译.教学设计的国际观(第1册):理论·研究·模型[M].北京:教育科学出版社,2005:127-145.
[2]罗伯特·加涅著,傅统先、陆有铨译. 学习的条件[M].北京:人民教育出版社,1996.
[3]袁昱明,施建华.网络教育资源平台的理念、原理与技术[M].北京:科学出版社,2010.
[4]孟伟.交互认知协同性实践与认识论研究的可能拓展[J].齐鲁学刊,2012(2):75-78.
[5]刘新阳,张从善,常淑娟,任建.关于新型教学软件开发模式的构想[J].中国电化教育,2003(5):65-67.
交互式多模型 篇5
目标跟踪是计算机视觉中一个重要的问题,它在视频监视、视频检索、车辆导航等领域有广泛应用。在跟踪过程中,待跟踪目标外观不断发生变化,且目标可能会被其它物体遮挡,再加上复杂的背景干扰,为跟踪算法提出了一系列的挑战[1]。由于单摄像机视野相对有限,处理遮挡等问题需要较为复杂的算法。多摄像机提供了更全视野、更多信息,有效融合多视角信息可以高效地处理遮挡等问题,多摄像机目标跟踪系统逐步成为近几年新的研究重点和热点。
目标跟踪可分为确定性跟踪和随机跟踪。确定性跟踪一般归结为确定性参数优化问题。随机跟踪[2,3,4,5]一般可归结为动态系统的状态估计问题,在这类问题中,对于线性、高斯估计问题,卡尔曼滤波[1]给出了最优解;对于非线性、非高斯问题,序贯蒙特卡洛粒子滤波[3,4,5](Particle Filter)为较常用的方法。随着计算机计算能力的提高,近年来,粒子滤波成为研究的热门课题,它是多测量数据融合的强大工具。
序贯蒙特卡洛粒子滤波[3,4,5]是一种用于估计动态系统状态的贝叶斯推理方法,其核心在于利用粒子来逼近待估计状态的后验概率密度函数从而得到目标状态的估计。粒子滤波不仅解决了跟踪系统中很难得到贝叶斯推理的解析解的问题,还可灵活融合不同类型观测数据,如目标位置信息及灰度信息。基于多摄像机的目标跟踪系统的一个重要任务,是从多个测量及多种测量数据中,更精确地估计出目标位置状态的真实值,因而本文采用粒子滤波的状态估计方法。
基于贝叶斯推理的序贯蒙特卡洛粒子滤波的多测量数据融合算法中:
文献[6]提出了一种基于贝叶斯联合(Bayesian Association)的测量数据融合方式,该方法存在下面两个主要问题:1)后验的时间递推没有给出证明;2)后验的空间递推没有根据摄像机具体拓扑来进行,而建立了各种独立性假设。
文献[7]提出了时空相继的顺次测量数据融合方式,该方法存在下面两个主要问题:1)后验的时空递推相继进行,不一定最终能收敛到时空联合后验;2)该方式的时空后验递推,只对于序列观测方式有效。
文献[8]同样采用分布式贝叶斯推理来得到高阶联合状态分布的后验的时空递推,但是在作者提出的方法中存在两个主要问题:1)后验推导时空递推时设定了多观测及状态之间的多种条件独立假设,不具普遍性,真实跟踪场景中不一定满足;2)没有采用多种类型的测量,对于观测及状态似然计算仅限于目标位置值,没有融合目标灰度信息。
归纳下来,上述方法普遍存在的两个问题:没有给出后验的时空递推方式的严格完整证明,脱离摄像机拓扑情况下的各种独立性假设来得到后验的时空递推,在很多情况下这些独立性假设并不成立;多视角的多种数据类型,没有在算法中充分利用,即没有有效融合多个视角内的目标位置及灰度信息。
为了解决上述问题,本文针对多摄像机视频跟踪的应用场景,在贝叶斯推理的框架下,提出了一种具有分布式时空交互计算特点的目标跟踪算法。该算法首先利用贝叶斯网络对多视角目标跟踪问题进行建模,根据具体摄像机网络的拓扑来完整推导多视角的联合后验概率时空递推的一般形式,并采用时空交互式的序贯蒙特卡洛方法来逼近该后验概率,高效求解出跟踪目标在各个摄像机视野中位置的估计值,通过时间及空间迭代的方法也大大节省了计算量。本算法有效地融合了目标时空的位置及灰度信息,仿真结果证明了本文算法能有效抑制遮挡现象给跟踪结果造成的影响。同时由于本系统分布式跟踪的特性,部分节点的跟踪失效也不影响系统跟踪效果。
1 基于贝叶斯推理的多视角目标跟踪算法
1.1 系统描述
假设待跟踪目标O处在N台静止摄像机(C1,C2,…,CN)的视野中,并且摄像机标号固定,在t时刻任意一台摄像机Ci(i=1,2,…,N)采集到的图像数据表示为zti,跟踪目标在该图像中位置表示为xti={(uti,vti)T}(uti,v ti分别为横纵坐标)。建立如图1所示的贝叶斯网络数学模型,在此定义N(i)为与摄像机Ci邻接的摄像机的编号集合。定义t时刻摄像机Ci的所有邻接摄像机内目标的状态的集合表示为XtN(i)={xtj,j∈N(i)},而对应的XtN(i)在摄像机i中的投影的集合为StN(i)={stj,j∈N(i)},具体投影方式将在第2节介绍。
本跟踪系统的整体任务是利用t时刻采集到的图像数据集合Zt={z t1,zt2⋅⋅⋅,ztN}及目标位置在当前视角的投影StN(i)及其对应的观测的图像数据ZStN(i),预测出运动目标在每台摄像机视野中所处的位置xit+1(i=1,2,…,N)。本系统每个摄像机都有一个跟踪器,分布式地进行视频采集、目标跟踪,本文跟踪算法的目的在于得到每个视角中的后验p(xi:0t+1sN:0t(i),zs:1tN(i),zi:1t),并最终得到目标状态的最大后验估计。
1.2 系统描述
本节中,给出每个视角中的联合后验时空递推的解析解,时空递推也即由推导递推得到由此可降低对于后验逼近所需的计算量。根据D-seperation分解理论[9,10],结合图1所示的贝叶斯网络系统模型,经过推导可得到后验分布的时空递推迭代公式,最终的联合后验表达式可分解为如下形式:
上述式子中的各项的物理含义也很容易理解,p(ztixti)为本摄像机Ci视角内的似然函数,stjk为Cjk视角内的状态投影到本摄像机Ci视角内的状态值,zstjk为其对应的观测,因而∏jk=~1j Kp(zstjkstjk)可以理解为从其他摄像机传递过来的远程观测似然信息;p(stN(i)st-1N(i))为远程目标位置交互信息;p(xit+1xti,stN(i))为时空状态转移函数,它不仅包括了本地状态的时间转移而且包括了远程状态的空间转移,其具体计算方式将在下一节中介绍。
2 序贯蒙特卡洛粒子滤波逼近
上一节,推导得到了多视角观测的联合后验的时空递推的解析解,但是对于一般的非线性、非高斯的动态系统,较难得到具体的解析解。而粒子滤波则巧妙地解决了此问题。为此本文使用序贯蒙特卡洛粒子滤波逼近后验根据粒子滤波的理论[4,11]通过对一个重要性密度函数(Importance Density)q(.)采样得到粒子{xti,n,n=1,...NS},相应的粒子的权重则为
根据粒子滤波的理论[4,11],重要性密度函数一般选择可按照下式分解:
把式(1)和式(3)带入式(2),可以推导得到:
式(4)中的各个项的物理含义也较易理解,现将其物理含义在表2中列出。
按照参考文献[4,11]本文选取可以得到:
对应于图3的系统拓扑图,本文可以得到远程状态转移函数为:
很容易地可以得到该拓扑下粒子滤波的权重时空迭代公式为
下面介绍粒子滤波中本地及远程时空信息交互的计算方式:
1)本地信息p(ztixti,n)计算
记初始选定的跟踪目标模板灰度值矩阵为f(m,n),Ci视野中目标位置xti,n所对应的感兴趣图像区域为ROI(xti,n),则本地信息可以描述为f(m,n)与ROI(xti,n)相似程度。本文算法以结构相似度指数(SSIM)[12,13]来替代传统的用于灰度匹配的归一化相关系数(NCCC)、协方差函数、差平方和(MSD)、差绝对值等指标(MAD),因为SSIM相对而言更符合人的视觉系统,是一个更加科学的指标。
设ROI(xti,n)的灰度值矩阵为g(m,n),则SSIM的计算表达式为
其中:l(f,g)=2μfμg/(μf2+μg2),用来比较亮度;c(f,g)比较对比度;s(f,g)=σfgσfσg,比较结构相关度。
2)远程信息计算
由于tsi-1与xti,n均对应于跟踪目标位置信息,tsi-1为摄像机Ci-1视野中目标位置xti-1投影到摄像机Ci视野中的结果,所以可以利用多视角成像所需要满足的几何约束条件(即单应性矩阵方法)来进行建模。单应限制[13,14,15]描述的是两个视角图像中点与点的对应关系,这种关系由所谓的单应矩阵来描述。利用单应性矩阵方法,对目标位置tsi-1和xti,n之间的关系进行建模,即:
其中:Hji(⋅)是预先得到的单应变换,它可以将摄像机Cj视野中对应的位置xti-1映射到摄像机Ci视野中目标的位置则是二维的零均值高斯噪声向量,表示了不精确Hji(⋅)带来的估计误差和模型的不确定性。
将xti-1通过式(9)投影即可得到,由此的计算与类似,但是由于及其观测都为在摄像机Ci视野中,因而的计算也是采用摄像机Ci视野中的模板得到。为与普通粒子滤波[4,11]类似的视角内状态转移函数。
3 算法整体流程
整个算法流程如图4所示。对式(7)观察可发现,对于每个摄像机而言权重的计算,一部分为本地计算无需借助其他视角信息,另外一部分为远程信息,因而可以利用消息传递的机制,即在每个t时刻,首先计算出每个摄像机的本地信息,然后接收网络上传递过来的其他视角上t-1时刻的粒子位置信息,利用式(7)及建立的远程信息模型,计算出最终的粒子权重,最后将t时刻本地的粒子信息xti,n发送到网络。得到了本地视角i每个粒子的权重之后,根据粒子滤波理论可以按照式(10),计算得到最终本地的估计值:
1)本地计算
在t时刻,每台摄像机节点利用本地得到的观测数据,由式(8)计算得到本地粒子的似然函数p(ztixti)。
2)消息传递
每台摄像机节点将离散随机向量xti,n的具体取值传递到其它摄像机节点。
3)数据融合
(1)每台摄像机节点根据其它摄像机节点传递过来的信息和几何约束条件,利用式(8)及式(9)得到远程粒子信息。
(2)利用式(7),将本地信息p(ztixti,n)与远程交互信息p(zsti-1sti-1)进行融合结合状态转移函数,计算得到后验函数p(xi:0t+1sN:0t(i),zs:1tN(i),zi:1t)的粒子滤波逼近值及最终的状态预测值。
4 实验与结果
4.1 测试数据仿真结果1)定量测试
为定量考查本算法跟踪精度,采用Matlab生成了一系列的测试数据,也即生成了每个视角的目标位置信息,而视角间的投影单应矩阵则为现实世界的单应矩阵的值。由于目标位置信息已精确知道,这有利于考察本文粒子滤波融合后估计结果与目标位置真实值的差别。如图5及图6所示,分别为不同视角间的状态转移噪声(式(9)中εSji(t))及视角内测量噪声情况下估计值与真实值间误差。从图中可以看出,本文的粒子滤波估计值还是比较精确的,估计的绝对误差大部分在5个像素以内。图5及图6中估计结果的RMSE(Root Mean Square Error)均在3以内,为一个比较好的估计结果[5]。通过本测试方法,得到的跟踪结果为理想情况下的最优值,实际情况下由于多变的背景等的变化,会使得估计误差加大。但是本测试证明了本算法的正确性、可靠性及算法估计结果的最优上限。此外,本测试结果,给我们在实际视频中的测量噪声及状态转移噪声的设置给出了参考。可以看出,在一定范围内设定的状态转移噪声及测量噪声对估计结果的影响为在可接受范围之内。
视角一中的目标位置的横纵坐标ut1与tv1分别以下面的关系变化:
其中:t代表帧数,调整s可改变目标的运动速度,当s取为定值时候,随着t的增大,目标的运动速度逐渐增大。
视角二中目标位置由单应变换得到:
式中:H21(⋅)为前文介绍过的单应变换,(ut1,vt1)为通过式(11)计算得到的视角一中目标位置。
2)定性测试
定性测试所用的测试视频为复旦大学数字信号处理与传输实验室自己搭建的多视角视频采集系统所拍摄的现实世界测试视频,对于大量现实视频的仿真结果均跟踪效果良好。图7所示为一个跟踪结果示例,图7所示为两个视角中一个视角被遮挡后,可以在遮挡物离开后,有效被纠正,体现了分布式跟踪一个优势部分节点的失效不会影响整个系统的跟踪效果。图中每个视角内,白框为本地跟踪的结果,蓝框为另一个视角的跟踪结果在本地利用单应限制投影后的结果,红点为本地粒子,绿点或者蓝点为远程粒子。在第二行的图像帧中可以看到第二个视角中目标被遮挡,但是最后仍旧能够很精确地被纠正回来。
4.2 标准视频仿真结果
网站http://homepages.inf.ed.ac.uk/rbf/CAVIAR/上提供了标准视频序列,采用标准视频评估本算法性能。这套视频序列由两台摄像机同时进行拍摄,一台摄像机从场景的正面进行拍摄(视角A),另一台摄像机从场景的侧面(视角B)进行拍摄。对视频序列进行了处理,均取得了良好的效果。
下面具体分析利用远程信息可以有效处理遮挡的深层次原因。如图8所示,在一个遮挡过程中,三个子图的三个维度分别代表粒子的横坐标,粒子的纵坐标及粒子相应的权重值。图8(a)所示为本地经过状态转移后的粒子位置值及对应的权重值,图8(a)中粒子权重最大值位置为(92.89,143.7),为一个局部极值点;图8(b)所示为远程传递过来的粒子的位置及对应的权重值,图8(b)中粒子权重最大值位置为(117.4,150.6);图8(c)所示为经过贝叶斯推理的数据融合后最终的粒子位置及相应的权重值,图8(c)中粒子权重最大值位置为(113.2,130.4),为全局最优点。由此可见,有效地利用其他摄像机传递过来的信息可以很好地纠正本地遮挡等问题,而不需要进行复杂的遮挡判断。
4.3 比较测试
为了更客观地比较本文和文献[6]的算法跟踪精度,我们采用误差测度RMSE来定量评估这三种算法的性能,其计算公式如下:
其中:L为每组视频序列中每个视角中处理的视频图像的总数;tuˆi和tvˆi分别表示t时刻第i台摄像机视野中跟踪目标在x轴和y轴上位置的估计值;而tui和tvi则分别表示在t时刻第i台摄像机视野中跟踪目标在x轴和y轴上位置的真实值。RMSE衡量了估计值与真实值之间距离的均方差。这里,估计值为采用跟踪算法计算所得的结果,真实值则采用人工勾画方式得到:在3组视频序列中的每帧图像上,人工勾画出跟踪目标所在的区域,从而得到每帧图像中目标位置的真实值(tui,tvi)。
表3给出了测试视频的遮挡次数的汇总。表4给出了本文算法、对比算法的精度指标。当RMSE超过20时,可以认为跟踪算法已经完全丢失了目标(在表格中,以#表示)。可以看到,在三组视频序列中,本文算法都没有发生跟踪失败的现象,对比算法在第一组和第二组视频序列中均存在跟踪失败。从表中还可以知道,本文算法的跟踪误差在两组序列中都是最小的,即跟踪性能是最优的。
5 总结
交互式多模型 篇6
MUD是90年代中期开始在Internet上流行起来的多用户异步通讯系统, MUD英文全名是Multiple User Dimension, 它是一种虚拟的“多用户空间”。MOO (Multiple dimension ObjectOriented) 是由MUD发展起来的, 是一种面向对象的MUD, 它通过对各种MOO对象构成的和数据库的共享来向用户提供虚拟社会环境。每一个客户通过自己客户机程序进入MOO。MOO提供实时的在线通信, 它引入房屋空间隐喻的概念, 一个“房间”有一个议论主题, 使得在实际地理位置上处于分离状态的用户能够在一个共同概念空间中进行交互和协作。MOO是面向对象的MUD, 它是MUD的一种也是MUD最有代表性的一种, 因此MUD/MOO经常连用。
2. MUD/MOO的特性
MUD/MOO作为一种基于Internet和文本表现的虚拟现实技术, 能够提供一个实时交换思想、共享信息、合作学习与合作创作的空间, 相比较而言, 它具有如下的特征:
2.1 工具性
从教育信息化的角度讲, MUD/MOO可以被看做一个很好的CMC (Computer Mediated Communication) 工具, 利用它不仅能够进行实时的交流, 也能进行异步的通信。与现行的交流工具E-mail相比, MUD交流更具空间性和个性性, 适合于远距离之间的密切交互, 同时MUD/MOO的匿名特性给用户以更自由的发言权。
2.2 启发性
MUD/MOO是以ASCII字符为主的文本和ASCII字符组成的简单图形来表现的, 屏幕上只有文本, 而没有浮华的图形与声音, 这个虚拟世界是借助于用户的想象存在于用户的脑海中, 而不存在屏幕上, 屏幕上只有提示用户想象的文本。在MUD世界中的一切活动, 都是通过键盘输入的方式进行的, 很少提供感官信息, 启发用户全心的投入思考。
2.3 竞争性
MUD发端于游戏领域时以经验值的高低来确定用户的等级, 有时还根据用户等级的高低来限制用户的可享用资源或者特权, MUD在想其它领域的扩展时一般保留了这一设置, 在教育性MUD中, 这一点更具有吸引力, 如果合理的运用, 不仅能够激发学习者的学习兴趣, 还能起到变“要我学”为“我要学”的积极作用。
2.4 构建性
MUD/MOO的构建性可谓以上特性的整合特性, MUD的众多优点特性使它具备了多人互动、文字虚拟实境、使用隐喻等迷人的属性。另外一点, MUD允许用户自由扩张, 具体的说MUD给用户提供了一个自由展示和发挥自己的框架, 这个框架不是系统具体定的、不可更改的, 而是可以根据自己的兴趣爱好来构建、充实这个属于自己的空间, 因而越来越多的吸引了研究者的目光, 把它作为交流与学习的平台。在教育领域则更多的把它作为一个良好的学习环境, 这一点是它目前在教育应用中最重要也是最有魅力的方面, 下面我们将重点讨论。
3. MUD/MOO与学习环境创设
随着建构主义学习理论在国内外追求信息化教育热潮中占有越来越多的地位, 人们发现MUD/MOO与建构主义结合得非常巧妙:建构主义非常强调以“学”为中心和“情境”在学习中的重要作用, 学习环境是构建主义学习中的一个最为重要的概念, 而学习环境恰又是MUD/MOO在教育中的最大优势, 因而学习环境无疑成了教育与MUD/MOO的结合点。
学习环境的重要性是在建构主义思想在教育中得到广泛推广和在以“学”为主的教学中不断得到肯定的基础上才提出来得, 学习环境往往被定义为用以促进和支持学习活动的学习资源和人际关系的组合。计算机及其网络技术所具有的特性为学习环境的创设提供了广阔的空间, 而MUD/MOO这种特殊的计算机网络技术不仅能够提供学习环境所要求的基本要素、实现人与机器的交流, 而且可以通过网络进行人与人之间的交流、有效地创建学习情景、支持合作、促进交流、促进知识表达和应用, 从而有效地激发学习兴趣, 更好的满足建构主义学习环境创设的需求。两者的关系如下图所示。
3.1 创设情境
MUD/MOO是一种基于文本的虚拟现实, 在这一虚拟现实中, 人们可以到处走动, 可以拓展、改造所处的环境和控制、操纵环境中的对象。许多MUD/MOO所反映的时真实世界中的某些环境, 如学校、实验室、图书馆等, 有些则是想象中的世界, 如体现中世纪的世界或幻想未来的世界。在MUD/MOO虚拟世界中, 情境是最重要的部分之一, 通过文字对某一情境的描述相当于提供了这里的说明材料。
MUD/MOO主要依靠文本表示情境并不是出于技术上的限制, 文本虚拟现实技术特别适合于某些领域的学习, 它能很好的培养学习者的写作、语言等文学素养, 此外, 用文字陈述情境给学习者以广阔的思想空间, 这如同课本和电影、电视相比一样, MUD环境与其它视频、图形类环境相比亦有它的优越性, 只是受众和目的不同而已。
3.2 促进交流
MUD能把地理上相距遥远但有共通兴趣的人聚合在一起, 在MUD/MOO虚拟空间环境中, 用户彼此互动和沟通, 吸引他们的不仅仅是这个共同的空间更重要的则是一系列可以共享的活动。先前MUD游戏中的合作活动往往表现为结对围攻怪物以获取经验值, 然后根据等级的高低分得经验值, 后来在台湾的著名MUD (东方故事II) 中, 将游戏规则改为在活动过程中获得经验值而非围攻结束后再分经验值, 从而吸引了更多的用户。在教育性流, 即可“钓胜于鱼”、“寓学于鱼”、“寓学于乐”、又可受到:“事半功倍”、“各有所得”的效果。
此外, 对于负有针对性、争论性的问题, 在MUD世界中会吸引特定的人群进行较深入探讨, 而且畅所欲言, 这对于问题的求解和创造性思想具有很重要的意义。
3.3 支持建构
MUD/MOO同样支持建构。MUD/MOO是虚拟的世界, “虚拟”一词在当代信息化教育中出现的频率很高如“虚拟学校”、“虚拟实验室”、“虚拟教室”、“虚拟图书馆”等等, 虽然MUD/MOO同样是一个虚拟的环境, 但是却与一般的环境有本质的不同。一般的虚拟环境是一个用户无法更改的环境, 用户所作的只有漫游于体会, MUD/MOO提供的是一个虚拟的框架, 用户可以在这个框架的基础上创建对自己有意义的对象与空间, 其建立与重组的过程体现了建构主义的原则, 为学习者的建构性学习和创造性研究提供了很好的机会和平台。
通过对MUD/MOO在学习环境创设中的作用分析, 结合学习环境的“四要素”——认识工具、学习资源、学习情境、学习策略, 笔者提出了以MUD/MOO支持和创设学习环境的模型, 以期得到关注。
4. 展望
MUD/MOO在教育中的应用已很快突破仅仅作为一种交流平台, 无论是远距离教学、桌上会议、或是内部沟通工具, 都开始有人利用MUD作为化解, 远程教学、虚拟会议、电子图书馆等几个方向代表了当前MUD教育性应用的潮流。当前, MUD/MOO在技术上也取得了很大的进展, 许多MOO已经用MOO空间整合桌上会议、或者内部沟通工具, 都开始有人利用MUD作为环境, 远程教学、虚拟会议、电子图书馆等一个方向代表了当前MUD教育性应用的潮流。当前, MUD/MOO在技术上也取得了很大的进展, 许多MOO已经用MOO空间整合WWW, 包括Gopher clients, 可以让使用者直接浏览Gopher而不需要跳出文字的世界, 两者结合可以同时发挥MOO多人互动合作及WWW超文本的特质, 成为合作超媒体系统Web MOO, 称之为WOO, 它给现钱的MUD/MOO带来了很大的变革, 为学习者提供更为丰富和易得的学习资源, 使MUD/MOO成为一个名副其实的建构主义学习环境, 相信会对教育产生深远的不绯的影响。
摘要:MUD凭借其允许多优点, 很快突破了仅应用于游戏的局限并越来越多的向非娱乐性正当应用延伸。本文从MUD/MOO的概念入手, 提出MUD/MOO学习环境创设模型并对MUD/MOO的教育应用了展望。
关键词:MUD/MOO,学习环境创设,展望
参考文献
[1]MUD/MOO多用户空间的教育应用及前景分析.刘明祥、朱书强.电化教育研究.2002.04
[2]教育MUD/MOO——独具魅力的网络化学习环境.瞿、顾清红.电化教育研究.2000.01
网络三维交互式虚拟模型库的构建 篇7
关键词:交互,动态,虚拟模型库,CAD软件
0引言
机械制图是工科类各专业的一门重要的技术基础课,为了扩展学生的思维,教学中普遍采用多媒体课件授课[1],但课件中的动画演示过程不能随心所欲地按照授课者或学习者的要求控制,无法实现交互操作,限制了动画的演示效果。另外,一般的动画格式文件占用的空间较大,网上传输较慢,不便于浏览,而网络化教学在教改中势在必行[2]。
针对以上问题,笔者以Cult3D网络虚拟软件为平台,借助其他三维建模软件和动画制作软件,创建网络虚拟模型库,从而实现了网络化教学。通过Cult3dDesigner软件完成操作者与动画间的交互,使学习者通过控制浏览器可以从任意角度观察模型的外形,也可以利用动画的剖切和拆卸模型,观察其内部结构及部件的装配关系,从而达到类似真实模型的使用效果[3,4]。
1虚拟模型库的创建
1.1 虚拟模型库的设计
利用Cult3D平台制作的交互动画模型库包括了机械制图学习的所有模型,其组织结构如图1所示。
1.2 虚拟模型的创建
Cult3D本身不具有三维建模的功能,需要利用其他三维设计软件完成建模。通过了解,3DMax是目前使用较多的三维建模和动画制作软件,软件安装有对应的Cult3D插件,可以完成3DMax 模型与Cult3D 模型文件的数据交换,因此,我们主要采用3DMax作为模型创建和格式转化的工具。
通过对课程内容的分析,将需要完成的模型分为两大类:简单模型和复杂模型。
(1) 简单模型的制作:
对于此类模型,可以利用3DMax直接建模,如内容中的投影法、点线面和投影变换等。
(2) 复杂模型的制作:
此类模型,直接利用3DMax建模比较困难。可以首先利用其他三维设计软件(如AutoCAD、SolidWorks和Pro/Engineer)建模,然后利用3DMax软件进行数据转化[5]。如内容中的机件表达方法、零件图和装配图部分的模型。
1.3 动画仿真的制作方法
模型的动画制作包括简单的基本体、通过叠加和切割构成的组合体、表现机件的外形和内部结构的表达方法以及部件的装配关系。
基本体的动画制作比较简单,只要把建好的模型导入Cult3dDesigner软件,利用事件、对象、行为和动作等表达模型,实现模型的旋转、移动和缩放效果。
对于组合体和表达方法部分的模型,需要演示切割、组合和隐藏等效果。未切割时的基本形体如图2所示,实现最终的模型要切去的部分比较多,如果在Cult3dDesigner中制作,按照实际一步一步地来进行切割和产生动画比较困难。我们可以在制作动画时,先在其他三维建模软件中完成所有模型的建模(包括切割去的部分),然后利用3DMax完成数据转换,在3DMax的动画场景中,将所有模型无缝拼接在一起,从外观看上去像一个整体,如图3所示。接下来,通过设定关键帧完成所需要的动画设置,如在制作切除效果时便可以移动被切去的模型或利用隐藏完成切割,实现视觉上的效果,这样制作比较方便。
2动态与交互功能的设计与实现
2.1 Cult3D三维模型场景的制作
一个完整的三维场景包括几何体模型结构、材质、纹理贴图、灯光、摄像机和动画。利用Cult3D的事件、对象、行为、表达式和动作等来分层表达模型关系,从而实现当鼠标点击模型后出现各种效果。制作流程如图4所示。
将模型导入Cult3D后,对其进行动画设置,从而实现旋转、移动和缩放等交互操作动作。对于不能直接完成的一些交互设计,可以利用Java语言编译,生成class文件,在Cult3D 里添加Java程序完成交互设计[6]。
2.2 机件表达方法的交互设计
图5演示了全剖的形成过程,源状态如图左边所示,利用鼠标点击模型上的触发点,剖切平面动态由上而下将模型剖开,并且动态隐藏前半部分。图6是半剖的动态演示过程,与全剖类似,只是动态隐藏了上边右半部分或右前半部分。
2.3 标准件和常用件的交互设计
齿轮是机械传动中广泛使用的传动零件,它可以用来传递动力,改变转速和方向。图7演示了圆柱齿轮、锥齿轮和蜗轮蜗杆的传动过程。利用鼠标点击模型上的触发点,即可演示各自的传动特点。
2.4 装配图的动态拆装设计
通过部件拆装过程的动画演示,可使我们了解部件的功能、性能、工作运动情况、结构特点、零件间的装配关系和拆装方法等。部件的整个拆装过程不仅要具有动态性、交互性和逻辑控制性,而且要符合实际的工艺要求。因而在动作设计中要进行相应处理,具体的动画设计思想是,用激活事件或解除激活事件控制每一个模型的拆卸或安装,用时间线控制动作的先后次序,用视点切换控制最佳的观察方位。通过预设视点列表实现视点的自动切换,在需要切换视点时,将视点列表中的相应视点与当前视点绑定(设定摄像机的参数为列表中的相应视点)[7]。图8为球阀工作原理动画截图,图9为球阀的拆装效果截图。
3利用网页搭建动态交互模型库平台
为了便于虚拟模型库的管理和浏览,虚拟模型库的主页以模型的轴测图展示。首先在3DMax软件中显示出要展示的模型最终效果,然后调整模型显示的轴测图位置,用截图软件截取模型图片,要求所有截图的格式和大小一致,以便于调整。
利用Dreamweaver软件进行主界面编辑,在网页上构建虚拟展厅。对上面截取的模型图片进行整理,将Cult3dDesigner中制作的CO文件插入到网页中。利用Dreamweaver设计模型库的导航界面,当鼠标点击相应的内容时即可进入模型缩略图展示页面,再次点击相应的鼠标,由于缩略图链接到相应虚拟模型文件,即可打开虚拟模型。由于在IE中浏览文件需要安装Cult3D_IE相关插件,因此网页中要设置提醒浏览者安装插件的提示文字,并提供所需的插件。图10为模型库的主界面。
4结论
基于网络的交互式虚拟模型库,以动态、交互的形式演示空间模型,使教授者和学习者可以根据主观要求控制和操作浏览器,使用者与动画间完成交互,实现了从任意角度观察模型的外形,也可以动态地展示模型的剖切和拆装,达到了真实模型的使用效果。激发了学生的学习兴趣,提高了教学质量,推进了网络教学的发展。
参考文献
[1]冯桂珍,池建斌.基于Web的虚拟现实模型创建工具[J].工程图学学报,2004,25(3):30-34.
[2]袁保国,冯桂珍.基于Cult3D的机械制图虚拟模型库的构建[J].河北省科学院学报,2008,25(3):11-13.
[3]赵国霞.工程图学虚拟模型库系统的开发与研究[D].兰州:兰州理工大学,2006:20-25.
[4]冯桂珍,池建斌,王大鸣,等.基于Web的机械制图虚拟模型库的构建[J].工程图学学报,2008(6):149-154.
[5]游万里,范富才,姚涵珍.工程制图网络虚拟模型库[J].天津科技大学学报,2006,21(2):77-81.
[6]王玲.基于网络的工程制图虚拟现实模型库的实现技术[J].计算机与现代化,2004(8):125-127.
交互式多模型 篇8
近年来, 房颤在各种心律失常病例中占一定的比例, 病源庞大, 治疗房颤已是各大医院心内科发展重点[1]。导管射频消融作为治疗房颤常用的方法, 可以改善患者的症状、生活质量和心功能, 也能提高患者的生存率。导管射频消融手术能够成为当今房颤治疗的主流技术, 不仅取决于临床学者对房颤机制的研究, 还取决于新型的医疗器械。它拓展了医生的视野, 使医生不通过开刀就可以看到人体内的病变部位。世界上治疗房颤的两大主流设备有美国圣犹达公司的Ensite[2,3]和Biosense Webster (美国强生公司) 的Carto[4,5]。
常见的心脏标测方式有十二导联心电图、体表标测、心内膜标测、心外膜标测、光学标测。其中心内膜三维标测技术集心电标测和心内膜三维模型表面重建为一体, 其最大的特点是导管接触性导航三维标测, 为医生真实直观地提供心腔三维结构图, 实时显示立体心腔解剖图及心肌活动时序, 并能为医生在最短的时间内发现、消融靶点导航, 大大地缩短了医生和患者在x射线下暴露的时间, 同时也降低了手术复杂性和并发症, 提高了手术成功率[6]。
当前国内也有相关的研究, 但对于医学软件的开发大多是基于医学图像处理和分析, 只有少数研究单位开展了射频消融手术软件的开发研究工作[7,8,9,10], 但目前并无适用于临床的系统, 对心内膜三维标测系统关键技术进行研究, 具有一定的社会意义和经济效益。
1 系统原理
本文研究是基于实时三维心内膜电极定位标测系统。在患者体表贴三对电极片, 每对电极片之间通过5 k Hz左右的低频电流, 形成X、Y、Z三维正交电场[11]。以腔内或体表电极作为位置参考, 据此感知及定位电场内任意电极的位置以及消融导管顶端位置、弯曲程度和运动方向并经计算机工作站处理后显示出来。
医师操纵导管, 使导管在被测心腔内沿着心腔壁移动, 系统则以100 Hz左右的频率采集电压定位信号, 获得导管电极在心腔内的位置信息, 当采集的心内膜位点数据足够多时, 用计算机重建心内膜三维模型。一旦得到心内膜三维模型, 消融导管或标测在心腔内的三维空间位置也就可以显示出来, 从而指导导管射频消融过程。心内膜三维标测系统框图如图1所示。
本文主要研究心内膜三维标测系统中射频消融手术导航模块中的心内膜模型网格切割环节。在手术中, 需要在系统中能够对心房后壁和肺静脉处的异常部位进行标记以及消融路径的选择, 并要求系统能够指导环肺静脉消融。根据重建后的心脏和肺静脉的三维模型, 可在每个肺静脉口周围, 距肺静脉大约5mm的位置做环形线性消融。由于局灶可能位于多支肺静脉中, 因而在手术中, 除能标记消融路径外, 还要求系统具有任意分支结构 (肺静脉) 的开口功能。开口是对重建后的心内膜三维几何模型进行网格切割, 将相连的网格单元分开。
本文研究的心内膜三维几何模型获取方法如下:首先基于文献[12]对心内膜散乱点云获取最外层边界点, 然后利用文献[13, 14]构建三维几何模型。
2 相关研究及本文算法框架
2.1 相关研究
近年来, 很多学者在网格切割方面做了相当多的研究工作, 已经提出了许多对三维模型进行切割的方法, 尤其是允许用户进行交互的网格切割在图形学领域里被研究最多。3D网格的交互切割大致分为以下四类。
1) 要求用户在欲切割的轮廓上精确定位几个点, 然后在这个几个点之间寻找最短路径完成切割。文献[15-17]都是属于此类方法, 此类方法直接面向切割轮廓, 可以应用于任意模型。但是, 该类算法在指定切割标记点时需要特别小心, 通常需要按顺序指定和多次旋转模型来指定切割标记点, 此外, 此类方法有严重的锯齿型切割边界。最近几年很少有学者对此类方法进行继续研究。
2) 用户需要指定一个初始化区域, 该区域需要逼近欲切割轮廓或切割轮廓位于该区域内。几何蛇形算法和网格剪算法[18,19,20]演变初始轮廓去定位逼近初始轮廓的欲切割轮廓。文献[21]在一个指定的搜索区域中寻找最佳轮廓, 文献[22]介绍了一些商业化的模型工具允许用户在屏幕空间中进行直线或者“lasso”的切割, 然后依照它们屏幕空间的映射进行网格顶点切割, 这种方法仅限于直线的切割。文献[23]利用图割算法确定切割轮廓。文献[24]提出了一种称为“油漆刷”渐进式交互网格切割方法, 不同于以前的用户界面, 对于该方法, 用户只需要在前景区域内刷上一笔, 被刷的部分即能被切割出来, 而且, 当用户利用鼠标渐进地漆刷感兴趣区域时, 该算法会及时反馈出切割结果, 这种效果是基于高斯混合模型 (GMM) 的局部图割方法实现。不足之处主要是对于光滑的表面, 较难实现部分切割, 对细节信息比较丰富的区域用户也较难实现一次就能得出满意的结果, 需要数次刷才可以实现, 且具有较大的锯齿效应。
此类方法允许用户粗略地指定初始化区域, 但是, 如果划线太短或者背景网格太复杂的话, 产生的切割轮廓有可能不能很好地反映用户切割意图, 而且可能将切割轮廓收敛到局部最小, 很难控制。
3) 用户需要标记一些三角网格顶点为前景 (欲切割部分) 或背景 (剩余部分) , 然后算法标记所有其他的三角网格顶点。在算法执行时, 用户通过在网格上标记strokes来设定前景和背景, 然后利用图割[25,26]或区域增长[27]算法将网格分为两个区域。简易网格切割算法[28]就属于此类, 其基于isophotic度量由不同的种子顶点开始增长为几个子网格而后完成切割。但是, 该技术是基于局部区域增长技术来实现网格切割的, 但这种局部的区域增长有其自身的局限性, 其一般较难处理那些比较平滑且没有明显特征的几何物体。文献[29]要求用户指定特征点, 然后根据网格每个面到特征点的距离将所有面分配到一定的区域。文献[30]主要是针对三维模型网格提出基于受限的随机游动的交互式网格切割。首先, 作者提出一个具有约束的随机游动方法, 该方法对随机游动过程添加约束, 允许用户直接输入参数。其次, 该文献设计了一个基于最短路径法获取平滑切割轮廓的优化方法, 在此优化过程的基础上, 作者提出了一个新的基于受限的随机游动网格切割算法。
此类方法也经常用于图像分割。此类方法优点在于:用户初始标记较容易, 但是自由设定前景与背景区域, 就意味着对切割轮廓的约束就比较少, 此类方法很难得到精确的切割结果, 抗噪性较差。
4) 基于切割边界的方法, 该类方法在用户控制与操作容易性之间找到了一个平衡。文献[31]提出交叉边界刷方法, 在网格切割时只需要用户在欲切割的边界上粗略地勾勒一个stroke。虽然该方法容易使用而且对切割边界容易控制, 但其有明显的缺点。首先, 由于几何形状分界不明显, 本方法经常需多次设置stroke来精准定位切割边界;其次, 当需要精准定义边界时, 设置strokes必须确保方向一致性, 而且因为该方法设定欲切割区域需经过strokes的中心, 欲切割轮廓边界大致与strokes垂直, 所以stroke的长度会影响切割效果。文献[32]提出一种操控性很强的被称为点裁切的交互网格切割方法, 用户只需对三维模型在欲切割区域点击一下鼠标, 生成一个可调节大小的圆, 在该圆内通过基于凹陷感知谐波场理论及投票机制理论方向寻优机制, 找到最优切割轮廓实现网格切割操作, 该方法在操作方面较简单, 不足之处, 对于较光滑的表面或分段光滑的平面无法实现切割。
2.2 算法框架
本文提出的针对心内膜三维几何模型交互式网格切割算法框架如下:
Step1加载心内膜三维几何模型到系统中;
Step2根据系统设置, 构建并初始化用于网格切割的平板模型;
Step3用户通过移动鼠标调整平板位置与角度, 移动平板至欲实现切割的位置;
Step4基于用户交互及平板与三角网格的位置关系, 实现心内膜模型三角网格与平板的交点求解;
Step5重复Step3-Step4, 直到得到用户满意的切割结果, 完成心内膜三维几何模型的切割。
本文第三部分详细讨论算法每个步骤。
3 交互式网格切割算法
针对心内膜三维几何模型, 我们构建一个用于切割三维模型的平板模型:操纵该平板的法向量, 可以在三维空间中的调节切割平板的角度;通过鼠标沿法线方向平移平板。平板对三角网格模型的切割实质上是指三角形网格和切割平板模型相交。
3.1 切割平板模型构建
在本文研究的心内膜三维标测系统中, 我们将控制模型切割的平板看作虚拟手术器械。虚拟手术器械的构建主要考虑虚拟手术器械的外观表达, 外观必须能直观地表现手术器械的功能, 并且能根据手术状态的不同改变其位置, 以满足医生的要求。
本文构建一个几何模型来模拟切割平板与三维模型体数据的关系。几何模型如图2所示, 长方体ABCO-A’B’C’D’表示三维模型体数据抽象成的几何模型。如果平板与模型体数据场相交, 则在长方体模型上会形成截平面A1B1C1D1。
其中, 向量n表示切平板的法向量, 以切入点O’作为原点, 将给定的切入方向向量n归一化作为z’轴的方向, 根据左手法则构建出切割坐标系x'y'z', 在构建的切割坐标系中, 切割平板即在x'o'y'平板中。
切割平板模型可以通过设定四个参数确定, 表示为:
3.2 心内膜模型三角网格与平板空间位置关系
切割平板将三维空间分割为两个半空间。对于空间任意点P (x, y, z) , 则定义顶点到平板的有向距离[33]如式 (2) 所示。
当D=0时, P点在平板上;当D>0时, P点处在平板上半空间中;当D<0时, P点处在平板下半空间中。
由此顶点到平板的D值就可以判断P和平板的位置关系, 同理, 通过检测三角形的顶点到平板的D值就能够判断该三角形与平板的空间位置关系。
由式 (2) 求出三角形的三个顶点到平板的D值, 就可判断出三角形与平板五种确定的位置关系[34]。
(1) 三角面片一个顶点的D=0, 另外两个顶点分居两边, 如图3所示。
(2) 三角面片两个顶点D=0, 而另一个顶点D≠0, 如图4所示。
(3) 三角面片一个顶点在平板的一边, 另两个顶点在另一边, 如图5所示。
(4) 三角面片一个顶点的D=0, 两个顶点在平板的一边, 如图6所示。
(5) 三角面片与平板没有交点或者三角形的三个顶点全部在平板上, 如图7所示。
以上平板与三角形的五种位置关系, 在心内膜三维模型的切割过程中, 每种位置关系的网格信息发生的改变都不同, 因此在切割时就需要不同的处理。当平板与三角形没有交点或三个顶点均在平板上时, 即情况 (5) , 则不用考虑两者相交的问题;当平板与三角形的交点为三角形顶点时, 如情况 (2) (4) , 就可以直接借用顶点的连接方式, 参与相交网格的重构;当平板与三角形的交点不全为三角形的顶点时, 如情况 (1) (3) , 则需计算交点的坐标, 我们在3.3节中进行交点坐标求解分析。
3.3 心内膜模型三角网格与切割平板交点求解
对于之前分析的三角网格与平板位置关系 (1) 和 (3) , 三角形会被平板分割为两个部分, 原三角网格被破坏而生成新的三角网格, 要得到新三角形的顶点信息, 就需要一种算法求该未知的顶点坐标。计算该顶点坐标, 就要求出三角形边与切割平板的交点坐标。
如图5所示, △ABC被分成四边形EFBC和△AEF, 交点为点E和F。将两顶点的坐标分别记为A (x1, y1, z1) , B (x2, y2, z2) , 由这两顶点的坐标可得边AB的直线方程为:
其参数形式为:
将式 (4) -式 (6) 代入平板方程ax+by+cz+d=0中得到:
将式 (7) 代入直线的参数式 (4) -式 (6) , 即可求得交点E (xe, ye, ze) 的坐标。
由式 (8) 可得到交点的坐标值, 从而也就实现了三角形与平板的交点求解。根据此方法, 也就求得了切割平板与心脏模型相交的所有交点, 这些交点参与重构切割后的模型边界轮廓, 由理论推导可知通过此方法可以完全消除网格切割的锯齿效应。
3.4 切割平板移动原理
在该切割算法中, 我们定义两个函数Set Origin () 和Set Normal () , 分别用来设置切割平板的切入点位置和切入方向。根据所确定的切割平板切入点位置和切入方向, 可以得到一条中心轴线, 沿着该轴线判断平板是否与三维模型相交[35]。
在切割过程中需要实时对切割平板的位置和方向调整, 切割平板的坐标和法线方向也将发生相应变化。
三维模型发生平移时的坐标变换矩阵为:
平板绕x轴旋转角度α时的变换矩阵为:
绕y轴旋转角度β时的变换矩阵为:
绕z轴旋转角度γ时的变换矩阵为:
通过旋转变换矩阵式 (10) -式 (12) 乘积来得到最后的复合变换矩阵, 将初始平板的法向量乘以复合变换矩阵即得到旋转后的法向量, 从而得到任意方向的平板。当切割面的切入点与法线方向确定后, 利用3.3节中心内膜模型三角网格与平板交点求解方法, 实现任意位置与角度平板的交互切割。
4 实验结果与分析
利用上述平板网格切割方法对心内膜三维几何模型进行实验分析, 实现网格切割。本文在P4 2.40 GHz、内存2GB的电脑上, 在Windows XP操作系统下的Visual Studio 2005平台中, 采用VTK与MFC相结合, 利用C++编程语言, 由心内膜散乱点云数据进行心内膜三维模型的构建处理, 完成从点云采集到模型构建、平板切割的算法功能实现。
实验步骤如下:
(1) 基于文献[12]对心内膜散乱点云获取最外层边界点, 然后利用文献[13, 14]构建三维几何模型;
(2) 加载心内膜三维几何模型到系统中, 构建并初始化用于网格切割的平板模型;
(3) 借助矩阵变换, 用户交互实时对切割平板的位置和方向调整, 移动切割平板至欲切割的位置;
(4) 基于切割平板与三角网格的位置关系, 利用3.3节中方法实现模型三角网格与切割平板的交点求解;
(5) 重复 (3) - (4) , 直到得到用户满意的切割结果, 完成心内膜三维几何模型切割。
实验结果如图8所示, (a) 为不同视角心内膜三维几何模型; (b) 为基于文献[31]方法实现的不同视角的网格切割实验结果; (c) 为基于本文方法实现的不同视角的网格切割实验结果。对比 (b) 和 (c) 可以得知, 基于文献[31]方法与本文方法的实验结果都可以很好地反映出用户切割意图和保留网格的细节特征, 但是本文的方法的切割边界是光滑的, 没有锯齿, 而且在选定切割位置后, 切割耗时0.2 s, 满足实时性要求。
5 结语
本文提出的基于平板的网格切割方法, 由用户交互移动切割平板和旋转切割平板的法线, 借助矩阵变换, 针对心内膜三维几何模型可以实现既能反映用户切割意图又能保持三角网格细节特征的无锯齿的实时切割。当然, 该方法并不是对所有模型都是理想的, 由于平板模型自身特点, 该方法不是万能的, 其适用于对整体模型切割, 不适用于局部小区域凹面区域切割。但是针对心内膜标测系统这个特定应用而言, 本方法优于目前其他方法。这种算法高效、稳定、易于实现, 为心内膜三维标测系统整体实现奠定基础。
摘要:针对心内膜三维标测系统中心内膜模型网格切割模块, 提出一种新的交互式网格切割算法。系统在载入心内膜三维几何模型后初始化切割平板模型, 由用户交互移动切割平板和旋转切割平板的法线。借助矩阵变换, 针对心内膜三维几何模型实现能反映用户切割意图和保持网格细节特征的网格切割, 而且切割平板可以消除锯齿效应。实验对比结果证明, 该算法对于心内膜三维几何模型可以实现令用户满意的实时无锯齿交互式网格切割。
交互式多模型 篇9
在目前全国法学本科教育处于瓶颈时期, 通过创新教学模式, 可以让学生掌握法学学科发展方向与趋势, 了解学科创新领域与创新点所在, 对学科与专业建设具有积极的推动作用。
一、交互式教学的前提——创新法学课堂角色定位
在文学家韩愈的《师说》文章里, 有这样一句众所周知的话:“师者, 所以传道、授业、解惑也”, 这句话也似乎顺理成章的成为自古至今大家对老师角色的定位, 人们反复引述, 只是为宣扬传统教育思想而已, 却没有随着社会的发展, 用时代的眼光审视。尤其在当今社会正处于变革时期的环境下, 知识经济逐步占主导地位的时代, 任何一个人要想满足与发展需要, 就必须充分发挥主体意识选择性的作用, 培养具有可持续发展能力的一代新人, 成为教育改革的终极目标。
(一) 法学教师定位——双师型
法学专业属于实践性、应用性较强的专业。教师是法学实践教学的指导者, 法学实践教学的效果在很大程度上取决于教师的素质。因此, 在法学教学中, 传统大学课堂教学单一模式, 即“老师讲, 学生听”这种以教师为中心的满堂灌的教学模式极其不利于调动学生的学习积极性。单纯的学习法律条文, 不仅枯燥无趣, 而且也不能培养学生解决问题的能力, 在当今依法治国方略的指导下, 传统教学也不能满足构建法治社会及司法机关对法律人才的需求。故, 法学课堂教学模式改革对教师角色重新定位是首要的, 双师型是最好的选择。
(二) 法学学生目标——培养职业定位意识和能力
2012年5月, 教育部、中央政法委联合举办的卓越法律人才教育培养计划启动, 这是我国法治道路中国化、推动法学理论实践化、推动法律人才走向国际化的重要举措。该计划也意味着法学学生的应用能力培养成为法学教育的核心, 所以法学学生的职业定位意识的培养和能力的提升成为教学改革的突破口。
(三) 教学过程再认识——知识的传播与生成
对于教学过程, 除了传统课堂教学, 充分利用法律实务部门的资源, 积极开展覆盖面广、参与性高、实效性强的专业实习, 将大大提高学生的四大能力:即诠释法律的能力、论证能力、推理能力及法律事实探知的能力。
二、交互式教学模式的特色
交互式教学模式作为一种新的教学方式, 对其可以如下定义:即构建师生平等对话为背景的互动性教学, 这种教学模式的理论基础是支架式教学思想。建立互相尊重、彼此信任和师生平等的学习氛围是交互式的目的所在, 对话和倾听能够实现师生之间和学生之间的双向沟通, 是合作学习的桥梁和纽带。概括起来, 其特点如下:
(一) 避免法学教育与法律职业脱节
在当今信息化时代, 大部分教师采用的教学方法依然是以教材为基础, 粉笔加黑板的授课模式。法学作为实践性极强的学科, 大多数老师极少联系实际, 很少采用案例教学法。使学生的能力与社会的实际要求具有一定的差距。
(二) 增强法学教学中的师生互动, 提高学生应用能力
现阶段的法学教育对法学理论的学习比较重视、看重法律概念和法律条文的剖析, 强调学生对理论体系的把握和了解, 因此对学生司法实务操作能力的培养却少有提及乃至忽视。, 从而导致本科教学注重的是教师的“教”, 即体现传统教育思想精髓:“传道、授业、解惑”, 对于学生的“学”是忽略不计的。
(三) 打破法学教学内容枯燥无趣, 强化人文关怀
法学教育区别于其他专业教育的特征就是, 要把人文教育与职业训练统一起来。品质的培养、视野的拓展、思维的启迪、理想的树立都属于人文教育;而培养学生的实践能力、分析和解决问题的能力则属于职业训练的重要内容。简而言之, 法学教育必须实现两个目标:既要教学生如何做事, 更要教学生如何做人。
三、交互式教学模式的构建
(一) 明确法学教育的指导思想和目标
陕西科技大学确立了在加强素质教育基础上实施专业教育和创新能力教育的教育理念, 遵循加强基础、强化应用、激励创新、注重融合、提高素质、体现特色的办学思想。
(二) 创新师生双方信息交递方式
确立以学生为中心的教学过程, 坚持课堂教学新理念, 即教师是生产者, 学生为消费者的生产消费理念。因为在课堂中, 传递知识和信息的纽带是教学本身, 教师和学生其实就形成了生产者和消费者之间的关系。二者是相依互存的, 学生对知识的接收、分析和理解是教师的知识形成和再建构的基础, 学生的反馈状态是实现动态教学的前提, 教师教学方式会随之调整, 当然也会包括知识体系、教学心态等一系列变动。
(三) 改革教学评价方式, 建立以课堂为中心的评价体系
完善现有的测试与评价体系, 尤其要重视形成性评价, 加强对学生在学习过程中应用能力发展情况的检测, 建立多样化的评价体系。
在传统的教学模式下, 对学生的评价基本采用的是终结性评价, 即最终分数决定优劣。交互式教学模式重在调动学生参与课堂学习的积极性, 因此, 把日常学习纳入学生评价体系是首要选择, 这样能让学生主动把心思从“分数”转向“课堂”, 从“结果”转向“过程”, 从而构建形成性评价体系。
(四) 开展启发式教学, 重视课堂微观模式
所谓课堂的微观模式是指每堂课或每次课的结构安排, 它是整个教学系统的核心构成部分, 每堂课根据具体的教学要求选择最适当的教学组织方式是非常必要的。要改变千篇一律的教学, 就必须运用多样化的方法和策略, 提高学生学习兴趣, 从而实现培养学生综合素质和创新能力的目标。
(五) 加大教学硬件设施投入, 提高教学效果
以现代信息技术革命为契机, 广泛采用多媒体和网络等现代信息技术, 促进教学模式的有效改革, 采用现代化、多样化、个性化的教学手段。
法学专业新型课堂教学模式的探索, 有助于法学教育摆脱传统教育模式的束缚, 真正培养出复合型司法人才。