失配问题

2024-05-27

失配问题(精选7篇)

失配问题 篇1

前言

主变压器间隙保护与系统零序保护失配问题在我国供电系统中比较常见,文章通过对我国的主变压器间隙保护与系统零序保护失配问题进行分析,针对这一问题高发的主要原因提出了针对性的解决方案与措施,为解决供电线路系统中常见的主变压器间隙保护与系统零序保护失配问题,保障我国供电系统平稳运行提供了一定的参考。

1 主变压器间隙保护与系统零序保护失配问题和原因

1.1 故障问题

主变压器间隙保护与系统零序保护失配问题主要表现为变压器的供电电路电源线发生接地事故时,供电的电源电路断路器会自动跳开,同时系统的零序保护会与变压器中主变压器的间隙保护失去原有的配合作用,导致主变压器失电和相关线路失电现象同时出现,造成变压器的瞬间故障,由于变压器的间隙保护在故障发生时使间隙保护跳开,因此在故障恢复时即使重合闸能够使整个供电线路瞬间恢复电流供应,但是间隙保护装置断开的线路仍然处于断电状态,不能自动恢复供电。

1.2 主要原因

发生主变压器间隙保护与系统零序保护失配问题的主要原因是由于意外情况到时变压器的保护装置断电,并产生后续事故,主要是因为变电站常用的主变压器的保护系统通常是通过系统零序保护系统与间隙保护装置共同构成,其运转需要系统零序保护系统与间隙保护装置通过配合共同实现,但是当变压器遭遇特殊的意外情况时,例如,雷电危害等等,会使整个供电线路的电流瞬间出现过高的情况,当电流强度高出变压器正常承受范围时,在系统零序保护系统与间隙保护装置的保护下会出现跳闸现象,致使整个变压线路失压并出现大范围断电现象[1]。此外诱发主变压器间隙保护与系统零序保护失配问题的原因还包括单相接地故障,这一故障会导致三项出现不对称运行的状况,一旦出现这种情况不接地的变压器会产生中性点电压偏移的问题,过大的电压会击穿中性点导致断路器断开,还会出现变压器的接地电路线路出现调整,产生主变压器间隙保护与系统零序保护失配问题。

1.3 实例分析

主变压器间隙保护与系统零序保护失配问题是常见的供电电路问题,普遍存在我国常见各种电力输送系统中,例如在某市的供电网络中主变压器间隙保护与系统零序保护失配问题就比较常见。据资料显示2012年贵阳市的电力传输系统中110k V的变压器有86台,这种变压器按照《3k V-110k V电网继电保护装置运行整定规程》设计,变压器的保护装置都不是通过中性点通过直接接地的系统,变压器的保护系统通过间隙零序电流和零序电压保护装置实现,因此在贵阳市的供电系统中主变压器间隙保护与系统零序保护失配问题比较常见。因为当输电网络中出现单相接地故障时,这种110k V的变压器由于结束设计的问题会出现电源线路保护与变压器的中性间隙点保护同时工作,进而使系统单项接地产生的零序过电压能够轻易击穿系统中变压器的中性间隙点,进而导致保护装置各侧的电路断路器断开[2]。经过对贵阳市近年来经常出现的主变压器间隙保护与系统零序保护失配问题进行分析得出结论,只有在选择输电线路中的变压器时应当注重考虑变压器的保护装置运行模式,依据系统该电路的供电整体设计,选择合适的变压器,才能在运行中有效减少电压对变压器中的中性点的影响,消除主变压器间隙保护与系统零序保护失配问题产生的土壤,有效保障供电网络的平稳无故障运行。

2 主变压器间隙保护与系统零序保护失配问题的解决措施

2.1 故障技术方案

根据以上分析可知,要解决主变压器间隙保护和系统零序保护失配问题,就需要增加该地区的供电网主变压器系统的局部接地点,使相应的k值逐渐减小,以此降低110k V变压器出现接地故障时产生的零序电压,将该地区的主变压器中的中性点的暂态和稳态电压控制在57k V和37k V以内,使其电压远远低于主变压器中的中性点绝缘频电压,同时需要增加接地变压器中的零序保护,进而使其推出间隙保护。此外在制定完解决故障的方案时,需要严格按照方案执行技术,对主变压器的零序保护装置进行相应的调整,并根据相应的装置技术规程和装置运行整定规程对主变压器进行保护,按照科学的验算方法,精确地验算出主变压器系统的零序保护定值。在雷击天气发生雷击故障时,主变压器一般情况下都处于零序电流最小的状态中,应将110k V零序保护的末端保护段相互配合,确保变压器母线灵敏度比1.6大,还要保证零序保护时间要比零序段的保护时间长。

2.2 方案分析

在传统主变压器间隙保护方案中,由于上级供电系统单项接地故障更容易引起的跳闸现象,通过对上文方案进行分析可以发现该方案有效的避免了这一现象的发生,有效解决了传统电路中容易出现主变压器间隙保护与系统零序保护失配的问题。首先,零序电流的不断增大对零序保护线路的影响,在供电系统将接地点增加时,会出现一些接地故障,这时零序电流也会相应的增加,对系统零序段保护的影响很大,要实现这一方案需要对供电系统中的其他一些零序线路的保护没有影响,退出零序段的保护,采用接地段的保护取代零序段的保护,通过这种保护方式解决供电系统在增加接地点后出现的故障。其次,零序电流的分布状况对零序线路保护产生的影响,在供电系统接地点增加时,接地故障一旦产生,零序电流的分布情况就会随之发生变化,对供电系统内部的零序线路保护具有一定的影响,如果要解决以上现象问题,需要对供电系统中的其他零序线路不构成威胁的情况下,改变其零序保护线路的方向,以防范反方向的零序线路在接地故障中得不到保护。第三,零序保护的灵敏度,在系统中增加接地点引发接地故障时,系统内部的零序线路保护的灵敏度也会受到相应的影响,在对系统零序段进行保护时其灵敏度可以通过110k V变压系统合理的增加接地点后满足电网的保护装置运行要求,因此增加接地点的方案也是可行的。

2.3 方案实施

实施上述方案时应当严格按照相关的设计标准建设供电网络,首先,在方案实施过程中应当对传统的机械控制技术进行技术升级改造,大量使用先进的电脑控制技术,确保方案正常实施过程中主变保护装置的技术能够满足方案设计的技术要求标准。其次,依照方案的运行设计标准,应当使用中性接地闸刀开关,确保保护装置性能参数能够保障该方案顺利运行。第三,应当着重按照方案实施的技术标准对变压器的侧零序保护装置进行严格配制,在原有的相关国家与行业标准规定基础上重新进行极值计算,依照计算结果设置主变压器的侧零序保护值数据。第四,在方案实施过程中及时对方案的运算数据进行检测,及时发现该方案中出现偏差的运算数据,并进行更正与修订,提高方案数据标准的可靠性,保障该方案及时得到妥善的完善,切实发挥最大效用,进而解决供电线路运行过程中存在的主变压器间隙保护与系统零序保护失配问题。

3 结束语

综上所述,文章提出的解决方案具备现实可操作性,该方案能够有效解决我国供电线路系统中常见的主变压器间隙保护与系统零序保护失配问题,为我国的供电系统稳定运行提供有力保障。

参考文献

[1]焦晓燕,吴志敏,王江萍,等.电网零序保护应用中的问题分析研究[J].内蒙古电力技术,2013(5).

语音识别中环境失配补偿综述 篇2

随着信息技术的迅猛发展,信息的获取、交互与处理已成为推动当今社会发展的强大动力。以计算机为中心的信息技术不断地改变着人们的生活方式,这一过程被誉为信息革命,而信息革命的提出也已成为继工业时代之后的知识时代里的里程碑式的重大事件[1]。语音是人类最自然、最常用的信息交流方式。无论是在生活中还是在快速普及的互联网上,语音作为主要媒体之一,承载着大量的有用信息。因此,对语音中的信息进行分析、处理与识别无疑具有广阔的应用前景。作为语音处理的支撑技术之一,语音识别以识别语音信号并将其转换成文字为目标,在智能人机接口、机器人语音理解、语音内容分析、军事侦查、工业控制、听写机、语言辅助学习和呼叫中心等领域有着广泛应用。

语音识别的历史可以追溯到上世纪30年代初,当时的研究者们尝试识别特定的声音,并开始从声学角度识别音素或数字等,但其任务只是局限于小词表孤立词识别。上世纪60年代到80年代,语音识别技术得到了较快发展,典型的进展是基于线性预测的频谱分析[2,3]、基于线性规划的语音时间对齐方法[4]以及矢量量化的成功应用[5],识别任务也发展到了中等规模的孤立词识别和连接词识别[6]。上世纪最后20年里,语音识别技术取得了长足进步,最重要的标志是隐马尔可夫模型(Hidden Markov Model,HMM)在语音识别领域的创新性应用[7,8],同时还辅以前向后向算法、K均值训练算法、维特比解码算法、基于神经网络的条件概率估计方法[9]以及提出的各种模型自适应方法,使语音识别迈向了非特定大词表连续语音识别(Large-Vocabulary Continuous Speech Recognition,LVCSR)的新阶段。近十年来,语音识别获得了进一步的飞速发展,出现了区分性训练、不确定性解码、噪声鲁棒性以及机器学习等一系列新技术,语音识别已经逐渐走出实验室,不断进入实际应用。

经过数十年的发展,语音识别技术取得了巨大进展,在理想环境下,目前的小词表以及中等词表语音识别系统的识别率能达到99%以上,LVCSR系统识别率也能超过95%[10],但在训练和测试条件不匹配时,识别率就会急剧下降。有众多因素会造成这种不匹配,较为典型的主要有:声学环境失配、说话方式差异、说话人差异以及词汇量和领域差异。

其中,声学环境差异是导致系统性能下降的主要原因,也是语音识别系统走向应用所面临的最大挑战。声学环境可以用如下公式建模:

式中,x(τ)和y(τ)分别为干净语音和畸变语音,h(τ)和v(τ)分别为信道畸变和加性噪声。从式(1)可以看出,造成环境失配的主要原因在于噪声的存在,这种噪声可能是加性的,卷积性的,也可能是两者的混合。诸如训练环境没有噪声而测试环境存在噪声,或者训练环境和测试环境存在不同的噪声,这都会引起环境失配。文献表明,当存在信噪比为10dB加性噪声时,未做任何补偿的孤立词识别系统的识别率将从99%降到49%[11];随着信噪比继续降低,语音识别系统将无法使用。相比较而言,人的听觉在噪声情况下则具有很强的鲁棒性。研究发现,在噪声环境下人的误识率虽然也会增加,但其降低的速度与当前的语音识别系统相比,则要慢上许多[12]。本文正是针对语音识别中环境失配问题,研究并提出增强系统环境鲁棒性的有效方法,从而推动语音识别技术走向现实应用。

1 国内外研究现状与分析

式(1)是声学环境的数学描述,全面刻画了信道畸变和加性噪声。在现实应用中,环境失配存在三种可能的情况,即信道畸变、加性噪声和二者同时并存。相应地,目前的环境失配补偿方法也可以大致分为信道畸变补偿、加性噪声补偿和联合补偿三类。下面将按照这一分类方式阐述环境失配补偿的研究现状。

1.1 加性噪声补偿方法

加性噪声在时域和频域都呈加性,但在对数频域和倒谱域则因对数运算表现出了高度非线性。加性噪声的补偿大致可以分为特征规正、特征增强和模型补偿三种方式。特征规正首先假定语音特征服从某一概率分布,而噪声的存在却改变了这种分布,可通过规正特征使其实现指定的概率分布,因此减小了噪声的影响。比如,倒谱均值规正(Cepstral Mean Normalization,CMN)[13,14]中通过在一个时间段内统计倒谱均值,然后从各帧中减去这一均值,达到了减小噪声影响的目的。倒谱均值方差规正(Cepstral Mean Variance Normalization,CMVN)[15]实现了同时规正倒谱特征的均值和方差,使得规正后的特征均值为零,而方差为一。倒谱直方图规正(Cepstral Histogram Normalization,C-HN)[16]则是用倒谱直方图代替其概率分布,通过将直方图规正到已知的形状以达到规正倒谱概率分布的目的。

加性噪声的补偿中的另一种,特征增强则是可以通过增强信号后提取特征、或者直接补偿特征来达到增强识别系统鲁棒性的目的。

在信号增强方面,谱减[17]和非线性谱减[18]是出现得较早且研究得较多的语音增强方法。谱减法首先利用噪声段估计噪声谱,然后从各帧语音谱中减去噪声谱以实现信噪比的提高。而针对谱减法会形成残留噪声(音乐噪声)的不足,非线性谱减法则通过比较噪声谱和混噪语音谱后采取分段处理策略,即能有效减少残留噪声,但以上这两种均不适用于快速时变的噪声环境。维纳滤波也已广泛用于语音增强,该方法在基于干净语音和输出语音的均方误差最小的条件下来设计线性滤波器处理混噪语音。欧洲分布式语音识别编码和传输标准[19]就采用了两阶段的梅尔弯折维纳滤波器。而且自适应滤波和卡尔曼滤波[20]对时变噪声的表现出了一定的跟踪能力。子空间降噪方法[21]是将混噪语音投影到一个子空间,并认为清晰语音和噪声分布在不同的分量上,通过压制噪声所代表的分量实现降噪。经过文献分析可知,语音信号或频谱被增强后,噪声的成分将有所减少,理论上由其提取的特征所受到的噪声影响也会相应地变小。

在特征增强方面,基于数据驱动的方法因其运用效果显著而受到广泛关注。这类方法在建立清晰语音和混噪语音之间的关系方面,需要清晰环境和噪声环境下同时录制并要求得到对齐的立体声数据。微软的学者们在这方面作了深入研究,提出了一系列方法。Acero等提出了基于码字的倒谱规正(NR-Dependent Cepstral Normalization,SDCN),其中假定清晰语音的特征服从高斯混合(Gaussian Mixture Model,GMM)分布,通过迭代的方式在混噪语音上估计噪声参数,进而补偿混噪特征。邓力等提出的SPLICE[22]是通过学习混噪语音和清晰语音特征的联合分布,然后运用混噪特征得到清晰特征的最小均方误差(Minimum MeanSquared Error,MMSE)估计。另一种使用立体声数据的补偿方法是RATZ[23],该方法仍然使用高斯混合函数实现清晰语音建模,其后运用MMSE估计获得清晰语音的估计值。尽管基于立体声数据的补偿方法能取得较好效果,但却需要预先知道噪声环境以及相应的立体声数据,应用条件苛刻,因而对于未知声学环境并不适用。

目前,多数方法均建基于对噪声的建模与估计,但是,噪声的时变特性以及其与语音之间的复杂作用方式却使得对噪声的建模与估计非常困难且不可靠。丢失数据技术[24]不对噪声作任何假设,也无需为噪声建模与估计,而只需要知道噪声对语音频谱污染的量级程度即可实现噪声畸变的补偿。该方法在前端用一个标记向量将语音特征分为可信的和不可信的两部分,在后端或者丢弃不可信部分,直接利用可信部分进行识别,或者利用统计的方法重估丢失部分特征,然后利用可信部分和重构部分进行识别[24,25]。标记向量根据语音谱的局部信噪比确定,最初只含有元素0和1,分别表示对应特征完全丢失和完全可信,而后扩展到可以取0~1之间的任何数,即所谓的软决策[26,27]。丢失数据方法最初运行在对数频谱域,后来又拓展到倒谱域[28,29]。在丢失频谱的重构方面,可以采用基于最大后验概率或基于聚类的估计方法[25]。在估计过程中,各种先验知识也可以参与其中,最为常用的则是时频相关性。比如文献[30]在频谱上组合传统的基于频率相关性和基于时间相关性的方法重构丢失特征,并对二者进行了一个合理的权衡,取得了一定的效果。基于丢失数据技术的方法虽然不需对噪声进行建模和估计,在信号处理上也类似于人耳对声音的处理方式,但在计算标记向量时却需要判断混噪频谱是否可信,这就同样存在着一个难以解决的问题。与丢失数据方法类似的另一种方法是不确定解码方法[31]。该方法根据信噪比对不同的特征赋予不同的置信度,并在后端充分考虑这些置信度以达到提高系统鲁棒性的目的。

近年来,随着稀疏分解与重构理论的成熟,稀疏编码(Sparse Coding)[32,33]在信号处理的各个领域表现出了巨大潜力。该技术在稀疏性准则下将信号用一组基元信号线性表示,获得信号的稀疏表示(Sparse Representation)。其中,每个基元信号称为一个原子(Atom),所有原子组成的集合称为字典(Dictionary)。稀疏性是指信号被分解到某个字典上时,仅有少量原子的系数不为零。现实中的大量信号,如语音、图像等都满足或近似满足稀疏性[34];另有研究表明,人类的感知神经系统在对外部刺激进行编码时也总是从海量神经元中仅仅激活其中极少的一部分[35,36]。这就意味着人类的感知系统在处理信号时,也利用了稀疏性原则。稀疏性似乎是信号本身具有的特点,是一种先验知识;而稀疏编码的有效性却正是利用了这种先验知识。作为一种新兴的技术,稀疏编码可广泛用于信号压缩、分析、去噪和分离等[37]。尤其是近年来,该技术在图像处理及模式识别领域的有效应用[38]使其得到了更加深入和广泛的探索与研究。

用稀疏编码增强语音频谱需要解决三个问题,即字典构建、稀疏分解和频谱重构。字典构建是稀疏编码的首要问题,目的在于选取有代表性的基元信号(原子)构成字典。目前的方法大致可分为基于选择的和基于学习的两类。基于选择的方法从预先定义的基函数中直接选取需要的原子组成字典[39,40,41]。基于学习的方法则在满足重构误差要求的情况下,从大量数据中选取一组能稀疏表示信号的原子组成字典[42,43]。稀疏分解的目的在于将信号表示为各原子的线性组合,其求解过程是非线性的;典型的方法有正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)[44]、匹配追踪算法(Matching Pursuit,MP)[32]和基追踪去噪算法(Basis Pursuit Denoising,BPDN)[45,46]等。频谱重构则利用稀疏表示和字典重构干净频谱,其过程是线性的。近年来,在语音及特征增强方面,稀疏编码开始应用于语音增强[47,48]和鲁棒语音识别[49,50]。但在用法上大多是将稀疏编码作为工具简单使用,缺乏针对语音信号特殊性的有效分析和应用。如果硬件和应用场合允许,基于麦克风阵列的语音增强也可用于信号去噪以及特征提取。麦克风阵列可以首先确定声源位置,然后采用空域滤波的方式,通过自适应滤波器增强某一位置的声音,同时抑制其他位置的声音,典型的方法有基于波束形成的方法[51]、多通道维纳滤波[52]、多通道子空间方法[53]和空间-时间预测法[54]等。但基于麦克风阵列的增强方法对硬件有较高要求,也不适合处理已经存在的单通道语音信号。

1.2 信道畸变补偿方法

当加性噪声可被忽略时,信道畸变在时域表现出卷积性,而在频域则表现出乘积性。因此,目前的方法普遍认为,信道畸变在对数频谱域或在梅尔倒谱域是一个加性的常量。补偿方法也可分为特征规正、特征补偿和模型补偿。特征规正类方法中,最为典型的则是CMN和相关谱滤波(RelAtive SpecTrA,RASTA)[55]。CMN认为信道影响存在于特征的直流分量中,在各帧中减去均值即可消除直流分量,从而去除信道影响。RASTA则提出信道产生的畸变存在于信号的慢变分量中,通过设计一个低通滤波器抑制信号的慢变分量,以达到抑制信道畸变的目的。CMN和RASTA是两种标准的规正处理方法,被广泛用于语音识别系统中,但文献中大量实验表明RASTA在没有畸变时反而会降低系统识别率。此外,文献[56]又提出可通过一个梅尔频域的带通滤波器逐帧处理畸变语音。该方法首先通过区分性函数进行重要性分析求得滤波参数,然后利用传统的特征轨迹滤波方法去除信道影响。实验表明,该方法与CMN和RASTA组合后则能够能进一步提高识别率。在特征补偿方面,基于贝叶斯框架的信道参数估计方法[57]是假定信道畸变为一个加性常量,并分别在假定语音服从高斯、高斯混合模型和隐马尔可夫模型的情况下,利用最大似然、最大后验概率在畸变语音中估计得到信道偏移量。补偿时,通过在特征中减去信道偏移量,达到补偿信道畸变的目的。在模型域,信号偏移量去除法(Signal Bias Removal,SBR)[58]在声学模型上使用期望最大化算法(Expectation Maximization,EM)迭代地估计信道偏移量,然后在模型域修改高斯均值,最后利用修改后的模型识别畸变语音。文献[59]用丢失数据技术,将倒谱特征的静态和动态参数表示成对数频谱的线性组合。该方法基于丢数据框架,利用噪声谱的可信部分,在对数频谱域或倒谱域使用最大似然准则估计一个直流偏移量以实现信道畸变的补偿。

近年来,研究者们开始关注语音识别中另一类由信道引起的畸变,即窄带语音畸变问题[60,61,62,63,64]。当待识别语音的带宽比训练语音的带宽窄时,与训练语音相比,待识别语音即丢失了部分频段,这种情况也将导致环境失配[60]。这一问题在复杂信道环境(比如互联网、分布式语音识别等)中广泛存在。在增强语音质量方面,解决这一问题的方法是人工频带扩展(Artificial Bandwidth Extension,ABE),即将窄带语音的频带加以扩展,使其成为宽带语音。典型的任务是将带宽为0~3.4kHz的窄带语音扩展为0~8.0kHz的宽带语音。ABE用以解决的问题就是利用现有窄带数据,重构得到3.4kHz~8.0kH频段的频谱。目前大多数方法都基于语音的源-滤波器产生模型。这些方法首先产生一个激励信号,然后用一个滤波器模拟声道处理激励信号以生成高频段频谱,再组合窄带信号和重建的高频信号,而最终获得宽带信号。在激励信号方面,目前常用的方法有频谱折叠、频谱变换和非线性处理等[65],也可使用正弦合成[66]或调节噪声模拟激励源[67]。声道通常用一个全极点滤波器进行模拟,而滤波器参数可以是线性频谱或倒谱系数[66]。因窄带信号是已知的,可以利用窄带特征估计高频段滤波参数。常用的方法有基于码本[66,68,69]、高斯混合模型[70,71]、隐马尔可夫模型[72,73]以及人工神经网络[66,74]等的方法。

尽管从信号增强的角度已经开展了大量工作用于扩展频带,但也有研究表明,直接运用上述方法扩展频带后所提取的特征在提高系统识别率上将非常有限[75]。原因在于用ABE方法重构的高频段虽然能提高测试个体的主观听觉,但这和提高识别准确率的目标并不一致,由此提取的特征在识别时仍然存在失配问题。研究者们尝试直接以语音识别为目的补偿带宽失配。在这些方法中,环境自适应类方法对此类畸变有一定效果,文献[60]将基于GMM的频段扩展方法和基于HMM的声学模型结合在一起,实现宽带声学模型对窄带语音的识别。文献[61]采用特征域的限定最大似然线性回归(Constraint Maximum Likelihood Linear Regression,CMLLR)将宽带特征直接转变为窄带特征,而后用于窄带声学模型的训练。文献[62]和[63]通过训练数据学习得到一组矫正函数以实现畸变语音特征向干净语音的转变;而文献[64]则在丢失数据技术框架下利用语音频谱的时频相关性,实现丢失频段的重构。尽管以上这些方法都是以提高语音识别或语音检索系统的性能为目的,而且取得了一定的效果,但其本质上仍是特征域补偿方法,而且又严重依赖于训练数据。而且这些方法要获得良好实现,一方面需要大量训练数据,另一方面要求语音带宽稳定。此外,这些方法只是单纯地补偿窄带引起的畸变,而对常规信道畸变却未能同时加以考虑,因而将导致这些方法仅适用于单一的带宽失配场合,而不适合各种畸变并存的复杂环境。

1.3 联合补偿方法

当信道畸变和加性噪声同时存在时,就需要对这二者同时进行补偿。在特征域可以选用能有效表示信号的特征,在模型域可以选用数据驱动的方式实现各种自适应,也可以利用畸变模型估计噪声参数然后补偿声学模型。鲁棒特征提取旨在有效表示信号并提取受噪声影响较小的特征以提高系统鲁棒性。常用的特征有基于人耳听觉特性的梅尔频率倒谱系数(Me-Frequency Cepstrum Coeficient,MFCC)[76]、基于自回归模型的线性预测系数(Linear Prediction Coeficient,LPC)[77]和基于听觉感知的相对谱感知线性预测系数(RelAtive SpecTrA Perceptual Linear Prediction,RASTA-PLP)[78]。此外,目前较新的Teager能量倒谱系数(Teager Energy Cepstral Coeficient,TECCs)通过采用一种稠密平滑的滤波器组以及可变的能量计算策略,取得了比MFCC更好的噪声鲁棒性。而瓶颈特征(Bottleneck Feature,BF)[79,80]则借助含有少量显层和大量隐层节点的瓶状神经网络生成新特征用以提取,获得了一定成果。虽然研究者们在特征提取方面做了大量尝试,提出了一系列特征,也取得了一定的成果。但对当前还有哪些参数携带着最有用、最具鲁棒性的信息,却仍处于不明朗之中。因为特征参数能表示语音,在一定程度上也能表示噪声,换言之,特征参数中不可避免地混有噪声,这将引起识别率的下降。

由于噪声影响在倒谱域呈现高度非线性,Moreno[81]等提出用泰勒级数(Vector Taylor Series,VTS)将非线性关系近似展开成线性,同时假定清晰语音服从高斯混合分布,并运用每一句语音在线估计信道参数和噪声参数,然后再进行特征补偿。该方法无需额外训练数据,能在短时间内动态补偿噪声,具有一定的优势。

特征域补偿方法试图补偿语音特征,使其与模型相匹配,而模型域方法则修改声学模型使其适应输入的特征。匹配训练的思路较为直观,即直接采集某一噪声环境下的语音进行标注,然后重新训练模型,用来识别这一噪声环境下的语音。这也意味着每遇到一个新的环境,匹配训练都需要重新采集、标注数据以及训练模型,其结果虽能保证识别率,但耗时耗力,无法推广。多重风格训练[82]可以采集所有可能的噪声环境下的数据,用以训练声学模型。但该方法也带有明显弊端:一方面,对未知噪声环境中的噪声类型无法穷尽,另一方面,过多的数据会导致声学模型的区分能力降低。总之,匹配训练和多重风格训练虽然能得到较高的识别率,但运算量不小而且需要又大量未知噪声环境下的标注数据,不适合LVCSR,因而只能用于在实验中作为对比方法以考察其他方法的性能。

模型域方法更多采用的策略,则是训练干净环境下的声学模型,然后利用目标环境下的少量数据,通过模型适应的方式增强系统对环境的适应能力。模型分解方法[83]可修改声学模型的基本结构,既补偿了均值和方差,又能补偿高斯混合数和混合系数,因此能使因噪声污染而呈现非高斯分布的语音得到综合补偿。该方法训练一个干净语音HMM和一个噪声HMM,然后在这两个HMM组成的状态空间进行联合解码。混噪语音与清晰语音以及噪声之间的关系经常通过一个最大值算子加以近似,因此该方法对低能量语音帧建模存在误差。另外,该方法使用的是对数谱特征而不是倒谱特征,计算复杂度相当高。

并行混合模型(Parallel Model Combination,PMC)[84]将清晰语音的HMM和噪声HMM从倒谱域变换到线性频域,然后根据失配函数合成后,再变换至倒谱域,获得混噪语音的声学模型。数据驱动并行混合模型(Data-driven PMC,DPMC)则采用蒙特卡罗方法获得清晰语音和噪声的概率分布,然后进行混合,运算复杂度也很高。尽管文献报道PMC取得了好的效果,但该方法在实际应用中存在一定的缺陷,表现为,一方面需要为每种噪声训练模型,另一方面,当噪声时变时,还必须随时更新模型。

另外,各种自适应方法,诸如最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)[85]、CML-LR和最大后验概率(Maximum A-Posteriori,MAP)[86]等用畸变环境下的标注语音进一步训练模型也能增强系统鲁棒性。这几种方法最初用于说话人自适应,而实验表明,这些方法也同样适用于环境自适应。MLLR假定清晰语音和混噪语音的模型均值和方差可以通过一个线性变换矩阵相互转换,然后在期望最大化(Expectation-Maximum,E-M)算法框架下通过最大化自适应数据的似然比得分,最终求得该变换矩阵。CMLLR与MLLR的不同之处则在于前者的均值变换矩阵与方差变换矩阵同一,而后者却无此限制。MAP自适应在最大化混噪数据后验概率的准则下重估模型参数。由于MAP估计的参数多于MLLR,因此需要更多的自适应数据。当自适应数据不足时,其性能明显低于MLLR,而随着自适应数据的增加,其性能将趋近于匹配训练方法。

2 结束语

失配问题 篇3

在工业生产过程当中,面对复杂的控制对象,研究者往往难以建立其精确的数学模型。特别是过程控制中常见的参数时变系统,由于存在系统参数的不确定性,采用常规控制方法不易得到良好的控制效果。Clark等人[1,2]于上世纪80年代提出的广义预测控制方法在预测模型的基础上,采用多步预测、滚动优化、反馈校正的策略,降低了对被控对象建模精度的要求,适用于不易建立精确数学模型的复杂控制系统。但如果由于模型参数失配,其预测模型的输出与系统实际对象的输出存在较大的误差时,势必影响其控制的精度和鲁棒性,甚至是稳定性。李东侠等[3]基于BP神经网络对系统的建模误差进行预测,并用其补偿模型输出,抑制了模型失配的影响,但神经网络的调节困难,计算量也很大。翟永杰等[4]利用最小二乘支持向量机对建模误差进行补偿,抑制模型失配的影响,但同样存在计算量大、训练困难的问题。高钦和等[5,6]采用隐式广义预测控制,利用输入输出数据直接辨识控制器参数来求解最优控制量,提高了系统对模型参数变化的适应能力,但不断的在线辨识需要付出很大的计算开销。孙明玮等[7]提出了一个中间程序速度概念,通过间接控制输出增量的方式实现控制目标,其控制思想的机理与变结构控制有一定的相似之处,有较好的鲁棒稳定性。

本研究在此基础上,提出一种克服模型参数失配的输出增量反馈广义预测控制简化算法。

1 克服模型参数失配的广义预测控制简化算法

为推导方便,本研究取被控对象数学模型为CARIMA模型,可表示为:

式中:y(k),u(k)—系统输出、输入;ξ(k)—零均值的随机噪声序列;Δ—差分算子。

并且:

对式(1)作简单数学处理,用差分算子Δ乘两边后,有:

为了预测向前j步的输出增量值Δy(k+j/k),引入多番图方程:

其中:

把多番图方程代入式(2),忽略随机噪声序列,可得向前j步最优输出增量预测值为:

式中:

为了克服模型参数失配,设计目标函数为:

式中:λ—控制增量的加权因子,λ>0;M—控制时域;P—预测时域;{w(k+j)}—输出增量参考序列。

可由以下方法产生:

式中:Δy(k)—输出增量,Δy(k)=y(k)-y(k-1);θr(y(k))—输出增量速度函数,θr(y(k))=(st-y(k))/st⋅θ;st—输出设定值;θ—设定的最大输出增量;α—柔化系数,

把式(5)写成向量形式,然后最小化JP,可得控制向量为:

式中:I—单位矩阵。

且:

观察式(7)可知,研究者在求取控制向量ΔU(k)的计算过程中,需要进行逆矩阵的求解,计算量大。为此,这里引入阶梯控制方式,事先对控制增量序列进行离线约束,这样既符合常规执行机构的控制规律,减少因控制量变化过大所带来的磨损,也保证了控制算法的可行性[8,9]。设输入柔化系数为τ∈(0,1),可得到:

把式(9)代入式(5),再对JP求最小化,可得当前控制增量为:

式中:g1=G×h,ΔY0=FΔy(k)+HΔU(k-1)

由式(10)可知,引入阶梯控制后,当前控制增量的计算避免了逆矩阵的运算。同时,为进一步提高控制算法的鲁棒稳定性,参考β增量型广义预测控制,将β⋅Δu(k)设为当前的控制增量[10,11],可得当前控制量如下:

式中:β—调节因子,取常量。

2 仿真研究

本研究选取如下的三阶参数时变控制系统:

其近似模型取为:

为便于比较,本研究分别采用基本广义预测控制和本研究提出的算法对该系统进行控制,两者控制参数为P=5,M=3,λ=0.5,α=0.5,最大输出增量θ=2.5,输入柔化系数τ=0.2,调节因子β=1.2,采样时间设为1 s,控制目标st设为10。

其仿真结果如图1、图2所示。

从仿真结果曲线可以看出,当对象模型参数时变、建模存在误差时,采用本研究提出的控制算法得到了较好的控制效果,有效抑制了输出调整过程中的输出波动,缩短了调整时间,提高了动态性能,克服了模型参数失配带来的不良影响。同时,控制输出也较平稳,实际使用中可减少执行机构的磨损。

为方便应用,笔者将以上内容进行归纳,可以得到本研究算法步骤如下:

(1)设定控制器参数P,M,λ,α,θ,τ,β;

(2)用阶梯式预测控制式(10)算出Δu(k);

(3)将求出的Δu(k)代入式(11),得到最终控制量u(k)。

3 结束语

针对模型参数时变对广义预测控制的不利影响,本研究提出了一种输出增量反馈的广义预测控制简化算法。该算法通过设定输出增量速度函数,抑制了由于模型失配引起的输出调整过程中的波动,缩短了调整时间,提高了动态性能;同时,利用阶梯控制避免逆矩阵运算,减少计算量,并对控制增量做了改进,提高了系统的鲁棒稳定性。

经过多次的仿真研究表明,与基本的广义预测控制相比,该算法能有效克服模型参数失配的影响,抑制输出调整过程中波动的产生,提高了系统的动态性能,控制效果良好。

参考文献

[1]CLARKE D W,MOHTADI C,TUFTS P.Generalized pre dictive contro1.PartⅠ&Ⅱ[J].Automatic,1987,23(2):137-160.

[2]王晓枫,余世明,熊小华,等.基于广义预测控制算法的水槽液位控制系统[J].机电工程,2009,26(3):35-37.

[3]李东侠,李平,丁淑艳.基于改进的BP网络误差修正的广义预测控制[J].计算机仿真,2004,21(12):143-145.

[4]翟永杰,李海丽,王东风,等.LS-SVM误差补偿的广义预测控制[J].计算机工程与应用,2010,46(3):192-194.

[5]高钦和,王孙安,黄先祥.参数时变系统的广义预测控制研究[J].计算机仿真,2008,25(2):181-182.

[6]李国勇.输入受限的隐式广义预测控制算法的仿真研究[J].系统仿真学报,2004,16(7):1533-1535.

[7]孙明玮,陈增强,袁著祉.输出增量反馈思想[J].信息与控制,2002,31(1):5-8.

[8]李飏,杨洁明.广义预测控制中对控制增量的研究[J].机械工程与自动化,2007(5):45-48.

[9]慈宇红,杨华,李英辉.输入平稳的快速无超调预测控制算法[J].控制工程,2006,13(5):407-412.

[10]麻文斗,王诗宓.输入受限的增量型模型算法控制[J].系统仿真学报,2001,13(Z1):114-116.

失配问题 篇4

在动力学条件对失配位错形成影响的研究中,Sprague[1]和Kang[2]等模拟研究了沉积原子入射动能方面对薄膜生长的影响,他们发现随入射动能的增加,增原子的表面扩散能力增大,导致薄膜内部缺陷密度下降,结构趋于完整。这都说明沉积原子入射动能对薄膜生长和薄膜内部缺陷形成有显著的影响。这些研究工作,使人们关于沉积原子入射动能对薄膜结构和薄膜中位错形成影响的认识有所提高,但他们考察对象是大量入射沉积原子,对薄膜结构和薄膜中位错形成影响也是大量沉积原子累积起来的结果。为了更详细地了解沉积原子入射动能对薄膜中失配位错形成的影响,本文运用分子动力学模拟方法,详细研究了单个入射原子对外延铝簿膜中失配位错的诱发作用,阐述了不同的入射原子动能给失配位错形成带来的影响。

1 模拟方法

采用在预置了一定应变的铝衬底上设置同质外延层,这样的体系中外延晶体和衬底之间只有几何结构上的失配而无化学交互作用,有利于研究失配位错的形成。外延膜生长面为{111},模拟胞构建设置如图1所示。图中由下至上以不同的灰度分别表示固定层、恒温层和自由层[3,4]。

此文中模拟胞的尺寸设定为:18d110×30d112×nzd111(nz为整数,dhkl为(hkl)面间距)。在模拟过程中,入射原子从薄膜上方可以忽略原子间相互作用的位置垂直入射到薄膜表面中心的FCC位置上,入射动能分别为0.014eV、0.14eV、1.4eV、7 e V和10eV。在所有实验中,不同动能的沉积原子都是入射在相同的位置,以保证模拟研究在相同的条件下进行,使产生的模拟结果有可比较性和可分析性。

2 模拟结果与讨论

我们用动能分别为0.014eV、0.14 e V、1.4eV、7eV和10eV的沉积原子入射到薄膜表面中心的FCC位置,然后将薄膜弛豫400ps,再观察体系的能量变情况。图2是失配度为fx=-0.06的外延铝薄膜在600K时,动能分别为0.014eV和0.14 e V的沉积原子入射到FCC位置上,体系的能量变化曲线。从图2可以看出,当沉积原子以很小的入射动能(0.014eV)沉积到薄膜表面时,体系的能量线基本呈水平状态,没有出现与失配位错相对应的能量下降,对其晶体结构进行原子分析发现外延铝膜的晶体结构自始至终都很完整,没有观察到失配位错结构。而当把沉积原子入射动能升高到0.14eV时,体系的能量线出现了一个明显的下降,下降大约60eV后就又保持水平状态。这说明入射动能足够大的单原子对外延薄膜中失配位错的形成有诱发作用。

图3示出了动能分别为0.14 e V、1.4eV、7eV和10eV的沉积原子入射到FCC位置上,外延薄膜的能量变化曲线。可以看出动能为1.4eV的沉积原子入射到薄膜表面中心的FCC位置后,体系的能量在100ps附近也有一个下降过程;动能分别为7e V和10eV的沉积原子入射到薄膜表面后,两体系能量曲线的变化规律基本相同,在60ps附近先后有个大约60eV的能量下降过程。这说明在上述两种情况下,体系能量下降的时刻受动能变化的影响不大。

不同能量的沉积原子入射时薄膜中失配位错的形成情况是怎样的呢?我们采用晶体结构观察分析法分析薄膜晶体的内部结构,再结合图3中体系的能量变化曲线,可以发现:对于以不同动能入射的沉积原子来说,对薄膜结构的影响程度有着显著的差异。沉积原子的入射动能为0.014eV时,外延薄膜中没有失配位错形成,当其动能增加到0.14eV、1.4eV、7eV和10eV后,失配位错也随之产生。

通过进一步观察还还可以看出:随着沉积原子入射动能的增大,外延铝薄膜的能量下降时刻越早,失配位错孕育时间越短,沉积原子对外延铝薄膜中失配位错形成的诱发作用越大。换而言之,沉积原子的动能越大,对基体结构完整性的影响也越大。这一结论与叶子燕等人研究团簇原子的平均动能对基体表面影响所得的结论是一致的[5]。但原子入射动能增加到一定数值后,失配位错的孕育时间基本上就不会再缩短而保持不变。当原子入射动能超过铝材料的溅射阈值时,根据溅射理论[6],溅射阈值Eth≈4U0,其中U0=3.36eV/atom为结合能,在入射粒子以高于此能量阈值入射的情况下,传递给基体原子的能量足以使其克服表面束缚势垒,产生溅射原子,此时入射载能粒子不再认为是沉积原子。

3 结论

本章运用分子动力学模拟方法,模拟考察了600K温度下,不同入射动能的原子沉积到失配度fx=-0.06的外延铝薄膜表面时,对薄膜内失配位错形成的影响。基于以上分子动力学模拟实验和分析结果,我们提出:入射动能足够大的单原子对外延薄膜中失配位错的形成有诱发作用,且这种诱发作用随原子的入射动能增大而增大。原子在600K下入射到失配度fx=-0.06,15个原子层厚且表面光滑的外延铝薄膜时,入射动能只要大于等于0.14eV就可以诱发失配位错的形成。

摘要:本文运用分子动力学模拟方法,详细研究了单个入射原子对外延铝簿膜中失配位错的诱发作用。模拟结果显示:入射动能足够大的单原子对外延薄膜中失配位错的形成有诱发作用。原子在600K下入射到失配度为-0.06,15个原子层厚且表面光滑的外延铝薄膜时,入射动能只要大于等于0.14eV就可以诱发失配位错的形成。

关键词:沉积原子,外延薄膜,失配位错,分子动力学

参考文献

[1]Gilmore C M,Sprague J A.Molecular-Dynamics Simulationof the Energetic Deposition of Ag Thin Films[J].PhysicalReview B,1991,44(16):8950-8956.

[2]Kang W J,Hwang J H.Molecular Dynamics Simulations ofEnergetic Aluminum Cluster Deposition[J].ComputationalMaterials Science,2002,23(1-4):105-114.

[3]周耐根,周浪.外延生长薄膜中失配位错条件形成的分子动力学模拟研究[J].物理学报,2005,54(7):3278-3283.

[4]潘华清,周耐根,潘展,周浪.FCC晶体外延薄膜中失配位错形成的动力学条件[J].南昌大学学报(理科版),2007,37(2):177-180.

[5]叶子燕,张庆瑜.低能Pt原子团簇沉积过程的分子动力学模拟[J].2002,51:2798-2803.

失配问题 篇5

1电流舵DAC

传统的二进制电流源DAC结构简单, 但需要较大的晶体管尺寸来满足匹配要求, 且代码从011… 111跳变到100 …000时会产生很大的毛刺能量, 在高速高精度DAC设计中受到限制, 因此, 分段电流舵DAC结构成为目前的首选, 对于一个N位的分段结构DAC其结构如图1: 输入数字代码 ( D0D1…Dn - 1) 低位段 ( 设为i位) 控制二进制权值电流源, 高位段采用温度计码电流源阵列实现, 先通过二进制- 温度计译码器转换成温度计码, 通过锁存器同步开关各电流源, 锁存器的输出信号经过限幅电路降低电流源的开关毛刺, 高、低位段的电流源采用差分输出分别连接到In和Ip节点。对应电流源阵列由2N - i- 1个大小相等 ( 2iLSB) 的电流源组成。由于电流源单元晶体管间尺寸失配, 生产工艺的离子注入浓度的变化, 电路工作中温度变化以及电路节点工作电压的变化等, 引起电流源晶体管间阈值电压失配, 晶体管单位面积栅氧化层电容失配和电流镜晶体管衬底偏置电压不一致, 造成比例缩放的电流镜公式不再严格成立; 同时电流源开关控制信号引起的毛刺 ( glitch) , 外部时钟信号在各个电流源单元之间的时钟偏移等也严重限制了DAC的动态性能。

因此, 对于高速高精度电流的舵DAC, 为了得到好的动态性能, 必须对高权值控制的电流源阵列采用必要的措施。

2自补偿算法

采用合理的选取算法, 高位段的电流源阵列中各个电流源的失配产生的误差可以白噪声化, 从而提高系统的动态性能。传统的方法总是从最低地址开始选取, 以3位数字代码为例, 假设输入数字代码分别为5, 7, 4, 则传统方法选取的电流源分别为 ( I1, I2, I3, I4, I5) , ( I1, I2, I3, I4, I5, I6, I7) , 和 ( I1, I2, I3, I4 ) , 传统方法会造成部分电流源重复选取 ( 如I1) , 而另外一部分却很少使用的情况 ( 如I7) 。 对于一些全随机的选取方法, 由于每次开关的电流源数目过多, 会产生过多的毛刺。

本算法不增加开关毛刺的情况下, 增大选取随机性。

( 1) 增加一个随机数发生器, 当随机数R1为 “1”时, 电流源的选取从上一选取的最高地址开始向低位地址进行选取, 如选取到最低位地址以后, 电流源单元数目还少于需要选取的数目, 则从最高位地址开始往低位地址方向选取合适数目的电流源。 当随机数为“0”时, 从上次所选取的最低位地址开始往高位地址进行选取, 当一直选到最高位地址都不能满足所需电流源数目时, 接着从最低地址开始往高位选取。在以上每次选取中都将所选电流源的最高位地址和最低位地址寄存下来, 用于下次选用。

( 2) 当高位段电流源输入数字代码为全“0”或全“1”这种特殊代码时, 下一个周期电流源选取从任何地方开始不增加开关毛刺 ( 增加随机数寄存器R2决定起点位置) 。

( 3) 芯片开始工作时从最低地址开始选取。为了说明算法, 假设输入数字代码为序列5, 7, 4, 2, 6, 1, 3, 5, 对应随机数R1分别为1, 0, 1, 1, 1, 0, 0, 1, R2在第三个周期为3。在第一周期从最小地址开始选取, 第二个周期选取对应7个电流源, 第三周期选取起点随机决定, 然后由R1寄存器决定起点位置, 从本周期开始, 依次选取 ( I3, I4, I5, I6) , ( I3, I4) , ( I3, I4, I5, I6, I7, I1) , ( I1) , ( I6, I7, I1) 和 ( I6, I7, I1, I2, I3) , 本算法和传统算法电流源的选取对照如图3.

3电路实现

针对14位200 MHz电流舵DAC应用, 对上述算法进行了实现, 整个算法的实现模块如图4: 输入数字代码的地位段采用二进制码直接控制电流源开关, 高位段代码与随机数寄存器R1以及地址寄存器输出的起点, 终点地址一起完成算法 ( 1) 的地址计算; 利用R2寄存器的输出通过近似方法产生算法 ( 2) 的地址计算; 这两种地址的输出通过特殊代码 ( 全“0”或全“1”) 判断模块的输出进行选择。

在对系统进行硬件描述和仿真的基础上, 采用SMIC0. 13 μm CMOS工艺对算法系统进行综合, 具体指标如下: 面积: 0. 01 mm2, 功耗0. 47 m W, 速度: 250 MHz。采用二级流水线情况下: 面积: 0. 024 mm2, 功耗1. 2 m W, 速度: 400 MHz。完全满足14位200 MHz电流舵DAC设计要求。

4仿真验证与结论

对本算法进行Verilog-AMS建模并应用到14位200 MHz电流舵DAC电路中, 当电流源失配在 ( - 0. 05LSB, 0. 05LSB) 随机分配, 开关毛刺噪声在 ( 0 1 /2000LSB) 随机分配时, 采用本算法的模型频谱如图5, 同时对三种模型进行了10次模型仿真, 传统算法、全随机算法和本算法的SFDR均值分别为77. 2 d B、83. 2 d B和94. 8 d B。通过观察各次仿真的SFDR数据可知, 全随机选取算法性能与开关毛刺相关性很大, 在较小毛刺的情况下, 性能优于传统方法, 但是全随机选取和传统选取方法性能都不如本算法。

本文对应用于电流舵DAC的一种高随机性、低电流源开关活性的电流源选取算法进行研究, 结果表明采用本算法14位200 MHz电流舵DAC SFDR能达到90 d B以上, 而且为全数字电路实现, 功耗、 面积小时钟频率完全达到高速设计的要求。

摘要:对高速高精度电流舵模数转换器 (DAC) 的非理想因素影响进行消除已经成为研究热点。提出了一种基于“方向随机”和“特定代码随机”的电流源单元动态随机选取算法, 并采用SMIC0.13μm CMOS工艺实现, 具有较优的功耗、面积和速度指标。最终对算法建立Verilog-A电路级模型并应用在14位200 MHz电流舵DAC上, 仿真表明SFDR达到90 dB以上。

关键词:电流舵,失配,开关毛刺,随机选取

参考文献

[1] Lin Chihung, ven der Goes, F M I, Westra J R, et al., A12 bit 2.9GS/s DAC with IM3<-60 dBc beyond 1 GHz in 65 nmCMOS, IEEE J Solid-State Circuits, 2009;44 (12) :3285—3293图5 8192点频谱分析

[2] Albiol M, González J L, Alarcón E.Mismatch and dynamic modeling of current sources in current-steering CMOS D/A converters:an extended design procedure, IEEE Trans Circuits Syst II, 2004;51 (1) :159—169

[3] Lin Chihung, Bult K.A 10—b, 500—M sample/s CMOS DAC in0 .6 mm2, IEEE J Solid-State Circuits, 1998;33 (12) :1948—1958

失配问题 篇6

在动力学条件对失配位错形成影响的研究中, Kang[1]、周耐根[2]和潘华清[3]等模拟研究了沉积原子入射动能方面对薄膜生长的影响, 他们发现随入射动能的增加, 增原子的表面扩散能力增大, 导致薄膜内部缺陷密度下降, 结构趋于完整。这些研究工作, 使人们关于沉积原子入射动能对薄膜结构和薄膜中位错形成影响的认识有所提高。为了更详细地了解沉积原子入射动能对薄膜中失配位错形成的影响, 本文运用分子动力学模拟方法, 详细研究了在外延铝簿膜中单个入射原子动能对失配位错成核时原子团挤出的影响。

1 模拟方法

采用在预置了一定应变的铝衬底上设置同质外延层, 这样的体系中外延晶体和衬底之间只有几何结构上的失配而无化学交互作用, 有利于研究失配位错的形成。外延膜生长面为{111}, 模拟胞构建设置如图1所示。图中由下至上以不同的灰度分别表示固定层、恒温层和自由层[4]。

此文中模拟胞的尺寸设定为:18d110×30d112×nzd111 (nz为整数, dhkl为 (hkl) 面间距) 。在模拟过程中, 入射原子从薄膜上方可以忽略原子间相互作用的位置垂直入射到薄膜表面中心的FCC位置上, 入射动能分别为0.014e V、0.14e V、1.4e V、7 e V和10e V。在所有实验中, 不同动能的沉积原子都是入射在相同的位置, 以保证模拟研究在相同的条件下进行, 使产生的模拟结果有可比较性和可分析性。

2 模拟结果与讨论

图2给出了不同动能 (Ek) 的沉积原子入射到外延薄膜表面的FCC位置上, 各体系在不同时刻 (T) 的原子结构图。从图2 (a) 中可以看出:动能为0.014e V的沉积原子入射在表面的FCC位置的情况下, 体系在第800ps时, 外延铝薄膜表面仍然保持原子级平整。沉积原子入射到表面之后, 成为表面吸附原子。它能够克服原子间的势垒, 在薄膜表面随机地迁移, 具有较大的运动特性, 但还不足以在超过临界厚度的外延铝膜中诱发形成失配位错。

图2 (b) 是动能为0.14e V的沉积原子入射在表面的FCC位置的情况下, 外延薄膜中出现失配位错 (T=220ps) 时, 体系的原子结构图。从图中可以发现沉积原子入射到薄膜表面后, 随着沉积原子在薄膜表面的不断迁移, 有一个正三角形构型的凸台在其落点处并紧挨着沉积原子由薄膜内部向上升起。在凸台上升的同时, 失配位错处于成核过程中。可见, 入射原子动能为0.14e V时, 由于外延薄膜表面受到了原子压力和原子动能的共同作用, 会有一部分基体内部原子被挤出来, 在表面形成一个正三角形构型的凸台, 同时, 在外延薄膜内部形成失配位错。通过和图2 (a) 比较可知:随着沉积原子入射速率的增加, 光滑的薄膜表面变成了带有正三角形构型凸台的非平整表面, 即沉积原子对薄膜结构完整性的影响增大。

图2 (c) 是动能为1.4e V的沉积原子入射在表面的FCC位置的情况下, 外延薄膜中出现失配位错 (T=100ps) 时, 体系的全局图。它显示了沉积原子入射到薄膜表面后, 一个正三角形构型凸台形成在入射原子最初的落点区域, 并且远离入射原子。沉积原子入射到薄膜表面后, 由于能量传递作用, 使得沉积原子落点周围的表面原子振动加剧。当沉积原子的入射动能是1.4e V时, 由于相邻原子间能量传递的作用, 故沉积原子落点周围的表面原子变得非常活跃, 振动明显加剧, 振幅也变大。此种情况下, 落点周围的表面原子不再需要入射原子压力的作用, 仅需得到从入射原子传递过来的能量就足以摆脱其他原子对它们的束缚, 而被挤出薄膜表面。在凸台上升的同时, 失配位错也处于成核过程中。图2 (d) 中沉积原子的入射动能是10e V, 也只需原子动能的影响, 就会使薄膜表面产生凸台, 体系内部形成失配位错。

图2不同入射动能 (Ek) 的沉积原子入射到外延薄膜表面的FCC位置上, 各体系在某一时刻 (T) 的原子结构。 (a) Ek=0.014e V, T=800ps; (b) Ek=0.14e V, T=220ps; (c) Ek=1.4e V, T=100ps; (d) Ek=10e V, T=61ps

失配位错形成的动力学条件本质上是一种能够打破力学平衡的结构微扰, 沉积原子入射至薄膜表面后, 薄膜表面原子有强烈的倾向与其相互作用, 使其周围就存在不均匀力场, 所以薄膜内部原子从紧贴着沉积原子旁边的地方挤出就更容易。通过分子动力学模拟所得到的有关外延薄膜局部表面形貌的变化能反映其内部结构变化的情况。

3 结论

以上研究表明, 在外延薄膜中的失配位错成核时, 随着原子入射动能的增加, 有二种不同作用方式使倒正四面体构型原子团被挤出。当沉积原子动能为0.14e V时, 在原子动能和原子压力的共同作用下, 倒正四面体构型原子团在紧挨着沉积原子边缘被挤出;当沉积原子动能大于1.4e V时, 在原子动能的影响下, 倒正四面体构型原子团能被挤出。位错形核后, 失配位错也随之形成。

摘要:本文运用分子动力学模拟方法, 研究了在外延铝簿膜中单个入射原子动能对失配位错成核时原子团挤出的影响。模拟结果显示:当沉积原子动能为0.14eV时, 在原子动能和原子压力的共同作用下, 倒正四面体构型原子团在紧挨着沉积原子边缘被挤出;当沉积原子动能大于1.4eV时, 在原子动能的影响下, 倒正四面体构型原子团能被挤出。位错形核后, 失配位错也随之形成。

关键词:沉积原子,动能,失配位错,分子动力学

参考文献

[1]Kang W J, Hwang J H.Molecular Dynamics Simulations of Energetic Aluminum Cluster Deposition[J].Computational Materials Science, 2002, 23 (1-4) :105-114.

[2]周耐根, 周浪.外延生长薄膜中失配位错条件形成的分子动力学模拟研究[J].物理学报, 2005, 54 (7) :3278-3283.

[3]潘华清, 周耐根, 潘展, 周浪.FCC晶体外延薄膜中失配位错形成的动力学条件[J].南昌大学学报 (理科版) , 2007, 37 (2) :177-180.

失配问题 篇7

实际的薄膜外延生长不只局限于在基底上薄膜的同质外延生长, 在大多数情况下是薄膜在异质基底上的外延生长。这样生长的外延薄膜与衬底材料存在着晶格常数的差异, 因而存在着外延薄膜与衬底材料之间的晶格失配。不同材料间由于晶格失配会产生界面应力, 这种界面应力是影响异质外延薄膜生长的主要因数, 并对薄膜的形貌、结构和性能都有很大的影响[5,6,7]。已经有许多

作者[8,9,10,11]不仅研究了晶格失配对于薄膜生长的影响, 还试图用应力调节材料的物理性质, 但晶格失配度一般都不大于3%。本文所用的MgO衬底的晶格常数为0.4213 nm, 与SNTO薄膜的失配度约为5.7%。因此, 本文对在较大晶格失配条件下的薄膜生长条件和相关特性的研究具有非常重要的理论和现实意义。

1实验部分

利用脉冲激光沉积技术, 在MgO平衬底上制备SNTO薄膜。SNTO靶材是用固相法制备的。激光器是德国Lambda Physik公司生产的LPX3000型KrF准分子激光器, 激光波长为248 nm, 脉冲宽度为20 nm。脉冲激光经凸透镜聚焦后, 与靶材表面呈45度角。靶材与衬底之前的间距为50 mm。衬底温度由红外测温仪测定。单晶MgO衬底依次放入丙酮、乙醇、去离子水中进行超声清洗各10 min, 置于镀膜腔内加热硅板上制备薄膜, 用BDX3200型X射线衍射仪测定薄膜相结构。

镀膜前先对衬底进行退火预处理, 使其表面能够进行重整, 从而使镀膜过程中粒子能够较好的在表面迁移。根据此前制备SNTO和STO薄膜及超晶格的实验经验, 我们选择在50 Pa氧压和850℃退火温度下对衬底退火1 h, 镀膜时的沉积温度选择

850℃, 沉积氧压分别选择50 Pa 、5 Pa、10-3 Pa, 镀膜后的原位退火氧压选择50 Pa、10-3 Pa。

2结果与讨论

2.1沉积氧压对薄膜的结晶质量及其电阻的影响

保持沉积温度为850℃, 沉积速度为2Hz/s, 沉积时间37.5 min。在50 Pa 、5 Pa、10-3 Pa的沉积氧压下分别得到样品a、b、c, 原位退火氧压为10-3 Pa。图1为其XRD图谱, 可以看出:在50 Pa、5 Pa的氧压下SNTO薄膜能以近外延的方式生长, 而在10-3 Pa 的氧压下SNTO薄膜已不能以近外延的方式生长;并且在50 Pa、5 Pa的氧压下SNTO薄膜的衍射峰向小角度方向偏移, 半高宽分别为0.4°、0.6°。说明随着沉积氧压的减小, 薄膜的晶格参数随之增大, 结晶质量也随之变差。测试其电阻得Ra≈250 kΩ, Rb≈0.5 kΩ, Rc≈26 kΩ。可见随着沉积氧压的减小, 膜的电阻先减小后增大。分析原因可以知道, 在沉积过程中低的氧压会导致薄膜中严重缺氧, 随着氧压的增大, 根据化合价平衡条件, 进入一个O2-会使两个Ti3+转变成Ti4+, 使得晶格参数减小, 这是减少氧空位的过程, 而且电阻也会随着氧空位的减少而降低;同时, O2-的进入使原来互相排斥的两个钛正离子被氧离子吸引而导致晶格参数减小, 这与文献[12]报道的结果一致。但过低的沉积氧压下, 薄膜并不能近外延生长, 这也可能是导致其电阻反而进一步增大的原因。

2.2原位退火氧压对薄膜的结晶质量及其电阻的影响

保持镀膜温度为850℃, 沉积氧压为50 Pa, 镀膜速度为2Hz/s, 沉积时间37.5 min。在50 Pa 、10-3 Pa的退火氧压下对沉积薄膜进行原位退火处理, 分别得到样品d和样品a。图2为其XRD图谱, 从图中看出:样品a和c都可以近外延生长, 并且薄膜的衍射峰都在46.06°, 半高宽分别为0.4°和0.3°, 可见随着退火氧压的减小, 薄膜的结晶质量变好。薄膜的衍射峰在同一个角度, 说明其晶格参数几乎无变化。因此可以知道晶格参数受到沉积氧压的影响较大, 而原位退火氧压对其影响不大。测试其电阻得d样品近似绝缘, Ra≈250 kΩ。比较可知随着原位退火氧压的降低, 薄膜的电阻也在减小。

3结论

用激光脉冲沉积法在MgO (001) 衬底生长、制备出了外延SNTO导电薄膜。实验发现:①沉积氧压对薄膜的结晶质量及其电阻的影响较大, 主要表现在随着沉积氧压的减小, 薄膜的晶格参数随之增大, 结晶质量也随之变差。薄膜的电阻则是随着沉积氧压的减小而先减小后增大, 这说明要得到导电的SNTO薄膜应该有一个最佳的沉积氧压。②随着原位退火氧压的减小, 薄膜的结晶质量变好。薄膜的衍射特征峰在同一个角度, 说明其晶格参数几乎无变化。而且随着原位退火氧压的降低, 薄膜的电阻也在减小。③最佳实验条件是:在沉积温度为850℃, 沉积氧压为5 Pa, 沉积速度为2Hz/s的条件下镀膜, 在5×10-3 Pa的退火氧压下对沉积薄膜进行原位退火处理。对制备出的外延SNTO薄膜进行了X射线衍射、电阻测量的研究。其结果表明:SNTO薄膜在MgO衬底上可以外延生长, SNTO薄膜的c轴是沿着MgO衬底表面垂直方向生长的, 并且电阻较小, 这说明低氧压的生长条件下也能得到较好的外延生长薄膜, 但会使SNTO薄膜缺氧而改变它的物理性能.主要表现在可以使薄膜的电阻减小。

参考文献

[1] Bouzehouane K, Woodall P, Marcihac B, et al. Enhanced dielectric properties of SrTiO3 epitaxial thin film for tunable microwave devices [J]. Appl Phys Lett, 2002, 80 (1) :109-111.

[2]JIa QX, Findikoglu AT, Reagor D, et al.Improvement in per-formance of electrically tunable devices based on nonlinear die-lectric SrTiO3using a homoepitaxial LaAlO3interlayer[J].ApplPhys Lett, 1998, 73:80:897-899.

[3] Copel M, Duncombe P R, Neumayer D A, et al. Metallization induced band bending of SrTiO3 (100) and Ba0.7Sr0.3TiO3[J].Appl Phys Lett, 1997, 70:3 227-3 229.

[4] H ohta, Kim S, Mune Y, et al. Giant thermoelectric Seebeck coefficient of a two-dimensional electron gas in SrTiO3.Nature Materials, 2007, 6 (2) : 129-134.

[5] Kim W J, Chang W, Qadri S B, et al. Microwave properties of tetragonally distorted (Ba0.5Sr0.5) TiO3 thin films[J]. Appl Phys Lett, 2000, 76 (9) :1185-1192.

[6] Canedy C L, Li H, Alpay S P. et al. Dielectric properties in heteroepitaxial Ba0.6Sr0.4TiO3 thin films:effect of internal stresses and dislocation-type defects[J]. Appl Phys Lett, 2000, 77 (11) :1659-1666.

[7] Pertsev N A, Tagantsev A K, Setter N, et al. In-Plane and Out-of-Plane Ferroelectric Instabilities in Epitaxial SrTiO3 Films[J]. Phys Rev B, 2000, 61 (2) :825-834.

[8] Schroeder M, Wolf D E. Bond counting in a simulation model of epitaxial growth[J]. Surface Science, 1997, 375 (1) :129-140.

[9]Brune H, Bromann K, Roeder H, et al.Determination of atom-ic potential energy around step corner sites of the Ir (111) sur-face[J].Phys Rev B, 1995, 52 (20) :14380-14383.

[10]Brune H, Roeder H, Boragno C, et al.Herringbone and trian-gular patterns of dislocations in Ag, Au, and AgAu alloy filmson Ru (0001) [J].SurfaceScience, 2006, 600 (9) :1735-1757.

[11] Sabiryanov R F. Surface diffusion and growth of patterned nanostructures on strained surfaces[J]. Phys Rev B, 2003, 67 (12) 125412-125420.

上一篇:机械化栽培下一篇:英语语言文学专业