距离模型(精选8篇)
距离模型 篇1
1 前言
岩爆是岩体具有高地应力的一种表现形式,是岩体地下工程建设中关注的重要工程地质问题之一。岩爆已成为深部采矿工程和岩石工程中迫切需要解决的难题[1,2,3,4]。水利水电、公路隧道、矿山等岩体工程向深部高应力区发展,引发的岩爆越来越频繁[5]。近年来,国内外学者在岩爆预测方面做了大量的研究工作[6,7,8],一些先进的数学方法成功引入到岩爆预测中,取得了一定的研究成果,如王元汉等人[9]采用模糊综合评判来预测岩爆的等级;冯夏庭[10]、杨涛等人[11]、陈海军等人[12]引入自适应模式识别方法,采用人工神经网络预测岩爆;杨莹春等[13]利用物元模型预测岩爆;杨健、武雄[14]采用系统决策和模糊数学相结合的层次分析—模糊综合评价法对岩爆预测。
判别分析方法是一种根据已有观测样本的若干数量特征(判别因子)对新获得的样本进行识别,判断其属性的预测预报分析方法。本文借鉴判别分析方法的思想,选取影响岩爆的主要因素,对岩爆进行预测,取得了很好的效果,为预测岩爆提供了一条思路。
2距离判别分析理论
2.1 多个总体的距离判别准则[15,16]
设总体G={X1,X2,…,Xm}T为m元总体(考察m个指标),其中样本X={x1,x2,…,xm}T。令μi=E(Xi){i=1,2,…,m}测总体均值向量为μ={μ1,μ1…,μm}T。总体G的协方差矩阵为:
则样本X与总体G的马氏距离定义为:
设有k个m元总体:G1,G2,…,Gk(k>2),从中任意取2个总体Gp、Gq,考察新样本X到总体Gp和Gq的马氏距离的平方差:
其中:
那么有
总体的均值向量和公共协方差矩阵可以利用各总体的学习样本作估计。令为来自总体Gq的学习样本,nq为总体Gq的学习样本个数。则μq的无偏估计为:
学习样本的协方差矩阵∑q的估计为组内协方差矩阵Sq:
当各总体的协方差矩阵相等时,则此时总体的协方差矩阵∑的一个无偏估计为:
以和S分别代替μq和∑,得到Wq(X)(q=1,2,…,k)的估计为:
则多总体情况下的距离判别准则为:若总体Gq0满足下式:
则X∈Gq0。
2.2 判别准则的评价
为考察上述判别准则的正确性[15],利用回代估计法来考察误判率。具体方法是以全体训练样本作为新样本,逐个代入已建立的判别准则中判别其归属,并将误判个数对全体训练样本个数的比值作为误判率η的回代估计。
3岩爆预测的距离判别分析模型
3.1 判别参数的确定
判别参数的选取需考虑到影响岩爆的主要因素。借鉴前人研究的成果,选取最大切向应力σθ、单轴抗压强度σc、单轴抗拉强度σt弹性能量指数Wet等4个指标作为判别因子建立线性判别模型。
3.2 距离判别分析模型的建立
文献[9,12,13]提供了大量国内外若干典型岩爆数据,见表1,选取其中的16个作为样本,9个作为待判样本。并将岩爆情况分为无岩爆(G1)、轻微岩爆(G2)和中等岩爆(G3)。构建线性判别函数如下:
利用样本数据进行训练,经过训练后的模型,利用回代估计法对学习样本判别,预测结果和期望输出如表1所示,预测结果误判率η=0/25=0.0。由此可见,距离判别分析模型用于采空区预测是完全可行、高效的。
4 结语
岩爆是非常复杂的动力地质现象,为了更好地对岩爆等级预测,本文借鉴前人研究成果,选取单轴抗压强度σc、最大切向应力σθ、单轴抗拉强度σt和弹性能量指数Wet作为岩爆的主控因子,建立了马氏距离线性判别模型,并将模型应用于实际工程预测中,取得了良好的效果。马氏距离判别模型是建立在原始的工程资料基础之上,原始资料是否具有代表性、准确性直接决定判别模型的适用性。因此,在实际工程中,应收集具有典型代表的数据资料,建立相应的数据库,以增强模型的适用性。
注:“*”为待判样本。
心理距离、社会距离、文化距离 篇2
柏拉图在2000多年前提出过一个哲学问题:假如有一台“体验机器”可以让你体验你能想象的任何体验,你愿意在这台机器里渡过一生吗?多年前,我问我的学生们,发现他们相当多数都愿意这样渡过自己的一生。我知道,西方的学生,多数都会立刻回答不愿意。
真、真实、真正感,在网上结识朋友,在网上洽谈生意,若缺乏真正感,我认为是很难成功的。所以,互联网以及任何网商的发展是否足可替代都市规模的扩张,首先取决于虚拟社会交往的真正感是否足可替代真实社会交往的真正感。金岳霖先生在《知识论》里多次试图界定“真正感”。依照我对金先生思想的理解,真正感的条件是:(1)真而不假,(2)正而不邪。我们关于世界的感觉,可以是虚幻的,故而违反了第一条件。我们关于世界的感觉,虽真却可能邪而不正,故而违反了第二条件。
网上的社会交往,何种因素决定我们的真正感?如这篇文章标题所示,这些决定因素可分为三类:心理的、社会的、文化的。每一类,都已有许多研究报告发表。最大的学术服务器Science Direct可下载的这类文献,大多来自管理学院,尤其是关于消费者选择行为(心理的)和跨国公司经营绩效(文化的)的研究。文化距离,英文是“cultural distance”;心理距离,英文有两个,“psychological distance”和“psychic distance”。读者不妨自行检索这些关键词,研读相关的文献。不过,关于“社会距离”的研究,相当比例的报告来自社会学家而不是管理学家。
社会距离,英文是“social distance”。与心理的和文化的距离有实质差异,人与人之间社会距离感的远近,主要由社会条件决定。而人与人之间的心理距离感由心理条件决定。当然,文化距离,根据瑞典学派的定义,主要由社会文化条件决定,于是与社会距离相当程度上有重合。
最近20年网络社会科学领域,“小世界”现象及其网络结构,构成一系列最醒目的研究课题。我在其他文章里介绍过小世界,此处提供一种直观的界说(详见 Duncan Watts,2004,“the ‘new’ science of networks”《Annual Review of Sociology》30: 247-270;或更通俗的一篇:Duncan Watts,1999,“networks,dynamics,and the small-world phenomenon”《American Journal of Sociology》vol. 105,Issue 2,493-527)。在现实世界里,满足下列四条件:(1)社会网络的总人数N足够大,例如,数以亿计;(2)平均每人认识的人数k远小于N,例如,数以百计或数以千计;(3)没有谁可以成为全部社会网络的核心,这也就是我们常说的“无中心网络”——没有任何节点能够直接与任一其他节点相连;(4)有足够的团聚性,即绝大多数人的朋友圈子之内,任何三人之间都有直接联系并且任何两人的朋友圈子之间至多有三个中介纽带。
小世界网络介于两个极端结构之间,其一是原始人的社会结构,我们称为“洞穴时代”——每一洞穴内部是一全连接网络而洞穴之间联系极少;其二是后现代人的社会结构,我们称为“互联时代”——每一节点到任何其他节点之间都可以极低费用建立直接联系(例如手机或微信)。
每一社会成员的注意力和情感是有限的,故而不可能平均分配给互联时代的每一个人。这就意味着,互联时代人与人之间的关系普遍地冷漠。也因此,完全互联的社会持续积累着“都市冷漠感”。在大都市里,你可以和任何人有联系,但你和他都明白你们很难有深层情感交流,这就是本雅明描写过的都市冷漠感。于是,在注意与情感的分配问题上,通行的仍是亚里士多德“中庸原则”。适度即是善,过度即是恶。小世界是介于洞穴时代与完全互联时代的中庸结构。也因此,经济活动以及任何合作行为,在小世界结构里有最迅速的扩展。当然,病毒(或邪恶)也可在小世界结构里迅速扩展。
社会距离,在小世界结构里,不很近也不很远。基于网络社会科学研究,我们知道下列两大事实:(1)节点之间的平均距离,在洞穴时代是最远的,在互联时代是最近的;(2)人与人之间基于情感生活而形成的团聚性,在洞穴时代是最高的,在互联时代是最低的。
距离模型 篇3
本文采用上海某社区的一项富裕性疾病 (系高血压、冠心病、糖尿病、高血脂、肥胖症的统称) 调查数据库, 总共获得18743条记录, 其中男性有10521条, 女性有8222条。我们选取疾病D为高血压, 其相关因素有高血压家族史、冠心病程度、年龄、BMI指数、高血脂程度以及糖尿病程度等六个因素。本文首先利用Kendall (tau-b) 方法剔除与高血压患病相关性较小的因素, 继而以项目数据库中的17000条记录作为建立风险判别模型的数据集, 应用马氏距离建立模型。最后通过改变训练集的样本数, 来检验模型的精确程度。当样本数达到17000时, 模型对投保人患病判别的吻合率达到71%左右。
1 数学模型
1.1 Kendall (tau-b) 相关性检验
在我们讨论的问题中, 顺序变量 (X, Y) 服从离散分布, 其样本观测值会有大量的重复数据, 所以我们采用Kendall (tau-b) 统计量。
设X与Y是两个顺序变量, (Xi, Yi) , i=1, 2, ……, n为其样本, 为检验:
H0:X与Y独立H1:X与Y相关。
定义:ξ (Xi, Xj, Yi, Yj) =sign (Xj-Xi) sign (Yj-Yi) ,
其中sign
undefined
构造Kendall (tau-b) 统计量, 其中, Tx为X的样本观测值中具有相同值的样本对数, Ty为Y的样本观测值中具有相同值的样本对数。
undefined,
当X与Y的样本顺序完全一致时, Kx-a=1, 而当X与Y的样本顺序完全相反时, Kx-a=-1。
Kx-b是可估参数E (Kx-b) 的U统计量, 因而当n很大时, 服从渐近分布N (0, 1) , 对于备选假设H1:X与Y相关, 显然K取大的值有利于H1, 故否定域有形式 (K≥ka) 。 ka为显著性水平α的临界值, 在n较小时可在Kendall相关性检验统计表中查得, n较大时则由正态分布确定近似值。
1.2 马氏距离判别法
首先根据已知的分类数据, 分别计算各类的重心即各总体的均值 (估计量) , 判别准则是对任意的一次观测, 若样本X与第i类ξi的重心距离最近, 就认为X∈ξi, 即X来自第i类。据此的数学推导为:
设有p个总体ξ1, ξ2……ξp, ξ1的均值为μi, ξi的协方差矩阵为∑i, 定义马氏距离如下:dundefined=D2 (X, ζi) = (X-μi) (∑i) -1 (X-μi) ,
(1) 当∑i
=∑2 =…=∑p时, dundefined=D2 (X, ζi) = (X-μi) ∑-1 (X-μi) i=1, 2, …, p, 则判别函数为:undefined, 相应的判别准则为:
undefined
当μi, ∑未知时可用矩估计量来代替。
设在总体ξi中含有ni个已知样本, 不妨记为Xundefined, Xundefined……, Xundefined, 则均值为undefined协方差为undefined, 其中P为总体的个数undefined为ζi的离差率。
(2) 当∑1, ∑2, …, ∑p不全相等时, 则判别函数为:Wij (X) = (X-μj) ′ (X-μj) - (X-μi) ′ (∑i) -1 (X-μi) ,
相应的判别标准为:
undefined
当μi, ∑i (i=1, 2, …, p) 未知时可用矩估计来代替, 其均值为undefined, 协方差为undefined, 其中undefined。
2 项目研究
2.1 相关性分析
利用MATLAB软件, 分别计算出十六个因子变量的Kendall (tau-b) 统计值 (如下表) 。根据一些专业医学知识, 我们以Kendall (tau-b) 统计值0.1为分界, 选出同高血压患病程度相关的前六个变量分别为:高血压家族史、冠心病程度、年龄、BMI指数、高血脂程度以及糖尿病程度。
2.2 马氏距离判别法
在建立马氏距离判别模型以前, 需要对数据记录进行分类。本文将数据库中的数据按照高血压的患病程度分成四个总体ξ1, ξ2, ξ3, ξ4, 其中ξ1是患病程度为0的总体 (即未患病) , ξ2是患病程度为1的总体 (即患病程度轻) , ξ3是患病程度为2的总体 (即患病程度中) , ξ4是患病程度为3的总体 (即患病程度重) , 并且取高血压家族史、冠心病程度、年龄、BMI指数、高血脂程度以及糖尿病程度这6个因素作为判别指标, 即每个样本为一个6维向量, 所有待测样本都属于且仅属于ξ1, ξ2, ξ3, ξ4其中的一类。
在完成分类之后, 根据属于各总体的已知数据记录来计算各总体的均值和协方差。设总体ξi含有ni条记录, μi, ∑i分别为ξi的均值和协方差。根据前面所述的马氏距离的基本理论可知:undefined, 其中 (i=1, 2, 3, 4) 。
在得到各个总体的均值和协方差之后, 就可以计算待测样本到各个总体的马氏距离, 本文我们把数据分成4类, 所以对于每一个待测样本都可以得到4个马氏距离:
dundefined=D2 (X, ζi) = (X-μi) ′ (∑i) -1 (X-μi) i=1, 2, 3, 4
其中undefined。
在完成马氏距离的计算之后, 比较这四个距离, 根据如下判别法则分类:
undefined
马氏距离判别法的判别精度同各样本总体本身的性质有密切关系, 即当两个总体的均值很接近的时候, 错判的概率很大, 这时候作判别分析是没有意义的。只有当各样本总体的均值有显著差异的时候, 作判别分析才有意义。通过计算, 得到本文中四个样本总体ξ1, ξ2, ξ3, ξ4的均值如下:
总体ξ1, 均值μi= (47.9733, 21.8712, 0.0038, 0.0131, 0.0257, 0.0119) 。
总体ξ2, 均值μ2= (58.2340, 23.3773, 0.8695, 0.1660, 0.0969, 0.0865) 。
总体ξ3, 均值μ3= (64.4096, 23.5223, 0.6408, 0.9249, 0.1162, 0.0434) 。
总体ξ4, 均值μ4= (65.8136, 22.8898, 0.5169, 0.5508, 0.1695, 0.0847) 。
可以看出, 四个样本总体均值的差异是比较显著的, 下面比较他们两两之间的马氏距离, 设样本i到样本j的马氏距离为dij, 通过计算得到:
undefined
其中i=1, 2, 3, 4 j=1, 2, 3, 4。
各样本总体两两之间的马氏距离是足够大的, 因此在错判率的控制方面, 这个模型可以认为是合理的。同时, 不同样本数下建立的网络对于疾病判别也较为一致见 (表2) 。
3 结语
本文运用多元统计的方法, 提出了一类医疗保险中风险分析模型, 并将此模型应用于一个实际项目的研究。实际项目高血压疾病的研究不仅验证、充实了风险分析的模型, 同时对这样全球性的疾病的预防、监视、治疗都有着重要意义。马氏距离模型的程序较为简单, 因此它也比较容易移植成其它语言, 出错处理也相对方便。但不可否认的是, 应用马氏距离判别法作为风险分析模型, 对数据的规模要求比较高, 如果数据量较少的话, 精确程度并不是很理想。
此外, 从保险的角度来看, 保险人可以根据投保人所提供的信息, 根据上述模型近似估计其患病的概率, 从而将他们进行不同程度的风险分类, 最后根据风险等级计算费率, 甚至做出据保的决定。
这样的模型也适用于金融等其它领域中的风险分析问题, 具有一定的可推广性。
摘要:针对高血压疾病建立风险判别模型, 对投保人的患病风险以及属于何种风险类别进行判别。首先运用Ken-dall (tau-b) 检验, 选取相关性因素;然后以项目数据库作为建立风险判别模型的数据集, 应用马氏距离建立模型;最后通过改变训练集的样本数, 来检验模型的精确程度。模型对投保人患病判别的吻合率达到71%左右, 具有较强的可操作性, 并可推广到相应的保险和金融等领域的风险分析。
关键词:高血压,马氏距离,风险分析,判别模型
参考文献
[1]孙山泽.非参数统计讲义[M].北京:北京大学出版社, 2000.
[2]许东, 吴铮.基于MATLAB6.X的系统分析与设计[M].西安:西安电子科技大学出版社, 2002.
[3]郑祖康, 马蓉, 陈汉年.肥胖症的统计分析[D].第六届全国概率统计学会论文, 1998.
[4]谢志刚, 韩天雄.风险理论与非寿险精算[M].天津:南开大学出版社, 2000.
[5]方开泰.实用多元统计分析[M].上海:华东师范大学出版社, 1989.
[6]Shang Hanji, Lu Yuchu, Wang Xiuwen, Fuzzy Risk Evaluation for Diseases Related to Better Living Conditions and Premium-rate Calculations for a Health Insurance Product, Proceedings of the Second Annual Conference of APRI A, 1998.
距离模型 篇4
距离保护的性能对电力系统的安全稳定运行有着重要的影响。现有距离保护存在如下问题:1)采用集中参数模型,对于超、特高压长距离输电线路而言,其分布参数特性使传统距离保护的测量阻抗与故障距离不成正比。虽然对于超/特高压长线而言,并联电抗器有效的补偿了输电线路分布电容电流,对特高压线路差动保护、距离保护都有不同程度的改善。但其仅补偿了工频电流的一部分,且对故障初期非工频分量的补偿效果有限。因此,仍需要研究采用分布参数模型的距离保护[1,2]。2)由于受对端系统助增的影响,耐过渡电阻能力差[3,4,5,6]。
现有距离保护多采用集中参数模型,文献[7]采用RL集中参数线路模型,利用解微分方程计算故障等值阻抗。该算法忽略了线路分布电容的影响,对于高压长距离输电线路分布电容产生的高频分量使阻抗计算出现较大误差,将会导致距离保护暂态超越。文献[8]提出了一种基于工频量补偿算法的长线距离保护,但该方法将故障点与整定点之间的线路等效为R-L集中参数模型,仍然存在模型误差,且耐过渡电阻能力差。
文献[9]在贝瑞隆模型基础上,提出了一种基于沿线电压分布的故障测距方案,利用故障电流电压计算沿线电压分布,通过寻找电压幅值最小点确定故障位置。文献[10]对该方案原理进行了实测并研制了测距装置。文献[11]提出在时域下利用暂态量计算电压分布,通过寻找电压幅值最小点距保护安装处的距离构成距离保护。文献[9-11]利用贝瑞隆模型进行故障计算,从而考虑了分布电容的影响,但上述文献都未对方案的有效性进行原理性分析,如未深入研究造成电压幅值最小点与故障点位置偏差的因素。并且上述文章仅考虑了金属性故障的情况,耐过渡电阻能力低;需要从输电线路保护安装侧向另一侧计算沿线电压分布,对采样频率要求高,计算量大。
为了解决上述问题,本文提出了一种利用电压分布的距离保护新方法,并对其有效性进行了原理性分析。本文的方法:1)能够计及输电线路的参数分布特性,原理不受线路分布电容的影响,适用于超、特高压长距离输电线路;2)利用线路末端两点电压幅值构造保护判据,计算量小,易于实现。同时给出了提高耐过渡电阻能力的改进方案,使得保护方法具有很高的耐过渡电阻能力。数字仿真数据及现场录波数据仿真都验证了本方法的有效性。
1 保护原理推导
本章将介绍基于电压分布的距离保护新原理,为了方便理解,原理推导部分先以R-L模型进行分析,进而运用到分布参数模型,仿真验证采用分布参数模型。
1.1 原理分析
系统发生单相金属性接地故障(fR=0),故障网络模型和故障分量网络模型[12]如图1所示,相量图如图2所示。
图2中,为正常运行时的负荷电流,为M端故障电压、电流。为故障分量电流。MO为计算得沿线电压分布。从图2中可以看出,对于金属性故障,电压降落与故障电压反向。故障点的电压为零,O点即为故障点,在该点处电压幅值最小,故障点后电压幅值持续上升。
根据以上分析可知,沿线电压幅值在故障点处达到最小且等于零,故障点后电压幅值持续上升。同样的,利用故障分量电流计算得到的电压分布为MF,它的电压分布最小点对应的电压不为零,但最小点对应的电压向量与故障分量电流同相位,该最小点的位置也能够反映故障点的位置。
结论,在金属性故障情况下,无论是全量电流计算得电压分布还是故障分量电流计算得电压分布,它们的最小点的位置都能够反映故障位置,进而可以用于构造新保护原理。
系统单相金属性故障沿线电压分布如图3所示。其中,图3(a)为区外故障沿线电压分布,图3(b)为区内故障沿线电压分布。F为区内故障点,F′为区外故障点,P为整定点。实线为故障电流计算的电压分布;虚线为故障分量电流计算的电压分布。
从图3可以看出,对于区外和区内金属性故障,电压分布分别在故障点F′和F点取得最小值。考虑到整定点处电压分布对于区外故障呈下降趋势;而对于区内故障呈上升趋势。因此,可根据整定点处电压分布趋势判别区内、外故障。以上分析了金属性接地故障时电压分布特征,当输电线路经过渡电阻故障时,由于过渡电阻的存在,故障点处电压幅值不再为零。因此有必要分析此时的沿线电压分布特征。
图4为系统经过渡电阻单相接地故障相量图。
图4中为突变量电流,为故障支路电流,θ为故障电流与故障分量电流的夹角。
当假设线路阻抗角与系统阻抗角相等时,同相位。并且,过渡电阻通常为纯阻性,有故障点电压与故障支路电流同相位。因此,同相位。
由前面的分析可知,电压沿线分布最小值与电流相位有关。从图中可以看出,故障电流计算得沿线电压分布为MF,在方向达到最小点,而不是在达到最小点。也就是说,点A为电压分布MF的最小点,而不是故障点F。为了使得电压分布在故障点达到最小值,需要利用与故障点电压同相位的故障分量电流。利用故障分量电流计算得电压分布MD在故障点取得最小值,与故障点电压同相位。因此,沿线电压分布MD反应故障位置的信息,可以用来判别区内、外故障。
为了更清楚地展示基于全量电流的电压分布和基于故障分量的电压分布中,幅值最小点的位置与故障点位置的关系及其影响因素,图5给出了线路全长90%处经过渡电阻故障情况下,在送端和受端分别利用故障全电流和故障分量电流计算得电压分布与故障点位置的关系。从图5(a)可以看出,对送端而言,用全量电流计算得到的电压分布中,电压分布最小点出现在故障点以近;从图5(b)可以看出,对于受端而言,用全量电流计算得到的电压分布中,电压分布最小点出现在故障点以远。也就是说,利用全量电流计算得到的电压分布其最小点位置与故障点的关系取决于潮流的大小和方向。而利用故障分量电流计算得到的电压分布中,电压分布最小点和故障点重合。
综合矢量图图2和图4,并分别结合其电压分布图3和图5可以看出,无论金属性接地还是带过渡电阻接地故障,故障分量电流对应的电压分布的最小点都能够指示故障点的位置。
图3和图5所示的故障分量电流决定的电压分布能够反映故障点的位置,且故障点以近电压呈现下降趋势,故障点以远电压分布具有上升趋势,因此,可以利用线路末端电压分布的变化趋势构造距离保护。
1.2 分布参数模型下的应用
对于分布参数模型,可由下式计算沿线任意一点的电压电流。
补偿后的电压计算公式如下:
其中,θ为故障电流与故障分量电流的夹角。
在实际系统中,相间会存在耦合,而以上分析适用于每一序分量,因此本方法适用于三相系统。对带并联电抗器的线路而言,在已知电抗器电流的情况下,与本文分析一样。
2 保护处理流程
2.1 保护判据
根据上述分析可知,电压分布能够反映故障点的位置,且故障点以近电压呈现下降趋势,故障点以远电压分布具有上升趋势。当发生区外故障时,位于故障点前的整定附近的电压分布呈下降趋势;当发生区内故障时,位于故障点后的整定点附近的电压分布呈上升趋势。
为了有效地利用上述分析的电压趋势差异构造区内、外故障的识别判据,现将区内、区外及整定点处故障时线路末端电压分布示于图6。其中,实线为线路90%处,即保护整定点故障时沿线电压分布;点划线为线路80%处,即区内故障时沿线电压分布;虚线为线路100%,即区外故障的沿线电压分布。
从图6可以看到,线路整定点处发生故障时,线路全长80%处的电压和100%处的电压相同。而区内故障时,线路全长80%处的电压低于线路100%处的电压,即Ul>U0.80l。区外故障时线路80%处的电压高于线路100%处的电压,即Ul
其中:l为线路全长;Ul为线路100%处电压幅值;U0.80l为线路80%处电压幅值。
需要说明的是,本文仅给出了一种利用电压幅值变化趋势的判据形式,所有能够利用该趋势的判据,都能够用来实现输电线路的距离保护。
2.2 保护处理流程(图7)
距离保护处理过程如下。
1)故障发生后,以突变量电流作为保护启动元件
其中:Img为M端故障分量电流幅值;In为额定电流幅值。当故障分量电流满足式(4)时,判断线路发生故障,保护启动。
2)利用保护安装处电流、电压,结合故障选相结果,对故障相求出线路80%、100%处电压幅值并判断是否符合判据(3)。
3)根据2)中计算电压幅值满足保护动作判据,则保护动作跳闸;否则,保护不动作。
3 保护理论误差分析
前面的分析可知,本方法是利用故障支路的阻性特征,即故障点电压与故障支路电流同相位实现区内、外故障判别。因此,所有影响故障支路电流相位计算的因素都会造成误差。
首先,由于本端电气量仅能反映本端对故障点的注入电流,因此,两端对故障支路注入电流相位的差异会引入误差。而两端对故障支路注入电流的差异取决于两端系统阻抗角的差异,因此有必要分析系统参数差异带来的误差。
另外,由于传输线的分布特性,故障点电流与本端电流相位存在差异,而本方法利用本端故障分量电流进行相位补偿,其不一定能够真实反映故障支路电流相位,存在误差。
鉴于上述原因,有必要对上述两种误差源带来的误差进行理论分析。
3.1 系统阻抗引入误差
在实际系统中故障支路电流受两端系统电流注入,用本端故障分量电流代替故障支路电流,存在一定的误差。并且本端故障分量电流与故障支路电流的相位差取决于两端系统阻抗角。
对图1(b)所示的故障分量网络分析可知,故障支路电流与本端故障分量电流的关系为
式中:ZL为线路总阻抗;ZM、ZN分别为M、N侧系统阻抗;ZL-x为对端到故障点的阻抗。
实际系统中,一般情况下系统阻抗角大于线路阻抗角。当近端故障时,故障支路电流相位超前本端故障分量电流,计算故障距离大于实际故障距离;当远端故障时,故障支路电流相位滞后本端故障分量电流,计算得故障距离小于实际故障距离。
图8为系统经过渡电阻故障时理论误差分析相量图。
图8中:α为故障电压与故障电流的夹角;β为故障电压与故障分量电流的夹角;γ为故障分量电流与故障支路电流的夹角。计算误差为
其中:Actual loc.为故障距离;Computed loc.为计算得故障距离;Line length为线路全长。可以看出,误差仅与故障分量电流与故障支路电流的夹角γ有关,而与过渡电阻大小无直接关系,因此本方法具有很高的耐过渡电阻能力。
3.2 线路模型引入误差
在分布参数线路中由于分布电容的影响,会使得本端电流超前于故障支路电流而引入误差。
但在实际系统中,分布电容电流对电流相位影响很小,特别是对装设有补偿电容器的系统,分布电容电流引入的相位差可以忽略。因此,本方法适用于分布参数模型。
4 仿真验证
4.1 数字仿真数据验证
对本文提出的分布参数模型下利用电压分布的距离保护进行仿真验证。利用EMTP建立750 k V分布参数线路系统模型,并结合Matlab进行仿真验证,线路采用分布参数模型,采样率为2 kHz。仿真模型如图9所示,系统及线路参数如表1所示。
对给出的750 kV系统分布参数模型,在350 km处经300Ω过渡电阻单相接地故障进行仿真,计算得补偿后的沿线电压分布如图10所示。从图中可以看出,电压幅值最小点出现在故障点,可用判据(3),正确判定为区内故障。
对全线0~400 km分别经0~300Ω过渡电阻故障进行仿真验证,结果如表2所示。表中,“+”表示为区内故障保护动作,“-”表示为区外故障保护不动作。由表2分析可知,分布参数模型下保护范围可以达到线路全长的90%。
图11为在350 km处经0~300Ω过渡电阻故障时,分布参数模型下利用补偿后电压分布得到电压幅值最小点及其与实际故障距离的偏差。可以看出,利用补偿后电压分布的距离保护偏差随着故障过渡电阻的增大变化不明显,即使故障发生在保护整定点fR=300Ω时仍可准确判断为区内故障。
为了进一步说明本方法的有效性,将本保护方法与现有距离保护方法,如测量阻抗法、解微分方程法,在不同故障情况下做了仿真对比,仿真结果如表3、表4所示。
从表3、表4中可以看出,本文所提出的保护方法误差远小于传统距离保护,因此本方法性能更好。
4.2 现场录波数据验证
为了说明本保护方法的有效性,利用750 kV系统现场录波数据进行验证。750 kV系统参数如表5所示,采样率为3.2 kHz。在距保护安装处77.8 km发生单相接地故障(2012-4-16,10:42:45),录波数据如图12所示。
线路77.8 km处单相经过渡电阻故障沿线电压分布如图13所示。从图中可以看出,故障点处电压最小,并且可由判据(3)正确判定为区内故障。
为了进一步说明本方法的有效性,将本保护方法与现有距离保护方法对录波故障做了仿真对比,仿真结果如表6所示。
从表6中可以看出,本文所提出的保护方法误差小于传统距离保护,本方法性能更好。
5 结论
本文在分布参数模型基础上提出了一种利用电压分布实现距离保护的新方法,提高了距离保护在长距离输电线路、高过渡电阻情况下的保护性能。研究了保护误差的影响因素。
由于利用分布参数模型,本保护方法适用于超、特高压长距离输电线路。由于利用故障分量电流,本方法具有很高的耐过渡电阻能力。本保护方法原理简单,采样率低,易于实现。数字仿真数据及现场录波数据验证了本保护的有效性和实用性。
参考文献
[1]桑丙玉,王晓茹.特高压长线路电流差动保护自适应电容电流补偿方法[J].电力系统保护与控制,2010,38(8):1-5.SANG Bing-yu,WANG Xiao-ru.Adaptive compensation scheme of capacitance current to differential protection in UHV lines[J].Power System Protection and Control,2010,38(8):1-5.
[2]易强,周浩,计荣荣,等.特高压线路高抗补偿方案研究[J].电力系统保护与控制,2011,39(20):98-105.YI Qang,ZHOU Hao,JI Rong-rong,et al.Research on high-voltage reactor compensation of UHV AC transmission lines[J].Power System Protection and Control,2011,39(20):98-105.
[3]李瑞生,索南加乐.750kV输电线路的特殊问题及其对线路保护的影响[J].继电器,2006,34(3):1-4.LI Rui-sheng,SUONAN Jia-le.The special problem s of750kV transmission line and its influences on relay protection[J].Relay,2006,34(3):1-4.
[4]张保会,尹项根.电力系统继电保护[M].北京:中国电力出版社,2005.
[5]朱声石.高压电网继电保护原理与技术[M].北京:中国电力出版社,2005.
[6]李风华.距离保护躲过渡电阻能力研究[J].电力系统保护与控制,2011,39(8):124-127.LI Feng-hua.The capacity of distance protection hiding from transition resistance[J].Power System Protection and Control,2011,39(8):124-127.
[7]索南加乐,齐军,陈福锋,等.R-L模型参数辨识的输电线路准确故障测距算法[J].中国电机工程学报,2004,24(12):119-125.SUONAN Jia-le,QI Jun,CHEN Fu-feng,et al.An accurate fault location algorithm for transmission lines based on R-L model parameter identification[J].Proceeding of the CSEE,2004,24(12):119-125.
[8]索南加乐,顾嘉,薛晓辉,等.基于工频量补偿算法的长线距离保护[J].电力系统自动化,2007,31(23):57-60.SUONAN Jia-le,GU Jia,XUE Xiao-hui,et al.Distance protection based on frequency-domain compensation algorithm[J].Automation of Electric Power Systems,2007,31(23):57-60.
[9]Ranjbar AM,Shirani A R,Fathi A F.A new approach for fault location problem on power lines[J].IEEE Trans on Power Delivery,1992,7(1):146-150.
[10]李仁俊,梁军,孟昭勇.一种新的电力系统短路故障测距方法[J].电力系统自动化,1993,17(6):31-36.LI Ren-jun,LIANG Jun,MENG Zhao-yong.A new approach for fault location problem on power lines[J].Automation of Electric Power Systems,1993,17(1):146-150.
[11]薛士敏,贺家李,李永丽.特高压输电线基于贝瑞隆模型的距离保护[J].继电器,2005,33(19):57-61.XUE Shi-min,HE Jia-li,LI Yong-li.Distance protection based on Bergeron model for UHV transmission lines[J].Relay,2005,33(19):57-61.
距离模型 篇5
传统距离继电器不考虑线路分布电容,在线路发生金属性故障时,测量阻抗是故障距离与线路单位阻抗的线性乘积。传统距离继电器是根据测量阻抗的大小来反映故障点的远近以决定是否发出跳闸信号[1,2,3,4,5,6,7,8,9,10,11,12]。然而,对于高压/超高压/特高压远距离输电线路,沿线分布电容电流很大,对保护动作性能的影响不能忽略。相关理论分析证明[13,14,15,16],考虑输电线路分布电容的影响后,测量阻抗与故障距离呈双曲正切函数关系,双曲正切函数特性决定了阻抗继电器抗故障电阻能力差,故障电阻带来的附加阻抗将严重影响阻抗继电器的动作特性。因此,由于分布电容和高阻的影响,传统距离保护将无法正确区分故障点是否位于保护范围内,所以无法保证选择性。同时,高压/超高压/特高压远距离输电线路上往往输送较大的负荷,文献[16]指出线路上较重的负荷电流将影响继电器的动作灵敏性。因此,在高压/超高压/特高压远距离输电线路上,传统距离继电器动作特性受分布电容、负荷电流和故障电阻影响较大。
本文采用分布参数建模,提出一种适用于高压/超高压/特高压输电线路的相间距离保护。该方法利用区外故障时等效故障点电压相量在测量电压和补偿电压相量一侧以及区内故障时等效故障点电压相量在测量电压和补偿电压相量之间这一故障特征构成判据,耐故障电阻和抗负荷电流影响的能力良好,有良好的动作灵敏性。该方法适用于距离保护I段,有良好的保护范围,因此具有良好的保护动作特性。
1 基于分布参数模型的相间距离保护原理
1.1 基于分布参数模型的相间故障理论推导
线路相间故障的正、负序等值网如图1所示。
故障点与保护安装处各电气量之间关系如下:
由式(1)可得:
其中,i=1,2;Umi、Imi为m端保护测量到的正、负序电压和电流;Ufi、Imfi为故障点f处的正、负序电压和电流;lm f为故障点f到m端的距离;sh(·)、ch(·)和th(·)分别为双曲正弦函数、双曲余弦函数和双曲正切函数;γi、Zci分别为线路正、负序传播常数和正、负序波阻抗。
以BC相间短路为例,由式(2)可得m处的B相电压为:
同理,可得m处的C相电压为:
由式(3)和式(4)可得:
其中,Rf为相间过渡电阻。
由式(5)可得如下关系:
令式(6)中可得:
其中,为等效故障点电压。
图2给出了ch(γ1x)的幅相特性曲线(D代表ch(γ1x))。由图2可得,等效故障点电压
于是,定义操作电压如下:
其中,lset为线路距离保护的整定范围。
1.2 基于分布参数模型的故障点电压相角估算
根据相间故障的复合序网可知,故障处电流为:
基于分布参数模型,m端负序电流与故障点负序电流之间满足[13]:
其中,lmn为线路全长长度;lm、ln分别为由m、n侧的正、负序系统阻抗决定的虚拟等值线路长度,且lm=a th(Zm2/Zc1)/γ1,ln=a th(Zn2/Zc1)/γ1。
图3给出了以Im A2相位估算If A2相位的误差特性曲线。由图3可知,最大估算误差小于0.35°。因此,实际计算中相间故障电压相角可近似为保护安装处参考相负序电流逆时针旋转90°后的相角,从而可得,φφ=AB,BC,CA;φ为参考相,对应φ=C,A,B。
1.3 基于分布参数模型的等效故障点电压计算
当相间故障发生后,Umφφ与Uop,φφ、Ufφφ,eq分别相差一固定相量Zc1th(γ1lset)Imφφ和Zc1th(γ1lmf)Imφφ,分析二者矢量关系如下。
以我国京津唐500 k V输电线路参数为例,随故障距离x变化,Zc1th(γ1x)和Z1=x(R1+j X1)函数的实、虚部变化曲线如图4所示。由图4可知,随故障距离x变化,Zc1th(γ1x)和Z1=x(R1+j X1)曲线贴近,即可认为arg[Zc1th(γ1lset)]≈arg[Zc1th(γ1lmf)]。其中,R1、X1分别为单位线路电阻和电抗。
保护区内故障时,根据线路电压降落情况有Umφφ超前Ufφφ,eq、Ufφφ,eq超前Uop,φφ;输电线路保护区外故障时,根据线路电压降落情况有Umφφ超前Uop,φφ、Uop,φφ超前Ufφφ,eq。无论区内故障还是区外故障,均有arg(Ufφφ,eq)≈arg(j Ifφ2)。Imφφ与Zc1th(γ1lset)Imφφ矢量夹角φL=arg(Zc1thγ1lset)。Umφφ与Uop,φφ相差一固定相量Zc1th(γ1lset)Imφφ,Umφφ与Ufφφ,eq相差一固定相量Zc1th(γ1lmf)Imφφ。于是可得,保护区内故障时,各电气量相对矢量关系如图5(a)所示;保护区外故障时,各电气量相对矢量关系如图5(b)所示。
在图中,由Umφφ、Ufφφ,eq与-Zc1th(γ1lmf)Imφφ构成矢量三角形,根据三角形边角关系可得:
又由于arg(Ufφφ,eq)≈arg(j Ifφ2),所以可得:
1.4 基于分布参数模型的相间距离保护判据
如图5(a)所示,保护区内故障时,等效故障点电压相量在测量电压和补偿电压相量之间;如图5(b)所示,区外故障时,等效故障点电压相量在测量电压和补偿电压相量的一侧,故障特征明显。基于此故障特征,本文提出基于分布参数模型的线路相间距离保护判据如下:
该保护原理适用于距离保护I段。该保护原理物理模型采用分布参数模型,能精确地描述高压/超高压/特高压输电线路的物理特性,具有天然的抗分布电容电流影响的能力;该保护原理利用区外故障时故障点电压相量在测量电压和补偿电压相量的一侧以及区内故障时故障点电压相量在测量电压和补偿电压相量之间这一故障特征构成判据,具有良好的耐故障电阻和抗负荷电流的能力,因此,该保护具有良好的动作灵敏性。
系统振荡时,三相电压、三相电流平衡,不存在负序电流量。负序电流量只在系统发生不对称故障时才出现,因此,本文方法原理上不受振荡工况的影响。
1.5 输电线路装有并联电抗器
如图6所示,当输电线路两端装有并联电抗器时,令,则前文分析过程依然成立。
如图7所示,当输电线路中间装有并联电抗器时,先令lset=lmr,若满足式(11)判据,则说明故障点位于m端与并联电抗器安装点r之间,保护动作于跳闸;若不满足,则利用长线路传输方程,采用保护安装处测量到的电气量Umφφ、Imφφ计算并联电抗器安装点r处电压Urφφ、电流Irφφ,进而计算。于是在并联电抗器安装点r到I段保护整定范围处这段线路上,若满足式(11),则说明故障点位于并联电抗器安装点r到保护整定范围处之间;若不满足,则说明故障点位于保护区外。
2 试验验证
以我国京津唐500 k V超高压输电线路参数建立PSCAD/EMTDC仿真模型如图8所示。
线路mn两端等效电源相角差为δ,二者电源幅值分别为1.05倍的标幺值和1.0倍的标幺值。
两侧系统参数:Zm1=4.264 3+j 85.145 3Ω,Zm0=0.6+j 29.091 1Ω;Zn1=7.995 6+j 159.647 4Ω,Zn0=2.0+j 37.469 7Ω。
线路参数:R1=0.020 83Ω/km,L1=0.894 8 m H/km,C1=0.012 9μF/km,R0=0.114 8Ω/km,L0=2.288 6m H/km,C0=0.005 23μF/km。
距离保护I段、II段和III段保护范围分别整定为输电线路全长的80%、120%和150%,即分别为240 km、360 km和450 km。三段式距离保护各段阻抗继电器的动作特性采用方向圆特性,即特性圆经过坐标原点处,圆心位于Zset/2处,半径为|Zset/2|,整定的阻抗方向与线路阻抗方向一致。以文献[10,12]方法为例与本文方法进行比较分析如下。
2.1 送端侧保护动作特性分析
保护安装在m端,仿真验证送端侧的保护动作特性如下。图9(a)、图9(b)分别给出m、n两侧等效电源相角差δ=10°时,距m端50 km处BC相经50Ω短路后360个采样点内,50 km处实际等效故障点电压与本文计算得到的50 km处等效故障点电压幅值与相角的比较曲线。由图可知,故障后第123个采样点开始,50 km处实际等效故障点电压与本文计算得到的50 km处等效故障点电压的幅值与相角皆吻合,从而在送端侧验证了本文等效故障点电压计算方法的正确性。
图10为m、n两侧等效电源相角差δ=20°时,距保护安装处200 km位置发生BC相经0Ω电阻短路故障后360个采样点内,传统相间距离保护方法(文献[10,12]方法)测量阻抗的变化曲线。由图10可知,在相间低阻故障时,传统相间距离保护能正确可靠动作。
图11为m、n两侧等效电源相角差δ=20°时,距m端200 km处BC相经0Ω短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后第118个采样点开始判据满足动作条件。由图11可知,故障后动作方程相角在动作范围(90°~270°)中间位置,远离动作范围边界,保护可靠动作,具有良好的动作灵敏度。
图12为m、n两侧等效电源相角差δ=20°时,距保护安装处160 km位置发生BC相经150Ω电阻短路故障后360个采样点内,传统相间距离保护方法(文献[10,12]方法)测量阻抗的变化曲线。图13为m、n两侧等效电源相角差δ=20°时,距保护安装处230 km位置发生BC相经300Ω电阻短路故障后360个采样点内,传统相间距离保护方法(文献[10,12]方法)测量阻抗的变化曲线。由图12和图13可知,相间高阻短路故障时,传统相间距离保护方法测量阻抗一直位于距离保护II段动作区域外,传统相间距离保护方法保护拒动。
图14为距m端160 km处BC相经150Ω短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后第120个采样点即故障后20 ms开始判据满足动作条件。图15为距m端230 km处BC相经300Ω短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后第131个采样点开始判据满足动作条件。由图14和图15可知,相间高阻短路故障时,本文方法能正确可靠动作,且故障后动作方程相角在动作范围(90°~270°)中间位置,远离动作范围边界,保护可靠动作,有良好的动作灵敏性。
由表1可知,m、n两侧电源相角差δ=45°时,即重负荷情况下,当相间低阻短路故障时,传统保护能正确动作;当相间高阻短路故障时,传统保护的测量阻抗则位于距离保护III段动作区域外,传统保护拒动。然而,无论相间低阻短路或相间高阻短路故障,新方法动作方程相角都在动作范围(90°~270°)中间位置,远离动作范围边界,保护可靠动作,有良好的动作灵敏性。
图16给出m、n两侧电源相角差δ=35°且m、n两侧振荡频率为5 Hz(m侧等值系统频率为52.5 Hz、n侧等值系统频率为47.5 Hz)时,距m端237 km处(近保护整定范围处)BC相经165Ω短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后第133个采样点即故障后22.167 ms开始判据满足动作条件。图17给出m、n两侧电源相角差δ=35°且m、n两侧振荡频率为5 Hz(m侧等值系统频率为52.5 Hz、n侧等值系统频率为47.5 Hz)时,距m端247 km处(保护区外7 km处)BC相经235Ω高阻短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后360个采样点内保护动作方程相角均落在(-90°~90°)范围内,保护可靠不动作。由图16和图17可知,本文方法能适应振荡工况。
图18给出m、n两侧电源相角差δ=30°且保护安装在送端侧时,本文相间距离保护新方法的动作特性。由图16—18可知,保护安装在送端侧时,无论相间低阻故障还是相间高阻故障,本文方法都可保护到整定值附近,具有良好的保护范围。保护区内故障时,动作方程相角在动作范围(90°~270°)中间位置,远离动作范围边界,保护可靠动作;保护区外故障时,动作方程相角在非动作范围(-90°~90°)中间位置,远离动作范围(90°~270°),保护可靠制动。因此,本文方法具有很好的躲避负荷电流影响的能力,从而验证了本文方法在送端侧具有良好的动作特性。
2.2 受端侧保护动作特性分析
保护安装在n端,仿真验证受端侧的保护动作特性如下。图19(a)、图19(b)分别给出m、n两侧等效电源相角差δ=10°时,距n端120 km处BC相经75Ω短路后360个采样点内,120 km处实际等效故障点电压与本文计算得到的120 km处等效故障点电压幅值与相角的比较曲线。由图可知,故障后第128个采样点开始,120 km处实际等效故障点电压与本文计算得到的120 km处等效故障点电压的幅值与相角皆吻合,从而在受端侧验证了本文等效故障点电压计算方法的正确性。
图20为距n端267 km处BC相经55Ω短路时保护判据相位的暂态轨迹。故障发生在采样时刻为3 000处,故障发生后动作方程相角一直位于(-90°~90°)范围内,保护可靠制动。图21为距n端235 km处BC相经85Ω短路时保护判据相位的暂态轨迹。故障发生在采样点数为3 000处,故障后第135个采样点开始判据满足动作条件,保护可靠动作。
图22给出m、n两侧电源相角差δ=25°且保护安装在受端侧时,本文相间距离保护新方法的动作特性。由图22可知,保护安装在受端侧时,无论相间低阻故障还是相间高阻故障,新方法都可以保护到整定值附近,具有良好的保护范围和很好的躲避负荷电流影响的能力,从而验证了本文方法在受端侧也具有良好的动作特性。
3 结论
采用分布参数建模,提出一种适用于高压/超高压/特高压输电线路的相间距离保护,该保护原理具有如下特点。
a.物理模型采用分布参数模型,不受分布电容的影响,适用于任何电压等级,特别是高压/超高压/特高压输电线路。
b.区外故障时,等效故障点电压相量在测量电压和补偿电压相量的一侧;区内故障时等效故障点电压相量在测量电压和补偿电压相量之间。根据此故障特征构成的相间距离保护判据具有良好的抗过渡电阻能力。
c.可以保护到整定值附近,具有良好的保护范围。
d.具有良好的抗负荷电流影响的能力,保护动作灵敏度高。
距离模型 篇6
统计语言模型可以分为生成模型和判别模型两大类:N-gram语言模型是生成模型的典型代表, 为了直接估计一个句子的概率, 它将句子的生成过程假设为一个马尔可夫过程。即假定当前词的出现概率是由该词前面的N-1个单词所决定的, 前N-1个词对当前词的转移概率可以采用极大似然估计来获得, 基于这些转移概率, 利用链式法则就可以直接估计一个句子的概率。最大熵模型[1]是判别模型的代表, 基本假设是:在用有限知识预测未知假设时, 应该选取符合这些知识条件下具有最大熵的概率分布作为预测模型, 它将统计语言问题看作为一个求解受限概率分布问题, 能够较好地包容各种约束信息。
现有语言模型虽然在很多应用领域都取得了比较成功的应用, 但是还是存在着一些不足。主要表现为:只能建模短距离的词之间的转移关系, 无法体现长距离的词之间的依赖关系, 描述能力较差, 不能很好的反映真实的概率分布。
目前对语言模型的改进主要集中在以下几个方面:
(1) 在现有N-gram的基础上, 建立大规模高阶的语言模型[2,3], 试图从一定程度上体现长距离依赖关系, 但取得的效果并不明显。随着训练语料的不断增加, 模型的规模会变得非常庞大, 数据稀疏问题会更加严重。
(2) 利用浅层语法、语义信息的语言模型。如基于词类的语言模型[4]、基于Trigger的语言模型[5]、Skipping语言模型[6]、基于神经网络的语言模型[7,8]等。
(3) 基于语言结构的语言模型, 这类模型从分析句子语法、语义结构入手构建语言模型, 它们更多地利用了语言的结构信息, 如结构语言模型[9,10]、基于自上而下句法分析器的语言模型[11]、无监督学习的依存结构模型[12]等。
1 相关工作
语言中长距相依的现象非常普遍, 某些词或词类对在句子中往往搭配出现, 它们是具有一定的内聚性、能够结合在一起承担某种句法功能的词或词性标记的序列, 从而形成一个比较固定的框架结构, 这些词或词类对就可能会产生长距离依存现象;同时, 句子的不同成分, 如主语、谓语、状语、宾语、补语的核心词之间, 也存在着一定的相依关系, 但它们通常在句子中并不是相邻出现的, 而是相距一定的距离内。语言模型的长距相依问题己经成为影响语言模型性能的重要问题和瓶颈。
1.1 基于数据聚类的语言模型
IBM的Brown等人提出了互信息语言模型, 该模型使用词类的转移概率来替代词的转移概率, 与基于词的N元语法模型相比较, 基于类的语言模型参数小, 对未知事件的预测较优, 使得模型的鲁棒性更强。但是降低了模型对己知事件的区分能力。所以在实际系统中, 基于类的语言模型常与基于词的N元语法模型做线性插值联合使用。
基于类的语言模型使用一个映射函数G, 把所有的词分到不同的类中去, 然后使用类之间的条件概率以及词和词类之间的关系来预测词序列的概率。其二元语法模型和三元语法模型分别如式 (1) 和式 (2) 所示:
1.2 基于Trigger对的语言模型
基于Trigger对的语言模型是通过语料中的trigger对来获取语言中的长距离约束关系。如果词A的出现使得后文中词B出现的概率大大增加, 则称 (A→B) 为一个Trigger对。在自然语言中, 这种情况是非常普遍的, 例如:如果词“奥运会”在文中出现, 那么在后文中“体育”、“冠军”等词出现的可能性将大大增加, 因此可以分别称 (奥运会、体育) 、 (奥运会、冠军) 为一个Trigger对。
在这种模型中, 如何从语料中抽取适当的trigger对是一个关键的问题。一种最简单的方法是限制Trigger对的最长约束距离, 如限制为20, 即只考虑当前词的前20个词作为历史, 按这种方法抽取的Trigger对数量是非常大的。另一种比较常用的方法是使用事件A0和B之间的平均互信息来度量Trigger对 (A0→B) 体现的约束关系, 平均互信息的定义如式 (3) 所示:
文献[5]将Trigger对作为约束成功地纳入到最大熵模型的框架中, 但该方法不能克服最大熵模型计算量大、存储量大的问题。利用Trigger对描述长距离的约束关系, 可以在一定程度上弥补传统的N元语言模型描述距离小于N的缺点。如何更有效地利用Trigger对提供的信息, 以及更一般地推广到词序列的长距离约束等, 需要今后进一步的研究和探索。
1.3 Skipping语言模型
基于跳跃单元的方法是指通过一些规则和预处理, 将对连续文本的建模改变为对非连续文本的建模。例如, 有的语言模型利用对文本进行的分词和词性标注结果, 只对句子中的名词、动词等有实际意义的词进行建模, 而不考虑句子中的虚词。文献[6]把词分为功能词与非功能词两大类, 并建立以中心词为对象的语言模型。
这种方法能在一定程度上提高语言模型的长距离相依的能力。但是, 其参数估计都要考虑到预测词wi的前一个词wi-1的类别。如果对wi-1的类别判断有误, 则会影响wi的概率估计结果。
2 长距离依存的语言模型
句子的各种成分的核心词之间的长距离依存关系是语言中的一种普遍现象, 但它们通常在句子中并不是相邻出现的, 而是相距一定的距离, 如何对这种长距离依存关系进行建模, 是一个很值得研究的问题。依存句法结构可以反映出句子各成分之间的语义修饰关系, 它可以获得长距离的搭配信息, 并与句子成分的物理位置无关。本文在具体分析依存句法中各种依存关系的基础上, 从句子的依存结构树中提取特定的长距离依赖关系并形式化为约束, 最后通过最大熵模型整合这些长距离依赖关系和局部的N-gram约束关系, 并建立一种体现长距离依赖关系的语言模型。
2.1 从依存树中获取长距离依赖关系
LTP的依存关系包括24种, 其中有多种依存关系可以体现词之间长距离的依赖, 如果能在构建语言模型的过程中体现这些依赖关系, 将有利于改善语言模型的性能。如句子“我刚吃了一个很新鲜的奇特的水果”是汉语中一个常见的例子, 如果使用N-gram语言模型的情况下, 句子主语/谓语、谓语/宾语、量词/名词之间的依赖关系无法体现。依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构, 上述句子的依存句法结构如图1所示:
通过对上述句子的依存结构进行分析, 可以获取多种长距离依赖关系, 如SBV关系“我/吃”, VOB关系“吃/水果”, QUN关系“一个/水果”, DE+ATT关系“新鲜的/水果”等。通过对依存关系的仔细分析, 可能体现长距离依存关系的主要有以下一些, 如表1所示:
2.2 最大熵模型
最大熵模型已经成为近年来自然语言处理领域最成功的机器学习方法之一, 其原理是当需要对一个随机事件的概率分布进行预测时, 预测的结果应当满足全部已知的条件, 而对未知的情况不要做任何主观假设。最大熵模型的优点是可以将各种信息综合在一起, 因此, 在对具体问题建模时, 只需要集中精力选择合适的特征, 而不需要花费精力考虑如何使用这些特征。
假设分类任务或者预测任务的类别为y∈Y, 而能够依据的上下文信息记为x, x∈X。希望对于不同的给定的上下文x条件下, 统计模型能够给出判为不同类别y的概率值P (y x) 。因此, 希望能够建立一种区分性的条件概率模型P (y x) 用p来表示所有这种条件概率模型的集合, 而期望得到的模型就是p中的一种, 就是在p中满足一定约束下条件熵最大的模型。
所谓的约束, 也就是已知的信息, 可以认为期望模型在这些信息上能和训练数据匹配。而熵最大, 则表明除约束外, 不再做未知的假设, 在条件最大熵模型中, 约束是通过特征的形式来体现的, 在自然语言处理领域一般表示为0-1的指示函数的形式。
观察训练语料, 通过简单的统计可以知道任意一个特征 (x, y) 组合的联合概率。有了联合概率, 可以计算观察到的某一特征函数f的期望, 称为经验期望, 如式4所示:
假设模型能够给出p (y x) 的值, 那么就可以从模型的角度求出这个特征函数的期望, 称为模型期望, 如式5所示:
估计出的统计模型应该能够很好地反应数据中蕴含的特征, 那么从模型角度看到的f的期望就应该等于从数据观察到的f的期望, 这就是模型应该满足的约束, 如式6所示:
2.3 定义约束关系
从依存结构中获取的依赖关系主要体现的是词与词之间的长距离依赖关系, 如句子“我刚吃了一个很新鲜的奇特的水果”中的QUN关系“一个/水果”, 这种依赖关系可以定义为二元关系 (wi, wj) ;而N-gram对体现的则主要是短距离的依赖关系, 如3-gram“奇特/的/水果”, 这种依赖关系可以定义为 (wi-2wi-1, wi) , 其它N-gram的约束关系可以以此类推。把这两类依赖关系都转化为用特征函数表示的约束关系, 作为训练最大熵模型的全部约束关系, 从而可以建立一种区分性的满足给定约束的条件概率模型。
把长距离依赖关系 (wi, wj) 转化为相应的约束, 首先定义约束函数fl, 如式7所示:
把3-gram蕴含的依赖关系 (wi-2wi-1, wi) 转化为相关的约束, 首先定义约束函数f3, 如式8所示:
3 小结
目前, 在自然语言处理领域使用最广泛的仍然是N-gram语言模型, 但其对当前词的预测仅依赖前面的N-1个词, 具有一定的局限性。语言中的长距离依赖现象大量存在, 蕴含了大量的语言信息, 在语言模型中体现这些信息可以获得更好的性能表现。本文首先从句子的依存树中提取长距离依赖关系, 并形式化为约束关系, 通过最大熵模型整合长距离约束关系和N-gram语言模型中体现的局部约束关系, 实现一种体现长距离依赖关系的语言模型。该模型既具有N-gram语言模型的优势, 又包含了大量长距离依赖关系。
摘要:基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域, 捕获的主要是词之间的局部依赖关系, 但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系, 显式地对词之间的长距离搭配关系进行建模。本文利用最大熵方法整合句子的局部依赖关系和长距离搭配关系, 构建一种包含长距离依赖关系的语言模型。
距离模型 篇7
高压直流输电在远距离大容量输电和电力系统联网方面具有显著优点,它将在中国西电东送和全国联网工程中发挥重要作用。目前,葛洲坝至南桥、天生桥马窝至广州北郊、三峡至常州、三峡至广州以及舟山和嵊泗等高压直流输电工程已投入运行,还有一些直流输电工程正在建设或在计划建设之中[1]。
高压直流输电线路输电距离较远,容易受天气及地理条件的影响,输电线路故障是导致直流系统停运的一个主要原因[2]。高压直流线路保护应能检测到线路上任一点可能发生的各种故障,并能有效地清除故障。目前,高压直流线路保护普遍以行波保护作为主保护。当直流线路发生故障时,从故障点到两端换流站会分别反射不同的故障电压、电流行波,据此可以检测故障。同时,高压直流线路保护采用低电压保护、纵差保护等作为行波保护的后备保护[3,4,5,6,7]。现有保护没有明确的整定原则,一般情况下依靠仿真来提供整定值。此外,行波保护存在可靠性问题,且高阻情况下无法动作,而直流线路纵差保护不满足速动的要求,因此,有必要研究新的直流线路保护。
距离保护具有保护范围稳定、不受运行方式影响的优点,在交流输电线路保护中具有优良的性能。其实,距离保护只需要区分区内、区外故障,无需在全线范围内准确测距。经分析发现,距离保护正确动作的条件是:测距误差不大于故障距离与整定距离之差[8]。文献[8]基于分布参数模型,得出了补偿电压、电流的频域表达式,并提出了基于工频量补偿算法的长线距离保护。由文献[9]可以得到利用线路首端电压、电流计算沿线电压、电流分布的时域表达式,据此可以得到补偿算法的时域表达式。虽然该算法是为交流输电线路设计的,但该距离保护原理也同样适用于直流输电线路。
本文根据直流输电线路具有明显的边界特征,提出一种基于分布参数模型的距离保护时域算法。针对直流线路较长,近端测距误差较大,保护可能拒动的问题,提出了两段式距离保护的解决方法。
1 保护原理
1.1 直流输电线路距离保护Ⅰ段
直流输电线路两端直接连接有平波电抗器,其电感量一般较大。对于直流输电线路保护来说,区内、区外故障具有明显的边界。为保证保护动作的选择性,直流输电线路距离Ⅰ段整定为线路全长。
如图1所示,将线路用贝瑞隆模型来模拟,通过线路首端即保护安装处m测得的电压、电流量(u,i),补偿计算得到直流线路末端n的电压、电流量(u′,i′),线路末端到故障点之间的线路用RL模型来模拟。补偿电流、电压可由下式求得[10,11]。
式中:um和im分别为保护安装处的电压、电流;u′和i′分别为补偿电压、电流,即计算得到的线路末端电压、电流;R为线路单位长度的电阻;lset为整定距离;v为线路波速度;Zc为线路的特征阻抗。
当距保护安装处lf远处发生故障时,可由下式通过时域方程利用最小二乘算法得到故障距离:
式中:Rf′为等效过渡电阻;ig′为补偿电流故障分量。
保护动作判据为:
1.2 误差分析
由式(2)可以得到线路故障点处电压与线路末端补偿电压、电流的关系式为:
假设线路发生的是金属性短路故障,即u(lf)=0,对式(5)进行拉普拉斯变换,可以得到测量阻抗与故障距离的关系式为:
式中:
由式(3)得到的测量阻抗与故障距离计算值x的关系式为:
进而得到测距误差与故障距离的关系式为:
给定线路参数R=0.013 3Ω/km,L=0.847mH/km,C=0.01297μF/km,线路长度为1000km,可以得到如图2所示的故障距离与测距误差的关系。
由图2可知:
1)距离Ⅰ段提高了直流线路末端附近的测距精度,正方向区外故障时能够可靠不动作,满足保护选择性要求;
2)线路中部及远端故障时,测距误差在容许范围之内,能够可靠动作;
3)线路近端故障时,测距误差超出了容许误差,距离Ⅰ段可能拒动。
1.3 直流输电线路距离保护Ⅱ段
为了满足保护可靠性要求,使保护范围为线路全长,可以在线路近端增设一个补偿点,并以此构成直流输电线路距离保护Ⅱ段,整定距离为线路全长的30%。补偿点电压、电流计算以及保护动作判据与距离Ⅰ段类似。图3给出了lset=300km时的测距误差曲线。
由图3可以看出:
1)当lset=300km时,提高了线路近端的测距精度,距离整定点越近,测距误差越小;
2)距离Ⅱ段对于其保护范围内(线路全长的30%)发生的故障能够可靠动作;
3)保护范围之外发生故障时,故障点距离整定点越远,距离Ⅱ段测距误差越大,但该误差为正误差,测距结果大于整定距离,距离Ⅱ段不会误动。
1.4 保护逻辑
鉴于以上分析,直流输电线路距离保护采用两段式保护原理。距离保护Ⅰ段和Ⅱ段配合,当直流输电系统故障时,在保证选择性的前提下,可靠地反应于直流线路故障,正确动作。保护逻辑见图4。
2 算法实现
双极直流输电系统如图5所示,保护安装处得到的是两极的电压量和电流量,首先要利用文献[10]中的变换矩阵,将两极电压和电流转化为相互独立模量,采用贝瑞隆分布参数线路模型分别计算出补偿点处的模电压和模电流。
线路故障后,存在如下关系:
式中:j取值为0或1,分别表示各个模分量;uj′和ij′分别为补偿点处j模电压和电流;rj和lj分别为j模系统中单位长度的电阻和电感;lf为保护安装处到故障点的距离;ufj为j模系统中故障点处的电压。
对于图5所示的直流输电系统,若正极线路发生接地故障,整定点处正极电压,将式(9)代入,整理可得:
式中:uJP′和iJP′分别为整定点处的正极电压和电流;i0′为整定点0模电流;Rf′为等效故障接地电阻;
对于高压直流输电线路,发生双极故障时,就取1模分量,则故障定位方程为:
式(10)和式(11)中未知数仅有故障距离lf和等效过渡电阻Rf′,在2个不同的时刻,分别建立2个独立的微分方程,就可以求解故障距离。为了提高计算精度,可以利用最小二乘法求解冗余方程组,得到故障距离。
3 仿真计算
±500kV双极直流输电系统的仿真模型如图5所示。线路全长1 000km,采用贝瑞隆模型,用PSCAD进行电力系统仿真,用MATLAB进行算法仿真。在PSCAD仿真时,数据采样频率为10kHz,故障发生在t=0.5s时刻,整个仿真时间为1s。
利用PSCAD数据输出功能得到整流侧直流线路电压、电流的测量值,用相模变换矩阵提取模量,分别用1模和0模数据计算补偿点的电压、电流模量,算法中lsetⅠ=1000km,lsetⅡ=300km,经过相模反变换得到相量,利用补偿算法得到故障距离,作为保护动作依据,总数据窗时长为20ms。
为了验证算法的有效性,故障考虑了双极直流输电系统正极线路区内故障、末端故障以及正向区外平波电抗器后故障;接地过渡电阻考虑0Ω,15Ω,30Ω。
表1~表3给出了在不同故障距离、过渡电阻下的测距结果及保护动作情况,其中,“+”表示动作,“-”表示不动作。
由表1可以看出:直流线路远端发生故障时,距离Ⅰ段测距精度高,能够正确动作,距离Ⅱ段判为区外,可靠不动作;线路近端故障时,距离Ⅰ段拒动,但此时,距离Ⅱ段测距误差小,能够正确动作;通过Ⅰ段和Ⅱ段的配合,该距离保护能正确反应于直流线路内部故障。由表2可以看出:距离Ⅰ段提高了线路末端故障时的测距精度,有效防止了保护超越。由表3可以看出:区外故障时,距离Ⅰ段和距离Ⅱ段判定结果都为区外,保护可靠不动作。
由表1~表3可以看出:故障点过渡电阻对于该距离保护的测距结果有一定影响,随着过渡电阻的增大,测距误差有所增加。基于该算法的保护,其耐过渡电阻能力有待进一步研究和提高。
4 结语
本文给出了一种基于分布参数模型的高压直流输电线路时域保护算法,提出了两段式距离保护原理,使保护能在全线范围内快速、正确动作。仿真结果表明,该方法在直流线路区内故障时可靠动作,线路末端以外故障时可靠不动作。该方法所需数据窗短,有效提高了保护动作速度,可靠性高。
摘要:对于距离保护而言,没有必要全线准确测距,只要边界准确,能正确区分区内、区外故障即可。文中针对直流输电线路两端连接有平波电抗器,具有明显的边界特征,提出一种高压直流输电线路距离保护时域算法。该方法建立在分布参数模型基础上,通过保护安装处的电压、电流量,计算得到线路末端的电压、电流量,再应用微分方程算法计算出故障距离,以此作为保护动作依据。针对直流线路近端故障时,测距误差大且保护可能拒动的问题,提出了两段式距离保护的解决方法。仿真表明,基于该算法的保护可以正确辨别区内、区外故障,在全线范围内动作快速、可靠。
关键词:高压直流,距离保护,分布参数,时域
参考文献
[1]赵畹君.高压直流输电工程技术[M].北京:中国电力出版社,2004.
[2]刘海峰,徐政,金丽成.世界远距离大容量高压直流输电工程可靠性调查综述[J].高压电气,2002,38(3):1-6.LIU Haifeng,XU Zheng,JIN Licheng.A review of thereliability survey of long distance high power HVDCtransmission project throughout the world[J].High VoltageApparatus,2002,38(3):1-6.
[3]艾琳,陈为化.高压直流输电线路行波保护判据的研究[J].继电器,2003,31(10):41-44.AI Lin,CHEN Weihua.Research on traveling wave protectioncriterion on HVDC transmission line[J].Relay,2003,31(10):41-44.
[4]艾琳,陈为化.高压直流输电线路保护的探讨[J].继电器,2004,32(4):61-63.AI Lin,CHEN Weihua.Discussion on line protection of HVDCtransmission line[J].Relay,2004,32(4):61-63.
[5]周翔胜,林睿.高压直流输电线路保护动作分析及校验方法[J].高电压技术,2006,32(9):33-37.ZHOU Xiangsheng,LIN Rui.Analysis of relay protectionaction for HVDC line and testing method[J].High VoltageEngineering,2006,32(9):33-37.
[6]曹继丰,王钢,张海凤.高压直流线路保护配置及其优化研究[J].南方电网技术,2008,2(4):101-103.CAO Jifeng,WANG Gang,ZHANG Haifeng.Study on lineprotection configuration and optimization of HVDC line[J].Southern Power System Technology,2008,2(4):101-103.
[7]高锡明,张鹏,贺智.直流输电线路保护行为分析[J].电力系统自动化,2005,29(14):96-99.GAO Ximing,ZHANG Peng,HE Zhi.Protection analysis ofDC transmission line[J].Automation of Electric PowerSystems,2005,29(14):96-99.
[8]索南加乐,顾嘉,薛晓辉,等.基于工频量补偿算法的长线距离保护[J].电力系统自动化,2007,31(23):57-61.SUONAN Jiale,GU Jia,XUE Xiaohui,et al.Distanceprotection based on frequency-domain compensation algorithm[J].Automation of Electric Power Systems,2007,31(23):57-61.
[9]宋国兵,索南加乐,许庆强.基于双回线环流的时域法故障定位[J].中国电机工程学报,2004,24(3):24-29.SONG Guobing,SUONAN Jiale,XU Qingqiang.A novel time-domain algorithm for locating faults on parallel transmissionlines by circulating circuit[J].Proceedings of the CSEE,2004,24(3):24-29.
[10]宋国兵,周德生,焦在滨,等.一种直流输电线路故障测距新原理[J].电力系统自动化,2007,31(24):57-61.SONG Guobing,ZHOU Desheng,JIAO Zaibin,et al.A novelfault location principle for HVDC transmission line[J].Automation of Electric Power Systems,2007,31(24):57-61.
距离模型 篇8
1 灰色预测理论与数学模型
1.1 理论机制
灰色系统是信息不完全、不确定的系统。灰色系统理论是将一切随机变量看作是在一定范围内变化的灰色变量, 将随机过程看作是随时间在一定范围内变化的灰色过程。由于环境干扰使系统行为特征量离散, 为此灰色系统用灰色数生成, 对原始数据进行处理得到随机性弱化、规律性强化了的数据列。在此基础上以灰色GM (1, 1) 模型作为预测模型, 来预测系统发展变化, 并可以及时对模型进行滚动优化和反馈校正。
1.2 灰色预测理论的数学模型
灰色预测通过累加抵消和减弱随机因素影响, 并对原始离散数据进行生成数的有效处理。它从生成数序列寻找系统变化规律来建立相应的预测模型。使用该方法只要4个以上的数据, 且无需知道原始数据分布的先验特征。此外, 其建模精度较高, 可保持原系统特征并能较好地反映系统的实际状况。
1.2.1 传统 GM (1, 1) 模型
设X (0) 为非负序列:
X (0) = (X (0) (1) , X (0) (2) , …, X (0) (n) ) (1)
其中X (0) (k) ≥0, k=1, 2, …, n
X (1) 为X (0) 的1-AGO (一次累加) 序列:
X (1) = (X (1) (1) , X (1) (2) , …, X (1) (n) ) (2)
其中
Z (1) 为X (1) 的紧邻均值生成序列:
Z (1) = (Z (1) (1) , Z (1) (2) , …, Z (1) (n) ) (3)
其中Z (1) (k) =0.5X (1) (k) +0.5X (1) (k-1) , k=2, 3, …, n
若
则灰色微分方程X (0) (k) +aZ (1) (k) =b (5)
(即传统灰色GM (1, 1) 模型的基本形式) 的最小二乘估计参数列满足:
称一阶线性微分方程
为灰色微分方程X (0) (k) +aZ (1) (k) =b的白化方程, 也叫影子方程。
白化方程
则GM (1, 1) 模型灰色微分方程X (0) (k) +aZ (1) (k) =b的时间响应函数为
取X (1) (0) =X (0) (1) , 则:
其还原值为:
1.2.2 离散模型DGM (1, 1)
GM (1, 1) 模型不需要大量数据就能取得较好的预测效果, 达到较高的预测精度, 但有时GM (1, 1) 预测模型的预测效果并不十分理想, 缺乏稳定性。究其原因, GM (1, 1) 预测模型式 (5) 是离散方程, 而式 (7) 是连续方程, 在预测时将式 (5) 求的参数代入式 (7) 中, 从离散形式到连续形式的直接跳跃正是问题所在。
为提高模型的预测精度, 需从由离散到离散的角度解决这一问题。现建立离散灰色预测模型DGM (1, 1) 如下 (限于篇幅, 严格的数学推导从略) :
令:
则灰色微分方程X (0) (k) +aZ (1) (k) =b对应于离散形式的解 (我们称离散递推函数) 为:
其还原值为
1.3 灰色模型的精度检验
模型预测值选定后, 一定要经过检验才能判定其是否合理, 只有经过检验的模型才能用来应用。灰色模型的精度检验一般有三种方法:残差检验法、关联度检验法与后验差检验法。这里只介绍常用的后验差检验法。
(1) C=S2/S1称为均方差比值, 指标C越小越好。
C越小, 表示S1越大、S2越小。S1大, 表示原始数据方差大, 原始数据离散程度大。 S2小, 表示残差方差小, 残差离散程度小, C小, 表示尽管原始数据很离散, 但模型所得计算值与实际值之差并不太离散。
(2) P=P{|q (k) -q|<0.6745S1}称为小误差概率, 指标P越大越好。
P越大, 表明残差与残差平均值之差小于给定值0.6745S1的点较多。
模型的精度由C和P共同评定。一般地, 将模型的精度分为四级, 见表1。
2 不等时距数据序列的等时距转换。
灰色预测模型 GM (1, 1) 建模中要求原始数据是等时距的, 但在实际应用时获得的原始数据一般是非等时距的, 可能会缺少部分原始数据, 因而出现不等时距的情况。这样, 严格地说, 按照原始的灰色理论的概念是难以建立模型的, 这就可能使一些必要的预测工作无法正常进行, 也使灰色系统理论的应用受到限制。对于不等时距问题, 一般常用的变通办法较多, 但这些方法都要对原始数据做一些线性处理, 人为引起数据失真。本研究尝试采用三次 B样条函数进行内插, 同时控制步长, 以减小误差。
三次样条插值函数拟合S—t曲线的基本原理为:对一组已知的数据点, 寻找一组拟合多项式。在区间[a, b]上拟合曲线, 设此曲线方程为三次多项式S=p (t) , 将区间[a, b]分为n个小区间, 要确定S=p (t) , 每个区间上需要4个待定系数, 根据一系列数学知识确定4n个待定系数。由此可求出数据拟合的三次样条函数S=p (t) 。利用三次样条插值可计算出一元函数S=p (t) 在任意的时间ti处的近似值, 利用此方法能通过不等时间段的量测数据, 计算出在相等时间间隔Δt的沉降量。
3 基于不等时距离散灰色预测模型的软土地基沉降实例分析
为了检验本文方法对具有波动性和非周期性沉降时间序列的预测效果, 并为了便于比较, 采用文献[3]的数据。文献[3]方法 (传统GM (1, 1) 预测法) 和本文方法计算的结果一同列于表2和表3。
不等时距数据序列的等时距转换
以文献[3]的实测数据按 7d步长分别采用线性插值方法和三次样条插值把不等时距序列转化为等时距序列, 由此得到的曲线与实测曲线比较如图1。由图1可知, 三次样条插值的插值效果要比线性插值的效果好得多, 三次样条条曲线几乎完全与实测曲线重合, 更逼近于实测沉降曲线。因此, 采用经过三次B样条内插得到的等时距序列进行建模预测是可行的, 并且使用三次 B样条内插得到的数据序列, 其数据的光滑性变得更好, 这也是符合灰色系统建模原理的。具体插值结果见表2。
在MATLAB平台下, 输入表2中的数据X=[3.08 3.4510 4.6457 5.6533 8.0075 9.3325]和X=[3.08 3.4310 4.1858 6.0737 7.9179 9.4816], 然后分别调用所编制的M文件gm.m和dgm.m, 即可得出GM (1, 1) 模型和DGM (1, 1) 模型的预测值和有关参数, 结果见表3和表4。
注:表中预测值1为GM (1, 1) 方法计算结果;预测值2为DGM (1, 1) 方法计算结果
由表3可知, 线性插值法得出的预测值和实测值有比较大的差异, 这主要是因为所给原始数据的时间间隔过大, 而检测数据的时间间隔明显影响预测模型的稳定性, 当时间间隔过大时, 模型会出现失真现象。另外, 由于该方法选取的平均时间间隔为7d, 使预测值的灰区间较大, 而且采用简单的线性插值, 与实际情况有较大的出入, 由此造成了模型的失真。三次样条插值法得出的预测值和实测值较为接近, 建立的模型较为合理, 原因在于三次样条插值为非线性插值, 在各段连接处不仅能保证曲线连续而且能保证各节点处都是光滑连接的, 因此插值所得到等间隔序列更准确, 也使得建立的模型更合理。
由表4可知, 利用GM (1, 1) 模型和DGM (1, 1) 模型进行预测, 预测模型均符合表1精度检验要求。但由C的大小可知, 对于原始数据很离散的数据列, DGM (1, 1) 模型所得计算值与实际值之差的离散程度要比GM (1, 1) 模型低, 即DGM (1, 1) 模型得出的预测值和实测值更为接近, 此结论可由表3中的预测结果比较得到验证。
工程实例证明, 采用三次B样条插值方法进行不等时距的转换, 然后利用离散灰色预测模型DGM (1, 1) 来预测沉降, 可取得良好的预测效果。因此, 在实际工程应用中, 本文方法具有较高的推广价值。
4 结 论
(1) 灰色模型的实质是通过对原始数据进行累加生成, 得到规律性较强的曲线后, 再用指数曲线拟合得到生成模型。因此原始数据不规律、预测值的灰区间较大、测试时间间隔较大都将影响模型的精度。
(2) 本文采用线性插值法和三次样条插值法两种方法把不等时距序列化为等时距序列, 并应用于实际工程的沉降预测。结果表明:三次样条插值法对不等时距序列进行等时距转换较为合理。
(3) 通过GM (1, 1) 模型和DGM (1, 1) 模型应用比较, 证明DGM (1, 1) 模型对离散的数据列具有良好的适用性, 能够较好地提高地基沉降预测的精度。
参考文献
[1]邓聚龙.灰色系统基本方法[M].武汉:华中理工大学出版社, 1987.
[2]谢乃明, 刘思峰.离散GM (1, 1) 模型与灰色预测模型建模机理[J].系统工程理论与实践, 2005 (1) :93-98.
[3]韦寒波, 高振林, 孙世国.北京某建筑地基的沉降监测与灰色预测[J].岩土工程界2007, 11 (6) :65-67.