非线性最小二乘曲线

2024-10-16

非线性最小二乘曲线(共8篇)

非线性最小二乘曲线 篇1

电子商务飞速发展使我们对市场的发展速度难以预计, 为此我们可以探讨用一种数学模式来探讨未来的市场走向, 为企业的发展提供有效的工具。

非线性最小二乘曲线拟合法, 就是利用非线性最小二乘法的基本思想和一些典型的非线性特征曲线来实现预测的方法。以下首先介绍线性最小二乘法的基本思想。然后, 尝试使用非线性特征曲线拟合法, 包括指数曲线拟合法、饱和指数曲线拟合法、皮尔 (Pearl) 曲线拟合法以及高柏茨 (Gompertz) 曲线拟合法。在历年中国网民的规模数据基础上, 对历年中国网民的规模做一个简单的预测。

一、最小二乘法的基本思想

作为其预测值, 对现有的x所对应的估值为:

二、指数曲线拟合法

大量的研究表明, 世界上许多事物的发展在一定时期内往往呈现出“雪崩”式的快速增长——指数增长。互联网行业同样如此, 伴随技术的进步、经济的起飞, 其增长趋势接近“指数规律”, 用指数函数建立拟合的模型较为满意。

1. 基本思想

其中, A>0, B>1。对式两边取对数, 得lgy=lg A+xlg B

令Y=lgy, a=lg A, b=lg B

这样, 便将指数曲线化为了直线, 于是, 可以套用算式 (6) 求得系数a和b, 再求反对数即获得指数增长模型中的待定系数A和B。对式 (9) 可做类似处理, 求出待定系数A和B。

2. 实例分析

截至2008年底, 中国网民规模达到2.98亿人, 较2007年增长41.9%, 互联网普及率达到22.6%, 略高于全球平均水平 (21.9%) 。继2008年6月中国网民规模超过美国, 成为全球第一之后, 中国的互联网普及再次实现飞跃, 赶上并超过了全球平均水平。 (1)

三、饱和指数曲线拟合法

1. 基本特征

实践证明, 各种事物的生长过程或成长过程均具有一定基本的共性, 主要具有下述两个特征。

(1) 发展的全过程科粗略分为三个阶段:首先是萌芽阶段, 此时, 事物处于初生或初创时期, 进展比较缓慢;其次是发展阶段, 此时在数量上出现明显的增长, 且往往有一个高速发展或突破性进展的事情;最后是饱和阶段, 此时的发展越来越慢, 趋于淘汰。 (2) 发展中存在一个上线或极限, 制约着每一个具体发展的全过程。

基于这两个事物共同的基本特征, 为了尽可能准确地拟合实际中各种各样的具体的事物发展过程, 便提出了有关描述“事物发展”的曲线拟合方法 (又称为生长模型法) , 其中, 饱和指数曲线拟合法以及皮尔 (Pearl) 曲线拟合法和高柏茨 (Gompertz) 曲线拟合法是比较具有代表性的方法。

2. 基本思想

其中, k, a, b为待求参数, 满足k>0, a>0, 0

通常用“三组法”来估计算式 (10) 中的参数, 以下简介之。

将 (2) 中的数据分别带入 (10) , 得

将方程组 (3) 中的算式顺序分成三组, 每组还有n个方程, 然后把各组加起来, 得

于是, 由方程组 (4) 便可以求得k, a, b的值:

3. 实例分析

将网民规模再次进行计算, 探讨中国网民的极限值。

按算式 (14) 计算b, a, k.。得出b=1.2868, 不在饱和指数曲线要求满足k>0, a>0, 0

四、结论

最小二乘法是一种数学优化技术, 它通过最小化误差的平方和找到一组数据的最佳函数匹配。用最简的方法求得一些不可知的真值, 而令误差平方之和为最小。在电子商务各个领域都能得到有效的应用。

参考文献

[1]陈庄, 等.ERP原理与应用教程[M].北京:电子工业出版社, ISBN7-50536-8632-8/TP.

[2]第23次中国互联网络发展状况统计报告[R].CNNIC.

非线性最小二乘曲线 篇2

在线性回归模型中普通的最小二乘估计(LSE)许多情形下是不稳健的.本文介绍了一种投影深度函数,深度加权平均和深度加权LSE,这些估计量有符合需要的`稳健性.并讨论了在深度加权LSE情形下线性回归模型的拟合检验问题.

作 者:范允征 林路 Fan Yunzheng kin Lu 作者单位:范允征,Fan Yunzheng(南通大学理学院,江苏,南通,226007)

林路,kin Lu(山东大学数学与系统科学学院,山东,济南,250100)

非线性最小二乘曲线 篇3

在实验数据的处理、分析时, 数据拟合是经常采用的一种方法。数据拟合的目标是找到能反映变量之间关系的一种表达式, 使其在某种准则下最佳地接近已知数据。其原理有最小二乘法、契比雪夫法等, 且以最小二乘法最为常见和重要。

随着人类认识能力的不断进步以及计算技术的快速发展, 对于变量之间的未知关系, 应用曲线拟合的方法揭示其内在规律具有重要的理论和现实意义。针对最小二乘曲线拟合的有关问题以及相应的MATLAB实现进行探讨。

1 最小二乘曲线拟合

曲线拟合是指:已知n个数据点 (xi, yi) , i=1, 2, ……, n, 其中xi不全相同, 寻求函数f (x;a1, a2, …, am) 的待定参数a1, a2, …, am的一组取值, 使得在这组取值之下, 函数f (x;a1, a2, …, am) 与已知n个数据点整体上最为接近。

最小二乘曲线拟合方法根据已知数据, 首先构造出能够反映含有待定参数的函数f (x;a1, a2, …, am) 与n个数据点 (xi, yi) , i=1, 2……, n偏离程度的函数:

然后应用数学方法求函数J (a1, a2, …, am) 的最小值a1, am2, i…n, am=J (a1, a2, …, am) , 此时a1, a2, …, am的取值就是所求的待定值。这样一组取值使得函数f (x;a1, a2, …, am) 与n个数据点在二次平方和意义下最为接近。

2 最小二乘曲线拟合的MATLAB实现

2.1 线性最小二乘曲线拟合的MATLAB实现

线性最小二乘曲线拟合的含有待定参数的函数形式为:

其中rk (x) 为事先选定的一组已知函数, ak为待定系数, k=1, 2, …, n, m

该方程组可简化为RTRA=RTY, 其中:

当r1 (x) , …, rm (x) 线性无关时, RTR可逆, 方程组RTRA=RTY有唯一解。

根据线性最小二乘拟合理论可得关于待求参数构成的矩阵A的解, 利用MATLAB下命令A=RY, 可以直接求得待求参数, 下面举例说明。

例1下表给出了一组实测数据

已知数据 (xi, yi) 的函数原型为:

试用已知数据进行曲线拟合, 求出待定参数的值。

在MATLAB中输入以下程序:

运行程序, 输出待定参数结果为:

下面画出拟合得到的曲线及已知的数据散点图:

由图1可见, 曲线拟合效果非常好。事实上, 所给数据就是由已知曲线:

2.2 非线性最小二乘曲线拟合

在最小二乘曲线拟合中, 如果待定参数不能全部以线性形式出现, 如指数拟合函数f (x) =a0+a1e-a2·x, 这便是非线性最小二乘曲线拟合。

非线性最小二乘曲线拟合与线性最小二乘曲线拟合的原理没有什么区别, 但是最小二乘的解常常难以通过人的手算实现, 从而制约了该方法的应用。随着计算机技术的进步、专业软件的不断涌现, 这一问题的求解已不再困难。但是, 非线性曲线拟合中初值的选取是一个重要的问题, 目前为止还没有固定的理论或方法给出一般性的结论。

在MATLAB中实现非线性最小二乘曲线拟合有三个常用的命令。

(1) lsqcurvefit () 命令, 其使用格式为x=lsqcurvefit (fun, x0, xdata, ydata) , 其中fun是要拟合的非线性函数, x0是初始参数, xdata, ydata是拟合点的数据, 该函数最终返回系数矩阵。

(2) nlinfit () 命令, 其应用格式为beta=nlinfit (x, y, fun, beta0) , 其中x和y是拟合点数据, fun是被回归 (拟合) 的函数, beat0是初始参数。

(3) lsqnonlin () 命令, 其应用格式为x=lsqnonlin (fun, x0) , 其中fun的定义与lsqnonlin () 函数中fun的定义有差别, x0仍为初始参数向量, 将输出的系数结果放在变量x中。

例2假设已知

并已知该函数原型为y (x) =a1exp (a2x) +0.54exp (a3x) .sin (a4x) , 其中ai为待定系数。

在MATLAB中输入以下命令:

%建立函数原型, 则可以根据他来进行下面的求取系数的计算

运行结果为:

所求得的系数与原式中的系数相近。

如果想进一步提高精度, 则需修改最优化的选项, 函数的调用格式也将随之改变。

在MATLAB中输入以下命令:

%修改精度, 即是修改其限制条件

%两个空矩阵表示系数向量的上下限a', res运行结果为:

下面画出由拟合得到的曲线及已知的数据散点图, 如图2。

3 结论

首先介绍了最小二乘法的原理, 其次对线性最小二乘曲线拟合和非线性最小二乘曲线拟合应用MATLAB进行了具体实现, 使得相关曲线拟合理论更加生动易懂, 这使我们可以在今后的研究和工作中建立曲线模型对相应对象进行曲线拟合, 并应用MATLAB来实现, 从而找到更好更形象的反映变量之间关系的曲线, 也就找到最合适的模型了。

参考文献

[1]薛定宇, 陈阳泉.高等应用数学问题的MATLAB求解[M].北京:清华大学出版社, 2004.

[2]刘琼荪, 何中市, 傅鹂等.数学实验[M].北京:高等教育出版社, 2000.

[3]梁国业, 廖健平.数学建模[M].北京:冶金工业出版社, 2004.

非线性最小二乘曲线 篇4

关于电流互感器(current transformer,CT)铁心的磁化曲线拟合问题,国内外学者提出了多种方法,较常用的有拉格朗日插值法,最小二乘拟合法、分段线性插值法。除此之外新兴的方法还包括基于人工神经网络的曲线拟合和支持向量机,其中人工神经网络又包括BP神经网络和径向基函数神经网络,这两钟方法本质上都是利用网络的自学习功能来自动寻找最优的连接权系数,以达到非线性函数拟合的目的[1,2]。优点是选取的样本容量越大,拟合出来的精度越高,但此种方法所形成的网络结构较复杂,需要调节的连接权系数较多,训练过程也较繁琐,一些重要参数的选择不当甚至会导致整个学习过程陷入局部极值的问题;并且最后得到的拟合公式也很复杂。而传统支持向量机(SVM)虽然没有上述问题,但其训练问题是一个二次规划问题或凸规划问题,当样本数目较大时,其训练速度较慢,占用内存较大[3,4,5]。为此本文提出了一种利用最小二乘支持向量机来实现励磁特性曲线拟合的新算法。该算法不仅具有支持向量机在小样本情况下拟合精度高、泛化能力强的优点,同时还具有计算简单、求解速度快,内存需求少的特点。

1 最小二乘支持向量机原理

最小二乘支持向量机[6](Least Squares Support Vector Machines,LS-SVM),是支持向量机的一种改进,将传统支持向量机中的不等式约束改为等式约束,同时把误差平方和损失函数作为训练集的经验损失,将经验风险由偏差的一次方改为二次方,最终将求解二次规划问题转化为求解线性方程组的问题,避免了不敏感损失函数,大大降低了计算复杂度,提高了求解问题的速度和收敛精度。

1.1 具体算法描述

给定一个有N个训练样本的集合{xk,yk},k=1,2,…,N,其中训练样本n维向量xk∈R n,yk∈R。

首先用一个非线性映射φ(·)把原空间样本从Rn映射到特征空间φ(xi),这样就把低维空间的非线性逼近问题转化为高维空间的线性化逼近问题,在这个高维特征空间中构造最优决策函数:

依据结构风险最小化原则,寻找ω,b就是最小化;

根据统计学理论,函数拟合问题就变为求解如下最优化问题:

其中:|ω|2控制模型的复杂度;γ是正规化参数,控制对超出误差样本的惩罚程度;ω为权矢量;ξ为误差变量;b为偏差量;Remp为误差控制函数,也即不敏感损失函数。常用损失函数有线性损失函数,二次损失函数,Huber损失函数,当选取不同的损失函数,可构成不同形式的支持向量机。本文采用的损失函数为误差函数ξ的二次项。

用拉格朗日法求解这个优化问题:

其中:ak,k=1,2,…,N为拉格朗日乘子。根据最优化理论中的KKT(Karush-Kuhn-Tucker)条件可得到:

可推得:

其中:ai=Cξiωϕ(x i)+b+ξi-yi=0。

定义核函数ϕ(x i,yj)=ϕ(x i)iϕ(x j)是满足条件的对称函数。优化问题转化为求解以下线性方程组解的问题。

根据最小二乘法求出a与b,得到非线性拟合模型:

1.2 关于核函数的选取

LS-SVM的非线性拟合能力都是通过“核映射”的方法来实现的,对于一个具体问题,如果核参数取得不合适,LS-SVM就无法达到预期的拟合效果(数据子空间的维数决定了线性分类面能达到的最小经验误差),并且,核函数的类型[7,8]也应根据不同的情况加以正确选择才能达到理想的拟合效果。一般只要满足Mercer条件的函数都是核函数,常用的有以下几种:

如果选取式(1),那么LS-SVM实现的是一个多项式的向量机,参数q由用户自己取值;式(2),每个基函数的中心对应于一个支持向量,得到的是径向基函数向量机;式(3),实现的是一个两层的多层感知器神经网络。本文采用较常用的径向基函数作为核函数,其中:δ为核宽度。

1.3 数据预处理

为了便于后续处理,需要对训练各样本值按式(10)进行标准归一化处理

归一化后的各样本值的范围在(0,1)之间。

2 具体实现步骤

图1中是用Matlab7.0编程实现LS-SVM的结构框图,括号中是相应用到的函数,详细计算步骤如下:

(1)创建输入输出样本,用Load命令加载数据。

(2)将测得的数据样本按照式(10)进行标准归一化处理。

(3)设定最小二乘支持向量机参数gam和相应核函数sig2,type;其中:gam和sig2是最小二乘支持向量机参数,gam是正则化参数,决定适应误差的最小化和平滑程度,sig2是RBF函数的参数。Type中有两种类型:一类是关于分类的是classfication;另一类是用于函数拟合的是function approximation。

(4)用trainlssvm函数建立回归模型,根据数据样本的输入输出和上一步预先设置好的训练参数,对网络进行训练,得到最小二乘支持向量机的支持向量`alpha`和相应的阀值`b`。

(5)读取预估数据的输入,进行数据预处理,得到实际波形。

(6)将各训练后的点进行拟合,查看拟合情况。

(7)如果上步中出现的拟合波形与实际励磁特性曲线相比不能满足实际要求,可利用模型调整部分的函数进行(3)、(4)两部分建立好的回归模型的相应参数的调整,直到符合要求为止。

3 仿真波形验证

表1列出了某种硅钢材料励磁曲线B-H的部分测量数据值,共9组,将各数据依据式(10)进行标准归一化,之后将其按照以上介绍输入Matlab7.0中,经过多次对回归模型参数的调整实验,最终得到比较理想的拟合波形,如图2所示,此时Matlab7.0命令窗口中部分命令如下:

其中:B,H0为测量值;H1为训练后的样本值;%为两者之间的相对误差。

图2中,黑点为训练后的各样本点,实线为实际的励磁特性曲线。从图中可见,经调整参数训练后的各样本点基本都在实际励磁特性曲线上,拟合效果较理想。同时从表1中列出的训练后的样本值与实际值的偏差程度,发现二者之间相差甚小,拟合精度较高,可以满足实际的需要。

4 结语

本文提出使用最小二乘支持向量机来拟合电流互感器励磁特性曲线,为CT铁心饱和特性的建立提供了一种新的算法途径。实验仿真波形验证了该算法在铁心非线性逼近方面的有效性和准确性。此外,该算法除了可以应用于电流互感器的铁心拟合外,同时还可以进一步推广到其它领域的非线性曲线拟合与回归中。

摘要:针对传统支持向量机在电流互感器铁心励磁特性曲线拟合时样本数目较大出现的训练速度慢、占用内存大的问题,提出了一种新的基于最小二乘支持向量机算法。该算法将实测数据由径向基函数把非线性逼近问题转化为线性逼近问题,依据最小二乘法的思想,利用Matlab7.0求一个线性方程组的解,得到拟合曲线的近似表达式。实验结果表明,新算法训练速度快,误差小、拟合精度高。

关键词:电流互感器,最小二乘支持向量机,非线性,径向基函数,曲线拟合

参考文献

[1]施晓秋.BP网络与CMAC用于非线性曲线拟合[J].温州大学学报,2001(1):46-49.

[2]李贵存,刘万顺.用于磁化曲线拟合的高精度混合型径向基函数神经网络[J].电网技术,2001,25(12).

[3]Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer,1995.

[4]Drucker H,Burges C J C,Kaufman L.Support vector regression machines[C].//Advances in Neural Informa-tion Processing Systems.Cambridge:MIT Press,1997:155-161.

[5]赵春晖,陈万海,郭春燕.多类支持向量机方法的研究现状与分析[J].智能系统学报,2007,2(4):11-17.ZHAO Chun-hui,CHEN Wan-hai,GUO Chun-yan.Research and analysis of methods formulticlass supportvector machines[J].CAAI Transa on Intellient Systems2007,2(4):11-17.

[6]阎威武,邵惠鹤.支持向量机和最小二乘支持向量机的比较及应用研究[J].控制与决策,2003,18(3):358-360.

[7]郑小霞,钱锋.高斯核支持向量机分类和模型参数选择研究[J].计算机工程与应用,2006,42(1):77-79.

非线性最小二乘曲线 篇5

总体最小二乘[1]认为平差模型中观测向量和系数矩阵同时含有误差, 并对其进行改正。针对系数矩阵含有误差的平差问题, 在理论上总体最小二乘较最小二乘更为严密。总体最小二乘的经典解法是奇异值分解法 (SVD) , 但由于其计算复杂且不利于编程, 测量学者提出了一些基于平差模型的迭代解法[2~7], 并对其实际应用作了一些研究[8~10]。在测量数据处理中, 线性拟合是总体最小二乘一个最重要的应用, 但总体最小二乘的常规解法 (即奇异值分解法和迭代解法) 都无法顾及线性回归中系数矩阵的常数列而是对其进行了改正, 这对线性回归模型来讲是不合理的。文献[5]以直线必须通过数据点的中心, 才能使其偏差最小为约束条件, 推导了一种求解线性模型的总体最小二乘算法, 虽然该算法提高了线性回归的逼近精度, 但仍然存在偏差。文献[7]通过将数据中心化后再采用奇异值分解法对回归参数进行解算, 则分离了系数矩阵的常数列, 得到的参数估值合理可靠。但其缺陷是计算复杂难以编程实现。鉴于此, 本文在基于平差模型的基础上, 推导了一种求解线性回归参数的总体最小二乘算法, 该算法易于编程实现。算例分析表明其可靠、合理。

1 总体最小二乘常规解法

1.1 SVD解法

线性回归模型为[1,2,6]:

式中:Δ观测量y的真误差, ak为回归参数, 当同时考虑到自变量xk也含有误差, 此时系数矩阵A中的元素含有误差, 则式 (2) 变换为总体最小二乘的平差模型:

采用奇异值分解 (SVD) 法将式 (2) 变换为:

求得参数估值为[1,2,6]:

式 (4) 中, n为非固定列对应参数的个数, σ2n+1为增广矩阵[A L]的最小特征值。其单位权中误差计算公式为σ02=σ2n+1/ (m-n-1) , 其中m为观测个数, n+1为参数的个数。

SVD解是将系数矩阵中所有元素看成是含有误差的, 这对线性回归模型来讲是不合理的。而且SVD解法较为复杂, 不利于测量数据处理的编程实现。

1.2 常规迭代解法

总体最小二乘的迭代解法为[2]:

进行迭代解算时, 首先按最小二乘法计算参数的初值X (0) , 然后根据式 (5) 反复迭代直到‖X (i+1) -X (i) ‖<ε则停止计算输出参数值, 单位权中误差按σ0=V/ (m-n) 计算。迭代解法最大的优点是充分运用到测量平差模型, 其迭代格式简单易于编程。但常规的总体最小二乘迭代解法都是将系数矩阵所有元素看成是含误差的, 这对线性回归模型也是不合理的。

2 线性回归参数的总体最小二乘迭代解法

2.1 算法推导

根据前文所述, 有必要建立基于总体最小二乘的线性回归模型和解法, 线性回归数学模型为:

可将式 (6) 进行等价转换为:

表示为矩阵形式为:

设v=vec (EA) , vec表示向量拉直运算, vec (EA) 即将矩阵从左至右逐列拉直成一列向量。在不考虑权重时, 根据总体最小二乘原理, 相应的误差期望和方差为:

式 (9) 中, 为矩阵的克罗内克积, Im和In分别为m和n阶的单位矩阵, 相应的其平差准则为:

根据式 (8) 与式 (10) 构造拉格朗日目标函数:

式 (11) 中, k为 (n+1) ×1的拉格朗日乘数;, In+1为n+1阶的单位矩阵。根据拉格朗日函数求极值的必要条件, 将式 (11) 分别对v、x求导并令其等于0, 化简整理后可得:

由式 (12) 的第一式可得:

式 (13) 中, vec-1表示vec的逆运算, 即将矩阵重新构造为m× (n+1) 的矩阵。

将式 (12) 的第一式代入到式 (8) 中, 并顾及, 整理后可得:

根据式 (11) 第二式和式 (14) 则可得:

根据式 (15) 即可得到参数^x的表达式:

根据上述推导, 其参数解算步骤如下:

(1) 对回归参数附初值^x (0)

(2) 按式 (17) 计算k值和新的回归参数值

(3) 重复步骤 (2) , 直到‖x (i+1) -x (i) ‖<ε, 则停止迭代

按上述迭代方法即可求得式 (7) 的方程, 相应的线性回归方程的参数解:

2.2 单位权中误差评定

根据线性回归模型式 (7) , 当同时考虑自变量误差即采用总体最小二乘求取回归参数值时, 其单位权中误差的计算公式为:

根据上文的迭代解再结合式 (12) 可得:

则按本文的推导, 其单位权中误差计算公式为:

在计算线性回归单位权中误差时, 按常规的总体最小二乘解法算得的结果比按式 (19) 计算的结果要小, 这与实践是不不相符的。因为, 常规的总体最小二乘解法没有顾及线性回归模型中系数矩阵常数列。而本文推导的解法从理论上比常规总体最小二乘解法更严密, 究其原因, 是因为按常规总体最小二乘解法对线性回归模型的单位权中误差评定有误, 下面则具体进行讨论。

按常规总体最小二乘法将线性回归系数矩阵中的常数列也进行了改正并参与精度评定, 其改正后的模型可表示为:

其单位权中误差评定公式为:

从式 (22) 可以看出, 其将常数列的改正值看成是自变量的改正值, 这显然是不对的。从改正模型来看, 应该将常数列的改正值归入到因变量的改正值中, 则变量的改正值为:

按式 (24) 进行改正值修正后, 再按式 (19) 进行单位权中误差的评定。如此得到的结果才与线性回归模型相符。这也解释了前文提出的疑问, 同时也表明不能单一以单位权中误差来评定一种平差模型和算法的优劣。因为它们的单位权中误差评定方式不一定都相同。

3 算例分析

3.1 算例1

运用文献[6]例5~10的数据, 用三个点 (1, 2) 、 (2, 6) 、 (6, 1) 来拟合一元线性回归方程。运用本文的解法得到的参数估值为6、1。这与文献[5]中将数据中心化后再采用奇异值分解法得到的结果相同, 而按常规总体最小二乘的奇异值分解法和迭代解法得到的参数估值皆为6.74、0.99。这是因为总体最小二乘的常规解法将系数矩阵的常数列也进行了改正, 得到的结果有偏差。而本文的解法则将系数矩阵的常数列分离开不加改正, 计算得到的参数估值较之可靠。

3.2 算例2

为进一步验证本文方法对线性回归模型的统一性和可靠性, 运用MATLAB模拟一平面方程。设平面方程为:z=1.5+x+2y, 在x和y没有误差时求得z的值上加上均值为0, 方差为0.005的随机误差, 组成观测值。然后分别对x和y添加均值为0, 方差为0.03的随机误差, 组成新的观测值, 如表1所示。分别采用最小二乘法 (LS) 、常规总最小二乘法、本文解法解算线性回归方程的参数值, 并按文中所述的单位权中误差评定公式计算其单位权中误差, 结果如表2所示。

从表2中的参数估值结果不难看出, 采用本文的总体最小二乘解法解算的回归参数值与真值最为接近, 而常规的总体最小二乘解法由于将线性回归模型中的系数矩阵中的常数列也进行了改正导致其结果与真实值有偏差, 最小二乘法由于没有考虑到线性回归自变量的误差即系数矩阵元素的误差, 计算的结果与真值偏差最大。这也可以从其单位权中误差中得出, 本文的总体最小二乘解法所得单位权中误差最小, 常规总体最小二乘解法次之, 最小二乘法最小。需要指出的是, 如果按常规总体最小二乘的单位权中误差计算公式得到的单位权中误差为0.0227, 比本文方法得到的值要小, 这就会误以为按常规总体最小二乘解法解算线性回归参数得到的精度比本文要高。其实不然, 这是因为其针对线性回归模型的单位权中误差计算公式有误, 通过本文的纠正得出的值才符合其实际。这也可以通过参数的估值结果与真值的比较中看出。

4 结束语

本文给出了一种线性回归参数估计的总体最小二乘算法, 该算法即能同时考虑线性回归自变量的误差即平差模型系数矩阵元素的误差, 又能顾及线性回归中系数矩阵常数列即对常数项不加改正。这弥补了常规总体最小二乘解法针对线性回归模型解算的不足, 且对基于总体最小二乘的线性回归单位权中误差进行了探讨, 纠正了针对线性回归模型的常规总体最小二乘单位权中误差评定的偏颇。

摘要:根据线性回归模型的特点, 推导了一种解线性回归参数的总体最小二乘算法。并对其单位权中误差的评定进行了探讨, 通过理论推导表明按常规的总体最小二乘解法求得的线性回归单位权中误差与实际不符, 并对其进行了纠正。通过算例分析且与常规的总体最小二乘解法进行比较, 结果表明了算法的正确性和可靠性。

关键词:总体最小二乘,线性回归,平差模型,迭代解法,奇异值分解

参考文献

[1]GOLUB G H, VAN L C F.An Analysis of the Total Least Squares Problem[J].SIAM J Numer.Anal, 1980, 17:883~893.

[2]鲁铁定, 周世健.总体最小二乘的迭代解法[J].武汉大学学报 (信息科学版) , 2010, 35 (11) :1351~1354.

[3]孔建, 姚宜斌, 吴寒.整体最小二乘的迭代解法[J].武汉大学学报 (信息科学版) , 2010, 35 (6) :711~714.

[4]许超钤, 姚宜斌, 张豹等.基于整体最小二乘的参数估计新方法及精度评定[J].测绘通报, 2011, (10) :1~4.

[5]邱卫宁, 齐公玉, 田丰瑞.整体最小二乘求解线性模型的改进算法[J].武汉大学学报 (信息科学版) , 2010, 35 (6) 708~710.

[6]丁士俊, 姜卫平, 杨颜梅.整体最小二乘线性回归模型与算法[J].测绘通报, 2012, (12) :8~10.

[7]邱卫宁, 陶本藻, 姚宜斌等.测量数据处理理论与方法[M].武汉:武汉大学出版社, 2008.

[8]陈义, 陆珏, 郑波.总体最小二乘方法在空间后方交会中的应用[J].武汉大学学报 (信息科学版) , 2008, 33 (12) :1271~1274.

[9]陆珏, 陈义, 郑波.总体最小二乘方法在三维坐标转换中的应用[J].大地测量与地球动力学, 2008, 28 (5) :77~81.

非线性最小二乘曲线 篇6

变电站接地网对变电站的安全运行具有重要的意义,是电力运行部门十分关注的问题,近年来也成为学术界研究的一个热点[1,2,3,4,5,6]。接地网导体埋于地下,由于化学腐蚀等原因使接地导体产生锈蚀极大地改变接地网的参数,从而影响接地网的接地性能。大型变电站接地网覆盖面积大,接地导体网格的数量也较大,因此接地导体的腐蚀程度是不均匀的,这给运行部门的维护检修带来相当大的困难。为了节约地网改造的成本,需要对接地导体网格的腐蚀情况有准确的评价,为接地网的改造提供准确的信息。

目前对接地网腐蚀程度的评价主要是进行测试,并通过一定的模型和算法诊断各个接地网格导体的实际电阻,与接地网的设计值对比即可知道接地导体的腐蚀程度,并在此基础上制定接地网改造方案。其中文献[3]利用接地网的可及点电压值检测接地网故障的判据,应用网络撕裂法概念建立接地网区域故障的诊断方程。文献[4]提出了一种基于禁忌搜索算法的接地网故障诊断方法,采用轮换激励位置和每处激励多处测量的方法,使可及节点得到更充分利用,观测信息显著增加。

本文提出了一种基于灵敏度分析的线性二乘优化模型。根据电路理论,电路元件参数的变化会引起电路响应参数的变化,当元件参数的变化量很小时,可以把电路响应参数的变化量近似表示成元件参数的变化量及响应参数对各个元件参数灵敏度的线性关系,从而建立基于最小线性二乘优化的诊断方程。通过求解线性最小二乘优化问题就可以诊断出腐蚀接地网各个接地导体的实际电阻值。

2 故障诊断模型

设接地网的支路电阻为Ri(i=1,2,…,b,其中b为支路数),测试参数(或响应参数)为各个可及测试节点的电压Vx(x=1,2,…,N,其中N为接地网可及节点数),若在接电网的两个可及测试节点i,i′间施加激励(可以为电流激励也可为电压激励),但考虑节点i,i′到电源间的引线电阻可能造成的影响,选择电流源作为接地网的激励源。接地网的测试框图如图1所示。

在如图1所示的测试条件下,故障条件接地网测试节点x的节点电压为V′x,非故障条件(所有接地支路电阻值都为标称值)节点x的节点电压为Vx,故障条件及非故障条件下Vx的变化量为ΔVx=V′x-Vx,Vx对各个支路电阻的灵敏度为Sundefined=∂Vx/∂Ri(i=1,2,…,b)。故障条件下每个支路电阻值为R′i,标称值为Ri,故障条件及非故障条件下各支路电阻的变化量为ΔRi=R′i-Ri(i=1,2,…,b),根据以上介绍的灵敏度理论,ΔVx可以表示如下:

undefined

这样即可把电路可及节点的节点电压变化量ΔVx表示成关于元件参数变化量ΔRi=R′i-Ri(i=1,2,…,b)及灵敏度Sundefined=∂Vx/∂Ri(i=1,2,…,b)的线性关系。

在同样的激励条件下(激励位置和大小相同),可以选择α不同的测试节点,得到一组多个测试节点电压的变化量与元件参数变化量及灵敏度的线性关系:

undefined

一般接地网的支路电阻数较多,为了通过解式(2)对各个支路电阻值进行识别,需要建立较多的形如式(1)的线性等式。若在相同的激励条件下选择过多的测试节点,方程(2)的条件会变坏。因此为了改善方程组(2)的条件,应该选择不同的节点i,i′施加激励,而且在同一激励条件下测试不同节点的节点电压。

3 灵敏度算法

接地网为纯电阻网络,根据电路理论中的节电电压法,电路的节电电压Vn向量与电路导纳矩阵Yn及电路施加的电流激励Is向量之间的关系可以表示为:

undefined

令:B=Yundefined。

undefined

节点电压对支路导纳的灵敏度为:

undefined

再由Yn·Yundefined=1得:

undefined

根据灵敏度关系,节点k的节点电压Vnk对电阻Rij的灵敏度为:

undefined

4 线性最小二乘优化模型

方程组(2)可以表示成如下的矩阵形式:

undefined

其中:ΔR=[ΔR1,ΔR2,…,ΔRb]T,d=[ΔVx1,ΔVx2,…,ΔVxα]T,C为式(2)中的灵敏度系数矩阵。

线性最小二乘优化模型为:

undefined

式(9)的线性最小二乘优化模型可以使用Matlab中的工具箱直接求解。

5 实例仿真

本文提出的的模型和方法在如图2所示的实际接地网上进行了数值仿真,数值仿真的结果如表1所示。

从表1可以看出实际电阻的诊断值与设定的故障值相当接近,误差不超过7.5%,取得了较好的诊断结果。

6 结 语

本文在基本电路理论和灵敏度分析的基础上,提出了一种线性最小二乘优化模型。该方法充分利用可及节点所提供的信息,建立的模型可以反映节点电压变化量与接地网导体电阻变化量之间的关系,在此基础上建立了最小二乘优化模型。从仿真实例的结果可以看出该方法具有较高的故障诊断精度。

参考文献

[1]刘渝根,滕永禧,陈先禄,等.接地网腐蚀的诊断方法研究[J].高电压技术,2004,30(6):19-21.

[2]王新翠,彭敏放.基于对称复镜像法接地网接地电阻的算法[J].现代电子技术,2007,30(9):143-145.

[3]江修波.接地网故障诊断的一种新方法[J].福州大学学报:自然科学版,2005,33(6):749-752.

[4]程红丽,刘健,王森,等.基于禁忌搜索的接地网故障诊断[J].高电压技术,2007,33(5):139-142.

[5]刘渝根,吴立香,王硕.大中型接地网腐蚀优化诊断实用化分析[J].重庆大学学报:自然科学版,2008,31(4):417-420.

非线性最小二乘曲线 篇7

影响皮带秤称重系统精度要素之一就是张力, 利用张力补偿可以提高称重长期稳定性和精度。张力越准确, 称重就越精确。因此, 准确测得张力值十分重要。另外, 张力不稳定是由机械的不平衡与磨损和电机响应运转等方面造成的[1]。本文通过检测皮带垂度并对垂度数据进行算法处理, 从而对张力的不稳定因素进行补偿, 最终根据研究得到的垂度与张力数学模型来计算出张力。

本文先理论推导出张力随流量变化的数学模型, 其次, 通过离散垂度测量来建立垂度与流量的数据表, 利用最小二乘曲线拟合法对垂度与流量曲线拟合, 实现对数据的综合分析, 为研究物料流量与皮带垂度的关系提供科学的参考依据[2]。然后对拟合结果进行分析, 最终得到垂度、皮带倾角等参数的张力数学模型。

1 现场输送带载料模型分析

现场的输送带安装示意图如图1所示, 在具体研究中简化为图2所示模型。

其中, O1为托辊A, B之间输送带上的垂点, AB倾角为β1, 其中虚线是输送带传输方向, 实心直线为水平面, 根据实际测试, O1垂点对应的输送带挠度即垂度v<3%L。现取一小段输送带O1D分析, 建立xo1 y坐标系, 如图3所示。

取O1为坐标原点, 且以过O1点的切线为X轴, 与X轴垂直作Y轴, 其中, T1, TD分别为O1和D点处的张力, P为均布载荷;D点坐标为 (x, y) , 载荷重心坐标E (xe, ye) , 因输送带挠度较小, 曲线O1D近似等于x。因此, O1D上负荷可视为x P, 且, 同时, 根据条件可知。使用平衡条件可得:

式中, MD为关于D点的力矩, P为皮带及物料的质量分布简称流量, β1地面与水平面间的夹角。经整理得: (2)

又已知O1为AB垂点, 且为中间, 因此可得x=L/2, 代入上式得:

式中, L为两托辊间的距离。其中, L与β1均为已知量。当P与y两个变量检测出来, 对应O1点的张力也就随之求出。

2 基于最小二乘法的垂度-流量曲线拟合

2.1 最小二乘法曲线拟合原理

假设流量fi与垂度xi, 其中i=0, 1, 2, …, n。拟合关系为n次多项式, 函数为, 其中a0, a1, …, an为下面方程组的解:

如果方程组中的系数矩阵为非奇异, 则最优解唯一, 这里, 是Rm+1上向量的加权内积, 即, , 通过该方程使用Matlab软件求解出系数a0, a1, …, an, 就可以解得n次多项式[3]。

由于皮带传输物料的重量不均匀, 只有通过垂度值来反推出流量, 从而进一步估算载物的重量, 辅助称重系统判定称重单元计算结果的正确性与故障源。因此, 研究物料流量固定, 通过大量数据采样得到垂度值, 经均值数据处理, 得到一组垂度与流量的数据, 重复该方法获取多组不同流量下检测到的垂度值, 来准确反映流量与垂度的关系。

2.2 流量与垂度实验

实验条件:1) 标定初始值104mm;2) 输送带预紧力为840kg;3) 皮带宽为1.2m;4) 料斗下料给定值设为100t/h。

本实验通过改变电机驱动输送带运转的频率来改变落在输送带的物料重量即流量, 并检测获取相应的垂度, 得到表1所示的9组流量范围在14.62~46.3kg/m内的垂度与流量的关系数据。

2.3 垂度-流量特性研究

根据表1数据采用Matlab对拟合模型y=a0x0+a1x+…+anxn进行多项式拟合, 由最小二乘法确定多项式的系数a0, a1, …, an, 通过拟合发现高于5次多项式曲线就会严重失真, 因此只考虑5次以内拟合曲线, 通过Matlab计算获得各多项式曲线对应的残差如表2所示。

由表2可以观察到5次多项式拟合曲线残差为0.80778, 拟合效果最好, 其拟合曲线如图4所示。

由图可以观察出数据与曲线拟合度非常好, 因此选取5次多项式拟合曲线为最优拟合曲线, 其5次多项式空间为, 且曲线方程[4]如下:

另外, 根据皮带本身性能和受力情况分析可以设想曲线y=f (x) 是双曲型, 它与实际数据规律大致符合, 可以通过变量代换, 化为线性参数的数学模型。拟合数据。其中 (i=1, 2, …, 9) 。其中ti, zi分别由原始数据xi, yi据变量代换公式计算出来, 转换后的数据表如表3所示。

根据最小二乘法曲线拟合基本原理, 并且简化求解方程组得

将以上计算值代入简化方程组得如下方程组:

计算得a1=0.33822, a0=-0.0078494从而拟合曲线为

3 最小二乘法曲线拟合结果分析

3.1 拟合模型误差比较

根据实测垂度数据, 分别利用5次和双曲型拟合曲线计算出输送带上的物料流量, 进而计算出理论流量与计算流量之间的绝对误差, 误差平方[5]。具体计算结果如表4所示。

由表4算得5次与双曲型拟合曲线误差平方总和分别为0.6683, 1.2104。5次多项式拟合曲线误差平方更小, 拟合效果更好。

由上表分析研究选择5次多项式拟合曲线作为最优曲线拟合结果, 其函数如下:

3.2 张力数学模型

根据5次多项式拟合曲线测得的流量值, 将其带入张力公式 (其中β1=6°, L=1.2m) , 张力公式简化为, P=y+10 (其中y为检测流量, 10为皮带重量为一常量其单位为kg/m) 。再将垂度数据代入上式就可算得张力值, 如表5所示。

从表5中可以观察到垂度为4.5~10.3mm范围内张力随着垂度变大而减小, 张力的极小值产生于垂度为10.3mm~11.5mm之间, 张力自极小值之后会随着垂度的增加而增加, 由以上规律可判定张力与皮带性能有很紧密的关系, 可以在以后的实验中作进一步研究。最终形成的张力与垂度的数学模型为:

若将参数β1, L代入公式则可以转化为

式中a为皮带重量分布 (kg/m) ;x为测得的垂度值 (mm) ;T 1为张力 (kg) ;β1为皮带与水平地面之间的夹角;L为两托辊之间的距离 (m) 。

由公式 (7) 可以根据检测到的垂度推算出张力。

4 结论

1) 通过实验获取了流量与垂度关系的对应数据;利用最小二乘曲线拟合法研究垂度与流量的实验数据, 得到垂度与流量关系的拟合曲线;通过实验验证分析得出5次多项式拟合曲线为最优垂度与流量拟合曲线。2) 根据最优垂度与流量拟合曲线及张力与流量数学关系建立了皮带张力与垂度的数学模型。

参考文献

[1]李南, 刘秋楠.有关高速传带设备张力控制的应用研究[J].制造业自动化, 2010.2, 32 (2) :132-133.

[2]谢先伟.最小二乘法在煤矿钻机测试中的应用研究[J].制造业自动化, 2011.5, 33 (9) :59-60.

[3]徐跃良.数值分析.成都:西南交通大学出版社, 2005, 08:59-60.

[4]吕喜明, 李明远.最小二乘曲线拟合的MATLAB实现[J].内蒙古民族大学学报 (自然科学版) , 2009.3, 24 (2) :126-127.

非线性最小二乘曲线 篇8

如何找到更符合实际情况的数据拟合, 一方面要根据专业知识和经验来确定经验曲线的近似公式, 另一方面要根据散点图的分布形状及特点来选择适当的曲线拟合这些数据.

例1在某化学反应里, 测得生成物浓度y (%) 与时间t (min) 的数据见下表, 试用最小二乘法建立x与y之间的经验公式.

解将已知数据点 (ti, yi) (i=1, 2, …, 16) 描绘在坐标纸上 (图略) , 观察可知拟合曲线y=φ (t) 应具有如下特点:

(1) 曲线随着t的增加而上升, 但上升速度由快到慢.

(2) 当t=0时, 反应尚未开始, 即y=0;当t→∞时, y趋于某一常数, 故曲线通过原点且有一水平渐近线.

具有上述特点的曲线很多, 选用不同的数学模型, 可以获得不同的拟合曲线和经验公式.

把这两个经验公式进行比较:

从均方误差和最大偏差两个不同的角度看, 后者优于前者.因此在解决实际问题时, 常常要经过反复分析, 多次选择、计算和比较, 才能获得较好的数学模型.

最小二乘法的应用很广, 下面我们利用最小二乘法来解决一个实际问题.

例2用电压U=10伏的电池给电容器充电, 电容器上t时刻的电压为, 其中U0是电容器的初始电压, τ是充电常数, 试由下面一组数据确定U0和τ.

解电容器上t时刻的电压为:U (t) =U- (U-U0) ·

式变为y=a+bx, 求解得a=1.4912, b=-0.2857, 进而求得V0=5.5577, τ=3.5002.

上一篇:幼儿自主游戏论文下一篇:南京城市