曲线拟合方法

2024-10-15

曲线拟合方法(精选7篇)

曲线拟合方法 篇1

摘要:在现代图形造型技术中,曲线拟合是一个重要的部分,是曲面拟合的基础。现着重对最小二乘法、移动最小二乘法、NURBS三次曲线拟合法和基于RBF曲线拟合法进行比较,分析拟合方法的适用场合,从而为图形造型中曲线拟合的方法选用作出更好的选择。

关键词:离散点,曲线,拟合

0 引言

随着科技的不断进步,产品造型越来越复杂,因而对于造型的方法也提出了更高的要求。由于经常要处理数据点,并对数据点进行拟合,因此曲线拟合就成了处理离散点成线的一种常用的手段。曲线拟合的方法有很多种,各有各的优势。本文将对常用的几种曲线拟合方法(最小二乘法、移动最小二乘法、NURBS三次曲线拟合和基于RBF曲线拟合)进行论述,分析拟合方法的适用场合,以便在针对具体情况时可以采用相应的拟合方法。

1 拟合方法论述

1.1 最小二乘法

最小二乘法通过最小化误差的平方和寻找数据的最佳函数匹配,是进行曲线拟合的一种早期使用的方法。一般最小二乘法的拟合函数是一元二次,可一元多次,也可多元多次。该方法是通过求出数据点到拟合函数的距离和最小的拟合函数进行拟合的方法。令f(x)=ax2+bx+c,计算数据点到该函数所表示的曲线的距离和最小。即:

对(1)式求导,使其等于0,则可以求出f(x)的系数a、b、c,从而求解出拟合函数。

1.2 移动最小二乘法

移动最小二乘法在最小二乘法的基础上进行了较大的改进,通过引入紧支概念(即影响区域,数据点一定范围内的节点对该点的拟合函数值有影响),选取适合的权函数,算出拟合函数来替代最小二乘法中的拟合函数。从而有更高的拟合精度及更好的拟合光滑度。

1.2.1 移动最小二乘法的拟合函数

设拟合函数为f(x)在求解域Ω内的n个节点Pi(i=1、2、3、……、n),则:

式中,α(x)为待求系数;K(x)为线性基函数。一般令K(x)=[1,x,y]T,m=3;求解过程可以参照文献[1],从而可求α(x),得到f(x)。

1.2.2 移动最小二乘法的算法流程

(1)将区域进行分段。(2)对每个分段点进行循环:1)确定网格点的影响区域大小;2)确定包含在网格点的影响区域内的节点;3)计算型函数;4)计算网格点的节点值。(3)连接网格点形成拟合曲线。

1.3 NURBS三次曲线拟合

NURBS作为定义工业产品几何形状的唯一数学方法,是现代图形学的基础,因此NURBS曲线拟合有着重要的实际意义。NURBS曲线的数学模型和数学方法可以参考文献[2]。本文采用VC技术[3,4],利用Open GL的NURBS曲线拟合函数,即可得到NURBS曲线。

1.4 基于RBF的曲线拟合

RBF(Radial Basis Function),径向神经网络是以径向基函数(RBF)作为隐单元的“基”,构成隐含层空间,隐含层对输入矢量进行变换将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。这是一种数学分析方法,具有较快的收敛速度、强大的抗噪和修复能力。RBF神经网络结构图如图1所示。

各算法流程如下:

最小二乘法通过建立二次函数进行拟合。建立拟合函数f(x)=ax2+bx+c,求所有数据点与二次曲线的距离和最小的二次曲线,得到a、b、c,从而得到二次曲线图像。

移动最小二乘法的流程是:

(1)NURBS曲线拟合:确定节点矢量,本文通过弦长累加来确定节点矢量。在NURBS曲线拟合时,设置最前4个节点矢量的值相同和最后4个节点矢量的值相同,那么拟合的曲线将通过给定型值点的第一个点和最后一个点。由于Open GL有现成的NURBS曲线拟合函数,因此本文将借助VC进行编程,实现NURBS三次曲线拟合。

(2)基于RBF曲线拟合流程:本文将采用高斯函数作为RBF函数的核函数[5]。1)采用K-均值法,确定聚类中心;2)按聚类中心分组;3)计算样本均值;4)重复2)、3),直到聚类中心不再变化;5)确定半径;6)调节输出层权。

2 实例验证

为了比较上述4种方法的优劣,本文采用1组数据,用4种方法进行拟合,然后比较拟合的情况,从而进行判断。如果型值点经比较后,在型值点变化微小的情况下,拟合的曲线将趋于平稳,就难以分出其优劣,因此在给定数据的时候(表1),特地给出一个奇异点(第3个点)。通过对该表的数据点进行4种拟合方法来比较各种方法的优劣。

采用不同的拟合方法对数据点进行拟合,得到的拟合曲线如图2所示。

3 结语

通过上述4个拟合的曲线可以得出:最小二乘法的精度最差。使用RBF进行曲线拟合的精度最高,但不易用数学表达方式去表达,而NURBS曲线易用数学表达。能用数学方式去表达RBF拟合的曲线,将使RBF拟合方法更具发展空间。

参考文献

[1]曾清红,卢德唐.基于移动最小二乘法的曲线曲面拟合.工程图学学报,2004(1):84~88

[2]朱心雄.自由曲线曲面造型设计.北京:科学出版社,2008

[3]吕希奎,周小平.实战OpenGL三维可视化系统开发与源码精解.北京:电子工业出版社,2009

[4]钱能.C++程序设计教程.北京:清华大学出版社,2005

[5]张丽艳,王宏涛,李忠文.基于RBF神经网络的三角网格曲面孔洞修补.中国机械工程,2005,16(23):2 072~2 079

曲线拟合的两个几何方法 篇2

根据已知点,通过拟合的方法,还原曲线或曲面是测绘学、计量学、图像处理等许多领域都会遇到的问题。曲线拟合一般以找到拟合函数或通过插值形成光滑曲线和曲面为目的。许多拟合方法都是根据某一类对象的特征、按照某一原则提出的,如文献[1]根据圆曲线拟合特点、按正交距离残差平方和极小的准则提出正交距离圆曲线拟合方法;文献[2]根据最小二乘法的不足,按间接平差原理提出正交多项式曲线拟合法;文献[3]根据数据与曲线的距离的估计值提出改进的拟合方法,文献[4]中通过实验指出,不同的拟合函数的拟合效果有较大的差异,而且所取函数与原函数越相近,效果越好。文献[5]考虑了样本分布和容量提出一种针对复杂信号源的曲线拟合方法,文献[6]针对机械加工对象的不连续性提出了在线NURBS法。

针对信号源未知或对象特性不连续的情况,本文将分别从倾斜角和面积的角度提出两种曲线拟合方法,之后验证二位曲线的拟合精度并展示三位曲面的拟合效果。

1 从倾斜角的角度提出曲线拟合

A1、 A2、 A3为原始点,其坐标分别为(xi,yi), i=1,2,3。 过A2作∠A1A2A3的平分线,交A1A3于E。 分别过A1、 A2、 A3作A2E的垂线A1B1、 D1D2、 A3C1, 并分别交A2EB1、 A2、 C1; 延长B1A2至B2并使B1A2=A2B2, 延长C1A2至C2并使C1A2=A2C2; 作∠B2D1A2和∠C2D2A2的角平分线,分别交A2EE1、 E2点。分别连接A1B2和A3C2, 分别交于D1、 D2。 设D1、 D2的坐标分别为(xD1,yD1)、 (xD2,yD2)。

一个已知点可看作它分别与之相邻两点连线的交点,所以可以定义原函数该点切线倾斜角为它分别与之相邻两点连线夹角的角平分线的倾斜角。此外,如图1,原函数A1、 A2间必存在一点P1, 使该点处切线倾斜角等于A1A2的倾斜角,假设该点位于A1A2中点附近。同理,假设D1A1中点附近存在一点P1使该点处切线倾斜角等于D1A1的倾斜角,D2A3中点附近存在一点P2使该点处切线倾斜角等于D2A3的倾斜角。

设代表X点处的倾斜角为θ(X), 则有,

θ(D1)-θ(Ρ1)=-B2D1E1(1)θ(A2)-θ(D1)=-E1D1D2(2)θ(D2)-θ(A2)=-E2D2D1(3)θ(Ρ2)-θ(D2)=-C2D2E2(4)

由于∠A1A2E=∠EA2A3,

则直角三角形ΔA2A1B1≈ΔA2A3C1;

由于B2B1C2C1=A2B1A2C1=A1B1A3C1,

则有ΔB2A1B1≈ΔC2A3C1,

所以∠B2D1D2=∠C2D2D1;

又由于E1D1和E2D2为角平分线,

则有,

B2D1E1=∠E1D1D2=

E2D2D1=∠C2D2E2。 (5)

由式(1)~式(4)和式(5)即实现了从P1→D1→A2→D2→P2的所在点处切线倾斜角的平滑过渡。下面将推导插入点的差值公式。

由于ΔA2A1B1≈ΔA2A3C1,

A2A1A2A3=A1B1A3C1;

由于A1B1A3C1=A1EA3EA1B1A3C1=D1A2D2A2,

A2A1A2A3=A1EA3E=D1A2D2A2

A1A2=lA2A3=m。 由于,

A2A1A2A3=A1EA3E, 可有,

xE=x1+ll+m(x3-x1)(6)yE=y1+ll+m(y3-y1)(7)

A1B1A2E=0A2B1×A2E=0, 可得,

xB1=(x2-xE)2x1+(y2-yE)2x2-(y2-yE)(x2-xE)(y2-y1)(x2-xE)2+(y2-yE)2(8)yB1=(y2-yE)2y1+(x2-xE)2y2+(y2-yE)(x2-xE)(x1-x2)(x2-xE)2+(y2-yE)2(9)

当(x2-xE)2+(y2-yE)2≠0时,

xB2=2x2-xB1, yB2=2y2-yB1, 从而可得,

xD1=(x1+xB2)/2(10)yD1=(y1+yB2)/2(11)

A2A1A2A3=D1A2D2A2,

xD2=x2+ml(x2-xD1)(12)yD2=y2+ml(y2-yD1)(13)

当(x2-xE)2+(y2-yE)2=0,

xD1=14x1+x2-14x3(14)yD1=14y1+y2-14y3(15)

xD2=-14x1+x2+14x3(16)yD2=-14y1+y2+14y3(17)

以上为进行一次迭代的算法推导,提出了一种可实现倾斜角平滑过渡的拟合方法。虽然具有数学意义明确的优点,但插值算法较为繁琐且缺乏灵活性。下面将从面积的角度提出插值算法更为简洁和灵活的拟合方法。

2 从面积的角度提出曲线拟合

A1、 A2、 A3为原始点,其坐标分别为(xi,yi), i=1,2,3。 设ΔA1A2A3的面积为S, 易见A2点处的二阶导数,

y(A2)=y2-y1x2-x1-y3-y2x3-x2x3-x1=(y2+y1)(x2-x1)+(y3+y2)(x3-x2)×-(y3+y1)(x3-x1)(x2-x1)(x3-x2)(x3-x1)=2S(x2-x1)(x3-x2)(x3-x1)

定义:已知A1、 A2、 A3点的坐标,则A2点处的二阶导数与ΔA1A2A3的面积S的关系为,

y(A2)=2S2(x2-x1)(x3-x2)(x3-x1)(18)

2.1推导插入点二阶导数与原有点二阶导数的关系

A1A3上任意一点B, 连接A2B; 过B点分别作A2A3和A1A2的平行线,分别交A1A2和A2A3于D点和C点;过A2作A1A3的平行线EF, 过A1作A2A3的平行线A1E, 过A3作A1A2的平行线;分别过A1、 DC点做A2B的平行线,分别交EFB1、 B2、 B3 点;分别过EB1、 B2作A1A2的垂线,分别交A1A2于D3、 D1、 B2。 设B2、 B3的坐标分别为(xB2,yB2)、 (xB3,yB3)。

由图2可见,由于有一条公共边A1A2, ΔA1B2A2的面积S1与ΔA1A2A3的面积S之比为该边对应的高的比,而ΔA1A2A3的高等于ED3。 所以,

S1S=B2D2ED3(19)

由于,

B2D2ED3=A2B2A2E=B2A2B1A2B1A2A1A3=A2DA2A1A1BA1A3=A1BA1A3BA3A1A3=(xB-x1)(x3-xB)(x3-x1)(x3-x1)

所以,S1S=(xB-x1)(x3-xB)(x3-x1)(x3-x1)。 (20)

同理可得,ΔA1B2A2的面积S2与ΔA1A2A3的面积S之比为,S2S=(xB-x1)(x3-xB)(x3-x1)(x3-x1)。 (21)

由式(18)和式(20)知,

S1=(xB-x1)(x3-xB)(x3-x1)(x3-x1)S;

(x2-x1)(x3-x2)=y(A2)(xB-x1)(x3-xB)2(x3-x1);

(x2-x1)(x3-x2)=y(A2)(xB-x1)A2D2A1A2;

(x2-x1)(x3-x2)=y(A2)(xB-x1)(x2-xB2)2(x2-xB1)

整理后可得,

y(B2)=2S1(xB2-x1)(x2-xB2)(x2-x1)=x3-x2xB2-x1y(A2)(22)

同理可得,y(B3)=x2-x1x3-xB3y(A2)(23)

2.2 求B2、B3点的坐标

y1-yBy1-y3=xB-x1x3-x1得,

yB=y1-xB-x1x3-x1(y1-y3)(24)

易知,

xB1=x1+x2-xB (25)

yB1=y1+y2-yB (26)

xB4=x2+x3-xB (27)

yB4=y2+y3-yB (28)

xB2-xB1x2-xB1=B2B1A2B1=DA1A2A1=BA1A3A1=xB-x1x3-x1

可得,

xB2=x2-x3-xBx3-x1(xB-x1)(29)yB2=y2+x3-xBx3-x1(y1-yB)(30)

同理可得,

xB3=x2+xB-x1x3-x1(x3-xB)(31)yB3=y2-x3-xBx3-x1(y1-yB)(32)

实际上,A2为B2B3的中点。

2.3 求B2、 B3点处的二阶导数

由式(22)可知,y(B2)=x3-x2xB2-x1y(A2), 则有,

y(B2)=x3-x2xB2-x1y(A2)=x3-x2(xB2-xB1)+(x2-xB)y(A2)(x3-x2)y(A2)(xB2-xB1)(x2-xB1)x2-xB1+x2-xB

又知,xB2-xB1x2-xB1=A1DA1A2=A1BA1A3=xB-x1x3-x1,

所以,

y(B2)=(x3-x2)y(A2)(xB-x1)(xB-x1)x3-x1+x2-xB=(x3-x2)(x3-x1)y(A2)(xB-x1)2+(x3-x1)(x2-xB)(33)

同理可有,

y(B3)=(x2-x1)(x3-x1)y(A2)(x3-xB)2+(x3-x1)(x2-xB)(34)

当取xB=x2时,可化简为,

y(B2)=(x3-x2)(x3-x1)y(A2)(x2-x1)2=BA3A1A3A1B2(35)y(B3)=(x2-x1)(x3-x1)y(A2)(x3-x2)2=A1BA1A3BA32(36)

实际上,一般在A1A3不变,转折点A2沿A2A1靠近A1远离A3时,A1A2间斜率变化变大,A2A3间斜率变化变小,对于距离A2相等的两点B2、 B3, 会导致B2点处二阶导数变大,B3点处二阶导数变小,反之亦成立。而由(33)和(34)可知,不考虑B点位置选取问题时,当转折点A2越靠近A1远离A3时,(x3-x2)变大,(xB-x1)2+(x3-x1)(x2-xB)=(xB-x1)2+(x3-x1)[(x2-x1)-(xB-x1)]变小使B2点处二阶导数变大,同理(x2-x1)变小,(x3-xB)2+(x3-x1)(x2-xB)变大使B3点处二阶导数变小,反之亦成立。这与和所表述的情况相同,说明该拟合方法与该事实较为相符;A1、 A2、 A3点不变,可以通过改变xB改变插入点B2、 B3处的二阶导数。应用时可根据误差调整xB以调整插入点处的二阶导数等信息,实现最优拟合。

由于插值算法式(29)~式(32)中含有xB-x1x3-x1x3-xBx3-x1, 为避免除法可选取,xB=x1+k(x3-x1)。 特别的,取BA1A3中点时可得B2、 B3点坐标分别为,

xB2=14x1+x2-14x3(37)yB2=14y1+y2-14y3(38)xB3=-14x1+x2+14x3(39)yB3=-14y1+y2+14y3(40)

可以极大地简化计算复杂度。

3 试验和分析

为验证拟合算法的有效性将取复杂信号作为信号源。设信号为幅值和周期变化的正弦信号,取,

y=(1+sin10t){sin[20(1+sint)]}。

由图3可知,当采样点数为25时,上面提出的面积曲线拟合简化方法与三次样条曲线都有着较高的拟合精度;但随着采样点数的变化,三次样条曲线的精度发生较大波动,这说明这种方法对模型有较大依赖,而本文的方法具有一定的适应性。除拟合曲线外,本文方法还可对三位形状进行拟合。如图4为对环状体表面的拟合,迭代次数为4。

4 结论

针对信号源未知或对象特性不连续的情况,分别从倾斜角和面积的角度提出两种曲线拟合的几何方法,并分别分析了两种情况下插入点与原数据点间倾斜角和二阶导数的关系,推导了插值算法计算式和简化式。

对于从倾斜角角度提出的拟合方法,可以实现原数据点与插入点处顺序的切线倾斜角光滑过渡;对于从面积角度提出的拟合方法,由于设计中有一个可支配参量xBk, 可以通过进一步设计实现自适应拟合以实现最优化。

在实验中应用了简化公式进行了曲线拟合,通过实验证明,与三次样条曲线法相比,该算法具有一定适应性。

摘要:针对信号源未知或对象特性不连续的情况,将分别从倾斜角和面积的角度提出两种不依赖对象的曲线拟合的几何方法,并分别分析了两种情况下插入点与原数据点间倾斜角和二阶导数的关系,推导了插值算法计算式和简化式,之后验证二位曲线的拟合精度并展示了三位曲面的拟合效果。

关键词:曲线拟合,倾斜角,面积,插值算法

参考文献

[1]丁克良,刘全利,陈翔.正交距离圆曲线拟合方法.测绘科学,2008;33:72—74

[2]朱晓东,鲁铁定,陈西江.正交多项式曲线拟合.东华理工大学学报,2010;33(4):398—400

[3] Mizuta M.Algebraic curve fitting for multidimensional data with exactsquares distance.IEEE Transaction Systems,Man and Cybernetics,1996;1:516—520

[4]徐进军,张洪波.曲线拟合中的几个问题.四川测绘,1997;20(3):117—118

[5] Sun Rui,Huang Hongzhong,Yang Jianping,et al.Curve fitting withweight assignment under evidence theory combination rule.Quality,Reliability,Risk,Maintenance,and Safety Engineering(ICQR2MSE).2011 International Conference on.vol.no,2011:929—934

三次曲线拟合的一种简便方法 篇3

数控加工中,经常会遇到非圆曲线的加工问题。非圆曲线通常给出一系列的坐标点加以表达,这就需要对列表曲线加以拟合。拟合的方法很多,较为常用的一种方法是使用CAD, Pro/E软件,根据已知坐标点绘制成样条曲线,这样做虽然直观,但曲线在何处取得极值、何处存在拐点、最小曲率半径是多少等等,均不得而知,更不能剔除坏点(破坏曲线趋势的实测点称为坏点)。难以保证加工的精度。因而人们更乐于使用某个函数的曲线来拟合,通常是用三次曲线拟合(拟合精度高、二阶导数连续,效果明显优于圆弧拟合)。然而确定三次方程的各项系数又成了劳神费力的事情。这里介绍一种较为简便的方法,此法既不用人工解方程,也不用编程序,而是利用了极其常见的一个软件——Excel。

1 方法应用介绍

下面结合一个实例,详细叙述这种方法。实测的原始数据列于表1。

a) 初步分析数据,剔除坏点:测量中的误差、数据传抄和打字中的失误都会产生坏点。如果加工者不能剔除坏点,显然无法加工出合格的零件。有的坏点显而易见,如表1第5个点,y值明显多了一个负号,这样的点可以直接予以剔除。有的坏点比较隐蔽,需要我们通过数据分析加以剔除。

打开Excel,第1行用作表头,在前两列里输入原始数据,如表2。然后在C3格内打入“=(B3-B2)/(A3-A2)”,按回车键确认后,再把鼠标点在C3格内,把本格右下角的填充柄往下拉,拉到C25格时放开鼠标,这一列数据可以看作是列表曲线的一阶导数。再在D4格内打入“=(C4-C3)/(A4-A3)”,确认后按住填充柄向下拉至D25格内,这一列数据可以看作是二阶导数。看D列内

表2 原始数据表

是否有某个数据明显与临近的数据不同号,如果有则说明是坏点。本例(-9.18,9.9)点致使11和12两行导数明显背离趋势。应视为坏点加以剔除。重复前一步计算过程,发现点(5.0155,9.19)仍不符合要求,加以剔除。剔除坏点之后的数据列表如表3,列表中数据符合曲线趋

势,均可用于拟合。

表3 剔除坏点之后的数据

b) 选定三次曲线通过的4个点,列出增广矩阵:设三次曲线为y=ax3+bx2+cx+d。在靠近两端处选两个点,中间再选两个点。本例选第4, 9, 16, 22点。把这4个点的x值复制到K1~K4格中,y值复制到M1~M4格中,见表4。

表4 x, y值复制表

在J1格中打入“=K1^2”,在I1格中打入“=K1^3”,选中这两格,把填充柄往下拉至第4行,则在J列中出现的数是K列中对应数的平方,I列中的数是其立方。在L1格里打入1,往下拉至L4格,则出现4个1。从I1到M4这20个数所组成的矩阵是由选定的4个点所确定的一个增广矩阵。

c) 列出能够用来找出系数的4个行列式:选中I1~L4这16个数,在下面复制4次。如表4,分别复制到了I6~L9, I11~L14, I16~L19, I21~L24这4个矩形块中。然后把鼠标点在J16格内,编辑栏里出现“=K16^2”,改为“=J1”,确认后把填充柄往左拉一格,紧接着(使I16, J16处于选中状态)再往下拉到这个小矩形块的底部(第19行)。表中数值虽没有变化,但这一步不能省去。

选中M1到M4这4个数,分别把它复制到下面4个小矩形块的第一至第四列,如表4,这些小矩形块就是需要的行列式。

d) 计算行列式的值:把鼠标点在H4格内,输入“=MDETERM(I1:L4)”,确认后,格内出现的数(4.8334E+12)就是I1~L4这个行列式的值。用鼠标右击此格,选“复制”,再右击H9单元格,选“粘贴”,则I6~L9这个行列式的值出现在格里。照此再分别在H14, H19和H24格内各粘贴一次,以计算出每个行列式的值。

e) 求出各项系数:在F26格内打入“=H9/H4”,此值是3次项系数。在H26格内打入“=H14/H4”,在J26格内打入“=H19/H4”,在L26格内打入“=H24/H4”(选定在哪一单元格中输入数字不受限定)。这3个数分别是2次项系数、1次项系数、常数项。为了直观起见,可以像表4那样将3次解析式表示完整。拟合的方程如下:

y=2.15731×10-6x3-0.000316396x2-0.05183x+9.673354

f) 计算拟合误差,检验拟合精度:为了验证拟合的优度,还需要计算出误差程度。把鼠标点在E2格内,在编辑栏中打入“=F$26×A2^3+H$26×A2^2+J$26×A2+L$26”确认,格内计算出第一个点的y的理论值y1′。把填充柄向下拖至E24格,则这一列y′值全部计算出来。再把鼠标点在F2格内,在编辑栏中打入“=E2-B2”,确认后同样把填充柄向下拖至F24格,则y值的误差计算出来。

误差计算结果符合厂家所提要求。拟合结果达到预期效果。

2 结语

曲线拟合方法 篇4

负荷曲线按时间分有日负荷曲线、月(或年)负荷曲线,是表示电力负荷随时间不断变化的特性曲线。从负荷曲线中可以获得用户用电的特征指标,例如负荷率、峰谷差率等,进而描述用户的负荷特性。对于电网来说,了解用户的负荷特性,可以研究调峰措施、调整负荷及规划电源等。然而由于同行业用户的分布具有分散性,较难实际获得行业日用电曲线。

目前的研究多采用模糊C均值聚类法进行负荷分类与综合[1,2,3],然而该方法计算量大,对专业知识要求高,不适合技术人员实际应用。随着全网负荷控制装置的大面积覆盖,我们更关注如何在满足精度要求的基础上方便技术人员操作,从数量巨大的用户日负荷曲线中,拟合出反映各用电行业负荷构成特性的行业日负荷曲线[4]。本文采用数学方法对行业负荷曲线进行拟合,首先采用组合抽样法进行典型用户筛选,然后从统计学原理出发,依据样本到总体的思路,通过求出的各行业负荷扩大系数实现行业负荷曲线的拟合,并用负控系统采集的实际用户日负荷曲线进行应用检验。

1 整体思路与实现方法

1.1 整体思路

从用户日负荷曲线中进行行业日负荷曲线拟合的思路为:将从负控系统获得的众多用户日负荷曲线,按照行业对其进行分类,并从每个行业中选取若干典型用户,然后按照统计学中从样本到总体的思路,抽取行业典型用户并拟合出对应行业的日负荷曲线。

整体思路如图1所示。

1.2 抽样方法

抽样(即选择典型用户)是决定最终拟合出的行业日负荷曲线是否能反映事实的关键步骤。一般抽样技术分为随机抽样技术和非随机抽样技术2类:随机抽样技术包含简单随机抽样、分层随机抽样、等距离随机抽样、分群随机抽样等;非随机抽样技术包含任意抽样、判断抽样和配额抽样等[5,6,7]。

根据陕西省电网的实际情况,并考虑到实际应用方便,采用随机抽样和非随机抽样相结合的方式:首先结合分群和分层2种随机抽样技术,对所有客户按行业分群,然后根据用电量或设备容量等参数将用户划分为大用户和中小用户;最后采用判断抽样,依据技术人员的经验和专家意见进行样本(典型用户)的选择。

1.3 行业负荷曲线拟合方法描述

应用统计学中从样本到总体的思路,取抽样典型用户的用电量与行业总用电量的比值作为样本到总体的扩大系数,进一步根据典型用户日负荷曲线拟合出地区各典型行业的日负荷曲线:

(1)对某一行业中各企业的第j点的样本进行汇总,得到该行业的在第j时点的样本负荷:

式中:i表行业;k代表企业;j代表24时点;s代表季节;y代表年份;pi,k,j,s,y代表在第y年的s季第i业的第k企业典型日负荷曲线中第j点的负荷;tpi,j,s,y代表第i行业在第y年第s季的第j时点的样本负荷。

(2)计算某个行业下所有用户典型日用电量占各选取行业日用电量的比值,作为该行业的扩大系数:

式中:ei,y代表在第y年第i行业的样本平均日用电量;Ei,j代表在第y年第i行业的平均日用电量;βi,y代表在第y年第i行业的扩大系数。ei,y及Ei,y均通过省调数据获得。

(3)某行业第j时点的典型负荷为:

(4)将由以上3步获得24个时点的各典型负荷Pij,s,y,分别与24个时点对应即可得到某行业的负荷拟合曲线。

2 应用实例分析

2.1 数据来源

为检验本文方法的有效性,选取陕西省1 1个典型行业进行行业负荷曲线拟合,并以石化、高科技以及大型商场这3种典型行业为例进行行业负荷曲线拟合。为保证样本数据能反应总体情况,依据前文所述抽样方法从每个行业中依据专家意见判断抽样至少5个典型用户(大用户),从负控系统选取上述用户2012年7月30日(夏季最大负荷)的24个时点日负荷曲线数据作为原始数据样本。

2.2 陕西省负荷简介

2012年陕西省全社会用电量为9.215 646×1010 kWh。各产业和城乡居民用电量统计如图2所示。

由图2可以看出,陕西省用电量主要集中在第二、三产业和居民用电量上,居民(尤其是城镇居民)用电量占比为15%,与第三产业相当。

陕西省2012年9月至2013年8月的负荷曲线(最大、最小用电负荷及峰谷差)如图3所示。

由图3可知,陕西省的年负荷曲线呈双峰形状,2个高峰分别对应着冬季高峰和夏季高峰,负荷水平也较为接近。

2013年8月16日下午4点30分,全省年最大负荷达夏季最高值15 661 MW,该日负荷曲线如图4所示。

从该日负荷曲线的起伏趋势分析,陕西省夏季高温期间负荷受到制冷空调负荷的影响,呈现出明显的白天高峰负荷拉平的现象。一天中22:00至8:00为负荷的低谷,9:00后受工厂生产、特别是办公空调和工厂降温负荷的影响,负荷急剧上升并在11:00左右形成早峰;此后负荷高峰一直持续至下午17:00下班时刻,随着大型设备、空调等设备的陆续关闭,负荷呈现下降趋势。晚间,随着居民降温负荷的急剧上升,在20:00左右形成了负荷的晚高峰,晚高峰的负荷主要由空调负荷和居民晚间照明负荷组成,并与部分工厂的生产负荷相叠加。

2.3 典型行业负荷曲线拟合

依据前文所述方法对3个典型行业的日负荷曲线进行拟合,如图5~图7所示。

由图5~图7可以得出各行业的负荷曲线特点:石化行业的负荷特性较为良好,负荷波动较小,对于电网企业来说是优质客户,而高科技行业和大型商场的负荷波动较大。进一步分析可知,石化行业属于重工业,由于工艺需要,必须保持主要大型设备处于常开状态,因此用电负荷曲线较为平稳;而高科技由于是智力密集型行业,因此负荷特性受员工的工作班制影响较大,且多为两班制,拟合出的高科技行业的日负荷曲线非常好地反映了该特征;而大型商场属于服务行业,因此商场负荷曲线的形状、趋势与顾客流量保持高度一致。

图5~图7所示结果表明,依据本文所述方法所获得的各行业日负荷曲线具有较显著的区分特点,并与实际情况相吻合,能够很好地描述各行业的用电特性。

将拟合出的各行业负荷曲线叠加可拟合出汇总负荷曲线(如图8所示),与陕西省实际负荷曲线相比,吻合程度较高,证明了本文所述的行业负荷曲线拟合方法可取,并且计算方便,有很高的实用价值。

3 结语

基于统计学中样本到总体的思路,提出了根据电力用户负荷曲线进行行业负荷曲线拟合的方法。文中分析了行业用电与负荷特性的对应关系,对于研究各行业负荷特性、分行业典型日负荷曲线叠加法进行负荷预测提供了理论依据和数据支持。由于分行业典型日负荷曲线叠加法能有效反映产业结构、用电结构变化对负荷特性的影响,因此本文提出的方法成为构筑行业日负荷曲线的可行方法,并能作为负荷预测的前期工作[8]。另外,目前重点实施的削峰填谷等措施实际上都在一定程度上改变了负荷曲线的形状[9],因此,从行业负荷曲线入手进行分析,能够帮助更好地实施需求侧管理措施。实际应用表明,本文所提出的行业负荷曲线拟合方法能很好地描述实际情况,且应用简便。

摘要:研究行业的负荷曲线对于了解各行业的负荷特性有很大帮助,目前的研究多应用模糊C均值聚类法拟合行业日负荷曲线,然而该方法对于专业知识要求高,计算量大,实际应用难度大。首先采用随机抽样与非随机抽样相结合的方式抽取典型用户,然后从统计学原理出发,依据样本到总体的思路,计算各行业的扩大系数,进而进行行业的负荷曲线拟合,并采用负控系统采集的大量实际用户日负荷曲线进行应用检验。实际应用表明,本文所提出的行业负荷曲线拟合方法能很好地描述实际情况,且应用简便。

关键词:负荷特性,典型行业,日负荷曲线

参考文献

[1]李欣然,姜学皎,钱军,等.基于用户日负荷曲线的用电行业分类与综合方法[J].电力系统自动化,2010,34(10):56-61.

[2]林雄,邢诒杏.模糊聚类方法在负荷曲线分析中的应用[J].信息技术,2008,(2):94-96.

[3]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78.

[4]赵希正,周小谦,姜绍俊.中国电力负荷特性分析与预测[M].北京:中国电力出版社,2002.

[5]钟巍峰.供电公司客户关系管理研究与实证分析[D].北京:华北电力大学.2007.

[6]李良.区间估计与抽样误差关系的研究[J].科技经济市场,2007,(3):36-37.

[7]徐波.统计推断与抽样[J].黔西南民族师范高等专科学校学报,2009,(1):71-78.

[8]仲伟宽.数据挖掘技术在负荷特性分析中的应用[D].南京:东南大学,2006.

曲线拟合方法 篇5

在文[1]中, 根据1790年至2000年美国人口数据, 使用线性拟合方法对Malthus人口模型中的参数进行了估计, 并得到结论:指数模型基本上能够描述十九世纪以前美国人口的增长, 但是进入二十世纪后, 美国人口增长明显变慢, 模型不再合适.虽然拟合结果基本支持这个结论, 但拟合效果却并不理想, 这就使得这个结论的正确性存在疑问.这个拟合是用数学软件Matlab提供的函数来完成的, 优化建模软件Lingo也可进行曲线拟合[2].本文从拟合精度和程序运行效率两个方面, 通过对Matlab与Lingo这两种数学软件所提供的曲线拟合方法的对比分析, 得到相关结论, 并对指数增长模型给予正确评价.

2、曲线拟合的原理与软件实现

曲线拟合是指根据一组二维数据 (xi, yi) , i=1, 2, …, n, xi互不相等, 寻求一个一元函数y=f (x) , 使f (x) 在某种准则下与所有数据点最接近.准则给出了衡量曲线拟合方法优劣的标准, 最小二乘准则由于其计算的方便性被广泛采用, 因此对于基于最小二乘准则的曲线拟合方法, 应直接使用残差平方和来比较分析其拟合效果。

在数学软件Matlab中分别提供了进行线性拟合和非线性拟合的函数, 函数polyfit () 可以进行线性曲线拟合, 函数lsqcurvefit () 或lsqnonlin () 可以进行非线性曲线拟合, 它们都是基于最小二乘原理的拟合方法.而优化建模软件Lingo虽未直接提供用于曲线拟合的函数, 但根据最小二乘原理, 曲线拟合实质上是一个无约束优化问题, 即

决策变量是拟合函数f (x) 含有的待估参数, 因此可用Lingo进行求解.

3、拟合方法对比分析

基于人口增长率r为常数的Malthus人口模型如下:

对人口模型求解得:对于初始人口数x0和人口增长率r的估计, 可以直接使用非线性拟合;也可以先对人口函数线性化, 即y=a+rt, 其中y=lnx, a=lnx0, 然后使用线性拟合.根据文[1]中给出的美国1790年至2000年的人口统计数据, 运用Matlab和Lingo分别实施这两种方法的结果如表1.

根据两种软件的拟合过程和拟合结果不难得到两个结论:⑴对于非线性拟合问题, 直接使用非线性拟合比线性化后再使用线性拟合的效果要好得多.⑵作为用于优化问题建模和求解的专业软件Lingo, 在曲线拟合的精度方面比Matlab有过之而无不及, 这是由其内部的算法决定的, 且用Lingo做非线性拟合不必给定参数初始值, 而这恰好是用Matlab做非线性拟合的一个难点.当然, 付出的代价是程序运行的时间较长.

事实上, 将非线性函数线性化后进行拟合, 主要是考虑到线性模型易于求解, 且计算效率高, 因此这样做在理论上是有意义的、可行的.但是, 由于计算机的字长确定了它在表示一个数时的精度[4], 这样, 在计算过程中难免会产生误差, 例如由于四舍五入而产生的舍入误差.而非线性参数的线性化以及参数值的还原过程起到了放大误差的效果, 表1的结果证明了这一点至于Matlab做非线性拟合时对参数初值的依赖性以及Lingo的运行效率问题, 在人口模型上体现得并不明显, 我们用下面的例子来说明.

在文[5]的第14讲中, 给出了钾肥对土豆的效应方程:使用文[5]中的数据对效应方程中的参数a0、a1、a2进行拟合, 表2是分别用Matlab和Lingo作非线性拟合的结果.Lingo程序得到的是全局最优解, 但运行时间较长.Matlab程序在第一组参数初值下得到了与Lingo程序几乎一样的结果, 这说明Matlab程序也得到了最优解, 且速度很快;而其在第二组参数初值下得到的结果与最优解相差很大.第二组参数初值是随意给的, 第一组参数初值是按如下方法确定的.由效应方程可知, 因此可以近似地认为参数a0是施肥量较大时的产量, 故取a0=46.22.而a1=W (0) -a0, 即a1=-27.24.最后任取一组试验数据代入效应方程计算出a2的初始值, 比如使用第二组试验数据计算得a2=0.0078.Matlab程序运行结果说明了其在作非线性拟合时对参数初值的依赖性, 上述参数初值的确定是通过对被拟合函数的分析来完成的, 这种方法具有可借鉴性, 但不具有一般性.

其实, 在Lingo建模语言中也可以通过其初始段来给决策变量赋初值, 经测试, 其提升运行速度的效果远不如Matlab.而根据优化模型的求解原理, 尽量缩小可行域是提高程序运行效率的有效途径.比如以第一组参数初值为中心给出三个适当长度的区间, 作为参数的可行域, 运行后发现Lingo的运行时间可以缩短至原来的近百分之一。

4、结论

对于线性曲线拟合问题, 数学软件Matlab和Lingo在拟合精度和运行效率上基本没有差别.对于非线性曲线拟合问题, 在方法上应优先考虑直接使用非线性拟合方法, 在软件的选择上则应根据精度与时间的要求来决定.Matlab能够达到Lingo的精度, 且速度快, 前提是必须给出好的参数初值, 否则精度可能会大打折扣.而Lingo一般能找到全局最优解, 且不必给参数赋初值, 但速度较慢.即使给参数赋初值, 提高运行速度的效果也不十分明显, 而通过给各参数一个尽量小的取值范围可以极大地提高程序运行效率, 但必须注意这个范围一定要包含参数最优解.

5、对指数增长模型的评价

下面是用Lingo分别作线性和非线性拟合的效果图.可以看出, 它们共同反映了在20世纪后期实际人口增速放缓, 模型已经不再适合.它们的区别是图1显示模型与十九世纪及以前的数据吻合得较好, 图2显示模型与二十世纪的数据吻合得较好.这就表明指数模型在参数的任意一组取值下最多只能与部分实际数据吻合得较好, 即指数模型不能较好地反映实际人口变化的长期趋势.

图3和图4是用Lingo软件分别针对十九世纪及以前和二十世纪的实际人口数据做非线性拟合的效果图.

图3和图4对应的残差平方和分别为28.2896和192.8107, 这表明相对而言, 指数模型更加适合于十九世纪及以前的人口数据;参数的取值分别为0.0245和0.0124, 更进一步说明不应该用1790年至2000年的全部数据拟合指数模型, 指数模型只适合短期人口预测.

参考文献

[1]姜启源, 谢金星, 叶俊.数学模型 (第三版) [M].北京:高等教育出版社, 2003.8.

[2]袁新生, 邵大宏, 郁时炼.Lingo和Excel在数学建模中的应用[M].北京:科学出版社, 2007.1.

[3]赵静, 但琦.数学建模与数学实验 (第3版) [M].北京:高等教育出版社, 2008.1.

[4]朱亚超.基于IEEE754的浮点数存储格式分析研究[J].计算机与信息技术, 2006, 9:50-52.

曲线拟合方法 篇6

信噪比估计是无线通信中一个重要的研究课题,一直受到广泛关注。在无线通信中,有些算法所需的参数与信噪比有着密切关系,得不到精确的信噪比估计,会使得这些算法的性能不同程度的下降。如调制识别,自适应通信技术、功率控制和传输速率控制等算法,都需要信噪比作为参考。

当前,已有一些关于信噪比估计的方法。David R P等人对AWGN信道的信噪比估计方法作了比较,其中基于最大似然估计的方法利用训练序列或反馈序列构造似然函数,而基于二阶矩四阶矩的方法是利用信号和噪声不同统计关系来估计信噪比。这两种方法都需接收序列首先取得同步,否则,就会失效。Hua J Y等人提出一种基于接收信号频谱分段的估计方法,根据信号和噪声的不同频谱分布特性,估计信噪比,这种方法只有在信号长度较长时,才能体现出较好的估计性能。Ilias T等人提出一种基于接收信号相位分布的估计方法,利用噪声的随机分布特性对相位的影响,根据接收信号的相位分布,估计出噪声的大小。Wax M等人利用信号的空间投影的方法对时分多址(TDMA)系统中的信噪比进行估计,这种方法需要利用训练序列来构造接收信号的相关矩阵,并且只适用于时分多址系统。

本文从自相关函数和曲线拟合的角度,提出一种基于曲线拟合的信噪比估计方法。主要根据周期平稳信号与噪声的自相关函数的不同特点,利用曲线拟合,分离信号和噪声的能量,从而进行信噪比估计。仿真结果表明,在高斯白噪声信道,本文方法的估计精度较高,有着较好的估计性能。

二、周期平稳信号自相关函数的特性

在实际的无线通信系统中,因为调制、脉冲成型、过采样等操作,使得大部分的信号都具有周期平稳特性。令:x[n]=s[n]+w[n]

式中,s[n]为周期平稳信号:w[n]为加性高斯白噪声。那么接收信号的自相关函数R[n,τ]=x[n]·x*[n-τ]可以表示为:R[n,τ]=(s[n]+w[n])(s'[n-τ]+w*[n-τ])

由于s[n]是周期平稳信号,而w[n]是平稳的随机分布,所以,其自相关函数可以表示为:

利用时间平均消除时间的相关性,那么接收信号的自相关函数用R[τ]表示为:

也就是说R[τ]的曲线走势主要是由Rs[τ]决定的,只有在第一点叠加了噪声能量,如图1所示。

三、基于曲线拟合的信噪比估计方法

曲线拟合的基本原理就是根据一定数量的已知离散点值走势,确定拟合函数,从而估计出未知点值。曲线拟合常常用来进行实验数据分析,根据已知点值的走势预测待求值。常见的曲线拟合模型主要有直线型、多项式型、指数函数型,模型的选取主要根据已知离散点的走势。例如散点走势为趋于直线,就用y=a0+a1x来拟合;若散点走势趋于抛物线,则用y=a0+a1x+a2x2来拟合。所以,对曲线拟合来说,关键是确定系数ai的值,使得曲线最优的拟合散点走势。对曲线拟合而言,已知点数要多于待定系数的个数,只有这样,才能确定出最优的拟合曲线。因此,对于二项式拟合模型,点数至少为4点。

从上面分析可知,由于需要的是第一点的值,所以不用对整条曲线进行拟合。如果对整条曲线进行拟合,由于曲线走势比较复杂,反而会使得对第一点的拟合误差更大。

选取τ≠0时一定数量的离散点值,确定一条拟合曲线φ(x),然后计算曲线在第一点的值为信号的能量估计值.则噪声能量估计值为:

那么信噪比估计值为:

四、仿真验证及性能比较分析

拟合项数对曲线拟合的性能有关键的影响,一般来说,项数越多,对曲线的整体拟合效果越好。因此我们通过仿真讨论拟合项数与信噪比估计精度之间的关系。采用8PSK调制信号,符号采样率Ns=16,滤波器长度为L=127.滚降系数为0.25,发送符号M=500,相关长度P=127。

首先用二项式拟合,拟合点数为4点和5点两种,用四种方法取点:从第二点开始依次取4点.每隔1点取4点,每隔2点取4点,随机取4点(取第2,3,5,6点和第9点)。通过对已知的点值来观察拟合性能。拟合性能用归一化均方误差表示:

用三项式进行曲线拟合,点数选择为5点和6点,取点方法和二项式拟合一样,随机取点时取第2,3,5,6,8点和第9点。

由图3可以看出,随机取4点(取自相关函数的第2,3,5,6点的值)的整体性能较好:由图4可以看出,每隔1点取6点的整体性能较好。图5给出这两种取点方法的性能比较。二项式采用两种取点方法:二项式拟合1取第2,3,5,6点;二项式拟合2取第2,5,7,8点。

由图5可以看出,二项式拟合2的性能在低信噪比(<6dB)时最好,但是随着信噪比的增加,性能略有下降。从图1可以看出,自相关函数曲线前面一段比较近似于抛物线,所以会使得二项式拟合性能更好一些。综合考虑各方面因素,在信噪比估计时,选择二项式拟合,选取第2,3,5,6点为拟合点。

2. 不同调制信号的性能比较

根据上一节的分析,选择二项式拟合,拟合点为第2,3,5,6点。图6给出BPSK,QPSK.8PSK和16QAM四种调制方式下,基于曲线拟合的信噪比估计的结果和归一化均方误差值(NMSE)。

由图6可以看出,不同的调制信号对估计性能影响不大,高进制的性能稍微好一些,这是由于自相关函数曲线在高进制时变化比较平缓,使得拟合性能较好;二是曲线拟合的性能曲线随着信噪比增加而提高,在10dB时归一化均方误差可达到0.002,具有较高的估计精度。

3.不同估计方法的性能比较

第一节提到的二阶矩四阶矩和频谱分段估计方法是比较常见的信噪比估计方法,应用比较广泛,下面就基于曲线拟合的估计方法和这两种方法进行性能比较,说明基于曲线拟合估计方法的相对性能。仿真信道模型为加性高斯白噪声信道,其他参数设置不变,采用8PSK调制信号。

从图7,图8可以看出,基于曲线拟合的信噪比估计方法具有较好的性能,尤其在低信噪比时,性能明显优于其他两种方法:二是曲线拟合方法对符号长度不是很敏感,而M2M4和频谱分段两种估计方法只有在符号较多时,才能体现出其优越性,这说明基于曲线拟合估计方法可以降低运算时间损耗,实时性较好。

五、结束语

以上研究表明,基于曲线拟合的信噪比估计方法不用考虑同步,不需使用训练序列,对序列长度没有特别要求,只要噪声与信号的自相关函数分布特性不同,就可以通过该方法进行信噪比估计。因此,该方法适用于不同的调制方式、高斯白噪声信道和多径时延的情况,具有较好的普适性。

参考文献见www.dcw.org.cn

参考文献

曲线拟合方法 篇7

传统的分段曲线拟合根据主观经验和绘制数据散点图来确定拟合的经验函数和分段点。文献[5] 提出分段区间重合的拟合方法, 由每4个数据点决定一个三次曲线, 但分段区间太密, 不适用于密集的数据拟合。文献[6]提出的多项式基函数的全局连续拟合方法, 只限于2个分段区间。文献[7]提出多分段区间全局连续的曲线拟合方法, 但基函数只限于一次多项式。文献[5—7]提出的方法都是根据主观经验来确定经验函数和分段区间, 然后进行拟合。文献[8]引入拟合误差限度 εmax, 在误差大于该限度的点处分段, 但该限度 εmax不容易界定。

提出一种自动分段多项式曲线拟合方法, 该方法在实际运用中具有如下有点: 1提供几种不同的经验函数, 根据不同经验函数拟合的数据和实测数据的误差的方差, 自动确定较优的经验函数; 2自动确定数据的分段区间, 在各个区间进行最小二乘拟合。通过数值实验, 证明该方法有较高的拟合精度。

1经验函数的确定及拟合步骤

1. 1经验函数的确定

数据拟合方法有很多, 例如对数曲线拟合, 反函数曲线拟合, 二次曲线拟合, 三次曲线拟合, 幂函数曲线拟合, 指数曲线拟合等。一般先观察散点图来确定曲线的类型, 不过散点图都是相关关系的粗略表示, 有时候散点图可能与几种曲线都很接近, 这时建立相应的经验函数可能都是合理的, 但由于选择不同的曲线, 得到同一个问题的多个不同经验函数, 怎样从这些经验函数中选择最优的一个。文献[1] 提出的, 用几种函数进行拟合, 计算历史数据点实测值和拟合值的误差平方和最小的为最优经验函数这一方法, 可能存在这样的问题: 误差平方和最小, 但误差波动较大, 即一些点误差很小, 一些点误差相对较大。针对这种情况, 本文提出一种新的确定经验函数的方法, 用几种不同的函数进行拟合, 从中选取最优的经验函数, 最优经验函数确定的条件如下:

1) 历史数据点误差为正和误差为负的个数之差小于适应性参数, 在本文试验中选用的适应性参数为3。

2) 计算误差的方差, 方差最小的为最优的拟合函数。

方差是各个数据与平均数之差的平方和的平均数。通俗点讲, 就是各点与平均数偏离的程度, 来衡量一批数据相较于平均数的波动的大小。方差的数学描述为

式 ( 1) 中把x-视为第一个历史点的误差, xi为后面各历史点的误差, 该公式即可理解为各点误差相较于第一个点的误差的波动大小, 波动越小, 说明各个点的误差相差越小, 分布较均匀, 那么该函数即为最优经验函数。经验函数确定的流程图如图1所示。

1. 2自动分段拟合的步骤

本文选取三种较为典型的回归方程类型

分段拟合步骤如下, 分段拟合流程图如图2所示。

1) 根据1. 1节提出的方法拟合所有的历史数据, 在上述的三种拟合函数中选择最优的拟合函数。

2) 由第1) 步选取的经验函数, 计算历史数据点拟合值和实测值的误差, 计算历史数据点误差绝对值的均值S。

3) 比较各历史点误差与误差均值S, 若连续3个点的误差绝对值大于均值S, 则从第一个误差大于均值的点处分段, 执行第4) 步, 若不存在拟合值和实测值误差大于均值的点, 或者这种点只有一个或两个, 则不进行分段, 执行第5) 步。

4) 从分段点处到历史数据最后一个点重新拟合, 选择最优的函数, 重复以上步骤。

5) 根据以上步骤得到的分段, 以及各段选出的最优经验函数对历史数据进行拟合。

2数值实验

2. 1自动分段拟合实验

为检验所论述的自动分段多项式曲线拟合方法, 采用两组数据, 厦门高崎机场1990 ~ 2012年的起降架次的数据[9]和1990 ~ 2004年中国人均GDP的数据来进行拟合。

提出的自动分段多项式曲线拟合方法对厦门高崎机场1990 ~ 2012年起降架次统计数据和1990 ~ 2004年中国人均GDP数据进行拟合, 用JAVA编程实现, JFree Chart绘制曲线。表1和图3是厦门高崎机场起降架次的数据与经过分段曲线拟合后的数据的比较, 表2和图4是中国人均GDP数据与拟合后的数据的比较。

对于厦门高崎机场起降架次的数据, 提出的该方法自动将数据分为3段, 即数据1990 ~ 1994, 1994 ~ 2003, 2003 ~ 2012, 这三段数据选取的最优经验函数都是指数函数形式。对于中国人均GDP的数据, 程序自动将数据分为三段, 即数据段1990 ~ 1995, 1995 ~ 1999, 1999 ~ 2004, 这三段数据选取的最优经验函数分别是多项式函数形式, 直线形式和多项式函数形式。由表1、表2和图3、图4可以看出, 提出的自动分段拟合方法拟合精度较高, 能够很好的拟合历史数据。

2. 2对比实验

本文选取1990 ~ 2004年中国人均GDP数据, 分别用本文提出的自动分段拟合方法和传统直线拟合、指数拟合、多项式拟合方法对该组数据进行实验, 对比实验各种方法的相对误差如表3所示。

由表3可以看出, 自动分段拟合方法相对误差比传统拟合方法相对误差小, 且相对误差波动比传统方法波动小。自动分段拟合方法不仅在拟合精度上比传统方法高, 而且分段方便, 不需用户根据主观经验和绘制散点图来分段, 方便用户使用。

3结论

提出的自动分段曲线拟合方法采取对历史数据进行拟合, 自动选取较优的经验函数, 自动进行分段, 使得在进行数据拟合时, 不需要人为的绘制出历史数据散点图来选取经验函数和分段。通过编程实现和数值实验验证, 该方法不仅便于在计算机上编程实现, 而且拟合效果较好。

摘要:针对传统的分段曲线拟合方法在选择拟合函数和确定分段区间时经验成分较多的不足, 提出一种自动分段多项式曲线拟合方法, 根据误差方差和误差均值, 自动确定经验函数和分段区间。通过实际数据的检验, 验证了该方法的拟合效果。

关键词:数据拟合,分段拟合,多项式曲线,最小二乘法

参考文献

[1] 吴宗敏.散乱数据拟合的模型、方法和理论.北京:科学出版社, 2007

[2] 杨维, 张晓明.利用最小二乘法进行回归分析及经验公式的确定.沈阳工业大学学报, 1991;13 (2) :1—6

[3] 侯超钧, 曾艳姗, 吴东庆, 等.全局连续的分段最小二乘曲线拟合方法.重庆师范大学学报 (自然科学版) , 2011;28 (6) :44—48

[4] Grama L, Rusu C.Phase approximation by divide-and-conquer piecewise linear fitting of gain.International Symposium on Signals, Circuits and Systems, 2009:1—4

[5] 蔡山, 张浩, 陈洪辉, 等.基于最小二乘法的分段三次曲线拟合方法研究.科学技术与工程, 2007;7 (3) :352—355

[6] 刘晓莉, 陈春梅.基于最小二乘原理的分段曲线拟合方法.伊犁教育学院学报, 2004;17 (3) :132—134

[7] Gluss B.An alternative method for continuous line segment curve-fitting.Information and Control, 1964;7 (2) :200—206

[8] 王成山, 黄碧斌, 李鹏, 等.燃料电池复杂非线性静态特性模型简化方法.电力系统自动化, 2011;35 (7) :64—69

上一篇:中国农地制度现状下一篇:不稳定性肩胛骨骨折