拟合预测

2024-10-02

拟合预测(精选8篇)

拟合预测 篇1

摘要:介绍了基于曲线拟合的软土地基沉降预测方法中的双曲线法和星野法预测原理,通过工程实例,分析了其在水泥搅拌桩和塑料排水板处理软土地基沉降预测中的良好拟合效果,为确定预压稳定后铺筑路面时间和验证设计提供了依据。

关键词:软土地基,曲线拟合,固结度,沉降预测

随着交通事业的发展,软土地区的高速公路不仅要求路堤稳定,而且对工后沉降有很高要求,特别是需要严格控制工后不均匀沉降量。沉降观测是验证设计与指导施工的重要手段,沉降观测资料不仅可以用来控制软土地基的稳定性,更重要的是进行沉降预测,推算地基最终沉降量,计算工后沉降量以及计算沉降速率等,确定预压稳定后铺筑路面时间和验证设计是否正确合理。

1 双曲线法和星野法预测

1.1 双曲线法原理

双曲线法是假定下沉平均速率以双曲线形式减少的经验推导法,从填土开始到任意时间t的沉降量St可用下式表示:

St=S0+tα+βt (1)

其中,S0为初期沉降量(t=0);St为t时刻的沉降量;t为经过时间;α,β均为从实测值求得的系数,化为直线分别表示直线的截距和斜率。

当t=∞时,最终沉降量S∞可用下式求得:

S=S0+1β (2)

荷载经过时间t后的残留沉降量ΔS用下式求得:

ΔS=S∞-St (3)

用此方案推测t时沉降,要求有较长时间的沉降观测资料,实测沉降时间一般要求至少在半年以上。

1.2 星野法原理

星野法是基于太沙基固结理论得出的固结度U和时间t的平方根成正比的关系,通过对在现场获取的实测沉降值研究,认为包括剪切变形沉降的总沉降量和时间平方根成正比,其基本计

算公式为:

St=S0+AΚ(t-t0)[1+Κ2(t-t0)] (4)

式(4)可改写成:

t-t0(St-S0)2=1A2Κ2+1A2(t-t0) (5)

其中,S0为瞬时加载产生的瞬时沉降量;K为影响沉降速度的系数;A为求t→∞时最终沉降值的系数。

这样,(t-t0)/(St-S0)2与(t-t0)的关系,正是斜率为1/A2,截距为1/(A2K2)的直线,据此可用图解法求出系数A,K。

当式(4)中的时间t→∞时,便可得到星野法计算最终沉降量的公式:

S=S0+A (6)

在观测点数偏少的情况下,采用星野法预测沉降要比双曲线法准确,但是双曲线法适应性比星野法强。

2 工程实例分析

2.1 工程概况

本试验依托于河北省沿海高速公路唐山段T5标段K143+449~K143+653路段水泥搅拌桩和塑料排水板对软土地基的处理。试验段处于滨海平原,地下水位极浅,地基属饱和淤泥质黏土、亚黏土,室内土工试验天然含水量27%~39%,一般呈软塑状,软弱土层厚度14 m,地基的承载力、沉降问题较为突出。

2.2 设计标准

设计对桥台两侧各30 m区段下部采取深层水泥土搅拌桩的处理方法。搅拌桩按正三角形布置,桩长15 m,桩径0.5 m,桩间距1.0 m~1.4 m,桩间距由密到疏渐变,处治宽度至坡脚0.5 m。水泥采用325号矿渣水泥,水泥掺入量为加固土体质量的15%,水灰比为0.5。

设计对一般路段下部采取塑料排水板的处理方法。塑料排水板设计深度为14 m,断面尺寸为10 cm×0.4 cm,按正三角形布置,间距1.5 m,处治宽度至坡脚0.5 m。

2.3 沉降预测与分析

分别以水泥土搅拌桩处理段K143+495断面和塑料排水板处理段K143+530断面中桩现场沉降观测数据为例,运用双曲线法和星野法进行沉降预测。沉降预测计算值与实测值的比较见表1,表2。

从表1,表2可以看出,两种方法对本次沉降值都有良好的拟合效果,并且随着沉降观测值的增多误差减小。

根据U=StS来大致推算各个时段的土体平均固结度,计算结果见表3。

%

从表3可以看出,星野法计算土体平均固结度值小于双曲线法计算土体平均固结度值,这是因为星野法预测最终沉降值较双曲线法大,但从预压时间看,预压40 d土体平均固结度均在84%以上,预压75 d比预压40 d土体固结度增长值不超过5%。这说明采用水泥搅拌桩和塑料排水板加固整个软弱土层,超载预压后经过大约3个月时间就可使加固土体固结度达到85%以上而满足卸载要求。

3 结语

从上述两种预测结果来看,经过水泥搅拌桩加固预压处理后的软土地基,其剩余沉降量均值(相对于路基填筑结束时)在4.37 mm~12.52 mm之间,经过塑料排水板加固预压处理后的软土地基,其剩余沉降量均值(相对于路基填筑结束时)在57.64 mm~82.87 mm之间,如果考虑路面铺筑及运营期过程中产生的次固结沉降(如果路基不发生过大塑性变形,次固结可按总沉降的8%估算),则工后沉降量均值在4.69 mm~89.50 mm之间,满足此项工程对软土地基设计的要求,处理效果较理想,达到了预期目的。

参考文献

[1]地基处理手册编写委员会.地基处理手册[M].北京:中国建筑工业出版社,1988.

[2]JTJ 017-96,公路软土地基路堤设计与施工技术规范[S].

[3]王晓谋,袁怀宇.高等级公路软土地基路堤设计与施工[M].北京:人民交通出版社,2001.

[4]张诚厚.高速公路软基处理[M].北京:中国建筑工业出版社,1997.

[5]张齐凯.CFG桩复合地基沉降计算探讨[J].山西建筑,2007,33(8):104-105.

拟合预测 篇2

学生学号

所在班级

指导教师

一、课程设计名称 函数逼近与曲线拟合 二、课程设计目的及要求 实验目的: ⑴学会用最小二乘法求拟合数据的多项式,并应用算法于实际问题。

⑵学会基本的矩阵运算,注意点乘与叉乘的区别。

实验要求: ⑴编写程序用最小二乘法求拟合数据的多项式,并求平方误差,做出离散函数 与拟合函数的图形;⑵用 MATLAB 的内部函数 polyfit 求解上面最小二乘法曲线拟合多项式的系数及平方误差,并用MATLAB的内部函数plot作出其图形,并与(1)结果进行比较。

三、课程设计中的算法描述 用最小二乘法多项式曲线拟合,根据给定的数据点,并不要求这条曲线精确的经过这些点,而就是拟合曲线无限逼近离散点所形成的数据曲线。

思 路 分 析 : 从 整 体 上 考 虑近似 函 数)(x p 同 所 给 数 据 点)

(i iy x , 误 差i i iy x p r  )(的大小,常用的方法有三种:一就是误差i i iy x p r  )(绝对值的最大值im ir  0max ,即误差向量的无穷范数;二就是误差绝对值的与 miir0,即误差向量的 1成绩评定

范数;三就是误差平方与 miir02的算术平方根,即类似于误差向量的 2 范数。前两种方法简单、自然,但不便于微分运算,后一种方法相当于考虑 2 范数的平方,此次采用第三种误差分析方案。

算法的具体推导过程: 1、设拟合多项式为:

2、给点到这条曲线的距离之与,即偏差平方与:

3、为了求得到符合条件的 a 的值,对等式右边求 偏导数,因而我们得到了:

4、将等式左边进行一次简化,然后应该可以得到下面的等式

5、把这些等式表示成矩阵的形式,就可以得到下面的矩阵:

        niininiiknikinikinikinikiniiniinikiniiyyyaax x xx x xx x11i11012111111211 1an    6.将这个范德蒙得矩阵化简后得到 n kkn nkkyyyaaax xx xx x    21102 21 1111 7、因为 Y A X  * ,那么 X Y A /  ,计算得到系数矩阵,同时就得到了拟合曲线。

四、课程设计内容 ⑴实验环境:MATLAB2010 ⑵实验内容:给定的数据点

0 0、5 0、6 0、7 0、8 0、9 1、01、75 1、96 2、19 2、44 2、71 3、00 1)用最小二乘法求拟合数据的多项式;2)用 MATLAB 内部函数 polyfit 函数进行拟合。

⑶实验步骤 1)首先根据表格中给定的数据,用 MATLAB 软件画出数据的散点图(图 1)。

2)观察散点图的变化趋势,近似于二次函数。则用二次多项式进行拟合,取一组基函数 ,并令 ,其中 就是待定系数。

3)用 MATLAB 程序作线性最小二乘法的多项式拟合,求待定系数。

算法实现代码如下: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];R=[(x、^2)“ x” ones(7,1)];A=Ry“

4)用 MATLAB 程序计算平均误差。

算法实现代码如下: y1=[1 1、75 1、96 2、19 2、44 2、71 3、00];x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=x、^2+x+1;z=(y-y1)、^2;sum(z)5)作出拟合曲线与数据图形(图 2)。

6)用MATLAB 的内部函数 polyfit 求解上面最小二乘法曲线拟合多项式的系数及平方误差。

算法实现代码如下: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];A=polyfit(x,y,2);%二次多形式拟合% z=polyval(A,x);A d=sum((z-y)、^2)7)绘制使用 polyfit 函数实现的拟合图形。(图 3)五、程序流程图

图 5-1 用最小二乘法求多项式拟合曲线流程图

图 5-2 用 polyfit 函数求多项式拟合曲线流程图 六、实验结果 输入初始数据点 根据原始数据绘制散点图 分析数据点变化趋势,确定拟合多项式 用最小二乘法求系数矩阵,确定多项式 用所求的多项式,计算误差 绘制拟合曲线 输入初始数据点 调用 polyfit 函数,确定多形式的系数 调用 plot 函数进行绘图 调用 polyval 函数,进行多项式求值

图 6-1 表中数据的散点图

图 6-2、最小二乘法实现的拟合曲线 第 1 问

系数为 A =

1、0000

1、0000

1、0000 则多项式的方程为

平方误差与为 ans =1、9722e-031

图 6-3、polyfit 函数实现的拟合函数 第 2 问 系数为 A =

1、0000

1、0000

1、0000 则多项式的方程为

平方误差与为 ans =

1、9722e-031

七、实验结果分析 编写程序用最小二乘法求拟合曲线的多项式的过程中,求出的数据与拟合函数的平方误差很小,达到了很高的精度要求,以及通过散点求得的拟合曲线比较

光滑。而用 MATLAB 的内部函数求 polyfit 求解的曲线拟合多项式与平方误差与程序求得的相同,还有就就是虽然求解过程简单了,但用 MATLAB 的内部函数做出的图形由明显的尖点,不够光滑。

此次实验数据较少,而且数据基本都就是可靠数据。但就是在应用实际问题中,数据会很庞杂,此时对于最小为乘法的算法就需要进一步的细化。例如在进行数据采集时,由于数据采集器(各种传感器)或机器自身的原因及其外部各种因素的制约,导致数据偶尔会有大幅度的波动,及产生一些偏差极大的数据,不能真实反映数据的可靠性,所以会对数据进行筛选或修正。而此时就可应用曲线拟合的最小二乘法的进行处理。

八、实验心得体会 在日常的学习与生活中,我们可能会遇到各种方面的跟数据有关的问题,并不就是所有的数据都就是有用,必须对数据进行适当的处理,然后找出数据之间的关系,然后进行分析得出结果。此次实验结果基本没有大的区别,可就是MATLAB 提供给我们一个特别简洁的办法,应用一个函数即可实现相同的结果。虽然很方便,但就是对于初学者来说,我觉得打好基础才就是关键,对于一个知识点,应该掌握其最基本的原理,然后在将它应用于实际。

通过这个实验我也理解到了,数值分析就是一个工具学科,它教给了我们分析与解决数值计算问题得方法,使我从中得到很多关于算法的思想,从中受益匪浅。

附录:源代码 散点图: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];plot(x,y,”r*“)title(”实验数据点的散点图“);legend(”数据点(xi,yi)“);xlable(”x“);ylable(”y“);最小二乘拟合:

建筑物沉降预测模型拟合精度评价 篇3

随着社会经济的发展,高层建筑物越来越多,沉降观测与预测愈显重要。预测精度的高低是评价预测模型拟合成功与否的重要指标,如何评价预测模型拟合精度越来越被人们重视。

建筑物沉降随着时间呈有界增长,研究发现沉降—时间理论曲线呈“S”型[1,2],与Logistic和Gompertz曲线的变化规律极为相似。因此,选取Logistic和Gompertz曲线方程对观测数据进行拟合,建立预测模型,根据预测结果,利用不同的评价方式对预测模型拟合精度进行评价。

1 预测模型拟合精度评价方法

影响预测模型拟合精度的因素有很多,主要取决于观测数据与估计水平的精确性,其中估计水平涉及到模型函数形式的设定、正确变量选择及参数估计。由于不同的研究对象、预测长度对精度要求不一样,采用多种精度指标来衡量是必要的[3,4]。广泛应用的精度指标有后验差检验、平均绝对百分误差(MAPE)、绝对误差平方和(SSE)、相对误差平方和(SSPE)、标准差(SE)和相对标准差(SPE)等。

1.1 后验差检验

(1)计算各期预测数值和残差(i=1,2)(i=1,2,…,n)。

(2)计算原始序列标准差和绝对误差标准差

原始序列标准差:

绝对误差标准差:

(3)进行指标检验。先计算后验差比值C及小误差概率P。

后验差比值:

C值为残差值标准与观测值标准差之比,用于判定两者变异程度的大小。

小误差概率:

P为残差ei落在区间的概率,用于评价残差值的集中性。

模型精度评定标准见表1。

1.2 平均绝对百分误差

平均绝对百分误差为,其精度分级原则见表2[5]。

2 应用实例

2.1 预测模型的选取

把函数和G(t)=abct所表示的几何图形分别称为Logistic曲线和Gompertz曲线(以下简称L曲线和G曲线)[6~8]。

2.2 预测模型的建立

现有某大楼封顶后的实测数据,该数据为2005年4月至2006年2月,每月19号的观测资料,共十一期[9],具体见表3。

对表3数据取前八期求取参数并建立预测模型如表4,后三期数据作为预测验证值。

2.3 预测值计算

利用表4中的预测模型进行预测,求得每个模型各期的拟合(预测)值及其残差见表5,根据表5绘沉降拟合预测曲线对比图(见图1)。

由表5后三期残差大小及图1沉降拟合预测曲线发展趋势可知,两种曲线模型预测精度较高。

3 预测模型拟合精度评价

3.1 后验差检验

原始序列标准差:

绝对误差标准差:

后验差比值C及小误差概率;

模型精度评定结果见表6。

最小的后验差比值为0.075≤0.35,小误差概率P=1,所以,模型精度均为1级。

3.2 平均绝对百分误差

经计算平均绝对百分误差见表7。

依据表2拟合精度划分表中MAPE拟合等级标准,由表7两种模型的精度指标值可知,依前八期数据计算的两种曲线模型均为高精度拟合。

4 结束语

在沉降观测过程中,影响建筑物沉降的因素有很多,对沉降预测提出了挑战。在沉降预测过程中,选取合适的预测模型是做好沉降预测的基础,通过对预测模型拟合精度的评价才能使预测结果可信。本文利用两种评价方法对两种预测模型拟合精度进行评价,评价结果一致,说明两种评价方法均可行,可以用于工程实践。

参考文献

[1]梅国雄,宰金珉,殷宗泽等.沉降—时间曲线呈“S”型的证明及其应用—从土体本构关系[J].岩土力学,2005,26(1):21~24.Mei Guoxiong,Zai Jinmin,Yin Zongze et al.Proof of settlement-time curve appearing“S”shape with ramp loadand its application base on stress-strain relationship[J].Rock and Soil Mechanics,2005,26(1):21~24.(in Chinese)

[2]梅国雄,宰金珉,殷宗泽等.沉降—时间曲线呈“S”型的证明—从一维固结理论角度[J].岩土力学,2004,25(1):20~22.Mei Guoxiong,Zai Jinmin,Yin Zongze et al.Proof of s-t curve appearing“S”shape based onone-dimensinal consolidation theory[J].Rock and Soil Mechanics,2004,25(1):20~22.(in Chinese)

[3]吴清海.基于TIN的土方计算在地面沉降预测中的应用[J].测绘通报,2009,(9):15~17.Wu Qinghai.Application of the earth-volume calculation in surface subsidence forecast based on TIN[J].Bulletin of Surveying and Mapping,2009,(9):15~17.(in Chinese)

[4]吴清海.非等间距灰色模型在沉降预测中的应用[J].淮海工学院学报(自然科学版),2006,15(4):68~70.Wu Qinghai.Application of non-spacing interval grey modelinto subsidence prediction[J].Journal of Huaihai Institute of Technology(Natural Sciences Edition),2006,15(4):68~70.(in Chinese)

[5]马超群,高仁祥.经济建模与预测精度分析[J].预测,1998,(5):50~52.Ma Chaoqun,Gao Renxiang.Economic modeling and forecasting accuracy analysis[J].Rorecasting,1998,(5):50~52.(in Chinese)

[6]朱正元,陈伟侯,陈丰.Logistic曲线与Gompertz曲线的比较研究[J].数学的实践与认识,2003,33(10):66~71.Zhu Zhengyuan,Chen Weihou,Chen Feng.Comparisons on Logistic curve and Gompertz curve[J].Mathematics In Practice and Theory,2003,33(10):66~71.(in Chinese)

[7]范晓秋,洪宝宁.Logistic和Gompertz曲线及其最优组合模型在沉降预测中的运用[J].防灾减灾工程学报,2007,27(2):192~195.Fan Xiaoqiu,Hong Baoning.Application of Logistic and Gompertz curves and optimum combined model to settlement prediction[J].Journal of Disaster Prevention and Mitigation Engineering,2007,27(2):192~195.(in Chinese)

[8]曹建莉,赵梦亚.Gompertz曲线和Logistic曲线在生物数学中的比较与应用[J].佳木斯教育学院学报,2014,(1):140~142.Cao Jianli,Zhao Mengya.Comparison and the application of Gompertz curve and Logistic curve in biology mathematics[J].Journal of Jiamusi Education Institute,2014,(1):140~142.(in Chinese)

拟合预测 篇4

智能车以MC9S12XS128芯片为系统控制核心, 传感器采用CCD摄像头, 摄像头拍摄赛道图像信息后, 经信号处理模块处理后再输入到MC9S12XS128做进一步计算处理来控制电机、舵机, 进而实现小车的智能竞速。

1 图像采集

路径识别系统作为整车的眼睛起到了至关重要的作用, 它决定了小车的行驶路线和车速的高低。

图像采集主要是获取视场中黑线的位置, 基于数字摄像头的图像采集方法就是利用视频复合信号中的行信号进入中断, 以固定时间间隔对每行视频信息提取若干个灰度值信号作为本行的赛道信息。然后根据场信号每场采集若干行作为一场赛道信息, 继而进行斜率、曲率、偏差等的计算。

由于虚线元素的引入, 如图1, 行信号中可能会出现没有黑线信息的情况, 容易导致参数计算错误, 控制出差错的情况, 本文提出了一种既简便快速, 又不失准确性的方法来解决路径采集中的虚线问题。

2 虚线处理算法

算法主要实现了对黑线中心的预测和对虚线的拟合还原两个方面, 整个算法过程如下:

1) 采集每行 (m行n列) 的灰度信号gray[m][n]。

2) 提取黑线中心值b_ce nte r[m], 计算预测值f_ce nte r[m]。

a.黑线中心值b_ce nte r[m]的计算, 如果没有黑线, 用f_ce nte r[m]作为b_center[m]。

b.一次拟合对预测值f_ce nte r[m]的计算

第0行的预测值用上一场的第0行黑线中心值;

第1行的预测值用第0行的黑线中心值;

第2行的预测值通过前两行的黑线中心拟合得到;

第3行的预测值通过第0行和第2行的黑线中心拟合得到;

第4行的预测值通过第0行和第3行的黑线中心拟合得到;

第4行之后的预测值与第4行一样用上一行和向上第四行的黑线中心值拟合得到。

对采集到的视频信号要采集一行处理一行, 不能在整场图像都采集完后再处理。

C环境下的代码如下:

3) b_ce nte r[m]的取值。

通过计算比较b_center[m]和f_center[m], 选取较合理的写进b_ce nte r[m], 第m行是否有黑线中心的有效标志位value[m]=1;如果没有黑线, 用f_center[m]作为b_center[m], value[m]=1。

4) 虚线的处理方法。

大赛规定每段虚线的长度不超过10cm, 通过标定, 每1.25cm采集一行, 则每段虚线最长可以占到9行。需要限制填补的最大行数是为了区别虚线和急转弯等其它丢失图像的情况, 否则智能车会作出错误的判断而冲出赛道。

判断当前行是否有效。如果当前行有效, 继续判断前一行是否有效, 如果前一行无效, 即value[m-1]=0, 则一直向前判断, 在9行之内如果存在有效行, 即value[m-a]==0且a<9, 则将这一段的无效行进行填补。

填补用拟合的方法, 这里用一次拟合法, 通过当前行的黑线中心值b_center[m]和前第a行的黑线中心值b_center[m-a]进行拟合, 并逐行得到其填补的黑线中心值。

利用此法, 可以通过较少的计算量和运行时间快速地对虚线赛道进行处理。对处理后的数据, 再进一步计算斜率、偏移量等不同的参量, 可以为智能车提供更精确的赛道信息, 从而为控制系统的决策提供更加准确丰富的信息。

3 实验结果分析

将此方法运用到智能车的路径采集系统中, 经过实验, 智能车较之以前能够很好的识别虚线赛道, 算法改进前后小车的行驶轨迹, 如图2所示。算法改进后的效果是很明显的, 智能车能够很好的跟随虚线的轨迹。

4 结语

针对智能车赛道中的虚线部分, 采用预测拟合的方法对获得的视频信号中的断续情况进行处理。通过实验与对比, 该算法取得了良好的效果, 解决了比赛中遇到的虚线问题, 也为未来生活中的自动驾驶汽车路径识别系统的设计提供了一些借鉴。

参考文献

[1]邵贝贝.单片机嵌入式应用的在线开发方法[M].北京:清华大学出版社, 2004.

[2]卓晴, 黄开胜, 邵贝贝.学做智能车[M].北京:北航出版社, 2007.

拟合预测 篇5

强震后余震是大地震发生后的常见灾害之一,震后余震对救灾活动、难民安置以及灾后重建等工作有着严重危害。所以,对震后余震的分析及预测就显得尤为重要。

文献[1]在研究了我国20世纪30年代到70年代接近50年内发生的28次地震的强余震序列后,发现了“等待时间”与余震“发生时刻”的对数线性关系,并对其作了初步理论解释。文献[2]分析了广州邻近区域的几次典型的余震序列,发现余震“发生时刻”的对数与“等待时间”对数具有较好线性关系,进一步印证了文献[1]的理论。文献[3]系统地分析了1966~1996年间70余次Ms5.5以上的地震的余震序列,发现强余震“等待时间”模型对6级以上主余震型序列预测成功率较高。文献[4]对多次大震和中强震进行比较研究,发现“等待时间法”对大震的强余震预测效果较好。文献[5]利用混沌理论对汶川地震余震“等待时间”序列进行研究,发现“等待时间”序列存在混沌动力学特征。文献[6]以“等待时间”作为权值弥补双对数变化对余震预测误差的影响,发现经过加权改正后,模型的预测精度有所提升。然而,现有的利用“等待时间法”进行余震预测的研究都是基于文献[1]的理论,仅考虑了“等待时间”的随机误差,运用最小二乘法(LS)或加权最小二乘法对文献[1]的模型进行求解,未能顾及“等待时间”模型中由“发震时刻”构成的系数矩阵的随机误差。

本文根据“等待时间”与余震“发生时刻”的对数线性关系,利用总体最小二乘方法(TLS),同时考虑“等待时间”观测向量的随机误差和以“发震时刻”构成的系数矩阵的随机误差来进行拟合;并将该方法应用在尼泊尔地震的强余震序列预测和拟合中,得到了有益的结果。

1 利用总体最小二乘法拟合的“等待时间”强余震预测模型

1.1“等待时间”强余震预测模型

连续发生的两个强余震之间的时间间隔为后一个强余震的“等待时间”。即:

文献[1]发现“等待时间”与“发震时刻”存在以下对数关系:

在式[1]及式(2)中i为第i次强余震的序号,ti为第i次强余震“发生时刻”(距主震时间),Δti则表示第i次强余震的“等待时间”,以上时间单位均为小时。β0,β1为拟合参数。式(2)中的β0,β1值可通过总体最小二乘方法拟合已知的强余震序列求出。根据得到的β0,β1值可以得到拟合直线,再通过最近一次余震的“发震时刻”对数即可预测出下次余震的时间对数,进而得到下次余震的“发震时刻”。

顾及观测向量和系数矩阵同时存在的随机误差的情况,建立EIV模型如下:

式中y为观测向量值,ey为观测值误差:

A为系数矩阵,EA为系数矩阵误差:

ξ为未知参数:

总体最小二乘的目标函数:

式(8)中vec为矩阵拉直符号。

利用总体最小二乘方法求解的迭代算法可表示如下[7]:

[1]以最小二乘方法得到的为起始点ξ^[1]:

(2)计算出残差:

(3)将式(9)、(10)得到的结果代入式(11)求出:

(4)重复步骤(2)、(3),当:

时终止迭代,本文中取ε=10-10。

精度评定:

1.2 作穷举线求交点

根据总体最小二乘方法拟合得出的β0,β1作拟合直线,并将求出的直线同穷举线作交点,穷举线绘制是依照以下公式进行的:

穷举线与拟合线的交点即为预测的第N+1个强余震,交点的横坐标即为预测下次强余震“发生时刻”的对数值,经过简单变换即可以得到预测时间[6]。

2 以尼泊尔地震为例的强余震序列拟合和预测

2015年4月25日在尼泊尔博拉克(北纬28.2°,东经84.7°)发生的Mw7.8强震给当地人民造成了巨大的生命和财产损失,接踵而来的余震也对救援和安置工作造成了很大的困难。本文分别应用最小二乘与总体最小二乘方法对尼泊尔地震强余震序列进行拟合及预测,并对结果进行讨论分析。

2.1 数据选择

对于余震目录的筛选,在利用“等待时间”序列进行余震预测时,一般采用主震震级减2~3级为余震目录的震级下限,并把时间间隔小于前一强余震“等待时间”的1/20的余震与前一次余震当作同一次能量释放,可以把它从余震目录中剔除[8]。

本例采用的余震目录是由美国地质勘探局(USGS)在其官网提供的尼泊尔Mw7.8级地震5级以上余震序列,并剔除了时间间隔小于前一强余震“等待时间”的1/20余震序列,时间截至2015年4月27日12:35:53(UTC时)。余震目录见表1。

2.2 震例分析

为了验证总体最小二乘方法的拟合效果,本文首先应用最小二乘法和总体最小二乘法对表1中的前17个样本进行拟合,利用总体最小二乘法得到β0=-0.638,β1=1.087,σ02=0.054。利用最小二乘法得到β'0=-0.612,β'1=0.980,σ'02=0.132。以两种方法求得的单位权中误差σ02和σ'02作为拟合线残差。通过求得的参数即可绘出拟合直线,见图1。

根据式(14)作穷举线,穷举线与拟合直线的交点即为预测的第N+1个强余震。预测残差是下一次强余震的“发生时刻”对数值的预测值和实际值之差。分别用eLS和eTLS来表示最小二乘与总体最小二乘的预测残差。结果见图2。

为了体现样本个数对拟合和预测结果的影响,本文进行了如下实验:采用前n个样本预测第n+1次余震,分别利用最小二乘和总体最小二乘方法进行直线拟合并预测下一次余震,样本数从11个逐次增加到19个,进行9次实验,结果见表2。

通过表2及图3可以看出,在该震例中,总体最小二乘对于余震“等待时间”和“发震时刻”对数模型的拟合结果要优于采用最小二乘拟合方法,预测精度在总体上也比直接采用最小二乘有较好的结果。预测残差的绝对平均值由0.082降为0.071,降幅约为13%。拟合残差的绝对平均值由0.071降为0.059,降幅约为17%。图3中随着样本数的增加,两种方法的预测误差都向0值靠拢,而总体最小二乘的结果在整体上更加接近0值。

3 其它地震实例

为了进一步验证总体最小二乘方法应用于余震“等待时间”和发震时刻对数模型的拟合和预测效果,本文另选了几组国内外典型强震的强余震序列样本进行最小二乘方法与总体最小二乘方法对比实验,结果见表3及图4。

由表3和图4可以看到,利用总体最小二乘方法得到的结果比直接运用最小二乘方法得到的结果在拟合精度上有明显的优势,在预测精度方面也有着不同程度的提高。总体上,拟合残差绝对均值从0.133降低为0.053,降低幅度约为60%,预测残差绝对均值从0.170降低为0.148,降低幅度约为13%。其中日本311地震精度提高幅度最大,拟合残差绝对均值由0.301降低为0.078,预测残差绝对均值由0.101降低为0.066,降低幅度分别为74%和35%。

4 总结

本文提出了同时顾及“等待时间”观测向量的随机误差和以“发震时刻”构成的系数矩阵的随机误差,采用总体最小二乘方法来进行强余震“等待时间”序列的拟合,并将其应用到2015年尼泊尔地震的强余震预测中。再经过对10个典型震例的实验分析后,结果表明,总体最小二乘方法可以用于“等待时间”余震模型的拟合以及余震预测;在拟合方面,因为总体最小二乘方法顾及了系数矩阵的误差,所以较最小二乘而言有较好的提升;在余震预测精度方面也有一定的提高。但是由于本文所涉及的余震震例较少,可能未能全面反映总体最小二乘在该方面的优劣性,利用该方式进行实际的余震预测有待进一步研究。

摘要:本文针对“等待时间法”余震预测模型在拟合过程中未考虑系数矩阵的随机误差的问题,利用总体最小二乘方法进行该模型的拟合,并将该方法应用于尼泊尔地震及其它震例的强余震预测。结果表明,运用总体最小二乘方法进行的“等待时间”余震序列拟合和预测所得结果精度比传统的方法在总体上有一定的提升。

拟合预测 篇6

1 数学理论

1.1 曲线拟合

指选择适当的曲线类型来拟合观测数据, 并用拟合的曲线方程分析两变量间的关系。常用的是曲线拟合的最小二乘法, 包括四种基本的曲线模型线性模型、多项式模型、指数模型、对数模型。

1.2 基本原理

第一, 设纵坐标Y代表地下深度。D为孔隙直径, φ代表孔隙度。第二, 用直线法测定孔隙φ。第三, 拟合得到数学模型φ (Y) 。得到孔隙变化规律, 预测区域储层孔隙度。

2 应用实例

假设在某区获得一组薄片测量其孔隙如下。

在载物台上安装机械台以使薄片沿测线而移动, 在移动过程中用目镜微尺测量测线 (测线长度l1) 通过每个孔隙的交切点的长度 (截距) 来测量孔径大小的用直接法观测铸体薄片, 统计各类孔径孔隙 (其中各个薄片选取孔径中值) 所出现的频次。统计表 (如表1)

Di—孔隙直径的组中值;

Ii—各组中值对应的频数;

L—测线总长度为1.0×104μm。

得拟合曲线:

预测区域孔隙度模型:

3 结论

(1) 本文只对模型做了简单介绍, 实际上由于各个地区的实际情况不同, 孔隙度与深度的关系不仅仅只是多项式关系, 还有很多其他模型。

(2) 对研究区通过最小二乘曲线拟合的方法, 对储层孔隙度进行预测, 实际计算表明是可行的。

(3) 该方法提供了一条实用且有效的孔隙度预测途径, 也为其他地区提出了一种预测孔隙度的解决方案。因此, 对于其他地区, 建议根据该研究的思路找出适合的经验公式。

摘要:本文介绍了一种数值模拟方法—曲线拟合法, 在储集岩物性研究中的应用。通过实验测得储层孔隙度, 在一定的误差范围内, 分别建立它与地下深度之间的数学模型, 从而得到储层物性在纵向上的展布规律。进而预测得到整个区域上储层物性的分布规律, 为储层预测提供依据。

关键词:孔隙度,曲线拟合,储层物性,孔隙度预测

参考文献

[1]西南石油大学应用数学教研室.数值计算方法[M].四川:四川出版集团.四川科学技术出版社

[2]彭志方.BP神经网络预测碳酸盐岩地层孔隙度[J].石油天然气学报, 2006, 28 (3) :249-251

[3]雷芬丽, 贺振华, 文晓涛, 等.ZH区碳酸盐岩储层孔隙度预测方法研究[J].石油天然气学, 2010, 32 (3) :236-239

[4]芮小平, 余志伟, 许友志, 等.多重二次曲面插值法在地质曲面拟合中的应用[J].中国矿业大学学报, 2000, 29 (4) :377-380

[5]朱国华.碎屑岩储集层孔隙的形成、演化和预测[J].沉积学报, 1992, 10 (3) :114-121

[6]周怀来, 李录明, 罗省贤, 等.碳酸盐岩储集层模型数值模拟与分析[J].物探化探计算技术, 2011, 33 (1) :20-23

[7]肖慈殉, 罗继红, 肖梅蔡, 等.应用神经网络技术预测碳酸盐岩储层孔隙度[J].天然气工业, 1993, 13 (6) :31-34

[8]徐士良.数值方法与计算机实现[M].北京:清华大学出版社, 2006.259-269

[9]申辉琳, 高松洋.基于BP神经网络进行裂缝识别研究[J].新疆石油天然气, 2006, 2 (4) :39-53

拟合预测 篇7

本文主要是利用三次样条平滑的方法, 基于R统计软件对数据进行拟合及预测, 并根据结果给出对该种方法的评价。在具体的拟合及预测过程中, 我们发现参数的选择对结果会产生一定的影响, 比如随机干扰项e的标准差sd, 数据量n的大小, 结点数knots的多少等。另外, 对于来自不同函数的数据的拟合及预测效果也不尽相同。针对这些不同情形, 我们做了全面细致的对比分析, 找出了影响效果的重要因素, 并以图表的形式一一呈现。

2 理论及模拟方法

关于数据拟合的方法多种多样, 三次样条平滑是其中最重要和常见的一种。其原理是通过构造一系列三次样条函数来对实际数据进行拟合。三次样条函数定义为:设有一组结点, 且在每个小区间上都是三次多项式, 则称fi (t) 是结点上的三次样条函数。

记为基函数, C为样条系数矩阵, 则F=C×T。设为实际数据。利用加权最小二乘法便可以求出样条参数的估计, 即最小化目标函数, 其中W为权重。可以解得。由此可得。。

关于数据拟合的方法多种多样, 三次样条平滑是其中最重要和常见的一种。其原理是通过构造一系列三次样条函数来对实际数据进行拟合。三次样条函数定义为:设有一组结点, 且在每个小区间上都是三次多项式, 则称是结点上的三次样条函数。

记为基函数, C为样条系数矩阵, 则F=C×T。设为实际数据。利用加权最小二乘法便可以求出样条参数的估计, 即最小化目标函数, 其中W为权重。可以解得。由此可得。。

假设数据量保持不变, n=50, 我们分别选取knots=5, knots=6, knots=10, knots=30, 这四种情形。可以看出, 只有当knots=5的时候, 效果不是很好, 其他情况的拟合都非常令人满意。当然, 预测的效果只在短期内近似有效。所以, 当数据量比较适中的时候, 选择knots的数量稍大即可, 但是不能太小。

3.2 随机干扰项e的标准差对拟合及预测效果的影响

基于前面的分析, 我们假设数据量和结点数均保持不变, n=50, knots=50。并且, 仍然是利用函数y=3*sin (0.8*t) +e, 并且e服从均值为0的正态分布, 但是改变e的标准差, 观察当sd=0.1, sd=1, sd=3, sd=5的情形。发现标准差sd越小, 拟合及预测的效果越好, 反之, 标准差sd越大, 拟合及预测的效果越差。尤其是当sd=0.1的时候, 拟合效果相当好, 而sd=5的时候, 拟合的图形变为一条直线, 已经没有了实际意义, 完全不能反映出原始函数的周期性。

3.3 不同函数对拟合及预测效果的影响

数据来自于不同的函数, 对于拟合及预测效果也是有影响的。我们分别采用了指数函数和多项式函数重新对前面的方法进行模拟运算, 并且假定数据量n=50, 结点数knots=50。从模拟运行的结果可以看出, 该方法对于这两类函数的拟合及预测效果都是比较令人满意的。

4 发现

经过反复的模拟测试, 我们发现总的来说, 用三次样条平滑方法对数据进行拟合及预测的效果还是不错的, 在多数时候结果具有较强的可信度。特别是结合统计软件R的使用, 实现起来是相当容易的。不过具体说来, 各种参数如数据量的大小, 结点数的多少, 随机干扰项e的标准差等对运行结果都有一定的影响, 归纳如下:

对于正弦函数等周期函数, 可以达到很好的拟合效果, 但是预测效果较差;

数据量越大, 效果越好;

当数据量较小时, 结点数哪怕取最大, 拟合效果也不好。而当数据量很大时, 结点数太少也会影响效果。所以, 对于结点数而言, 只要不是很少 (对于我们这里涉及的情形一般大于或等于6) , 对结果的影响都不大;

标准差越小, 拟合及预测的效果就会越好, 反之, 如果标准差较大, 函数的信息几乎都被掩盖了, 这个时候所做的拟合及预测本身都已经没有了意义;

对于指数函数以及多项式函数等, 拟合效果较好, 预测的效果也可以达到很好的水平。

摘要:在证券投资分析中, 常常需要对证券价格、成交量等时间序列数据进行拟合及预测, 本文给出了基于R统计软件平台, 利用三次样条平滑得到的数据拟合及预测的原理、方法和应用举例。R统计软件的功能强大, 使用简便, 是进行证券数据分析的重要工具之一。

关键词:R统计软件,三次样条平滑,证券投资,数据拟合

参考文献

[1]何书元.应用时间序列分析[M].北京:北京大学出版社, 2009.

[2]贾俊平, 何晓群, 金勇进等.统计学[M].北京:中国人民大学出版社, 2000.

[3]郑思齐.住房需求的微观经济分析[M].北京:中国建筑工业出版社, 2007.

拟合预测 篇8

自1978 年改革开放以来,我国整体经济一直保持超高速增长,实际人均GDP年平均增长率达到9.0%,被世界誉为“中国奇迹”(林毅夫等,1994)。而自2008 年国际金融危机以来,我国经济不免也受到国际整体经济形势的影响,增长速度有所下滑,至2012 年经济增长率甚至首次低于8%(7.5%)。而在同一时期,天津经济增长却逆势上扬,一直保持强劲势头,维持在高于15%的水平,远超过全国平均水平,近几年其经济增长率连续实现全国各省市第一名。

是什么因素助推天津的经济增长呢?我们进一步把整体经济按照三个产业进行划分,分析相关数据可知天津的产业结构中工业所占比例很高,接近50%,而且这其中重工业的比例超过80%。既然工业对于天津整体经济如此重要,对其未来增长趋势进行分析和预测,可为进一步制定发展规划提供依据。然而,我市工业总产值无疑要受到多种因素的制约,并且各个不相同的因素之间又有可能保持着极其复杂的关系,因而,运用结构性因果模型对天津市工业总产值进行预测,一般难以达到较为理想的预测效果。再者,我市工业总产值序列为非平稳时间序列,对其进行建模拟合和预测不宜直接采用自回归(AR)、移动平均(MA)或自回归移动平均(ARMA)模型分析。ARIMA(autoregressive integrated moving average model) 是由统计学家Box和Jenkins提出的,又被称为B-J模型(the Box-Jenkins Model),可用于非平稳时间序列预测。本文首先分析和整理了我市工业总产值月度数据,进一步建立了工业总产值的ARIMA模型,最后以此对我市工业总产值做出分析与预测,并提出相应的政策措施。本文所采用的我市工业总产值的月度数据的样本区间为1997—2013 年。原始数据(以“亿元”为单位的天津市工业总产值) 来源于天津市统计信息网,使用分析软件为STATA12.0。

二、数据描述与趋势性、季节性调整

图1 是我市工业总产值序列,1997 年1 月至2013 年12 月的时序图。该图显示我市工业总产值呈现不断上涨趋势,但波动的幅度逐渐加大,并且伴随有明显的季节波动。前者预示着可能有逐渐加大的异方差的存在,后者指出我们在数据建模前应对其进行季节调整。

按照时间序列数据处理惯例,我们首先计算经济数据的对数值。这样做的理由是经济学家的研究发现很多经济时间序列数据,具有近似指数的增长速度,即时间序列长期而言趋向于平均每年以一定的百分率增长,如果这样的话,时间序列的对数就有近似于线性的增长速度。另一个理由是,许多时间序列数据的标准差近似于其水平成比例,即标准差可以使用时间序列水平值的百分率来表示,这时时间序列数据对数的标准差近似为常数(注:变量对数的变化近似于变量的比例变化,这一性质来源于Ln函数的导数性质。)。一般来说,这一处理能在相当大的程度上缓解异方差造成的影响。由图3 可见,天津市工业总产值时间序列的波动已经温和多了,这也表明,对数据进行取对数处理是有必要的。由于所使用的数据是月度数据,其不可避免的有月度本身的结构特点,为了使得月度本身不影响模型结果,所以我们下面将对数据进行去除月度特质的季节调整(注:季节调整的原意是对于季节数据要去除其季节因素,此处实际为去除月度结构因素。)。图4 报告了经过月度的季节调整之后的数据图示,可以看出经过处理之后数据已经基本剔除了月度结果特征。

三、天津市工业总产值的ARIMA模型分析

1、单位根检验

经济建模的前提是时间序列必须是平稳的,因而,第一步需要对数据做单位根检验,而不是直接对数据水平量进行分析,从而为有关推论求得更可靠的统计分析依据。在对经过季节调整后的天津市工业总产值对数值时间序列和其差分下列给出单位根检验结果之后,依据所报告的统计量与其相应的临界值进行比较,原数列很可能存在单位根,即为I(1)时序数据。而对于差分序列可以明确的拒绝单位根的存在,即为I(0)时序数据。

2、ARIMA模型中p、q的确定

图4 和图5 分别展示了原数据序列的自相关图和差分以后时间序列的自相关图。图6 和图7 分别展示了原数据序列的偏相关图和差分以后时间序列的偏相关图。

对于ARIMA模型的阶数取决于该序列的自回归函数(ACF)和偏自回归函数(PACF)。我们所用差分序列的AC值和PAC值如下(表2)。

由相关图结合表1 中,如果自相关值(AC) 或偏相关值(PAC)在正、负2 倍的估计标准差之间,则在显著水平为5%的情形下与0 无显著区别。由此可知序列的P和Q按照最保险的方式,均取11 阶即可。至此,我们得到ARIMA模型的(p,i,q)=(11,1,11)。

四、天津市工业总产值的ARIMA模型预测与结果分析

1、模型预测

评价一个经济计量模型的效果,最重要的指标是它的预测。图8 中展示了,我们模型的预测效果和实际值之间的差距。以最近的2013 年为例,我们具体来看模型的预测力。

在表2 中可以看到,模型的预测力还是不错的,即使由于今年天津工业发展与国家经济大势不符,我们的简单模型还是能预测出超过90%比例的变化。

2、模型适用性和结果分析

在我市工业总产值的预测(尤其是短期预测) 上,ARIMA模型是一种比较适用且预测精度较高的预测方法。AR、MA模型假定,事物的变迁符合渐进特征,影响事物的因素在过去、当前和将来基本不变或变化较小,即事物的变迁遵循稳定与类推的法则。因此可根据序列的现有信息和确定趋势以预测未来信息。与此相反,ARIMA模型将预测对象随时间t的变化而生成的序列视为随机序列,即剔除个别源起偶发因素的观测值外,时间序列是一组依赖于时间的随机变量。虽然构成该时间序列的单个序列值具有不确定性,但是,整个序列的变迁所具有的规律,可用数学模型来近似。随机变量的依存关系或自相关性表明了预测对象发展的延续性,可以用时间序列的过去信息与当前信息预测未来信息。ARIMA模型由于不需要对时间序列的发展模式作先验的假设,并且可反复识别与修改,直到获得相对理想的模型。因此,ARIMA模型适合于我市工业总产值非平稳时间序列建模。

摘要:工业在天津经济结构中占重要地位,对其未来增长趋势进行分析和预测,可为进一步制定发展规划提供依据。本文采用自回归求积移动平均(ARIMA)法,对天津市工业总产值进行了拟合和预测。结果显示,ARIAM(1,1,10)模型提供较准确的预测效果,可用于未来的预测,并为天津市未来的工业总产值增长趋势分析提供可靠依据。

上一篇:必然结果下一篇:中西广告的翻译策略