趋势拟合(精选9篇)
趋势拟合 篇1
身高生长发育状况,虽是人体生长的一种外在表现,但其势必要反映人体内在生长发育的必然趋势和本质联系。因此,分析研究学生身高生长发育的现状、规律及其有关特征和差异,是学生体质健康状况调查研究不可缺少的重要组成部分。[1]文献资料显示,直接利用断面静态数据进行动态变化趋势的研究,缺乏科学性。本文依据正式公布的2004年全国学生体质与健康调研报告中的数据,尝试采用曲线拟合方法对山西省与全国城市汉族学生的身高断面资料进行拟合纵向化处理,回代后,再采进行横向和纵向的、动态的、系统的比较研究,剖析身高的变化趋势,并希望此方法能够解决此类研究问题。
1 研究对象与方法
1.1 研究对象
中国学生体质健康监测网络2004年监测报告[2]及山西学生体质健康监测站颁布的全国和山西省6-22岁城市汉族学生身高样本数据。
1.2 研究方法
查阅有关体质与健康调研报告、国民体质研究、生物学等相关文献资料。
1.3 曲线拟合法与统计学方法
采用曲线拟合法对断面数据进行曲线拟合,优化数据资料,将自变量(年龄)回代曲线模型方程,求出优化后各年龄段拟合均值。对身高均值、差值、增长值、增长率进行描述性统计。
2 结果与分析
2.1 山西与全国城市汉族学生身高原始断面资料的变化分析
增长值和增长率可以反映身高指标生长速度变化,即儿童青少年身高在一定时期(如1年)内增长的数量,虽不能反映其群体累计生长情况,但是可以比较客观而敏感的反映儿童青少年发育和健康状况以及某一时期内的生长状况[2]。如图1显示山西和全国增长值和增长率大体一致,生长速度曲线大致可分为7~9岁的匀速增长期、10~12岁的快速增长期、13~18岁的缓慢增长期和19~22岁的相对稳定期。全国和山西相比:全国各年龄增长动态趋势明显些,山西变化幅度明显大于全国,起伏更为明显。但山西、全国各年龄段生长速度缺乏连续变化规律性,并且增长序次差别较大,缺乏连续变化趋势规律,不符合儿童青少年生长发育特点,无法合理解释。分析认为,由于原始数据非纵向追踪数据和测量误差及抽样误差干扰照成的,山西7-18岁抽样为150人,19-22岁为100人。所以用原始断面数据进行动态分析比较缺乏可靠性。
2.2 山西、全国身高均值的最佳曲线拟合
2.2.1 最佳曲线拟合理论与方法
全国科学技术名词审定委员会定义:曲线拟合(curve fitting),是指推求一个解析函数y=f(x)使其通过或近似通过有限序列的资料点(xi,yi),通常用多项式函数通过最小二乘法求得此拟合函数;是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。
曲线模型包括[3]:Linear(Y=b0+b1X)、Quadratic(Y=b0+b1X+b2X2)、Compound(Y=b0×b1X)、Growth[Y=e(b0+b1X)]、Logarithmic(Y=b0+b1lnX)、Cubic(Y=b0+b1X+b2X2+b3X3)、S[Y=e(b0+b1/X)]、Exponential(Y=b0eb1X)、Inverse(Y=b0+b1/X)、Power(Y=b0X b1)。
本文以年龄为自变量(X)、以各年龄段测量均值为因变量(Y),运用Spss 17.0软件曲线拟合,选择合适的最佳曲线模型。然后把自变量(年龄)回代所选择的曲线方程求出因变量(身高值)。
对山西、全国各年龄段身高平均值曲线模型拟合见表1,R2为拟合指数(可决系数),反映方程对实测值的解释程度。R2值越高(越接近1),方差分析F值越大,越具有统计学意义,说明方程对实测值的拟合程度越高,对实测值的解释程度越高;经多次模拟比较,残差分析和对比测量值与拟合理论值误差(由于计算量大,受篇幅限制此文略),且各模型Sig.的F值的显著水平P<0.01。均衡考虑,以Cub模型拟合为最佳。
2.2.2 最佳曲线拟合前后对比分析
经Cub模型拟合后,回代后山西与全国各年龄身高增长值、增值率拟合前数据比较,具有动态趋势,更符合青少年发育特点,一致性程度更明显。图2为拟合回代后增长值、增长率动态趋势,山西省与全国城市的汉族男学生身高生长速度变化趋势及差别表现更为直观。
2.3 山西、全国城市汉族男学生身高拟合后变化趋势分析
由图2,山西与全国城市汉族男学生身高均值均到20岁不再增长;增长值与增长率山西7-15岁均高于全国水平,15岁后落后与全国水平。以每年5cm增长速度为参照标准分析,身高增长速度最快的3个相邻年龄组(快速增长期或突增期)[2],山西与全国均为7~9岁和10~12岁。13~19岁增长速度缓慢下降和20以后降至最低。这与拟合前趋势基本一致。
总体上,山西、全国城市汉族男学生身高,动态拟合后生长速度具有了同样的变化趋势,增长率与增长值秩序的年龄段是接近的、连续的。增长值和增长率随年龄增长变化,在小幅上升后不断下降。20岁后身高均值,有随年龄的递增,其均值逐渐降低,增长值和增长率出现负增长的现象,成年学生这种身高降低的现象,和骨细胞的耗损率有直接的联系,也和关节盂中软骨、椎间软骨的胶原纤维的丧失有密切关系,最终导致骨质疏松,椎间盘萎缩,脊椎骨扁平,下肢弯曲,从而使身高下降。[4,5,6,7]
3 结论
(1)身高是反映人身体形态结构和生长发育水平,人体生长发育的过程,是一个长期连续动态的过程。拟合后的资料研究显示山西省和全国城市的汉族学生身高均值趋势一致,20岁趋于稳定,成年学生身高均值有降低趋势。
(2)拟合后山西与全国城市汉族城市男学生生长速度具有了同样的变化趋势,均随年龄增长变化,在小幅上升后不断下降。与拟合测试断面数据基本一致。全国与山西省增长速度曲线在6岁和15岁时两次交叉。
(3)以非追踪横向断面数据为依据进行动态推断时,一定要考虑分析对象的动态变化特征,本研究尝试用曲线拟合进行资料的变换,揭示事物变化规律,由于研究受测试横断面人群、测试条件控制等因素的影响,拟合出来的变化曲线,可能与实际状况不完全吻合,但总体变化的特点和趋势仍基本一致,需在以后的研究中调整曲线模型。
摘要:文章运用曲线拟合的方法,将全国和山西省城市汉族722岁男学生各年龄段断面的身高数据拟合转换为纵向连续资料,选取最佳曲线拟合模型,对比分析揭示内部变化规律。发现山西与全国城市汉族722岁男学生身高均值与生长速度变化趋势一致,均在79岁和1012岁身高进入生长突增期,1319岁增长速度缓慢下降,20岁趋于稳定后身高均值有随年龄增长而降低趋势。全国与山西省增长速度曲线在6岁和15岁时两次交叉。
关键词:曲线拟合,身高,趋势
参考文献
[1]陈志强,胡晓帆,柳志鹏.中国汉族7~22岁学生身高生长发育变化差异性评价研究[J].北京体育大学学报,2001(1):69-71.
[2]教育部体育卫生与艺术教育司.中国学生体质健康监测网络2004年监测报告[M].北京:高等教育出版社,2006:56-332.
[3]全国体育院校教材委员会.体育统计[M].北京:人民体育出版社,2002:200-204.
[4]N.D.Cante(r英)发育生长衰老[M].北京:人民卫生出版社,1983.
[5]上海第一医学院.组织胚胎学[M].北京:人民卫生出版社1978.
[6]夏廉博.衰老生物学[M].北京:知识出版社,1987.
[7]孙飘,王梅.成年人形态体质指标变化的年龄特征[J].南京体育学院学报(自然科学版),2003(2):1-5.
趋势拟合 篇2
学生学号
所在班级
指导教师
一、课程设计名称 函数逼近与曲线拟合 二、课程设计目的及要求 实验目的: ⑴学会用最小二乘法求拟合数据的多项式,并应用算法于实际问题。
⑵学会基本的矩阵运算,注意点乘与叉乘的区别。
实验要求: ⑴编写程序用最小二乘法求拟合数据的多项式,并求平方误差,做出离散函数 与拟合函数的图形;⑵用 MATLAB 的内部函数 polyfit 求解上面最小二乘法曲线拟合多项式的系数及平方误差,并用MATLAB的内部函数plot作出其图形,并与(1)结果进行比较。
三、课程设计中的算法描述 用最小二乘法多项式曲线拟合,根据给定的数据点,并不要求这条曲线精确的经过这些点,而就是拟合曲线无限逼近离散点所形成的数据曲线。
思 路 分 析 : 从 整 体 上 考 虑近似 函 数)(x p 同 所 给 数 据 点)
(i iy x , 误 差i i iy x p r )(的大小,常用的方法有三种:一就是误差i i iy x p r )(绝对值的最大值im ir 0max ,即误差向量的无穷范数;二就是误差绝对值的与 miir0,即误差向量的 1成绩评定
范数;三就是误差平方与 miir02的算术平方根,即类似于误差向量的 2 范数。前两种方法简单、自然,但不便于微分运算,后一种方法相当于考虑 2 范数的平方,此次采用第三种误差分析方案。
算法的具体推导过程: 1、设拟合多项式为:
2、给点到这条曲线的距离之与,即偏差平方与:
3、为了求得到符合条件的 a 的值,对等式右边求 偏导数,因而我们得到了:
4、将等式左边进行一次简化,然后应该可以得到下面的等式
5、把这些等式表示成矩阵的形式,就可以得到下面的矩阵:
niininiiknikinikinikinikiniiniinikiniiyyyaax x xx x xx x11i11012111111211 1an 6.将这个范德蒙得矩阵化简后得到 n kkn nkkyyyaaax xx xx x 21102 21 1111 7、因为 Y A X * ,那么 X Y A / ,计算得到系数矩阵,同时就得到了拟合曲线。
四、课程设计内容 ⑴实验环境:MATLAB2010 ⑵实验内容:给定的数据点
0 0、5 0、6 0、7 0、8 0、9 1、01、75 1、96 2、19 2、44 2、71 3、00 1)用最小二乘法求拟合数据的多项式;2)用 MATLAB 内部函数 polyfit 函数进行拟合。
⑶实验步骤 1)首先根据表格中给定的数据,用 MATLAB 软件画出数据的散点图(图 1)。
2)观察散点图的变化趋势,近似于二次函数。则用二次多项式进行拟合,取一组基函数 ,并令 ,其中 就是待定系数。
3)用 MATLAB 程序作线性最小二乘法的多项式拟合,求待定系数。
算法实现代码如下: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];R=[(x、^2)“ x” ones(7,1)];A=Ry“
4)用 MATLAB 程序计算平均误差。
算法实现代码如下: y1=[1 1、75 1、96 2、19 2、44 2、71 3、00];x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=x、^2+x+1;z=(y-y1)、^2;sum(z)5)作出拟合曲线与数据图形(图 2)。
6)用MATLAB 的内部函数 polyfit 求解上面最小二乘法曲线拟合多项式的系数及平方误差。
算法实现代码如下: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];A=polyfit(x,y,2);%二次多形式拟合% z=polyval(A,x);A d=sum((z-y)、^2)7)绘制使用 polyfit 函数实现的拟合图形。(图 3)五、程序流程图
图 5-1 用最小二乘法求多项式拟合曲线流程图
图 5-2 用 polyfit 函数求多项式拟合曲线流程图 六、实验结果 输入初始数据点 根据原始数据绘制散点图 分析数据点变化趋势,确定拟合多项式 用最小二乘法求系数矩阵,确定多项式 用所求的多项式,计算误差 绘制拟合曲线 输入初始数据点 调用 polyfit 函数,确定多形式的系数 调用 plot 函数进行绘图 调用 polyval 函数,进行多项式求值
图 6-1 表中数据的散点图
图 6-2、最小二乘法实现的拟合曲线 第 1 问
系数为 A =
1、0000
1、0000
1、0000 则多项式的方程为
平方误差与为 ans =1、9722e-031
图 6-3、polyfit 函数实现的拟合函数 第 2 问 系数为 A =
1、0000
1、0000
1、0000 则多项式的方程为
平方误差与为 ans =
1、9722e-031
七、实验结果分析 编写程序用最小二乘法求拟合曲线的多项式的过程中,求出的数据与拟合函数的平方误差很小,达到了很高的精度要求,以及通过散点求得的拟合曲线比较
光滑。而用 MATLAB 的内部函数求 polyfit 求解的曲线拟合多项式与平方误差与程序求得的相同,还有就就是虽然求解过程简单了,但用 MATLAB 的内部函数做出的图形由明显的尖点,不够光滑。
此次实验数据较少,而且数据基本都就是可靠数据。但就是在应用实际问题中,数据会很庞杂,此时对于最小为乘法的算法就需要进一步的细化。例如在进行数据采集时,由于数据采集器(各种传感器)或机器自身的原因及其外部各种因素的制约,导致数据偶尔会有大幅度的波动,及产生一些偏差极大的数据,不能真实反映数据的可靠性,所以会对数据进行筛选或修正。而此时就可应用曲线拟合的最小二乘法的进行处理。
八、实验心得体会 在日常的学习与生活中,我们可能会遇到各种方面的跟数据有关的问题,并不就是所有的数据都就是有用,必须对数据进行适当的处理,然后找出数据之间的关系,然后进行分析得出结果。此次实验结果基本没有大的区别,可就是MATLAB 提供给我们一个特别简洁的办法,应用一个函数即可实现相同的结果。虽然很方便,但就是对于初学者来说,我觉得打好基础才就是关键,对于一个知识点,应该掌握其最基本的原理,然后在将它应用于实际。
通过这个实验我也理解到了,数值分析就是一个工具学科,它教给了我们分析与解决数值计算问题得方法,使我从中得到很多关于算法的思想,从中受益匪浅。
附录:源代码 散点图: x=[0 0、5 0、6 0、7 0、8 0、9 1、0];y=[1 1、75 1、96 2、19 2、44 2、71 3、00];plot(x,y,”r*“)title(”实验数据点的散点图“);legend(”数据点(xi,yi)“);xlable(”x“);ylable(”y“);最小二乘拟合:
基于机器学习的过度拟合现象 篇3
【关键词】过度拟合 学习评价 考试
【中图分类号】G64【文献标识码】A 【文章编号】2095-3089(2016)03-0149-01
在机器学习中有这样的一种现象:当一个假设可以在训练数据上获得很好的拟合,但是在一般的数据集上却无法取得很好的拟合数据。我们将这种现象称为过度拟合(overfiting)。现在的数学教学,很多学生能够在考试当中取得不错的成绩,但是对于数学知识的迁移,应用能力薄弱,即我国数学教育中的过度拟合现象,下面将对出现这一现象的成因分析。
1.数学教学中的过度拟合现象
课程标准是对学生在经过一段时间的学习后应该知道什么和能做什么的界定和表述,反映了国家对学生学习结果的期望。我国不同地域不同阶段的中学数学教学以教育部颁布的《全日制义务教育数学课程标准(实验稿)》和《全日制普通高中数学新课程标准》(以下统一简称《新课标》)为标准,根据《新课标》给出的内容标准(划定学习领域)和表现标准(规定学生在某领域应达到的水平)制定相应的《教学标准》和《考试标准》,合理的安排教学时间、内容与进度,学业成绩考试。
1.1教学与大纲的过度拟合
《教学大纲》所关注的是学生在知识和技能方面的要求,规定了教学重点、难点、时间分配等具体内容,强调学科自身的系统性、逻辑性,重视终结性评价和评价的筛选评判功能。对教材编写、教师教学和学业评价的影响是直接的、严格控制的、硬性的!
《新课标》提出了知识与技能、过程与方法、情感态度与价值观三位一体的课程目标。体现了学科课程服务于学生发展的功能。密切教科书与学生生活以及社会、科技发展的联系。评价主体是多元的、评价方式多样化。更多的是强调过程评价和评价的教育发展功能,对教材编写、教师教学和学业评价的影响是间接的、指导性的、弹性的。中国的现实是数学教学往往侧重于数学基础知识的传授和基本技能的训练,忽视了学生的真正需求,学习方法和良好习惯的培养。
1.2情景与解法的过度拟合
回顾教材,我们发现很多数学题目在创设情境的过程中与生活情境相脱离,但是却与相关数学概念性质定理解题方法过度拟合。以一元二次方程为例这类题目有着广泛的生活背景,但都是通过已知求解的方式进行考核的,问题模式固定,为了解题而解题的教学,为了解题而创造的问题,脱离生活情境,使得学生迁移创新能力的下降。
1.3学生数学能力与解题能力的过度拟合
2014年《数学高考考试大纲》指出学生数学能力包括:1)思维能力;2)运算能力;3)空间想象能力;4)实践能力;5)创新意识;其中思维能力、运算能力、空间想象能力都包含在解题能力之中;过份的追求成绩最终导致的是学生实践能力创新意识不足,也使得数学与现实社会愈加脱节。
2.成因分析
2.1社会因素功利性实用性角度
高考的功能是选拔,虽然应试教育已成众矢之的,但是以考试来选拔人才的机制有极大的合理性和很大的价值,实行考试制度是历史的选择,时代的要求,它因社会需要而产生,又因其有利于社会发展且具有很强的生命力。考试是公正的选拔人才的工具,是教学质量评价的手段。又是教学管理的方法,因为高考人才选拔的特殊职能,使得个人与家庭的命运与之紧密联系起来,所以使得命题更加谨慎。
2.2以纲为纲
在教学的过程中需要有个“纲”,然而“纲”到底是什么?它是“考纲”或各地的“考试说明”,还是教学大纲?我们可以看到在中学教学的过程中,很多的教学仅以考纲或考试说明为依据,因为考纲给出的是高考所要考核的知识的条目和要求,这样在教学与复习中更加的简单有效的提高学生的高考成绩。
教师的认识是存在差异的。从平时的听课以及与老师们交流的情况来看,许多老师是只讲事实不讲“理”,他们对“理”的理解仅是某版本(自己使用的)教材上的符号描述,这些符号仅停留在知识的事实性或概念性知识的层面,很少将其上升到方法性和价值性的层面。典型的表现就是热衷于这些符合的机械记忆,死背硬背甚至是默写成了师生复习的法宝。
3.反思
在某方面来讲,实际上是我们教学不到位的表现。重事实,轻理性;重结果,轻过程;重做题,轻思辨;重复习,轻新课;重抠本,轻加工……其结果是我们将总是陷于这种超“纲”的争议中不能自拔。
参考文献:
趋势拟合 篇4
一、研究方法、数据来源及指标选取
( 一) 研究方法
科学合理地考察研究对象,需要考虑多方面的问题,进而进行多角度的、综合性的分析。主成分分析提供了一种较好的解决复杂问题的方法, 它将多种指标综合处理,以最终少量指标反映整体信息,较好地实现了降维思想的应用。假设原始变量的m维空间,需要找到新的m个坐标,两者的空间关系可以表示为[13]:
其中,l表示新变量,( l < m) ,反映了事物原有的绝大多数信息,p为原始变量的主成分,每个新变量均为原始变量x的线性组合[13]。本文运用SPSS软件,分别对1998年、2008年所有因子进行主成分分析,得到每个主成分的得分值,并以旋转后的方差贡献率作为权重,与各主成分间的加权求和得到两个年份的旅游业绩效系统总分值和子绩效得分值。
其中Ai为第i个城市旅游业绩效总得分值,D为第j个主因子在第i个的样本得分值,ωi为第j个主因子的方差贡献率占4个主因子累计贡献率的比重。
( 二) 数据来源与指标选取
城市旅游业绩效评价核心是科学合理的制定出旅游业绩效评价指标,鉴于目前国内外旅游业绩效评价标准尚未出台,以往的评价体系更多的关注旅游业收入,围绕旅游业的经济效益展开,实质上,旅游业绩效评价是一个综合的、关联性强的多指标多层次的综合评价,不仅要体现旅游业的经济效益,市场客源份额的占有量,更要反映旅游业投入和产出的效率问题,以及旅游发展带来的社会公平性。综合以上问题,本文在前人研究的基础上[14],参考政府部门相继制定的服务业考核绩效的评价体系,并按照科学性、代表性、可比性、 量化性及数据的可获得性原则,建立了转型期城市旅游业绩效系统评价体系 ( 表1) ,该体系包括1个目标层,4个准则层和20个指标层。文章以泛长三角地区42城市为研究单元,在时间序列上选取1998年、2008年两个时间断面,文中涉及所有基础数据均来自1999年、2009年 《江苏省统计年鉴》、 《浙江省统计年鉴》、 《安徽省统计年鉴》、 《上海统计年鉴》、《中国城市统计年鉴》、《中国旅游统计年鉴》以及各地级市的国民经济和社会发展统计公报。
二、城市旅游业绩效系统空间分异特征
( 一) 主成分因子的提取
借助SPSS17. 0软件,首先对原始数据进行无量纲处理,结果通过KMO和Bartlett球度检验,并对因子载荷矩阵加以旋转,得到主因子载荷矩阵 ( 表2) 。结果显示,KMO值为0. 836,适宜进行主成分分析,经方差极大法旋转后,前4个主成分的累计方差贡献率为80. 473,包含了20个指标的大部分信息,说明选择4个主成分较为恰当。由主成分载荷矩阵可出看出,第一主成 分与X1、X2、 X5、X8、X12、X14、X19有较大正相关,根据其代表的意义判断为经济绩效因子; 第2主成分与X4、X6、X7、X11、X17有正相关,判断为市场绩效因子; 同样,第3主成分与X3、X10、X13、X16以及第4主成分与X9、X15、X18、X20分别判断为效率绩效因子和公平绩效因子,尽管在时间上变化存在差异,但相关主成分反映的实质没有改变,因而下文中依然运用四个子绩效的原始名称。
( 二) 城市旅游业绩效子系统空间分异特征
城市旅游业绩效不仅在时间上呈现明显的区域差异性,还反映在地域空间上,本文利用上述计算得出的主成分因子得分以及公式 ( 2) ,分别计算出城市旅游业绩效系统总分值和各子绩效得分值,结合Arc GIS9. 3软件平台,采用最佳自然断裂点法进行分级,得到1998年和2008年经济绩效、 市场绩效、效率绩效、公平绩效的空间分异图 ( 图1 - 图4) 。
1. 经济绩效空间分异特征。经济绩效对于旅游业绩效整体而言贡献度最大,在得分值上明显高于其它子绩效,1998年绩效最大值和最小值分别是上海和巢湖,分值为1. 037、 - 1. 293,较之2008年,表现较低的得分值,在平均值上,后者是前者的近两倍; 区域差异上主要以江浙沪分值较高,较低值基本位于安徽省内,其中,高于平均值的城市占据比例分别为61. 90% 、52. 38% ,说明经济绩效的区域差异较为显著。在总体上提高的情况下,2008年高分值与低分值的差异距离增大,这一现象与城市经济发展水平较为吻合,快速发展的经济速度对于经济绩效的提升起到了重要作用,同时,经济绩效差异的加大也进一步加剧了地区旅游业绩效水平的整体不协调; 在空间上,两个年份变化较大的主要在浙江地区,宁波经济绩效水平提高的较为显著,丽水、金华、台州经济绩效水平提高较慢; 在区域上,江苏省整体上与浙江省相比,表现出更为显著的绩效水平提高,尤其到了2008年,浙江南部的丽水、金华等城市转换到较低值区域,加大了与江苏省城市的差距 ( 图1) 。
2. 市场绩效空间分异特征。市场绩效一定程度上与地区经济发展水平息息相关,反映了生产市场和消费市场两者之间的比例关系,市场绩效越高,反映了区域旅游市场的发育程度较高,反之,市场发育 程度较低。图2可以看出,高于1998年平均绩 效的城市 有30个, 占据比例 为71. 43% ,高于2008年平均绩效的 城市有28个, 占据比例为66. 67% ,也在一定程度上说明了2008年较之1998年,城市旅游业市场绩效地区差异呈现加大态势,且得分值表现为增大。在地域空间上呈现明显的区域不平衡特征,1998年高值区域主要在上海、苏锡常、南京以及杭州与宁波,低值区域主要集中在安徽的豪州、阜阳、六安、池州等城市,到了2008年,高值区集聚增多,在数量上较之1998年增加了5个,且高于平均值的城市有29个,占据比例为69. 05% ,较低的得分值区域数量上明显减少,总体格局上2008年较之1998年,表现出更多的较高绩效值。这一时期主要得益于国内旅游业和入境旅游业的快速发展,市场规模和空间得到进一步提升和增大 ( 图2) 。
3. 效率绩效空间 分异特征。通过图3可知, 相比其它子绩效而言,在得分值上处于最低的一个子系统,说明泛长三角地区城市旅游业效率绩效水平总体较低,旅游业投入与产出的配置比例不合理,这与如今的旅游业粗放型生产方式有密切关系,劳动密集型、技术投入比重较低成为旅游业效率提升的最大障碍。尽管效率绩效2008年得分整体上高于1998年,但高值区域城市数量减少, 低值区域城市的数量却呈相反态势,且呈现高度集聚的特征,一定程度上抑制了旅游业效率绩效总体水平的提升。其中,1998年高于平均得分值的城市有23个,占据54. 76% 的比例,2008年高于平均值的区域城市数量为21个,占据比例为50% ,两个年份低于平均值的区域城市主要集中在安徽省,分别占据 安徽省总 城市的70. 59% 和76. 47% ,处于中间水平的城市主要集中在江苏的中北部和浙江的西南地带,随着时间的推移,也发生了较大的变化,反映在空间上,以较低值区域代替了原来的较高值区域,当然,这里的高值与低值、较高值与较低值均是相对意义的表述,是在同一年份的数值大小的比较,不具有绝对意义。
4. 公平绩效空间分异特征。公平性是旅游业发展一定阶段的产物,加强对旅游业公平性的探索,以便为游客和城镇居民提供共享的平台。通过图4可以看出,泛长三角地区旅游业公平绩效高值区域和低值区域所占比例均较小,绝大多数城市处于中间水平,说明公平绩效总体水平较低,主要由于旅游业从业人数在地区就业总人数中的比例较小,加上泛长三角地区城市化步伐加快,居民所享有的公共绿地面积减少,城市发展为居民提供的服务设施空间在一定程度上受到压制,同时,旅游专业院校开设比例在整个城市所占的比例不高, 尤其是提供的高等专业教育机会较低,某种程度上也带来了旅游专业人才的短缺,以上因素延缓了旅游业公平绩效水平的整体提升。公平绩效值最大的是上海,其增幅率为4. 38% ,而效率值最小的池州,增幅率分别为31. 54% ,这也在另一方面说明了绩效水平的增加速度和效率值的大小不成正比,效率值较低的城市,其增幅率往往较高。 因而,对于目前尚处于公平绩效较低的城市来说, 加大旅游业公平性的投入,势必对于整个旅游业绩效水平的提高将起到重要作用。
三、城市旅游业绩效系统空间类型划分
结合公式 ( 2) 计算得出泛长三角城市旅游业绩效总得分,利用GIS软件按照最佳自然断裂点法将其空间化,绘制出1998年、2008年泛长三角城市旅游业绩效空间分异图。在此基础上,按照得分划分为四个类型区域,即高水平绩效区域、较高水平绩效区域、中等水平绩效区域以及低水平绩效区域 ( 图5) 。其中,高水平绩效区域在空间上呈现扩大态势,由1998年的9个城市增加到2008年的12个城市,所占比例 由21. 43% 相应增加 到28. 57% ,整体格局向南北两侧扩大; 较高水平绩效区域总体上呈现缩小态势,城市比例由1998年的38. 10% 变化到2008年的28. 57% ,主要分布在江苏和浙江两省; 中等水平绩效区域分布没有规律性,整体格局较为分散,所占比例较小; 低水平绩效区域以安徽省的大部分城市为主,总体格局基本保持不变,占据区域城市总数的23. 81% 左右,这也与安徽省旅游业发展水平整体较低有密切联系。上述数据分析表明,转型期的泛长三角地区城市间旅游业绩效水平差异显著,以安徽为主的低水平集聚较多,尽管当前安徽致力于发展旅游业,而事实上,除合肥和安徽的旅游业发展水平尚可外,其它城市旅游发展均处于较低水平,不足与长三角城市展开竞争,近年来,急需改变现状, 立足发展实际,形成旅游精品,在泛长三角地区打造出自身的特色,形成最广泛的市场竞争力,实现旅游业绩效水平的整体提高。针对旅游业绩效系统的空间类型划分,客观上为泛长三角城市旅游业发展进行分类指导提供科学依据。
四、转型期城市旅游业绩效子系统演变趋势 分析
本文在分析城市旅游业绩效系统空间分异的基础上,为进一步探究绩效子系统的时空演变趋势,分别对1998年、2008年的子系统进行趋势拟合 ( 图6) 。可以看出,两个时间断面子系统的演变趋势较为相似,呈现相对一致的波动特征。趋势方程的总方差、常数项均通过显著性检验 ( 显著水平小于0. 05) ,拟合优度R2达到0. 8以上,精度效果较好 ( 表2和图6) 。从波动的峰值和谷值看,波峰总是出现在旅游业发展水平较高的城市, 比如,上海、南京、杭州等。波谷较多的出现在安徽省的部分城市,从拟合曲线看,总体回归系数绝对值远小于1,说明泛长三角城市市域旅游业绩效子系统差异绝对量较小,但在时间尺度的变化上, 市域间子系统的相对差异在短时期内依然存在。拟合曲线的选择上,初步选取了线性回归、对数回归以及指数回归,综合比较后发现,线性回归的拟合曲线更有代表性和规律性,也说明了泛长三角城市旅游业绩效子系统演变趋势符合线性增长模式。
五、结论与讨论
综合运用SPSS和Arc GIS软件定量分析转型期泛长三角城市旅游业绩效系统空间分异特征,并对其演变趋势进行了探讨,得到以下结论:( 1) 多年来,泛长三角城市旅游业绩效水平总体上处于增大态势,表现在空间格局上,以江浙沪所属城市绩效值较高,安徽多数城市绩效值较低,且经济绩效对于整体绩效的贡献度最大,效率绩效贡献度最小,商品零售业的发达程度、旅游促销手段的运营模式、游客消费水平以及旅游业投入比重等起到了重要影响作用。 ( 2) 旅游业绩效作为一个综合系统,系统功能的完美发挥关系到旅游业的顺利发展和整体水平的提高,通过实证研究发现, 转型时期旅游业子系统均呈现不同程度的空间分异,客观上形成了旅游业绩效系统不同的空间类型。其中,经济绩效系统区域差异格局显著,在整体绩效值提高的情况下,高值区与低值区差异的距离增大; 市场绩效系统地域空间上呈现明显的区域不平衡特征; 效率绩效系统和公平绩效系统相比其它两个子系统,数值上较低,但效率值的增幅率较高。 ( 3) 城市旅游业绩效子系统演变趋势呈现波动性特征,且两个时间断面的演变趋势较为相似,表明了泛长三角地区市域间旅游业绩效子系统差异绝对量较小,但在时间尺度的变化上, 市域间子系统的相对差异在短时期内依然存在,且这种演变趋势符合线性增长模式,未来有着更为广阔的提升空间。
当前,旅游业发展面临前所未有的机遇和挑战,在宏观经济大转型的背景下,开展旅游业绩效系统空间分异及其趋势拟合研究,对于认清旅游业发展态势,提升旅游业绩效水平,把握旅游业的转型方向,缩小区域旅游发展水平有着极为重要的价值。然而,多年来,旅游业绩效问题评价标准尚未建立,对于快速发展的泛长三角地区无疑是一个障碍,使其无法从根本上认识到自身优劣,因而,有必要加快制定旅游业绩效评价标准的出台, 为各级政府旅游发展提供参考依据。
摘要:本文选取1998年、2008年两个时间断面,综合运用SPSS和Arc GIS软件定量分析泛长三角城市旅游业绩效系统空间分异特征,并对其演变趋势进行了探讨。泛长三角城市旅游业系统呈现明显的空间分异,空间格局表现为以上海为中心的长三角地区绩效值较大,安徽省的旅游业绩效值较小,子系统绩效值与旅游业发展水平呈较高的线性相关性;在此基础上,客观地划分城市旅游业绩效类型,并基于时空尺度对城市旅游业绩效子系统进行趋势分析与拟合,表明子系统演变趋势符合线性增长模式,有着较好的提升空间。
长方体的拟合方法 篇5
在工程测量中, 经常需要确定一些建筑物的空间位置和形态, 最常见的如确定一个长方体形状物体的各顶点坐标。传统工程测量应用中, 可以测量长方体的八个顶点坐标, 利用长方体各棱之间的相互垂直关系, 运用条件平差对顶点坐标进行改正, 从而确定长方体形房间的顶点坐标[1];本文提出一种新的测量方法:测量长方体的六个表面上均匀分布的若干点, 根据六个平面的关系来拟合长方体的形态。显然, 观测六个平面上多个点拟合出的长方体精度要高一些。测量长方体六个面的数据后, 有两种方法可以拟合出长方体空间形态, 本文将加以详细讨论。
无反射电子全站仪无需安装棱镜或反射片就可以测定待定点的三维坐标, 功能强大, 操作简单, 在建筑物表面测量中应用十分广泛[2]。
本文将以同济大学某房间为例, 利用索佳SET230R无反射电子全站仪在房间内设站, 精确测量房间六个内表面上均匀分布的若干点位, 根据最小二乘原理, 用两种方法拟合出房间的形态, 并对两种方法的拟合结果加以比较分析。
1 拟合原理
对长方体形房间六个墙面上的点位进行观测, 需求得长方体的六个平面参数以及八个顶点坐标。有两种方法可以实现, 方法一是先独立拟合六个平面, 然后求取六个平面的交点坐标, 即长方体的顶点, 再根据长方体的各棱之间的垂直关系对顶点的坐标进行微调, 从而精确确定顶点坐标, 在此称之为顶点拟合长方体;方法二是直接利用实测的六个平面上的点位坐标, 附加平面之间的平行与垂直限制条件, 通过附加限制条件的间接平差来求得六个平面的参数, 在此称为平面直接拟合长方体。下面将详述两种方法的原理和计算过程。
1.1 顶点拟合长方体
空间平面的方程[3,4]可以表示为:
(a b c) T表示平面法线方向的单位矢量, 因此a2+b2+c2=1。由于平面的法线方向不能唯一确定[5], 同一平面的法线可以表示为 (a b c) T或 (-a-b-c) T, 为唯一确定该矢量, 规定:a>0;若a=0则b>0;若a=0, b=0, 则c>0 (由单位矢量的定义可知此时c=1) 。d为坐标原点到该平面的距离。
通过测量的点位坐标 (xiyihi) T, 根据最小二乘法求取参数。误差方程为:
另外, 由条件a2+b2+c2=1可得限制条件:
由以上 (2) 、 (3) 两式, 通过附有限制条件的间接平差[6]即可计算出参数值。
分别拟合出六个面后, 得到六个面的参数 (aibicidi) T (i=1, 2, 3, 4, 5, 6) , 如图1所示, 则前、上、左三个平面的交点1的坐标:
类似地, 求出八个顶点的坐标 (xj0yj0hj0) T (j=1, 2, 3, 4, 5, 6, 7, 8) 作为近似值, 调整八个顶点的坐标使之满足长方体的必要的条件:
(1) 组成顶点2的三条边两两正交;
(2) 组成顶点4的三条边两两正交;
(3) 组成顶点5的三条边两两正交;
(4) 组成顶点6的三条边两两正交;
(5) 组成顶点7的三条边两两正交;
以上15个正交条件可以任意选择, 但是独立的条件个数是15个。顶点i处的ij棱与ik棱相正交的条件式为:
将式 (5) 线性化得:
根据上述公式组成15个条件方程:
式 (7) 中, δX是顶点的三维坐标改正数。
根据最小二乘原则, 利用条件平差进行解算, 求得:
迭代至改正数符合限差后, 可以计算出顶点坐标, 根据顶点坐标可以反求六个平面的平面方程参数。
1.2 平面拟合长方体
1.1节是先独立拟合长方体的六个平面, 再由平面方程求长方体顶点, 然后对顶点坐标微调使之满足长方体的垂直关系。还可以直接对长方体的各平面进行拟合, 在拟合的同时附加各平面之间的平行与垂直关系进行限制, 通过附有限制条件的间接平差来拟合长方体。
空间平面的方程形式如式 (1) , 由于长方体的上下面相互平行, 即两个面的平面方程中参数a、b、c相同, 因此可以将上、下面的平面方程分别表示为:
同理, 前后面、左右面的平面方程可以表示为:
根据 (9) 、 (10) 两式, 得误差方程:
其他常数项lj1、lj2、lk1、lk2可以根据li1、li2的形式类似地写出来。
由单位向量的定义可以得到三个限制条件
长方体的上 (下) 面、左 (右) 面、前 (后) 面之间相互垂直, 因此满足
将式 (12) 、式 (13) 线性化, 得到六个限制条件:
由式 (11) 、 (14) , 利用附有限制条件的间接平差方法, 得误差方程:
根据最小二乘原则, 组成法方程:
权阵P可以取单位阵, 由此计算出各平面方程的参数改正数, 迭代至符合限差即可。
由平面方程的参数, 根据式 (4) 可以计算长方体顶点的坐标。
1.3 两种方法的比较
以上两种方法, 方法一是先单独拟合六个平面, 然后由平面方程来计算顶点坐标, 再对顶点坐标进行微调使之满足长方体的平行与垂直关系;方法二是直接拟合六个平面, 附加长方体的限制条件。方法一计算比较简单, 但是精度不如方法二, 因为长方体的顶点坐标是由平面算出的, 在对顶点坐标进行调整时, 只能满足顶点坐标的改正数最小, 而每个面上观测点的残差平方和并不能满足最小的条件。而方法二是对直接观测值的改正, 因此方法二能够满足观测点最佳拟合于长方体。方法二的局限性在于:当观测的点位个数比较多时, 误差方程系数阵维数高, 计算量大。
2 实例计算
现以某长方体的房间为例, 观测了房间内表面上均匀分布的96个点, 每个面上的点位均多于10个。用上面两种方法分别进行长方体的拟合。
先独立拟合六个平面, 由式 (2) 、式 (3) 计算得六个平面的参数见表1。
各表面之间的夹角见表2。
由表2可以看出, 各个面之间并不能严格满足长方体的平行与垂直条件, 因此需要对其进行调整。
利用单独拟合出的六个平面的参数, 由式 (4) 计算得出的顶点坐标见表3。
根据式 (6) 、 (7) 、 (8) 对顶点坐标进行微调, 调整后的顶点坐标见表4。
根据调整后的顶点坐标再计算六个平面的参数, 计算结果见表5。
通过表5可以看出, 各表面之间严格满足相应的平行与垂直关系, 因此所拟合出来的长方体是正确的。
上述计算结果是先单独拟合六个平面, 然后由平面参数计算顶点坐标, 再对顶点坐标进行调整, 使之满足长方体各棱之间的垂直关系。下面利用六个表面之间的平行与垂直关系, 通过附有限制条件的间接平差直接拟合各表面的平面方程, 计算出的平面方程参数见表6。
由直接拟合的六个平面参数计算出的长方体顶点坐标见表7。
通过表6可以看出, 拟合出的六个平面严格满足相应的平行与垂直关系, 因此拟合结果是正确的。
对以上两种拟合方法的计算结果进行误差分析, 根据两种方法分别拟合出的平面参数, 可以计算每个面上观测点到拟合平面的距离, 即观测点的残差, 从而得出每个面的中误差和长方体的整体误差, 结果见表8。
顶点拟合的残差之和为-10mm, 平面拟合的残差之和为0mm。通过两种方法的误差比较可以看出, 由顶点拟合出的长方体中误差与直接根据六个平面拟合出的长方体中误差相比偏大, 这是因为顶点拟合时, 顶点坐标是由每个面上的点位观测值单独拟合出的平面参数计算得出的, 并不是直接观测值, 拟合时顶点坐标改正数的平方和最小并不能满足所有面上观测点到拟合平面的距离平方和最小。因此在拟合长方体时, 应该观测六个平面上均匀分布的若干点位, 然后采用平面拟合的方法。
3 结语
本文介绍了由实测的位于长方体形房间的内表面上点位的三维坐标拟合长方体的两种方法, 一种是先单独拟合长方体的六个平面, 再根据平面方程计算顶点坐标, 然后对顶点坐标进行微调使之满足长方体的限制条件;另一种是直接根据长方体的各面之间的关系, 利用附有限制条件的间接平差直接解算各平面的参数。文章详细阐述了这两种方法的数学原理、拟合过程。这两种方法各有优缺点, 文中通过拟合原理加以理论分析, 并用算例结果对理论分析进行了验证。通过算例可以看出, 本文介绍的两种拟合方法是正确的、可行的, 对两种拟合方法的精度分析也是可靠的。这两种方法在实际工程测量的应用中, 有较好的实用性和可推广性。
摘要:利用无反射电子全站仪观测长方体形房间内表面上均匀分布的点位, 根据观测点的三维坐标, 通过最小二乘原理可以拟合出长方体的空间表面参数和顶点坐标。本文介绍了两种拟合方法, 通过顶点坐标分步拟合长方体和附加限制条件的间接平差直接拟合长方体, 阐述了两种方法的数学原理与计算过程, 并对两种方法的精度以及各自的优缺点进行简单分析比较, 通过对某实测数据的拟合结果的计算与分析, 验证了拟合模型可靠性与准确性。
关键词:长方体拟合,最小二乘法,精度
参考文献
[1]王解先, 季凯敏.工业测量拟合[M].北京:测绘出版社, 2008.
[2]顾孝烈, 鲍峰, 程效军.测量学 (第三版) [M].上海:同济大学出版社, 2006.
[3]张益泽, 王解先.建筑物的平面拟合和质量检测[J].工程勘察, 2009, (9) :79~86.
[4]王清泉, 闫保旭, 王解先.长方体立面检测方法研究[J].测绘通报, 2008, (8) :48~49.
[5]龚秀强, 王解先.圆锥形曲面的拟合[J].工程勘察, 2010, (10) :79~82.
关于曲线拟合的方法探讨 篇6
关键词:离散点,曲线,拟合
0 引言
随着科技的不断进步,产品造型越来越复杂,因而对于造型的方法也提出了更高的要求。由于经常要处理数据点,并对数据点进行拟合,因此曲线拟合就成了处理离散点成线的一种常用的手段。曲线拟合的方法有很多种,各有各的优势。本文将对常用的几种曲线拟合方法(最小二乘法、移动最小二乘法、NURBS三次曲线拟合和基于RBF曲线拟合)进行论述,分析拟合方法的适用场合,以便在针对具体情况时可以采用相应的拟合方法。
1 拟合方法论述
1.1 最小二乘法
最小二乘法通过最小化误差的平方和寻找数据的最佳函数匹配,是进行曲线拟合的一种早期使用的方法。一般最小二乘法的拟合函数是一元二次,可一元多次,也可多元多次。该方法是通过求出数据点到拟合函数的距离和最小的拟合函数进行拟合的方法。令f(x)=ax2+bx+c,计算数据点到该函数所表示的曲线的距离和最小。即:
对(1)式求导,使其等于0,则可以求出f(x)的系数a、b、c,从而求解出拟合函数。
1.2 移动最小二乘法
移动最小二乘法在最小二乘法的基础上进行了较大的改进,通过引入紧支概念(即影响区域,数据点一定范围内的节点对该点的拟合函数值有影响),选取适合的权函数,算出拟合函数来替代最小二乘法中的拟合函数。从而有更高的拟合精度及更好的拟合光滑度。
1.2.1 移动最小二乘法的拟合函数
设拟合函数为f(x)在求解域Ω内的n个节点Pi(i=1、2、3、……、n),则:
式中,α(x)为待求系数;K(x)为线性基函数。一般令K(x)=[1,x,y]T,m=3;求解过程可以参照文献[1],从而可求α(x),得到f(x)。
1.2.2 移动最小二乘法的算法流程
(1)将区域进行分段。(2)对每个分段点进行循环:1)确定网格点的影响区域大小;2)确定包含在网格点的影响区域内的节点;3)计算型函数;4)计算网格点的节点值。(3)连接网格点形成拟合曲线。
1.3 NURBS三次曲线拟合
NURBS作为定义工业产品几何形状的唯一数学方法,是现代图形学的基础,因此NURBS曲线拟合有着重要的实际意义。NURBS曲线的数学模型和数学方法可以参考文献[2]。本文采用VC技术[3,4],利用Open GL的NURBS曲线拟合函数,即可得到NURBS曲线。
1.4 基于RBF的曲线拟合
RBF(Radial Basis Function),径向神经网络是以径向基函数(RBF)作为隐单元的“基”,构成隐含层空间,隐含层对输入矢量进行变换将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。这是一种数学分析方法,具有较快的收敛速度、强大的抗噪和修复能力。RBF神经网络结构图如图1所示。
各算法流程如下:
最小二乘法通过建立二次函数进行拟合。建立拟合函数f(x)=ax2+bx+c,求所有数据点与二次曲线的距离和最小的二次曲线,得到a、b、c,从而得到二次曲线图像。
移动最小二乘法的流程是:
(1)NURBS曲线拟合:确定节点矢量,本文通过弦长累加来确定节点矢量。在NURBS曲线拟合时,设置最前4个节点矢量的值相同和最后4个节点矢量的值相同,那么拟合的曲线将通过给定型值点的第一个点和最后一个点。由于Open GL有现成的NURBS曲线拟合函数,因此本文将借助VC进行编程,实现NURBS三次曲线拟合。
(2)基于RBF曲线拟合流程:本文将采用高斯函数作为RBF函数的核函数[5]。1)采用K-均值法,确定聚类中心;2)按聚类中心分组;3)计算样本均值;4)重复2)、3),直到聚类中心不再变化;5)确定半径;6)调节输出层权。
2 实例验证
为了比较上述4种方法的优劣,本文采用1组数据,用4种方法进行拟合,然后比较拟合的情况,从而进行判断。如果型值点经比较后,在型值点变化微小的情况下,拟合的曲线将趋于平稳,就难以分出其优劣,因此在给定数据的时候(表1),特地给出一个奇异点(第3个点)。通过对该表的数据点进行4种拟合方法来比较各种方法的优劣。
采用不同的拟合方法对数据点进行拟合,得到的拟合曲线如图2所示。
3 结语
通过上述4个拟合的曲线可以得出:最小二乘法的精度最差。使用RBF进行曲线拟合的精度最高,但不易用数学表达方式去表达,而NURBS曲线易用数学表达。能用数学方式去表达RBF拟合的曲线,将使RBF拟合方法更具发展空间。
参考文献
[1]曾清红,卢德唐.基于移动最小二乘法的曲线曲面拟合.工程图学学报,2004(1):84~88
[2]朱心雄.自由曲线曲面造型设计.北京:科学出版社,2008
[3]吕希奎,周小平.实战OpenGL三维可视化系统开发与源码精解.北京:电子工业出版社,2009
[4]钱能.C++程序设计教程.北京:清华大学出版社,2005
直线拟合椭圆误差控制算法 篇7
对于没有非圆曲线插补功能的机床而言, 加工椭圆等非圆曲线时, 较多采用宏程序编程, 用直线拟合时, 常采用等间距法和等弦长法, 但不易控制轮廓精度。若用等误差法编程, 一般算法是:在已知节点建立允差圆, 根据允差圆与曲线关系, 求出拟合直线斜率, 再求出拟合直线与曲线交点。这种算法复杂, 且有不易求解的缺点。本文提出了一种新算法, 原理简单, 适合用宏程序编程。
2 原理及计算方法
如图1, 直线L1拟合椭圆时, 起点 (X1, Y1) , 另一交点 (X2, Y2) , 误差即是椭圆上某点到直线的最大距离。设拟合误差控制在一个定值D内, 做拟合直线的平行线L2, 两直线距离为D, 若直线L2与椭圆相切或相离, 则拟合误差未超差, 若直线L2与椭圆相交, 则拟合误差大于D。
设椭圆方程为:x2/a2+y2/b2=1, 直线方程为y=Kx+C
直线L1方程:y=Kx+C1, 直线L2方程:y=Kx+C2
(上半部椭圆用“+”号, 下半部椭圆中间用“-”号) 将已知点 (x1, y1) 代入直线L1方程得:C1=y1-Kx1
此方程只有两个解时:直线L2与椭圆相交;此方程只有一个解时:直线L2与椭圆相切;此方程没有解时:直线L2与椭圆相离。
要使椭圆上的点到拟合直线最大距离小于等于拟合允许最大误差D, 则只允许直线L2与椭圆相切或相离。
据韦达定理:方程Ax2+Bx+C=0
要使其只有一个解或无解则:B2-4AC≤0
编程时可以根据条件判断拟合误差是否超出给定最大误差D, 满足条件则未超差, 否则超差。
3 编程实例
(1) 用常规等间距法编程的精加工程序
此程序没有考虑拟合误差大小, 加工精度无法保证。
(2) 若编程时考虑拟合误差, 并使用本文算法, 假设取最大拟合误差为D=0.005的精加工程序
4 结 语
利用这种算法, 每走一段直线都会判断拟合误差大小, 当拟合误差符合要求时才进行拟合, Z坐标间距初始值一定 (例题为0.4) , 当不满足精度要求时, 则间距会变化, 每次变化0.05 (第一次0.4, 第二次0.35, 以此类推) , 直至求出最合适间距。本编程方法克服了等间距直线拟合精度不能保证的缺点, 原理简单, 适合宏程序编程。
摘要:主要介绍对于有轮廓度要求的椭圆, 数控编程时要如何控制拟合误差, 文中提出了一种纯代数算法——直线拟合椭圆时误差控制算法, 适合在宏程序中自动算出节点, 并可控制拟合误差在一定值内。
关键词:宏程序,直线拟合,韦达定理
参考文献
曲线拟合法的Octave应用 篇8
天线的问题
我们开始为踏青做准备的时候已经有点晚了,才刚刚把40米CW天线竖立起来。我们用熟知的468/f(MHz)公式将其缩减到了7.050MHz,并在天线中央到操作地点之间串起了一条450Ω的窗口线路。在连接无线电收发机之前,我们要用天线分析器对装置进行检查。可结果怎么会是这样?分析器告诉我们,天线的共振频率大约为7.23MHz。我们哪里弄错了?我们跑到80m波段的操作地点,问他们借了台分析仪,但却只是验证了我们这台的结果。我们难道是把12号的电线量错了?难道地面效应(我们的天线高度为25英尺)所造成的变化超出了我们的预期?我们该把天线拆开来,重新制作吗?
天线的建模
我们的天线其实一点问题都没有,完全可以拿去参加踏青日的活动。可是,我们用分析器测量时究竟出了什么错呢?错就错在对测量数据的解释上。既然踏青日已经过去了,我们也回到了家,就来我们给《传输线的Octave应用》(Octave for Transmission Lines)一文编写的输入阻抗代码来看看整个装置(包括天线和传输线)究竟怎么了吧。
不过,首先我们需要一个合理的模型,来表现出天线应有的特性。我们要使用GNU Octave中本系列之前一直用到的天线建模软件nec2c。我们假设踏青日的天线是一根中心馈电偶极天线,距离理想地25英尺,使用66.4英尺长的12号电线。我们要在所需的工作频率周围,比如说2MHz到6MHz至8MHz这样的范围内,取紧密间隔的各个频率点,测出天线和传输线的各方面数据。我们可以用nec2c生成与大量频率对应的众多输入阻抗,但这样做就太冗长了。于是我们改而尝试些新的方法。
我们首先要计算出在所需频率范围内每500kHz间距的输入阻抗。这需要在nec2c,或者你自己喜欢的天线分析程序中,进行五次调用,范围从6MHz到8MHz。结果列于表1。
我们可以用表2中的部分Octave代码将这些数据描成图线,结果示于图1。在表2中的plot一段,第三个指定的图线就会在零阻抗上产生一条水平线,这是为了使图像更加清晰。每个指定图线的第三个参数“-”会在每条图线的各个点之间画出一条直线,并按照需要量子化。本文中所使用的Octave代码可以从ARRL《QEX》网站下载。
此时,我们已经有了几条漂亮的曲线,如果将这些电阻和电抗的图线和The ARRRL Antenna Book第二章第2~3页的图2的对应部分相比较的话,看起来它们与偶极天线在接近共振区域的有限范围频率内所应有的表现非常符合。但是,组成这两条曲线的直线序列都是由五个间距500kHz的频率点产生的,而这五点之间的任意频率,我们依然没有办法进行天线的数学建模。
如果我们能让曲线与表1中的天线阻抗数据(与期望中偶极天线的表现极为相近)匹配起来,那么就能够利用描述这些曲线的等式,根据用天线建模程序计算出来的值,对天线的输入阻抗值进行合理的估计。有一种方法能提供这样的等式,那就是最小平方法。根据图1中的观察数据,我们要给无功部分采用线性拟合,而有功部分则采用抛物线(二级)拟合。
为了帮助避免出现大量冗长而易出错的手工计算结果,Octave提供了一种强大的曲线拟合函数polyfit,可以给出所需的多项式系数,与我们手上的数据进行拟合。Polyfit是这样定义的:
其中:
P是一个行向量,含有N级拟合多项式系数。
S是一个数据结构,含有拟合产生的方法以及拟合质量的相关信息。在本文的应用中,我们并不需要用到S。
X是一个行向量。
Y是一个行向量。
N是多项式拟合的级数,我们要将其作为X中点的函数,与Y中的点拟合。
我们使X的值代表天线阻抗计算的频率,而Y的值则代表实部和虚部中某一边的阻抗值。
表3中的代码将所需频率定义为fn,而天线阻抗的实部和虚部向量则为Rnec2c和Xnec2c。当我们在无功部分上以N=1、有功部分上以N=2来运行polyfit时,得出的多项式系数就可用于表3,定义Rfit和Xfit。请注意,这五个离散的频率被储存在向量fn中,而函数linspace则将6.0至8.0MHz的101个值储存在向量ff中,以便我们在为Rfit和Xfit作图时,近似出一条连续的曲线。
此时,我们可以用Rcoef和Xcoef中储存的数据写出以下等式:
不过,还有一种更加简单、不易出错的方法,可以生成这些等式,那就是利用Octave的polyval函数,其定义如下:
S=polyval(C,X)
其中:
S是一个行向量,含有根据X中指定点所估算的C值。
C是一个行向量,含有待估算的多项式的系数。
X是一个行向量,含有估算时函数C的参数。
请注意,这些等式虽然写成了数学表达式,但是在表2、3和4中的实际Octave代码则表示了如何在Octave中创建这些等式。Octave代码会在操作符之前使用一个小数点,告诉Octave进行逐元素算法,而不是矩阵算法。在QEX2007年1/2月号的《传输线的Octave应用》中有一段简短的指南和几个例子,解释了“点操作符”和与之对应的“没点”之间的区别。
在我们的曲线拟合中,需要使用:
Rfit=polyvaI(Rcoef,ff);
Xfit=polyval(Xcoef,ff);
我们将这些都代入表3中,在Octave下运行代码,就能得到图2中的线条和点。请注意,这些点代表了使用nec2c的天线计算,都里代表拟合曲线的线条非常接近,这表明这两条曲线是密切拟合的。如果我们想要进行更详细的数学分析,判断“拟合的好坏”,就可以用S的polyfit中储存的数据,不过,在这里并不需要这么做,因为我们可以从图2中看到,拟合已经足够满足我们的需要了。
传输线的建模
请看图2,天线在7.050MHz附近具有大约54Ω的电阻性阻抗,这正是我们所期望的。那么,究竟什么地方出错了呢?我们应该记得,我们是在60英尺长的450Ω传输线的末端用天线分析器进行测量的,而不是在天线上,因此,即使其单位长度的衰减率很低,但450Ω的传输线与天线本身依然存在误差。我们来将《传输线的Octave应用》中的代码修改一下,解决这里发现的问题。我们要用之前得出的曲线拟合将负载阻抗上的数据也包含进去,并在代码中指定传输线的特征,而不是通过键盘接收。
在这一装置中,我们使用了WM CQ 533架空明线,所以可以使用(The 201 1 ARR Handbook)的表22-60中的数据:
Z0和VF在较宽的频率范围内都是相对恒定的,我们可以在代码中将它们输入为常数。然而,衰减值则会随所用频率而发生变化。幸好,衰减的变化是可以预测的,对几乎所有传输线而言,在所需频率范围内均可视为与频率平方成比例。我们乘上一个10MHz的常数,可以解得:
这和《传输线的Octave应用》中一样。
我们要从取自《传输线的Octave应用》的代码中删除键盘输入的命令,然后将数据嵌入代码中。我们要将数据作成图像,而不是打印出来,并且只需考虑传输线输入阻抗的无功部分,因为我们感兴趣的是“共振”,也就是天线分析器检测到阻抗中的无功部分穿过0欧姆的那一点。表4列出了我们的代码。
在Octave下运行表4代码后,得到的图线就如图3所示。为了比较的方便,我们不仅作出了天线电抗的图线,也作出了在传输线输入端观察到的电抗图线,并加入了一条水平线,标出过零点。我们没有手动传输数据——这是个容易出错的步骤——而是利用代码从表3到表4中生成曲线。我们可以得出所有101个点的两幅图线,全都是近似连续的曲线。
我们还用text命令给图线添加了标签。我们也可以像上次的文章中那样,使用legend来显示不同曲线的图例。不过legend必须用不同的颜色或者线形将两者区分开来,而我觉得这张图像还是将两条图线都表示出那个实心线会比较清晰。
解释结果
当我们仔细观察图3时,会发现450Ω传输线会按照频率的函数对阻抗中的无功部分进行转化,让过零点位于7.23MHz左右,而我们的天线分析器就将这一点当成了共振点。
为什么80m的兄弟们进展得如此迅速,没有碰到这样的问题呢?嗯,因为他们用的不是架空线,而是50Ω的同轴电缆。在80m波段,同轴电缆的损耗很低,所以根本不用考虑梯形线带来的麻烦。
让我们看看,要是在40m波段中使用了同轴电缆,又会发生什么呢?我们从《ARRL HANDB00k 2011》的表22-60中找出RG-58同轴电缆(Belden 787A)的数据,将其包含在表4的代码中,并作好注释。请注意,我们采用了与窗口线路一样的做法,使用相同的频率模型平方根,对单位长度的衰减进行天线数据的曲线拟合。既然我们需要在图线中给同轴电缆一个不同的标签,而且标签的位置也要不一样,那么就还得给同轴电缆加入额外的text语句(已经注释出来了)。结果得出的图线如图4所示。
请注意,由于当频率接近天线共振频率时,同轴电缆与天线的匹配状况很好,所以阻抗中的无功部分在这一过程中沿传输线都没有多大的变化。不过,当我们远离共振点时,传输线的电抗就与不断增加的正极或负极电抗不匹配了,其程度要比采用450Ω传输线时更严重,而与零电抗的偏离程度也会更加明显。80m的兄弟们根据分析器的结果得知,他们的天线/同轴电缆组合的共振位置与预期的相同,于是就立刻开始操作了。
结论
我们从这次经验中学到了,对于天线分析器的结果,要留个心眼,特别是在天线和分析器之间存在一段长度的传输线时。
我们还学会了使用Octave的polyfit与polyval函数所组成的强大工具集,并见识了Octave通过简单的运算符或函数调用,来处理庞大的数据矩阵或向量的能力。
这些函数中所采用的最小平方法,以及无需手动传输数据,就能使用高阶曲线拟合的系数的能力,让我们能够对相对复杂的数据集进行高效、无差错的近似计算。
一些警告
最小平方法是一种强大的曲线拟合工具。不过,如果不小心的话,它可能会带我们误入歧途。让我们将一条曲线与正弦波形拟合起来,做个小小的实验。一般来说,我们并不需要这么做,不过这是个非常值得学习的例子,因为,我们已经对待拟合曲线的特性了然于胸。我们要根据表5中Octave代码里的向量amplitude (幅值),用一系列点来代表这条正弦曲线。正弦曲线、指数函数,以及其他相对复杂的函数也许可以用无限多的一组多项式来表达出来,所以,就可以利用最小平方拟合法,用被缩短的无限多的一组多项式近似替代原本的式子,从而生成所需的多项式,来准确表达出这条正弦波形。利用表5中的代码,我们作出了图5中的图线,这是对amplitude中几个点的五级最小平方拟合。我们还作出了正弦波形的101点近似曲线,这两者非常接近,几乎每一点都重合在一起。
要是提高级数,在多项式中增加更多的式子,是否就能得出更好的结果呢?我们在表5和图5中进行了七级最小平方拟合。请注意,最小平方的计算程序并不“知道”我们想做什么。它只“知道”我们想要得出一条曲线,尽可能接近地通过在polyfit参数中所指定的五个点。如果我们观察七级拟合的结果,就会发现在图中看来,每一个点都已经逼近到了最佳程度,但是却同时产生一条有些变形的曲线,看上去与五个采样点本来的那条曲线不太相似。
支架压力监测数据分段拟合方法 篇9
支架压力监测是矿压监测和顶板支护的重要监测手段[1]。在矿压监测数据中,移架过程的压力变化对于计算和分析煤矿工作面压力有非常重要的意义[2]。图1(a)为某支架24h实际压力曲线,可见支架压力监测数据中存在有奇异变化的信号,反映了移架时的压力突降、低压保持、再升压和压力调整的过程[2,3]。其中A点移架过程压力变化如图1(b)所示,整个移架过程持续约7~8s,其中降压时间约为1s,升压时间约为1s。24h压力曲线被多个移架过程分成2~3h的若干工作周期。在这2~3h内,压力曲线的变化比较缓慢。
可见支架压力监测数据的特殊性是在较缓慢变化的压力数据中夹有人工移架时压力突变的奇异数据。对于缓慢变化的压力数据,支架压力监测系统的采样频率可低至数秒甚至数十秒1次,而对移架时的奇异数据,采样频率需不低于每秒3—4次。
目前煤矿支架压力监测系统一般采用工业总线传输数据,系统由1个主站和若干个接在总线上的分站构成,由主站轮询向各个分站查询数据。主站通常置于地面,分站分布在各个支架上,整个支架压力监测系统传输线路可达数km。为了保证长距离传输的可靠性,通信速率常设为5 kbit/s或2.4kbit/s。而分站的采样速率较快,如3次/s,一个支架采样6个压力值,传输速率为5kbit/s,在超长工作面多达200个分站时[3],查询扫描1周的时间约为11s。而在此传输过程中,分站内积累存储了约11倍的数据。为了缓解传输压力,有的支架压力监测系统不得不降低分站的采样速率,从而抛弃大量数据。 但分站采样速率即使减小为1 次/s,200个分站的数据传输时间仍需3.36s左右。也就是说,对于具有200个分站的支架压力监测系统,分站采样速率减小为0.25 次/s时才能满足数据的实时传输要求,但该情况下可能会丢失降架、移架、升架信息。针对该问题,本文提出一种支架压力监测数据分段拟合方法。
1 支架压力监测数据分段拟合方法
1.1 数据分段拟合
支架压力监测普遍采用工业总线查询方式,主站发指令查询分站,分站接收到主站的查询指令才向主站发送数据,1个查询周期往往为数秒或数十秒。因此,将支架压力监测数据按查询周期进行分段,即分站在1个查询周期内将数据存储在分站存储器中,主站查询该分站时进行数据拟合。
采用多项式拟合方法进行数据拟合。通过实测发现,采用4次多项式能较好地满足支架压力监测要求,即设监测的压力数据为
式中:ti为第i个采样点时刻,i=1,2,…,n,n为分段内数据长度。
f函数关系未知,因此采用多项式拟合公式(式(2))来拟合f函数。
式中:yi为拟合后的数据;a4,a3,a2,a1,a0为拟合系数。
与一般的数据拟合不同,因总线查询时间难以完全确定,所以分段内数据长度n可能会有变化。拟合目标是取合适的系数组,使拟合后的数据yi与监测数据xi最接近。目前常用最小二乘法来确定拟合系数,即通过不断迭代,使拟合后的数据yi与监测数据xi差值的平方和最小,即求解式(3)中F最小时的系数集。
具体方法:采用式(2)代替式(1)中的f函数并代入到式(3)中的xi,然后分别求5 个拟合系数的偏导数。令偏导方程为0,公式为[4]
式中:j为对某一个系数求偏导时该系数的下标,j=0,1,…,4;m=4;k为5 个系数的下标,k=0,1,…,m。
式(4)为5 个方程的偏导方程组,n为采样点数,因n>m,所以该方程组有唯一解。数据拟合过程即迭代求解式(4)的过程,获取5个拟合系数a4,a3,a2,a1,a0。总线传输时只传输这5个系数。
1.2 数据直传与数据拟合判断
有的支架压力监测系统并不对所有支架进行压力监测,如采用5条线监测方法时,在工作面中选取5个支架安装分站,当工作面向前推进时,形成5条监测线。该情况下,由于分站少,可能不需要进行数据拟合,而是直接传输监测数据。为了实现系统软件的通用性,由分站判断分段内的数据量,若数据量小于拟合系数量,则直接传输数据;若数据量大于或等于拟合系数量,则进行数据的多项式拟合,只传输拟合系数。本文采用4次多项式拟合,即当1个查询分段周期内的数据量小于5时,直接传送数据,并在数据后补0,凑足5位数据,所补0可作为主站判断所传输数据为直接数据还是拟合系数的标志;当数据量大于或等于5时,进行4次多项式拟合,获取5位拟合系数且只传输这5位数据。这样每次均传输5位数据,便于管理数据传输和确定传输时间。
1.3 主站中拟合数据恢复
理论上主站只需将接收到的5位拟合系数代入式(2)即可求出拟合数据yi。但主站首先需要确定分段内数据长度n。有2种方法获取n:(1) 在传输时增加1 位数据n,即传输6 位数据(5 个系数加1个数据长度数)。该方法优点是恢复的数据长度准确,缺点是增加了传输负担。设每个分站有6个测点,存在200个支架时,在1个查询周期内需多传输1 200个数据。当查询周期较短时,这种传输代价与本文目的相悖。(2)由主站根据查询周期计算出数据长度。查询指令由主站发出,因此主站可方便地根据每个分站的查询时间间隔乘以各个分站的采样速率计算出本查询周期内的数据长度。例如主站对某分站的查询周期为12.8s,该分站采样速率为3次/s,则可计算出数据长度为38.4,取整为n=38。该方法的优点是获取方便,减少了数据传输量,缺点是由于主站与各分站之间时钟稳定性存在差异,在极偶然的情况下,可能会少或多计算出1位数据。实际上因分站之间时钟稳定性存在差异,在1个查询周期内,大多数分站采集了n个数据,但极个别分站采集了n+1或n-1个数据,这与拟合后极偶然情况下可能会多或少1位数据类似,并不影响整体数据的准确性。因此,本文采用方法(2)来确定分段内的数据长度,进而恢复拟合数据。
2 数据分段拟合方法的实现
图2为系统分站组成。6路压力传感器量程为5 000kN,分别监测前梁、前柱、后柱压力。压力数据由6路信号放大电路放大为0~5V电压信号。信号放大电路中带有低通滤波器,对压力数据进行滤波处理。STC15F2K60S2 单片机对放大信号进行A/D转换,对部分信号进行显示转换后送液晶显示屏进行显示,并根据需要进行分段数据拟合。单片机处理程序和数据均存储在外部存储器中,采集数据或拟合系数通过MAX485芯片连接到系统总线上。主站发送的查询指令通过总线由分站接收。
图3 为分站软件流程。主程序首先进行初始化,清数据存储器,然后采集6 路压力信号进行A/D转换,将A/D转换值发送到存储器,并对数据进行压力转换,送到液晶显示屏进行本地显示。
当主站查询本分站数据时,程序进入中断处理过程。首先进行中断保护,然后从存储器中读取数据,如果数据量小于5,直接将数据存入通信缓冲单元,数据不足5位时通过补0补足5位;如数据量不小于5则进行数据拟合,获得5位拟合系数,将系数存入通信缓冲单元并发送给主站。6路压力数据发送完后,清除数据存储器,准备存储下一段数据。
3 拟合效果分析
采用支架压力监测数据分段拟合方法后,主站对从站的查询周期与采样间隔可相互独立,不会出现查询周期越长,分站中积累的数据越多,所需传输时间也越长的情况。设分站采样速率为3次/s,在查询周期分别为10,15,30s情况下(即分别有30,45,90 个采样数据)进行数据拟合,结果如图4所示。
从图4可看出,采用数据分段拟合方法后,主站查询周期为10,15,30s时传输数据个数是相同的,均为每次传输5个数据,压力曲线变化也基本类似,满足应用需要。从数据准确度来讲,应尽可能选择较短的查询周期。
4 结语
支架压力监测数据分段拟合方法按支架压力监测系统主站的1个查询周期进行数据分段,在某个分段内,如果数据量小于拟合系数量,则直接传输数据;若数据量不小于拟合系数量,则进行数据的多项式拟合,获取拟合系数并只传输拟合系数。实验结果表明,该方法大大减少了数据传输量,且不丢失重要数据,解决了支架压力监测数据的实时性和对奇异信号捕捉之间相互矛盾的问题,同时实现了每个查询周期固定数据传输量,方便数据传输管理。
摘要:针对支架压力监测系统应用于超长工作面时,受总线查询周期限制而难以兼顾监测支架压力中的突发奇异信号与数据实时传输的问题,提出一种支架压力监测数据分段拟合方法。该方法按照支架压力监测系统1个查询周期进行数据分段,在某个分段内如果数据量小于拟合系数量,则直接传输数据;如果数据量不小于拟合系数量,则进行数据的多项式拟合,获取拟合系数并只传输拟合系数。实验结果表明,该方法大大减少了传输数据量,又不丢失重要数据,同时实现了每个查询周期固定数据传输量,便于数据传输管理。
关键词:支架压力监测,数据拟合,分段拟合,查询周期
参考文献
[1]赵端,纵鑫.基于ZigBee技术的井下液压支架压力监测系统设计[J].工矿自动化,2014,40(1):31-34.
[2]汪新文,刘云霞.综采工作面压力实时监测系统的应用[J].工矿自动化,2011,37(10):121-124.
[3]张飞,张巍,孙建岭,等.超长综放工作面矿压显现规律研究[J].煤炭工程,2010,12(12):52-54.