最优回归方程(精选4篇)
最优回归方程 篇1
1 概述
GPS工程中常常遇到高程拟合问题。解决这一问题的基本思路是, 首先根据联测点上的高程异常, 对测区内的似大地水准面进行趋势分析, 在此基础上, 建立区域似大地水准面的数学模型, 利用该模型求得非联测点的高程异常, 即可求得相应GPS点的正常高[1]。其中曲面拟合是常用模型之一。在应用曲面拟合时往往采用低次曲面函数, 对于面积小且较为平坦的区域一般选择一次曲面, 其他情况下则选择二次曲面。这种选择往往依据经验, 缺乏必要的理论解释。从数学角度看, 这种曲面拟合法就是建立平面坐标与高程异常之间的线性回归模型。如何选取最优回归方程, 线性回归模型中有着丰富的理论[2], 文献[3]研究了逐步回归法。用逐步回归法选取的拟合方程是建立在假设检验基础上的, 该方法最大的优点是自变量较多时优越性明显。我们知道统计假设检验总是会犯两类错误且受制于初始模型, 鉴于GPS拟合中所选曲面次数不超过二次, 自变量的个数不多, 因此可以全面衡量每一个GPS高程拟合方程, 从中选出最优的回归方程, 进而提高GPS高程拟合的精度。
因此, 本文讨论了建立最优回归方程的几个准则, 结合GPS高程拟合实例, 对比分析得到一些有益的结论。
2 最优回归方程的建立
在一定区域范围内, 高程异常ζ可以看作是大地坐标 (B, L) 或平面坐标 (x, y) 的拟合函数:
其中, e为随机误差;函数f (x, y, …) 中的每一项看作是因变量ζ所对应函数的自变量。如果函数模型取作二次曲面, 式 (1) 可以写成:
其中, a0为常数项;ai (i=1, 2, 3, 4, 5) 为自变量的系数, 以下简称此模型为全模型。相对应地, 只要这六个系数不同时为0的模型, 称之为选模型。测量中常用的一次曲面:
可以看成是一种选模型, 此时a3=a4=a5=0, 以下简称为一次曲面。
利用联测点的高程异常值求解这六个参数, 从数据处理角度上看, 是一个线性回归问题。线性回归理论指出可选的自变量集合中, 选择一个最优的自变量子集是非常重要的[3]。因为全模型中往往把对因变量没有影响的自变量也包含在回归方程中, 导致计算量变得很大, 并且预报的精度也下降很多。如何在可用的模型中选取最优的模型, 这就是最优回归方程选取问题。建立最优回归方程, 首先要确立选取的准则。
我们知道残差平方和RSS的大小反映了实际数据与理论模型之间的偏离程度, 是评价拟合方程的一个重要标准。一般来说, RSS越小, 数据与模型拟合得越好, 全模型残差平方和为:
相应地方差为:
其中, n为参与建模点的个数。
在选模型中, 由于RSS是随着拟合变量个数的增加而下降, 为了防止选取的自变量过多, 于是我们把残差平方和乘上一个随拟合系数个数q增加而上升的函数作为惩罚因子, 记为:
按照RMSq的定义, 我们可以依据RMSq越小越好的原则选取自变量子集, 并简称为RMSq准则。
式 (6) 说明不能无限制增加拟合参数以提高精度, 当拟合方差变化比较缓慢了, 再增加拟合参数对提高拟合精度意义不大。同时该式也说明不能以过多地增加未知数的个数来提高拟合的精度, 这也正是不宜用高次曲面拟合GPS高程的原因。实际上, 式 (6) 就是模型拟合方差, 测绘界习惯称之为内符合精度。
RMSq准则是从数据与拟合模型优劣的角度出发导出的, 如果从预报角度考虑, 可以选用Mallows在1964年提出的Cp准则, 该准则定义为:
Cp准则依据“Cp愈小愈好”的原则选取自变量子集。
极大似然原理是统计学中估计参数的一种重要方法。日本统计学家Akaike把这个方法加以修正, 于1974年提出了一种较为一般的模型选取准则, 称为Akaike信息量准则, 简称AIC准则, 它可以表述为:
使式 (8) 达到最小的那组自变量组合即为最优组合, 从而获得了最优回归方程。
以上三个准则, 根据建模的不同需要, 顾及各准则的侧重点不同而选取不同的准则衡量最优回归方程。
选定准则后, 针对所有的备选模型计算相应指标。在建立高程拟合实践中, 如前所述由于全模型有六个自变量, 平面拟合模型一般有三个自变量, 因此可选的自变量子集仅有七个, 计算量并未显著增加。从平面拟合开始分别对这七个子集做回归, 寻找最优回归方程即最优建模方程。
可以看出, 本文方法不必考虑用假设检验来判断增减自变量, 因此可以避免逐步回归法中由假设检验可能带来的弃真和纳伪两种错误所带来的不良影响。
3 实例
本文选取了某市D级GPS网 (平坦地区, 区域面积约为300 km2) 40个水准联测点进行试验[4,5]。高程异常的原始数据见表1。首先选取了测区内均匀分布的10个点作为建模点, 使其满足建立拟合模型的要求, 而其余的30个点作为模型的检核点, 如图1所示。图中编号1~10的点是建模点, 用矩形与十字光标组合图形标示, 而空心圆点代表检核点, 其编号为10~40。
运用二次曲面拟合GPS高程, 自变量最大子集是{x, y, x2, xy, y2}, 从平面拟合至少选取{x, y}两个自变量开始做拟合方程, 分别计算每种模型所对应的三种最优准则指标量, 其结果如表2所示。
根据表2可知, 在全模型中, y2与其他变量存在复共线关系, 应予以舍去。当选模型的自变量子集为x, y, x2, xy时, RMSq, Cp和AIC三个准则的指标值都最小, 三种准则呈现了较好的一致性, 所以该子集建立的回归模型为最优回归模型。此时, 拟合方程为:
按照测量习惯, 我们通常要依据中误差定义计算外符合精度[6]验证模型的适用性。表3给出了全模型和最优模型的拟合残差Δ, 即拟合值与观测值之差, 此处可以视为高程真误差。为了便于比较各模型精度, 计算了所有二次曲面模型的外符合精度, 结果见表2。从外符合精度来看, 最优模型建模精度与全模型精度相当。
综上所述, 对于本试验区来说, 运用最优回归方程建立的拟合模型其内外符合精度俱佳, 且方法可靠。
为了进一步比较本文提出的最优回归方程特点, 笔者也用了逐步回归法寻求拟合方程, 无论显著水平选为0.05, 还是0.1, 所得的拟合方程都是平面拟合模型。从表2中可以看出, 最优回归方程建立的拟合模型明显优于平面拟合模型。
4 结语
本文在讨论运用RMSq准则即中误差准则确定最优回归方程时, 对测绘工程实践中常用平面拟合或二次曲面拟合GPS高程这一经验模型, 给出了合理的解释。基于最优回归方程获得的曲面拟合方程, 选取最优方程的准则多样, 不仅仅是中误差, 还可以考虑Cp和AIC准则, 实践中可以依据工程需要合理选择。
实际上对于用低次曲面拟合GPS高程来说, 本文所提出方法的计算量与逐步回归方法相比增加不多, 同时该法可以克服假设检验选取最优自变量所带来的不良影响, 进而保证了入选因子在模型中都是显著的, 克服了复共线性问题, 提高了解的可靠性。
最后, 需要说明的是GPS高程拟合精度不仅与所选取的数据模型有关, 而且与物理模型密切相关。因此, 欲进一步提高精度应全面考虑GPS高程拟合的几何物理模型。
摘要:分析了二次曲面拟合方法, 讨论了最优回归方程选取的三个准则, 提出了基于最优回归方程的GPS高程拟合方法, 最后通过实例计算, 给出了最优回归方程的选取步骤, 验证了该方法的有效性。
关键词:GPS高程,拟合,二次曲面,最优回归方程
参考文献
[1]徐绍铨, 张华海, 杨志强, 等.GPS测量原理及应用[M].第3版.武汉:武汉大学出版社, 2008.
[2]王松桂, 陈敏, 陈立萍.线性统计模型:线性回归与方差分析[M].北京:高等教育出版社, 2002.
[3]翟高鹏, 花向红, 刘金标, 等.基于逐步回归的GPS高程拟合方法研究[J].城市勘测, 2011 (5) :62-64.
[4]胡伍生.神经网络理论及其工程应用[M].北京:测绘出版社, 2006.
[5]胡伍生, 华锡生, 张志伟.平坦地区转换GPS高程的混合转换法[J].测绘学报, 2002 (2) :101-103.
[6]武汉大学测绘学院测量平差学科组.误差理论与测量平差基础[M].第2版.武汉:武汉大学出版社, 2010.
最优回归方程 篇2
潮流计算是电力系统中的基本计算, 在研究系统规划、稳定和运行状态等方面有着非常重要的作用。由于我国目前电力系统大面积联网形成了大送端和大受端的电网格局, 并且电力负荷逐年加重使得系统设备接近极限运行, 尤其是风电等可再生能源大规模并网带来的不确定性, 使得潮流计算较之以往更容易出现收敛困难而无解的情况。因此, 对无解潮流研究进而将其调整到有解区域就显得十分必要。
潮流不收敛的一个典型原因就是电力网络在重负荷情况下产生了病态潮流的问题。目前对此类病态潮流求解的一个主要研究方向是改变负荷点的负荷水平, 使系统向着有解区域进行调整。在不同调整方向上可能都会达到有解区域, 因此这涉及到一个最优调整策略的问题, 但是由于在调整有功和无功功率时需要考虑发电机出力水平、无功补偿装置的补偿能力、重要负荷等因素, 使得最优调整策略的制定变得复杂。
因为潮流计算不收敛, 因此采用常规的潮流计算方法如牛顿法无法进行求解, 需要对原有方法进行改进或转化为其他形式的问题来分析。目前, 潮流无解调整的方法主要集中在以下几个方面。最优乘子法[1,2,3]在常规牛顿法的基础上增加了最优乘子的部分, 能够保证潮流的收敛性, 通过最优乘子确定系统解的临界点, 进而确定潮流无解的调整方向, 但最优乘子法对计算初值较为敏感的问题还没有很好地解决。改进的牛顿法[4,5,6,7]在原有牛顿法的基础上通过预测、校正等环节追踪潮流方程的平衡解流形, 改善潮流算法的病态现象和收敛性, 是对潮流无解情况下近似计算的一种比较可靠的方法。非线性规划法[8,9,10,11]则将潮流解的临界条件转化为约束优化问题, 利用Kuhn-Tucker最优性条件, 采用内点法或梯度法进行求解。此外, 文献[12]和[13]分别采用降出力法和电路分析法将电力系统潮流调整到有解可行域;文献[14]采用同伦算法对无解潮流进行了计算, 也取得了较好的效果。
在潮流无解向有解区域调整的过程中, 确定无解的边界条件是至关重要的一步[15]。但是由于传统的电力网络方程是以节点电压方程为基础的, 采用的变量主要是节点电压和节点注入功率, 因为节点电压之间的相互关联性, 很难直观得到无解边界条件, 大多是通过逐渐逼近的方式达到无解边界。本文将支路电流与节点电压一同作为状态变量来表示电力网络方程, 推导出潮流无解的边界条件, 并结合负荷调整量最小为优化目标的Kuhn-Tucker条件, 求解此条件可解得负荷最近的调整方向的大小。
1 以节点电压-支路电流为变量的电力网络方程
在直角坐标系下, 当忽略对地支路电导时, 电力网络可以描述为支路电流-节点电压方程混合的形式[16,17], 如式 (1) — (3) 所示。
对于节点i有:
其中, l=1, 2, …, L (L为支路数) ;i, j=1, 2, …, N (N为节点数) ;li表示支路l与节点i相关联;ila、ilr分别为支路l电流的实部和虚部;Ui、θi分别为节点i电压的幅值和相角;Rij、Xij分别为支路l的电阻和电抗;Bl为支路l对地的1/2电纳;pi、qi分别为节点注入的有功和无功功率。对于节点j有与式 (2) 、 (3) 相同形式的方程。令分别表示节点注入电流的实部和虚部 (不含对地支路电流) ;。由式 (2) 和 (3) 可得节点电压的实部和虚部:
显然, 节点电压的表达式由支路电流和节点注入功率表达而成, 并且解的个数与是否存在实数解由方程的根号内表达式决定。
此外, 发电机节点通常定义为PV节点, 式 (3) 的节点无功方程被下式所取代:
得到节点电压的解析表达式为:
与PQ节点类似, PV节点也存在双解的问题, 所以系统中除平衡节点外的其他节点可以采用相同的方法对潮流无解调整策略进行研究。
2 潮流无解边界条件
对式 (4) 进行分析可知, 如果方程有解存在, 其表达式必须满足式 (7) 、 (8) 条件之一:
式 (7) 的物理意义是:当节点注入电流的幅值在以0为圆心、为半径的圆外时 (如图1中的c点) , 方程有高低压解存在, 系统是潮流可解的;式 (8) 说明当只有“=”成立时, 方程有唯一解, 解在圆上 (如图1中的a点) , 达到了系统的有解边界。而当
条件满足时, 方程无实数解, 节点位于圆的内部 (如图1中的b点) , 系统是潮流不可解的。在此情况下, 可以通过调整发电机出力、投入无功补偿装置、改变负荷水平等将系统调整到有解区域, 最基本的要求是调整到有解边界的a点上。当然在不同的调整方向上这样的a点有多个 (如图1中的a′、a″点) , 找到最近的a点代表着最小的调整量, 是方程无解情况下的优化调整目标。同样, 对于PV节点存在唯一解的边界条件为:
其物理意义是当节点注入电流幅值分布在以0为圆心、pi/Ui为半径的圆上时, 电力网络方程有唯一解存在。
而当满足条件式 (8) 或式 (10) 时, 即在图1中的a点上, 节点电压变为式 (11) 或式 (12) 。
3 潮流无解最优调整模型
对于潮流无解的优化调整策略, 可以采用节点负荷调整量最小作为目标函数, 表示为:
其中, pb、qb为节点给定的负荷初始值;pa、qa为满足式 (8) 或式 (10) 的达到潮流有解的节点负荷功率边界值, 即将潮流无解的节点功率调整到有解的临界点上。这里采用最小的欧氏距离作为优化目标, 得到调整量最小的负荷调整方向。不等式约束条件为:
式 (14) 代表了发电机或无功补偿装置对无功功率的调节能力约束;式 (15) 对于PV节点代表了发电机对有功功率的调节能力约束, 对于PQ节点则代表节点上有重要负荷而必须保留的功率值;式 (16) 代表节点电压约束。等式约束条件为式 (8) 或式 (10) 。式 (16) 中电压幅值Ua由式 (11) 或式 (12) 推导得到, 结果如式 (17) 或 (18) 所示:
对于以式 (13) 为目标函数和式 (14) — (16) 及式 (8) 或式 (10) 为约束条件的优化模型可以形成扩展的拉格朗日方程L (s, t) , 其中s代表a点有功、无功, t代表与a点相关联的电流实部、虚部。L (s, t) 的Kuhn-Tucker条件为:
其中, α、β为拉格朗日因子;h (s, t) ≤0为不等式约束条件式 (14) — (16) ;g (s, t) =0为在a点的等式约束条件式 (8) 或式 (10) 。
求解上述优化模型得到a点的pa和qa后, 节点b的负荷裕度最小的变化方向由下式确定:
其中, δb为节点b向负荷调整量最小的有解方向调整的角度。
最小负荷裕度值由欧氏距离来确定:
4 模型求解步骤
模型求解步骤如下:
a.给定各支路电流的初值il (0) 和a点的初始功率S (0) a=p (0) a+jq (0) a;
b.对于待求的临界点a, 按照式 (19) 形成KuhnTucker条件, 应用牛顿法进行迭代求解;
c.如果‖Sa (k+1) -Sa (k) ‖≤ε (ε为一个很小的正数) , 则结束迭代, 否则设k=k+1, il (k+1) =il (k) +Δil, Sa (k+1) =Sa (k) +ΔSa, 并返回步骤b;
d.根据计算出的临界点a的功率值, 由式 (20) 和式 (21) 计算系统方程无解调整的方向和大小。
5 算例分析
在计算过程中, 所有量值都采用标幺值计算, 功率基准值为100 MV·A, 电压基准值为额定电压, 电压上下限取[0.9, 1.1]。
算例1:以IEEE 14节点为例进行计算, 将节点1与节点14编号对调, 节点14为平衡节点, 将表1中所列节点的负荷功率同时增加为原来的4.5倍, 潮流计算不收敛。采用本文提出方法对各节点分别进行计算, 得到各节点调整到潮流收敛时应切除的最小负荷量值, 计算结果如表1所示。
节点10、11和12处在重负荷区域且电源支持不足, 负荷切除百分比较大, 虽然节点4初始负荷较大, 但由于附近电源点多, 因此并不是负荷切除比例最大的。节点7因为本身负荷较小, 因此在切除其所有负荷后系统仍然无法收敛。负荷切除比例代表切除负荷占初始负荷的百分数, 表中节点10、11和12的负荷切除比例较大, 但它们的初始负荷并不是最大的, 这也说明负荷切除比例大小和网络结构、负荷分布、电源分布等多种因素有关。
算例2:采用安徽某地区电网进行验证, 取典型日数据进行计算, 137个节点, 总有功负荷622.68 MW, 无功负荷50.99 Mvar, 假定与地区外电网交换功率在计算过程中保持不变。将其中6个110 k V变电站负荷同时增加到原来的7倍, 潮流计算发散。采用本文的计算方法对表2中所列变电站分别针对下列3种情况进行计算, 得到各变电站要切除的最小负荷值:情况1为正常情况下计算需要切除的负荷;情况2为投入这6个变电站的无功补偿装置, 最多可以补偿无功功率38.8 Mvar;情况3为不投入无功补偿装置, 并且放王变有120 MW为重要负荷不能切除。
对于潮流无解向有解区域调整都是以尽量减少切除负荷为目标, 可以采用的调控方法也有多种。对于情况2, 表1说明当对测试系统进行无功补偿后, 系统总的负荷切除量减少了48.9 MW, 这是因为无功补偿装置对节点电压的支持, 使得各变电站的潮流有解的功率临界值范围变大了。当放王变有重要负荷不能切除时, 总的负荷切除量值增加了29.3 MW, 这是因为此时的优化过程是有条件的优化, 并不是最优结果, 要保证重要负荷不被切除, 需要在其他变电站切除更多的负荷来弥补。
采用改进牛顿法和最优乘子法对算例2进行计算, 各变电站切除负荷量值的计算结果比较见表3。由此可以看出, 本文提出的算法优于改进牛顿法和最优乘子法。
6 结论
在进行电力系统无解调整过程中, 采用节点电压和支路电流作为状态变量的网络方程的维数增加了, 同时由于需要考虑运行时的节点注入功率的限制而使计算复杂度增加, 与传统的节点电压作为状态变量的方程相比较, 这给问题的求解带来了一定困难。在本文中, 利用解的唯一性边界条件和优化目标的Kuhn-Tucker条件采用牛顿法求解。最终本文得出以下结论:
a.电力网络方程可以表示为基于节点电压和支路电流的混合形式;
b.从切负荷的计算结果来看, 提出的调整策略优于其他方法;
c.本文提出的基于节点电压和支路电流混合方程的数学模型可以应用于电力系统其他优化问题中。
回归直线方程的简单推导 篇3
一、确定回归直线的位置
平均数反映一组数据的集中趋势.能够利用所有数据的特征是它的优点之一.除此之外, 平均数能使得误差平方和达到最小.如果利用平均数代表数据, 则可以使二次损失最小.对所给的样本数据的横坐标与纵坐标分别取平均值x-、珔y, 则坐标点 (x-, 珔y) 称为样本中心.依据平均数的意义, 样本中心 (x-, 珔y) 反映了样本数据的集中趋势, 所以回归直线一定通过样本中心 (x-, 珔y) .
二、求回归直线的参数
本文利用回归直线恒过样本中心的特点以及二次函数求最值的方法而得到回归直线的两个参数公式.该方法思路清楚, 推理简单, 并且还能加深学生对回归直线的理解———回归直线恒过样本中心.本人认为教材应该使用本文方法介绍回归直线方程.
参考文献
[1]刘坦.回归直线方程的另一推导[J].数学通讯, 2003 (23) :10.
一元回归直线方程的简易推导 篇4
根据经验公式拟合原理及点与直线的位置关系, 有:yi=a+bxi (i=1, 2, 3, …, n)
对上式两边同乘以xi得
xiyi=axi+bx2i (i=1, 2, 3…, n)
对上面两式求累积得:
将 (1) 式两边同除以n得: