偏最小二乘估计法(共3篇)
偏最小二乘估计法 篇1
在轻型舰载鱼雷发射的过程控制和参数分析中, 动力学模型往往比较复杂, 如何利用有限的实验数据, 进行鱼雷发射过程中一些主要参数的分析及快速预报是十分有意义的。在潜艇鱼雷发射装置管内运动参数设计中, 首先要弄清鱼雷管峰压的影响因素及其函数关系。文献[1]利用基于最小二乘法的回归分析方法, 建立了发射管内峰压Pm的一元线性回归方程, 并进行了显著性检验。
偏最小二乘回归是一种新的多元数据分析方法, 集多元线性回归、典型相关分析和主成分分析的基本功能为一体, 将建模预测类型的数据分析方法与非模型式的数据认识方法有机地结合起来, 使得模型精度、稳健性、实用性得到提高[2,3,4], 已广泛应用于各领域的研究中[5,6,7,8,9,10]。本文应用偏最小二乘回归方法, 进一步探索鱼雷水面发射时影响鱼雷管峰压Pm的主要因素, 建立回归方程并进行误差分析。
1偏最小二乘回归模型
1.1建模原理
设有p自变量X={x1, x2, …, xp}和q个因变量Y={y1, y2, …, yp}, 观测n个样本点, 分别在X与Y中提取出成分t1和u1 (即t1是x1, ..., xp的线性组合, u1是y1, ..., yq的线性组合) , 要求t1和u1应尽可能大地携带他们各自数据表中的变异信息, 同时t1与u1的相关程度能够达到最大使得t1和u1应尽可能好的代表数据表X和Y, 同时自变量的成分t1对因变量的成分u1又有最强的解释能力。
在第一个成分t1和u1被提取后, 分别实施X对t1的回归以及Y对u1的回归。如果回归方程已经达到满意的精度, 则算法终止;否则, 将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此往复, 直到能达到一个较满意的精度为止。若最终对X共提取了m个成分t1, …, tm, 偏最小二乘回归将通过实施yk对t1, …, tm的回归, 然后再表达成yk关于原变量x, …, x的回归方程 (k=1, 2, …, q) 。
1.2交叉有效性检验
将所有n个样本点分成两部分:第一部分除去某个样本点i的所有样本点集合 (共含n-1个样本点) , 用这部分样本点并使用h个成分拟合一个回归方程;第二部分是把刚才被排除的样本点i代入前面拟合的回归方程, 得到yj在样本点i上的拟合值y hj (-i) 。对于每一个i=1, 2, …, n, 重复上述测试, 定义Y的预测误差平方和为PRESSh, 有PRESSh=, 显然, 如果回归方程的稳健性不好, 误差就很大, 它对样本点的变动就会十分敏感, 这种扰动误差的作用, 就会加大PRESSh的值。
1.3精度分析
在偏最小二乘回归计算过程中, 所提取的自变量成分th一方面可以尽可能多地代表X的变异信息, 另一方面又尽可能与Y相关联, 解释Y中的信息, 用r (xi, xj) 表示两个变量之间的相关关系, 定义t1, t2, …, th对各变量的解释能力。
对自变量X的累计解释能力:
对自变量X的累计解释能力:
对自变量Y的累计解释能力:
定义为变量投影重要性指标用来描述自变量对因变量的解释能力, 其中whj表示轴wh的第j个分量, VIPj的意义:由于xj对Y的解释是通过th来传递的, 如果th对Y的解释能力很强, 而xj在构造th时, 又起到了非常重要的作用, 则可以认为xj对Y具有相当大的解释能力。
2鱼雷管峰压预测
2.1建立模型
发射鱼雷时, 鱼雷从静止开始, 可以通过不同的运动规律, 进行舰艇鱼雷发射装置管内运动参数的设计。分别记发射气瓶的容积记为x1, 发射气瓶的初始压力为x2, 发射阀喉部的通径为x3, 文献[1]分析了内弹道试验实测数据表1。
建立了鱼雷管峰压的线性回归模型为
Pm=-0.078 3x1+0.035x2+0.048 9x3。
本文利用偏最小二乘法建立模型。首先进行交叉有效性检验, 可得PRESSh=[0.5136 0.21330.2062]', 当h=3时, PRESSh达到最小, 模型的预测能力最好, 因此取3个主成分t1, t2, t3建立模型, 得到鱼雷管峰压的偏最小二乘回归标准化变量模型:
Pm=0.153 7x1+0.795 9x2+0.367 6x3 (1)
转化为原始变量回归方程为:
Pm=-6.610 6+0.124 9x1+0.031 8x2+0.175 9x3 (2)
2.2模型评价
2.2.1累计解释能力分析
计算t1, t2, t3的累计解释能力数值见表2。可以看出, 当取3个主成分时, t1, t2, t3对x1、x2和x3的累计解释能力达到100%, 对全部自变量x的累计解释能力达到100%, 对因变量y的累计解释能力均超过98%, 均达到了很高的解释水平, 说明用偏最小二乘法拟合出的回归模型能概括原始数据所携带大部分的信息。
2.2.2变量投影重要性指标
经计算, 得变量投影重要性指标VIP=[0.1834 1.463 1 0.908 8]', 对鱼雷管峰压的影响程度依次为发射气瓶的初始压力、发射阀喉部的通径和发射气瓶的容积。
2.2.3相关关系分析
图1给出了三个主成分与u1的平面图。从图中可以看出, t1与u1存在明显的线性关系, 说明发射气瓶的容积、发射气瓶的初始压力、发射阀喉部的通径与鱼雷管峰压有显著的相关关系, 采用偏最小二乘回归方法建立的线性模型 (1) 、 (2) 是合理的, t2、t3与u1也存在着一定的线性关系, 但已经很弱了。
2.2.4 鱼雷管峰压拟合结果
鱼雷管峰压的实测值与拟合值的对比情况如表3所示。从中可以看出, 偏最小二乘回归拟合值好于文献[1]的回归值, 相对误差较小, 表明偏最小二乘回归模型能较好的反映鱼雷管峰压与气瓶压力、发射阀通径、气瓶容积的关系, 预测效果较好。
鱼雷管峰压实测值与拟合值对比图如图2所示。可以看出, 所有的样本点均排列在图中对角线的附近, 模型的拟合效果很好。
3 结论
本文采用偏最小二乘回归方法, 经交叉有效性检验, 建立了鱼雷管峰压与气瓶容积、气瓶压力和发射阀通径的关系模型。通过检验, 该模型对自变量和因变量的解释能力较高, 通过与实测值的对比, 该模型拟合精度较高, 具有较好的预测能力。
摘要:采用偏最小二乘回归方法, 经交叉有效性检验建立了鱼雷管峰压的回归方程。通过实验数据比较, 该模型拟合精度较强, 说明偏最小二乘回归是估算舰艇鱼雷发射内弹道特征参数的一种有效方法。
关键词:鱼雷管峰压,偏最小二乘,预测,误差
参考文献
[1] 李志华, 申志伟. 鱼雷内弹道特征参数估计的回归分析. 舰船电子工程, 2009 (12) :188—191
[2] 乔汝椿. 潜艇鱼雷发射装置内弹道特性初步设计. 水中兵器, 2003; (2) :51—55.
[3] 王惠文. 偏最小二乘回归方法及其应用. 北京:国防工业出版社, 1999
[4] 罗批, 郭继昌, 李锵, 等. 基于偏最小二乘回归建模的探讨. 天津大学学报, 2002;35 (6) :783—786
[5] 贾子英, 陈松辉, 黄华. 基于偏最小二乘的两栖突击车作战效能预测. 舰船电子工程, 2009; (1) :119—121
[6] 巴胜生. 基于偏最小二乘回归的军用飞机效能预测. 自动化技术与应用, 2006;25 (10) :40—42
[7] 钱筱丹, 黎放, 卞金露. 偏最小二乘回归在舰船维修费用预测中的应用. 舰船科学技术, 2007;29 (4) :98—100
[8] 任震, 张静伟, 张晋听. 基于偏最小二乘法的设备故障率计算. 电网技术, 2005;29 (5) :12—16
[9] 王文圣, 丁晶, 赵玉龙, 等. 基于偏最小一乘回归的年用电量预测研究. 中国电机工程学报, 2003;23 (10) :17—21
[10] 王松岭, 袁雄俊, 侯军虎, 等. 基于偏最小二乘法的通风机性能仿真模型. 流体机械, 2001;29 (12) :19—23
偏最小二乘估计法 篇2
在线性回归模型中普通的最小二乘估计(LSE)许多情形下是不稳健的.本文介绍了一种投影深度函数,深度加权平均和深度加权LSE,这些估计量有符合需要的`稳健性.并讨论了在深度加权LSE情形下线性回归模型的拟合检验问题.
作 者:范允征 林路 Fan Yunzheng kin Lu 作者单位:范允征,Fan Yunzheng(南通大学理学院,江苏,南通,226007)
林路,kin Lu(山东大学数学与系统科学学院,山东,济南,250100)
偏最小二乘估计法 篇3
关键词:系统谐波阻抗,偏最小二乘回归,用户谐波发射水平
在电力系统中, 供电系统谐波的定义是对周期性非正弦电量进行傅立叶级数分解, 除了得到与电网基波频率相同的分量, 还可以得到一系列大于电网基波频率的分量, 这一部分分量即被成为谐波。谐波频率与几波频率的比值称之为谐波次数。电网中有时也存在非整数倍谐波, 称之为非谐波或者分数谐波, 谐波实际上是一种干扰量, 使电网受到污染。
1 谐波的危害和抑制
1.1 谐波的危害
理想的公用电网所提供的电压应该是单一而固定的频率以及规定的电压幅值。谐波电流和谐波电压的出现, 对公用电网是一种污染。谐波对电网的危害十分严重, 使电力系统中电能的生产、传输和利用的效率降低, 使电气设备过热、产生振动和噪声, 并使绝缘老化, 使用寿命缩短, 甚至发生故障或者烧毁等等。谐波可引起电力系统局部并联谐振或串联谐振, 使谐波含量放大, 造成电容器等设备烧毁。谐波还会引起继电保护和自动装置误动作, 使电能计量出现混乱。对于电力系统外部, 谐波对通信设备和电子设备会产生严重干扰。
1.2 谐波的抑制
对于解决电力系统中电力装备和其他谐波来源的污染问题, 有两条可行的方法, 首先是装设一种谐波补偿装置来补偿谐波, 这一方法适用于各种来源的谐波, 其次是对电力系统中的电力设备进行种种技术上的改造, 尽量使其不产生谐波, 并且始终将功率因数控制到1, 这一条方法只适用于被谐波污染的电力系统中电子设备。在传统方法中, 装设谐波补偿装置的方法就是采用LC调谐波滤波器, 这种方法技能补偿谐波, 又能补偿无功功率, 而且LC调谐波滤波器结构简单, 操作方便, 因此一直被广泛使用。而LC调谐波滤波器的主要缺点则是对谐波的补偿特性会受到电网的阻抗和电力系统的运行状态的影响, 比较容易的和电力系统发生联通谐振, 致使谐波不仅没有被补偿, 反而持续放大, 最终导致LC滤波器过载运行直至烧毁。而且LC滤波器只能补偿固定频率的谐波, 补偿效率也不高。
2 偏最小二乘回归法对谐波检测的运用
对于电力系统的运行, 谐波的治理已经是必然要面对的重点问题。谐波的定位有两种方法, 第一种是将电力系统分成供电侧和用户侧两侧, 然后根据相应的等效电路模型确定发出主谐波源存在的那一侧, 这种方法成为基于等小电路吗, 模型的定位法, 根据定位依据的不同, 可以分为功率定位法、阻抗定位法、灵敏度定位法;第二种是估计电力系统整体谐波的方法, 计算出系统中各个节点的谐波电压一直各个支路的谐波电流, 从计算结果中判断出哪条支路或者哪个节点含有谐波, 根据不同的量测量的选择, 可以分为功率量测、电压量测和电流量测三种。
谐波源的监测就是指定量的计算出系统侧与用户侧对公共连接点的谐波畸变电压的大小, 并明确估算出用户侧谐波的发射水平。国内外对于谐波发射水平的估计方法主要还是围绕着对系统和用户谐波波阻抗的估算来展开。
偏最小二乘回归法, 是一种新型的多元统计数据分析方法, 它主要研究的是多应变量对多自变量的回归剑魔, 特别当各变量内部高度线性相关时, 用偏最小二乘回归法更有效。此外, 偏最小二乘回归法还可以较好的解决了样本个数少于变两个数等问题。偏最小二乘法是集主成分分析、典型相关分析和多元线性回归分析3种分析方法的优点于一身。它与主成分分析法都试图提取出反映数据变异的最大信息, 但主成分分析法只考虑一个自变量矩阵, 而偏最小二乘法还有一个“响应”矩阵, 因此具有预测功能。研究认为, 集多元线性回归分析、典型相关分析、主因子分析等方法于一体的偏最小二乘回归方法 (PLS) 更适用于FM分析, 可以避免数据非正态分布、因子结构不确定性 (factor indeterminacy) 和模型不能识别等潜在问题。偏最最小二乘回归与传统的多元线性回归模型相比, 有以下几个突出的特点:
(1) 能够在自变量存在严重的相关性的条件下进行回归建模;
(2) 允许在样本点个数少于变量个数的条件下进行回归建模;
(3) 偏最小二乘回归在最终模型中将包含原有的所有自变量;
(4) 偏最小二乘回归模型更易于辩识系统信息与噪声 (甚至一些非随机的噪声) ;
(5) 在偏最小二乘回归模型中, 每一个自变量的回归系数将更容易解释。
目前, 偏最小二乘回归计算方法在国内已经开始逐步实施, 该方法应用于负荷模型预测的研究成果, 并且在过去“二元回归”的方法的基础上, 已有将偏最最小二乘回归方法初步应用于配电网谐波源定位与检测中, 充分的发挥算法本身的特点, 对电力系统数据建模有了新的思路。在应用偏最小二乘回归方法进行谐波源的定位时, 首先应用PMU (相量测量单元) 对电力系统等效电路各个节点的电压和电流相量进行同步测量, 使得测量结果更加准确, 从而给偏最小二乘回归法的应用奠定了更好的基础, 使得计算结果更加符合实际情况, 以使谐波源的定位更加准确。谐波阻抗与谐波发射水平评估是近年来国内外较为关注的谐波源检测方面的研究内容。利用偏最小二乘回归方法可得到较好的评估效果。采用统计回归和其它建模方法, 可在大量相关的实验数据基础上对复杂系统进行建模, 但普通的多元统计回归方法在实际系统建模中往往存在一些难以解决的问题。传统的最小二乘法在其参数估计式的计算中, 要求其计算公式必须是可逆矩阵, 估计式才有意义。所以当模型变量的多重相关性严重时, 或者当系统中样本容量少于变量个数时, 参数估计一般就会失效。采用人工神经网络建模时, 网络模型的选取通常只能依据经验或采用随机试探的方法, 具有一定的随意性;另外, 由于网络采用“黑箱”结构, 它对所描述对象的输入输出变量之间的关系往往缺乏很好的解释性。这些问题在一定程度上制约了神经网络在系统建模方面的进一步发展。偏最小二乘回归方法借助提取主元的思路, 有效地提取对系统解释性最强的综合信息, 从而实现对高维数据空间的降维处理, 较好地克服变量多重相关性在系统建模过程中的不良影响。二元回归法是一种估算电力系统谐波阻抗和用户谐波发射水平的方法, 但在二元回归方程中, 两个自变量的相关系数较大, 存在严重的多重相关性, 这样会使最小二乘法失效, 得到的回归模型的拟合效果不好。为了较好地解决多重相关性问题, 基于电网各参数的复数关系的二元回归方程, 可以用偏最小二乘法来求解系统阻抗和用户谐波发射水平。综上所述, 根据偏最小二乘的基本原理、建模基本思想, 以及该方法在配电网谐波电源定位与检测中的应用, 已经可以证实偏最小二乘法在配电网谐波源定位与检测中得到了较好的效果。
由于实习系统中谐波源发射水平较低, 在数据处理的精度上出现误差相对较大的情况, 当系统中谐波含量越大, 偏最小二乘回归模型估算方法在数据建模上的效果将更加明显。
3 结语
随着电力企业的不断发展壮大, 为了适应社会和人民生活工作的要求, 必然要对电能的质量做出更高的要求, 谐波治理是电力系统中影响电能质量的重点, 应用偏最小二乘回归模型可以较好的估算出系统谐波阻抗以及用户谐波发射水平, 对于分清楚电力系统中系统侧和用户侧的对于电能质量恶化的责任。与传统方法相比, 偏最小二乘回归法算法集多元性回归、典型相关分析和主成分分析的基本功能为一体, 可以同时实现回归建模、数据结构简化以及变量间相关性分析, 能够有效的解决谐波检测中变量相关性给系统建模带来的误差, 并且更加的统一辨认出系统信息与造成, 对于电力系统中谐波的检测和定位有很大的帮助。
参考文献
[1]黄舜, 徐永海.基于偏最小而成回归的系统谐波阻抗与谐波发射水平的评估方法[J].中国电机工程学报, 2007, 27 (1) :94-97.
[2]侯丽丽.配电网谐波源的定位[D].山东大学, 2009.