最小二乘法模型(共9篇)
最小二乘法模型 篇1
0 引言
光伏发电系统因太阳能“取之不尽,用之不竭”的天然优势而日益受到重视。光伏并网逆变器是光伏系统实现并网发电的核心装置之一,具有将太阳电池发出的直流电转化为和电网电压同频、同相交流电的功能。目前关于光伏并网逆变器的研究主要集中在逆变器的硬件设计、控制模型和算法等[1,2,3,4,5,6],而对于逆变器的整体模型结构研究甚少,测试手段亦不够丰富。文献[7]基于瞬时转换效率,建立和检验并网光伏逆变器AC/DC转换效率模型,评估了拟合精度与应用价值。文献[8]在dq旋转坐标系下,提出一种模型电流预测控制方法,预测了三相并网逆变器的静、动态特性。文献[9]提出了一种光伏阵列特性的工程计算方法,并介绍了国内第一套光伏并网逆变器测试系统,以此为平台对某逆变器参数进行了检验测试。但该测试环境是基于某特定光照、温度条件下进行的,无法反映其他工作条件下的性能参数。文献[10]对基于三相高频PWM整流器的光伏阵列模拟器作为试验电源的光伏逆变器综合性能测试平台进行系统仿真,同时对逆变器的效率、最大功率点跟踪性能、反孤岛保护功能、输出波形质量等进行了分析和研究。
逆变器运行于开关状态,是一个非线性系统;内部元器件参数在实际运行中会漂移变化;逆变器的输入电压不是理想直流电压;开关器件存在死区;逆变器时常受到不可预测扰动[11]等等都给逆变器精确建模带来一定困难。文献[12,13,14]根据逆变器拓扑结构,通过以输出端电网电流为状态变量建立了电压型逆变器的传递函数模型。文献[15,16]建立基于状态空间平均法的光伏并网的控制模型,文献[17,18]建立了一种基于开关函数的新型逆变器模型。上述模型均是在逆变器拓扑结构已知的前提下建立的,文献[12,13,14,15,16]是通过输出端列写微分方程求解得到模型,文献[17,18]是通过开关元件的通断来确立模型。事实上,实际运用的逆变器拓扑结构和控制策略往往未知,内部元器件的参数也无从知晓,上述建模方法和模型就不太适用了。
本文提出一种基于实验测试的并网逆变器建模方法,通过将逆变器整体作为黑箱处理,不考虑物理拓扑结构和控制策略,直接测取其输入输出数据,通过辨识方法建模,为逆变器建模提供新的思路。
1 基于实验测试的逆变器模型辨识
1.1 逆变器结构
逆变器是连接光伏阵列模块与电网的关键部件,它实现控制光伏阵列运行于最大功率点和向电网注入正弦电流两大主要任务。实际中比较常见的为电压型逆变器(见图1),光伏的直流输入经过全桥逆变成交流输出,逆变器的输出电压幅值自动被钳位为电网电压,通过采用控制技术实现并网电流与电网电压的相位同步,保证系统输出的功率因数接近1。
1.2 基于实验测试的模型辨识原理
逆变器本身具备损耗小,转换效率高,以及输出与电网同频同相等特点,选择相位、频率、功率等参数建立模型显然不够准确。考虑到逆变器输入电压具备较宽的波动范围,电流与电压满足一定的约束条件,因此,建模时可以选择电压和电流两个电气量作为测量的变量,测试系统能够准确同步地记录输入输出的电压和电流数据。基于实验测试的逆变器建模方法如图2所示。测试装置将测量通道直接与逆变器输入和输出端相连,同步采集电流和电压数据,将所得数据经过计算机预处理后,根据选择的模型,运用辨识理论进行参数估计,并通过检验输出拟合精度最高的模型。
1.3 辨识建模
系统辨识就是按照一个准则在一组模型类中选择一个与数据拟合的最好的模型。在研究系统辨识问题时,常把待辨识系统看做“黑箱”问题,只考虑系统的输入-输出特性。最小二乘估计辨识是系统辨识运用最为广泛的估计方法之一,是动态系统辨识的主要手段。本文把光伏并网逆变器看成一个多输入多输出的线性动态系统,用如式(1)的典型差分方程表示[19]。
式中:Uout(k)、Iout(k)为输出量的k次序列;Ud(k)、Id(k)为输入量的k次序列;n为差分方程的阶数;N为数据长度。
定义下列向量和矩阵:
则令
由此式(1)可以写成
按照实际测量情况,只有是未知的,假设为的最优估计,则输出的最优估计残差最小二乘估计要求残差平方和最小,对其求微分,得到最优估计即可得到待求的差分方程系数最终模型表示成Z传递函数为
1.4 辨识模型参数和阶次的最小二乘算法
一般讨论的估计模型参数的算法,都是假定在模型结构已知的前提下。而实际上,许多情况下模型结构事先并不清楚,在估计参数时,如果假设的结构不合理,模型将产生很大的误差。对于线性系统,模型结构辨识的主要问题是系统阶次的确定。比较不同阶次情况下,模型与观测数据间拟合好坏程度,可用残差平方和J来度量[20]。当阶次n递增时,J下降。设n0为模型真实阶次,由于n>n0,J下降不明显或趋于固定值,由此得出系统的阶次。为了提高辨识的效率和精度,将结构辨识与参数估计同时进行,采用阶次搜索的方法,逐渐提高模型的阶,在不同的阶次下估计出模型的参数和计算对应的残差平方和,再利用检验准则确定模型的阶次,最后输出模型参数。该算法能同时辨识模型参数和确定系统阶次,有效地减少了传统阶次搜索的计算量,并具有较好的数值计算品质。图3为程序流程图。
2 实验室测试与建模
2.1 测试平台
根据系统建模目的,需要得到同步的逆变器输入输出电流和电压数据,为此设计搭建了实验室测试平台。该平台主要由光伏系统、单相逆变器、同步测试仪和操作界面组成(图4)。
该光伏系统额定功率为7.68 kW的屋顶光伏系统,通过逆变器实现与楼宇配电网并网。逆变器为奥地利Fonius公司提供的IG30单相逆变器,完全实现自动控制,随着日照变化而自动并网与断网,所有设置和记录数据自动保存。并配有辐照度、温度、风速等参数检测光伏系统配件,方便监控和观察。
测试系统是由中国电力科学研究院研制的DF1024波形记录分析系统,由DF1024便携式波形记录仪、DFW软件包、微型计算机等组成。便携式波形记录仪主要完成对模拟、数字信号的采集,包含4个电流和4个电压通道,足以满足实验要求,且能实现高采样速率同步采样,和数据输出多种格式,具有测量精度高,通道多,操作简单,界面简洁等优点。
2.2 实验过程
根据建模目的进行试验设计,直接影响到系统模型辨识的精度、速度和经济性。试验设计的关键问题包括输入信号的选择、采样速率、试验持续时间等。
2.2.1 输入信号的选择
为了使过程可辨识,输入信号的最低要求是:必须满足在辨识时间内持续激励,覆盖过程的所有频谱[21]。根据实验系统的运行情况,我们测取了9~18 h逆变器的运行数据。
2.2.2 采样速率
采样间隔会直接影响数据的精度从而影响辨识的结果,采样间隔太小,会出现数值问题,使数据的相关度明显降低,在进行参数估计值时出现病态方程组,增加计算难度[22]。根据香农定理,采样速率必须大于100 Hz。设备调试初期分析得到速率小于500 Hz,采样波形会出现明显失真。采用5 000 Hz的速率进行采集,在数据不失真的前提下保证了充裕的记录时间。
2.2.3 实验持续时间
在实际测量中,一般要求足够多的数据才具有统计意义,才能达到一致性估计的目的,数据太少,辨识的精度难以保证。但由于受实际条件的限制,数据越长,出现漂移和串入额外干扰的几率增加,计算量也加大。我们选取每组测量40 s,每隔3 min测一组,这样每组的数据长度可达N=200 000个。
2.3实验结果
通过上述测试方案,真实地获取了某晴天工况À¢§下逆变器的9~18 h的输入输出数据(图5、图6)有效值。
2.4 模型辨识
利用Matalab软件编写相关程序,结果显示该系统为7阶系统。图7直观地表示了残差平方和J与阶次n的关系,当n=7时,J迅速下降,n>7之后J趋于不变。故可认为所建立的系统模型为7阶系统,与程序输出结果完全一致。得到模型参数如表1所示。
注:部分参数因为精确度的原因变为0。
由此得到单相光伏逆变器稳定工作状态下的模型,用Z传递函数表示为
图8、图9对比了实测与本模型计算的输出电压和电流,曲线几乎重合,电压百分误差曲线(图10)表明该模型验证的电压误差控制在2%以内,电流百分误差曲线(图11)表明电流误差在9%以内,误差均在工程可接受的范围之内,该模型具有良好的拟合效果和较高的辨识精度。
3 结论
光伏并网逆变器是光伏系统的核心装置,对其模型进行研究具有重大意义。本文利用现有实验条件,搭建了测试并网逆变器的输入输出特性的实验平台,通过实测工况稳定运行数据,利用最小二乘系统辨识理论,对输入输出模型进行结构辨识和参数估计,得到其稳定工作状态模型,形成了一种基于实验测试的逆变器建模方法。与以往建模方法相比,该建模方法屏蔽了逆变器拓扑结构及内部控制策略等对建模的影响,直接测取输入输出数据得到模型。该方法易于实验室条件下测试,具有广泛的适用性。辨识结果表明该方法得到的模型具有较高拟合精度,从而验证了本建模方法的正确性和有效性。
摘要:光伏并网逆变器是实现太阳能发电系统与电网并网的核心装置,准确的光伏逆变器模型对光伏接入电网的运行分析、故障保护等均具有重要的意义。针对目前逆变器模型研究较少,分析现有逆变器建模方法不足。结合7.68kW光伏实验发电系统搭建了光伏逆变器的测试平台,采集了逆变器输入输出数据,建立了基于最小二乘系统辨识算法的逆变器模型和模型参数估计方法,形成了一种基于实验测试的光伏逆变器建模方法。实验验证了此测试和建模方法的有效性。
关键词:光伏逆变器,系统辨识,测试,建模,最小二乘法
最小二乘法模型 篇2
关键词:数据处理;最小二乘法;直线拟合;visual basic
中图分类号:TP311文献标识码:A 文章编号:1009-3044(2007)15-30782-02
The VB Programming to Deal with the Data for Linear Fitting with Least Square Method
WANG Suo-ming, HOU Bin, CHEN Ze-zhen
(Yanshan University, Qinhuangdao 066004,China)
Abstract: This paper introduces the least square method on the data processing and the programming design with visual basic language. This program will make the data processing more convenient and reliable, so the complicated computing will be avoided. Accordingly, the quality and the effect of the data processing will be ensured.
Key words: data processing; least square method; linear fitting; visual basic
1 引言
在数据处理中,经常遇到两测试量x、y间存在y=ax+b的线性关系,a、b为此线性函数的参数,通常是具有物理含义的,而且一般是我们的间接待求量(或相差一常数倍).通过测出多组x,y值,同时求出未知参数a、b的过程,即为组合测量。求最佳直线参数在组合测量中比较简单,应用较广,但数据处理较为复杂。而Visual Basic作为一种可视化的计算机编程语言,具有界面友好和编程简单的特点,为数据处理中的大量计算提供了的捷径,从而减少计算工作量,得到准确的拟合曲线。
2 最小二乘法应用
在实际工作中,许多测量量之间的关系并非都是线性的,但可通过适当的变换化成线性关系,即将曲线变换成直线,做这样的变换不仅是线性关系简单、直线容易描绘,更重要的是直线的参数(斜率和截距)所包含的物理内涵是我们所需要的。常见的可化为线性关系进行处理的函数关系有以下几种:
(1)y=axb,式中a、b常量,可变换成lgy=blgx+lga,lgy为lgx的线性函数,斜率为b,截距为lga;
(2)y=abx,式中a、b为常量,可变换成lgy=(lgb)x+lga,lgy为x的线性函数,斜率为b,截距为lga;
(3)PV=C,式中C为常量,可变换成P=C(1/V),P为1/V的线性函数,斜率为C;
(5)y=x/(a+bx),式中a、b为常量,可变换成 1/y=a(1/x)+b,1/y为1/x的线性函数,斜率为a,截距为b;
(6)s=v0t+at2/2,式中v0、a为常量,可变换成s/t=(at/2)+v0, s/t为t的线性函数,斜率为a/2,截距为v0。
3 主要数据处理代码
3.1 数据计算部分
Dim xx!, xh!, yy!, yh!, xy!, r!, dyy!, myy!
Dim pmx!, pmy!, pdx!, pdy!, xjiao!, yjiao!
Dim rr As String
xx = 0: xh = 0: yy = 0: yh = 0: xy = 0: r = 0
For i = 1 To n
xx = xx + X(i) * X(i)
xh = xh + X(i)
yy = yy + Y(i) * Y(i)
yh = yh + Y(i)
xy = xy + X(i) * Y(i)
If X(i) > mx Then
mx = X(i)
End If
If Y(i) > my Then
my = Y(i)
End If
If dx > X(i) Then
dx = X(i)
End If
If dy > Y(i) Then
dy = Y(i)
End If
Next i
sx = xx - xh * xh / n
sy = yy - yh * yh / n
sxy = xy - xh * yh / n
If sx = 0 Then
MsgBox "直线垂直于横轴," & Lx.Caption & "为定值"
ElseIf sy = 0 Then
MsgBox "直线平行于横轴," & Ly.Caption & "为定值"
Else
a = sxy / sx
r = sxy / Sqr(sx * sy)
b = yh / n - xh * a / n
If r = 1 Then
sa = 0: sb = 0
Else
sa = Sqr((1 - r * r) / (n - 2)) * a / r
sb = Sqr(xx / n) * sa
End If
3.2数据输出部分
If Abs(r) < 1 Then
Label6.Caption = "a=" & Format(a, dots(sa)) & "S(a)=" & Format(sa, dots(sa))
Label7.Caption = "b=" & Format(b, dots(sb)) & "S(b)=" & Format(sb, dots(sb))
Else
Label6.Caption = "a=" & Format(a, Formx)
Label7.Caption = "b=" & Format(b, Formx)
End If
Label5.Caption = "得形式为" & Lx.Caption & "=a" & Lx.Caption & "+b的曲线方程中"
Lxx = (mx - dx) / 10
Lyy = (my - dy) / 10
pdx = dx - Lxx 'IIf(dx > 0, dx - Lxx, Lxx + dx)
pdy = dy - Lyy 'IIf(dy > 0, dy - Lyy, dy + Lyy)
pmx = mx + Lxx 'IIf(mx > 0, Lxx + mx, mx - Lxx)
pmy = my + Lyy 'IIf(my > 0, my + Lyy, my - Lyy)
Lxx = (pmx - pdx) / 10
Lyy = (pmy - pdy) / 10
3.3绘图部分
P1.ScaleMode = 3
P1.DrawWidth = 1
P1.Scale (pdx, pmy)-(pmx, pdy) '坐标轴
P1.ForeColor = RGB(255, 255, 0)
If dx > 0 Then
P1.Line (pdx + Lxx, pdy + Lyy)-(pdx + Lxx, pmy - Lyy)
xjiao = dx
ElseIf mx < 0 Then
P1.Line (pmx - Lxx, pdy + Lyy)-(pmx - Lxx, pmy - Lyy)
xjiao = mx
Else
P1.Line (0, pdy + Lyy)-(0, pmy - Lyy)
xjiao = 0
End If
If dy > 0 Then
P1.Line (pdx + Lxx, pdy + Lyy)-(pmx - Lxx, pdy + Lyy)
yjiao = pdy + 0.8 * Lyy
ElseIf my < 0 Then
P1.Line (pdx + Lxx, pmy - Lyy)-(pmx - Lxx, pmy - Lyy)
yjiao = pmy - 0.2 * Lyy
Else
P1.Line (pdx + Lxx, 0)-(pmx - Lxx, 0)
yjiao = 0
End If
P1.DrawWidth = 3
dyy = a * pdx + b '直线
myy = a * pmx + b
P1.Line (pdx, dyy)-(pmx, myy), RGB(100, 120, 0)
P1.PSet (dx, dy), RGB(0, 0, 0)
P1.ForeColor = RGB(0, 0, 0)
For i = 1 To n '绘点
P1.DrawWidth = 5
P1.PSet (X(i), Y(i)), RGB(255, 0, 0)
P1.CurrentX = X(i) - Lxx / 6
P1.CurrentY = yjiao
P1.Print Format(X(i), Formx)
P1.CurrentX = xjiao + Lxx / 5
P1.CurrentY = Y(i) + Lyy / 5
P1.Print Format(Y(i), Formy)
Next i
If Abs(r) = 1 Then
rr = "完全符合线形关系"
ElseIf Abs(r) > 0.98 Then
rr = "线性关系很好"
ElseIf Abs(r) > 0.9 Then
rr = "具有较好的线性关系"
ElseIf Abs(r) > 0.7 Then
rr = "线性关系较差"
Else
rr = "可能并不存在线性关系,请核实"
End If
Lr.Caption = "r=" & Format(r, "0.0000") & "该组数据" & rr
End If
4 应用举例
以热敏电阻的阻值与温度的关系为例实验测得以下7组数据。
表1 测量数据
以上数据表输入软件经处理得数值为:
a=0.291±0.007
b=70.6±0.2
c=0.9987
图1 软件处理结果面版
参考文献:
[1]王可,毛志伋.基于Matlab实现最小二乘法曲线拟合.北京广播学院学报,2005,(12):52-56.
[2]杨述武.普通物理实验(一.力学及热学部分)第三版.高等教育出版社,2005.
[3]蔡欣,张聪,李煦.Visual Basic程序设计基础.中国铁道出版社2003,9.
[4]刘炳文.精通Visual Basic 6.0中文版.北京:电子工业出版社 1999,7.
最小二乘法模型 篇3
三维城市建筑物模型是城市地理信息系统(UGIS)研究的一个重要内容,也是数字城市的重要内容,空间关系又是GIS的重要理论问题之一,其在GIS空间数据建模、空间查询、空间分析、空间推理、制图综合、地图理解等过程中起着重要的作用,因此建筑物三维模型的空间约束关系的表达对数字城市的建设有重要意义[1]。
1 最小二乘法原理
对给定数据(xi,yi)(i=0,1,…,m),在取定的函数类Φ中,求p(x)∈Φ,使误差ri=p(xi)-yi(i=0,1,…,m)的平方和最小,即:
设观测值为
这是一个非线性形式的方程组,通常以
2 建筑物数据的空间约束关系
数字城市中建筑物的基本空间目标空间关系包含点与点、点与线、点与面、点与体、线与线、线与面、线与体、面与面、面与体、体与体之间的各种关系。笔者认为,对空间关系的描述多种多样,有定量的,也有定性的,有精确的,也有模糊的。各种空间关系的描述也并非绝对独立,而是具有一定的联系。
由于本文探讨的是建筑物三维模型,这里只分析点、线、面、体之间在三维的空间关系。
假设(xi,yi,zi)(i=1,2,3,…,n)为建筑物特征点的观测值,相应的平差值和改正数为
1)三点共线(如图1所示)。
经过测量后的O,A和E点的坐标应满足在同一直线的条件,即三点共线,设OA直线的方位角平差值为α,AE直线的方位角平差值为β,应使α=β,其条件方程式:
其中,αOA,αOE分别为OA和OE方向的方位角,由观测值计算得到。
2)线与线之间的空间关系及其约束条件。
a.线线平行条件的空间约束:在图2中,在面ABCD中,线AB与线CD平行,使
如果在这建筑物的一个面能取多个特征点,就可以多列出几个直线条件和一个平行线条件。
b.线线垂直条件的空间约束:在图2中,面ABCD是一个长方形,其四个角都是直角,设AB直线的方位角的平差值为
其中,αAB,αAD分别为AB和AD方向的方位角,由观测值计算得到。
c.线线相交(固定夹角)条件的空间约束:设AB直线的方位角的平差值为
其中,αAB,αAD分别为AB和AD方向的方位角,由观测值计算得到。
3)面与面之间的空间关系及其约束条件。
a.面与面相交(有固定夹角)。设AD直线的方位角的平差值为
其中,αOA,αAD分别为OA和AD方向的方位角,由观测值计算得到。
b.面面共面或面面平行。面面间的共面与平行可转化为线线之间的空间关系,此处不在赘述。
综上所述,图形条件越复杂,分解组合就越复杂,获取的冗余数据越多,约束条件随之越多,条件方程式越多,经过处理的数据越多,测量值越接近真实值。
3 结语
建筑物模型的建立是一个复杂的过程,通过对其模型的空间关系进行分析,利用最小二乘法原理对数据进行平差处理,可以降低建模的难度,提高建模的精度,提高了模型的可靠性和实用性,对数字城市建设具有重要意义。
摘要:针对建筑物建模的重要性,提出建筑物体元间的空间约束条件,利用最小二乘法原理对其数据进行处理,为数字城市建筑物建模数据处理提出了可行的方法,提高了模型的可靠性和实用性,对数字城市建设具有重要意义。
关键词:地理信息系统,最小二乘法,空间关系,约束条件
参考文献
[1]万刚,陈刚,游雄.虚拟城市中地物几何建模技术的研究[J].测绘学报,2002(1):49-50.
[2]祁向前.基于最小二乘法原理建筑物模型的实现[J].地理与地理信息科学,2008,24(5):113.
[3]祁向前.数字城市单体建筑物建模中的数据处理问题[J].三晋测绘,2004(2):41-42.
[4]吴军.三维城市建模中的建筑墙面纹理快速重建研究[J].测绘学报,2005(4):93-94.
[5]祁向前.数字城市单体建筑物模型的空间关系[J].山西建筑,2007,33(33):15-16.
[6]孙敏.三维城市模型的数据获取方法[J].测绘通报,2002(6):8.
最小二乘法模型 篇4
摘要:为了突破独立性假定和主观赋权的局限,兼顾真实数据的结构特征,文章提出偏最小二乘—二阶因子模型(Partial Least Square Second-order Latent Variable Model,PLS-SLVM),解决综合变量的构建问题。二阶因子模型(Second-order Latent Variable Model,SLVM)作为构建综合变量的模型基础,其测量模型和结构模型分别展示了可测变量与潜变量间、潜变量间的结构关系。偏最小二乘(Partial Least Square,PLS)作为构建综合变量的估计方法,不要求可测变量间相互独立,保证权重赋值的客观性。与简单线性相加相比,PLS-SLVM较难理解,运算较为复杂,但PLS-SLVM放宽了独立性假定,兼顾变量间真实的相关关系和结构状态,提高了综合变量的分类准确性,为企业管理与绩效评价等方面提供方法学指导。
关键词:综合变量构建方法;二阶因子模型;偏最小二乘估计;简单线性相加
一、 引言
综合变量构建方法需要满足全面性、目的性、可比性、层次性、科学性等基本原则。综合变量必须反映综合评价问题的各个方面,必须紧紧围绕综合评价目的展开,保证研究结论的确反映了评价意图,必须保证对每个研究对象的公平性和可比性,不能有倾向性的侧重某些研究对象。综合变量的构建过程必须关注综合评价指标体系的层次性和结构性。这种层次性和结构性一方面体现在综合变量架构的设计上,另一方面则体现在不同指标间关系的明确量化。综合变量构建过程的层次性和结构性必须以综合变量构建方法的科学性为前提。从元素到结构,从计算内容到计算方法都必须科学、合理、准确。科学的综合变量构建方法一定是客观的、严谨的,是经得起推敲的。从真实数据出发,有效避免人为干预,严格把握构建方法的适用条件,保证分析结果和研究结论的客观性和严谨性。
简单线性相加作为一种简单易懂、方便操作的综合变量构建方法。它要求所有条目间、不同条目所属方面间均相互独立,一般默认等权或人为赋权。这种强假设条件和主观的赋权方式直接影响研究结论。本文提出的PLS-SLVM可以改进这些方面的不足,完成综合变量的构建。
二、 PLS-SLVM的提出
1. 提出依据。目前,国内外常用的综合变量构建方法不少于几十种。尽管各种方法在原理、适用范围、优劣点方面有所不同,但大体上可以分为两类:一类是主观赋权,即采用综合咨询评分的定性方法确定权重,比如简单线性相加、层次分析法、综合指数法等。另一类是客观赋权,即根据各指标间的数值关系确定权重,比如主成分分析、因子分析等等。这些常用的综合变量构建方法存在一些共性的特点。主观赋权法普遍具备简单易懂、清晰明了、方便操作的特点,客观赋权法则有效规避了主观赋权法在权重确定方面不够客观的缺陷,利用数据信息构建各指标变量间的层次关系和相互关联。此外,不同的综合变量构建方法都存在着不同的局限性。层次分析法的评价结果因判断矩阵的不同而异,而且利用九级分制对指标的两两比较很容易出现矛盾,综合指数法较难确定比较标准,而且评价结果对比较标准过于依赖。而主成分分析法在主要主成分的涵义和个数的确定方面都存在一些质疑。涵义界定的是否清楚直接关系到对结果的解释清晰度和评价可信度。而根据方差贡献率选择的主要主成分毕竟不能代表全部数据信息,尤其在主成分是无序变量时,主成分综合评价函数会导致错误的结论。相比之下,虽然因子分析同样利用了降维的思想,但是因子分析需要满足因子间不相关的假设条件,通过坐标轴不同程度的旋转会得到不同的因子,而且因子载荷有时为负值,不易解释。显然,如果用因子分析寻找变量间的潜在结构,构造综合变量存在一定的问题。
简单线性相加作为综合变量的构建方法之一,主要存在以下两个方面的不足:
第一,简单线性相加假定所有条目间、不同条目所属方面间均相互独立。在实际应用中,某几个条目间可能存在独立关系,但所有条目间相互独立很难成立。试想,如果真实世界中所有条目间相互独立,则统计学中讨论变量间相关关系和因果关系的方法将无法使用,数据挖掘和机器学习的许多方法将失去研究基础。不同条目所属方面的独立性假定,削弱了综合变量本身可能存在的结构形态。不同方面间可能存在着一定的相关关系,这种相关性通过综合变量可以得到进一步的解释,表现为共同受到的潜在因素的影响。
第二,简单线性相加采用默认等权或主观赋权法,加入人为干预,不够客观。主观赋权因人而异,不同的专家给出不同的权重。主观赋权没有考虑不同人群的特征,不同的人群可能有相同的权重。这种主观而“普适”的权重赋值方式直接影响综合变量的研究结论和评价效果。赋权方式应该是基于客观数据的,是兼顾人群特征的,是参与数值计算过程始终的。尤其在挖掘和探索综合变量不同方面间结构关系,通过先验信息决定权重削弱了对实际数据的提取和利用。
真实世界的可测变量间往往不相互独立。综合变量的构建需要真实反映综合变量的内涵与逻辑结构,有效避免简单线性相加等主观赋权法对非客观数据因素的依赖性。相比之下,PLS-SLVM从真实数据出发,不要求所有条目间相互独立,揭示条目间实际存在的相关关系和结构形态。选择客观的权重赋值方式,有效避免人为干预,经过权重和得分的相互作用和反复调整,完成综合变量的所有数值计算工作。PLS-SLVM的提出,突破了简单线性相加的局限,提供了一种新的综合变量的构建方法。
2. SLVM。作为综合变量构建方法的模型基础,SLVM根据变量是否可以直接观测,将模型中的变量分为可测变量和潜变量。SLVM的提出将变量是否可以直接观测这一属性和变量间的结构清晰的展示出来。一阶因子表示的是可测变量共同反映的某个方面,二阶因子是一阶因子的综合体现,反映的是一阶因子共同受到的影响因素。比如,在评价企业家领导力、企业战略绩效、企业资本等问题时,二阶因子可以作为综合变量,反映这些评价课题不同方面共同收到的影响因素。SLVM的表达形式如下:
xjh=?姿jh?孜j+?着jh(1)
?孜j=?茁j?浊+?啄j(2)
(1)式为测量模型,它反映的是可测变量xjh与一阶因子?孜j间的关系。?姿jh是载荷系数,表示一阶因子?孜j对可测变量xjh的影响。?着jh为第j个一阶因子?孜j中第h个可测变量xjh的测量误差,均值为0,方差为?啄2jh,且与一阶因子?孜j不相关。
(2)式为结构模型,它反映的是一阶因子?孜j与二阶因子?浊间的关系。?茁j是路径系数,表示二阶因子?浊对一阶因子?孜j的影响。?啄j为第j个一阶因子?孜j的测量误差,均值为0,方差为?啄2j。
3. PLS。为了避免联合分布的假定,可以采用PLS估计SLVM中的因子得分和系数。算法的基本思想如下:
首先,标准化一阶因子(?孜j-mj)的外部估计Yj。一阶因子的外部估计是指利用可测变量的线性组合对一阶因子进行逼近。标准化一阶因子(均值为0,标准差为1)以中心化的可测变量的线性组合表示:
Yj∝[?撞?棕jh(xjh-xjh)](1)
标准化一阶因子最终可写为:
Yj∝[?撞■jh(xjh-xjh)](2)
一阶因子的估计为:
mj=?撞■jhxjh=Yj+mj(3)
■jh被称为外生权重。
其次,标准化二阶因子(?浊-m)的内部估计Z。二阶因子潜变量的内部估计指的是利用因子间的某种数学关系,对一阶因子的外部估计值进行调整的过程。内部估计Z被定义为:
Z∝?撞eiYi(4)
内生权重ei指在模型中有箭头连接的两个因子的关系,它有路径加权方法、重心方法、因子加权方法三种方法可以选择,本文采用重心法,即ei等于Yj与Yi的相关系数的符号。
第三,更新一阶因子与可测变量间、二阶因子与一阶因子间的权重。本文利用(7)式更新一阶因子与可测变量间的权重?棕j,利用(8)式更新二阶因子与一阶因子间的权重e。
?棕j=(X′jXJ)-1X′jXJ(5)
e=(Y′jYJ)-1Y′jZJ(6)
初始的权重可以任意的赋值,然后进行上述的迭代计算,直到收敛为止。常用的收敛判断标准为:相邻两次的权重估计值相差小于10-5。
因此,PLS算法的迭代步骤如下:
步骤1设定初始权重?棕jh=1,计算向量Yj的初始值为?撞(xjh-xjh),通过(4)式,可以得到Z的估计值;
步骤2根据Z的估计值,通过公式(5)和(6),可以计算出新的权重?棕j和e;
步骤3利用计算得到的?棕j和e,依次通过(2)和(4),分别得到新的Yj和Z;
步骤4再回到步骤1,指导计算收敛为止,则最终得到的?棕j和e作为权重,最终得到的和作为一阶因子Yj和Z二阶因子得分。
三、 PLS-SLVM的研究结论
1. PLS放宽了对数据分布的要求。综合变量构建中的估计方法有最大似然(ML)估计法和偏最小二乘(PLS)估计法两种方式。最大似然法固然可以估计出权重和系数,但是要求数据服从对称的联合正态分布。但在实际研究中,数据多为不对称的偏态分布。因此该方法科学性的基础受到限制。偏最小二乘估计算法(PLS)通过内外部关系调整、迭代,计算得到潜变量的值,对数据没有联合正态分布的要求,因此更适于企业管理和绩效评价的实证研究。偏最小二乘(PLS)估计不要求数据服从正态分布,可以采用Bootstrap方法构造置信区间,计算均值、标准差、置信上限和置信上限,构造95%置信区间检验各个参数的合理性(显著性)。为验证大样本情况下满意度指数PLS估计的稳健性与可行性,采用Bootstrap法进行五组模拟实验:根据满意度指数模型生成样本量为100 000的模拟数据,分别利用Bootstrap法抽取样本量为5 000、10 000、20 000、30 000和50 000的随机子样本,每组模拟重复500次抽样。将每组模拟数据的模型估计结果平均值、全数据(100 000条)一次估计和模拟数据参数真值进行比较,研究发现Bootstrap法随机估计的方法优于全数据的一次性估计。
2. 兼顾变量相关性,突出结构状态。简单线性相加有两种赋权方式:一种是默认权重为1,假定不同可测变量与潜变量间、潜变量与潜变量间的关系相同;另一种是主观赋权,采用专家打分等方法对权重赋值。无论采用哪种赋权方式,可测变量与潜变量间、潜变量与潜变量间的权重均没有从真实数据出发,没有考虑变量间的相关性。而且,这两个赋权过程是相互独立的,彼此互不影响。
PLS-SLVM对路径系数和载荷系数的估计不是两个相互独立的过程。在全盘考虑条目间关系的基础上,通过不断的内部调整,更新内生权重,通过不断的外部调整,更新外生权重,反复迭代,最终估计出路径系数和载荷系数。不同可测变量与潜变量、不同潜变量间数量关系的明确量化突出了综合变量的结构形态。
3. 减少因子得分趋同的可能性。因子得分可以表现不同研究对象在某个方面的表现,如果不同研究对象的某个因子得分相同,则说明研究对象在该方面的表现没有区别。但是,也可能是方法本身造成因子得分的过度趋同。若二阶因子宗气指数得分过于趋同,则会影响综合变量对结果的判断和评价;若一阶因子得分过于趋同,则不利于综合变量排名的影响因素的探索,无法研究综合变量得分相同的各一阶因子的得分及构成特点,更不利于研究综合变量得分不同的各一阶因子的得分及构成特点。
事实上,综合变量构建方法本身也会对因子得分产生影响,选择二阶因子模型可以更好的区分不同研究对象的各阶因子的水平。这是因为,二阶因子模型计算因子得分的过程中要通过外部调整和内部调整,利用可测变量与一阶因子间的权重(载荷系数)、一阶因子与二阶因子间的权重(路径系数)不断调整外部估计和内部估计,迭代所得。而简单线性相加则是对可测变量进行权重为1的一次性加和,如果每个可测变量均采用量表打分的方式,取值范围均为{1,2,3,4,5},更易出现因子得分趋同的结果。此外,二阶因子模型中各个权重系数之间的差异也是增加因子得分区分度的因素之一。
4. 提高综合变量分类准确性。综合变量构建方法的好坏,直接影响综合变量对不同结局的识别能力和分类效果。为了进一步探讨简单线性相加方法和PLS-SLVM在这些方面的表现,本文借助受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC),计算AUC和判对率,评价综合变量的区分度和分类准确性。
因子得分作为重要的估计结果之一,是绘制ROC曲线的基础。因子得分的研究,并不止于比较绝对数值的大小,而在于对相对信息的分析和探索,关注不同研究对象的相对位置,因此,对因子得分取秩是获得相对信息的途径之一。无论是对因子得分本身还是取秩后进行研究,PLS-SLVM都为综合变量分类准确性的提高提供了可能。研究表明,PLS-SLVM提高了综合变量的判对率,增加了分类准确性。
四、 结论
综合变量构建方法的好坏,关键在于多指标结合为综合指标的统计方式的选择。一种好的统计方式应该放宽独立性假定,突破主观赋权的人为干预,考虑真实数据的结构特征。SLVM设定了可测变量与潜变量间、潜变量间的结构关系。PLS算法不要求可测变量间相互独立,完成了载荷系数、路径系数及因子得分的估计。SLVM与PLS的结合,改进了简单线性相加在强独立性假定和主观赋权方面的不足。
研究表明,PLS-SLVM作为一种综合变量的构建方法,不仅在构建过程中兼顾变量间的相关关系和结构形态,而且提升了综合变量的分类准确性,可以用来判断或预测不同研究对象的所属类别。
此外,偏最小二乘—二阶因子模型作为一种非参数的估计方法,没有分布假定,不必计算结构模型中的所有关系。因此,当样本量较少时,不会出现无法识别的问题,而且会得到相对较高的统计功效。随着样本量的增加,偏最小二乘—二阶因子模型的估计精度越高。当存在缺失数据时,该算法在一定程度上具有较高的稳健性。偏最小二乘—二阶因子模型可以适用于度量数据、二分类数据等数据类型,但是在测度分类内生变量时,存在一定的局限性。无论模型是否复杂,因子(潜变量)是通过单个还是多个可测变量进行测度,因子与可测变量间关系是形成型还是反映型,偏最小二乘算法都较为适用。而且,随着可测变量个数的增加,该算法的估计有偏性会降低。此外,与极大似然估计方法相比,尽管偏最小二乘估计算法没有全局拟合优度评价指标,但是却可以得到因子得分。当样本量足够大时,可以借助Boostrap方法构造置信区间,计算均值、标准差、置信上限和置信上限,构造95%置信区间检验各个参数的合理性(显著性)。
但是,并不是所有的综合变量构建问题都可以用PLS-SLVM来解决。当一阶因子间存在中高度关联性,一阶因子测度的是同一个问题的同一个水平,二阶因子能够反映并解释一阶因子所受到的共同影响时,才考虑采用SLVM。尤其在样本量较小、待估参数较多的情况下,PLS-SLVM可以保证模型的可识别性和模型的简化。
参考文献:
[1] 侯杰泰,温忠麟,成子娟.结构方程模型及其应用[M].北京:教育科学出版社,2004.
[2] 高文杰,高旭.基于SEM的我国重要城市现代化水平综合评价模型研究[J].数学的实践与认识,2010,(18).
[3] 罗玉波,王玉翠.结构方程模型在竞争力评价中的应用综述.技术经济与管理研究,2013,(3).
[4] 孙继红,杨晓江,缪榕楠.我国高等教育发展统计特征的PLS通径模型分析.数理统计与管理,2010,(2).
[5] 王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
基金项目:2012年中医药行业科研专项(项目号:2012468005)。
作者简介:易丹辉(1948—),女,汉族,湖南省汨罗市人,中国人民大学统计学院教授、博士生导师,研究方向为风险管理与保险、预测与决策;程豪(1989—),男,汉族,山西省长治市人,中国人民大学统计学院博士生,研究方向为结构方程模型、社会网络、数据挖掘。
最小二乘法模型 篇5
电力是经济发展的晴雨表,全国用电消费增速从根本上取决于未来经济增长。电力消费已经比过去农村经济落后时期增加了很多,目前农村的电力消费增长每年维持在6%左右。某个地区或全国电力年用电量决定了电力系统的发展规模和速度,农村用电系统的计划、控制和运行显得尤为重要, 当下,提高农村电力系统的预测精度,既可以保障弄错电力系统的安全运行,又可以改善农村电力系统的经济性,所以合理准确的进行农村用电系统的预测具有很大的现实意义。
当前文献研究表明国内目前对于农村用电量的预测方法很多,譬如常用的时间序列法、多元线性回归法以及神经网络法等,众所周知,灰色预测模型所需要的数据量比较少, 预测比较准确,精度较高。样本分布不需要有规律性,计算简便,检验方便等优点。所以在预测领域得到了广泛的推广和应用,而另一方面仅仅采用原始GM(1,1)模型对于预测的精度已经不能满足事物的发展要求,所以本文尝试对原始GM(1,1)模型进行改进。首先可以运用最小二乘法将初始数据进行模拟,如果波动较大,可以弱化当前数据的随机性,以便强化其规律性,接下来再对弱化后的数据运用灰色理论建立模型,本文最后通过验证改进模型的精度和可靠性, 最后再预测我国未来农村的用电量。
2 GM(1,1)预测模型
灰色预测模型是通过少量的、不完全的信息,建立灰色微分方程的一种预测模型,对事物的发展做出模糊性的长期描述,通过GM(1,1)灰色模型,先将我国农村1999—2008年的年用电量数据进行累加生成算子,削弱数据的随机性, 得出相对有规律的生成数,然后建立微分方程,进而建立模型,预测未来几年我国农村地区年用电量走势[4]。
农村用电量的历史数据组成数列为:
上式中,x(0)(i) >0,i=1,2,…,n,x( 0 )的一次累加生成算子序列为:
上式中,的紧邻均值生成序列为:
称为一阶线性微分方程:
为灰色微分方程,即灰色GM(1,1)模型:
的白化方程,取式(1)的解
上式中,构造累加矩阵B与常数项向量Y为:
还原到原始数据,可得G M(1 , 1 ) 的动态预测模型为:
灰色系统模型的检验方法有三种:残差合格(相对误差)、关联合格、后验差合格(均方差比合格、小误差概率合格),通常情况下应用最广泛的是后验差检验。所以本文亦采用后验差检验[5]。
本文记S1为原始数据的标准差,S2为绝对误差数据标准差,方差C=S1/S2,后验差比值C越小越好,小误差概率为残差与残差平均值之差小于定值0.6745S1的频率:
上式中,小误差P越大越好,参考的标准如表(1)所列:
3改进后的GM(1,1)模型
设原始数据序列:
上式中, x(0)(i)>0,i=1,2,…,n,
第一步对给定原始数据计算级比
检验级比η(0)(k) 是否落于可容覆盖中,当级比均落在可容覆盖中,则该序列可作为GM(1,1)建模数据且能进行数据灰色预测[6]。对于级比检验不合格的序列,必须做数据的预处理,使其变换后的序列级比落于可容覆盖中。数据预处理有如下方法:对数处理、方根处理、平移处理、累加处理。文中采用累加处理。
第二步累加生成
将原始的数据进行1次累加,以弱化数据的随机性强化规律性,可得新序列为:
第三步运用最小二乘法拟合序列x( 1 )
将x(1)x(1)(1), x(1)(2),..., x(1)(n)采用最小二乘法拟合
x( 1 )的图像采用MATLAB画出,根据数据走势的分析结果,本文调用MATLAB的工具箱函数polyfit弱化后的序列进行二次多项式拟合。则可以得到序列x( 1 )的二次多项式函数s( x)
代入x的值, 可得出相应的一次导致值s' ( x), 令
第四步改进后的a, u求值
利用最小二乘法估计a, u值为:
其中:
第五步改进后的白化模型GM(1,1)
将改进后的a, u以及改进后的初值x'(0)(1) 代入公式得改进后的G M( 1 , 1 )模型:
第六步精度检验
采用后验差法来检验模型的预测精度。
4农村用电量预测
本文以1999—2008年我国农村用电量为数据样本,数据来源国家统计局官网,如表2所示:
由表2得原始数列:
第一步原始数据计算级比:
第二步通过计算可得:原始数据级比范围是(0.8809, 0.9643),而可容覆盖(0.8461,1.1817),可以得出原始数据的级比均在可容覆盖区间之内,故原始数据不需要进行预处理。
第三步最小二乘法拟合序列:
对上述数据采用最小二乘法拟合,用Matlab自带的箱函数polyfit对已知上述序列进行二次多项式拟合。可以得出序列x(0)(k) 表示如图所示:
其中,拟合用来拟合的二次多项式为:
第四步对s( x)求导得:
代入x的值得导数值如表(3)所示
则二次多项式的z(1)(t)为:
根据公式(8)可以得出定参数a, u的值。其中二次多项式的B为:
第五步确定改进后的G M( 1 , 1 )模型,将a, u代入公式(9) 可得:
第六步求预测值及其残差
小误差检验法精度检验。经检验小误差概率大于0.8,则改进后的模型可进行预测。利用改进后的模型对2008年我国农村年用电量预测结果为8456亿千万小时,而利用普通模型进行预测的结果为8331亿千瓦时,实际2008年我国社会消费品零售总额为8549亿千万时,很明显可以看出,改进后模型预测的结果更加接近实际值。
5结论
综上, 本文采用改进后的GM(1,1) 模型可以预测2015—2017我国农村用电量9251(亿千瓦小时)、9648(亿千瓦小时)、9836(亿千瓦小时),可以看出我国农村用电量呈现逐年上升的趋势。我国农村用电量虽然受农村经济和环境以及留守人口等各方面的影响,但是从该模型的预测结果来看, 具有较高的可信度。电力保障部门依据本文的预测结果可以制定出相应的农村用电调控系统,保障用电系统的平稳运行,为农村经济的发展带来更好的发展条件。
参考文献
[1]邓聚龙,灰色系统理论教程[M].武汉:武汉科技大学出版社,1990:189-225.
[2]王文圣,丁晶,赵玉龙,张晓明.基于偏最小二乘回归的年用电量预测研究[J].中国电机工程学报,2003,10:17-21.
[3]王允平,黄殿勋,熊浩清,牛元立.智能电网环境下采用关联分析和多变量灰色模型的用电量预测[J].电力系统保护与控制,2012,01:96-100.
[4]王成山,杨军,张崇见.灰色系统理论在城市年用电量预测中的应用——不同预测方法的分析比较[J].电网技术,1999,02:17-20.
[5]卓元志,刘家军,王明军,张小庆,刘益瑾.基于熵值法的组合模型用电量预测方法研究[J].电网与清洁能源,2011,05:47-50+54.
最小二乘法模型 篇6
心理契约是社会交换理论的一个基本概念, 源于组织行为学研究, 它是指以许诺为基础的义务或责任观 (Roussedu, 1989) 。现有心理契约研究在企业与顾客的营销情境中同样存在, 可相关的研究非常少, 只有学者提出心理契约在营销情境中的概念。本文将心理契约应用到电网企业客户的研究当中, 通过设计测度量表及模型计算达到检验心理契约在营销情景中存在并为电网企业客户满意度研究提出建议的目的。
二、基本概念
(一) 心理契约概念
学术界普遍认为是Argyris (1960) 最早引入了心理契约概念, 他用“心理工作契约”术语来描述雇员与工头之间的关系。
Schein (1965) 推广了心理契约这一概念的使用, 她认为, “心理契约理念意味着个人对组织具有许多期望, 同时组织对个人也有许多期望……这些期望虽然没有写入雇主与组织之间的任何正式协议, 但它们却是行为的有力决定因素”。
Kotter (1973) 将心理契约定义为“个人与其组织之间的一种隐含契约, 它界定了各方期望从关系中相互所给予和所接受的东西。”
心理契约概念发展在Rousseau (1989) 的著作中达到了顶峰, 她将心理契约定义为个人与其他方之间互惠交换协议的条款或条件的信念。Roussesu (1990) 进一步将心理契约界定为雇员对相互义务的感知, 认为心理契约概念主要关注的是雇员对相互义务的个人主观感知, 其观点成为此后其他学者的研究基石。
(二) 心理契约的维度
Rousseau (1990) 认为, 在总体层次上, 可以把心理契约分为交易心理契约与关系心理契约两大类, 她通过对224位就业的MBA毕业生的研究, 得到了对心理契约一维度区分的实证支持。
一般来说, 心理契约可能同时包括交易要素和关系要素, 不同心理契约之间的差异主要在于两种成分所占比例的不同。
三、电网企业客户心理契约
电网企业客户心理契约主要从两方面体现客户与企业的关系:一是指指顾客对电网企业所许诺的义务或责任的感知或信念;二是这种许诺和保证不只是停留。
电网企业客户心里契约的影响因素包括以下方面:
电网企业客户心里契约的影响因素包括对于企业和客户之间对于供电质量和服务方面没有日头或书面约定的项目。可归纳为三个方面:供电质量和服务质量;电网企业履行承诺的情况;出现特殊情况时对客户利益的关注和对客户的重视与尊重。
供电质量和服务质量是指电网企业能否尽可能的提供给客户更好的供电服务, 而不是只提供合同约定供电服务。
电网企业履行承诺的情况是指能否提供约定的服务, 在违反约定的情况下能否主动承担给客户带来的损失, 而不是根据合同约定尽可能的减小赔偿。
出现特殊情况时对客户利益的关注是指在出现特殊情况时如突然负荷升高或自然灾害等, 能否首先考虑客户的利益。
对客户的重视与尊重是指和客户保持的长期关系时对客户的态度。
四、心理契约与满意度关系模型及问卷设计
本文在参考ACSI满意度指数模型与Rousseau提出的二维度心里契约的基础上, 根据电网企业客户的心理契约内涵及影响因素的描述, 建立了测评电网企业客户心理契约与满意度的潜在变量, 并得到了具有因果关系的概念模型及将模型中的显变量转化为问卷。
(一) 心理契约与满意度指数模型
本文潜变量的选取主要分为两个方面:心里契约和满意度。其中, 心理契约包括交易心理契约 (TPC) 和关系心理契约 (RPC) 两个隐变量;满意度值选择满意度指数一个潜变量便可通过显变量进行观测。隐变量之间的因果关系假设为:交易心理契约和关系心理契约与满意度具有因果关系, 并且为正相关;交易心理契约与关系心里契约的因果关系不确定但同样为正相关。在模型的设计中设置了12显变量, 交易心理契约有3个显变量, 关系心理契约有5个显变量, 满意度有4个显变量, 得到的具体概念模型如图1所示。
(二) 心理契约与满意度关系问卷设计
针对电网企业客户的具体情况, 从交易心理契约与关系心理契约两个方面进行量表设计, 共包括8个问项, 其中, 前3个问项 (TPC1-TPC6) 是测度消费者交易心理契约维度, 后5个问项 (RPC1-RPC6) 是测度消费者的关系心理契约维度。研究采用1-7级Likert量表, 1表示完全不同意, 7表示完全同意。
满意度的设计思路是参考ACSI满意度指数模型并根据电力企业客户的实际情况及概念模型的需要进行调整, 共包括4个问题, 同样采用7级量表。具体问卷及与隐变量的关系如表1所示。
五、实例分析
(一) 数据处理与分析
本次实证研究是在重庆市电力公司2009年客户满意度测评项目的基础上进行的, 在项目的调查过程中, 在问卷中加入了心理契约的相关问题。对于本文模型的估计, 采用Chin开发的PLS路径分析的PLS-Graph3。0软件对数据进行分析, 研究的目的是验证心理契约与满意度指数模型的有效性, 并得到模型中个潜变量之间及潜变量与显变量的相关系数。
1、数据收集与样本特征
本次调查调查采用拦截访问和入户面访相结合的方式进行, 调查工作从2009年11月15日开始至2010年1月5日结束, 共完成有效样本2448 (拦截1200、面访1248) 。覆盖所属重庆电力公司的12个供电公司的大工业及重要客户、普通工业客户、商业客户、居民和农业客户。
2、信度分析
通过应用SPSS软件对12个度量项目进行数据的信度检验, 得到克朗巴哈α信度系数0.952, 说明问卷是完全可信的。
(二) 基于PLS的模型估计
本文使用PLS-Graph30软件运行PLS方法对模型进行检验, 主要生成个变量间的路径系数, 路径系数结果图2所示。
输出结果显示对角线上交易心理契约、关系心理契约和满意度的AVE值平方根都大于对角线左下角任意二者之间的相关系数, 这说明模型是可信的。即心理契约会影响到满意度。
各变量间相关系数如表2所示。从表2中可以看出关系心里契约和交易心里契约都会对满意度产生影响, 其中关系心里契约的影响远高于交易心理契约对满意度的影响, 因此电网企业要想特高客户满意度应该特别重视关系心里契约, 即与客户保持长期的利益关系。
六、结论
通过以上的模型估计, 可以证明心理契约与满意度指数模型是可信的, 从而可以说明, 心理契约理论在电网企业客户营销中同样存在并且适用。关系心理契约与交易心里契约对满意度都是有影响的, 但关系心理契约对满意度的影响远高于交易心里契约对满意度的影响, 可知电网企业客户更加看重与企业的长期关系, 这也符合电网企业客户为企业的长期客户的客观事实。因此, 电网企业在提高客户满意度方面应该重视与客户的长期关系的培养与保持。
摘要:文章将组织行为学中心里契约的理论应用于电网企业的营销中, 界定了概念的相应内涵, 开发设计了相应的测度量表;然后借鉴ACSI满意度指数模型构建电网企业客户心理契约与满意度指数模型, 并运用偏最小二乘 (PLS) 对测评模型进行检验和参数求解;最后根据测评结果得出模型是可信的, 关系心理契约与交易心里契约对满意度都是有影响的, 但关系心理契约对满意度的影响远高于交易心里契约对满意度的影响。
关键词:心理契约,顾客满意度,PLS路径分析,结构方程
参考文献
[1]、Argyris C..Understanding Organizational Behavior[M].Illinois:Dorsey press, 1960.
[2]、Schein E.H..Organizational Psychology[M].Prentice-Hall, 1965.
[3]、KoLLer J.P..The Psychological Contract:Managing the Joining up Process[J].California Management Review, 1973 (3) .
[4]、Llewellyn N..The Role of Psychological Contracts Within Internal Service Networks[J].The Service Industries Journal, 2001 (1) .
[5]、罗海成.营销情境中的心理契约及其测量[J].商业经济与管理, 2005 (16) .
[6]、刘宇.顾客满意度测评[M].社会科学文献出版社, 2003.
最小二乘法模型 篇7
非煤矿产资源开发和利用, 一方面使得社会财富快速递增, 促进了经济发展[1]。另一方面乱采滥挖给国有矿山的安全生产造成了巨大威胁, 导致大量矿山灾害 (隐患) 积聚、开采环境恶化, 严重的矿山灾害性事故呈急剧上升趋势, 而且各类可导致矿山灾害事故的潜在隐患也明显增多, 已严重影响我国非煤矿山的安全生产。我国非煤矿山特别是数目众多的小矿山, 安全生产条件差, 每年因事故死亡人数为世界上较高的几个国家之一, 矿石百万吨死亡率是美国、南非、澳洲等矿产发达国家的30倍以上[2]。全国非煤矿山每年安全事故死亡人数仅次于交通事故和煤矿安全事故, 在各行业中位居第三位。安全生产形势相当严峻, 已经严重危害到了人民群众的生命安全, 对生态环境造成了严重破坏, 给国家造成了巨大的经济损失, 严重制约了我国矿山企业的可持续发展, 同时造成了恶劣的社会影响[3,4]。因此对非煤矿山事故率及死亡人数的发生规律统计并预测分析及研究具有重要的意义, 对于矿山企业安全监管及专项整治具有指导性的作用。灰色预测GM (1, 1) 模型方法已被广泛成功应用于非煤矿山事故率预测中, 相关的预测模型也很多[2], 但是灰色预测GM (1, 1) 模型的预测方法本身存在的缺陷却并未得到有效的改进。本文通过分析最小二乘法GM (1, 1) 改进模型的建立过程, 对灰色预测GM (1, 1) 原始模型进行改进, 以便从根本上有效提高灰色预测模型的预测精度。
1 基于最小二乘法的灰色GM (1, 1) 的改进模型的建模机理
1.1 拟合问题的提出及其最小二乘法
设已获得一组杂乱无章的实验数据 (xi, yi) , (i=0, 1, 2, …, m) 。比如说文中所说的灰色系统的初始值, 其实都是具有一定随机性质的、想寻求其中的某些规律是非常困难的, 很难找出精确的表达式来表现出它的规律。那么如果希望从中找出规律来, 也只能构造一个近似的函数S (x) 去逼近函数y=f (x) , yi=f (xi) , i=0, 1, 2, …n[5]。
f (x) 的最小二乘法解为:
1.2 最小二乘法拟合多项式及其求导
最小二乘法矩阵形式的法方程如下:
利用法方程求得多项式的系数a0, a1, …, an, 可以得到函数f (x) 的拟合的多项式函数S (x) 。
其中取φ1 (x) , φ2 (x) , …, φn (x) 分别为1, x, …, xn。
所以S (x) 也可以表示为:
将 (1.4) 式求一阶导数可得导函数为:
1.3 最小二乘法拟合多项式在灰色GM (1, 1) 模型中的应用
灰色GM (1, 1) 模型的白化微分方程为[6]:
笔者认为在求取GM (1, 1) 模型的参数α、b时有几个因素对其结果有所影响:
第一:数据的预处理, 在数据预处理中有三种方法, 其一:层次变换包括累加生成和累减生成。其二:数值变换包括初值化, 均值化及区间值化。其三:极限变换灰生成包括上限效果、下限效果及适中效果。数据的预处理不当可能导致较大的误差。
第二:计算白化微分方程时, 初值的选取也会对最终结果造成一定的影响, 我们一般选取初值为x (0) (1) 。
第三:白化微分方程的近似方法。
由于灰色系统的特点为数据少, 含有大量未知信息, 所以对于近似方法的选取更是具有很大困难。
笔者由于选取对数据进行累加的预处理形式, 所以拟合曲线可以呈单调递增的态势, 所以可以选取多项式进行最小二乘拟合。
1.4 最小二乘法在灰色系统GM (1, 1) 模型改进中的优势
目前应用较多的方法为求出x (1) 的紧邻生成序列在根据公式求解。但是缺乏形象性和前期说服力, 预测结果为事后预测进行考量预测的精度。但在预测中可以选择另一种思路来解决此问题, 笔者选择先对已知数据进行数据拟合选取适当的函数曲线来拟合已知数据, 这样得到了已知数据的曲线方程, 再对得到的曲线方程进行求导这样也可以形象的看出选取的拟合曲线的可行性。相比原始的GM (1, 1) 模型可以直观的进行事前预测, 并且还可以提供相关的数据支撑。
2 灰色系统GM (1, 1) 模型的建立及最小二乘法在模型改进中的应用
2.1 灰色GM (1, 1) 模型的建立步骤
设原始数据x (0) ={x (0) (1) , x (0) (2) , …, x (0) (n) }
其中x (0) (i) >0, i=1, 2, …, n。
第一步:对给定原始数据计算级比
为原始数据x (0) 的级比。检验级比σ (0) (k) 是否落于可容覆盖中, 当级比均落在可容覆盖中, 则该序列可作为GM (1, 1) 建模数据且能进行数据灰色预测。对于级比检验不合格的序列, 必须做数据的预处理, 使其变换后的序列级比落于可容覆盖中。
数据预处理有如下方法:对数处理, 方根处理, 平移处理, 1-AGO累加处理。文中采用1-AGO累加处理。
第二步:对x (0) 做1-AGO (累加处理)
同时必须说明一下, 根据定理可知:为了获取合理解, 作GM (1, 1) 建模的序列x (0) 要求至少要获取四个数据。
第三步:求x (1) 的紧邻生成序列z (1)
第四步:建立GM (1, 1) 白化模型并求出参数α、b
其中:
通过求出参数α、b的值。
第五步:求GM (1, 1) 模型的白化时间响应函数
其中为预测值累加的生成值, x (0) (k) 为真实值, 为预测值。
第六步:求出预测值累加生成值
第七步:求出预测值
其中k=1, 2, …, n。
第八步:精度检验
GM (1, 1) 模型的精度检验, 通常采用后验差检验法, 来检验预测模型的可行性[7]。
第九步:预测结果及分析
2.2 最小二乘法在灰色系统GM (1, 1) 模型改进中的应用
灰色系统GM (1, 1) 改进模型的建立步骤如下:
设原始数据x (0) ={x (0) (1) , x (0) (2) , …, x (0) (n) }
其中x (0) (i) >0, i=1, 2, …, n。
第一步:对给定原始数据计算级比σ (0) (k)
第二步:对x (0) 做1-AGO
对于原始数据x (0) 进行一次累加1-AGO得
其中k=2, 3, …, n。
第三步:最小二乘乘法拟合序列x (1)
对x (1) ={x (1) (1) , x (1) (2) , …, x (1) (n) }进行最小二乘法拟合。
先根据序列x (1) 在MATLAB中画出图像, 然后分析图线的走势, 所以选择调用MATLAB的工具箱函数polyfit对已知序列进行多项式拟合。这样就可以得到序列x (1) 多项式函数S (x) 。
其中取φ1 (x) , φ2 (x) , …, φn (x) 分别为1, x, …, xn;
所以S (x) 也可以表示为:
第四步:将S (x) 求导并求出导数值
将 (2.13) 式求一阶导数可得导函数为:
第五步:建立GM (1, 1) 白化模型并求出参数α、b已知为改进的白化模型如下 (2.15) :
则 (2.15) 转化为:
将 (2.16) 写成矩阵的形式可得:
其中
根据
通过 (2.19) 可求出α、b的参数矩阵φn, 从而分别确定α、b, 计算公式如下 (2.20) :
第六步:求GM (1, 1) 模型的白化时间响应函数
将 (2.20) 求得的α、b带入 (2.7) 中可得GM (1, 1) 模型的白化时间响应函数。
其中为预测值累加的生成值, x (0) (k) 为真实值, 为预测值。
第七步:求出预测值累加生成值
将x (0) (1) 与k值依次带入 (2.21) 式, 求得序列 (2.22)
第八步:求出预测值
根据式 (2.23) 还原出预测值
其中k=1, 2, …, n。
第九步:精度检验
采用后验差检验法, 来检验预测模型的可行性。
3 应用
针对2002-2007年我国非煤矿山伤亡事故统计情况 (表1) , 运用灰色理论对2008-2010年我国非煤矿山安全事故死亡率进行预测, 同时与已有文献的预测方法进行比较[8], 说明改进GM (1, 1) 模型的可行性。
由表1可得原始数据列x (0) 。x (0) ={1.634, 2.283, 2.248, 1.928, 1.869, 1.861}
x (0) ={1.643, 2.283, 2.248, 1.928, 1.869, 1.861} (3.1)
第一步:计算原始数据的级比σ (0) (k)
通过表2可以显然发现x (0) (2) 的级比σ (0) (2) 不在可容覆盖区间内, 则必须对原始数据进行数据的预处理。
第二步:数据预处理即对x (0) 做1-AGO
对于原始数据x (0) 进行一次累加1-AGO得:
第三步:最小二乘法拟合序列x (1)
x (1) ={1.634, 3.917, 6.165, 8.093, 9.962, 11.823}进行最小二乘法拟合, 调用MATLAB中的工具箱函数polyfit对已知序列进行多项式拟合。根据图线观察选择分别用二次多项式与三次多项式进行拟合。使用MATLAB编写程序将已知序列x (1) 表示如图1、图2。
可以分别得到拟合的多项式函数S (2) (x) , S (3) (x) 。
式 (3.5) 、 (3.6) 分别为用最小二乘法拟合的二次、三次多项式。
第四步:将S (2) (x) , S (3) (x) 求导并求出导数值即
对于二次多项式函数S (2) (x) :
对于三次多项式函数S (3) (x) :
导数值见表3。
第五步:建立GM (1, 1) 白化模型并求出参数α、b
次多项式的y (1) (t) 为:
三次多项式的y (1) (t) 为:
其中二次多项式与三次多项式的B为 (3.13) 。
第六步:确定GM (1, 1) 模型的白化时间响应函数将 (3.14) (3.15) 求得的α、b分别带入 (2.21) 中可得GM (1, 1) 模型的白化时间响应函数。
二次多项式的白化模型时间响应函数为:
三次多项式的白化模型时间响应函数为:
第七步:计算出预测值累加生成值及预测值
二次多项式、三次多项式的原始数据、预测值累加生成值及预测值集中表示如表4。
第八步:后验差检验法精度检验
见表5-表7。
4 模型及其预测结果评价
4.1 模型评价
笔者通过基于最小二乘法拟合建立起来的GM (1, 1) 改进模型并与原始的GM (1, 1) 模型进行了数据上的比较, 详见表5、6与表7。通过计算分析得出二次多项式拟合可以达到好的预测等级, 但三次多项式拟合由于方差比值过高为不合格的预测模型, 而原始数据的预测等级可以达到较好的层次, 说明改进后的模型当采用二次多项式拟合进行改进时, 模型的精度对于原始方法有所提高。
4.2 预测结果评析
笔者最终采用基于二次多项式拟合GM (1, 1) 改进模型对2008-2010年的我国非煤矿山伤亡事故进行预测性计算。
二次多项式的白化模型时间响应函数为:
具体预测计算过程及结果详见表8。
其中为改进模型对2008-2010年我国非煤矿山伤亡事故千人死亡率的预测值, x* (0) (k) 为查阅安全生产年鉴、国家安全生产监督管理总局网站综合整理得到的非煤矿山伤亡事故千人死亡率的实际值。
模型的预测结果与实际数据直观对比图如图3。
经比较可以直观的在图3上看出该预测结果与实际结果非常接近, 经计算误差可达到1.2×10-3, 因此该改进模型是可行的。
5 小结
笔者根据灰色理论及其相关理论, 通过对GM (1, 1) 模型中微分方程使用最小二乘法多项式拟合来求解, 提出一种改进GM (1, 1) 模型。将改进模型的预测精度与原始模型进行了比较, 得出采用二次多项式拟合的改进模型预测精度高于原始模型, 因此采用二次多项式拟合GM (1, 1) 改进模型。并将该改进模型用于我国非煤矿山事故预测中, 对2008-2010年我国非煤矿山伤亡事故死亡率进行预测性计算并且与真实数据进行了比对, 验证了模型的可行性。此外对我国非煤矿山事故发生趋势做出统计学的判断, 为相关部门制定宏观管理目标提供了定量、科学的依据。
摘要:根据灰色理论及其相关理论, 通过对GM (1, 1) 模型中微分方程使用最小二乘法多项式拟合来求解, 提出一种改进GM (1, 1) 模型。将改进模型的预测精度与原始模型进行了比较得出采用二次多项式拟合的改进模型预测精度高于原始模型, 因此采用二次多项式拟合GM (1, 1) 改进模型。并将该改进模型用于我国非煤矿山事故预测中, 对2008-2010年我国非煤矿山伤亡事故死亡率进行预测性计算并且与真实数据进行了比对, 进一步验证了模型的可行性。
关键词:最小二乘法,GM (1, 1) 模型,改进模型,事故预测
参考文献
[1]王启明, 鲍爱华.我国非煤矿山安全生产现状与技术发展[J].采矿技术, 2005, (2) :11-12WANG Qi-ming, BAO Ai-hua.Production of non-coal mine safety situation and technological development[J].Mining technology, 2005, (2) :11-12
[2]李仲学, 李全明, 等.国外非煤矿山安全生产标准研究[J].中国安全生产科学与技术, 2008, (4) :117-121LI Zhong-xue, LI Quan-ming, et al.The safety precuction standard study of the non-coal mines abroad[J].China Safety Science Journal, 2008, (4) :117-121
[3]关治, 陆金甫.数值分析基础[M].北京:高等教育出版社, 1998
[4]李庆扬, 王能超, 易大义.数值分析[M].3版.武汉:华中科技大学出版社, 2002
[5]李庆扬, 易大义, 王能超.现代数值分析[M].2版.高等教育出版社, 1995
[6]邓聚龙.灰色预测与决策[M].武汉:华中科技大学出版社, 1998
[7]刘思峰, 谢乃明.灰色系统理论及其应用[M].北京:科学出版社, 2008
[8]朱婵, 陆愈实, 龚欢, 等.灰色系统理论在非煤矿山事故预测中的应用[J].安全与环境工程, 2009, (6) :81-84ZHU Chan, LU Yu-shi, GONG Huan, et al.The gray system theory application in the non-coal mine’s prediction of accidents[J].Safety and Evironmental Engineering, 2009, (6) :81-84
基于最小二乘法离场航迹构造方法 篇8
飞机离场航迹是飞机起飞过程的形象化体现。目前,飞行航迹的构造方法通常采用两类方式,第一类是在飞行计划确定及气象资料完整的情况下,结合飞行动力学和运动学模型正向推导的方法。飞机起飞航迹计算方法研究提出了对不同机型统一的离场航迹构造方法,该方法主要针对离场航迹剖面进行了构造,缺少对水平投影面构造的方法;基于ANP数据库的飞机起飞仿真研究是基于详细的飞行资料和性能参数的前提下,提出了飞机离场剖面航迹构造方法;离场航迹降噪优化设计的多目标智能方法是一种利用航段飞行特征约束求解离场航迹的方法。第二类是在拥有较为准确的雷达位置信息点的情况下对雷达数据去噪,拟合出最佳函数匹配从而得到平滑的航迹。经纬仪目标交汇测量及航迹曲线拟合文中提出根据不同时刻的坐标,用最小二乘法对目标航迹进行拟合,从而推测下一时刻的位置速度及加速度;三维航迹的B样条曲线拟合算法利用B样条曲线的几何性质,解决了飞行器三维航迹拟合中的边界条件等约束问题。第二类多用于飞机离场结束后航迹的拟合。上述提出的两类方法用于离场航迹的构造存在以下三种问题:一是由于飞机离场属于低空飞行,雷达捕捉飞行器在低空飞行的位置信息不准确,飞机离场的雷达点相比于真实点误差较大,且飞机离场的方式不同,导致无法单一的利用拟合离场雷达数据的方法确定离场航迹。二是现有方法多为对离场剖面航迹进行构造,忽略由于离场方式的不同导致水平面航迹存在误差。三是在离场数据、飞行计划及气象资料缺失的情况下,无法对飞机离场航迹进行构造的问题。由此本文为了解决上述问题,采用最小二乘法结合两种离场方式特征,提出离场航迹逆向构造方法。
相关工作
飞机离场过程是指飞机高于起飞表面450m(1500ft),并完成从起飞到航路形态的转变,达到规定的速度和爬升梯度。飞机起飞过程包括起飞场道滑跑阶段和起飞航道阶段。起飞航迹依据飞机的构型、发动机的推力状态、对爬升梯度的要求等分为第一爬升阶段、第二爬升阶段、第三平飞阶段、最后爬升阶段等四个阶段。本文忽略平飞过程,把此过程与第四阶段融合在一起下文统称第三阶段,分别对第一、二及三阶段分别进行构造。
最小二乘法是通过最小化误差的平方和求得待定系数从而寻找数据的最佳函数匹配。假设多项式:
由最小二乘法确定待定系数a0,a1,(43)am,设数据点权为1,令
得方程组:
该方程组称为多项式拟合的法方程,令:
基于最小二乘法飞机离场航迹逆向构造方法
飞行高度在350m以上的雷达监测位置信息点较为准确,本文把航迹投影到水平面和剖面分别构造,并利用准确数据逆推离场航迹。首先根据两种离场方式特征判别离场方式,其次利用350m以上的雷达监测位置信息点分别拟合两种离场方式的第三阶段航迹水平面投影,最后计算各阶段关键参数确定滑跑航迹及运动过程。不得不提在离场数据、飞行计划、气象资料缺失前提下。起飞过程模拟难度很大,为了确保模拟的航迹准确性,不可避免需要根据飞机的离场规则,假设合理数值。
P0(x0,y0,z0)点为已知飞机在跑道滑跑的加速始点,此点的各方向速度均为V0=0,P1(x1,y1,z1)点为飞机的离地点,其中z1已知为地平面高度,P2(x2,y2,z2)为直线离场时高度为时的坐标点,转弯离场时为转弯点,P3(x3,y3,z3)为已知雷达数据第一个点。
基于贝叶斯推理的飞机离场方式估计方法
直线离场方式特征:特征一,起始离场航线与跑道中线方向角度相差小于15°;特征二,离场航迹偏于跑道中线一侧而在DER(离场末端)的横向距离不大于300m。但只要实际可能,离场航线就应与跑道中线延长线一致。转弯离场方式特征:离场过程中出现离场角度要求大于15°的转弯,并且规定在飞机起飞离场到达DER标高之上才允许转弯,在此之前为直线飞行。
由于已知雷达数据的高度值不同分为以下两种情况,利用不同的离场特征分别作为判别离场方式的依据。
(1)现有雷达数据高度值在450m以上,飞机可能已经结束离场并立即发生转弯,由雷达数据得到的航线与跑道中线的夹角大于15°不能说明转弯发生在离场过程中,因此不能用特征一判断,利用特征二更加适合。利用特征二区分时,计算雷达数据第一个点与跑道直线的水平距离如果小于300m则为直线,否则为转弯。
(2)现有雷达数据高度值在450m以下,飞机还未结束离场,利用特征一就可以判断。已知离场结束后航迹的雷达数据,前几个点组成的航迹是顺沿离场航迹的方向产生,继承了离场方向变化趋势。利用特征一区分时,利用前四个数据点进行一次的最小二乘法拟合方程,跑道直线方程,由正切公式计算两直线夹角,则,当时为转弯离场,否则为直线离场。
爬升阶段构造方法
坐标由公式得:
公式为:
起飞场道阶段构造方法
在实际计算起飞滑跑距离时,可以将地面滑跑期间发动机的推力取平均值并视为常数,同样换算摩擦系数也取其平均值并看作常数,飞机地面滑跑距离的近似估算公式:
综上飞机离场航迹由此确定。
方法验证
本实验以首都机场为例,采用首都机场提供的2013年4、5月的飞机飞行数据及机场地理位置信息,随机抽取1000条离场航迹进行实验。首先,依据构造方法对数据进行处理拟合出离场航迹,利用拟合出的航迹计算出飞机离场滑跑距离及转弯高度,查看计算出的上述参数是否符合飞机离场规定,从而验证方法的有效性。利用基于贝叶斯推理的飞机离场方式选择评分函数计算分数,验证飞机离场方式选择方法的准确性。
为了大致了解离场航迹线的特点,利用雷达数据做出三维散点图。进而根据航迹线水平面的投影的特征对航迹线进行分类。航迹线水平面投影类型分为两类,第一类为近似顺延跑道延长线如图2(a)。第二类为偏离跑道延长线,在跑道的一侧与跑道延长线形成较大夹角如图2(b)。从对雷达数据初步分析可以看出本文对离场模型的分类假设是正确的。
图3(a)和(b)分别为直线离场实验前350m以上原始雷达数据三维曲线图和实验后效果图。图2(c)和(d)分别为转弯离场实验前350m以上原始雷达数据三维曲线图和实验后效果图。通过实验效果前后对比可以看出利用本文方法构造出的离场航迹与实际情况较为一致。
由表1可以看出转弯高度均允许转弯高度值120m以上。滑跑距离在均合理范围以内。
由统计学办法得出P(line)及P(arc)。利用飞机离场方式选择方法从直线离场航迹中筛选出符合直线起飞特征的航迹及符合转弯起飞特征的航迹,从转弯离场航迹中筛选符合直线起飞特征的航迹及符合转弯起飞特征的航迹,利用统计学办法得出P(w/line)、、P(w/arc)及。最后利用评分方法计算评分。评分结果均在85分以上表明离场方式选择方法的准确度较高。
由图1和表2可以看出本文对离场模型的分类假设是正确的,离场方式选择方法准确度较高。由图2和表1可以看出本文构造出的离场航迹与实际情况一致。由此验证了基于最小二乘法离场航迹构造方法的有效性及准确性。
结语
本文提出了一种基于最小二乘法离场航迹逆向构造方法。新方法的可行性已在多次实验中得到验证。并利用基于贝叶斯推理的飞机离场航迹选择评分函数计算评分,评分结果理想,验证了离场方式的选取方法的有效性。新方法不仅可以利用于解决在飞行计划和气象资料缺失的前提下,无法对飞机离场航迹进行构造的问题,还可以为场间雷达与空中雷达连接方案的制定提供有利参考。
最小二乘法模型 篇9
目前,我国10~35 k V系统以中性点不接地或经消弧线圈接地(称为小接地电流系统)的方式为主。中性点不接地方式的显著优点是,系统在发生单相接地故障(约占60%以上)时,可以短时继续运行。但是,此时由于电容电流的存在,就有可能引发间歇性弧光接地、铁磁谐振、中性点位移过电压等,甚至发展为事故。随着城市建设及城市电网改造,城市变电站大量采用了电力电缆送电线路,而在相对落后的农村地区,虽然农网改造已经大大地改善了当地的供电条件,但仍存在配电系统供电半径过大等问题。这些情况都会造成变电站不接地系统电容电流过大,弧光过电压时有出现,严重影响了系统和人身安全以及对用户的可靠供电。
电网电容电流的大小是决定是否装设消弧线圈以及消弧线圈调谐的依据,为了掌握电容电流增长变化情况以及正确设定消弧线圈补偿的档位,准确测量系统电容电流是非常必要的。
电容电流的测量可采用直接法和间接法。直接法由于对试验人员和配网系统均存在很多不安全的因素,现在几乎不再采用了。目前广泛采用的是分相外加电容法和变压器中性点外加电容法等间接法。但是这些测量方法都要接触到高压一次侧,且存在操作繁琐、准备工作耗时长、测量工作效率低等缺点[1]。
基于上述原因,本文介绍一种采用参数辨识原理测量电容电流的新方法。新方法采用注入信号法与递推式最小二乘法辨识相结合的方案,从PT二次侧进行采样,通过输入和输出间的数学模型,辨识计算出电网电容电流。
1 辨识算法的测量原理
1.1 注入信号法
首先,需要明确电容电流辨识的关键——信号注入法与最小二乘法辨识之间的关系。最小二乘法是一种系统辨识方法,用在这里是为了辨识电力系统的接地电容。然而,只有在一个系统模型中包括进去电力系统的接地电容,才能运用最小二乘法进行包括接地电容在内的系统参数的辨识。这里面的电力系统模型就是在信号注入法的实现方案中得到体现的。信号注入法运用到电压互感器PT,就包括了对电压互感器PT回路的电路等效与建模。运用这个电路模型作为目标系统模型,用注入信号角频率ω作为系统输入,用测量到的回路阻抗Z和相角θ作为系统输出,那么最小二乘法就能够对此系统发挥作用,有效地辨识到电压互感器PT回路的电路参数,得到接地电容,进而求得电容电流[2]。具体方案设计如图1所示。
图中WA、WB、WC分别为电压互感器(PT)三相的高压绕组,二次绕组Wa、Wb、Wc组成开口三角形;CA、CB、CC为三相导线对地电容。若在PT开口三角端注入一恒定电流i0,就会有3个大小相等、相位相同的电流i1、i2、i3从PT的高压侧流出,这3个电流将分别在PT三相的绕组电阻R、漏抗XL和导线对地电容上产生压降。根据图2所示的PT等值电路,可得:
一般地,三相PT的参数(绕组电阻R和漏抗XL)是对称的,而且三相导线对地电容CA、CB、CC也是基本相等的,因此三相电流i1、i2、i3分别在三相PT与导线对地电容中产生的压降是基本相同的,即uA=uB=uC,这时在PT开口三角端就可以测到一零序电压u0。
将式(2)代入式(1),得:
式(3)中:i0、u0为输入和输出变量;R、L和C为待辨识参数。这样,问题就转化为参数辨识问题[3]。
1.2 递推式最小二乘法
递推式最小二乘法的计算方法是这样的。一般最小二乘法计算系统参数的公式为
那么,在进行第N+1次数据观测后,有
经过推导可以将递推算法的公式总结为:
其中:Pi=(XiTXi)-1,γi+1=(1+XTi+1Pi Xi+1)-1,KN+1=γN+1PNxN+1为增益矩阵[4]。
式(3)描述了系统输入i0,系统输出u0与系统参数R,L,C的关系。但是其中电气量的微分,积分算子,不易进行数值化和系统实现[5]。所以,这里对公式(3)进行了变形。首先,对式(3)由时域变换到频域,微分算子d/dt变换为jω,积分算子∫dt变换为1/jω,得到:
式中:是PT开口端的电压频域变量;是PT开口端的电流频域变量;ω是注入信号的角频率。接着,对上式移到左边,公式两边取虚部,进一步变形为
其中:为阻抗模,θ为阻抗相角,n1、n2分别是电压互感器PT的高、低压绕组匝数。
这里信号注入法的测量对象是ω,U0和I0。通过测量PT开口端特定频点处的U0、I0就可以求得Z和sinθ。获得PT等效回路的电路模型,测出了ω,Z和sinθ,接下来的工作就是运用最小二乘法对电路模型中的L,C系统参数进行辨识,得到电力系统接地电容。递推式最小二乘法辨识的目标是获得系统参数L,C,记为Φ=(L,C),系统输入为注入信号的角频率ω和其倒数1/ω,记为X=(ω,1/ω),系统输出为等效阻抗的模Z和相角θ,记为Y=Zsinθ。递推式最小二乘法的算法流程如图3所示。
递推过程是这样的:在PT开口三角侧注入角频率ω逐渐变化的电流信号。在10~200 Hz的范围里,经过大量仿真实验和计算比较,最终选择扫频范围10~181 Hz之间的20个频点,各频点间隔9 Hz,作为注入信号的频率。不断地读取系统输入X和相应的输出Y,i时刻读取的一对输入、输出记为(Xi,Yi)。每次读取一对(Xi,Yi),用最小二乘法计算出当前迭代的系统参数iΦ。如此循环,直到系统参数Φn与系统参数Φn+1之差的绝对值小于一个非常小的正数ε,那么迭代结束,取得系统辨识参数Φn=(Ln,Cn)。最后,计算出电网电容电流Ic=3ωCU相。
2 电容电流辨识算法实现
最小二乘法辨识电容电流的实现主要是完成辨识算法程序,并将其加载到DSP芯片中。辨识电容电流程序的目标器件选用TMS320LF2407芯片,采用C语言进行开发,不仅能够方便地实现算法的编程,而且也能够达到较高的辨识速度,不会影响电容电流辨识的实时性。在前面设计的辨识算法的基础上,可以比较容易地制定出辨识电容电流的程序流程,如图4所示。
其中,程序运行的终止条件可以根据系统要求和实际情况而定。如果对辨识电力系统电容电流的反应时间有规定,那么可以设定迭代次数不超过N。经过多次仿真实验和计算,这里N一般可取10,就可以使系统辨识结果具有较高精度。如果对辨识电力系统电容电流的精度有较高要求,那么可以设置辨识系统参数Φn和下一次的参数Φn-1之差的绝对值小于一个非常小的正数ε,那么迭代结束。一般地,ε可以取10-4,所用的辨识迭代次数通常在10次以内。另外,最小二乘法程序中涉及到对矩阵的较多操作,比如辨识算法中PiXi+1是n×n方阵和1×n向量相乘,(I-Ki+1XTi+1)P是两个n×n方阵的乘积,Pi=(XiTXi)-1需要进行矩阵求逆运算。程序中对各种类型的矩阵运算进行了单独编程,并且用函数进行实现,从而能将辨识过程进行明确划分,更好地执行辨识流程。
3 电容电流辨识算法仿真
这里,我们给出CCS2.20中TMS320LF2407芯片完成电容电流辨识仿真的过程和结果。CCS2.20是TI推出的用于开发其DSP芯片的集成开发环境。它采用Windows风格界面,集编辑、编译、链接、软件仿真、硬件调试及实时跟踪等功能于一体,极大地方便了DSP程序的设计与开发。对电压互感器PT回路的建模采用Matlab实现,仿真并获得PT开口端的等效回路的各次电流Ii和电压Ui,从而计算得到各个角频率相应的电路阻抗值Zsinθ。根据各次电流Ii和电压Ui,在CCS2.20中仿真运行递推式最小二乘法算法程序,然后我们就可以在CCS2.20中设置断点,监测到程序辨识到的接地电容,从而验证DSP的电容电流辨识程序的正确性。
在PT开口端输入10~181 Hz,频率间隔为9Hz,幅度为1 A,相位为0°的20个电流信号Ii。在每输入一个电流信号之后,根据PT开口端测量到的电压值,就可以计算等效阻抗值Zsinθ。各个角频率对应的电路阻抗值Zsinθ见表1所示。
然后,把电流注入法检测到的各次电路等效阻抗Z和相角θ作为输入在CCS2.20中运行递推式最小二乘法程序,检测接地电容C。表1中列出了辨识的结果。由表1可见系统对电感L的辨识误差从第三迭代开始都在1%以内,而对电容C的辨识误差则在第一次辨识就达到1%以内。
由此,我们可以看到,这里实现的递推式最小二乘法辨识电容电流具有较高的辨识效率,而且相比一般最小二乘法,可以使系统计算开销降低,辨识速度提高。
4 结论
本文实现的接地电容电流辨识的实现方案具有一定创新性。这里辨识算法首先对电力系统加入了电压互感器PT,并且建立了电力系统的等效模型和系统方程。辨识所需的电力系统状态的获取是通过信号注入法获得的,而对系统参数的辨识中使用的是递推式最小二乘法。本文在接地电容电流辨识中创新性地对PT等效回路的电路方程进行了变换,使得其中的系统输入、输出变量的采集、获取比较容易实现。此外,本文电路系统参数的求解运用了递推式最小二乘法,它的特点是能够实时、在线辨识系统参数,满足消弧线圈实时补偿电力系统电容电流的要求。
参考文献
[1]孙结中,蒋学军.配电系统电容电流测试仪的研制[J].广西电力,2006(2):1-4.SUN Jie-zhong,JIANG Xue-jun.Development of Capacitive Current Tester in Distribution System[J].Guangxi Electric Power,2006(2):1-4.
[2]赵正军,姜新宇.信号注入法在配电网电容电流测量中的研究[J].广东电力,2005,17(6):25-28.ZHAO Zheng-jun,JIANG Xin-yu.Research of Signal Injection Method used in the Measurement of Capacitive Current in Distribution Network[J].Guangdong Electric Power,2005,17(6):25-28.
[3]徐宁寿.系统辨识技术及其应用[M].北京:机械工业出版社,2003.XU Ning-shou.System Identification Technology and Its Application[M].Beijing:China Machine Press,2003.
[4]陈自宽,母国光.相关数据集的最小二乘处理方法[J].数据采集与处理,2007,11(1):66-68.CHEN Zi-kuan,MU Guo-guang.Least Square Method Sets to Deal with the Related Data[J].Data Acquisition and Processing,2007,11(1):66-68.
【最小二乘法模型】推荐阅读:
偏最小二乘法模型05-26
偏最小二乘法回归模型07-05
最小二乘法分析07-05
分段最小二乘法10-02
最小二乘法拟合直线05-21
递推最小二乘法06-04
线性回归最小二乘法06-19
最小二乘法曲线拟合07-11
非线性最小二乘法拟合06-24
改进的偏最小二乘法11-29