特征向量法

2024-10-04

特征向量法(共7篇)

特征向量法 篇1

0 引言

特征向量提取和特征选择的基本任务是研究如何从众多特征中求出那些对于分类识别最有效的特征,从而实现特征空间维数的压缩,特征提取和选择的优劣很大程度的影响了分类器的设计和性能。因此,特征提取是模式识别的三大核心问题之一[1]。本文针对特征向量提取提出了基于搜索树和解数的分支界定算法,总的搜索方案是沿着搜索树自上而下,从左到右进行,树的每一节点代表一种特征组合,在搜索树中考虑了所有可能的组合。

本算法利用了可分性判据的单调性,采用分支界定策略,合理地组织搜索过程,使其有可能避免计算某些特征组合,同时又保证选择的特征子集是全局最优的,从根本上提高了用于特征向量提取的基于搜索树的分支界定算法的效率[2]。

1 搜索树原理分析

树的每一个节点表示一种特征组合。根节点代表所有的特征组合,子节点代表的特征向量比其父节点代表的特征少一个,同父的各子节点的特征组合中丢弃不同的一个特征后余下的特征,节点上的标志表示被丢弃的特征序号,各叶节点代表各种不同的待取特征数的组合。S(n,d)共有Cnd各叶节点,沿树的纵向看,每去掉一个特征称为树的一级,所以,要想从n个特征中选出d个特征,全树就应该有n-d级,根节点表示为0级,叶节点为n-d级。级也称深度,可用s表示,具有深度s的节点代表n-s个特征。用Xl表示含l个特征的特征集,Xs表示舍弃s个特征后余下的特征,Χs表示可供第s级当前节点的子节点数。由于在第s级某当前节点的每个子节点要舍弃Χs中互不相同的一个特征,从而对于这个节点在确定它的下一级(s+1)可以丢弃一个特征的实际方案时,必须使这一级任一子节点丢弃一个特征后Xs+1(至少)还剩下(n-d)-(s+1)个特征以供后面每级丢弃一个特征,对某子节点而言,它及其左边父节点已丢弃的特征,以后不在要丢弃的特征组之内,得出子节点数qs=rs-(n-d-s-1)。

2 生成解数的原理分析

将搜索树S(n,d)定义成一个四元组T(n,d)=(N,E,R,L),N表示节点集合{η};E是边集,其元素是e(η,ηc)表示父、子节点所代表特征的关系,子节点ηc代表的是从其父节点η代表的特征去掉一个后留下的特征;R是根节点,代表n个特征组成的集合Xn;L是叶节点集,其每个元素代表d个特征的组合,是一个可能解。

为迭代构造搜索树[3],令Ns={ηη∈N,η的浓度不大于s},Es={e(η,ηc)|e∈E,η,ηc∈Ns},Ls Ns是子树叶节点集,叶节点具有s深度,定义T(n,d)的s深度子树T s(n,d)=(Ns,Es,R,Ls),可知,它是T(n,d)去掉深度大于s的节点和相应边后的结构,即T s(n,d)=T(n,ns)。当在规定根节点、叶节点代表的特征数目而生成树之后不再考虑节点特征因素时,也即只考虑树结构,并令T s(n,d)表示T s(n,d)的树结构,可知T(n,d)的子树T s(n,d)和T(d+s,d)的树结构相同,有如下关系:T s(n,d)=T(d+s,d),可据递推方法产生解树。

3 基于解数的分支界定法的可分性判据分析

就可分性判据而言,本算法提供了利用JB、JC、JD三种判决准则进行判决。设两类都是正态分布,p(x| w1)~N(μ1,∑1),p(x|w2)~N(μ2,∑2),变换后的判据JC是W的函数,记为JC(W).

其中M=(μ1-μ2)(μ1-μ2)′,JB=JC(s=1/2)。

对于多元正态分布的两类问题,设p(x| w1)~N(μ1,∑1),p(x| w2)~N(μ2,∑2),经变换散度判据JD可写成W的函数[2,4,5]:

其中,M=(μ1-μ2)(μ1-μ2)′,当时∑1=∑2=∑时,JB,JC,JD三种判据分述如下:

4 仿真分析

(1)产生均值变化显著,方差不变的正态随机样本

运行程序,提取特征,结果为:

(2)产生均值变化不明显,方差变化显著的正态随机样本

运行程序,提取特征,结果为:

5 结论

本文针对两类问题的不同显著特征的情况,利用基于搜索树的分支界定法进行了特征提取,在确定搜索树是采用了递推算法,由子树不断的添加一个特征并由子数的叶节点“长”出新的叶节点的方法产生搜索树,同时利用判据J值的单调性,提高了基于搜索树的分支界定算法的运行效率。从仿真结果看出,在均值变化显著,方差基本没变化的服从正态随机样本情况下,利用该算法提取的有效特征分别为第二个、第三个和第五个;在对服从正态分布的样本,其均值变化不明显,方差变化显著的情况下,利用基于搜索树的分支界定算法提取的特征分别为第三个、第五个和第七个,与实际分析的结果相同。验证了基于搜索树的分支界定算法提取特征的正确性和算法的高效性。

摘要:着重分析了基于搜索树和解数的分支界定算法在特征向量提取中的应用,阐述了搜索树的形成原理、解数的生成过程及可分性判据。通过matlab仿真,验证了该算法在特征提取应用中的有效性和合理性。

关键词:分支界定法,搜索树和解数,特征向量提取,可分性判据

参考文献

[1]Yu B,Yuan B.A More E ffic ient B ranch and Bound A l-gorithm for Feature Selection[J].Patern Recogn ition,1993,26:883-890.

[2]孙即祥.现代模式识别[M].北京:国防科技大学出版社,2002,190-240.

[3]王思臣,于潞.分支界定法及其在特征选择中的应用研究[J].现代电子技术,2008,273(10):142-144.

[4]李国正.特征选择若干新方法的研究[D].上海:上海交通大学,2004.

[5]虞华.基于雷达回波的特征选择与分类识别方法的研究[D].长沙:国防科技大学,2003.

特征向量法 篇2

电力系统潮流计算是电力系统分析中重要的基本问题。潮流方程组本质上是一个多元二次方程组,通常具有多个解。工程中通常采用牛顿—拉夫逊法、P-Q分解法等数值迭代方法进行计算。尽管这类方法求解速度快并且非常准确,但是只能得到一个解,并且计算过程中可能出现雅可比矩阵奇异导致不收敛的问题,无法求解不稳定的运行点和奇异点。潮流问题的全部解是研究暂态稳定问题的稳定边界的必要信息。在静态电压分析中奇异点的相关分析也是需要的,比如绘制PV曲线。当采用数值迭代法求解潮流时,理论上可以采用连续潮流法设计合适的参数化方法(比如预测—修正机制[1,2])来处理奇异性问题。

除了数值迭代法外,吴消元法、同伦算法和Gröbner基法也曾被应用于求解潮流方程。文献[3]利用同伦算法求解复空间的潮流方程。文献[4,5,6]采用吴消元法辗转消元得到三角化的方程组,以求解潮流方程组。近期,基于Gröbner基的消元法在文献[7,8]中得到研究,此方法需要字典序下的Gröbner基,而基的求解速度是该方法的重要局限。值得注意的是,基于Gröbner基的消元法和吴消元法在逐步消去变量的过程中会产生累积误差,是限制消元法进一步发展的主要困难之一。

本文利用基于Gröbner基和商环的相关理论将潮流计算问题转化为矩阵的特征值或特征向量的求解,使得在给定负荷下,能够一次性求解潮流方程组的全部解。该方法从原理上避免了消元法的累积误差,同时绕开了雅可比矩阵的奇异性问题,不仅不需要采用连续潮流法来计算临界点,还可以得到比连续潮流法更加完整的PV曲线。本文所采用的方法普遍适用于求解多项式方程组,它回答了潮流方程解是否存在、解的个数等长期悬而未决的基本问题,在电力系统其他领域有潜在的应用价值,以此法初探代数几何方法在潮流计算中的应用。

1 理论基础

本文所介绍方法的基本思想是将求解多元多项式方程组的问题转化为求解矩阵的特征值或者特征向量。为了获取正确的、能反映原方程组解信息的矩阵,这里简要介绍代数几何的相关概念和原理。其中涉及的更加具体的概念可以参考文献[9,10,11]。

实际中很多问题能够描述成如式(1)所示的多元多项式方程组的求解,其中未知变元为x1,x2,…,xn。记F={f1,f2,…,fs},则式(1)的解所构成的集合记为V(F)。

f1(x1,x2,,xn)=f2(x1,x2,,xn)==fs(x1,x2,,xn)=0(1)

按照式(2)定义的〈f1,f2,…,fs〉是由f1,f2,…,fs生成的理想,根据定义即可推断V(F)⇔V(〈f1,f2,…,fs〉)。

f1,f2,,fs=p1f1+p2f2++psfs(2)

式中:pik[x1,x2,…,xn],其中i=1,2,…,s,k表示一个域,k表示系数属于域k的以x1,x2,…,xn为变元的多项式集合。

当选择复数域,即k=C时,C[x1,x2,…,xn]表示系数为复数的多项式集合。

I=〈f1,f2,…,fs〉,则对理想I可计算其Gröbner基Gb={g1,g2,…,gt}。 I=〈g1,g2,…,gt 〉(基的定义),因此求解V(F)等价于求解V(Gb)。目前Gröbner基理论在电力系统中的应用正是通过求解V(Gb)来实现的。

本文并不求解V(Gb),而是利用Gb来求解I的正规集。在求解Gröbner基和求解正规集的过程中单项式序的概念十分重要[10]。最为常用的单项式序是字典序和次数字典逆序。假设xα,xβk均是单项式,如果α-β的从左往右的第1个非零分量为正数,则xα优于xβ,表示为xαxβ,称由此定义的序关系为字典序;如果|α|>|β|或者|α|=|β|,且α-β的从右往左的第1个非零分量为正数,则xα优于xβ,表示为xαxβ,并称这个序关系为次数字典逆序[11]。

非零多项式f=∑aαxαk,给定单项式序,其次数为deg (f)=max {α∈Nn|aα≠0};首项系数LC(f)=adeg(f);首项单项式LM(f)=xdeg(f);首项LT(f)= LC(f)LM(f)。令〈LT(I)〉表示由I中元素的首项所生成的理想,I的正规集定义为集合Nset={xα| xα∉〈LT(I)〉}。由Gröbner基的定义和性质可知〈LT(I)〉=〈LT(g1), LT(g2),…, LT(gt)〉,因此,通过写出所有不能被LT(Gb)模尽(参见多项式除法的相关定义)的单项式,可得到Nset={t1,t2,…,tm}。由理想I定义的商空间k[x1,x2,…,xn]/I可知,其是一个可由t1,t2,…,tm生成的理想。根据有限性定理[9,10],如果I为有限维理想,m则是一个有限的整数。

按照式(3)定义f的同余类计算[f],其中gfmod I,指gfI同余,满足f-gI。由Gröbner基的性质推断用Gb模集合[f]中的元素所得到的余相同,即[f]

=[f¯Gb]。那么显然对任意f,gk均满足[f]=和[f]+[g]=,因此,k[x1,x2,…,xn]/I是一个环(参考环的定义[11])。

[f]={gk[x1,x2,…,xn]|gfmod I}

(3)

2 特征值/向量法求解多项式方程组

为求解如式(1)所示的多元多项式方程组,生成理想I=〈f1,f2,…,fs〉,由前文的理论基础知求解式(1)可转化为求解I的零点集。

对于理想I,以下2个重要的命题成立[11]。

命题1:假设I⊂C[x1,x2,…,xn]是零维的,即V(I)是有限集,任意函数fV(I)上的值正好也是Mf的特征值,特别的乘法矩阵Mxi的特征值是V(I)对应点的xi值。

命题2:假设I是不包含1的理想,任意选择f∈C[x1,x2,…,xn]使得对mpV(I)有彼此不同的f(p)值。那么Mf的左特征空间是一维的并且由行向量(pα(1),pα(2),…,pα(m))组成,其中pV(I)。

根据命题1和命题2,可以将求解I的零点集转化为求解某些函数的乘法矩阵的特征值或特征向量。为了得到正确的包含I的零点集信息的矩阵,有3个关键问题:第1个是对于给定的函数如何求解它的乘法矩阵;第2个是如何选择合适的函数;第3个是如何从乘法矩阵的特征值或特征向量中得到I的零点集。

首先,给定函数f∈C[x1,x2,…xn],乘法矩阵Mf的计算方法为[10]:假设Nset={t1,t2,…,tm}是I的正规集,由前文同余类计算的定义知[f]

[t]=[ft]=[ftGb]是商环C[x1,t2,…,xn]/I上的元素,且Nset={t1,t2,…,tm}是该商环的基,因此对i=1,2,…,m均有[f]=j=1maij(f),写成如式(4)所示的矩阵形式,其中

[a11a1mam1amm

T称为f的乘法矩阵Mf,规模为m×m阶,且总是满秩的。

[f][[t1][tn]=[a11a1mam1amm[[t1][tm](4)

其次,选择合适函数f和从乘法矩阵中得到正确解的方法,具体在2.1节和2.2节中给出。

2.1 特征值法

前文所述V(F)⇔V(I),因此旨在求解V(I)上的点pV(I),即确定p=(a1,a2,…,an)的ai(i=1,2,…,n)值。由命题1可知,分别选择f等于待求的变量,计算对应Mf的特征值,即为待求变量的值。但Mf往往具有多个特征值,必须经过匹配才能得到正确的解。完整的特征值法步骤如下。

1)求解指定单项式序的Gröbner基及正规集Nset。

2)分别选择f=xi(i=1,2,…,n)计算对应的Mf,并用矩阵W1(见式(5))保存各个变量的特征值。

W1=[vx1,1vxn,1vx1,mvxn,m](5)

式中:vxi,j表示f=xi时的第j个特征值。

3)分别选择f=x1+xi(i=2,3,…,n)计算对应的Mf,并用矩阵W2(见式(6))保存特征值。

W2=[vx1,1vx1,mvx1+x2,1vx1+xn,1vx1+x2,mvx1+xn,m](6)

式中:vx1+xi,j表示f=x1+xi时的第j个特征根。

4)利用W1和W2进行解的匹配,流程如图1所示,得到的W1记为匹配后的原方程的解。

值得注意的是,Mf的阶数m由正规集维数决定,对一个m×m阶的满秩矩阵,在复数域总能找到m个特征值(包括重复特征值)。由命题1可知,对任何待求变量均能够得到m个值,由此可以推断正规集的维数就等于多项式方程组根的个数。实际上根据有限维定理[12],这个正规集维数几乎就等于多项式方程组根的个数。

2.2 特征向量法

由命题2可知,当选择合适的函数时,Mf的左特征向量v可用于确定任意有限V(I)的点。设计特征向量法的步骤如下。

步骤1:求解指定单项式序的Gröbner基及正规集Nset。

步骤2:系数f=c1x1+c2x2+…+cnxn,系数随机给定以满足f(p)彼此不同 (这个条件几乎处处满足),并求解其乘法矩阵Mf

步骤3:求解Mf特征值λi及对应的左特征向量δi=c(pα(1),pα(2),…,pα(m)),左特征向量的值分别对应了正规集的各项的值。

步骤4:读取和计算V(I)各点各变量的值。根据有限性定理,存在某些xi,[xi]∈Nset,caiv,为了确定ai的值,只需要确定c的值;[1]∈Nset,c也可以从v中直接读出;对于另一些xj,[xj]∉Nset也总是可以通过已知的变量值求解得到。

3 潮流求解及PV曲线绘制

3.1 电力系统潮流计算

对n节点系统,假设Pj和Qj分别为节点j的注入有功功率和无功功率;节点电压用直角坐标Vj=ej+jfj表示,对j=1,2,…,n,均满足:

Ρj=i=1nGji(fifj+eiej)+i=1nBji(eifj-ejfi)(7)Qj=i=1nGji(eifj-ejfi)-i=1nBji(eiej+fifj)(8)|Vj|2=ej2+fj2(9)

式中:Gji和Bji分别为节点导纳对应的实部和虚部。

式(7)至式(9)就是经典的功率方程。显然,潮流方程组本质上是一个二次多元方程组,而且潮流方程组解的个数一般是有限的,因此由潮流方程所生成的理想是有限维的且不包含1,适合采用依据命题1和2所介绍的特征值法和特征向量法,求解步骤如下。

步骤1:对于给定的n节点系统,节点1为平衡节点,则待求变量是e2,e3,…,en和f2,f3,…,fn;根据式(7)至式(9)可写出2n-2个方程,即H1=H2=…=H2n-2=0,生成理想I=〈H1,H2,…,H2n-2〉,并指定单项式序计算其Gröbner基Gb和理想I的正规集Nset

步骤2:采用特征值法,分别选择g=e2,e3,…,en和f2,f3,…,fn计算乘法矩阵Mg和其特征值,由于潮流方程只关心实数解,因此用矩阵W1保存实数特征值;分别选择g=e2+e3,…,e2+en,e2+f2,…,e2+fn,计算乘法矩阵Mg,用矩阵W2保存其实数特征值;然后,根据特征值法所介绍的匹配法得到全部的潮流解。

步骤3:采用特征向量法,随机产生各待求变量的系数c1~c2n-2,则g=c1e2+c2e3+…+cn-1en+cnf2+…+c2n-2fn,计算Mg的左特征向量,根据特征向量法的求解步骤得到全部的潮流解。比如求某个3节点系统的潮流方程(限于篇幅略)所生成的理想在次数字典逆序下正规集Nset={1,e2,f2,e3,f3,e22},则Mg规模为6×6阶,可得到6个左特征向量δi=(δi,1,δi,2,…,δi,6),i=1,2,…,6,对任一向量均可得到e2,f2,e3,f3分别等于δi,2/δi,1,δi,3/δi,1,…,δi,5/δi,1。

根据经典Bezout定理[11],乘法矩阵Mg阶数的上限为22n-2,而实际阶数不仅与节点个数相关还与网络结构、PV节点的个数相关,因此难以给出具体的结论,但通常情况下Mg阶数远远小于22n-2。某个3节点系统,Mg阶数为6<24=16。后文算例中5节点系统的Mg阶数为54<28=256,如果增加一个PV节点,Mg阶数为46。这是由于PV节点的方程比PQ节点的方程简单。另外修改节点导纳矩阵的值,使之更稀疏,得到阶数为48的乘法矩阵。

3.2 计算复杂性及准确性分析

首先,将特征值法/特征向量法与基于Gröbner基的消元法进行比较。消去理论[10]指出字典序下的Gröbner基能够应用逐步消元法,得到多元高次方程组的解,目前已经初步应用于电力系统潮流方程的求解[7,8]。对于前文所述的3节点系统,指定字典序f3≻e3≻f2≻e2,得到Gröbner基{g1,g2,g3,g4},其中g1是关于e2的6次函数,g2含有变量e2和f2,g3含有变量e2和e3,g4含有变量e2和f3,因此利用消元的方法可以求解。消元法存在累计误差,这是由于一元高次函数所得到的e2值有误差,利用该值求解其他值误差将累计,这种误差有时甚至会很大。吴消元法也存在这个问题。相比较,特征值和特征向量法从原理上不存在累积误差,因此更为准确。

从计算时间分析,由于Gröbner基计算常用的算法是Buchberger法[12]、F4[13]算法、FGLM[14]算法,通过多元多项式的长除法进行符号计算求解得到,这是3种方法花费时间的主要组成部分。计算Gröbner基的过程所需要占据的内存和花费的时间与指定的单项式序密切相关,通常情况下次数字典逆序的计算速度远远快于字典序,比如本文采用的2机5节点系统潮流计算中字典序下的Gröbner基求解耗时125 s且占内存165.6 MB,而次数字典逆序仅耗时0.562 s且几乎不占内存。由于消元法必须指定单项式序为字典序,因此限制了计算速度。

其次,比较特征向量与特征向量法,两者的计算准确性不相上下,但是特征向量法的计算效率远远高于特征值法,这是由于特征向量法免除了特征值的结果配对,只需要计算一次乘法矩阵和一次特征值及特征向量,而特征值法需要重复2n-2次乘法矩阵、特征值/向量的计算。

3.3PV曲线绘制

假设所研究的理想的正规集维数为m,则可以求解得到潮流方程组的m个解,包括实数解和复数解。实数解和复数解的个数分别由乘法矩阵的实数特征值个数和复数特征值个数决定。连续潮流法旨在解决常规潮流计算在临界点附近的奇异性问题。而临界点及其附近点的潮流方程采用特征值/特征向量法是可以求解的:负荷水平不小于临界点时,乘法矩阵没有实数的特征值而只有复数的特征值,也就是说潮流方程只有复数解而没有实数解。因此,临界点可以逐步增加负荷,观察实数解的个数得到。PV曲线绘制方法如图2所示。步长选择的原则是:如果以快速求取临界点为目的,当实数解个数大于2时,选择较大的步长;当实数解逐步减少至2时,选择较小的步长。以细致描绘PV曲线为目的,则始终采用较小的步长。

值得说明的是,连续潮流法求取PV曲线时负荷水平有增长到达临界点再减小的过程,由于特征向量法和特征值法每次计算潮流都能给出对应条件下所有的解,因此只需要逐步增长的过程就可以绘制完整的PV曲线。

4 算例分析

4.1 潮流计算

图3为某一经典的2机5节点系统,网络参数参见文献[7]。假设节点3和节点4装设无功补偿器,补偿后产生的总无功负荷为有功负荷的一半;节点5未装无功补偿器,其无功负荷为有功负荷的一半,具体参数如表1所示。

由潮流方程组生成的理想在次数字典逆序下正规集维数为54,因此对任意选定的函数g,其乘法矩阵Mg规模为54×54阶。表2列出了由特征值法和特征向量法所得到的8个实数解,2种方法得到的结果一致,验证了方法的正确性。将结果代入原8个多元二次方程与目标零之间的最大偏差值为0.000 47,验证了计算所得解的准确性。文献[7]计算字典序下的Gröbner基,期望利用消元法进行求解,由于基中一元多项式次数高达52次而难以进一步得到结果。

pV(I),g(p)的值并不是各不相同时,特征向量法可能出错。任意选择1 000次g分别计算潮流得到的节点5的电压实部e5值,结果表明,只有2次随意选择的结果与其他结果有差异,即出错概率约为0.2%。这个出错概率很低,而且这个缺陷很容易识别和纠正。

仿真采用32 bit的Maple 16 软件在CPU 2.94 GHz,内存 2 GB的32 bit计算机下完成,所花费时间及占据内存在前文中已经提及。在同等条件下,计算更大的系统(比如IEEE 14节点系统)出现内存溢出的错误。

4.2PV曲线和电压稳定分析

以4.1节的算例为基础,节点5负荷的无功功率大小设定为有功功率的一半,即在有功功率发生变化时,无功功率也随之变化。在此设定上,图4显示了节点4的电压幅度随负荷P5逐步增加的变化曲线,该图显示的PV曲线由不连续的3段组成,其中正常运行点在最上面的那部分。曲线的各个转折点对应潮流方程解个数一对一对减少的点,分别出现在P5值等于1.0,1.6,1.9,2.6,3.4(标幺值,下同)处。

图5给出了节点5电压幅值随自身负荷大小变化的情况;与图4形状类似,各条曲线的末端也对应潮流解个数变化的点。若以正常运行点为研究对象,则静态电压稳定临界点出现在P5=3.4处,此时对应各点电压如表3所示。

节点2为PV节点,图6(a)三部分曲线分别对应图6(b)的三部分曲线,正常运行点在底部曲线上。图6(b)曲线的断点出现在电压幅值0.4~0.6之间,其对应P5=2.6 这个临界点。

5 结语

本文采用基于Gröbner基的特征值/特征向量法来求解简单系统的潮流方程。该方法能求解潮流方程的全部解,同时也避免了消去法求解一元高次方程(有时甚至难以求解)的困难。从算例仿真结果来看,该方法所绘制的PV曲线比传统连续潮流法所得到的要丰富得多。Gröbner基的求解速度是目前限制其求解系统规模的重要因素,但其优点在于能够可靠地求取所有的潮流解,而且本文采用的方法可以用于求解任何小规模多项式问题,对进一步探索电力系统基本性质有一定的意义。

特征值与特征向量研究性教学设计 篇3

关键词:特征值,特征向量,研究性教学设计

特征值与特征向量是重要的线性代数概念, 在工程领域和经济领域具有广泛的应用。例如工程技术中的振动问题和稳定性问题, 往往归结为求一个方阵的特征值与特征向量, 特征值与特征向量的有关理论也常常用于讨论线性微分方程的求解问题[1]。这些都说明方阵的特征值与特征向量具有实际意义和广泛的应用价值, 而且概念很抽象, 其性质具有探索性, 适合运用研究性教学, 有利于培养学生的自主探索能力与创新能力。本文在已有的理论研究基础上, 结合我校大学公共数学研究性教学实践, 主要就研究性教学过程设计展开研究, 并在学生的合作参与下, 对方阵的特征值与特征向量研究性教学案例进行了实践研究。

一、问题情境的创设

通过矩阵及与矩阵相关知识的学习, 认识到矩阵的运算是非常重要的, 但是矩阵的运算往往比较复杂麻烦, 如何简化矩阵的运算及相关问题是一个值得研究的问题。

引例:计算

通过计算让学生发现问题、提出问题, 并自主探索。

猜想1:对任意的正整数n有:

思变:对以上矩阵中元素稍作改变, 再让学生计算, 一般来说, 上述结论就不成立了。

问题1:对于满足什么条件的矩阵与向量能使上述结论成立?

猜想2:设A为n阶方阵, x为n维非零列向量, λ为实数, 如果Ax=λx, 那么就有Anx=λnx.

问题2:对于n阶方阵A, 满足条件Ax=λx的λ和x怎么求?

问题3:对于n阶方阵A, 满足条件Ax=λx的λ和x具有什么性质?

二、问题探索

通过以上问题分析, 学生根据已有知识感性认识到结论的正确性, 关键的工作是要对以上猜想进行严格的证明。

探索1:运用数学归纳法易证猜想1与猜想2的正确性, 问题1得到解决, 并给出方阵的特征值与特征向量的概念。

探索2:通过化归变形解决问题2。

Ax=λx有非零解圯 (A-λE) x=0有非零解圯|A-λE|=0, 解得所有λi, i=1, 2, …, n圯 (A-λiE) x=0, 求得λi对应的基础解系。

归纳求方阵的特征值与特征向量的一般方法: (1) 求解特征方程|A-λE|=0的所有根, 特征方程是一元次方程, 在复数域上有n个根 (重根重复算) λ1, λ2, L, λn, 就是所求矩阵的特征值; (2) 对每一个λi求出对应的齐次方程 (A-λiE) x=0基础解系, 相应基础解系的线性组合就为对应λi对应的全部特征向量。

探索3:设A=diag (a11, a22, L, am) , 则有:

(1) A的特征值为λ1=a11, λ2=a22, L, λn=ann;

(3) 如果|A|≠0, A-1的特征值为a11-1, a22-1, …, ann-1;

(4) An的特征值为an11, an22, L, annn;

(5) λi对应的特征向量xi=ki (0, L, 0, 1, L, 0) T, 1在第I位, ki≠0的常数。

以上结论易证, 并作一般性猜测, 设A= (aij) n×n, 其特征值为λ1, λ2, …, λn, 探索3中 (1) 显然一般不成立, (2) (3) (4) 不难证明有相同的结论, 仅有 (2) 的证明麻烦一点, 可以先用2阶的特例, 利用一元二次方程根与系数的关系证得。由此可归纳出特征值的性质。探索3中的结论 (5) 的一般性猜测无类似结论, 由探索2知道, 一般求特征值和特征向量过程很麻烦, 尤其当n较大时, 求解的工作还是困难的, 这也激发了作进一步探索的兴趣。

定义矩阵的行列互逆变换[2]: (1) 互换i、j两行, 同时互换i、j两列; (2) 第行乘以不为零的数k, 同时第i列乘以不为零的数 (3) 第j行的k倍加到第i行 (ri+krj) , 同时第i列的倍加到第j列 (cj-kci) .

令a12+k (a22-a11) -k2a21=0, 那么易验证a11+ka21和a22-ka21就是特征方程λ2- (a11+a21) λ+a11a21-a12a21=0的特征根, 当然以上的工作比直接求特征方程的根感觉还要麻烦, 但是, 它具有潜在的意义并继续实施行列互逆变换, 假设a11+ka21≠a22-ka21, 使其成为对角矩阵,

如果a11+ka21=a22-ka21, 那么不一定能通过行列互逆变换将其对角化。

探索5:n阶方阵A= (aij) n×n通过行列互逆变换对角化解决方法探讨 (说明:本文仅探讨对角化方法, 化到不能化为止, 回避标准型的提出) 。

事实上, 2阶方阵的对角化方法可推广到高阶方阵, 主要解决以下基本模块的对角化, 其中b=aij+k (ajj-aii) -k2aji, 令b=aij+k (ajj-aii) -k2aji求出k, 再代入。

在利用初等矩阵变换方法求逆矩阵的启发下, 尝试以下的行列互逆变换:

观察A、E2的变化, 不难发现A化为对角矩阵的同时求出了特征值, 而E2变换后的列向量恰好是本列中上方特征值所对应的特征向量。

显然, 通过以上的分块矩阵的行列互逆变换, 不仅求出了特征值, 还求出了特征值所对应的特征向量, 由此可得:

猜想3:方阵An、En构成列分块矩阵, 对其实施行列互逆变换, 当An化为对角阵时, 对角线上的元素就是An对应的特征值, 而En的每一列向量恰好是变换成An所在列的特征值对应的特征向量。

事实上, 猜想3并不严密, 当学习矩阵可对角化的条件后, 学生可以完善本猜想, 并完成证明, 本文再通过一个例子说明行列互逆变换方法对求矩阵的特征值与特征向量的有效性与简捷性, 并不要求完成严格的理论证明。

本题中所求矩阵无法通过行列互逆变换完全对角化, 但是特征值与特征向量依然求出, 对角线上元素依然是特征值, 且两个相等的特征值2, 仅有第二列的2对应其特征向量特征值4对应特征向量 (1, -1, 1) , 事实上, 与用一般方法求的结果是一致的, 此3阶矩阵仅有两个不同的特征值, 两个相等的特征值2对应的特征向量为k (-1, 1, 1) , 而前一例子两个相等的特征值λ1=λ2=-2对应的特征向量为x1=k1 (1, 0, -1) T、x2=k2 (1, 0, -1) T有所不同, 关于这一点是由矩阵本身确定的, 与求解方法无关, 随着进一步学习问题就清楚了。

三、问题小节

1. 由引例探讨引出了特征值与特征向量的概念, 归纳

特征值与特征向量的性质, 认识了解特征值与特征向量能简化矩阵运算的有关问题。

2. 通过对问题的探究找到了求特征值与特征向量的

一般方法, 但由于过程麻烦, 继续探究后, 发现了行列互逆变换求特征值与特征向量的简捷方法。

3. 矩阵行列互逆变换对角化的计算方法与技巧。

四、特征值与特征向量的应用与素质拓展

1. 了解特征值与特征向量在矩阵运算和工程技术领

域的应用情况, 学生通过查阅有关资料完成特征值与特征向量应用的总结报告。

2. 通过查阅资料加强对行列互逆变换求特征值与特征向量方法的理论认识, 完善猜想3, 并进行理论证明。

3. 指导学生查阅相关资料, 尝试其他求特征值与特征向量的方法。

五、结束语

特征值与特征向量是线性代数的重要概念, 相关内容丰富, 应用广泛, 研究方法灵活多变;概念本身具有实际背景意义, 问题的探究解决有利于培养学生的研究能力与创造能力, 相关结论的应用有利于培养学生的发散思维与创新精神。总之, 特征值与特征向量科学有效地采用研究性教学, 有利于培养学生数学研究能力与创新能力。

参考文献

[1]牛莉.线性代数 (第二版) [M].北京:中国水利水电出版社, 2009.

“被轻视”的向量法 篇4

一、利用向量求函数值域

求函数值域是中学数学中的常见问题,而向量的引入,使部分问题变得简单直观.

【例1】求函数的值域.

解:设则

如图1,记

由点M是直线y=2(x≠-)上的动点,当点M在直线上运动时,?m,n?的取值集合是即cos?m,n?的取值集合是

∴y的取值集合是

∴函数值域为

二、利用向量求最值问题

构造向量,使其模长和数量积都有对应的代数表达式,然后根据向量不等式来解决最值问题.

【例2】已知:x2+y2-8x-6y+21≤0,求5x+12y的最值.

解:∵x2+y2-8x-6y+21≤0,

即(x-4)2+(y-3)2≤4.

设m=(x-4,y-3),n=(5,12),

由|m·n|≤|m||n|知|5(x-4)+12(y-3)|≤即|5x+12y-56|≤4×13=52.

∴-52≤5x+12y-56≤52,即4≤5x+12y≤108.

∴5x+12y的最小值为4,最大值为108.

三、利用向量证明不等式

利用向量不等式证明代数不等式是不等式证明的常用方法,关键是抓住不等式所蕴含的向量背景.

【例3】设a、b、c、d为非零实数,求证:并探求等号成立的条件.

解:设m=(a,b),n=(c,d),则m-n=(a-c,bd).

由|m|+|n|≥|m-n|得

当且仅当m=λn(λ<0),即时取等号.

四、利用向量解线性规划问题

在可行区域内求函数最值的线性规划问题,可利用向量数量积的几何意义,使规划问题变得更加直观.

【例4】x,y满足约束条件求z=3x+2y的最值.

解:设可行区域内任意一点P(x,y),记

即求在方向上投影的最值.

如图2,在点C处最大,在点B处最小.

由得

由得

∴zmax=3×3+2×1=11,zmin=-

五、利用向量求解析几何问题

解析几何就是用坐标的方法研究图形,而向量也引入了坐标,因此可以用向量的坐标运算解决解析几何中的证明与计算,利用向量中公式的特点,可避免复杂的运算.

【例5】如图3,已知F(1,0),直线l:x=-1,P是平面上的动点,过P作直线l的垂线,垂足为Q,且

(1)求动点P的轨迹C的方程;

(2)过点F的直线交轨迹C于A、B两点,交直线l于点M,已知求λ1+λ2的值.

解:(1)由

由抛物线定义可知:点P的轨迹C是抛物线,方程为y2=4x.

(2)∵,易知λ1λ2<0,

过点A、B分别作准线l的垂线,垂足分别记为S、T.

由(1)(2)可得

用向量法解题例说 篇5

一、向量法在平面几何中的应用

例1 在△ABC内求一点P, 使AP2+BP2+CP2的值最小.

解 设undefined, 则undefined,

undefined

∴当undefined时, undefined取最小值.

记D为AB的中点, 则undefined,

于是undefined

∴C, P, D三点共线且P点是△ABC的重心时, undefined取最小值, 即AP2+BP2+CP2取最小值.

如果我们注意到新教材中的正弦、余弦定理这种平面几何的“宪法”, 也是用向量推导出来的话, 我们就不能再有任何理由怀疑向量法在解决平面几何题中的出神入化了.

二、向量法在代数中的应用

例2 求证: (ac+bd) 2≤ (a2+b2) (c2+d2) .

证明 设undefined

当undefined至少有一个为零向量时, 所证不等式为0≤0, 成立;

当undefined均不是零向量时, 设其夹角为α.

undefined

即 (ac+bd) 2≤ (a2+b2) (c2+d2) .

从本题看出, 只要实质上, 甚至形式上和向量沾点边的, 都是向量的“亲戚”, 用向量去思考, 方法简单明快、易于接受.

三、向量法在解析几何中的应用

向量在处理某些解析几何问题时有独到之处, 然而许多资料中的题目对于这类问题的解答还是习惯用传统方法, 不能充分体现向量这一工具的便捷性.

例3 双曲线undefined的离心率undefined, 点A与点F分别是双曲线的左顶点和右焦点, B (0, b) , 则∠ABF等于 ( ) .

A.45° B.60° C.90° D.120°

解 不难得A (-a, 0) , F (c, 0) ,

则undefined,

故undefinedundefined

undefined, 故BA⊥BF.于是选C.

通过此例不难发现, 用向量法解这样的解析几何题, 思路是清晰的, 过程是最简单的.

四、用向量知识解决实际问题

利用向量建立数学模型, 解决实际问题, 能充分体现中学数学的四大数学思想, 函数与方程思想、等价转化与化归思想、分类讨论思想和数形结合思想, 它是沟通数与形内在联系的有力工具, 用它来解决实际问题既简捷又直观, 不仅免去了冗长的运算, 而且能直观地抓住问题的本质.

例4 一艘船要从A处驶往正东方向200海里的B处, 当时有自西北方向吹来的风, 风速为undefined海里/小时, 如果帆船计划在5小时内到达目的地, 该船应以怎样的速度和方向航行? (如图所示, ∠CBA=45°, ∠CAB=α)

解undefined, 且undefined

undefined

undefined

undefined

又undefined

又undefined

因此该船应以每小时undefined海里的速度, 北偏东undefined的航向航行.

利用向量法解决空间问题 篇6

一、直线外一点到该直线的距离

例1如图1,已知正方体ABCD—A1B1C1D1的棱长为1,点E为AD1的中点,求点E到直线BD的距离.

分析:点E到直线BD的距离就是点E到直线BD的垂线段EF的长,而确定EF的准确位置比较麻烦,因此采用向量法.

解:如图1所示,建立空间直角坐标系,设EF丄BD,F为垂足(F的位置未确定),(λ∈R),由于,所以.∵A(1,0,0),D(0,0,0),,∴.又∵,EF⊥BD,∴,即.

二、两异面直线的距离

欲求两异面直线l1,l2之间的距离,可设与公垂线段AB平行的向量为,C、D分别为l1、l2上的任意两点,则l1,l2如之间的距离为.

例2在棱长为l的正方体ABCD—A1B1C1D1中,求异面直线A1C1与B1C的距离.

分析:因为找A1C1与B1C的公垂线或进行其他转换都比较困难,因此建立坐标系D—xyz,利用向量法计算A1C1与B1C之间的距离,为.

解:如图2所示,建立空间直角坐标系D—xyz,则A1(1,0,1),B1(1,1,1),C(0,1,0),C1(0,1,1).∴,.

设A1C1与B1C的公垂线段的方向量为,

则,即.

取x=1,得,又,

∴A1C1与B1C之间的距离为.

三、平面外的一点到平面的距离

例3如图3,已知正方形ABCD的边长为4,E、F分别是AB、AD的中点,GC垂直于ABCD所在的平面,且GC=2,求点B到平面EFC的距离.

分析:建立适当的坐标系,求出平面EFG的法向量,则在法向量方向上的投影向量的模为点B到平面EFG的距离.

解:如图3,建立直角坐标系C—xyz,则G(0,0,2),E(2,4,0),F(4,2,0),B(0,4,0).

则,,.

设平面EFG的法向量,由及,可得(取x=1),∴点B到平面GEF的距离

四、和平面平行的直线到平面的距离

例4已知棱长为1的正方体ABCD—A1B1C1D1,求直线D1C到平面A1BD的距离.

分析:找出平面A1BD的任意一个法向量,同时求出平面A1BD上任意一点到直线C1D的向量,然后求出该向量在上的射影的长就是直线D1C到平面A1BD的距离.

解:如图4,建立直角坐标系D—xyz,则D(0,0,0),B(1,1,0),A1(1,0,1),C(0,1,0),所以,,.

设平面A1BD的法向量,由及,可得(取x=1).于是,直线D1C到平面A1BD的距离.

五、平面的斜线与平面的夹角

例5如图5,三棱锥S-ABC中,SA⊥平面ABC,SA=3,AB=BC=2,∠ABC=120°,求:SA与平面SBC所成角的大小.

分析:找SA上的点到平面SBC的垂线比较困难,而SA⊥平面ABC,并且∠CAB容易求得,故用向量法求解.

解:过A作AD⊥AC,交CB的延长线于D,过B作BE∥AC交AD于E.

∵AB=BC=2,∠ABC=120°,根据余弦定理可得∠BAE=60°,∴,.

设AO是平面SBC的垂线,如图5所示,建立直角坐标系A—xyz,则A(0,0,0),S (0,0,3),,,所以,,,,

设平面SBC的法向量,由与可得(取x=3),∴,,

∴,即SA与平面SBC所成的角为.

特征向量法 篇7

力学对数学有很大的依赖性,没有学好数学想要成为力学家是很难想象的.甚至可以说没有学好数学就无法学好工科的其他课程.所以,作者要求自己大学一年级的学生一定要学好数学.像线性代数、微积分、空间解析几何等知识在力学中无处不有.下面以特征值和特征向量知识在力学中的运用为例做一介绍.

1 特征值和特征向量知识在求主应力和主方向中的运用

某一点的应力状态由6个应力分量决定,可以写成应力矩阵的形式[1]

如果能将式 (1) 中的非对角线元素变为0,这时剪应力为0,根据主应力的定理:某一个面上只有正应力而无剪应力时,这个正应力为主应力.式 (1) 为实对称矩阵,总是可以对角化,也就是说通过初等变换可以把应力矩阵变为如下对角线

式 (2) 中的非对角线元素为剪应力,这时剪应力为0.因此,式 (2) 中的对角线元素分别为第一、第二和第三主应力.求主应力就变为求下列特征值方程的特征值

3个特征值对应的特征向量是3个主平面的法线方向,而根据不同的特征值对应的特征向量正交可知3个主应力的方向是相互正交的.

2 特征值和特征向量知识在求结构动力学问题中的运用

无阻尼多自由度系统的动力学微分方程总是可以写成[2]

其中,M为系统质量矩阵,K为系统刚度矩阵,x为位移列向量.

求解式 (4) 的广义特征值方程为

系统的固有频率ωi2=λi,每一个特征值对应一个特征向量,对特征向量进行归一化就得到每一固有频率对应的振型如果系统刚度矩阵线性相关,则系统存在刚体运动,存在固有频率为零的情况.

3 特征值和特征向量知识在求结构临界屈曲力中的运用

结构屈曲的特征方程为

其中,K为系统刚度矩阵,Kσ为系统几何刚度矩阵,x为位移列向量.最小特征值λmin (载荷因子) ,即为屈曲临界载荷的表征.不同的特征值对应不同的特征向量xi,这个特征向量也可叫屈曲模式.

4 结论

在教学实践中,作者给学生上《弹性力学》课时,发现很多同学在学了材料力学后,很难记住材料力学中求二维问题的主应力公式,但是如果知道了求主应力就是求应力矩阵的特征值问题时,他们就能很快求出主应力和主应力的方向即使记忆力好的学生,他们也许在一两年内还记得材料力学中计算主应力的公式, 但是,若干年后,再问他们,还能记得这些公式的学生应该所剩无几了.在学习和教学的过程中,对知识点进行总结,要学会从全局出发,对知识进行串联、串讲.

参考文献

[1]王敏中, 王炜, 武际可.弹性力学教程.北京:北京大学出版社, 2002

上一篇:护士执业资格考试辅导下一篇:紧迫形势论文