数值化分析(共4篇)
数值化分析 篇1
数值重整化方法是由物理学家Wilson提出用来解决凝聚态物理上的Kondo问题以及其它相关的杂质问题。实际上, Kondo问题其本质就是零温发散问题, 最开始人们使用微扰方法来计算磁性杂质对比热、电阻等相关物理量的影响, 而得到的零温度下对数发散的相关结论。通过研究系统粒子间的相互作用的局域性, 来得到系统的基态表现出某种相关联别的形式, 我们从而可以运用有限的计算机资源来模拟所研究系统的基态。在微扰论建立起来的重整化转换, 会随着系统能标的减小而最终将变得非常不准确, 但在Wilson的数值重整化方法中, 系统的每一步的微小的不依赖于系统的耦合的尺寸的转换的精度是相同的。这样的一个数值重整化转换可以成为首个用来恰当描述从弱耦合机制区域到强耦合机制区域的Kondo模型。
数值重整化方法的一个非常重要并关键的步骤是系统能级的对数离散化。在不同的系统的能量尺度上, 系统在通过不动点时其行为会发生质变。系统的Kondo模型的连续形式的哈密顿量, 经过离散化后就变形为分离形式的Kondo哈密顿量:
其数值重整化后的哈密顿量, 满足下列递归关系
可以得到这个矩阵能够对角化, 并且上述这一处理过程, 在系统下一个能量位置能够继续重复。在这一迭代数值重整化的整个过程中, 我们并不能保证对系统高能态的情况忽略不会对我们得到的最终结果, 即对系统能谱的低能部分产生比较大的影响。对于两信道Kondo模型和局域Cu-O模型来说, 计算结果也表明, 高能态的忽略确实是一个有效的近似。数值重整化方法在量子杂质相关模型中的运用, 主要在输运性质、动力学计算和热力学计算这三个领域。按照Wilson对Kondo模型的数值重整化思想, 可以来研究系统的不动点以及其它许多量子杂质模型的热力学性质, 其中包括共振能级模型、Anderson杂质模型、两信道Kondon模型和两杂质模型, 以及进一步加入屏蔽的Anderson模型、超导的Kondo杂质、电导通道、赝能隙系统。数值重整化方法模拟进一步研究表明, 实验上的高温超导材料发现的反铁磁可能对超导的形成具有关键的作用, 现在已经有很多高温超导铜氧化物的实验结果证明给出了高温超导显示的崭新的特征, 其中包括比热测量、角分辨光电子能谱、核磁共振、光电子发射光谱等位相不敏感的实验结果, 以及超导SQUID等位相敏感的的实验结果。
同时实验中的中微子实验、中子散射结果也标明, 超导态中存在反铁磁自旋涨落。数值重整化方法模拟为反铁磁自旋涨落引起的超导、d波主导的超导、掺杂s波主导的超导的研究提供了新的数据。
项目支持:重庆江津区科委研究项目 (zzjh2015016) 、重庆市教委研究项目 (KJ1403203) 。
摘要:本文主要介绍了Wilson提出来的基于张量网络表述的数值模拟算法——数值重整化方法。按照Wilson对Kondo模型的数值重整化思想, 以在Kondo模型为例, 来说明数值重整化方法可以来研究系统的不动点以及其它许多量子杂质模型的热力学性质, 从而来说明实验上的高温超导材料发现的反铁磁可能对超导的形成具有关键的作用。
关键词:重整化,Kondo,超导
参考文献
[1]K.G.Wilson, P.J.Grout, J.Maruani, B.G.Delgado, and P.Piecuch.Frontiers in Quantum Systems in Chemistry and Physics[J].Theor.Chem.Phys., 2008, 18
[2]K.G.Wilson.The renormalization group:Critical phenomena and the Kondo problem[J].Rev.Mod.Phys, 1975, 47.
[3]H.R.Krishnamurthy, J.W.Wilkins and K.G.Wilson.Renormalization-group approach to the Anderson model of dilute magnetic alloys[J].II.Static properties for the asymmetric case.Phys.Rev.B, 1980, 21.
数值化分析 篇2
在分析云微物理参数化对云结构和降水特征的影响的基础上,研究云微物理参数化过程对台风“云娜”强度与路径的影响.结果表明:云微物理过程对台风强度和路径有一定影响,其中不考虑雨水蒸发冷却效应后,比其他试验最终地面最大风速强7 m/s以上,但此时登陆地点误差最大,与对照试验偏离150 km左右.我们还从螺旋雨带结构变化及环境风切变影响角度分析台风临近登陆时强度模拟减弱的原因,发现过强的`外围螺旋雨带以及环境风场垂直切变对于台风的加深、维持是不利的,他们可能会造成“云娜”临近登陆时强度的下降.不难看出,云微物理过程可以加强甚至产生外螺旋雨带,当外围雨带发展加强之后,可以引起局地辐合强度增强,从而限制了大量水汽和能量向台风内核输送,从而会导致台风强度下降.此外,外围螺旋雨带的发展,还可以从对流层中层带来干冷空气入侵行星边界层;而当入流边界层中雨水下落时,其自身的蒸发也会使周围气块温度下降;这些干冷气团在入流气流的输送下进入台风内核,从而对云墙产生了“冷侵蚀”,最终引起台风强度下降.因此,减小上述两方面的模拟误差,应能改进台风“云娜”登陆过程中强度的模拟效果.
作 者:程锐 宇如聪 徐幼平傅云飞 CHENG Rui YU Rucong XU Youping FU Yunfei 作者单位:程锐,徐幼平,CHENG Rui,XU Youping(中国科学院大气物理研究所LASG,北京,100029;中国科学院研究生院,北京,100049)
宇如聪,YU Rucong(中国科学院大气物理研究所LASG,北京,100029)
傅云飞,FU Yunfei(中国科学技术大学,合肥,230026)
数值属性离散化方法研究 篇3
关键词:数据挖掘,关联规则,离散化
0 引言
以前,在机器学习领域中,离散化处理通常被当作一种边缘性的辅助工作而没有受到应有的重视,直到近年来随着知识发现和数据挖掘的迅速发展才引起人们的关注。现实世界的许多应用中常常涉及连续的数值属性,目前许多的机器学习算法却要求所处理的属性为离散值。随着机器学习和数据挖掘研究的发展,已经发展了很多处理离散型数据的算法,如决策树、关联规则等等。对于连续型数据,则需要进行离散化处理。人们认识到为了能够处理这些现实问题,必需对连续的数值属性进行离散化处理,使其转变为离散属性。因此,离散化[1]问题得到了广泛和深入地研究,多种离散化算法被提出来。
1 数据挖掘及关联规则概述
数据挖掘[2]技术可以帮助人们从大量的数据中智能地、自动地抽取隐含的、事先未知的、具有潜在价值的知识或信息。目前,数据挖掘不仅被许多研究人员看作是数据库系统和机器学习方面的一个重要研究课题,而且被许多产业界人士看作是一个能带来巨大回报的重要领域,从数据库或数据仓库中挖掘出来的规则和知识可以用在信息管理、查询响应、决策支持、过程控制等许多方面。
关联规则挖掘是数据挖掘中的最活跃的研究方向之一,它是由RakeshAgrawal等人首先提出的重要的KDD研究课题,它反映了大量数据中项目之间有趣的关联或相关联系。关联规则也称为关联模式,是形如X※Y的逻辑蕴涵式其中X和Y是关于数据库中属性取值的判断。其任务是在给定的交易或事物数据库中,发现所有的频繁关联规则。
2 数据离散化
所谓离散化就是把连续属性的取值范围或取值区间划分为若干个数目不太多的小区间,其中每个区间对应着一个离散化的符号。离散化的一个不足之处是可能降低发现的知识的精确度,因为离散化过程如同其他汇总小结过程一样,可能会导致某些相关信息的丢失。对于不同的离散化算法,没有一个绝对的性能评价标准,一个离散化算法的性能应与应用它的分类算法的总体性能统一起来来衡量。虽然对于离散化算法没有统一的衡量标准,但是也要遵循原则:离散化后属性的结果尽可能的简单,即离散后的断点区间尽可能少;离散化处理应该尽可能保证经过离散化处理后所得到的数据集的一致性与原始数据集的一致性接近。
3 离散化方法(DRST)
DRST(Discretization based on Rough Set Theory)方法是以粗糙集合理论为基础的,粗糙集理论是波兰学者Pawlak于1982年提出的一种处理模糊、不确定知识表达、学习及归纳的数学工具,它已广泛在人工智能、知识与数据发现、模式识别与分类、不精确数据的分析推理和发现潜在知识、数据挖掘等方面得到了较为成功的应用。下面简单介绍一下与本方法有关的几个概念。
3.1 决策表的定义
决策表(也称决策信息系统)是一个由四元组T=构成的知识表达系统,其中U是对象的集合,也称为论域。R=C∪D,是属性的集合,子集C和D分别被称为条件属性集和决策属性集。,其中Vr表示属性r∈R.f:U×R→V是信息函数,它指定U中每一个对象的属性值。决策表的一般形式如下表1所示:
3.2 决策表的一致性定义
其中POSc(D)为D的C正域,表示论域U中所有根据分类U/D的信息可以正确地划分到D的等价类中去的对象集合,C-X为X的下近似集。关于正域和下近似集的概念可以查看参考文献[3]。
3.3 区间类信息熵的定义
根据粗糙集理论的知识,提出区间类信息熵的概念,用来度量属性区间离散化的效果。某个属性中第i个区间Ii的区间类信息熵的定义如下:
其中k为类别个数,Ri为第i个区间中实例的个数,Cij为第i个区间中类别为j的实例个数。区间中的类别越混杂,该区间的类信息熵就越大,离散化的效果就越差,当该区间只包含一个类别的实例时,其类信息熵为0,达到最小,离散化的效果就越好。
3.4 离散化算法
众所周知,最基本的离散化算法是等宽离散化的方法,但是这种方法有个显著的缺点就是很大程度上受到人为因素的影响,简单的说就是不清楚应该划分成几个断点更为合适。根据粗糙集中决策表的定义以及区间类信息熵的概念,在这个基础上本文采用了一种新的方法DRST,这种方法不受人为因素的影响,更合理、更科学。算法具体过程描述如下:
输入:原始决策表T
输出:离散化后的决策表T1
Step1:
(1)计算T的LC设定区间类信息熵的阈值ε。
(2)统计T中属性Ci的取值情况,放入变量m中。
(3)依据Ci的取值情况把Ci分成m个断点区间,区间中属性值相同。
Step2:
(1)合并所有相邻、区间类信息熵为0区间属性类别相同的断点区间。
(2)计算断点区间的区间类信息熵,找出信息熵最小不超过ε的区间。
(3)重复上一步直到找不出可以合并的区间。
(4)对离散化后的属性值进行编号,计算出T1的Lc。
3.5 算法分析
为了验证此算法的有效性,本文对某个班中8个学生的2次英语成绩数据进行测试,条件属性就是这两次的成绩,决策属性是否达标,1表示达标,0表示不达标。原始决策表如表2所示:
通过对表2数据分析,易知两个条件属值之间不存在条件属性权重差异,决策属性只有一个D,因此容易得出区间类信息熵与区间内类的比重关系,为了保证区间离散化的效果,使类别差异不超标(<=90%),对应的类信息熵的阈值ε=0.47,类的比重分别是6∶94,7∶93,8∶92,9∶91,10∶90对应的信息熵值分别是0.33,0.37,0.40,0.44,0.47。
依据得到的阈值使用DRST算法对T进行离散化,得到T1,使用等宽离散化算法(人为给定断点区间数目是4)得到另一个决策表T2,数据分别如表3,表4所示:
连续属性离散化实际上就是把连续的属性值划分成若干个断点区间,此离散化步骤的目标是在尽可能保持原数据类别信息的前提下找出具有实用性和科学性的区间,从表中可以看出DRST划分的区间更细分别是6和5,等宽算法划分的区间粗糙都是4,然而过少的断点区间很可能丢失很多类别信息,对决策属性产生影响,这一点可以通过计算T1的LC=0.91和T2的LC=0.83可以得到。
4 结束语
随着各种理论的出现,很多学者和专家提出了各种离散化算法,应用在各种类型数据的处理,其中基于统计学的ChiMerge[4]和StatDisc算法应用很广泛。本文提出的算法相比等宽算法有优越性,但是在处理多种属性时,尤其是属性间权重不同时,又存在不足之处。总之,要结合具体的情况来处理问题,找出更科学、更有效的离散化方法。
参考文献
[1][加]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,等译.北京:机械工业出版社,2001(8).
[2]朱玉全,杨鹤标,孙蕾.数据挖掘技术[M].南京:东南大学出版社,2006.
[3]王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001.
数值分析课程实验报告 篇4
实验名称 用二分法和迭代法求方程的根
成绩
一、实验目的
掌握利用二分法以及迭代法求方程近似根的方法,并学会运用 matlab 软件编写程序,求解出方程的根,对迭代法二分法进一步认识并灵活运用。
二、实验内容
比较求方程 5 0xx e 的根,要求精确到小数点后的第 4 位 1.在区间[0,1]内用二分法; 2.用迭代法1/5kxkx e,取初值00.25 x .三、算法描述
1、二分法:二分法是最简单的求根方法,它是利用连续函数的零点定理,将汗根区间逐次减半缩小,取区间的中点构造收敛点列{ }来逼近根 x.2、迭代法:迭代法是一种逐次逼近的方法,其步骤是首先给定一个粗糙的初始值,然后用一个迭代公式反复修正这个值,知道满足要求为止。
四、实验步骤1、二分法:
(1)计算 f(x)在区间[0,1]端点处的值 f(0)和 f(1)的值;
(2)计算 f(x)在区间【0,1】的中点(0+1)/2=1/2 处的值 f((a+b)/2);
(3)如果函数值 f(1/2)=0,则 1/2 是 f(x)=0 的实根,输出根 x,终止;否则继续转(4)继续做检验。由于 f(1/2)≠0,所以继续做检验。
(4)如果函数值 f(0)* f(1/2)<0,则根在区间[0,1/2]内,这时以 1/2 代表 1;否则以 1/2 代表 0;,此时应该用 1/2 代表 1.(5)重复执行(2)(3)(4)步,直到满足题目所要求的精度,算法结束。2、迭代法
(1)提供迭代初值25.00 x;(2)计算迭代值)(0 1x x ;
(3)检查|0 1x x |,若 | |0 1x x,则以1x代替0x转(2)步继续迭代;当 | |0 1x x时
终止计算,取作为所求结果。
五、程序
(1)二分法程序:
function y=bisection(fx,xa,xb,n,delta)
x=xa;fa=5*x-exp(x);
x=xb;fb=5*x-exp(x);
disp(“[
n
xa
xb
xc
fc
]”);
for i=1:n
xc=(xa+xb)/2;x=xc;fc=5*x-exp(x);
X=[i,xa,xb,xc,fc];
disp(X),if fc==0,end
if fc*fa<0
xb=xc;
else xa=xc;
end
if(xb-xa) end (2)迭代法程序: function y=diedai(fx,x0,n,delta) disp(“[ k xk ]”); for i=1:n x1=(exp(x0))/5; X=[i,x1]; disp(X); if abs(x1-x0) fprintf(“The procedure was successful”) return else i=i+1; x0=x1; end end 六、实验结果及分析 (1)二分法: 实验结果如下: [ n xa xb xc fc ] 1.0000 0 1.0000 0.5000 0.8513 2.0000 0 0.5000 0.2500 --0.0340 3.0000 0.2500 0.5000 0.3750 0.4200 4.0000 0.2500 0.3750 0.3125 0.1957 5.0000 0.2500 0.3125 0.2813 0.0815 6.0000 0.2500 0.2813 0.2656 0.0239 7.0000 0.2500 0.2656 0.2578 --0.0050 8.0000 0.2578 0.2656 0.2617 0.0094 9.0000 0.2578 0.2617 0.2598 0.0022 10.0000 0.2578 0.2598 0.2588 --0.0014 11.0000 0.2588 0.2598 0.2593 0.0004 12.0000 0.2588 0.2593 0.2590 --0.0005 13.0000 0.2590 0.2593 0.2592 --0.0001 14.0000 0.2592 0.2 593 0.2592 0.0002 15.0000 0.2592 0.2592 0.2592 0.0001 依据题目要求的精度,则需做二分十四次,由实验数据知 x=0.2592 即为所求的根 (2)迭代法: 实验结果如下: 【数值化分析】推荐阅读: 耦合数值分析10-15 数值模拟分析07-01 数值分析课程10-30 FLUENT数值分析09-07 Matlab数值分析09-23 地震响应数值分析11-21 数值分析期末试卷11-11 非线性数值分析12-05 北航数值分析大作业06-27 数值分析完整实验报告07-07