计算方法预测

2024-08-30

计算方法预测(精选9篇)

计算方法预测 篇1

0 引 言

microRNA(miRNA)是一类长度约为19~24个核苷酸的小分子单链RNA。其产生过程如图1所示,MIRNA基因首先在RNA聚合酶Pol II的作用下转录成初始转录本(pri-miRNA),之后经Drosha、Dicer酶等逐步剪切形成miRNA前体(pre-miRNA),再进一步切割形成双链复合体(miRNA/miRNA*),最后解链产生出成熟体miRNA[1]。其成熟体miRNA能够通过碱基互补配对的方式识别靶基因(mRNA),并降解或者抑制后者的翻译,从而对基因进行转录后的表达调控。

自1993年第一个miRNA -lin-4在线虫中被发现以来,miRNA就成为了生物信息学的一个重要研究方向。截止至2011年12月,miRBase[2]数据库已经收录了18226条前体miRNA序列、21643条成熟体miRNA序列。最近的研究表明, miRNA参与生物体内多种调控路径,包括发育、器官形成、细胞增殖和凋亡等[3]。因此准确识别miRNA进而了解其相关生物功能都具有重要的意义。

早期的miRNA识别方法主要都是依赖直接克隆测序,这些传统的实验验证方法比较简单,但是有一定的局限性。它们只能检测具有一定表达量的miRNA,而很难发现那些表达量较低或者表达水平具有时空特异性的miRNA[3]。

近年来,计算预测miRNA的方法逐渐增多,开辟了miRNA发现的新途径。通常这些方法主要分成两类:基于同源性比较和基于机器学习的方法。同源性比较的方法一般是结合序列相似性和结构相似性去寻找在相同或者相似基因组中保守的miRNA,这种方法较难发现一些非保守或保守性不够高的miRNA。而机器学习的方法一般是通过构造一些高质量的训练样本,并提取精确的相关特征,从而训练分类器对miRNA进行预测。它的主要缺点在于准确性还不够高,假阳性样本可能较多,这样就为之后的生物验证增加了困难。

随着高通量测序方法的迅猛发展,产生了大量的基因组数据和RNA数据。之前的同源性方法和机器学习的方法已经难以满足从大规模数据中预测发现miRNA的需求,因而出现了一些基于高通量测序数据的miRNA预测方法。

本文主要总结了上述基于同源性、机器学习、高通量测序的三类计算预测miRNA的方法,分别介绍其原理和优缺点,并对未来的发展方向作出了相关探讨。

1 计算预测miRNA方法

1.1 基于同源性比较的方法

miRNA的一个重要的特性就是其前体可以折叠成发夹结构,且具有较低的最小自由能[3]。研究表明,miRNA在进化过程中是比较保守的,因此miRNA会在进化关系相近的物种之中保守出现。基于同源性比较的方法就是利用miRNA的上述特性,其中较成功的方法有MiRscan[4]、miRseeker[5]和miRFinder[6]等。该类方法主要原理是:给定一些已知的miRNA前体序列,根据序列相似性或结构相似性在相同或者相近的基因组中寻找同源片段,从而发现新的miRNA。

2003年文献[4]提出了MiRscan方法,首先寻找在C.elegans和C.briggsae基因组中都保守的长度约为110个碱基的发夹结构片段,通过对文献[7]中给出的50个已知的保守miRNA进行训练后,再对那些发夹结构片段进行打分,进而选取在序列和结构上的具有较高相似性的片段。利用这个方法,他们发现了35个新的线虫miRNA,其中16个得到了实验验证。文献[8]除了考虑MiRscan中用到的结构相关特征外,还增加了描述miRNA基因上游序列的保守模体特征,这样在线虫中又找出了9个新的miRNA。

此外,miRNA的结构和功能在进化距离较远的物种间都是具有一定的分歧的。结合这个特性,文献[5]中的miRseeker方法首先找出在D.melangaster和D.pseudoobscura中的同源片段,再根据碱基配对、最小自由能和内部环(bugle)等对待测片段进行打分。利用该模式,他们在进化距离较远的物种(如昆虫和脊椎动物等)中发现了48个新miRNA,其中24个得到了实验验证。

基于序列和结构特征相似性提出的同源性比较的方法,是最早采用的计算发现miRNA的方法。它们可以找到很多具有高度保守性的miRNA,但是对那些保守性不高或者非保守的miRNA显得有些力不从心。另一方面,为了提高方法的可靠性,在搜索筛选miRNA时标准一般都过于严格,也因此会漏掉一些真实的miRNA。

1.2 基于机器学习的方法

基于机器学习的方法是目前最流行的miRNA预测方法[9]。与同源性比较的方法不同,这类方法通常同时需要已知的miRNA及非miRNA两类样本,通过选取特征、构造正负样本来训练分类器,然后对未知序列进行预测分析[10]。通常用到的机器学习的方法有支持向量机[11,12,13,14]、隐马尔可夫模型[15]、随机森林[16]和贝叶斯分类器[17]等,其中在构建分类器时可以选取的特征主要包括三种:一级序列、二级结构以及热力学相关的特征。

支持向量机(SVM)是目前最多的用来预测miRNA的方法。2005年文献[11]基于RNAfold[18]折叠成的二级结构,统计连续碱基配对和中间位置的碱基类型,提出用32个三联体结构-序列特征来描述样本的triplet-SVM方法。其训练集正样本是已知的163个人类miRNA,而负样本是从人类基因组蛋白质编码区域随机选取的168个能够折叠成发夹结构的片段。实验测试集是30个已知的miRNA以及1000个从蛋白质编码区域随机选取的发夹结构片段,该分类器的预测敏感性和特异性分别为93.3%和88.1%。同样基于人类miRNA数据集,文献[12]在2007年提出了采用碱基含量、碱基配对个数及自由能等29个特征的miPred方法,其训练集为200个已知的miRNA和400个非miRNA序列。这个分类器训练所采用的负样本的数量是正样本的两倍,因此倾向于提高分类器预测的特异性,而降低敏感性。结果显示,该方法预测敏感性降低到84.55%,而特异性提高为97.97%。在miPred的29个特征基础上,2009年microPred[13]新加了19个自由能、碱基配对等结构相关的特征,并且在负样本中加入了一些非编码小RNA分子(如tRNAs、snoRNAs等)来训练分类器,使得预测的miRNA具有更高的可靠性。该分类器的敏感性和特异性分别为90.02%和97.28%。

文献[16]采用了随机森林来构建分类器MiPred。其训练样本与triplet-SVM[11]方法相同,特征集除了32个三联体特征之外还增加了最小自由能和由RANFOLD[19]计算得到的自由能随机检验P值。该方法在测试集上敏感性为89.35%,特异性为93.21%,表现优于triplet-SVM[11]。

此外,朴素贝叶斯分类器也被应用于miRNA预测,其中最具代表性的是文献[17]提出的BayesmiRNAfind。由于之前的一些分类器的训练样本较少,只是在单个基因组或较少的相近基因组上选取,预测效果受负样本选择的影响较大,因此健壮性不够好。因此该方法从人类、小鼠、果蝇和线虫等多个物种中提取了1420个miRNA作为正样本,同时选取了30000个保守的茎环结构的片段作为负样本来训练分类器,并结合一些序列和结构特征的过滤筛选,在贝叶斯分数阈值设为0.99时成功预测了53个小鼠基因组中的miRNA。

自2008年开始,高通量测序技术近几年得到了蓬勃的发展,因此出现了一些基于小RNA数据的miRNA预测方法,而传统的机器学习预测方法正在逐渐减少。近年来还是有针对之前预测方法的改进方法出现,它们的做法大都是考虑通过增加新的特征、或者采用新的特征、样本选择方法等来提高算法的预测准确性。

2011年文献[14]提出了基于支持向量机的预测植物miRNA的方法PlantMiRNAPred,其中大部分特征来自triplet-SVM[11]以及microPred[13],此外还新增了两个自由能特征和一个碱基配对的特征。一方面,考虑到特征之间的冗余性,它采取了信息增益及特征相似度的标准选取了68个特征。另一方面,考虑到非均衡的正负样本集合对预测结果的影响,论文根据样本的分布选择了具有代表性的980个相同数目的正负样本。在植物miRNA预测中,该分类器准确率比triplet-SVM和microPred分别高出22.19%和5.19%,而特异性分别高出12.25%和4.98%。

基于机器学习的方法主要是在一代测序的技术上发展起来的,处理的也都是较长的前体序列。这类方法的优点在于能够快速的找出可能的miRNA前体序列,但缺点是很难预测成熟体在前体上的具体位置,而真正跟靶基因结合起到调控作用的恰巧是成熟体miRNA。另外,纯计算的方法预测准确率还不足够高,可能会产生较多的假阳性样本,这样就为生物实验验证带来了困难。

1.3 基于高通量测序的方法

伴随着二代测序技术(如Illumina, SoLiD, Roche/454)不断被推广和发展,产生了大量的小RNA测序数据,它们开辟了识别miRNA的新途径。然而高通量数据中包含大量的其他小RNA数据(如siRNA, tRNA等)或者一些大分子的降解片段,如何快速高效地从中发现真正的miRNA成为一个新的极具挑战的课题。

目前,基于高通量测序数据的miRNA发现方法大致流程比较相似,基本上都是先利用序列比对工具如BLAST[20]、PatMaN[21]和Bowtie[22]等将测序片段比对到已知的基因组上,再根据基因组注释数据(如rRNA、tRNA、siRNA和snoRNA位点等)筛选候选的区域,候选的区域如果进一步满足序列和结构相关特征则会被标记为miRNA前体。与基于机器学习的方法不同,这类方法可以准确地找到miRNA成熟体,其困难在于如何准确界定miRNA的前体。

研究认为,在miRNA产生过程中,Dicer酶切割的位置不是随机的,而是比较固定的,所以产生的miRNA、miRNA*,以及环片段的位置和频数也有一定的规律性[23]。因此,2008年文献[24]对测序片段与miRNA产生过程的符合程度进行综合打分,提出了一个基于概率模型的预测方法miRDeep。该方法可以根据概率来估计假阳性样本的比例,从而提供一个对预测结果质量的评价指标。预处理过程如下:(1) 首先用BLAST[20]将测序数据比对到基因组上,得到一个全基因组的小RNA分布;(2) 借助已知的基因组注释信息剔除掉一些匹配到rRNA、tRNA、scRNA等非miRNA位点的片段;(3) 依据碱基配对信息及是否可以形成发夹结构等特征,筛选得到候选的前体序列。接下来就是miRDeep的核心算法,对候选前体序列与miRNA的产生过程的吻合性进行打分,综合考虑:(1) miRNA、miRNA*及环区片段在前体序列上位置及频数;(2) 前体序列的最小自由能及稳定性;(3) 成熟体5’端的片段与已知的miRNA的相似性等。miRDeep在线虫、人类和狗的基因组上发现了约230个新的miRNA,其中线虫的4个新miRNA已经通过了实验验证。此外,真涡虫样本上的实验显示,在没有借助基因注释信息的情况下,miRDeep仍然达到了86%的敏感度,16个新发现的miRNA通过了实验验证,其中7个在其他相邻物种中还没有发现同源基因。2011年,文献[25] 在miRDeep基础上提出了miRDeep2,在时间效率和内存分配都有很大的改进。一方面它在寻找候选前体序列时,对基因组的两条链分开扫描,以便于发现反义链上的miRNA。另一方面,高通量测序技术在实际使用中是存在测序误差的,miRDeep在比对测序片段至基因组时只允许精确的匹配,而miRDeep2则支持一个或多个位置的碱基错配。它在预测动物miRNA时准确率为98.6%-99.9%,并且发现了100多个新的miRNA。鉴于miRDeep和miRDeep2主要是用于预测动物的miRNA,文献[26]提出了针对植物miRNA预测的miRDeep-P。该方法采用了短序列比对效果更好的Bowtie[22],将片段匹配到基因组上的最大位置上限从5个修改为15个,同时将候选前体序列的长度从100个碱基修改为250个碱基。此外,由于植物的前体序列更长,折叠形成的二级结构的自由能比动物低,因此在打分时,miRDeep-P对自由能采取一定的量化处理。最后对打分后的miRNA根据已有的植物miRNA的特征[27]进行筛选处理。他们在拟南芥数据集中找到了90个已知的miRNA和18个新的miRNA,其中5个通过了实验验证。

2010年,MiRTAP[28]在miRDeep基础上新增加了一个步骤:根据反义链或者邻近区域的小RNA读长分布来筛除掉一些假阳性的miRNA。在海鞘数据集上,MiRTRAP共预测了446个miRNA可能的位点,通过二级结构等手工筛选掉了84个假阳性样本,假阳性比率大概占19%。另外,miRTRAP还在海鞘中找到了一些保守的miRNA基因(如miR-8等),这些在以前的研究中是没有被发现的。对果蝇数据集的对比测试显示, miRDeep发现了109个miRNA,敏感性为71%,而miRTRAP发现了134个,敏感性为90%。

文献[29]针对动物和植物提供了两个不同版本的miRNA预测工具miRCat。该方法采用PatMaN[21]比对短序列片段,利用基因组注释信息筛选位点,分析基因组上小RNA分布模式来获取候选前体序列,再根据二级结构、碱基配对数量、自由能及自由能随机检验P值[19]等进一步筛选最终得到预测的前体序列及成熟体序列。miRCat在拟南芥叶子数据集中发现了89个位点,其中6个是新的位点,敏感性和特异性分别为91.2%和 99.93%。

除此之外,尝试结合传统的机器学习方法(如随机森林[30]和朴素贝叶斯分类器[31]),来从高通量测序数据中发现miRNA,也成为miRNA预测方法的新亮点。2009年文献[30]提出miRanalyzer方法,在将测序片段比对到基因组后,剔除掉那些与miRBase[2]中成熟体、前体序列等匹配的片段,以及与Rfam[32]等数据库中的其他非编码小分子匹配的片段。最后对筛选得到的片段提取碱基序列、结构和自由能等特征,并根据信息增益等选择对分类结果具有最大区分度的十个特征。该方法从人类、老鼠和线虫中选取等量的正负样本,构建了随机森林分类器,敏感性和特异性分别为79%和99.3%。2011年他们提出了改进的版本[33],采用了不同的负样本集训练了5个随机森林分类器。最终预测的miRNA序列必须至少3个分类器中都被预测为miRNA,这样通过投票机制预测的miRNA在可靠程度上有了一定的提高。PIPmiR[31]方法则首次尝试将朴素贝叶斯分类器引入到基于高通量测序数据的植物miRNA预测中。它先用Bowtie[22]将测序数据比对到基因组上,寻找候选的成熟体序列,然后向基因组上下游各延伸50至500个碱基得到候选前体序列。构建的贝叶斯分类器采用了包含GC含量、自由能、碱基配对在内的15个特征,并对连续特征做了离散化处理。实验数据取自于拟南芥,分类器训练用的正样本为二代测序检测到的144个已知miRNA,负样本为取自基因间或者内含子区域的能折叠成发夹结构的42916个片段,四倍交叉检验结果显示,该方法敏感性为91.7%,而特异性为99.9%。而在特异性为99.9%时,miRCat[29]敏感性只有78%。PIPmiR在拟南芥根中发现了183个新的miRNA,其中有29个依据植物miRNA的注释标准[27]可以不需要实验验证而直接注释为miRNA,另外有8个已被生物实验证实。

基于高通量测序技术来预测miRNA,不仅可以找出前体序列,也可以非常快捷准确地找到成熟体序列。但是在实际应用中这类方法也存在着一些比较棘手的问题。首先它需要全基因组信息来比对短序列片段,因而不适用未测序的物种。其次高通量测序技术存在一些测序错误,这样在比对到基因组时具有一定的模糊性,对miRNA预测也有一定的影响。另外,在整个预测miRNA的过程中,部分参数是根据经验设定的,缺乏有力的理论依据,也没有达成共识。

2 总结与展望

miRNA自从被发现以来,就一直是生物研究领域内的一个具有挑战性的研究热点。miRBase[2]数据库记录了大量已知的miRNA,其中通过传统实验方法发现的只占很少一部分,其余绝大多数是通过计算方法预测得到的。研究预测miRNA的方法可以帮助我们进一步揭示miRNA的奥秘,推动miRNA功能相关的研究。同时这些预测方法也可以为预测其他非编码小RNA提供可借鉴的思路。

在传统的一代测序基础上,miRNA计算预测的方法主要分为基于同源性和机器学习两种。基于同源性的方法依赖的是miRNA在相同或相近物种之间的序列和结构的相似性,因而找出的大多是保守性的miRNA,对于非保守性的miRNA则几乎无能为力。而机器学习的方法从一个新的角度去探讨了这个问题,它通过构建一些高质量的miRNA正负样本来训练分类器以预测新的miRNA。但是该类方法通常存在着正负样本的不均衡的问题,准确率不够高,并且假阳性样本有可能过多。此外,它们只能预测前体序列,而不能预测精确的成熟体序列。而真正在于把基因结合起调控作用的正是成熟体序列,所以迫切需要一种方法来预测发现成熟体序列miRNA。

高通量测序技术的发展为miRNA预测提供了一个全新的思路,一些基于二代测序的miRNA预测方法逐渐被实际应用,如miRDeep、miRCat等。它们不仅能够预测前体序列及其二级结构,还能找出成熟体序列,并且在敏感性上有了较大的提高。但是高通量测序技术也存在测序误差,并且物种基因也存在单位点突变的可能性,因此对miRNA预测会产生一定的影响。同时在预测miRNA的过程中各方法中对于自由能或碱基配对等一些参数的设置不是基于一个通用的标准,选择不同的参数对实验结果的影响比较大。随着测序精度的提高,新的计算预测方法或新特征的提出,以及有效地对现有的方法进行整合,miRNA的预测将会有更加高的精确度。

此外,第三代测序技术[34]已经进入了实验室研究阶段,它测序得到的片段更长、数目更多,并且消耗成本更低。如何改进已有的算法以及开发出新的算法来适应三代测序以预测miRNA将会成为今后研究的方向。

摘要:microRNA(miRNA)是一类内源性、长度为19-24个碱基的非编码小分子RNA。它在调控动植物的基因表达、生长发育等方面起着重要的作用。现阶段寻找miRNA的方法主要分为实验方法和计算预测两大类,其中,实验的方法很难测定表达量偏低或者特异表达的miRNA,也不适合进行基因组范围的发现。而计算预测的方法则恰好可以弥补这些不足。总结近几年计算预测miRNA的方法,归纳为三类,分别是基于同源性比较的方法、基于机器学习的方法和基于高通量测序的方法。最后对miRNA计算预测方法未来的发展方向作出了探讨。

关键词:microRNA,计算方法预测,同源性比较,机器学习,高通量测序

计算方法预测 篇2

1、下列说法中错误的是( B )

A、“页面设置”命令项位于“文件”菜单下

B、“页面设置”对话框中有4个选项卡

C、“页面设置”选项可以进行垂直对齐方式的设置

D、“页面设置”通常是篇文档,也可以是插入点之后的文档

2、对文档进行页面设置时将插入点置于( C )

A、开头

B、结尾

C、文档中

D、行首

3、在WORD中, 要为文档的某一部分设置不同的页边距,下列可以省略不做的步骤有( D )

A 、选定要设置不同页边距的文档

B、单击“文件”菜单中“页面设置”命令

C、在“页面设置”对话框中,从应用范围列表选择选取的文本选项

D、将插入点置于选定的文档中

4、在WORD中,关于页码叙述错误的是( C )

A、对文档设置页码时,可以对第一页不设置页码

B、文档的不同节可以设置不同的页码

C、删除某页的页码、将自动删除整篇文档的页码

D、只有该文档为一节或节与节之间的连接的没有断开。

5、下列说法中错误的是( C )

A、插入页码时可以将页码插入文档页面的左下方

B、插入页码时可以将页码插入文档页面垂直居中的地方

C、插入页码时都是从首页开始的

D、插入页码可以有选择的从后面的页面开始

6、下列说法中正确的是( D )

A、“页码”选项位于“格式”菜单下

B、设置完毕后单击“插入”按钮即可将所设置的页码插入文档

C、在“页码”对话框中没有“格式”按钮

D、设置的页码并非都是从1开始的

7、在WORD的编辑状态,为文档设置页码,可以使用( D )

A、“工具”菜单中的命令

B、“编辑”菜单中的命令

C、“格式”菜单中的命令

D、“插入”菜单中的命令

8、在WORD文档中,插入分页符的快捷键是( B )

A、Shift+Enter

B、Ctrl+Enter

C、Alt+Enter

D、Alt+Shift+Enter

9、关于WORD 中的分页符和描述,错误的是( C )

A、分页符的作用是分页

B、按Ctrl+Enter可以插入一个分页符

C、各种分页符都可以选择中后按Del键删除

D、在“普通视图”方式下分页符以虚线显示

10、在“分栏”对话框中的“预设”选项下可供选择的分栏类别有( C )

A、3种

B、4种

计算方法预测 篇3

近年来,随着电网的快速发展和强对流天气的增多,雷害故障频繁发生,雷击成为中国输电线路安全可靠运行的主要危害。如2009年7月的某大型水电站近区电网500kV双回线路遭受雷击相继跳闸,造成水电厂切机甩负荷;2009年8月浙江某变电站220kV线路遭遇多重雷击,开关断口被击穿,造成设备损坏、220kV母线失电。根据电网故障分类统计,在高压线路的总跳闸次数中,由雷击所引起的跳闸次数占40% ~70%[1],尤其是在多雷、土壤电阻率高、地形复杂的地区,雷击输电线路所引起的跳闸率更高。因而若能实现对电网雷击跳闸概率的预测、分析,并进而形成相应的预警系统,对增强电网抵抗因雷击所引起的故障具有重要意义。

若要进行电网的雷击跳闸概率预测和分析,首先需要实现对雷电发生范围的预报,进而预测雷电分区内输电线路雷击跳闸概率。

对于雷电发生范围的预测,涉及许多其他气象及自然环境因素,且其发生及消失过程非常快,如何进行准确预报一直是气象预报领域的热点课题之一。文献[2]提出了基于雷达回波信息的雷暴识别、追踪、分析和临近预报系统(TITAN)。文献[3]在此基础上,进一步提出了雷暴单体识别追踪(SCIT)算法,为下一代气象雷达(WSR-88D)的雷达回波信息识别设置了多个阈值,增强了对雷暴单体的识别能力。文献[4]考虑到雷暴气象生消时间短、变化快的特点,将临近预 报点的时 空分辨率 设定在0.5km-1min,以提高预报的准确度。文献 [5]则提出利用连续3个时次的雷电统计数据代替连续2个时次的统计数据进行分析,考虑了雷区发展的非线性变化,增加了雷区预测的准确度。

雷击对于电网运行的影响,以及雷击引起电网跳闸率的预测和分析,不少专家和学者对此进行了有意义的研究和探索。文献[6]基于有限的数个严重雷暴事件及相关的其他气象数据和电网故障数据,采用数理统计分析,建立了雷暴引起的电网故障率回归模型;但由于雷暴事件比较少,且事件之间间隔比较长,故基于此所建立模型的推广性有很大的局限性。文献[7]对比了基于实测落雷密度的雷击跳闸率预测与基于规程落雷密度的理论雷击跳闸率预测准确度的差别,发现由于线路的雷击故障情况时空差异性大,从而使得基于实测落雷密度得到的线路雷击跳 闸率的预 测具有更 高的准确 度。文献[8]基于时变矩阵分析而得到两相邻时段雷电区域的关联关系,并直接预测未来雷电发生区域,进而基于预测雷电区域的预测落雷密度实现线路雷击跳闸率的动态评估,获得了不错的效果;但关联分析法并不适用于临近预报点的时空分辨率较小的情况,另外,该文的线路跳闸率动态评估只考虑了线路的实时落雷情况,而忽略了雷电流强度的影响,因此,其预测准确度还有待进一步提高。

基于上述情况,本文提出基于三时次雷区信息预测的电网雷击跳闸率的预测新方法。首先,根据每个时次的雷电监测信息,基于图像识别技术识别雷电发生区 域;然后,根据当前 时次及之 前的连续2个时次的雷区信息而构成三时次雷区信息,构建雷区移动向量和雷区特性变化量(雷区面积、雷电流强度、雷区落雷概率),用于预报下一时次可能遭受雷击的区域范围;进而,计算位于雷击预报范围内的输电线路 故障概率。 算例证明 了本文方 法的有效性。

1基于三时次的雷电范围预报

1.1基于图像识别技术的每一时次雷电分区识别

对于中国各地电力系统而言,已形成了覆盖绝大部分输电线路通过区域的雷电监测网[9],可取得实时的雷电监测数据,包括雷击发生时间、落雷点位置(经度和纬度)、雷电流和回击次数等参数。

为了方便识别雷电发生范围,首先将监控地域按经纬度方向划分成面积相等的小方格,将其等价于一个2D网格图像,如图1所示。以经纬度方向为横纵坐标建立新坐标系,小方格的边长为单位长度,以小方格右下角点的坐标作为小方格的标记。取方格大小为0.05°×0.05°,以2min为一个统计时间段,将雷电监测系统在相应时间段内统计的落雷点累计到对应的小方格,以便识别出落雷密集区域。

对于如图1所示的网格图像雷电监控地域,本文采用八邻域边界跟踪算法[10]识别出落雷密集区域,统计各区域的落雷信息,并用圆形对于所辨识区域进行整形。具体步骤如下。

1)形成如图1所示的雷电监测信息方格图。

2)根据每一 小方格的 累计落雷 个数n*,按式(1)对每一方格进行二值化(0-1)处理,获得以二值化表示的落雷网格图,如图2所示。

3)对落雷区域进行轮廓提取。落雷区域轮廓提取采用3×3网格的八邻域信息分析方法,其具体过程如下:设点P为落雷区域轮廓上的一个点,则下一轮廓上的点必在P的八邻域内,首先对落雷网格图从左至右、自上而下进行扫描,找到的第1个标记为1的点即为落雷区域左上角的轮廓点,将其作为搜索起点;然后按逆时针方向,自上而下、从左至右,搜索该点的八邻域,找到下一轮廓点;然后以此点为当前点继续搜索,这一搜索过程不断重复,直至回到搜索起点,其流程见附录A图A1。

其中,判断当前点是否为落雷区域轮廓上点的具体方法为:对于以当前点为中心(记为P)的八邻域,其邻域的8个点按逆时针分别记为P0,P1,…,P7,其中P0在P左下方,如图3所示;如果中心点P为1,且它的8个邻域点都是1时,表明当前点P是落雷区域轮廓的内部点,应删除当前点P,并把点P右边的点作为当前点继续按上述方法判断其是否位于落雷区域轮廓上;否则,当前点为落雷区域轮廓上的点。在完成落雷区域轮廓提取之后,其轮廓所包围的区域即为落雷区域。对于每一时次的落雷信息,经过落雷区域识别之后,相应获得多个落雷密集区,如图4中的多个黑实线图所示;图中的红色虚线围成的圆形轮廓即为辨识之后雷区边界。

4)以圆轮廓代替各个雷区的不规则轮廓,作为雷电发生区域,并求取各雷电发生区域的特性参数。根据式(2)至式(4)计算各落雷区域中心点L经纬度坐标(x,y)、各雷区所有落雷点距离相应中心点的最大距离r及各雷电分区的落雷概率q;以L点的经纬度坐标(x,y)为中心、r为半径画圆,即为实际雷电发生区 域。各个圆的 中心经纬 度坐标 (x,y)、半径r和雷电分区落雷概率q为相应雷电分区特性参数,也为当前时次雷电分区的识别结果。

式中:n′为落雷区域内的落雷总数;(xi,yi)为第i个落雷的经纬度坐标;N′为当前时次的落雷总数。

1.2雷电发展轨迹追踪

雷电发展轨迹追踪问题为多目标指派问题,通过对2个相邻时次的雷电分区的最优匹配而找到各个雷区的相应最可能发展轨迹,即为雷区发展的最优轨迹。

为了取得最优轨迹,基于雷区发展的统计分析,可做如下合理假设[2,11]:12个雷区之间较短的移动轨迹具有更大的逻辑可能性;2面积相似的2个雷电分区 间的移动 轨迹具有 更大的逻 辑可能性;3雷电分区的移动轨迹速度应小于实际雷暴移动速度,故根据相邻时次的时间长度确定轨迹长度阈值,去除太长的移动轨迹。

对于图5所示的2个相邻时次的雷区所有移动轨迹,在满足上述假设的前提下,最有可能的轨迹即为最优轨迹。

相邻2个时次的雷电分区数目可能不相同,可能存在雷电分区分裂与融合的现象,即在前一时次的一个雷电分区可能分裂成后一时次的多个雷电分区,或前一时次的多个雷电分区融合成后一时次的一个雷电分区,这些因有轨迹相连的雷电分区为相关联雷电分区。以Xij表示t1时次的第i个雷电分区到t2时次的第j个雷电分区的关联情况,Xij=1表示2个雷区之间有关联,并有轨迹相连;Xij=0表示2个雷区之间无关联,即没有轨迹相连。

如图5所示的连续2个时次t1和t2的多个雷区,t1时次有n1个雷电分区,t2时次有n2个雷电分区。(x1i,y1i)表示t1时次第i个雷电分区的位置,(x2j,y2j)表示t2时次第j个雷电分区的位置。为了求取2个时次所有雷区之间的最有可能轨迹,可建立如下优化模型:

式中:Xij为相邻时次雷电分区关联矩阵Xn1×n2的第i行第j列元素,表示t1时次的第i个雷电分区到t2时次的第j个雷电分区的关联情况;Cij为价值矩阵Cn1×n2第i行第j列元素,表示t1时次的第i个雷电分区到t2时次的第j个雷电分区的变化价值,价值函数值越小表示两雷电分区关联性越强;ω1 和ω2为权重;dp表示雷电分区位置的变化;dA表示雷电分区面积的变化;A1i,A2j分别为t1时次的第i个雷电分区的面积和t2时次的第j个雷电分区的面积。

基于统计分析,雷区的移 动速度可 设定阈值vmax=60km/h[2,11];2个时次的时间间隔为Δt,若dp/Δt>vmax,设定Cij为一个较大的值,使得该轨迹不会成为最佳匹配结果;条件约束式(9)保证了在相邻时次雷区发展过程中,当n1<n2 时,只能有雷区的分裂发生;当n1>n2 时,只能有雷区的融合发生。而对于在相邻时次雷区发展过程中,既有雷区融合又有雷区分裂的最优轨迹的确定,将另文讨论。

对于由式(5)至式(9)所组成的优化模型,本文采用推广匈牙利算法[12,13]求解最优轨迹,具体求解过程如下。

1)计算所有可能轨迹的价值函数Cij,建立价值函数矩阵Cn1×n2,若相邻时次雷电分区数目不相等,则利用0元素,取n=max{n1,n2},将价值函数矩阵补全为价值方阵Cn×n,即

2)设定m=min{n1,n2}。

3)利用标准匈牙利算法进行求解,步骤如下。

步骤1:变换价值方阵Cn×n,使方阵的各行各列均出现0元素。变换原则为:从价值方阵的每行元素中减去该行的最小元素,再从所得价值方阵的每列元素中减去该列的最小元素。

步骤2:从只有一个0元素的行(列)开始,圈出该0元素,记作,然后用直线划去所在列(行)。

步骤3:找到只有一个0元素列(行),圈出该0元素,记作;然后用直线划去所在行(列)。

步骤4:反复进行步骤2,3,直到所有0元素都被标记和划掉为止。

步骤5:判断标记出的数目是否等于m,若相等,转到步骤4,若不等,转到步骤6。

步骤6:调整价值方阵。取出未被直线穿过的数据区中最小元素,该数据区所有元素减去该最小元素,同时直线相交处每个元素加上该最小元素,去掉直线和圈,更新价值方阵,转到步骤1进行计算。

4)获取新价值方阵:当n1>n2 时,取剩余列构成新价值方阵;当n1<n2 时,取剩余行构成新价值方阵,并取m为新价值方阵的行(列)数,转到步骤3。

5)所有n个由圈出的0元素对应的解为所寻求的最优解,对应的轨迹组成最优轨迹。

上述过程的流程见附录A图A2。

1.3雷电发展预测

基于连续2个时次雷电分区的最优轨迹所作的雷电预测只能反映出相邻时次雷电的线性发展,且由于所采样的雷区信息少,其预测精度相对低。而若基于连续3个时次雷电分区最优轨迹所做的雷区发展预测,则可以考虑雷区发展的非线性,同时也因为所采样的雷区信息多,使得其预测精度相对更高。基于此,本文在连续3个时次t-2,t-1,t的雷电分区的最优轨迹计算的基础上,进行雷电分区的预测,如图6所示,根据t-2,t-1时次和t-1,t时次的雷电分区位置及移动轨迹计算雷电分区的移动速度(包括速度大小及方向),从而预测t,t+1时次的雷电分区移动速度,预测t+1时次雷电分区的位置,其预测准确度相对于基于两时次雷电分区的最优轨迹预测更高[5]。

具体步骤如下。

步骤1:利用本文1.1节的方法,识别t-2,t1,t这3个时次的雷电分区。

步骤2:根据步骤1的结果,利用本文1.2节的方法,分别得到t-2,t-1及t-1,t的两时次雷电分区间的各自最优轨迹,根据式(11)至式(14)计算雷电发展的 移动速度vt-2,vt-1及半径变 化系数βt-2,βt-1,如图6所示。

式中:(xt-2,yt-2),(xt-1,yt-1),(xt,yt)分别表示t-2,t-1,t这3个时次的 雷电分区 位置;rt-2,rt-1,rt分别表示t-2,t-1,t这3个时次的雷电分区的半径。

步骤3:按式(15)和式(16)预测从t时次雷电分区到t+1时次每一雷电分区的雷电分区移动向量vt及雷电分区的半径变化系数βt。

式中:vt,βt为t时次雷电分区到t+1时次雷电分区的预测移动速度和雷区预测半径变化系数。

步骤4:按式(17)至式(20)预测t+1时次的每一雷电分区位置(xt+1,yt+1)和雷电分区的特性(包括雷电流It+1、半径rt+1和落雷概率qt+1)。

式中:M为t时次与之相关联的雷电分区数目;It,1,It,2,…,It,M分别为t时次与之相关联的M个雷电分区的雷电流;qt,k为t时次与之相关联的M个雷电分区中第k个雷电分区的落雷概率。

2输电线路的雷击跳闸概率

本文在上述基于在线雷电监测信息实现雷电分区预测、落雷概率预测及雷电流预测的基础上,进一步提出线路雷击跳闸概率的计算新方法。

同一线路上的杆塔之间为可靠性逻辑串联关系,即线路上任一杆塔出现故障则线路出现故障,线路的故障概率等于该杆塔的故障概率,但若多个杆塔存在故障概率,则线路的故障概率应大于所有杆塔故障概率之和。因此,对于有h个杆塔的线路,本文采用如下表达式计算其雷击跳闸概率:

式中:Pline为线路的雷击跳闸概率;h为该线路在雷区内的杆塔数;PiT为第i基杆塔的 落雷概率;Pi为第i基杆塔的雷击跳闸概率,为第i基杆塔的反击跳闸率Pic和绕击跳闸概率Pis的和;PiTPi 为第i基杆塔的雷击跳闸概率。

对于第i基杆塔的落雷概率PiT,本文根据杆塔在雷电分区的位置计算落雷概率;对于第i基杆塔的雷击跳闸概率Pi,本文基于改进电气几何模型及蒙特卡洛模拟方法分别计算绕击跳闸概率Pis和反击跳闸概率Pic而得到Pi。

2.1杆塔落雷概率计算

2011—2013年安徽220kV和500kV线路雷击跳闸故障事件的统计分析表明,引起安徽电网线路跳闸的落雷事件70%发生在距离线路350 m的范围内。因此,本文基于此统计分析,提出了如下的杆塔落雷概率计算方法:认为对安徽电网而言(对于其他电网需要类似的统计分析),对于每个杆塔,以杆塔为中心取垂直线路方向±350m、线路方向1/2档距的区域为杆塔落雷概率计算的有效区域,杆塔的落雷概率等于该区域的落雷概率,如图7所示。

对于第i基杆塔而言,其落雷概率PiT为:

式中:a为第i基杆塔所在雷电分区的面积;a′为第i基杆塔落雷概率计算的有效区域与杆塔所在雷电分区的重合面积,如图7中阴影区域所示;q为第i基杆塔所在雷电分区的落雷概率。

2.2杆塔雷击跳闸概率

雷击跳闸概率P为绕击跳闸概率Ps和反击跳闸概率Pc的总和,见式 (23)。采用电气 几何模型[14,15,16]计算绕击跳闸概率,计算过程考虑了杆塔所处地形及雷电入射角[17]的随机性;应用蒙特卡洛模拟方法[18,19]计算反击跳闸概率,在模拟雷电发生的随机过程中,考虑工频电压对三相线路的影响[20]。

2.2.1绕击跳闸概率计算

电气几何模型如图8所示,通过几何分析,考虑避雷线路、三相线路间的相互屏蔽作用,以屏蔽弧的比率计算得到线路的绕击概率和绕击跳闸概率。通过引入地面击距rg和导线(避雷线)击距rc(rs),而计及了雷电先导对大地和线路击距的差异性;引入地面倾斜角θg和雷电入射角φ来计及地形与雷电入射方向对输电线路的绕击率的影响;对于地面倾斜角,通过旋转坐标系而转化为按雷电垂直入射平原地区的情形进行计算。

具体计算步骤如下。

步骤1:对电气几何模型进行几何分析。通过旋转坐标系转化为按雷电垂直入射平原地区的情形进行计算,如式(24)所示,以暴露弧段的比值计算绕击概率Pα(φ)。

式中:lB′C和lA′C分别为B′,C点和A′,C点间距离。

步骤2:计算绕击率Pα。在实际雷电发生过程中,雷电入射角是随机的,因而通过式(25)引入雷电入射角φ的统计概率密度g(φ)[19],计算绕击率,如式(26)所示。

步骤3:计算绕击跳闸概率Ps,如式(27)所示。

式中:η为建弧率。

2.2.2反击跳闸概率计算

本文采用蒙特卡洛方法来模拟雷击的随机过程,并计及工频电压对三相输电线路雷电跳闸率的影响。具体过程如下。

步骤1:设定模拟次数为N,以yk表示第k次模拟的结果,若反击引起闪络,则yk=1,否则yk=0。

步骤2:计算绕击跳闸概率。在一次雷击模拟中,首先按照2.2.1节所述方法计算出杆塔的绕击跳闸概率。

步骤3:绕击判断。产生一个[0,1]均匀分布的随机数r1,判断是否发生绕击,若r1>Pα,则认为没有发生绕击,转到步骤4,否则yk=0并转到步骤6。

步骤4:反击判断。产生一个[0,1]均匀分布的随机数r2,判断是否发生反击,若r2<g(g为击杆率),则发生反击,转到步骤5,否则yk=0并转到步骤6。

步骤5:反击闪络判断。产生一个[0,1]均匀分布的随机数r3,得到工频相角及三相工频电压瞬时值,然后根据闪络判据判断是否发生反击闪络,发生反击闪络则yk=1,否则yk=0。

步骤6:判断模拟过程是否结束。模拟次数若达到N次则转到步骤7,否则转到步骤3进行下一次模拟。

步骤7:计算反击跳闸概率。N次模拟结束后,如式(28)和式(29)所示,得反击跳闸率的渐进统计估计值ζ,并计算反击跳闸概率Pc。

基于如上计算,一个完整的线路雷击跳闸概率预测的计算框图如图9所示。

3算例分析

3.1雷电分区预报效果

为了评估雷电分区预报的准确性,采用雷区面积检出率 (probabilityofdetection,POD)指标RPOD、雷区面积虚警率(falsealarmratio,FAR)指标RFAR与落雷数 检出率 (lightingdetection probability,LDP)指标RLDP[8,21],如式 (30)至式(32)所示:

式中:E为预报的雷电区域面积;A*为实际的雷电区域面积;A-为实际的非雷电区域面积;E∩A*为预报准确的雷电区域面积;E∩A-为误预报的雷电区域面积;p′为预报的落雷概率;p为实际落雷概率;(E∩A)min{p′,p}为预报成功的落雷数;Ap为实际雷电区域的落雷数。

对于安徽 电网2011年6月24日15:00—16:00的雷电监测信息,采用本文方法每1min预报一次雷电发生范围,并计算其相应的指标,各指标随时间变化的曲线如图10所示。从曲线变化中可以看出,在整个预 报过程中,雷区面积 检出率RPOD 达到70% 以上,雷区面积 虚警率RFAR低于30%,落雷数检出率RLDP基本上均大于75%,从而证明了本文所提出的雷区预报方法具有较高的准确率。

3.2线路跳闸概率预报效果

安徽电网在雷电监测范围内有线路458条,其中220kV线路399条,500kV线路59条。每一次的线路跳闸概率预报过程中,以预报时刻前6 min的雷电监测数据为基础预报未来1min的雷电分区(即预报计算的周期是1 min),进而计算处于雷电区域中的所有线路的雷击跳闸概率。

附录A表A1给出了在2011年7月18日18:14:00的线路跳闸概率预报结果。在此次预报中,安徽电网有5条线路处于预测雷电分区内,这5条线路的预测雷 击跳闸概 率分别如 表A1所示。可以看出,繁朱2873线的雷击跳闸概率相对于其他4条线路的雷击跳闸概率均来的大而排在第1位。而实际电网雷 电跳闸事 故表明,在2011年7月18日18:15繁朱2873线路上发 生雷击跳 闸故障。从而证明本文所提出的雷击跳闸概率计算方法是有效的,它的大小能够作为量度线路雷击跳闸可能性的大小。

附录A表A2给出了安徽电网2011年6月到8月期间利用本文方法所进行的提前1min线路雷击跳闸概率预报结果。电网实际发生了12次雷击跳闸事件,其中3次因大量数据缺失,无法进行计算,对于能够进行跳闸概率计算的9次跳闸事故,均发生在220kV或500kV线路,基于本文方法均能得到成功预报,且实际跳闸线路跳闸概率相对于雷区中的其他线路均来的大(基本均位于前列),从而也再次证明了本文方法的有效性和正确性。

4结语

为了实现对电网雷害的在线安全防御,应对内部电网信息及外部气象、地理等信息进行实时的综合采集与分析。基于雷电发展的快速性,利用雷电定位系统,对短时段雷电信息进行统计以识别雷区,并利用相邻3个时次的雷区信息进行下一时次雷区相关信息的预测,进而预报出位于雷击预报范围内的输电线路雷击跳闸概率,实现了动态预测输电线路雷害故障的时空演变趋势。本文方法应用于实际电网时,因利用了较多的雷电监测信息而具有较高的雷区预报准确度,相应的线路雷区跳闸概率也较准确而可以作为线路雷击预警指标,可有效地提高对电网雷害故障的防御水平。为了进一步提高雷区预测的准确率,还需要对雷区最优轨迹的算法进行改进,并考虑根据实际应用情况动态改变统计时间段长度以适用于雷电信息过于薄弱的情况。

附录见本 刊网络版 (http://www.aeps-info.com/aeps/ch/index.aspx)。

摘要:如何实现雷电故障的预警及跳闸概率的计算,对于电力系统防御雷击故障具有积极意义。提出了基于三时次雷区信息的电网雷击跳闸概率计算新方法。首先,根据每个时次的雷电监测信息,基于图像识别技术识别雷电发生区域;然后,以优化的方法确定雷区发展最佳轨迹;根据当前时次及之前的连续2个时次的雷区信息及发展轨迹,构成三时次相关雷区信息,并进行下一时次雷区相关信息的预报,包括雷区特性变化量(雷区面积、雷电流强度、雷区落雷概率);进而,计算位于雷击预报范围内的输电线路跳闸概率。该方法因利用了较多的雷电监测信息而具有较高的雷区预测准确性,相应的线路雷击跳闸概率也具有较高的准确率而可以作为雷击跳闸预警指标。算例证明了所述方法的有效性。

计算机三级《数据库技术》预测题 篇4

A.物理设计着眼于数据库底层的物理存储与存取,与操作系统和硬件环境及数据库管理系统密切相关

B.物理设计时需要合理安排不同的存储介质,索引文件一般存储在高速磁盘中,日志文件可以考虑存储在磁带中

C.物理设计过程中需要考虑设置合理的数据库管理系统参数和操作系统相关参数

D.物理设计过程中需要考虑RAID级别、操作系统的文件管理机制、数据库管理系统支持的索引类型

9、对于故障管理,下列说法正确的是( )。

A.软件容错最完全的方法是设计两套相同的数据库系统同时工作,数据的变化也同步,空间有一定的距离,因此同时破坏两套的概率几乎为零,这样就能达到数据库的完全安全

B.动态转储提高了数据库的可用性,但是数据的有效性得不到保证

C.介质故障是指数据库在运行过程中,系统突然停止运转,所有正在运行的事务以非正常方式终止,需要系统重新启动的故障

D.在数据库系统中,事务日志能够实现数据转储

10、数据库应用系统在使用过程中,会根据用户的需求及系统运行情况对系统进行升级和改造。关于系统升级改造工作,下列说法错误的是( )。

A.在系统升级改造过程中,可能会调整数据库的逻辑结构,例如增加数据项、修改数据项的类型等

B.升级改造实施过程应尽量选择在业务不繁忙或没有业务的期间进行,并在升级完成后进行测试

C.升级改造过程一般只对应用系统及其相关的数据库对象进行调整,不涉及数据库管理系统及操作系统的类型和版本

D.在升级之前,应先对现有的系统及数据进行备份,如果升级失败则需要使用备份进行恢复

11、在SQL Server 2008中,设要为数据库DB1添加一个新的数据文件,该文件的逻辑名为filex,物理文件名为filex.n(if,存储位置为D:DB1,初始大小和最大大小均采用系统默认值,增长方式为自动增长,每次增加20%。下列语句中正确的是( )。

A.ALTER DATABASE DB1 ADD FILE(

NAME=filex,

FILENAME=D:DB1filex.ndf,

FILEGROWTH=20)

B.ALTER DATABASE DB1 ADD FILE(

NAME=filex,

FILENAME=D:DB1filex.ndf,

FILEGROWTH=20%)

C.ALTER DATABASE DB1 ADD FILE(

NAME=filex,

FILENAME=@D:DB1filex.ndf@,

FILEGROWTH=20)

D.ALTER DATABASE DB1 ADD FILE(

NAME=filex,

FILENAME=@D:DB1filex.ndf@,

FILEGROWTH=20%)

12、关于分布式数据库,下列说法错误的是( )。

A.分布式数据库的查询代价需要考虑站点间数据传输的通信代价,一般来说导致数据传输量大的主要原因是数据间的连接操作和并操作

B.分布式数据库中位置透明性是指数据分片的分配位置对用户是透明的,使得用户在编程时只需考虑数据分片情况,而不用关心具体的分配情况

C.分布式数据库的事务管理包括恢复控制和并发控制,恢复控制一般采用的策略是基于两阶段的提交协议

D.分布式数据库系统的目标是利用多处理机结点并行地完成数据库任务,以提高数据库系统的整体性能

13、在SQL Server 2008中,有商品表(商品号,商品名,单价)和销售表(商品号,销售时间,销售价格)。现要限制“销售价格”的取值必须在此商品“单价”的0.6倍到1.5倍范围之内,实现这个约束的正确代码是( )。

A.CHECK(销售价格BETWEEN单价*0.6 AND单价*1.5)

B.CHECK(销售价格BETWEEN商品表.单价*0.6 AND商品表.单价*1.5)

C.CREATE TRIGGER tri_Sales ON销售表FOR INSERT,UPDATE

As IF EXISTS(SELECT*FROM INSERTED a JOIN商品表b

ON a.商品号=b.商品号WHERE销售价格NOT BETWEEN单价*0.6 AND单价*1.5)

ROLLBACK

D.CREATE TRIGGER tri_ales ON销售表INSTEAD OF INSERT,UPDATE AS

IF EXISTS( SELECT冰FROM INSERTED a JOIN商品表b

ON a.商品号=b.商品号

WHERE销售价格NOT BETWEEN单价*0.6 AND单价*=1.5)

ROLLBACK

14、在数据库系统中,下列映像关系用于提供数据与应用程序间的物理独立性的是( )。

A.外模式/模式

B.模式/内模式

C.外模式/内模式

D.逻辑模式/内模式

15、在SQL Server 2008中,有系统数据库master、model、msdb、tempdb和用户数据库。下列关于系统数据库和用户数据库的备份策略,最合理的是( )。

A.对系统数据库和用户数据库都实行周期性备份

B.对系统数据库和用户数据库都实行修改之后即备份

C.对系统数据库实行修改之后即备份,对用户数据库实行周期性备份

D.对master、model、msdb实行修改之后即备份,对用户数据库实行周期性备份,对tempdb不备份

16、数据库物理设计的目标是为应用数据提供合适的数据存储结构,同时要保证数据库系统具有良好的性能。关于数据库物理设计,下列说法中错误的是( )。

A.数据库物理设计需要考虑数据的存储方式、存取路径和具体的实现细节,还需要考虑数据的加载方式

B.数据库物理设计一般需要根据数据的存储需求和使用需求确定数据库管理系统的配置参数

C.数据库物理设计需要权衡系统的时间效率、空问效率、维护代价和各种用户要求,因此可能会产生多个备选方案

D.在数据库物理设计后期,可以根据实际需要适当降低某些关系模式的规范化程度,以提高查询效率

17、下列关于SQL Server 2008中guest用户的说法,错误的是( )。

A.guest用户没有对应的登录账户名

B.通过授权语句可以启用数据库中的guest用户

C.所有数据库用户都继承该数据库中guest用户的权限

D.任何SQL Server登录账户都可以访问启用了9uest用户的数据库

18、下列关于SQL Server 2008架构的说法,错误的是( )。

A.在一个数据库中,一个用户可以拥有多个架构,一个架构只能属于一个用户

B.架构相当于数据库对象的容器,在同一个数据库中架构不能重名

C.架构是数据库中的逻辑命名空间,同一个数据库的不同架构中可以存在同名表

计算方法预测 篇5

对于微博、微信等社交网络而言, 完整的用户信息主要包括:个人信息、收听微博、关注信息以及用户的行为信息等;这些信息基本涵盖了用户偏好的各个方面, 本文中分析的用户偏好, 都来源于这些数据。

在分析不同用户的偏好时, 其个人信息可以作为相关与否的最直观反映。需要注意的是, 有些用户填写的信息是虚假的或不完整的, 所以个人信息只能作为用户偏好分析的辅助手段。微博用户间的关注和被关注关系反映了用户间的联系, 不同用户间的关注关系是社交网络节点之间的关系;不同的用户会因为相同的兴趣爱好、生活方式以及教育背景而相互关注或被关注。用户的行为信息包括转发、评论以及@行为等, 这些分享性动作充分体现了用户间的交互性。为了从大量的相似偏好用户中筛选出有效用户群, 有必要引入用户影响力的概念:一般而言用户的粉丝越多、用户活跃度越大, 其影响力就越大。

在得到出与用户偏好相关的相关数据后, 需要判定用户的偏好, 主要有新话题的偏好判定、新状态的偏好判定以及新用户的偏好判定等方式。最简单的新话题偏好判定方式是比较原有话题和新话题, 如果新话题和原有话题存在一定的相似性, 那么用户就很有可能对新话题感兴趣。在实际判定时, 需要先将原有的话题进行分词, 在统计出各个分词出现的频率后按照一定的顺序排列;然后对新话题进行分词, 同样统计各个分词的频率, 然后计算新话题的高频度分词和原有话题的高频度分词的相关性。只有原有话题中的一个话题和新话题具有较高的相似度即可, 而不需要所有的话题都有很高的相似度。

2 基于偏好模型的推荐方法

用户的偏好表示方法是预测话题趋势的最基本需求, 与此同时给予偏好模型的推荐方法是预测话题趋势的手段。本文接下来将借助上面的方法得到的用户偏好数据, 实现针对用户的推荐。

用户的偏好数据是以X M L文件的形式存在的, 其偏好数据被表示为特征向量的形式:

特征向量间是存在一定的联系性的, 传统的计算特征向量联系的工具是余弦相似性, 本文使用余弦相似性来计算用户偏好特征, 其基本原理是:如果两个用户的偏好数据越相似, 那么他们的余弦相似性就越大;也就是说, 可以将偏好数据的相似度问题, 转换为数学上的特征向量夹角的问题, 夹角越小说明相似度越高;两个向量A和B的余弦相似度计算公式是:

当用于计算相似性的特征向量中数据足够时, 利用用户偏好中的关键词已经可以得到足够精确的相似性表示;但是, 假如用户偏好表示中的关键词数据较少时, 用这样的特征向量计算相似度就难以得到预期的相似度结果。例如:“李娜的表现太棒了!”和“娜姐要退役了。”这两条微博数据中并没有相同的关键词, 所以利用基于关键词的用户偏好数据建立的特征向量计算相似度时, 并不能得到预期的相似结果;但是了解网球的人都知道, “李娜”和“娜姐”指的是同一个人。为解决这一问题, 可以将用户的特征向量由一维表示为多维, 用用户偏好矩阵替代用户偏好特征向量, 以此增加相似度计算的准确性。LD A话题模型可以用于改进用户的偏好向量模型, 它有文档、话题以及词三个元素, 文档可以看作是词的集合, 每一个词都可以认为是文档的一个话题;LD S话题模型中得到话题列表后, 会合并同一话题的主题词, 得到用户的偏好矩阵后, 解决用户偏好数据偏少的问题。

3 话题趋势预测方法

微博信息传播的过程、时间以及用户行为的话题等构成了一个复杂系统, 对其发展趋势进行预测时, 不仅要考虑用户关系及用户行为的等微观因素, 还需要从宏观上考虑整个信息的传播过程。从宏观上讲, 当没有强力的外界干扰时, 每一个话题都是由前面若干时刻的话题延续而来的, 话题的这种连续性决定了可以根据某话题前面若干时刻的信息预测将来的话题趋势。

按照时间先后顺序可以将一个话题分为不同的时间区段, 这些连续的时间区段构成的序列称为时间序列, 基于时间序列的预测方法被广泛用于诸如股票预测、气象预测等生活领域。本文也使用基于时间序列的方法进行话题趋势的预测。序时平均数方法是简单的一种时间序列预测方法, 其基本原理是利用整个序列的平均值预测下一时刻的序列值。移动平均法在计算平均值的基础上, 还考虑了时间因素在话题预测中的作用, 计算的是最近N个时间的平均值。虽然上述方法在简单、特定的环境下可以得到比较好的预测效果, 但在复杂的情况下预测准确度会显著下降, 一般使用的是差分自回归移动评价模型 (A R IM A模型) 。

A R IM A模型在预测时, 认为时间序列是有一定的依存性的, 与此同时又将随机波动对时间序列的影响降到最小, 所以对于短期时间序列会得到很好的效果。A R IM A模型包括自回归过程A R (p) 和移动平均过程M A (q) 两部分, 其中p是自回归因子, q是移动平均因子, 所以总的模型是A R IM A (p, d, q) ;模型中d是使时间序列平稳化的差分阶数。

自回归过程A R (p) 描述了历史数据和目前要预测的数据间的关系;M A (q) 说明了时间序列在自回归过程中所产生的误差。一般情况下, A R IM A模型要求时间序列是平稳的, 当时间序列是非平稳的时, 需要先将其平稳化;最常用的平稳化方法是对是对时间序列进行差分运算。综上可知, 建立A R IM A模型的步骤如下:1) 生成时间序列。用户偏好数据开始时并不是以时间序列的形式存在, 所以需要用数据聚合的方式生成原始时间序列。2) 平稳性分析和处理。A R IM A模型只能处理平稳的时间序列, 所以如果时间序列不是平稳的, 需要先对其进行差分运算, 以生成平稳时间序列。3) 模型的识别和参数估计。分析A R I-M A模型中自回归过程和移动平均过程的参数, 并利用最小二乘法和极大似然估计等拟合方法分析模型参数。4) 预测分析。分析用户偏好数据, 并预测话题趋势。

4 结论

本文首先以微博为例, 介绍了网络用户的偏好分析, 并说明了用户偏好的判定方法;接下来说明了话题预测的手段———基于用户偏好模型的推荐方法;最后研究了话题趋势预测方法。本文介绍的这种偏好分析及话题趋势预测方法可以有效用于互联网中的推荐系统以及趋势预测等, 有重要的现实意义。

摘要:大数据环境下定向推荐起着重要的作用, 而用户偏好是定向推荐实现的前提, 因此对用户的偏好进行分析并有效预测用户的话题趋势, 对于社交网络等环境下的推荐系统有重要的现实意义。本文以微博为例, 分析用户的偏好分析, 并预测其话题趋势。

关键词:计算机网络,偏好分析

参考文献

计算方法预测 篇6

定向井是在给定造斜井深的条件下,按照预先设计的方位和井斜钻达目的层的钻井方法。特别是对于开发低渗透、低孔隙度油气藏和海洋油气藏,定向钻井可以取得非常好的开发效果。目前的钻井技术可以使井深超过8 000 m,水平位移达5 000 m。 形成井斜角达80°以上的大斜度井,即所谓大斜度井。地层破裂压力预测是进行钻完井和压裂设计的必要工作之一,准确地预测破裂压力可以有效避免坍塌、井喷等钻井事故的发生,还可以为设计套管程序、计算安全钻井液密度窗口等提供技术参数[1,2]。针对于定向井的破裂压力计算,目前仍多采用传统经典Hubbert-Willis模型、Eaton模型、Stephen模型等[3,4,5,6,7]。然而,由于定向井涉及的计算参数较多,特别是较直井新加入了井斜角、方位角等影响因素,使得破裂压力的计算更加复杂。根据岩石力学最大拉应力理论,基于多孔弹性斜井模型对定向井的破裂压力进行了预测,利用测井资料求取模型中的岩石力学计算参数,并进行了单因素敏感性分析。

1 定向井破裂压力计算模型

从岩石力学角度看,井壁稳定与否,取决于井眼围岩的应力水平与地层强度的比较上。若钻井液密度过高,在井壁处就会出现拉应力,当拉伸应力大于岩石的抗拉强度时,就要发生拉伸破坏(表现为井漏)。多孔弹性力学模型如图1所示。

根据任意斜井,井眼围岩的应力分布规律,在井壁上r=a,应力表达式为:

{σrr=Ρwσθθ=(σx+σy)-2(σx-σy)cos2θ-4τxysin2θ-Ρwσzz=σz-2μ(σx-σy)cos2θ-4μτxysin2θτθz=2(τyzcosθ-τxzsinθ)τrθ=τrz=0(1)

此时井壁上存在剪应力τθz,表明此坐标系下的应力分量不是主应力。而判定岩石是否发生拉伸破坏,一般用主应力表示。因此,需要计算出井壁上的三个主应力分量:

{σ1=σr=pwσ2,3=12(σθθ+σzz)±12[(σθθ-σzz)2+4τθz2]1/2(2)

观察式(2)可以看出,只有σ3可能为负。根据最大拉应力破坏准则:

σ3=-σt(3)

式(3)中σ3为井壁上一点的最小主应力,MPa;σt为地层的抗拉强度,MPa。

为方便起见,式(3)简写成:

{σrr=ΡWσθθ=X-Ρwσzz=Yτθz=Ζ(4)

式(4)中,

{X=(σx+σy)-2(σx-σy)cos2θ-4τxysin2θY=σz-2μ(σx-σy)cos2θ-4τxysin2θΖ=2(τyzcosθ-τxzsinθ)(5)

考虑地层的有效应力效应,有:

σ=σ-αΡp(6)

式(6)中:σ为作用在岩石上的总应力,MPa;σ′为作用在岩石上的有效应力,MPa;α为有效应力系数;Pp为地层孔隙压力,MPa。

对于任意井眼条件,综上可述,可求出地层破裂压力的表达式如下:

12(X+Y-Ρw)-12[(X-Y-Ρw)2+4Ζ2]=-σΤ(7)

在0至1800之间循环圆周角θ,求解井眼压力最小值pwmin,即为保持井眼稳定的井眼压力上限-破裂压力Pf

2 岩石力学参数求取方法

在地层破裂压力计算中需要用到的钻井岩石力学参数主要有:弹性模量E、泊松比μ、有效应力系数η、抗拉强度σt等。岩石力学参数的获取分为直接方法和间接方法,前者是通过室内岩心试验直接确定岩石的弹性参数和强度参数。这种方法的确定需要花费大量的人力物力,并且原地岩心获取苦难。相比之下,利用测井资料来确定地层岩石的弹性参数和强度参数等数据,进而实现地层坍塌压力和破裂压力的连续预测是一项十分有潜力的、经济实用的技术。

许多学者经过多年的研究发现:地层的强度力学特性与其纵、横波速度(或时差)之间存在着内在联系。根据声波传播特点,纵波是压缩波,能反映地层岩石压缩变形的特点;横波是剪切波,能反映地层岩石剪切变形的特点,而岩石的压缩变形和剪切变形都能间接地反映出其力学特性[8]。现场的声波测井资料是在井下直接测量的,由于受人为影响因素小,能很好地反映地层岩石的力学特性。

对于均质各向同性弹性体,纵横波速度表达式如下:

VΡ=(λ+2Gρ)12(8)VS=(Gρ)12(9)

根据弹性参数间的关系,可进一步表示为:

剪切弹性模量:

G=ρVS2(10)

体积弹性模量:

Κ=ρVΡ2-43ρVS2(11)

弹性模量:

Ed=ρVS2(3VΡ2-4VS2)VΡ2-VS2(12)

泊松比:

μd=VΡ2-2VS22(VΡ2-VS2)(13)

但是对于岩石来说,在一般情况下并不是均质各向同性的弹性材料,内部存在着大量的孔隙、裂隙、节理、层理等结构,使得用上面公式确定的力学参数与室内实验值之间存在差异。我们把由上面公式确定的力学参数定义为动态力学参数,由室内实验得到的力学参数定义为静态力学参数,通过大量的实验发现岩石动态力学参数与静态力学参数之间存在一定的相关性,具体规律如下:

Es=a1+b1Ed(14)

式(14)中:a1、b1为试验常数,与泥质含量和岩石应力状态有关。

动态泊松比与静态泊松比之间的定量关系为:

μs=a2+b2μd(15)

式(15)中,a2、b2为试验常数。

Deer和Miller根据大量的室内试验结果建立了砂泥岩的单轴抗压强度σc和动态杨氏模量Ed以及岩石的泥质含量Vsh之间的关系:

σc=(0.0045+0.0035Vsh)Ed(16)

根据弹性力学理论,体积弹性模量K与弹性模量E和泊松比μ的关系如下:

Κ=3μ1-2μE(17)

根据上述理论,对于某一地层岩石的弹性模量、泊松比、三个主地应力、单轴抗压强度、单轴抗拉强度、有效应力系数等参数即可确定,从而可以进行定向井破裂压力计算分析。

3 实例计算及敏感性分析

3.1 实例应用

将上述理论程序化,分别利用经典的Eaton模型、Stephen模型和斜井模型对英琼盆地已钻的4口井3个深度点的地层破裂压力进行了计算,并给出了3种方法计算地层破裂压力的误差,如表1示。

从表1可以看出,用该法预测的地层破裂压力与实测的地层压力比较吻合,这说明该法能满足钻井工程和采油工程的需要。

3.2 参数敏感性分析

以井深为2 760 m的数据为例来分析统计规律性,主要研究包括上覆岩层压力、最大水平应力、最小水平应力、孔隙压力、抗拉强度、抗剪强度、biot系数、泊松比、方位角和井斜角对破裂压力的影响。进行单因素分析,研究单一变量的变化对破裂压力产生的影响。各个变量的初始值如下表2:

3.2.1 上覆岩层压力对破裂压力影响规律

从图2可知,上覆岩层压力与破裂压力呈负相关的关系,即随着上覆岩层压力的逐渐增大,破裂压力逐渐减小。

3.2.2 最大、最小水平主应力对破裂压力的影响规律

从图3中看出,在斜井中,随着最大水平应力的变大,破裂压力呈现先增大后减小的趋势,说明在某一个最大水平应力下破裂压力有最大值。同时,最小水平应力与破裂压力呈正相关的关系,随着最小水平应力的变大,破裂压力呈现增大的趋势。

3.2.3 抗拉强度、抗剪强度对破裂压力的影响规律

从图4中看出,最大水平应力与破裂压力呈正相关的关系,随着抗拉强度的变大,破裂压力呈现增大的趋势。

3.2.4 泊松比、biot系数对破裂压力的影响规律

从图5中看出,泊松比与破裂压力呈负相关的关系,随着泊松比的变大,破裂压力呈现减小的趋势。biot系数与破裂压力呈负相关的关系,随着biot系数的变大,破裂压力呈现减小的趋势。

3.2.5 孔隙压力对破裂压力的影响规律

从图6中看出,孔隙压力与破裂压力呈负相关的关系,随着孔隙压力的变大,破裂压力呈现减小的趋势。

3.2.6 方位角、井斜角对破裂压力的影响规律

从图7中看出,破裂压力随着方位角呈现周期性的变化趋势。相隔180°方位角的破裂压力值是一样的,且在45°时达到最大值,0°达到最小值。破裂压力随着井斜角呈现周期性的变化趋势。相隔180°井斜角的破裂压力值是一样的,且在45°时达到最大值,0°达到最小值。

4 结论

在斜井中,随着上覆岩层压力的变大,破裂压力呈现减小的趋势;随着最大水平应力的变大,破裂压力呈现先增大后减小的趋势;随着最小水平应力的变大,破裂压力呈现增大的趋势;随着抗拉强度的变大,破裂压力呈现增大的趋势;随着抗剪强度的变大,破裂压力不变,说明抗破裂压力与抗剪强度无关;随着biot系数的变大,破裂压力呈现减小的趋势;随着孔隙压力的变大,破裂压力呈现减小的趋势;随着泊松比的变大,破裂压力呈现减小的趋势;破裂压力随着方位角呈现周期性的变化趋势;破裂压力随着井斜角呈现周期性的变化趋势。

参考文献

[1]钟敬敏,齐从丽,杨志彬.定向井安全钻井液密度窗口测井计算方法.新疆石油地质.2006;2(3):40—42

[2]李传亮,孔祥言.油井压裂过程中岩石破裂压力计算公式的理论研究.石油钻采工艺,2000;22(2):54—56,83

[3] Hubbert M K,David G W.Mechanics of hydraulic fracturing.Petrole-um Transactions,AIME,1957;210:l53—168

[4] Matthews W R,John K.How to predict formation pressure and fracturegradient.Oil&Gas Journal,1967;(2):92—106

[5] Pennebaker E S.An engineering interpretation of seismic data.Societyof Petroleum Engineers of AIME,,SPE2l65.1968;

[6] Eaton B A.Fracture gradient prediction and its application in oilfieldoperations.JPT,1969;21(10):1353—l360

[7] Stephen R D.Prediction of fracture pressure for wildcat wells.JPT,1982;34(4):863—872

计算方法预测 篇7

随着网络技术和电信业务的发展,基于IP网络承载数据、语音、视频、无线等多种业务已成为网络发展的趋势。NGN语音、IPTV、三网融合等业务的开展,是未来固网通信市场业务推广主力,这些业务对于承载网络高带宽、高质量、高可靠性的需求,对IP城域网提出了更高的要求。网络服务质量是用户选择一个网络的首要考虑因素,良好的网络服务质量是用户发展和业务收入增长的保障。而宽带业务的网络服务质量的好坏主要取决于IP城域网建设的好坏,因此建议首先加强城市的IP城域网建设,增强其业务承载能力,为今后IP多业务承载做好必要的准备。而在工程实践中,IP业务流量及带宽需求预测的正确与否,是影响IP城域网建设的成败的关键因素之一,本文以某地市为例,列举了IP业务流量及带宽需求在工程实践中常用的方法。

1 业务承载模型

目前,IP城域网主要承载公众宽带业务、专线业务和NGN语音业务,具体业务承载模型如图1所示:

2 业务流量及带宽需求预测

2.1 宽带业务流量

宽带业务流量=宽带用户数×用户并发率×用户平均业务带宽(Mbps)×宽带用户带宽占用率。其中,各项指标如下:

(1) 宽带用户数(含DSLAM用户、LAN折算用户、x PON用户、WLAN用户):为预计达到的用户数。

(2)用户并发率:应为峰值的用户并发率,参考值为50%。

(3)宽带用户平均带宽:应根据省分公司市场部预计的不同带宽用户发展比例进行计算。

公式为:

用户平均业务带宽=2M×2M接入用户占比+4M×4M接入用户占比+8M×8M接入用户占比+……。

(4)宽带用户带宽占用率=宽带用户实际平均流量/宽带用户平均带宽。

其中,按照市场部规划,4M接入用户占比取定参考值为60%,8M接入用户占比取定参考值为35%,8M以上接入用户占比取定参考值为5%。由此计算出接入用户平均带宽为5.7M。

2.2 IPTV 业务流量

IPTV业务流量,包括中心节点点播业务流量和中心节点直播业务流量。

(1)中心节点点播业务流量=IPTV用户数×开机并发率×点播并发率×中心命中率×(标清并发率×标清码流+高清并发率×高清码流)×带宽冗余系数。

(2)中心节点直播业务流量=(标清频道数×标清码流+高清频道数×高清码流)×带宽冗余系数。

其中,开机开机并发率参考值为50%,点播并发率参考值为50%,中心命中率参考值为20%,标清并发率参考值为90%,标清码流参考值为2M,高清并发率参考值为10%,高清码流参考值为8M,标清频道数参考值为100个,高清频道数参考值为20个,带宽冗余系数参考值为1.2。

2.3 NGN 业务流量

NGN业务流量=NGN用户数×平均用户流量。

其中,平均用户流量参考值为4.3Kbps。

2.4 专线业务流量

专线业务流量=宽带业务流量×专线业务流量系数。

其中,专线业务流量系数参考值为12.5%。

2.5 IDC 业务流量

IDC业务流量=宽带业务流量×IDC业务流量系数。

其中,IDC业务流量系数参考值为15%。

2.6 省干至国干业务流量

省干至国干业务流量=IDC业务流量×IDC出省流量占比。

其中,IDC出省流量占比参考值为96%。

2.7 IP 城域网至省干流量

IP城域网至省干流量=IPTV业务流量+宽带业务流量×宽带业务省内流量占比+专线业务流量×专线业务省内流量占比+IDC业务流量×IDC业务省内流量占比。

其中,宽带业务省内流量占比参考值为5%,专线业务省内流量占比参考值为40%,IDC业务省内流量占比参考值为30%。

2.8 IP 城域网至国干流量

IP城域网至国干流量=宽带业务流量×宽带业务出省流量占比

其中,宽带业务出省流量占比参考值为95%。

2.9 BRAS 上行流量

BRAS上行流量=宽带业务流量。

2.10 SR 上行流量

SR上行流量=IPTV业务流量+专线业务流量+NGN业务流量。

2.11 IP 城域网带宽需求

IP城域网至省干出口带宽需求=IP城域网至省干出口业务流量/峰值带宽占比。

IP城域网至国干出口带宽需求=IP城域网至国干出口业务流量/峰值带宽占比。

省干至国干带宽需求=省干至国干业务流量/峰值带宽占比。

由于新增出口带宽需求按40G端口考虑,因此部分地市城域网出口带宽目标值会略大于计算结果。

2.12 预测结果(详见下表 1)

3 小结

基于IP网络承载数据、语音、视频、无线等多种业务已成为网络发展的趋势。NGN语音、IPTV、三网融合等业务对于承载网络的带宽、质量、可靠性提出了更高的需求,本文以某地市为例,列举了IP业务流量及带宽需求在工程实践中常用的计算方法,希望能在工程设计和实施中有点借鉴之处。

参考文献

[1]杨合林.流量分析和控制技术的研究与系统建设.科技传播.2012.

[2]林锡川,李志强.校园网流量分析与控制.价值工程.2011.

计算方法预测 篇8

嵌入式系统, 是一种“完全嵌入受控器件内部, 为特定应用而设计的专用计算机系统”, 其通过有限的硬件资源来执行带有特定要求的预先定义的任务。由于嵌入式系统只针对一项特殊的任务, 设计人员能够对它进行优化, 减小尺寸降低成本。从当前嵌入式消费电子产品来看, 媒体处理与无线通信、3D游戏逐渐融合, 其强大的功能带来了芯片处理能力的增加, 在复杂的移动应用环境中, 功耗正在大幅度增加[1,2,3]。比如手机, 用户往往希望待机时间、听音乐时间, 以及看视频的时间能更长, 在这样的背景下, 嵌入式处理器的功耗波动范围非常的大, 并且由于嵌入式节能算法的引入导致其功耗的预测变得更加困难。如何在不断变化的动态的计算环境中准确的预测云计算嵌入式处理器的功耗是亟待解决的问题[4,5,6]。

目前, 随着网络应用的飞速发展使得对计算能力的需求不断增加, 伴随着网格计算, 并行计算, 分布式计算的发展, 云计算应运而生, 被列为国家未来重点发展的技术方向, 并成为了当今计算机研究届和工业界的热点研究课题。现有的云计算是将大量用网络连接的计算资源统一管理和调度, 构成一个计算资源池向用户按需服务。简单来说就是将计算、处理等工作分布在大量分布式计算机上, 而管理中心只需对计算结果进行汇总管理, 并为用户提供应用服务。

本文提出一种基于云算法的嵌入式处理器CPU功耗预测方法。结合目前先进的云计算方法, 将云计算和传统的嵌入式处理器CPU功耗预测方法相结合, 给出一种全新快速稳定高效的嵌入式处理器CPU功耗预测方法。本文所提的云计算节点采用模块化设计, 嵌入式微架构, 可根据实际应用范围增加或减少扩展功能模块, 功能丰富, 即插即用.可以网络中任意位置部署, 降低网络搭建成本, 大大降低网络维护难度.有效减少网络数据传输对通信链路的资源占用, 降低管理中心的计算量, 间接降低了网络搭建和管理中心架设的投入成本.同时本文开展了充分的实验研究, 将本文的方法应用于实际的嵌入式处理器CPU功耗预测中, 考虑不同型号的嵌入式处理器, 来进一步验证本文方法的适用性, 结果表明本文方法能够准确的预测出嵌入式CPU的功耗, 尤其对于复杂环境下的预测效果明显优于传统的预测方法[7]。

1 一种基于云计算的嵌入式CPU功耗预测方法

1.1 基于云计算的嵌入式CPU功耗预测方法简介

云计算是一种基于互联网的计算方式, 通过这种方式, 共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。云计算是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。用户不再需要了解“云”中基础设施的细节, 不必具有相应的专业知识, 也无需直接进行控制。云计算描述了一种基于互联网的新的IT服务增加、使用和交付模式, 通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。本文采用嵌入式云计算节点的系统包括Zig Bee节点模块和扩展应用模块。如图1所示, 其中, Zig Bee节点模块基于Zig Bee技术, 用于实现组网和通信。扩展应用模块包括定制计算模块、数据压缩模块、数据存储模块、扩展通信模块以及开关控制模块中的至少一种。扩展应用模块与其包含的子模块的接口采用标准化设计, 即插即用, 本文提供的一种嵌入式云计算节点的方法, 依靠节点模块与附近的网络建立连接, 扩展应用模块开始向网内广播具备的功能标识并开放链路, 网络内的节点向网内链路发送请求, 扩展应用模块验证请求的合法性, 扩展应用模块验证自身是否具备请求的相应的功能, 如果验证通过, 扩展应用模块根据请求执行相应的功能, 扩展应用模块根据请求返回计算的结果。其中, Zig Bee节点模块与附近的网络建立连接的步骤包括:Zig Bee节点模块启动后搜索网络信号;Zig Bee节点模块搜索到网络信号后, 请求验证:Zig Bee节点模块通过验证后, 与搜索到的网络建立连接。其中, 请求包括向网内链路发起数据计算处理的请求。扩展应用模块根据请求返回计算的结果包括将计算的结果返回给发送请求的网络内的节点或者扩展应用模块根据所述请求返回计算的结果包括按照发送请求的网络内的节点的要求返回的计算的结果, 或者扩展应用模块根据所述请求返回计算的结果包括将计算的结果经过网关节点传输到管理中心[8]。

如图2所示是整个嵌入式CPU功耗预测方法的示意图。首先从RAPL接口读取当前嵌入式CPU的工作状态, 将工作状态的数据经过预处理之后到达监测模块, 监测模块将得到的数据发送给误差修正模块, 利用当前的嵌入式CPU的输入数据对功耗进行一个初始的预测。通过功率仪将这个预测的初始值和从功率仪上得到的测量值进行比较, 利用这个误差来修正功率预测模块。误差修正的主要作用是在给定总功率的情况下, 对最大功耗情况下的差额进行计算与分析。为了能够方便的获取任意嵌入式CPU的最大功率差额, 本文所述方法在误差修正模块中额外提供了功耗分析功能。以便于用户对嵌入式CPU功耗的情况进行分析和记录。功耗预测模块根据嵌入式CPU以往的运行数据, 结合误差修正模块的信息, 并对所以的嵌入式CPU进行统一的设定。这样就能够使得整个嵌入式CPU保持在合适的工作状态。

1.2 一种基于云计算的嵌入式CPU功耗预测方法的实验与分析

本文以两种主流的嵌入式CPU为例子进行了实验验证。为了获得CPU总的功耗与给出的限额之间的数学关系。通过这个关系来确定出功耗差值的大小。本实验考虑了两种不同的RAPL限额, 依据功率仪给出的数据最终来校正预测模型的准确性。同时为了充分利用云计算中的主机节点, 在节点端采用的是高性能并行测试程序。

图4, 图5, 图6所示分别为RAPL为20W, 40W, 60W情况下实际功率和预测功率值的对比。从以上三个图中可以看出, 无论对于RAPL值是多少的情况下, 功率预测值和功率实际值有着相同的变化趋势。同时可以得出预测值和实际值的差值大多数情况下是小于20的。由此说明该方法的有效性。

2 结语

本文针对嵌入式处理器CPU功耗预测问题, 提出了一种基于云计算的嵌入式处理器CPU功耗预测方法。该方法有效的结合了目前云计算的优势, 能够快速有效的给出嵌入式处理器CPU功耗预测问题。与传统方法相比, 本文所提方法可以将预测误差控制在10W之内, 从而大大提高了预测精度。

参考文献

[1]林闯, 苏文博, 孟坤, 刘渠, 刘卫东.云计算安全:架构、机制与模型评价[J].计算机学报, 2013 (9) :1765-1784.

[2]何鹏举, 吴来斌, 宋凯华, 曹允耀.基于粒子群算法的嵌入式云计算资源调度[J].电子设计工程, 2014 (10) :88-90.

[3]罗亮, 吴文峻, 张飞.面向云计算数据中心的能耗建模方法[J].软件学报, 2014 (7) :1371-1387.

[4]罗军舟, 金嘉晖, 宋爱波, 东方.云计算:体系架构与关键技术[J].通信学报, 2011 (7) :3-21.

[5]刘嵩, 刘轶, 杨海龙, 周彧聪.基于RAPL的机群系统功耗限额控制[J].计算机工程, 2010:1-7.

[6]陈俊, 张文光.面向IPv4/IPv6云计算虚拟机迁移实时功耗建模研究[J].测控技术, 2016 (4) :89-93+97.

[7]陆娇蓝, 陈军, 杨著.基于云计算的嵌入式人脸识别系统建构与研究[J].计算机测量与控制, 2016 (4) :146-148.

计算方法预测 篇9

短波传播的基本方式有地波传播和天波传播2种。受传输距离的限制,短波传播主要还是靠天波来实现的。天波就是指从电离层反射或散射后回到地球表面的无线电波。天波传播电离层反射信道属于时变色散信道,具有时间、频率和空间3种选择性的衰落,其模型主要是基于实测与经验(或修正经验)的统计预测模型。

国外相关机构开发了几种预测软件,如IONCAP、ICEPAC和PropMan等,但其核心技术是不公开的,目前国内在短波工程上仍沿用的是以查图查表手工计算为主的方法。本文利用CCIR模型,结合我国环境特点及地理信息,利用Matlab与数据库的联合编程技术,实现了短波传播路径损耗预测的全程计算机化。

1 预测模型选择

为了能够对短波传播线路进行预测和计算,国际电信联盟无线电通信大会(ITU-R)即原无线电咨询委员会(CCIR)曾先后提出了3个独立的估算短波天波场强的方法,即基于报告252、报告252补编和报告894的方法。本论文中采用的方法主要基于报告894方法。报告894方法包括2部分:频率预测部分和场强计算部分。频率预测部分是根据国际电信联盟提供的Oslo系数,利用数字图法求出电离层特性参数f0F2和m(3000)F2,以此得到相应的E层和F层各模式的基本最高可用频率(MUF)和路径的工作可用频率(FOT);场强计算部分则考虑了各种传输损耗以及多径效应,计算了接收区内信号的中值场强。尽管信号是由中值和瞬时值联合表征的,在短波通信体系中,接收信号存在着严重的衰落,场强的瞬时值会随着时间和空间的延续而快速起伏,这对于欲了解短波通信长时间稳定的场强情况,是不具备预测意义的,只有中值场强是一个唯一有效的表征量。在通常意义下,场强预测即指的是信号场强中值的预测。

根据CCIR的预测模型,短波天波传播过程中的传输损耗主要分成5个部分:自由空间基本传输损耗Lbf;电离层的吸收损耗Li;地球表面的反射损耗Lm;频率高于基本MUF传播的损耗Lg;额外系统损耗Yp。

2 计算机实现

计算机实现主要包括数据库的建立和计算程序的编写2个步骤。

2.1 数据库的建立

路径损耗预测的计算机实现首先须具备数字化的地理信息与传播参数。在无现成的基本参数图表资料情况下,要通过计算来获得;若有现成的基本参数图表资料,可将其数字化。这些参数包括收发信地理位置、大圆路径中点、磁旋频率、太阳天顶角、太阳黑子数和反射地面情况等。最后获得的数据要做成数据库,以便为系统调用。在本文中,数据库采用Acess制作。

获取数字化的资料是计算机处理的前提和基础,也是本文中要解决的一个重要问题。目前的有关短波电波传播的参数数据都是记录在纸上的一些曲线图或者图纸,要对这些资料重新处理,首先就要进行数字化。采取的办法是对图纸的扫描图像进行数字交互式采样,求出曲线上的坐标点。然后,在计算机上对数据曲线进行插值和曲线拟合,可恢复出原来的数字化的曲线,并达到很高的精度。在交互式采样中,有多种程序设计工具选择,Matlab工具箱提供了丰富的图像输入、处理及输出函数,非常适合用于图纸的数字化。

2.2 计算程序的编写

计算程序是计算机实现的核心部分。通过程序调用数据库,按照短波天波传播的数学模型及算法,以Matlab语言为开发平台,在机上完成损耗的预测及场强的估算,并输出结果。其中的关键技术为:① 覆盖区域的网格化:要进行区域内的参数数据预处理和损耗及场强的计算,必须要将区域分成网格、逐点量化、数据逐个处理,这些都主要依靠Matlab强大的的矩阵运算和数据处理功能完成;② 输出结果的可视化:由Matlab语言强大的图形绘制功能所支撑。计算出区域内所有点的场强值,进而画出等值线分布图等结果。

3 仿真结果

为说明算法的可靠性,给出了对一条固定通路和多接收点场强分布的仿真结果。

3.1 对一条固定通路的仿真

以北京-武汉短波通路为例,对一条基本参数已给出的固定通路进行计算。路径基本参数为:通信时间为1月12:00(正午);太阳黑子数0;大圆路径中点(115.1° E,34.0° N),太阳天顶角55°,磁旋频率1.32 MHz。输入功率26 dB(相对于1 W),发射天线增益15 dBi。

经计算,北京-武汉间大圆路径距离为1 051 km,因此传播模式为1E及1F。E层模式仰角9.6°,F2层模式仰角28.3°,可以看出,采用1E模式传播时,辐射仰角很小,此时必须采用具有小角度辐射方向性的天线,具体对于短波天线,最好的办法就是采用架高天线,或者将天线假设在向前倾斜的山坡上,以降低仰角。自由空间基本传输损耗Lbf 与工作频率和大圆距离有关,Lbf与工作频率的关系如图1所示,总的Lbf 应由E层模式和F2层模式叠加。可以看出,自由空间基本传输损耗是随着频率的增高而增高的。

电离层的吸收损耗与工作频率的关系如图2所示,可以看出,电离层的吸收损耗是随着频率的增加而减小的。资料表明,除高仰角外,一跳F层模式的穿透吸收常小于1 dB,因此对于F层的穿透吸收未做考虑。本方法中也未考虑反射吸收的影响,因为它仅在有限的反射区域附近才显得重要,而这是也是一种传输模式很快的转到另一种传输模式的时候。由于本路径内电波传播只有一跳,因而无地面的反射损耗。

接收点场强中值结果如图3所示。其中场强中值的计算结果做如下处理:如存在2个以上传播模式的场强时,应选最大的一个做为接收天线输入端的场强。因此,在上述计算中,应选1E模式作为到达接收天线输入端的场强。

3.2 多接收点场强分布的仿真

在实际通信工作中,对给定区域内每个接收点的场强中值进行估算,是一项非常耗时且费力的工作,且结果不够清晰、直观。但用常规方法要完全分析和整理这些数据,寻找出相应的场强变化规律是十分困难的,实现计算结果的可视化成为关键的因素。利用Matlab数据可视化技术,对短波线路计算结果进行可视化处理,可以得到给定天线覆盖区域每点场强大小的预测值。

基本参数设置为:双极天线作为发射天线;架设高度12 m,单臂长10 m;工作频率15 MHz;时间为1月10:00;太阳黑子数100;输入功率1.6 kW;馈线损耗1.2 dB,辐射效率80%,发射天线位置是东经116.4°,北纬39.9°(北京);最大辐射对正北的指向是0°(天线最大辐射方向对着正北)。为直观起见,本文选择了输出图形为二维等值线图形,如图4所示。

3.3 检验

实际情况中,由于电离层和气象等不可估计的影响,电波传播会出现各种变化,与预测值可能有一定的差距。受实验条件的限制,本文尚不具备能够进行场强实际测量的条件,但可以将仿真输出的结果与专家经验计算数据相比较,比较结果可信度较高能够满足工程计算和仿真的需要。

4 结束语

本文对短波天波传播损耗预测的全计算机化处理软件,可以为短波通信台站最优化设计、通信网络规划及通信的决策支持、宏观管理提供有力的依据。对于其他波段,仍可参照本论文的思想方法进行建模和仿真。

进一步的工作可以考虑:① 如条件允许,应在实测的基础上对模型进行相应的改进;②精算精度仍有提高的余地,如将覆盖区域网格化更细,考虑更多的电波损耗等(但过高的精度已无必要,因为短波信道本身就是随参信道,随机性变化通常比较大)。将以上因素考虑进去,将为今后的短波通信工作提供更加完美的仿真与计算环境。

摘要:以CCIR关于短波传播信道的模型为基础,结合我国环境特点及地理信息,利用Matlab工具和数据库联合编程技术,实现了短波传播路径损耗预测的全程计算机化。给出了预测算法的计算机实现方法与仿真结果,并对仿真结果和影响信道传输特性的几种主要参数做了较为详细的分析、讨论。研究结果可作为短波通信台站最优化设计、通信网络规划及通信部门的决策支持、宏观管理的依据。

关键词:短波通信,信道模型,场强预测,Matlab

参考文献

[1]OKUMURAS.Field Strength and Its Variability in VHF and UHF Land-mobile Radio Service[J].Rev.Elec.Comm.Labs.,1968,16(9-10):825-843.

[2]HATA M.Empirical Formula for Propagation Loss in Land Mobile Radio Services[J].IEEE Trans.on Veh.Tech.,1980,29(3):317-325.

[3]ANDERSENJ B,RAPPAPORT TJ,YOSHIDAS.Propagation Measure andfor Wireless Communications Channel[J].IEEE,Comm.Mag.,1995,33(1):42-49.

上一篇:微反应器下一篇:低分子肝素钙