高斯过程

2024-08-13

高斯过程(精选11篇)

高斯过程 篇1

0 引言

光伏产业近年来发展迅猛, 以年均30%以上的速度快速增长。可以预见, 在21世纪, 光伏发电不仅将替代部分传统发电方式, 而且将成为全球电力供应的主体[1]。

光伏产业在迅猛发展的同时也面临一个危险趋势, 即仅仅关注兆瓦级甚至吉瓦级的产能, 而忽视并网时对大电网的安全保护。由于光伏发电输出功率的特殊性, 以及由于天气突变造成短时间输出功率急剧变化的特点, 并网后会对电网产生冲击, 影响电网的安全稳定运行。因此针对含有光伏发电系统的电网进行发展规划和并网运行时, 需要对光伏发电功率进行预测, 从而解决大电网中电力调度、负荷分配等问题, 有效地减轻光伏发电并网后对电网安全性的影响[2]。

在20世纪90年代初, 光伏发电功率预测主要沿用了传统预测技术, 采用的方法主要为时间序列法[3]。到90年代中后期, 随着人工智能领域机器学习方法的快速发展, 许多先进的机器学习算法应用到光伏发电功率预测中, 采用的模型主要有人工神经网络 (ANN) 模型[4,5,6]、支持向量机 (SVM) [7,8]等。这些方法在预测过程中除了采用历史功率数据外, 还考虑了气象因素、环境因素和特殊事件等许多随机因素, 从而使光伏发电功率预测的精度得到提高。然而ANN本身在网络结构选择上具有随意性, 存在过拟合和易陷入局部极小等本质上的问题, 鲁棒性差。SVM基于小样本统计学习理论, 具有强大的自学习、抗噪声、泛化能力, 能够较好地解决小样本、非线性等实际问题, 取得了比ANN更好的预测效果。但是SVM也存在一些问题, 例如怎样选取特定问题中的核函数和核参数等。从21世纪初开始, 集成 (integrated) 模型和混合 (hybrid) 模型[9]被引入到功率预测领域, 由于这些模型在参数选取等方面存在一些随意性, 可以采用启发式算法对模型参数进行优化选取, 从而获得含有最优参数的预测模型, 进一步提高预测精度。

本文在对光伏功率预测相关方法进行研究的基础上, 建立了基于高斯过程GP (Gaussian Process) 的光伏发电功率预测模型。相比SVM[10], GP是一种具有概率意义的学习机, 能克服SVM难以估计输出的缺点, 且更容易实现。针对传统GP中优化超参数采用的共轭梯度法存在一些缺陷, 如优化效果对初值依赖性强、迭代次数难以确定和易陷入局部最优等, 提出采用和声搜索HS (Harmony Search) 算法代替共轭梯度法优化GP的超参数, 得到一种基于HS优化的混合GP模型并应用于光伏功率预测问题中。最后通过MATLAB仿真, 对提出的混合预测算法的有效性进行了验证。

1 光伏功率特性分析

光伏发电具有很强的周期性, 出力大体集中在每天07:00—19:00, 这段时间和电力负荷有一定的重合, 在负荷高峰时期光伏发电能提供相当数量的用电量, 起到了调峰作用。

光伏阵列的输出功率还具有非线性, 并在很大程度上受到光照强度、环境温度等因素影响。光照强度对光伏发电功率具有重要影响, 光伏电池、组件的光电流与光照强度成正比, 当光照强度在100~1000 W/m2范围内变化时, 光电流始终随光照强度的增长而线性增长;而光照强度对电压的影响很小, 当光照强度在400~1 000 W/m2范围内变化时, 光伏电池、组件的开路电压基本保持不变。可见光伏电池的功率与光照强度也基本保持正比关系。

温度对光伏发电功率也有一定影响。总体而言, 温度每升高1℃, 功率减少0.35%。虽然当温度降低时太阳电池的光电转换效率会有所提高, 但是还是有一个临界值, 当温度无限降低时光伏阵列的输出不会无限增大, 而一般情况下, 气温低于0℃和0℃时相比, 出力值基本没有差别。所以在本文中当气温低于0℃时, 都按0℃处理[11]。

天气类型对光伏发电的功率变化起重要作用。天气类型可以分为晴、晴间多云、多云、雾、阴、雨、雪、扬沙等。不同的天气类型下气象因素一定会有很大的差别, 所以要根据预测日天气情况来选取历史功率数据作为样本。

综上所述, 本文在构建样本集及建模时, 主要考虑3种因素:光照强度、环境温度、天气类型。另外考虑到光伏发电出力的集中时间, 选取07:00—19:00时段内的数据点作为样本点。

2 优化GP模型的建立

在研究GP算法原理的基础上, 本文建立了基于GP的光伏发电功率预测模型。但由于传统的GP算法采用共轭梯度法进行参数优化, 而共轭梯度法存在优化效果对初值依赖性强、迭代次数难以确定和易陷入局部最优等缺陷, 因而本文提出采用HS算法代替共轭梯度法来优化超参数, 从而得到一种基于HS优化的混合GP模型。

2.1 共轭梯度法优化的传统GP

GP[12]是基于高斯随机过程和贝叶斯[13]学习理论发展起来的一种新的机器学习方法, 适于处理高维、小样本、非线性的复杂问题, 在非线性回归、分类、概率密度估计等领域已得到成功应用。

假设有n个观察数据的学习样本集D= (X, y) , X表示d×n维输入矩阵, y表示输出矢量。

假设观察值y被噪声腐蚀, 它与函数输出值f相差ε, 即:

其中, x为输入向量 (自变量) ;ε为独立的随机变量, 符合高斯分布, 如式 (2) 所示。

其中, σn2为噪声的方差。

观察目标值y的先验分布为:

其中, I为单位矩阵;K=K (X, X) 为输入矩阵X对应的对称正定的协方差矩阵。

假设有新的输入向量x*相对应的输出值y*, 那么n个训练样本输出矢量y和1个测试样本输出值y*形成的联合高斯先验分布为:

其中, K (X, x*) 为测试点x*与训练集的所有输入点X的n×1维协方差矩阵;k (x*, x*) 为测试点x*自身的协方差。

本文采用的协方差函数为:

其中, xp和xq为2个任意样本的输入向量, p∈{1, 2, …, n}, q∈{1, 2, …, n};σf、σn和l均为超参数, l用于关联性测定, 值越大表示输入与输出之间的相关性越小, σf控制局部相关性程度;δpq为Kronecker符号, 当p=q时δpq=1, 否则δpq=0。

超参数的选择对预测结果有重要的影响[14]。在训练GP[15]模型时, 可以通过学习样本的对数似然的极大化自适应获得, 称之为共轭梯度法。

根据贝叶斯回归原理, GP模型以学习样本集为基础获取X与y的关系, 进而预测与x*对应的最可能的输出值y*, 其预测分布也是高斯型的。

在统计理论上, 协方差是一个对称正定的函数, 故协方差函数等同于核函数。核函数可以将映射到高维特征空间的非线性关系数据转换为线性关系数据, 从而使得复杂非线性问题转化为简单线性问题求解。

2.2 基于HS的GP超参数优化

为了克服传统GP算法中采用共轭梯度法优化超参数的缺陷, 本文提出采用HS算法[16,17]对样本训练过程的GP模型进行超参数优化, 从而得到和声搜索-高斯过程 (HS-GP) 混合算法。

HS算法首先产生sHM个初始解 (和声) 放入和声记忆库HM (Harmony Memory) 内;然后在HM内以记忆库取值概率rHMC搜索新解, 即随机产生0~1之间的随机数rand, 如果rand

算法通过引入rHMC和rPA2个参数, 期望达到算法对解空间开发、探索能力的平衡, 但是针对如何取值的问题, 并没有理论基础。Z.W.Geem等人认为rHMC应取较大值, rPA应取较小值, 这与遗传算法[18]中交叉概率与变异概率的取值规律类似。

2.2.1 设定HS的参数

首先要确定每一个解向量的参数个数NA和本文使用的GP协方差函数中的3个超参数。sHM是HS算法的一个重要参数, 一般而言, sHM与算法的全局寻优能力成正比, 但由于HS从多点同时开始, 随着sHM不断增大, 计算量也会增大, 从而影响到搜索的寻优速度。rHMC是HS算法的另一个重要参数, 取值一般在0~1之间, 它决定每次迭代过程中新解产生的方式。因新解中的每一个变量都依赖rHMC, 一般rHMC取0~1之间较大的值。rPA在算法中起到控制局部搜索的作用, 避免陷入局部最优, 其值一般取0.1~0.5之间。音调调节带宽WB用于保证调节幅度不会超出取值范围。根据上述分析, 本文中各参数的取值如表1所示。

2.2.2 初始化HM

HS算法可以随机给出初始解, 形成HM, 也可以使用其他算法构成一个较好的初始HM。由于HS算法是基于邻域搜索的, 初始解的好坏对搜索性能的影响很大[19], 尤其是相对复杂的优化问题, 随机生成的初始解一般不可行。将2.1节中GP采用的协方差函数的超参数σf、σn和l作为一组解向量ω, 即HS算法中的一组和声ω={σf, σn, l}, 随机取出sHM个ωi, 采用实数编码, 作为初始HM, 即{ω1, ω2, …, ωs HM}, HM为和声ω的sHM元组。

在2.1节的GP算法的学习过程中, 可以自适应地得到多组超参数, 如表2所示, 并将其作为HM。

2.2.3 产生新解

新解的第一个变量ω′1有rHMC的取值概率选择HM中ω11~ω1sHM的任何一个值, 有1-rHMC的取值概率选择HM外 (且在变量范围内) 的任何一个值。同样, 其他变量的生成方式如下:

其中, i=1, 2, …, N;rand表示[0, 1]上均匀分布的随机数;Zi为变量范围;ωij (j=1, 2, …, sHM) 为第i次产生的HM的第j个解。

如果新的和声ω′i来自HM, 要对其进行微调。具体操作如下:

其中, i=1, 2, …, N。

2.2.4 更新HM

对新解进行评估, 就是计算新解的适应度值。如果优于HM所有解中适应度值最差的一个, 则将新解更新至HM中, 具体操作如下:

2.2.5 检查停止准则

重复2.2.3和2.2.4节, 直至迭代次数达到Tmax为止。此时的HM中的最优解即为GP协方差函数超参数的最优值。

表3为利用HS算法优化后得到的结果。

3 基于优化GP的光伏发电功率预测

3.1 构建样本集

3.1.1 样本分析

首先, 光伏系统只在有日照的时间段内输出功率。由于季节影响, 每天的日出、日落和日照时间长度不尽相同, 所以光伏出力的时间段也不尽相同, 尤其是在季节变化明显的中国北部, 几天之后的天气状况截然不同, 所以没有必要选取过多的样本点。为了统一光伏出力格式, 本文规定每天光伏出力数据采样从07:40开始, 到19:40结束, 每间隔15 min是一个采样点, 全天一共49个采样点, 对于小于标准的数据赋值为零, 分别采得每个时刻的发电功率、光照强度、气温。

其次, 由于光伏发电的出力特性是由光资源的特性决定的, 不同的天气类型下气象因素一定会有很大的差别, 所以要根据预测日天气情况来选取历史功率数据作为样本。本文将光伏发电功率按照晴、晴间多云、多云 (雾) 、阴 (雨, 雪, 扬沙) 4种天气类型划分。若不考虑其他因素, 越靠近预测日的样本与预测日的功率特性越接近。本文为了将天气类型作为样本的一个特征, 将每种天气类型进行数值化处理, 见表4。这样就可以将相同天气类型的光伏出力数据组成关联性很强的数据序列, 作为GP的训练样本集。

最后, 选取关联性强的历史数据作为样本, 有利于模型的收敛。若取过多的历史数据作为输入, 会增加模型的学习复杂度, 收敛速度慢;若取过少的历史数据, 又会增大模型的预测误差, 导致模型泛化能力和连续多步预测能力差。

3.1.2 样本构建

根据上面的样本分析, 本文只选择预测日前5天中相同天气类型的历史数据。对光伏发电功率进行预测时, 首先通过天气预报获得预测日的天气类型, 然后选择与预测日天气类型相同的历史数据, 将这些数据作为训练样本集。本文将样本集构成因素归纳为下面几类。

a.天气类型W。通过天气预报获得, 分为晴、晴间多云、多云 (雾) 、阴 (雨, 雪, 扬沙) 4种类型。

b.温度属性T。T={t1, t2, t3, t4, t5}, t1、t2、t3、t4、t5分别为预测日前5天中同一时刻的温度。

c.光照强度S。S={s1, s2, s3, s4, s5}, s1、s2、s3、s4、s5分别为预测日前5天中同一时刻的光照强度。

d.历史光伏出力数据P。P={p1, p2, p3, p4, p5}, p1、p2、p3、p4、p5分别为预测日前5天中同一时刻的发电功率值。

根据上述理论, GP回归模型的训练样本集中, 输入为与预测日天气类型相同的前5天中头4天同一时刻的光伏发电功率值、气温和光照强度。输出为前5天中第5天同一时刻的发电功率值、气温和光照强度。测试样本集中, 输入为前5天中第5天同一时刻光伏发电功率值、气温和光照强度, 输出则是预测日当天该时刻的发电功率值。

3.2 建立HS-GP预测模型

构建基于HS-GP功率预测模型步骤如下。

a.由若干实测功率、光照强度和温度建立训练样本 (x, y) , 输入向量x为预测日前5天中头4天的数据, 输出向量y为预测日前5天中第5天的数据。

b.当影响发电量的各主要因素的数量级相差较大或同一控制因素的离散性太大时, 将不利于GP的学习, 需要对实际采集数据和预测样本数据进行归一化处理。

c.取式 (5) 协方差函数, 利用3.1节构建的学习样本进行学习, 通过HS算法获得最优的超参数, 生成HS-GP模型。

d.将测试样本代入到HS-GP预测模型中, 测试样本的输入向量由预测日前一天的49个发电功率、光照强度和环境温度构成, 输出向量即为预测日的49个发电功率数据。

HS-GP预测模型的流程如图1所示。

4 算例分析

本文采用龙源西藏羊八井太阳能电站远程监测平台数据, 选取2012年4月某5天相同天气类型的数据样本, 每天49个样本点, 共245个样本, 包含发电功率、天气类型、光照强度以及温度。将前4天的数据作为训练样本, 然后将第5天的数据作为测试样本, 对第6天 (预测日) 的49个功率进行预测。表5为光伏电站一段时期内的天气类型。

表6为不同日期同一个时刻的训练样本集 (以07:40为例) 。其中, 每一天的输出发电功率是第2天输入的发电功率。

表7为某一个时刻测试样本集 (以07:40为例) 。将4月26日的数据作为测试样本的输入, 输出即为4月27日 (预测日) 的预测功率值。

将HS优化的超参数代入GP的协方差函数中, 即利用优化的GP模型进行预测, 图2是优化模型的预测结果。方差表示预测值的误差允许范围。由图2可知, 所得预测值均在误差允许范围内, 优化后的GP模型取得了较高的预测精度。

优化后的GP模型 (HS-GP) 和传统GP模型预测结果的比较见表8, 表中δRE表示相对误差。HS-GP采用HS算法优化超参数, 而传统GP模型默认采用共轭梯度法优化超参数。HS-GP模型和传统GP模型的最大相对误差分别为20.06%、34.2%, 平均相对误差分别为5.578%、5.801%, HS-GP模型进行预测的最大相对误差和平均相对误差均小于传统GP模型, 表明用HS算法代替共轭梯度法取得了较好的预测效果。

由仿真结果可见, HS-GP模型进行预测的相对误差波动较小, 稳定在20%以内, 而传统GP模型进行预测的相对误差在2个时刻大于20%, 波动较大。从而表明了本文提出的采用HS优化的GP模型对光伏功率预测的有效性和可行性。

5 结论

针对采用共轭梯度法优化传统GP模型超参数时存在的一些缺陷, 本文提出采用HS算法对样本训练过程中的GP模型进行最优超参数自动搜索, 构造了HS-GP混合算法, 并将混合算法应用在光伏发电功率的预测中。算例仿真结果表明, HS-GP混合算法的预测精度优于传统GP方法。

高斯过程 篇2

一次他看到爸爸在算帐就在旁边看,爸爸刚要去干别的事他告诉爸爸算错了,爸爸重算了一遍果然错了爸爸觉得儿子很爸觉得儿子很聪明倾家荡产也得让儿子上学,于是高斯10岁时进了小学。

那年老师出了一道计算题,从1加到100同学们都在埋头苦算,只有高斯一个人在思考,他在本子上写了5050就交给了老师,背起书包回家了。

从这个故事中我体会到:在学习中我们要像高斯那样善于观察、爱动脑筋、遇到问题不慌张,善于发现它的规律,这样才能利用这把宝贵的“钥匙”解开难题。

然而不动脑筋的结果又怎样呢?从前有个小孩他很聪明,很小的时候就会作诗,但是后来他骄傲了,变得不爱动脑筋,成了一个平庸的人。

可见不动脑筋的坏处多么大啊! 《高斯》这个故事让我受益非浅,我喜欢读它。

高斯的萝卜灯 篇3

高斯从小就是在困苦的环境中锻炼和成长起来的。他的父亲是一个勤劳的装水管的工人,母亲是一个石匠的女儿,没有什么文化。高斯是他们的独生儿子,他们对高斯非常宠爱。由于高斯父亲的收入微薄,一家三口不得不省吃俭用,精打细算地过着日子。小高斯很懂事,从不随便向爸妈要钱,从小就养成俭朴的习惯。

高斯生活的时代,还没有电灯。那时,有钱人家为了照明,用铅、锡、铜等金属做成各种式样的烛台,在上面插上一支支粗粗的蜡烛,点起来很亮。高斯家穷,买不起这样的烛台,也点不起蜡烛。每天一到晚上,爸妈就催促高斯早点上床睡觉。小高斯读书很用功,晚上没有灯光看书,在床上翻来覆去,说什么也睡不着觉。

一天,妈妈从菜场买菜回来,篮子里装着几只红萝卜。

“妈妈,给我一只萝卜吧!”小高斯紧蹲在妈妈的身边,轻轻地摇着妈妈的臂膀。

“傻孩子,生萝卜辣,有什么好吃的!”妈妈随口讲着。

“不,妈妈,我不是要吃,我要用它来做一盏美丽的灯。”高斯一面用手比划,一面微笑着说。

从妈妈手里接过一只萝卜,高斯把它洗净擦干。然后用小刀一点一点地把萝卜心子挖空,倒点油进去,再放上一根灯芯,就成为一盏很别致的“萝卜灯”了。就在这盏灯旁,高斯常常学习到深夜。

高斯一生中,一直保持着童年时代就养成的这种俭朴的美德。三十岁起,他除了从事数学,物理方面的科研外,还一直担任着哥廷根天文台台长的职务,已经成为一位著名的科学家了。按照当时的经济收入,他完全可以生活得很优裕、舒适。但是,高斯从不追求这些。在哥廷根天文台里,他住着一间很小的房子,里面只放着几件很简单的家具,一支暗淡的蜡烛,再加上简单的食品和衣帽,这些几乎就是高斯全部物质上的享受。

一个生活上俭朴的人,往往在学习和工作上是勤奋的。

高斯从23岁起,就开始系统地研究天文学了。他每天坚持不懈地观察慧星的位置,测算日月蚀的有关数据。为了进行有关木星摄动智神星的计算,他需要用到337000个数据,并对它们进行大量繁琐的数学运算。正因为他日以继夜,反复不断地使用对数表,表中数据用得滚瓜烂熟,以致他能背出表中对数的前几位小数。天才加勤奋,正是高斯具有惊人记忆力和心算力的秘诀。

高斯过程 篇4

高校科技成果转化是指研究如何把以“高、新、尖”知识为主要载体的高校科技成果如何投入到现实的生产生活当中去, 使之能把这些抽象的知识转化为现实的、具体的、可推动社会发展、改善人民生活的切实生产力[1,2]。高校科技成果转化是一个分阶段且动态的过程, 是一个不断挖掘这些科技成果本身潜在的生产能力并使之转变为具体生产能力的过程。对高校科技成果转化做正确的评价不仅能够促进这些科技资源的优化配置, 更是提高高校科技管理水平、增强高校管理能力的重要手段和可靠保障。它不仅和国家科技发展的长远目标息息相关, 而且对科技健康有序发展也至关重要, 对学术风气准则的正确树立, 学术创新的扎实推进都具有重要的意义。本文基于高斯过程回归理论, 提出了一种新的高校科技成果转化评价方法。该方法能够充分挖掘评价指标间的相互关系, 且无须手工设定初始化参数, 原理简单, 易于操作实现, 同时实验结果表明所得到的评价结果更为稳定且准确。

2 现状

当前, 我国大部分高校都对科研成果的理论水平和所包含的学术价值的评价过于重视, 科研成果在实际应用中水平的评价却缺乏重视, 尤其是对科研成果本身所包含的创新性, 以及产业化后能够取得的经济效益与社会效益没有明确具体的要求。另外, 高校教师的业绩考核、职称评定等依然对发表论文、著作的数量、级别、档次等过于强调, 这种片面的方式导致了小部分高校教师在名利驱使下做出了造假论文、抄袭创新点等不良学术行为[3]。长此以往, 这种做法抑制了高校教师在科研中的研究兴趣, 阻碍了创新思维, 许多高校科研人员都放弃了有可能取得重大科技突破却需要冒较大风险的研究方向, 转去选择那些“多快好省”的研究课题, 造成了高校科研成果大量的低水平无意义的重复, 甚至是著名学者也是如此。

综上所述, 对高校科研成果转化评价做深刻地探究是有必要且迫切的。近几年来, 研究如何促进高校科技成果转化、加速科技成果产业化与市场化已成为管理领域的研究热点之一。据统计, 我国高校每年的科技成果总量在6000-8000 项, 在数量上与发达国家相比不显丝毫逊色, 但真正能够推广应用, 取得规模效益的科技成果数量却还不到总量的10%。高校科技成果转化缓慢, 潜能远没有发挥出来, 其原因除了科技成果自身与市场脱节、科技成果转化投入人力物力不足因素外, 缺少科学合理的高校科技成果转化评价标准也是制约高校科技成果转化发展的重要原因。

当前, 我国所采用的科技成果转化评价方法主要包括网络层次分析[4,5]、模糊综合评价[6,7,8,14]、BP神经网络[9,10,11]等方法。然而, 通过分析评价指标体系可以看出, 各个指标间不是互相独立的, 它们之间存在互相影响互相支配的情况, 使得网络层次分析、模糊综合评价等传统方法无法做出准确的评价。BP神经网络虽然在一定程度上考虑指标间的关系, 但对初始网络权重设置非常敏感, 以不同的权重初始化神经网络往往会收敛到不同的局部极值, 这说明BP神经网络的评价结果不稳定。同时, BP神经网络算法计算复杂、收敛速度缓慢也是它难以克服的缺陷。

3 评价指标构建

高校科技成果转化评价是一项专业性、技术性极强的管理工作, 涉及到多种专业学科的交叉关联, 在评价过程中必须简化后再切合实际的假设和前提下, 针对要研究的特定领域和问题建立符合实际情况的评价模型以及评价指标体系。

目前, 没有一套完整的高校科技成果转化评价的测度方法与评价指标体系提供给科技成果评价工作者使用, 并且没有统一标准, 发展尚不成熟。同时, 高校科技成果种类繁多, 每一类都有着独特的特点, 因此在进行科技成果转化的评价过程中要理清头绪、统筹兼顾, 不能顾此失彼, 应充分考虑到各类成果的区别与共性[10]。通常科技成果评价工作者期望所选择的一整套评价指标体系可以较为充分地满足高校科技成果转化评价的要求, 不仅能够较为全面地反映出高校科技成果转化的各方面特点, 做到能够科学、客观、公平体现待评价成果的特征, 还要考虑到所采用评价方式实现的可能性, 所采用的指标体系与所用的评价方式的匹配程度, 再者, 还应考虑指标使用者对指标的理解程度。综上所述, 基于以上原则为指导, 对高校科技成果转化的评价过程中所选择的高校科技成果转化评价指标具体如下:

(1) 科技创新能力:在当前科技成果转化为现实生产力的过程中, 科研团队所体现出来的科技创新能力主要包括师资力量x11、软/硬件基础 (包括仪器设备、查阅资料平台等) x12、参与人员的研究水平x13、每年学术交流次数x14。

(2 ) 科技成果转化能力:反映科技成果转化情况的指标主要包括科技成果的成功转让率x21、科技成果的转让收入x22、团队所在单位的支持力度x23、成果转化中的经费投入情况x24。

(3) 研发制造水平:研发制造水平是高校最基本、最具核心竞争力评价指标, 主要包括每年所成功申请的科研项目数量x31、团队所主导的科研与技术开发项目完成情况x32、每年所申请专利的数量及质量情况x33、每年人均获得的研发经费数量x34、全职投入到研发中的人员人均配备情况x35。

(4) 所取得的经济效益和社会效益:它反映了当前科技成果转化过程中所产生的社会效益x41、经济效益x42 和从技术层面角度出发对经济增长所带来的贡献x43。

具体的评价指标体系如附表1 所示。

4 高斯过程回归模型

高斯过程考虑的是把空间 χ 的点映射到空间中去的函数f的分布情况, 它的式样由均值方程m (x) 和协方差矩阵K唯一确定[13]。对于一个给定的输入数据集合, 高斯过程假设与其相对应的函数值集合f=[ f (x1) , …, f (xn) ]T具有联合高斯分布的特性, 表示如下:

其中, X表示训练集中输入向量xi链接构成的矩阵, 即X=[x1, …, xn]T, K (X, X) 表示一个n×n的协方差矩阵, 其具体表示形式为:Kij=k (xi, xj) 。本文选取常见的高斯核函数作为k (xi, xj) 的表示形式:

其中, 表示向量信号方差, l表示向量信号带宽。在回归模型中, 已知训练数据是一个包含有n个输入—输出对的集合, 可以表示为D@{xi, yi| i=1, …, n}, 其中, xi∈Rd, yi∈R。

在给定训练数据集的前提下, 使用回归过程的目的是对一个新输入的d维测试数据, 根据学习到的训练集中的输入输出关系, 预测出其对应的输出值。

高斯过程回归是基于预测值是由一个未知具体形式的隐函数f (x) 在高斯加性噪声的背景条件下产生的这一假设条件下展开的, 可表示为:

对f (x) 加上高斯过程先验约束后, 可得到在均值函数为0的条件下训练集输出y和测试集输出的联合概率分布:

其中X*表示输入的测试数据构成的矩阵。由上式, 我们可以得到测试数据对应输出的概率分布:

其中:

上式 (6) 表明预测结果是训练集输出的加权线性组合。一般来说, 在高斯过程回归中, 对于给定的测试点在训练集中与之结构越相似的点所赋予的权值越大。这一特性也是本文能够应用于高校科技成果转化评价的重要原因。

5 以某高校为例分析

本节以广东省某高校为例利用高斯过程回归算法对该单位科技成果进行评价。选取该单位的2012 年至2013 年时间段107 项科技成果作为研究样本, 其中前100 项作为训练样本, 后7 项保留下来不参与训练过程, 作为测试样本在测试算法效果时作为输入数据使用用以评估算法效果。该算法分为训练和预测两个主要步骤。首先, 将每一个项目的所有评价指标标量以列向量的形式连接表示, 记为xi= [xi11, xi12, …, xi42, xi43], 其中, i表示训练样本集合中的第i个样本, 堆叠所有训练样本向量得到训练样本矩阵X=[x1, x1, …, x100]T, 其对应的评价结果向量记为:y=[y1, y1, …, y100]T。将矩阵X、向量y带入方程 (6) , 通过梯度下降法求出所需参数 σ, σf, l。在预测步骤中, 把测试样本向量及训练阶段求解参数 σ, σf, l代入到式 (6) 中, 计算得到预测评价结果f*。把后7 项科技成果转化评价指标向量依次代入后, 得到的评价结果如表2 所示:

从表2 中的评价结果可以看出, 7 项科技成果转化评价结果预测值与实际专家评估值误差在[-0.5%, +0.5%]之间, 上述数据说明本文所选择的科技成果评价指标符合科技成果转化的特点, 同时, 这一评价结果也表明我们所采用高斯过程回归模型来对高校科技成果的转化进行评价, 这一方法有着非常好的预测评价能力, 非常适合当前对高校科技成果进行评价这一目的。

6 结论

高斯的故事 篇5

约翰·卡尔·弗里德里希·高斯(C.F.Gauss,1777年4月30日-1855年2月23日),德国著名数学家、物理学家、天文学家、大地测量学家。高斯被认为是历史上最重要的数学家之一,并有“数学王子”的美誉。生于布伦瑞克,1792年进入Collegium学习,在那里他独立发现了二项式定理的一般形式、数论上的“二次互反律”、素数定理、及算术-几何平均数。1795年高斯进入哥廷根大学,1796年得到了一个数学史上极重要的结果,就是《正十七边形尺规作图之理论与方法》。1855年2月23日去世。高斯在历史上影响巨大,可以和阿基米德、牛顿、欧拉并列。

高斯是一对普通夫妇的儿子。他的母亲是一个贫穷石匠的女儿,虽然十分聪明,但却没有接受过教育,近似于文盲。在她成为高斯父亲的第二个妻子之前,她从事女佣工作。他的父亲曾做过园丁,工头,商人的助手和一个小保险公司的评估师。在成长过程中,幼年的高斯主要得力于母亲和舅舅:高斯的母亲罗捷雅、舅舅弗利德里希(Friederich)。弗利德里希富有智慧,为人热情而又聪明能干投身于纺织贸易颇有成就。他发现姐姐的儿子聪明伶利,因此他就把一部分精力花在这位小天才身上,用生动活泼的方式开发高斯的智力。若干年后,已成年并成就显赫的高斯回想起舅舅为他所做的一切,深感对他成才之重要,他想到舅舅多产的思想,不无伤感地说,舅舅去世使“我们失去了一位天才”。正是由于弗利德里希慧眼识英才,经常劝导姐夫让孩子向学者方面发展,才使得高斯没有成为园丁或者泥瓦匠。

7岁那年,高斯第一次上学了。头两年没有什么特殊的事情。1787年高斯10岁,他进入了学习数学的班次,这是一个首次创办的班,孩子们在这之前都没有听说过算术这么一门课程。数学教师是布特纳,他对高斯的成长也起了一定作用。

当然,这也是一个等差数列的求和问题。当布特纳刚一写完时,高斯也算完并把写有答案的小石板交了上去。E.T.贝尔写道,高斯晚年经常喜欢向人们谈论这件事,说当时只有他写的答案是正确的,而其他的孩子们都错了。高斯没有明确地讲过,他是用什么方法那么快就解决了这个问题。数学史家们倾向于认为,高斯当时已掌握了等差数列求和的方法。一位年仅10岁的孩子,能独立发现这一数学方法实属很不平常。贝尔根据高斯本人晚年的说法而叙述的史实,应该是比较可信的。而且,这更能反映高斯从小就注意把握更本质的数学方法这一特点。

高斯的计算能力,更主要地是高斯独到的数学方法、非同一般的创造力,使布特纳对他刮目相看。他特意从汉堡买了最好的算术书送给高斯,说:“你已经超过了我,我没有什么东西可以教你了。”接着,高斯与布特纳的助手巴特尔斯建立了真诚的友谊,直到巴特尔斯逝世。他们一起学习,互相帮助,高斯由此开始了真正的数学研究。

1788年,11岁的高斯进入了文科学校,他在新的学校里,所有的功课都极好,特别是古典文学、数学尤为突出。经过巴特尔斯等人的引荐,布伦兹维克公爵召见了14岁的高斯。这位朴实、聪明但家境贫寒的孩子赢得了公爵的同情,公爵慷慨地提出愿意作高斯的资助人,让他继续学习。布伦兹维克公爵在高斯的成才过程中起了举足轻重的作用。

1792年高斯进入布伦兹维克的卡罗琳学院继续学习。1795年,公爵又为他支付各种费用,送他入德国著名的哥丁根大学,这样就使得高斯得以按照自己的理想,勤奋地学习和开始进行创造性的研究。1799年,高斯完成了博士论文,回到家乡布伦兹维克,正当他为自己的前途、生计担忧而病倒时─虽然他的博士论文顺利通过了,已被授予博士学位,同时获得了讲师职位,但他没有能成功地吸引学生,因此只能回老家-又是公爵伸手救援他。公爵为高斯付诸了长篇博士论文的印刷费用,送给他一幢公寓,又为他印刷了《算术研究》,使该书得以在1801年问世;还负担了高斯的所有生活费用。所有这一切,令高斯十分感动。他在博士论文和《算术研究》中,写下了情真意切的献词:“献给大公”,“你的仁慈,将我从所有烦恼中解放出来,使我能从事这种独特的研究”。

1806年,公爵在抵抗拿破仑统帅的法军时不幸阵亡,这给高斯以沉重打击。他悲痛欲绝,长时间对法国人有一种深深的敌意。大公的去世给高斯带来了经济上的拮据,德国处于法军奴役下的不幸,以及第一个妻子的逝世,这一切使得高斯有些心灰意冷,但他是位刚强的汉子,从不向他人透露自己的窘况,也不让朋友安慰自己的不幸。人们只是在19世纪整理他的未公布于众的数学手稿时才得知他那时的心态。在一篇讨论椭圆函数的手搞中,突然插入了一段细微的铅笔字:“对我来说,死去也比这样的生活更好受些。” 为了不使德国失去最伟大的天才,德国著名学者洪堡(B.A.Von Humboldt)联合其他学者和政界人物,为高斯争取到了享有特权的哥丁根大学数学和天文学教授,以及哥丁根天文台台长的职位。1807年,高斯赴哥丁根就职,全家迁居于此。从这时起,除了一次到柏林去参加科学会议以外,他一直住在哥丁根。洪堡等人的努力,不仅使得高斯一家人有了舒适的生活环境,高斯本人可以充分发挥其天才,而且为哥丁根数学学派的创立、德国成为世界科学中心和数学中心创造了条件。同时,这也标志着科学研究社会化的一个良好开端。

18岁的高斯发现了质数分布定理和最小二乘法。通过对足够多的测量数据的处理后,可以得到一个新的、概率性质的测量结果。在这些基础之上,高斯随后专注于曲面与曲线的计算,并成功得到高斯钟形曲线(正态分布曲线)。其函数被命名为标准正态分布(或高斯分布),并在概率计算中大量使用。

在高斯19岁时,仅用没有刻度的尺子与圆规便构造出了正17边形(阿基米德与牛顿均未画出)。并为流传了2000年的欧氏几何提供了自古希腊时代以来的第一次重要补充。

高斯在他的建立在最小二乘法基础上的测量平差理论的帮助下,计算出天体的运行轨迹。并用这种方法,发现了谷神星的运行轨迹。谷神星于1801年由意大利天文学家皮亚齐发现,但他因病耽误了观测,失去了这颗小行星的轨迹。皮亚齐以希腊神话中“丰收女神”(Ceres)来命名它,即谷神星(Planetoiden Ceres),并将以前观测的位置发表出来,希望全球的天文学家一起寻找。当时,24岁的高斯得悉后,只花了几个星期,通过以前的三次观测数据,用他的最小二乘法得到了谷神星的椭圆轨道,计算出了谷神星的运行轨迹。尽管两年前高斯就因证明了代数基本定理获得博士学位,同年出版了他的经典著作《算术研究》,但还是谷神星的轨道使他一举名震科坛。奥地利天文学家 Heinrich Olbers在高斯的计算出的轨道上成功发现了这颗小行星。从此高斯名扬天下。高斯将这种方法著述在著作《天体运动论》(Theoria Motus Corporum Coelestium in sectionibus conicis solem ambientium)中。

高斯设计的汉诺威大地测量的三角网为了获知任意一年中复活节的日期,高斯推导了复活节日期的计算公式。

在1818年至1826年之间高斯主导了汉诺威公国的大地测量工作。通过他发明的以最小二乘法为基础的测量平差的方法和求解线性方程组的方法,显著的提高了测量的精度。出于对实际应用的兴趣,他发明了日光反射仪,可以将光束反射至大约450公里外的地方。高斯后来不止一次地为原先的设计作出改进,试制成功被广泛应用于大地测量的镜式六分仪。

高斯亲自参加野外测量工作。他白天观测,夜晚计算。五六年间,经他亲自计算过的大地测量数据,超过100万次。当高斯领导的三角测量外场观测已走上正轨后,高斯就把主要精力转移到处理观测成果的计算上来,并写出了近20篇对现代大地测量学具有重大意义的论文。在这些论文中,推导了由椭圆面向圆球面投影时的公式,并作出了详细证明,这套理论在今天仍有应用价值。汉诺威公国的大地测量工作直到1848年才结束,这项大地测量史上的巨大工程,如果没有高斯在理论上的仔细推敲,在观测上力图合理精确,在数据处理上尽量周密细致的出色表现,就不能完成。在当时条件下布设这样大规模的大地控制网,精确地确定2578个三角点的大地坐标,可以说是一项了不起的成就。

为了用椭圆在球面上的正形投影理论以解决大地测量中出现的问题,在这段时间内高斯亦从事了曲面和投影的理论,并成为了微分几何的重要理论基础。他独立地提出了不能证明欧氏几何的平行公设具有‘物理的’必然性,至少不能用人类的理智给出这种证明。但他的非欧几何理论并未发表。也许他是出于对同时代的人不能理解这种超常理论的担忧。相对论证明了宇宙空间实际上是非欧几何的空间。高斯的思想被近100年后的物理学接受了。

1801年发表的《算术研究》是数学史上为数不多的经典著作之一,它开辟了数论研究的全新时代。在这本书中,高斯不仅把19世纪以前数论中的一系列孤立的结果予以系统的整理,给出了标准记号的和完整的体系,而且详细地阐述了他自己的成果,其中主要是同余理论、剩余理论以及型的理论。同余概念最早是由L.欧拉提出的,高斯则首次引进了同余的记号并系统而又深入地阐述了同余式的理论,包括定义相同模的同余式运算、多项式同余式的基本定理的证明、对幂以及多项式的同余式的处理。19世纪20年代,他再次发展同余式理论,着重研究了可应用于高次同余式的互反律,继二次剩余之后,得出了三次和双二次剩余理论。此后,为了使这一理论更趋简单,他将复数引入数论,从而开创了复整数理论。高斯系统化并扩展了型的理论。他给出型的等价定义和一系列关于型的等价定理,研究了型的复合(乘积)以及关于二次和三次型的处理。1830年,高斯对型和型类所给出的几何表示,标志着数的几何理论发展的开端。在《算术研究》中他还进一步发展了分圆理论,把分圆问题归结为解二项方程的问题,并建立起二项方程的理论。后来N.H.阿贝尔按高斯对二项方程的处理,着手探讨了高次方程的可解性问题。

高斯在代数方面的代表性成就是他对代数基本定理的证明。高斯的方法不是去计算一个根,而是证明它的存在。这个方式开创了探讨数学中整个存在性问题的新途径。他曾先后四次给出这个定理的证明,在这些证明中应用了复数,并且合理地给出了复数及其代数运算的几何表示,这不仅有效地巩固了复数的地位,而且使单复变函数理论的建立更为直观、合理。在复分析方面,高斯提出了不少单复变函数的基本概念,著名的柯西积分定理(复变函数沿不包括奇点的闭曲线上的积分为零),也是高斯在1811年首先提出并加以应用的。复函数在数论中的深入应用,又使高斯发现椭圆函数的双周期性,开创椭圆函数论这一重大的领域;但与非欧几何一样,关于椭圆函数他生前未发表任何文章。1812年,高斯发表了在分析方面的重要论文《无穷级数的一般研究》,其中引入了高斯级数的概念。他除了证明这些级数的性质外,还通过对它们敛散性的讨论,开创了关于级数敛散性的研究。

非欧几里得几何是高斯的又一重大发现。有关的思想最早可以追溯到1792年,即高斯15岁那年。那时他已经意识到除欧氏几何外还存在着一个无逻辑矛盾的几何,其中欧氏几何的平行公设不成立。1799年他开始重视开发新几何学的内容,并在1813年左右形成较完整的思想。高斯深信非欧几何在逻辑上相容并确认其具有可应用性。虽然高斯生前没有发表。

高斯不仅是数学家,还是那个时代最伟大的物理学家和天文学家之一。在《算术研究》问世的同一年,即1801年的元旦,一位意大利天文学家在西西里岛观察到在白羊座(Aries)附近有光度八等的星移动,这颗现在被称作谷神星(Ceres)的小行星在天空出现了41天,扫过八度角之后,就在太阳的光芒下没了踪影。当时天文学家无法确定这颗新星是彗星还是行星,这个问题很快成了学术界关注的焦点,甚至成了哲学问题。黑格尔就曾写文章嘲讽天文学家说,不必那么热衷去找寻第八颗行星,他认为用他的逻辑方法可以证明太阳系的行星,不多不少正好是七颗。高斯也对这颗星着了迷,他利用天文学家提供的观测资料,不慌不忙地算出了它的轨迹。不管黑格尔有多么不高兴,几个月以后,这颗最早发现迄今仍是最大的小行星准时出现在高斯指定的位置上。自那以后,行星、大行星(海王星)接二连三地被发现了。

在物理学方面高斯最引人注目的成就是在1833年和物理学家韦伯发明了有线电报,这使高斯的声望超出了学术圈而进入公众社会。除此以外,高斯在力学、测地学、水工学、电动学、磁学和光学等方面均有杰出的贡献。即使是数学方面,我们谈到的也只是他年轻时候在数论领域里所做的一小部分工作,在他漫长的一生中,他几乎在数学的每个领域都有开创性的工作。例如,在他发表了《曲面论上的一般研究》之后大约一个世纪,爱因斯坦评论说:“高斯对于近代物理学的发展,尤其是对于相对论的数学基础所作的贡献(指曲面论),其重要性是超越一切,无与伦比的。”

从1989年直到2001年年底,高斯的肖像和他所写的正态分布曲线与一些在哥廷根突出的建筑物,一起被放入德国10马克的钞票中。另一方面,在汉诺威有和他有关的鸡血石以及三角测量方法。在德国也发行了三种用以表彰高斯的邮票。第一种邮票(第725号)发行于1955年−他死后的第100周年;另外两种邮票(第1246号.第1811号)发行于1977年,他出生的第200周年。

数学王子高斯的故事 篇6

像往常一样,前两道题目在两个小时内顺利地完成了. 第三道题写在一张小纸条上,是要求只用圆规和一把没有刻度的直尺做出正17边形. 青年没有在意,像做前两道题一样开始做起来. 然而,做着做着,青年感到越来越吃力.

困难激起了青年的斗志:我一定要把它做出来!他拿起圆规和直尺,在纸上画着,尝试着用一些超常规的思路去解这道题. 当窗口露出一丝曙光时,青年长舒了一口气,他终于做出了这道难题.

作业交给导师后,导师当即惊呆了. 他用颤抖的声音对青年说:“这真是你自己做出来的?你知不知道,你解开了一道有两千多年历史的数学悬案?阿基米德没有解出来,牛顿也没有解出来,你竟然一个晚上就解出来了!你真是天才!我最近正在研究这道难题,昨天给你布置题目时,不小心把写有这个题目的小纸条夹在了给你的题目里.”

多年以后,这个青年回忆起这一幕时,总是说:“如果有人告诉我,这是一道有两千多年历史的数学难题,我不可能在一个晚上解决它. ”

这个青年就是数学王子高斯.

有些事情,在不清楚它到底有多难时,我们往往能够做得更好!

高斯过程 篇7

近年来,我国风电产业正在由粗放式发展向精细化发展转变,风力发电企业对已投运的风电机组的运行管理越来越重视。每台机组发电性能的高低对风电场的运行经济效益有着重要的影响。风电机组的发电性能通常用风能利用系数表示,反映其对风能的利用效率,是机组性能好坏的重要标志,较高的发电性能或风能利用系数能够提高风电机组的年发电量。由于风电机组运行环境恶劣,运行工况复杂多变,导致机组的实际发电性能往往偏离机组的设计指标,风能利用系数降低。文献[1]研究了叶片安装误差对风电机组性能的影响;文献[2]首先建立双馈风电机组模型,在此基础上从风能最大利用和安全运行角度,提出考虑发电机损耗最小的功率控制策略来提高机组发电性能;文献[3]讨论了风剪切效应对发电量的影响;空气密度对风电机组发电性能也有一定影响,文献[4]分析了不同海拔高度下空气密度对机组发电量的影响,通过优化叶片翼型提高发电性能;文献[5]以功率曲线为风电机组性能的评价标准,比较了最大值法、最大概率法和比恩法3种功率曲线建模方法,并估计了不确定度;文献[6]采用模糊滑模控制来改进风电机组控制系统性能。风电机组监控与数据采集(SCADA)系统记录了机组的环境因素(风速、气温等)和各个重要组成部件的运行参数,全面反映了机组的运行状态和性能。本文以风电机组的SCADA运行数据为基础,首先对影响风电机组发电性能的因素进行了详细分析,进而采用高斯过程回归方法建立风电机组的发电性能模型。该模型能够实时监测风电机组发电性能的变化,当发电性能异常降低时,及时提醒运行人员检查风电机组各个部件的运行状态。

1 风电机组发电性能影响因素分析

待研究的风电机组为张家口某风电场额定功率为1.5 MW的变桨变速双馈机组。该机组切入风速、额定风速、切出风速分别为3 m/s、12 m/s和25 m/s,叶轮直径为77 m。该机组的SCADA系统采用10 s和10 min 2种不同时间间隔记录环境参数和各个重要部件传感器的测量参数。10 s和10 min间隔记录的内容相同,每条记录包括时间标签、风速、功率、环境温度、叶轮转速、叶片桨距角、偏航误差等共计46个参数。如前所述,风电机组的发电性能利用风能利用系数描述,风能利用系数为:

其中,P为某时刻机组实发功率;ρ为空气密度;A为叶轮扫风面积;v为该时刻风速。由动量理论,风能利用系数最大不超过贝兹极限,即0.593。风能利用系数越大,风电机组从风资源中获取的能量越多,发电性能越高。

变桨变速风电机组通常具有几个不同的运行区域。在切入风速和额定风速之间,机组工作在最大风能追踪阶段。在此区间,机组的桨距角固定(一般在0°~2°附近),机组的转速和转矩随风速变化,使叶尖速比接近最佳值,达到最大风能追踪的目的。在额定风速以上至切出风速,机组工作在恒功率控制阶段。由于风速已超过额定风速,为保持功率不超过额定值,机组控制系统通过叶片桨距角的变化,甩掉多余的风能,使功率保持在额定值附近。由于在额定风速以上通过增大叶片桨距角人为减小风能利用系数,且根据风速威布尔概率分布曲线,低风速出现的频次远高于高风速出现的频次,本文仅研究额定风速以下的风电机组的发电性能。图1和图2分别为同一风电机组在2个不同时段的风能利用系数与风速的关系图。时段1和时段2数据为10 min间隔数据,都为1423条记录。利用每条记录中的功率和风速数据根据式(1)计算得到该点的风能利用系数Cp。

由于风速、风向随机变化,偏航系统、控制系统等存在偏差,即使在风速相同的情况下,风电机组发出的功率也会不同。在图1和图2中,与某一风速对应的Cp值有多个而不是一个,Cp散点呈带状分布。时段1为风电机组正常运行时的发电性能,而时段2风能利用系数明显异常偏低。

对发电性能或风能利用系数有影响的关键因素如下。

(1)风资源特性,包括风速和湍流。

由于在不同风速下风电机组的运行方式不同,对风能利用系数有很大影响,因此风速是影响因素之一。湍流反映风速在短时间内变化的情况,是由地形变化和风的不稳定性引起的,可以用湍流强度表示。湍流强度定义为瞬时风速标准差与平均风速的比值:

其中,vi为10 s间隔风速;为10 min间隔的平均风速;N为10 s间隔采样的风速个数。图3为时段1的湍流强度。

图3中,在低风速时风速不稳定,湍流强度较大,而在高风速时风速平稳,湍流强度较小且分布集中。当湍流强度较大时,由于风速风向变化频繁,风能不能持续作用在叶轮上转化为动能,导致机组实际输出功率往往低于测得的瞬时风功率,风能利用系数降低。在同一风电场中,由于地形对来流风的影响,地势较高或平坦处的机组的湍流强度小;而位于山脚或山谷处的机组的湍流强度与前者相比较大。因此风资源作为环境因素对风电机组发电性能有重要的影响且该影响不可控。根据风电机组所在位置的风资源特性来个性化地优化调整其运行方式和控制参数是提高机组发电性能的可行措施之一。

(2)叶轮变桨系统,包括平均桨距角、3个叶片两两之间的桨距角偏差(叶片1、2偏差,叶片2、3偏差,叶片3、1偏差)。

风作用在叶片上,产生气动转矩,推动叶轮旋转做功。风电机组发电性能的高低与叶轮捕捉风能的效率密切相关。叶片桨距角是指叶片剖面的翼弦与叶轮扫略平面之间的夹角,桨距角变化时能够调整叶片的迎风角度,从而增加或减少叶片产生的转矩,进而改变机组的输出功率。风电机组目前主要采用集中变桨距控制,即3个叶片的桨距角变化相同。在风电机组SCADA系统中,通常都记录3个叶片各自实际的桨距角大小。

平均桨距角为3个叶片桨距角的平均值。在额定风速以下,机组的平均桨距角应在0°附近保持不变,从而在不同风速下都能产生最大的气动转矩。但如图4所示,由于变桨距控制系统或执行机构的误差,造成额定风速以下桨距角变化,从而影响风电机组的发电性能。

同样,由于变桨距执行机构的误差,本应该相同的3个叶片的实际桨距角之间也会不同,造成叶片1与2、叶片2与3、叶片3与1两两之间的桨距角产生误差,即桨叶不对称(blade angle asymmetry)。图5为时段2机组叶片2与3桨距角之间的偏差,该偏差不仅较大,而且偏向一侧。由于叶片之间的桨距角不同,导致某些叶片无法工作在最佳桨距角状态,叶片产生的气动转矩减小,从而影响机组的发电性能,导致风能利用系数减小。

(3)偏航误差。

位于机舱顶部的风向标检测风向。风向发生明显改变时,风电机组偏航系统通过偏航电机使机舱和叶轮旋转进行对风,保证叶轮与来流风向垂直,从而使叶轮捕获最大的风能。由于风向时变且偏航系统对风存在较大惯性,对风会存在一定的误差,风电机组机舱轴线和风向的夹角即偏航误差,记为θ,分布在0°附近。由于偏航误差θ的存在,叶轮捕获的风能为:

其中,Po为偏航误差为0°时捕获的风能。偏航误差造成风电机组发电能力和风能利用系数降低。图6为2个时段风电机组的偏航误差分布。

从图6可以看出,时段2的偏航误差分布明显较时段1的松散,偏航误差较大,这也是导致时段2风能利用系数偏低的重要原因。

(4)叶尖速比。

在切入风速至额定风速之间,风电机组工作在最大风能追踪模式。当风速变化时,控制系统需要调节发电机电磁转矩从而改变叶轮旋转速度,使变化的风速和叶片自身旋转速度两者合成的叶片所感受到的可视风速对叶片的攻角保持最佳位置,从而保证在不同的风速下叶轮都能获得最大的气动转矩。叶尖速比反映了叶片转速和风速的关系,记为λ,可表示为:

其中,ω为叶轮旋转角速度;R为叶轮半径;v为风速。当叶轮转速与风速的比值即叶尖速比保持不变时,可视风速对叶片的攻角也会保持不变。对于大型兆瓦级三叶片风电机组,使叶片产生最大气动转矩的最佳叶尖速比λopt通常在7~10之间。对于本文研究的机组,λopt为8.5。在切入风速至额定风速之间,风电机组控制系统在风速变化时需要不断调整叶轮转速,维持叶尖速比在最佳值附近,达到较高的发电性能。因此SCADA数据中记录的叶尖速比是风电机组控制系统运行好坏的重要标志,也反映了控制系统对发电性能的影响。图7为2个时段在某风速区间的叶尖速比值的分布。

由图7可见,时段1的叶尖速比分布在该机组的最佳叶尖速比附近;而时段2的叶尖速比分布明显偏离最佳叶尖速比,导致叶片效率和发电性能降低。因此,叶尖速比也是风电机组发电性能的重要影响因素。

2 基于高斯过程回归的风电机组发电性能建模

2.1 高斯过程回归建模

在上节分析中,风电机组的发电性能与环境因素、机组自身部件运行状态有密切关系。本文采用图1中风电机组正常运行时段1的数据和高斯过程回归方法建立机组发电性能模型。发电性能模型的输出为风电机组风能利用系数Cp的预测值,模型的输入为对发电性能有密切影响的因素,包括上节分析中的风速、湍流、叶片平均桨距角、叶片两两之间的桨距角偏差、偏航误差、叶尖速比。由于风电机组的能量来源为风,当风速改变时,风电机组的运行参数都会随风速变化,运行数据具有很强的随机性。同时由于风电机组处在户外,工作环境恶劣,昼夜温差、风沙、振动等都会导致传感器测得的运行数据存在较大的测量噪声。强随机性和高噪声是风电机组运行数据的2个重要特性,因此所选择的发电性能建模方法必须体现风电机组数据的以上2个特性。

高斯过程建模是贝叶斯方法的一种,其全部统计特性由其均值m(x)和协方差函数k(x,x′)确定,即:

其中,GP表示高斯随机过程。由于观测目标值y中含有观测噪声,可建立高斯过程的一般模型为:

其中,ε为独立的白噪声,符合高斯分布,均值为0,方差为σn2,记为ε~N(0,σn2)。设该高斯过程已有N个观测样本数据对(X,y),X={x1,…,xi,…,xN},y={y1,…,yi,…,yN}。由于f(x)和ε均符合高斯分布,则y同样服从高斯分布,其有限观测值联合分布的集合可形成一个高斯过程,即:

其中,δi j为Kronecker函数,当i=j时,函数δi j=1,否则δij=0。当以矩阵形式来表示协方差函数时,有:

其中,C(X,X)为N×N阶协方差矩阵;K(X,X)为N×N阶核矩阵,其元素Kij=k(xi,xj);I为N×N阶单位矩阵。对于符合该高斯分布的新的输入为x*及其未知输出y*,与已有样本(X,y)构成的先验联合高斯分布为[7,8,9]:

在已有样本数据对(X,y)和输入x*的条件下,y*的后验概率分布为:

其中,为未知输出y*的预测均值;σ*2=K(x*,x*)-K(x*,X)[K(X,X)+σn2I]-1K(X,x*)为未知输出y*的预测方差。

高斯过程建模中的协方差函数k(x,x′)是描述建模随机运行数据的重要数字特征,该函数中的参数反映了运行数据在不同输入维度上的关系紧密程度。模型中的噪声方差σn2反映了建模数据集的噪声水平。采用高斯过程方法对运行数据建模即是确定协方差函数参数与噪声方差σn2的过程。协方差函数确定后即可采用式(10)对新的输入进行预测。

采用高斯过程建模既可以用协方差函数来描述风电机组运行数据的随机分布规律,同时可以将数据中的噪声即σn2有效辨识和分离,非常适用于风电机组运行数据的建模工作。与高斯过程建模相比,神经网络和支持向量机在建模时,没有考虑对信号中的噪声进行辨识和分离,直接采用含噪声的测量信号建立对象模型。在建模过程中,模型在刻画对象特性的同时,把测量噪声也固化在模型中,导致此类模型存在过学习和置信风险随模型复杂度增大而增大的问题。高斯过程应用于连续变量的建模即为高斯过程回归。

采用高斯过程对风电机组发电性能进行建模的关键是合理确定模型的输入、输出变量和模型的超参数集Θ。本文采用平方指数协方差函数:

其矩阵形式如下:

其中,xi(l)为向量xi∈RL的第l项;超参数集Θ={σf2,{D},σn2}为包含协方差函数参数与噪声方差σn2的向量,σf2为信号方差;矩阵D=diag(d1,d2,…,dL)表征了对应每个输入的长度尺度dl的一组集合;σn2为噪声方差,表征了噪声水平[10,11,12,13,14];δij为单个Kronecker函数;δij为由多个Kronecker函数构成的矩阵。

为了获得超参数Θ,采用对式(13)的负对数似然函数进行最小化的方法,即最大似然估计MLE(Maximum Likelihood Estimation)。

负对数似然函数式(13)相对超参数Θ的一阶偏导数为:

其中,tr(·)是矩阵求迹运算,K(Θ)和Λ(Θ)简写成K和Λ。采用共轭梯度法即可求得该最大似然问题的解,即得到高斯过程模型的超参数。得到高斯过程模型的超参数后,模型建立完毕。在最大似然和共轭梯度优化的过程中,高斯过程能够根据建模数据特性自动确定信号噪声方差σn2即信号噪声的大小,并在式(10)中用不含噪声的协方差矩阵对新的输入进行预测,从而实现噪声分离的目的。

2.2 风电机组发电性能建模

该机组时段1的运行数据用来建立发电性能模型。时段1数据共有1423条10 min间隔记录,其中前1223条记录用来进行高斯过程回归建模,剩余的200条记录用来进行模型验证。高斯过程回归建立的发电性能模型的输出为风能利用系数Cp预测值。模型的输入为第1节分析得到的发电性能的影响因素,包括每条记录中的风速、偏航误差、叶片平均桨距角以及间接计算得到的湍流、叶片两两之间的桨距角偏差、叶尖速比共8个输入。因此高斯过程发电性能模型的超参数除了信号方差和噪声方差外,还有与8个输入有关的D=diag(d1,d2,…,d8)共10个参数。采用1 223个建模样本和共轭梯度法求解高斯过程模型的超参数,得到高斯过程模型的超参数见表1,其中d1(风速)表示输入量风速的长度尺度,其他类似。

采用未参与建模的200条记录对已建模完毕的高斯过程发电性能模型进行验证,验证结果见图8。

图8中,实线为实际Cp值,虚线为高斯过程预测Cp值(都为归一化后的值,后同),具有较高的建模精度。将BP神经网络与高斯过程回归建模效果进行对比。BP网络的输入参数为8个,即高斯过程回归模型的输入;输出层节点数为1即预测Cp值;隐含层节点数设为20;其训练样本、验证样本与高斯过程建模相同。BP神经网络模型预测结果如图9所示。

图9中,实线为实际Cp值,虚线为神经网络预测结果。高斯过程模型和神经网络模型预测残差的方均根误差分别为0.013 6和0.023 7。通过对比可知,高斯过程建模具有更高的建模精度。

3 风电机组发电性能监测

发电性能模型反映了风电机组在正常运行时发电性能与多个影响因素之间的内在复杂关系。模型建立完毕后即可开始风电机组发电性能的监测工作。将新的运行数据作为发电性能模型的输入,如果模型新的输入、输出变量之间的关系与模型记忆的发电性能一致,即机组发电性能正常,模型的预测Cp值与实际Cp值之间的残差会很小,模型的预测精度很高;当机组发电性能发生改变,新的输入、输出之间的关系偏离模型记忆的发电性能特性,模型预测输出Cp值将会偏离实际Cp值,模型预测残差增大,预示机组发电性能出现异常变化。监测原理如图10所示。

选取时段2中的部分数据作为已建立的高斯过程发电性能模型的输入,模型预测结果如图11所示。

如图1、图2所示,风电机组在运行过程中风能利用系数在0与贝兹极限之间波动,只考察个别风能利用系数自身的大小并不能反映机组发电性能的变化。通过建立风电机组正常运行时的发电性能模型,找到了风能利用系数与其多个影响因素之间的复杂联系。对发电性能的监测不是考察风能利用系数自身大小的变化,而是考察风能利用系数与其影响因素之间的关系是否改变。由于与正常时段1相比,时段2风能利用系数与其影响因素之间关系发生明显改变(如第1节分析中的偏航误差、叶尖速比),当其数据作为发电性能模型输入时,模型输出残差明显增大,如图11所示,方均根误差达到0.0498,预测精度显著下降,可检测出时段2机组发电性能出现异常变化。通过设定预测残差阈值,能够实时监测风电机组发电性能的异常变化。可以参考文献[15]采用滑动窗口残差计算和阈值设定方法来保证性能监测的灵敏度和可靠性,也可以人为设定发电性能报警阈值。当发现机组发电性能异常时,应尽快逐项检查其影响因素(如变桨系统、偏航系统和控制系统等)是否存在运行异常并及时消除。

4 结论

高斯过程 篇8

多变量统计方法,如PCA、PLS在化工过程监视与故障诊断中得到了广泛的应用,克服了过程模型方法的诸多问题,但通过对多变量统计方法的大量实验与深入研究发现其在进行故障监视和诊断的过程中存在一定的局限性。应用多变量统计方法的前提条件是采样数据必须来源于单一的操作条件而且服从于单峰的高斯分布,但是在实际工业过程中,操作条件由于原料、生产性能、环境变化及生产策略等诸多因素的改变而不断变化,这就使得多数工况不能满足上述应用条件,在一定程度上受到了限制。而且在实际化工过程中,由于随着过程变量的增多,过程中一旦出现故障,直接使用多变量统计方法确定故障变量的工作量也随之增大,不可靠因素也随之增加,大大降低了故障诊断的可检性与可靠性[6,7,8,9,10]。

笔者通过引入高斯模型解决了过程采样数据难以满足应用多变量统计方法前提的局限性,同时利用高斯模型,提出了非正常高斯元域方法,即划分高斯单元后,又在每一个高斯单元中用PCA或PLS方法进行故障诊断,剔除实际过程中表现正常的过程变量,对余下的变量继续确定故障源,从而减少了确定故障变量的个数,使基于多变量统计的故障诊断合理可靠。

1 非正常高斯元域的故障诊断

高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化结果,将一个事物分解为若干个基于高斯概率密度函数的模型。构建高斯模型后,首先要估计未知参数均值向量μi和协方差矩阵Σi,估测高斯模型的未知参数方法有期望最大化法(Expectation Maximization,EM)及最大可能估测法(Maximum Likelihood Estimate,MLE)等。笔者主要采用EM法来估测高斯参数,其中期望阶段(E-Step)表示为:

undefined (1)

式中undefined——第k个高斯元的第j个采样数据的后验概率。

最大化阶段(M-Step)表示为:

undefined (2)

undefined (3)

式中 ωundefined——第k个高斯元在第(s+1)次迭代的先验概率。

将新的参数,如均值、方差、分类的先验概率,代入式(1),重新计算,直到样本集合对各个分类的似然函数不再有明显的变化为止。最后,通过新的参数构建多个高斯元。

利用期望最大化法(EM),将服从于不同高斯分布的过程采样数据,划分在不同的高斯元中,这些高斯元被称作高斯元域。然后,分别在每一个高斯元域内,利用多变量统计方法进行故障诊断,通过判断Q统计图,来决定是否保留此高斯元域。若Q统计图中的所有采样点全部在控制阈以下,表明在指定的采样区间内,相关的过程变量表现正常,因此可以去除此高斯元域;反之,存在平方预测误差(SPE)点超过控制阈的高斯元域,即非正常高斯元域,应予以保留。

针对非正常高斯元域中的Q统计分布,利用贡献图继续进行故障源的诊断,确定出异常变量,从而实现利用非正常高斯元域诊断故障。

2 仿真实例

2.1 传统多变量统计的故障诊断

为了与非正常高斯元域故障方法进行比较,应用模拟田纳西-伊斯曼(TE)化工过程进行仿真研究,收集到的过程数据是含有960个采样时刻、52个过程变量的样本数据,通过多变量统计方法得到的Q统计分析情况如图1所示。为了说明此方法的可用性,在模拟TE的过程中,分别在第14、18、37、48、50、52、100、200等多个采样时刻,加入幅值为1.3的偏差干扰,从Q统计量中可以看到,在前100个采样时刻,没有及时地显示故障信息,这就反映出了直接用多变量统计方法的局限性。

2.2 非正常高斯元域的故障诊断

构建高斯模型,利用式(1)~(3)的EM法估测模型参数,划分归属同一正态分布的各个高斯单元。在此例中,得到了3个不同区域的高斯单元,分别为:包含3个过程变量的第一个高斯元,包含2个过程变量的第二个高斯元和包含47个过程变量的第三个高斯元,划分后的采样数据分布如图2所示。

划分高斯单元后,利用多变量统计方法,针对第一个高斯元进行故障诊断,得出的Q统计图如图3所示。通过观察可以判断出,在所有采样时刻里,采样点都在控制限以下,可以证明此高斯单元包含的3个过程变量在960个采样时刻里,全部表现正常,因此剔除此高斯单元,对余下的单元继续进行故障诊断。

利用多变量统计方法,再针对第二个高斯元进行故障诊断,得出的Q统计图如图4所示。可以看出所有采样时刻的采样点都在控制限以下,因此可以剔除此高斯元,再对余下的高斯元中的采样数据继续进行故障诊断研究。

最后针对第三个高斯单元的采样数据进行故障诊断,确定故障采样时刻,判断出在第14、18、37、48、50、52、100个采样时刻,有超出SPE控制线的点,及时地反映出这些时刻有异常干扰出现,如图5所示。因此通过数据信息的高斯元域的划分克服了数据的非高斯性,使得在此基础上的过程监视与故障诊断更具可靠性。

针对此非正常高斯元的采样数据,监视其变量贡献情况,确定故障变量,这里仅以第100个采样时刻为例,针对此时刻做贡献图,可得此时刻第16个变量出现了故障。Q统计量和贡献情况如图6所示。

3 结束语

笔者通过采用非正常高斯元域进行故障诊断,克服了多变量统计方法的局限性,即要求化工过程采集到的过程数据必须来源于单一的操纵条件而且服从于单峰的高斯分布。通过划分正常与非正常高斯元域的方法,缩减判断故障源的变量个数,使故障域不断收敛,减少了过程数据固有的问题给过程监视与故障诊断带来的误差,提高了数据驱动故障诊断方法的可靠性与可用性。

参考文献

[1]周东华,孙优贤.控制系统的故障检测与诊断技术[M].北京:清华大学出版社,1994.

[2]王海清,宋执环,王慧.PCA过程监测方法的故障检测行为分析[J].化工学报,2002,53(3):297~301.

[3]Kendall M.多元分析[M].北京:科学出版社,1983.

[4]张杰,阳宪惠.多变量统计过程控制[M].北京:化学工业出版社,2000.

[5]Zhou D H,Ye Y Z.Modern Fault Diagnosis and Toler-ance Control[M].Beijing:Tsinghua University Press,2000.

[6]Qin S J,Dunia R.Determining the Number of PrincipalComponents for Best Reconstruction[J].Journal ofProcess Control,2000,10(2-3):245~250.

[7]Yu J,Qin S J.Multimode Process Monitoring with Bayes-ian Inference-Based Finite Gaussian Mixture Models[J].AIChE J,2008,54(7):1811~1829.

[8]Dunia R,Qin S J,Edgar T F,et al.Identification of FaultySensors Using Principal Component Analysis[J].AIChEJ,1996,42(10):2797~2812.

[9]MacGregor J F,Kojrti T.Statistical Process Control ofMultivariate Processes[J].Control Engineering Prac-tice,1995,3(3):403~414.

高斯皇后问题 篇9

国际象棋的棋盘是一个8行×8列共64格的方格棋盘, 本讲座将涉及一般n行×n列以至n行×m列的广义棋盘。

在国际象棋中, 皇后可以吃掉同行、同列或同一与棋盘边框成45度角的斜线上的任何棋子, 是攻击力最强的。

数学大师高斯 (Gauss) 于1850年由此引申出著名的8皇后问题:在国际象棋的8×8方格的棋盘上如何放置8个皇后, 使得这8个皇后不能相互攻击, 即没有任意两个皇后处在同一横排, 同一纵列, 或同一与棋盘边框成45度角的斜线上。

实际上, 8皇后问题是高斯借助国际象棋高度抽象出来的一个形象有趣的组合数学问题。图1就是高斯8皇后问题的一个解。

图1中的8个皇后既不同行, 也不同列, 也没有同处一对角线上, 即任意两个皇后都不相互攻击。

2 枚举求解8皇后问题

首先从简单开始, 试应用“蛮力”策略枚举求解8皇后问题。

2.1 8皇后问题解的表示

试用一个8位数表示高斯8皇后问题的一个解:8位数的第k个数字为j, 表示方格棋盘上的第k行的第j格放置一个皇后。由此可知, 图1所示的解可表示为36258174。

2.2 枚举算法设计

(1) 设置枚举循环

设置枚举8位数的循环变量a, 应用数字1~8不重复且从高位开始尽可能使相邻两位数字不相连的策略, 确定循环变量a的取值范围为区间[13526847, 86473152]。而数字1~8的任意一个排列的数字和为9的倍数, 即数字1~8的任意一个排列均为9的倍数, 因而枚举循环步长可确定为9。

(2) 任两个皇后不允许处在同一横排, 同一纵列

要求8位数中数字1~8各出现一次, 不能重复。

设置f数组, 分离a的8个数字, 用f (x) 统计a中数字x的个数。若f (1) ~f (8) 均等于1, 即数字1~8在a中各出现1次。否则返回。

(3) 任两个皇后不允许处在同一斜线上

设置g数组, 若a的第k个数字为x, 则g (k) =x。要求解的8位数的第j个数字与第k个数字的绝对值不等于j-k (设置j>k) 。若出现

表明g (j) 与g (k) 同处在与棋盘边框成45°角的斜线上, 则返回。

(4) 输出解

在枚举范围内同时通过以上 (2) (3) 两道筛选的8位数即为一个解, 打印输出 (每行打印5个解) , 同时用变量sum统计解的个数。

2.3 枚举求解8皇后问题程序

2.4 程序运行与说明

高斯8皇后问题的解为:

高斯8皇后问题共有以上92个解。

枚举设计简单而有效, 从程序的实际运行看, 搜索时间还是可以接受的。

如果枚举范围简单地定为[12345678, 87654321], 循环步长定为1, 也是可行的, 只是增加了循环次数。尽管以上枚举设计注意在枚举范围与循环步长的确立上进行了适当优化处理, 枚举循环量依然较大, 且对每一个循环变量a均需进行8个数字的分离统计, 并实施两道筛选, 操作量大, 导致求解效率比较低。

之所以首先选用枚举设计, 说明应用简单的“蛮力”策略也可以求解这些经典名题, 同时为下面效率较高的回溯与递归设计提供参照。

3 回溯求解n皇后问题

3.1 问题提出

把国际象棋棋盘从8行×8列拓广到一般n行×n列, 要求在n×n棋盘上放置n个皇后使它们互不攻击, 即成为n皇后问题。它是8皇后问题的直接推广。

根据键盘输入的正整数n (n>3) , 试求出n皇后问题的所有解。

3.2 回溯设计要点

设置数组q_pos (n) , 数组元素q_pos (cur_row) 表示当前行cur_row的皇后位于第q_pos (cur_row) 列。

求n皇后问题的一个解, 即寻求q_pos数组的一组取值, 该组取值中每一元素的值互不相同 (即没有任两个皇后在同一行或同一列) , 且第cur_row个元素与第k个元素相差不为cur_row-k|, (即任两个皇后不在同一45°角的斜线上) 。

问题的解空间是由整数1~n组成的n项数组, 其约束条件是没有相同整数且每两个整数之差不等于其所在位置之差。

在设置的永真循环中, q_pos (cur_row) 从1———n范围内取一个值。

为了检验q_pos (cur_row) 是否满足上述要求, 设置标志变量succeed, succeed赋初值true。q_pos (cur_row) 逐个与其前面的元素q_pos (k) 比较:

若q_pos (cur_row) =q_pos (k) or|q_pos (cur_row) -q_pos (k) |=cur_row-k, 即出现相列或同处一对角线, 标注succeed=false;

若出现succeed为假, 则表明q_pos (cur_row) 不满足要求, q_pos (cur_row) 增1后再试, 依此类推。

若cur_row=n且succeed为真, 则满足要求, 输出这组解, 并用sum统计解的个数。若n>10, 输出解的各数值间用空格或“, ”隔开。

若cur_row

若q_pos (n) =n, 则回溯到前一个数组元素q_pos (n-1增1赋值 (此时, q_pos (n) 又从1开始) 再试。

若q_pos (n-1) =n, 同样回溯到前一个数组元素q_pos (n-2) 增1赋值再试。

一般地, 若q_pos (cur_row) =n (cur_row>1) , 则回溯到前一个数组元素q_pos (cur_row-1) 增1赋值再试。

直到q_pos (1) =n时, 已无法回溯, 意味着已完成回溯试探, 求解结束。

3.3 回溯求解n皇后问题程序

3.4 程序运行示例与说明

运行程序若输入n=8, 即输出高斯8皇后问题的所有92个解。

4 递归求解n皇后问题

注意到递归也具有回溯功能, 应用递归自然也可以求解n皇后问题。

4.1 递归设计要点

递归函数put (cur_row) 的设计针对n皇后问题数字解的n个整数中的第cur_row个整数q_pos (cur_row) 展开。

设q_pos (cur_row) 取值为i (1, 2, …, n) , q_pos (cur_row) 逐一与已取值的q_pos (k) (k=1, 2, , cur_row-1) 比较:

若满足q_pos (cur_row) =q_pos (k) or|q_pos (cur_row) -q_pos (k) |=cur_row-k, 即同行或同列或同对角线, 显然不符合题意要求, 记succeed=false, 即所取q_pos (cur_row) 不妥, 表示该行该列已放不下皇后, 于是q_pos (cur_row) 继续下一个i取值。

否则, 符合题意要求, 保持succeed为真, 即所取q_pos (cur_row) 妥当。此时检测所完成的行数:

若cur_row=n成立, 完成了n行, 按格式输出一个数字解, 并用sum统计解的个数;

若cur_row=n不成立, 未完成n行, 继续调用pu (cur_row+1) , 探讨下一行取值。

若q_pos (cur_row) 取值到n仍不妥, 则返回 (回溯) 到调用put (cur_row) 的put (cur_row-1) 环境下, 继续q_pos (cur_row-1) 的下一个取值。

最后若q_pos (1) 取值到n仍不妥, 则返回到调用put (1的主程序, 输出解的个数sum或“无解”, 程序结束。

4.2 递归程序

4.3 程序运行示例与说明

运行程序, 输入n=8, 可得8皇后问题的92个解。

求解n皇后问题, 请确定n (n>3) :5

5皇后问题共10个解。

比较以上3种设计的搜索效率, 枚举设计的时间复杂度最高, 为O (10n) ;回溯设计与递归设计的时间复杂度都难以用一个关于n的确切数量级估算, 从实际运行的时间对比, 其搜索效率确实高于枚举。

由于以上回溯与递归的搜索流程与操作步骤 (含回溯) 基本相同, 因而这两个算法的搜索效率也基本相等, 从实际运行 (选择比较大的n值) 的时间来看也证实了这一点。

参考文献

[1]谷峰, 吴勇, 唐俊.基于遗传算法的n皇后问题求解[J].宿州教育学院学报, 2002, (04) .

[2]黄建民, 罗杰.八皇后问题的非递归算法设计[J].计算机与现代化, 2004, (05) .

[3]周康, 同小军, 许进.基于闭环DNA模型的八皇后问题算法[J].计算机工程与应用, 2007, (06) .

[4]李鸿.解决N—皇后问题的一个遗传算法[J].宿州师专学报, 2000, (04) .

高斯衰减体绘制 篇10

随着医学成像设备的快速发展,设备产生的数据量急剧增加。利用体绘制技术,医生可以对可疑病灶部位进行直观三维观察,有效地掌握不同部位或组织的空间结构信息,从而提高诊断精度与效率,医学图像的三维可视化方法[1]研究近年来又再次成热点。在临床实践中,利用体绘制技术的辅助,医生可以对可疑病灶部位进三维观察,有效地掌握不同部位或组织的空间结构信息;但在很多情况下,直接体绘制的显示效果并不理想,如头部血管造影获得的CT数据。头颅内部血管组织的某一部分是医生观察的重要组织,但由于头骨的灰度值和造影后血管的灰度值比较接近,传统体绘制很难对其进行有效的分类,在成像结果中会出现血管组织被头骨遮挡或血管成像质量被减弱的现象。

通过转换函数[2,3,4,5,6]的调节,用户可以抑制非感兴趣区域,突出感兴趣区域。但转换函数的方法是一种不断试探尝试的过程,比较耗时且人机交互性比较差。剖切方法是去除遮挡组织的直观方法。Weiskopf[7,8]等提出构建任意的剖切曲面,用户通过对剖切曲面的选择来实现感兴趣区域上下文信息的保留,但复杂剖切曲面的构建需要过多的人机交互,简洁的人机交互是剖切方法研究的重点;另外采用剖切方法去除遮挡物,在视点发生变化的时候需要重新构建剖切曲面,不利于用户多方位对感兴趣组织的观察。

保留上下文[9,10]的可视化方法主要是通过提取空间几何信息或三维数据场本身的信息来构建不透明度衰减函数,对每个采样点的不透明度进行修正。Zhou[11]等提出采用距离来增强和减弱不同组织,其主要思想是引入感兴趣点(或焦点),通过当前采样点到感兴趣点的距离作用于当前采样点的不透明度;感兴趣点的引入可以确定用户目标区域,有利于快速锁定三维空间中的感兴趣点。基于焦点和保留上下文的可视化方法,在视点改变后不需要重新调整参数,可以方便用户多方位对感兴趣组织进行观察,另外减少了人机交互的频率,可以提高操作的效率。

为了突出显示医生感兴趣的组织或部位,对感兴趣组织或部位进行定位,快速锁定观察的重点区域,本文提取定位点与用户当前观察视点之间几何结构信息,利用这些几何结构信息构建动态的高斯不透明度衰减函数,去除遮挡感兴趣部位的组织,提高感兴趣组织或部位的成像质量,同时保留了更多的感兴趣区域上下文信息,方便用户对感兴趣区域的重点观察。

1 直接体绘制

光线投射算法[12]的成像结果精度比较高,所以直接体绘制中通常采用该算法。设三维连续数据场用f(Pn)表示, Pn表示三维数据场中采样点的坐标,在采样点Pi处的灰度值和梯度为fPigPi=∇f(Pi), ‖gPi‖[0,1]为归一化后梯度的模。

光线投射算法过程中,沿光线方向采用离散近似积分由前向后对采样点的光学特性进行合成,最后得到该视线在成像平面上一点的颜色值和不透明度值。离散化后具体的合成公式如下:

αi=αi-1+α(Ρi)(1-αi-1)(1)ci=ci-1+c(Ρi)α(Ρi)(1-αi-1)(2)α(Ρi)=αtf(fΡi)(3)c(Ρi)=ctf[fΡiL(Ρi)](4)

其中α(Pi)和c(Pi)为当前采样点的不透明度和颜色值,αi-1、ci-1为视线进入当前采样点之前累积的不透明度和颜色值,αici为视线穿过当前采样点后的累积不透明度和颜色值,αtf()、ctf()为不透明度和颜色传递函数;L(Pi)为当前采样点的光照亮度,一般采用Phong-Blinn模型。

通常在直接体绘制中采样点的不透明度仅与该采样点处的值和不透明度转换函数有关,但为了增强不同组织之间的边界,可以对不透明度进行修正,修正公式如式(5)。

α(Ρi)=αtf[fΡim(Ρi)](5)

式(5)中m(Pi)是要构建的不透明度衰减函数,一种常见的方法是利用梯度算子对不透明度进行修正,此时m(Pi)=‖gPi‖[0,1],但单纯引入梯度算子,渲染的结果中,不同的组织边界会重叠在一起,容易造成成像结果模糊。

2 高斯衰减体绘制

2.1 高斯衰减体绘制模型

针对感兴趣组织在三维数据场中所占空间比率较小的特点,引入定位点可以快速锁定感兴趣区域,进行有针对性的观察。另外将当前采样点与定位点的空间距离,作为判断与感兴趣组织上下文信息相关的程度,一般情况下,距离焦点的距离越近,说明该组织对观察者了解感兴趣区域有较大的意义,应予以保留或增强;而距离越远,则说明该组织与感兴趣组织的空间关联性越小,具有较小的意义。梯度信息也是非常重要,梯度的改变往往意味着不同组织的边界。将以上三种因素考虑在内,结合当前视点的空间位置,构建高斯不透明度衰减函数,图1是具体的模型示意图。

图1是高斯体绘制模型示意图,其中黑色立方体为三维数据场,深蓝色的区域为数据场中用户的感兴趣区域,红色的点是由用户标定的感兴趣区域内的焦点;浅蓝色的区域为数据场中的其它组织。由视点(眼睛)射出的光线称为视线,图1中带箭头的线为视线。当视线进入三维数据场并开始采样后,白色的圆点为当前的采样点,将该采样点与焦点相连,该线段与视线的夹角为θPi, θPi越小说明该采样点对感兴趣区域内组织的遮挡就越大,应予以衰减或去除;θPi越大,则说明该采样点对感兴趣区域内组织的遮挡就越小,应该予以保留或增强。当焦点位于视线上时,这一情况并不符合上面的描述,为了克服这一特殊情况,引入了当前采样点到焦点的距离dPi进行限制。当前采样点到焦点的距离dPi越小,说明该采样点与焦点的空间关联越大,应予以保留;相反,则予以减弱或去除。图1中深蓝色区域和浅蓝色区域的边界信息,用梯度‖gPi‖[0,1]来近似,当前采样点的梯度越大,则说明当前采样点可能位于不同组织的边界上,对于观察组织的形态结构有很重要的意义,应予以增强;相反则予以减弱或去除。

为了有效地将上述信息整合在一起,引入高斯函数,具体整合公式如下:

当0°≤θPi<90°时:

m(Ρi)=G(Ρi)=gΡi[0,1]2πδΡie-kdΡi22δΡi2(6)δΡi=1-cosθΡi(7)

当90°≤θPi时:

m(Ρi)=G(Ρi)=1(8)

当0°≤θPi<90°时,说明当前采样点对感兴趣区域有遮挡,采用高斯衰减体绘制进行渲染;当90°≤θPi时,当前采样点对焦点无任何遮挡,不再采用公式(6)—式(8)对当前采样点的不透明度进行衰减,而是进行直接体绘制。另外针对高斯函数的输出会出现大于1的情况,作如下处理:当高斯函数的输出大于1时,就对输出进行截取,使高斯函数的输出最大值为1。

2.2 高斯衰减函数分析

图2是不同输入和方差下的高斯函数曲线分布图,横坐标是高斯函数的输入dPi,纵坐标是高斯函数的输出,不同的颜色代表不同方差下的高斯曲线。其中红色曲线表示的高斯函数的峰值会出现超过1的情况,这时将该高斯函数的输出作用于当前采样点的不透明度时,当前采样点的不透明度值可能会大于1,渲染结果会出现亮斑或黑斑现象,为了克服这一现象的出现,采用对公式(6)中对高斯函数的输出进行截取,如果公式(6)的输出大于1,则对其进行截取,赋予1,;如果高斯函数的输出小于等于1,则按照其输出值作用于当前采样点的不透明度。高斯函数的输入为当前采样点到焦点的距离dPi, dPi越大,高斯函数的输出就越小,对该采样点的衰减就越大;反之高斯函数的输出就越大,对该采样点就起到增强的作用。高斯函数的方差δPiθPi成正比,方差δPi决定了高斯函数曲线的陡峭程度。当前采样点与焦点连线和视线的夹角越小,则对该采样点予以较大衰减,这个时候高斯函数的方差δPi会变小,高斯曲线比较陡峭,距离起主要作用;相反,则方差越大,高斯曲线越平滑,距离起次要作用。

3 实验结果与分析

本文实验使用Intel■CoreTM 2 Quad CPU 2.33 GHz,DDR3 2 GB内存,显卡:Quadro FX 1700,编程环境为Windows XP系统下Visual Studio C++. NET 2008以及OpenGL,渲染语言采用的是NVIDIA公司的Cg。

图3是腹部血管造影数据的显示效果,腹部数据内部骨骼较少,基本上没有其它组织的灰度值和造影后血管组织的灰度值比较接近,如果不需要显示皮肤组织,则通过对一维转换函数的调节就可以达到很好的血管显示效果。图3是在显示多组织情况下,直接体绘制方法和本文方法的对比,本文方法可以在显示皮肤组织的同时,有效地显示腹部内部的不同组织,方便用户在整体上对不同组织间空间结构的理解。与直接体绘制方法相比, 本文方法的渲染效果可以在突出显示感兴趣区域的同时,呈现给用户更多的全局信息。

图4是不同空间位置下对头部CT数据的成像效果。当用户需要从不同的空间位置对同一感兴趣区域进行观察时,视点改变后,用户不需要像剖切方法一样重新构建剖切面,就可以直接观察到感兴趣区域,略去了参数调节步骤,减少了人机交互的次数,提高了工作的效率,同时可以突出显示感兴趣区域,保留更多的上下文信息。

4 结束语

本文的主要工作是根据用户标定的感兴趣区域来提取相关的几何特征和数据本身的属性,充分结合了空间和数据的信息,进而构建高斯衰减函数,并作用于当前采样点,从而克服了直接体绘制方法中,感兴趣区域与非感兴趣区域彼此重叠或遮挡的现象,提高了感兴趣区域的成像质量;在交互方面,简化了人机交互的步骤,当用户视点发生改变时,不需要重新构建衰减函数就可以直接观察到感兴趣区域内的组织,极大地提高了用户的工作效率。

摘要:为了解决医学数据中感兴趣组织易被非感兴趣组织遮挡的问题,提出了一种高斯衰减体绘制方法。首先对感兴趣组织进行空间定位,以快速确定观察区域。然后根据当前采样点与定位点连线和投射光线的夹角,以及当前采样点到定位点的空间距离来构建高斯衰减函数。最后将该高斯函数作用于当前采样点的不透明度。可以有效地减弱非感兴趣组织对感兴趣组织的影响和遮挡,突出感兴趣组织的空间结构信息。实验结果表明,方法具有简洁高效的人机交互,且对感兴趣区域可以进行有效地增强显示。

关键词:转换函数,高斯函数,不透明度,体绘制

参考文献

[1] Preim B,Bartz D.Visualization in medicine:theory,algorithms,and applications.Oxford:Morgan Kaufmann,2007:261—290

[2] Correa C D,Ma Kwan-liu.Size-based transfer functions:a new vol-ume exploration technique.IEEE Transactions on Visualization andComputer Graphics,2008;14(6):1380—1387

[3] Correa C D,Ma Kwan-liu.Visibility histograms and visibility-driventransfer functions.IEEE Transactions on Visualization and ComputerGraphics,2011;17(2):192—204

[4] Ljung L C,Ynnerman A.Local histograms for design of transfer func-tions in direct volume rendering.IEEE Transactions on Visualizationand Computer Graphics,2006;12(6):1570—1579

[5] Zhou Jianlong.Automatic transfer function generation using contourtree controlled residue flow model and color harmonics.IEEE Trans-actions on Visualization and Computer Graphics,2009;1481—1488

[6] Kniss J,Kindlmann G,Hansen C.Multidimensional transfer func-tions forinteractive volume rendering.IEEE Transactions on Visual-ization and Computer Graphics,2002;8(3):270—285

[7] Weiskopf D,Engel K,Ertl T.Volume clipping via per-fragment op-erations in texture-based volume visualization.Procceedings of IEEEVisualization,2002:93—100

[8] Weiskopf D,Engel K,Ertl T.Interactive clipping techniques for tex-ture-based volume visualization and volume shading.IEEE Transac-tions on Visualization and Computer Graphics,2003;9(3):298—312

[9] Bruckner S,Grimm S,Kanitsar A,et al.Illustrative context-preser-ving exploration of volume data.IEEE Transactions on Visualizationand Computer Graphics,2006;12(6):1559—1569

[10]冯前进,贠照强,秦安,等.设计转换函数实现保留上下文体绘制.计算机辅助设计与图形学学报,2010;22(9):1491—1496

[11] Zhou Jianlong,Dring A,Tnnies K D.Distance based enhancementfor focal region based volume rendering.Bildverarbeitung für dieMediyin,2004:199—203

高斯投影的计算与应用 篇11

关键词:高斯投影,数学模型,工程测量

高斯投影计算是各种工程测量项目经常遇到的一种计算课题, 由于其不但涉及到高斯投影的正算问题, 也涉及到高斯投影的反算问题, 还涉及到高斯投影的换带计算。此外, 由于我国目前工程测量项目所给出的平面坐标起算数据, 既有1954年北京坐标系数据, 又有1980年西安坐标系数据, 还有WGS-84坐标系 (GPS用) 数据, 这就给高斯投影的计算带来了许多麻烦, 稍有不慎, 就会形成错误的工程测量计算成果。

正是由于上述原因, 本人利用CASIOfx-5800P可编程计算器的语言特点, 编制了一套高斯投影计算程序。本程序既能对1954年北京坐标系进行高斯投影的正反算及换带计算, 又能对1980年西安坐标系进行高斯投影的正反算及换带计算, 同时也能用于对WGS-84坐标系高斯投影的正反算及换带计算。下面就本程序的数学模型及使用等方面作以简要介绍。

1 数学模型

1.1 参考椭球元素值

由表1各坐标系数据推算出的其他元素值由以下公式得出:

短半径:b=a (1-α)

极曲率半径: c=a2/b

赤道子午曲率半径: d=b2/a

第一偏心率:e= (a2-b2) /a2

第二偏心率:e= (a2-b2) /b2

1.2 高斯投影的正算

高斯投影正算是指由地面点的大地经纬度L、B计算出该点高斯平面上投影点的平面直角坐标x、y。

计算公式如下:

x=X+Nt[m2/2+ (5-t2+9η2+4η4) m4/24+ (61-58t2+t4+270η2-330η2t2) m6/720]

y=N[m+ (1-t2+η2) m3/6+ (5-18t2+t4+14η2-58η2t2) m5/120]

子午线收敛角:γ=t[180m+60 (1+3η2+2η4) m3+12 (2-t2) m5]/π

以上公式中, t=tanB;m=πcosB (L-L0) °/180;Ν=c/1+η2;η2=e′2cos2B

X=A0B0- (B0sinB+C0sin3B+D0sin5B+E0sin7B) cosB;B0代表以度为单位的大地纬度;

A0=d (1+3/4×e2+45/64×e4+175/256×e6+11025/16384×e8+…) π/180

B0=d (3/4×e2+45/64×e4+175/256×e6+11025/16384×e8+…)

C0=d (15/32×e4+175/384×e6+3675/8192×e8+…)

D0=d (35/96×e6+735/2048×e8+…)

E0=d (315/1024×e8+…)

1.3 高斯投影的反算

高斯投影反算是指由地面点的高斯平面直角坐标x、y计算出该点的大地经纬度L、B。

计算公式如下:

B0=Bf0-tf (1+ηf2) ×[90n2-7.5 (5+3tf2f2-9η2ftf2) n4+0.25 (61+90f2+45tf4) n6]/π

L0=L00+[180n-30 (1+2tf2f2) n3+1.5 (5+28tf2+24tf2) n5]/cosBf/π

以上公式中, L00代表中央子午线的经度, 以度为单位;Bf0代表该点横坐标在中央子午线上垂足处的纬度, 以度为单位。

tf=tanBf;ηf2=e′2cos2Bf;n=y (1+ηf2) /c

Bf0可由迭代计算求得:Bf1=x/A0;Bfi+1= (x-f (Bfi) ) /A0;

f (Bfi) =- (B0sinBfi+C0sin3Bfi+D0sin5Bfi+E0sin7Bfi) cosBfi

重复迭代至Bfi+1-Bfi<1×10-10即可。

1.4 高斯投影的换带计算

高斯投影换带计算, 是已知地面某点的高斯平面直角坐标x、y及所在投影带的中央子午线经度L01, 通过高斯投影的反算公式计算出该点的大地经纬度L、B, 再用高斯投影的正算公式计算出该点在另一中央子午线经度为L02投影带的高斯平面直角坐标x′、y′。

即已知 (x、y、L01) 反算→ (L、B) 正算 (通过L02) → (x′、y′)

2 源程序

主程序 GSTYJS

Deg:10→DimZ:″GSJS (ZS=1, FS=2, HD=3) =″?→J:5×10^ (5) →D:″ZBX (54=1, 80=2, 84=3) = ″?→Z[5]:If J=1:Then ″L=″?L:″B=″?B:″L0=″?Z: Prog″GD″: Prog″ZS″:″JH″:Prog″FS″:IfEnd

If J=2:Then ″X=″?X:″Y=″?Y:″L0=″?Z: Prog″GD″: Prog″FS″:″JH″:Prog″ZS″:IfEnd

If J=3:Then ″X=″?X:″Y=″?Y:″L01=″?Z: Prog″GD″: Prog″FS″: ″L02=″?Z: Prog″ZS″:IfEnd: ″END″

子程序 ZS

Prog″GJ″:TC→U: U2→V: (L-Z) C÷P→W:W2→M:Z[6]B-C (Z[7]U+ Z[8]U^ (3) +Z[9]U^ (5) +Z[10]U^ (7) ) →X:″X=″:X+ ( ( ( (H-58) H+ (270-330H) E+61) M÷30+ (4E+5) Q-H) M÷12+1) NTM÷2→X◢

″Y=″:D+ ( ( ( (H-18) H- (58H-14) E+5) M÷20+Q-H) M÷6+1) NW→Y◢

TWP (1+M ( (Q+E) Q÷3+M (2-H) ÷15→G:″G=″:G►DMS◢

G→A: Prog″GS″: ″Gr=″:A◢

Norm 1:Return

子程序 FS

X÷Z[6]→B:Do:B→P:sin (P) →T:cos (P) →C:- (Z[7]T+Z[8]T^ (3) +Z[9]T^ (5) + Z[10]T^ (7) ) C→C: (X-C) ÷Z[6]→B:Abs (B-P) →Z:LpWhile J<1×10-10: Prog″GJ″: (Y-D) ÷N→N:N2→M:B-P ( ( ( (45H+90) H+61) M÷30- (3-9E) H-5-E) M÷12+1) MTQ÷2→B:″B=″:B►DMS◢

B→A: Prog″GS″: ″Br=″:A◢

Z+P ( ( ( (24H+28) H+5) M÷20-2H-Q) M÷6+1) N÷C→L:″L=″:L►DMS◢

L→A:Prog″GS″: ″Lr=″:A◢

Norm 1:Return

子程序 GD

If Z[5]=1:Then 6378245→I:298.3-1→F:IfEnd:If Z[5]=2:Then 6378140→I:298.257-1→F:IfEnd:If Z[5]=3:Then 6378137→I:298.257223563-1→F:IfEnd

(2F-F2) Κ:I (1-F) →〇:I2÷〇→R:〇2÷I→S: (1÷ (1-F) 2-1)

S (1+3」4K2+45」64K^ (4) +175」256 K^ (6) +11025」16384K^ (8) ) π÷180→Z[6]: S (3」4K2+45」64K^ (4) +175」256 K^ (6) +11025」16384K^ (8) ) →Z[7]:S (15」32K^ (4) +175」384 K^ (6) +3675」8192K^ (8) ) →Z[8]:S (35」96K^ (6) +735」2048K^ (8) ) →Z[9]: S×315」1024K^ (8) →Z[10]:Return

子程序 GJ

180÷π→P:tan (B) →T:cos (B) →C:〇2C2→E:T2→H:1+E→Q:R÷ (Q) Ν:Return

子程序 GS

A→Z[1]:Int (Z[1]) →Z[2]:Int (60 (Z[1]-Z[2]) ) →Z[3]:3600 (Z[1]-Z[2]-Z[3]÷60) →Z[4]:Abs (Z[4]) →A:Fix 5:Return

3 程序说明

本程序在数据输入过程中, 采用问答式的输入方式, 如运行程序后, 先输入计算类型 (1为正算, 2为反算, 3为换带计算) , 有屏幕提示, 再输入坐标系 (54坐标为1, 80坐标为2, 84坐标为3) , 同样有屏幕提示。

L为某点的大地经度, B为某点的大地纬度, X为某点的高斯投影纵坐标, Y为某点的高斯投影横坐标。在程序运算中, 输入及输出的Y坐标值均为加上500km后的坐标值, L0为某点所在投影带的中央子午线经度, G为某点的子午线收敛角。另外, 程序所输出的L、B及G值显示结果, 第一行为度、分、秒显示, 秒位只保留至小数点后两位, 第二行为秒位显示, 保留至小数点后五位。

4 高斯投影计算的具体应用

4.1 高斯投影的正算

4.2 高斯投影的反算

4.3 高斯投影的换带计算

5 结束语

由于CASIOfx-5800P可编程计算器携带非常方便, 其大小与普通计算器相同, 其存储容量也较大, 而且两台计算器之间又可互传程序, 这样就节省了大量的程序输入过程, 很受外业测量工作者的信赖。本程序因其具有广泛的高斯投影计算适用性, 操作过程方便快捷, 所占用的字节数较少, 在高斯投影正算结果输出后, 又用其结果进行反算检验, 避免了错误计算, 近年来在许多工程测量项目中得到了较好的应用, 愿本程序能为测量工作者带来工作上的便利。

参考文献

[1]王君瑞.测量程序集[M].北京:科学教育出版社, 2002.5.

[2]孔祥元, 郭际明.控制测量学[M].武汉:武汉大学出版社, 2006.11.

上一篇:放样方法下一篇:经济发展与政策建议