广义神经网络(通用12篇)
广义神经网络 篇1
0 引 言
有效的数据预测在金融投资领域占有重要地位, 而以股票涨落为代表的金融数据影响因素非常复杂, 其变化有着很强的无序性, 从而增加了预测的难度。目前, 已出现众多分析股市的手段以及预测方法。其中, 逐步形成理论的有K线法、波浪法、道琼斯法等。但这些都仅作为分析方法, 作为缺乏经济理论和证券知识的普通用户, 并不能直接从中预测股市的动态。除此之外, 有利用现代统计学的手段, 试图建立模型来预测股市。然而, 影响股市的因素多且复杂, 许多因素本身尚具模糊性、混乱性, 所以上述种种努力所取得的效果甚微。在股市发展过程中, 的确有某种规律性的东西, 或者称为模式。这些规律性的东西常常蕴涵于看似杂乱无章的大量历史数据中, 因此, 要想获得有效的预测, 关键在于发现规律。从数学的角度看, 就是建立某种映射关系 (函数) , 并进行函数的拟合, 神经网络是解决这一问题的最佳工具之一。人工神经网络已被广泛应用于包括经济领域在内的预测问题中, 并已取得了不错的效果。
股市往往具有如下特点:① 含有大量原始数据;② 影响因素众多, 因素之间关系复杂且有某种并行性;③ 很多因素具有一定的模糊性;④ 股市的发展有某种规律性。基于这些特点, 采用模糊神经网络方法进行股价的预测较为合理。然而, 传统的模糊神经网络也具有一定的局限性, 研究人员必须预先划分输入空间, 确定模糊规则基, 在此基础上, 再利用神经网络的学习功能和自适应能力对系统参数进行优化。这往往导致所建立的神经网络不一定具有应用所需的最佳网络结构, 使得研究者不得不经过反复试验, 才能最终确定。本文使用的广义动态模糊神经网络 (GD-FNN) 不同于传统神经网络, 它的网络结构不是预先设定的, 而是动态变化的, 即在学习开始前, 没有一条模糊规则, 其模糊规则在学习过程中逐渐增长而形成。这样就克服了上述缺点, 为应用带来了很多方便。
1 GD-FNN结构
GD-FNN共分为四层, 分别为输入层、隶属度函数层、T-范数层和输出层, 如图1所示。
第一层为输入层, 节点的个数为输入变量的个数, 设共有r个输入变量, 并且每个输入变量xi (i=1, 2, …, r) 有u个隶属函数Aij (j=1, 2, …, u) , 共有r×u个节点位于第二层, 每个输入变量xi与其自身的u个隶属函数相连, 隶属函数为高斯函数, 形式为:
其中, μij是xi的第j个隶属函数, cij和σij分别为xi的第j个高斯隶属函数的中心和宽度。第三层用于计算每个规则触发权的T-范数算子用乘法, 第三层的j个规则Rj (j=1, 2, …, u) 的输出用下式计算:
第四层为输出层, 用如下的表达式:
其中, y是输出变量的值, ωj为第j个规则的连接权。
2 GD-FNN学习算法
广义动态模糊神经网络的结构是在学习过程中逐渐生成、调整的, 通过对模糊规则的调整从而调整网络结构, 因此算法要完成网络结构调整和参数确定、调整两个功能。对于网络结构的调整分为模糊规则的产生和剔除, 对于参数的学习分为两个方面:前提参数估计和结果参数确定。
2.1 模糊规则的产生和剔除
2.1.1 模糊规则的产生
模糊规则的产生考虑两个因素:系统误差和模糊规则的ε-完备性。
GD-FNN输出误差是确定是否需要增加一条新的模糊规则的一个重要因素。误差规则可以表示如下:
对每个观测数据 (Xk, tk) , k=1, 2, …, n;其中, n是全部训练数据的数量, Xk是第k个输入样本向量, tk是第k个期望的输出, 用式 (2) 和式 (3) 计算当前结构下的GD-FNN输出yk。定义系统误差为:
如果‖ek‖>ke, 则应考虑增加一条新的模糊规则。这里, ke是根据GD-FNN期望的精度预定义的一个阈值, 它在学习过程中按以下准则逐渐变化:
其中, emin是GD-FNN期望的输出精度, emax是选择的最大误差, k是学习的次数, β∈ (0, 1) 称为收敛常数, 可以推导出:
模糊规则的ε-完备性是确定是否需要增加一条新的模糊规则的另一个重要因素。ε-完备性定义如下:
定义1 模糊规则的ε-完备性 对某个变化范围内的输入, 如果至少存在一条模糊规则, 使得匹配度 (即触发权) 的值不小于ε, 我们就说这样的模糊规则具有ε-完备性。
在模糊系统中ε的最小值通常选择为εmin=0.5。
从模糊规则观点来看, 一条模糊规则是在输入-输出空间中的一个局部表达。如果一个新的样本满足ε-完备性, 那么GD-FNN不会产生一个新的规则, 而会通过更新现有规则的参数来包容样本。
根据ε-完备性, 当一个观测数据 (Xk, tk) , k=1, 2, …, n进入系统, 可以计算观测数据Xk 和现有的高斯单元的中心Cj (j=1, 2, …, u) 之间的马氏距离mdk (j) , 找到:
如果:
其中kd是一个预先设定并与ε相关联的阈值, 则表明现有的系统不满足ε-完备性而应该考虑产生一条新规则。这里kd在学习过程中按下式变化:
其中, k是学习的次数, γ∈ (0, 1) 称为衰减常数, 由式 (9) 推算出:
2.1.2 模糊规则的剔除
定义误差减少率矩阵Δ= (ρ1, ρ2, …, ρu) ∈R (r+1) ×u, △的第j列是对应的第j个规则的 (r+1) 个误差减少率。定义:
则ηj代表了第j个规则的重要性。如果ηj<kerr, j=1, 2, …, u;其中, kerr是预先定义的值, 则第j个规则被删除。
2.2 参数的确定和调整
参数的确定和调整, 包括高斯函数宽度和中心的确定, 高斯函数宽度的调整和权值的调整。
2.2.1 高斯函数宽度和中心的确定
假设u个模糊规则已经产生, 当得到一个新的采样样本Xk (k=1, 2, …, n) 时, 按照规则产生准则, 需要产生一条新的模糊规则。这时, 把多维输入变量Xk投影到相应的一维隶属函数空间, 同时计算数据x
其中, Φi∈{ximin, ci1, ci2, …, ciu, ximax}, 同时找到:
如果edi (jn) ≤kmf, 其中, kmf是一个预先定义的常数, 该常数控制相邻隶属函数的相似性, 那么, 就说x
其中, ci-1和ci+1是与第i个隶属函数邻近的两个隶属函数的中心。而高斯函数的中心确定如下:
2.2.2 高斯宽度修正
对于一个新样本Xk, 可以找到以马氏距离“最靠近”该样本的第j个规则。如果条件‖ek‖>ke和mdk, min≤kd都成立, 把向量Xk分解为相应的一维输入变量, 则输入变量xi (i=1, 2, …, r) 的最近的隶属函数的宽度σij (j=1, 2, …, u) 可以修正如下:σ
其中, r是输入变量的总数。
2.2.3 权值确定
设r个输入变量的n次观测样本产生u个模糊规则, 将网络的输出写成矩阵形式为:Wϕ=Y, 其中W∈Ru (r+1) , ο∈Ru (r+1) ×n和Y∈Rn。假设期望的输出为T= (t1, t2, …, tn) ∈Rn, 确定最优参数W*的问题可以用公式表示为最小化
整个算法的流程图如图2所示。
3 样本选择
用定量模型对股票市场进行预测, 首先就是要对股票市场进行定量化描述。就GD-FNN而言, 需将股市的历史数据处理成一系列可供神经网络学习的例子样本, 组成一个学习样本集, 每个学习样本为因果关系的偶对: (预测依据|预测对象) 。
本文以上证指数第七天的收盘价作为预测对象。预测依据表示在预测对象的结果发生前系统的描述, 就股市技术分析而言, 某时刻t前的系统状态为价格和成交量的时间序列数据, 显然这里的数据量是相当庞大的, 且股票价格变化在短期内具有很大的随机性, 而瞬时的变化对未来趋势预测意义很小。人们在长期的实践中已总结出数百种描述系统状态的技术指标, 如MA、MACD、WMS%、KDJ、RSI、BIAS、PSY、AR、OBV、ADR等, 另外, 还有一些特征提取的数学方法, 如卡尔曼滤波、小波变换等。具体应用时可针对不同的预测对象, 选取若干种和该预测对象相关度大的技术指标, 来组成描述系统状态的预测依据向量。
本文选用移动平均线 (MA (6) ) 、乖离率 (BIAS (6) ) 、随机强弱指标 (RSI (6) ) 和心理线 (PSY (6) ) 作为输入变量, 用第7天的收盘价作为目标输出, 对网络进行训练。
MA是利用若干天或若干周收市价的均值为参数绘制的曲线。由于它利用了移动平均理论, 剔除了股价的偶然变动, 因而可以作为投资者判断行情走向的依据。MA的计算公式为:
BIAS用来描述股价与移动平均线距离的远近程度, 计算公式为:
式中, Cn为当日收盘价, MA为n日移动平均值, BIAS可正可负, 也可为零。
RSI是反映行情变化动量的指标, 即市场向某一个方向变化时, 其内部所包含的能量, 可用以反映股价变动的强弱状况。计算公式为:
其中, n为天数, Un表示n日中股价上升幅度之和, Dn表示n日中下跌幅度之和。
PSY指标是在时间的角度上计算N日内的多空总力量, 来描述股市目前处于强势或弱势, 是否处于超买或超卖状态。它主要是通过计算N日内股价或指数上涨天数的多少来衡量投资者的心理承受能力, 反映股市未来发展趋势及股价是否存在过度的涨跌行为。计算公式为:
4 上证指数预测实验
本文用上证指数2008-07-12到2008-12-14共100个样本数据, 其中, 前70个作为训练样本, 后30个作为测试样本。计算出MA (6) 、BIAS (6) 、RSI (6) 和PSY (6) 作为输入数据, 用第7天的收盘价作为输出数据。为保持数据取值范围的一致性, 这里用MA (6) /100代替MA (6) 作为输入。实验结果如图3和图4所示。
图中圆圈为期望输出, 星号为实际输出。从结果来看, 预测值与实际值完全吻合, 取得了非常好的效果。
5 结 语
将GD-FNN用于上证指数的预测取得了较为理想的效果, 但股票市场复杂多变, 影响因素众多。尽管GD-FNN具有良好的自学习能力, 但依然存在一些不稳定的因素, 如何设计出更为稳定的网络, 依然需要做进一步的研究, 另外, 如果能将影响股市的因素经模糊化后作为模糊神经网络的输入, 也许会收到更好的效果, 也有待研究。
摘要:提出一种用广义动态模糊神经网络预测股票价格的方法, 网络结构可随模糊规则在学习过程中逐渐增长而自动调节, 以达到预测最优化。通过选用实用的技术参数指标作为网络的输入变量对上证指数的收盘价进行预测, 取得了较为理想的效果。
关键词:广义动态模糊神经网络,上证指数,预测,技术指标
参考文献
[1]伍世虔, 徐军.动态模糊神经网络—设计与应用[M].北京:清华大学出版社, 2008.
[2]张学仁, 宋全启.股票理论与投资分析[M].西安:西北大学出版社, 1998.
[3]陈兴, 孟卫东, 严太华.基于T-S模型的模糊神经网络在股市预测中的应用[J].系统工程理论与实践, 2001 (2) :66-72.
[4]Pei-Chann Chang and Chen-Hao Liu.ATSKtype fuzzy rule based systemfor stock price prediction[J].Expert Systems with Applications, 2008.
广义神经网络 篇2
基于广义回归神经网络的飞参数据预处理
由于存在干扰,飞参系统记录的发动机参数中,经常会有不少间断点和奇异值.为了利用数据对发动机性能趋势进行预测,必须对数据进行预处理.分析了航空发动机作为一个系统,其各主要输入和输出参数之间存在的函数关系.研究了利用广义回归神经网络和参数之间的.关系对数据进行预处理,结果得到了较为正常的数据,证明该方法是有效的.
作 者:曲建岭 唐昌盛 李万泉 高峰 QU Jian-ling TANG Chang-sheng LI Wan-quan GAO Feng 作者单位:海军航空工程学院,青岛分院航空仪表与控制工程教研室,山东,青岛,266041刊 名:航空计算技术 ISTIC英文刊名:AERONAUTICAL COMPUTING TECHNIQUE年,卷(期):200838(2)分类号:V557关键词:飞参数据 广义回归神经网络 预处理 航空发动机
广义价值论 篇3
其一,该书通过对狭义价值理论的比较研究,建立了一个反映市场经济一般规律的价值理论即广义价值论,并进一步揭示了广义价值论在不同条件下借以实现的形式,从而使价值理论与收入分配理论内在地统一起来。
众所周知,自经济学产生以来,价值理论就一直是争论的焦点,其中劳动价值论、新古典价值论和斯拉法价值论相互对峙,形成三足鼎立之势。作者针对这三种理论进行了详实的比较分析。
首先,作者指出国内理论界对劳动价值论的讨论中存在两种错误倾向。一种倾向是充满了形而上学和教条主义的色彩,是在坚持活劳动是价值的唯一源泉的前提下发展劳动价值论。这些学者往往是引用马克思的诸多论述来证明价值是由劳动唯一地决定的。但是,价值理论是一种实证理论,劳动创造价值并非不证自明的公理,它必须一方面要经过逻辑一致性的检验,另一方面要经过经验验证,而不能用马克思的论述来证明马克思本人观点的正确性。另一种倾向,则是通过无限制地扩大劳动的外延而把劳动价值论庸俗化(或通俗化)。这样的理论一旦面对现阶段非公有制经济存在的必要性以及各种生产要素参与分配的合理性的现实问题时,必然会陷入困境,难以做出令人满意的分析。总之,由于只固守劳动是价值的唯一源泉,国内外经济学界对劳动价值论,或者全盘否定者,或者当做教条,或者用死劳动偷换活劳动从而使之庸俗化,多年来并未取得实质性进展。
其次,作者指出新古典价值论虽然对各种生产要素在价值决定中的作用以及功能性分配给出了数量解,但其内在的逻辑矛盾(循环论证)和固有的辩护性(宣扬阶级调和),亦受到马克思主义经济学家和新剑桥学派的批评。
至于斯拉法的价值论,作者认为,它虽然给予边际生产力论致命一击,但又通过揭示出交换比例与利润率形成的同一机制而使“价值向生产价格的转换”成为多余,因而既不能被马克思主义阵营所接受,也难以融入西方经济学主流。
由此可见,上述三种价值理论,都是在不同的假定条件下才能成立的,缺乏统一的基础,因而只是一种狭义的价值理论。与以往的这些价值理论不同,蔡继明教授创立的广义价值论是关于价格运动一般规律及其特殊形式的学说,以往的狭义价值理论都可以视为广义价值论的特例。它说明商品交换价值是由平均比较利益率决定的,或者说是根据比较利益率相等的原则决定的,广义价值的实体就是比较成本。相对劳动价值和相对资本价值都是广义价值发生作用的具体形式,或称作价值特殊。古典劳动价值论所规定的价值,仅仅是价值的一种个别形式,远不能作为调节价格运动的一般规律而存在。
其二,该书是运用逻辑与历史相统一的研究方法的典范。所谓历史和逻辑相一致的方法是指思维的进程必须反映历史的进程,这就是说,历史从哪里开始,思维进程也应该从哪里开始,但思维进程应该是历史进程在抽象的和前后一致的形式上的反映。该书的研究充分体现历史和逻辑一致的方法。
一方面,作者从历史的角度,按照经济思想史的发展,依次分析了劳动价值论向生产费用论的转化,以及由客观价值论向主观价值论的转化,在分别肯定了这些价值理论各自具有的真理性的同时,强调它们只是适用于特定条件下的狭义价值论,而只有根据比较利益率相等的原则决定的价值才是具有普遍适用性的广义价值。
另一方面,作者从实证的角度,回到价值理论研究的逻辑起点,阐明了价值决定与价值分配之间的关系,对价值理论研究中存在的若干似是而非的论点进行了剖析,指明“价值是凝结在商品中的一般人类劳动”这一命题,仅仅是古典经济学家在探讨价值决定问题时得出的一个个别结论,并非价值本身的定义或价值理论研究的逻辑起点。相反,价值作为“交换价值的基础”和“调节价格运动的规律”,才是价值理论研究的逻辑起点;价值所反映的是不同部门生产者的分工交换关系,价值的决定既不能离开生产(供给),也不能离开交换(需求),更不能离开分配。从商品的交换价值引出价值,然后探讨作为调节商品交换价值(或价格)运动的一般规律的价值是由什么决定以及如何决定的。顺着这种逻辑顺序,作者又探讨了分工交换的起源以及广义价值的决定,并由两部门模型扩展到N部门模型,由局部均衡扩展到一般均衡,由产品价值扩展到要素价值,最终形成体系完整、逻辑严密的广义价值理论体系。
其三,由于广义价值论建立了一个反映市场经济一般规律的价值理论,是继劳动价值论、新古典价值论和斯拉法价值论之后的第四大价值理论体系,是价值理论的又一次变革,因此该书具有重要的学术价值和应用价值,必将对我国理论界产生深远的影响。
第一,它将有助于我们深化对劳动价值论的再认识。作者认为,广义价值论并不是对狭义价值论的简单否定,而是一种理论的扩展。在以马克思劳动价值论为代表的狭义价值论中,商品的价值决定只取决于其自身的平均成本,而与机会成本无关。广义价值论将机会成本纳入商品价值决定中,将价值视为在交换过程中形成,将价值决定与价值分配相统一,很好地解决了传统的狭义价值论的许多理论难题,澄清了价值理论研究中存在的若干似是而非的论点。例如,通过广义价值论的分析,我们不难发现,困扰理论界长达一个世纪的所谓价值向生产价格的转化(转型问题)本身是虚构的,是一个伪命题,围绕它展开的争论实际上是毫无意义的。可见,广义价值论为推进价值理论和收入分配理论的创新,为构建适应社会主义市场经济需要的政治经济学体系奠定了理论基础。
第二,它把抽象的价值理论改造成了具有可操作性的价值理论。由于广义价值论是在具体劳动和使用价值形态上讨论价值决定的,它完全是根据具体劳动的生产率即单位劳动时间生产的使用价值量来推导均衡交换比例的,这就使原本抽象的价值理论具有可操作性。一般而言,只要我们掌握了两个部门生产两种商品的平均劳动耗费以及相应的机会成本,我们就可以容易地计算出两种商品的均衡交换比例即广义价值,从而使不同部门生产力的比较成为可能,这一研究成果可用于解决复杂劳动折算、工农业产品剪刀差的度量以及公平分配标准的确立等问题。
第三,它通过把生产力的概念由绝对生产力扩展到相对生产力,通过引入比较生产力,把李嘉图的比较优势说由一种单纯的国际贸易理论改造为一种有关分工和交换的起源、分工方向的选择和交换价值决定的一般价值理论。李嘉图虽然提出了比较优势原理,但他并没有将其应用于价值决定中,相反,他还否定了这一原理对于国内交换的适用性。而广义价值论的分析则相反,认为支配国际交换的比较利益法则,同样支配国内交换,而且,首先是作为支配一国内部分工与交换的规律而发生作用的,从而为分工与交换经济中确定分工和专业化的方向提供了理论基础。
第四,它同时也为中共十六大确立的生产要素按贡献分配的原则提供了价值基础。通过把新古典的边际生产力理论引入广义的要素价值决定模型,在广义价值论基础上阐明了功能性分配,作者建立了包括产品价值决定和要素价值决定在内的完整的广义价值论体系。这一创新成果,为按生产要素贡献分配奠定了更坚实的理论基础。只要我们全面地把握按贡献分配的思想,把价值的创造和价值的分配统一起来,把非劳动收入和剥削区分开来,把剥削与私有制区分开来,保护合法的非劳动收入与保护私有财产就会顺理成章,消灭剥削和发展非公有制经济就会并行不悖,我们就能够打破传统观念和思维模式对人们的束缚,使保护私有财产逐步成为全社会的共识,从而为保护合法的非劳动收入、保护公民合法的私有财产以及非公有制经济的进一步发展提供必要的理论依据,扫清思想上的障碍。
笔者认为,广义价值论的研究在两个层面上还有待拓展。其一是理论层面的,即如何把需求及市场结构引入广义价值决定模型,如何建立起既适用于可变分工,又适用于不变分工和混合分工的统一的广义价值模型。其二是经验层面的,即如何运用统计的和计量的方法对广义价值论进行经验验证。我们期待着蔡继明教授和他的学术团队在广义价值论的深化和检验以及相应的应用方面不断取得新的成果。
广义神经网络 篇4
现代电力系统的谐波问题正随着非线性负荷的广泛使用而日趋严重,为了有效地对谐波进行分析与治理,准确并合理的谐波源模型必不可少[1]。现有的谐波源模型[2]有恒流源模型、基于交叉频率导纳矩阵模型、Norton等效模型、基于最小二乘法的简化模型等。对于铁磁饱和型负荷、电弧型负荷和网络拓扑结构复杂的多个谐波源组合的负荷来说,难以获得其数学模型,因此学者们提出根据实测数据对谐波源建模[3,4]。
神经网络具有强大的非线性映射能力、并行处理和自学习的优点,它不用考虑谐波源内部机理。文献[5]提出用RBF神经网络建立不可控整流桥的稳态频域模型,将谐波负荷功率灵敏度引入潮流计算,提高潮流计算的收敛速度;文献[6]利用广义生长-剪枝RBF神经网络表征相同谐波源的电压-电流特性,建立稳态频域谐波源模型,进一步提高模型精度。非线性负荷在实际运行过程中吸收的谐波电流受其基波电压和基波功率等运行条件的影响,现有方法还未能直接揭示这一特性。本文引入电压运行度Sv和功率负荷度Sp分别表征基波电压和基波功率水平,基于广义回归神经网络采用实测数据建立谐波源的负荷度-电流特性;对网络平滑系数进行优化设计,将最小检测误差对应的平滑系数用于网络训练。以某铸造厂中频炉实测数据为例,结果表明该模型计算值与实测值的误差很小;具有人为确定参数少、训练时间短、所需样本少、精度高等优点,适合一般谐波源的建模。
2 广义回归神经网络
广义回归神经网络(Generalized Regression Neural Network,GRNN)是由Specht在1991年提出的,它是RBF神经网络的一种变化形式。GRNN具有良好的非线性映射能力、建模所需样本少、人为确定参数少的优点,其网络的训练完全取决于数据样本;网络的结构和连接权值由学习样本唯一确定,训练过程只需通过一维寻优来人为确定平滑系数σ,最大程度避免了人为主观因素的影响[7]。
2.1 GRNN网络结构
GRNN仍然采用BP算法对连接权值进行修正,网络隐含层节点采用高斯函数作为基函数,当输入信号靠近基函数的中央范围时,隐含层节点将对输入信号产生局部响应。GRNN包括输入层、模式层、求和层和输出层4层神经元[7,8]。
输入层:神经元数目等于学习样本中输入向量X的维数m,即X中有m个元素。
模式层:神经元数目等于学习样本的数目n,神经元i的传递函数为
求和层:该层中有2种类型的神经元,一种是对所有模式层神经元的输出进行算术求和,模式层各神经元与该神经元的连接权值为1,传递函数为
另一种是对所有模式层神经元的输出进行加权求和,模式层中第i个神经元与求和层中第j个求和神经元之间的连接权值为第i个输出样本Yi中的第j个元素yij,其传递函数为
输出层:神经元数目等于学习样本中输出向量的维数l,各神经元将求和层的两种神经元的输出相除得到网络的输出yj,即
2.2 GRNN平滑系数的优化设计
GRNN的网络训练实际上是确定平滑系数的过程,隐含了网络性能的验证过程,在学习样本中无需另外的验证数据。与BP算法不同,GRNN在训练过程中只需改变平滑系数,从而调整模式层中各神经元的传递函数,以获得最佳的回归估计结果。
本文将平滑系数在区间(0,0.05)内划分成50等分等间隔递增变化,一次性随机抽取10%左右的样本集用于检验,其余的样本用于构建网络,用构建的网络模型计算检测样本的均方根相对误差,称为检测误差E,在此省略了文献[8]中需要循环每一个样本的步骤,提高了平滑系数的寻优效率。
式中,和Yi(X)分别为检测样本的计算值和实测值;n为检测样本个数。
3 基于GRNN的谐波源建模
由于电压运行度Sv和功率负荷度Sp两者之间的不同组合关系对应着谐波负荷不同运行状态,产生的谐波电流也不同。对于单个谐波负荷而言,可以采用负荷电压标幺值和功率标幺值来表示Sv、Sp,即负荷实际基波电压与额定电压之比,实际基波功率与额定功率之比。
然而,当需要对一个谐波负荷群进行建模时,由于各谐波负荷运行状态不同,此时不便于采用电压和功率标幺值来代替Sv、Sp,可以考虑采用各谐波负荷的加权Sv、加权Sp来等效这一谐波负荷群的Sv、Sp,从而反映该谐波负荷群的负荷度-电流特性。
值得注意的是,当不考虑Sv的变化时,可以采用基波电流标幺值代替Sp,但对于电压变化很剧烈的电弧炉这类负荷来说,应该考虑Sv的影响。
文献[9]将谐波源的电压-电流非线性特性统一表述为
式中,为非线性负荷吸收的h次谐波电流向量;为供电电压基波和各次谐波电压向量;C为负荷特征参数集。在实际工程中,C难以确定,因此文献[10]提出了谐波源简化模型,假设C在运行期间内保持不变,不考虑C的影响。
本文提出的基于GRNN的谐波源建模方法采用实测数据作为输入输出变量,根据实测数据的大小和GRNN网络训练的需要决定是否归一化处理。对于不同谐波源,其负荷特征参数C也不同,而Sv、Sp则反映了所有谐波源的共性,因为非线性负荷在实际运行中,其吸收谐波电流的变化受到Sv、Sp的影响,因此对于所有谐波源都可以用Sv、Sp作为谐波负荷特征参数的一个子集,本模型只考虑各次谐波电压、电流幅值,而不考虑它们的相角关系。
综上所述,根据式(7)的关系,考虑Sv、Sp的谐波源模型可表示为
这样,各次谐波电流幅值与各次谐波电压幅值、Sv和Sp的非线性映射关系可以通过对GRNN的训练建立起来。在系统实际运行过程中,基波电压和各次谐波电压幅值的变化范围不会超过系统电压额定值的10%[6];而谐波负荷功率随着运行工况的改变可能大幅度变化。此时,各次谐波电流主要受Sp的影响,根据Sp可以估计出各次谐波电流幅值,式(8)可以简化为式(9)的关系式,用于单独研究Sv、Sp对各次谐波电流幅值的影响。
定义1:用于衡量GRNN学习精度的两个指标[6]:算术平均误差εM AE和均方根误差εRM SE。
式中,Ih^、Ih分别为进行GRNN网络训练时各次谐波电流幅值的计算值和实测值。
4 算例分析
为了验证所提出的基于GRNN的谐波源模型的有效性,采用宜宾某铸造厂的中频炉实测数据进行GRNN网络训练。该中频炉由12脉波整流电源供电,理论上只含有12k±1(k为整数)次的特征谐波,本文考虑1、11、13、23、25次特征谐波电流幅值。中频炉额定功率为6600kW,选取供电变压器一次侧进行实际测量,考虑了谐波电流在变压器中的传播特性。互感器PT为110kV/100V,CT为400A/5A,如图1所示。测量仪器为电能质量分析仪PQPT1000,GRNN编程软件为MATLAB。
测量数据为每分钟一个值,取A相的400个样本,随机抽取350个为训练样本,剩下50个为测试样本。GRNN人为确定的参数只有一个平滑系数σ,使其预测模型能最大限度地避免人为主观假设对预测结果的影响,σ一般小于1,能够更好地拟合数据。为了更好地说明Sv、Sp与各次谐波电流幅值的内在联系,分别对式(8)、式(9)和文献[10]的简化模型进行GRNN网络训练,通过对比来反映Sv、Sp对各次谐波电流幅值的影响,分别按2.2节中的方法确定平滑系数σ为0.021,0.003,0.006,此时的检测误差Emin最小,拟合结果也最满意。
图2显示了中频炉11、13次特征谐波电流幅值(I11、I13)与Sv、Sp之间的相互关系。从2图中可以看出,在中频炉运行过程中,Sv在区间(0.59,0.605)范围内随机波动,它对I11、I13的影响比较小,I11、I13主要受Sp的影响,两者的变化是基本一致的,当Sp增大时,I11、I13随之增大;I23、I25也有类似的关系,由于篇幅有限,在此不再多作说明。
由表1可见,通过三个模型的GRNN训练结果可以很清楚地发现:(1)功率负荷度Sp对各次谐波电流幅值的影响很大,Sp是负荷特征参数的一个很重要的元素,如果没有它,很难确定谐波电流;(2)GRNN网络训练并不是输入参数越多越好,考虑太多影响很小的因素而忽略了影响很大的因素时,可能导致其训练结果误差很大,甚至导致不正确的结果。与文献[6]的GGAP-RBF方法相比,本文方法的训练时间比其缩短两倍左右,GRNN网络训练的平均绝对误差比较大,其原因有:(1)基波电流幅值比其余谐波电流幅值大很多,其误差占了平均绝对误差的绝大部分;(2)本文方法采用的变压器一次侧(110kV)的实测数据比文献[6]方法采用的基于电压、电流三相对称假设条件下的仿真数据随机性和影响因素也更多,对GRNN的训练误差有一定的影响。除此之外,文献[6]方法不能反映谐波源的负荷度-电流特性。
表2显示了在两种不同运行条件下的各次谐波电流幅值估计的结果。通过Sv、Sp对各次谐波电流幅值的预测误差比较小,满足实际工程中谐波源建模的要求,可以根据不同Sv、Sp的组合关系通过GRNN建模方法估计谐波源的各次谐波电流幅值。
5 结论
(1)提出一种基于广义回归神经网络采用实测数据的谐波源建模方法,算例结果验证了模型的正确性和有效性,此方法适用于一般谐波源建模。
(2)引入电压运行度和功率负荷度概念,将谐波源负荷度-电流特性关系通过广义回归神经网络建模,对网络平滑系数进行了优化设计。
(3)研究了谐波源在不同运行条件下的负荷度-电流特性,根据电压运行度和功率负荷度估计各次谐波电流幅值,模型精度能够满足实际工程要求。
摘要:提出了一种基于广义回归神经网络采用实测数据的谐波源建模方法。引入电压运行度和功率负荷度概念,通过广义回归神经网络将它们与各次谐波电流幅值之间的非线性映射关系建立谐波源模型。在该模型中,对网络平滑系数进行了优化设计,将最小检测误差对应的平滑系数用于网络训练;对谐波源在不同运行条件下的负荷度-电流特性进行了研究,根据电压运行度和功率负荷度估计各次谐波电流幅值。以某中频炉实测数据为例,结果表明该模型计算值与实测值的误差很小,具有人为确定参数少、训练时间短、精度高等优点,是一种有效的谐波源建模方法。
关键词:电能质量,谐波源建模,广义回归神经网络,功率负荷度,实测数据
参考文献
[1]肖湘宁(Xiao Xiangning).电能质量分析与控制(A-nalysis and control of power quality)[M].北京:中国电力出版社(Beijing:China Electric Power Press),2004.
[2]郑连清,吴萍,李鹍(Zheng Lianqing,Wu Ping,LiKun).电力系统中谐波源的建模方法(Modeling ap-proaches of harmonic sources in power system)[J].电网技术(Power System Technology),2010,34(8):41-45.
[3]Nassif A B,Yong J,Xu W.Measurement-based ap-proach for constructing harmonic models of electronichome appliances[J].IET Generation,Transmission&Distribution,2010,4(3):363-375.
[4]Mau Teng Au,Jovica V Milanovic.Development of sto-chastic aggregate harmonic load model based on fieldmeasurements[J].IEEE Transactions on Power Delivery,2007,22(1):323-330.
[5]Moreno M A,Usalla J.A new balanced harmonic load flowincluding nonlinear loads modeled with RBF networks[J].IEEE Transactions on Power Delivery,2004,19(2):686-693.
[6]占勇,程浩忠,葛乃成,等(Zhan Yong,Cheng Ha-ozhong,Ge Naicheng,et al.).基于广义生长-剪枝径向基函数神经网络的谐波源建模(Generalized growingand pruning RBF neural network based harmonic sourcemodeling)[J].中国电机工程学报(Proceedings of theCSEE),2005,25(16):42-46.
[7]Donald F Specht.A general regression neural network[J].IEEE Transactions on Networks,1991,2(6):568-576.
[8]陈娇,王永泓,翁史烈(Chen Jiao,Wang Yonghong,Weng Shilie).广义回归神经网络在燃气轮机排气温度传感器故障检测中的应用(Application of general re-gression neural network in fault detection of exhaust tem-perature sensors on gas turbines)[J].中国电机工程学报(Proceeding of the CSEE),2009,29(32):92-97.
[9]Task Force on Harmonics Modeling and Simulation.Mod-eling and simulation of the propagation of harmonics in e-lectric power networks part I:concepts,models,and sim-ulation techniques[J].IEEE Transactions on Power De-livery,1996,11(1):452-465.
广义解释及造句 篇5
【注音】: guang yi
广义解释
【意思】:范围较宽的定义(跟‘狭义’相对):~的杂文也可以包括小品文在内。
广义造句
1、这个广义的理解帮助他们看到大局。
2、第一章节提出了一个广义而又详细的软件需求。
3、如果他的理论正确,那么在低能量下它看起来像广义相对论。
4、当然,这是广义的,但是还是有很多额外的糖和脂肪被添加进了食物,当你外出用餐事至少有额外的脂肪在大多数的餐点中。
5、他们发现的红移量,似乎是由引力所引起,其数量恰好与广义相对论的预测相符合。
6、草图速写和制作模型也是观看的动作,除了我认为观看还有广义的含义。
7、广义的思考是我们拥有的一种前自觉的意识类型,存在于有关的感觉意识中。
8、“从广义上来说,像这样的顶级捕食者是整个生态系统的晴雨表,”他解释说。
9、这一战略呼吁国家采取全面行动,并给我们的国家安全下了一个广义的概念。
10、食品和药物管理局要求天然风味需来自天然的材料,但它是个很广义的分类。
11、那意味着在将来相当长的时间里我们在广义相对论上还有很多事情要做。
12、这种观点认为大脑的运转更像是一个有着不同功能的工具箱,而不是广义的一件设备。
13、我们在本书中推出的广义理论和具体模型,都包含着与那些主流正统的企业和产业行为理论不一样的基本假设。
14、只有这样,广义相对论的效果才能被观察到,而且可以在地球上确认这个效果是否也适用于宇宙。
15、更具体而言,问题在于爱因斯坦的引力理论即广义相对论中将时间和空间联系起来。
广义的“街头艺术”及其起源 篇6
“街头艺术”随着1980年代之后的涂鸦繁荣期而获得了更多的受众。1976年让-米歇尔·巴斯奎特(Jean-Michel Basquiat)以“SAMO”的假名在曼哈顿下城的建筑物上开始喷漆涂鸦,是这段历史中具有标志性的事件之一;但是最初的一系列实验则可追溯到1970年代初纽约的包厘街墙壁绘画(Bowery Mural)和SOHO区的大街小巷,后者存有勒内·蒙卡达(Rene Moncada)的墙壁绘画。
街头艺术的历史渊源可追溯到一句俚语“吉佬儿到此一游”(“Kilroy was here”)。它是美国文化的一种表现,曾于二战时期一度流行,并常常以涂鸦的形式出现。“吉佬儿到此”的起源难以确定,但这个文字与图像结合的独特涂鸦—一个长有大鼻子的光头双手攀墙、向前窥探的样子—成为与1940年代美国部队文化相关联的一个标识。
传统的涂鸦艺术家主要用徒手喷漆来从事他们的创作,但街头艺术则不同,它包括了更多其他的媒介和技术,比如:模具喷涂、拼贴、马赛克镶嵌、投影、街头装置、针织涂鸦等。街头艺术家常常在国家与国家之间穿梭,寻找合适的空间创作并传播他们的创意。他们其中一些已有很多追随者,并受到媒体和艺术界的关注,并开始以成名时的街头风格从事带有商业性质的工作。纽约、迈阿密、旧金山、伦敦、布里斯托、巴黎、柏林、圣保罗和布宜诺斯艾利斯都是街头艺术的发达之地。其中一些艺术家已经转以平面设计师的身份为企业工作,他们的创意则被主流广告文化吸纳。最著名的例子是:凯斯哈林(Keith Haring)、班克西(Bansky)、谢帕德·费瑞 (Shepard Fairey)和黑兹(Haze)。在街头艺术的领域中,艺术家开展自我推销的例子并不少见。
至于在中国,最近由美国导演Lance Crayon制作的纪录片《北京涂鸦》, 试图使中国涂鸦艺术家鲜为人知的状态公诸于世。出乎导演Crayon的预期,他发现艺术家在一些地段可以白天公开工作,还吸引了不少路人围观及拍照,而警察则视而不见。这种情况与西方国家完全相反,那里的街头艺术家不仅可能会被罚款数千美元,甚至获狱数年。2008年北京奥运会期间,中国政府甚至赞助涂鸦。有资料显示,在中国,室外空间的书写创作有着悠久的历史,自汉代起,已有人们在岩石、树木或墙壁上刻字的记载。不同于西方对自然的态度:或做科学式的观察,或者仅是作为物质对象去摹仿;传统的中国艺术家几乎从不把自然视为客体,而视“自然”为“我”的投射,视其为灵感的来源。传统的中国艺术家的山水画创作,是他们体会“道”的一个过程。这也许可以从一个方面帮助我们理解:为什么古代的中国人乐于以自己的心意改写自然,并以自然为他们的“画布”。
在西方,某些国家政府和公民视街头艺术为犯法,有的则认为这只是一种艺术形式而已。“故意破坏,毁坏财物,抑或非法侵入”,街头艺术家以这样的罪名被指控的事件也时有发生。在挪威首都奥斯陆,政府对涂鸦和街头艺术采取零容忍政策。从广义上说,街头艺术在西方国家通常被视为一种表达政治或社会见解的形式。而这种观点存在误导的部分。尽管颠覆性一直是街头艺术的特点之一,然而在我们看来,这样的特性并不是街头艺术所独有。对于街头艺术,一个更普遍的共识在于,它不断寻找着契合的表现形式,期望使艺术唤醒人们所处的平凡空间。废弃的墙壁、荒废的建筑物和火车表皮等都可以为街头艺术家开展创作所用,以这样的角度来看,几乎各种公共空间的各种因素都有可能成为街头艺术创作的一个有机组成部分。下面我想列举一些街头艺术作品,它们形象地说明了街头艺术的特质。前四个作品分别来自俄罗斯的Pavel Pukhov、巴西的 Os Gemeos(奥斯·葛妙斯兄弟)、波兰的Etam Cru组合和法国的Oak Oak,他们的共同点是挪借了公共空间中已有的元素来促成他们的创作:一盏路灯,一个屋顶,一扇车库门,一座房屋的转角,所有这些都可以是萌生创作的契机。因此,街头艺术确实转变了艺术和公共空间的关系;同时它也转变了艺术品和特定艺术空间的关系。它的存在启示我们,并不是所有艺术都依赖于画廊或美术馆方能获得展示:这些艺术只需周遭世界作为画布,同样以世界作为它们写作人间喜剧的素材—街头艺术面向其发声的剧场,就是我们的世界本身。
(本文作者Filippo Fabrocini(周思远)系布睿克艺术空间的艺术总监。曾任职于Pontifical Gregorian大学(意大利,罗马)哲学部, 也曾于梵蒂冈博物馆担任艺术顾问及策展人,同时担任伽利略博物馆(意大利,佛罗伦萨)的顾问。撰写从当代哲学到艺术和美学理论的书籍和多篇文章被分别收录在多项专业书籍及著作中。)
广义神经网络 篇7
一、广义回归神经网络
广义回归神经网络 (GRNN) 是径向基函数神经网络的一种, 有三层组织结构。第一层为输入层, 有信号源结点组成。第二层为径向基隐含层, 神经元个数等于训练样本数, 由所描述问题而定, 第三层为线性输出层, 其权函数为规范化点积权函数, 计算网络的输出。
GRNN网络连接权值的学习修正使用BP算法, 由于网络隐含层结点中的作用函数采用高斯函数, 从而具有局部逼近能力, 此为该网络之所以学习速度快的原因, 此外, 由于GRNN中人为调节参数很少, 只有一个阈值, 网络的学习全部依耐数据样本, 这个特点决定网络得以最大可能地避免人为主观假定对预测结果的影响。
二、GRNN在经济预测中的应用
本文根据对GDP影响因素的分析, 这里分别取固定资产投资、从业人员数量、能源生产总量、财政支出、货运量、人均收入、进出口量, 货币供应量等8项指标作为GDP预测的影响因子, 以第一产业, 第二产业, 第三产业生产总值作为GDP的输出因子, 即网络的输出。由此来构建广义回归神经网络。
我们通过查《中国统计年鉴》, 利用1990年~1999年共10年的历史统计数据作为网络的训练样本, 2000年~2003年共4年的历史统计数据作为网络的外推测试样本。
应用MATLAB7编程, 创建一个GRNN网络, 输入向量组数为10, 每组向量的元素个数为8, 中间层径向基神经元个数为10, 输出层有线性神经元个数3。对网络进行训练和测试。我们将光滑因子分别设置为0.01, 0.02, 0.03, 0.04, 0.05, 通过不断的尝试, 我们得到光滑因子为0.01时, 网络的误差最小, 逼近效果相对最好, 如图1所示, 网络此时的逼近误差基本均在0附近, 网络训练符合要求。
通过2000年至2003年共4年的数据进行网络外推预测测试, 得到预测误差曲线如图2, 网络的输出误差分别在0.12和0.25之间。应该说在训练样本较少的情况下这种误差是可以接受的。因此可以用GRNN神经网络进行预测, 将2007年的相关数据进行输入网路中, 就可以得到2008年的各产业的经济生产总值了。
三、结论
通过以上对GRNN在经济预测中的应用分析可以看出, GRNN神经网络模型在预测方面有很好的优势, 其预测精度较高, 对参数的要求较低, 只需一个光滑因子, 但模型本身也有一定局限, 其对样本数据依耐很强, 随着时间推移, 其预测结果偏差会越来越大, 因此模型更适合于短期预测。如要应用于长期预测, 就需不断增加新样本数据, 对模型进行完善。
参考文献
[1]乔维德:基于BP神经网络的电力企业信息化水平评价指标体系的研究[J].电气时代, 2004, A20
[2]欧邦才:基于BP神经网络的经济预测方法[J].南京工程学院学报 (自然科学版) , 2004 (2) , 11~14
[3]飞思科技产品研发中心:神经网络理论与MATLAB7实现[M].北京:电子工业出版社, 2005, 117
广义神经网络 篇8
雷达是武器系统的关键组成部分之一,雷达可靠性是影响对武器性能发挥的的重要因素。目前,雷达的维护主要有事后维修与定时维修两种主要维修策略,但是这两种维修策略还不能完全满足雷达保障实际工作的需求。事后维修只能在装备发生故障以后进行;定时维修的维修阈值难以准确判断。两者可能导致维修过度、维修不及时等问题。
预测维修是解决这一问题的有效途径,故障预测是预测维修的主要研究内容。由于雷达系统的非线性,所以难以用解析的方法对其建模,基于数据驱动的方法是雷达故障预测的重要方法。
近年来,人工神经网络和遗传算法(GA)在求解复杂的高度非线性问题时表现出巨大的优势,被广泛应用于预测、优化和控制领域。广义回归神经网络(GRNN)是一种有效的数据驱动建模方法。针对GRNN的平滑因子难以确定的问题,本文利用遗传算法优化广义回归神经网络(GRNN)平滑因子,建立雷达故障预测模型。
1 GRNN网络及GA算法
1.1 GRNN网络
GRNN网络最早由Sprecht提出,它是径向基神经网络的变形,其结构与径向基网络接近,仅在输出的线性层有一些不同,非常适合于非线性函数的逼近。GRNN网络结构包括三层:输入层、径向基隐含层及线性输出层。输入层节点只传递输入信号到隐含层,隐含层节点由像高斯函数那样的径向基传递函数构成,而输出层节点通常是简单的线性函数。隐含层节点中的基函数对输入信号将在局部产生响应,当输入信号靠近基函数的中央范围时,隐含层节点将产生较大的输出,所以GRNN网络具有局部逼近能力。
GRNN网络较BPNN和RBF网络模型而言,克服了收敛速度慢和容易陷入局部最小等缺点,有很好的逼近能力、分类能力和学习速度,网络最后收敛于样本量集聚较多的优化回归面,并且在样本数据相对较少时,效果也比较好。此外,GRNN网络中人为调节的参数少,只有1个阈值,网络的学习全部依赖数据样本,该特点决定了网络得以最大限度地避免人为主观假定对预测结果的影响。
GRNN网络的基本原理为:假设Xi和Yi分别是输入矢量和输出矢量的样本,对于任意一个X对应的Y值,可以用以下公式进行评估:
(1)式中,
δ即平滑因子是GRNN网络仅有的参数。
1.2 GA算法
平滑因子的确定是GRNN网络训练的实质和难点[1],本文采用GA算法对GRNN的平滑因子寻优,并优化神经网络的隐含层神经元数。GA算法的主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于梯度信息,因此避免了基于微分寻优方法的一些缺点,如可能陷入局部最优解和对各变量要求较苛刻等,尤其适用于处理传统搜索方法难以解决的复杂和非线性问题。
2 GRNN预测模型建立
2.1 数据预处理
由于收集的训练样本是在不同条件下形成的,而且原始样本数据取值范围较大,不适合神经网络的训练和预测,所以需要对训练样本进行预处理。在GRNN网络学习阶段,需要对输入值和对应的已知输出值进行归一化处理,即把数据处理成0~1之间的数值,如(3)式、(4)式所示。
(3)式中,xi为归一化后GRNN网络的输入值;xdi为原始输入值;xdmin为原始输入值中的最小值;xdaxn为原始输入值中的最大值;tl表示归一化后神经网络的目标值;ydi表示原始目标值;ymini表示原始目标值中的最小值;ymaxi表示原始目标值中的最大值。GRNN网络经过学习训练后,得到预测值Ol,其值范围为0~1,因此,需把预测值还原为实际值。
(5)式中,ypl为预测值的还原值;Ol为神经网络的预测输出值。
2.2 GRNN预测模型
该GRNN预测模型的输入层由10个神经元组成,分别代表雷达前10个时刻的状态值,输出层由2个神经元组成,分别代表下一时刻的雷达状态以及状态变化速度,隐含层神经元个数由GA优化确定,算法如下:
(1)浮点编码。浮点编码精度高,不受染色体编码长度的限制,同时可以提高运算效率。对GRNN输入矢量的每一维分别取一个平滑因子,即染色体编码长度即为输入矢量的维数。染色体即种群的个体,每个个体代表GRNN模型平滑因子的一种取值情况。
(2)适应度函数。如何构造适应度函数,是遗传算法的核心问题之一。本文每次从训练样本中取出一个样本作为预测样本,其余样本作为训练样本,根据预测得到的最小均方差来构造GA算法的适应度函数。
(3)交叉操作。采用简单的单点交叉操作,随机产生交叉点。交叉操作为[2]
(6)式中,ak,bk为交叉前的个体,a'k,b'k为交叉后的个体;α,β为(0,r)区间上均匀分布的随机数,系数r∈(0,1),调节r的值可以控制交叉操作的变化范围。L,R按实际问题的物理变量取范围的上、下限,此处取L=R=0.85。
(4)变异操作。本文采用如下变异操作:
(7)式中,c为变异前的个体,c'为变异后的个体,γ为(0,1)区间上的随机数,系数k∈(0,1)。
图1所示为GA算法寻优平滑因子过程流程图。
3 结果与分析
遗传算法最大进化代数为200,种群规模20,变异概率0.05,交叉概率0.6,采用Matlab进行训练和预测。
常用的神经网络的评价指标包括:标准偏差σ(standard deviation)、偏差系数CV(Coefficient of Variation)、期望偏差率EEP(Expected Error percentage)[3],参见式(8)、(9)、(10)。这三个评价指标表明预测值偏离计算值的程度。
其中,下标pre表示预测值,cal表示计算值,max表示最大值,上划线表示平均值。
训练好后,需要利用测试样本对模型进行测试,如果测试结果满足需要则可以将其用于故障预测,否则需要进行再训练。图2为预测结果与真实结果对比图。
理想情况下,预测值数据点都应该落在斜率为1的直线上,即线性完全正相关。用最小二乘法拟合这些数据,得出回归直线斜率为0.972,95%置信水平下回归直线斜率的置信区间为0.966~1.012,根据回归方程的显著性检验,证明预测值和计算值之间强相关。
4 结论
从测试数据可以看出,本文提出的方法预测精度较高,可以满足预测维修的需求。该方法利用GA对神经网络进行优化,目前,还有很多其他群优化算法可以用于神经网络的优化,这是本文的下一步工作内容之一。
摘要:针对目前雷达故障预测存在的问题,提出了一种基于遗传算法(GA)的广义回归神经网络(GRNN)模型。该模型以前10个时刻的雷达状态为输入,以下一时刻状态及其变化速度为输出;利用遗传算法对网络平滑因子以及网络结构进行优化,以均方差(MSE)最小构造适应度函数。仿真结果表明,所提出的GRNN模型预测值与计算值的偏差系数2.62%,期望偏差率2.07%。
关键词:雷达,遗传算法,广义回归神经网络,故障预测
参考文献
[1]Tse W L,So AT.Aweather information-based intelligent ice storage control system.ASHRAE Transactions,the2002Winter Meeting,Atlantic City,18—29
[2]Sprecht D F.The general regression neural network rediscovered.Neural Networks,1993;(6):1033—1034
广义神经网络 篇9
关键词:光伏电池,MPPT,椭圆基,广义动态模糊神经网络,智能控制
0 引言
智能电网是近年来国际上备受关注的未来电力系统发展方向的热门话题。分布式电源是智能电网中一个很重要的分支。光伏电池作为一种新兴的分布式电源越来越受人类的青睐[1]。因此对光伏电池的研究具有相当重要的意义。
光伏发电系统[2]的电流-电压的输出特性是非线性的,再加上其输出功率受光照和环境温度的影响很大,为了提高能源的利用效率,人们提出了最大功率点跟踪(MPPT)理论。MPPT这种理论目前已经有这几种算法:电压回授法,增量电导法,扰动与观察法[3]等。但是这些方法存在着对环境的适应性差,算法不严谨等缺点。目前神经网络和模糊系统在这方面的应用比较广泛,而且取得了较好的效果。模糊标记的权值是在训练之前选定的,只能对特定的情况实现最优控制。为了克服这些缺点,本文提出了基于椭圆基的广义动态模糊神经网络。该算法中,高斯函数的宽度可以通过训练实施在线自适应调整,并提出了模糊ε-完备性作为在线参数分配机制,避免初始化选择的随机性,提高了系统的自适应能力。
1 光伏电池的特性及MPPT原理
1.1 光伏电池的特性分析
光伏电池是通过光电效应或者光化学效应直接把光能转化成电能的装置。其输出特性方程式是[4]:
其中:Isc是指光电流密度,与照射时的光照强度有关,与所加电压无关;I0是逆饱和电流,是由PN结两端的少量载流子和载流子的扩散常数决定的;q指单位电流,取值1.6×10-19 C;A是理想因子,取值为1;k是波尔兹曼系数,取值是1.38×10-23J/K;T是电池表面温度;V是输出电压;I是输出电流;Rs为串联等效电阻。
根据光伏电池的数学模型在Matlab/Simulink建立模型,得到P-V曲线如图1所示。
由图1可以分析,输出功率随光照强度的增加而增大。当外部环境发生变化的时候,功率就会发生相应的变化,如果不及时控制,就会造成能源的浪费。因此,如何在外部环境发生变化时实现功率的最优化是光伏电池控制中一个急需解决的问题。
1.2 MPPT的原理
在光伏系统中,为了寻求阻尼的最佳匹配,通常是通过控制PWM的占空比来实现功率的最优化的。于是,在此基础上提出了MPPT理论[5,6,7]。由图1可以看出,当且仅当d P/d V=0时,输出功率最大。而电压V是由占空比决定的。因此直接把占空比作为控制变量,能够使控制系统简化,容易实现。
2 光伏系统最大功率跟踪控制原理
2.1 控制方案设计
在MPPT控制系统中,选择系统的第n周期和第n-1周期的功率差b(n-1)及第n-1周期的采样步长c(n-1)作为GD-FNN的输入量,第n周期的采样步长c(n)为神经网络的输出量。利用Matlab/Simulink搭建光伏发电系统控制器,其核心部分的原理框图如图2。
其中:S函数实现D(n)=D(n-1)+c(n)的功能。
2.2 GD-FNN的结构[8]
广义动态模糊神经网络是由输入层,隶属函数层,模糊推理层和输出层构成的网络。网络结构共有两个输入信号:第n个周期和第n-1个周期的功率差以及第n-1周期的采样步长。输出变量是第n个周期的采样步长。其结构如图3所示。
2.3 网络结构的算法
模糊规则的数量可以在线自适应调整是GD-FNN算法的优势之一,而其输出误差和其新样本是否满足ε-完备性是确定是否需要增加模糊规则的重要因素。
定义系统误差为:
其中tk是第k个期望输出。
如果ek>ke,则应该考虑增加一条新的规则。其中
其中:emin是系统期望的输出精度;emax是选择的最大误差;k是学习的次数;β∈(0,1)称为收敛常数。可以推导出:
同时,定义马氏距离为:
令
如果
则表明现有的系统不满足ε-完备性而应该考虑产生一条新的规则,其中kd是这样变化的:
上式中,r为衰减常数,它可以由上式推导:
当一条模糊规则产生以后,下一步就是如何分配参数。
假设u个模糊规则已经产生,当得到一个新的样本时,把多维输入变量投影到相应的一维隶属函数空间,同时计算数据xik和边界集φi之间的欧式距离edi(j),并找到它的最小值edi(jn),如果
就不用分配新的高斯函数,否则需要增加一个新的高斯函数,其宽度由式(11)决定,高斯函数的中心设置如下:
把输出变量的方程式看成是线性回归方程,其模型为:D=Hθ+E;其中,D=TT为期望输出;H=φT=(h1,…,hv);θ为实参数;E为误差向量。H通过QR分解成正交基向量集:H=PN,其中P=(p1,p2,…,pv)。
定义pi的误差减少率为
此外定义
其中ρj为误差减少率矩阵△=(ρ1,ρ2,…,ρu),如果ηi
高斯宽度可以修正是GD-FNN算法的另一个优势。输入变量的最近的隶属函数的宽度σij可以修正如下:
其中ζ是衰减因子,它是由下式决定的:
其中Bij是输入变量的敏感性。
从前面的分析可以看出,运用广义动态模糊神经网络对系统进行控制,其输入输出的隶属度函数的宽度是可以通过训练的,这就提高了系统跟踪环境变化的能力。
3 仿真设计与实现
在Matlab/Simulink里进行仿真,系统原理框图如图4所示,主要由光伏电池、模糊神经网络控制系统以及电阻性负载构成。
为了显示文中提出方法的控制效果,仿真中把结果与文献[9]中提出的模糊控制进行比较。采用ode23tb算法,设置环境温度为25°,光照在0.1 s时由600 W/m2变成900 W/m2,仿真时间为0.2 s,仿真图形如图5。
图5(a)是采用模糊控制的输出功率的曲线,图5(b)是采用广义动态模糊神经网络进行控制的功率输出曲线。可以看到,前一种方法响应速度慢,而且在最大功率点出现了震荡。运用本文提出的理论仿真的结果能在0.01 s快速找到最大功率点,并且有效地克服了最大功率点震荡问题。具有较好的鲁棒性和快速性。
4 结论
针对光伏电池这种新兴的分布式电源的特性,本文采用广义动态模糊神经网络控制算法,建立了一个光伏系统的控制模型,通过调节PWM的占空比对光伏系统的输出电压加以控制,从而实现输出功率的最大化。这种方法不仅能够很好地跟踪外部环境的变化,而且需要设置的参数比较少,同时具有一定的自适应能力,容易实现在线智能控制。仿真结果表明,这种控制系统的学习效率和性能有着更突出的优势,具有很好的鲁棒性及快速性。
参考文献
[1]Haase P.Intelligrid:a smart network of power[J].EPRI Journal,2005:27-32.
[2]Ghiang S J,Ghang K T,Yen C Y.Residential photovoltaic energy storage system[J].IEEE Trans on Industrial Electronics,1998,45(3):386-298.
[3]王松.一种基于神经网络的光伏电源最大功率控制系统[J].山东大学学报,2004,34(4):45-48.WANG Song.A maximum power control system of photovoltaic cells based on neural network[J].Journal of Shandong University,2004,34(4):45-48.
[4]滨川圭弘.太阳能光伏电池及其应用[M].北京:科学出版社,2009:18-34.Hamagawa Yoshihiro.Solar photovoltaic cells and its application[M].Beijing:Science Press,2009:18-34.
[5]Eduardo Román.Intelligent PV module for grid-connected PV systems[J].IEEE Transactions on Industrial Electronics,2006,53(4):1066-1073.
[6]叶秋香.光伏电池最大功率跟踪器的模糊控制及其应用研究[D].上海:东华大学,2006.YE Qiu-xiang.A study on PV maximum power point tracking system using a fuzzy controller[D].Shanghai:Northeastern University,2006.
[7]Efichios Koutroulis,Kostas Kalaitzkis,Voulgaris C.Development of microcontroller-based photovoltaic maximum power point tracking control system[J].IEEE Transaction on Power Electronics,2001,16(1):46-54.
[8]舒菲.基于RBF神经网络与模糊理论的电力系统短期负荷预测[D].西安:西安理工大学,2008:11-17.SHU Fei.Short-term load forecasting of power system based on RBF neural network and fuzzy theory[D].Xi'an:Xi'an University of Technology,2008:11-17.
广义神经网络 篇10
1燃气管道泄漏检测定位
1.1声发射检测定位原理
压力管道泄漏产生 的声发射 信号是广 义声发射 信号,管壁本身不释放能量,只是作为一种传播介质。泄漏过程中,在泄漏点处由于管内外压差,使管道中的流体形成多相湍射流,如图1所示。这一射流不但使流体的正常流动发生紊乱,而且与管道及周围介质相互作用向外辐射能量,在管壁上产生高频应力波。该应力波携带泄漏点信息(泄漏孔形状和大小等)沿管壁向两侧传播,对这种声发射信号进行采集和分析处理就可以对泄漏及位置进行判断,图2为管道泄漏声发射检测系统结构图。
1.2声波法定位及定位公式的改进
1.2.1声波法定位原理
当燃气管道发生泄漏时,管道内外压力差的存在使得管道内气体通过泄漏点到达管外时由于挤压而产生振荡变化的声波。该声波以一定的波速从泄漏口分别向管道上下游传播。根据上、下游传感器接收到该声波的时间差以及该声波 在管道介 质中的传 播速度可 以进行定 位,计算见式(1)所示。
式中:x为泄漏点到上游传感器A的距离,m;L为两传感器之间的距离m;v为声波在泄漏管道中的传播速度, m/s;u为管道内介质的流速,m/s;Δt为信号到达上 、下游传感器之间的时间差,s。
相对长输管道,城市燃气管道管径较小,多为中低压管道,压力范围一般为0.01 MPa<p≤0.4 MPa,管道内介质的流速一般为5~11m/s。实验数据表明,燃气管道泄漏定位声波传播速度约为3 300m/s。因此,相对于泄漏声波波速,管道内介 质流速的 影响可以 忽略不计,式 (1)可以变为式(2)。
管道长度可以通过设计图查得,问题的关键是如何准确检测声波的传播速度和传到两端传感器的时间差。
1.2.2改进波速和时差的定位计算
用式(1)进行管道泄漏定位时,一般假设泄漏声波波速为定值,取平均值。而实际管道泄漏声波的传播速度与管道内媒 介密度、压力、温度、比热容等 有关,并非常数。实际应用中,声波波速可简化为式(3)。
式中:αp为气体压缩系数,Pa-1;ρ为气体密度,kg/m3;T为温度,K;p为压强,取105Pa。
由式(3)可知,管道内声波的传播速度随温度和压力变化。从泄漏x点处产生的泄漏声波传播到上、下游传感器的理论时间差计算,如式(4)所示。
因城市燃气管道忽略管道内介质流速对声波波速的影响,式(4)可简化为式(5):
如果式(3)可以精准地描述声波在城市燃气管道中的传播以及管 道内传输 介质的传 送过程,那么根据 式 (1)、(3)和(5)即可实现城市燃气管道泄漏点的定位。
1.3离散小波变换定位
由连续小波变换的定义,可得对于任意函数的连续小波变换如式(6)所示。
其重构公式(逆变换)如式(7)所示。
由连续小波变换的概念可知,在连续的尺度和平移值下,小波基函数具有很大的相关性,所以一维信号做小波变换成二维后,它的信息是冗余的。在理想情况下,离散后的小波基函数满足正交完备性条件,此时小波变换后的系数没有任何冗余度,这样大大地压缩了数据,并且减少了计算量。
在连续小波变换中,令参数a=2-j,b=k2-j,其中j, k∈Z,则离散小波如式(8)所示。
用 Ψj,k记Ψ2-j,k2-j(t),对应的离散小波变换如式(9) 所示。
将含有噪声的信号在一个适合的尺度下分解到不同的频带内,直接提取有用信号的频带,导入MATLAB小波分析工具箱,根据声发射互相关分析原理,进行波形的互相关定位计算。
2广义回归神经网络的燃气管道泄漏定位预测
2.1广义回归神经网络结构
GRNN具有很强的非线性映射能力和柔性网络结构以及高度的容错 性和鲁棒 性,适用于解 决非线性 问题。 其算法中使用径向基函数运算,具有较好的泛化能力、逼近能力及快速学习特点,而且能逼近任意类型的函数、仿真精度高,即使在样本数据较少时,预测效果也较好,具有良好的实用性。基于此,采用GRNN建立燃气管道泄漏定位预测模型,对城市燃气管道泄漏进行精确定位。
GRNN由四层构成,如图3所示,分别为输入层、模式层、求和层和输出层。对应网络输入X=[x1,x2,…, xn]T,输出层为Y=[y1,y2,…,yk]T。
2.2城市燃气管道泄漏GRNN定位模型
选择一组最能反映期望输出变化原因的输入变量直接关系到神经网络预测的性能。根据上文可知,管道的泄漏位置主要与时差 Δt和声波波速有关,声波传播速度v是温度T和管道压力P的函数,同时与传感器间距L、 管道内径D、管道内介质流量Q有关。因此,以进出口压力P、进出口温度T、间距L、管径D、进出口流量Q等8个数据指标作为网络输入变量,分别以声发射检测定位值,声波法改进公式计算值和小波消噪分析定位值为神经网络的输出变量,构建GRNN。
笔者以实验室模拟燃气管道泄漏定位实验,选取压力分别为0.15、0.2、0.3 MPa做三组模拟实验,每组取样3次,共9组数据,其中1~7组作为训练样本,8~9组作为目标样本,见表1和表2所示。
在获得输入和输出变量后,要对其进行归一化处理, 将数据处理为[0,1]之间的数 据,归一化处 理计算见 式 (10)所示。
对数据归一化处理后进行样本训练。经归一化处理后,确定适合的光滑因子。对于广义回归神经网络,光滑因子对网络的逼近精度具有较大的影响。从理论上,spd越小,对函数的逼近越精确,但是逼近的过程越不平滑; spd越大,逼近过程就比较平滑,但是逼近误差会比较大。 因此,需要不断调整spd来确定最佳值,从而减少模型的误差。考察光滑因子的取值范围为0.1~0.5。训练网络的逼近误差和预测误差,分别见图4和图5所示。
2.3实验分析
由图4和图5可见,spd为0.1,无论是逼近性能还是预测性能,误差都比 较小。随着spd增加,误差不断 增加。从误差角度考虑,spd取0.1。此时网络输出为:
经过反归一化处理后,得到的结果为:
经过对其中两组数据分析可知,声发射检测值/声波法定位值以及小波分析定位值都在一定程度上提高了定位的精确度。然后分别采取上述方法,变换不同的训练样本和目标样本 进行预测,得到数据 结果见表3所示。 可见,以上三个输出变量的预测值误差率分别为8.38%、 7.49%和2.79%,相比于之前的13.19%、8.1%、3.9% 有了较大的提升。由图6和图7也可以看出,小波消噪定位方法更加接近泄漏点的真实值。
3城市燃气管道泄漏定位应用
3.1现场应用分析
2014年2月,对某市一 段燃气管 道进行泄 漏检测。 管道长约为70.5m,属于中压B级管线,管道压力约为250kPa,管道外径为426 mm。测量时间为用气低谷时段,流量约1 500m3/h。平均埋地深度为1.0m。管道上是硬化人行地面,南侧是交通主干道及公交站台,人员来往密集区,北侧6m处是小区,不具备开挖检测条件。
由于不具备开挖条件,采用图2介绍的管道泄漏声发射检测系统进行参数采集。在管道的两端布置传感器1和2,传感器间距为67m。准备完毕后,对管道进行3次数据采集。在获取管道参数的基础上采用声波法改进公式计算泄漏位置,计算结果见表4所示。
将1、2号传感器收集到的50对撞击波形用小波进行尺度分解。对两个传 感器的重 构波形进 行互相关 分析,获取互相关信息,进行互相关计算,画出互相关系数图,如图8所示。可以得到,互相关系数最大的是第25对波形,此时两信号所对应的采样点差值为145,根据互相关定位算法,得出泄漏点距离1号传感器33.51m。定位结果见表4所示。
在获取以上参数 后,用公式进 行归一化 处理,构建GRNN模型,取光滑因子为0.1时,网络的逼近误差和预测误差最小,此时得到网络的输出并进行反归一化处理, 得到的值见表4所示。
3.2泄漏位置验证
2014年5月,燃气公司在管道沿线每隔1m去土进行泄漏位置验证,用Gasurveyor 500型可燃气体检测报警仪检测,当检测仪放在距1号传感器37m的孔内时,可燃气体浓度值迅速上升并伴随报警声,可判断此处管道确有泄漏存在。结果表明,经过GRNN预测处理的定位值,相比于传统的检测方法和计算方法,在定位的精确度上有较大提升。相比于声发射检测、声波法改进公式定位,小波分析定位更加准确,有着广阔的应用前景。
4结论
(1)利用广义回归神经网络强大的容错和函数逼近能力,建立基于广义回归神经网络的燃气管道泄漏定位计算模型,确定输入与输出向量,将泄漏定位问题转化为函数逼近问题,进行燃气管道泄漏源检测定位分析,运算速度快,与实际检测结果比较,该方法定位精度较高。在实际管道泄漏定位中,取得较好效果。
(2)分析了影响管道泄漏定位的关键因素,对于声波法定位公式提出了改进。通过广义回归神经网络进行预测的检测值、声波法定位值以及小波分析值,在定位精度上得到很大提升,证明了构建的广义回归神经网络模型有用。而小波分析值最接近泄漏点真实值,可以将该方法运用于工程实际。
肖广义 中国牙雕擎旗者 篇11
他意识到牙雕面临“人走艺绝”的危险,毅然担负起传承国粹的重任,培养年轻人。
他就是北京象牙雕刻有限责任公司董事长、北京进茂骨雕工艺品有限责任公司董事长肖广义。同时还担任中国工艺美术协会象牙雕刻委员会主任、全国金银珠宝工艺品产业委员会副主任、北京工艺美术协会副会长。
如今,他成了一门国粹技艺的擎大旗者。他带领一批国宝级的雕刻师筚路蓝缕,破釜沉舟,将北京象牙雕刻厂打造成享誉业界的荣誉企业,保存并光大了牙雕这门传统工艺瑰宝,将北京象牙雕刻写进了国家非物质文化遗产保护名录,创造出令人瞩目的经济效益和社会效益,他本人也成为了业界声名显赫的领军人物。
走近肖广义,仿佛翻开了一部中国传统工艺向现代市场嬗变的史诗,雄壮得动人心魄。
精雕细刻创精品
作为东方文明古国,中国有着悠久的“文治”历史。全国的能工巧匠请汇集京城,进行讴歌盛世的艺术创作。他们互相切磋交流,开创了一个高端艺术流派——京工。
牙雕也是如此。象牙光洁如玉、坚实致密,历来是很好的雕刻材质,被誉为“有机之玉”,象牙雕也成为独特的工艺品种。在牙雕领域,也分南北两派。南方以苏州工和广州工为代表,清雅灵秀;北方则以北京工艺为典范,饱满盛大,华贵庄雅。
京工牙雕的擎大旗者,当然要数北京象牙雕刻厂。回顾过去,该厂走过了与共和国节奏相同的非凡历程。
新中国成立后,过去零散的牙雕私营作坊业主,纷纷接受社会主义改造,成立合作社。1956年1月15日,北京牙雕老艺人代表杨士惠作为“走上合作化道路的手工业代表”,向党中央毛主席报喜。
乘着社会变革的万里东风,1958年,北京的一批民办象牙作坊、合作社合并成立了北京象牙雕刻厂。
那是一段激情燃烧的岁月。牙雕艺人圈和整个工商业界一样,响应国家号召,一切以社会需要为中心,进入统购统销的行列。比起民国时期艺人的破落潦倒,业界享受到别样的荣光。
1959年,周恩来总理接见北京牙雕厂老艺人、劳动模范崔华轩;
朱德、康克清夫妇亲临工厂视察,并对工厂使用蛇皮钻取代手工操作高度赞赏,指示“多用机器,多在机器上发展”;
全国政协组织郭沫若、沈钧儒、李济深、马寅初等社会名流、文化大家来厂视察参观……
国家领导人和社会名流的关怀,令北京象牙雕刻厂倍感鼓舞。牙雕大师们心无旁骛、力争上游,在经典技艺基础上革新样式,创作出一大批形神兼备的艺术形象,将传统京工技艺水准推到新的高峰。北京象牙雕刻厂的作品造型优美、装饰华丽、线条挺拔、刀法富于变化,是牙雕界“京工风格”的卓越代表。
北京牙雕厂的大师杨士惠创作了重达10多公斤的《颐和园》,被中国政府作为国礼,赠送给德意志民主共和国总统皮克,祝贺他80岁生日。
杨士惠的另一名作《北海全景》,是与6位牙雕工人共同创作,历时两年才告完成的,赴伦敦参加国际展览,广受好评。1957年毛主席去苏联参加十月革命纪念活动,将《北海全景》作为国礼,赠送给苏联领导人。
1972年,北京牙雕厂作品《嫦娥奔月》再度作为国礼,被毛主席馈赠给前来中国进行“破冰之旅”的美国总统尼克松。
1977年,北京牙雕厂大型牙雕作品《万景台》被送给朝鲜首相金日成。作品《花卉月球》至今陈列在联合国总部大厦……
极“左”时期结束,随着政策调整,一些靠创汇补贴获得生存的工艺品行业,遭受重创。而在上世纪八十年代,北京牙雕厂在创作方面依然“逆市飘红”,创造出一批牙雕精品,如《飞夺泸定桥》、《毛主席走遍全国》、《东方红》、《嫦娥奔月》、《遵义会议光芒照前程》、《成昆铁路》、《八十七神仙卷》等。工厂开创性地采用“拼嵌法”,充分展现出象牙的细腻质感,以这种方法创作的《遵义会议光芒照前程》、《八十七神仙卷》等精品被国家博物馆收藏,成为传世珍宝。
这些成果的取得,除了归功于大师的刻苦努力,也与雕刻工具的自然发展密不可分。在过去,雕刻只能依靠手工和粗糙的机械,玉雕领域就有段子说“有女不嫁雕玉郎,三年五载守空房;有朝一日回家转,补完袜子补裤裆”,道出了原始方法的艰辛。在上世纪50年代出现的蛇皮钻,使雕刻效率和精度发生了天翻地覆的变化。北京牙雕厂不断把握变化,及时革新技术,实现了卓越的创造和领先。
负重奋进图发展
然而,在20世纪末,北京牙雕厂的经营还是遇到了极大的困难。首先,市场经济风起云涌,改革开放不断深化,而牙雕厂在体制上相对较僵化,欠缺适应能力。其次,原材料开始吃紧。1990年我国根据《国际濒危野生动植物贸易协议》停止进口象牙,北京象牙厂进入“吃老本”的状态:有多少存料做多少活,做完了谁也不知道该怎么办。
就这样,北京牙雕厂欠下巨额债务。牙雕属于工艺美术行业,除了大师的智慧,没有什么可以抵债的工业设备。原料少了,大师亦无用武之地,工厂失去造血功能,一度到了无法开出员工基本工资的程度。
在这种背景下,1998年4月,肖广义临危受命,接手北京象牙雕刻厂厂长兼书记职务。在当时的情况下,这与其说是当领导,不如说是当债主。
有人对他说,厂是国家的,债也不是你欠下的,不必太较真;但肖广义认为,既然戴了这顶帽,就要担起这份责。欠国家的也是欠,欠债还钱天经地义。另外,如果不能打翻身仗,倒下的不光是一个厂子,更是一个流派、一门传承千年的技艺!
于是,肖广义向债主们郑重承诺:三年时间,我们将还清所有债务!此后,他便开始了大刀阔斧的改革。
肖广义首先,压缩行政人员,降低人力成本。工厂裁员达60%,一部分到龄的办理退休手续,一部份分流到公司第三产业岗位。每年的人工开支也从420万元降到了180万元。
第二步是盘活土地资源,缓解资金压力。世纪之交的首都北京,已经出现了寸土寸金的局面,空地值钱起来。肖广义合理压缩改造厂房,把其中5000平方米改造成宾馆,对外承包营业,让工厂获得额外经济收益,激活牙雕业务。
第三步,肖广义着手解决原材料的问题。他亲自披挂上阵,找政府部门反映情况,表达诉求。他提出,野象诚然需要保护,但是完全禁绝象牙购买也不合理。首先,非洲国家自己就有合法的象牙买卖;其次,经过一段时间的保护,野象濒临灭绝的问题已经缓解,有的地方甚至开始泛滥。如果完全阻绝进口,灭绝的将是一门传统工艺,再找回来可就难了。
在肖广义多次据理陈说下,国家林业局终于开始重视这一问题。2000年国家林业局和国家工商总局给北京牙雕厂颁发了特种经营许可证,允许其合法进口象牙。
喜讯传来,全厂上下如同久旱逢甘霖,对肖广义的领导能力赞不绝口。人心很快重新凝聚,全力投入生产创作。
为了最合理地利用有限的原料,肖广义将牙雕产品定位于精品、艺术品和收藏品,进行精细化制作。
也有的人曾经企图把来路不清、疑似走私的象牙料卖进工厂,肖广义断然拒绝了。他决不触犯法律禁令,他要在产品的劳动附加值上做足功夫。
提升牙雕附加值的关键,在于人才技艺。肖广义重新启动工艺大师申评工作,工厂形成了强大的国家级大师团队,包括资深牙雕大师陈吉品、国家级大师李春珂、柴慈继等。这对大师是褒扬和鼓励,对其他人则树立了标杆,让大家共同看齐最高工艺水准。
肖广义还在牙雕领域率先提出了“经纪人公司”的理念。他说,牙雕领域有很多出色的老艺人,“肚子里有话倒不出来,不善言谈”。那就需要进行分工,由另外的专人对大师进行包装,对牙雕文化进行推广,这和演艺界、体育界的经纪人制度是一样的,是社会合理分工的需要。
除了象牙雕刻,肖广义近年来还开拓行业经营思路,贴近市场需求,挺进紫檀木雕刻领域,先后完成了《紫檀故宫》、《九门宫阙》等一大批声名远播、极具艺术观赏性与投资收藏价值的珍品力作。象牙与紫檀木材质不一样,雕刻手法差却不多,牙雕厂的木雕作品同样令人惊叹!
经过一系列改革创新,北京牙雕厂终于在2001年实现了经济突破,还清了银行的巨额欠款。这一成绩震动了全公司,轰动了传统工艺美术界。
谈到这里,肖广义激动地说:“我永远都忘不了那一天,2001年12月18日下午5点多钟,银行打电话告诉我,‘钱到帐了,你厂的债务全部还清了。’我当时激动得热泪盈眶啊!”——这是奋斗者才能真正体会的胜利喜悦!
摆脱了债务困扰,北京牙雕厂迈上了新的征程——
2002年,工厂成功进行企业化改制,成立北京象牙雕刻厂有限责任公司;
2004年,公司与中国工美集团联合举办“象牙制品收藏证”宣传月活动,并与广州象牙厂联合发起签订《中国象牙雕刻行业自律公约》,得到国家主管理部门的高度称赞;
2006年,该厂的“象牙雕刻”入选国家非物质文化遗产保护名录,孙森大师被批准为传承人。
2006年7月15日,在江西庐山召开的中国象牙雕刻专业委员会成立大会上,肖广义董事长当选为第一届主任委员。
2007年,全国人大常委会原副委员长、中国工艺美术协会名誉会长李铁映为北京象牙雕刻厂题词:人间绝艺,天阙极品。
此后,张德江、李长春、陈至立、田纪云等党和国家领导人,分别在不同场合了解和称赞了北京牙雕厂的作品……
如今,北京牙雕厂公司拥有8名国家级工艺大师、15名北京市级工艺大师,奠定其全国行业的领军地位,成为北方牙雕艺术的代表。企业先后被授予“全国红旗厂”、“大庆式企业”、“北京市质量工作先进单位”、“首都文明单位”等荣誉称号。公司名作层出,多次荣获“百花奖”、“西博会金银奖”等大奖,开创了现代牙雕技艺的鼎盛局面。
传承国粹担重责
牙雕,属于最原始的艺术门类之一,我国多个考古遗址均发现牙雕作品。几千年前的原始人将野兽的牙齿用细线串起来,挂在手上或胸前,代表征服和收获。有的还在牙上镂刻简单的花纹,增加它的美感和表意功能。北京山顶洞遗迹出现了象牙雕制的器具。
肖广义看到,牙雕是老祖宗留下来的手艺,而眼前面临了“人走艺绝”的危险。例如,牙雕泰斗陈吉品老先生,自少年师从清宫艺人学习牙雕,现在已经年逾九旬。牙雕技艺在百年前的刀光剑影中不曾断绝,如果在现今和平盛世却失传了,那真是对祖宗传统的极大不负责!
站在这个高度来认识牙雕创作工作,肖广义要求加强老专家对年轻人的传帮带、落实于工厂的管理实践当中,他所带领的北京象牙雕刻厂也有了不一样的做法。
关于牙雕技艺的传承。在过去,象牙雕刻具有封闭的业态,师徒私密授受,甚至师父教一手、留一手,生怕走漏了安身立命的绝招。而现在,北京象牙厂的年轻雕刻师学的都是“全套活儿”。肖广义认为,现在行业环境已经完全不一样,技艺传承才是最重要;我不怕他们学到、就怕他们不学,不怕他们跳槽、就怕他们转行。
2009年,工厂重新招年轻人,从北京工业大学雕塑专业引来多名大学毕业生。这些刚出社会的年轻人起薪并不高,但给予很好的学习机会,立足于全面学习牙雕技艺,以及培养文化使命感。用肖广义的话来说,就是要培养“又红又专”的接班人。“这说法有点过时,但是话糙理不糙”。
实际上,由于公司管理完善,由于肖广义以沉稳大气的风格运作这艘大船,5年过去,这些年轻人没有一个人选择离去,在牙雕厂渐渐成长起来。
2005年,肖广义还编辑出版了一本行业书籍《牙雕图案》,向社会宣传牙雕艺术,与业界交流牙雕技艺。书中涉及人物、花卉等不同的题材类别,不仅有图片,还有文字;不仅值得欣赏,还能够学习。它充分体现了肖广义在经营企业之外、对弘扬牙雕国粹的高度重视。
在牙雕原料稀缺、出品减少之下,必然会出现这样的经济现象:富豪更加追捧稀有之物,商家也就更专注于高端市场,追求日益优厚的利润。
然而,肖广义领导下的北京象牙雕刻厂却有一个“非卖品制度”:专家们认为具有最高艺术造诣、具备技法代表性的精品,只能流向博物馆,不对市场出售。早在2002年,肖广义带领的牙雕厂刚还完银行的巨债,就将三件一流的牙雕艺术精品捐给了国家博物馆。肖广义还说,将来条件成熟,还要建象牙博物馆。
为什么这样选择?肖广义考虑的是社会效益。所谓社会效益,就是无法通过市场交易完全展现的、具有普益性的价值。在商品经济无孔不入、市场似乎无所不能的今天,社会效益经常成为被人遗忘的角落。
肖广义认为,有限的产品不能都流向豪富的私人藏室,精粹部分实际上更应该属于整个社会。
孙中山先生的民生主义曾经以地价为例,强调一种社会主义理念:一种东西为什么能增值?因为全社会都喜欢它、需要它;所以说,增值应归功于社会,而不能被少数人专享。
在肖广义看来,牙雕也是如此。民众广泛喜欢牙雕,才造成它日益昂贵,而这种昂贵又令它被雪藏起来、脱离了民众、在小圈子里供人把玩,这显然是一种不合理的异化。
因此,肖广义和同事们抵御了奢侈品市场的高价利诱,让最精湛的作品展示于公众博物馆,让一代代的更多人在参观时能欣赏到它。说短浅点,这是让牙雕大师享誉久远,让北京牙雕厂确立品牌、名垂青史;说宏大点,这是文化传承,是国粹弘扬,能让人们望而生“喟”——我们的艺术曾经如此美轮美奂,这就是我们中国!
而这,不正是今天我们所向往的“中国梦”的根基所系么?
办企业,也是办文化;特殊的行业,需要特殊的经营理念。
从这个角度,我们能更好地理解肖广义,理解他和他团队的不懈追求。
广义神经网络 篇12
迄今为止,以和-积式神经元为基础的前馈型多层(特别是三层)神经网络,与误差反向传播(Error Back Propagation,BP)学习算法相配合的ANN结构体制,获得了最广泛的应用。
BP算法实质上是把一组样本输入输出问题转化为一个非线性优化问题,并通过梯度算法利用迭代运算求解权值问题的一种学习方法[1]。在BP网络中,神经元最有名的输入—输出关系是一非线性极限函数,已经证明,具有S型非线性函数的多层神经网络可以任意精度逼近任何连续函数,但是,BP算法在性能上仍存在若干待改进的地方。例如,算法迭代次数甚多使得学习效率低,收敛速度很慢;BP网络是前向网络无反馈连接,影响信息交换和效率;它只能调整权值,不能调整网络拓扑结构,无法实现注意力集中功能;学习新样本时,会“冲乱”原已学好保存下来的旧样本;其学习算法中,包含有较复杂的非线性激励函数的求导运算过程等。针对BP网算法的缺点,人们提出了几种改进算法,如MFBP算法、MBP算法和前向网络的自构形学习算法等。这些新方案显示出BP网络未曾具备的一些特性,但离智能计算的需要仍还很大距离。
文献[2,3]曾提出广义同余神经网络((Generalized Congruence Neural Networks,GCNN),该网络采用广义同余函数为激励函数。初步研究显示,相对于BP网络,GCNN具有很快的学习速度。同时,也存在一些不足,主要包括:学习能力略差,激励函数模值不易设定,难以开发出合适的学习算法,缺乏严格的理论基础。GCNN作为一个新的模型,理论尚未成熟,值得研究的领域众多。
本文对广义同余神经网络的激励函数做了进一步的改进,并对三种激励函数的神经网络作比较研究。
一、GCNN的定义及学习算法
1.1 GCNN的定义
[定义1]假设a、b,m∈R,且a-b能被R整除,则称a就模m广义同余于b,并记为
[定义2]设X={x1,x2,…,xn}∈Rn和W={w1,w2,…,wn}∈Rn,为人工神经元的n维输入矢量和连接权矢量,如输出按模m∈R的广义同余方式运算,即
或者写为矩阵形式
则称该神经元按广义同余方式工作。
[定义3]由广义同余神经元构成的人工神经网络称为广义同余神经网络,记为GCNNㄢ
1.2 GCNN的学习算法
GCNN学习算法的主要任务是选择诸如给定输入输出取样点具有的关系,关系神经网络各权重的合适组合。
学习算法步骤如下[1]:
设GCNN有L层,S=1为输入层,S=L为输出层,各层的神经元素为n1,n2,…,nLㄢ
Step 1:将第s层i元的加权输入和记为,输出记为广义模记为msi;
Step 2:将第s-1层i元向s层j元的权值记为;
Step 3:S层j元的输入输出之间由广义同余关系的激励函数来确定。
Step 4:在样本对输入到网络输出层时,在输出层L的第j元素上实际输出与期望输出yj间的误差为:
Step 5:第L-1层元素i对偏差dj所承担的分量为:
Step 6:权值的修改量按:
式中,调整β率取值范围为0≤β≤1。由此得到:
Step 7:t+1时刻的权值由:
来确定;
Step 8:将Step 5式和Step 6式的差值当作元素还未抵消完的误差,再按Step 5式至Step 8式类似地将误差逆推到L-2层。如此进行下去直到输入层为止;
Step 9:重复第Step 4步,检验输出层的实际输出与期望输出之间的误差,直到误差平方和小于某个规定值为止,学习阶段完成。
二、三种激励函数的比较研究
2.1广义同余激励函数
最早定义的GCNN的激励函数是广义同余函数,其定义如下[3]:
假设a、b∈R,若存在m∈R,如m|(a-b)|,且a是一广义上同余于b模m,由式a≡b(Gmod m)表示,亦即必存在一整数k,使a-b=km。若m∈Z+,通用同余转变为广义上的同余数,并表示为a≡b(mod m)。
其激励函数如下:
式中,msj为s层j元的模。
这样的激励函数实质上是一有跃变的锯齿形函数,在每一个模值的整数倍,输出值都会发生跃变。
2.2改进的广义同余激励函数
改进算法的激励函数定义如下[4]:
式中,[x]表示取x的整数部分;
改进算法用三角形的同余运算取代原有的有跃变的锯齿形的同余运算,因而提高了GCNN网络工作的泛化能力。
2.3进一步改进的广义同余激励函数
最早定义的广义同余激励函数是一有跃变的函数,不能保证网络迭代过程中的连续变化,因而GCNN工作阶段的泛化能力不是很好。
在改进算法中,激励函数的实质是三角形的函数,所以在每个三角形的顶端都会出现一个不连续过程。
进一步改进的激励函数实质上是在改进算法的每一个三角形的顶端改用正弦函数来代替。因此进一步改进的激励函数完全是一连续函数。
正是由于进一步改进的激励函数的完全连续的特性,因而能进一步提高GCNN工作阶段的学习速度和泛化能力。
三、算例
采用图1所示的2-3-1向前GCNN神经网络,即输入层、隐含层和输出层的元素数分别为2,3和1。激励函数为锯齿形广义同余函数。要求该同余网络经过学习后能完成两乘法运算,3×5=15及3×6=18,即x1=3,x2=5或6,y=15或18ㄢ
任意取m1=12.4,m2=13.6,m3=14.8,m4=20.5,并选择输出层的实际输出和期望输出间的方差允许值为δ=0.02。各初始权值由随机发生器给出,如表1所示。经过30次的权重迭代运算后,完成了学习阶段。最后的权重亦列入表1中。
在图2中表示出当固定x1=3时,输入x2与输出y之间的关系,由此来估计GCNN的学习的一般特征。图中各点表示GCNN的实际输出值,直线是y=x1×x2确定的理论输出值。由此可以推论:在各点附近GCNN保持良好的通用性。
当采用改进的GCNN算法完成例子中的两个乘法运算,只需经过16次的迭代运算,即可完成运算。因此进一步提高了网络的学习速度。
四、结束语
通过进一步对广义同余神经网络的激励函数做改进工作,可以得出以下的结论:
(1)由于GCNN应用相对简单的同余运算,而不是用于BP神经网络中S型激活函数,因而可避免由于非线性激活函数引起的麻烦;模拟计算的主要结果表明,在取样点附近表现出比较满意的通用特性。
(2)改进算法用三角形的同余运算取代原有的有跃变的锯齿形同余运算,因而提高了网络工作的泛化能力。
(3)进一步改进的算法比三角形的同余运算,能进一步提高网络的学习速度和泛化能力。为使GCNN更完善更实用,许多问题如模值的设定原则、GCNN的计算效率以及学习过程中离散处理的改进方法等问题,还需进一步研究。
摘要:讨论了一种新的神经网络——广义同余神经网络(GCNN),阐述了它的定义和学习算法,并对GCNN中的三种激励函数进行了比较。算例表明,改进后的算法在学习速度和网络泛化能力上都有显著的提高。由于该神经网络易于操作和实行,有必要就相关理论及其应用作进一步的研究。
关键词:广义同余,同余神经元,激励函数
参考文献
[1]靳蕃.神经计算智能基础原理-方法[M].西南交通大学出版社,2001:123-137,167-173.
[2]Jin Fan.Study on principles and algorithms of generalized congruence neural networks[A].In:Proc,of International Conference on Neural Networks and Brain[C].Beijing:Publishing House of Electronics Industry,1998:441-444.
[3]Jin Fan,Architectures and algorithms of generalized congruence neural networks[J].Joumal of Southwest Jiaotong University,1998;33(2):119-125.
[4]胡飞,靳蕃.广义同余神经网络的算法改进与性能分析[J].西南交通大学学报,2001,31(2):136-139.
[5]Yan Tianyun,Zhang Cuifang,Jin Fan.Identif ication Simulation for Dynamical System Based on Genetic Algorithm and Recurrent Multilayer Neural Network[J].Joural of Southwest Jiaotong University,2003,11(1):9-15.
[6]lacobs R A.Increased rates of convergence through learning rate adaptation[J].Neural Networks,1988,1:295-307.
[7]Waibel A,Hanazawa T,Hinton G,Shikano K,et al.Phoneme recognition using time-delay neural networks[J].IEEE Trans.on Acoustics,Speech and Signal Processing,1989,37:328-339.
[8]靳蕃,范俊波.神经网络理论与应用研究[M].成都:西南交通大学出版社,1996:220-225.
[9]Barnard E.Optimization for training neural nets[J].IEEE Trans.on Neural Networks,1992,3(2):232-240.