非线性动态模型

2024-10-19

非线性动态模型（精选9篇）

非线性动态模型篇1

摘要：针对循环流化床(CFB)锅炉复杂特性下建模困难的情况,借助神经网络良好的非线性映射能力,利用山西某电厂300MW循环流化床机组的运行数据,研究了锅炉燃烧过程的主要参数关系,建立了给煤对主汽压力以及一、二次风对床温参数的非线性动态辨识模型。仿真结果显示预测与实际值误差较小,说明所建立的模型能反映研究对象的实际运行状况,预测模型可以作为下一步预测控制的基础。

关键词：CFB机组,神经网络,主汽压,床温,预测模型

1 引言

循环流化床(CFB)燃烧技术是一种清洁高效的燃煤技术,在当前环境与能源形势下更得到了空前的重视和迅速的发展[1]。但循环流化床锅炉作为控制对象,其复杂多变、大延迟、非线性和多参数耦合的特性给建模和控制带来了很大困难[2]。实际运行中机组经常靠手动操作,特别是,当前还存在着煤种和负荷经常变动的不利情况。针对这些问题,有许多基于传统控制方式的改进,但随着研究不断深入发展,更多的基于先进智能建模和控制的方法被大量发掘应用。

神经网络具有表达任意非线性映射的能力,能够对非线性系统进行建模,利用神经网络这一特点建立动态模型,作为预测控制器的预测模型,可用于过程的预测和优化[3]。用神经网络对热工过程进行建模的研究已经取得了丰富的成果,可学习借鉴[4]。

2 模型分析

山西某电厂3 0 0 M W循环流化床机组实际运行数据,采样周期为1min,从控制系统输出了包括给煤值、三种风量、床温、主汽压、主气温等大量数据样本。部分数据如表1所示。

C F B锅炉机组与其煤粉炉机组最大的不同在于燃烧过程的不同,燃煤粒径比普通煤粉炉的煤粉大得多,当煤粒进入炉膛后,不能像煤粉一样直接充分燃烧,而是发生一系列复杂过程[5]。因此,CFB机组能量的转化和传递过程需要更长时间,耦合因素多,模型建立困难。具体来说,燃料的增减的变化,要经历煤块破碎,输送机送煤入炉膛,循环燃烧等多种物理、化学的转换过程。这个过程属于多容性、大惯性及变参数的动态系统,很难建立较理想的数学模型[6]。

煤颗粒经过复杂的燃烧过程释放热量,使得床层的热容量较大,造成主蒸汽压力和床温对给煤量和送风量的响应的有较大滞后,并呈现强非线性影响。同时过程特性随燃煤品质的不同而变化,给煤和送风量同时影响主汽压力和床温,使二者成为紧密的强耦合量,使得主蒸汽压力和床温的控制成为难点[7]。因此,非常有必要以主汽压和床温作为研究对象进行建模控制等研究。

基于以上的分析,考虑采用模型预测控制,一种基于预测模型的控制算法。根据对象的历史信息和未来输入来预测未来输出,是预测模型的主要功能,这就需要寻求合适的、可在线修正的黑箱模型[8]。

3 多层前向神经网络

多层前向传播网络具有良好的学习算法,动态系统的建模方法往往选择多层前向网络,不失一般性,非线性离散动态系统:

当前n时刻的系统输出依赖于过去时刻的ny个输出值和过去时刻的nu个控制值。对于主汽压和床温这两个惯性参数来说,其神经网络的输入输出结构选择与系统一致,则f为神经网络的非线性映射,其网络结构如下图所示

式中:f2(·)为输出层节点的激励函数,f1j(·)为隐层第j个节点的激励函数,Nhid为隐层节点的个数,un和ny分别为u(·)和y(●)的输入节点个数,wj为第j个隐节点到输出节点的连接权,wj,i为第i个输入节点到第j个隐节点的连接权值,b为输出节点阈值,bj为第j个隐节点阈值。

神经网络预测控制算法通过被控对象的模型,预测从当前时刻n到未来某时刻n+k任意输入的动态特性。

其中f1j(·)采用双曲正切S型函数

f2(·)采用线性函数

理论上已经证明:一个隐含层采用tansig传递函数、输出层采用purelin传递函数的三层前向网络能够充分逼近任何一个具有有限间断点的非线性函数[9]。

3.1 数据处理

训练前有效的数据处理是保证网络训练成功的重要因素。对于这些不同参数而言,数据范围和单位都不相同,而且存在数量级差别较大的现象,因此,需要对数据进行一定的处理。数据处理的方法很多,一般处理的方式是使获得的新值都处于0-1范围内。本文利用下式对样本数据做简单的归一化处理:

其中,m a x和m i n并不是直接选择样本数据中的最大值和最小值,因为样本只是有限的观测,有可能还有更大或者更小的观测。因此,合适的选择应该是max选取比样本最大值大一些的值,min选取比样本最小值小一些的值,如此一来,也可以避免出现等于零和一的情况,使处理后的数据处于开区间(0,1)内[10]。此方法处理后的数据变化趋势和原始数据变化趋势吻合。

3.2 隐含层神经元个数

隐含层神经元数目可由经验公式来获得,常用的经验公式(7)中:n1为隐含层单元数,n为输入单元数,m为输出单元数,a为[1,10]之间的常数。结合公式,确定n1的边界数,通过比较均方误差找到最佳隐含层单元数。实现不同节点数误差计算的部分程序如下:

4 主汽压预测模型的实现

目前,对于主蒸汽压力的控制主要是通过改变燃料来实现。因此建立输入为给煤,输出为主汽压力,含有一个隐含层的三层神经网络,神经网络的模型为

因为实际情况中给煤量的变化对主汽压的影响是延迟的过程,一般情况下,C F B锅炉给煤管线产生的纯滞后为3-6分钟,从煤颗粒进入床料再转化为“残炭”时间滞后一般为3-5分钟,也就是说,改变给煤量带来的能量变化至少要经过近10分钟的时间。因此网络模型的输入输出的时间对应上做适当调整,以t时刻给煤量对应t+10时刻。

选取部分数据,利用上述循环程序来计算输出隐含层神经元个数所对应的误差。从误差输出中可以确定网络隐含层节点为11个,输入层神经元为3个,输出层神经元为1个。设置学习系数为0.01,训练循环次数10000,性能目标0.0001。训练完成后,用100组数据进行仿真验证,如图6

5 床温预测模型的实现

床温控制是循环流化床机组特有的,也是至关重要的控制部分。目前比较典型的控制床温方式是调整一、二次风配比,故建立以一,二次风和历史床温为输入的神经网络模型,输入层神经元为4个,输出层神经元为1个,隐含层节点同样为11个。设置学习系数为0.01,训练循环次数10000,设置性能目标0.0001。训练完成后,用40组数据进行仿真验证,仿真如图7所示:

6 结束语

应用神经网络预测本质上也是对参数的模型辨识,这两个参数对于燃烧控制非常重要。本文的意义在于以简单有效的神经网络实现了主汽压和床温的动态预测,计算量小,收敛速度快,而且预测效果好,该方法便于推广利用,通过预测来提前了解调节量变化对输出的影响,作为进一步控制的基础。

参考文献

[1]牛培峰,丁希生等.火电厂循环流化床锅炉控制技术的研究进展与发展趋势[J].仪器仪表学报,2007,28(12):2295-2304.

[2]高建强,马良玉等.450t/h循环流化床锅炉机组动态仿真模型研究[J].中国电机工程学报,2004,24(11):241-245.

[3]栾秀春,李世勇.基于局部神经网络模型的过热汽温多模型预测控制的研究[J].中国电机工程学报,2004,24(8):190-195.

[4]刘志远,吕剑虹.陈来九新型RBF神经网络及在热工过程建模中的应用[J].中国电机工程学报,2002,22(9):118-122.

[5]童一飞,金晓明.基于广义预测控制的循环流化床锅炉燃烧过程多目标优化控制策略[J].中国电机工程学报,2010,30(11):38-43.

[6]孟凡强,孟庆金.热电厂循环流化床锅炉主蒸汽压力智能控制[J].济南大学学报(自然科学版),2006,20(3):242-244.

[7]王渡,陈佳,李嘉.基于改进的神经网络循环流化床锅炉建模[J].上海电力学院学报,2010,26(4):327-330.

[8]戴文战,娄海川,杨爱萍.非线性系统神经网络预测控制研究进展[J].控制理论与应用,2009,26(5):521-530.

[9]张力,岳中石,李书才等.300MW循环流化床锅炉主汽压的神经网络系统辨识[J].微计算机信息,2011,27(2):186-188.

[10]陆王琳,李蔚等.基于改进BP神经网络的火电厂实时数据预测模型研究[J].热力发电,2006,35(7):18-20.

非线性动态模型篇2

基于动态逆的综合非线性飞行控制方法

在解决非线性飞行控制问题中,动态逆控制方法已成为一种流行的控制方法.文中以动态逆控制方法为基础,使用神经网络控制与动态非线性阻尼控制综合的.控制方法进行补偿,以提高非线性飞控系统的鲁棒性.在以某型推力矢量飞机为对象的仿真中,这种方法显示出很强的非线性控制能力和鲁棒性.

作者：刘志成朱铁夫郁万鹏 LIE Zhi-cheng ZHU Tie-fu YU Wan-peng 作者单位：刘志成,LIE Zhi-cheng(海装沈阳局,航空装备处,辽宁,沈阳,110034)

朱铁夫,郁万鹏,ZHU Tie-fu,YU Wan-peng(沈阳飞机设计研究所,辽宁,沈阳,110035)

刊名：飞机设计英文刊名：AIRCRAFT DESIGN 年，卷(期)： 29(5) 分类号：V249.1 关键词：动态逆非线性控制动态非线性阻尼控制

非线性动态模型篇3

2008年9月14日雷曼兄弟集团破产引发的全球范围内金融危机, 使得人们更加注重金融市场的稳定性及其相关问题。金融稳定及价格变动在很大程度上取决于市场交易者的交易决策, 交易者的异质交易行为对金融价格的动态稳定性影响正在引起学术界与金融界的重视。

金融市场中影响交易者决策的因素主要体现在两方面: 一是基本面者采取的均值回归策略Lux (1995, 1998) 构建了一个基于交易者观点及行为传染的基本模型, 该模型阐述了交易者同时依据价值信息和其他交易者的行为形成价格预期, 并认为交易者之间的传染行为导致了资产泡沫的产生、膨胀和崩溃[1,2]; Kaizoji (2000) 认为交易者观点和行为的相互传染将给金融市场带来泡沫和危机[3];Lux和Marchesi (2000) 发现市场中图表者的数量比例超过某一临界值时将导致市场波动的发生[4]Chiarella等 (2002) 发现当图表者的需求强度相对很强时, 基本面者的需求难以稳定系统的局部均衡[5]; Brock等 (2005) 认为交易者对于市场价格的不同看法导致市场价格难以在价值处形成稳定的均衡, 并且交易者对观点分歧越敏感则越容易产生价格的过度波动[6]; Foroni和Agliari (2008) 认为当市场的传染效应超过临界值时将会对市场带来灾难性的冲击, 如果传染效应非常大, 市场价格不可能收敛于价值[7]; Chiarella等 (2008) 认为基本面者采用状态依赖的交易策略, 即价格短期偏离价值导致基本面者对于价值观念的自信逐步丧失并逐渐加入趋势预测行列, 这种行为传染导致价格趋势的持续, 但随着价格不断偏离价值, 基本面者日益增长的均值回归自信避免了价格的发散, 因此市场价格呈现长期钟摆式运行特征[8]。2001年诺贝尔经济学奖获得者Akerlof教授及耶鲁大学教授Shiller (2009) 认为具有典型市场传染效应特征的自信、恐慌、欺诈等心理因素导致了近几年诸如从美国房地产泡沫到全球金融危机等金融事件的发生[9]。Hommes在2006年的一篇著名综述文章[10]总结了上述异质交易者模型, 该文认为基本面者及理性套利者推动价格趋向价值, 图表者推动价格偏离价值, 当采用趋势追随战略的交易者比例超过某一临界值时, 价格趋势进一步加强, 这又导致了趋势追随战略信念的加强, 自实现的趋势导致价格短期持续偏离价值, 但均值回归战略将从长期决定市场价格。

国内外该方向的研究文献一方面描述了异质交易者之间的相互作用是如何导致价格持续偏离价值的;另一方面, 尽管对导致价格非线性运动特征的原因认识不同, 比如Chiarella (1992) 认为图表者的非线性资产需求函数引起了非线性特征[11], Hommes (2006) 认为基本面者与图表者的相互作用导致了价格形成的复杂、混乱的非线性动态特征[10], 然而这类文献均使用了非线性动力学方法来研究金融资产价格的动态性。这些研究缺少具有实际价值的研究结果。

本文在考虑交易者决策的均值回归及传染效应的基础上构建非线性动力学模型, 并实证检验影响我国交易者投资决策的这两方面因素。我国学术界相关问题的研究主要集中于应用价格分散度来研究市场上的羊群效应, 如宋军和吴冲锋 (2001) [16]、孙培源和施东晖 (2002) [17]、程希明等 (2004) [18]、刘波等 (2004) [19]。孙培源和施东晖 (2002) 、刘波等 (2004) 均以CAPM模型为基础建立了一个羊群行为检验模型并同时认为我国资本市场存在一定程度的羊群行为。值得指出的是, 如果市场中同时存在很强的均值回归效应, 单一检验出市场具有羊群效应并不一定意味着资产价格的发散。本文以异质交易者模型 (HAMs) 为基础建立了交易者买卖观点转换概率的检验模型, 检验市场传染效应的同时也检验了我国交易者是否具有均值回归交易策略, 这种联合检验对于我国资本市场资产价格稳定性的研究及相关政策的制定具有更重要的意义。

2 模型建立

本文仍依据Lux (1995) 的经典模型建立相关模型分析框架, 本文模型描述了一个有n个交易者仅交易一种资产的金融市场。每个交易者i有一个投资态度, 记为变量xi, 如果在时间t交易者i购买资产的一股则记为xit=1, 如果在时间t想去卖则记为xit=-1。由于当交易者认为资产价格会上升时才决定去买资产股票, 所以买者被定义为乐观投资者。相反地, 卖者被定位为悲观投资者。

引入算术平均值可以得到: $X_{t} = \sum_{i = 1}^{n} \frac{x_{t}^{i}}{n}$ , 这里指数Xt代表了所有投资者的平均态度。

对于任何时间t都有Xt∈[-1, 1]。而且, 如果Xt>0, 则表示乐观投资者的数量多于悲观投资者的数量; 当Xt<0时, 反之亦然; 当Xt=0时表示乐观和悲观投资者数量相同时的“平衡”状态。最后, 极端的情况是有可能出现的, 也就是Xt=-1或1时, 分别代表所有交易者都是卖者或者买者的情况。随着时间的变动, 每个交易者都可能修改自己的投资态度, 但这种改变在任何时间t时仅发生一次。于是, 记号Prbs代表了从买者到卖者的转换概率, Prsb代表了从卖者到买者的转换概率。为了更好地理解投资者的平均态度Xt, 记nb和ns分别表示买者和买者的数量, 市场上所有交易者为n=nb+ns, 则:

$X_{t} = \sum_{i = 1}^{n} \frac{x_{t}^{i}}{n} = \frac{n_{b} - n_{s}}{n}$

根据Prsb和Prbs的定义可知, 交易者从卖者向买者转换的数量为nsPrsb, 买者向卖者转换的数量为nbPrbs. 于是, 时间t至时间t+1买者的变动量为nsPrsb-nbPrbs, 其中第一项代表加入买者的交易者数量, 第二项代表由买者变为卖者的交易者数量。同样地, 时间t至时间t+1卖者的变动量为nbPrbs-nsPrsb. 因此, Xt至Xt+1的变动量为:

$X_{t + 1} - X_{t} = \frac{(n_{s} Ρ r_{s b} - n_{b} Ρ r_{b s}) - (n_{b} Ρ r_{b s} - n_{s} Ρ r_{s b})}{n}$

立即可得市场平均态度Xt的时期动态表达式为:

$X_{t + 1} - X_{t} = (1 - X_{t}) Ρ r_{s b} - (1 + X_{t}) Ρ r_{b s} (1)$

为了更好地理解该模型, 需要明确转换概率的含义。假设交易者的资产购买或出售战略依赖两种类型的信息:①资产的价值k, 即当资产被低估时购买资产和当资产被高估时出售资产; ②市场的平均投资态度 (乐观或者悲观) , 在这种信息条件下, 如果市场上的大多数投资者都是乐观的, 交易者更愿意去买, 卖出的情形也是这样, 市场中投资者的总体观点影响每个交易者的态度。概括来说, 资产的价格信息和市场的平均投资态度也许会导致交易者态度的改变。因此, 转换概率的定义应综合考虑交易者之间的传染行为和基于价值的交易策略。类似Weidlich等 (1992) [12]、Lux (1995) [1]、Kaizoji (2000) [3]对于转换概率的选择, 本文定义买卖者之间的转换概率表达式为:

$\begin{array}{l} Ρ r_{s b} = v [μ + e^{γ X_{t} + α \frac{k - p_{t}}{v}}] \\ Ρ r_{b s} = v [μ + e^{- γ X_{t} - α \frac{k - p_{t}}{v}}] (2) \end{array}$

在表达式中, α、γ、v、μ都是真实价值参数, 具体为:参数α代表了交易者对市场价格与价值k之间差异的反应强度, 换句话说, α度量了套利效应。参数γ度量了交易者根据市场平均投资态度进行决策的权重, 即传染效应, α和γ都为正数。v为买卖者之间观点转变的速度, 在一个流动性市场, 总是存在买卖双方的转换, 故必然为正的参数。我们将μ设定为非负参数, 它代表了交易者认为影响资产价格的其他可能附加因素。

将式 (2) 代入式 (1) 后, 均值的动态效用表达公式为:

$\begin{array}{l} X_{t + 1} = (1 - 2 v μ) X_{t} + v [(1 - X_{t}) e^{γ X_{t} + α \frac{k - p_{t}}{v}} \\ - (1 + X_{t}) e^{- γ X_{t} - α \frac{k - p_{t}}{v}}] (3) \end{array}$

为了定义市场价格调整的状况及过程, 设想市场存在一个做市商。做市商接受代理人的交易指令, 根据超额需求调整资产价格, 当具有正的超额需求时, 价格上升, 反之则下降; 当没有超额需求时, 价格保持不变, 也就是达到局部均衡。本文模型对于做市商假设的引入与Day等 (1990) [13]的目标是一致的, 即做市商假设只是为了保证价格变动及时准确地反映供需关系。由于价格变动的幅度仅受超额需求的绝对值影响, 为简化起见, 假定每个交易者的交易量是固定的, 并正好等于一个值θ>0, 于是θxit就是交易者i在时间t交易的实际数量, θXt代表了整个市场交易者的平均超额需求。这样, 资产的动态价格为:pt+1=pt+πθXt+1, 其中, π>0代表了价格调整速度, 令λ=πθ>0代表基于投资者态度的价格调整尺度。这一价格调整机制, Lux (1995) [1]、Kaizoji (2000) [3]、Chiarella等 (2008) [8]等的工作都有类似的定义。价格调整机制表达式为:

$p_{t + 1} = p_{t} + λ X_{t + 1} (4)$

联立考虑式 (3) 和式 (4) 得出一个具有均值回归及传染行为的金融市场资产价格的跨期动态演变过程:

$G : {\begin{cases} X_{t + 1} = (1 - 2 v μ) X_{t} + [(1 - X_{t}) v e^{γ X_{t} - α \frac{p^{'}_{t}}{v}} \\ - (1 + X_{t}) v e^{- γ X_{t} + α \frac{p^{'}_{t}}{v}}] \\ p^{'}_{t + 1} = p^{'}_{t} + λ X_{t + 1} \end{cases} (5)$

式 (5) 对于式 (3) 引入坐标转换-将点 (0, k) 转换为 (0, 0) 。值得注意的是, 式 (5) 中的变量p′t代表了价格对于价值k的偏差, 即p′t=pt-k, p′t=0则意味着此时价格正好等于价值。

3 均衡点特征及稳定性分析

假定点P*= (X*, p*) 是模型 (5) 的唯一均衡点, 则在均衡点处满足

${\begin{cases} X^{*} = (1 - 2 v μ) X^{*} + [(1 - X^{*}) v e^{γ X^{*} - α \frac{p^{*}}{v}} \\ - (1 + X^{*}) v e^{- γ X^{*} + α \frac{p^{*}}{v}}] \\ p^{*} = p^{*} + λ X^{*} \end{cases}$

显然等价于:

${\begin{cases} 0 = - 2 v μ X^{*} + [(1 - X^{*}) v e^{γ X^{*} - α \frac{p^{*}}{v}} \\ - (1 + X^{*}) v e^{- γ X^{*} + α \frac{p^{*}}{v}}] \\ 0 = λ X^{*} \end{cases} (6)$

根据定义λ>0, 方程组 (6) 的第二个等式唯一解为X*=0。将此条件代入第一个等式得到: $v e^{- α \frac{p^{*}}{v}} = v e^{α \frac{p^{*}}{v}}$ , 根据前面定义v、α均不为零, 因此p*=0, 点P*= (X*, p*) = (0, 0) 是唯一局部均衡点。

由于p*=0对应于股票的价值, 于是我们把P*点看作模型中的基本面稳定状态。我们通过雅可比矩阵在P*点的特征值在二维平面上的位置来研究这个不动点的局部平稳性。用JG表示模型 (5) 的雅可比矩阵, 则

$J_{G} = [\begin{matrix} \frac{\partial X_{t + 1}}{\partial X_{t}} & \frac{\partial X_{t + 1}}{\partial p^{'}_{t}} \\ λ \frac{\partial X_{t + 1}}{\partial X_{t}} & 1 + λ \frac{\partial X_{t + 1}}{\partial p^{'}_{t}} \end{matrix}] (7)$

这里, $\frac{\partial X_{t + 1}}{\partial X_{t}} = (1 - 2 v μ) + v {[γ (1 - X_{t}) - 1] e^{γ X_{t} - α \frac{p^{'}_{t}}{v}} + [γ (1 + X_{t}) - 1] e^{- γ X_{t} + α \frac{p^{'}_{t}}{v}}}, \frac{\partial X_{t + 1}}{\partial p^{'}_{t}} = - α [(1 - X_{u}) e^{γ X_{t} - α \frac{p^{'}_{t}}{v}} + (1 + X_{t}) e^{- γ X_{t} + α \frac{p^{'}_{t}}{v}}]$ 。

代入均衡点 (X*, p*) = (0, 0) 可得JG在均衡点处的参数表达形式为:

$J_{G}^{*} = [\begin{matrix} 1 + 2 v (γ - μ - 1) & - 2 α \\ λ [1 + 2 v (γ - μ - 1)] & 1 - 2 λ α \end{matrix}]$

分别用记号Det和Tr代表雅可比矩阵在不动点的行列式和迹, 则:

detJ*G=1+2v (γ-μ-1)

TrJ*G=2[ (1-λα) +v (γ-μ-1) ]

由下面不等式组:

${\begin{cases} 1 - t r J_{G}^{*} + d e t J_{G}^{*} = 2 λ α > 0 \\ 1 + t r J_{G}^{*} + d e t J_{G}^{*} = 4 - 2 λ α + 4 v (γ - μ - 1) > 0 \\ 1 - d e t J_{G}^{*} = - 2 v (γ - μ - 1) > 0 \end{cases} (8)$

给出了离散非线性动力系统的局部渐进稳定性判别条件, 根据前面定义α、λ、v均为大于零的数, 不等式组的第一个不等式显然成立。因此, 不等式组 (8) 的稳定性条件可以改写为:

${\begin{cases} 2 v (γ - μ - 1) > λ α - 2 \\ γ - μ - 1 < 0 \end{cases} (9)$

当λα-2>0时, 不等式组 (9) 不能成立, 对于这种情况, 一种可能的解释是当度量均值回归参数α及价格根据市场平均态度调整系数λ很大时, 任何对价值的偏离立即得到纠正, 市场无法形成传染效应, 因此, 分析被限制在λα<2的范围内。根据式 (9) , 图1描绘了价格在 (γ-μ-1, v) 构成的二维参数平面的稳定域及发散路径。

对图1的解释为: (1) 稳定域由双曲线 $v = \frac{λ α - 2}{2 (γ - μ - 1)} 、$ 纵轴、横轴所围区域组成; (2) 发散路径表示了v取固定值时, 参数γ的变动导致价格由局部渐进稳定到发散的演变途径Kaizoji (2000) [3]选择前后月价格差△p作为Xt变量的替代变量类似, 这么选择的意义在于:首先, 收盘价的形成本身代表了单位时间买卖方综合作用的结果, 如果月涨跌幅>0, 则表示乐观投资者多于悲观投资者, 反之, 当月涨跌幅<0时, 则代表了悲观者投资者多于乐观投资者, 这与Xt的定义类似;其次, 月涨跌幅的定义符合pt+1=pt+λXt+1的表达式, 如果月涨跌幅为正, 则价格上升, 反之则下降, 这较为符合做市商制度的假定;最后, 月涨跌幅的通常变动范围为[-1, 1], 符合Xt的变动范围。根据第2节和第3节的分析, 可以得到实证研究假设为:均值回归战略及传染效应是交易者买卖观点转换概率的重要影响因素。实证研究的具体步骤如下:

(1) 通过对741支股票进行108个方程的逐月截面回归以获得108个市场平均的Prsb与Prbs值;

根据式 (1) 建立如下计量模型:

$X_{t + 1} = c_{1} + c_{2} X_{t} + ε_{t} (10)$

其中:Xt=个股t月涨跌幅, Xt+1=个股t+1月涨跌幅,

${\begin{cases} c_{1} = Ρ r_{s b} - Ρ r_{b s} \\ c_{2} = 1 - Ρ r_{s b} - Ρ r_{b s} \end{cases} (11)$

因此, 通过估计模型 (10) 获得c1及c2, 然后求解方程组 (11) 可以得出各月的两个转换概率。值得指出的是:①这一步骤的目的仅是为了对Xt+1与Xt之间是否存在线性关系进行检验, 以此得到回归系数c1与c2值, 至于Xt+1与Xt之间是否具有因果关系则不是本文考虑的重要因素;②式 (10) 仅在前后月对解释变量Xt、被解释变量Xt+1进行截面回归, 因此不能把式 (10) 看作一阶向量自回归模型。

(2) Prsb、Prbs值分别对上证指数及上证指数月涨跌幅进行时间序列估计, 以检验研究假设。

基于转换概率的定义式 (2) , 等式两边取对数可得出如下计量模型:

${\begin{cases} \ln Ρ r_{b s} = β_{1} + β_{2} Ρ_{Μ} + β_{3} X + ε_{1} \\ \ln Ρ r_{s b} = ω_{1} + ω_{2} Ρ_{Μ} + ω_{3} X + ε_{2} \end{cases} (12)$

其中, PM=k-pt=2000年1月至2008年12月期间上证指数均值2045.46与各月上证指数之差, X=各月上证指数涨跌幅, ε1与ε2代表了影响转换率的其他因素μ. 值得指出的是, 根据理论模型定义式 (2) , 应该有β1=ω1=lnv, β2=-ω2=-γ, β3=-ω3=-α/v.

4.3 检验结果

步骤1: 利用741支股票数据对式 (10) 逐月回归的108组结果的时间序列值统计结果汇总于表1。根据表1显示:①c1系数t值的均值为16.064, c2系数t值的均值为3.445, 检验结果总体上表明c1、c2系数的估计都在5%的水平上显著;②Durbin-Watson统计量均值为1.977, 总体表明不存在序列相关;③F统计量均值为20.383, 中位数为6.865, 这表明了108组方程总体上在1%的显著性水平上方程解释变量Xt与被解释变量Xt+1存在很强的线性关系。

均采用 SPSS 13.0 软件进行统计。各指标均以表示。以独立样本的t检验进行组间各指标比较;控制年龄与性别后, 以部分相关求算Person相关系数, Liner Regression进行多元逐步回归分析。注: ①括弧内为t值; ②c1、c2均值及中位数对应的t值为取绝对值的t值均值及中位数; ③F统计量临界值为:5%注: (1) 括弧内为t值; (2) c1、c2均值及中位数对应的t值为取绝对值的t值均值及中位数; (3) F统计量临界值为:5%显著性水平下, F1739=3.84;1%显著性水平下, F1739=6.63。

根据方程组 (11) , 利用获得的c1、c2值计算出Prsb、Prbs, 图4描绘了这一计算结果。

图4.1显示了上证指数2000年1月至2008年12月的趋势, 图4.2显示了这一时期的买者向卖者的转换概率时间序列, 图4.3则为卖者向买者转换概率时间序列。整体上看, Prsb与Prbs值相同之处在于大约时期60 (各子图时期0处均对应于2000年1月) 之前, 也即2006年1月之前均围绕0.5呈现出一种随机运动特征, 不同之处在于2006年之后Prsb仍然表现出一种无趋势状态, 而Prbs则具有一定的趋势, 而且这种趋势大体上与上证指数走势相反, 具体为大约2006年至2007年10月, 指数不断上涨的同时买者向卖者转换概率不断下降, 指数的最大值与Prbs的最小值几乎同时出现, 而2007年10月以后, 随着指数的不断下跌, 买者向卖者转换概率不断上升。

图4.4清晰反映了2006年之前Minus=Prsb-Prbs大体表现出围绕0值做小幅波动, 2006年之后, Minus呈现剧烈波动特征, 总体而言, 当指数大幅上涨时, Prsb>Prbs;指数剧烈下降时, Prsb<Prbs;指数处于相对长期平稳时, Prsb=Prbs.

步骤2: 检验结果如表2所示。

通过对表2的分析, 本文得出以下基本结论:

①β1=-0.681, ω1=-0.675, β1≈ω1, 根据4.2节的讨论, 应该有β1=ω1, 实证检验结果与理论模型几乎完全一致, 它对应的经济含义为在市场传染效应为零且处于基本面均衡点时, 市场买卖者之间仍然会进行正常的买卖转换, 这一转换概率大约为Prbs≈Prsb =e-0.68;

②β2、ω2分别对应的t值为0.0884、-0.5359, 检验结果表明β2与ω2均不显著, 这表明了样本期间中国资本市场中买卖者之间的转换不具有均值回归效应, 但与理论模型一致的是, β2与ω2在系数符号上相反;

③β3、ω3分别对应的t值为-3.782、4.7779, 检验结果表明β3与ω3均在1%的显著水平下显著, 这反映了样本期间中国资本市场中买卖者间的转换概率具有明显的传染效应;

④β3= -0.923, ω3=1.108, β3与ω3在符号上相反也符合理论模型, 从数值绝对值上看, β3与ω3大体接近, 但略小于ω3, β3与ω3这种数值上的差异表明中国投资者由卖者向买者转换的概率Prsb相对由买者向卖者转换Prbs而言更容易受到传染效应的影响。

本文检验市场传染效应的同时也检验了我国交易者是否具有均值回归交易策略, 这种联合检验对于我国资本市场资产价格稳定性的研究及相关政策的制定具有更重要的意义。本文的研究结果表明中国投资者由卖者向买者转换的概率Prsb相对由买者向卖者转换概率Prbs而言更容易受到传染效应的影响, 国内投资者的“追涨”倾向大于“杀跌”倾向, 研究结果更符合孙培源和施东晖 (2002) 的观点。

5 结论

本文发展了一个资产价格动态性的二维离散时间模型, 在一个简单的做市商价格设置规则的条件下, 不断演化的交易者买卖观点转换概率驱使了资产价格的动态性。研究发现, 随着传染效应的不断增大, 价格趋于更长时间地偏离价值, 当传染效应逐渐接近于不包含基本面信息的临界值时, 价格呈现出复杂的运动轨迹而难以稳定。实证检验表明中国资本市场中买卖者间的转换概率主要受投资者之间的传染效应影响而不具有均值回归效应, 投资者以市场的平均投资态度作为投资的判断依据, 而对价值没有正确的认识, 并且投资者由卖者向买者转换的概率相对由买者向卖者转换而言更容易受到传染效应的影响。基于文献综述的分析可知, 中国投资者买卖观点只具有传染效应的价格发散机制而不具有均值回归的价格稳定机制的情况下, 中国资本市场价格现阶段难以通过市场的自我调节形成价值均衡, 价格必然表现为过度上涨或者极度下跌, 中国资本市场的现实也体现了这一点。

本文认为, 鉴于中国投资者没有正确的价值意识, 并且买者向卖者转换的概率受传染效应影响, 这将会导致中国资本市场出现非理性的下降, 资产价格被严重低估。由于中国投资者由卖者向买者转换的概率更容易受到传染效应的影响, 金融危机中的政府救市能通过市场的传染效应促使价格趋于价值, 因此政府救市在一定程度是可取的。值得指出的是, 过度的救市则可能导致高于基本面的价格, 这可能会为市场带来泡沫, 问题的关键是市场监管者对于价值的衡量, 这就不是本文所讨论的范围了。

摘要：基于做市商假设构建了一个二维离散非线性资产价格动态模型, 本文分析了模型中买卖者之间的转换概率同时依赖均值回归战略及传染效应时资产价格的动态稳定性, 实证检验了中国资本市场影响投资者买卖观点转换概率的两个主要因素。结果表明, 随着传染效应的不断增大, 资产价格逐渐呈现出复杂的运动轨迹而难以收敛于均衡点, 实证显示中国投资者买卖观点只具有传染效应的价格发散机制而不具有均值回归的价格稳定机制, 这是中国资本市场价格现阶段难以通过市场的自我调节达到价值的基本原因。

非线性动态模型篇4

基于遗传算法的非线性系统模型参数估计

针对非线性系统模型的多样性,提出适用于多种非线性模型的基于遗传算法的`参数估计方法,并以多种非线性模型为例作了仿真研究.结果表明,遗传算法是非线性系统模型参数估计的有效工具.

作者：姜波汪秉文 JIANG Bo WANG Bingwen 作者单位：华中理工大学自动控制系・武汉,430074刊名：控制理论与应用 ISTIC EI PKU英文刊名：CONTROL THEORY & APPLICATIONS年，卷(期)：17(1)分类号：O23关键词：遗传算法非线性系统参数估计

非线性动态模型篇5

对于汽油调合辛烷值模型,学者们已经提出了一些典型的建模方法。Zahed A H等基于实验方法来预测调合汽油辛烷值[2],此方法需要已知各组分油的辛烷值、流量,模型中参数需要通过实验数据进行回归分析得到; 李信等提出一种基于最小二乘支持向量机的方法对辛烷值进行预测建模[3]; 张希发等通过确定汽油辛烷值与烃族组成的定量关系来建立汽油调合模型[4]。对于调合优化问题,黄彩凤等采用机会约束规划进行求解[5],将优化问题中带不确定参数的约束以概率形式加以表示,从而将随机规划问题转化为相应的确定性规划问题进行求解。袁奇等将全局群搜索优化算法运用到汽油调合上[6],提高了优化过程的收敛速度和性能。Mendez C A等将汽油调合混合整数非线性规划问题转化为一系列的混合整数线性规划问题进行求解[7],以获得最优的组分油流量。

笔者将汽油调合过程分解为若干个短周期,在每一个短周期内用线性化模型来近似描述调合汽油辛烷值等质量指标,并基于该线性化模型,采用常规的线性规划算法以获得调合过程中的最优组分油流量比。在此基础上,针对汽油调合优化过程进行了较为深入的仿真实验研究,并就在线分析仪测量误差及原料价格发生变动等情况对动态优化过程的影响进行了分析。

1 汽油管道自动调合系统结构①

某炼油厂汽油管道调合工艺采用5 种组分油,分别为催化汽油、重整汽油、MTBE、石脑油和非芳,将它们按照一定的比例混合,可同时生产出符合国IV标准的93#、97#汽油或者国V标准的92#、95#汽油。组分油中的催化汽油、重整汽油和非芳均直接来自于各自相应的生产装置,无中间缓冲罐,同时流经一个管道,其进料全部参与调合。为方便对调合过程进行描述,以93#汽油为例,将此管道输送混合油等价为催化汽油,由此简化后的汽油调合系统如图1 所示。其中催化汽油为主组分油,低辛烷值的石脑油和高辛烷值的MTBE作为辅助组分油,其进料流量r2和r3按照一定的比例参与调合。将3 种组分油同时输入管道混合器,最终目标是在生产出质量指标合格的93#汽油的前提下,使调合利润达到最大化。流量的调节回路由流量变送器FT、流量控制器FC和控制阀组成,流量控制器设定值由比值控制器提供。比值控制器的输入为石脑油、MTBE与催化汽油流量比值的最优值u2*、u3*,输出为石脑油流量设定值( F2sp) 和MTBE流量设定值( F3sp) 。优化控制器依据当前产品质量与卡边值之间的偏差,实时计算最优流量比u2*和u3*,以生产出质量合格的调合汽油,并使调合利润最大化。

2 汽油在线调合优化问题的数学描述

汽油调合过程的优化目标是在满足调合汽油各项质量指标要求的前提下,使调合利润最大化,其目标函数可表示为:

式中c1、c2和c3———催化汽油、石脑油和MTBE的成本价格,元/吨;

cp———成品汽油的市场销售价格,元/吨;

r1、r2和r3———催化汽油、石脑油和MTBE的流量,m3/h。

由于c1、c2、c3和cp短期内保持不变,单位催化汽油所得的最大调合利润J为:

其中,u2为石脑油与催化汽油的流量比值,; u3为MTBE与催化汽油的流量比值,。

笔者假设催化汽油和石脑油的氧含量为0,MTBE中的芳烃含量为0。因而,质量指标约束可表示为:

其中,x11、x12、x13分别为催化汽油、石脑油和MTBE的辛烷值; x21、x22分别为催化汽油、石脑油的芳烃含量,% ; x33为MTBE的氧含量,% ; y1、y1min分别为调合汽油的辛烷值及其目标控制下限; y2、y2max分别为调合汽油的芳烃含量及其目标含量的上限,% ; y3、y3max分别为调合汽油的氧含量及其目标含量的上限,% 。

流量比值和流量比值变化量约束可表示为:

其中,u2max为石脑油与催化汽油流量比值控制上限; u3max为MTBE与催化汽油流量比值控制上限; Δu2max、Δu3max分别为石脑油、MTBE与催化汽油流量比值变化量上限。

3 调合模型的建立和问题求解

为了求解上述优化问题,需先建立调合汽油3种质量指标与组分油的质量指标和流量比值之间所对应的函数关系。

3.1调合模型的建立

调合汽油的芳烃含量和氧含量与组分油的质量指标和流量比值之间满足线性可加,即:

辛烷值的调合具有非线性效应,预测调合辛烷值的模型主要有Ethyl-70 模型、交互模型及神经网络模型等。其中交互模型[8]是很早就由Morris W E等提出且之后不断进行改进的经典模型,其曲线如图2 所示。

因为在汽油调合过程中,催化汽油为主组分油( 70% 以上) ,由图2 直线b可近似得到调合汽油辛烷值:

把上述情况推广应用到3 种组分油的混合过程中,同理可得调合汽油的辛烷值:

也即:

其中,z1、z2和z3分别为催化汽油、石脑油和MTBE的流量体积分数(%),;x12*和x13*分别为石脑油和MTBE的表观辛烷值。

3.2问题求解

通过在线分析仪可实时检测出该时刻调合汽油的辛烷值、芳烃含量和氧含量yim( k) ( i = 1,2,3) ,相互间满足以下关系:

若在下一时刻ui( k) ( i = 2,3) 变化为ui( k +1) ,假设各组分油的质量指标仅在一定范围内缓慢波动,则有:

以辛烷值为例,k + 1 时刻调合汽油的各项质量指标y1( k + 1) 可近似为:

在k + 1 时刻,调合汽油质量指标应满足约束,可得:

结合式( 12) 、( 15) 和( 16) 可得:

同理,对芳烃含量和氧含量的约束条件可转化为:

由式( 17) ~ ( 19) 可知,为求解上述约束条件,除调合汽油外,还需要利用在线分析仪对石脑油与MTBE的质量指标进行实时检测,以计算下一周期调合汽油的质量指标。

将上述各式化简后,短周期内的汽油调合优化问题可近似为:

也可转化为求解形如的线性规划问题。

4仿真研究

通过Matlab软件中的Simulink平台搭建汽油调合优化仿真模型,仿真结构框图如图3 所示。

调合过程对象模型以状态变量u2(k)和u3(k)为输入,得到当前时刻所对应的调合汽油辛烷值y1、芳烃含量y2和氧含量y3,受汽油组分管道混合过程及在线分析仪表测量特性等方面的影响,调合过程具有一定的纯滞后和一阶惯性特性,因而调合汽油在线分析仪所测得的yim可表示为,其中T、τ分别表示惯性时间和纯滞后时间。将调合汽油指标的测量值反馈输入到优化控制器,并将石脑油与MTBE的质量指标测量值一并作为输入,根据第3节所讨论的问题求解方法,求出流量比值变化量Δu2和Δu3,进而可得到下一时刻的流量比u2(k+1)和u3(k+1)。再将其作为调合过程对象模型的输入,重复上述过程,直到仿真过程结束。

4. 1 动态优化过程实验

对于单位催化汽油进料,假设初始的石脑油流量和MTBE流量均为0。设催化汽油、石脑油和MTBE研究法辛烷值的初始值分别为92、65 和115,初始芳烃含量分别为30% 、10% 和0% ,初始氧含量分别为0% 、0% 和18% 。研究法辛烷值的目标设定值为93. 2,芳烃含量不大于40% ,氧含量不大于2. 7% 。另外,假设93#成品油的价格为每吨8 000 元,催化汽油的价格为每吨7 300 元,石脑油的价格为每吨7 000 元,MTBE的价格为每吨8 300 元。动态环节中惯性时间常数T = 2min,滞后时间 τ = 5min。

动态优化过程如图4 所示,其中图4b为石脑油流量比值的变化曲线,图4c为MTBE的流量比值变化曲线,所对应的单位催化汽油的调合利润变化曲线如图4d所示。

在0 ~ 200min时间段,3 种组分油质量指标均无变化。初始状态下,调合汽油的辛烷值为92. 0,低于设定值,因此高辛烷值MTBE的加入比率应多于石脑油,又受到调合汽油氧含量的限制,MTBE的加入比率应该适量。在200min处,不可测的催化汽油质量指标发生了阶跃变化,其辛烷值由92. 0 变化到91. 0,此时调合汽油的对应辛烷值下降。为使辛烷值回到设定值,系统自动减少石脑油的加入量,同时,为了避免氧含量超标,MTBE的加入量也随之下降。在300min处为石脑油的辛烷值由65 阶跃变化到67,其芳烃含量由10% 阶跃变化到15% 。

4. 2 在线分析仪表测量误差对优化结果的影响

在线分析仪监控整个调合过程成品油的辛烷值、芳烃含量及氧含量等质量指标的变化,将所测的质量指标作为反馈输入至优化控制器,从而实现组分流量比值的在线调整。以辛烷值为例,若在线分析仪存在测量误差,比实际值偏大0. 1 个辛烷值。重复4. 1 节的实验,可得到调合汽油辛烷值动态优化曲线如图5 实线所示。可以看出,动态过程稳定后的实际辛烷值比设定值偏小0. 1,可见结合在线分析技术的汽油调合优化对分析仪表的精度有较高的要求。

4. 3 原料市场价格变动对动态优化过程的影响

假设在下一个批次调合前,MTBE的价格从原来的每吨8 300 元变为每吨9 300 元,按照4. 1中的实验方法重新进行实验。实验结果如图6 所示,其中图6b为石脑油流量比值变化曲线,图6c为MTBE的流量比值变化曲线,图6d为所得调合利润变化曲线。

由图6 可见,当原油的市场价格发生变动时,汽油调合动态优化过程也会相应的发生变化。

5 结束语

将汽油调合过程分解成若干个短周期,对每一段短周期内汽油辛烷值等质量指标进行线性化处理,提出了一种新的汽油调合过程动态优化控制方法。仿真实验结果表明,在分析仪测量精度达到要求的前提下,可以实现组分油流量比值自动调整优化,从而使成品油的质量指标卡边,并得到最大的调合利润。即使在组分油的质量指标和原料价格发生变动的情况下,优化控制器仍能够进行快速有效的优化控制。笔者所采用的模型结构简单,同时优化算法采用常用的线性规划,该方法可广泛应用于炼油生产与调合过程。

摘要：针对现有的调合模型复杂且参数难以获取、优化算法繁琐的缺陷,引入动态优化思想,将汽油调合优化过程分解成若干个短周期,对每一段短周期内汽油辛烷值等质量指标进行线性化处理,建立了一种汽油调合线性动态模型。结合实际工艺背景,对汽油调合优化目标函数和约束条件进行了数学描述,并将其转换成简单的线性规划问题。与此同时,运用在线分析技术获取调合过程当前工况下的调合汽油和组分油的质量指标,用于实时更新优化模型。仿真结果表明:基于线性化模型的汽油调合过程动态优化方案在在线分析仪精度达到要求的情况下,能很快、精确地跟踪质量指标目标设定值,实现调合汽油质量指标的卡边控制,并提高调合利润。

关键词：汽油调合,实时优化,在线分析

参考文献

[1]Li J,Karimi I A,Sarinivasan R.Recipe Determination and Scheduling of Gasoline Blending Operations[J].AICHE Journal,2010,56(2):441~465.

[2]Zahed A H,Mullah S A,Bashir M D,et al.Predict Octane Number for Gasoline Blends[J].Hydrocarbon Processing,1993,(5):85~87.

[3]李信,李少远,黄彩凤.最小二乘支持向量机在汽油调合建模中的应用研究[J].化工自动化及仪表,2006,33(3):14~16.

[4]张希发,任连岭,刘长法,等.基于烃族组成的汽油调合优化模型研究[J].石油炼制与化工,2012,43(6):93~97.

[5]黄彩凤,李信,李少远.基于Ethyl RT-70模型的汽油调合优化[J].控制工程,2007,14(3):256~259.

[6]袁奇,程辉,钟伟民,等.全局群搜索优化算法及其在汽油调合中的应用[J].化工学报,2013,64(12):4427~4433.

[7]Mendez C A,Grossmam I E,Harjunkoski I,et al.A Simultaneous Optimization Approach for Off-line Blending and Scheduling of Oil-refinery Operations[J].Comp Chem Eng,2006,30(4):614~634.

液压悬置非线性动态特性仿真研究篇6

液压悬置是国外20世纪80年代初发展起来的一种新型的减振元件, 它利用液体阻尼从根本上克服了橡胶悬置低频阻尼小、高频出现动态硬化的局限性, 更好地满足了汽车减振的要求[1]。液压悬置具有低频阻尼大、高频动刚度低等减振降噪更为理想的特点, 可有效衰减动力总成振动, 降低车室共鸣声[2]。但是液压悬置的动态特性十分复杂, 因此如何简洁、正确地建立液压悬置数学模型, 以便进一步地研究悬置系统在整车隔振中的作用, 显得尤为重要。本文基于流体动力学理论及液压原理, 计算分析液压悬置的动态力学行为, 非常接近实际工作情况。

1 物理模型的建立

本文研究的目标液压悬置属于惯性通道解耦盘式液压悬置, 其三维结构剖面图如图1所示。

1.动力总成连接螺栓 2.金属骨架 3.橡胶主簧 4.上液室 5.解耦盘 6.惯性通道 7.下液室 8.橡胶底盘 9.底座

为了分析其动态特性, 需建立描述其本质特征的力学模型, 以便进一步建立非线性数学方程, 进行数值分析与仿真。实验显示, 液压悬置中的流体部分只对悬置垂向 (Z向) 的动特性有比较大的影响, 对侧向 (X、Y向) 动特性基本上没有什么影响[3,4], 因此本文仅建立液压悬置的垂向力学模型,

并对建模过程进行了合理的简化和假设, 简化的力学模型如图2所示。该液压悬置具有两个液室:上液室和下液室;上下液室的体积弹性特征视为线性, 用体积刚度C1、C2表征。kr和br是橡胶主簧的静刚度和阻尼, 橡胶主簧具有类似于活塞的泵吸液体作用, 设Ap为等效活塞面积, If为惯性通道内液体的惯性。液体通过惯性通道的体积流量和随解耦盘运动液体的体积流量分别为qv和qvd, 两个液室的平均压力分别为p1 (t) 和p2 (t) , Δd为解耦盘与上、下限位盘之间的间隙。F (t) 为液压悬置传给车架的力;X1 (t) 为橡胶主簧上端面的位移输入;X2 (t) 为解耦盘及其附加液体质量的振动位移响应。

2 非线性数学模型的建立

2.1 橡胶主簧模型

橡胶主簧是液压悬置的基本弹性元件, 它不但承受发动机的静载和大部分动载, 而且在高频激振时还要起到主要的减振作用。将橡胶主簧假设为“质量一弹簧一阻尼”系统, 且其质量与悬置的承载共有一个位移, 输入力一部分传给主簧, 另一部分通过以橡胶主簧的等效面积为活塞传递至上液室。橡胶主簧的复刚度表达式可写为

K (ω) =kr+jω br (1)

式中, ω为激振频率;br为黏滞阻尼系数;kr为橡胶主簧的静刚度。

2.2 惯性通道模型

液体在沿惯性通道流动时会产生能量损失, 这种能量损失主要表现为压力损失, 包括惯性阻尼损失, 沿程压力损失和局部压力损失。由于悬置惯性通道的结构不同, 又可将局部压力损失分为弯管压力损失和液体流动截面突然变化引起的收缩局部损失[5]。根据液压原理及流体动力学的相关定律[6], 并考虑振荡流对能量损失的影响来建立惯性通道的动态方程。

2.2.1 沿程压力损失Δp1

沿程能量损失是液体黏性作用的结果, 假设液体从入口到出口流经的等效总长度为lf, 液体流动为层流, 有

$Δ p_{1} = \frac{1}{2} \frac{l_{f}}{d_{f}} ρ ζ_{1} \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | (2)$

式中, ρ为悬置内液体的密度;lf为惯性通道长度;Af为惯性通道孔等效横截面积;ζ1为沿层阻力系数, 当液体为层流时, ζ1 =64/Re;Re为液体的雷诺数;df为通道当量直径。

当横截面为矩形时, 通道直径为

$d_{f} = \frac{2 a b}{a + b} (3)$

式中, a为矩形长边;b为矩形短边。

2.2.2 入口局部压损失Δp2

由于流体的惯性作用, 流体经突然收缩的截面时, 流线光滑收缩, 在前方形成最小收缩截面, 然后, 再扩散附壁, 存在压力损失:

$Δ p_{2} = \frac{1}{2} ρ ζ_{2} \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | (4)$

式中, ζ2为截面突然收缩局部阻力系数。

2.2.3 出口局部压力损失Δp3

流体通过管道截面突然扩大处的流动能量损失可表示为

$Δ p_{3} = \frac{1}{2} ρ ζ_{3} \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | (5)$

式中, ζ3为突然扩大局部阻力系数。

2.2.4 弯管效应形成的压力损失Δp4

惯性通道内液体螺旋状的流动非常复杂。魏斯巴赫通过实验总结出弯管阻力系数的经验公式如下[6]:

$ζ_{4} = [0.131 + 1.847 (\frac{d_{f}}{R})^{3.5}] \frac{α}{90 °} (6)$

式中, R为惯性通道弯管轴心线的曲率半径;α为惯性通道的转弯角度。

此时, Δp4可表示为

$Δ p_{4} = \frac{1}{2} ρ ζ_{4} \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | (7)$

则液体流经惯性通道时, 受到的总压力损失为

$Δ p = \sum_{i = 1}^{4} Δ p_{i} = \frac{1}{2} ρ (\frac{l_{f}}{d_{f}} ζ_{1} + ζ_{2} + ζ_{3} + ζ_{4}) \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | (8)$

通过惯性通道的流量为

$q_{v} = \frac{π d_{f}^{4}}{128 μ l_{f}} (p_{1} (t) - p_{2} (t)) (9)$

式中, μ为液体的黏性系数。

2.3 解耦盘模型

根据液压悬置的结构及其活动解耦盘的运动过程的变化[5], 可建立解耦盘的运动微分方程式如下:

$(p_{1} (t) - p_{2} (t)) A_{m} = m_{d} \ddot{X}_{2} (t) + e k_{d} X_{2} (t) (10)$

式中, md、kd为解耦盘及其附加液体的质量、刚度;Am为解耦盘面积;e为状态系数。

在仿真计算过程中, 为了保证系统运动的连续性和计算过程的稳定性, 将解耦盘的上下限位板视作刚度很大的弹性元件, 当发生接触时可以产生很大的支撑反力。这样需要在方程中加入一个状态判断系数:

$e = {\begin{cases} n X_{2} (t) > Δ d \\ 0 X_{2} (t) < Δ d \end{cases} (11)$

其中, n值根据仿真过程的收敛性和经验选取。

当解耦盘不到达限位位置时, 油液经过解耦盘的流动可以简化为环形缝隙流动, 理想情况下是同心环形缝隙, 实际工作过程中多为偏心环形缝隙。根据文献[6]可得偏心环形缝隙的体积流量公式, 也即解耦盘周围液体的运动微分方程为

$q_{v d} = {\begin{cases} 0 e = n \\ (1 + 1.5 ε^{2}) \frac{π d h_{0}^{3}}{12 μ l_{d}} (p_{1} (t) - p_{2} (t)) e = 0 \end{cases} (12)$

式中, ε为相对偏心率;d为圆形解耦盘直径;h0为同心缝隙值;ld为解耦盘厚度。

2.4 液压悬置非线性数学模型

根据上述橡胶主簧模型和流体模型, 设液压悬置承受的预负载为F0, 液体初始压力为p0, 液压悬置初始位移X0, 可得目标液压悬置的非线性数学模型如下:

$\begin{array}{l} p_{1} (t) - p_{2} (t) = Ι_{f} \dot{q}_{v} + \frac{1}{2} ρ (\frac{l_{f}}{d_{f}} ζ_{1} + ζ_{2} + \\ ζ_{3} + ζ_{4}) \frac{q_{v}}{A_{f}} | \frac{q_{v}}{A_{f}} | \\ q_{v} = \frac{π d_{f}^{4}}{128 μ l_{f}} (p_{1} (t) - p_{2} (t)) \\ Ι_{f} = ρ l_{f} / A_{f} \\ (p_{1} (t) - p_{2} (t)) A_{m} = m_{d} \ddot{X}_{2} (t) + e k_{d} X_{2} (t) \\ q_{v d} = (1 + 1.5 ε^{2}) \frac{π d h_{0}^{3}}{12 μ l_{d}} (p_{1} (t) - p_{2} (t)) \\ p_{1} (t) = C_{1} Δ V_{1} + p_{0} \\ p_{2} (t) = C_{2} Δ V_{2} + p_{0} \\ Δ V_{1} = A_{m} X_{2} (t) - A_{p} X_{1} (t) - \int_{0}^{t} q_{v} d t - \int_{0}^{t} q_{v d} d t \\ Δ V_{2} = \int_{0}^{t} q_{v} d t + \int_{0}^{t} q_{v d} d t + A_{m} X_{2} (t) \\ X_{1} (t) = X_{0} + X_{ω} \sin ω t \end{array}} (13)$

式中, xω为激励振幅。

则振动经过液压悬置元件传到车架端的响应力可表示为

$F (t) = k_{r} X_{1} (t) + b_{r} \dot{X}_{1} (t) + A_{p} (p_{0} - p_{1} (t)) + F_{0} (14)$

3 动态特性仿真

根据液压悬置的非线性数学模型, 利用MATLAB软件编制相应的仿真程序, 确定相关参数值, 选定合适的积分方法、积分精度、积分步长, 给定激励信号的幅值和频率, 如果数值收敛, 就可以求得各变量的时间历程, 得到各变量响应的幅值和相位角, 为动特性分析提供依据。

3.1 参数获取

本文仿真参数 (表1) 主要由汽车厂配套企业提供, 部分系数来源于文献[6]的推荐值。

3.2 特性仿真

由于液压悬置的动特性具有强烈的非线性, 不仅与激励信号的频率有关, 而且与激励信号的幅值有关, 可定义液压悬置在频率为ω的正弦位移信号Xm=Xωsin ω t激励下的复刚度为

K* (ω, Xm) =K (ω, Xm) exp (jϕ (ω, Xm) ) =

K*cos ϕ (ω, Xm) +jK*sin ϕ (ω, Xm) =

K′ (ω, Xm) +jK″ (ω, Xm) (15)

其中, ϕ (ω, Xm) 为液压悬置在频率为ω的正弦位移信号Xm=Xωsin ω t的激励下的阻尼滞后角;

K′ (ω, Xm) 为复刚度的实部, 即弹性部分;K″ (ω, Xm) 为复刚度的虚部, 反映液压悬置的阻尼特性, 则液压悬置的动刚度K可定义为

$Κ = \sqrt{Κ^{'} (ω, X_{m})^{2} + Κ^{″} (ω, X_{m})^{2}} (16)$

即复刚度的模, 指一定频率下激振力与响应位移的幅值之比。滞后角表达式为

ϕ (ω, Xm) =arctan (K″ (ω, Xm) /K′ (ω, Xm) ) (17)

即一定频率下响应位移与激振力之间的相位差, 即复刚度的相角, 表征元件阻尼的大小。

动态特性评价指标采用液阻悬置特性研究常用的动刚度和滞后角[3,4], 另外通常把液阻悬置在5～50Hz范围内、振幅为1mm的振动视作典型的低频大振幅振动, 而把50～200Hz范围内、振幅为0.2mm的振动视作典型的高频小振幅振动。课题组分别针对这两种典型工况进行了液压悬置的动特性仿真, 并与实验测试结果做了对比分析, 仿真与实验的对比曲线见图3、图4所示。

3.3 结果及误差分析

由图3、图4可见, 仿真结果和实验结果比较接近, 相对误差保持在10%～30%范围内, 能够满足工程应用要求, 也证明了所建模型是正确的、可用的。高频小振幅激励时, 动刚度仿真与实验曲线有较好的相似性, 且在高频区域, 动刚度只稍有增大, 没有出现高频硬化现象, 拓宽了悬置在高频时的使用性能。低频大振幅激励情况下仿真数据与实验数据的吻合情况相

(b) 滞后角曲线

对来说不如高频小振幅激励工况, 这可能与橡胶主簧的简化有关, 实际上它是橡胶和金属骨架的耦合体, 其非线性特性更复杂。由此可推断, 虽然橡胶主簧对液压悬置的频动特性有一定影响, 但与其内部的液体阻尼机构 (惯性通道及活动解耦盘) 的影响相比, 其量值较小;低频大振幅工况, 悬置的减振作用主要依赖于液体流过惯性通道的阻尼, 而在高频小振幅激励下, 惯性通道和活动解耦盘共同工作, 活动解耦盘在液室内波动为主要振动, 抑制了悬置动刚度的上升。

仿真计算结果与实验测试结果之间的差别主要来自于建模过程中的各种简化, 因为实际的液压悬置结构比所建的力学模型复杂得多。例如其内部液体压力并非均匀分布、上液室内液体的复杂流动在高频段对悬置动特性会有明显的影响、液室间的泄漏现象在高频段不能忽略;在计算悬置上、下液室压力差时, 只考虑了沿程阻尼损失系数、局部收缩系数和局部扩大系数, 而对于螺旋形惯性通道而言, 入口和出口的轴线夹角所引起的弯管损失没有考虑等。液压悬置内的液体也并非纯净的液压油液, 本身会混有一定数量的不溶解气体[7], 在振动过程中, 当悬置处于拉伸状态时, 上液室的液体压力会显著降低, 甚至远低于外界大气压, 直接影响着悬置上液室的体积变化。

4 结论

随着液压悬置的结构越来越复杂, 寻求一种简单而有效的建模方法以适应快节奏的研发工作是一个很棘手的问题。本文运用机械和流体混合列平衡方程的方法并结合流体动力学理论和液压原理推导建立液压悬置元件的非线性数学模型。该方法利用悬置元件的本身结构参数建立悬置模型, 而不必进行细致的仿真参数识别实验, 降低了研究难度, 所建立的非线性模型通用性较好, 可直接用于悬置其他特性的预测和汽车动力总成悬置系统的匹配选型、优化分析及整车的振动性能研究, 有利于提高产品设计质量、缩短开发周期。

参考文献

[1]Lee Y W, Lee C W.Dynamic Analysis and Controlof an Active Engine Mount System[J].AutomobileEngineering, 2002, 216:921-931.

[2]上官文斌, 吕振华.液阻型橡胶隔振器非线性特性仿真分析[J].振动工程学报, 2003, 16 (4) :393-398.

[3]张云侠, 张建武, 上官文斌, 等.直接解耦盘式液阻悬置的动力学研究[J].上海交通大学学报, 2007, 41 (9) :1406-1410.

[4]吕振华, 上官文斌, 梁伟, 等.液阻型橡胶隔振器动态特性实验方法及实测分析[J].中国机械工程, 2004, 15 (2) :182-186.

[5]鲍宁.动力总成液压悬置的参数化设计[D].长春:吉林大学, 2007.

[6]《机械设计手册》编委会.机械设计手册———液压传动与控制[M].北京:机械工业出版社, 2007.

非线性动态模型篇7

过去的四十年是传统控制技术飞速发展的阶段, 大量控制方法的提出和完善极大的促进了现代工业的快速发展。随着生产力的不断提高, 工程技术系统越来越复杂, 生产实践对系统的可靠性和安全性提出了更高的要求。容错控制技术就是在这种背景下产生并发展起来的。

容错控制包括主动容错控制和被动容错控制。被动容错控制大致可以分成可靠镇定, 完整性, 联立镇定三种类型。主动容错控制大致可以分成三大类:控制律重新调度, 控制器重构设计, 模型跟随重组控制。

二、基于人工智能的非线性系统主动容错控制方法

非线性系统容错控制领域中研究的比较多的方法, 大都是基于人工智能的控制律重组方法, 这种方法最典型的特点是利用了人工智能技术。人工智能技术包括模式识别, 专家系统, 神经网络, 模糊逻辑和遗传算法等。根据对人工智能技术使用目的的不同, 分为三类:估计系统动态, 估计故障函数, 控制非线性对象。这类方法大多使用了神经网络, 利用神经网络很强的非线性连续函数的逼近能力同时还引入了神经网络的固有缺陷 (如何构造出符合要求的神经网络是一个解决的难题, 在实际应用中, 需要一些经验) 。另外, 神经网络的引入使得理论分析比较困难。

三、基于观测器和滤波器的非线性系统主动

容错控制方法这类方法主要利用非线性自适应观测器估计出故障幅值, 利用这一故障信息进行控制律重组。Boskovic主要针对太空船模型, 研究了执行器发生故障的情况下的容错控制问题。采用多模型的办法, 对每个执行器建立一个故障模型, 设计一个自适应的观测器估计出实际的控制输入量。利用自适应观测器的估计重组控制律, 同时证明了这种方法的全局稳定性。

Kabore对于一类仿射非线性系统, 通过精确线性化, 基于非线性自适应观测器方法估计出故障幅值, 采用伪逆的方法设计控制律, 证明了系统在故障情况下仍然能够渐近地跟踪参考输入。

四、其他方法

非线性系统容错控制领域现有的研究成果大都是针对仿射非线性系统的, 只有基于滤波器的方法考虑了非线性时滞系统的容错控制问题, 对于更为复杂的非线性对象, 还没有结果。而实际对象是非常复杂的, 现有的成果远不能满足工程实际的要求。其次, 现有方法考虑的容错目标大都是故障情况下系统的稳定性, 并没有考虑一些动态指标。系统发生故障后, 系统的性能会下降, 如何选择新的控制目标, 使得发生故障后的系统能够满足这个新的目标, 并且运行在安全的状态下, 这个问题目前研究的还比较少。另外, 网络化是现代控制技术发展的趋势, 如何通过利用网络资源进行非线性容错控制是个不错的研究内容。总之, 非线性动态系统的容错控制还有不少内容有待探索:

1、快速故障诊断方法研究;

2、非线性不确定系统故障诊断以及容错控制研究;

3、网络形式下, 非线性故障诊断以及容错控制研究等。

参考文献

[1]Patton R J.Fault-tolerant control:the1997situation[A].Proc of IFAC/IMACs symposium on Fault Detection and Safety for Technical Process.Hull, England, 1997:1033-1055.

[2]Herbert E R.A control engineer, s use of artificial intelligence[J].Control Engineering Practice, 1998, 6:249-258.

[3]周东华, Ding X.容错控制理论及其应用[J].自动化学报, 2000, 26 (6) :65-70.

[4]Jovan D B, Li Sai-ming, Raman K M.Globally stable adaptive tracking control design for spacecraft under input saturation[A].Proceedings of the38th conference on decision&control, Phoenix, Arizona, USA, 1999:1952-1957.

非线性动态模型篇8

人眼视觉范围指人眼所能感知的亮度范围,从10- 6cd / m2( 注: 1 cd/m2= 1 nt) 到了108cd / m[1,2],范围( 亮度比值) 达到了1014( 即1014∶ 1 ) ,而典型的景物亮度大致在105范围。当人眼适应了某一环境亮度后,其瞬时视觉范围可达到104( 即同一瞳孔开度下可辨别的亮度范围) 。现今的电视显示器对比度范围大致能做到2 000∶ 1,远小于人眼的感知范围。所以,人们从电视上所看到的仅仅是一个屏幕表现,而非真实世界景色的再现。图1 真实世界中,人眼可感知的亮度范围从暗处的2 cd /m2到明亮处的10 000 cd/m2,其亮度分辨率能力远高于目前的任何显示设备。

传统显示器CRT曾长期占据显示屏的统治地位,CRT能提供的最高亮度不超过100 cd / m2。现代的视频显示器,比CRT显示器提供更高的性能。特别是可提供更明亮的图像和更深的黑色。换句话说,现代显示器可提供比CRT显示器更高的动态范围。现今消费级液晶显示器亮度可达到400 cd/m2,高质量产品可达到1 000 cd /m2,某些专门用途的商用产品则可实现4 000~5 000 cd / m2的高亮度。

目前以CRT为基础的光电转换特性标准限制了新型显示器表现真实景物亮度范围的能力,单方面提高显示器件的亮度范围仍无法实现高动态范围景物显示。本文介绍了杜比Vision和英国广播公司BBC提出的HDR( 高动态范围) 显示方案,二者从HDR需求出发,提出了新型的光电转换特性,可实现高达10 000cd / m2的亮度,有效扩展了显示器的动态范围。

2 电视系统的非线性光电变换

电视中的非线性最初来自使不同亮度等级上获得一致的噪声效果的理念。CIE规定了一个亮度的函数,使之尽可能接近人眼对亮度的响应,这函数关系大致是幂指数0. 42。对于线性电视系统,同样的噪声量级,在暗区表现明显而在亮区则很弱。因此,模拟电视系统用非线性变换使主观视觉在不同亮度区看上去噪声处于相同的水平。在摄像机输出端,把信号用幂指数0. 42 加以压缩,而在显示器端把信号扩展,使整个系统的亮度传输基本线性,而视频噪声则在不同亮度区趋于一致。早期电视工程师利用CRT电- 光转换的非线性来实现噪声均匀性要求,CRT的转换幂率为2. 4( 2. 4 大约是0. 42 的倒数) 。

实际操作中,用于摄像机变换的预校正指数平均值为0. 5,由ITU BT. 709 标准化。通过与显示器的2. 4结合,整个系统的伽马值为1. 2,即图2 表示的系统伽马值。这种对前端信号的预校正补偿称为意图再现( rendering intent) ,是人眼在室内较暗环境观看图像较为适宜的变换值,它较好地反映了人眼视觉系统对真实世界景物的客观响应。

视频信号数字化后,量化比特成为图像噪声的主要来源。量化级数直接影响动态范围,而且是图像中亮度差的重要体现,量化比特不足会在图像的平滑区域引入不规则的边界,这种现象被称为“条带”、“轮廓”或量化误差,图3 表示一种极端的轮廓效应。BBC在1974 年的研究表明[3],对于100∶ 1动态范围,8 bit已经使图像足够平滑,几乎看不出“轮廓”。

电视演播室中常用10 bit视频,但实际中,使用BT.709的变换值,对增加动态范围几无贡献,因为多出来的2 bit用于最低有效位,指望提高暗区分辨率,可以降低最小黑电平,但不能增加屏幕的最高亮度。类似的情况,ITU BT.2020中提出的12 bit也不能增加屏幕的最高亮度。

BT. 709 规定从景物亮度到电信号的光- 电转换关系,称为OETF。摄像机制造商希望能支持更高的动态范围,但BT. 709 只提供100∶ 1动态范围而无法实现。目前的摄像机甚至可支持16 bit视频动态范围,达到105量级。为规避BT. 709 限制,摄像机制造商在OETF曲线中加入一个“膝盖”状拐点,来延伸亮度范围,使信号不至于饱和[3],见图4。

采用不同的OETF可增加视频信号的动态范围。BT. 709 规定的伽马曲线设计目的,在于不同亮度下产生均匀的视频噪声,由此设计出近似于人眼视觉的主观亮度曲线。但是,视频信号数字化以后,视频信号量化的目标是避免产生量化的轮廓噪声,而不是提供均匀的感知噪声。所以,量化视频信号时,重点放在展现人类视觉系统的亮度范围感知能力,以及能够区分亮度差的能力。

3 人眼视觉系统特性

量化视频信号希望避免轮廓,即相邻点的量化电平差。研究人眼视觉系统的韦伯定律指出,人眼可察觉的物理亮度差与亮度成正比。也就是说,在可察觉亮度差的边界上,韦伯分数( ΔL/L) 趋于一个常数。研究表明,人眼锥细胞的韦伯分数在2% ~ 3% 之间,表示受试者能可靠地检测出物理亮度在2% 到3% 的变化[4,5]。

韦伯定律表明,对数关系的OETF将提供最大的动态范围,同时再现图像中察觉不到的量化轮廓。韦伯分数为2% 表示可以获得100∶ 1的动态范围。使用233级量化电平,即709 中的8 bit,没有可感知的轮廓。

这也就是说,人眼瞬时的亮度动态范围在104,这并非量化级要达到214= 16 384 才能满足分辨要求。例如亮度从0. 1 cd/m2到1 000 cd /m2,动态范围104,而人眼随亮度增加,在100 cd /m2处分辨率只有1 cd/m2而不是0. 1 cd/m2,亮度越高可分辨的亮度差越大,维持 ΔL/L基本不变,所以并不需要按最小亮度均匀量化。只要按照某种适合人眼视觉特性的变换关系,就可以用1 000 个量化级实现亮度动态范围104,甚至更大,如杜比Vision用12 bit实现107的亮度动态范围。

Barten根据人眼视觉系统规律,并经过大量试验得出复杂的Barten模型,是图像研究领域公认的基础,成为图像显示中人眼最小亮度差分辨率阈值理论依据。ITU BT. 2246 中给出Schreiber和Barten模型曲线,见图5[6]。

BT. 1886 根据CRT的Gamma特性,规定幂指数为2. 4 的电- 光转换特性。图5 中给出3 种12 bit量化的BT. 1886 随亮度范围变化的最小对比度特性,在高亮度区,BT. 1886 量化误差小于人眼对比度阈值,但低亮度区则高于人眼对比度阈值,表明对高动态范围显示的高亮度区,BT. 1886 量化浪费了过多的比特,而低亮度区则比特量化太粗,比特数不足。

4 支持HDR的光电转换特性

为摆脱以CRT为基础的光电转换特性束缚,实现高动态范围( HDR) 显示,现已有杜比、BBC、NHK和Philips向ITU提出4 个HDR标准化建议,其中杜比Vision提出的感知量化( Perceptual Quantizer,PQ ) 成为SMPTE ST2084 标准,可实现10 000 cd / m2屏幕亮度,BBC提出的10 bit HDR建议,支持超过1 000 cd / m2的HDR显示。图6 给出几种光电转换特性的比较,其中BT. 709 只有100 cd / m2亮度范围,DICOM是医学数字成像和通信领域的标准,规定医学图像质量,10 bit可实现5 000 cd/m2以上的高亮度,杜比Vision则有107高动态范围,支持10 000 cd/m2亮度。

4. 1 系统级光电转换特性

电视传播信号链如图7 所示,信号的变换包括摄像端和显示端的非线性特性。摄像机非线性特性称为光- 电转换特性( OETF) ,显示端则称为电- 光转换特性( EOTF) 。常规电视通常把这两者混为一谈而统称为“伽马校正”。整个信号链为适应人眼视觉系统而呈现非线性,是光- 光的系统转换特性( OOTF) 或系统伽马。系统伽马用来补偿人眼在不同观看环境的心理视觉效果,适合的系统伽马值能更好地完成景物真实再现( rendering intent) 。电影业选择系统伽马值为1. 6 ~1. 8,适合黑暗环境下观看,电视在室内较暗环境观看,系统伽马值为1. 2,计算机从业者偏爱系统伽马值为1,因为它适合在室内较亮环境下观看图像。

BBC对系统伽马值进行了主观测试,测试的室内照度10 lx,一台参考显示器显示亮度为600 cd/m2的参考图像,另一台测试显示器显示9 个不同伽马值( 1. 0~2. 4) 的测试图像,测试图像亮度从68 cd /m2到5 200 cd / m2变化,参试者从中选出与参考图像匹配最好的测试图像。测试结果中得出优选的系统伽马值如图8 所示,并得到如下经验公式[8]

图8 表明,HDR系统伽马值随显示器峰值亮度而改变,例如室内常用环境亮度10 lx下,相当于背景亮度10 cd /m2,亮度为1 000 cd/m2显示器系统伽马值优选为1. 4,而数千坎德拉每平方米亮度的显示器,则系统伽马值宜取1. 5。为此,BBC的研究报告建议,厂商根据显示器亮度不同而采用不同的系统伽马值,可获得最佳观看效果。

4. 2 杜比Vision

杜比实验室提出一种用于显示器的电信号到屏幕光输出的非线性变换,即电- 光转换特性EOTF,也称感知量化( Perceptual Quantizer,PQ) ,其商业名称为杜比Vision。杜比PQ根据Barten对比度敏感特性,构造显示端非线性变换EOTF,使量化误差形成小于Barten对比度阈值的PQ曲线。

Barten模型给出对比度敏感函数CSF公式,表示在给定观测条件下,CSF对不同空间频率的图像分辨能力,CSF是可察觉亮度差与亮度的比值[6]

对不同类型的图像,人眼视觉敏感度不同,以不同空间频率的图像( 图像呈现不同距离的光栅) 作为敏感度的测试。图9 中画出不同亮度下的敏感度CSF曲线,找到每个亮度下CSF最大值,也就是指该亮度下人眼对此光栅图像最为敏感,所谓的图像勾边效应,而此时的亮度差作为人眼可察觉的最小亮度差阈值。将这些亮度差阈值连成随亮度变化的一条曲线,即得到Barten最小可觉差( Just Noticeable Difference,JND) 曲线,如图10 表示[7]。

图10 中虚线表示的折线段为Schreiber可觉差阈值曲线,在1 ~ 10 000 cd/m2亮度范围,呈对数关系,而在0. 01 ~ 1 cd/m2范围为1 /2 幂指数关系。另一条虚线表示的弯曲线段即从Barten模型公式中得出的可觉差阈值曲线,该曲线下方即为不同亮度下不可察觉的亮度差值,也就是量化阶梯的取值范围。沿着这条阈值曲线构造的变换特性,便可用最少的量化比特获得最佳量化效果。

杜比实验室按照Barten阈值曲线做出3 条12 bit量化曲线,分别是0. 46JND,100 cd /m2; 0. 68JND,1 000 cd / m2; 0. 9JND,10 000 cd/m2。分别对应不同的量化误差和最大亮度。误差最小的是0. 46JND,位于最下方。

以0. 9JND,10 000 cd /m2曲线为基础,得到杜比PQ。杜比PQ用了不同的函数规律来逼近Barten阈值曲线,低亮度区为平方根关系( 斜率- 1 /2) ,高亮度区是斜率接近0 的对数关系,低亮度和高亮度之间的中间区域,则为变化的斜率,中间区斜率平均值表现为BT. 1886 的变换斜率。杜比PQ提出的EOTF由下式表示[7]

其中:Y是屏幕亮度;V是视频信号值,0≤V≤1;L0=10 000;m=78.843 8;n=0.159 3;c1=0.835 9;c2=18.851 6;c3=18.687 5。

根据杜比PQ曲线,屏幕亮度为

反过来得到视频信号

经过导数运算,写成对比度敏感形式

式中: ΔV是数字量化的最小单位,12 bit时,ΔV =1 /4 060。

按照式( 10) ,画出12 bit,10 000 cd/m2时的PQ曲线见图11,可见杜比PQ构造的EOTF亮度范围从0. 001 cd / m2到10 000 cd/m2,动态范围107,整条曲线在不同亮度区量化阈值均小于Barten阈值。同样是12bit量化的BT. 1886 EOTF,最高亮度1 000 cd / m2,在小于2 cd / m2的低亮度区,量化阈值高于Barten阈值,表明杜比PQ比BT. 1886 量化效率更高。

杜比PQ是显示端的非线性变换特性EOTF,与摄像端不发生关系,只考虑了信号量化和人眼亮度分辨率的关系,认为若视频信号从摄像机获取,则摄像机端信号与景物亮度呈线性关系。换句话说,若摄像端存在类似BT. 709 给出非线性变换,则需要去除这种非线性,才能正确显示所摄取的景物亮度。因此,杜比PQ是作为表现视频信号特征的视频监视器角色出现,而非指定从景物到显示屏整个系统的变换关系。

4. 3 BBC建议的HDR光电变换特性

BBC的HDR建议考虑电视信号的产生到显示整条信号链,提出OETF和EOTF。从信号产生端看,在图像的较亮部分符合韦伯定律,即感知亮度差和亮度的比值近似恒定。这意味着对数规律的OETF在给定的量化深度下将提供最大动态范围。例如现今专有的摄像机OETFs,如S-LOG,Panalog和Log C等已获得广泛使用。但对数变换在低亮度区域分辨率很差,会出现可察觉的量化误差。低亮度区人眼视觉感知阈值符合De Vries-Rose规律,很凑巧的是,传统的指数型OETF特性与De Vries-Rose规律匹配很好。这种传统的伽玛曲线当初就是为低亮度表现的CRT所设计。因此,理想的OETF应在低亮区符合指数规律,在高亮区符合对数规律。

BBC提出混合型OETF如下式表示[8]

式中: E是代表景物线性亮度的摄像机各彩色通道( R,G,B) 信号值。E'是非线性变换信号,归一化范围0~1。r = 0. 5 是白电平参考值。

固定常数a = 0. 178 832 77,b = 0. 284 668 92,c =0. 559 910 73。对应这组常数,相对亮度为12 时,信号值E' = 1。

图12 表示按照log-Gamma规律的组合型OETF变换,其中虚线为BT. 709 的伽马预校正,实线为适合HDR的OETF,相对亮度从1 扩大到12,避免了高亮度区的信号饱和。这种log-Gamma规律的组合为提高量化效率埋下伏笔。

BBC建议的显示器非线性变换EOTF如下[8]

式中: Yd为像素表示的屏幕亮度; Ys是景物亮度; α =LP- LB,表示屏幕亮度最大值; β = LB; γ 为系统级光电转换特性。LP是峰值白(对应Ys=1),LB是黑亮度(Ys=0)。

EOTF实际计算过程见图12。EOTF把线性景物亮度Ys映射到屏幕亮度Yd。与常规动态范围SDR不同,EOTF将变换施加到景物亮度Ys,而不是加到每个颜色通道,来防止颜色变换的不一致。

Ys可通过预校正信号E'来获得

E是线性景物亮度的每个彩色分量RGB分量表示,可得到

显示亮度Yd确定之后,显示器每个像素的显示值Rd,Gd和Bd由下式决定

计算量化误差曲线,取 α = 2 000,β = 0. 01,γ =1. 5。按10 bit量化有 ΔE' = 1 /1 020,得到BBC EOTF量化误差曲线如图13 所示,图中3 种EOTF均为10 bit量化,杜比PQ是最接近Schreiber阈值的EOTF,支持亮度到10 000 cd /m2。BBC和1886 传统Gamma支持2 000 cd / m2亮度,但1886 在中低亮度区已经超过Schreiber阈值,量化误差为可察觉。BBC EOTF结合了Gamma和对数转换特性,量化误差正好在阈值之内,表现出较好的量化效率。需要指出的是,按照本文的推导计算曲线,与BBC研究报告给出的曲线略有差别,尚未找到原因。BBC研究报告误差曲线如图14 所示。

BBC HDR转换特性首先从摄像端入手进行非线性预校正,低亮度区采用BT. 709Gamma特性,在高亮度区采用对数特性,这样充分发挥摄像机已具备的高亮度景物摄取能力,同时将人眼视觉亮度差阈值与量化级相适配。其次,对于显示端,按照观看环境亮度和显示器峰值亮度参数选择系统级Gamma值,从整个亮度观看全过程适应人眼视觉特性。BBC HDR方案与现有的电视伽玛特性标准在低亮度区域有一定兼容性,转换特性产生的量化误差对大多数自然景物图像而言不易察觉,转换特性没有杜比PQ那么复杂,因此,日本已将其作为扩展图像动态范围电视( EIDRTV) 系统的ARIB国家标准。

5 结束语

本文以杜比感知量化和BBC摄像端和显示端分开考虑的转换特性入手,介绍HDR电视系统光电转换特性原理和设计实现。这两种HDR方案均基于人眼视觉系统的感知特性,以最少的量化比特实现高动态范围显示要求。杜比方案基于显示器屏幕亮度,以人眼视觉感知阈值来确定电- 光转换特性,使量化误差正好小于视觉阈值,形成精确复杂的高亮度转换特性。BBC方案在摄像端采用扩大景物亮度范围非线性预校正,在显示端以适合观看环境的系统级伽玛数设计电- 光转换特性,同样以较少的量化比特实现高动态范围显示。HDR电视系统将传统基于CRT特性,亮度范围在100 cd/m2以内的常规显示扩展到2 000 ~10 000 cd / m2高亮度,适应新型显示器的发展现状,为用户提供更加绚丽多彩的真实世界再现。

参考文献

[1]DENTON E J,PIRENNE M H.The absolute sensitivity and functional stability of the human eye[J].The journal of physiollogy,1954,123(3):417-442.

[2]NARISADA K,SCHREUDER D.Light pollution handbook[M].[S.l.]:Springer Science&Business Media,2004.

[3]BORER T.Non-linear opto-electrical transfer functions for high dynamic range television[EB/OL].[2015-11-01].http://downloads.bbc.co.uk/rd/pubs/whp/whp-pdffiles/WHP283.pdf.

[4]STEVENS S S.On the psychophysical law[J].Psychological review,1957,64(3):153-181.

[5]DAVSON H.Physiology of the eye[M].5th ed.London:Macmillan Academic and Professional Ltd.,1990.

[6]BARTEN P G J.Formula for the contrast sensitivity of the human eye[C]//Proc.SPIE-IS&T.San Jose,CA:[s.n.],2004,5294:231-238.DOI:10.1117/12.537476.

[7]SCOTT M.Perceptual signal coding for more efficient usage of bit codes[J].Motion imaging journal,2013,122(4):52-59.DOI:10.5594/j18290.

非线性动态模型篇9

1 离散系统输入输出模型

由于计算机的广泛应用, 致使人们对离散系统更感兴趣[2—5]。离散系统的数学模型可以描述为如下的差分方程

对式 (1) 进行z变换, 在零初始条件下, 输出变量的z变换对输入变量的z变换之比就是该系统的z传递函数

式 (2) 中, z表示运算子, 也称为移位算子。

单输入输出的数据采样系统如图1所示。其中u (t) 是系统输入, y (t) 是系统输出, t=1, 2, …, n表示采样的时间点, G是传递函数。在神经网络的每一个单元, 将多输入的活性模式变换为一个输出的活性模式并将其传递给其他的神经元。主要包括两步:第一, 将每个输入乘以相应的权值并求和, 获得一个称为总输入的模式;第二, 每个神经元启用激活函数将总输入模式激活为输出模式, 神经网络的行为取决于这些权值及各神经元特有的激活函数, 具体表示如下

式中, N表示网络中的神经元总数, ui (t) 和τi (t) 分别是t时刻第i个神经元的内部状态和外部状态, wij是t时刻第i个神经元与第j个神经元之间的权值, τi (t) 是t时刻第i个神经元的阈值, fi (·) 是非线性函数。现选取。不同的参数β, 使得函数的形状不同。在确定所有的输出神经元的输出yi (t) 后, 网络便将任意输出神经元的输出通过连接权值Tij反馈至所有的神经元ui (t) 作为输入。也就是说每一个神经元都通过连接权值接受所有神经元输出反馈回来的信息, 目的是为了让任意神经元的输出都能受所有神经元输出的控制, 使得各神经元的输出能够相互制约。每个神经元均有一个阈值τi (t) , 以反映对输入噪声的控制。由文献[6—8]可以看出, 即使静态非线性足够的精确, 但仍然存在局限性。这使得在有关静态非线性反馈的应用中, 近似误差的小幅度增加会导致更大的模型误差。

2 应用δ变换降低误差

导致建模误差的原因之一是离散化在连续系统采样中的应用。为了改进离散化的属性, 引入了δ变换, 随着采样时间h的变化, δ变换在xt上定义了如下的操作

式 (5) 中, xt表示一个连续信号的样本。为了展示δ变换的优越性, 将讨论一阶滞后的例子。假设连续变化的过程方程为

式 (6) 中, u和y分别表示过程的输入和输出, 而K是稳态增益, T是过程的时间常数, D代表微分算子。假设h控制抽样数据的采样时间, 考虑零阶滞后离散过程可以用变换q-1, 或者用δ算子:

来描述控制过程。

以下主要讨论误差的有关问题。上述离散时间模型的参数可以通过输入输出样本进行估计, 最终的目的是重新确定连续过程的参数K和T。离散时间模型中设定的相关参数有一定的误差, 这里的关键在于重建的连续时间模型参数的准确性不仅取决于连续时间参数的误差估计, 还取决于离散时间模型的选择, 本质在于用离散化时间模型参数描述连续时间模型的误差取决于离散时间模型本身。这种刻画连续模型的参数可以表示为

经推理得出K和T的误差函数ΔK、ΔT可以直接表示为关于Δa、Δb的函数。相对误差的转换运算结果为

分析的表达, 可以看出由于 (特别是, 随着样本频率的增加, a的值趋向于1。因此, 第二列元素的矩阵表示高增益, 在关于向量方程的离散模型参数估计时, 相对误差明显被放大, 这会影响连续参数h=0.01 s和a=0.99, b=0.01的确定。例如考虑K=1和T=1情形, 应用采样时间h=0.01 s, 这使得a=0.99, b=0.01, 导致乘法运算增加接近100, 得到的误差矩阵如下

再次, 当a→1得到, 这意味着离散时间和连续时间模型的相对误差很接近。类似的数值实例可以用于高阶系统的重复。进一步的数值实例证实了上述现象:灵敏度矩阵影响高收益的结论, 在变换模型的情况下, 就会是更显著的高阶系统。

3 等价的非线性系统

非线性动态系统模型设计作为典型的分解应用于大多数情况, 即完整的系统往往是由动态线性子系统和静态非线性以某种方式结合而成。现讨论两种类型的模型, 状态模型将使用动态系统作为静态非线性外围的反馈, 输入输出模型将使用静态非线性和动态子系统的层级连结。离散的时间系统模型可以扩展为连续的时间系统模型。

3.1 状态模型

建立模型的一种方法是使用由过程输入和内部状态向量x驱动的未知的静态非线性假设, 静态非线性的输出是已知的属于反馈的类似存储单元和输出y及输入向量u来激活动态系统, 动态子系统是一个带有相同存储单元的简单对角结构, 完整的状态模型如图2所示。假设状态向量是大小完全相同的n维向量;静态非线性包含n+1个函数, 每个函数都有n+1个变量。

假定将用单值非线性映射神经网络实现静态非线性子系统。通常, 动态子系统被认为是线性的, 然而, 它可以推广到非线性动力学中。此外, 动态子系统可以有自己的内力状态x

任何系统都可能有几个等价的输入/输出表示形式。例如, 等价系统的描述可以通过引入不同的状态向量x和z来实现。很显然, 确保输入/输出等价的各种状态变量将导致各种静态和动态子系统。假设动态线性系统是由静态非线性系统S1和动态子系统D1通过某种方式耦合建模所形成的, 进一步假设定义另一个动态子系统D2作为 (S2, D2) 的一部分, 自然地会引出问题:相同属性的D1和D2能否保证存在S2使得 (S1, D1) 和 (S2, D2) 为等价系统 (图3) ?

为了简单起见, 只讨论带有相同大小的状态向量x、u和y的线性动力系统。动态子系统用如下方程描述

矩阵A, B和C都是二次型矩阵。如果B和C是可逆矩阵则两种系统是等价的。另外, 假定实现系统也是稳定的。这种情况下需要一个适当的矩阵A。特别地, 这种情况意味着类似存储器单元可以通过许多方式很容易地选择。例如:非线性动态系统可能涉及下式的转换操作

或者涉及下式的离散时间积分器

3.2 输入输出模型

与状态模型不同的是输入输出模型可以表示为以前的输入和输出样本的函数

则有

为了建立模型, 由动态子系统生成的具有一般属性的输入输出样本作为静态非线性的函数变量。输入输出模型是级联结构, 如图4所示, 由过程输入u激活动态子系统而不是静态非线性。比较输入变量数, 静态非线性的输入变量数已经增加一倍达到了2n, 而在状态模型中只有n+1。然而, 输入输出模型的明显优势在于底层的动态子系统是由过程输入输出的样本激活的。这不像在状态模型的情况下, 没有由动态子系统直接访问输入向量y和输出向量x。接下来我们将获取条件, 找到等价的 (S, D) 对。配方的问题如图5所示。

式 (16) 可以变形为:yt=F (zt) , 其中

这种变形对线性的动态系统有如下的限制条件

式 (18) 中A为非奇异矩阵。然后导入新的状态, 可以表示为

与状态模型相比, 考虑到输入输出模型会受到有效等价转换集合的限制, 线性的变形z'=Az+b将不会改变动态系统的结构。为了得到更加有效的系统模型结构, 将输出方程改写为如下的形式

式 (20) 中

将系统转变成一个等价的输入输出来实现, 相应地对wt执行如下线性变换

可以导出, g' (wt) =0。样本的有效等价输入输出模型结构如图6所示。

图6中, L表示静态的线性子系统。上述方案表明:将一个系统分解为一个线性标称模型和一个以非线性子系统形式表示的该线性模型的偏差是可行的。如果动态子系统D由级联移位算子构成, 则用线性子系统L实现的一阶滞后和二阶滞后分别为

4 非线性模型设计的误差分析

现考虑未知非线性动态系统的模型设计。前面讨论的等价转换关系将作为减小误差的关键方式。一般地, 非线性动力系统的识别运用并行结构实现。首先讨论输出模型对逼近误差的影响, 静态非线性和线性子系统并行工作方式如图6所示。根据并行分解理论, 假设模型将用状态向量x及一个近似的模型:ytN=FN (zt) , 其中zt为串并联模型的状态向量。近似的模型和实际的过程输出之间的误差用误差模型描述为:ytE=FE (zt) , 则实际过程输出为:yt=FN (zt) +FE (zt) 。当这个系统用于识别时, 可以对误差模型加以估计。假设估计误差模型的输出是:, 由上式可以得出输出序列估计表达式:。输出序列的估计误差为

仔细观察上面方程的误差项, 需要注意的是:由于模型的状态向量z不能涉及全部样本, 因此真正的过程输出是不可用的。自然地, 将使用输出样本进行估计。相应地, 并行模型的状态模型可表示为:, 其中误差模型为:, 而且, 建模误差可被转换为, 其中为并行模型的状态向量。

由文献[9—11]可知, 从串并联模型中获得的误差关联于等价转换, 即选择一个合适的模型结构, 理论上存在一个适当的等价转换可以显著降低模型误差。运用前面讨论的等价转换。在自适应建模方面包含两个阶段的过程:第一阶段运用串并联结构模型进行识别, 即实际的过程输出用于潜在的评估体系。下一阶段的模型使用并行结构, 即通过输出模型进行估计, 而不是通过实际过程输出进行估计。然后, 比较等价的结构, 可以得到如下的结论:当从串并联结构转换到并行结构时, 在等价的模型中没有合适的选择来影响误差的传递。换句话说, 误差传递独立于等价转换的应用。这个结论本身并不奇怪, 随着等价转换不调整“环路增益”。

5 结论

非线性动态系统模型需要由模型构建元素来实现非线性映射和动力学行为。状态模型和输入输出模型不仅仅用于建模, 还应用于模型的灵敏度分析。由未知的非线性动态系统的模型设计经验表明, 即使是近似静态非线性逼近的微小误差也可能导致完整模型设计中的较大误差。误差分析解释了这一事实。当转换到并行结构时, 串并联结构的模型设计误差在很大程度上会被放大。主要结果表明:等价转换不影响由串并联结构转换到并行结构时的误差。然而, 等价系统的实现, 会帮助串并联结构本身误差的显著性减小。因此, 并行结构实现识别的性能会得到很大的改善。

摘要：人工神经网络常用于非线性动态系统建模, 动态子系统中可以运用多种形式的静态非线性。为完成非线性动态系统建模, 利用神经网络结构来近似静态非线性关系。自然地, 建模过程中会出现相应的误差估计。分析了基于离散化和数据抽样系统结构因素建模所引起的误差, 发掘出了等价输入输出结构可以作为误差分析的一种度量工具, 刻画出了模型设计误差和逼近误差之间的相依关系并找到了如何选择合适的系统结构来减小误差。

关键词：非线性动态系统,反馈神经网络,逼近

参考文献

【非线性动态模型】推荐阅读：

线性动态系统07-13