经典梯度论文

2024-06-30

经典梯度论文（通用5篇）

经典梯度论文篇1

摘要：策略梯度函数是基于直接策略搜索的方法。它把策略参数化, 并且估算优化指标相对于策略参数的梯度, 然后利用该梯度来调整这些参数, 最后可以获得局部最优或者局部最优策略。所以这样得到的策略可以是随机性策略也可是确定性策略。通过自主开发的Gridworld策略梯度实验平台, 对经典GPOMDP、NAC和基于TD (λ) 的策略梯度算法的收敛性能进行了对比分析。

关键词：强化学习,策略梯度,收敛性,仿真实验

强化学习可以分为基于值函数方法和策略梯度方法[1]。基于值函数的算法, 不需要显性表示学习客体 (agent) 的行为策略, 而是通过不停地更新状态动作对的累计期望回报来得到最优值函数。在估计所得的最优值函数基础上, 在整个状态、动作空间内, 使用贪心算法来确定当前状态迁移时所需的最优动作。

值函数方法常用于对确定性策略的求解过程中, 对于随机性策略的处理仍存在很大困难, 比如在使用线性函数逼近器面对连续状态、动作空间环境时不能保证收敛[2]。策略梯度方法需要显式地表示策略函数, 并且能够沿着策略梯度下降的方向持续改善和优化策略函数的参数向量。该方法能够最终逼近约束环境下的最优解。相对于值函数方法, 策略梯度方法能够同时处理确定性策略和随机性策略, 并且在理论上能够保证收敛。

策略π决定了Agent在当前环境状态下对动作的选择, 动作选择后Agent按照某种概率分布迁移到下一个状态。环境的状态转移概率直接影响优化指标J的计算, 不同的π的值对应不同的J值, 即优化指标是一个关于π的函数。直接策略搜索方法就是π调整其参数, 使得指标J达到最大。调整其参数, 使得指标J达到最大。

在状态xk中执行动作ak, 转移至新状态的概率是:

对于策略梯度方法来说, 所有agents的动作产生于:

θ代表策略梯度参数向量。利用Bellman公式可以求解策略π下的状态和动作值函数:

式中, α是折扣率。优化目标函数J定义为:

策略梯度的方法就是沿梯度方向 (J) / (θ) , 迭代更新参数向量θ , 使得 (J) / (θ) →0, 并最终获得最优策略πθ。

1内部策略梯度可观测算法

Baxter提出了内部策略梯度可观测算法GPOMDP并在理论证明了该算法的收敛性[3]。GPOMDP算法对策略梯度的估计方法是:

其中动作值函数, 反映了当前状态动作对下的累计回报:

在GPOMDP算法中, 迭代公式为:

在式中, βt称为适合度轨迹, 初始化为0向量, 公式迭代L次以后, 梯度的估计值为:

可以证明式为前L次的梯度估计的平均值[4]。

对策略π对其参数θ求偏导:

因为L0=0, 所以迭代公式为:

2自然梯度算法 (Natural-Actor-Critic, NAC)

策略梯度通常总是根据该梯度方向来更新参数, 使之下降的更快。Amari指出这个方向在有些情况下未必是指标函数增长最快的方向, 对于具有正交基的欧氏空间, 梯度方向是指标达到最优的最快方向, 但是对于非欧式空间或者黎曼空间, 并不是常规的梯度方向接近目标最快, 而是 (Natural Gradient) 自然梯度方向[5]。随后Perters提出NAC算法 (Natural- Actor-Crtic) [6]。自然梯度算法的优点是, 比常规的梯度算法收敛速度快, 但是, 在求解自然梯度时, 要先计算常规的梯度, 所以常规梯度计算中方差很大的问题并没有解决。

Sutton在文献[7]中提出了策略梯度的常规估计值方法:

其中,

Williams在REINFORCE算法中采用来估计动作值函数Qπ, 进而估计出策略梯度值, 得到最优策略, 并且假设值函数Qπ可以用一个线性函数逼近器来估计[8]。例如:

在这个式子中v是参数向量, φ (x, a) 是关于状态行为对的特征向量。Actor和Critic的更新符合马尔可夫决策过程:

这种仅仅是对常规梯度算法的估计, 需要更新两个参数向量θ和v, 其中每个参数的在下一个离散时间的更新都是线性的。

自然梯度估计是:

Gt-1是G (θ ) -1的时刻的估计, 对于t≥0, 定义:

得到递推公式:

更加一般化的表达式:

G-1t-1可以用Sherman矩阵求逆得出。

在文献[9]中, 作者证明随着时间的增长 , G-1t-1以概率1收敛到G (θ) -1.但是这种梯度算法不能保证收敛到全局最优策略。

3基于TD (λ) 的自然梯度强化学习算法

值函数估计中通常采取即时差分TD (0) 的方法, 然而这种单步TD在学习过程中, 经验传播的效率比较低, 导致收敛速度缓慢。Sutton在TD (λ) 方法中的资格迹能够把TD (λ) 的回报值沿着当前路径的反方向传播, 并且能够作到隐式的记录过程路径, 能够使经验的传播更加高效, 提高算法性能, 降低梯度估计的方差[10]。

t时刻的每个特征的迹向量取决于当前路径以及:

引入资格迹:

理误差, 加快经验的学习和传播速度。

4策略梯度算法性能仿真实验与分析

4.1 网格世界

GridWorld网格世界是在强化学习中经常被使用的模型, 如图1:

图1 (a) 中表示从开始的状态A转移到状态A’, agent可以得到+10的回报, 从B转移到B’的回报是 +5。 (b) 表示每个格子上最优值函数 (c) 表示 (b) 相应的最优策略。其中若是在单元格中的箭头表示, 对应任何其中一个动作都是最优的。实验中把Grid-World作为环境模型, 并在此基础上构造相应的状态转移方程和不同的策略梯度估计函数。

4.2 转移矩阵的构造

在GridWorld上就是构造各种状态, 动作的构造转移矩阵, 表明在某个状态下, 每个动作的概率, 并且和为1.0.规定每一个格子里面, 可以向相邻的上下左右格子进行转移, 为了简化问题, 碰到四壁并不考虑, 不同的方向有不同的概率。对角线不能相互转移, 则概率为0.0并未在图上标出。如图2所示。

还有伴随从某一个状态移动到另外一个状态的回报值R. 我们把A作为起始的位置, 目标是达到D位置。这里规定:

所以通过上面的叙述, 做成状态转移表1。

每个状态Xi被分成概率不同的三个方向的动作, 例如在A中, 执行动作a2, 就会到达B的概率, 表示A→B的概率为0.3, 因为在实际情况下有别的因素影响, 并不为1.0所以A→A, A→C, A→D在 (状态A, 动作a2) 的到达的概率分别为0.3, 0.4, 0.0. 其余动作的参数意义同样如此。对于每一个状态的概率选择都为是相同的, 在程序内部, 以srand () , 和random () 随机数实现。因为目标状态是D, 所以规定到达别的状态回报都是0, 到达网格D的回报为10。同时考虑环境中的一些不确定因素, 比如侧风等。测试环境可以看做是一个复杂情况下的网格世界。

4.3 实验结果

分别进行了NAC和TD ( λ) 算法的收敛性实验, 同时作为参照也选择了基于值函数的Q-learning ( λ) 算法, 进行分类对比, Q-learning ( λ) 算法中的采用温度衰减的softmax行为策略。

1) Q-learning ( λ) 算法

试验点数160。收敛速度:较快。方差较大。实验结果如图4所示。

2) 自然梯度Natural Actor-Critic

试验点数160。收敛速度:较慢。方差:大。结果如图5所示。

3) 最小平方差TD (λ) 强化学习方法。

试验点数160。收敛速度:较慢。方差:实验结果如图6所示。

在构建的GridWorld环境下, 实验结果表明策略梯度强化学习算法能够收敛, 但是相比较基于值函数的强化学习方法如Q-learning, 收敛速度较慢。策略梯度方法中, 回报方差是确实不稳定, 在NAC中方差较大, Q-learning和SARSA的方差的波动较小。符合之前本文提到的策略梯度的特点。

NAC策略梯度函数结果方差较大, 并且收敛速度较慢, 和原来的预期有一定的出入。

从图上也可以看出, 强化学习策略梯度的方法引入先验知识的重要性。学习开始的时候累计回报波动剧烈, 原因是按照随机概率随意选取策略导致学习初期的时间消耗较大, 并且Agent尚未探索到系统的的全部的观测到整个系统情况。

参考文献

[1]Sutton R S, Barto A G.Reinforcement learning:An introduction[M].MIT press, 1998.

[2]王学宁.增强学习中的直接策略搜索方法综述[J].智能系统学报, 2007, 2 (1) :16-24.

[3]Baxter J, Bartlett P L.Direct gradient-based reinforcement learning[J].Circuits and Systems, The 2000 IEEE International Symposium, 2000:271-274.

[4]王学宁.策略梯度增强学习的理论、算法及应用研究[D].长沙:国防科学技术大学, 2006.

[5]Amari S I.Natural gradient works efficiently in learning[J].Neural computation, 1998, 10 (2) :251-276.

[6]Peters J, Schaal S.Natural actor-critic[J].Neurocomputing, 2008, 71 (7) :1180-1190.

[7]Sutton R S.Policy gradient methods for reinforcement learning with function approximation[M].NIPS, 1999:1057—1063.

[8]Williams R J.Simple statistical gradient-following algorithms for connectionist reinforcement learning[J].Machine learning, 1992, 8 (3-4) :229-256.

[9]Bhatnagar S.Natural actor—critic algorithms[J].Automatica, 2009, 45 (11) :2471-2482.

[10]Sutton R S.Learning to predict by the methods of temporal differences[J].Machine learning, 1988, 3 (1) :9-44.

经典梯度论文篇2

一、精心梯度设计, 优化课堂结构

我们在教学过程中总有这样的体会, 有时突发一个创意, 运用到课堂上去完全没有达到预期效果。我们往往就弃而不用, 其实如果能根据学生实际在细节上做功夫, 稍加修改优化创意, 也许就会有意想不到的效果。比如在材料库的构建上, 我的设计是八分钟小组合作, 写出历史上的名人事例、改革故事, 小组合作至少写出十个, 再写在学习卡上, 张贴在黑板上, 然后每位同学按座次先后说出两个名人, 前后不得重复。此创意能激发学生思维, 开阔视野, 课堂气氛活跃。班级人力资源也得到充分利用, 让学生进行梯度形态下的思维和要素扩张, 进行多向度的训练是较为突出的一点。很多时候细节决定成败, 只要我们在梯度设计上多加思考, 就能走入“山穷水尽疑无路, 柳暗花明又一村”的境界。

二、设置梯度问题, 启发学生求知。

“学启于思, 思启于问”, 问题是思维活动的起点, 有了问题才能引起思维, 才能进行探索。因此, 教师在平时的教学中必须注重对学生问题意识的培养。引导学生怎样发现问题、提出问题、分析问题、解决问题。同时, 当发现问题的难度超过学生的知识结构和思维水平时, 可先提一些简单的问题层层递进, 步步深入, 环环相扣。学生接受能力有好、中、差之分, 整节课的内容设计一般也是由易、中、难逐步深入的。“易”、“中”类问题似乎不难解决, “难”这一部分中所包含的问题也有简单的导入性或延伸性问题。所以我们要把握好问题的设置, 同时在提问时要把握学生的接受能力, 让不同层次学生的认识沿着教师铺设好的阶梯拾阶而上, 最终让学生都能“摘到果子”。如讲授“拿破仑的对外战争”时, 教师可按如下梯级设问。有人引用恩格斯的话“反对拿破仑的普遍战争是各民族遭受到拿破仑践踏的民族意识的反映。”认为反对拿破仑的战争是正义战争;还有人根据恩格斯的话, 认为恩格斯对反对拿破仑的战争的看法发生了变化。你认为上述观点中哪些是对的?哪些不符合史实?应如何理解恩格斯这两段话?这是第一层次的设问, 以简单提问向复杂问题推进。接着又设一问:从这个讨论中可以看出我们应当怎样正确对待无产阶级革命导师的有关结论。这是第二个层次的设问, 由运用历史基础知识上升到辩证思维的训练, 这一层次显然高于第一个设问。第三个设问是:应当怎样研究历史?这一问是梯度更高的史学问题。由此可见, 设计有梯度的问题, 层层渐进, 对培养学生的问题意识发展创造性思维具有积极的作用。

三、设计梯度训练, 取得不同成效。

课堂教学的知识点有难易之分, 易中有难, 难中有易, 易与难是相对而言的。每个知识点的掌握都离不开必要的训练来巩固所学知识。根据学生对新知识掌握的熟练程度, 以及学生知识能力及理解能力的差异, 应有满足不同层次的死搬硬套题、适度变换条件题、灵活多变题和拔高升级题。老师既要征求学生意愿, 又要把握原则。有的学生暂时只会死搬硬套公式或例题, 有的学生较能灵活应用;优等生就需要有拓展性或纵横联系较广泛的习题才能激发他们的思维和作题的兴趣。所以课堂上训练题应设计三种类型, 并且同时出示易、中、难类型的题。作“易”类题的学生选作“中”类, 做“中”类题的学生选作“难”类型的题。学生也可以根据自己的情况灵活选题做。对于自觉性差的学生, 老师就要安排他们去作那一类型的题。老师检查学生训练情况的方法很多, 对于死搬硬套类题只需对答案即可;“中”类题的讲解要照顾全班学生;处理“难”类题时, 为照顾差生可以让他们再练一些“中”类题而不必听他们听不懂的“难”类题。

四、把握评价梯度, 激励学生奋发向上。

当然, 学生的各方面差异是客观存在的, 教学的梯度艺术高深莫测而又简单实在。做的好能激励全体学生比、学、赶、帮、超, 反之, 优等生也会倒退到最差学生行列中去。因此评价梯度更为重要, 这就要求教师有驾御全体学生的能力, 了解学生的耐心和精力, 绝不能冒然分档。学生的接受能力、智力因素、家庭和社会因素、学习习惯的养成, 老师在评价上要有相对应的“评价梯度”。决不能因为差生作的题简单而不屑一顾。差生作对低档题应该及时肯定, 而差生作到中档题时, 更要大力鼓励宣扬, 并适时鼓励他作中档题以次上升到中档。中、优档的学生更要鼓励他们向更高峰攀登。

总之, 我们教师要适应学生的差异, 艺术化的设计教学“梯度”, 使优等生吃的饱, 后进生吃的消。只有这样, 学生会从“要我学”向“我要学”转化;课堂上学生会从听懂学会向懂听会学转化。通过“梯度原则”的课堂设计、课堂提问、课堂训练和课堂评价, 可以启发学生积极思维, 进行自主性的学习, 可以培养学生的思维能力、探究能力和问题解决能力, 增强教学效果的目的。

参考文献

〔1〕李海涛, 2011, 《课堂教学中我的梯度教学法》

〔2〕刘燕.对话教学及其应用类型示例〔J〕.素质教育大参考, 2006. (1)

〔3〕《“问题讨论法”在历史教学中的应用》, 孙杰《中学历史教学参考》2005年第七期

〔4〕《幼儿教育》2006年07期《教学活动要有梯度》朱雪

〔5〕《中学历史教学参考》2002年第2期陕西师大出版社

梯度仿写训练篇3

1.仿词语,仿写反义词或近义词,仿词与原词的用字最好不重复。

红——丹、朱、赤、_________、_______

喜欢——钟情、钟意、________、__________

皓首——白发、龙钟、_________、_________

米老鼠——唐老鸭、__________、_________

2.仿短语,仿写语与规定短语结构和格调一致。把单词加上修饰语、补充语,或变成主语、谓语和宾语,然后进行仿写。或直接按规定的短语仿写,仿出结构相同、词义相似的短语。

玩游戏——写作业、_________、_________

听清弦——看知音、_________、__________

刺眼红——炫目白、_________、_________

红得发紫——黑得发亮、_________

七上八下——三心二意、_____________

青青的草——绿绿的叶、____________

遥遥领先——远远超出、_________

高山巍巍——碧水长长、_____________

3.对对联,根据提示将下面的对联补充完整。

(1)下面这副关于岳阳楼的对联,在横线处依次应填入的词语是:去老范一千年后,后_________先_________ ,几辈能担天下事;揽________ ,南来北往,孤帆曾系画中人。

A.悲喜八百里大湖B.乐忧大湖八百里

C.喜悲大湖八百里D.忧乐八百里大湖

(2)用一个字补充下面这副贴在书香门第的对联。

上联:忠厚传家久

下联:诗书继世_____。

(3)下面是上下联混合后的四副对联,请仔细品味,分别用线条将相应的上下联连接起来。

1笔下留有余地步

2且喜六时长见书

3好书不厌看还读

4文章不写一句空

5板凳要坐十年冷

6胸中养无限天机

7未须百事必如意

8益友何妨去复来

(4)阅读下面一段文字,回答文后问题。

古都南京,历史名城。南朝旧事、明代遗韵、民国风雨,都在这座古城留下了深深的印象,浸染出浓浓的意韵。玄武湖舒展,鸡鸣寺空灵,秦淮河的桨声灯影,夫子庙的热闹繁华,无不让人流连忘返。不少地名还可组成比较工整又非常有趣的对子。

例如:石头城对燕子矾,朝天宫对阅江楼,凤凰台对麒麟门。

请从“无想寺”“状元楼”“白马湖”三个地名中,选出最恰当的分别填在下面的横线上。

乌龙潭对_________莫愁湖对_________总统府对_________

4.仿单句,根据文段大意仿写句子。

(1)幼年时,___________;少年时,____________;青年时,我是草原奔驰的骏马;中年时,我是凭轭负重的犍牛;老年时呢?我也许就是一株数着自己凋零叶子计算光阴的秋树。

(2)朋友,你会微笑吗?微笑是一杯浓浓咖啡, ____________,____________ ,微笑是一曲动人的音乐。微笑让我们的生活充满了温馨。

(3)童年是一个谜,混沌初开,稚嫩好奇;少年是一副画,色彩绚丽,烂漫天真;青年是一首诗,激情澎湃, ___________。(限填四字)

(4)爱读书,是一种美德。世界上有大成就的人,对人类有特殊贡献的人,几乎都是爱读书的人。读书,使人思维活跃,聪颖智慧;_____________;_____________ ;读书,使入思想插上翅膀,感情绽开花蕾。

5.仿复句,补写出复句中的一个或多个单句,要分清修辞、主题、格调和事物的特征,务必与例句一致。特征描述与事物要对应相符,主要词语要对应,语气要一致贯通。

(1)春天从天外轻盈地飞了回来,化作雏燕和云雀;春天从地里悄悄冒了出来,化作草叶和芽苗;春天从________________。

(2)书是钥匙,能开启智慧之门;书是阶梯,帮助人们登上理想的高峰。___________________;_______________; _______________。

(3)故宫像一部卷帙浩繁的史书、凝结着历史的烟云,记载着岁月的沧桑,每一座殿宇楼台都承载着丰富的文化,____________。

(4)如果你能使一朵花儿快乐,不用自己的手随意折毁它,那么鲜花也会使你快乐,在你苦闷烦恼时为你送上一束醉人的温馨;如果你能使一条小溪快乐,不把生活的污秽抛向它,那么小溪也会使你快乐,在你口干舌燥时为你送来一捧甜蜜的甘露 ;______________ ,______________ , ______________。

答案示例:

1.略 2.略

3.(1)B (2)长或远 (3)16;72;38;54 (4)乌龙潭对白马湖,莫愁湖对无想寺,总统府对状元楼

4.(1)我是枝头雀跃的小鸟,我是天际悠悠的白云。(2)微笑是一片遮阳的绿阴,微笑是一句温暖的问候。(3)乐观自信、浪漫潇洒、热情开朗等。(4)读书,使人胸襟开阔,豁达晓畅;读书,使人目光远大,志存高远。

聚焦科学活动的梯度篇4

一、呈现梯度材料，提供探究线索

根据幼儿能力的差异，我提供了不同层次的材料，让幼儿自主选择适合自己的活动材料来参与科学探究活动。比如，在科学活动“比较轻重”中，我投放了两个层次的材料：第一层次是相同材质的物体比较轻重，如两本书、两块积木等；第二层次是不同材质的物体比较轻重，如大塑料瓶与小玻璃瓶、铁块与棉花等。幼儿操作第一层次的材料时没有出现问题，但在操作第二层次的材料时出现了这样一种错误认识：体积大的物体重，体积小的物体轻。针对这一问题，我在操作区里专门投放了体积小而重的物体和体积大而轻的物体。通过反复操作这些物体, 幼儿逐渐了解到物体轻重与物体大小之间的关系, 得出了一个比较科学的概念:大的物体不一定重, 小的物体不一定轻。

在幼儿学会了比较两个物体轻重的基础上, 我又在操作区投放了三个层次的材料, 并在每一层次的材料上编有难易程度的标记及奖励等级, 供幼儿自由选择探索:第一, 对三个物体的轻重进行排序;第二, 对五个物体的轻重进行排序;第三, 摆放物体使天平两端平衡。幼儿各自根据自己的现有水平选择合适的操作材料, 边做实验边记录。梯度性地投放活动材料, 有利于幼儿在各种经验中建立一种内在联系, 加速幼儿对经验的整合和提高, 使之变成自己能力结构中的一部分。

二、设计梯度目标，明确活动方向

科学活动目标的设计要关注幼儿的“最近发展区”，保证活动目标既不简单重复原有经验又能产生一定的新经验。因此，我根据幼儿的年龄特点从两个方向设计梯度性的活动目标：一是向深度挑战，从纵向上对原有经验进行概括和提升；二是向广度挑战，从横向上对幼儿原有经验进行拓展。比如，在探究“水”的科学活动中，我根据不同年龄段幼儿的认知发展特点，精心设计了有梯度的活动目标：1.小班《好玩的水》。以“利用各种感官，体验、探索水的基本形态特性”为活动目标，开展玩水、戏水、画水、说水等各种活动，引导幼儿初步感知水的基本特征（无色、无味、透明、流动、能够融化某些物质……）。2.中班《有趣的水》。以“调查、探索水的存在形式和变化特征”为活动目标，让幼儿了解水在自然中的存在形式（江、河、湖、海、泉、溪、井……）和水的特性（流向、沉浮、水质……）。3.大班《神秘的水》。以“探索实验、感知理解水的相关物理特性”为活动目标，让幼儿探索水的三态变化（冰、气、水）与温度之间的关系，以及水的其他表现状态（雾、霜、冰雹……）和物理特性（张力、压力、折射……）。

我用不断深化的层次目标引领各年龄段的幼儿，有目的、有步骤地从不同的角度，运用不同的手段，观察、了解“水”，激发他们的想象力及初步发展的逻辑推理能力，从而使他们的经验在深度上和广度上都得到了拓宽。

三、实施梯度评价，激活动态发展

起飞转弯爬升梯度损失分析篇5

飞机不同坡度下的转弯梯度损失值应按照制造商手册中给出的数据处理[2],飞机制造商在其性能手册中给出转弯坡度与梯度损失的关系图: 空客飞机在Airbus Flight Manuel中给出,波音飞机在Performance Engineer Manuel中给出[3]。图4、图5中实线部分是波音手册中的转弯梯度损失修正用图[3]。它只是考虑了不同襟翼情况下的梯度损失随转弯半径的关系,忽略了其他影响因素。现用气动原理和数值拟合的办法推导梯度损失计算公式,并分析其影响因素。计算结果可以用于单发或正常离场程序设计、机载的飞行性能快速计算以及四维航迹预测[4]。

1 爬升梯度分析

爬升梯度是飞机单位时间内爬升的高度h与飞过的地面距离d的比值,通常用C. G ( climb gradient) 表示。如图1所示C. G = h / d,θ为爬升梯度角。

对飞机爬升状态进行受力分析可得到飞机爬升时的动力学方程[5—7]( 图2) 。其中各字符表达含义为: L为升力; D为阻力; W为重力; FN为发动机推力; dv为速度的改变; dt为时间的改变。

由式( 1) 和式( 2) 前试得

按爬升率( r/c,rate of climb) 定义代入上式,得

将dv/dt=dv/dhdh/dt代入并经整理后得爬升率公式为

由C. G = ( r/c) /v ,得爬升梯度公式为

式( 6) 中V/gdv/dh表示飞行速度随飞行高度的变化率,称为加速因子。民用飞机在起飞爬升中,一般保持等表速飞行,加速因子变化非常小。

2 转弯气动特性分析

飞机平飞转弯时[8—10]( 图3) ,升力Lturn垂直机翼斜向上,升力的水平分力产生向心力使飞机转弯,竖直分量L与飞机的重量抗衡,保持飞行高度,Φ为转弯坡度角。

由 LturncosΦ = L ,则

即

升力的侧向分力LturnsinΦ会产生两个效果: 为飞机转弯提供向心力和使飞机侧滑。如式( 9) 所示,如果飞机在转弯中侧向分力与向心力不协调,会出现使飞机侧滑的作用力,为了避免侧滑通常需要调整方向舵实现协调转弯。

假设无侧滑,其中m为飞机质量,R为转弯半径,aτ为切向加速度则maτ= 0,可得到:

3 转弯爬升分析

平直飞行时,飞机的L = W,而转弯时L > W,是为了使飞机不掉高度,升力竖直分力要维持重量的大小,因此与平直飞行相比升力增大,故需增大迎角α,从而带来阻力增大。由梯度公式式( 6) 可知,阻力增大必然带来梯度损失,梯度的损失是由于转弯时阻力的增量( ΔD = Dturn- D ) 造成的。

如果总阻力用零升阻力 ( D0) 与诱导阻力( Di)之和来表示,即D = D0+ Di,则:

式( 1) 中CD为阻力系数,CD 0为零升阻力系数,CD i为诱导阻力系数,CL为升力系数,A为修正系数。

转弯时,气动外形没有发生变化,把式 ( 12)ΔD = Dturn- D ,整理可得到:

再由式( 8) 得

则

再由式( 8) 和式( 11) 得到

因此,转弯爬升的梯度损失与转弯的坡度角、转弯前的升力系统和加速因子有关。转弯坡度角越大,梯度损失越大; 转弯前的升力系数越大及转弯前攻角越大,梯度损失越大; 如果加速转弯爬升时,采用等表速飞行,随着高度增加,空气密度减小,使得真空速增大,则加速因子大于1,爬升梯度损失更大,这是由于发动机产生的推力用于增大了飞机的动能,使得飞机的势能增加量减小。

如果采用等半径转弯方式转弯时,由式( 11)可得

在转弯爬升过程中,根据升力公式和式( 18) ,整理得

可见梯度损失会随半径的增大而减小,速度的增大而增大。

4 转弯爬升对应重量限制

起飞时如果受到爬升梯度限制或越障限制要求飞机至少到达某个最小梯度才能保证飞机安全飞行,此时对应的重量为爬升限重或障碍物限重。根据梯度公式式( 6) ,该重量与最小梯度相关。如果此时飞机进行转弯,为了保证安全,不能减小梯度,而造成了转弯的梯度损失。

设C. Gmin为受爬升或障碍物限重时对应的最小梯度,对于双发飞机第二爬升段为2. 4% ,我国标准仪表离场程序要求保持最小爬升梯度3. 3% 。

由 C. G - ΔC. G ≥ C. Gmin,则

整理得到

可见,转弯坡度角越大,飞行重量要求越小。

5 实例计算

为了求得修正系数A采用最小二乘法对升力系数和阻力系数进行拟合。现以B737机型性能工程师手册为基础数据进行拟合和对比,以低速机翼收上为例。

原极曲线数据如表1。

设

由方程MTMX = MTb,可解出X,从而得

即修正系数A = 0. 044 45。代入式( 18) 。γCL取值不同,会计算出不同的%C. G随Φ的变化关系曲线,通过多次拟合实验,当系数γCL= 1. 1时,函数曲线与波音性能工程师手册中的曲线最接近[3],其平均偏差为0. 16% ,标准偏差为0. 46% 。如图4所示。实线为性能手册提供的试飞数据,“+ ”标记为采用本方法的拟合数据。

γCL= 1. 1,其中γ是加速因子的倒数,近似为1,因此可认为CL≈1. 1,。由表1可知,在襟翼收上时可用的最大升力系数即为1. 1。飞机生产商在飞机的性能工程师手册中制作的数据为了保证飞行的安全性和适航性,通常采用保守策略,在梯度损失随转弯角度的变化关系曲线中,CL的影响因素取最大值,使得相同转弯角Φ时,梯度损失%C. G最大。在运行时,经过图表中的梯度损失修正后得到的爬升梯度如果能满足第二爬升段梯度或越障要求,则实际飞行时,由于飞行员不会采用最大升力系数飞行,梯度损失比图表数据小,因此爬升梯度大,安全余量大。

表2和图5是对不同襟翼情况的拟合,γCL对应的数据几乎都是可用的最大升力系数。

如果采用等半径转弯方式转弯时,由式( 19) ,假设爬升梯度角不变,根据式( 2) L = Wcosθ,且爬升时θ很小,则cosθ = 1 ; 通过绘图可直接得到半径与坡度角的关系,进而可得到梯度损失,图6所示。

6 结束语

通过气动原理和极曲线数值拟合关系推导出了飞机在转弯爬升时的梯度损失随转弯坡度角或转弯半径的变化关系,与试飞数据相比,计算结果平均偏差不超过0. 73% ,标准差不超过1. 54% 。发现了波音公司爬升梯度损失数据是按最大升力系数的保守形式计算的。

该计算方法为转弯离场限重计算提供了理论基础。可用于单发离场程序设计中障碍物修正高度( 障碍物修正高度 = 原障碍物高度 + 梯度损失×转弯飞行时所经过的水平距离) 的快速计算和机载软件程序的设计计算,为我国大飞机性能手册的制作提供了参考。也可以用于飞机机载电子设备性能参数的快速计算或用于预测飞机的四维航迹。

摘要：起飞转弯爬升会降低飞机的爬升能力,影响起飞安全,为了保障越障安全,需要详细确定梯度损失。通过动力学模型推导出转弯爬升时的梯度损失计算公式,揭示了试飞数据内在原理,分析了固定坡度角转弯、固定转弯半径转弯的梯度损失影响因素和转弯对起飞限重的影响。利用最小二乘法拟合了极曲线参数,计算了某机型的梯度损失数据,与试飞数据相比,计算结果平均偏差不超过0.73%,标准差不超过1.54%。可用于飞机离场程序设计、飞行性能的快速计算以及四维航迹预测。

关键词：梯度损失,爬升梯度,转弯爬升,飞机性能

参考文献

[1] 耿建中,武虎子,段卓毅.目标跟踪中飞机无坡度转弯操纵方法研究,科学技术与工程,2012;10,12(30):7960—7965Geng J Z,Wu H Z,Duan Z Y.Research on the control methods of an aircraft no bank turning during target tracking.Science Technology and Engineering,2012;12(30):7960—7965

[2] 民航局飞行标准司.飞机起飞一发失效应急程序和一发失效复飞应急程序制作规范.北京:中国民航管理局,2013Flight Standards Division.Production specification of airplane emergency takeoff procedures and missed approach procedures in one engine failure.Beijing:Civil Aviation Administration of China,2013

[3] Boeing D632A804,Performance engineers manual for 737-800/CFM56-7B27.Boeing Commercial Airplane Group,1998:15—36

[4] 李海峰,吴喜萍.基于BCOP的终端区的四维航迹预测研究.武汉理工大学学报(交通科学与工程版),2012;36(6):1209—1211Li H F,Wu X P.Terminal area 4D trajectory prediction model based on BCOP.Journal of Wuhan University of Technology(Transportation Science&Engineering),2012;36(6):1209—1211

[5] 陈治怀,谷润平,刘俊杰.飞机性能工程.北京:兵器工业出版社,2006Chen Z H,Gu R P,Liu J J.Airplane performance engineering.Beijing:Arms Industry Publishment,2006

[6] 张志刚,王百争,王和平.MA60飞机高原机场起飞性能研究.飞行力学,2006;24(4):65—69Zhang Z G,Wang B Z,Wang H P.Research on take-off performance of the MA60 aircraft at plateau airport.Flight Dynamics,2006;24(4):65—69

[7] Slater G L.Adaptive improvement of aircraft climb performance for air traffic control applications.Proceedings of the 2002 IEEE International Symposium on Intelligent Control Vancouver,Canada 2002:602 —607

[8] 任志强,范国星.飞机盘旋/转弯机动研究.飞行力学,2010;28(2):24—27Ren Z Q,Fan G X.Aircraft spiral/turning maneuver research.Flight Dynamics,2010;28(2):24—27

[9] 陈海,王新民,焦裕松,等.无人机覆盖路径规划中转弯机动的运动学分析.飞行力学,2010;28(2):31—34Chen H,Wang X M,Jiao Y S,et al.Kinematics analysis of UAV turning motion in coverage path planning.Flight Dynamics,2010;28(2):31—34

【经典梯度论文】推荐阅读：

梯度教学论文08-01

梯度方向直方图特征论文06-28

压力梯度05-25

写作梯度07-09

应力梯度08-01

梯度系统08-15

梯度利用08-19

海拔梯度09-06

梯度训练算法06-07

梯度渐进理论08-28

>> 查看更多相关文档