参数比较法(精选8篇)
参数比较法 篇1
通常, 对于经典Gauss-Markov模型, 参数的最小二乘估值具有无偏且方差最小的优良性质, 因此, 在过去近两个多世纪里, 最小二乘估计一直被当做是优良估计而被广泛应用。然而, 当参数估计系统存在病态性时, 参数LS估计性质会明显变坏, 参数的估值质量难以保证[1]。所谓病态性, 是指由于观测结构不好, 观测信息量缺失, 导致参数估计的不稳定, 结果严重偏离真实值的现象。病态性广泛存在于现代测量的诸多领域, 如GPS精密快速静态定位、大地测量反演、GPS高程拟合、坐标转换模型求解、重力场向下延宕、变形监测数据处理等领域都存在病态问题。因此, 分析测量平差中病态性的实质、克服或减弱病态性对测量平差的影响、取得更为准确的参数估值和可靠的平差成果, 是现代测量误差理论及数据处理研究所面临的一个重大课题[2]。病态问题的处理, 需要解决三方面的主要问题: (1) 病态性的诊断方法; (2) 克服或减弱病态性的理论和方法; (3) 病态系统参数估计方法。本文假定系统病态性已经存在时, 研究利用岭估计进行参数求解的问题。目前, 病态模型的求解方法大致分为两类: (1) 基于法矩阵的有偏估计方法; (2) 直接解算方法[2~7]。岭估计是较早发展起来的一种最有影响的有偏估计, 当系统病态时, 岭估计可以改善最小二乘估计。岭估计应用的核心问题是岭参数的选取, 不同的岭参数估值差异较大。本文着重比较当前几种最常运用的岭参数确定方法以及它们对LS估计的改善效果。
1岭估计及其解算原理
设有观测方程为:
则众所周知, 式 (1) 的最小二乘解为:
当ATPA病态时 (关于病态性的诊断方法详见文献[1]、[3]) , 微小误差会引起LS解出现不稳定甚至扭曲, 由于测量中观测噪声不可避免, 导致X^LS与其准确值差异较大, 此时估计结果不可信。
根据Tikhonov正则化原理, 对应式 (1) 岭估计的估计准则为[8]:
式中:
以上两式顾及式 (1) , 对式 (3) 中的求导, 得到岭估计的解为:
一般认为, 系统的病态性主要是因为法矩阵至少存在一个很小的特征值造成的。与最小二乘解相比, 式 (5) 右端求逆部分增加了αI这一项。法矩阵的特征值由λ1, λ2, …, 变为λ1+α, λ2+α, …, λt+α, 法矩阵最小特征值接近于零的程度就会有所改善, 法方程的病态性得到抑制, ATPA+αI求逆变得正常, 因而能得到可靠的估值。有关岭估计的一些统计性质请参阅文献[3], 鉴于篇幅, 此处不再给出。
2岭参数确定方法
设最小二乘估计和岭估计的偏差分别为V和VLS, 且他们的范数分别为‖V‖和‖VLS‖, 则根据文献[3]有:
目前常用的岭参数确定方法有三种, 它们是岭迹法、广义交叉核实法 (GCV) 和L曲线法 (L-C) 法。以下分别给出其确定岭参数的原理及相关计算公式:
2.1岭迹法
2.2 GCV法
GCV法思想是首先选取α所得到的拟合曲线, 用此曲线进行预测, 使所有预测点上的均方误差最小, 在应用时, 轮换去掉一点, 用剩下的点进行估计来预测该点, 得到所谓交叉核函数, 求可以使交叉核函数最小的α即可。GCV核函数为:
式中:H (α) +A (ATPA+αI) -1ATP, 通常称为帽子矩阵;n为观测值个数;I为n阶单位阵;tr为矩阵的求迹符号。根据式 (7) 求解的最小值α就是GCV法所确定的岭参数。
2.3 L曲线法
3 算例分析
从表2结果可以看出, 当法方程病态时, LS估计结果明显不如岭估计, 说明岭估计在均方误差意义下确实改善了LS估计结果。但就岭估计而言, 不同岭参数所得估计结果也有比较明显的差别, 说明岭参数的最优确定仍然是值得研究的课题。另外, 本例还采用试探法随机选取岭参数, 当选取岭参数α=0.655时, 结果得到了明显优于其它岭参数的估计结果, 说明, 当前所采用的几种岭参数确定方法所给出的岭参数不是最优的, 仅仅是给出了相应的严密数学方法而已。
4 结论
岭估计是一种病态模型解算的较好的方法, 其应用的核心问题是岭参数的确定, 不同岭参数对岭估计结果影响较大。当系统病态时, 选定合适的岭参数可以较好地减弱病态性对估计结果的影响, 但是, 目前几种岭参数确定方法 (L曲线法、GCV法、岭迹法) 给出的岭参数不是最优的, 而是采用严密数学方法给出了近似最优的岭参数。因此, 单纯从模型解算的纯数学手段解决病态问题是值得商榷的, 实践中, 探讨避免或减弱病态性的理论和方法更加重要。
摘要:当平差系统病态时, 最小二乘估计由于法矩阵求逆不稳定而得不到可靠解。岭估计作为一种有偏估计, 可以改善病态性对最小二乘解的影响。岭估计应用的核心问题是岭参数的选取问题。通过算例比较几种岭参数确定方法以及对应的岭估计对最小二乘估计的改善效果得出, 单纯从纯数学手段解决病态问题对结果影响的做法是值得商榷的, 实践中, 探讨避免或减弱病态的理论和方法更加重要。
关键词:岭参数,确定方法
参考文献
[1]卢秀山, 冯遵德, 刘纪敏.病态系统分析理论及其在测量中的应用[M].北京:测绘出版社, 2007.
[2]归庆明, 郭建峰.病态平差模型直接解算方法的研究[J].大地测量与地球动力学, 2004, 24 (1) :15~18.
[3]黄维彬.近代平差理论及其应用[M].北京:解放军出版社, 1992.
[4]樊功喻.主成分与主成分估计[J].测绘工程, 1995, 14 (4) :2~6.
[5]叶松林, 朱建军.矩阵奇异值分解与广义岭估计及其在测量中的应用[J].中国有色金属学报, 1998, 8 (1) :160~164.
[6]王振杰, 欧吉坤.一种新的病态问题奇异值修正方案及其在大地测量中的应用[J].自然科学进展, 2004, 4 (6) :672~676.
[7]吴俊良, 刘飞.病态线性模型的控制模型设计及其迭代算法[J].控制与决策, 2004, 19 (11) :1315~1317.
[8]王振杰.测量中不适定问题的正则化解法[M].北京:科学出版社, 2006.
[9]王振杰, 欧吉坤.用L曲线法确定岭估计中的岭参数[J].武汉大学学报, 2004, 29 (3) :235~238.
参数比较法 篇2
3.2.2 起跳能力的比较分析
助跑速度只是为创造高水平成绩提供了可能性,但不是决定跳远成绩的唯一因素。为了能跳越更远的水平距离,还必须将助跑和起跳很好的结合起来,做到起跳时既要保持助跑所获得的水平速度,又要重视发挥垂直 速度,以获得较大的腾起速度和适宜的腾起角,这就需要具有与高速助跑相适应的起跳能力。由统计可知,第 6 届世锦赛男女跳远选手的起跳垂直速度和腾起角平均值分别为3.41m/s、3.11m/s和21 °、21.33°。其中 男子跳远第一名获得者佩德罗索,女子第二、 第三名获得者赞瑟欧及梅等人,在保持较高助跑水平速度的前提 下,起跳阶段也获得了相当高的垂直速度和适宜的腾起角(23°左右),分别为3. 86m/s、3.48m/s、3.32m /s和24°、24°、23°, 表现出极强的起跳能力。而对照第8 届全运会男女跳远决赛选手垂直速度和腾起角平均值仅分别为3.10m/s、2.86m/s和18.94°、19.55°,其差值男子为0. 31m/s、2.06°,女子为0.25m/ s、1.78°。可见, 我国选手与世界选手在腾起垂直速度和腾起角度上有明显的`差异,其原因除绝对速度和起 跳技术相对较差外,主要与起跳能力较弱有一定关系。由于我国选手的快速起跳能力还没有与助跑速度利用率 的提高同步,在快速助跑中跳不起来,腾起角太小,不能充分发挥水平速度的作用。特别是我国男子在腾起水平速度大于世界选手0.06m/s时,因腾起垂直速度的差异致使跳远成绩相差0.36m。据前苏联跳远教练员费・勃 ・波波夫研究发现, 跳远运动员的助跑速度每增加0.2m/s或增大腾起角度1°时运动员的起跳力量需要增加2 %。因此,针对我国选手绝对速度能力的现状, 要在重点提高腾起水平速度的同时,着重提高腾起垂直速度。 而要提高腾起垂直速度就必须提高我国选手的快速起跳能力。因此,加强与跳远运动员起跳能力有关的专项力 量训练,使起跳能力与助跑速度利用率的提高相适应,是今后提高我国跳远成绩的关键。
3.2.3 踏板准确性和落地动作比较分析
尽管助跑速度及起跳能力等技术环节对跳远成绩和比赛胜负有着非常重要的作用,但有时它们之间并非成 正比关系。随着跳远技术的发展和水平的不断提高,当今世界大赛跳远选手水平已相当接近,许多有实力的选 手往往会因助跑准确性不高或落地动作不佳造成距离损失,只相差几厘米,便与奖牌失之交臂或失去较好的名 次。由统计显示,第6 届世锦赛男女跳远决赛选手有效距离(起跳脚的脚趾至落地脚的最近点的水平距离)平均值分别为8.43m和7.02m,而正式成绩平均值仅分别为 8.12m和6.81m, 因踏板不准确和落地动作不佳而总损 失距离(包括着地损失的距离、跳跃中的偏移和趾一板距离的总和)男子平均达0.31m,女子平均为0.21m。特 别是第8名获得者迪尔沃思,总损失距离竟高达 0.80m。这表明踏板不准确和落地动作不佳是当今世界不少优秀 跳远选手存在的较为严重的问题。而我国选手在这方面也同样存在着问题,从而影响跳远成绩水平发挥。从第 8届全运会跳远决赛有关距离参数看, 男女跳远有效距离平均值分别为7.94m和 6.68m,正式成绩平均值分别为 7.76m和6.53m,总损失距离平均值分别为0.18m和0.15m, 分别比世界男女选手平均少损失0.13m和0.06m。说明 我国选手在助跑的准确性和落地动作上优于世界选手。这是我国教练员近年来注重助跑的准确性和落地动作的 正确性等一些技术细节训练的结果。
4 结论与建议
4.1 我国跳远选手的助跑速度与世界选手相比存在着一定
生物质发电项目高参数方案比较 篇3
关键词:高温高压,高温超高压,再热系统
0 引言
国内30MW生物发电机组主要有三种不同参数的运行方式:高温高压机组、高温超高压不带再热机组、高温超高压带一次中间再热机组。本文通过不同参数的装机方案的技术、经济比选, 得出最经济合理的装机方案。
1 机组应用情况
目前, 国内30MW机组主要有三种不同参数的运行方式:高温高压机组、高温超高压不带再热机组、高温超高压带一次中间再热机组。高温高压和高温超高压技术均已经成熟, 30MW高温超高压再热技术目前尚处于开发试验阶段, 目前国内无运行业绩, 技术相对不成熟。截至目前, 已投运的30MW生物质电厂大多为高温高压机组;武汉凯迪的部分投运机组采用西门子的高温超高压30MW机组, 高温超高压带再热的30MW机组目前国内尚无投运业绩, 仅有6台在建业绩。
2 方案比较
2.1 性能比较
30MW级高温高压、高温超高压、高温超高压带再热机组的性能比较如表1。
高温超高压机组虽然节约了燃料消耗量, 但因为给水泵扬程的增加, 将增加厂用电, 生物质电厂电价较高, 就更明显减少了售电收入。因此高温超高压机组的总年费用仅节省62万元。而高温超高压带再热机组的厂用电量降低, 既增加了售电收入, 又节省了燃料, 总的年费用节省868万元。
2.2 投资比较
三种方案的具体投资比较如表2。
3 结论
从初投资以及运行经济性, 30MW高温超高压机组比同容量高温高压机组投资约高780万元, 但通过运行经济性分析, 超高压机组相比高压机组每年增加收入仅62万元, 投资需要13年才能回收, 不经济。高温超高压带再热机组投资增加2380万, 年费用节省868万, 投资在3年内能回收。但对于高温超高压带再热的机组, 目前国内已完成设计的成型机型的厂家仅有杭汽中能、东汽、南汽三家汽机厂, 锅炉也仅有济锅、杭锅有成熟炉型, 目前此方案的机组仅有合同业绩, 均没有运行业绩。此技术相对不成熟, 存在一定的技术风险。
另外如果为抽汽供热机组, 根据汽机厂计算, 高温超高压再热机组最经济的供热方式是从再热冷段管道上抽出蒸汽对外供热, 但是抽汽量不能超过50t/h, 否则会导致再热器通流蒸汽太少而过热超温。因此采用高温超高压再热机组在供热抽汽能力上会受到锅炉再热器的最小通流量的限制, 不太适合供热机组。
综合考虑, 如果是抽汽供热机组, 且抽汽量大于50t/h, 推荐选用高温高压30MW机组。如果是纯凝机组, 采用高温超高压带再热系统的机组经济性最好, 3年即可回收增加的投资, 但存在一定的技术不成熟的风险。高温超高压不带再热系统的方案无论运用在抽凝机还是纯凝机上都是相对不经济的, 不推荐采用。
参考文献
[1]李梁杰.生物质发电项目可持续性评价研究[D].北京化工大学, 2010.
[2]葛少英.生物质发电项目的可行性分析[D].华北电力大学 (北京) , 2009.
参数比较法 篇4
线性模型的最小二乘估计存在最小方差, 但是当设计矩阵的列向量之间存在近似的线性关系时, 法方程系数矩阵接近奇异, 称这种情况下的法方程为病态方程[1]。当法方程病态时, 参数最小二乘估计的性能会明显下降, 从而导致估计参数失真甚至严重错误[2,3]。病态问题在测量领域普遍存在, 分析模型的病态性质, 解决模型的病态问题, 是当前测量平差中的重要研究方向[4,5]。
在测绘领域中, 病态问题的解决办法主要有两大类, 一类是从病态观测方程直接入手进行求解, 利用奇异值分解技术直接对病态观测方程进行解算。国外研究主要有截断奇异值方法[6,7]、多种奇异值修正方案[8]等, 国内研究主要有杨文采[9]和王振杰等[5]提出的奇异值修正方法, 但这些方法在适用性方面还需要进一步深入研究。另一类是对病态法方程的求解进行优化和改进。这一类包含两个分支, 其中一个分支是以岭估计、广义岭估计等为代表的有偏估计, 其主要思想是以牺牲最小二乘估计的无偏性来换取参数估计的稳定性和参数估值的可靠性, 但结果有偏和参数确定困难是其无法克服的缺点。另一分支是以遗传算法及误差方程的正交化等为代表, 由于计算繁琐, 在实际工作中应用不便。
上述的两大类算法都存在计算复杂度较大的问题, 迭代算法是目前解决病态问题的有效方法之一, 并因其计算简单而在实际中得到了广泛的应用。经典的迭代法有牛顿法、最速下降法、共轭梯度法、雅可比迭代法等。这些迭代算法理论已经较为成熟, 在法方程良态时能表现出较好的性能, 但在病态线性问题中的表现却未必理想, 如经典的雅可比迭代法在遇到病态问题时便不再适用。文献[10]对雅可比迭代算法进行了改进, 使之成为一种求解病态线性问题的高效迭代法。文献[11]提出了谱修正迭代算法, 该方法克服了岭估计结果有偏的缺点, 并且能够保持法方程的稳定性。
为了解决测绘领域中的病态问题, 同时克服现有算法的缺点, 本文将最速下降法、共轭梯度法、谱修正迭代法、改进的雅可比迭代法等引入到测量数据处理中。分为良态和病态两种情况, 在应用实例中对各种算法的计算结果进行了比较, 并通过对结果的分析, 选择出适合解决测绘领域中病态线性模型的参数估计问题的实用算法。
1 几种解算方法简介
迭代法的优点是迭代计算简单, 对初始点要求不高, 计算程序的实现比较容易, 所以在实际求解问题中非常简单实用。本文引入了最速下降法、共轭梯度法、谱修正迭代法和改进的雅可比迭代法等几种迭代算法, 其原理分别进行简要介绍如下。
1.1 雅可比迭代法及其改进
在处理病态问题的多种方法中, 雅可比迭代法是解线性方程组的一种有效方法。但当方程组的系数矩阵为病态时, 该方法不再适用。针对上述问题, 文献[10]提出一种改进的雅可比迭代算法, 给出了一种求病态线性方程组解的高效迭代算法, 该算法不仅具有传统雅可比迭代法的各种优点, 同时对病态线性模型的参数估计性能优越。
(1) 传统的雅可比迭代法
测量数据处理中存在诸多病态线性方程组, 一般为如下形式:
其中A∈Rn×m, 且A为非奇异矩阵, b∈Rn, 线性代数方程组Ax=b有解的一阶定常迭代法x (k+1) =Bx (k) +f, 其中B= (bij) ∈Rn×n。若J为雅可比法的迭代矩阵, 则有:
式 (2) 中D、L、U分别为:
雅可比迭代法的矩阵形式为:
(2) 雅可比迭代的改进算法
病态线性方程组的解存在较大误差, 条件数cond (A) 可用来衡量其病态性的严重程度, 当cond (A) >>1时认为严重病态。此时, 传统的雅可比方法不再适用, 需要加以改进, 文献[10]提出的雅可比迭代改进算法简要介绍如下:
令A=D+M, 则Dx+Mx=b, 在两边同时加上ωFx (ω>0) , 则变为:
迭代格式为:
其中D同前, M为:
设
其中, fi的取值可有以下两种形式:
1.2 谱修正迭代法
在文献[11]中提出了一种简便的迭代方法———谱修正迭代方法, 其迭代公式为:
则迭代公式可写为:
可以看出谱修正迭代法的计算是非常简单的, 实验结果也表明谱修正迭代法估计结果是无偏的, 其估值精度优于岭估计, 并且理论严密, 计算过程无人为干扰因素, 同时可以给出参数估值的协因数矩阵, 便于进行精度评定。
1.3 最速下降法
最速下降法又称为梯度法, 是其它一些重要方法的基础。该方法在每步迭代中, 沿负梯度方向进行搜索。其基本思想是:设无约束最优化问题中的目标函数为f (x) , 且f (x) 一阶连续可微, 从当前点xk出发, 搜索方向pk为目标函数f (x) 在点xk处下降最快的方向, 这样便于以最快速度达到极小值。其解析方法是利用函数的解析性质构造迭代公式使之收敛到最优解。
由f (x) 的Taylor展开可知:
略去t的高阶无穷小项不计, 可见取pk=-f (xk) 时, 函数值下降最多。
最速下降法的迭代公式为:
其中, 搜索方向dk=-f (xk) 也称为最速下降方向;搜索步长λk取最优步长, 即满足f (xk+λkdk) =minf (xk+λdk) 。
1.4 共轭梯度法
共轭梯度法是由Hesteness和Stifel于1952年为求解线性方程组而提出的, 后来用于求解无约束最优化问题, 它是一种重要的数学优化方法。该方法的基本思想是把共轭性与最速下降法相结合, 利用已知点处的梯度构造一组共轭方向, 并沿着此组方向进行搜索, 求出目标函数的极小点。
对于一般无约束最优化问题的共轭梯度法形式为:
(1) Fletcher-Reeves公式
(2) Dixon-Myers公式
(3) Polak-Ribiere-Polyak公式
2 实例应用与结果分析
下面针对平差问题中的良态、病态等情况, 利用高斯约化法和本文介绍的几种方法 (最速下降法、共轭梯度法、谱修正迭代法和改进的雅可比迭代法等) , 通过实际算例分别进行讨论。
2.1 实例1:法方程良态的平差问题
本例取自文献[17]第130页中的例7-9。在该三角网坐标平差中, 得到的法方程为:
经计算得该法方程系数矩阵的条件数为2.7147, 为良态方程。利用本文介绍的几种方法分别进行计算, 其结果列于表1。
在表1中, 若将高斯约化法的解算结果看作真值, 其余几种算法的解算结果与高斯约化法的结果基本一致, 以参数估值与模拟真值之差的2范数 来衡量解算结果的优劣 (最末一行) 。可以看出, 雅可比迭代的两种改进算法的计算结果均与高斯约化法完全一致 (相差0.0000) , 谱修正迭代法和最速下降法略有差异 (0.0003和0.0005) 。由以上结果可知, 当平差问题中的法方程为良态时, 本文介绍的几种算法均能得到与高斯约化法基本相同的计算结果。
2.2 实例2:法方程病态的平差问题
本例取自文献[10], 其中的法方程为:
本例中法方程系数矩阵的条件数为79770, 为严重病态方程, 扰动常数项取为[2.090 3.7656.656 7.684]T。利用本文介绍的几种方法分别进行计算, 计算结果列于表2。
在表2中, 几种方法的参数估值与真值 (X=[1, 2, 3, 4]') 之差的2范数分别为:31.8262 (高斯约化法) 、0.3499 (最速下降法) 、0.3499 (共轭梯度法) 、0.3415 (谱修正迭代法) 和0.0605 (雅可比改1) 、0.0463 (雅可比改2) 。由以上计算结果可知, 当法方程为病态方程时, 本文介绍的几种算法均显著优于高斯约化法, 其中两种雅可比改进方法的改善效果更为明显。
通过以上两个算例的分析可知, 无论法方程良态还是病态, 雅可比迭代的两种改进算法的计算结果都非常接近参数真值, 有效地克服了传统雅可比迭代不能解算病态问题的缺陷, 而且在解算结果中比其他一些迭代算法的结果更优。
同时, 由于在计算过程中, 改进的雅可比迭代法能够使用统一的计算程序来进行运算 (法方程为良态和病态时均可使用相同程序) , 这样便提高了计算程序的通用性, 非常值得在实践中推广应用。
3 结束语
病态问题广泛地存在于测量数据处理领域中, 是一项重要的研究课题。本文将几种算法应用于线性病态参数估计中, 得到了良好的计算结果。在良态法方程平差问题中, 本文介绍的几种迭代算法均与高斯约化法高度一致;在病态法方程平差问题中, 引入的几种迭代算法都比高斯约化法更加接近真值, 尤其是雅可比迭代的两种改进算法效果更加明显。因此, 雅可比迭代的两种改进算法具有很强的实用性。同时, 上述几种算法还大大增强了数据处理程序的通用性, 在处理线性问题时, 不用考虑其法方程是否病态, 可用统一的程序来计算。随着对测量数据处理领域中病态问题研究的不断深入, 将数学与平差理论紧密融合成为处理该问题的趋势, 在今后的研究和应用中, 还会出现许多新的问题需要解决, 需要不断总结和借鉴已有的处理方法。
摘要:在测量数据处理中, 当法方程为病态时参数最小二乘估计的性质会发生改变, 此时传统的解算方法难以得到理想结果。为了有效解决该问题, 本文引入几种迭代算法, 并通过两个实际算例比较了几种方法在良态、病态等不同情况下的应用效果。计算结果表明, 在良态情况下, 本文介绍的几种方法与传统方法结果一致;在病态情况下引入的几种方法均优于传统算法, 尤其是改进的雅可比迭代法的性能尤为突出。
参数比较法 篇5
现实中很多的时间序列的变化都会呈现出一种长记忆性的现象, 如水库的蓄水量、食品价格等。Mandelbrot等最先通过建立数学模型——带Hurst指数的分形布朗运动, 刻画了这种有趣的现象[1,2]。
到目前为止已经提出了多种估计分形布朗运动参数的方法, 重标极差 (R/S) 分析方法首先由Hurst[3]在1951年为了更好地描述尼罗河水库的长期贮存能力而提出的, 并建立了Hurst指数作为判断时间序列数据遵从随机游走还是有偏的随机游走过程的指标, 并由Mandelbrot[2]于1971年应用到金融时间序列分析中, 此后成为了应用于时间序列的分形特征的有效研究方法之一。为了克服经典R/S分析方法无法分辨短期相关性与长期相关性的缺点, Lo在经典R/S分析的基础上给出了修正的R/S分析方法 (简称MR/S) [4]。Moody研究发现MR/S方法的修正值对短期记忆太过敏感从而导致Hurst指数估计失真, 认为该方法就是有偏的[5]。在MR/S方法的基础上, Giraitis等用样本序列累积离差的方差代替MR/S分析中的极差, 提出了V/S分析方法, 并从理论和仿真实验角度说明了V/S方法比MR/S方法更具稳健性和有效性[6]。Peng等在研究DNA组织时扩展了普通的波动分析方法, 得到了DFA方法, 它在消除时间序列局部趋势及发现局部相关性方面比R/S及MR/S方法更优[7]。正如Chronopoulou和Viens[8]所说, 传统的R/S与MR/S等非参数估计法只能判别时间序列的是否具有长记忆性, 且对长记忆性强弱Hust指数的估计有较大的偏差。而Whittle估计法[9]是一种基于极大似然的参数估计法, 该方法比前面提到的常用的几种方法更适合用于统计推断, 而且更高效。
目前在研究分形布朗运动、时间序列长记忆性时主要运用经典R/S、MR/S、V/S、DFA (Detrended Fluctuation Analysis) 等分析方法, 徐龙炳等利用R/S算法分析中国股市, 得出其具有非线性的特征[10]。基于经典R/S方法, 王春峰等研究了中国股市的长期记忆性, 认为中国股市还不是一个效率市场[11]。胡彦梅等采用MR/S算法分析了中国股市记忆性, 结果表明在0.05的显著水平下沪深股市的日收益序列均无长记忆性[12]。通过对上证A、B股市的日收益序列进行V/S分析, 何兴强等得出了A、B股市场收益均不存在显著的长期记忆性[13]。郝清民则采用ARFIMA模型和R/S分析方法对股指与个股的收益率序列关系进行了长记忆性研究[14]。
虽然以上很多学者对中国股市的有效性和长记忆性强度进行了多方面的分析, 但他们均是对中国股市的总体有效性进行的研究, 都得出了中国金融市场是一个弱式有效市场的结论[15,16]。但关于中国自证券交易市场成立运行以来, 其20多年的市场发展状态却少有人研究。而对于Hurst指数估计的研究中, Whittle分析方法作为一种更稳定更有效的分析方法亦鲜有人研究。
基于这两点, 本文首先通过蒙特卡罗仿真实验, 通过比较不同估计方法的估计结果说明Whittle分析方法的优越性。基于该方法, 结合移动窗口技术 (rolling widows) , 对中国证券市场的历史发展状态进行研究, 得出中国证券市场的有效性更趋变强, 长记忆效应更趋变弱的结论。
1 估计方法
下面, 本节介绍估计Hurst指数的五种著名方法, 包括R/S法、修正R/S法、V/S法、DFA法、基于极大似然Whittle法。
1.1 R/S分析方法
重标极差 (R/S) 分析方法的思路是: 设si (i=1, 2, …, N+1) 为一时间序列的N+1个连续值, 将取对数并进行一次差分后的N个数据xi (i=1, 2, …, N) 划分为长度为L的相邻的子区间Lm=[x (m-1) L+1, x (m-1) L+2, …, xmL]′, m=1, 2, …, M, 其中M=N/L. 则每个子区间Lm的均值为
则平均重标极差为:
其中, L表示子区间的长度。
Hurst[3]推出的关系为:
其中, c为常数, H为相应的Hust指数。将上式两边取对数得到:
对logL和log (R/S) L进行最小二乘法回归分析便可以计算出H的近似值。
1.2 修正R/S分析方法
为了克服经典R/S分析方法无法分辨短期相关性与长期相关性的缺点, Lo[4]在经典R/S分析的基础上给出了修正的R/S (MR/S) 统计量:
其中σ2m (q) =
其中, int[·]表示取整, ρ为序列的一阶自相关系数, N为样本数。
1.3 V/S方法
用样本序列累积离差的方差代替R/S分析中的极差, Giraitis等提出了V/S统计量[6]:
其中, xi, m表示第m个子区间的第i个的数据,
1.4 DFA方法
DFA是一种在随机过程, 混沌理论和金融时间序列分析测定信号统计自相似性的方法, 是分析金融时间序列长记忆性相关强度指数的有用工具。DFA方法首先由Peng[7]提出, 是Ordinary Fluctuation Analysis方法的扩展。
设st, t∈N为有界的时间序列, 通过求累积和的方式转化为无界过程xt, 即
1.5 Whittle估计法
Whittle估计法作为一种参数估计方法, 比前面提到的常用的几种方法更适合用于统计推断, 而且更高效。Whittle估计值可以通过以下方法得到。设令BHi (i=1, 2, …, N) 为观察到的且Hurst指数为H的分数布朗运动, 并假设θ为参数H的估计值, 同时令X1=Bθ1, X2=Bθ2-Bθ1, …, XN=BθN-BθN-1, 且ρ (k) 表示它们的协方差, 则时间序列的谱密度可以表示为:
进一步令
其中,
同时Beran和Terrin[9]证明了在一定条件下Whittle估计值
其中,
并且采用Whittle估计Hurst指数参数的95%置信区间由下式给出:
2 基于蒙特卡罗仿真模拟的方法比较
因为目前业界对各金融市场现实数据的具体分形维参数还没有一个公认的估计值, 因此本节采用蒙特卡罗仿真模拟对上一节介绍的各种Hurst指数估计方法进行比较分析。对不同的Hurst指数值H和时间序列长度N以及路径数Q, 通过调用Matlab自带的wfbm (H, N) 函数[16,17]产生Q条服从标准分数布朗运动的时间序列, 记为BHq, t (t=1, 2, …, N;q=1, 2, …, Q) 。通过转化得到Q条服从分数高斯过程的时间序列sq, t=BHq, t-BHq, t-1.应用上一节介绍的方法对Q组时间序列sq, t (q=1, 2, …, Q;t=1, 2, …, N) 进行估计, 得到Q个Hurst指数估计值Hq (q=1, 2, …, Q) 。则有
其中, H为真实Hurst指数,
注: Whittle方法是在95%的置信水平下的估计结果。
从表1可以看出, 随着样本量的增大, 各种估计方法的根均方误差趋于零, 表明样本量越大, 对Hurst指数的估计值越精确; 表中数据显示, 各种方法对真实Hust指数值变化的反应各不相同, 从标准差和根均方误差的变化来看, Whittle估计法表现的更加稳定, 而传统的R/S方法以及DFA方法的估计值均随着真实Hurst指数值的变大而变差; 而除了当真实Hurst指数值H=0.8, 样本大小N=350时, Whittle估计法的标准差略小于移动平均Hurst指数估计法外, 其余无论真实Hurst指数和样本的大小取多少, Whittle估计法都较其它方法更稳定更准确; 特别当H=0.55时, Whittle方法和DFA方法都有良好的表现, 但是R/S、MR/S以及移动平均方法均严重高估了Hurst指数值, 而V/S方法则低估了Hurst指数值, 这一仿真结果对本文后面实证研究具有重要的指导作用。
图1是使用蒙特卡罗模拟进行300次试验得到的结果。从图1可以看到, 无论样本大小N取多少, Whittle估计值曲线几乎都与真实值线重合, 表明了Whittle估计法的精确性以及稳定性。R/S分析法在样本容量N=350时, 对真值H<0.75时, 其估计值偏大;对真值H>0.8时, 其估值偏小。而随着样本容量的增加R/S分析法的性能有所提升。DFA方法表现稍好, 但是误差还是比Whittle估计法大, 而且DFA算法计算效率很差, 是这几种算法中耗时最长的。MR/S分析法和移动平均方法与R/S分析相同, 没有质的区别, 也是高估小的真值而低估大的真值。而V/S方法则一直呈现出低估真值的现象。
从这些分析结果可知, 在估计Hust参数值时, Whittle估计法克服了传统R/S、MR/S、V/S和DFA等方法的缺陷, 使得估计值具有了更高的精度和更稳定的估计结果。因此本文使用Whittle估计法对沪深股指进行实证分析应用。
3 实证分析及方法应用
本节将采用经过蒙特卡罗仿真模拟证明的精度和稳定性更好的Whittle方法进行实证分析应用。
3.1 数据选择及统计特性分析
鉴于我国学者多使用沪深两市股指数据进行长记忆性分析, 为了方便比较分析, 本文采用上证指数和深圳成指的日收盘价为研究对象, 时间分别选取1990年12月19日至2011年1月14日和1991年4月3日至2011年1月14日, 上证指数有4904个样本, 深圳成指有4874个样本, 数据来源于聚源数据库。对数收益率yt=logpt-logpt-1, 分别取其绝对值和平方值作为股市波动率的近似值为研究样本, 下面应用Whittle估计法分析上证指数和深圳成指的Hurst指数值。
注: ①***表示在1%的显著性水平下拒绝原假设; ②R1和R2分别表示上证指数和深圳成指的对数收益率序列, |R*|和squarer*分别表示其相应的绝对值和平方值序列。
表3中, 上证指数和深圳成指的收益率序列和波动率序列的峰度和偏度值表明其均有别于正态分布。而从J-B正态性检验的结果来看, 两只指数的J-B统计量均显著地超过了临界值, 概率P值几乎为0。因此, 两序列均表现出尖峰、厚尾、右偏的特征, 均为非正态分布。而ADF统计量的值表明沪深股指序列均为平稳时间序列。
3.2 移动窗口技术和Whittle估计分析
为研究市场的波动率发展状态, 本文采用移动窗口技术结合Whittle估计方法, 对沪深股指的波动率变化进行深入分析。为了得到更具有鲁棒性的实证结果, 选择窗口长度分别为175天和250天, 图2分别是窗口长度为175天的上证指数和深圳成指自上市至2011年1月14日以来对数收益率的Hurst指数估计结果, 从图可以看出随着时间的发展, 沪深市场的Hurst指数估计值呈明显的下降趋势, 但到2011年1月14日止, 该估计值均稳定在0.6左右, 且近年来上证指数的Hurst指数估计值略低于深圳成指的Hurst指数估计值, 表明沪深两市场的记忆性强度有所降低, 但仍具有稍强的记忆性, 且上海证券市场比深圳证券市场的记忆性强度稍低。图3是窗口长度为250天的沪深两市的Hurst指数估值结果, 从图3可以看出, 窗口长度设为250天时沪深两市的Hurst指数估计值的波动性比窗口设为175天时较小, 变化更缓, 但是估计结果并没有质的区别。这结果一方面说明了Whittle估计方法的稳定性, 另一方面预示我们窗口长度应该尽量设长一点, 避免估计结果受季节效应的影响。
从图3可以看出, 从1997年开始, 沪深两市的Hurst指数估计值下降趋势十分明显, 并在以后的时间里趋于平稳, 可以说这是我国金融市场的一个转折点, 这与我国期间颁布的一系列法律法规不无关系, 1997年3月1日股票基金交易也开始实施公开信息制度, 公开信息制度作为证券监管的重要方式一方面是科学投资决策的前提, 另一方面能够更好地保障投资者的利益不受侵犯, 从而更有利于股票市场的健康运行。1998年1月1日《上海证券交易所股票上市规则》正式生效, 对公司股票上市进行了规范化;同年12月29日《中华人民共和国证券法》通过了审议并于1999年7月1日正式实施, 开始正式规范指导中国金融市场的运行。
时间序列收益率的绝对值和平方值都可以看作是该时间序列的波动率的估计, 为了研究沪深两市的波动率的长记忆强度情况, 本文使用上证指数和深圳成指自上市至2011年1月14日以来对数收益率的绝对值和平方值作为样本进行Whittle估计, 结果如图4至图7所示。
从图4至图7可以看出, 沪深市场波动率的长记忆效应比收益率的长记忆效应略显著, 但也有随时间递减的趋势, 而且Hurst估计值也是基本上从1997年左右的时间开始呈现转折下降的特点。
从图2至图7的分析结果来看, 沪深市场近20年来的收益率和波动率的记忆性均呈现出波动变弱的特点, 特别是1997年之后的趋势更明显。由于市场有效性假说的灵魂是价格已经反映了所有可以得到的信息, 即t时期的信息集对t+1时期的收益率是没有影响的, 也即建立在历史信息分析基础上的预测是无效的, 因而也可以认为有效市场是不存在记忆性的, 而且记忆性的强弱可以反过来反映市场有效性的强弱。而从对整个沪深市场的发展过程的分析结果来看, 沪深市场的有效性是更趋变强的, 说明我国金融市场的发展是卓有成效的。
4 结论
本文通过引入Whittle算法, 结合蒙特卡罗仿真实验, 对比了常用的几种Hust指数估计方法, 说明了Whittle算法克服了国内常用的R/S算法、修正R/S算法、V/S算法、DFA等算法的缺陷。与常用的算法相比较, Whittle 算法具有更高的精度和更好的稳定性, 而且以均方根误差和标准差为指标说明了本文方法的优越性, 并进一步说明了Whittle算法对Hurst指数真实值以及样本大小敏感度方面的强壮性。最后使用Whittle算法和移动窗口技术, 并进一步结合市场关键事件的影响对沪深市场的发展状态进行了实证分析。结果表明, 我国证券市场资产收益率以及波动率均存在着长期记忆性, 且深市的长期记忆效应相对更显著, 这意味着上市比深市更有市场效率, 进一步说明了近20年来沪深市场有效性是更趋变强的, 说明我国金融市场正得到逐步的完善, 随着股指期货的推出, 相信不久的将来中国金融市场的有效性将会得到进一步的加强。
参数比较法 篇6
由于3#6000空分装置空压机油冷却器冷却效果差, 造成润滑油温在很长一段时间内超出工艺指标。计划于1月10日氮气管网退气, 氮压机打放空。切换空压机油冷, 在空压机出入口水管线加导淋并且在出入口管线上加压力表。于9:20氮气退管网氮压机打放空, 并以1月11日23:00向氮气管网送气为标志结束此次检修。
本次检修期间主要完成了空压机油冷的更换、空压机总回水活门的处理、油冷却器回水管线的改造、油冷却器循环水出入口管线加导淋和压力表、空压机三四级胶圈更换以及仪表方面的检查。下面就将本次检修的基本情况和检修前后空气压缩机的主要运行参数进行比较, 同时总结本次开停车过程中的经验和教训。
2 装置停车1月10日
1) 19∶15接厂调度命令, 开始进行氮气管网退气;于9∶25氮气退出管网, 氮压机打放空。
2) 9∶30当班操作人员准备分别切空压机1#和2#油冷却器。 ①操作人员于9∶30切除1#油冷却器。在此之前, 两台油冷并用时润滑油温为50.1℃;切1#油冷后, 润滑油温快速升高至54.7℃, 最高达到60.2℃。润滑油压也同时从0.273MPa降低到0.264MPa。
②鉴于润滑油温快速升高、润滑油压降低, 因此将1#油冷却器投上。通过此操作可知, 一台油冷运行不能保证润滑油温要求。决定空压机正常停车, 全系统退气。
3) 联系4#6000装置打开两装置连通密封污氮气活门, 确保在保冷停车过程中冷箱基础温度不会下降很多。
4) 停车时主冷液面已达满量程、下塔液空液面LICA1为319mm。
5) 在分离系统退气前将装置仪表气倒为外供。
6) 于13∶10手动停氮压机, 13∶20停膨胀机并相继于13∶40停空压机, 待空压机主机停止运行20min后, 停油泵和排油烟机, 装置交付检修。
3 装置检修
1) 1月10日14∶00至11日9∶00期间, 分别进行了油冷却器更换、空压机油箱加油、空压机三、四级胶圈的更换和空压机总回水活门的处理及相关仪表项目。
2) 12∶00仪表处理空压机油压二次调节阀、空压机气动放空阀、V-1204阀关信号拆除。
4 装置复工1月11日
1) 空压机油系统循环, 于13∶05开启空压机, 无负荷时运行一段时间。
2) 13∶20缓慢开空压机入口导叶, 逐渐缓慢加量。
3) 当空冷塔出口压力达到0.35MPa左右, 先后开冷却水泵、冷冻水泵和冰机.此时出分子筛空气中CO2和H2O含量偏高, 因此出分子筛空气通过V-1218放空。
4) 16∶55打开V-101缓慢向主塔充气, 而后打开HV-101主塔进气。
5) 17∶15开1#膨胀机, 进入系统积液调纯阶段。
6) 20∶30氮压机开启正常。
7) 22∶00由于产品氮气纯度可能差, 因此联系调度协调微量氧在线分析仪测量产品氮气纯度。分析结果氮气纯度为3.0×10-6。
8) 于当日23∶00氮气纯度合格并入氮气管网, 标志此次停车检修和复工结束。
5 检修前后空压机运行参数对比
本次停车主要是由于空压机油冷却器效果变差, 润滑油温超工艺指标。将检修前后空压机各级吸气温度、润滑油温、压缩机轴承温度变化作以比较, 见表1。
从表1可以看出, 循环水温度在一天内随时间变化趋势一致;空压机一级吸入口空气温度随环境温度有所下降。检修前后各参数平均值和差值, 见表2。
注:表中数据分别采集于检修前 (1月8日的数据, 每隔4小时取一点) , 检修后 (1月13日的数据, 每隔4小时取一点) 。
由表2可看出, 检修后压缩机相关参数均较以前有所下降。二级平均吸气温度降低8.0℃, 三级平均吸气温度降低4.6℃, 四级平均吸气温度降低5.5℃, 润滑油温降低6.8℃, 四级轴承温度降低5.8℃。
5.1 检修前后空压机运行参数对比曲线
5.1.1 时间-循环水温度曲线, 如图1所示
从图1可以看出, 在一天内循环水温度随时间的变化趋势一致, 主要是受环境温度影响, 循环水温度的平均值下降0.9℃左右。
5.1.2 时间 - 空压机一级吸气温度曲线, 如图2所示
从图2可以看出, 在一天时间内空压机一级吸气温度随时间的变化趋势一致, 随着气温下降, 因此吸气温度的平均值下降6.0℃左右。
5.1.3 时间 – 润滑油温度曲线, 如图3所示
从图3可以看出, 在一天时间内空压机润滑油温度随时间的变化趋势基本一致, 由于更换了油冷却器, 冷却效果明显增加。润滑油温度也较以前有所降低, 润滑油温度的平均值下降了6.8℃。
5.1.4 时间-空压机轴承温度 (四级) 曲线, 如图4所示
从图4可以看出, 在一天时间内空压机四级轴承温度随时间的变化趋势基本一致, 由于更换了油冷却器, 冷却效果明显增加, 润滑油温度也较以前有所降低。因此, 空压机轴承温度的平均值下降了5.8℃。
5.2 检修后空压机各温度有所降低的原因
(1) 原用空压机油冷器水相污垢热阻大, 换热效果差;
(2) 空压机循环水总回水不畅, 致使进入段间冷却器内循环水流量下降, 影响段间冷却器和油冷却器换热效果;
(3) 同时空压机油冷却器回水管线改造, 也在一定程度上确保油冷却器的换热效果。
6 本次停车检修的经验
1) 停车前空压机润滑油温超出工艺指标, 导致压缩机其它参数也随之升高, 对空压机的长周期稳定运行存在一定的威胁。检修前油冷为两组并用, 且润滑油温度一直偏高。因此, 要求自己在以后生产管理工作中要把工作做细, 发现问题及时向有关部门汇报并处理装置中存在的隐患, 确保装置长周期稳定运行。
2) 此次为临时停车, 主冷和下塔液体未排出塔外。因此, 确保在停车保冷过程中冷箱基础温度不能降得过低, 在停车前应打开两套装置冷箱密封氮气活门。岗位操作人员应密切关注冷箱基础温度, 当此温度下降时应检查活门开度情况。
3) 在以后停车检修而后复工前必须调试所有调节阀, 确保各调节阀好用。
4) 进一步完善装置开停工过程生产受控操作卡, 在原有操作卡的基础上根据生产实际进行修订, 使各项操作规程确实能够对装置生产起到有效的指导作用。
摘要:介绍了3#6000空分装置停车更换油冷及进行其它检修项目, 详细分析了检修前后空压机运行参数的变化情况并简要说明本次开停车的经验。
参数比较法 篇7
支持向量机是由Vapnik等人于20世纪90年代研究并迅速发展起来的一种基于统计学习理论的机器学习方法,以往困扰机器学习方法的很多问题在这里都得到了一定程度的解决。但是,SVM在也存在一些局限性,比如:SVM的性能很大程度上依赖于核函数的选择,但没有很好的方法指导针对具体问题的核函数的选择,而参数选取的好坏将直接影响着分类器泛化性能好坏,本文对支持向量机核函数与参数的选择进行比较分析,在最后进行总结。
2、核函数的种类
把原问题空间中的训练样本变成特征空间中线性可分的训练样本,是核函数在SVM中所起的最基本作用,因此核是SVM方法的关键所在。目前得到研究的核内积函数形式主要有下面四种:
核函数的形式及其参数的确定决定了分类器类型和复杂程度,由于目前常用的核只有有限的几种,所以选择核函数的一种比较可行的方法是:对每一种核选用某种方法选出其对应的最佳核参数,然后再比较哪种核最好。
3、参数的选取
在实际应用中,选用参数要根据识别任务来确定。本文研究的内容主要是用SVM识别特定人手写数字时,找出比较好的核函数和参数,以便较好的识别带有个人书写风格的数字。目前参数的常用选择方法主要有以下两种:
(1) 试凑法
该方法是在核函数选择以后,首先为惩罚因子C和核函数固有的参数赋一初始值,然后开始实验测试,根据测试精度重复调整参数值,直至得到满意的测试精度为止。
(2) 最优化方法
在数字识别方面总的来讲,最优化方法是一个标准的最小最大化优化问题,可以使用已有的优化工具来实现,难点是如何更新惩罚因子C和核参数。
4、实验及比较分析
本文针对其核参数和误差惩罚因子C展开优选研究,通过下面两个方面的实验进行:
实验一:选定核函数,设置不同参数,观察识别率的变化并进行分析。具体实验方法是固定惩罚因子C的值为1000,对训练集选择多种参数进行识别,根据识别结果找出比较好的参数值。
实验二:选取上一实验中找出的识别率较优的核函数和参数,将其固定,再选择多种惩罚因子C对样本测试集进行识别,从识别结果中进一步观察惩罚因子C对识别率的影响。
需要说明的是在实验中的样本来自10位对象的手写体数字,包括了0~9十种数字,每人每种数字书写10次。实验一中设置的核函数的参数值及实验二中选取的C值都限定为平时用的比较多的那些值。实验一分别选择多项式核、径向基函数核、S形核函数,对训练集进行识别,结果分别如表1、2、3所示。根据表1中的数据,我们可以发现阶数大致在1-7之间时识别率都比较高,阶数从9开始,识别率开始明显下降。所以可以认为选用多项式核识别这10个人书写的数字时,阶数在1-7之间进行取值比较适合。
我们从表2中可以看出用σ2在两个区域附近取值时识别率比较高,用径向基核识别这10个人书写的数字时,σ2大致在0.2-3.2之间进行取值时比较适合。从表3中,我们很容易看出不管t怎样取值,v=1和v=2时的识别率都要高于v=3与v=4时的识别率。观察表4中数据,我们可以发现有6次选用三阶多项式核时识别率最高,另有6次选四阶多项式核时识别率也是最高。可认为我们对实验样本用多项式核的SVM识别时,选用三阶或四阶多项式核都比较好。
根据表5中数据我们可以从中看出有5次选用σ2=0.8时识别率最高,另有5次选用σ2=1.6时识别率也是最高。因此,可认为我们对这10人书写的数字选用径向基函数核的SVM进行识别时,取σ2为0.6或1.6都很好。
用以上实验找出的较好函数对测试集进行实验后发现V=1, t=1和V=2, t=0.8的s形核效果最好。最后选用这两种核函数,调整C的值对测试集再进行实验,结果如表6所示。结果表明当惩罚因子C较小或较大时时识别率都很不太好,这是由于C可以调节分类置信范围和经验风险的比例以使分类器的推广能力最好,实际上,总存在一些C(这里数量级在之间)使分类器不太复杂且泛化能力又很强,这些C值也使得识别率很高。
4、结论
总的来说实验一、二,其结果验证了Vapnik等人的结论,即不同的核函数对SVM性能的影响不大,反而核函数的参数和惩罚因子C是影响SVM性能的关键因素,因此选择合适的核函数参数和惩罚因子C对学习机器的性能至关重要。
摘要:论文介绍了一种新型的机器学习方法-支持向量机, 详细介绍了支持向量机模型思想。论述了不同种类支持向量机算法并指出了每种算法的优劣。实验结果显示了核函数中选择合适的参数对分类器的效果是很重要的, 文章最后总结了SVM研究中核函数和参数的选择对结果的影响。
关键词:支持向量机,核函数,参数
参考文献
[1].邓晓文.支持向量机参数选择方法分析.福建电脑, 2005, (11) .
[2].董春曦等.支持向量机参数选择方法研究.系统工程与电子技术, 2004, 26 (8) .
[3].丁胜.基于支持向量机的手写体字符识别[学位论文].青岛大学, 2006.
[4].周奇.基于支持向量机的脱机手写字符识别研究[学位论文].重庆大学, 2007.
[5].谢承旺.不同种类支持向量机算法的比较研究.小型微型计算机系, 2008, (1) .
参数比较法 篇8
青海高原半细毛羊养殖区域集中在青海省海西州、海南藏族自治州、海北藏族自治州等地,由于高原地区独特的环境影响其遗传特性和生长性状均不同于其他细毛羊品种,是中国培育的独特的高原细毛羊品种。因此,对青海高原半细毛羊的生长性状进行遗传参数估计的研究,对了解该品种遗传特性以及对该品种进行选育具有重要意义。1986 年后,塔基绵羊参加美国国家绵羊改良计划( NSIP) ,在很大程度上改进了其遗传进展与生产性能[2]。王立贤等[3]采用公畜母畜模型和外祖父模型估计了高加索细毛羊初生体重、断奶体重的遗传力分别为0. 164,0. 076。E.Safari等[4]采用线性全混合模型估计了澳洲美利奴羊生长性状间的遗传相关,初生体重与断奶体重、周岁体重和成年体重的遗传相关分别为( 0. 44 ±0. 03) ,( 0. 16 ± 0. 04) ,( 0. 28 ± 0. 03) ,断奶体重与周岁体重、成年体重的遗传相关分别为( 0. 85 ± 0. 05) ,( 0. 54 ± 0. 05) ,周岁体重与成年体重的遗传相关为( 0. 89 ± 0. 06) ,表明澳洲美利奴羊生长性状间遗传相关性较强。
目前,青海高原半细毛羊生长性状遗传参数估计的研究在国内尚未见文献报道。研究采用平均信息与期望最大结合约束似然法,利用不同个体动物混合模型估计青海高原半细毛羊生长性状的遗传参数,从数量遗传学的角度探讨青海高原半细毛羊生长性状的遗传特性,以期为指导青海高原半细毛羊科学育种提供理论依据。
1 材料与方法
1. 1 试验材料与数据预处理
试验数据来源于青海省河卡种羊场2004—2012年场内生产性能测定的原始记录,首先对数据进行预处理,去除无系谱记录、无生产性能记录、个体号记录错误、无性别记录以及表型记录错误的个体。
模型中选择场年季节效应和性别作为固定效应,场分为2 个水平,年度效应按自然年度划分,季节效应根据试验场当地的气候特点划分为4 个水平( 春、夏、秋、冬) ,性别分为公、母2 个水平,为了减少固定效应的水平数,将场、年、季节合并为一个效应[5]。分析的生长性状包括羔羊初生重、4 月龄断奶重、周岁重( 12 月龄) 和成年重( 24 月龄) ,各生长性状数据见表1。
1. 2 参数估计模型
采用3 种单性状动物模型[6]估计青海高原半细毛羊生长性状的遗传参数,相应的模型表达式如下:
Zss + e。式中: y为个体观察值向量,b为固定效应向量( 场年季节效应、性别效应) ,a为动物个体加性遗传效应向量,m为母体遗传效应向量,s为永久环境效应向量,e为残差效应向量,X、Z分别是固定效应和个体加性遗传效应的结构矩阵,Zm和Zs分别是母体遗传效应和永久环境效应的结构矩阵。
1. 3 不同模型的比较方法
为了估计得到真实的遗传参数,研究对青海高原半细毛羊生长性状方差组分估计的3 个模型的估计效果进行比较。不同模型方差组分估计准确度用以赤池信息指数( AIC) 作为评价标准[7],AIC信息指数的公式为: AIC = - 2log L + 2p。式中: L为最大似然函数,p为需要估计参数的个数,AIC信息指数可以反映模型中需要估计的参数个数对估计效果的影响。不同模型的AIC标准值越小,模型方差组分估计的效果越好。
1. 4 方差组分及遗传参数估计
试验再用DMU6. 0 软件包的DMUAI模块进行方差组分和遗传参数的估计,算法采用平均信息和期望最大结合( AI - EM) 算法[8],该算法具有收敛速度快、参数估计值不会跳出样本空间的优点。计算过程中的迭代收敛标准为< 10- 2。
2 结果与分析
2. 1 个体动物模型对青海高原半细毛羊生长性状的方差组分估计
不同生长性状的个体动物模型的方差组分,结果见表2。
由表2 可知,各生长性状的残差效应差异较大,初生重的残差效应范围为0. 623 3 ~ 0. 653 4,4 月龄断奶重的残差效应范围为0. 697 3 ~ 0. 722 8,周岁重的残差效应范围为0. 650 7 ~ 0. 775 5,成年重的残差效应范围为0. 602 3 ~ 0. 779 3。遗传力在各模型中差异较大,除成年重外,模型1 估计的生长性状的遗传力最大。各生长性状的母体遗传效应比永久环境效应要大。不同性状的加性遗传效应与母体遗传效应间的相关差异较大,范围为- 0. 225 1 ~ 0. 564 7。
2. 2 不同动物模型间的比较
各生长性状不同动物模型的- 2log L值与AIC信息标准值的计算结果见表3,4。
由表3,4 可知,模型2 对初生重、4 月龄断奶重性状遗传参数估计效果最优,模型1 对周岁重和成年重性状遗传参数效果最优。
3 讨论
3. 1 不同动物模型估计效果的比较
随机效应包括个体加性遗传效应和母体遗传效应。模型2 对初生重和4 月龄断奶重性状的遗传参数估计的效果最好,这表明母体遗传效应对初生重和4 月龄断奶重有显著影响,母体遗传效应在早期生长性状遗传参数估计中具有重要的作用[7]。K. J. Hanford等[2]的研究中同样证明了这个结论。
模型1 对周岁重和成年重性状的遗传参数估计效应最优,这表明母体遗传效应或永久环境效应对这两个性状的影响微弱,这是因为这两个性状属于生长发育后期,从而只受个体加性遗传效应和环境效应的影响[9]。E. Safari等[10]研究表明,绵羊断奶后的生长性状不受母体遗传效应和永久环境效应的影响,这与本文的研究结果一致。因此,在估计周岁重和成年重性状的模型中,不需要考虑母体遗传效应和永久环境效应的影响。综上所述,母体遗传效应对早期生长性状有显著影响,而对个体后期生长性状的影响不大。
3. 2 不同模型生长性状的遗传参数的估计
从生长性状方差组分估计结果可知,残差效应比例、遗传力在各模型中差别较大,这可能与研究用数据的结构有关[5]。个体永久环境效应的比重很小,因此对生长性状的影响可以忽略。从估计的方差组分结果来看,随着个体发育时间的延长,从初生重到成年体重母体遗传效应呈下降趋势( 0. 042 6 ~0. 000 0) 。E. Safari等[4]研究表明,随着个体年龄的增长,母体效应对生长性状的作用逐渐减弱。而且从试验结果来看,模型中考虑母体遗传效应时,对初生重、断奶重两个性状估计的遗传力偏低。N. Maniatis等[11]研究表明,对于早期生长性状,模型中不包括母体遗传效应时估计的遗传参数偏高。
研究中,估计的初生重、4 月龄断奶重的母体遗传效应遗传力分别为0. 042 6,0. 039 7,低于L. Varona等[12]对圣伊内斯肉羊的研究结果,即初生重母体遗传力为0. 12,断奶重为0. 1; 也低于D. G. Hall等[13]对美利奴羊与德美羊杂交的研究结果,即初生重母体遗传力为0. 08,断奶重为0. 05。虽然母体遗传效应在周岁重中占有较大比重,但其对遗传参数估计的影响较小。因此,母体遗传力对周岁重的影响可以忽略; 对于成年重,母体遗传效应所占比率几乎为0,其作用也可以忽略不计。
除成年体重外,加性遗传效应与母体遗传效应的相关在本次研究中均呈较强的正相关,与研究者[14]对波尔山羊的研究,J. J. Tosh等[15]对汉普夏羊的研究结果不一致,即加性遗传效应与母体遗传效应的相关分别为- 0. 59 ~ - 0. 71,表明对青海高原半细毛羊的生长性状进行选择可以间接改进后代生长性状的遗传特性。