变参数回归模型

2024-06-24

变参数回归模型（共5篇）

变参数回归模型篇1

摘要：针对钻井液在工程实际中的优化设计, 在分析添加剂作用机理以及各典型地层钻进需求的基础上, 将添加剂性能指标以及地层参数予以量化, 通过室内试验建立添加剂基本性能指标数据库, 然后通过加权回归模型建立匹配规则, 依靠模型运算法则对典型地层所需要的钻井液体系进行设计与优化控制, 以提升生产效率和确保钻井液设计合理性。

关键词：钻井液,优化设计,数据库,加权回归模型

引言

合理的钻井液设计是成功进行钻井和降低钻井费用的关键, 钻掘工程中, 钻井液优化设计主要包括性能设计和配方优选等内容[1]。要设计一套匹配目标地层的最佳钻井液方案, 首先必须明确目标地层的具体情况, 选择合适的钻井液性能设计体系, 然后依靠该体系进行钻井液的配方优化设计。随着我国钻掘工程技术逐渐与国际接轨以及计算机技术的普及, 钻掘工程项目设计在规范化、计算机化和管理现代化等方面有了新的发展条件和需求。

目前, 针对钻掘工程中钻井液主要由现场技术人员根据经验进行配方设计, 设计因人而异, 难以形成规范的工艺体系。参考国际先进技术体系, 国内许多研究机构也对钻井液优化设计进行了相关研究, 涉及体系主要包括范例模型[2]、正价优化实验、神经网络预测体系、数学参数控制体系以及专家预设计等[3]。文章参考数学参数控制体系和专家参数评分方法, 结合因子分析方法和数学建模, 建立了一种新的钻井液参数优化模型。

1 钻井液基本参数库的建立

1.1 地层的预处理

不同地层对钻井液性能的需求不尽相同, 为了满足针对钻井液参数设计的建模需求, 首先应对各工作地层进行预处理[4]。依靠专家经验知识划分钻井液指标优控区间, 使地层区别反映到钻井液控制指标的参数选择上, 这是地层预处理的主要手段。例如, 由于软弱地层孔壁自稳能力较差, 岩心保真困难, 这就要求钻井液在动切力、动塑比等性能方面进行相应的综合控制, 使之保持在各地层匹配的优控区间之内。通过地层的预处理, 划分出的代表地层指标优控区间, 是优化模型的进行运算匹配的特征参数。

1.2 添加剂性能指标的参数化

针对各类钻井液主要添加剂, 将其对钻井液性能的影响参数化, 并通过室内试验建立了优控模型基础参数库。现已纳入数据库的主要添加剂主要包括高聚物类降滤失剂CMC、高聚物类抑制剂PAM、植物胶、膨润土改型剂和碱度控制剂以及加重剂等。根据模型运算需求, 实验设计包括了比重实验、六速旋转粘度实验、漏斗粘度实验、失水率以及泥皮实验等;其中CMC、PAM、植物胶等主要添加剂分剂量水平进行交叉组合, 根据层次分析建库要求, 录取相应实测性能数据。另外, 由于各代表地层匹配的性能指标优控区间的划分主要依赖于专家知识经验, 且粘度、比重、失水率等指标的控制区间选取具有不规范性, 为了适应数学模型的运算需求, 现通过运算处理, 主要选取滤失水量API以及流变性参数n以及K值作为优控参数[5]。

2 参数的分析处理

钻井液表观粘度主要是由流体体系结构内的内摩擦作用和主辅剂高分子间交联所形成的空间网架结构所引起的, 尤其在低剪切速率的情况中这种结构表现的更加明显。所以表观粘度的数值大小直接反映着冲洗液空间网架结构构型对冲洗液性能的影响程度, 直观的表现就是排砂和携岩屑的效果。同样, 无固相冲洗液的流体形式属于假塑性流体, 流性指数n表示假塑性流体在一定剪切速率范围内所表现出的非牛顿性的程度和剪切稀释性的强弱。n值越小, 曲线的曲率越大, 流体的非牛顿性越强, 剪切稀释性也越强, 同样动塑比也说明了剪切稀释能力的强弱[6], 需要注意的是, n值并非越小越好, n值应与各地层需求匹配。这有助于冲洗液在环形空间产生较好的流核, 形成平板层流, 保证了冲洗液能有效地携带岩屑和保持井眼清洁[7];K值与冲洗液的粘度、切力有关, 其值越大, 粘度越高, 可有效包裹岩心, 提高岩心采取率及取芯质量[8], 但K值的增大会导致动切力增大, 不利于钻进效率的控制, 因此对应各地层指标匹配规则的建立, 有利于实现钻井液的最优设计。表1是基于室内试验所建立的基础数据库中的部分实验数据, 基浆为膨润土-Na OH浆液, 添加剂ABC分别代表为抑制剂PAM、高聚物VG、降滤失剂CMC。

3 加权回归分析模型的建立与实现

回归分析 (Regression Analysis) 是一种统计学上分析数据的方法, 可用于了解两个或多个变量间是否相关、相关方向以及强度, 并可依据回归关系建立模型对变量的响应关系进行预测。现选取室内数据库中高聚物类降滤失剂CMC、高聚物类抑制剂PAM、碱度控制剂Na OH等添加剂量为自变量X= (X1, ..., Xk) , n、k以及API等控制参数记做Y= (Y1, ..., YP) , 分别建立因变量y涉及k个自变量依赖关系的多元回归方程如下:

其中, β1, β2, ..., βi为偏回归系数, βi表示假定其他变量不变, 当XP每动一个单位时, YP的平均变动值。文章在模型关系中涉及了多重因子, 并且多重因子之间还具有一定的交互作用[9], 因此, 一般线性模型并不适用于钻井液参数体系的研究。

加权回归分析模型的建立以及运算使用了SPSS (Statistical Product and Service Solutions) , 即“统计产品与服务解决方案”软件。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等, 具有分析功能强大, 操作界面友好, 输出结果美观漂亮的特点。

文章以室内试验所建立的数据库为基本观察数据, 使用SPSS对数据库中一系列参数分组进行了回归分析。如不同水平的添加剂ABC组合与ND、API等控制指标的回归关系。为了利于参数分析的均衡性, 结合对实验数据的直观分析, 这里对ND等控制指标的回归分析采用权重估计。在“权重估计”界面中, 选取添加剂ABC为自变量, 其中C作为权重变量, ND作为因变量, 如图1。

计算每一步中的对数似然值, 可见, 对于幂为2时, 算出的对数似然比值最大。加权回归分析结果如表2:常数为-3.909, 对应系数分别为317.231, -24.029, -490.655。方差分析中的计算概率为0, 小于显著性水平0.05, 说明回归模型有效[10]。模型摘要中, 调整R方为0.856, 接近于1, 模型拟合较好。另外, 分别对n、k等组合进行了回归分析, 在进行适当的参数调整之后, 均能有较好的模型拟合度。

此SPSS回归分析所建立的模型, 可应用到实验数据库中未涉及的同类别不同水平的添加剂组合, 以预测其不同添加剂水平所形成的钻井液体系中ND, API, N的性能水平。将此模型封装成钻井液优化软件应用于钻井液配方的优化设计, 能避免繁复的室内试验, 高效快速地实现工程应用中的钻井液设计, 推进钻掘工程的规范化设计, 提升生产效率。

4 结束语

(1) 通过经验知识确定各代表地层的泥浆性能需求, 确定了API、ND、n值、k值等主要控制参数。 (2) 通过室内试验建立了主要添加剂的基本性能指标数据库, 并通过SPSS软件建立数学模型分析了API、ND、n值、k值与添加剂剂量水平之间的作用关系。 (3) 基于室内试验数据库建立的加权回归模型能避免繁复的室内试验, 快速高效地预测不同添加剂水平所形成的钻井液体系的性能水平, 将此模型以计算机软件作为载体应用于工程实践之中具有积极的实际意义。

参考文献

[1]王平全, 周世良.钻井液处理剂及其作用原理[M].北京:石油工业出版社, 2003, 9:323.

[2]程金霞, 郑秀华, 夏柏如.基于范例推理的钻井液优化设计系统的研究[J].探矿工程 (岩土钻掘工程) , 2005 (S1) :300-302.

[3]杜钦波, 赵正文.基于产生式的钻井液优化系统设计[J].现代电子技术, 2004 (8) :93-94.

[4]董书礼, 鄢捷年.钻井液优化设计的智能化方法[J].钻井液与完井液, 2000, 17 (4) :15-17.

[5]徐璧华, 梁大川, 罗悦, 等.基于规则推理的钻井液设计系统研究[J].重庆科技学院学报 (自然科学版) , 2011, 13 (4) :155-157.

[6]牛文琳, 陈礼仪.植物胶无粘土冲洗液的流变性研究[J].探矿工程 (岩土钻掘工程) , 2006 (1) :44-46.

[7]占样烈, 徐力生, 李月良, 等.植物胶冲洗液特殊功能及其作用机理的分析与探讨[J].勘察科学技术, 2009 (2) :34-36.

[8]王政敏.PAA高分子聚合物冲洗液在复杂地层钻探中的应用[J].2001, 37 (4) :83-84.

[9]芝顺, 曹亦薇.因素分析法[M].北京:人民教育出版社, 1999:196.

[10]薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社, 2009, 9:483.

变参数回归模型篇2

投入报酬递减规律模拟的回归函数模型与参数估计方法

投入报酬递减规律是产品生产中投入与产出的核心规律.若要获得最优生产决策,对该规律的`模拟是至关重要的.根据长期从事该方向研究的积累,给出了一些可用于对投入报酬递减规律进行模拟的回归函数模型,并提供了相应的参数估计方法,以解决对投入报酬递减规律进行模拟时回归函数模型确定的困难.应用实例分析表明,所给回归函数模型适合对投入报酬递减规律的模拟.

作者：王玉杰张大克 WANG Yu-jie ZHANG Da-ke 作者单位：天津科技大学理学院,天津,300457 刊名：天津科技大学学报 ISTIC英文刊名：JOURNAL OF TIANJING UNIVERSITY OF SCIENCE & TECHNOLOGY 年，卷(期)： 24(2) 分类号：O212.1 关键词：投入报酬递减规律模拟回归分析回归函数模型参数估计

变参数回归模型篇3

在回归模型y = f ( x) + ui的经典假定中, 随机误差项ui无自相关, 即Cov ( ui, uj) = 0 ( i≠j) , 如果该假设不能满足, 就称ui和uj存在自相关, 即不同观测点上的误差项彼此相关. 此时, 如果依然用最小二乘法去估计参数, 会低估参数估计值的方差, 因此, 必须消除自相关的影响.

ut的一阶自回归形式为: ut= ρut - 1+ υt, 其中, ρ < 1, υt满足经典假定.

假设检验包括4个步骤: 第一步, 提出假设; 第二步, 构造适当的检验统计量, 并根据样本计算统计量的具体数值;第三步, 规定显著性水平, 建立检验规则; 第四步, 作出判断.

引理多元线性回归模型总体回归函数的一般形式为: Yt= β1+ β2X2t+ … + βkXkt+ ut.

多元线性回归模型的样本回归函数为:

其中: et是Yt与其估计Y^t之间的残差.

若记: Y = [y1, y2, …, y n]T, U = [u1, u2, …, u n]T,

B = [β1, β2, …, β k]T,

则总体回归模型的矩阵形式为: Y = XB + U, 样本回归函数的矩阵形式为: Y = X^B+ e.

多元模型中回归系数的检验采用t—检验, t统计量公式为

其中: βj是回归系数估计值, n是βj的标准差估计值, , ψjj是 ( X'X) - 1的第j个对角线元素.

二、线性自回归模型的假设检验

已知时间序列 {X t}: X1, X2, …, Xn, 建立线性自回归模型:

由引理, 回归系数的显著性检验中t统计量为:βj是回归系数的估计值, 是βj的标准差估计值ψjj是 ( X'X) - 1的第j个对角线元素.

三、幂函数自回归模型的假设检验

已知时间序列 {X t}, 建立幂函数自回归模型Xt=αXβt - 1expμt ( μt= ρμt - 1+ υt) , 则

用 ( 1) - ρ× ( 2) , 得

由引理, 回归系数的显著性检验中t统计量为:ψjj是 ( X'X) - 1的第j个对角线元素.

四、指数函数自回归模型的假设检验

已知时间序列 {X t}, 建立指数函数自回归模型Xt=αβXt - 1expμt ( μt= ρμt - 1+ υt) , 则

用 ( 1) - ρ× ( 2) , 得

变参数回归模型篇4

在我国实施经济发展方式转变的战略过程中, 积极推进产业与资源环境协调发展是减轻生态环境压力, 有效利用资源的必然选择和有效路径。然而, 产业与资源环境之间存在各种胁迫与约束, 是国内外学者研究的重点领域。国外如福雷斯特[1]提出产业环境的概念, 倡导政府在实施产业结构转换或调整过程中充分考虑产业发展与环境保护的相互协调性。赫尔曼·戴利[2]倡导在产业结构调整中尽量减少资源消耗量大的产业的规模, 尽量扩大无污染或污染小的产业。他认为人类具有克服环境资源稀缺的能力。米勒和布莱尔[3]利用投入产出方法分析能源使用和环境问题, 而且对行业活动中的能源投入和污染物排放进行定量分析, 为产业结构调整提供了政策支持。国内如张景云[4]认为沿江地区工业结构不合理是资源供应紧张和环境质量恶化等问题产生的根源。要突破资源环境约束, 只有协调好环境保护与产业发展之间的矛盾, 才能实现可持续发展。此外, 王力[5]、张少兵[6]对产业结构优化的环境, 卓锰钢[7]对产业结构优化的资源, 杨艳琳[8]对产业转型的资源环境进行研究。姚聪丽[9]在理论上分析了资源环境与工业化发展的关系, 在此基础上建立了资源环境下工业化发展的模型。张燕[10]基于产业地位划分法探讨了中国产业升级路径中的资源环境。

这些研究主要是从定性的角度来分析产业与资源环境的关系, 如何定量地揭示绿洲产业与资源环境间的关系, 特别是量化资源环境对产业发展的约束, 研究更少。绿洲是在干旱气候条件、水文地貌、人类活动诸因素综合作用下形成的特殊景观, 是干旱区的精华和人类活动的载体。新疆绿洲占干旱区绿洲总面积的72% , 因此, 以新疆作为研究对象具有一定的代表性。本文采用变参数状态空间模型, 以新疆为例, 对产业发展受资源环境的约束进行了实证研究, 对推进干旱区绿洲产业可持续发展至关重要。

2 可变参数模型的状态空间模型构建

传统变量之间的关系一般采用固定参数模型来描述, 只能反映变量间的静态关系, 难以反映变量间由于时间变化以及各种各样的外界冲击导致的变量间关系的改变程度, 因此, 需要考虑采用可变参数模型。根据状态空间分析的思想, 状态空间分析法是现代控制理论的基础, 是对系统内部以及系统之间输入输出关系的描述, 同时适用于时变系统、非线性系统和随机控制系统, 基于量测方程和状态方程, 以数学模型对系统的一种完全描述。产业结构受资源环境的约束也是随时间发生变化的, 因此, 为测度产业结构受资源环境的约束程度, 利用状态空间模型 ( Harry[11], Hamilton[12]) 构造的可变参数模型如下:

方程 ( 1) ( 2) ( 3) 就是状态空间模型。状态空间模型是动态模型的一般形式, 由量测方程和状态方程构成。量测方程 ( 1) 中, xt是具有随机系数的解释变量的集合, 随机系数向量 βt是状态向量, 称为可变参数。向量 μt, εt是量测方程和状态方程的扰动项, 假定为相互独立的, 且服从均值为0, σ2方差为和协方差矩阵为Q的正态分布。Rt是系统矩阵, 能随时间改变, 但是都是可以预先确定。βt是不可观测变量, 必须利用可观测变量yt和xt来估计。状态向量方程一般采用卡尔曼滤波 ( Kalman Filtering) 的迭代算法进行最优值估计, 当新的观测值得到, 可以利用Kalman滤波连续地修正状态向量的估计值, 体现出状态空间模型估计参数的时变性。

根据变参数状态空间模型量测方程和状态方程, 得到预测方程:

一旦得到新的预测值yt , 就能够修正 βt的估计at / t - 1, 更新方程是:

给出一步向前状态条件均值, 我们还可以得到的一步向前最小均方误差估计:

一步向前预测误差可以通过下面的公式得到:

预测误差的方差被定义为:

Kalman滤波提供了状态向量的最优估计。当所有的T个观测值都已处理, Kalman滤波基于信息集YT, 产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量和未来观测值的最优预测所需的所有信息。

3 新疆产业发展的资源环境约束实证检验

3. 1 变量选取与数据说明

样本研究期间确定为1995 - 2009 年。数据来自《新疆统计年鉴》、《新疆年鉴》相关年份。产业发展很大程度体现为产业结构的不断优化, 因此, 本文选择产业结构优化率 ( ISR) 反映产业发展水平, 以第二产业产值与第三产业产值的和占GDP的比重表示, 用以表征因变量, 工业废气排放 ( FQ) 、工业废水排放 ( FS) 、工业固体废物排放量 ( GF) 、一产能源效率 ( YNX) 、二产能源效率 ( ENX) 、三产能源效率 ( SNX) 、农业水耗 ( NHS) 、非农业水耗 ( FNHS) 反映资源环境影响情况, 是随时间变化的自变量。其中产业能源效率为产业产值与产业能源消费之比。为了保证数据的可比性和容易得到平稳序列, 同时削弱可能的异方差, 对数据取自然对数处理。

3. 2 平稳及协整检验

要建立产业发展资源环境约束的可变参数状态空间模型, 要求变量是平稳的且变量间存在协整关系。首先, 采用扩展的Dickey - Fuller ( ADF) 的检验方法对变量进行单位根检验, 利用AIC与SC准则确定变量的滞后阶数。检验结果如表1 所示。

注: △代表一阶差分; 括号内前两个字符表示检验的类型 ( c: 含常数项, t: 含趋势项, ) , 第3 个字符表示滞后的阶数

从表1 可以看出, 对变量的对数取一阶差分后为平稳序列, 均在5% 的水平上显著, 通过ADF检验, 即各变量均为I ( 1) 阶单整序列, 为了研究平稳时间序列间的长期关系, 需要确定它们之间是否具有协整关系。我们选取适合多变量协整检验的Jo-hansen协整法对变量进行协整分析, 协整检验结果如表2。

注: * 表示5% 显著水平下的临界值, 以迹检验结果为准

从表2 可以看出, 产业发展水平ISR与二产能耗ENH的统计量19. 23 大于5% 显著水平下的临界值18. 39, 拒绝没有协整方程的原假设, 5. 87 大于5% 显著水平下的临界值3. 84, 拒绝至多有1 个协整方程的原假设, 认为至少存在2 个协整方程, 因此, 产业发展水平ISR与二产能耗ENH存在2 个协整关系。同理, 产业发展水平ISR与其他变量存在1 个协整关系, 故产业发展水平ISR与各变量间存在长期的动态均衡关系, 可进行变参数状态空间模型的估计。

3. 3 时变参数模型估计结果

根据可变参数状态空间模型, 代入新疆产业发展与资源环境相关数据估计结果如下:

式 ( 12) 表示新疆产业发展可变参数状态空间模型的量测方程, 下方括号中的数字表示Z统计量, βit分别代表资源环境变量对产业发展的动态约束关系。

表3 为资源环境各解释变量时变系数变动统计描述。资源环境对产业发展的动态约束关系如图1、2、3 所示。

图1 反映了生态环境对产业发展的约束路径。结合表3 和图1, 环境对于新疆产业发展的约束自1995 年以来, 工业废气排放对产业发展的约束一直最强, 工业固废排放对新疆产业发展的约束居其次, 工业废水排放对新疆产业发展的约束较弱, 波动幅度较大。从产业发展约束的各生态因子来看, 工业废气排放对产业发展的约束从1995 - 1997 年迅速增加, 于1997 年达到极大值0. 1445, 1998 - 2009 年间对产业结构的约束较稳定, 波动性最小, 标准差仅为0. 0209; 工业固废排放对产业发展的约束1996年增大, 1997 年约束减小, 为负值。1998 年以后, 工业固废对产业发展的约束较为稳定; 工业废水排放对产业发展的约束较弱, 自1997 年以后都为负值, 并于2003 年达到最小值0. 3611, 总体来看工业废水排放对产业发展的约束波动性最大, 标准差达到0. 1347, 且有逐渐增大的趋势。

从图2 可以看出, “九五”以来, 三产能源效率对产业发展的约束波动较大。1999 年以前, 一产能源效率对新疆产业发展的约束最大, 第三产业能源效率约束程度其次, 二产能源效率约束较弱;2000 年以后, 二产能源效率约束程度迅速增加, 一产能源效率约束程度逐渐减弱。1999 年以前, 三次产业能源效率对产业发展的约束程度较为接近, 1999 年以后, 一产能源效率对产业发展的约束程度变动较平稳, 且有逐渐减弱的趋势; 二产能源效率对产业发展的约束程度自1999 年迅速增强, 2002 年达到极大值后约束程度减弱, 2005 年后保持较高程度的约束水平, 标准差较大; 三产能源效率对产业发展的约束程度1999 年以前为正值, 2000 年后对产业结构的约束程度减弱, 2000 - 2007 年均为负值, 2001 年达到最低约束水平, 2008 年以来约束程度又有增大的趋势。

由图3 可知, 农业耗水与非农业耗水对新疆产业发展约束程度的变化较稳定, 且非农业耗水对产业发展的约束程度较小。结合表3 分析可知, 非农业耗水对产业发展的约束程度除1996 年外, 均为正值, 意味着产业结构的优化与非农业耗水成同向变动的关系。由图3 可知, 非农业耗水对产业发展的约束程度较小, 且保持较平稳的趋势; 而农业耗水与产业发展成反向变动的关系, 农业耗水约束系数较大, 即对产业发展的约束程度较大。产业结构的优化按照国际经验表现为二、三产业所占比重的提高, 新疆农业耗水占三产用水总量的90% 以上, 意味着产业结构越优化受到水资源的约束就越小。

4 结论与建议

4. 1 结论

本文采用可变参数状态空间模型, 利用卡尔曼滤波方法估计并检验新疆产业发展的资源环境约束的变参数关系, 分析结论如下:

( 1) 通过生态环境对产业发展约束的数据分析表明, 重点选取的环境因子中工业废气排放对产业发展的约束最强, 工业废水排放对新疆产业发展的约束较弱。从工业废气排放的行业来看, 电力蒸汽热水生产和供应业、非金属矿物制造业、黑色金属冶炼及压延加工业、石油加工及炼焦业、采选业是新疆向大气排放污染物的重点行业, 以上5 个行业占全行业工业废气污染物排放量的70% 以上, 其中电力蒸汽热水生产和供应业的排污量在全行业中一直位居第1。说明新疆自 “九五”以来产业结构以资源型产业为主, 从全疆排放工业废水的主要行业来看, “八五”末排放量最大的是纺织业、造纸及纸制品业, 到 “十一五”末工业废水排放量最大的是化学纤维制造业、化学原料及化学制品、食品制造业。由于产业结构的调整, 化工业得到迅速发展, 减少了废水的排放。全疆工业固体废物产生量最大的行业是采选业, 其次是电力蒸汽热水的生产和供应业、黑色金属冶炼及压延加工业, 利用率最高的是黑色金属冶炼加工业。从约束力度来看, 一直保持较平稳的趋势, 说明新疆产业结构的调整初显成效, 有很大的优化空间。

( 2) 通过资源对产业发展约束的数据分析表明, 从产业结构调整的能源约束来看, 2000 年以后, 二产能源效率约束程度在逐渐增加, 一产能源效率约束程度逐渐减弱, 三产能源效率约束程度较小。正是由于新疆新型工业化的推进, 优势资源转换战略的实施, 以石油、天然气、煤炭为主的产业结构占据了主导地位, 能源技术效率低下, 能源的约束力度较大。从产业结构调整的水资源约束来看, 农业耗水与非农业耗水对产业发展的约束程度的变化较稳定, 且农业耗水对产业发展的约束程度较大。

4. 2 建议

产业是资源的转换器, 并决定了对生态环境的胁迫, 因此, 资源环境对产业发展的约束, 最终决定于产业的发展水平, 不断合理化、高度化的产业结构是突破资源环境瓶颈的重要路径。对于新疆来讲, 首先, 加快推进新疆高效环保的现代农牧业发展, 继续推进新疆农牧特色产品生产向农牧产品流通和精深加工转变, 同时, 加快特色农牧业和绿色、有机农牧产品基地建设, 发展现代农牧业, 推进新疆农牧业由大变强的优化升级。其次, 新疆以资源为主的产业具有明显的超前发展优势, 应运用信息技术和高新技术, 提高原油和天然气开采、加工与石化后续产业的结合程度, 延长加工工艺流程和产业链, 提高附加值, 按照资源节约, 保护环境的要求, 推进节能减排, 促进新疆传统重化工业向低消耗、轻污染、高素质产业发展。新疆第三产业应重点发展金融、信息、物流、法律、咨询等生产性服务业, 并促进服务业与制造业的渗透与融合。利用新疆的地缘优势, 大力发展现代物流业, 加快构建高效、快捷、通畅、具有较强竞争力的现代物流服务体系, 打造西部物流基地或区域中心, 实现产业结构高度化。另外, 新疆应加快培育和发展战略性新兴产业, 从实际出发, 有计划地培育和发展风电产业、煤炭资源清洁利用产业, 节能环保产业、生物医药, 还有符合新型工业化要求的环保、安全生产等新兴产业, 打造环保产业体系, 逐步形成新的经济增长点。

参考文献

[1]福雷斯特.世界动态学[C].中国环境管理、经济和法学学会, 1984

[2]戴利.超越增长:可持续发展的经济学[M].上海:上海译文出版社, 2001

[3]MILLER R E, BLAIR P D.Input-output Analysis:Foundations and Extensions[J].Englewood Cliffs, 1985, 200-227

[4]张景云.江苏省沿江地区工业可持续发展对策研究——基于资源环境约束条件的分析[D].东南大学, 2006

[5]王力.环境影响下江苏省产业结构优化研究[D].江南大学, 2008

[6]张少兵.环境影响下区域产业结构优化升级研究:以长三角为例[D].华中农业大学, 2008

[7]卓锰钢.基于节能减排的浙江产业结构优化研究[D].浙江工业大学, 2008

[8]杨艳琳.中国中部地区资源环境影响与产业转型研究[J].学习与探索, 2010 (3) :154-157

[9]姚聪莉.资源环境影响下的中国新型工业化道路研究[D].西北大学, 2009

[10]张燕, 路文杰.中国产业升级路径中的资源环境影响——基于产业地位划分法的研究[J].河北科技大学学报:社会科学版, 2010, 10 (3) :11-15

[11]HARRY.Foresting Structural Time Series Models and the Kalman Filter[M].Cambridge University Press, 1999

变参数回归模型篇5

关键词：半参数模型,系统误差,大坝安全监测,偏最小二乘回归

0 引言

在数据处理中,最常用的模型是高斯-马尔可夫模型,其前提条件是假设观测值中只含有偶然误差。然而现代测量技术为大范围、长时间、不间断的测量提供了充分的可能性,使观测值中不可避免地包含有系统误差,从而对参数估计产生不可忽视的偏差。20世纪80年代统计学界提出的半参数回归模型既含有参数分量又含有非参数分量,前者用来表示观测值与影响因素之间函数关系明确的部分,为模型主体;后者表示观测值和影响因素之间函数关系不明确的部分,为系统误差,从而比经典的参数和非参数模型更具有灵活性和适用性,具有更强的解释能力,更好地满足现代测量数据处理的实际需求。

1 半参数模型及其解

Stone(1997)提出了半参数回归模型[1,2]:

式(1)中,L为n维观测向量,B为列满秩设计矩阵,X为t维参数向量,s为描述系统误差的n维向量,Δ为n维误差向量,σ0为单位权中误差,D,P,Q分别为Δ的方差阵、协因数阵和权阵。未知量为参数X和非参数s,共有n+t个未知数,方程的数目小于未知数的数目,方程无唯一解。为此,统计学者提出了补偿最小二乘准则:

式(2)中,R是一个正定矩阵,二次型s^TR s^反映对参数s^的某种度量;α是一个给定的纯量因子,在极小化过程中对V和s^起平衡作用,称为平滑因子。求解得:

式中,S=(P+αR)-1P

2 基于偏最小二乘回归的半参数模型

2.1 基本思想

大坝安全监测系统是一个复杂的非线性动态系统,而常规的统计模型:线性回归、逐步回归及偏最小二乘回归,在建模时仅仅考虑了水位、温度及时效等线性因素的影响,而忽略了其他诸多非线性因素,如岩体的压缩、地基中的裂缝、大坝内部地质条件及构造的高度非均匀性、筑坝材料及介质的各向异性以及人类活动的影响,使得最终建立的统计模型缺乏严密性和完整性[3]。

本文将半参数模型运用于大坝安全监测中,结合偏最小二乘回归,提出了一种基于偏最小二成回归的半参数模型。其基本思想是将大坝安全监测模型分为参数和非参数两部分,用参数部分来解释水位、温度和时效等线性因素对大坝形变的影响,是观测值中的主要部分;非参数部描述函数关系未知和无法参数化的部分,即模型误差,且运用半参数模型估计方法分别求得参数解与非参数解,从而达到补偿和完善统计模型的目的。

2.2 算法推导

(1)标准化处理。记F0为因变量Y的标准化矩阵,E0为自变量X的标准化矩阵,标准化处理的目的是使样本点的重心和坐标原点重合;

(2)主成分提取。首先从F0中提取一个成分u1,u1=F0C1,‖C1‖=1,则C1为F0的第一主轴。由于F0只是一个变量,因此C1是一个常数,且C1=1,故u1=F0。同时从E0中提取一个成分t1,t1=E0w1,‖w1‖=1,w1是E0的第一主轴,分别求E0和F0对t1的两个回归方程E0=t1pT1+E1,F0=t1rT1+F1,E1,F1分别为回归方程的残差矩阵。

用残差矩阵E1,F1取代E0,F0,用上述方法求C2和w2,以及u2和t2,依次计算下去,可求得第h成分th,h可用交叉有效性原则进行计算。如果进行m(m<A,A为X的秩)次运算,则E0,F0关于t1,t2,…,tm的最小二乘回归方程为:

(3)模型误差补偿。顾及到主成分t1,t2,…,tm无法完全表达对F0的影响,对公式(5)加以模型误差的补偿得:F0=t1r1+t2r2+…+tmrm+s0+Fm,s0为模型误差。运用半参数的虚拟观测法[4,5]解算得:F0^=t1r1^+t2r2^+n+tmrm^+s^。

(4)回归方程还原。由于t1,t2,…,tm均可表示成E01,E02,…,E0 p的线性组合,由偏最小二乘回归的性质得:th=Eh-1wh=E0wh*(h=1,2,…,m),

若记则标准化回归方程为:经过初始化还原,得到原始因变量Y关于原始自变量X=(x1,x2,…,xp)的回归方程:

(5)系统误差推估。假定其变化主要取决于气温、水位两个因子,引入距离函数Q:

式(7)中,H表示水位,T表示气温,下标i,j表示测期。则前n期之间的距离函数矩阵为:

则第k(k>n)期和前n测期间模型误差的函数关系为:Qk=[Qk,1Qk,2…Qk,n],则第k(k>n)期的模型误差为:sk=QkQ-1n×ns。

2.3 精度评价

衡量回归模型有效性和精度的主要指标有复相关系数及标准差,如下:

3 实例分析

某水电站属于混凝土双曲拱坝,该坝安装了变形、渗流渗压、内部观测等设备,且于2001年安装了自动化监测系统,保证了资料的连续可靠。本文对该坝11#坝段L3垂线291测点的上下游水平位移数据进行统计模型的建立和选择,计算时段取1997年1月1日至2002年12月31日共319组数据作为模型拟合数据,实测水位差、气温和上下游水平位移过程线见图1、图2和图3,并取2003年1月1日到2003年12月31日共26组数据作为模型预测数据。

统计模型取为[6]:

式(9)中,H为上下游库水位之差;Ti为位移观测日前i天的平均气温;θ为位移观测日至始测日的天数除以100;θ0为资料建模初始日至始测日的天数除以100;βj表示与因变量对应的第j个自变量的回归系数,j=0,1,…,9。

运用Matlab编程分别求解四种回归模型的系数,并进行参数的检验以及预测精度的比较,分别如表1、表2和图4所示。

从表1看出,因为三个水位因子是呈幂次关系,系数符号该保持一致,而在多元回归中,系数有正有负,毫无规律,显然不符合水位对大坝上下游水平位移的影响规律;在逐步回归中,选入了水位分量和温度分量,而未选入时效因子,从专业角度是无法接受的。相比之下,偏最小二乘回归和基于偏最小二乘回归的半参数模型的系数更加合理。表2中基于偏最小二乘回归的半参数模型的复相关系数值最大,且剩余残差平方和和标准差最小,表明其拟合效果最好。

图4中,自1999年之后s^的范围波动在±5mm内,表明大坝位移受内部复杂因素的影响正逐渐趋于平稳,一直处于良好的工作状态。图5表明,该模型的预测残差平方和略大于逐步回归,分别为55.05mm2、41.71mm2,且远小于多元回归和偏最小二乘回归。

综上所述,基于偏最小二乘的半参数模型不仅弥补了偏最小二乘回归中拟合与预测较差的不足,同时又保留了其效应量分离的合理性、方程组解的稳定性的优点,具有明显的优势。

4 结论与展望

半参数模型因其完备性及合理性,并能有效地分离出观测数据中的系统误差,实现正确的参数估计,从而被广泛应用于现代测量的众多领域。本文将半参数模型运用于大坝安全监测系统中,并与偏最小二乘回归结合,提出了基于偏最小二乘回归的半参数模型,实例分析表明该模型明显优于其他三种常规统计模型,取得较满意的结果,可为大坝安全监测资料分析与决策提供一定的科学依据。

参考文献

[1]丁士俊.测量数据的建模与半参数估计[D].武汉:武汉大学,2005.

[2]丁士俊,陶本藻.半参数回归与平差模型[J].大地测量与地球动力学,2003,23(4):111～114.

[3]袁晓峰.大坝安全监测资料分析若干问题研究[D].南昌:南昌大学,2007.

[4]朱建军,冯光财,戴吾蛟.半参数模型解算的一种虚拟观测法[J].工程勘察,2006,(9):54～57.

[5]周晓卫.基于虚拟观测的若干测量数据处理方法研究[D].长沙:中南大学,2007.

【变参数回归模型】推荐阅读：

用MATLAB回归非线性模型参数10-02

纵向数据半参数回归模型估计的r阶平均相合性11-08

自回归参数08-05

逻辑回归模型07-12

线性回归模型09-26