自回归参数(精选4篇)
自回归参数 篇1
一、引言
在回归模型y = f ( x) + ui的经典假定中, 随机误差项ui无自相关, 即Cov ( ui, uj) = 0 ( i≠j) , 如果该假设不能满足, 就称ui和uj存在自相关, 即不同观测点上的误差项彼此相关. 此时, 如果依然用最小二乘法去估计参数, 会低估参数估计值的方差, 因此, 必须消除自相关的影响.
ut的一阶自回归形式为: ut= ρut - 1+ υt, 其中, ρ < 1, υt满足经典假定.
假设检验包括4个步骤: 第一步, 提出假设; 第二步, 构造适当的检验统计量, 并根据样本计算统计量的具体数值;第三步, 规定显著性水 平, 建立检验 规则; 第四步, 作出判断.
引理多元线性回归模型总体回归函数的一般形式为: Yt= β1+ β2X2t+ … + βkXkt+ ut.
多元线性回归模型的样本回归函数为:
其中: et是Yt与其估计Y^t之间的残差.
若记: Y = [y1, y2, …, y n]T, U = [u1, u2, …, u n]T,
B = [β1, β2, …, β k]T,
则总体回归模型的矩阵形式为: Y = XB + U, 样本回归函数的矩阵形式为: Y = X^B+ e.
多元模型中回归系数的检验采用t—检验, t统计量公式为
其中: βj是回归系数估计值, n是βj的标准差估计值, , ψjj是 ( X'X) - 1的第j个对角线元素.
二、线性自回归模型的假设检验
已知时间序列 {X t}: X1, X2, …, Xn, 建立线性自回归模型:
由引理, 回归系数的显著性检验中t统计量为:βj是回归系数的估计值, 是βj的标准差估计值ψjj是 ( X'X) - 1的第j个对角线元素.
三、幂函数自回归模型的假设检验
已知时间序列 {X t}, 建立幂函 数自回归 模型Xt=αXβt - 1expμt ( μt= ρμt - 1+ υt) , 则
用 ( 1) - ρ× ( 2) , 得
由引理, 回归系数的显著性检验中t统计量为:ψjj是 ( X'X) - 1的第j个对角线元素.
四、指数函数自回归模型的假设检验
已知时间序列 {X t}, 建立指数函数自回归模型Xt=αβXt - 1expμt ( μt= ρμt - 1+ υt) , 则
用 ( 1) - ρ× ( 2) , 得
因μt= ρμt - 1+ υt, 则
由引理, 回归系数的显著性检验中t统计量为:
βj是回归系数的估计值, 是βj的标准差的估计值,
ψjj是 ( X'X) - 1的第j个对角线元素.
自回归参数 篇2
关键词:钻井液,优化设计,数据库,加权回归模型
引言
合理的钻井液设计是成功进行钻井和降低钻井费用的关键, 钻掘工程中, 钻井液优化设计主要包括性能设计和配方优选等内容[1]。要设计一套匹配目标地层的最佳钻井液方案, 首先必须明确目标地层的具体情况, 选择合适的钻井液性能设计体系, 然后依靠该体系进行钻井液的配方优化设计。随着我国钻掘工程技术逐渐与国际接轨以及计算机技术的普及, 钻掘工程项目设计在规范化、计算机化和管理现代化等方面有了新的发展条件和需求。
目前, 针对钻掘工程中钻井液主要由现场技术人员根据经验进行配方设计, 设计因人而异, 难以形成规范的工艺体系。参考国际先进技术体系, 国内许多研究机构也对钻井液优化设计进行了相关研究, 涉及体系主要包括范例模型[2]、正价优化实验、神经网络预测体系、数学参数控制体系以及专家预设计等[3]。文章参考数学参数控制体系和专家参数评分方法, 结合因子分析方法和数学建模, 建立了一种新的钻井液参数优化模型。
1 钻井液基本参数库的建立
1.1 地层的预处理
不同地层对钻井液性能的需求不尽相同, 为了满足针对钻井液参数设计的建模需求, 首先应对各工作地层进行预处理[4]。依靠专家经验知识划分钻井液指标优控区间, 使地层区别反映到钻井液控制指标的参数选择上, 这是地层预处理的主要手段。例如, 由于软弱地层孔壁自稳能力较差, 岩心保真困难, 这就要求钻井液在动切力、动塑比等性能方面进行相应的综合控制, 使之保持在各地层匹配的优控区间之内。通过地层的预处理, 划分出的代表地层指标优控区间, 是优化模型的进行运算匹配的特征参数。
1.2 添加剂性能指标的参数化
针对各类钻井液主要添加剂, 将其对钻井液性能的影响参数化, 并通过室内试验建立了优控模型基础参数库。现已纳入数据库的主要添加剂主要包括高聚物类降滤失剂CMC、高聚物类抑制剂PAM、植物胶、膨润土改型剂和碱度控制剂以及加重剂等。根据模型运算需求, 实验设计包括了比重实验、六速旋转粘度实验、漏斗粘度实验、失水率以及泥皮实验等;其中CMC、PAM、植物胶等主要添加剂分剂量水平进行交叉组合, 根据层次分析建库要求, 录取相应实测性能数据。另外, 由于各代表地层匹配的性能指标优控区间的划分主要依赖于专家知识经验, 且粘度、比重、失水率等指标的控制区间选取具有不规范性, 为了适应数学模型的运算需求, 现通过运算处理, 主要选取滤失水量API以及流变性参数n以及K值作为优控参数[5]。
2 参数的分析处理
钻井液表观粘度主要是由流体体系结构内的内摩擦作用和主辅剂高分子间交联所形成的空间网架结构所引起的, 尤其在低剪切速率的情况中这种结构表现的更加明显。所以表观粘度的数值大小直接反映着冲洗液空间网架结构构型对冲洗液性能的影响程度, 直观的表现就是排砂和携岩屑的效果。同样, 无固相冲洗液的流体形式属于假塑性流体, 流性指数n表示假塑性流体在一定剪切速率范围内所表现出的非牛顿性的程度和剪切稀释性的强弱。n值越小, 曲线的曲率越大, 流体的非牛顿性越强, 剪切稀释性也越强, 同样动塑比也说明了剪切稀释能力的强弱[6], 需要注意的是, n值并非越小越好, n值应与各地层需求匹配。这有助于冲洗液在环形空间产生较好的流核, 形成平板层流, 保证了冲洗液能有效地携带岩屑和保持井眼清洁[7];K值与冲洗液的粘度、切力有关, 其值越大, 粘度越高, 可有效包裹岩心, 提高岩心采取率及取芯质量[8], 但K值的增大会导致动切力增大, 不利于钻进效率的控制, 因此对应各地层指标匹配规则的建立, 有利于实现钻井液的最优设计。表1是基于室内试验所建立的基础数据库中的部分实验数据, 基浆为膨润土-Na OH浆液, 添加剂ABC分别代表为抑制剂PAM、高聚物VG、降滤失剂CMC。
3 加权回归分析模型的建立与实现
回归分析 (Regression Analysis) 是一种统计学上分析数据的方法, 可用于了解两个或多个变量间是否相关、相关方向以及强度, 并可依据回归关系建立模型对变量的响应关系进行预测。现选取室内数据库中高聚物类降滤失剂CMC、高聚物类抑制剂PAM、碱度控制剂Na OH等添加剂量为自变量X= (X1, ..., Xk) , n、k以及API等控制参数记做Y= (Y1, ..., YP) , 分别建立因变量y涉及k个自变量依赖关系的多元回归方程如下:
其中, β1, β2, ..., βi为偏回归系数, βi表示假定其他变量不变, 当XP每动一个单位时, YP的平均变动值。文章在模型关系中涉及了多重因子, 并且多重因子之间还具有一定的交互作用[9], 因此, 一般线性模型并不适用于钻井液参数体系的研究。
加权回归分析模型的建立以及运算使用了SPSS (Statistical Product and Service Solutions) , 即“统计产品与服务解决方案”软件。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等, 具有分析功能强大, 操作界面友好, 输出结果美观漂亮的特点。
文章以室内试验所建立的数据库为基本观察数据, 使用SPSS对数据库中一系列参数分组进行了回归分析。如不同水平的添加剂ABC组合与ND、API等控制指标的回归关系。为了利于参数分析的均衡性, 结合对实验数据的直观分析, 这里对ND等控制指标的回归分析采用权重估计。在“权重估计”界面中, 选取添加剂ABC为自变量, 其中C作为权重变量, ND作为因变量, 如图1。
计算每一步中的对数似然值, 可见, 对于幂为2时, 算出的对数似然比值最大。加权回归分析结果如表2:常数为-3.909, 对应系数分别为317.231, -24.029, -490.655。方差分析中的计算概率为0, 小于显著性水平0.05, 说明回归模型有效[10]。模型摘要中, 调整R方为0.856, 接近于1, 模型拟合较好。另外, 分别对n、k等组合进行了回归分析, 在进行适当的参数调整之后, 均能有较好的模型拟合度。
此SPSS回归分析所建立的模型, 可应用到实验数据库中未涉及的同类别不同水平的添加剂组合, 以预测其不同添加剂水平所形成的钻井液体系中ND, API, N的性能水平。将此模型封装成钻井液优化软件应用于钻井液配方的优化设计, 能避免繁复的室内试验, 高效快速地实现工程应用中的钻井液设计, 推进钻掘工程的规范化设计, 提升生产效率。
4 结束语
(1) 通过经验知识确定各代表地层的泥浆性能需求, 确定了API、ND、n值、k值等主要控制参数。 (2) 通过室内试验建立了主要添加剂的基本性能指标数据库, 并通过SPSS软件建立数学模型分析了API、ND、n值、k值与添加剂剂量水平之间的作用关系。 (3) 基于室内试验数据库建立的加权回归模型能避免繁复的室内试验, 快速高效地预测不同添加剂水平所形成的钻井液体系的性能水平, 将此模型以计算机软件作为载体应用于工程实践之中具有积极的实际意义。
参考文献
[1]王平全, 周世良.钻井液处理剂及其作用原理[M].北京:石油工业出版社, 2003, 9:323.
[2]程金霞, 郑秀华, 夏柏如.基于范例推理的钻井液优化设计系统的研究[J].探矿工程 (岩土钻掘工程) , 2005 (S1) :300-302.
[3]杜钦波, 赵正文.基于产生式的钻井液优化系统设计[J].现代电子技术, 2004 (8) :93-94.
[4]董书礼, 鄢捷年.钻井液优化设计的智能化方法[J].钻井液与完井液, 2000, 17 (4) :15-17.
[5]徐璧华, 梁大川, 罗悦, 等.基于规则推理的钻井液设计系统研究[J].重庆科技学院学报 (自然科学版) , 2011, 13 (4) :155-157.
[6]牛文琳, 陈礼仪.植物胶无粘土冲洗液的流变性研究[J].探矿工程 (岩土钻掘工程) , 2006 (1) :44-46.
[7]占样烈, 徐力生, 李月良, 等.植物胶冲洗液特殊功能及其作用机理的分析与探讨[J].勘察科学技术, 2009 (2) :34-36.
[8]王政敏.PAA高分子聚合物冲洗液在复杂地层钻探中的应用[J].2001, 37 (4) :83-84.
[9]芝顺, 曹亦薇.因素分析法[M].北京:人民教育出版社, 1999:196.
自回归参数 篇3
近年来,山东省各类保险机构数量快速增加。2011 年,全省新增保险公司15 家,共计达到61 家,保险业的辐射能力大大增加。保险需求对保险业的发展具有决定性的意义。从经济学意义上讲,保险需求即保险的有效需求,是指在一定时间内,一定的费率水平上,保险消费者愿意并有能力购买的保险商品的总量。保险需求收入弹性是指在其他影响因素不变的条件下,消费者对保险产品需求量的变动对收入变动的反应程度,即年保费收入相应于年国内生产总值GDP变化的反应程度,通常用数学指标EDI表示。EDI1 的商品称为奢侈品,把EDI1 的商品称为必需品。
许多学者都对保险需求收入弹性系数进行过定性和定量的分析。林宝清(1992)在“保险需求定量分析”中,发现保险需求收入弹性系数与GNP无显著相关关系,并测定其目标值的置信区间为1.015—1.058。李佼瑞、潘海涛(2006)利用陕西省的数据,运用模型分析法对陕西省的保险需求分析,得出总需求弹性、财产险需求弹性和人寿险需求弹性都在正常范围区域值0.84—1.2 内,仅收入对财产险和人寿险的相对影响略有差异的结论。俞雅芳(2009)利用中国1990—2007 年经济发展数据和保费收入数据,表明保险在中国还属于奢侈品。
一、指标选取与描述
1.保险深度
保险深度是指某地保费收入占该地国内生产总值(GDP)之比。保险深度等于“保费收入/GDP”,亦可看做等于“人均保费收入/ 人均GDP ”,即“保险密度/ 人均GDP ”。这一指标不是单纯地考虑保险业的发展,而是同时考虑了经济发展,即考虑了“相对于经济发展的保险业发展水平”,反映了该地区保险业在整个国民经济中的地位。保险深度取决于一国经济总体发展水平和保险业的发展速度。
2.全社会固定资产投资
全社会固定资产投资(Total Investment in Fixed Assets )是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。
3.金融深度比
GDP中流动负债的比例。正规保险市场中,金融深度比的值越高,交易成本越低。损失是影响保险需求的关键因素,因此在进行实证分析时要对损失进行控制。首先,大部分保险产品是建立在大数法则基础上的,人口的多少很重要,人口越多,总保费越大。所以,选用收入基尼系数,一般来说,收入与财富有很强的正相关性。
二、计量模型设计
基于以上因素考虑,我们用下面的部分线性回归模型,在线性回归模型的基础上包含了非参数部分,利用半参数方法来做实证分析,检验山东省各县市区保险需求的弹性系数。
其中Di是总保费,Wi是总财富值,b是向量参数,Xi是回归模型中可控变量,εi是随机误差项,i是地区变量。方程两边求导数得到
其中 η 是保险收入的弹性系数EDI。因此,当f′(Wi)<0,即 η<0,即保险是必需品;当f′(Wi)>0,即 η>1,保险是奢侈品。
三、实证分析
本文采用的是鲁东地区、鲁西地区、鲁北地区以及鲁南地区的各县市区2009—2010 年经济指标数据,剔除缺失数据。数据来源于2011 年金融年鉴。
注:(1)***、**、* 分别表示回归系数在1%、5%、10%的显著水平下显著;(2) 半参数回归中,模型1:df=1,spar=280700,knots=16;模型2:df=1,spar=270000,knots=17。
表1 报告了半参数回归结果。回归结果显示,第一,人口对保险深度有显著的正向影响,即表明人口越多,保险深度越大。第二,城乡收入差距对保险深度有显著的负向影响,这表明城乡收入差距具有负的外部效应,对保险发展有负的影响。第三,金融深度比对保险深度有正的显著影响,即金融深度比越高,保险深度越大。第四,赔付率对保险深度有负的显著影响,即赔付率越大,保险深度越小。
图1 报告了2010 年保险深度与GDP之间的关系。图2显示,随着GDP的增长,保险深度不断增加,呈一个向上的斜线。这表明保险需求收入弹性大于1,保险是奢侈品。从2010年与2009 年半参数回归结果的图示上看,保险产品是奢侈品具有稳健性,所以2010 年的结果是正确的。
四、结论
通过山东省鲁东地区、鲁西地区、鲁北地区以及鲁南地区的各县市区2009—2010 年经济指标数据的实证分析,可以看出,2010 年保险总需求收入弹性系数大于1,保险产品是奢侈品。这表明,山东省保费收入的增长依赖于经济水平的增长,所以要扩大山东省的保费收入,在保持经济水平的平稳快速增长的同时,要缩短城乡收入差距,减少赔付率,这样才能促进保费收入的增长,从而拉动保险需求对收入的弹性增长。
摘要:运用山东省鲁东地区、鲁西地区、鲁北地区以及鲁南地区的各县市区2009—2010年经济指标数据,对山东省保险需求收入弹性进行了实证分析,结果表明,山东省保险产品是奢侈品。因此,只有加快经济发展,缩短城乡收入差距,减少赔付率,才能增加保费收入,拉动保险需求对收入的弹性增长。
自回归参数 篇4
在城市中, 干道网密度相对较高, 交叉口繁多, 将相邻交叉口之间连接起来进行协调控制[1], 可以使干道上的车辆到达每个路口时都遇到绿灯, 能连续不停顿地通过交叉口, 减少延误。目前, 干线协调控制在城市交通信号控制中应用广泛, 但控制方法都侧重于对交叉口或干线系统进行静态最优化控制, 缺乏对交叉口及干线系统的运行状态进行预判。本文依据检测器数据, 预测系统未来交通状况, 并依据预测结果调整控制策略及信号配时参数, 为协调控制提供一种新思路。
1 干线协调控制设计
干线交通信号协调控制是指通过调节主干道上各信号交叉口之间的相位差, 使干道上按照接近设计车速行驶的车辆获得连续的通行权。干线信号控制的分类形式有很多种, 从控制方法上可分为:定时控制、感应控制、自适应控制。在干线协调控制的方案设计中, 首先计算线控系统的周期时长, 根据每一交叉口的平面布局及计算交通量, 按单点定时控制的配时方法, 确定每一交叉口所需的周期时长。以所需周期时长最大的交叉口为关键交叉口, 以此周期时长为线控系统的备选系统时长, 再计算线控系统中各交叉口的绿灯时间, 确定信号相位差, 最后通过车辆平均延误、排队长度等交通评价指标来评价方案效果[2]。
2 基于非参数回归预测下的干线协调控制设计
2.1 短时交通预测
国内外对短时交通预测提出了很多方法, 有历史均值法、回归预测法、神经网络预测法、时间序列法、卡尔曼滤波法、复合预测算法等。其中历史均值法、回归预测法都比较简单, 但未能反映交通流过程的不确定性与非线性, 而非参数回归是近几年兴起的一种适合不确定性的、非线性的动态系统的非参数建模方法, 比较符合短时交通流所具有的不确定性和时变性的特征。它不需要先验知识, 只需要足够的历史数据, 它寻找t时刻历史数据中与当前点相似的“近邻”, 并将历史数据库中下一时刻t+1的交通量作为预测值, 从而对短时交通流量进行实时准确预测。
本文采用的K近邻的非参数回归方法, 是利用K个历史库中的最近邻的K个数据进行预测。对于近邻K的选取, 足够充足的历史数据更易找到与现状相似的演变趋势, 但冗余的数据又会耗费算法的运行时间, 因此, K值的选取显得尤为重要。根据经验, 本文选取K=5, 即以过去五组数据作为历史数据库。
通过道路上的车辆检测器采集各车道车流数据, 本文选取连续5天的交通流量作为历史数据库。以15分钟作为控制单位采集交通流量, 并以时间顺序排列, 定义t, t-1, t-2, t-3时刻的交通量为状态向量X=[V (t) , V (t-1) , V (t-2) , V (t-3) ]。定义历史数据库中相同时间状态向量Xhi=[Vhi (t) , Vhi (t-1) , Vhi (t-2) , Vhi (t-3) ]。历史数据对应的下一个时刻流量为Vhi (t+1) , (i=1, 2, ...k) 。
计算现状状态向量X与历史状态向量Xhi的离差平方和di=[ (V (t) -Vhi) t) ) 2+…+ (V (t-3) -Vhi (t-3) ) 2]1/2。其中di表示现状向量与第i组历史数据比较而得到的距离, 文中采用k=5, 五组历史数据, 因此共有i=5组距离。并使用带权重的预测算法, 采用如下形式:
带权重的预测算法认为, 历史数据库中和当前观测值更为接近的数据更能体现出交通状况的变化趋势。其中, V (t+1) 是预测出的下一15分钟的车流量[3,4,5]。
2.2 交通状态选择
对于交叉口, 交通量的变化具有一定的规律, 一天之内的交叉口按一定规律变化着。如图一所示, 采集某交叉口连续6天的流量数据, 呈现出一定的规律性。
本文利用历史交通流的相似性, 对所有的交通流量进行分类, 划分若干个交叉口状态, 并对应交叉口状态计算周期[6]。图一可划分5个交通状态, 如表一所示。
表一所示的周期采用韦伯斯特提出的最小车辆延误周期方法计算。
2.3 短时交通状态预测下的干线协调控制
本文采用单向干线协调控制, 通过车辆检测器采集干线上需要协调控制的各交叉口交通流量, 当数据足够构成状态向量X=[V (t) , V (t-1) , V (t-2) , V (t-3) ]时, 预测t+1时刻即下个15分钟交通量V (t+1) 。继而得出交叉口预测交通状态, 并根据状态划分得出对应周期C1-C5, 则这个干线上所有交叉口的预测周期记为C={C1, C2, C3, …, Ci}, i代表交叉口序号。选择当前干线中最大的交叉口周期CL=max{C}作为公共周期。并调整绿信比, 计算相位差, 整个干线自适应协调过程流程如图二所示。
3 方案验证
在方案中, 短时交通预测的准确性是实现协调控制的关键。为了检验预测模型的预测效果, 以图一中前5天数据作为历史数据, 以第6天0∶00~0∶45, 即V (t) , V (t-1) , V (t-2) , V (t-3) 流量数据构成状态向量, 利用MATLAB编写代码进行非参数回归预测, 拟合过去5天历史数据, 预测结果如图三所示。
通过图三可以看出, 非参数回归预测结果具有较强的实时性, 基本上呈现了一天的交通趋势。
保证了预测的可靠性后, 利用微观仿真软件VISSIM进行仿真实验, 利用软件提供的COM类型库, 通过C++编写控制算法, 获得仿真结果。本实验主要采用主干路上连续4个交叉口作为算法的验证对象, 其中交叉口间距分别为320、370、270米。路网绘制采用地图的卫星图层数据, 结合实地采集的交叉口结构数据, 再绘制与实际路网相同的交叉口路网。如图四所示。
在该路网上分别实行非绿波控制方案、绿波控制方案及自适应绿波协调控制方案。自适应绿波协调控制按照本文所述采用15分钟预测周期, 获取新的预测周期后重新计算新的相位差。三种方案最终以干线延误、全路网延误和路网车辆平均停车次数为评价指标, 统计的仿真时间为0~57600仿真秒。实验结果分析干线延误仿真结果对比如图五所示。
从图五可以看出, 非绿波控制平均延误明显大于其他两种控制方式, 且基于非参数回归预测下的干线协调控制方法较普通协调控制有所改善。
4 结束语
通常的交通信号模型都是基于优化指标, 如车辆延误、排队长度等建立的, 很少有对于单个交叉口的相位选择建立模型。本文采用无模型控制策略, 依照历史交通流量数据对交通状态进行预测, 实时监测并预测交叉口当前交通状态, 依据预测的交通状态调整控制策略, 更改信号配时参数。通过仿真实验表明, 此方法有效的提高了交叉口的通行能力, 减小了交叉口延误, 改善了交叉口服务水平。
摘要:城市干线协调控制是智能交通研究的关键环节。由于交通流是一个时变的、复杂的非线性系统, 具有高度的不确定性、随机性, 因此很难建立准确的模型, 针对这一问题, 本文采用非参数回归预测的方法对交通量进行预测, 并运用到干线协调控制中, 根据预测出的各交叉口短时交通量对干线协调控制进行配时设计。通过仿真表明, 该方法能有效减少交叉口平均延误。
关键词:非参数回归,短时预测,协调控制
参考文献
[1]李元, 余立建, 张乐.城市交通干线协调控制[J].交通科技与经济, 2014, 16 (03) :25-29.
[2]宋现敏.城市交叉口信号协调控制方法研究[D].长春:吉林大学, 2008.
[3]李振龙, 张利国, 钱海峰.基于非参数回归的短时交通流预测研究综述[J].交通运输工程与信息学报, 2008, 6 (04) :34-39.
[4]屈莉, 兰时勇, 张建伟.基于浮动车数据非参数回归短时交通速度预测[J].计算机工程与设计, 2013, 34 (09) :3298-3301.
[5]张涛, 陈先, 谢美萍, 等.基于K近邻非参数回归的短时交通流预测方法[J].系统工程理论与实践, 2010, (02) :376-384.
[6]方良君.短时交通状态预测下的动态交通信号控制方法研究[D].杭州:浙江工业大学, 2013.
【自回归参数】推荐阅读:
变参数回归模型06-24
用MATLAB回归非线性模型参数10-02
自适应回归07-25
向量自回归09-04
线性自回归11-01
周期自回归模型07-02
参数自调整11-09
PID参数自整定10-13
参数自适应PID控制11-19