高斯分布模型(精选7篇)
高斯分布模型 篇1
摘要:采用高斯扩散方程建立了烟雾扩散-衰减控制模型, 介绍了参数的确定。基于建立的模型, 研究了烟雾突增条件下, 单一火灾点源在稳定风场作用下及两个点源共同作用时的烟雾高斯扩散-衰减规律, 并讨论了该模型的合理性。
关键词:火灾烟雾,扩散模型,高斯分布,衰减规律
火灾的危害主要来自两个方面:一是火源失去控制蔓延发展而给人民生命财产造成损失;另一方面是烟雾的快速、大面积扩散导致被困人员由于缺氧窒息而死, 同时火灾发生后会产生很多有毒的烟雾。据消防部门统计, 火灾中由于窒息致死或被有毒气体毒死的人数占火灾总死亡人数的60%以上。对烟雾扩散模型的研究不但可以揭示烟雾扩散过程, 还可反映出不同区域烟雾的浓度, 从而为消防人员制定火灾救援预案提供依据。
笔者假设以一个火灾点源为中心的烟雾强度情况满足高斯分布, 在此基础上建立了火灾烟雾扩散模型。
1 烟雾扩散与衰减规律模型
建立烟雾在大气中的扩散模型多以高斯模型为出发点, 在阅读相关文献的基础上, 假设以一个火灾点源为中心的烟雾强度情况满足高斯分布, 如式 (1) 所示。
式中:C为距离火灾点源距离为r的点的烟雾强度;C0为该区域的烟雾强度的背景值;S为火灾点源处烟雾强度;b为高斯分布参数;r为某点距离火灾点源的距离。
若存在两个火灾点源M、N共同作用, 则任何一点的烟雾高斯浓度具有可加性, 由M、N的作用叠加得到, 源M作用为SM (t) exp (-rM2/bM) , 源N作用为SN (t) exp (-rN2/bN) , 叠加结果如式 (2) 所示。
式中:SM (t) 、SN (t) 分别为源M、源N强度;C0为烟雾浓度背景值;rM、rN分别为待求点距源M中心、源N中心的距离;bM、bN分别为源M、源N的高斯分布参数。
其次, 将天气影响以影响系数的方式加入上面的表达式, 由此得到任何一点烟雾的实际浓度C (x, y, t) 的分布模型如式 (3) 所示。
式中:rwv为风速影响系数;rwd为风向影响系数;r湿为湿度影响系数, 含降水作用影响。
2 模型参数的确定
(1) 浓度背景值C0:烟雾浓度背景值为在没有其他烟雾源时, 当地自然条件下产生的烟雾浓度值。依具体场地背景而言, 简单起见, 分析时也可以取值为0。
(2) 高斯分布模型参数b:平面区域内计算已知点源的高斯分布模型参数b时, 直接利用点源和某个相应的受影响点之间的关系, 即它们相距的距离和各自的烟雾强度, 代入式 (4) 就可得到b值。
对于不严格满足高斯分布的情况, 采用一种平均统计学方法, 火灾点源周围有若干受影响的点并已知这些点的烟雾强度的时候, 对于每一受影响点和源点列出一个方程求解相应的b值, 然后求出所有b值的平均值作为这个区域的高斯分布参数。简称这种方法为平均值高斯参数计算法, 如式 (5) ~式 (6) 所示。
(3) 风速影响系数rwv:已有研究表明, 烟雾浓度与风速呈现一定程度的负相关。这是因为风速的大小会影响烟雾颗粒的水平输送。当风速偏大时, 扩散条件好, 烟雾容易引起迁移。相比之下, 静风小风条件容易造成颗粒物的局地累积。有学者研究表明, 一般当风速小于2m/s时, 两者的相关性不很明显;但风速超过2m/s时, 风速使得颗粒物浓度明显降低。当风速达到一定程度时, 颗粒浓度开始上升, 因为大风开始将地面灰尘大量吹到空气中, 增加了其中的颗粒物含量。如式 (7) 所示。
数值范围与变化趋势:wv1可取为1, wv2、wv3、wv4取值先降低后升高, 非线性变化。数值确定方法:将已知记录点的数据代入模型, 结合上述判断, 进行参数反演。
(4) 风向影响系数rwd:除了风速, 烟雾浓度也同时受到风向的影响。迎风向浓度减小, 背风向浓度增大。对每个区域给出相应的参数值如式 (8) 所示。
数值范围:wd迎处于0~1之间;wd背大于1。数值确定方法:将已知测点数据, 代入模型, 结合上述判断, 进行参数反演。
(5) 湿度影响系数r湿 (包括降水作用分析) :已有研究结论表明, 不降水时, 空气中水分加多会加重颗粒物的累积程度, 烟雾浓度与空气湿度呈现一定程度正相关, 即空气湿度增加, 烟雾浓度上升。一旦发生降水, 则对颗粒物有非常显著的清除作用。经历一次湿沉降, 颗粒物的浓度会大幅下降。如式 (9) 所示。
其中, e1、e2、e3大于1, 非线性变化;er1、er2、er3小于1, 非线性变化。数值确定方法:需采集湿度、雨强等数据, 研究合理的级别划分及相应的参数取值。
3 烟雾扩散模型的讨论
3.1 单一火灾点源时烟雾扩散评估
根据上述建立的模型, 以单一点源在稳定风场作用下的高斯扩散模型进行模拟。为分析方便起见, 去掉浓度背景值项, 则有场内任意点的高斯浓度如式 (10) 所示。
式中:径向距离;S为点源烟雾浓度; (x0, y0) 为点源坐标;b为高斯分布参数。
建立一个理想的稳定风场, 场内各点风向、风速均相同, 风速大小为v2。假设烟雾高斯扩散速度为v1, 烟雾在风中的扩散速度与风速成正比, 其值为kv2。则烟雾顺风向扩散速度为v1-kv2, 逆风向扩散速度为v1+kv2, 斜风向扩散速度介于两者之间, 大小为v1+kv2cosθ, θ为v1方向与v2方向的夹角。此时烟雾扩散场如图1所示。
则风场作用下的浓度分布函数图像, 是在高斯浓度分布函数图像上作了平移和拉伸两种变化之后得到的, 图1中函数表达式具有如下的形式:记偏移量为 (Δx0, Δy0) , 拉伸系数为k2, 下风向的浓度分布如式 (11) 所示。
规定安全浓度限值为C限, 则由式 (12) , 可得式 (13) 。
如图2所示, CAB边界上满足扩散速度等于0, 如式 (14) 所示。
假定高斯扩散的扩散速度v1大小与浓度梯度成正比, 如式 (15) 所示。
则由式 (16) 可确定CAB边界的位置。
BEDC边界上满足浓度值等于安全区浓度限值, 如式 (17) 所示。
这样, 稳定扩散场已经建立, 在此基础上考虑时间因素, 就可以对区域内任意一点的浓度变化进行判断。
3.2 两个火灾点源时模型参数的影响
模型参数对烟雾扩散的影响较大, 针对不同的点源, 强源、弱源的衰减规律不相同。b值对火灾烟雾扩散的影响见图3~图5所示, 表示的是当两个强源、两个弱源、一强一弱源作用时烟雾扩散规律。由图3~图5可知:此模型中模型参数bM、bN对扩散半径的影响较大, 当两弱源或两强源共同作用时, 烟雾扩散半径随着b值的增大而增大, 而烟雾浓度衰减速率随着b值的增大而减小。其中两弱源共同作用时 (如图3 (a) ) , 烟雾浓度仅在靠近火源处达到局部峰值, 且衰减迅速。当一强一弱源作用时, 烟雾扩散半径随着强弱火源b值差距的减小而增大, 其浓度衰减随着两者b值差距的减小而减弱。当一强一弱火源b值差距很大时 (如图4 (a) ) , 烟雾浓度出现明显峰值, 且衰减迅速。另外, 湿度、风特性在模型中仅作定性探讨。
4 总结
建立了以高斯方程为基础的火灾烟雾扩散-衰减模型, 并对模型的参数进行了讨论与分析。该模型在一定程度上能合理地揭示烟雾扩散-衰减规律, 反映出不同区域烟雾的浓度, 并为消防人员制定火灾救援预案提供基础性数据依据。但是模型中一些参数现阶段仅为定性给出, 后期需要大量数据的支撑和修正。如参数的确定对环境的依赖性比较强, 需要大量采集风速、湿度、雨强等数据, 研究合理的级别划分来采用相应的参数取值。因此, 可在此模型的基础上进一步深入, 研究多个参数的权重系数, 对各参数的影响重要性有更直接的了解以便于应用。
参考文献
[1]秦培煜, 陈传波, 吕泽华, 等.基于物理模型的烟雾实时模拟[J].小型微型计算机系统, 2007, 28 (8) :1486-1488.
[2]孟强龙.烟雾的物理模型及其模拟[D].合肥:安徽大学, 2010.
[3]张子波, 李自力, 王瑶.用修正的高斯模型计算天然气稳态扩展[J].石油天然气学报, 2010, 32 (1) :369-371.
[4]方学荣, 冯平.高斯函数的性质[J].新疆师范大学学报 (自然科学版) , 2004, 23 (2) :13-15.
[5]关世钧, 王学峰.连续点源泄漏事故的数学模型研究[J].消防科学与技术, 2004, 23 (4) :313-316.
[6]张文艳, 姚安林, 李又绿, 等.风力对天然气管道泄漏后扩散过程的影响研究[J]天然气工业, 2006, 26 (12) :150-152.
[7]孙昊.有风条件下髙层建筑烟气蔓延规律的研究[D].淮南:安徽理工大学, 2012.
[8]由颖, 王君, 王静巍.基于复杂环境的烟雾扩散模拟方法[J].沈阳工业大学学报, 2009, 31 (3) :333-350.
[9]许峰, 于春雨, 徐放.视频烟雾火灾探测技术研究趋势[J].消防科学与技术, 2012, 31 (11) :1185-1188.
[10]李逸轩.火灾蔓延损失与出警模型研究[J].消防科学与技术, 2013, 32 (3) :322-324.
高斯分布模型 篇2
此外, 电力系统负荷预测模型一般关注负荷时间序列的一阶矩, 即从数学期望层面上讨论, 而综合考虑时间序列的高阶矩预测模型则相对鲜见。这里所建的非高斯分布GARCH模型包含的条件方差方程, 为剖析时间序列二阶矩提供了平台。
1 ARCH模型简介
时间序列建模时常出现波动集聚现象。时序的二阶矩在某个时期密集地出现高值, 在某个时期密集地出现低值。这种异方差现象不可忽视。
1.1 标准GARCH模型
ARCH模型[9,10]通常可用于时间序列模型的随机扰动项建模。
对于模型均值的方程:
如果有
条件方差方程为
vt~i.i.d.N (0, 1) , 即vt服从正态独立同分布;α (B) 为滞后算子多项式;ht为εt的条件方差。需同时满足非负约束条件和二阶平稳约束条件。
GARCH模型[11]为广义自回归条件异方差模型。
引入滞后算子B, GARCH (p, q) 的条件方差为
其中, α (B) 为滞后算子, p≥0, q>0, α0>0, αi≥0, i=1, 2, …, q, θj≥0, j=1, 2, …, p。且满足模型的二阶平稳条件:α (B) +θ (B) <1。
一般参数p、q均取1的GARCH (1, 1) 模型即可描述大量时间序列的波动集聚效应。为和下述GARCH-t和GARCH-GED相区别, 本文称采用正态分布假设的GARCH模型为标准GARCH模型。
1.2 厚尾特征与非高斯条件分布
在很多应用场合, 随机过程的分布具有极厚的厚尾特征[12]。不仅εt的无条件分布是厚尾的, 甚至条件分布可能也是厚尾的。为了进一步增强刻画随机过程的分布厚尾的能力, 可以考虑将式 (1) 中的vt由服从正态分布扩展成为服从尾部较厚的非高斯分布, 如t分布和广义误差分布 (GED) 。
1.2.1 t分布
t分布在自由度为无穷时, 渐近变为正态分布;通常情况下则拥有比正态更厚的尾部。当模型中vt服从t分布时, GARCH-t模型比标准GARCH模型更适合描述具有厚尾特征的时间序列。
1.2.2 GED
GED概括性较强, 其概率密度函数为
当厚尾参数v=2时, GED退化为正态分布, v<2时, GED较正态分布有更厚的尾部。
1.3 ARCH效应检验
判断一个序列 (如模型残差{εt}) 是否存在ARCH效应, 最简便也是最常用的检验方法是拉格朗日乘子检验, 即LM检验。
1.4 模型参数估计
ARCH模型参数的估计方法主要有2大类:极大似然估计 (MLE) 和矩估计 (ME) [13,14,15]。似然函数可求时, 一般倾向于采用MLE。这里采用MLE。
通过最大化条件对数似然函数, 可得标准GARCH模型的参数估计。
当vt服从t分布时, 参数估计变为在自由度k>2约束下使条件对数似然函数最大化问题, 函数形如
当vt服从GED时, 其有待最大化的条件对数似然函数形如
其中, 厚尾参数v>0, 当v<2时, GED拥有比高斯分布更厚的尾部。
2 算例分析
现结合日用电量时间序列传统模型分析ARCH效应, 并在标准GARCH模型基础上建立了非高斯分布GARCH模型。最后, 将非高斯分布GARCH模型、标准GARCH模型以及传统的自回归移动平均 (ARMA) 模型作了综合比较。
2.1 数据
选用南京地区日用电量数据进行时序建模。样本空间为2002年1月至2004年5月。使用所建各种模型分别对2004年6月4个星期的日用电量数据进行预报, 以检验和比较各模型的预测能力。
2.2 GARCH效应分析
用电量时间序列建模均值方程采用乘法模型:
其中, Ttrend、Sday、Iday依次为趋势变动分量、季节变动分量、不规则变动分量。
2.2.1 趋势分量与季节分量的提取
趋势分量利用指数模型刻画, 表达式如下:
季节分量Sday的提取, 采用了文献[1]的日负荷数据广义季节调节技术。至此, 已获取Ttrend、Sday。
2.2.2 不规则分量建模
首先, 使用ADF test、PP test验证了Iday序列的平稳性, 确认ARMA建模前提是满足的。
参考Iday序列自相关函数 (ACF) 和偏相关函数 (PACF) , 比较可行阶的ARMA模型的赤池信息准则 (AIC) 和贝叶斯信息准则 (BIC) , 最终筛选出阶数最为适当的ARMA模型。
经权衡各个模型的AIC、BIC, ARMA (15, 19) 优于其他备选模型, 模型参数估计结果参见表1。
注:C为参数估计的截距项;AR (i) 、MA (i) 分别为滞后i阶的AR项系数、MA系数的参数估计。
本ARMA模型参数均显著, 信息指标良好, 但是如果考察模型残差平方时序的ACF, 可以观察到显著的相关关系, 即残差时序似乎是非独立的。
下面使用LM检验就此问题给出一个相对正式的统计检验。经初步计算, ARCH (1) 效应检验中LM值远高于临界值, ARCH (1) 效应是极为显著的。随后动态调节LM辅助方程的q值, 可以进一步分析ARCH (q) 效应的存在性。
不同q值对应的LM值绘成曲线如图1所示。由图1可见, 所有阶次对应的LM值均比较高 (即从低阶到高阶ARCH效应都是显著的) , 残差非独立。鉴于传统模型的同方差假设是不满足的, 方程残差的条件方差改为时变方差较为合理。
2.3 非高斯分布GARCH建模
残差的这种非独立性一定程度上可以用GARCH模型加以刻画。
模型均值方程定阶方法如前, 在反复比较大量备选模型之后, 可得新模型ARMA (15, 15) -GARCH。
使用MLE估计GARCH-GED、GARCH-t模型的参数 (标准GARCH模型的参数估计亦列于后, 以供比较) 。3种GARCH模型的均值方程参数估计见表2。
标准GARCH模型条件方差方程为
GARCH-t模型的条件方差方程为
同时估计得t分布自由度k=4.366 450, 显然具有比正态假设更厚的尾部。
GARCH-GED模型的条件方差方程为
其中, 厚尾参数v=1.204 462<2, 正符合GED拥有厚尾的情形。同时也为厚尾假设选取的合理性提供了依据。在这个问题上, 2种非高斯分布GARCH模型的结论是一致的。
由表2可见所有模型均值方程参数的显著性情况均良好 (条件方差方程亦然) 。并且本算例中, GARCH采用厚尾分布假设有数理依据, 可通过比较考核非高斯分布GARCH模型的预测能力。
2.4 预测结果
预测模型乘法模型形式为
其中, I!day依次采用ARMA、标准GARCH、GARCH-t、GARCH-GED模型的预测值。
分别使用上述模型进行样本外预测, 将4周数据的预测值和真实值对比, 计算出预测误差, 并归纳其统计特性如表3所示 (用GARCH-GED模型代称TtrendSdayIGARCH-GED模型, 余者类同) 。
其中, GARCH系列模型平均大误差归算方法为
式中j为ARMA模型中预测误差>3%或>4%
的诸点的序号。
通过表3的对比, 不难得出3点结论。
a.从平均误差指标看, GARCH系列模型均稍优于ARMA模型。其中GARCH-GED模型表现最好。
b.对比各种模型的最大预测误差, GARCH系列模型有一定优势。其背景是因为该最大误差是正在波动集聚的状态下出现的。模型的GARCH部分一定程度上捕捉到了这一信息。在大误差 (3%、4%) 抑制这项指标上, GARCH系列模型相对ARMA模型有一定改进, 且本算例中GARCH-GED表现最出色。
c.以GARCH-GED为代表的非高斯厚尾分布假设GARCH模型总的实际预测能力在均值意义上不逊于ARMA模型 (本文算例中略胜一筹) , 在一些统计指标上非高斯分布GARCH模型甚至略优于标准GARCH模型。考虑到厚尾假设模型参数估计中参数的显著性水平, 可以认为非高斯厚尾假设的选取是有理论依据的。
此外, 不容忽视的一点是, 非高斯分布GARCH模型不存在同方差假设问题的建模瑕疵, 从数学严密性角度看, 同样具有较完善的理论背景。
3 结论
基于对负荷时间序列ARCH效应的研究, 在为负荷时间序列建立标准GARCH模型基础上, 从vt角度扩展了GARCH模型, 并建立了非高斯分布GARCH模型 (GARCH-t、GARCH-GED) 。算例表明, 所提出的非高斯分布GARCH模型预测能力良好。
此外, 标准GARCH模型可归于GARCH-GED的一个特例情况 (v=2) 或GARCH-t (自由度k∞) 的极限情况, 非高斯分布GARCH模型 (如GARCH-GED) 比标准GARCH模型具有更为细致地刻画尾部特征的能力, 模型概括性更强, 适用范围更广。
总之, 基于非高斯分布GARCH模型为电力系统短期负荷预测提供了一种思路, 理论层面设计较为完备, 具有一定的实际应用意义。
摘要:提出一种基于非高斯分布的广义自回归条件异方差 (GARCH) 模型的短期负荷预测方法。在论证自回归条件异方差 (ARCH) 效应存在性的基础上, 将标准GARCH模型的正态条件分布假设推广为非高斯条件分布的形式 (t分布、广义误差分布) 。用极大似然估计获得ARCH族各模型的参数估计, 建立了非高斯分布假设GARCH模型 (GARCH-t, GARCH-GED) 。比较了ARMA、标准GARCH、非高斯分布GARCH模型的预测能力, 分析平均预测误差、最大预测误差能力等指标显示GARCH-GED模型表现最出色。算例表明, 基于非高斯分布GARCH负荷预测模型是有效而可行的。
高斯分布模型 篇3
关键词:项目测试进度管理分析,高斯分布,S型曲线
项目进度管理是根据工程项目的进度目标,编制经济合理的进度计划,并据以检查工程项目进度计划的执行情况,若发现实际执行情况与计划进度不一致,就及时分析原因,并采取必要的措施对原工程进度计划进行调整或修正的过程。该文着重介绍测试阶段的进度管理方法,当然这个方法也可以应用到其它的阶段。在实际工作中往往出现一个测试项目需要持续几个月甚至几年,那么如何衡量这当中的进度是否可控就成为了项目成功与否的关键。笔者通过建立测试项目的测试执行情况和测试的成功率的S型曲线,然后每周只要把当周的测试执行及成功状态与其相比就可以反映出测试是否按计划进行,是否在可控范围。
1 高斯分布适用于进度管理测试依据
在软件测试过程中,很多情况下会以测试用例的权重作为衡量测试用例工作量的一个指标,但是这个指标是基于测试人员按照一定的速率来完成所有不同的测试任务。这样的话测试进度其实是一个线性的增长的过程,实际情况却并非如此。测试人员在接到新的测试任务时往往是需要一定的热身Ramp-up时间,来熟悉整个测试任务。经过这段时间后,测试的效率及质量都会有所提高,并且持续提高,到项目接近尾声时,需要测试的工作减少,而慢慢进度缺陷修复阶段,测试进度就趋于平缓。整个这样的过程就可以用一个S型曲线(S-curve)来表示。类似于图1。
目前这样的S型曲线在测试进度管理中非常流行,用型曲线作为预计,然后根据每一周期的实际情况来衡量是否符合预计。如果低于预期,寻找原因,并解决,到下一周期再看是否赶上进度;如果高于预期,则看是否因为客观原因改变,如测试人员增加等,使实际超出预期,如果不是,是否因为测试不够深入等,通过这样的一条曲线就可以来衡量进度。并且对于管理人员来说,找出实际的数据是非常重要的,然后每周只要把当周的测试执行及成功状态与其相比就可以反映出测试是否按计划进行,是否在可控范围。
2 测试项目的S型曲线(S-curve)的绘制
高斯分布累积分布函数是指随机变量小于或等于的概率,用概率密度函数表示为:
高斯分布的累积分布函数能够由一个叫做误差函数的特殊函数表示:
因为高斯分布的曲线的累加就是一个S型曲线,于是可以选择高斯分布作为画S型曲线(S-curve)的数学模型。
S型曲线的绘制步骤如下:
1)确定测试进展速度曲线
根据每单位时间内完成的任务量(实物测试量、投入劳动量或费用),计算出单位时间的计划量值(qt)
2)计算规定时间累计完成的任务量
其计算方法是将各单位时间完成的任务量累加求和,可以按下式计算:
式中:Qj——时刻的计划累计完成任务量;
qt——单位时间计划完成任务量。
3)绘制S型曲线,按各规定的时间及其对应的累计完成任务量Qj绘制S型曲线。
在这里选择用excel来画这样的曲线。首先在excel中录入以下数据,如图2。
项目的持续时间(duration),需要手动填入,这里以一周为周期,如果项目为12周,就填写"12"在duration那栏。接下来填写“总执行点”(total execution points),这个的填写根据不同项目的总点数。实际工作中这个数据一般很难估计,需要有一段时间的历史数据积累才能估算的比较准确。不妨可以采用以下几种估算的方法:
1)根据每个测试人员每天可以测试的点数为基准,然后乘以测试持续时间得到。
2)根据开发人员的开发周期估算,每一个人天的开发工作需要相应多少的测试点数,再乘以开发周期得到。
3)根据项目的大小估算,以前一个相同大小的项目的测试点数得到。
Alpha(α)值根据duration值就确定了,是duration的一半Beta(β)值则可以相应的调整曲线的陡峭程度,调整好这些以后就会得到图3的表格。
根据这个表格就可以画出每周需要测试点数的高斯分布图,如图4。
这些值的累积就是S型曲线,如图5。
这样第一个S型曲线就完成了,通常情况下,测试项目除了需要了解测试执行情况以外还需要了解测试的成功率,于是可采用相同的方式画出项目成功率估算的S型曲线。得到图6。
这样就有了两条曲线,偏上一条表示测试进度,偏下一条表示测试成功的进度状态。有了这样两条曲线(projection)后,每周只要把当周的测试执行及成功状态与其相比就可以反映出测试是否按计划进行,是否在可控范围了。
3 利用S型曲线分析测试进度
接下来就是在以上曲线基础上加入现状进行分析了,例如目前有一个测试项目,总共执行点数120点,需要在12周完成。相应的会有这个测试的执行笔录(execution record),并且总点数为120。当测试人员执行了相应的测试用例后,会在标记执行情况,测试组长或者项目管理人员就可以通过报表功能收集目前为止已测试点数的统计数据。
这样可以每周获取一次数据,需要的数据是执行了多少点,成功了多少点。拿到这样的数据,利用这些数据每周更新下图,来比较项目实际执行情况与预期是否相符。如图7。
分析:通过上图就可以看到第1-2周的数据跟我们的预期相符;第3-4周的数据远低于我们预测,这样对于管理人员来说就需要对其进行分析相应的采取措施已使项目回到正轨。第7周的数据远过我们的预测,或许是因为加强了技术,项目增加加了人手,或者质量很高,没什么问题,所以测试进度就提前了。
参考文献
[1]Patton R.软件测试[M].张小松,译.北京:机械工业出版社,2006.
[2]陈纪修,於崇华.数学分析[M].北京:高等教育出版社,2004.
[3]曹向志.软件测试项目实战[M].北京:电子工业出版社,2010.
高斯分布模型 篇4
目前,有关拉盖尔-高斯光束的轨道角动量已经有了大量的研究结果[1,2,3,7,8],而对椭圆厄密-高斯光束(EHGB)的轨道角动量还少有研究.本文将从傍轴条件下光束轨道角动量密度的一般计算出发,用张量方法对椭圆厄密-高斯光束的光场及轨道角动量密度分布作出理论分析,并在不同参数条件下进行数值计算,以期找出其中的一些规律.
1 傍轴条件下光束轨道角动量密度的一般计算
对一沿undefined轴方向偏振的矢势
在傍轴近似下可以得到
由此可以算出坡印亭矢量时间平均值的实部,即光束中的线动量密度[3]
这一结果也适用于柱坐标系下表达的光场
光束的轨道角动量源于光束线动量的角向分量[1],因此光束中沿z轴传播的轨道角动量密度可以经由径矢r叉乘线动量密度的《分量(即x-y平面上的分量)计算得到,即:
2 椭圆厄密-高斯光束的光场分布
椭圆厄密-高斯光束可以用张量的形式定义如下[11]
其中E0是常数,以下设其为1,k=2π/λ为波数,λ为波长,r是光束传播横截面上的位置矢量,rT=(x,y),Hp是p阶厄密多项式,Qe-1和Qh-1都为2×2的复曲率张量.设
其中a,b,c,d,a′,b′,c′,d′,e,f,g,h均为实数,且e<0,h<0,(f+g)2-4eh<0,使得在横截面上的任意点(x,y)处保证undefined为一个实数.于是高阶椭圆厄密-高斯光束在x-y平面上的光场可以表示为
其中α,η,ξ为实数:
作为一个实例,取参数I:
undefined
将其代入式(8)进行计算,得到这种情况下的椭圆厄密-高斯光束横截面上的相对光强(|Ep(x,y)|2)分布,结果如图1所示.
可以看到,光束的光强呈椭圆形分布,在同一椭圆上有中心对称的强弱变化.当阶次p增大时,光束的光强更趋向于向椭圆形的外围集中,中心部分的贡献趋于减少.
3 椭圆厄密-高斯光束的轨道角动量密度分布
由式(4)、式(6)可得光束的轨道角动量密度为
将式(8)所表达的椭圆厄密-高斯光束的光场振幅分布,作为u的数学表达式代入式(12),即可求得椭圆厄密-高斯光束的轨道角动量密度分布.有
其中
类似地有
利用式(13)和式(15),可得椭圆厄密-高斯光束横截面上的轨道角动量密度为
即
式(17)表明,若b+c=0及d-a=0,则光束不可能具有轨道角动量.
由上述结果,可以计算并画出傍轴近似下的椭圆厄密-高斯光束在z=0处垂直于传播方向的横截面上的轨道角动量密度jz的分布.图2为参数I的情况下光束的轨道角动量密度分布及等高线图.由图2可见:
(1)在垂直于光束传播方向的同一横截面上,轨道角动量密度集中分布在几个不同的区域,且不同位置处的轨道角动量密度大小不一,方向也不尽相同,有的区域为正(三维立体图中的上凸部分,表示轨道角动量沿z轴的正方向),有的区域为负(三维立体图中的下凹部分,表示轨道角动量沿z轴的负方向).在图2所示的例子中,沿z轴正方向的轨道角动量密度分布明显大于负方向的分布,整个光束携带有总的沿z轴方向的轨道角动量.
(2)当阶次p增大时,轨道角动量密度的峰值显著增大.
若适当改变参数,则可使沿z轴正方向的轨道角动量密度分布小于沿负方向的分布,这样整个光束便带有总的沿z轴负方向的轨道角动量.例如,由式(17)可知,将参数I中a、b、c、d的负号都改为正号,则轨道角动量密度分布的正负情况正好相反.
若改变参数,使得沿z轴正方向的轨道角动量密度分布接近或几乎等于沿负方向的分布,这样整个光束便很少或几乎不带有总的沿z轴方向的轨道角动量.图3就是这样的一个例子,其所取的参数为(参数Ⅱ):
undefined
4 结 论
本文依据傍轴近似条件下光束轨道角动量密度的一般计算公式,从用张量表达的椭圆厄密-高斯光束光场的数学表达式出发,推导得到了计算该种光束的轨道角动量密度分布的数学公式,由此计算了特定参数下不同阶次光束轨道角动量密度分布的情况并画出了其分布图.由此可见,椭圆厄密-高斯光束的轨道角动量密度集中分布在光束横截面上的某些区域.同一区域的不同位置处轨道角动量密度大小不一,不同区域处的轨道角动量密度有正有负,即有的区域轨道角动量沿光束的传播方向,有的沿相反方向.另外,当光束的阶次增大时,轨道角动量密度的峰值显著增大.这些结果对将椭圆厄密-高斯光束的轨道角动量应用于实际的激光操控微粒技术中具有重要的指导意义.
参考文献
[1]高明伟,高春清,林志锋.扭转对称光束的产生及其变换过程中的轨道角动量传递[J].物理学报,2007,56(4):2184-2190.
[2]高明伟,高春清,何晓燕,等.利用具有轨道角动量的光束实现微粒的旋转[J].物理学报,2004,53(2):413-417.
[3]Allen L,Beijersbergen M W,Spreeuw R J C,et al.Or-bital angular momentum of light and the transformationof the Laguerre-Gaussian laser modes[J].Phys.Rev.A.,1992,45:8185-8189.
[4]雷铭,姚保利.碳酸钙微粒光致旋转的实验和理论研究[J].光子学报,2007,36(5):816-819.
[5]Simpson N B,Dholakia K,Allen L,et al.Mechanical e-quivalence of spin and orbital angular momentum of light:an optical spanner[J].Opt.Lett.,1997,22(1):52-54.
[6]O’Neil A T,Padgett M J.Three-dimensional opticalconfinement of micron-sized metal particles and the de-coupling of the spin and orbital angular momentum withinan optical spanner[J].Opt.Comm.,2000,185:139-143.
[7]Courtial J,Dholakia K,Allen L,et al.Second-harmonicgeneration and the conservation of orbital angular momentum withhigh-order Laguerre-Gaussian modes[J].Phys.Rev.A.,1997,56:4193-4196.
[8]Allen L,Babiker M,Lai W K,et al.Atom dynamics in multipleLaguerre-Gaussian beams[J].Phys.Rev.A.,1996,54:4259-4270.
[9]刘义东,高春清,高明伟,等.利用光束的轨道角动量实现高密度数据存储的机理研究[J].物理学报,2007,56(2):0854-0858.
[10]刘义东,高春清,李丰,等.部分相干光的轨道角动量及其谱的分析研究[J].应用光学,2007,28(4):0462-0467.
基于高斯混合模型的社区检测算法 篇5
许多复杂网络,包括因特网、引用网络、社交网络、生化网络和交通运输网络都具有社区结构,社区结构是复杂网络中的一种重要的特性,已经促成了许多应用的出现,比如在线零售公司的在线商品推荐系统和微信的朋友推荐系统。一直以来,社区结构都没有一个准确的定义,学者们普遍接受的社区结构定义就是:每个社区内部的节点连接相对紧密,而社区与社区之间的连接就较为稀疏,因此对于了解网络的组织和功能来说,能够有效地分析和检测社区结构就显得尤为重要。随着互联网和社交网站的兴起,在Twitter,Facebook以及新浪微博这样的社交网站上使用社区检测的技术已经成为热潮。在复杂网络社区中用户的相互交流与沟通,能为传统的社区带来新的内容以及网络结构,从而使社区检测[1]的技术不断地发展。
1 基于高斯混合模型的社区检测算法
致力于复杂网络研究的学者也发明了许多社区检测算法,但大部分算法却只能处理非交叠的社区,也就是算法属于硬划分,即得到的结果是每个节点只能属于一个社区。但是,在实际网络中,每个节点可能同时属于多个社区,例如,在社交网络中,一个人可能既属于篮球俱乐部,又属于漫画俱乐部,这就要求社区检测算法能够检测出交叠社区[2]。社区检测方法的有效性是基于社区划分的好坏,最流行的质量评价函数是模块度函数,是由Newman和Girvan为了评价不相交的社区结构而首先提出的。基于Newman的模块度,大量的社区检测方法相继被提了出来,有谱优化方法,极值优化方法和模拟退火方法等。但是,复杂网络中的节点可能同时属于多个社区,因此,就需要一种能够检测交叠节点的社区检测算法。由于硬分割的社区检测方法不能处理复杂网络中的交叠社区现象,近年来,各学科领域的研究者们纷纷提出了很多处理交叠社区的方法。如基于派系过滤的交叠社区检测方法,一种基于Potts模型的交叠社区检测方法,一种模糊C均值的方法,一种局部优化的方法,还有一种非负矩阵分解的方法。
本文提出了一种基于高斯混合模型的社区检测算法,这是一种基于统计推断的社区检测方法,由于初始值对传统的高斯混合模型影响较大,容易得到局部最优参数,针对这一现象提出了高斯混合模型参数优化的新方法:首先利用K-means算法对整个社区网络进行一次粗略的划分,在迭代过程中,将运用K-means算法得到的结果centroids作为初值传入高斯混合模型;在之后的参数迭代优化过程中采用遗传算法[3,4]对参数进行修正(在遗传算法中,使用了精英保留策略,即在每一代都保留适应度函数值最大的个体,直到适应度函数值达到稳定);最后,输出适应度函数值最高的那个个体所对应的划分结果。
在整个过程中,尝试找到一种适合网络数据的数学模型来表示社区结构。每个高斯模型就代表了一个社区(Community)。对样本中的数据分别在几个高斯模型上投影,就会分别得到样本点在各个社区上的概率,也就是软分类(Soft Assignment)。基于高斯混合模型的复杂网络社区检测算法GAGMM框架如算法1所示。
每次保留当代最优解,最终得到一个最优解,得到一个n行k列的矩阵U1,该矩阵表示每个节点属于每个社区的概率密度值,然后将该矩阵归一化,得到一个新的矩阵U2,U2矩阵即表示一个节点属于某一个社区的概率,这样就可以找出复杂网络中的交叠节点,通过U2矩阵可以得出网络社区的划分类标Label。
1.1 应用于社区检测的高斯混合模型
高斯混合模型(GMM)由K个Gaussian分布组成,每个Gaussian称为一个“Component”,这些Component线性叠加在一起就组成了GMM的概率密度函数:
根据式(1)的分析,可以归纳出以下步骤:首先随机地在这K个Component之中选一个,那么每个Component被选中的概率就是它的系数πi,其次选中了某个Component之后,再单独考虑每一个高斯分布。完成了上述两个步骤之后也即完成了从GMM的分布中随机的抽取一点的工作。
对于网络的邻接矩阵(方阵),邻接矩阵的行数和列数都为N,假设这些数据是由GMM生成出来的,那么GMM的概率分布完全可以根据数据推出,然而GMM的K个Component对应社区检测中的K个社区。当已知概率密度函数的形式,而要估计其中的参数的过程被称作“参数估计”。而根据数据来估算概率密度通常称作密度估计。
假设有服从某种分布(记为p(x))的N个数据点,现在需要确定里面的参数的值,例如:在高斯混合模型中需要确定的参数有:πi,μi,σi。首先找到这样一组参数,在本文中,采用K-means算法先粗略划分社区得到一组参数,它所确定的概率分布生成这些给定的数据点的概率最大,而这个概率实际上就等于,把这个乘积称作似然函数。为了得到遗传算法中的目标函数,需要求出单个点的概率的似然函数,由于独立点的概率较小,因此先对单个点的概率取对数,将乘积变成加和,这样就得到了目标函数。随后对目标函数进行求最大值,这就是整个参数估计的全过程,认为找到了使得似然函数取得最大值的参数就是最适合的参数。
假设At={Xt,1≤t≤N}为网络中每个节点的特征矢量序列,则其对应的混合度为K的高斯混合模型πk=Nk/N可以表示为:
其中,N(Xt|μi,σi)服从单高斯分布,其协方差矩阵为σi,均值矢量为μi,则K个高斯混合模型的联合概率密度为:
式中,d表示xt的维数,通常使用协方差矩阵的对角阵来代替协方差阵。
1.2 解的编码
在遗传算法中,采用了实数编码[5]的方式,染色体由一串具有复合结构的基因Gi组成,其表现形式为:G=(G1,G2,…,Gk),其中K为GMM中单高斯模型gi的个数。Gi可以表示为Gi=(πi,μi,σi),πi为每个Component被选中的概率,μi=(μi1,μi2,…,μik)为均值向量,σi=(σi1,σi2,…,σik,)表示协方差矩阵的对角线元素组成的向量。
2 实验结果及分析
为了证明算法的有效性,本节将GA-GMM算法分别应用于已知真实划分情况的人工合成复杂网络和四个小型的真实世界网络,并且与没有加入遗传算法(Genetic Algorithm,GA)优化的原始GMM算法得到的结果进行了比较。
为了评估算法得到的解的质量,需要引入评价指标。模块度函数Q是一种衡量网络划分的社区结构是否明显的度量方式。一般来说,Q值越大,对应的社区结构就越明显。因此,本算法也将该目标函数作为社区划分结果的一个评价指标。
2.1 人工合成网络
使用经典的GN benchmark复杂网络来检测算法的可行性和有效性。GN基准网络[6,7]是由Newman等提出。对于该基准网络,每个图包含了128个节点,分为4个由32个节点构成的社区。每个节点平均有Zin条边与同社区内节点连接,Zout条边与社区外节点连接。其中Zin+Zout=16,作为每个节点的期望的度。随着Zout的增大,所产生的随机网络给社区检测算法带来了更大的挑战。特别是,当Zout大于8时,意味着每个节点在社区内的边都要小于社区外的边,这时网络的社区结构就会非常模糊。当Zout≤8时,节点外度所占的比例小于内度所占的比例,因此算法应该能检测出网络中存在的社区结构,当Zout=0时,表明节点的外度为0,此时节点仅与自身社区内的节点相连接,社区结构非常明显。分别对Zout从0到8进行了测试,对每种类型的网络产生一个复杂网络,使用NMI来衡量算法检测的结果和真实网络划分之间的相似性。对于每个网络,计算三十次独立运行的平均值。
图1给出了当节点与其它社区内的节点相连接的边的数目,即Zout取不同的值(0到8)时,算法得到的平均模块度值(a)和平均NMI值(b)的曲线图。利用K-means算法初始化参数,并将遗传算法(GA)用于优化参数,这是GA-GMM算法;而初始的没有使用GA的算法表示为GMM,将GMM用于GN基准网络来作为对比说明遗传算法参数优化和K-means算法初始化参数的效果。
2.2 真实世界网络
将GA-GMM算法应用在四个真实世界网络上,分别是Zachary’s Karate Club,Dolphin social network、American College football和Books about US politics,并与没有加入遗传算法的初始GMM算法进行了对比。
由表1可得,三十次独立运行后,对于前三个真实世界复杂网络,GA-GMM算法所获得的模块度Q和NMI值的平均值均优于GMM,对于American College football网络,GA-GMM所获得的模块度Q和NMI均略小于GMM算法。
图2-9以盒图的形式给出了这四个真实世界复杂网络三十次独立运行的模块度Q和NMI的统计结果。其中,横坐标上的“1”表示GMM算法,“2”表示GA-GMM算法。
图2-3为Zachary’s Karate Club网络的30次独立运行的模块度Q和NMI值的统计结果。可以看出GA-GMM相比GMM能获得更高的平均模块度Q和NMI值,且GMM算法在NMI值的统计盒图中存在野值点。
图4-5为Dolphin social network网络的30次独立运行的模块度Q和NMI值的统计结果。可以看出虽然两种算法稳定性都差不多,但是GA-GMM算法相对于GMM算法来说,获得了更高的模块度Q值和NMI值。
图6-7为Books about US politics网络的30次独立运行的模块度Q和NMI值的统计结果,可以看出GA-GMM相比GMM算法,不仅稳定性更好,而且模块度Q值和NMI值更高。
图8-9为American College Football网络的30次独立运行的模块度Q和NMI值的统计结果。可以看出GA-GMM算法的Q值和NMI值都略差于GMM算法。
3 结束语
本文提出了一种复杂网络中的模糊社区检测算法,在混合高斯模型中,每个高斯模型就相当于复杂网络中的一个社区,GMM是连续型的概率分布,因而不会得到一个0到1之间的概率值,而得到的是概率密度值。算法产生的结果Px是一个N行K列的矩阵,N表示复杂网络的节点数目,K表示该网络的社区数目,对于每一个节点i,只要取该矩阵第i行中最大的那个概率密度值所对应的社区类标即可。GMM模型的优点是算法结果会得到每个节点属于每个社区的概率,相当于一种模糊划分,而不是明确地划分。根据概率密度值的大小来决定节点属于哪一个社区。实验证明,提出的GA-GMM算法在四个真实世界网络以及计算机生成的GN网络中都能取得较好的结果。
参考文献
[1]Alexanderson G L.About the cover:Euler and Konigsberg’s Bri dges:A historical view[J].Bulletin-American Mathematical Society,2006,43(4):567.
[2]Yang J,Leskovec J.Overlapping community detection at scale:a nonnegative matrix factorization approach[C]∥Proceedings of the sixth ACM international conference on Web search and data mining.ACM,2013:587-596.
[3]张彤,张华.浮点数编码的遗传算法及其应用[J].哈尔滨工业大学学报,2000,32(4):59-61.
[4]Su J,Havens T C.Fuzzy community detection in social networks using a genetic algortihm[C]∥Fuzzy Systems(FUZZ-IEEE),2014 IEEE International Conference on.IEEE,2014:2039-2046.
[5]Zhang T,Wu B.A method for local community detection by finding core nodes[C]∥Proceedings of the 2012 International Conference on Advances in Social Networks Analysis and Mining(ASONAM2012).IEEE Computer Society,2012:1171-1176.
[6]Newman M E J,Girvan M.Finding and evaluating community structure in networks[J].Physical review E,2004,69(2):026113.
高斯分布模型 篇6
大量准确可靠的动态交通信息是ITS(智能交通系统)得以顺利实施的基础。与其他检测技术相比,视频检测技术最显著的优点是具有丰富的信息量,因此为复杂检测任务的执行和交通信息的获取提供了可能[1]。
背景差分法是最常用、最有效的交通视频处理模式,而背景估计正是背景差分法的基础和核心环节。背景估计方法是视频交通信息采集领域的研究热点,近年来有大量的新方法出现,但目前尚没有1种被普遍接受的模型方法。常见的模型方法有统计学模型[2,3]、卡尔曼滤波法[4]、混合高斯分布模型[5,6]等。统计学模型中最常用的方法为序列均值法[3],该方法将运动对象的像素纳入背景估计,存在一定的偏差,适用于背景大部分时间未被遮挡,即交通占有率很低的情况。基于卡尔曼滤波的背景估计模型能够适应光线均匀、有序的变化,但卡尔曼滤波法在光线不稳定的情况下难以建立有效的状态转移矩阵,而对于目标像素常被遮挡(如交通繁忙时)的情况也难以适应。基于混合高斯分布的背景估计模型可以很好地适应光线的变化,对于缓慢移动的目标有较好的鲁棒性,但该方法对每个像素点都需要用相应的模型来进行描述,每个模型由多个高斯函数加权得到,因此模型的建立、参数的确定相当困难,算法的时空复杂度很高,对照明突变(如在公路隧道中)的应变能力较弱,不适合用于城市实时交通信息视频采集和处理。
针对城市道路实时交通信息视频信息采集和处理,笔者在综合考察现有方法的优缺点,并充分考虑算法的实时性的基础上,提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的混合模型对图像背景进行快速估计。
1 模型描述
1.1 背景像素亮度高斯分布假设
高斯分布满足自然界的许多现象,许多学者认为背景像素亮度值分布符合混合高斯分布的特点[5,6]。多高斯混合分布的缺陷是模型参数获取困难,样本需求量大,不能满足实时交通信息采集的要求。鉴于此,笔者提出了如下模型假设[7]:在主照明光源没有明显变化,且无遮挡的时间段内,数字图像上任意像素点的亮度值满足单高斯分布,即:
式中:p(x)为像素取某个亮度值x的概率;标准差σ>0;最大概率
本模型中,在没有遮挡的情况下,要获取背景图像某像素点在一段时间内的真实值,采用数节学期望E(N(μ,σ2))来表示,该方法与序列均值法一致。但是实际上,城市的道路常常会被车辆遮挡,单高斯分布假设并不存在,若直接按照此方法进行计算,误差将会很大。
为了处理干扰信息,将车辆对背景上某像素点的遮挡看作为随机干扰,由于车辆本身颜色、反射度等光学特征的差异,这些随机干扰一般不构成单一的高斯分布。即车辆遮挡下背景像素的亮度概率函数为:
对于车道上任意点的像素,其亮度值概率函数可描述为:
式中:Occ为系数,对应交通工程中的占有率指标。一般来说,Occ越小,表明道路的交通占有率越小,采用数学期望方法估计出来的结果越接近于真实值。因此,在进行样本采集时,应尽量将像素点被遮挡的图像筛选出来,不作为背景估计的样本。
直接采用数学期望作为估计值,将会干扰信息纳入背景值中,因此本文采用最大后验法,此时的背景估计模型为:
式(4)成立的前提是“真实背景值出现概率最大”的情况不被遮挡像素所改变。当观测时间内车辆遮挡的情况较少时,即占有率Occ较小时(极端情况下当Occ=0时式(3)等于式(1)),式(4)能够成立。
但是,当经过的车辆大部分与路面的颜色、反射度等光学特性相近时,就会影响到μ的取值;随着占有率Occ的增大,由式(3)可知,车辆亮度值对最终估计结果的影响也会变大(极端情况下当Occ=1时,则背景上的像素完全被淹没),此时μ具有较大的偏差。
综合考虑光源突变时(如隧道照明改变、多云天气、路边树荫等情况)能够实时更新背景,改进的算法如下:
式中:a为累加器;T为最大累加次数;D为亮度突变阈值;t为第t次进行背景图像获取;t从0开始取值,
1.2 基于帧差法的样本分块选取
在求取
假如将图像(高H、宽W)平均划分为r行、c列,那么共有r×c个分块,任意像素(x,y)所属的区域为
式中:WLS为
1.3 算法流程
在以上分析的基础上,可得到1种快速的、融合了高斯分布模型和帧差样本选取的背景估计方法,其流程如图2所示。其中图像输入按照一定的采样间隔来进行,常用的频率有25帧/s,为了降低算法的复杂度,也可以设为10~15帧/s;图像分块数量与具体的道路环境有关,一般取40~70个比较适宜;统计样本数直接决定了背景估计的效果和效率,为同时兼顾算法的精度和速度,一般取30~50个比较适合。
图2中,获得最新的图像背景后,清空样本集继续进行图像采集。背景图像根据一定的周期不停地进行更新,因此算法对于环境变化的适应能力较强。
2 实 验
实验地点为广州市广园东快速路,分别采用文献[3]所介绍的序列均值法、文献[10]所介绍的多颜色模型法以及本文提出的样本选择高斯估计模型对白天交通场景和夜间交通场景进行背景估计,结果如图3所示。
采用本文方法时,背景更新间隔是5 s,背景估计所采用的样本数为30个。实验结果表明,序列均值法、本文方法均能在10 s内获取图像背景,而多颜色模型法需要约25 s才能做到。对于白天的背景图像估计,序列均值法受运动车辆的影响较大。
3 结束语
背景估计是视频交通信息采集的基础技术之一,对于环境多变情况下的实时交通信息采集,目前仍没有足够高效、稳定的背景估计方法。笔者提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的背景图像混合估计方法。单高斯估计模型符合像素在无遮挡情况下的亮度分布特性,与现有多数方法相比该模型参数简单,算法的实时性好;为了提高单高斯估计模型的应用效果,对图像进行帧差分块选取,从而提高了样本的纯度,削弱了运动物体和噪声对于像素分布的影响。实际道路环境下通过与序列均值法、多颜色模型法进行实验比较,证明了该方法的正确性和有效性。
摘要:为适应交通环境多变情况下实时交通信息动态采集的要求,提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的动态混合模型对交通信息的图像背景进行快速估计,并在实际道路环境下对多种方法进行实验比较,证明该模型有效地削弱了运动物体和噪声对于背景估计的影响,具有较好的正确性和有效性。
关键词:智能交通系统,动态交通信息采集,图像处理,背景估计,高斯分布
参考文献
[1]林培群.道路交通参数及交通事件智能检测关键技术研究[D].广州:华南理工大学,2008
[2]Triantafyllidis G A,Tzovaras D,Strintzis M G.Occlusion and visible background andforeground ar-eas in stereo:a bayesian approach[J].IEEE Trans-actions on Circuits and Systems for Video Technolo-gy,2000,10(4):563-575
[3]Jung Y K,Ho Y S.Traffic parameter extraction u-sing video-based vehicle tracking[C]//Proceedingsof IEEE International Conference on IntelligentTransportation Systems,1999
[4]Copeland B R,Chen M,Wade B D,et al.Anoise-driven strategy for background esti mation and eventdetection in data streams[J].Signal Processing,2006,86(12):3 739-3 751
[5]李全民,张运楚.自适应混合高斯背景模型的改进[J].计算机应用,2007,27(8):2 014-2 017
[6]Bailo G,Bariani M,Ijas P,et al.Background esti-mation with gaussian distributionfor i mage segmen-tation,a fast approach[C]//Proceedings of IEEEInternational Workshop on Measurement Systemsfor Homeland Security,2005
[7]Lin P Q,Xu J M,Bian J Y.Robust vehicle detec-tion in vision systems based on fast wavelet trans-form and texture analysis[C]//Proceedings ofIEEE International Conference on Automation andLogistics,2007
[8]Lucke R L,Stocker A D.Filteringinterpolators forframe differencing signal processors[J].IEEETransactions on Signal Processing,1993,41(8):2 574-2 582
[9]Tanaka K,Saji H.Vehicle extraction from aeriali mages using voting process and frame matching[C]//Proceedings of IEEE Intelligent VehiclesSymposium,2007
高斯分布模型 篇7
近年来,视频监控被应用到许多领域。目前,由Stauffer[1]等人提出的混合高斯模型由于方法简单并且计算量小而被普遍应用。混合高斯模型是在视频图像中进行动态背景建模的方法,混合高斯模型有多个高斯分布构成,每一个分布的参数( 均值、方差、权重) 都会被自动更新。这种背景建模方法非常适用于缓慢的场景变化,容易受到噪音影响。如果光照突然变化将会导致背景像素的错误更新而导致前景混淆,同时传统的混合高斯模型容易引入噪音,导致无法精确的检测目标物体。
目前,许多研究者对混合高斯模型提出了改进算法。HajaFradi[2]等提出了将选择流融入混合高斯模型中,提高前景分割的精确性。Song Xuehua[3]等提出了加速背景更新过程。LuJinman[4]等提出了基于反馈原理的自适应混合高斯模型。焦波[5]等提出了一种改进的高斯模型来加快收敛,但效果并不理想。刘鑫[6]等提出了通过帧间差分划分区域并对不同区域进行学习率的自适应变化来改进混合高斯模型,虽然可以减小光照的突变的影响,但结果仍然受到噪音影响并且计算复杂。张燕平[7]等提出了通过分区来改进混合高斯模型,减少部分噪声。刘静[8]和王玲提出通过三帧差分来改进混合高斯模型,提高检测效果。李颖宏[9]等利用图像的边缘信息不会由于光照的突然变化而产生严重影响的特点,采用了一种基于边缘混合高斯模型的目标检测的方法,可以提高目标检测的精确性。由于边缘图像受光线影响会出现部分边缘闪烁现象并且上述方法对于处理光照突变和各种噪音都有一些缺点。因此,这里提出了对边缘图像和原图像采用通过三帧差分划分区域进行自适应学习率,通过三帧差分划分区域,提高了边缘图像前景分割的效果,最后将前景与原图像分割出的前景做与运算。实验证明,该方法有效减少了噪音和在光照突变情况下所造成的影响,提高了目标检测的效果。
1 混合高斯模型
混合高斯模型来源于单高斯模型。在每个像素点建立K( 3≤K≤5) 个高斯分布,对于某一像素点的( x0,y0) ,它的历史记录{ X1,…,Xt} = { I( x0,y0,i) : 1≤i≤t} ,那么当前可能观察到的像素值变化:
当像素点与高斯分布匹配时,如式( 3) 、式( 4) 和式( 5) 对匹配的分布进行参数更新:
其中,α和β是学习率,且β = αη( Xt|μk,σk) 。
其他不匹配的分布只改变权重,如式( 6) :
若都不匹配,当前分布的个数小于K时,增加一个新的高斯分布。当前分布个数等于K时,用新的高斯分布代替优先级ρk,t最小的高斯分布。新的高斯分布以xt作为均值,并初始化一个大的方差和较小的权重。
2 改进后的模型
2. 1 改进的混合高斯模型
改变学习率可以加快背景收敛,但是学习率的大小一般是固定的,太小背景更新速度较慢,而太大容易引入噪音。为了避免受到光照影响和减少噪音影响,当光照突变时应该增加学习率,而无运动目标时应该减小学习率。因此,改用三帧差分对图像进行判断,为能更好的处理噪音和加快恢复受到突然光照的影响,用三帧差分来获取受到光照变化的像素点的比率,然后进行学习率的变化。公式如下:
如果λ小于λ1执行规则4,大于λ1小于λ2执行规则3,大于λ2小于λ3执行规则2,大于λ3执行规则1。
规则1当α≤0. 2时,α扩大2倍,否者不变。
规则2当α≤0. 1时,α扩大2倍,否者不变。
规则3当α≥0. 05时,α减小2倍,否者不变。
规则4当α≥0. 025时,α减小2倍,否者不变。
当前图像的像素点总数为M×N。其中,∧为交运算,H为二帧差分的阈值[10],来描述当两帧差值满足区域为光照突变区域的条件。λ为突变比率,是学习率变化的界限,取值不同会影响采用的变化规则。λ1取0. 1,λ2取0. 4,λ3取0. 8。
2. 2 获取边缘图像前景
与普通图像相比,边缘图像有两个优点。首先,边缘图像仅含有图像的边缘信息,因此受到噪音的影响比普通图像小。并且光照的突变也不会对边缘图像造成很大的影响。因此,可以通过边缘图像与2. 1节中的方法对原图像进行前景分割的结果相结合,来解决噪音和光照突变问题。
采用canny[11]算法来获得视频帧图像的边缘图像。与其他的边缘检测运算相比,Canny算法具有更好的检测效果,更好的定位并且对每个单一边缘都只做一次响应。Canny算法是一种基于最优化算法的运算,并且能有效抵抗噪音干扰,检测更加精确。
对于Canny算法的两个阈值采用Otsu方法[12],T1为低阈值T2为高阈值并且T1= 0. 4T2。然后对边缘图像采用改进的混合高斯模型进行前景分割,获取前景图像。
2. 3 整合过程
首先用到图像膨胀的方法。图像膨胀是一种形态学的基本运算,可以将图像的边缘像素结合起来并拓展图像的边缘,膨胀后的图像结果用二值图像来显示。
将边缘图像的前景图像进行图像膨胀,图像膨胀后运动区域将被拓展。把膨胀结果的二值图像与改进的混合高斯模型的前景分割结果取交集,得到退后的结果图像。整个算法流程如图1所示。
3 实验结果和分析
原视频未经过任何处理。K取3,α取0. 05,T取0. 7,视频图像的分辨率为320×240。
图2为车辆监控视频在不同方法下的不同结果以及噪音控制和受到光突变的影响。图3为室内视频在不同方法下的不同结果以及噪音控制和受到光突变的影响。
由图2第277帧和图3第309帧的各种实验方法的比对可看出,如果没有特殊情况,结合算法比任何一个算法受到的噪音都小。
由图2第278帧和图3第310帧的各种实验方法的比对可看出,光照突变时对不同方法的影响。可见,结合算法受到突变光照的影响较小。
由图2第285帧和图3第315帧的各种实验方法的比对可看出,受到光照突变的影响时,结合算法的恢复速度是最快的。
检测率( DR)[13]和错误警报率( FAR) 通过式 ( 10) 和式( 11) 来计算说明结合方法的有效性并通过表1比较了不同方法的不同结果:
实验结果表明,通过对混合高斯模型进行改进,并获取原图像前景和边缘图像的前景。边缘图像的前景膨胀后与原图像前景通过与运算相结合,不仅能有效减少噪音,而且对突变的光照处理效果也非常好。
4 结 语