有限混合模型

2024-09-17

有限混合模型(共7篇)

有限混合模型 篇1

0 引言

噪声治理分为主动式治理及被动式治理。对于被动式治理,需要求解出噪声声场的分布,从理论上能够预估被动式治理后的声场分布情况。这就涉及到复杂的声场-结构场的耦合求解问题。目前,工程上多采用公式简化处理方法,比如将声源简化成点声源,利用公式计算治理前后场的各点声场变化情况,从而为设计提供依据。利用公式法的优点是简单,然而,对于复杂的几何体形状,公式法会存在一定的计算误差。

有限元法在计算较为复杂的几何形状上有相对的优势,越来越多的学者采用有限元方法研究声场-结构场耦合问题[1,2,3];部分学者采用SYSNOISE与ANSYS相结合的方式计算声场问题[4,5];文献[6]单独采用ANSYS计算房子空间声场分布。采用有限元软件计算的问题多数是结构包围下的密闭空间声场分布问题,或者是振动体振动下的开阔空间辐射声场分布问题。而对于振动体作用下,且空间内存在结构体的问题用有限元软件研究的相对较少。

本研究首先给出要建模问题的理论模型,接着详细给出ANSYS建模要点,最后对理论模型相对应的实例进行计算,求解并对比有无声屏障下的声场分布情况。

1 理论模型

声波传播遇到结构体时,会产生反射、透射和绕射现象。一部分绕过结构体到达受声点;一部分穿透结构体到达受声者;一部分在结构体壁面产生反射。衡量声屏障降噪效果的指标为插入损失,即:

式中ΔLd—绕射声衰减,dB;ΔLt—透射声衰减,dB;ΔLr—反射声衰减,d B。

当声源至受声点的距离大于线声源长度的3倍,线生源可以看成点声源,点声源对一无限长声屏障的绕射声衰减如下:

其中:

式中N—菲涅尔数;λ—声波波长,m;D—声源与受声点间的直线距离,m;A—声源至声屏障顶端的距离,m;B—受声点至声屏障顶端的距离,m。

声音绕过结构体示意图如图1所示。

当结构体的材料及厚度较大时,可忽略透射声影响,即ΔLt≈0。

反射降低量取决于结构体、受声点及声源的高度,周围界面与声屏障之间的距离,受声点至结构体的距离以及结构体内侧和周围界面的吸声降噪系数,若吸声降噪系数大于0.5,可认为ΔLr≤1 d B。

2 有限元模型

建立ANSYS声场-结构体混合模型步骤包括绘制实体模型、定义材料及单元类型、剖分网格、施加载荷、求解以及结果显示。

利用ANSYS中的RECTNG以及CYL4等APDL绘制图形命令可绘制实体模型[7,8]。在实体模型最外部绘制一个圆,代表无限远边界,圆的圆心在原点,ANSYS要求无限远边界圆的半径距离发声材料体的最小距离为0.2λ(λ为求解频率波长)。

模型中的材料包括两种:第1种为结构材料,需要用命令MP分别定义材料的弹性模量(EX)、密度(DENS)、泊松比(NUXY)以及吸声系数(MU);第2种为声音材料,需要用命令MP分别定义声速(SONC)以及空气密度(DENS)。APDL命令如下:

模型中的单元类型包括4种:第1种是结构材料单元PLANE42;第2种是具备位移自由度UX与UY的二维声场单元FLUID29,该单元包围在结构体的四周,起结构体与空气单元耦合的作用,定义结构材料单元PLANE42四周的声场单元;第3种是无限大声场边缘单元FLUID129,实常数中定义无限大声场边缘半径,该半径等于实体模型中最外部绘制圆的半径;第4种是不具备自由度UX与UY的声场单元FLUID29,定义模型中的空气单元。定义单元类型的命令为ET,定义实常数的命令式R,单元类型分布如图2所示。

在本研究中,模型中的网格采用AMESH命令,第2种单元类型的网格层数一层即可,其他层可根据模型的具体尺寸进行剖分。

模型中施加载荷采用f命令,在结构体材料上的具体NODE节点施加指定方向和大小的作用力。

3 实例计算

在本研究中,笔者运用实例分析了一个结构体圆环在Y方向周期作用且方向相反的两个作用力F1与F2下的声场分布情况。计算模型包括两种:(1)无屏障;(2)有屏障结构,除了屏障外,两个模型其余参数不变。模型结构尺寸如图3所示,几何参数如表1所示,计算参数如表2所示,其中弹性模量是圆环属性,AN-SYS需要已知弹性模量参数计算圆环结构形变,模型中圆环材料与屏障材料相同。

在100 Hz作用力下,以圆环原点为圆心,以圆环圆心到屏障表面距离的一半为半径的圆周上的声压分布图如图4所示(图中角度单位为度)。从图中可以看出,没有屏障情况下,作用力在Y方向上声压比在X方向上的大,且相对于坐标轴对称;在屏障存在情况下,屏障的反射作用增加了屏障与圆环之间的声压。500 Hz作用力下,以圆环原点为圆心,半径等于0.063 7 m圆周上的声压分布图如图5所示。从图中可以看出,由于屏障的存在,屏障后的声压急剧变小[9,10]。

4 结束语

本研究利用ANSYS建立了声场-结构场混合有限元模型,为研究声场的分布提供了一种行之有效的方法。基于该模型笔者进一步研究了声场在复杂结构体下的分布情况,例如复杂形状的声屏障的设计等。研究结果表明,在该模型的建立中至少需要定义2种材料及4种单元类型,利用圆模拟无穷大边界,通过不同的单元类型将声场和结构场结合成一个模型,从而解决声场—结构混合场问题。

摘要:为了求解复杂结构体下的声场分布,采用ANSYS软件建立了声场-结构二维混合有限元模型,给出了ANSYS软件中混合模型的建模方法,通过在结构体四周设置结构体与空气耦合单元,将结构模型因受力发生形变而产生的噪声声压耦合到空气中,实现了混合声场模型的求解。模型求解结果表明,该模型能很好地解决声场与结构场的耦合问题。

关键词:声场,结构,有限元模型,ANSYS,耦合

参考文献

[1]黄兹思,蒋伟康,朱蓓丽,等.压缩机消声器特性的数值分析与实验研究[J].振动工程学报,2004,17(4):399-402.

[2]张辉东,周颖.大型水电站厂房结构流固耦合振动特性研究[J].水力发电学报,2007,26(5):134-137.

[3]张军,兆文忠,张维英.声场-结构耦合系统声压约束下板重量优化设计研究[J].应力力学学报,2006,23(4):568-571.

[4]方华,王天灵,李盛成,等.柴油机油底辐射声场的仿真研究[J].噪声与振动,2007,27(5):115-118.

[5]宋雷鸣,孙守光,张新华.用有限元法分析铁路客车车内空间的声学特性[J].噪声与振动控制,2005,25(2):21-22.

[6]李婧,朱晓天.声学小房间的比例及形状研究[J].建筑与环境,2007,1(2):128-130.

[7]王奇芳,张云电.高能聚焦超声波清洗声学系统的有限元分析[J].机电工程,2007,24(1):15-18.

[8]阿荣其其格,刘文芝.风力机叶片有限元建模的两种方法[J].机械,2009,36(1):48-50.

[9]石峰.基于ANSYS软件的注塑机定模板的设计与优化[J].轻工机械,2008(4):13-16.

[10]童鲁海,周赵凤.基于ANSYS/LS-DYNA软件的刀剪双面磨削过程数值分析[J].轻工机械,2009(1):39-41.

基于用户兴趣的混合推荐模型 篇2

随着网络技术的发展以及机器学习、数据挖掘等知识发现技术的出现, 推荐系统应运而生, 它根据用户的兴趣爱好, 推荐符合用户兴趣爱好的对象。推荐系统模拟商店销售人员向用户提供商品推荐, 帮助用户快速找到所需商品, 顺利完成购买过程, 可以有效保留用户, 提高电子商务系统的销售能力, 重建客户关系。目前电子商务推荐系统主要有两种方法, 一是基于内容过滤的推荐方法, 二是基于协同过滤的推荐方法。

基于内容过滤的推荐方法, 为每个用户建立兴趣模型 (profile) , 根据用户以往的购买历史和访问数据, 提取用户的兴趣特征集合, 形成用户的兴趣模型。基于内容过滤的系统如:Personal WebWatcher[1], CiteSeer[2], WebMate[3], WebPersonalizer[4]等。基于内容过滤的系统其优点是简单、有效, 缺点是难以区分资源内容的品质和风格, 而且不能为用户发现新的感兴趣的资源。

基于协同过滤的推荐方法, 其出发点在于任何人的兴趣不是孤立的, 应处于某个群体所关心的兴趣当中, 因此可以根据相同或相近兴趣的用户对相应信息作出的评价进行推荐。基于协同过滤的系统如: WebWatcher[5], GroupLens[6], SiteSeer[7]等。基于协同过滤系统的优点是能为用户发现新的感兴趣的信息, 缺点是存在稀疏性问题和可扩展性问题。

本文提出一种基于用户兴趣的混合模式推荐方法, 该方法首先根据用户的购买数据和浏览行为, 形成用户的兴趣模型, 并按商品与用户兴趣模型的相似度进行推荐;然后, 根据相似兴趣的用户其特征向量也相似的原则将用户进行分类, 按照用户特征相似度进行推荐;再根据用户评价的相似度, 将评价一致或者相似的用户分为一类, 利用用户间的评价进行推荐;最后对推荐的贡献进行加权求和, 形成最终的推荐。该推荐方法综合考虑来自两个类别的影响, 能动态调整用户类别以及相应地修改各类参数, 以提高推荐系统的准确性。

2 用户兴趣模型的表示机制

要实现个性化的推荐服务, 首先必须搜集用户的个人信息, 建立用户兴趣特征模型。用户兴趣模型建立的主要依据是用户感兴趣的文本以及用户对于文本的关注程度, 用户对文本内容兴趣的程度不同, 其对用户兴趣模型的贡献也不同, 用户兴趣模型是感兴趣的文本以及兴趣强度的函数[8,9], 即:

Μodel-Use=f (<D1, g1>, <D2, g2>, , <Ds, gs>)

其中Di表示示例文本集, gi是对Di的兴趣强度, s是文本数, i=1, 2, 3, …, s.

用户兴趣模型的基础是示例文本的特征表示, 用户对于文本的关注可大致归结为对概念的关注, 兴趣强度越大, 说明该文本所体现的概念对于用户的兴趣相关程度越大。用户对于文本的关注强度可以根据显式方式获得, 即通过用户明确的反馈获得, 也可以通过隐式方式获得, 即收集用户的访问模式来确定。兴趣强度设定为如下函数:

gi=g (Di, Bi, U)

其中0≤gi≤1, U表示用户;Di表示访问的HTML页面或者文本;i表示文本编号;Bi表示访问模式的类型, i=1, 2, …, s; gi表示用户关注强度。

Bi∈{Bookmark, Save, BrowseTime, BrowsePage, Feedback, …}, Bookmark表示将页面加入书签的动作;Save表示保存页面; BrowseTime表示浏览的时间因素; BrowsePage浏览指定页面的动作, 如滚动或点击; Feedback表示对于给定的要求, 用户给予的反馈。

设用户的示例文本的特征向量为Di= (ti1, ti2, …, tik) , 这里是潜在语义空间的k维向量;用户U对于示例文本Di的兴趣强度为gi=g (Di, Bi, U) , n是示例文本数目, 则用户兴趣模型为:

User-Vector=i=1ngiDi= (i=1ngit1i, i=1ngit2i, , i=1ngitki) = (u1, u2, , uk)

3 混合模式推荐模块的构建与修改

3.1 混合模式推荐算法的流程

整个推荐分为两个模块, 即内容过滤推荐模块和协同过滤推荐模块, 其基本流程是:首先将用户当前访问序列、用户购物历史数据和Web日志等内容进行预处理, 提取出用户兴趣的主题向量和特征向量, 经过数据处理建立基于内容过滤的推荐模块;再根据用户兴趣特征、用户评分数据和当前访问序列等数据, 建立基于协同过滤的推荐模块, 提取用户的最近邻和当前访问序列的最近邻;然后综合两个推荐模块进行加权求和运算, 对产品信息库中的产品, 与混合推荐模型进行相似度计算 (即推荐处理) , 生成top-N推荐访问序列, 通过Web服务器将序列推荐给用户, 并获得用户对推荐序列的反馈信息, 自适应的调整推荐模型和阈值, 以获得最佳的推荐质量。

基于用户兴趣的混合模式推荐算法的基本流程如图1所示。

3.2 基于内容过滤推荐模块的建立

(1) 数据处理流程

首先将用户U当前访问序列转变为兴趣主题向量, 连同从用户历史购物数据和Web日志中抽取的特征向量进行加权和运算, 得到初始推荐模型, 再计算初始向量和当前访问序列之间的相似度, 最后为每一个兴趣主题设置最优的初始相似度阈值。

数据处理的流程如图2所示。

(2) 基于内容过滤的推荐模型

初始推荐模型向量是由兴趣主题向量、从用户购物历史数据中抽取的特征向量以及从Web日志中抽取的特征向量进行加权和运算得到的, 设权重分别为a, bc, 则有:

Ρf0 (Q) =aΡ0 (Q) +bΡ1 (Q) +cΡ2 (Q)

式中Q表示兴趣主题, Pf0 (Q) 表示用户兴趣主题Q的初始推荐模型向量, P0、P1和P2分别是它的3个分向量。P0 (Q) 是主题向量, P0 (Q) = (P01, P02, …, P0w) , P0i表示第i个词wi的权重;P1 (Q) 是从用户购物历史数据中抽出的特征向量, P1 (Q) = (P11, P12, …, P1w) , P1i表示wi的权重;P2 (Q) 是从Web日志中抽出的特征向量, P2 (Q) = (P21, P22, …, P2w) , P2i表示wi的权重。

3.3 基于用户协同过滤推荐模块的建立

选取登录次数较多和浏览文本较多的用户参与用户聚类, 便于从总体上考虑产品信息内容与用户兴趣之间的关系, 兼顾产品信息的范围。用户聚类模块可以根据聚类的内容不同而分为用户的内容类和用户的合作类。

(1) 用户的内容类

用户的内容类依据用户兴趣之间的相似度进行确定, 本文选择用夹角余弦的方法, 用户的兴趣相似度为simC (U, V) =cos (U, V) , UV表示用户, U= (u1, u2, …, uk) , V= (v1, v2, …, vk) 。

根据用户特征向量之间的相似度, 将其进行聚类, 使兴趣相近的用户归入一类, 便于处理, 同时对于新产品信息文档, 通过判断其类别归属, 获得应该推荐的用户清单。假定所要求的分类数为K, 用户数为P, 两个用户之间的相似度采用夹角余弦公式, 两个类之间的相似度为两类之间最不相似的用户特征向量相似度:

simC (Cr, Ct) =minUCr, VCtsimC (U, V)

分类中采用完全联接的基本思想在于使同一类中用户兴趣的相似度较大, 而不同类之间的用户兴趣的相似度较小。

具体分类算法如下:

①设分类数为L, 初始时刻L=P, 即P个用户各成一类, Ci={Ui}。

②若LN则结束退出。

③寻找两类之间相似度最小的两类Ci, Cj.

④合并Ci, Cj, 删除Cj, 计算新类与其它类的相似度, 转L=L-1。

当达到预先给定的类别数N时, 分类停止。由此获得N个用户类{C1, C2, …, Cn}, 由于是基于用户兴趣内容进行的分类, 故称为用户的内容类 (content class) 。

(2) 用户的合作类

基于内容所作的分类即通过内容的相似度进行分类, 其好处是能够发现和用户已有兴趣相似的信息, 但如何发现新的感兴趣的信息, 还要通过合作方式获得, 即通过用户间的评价相似度来确定对于信息的感兴趣程度。基于合作方式的用户类别作为用户内容类的某种程度上的兼类, 称之为合作类 (collaborative class) , 仿照内容类的划分方法, 进行合作类的划分。

定义用户之间的评价相似度为:

simD (U, V) =DUVmin (g (D, B, U) , g (D, B, V) ) UV

式中U, V分别表示用户评价的文本集合, ‖U‖和‖V‖分别表示其评价的文本数量, g (D, B, U) 和g (D, B, V) 分别表示用户UV的兴趣强度函数, D表示访问的HTML页面或者文本, B表示访问模式的类型。

通过相似性的度量得到目标用户的最近邻后, 下一步则需要产生相应的推荐。设用户U的最近邻集合用NNu表示, 则用户U对项目i的预测评分Pu, i可以通过用户U对最近邻集合NNu中项目的评分得到, 计算方法如下:

Ρu, i=R¯u+nΝΝusim (U, Ν) (Rn, i-R¯n) nΝΝu (|sim (U, Ν) |)

式中sim (U, N) 表示用户U与用户N之间的相似性, Rn, i表示用户N对项目i的评分, R¯uR¯n分别表示用户U和用户N对项目的平均评分。

通过上述方法预测用户对所有未评分项目的评分, 然后选择预测评分最高的前若干个项目作为推荐结果。

3.4 混合模式推荐模型的建立

对于产品信息库中对产品进行描述的信息文本D, 获取其在语义空间的特征表示, 首先计算D与用户U兴趣的相似度, 即文本特征向量与用户特征向量的相似度simU (U, D) ; 然后计算与用户的内容类的相似度, 即计算内容类的类别特征向量与文本特征向量的相似程度simCE (U, D) ;其次计算与用户合作类的相似度simDE (U, D) , 最后综合计算文本D与用户U的相似度。

这里类别特征向量为:

L= (i=1Ld1iL, i=1Ld2iL, , i=1LdkiL) = (l1, l2, , lk)

L为类别, ‖L‖为类别的用户数, dij为第i个用户的第j个特征分量。

simU (U, D) =simU (pf, D) =cos (pf, D) , 表示根据用户兴趣模型pf与文本D的相似度。

simCE (U, D) =cos (C, D) , 表示用户所在的内容类别C与文本D的相似度。

simDE (U, D) =1Li=1Lg (D, Bi, Ui) , 表示用户所在的合作类对文本D的兴趣强度。

最终的综合相似度sim (U, D) 为下面公式所示:

sim (U, D) =αsimU (U, D) +βsimCE (U, D) +γsimDE (U, D)

式中αβγ为可调节的权重参数, 表明在匹配过程中, 用户兴趣模型相似度、用户的内容类类别兴趣相似度、用户的合作类兴趣强度对推荐系统的贡献程度, α+β+γ=1 (0≤α≤1, 0≤β≤1, 0≤γ≤1) 。若β=0, γ=0, 则为基于内容过滤的推荐模型;若α=0, 则为协同过滤的推荐模型。

4 实验结果及分析

4.1 实验数据集和评价指标

本文采用MovieLens站点 (http://movielens.umn.edu/) 提供的数据集来测试混合模式推荐算法。从用户评分数据库中选择12000条评分数据作为实验数据集, 实验数据集中共包含245个用户和1106部电影, 其中每个用户至少对20部电影进行了评分, 评分值为从1到5的整数, 数值越高, 表明用户对该电影的偏爱程度越高。

整个实验数据集需要进一步划分为训练集和测试集, 为此引入划分系数x表示训练集占整个数据集的百分比, 我们选择的电影数据集的稀疏等级为:

1-12000245×1106=0.9557

评价推荐系统推荐质量的度量标准主要包括统计精度度量方法和决策支持精度度量方法两类。本文采用平均绝对偏差MAE (Mean Absolute Error) 和文本检索系统中的综合评价指标F-measure作为度量标准。平均绝对偏差MAE通过计算预测的用户评分与实际的用户评分之间的偏差度量预测的准确性, MAE越小, 推荐质量越高;文本检索系统中的综合评价指标F-measure综合考虑了精确率和召回率对推荐系统的影响, F-measure值越大, 对应的推荐效果越好。

4.2 实验结果及分析

首先查看在不同的训练集测试集比例即拷虑在不同数据稀疏程度的情况下, 两种方法的MAE性能比较, 最近邻用户数值设置为30, 实验结果如图3所示;然后查看在一定训练集测试集比例即稀疏程度不变、最近邻集大小不同的情况下, 两种方法的MAE性能比较, 考虑最近邻集大小的不同对算法性能的影响, 实验结果如图4所示。

从图3和图4可以看出, 基于用户兴趣的混合模式推荐方法的平均绝对偏差MAE数值比基于用户协同过滤推荐方法的MAE数值也要小, 混合模式推荐算法的MAE曲线也处于基于用户协同过滤算法的MAE曲线下方, 混合模式推荐方法的推荐效果优于基于用户协同过滤推荐算法的推荐效果。在数据稀疏程度不同的条件下, 随着训练集数据的增多, 两者之间MEA值的差距在逐渐缩小, 说明混合模式推荐效果的优势随着训练集的增多而缩小;在数据稀疏程度相同的条件下, 随着最近邻集数量的增加, 推荐效果将会下降, 说明在较小的最近邻数值范围内就可以得到较为准确的预测值。

为了比较基于用户兴趣的混合模式推荐方法与基于内容过滤的推荐方法的性能, 将2002年的数据作为训练集, 2003年、2004年和2005年的数据作为测试集, 两种方法在F-measure指标的实验结果如图5所示。

从图5可以发现, 不论是基于内容过滤的推荐方法还是基于用户兴趣的混合模式推荐方法, 其综合评价指标F-measure随着时间的推移逐渐提高, 说明两种推荐方法随着系统的运行, 其综合性能都能得到提高, 系统具有一定的机器学习能力;同时, 混合模式推荐方法的F-measure曲线位于基于内容过滤推荐方法对应折线的上方, 说明混合模式推荐方法的推荐效果优于基于内容过滤推荐方法的推荐效果。

5 结束语

基于用户兴趣的混合模式推仅方法综合考虑用户的阅读习惯和兴趣, 同时也利用了用户之间的评价所体现出来的兴趣一致性, 不但能够根据用户的历史资料来推荐相似的信息, 而且能够通过相似兴趣用户的推荐来获取新的信息, 实现兴趣的扩充和转移, 推荐质量得到了显著提高。本文只是针对推荐系统中用户信息和商品信息的处理这一小部分作了分析和探讨, 提出的方法也有一定的局限性, 在实际应用中可能会存在一些问题, 下一步工作可以从信息获取、推荐质量与推荐实时性平衡等方面展开。

参考文献

[1]Mladenic D.Machine learning for better Web brows-ing[A].Rogers S, Iba W.AAAI 2000 spring sym-posium technical reports on adaptive user interfaces[C].Menlo Park, CA:AAAI Press, 2000:82~84.

[2]Bollacker K D, Lawrence S, Giles C L.Discoveringrelevant scientific literature on the Web[J].IEEEIntelligent Systems, 2000, 15 (2) :42~47.

[3]Chen L, Sycara K.WebMate:a personal agent forbrowsing and searching[A].Sycara K P, WooldridgeM.Proceedings of the 2nd international conferenceon autonomous agents[C].New York:ACM Press, 1998:132~139.

[4]Mobasher B, Cooley R, Srivastava J.Automatic per-sonalization based on Web usage mining[J].Commu-nications of the ACM, 2000, 43 (8) :142~151.

[5]Joachims T, Freitag D, Mitchell T.WebWatcher:atour guide for the World Wide Web[A].Georgeff MP, Pollack E M.Proceedings of the internationaljoint conference on artificial intelligence[C].SanFrancisco:Morgan Kaufmann Publishers, 1997:770~777.

[6]Konstan J, et al.GroupLens:applying collaborativefiltering to usenet news[J].Communications of theACM, 1997, 40 (3) :77~87.

[7]Rucker J, et al.Siteseer:personalized navigation forthe web[J].Communications of the ACM, 1997, 40 (3) :73~75.

[8]曹毅, 贺卫红.基于向量空间模型的信息安全过滤系统[J].计算机工程与设计, 2006, 27 (2) :224~227.

混合原油粘度计算模型归纳浅析 篇3

参考文献

[1]杨筱蘅.输油管道设计与管理[J].山东:中国石油大学出版社, 2006.05

有限混合模型 篇4

随着观测数据的种类与数量的迅猛增加,各行各业的专家学者逐渐发现单一的分布类型和模型对复杂数据问题的研究已经显得愈来愈力所不能及。基于混合分布的统计模型的出现与应用填补了对这类数据分析的不足,逐渐成为分析复杂现象的不可或缺的统计工具,在生物领域、医学领域、环境科学、金融领域与工程领域有了一定的实际应用。在以往的研究中(如Klugman等,2008[1]),对损失数据进行建模常常采用泊松分布、伽马分布、帕累托分布、威布尔分布或者是对数正态分布等一些特定的参数分布族,这些分布大多可以归属到指数分布族中。然而,在保险大数据中,损失数据经常呈现出非负、非对称、右偏斜与尖峰厚尾的特点,甚至出现多峰性。此时,用常用的分布来分析数据不一定是恰当的选择,选择更灵活的分布类来描述数据的特征显得很有必要。Erlang混合分布已经被应用于多个领域的分析中,在非寿险精算中的应用如风险分析(Lin和Willmot,2000[2];Willmot和Lin,2001[3];Willmot和Woo,2007[4])与损失建模(Lee和Lin,2010[5])。Willmot和Woo(2007)证明了Erlang混合分布类包含了多种损失分布,利用该分布可以得到总索赔的各种解释表达式。Lee和Lin(2010)应用具有相同尺度参数的Erlang混合分布来分析损失数据,详细说明了应用EM算法进行参数估计的过程,并提供了依据BIC统计量来选择最优成分数的方法。另一个相关的模型是超Erlang分布,其中的Erlang成分具有相同的形状参数,如Wang等(2006)[6]。杨静平等(2005)[7]探讨与说明了在索赔额服从混合分布、索赔次数属于(a,b)-类的假设下,概率密度函数pS与qS的数值解法,用以逼近分布函数FS,从而给出FS递推方程的理论结果。在索赔额服从指数分布或帕累托分布、索赔次数服从二项分布、几何分布或泊松分布的假设下,进行了数值分析。徐昕等(2009[8],2012[9])研究了零膨胀分布类下泊松分布与负二项模型的推广,并结合索赔次数的拟合探讨了推广模型的应用。

国内学者对有限混合分布的应用研究多集中在其他领域,在非寿险定价中的研究较少。本文的研究从有限混合分布的视角出发,在gamlss分布族中选取典型分布,讨论与比较它们的理论结构并进行索赔次数与索赔额的实证分析。首先,介绍有限混合分布的基础理论,并给出几种特殊的有限混合分布;然后重点讨论基于EM算法的参数估计问题;最后结合索赔次数与索赔额进行费率厘定,说明有限混合分布在非寿险精算领域应用的重要性。

2 有限混合分布的基础理论

2.1 有限混合分布的定义

定义1[1]称随机变量X是由随机变量X1,…,Xk生成的k元混合分布,如果它的累积分布函数可以表示为:

其中,对所有的i而言,ai>0,满足a1+a2+…+ak=1成立。混合分布的概率密度函数为:

其中,参数a1,a2,…,ak称为混合权数,(Ω为随机变量Y的取值空间),fi(y)称为混合分布中各个成分的概率密度函数,也可以称为基本分布。

示例:如果将逆高斯分布的概率密度函数表示为:

一个混合分布是由两个逆高斯分布混合而成,且这两个逆高斯分布分别为IG1(μ1,σ1)=IG1(80.40,0.012)和IG2(μ2,σ2)=IG2(54.90,0.016),α1=0.75、α2=0.25,则这个混合分布的概率密度函数如图1所示。

定义2一般混合分布(变元数不确定)(variablecomponent mixture distribution)的分布形式如下:

形如式(4)的模型称为半参数的,本文中研究的模型仅限于k元混合分布。

2.2 几类特殊的有限混合分布

有限混合分布区别于指数散布族分布(Exponential Dispersion Family,简记为EDF),该类分布对于拟合复杂保险数据的优势日益明显。下面基于保险索赔损失数据的分布特点着重介绍几种典型的有限混合分布。

定义3[10]假设随机变量X服从零膨胀泊松(Zero Inflated Poisson,简记为ZIP)混合分布,则其概率密度函数可以写成如下形式:

式中,λ是泊松分布的参数,λ>0;参数ν表示取值为零的概率,一般情形下,满足0<ν<1,且ν的值越大,表明相应的数据集中含零数据的比例越大;若ν=0,则该ZIP分布退化为标准的泊松分布。通过数学计算可知,X的均值与方差如式(6)所示,方差大于均值:

定义4假设随机变量X服从三参数的零膨胀负二项分布(Zero inflated negative binomial distribution,简记为ZINBI),则其概率密度函数可以写成如下形式:

式中,参数μ>0,σ>0,ν表示X=0发生的概率,X~NBI(μ,σ)的概率为(1-ν),0<ν<1。在式(7)中,X′~NBI(μ,σ),因此有:

式中,x=0,1,2,3,…若X~ZINBI,若其均值与方差分别为:

定义5称随机变量X服从零调整负二项分布(Zero adjusted negative binomial distribution,简记为ZANBI),如果X的概率密度函数可以写成如下形式:

式中,参数μ>0,σ>0,ν表示X=0发生的概率,X~NBItr(μ,σ)①的概率为(1-ν),0<ν<1。X′~NBI(μ,σ)。若X~ZANBI,其均值与方差分别为:

在车险费率厘定业务中,许多损失数据包含大量零值过多的计数型数据,表现出“零膨胀”或“零调整”的特点。ZIP、ZINBI、ZANBI均可以用于分析索赔次数,弥补了传统分布无法准确反映实际数据中零值过多的缺陷,使得拟合结果更加准确。

定义6对于取值在[0,+∞)上的随机变量X,如果其服从零调整伽玛分布(Zero Adjusted Gamma distribution,简记为ZAGA(μ,σ,ν)),则其概率密度函数为:

式中,参数0<ν<1,μ>0,σ>0。X的均值与方差分别为:

非寿险精算中的车险费率厘定问题可以考虑用ZAIG为例进行分析拟合索赔额,ZAIG是区别于ZAGA的一种分布,其分析的被解释变量(用X来表示)在取零值时有一个非零的概率ν,当取值大于零时服从逆高斯分布。标准的零调整逆高斯分布有三个参数μ,σ,ν,ZAIG(μ,σ,ν)的概率密度函数表示为以下形式:

式中,三个参数取值满足0<ν<1,μ>0,σ>0。通过计算可以得到,E(X)=(1-ν)μ,Var(X)=(1-ν)μ2(ν+μσ2)。令α1=ν,α2=1-ν,f1(x)与f2(x)的具体表达式为:

则式(14)可以表示为:

由式(16)可见,ZAIG可以看作是一个混合分布模型,该混合分布包含的第一个成分是零成分,第二部分是逆高斯分布概率函数。

从分布的角度看,上述ZIP、ZANBI、ZAIG、ZAGA等可以归纳到gamlss分布族中(R Development Core Team,2011)[12],该分布族比GLM框架下的EDF包含更多的分布类,类似的分布还有零调整泊松(Zero Adjusted Poisson,ZAP)分布等。事实上,它们均可以由二元混合分布构造,具体地说,是由一个零点退化分布与一个概率生成函数分布构成的(离散)二元混合分布[1]。

3 参数估计与模型诊断

3.1 参数估计

混合分布模型的参数估计包括三种主要的方法,方法之一是可以进行极大似然估计,例如可以采用NewtonRaphson迭代或者EM算法,迭代计算出参数的估计值,Dempster等(1977)[13]是关于EM算法较早的研究参考;另一种是贝叶斯方法,利用MCMC等随机算法对混合分布中未知参数的后验密度进行模拟,从而利用得出的参数的后验估计来拟合混合模型。Tanner(1991)[14]、Mclachlan和Krishnan(2008)[15]介绍了关于参数的统计推断算法,包括EM算法与贝叶斯计算进行了系统、详细的阐述。此外,对于成分密度未知的混合模型,非参数方法是拟合混合模型的一种有效方法,譬如,Hall和Zhou(2003)[16]采用非参数方法对混合分布下的参数估计问题进行了讨论。

EM法是属于“数据扩张”方法中常用的一种迭代算法,分为先求数学期望(E步),再求极大值(M步)两个步骤,对于处理存在缺失数据的问题十分有效,国内学者茆诗松等(2006)[17],韦博成等(2009)[18]对这方面的理论进行了比较深入与详细的研究。

以ZIP分布为例,参考谢锋昌等(2013)[11],对EM算法在混合模型中的应用加以初步介绍。假设(yi,Wi,Xi)(i=1,2,…,n)是ZIP分布的n个观测值与解释变量,对于ZIP分布下的观测值yi而言,引入变量di,满足:

将d=(d1,d2,…,dn)T视为缺失数据,记为Ym;将可观测数据(yi,Wi,Xi)(i=1,2,…,n)记为Yo,首先的想法是将观测数据与缺失数据扩张成“完全”数据,记为Yc=(Ym,Yo)。在ZIP数据的每一次观测中,退化部分的数据发生的概率为νi,非退化部分的数据发生的概率服从泊松分布,通过分析计算,基于完全数据的对数似然函数可以表示为:

应用EM算法计算的基本步骤如下:

第一步(E步):构造Q函数,计算期望:

式中,表示EM迭代过程中在第k步的参数估计值。

第二步(M步):求解下列极大化问题,得到,使得:

E步与M步交替进行,形成了一个迭代过程。Wu(1983)[19]证明,EM算法一般都能够达到一个局部极大值,该算法中反复迭代产生的序列收敛到参数β的极大似然估计.

3.2 模型诊断

由于一些混合分布可以纳入到gamlss分布族中去,因此关于衡量模型的拟合优度及模型的选择与诊断问题,常常借助于GAMLSS框架下的某些统计量作为衡量标准进行判断。

首先,常用的统计量是Akaike(1983)[20]提出的GAIC统计量(Generalized Akaike Information Criterion,简记为GAIC)。GAIC统计量的计算表达式为:

式中,λ代表一个固定的惩罚项,df是模型的有效自由度。事实上,AIC统计量作为目前评价模型的拟合优度的常用统计量,是GAIC统计量的一个特例。此时,惩罚项λ=2,AIC=GAIC(2)=GD+2df.在不同的模型中,GAIC统计量选取的标准是越小越好。

其次,施瓦茨贝叶斯准则(Schwarz Bayesian Criterion,简记为SBC)也称贝叶斯信息准则(Bayesian Information Criterion,简记为BIC),由Schwarz(1978)[21]提出,其计算式为:

式中,l代表似然函数值,p是拟合模型中参数的个数,n是模型中观测值的个数。

最后,可以根据Dunn和Smyth(1996)[22]提出的标准化残差图(normalized randomized quantile residuals)来判断模型拟合结果的优劣,这种方法更简单直观。以残差为纵坐标,以拟合值或对应的数据观测序号为横坐标绘制的散点图统称为残差图。残差图是进行模型诊断的一个重要工具,对于经过变换后标准化的残差,应该近似服从标准正态分布,从图形上观察,样本点应该落在一定宽度的水平带的区域内。QQ图可以检验残差的正态性,如果标准化的残差是服从标准正态分布的样本点,则这些点应该落在一条直线上。

4 实证分析

4.1 数据描述

采用Frees(2010)[23]中收录的一组汽车索赔数据,讨论上述几类混合分布在车险费率厘定中的应用。除了Frees(2010),该组数据在国内其他的讨论中也有被用到,如孟生旺(2007)[24]、钟桢和孟生旺(2010)[25]、童丽娟(2010)[26],这里采用该组数据集,有利于研究比较。将年行驶里程数(Kilometers,用K表示,分为5个等级)、无赔款折扣等级(Bonus,用B表示,分为7个等级)、行驶地区(Zone,用Z表示,分为7类)和车型(Make,用M表示,分为9类)作为解释变量,将索赔次数(Claims)与总索赔额(Payment)作为被解释变量。

4.2 拟合索赔次数

对索赔次数进行拟合分析,分别基于泊松分布、NBI分布、零调整泊松分布(ZAP)、零膨胀泊松分布(ZIP)、零调整NBI分布(ZANBI)、零膨胀NBI分布(ZINBI)进行建模分析。以索赔次数服从泊松分布假设为例,对应的模型为:

由于NBI分布含有形状参数与尺度参数,索赔次数服从NBI分布的模型为:

由于ZAP分布含有位置参数μ与斜度参数ν,索赔次数服从ZAP分布的模型为:

式(23)、式(24)、式(25)中,X是解释变量矩阵,β0,…,β24,γ0,…,γ24为不同类别不同水平下解释变量的待估参数,K1、Z1、B1与M1为基准水平。

在尝试基于不同分布的模型构建过程中,泊松分布、NBI分布与ZAP的拟合效果较为理想,ZIP分布在ν假定为常数的情况下可以得到相应的结果,而ZANBI与ZIN-BI的算法不收敛,将其舍去,最后参数估计结果如表1所示。

上述各个基于不同分布的模型比较统计量结果如表2所示。

经过比较GAIC与SBC统计量,以及观察各个拟合模型的标准化残差图,可以判断模型的拟合优度。表2的结果显示,对于本组样本数据而言,基于NBI分布的拟合效果相对较好。

4.3 拟合索赔额

对总索赔额进行拟合分析,零值的存在使逆高斯分布与伽玛分布不再是合适的选择,分别基于ZAIG与ZAGA对索赔额进行建模分析,以ZAGA分布的假设为例,对应的模型为:

式中,X是解释变量矩阵,β0μ,…,βμ24,β0σ,…,βσ24,β0ν,…,βν24是待估参数,表3给出了这些参数的估计结果。

表4列出了两个模型下的GAIC统计量与SBC统计量的值。

图2给出了拟合模型的标准化残差图。无论是在图2(a)所示的基于NBI分布的拟合模型的标准化残差图中,还是在图2(b)中基于ZAGA拟合模型的标准化残差图中,标准化残差的分布都比较均匀,核密度估计图接近标准正态分布,QQ图中残差的样本点基本落在一条直线上。可以看出,基于NBI分布与ZAGA分布的模型对于索赔次数与总索赔额的拟合效果比较理想。

进一步地,基于ZAGA分布的拟合模型可以结合已知的数据集来得到分布参数μ、σ和ν的估计值。从表5的结果可以发现,拟合的总索赔额的均值^μ在一定程度上接近于数据集中变量Payment的实际观测值,表明模型拟合结果比较理想。

5 结语

有限混合模型 篇5

大量准确可靠的动态交通信息是ITS(智能交通系统)得以顺利实施的基础。与其他检测技术相比,视频检测技术最显著的优点是具有丰富的信息量,因此为复杂检测任务的执行和交通信息的获取提供了可能[1]。

背景差分法是最常用、最有效的交通视频处理模式,而背景估计正是背景差分法的基础和核心环节。背景估计方法是视频交通信息采集领域的研究热点,近年来有大量的新方法出现,但目前尚没有1种被普遍接受的模型方法。常见的模型方法有统计学模型[2,3]、卡尔曼滤波法[4]、混合高斯分布模型[5,6]等。统计学模型中最常用的方法为序列均值法[3],该方法将运动对象的像素纳入背景估计,存在一定的偏差,适用于背景大部分时间未被遮挡,即交通占有率很低的情况。基于卡尔曼滤波的背景估计模型能够适应光线均匀、有序的变化,但卡尔曼滤波法在光线不稳定的情况下难以建立有效的状态转移矩阵,而对于目标像素常被遮挡(如交通繁忙时)的情况也难以适应。基于混合高斯分布的背景估计模型可以很好地适应光线的变化,对于缓慢移动的目标有较好的鲁棒性,但该方法对每个像素点都需要用相应的模型来进行描述,每个模型由多个高斯函数加权得到,因此模型的建立、参数的确定相当困难,算法的时空复杂度很高,对照明突变(如在公路隧道中)的应变能力较弱,不适合用于城市实时交通信息视频采集和处理。

针对城市道路实时交通信息视频信息采集和处理,笔者在综合考察现有方法的优缺点,并充分考虑算法的实时性的基础上,提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的混合模型对图像背景进行快速估计。

1 模型描述

1.1 背景像素亮度高斯分布假设

高斯分布满足自然界的许多现象,许多学者认为背景像素亮度值分布符合混合高斯分布的特点[5,6]。多高斯混合分布的缺陷是模型参数获取困难,样本需求量大,不能满足实时交通信息采集的要求。鉴于此,笔者提出了如下模型假设[7]:在主照明光源没有明显变化,且无遮挡的时间段内,数字图像上任意像素点的亮度值满足单高斯分布,即:

p(x)=(2πσ)-1e(x-μ)22σ2(1)

式中:p(x)为像素取某个亮度值x的概率;标准差σ>0;最大概率max(p(x))=(2πσ)-1;数学期望E(x)=μ。上述假设中“主照明光源”在白天指自然光,在夜间指自然光与路灯光的叠加;由于自然光、路灯光在大多数情况下是渐变的,在短时间段内(如几分钟)可认为“没有明显变化”,如果背景更新的频率(一般5~60 s)足够高,则上述假设可适应一般的交通场景。同时,以任何一帧图像(即便无任何前景目标存在)作为背景图像都是有偏差的。

本模型中,在没有遮挡的情况下,要获取背景图像某像素点在一段时间内的真实值,采用数节学期望E(N(μ,σ2))来表示,该方法与序列均值法一致。但是实际上,城市的道路常常会被车辆遮挡,单高斯分布假设并不存在,若直接按照此方法进行计算,误差将会很大。

为了处理干扰信息,将车辆对背景上某像素点的遮挡看作为随机干扰,由于车辆本身颜色、反射度等光学特征的差异,这些随机干扰一般不构成单一的高斯分布。即车辆遮挡下背景像素的亮度概率函数为:

p(x)=Q(x)(2)

对于车道上任意点的像素,其亮度值概率函数可描述为:

p(x)=(1-Οcc)(2πσ)-1e-(x-μ)22σ2+ΟccQ(x)(3)

式中:Occ为系数,对应交通工程中的占有率指标。一般来说,Occ越小,表明道路的交通占有率越小,采用数学期望方法估计出来的结果越接近于真实值。因此,在进行样本采集时,应尽量将像素点被遮挡的图像筛选出来,不作为背景估计的样本。

直接采用数学期望作为估计值,将会干扰信息纳入背景值中,因此本文采用最大后验法,此时的背景估计模型为:

μ=argmaxx(p(x))(4)

式(4)成立的前提是“真实背景值出现概率最大”的情况不被遮挡像素所改变。当观测时间内车辆遮挡的情况较少时,即占有率Occ较小时(极端情况下当Occ=0时式(3)等于式(1)),式(4)能够成立。

但是,当经过的车辆大部分与路面的颜色、反射度等光学特性相近时,就会影响到μ的取值;随着占有率Occ的增大,由式(3)可知,车辆亮度值对最终估计结果的影响也会变大(极端情况下当Occ=1时,则背景上的像素完全被淹没),此时μ具有较大的偏差。

综合考虑光源突变时(如隧道照明改变、多云天气、路边树荫等情况)能够实时更新背景,改进的算法如下:

if(aΤ)and(t0)and(abs(argmaxx(p(x))-L^i-1)D)thenL^i=L^i-1,a=a+1elseL^i=argmaxx(p(x)),a=0

式中:a为累加器;T为最大累加次数;D为亮度突变阈值;t为第t次进行背景图像获取;t从0开始取值,L^i为第t次计算获得的背景图像。

1.2 基于帧差法的样本分块选取

在求取argmaxx(p(x))时,统计样本数太大,则计算复杂度会很高(由于需要对每1个像素进行估计;另外为了快速适应环境变化,背景图像必须按照较小的时间间隔进行更新);但是样本数太少,则遮挡物的干扰变得显著。为了在取较小样本时仍具有良好的背景估计效果,需要考察样本的可靠性并进行选择。具体方法是:将图像划分为若干个子区域,采用计算复杂度很小的帧差法[8,9]计算各子区域中的运动像素数(按照某阈值对帧差法结果进行二值化,大于阈值的像素为运动像素),运动像素数小于某个阈值,才将该区域中的像素纳入统计样本中。区域划分如图1(a)所示,其对应的区域选择如图1(b)所示。值得注意的是,虽然每一帧图像选择的区域不同,但多帧图像样本联合起来能够对整个视频区域进行完整的背景估计。

假如将图像(高H、宽W)平均划分为r行、c列,那么共有r×c个分块,任意像素(x,y)所属的区域为yrΗ+1行、xcW+1列对应的分块,因此该像素在当前图像下作为背景估计样本的条件是:

WLS(yrΗ+1xcW+1)G(5)

式中:WLSyrΗ+1行、xcW+1列对应的分块的运动像素数;G为阈值。

1.3 算法流程

在以上分析的基础上,可得到1种快速的、融合了高斯分布模型和帧差样本选取的背景估计方法,其流程如图2所示。其中图像输入按照一定的采样间隔来进行,常用的频率有25帧/s,为了降低算法的复杂度,也可以设为10~15帧/s;图像分块数量与具体的道路环境有关,一般取40~70个比较适宜;统计样本数直接决定了背景估计的效果和效率,为同时兼顾算法的精度和速度,一般取30~50个比较适合。

图2中,获得最新的图像背景后,清空样本集继续进行图像采集。背景图像根据一定的周期不停地进行更新,因此算法对于环境变化的适应能力较强。

2 实 验

实验地点为广州市广园东快速路,分别采用文献[3]所介绍的序列均值法、文献[10]所介绍的多颜色模型法以及本文提出的样本选择高斯估计模型对白天交通场景和夜间交通场景进行背景估计,结果如图3所示。

采用本文方法时,背景更新间隔是5 s,背景估计所采用的样本数为30个。实验结果表明,序列均值法、本文方法均能在10 s内获取图像背景,而多颜色模型法需要约25 s才能做到。对于白天的背景图像估计,序列均值法受运动车辆的影响较大。

3 结束语

背景估计是视频交通信息采集的基础技术之一,对于环境多变情况下的实时交通信息采集,目前仍没有足够高效、稳定的背景估计方法。笔者提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的背景图像混合估计方法。单高斯估计模型符合像素在无遮挡情况下的亮度分布特性,与现有多数方法相比该模型参数简单,算法的实时性好;为了提高单高斯估计模型的应用效果,对图像进行帧差分块选取,从而提高了样本的纯度,削弱了运动物体和噪声对于像素分布的影响。实际道路环境下通过与序列均值法、多颜色模型法进行实验比较,证明了该方法的正确性和有效性。

摘要:为适应交通环境多变情况下实时交通信息动态采集的要求,提出了1种基于单高斯分布假设、图像分块处理、利用帧差法进行样本选取的动态混合模型对交通信息的图像背景进行快速估计,并在实际道路环境下对多种方法进行实验比较,证明该模型有效地削弱了运动物体和噪声对于背景估计的影响,具有较好的正确性和有效性。

关键词:智能交通系统,动态交通信息采集,图像处理,背景估计,高斯分布

参考文献

[1]林培群.道路交通参数及交通事件智能检测关键技术研究[D].广州:华南理工大学,2008

[2]Triantafyllidis G A,Tzovaras D,Strintzis M G.Occlusion and visible background andforeground ar-eas in stereo:a bayesian approach[J].IEEE Trans-actions on Circuits and Systems for Video Technolo-gy,2000,10(4):563-575

[3]Jung Y K,Ho Y S.Traffic parameter extraction u-sing video-based vehicle tracking[C]//Proceedingsof IEEE International Conference on IntelligentTransportation Systems,1999

[4]Copeland B R,Chen M,Wade B D,et al.Anoise-driven strategy for background esti mation and eventdetection in data streams[J].Signal Processing,2006,86(12):3 739-3 751

[5]李全民,张运楚.自适应混合高斯背景模型的改进[J].计算机应用,2007,27(8):2 014-2 017

[6]Bailo G,Bariani M,Ijas P,et al.Background esti-mation with gaussian distributionfor i mage segmen-tation,a fast approach[C]//Proceedings of IEEEInternational Workshop on Measurement Systemsfor Homeland Security,2005

[7]Lin P Q,Xu J M,Bian J Y.Robust vehicle detec-tion in vision systems based on fast wavelet trans-form and texture analysis[C]//Proceedings ofIEEE International Conference on Automation andLogistics,2007

[8]Lucke R L,Stocker A D.Filteringinterpolators forframe differencing signal processors[J].IEEETransactions on Signal Processing,1993,41(8):2 574-2 582

[9]Tanaka K,Saji H.Vehicle extraction from aeriali mages using voting process and frame matching[C]//Proceedings of IEEE Intelligent VehiclesSymposium,2007

有限混合模型 篇6

动作分类主要有两大方法, 一类是利用判别模型 (discriminative models) 进行分类, 例如采用支持向量机等方法, 另一类是基于生成模型 (generative models) 进行分类, 例如采用主题模型或隐马尔科夫模型进行分类。作为一种典型的生成模型, 主题模型在计算机视觉领域, 特别是物体识别和分类领域得到成功的运用, 很多研究者结合词袋模型的框架, 利用生成模型来进行动作识别。

这些方法利用主题模型进行分类, 动作的类别直接对应于主题标记。原则上来讲, 判别模型在训练和分类方面, 性能比生成模型好。但是, 生成模型能够提供更多有用的信息, 它能够在视觉特征与模型中的隐变量之间建立直接的联系, 从而能够处理数据丢失以及非监督学习等问题。有一些研究者试图将判别模型和生成模型结合起来进行物体识别。在文献中判别模型和生成模型采用ad-hoc的方式进行结合。在文献中, 作者在生成模型的基础上进行判别模型的学习, 其中背景的后验概率被认为是一个常量。

本文提出了一种新的生成/判别混合模型来进行动作识别。该方案利用Fisher核的方法, 通过主题模型LDA建立训练样本的Fisher核表示, 然后利用核函数训练判别模型进行动作分类。

2 生成/判别混合模型的动作识别

2.1 动作表示

本文仍采用轨迹特征和时空点特征进行动作表示。利用显著点得到动作运动模式的轨迹, 然后对这些运动轨迹提取一些描述子来表示轨迹。这些轨迹反映了动作在较长时间段的信息。同时本文利用了时空兴趣点的方法来捕捉局部运动信息。针对轨迹特征, 提取了三种不同的描述子, 一是用SIFT点的平均特征表示的轨迹点之间的信息, 二是用轨迹的方向和幅值表示的轨迹运动特征, 三是利用傅里叶描述子进行表示的轨迹形状特征。针对时空兴趣点特征, 则采用了3D-SIFT描述子进行表示。在生成/判别混合模型中, 将让这两种特征进行整合, 从而训练一个分类器。轨迹特征能够反映全局的运动信息, 而时空点特征能够反映局部运动信息, 将这两种特征进行组合, 能够有效的提高动作表示的可判别性。

2.2 核方法

对于监督学习的问题, 例如回归或是分类问题, 核方法已经被证明是非常有效的一类方法。本文选择SVM作为基于核的分类器。构建一个有效核的方法是定义一组特征, 然后定义一个核矩阵K (x i, xj) =φT (xi) (xj) 。在这样的判别模型下, 生成模型可以通过定义这些特征来与判别模型进行整合。也就是说, 可以利用生成模型定义核函数, 然后在判别方法中利用这个核。

本文利用LDA模型作为训练Fisher分值的生成模型。原则上, 任意形式的可以进行利用求导进行推断的主题模型均可以利用Fisher核方法计算Fisher分值。本文采用LDA模型作为选定的生成模型。

为了训练一个SVM分类器, 需要计算LDA的Fisher分值。针对LDA模型, 可以利用变分推断的算法计算偏导数变分推断的基本思想是将p (θ, z, w|α, β) 用一个可以进行因式分解的变分概率分布q (θ, z) 来表示, 其中

偏导数实际上可以由变分EM算法计算得到。在完整的贝叶斯形式的LDA生成模型中, Fisher分值的长度为k+V。本文利用完整的贝叶斯LDA作为生成模型来训练SVM。

假定有一组M (j=1, 2, ..., M) 个视频序列, 这些序列由大小为V的词典中的单词构成。每一个视频dj可以表示成Nj个时空单词构成的向量w= (w1, w2, ..., w Nj) , 生成/判别混合模型的训练过程如下:

(1) 计算主题模型的Fisher分值, 这些导数可以从变分EM收敛的结果中得到。这个过程可以看做是生成模型的特征训练过程。

(2) 利用Fisher核方法训练一个基于RBF核的SVM分类器, RBF核的形式如下:

尽管LDA是一个简单的模型, 但它可以很容易的进行扩展。因此, 将那些扩展的生成模型与判别模型进行整合也可以得到新的混合模型。这篇文章提出的构建Fisher分值的方法为那些利用变分方法求解的主题模型与判别模型的组合提供了一种可行的参考。需要强调的是, 基于生成模型来构建核的Fisher核方法, 仅适用于可以利用变分方法求解的主题模型, 那些利用随机方法 (采样) 求解的主题模型并不能很容易的计算出Fisher分值。

3 实验结果与分析

本文在KTH数据库上进行了测试。对KTH数据, 将25个人完成的视频序列分成训练集、验证集和测试集, 其中8个人的动作视频用来进行训练, 另外8个人的视频序列作为验证集进行分类器参数的选择, 其余9个人的视频序列用于测试。混淆矩阵:图1给出了在数据库上的混淆矩阵。可以看出本方法具有较好的识别效果。

由于本文采用基于码书的特征来进行动作表示, 码书的大小影响对识别率有一定的影响。由于主题可以表示每个动作的语义信息, 主题的个数对识别率也有影响。随着参数个数的增加, 识别率成上升趋势。此外, 仅仅使用主题参数的Fisher分值得到的识别率较高, 而使用码书参数得到的Fisher分值较低。这主要是由于每段视频的Fisher分值之间差异不大, 不能有效反映动作类别之间的差异。

4 小结

本文提出了一个新的生成/判别模型来进行动作识别, 这个混合模型首先采用Fisher核的方法, 利用主题模型得到特征的一种映射表示, 然后利用这种映射表示, 实现对SVM的训练。这个混合模型有效的保持了生成模型的优点, 同时提高了判别模型的分类性能。

摘要:生成模型能够处理丢失的数据, 而判别模型一般具有较好的分类性能。本文提出了一种新的生成/判别混合模型来进行动作识别。该方案利用Fisher核的方法, 通过主题模型LDA建立训练样本的Fisher核表示, 然后利用核函数训练判别模型进行动作分类。

关键词:生成模型,判别模型,混合模型,主题模型,Fisher核

参考文献

[1]Holub, A.P., P., A discriminative framework for modelling object classes, in IEEE Conference on Computer Vision and Pattern Recognition, C.Schmid, S.Soatto, and C.Tomasi, Editors.2005, Ieee Computer Soc:Los Alamitos.p.664-671.

[2]Bar-Hillel, A.H., T.Weinshall, D., Object class recognition by boosting a part-based model, in 2005IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Vol 1, Proceedings, C.Schmid, S.Soatto, and C.Tomasi, Editors.2005, Ieee Computer Soc:Los Alamitos.p.702-709.

[3]Blei, D.M.N., A.Y.Jordan, M.I., Latent Dirichlet allocation.Journal of Machine Learning Research, 2003.3 (4-5) :p.993-1022.

[4]Holub, A.D.W., M.Perona, P., Combining generative models and Fisher kernels for object recognition.IEEE International Conference on Computer Vision, 2005.143 (1) :p.136-43

一种考虑混合作用的烟气区域模型 篇7

文献[2]提出一种三层模型FASIT模拟隧道火灾。模型中,整个区域首先被分成多个子区域,每个子区域沿高度方向分成三层,每一层中,物理量(温度、烟气体积分数等)的属性假设为完全均匀的。模型的缺点是需要动态跟踪模拟2个界面,这种界面在隧道火灾模拟中相对比较容易确定,但是在建筑火灾中,由于门窗的关闭打开,导致边界条件非常复杂,因此使用该模型并不方便。

文献[3]针对单室火灾提出一种多层模型。该模型将一个房间分为若干垂直层,模拟结果与实验符合较好,但该模型推广到多层多室火灾时,会产生大量的动态界面,确定这些界面之间的物质和能量交换是非常困难的。

笔者提出一种新的区域模型,即考虑热烟气层和冷空气层的混合作用,通过一个标量函数F来表征冷热层的混合行为,并确定冷热层间的物理量分布形态。与之前的三层模型和多层模型不同,该模型混合层中的物理量并不需要假设为均匀分布。笔者用新三层模型对建筑火灾进行了模拟,并将结果与实验数据、区域模型CFAST以及场模型FLUENT的模拟结果做了对比。

1 三层模型介绍

模型中,计算区域被分成不同的子区域,每个子区域分为热烟气层、冷空气层和混合层。在湍流中,混合层的物理量分布具有自相似性,这种自相似性已经被直接数值模拟和实验证实。因此,引入标量函数F来描述混合层中的物理量分布,如烟气体积分数、温度和流动速度。通常情况下,F应该是高度、时间以及环境条件等变量的复杂函数,相关物理量Φ(温度、烟气体积分数、组分体积分数等)均是F的函数,见式(1)。

Φ=Φ(ΦU,ΦL,F) (1)

式中:ΦU和ΦL分别为该物理量在热烟气层和冷空气层的最大值和最小值。

标量函数的取值范围为0~1。当F只取0和1时,该区域模型即为传统的两层模型;当F取0、0.5、1时,该区域模型就是三层模型FASIT。一般来说,需要建立F的控制方程,并通过基于网格的方法如VOF或level set,求解F的精确分布。但由于区域模型计算量小,没有划分网格,因此无法采用上述方法来求解F,需要寻求另外的方法。

为了得到F的分布,笔者研究火灾实验中温度的垂直分布特点。Steckler进行了一系列全尺寸火灾实验,测量了温度的垂直分布。从实验数据可以发现,尽管不同的火源强度下,温度的绝对值并不相同,但其垂直分布的形态是相似的,即:混合层中,温度几乎是线性分布的,见图1所示。基于此,将F假设为线性函数,在冷空气层中,F为0;在热烟气层中,F为1;在混合层中,F从0线性增加到1。因此,模型将标量函数F定义为式(2)。

undefined

式中:Hundefined和Hundefined分别为热烟气层底部及冷空气层顶部的高度;t为时间; H为高度。

基于标量函数F,相关物理量如温度、烟气体积分数等均可以用式(3)求出。

Φ=FΦU+(1-F)ΦL (3)

需要说明的是,标量函数F也可采用其他形式或通过实验来校正。在常湍流粘性的混合层中,物理量的分布是误差函数的形式,见式(4)。

undefined (4)

式中:D和α分别为层流和湍流扩散系数;x为空间距离;t为时间;erf为误差函数。

从高体积分数到低体积分数的混合过程中,有如下表达式(5):

undefined (5)

式中:Chigh和Clow分别为高体积分数和低体积分数;Thigh和Tlow分别为高温和低温。

因此,热烟气层与冷空气层的混合行为也可以由上述公式近似表达。标量函数F也可以采用上述误差函数定义,见图1所示。可以看出,这两种分布的主要差别只是在于从冷空气层到混合层,以及从混合层到热烟气层的光滑性。为了简化,笔者采用线性分布,但可以预期,这两种分布在混合层的大部分区域内应该是相似的。

对于混合层的厚度,由湍流输运理论可知,热边界层和流动边界层的厚度取决于湍流普朗特数Pr、有效涡粘系数和扩散时间,见式(6)。

undefined

式中:*为动量扩散;**为热扩散;vt和vl分别为湍流和层流涡粘系数。烟气混合过程接近于剪切湍流,因此采用理想剪切湍流假设,用代数湍流模型来估计上述湍流涡粘系数,见式(7)。

undefined (7)

式中:U0为特征速度,undefined;S和x分别为扩展率和特征尺度。实验表明,扩展率S几乎为常数。例如,Lumley测量到当雷诺数为11 000时,扩展率为0.096,Hussein测量显示当雷诺数为95 500时,扩展率为0.102。因此,模型中扩展率取为0.1。RT代表湍流雷诺数,平面射流为31, 圆射流为35。由此即可计算湍流涡粘系数。湍流普朗特数Pr,根据实验,取为1。

根据分段线性函数F的特点、混合层的厚度Hundefined(t)-Hundefined(t)和界面位置(F=0.5的位置),即可完全确定F的分布。由于混合层厚度已经给出,因此只需要计算界面位置即可,计算方法完全与两层模型一致。

为了计算质量和能量的输运,跟踪冷热空气的界面,同时引入混合层的影响,采用式(8)计算上下层的平均物理量undefined。

式中:Hint为F=0.5时对应的高度。

考虑到标量函数的定义,可以得到式(9)。

对于混合作用的控制方程。根据密度、内能的定义和热力学第一定律以及质量守恒和能量守恒,可以推导出如式(10)所示的控制方程。

undefined

由于各质量和能量交换项与CFAST完全相同,因此可以利用CFAST的程序框架改进实现。

2 模拟结果及分析

如图2所示的建筑结构,包含1个中庭、3个长走廊和25个敞开的房间,这些房间允许烟气进入。走廊26长59.7 m、高2.67 m、宽2.4 m。走廊27长19.4 m、高2.67 m、宽2.0 m。走廊28长49.0 m、高2.67 m、宽2.4 m。选取3个模拟火灾场景,场景1火源位于中庭1的中央,场景2火源位于14号房间中央,场景3火源位于走廊26的中部。火源热释放速率假设为时间的函数,最大热释放速率为3 MW。

为了对比,分别采用三层模型、两层模型CFAST和FLUENT进行火灾烟气运动模拟。

图3、图4给出了场景1、2在150 s和300 s时温度的垂直分布。可以看出,三层模型的结果更接近FLUENT的模拟结果。这说明相比于传统的两层模型CFAST,三层模型能够提高温度垂直分布的预测精度。从图中还可以看出,由于两层模型中没有考虑混合作用,因此在界面处温度存在突跃,并导致上层烟气的温度预测值偏高。三层模型与CFD模型的偏差主要是由于混合层的厚度误差。因为混合层的厚度主要由涡粘性系数决定,模型采用了常数值,实际上更精确的方法应该是采用湍流模型给出。正是这个因素导致了混合层厚度的预测误差,从而导致温度偏差。

高度为1.5~2.0 m处的物理量分布对于人员疏散至关重要,影响人员安全。从图3、图4可以看出,此高度范围恰好位于混合层中,因此考虑混合作用的影响是很有意义的。从预测结果看,1.5~2.0 m的高度范围内,三层模型更接近CFD的预测结果,比两层模型CFAST有较大改进。

从图3、图4的温度分布来看,随着时间的推移,走廊的预测结果逐渐精确,而靠近火源的房间则变差。原因在于烟气在走廊和房间的输运方式不同。在走廊中,混合层的发展需要更长的时间,混合作用的影响更大。在混合层的发展阶段,走廊中持续时间更长(如场景1和3超过300 s),三层模型在这个阶段预测更精确。而在场景2中,房间中的混合层发展得更快,可能在更短的时间内出现改进。因此,三层模型更适合预测长时间的走廊烟气分布和短时间的房间烟气分布。

在某一高度处的温度分布对于人员疏散十分重要,而且走廊中的温度和烟气高度会影响其他房间。因此,给出用三种方法预测的2 m高度处走廊的温度变化,见图5所示。其中,CFD的结果是将走廊1/4、1/2、3/4宽度处的温度平均后给出的。

从图5可以看出,三层模型预测的2 m高度处的温度分布更接近CFD预测结果,特别是在靠近火源的走廊中。如图5(a)和图5(c)中,由于火源位于中庭1,热烟气和冷空气的混合导致三层模型对于走廊26和28的温度预测结果比CFAST要低,更接近CFD预测结果。当混合层中的烟气从走廊26和28进入走廊27时(约250 s左右),走廊27的温度预测值也开始低于CFAST的预测结果。但同时可以看出,三层模型的结果仍然比CFD的模拟结果偏高,原因是当前的三层模型仅考虑了垂直方向的混合作用,当动量输运变弱时如烟气进入走廊27时,水平方向的混合作用会变得明显,三层模型没有考虑这种影响,故存在一定的误差,并且这种误差会在距离火源房间较远的地方更加明显,如在场景1中走廊27。以上分析同样适用于场景2和场景3。

下面比较一下三种模型的计算时间。模拟是在Intel Core2 Duo 2.4G 的CPU下完成的。CFAST模型对于三个场景的计算时间分别为8.41、8.40 s和7.17 s,三层模型的计算时间分别为14.95、14.90 s和11.88 s;而CFD完成三个场景分别需要39、42 h和38 h。可以看出,三层模型和CFAST都能显著降低计算时间,同时三层模型尽管计算时间比CFAST略多,但却能显著提高预测精度,同时时间的增加量在工程上也是可以接受的。

3 结 论

提出了一种考虑混合作用的烟气输运模型,该模型适合模拟复杂建筑或空间的火灾烟气传播过程。与传统的两层区域模型CFAST不同的是,模型将空间分为三层,在传统的上下两层结构的基础上加入混合层,并引入标量函数来表征混合层中的物理量。

笔者只是对该模型做了初步验证和确认,后续还需要更为细致的考核(如用不同的火灾场景、边界条件等),以此给出模型参数的敏感性分析,以便为将来的模型改进提供参考。

参考文献

[1] Olenick, Stephen M, Carpenter, et al.An updated international survey of computer models for fire and smoke[J]. SFPE Journal of Fire Protection Engineering, 2013,13(2):87-110.

[2]Charters D A,Gray W A,McIntosh A C.A computer model to as-sess fire hazards in tunnels(FASIT)[J].Fire Technology,1994,30(1):134,154.

[3]Suzuki K,Harada K,Tanaka T.A multi-layer zone model for pre-dicting fire behavior in a single room[C].Proceedings of the Sev-enth International Symposium,International Association of FireSafety Science,2002.

[4]Panchapakesan N R,Lumley J L.Turbulent measurements in axi-symmetric jets of air and helium[J].Journal of Fluid Mechanics,1993,246:197-223.

上一篇:欧洲绘画下一篇:身体指标