数据融合算法

2024-05-28

数据融合算法(共9篇)

数据融合算法 篇1

大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集[1]。随着产业数据量的种类和规模的爆炸式增长, 大数据概念受到越来越多的关注, 各种云计算、物联网、智能系统等新兴服务促使社会以前所未有的速度跨步发展。

鉴于大数据的海量, 复杂多样, 信息的维度多, 颗粒度细, 信息更非结构化等特性, 使得大数据环境的构建颇为复杂。大数据时代数据的收集问题不再成为我们的困扰, 采集全量的数据成为现实。全量数据带给我们视角上的宏观与高远, 这将使我们可以站在更高的层级全貌看待问题, 看见曾经被淹没的数据价值, 发现藏匿在整体中有趣的细节。因为拥有全部或几乎全部的数据, 就能使我们获得从不同的角度更细致更全面的观察研究数据的可能性, 从而使得大数据的分析过程成为惊喜的发现过程和问题域的拓展过程。很多人自始至终都认为数据是越多越好, 那么理想中的大数据是更多的数据, 还是由各种算法构成智能处理技术。

大数据的理想形态是不用构建算法模型, 也可以说已经构建了完整的统计模型, 不用根据具体的问题再单独建立模型, 数据自身会从数据特性, 规律去进行统计分析, 人们只需要将所有数据输入, 计算机就能利用完整的统计模型, 决策出哪些数据适用哪个模型, 解决了哪些数据的问题。最后大数据的输出成果将不是一份报告, 而是一个完整的体系, 给出了在各种条件下的结论的体系。这个体系没有一份报告能容纳如此多的结果。大数据给出的体系具有普遍性, 客观性, 解决了人们片面的使用数学模型, 得出片面结果的问题。

当然, 这是一种理想的智能环境模式。智能环境的理想状态就是, 计算机能够自己的进行推理, 能够自适应数据的维度、结构。到了那个时候, 更多的数据将胜过更好的算法, 因为那时候已经没有了算法, 没有什么是不能计算的。

但现实是, 我们目前的大数据离理想中的大数据形态还有很远的距离。首先, 模型本身就是大数据的一部分, 各种不同模型都有各自的适用范围;其次, 已有的模型可能不适合新的数据, 那么就要构建新的模型, 这都给大数据环境的架构带来很大的困难。

数据分析员总是习惯带着预先设定的结论去分析, 这是统计学随机样本检测的特点, 随机样本带给我们的只能是事先预设问题的答案。他们会不自觉地以对自己有利的方式对这些数据进行分析和解释, 即使这些方式很可能与这些数据所代表的客观现实不相吻合。出于各种原因, 数据分析员很难从干扰他们的噪声中分辨出有用的信号, 甚至会无视这些真实有用的信号。

于是, 数据展示给他们的通常都是他们想要的结果, 而且他们通常也能确保这些数据令大家皆大欢喜。同时, 我们有时天真的相信各种预测分析模型, 却没有人认真地去验证这些模型是否科学合理, 是否与事实相符, 也许这些模型在进行架设选择时根本不堪一击。这种缺乏延展性的结果, 无疑会使我们错失更多的问题域。

大数据时代, 算法不再受限于传统的思维模式和先验的假定, 数据会为我们呈现出新的深刻洞见和释放出巨大的价值, 只有更好的使数据和算法融合, 才能在随时接收着来自数据的同时做出快速的决策, 这样效率会大大提升, 大数据的价值也正是在于将及时的信息及时的传递给需要的人手中并及时的做出决策。

笔者认为数据只是基础, 而更多的是如何建构起有效的算法、模型, 这比数据本身更重要, 网络中有时更多的数据意味着更多的噪声。信号是真相, 噪声却使我们离真相越来越远。

目前的大数据与理想中的大数据形态的距离并不在于数据源的多少上, 数据源从来不是问题, 问题是在于我们如何去构建一个科学合理的分析模型, 并坚信分析模式的输出结果。通过不断地修正、累积各种正确的分析模型, 我们将不断接近理想形态。

我们以为自己需要更多的信息, 但其实我们真正需要的是知识, 需要的是更多的解决问题的模型。所以, 大数据是一种理想的智能环境, 目前我们只是站在一个很长过程的起点上。

参考文献

[1]Big data[EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data.

[2]王元卓, 靳小龙, 程学旗.网络大数据:现状与展望.计算机学报, 2013 (6) :1125-1138.

[3]李德仁.数字城市+物联网+云计算=智慧城市.中国新通信, 2011 (20) :46.

数据融合算法 篇2

基于图像融合的年轮细胞边缘检测算法研究

提出一种基于图像融合的边缘检测算法.首先对源图像进行小波分解.在不同分解层用小渡模极大值法对高频子图像进行边缘检测,用数学形态学时低频子图像进行边缘检测.然后采用一定的融合规则将这两个边缘检测图像融合在一起.实践结果表明.这种方法优于单独使用小波模极大值法或数学形态学法,对噪声具有很好的.鲁棒性.得到的图像边缘连续、清晰.

作 者:崔莉 孙丽萍 CUI Li SUN Li-Ping  作者单位:东北林业大学机电工程学院,黑龙江,哈尔滨,150040 刊 名:机电产品开发与创新 英文刊名:DEVELOPMENT & INNOVATION OF MACHINERY & ELECTRICAL PRODUCTS 年,卷(期): 22(6) 分类号:P317 关键词:小波变换   教学形态学   边缘检测   图像融合  

数据融合算法 篇3

神经网络(Neural Network,简称NN)是对人脑或自然神经网络若干基本特性的抽象和模拟,是一门多个学科领域的边缘交又学科。它以对大脑的生理研究成果为基础,旨在模拟大脑的某些机理与机制,实现某个方面的功能[4]。

神经网络与数据融合具有一个共同的基本特征,即通过对大量的数据进行一定的运算和处理,得到能够反映这些数据特征的结论性的结果。本文提出一种新的无线传感器网络数据融合算法,该算法基于分簇无线传感器网络模型,将其中的分簇结构与神经网络模型相结合,在簇头节点利用神经网络算法对簇成员节点的数据进行融合处理,以有效地减少网络中传输的数据量,延长网络使用寿命。

1 无线传感器网络模型与神经网络模型

无线传感器网络由大量部署于监控区域的传感器节点组成。传感器节点分为3类:基站、簇头和普通传感节点。层次化无线传感器网络如图1所示。

本文采用的神经网络模型是典型的前馈神经网络—多层感知器(MLP)[5]。多层感知器由若干层非线性神经元组成,每个神经元都是一个感知器,每层包含多个感知器,相邻层的神经元用权连接起来。图2给出了多层感知器的结构示意图,通常情况下,层与层之间是全连接的,信号沿着前馈方向,即从左边到右边,逐层传递。

2 具体数据融合算法

本算法基于三层感知器神经网络模型,对应无线传感器网络中的一个簇。其中,输入层和第一隐层位于簇成员节点中,而输出层和第二隐层位于簇头节点中。

假设无线传感器网络中一个簇内有n个簇成员节点,每个簇成员节点采集m种不同类型的数据,那么该神经网络模型共有n×m个输入层节点、n×m个第一隐层神经元。第二隐层神经元的数量、和输出层神经元的数量k可以根据实际应用的需要进行调整,与簇成员节点的数量n并没有联系。对于不同类型的数据,第二隐层的数量可以不同。在输入层与第一隐层之间、第一隐层和第二隐层间没有采用全连接,只是对不同类型的数据分别进行处理;而第二隐层与输出层之间是全连接的,可以对不同类型的数据进行综合处理。

根据这样一种三层感知器神经网络模型,本文的数据融合算法首先在每个传感器节点对所有采集到的数据按照第一隐层神经元函数进行初步处理,然后将处理结果发送给其所在簇的簇头节点。簇头节点再根据第二隐层神经元函数和输出层神经元函数进行进一步地处理。最后,由簇头节点将处理结果发送给汇聚节点。下面以第一隐层神经元功能模型为例,叙述神经元函数信息处理过程。

第一隐层神经元位于簇成员节点。每个簇成员节点中第一隐层神经元的数量是根据传感器节点所采集的数据类型来决定的,不同类型的数据由不同的神经元来进行处理。第一隐层神经元功能模型的输入区、处理区和输出区三个功能函数如图3所示。

3 性能仿真

将本文的融合算法与基于卡尔曼滤波的融合方法进行比较,在条件相同的情况下,考察两算法性能的主要指标,包括:网络总能耗、节点平均剩余能量和平均时延三个方面。如图4所示。

图中,表示基于神经网络的融合算法,表示基于卡尔曼滤波的融合方法,由图可知,本文基于神经网络的融合算法在这三方面均优于基于卡尔曼滤波的融合方法。

4 结论

本文将神经网络功能模型与层次化无线传感器网络相结合,提出一种基于神经网络的无线传感器网络数据融合算法,通过采用该算法,有效地减少了网络的能耗,延长了无线传感器网络的生存周期,是一种较为实用的无线传感器网络数据融合算法。

摘要:该文将神经网络功能模型引入无线传感器网络,提出一种基于神经网络的无线传感器网络数据融合算法。实验表明该算法有效地减少了网络的能耗,延长了无线传感器网络的生存周期,是一种较为实用的无线传感器网络数据融合算法。

关键词:无线传感器网络,数据融合,神经网络

参考文献

[1]李建中,高宏.无线传感器网络的研究进展[J].计算机研究与发展,2008(1):1-15.

[2]Castelluccia C,Mykletun E,Tsudik G.Efficient aggregation of encrypted data in wireless sensor networks[J].Mobile and Ubiquitous Sys-tems:Networking and Services MobiQuitous,2005.

[3]Chen J,Pandurangan G,Xu D.Robust computation of aggregates in wireless sensor networks:Distributed randomized algorithms and anal-ysis[C].IPSN,2005:348-355.

[4]Simon Haykin.神经网络原理[M].北京:机械工业出版社,2004.

数据融合算法 篇4

摘 要:算理是四则运算的理论依据,它是由数学概念、运算定律、运算性质等构成的,运算法则是四则运算的基本程序和方法。运算是基于法则进行的,而法则又要满足一定的道理,所以算理为法则提供了理论依据,法则又使算理可操作化。

关键词:小学数学 计算教学 有效融合计算教学在小学数学教学中占有很大的比例,新课改已经十几年了,许多老师乃至家长都感觉到现在学生的计算能力明显下降了,大不如前,以及经常“粗心”出错,不仅影响了学习成绩,也影响了学生学习的自信心。曾经有些教师认为计算教学只要让学生把法则背下来反复练习即可,似乎不必花时间去研究计算法则背后计算的道理。在这里我不得不重提算理、法则的内涵以及二者的关系:算理是四则运算的理论依据,它是由数学概念、运算定律、运算性质等构成的,运算法则是四则运算的基本程序和方法。运算是基于法则进行的,而法则又要满足一定的道理,所以算理为法则提供了理论依据,法则又使算理可操作化。那么,在小学数学计算教学中如何将算理与算法合理融合在一起,是教师急需思考的问题。

一、借助学生已有知识经验,推动算理与算法之间相互迁移

在小学数学教学中,教师应积极引导学生借助已经学习过的数学方法与知识,科学完成算理与算法之间的相互迁移。比如,在学习人教版小学数学教材中与《小数加减法》有关的内容时,教师就可借助,为学生营造出一定的教学情景:“小刚与小明到商店买文具,其中文具盒8元一个,笔记本3.4元一本,讲义夹4.75元一个,彩笔2.65元一支”。小刚买了一支彩笔,小明买了一个讲义夹。求:(1)小刚与小明一共花掉多少钱?(2)小刚比小明多花多少钱?在学习这节新课时,学生已经学习了加法运算及一位小数的运算,所以在解答以上题目时,学生很可能用思维定势解决计算问题。虽然学生可凭借自己的计算经验进行计算,但是由于他们还没有清晰认识其中的算理,因此不敢确保自己所运算的结果完全正确。在实际教学中,有些学生用列竖式的方式进行计算,就出现了“把两个加数的末位对齐进行计算”及“把两数中的小数点对其进行计算”的情况。为了使得学生获得正确的计算结果,就需要教师从引导学生认识“元角分”为入手点,启发他们在计算时把单位相同的数对齐,借助这样的方式使得学生明白计算时应将小数点对齐。[1]

教学实践表明,教师引导学生利用已经学习过的计算方法,尝试算理与算法的相互迁移,可使得学生在温故而知新的同时,还能真切感知到算理与算法之间的密切联系。

二、引导学生思考算法,推倒出算法形成中的算理依据

在学生较好地掌握一些算法后,教师应激励学生回顾与反思这些算法,并借助沟通与商讨等方式分析算法形成过程中依据的算理。比如,在上题小刚与小明到商店买文具的习题,在教师的引导与启发下,学生已经理解了小数加法计算应将小数点对齐才能正确计算出结果。在此基础上,数学教师还应依据具体教学需求,使得学生在交流与讨论中,分析“整数加减法”和“小数加减法”之间的联系。通过学生思考、交流与回顾,不难发现两者的算理都是“相同位数必须对齐”,而“小数加减法”的算理是“必须对齐小数点”,从这里看两者貌似有不同之处。在这种情况下,教师可尝试换个角度启发学生深入分析与思考例题:2.65是2个1、6个0.1和5个0.01,而4.75是4个1、7个0.1和5个0.01,接着根据“整数加减法”的算理,把同位数对齐进行计算。

教学实践表明,教师启发学生深入思考算法,可使得学生站在更高的高度掌握与理解各种数学算法与算理之间的联系,把知识恰当地融合在一起,从而更科学地掌握计算法则。

三、创设恰当教学情景,帮助学生较好融合算法与算理

受到传统教学方法的影响,当前很多小学数学教师仍旧沿用过去的“讲读式”教学法组织教学活动,再加上数学知识本身就十分枯燥、抽象,这就不利于学生深刻而精准地掌握算法与算理知识。在这种情况下,教师就可大胆创新传统教学方法,将以往的空洞的理论创新为直观操作,尽可能为学生营造出生动、有趣的教学情景,最大限度激发学生参与教学活动的积极性,并加深学生对数学算理与算法的掌握程度,从而使得学生更好地将算法与算理融合在一起,以切实提高自身的计算能力。

比如,在上文提到的小刚与小明到商店购买文具的题目中,教师在实际教学中,就可用多媒体设备为学生营造出商店?物的逼真情景,然后将学生分成两人小组,其中一人扮演小明、一人扮演小刚,让他们将购买文具的钱放在一起进行直观的比较,从而深刻思考与体会小数加减法所依据的算理是什么。在角色扮演结束后,教师可引导学生把题目中提到的2.65元转化成2元6角5分,借助一边讲解一边列算式的方式,以加深学生对算理预算法的印象。[2]

总之,在小学数学教学中,计算教学占据重要地位,而算理与算法的学习情况对学生的计算能力有很大影响作用。今后在教学中我们还要多抓住课堂中的细节进行思考研究,做到真正读懂教材、读懂学生、读懂课堂,让我们的数学课堂更完美更精彩。

参考文献

数据融合算法 篇5

边缘是图像的基本特征之一, 也是图像分割所依赖的一个重要依据。因此, 边缘提取与检测在图像处理中占有很重要的地位。传统的边缘检测方法基于空间运算, 借助空域微分算子进行, 通过将算子模板与图像进行卷积合成, 根据模板的大小和元素值的不同有不同的微分算子, 如Robert算子、Sobel算子、Prewitt算子、LOG算子、Canny算子等[1]。这些算子虽然易于实现, 具有较好的实时性, 但由于边缘检测问题固有的复杂性, 使这些方法往往在抗噪性能和边缘定位方面得不到满意的效果, 这主要是因为边缘和噪声都是高频信号, 很难在噪声和边缘中做出取舍[2]。

数据融合技术是在采集多源信息的基础上, 通过协同利用原始的多源信息, 获得同一事物或目标的更客观、更本质认识的综合处理技术[3,4]。与单一、孤立的原始多源信息相比, 经过融合技术处理的信息更简洁、更少冗余, 因此更有效、更有用途。

目前, 在像素级图像的融合方法中, 多分辨率融合具有良好的效果。小波分解具有非冗余性, 图像经小波分解后数据总量不会变大, 再利用小波分解的空间频率和方向性, 就可以针对人眼的视觉频率特性和方向特征获得视觉效果良好的融合图像。由于用于正交小波变换的正交滤波器不具备线性相位特性[5], 其产生的相位失真将会引起图像中边缘的失真。为此, 提出一种基于双正交小波变换的多分辨率图像融合新方法, 以达到突出图像边缘和局域细节信息的目的。

1 图像的小波边缘检测

小波变换把图像信号分解成呈现在不同尺度上的多个分量[6], 小波变换的局部极大值点刻画出了图像信号突变点的位置 (图像边缘位置) 。通过选择适当的小波函数, 可以使小波分解的细节分量真实地反映出图像的局部灰度突变点。

1.1 小波多尺度边缘检测的方法

在图像的边缘检测中, 小波函数的选取直接关系到检测结果。Mallat等人首次提出小波用于边缘检测的图像分割方法, 并证明了小波变换用于边缘检测类似于Canny边缘检测方法, 若小波变换的基函数是高斯函数的偏导数, 则二者等效。小波母函数种类很多, 也可以自己构造, 但用于边缘检测的小波应当是有限紧支撑、对称和一阶消失矩的, 而且需要选择能够适合判定边缘检测算子有效的3个准则中最优边缘检测的小波。由于B样条小波的基底是有限紧支撑的, 并且收敛于Canny算子的m阶基数, 所以B样条小波边界检测算子在边界检测综合性能指标上是较佳的, 故最终选择B样条小波来作图像边缘检测[7]。

当m取有限值时, 中心B样条函数及其导数对高斯函数及其导数有极高的逼近精确度。设二维图像信号为f (x, y) , θ (x, y) 是二维平滑函数, 满足:

undefined

对平滑函数θ (x, y) 分别求x方向和y方向的偏导数, 有:

undefined

则φ1 (x, y) 和φ2 (x, y) 可看作二维小波函数。对于任意函数f (x, y) ∈L2 (R) , 由两个小波φ1 (x, y) 和φ2 (x, y) 定义的小波变换具有两个分量:

undefined

梯度矢量为:

undefined

式中:S为尺度系数;Wundefinedf (x, y) 和Wundefinedf (x, y) 分别表征图像中沿x, y方向的偏导数。小波变换在尺度2j的模和幅角分别为:

小波变换的模M2jf (x, y) 正比于梯度向量undefined的模, 小波变换的幅角A2jf (x, y) 是梯度向量undefined与水平方向的夹角, 这正是图像边缘的方向。因此, 要检测边缘, 只需寻找梯度向量undefined的模的局部最大值点。在每一个尺度2j, 小波变换的模的最大值都定义为模M2jf (x, y) 在沿着梯度方向的局部最大值点。

1.2 小波边缘检测方法的具体实现

多尺度局部模的极大值边缘检测就是沿梯度方向, 在阈值的约束下检测出各尺度下小波变换模的极大值点[7,8]。在小尺度时, 图像的边缘细节信息较为丰富, 边缘定位精确度较高, 但易受到噪声的干扰;在大尺度时, 图像的边缘稳定, 抗噪性好, 但定位精确度差, 所以将它们的优点结合起来, 通过在不同尺度上进行综合得到最终边缘图像。具体步骤如下:

(1) 对边缘区进行4阶B样条平滑, 根据式 (5) 和式 (6) 求出M2jf (x, y) 和A2jf (x, y) ;

(2) 采用非极大值抑制法将梯度相角按照邻接位置划分成8个方向即3×3的矩阵模板, 将模图像分别沿各自的相角方向求得模的局部极大值点, 生成可能的边缘图像, 图像中其他像素均标记为零。

(3) 对各尺度的边缘图像设置阈值, 大于阈值的边缘点保留, 小于阈值的边缘点置零。

2 基于双正交小波的数据融合算法

小波变换相当于滤波, 它将一幅图像分解滤波成多个低通、带通成分。小波基的选择就是用设计滤波器组的方法, 设计出满足所有条件, 并符合小波基准则的滤波器组。将该组滤波器作为小波基, 按照小波基的选择标准, 决定选取Daubechies小波系中的db4小波[9]。

首先, 对原始图像分别采用Daubechies小波变换、利用Sobel算子检测横向边缘, 利用Sobel算子检测纵向边缘以及利用LOG算子进行边缘检测, 然后将所得的四幅边缘图像对应点的像素值加权平均, 把四幅图像融合为一幅新的图像, 最后再进行灰度阈值处理[10], 去除不需要的多余信息, 得到最终的边缘图像。该方法示意图如图1所示。

3 仿真结果

对多幅图像进行了计算机仿真处理, 均取得了很好的效果。图2是对Lena图像的实验结果。其中:图2 (b) 为Sobel算子检测的横向边缘检测结果;图2 (c) 为Sobel算子检测的纵向边缘检测结果;图2 (d) 为LOG算子边缘检测结果;图2 (e) 是一级小波变换后提取有用高频信息得到的边缘图像;图2 (f) 是经过二级小波变换后提取其高频信息作为图像边缘信息, 对低频非边缘信息作置换处理, 经小波变换后的边缘图像;图2 (g) 是用上述融合算法得到的边缘图像。

从图2可以看出, 采用Sobel算子检测到的图像包含的信息比较少, 丢失了一些有用的细节信息, 如原图人物头发中的信息就缺失了很多;采用Log算子检测到的边缘信息较Sobel算子完备一些, 但有些信息是多余的, 从视觉上看效果不太令人满意;单独采用4阶小波检测的边缘中, 头发部分的信息比其他两种好一些, 但是比较这几幅图像来看, 小波变换得到的边缘图像连续性不太好。本文提出的方案所得结果是比较好的, 弥补了三种方法的不足, 又保持了它们的优点, 是一种比较有效的方法。可以看到, 采用本文所提方案得到的边缘图像有很好的清晰度和连续性, 边缘信息比较完备, 具有良好的视觉效果。

参考文献

[1]余成波.数字图像处理及Matlab实现[M].重庆:重庆大学出版社, 2003.

[2]董长虹, 余啸海.Matlab小波分析工具箱原理与应用[M].北京:国防工业出版社, 2004.

[3]刘贵喜, 赵曙光, 陈文锦.双正交小波变换多分辨率图像融合方法[J].光电工程, 2004, 31 (4) :50-53.

[4]夏庆观, 陈桂, 盛党红.基于小波变换的多源图像数据融合与边缘检测方法[J].微计算机信息, 2005, 21 (30) :105-106.

[5]Averbuch A Z, Zheludev V A.Lifting Scheme for Biortho-gaonal Multi wavelets Originated from Hermite Splines[J].IEEE Trans.on Signal Processing, 2002, 50 (3) , 487-500.

[6]王涛.模糊多尺度边缘检测算法的研究[J].微计算机信息, 2006, 22 (33) :304-306.

[7]连静, 王珂.样条小波自适应阈值多尺度边缘检测算法[J].系统仿真学报, 2006, 18 (6) :1 473-1 478.

[8]施成湘.扩展的多尺度模糊边缘检测[J].计算机工程与应用, 2006 (7) :65-68.

[9]飞思科技产品研发中心.Matlab 6.5辅助小波分析与应用[M].北京:电子工业出版社, 2003.

数据融合算法 篇6

D-S证据理论在解决不确定性方面提供了一条新途径[1,2],它建立了命题和集合之间的一一对应,把命题的不确定性问题转化为集合的不确定性问题,而证据理论处理的正是集合的不确定性。D-S证据理论中,用信度函数表达概率大小,通过多传感器测试被检测对象,得出每一传感器测得症状属于各类故障的信度函数,然后利用D-S组合规则进行信息融合,最后根据一定的判定准则确定故障类型。传感器有效工作状态的判断其关键是要尽可能早的发现和分离故障传感器,然后进行处理,再基于各传感器的测量信息,通过对信息的优化组合导出更多有效信息,得到更加准确可靠的输出。由于干燥设备本身的复杂性和运行环境的不确定性,使得传感器检测的被测信息具有不确定性,这些不确定性的存在,必然导致故障诊断准确率降低。

在运用D-S证据理论解决故障诊断问题时,要求基本信任分配已知,事实上要确定基本信任分配存在一定的困难,使得该理论在实际应用受到限制。利用RBF神经网络可以任意精度逼近任意连续函数,具有最佳一致逼近特性,而且具有训练周期短,数值精度高,网络结构易于调整等优点,将其运用到证据合成过程中基本信任分配的获取,这样既可利用D-S证据理论来表达和处理不精确的、模糊的信息,又可以充分发挥RBF网络的自学习、自适应和容错能力,这样对不确定信息的融合就有较强的鲁棒性,并可提高诊断系统的准确性。本文提出了一种基于RBF神经网络和证据理论的两级信息融合方法,应用于木材干燥过程中传感器有效工作状态的判断,并进行了仿真研究。

2 RB F神经网络

1985年POWELL提出了多变量插值的径向基函数(Radical Basis Function,RBF)。1998年Broom head和Lowe将RBF应用于人工神经元网络设计,构造了径向基人工神经网络(Radial Basis Function Network,RBFN)[69]。RBFNN的结构与多层前向网络相似,它是一种三层前向网络。输入层由信号源节点组成,第二层为隐含层,单元数视所描述的问题而定。第三层为输出层,它对输入模式的作用做出响应。从输入空间到隐含层空间的变换是非线性的,而从隐含层空间到输出层空间的变换是线性的。隐单元的变换函数是RBF,它是一种局部分布的对中心点径向对称衰减的非负非线性函数。

其基本思想是:用RBF作为隐单元的基构成隐含层空间,将输入矢量直接(即不通过权连接)映射到隐空间。当RBF中心点确定后,这种映射关系就确定了。而隐含层空间到输出空间的映射是线性的,即输出是隐单元输出的线性加权和,此处的权即为网络的可调参数。由此可见,从总体上看,网络由输入到输出的映射是非线性的,而网络的输出对可调参数而言却又是线性的。这样网络的权就可由线性方程直接解出,从而大大加快学习速度并避免了极小问题。本文采用两输入单输出的RBF神经网络如图1所示。

3 D-S证据理论

设现有一判决问题,该问题所能认识到的所有可能结果的集合用Θ表示,那么,任一命题都对应于Θ的一个子集。为了强调Θ所具有的这种认识论的特性,Shafer把Θ称为识别框架(Frame of discernment);当一个命题对应于该识别框架的一个子集时,称为该框架能够识别的命题[3,4]。

定义1:设Θ为识别框架,如果集函数m:2Θ→[0,1](2Θ为Θ的幂集)满足

(1)不可能时间的基本概率为0,即:m(Φ)=0;

(2)Θ中全部元素的基本概率之和为1,即:

则称m为框架Θ上基本概率分配函数(Basic Probability Assignment,BPA):∀A⊆Θ,m(A)称为A的基本可信数,反映了对A本身的信任度。

定义2:设Θ为识别框架,如果函数Bel:2Θ→[0,1]满足:

则称Bel为置信函数,也称为下限函数,表示对A的全部信任。

定义3:对于∀A⊆Θ,如果m(A)>0,则称A为置信度函数Bel的焦元;设置信任函数Bel的焦元为1A,2A,K Ak,则称

为Bel的内核。

定义4:设Θ为识别框架,如果函数Pls:2Θ→[0,1]满足:

则称Pls为似然函数,也称为上限函数或不可驳拆函数;A的不确定性由u(A)=Pls(A)-Bel(A)表示;[Bel(A),Pls(A)]称为置信区间,表示对A的不确定区间。

D-S证据理论的特点是它能够很好地表示未知(unknown)信息的程度。当D-S证据理论把一个置信度赋给一个子集的同时,并不要求把剩下的置信度赋给子集的补,即。D-S证据理论的不确定区间(uncertainty interval)如图2所示。

4 两级数据融合的故障诊断原理

传统的融合方法大多以Bayes推理和D-S证据推理为基础。Bayes融合方法需要先验概率,在大多数情况下,这种先验信息难以获得或不够准确。证据理论具有很强的处理不确定性的信息能力,但是用于信息融合时需要有足够的证据,在有些情况下这些证据也是难以得到。因此本文结合神经网络和证据理论的优点,提出了一种传感器两级信息融合结构,利用神经网络实现多传感器的初级信息融合,并将神经网络的输出作为证据,再利用证据理论进行综合决策。

多传感器信息融合主要是通过多源信息的综合达到改善识别精度,减少证据不确定的过程,为了综合利用系统所拥有的传感器以准确判定待测参数,必须建立适当的体系结构。传统的多传感器信息融合是在数据级、特征级和决策级上进行的。本文从多级融合的角度出发,利用神经网络的初级融合结果作为证据,然后进行综合融合,以得到完全可靠的决策信息,为此本文提出了一种两级融合结构,如图3所示:

图3中的融合结构分为两级,其中第一级融合为特征融合层,其功能为:将传感器采集的工业现场数据的信息通过神经网络处理,得出精确的融合输出结果。第二级融合为决策融合层,其功能为:证据理论信息融合是将不同时刻神经网络的输出作为证据,经过证据理论综合产生决策信息,实现传感器有效工作状态的管理。依据Dempster和Shafer提出的一种不确定推理方法,将多源信息作为证据,通过基本概率分布函数和信任函数对所有命题赋予一个可信度,可信度作为证据的函数。在多传感器信息融合中,每个信息源产生一组证据和命题,因此每个信息源也是一个证据体,多传感器信息融合过程其本质上就是在同一识别框架中,将不同的证据体合并成一个新的证据体的过程,每次合并都可以求出新的信任函数,最后利用某种准则获得最终决策。

5 试验仿真研究

本文以木材干燥系统为对象进行了传感器故障诊断的仿真研究,由于木材含水率是测量监控的重要参量,因此选择2路木材含水率传感器(S1、S2)、1路平衡含水率传感器(S3)、1路温度传感器(S4)作为一组相关向量组[5,6]。

根据证据理论分析,则此相关向量组有4个参数,需要的RBFNN的个数为4C2=6个,也就是输出分别是:m12(A)、m13(A)、m14(A)、m23(A)、m24(A)和m34(A)。理论上有6C2=15种组合方式,但有C42 C 42-2/2=3种组合是不能进行组合运算,分别是:m12和m34、m13和m24、m14和m23。本文对木材干燥系统中传感器故障进行了仿真研究,把S1木材含水率传感器和S4温度传感器设成故障状态,当系统重新稳定后,测得数据通过RBFNN进行识别。识别结果如表1所示。按照所提方法,首先进行两两组合运算,得到各个传感器状态的信任区间[Bel(A),Pl(A)],然后利用D-S理论的组合规则进行融合得到最后结果,从表2看出,传感器S1、S4故障,传感器S2、S3没故障。通过两两组合,信任区间[Bel(A),Pl(A)]上下限的差值较大,说明传感器状态的不确定性较大,这是由于所有两两组合的结果都是部分信息源对3个传感器状态的判断,每个信息源获取的信息各不相同,结果差别较大,无法准确判断传感器的状态。在此基础上,对每个传感器的所有信任分配按照D-S理论组合规则再次进行融合计算,得到新的状态信任分配区间。从数据上可以看出,由于有效利用各个信息源的数据,减少了传感器状态的不确定性,即可准确判断故障传感器是S1、S4。

6 结束语

两级融合结构充分利用了神经网络和证据理论的优点,以神经网络的输出作为证据理论的证据。这种两级融合方法有效地解决了基于D-S推理方法的计算组合爆炸问题。并将此方法应用到木材含水率检测系统中传感器状态有效判断与管理,仿真结果表明该方法具有可行性。

摘要:本文提出了一种基于RBF神经网络和证据理论的两级数据融合方法。利用RBF神经网络实现特征层数据融合,建立基本信任分配函数,具有最佳一致逼近特性,同时解决了D-S证据理论确定基本信任分配函数困难的问题。基于D-S证据理论的传感器故障诊断方法的研究,可有效地判断工业现场传感器的工作状态。实验结果表明该方法可正确定位并准确分离出木材含水率检测系统中失效传感器。

关键词:证据理论,故障诊断,融合算法,RBF神经网络

参考文献

[1]Dempf D,List T.On-line data reconciliation inchemical plants[J].Computer Chemical Engineering,1998,22:1023-1025.

[2]Parikh C R,Pont M J,Jones N B.Application of dempster-shafer theory in condition monitoring systems:a case study[J].Pattern Recognition Letters,2003,22(6-7):777-785.

[3]Shafer G.A.mathematical theory of evidence[M].Princeton,NJ,Princeton University Press,1976.

[4]Dempster A P.Upper and lower probabilities induced by a multivalued mapping[J].The Annals of Statistics,1967,28:25-339.

[5]白雪冰,张佳薇,赵真非.智能化木材含水率自动测试系统的研究[J].木材工业,2006,20(3):35-37.

[6]曹军,张佳薇.智能化木材干燥窑的数据采集系统.自动化仪表,2004,25(1):27-29(A类期刊).

数据融合算法 篇7

信息社会已进入数据洪流时代,大规模数据的涌现对数据的处理带来了挑战。现有信息媒介包括广播电视网络、新闻网站、微博和视频分享网站等多种承载平台,其数据以文本、图像、视频等多种形式传播。一方面,各种信息不仅局限于单一平台中,还通过互动方式迅速跨平台传播;另一方面,用户不再简单地用文字直接表达观点,而会用多种形式的媒体来表达看法。这种新的媒体形式被称为“异构媒体”,异构媒体的一致性表示是进行关联与聚合的基础。现有媒体描述和表达仅仅针对特定的任务,对于不同媒体数据往往独立表示,缺乏对不同平台下的多媒体数据的一致性表示,如图1所示。

面向媒体融合的海量异构数据一致性表示成为了一个重要的研究课题。高效的异构媒体描述是有效分析的前提,它不仅需要刻画媒体的自然属性,还应能够有效描述社会属性。媒体数据的自然属性主要刻画的是媒体本身的内容信息。为了描述各种媒体数据的自然属性,对于音频数据、视觉数据和自然语言数据,都分别有不同的表示方法。

(1)音频数据

首先需要将属于不同说话者的声音片断分割出来,Delacour等将一些二阶统计量作为特征,对连续语音信号中的不同语义声音进行分割[1]。该方法不需要知道说话者的数目和其他一些先验信息,但是要求说话人不能同时讲话。Kim等比较了声谱投影(audio spectrum projection,ASP)和MFCC这两种特征在说话人分割问题中的有效性[2]。

(2)视觉数据

传统的媒体表达方式往往采用自然语言表示中的“词袋”模型[3]及其变种,如所提出的“视觉单词”[4]以及“视觉文法”[5]等。但“词袋”表示方法忽略了空间、结构信息。为此,研究人员提出了区域划分的表示策略,如空间金字塔划分[6]和形状上下文描述子[7]等。基于中层语义表示的方法也被广泛应用,如概率隐语义分析方法[8]、隐狄利克雷分配模型[9]和语义样例检索[10]等。另外,研究人员也进行了直接利用高层语义表达[11,12]的研究,取得了良好的表示效果。但是,现有方法往往无法处理虽然视觉相似,但语义完全不同的问题。

(3)自然语言数据

自然语言处理中,文档常先被分割为词项、短语等元素。而在文档集中频繁出现的有意义的词项、短语,可以看作是具有一定的标识性。一种行之有效的方法是:首先在每个文档中提取短语,然后去除很多无意义的短语,比如过短、过长或者过于频繁的短语,并将短语视为图节点;再根据短语间的编辑距离,得到短语间的相似度,从而得到短语图;在得到短语图后,对短语图进行分割。

媒体数据的社会属性主要指的是媒体数据本身在社会事件中起的作用,侧重于对其社会影响的描述。网络事件的语义不仅体现在媒体数据本身的自然属性方面,也体现在其社会属性方面。现有的社会属性获取方法主要可以分为两种:基于语义标注的方法[13,16]和基于信息挖掘[17,19]的方法。基于语义标注的方法往往利用有标注的训练样本,通过视觉、文本相似性来传递标注词,从而达到对于未知图像、视频和文本的社会属性获取。基于挖掘的社会属性获取方法也引起了研究人员的广泛兴趣,并提出了一系列行之有效的方法,如概念发现[17]等。另外,网络信息挖掘还可以获取用户行为等社会属性,如基于习惯挖掘的相似移动用户选择[20]等。对于媒体数据社会属性的提取和挖掘尚处在起步阶段,还存在大量的问题亟待解决。

上述方法大多是针对特定媒体数据、特定语义理解任务的,而异构媒体一致性表示的方法流程如图2所示。将异构媒体进行特征抽取与表示,并在此基础上进行结构化数据组织,以实现一致性表示,为后续的关联与聚合提供基础。

2一致子空间学习

在抽取完异构媒体各自的特征表示后,需要进行一致性子空间投影,以实现异构数据之间的相似性度量。原始表示的维度往往较高,而一致子空间的维度较低,因而,一致子空间的学习可以认为是降维的过程。降维技术可以分为特征选择、特征变换、距离度量学习和基于排序的子空间学习。特征选择是从原始的特征集合里直接选取某些特征作为新的低维表示。依据是否利用类别信息,可以分为监督的特征选择[21]和无监督的特征选择[22]。

特征变换是指利用某个线性的或者非线性的变换函数去产生原始数据的简洁表示。根据变换函数的性质,可以分为线性和非线性两种。特征变换也可以利用排序的方式进行。这种方法基于两点假设:查询数据和相关联的数据通常分布在一个低维的流形上;查询数据和相关联的数据间存在一定的顺序关系。在排序过程中,不仅要识别出是否属于同一个层次,还要保持层次之间的顺序关系。给定训练集,通过优化下述目标函数实现:

目标函数的第一项是寻找d个正交方向,使得d个保持数据几何结构信息的方向尽量相同。

距离度量学习是利用某些给定的辅助信息,从输入空间学习一个距离度量来测量数据点之间的距离。一个有代表性的距离度量学习方法是LMNN[23],其目标是对于输入空间中的每个样本,其k个具有相同类标的近邻应尽可能地接近,而属于不同类别的样本应保持一定距离。

基于排序的子空间学习方法主要是针对高维数据进行排序。排序学习框架如图3所示。

大部分的距离度量学习技术都是为了分类或聚类任务设计的,无法直接应用与排序任务。在实际的排序问题中,也需要依赖距离度量来比较并确定排序关系。如果能够学习一个合适的距离度量,就容易构造一个好的分类器。基于这种假设,相应的线性学习模型可以表示为:

其中,第四项是松弛变量,w(i,j)是加权因子,其定义为:

算法通过梯度下降的方式进行求解。

类似地,基于多核度量学习的非线性学习模型可以表示为:

在移除松弛变量后,上述目标函数可以重新表示为:

可以通过交替的梯度下降进行求解。

3多模态结构化一致索引

在获取异构媒体的一致性表示后,还需要对其进行索引表示。不同模态信息之间存在结构化的关联关系,利用结构化信息进行一致性索引更有利于多模态数据的关联和聚合。现有的方法大致可以分为特征高阶特性的分析和基于二值化的结构索引两部分。

3.1高阶特性分析

传统的多媒体分析方法往往采用词袋模型,忽视了不同特征之间的关联关系。而空间上下文关系等高阶特性对于一致性表示的改进被忽略了。由于对于二维图像数据来说,这种空间上下文关系的利用更能改进表示的效果,因此,现有的方法主要针对视觉数据进行。随机抽样调查,即RANSAC是一个比较经典的算法,它假设查询图像与数据库图像之间存在一种仿射变换模型,这种变换可以通过匹配的局部特征对估计出来。将视觉特征的空间上下文关系,即高阶特性,嵌入到倒排表结构中,用以获得更好的初始特征匹配,提高检索精度。

近些年,研究人员投入了很多精力,关注如何生成可以保持高维视觉特征相似度的紧凑二值特征码。将高维的特征编码成二值比特流,具有很好的存储便利性和特征相似度计算的便利性。下面着重介绍将局部视觉特征的高阶特性进行高效利用。

对每个视觉特征来说,根据其周围特征和该特征的空间关系,这些周围特征被分为几个组,如图4所示,绿色的点代表局部特征,红色圆中的特征点表示绿色特征的有意义的空间上下文范围。为了描述每个特征组中的视觉内容,首先对每个组生成一个统一的描述子,其次将左右组的描述子连接形成描述该特征的上下文关系的描述子,最后将生成的上下文关系描述子二值化以方便应用和存储。除了特征的上下文描述子之外,还揭示了局部视觉特征的多模态特性。图5中展示了几个多模态特性的例子,该图中采用海森仿射检测子,每个黄色的椭圆代表一个检测到的特征区域,其中被红色矩形框标出的是两个具有多模态特性的示例。

这里以图6中特征A为例说明空间上下文表示方法,记A的空间位置的主方向为OA,并以此为基础建立一个以IA为原点,以OA为x轴的坐标系。这样可以将图像平面划分为4个子区域,在图6中给出了每个子区域的标号。由于以特征点的主方向为基准,这样的划分方式具有平移、旋转的不变性。实验的结果显示,图像平面被划分为3个子区域的时候能得到较好的结果,每个子区域为120度角,这样对特征点主方向的误差有较好的鲁棒性。考虑到存储和相似度计算的复杂度问题,将环境特征描述子编码成二值字符串。令A的环境特征记为,其中NA表示A的环境特征的数目,然后把每个子区域中的环境特征以加权求和的方法融合成一个向量表示:

其中,fi表示特征fi落在第k个子区域,di表示特征fi的描述子,wi表示fi的权重。

其中si和Ii表示特征fi的空间位置,t决定了特征环境描述子的范围。基本上是对距离特征A较远的环境特征分配较小的权值,较近的环境特征分配较大的权值。然后将所有子区域的描述子连接形成一个长向量。

3.2二值化结构索引

特征的匹配可以被当作查找特征的最近邻或者近似最近邻,当特征量变得非常巨大的时候,这种最近邻的匹配方法就变得太费时而不能使用,从文本检索中引入的倒排表的数据索引结构可以解决这个问题。

在倒排表结构中,每个特征被分配一个整数ID,如图7(a)和7(b)中所示。每个整数ID对应倒排表中的一个表项,表项中记录着含有这个整数ID对应的特征的所有图像ID和特征的一些其他信息,如空间位置、尺度、主方向等。特征采用在视觉码本中的最近邻或者近似最近邻的方法量化到视觉单词。

对于基于编码单词和基于视觉单词的索引结构,特征空间被编码单词和视觉单词划分成很多字空间。在高维空间中,给定了一个查询特征,它的正确匹配特征有可能落在量化后不同的特征字空间内,两个匹配的特征之间的二值化字符串之间的编码单词(前32比特)之间的汉明距离是3比特。为了获得更好的查询查全率(recall),检索时通常要检查多个编码单词字空间或者视觉单词字空间,分别称之为编码单词查询扩展和视觉单词查询扩展。

对于视觉单词查询扩展,在特征空间中进行均匀的查询扩展效率并不高,因为有些查询特征与它的正确匹配特征之间并不是均匀分布,有些特征的正确匹配特征落在较多的视觉单词字空间中,有些落在较少的视觉单词字空间中,如图8所示。

基于上述对编码单词和视觉单词查询扩展的分析,可以采用交叉索引进行处理。考虑到查询过程中的复杂度,仅进行一比特的编码单词查询扩展,用以找到一些正确的匹配,和这些正确匹配量化到的视觉单词ID,这样可以自动发现需要进行查询扩展的视觉单词。交叉索引过程如图9所示。首先,如图9(a)所示,绿颜色十字表示的查询特征对应的编码单词被用作编码单词查询扩展,查询扩展到的编码单词以紫颜色的虚线三角形表示,在这个过程中有两个正确的匹配特征被找到,在图9(a)中以绿颜色的矩形表示。然后,查询上一步骤中找到的正确匹配特征对应的视觉单词字空间,如图9(b)所示,紫颜色的虚线表示的不规则多边形,这个过程中新发现的正确匹配特征,也以棕颜色的矩形表示。最后,对第二步中找到的正确匹配的特征对应的编码单词,进行小范围查询扩展,如图9(c)所示。

在视觉单词袋模型中,每幅图像被表达成含有TF-IDF加权的视觉单词直方图。图像之间的相似度以图像视觉单词直方图向量之间的L1或者L2距离来计算。在含有二值码字符串的图像检索系统中,特征的二值码被用作特征匹配的校验,并且正确匹配的特征数目被用来衡量两幅图像之间的相似度,算法可以用以下公式:

其中,i表示第i幅数据库图像。B(d)和B(q)表示数据库中的特征d和查询特征q的二值码。T是一个预先设定的阈值,它的影响将在实验部分给出。H(B(q),B(d))表示两个二值特征码之间的汉明距离,如果两幅图像和查询图像之间有相同的匹配特征数,就将含有特征数较少的数据库图像排在前面。这种交叉索引结构可以提高查询特征的查全率。图10给出了码本大小为一百万时,交叉索引算法在UKBench数据集[25]上的性能。

4总结与展望

在市场需求和全球大潮流的驱动下,媒体融合已经是大势所趋。而现在多种媒体共存,造成信息的多渠道和分众化传播。网络媒体虽然有在线传播的优势,但是新闻传播角度的先天缺陷和技术的不够成熟使其在短时间内还很难一统当今的媒体。现有的几种传统媒体中,广播电视媒体的前期投入最大,针对广电数据进行媒体融合就尤为迫切。不同平台的数据在表示形式、结构和语义内容上存在很大差别,它们具有非结构化、异质等特性,给数据内容分析和挖掘造成巨大挑战。因此,首先需要对这些异构媒体数据进行结构化抽取和一致性表示,为后续的关联与聚合分析提供数据基础。

摘要:随着信息技术的发展,急需处理海量异构数据的方法。面对媒体融合的需求,海量异构数据的一致性表示成为一个关键问题。本文首先对媒体融合、海量异构数据一致性表示的必要性进行了讨论,随后对海量异构数据一致性表示的主要步骤进行了介绍,并详细介绍和分析了一致子空间学习和多模态结构化一致索引这两个主要步骤,最后对面向媒体融合的海量异构数据一致性表示进行了总结与展望。

数据融合算法 篇8

同时,传感器由于制造工艺以及一些不确定因素都会造成获得的数据与真实值之间差异较大。针对这种情况,目前同一探头经过分时复用的数据测量并融合是传感器发展的一个方向,其主要工作原理是用一个传感器对同一对象进行分时多次测量,并将这些信息数据通过一定方法进行融合处理[1,2,3],得到一个误差更小、精度更高和准确的测量值,能比较完整、精确地反映被测对象的信息特征。

对于数据融合的算法[4]。在激光雷达、红外、声呐、图像获取等领域都得到充分的实际应用[5]。其中超声波T_R分离传感器数据融合方法主要数字平均[6]、模糊判断、贝叶斯估计和D-S推理[7,8]、数字滤波[10]等。这些计算方法各有各的优缺点。因此,对于智能设备,传感器获得的数据对其智能判断起到至关重要,本文针对数据融合的优缺点,改进发送和接收原理,同时改进了数据融合算法,取得非常满意的结果。

1 T-R分离实现原理

如图1所示,(a)图是传统发送与接收一体模式,当T探头发送一串超声波信号,经被测距离的物体反射,接收R会接收到相应的超声波信号,从而根据速度和时间可以计算出距离,一般不会超过10 m左右。改进测距原理如图1(b)所示,当T探头发送超声波信号的同时发送一个无线信号,探头R模块收到无线信号便开始计时,当T的超声波信号达到R时,CPU关闭计时器,从而根据超声波速度和时间便可以算出距离,经过多次分时测距,再根据数据融合算法,可以计算出精确的距离,同时距离是传统方式1倍,既20 m左右。

2 多超声波传感器数据融合原理

由于环境等其它综合因素的影响,超声波传感器测量值与真实值之间有误差,一般文献证明其基本服从正态分布。设超声波探头有n个传感器,第i个超声传感器的真实值A进行k次测量,测量值为xi1,xi2,…,xik,假定均值为xi和标准差为σi。设目标估计值为x0,标准差为σ0。

令:

由于探头发送接收过程受很多环境因素的影响,需要监测无效数据,留下有用数据。这里采用Grubbs判断法。

设Gi=(xim-x0)/σ0,其中xim为第i组数据中最大或者最小值,x0为均值。下面要把计算值Gi与格拉布斯表给出的Cp(n)比较,如果计算的Gi值大于表中的临界值Cp(na),那么判断该测量数据是异常值,可以剔除。临界值Gp(n)与两个参数有关:检出水平α(与置信概率p有关)和测量次数n。α一般取值为0.01或者0.05。

令:Ai,A0表示第i个探头获得的测量值与估计值数据的正态模糊集。即:

其指数加权为:

式(4)中c(k)=(1-b)/(1-bk+1),b为遗忘因子,一般取0.95—0.99,这与外部干扰因素相关,影响大时可以选择大一些。

由内积定义可知,与内积是两个模糊集的最大值,即:

解出t有两个解:t'和t',即:

由于t'不在范围xi~x0区间,所以舍去。

故,内积:

把公式(6)t'的值代入式(7)得:

由外积的定义可知,模糊集的外积是两个模糊集并积的最小值,所以:。

贴近度定义为:

把公式(7)代入公式(9)得:

n个传感器归一化,得各自权重:

3 实现算法流程

单片机系统初始化各参数的初始值,如图2所示。计算步骤如下:

1)T发送超声波信号,同时发送无线信号;R接收无线信号开始计时,收到超声波信号停止,分时测距6次,并记录相应数据。

2) Grubbs异常数据判断,剔除数据中异常数据值。

3)分别算出每组的均值和标准差xi,σi。

4)计算出测量数据均值和标准差x0,σ0。

5)求出6次超声波探头数据的接近度S(Ai,A0)。

6)求出每组数据权重ωi。

7)根据,融合出系统距离的确切数值。

4 结果分析

实验用6个超声波探头进行四次测量,测量值、均值、标准差、接近度、相对权重如表1所示。

经过数据融合,得出超声波探头与障碍物之间的确切距离的融合值为:,与实际距离误差为:0.005 m。

由表1可知,传感器编号为1至6,对于每次传感器获得的数据,第2个传感器的数据的稳定性和可靠性最高,其次是第5、第6个传感器的数据,传感器编号为4组接近度最差。由此可以看出,相对权重能表征数据接近真实值的程度。从而证明本文提出的接近度算法相对模糊神经和D-S推理在精度和距离上都很高,而且运算过程简单,快捷,适合资源非常有限的8位或者16位以及最新的32单片机的系统使用。

5 结论

本文根据每次数据的权重计算该组的最终数据,用Grubbs算法找出其中不合理干扰数据,并且通过T-R分离方式获取数据,相比常用的一体式探头,测量的距离大大提高,可以达到20 m左右,该算法设计在超声波测距、定位领域得到实际验证,能满足实际要求。

摘要:针对T-R分离的传感器中对距离多次测量的数据融合问题,提出用接近度作为多传感器数据融合的权重的新方法。该方法采用无线数据传送结合超声波传感器测得数据,并算出均值和方差,用Grubbs方法剔除异常数据,且计算出每个探头数据对应的接近度权重,并计算最终到数据融合的表达式。实验表明方法比单一传感器有更高的精度,适合8位以及32位单片机等嵌入式系统中应用。

关键词:超声波传感器,数据融合,T-R分离,权重

参考文献

[1]满莎,杨恢先,彭友,等.基于ARM9的嵌入式无线智能家居网关设计.计算机应用,2010;30(9):2541-2545

[2]刘春荣.弹道导弹制导技术浅谈.海军航空工程学院学报, 2002;17(4):431-435

[3] Hall D L.Mathematical techniques in multisensor data fusion.Artech House,Boston,1992

[4] Hashemipour H R R.Decentralized structures for parallel Kalman filtering. IEEE Transactions on AC,1998;33(1 ):88-93

[5] Carlson N A.Federated square root filter for decentralized parallel processes.1990 IEEE T-AES,1990;26(3 ):517-525

[6]李瑞峰,李伟招.基于多传感器信息融合的移动机器人路径规划.机电一体化,2002;(4):20-23

[7]李贻斌.移动机器人多超声波传感器信息融合方法.系统工程与信息,1999;(21):55-57

[8]夏阳,陆余良.D-S证据推理及算法实现.安徽大学学报(自然科学版),2004;28(6):20-26

[9] Baase S,Gelder A V.Computing algorithms.Beijing:Higher Education Press,2001:235-267

[10]叶涛,谭民,陈细军.移动机器人技术研究现状与未来.机器人,2002;24(5):475-480

[11]危遂薏,刘桂雄.一种同质的多传感数据融合新算法.传感器技术,2004;(8):61-62

数据融合算法 篇9

随着国际国内形势的剧烈变化, 武警部队所担负的维护国家安全和社会稳定、保障人民安居乐业的职责使命也面临着越来越严峻的考验。随着无线通信技术的全面发展, 在我军信息化建设的背景下, 无线传感器网络在武警部队中的应用也越来越广泛[1]。但在无线传感器网络中, 由于节点采用电池供电, 在通常情况下, 节点部署后电池无法更换, 且无线传感器网络在武警部队多用于现场态势感知和人员定位, 以及火灾等突发事件的检测, 在这类应用中, 观测者主要关注的是传感器采集到的数据的变化情况, 而传感器节点不断地采集一些环境指标[2], 例如:温度、湿度、位置信息等, 并将它们采集到的数据传输给汇聚节点。很明显, 所有传感器节点连续采集到的数据, 具有很大的冗余, 造成了不必要的能量消耗, 很大程度上缩短了网络的生命周期。因此, 研究基于事件驱动的无线传感器数据融合算法, 对无线传感器网络在武警部队的应用, 具有十分重要的意义。

1 网络模型

根据对以上典型分簇数据融合算法的分析比较, 结合武警部队应用实际, 给出了一种基于事件驱动和能量消耗的数据融合算法。

网络模型定义:假设有N个传感器节点随机分布在事件发生区域A内, 并且各传感器节点具有以下特征:①所有传感器节点在部署后不能轻易移动[3];②有且只有一个基站, 且部署在事件发生区域A以外的某个固定位置;③假设基站的剩余能量为无穷大, 且能够采用一跳模式向所有传感器节点发送信息;④所有传感器节点具有相同的能量、处理和通信能力;⑤所有传感器节点的能量都不能得到任何形式的补充;⑥传感器节点能够从基站获取自己的位置信息。

2 算法描述

为了达到节省能量的目的, 所有传感器节点在被随机布置到检测区域后, 均处于抑制状态。当检测区域内有事件发生时, 节点由于受到刺激, 从抑制状态转为兴奋状态, 进行信息的感知和传送, 否则, 节点只负责定期与基站进行通信, 告知基站本节点的工作状态是否良好。当区域内事件停止时, 节点解除刺激, 从兴奋状态重新转回抑制状态, 以节省能量[6]。

本算法与TEEN协议一样, 定义了硬阈值和软阈值, 用来决定是否发送数据检测数据, 对硬阈值、软阈值和其他相关阈值的定义如表1所示。

阈值名称含义及用途:

基本硬阈值 (BHT) :该值不随监测数据变化, 是一个由基站设定的稳定值。用以衡量事件发生的严重程度。

软阈值 (ST) :节点发送监测数据的最小变化量。衡量监测数据的变化量。

标准硬阈值 (NHT) :NHT的初始值等于 (BHT-ST) 。在网络的初始阶段, 所有节点都处于抑制状态, 仅当抑制状态节点的监测数据满足Mdata>BHT&&|Mdata-NHT|≥ST时, 该节点才进入兴奋状态, 并将Mdata值设置为新的NHT值。对于已经处于活动状态的节点和簇头而言, 当满足Mdata>BHT&&|MdataNHT|≥ST时, 更新NHT值为Mdata, 并且簇内节点将监测到的数据传送给该簇的簇头节点。处于抑制状态的节点使用它们的NHT值来竞争成为簇头;簇内节点向簇头节点传送监测数据时使用NHT来避免重复发送信息[7]。

相对兴奋时间阈值 (RETT) :RETT的大小与事件发生的严重程度成正比, 即RETT=α|Mdata-BNT|, 其中α为兴奋时间系数。RETT用于确定簇的生存时间。

绝对兴奋时间阈值 (AETT) :将当前时间记为t, 则AETT=t+RETT, 当前时间t>AETT后, 表明簇的生存时间结束, 节点重新变成抑制状态。AETT用于簇内节点判断簇的生存时间。

对本算法的具体描述如下:

(1) 初始化网络节点。监测区域内的所有节点, 在网络配置初期, 都处于抑制状态。节点从基站获得自身的位置信息, 并通过和邻居节点的信息交换, 获得邻居节点的位置信息以及到基站的距离。

(2) 簇头的选取。由于簇头节点不仅要接收来自簇成员节点的信息, 还要对信息进行简单的数据融合, 因此, 从网络的生命周期考虑, 应选取剩余能量较多且距离事件发生中心较近的节点作为簇头[8]。

某处于抑制状态节点i的监测数据满足Mdata>BHT&&|Mdata-NHT|≥ST时, 该节点将从原有的抑制状态进入激活状态, 此时, 节点内部的计时器开始计时, 计时时间Ti与受到的刺激强度即|Mdatai-NHT|和节点剩余能量的乘积成反比, 即节点受到的刺激强度越大、剩余能量越多, 则越有可能成为簇头节点, 如公式 (1) 所示:

其中, α表示刺激能量系数, α的值可根据无线传感器网络应用的场合具体设定。

(3) 广播成簇信息。当节点i满足条件, 成为簇头后, 计算成簇信息的广播跳数K, 其中为某固定的常数, 称为传播系数, K用来确定成簇消息广播范围的大小。同时计算相对兴奋时间和绝对兴奋时间的值, 并将NHT值更新为新的Mdata值。簇头广播成簇消息, 广播包包括成为簇头的标志CH、簇头ID、传输跳数K、新的NHT、AETT值和剩余能量等字段。

(4) 选择簇成员节点。当处于抑制状态的节点接收到成簇信息后, 先计算K-1, 若K-1>0, 表明该节点仍在传播跳数以内, 则节点修改K=K-1, 并转发该消息;否则丢弃[9]。如果簇头ID和AETT值与上次接收到的相同, 表明重复接收了该消息, 此时也丢弃该簇头信息。若节点同时接收到不同的成簇信息, 则根据K值和剩余能量值综合考虑加入哪个簇。

(5) 防止形成冗余。为了避免一个节点多次加入簇, 保证在事件发生区域A内, 簇能均匀分布, 算法规定已经成为簇头的节点受到新的刺激后, 不能再次进入兴奋状态, 并且簇成员节点也不能因为受到新的刺激而成为其他簇的簇头[10]。

(6) 簇的解散。当t>AETT时, 表明簇头的兴奋时间已过, 簇头首先进入抑制状态, 释放该簇, 同时, 簇成员节点也进入抑制状态, 当新的刺激产生时, 将按照以上步骤, 重新选取簇头。

3 仿真实验及结果分析

为了分析和比较算法的有效性, 本文在NS-2平台上对本算法和TEEN算法在节点能耗和节点存活率方面进行了比较。实验参数的设置如表2所示。

通过在NS-2平台上对节点能耗和节点存活数量这两个参数的比较, 本文提出的基于事件驱动的算法比TEEN算法具有较低的节点能耗和较高的节点存活率。

4 结语

监测突发事件是无线传感器网络在武警部队的一个重要应用, 本文从均衡能量和减少能耗的方面考虑, 提出了一种基于事件驱动的无线传感器网络数据融合算法。实验表明, 相比于TEEN协议, 能够在一定程度上延长网络的生命周期。在以后的工作中, 将对数据融合等待时间以及数据融合路径做进一步的研究。

参考文献

[1]HEINZELMAN W R, CHANDRAKASAN A, BALAKRISHNAN H.Energy-efficient Communication Protocol for Wireless MicrosensorNetwork[C].Proc.of the 33rd Intl Conf on System Science, 2000:1-10.

[2]KRISHNAMACHARI B, ESTRIND, WICHERS.ModelingDataCentricRouting in Wireless Sensor Networks[C].Proc.of IEEE Infocom, 2002.

[3]HAOWEN CHAN, ADRIAN PERRING, BARTOSZ PRZYDATEK, et al.SIA:Secure Information Aggregation inSensor Networks[C].Proc of the first ACM Conference on Embedded Networked System.New York:ACM Press, 2003:255-265.

[4]王结太, 许家栋, 于海勋.分组敏感的无线传感器网络实时数据融合树算法[J].传感技术学报, 2008, 21 (10) :1760-1764.

[5]段斌, 柯欣, 皇甫伟, 等.无线传感器网络中基于融合贡献的传输延时分配算法[J].计算机研究与发展, 2008, 45 (1) :34-40.

[6]NISHEETH SHRIVASTAVA, CHIRANJEEB BURAGOHAIN.Divyakant Agra-wal.Medians and Beyond:New Aggregation Techniques forSensor Networks[C].Proc of the second ACM Conf on Em-bedded Networked Sensor Systems, Balt-i more, 2004:239-249.

[7]秦拯, 李娜, 张大方, 等.Chi-square Distance在协议异常检测中的应用[J].湖南大学学报:自然科学版, 2005, 32 (4) :99-103.

[8]邵颖佳, 张大方, 黄昆.无线自组织网络中动态源路由协议的移动性分析[J].计算机应用研究, 2007, 24 (9) :212-213.

[9]李敏, 罗挺, 周俊.WSN中基于虚拟锚节点的AD定位算法研究[J].后勤工程学院学报, 2010 (6) :45-49.

上一篇:趣味拼音教学下一篇:大直径超长桩