自编码算法

2024-07-01

自编码算法(共7篇)

自编码算法 篇1

1 引言

随着计算机技术和网络技术的迅猛发展, 数字化、多媒体等新产品已经走进人们的生活, 并且在各个领域中不断创新发展。在人们生活水平不断提高的同时, 人们对健康、保健等知识的获取也随之丰富。新的科学技术和研究理论在医疗领域发挥的作用逐步加深。脑电信号是一种可以帮助医生诊断患者脑部疾病的重要手段。由于人脑自身可以产生微弱的生物电, 利用先进医疗仪器可以将其放大显示, 进而可以显示头皮电位的高低频率, 这种高低电位信号相互连接就产生了人脑的波形曲线图。随着脑电信号研究的不断深入, 人们已经在脑部疾病的辅助诊断、揭示脑电功能、工程应用方面以及其他领域中取得大量学术价值和研究成果。然而, 一方面对于具备医学研究价值的脑电信号是有必要深入研究的, 由此产生的数据量是巨大的, 伴随医疗器械需要存储和传输的数据量也是惊人的;另一方面, 如何利用现有的设备高效的进行数据存储和解析, 是摆在研究人员面前的又一个难题。

2 数据压缩算法

2.1 数据压缩

数据压缩是指在不丢失信息的前提下, 缩减数据量以减少存储空间, 提高其传输、存储和处理效率的一种技术方法。按照一定的算法对数据进行重新组织, 减少数据的冗余和存储空间。数据压缩包括有损压缩和无损压缩。一些机制是可逆的, 这样就可以恢复原始数据, 这种机制称为无损数据压缩;另外一些机制为了实现更高的压缩率允许一定程度的数据损失, 这种机制称为有损数据压缩。

有损压缩 (Lossy Compression) , 又被称为破坏型压缩, 这种压缩方法对压缩后的数据进行重新编码, 将次要的信息压缩掉保留主要的信息, 重新编码后的数据与原始的数据之间存在不同, 却不影响人们对原始数据的理解, 这种通过牺牲数据质量来减少数据量的方式换来了较高的压缩比。然而, 这种压缩方式会产生渐进的质量下降, 造成无法完全恢复原始数据, 所以常用于语音、图像和视频压缩。

无损数据压缩 (Lossless Compression) , 这种压缩方法无需对压缩后的数据进行重新编码, 恢复后的数据与原始的数据完全相同, 压缩后的数据不受任何损失, 解压后数据质量没有损失。然而, 这种压缩方式处理后的数据会压缩到原来的1/2~1/4, 压缩比率明显低于有损压缩, 占用空间大, 所以常用于高品质数据的处理。

2.2 Huffman编码

Huffman编码, 又称最佳编码, 作为一种高效实用的无损数据压缩算法, 是由D.A.Huffman首先提出的一种通过构造最小冗余代码为核心的理论。正是依靠这一理论内容, 算法通过统计数据出现频率, 将原始数据中出现频率较多的数据用最短的代码来代替, 而出现频率较少的数据用较长的代码代替, 每个数据的代码各不相同, 有些代码都是二进制码, 且码的长度是可变的。

Huffman编码主要利用贪心算法通过构造二叉树来求得编码, 且二叉树的构造从叶子节点往根节点进行的。由于Huffman编码方法简单, 因此应用比较广泛。现在使用中的Huffman编码大致分为两种:静态Huffman编码和自适应Huffman编码。静态编码压缩率高, 缺点是压缩时间长。动态Huffman编码压缩时间短, 压缩率相对于静态Huffman编码较低。

2.3 自适应Huffman编码

自适应Huffman编码的核心内容与静态Huffman编码类似, 也需要构造一棵二叉树, 所有可能的输入符在二叉树存在一个叶子节点与其对应, 叶节点的位置就是该输入符的Huffman编码。自适应Huffman编码解决了静态Huffman编码树面临的难题。自适应Huffman编码不需要事先扫描输入符号流, 而是伴随编码的进行逐步构造一棵二叉树。随着编码的进行, 自适应Huffman编码对输入符的统计也是动态进行, 输入符中同一个符号的编码可能有所不同, 变得更长或更短。因此在实际领域下, Huffman编码在高质量的图像和视频流传输中获得了广泛的应用。

自适应Huffman编码算法的基本步骤如下:

(1) 判断字符在输入符中是否出现。对输入字符进行自适应Huffman编码前需要对输入符扫描一次, 需要判断输入符在前面的字符流是否出现过。

(2) 判断该字符在该节点编码内是否最大。为了保证其兄弟属性不受影响, 在进行增加权重值时, 需要额外判断该结点编码是否在所属块是最大结点, 如果不是就需要交换当前结点与最大结点。

(3) 根据NYT结点对当前字符进行编码。从输入流中得到一个字符, 若以前出现过该字符, 则对该字符进行编码, 并判断该字符是否是所属块的最大结点, 否就交换当前结点与最大结点;若以前没有出现该字符, 则生成两个结点, 一个结点用于保存该字符, 另一个用做NYT结点, 并设置这两个结点的父结点为原NYT结点, 输出NYT结点码及原字符。

3 基于自适应Huffman编码的脑电信号压缩

3.1 实验数据描述

目前科学所知的脑电波频率主要包含在30Hz以下, 本文提取人类常见的两种脑电波形, 对两种图形数据的描述如下。

实验数据1:alpha波, 正常成人脑电图多以8-13Hz为其主调节律, 就是通常所指的潜意识状态。人的脑波处于alpha状态时, 人的意识活动明显受抑制, 无法进行逻辑思维, 处于无意识状态。

实验数据2:beta波, 13-30Hz通常所指大脑处于高度清醒状态, 人脑在精神活动、情绪兴奋和睁眼时beta波增多。

3.2 实验过程与结果

对脑电信号的图形数据进行信息提取, alpha波和beta波是人体中相对规律性较强的波形, 作为实验数据每组数据提取50K图谱信息, 提取后实际是一组十六进制的编码, 通过C语言程序实现自适应Huffman编码算法, 并将实验数据录入到程序中, 产生的结果是两组符合最优二叉树定义的编码, 即Huffman编码。

4 性能评估

4.1 脑电信号恢复

由于自适应霍夫曼编码是一种无损压缩类型, 如图4-1所示, 从两组实验数据压缩/解压后的效果可以看出通过解压缩方式解压后的数据与原始数据图形一致。

4.2 压缩效果

实际应用结果表明, 自适应Huffman压缩编码算法对人体脑电信号波形图的压缩比例较高, 压缩与解压缩的时间较短, 压缩保存的图谱信息完整, 有效的节省了网络带宽和存储空间。

5 总结

本文利用自适应Huffman压缩算法对脑电信号进行压缩, 实验效果良好。自适应Huffman压缩编码算法尽管在压缩比上不能和有损压缩相比, 但它改进了静态Huffman编码算法, 更大程度的压缩了图像网络传输冗余信息, 从而减少了网络传输的信息量, 进一步提高了通信质量和网络传输数据的效率。自适应Huffman编码方法只需要对输入的数据流进行一遍扫描统计, 流程速度很快, 能够满足大数据量实时系统的应用需要。

参考文献

[1]李晓飞.Huffman编解码及其快速算法研究[J].信号处理, 2009, 21:102-104.

[2]雒莎, 葛海波.基于查找表的自适应Huffman编码算法[J].西安邮电学院学报, 2011, 9, 16 (5) :76-79.

[3]李玉坤.脑电无线信号采集系统数据压缩算法的研究[D].山东师范大学, 2013, 4:23-31.

[4]文国知.基于C语言的自适应Huffman编码算法分析及实现研究[J].武汉工业学院学报, 2011, 06, 30 (2) .

[5]何昭青.运用Huffman编码进行数据压缩的新算法[J].科学技术与工程, 2008, 8 (16) :4531-4535.

自编码算法 篇2

长期以来, 视频图像压缩编码主要利用离散余弦变换DCT[Discrete Cosine Transform, DCT]技术完成图像的变换编码, 然而DCT图像变换编码不可避免的存在两个问题:方块效应和蚊式噪声。小波变换对整幅视频图像变换, 很好克服了传统的余弦编码产生的方块效应和蚊式噪声。在基于小波变换的压缩方案中, EZW (嵌入式小波零树) 算法是近年来最有效的编码方法, 它很好地利用小波系数的特性使得输出的码流具有嵌入特性。

2 EZW算法及其符号的二元化

2.1 EZW (嵌入式小波零树) 算法

嵌入式编码 (embedded coding) 就是编码器将待编码的比特流按重要性的不同进行排序, 根据目标码率或失真度大小要求随时结束编码;同样, 对于给定码流解码器也能够随时结束解码, 并可以得到相应码流截断处的目标码率的恢复图像。嵌入式编码中首先传输的是最重要的信息, 也就是幅值最大的变换系数的位信息。图1显示了一个幅度值由大到小排序后的变换系数的二进制列表。表中每一列代表一个变换系数的二进制表示, 每一行代表一层位平面, 最上层为符号位, 越高层的位平面的信息权重越大, 对于编码也越重要。嵌入式编码的次序是从最重要的位 (最高位) 到最不重要的位 (最低位) 逐个发送, 直到达到所需码率后停止。

Shapiro的EZW算法利用小波系数的特点较好地实现了视频编码的嵌入功能, 主要包括以下三个过程:零树预测、用零树结构编码重要图、逐次逼近量化。

2.1.1 零树预测

一副经过小波变换的图像按其频带从低到高形成一个树状结构, 树根是最低频子带的结点, 它有三个孩子分别位于三个次低频子带的相应位置, 见图2左上角, 其余子带 (最高频子带除外) 的结点都有四个孩子位于高一级子带的相应位置 (由于高频子带分辨率增加, 所以一个低频子带结点对应有四个高频子带结点, 即相邻的2×2矩阵, 见图2) 。这样图2所示的三级小波分解就形成了深度为4的树。一个小波系数x, 对于一个给定的门限T, 如果|x|

2.1.2 用零树结构编码重要图

重要图包括三种要素:即重要系数、孤立零和零树根。其中, 对于一个给定的阈值T, 如果系数X本身和它的所有的子孙都小于T, 则该点就称为零树根;如果系数本身小于T, 但其子孙至少有一个大于或等于T, 则该点就称为孤立零点。在编码时分别用三种符号与之对应。当编码到最高分辨率层的系数时, 由于它们没有子孙, 零树根不再存在, 只需其余两种符号即可。在原始的EZW算法中, 将重要系数的符号与重要图一起编码, 这样就要使用四种符号:零树根、孤立零、正重要系数、负重要系数。

2.1.3 逐次逼近量化

嵌入式编码的核心在于采用了逐次逼近的量化方法 (SAQ) 。SAQ按顺序使用了一系列阈值T0, T1, ..., TN-1来判决重要性, 其中Ti=Ti-1/2, 初始阈值T0按如下条件选择, ∣Xj∣<2T0, 其中Xj表示所有变换系数。在编 (译) 码过程中, 始终保持着两个分离的列表:主表和辅表。主表对应于编码中的不重要的集合或系数, 其输出信息起到了恢复各重要值的空间位置结构的作用, 而辅表是编码的有效信息, 输出为各重要系数的二进制值。编码分为主、辅两个过程:在主过程中, 设定阈值为Ti, 按上述原理对主表进行扫描编码, 若是重要系数, 则将其幅值加入辅表中, 然后将该系数在数组中置为零, 这样当阈值减小时, 该系数不会影响新零树的出现;在辅过程中, 对辅表中的重要系数进行细化, 细化过程类似于比特平面编码。对阈值Ti来说, 重要系数的所在区间为[Ti, 2Ti], 若辅表中的重要系数位于[Ti, 3Ti/2], 则用符号“0”表示, 否则用符号“1”表示。编码在两个过程中交替进行, 在每个主过程前将阈值减半。

2.2 EZW算法符号的二元化

总的来说, 原始EZW算法符号由3个字母集构成∑1={0, 1}, ∑2={P, N, ZR, IZ}, ∑3={P, N, Z}, ∑1是辅过程字母集, ∑2是除最高分辨率层LH, HL, HH的主过程字母集, ∑3是最高分辨率LH, HL, HH的主过程字母集。通过实验可以发现, 辅过程输出的∑1中位流即使使用高阶熵编码也难以压缩。所以, 在本文的编码器中不对∑1中的位流进行编码, 而是简单的原样输出。对于∑2和∑3中的字母, 我们将P和N合并为S, ZR和IZ合并为Z, 形成新的二元字母集∑A={S, Z}。如果当前的EZW系数x是S, 那么使用一个符号位 (∑B={P, N}) 说明x是正还是负, 对于这个增加的符号位使用符号编码。相似的, 如果x是Z, 并且x∈∑2, 那么增加一位 (∑C={ZT IZ}) 说明x是零树还是孤立零点, 对于这一位进行熵编码, 因为零树和孤立零点的概率在不同的模型状态下差别很大。

这样新的EZW符号集为∑A={S, Z}, ∑B={P, N}, ∑C={ZT, IZ}, ∑D={0, 1}。在本文中对于∑A={S, Z}和∑C={ZT, IZ}考虑父系数和内部子带相邻系数建立上下文模型进行自适应的二进制算术编码, ∑D={0, 1}原样输出不进行熵编码, 对于重要系数的符号 (∑B={P N}) 建立的上下文模型是本文的重点, 详见下面几节。将原始EZW算法符号进行二元化的优点:

1) 可以对各个字符集使用计算效率很高的二进制算术编码器;

2) 将符号信息从原始EZW字符集中抽取出来, 有利于对符号进行独立的上下文熵编码。

3 符号编码

3.1 内部子带符号相关

挖掘内部子带系数符号之间的相关对HL和LH子带系数符号的压缩特别有用, 因为HL和LH子带有非常强的边缘方向信息。

3.1.1 边缘垂直方向系数符号相关性

一幅多分辨率的2-D小波分解的HL子带是由垂直方向低通滤波和水平方向高通滤波形成的。高通滤波检测垂直边缘, 因此HL子带包含了基本的垂直边缘信息。LH子带是相反定义的, 包含了基本的水平边缘信息。给定一个在HL子带中的垂直边缘, 有理由认为沿着该边缘的变换系数是正相关的。这是因为在图像中沿着垂直边缘通常有很强的垂直相关。当低通滤波器沿着图像列应用, 导致一系列相似的行, 在一行中的元素由于垂直相关的原因和上下方向的元素倾向于非常相似。后继的沿着相似行的高通滤波将获得垂直相关变换系数。因此, 沿着边缘垂直方向的相邻系数可以被认为是有价值的上下文信息, 当系数被编码时期望与相邻系数有相同符号。

3.1.2 边缘水平方向系数符号相关性

考虑边缘横向相关性也非常重要。对于Daubechies'9/7滤波器而言, 边缘横向小波系数符号是强负相关的。对边缘横向负相关的一种解释来源于边缘检测理论。许多边缘检测器利用了一阶或二阶类似高斯方程导数去确定边缘。信号被平滑后, 对一阶导数取极值, 对应二阶导数的零点, 作为边缘分类。而高斯二阶导数的图形和Daubechies'9/7滤波器的小波图形非常相似。这种小波非常类似于二阶高斯导数边缘检测, 直观上可以预测横向边缘小波系数将会变号。尽管离散小波变换使用二次抽样, 二次抽样后的系数横向边缘仍然保持强负相关。横向边缘负相关性被广义线性回归技术进一步加强。当一个小波系数作为它的横向边缘相邻系数的函数被优化预测时, 预测系数是负的, 标志预测一次符号转变。

3.1.3 符号编码内部子带上下文

由于小波变换系数存在纵向/横向边缘符号相关, 因此在编码一个系数的符号时, 考虑其上下左右四个方向的相邻系数作为内部子带上下文。由于每个相邻系数的符号都有3种可能性 (可正, 可负, 或者未指定) , 这样总共有34个上下文。为了避免上下文稀疏现象, 也就是为了减少模型耗费, 将这34个上下文量化为7个上下文。在选择上下文时进行顺序评测, 选择第一个相符合的上下文。

3.2 使用投影技术的符号预测

当前多数小波编码利用内部子带相邻系数的一些组合作为上下文模型, 有些模型也考虑到将同方向的一个父系数包括到模型中。但是, 这些算法主要关注内部子带系数, 并且认为在其它系数中几乎没有可以利用的信息。

投影方法将小波分解基向量投影至由其它交叠支撑集基向量张成的子空间。显然, 如果所有的基向量是正交的, 那么投影得到零向量, 不提供任何信息。但是, 对应于双正交小波分解的基向量不是完全正交的, 可以考虑利用双正交基向量之间的交互信息。

3.2.1 投影预测

给定一个图像 (离散时间) 信号x, 那么x的双正交展开公式为:

这里 (vi) 和是双正交基, <., .>是标准欧几里得内积。

对于一个给定的LH基向量LHi, j, 考虑预测其相应的系数值CLHi, j。这个基向量LHi, j能够投影到由来自其它三个方向的所有交叠基向量张成的子空间S上, 如图3所示。内部子带基向量不包括在子空间中, 因为它们提供的信息在上下文模型的内部子带部分可以获得。

这种子空间投影是相邻基向量的一个线性组合:

投影系数 (αvi, j) 可以和已经编码的小波系数Cvi, j (对应vi, j∈S) 的值一起构成小波系数CLHi, j的一个线性预测。

对于使用Daubechies'9/7双正交滤波, 首先, 预测LH和HL子带系数时, 需要知道LL子带中的系数值。只有在小波分解金字塔的最粗层次中LL子带系数是直接可以得到的, 在其它层次不能直接得到。对于渐进分辨率的编码器, 由于在编码进入下一层金字塔之前, 每层金字塔已经编码为最终的量化值, 所以在解码器需要使用较细的LL子带时只需合成一次。

其次, 预测HH子带的系数来自LH和HL子带, 不需要合成LL子带。预测HH子带系数的能力对于符号编码而言是非常有用的。因为在HH子带中缺乏方向性结构, 这使得符号编码难以实行, 而投影预测提供了在HH子带中压缩系数符号的方法。另外, 如果一个系数没有相邻的重要系数时, 预测系数符号的唯一信息来自于投影预测。使用投影技术预测系数符号时, 接近65%的符号是预测正确的, 这个数字可以节约10%的编码相应符号的位率。

3.2 符号编码中的投影预测上下文

在对小波系数符号进行上下文编码时, 可以在每个内部子带上下文中, 包含4个投影预测上下文。参数是由实验决定的, 它区分投影预测的幅值是大的还是小的, 这样有利于后续的算术编码。因此总共7*4=28个上下文用于符号编码。

在有损小波压缩中, 一些系数被量化为零。这种量化在向量量化器中可能是精确的, 但在位平面编码器中是不精确的 (在到达重要系数阀值前可能已经耗尽位数) 。甚至在仅仅压缩比率8:1的压缩中, 典型的剩下80%的小波系数量化为零。假设零量化系数符号正负可能性相等, 那么在解码端对这些系数的最好估计是把它们重建为0值。使用先前描述的符号预测技术, 可能预测一个零量化系数的符号正确 (大于50%的概率) 。这使系数的分布倾斜, 零也就不再是最佳估计了。通过使用解码过程中积累的符号预测和幅值预测统计数据, 能够推导出改进的零量化系数估计。

假设估计一个小波系数ω∈ (-τ, τ) , 这个系数符号为正的概率为p, ω在正区域和负区域是独立同分布的, f (ω) 是ω的概率分布方程。

当ω∈ (0, τ) 时, f (ω) =k1;当ω∈ (-τ, 0) 时, f (ω) =k2。 (4

这里的k1和k2不一定相同, 实际上只有在p=1/2时两者才相等。在此情况下, ω的最小均方误差估计为:

这样对零量化系数的估计不需要额外的位率, 是从已存在的信息中计算得来的。可以在图像编解码系统的解码端完全获得零量化系数估计。编码端不需要知道是否解码段要进行零量化系数估计, 也不需要为零量化系数估计编码任何附加信息。因此, 零量化系数估计作为一个属性可以很容易地添加到任何解码端有符号和幅值编码统计数据的小波编解码系统中。由于零量化系数估计是自然随机的, 所以并不能保证减少解码图像的失真, 但是在实际应用中它很成功。

4 结束语

本文的方案可以通过使用优化幅值 (显著) 编码算法获得更高的编码效率。由于符号编码是独立于幅值编码的, 所以本文的符号编码方案可以添加到那些没有考虑符号编码的算法中 (例如SPIHT) , 以提高这些算法的效率。最后, 零量化系数估计使得在按额分配的位率耗尽后提高解码效率, 由于它仅利用解码过程中积累的统计信息, 它可以完全在解码端实现。可以容易地整合入当前产生符号和幅值 (重要信息) 编码统计信息的小波编码方案中。

摘要:嵌入式小波零树编码 (EmbeddedZerotreeWavelet, EZW) 是一种典型的小波图像编码算法。它是一种非常有效和实用的压缩技术, 曾为其他小波编码算法的产生奠定基础。小波变换理论是近几年兴起的崭新的时 (空) 频域分析理论, 与其它的变换编码方法一样, 小波变换也是将视频 (空域) 信号变换到系数空间 (频域) 上进行处理的方法, 许多学者在利用小波变换进行视频图像压缩方面做了大量工作, 并取得了相当大的成果, 其中Shaprio的嵌入式零树小波编码方法 (EZW) 则是最有影响的小波编码方法之一。

关键词:视频压缩,算法,自适应滤波,嵌入式

参考文献

[1]JPEG2000Part I Final Int.Std., ISO/IEC JTC1/SC29/WG1N1890, Sept.2000.

[2]D.S.Taubman and M.W.Marcellin, JPEG2000:Image Compression Fundamentals, Standards and Practice.Norwell, MA:Kluwer, 2002.

自编码算法 篇3

齿轮箱作为一种具有结构紧凑、传动转矩大、传动效率高等诸多优点的动力传动装置,被广泛应用于交通运输、能源化工、起重机械等领域。然而,由于齿轮箱结构复杂、承受负载大、工作环境恶劣等原因,使得齿轮箱易于发生磨损、剥落、点蚀、裂纹等故障。但由于齿轮箱复杂的振动传递路径、强背景噪声以及多振动源激励的影响,使得振动信号信噪比小,故障特征被噪声淹没,增加了特征提取难度。因此,实现强背景噪声中齿轮振动特征的有效提取是齿轮故障检测的关键。

齿轮运行过程中,当损伤轮齿与正常轮齿啮合接触时,会使得轮齿滑动接触表面间的润滑油膜破裂,从而产生冲击,而在齿轮旋转运动下,冲击会按一定的时间间隔规律重复性出现,所以,振动信号中周期性或准周期性冲击成分的出现是齿轮局部损伤的一个关键征兆[1]。因此,选取适当方法将周期性瞬态冲击成分从被强噪声污染的齿轮振动信号中提取出来,对实现齿轮故障诊断具有重要意义。文献[2]针对齿轮局部故障产生的动态响应特点,将信号共振稀疏分解和包络解调相结合,实现了振动信号中瞬态冲击分量的有效识别;文献[3]将双树复小波和局部投影算法相结合,提取齿轮振动信号中的周期冲击分量,实现齿轮故障诊断。此外,局部均值分解[4]、最大相关峭度解卷[5]、局部特征尺度分解[6]等多种现代信号处理方法也被应用于齿轮故障诊断中,并取得了较好的效果。

随机共振是Benzi等[7]在解释地球古气象“冰川期”和“暖气候期”周期性变化规律时提出的。随机共振作为一种利用噪声增强微弱信号特征的处理方法,通过构建评价随机共振效果的测度函数,控制调整噪声或系统参数实现信号、噪声与系统三者间的最佳匹配,从而将噪声能量转移给目标信号,实现目标信号特征的增强提取,为微弱信号检测与特征提取提供了有效的解决途径[8,9,10,11]。虽然随机共振可以在一定程度上实现信号中冲击特征的有效提取[12,13],但对于信号中周期性冲击分量的检测效果不佳,其原因主要是:缺乏有效的随机共振测度函数对其检测效果进行有效合理的评价;峭度指标作为一种量纲一指标,可定量表征信号中的冲击成分,但对初期损伤敏感,对不同冲击幅值、多冲击分量特征的整体定量刻画效果不理想;互相关系数可定量地表征两个信号的相似性,但容易受到噪声的影响;此外随机共振系统参数的合理选取也缺乏有效的理论依据。因此,本文针对随机共振在周期性冲击分量检测中存在的问题,提出了基于自适应随机共振和稀疏编码收缩算法的齿轮故障诊断方法,利用相关峭度对信号中周期性冲击分量的良好评价能力,将其作为随机共振提取周期性冲击特征的测度函数,并借助遗传算法[14]实现系统参数的自适应优化选取,同时,为使得检测结果中的冲击特征更加突出,借助稀疏编码收缩算法的稀疏降噪能力,对随机共振检测结果作进一步消噪处理,从而提高故障识别精度。仿真和工程应用验证了本方法的有效性和实用性。

1 理论基础

1.1 随机共振

随机共振是随着非线性动力学和统计物理理论飞速发展而出现的一种利用噪声来增强微弱信号特征的信号处理方法,强调的是非线性系统、周期信号和噪声间的积极协同效应,它为微弱信号检测提供了有效的解决途径。

过阻尼双稳系统随机共振模型用非线性朗之万方程描述如下:

式中,x(t)为系统输出;s(t)为输入信号;n(t)为均值为0、方差为D的高斯白噪声;U(x)为双稳态势函数;a和b为双稳态势函数的系统参数,均为正实数。

令,可得到一个非稳态解x=0和两个稳态解。势垒高度为ΔU=U(0)-U(x±)=a2/(4b),势间距为

由式(1)可以看出,随机共振的系统输出实际上是布朗粒子在双稳势函数中的运动轨迹。当布朗粒子仅在周期信号作用下时,没有足够的能量跃迁势垒,只能在单势阱内移动;但在适量噪声协助下,布朗粒子可以逐渐积累能量,从而按照周期信号的振荡频率在两势阱间实现周期跃迁,达到“共振”状态,进而将布朗粒子在单势阱内的小范围移动放大为两势阱间的大范围跃迁,达到凸显周期信号特征的效果。因此,随机共振检测微弱信号的过程就是调整系统参数或噪声强度实现信号、噪声与非线性系统三者间最佳匹配的过程。

1.2 相关峭度

相关峭度是Geoff等在峭度指标的基础上,综合考虑冲击成分的周期性而提出的用于定量描述信号中周期冲击成分的评价指标[15]。该指标综合体现了相关系数和峭度指标的双重思想,既考虑了各周期内冲击成分间的相关性,又继承了峭度指标对冲击成分的敏感性。在利用随机共振提取信号中的周期性冲击特征时,既要考虑检测结果的整体效果,即周期冲击特征全部有效提取,又要凸显检测结果的个性特征,即各周期内冲击特征实现最大化提取。而相关峭度没有考虑各周期内信号峭度对整体检测结果的影响。所以,本文在相关峭度的基础上,引入了各周期内的信号峭度指标,并将完善后的相关峭度作为随机共振检测冲击信号的测度函数,依据测度函数最大化选取最优的系统参数,实现周期冲击特征的最佳提取。

设y(n)为均值为零、含有周期冲击成分的原始信号序列,引入各周期内信号峭度指标影响的相关峭度计算公式为

式中,T为冲击周期,单位为数据点数;N为原始信号长度;M为周期偏移数。

对于旋转机械中齿轮、轴承等关键部件的振动监测,由其局部损伤导致的冲击响应周期一般与相应轴的转频成倍数关系,因此,冲击周期T可由分析对象的转频信息和采样频率计算得到。此外,选取的冲击周期T与原始数据长度N不一定满足整数倍关系,因此,当原始数据长度N与选取的冲击周期T不满足整数倍关系时,则采用重采样技术对原始信号进行重采样处理,使得重采样后的数据长度与冲击周期T满足整数倍关系。对于周期偏移数M的确定,为了充分利用各周期内的冲击信息,本文选取

1.3 稀疏编码收缩

稀疏编码收缩算法是Hyvarinen[16]基于稀疏编码理论提出的一种利用数据统计特性从背景噪声中预估非高斯成分的消噪方法。该算法利用非高斯成分的稀疏概率密度函数,借助最大似然估计理论得到阈值收缩函数,从而对观测信号进行稀疏阈值降噪处理,凸显信号中的非高斯分量。在本文中,齿轮故障信号中的冲击分量是典型的非高斯成分,因此,采用该算法对随机共振检测结果做进一步处理,使得冲击特征更加明显,提高故障识别精度。

Hyvarinen[16]提出的非高斯成分的稀疏概率密度函数如下:

式中,x为原始信号,其统计特性表现出非高斯性质;d为原始信号x的标准差;α为控制概率密度函数稀疏性的参数,α取值越大,概率密度函数越稀疏,本文α取值在0.1~0.5之间[17]。

基于上述稀疏概率密度函数模型,利用最大似然估计方法给出稀疏阈值收缩函数,从而可以从观测信号y中估算得到原始信号x的估计值

式1中N,σ为观测信号中的噪声标准差,由公式估计得到;为观测信号y的平均值;d由公式估算得到;σy为观测信号y的标准差[18]。

当式(4)中的平方根为虚数时,取值为零。

2 算法流程

由随机共振原理可知,随机共振检测微弱信号的过程就是通过调整系统参数,使得随机共振测度指标实现最大化的过程。因此,随机共振系统参数调整规则和随机共振现象发生与否的判断标准是利用随机共振实现微弱特征提取的两大关键问题。而目前,随机共振控制参数的合理选取缺乏有效的理论依据,经验法或试验法选取具有一定的人为主观盲目性,因此本文利用遗传算法的多参数同步优化能力实现系统最优参数的自适应选取;同时,利用相关峭度可以定量评价信号中周期冲击成分的优良特性,将其作为随机共振检测冲击信号的测度指标,构造遗传算法的适应度函数,实现齿轮故障信号中冲击特征的自适应提取。同时,由于齿轮故障冲击成分通常具有非高斯性质,而噪声成分则呈现出高斯分布特性,稀疏编码收缩算法可实现高斯信号和非高斯信号的有效分离,因此利用该算法对随机共振的检测结果做进一步消噪处理,凸显信号中的冲击特征。综上所述,本文提出的基于自适应随机共振和稀疏编码收缩算法的齿轮故障诊断方法可以有效实现齿轮冲击故障特征的增强提取,提高诊断精度。该算法的流程如图1所示,具体实现如下:

(1)相关峭度参数设置和数据预处理。根据被测对象的转频等信息选取相关峭度计算公式中冲击周期T和周期偏移数M的初始值,若原始数据长度与冲击周期T不满足整数倍关系,则需对原始信号按照T的整数倍关系进行重采样处理。

(2)遗传算法参数初始化。设置初始种群数量、随机共振系统参数a和b的搜索范围、最大迭代次数、迭代精度等,并利用相关峭度构造遗传算法适应度函数,基于适应度函数的最大化实现系统参数的优化选取。

(3)变尺度随机共振处理。根据信号特征设置变尺度压缩率,将原始信号输入到变尺度随机共振系统[13],利用遗传算法实现系统参数的最优选取,并利用得到的最优参数重构共振系统,从而进一步得到随机共振的最佳检测结果。

(4)稀疏编码收缩处理。利用稀疏编码收缩算法对随机共振的检测结果作进一步的降噪处理,凸显信号中的冲击特征。

(5)故障诊断。依据齿轮故障信号的最终处理结果实现齿轮故障的有效识别和诊断。

3 应用实例

3.1 试验台齿轮裂纹故障检测

齿轮箱作为旋转机械的常用传动装置,长期在低速、重载等恶劣环境中运行,难以避免发生各种损伤或故障。齿轮裂纹作为齿轮箱常见的早期故障之一,具有危害大、隐蔽性强、检测识别难等特点。而且,随着裂纹的逐渐扩展,若未能及时发现,则会导致后续一系列从属故障的发生,成为很多重大事故的潜在诱因。因此,利用齿轮裂纹故障的信号响应特征,实现齿轮裂纹故障的有效检测具有重要意义。

利用齿轮箱故障模拟试验台进行齿轮裂纹故障试验,齿轮箱采用一级传动,其中主动轮齿数为55,从动轮齿数为75。在从动轮齿轮齿根处用线切割加工裂纹,宽度为0.1mm,深度为2mm,如图2所示。用安装在齿轮箱顶盖上的振动加速度传感器采集振动信号,采样频率为12 800Hz,输入转速为780r/min,计算得到从动轮转速为572r/min,数据长度为6144点。

图3a给出了原始信号的时域波形,可以看出波形较为杂乱,没有明显的与齿轮故障特征相符的特征信息;而在图3b所示的频谱图中,频率成分复杂,也没有出现相应的有价值的频率特征信息。对该信号采用本文所提方法进行处理,选取相关峭度的计算参数:周期T由从动齿轮转频和采样频率计算得到,即T=1343;原始数据长度6144与冲击周期1343不满足整数倍关系,重采样处理后数据长度为5372点,采样频率变为11191.67Hz,从而周期偏移数M=3;遗传算法初始参数中的初始种群数量为50,系统参数a和b的搜索范围为[0.1,30],最大迭代次数为25,迭代精度为10-8等;变尺度压缩率R=700;得到的最终处理结果如图3c所示。从图3c中可以清晰地看到一组以近似0.106s为周期的冲击序列,冲击间隔与从动轮/故障齿轮的转频9.533Hz相符。诊断结果验证了所提方法的有效性。

此外,还给出了两组对比分析结果,图4a所示为随机共振方法以峭度指标作为评价函数得到的最优检测结果,图4b所示为以加权峭度指标[12]作为评价函数得到的随机共振处理结果,其中算法参数除随机共振测度函数不同外,其余参数设置与前文相同。由图4a、图4b可以看出,二者均未能有效提取出原始信号中的周期冲击特征。可见,本文所提方法借助随机共振的噪声利用特性和稀疏编码收缩算法可以实现齿轮故障冲击特征的增强提取。

3.2 机车走行部齿轮箱故障诊断

铁路运输作为国民经济的大动脉,正朝着高速方向发展,从而对机车的安全性、可靠性等提出了越来越高的要求。而电力机车作为一种重要的铁路运输工具,其安全可靠性运行是铁路运输的重要保障。齿轮箱作为电力机车的重要动力传递装置,工作环境恶劣,容易发生齿轮的胶合、磨损、裂纹甚至断齿等损伤,严重影响机车的正常运行。为保证机车的行车安全,缩短故障维修时间,实现齿轮早期故障的识别与诊断具有重要意义和实用价值。同时,由于机车运行环境复杂,所采集到的振动信号的信噪比往往很小,大量随机噪声掩盖了齿轮故障特征信息。因此,引入本文所提出的方法分析电力机车走行部齿轮箱振动信号,实现齿轮故障的有效诊断。

某型号机车走行部齿轮箱为一级斜齿轮减速传动,齿轮齿数分别为20和87,机车运行速度为63km/h,车轮直径为1.25m,计算得到大齿轮的转频为4.47Hz,小齿轮的转频为19.44Hz,齿轮啮合频率为388.9Hz。采样频率为12 800Hz,数据点数为13 500点。图5a所示为齿轮箱振动信号时域波形,可以看出,原始信号中含有不太明显的冲击成分,但由于背景噪声的影响,故障征兆不明显。而在其频谱图(图5b)中,频率成分较为复杂,有用信息也被噪声淹没,未能发现与齿轮故障相关的频率特征信息。采用本文所提方法对该信号进行处理,选取相关峭度的计算参数如下:周期T=2864,重采样后数据长度为14 320点,采样频率变为13 577Hz,周期偏移数M=4;遗传算法初始参数与前文相同,变尺度压缩率R=400,处理结果如图5c所示。从图5c中可以发现,信号中出现了明显的一组等间隔冲击序列,冲击周期近似为0.22s,与大齿轮的旋转频率4.47Hz相符,说明在大齿轮的某个齿上存在局部损伤。

图6所示为随机共振方法结合峭度指标和加权峭度指标得到的检测结果。由图6a和图6b可以看出,除了较为明显的前两个强冲击特征被提取出来,其余的弱冲击特征依然被噪声淹没,未能有效识别。因此,依据图6的处理结果难以给出明确的诊断结论。在之后的检修中发现机车走行部齿轮箱大齿轮某一齿的齿根存在裂纹损伤,与本文所提方法分析结果相符,验证了本文方法的有效性和优越性。大齿轮齿根裂纹故障图片见图7。

4 结语

本文针对随机共振在周期性冲击分量检测中存在的问题和不足,提出了基于自适应随机共振和稀疏编码收缩算法的齿轮箱故障诊断方法。该方法选用相关峭度作为随机共振检测周期性冲击分量的测度函数,并采用遗传算法优选随机共振系统参数,实现齿轮故障冲击特征的自适应随机共振检测;在此基础上,利用稀疏编码收缩算法对信号中非高斯分量的稀疏降噪能力,对随机共振检测结果做进一步降噪处理,凸显冲击特征,提高齿轮故障诊断精度。试验和工程实例结果表明,该方法对齿轮故障振动信号中的周期性冲击成分具有良好的提取效果,从而为齿轮故障诊断提供了一种有效解决途径。

摘要:针对强背景噪声下齿轮故障冲击特征提取问题,提出了一种基于自适应随机共振和稀疏编码收缩算法的齿轮故障诊断方法。该方法选用相关峭度作为随机共振检测周期性冲击分量的测度函数,借助遗传算法实现信号中周期性冲击特征的自适应提取;在此基础上,利用稀疏编码收缩算法对随机共振检测结果做进一步降噪处理,从而凸显冲击特征,提高故障识别精度。试验和工程实例分析结果表明,该方法可实现齿轮故障冲击特征的增强提取,为齿轮故障诊断提供依据。

自编码算法 篇4

关键词:票据图像,多分辨率分解,零树编码,JPEG压缩标准,边缘细节信息

票据图像作为人们生活和工作中广泛应用的图像,在许多多媒体系统中都需要存储和传输的,例如医院信息系统和电子金融管理系统。长期以来,数字图像压缩编码技术主要采用JPEG压缩标准[1]来进行压缩。对于一般的自然图像来说,JPEG压缩标准在保证图像质量的前提下具有较高的压缩比。但是对于JPEG压缩标准中主要利用离散余弦变换DCT(Discrete Cosine Transform DCT)技术完成图像的变换编码,然而经过DCT处理的图像编码在大的压缩比下存在着严重的块状效应,这非常不利于票据图像的压缩及存储。因为票据图像中包含了丰富的边缘细节信息,这些都是票据图像中的重要信息,需要完整的保留下来。所以出现了一些基于二值化分割算法来获得高的压缩比[2,3,4,5,6],但是这些方法不仅要面对图像分割的挑战,而且有时对图像重要的信息在压缩以后已经丢失了。

为此,该文通过对Shapiro提出的嵌入式零树小波编码算法EZW(Embedded Zerotree Wavelet,EZW)[7]分析的基础上,实现了针对票据图像的零树编码,并进行了仿真试验,仿真结果与JPEG压缩标准作了比较,在大的压缩比下,票据图像的边缘细节信息得以保留,保证了阅读质量。

1 算法设计

本文方法是是针对票据图像进行压缩编码,票据图像与普通自然图像有着明显的区别,因此首先要了解票据图像有如下特点:

1)票据图像颜色单一,从视觉效果上,一幅票据图像有4-5种颜色就可以显示整幅图像的信息。

2)票据图像在一个小区域内像素颜色一致(不包括背景颜色)。

3)票据图像存在着大面积的背景区域。

根据票据图像特点(1)和(2),可以将票据图像进行颜色聚类,得到调色板和颜色位图。每幅颜色位图代表调色板中的一种颜色,而颜色位图可以用一幅二值图像来表示,黑色代表背景,白色代表前景,即前景信息就是原始图像中代表该颜色的信息。根据特点(3),可以判断出每幅位图中都包含大面积的背景区域,对每幅颜色位图进行二值图像的多分辨率分解得到金字塔结构图,在分析EZW算法的基础上对每幅位图的金字塔结构图进行改进的零树编码。在解码端,根据解码得到的金字塔结构图,重构颜色位图,根据对应调色板的颜色得到解压缩的图像。

1.1 颜色位图的多分辨率分解

对于原始的颜色位图,它是一幅二值图像,将图像中的像素点分为2×2像素的方块,并按图1所示规则[8]进行分解,得到原始二值图像的低频子图。

其中不全为0或者不全为1。将得到的低频子图按图2所示规则映射到原图尺寸大小。

将映射得到图像与原始位图相减得到残差图,即高频子图。此时低频子图与高频子图就构成了一个金字塔结构图。对于低频子图再进行几次上述算法处理,便得到了原始位图的金字塔结构图。

1.2 改进的零树编码

EZW方法是基于小波变换之后进行编码的,经过小波变换后的图像具有多分辨特性,EZW算法就是利用不同分辨率子带中同一空间位置的数据构成一棵树,利用树中的低频数据的幅度值大、高频数据的幅度值小的特点,生成零树,从而达到压缩的目的。

原始位图经过多分辨率分解后的金字塔结构图,在不同分辨率层级中同一空间位置的数据具有相关性。以图3所示的金字塔结构图为例,将金字塔结构中最低分辨率层级中的每个像素点作为“父亲”,那么该分辨率层级上每个像素点都有4个“儿子”存在于下一分辨率层级,在最高分辨率层级中有16个“孙子”。根据原始位图多分辨分解算法,可以得知其金字塔结构图中不同分辨率层级中同一空间位置的数据有如下特点:

1)每个分辨率层级中的“1”,其子孙后代全为0;

2)每个分辨率层级中的“0”,其子孙后代中可能全为0或者含有1。

EZW算法中从最低分辨率的系数开始扫描,判断扫描到的系数是否为“正显著系数”、“负显著系数”、“零树跟”和“孤立零点”,然后进行编码输出。因此,根据EZW的编码思想及上述特点,改进的零树编码算法如下:

1)扫描整个金字塔结构图,按照自上至下,自左至右的顺序扫描;

2)若扫描到“1”,则认为该点为正的零树跟,标记其子孙节点都无需扫描编码,将该点编码为“p”;

3)若扫描到“0”,判断其子孙节点是否全为0。

(1)若其子孙节点全为0,则认为该点为负的零树跟,标记其子孙节点都无需扫描编码,将该点编码为“t”;

(2)若其子孙节点有1,则认为该点为孤立零点,编码为“z”。

2 实验验证

为了检验本文对于票据图像的压缩编码算法,本小节对票据图像分别进行了本文的压缩编码算法和JPEG压缩编码,并给出实验结果对比。为了验证本文算法的有效性,同时给出了二者之间峰值信噪比、视觉效果和细节保留的对比。

图4为原始票据图像,图5为JPEG压缩后的图像,图6为本文方法压缩后的图像。实验表明,JPEG压缩标准的压缩比已经达不到本文方法的压缩比了。如表1所示,JPEG压缩能够达到的最大压缩比为113:1,而本文的方法已经达到了137:1,而且在峰值信噪比上本文方法也要高于JPEG压缩。从阅读质量上来看,经过本文压缩方法后的解码图像能够更好有利于从图像中获取信息,JPEG压缩后的图像已经产生了明显的块状效应,造成图像模糊。图7中自上而下为原图像细节、JPEG压缩后细节和本文方法压缩后细节,可以看到本文方法保留了更多的票据图像的边缘细节信息,保证了票据图像的信息传达。

3 结束语

本文研究了一种针对票据图像有效的压缩编码算法。首先,针对票据图像的特殊性进行了预处理,其次对零树编码进行了改进以适用于票据图像的编码,不仅仅提高了压缩比,而且还保留了票据图像中重要的边缘细节信息。实验表明,该文方法在同等压缩比下,解压缩后的图像在峰值信噪比和视觉效果上,尤其是在边缘细节信息的保留上都要优于JPEG压缩标准。

参考文献

[1]http://www.jpeg.org/jpeg/index.html[S].

[2]Shapiro,J.M.:‘Embedded image coding using zerotrees of wavelets coefficients’[J].IEEE Trans.Signal Process.,1993,41:3445–3462.

[3]Howard P G.Text image compression using soft pattern matching[J].The Computer Journal,1997(40):146-156.

[4]Seropian A,Vincent N.Writers authentication and fractal compression[J].Proceedings.8th International Workshop on Frontiers in Hand writing Recognition,2002:434-439.

[5]Howard P G.Lossless and lossy compression of text images by soft pattern matching[J].Proceedings Data CompressionConference,1996:210-219.

[6]Ye Y,Cosman P.Fast and memory efficient text image compression with JBIG2”[J].IEEE Transactions on Image Processing,2003,12(8):944-956.

[7]Y.Ye,and P.Cosman,“Dictionary design for text image compression with JBIG2”[J].IEEE Transactions on Image Processing,2001,10(6):818-828.

速率自适应的软网络编码方案 篇5

但是,由于无线网络拓扑结构的动态变化以及链路的时变性,使得无线网络中难以提供可靠的恒定速率的信息传输服务。对此,有人提出了速率适配的网络编码方案[6],通过降低节点瞬时发送速率来增加数据包被串听(overheard)的范围,以此增加网络编码机会并进一步提高网络吞吐量。先前网络编码[3,5,7]在TWRC(双向无线中继信道)中的设计需要在中继节点对接收到的来自两个端节点的数据包进行正确的信道译码,但是由于信道衰落的时变性,不可能总是假设接收到的数据包被正确译码,而且信道译码处理会消耗过多的功率。

针对以上问题,本文提出一种速率自适应的软网络编码传输方案,该方案的关键特征包括两个方面:相比于传统的网络编码方案,中继节点不需要信道译码和重新编码,大大减少了中继节点的计算复杂度和功率消耗;根据节点之间的信道信噪比估值,源节点自适应调整物理层发送速率响应信道变化,进一步提升系统吞吐性能。

1 软网络编码的基本思想

传统的直接网络编码SNC(Straightforward Network Coding)在TWRC的设计如图1所示,来自两个端节点的数据包在中继节点被正确译码之后才进行网络编码合并,这就限制了其吞吐量;由于信道衰落的时变性,不能确保接收到的数据包总是被正确译码;信道译码处理(尤其是Turbo、LDPC这样高级的编码方式)会消耗过多功率,增加计算复杂度。

软网络编码方案中,中继节点不需要进行信道译码和重新编码操作,如图2所示。信道编解码是在端对端的基础上,也就是说只在端节点进行信道编码和相应解码。

由于Turbo码、LDPC等信道编码的线性性质,即相同长度的两个码字可以进行线性合并,而网络编码实际上也是线性映射,因此,对于码字也能够进行网络编码合并。

为分析简单起见,假设两个端节点使用同样的编码方式和BPSK调制,以及相同的数据包长度和码字长度。本文中,Γ定义包括信道编码和调制过程,信息数据包Ui和要发送的BPSK信号Xi之间的关系为:

由于对两个码字Di的二进制比特的逻辑异或操作等同于对两个BPSK符号Xi进行乘法操作,所以,Γ的线性性质可以表示成:

其中,⊗表示BPSK信号诸元素相乘(其他调制方式可以推导)。

中继节点接收到两路数据包后合并其软判决信息v13,m和v23,m,软网络编码的输出数据包x3,m实际上是目标信息数据包U1⊕U2的码字。忽略噪声和衰落影响,软网络编码可表示成:

可见,SNC需要两个信道译码器和一个信道编码器;软网络编码机制中,中继节点对接收到的两路信号的软判决信息进行网络编码,而不需要任何信道译码,节省了基带信号处理的功耗,提高了无线网络中继节点的功率效率。

上述对软网络编码的讨论是建立在假设两个终端节点使用相同的信道编码结构的基础上,但是可以看出,当两个终端节点采用不同的信道编码结构时,软网络编码设计依然适用。这就为下一步的自适应编码调制提供了必要的条件。

2 速率自适应策略

不同的编码调制方式抗噪能力不同,所以,在满足一定误码率的前提下,可根据实际信道择优选择编码调制方案当用户处于有利通信地点时(如靠近基站或存在视距链路),对用户的传输数据可以采用较高阶的调制方式和较高码率的信道编码方式(即高信息率传输模式),提高系统总吞吐量;而当用户处于不利的通信地点时(如位于小区边缘或者信道处于深衰落),则选取较低阶的调制方式和较低码率的信道编码方式(即低信息率传输模式),保证系统BER需求。

首先将不同码率的Turbo编码和不同阶数的调制方式形成N=6种不同数据率的组合Zi,具体为:信道停用不传数据;1/2 Turbo码+BPSK;1/2Turbo码+QPSK;3/4Turbo码+QPSK;1/2 Turbo码+16QAM;1/2Turbo码+32QAM;3/4Turbo码+16QAM。其对应吞吐量bi分别为0,0.5,1,1.5,2,2.5和3(b·s-1·Hz-1)。将信道信噪比范围划分为分别对应于N种编码调制组合方式的N个子集Di,根据系统所要求的BER大小来确定信噪比的阈值集合,使得系统吞吐性能达到最大;发送端根据反馈回来的信噪比信息确定所处的阈值区间,选择相应的调制方式进行数据传输,并将编码调制参数通过一定的方式通知接收端。

在TWRC中,使用速率自适应的传输策略可以根据信道状态动态调整发送速率,适应信道变化,在保证通信质量的前提下,得以最大限度地传输信息,提高小区的平均吞吐量。

参考文献[4]研究表明,即使很简单的网络拓扑,联合速率适配和网络编码的最优策略是一个NP-hard问题作者提供了一个启发式算法找到一个次优的速率适配和编码方案,而且证明了发送速率不能随意降低,否则会导致网络性能的恶化。

3 方案设计描述

TWRC中速率自适应的软网络编码传输方案如图3所示,两个端节点N1和N2在中继节点N3的协作下相互交换信息。假设3个节点都工作在半双工方式。由于无线网络自身的广播特性,任一节点发送的数据包能够被其他两个节点接收。时隙1,N1发送数据包给N2和N3;时隙2,N2发送数据包给N1和N3;时隙3,N3进行网络编码操作,合并前两时隙接收到的两个数据包并且将处理过的数据包转发给两个端节点。

Γi、Ki、Mi(i=1,2)分别表示节点处的信道编码调制映射函数、信息数据包长度和发送数据包长度。假设不同节点Γi和Ki都不同,Mi相同(当两个端节点的码字长度不同,就在较短码包的末尾添0补齐)。端节点AMC模块根据信道估计结果,采用AMC算法进行编码调制方式的选取,并将编码调制参数通知给另一个端节点。

假设节点与节点之间是复高斯广播信道,则有:

hij是节点Ni和Nj之间的信道衰落系数,假设|h13|2≥|h23|2,即信道N1→N3优于N2→N3,N1以速率R1bit/s发送U1给N3,N2以R2bit/s的速率发送U2给N3(R1>R2)。

N3分别对接收到的数据包进行调制信号识别,根据调制方式信息进行相应的软解调:

然后进行网络编码,即合并两路数据包的软判决信息v13,m和v23,m,软网络编码的输出数据包实际上是目标信息数据包U1⊕U2的码字,即网络编码后的比特d1,m⊕d2,m(等同于(x1,m×x2,m))的LLR,表示为:

其中×表示对码字D的二进制比特的逻辑异或操作等同于对发送数据包Xi的两个调制符号进行的操作,如BPSK调制,其他调制方式可以推导。

根据N3的功率约束对网络编码比特(x1,m×x2,m)的估计值归一化:

最后,N3广播x3,m给两个端节点。

通过上面的分析,可以看出N3的软网络编码操作实际上是利用y13,m和y23,m估计出(x1,m×x2,m),转发信号就是对接收的两个码字进行XOR操作得到的比特的软信息。

以N2为例简述端节点的数据处理。N2在第一个时隙通过N1和N2之间的直接链路接收到信号y12,m,在第三个时隙接收到的信号为:

其中,x3,m由式(7)给出。因为v3,m是(x1,m×x2,m)的LLR估计值,便可以看做是(x1,m×x2,m)加上虚拟噪声nv,即:

为了去掉包含在v3,m中的自信息,N2对己有信息x2,m和接收到的来自N3的y32,m进行异或操作,以BPSK调制为例:

由于和y12,m实际上就是接收到的码字x1,m的两个独立的副本,因此,N2对去掉自信息的和y12,m可以进行最大比合并(MRC)。最后,经过相应的信道译码Γ-1,N1发出的原始信息包U1就可以恢复。节点N1处的处理过程与N2相同。

4 性能分析与仿真

本小节将软网络编码与传统的SNC进行对比分析并且仿真了软网络编码方案在多种速率下的误比特性能。

由式(9)可以看出,转发信号x3,m可以近似为:

其中是为了满足功率束缚E{|x′3,m|2}的归一因子。

这样,可以形成一个输入为(x1,m×x2,m),输出为x3,m的等效虚拟信道。则式(11)可以用图4这样一个高斯信道表示,其中hv是实的信道系数,nv为加性高斯噪声。

4.1 性能比较

等效信道的吞吐量即为计算输入信号(x1,m×x2,m)和输出信号v3,m之间的互信息,即:

其近似结果为:

基于MATLAB环境仿真比较SNC和软网络编码两种方案的信道容量和误比特性能如图5所示。仿真条件为:信道编码为Turbo编码,2个分量编码器结构相同,采用由3个移位寄存器构成的递归系统卷积码,生成多项式为(15,17),码率为1/2,5次译码迭代;调制方式为BP-SK;SNC方案中译码输入为两路软判决信息的合并信息。所有的链路都是噪声方差相同的AWGN信道。

从仿真曲线可以看出,与SNC方案相比,软网络编码方案信道容量稍低,误比特性能稍差,这是因为中继节点的软合并操作使得噪声增强、错误概率相应增加,这可以通过虚拟信道看出。对应于硬信息的XOR操作,对两个软比特的网络编码操作可以表示为:

从上式可以看出,虚拟信道输出的LLR值近似于两个输入LLR值中较小的一个,也即对应着较大的噪声方差。但是由图5可以看出,随着SNR的增加,软网络编码的性能损失将会减少。在中上水平的SNR范围内,软网络编码方案有着和SNC几乎同样的信道容量。另外,提高编码速率会减小两种方案误比特性能之间的差距。

4.2 速率自适应策略的误比特性能

按照6种编码调制模式,对软网络编码方案进行仿真。

图6显示了不同发送速率下系统的误比特性能。可以看出,相同信道条件下,不同发送速率的误比特性能有所差异,即不同的信道信噪比情况对应不同的最优发送速率。则可以得出:(1)源节点与中继节点之间距离越远,平均信噪比越低,源节点采用低吞吐量的编码调制参数有效利用信道容量并且可以获得很好的误比特性能;(2)两者越接近,平均信噪比越高,为了充分利用信道容量必须采用多电平调制参数,选择最合适的发送速率,在保证通信质量的前提下,得以最大限度地传输信息。

网络编码被证明能够显著提高无线网络的性能,而无线信道具有时变和衰落特性,要想取得更大的无线信道容量,必须考虑使发送速率与随机信道特性相适应。本文针对TWRC提出了联合速率自适应和软网络编码的方案,结果显示在中上的信噪比范围内能达到与传统网络编码几乎相同的信道容量,误码性能稍有损失却可以降低中继节点的计算复杂度和功耗,而且每个移动源节点可以根据当前信道确定合适的编码调制方式,能够适合不同的传输质量需求,在保持较低的误比特性能的同时,尽可能提高信道容量,从而使性能得到优化。

参考文献

[1]AHLSWEDE R,CAI N,LI S Y R,et al.Network infor-mation flow[J].IEEE Transactions on information Theory,2000(46):1024-1016.

[2]LI S Y R,YEUNG R W,CAI N.Linear network coding[J].IEEE Transactions on Information Theory,February,2003,49(2):371-381.

[3]WU Yun Nan,CHOU P A,KUNG S Y.Informationexchange in wireless networks with network coding andphysical-layer broadcast[C]//2005 Conference on Informa-tion Sciences and Systems,The Johns Hopkins University,March 16-18,2005.

[4]PARK M,KIM S L.A minimum mean-squared errorrelay for the two-way relay channel with network coding[J].IEEE Communication Letters,2009,13(3):196-198.

[5]KIM Y,VECIANA D G.Is rate adaptation beneficial forinter-session network coding[J].IEEE Journal on SelectedAreas in Communications,2009,27(5):635-646.

[6]THOBABEN R.Joint network/channel coding for bandwidth-efficient multiuser ARQ[J].in Proc.IEEE Signal Process-ing Workshop on Signal Processing Advances in WirelessCommunications(SPAWC),Perugia,Italy,June 2009.

遗传算法编码策略研究 篇6

关键词:遗传算法,编码策略,二进制码,格雷码

遗传算法是—类借鉴生物界自然选择和自然遗传机制的自适应全局优化概率搜索算法, 它起源于60年代对自然和人工自适应系统的研究, 主要特点是群体搜索策略和群体中个体之间的信息交换和搜索不依赖于梯度信息, 它尤其适用于处理传统搜索方法难于解决的复杂和非线性问题。作为一种全局优化搜索算法, 以其简单、通用、较强的自适应性和鲁棒性, 以及适于并行处理等特点, 被广泛应用于组合优化、机器学习、自适应控制、规划设计和人工生命等领域[1]。

按照遗传算法的工作流程, 当用遗传算法求解问题时, 必须在目标问题实际表示与遗传算法的染色体位串结构之间建立联系, 即确定编码, 遗传算法以决策变量的编码作为运算对象, 三种基本的遗传算子的选择和设计都依赖于编码的方式[2], 编码策略对于遗传算子, 尤其是对交叉和变异算子的功能和设计有很大的影响。编码作为遗传算法流程的第一步, 在遗传算法中起着重要作用, 因而提出了许多不同的编码方法[3]。

主要分析了两种主要的编码方式 (二进制码和格雷码) 自身具有的特点, 以及这些特点对于算法的搜索能力的影响。

1 遗传算法流程

遗传算法将m维决策向量X=[x1, x1, …, xm]T用m个记号Xi (i=1, 2, …, m) 所组成的符号串来表示:

X=XiX2…Xm⇒X=[x1, x1, …, xm]T

把每一个Xi看作一个遗传基因, X就可以看做是由m个遗传基因所组成的一个染色体。—般情况下, 染色体的长度是固定的, 但对于一些问题m也可以是变化的, 根据不同的情况, 等位基因可以是一组整数, 也可以是某一范围内的实数值, 或者是一个纯粹的记号。最简单的等位基因是由0和1这两个整数组成的, 相应的染色体就可表示为一个二进制符号串。这种编码所形成的排列形式X是个体的基因型, 与它对应的X值是个体的表现型。对于每一个个体X, 要按照一定的规则确定出其适应度, 个体的适应度与其对应的个体表现型X的目标函数值相关联, X越接近于目标函数的最优点, 其适应度越大;反之, 其适应度越小。

遗传算法中, 决策变量X组成了问题的解空间, 对问题最优解的搜索是通过对染色体X的搜索过程来进行的, 由所有的染色体X就组成了问题的搜索空间。遗传算法的运算对象是由N个个体所组成的集合, 称为群体, 遗传算法的运算过程也是一个反复迭代过程, 第t代群体记做P (t) , 经过一代遗传和进化后, 得到第t+1代群体, 它们是由多个个体组成的集合, 记做P (t+1) , 这个群体不断地经过遗传和进化操作, 并且过次都按照优胜劣汰的规则将适应度较高的个体更多的遗传到下一代, 这样最终在群体中将会得到一个优良的个体X, 它所对应的表现型X将达到或接近于问题的最优解X*。

2 编码策略

编码策略是设计GA的一个重要步骤。三种基本GA算子的选择和设计都依赖于编码的形式。编码成为GA应用中的首要问题, 因而对编码策略的研究也成为研究GA的热点之一, 见表1。

3 编码分析

以前对编码策略的研究, 多以仿真对比来说明不同编码策略对算法的影响。并没有从编码本身的区别上说明原因。Schraudolph的动态编码研究、Goldberg双倍体编码分析等研究就属于此类。对编码本身特点的分析是设计遗传基本算子的基础, 因此, 结合遗传算子分析编码的本身特点来研究。

3.1 二进制码分析

个体编码长度主要由搜索空间和问题精度要求决定。一般函数优化问题的编码精度是唯一的, 考虑到实际应用中, 不同决策变量可能有不同的精度要求, 因此, 将编码长度的结论扩展到多精度的情形。

定义决策变量个数为m, 变量xi (i=1, 2, …, m) 满足xi∈[ui, vi], xi的搜索精度为δi, 即:

∀变量xi的两个值xundefined, xundefined∈[ui, vi], 如果|xundefined-xundefined|<δi/2, 则认为xundefined=xundefined, 则有:

undefined

二进制编码不能保持群体稳定性。这是由于个体和编码之间的映射关系决定的。即对于任意给定的第t代第i (i∈{1, 2, …, n}) 个个体的二进制编码Xundefined, 如果只变异一位, 产生新个体X*t, 不妨假设第k (k∈{1, 2, …, m}) 个变量xk发生变异, 且第k个变量的编码长度为l, 定义变异前后个体的差异为s, 记第k个变量发生变异前后两个个体的数值差为sk:

undefined

则s的最大值为:

undefined

s的最小距离为:

undefined

以上说明了对于二进制编码, 变异操作不能保证父个体与新个体充分接近。即编码相近, 但个体未必相近, 这就导致了变异后的个体与原个体的差异不可预估, 种群的稳定性较差。但是这个结论只说明了编码相差1位的个体的数值差的最大和最小值, 通过下面的分析, 将给出编码差异和数值差所有可能的对应关系, 首先考虑只有一个连续变量x的情形, 多变量编码时可以通过简单的组合得出类似结论。变量x满足x∈[u, v], 在搜索精度δ时, 根据 (1) 式得出的编码长度为l, 变量x对应的编码用X表示, 对二进制编码而言, 采用B表示, 设二进制编码B可以表示为:B=blbl-1…b2b1 (其中bi, i=1, 2, …, l∈{0, 1}) 。任给变量x的两个相异值x1、x2, 他们分别对应的编码是B1、B2。

由二进制数和整数之间的转换公式知, 二进制编码从高位到低位的权值依次为:2l-1, 2l-2, …, 2l, 20。则有个体x的编码B=blbl-1…b2b1对应的解码公式是:

undefined

其中, undefined。

数值差异为:

dx (x1, x2) =round (|x1-x2|/δ) (5)

其中, round () 表示就近取整函数。将解码公式 (4) 代入式 (5) 得:

undefined

式 (6) 可以看作二进制码对应的数值差异定义, 可以看出编码精度和变量的取值区间已经对数值差异不存在影响。编码差异用dH (X1, X2) 表示, 定义为两个编码X1、X2的海明距离 (Hamming Distance) 。对于二进制码, 编码差异为:

undefined

[定理1]当dH (B1, B2) =1时, 如果固定其中一个个体编码B1, 则有:

1) B2存在的种类个数为Cundefined=l;

2) dx (x1, x2) 的可能取值分别为2l-1, 2l-2, …, 2l, 20;

3) P{dx (x1, x2) =2k-1}=1/l (8)

其中 (∀k∈{1, 2, …, l})

证明:undefined

又∵bi, i=1, 2, l∈{0, 1}

∴∃唯一的k (k∈{1, 2, …, l}) ,

undefined

(8) 代入 (6) 得:

undefined

再由k在集合{1, 2, …, l}内取值的任意性知 (8) 式成立。

下面以十进制数0~7的数值差异 (数值差) 和二进制编码差异的对比为例来说明以上结论, 见表2, 其中, 表的首行和首列的数据格式为“个体数值/二进制编码”, 表内的数据格式为“数值差异/编码差异”。从表中得不出数值差异和编码差异的有规律性的联系。但是从式 (10) 可得如下结论:编码差异为1的两个个体的差值可能为{4, 2, 1}, 或者表示为{23-1, 21, 20}。即, 一发生变异产生的新个体与父个体的数值差异是无法预估的。表2的*部分就说明了这一点。

二进制编码因为具有编解码操作简单易行、遗传操作便于实现、符合最小字符集编码原则、便于利用模式定理对算法进行理论分析等优点而得到广泛的应用。但是, 由于二进制编码使得编码差异的大小不能代表数值差异的大小, 导致变异算子的局部搜索能力不足。

3.2 格雷码分析

二进制编码不便于反映所求问题的结构特征, 对于一些连续的函数优化问题等, 也由于遗传运算的随机特性而使其局部搜索能力较差。为改进这个特性, 人们提出了格雷码 (Gray Code) 来对个体进行编码。例如, 十进制数0~7之间的二进制码和相应的格雷码见表3。

格雷码是这样的一种编码方法:其连续的两个整数所对应的编码值之间仅仅只有一个码位是不相同的, 其余码位都完全相同。

假设个体x的二进制编码为B=blbl-1…b2b1, 其对应的格雷码为G=glgl-1…g2g1 (gi, i=1, 2, …, l∈{0, 1}) 。由二进制编码到格雷码的转换公式为:

undefined

由格雷码到二进制编码的转换公式为[5]:

undefined

上面两种转换公式中, ⊕表示异或运算符。

格雷码的编码差异同样用编码的海明距离来表示:

undefined

[定理2]dx (x1, x2) =1⇒dH (G1, G2) =1 (14)

证明:由dx (x1, x2) =1及 (6) 得:

undefined

并且bi, i=1, 2, …, l∈{0, 1}, 不妨设x1>x2, 并令两个个体的二进制编码B1和B2的编码存在差异的最高位是k (其可能取值范围为k∈{1, 2, …, l}) , 则有:

undefined

(16) 代入 (11) 并由gi, i=1, 2, …, l∈{0, 1}得:

undefined

由式 (17) 代入式 (13) 得,

undefined

下面以整数0~7的格雷码编码为例, 分析一下数值差异 (整数值的差) 与海明距离的关系, 见表4。其中, 表的首行和首列的数据格式为“个体数值/格雷码”, 表内的数据格式为“数值差异/编码差异”。

从表4的*部分可知, 数值差异为1时, 其编码差异全部是1, 验证了 (13) 的成立。从定理2可以看出, 格雷编码方式使相近个体具有相似编码, 这是采用格雷码的遗传算法局部搜索能力强的原因。类似于上面的分析, 可以给出数值差异为任何一个值时的编码差异。但是, 从遗传算法的运行过程可知, 需要的编码方式是满足编码相似可以推导出个体相近的编码策略。定理2表明了格雷码数值差异和编码差异的关联性要好于二进制码。

4 结论

主要分析了两种主要的编码方式 (二进制码和格雷码) 自身具有的特点, 以及这些特点对于算法的搜索能力的影响。这种分析方法也适用于十进制编码和符号编码, 但浮点数编码不同于二进制码等编码方式, 需要结合具体的遗传算子通过搜索能力的对比, 来分析浮点数编码和其他编码方式对某一类问题的优劣对比。通过分析个体差异和编码差异的关系, 得出了格雷码的一些有利于遗传算法局部搜索的特性, 这是格雷码得到广泛应用的原因。

参考文献

[1]Chao Chen, Jianghai Xia, Jiangping Liu, GuangdingFeng.Nonlinear inversion of potential-field data usinga hybrid-encoding genetic algorithm[J].Computers&Geosciences, 2006, 132 (2) :230-239.

[2]李敏强, 寇纪淞, 林丹, 李书全.遗传算法的基本理论与应用[J].北京:科学出版社, 2002.

[3]Alan Crispin, Paul Clay, Gaynor Taylor etl.Genetic Algo-rithm Coding Methods for Leather Nesting[J].AppliedIntelligence 23, 0-20, 2005.

[4]Serkan Bekiro lu, Tayfun Dede, Yusuf Ayvaz.Implementation of different encoding types on structural optimiza-tion based on adaptive genetic algorithm[J].Finite Ele-ments in Analysis and Design, 2009, 45 (11) :826-835.

[5]Ying-Hua Chang, Young-Chang Hou.Dynamic pro-gramming decision path encoding of genetic algorithms forproduction allocation problems[J].Computers&Indus-trial Engineering, 2008, 54 (1) :53-65.

自编码算法 篇7

编码感知路由是指在路由协议中引入的编码感知技术。就是检测路径上的类COPE编码结构, 引导数据流之间形成有效的编码双向流, 并试图主动去构造编码机会。该方法在一定的场景中能有效的提高吞吐量, 但是网络中的其他流量因素还值得进一步考虑:网络流的长度对网络吞吐量的影响有至关重要的作用, 盲目地选择具有编码结构的路径有时反而造成吞吐量的下降;动态管理编码侦听缓存报告, 进一步减少信令开销。

2 编码感知的机会路由

机会路由的特性是通信节点对当前数据包不明确指明下一跳中继节点, 而是在下一跳节点集中选取一个最佳的接收节点作为下一跳节点。编码感知的机会主义路由是在下一跳节点集中选取具有较高编码机会的节点作为下一跳转发节点, 能够提高编码机会, 从而带来吞吐量的提升。

推送节点集是机会主义路由当中的重要概念。在推送节点集中所有节点都会收到当前节点发送的数据, 但只有该集合中的一个节点会对数据处理, 继续推送转发。在推送节点集中各节点之间的协调十分关键。对于推送节点集中的节点选取规则如下:与目的节点比较接近的或者通信质量较好的节点, 可以用路由判据ETX的值来衡量;距离发送节点一跳范围内的节点;在推送节点集中的节点必须要能相互侦听。节点发送数据时, 在数据包头部加入推送节点集合列表, 节点的顺序会根据其到目的节点的距离来排列。

3 速率自适应的协作网络编码

如果出现链路不对称情况, 将会导致网络编码的性能下降, 相比于没有使用网络编码的普通网络传输机制, 性能的提升十分有限。因此在编码感知的同时, 加入对不同链路速率的感知, 可以有效的调整编码策略, 避免链路不对称数据流编码。

在图1 (a) 所示的单速率网络当中, 若节点1发送数据给节点4, 则经过路径为1-2-3-4。如果在网络中加入新数据流, 则从节点5发送数据到节点2, 并通过编码感知的技术, 可以选择路径5-4-3-2, 而在节点3上产生编码机会, 从而改善网络的吞吐量。但在实际网络中, 例如802.11无线网络就允许不同链路有不同的传输速率。在图1 (b) 所示当中, 每条边中的数字表示该链路最大传输速率和此时可用的传输带宽, 单位为Mbps。假如当没有网络编码的时候, 节点5此时则会选择路径5-4-6-2来传输数据。若考虑流内干扰竞争, 此时两条流总共的最大的吞吐量为1.5Mbps。当采用一般的编码感知技术的时候, 通过路径5-4-3-2传输数据, 节点3只能使用2Mbit/s的速度进行编码广播, 且这两条流的吞吐量仍为1.5Mbps, 与没有编码的方法吞吐量相同。当源节点和目的节点之间的信道质量变差时, 使用另一个与目的节点之间具有较好信道质量的节点来协助源节点向目的节点发送数据。协作链路的加入, 充分利用了空间分集和用户分集, 增加了系统容量。在图1 (b) 中, 若在节点6中进行编码中继, 仍然使用路径5-4-3-2进行传送数据, 此时两条流的吞吐量为2Mbps, 吞吐量提升了33.3%。可见, 在实际的多速率网络中权衡非平衡传输特性, 使用这种合作编码技术能有效提升网络吞吐量。

参考文献

[1]岩延, 张宝贤, 马建.基于网络编码的无线网络路由协议[J].中兴通讯技术, 2009, 15 (6) :1-4.

[2]樊凯, 李令雄, 龙冬阳.无线mesh网中网络编码感知的按需无线路由协议的研究[J].通信学报, 2009, 30 (1) .

上一篇:时尚潮流下一篇:计算机教学策略