小波视频编码器

2024-08-17

小波视频编码器（精选7篇）

小波视频编码器篇1

1 引言

为适应复杂多变的异构环境,视频编码引入了可分级编码的概念,可分级视频编码(Scalable Video Coding,SVC)可以使视频流较好地适应各种不同的网络环境和用户终端,并具有一定的容错性和可分级性。但在现有的视频编码标准中,采用的都是基于运动补偿的分块离散余弦变换(Discrete Cosine Transform,DCT)编码技术,其运动预测环路中的递归结构,易在编解码器间产生漂移,使得解码后的视频图像具有明显的块效应和飞蚊噪声,降低了编解码器的性能。基于运动补偿时域滤波技术和小波变换的可分级编码方案采用了开环结构并克服了块效应,其较好的可分级能力,受到广泛关注[1]。

2 小波图像编码

目前小波已经在二维图像压缩中显示了优势,并且正在被越来越多地运用于三维图像压缩。小波在图像编码问题中之所以有吸引力,是因为解码器对收到的码流进行图像重构时,有较好的率失真性能,并具有以下良好的特性[2]:1)信号能量大多分布在低分辨力的子带上,因为大部分图像本质上都是低通的;2)高频子带上的系数大都为零;3)小值或者零值的系数(即不重要的系数)聚集在一个给定的子带上;4)在一个子带上的不重要系数串和相同方向的下一高分辨率子带上的相似串有相同的相关位置。

小波图像编码的基本思路是,经过离散小波变换(Discrete Wavelet Transform,DWT)之后,系数值是由符号和幅度构成,且分别对符号和幅度进行编码。当所有系数的幅度值的大多数重要的比特被编码时,系数的幅度通过比特面编码(bitplane coding)逐步近似得到。而比特面编码由两个编码通道实现———有效值通道和精细值通道。本质上,有效值通道描述的是在离散小波变换中,对所有系数保持非零比特的第一比特面;而精细值通道是在最重要的非零系数编码后,产生对每个系数的连续逼近。有效值通道是通过对系数的有效值映射(significance map)进行连续的编码,其系数是偏离阈值较远的;基于小波的编码器之间的主要区别就是在于怎样执行有效值映射编码[2],根据执行的策略不同,可以分为零树(Zerotrees)、集合分裂(Set partitioning)、条件编码(Conditional coding)等3种编码策略,如表1所示[2]。

1993年,J.M.Shapiro提出的嵌入式零树小波(Embedded Zerotree Wavelet,EZW)算法[3],是小波视频编码中最经典的算法。EZW利用小波图像中各级子带间的相似性,对系数按重要性进行排序,然后对系数进行逐级量化,最终得到按系数重要性排序的比特流。1996年,A.Said与Pearlman提出的集合分裂零树(Set Partitioning In Hierarchical Trees,SPIHT)算法[8],也是基于树的结构的算法,而且其效率要优于零树编码算法,是对零树编码的更一般化的表述,并且被认为是目前效率较高的算法之一。SPIHT算法不仅采用了树的结构,还提出了集合的概念,把两者结合起来对小波系数进行描述,并根据其重要性进行标记。若一棵树里的每个系数都是不重要的,则这颗树的集合就用一个比特表示;若有重要系数,则对构成这棵树的小波系数所形成的集合进行划分,划分成几个单独的系数和一个子集合,进行反复判断直到不再有集合,编码结束。它更加合理地利用了小波分解后的多分辨率特性,即使不采用算术编码器进行熵编码,编码效率仍然很高。

1999年,A.Islam和W.A.Pearlman提出了集合分裂嵌入块(Set Partitioning Embedded Block Coder,SPECK)算法[5]。EZW算法和SPIHT算法主要是利用树结构来表示不重要系数的,但没有充分利用同一子带中不重要系数的相关性。SPECK利用零树和方向树结构表示这些不重要系数,可以充分利用同一子带中不重要系数的相关性,消除块间冗余。SPECK算法是继EZW算法、SPIHT算法后性能更好、速度更快的一种图像压缩算法。SPECK算法采用易于计算和并行处理的块结构,提高了编码速度;动态存储需求小,有较强的容错性;因为块间独立编码,传输错误时只影响误码所在块[9]。

另一种利用子带内部相邻节点之间关系的编码策略扩张了条件编码策略,即使用基于上下文模型的块编码。Taubman在2000年提出了优化截断点的嵌入块编码(Embedded Block Coding with Optimized Truncation,E-BCOT)算法[10],同时提出了一种被称为压缩后率失真(post-compression rate-distortion,PCRD)的优化算法。EBCOT产生的码流具有分辨率可分级性、SNR可分级性、支持随机访问处理等特性;另外,由于EBCOT码流采用的是独立分块编码方法,所以其抗误码能力强[11]。因此EBCOT最终成为新一代静止图像压缩标准JPEG2000的核心算法。

传统小波变换采用的是卷积运算方法,过程复杂,运算量大,实时性差,不利于硬件实现,且不能对所有尺寸图像进行变换,因此在JPEG2000中采用了小波提升算法[12],该算法不仅具有原来小波变换的优点,还可以实现更快速的小波变换算法;可以实现完全的同址运算;正变换和反变换仅有正负号的区别;描述非常简单,可以避免使用傅立叶变换。

3 小波视频编码

目前基于小波的视频编码技术还不像图像编码技术那么成熟,也没有形成相应的标准,很多问题还有待于进一步研究。虽然由基于块的运动估计(Motion Estimation,ME)和运动补偿(Motion Compensation,MC)在离散余弦变换(DCT)之后的反馈回路的传统视频结构仍然广泛使用在现代视频压缩系统中,但小波视频编码技术仍然受到广泛关注。从运动补偿的角度,可以分为两类,即基于传统运动估计与运动补偿(ME/MC)的小波视频编码方法和基于运动补偿时域滤波(Motion-Compensated Temporal Filtering,MCTF)技术的小波视频编码方法。同时从时间域处理的顺序来看,第一类方法,有ME/MC+2D-DWT和2D-DWT+ME/MC两种实现方式;第二类方法也可分为MCTF+2D-DWT和2D-DWT+MCTF两种实现方式。

3.1 基于ME/MC的小波视频编码技术

在视频中,相邻帧之间的一些变化是由场景内各物体的变化产生的,检测物体的运动参数,并通过运动参数从前一帧预测当前帧,这就是运动补偿预测,简称运动补偿,而其中最主要的就是检测物体的运动参数,即运动估计。ME/MC+2D-DWT方式,就是在传统的ME/MC反馈回路中使用离散小波变换,替换原来的DCT,即先采取空域ME/MC消除时间冗余,而后对运动估计预测残差帧进行小波变换,以去除空间冗余。该方案使用一个冗余变换以提供小波域的ME/MC处理的必要平移不变性,并使用重叠块运动补偿技术以降低块效应,改善视频编码器的性能[13];该方案和传统可分级编码相比,优势是可以提供空域可分级等多种可分级方式[14]。

而2D-DWT+ME/MC方式是先对视频帧进行二维小波变换,然后在小波变换域进行运动估计以去除时间冗余,最后再对运动估计预测残差进行编码。该方案的特点是,由于小波具有良好的多分辨率特点,很容易在小波变换域中进行多分辨率运动估计(Multi-resolution Motion Estimation,MRME),而同传统的时域运动估计方法相比,这种方案可以节省大量的搜索时间[14]。

3.2 基于MCTF方法的小波视频编码技术

传统的ME/MC反馈回路影响了视频编码器的可分级性能,目前基于开环回路(open-loop)的MCTF小波视频编码方法受到广泛关注。MCTF主要基于帧间小波变换和提升结构,在可分级视频编码系统中,MCTF是一个重要组成模块,它能有效地实现时间(帧速率)的可分级性。在一般的MCTF分解中,MCTF对若干连续的视频帧组成的GOP进行时域分解形成时域小波树,其中源视频帧通过时域滤波形成高频和低频帧,通过时域分解形成了两组正交视频子序列:低频子序列和高频子序列。如图1所示[2],是基于Haar的MCTF,描述的是三级时域分解。

大部分基于MCTF的编码器都是先对空域帧使用MCTF,其后再对每个时域子带进行二维DWT。这通常被称为帧间小波滤波编码系统,即“MCTF+2D-DWT”方案。帧间小波滤波编码步骤[15]:1)对一组连续图像进行时间维滤波;2)再对滤波后的数据进行空间二维小波分解;3)对变换后的小波系数进行熵编码。帧间小波滤波编码由于经过了时间维滤波,所以视频帧之间的关系是交互的,不存在单一关键帧的概念。

该方案的优点是对在运动图像中,各图像中包含的运动轨迹之间的冲突进行处理,以降低残差帧信号,提高编码效率。并且应用该方案小波编码技术所获得的编码质量和H.264编码器最优化编码效果非常接近;并且该方案可以提供码流的可分级性[16]。但是该方案中,若运动补偿是在不同分辨率下进行编解码,则会造成所谓的子采样相位漂移(sub sampling phase drift),且会降低运动补偿效率。

另一种基于MCTF的方法是先进行二维DWT,然后再在小波域帧中进行MCTF。这通常被称为小波子带预测编码系统,即“2D-DWT+MCTF”方案。小波子带预测编码主要步骤[17]:1)对每一帧图像进行二维空间小波变换;2)再对所得的各子带小波系数值进行帧间预测去处冗余;3)对变换后的小波系数进行熵编码。整个处理流程是分子带进行的,子带与子带之间互不影响。

该方案的优点是运动补偿是在各级小波子带中进行,使得小波本身多分辨率特点解决了MCTF+2D-DWT结构问题,使得空间可分级性能增强;并且该方案中的运动估计精度是自适应的,各个子带采用不同的运动估计块尺寸,对最低级的分辨率使用最粗糙的运动估计,反之则提高运动估计的精度[16]。但因为运动部分的系数模式在连续帧间是变化的,导致在严格采样细节子带中的运动估计是不可靠的;并且2D-DWT+MCTF方案比MCTF+2D-DWT的编码性能低,特别是在较高分辨率下[18]。

3.3 MPEG小波可分级视频编码模型

2004年10月,ISO/MPEG选择德国HHI(Heinrich Hertz Institute)图像通信小组提出的基于运动补偿时域滤波技术的H.264/MPEG-4 AVC可分级视频编码扩展方案[19]作为基础,开始制定新的可分级视频编码标准[20],2007年已完成该标准的草案工作。然而,基于传统技术改进的可分级视频编码方案目前还没有得到工业界的广泛认可,因此在对HHI方案测试完善的同时,ISO MPEG组织将小波可分级视频编码技术作为将来长期的目标来研究,并以微软亚洲研究院等研究机构和公司提出的方案为基础,建立了小波可分级视频编码参考模型和参考软件[1],对小波可分级视频编码技术进行更加深入的研究。

MPEG WSVC参考模型(VidWav)如图2所示[18],其主要组件有:1)运动估计和编码(Motion Estimation and MV&Mode Coding):运动估计采用H.264/AVC的宏块分割模式,支持多种块结构的预测,运算精度能精确到1/4像素。对于运动模式、运动矢量及运动补偿中非连接块的标识采用H.264/AVC中的可变长编码方式;2)时域变换(Temporal Wavelet Decomposition):时域变换模型实现一个在提升结构中的帧方法运动补偿(或者运动排列(aligned))小波变换;3)空域变换(Pre(Post)-2D Spatia Wavelet Decomposition):这里允许实现MCTF+2D-DWT和2D-DWT+MCTF方案,但是不同的空域分解有着不同的编码效率;4)熵编码(Entropy Coding):在空域-时域模块之后,系数由三维EBCOT编码,每个空域-时域子带被分解为三维块分别独立进行编码。

4 小结与展望

由于传统的小波基不能同时具有正交性、正则性、高消失矩、紧支性和对称性等特性。此外,DWT还有变化敏感、方向性差、没有相空间信息,运算复杂,数据冗余多等缺陷。研究人员也提出了许多对小波视频编码的改进方法,如文献[21]提出了基于冗余离散小波变换(RDWT)平移不变特性的LBS(Low-Band-Shift)方法,该方法利用参考帧的RDWT多相位子带提高运动补偿的效率,使小波域中的运动补偿效率得到了较大的提高。再如复数双树离散小波变换(dual-tree discrete wavelet transform,DDWT)形式下的MCTF方法。三维条件下,DDWT是一种冗余变换,产生4倍于离散小波变换的子带数量,每个子带位于不同的时空方向上。当应用于视频信号时,这些定位能帮助运动到不同方向的图像特征孤立起来,提供固有的运动选择性。Geronimo等人应用分形插值的方法构造出著名的GHM多小波[22],这种多小波能同时兼顾正交性、正则性、高消失矩、紧支性和对称性等特性。多小波变换理论的提出,为视频可分级编码方案提供了一种新的思路。研究人员已提出将多小波变换与多描述编码技术、多分辨率运动估计及快速运动估计技术相结合,应用于可分级视频编码[23,24];文献[25]则对三维多小波视频编码技术进行了分析。

笔者等人提出了一种基于MCTF的多小波视频编码方案,取得了较好的编码效果[26,27]。但在研究过程中,发现多小波变换虽然具有很多优势,但其运算复杂度较高,从而制约了多小波的推广应用;如何构造适合于视频图像编码的多小波的提升算法,降低复杂度是一个亟待解决的问题;针对现有多小波变换编码无法有效地逼近(刻画)图像或视频中多方向信息的缺陷,如何构建一种新的自适应方向多小波变换框架是一个值得深入研究的问题;如何将多小波变换与其他优秀的嵌入式编码算法结合,寻找一种更优的多小波嵌入式图像编码算法;为了满足工业化的需要,对多小波的视频图像编码算法进行优化使其易于硬件的实现,这也是有待进一步研究的关键问题。

摘要：主要对小波图像视频可分级编码方法进行了分析和评述,并探讨了目前小波可分级视频编码技术的研究热点和今后的发展方向。

关键词：小波,可分级,视频编码

基于小波变换的遥感图象编码研究篇2

近些年, 遥感技术在不断的发展, 对于遥感图象的压缩效果的要求也逐渐提高, 但是由于遥感图象分辨率高、相关性弱、纹理丰富复杂、信息量大、码速率高, 为了达到较好的压缩比和失真度并满足数据传输与存储的需要, 产生了多种压缩方法, 但是各种方法都各有利弊, 都不能真正地达到对压缩效果的要求, 自此, 小波变换应运而生。

本文在分析了小波变换的特点的基础上, 充分发挥小波变换的潜能, 并结合SPIHT算法对分辨力人群、候机楼等多幅遥感图象进行压缩。

1 小波变换

与以往的压缩算法编码过程相比, 基于小波变换[1, 2]的编码过程如图1所示。

2 压缩编码

目前, 常见的小波变换系数量化方式最为突出的是嵌人编码方法, 包括EZW[4] (Embedded Zero-tree Wavelets) 算法、SPIHT[3,5] (Set Partitioning In Hierarchical Trees) 算法、EBCOT[6] (Embedded Block Coding with Optimization Truncation) 算法。其中, EZW算法和SPIHT算法都是基于空间小波方向树的, 本文采用SPIHT算法。

Said和Pearlman于1996年提出了著名的多级树集合分裂算法 (SPIHT) , 该算法通过一系列的集合分裂来实现对小波系数类型的分类, 另外还引入链表来记录前面搜索获得的系数和集合的信息。SPIHT算法的核心也是基于低频子带的系数相对于某一阈值是次要的, 则高频子带系数相对于这一阈值在很大概率上也是次要的这个假设, 所以SPIHT是EZW的一种改进。SPIHT方法的基本要素包括:1) 依据系数幅值对不重要系数集合进行分裂的分类算法;2) 位平面的渐进有序发送;3) 利用频带间的自相似性构造零树。

在SPIHT算法中, 总共需要定义3种链表:非重要集合链表 (LIS) 、重要像素链表 (LSP) 、次要像素链表 (LIP) , 算法相对于每一个阈值都需要分两步:扫描过程和细化过程。

3 实验结果与分析

实验对分辨力人群的遥感图象, 大小为256×256。对测试图像, 首先采用3级小波分解, 再分别用EZW算法和SPIHT算法进行仿真实验, 实验数据如表1所示。

从表1可以看出, 无论bpp在多大的情况下, SPIHT算法与EZW算法相比较, 峰值信噪比 (PSNR) 都有得很大提高, 最多可提高7.48, 平均提高6.57, 编码时间和解码时间也都提高7倍左右。

4 结论

本文采用小波变换与SPIHT算法相结合, 对遥感图象进行压缩, 并进行了仿真实验, 实验证明, 此方法相对于传统的小波压缩算法有较高的PSNR值, 压缩和解压的时间都有所提高, 而其重构图像的人眼视觉质量较好。

参考文献

[1]杨建国.小波分析及其工程应用[M].机械工业出版社，2005：6-33.

[2]Rafael C.Gonzalez，Richard E.Woods.阮秋琦，阮宇智.数字图像处理[M].电子工业出版社，2003：327-334.

[3]柯丽.基于小波变换的空间遥感图像实时压缩方法研究[D].中国科学院博士论文.

[4]J.M.Shapiro.Embedded Image Coding Using Zerotrees of Wavelet Coefficients.IEEE Trans.on Signal Processing，1993，41 (12) ：3445-3462.

[5]A.SaidW，A.Pearlman.A New Fast and Efficient Image Codec Based on Set Partitioning in.Hierarchical Trees.IEEE Trans on.Circuits and System For Video Technology，1996，6 (3) ：243-248.

全新的视频编码器篇3

全新的视频编码器AXIS M7016和AXIS P7216能够更加经济有效、更加灵活地将模拟系统改造成为网络视频解决方案。这两款16信道的视频编码器产品可在所有分辨率下提供全帧速率, 并且提供单一以太网端口用于所有16个信道, 安装十分简便。

安讯士网络通讯公司 (Axis Communications) 推出了视频编码器系列中的两款新产品。具备全帧速率的AXIS M7016可经济有效且非常简便的实现网络视频改造, 而灵活的AXIS P7216则可提供音频, I/O, 并配备了一个SFP插槽用于光纤连接。SFP插槽还可用于网络冗余。若SFP模块发生故障, 则数据流量将自动切换至以太网端口。这些全新的视频编码器产品可满足中小型安装项目的需求, 例如零售行业的部分项目。

安讯士网络通讯有限公司 (Axis Communications) 解决方案经理邹毓帆表示:"我们成功的视频编码器系列新增的这两款产品, 能够为更多的用户将模拟系统改造成为数字解决方案。同时, 我们十分注重降低成本, 以便这两款新产品能够在市场上更具吸引力。此外, 我们还增加了一些实用的功能。AXIS M70系列现在也能够提供全帧速率, 因此可实现流畅的视频监控体验。而AXIS P72系列能够提供视频和音频两种数据流, 是十分灵活和优异的产品。"

两款全新的视频编码器产品均带有电源, 可提供H.264和Motion JPEG同步数据流, 并配备了四个Micro SD卡槽, 能够支持最高64GB的内存卡 (产品不含内存卡) 。

AXIS M7016 and AXIS P7216通过安讯士应用软件开发合作伙伴计划 (ADP, Application Development Partner Program) 得到了业界最广泛的视频管理软件的支持, 并且安讯士自有监控软件平台 (AXIS Camera Station) 的支持。此外, 这些视频编辑器可支持AXIS Camera Companion, 安讯士视频托管系统 (Hosted Video) 以及ONVIF网络视频产品互操作性规范, 可轻松实现摄像机系统整合。

小波视频编码器篇4

小波变换在时域和频域具有良好的局部特性,具有描述非平稳图像信号的能力和适应人眼视觉特性的良好性能,成为现代图像编码领域研究的热点之一,在图像编码领域获得了广泛的应用。

1零树小波编码算法分析与实现

JPEG2000不仅适于静图像的压缩,也适于电视图像序列的帧内图像的压缩编码。JPEG2000主要有以下特点:1) 高压缩率。2) 同时支持有损和无损压缩。3) 支持“感兴趣区域”。

JPEG2000采用的是小波变换算法。小波变换的基本思想是用一组小波或基函数表示一个函数或信号。小波提升的核心是更新算法和预测算法,通过预测算法可以得到高频信息,根据更新算法可以得到正确的低频信息。

小波变换把图像分解成各种子带的方法有很多种。例如,均匀(uniform decomposition),非均匀分解(non-uniform decomposition),八带分(octave-band decomposition)和小波包分解(wavelet-packet decomposition),根据不同类型的图像选择不同小波的自适应小波分解。其中,八带分解是使用最广泛的一种分解方法。这种分解方法属于非均匀频带分割方法,它把低频部分分解成比较窄的频带,而对每一级分解的高频部分不再进一步分解。

1.1零树定义和系数分类

小于阀值的小波系数称为次要系数;如果最低分辨率上的系数,即所有高频小波系数的父系数大于阀值,那么该系数就成为主要系数。如果小波系数小于阀值,那么同一方向上相同位置上的子系数也可能是次要的。如果父系数小于阀值,而其子系数中有大于阀值的系数,那么该系数被称为孤立系数。下面是如何得到阀值的方法:

T0=2log2(max(|Xi|))

其中,max表示最大的系数值Xi,表示小波变换分解到第i级时的系数。以后每扫描一次,阈值减少一半。

1.2零树小波编码算法分析

EZW算法可归纳为下面几个主要步骤:1) 阈值T的选择,开始时阈值T0通常按上节公式T0=2log2(max(|Xi|)估算,每扫描一次,阈值减少一半。2) 给系数分配符号,使用EZW算法编码图像时每一次扫描需要执行两种扫描,第一种扫描叫做主扫描(Dominant Pass),它的任务是把小波系数X与阈值T进行比较然后指定一个符号,我们把这种符号叫做系数符号。对整幅图像扫描之后产生系数符号序列。

第二种扫描叫做辅扫描(Subordinate Pass),其任务是对主扫描取出的带有符号P或者N的系数进行量化,产生代表对应量化值的符号“0”和“1”,我们把这种符号称为量化符号。

主扫描:扫描每一个系数以产生系数符号。如果系数幅度大于阈值T且为正数,输出符号P;如果系数幅度小于阈值T且为负数,输出符号N;如果系数是零树根,输出T;如果系数幅度小于阈值但树中有大于阈值的子孙系数,输出孤立零符号Z。为了确定一个系数是否为零树根T或者是孤立零Z,需要对整个4叉树进行扫描,这样就需要花费时间。此外,为了保护已经被标识为零树的所有系数,需要跟踪它们,这就意味需要存储空间来保存。最后要把绝对值大于阈值的系数取出来,并在图像系数相应的位置上填入一个标记或者零,这样做可防止对它们再编码。

辅扫描:量化带符号P和N的系数。在量化系数之前要构造量化器。量化器的输入间隔为(Ti-1,2Ti-1),该间隔被1.5Ti-1分成两部分:(Ti-1,1.5Ti-1)和(1.5Ti-1,2Ti-1),量化间隔为0.5Ti-1,其中i为第i次编码。量化器的输出为量化符号“0”和“1”,“0”对应量化值为(1.5-0.25)Ti-1,“1”对应量化值为(1.5+0.25)Ti-1。

例如:第一次扫描时的阈值T0=32,量化器的间隔就为[32,64],该间[32,64]被48分成两个相等的部分:[32,48]和[48,64],量化间隔为16,对系数进行量化时,如果幅度在[32,48]的范围里,该系数的量化值为“0”对应的量化值为(1.5-0.25)T0=40;如果幅度在[48,64]的范围里,该系数的量化符号为“1”,它的量化值为(1.5+0.25)T0=56。

图像小波编码主要有小波变换,量化和熵编码3个模块组成。小波变换不损失数据,是EZW编码具有渐进编码的基础,量化模块会对数据造成损失,数据损失的程度取决于量化阀值的大小,EZW算法指的就是这个模块的算法;熵编码模块对每个输入数据值精确的确定它的概率,并根据这些概率生成一个合适的代码,使输出的码流小于输入的码流。

1.3图像预处理

在零树小波编码过程中,要对图像编码操作,对它进行一定的处理,以获取该图像的信息。我们从图像中获得的信息包括图像长,宽,灰度值,像素,文件大小等,并给他们分配内存。将这些信息放入一个文件中,使其成为一个编码流,以便于我们进行编码。在程序实现EZW算法中,要将图像的一些信息转化为浮点型。还有一点需要注意的是在获取图像信息的时候,有一些不重要的信息,就采取跳过的处理办法,就是我们多媒体中所说的“去粗取精,去伪存真”。

1.4零树小波解码算法实现

解码所要实现的功能就是将编码所得到的文件进行系数重构,使其能够还原成一幅和原图像近似的图像。在实现零树小波解码算法中用到的函数及其功能,其中最重要的是DecodeDominantPassMortonScan()解码主扫描过程函数;DecodeSubordinatePass()解码辅扫描过程函数,实现逆量化;WaveletTransformInvert()逆小波变换,这些函数与编码中的函数相对应。

2压缩性能测试与评价

2.1图像重建数据统计和数据质量评价

该程序对这幅图像共进行了13次扫描,其中给出的初始阀值是4096,然后每扫描一次阀值减半,这与前面零树建立小节中提到的阀值在扫描过程中的变化相吻合,表明程序对该图像的压缩是成功的。这幅图像最终被压缩成一个大小为153972 Bytes的文件,比原来图像所占容量少了一半多。

2.2压缩性能评价

该演示程序,在功能基本上可以对一幅静态图像实现任意比特率的压缩,而且可以将压缩后的文件打开对其进行解码,重构成一幅完整的图像。

3结论

零树小波编码算法能够对静态图像实现高效的压缩,有效地节省了图像的存储容量,提高了图像信息在网络上的传输效率。

由于小波变换的多分辨率特性,它已经被成功地应用于图像编码。小波构造提升方法,它继承了第一代小波变换多分辨率的特性;小波变换后的系数是整数;图像的恢复质量与变换时边界采用何种延拓方式无关。由于它能实现图像的整数到整数的变换,因此给图像的无损压缩提供了理论基础。

小波变换图像编码既拥有传统编码方法的一些优点(能够很好地消除图像数据中的统计冗余),又具有新型图像压缩编码方法的优点(利用了人眼视觉的特性机制),因而小波图像编码非常适应于高压缩比应用领域的要求。

参考文献

[1]雷英杰.零树小波编码算法[J].空军工程大学学报,2004,5(1).

[2]王志军.多媒体技术及应用[M].北京:高等教育出版社,2005.

[3]孙虎.多媒体数据压缩与实现[M].北京:清华大学出版社,2004.

小波视频编码器篇5

本文在研究小波变换、色彩空间、图像压缩编码方法的基础上, 将小波理论以及各种色彩空间编码在图像压缩中的应用进行了深入研究, 并对基于小波分析的SPIHT编码算法进行了改进。

一、SPIHT算法

SPIHT (set part itioning in hier ar chical t ree) 主要是利用渐进式传输的理论进行编码。渐进式传输理论是将数值的绝对值由大到小排列, 然后将最重要的数值先传输, 还原时图像的恢复质量将渐渐变好。图像在做小波变换后, 其系数特性如下:位于图像左上角的系数最少但是最为重要, 图像的大部分能量都集中在最低精度的子图像里, 并且各子图像的小波系数间存在着空间自相似性, 这一点比幅值顺序在图像编码中更为重要。

(一) SPIHT算法具体符号规定

O (i, j) 表示节点 (i, j) 所有孩子坐标的集合。即:O (i, j) ={ (2i, 2j) , (2i, 2j+1) , (2i+1, 2j) , (2i+1, 2j+1) }。

D (i, j) 表示节点 (i, j) 所有后代坐标的集合。

H表示小波变换最大尺度的变换系数坐标的集合, 既LLJ, HLJ, LHJ, HHJ。

L (i, j) 表示L (i, j) =D (i, j) -O (i, j) 。

三种链表表示

不重要集合链表 (LIS) , 不重要像素链表 (LIP) , 重要像素链表 (LSP) , 在LSP、LIP中, (i, j) 表示单个像素, LIS中 (i, j) 代表集合L (i, j) 或D (i, j) 。为了区分这两种集合的类型, 如果是D (i, j) 称LIS的表值为A型, 如果是L (i, j) 称LIS的表值为B型。

(二) SPIHT具体实现过程

1. 初始化:

输出n=㏒2 (max (i, j) {|Ci, j|}, 置LSP为空, 将坐标 (i, j) ∈H送入LIP, 并将H中有后代 (即高频部分:HLJ, LHJ, HHJ) 的送入LIS, 作为A型值。

2. 排序过程:

(1) 对每一 (i, j) ∈LIP, 作:1) 输出Sn (i, j) ;2) 若Sn (i, j) =1, 将 (i, j) 移入LSP, 并输出C (i, j) 的符号; (2) 对每一 (i, j) ∈LIS, 作:1) 若为A型值, 则①输出Sn (D (i, j) ) ;②若Sn (D (i, j) ) =1, 则对每一 (k, l) ∈O (i, j) , 作:·输出Sn (k, l) ;·若Sn (k, l) =1, 将 (k, l) 送入LSP并输出其符号;·若Sn (k, l) =0, 将 (k, l) 送入LIP末尾;③若L (k, l) ≠φ, 将 (k, l) 移到LIS的末尾, 作为B型值;否则, 将 (i, j) 从LIS中删除。2) 若为B型值, 则①输出;②若Sn (L (i, j) ) =1, 则·对每一 (k, l) ∈O (i, j) 加到LIS的末尾, 作为A型值;·将 (i, j) 从LIS中删除。 (3) 细化过程:对每一 (i, j) ∈LSP (不包括最近一次分裂过程产生的) , 输出|C (i, j) |的第n个最重要的位; (4) 量化步长刷新:n=n-1;返回2) 。

二、YFr Fb变换

同样是3-D整数变换, Fast-VDO提出了另外一种颜色转换, 我们称之为YFr Fb变换。这种转变有许多可取的特性:高编码增益, 16位整数映射, 低比特扩张。具体可以表示为:

三、实验结果及结论

为了说明本算法的有效性, 本文通过对12幅彩色国际标准测试图像的JP2、RAR、ZIP、PNG、TGA、PCX、TIF几种格式无损图像压缩算法进行了对比, 平均而言无压缩比分别比上述算法分别提高了-1%、11%、60%、60%、33%、52%、29%, 见表1。

参考文献

[1]Shapiro J M.Em bedded image coding using zerotreesof wavelet coefficien ts[J].IEEE Transactions on Signa lProcessing, 1993, 41 (12) :3445-3462.

[2]Said A, Pearlman W.A new fast and efficient image codecbased on set partitioning in hierarchical trees[J].IEEE T ransactions onCircuits System Video Technology, 1996, 6 (6) :243-250.

[3]Geronimo J S, Hard in D P.Fractal fun ctions and waveletexpansions based on several scaling function s[J].Journal of ApproxTheory, 1994, 78 (3) :373-401.

小波视频编码器篇6

小波编码和分形编码都是图像压缩技术研究的主要方向,但二者都存在一定的局限性。利用小波与分形混合的图像编码方法对图像进行压缩,使两种算法相得益彰,已经成为目前发展的趋势。

1 基于分形变换的图像编码压缩过程

分形图像编码以迭代函数系统IFS和拼贴定理为理论基础,利用图像的自相似性,达到图像的压缩目的。Jacquin提出了基于分块的图像压缩编码算法,首先将图像分割成N个子块Ri称为Range块(R块),R块互不重叠且覆盖整个图像。再把图像分割成M个子块Dj称为Domain块(D块),D块可以重叠且边长一般为R块的两倍,然后D块通过4-邻域像素值平均或欠采样收缩为与块具有相同大小的码本块Ω,为提高图像的编码质量,通常还需要对收缩后的Ω块进行8种等距变换tk,k=1,…,8。

编码阶段,对于每个R块Ri,寻找一个最佳匹配D∈Ω块的亮度变换来近似,即R≈S·D+o·I,也就是求解下面式子的极小化

$| R_{i} - (s_{i} \cdot D_{m_{i}} + o_{i} \cdot Ι) | = \min_{D \in Ω} {\min_{s, o \in R} | R_{i} - (s \cdot D + o \cdot Ι) |}$ (1)

其中, $| \cdot |$ 是向量2-范数;mi、si和oi分别表示Ri的最佳匹配块的序号和对该匹配块对比度和亮度的最优调整。要求 $| s | ＜ 1$ 保证其解码序列收敛,一般先忽略收敛性条件,求解下式

$E (R_{i} \cdot D) = \min_{s, o \in R} | R_{i} - (s \cdot D + o \cdot Ι) |$ (2)

然后排除不满足条件的Si,接着求解出式(1)的外层最小化。

$E (R_{i}, D_{m_{i}}) = \min_{D \in Ω} E (R_{i}, D)$ (3)

由式(3)得到Ri的分形三元组 $(m_{i}, \bar{s}_{i}, \bar{o}_{i})$ ,其中, $\bar{s}_{i}, \bar{o}_{i}$ 是si,oi是量化值,如果考虑等距变换,则Ri的分形码则为四元组 $(m_{i}, \bar{s}_{i}, \bar{o}_{i}, k)$ ,其中,k是等距变换的序号。

2 提升小波变换

经典小波分析是从傅里叶分析的基础上发展起来的,在一定程度上受到傅里叶分析的限制。小波提升算法是一种更为快速有效的小波变换实现方法,它不依赖于傅里叶变换,完全能够在空间域完成小波的构造,具有显著的优点[5,6,7]。提升方法一般分为3个步骤:分裂(Split)、预测(Predict)和更新(Update)。设原始信号为x[n],正向变换如图一所示,其中,s[n]为信号x[n]的低频部分,d[n]为信号x[n]的高频部分。

(1)分裂。

将信号x[n]分割成相关的两个部分:a[n]和b[n],并且a[n]和b[n]的相关程度越高,就会获得越好的分割效果。根据数据的奇偶来对数据实施间隔取样,即a[n]=x[2n],b[n]=x[2n+1]。

(2)预测。

利用数据间得到的相关程度,用a[n]来预测b[n],用一个因子p(·)使得d[n]=b[n]-p(a[n])。

(3)更新。

采用因子U(·),用d[n]来修正x[n],使得更改后的x[n](记为c[n])只包含信号x[n]的低频部分,即c[n]=a[n]+U(d[n])。

3 基于提升小波变换的分形图像编码

小波变换把图像信号分解为具有不同尺度和空间选择性的一系列空间信号,并可以通过这些信号重构图像。它是一种空间域与时间域相结合的图像分析手段。分形压缩算法具有潜在的压缩比高、解码速度快和解码图像与分辨率无关等优点,但编码时间长。基于上述分析,提出基于提升小波变换的分形编解码算法过程如下:

(1)将图像进行提升小波变换,进行二级小波分解。

(2)分别对二级高频部分HL2,LH2,HH2进行改进的分形编码,以HL2为例步骤如下:

第一步按照基本分形编码方法生成码本Ω。

第二步设定R块的标准差阈值τ以及D块的标准差阈值η,定义容许码本 $Ω_{η} = {D \in Ω | σ_{D} \geq η}$ 。

第三步计算每个R块的标准差。如果σR<τ,则块R直接用 $\bar{R} \cdot Ι$ ;如果σR≥τ,则在容许码书Ωη中搜索与R块匹配误差最小的Dc块。

第四步在容许码本Ωη中定义Dc为中心的k-邻域,从中选择与子块R有最小E(R,D)的码块Dm。然后考虑Dm的8个等距变换,并选出有最小E(R,D)的等距变换序号l。

(3)对第一次小波变换的高频子图像,仅修改分形代码中的Δg作为每个块的分形代码,即 $Δ g = \bar{R}_{l} - α_{l} \bar{D}_{l}$ ,其中 $\bar{R}_{l}$ 和 $\bar{D}_{l}$ 分别为子图像R块和D块的像素平均值。

(4)低频部分采用传统的DCT编码[10]。

(5)解码时首先对低频子图像采用IDCT,然后对高频部分进行分形迭代。分别用相应大小的初始图像对第二次小波变换的高频子图像进行迭代。对第一次小波变换的高频部分的分形代码,除了修改过的Δg之外,其余代码取自上层子块所存储的分形图像代码。得到的小波域分形图像,再经提升小波逆变换得到解码图像。

4 实验结果分析

实验平台为Windows XP、Intel3.2 GHz CPU和0.99 GB内存,采用D9/7双正交小波基对512×512的Lena图像进行2级小波分解,用Matlab7.0编程。本实验中生成块的步长σ为8。R块的标准差阈值τ为2,块阈值η为20,k取5时,实验数据比较结果如表1所示。

表1给出了文中算法与传统分形算法对比实验结果。可以看出文中算法在相同的值域块(如8×8)时的峰值信噪比与对应的传统分形算法基本相同,但编码时间缩小为1/160,压缩比提高了3.5。

5 结束语

文中利用了提升小波变换和分形压缩各自的优点,采用局部分形编码算法,结合提升小波变换进行图像的压缩编码。在保证图像还原质量基本不变的前提下,较大地减少了图像的编码时间,提高了图像的压缩比。实验结果验证了该算法的有效性。

摘要：介绍了分形理论和提升小波变换理论,提出提升小波变换结合快速分形编码的混合编码方法。实验结果表明,提出的新算法在解码图像质量略有损失的情况下,图像编码时间和压缩比方面均有良好的效果。

关键词：分形编码,提升小波变换,图像压缩,混合编码

参考文献

[1]FISHER Y.Fractal image compression,theory and applica-tion[M].NewYork:Springer-Vorlag,Inc,1995.

[2]HE C,YANG S X,HUANG X.Variance-based acceleratingscheme for fractal image encoding[J].IEE Electronics Let-ters,2004,40(2):115-116.

[3]HE C,YANG S X,XU X.Fast fractal image compressionbased on one-norm of normalised block[J].IEE Electron-ics Letters,2004,40(17):1052-1053.

[4]周一鸣,张超,张曾科.基于图像子块的快速分形图像编码算法[J].计算机应用研究,2008,25(2):458-463.

[5]陈武凡.小波分析及其在图像处理中的应用[M].北京:科学出版社,2002.

[6]DAUBECHIES I,SWELDENS W.Factoring wavelet trans-forms into lifting step[J].Fourier Anal.Appl,1998,4(3):247-269.

[7]宋凭,刘波,曹剑中,等.基于快速提升小波变换的图像压缩[J].科学技术与工程,2005(19):1330-1333.

[8]闫允一,郭宝龙,陈龙潭.小波提升原理在图像编码中的应用[J].计算机应用研究,2004(8):136-137.

[9]ZHOU B,CHEN J.A geometric distortion resilient image wa-termarking algorithm based on SVD[J].Image and Graph-ics,2004,9(4):506-512.

小波视频编码器篇7

本文在此基础上,通过分析基本分形图像编码的压缩算法,提出一种基于小波域的分形图像编码改进算法。这种改进算法包括两部分:(1)根据图像小波分解后各子图像包含的不同能量,考虑各子图像所代表的方向、纹理特征等信息,对各子图采用非均匀的分形编码方案,即在进行小波域的分形编码时,分形块的选取不一定全是正方形,对于不同方向的纹理特征的小波子图像选取不同形状的分形块;(2)根据图像的小波变换系数在同一方向不同分辨率、同一分辨率不同方向之间都存在相关性,对每一图像块,在同一方向低一级分辨率的子带图像上寻找与其最佳分形匹配的相似块,由这些相似块形成一棵一棵预测树,解码端通过对预测树的分形预测恢复出各级图像块。实验证明,这种改进算法能够大大提高分形编码的速度,并取得较高的压缩比。

1 基本分形编码压缩算法

基本分形编码压缩算法的主要内容:将待编码的图像分割成互不重叠的子块(Range Block),称为图像块R,同时将图像分割成可以相互重叠的大一些的块(Domain Block),称为相似块D。对分割后的R块和D块进行分类,如:变换平缓的平滑区域、变换突然的边缘区域和变换缓和的中间型区域等,使相匹配的块具有相同的区域性质。对分类后相同区域的每一个R块Rj寻找可以匹配的D块Dj,使得Dj通过仿射函数ψj可以近似于Rj,由此可以得到一组仿射变换组ψ1,ψ2…ψN,即分形迭代系统。只要该系统的变换是收敛的,且比原系统简单,就实现了分形压缩[12]。基本分形编码算法主要在图像分割后对R块和D块进行搜索匹配的过程,其压缩比较高,但是压缩时的计算量较大,编码压缩时间很长。

2 基于小波域的分形图像编码改进算法

本文的改进算法包括两部分:小波域分形编码过程中分形块形状的选取以及分形预测树的形成。

2.1 小波域分形编码过程中分形块形状的选取

在上述基本分形压缩编码过程中,在确定R块和D块的形状时,对各小波分解子图取的均是正方形。由于图像小波分解后,各子图包含的能量有所不同,其代表的方向、纹理等特征信息也不相同,因此,可以考虑在进行小波域的分形编码时,分形块的选取可以不选正方形,而是依据小波分解子图的不同方向的纹理特征选取不同形状的子块。

以512×512的8 bit图1为例进行实验,计算结果表明,不同方向的子图由于其纹理特征信息不同,在LH、HL、HH区域中,其水平和垂直方向的相关性不相同,所以在不同方向的分解子图像中采用不同形状的块进行分形编码,可使其编码时间更短,图像恢复效果更好。例如,在LH区域,通过计算分析,行相关长度大于列相关长度,图像以水平纹理为主,可采用4×2的矩形进行R块和D块的分割;在HL区域,行相关长度小于列相关长度,图像以竖直纹理为主,可采用2×4的矩形进行R块和D块的分割;而在HH区域,行相关长度与列相关长度接近,则可以采用正方形来分割。同时,由于左上角的低频子图包含了图像的大部分能量,因此仍采用2×2正方形子块的选取,不参加计算。图像块的分割方法如图2所示。应用均匀分块和非均匀分块的压缩效果比较如图3所示。

2.2 分形预测树的形成过程

分形预测树的形成原理是:应用Davis把零树的概念引入到分形图像编码的理论,把分形图像编码中的相似块和图像块扩大到相似树(Domain Tree)和图像树(Range Tree),从而使得相似块与图像块之间的分形匹配转化为相似树与图像树之间的分形匹配。在此基础上,可以在各级小波分解的子图像中寻找与图像块R最佳分形匹配的代表块,再由各级代表块按照零树结构产生一棵代表树,通过计算比较各级图像树R与代表树的距离,确定距离最小的代表树就是图像树R的预测树。

结合小波域图像分割形状的分析,对图1进行如图2所示的小波域分割,得到基于小波域的分形预测树的形成图如图4所示。具体过程是:

(1)首先对图像进行多次小波变换,产生各个子带图像。通过对图像行、列相关性的计算分析,确定各子带小波域图像分割的形状。为了保证信噪比,对最低分辨率的子带图像LL1、HL1、LH1、HH1不编码。

(2)同时在水平、垂直、对角线3个方向上形成一棵一棵图像树,即零树。如LH方向上的R=(R1,R2,R3,R4)就是其中一棵图像树,而D=(D1,D2,D3,D4)表示HL方向上的相似树。然后在LH1中寻找与图像块R2最佳分形匹配的代表块E1,再由E1按照零树结构产生一棵代表树E=(E1,E2,E3)。同理,在LH2中寻找与图像块R3最佳分形匹配的代表块F2,并生成代表树F=(F1,F2,F3)。在LH3中寻找与图像块R4最佳分形匹配的代表块G3,并生成代表树G=(G1,G2,G3)。

(3)分别计算图像树R与3棵代表树E、F、G的距离,距离最小的代表树就是图像树R的预测树。然后将预测树在相应层次的位置以及经历的几何变换和仿射变换作为图像树R的分形预测编码。

(4)HL、HH方向按同样方式编码,只是构成的R块和D块的形状大小不同。这样,在改进算法中,编码只需对代表树中的一个代表块进行分形编码。而解码时,又可依据这个代表块通过零树结构推出其他代表块,再分形预测图像块R。

由于前面针对小波分解图的能量分配特性已经采用了非均匀的分形块形状的选取,再结合这种分形预测编码方法,其结果大大提高了分形编码的速度,缩短了编码时间,在提高压缩比方面也取得了良好的效果。

3 实验结果

实验采用图1所示图像,分别用基本分形编码方法和本文的改进算法进行实验,其重建图像如图5所示。基本分形编码时各子图中图像块大小为4×4,相似块大小为8×8,改进算法中对小波分解图像块的分割方法如图2所示,相似块大小取为图像块大小的2×2倍,实验结果如表1所示。

本文提出基于小波域的分形图像编码改进算法是将小波域分形与分形预测方法相结合,由表1可知,与基本分形算法相比,在恢复图像质量接近的情况下,压缩比提高约2倍,信噪比下降2 dB,而编码时间大大缩短,提高了编码速度,表明在提高压缩比方面,效果良好。

参考文献

[1]余松煜,张文军,孙军.现代图像信息压缩技术[Ml.北京:科学出版社,1998.

[2]陈守吉,张立明.分形与图像压缩[M].上海:上海科技教育出版社,1998.

[3]BRENDT W,GERHARD D J.A review of the fractalimage coding literature[J].IEEE Transactions on ImageProcessing,1999,8(12):1716-1729.

[4]RINALDO R,CALVAGNO G.Image coding by blockprediction of multiresolution subimages[J].IEEE TransactionOn Image Processing,1995,IP-4(7):909-920.

[5]DAVIS G.A wavelet-based analysis of fractal image com-pression[J].IEEE Transactions on Image Processing,1998,7(2):141-154.

[6]DAVIS G.Adaptive self-quantization of wavelet subtrees:a wavelet-based theory of fractal images compression[C].SPIE Conf.on Mathematical Imaging:Wavelet applicationin Signal and Image Processing,San Diego:1995:265-279.

[7]WALLE A V D.Merging fractal image compression andwavelet transform methods[C].In Fractal Image CodingAnalysis:A NATO Series Book,Yuval Fisher,Ed.NewYork:Springer Verlag,1996:523-597.

[8]KRUPNIK H,MALAH D,KARNIN E.Fractal represent-ation of images via the discrete wavelet transform[C].InIEEE 18th Conference of EE,Israel:1995,3:187-191.

[9]张宗念,马义德,余英林.基于方向性零树小波的分形图像编码[J].电子科学学刊,2000,22(5):780-783.

[10]周艳,吴敏金.基于方向剖分的小波域分形图像压缩[J].华东师范大学学报(自然科学版),2002,3(9):20-23.

[11]谢鑫,马争鸣.基于小波系数零树结构的分形预测图像编码[J].中国图像图形学报,2000,5(11):920-924.

【小波视频编码器】推荐阅读：

视频编码技术05-16

视频解码器06-29

高效视频编码标准09-03

高速编码器06-11

编码器结构06-28

仿真编码器07-13

绝对编码器08-10

磁旋转编码器07-17