数字图像:压缩技术

2024-05-11

数字图像:压缩技术（共9篇）

数字图像:压缩技术篇1

1 引言

目前多媒体数据通信的需求在不断增长,而图像数据构成了多媒体通信的主要部分,它们占据了很大一部分通信带宽。同时图像数据也占据了很多设备的存储空间,基于以上两点,促进了图像压缩技术的发展。其中图像变换技术就是其中之一。图像变换本身并不进行数据压缩,它只把信号映射到另一个域中,使信号在变换后的域中容易压缩而已。对于一幅图像来说,直接在空间域中进行处理需要的运算量很大。为了减少运算量,我们可以采用数学手段对空间域的图像进行积分变换,将空间域的问题转化到频率域来处理。这样不仅可以减少运算量,而且可以获得更有效的处理结果。例如,一幅重影图像在空间域中是无法把它们分开的,然而将它们变换到频率域后,它们在频谱上确是独立分开的,由此便可以对它们进行分别处理。

图像变换的方法众多,包括经典的傅里叶变换、余弦变换等。这些变换名称意义各不相同,但它们的共同点是都存在自己的正交函数集,正是由于这些正交函数集的不同才产生了不同的变换。该文主要讨论了数据压缩中的三种变换及其各自的特点,同时用C++进行了实现,最后对3种变换进行对比。

2 快速傅里叶变换

快速傅里叶变换(FFT)是建立在离散傅里叶变换(DFT)基础上的。而离散傅里叶变换(DFT)是连续傅里叶变换的离散形式。离散傅里叶变换建立了函数在空间域与频率域之间的转换关系,把空间域难以表示的特征在频率域中显示出来。但是,在离散傅里叶变换的计算中,不论乘法或是加法,计算量均与N2成正比,所以N较大时计算量是相当大的。而快速傅里叶变换则利用变换系数ωNnk的周期性和对称性对DFT运算进行合并和分解,从而降低了DFT的计算量。FFT从本质上说就是DFT的一种快速算法。由于图像数据是二维的,因此在图像压缩中采用的是二维离散傅里叶变换。变换公式如下(本文的傅里叶变换取方阵形式):

由公式可以看出二维DFT具有分离性,因此二维DFT可以通过两次一维DFT来实现。本文采用蝶形运算实现一维FFT和二维FFT。其蝶形运算关键代码如下:

3 离散余弦变换

离散余弦变换(DCT)是数字图像处理中的一种重要变换,它是JPEG国际标准的变换核心。DCT是一种可分离的正交变换,并且是中心对称的。它与DFT有密切的联系。DFT的一个最重要的问题是它的运算都是复数运算,在数据表述中是实数的2倍,不易计算。而离散余弦变换是以实数为对象的运算。离散余弦变换的基本思想就是通过对图像的变换使分散在各个像素上的能量集中到变换后的少数系数上,同时除去0或近似于0的系数,从而达到数据压缩的目的。二维DCT变换公式如下:

由上式公式可知,二维DCT变换的基函数也是可分离的,因此二维DCT变换可以通过分别对行和列进行一维DCT变换实现。即如图1所示。

在JPEG标准中,图像被分割成一个一个由8*8像素构成的像块,而后再对每一像块进行DCT变换。对一个像块进行变换的关键代码如下:

4 小波变换

所谓小波,就是用具有零均值,在时域和频域内能量局部化的函数表示,其波形表现为两端衰减为零的小的波形。由于傅里叶变换和离散余弦变换是一种全局变换,完全在空域或者完全在频域,因此无法表达信号的时频局部特性。而小波变换在空域和频域都具有表征信号局部特征的能力,即在低频部分具有较高的频率分辨率和较低的时间分辨率,而在高频部分具有较高的时间分辨率和较低的频率分辨率。小波变换采用塔形分解的数据结构,与人眼由粗到精,由整体到细节的观察习惯一致,即先传送频率最低的子图像,再依次传送其他图像。

图像经过小波变换后,图像数据就被分解为大小,位置和方向都不同的分量。能量在各个频率空间进行了重新分配。其中不同分辨率的子图像对应的频率是不一样的。同时小波系数与原始图像存在着空间上的对应关系,通过对小波系数分布情况的分析,利用不同的滤波器处理小波系数,经过逆变换后可以得到理想的处理效果。

标准的图像可以对其进行3次小波变换。小波的每一次变换实际就是对图像进行行列变换,其结果是左上角显示缩小为原来四分之一的图像,右上角是图像行变换的结果,左下角是图像列变换的结果,而右下角则是对图像进行45度边缘检测的处理结果。其行变换的关键代码如下(列变换类似):

5 结论

傅里叶变换是一种经典的数学变换方法,本身提供了很多有用的特性,但是也有不足的地方。其一,是需要计算复数,而复数计算相对比较费时。而离散余弦变换是以实数为运算对象,避免了这种复数运算。因此计算速度要比傅里叶变换快得多。其二,傅里叶变换收敛慢,尤其在图像编码中比较突出。

离散余弦变换由于对原信号进行了以网格为单位的处理,每个网格之间信号的连续性被分割,由此产生了方块效应。也就是说所得的变换系数只反映块内信息,而不能反映块间信息。而小波变换是一种全局变换,故在重建图像中可以免除离散余弦变换所固有的方块效应,在较低的码率下比采用离散余弦变换效果更好。这也是为什么JPEG2000标准中采用了小波变换。

参考文献

[1]章毓晋.图像工程——图像处理与分析[M].北京:清华大学出版社,1997.

[2]杨淑莹.VC++图像处理程序设计[M].2版.北京:清华大学出版社,2005

[3]Gonzalez R C,Woods R E.Digital Image Processing[M].2nd ed.Pearson Education,Inc,2002.

[4]Acharya T,Ray A K.Image Processing:Principles and applications[M].Wiley-interscience,2007.

[5]邱宽民,赵胜凯.DFT与FFT在实际应用时的性能比较[J].北方交通大学学报,2000,24(5):60-62.

数字图像:压缩技术篇2

摘要

数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。在日常生活中，图像处理已经得到了广泛应用，例如：电脑人像艺术，电视中的特殊效果，自动售货机钞票的识别，邮政编码的自动识别和利用指纹、虹膜、面部等特征的身份识别等。图像的特技切换是计算机软件开发,尤其是多媒体软件设计中经常遇到的问题。

本文就所学到的微薄知识对利用VB程序设计实现彩色图像界面切换技术做以基本阐述。

关键字：数字图像处理计算机软件开发界面切换

一、数字图像处理概述: 数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。图像处理中，输入的是质量低的图像，输出的是改善质量后的图像，常用的图像处理方法有图像增强、复原、编码、压缩等。图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就，属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等，使图像处理成为一门引人注目、前景远大的新型学科。

数字图像处理的目的:一般来说，图像进行处理(或加工、分析)的主要目的有三个方面:

(1)提高图像的视感质量,如进行图像的亮度、彩色变换,增强、抑制某些分，对图像进行几何变换等,以改善图像的质量。

(2)提取图像中所包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等。

(3)图像数据的变换、编码和压缩,以便于图像的存储和传输。

不管是何种目的的图像处理,都需要由计算机和图像专用设备组成的图像处理系统对图像数据进行输入、加工和输出。

在日常生活中，图像处理已经得到了广泛应用。例如：电脑人像艺术，电视中的特殊效果，自动售货机钞票的识别，邮政编码的自动识别和利用指纹、虹膜、面部等特征的身份识别等。

二、系统总体分析 2.1 窗口设计

图像的界面切换主要是指图像进入界面时的显示方式，也就是按不同的规律显示图像中的各个像素点。

根据需要在窗体上配置必要的控件，并修改相应的值，如图1所示，图片框用于显示图像，命令按钮“获取图像”用于选择指定图像文件，并且将图像显示在图片框内。命令按钮“退出”用于退出该窗口，其他命令的具体作用将在下文列举。

图1 添加控件及修改名称

以同样的方式添加其他控件按钮，如上下对接进入、从坐上到右下进入、从中央到四周扩散、以斜线方式进入、以渐显方式进入、利用Bitlit函数实现界面切换和以工字型进入等控件按钮。如图2所示：

图2 窗格及控件按钮

2.2 程序设计及实现过程

下面通过几个具有代表性的界面切换实现过程,对界面切换技术加以简单阐述。2.2.1 读图像数据

单击“读图像数据”命令按钮，相应的单击事件程序为： Private Sub Command1_Click()’以二进制的方式打开文件对话框中用户选择的图像文件 On Error GoTo Err CommonDialog1.Filter = “(*.*)|*.*|(*.gif)|*.gif|(*.bmp)|*.bmp|(*.jpg)|*.jpg” CommonDialog1.ShowOpen Picture1.Picture = LoadPicture(CommonDialog1.FileName)Err: Exit Sub End Sub Private Sub Command2_Click()End 通过该程序选择.jpg文件实现图像的读取，如图3所示。

图3 获取图像的实现

2.2.2 图像从上下对接进入界面

图像以上下对接方式进入界面时，首先显示图像的第一行和最后一行，然后显示图像的第二行和倒数第二行，以此类推，最后将图像中所有的像素显示出来。其实现过程如图4所示。

图4 图像以上下对接方式进入界面的过程图

对该控制命令进行VB编程如下： Private Sub Command3_Click()Picture2.Picture = Picture3.Picture width2 = Picture1.ScaleWidth height2 = Picture1.ScaleHeight

For j = 0 To height2 / 2

For i = 0 To width2jj1

For j = 0 To i

c1 = Picture1.Point(i, j)

rr1 = c1 Mod 256

gg1 = c1 / 256 Mod 256

bb1 = c1 / 65536 If j < height2 And i < width2 Then Picture2.PSet(i, j), RGB(rr1, gg1, bb1)

c2 = Picture1.Point(j, i)

rr2 = c2 Mod 256

gg2 = c2 / 256 Mod 256

bb2 = c2 / 65536 If j < width2 And i < height2 Then Picture2.PSet(j, i), RGB(rr2, gg2, bb2)

Next j Next i End Sub 2.2.4 图像从中央向四周扩散进入界面

图像从中央向四周扩散进入界面时,首先显示的是中心点像素,然后显示图像中心点周围的像素,依次类推,每次显示当前已显示像素的周围一圈像素,最后将图像中所有像素显示出来.如图6所示。

图6 图像从中央向四周扩散进入界面

图像从中央向四周扩散进入界面的程序代码如下： Picture2.Picture = Picture3.Picture w = Picture1.ScaleWidth h = Picture1.ScaleHeight x0 = w 2 y0 = h 2 rmax = Int(Sqr(x0 ^ 2 + y0 ^ 2))For r = 1 To rmax

dc = 1 /(6.28 * r)

For c = 0 To 6.28 Step dc

x = x0 + r * Cos(c)

y = y0 + r * Sin(c)

c1 = Picture1.Point(x, y)

If x >= 0 And x < w1 Then

rr1 = c1 Mod 256

gg1 = c1 / 256 Mod 256

bb1 = c1 / 65536

Picture2.PSet(x0, y0), RGB(rr1, gg1, bb1)

Picture2.PSet(x, y), RGB(rr1, gg1, bb1)

End If

Next c Next r End Sub 2.2.5 图像以斜线方式进入界面

图像以斜线方式进入界面时，首先显示图像的左上角像素，然后以斜线方式显示当前已显示像素的下一个斜线上的像素，最后将图像中所有像素都显示出来。显示过程如图7所示。

图7 图像以斜线方式进入界面的过程图

其对应的程序代码为： Picture2.Picture = Picture3.Picture w = Picture1.ScaleWidth

h = Picture1.ScaleHeight Max = If(h < w, w, h)For d = 0 To 2 * Max y = d For x = 0 To d

If x < w And y < h Then

c1 = Picture1.Point(x, y)

rr1 = c1 Mod 256

gg1 = c1 / 256 Mod 256

bb1 = c1 / 65536

Picture2.PSet(x, y), RGB(rr1, gg1, bb1)

End If

y = y1 Step 2

For i = 0 To w1 Step 2

For i = 1 To w1 Step 2

For i = 0 To w-1 Step 2

c1 = Picture1.Point(i, j)

rr1 = c1 Mod 256

gg1 = c1 / 256 Mod 256

bb1 = c1 / 65536

Picture2.PSet(i, j), RGB(rr1, gg1, bb1)

Next i Next j End Sub 2.2.7利用Bitblt函数实现界面切换

Bitblt是Windows API函数，它用于从源对象向目标对象成块复制图形，该函数对指定的源设备环境区域中的像素进行位块（bit block）转换，以传送到目标设备环境。其实现过程如图9所示：

图9 Bitblt图像进入效果

其实现程序为：

Picture2.Picture = Picture3.Picture

w = Picture1.ScaleWidth

h = Picture1.ScaleHeight For i = 0 To w / 10 + 1

For j = 0 To 10

Bitblt Picture2.hDC, j * w / 10, 0, i, h, Picture1.hDC, j * w / 10, 0, &HCC0020

DoEvents

Delay 100000

Next j Next i End Sub

三、课程总结及心得体会

走进数字AV压缩技术(上) 篇3

传统的AV压缩技术是建立在香侬理论的基础上的。简单解释一下的话，首先我们要将AV信号分成必需的部分和不必需的部分。其中必需的部分即是AV信号中的真实而有用的信息，而不必需的部分就是数据冗余（Data Redundancy）。按照传统的香侬理论，AV数据之所以可以被压缩就是因为其中有数据冗余存在，压缩系统就是要将AV信号的必要部分从冗余中分离出来。而新型的AV压缩技术则突破了香侬理论的框架束缚，在充分考虑人类听/视觉生理特性及信源特性的前提下，不仅去除数据冗余，更通过去除内容冗余（Content Redundancy）来实现压缩。新型的AV压缩技术主要有以下的优点：

需要较小的存储量；

降低了所需的带宽；

允许在介质之间实现比实时更快的传送；

压缩录制格式只需较低的录制密度，从而降低了录制设备对环境因素和维护的敏感性。

音频压缩技术

为了充分了解AV压缩技术，我们首先从音频压缩方面开始讨论。音频压缩技术指的是对原始的数字音频信号经过适当的信号编码处理，来达到压缩的目的，它必须具有相应的逆变换，即解压缩或译码。数字音频压缩技术在目前各种音乐供应或传送体系中，都扮演着极其重要的角色，像我们日常熟知并广泛接触的CD、VCD、DVD等音乐光盘，互联网络、有线电视、卫星电视等网络媒体。在所有这些不同的领域中，我们都发现音频压缩技术已演变为一种流行，甚至是强制性的技术需求。随着音频市场持续地迅速发展，不断涌现出各种各样新型的压缩技术和标准，可以说我们已经进入了新的数字音频时代。

一般来讲，可以将音频压缩技术分为无损压缩及有损压缩两大类。对于无损编码来说，我们主要着重讨论其压缩率，而对于有损压缩来说，我们除了考虑压缩率以外还要考虑其质量，也就是其音质的具体情况。当然，按照压缩方案的不同，音频压缩技术还可以划分为时域压缩、变换压缩、子带压缩，以及多种技术相互融合的混合压缩等等。各种不同的压缩技术，其算法的复杂程度、音频的质量、压缩率，以及时延等都有很大的不同。为了让大家更容易接受，我们这里就不再对下面具体的压缩方案进行详细分类，而是采用我们比较熟悉的名称来简要介绍一下即可。

1、PCM编码

PCM（脉冲编码调制）最早是由一位名叫Alec Reeres的法国工程师Alec Reeres于1937年提出来的。1946年的时候，大名鼎鼎的Bell实验室根据其原理实现了第一台PCM数字电话机。而到了20世纪70年代后期，超大规模集成电路的PCM编码器、译码器的出现，使PCM在卫星通信、数字微波通信、甚至光纤通信中都获得了广泛的应用。因此PCM已经成为数字通信中一个十分基础的编码技术。

PCM编码的最大的优点就是音质好。我们最常见的CD就大多都采用了PCM编码，一张CD光盘的容量最多也就只能容纳72分钟的音乐信息。PCM编码主要包括采样、量化和编码三个过程。采样就是把连续的模拟信号转换成离散的数字信号。从上面的原理图中，我们很明显就可以看出，在一秒中之内抽采样的点越多，获取的声音频率信息就更丰富。按照采样定理，为了复原波形，在声波一次的振动中，必须有2个以上的采样点，换句话说就是采样频率必须大于或等于信号频率的两倍。那么，我们可以简单计算一下，人耳能够感觉到的最高频率为20kHz，因此要满足我们耳朵的听觉要求，采样率至少是40kHz，即每秒钟对信号进行40000次采样。一般我们常见的CD，它们的采样率大多为44.1kHz。

光有频率信息还不够，在PCM编码中我们还必须获得该频率的能量值并量化，以用来表示音频信号的强度。采样信号只表示了原始模拟信号在离散时间内某个点上的值，量化则是要把这些采样信号再进一步转换成真正的数字信号。而所谓的采样大小就是说要用多少bit的二进制数对采样信号值进行标识，量化电平数为2的整数次幂。这个概念比采样率要更难理解一些，因为比较抽象，举个简单的例子吧：假设对一个信号进行8次采样，各采样点对应的能量值分别为A1~A8，一共有八个，但我们如果只使用2bit的采样大小，那么我们就只能保留A1-A8中4个点的值而舍弃另外4个；如果我们进行3bit的采样大小，则刚好记录下8个点的所有信息。我们常见的CD，其采样大小通常为16bit，即可以有2的16次方（等于65536）个不同的采样值。采样率和采样大小的值越大，记录的波形更接近原始信号。而编码过程就是对量化后的信号再进行编码从而形成一个二进制码组来输出。举例来说，2bit的采样大小只包括了00、01、10和11这四个二进制码组，能表示4种不同的采样值；如果采样大小是3bit，则包括了000、001、010、011、100、101、110、111这8个二进制码组，这样就可以表示8种不同的采样值。

相对自然界的音频信号，音频编码技术最多只能做到无限接近，严格地讲，任何数字音频编码方案都是有损编码，因为无法完全还原。在实际应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，比如CD、DVD以及我们常见的WAV文件，所以在目前所有的随身播放设备中，CD机仍然是音质最好的。因此，我们将PCM约定俗成了无损编码，因为它代表了数字音频中最佳的保真水平，但这并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。

数字图像压缩综述篇4

数字图像压缩的概念

在当前这个信息化社会中, 多媒体技术已被人们频繁使用, 多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一, 发挥着越来越重要的作用;而传输图像需要占用大量的数据空间, 严重影响传输速率和实时处理量, 因而我们要将图像进行压缩, 来解决这一问题。

数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术, 图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息, 提高传输速率, 节省存储空间。

1 发展现状

目前数字图像压缩已取得了划时代的发展, 在国际上形成了一系列国际标准, 如JPEG标准。此标准是负责开发静止图像压缩标准的“联合图片专家组”于1989年形成的基于自适应DCT的JPEG技术规范的第一个草案, 后经多次修改, 最终在一年后形成国际标准。随着多媒体应用的不断增长, 为满足人们在图像压缩领域的迫切需要, 于2000年联合图片专家组又研究出新一代静态图像压缩标准——JPEG2000。系列的国际标准的提出标志着数字图像压缩技术已由学术研究转为产业化, 逐步走向成熟。它使通信、广播、计算机产业的界限变得模糊, 促使现有信息产业的结构发生巨大改变, 当前分形图像压缩和小波图像压缩是研究的新方向。

2 图像压缩基本方法

图像压缩有两种基本的压缩方法:一种是有损数据压缩;另一种是无损数据压缩。有损数据压缩一般采用变换编码方法, 例如, 基于离散余弦变换 (DCT) 的变换编码方法, 如JPEG;还有基于小波变换的方法, 例如JPEG2000、EZW、SPIHT等等。JPEG是有损数据压缩。通过DCT变换后选择性丢掉人眼不敏感的信号分量, 实现高压缩比率。PNG是无损数据压缩中图片压缩常采用的格式, 采用LZ77派生的无损数据压缩算法。而音频压缩格式Fl LAC、TTA和视频压缩格式HUFFYUV也是无损数据压缩常采用的压缩格式。

2.1 有损数据压缩

有损数据压缩是一种破坏性压缩。它在压缩过程中, 允许有一定信息的失真, 但此失真对原图像影响较小, 得到一个与原图像相近似的图像, 但压缩比却大大提高了。有损数据压缩常用于因特网、流媒体、视频以及电话领域。有损数据压缩方法有色彩空间、色度抽样、变换编码、分形压缩。

2.2 无损数据压缩

无损数据压缩采用数据的统计冗余进行压缩, 使数据通过其压缩后信息没有受到损失, 均可还原到压缩前的原样。比如在工程制图、计算机程序、医疗图像、指纹图像等方面此方法得到广泛应用。经常使用的无损压缩方法有Shannon-Fano编码、Huffman编码、游程 (Run-length) 编码、LZW (Lempel-Ziv-Welch) 编码和熵编码法等。无损压缩的优势有100%的保存, 没有任何信号丢失;音质高, 不受信号源的影响;转换方便。无损压缩的不足是缺乏硬件支持, 占用空间大, 压缩比不高。

3 图像压缩算法

比较常用的数字图像压缩方法有:基于傅立叶变换的图像压缩算法、基于离散余弦变换的图像压缩算法、基于小波变换的图像压缩算法。此外还有NNT (数论变换) 压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等。下面简单介绍近年来任意形状纹理编码的几种算法。

3.1 形状自适应离散小波变换

SA-DWT编码主要包含SA-DWT和零树熵编码的扩展以及嵌入式小波编码 (EZW) 。

其中经过SA-DWT之后的系数个数, 同原任意形状可视对象的像素个数相同;EZW则是采用渐进式量化和嵌入式编码, 算法复杂度低, 打破了常规, 即使用低复杂度的算法就可以完成高效的压缩编码器的编码。

3.2 Egge r方法

Egger方法使用了小波变换的局域特性, 把可视对象的行像素推到与边界框的右边界相平齐的位置, 然后对每行的有用像素进行小波变换, 接下来再进行另一方向的小波变换。此方法可能引起重要的高频部分同边界部分合并, 不能保证分布系数彼此之间有正确的相同相位。

3.3 形状自适应DCT (S A-DCT) 算法

SA-DCT把一个任意形状可视对象分成的图像块, 对每块进行DCT变换, 它实现一个类似于形状自适应Gilge DCT变换的有效变换, 但它比Gilge DCT变换的复杂度要低。可是, SA-DCT也有缺点, 它把像素推到与矩形边框的一个侧边相平齐, 因此一些空域相关性可能丢失, 这样再进行列DCT变换, 就有较大的失真了。

4 结论

今天, 数字图像压缩技术取得了卓越的成果, 它广泛应用于网络互联、媒体传播、医疗图像等生活的各个方面, 由于它的存在, 使我们大大减少了传输数量, 提高了通信速率, 使生活更加便捷, 同时也使多媒体技术上了一个新的台阶, 数字图像压缩技术在更深更广层次上的应用值得我们进一步研究。

参考文献

[1]刘方敏等.JPEG2000图像压缩过程厦原理概述[J].计算机辅助设计与图形学报, 2002.

[2]T Sikora, B Makai.Shape-adaptive DCT for genericcoding of video[J].IEEE Trans.Circuits Syst.Video Technol., 1995, 5 (1) :59-62.

[3]M Bi, S H Ong, Y H Ang.Comment on“Shape-adaptiveDCT for generic coding of video”[J].IEEE Trans.CircuitsSyst.Video Technol., 1996, 6 (6) :686-688.

[4]P Kauff, K Schuur.Shape-adaptive DCT with block-basedDC separation and Delta DC correction[J].IEEE Trans.CircuitsSyst.Video Technol., 1998, 8 (3) :237-242.

[5]吴乐南.数据压缩[M].电子工业出版社, 2005.

[6]张晓娣等.新一代的静止图像压缩标准JPEG2000[J].电信科学, 2001.

数字图像:压缩技术篇5

压缩感知（Compressed Sensing）由D.Donoho、E Candes及T.Tao等人提出[1,2,3]，作为一种新兴的思想以其特有的优势给信号处理方法带来了一场新的革命。压缩感知理论是对传统理论的颠覆，它突破了香农采样定理的极限，能以随机采样的方式用更少的数据采样点（平均采样间隔低于采样定理的极限），来完美的恢复原始信号[4]。

从信号处理的角度分析，数字水印可以看为在强噪声背景下嵌入一个微弱信号，并且在嵌入水印后，基本不影响原始载体的视觉或听觉的品质。本文主要对彩色图像的水印算法进行研究。为了增加水印信息的安全性通常在嵌入之前对原始水印信息进行预处理。传统的预处理方法是将水印进行Arnold置乱处理，但由于其具有周期性，通过有限次的置乱总能得到原始水印图像，因此该算法的安全性不够强。将水印稀疏化后进行压缩感知，既可以将水印信息进行置乱处理，由于压缩比的可调节性使得置乱过程更加不确定，又可以提高水印信息的安全性。而且利用压缩感知可以将水印信息进行压缩，保证水印信息量在嵌入容量之内。从而使水印信息嵌入的安全性获得很好的提高。

1 压缩感知概述

作为信号领域研究热点的压缩感知突破了传统信号采集、传输与处理的不足，它的特色之处就是在信号具备稀疏性抑或可压缩性情况下，用远少于奈奎斯特采样速率来采样，并将采样与压缩合二为一，解码的过程不再是简单的逆变换过程，而是要运用重构算法优化求解而实现信号的完美重构或者近似重构[5]。

压缩感知理论包括三个重要的部分，分别为稀疏表示、随机测量与重构算法。

稀疏表示就是用合适的基来表示信号，使得信号子变换后表现出最好的稀疏性。

随机测量主要涉及的是随机矩阵的设计，随机矩阵要满足与变换基不相关，即需要满足约束等距性（Restricted Isometry Property,RIP）条件。

重构算法作为实现信号重构的必要手段，这个过程中关键是优化求解的问题，这也是一个难点。

压缩感知处理的具体三个步骤如下：

步骤一：对于长度为N的可压缩或者稀疏信号x∈RN×1，进行稀疏变换，获得x=ψα，即α=ψTx，其中ψ表示一个标准的正交基，ψT表示矩阵ψ的转置；

步骤二：用一个与基ψ不相关的观测基ϕ：M×N(M≪N)对系数向量α进行测量，即y=θα，并获得观测向量Y:M×1;

步骤三：利用优化求解的方法从观测集合中精确或高概率地重构原始信号x。

2 基于正交小波变换压缩感知的图像重构分析

2.1 实验步骤

实验的素材是两幅具有不同特征的图像，即Lena图与星空图，实验的主要步骤就是分别对这两幅图像进行基于正交小波变换压缩感知的图像重构，保证正交小波变换稀疏表示，测量矩阵和重构算法相同，改变图像的采样率，观测在不同的采样率下这些重构图像的峰值信噪比PSNR[6]值，结构相似系数SSIM[7]和信息相关值IICC的大小，最终通过PSNR,SSIM,IICC值的变换来具体分析原始图像基于正交小波变换这一稀疏表示下经过压缩感知重构的图像的性能分析。其中测量矩阵运用的是高斯随机观测矩阵，重构算法运用正交匹配追踪（OMP）算法，采样率为观测矩阵大小与图像大小之比。

2.2 实验结果

(1)Lena图重构效果图如图1所示。

(2）星空图重构效果图如图2所示。

(3）基于小波变换压缩感知在不同采样率下对图像重构的PSNR(dB）值比较图如表1所示。

(4）基于正交小波变换压缩感知在不同采样率下PSNR,SSIM与IICC值比较图如表2所示。

2.3 实验数据分析与结论

对于具有不同特征的图像采用相同的稀疏变换，测量矩阵与重构算法的压缩感知进行图像的重构，在相同的采样率下原本具有相对更高的稀疏性的图像在相同采样率下经过压缩感知重构出的图像质量效果更好。

对于同一幅图像而言，采用同样的稀疏变换，在测量矩阵和重构算法的压缩感知进行图像重构的过程中，采样率越高，重构的图像效果越好。主观上随着采样率的增加图像越清晰，重构的块效应越小，客观上，重构的图像峰值信噪比随着采样率的增加也越来越大，当超过30 dB的时候恢复的图像与原始图像很难察觉出差异，恢复效果较好。

3 基于压缩感知的RGB空间彩色图像水印算法的分析

3.1 水印的嵌入及位置的选取

RGB空间是颜色空间描述中最基本的加性空间。根据人类视觉系统HVS模型可知人眼对图像的蓝色层变化不是很敏感，因此蓝色层有较大的嵌入容许度，可以有更多的水印能量嵌入，保证水印有较高的鲁棒性。因此选择图片的蓝色层作为水印嵌入域。

对载体图像的饱和度域S进行两层小波分解，将水印嵌入到第二层的中频和低频分量上，与高频分量相比中低频分量具有更大的权值，而大的权值意味着有大的嵌入允许度，即允许嵌入的水印能量较大；且噪声和滤波等攻击对载体图像的高频部分影响较大，因此中低频分量更适合作为水印嵌入位置[9]。

3.2 水印图像的预处理过程

对水印图像进行稀疏变换，本算法采用正交小波变换。对稀疏化后的水印图片进行压缩感知处理。就是对稀疏后的水印信息进行观测，本算法采用的测量矩阵为高斯随机矩阵，采样率为0.7，采样率以及水印信息大小作为密钥的第一部分。第三部分的实验表明基于正交小波变换压缩感知图像重构在一定的采样率下重构的图像具有较好的效果。

3.3 实验步骤

步骤一：将载体图像进行RGB三色分离，并对蓝色层进行小波分解。

步骤二：对水印信息进行压缩感知预处理，分别以0.8和0.6的嵌入强度将水印信息嵌入到载体图像的低频和中频部分。

步骤三：将嵌入水印的小波系数进行小波逆变换以及RGB三色叠加得到带有水印信息的载体图像。

步骤四：依照步骤一到步骤三对水印信息进行提取。

步骤五：分别采用噪声干扰、几何切割和压缩感知压缩的攻击方式来检测算法的鲁棒性。

步骤六：采用传统的Arnold置乱对水印进行预处理，并用相同的方法进行嵌入提取和攻击实验，将实验结果进行对比分析。

3.4 实验结果和数据分析

(1）测试图片，如图3所示。

(2）攻击检测试验结果如图4，图5所示。

(3）鲁棒性对比

相关系数是经常使用的鲁棒性检测模型。本文使用归一化相关系数来检测鲁棒性。归一化相关系数的定义为其中Im,n和I2m,n分别表示原水印图像和提取出的水印图像。鲁棒性对比如表3所示。

4 数据分析与结论

对水印信息采用压缩感知的方法进行预处理，嵌入水印后的载体图像PNSR高于30 dB，与原图相比察觉不出有太大差异，具有很好的隐蔽性。对嵌入水印后的载体图像进行攻击检测，提取的水印信息从主观上评价，画质都比较好，能够清楚地辨认出水印信息，从客观上评价，其归一化相关系数NC都接近于1，提取效果较好，表明该算法对常见的攻击具有很好的鲁棒性。

与传统的Arnold置乱相比，采用压缩感知进行预处理受攻击前后提取的水印信息，从主观上评价，画质更好一些，更容易辨认出水印信息。从客观上评价，其归一化系数都高于传统置乱方法，提取的效果更好，鲁棒性更强。

5 总结

本文将压缩感知理论思想与数字水印的技术相结合，对一种基于压缩感知的RGB空间彩色图像水印算法进行了分析。将水印信息进行基于正交小波变换压缩感知预处理，实验表明，当图像具有较好的稀疏性的时候，在采样率较低时也可以获得效果较好的重构图像。与传统的Arnold置乱相比，基于压缩感知的RGB空间彩色图像水印算法具有更好的鲁棒性，并且由于采样率的可调节性，增加了密钥量，更好地提高了水印的安全性。

参考文献

[1]CANDèS E.Compressive sampling[C]//Proceedings of the International Congress of Mathematicians.Madrid,Spain:[s.n.],2006,3:1433-1452.

[2]CANDèS E,ROMBERG J,TAO T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.

[3]CANDèS E,TAO T.Near optimal signal recovery from random projections:universal encoding strategies[J].IEEE Transactions on Information Theory,2006,52(12):5406-5425.

[4]沙威.压缩感知引论[D].香港:香港大学,2008.

[5]任肖丽.压缩感知理论研究简述[J].中国科技信息,2010(3):45-46.

[6]朱里,李乔亮,张婷,等.基于结构相似性的图像质量评价方法[J].光电工程,2007,34(14):109-110.

[7]李民权,朱大龙,明军.基于图像信息相关性的质量评价方法[J].安庆师范学院学报:自然科学版,2007(2):21-23.

[8]PRATTL W K.Digital image processing[M].New York:John Wiley&Sons,1991:115-137.

[9]LEDLEY R S,BUAS M,GOLAB T J.Fundamentals of truecolor image processing[C]//Proceedings of IEEE International Conference on Pattern Recogittion.USA:IEEE,1990,1:191-195.

[10]林小平,周石琳,张官亮,等.基于计算智能的图像拼接系统设计与实现[J].现代电子技术,2013,36(12):49-52.

数字图像:压缩技术篇6

网络的广泛应用, 以及压缩图像的网络传输, 使半脆弱水印技术成为人们关注的焦点。该水印要求能够承受某种可接受的修改 (如JPEG有损压缩) , 同时对其他的篡改则表现出脆弱性。近年来, 半脆弱数字水印技术开始逐渐得到重视, 涌现出不少半脆弱数字水印方法的论文。文献[1]提出了关于DCT系数在经受JPEG压缩前后的不变特性, 并基于这个原理设计出了能够有效的承受JPEG压缩的半脆弱水印算法。文献[2]设计了基于DWT变换的半脆弱水印算法。该算法选择了小波子带中的一小部分系数进行嵌入, 减小水印嵌入对图像失真的影响。文献[3]根据人眼视觉系统的掩蔽特性模型, 将小波系数分块动态量化, 通过调整块内小波系数的值, 在每个小波系数块中嵌入一个水印信息位。文献[4]提出了一种基于分层的半脆弱数字水印算法, 该算法不仅能够精确定位图像篡改位置, 而且能有效抵抗VQ攻击。该算法仅使用图像所有像素的最低有效位嵌入水印, 这样虽然能保证很好的不可见性, 但不具备篡改恢复功能。为了实现篡改恢复功能, 文献[5]提出了一种基于分层的半脆弱数字水印算法, 用于图像内容完整性认证, 篡改定位和恢复。将水印信息嵌入到原始图像所有像素的2bit最低有效比特, 这样虽然能够抵抗局部修改攻击, 但是对于JPEG压缩等正常处理不具备鲁棒性。

为了使半脆弱水印具有较强的抗JPEG压缩的能力, 同时对恶意篡改能进行有效的检测和恢复, 本文提出了先嵌入恢复水印再生成认证水印的半脆弱水印算法。其中, 将原始图象进行4×4分块, 然后以自同构映射块的平均灰度 (8bit) 作为恢复水印嵌入到该块的每个像素的2bit最低有效比特中, 这样每个块中就有32bit的容量可供嵌入水印, 采用多重嵌入的方法, 重复嵌入4次, 提取水印时采用多数表决的办法, 这样在恢复水印的时候提高了水印的安全性。利用图像块的DCT变换系数生成混沌迭代系统的初始值, 经过数次迭代以后生成待嵌入的认证水印, 选择DCT变换的中频系数之间的关系嵌入。该算法具有很好的抵抗JPEG压缩的能力, 对局部发生的篡改可以有效地检测, 精确定位并进行内容恢复。

1算法设计

本文提出了一种半脆弱数字水印算法用于篡改定位和恢复。其中, 对图像被篡改区域进行滤波处理可精确地定位出图像被篡改的位置, 而被篡改图像块的有效恢复是依赖于嵌入在另一个子块中的特征信息, 该嵌入块的确定是由Torus自同构映射一维变换计算得到的。下面分别介绍恢复水印嵌入、认证水印嵌入、篡改检测定位和恢复。水印算法过程如图1所示。

1.1基于分块的恢复水印嵌入

1.1.1 预处理

假设原始图像I为256灰度级, 大小为M×M, 其中M为4的倍数。对图像进行4×4分块, 得到图象的块数为 $Ν = \frac{Μ}{4} \times \frac{Μ}{4}$ , 按照从左到右, 从上至下的顺序, 对所有分块进行编号, 记为X=1, 2, …, N, 通过Torus自同构变换得到块映射序列A→B→C→D…→A, 并进行水印嵌入, 序列中的每个字母代表一个独立的4×4块, 即块A的亮度特征嵌入到块B中, 块B的亮度特征嵌入到块C中, 依此类推。Torus自同构映射一维变换公式计算一一映射序列, 如式 (1) 所示:

f (X) = (k×X) mod N+1 (1)

(1) 式中, X是原图象的块序号, f (X) 是自同构映射后的块编号, 0≤k<N, 且k必须为素数, k相当于一个密钥, 在不知道k的情况下, 其他人很难得到恢复水印, 从而增强了水印的安全性。只有当密钥k为素数时, X和f (X) 满足一一映射关系, 否则为多对一映射关系。

1.1.2 基于分块的恢复水印生成与嵌入

假设图像块A和B是原始图像I中的2个分块, 它们是一对Torus自同构映射, 即A→B, 计算出A块中所有像素的平均值作为恢复水印, 嵌入到嵌入图象块B每个像素的最后2 bit。图象块B有16个像素, 这样每个块中就有32 bit的容量可供嵌入水印, 采用多重嵌入的方法, 重复嵌入4次。为了提高水印安全性, 可以对B中所有的16个像素用Torus自同构映射进行重新排序, 即

f (i) = (k′×i) mod 16+1 (2)

(2) 式中, i是B块中原来每个像素的顺序 (按照从左到右、从上到下的顺序) , f (i) 是自同构映射后的像素编号。

经过上述步骤的处理, 恢复水印被嵌入到原始图像中。

1.2认证水印的生成与嵌入

1.2.1 认证水印的生成

利用混沌序列作为水印信号, 具有易于生成、数据极多以及初始条件敏感的优势, 将混沌序列的初始值作为嵌入和提取水印的密钥, 不仅简单而且实用。混沌迭代系统定义如下:

f (n+1) =1-η f (n) 2;η∈[0, 2];

f (n) ∈[-1, 1];n=0, 1, 2…… (3)

将嵌入恢复水印的图象进行8×8分块后进行DCT变换, 对变换矩阵zig-zag扫描后得到一个新的一维向量Vi (i=1, 2, …, 64) , 计算

IInitial= $\sum_{i = 2}^{21} V_{i} (4)$

得到混沌迭代系统的初始值f (1) , 带入 (3) 式中迭代n次得到f (n+1) , n为密钥, 提高了水印的安全性。认证水印w的生成如下定义,

$w_{i} = {\begin{cases} 1 ‚ f (n + 1) > 0 \\ 0 ‚ f (n + 1) \leq 0 \end{cases} i = 1, 2 ‚ \dots, \frac{Μ}{8} \times \frac{Μ}{8} (5)$

1.2.2 认证水印的嵌入

利用DCT系数的关联性来嵌入水印。选中每个8×8块中的固定的两个点 (U1, V1) 、 (U2, V2) , 对应的DCT系数分别为F (U1, V1) 、F (U2, V2) , 如果要嵌入的水印为1, 则令F (U1, V1) >F (U2, V2) ;如果要嵌入的水印为0, 则令F (U1, V1) <F (U2, V2) , 为了保证DCT系数的关联性从而提高水印的鲁棒性, 可以设置一个参数ddifference。例如F (U1, V1) >F (U2, V2) 且F (U1, V1) -F (U2, V2) <k, 则

在每个8×8的块中选择的两个点是 (5, 2) 和 (4, 3) , 这是因为:

1) 它们都处于DCT系数的中频部分且位置接近;

2) 它们在JPEG压缩时有相同的量化系数, 这样就可以很好的抵抗一般的JPEG压缩;

3) 它们在DCT变换后的系数相对较小, 作出改变后图象发生的改变较小。

经过上述步骤就完成了认证水印的嵌入, 再对每个8×8子块做DCT逆变换就得到了嵌入认证水印的图形。

1.3篡改检测和定位

要确定图像是否被篡改, 首先要提取认证水印来确定篡改区域。认证水印的提取是嵌入的逆过程, 将待检测的图像进行8×8分块后进行DCT变换, 对变换矩阵F′ (i, j) (i=1, 2, ……, 8;j=1, 2, …, 8) ;zig-zag扫描后得到一个新的一维向量Vi′ (i=1, 2, …, 64) , 根据 (4) 式计算出混沌迭代系统的初始值f (1) ′, 带入 (3) 式中迭代n次得到f (n+1) ′, 得到

对w1和w2进行比较, 如果w $_{i}^{1}$ =w $_{i}^{2}$ , 则第i块通过认证, 否则作出篡改标记。

由于对图像的正常修改 (如JPEG压缩) 而被标记的图像子块的分布是随机的, 而被恶意修改区域的图像子块则出现标记聚集。为了实现更精确的恶意篡改定位, 我们对篡改矩阵进行滤波处理。

篡改矩阵如下定义:篡改矩阵是 $\frac{Μ}{8}$ 行 $\frac{Μ}{8}$ 列的二值矩阵, 如果图像第i块矩阵作出篡改标记, 则对应的篡改矩阵的值就设为1, 否则为0。

下面给出稀疏点的定义:在一幅二值图像中 (不包括边界点) , 对于任一像素点, 若满足以下两个条件中任意一个, 即可视为稀疏点:

(1) 该像素点没有一个四连通点与之灰度值相同;

(2) 该像素点有且仅有一个四连通点与之灰度值相同, 但没有与该像素点灰度值相同的八连通点。

为了精确定位篡改区域, 我们需要在篡改矩阵中去掉这些稀疏点.所以, 对篡改矩阵做循环滤波, 直到没有这样的稀疏点存在为止.篡改矩阵在经过上面的滤波方法处理以后, 即得到最终的篡改定位矩阵。根据篡改定位矩阵我们可以找到图像被修改的区域。

1.4篡改恢复

经过水印检测与定位后, 遭受篡改的图像块均做出了标记, 因此只需恢复被篡改图像块, 未做出篡改标记的图像块保持不变。假设图像块X′有篡改标记, 由 (1) 式可知, 在水印嵌入过程中, 图像块X′的灰度特征是嵌入到图像块f (X) 中的。其恢复过程如下:

1) 根据密钥k和式 (1) 计算并定位图像块f (X) ;

2) 如果图像块f (X) 有篡改标记, 则无法恢复图像块X′;

3) 如果图像块f (X) 无篡改标记, 则从图像子块f (X) 每个像素提取最后2 bit, 采用多数表决的反法生成恢复水印, 该恢复水印即为对应图像子块X的灰度特征。

2实验结果

2.1不可见性

为了定量分析本文方法的优越性, 本文使用峰值信噪比PSNR 来带水印图像的质量好坏, 其定义为

$Ρ S Ν R = 10 \lg [\frac{255^{2}}{\sum_{j = 1}^{Μ} \sum_{i = 1}^{Μ} (Ι (i, j) - Ι^{'} (i, j))^{2}}]$ (9)

I和I′分别代表原始图像和嵌入水印的图像, PSNR可以反映原始图像和水印图像对应点之间的均方误差情况, PSNR值越大则表明加水印图像和原始图像之间差别越小, 不可见性越高。PSNR值受到ddifference影响, ddifference值越大则PSNR值越小, 水印的不可见性越低, 但是PSNR值越小则水印鲁棒性越低。图1给出了不同的ddifference值下的PSNR曲线表, 其中横坐标为ddifference值, 纵坐标为PSNR值。本文实验中我们选取ddifference值为0.4, 图3 (a) 为原始图像, 图3 (b) 为当ddifference值为0.4时嵌入恢复水印和认证水印后的图像。

2.2篡改检测与恢复

图4 (a) 和5 (a) 分别给出了剪切攻击和拼贴攻击后的水印图像, 图4 (b) 、5 (b) 给出了图像篡改定位的检测结果, 篡改定位部分用白色显示结果, 由图可见算法对剪切攻击和拼贴攻击有很好的检测效果和定位结果, 图4 (c) 、5 (c) 给出了篡改恢复图像

图6 (a) 、图7 (a) 分别给出了质量因子为50%和70%的JPEG压缩, 图6 (b) 、7 (b) 给出了图像篡改定位的检测结果, 没有显示出虚警检测, 由图可见算法对JPEG压缩所具有很好的鲁棒性。

3结束语

本文设计并实现了一种抗JPEG压缩的半脆弱数字水印算法, 本算法主要有以下几个特点: (1) 将恢复水印信息嵌入到原始图像所有像素的2 bit LSB, 采用多重嵌入的方法, 提高了篡改恢复效果, 算法实现原理简单, 篡改恢复效果好; (2) 将水印信息嵌入到各DCT变换域的中频, 可以保证水印算法对JPEG压缩具有较强的鲁棒性, 并且DCT变换又能够将嵌入的水印能量较好的分布到图像块的各部分, 这在一定程度上保证了所嵌入水印信息的不可见性; (3) 采用滤波的方法避免了JPEG压缩等正常操作造成水印检测的虚警, 提高了篡改检测的精确性; (4) 算法实现了无源提取, 是一种盲水印算法。本文算法经过实验验证可以检测出图像中篡改内容的位置, 并且可以对篡改内容进行有效的恢复, 同时能有效抵抗矢量量化攻击和局部修改攻击。

摘要：基于JPEG压缩的特性, 设计并实现了一种抗JPEG压缩的半脆弱数字水印算法, 用于图像内容完整性认证, 篡改定位和恢复。在嵌入方, 将恢复水印信息重复嵌入到原始图像所有像素的2bit最低有效位;认证水印利用图像块的DCT变换系数和混沌迭代系统生成, 并选择DCT变换的中频系数之间的关系实现嵌入。实验结果表明, 该算法具有很好的抵抗JPEG压缩的能力, 对局部发生的篡改可以有效地检测、精确定位并进行内容恢复。

关键词：半脆弱水印,篡改恢复,联合图像专家组 (Joint Photograplic Experts Group, JPEG) 压缩,DCT变换

参考文献

[1] Lin C Y, Chang S F.Semi-fragile watermarking for authenticating JPEG visual Content.Proceedings of SPIE:The International Society for Optical Engineering, 2000:140—151

[2]Winne D A, Knowles H D, Bull D R, et al.Compression compatible digital watermark algorithm for authenticity verification and localiza-tion.Proceedings of SPIE:The International Society for Optical Engi-neering, 2002:357—367

[3] Wang Xiangyang, Yang Hongying, Chen L, et al.A new semi-fragile image watermarking based on visual masking.Journal of Image and Graphics, 2005;10 (12) :1548—1553

[4] Celik M U. Hierarchical watermarking for secure image authentication with Localization.IEEE Trans on Image Processing, 2002;11 (6) :585—595

数字图像:压缩技术篇7

1 主成分分析法概念及性质

1.1 概念

假定有n个样本, 每个样本由p个变量构成, 则可以组成一个n×p阶的数据矩阵:

设x1, x2, …, xP为原变量, z1, z2, …, zm (m≤p) 为新变量, 则:

系数lij为新变量对原变量的反应情况。

1.2 性质

zi与zk (i≠k;i, k=1, 2, …, m;j=1, 2, …, p) 相互无关;z1是x1, x2, …, xP的一切线性组合中方差最大者, z2是与z1不相关的x1, x2, …, xP的所有线性组合中方差最大者;zm是与z1, z2, ……, zm-1都不相关的x1, x2, …xP的所有线性组合中方差最大者。则新变量指标z1, z2, …, zm分别称为原变量指标x1, x2, …, xP的第1, 第2, …, 第m主成分。

通过以上表述可知, 主成分分析的实质是计算主成分zi (i=1, 2, …, m) 所反映的原变量xj (j=1, 2, …, p) 上的荷载lij (i=1, 2, …, m;j=1, 2, …, p) 。它们分别是相关矩阵 (也就是x1, x2, …, xP的相关系数矩阵) m个较大的特征值所对应的特征向量。

2 计算步骤

2.1 计算相关系数矩阵

SAR图像压缩技术研究综述篇8

合成孔径雷达(Synthetic Aperture Radar,SAR)因具有全天候，全天时对地球表面进行观察的能力以及不受天气、光照等条件的限制和空间分辨率高的特点，使得SAR在民用和军事方面发挥着越来越大的作用。自从50年代Wiley首次提出SAR的概念以来，SAR技术不断发展，许多新概念的提出，如运动补偿、自聚焦、聚束照射、多视处理、逆SAR(ISAR)和干涉SAR等不但完善了SAR技术，而且扩展了它的应用范围。纵观国外合成孔径雷(SAR)的发展过程可以看出，合成孔径雷达(SAR)已经开始经历单波段向多波段、单极化向多极化、固定人射角向多人射角、单工作模式向多工作模式的逐渐发展，天线也经历了固定波束视角、机械扫描、一维电扫描及二维相控阵的发展过程[1]。SAR系统获得的数据量是巨大的，美国SAR地面处理系统ASF(Alaska SAR Facility)每天处理的SAR数据为9600MB[2]，早在1991年发射的ERS-1卫星的星载SAR数据率已经达到105Mb/s，机载和星载SAR系统都产生大量的遥感数据，通常SAR的数据传输率为每秒数百兆比特，并且随着国内外合成孔径雷达(SAR)的不断发展，分辨率的不断提高，星载、机载雷达的不断出现，这无论是对大容量存储还是高速传输都提出了巨大挑战，因此研究SAR图像的高效压缩具有重要意义。

与光学图像不同，SAR数据具有高的动态范围、固有斑点噪声、像素相关性小和纹理边缘处具有重要的高频率成分等特性，经典的图像压缩算法并不适应于SAR图像，对SAR图像进行压缩是十分困难的。目前尚未有一种通用的高效SAR图像压缩算法，这便促使当前寻求对SAR图像高效压缩的形势更加迫切。

2 SAR图像的统计特征及其特点

图像的统计特性对压缩编码是十分重要的，因为从数据本身来说，实现数据压缩的本质在于对数据统计冗余的压缩。SAR图像的特征可以由均值、方差、最大值、最小值和相关系数等统计特征来简单描述。其中均值主要反映了SAR图像幅值中直流分量的大小;方差主要体现了SAR图像中内容的活动性;最大值和最小值描述了SAR图像的动态范围。

与光学图像不同，SAR图像服从特定的统计特性，通常说来，单视SAR幅度图像服从瑞利分布,而多视图像服从2N个自由度的Γ分布。同时由于受到乘性相干斑噪声的干扰，使得SAR图像中相邻像素的相关性降低[3],因此相比一般的光学图像，其特点十分显著。

2.1 SAR图像的斑噪声

相干斑是SAR图像的重要特征，它与光学图像中的噪声有本质的不同，它是由发射波、回波以及其它干扰波相互作用而形成的，这与普通图像中噪声的形成有着本质区别。由于采用了相干成像机理，雷达接收到的回波信号包含了一个分辨单元内部许多基本散射体的回波，不同散射体的散射系数是不同的，且由于物体表面的粗糙性，导致回波在相位上已非相干，致使回波强度随像素而发生变换，从形成斑噪声(Speckie)。在图像的均匀区域，标准偏差与均值的比率是衡量斑点噪声强度的一个较好的指标[4],定义这一指数为斑点噪声指数：

斑噪是所有基于相干原理的成像系统所固有的原理性缺陷，是SAR成像系统不可避免的。斑噪声既降低了图像的质量，又严重影响了图像在分割、压缩等方面的后续应用。

2.2 SAR图像的动态范围

SAR图像采用相干原理成像，反映了所探测分辨单元内的后向散射特性，由于雷达的地表后向散射系数的差异很大，出现大量纹理细节，使得SAR图像具有较大的方差，又由于受到乘性噪声的污染，使得SAR图像具有很大的动态范围，即最大值和最小值间的差值很大。图像的动态范围反映了图像区域地面目标后散射系数的差异:

其中Imax、Imin分别为图像灰度的最大值和最小值。

2.3 SAR图像的相关性分析

相关系数是反映图像中各像素相关程度的变量，它随像素间距离的变化而改变，是衡量图像压缩率的重要参数之一。对图像自相关特性的研究有助于对图像的压缩性能进行整体地预测和M∑评N∑估[，f且(i,j对)-于f-]压[f(缩i+算l,法j+的k)选-用f-]具有一定指导作用。根据相关系数公式：

由(3)对光学图像和SAR图像的相关系数作实验可知(图1)，在相同距离的条件下，SAR图像相关系数相比光学图像的相关系数要小的多，且随着距离的增加SAR图像的相关系数减小的趋势要比光学图像明显。由此可得结论：SAR图像具有较差的相关性，很难通过减少其相关性来达到高压缩比。

3 SAR图像的压缩编码概述

根据编码方法的不同图像编码技术可分为“第一代”图像编码和“第二代”图像编码的概念，“第一代”图像编码包括熵编码，预测编码，变换编码以及矢量量化编码，是以信息论为理论基础，旨在去除图像数据中统计冗余的一类编码技术。但是，“第一代”图像编码在去除冗余信息的能力已经接近极限，基于SAR图像的上述特点，采用“第一代”的图像压缩方法对SAR图像的压缩是十分困难的，其压缩比不高。“第二代”图像压缩编码包括子带编码，分形编码，小波变换，模型基编码和神经网络等。它并不局限于信息论框架，其充分利用人的视觉生理心理和图像信源的各种特征，因此获得了较高的压缩比。针对SAR图像的特点，近20年来，学者们提出了许多针对SAR图像的压缩方法，它们大多都是对不同编码技术的改进与结合，如基于矢量量化、SAR图像内容、小波变换、压缩感知等SAR图像压缩方法，这些方法都在SAR图像压缩方面展现出一定优势，并且可以根据需要灵活运用于图像的编码过程中，以便提高编码效率和性能。

3.1 基于矢量量化编码的SAR图像压缩

矢量量化(VQ)是标量量化的推广，其基本思想是利用像素之间的相关性将输入数据划分为若干组，在量化时以组为单位进行量化，效率较标量量化有显著提高。SAR图像像素之间相关性比较弱，但考虑到矢量量化在信源弱相关的条件下，也能取得比较好的压缩效果，因此将矢量量化用于SAR图像压缩中取得了一定进展，矢量量化算法已被建议用于SAR图像压缩[5]。针对适量量化算法中码书自适应性不强的特点，文献[6]提出了一种更为高效的新型自适应LBG矢量量化算法,该算法在LBG算法码书中利用点到线的垂线关系基础上进行了改进,进一步的自适应化迭代进而获得了更小的残差，并应用于干涉高光谱图像的无损压缩中，压缩性能有了显著提高。邓云凯[7]提出了一种基于改进矢量量化的SAR图像压缩算法，针对SAR图像纹理丰富，容易受到斑点噪声影响的特点，改进算法将区域整体图像信息从量化空间中分离出来，只对主要是纹理信息的剩余信息进行量化而且删除了每次聚类后含有最少矢量的胞腔。该算法有效的减少了量化空间大小，使生成码字分布更加合理，不仅提高了SAR图像整体压缩效果，同时在斑点噪声抑制方面做出了有益的工作。

但是矢量量化编码技术一个缺点是其复杂度大，并且随着维数的增加呈指数级增加，严重影响高维的矢量量化器的实现。以码书的训练为例，其码书形成过程是非常耗时的，不适应于实时性要求较高的应用。而且码书并不具有通用性，因此，虽然人们提出了许多矢量量化编码技术，但是并未广泛的应用到实际的系统之中。

3.2 基于小波的SAR图像压缩

小波变换是变换编码的一种，与傅立叶等变换不同，小波变换具有良好的时频特性，通过伸缩和平移可以对图像进行多尺度分析，能有效的提取图像中的内容，因此在图像编码中得到广泛应用。随着小波包技术、多小波技术、嵌入式小波零树图像编码(EWZ)技术、分层小波树集合分割算法(SPIHT)技术的相继出现，小波图像压缩被认为是当前最有发展前途的图像压缩算之一。JPEG2000于2000年被确定为静态图像的新一代编码标准,其中最大改进是用小波变换代替余弦变换。以小波变换为基础，发展了多种针对SAR图像的压缩算法，文献[8,9]研究使用JPEG2000对SAR图像进行压缩，并针对SAR图像的特点对算法进行相应的调整和优化，其基本思想是在使用JPEG2000对SAR图像进行压缩之前，首先使用滤波器对图像进行平滑处理，减少噪声的影响，这种方法取得了较好的效果。基于分层树的集合划分(Set Partitioning In Hierarachical Trees,SPIHT)算法也是小波变换压缩编码的典型应用，文献[10]给出了利用改进SPIHT算法实现对SAR图像的压缩，运用了统计方法对小波系数按其幅值分布区间进行重排，并设计阈值对重要比特进行优先传送。文献[11]提出了一种基于提升格式小波的SPIHT图像压缩算法,该算法采用Daubechies9/7双正交小波的提升格式进行小波变换,然后采用SPIHT算法对变换系数进行编码,可实现任意码率的压缩，对SAR图像实现任意码率的压缩也具有一定指导意义。

为了有效改善小波变换在图像方向性信息方面表示的不足，有学者提出了Contourlet和Bandelet两种变换[12][13]，它们具有多分辨率、局部化和方向性等特征，能很好地刻画图像轮廓和纹理，所以在新一代图像压缩中常与小波变换结合使用。文献[14]提出了一种基于Bandelet和SPIHT算法的压缩方法，文献[15]将第二代Bandelet变换应用到SAR图像压缩上，在bpp值较高的情况下，提高了SAR图像的压缩性能。文献[16,17]研究了基于小波的Contourlet变换，采用传统的张量积小波变换取代其中的拉普拉斯金字塔式变换可获得非冗余的变换形式，然后用方向滤波器组把高频子带分解为多个方向子带，之后对每个方向子带进行Bandelet变换,从而更稀疏表示了图像的边缘和纹理，达到压缩的目的，这对具有丰富纹理特性的SAR图像压缩也具有借鉴意义。

但是小波变换依然存在发展的空间。首先对同一幅图像,使用不同小波基进行图像压缩,效果往往是不同的，如何选择最优的小波基将成为图像压缩成为难点。其次小波图像压缩还远远没有充分利用人眼视觉特性,进一步将人眼视觉特性应用到小波压缩编码中,可更深层次地发掘图像压缩编码的潜力。

3.3 基于内容的SAR图像压缩

SAR图像具有极低的相关性，这就导致传统的以去除图像相关性为目标的压缩技术在对SAR图像进行处理时很难在压缩性能上获得突破，因此，新的基于图像内容的压缩方法得到了广泛关注。其基本思想是首先对图像进行分割，分离出目标区域和背景区域，针对不同的区域采用不同的压缩方法，以达到高效压缩的目的，其流程图如图2所示。在基于SAR图像内容的压缩算法中，文献[18]使用自动目标识别算法对目标区域进行检测，并采用子带编码和矢量量化编码为目标区域分配更多的比特，取得了较好的效果。文献[19]对SAR图像使用自动目标识别方法进行分割，并产生目标区域和背景区域，对背景区域进行高倍率有损的压缩，而对目标区域使用无损的压缩，从而使SAR图像得到高效的压缩。

但是基于内容的图像压缩要求寻找到较好的图像分割算法，而当前针对SAR图像的目标自动检测方法也处于发展阶段，没有较通用的算法。因此，将高效图像分割算法与图像压缩算法合理的结合在一起是基于内容的SAR图像压缩方法必须面对的问题。

3.4 压缩感知在图像压缩方面的应用

自Donoho、Candes以及Tao等人提出压缩感知(Compressive Sensing,CS)理论[21][22][23]以来，它便在信号、图像压缩方面起到重要作用。与通常的数据采样定理不同，该理论提出可以用远远少于传统采样定理所需的采样点数或观测点数恢复出原信号或图像，它将信号的采样、压缩及编码合并在了同一步骤中，在采样的过程中直接提取信号的少量重要信息，并用它们来重构图像。文献[24]分别选取了10K、25K、20K、25K个采样值对Lena图进行压缩，达到了较好的效果。压缩感知算法正处于蓬勃的发展阶段，已在SAR图像成像前的压缩处理中取得了成果，但是针对SAR图像的压缩感知研究仍处于起步阶段，还未能达到其他压缩方法的效果。

4 结束语

数字图像:压缩技术篇9

关键词：DICOM,压缩,存储,提取,量化因子

0 引言

随着医学影像技术的发展,出现了包括计算机断层扫描(CT)、核磁共振(MRI)、超声成像(US)、数字减影血管造影术(DSA)等多种医学成像方法和设备,为疾病的诊断提供了重要的依据。需要PACS(Picture Archiving and Communication System)解决数据传输和图像存储,因此如何利用有限的存储空间存储更多的图像,即医学图像压缩成为PACS关键的技术之一。

在PACS的发展过程中,由于医学数字图像的图像格式、传输方式在不同的影像设备和系统中千差万别,给PACS及各种设备之间的图像及其相关信息的交换带来了很大困难。为此,美国放射学会(American College of Radiology:ACR)和美国全国电子厂商联合会(National Electrical Manufactures Association:NEMA)于1985年联合建立了医学数字图像通讯DICOM标准,以利于规范图像及其相关信息的交换。DICOM图像数据源的最大特点是数据量巨大,在医院每天产生的图像及附属信息数据量可以从几十Mb到几十Gb,其中90%以上是图像数据。如此巨大的数据量使得存储空间的管理、图像存取速度和数据可靠性成为重要的问题。其中,对图像进行压缩处理是解决存储空间的一个重要方法。因此,在DICOM作为医学图像与通信的重要标准中,加入了对图像压缩算法的支持。

1 DICOM医学图像压缩技术介绍

图像压缩目的是尽量减少表述数字图像时需要的数据量。通常是通过改变图像的表示方式来达到的,因此压缩和编码是分不开的。第一代图像压缩编码主要是基于信息论的编码方法,压缩比较小。其中变换压缩编码与量化压缩编码是当时的研究热点。变换压缩编码是通过对图像进行正交变换,然后通过量化去除对视觉影响不大的高频分量,再采用行程编码或哈夫曼编码达到压缩效果。按照正交变换的不同,常用的变换压缩编码又分为Karhunerr Loeve变换,离散余弦变换,离散哈德玛变换,离散斜变换等,由于离散余弦变换压缩编码算法具有编码效果较好、运算复杂度适中等优点,目前己经成为国际图像编码标准的核心算法。

近年来,出现了许多新的编码算法,如基于对象(Object-Based)的算法、基于模型(Model-Based)的算法、人工神经网络(Artificial Neural Network)的算法、小波(Wavelet)算法等等。

2 DICOM医学图像压缩的实现

首先,将DICOM文件中的图像部分提取出来,转换为BMP这种通用格式的文件。然后,将DICOM文件中的非图像信息部分存储到文本文件中,将非压缩的BMP图像转换为JPEG标准的压缩图像,将JPEG标准的图像和非图像信息部分封装到DICOM格式图像中去。其压缩流程如图1所示。

2.1 DICOM非像素信息部分的提取

根据对DICOM图像文件结构的解析,我们知道DICOM图像文件的数据元素中包含了大量的非图像信息,这些在DICOM标准的PS3.6部分可以查到。数据元素包括了标签、数据类型、数据长度、数据值域等内容,标签在数据元素的最开始位置,唯一标志了数据元素,因此可采用查找标签的方法来确定数据元素。本文采用的思路是首先建立数据元素的字典,然后读取DICOM文件,跳过文件头,取得数据元素的入口地址,开始查找标签并与数据字典中的标签比对,找到相应的VR字段,确定传输语法,并根据数据长度VL取出相应字节数,最后根据传输语法及VR来确定该元素的值,这是一个循环遍历过程,直到查找完最后一个数据。

(1)数据字典的建立

首先,定义一个结构体变量:

然后定义一个结构体变量的数组,按照DICOM标准的PS3.6部分制作数据字典:

(2)数据元素的获取及显示

定义如下结构体变量用来存储查找得到的结果:

用一个List Control控件显示数据元素,并将结果保存到文本文件中。

2.2 DICOM图像转化为BMP图像

DICOM文件可能封装了多幅图像,对于这样的DICOM文件,需要找到每幅图像的偏移量,根据偏移量分次转换。在DICOM图像文件转换为BMP文件只需把DICOM中的像素数据输出到BMP文件即可,但在转换前需考虑窗宽和窗位的问题。

所谓的窗宽是指图像数据显示的范围,窗位是指图像数据显示的中心值,两指标的值根据不同的生理组织结构设定不同的值,当把DICOM文件的全部像素读入内存后,就要考虑如何把DICOM显示到屏幕上,由于DICOM图像像素的灰阶可达到216,而系统的调色板只能显示28种颜色,所以为了较逼真的显示医学图像的全部信息,必须对图像数据进行窗宽、窗位的调整,把窗口区域图像数据线形的转换到显示器的最大显示范围内,这样就可以动态调整窗宽和窗位,观察医学图像的全部信息。可对图像的每个数据按照式(1)进行转换,把数据压缩到256个灰度等级。

式中:y为显示的位图灰度值,x为图像的数据,w为窗宽,c为窗位。

由于DICOM图像和BMP所规定的图像数据的存储顺序不同,所以在存放BMP数据时,其顺序是先从最后一行开始,依次向上,直到第一行。

2.3 BMP转化为JPEG的实现

BMP转化为JPEG一般需要以下步骤:

(1)色系变换:由于BMP采用了RGB色彩模式而JPEG采用了YCbCr的颜色模型,所以BMP转换为JPEG的准备工作就是色系变换。

(2)离散余弦变换:根据前面所讲知识,离散余弦变换的目的是把图像从空域变换到频域。经过DCT变换后,矩阵数据称为频率系数,其值以F(0.0)最大,称为DC,其余的63个接近于0的浮点数统称为AC。

(3)量化:量化需要两个8×8矩阵,分别用来处理亮度和亮度频率系数。量化就是使用量化表对离散余弦变换系数进行量化,量化表是根据人的视觉系统和压缩图像类型特点进行优化的量化系数矩阵,滤掉那些总体上对图像不重要的部分,这一步是有损压缩,量化矩阵的值越高,从图像中丢弃的信息就越多,压缩率就越高,因此在JPEG压缩时可选择一个量化因子,该因子的值决定了量化系数矩阵中的数值。本文在进行压缩时选择的量化因子取值范围为[0,100],可根据图像内容或用途选择不同的量化因子,在压缩比和压缩质量之间进行取舍。

(4)ZigZag扫描:ZigZag扫描的目的是为了解决量化后频率系数AC为0的问题。经过编码,8x8的矩阵变为一维向量,这样增加了AC连续为0的几率,在下一步编码时可节约码率,ZigZag扫描过程如图2所示。

(5)游程编码(RLE):游程编码所要编码的是63个频率系数AC,经过ZigZag扫描,一维向量中的64个元素许多的系数都是0而且是相邻的,采用游程编码可大大提高压缩效率。

(6)霍夫曼编码:霍夫曼是一种变长编码,对频率系数AC和DC采用不同的编码方式,再加上对亮度和色度的编码,一共需要四个霍夫曼编码表才能完成霍夫曼的解码工作,这些霍夫曼表存储在JPEG文件结构中的“霍夫曼表定义段”。

2.4 JPEG封装为DICOM压缩图像

JPEG图像转换为DICOM文件需要将DICOM转换为BMP时的非像素信息再次附加到DICOM的数据元素中去。对DICOM非像素信息的操作为:首先读取保存的DICOM非像素数据,然后将其构造为数据元素。对于JPEG文件,首先判断是否解压缩,如果未解压缩,则解压缩并提取相关信息,对非像素数据和像素数据按不同方式构造为数据元素,再次写入DICOM本身的非像素信息,生成DICOM文件,其流程如图3所示。

2.5 结果分析

2.5.1 DICOM非像素信息提取结果

根据前而对DICOM非像素信息部分格式的分析,编程实现对各字段值的提取。图4为程序读取数据元素的属性描述和属性值字段值的结果。

2.5.2 不同量化因子下图像质量及压缩比

本文选用了一幅的DICOM图像,名称为test dcm,将其转换为BMP图像后进行JEPG压缩。在进行BMP到JPEG的转换过程中,对量化因子进行了设置,设置量化因子为10的整数倍进行转换。图6~图8为原始图像和量化因子分别为10,50,100的图像。

从上述可知,量化因子越大,图像在转化过程中丢失的信息越少,图像越清晰,但转换后的文件较大,压缩比低,量化因子越低,转换后的文件越小,压缩比也高。表1所示不同量化因子下的图像压缩比和这一理论完全符合。

3 结论

在PACS系统中.使用图像压缩技术,以减少医学图像的精度为代价来获取更大的存储空间,也使图像在医院PACS系统中传递的速度更快,大图像显示的时间更短。尤其在如今的区域医疗中,同一病人在各个医院之间的图像需要相互传递调阅时,医学图像的压缩就显得更加关键。

注:压缩比=BMP图像大小/JEPG图像大小

本文通过编程实现了对DICOM图像的压缩,在图像压缩的实现过程中,引入了量化因子的概念,可根据图像实际内容调整量化因子的值,在图像压缩比和图像质量之间达到最优选择,如果图像用于存储,则可适当降低图像质量,以减小文件所占空间大小,降低存储成本。

参考文献

[1]吕旭东.一种电子病历系统体系结构及其关键技术[J].中国生物医学工程学报,2008,(2):199-205.