离散余弦变换论文

2024-11-01

离散余弦变换论文（精选7篇）

离散余弦变换论文篇1

摘要：本文论述了DCT系数的选取原理和方法, 介绍了HVS三个主要特性在DCT域水印上的数学模型。讨论了基于HVS特性的图像自适应DCT水印算法。利用HVS模型根据图像局部特征实现水印自适应地嵌入。

关键词：DCT,水印,HVS,算法

0 引言

基于离散余弦变换 (Discrete Cosine Transform, DCT) 的数字水印根据对宿主图像的计算方法不同, 分有两类:一类是直接对整幅图像进行DCT计算, 选取合适频段的系数来嵌入水印;另一类是, 首先将整幅图像分成若干小块, 对每一小块分别进行DCT计算, 再在每一块中选取合适频段的系数, 将水印信息分散嵌入到所选取的系数中。这种方法称为分块DCT。下面我们主要针对分块DCT具体进行分析和论述, 并在此基础上, 讨论一种基于人类视觉特性的DCT数字水印设计方案与实现技术。

1 基于DCT变换域的数字水印模型

由于数字图像经DCT变换后以频率的形式表现出来, 如果直接对频率分量系数作修改以嵌入水印后再进行反变换, 即可得到含有水印的图像, 这样一来大大提高了数字水印的鲁棒性, 使得基于DCT变换域的数字水印理论与技术得到了较为广泛地应用。

数字水印的检测系统用来检测待检图像是否含有水印, 其输出是一个二值判断信息, 通常用l个bit来表示, 如“1”表示含水印, “0”表示不含水印。如果从待检图像中检测到水印, 则进一步提取出水印, 进行水印解码, 恢复原来嵌入到图像中的水印信息。

在许多实际应用中, 通常只需要证明图像中是否含有水印, 并不进行水印的提取。水印的解码方式与水印嵌入时采用的编码方法密切相关, 不同的编码方法采用不同的解码方法。图1是基于DCT变换域的水印检测与提取过程图。

如图1所示, DCT域水印的检测和提取过程, 将待测图像Y进行DCT运算;然后按着嵌入水印时选取的DCT系数, 选取其含有水印的系数, 进行水印提取;然后利用水印检测方法判断水印是否存在。如果水印检测器输出结果显示水印存在, 则根据需要可以用水印解码器, 对提取的水印进行解码, 恢复水印。

2 人类视觉系统感知模型

医学研究表明, 人类视觉系统 (Human Vision System, HVS) 类似于一个光学系统, 但不是普通意义上的光学系统, 它受到神经系统模型的调节。

研究HVS对于图像的感知特点, 建立HVS数学模型, 对于提高数字水印的不可感知性和鲁棒性具有重要意义。许多数字水印方法应用了HVS模型, 嵌入图像自适应水印, 对于减小水印对图像的影响, 增强鲁棒性, 取得了较好的效果。目前出现的很多水印算法都利用了HVS的特性来限制水印嵌入的位置和强度, 试图达到最大的嵌入强度和最好的视觉不可见性。

而对人类视觉影响最大的图像因素就是背景照度、背景纹理和信号频率, 而这三点决定了对比度门限值, 只要迭加的信号低于对比度门限, 视觉系统就无法感觉到信号的存在。因此应对这三个要素进行建模。

3 基于HVS的DCT域数字水印方案

下面我们结合HVS特性, 设计一个数字水印算法, 此算法采用通用加性水印模型:

设计一个图像自适应水印方法, 设计更优的水印嵌入强度, 即使其结合图像对HVS产生影响的三个主要因素, 确定H V S掩蔽因子, 进而根据图像局部纹理特性的不同而变化, 尽可能根据不同区域的特性加大水印嵌入强度, 增加鲁棒性的同时, 保证良好的透明性。

3.1 确定HVS掩蔽特性因子

下面我们具体说明HVS特性因子的确定方法。

3.1.1 背景照度掩蔽因子的确定

我们知道, 图像DCT系数的DC分量代表了图像的平均亮度, 因此块DCT的DC分量就代表了这一块图像的平均亮度。块DC分量是块DCT系数矩阵的第一个元素, 即ck (1, 1) 是第k块的DC分量, 用Lk表示。

令第k块的背景照度掩蔽因子是第k块的DC分量与整幅图像所有图像块的DC分量的平均值之比:

其中, 是所有图像块的DC分量的平均值, 表示整幅图像的平均亮度, 用下式计算:

从式 (1) 我们可以看出, 当图像块的亮度大于平均亮度时, 背景照度屏蔽因子的值就大于1, 否则小于1:

3.1.2 频率掩蔽因子的确定

令频率掩蔽因子是本块的频率掩蔽与全图所有块的频率掩蔽的平均值之比:

其中, 是平均频率掩蔽, 由下式计算:

从式 (4) 我们可以看出, 当图像块的频率掩蔽大于平均频率掩蔽时, 频率掩蔽因子的值就大于1, 否则小于1。

3.1.3 纹理掩蔽因子的确定

确定一个图像的纹理是否复杂, 我们可以对其进行边缘检测, 显然边缘多的图像区域纹理就复杂, 可嵌入的水印强度就大。我们利用边缘检测算子, 对整幅宿主图像进行边缘提取, 然后计算每一个8×8块的区域内位于边缘上的像素点个数。每块图像中含有的像素点的多少反映了这块图像的纹理复杂度。

纹理掩蔽因子就是本块的纹理复杂度与平均纹理复杂度之比, 即边缘点个数与平均边缘点个数之比:

其中, Pe, k表示第k块的位于边缘上的像素点个数, 表示平均边缘像素点个数, 其值由下式计算得出:

其中, Pe表示整幅图像位于边缘上的像素点的个数。

从式 (6) 我们可以看出, 当图像块的纹理复杂度大于平均纹理复杂度时, 纹理掩蔽因子的值就大于1, 否则小于1。

由以上三个HVS掩蔽因子的确定方法可以看出, 水印嵌入模型是根据图像局部特征自适应地嵌入水印的。对于纹理复杂, 高亮度, 高频率的区域嵌入水印强度就大, 反之嵌入强度小。

3.2 水印嵌入模型

对大小为M×N的宿主图像S进行8×8的块DCT变换, 则S被分成Bnum块:

对每一块从中频段取出系数ck (i, j) , 嵌入水印信号。其中, k表示第k个大小为8×8的DCT块, k∈{1, 2, …, Bnum}。 (i, j) 表示第k块的第个DCT系数, i, j=1, 2, …, 64。我们在中频域选取 (i, j) 。

图像自适应水印嵌入模型用下式表示:

其中分别为三个HVS特性因子:背景照度掩蔽因子、频率掩蔽因子和纹理掩蔽因子是常数, 表示平均的水印嵌入强度因子。

3.3 水印嵌入步骤

(1) 将宿主图像分成8×8的块, 每一块都进行DCT变换, 得到与宿主图像相同尺寸的DCT域系数矩阵:

(2) 对每个8×8的DCT系数矩阵, 按照上节所述, 计算HVS三个掩蔽因子:

(3) 我们用密钥生成长度为Nw的Guassian白噪声作为水印信号:

(4) 将每个8×8的DCT系数矩阵, 从每一块的中频段取出个系数:

(5) 按照下式嵌入水印:

(6) 用得到的新的DCT系数对原来位置的DCT系数进行置换。

(7) 对新的DCT系数矩阵进行DCT反变换, 得到了嵌入水印信号的图像X。

3.4 水印检测步骤

由于我们用Guassian白噪声作为水印嵌入到DCT系数中, 因此我们直接用相关检测法检测水印。

(1) 对含水印图像进行8×8的块DCT变换。

(2) 对每一块的DCT系数进行“之”字型排列, 从我们己知的嵌入位置取出可能含有水印的系数将所有提取出的系数, 按顺序组成新的系数序列:

(3) 用密钥生成水印信号:W～N (0, 1) 。

4) 利用相关法检测水印。

前面说过, 考虑到水印的鲁棒性和安全性, 水印信息一般首先被调制成伪随机序列, 然后再嵌入到宿主图像中。根据概率论可知, 两个互不相关的随机序列的相关系数 (或称为标准协方差) 为0, 如果是线性相关的, 则相关系数大于0, 最大相关系数为1。根据这一原理, 我们可以通过计算提取出的水印序列与原水印序列的相关系数来判断水印是否存在。

4 实验结果

实验中用标准Lena灰度图像作为宿主图像, 如图2所示。用另一幅文字图片作为水印, 格式为JPEG, 如图3所示。可宿主图像的每一个8×8DCT系数的中频段选取16个系数嵌入水印。图4为嵌入水印后的图像, 可见视觉效果很好。图5为水印检测后的输出结果。

5 结束语

本文对DCT域的数字水印进行了较为深入的探讨, 详细论述了DCT系数的选取原理和方法, 介绍了HVS三个主要特性在DCT域水印上的数学模型, 并在此基础上, 讨论了基于HVS特性的图像自适应DCT水印算法, 利用HVS模型根据图像局部特征实现水印自适应地嵌入。试验结果证明这种方法对于图像压缩、噪声攻击、直方图攻击和中值滤波等常见的攻击或图像处理具有很好的鲁棒性。

参考文献

[1]赵春晖, 王小辉, 孙兵.基于分块DCT变换的HVS模型加权数字水印算法[J].应用科技.2001.

[2]Chih-Wei Tang Hsueh-Ming Hang.A Feature-based Robust Digital Image Watermarking Scheme[J].IEEE Transactions on Sig-nal Processing.2003.

[3]Adnan M.Alattar Eugene T.L in Mehmet Utku Celik, DigitalWatermarking of Low Bit-Rate Advanced Simp leProfile MPEG-4Comp ressed Video.IEEE Transactions on Circuits and Systems forVideo Technology.2003.

[4]王方, 林泓.基于DCT变换的彩色图像数字水印嵌入算法研究[J].软件导刊.2007.

基于离散余弦变换的图像压缩研究篇2

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50年的历史了。20世纪50年代和60年代的图像压缩技术由于受到电路技术等制约,仅仅停留在预测编码、亚采样以及内插复原等技术的研究上,还很不成熟。自80年代后期以来,由于小波变换理论、分形理论、人工神经网络理论、视觉仿真理论的建立,人们开始突破传统的信源编码理论,例如不再假设图像是平稳的随机场。图像压缩编码向着更高的压缩比和更好的压缩质量的道路前进,进入了一个崭新的、欣欣向荣的大发展时期。

1 图像的编码表示

本质上说,图像压缩就是对要处理的图像源数据用一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息的目的。压缩通过编码来实现,所以,一般把此项处理称为压缩编码。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息,也就是用一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量。

在数字图像压缩中,有三种基本的数据冗余:像素相关冗余、编码冗余、心理视觉冗余。如果能减少或者消除其中的一种或多种冗余,就能取得数据压缩的效果。无损压缩也称冗余度压缩方法,利用数据的统计冗余进行压缩,具体来说就是解码图像应与压缩编码前的数据严格相同,没有失真,从数学上讲是一种可逆运算。有损压缩方法也称为信息量压缩方法,利用了人类视觉或听觉对图像或声音中某些频率成分不敏感的特性,允许压缩过程中损失一定的信息,所损失的部分对理解原始图像的影响较小,却换来了大得多的压缩比。

2 离散余弦变换理论基础

在图像处理的广泛领域中,傅里叶变换起着非常重要的作用,包括图像增强、图像分析、图像复原和图像压缩等。在图像数据的数字处理中常用的是二维离散傅里叶变换,它能把空间域的图像转变到频域上进行研究,从而很容易地了解到图像各空间频域成分,进行相应处理。在计算机上使用的傅里叶变换通常都是离散形式的,使用离散傅里叶变换的根本原因有:第一,DFT的输入、输出均为离散形式的,有利于计算机处理;第二,计算机DFT存在快速算法——快速傅里叶变换。

离散余弦(Discrete cosine Transform,DCT)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换,但是只使用实数,相当于一个长度大概是它两倍的离散傅里叶变换。通常所说的离散余弦变换指的就是这种。它的逆通常相应地被称为反离散余弦变换、逆离散余弦变换或者IDCT。任何连续的实对称函数的傅里叶变换中都只含余弦项,因此余弦变换与傅里叶变换一样有明确的物理量意义。因此经常被图像处理使用,用于对图像进行有损数据压缩。这是由于离散余弦变换具有很强的“能量集中”特性:大多数的自然信号的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔可夫过程的统计特性时,离散余弦变换的去相关性接近于K-L变换(Karhunen-Loève变换),它具有最优的去相关性性能。

3 使用离散余弦变换进行图像压缩

离散余弦变换是先将整体图像分成N×N像素块,然后对N×N像素块逐一进行离散余弦变换。由于大多数图像的高频分量较小,相应于图像高频成分的系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化,因此传送变换系数所用的数码率要大大小于传送图像像素所用的数码率。到达接收端后,再通过反离散余弦变换回到样值,虽然会有一定的失真,但人眼是可以接受的。

M×N维矩阵A=(ajk)的离散余弦变换定义为:

$b_{u v} = c_{u} c_{v} \sum_{j = 0}^{Μ - 1} \sum_{k = 0}^{Ν - 1} a_{j k} \cos \frac{(2 j + 1) u π}{2 Μ} \cos \frac{(2 k + 1) v π}{2 Μ}$

其中,cu,cv由下式确定:

$\begin{array}{l} c_{u} = {\begin{cases} \frac{1}{\sqrt{Ν}}, u = 0 \\ \frac{2}{\sqrt{Ν}}, 1 \leq u \leq Ν - 1 \end{cases} \\ c_{v} = {\begin{cases} \frac{1}{\sqrt{Ν}}, v = 0 \\ \frac{2}{\sqrt{Ν}}, 1 \leq v \leq Ν - 1 \end{cases} \end{array}$

其离散余弦变换为:

$a_{j k} = \sum_{j = 0}^{Μ - 1} \sum_{k = 0}^{Ν - 1} c_{u} c_{v} b_{u v} \cos \frac{(2 j + 1) u π}{2 Μ} \cos \frac{(2 k + 1) v π}{2 Μ}$

利用离散余弦变换进行图像压缩技术的计算机过程为:首先从原始图像中读取出利用数字矩阵表示的RGB图像数据,为了编写出可操作性较强程序一般将该矩阵分为16×16或者8×8的小方阵,以每个小方阵为单位,进行离散余弦变换,变换完毕后每个方阵的低频部分就集中到了矩阵的左上角,而高频部分就集中到了右下角,而它的低频部分代表了图像的大部分信息,相比之下高频部分就显得不是特别重要了,此时可以根据实际需要或对压缩比的要求来决定对右下角高频部分舍弃的程度。

N代表像素数,一般N=8,8×8的二维数据块经离散余弦变换后变成8×8个变换系数,这些系数都有明确的物理意义:u代表水平像素号,v代表垂直像素号。当u=0,v=0时,F(0,0)是原64个样值的平均,相当于直流分量,随着u,v值的增加,相应系数分别代表逐步增加的水平空间频率分量和垂直空间频率分量的大小。

输入图像首先被分成8×8的图像子块,然后对每个图像子块计算二维离散余弦变换。离散余弦变换的系数经过量化,编码并传输;在读取图像时,解码出离散余弦变换系数,进行二维离散余弦逆变换,最后将子块放到图像中。Matlab图像处理工具箱中提供的二维DCT变换及DCT反变换函数。DCT2实现图像的二维离散余弦变换,其语法格式为:B=DCT2(A),B表示返回图像A的二维离散余弦变换值,其大小与A相同,且各元素为离散余弦变换的系数B(i,j)。通常情况下,一副图像并不会正好就是8的倍数,这样在边角就会出现非方阵的矩阵,此时使用B=DCT2(A,m,n)。Matlab对于此处理规则是如果m和n比图像A大,在对图像进行二维离散余弦变换之前,先将图像A补零至m×n;如果m和n比图像A小,则进行变换之前,将图像A剪切。IDCT2可以实现图像的二维离散余弦反变换,其语法格式为:B=IDCT2(A);B=IDCT2(A,m,n)。对于非方阵的处理规则同上。

图1是Matlab自带的用离散余弦变换(DCT)进行压缩的实例截图,从图中可以看出,DCT技术很好地还原了图像,而其达到了比较高的压缩比。其中的Original Trees Image代表了原始图像,Reconstructed Image代表了压缩后的图像。可以看出,有一定的失真但不明显,后面的Error Image代表了原图像和压缩图像之间的误差,大体可以看出一些轮廓。Matlab采用了8×8的小方阵进行DCT变换。

上面采用的是灰度图,下面采用Windows XP自带的彩色图片进行离散余弦变换,如图2所示,采用较高的压缩比,失真较为明显。

4 离散余弦变换算法的改进

二维离散余弦变换的常规算法是行列法,对于计算N×N的矩阵,需要计算2N个一维的向量,为了更有效地计算二维,有学者提出了一种直接作用于二维数据集的快速算法,该算法对于计算N×N的矩阵,只需计算N个一维向量,因此可以有效地减少计算时间,所需乘法次数只是常规算法的50%。目前国内外学术界关于如何加快DCT变换的研究进行的比较多,成熟的算法还有快速哈特莱变换(也就是离散哈特莱变换的快速算法)、快速余弦变换、快速沃尔什-哈达玛变换、快速数论变换、快速多项式变换等。

5 结论

离散余弦变换具有算法简单,易于硬件实现等优点,从而广泛应用于图像压缩领域。然而,它在低比特率条件下的方块效应成了不容忽视的瓶颈缺陷。原因就在于离散余弦变换处理的图像是分块进行的,块与块边界两边的像素相关性不能去掉,从而形成了明显的方块边界。若将DCT变换与其他编码方法如小波变换、分形等相结合,将会得到更好的效果。

摘要：图像压缩是数据压缩技术在数字图像上的应用,其目的是减少图像数据中的冗余信息,从而用更加高效的格式存储和传输数据。图像压缩可以是有损数据压缩也可以是无损数据压缩。这里所研究的是有损压缩技术,对于此类技术,变换编码是最常用的方法,如离散余弦变换(DCT)或者小波变换这样的傅里叶相关变换,然后进行量化和用熵编码法压缩。

关键词：图像压缩,离散余弦变换,傅里叶变换,熵编码

参考文献

[1]郑戟明,曹玉茹.基于Matlab的图像压缩处理及其实现[J].微计算机信息,2010(10):143-144.

[2]练华,宋宝瑞.基于小波变换的分形图像编码[J].上海交通大学学报,2004,38(4):637-640.

[3]吴崇明.基于Matlab的系统分析与设计:小波变换[M].西安:西安电子科技大学出版社,2000.

[4]姚庆栋.图像编码基础[M].北京:清华大学出版社,2006.

[5]闫敬文.数字图像处理技术与图像图形学基本教程[M].北京:科学出版社,2002.

[6]黄伟,龚沛曾.图像压缩中的几种编码方法[J].计算机应用研究,2003,20(8):67-69.

[7]周晓光.极化SAR图像分类方法研究[D].长沙:国防科学技术大学,2008.

[8]杨旭东,王万良.基于改进的MSE准则的小波图像压缩[J].计算机辅助设计与图形学学报,2003,15(4):402-409.

离散余弦变换论文篇3

复杂信号的分选识别一直是电子对抗的关键技术和难题。随着技术的快速发展,常规脉冲信号在信号环境中的比例已越来越少,线性调频、非线性调频和相位编码等复杂调制脉冲信号逐渐增多,这对信号的分选识别提出了更高的要求,必须对信号的脉内特性进行识别分析。信号的脉内特性是信号细微特征的主要体现,是电子侦察中对信号分选和识别的重要参数,是设备个体特征识别的重要特征之一。因此,新一代辐射源识别系统一般都在原有的系统中加入了信号脉内调制特征信息的提取和识别。

通常,各种应用系统对脉内调制特性分析方法的要求是精度高、速度快、智能化程度高和便于实现等。然而已有的许多分析方法,如谱相关分析法、延时相关法、数字复倒谱法以及相位进程计数调制域分析技术等都存在这样或那样的缺点,很难满足实际系统的要求[1]。这里从速度快、便于实现角度考虑,提出了一种新的识别方法。

该方法以信号频谱为基础,充分利用调制信号频谱特性的差异对信号的脉内调制样式进行识别。与前述方法相比,运算量小,便于实现。

1 识别方法

相位编码信号的解析表达式如下:

s(t)=a(t)exp[jφ(t)]exp(j2πf0t)。 (1)

信号的复包络为:

u(t)=a(t)exp[jφ(t)]。 (2)

式中,a(t)为振幅;φ(t)为相位调制函数;f0为载频。对于二相编码(BPSK),φ(t)为0和π;四相编码信号(QPSK),φ(t)为 $0 ‚ \frac{π}{2} ‚ π ‚ \frac{3 π}{2}$ 。

对相位编码信号进行平方,即

s2(t)=a2(t)exp[j2φ(t)]exp(j4πf0t)。 (3)

相位差分法速度快,易于实现,但其对噪声比较敏感,在低信噪比下,性能严重下降,针对其不足,提出了本文的识别方法。以下就相位差分法和本文方法展开分析,并对2种方法的识别性能进行了仿真对比。

1.1 相位差分法[1,2]

利用相干混频的方法可以获得原信号的2路正交分量而不丢失任何相位和幅度信息。对中频信号s(t)相干混频后有:

sI(t)=b(t)cos(2πf2t+φ(t)), (4)

sQ(t)=b(t)sin(2πf2t+φ(t))。 (5)

式中,f2为第2中频,且b(t)=0.5a(t)。sI(t)和sQ(t)可构成解析信号,且该解析信号的幅角为:

p(t)=2πf2t+φ(t)。 (6)

实际计算时,根据式(4)和式(5)得到的幅角值p(t)是有模糊的,要分析相位特性和判断调制样式,必须对上述幅角值解模糊,解模糊过程可以参见文献[3]。

其一阶微分为:

$\frac{\partial p (t)}{\partial t} = 2 π f_{2} + 2 π f_{p s k}$ 。 (7)

式中,对于二相编码,fpsk可能的取值为0和fs/2;对于四相编码,fpsk可能的取值为0、fs/2、fs和3fs/2,fs为采样率。

在计算机上处理时需要将上式离散化,即将连续相位的一阶微分转换为相位序列的一阶差分。式(7)表示的一阶微分可以化为以下差分形式:

$θ (i) = \frac{p (i + 1) - p (i)}{2 π} f_{s} - f_{2}$ 。 (8)

式中,i=nTs,Ts为采样间隔;fs为中频采样频率。

由式(8)得到的相位差分序列的幅值会受到采样频率的影响,这会对识别和参数估计带来不便。为此对其进行归一化处理,归一化的相位差分序列用fg(i)表示为:

$f_{g} (i) = \frac{2 \times (θ (i) + f_{2})}{f_{s}} = \frac{p (i + 1) - p (i)}{π}$ 。 (9)

经过归一化以后的相位差分序列幅度范围为(-2,+2),对应于相位变化(-2π,2π)。

上面采用的相位差分是一重的,实际应用时可以采用多重相位差分,以提高算法对低信噪比信号的适应能力。对相位序列p(i)的N重相位差分序列fN(i)计算如下:

$f^{Ν} (i) = \frac{\sum_{j = 1}^{n} p (i + j) - \sum_{j = 0}^{Ν - 1} p (i - j)}{2 Ν^{2} π} f_{s}$ 。 (10)

假定噪声是不相关的,则求多重相位差分时噪声会部分抵消,所以通过求N重相位差分能够有效地减小噪声影响。

通过对相位进行差分运算,可有效检测出相位编码信号的突变点。利用高阶差分还可一定程度地去除噪声的影响。理论上,二相编码信号的相位进行差分后,相位跳变点处的幅值应相等,四相编码信号的相位进行差分后,相位跳变点处的幅值应呈比例。但是,通过差分运算之后的幅度由于噪声的影响,其规律性受到破坏。这样,通过差分运算后的幅值是否成比例来区分二相编码和四相编码信号就容易出错。由此,在低信噪比下(<5 dB),受噪声的影响,相位差分法的应用受到了一定的限制。为此,提出了一种基于频谱特征的调制识别方法——离散余弦变换方法(DCT)。

1.2 DCT变换法

不同脉内调制类型信号的频谱不同,并且频谱系数之间具有相关性,采用DCT的方法对频谱系数去相关。由于利用少数几个DCT变换系数可以表征信号的总体特征,故选取部分DCT变换系数来描述信号。

Karhunen-Loeve(KL)变换能够最大限度地去除信号之间的相关性。但为了得到正交特征向量必须求得相关矩阵:

R=E[xxT]。

式中,x为信号向量。这在实际情况下是不可行的。FFT和DCT也是有效的信号去相关方法,但FFT得到的是复信号。所以采用DCT去相关。

长度为N的矢量x的DCT变换定义为:

$\begin{array}{l} y (k) = a (k) \sum_{n = 0}^{Ν - 1} x (n) \cos (\frac{π (2 n + 1) k}{2 Ν}) ‚ \\ k = 0, 1, \dots Ν - 1 。 (11) \end{array}$

式中,

由于不同调制类型信号其频谱不同,采用离散余弦变换(DCT)的方法去相关后,其特征参数在特征平面的分布呈现了较为明显的差别。由于特征参数较多,可选取部分区分度较大的DCT变换系数来描述信号。通过计算选取的特征参数的平均离散度,可以将不同调制类型信号进行有效区分。

平均离散度的定义为:

$\hat{k}_{1} = \sum_{i = 1}^{Ν} k_{1} (i)$ ; $\hat{k}_{2} = \sum_{i = 1}^{Ν} k_{2} (i)$ ; (12)

$σ_{1} = \frac{1}{Ν} \sum_{i = 1}^{Ν} (k_{1} (i) - \hat{k}_{1})^{2}$ ; (13)

$σ_{2} = \frac{1}{Ν} \sum_{i = 1}^{Ν} (k_{2} (i) - \hat{k}_{2})^{2}$ 。 (14)

式中,k1为第1类特征参数;k2为第2类特征参数; $\hat{k}$ 1为第1类特征参数的平均值; $\hat{k}$ 2为第2类特征参数的平均值;σ1为第1类特征参数的平均离散度;σ2为第2类特征参数的平均离散度。

由以上分析可得,基于DCT变换的脉内调制特征识别方法的步骤如下:

① 利用FFT求信号的频谱并取模;

② 截取信号的3 dB有效带宽,进行能量归一化;

③ 对归一化后的频谱进行DCT变换;

④ 选取2个区分度较大的DCT变换系数来描述信号,并分别计算每一个系数的平均离散度;

⑤ 根据计算得到的平均离散度设置一门限。根据各种信号的平均离散度与门限的大小关系可进行分类识别。

BPSK和QPSK信号较难区分,这是因为BPSK和QPSK信号的频谱有很大的相似性。若直接对其频谱进行DCT变换,这2种信号变换后的特征参数在平面上的分布会混叠在一起,无法有效区分2种信号。在此提出了一种改进的方法,先对接收信号进行平方运算,然后再对信号平方后的频谱进行DCT变换,这样就将同类型调制信号的识别变换成不同类型调制信号的识别。

因此对这2种信号的区分可以分2步:

① 先对信号进行平方运算。此时二相编码信号的相位调制函数值为0,2π,四相编码信号的相位调制函数值为0,π,2π,3π。根据正弦信号周期性,此时二相编码的相位调制函数不具备相位调制能力,四相编码信号的相位调制函数只有0和π两个值。因此,二相编码信号变为常规信号,四相编码信号则变为二相编码信号;

② 对平方后的信号进行傅里叶变换,截取3 dB带宽,对其进行DCT变换,选取部分DCT特征参数来区分2种信号。

2 仿真分析

仿真条件:测试信号由信号模型产生。二相编码信号和四相编码信号的参数(参数进行了归一化)选取相同。频率值为0.2,采样点数为512,每个子脉冲内采样点数为64,噪声为高斯白噪声,均值为0,方差为1;信噪比范围为0～10 dB。2种信号各选取50个样本。这里选取前2个特征参数进行分析比较。仿真结果如图1和图2所示。

图1和图2所示为信噪比为3 dB时,2种信号经相关处理后的DCT参数分布图。图1中2种信号的DCT系数在平面上的分布混叠在了一起。这是因为BPSK和QPSK信号的频谱有很大的相似性,直接对其频谱进行DCT变换后,这2种信号的DCT系数也会有很大的相似性,从而在平面的分布会交叠在一起,进而无法有效区分2种信号。

图2为2种信号经过平方变换后的DCT系数,可以看出分布有明显的区别。这是因为二相编码信号平方后变为常规信号,其频谱有明显的尖峰,带宽很窄,能量高度集中,经DCT变换后能量仍然高度集中,而四相编码信号平方则变为二相编码信号,频谱仍然具有一定的带宽,经DCT变换后能量分布仍然比较分散。这说明常规信号变换后的能量聚集性较好,平均离散度σ较低,相位编码信号变换后的能量聚集性较差,平均离散度σ较高。同时,由仿真结果得出:2种信号经DCT变换后的第1个特征参数k1差别较大,故可以选取一适当的门限阈值Th。若k1<Th,判为二相编码信号,反之,判为四相编码信号。因此,根据2种信号进行相应变换后特征参数的分布规律,可以将2类信号进行有效区分。

2种方法的识别性能曲线如图3所示。从图3可以看出,本文方法具有较好的抗噪声能力,在2 dB时识别率仍然可达80%,而相位差分法在信噪比低于5 dB时,性能迅速下降,在2 dB时几乎无法识别2种信号。这是因为DCT变换具有能量压缩的性质,对信号进行处理后,仅用少数几个特征参数就可以表征信号的整体特征。因为噪声是均匀分布在整个频带上的,这里选择有效带宽可以有效滤除带外噪声的影响。在此基础上,进一步用DCT处理后,信号能量得到了更好的压缩,能更好地表征信号。而低信噪比下,噪声对信号的相位产生了严重的影响,真实相位突变点可能不会产生相位跳变,而没有相位突变点的地方,会产生大量的虚假跳变点,这样经过相位差分后,差分曲线会出现严重的失真。由此,通过比较差分曲线幅度来区分相位编码信号有较高的错误概率。当信噪比较高时,2种方法性能相近。但本文方法采用FFT处理信号,仍然具有较快的速度,在一定程度上能满足实时处理的要求。

3 结束语

这里提出了基于离散余弦变换(DCT)的二相编码和四相编码信号识别方法。在仿真条件相同的情况下,相比相位差分法,所提出的方法识别率较高,抗噪性能也有所提高。同时,该方法具有运算量小,提取特征参量稳定的特点。该方法充分利用不同调制信号频谱的差异进行分析,快速高效,同时频分析、谱相关法分析相比,不需要庞大的计算量即可提取有效的特征对信号进行分类识别,经济实用。但是,该方法在更低信噪比下(<0 dB),识别性能会严重下降。因此,如何在低信噪比下保持较高的正确识别率需要进一步研究。基于信号频谱的特征提取方法不仅可以成为提升信号分选可靠性的一种重要手段,而且可以进一步精细鉴别信号的个体特征,具有更广泛的应用前景。

参考文献

[1]王丰华,黄知涛,姜文利.一种有效的脉内调制信号识别方法[J].信号处理,2007,23(5):686-689.

[2]黄知涛,周一宇.一种有效的BPSK/QPSK信号调制识别方法[J].电子对抗技术,2005,20(2):10-13.

[3]黄知涛,周一宇,姜文利.基于相对无模糊相位重构的自动脉内调制特性分析[J].通信学报2003,24(4):153-160.

[4]温志津,王甲峰.PSK非相干差分解调[J].通信技术,2009,42(9):12-15.

[5]GARDNER W A.Exploitation of Spectral Redundancy in Cyclostationary Signals[J].IEEE ASSP Mag,1991,8(4):14-36.

离散余弦变换论文篇4

数字水印采用技术隐藏保护了重要的信息和文件。它通常采用类似扩频图像技术来隐藏信息。一般基于常用的有DCT变换、DWT变换、DFT变换。文章基于DCT算法进行验证, 对水印系统中图像进行质量评价。

离散余弦变换简称DCT, 傅立叶变换简化方法之一。基于DCT域的数字水印算法, 根据对宿主图像进行DCT方法计算, 分为两大类, 一类是直接对整幅图像进行DCT计算, 选取合适频段的系数, 嵌入水印。另一类是先将整幅图像分成n块, 分别对每一块进行DCT计算, 并在每一块中选取合适频段的系数, 将水印信息分散嵌入到每一块所选取的DCT系数中。

在这里采用的分块DCT算法。原始图像按8×8分成互不重叠的子块。首先计算每一个子块的方差值, 选择方差值最大的前n块, 然后依据系统密钥进行DCT变换, 选取每一块中频系数的随机序列, 最后通过子块的DCT逆变换生成含水印的图像。水印的提取是上述过程的逆过程。该算法的嵌入流程图如1所示, 水印提取过程如图2所示。

文章采用MATLAB软件进行仿真, 选择的原始图像为512×512的256等级的灰度标准图像。将水印嵌入原始图像再提取之后, 为了评价所得到图像质量, 使用峰值信噪比来衡量两幅数字图像之间的数值差别:

原始图像嵌入水印后, 峰值信噪比为39.01, 如图3 (1) 所示, 图像具有良好的不可见性, 得到了较好的主观视觉效果。然后对加入水印的图像进行水印提取, 得到水印图像如图3 (2) 所示, 提取的水印图像与原始水印图像几乎没有差异。

最后对该算法产生的含水印图像进行了一系列攻击实验。

(1) 噪声攻击。在这里对图像分别进行高斯噪声攻击和椒盐噪声攻击, 得到提取水印与原水印的相关度分别为0.9721、0.9845, 提取的结果如图4所示。

(2) 左上角四分之一剪切。对图像进行四分之一剪切后, 得到提取水印和原水印的相关度为0.8221。水印提取的结果如图5所示。

通过MATLAB软件仿真结果可见, 基于DCT域的数字水印算法在文件保护上发挥着很好的作用, 该算法具有较好的提取效果, 具有一定的抵抗能力, 能在信息保护领域发挥重要的作用。

摘要：数字水印技术在所有权保护、认证、指纹、拷贝控制、访问控制和广播监控方面都有重要的应用。本项目将研究方向锁定在变换域上, 提出了新的解决方案。

关键词：数字水印,余弦变换,噪声攻击

参考文献

[1]孙圣和, 陆哲明, 牛夏牧.数字水印技术及应用[M].科学出版社, 2004.

[2]王丙锡, 陈琦, 邓峰森.数字水印技术[M].西安电子科技大学出版社, 2003.

离散余弦变换论文篇5

近年来,随着各种信息的数字化、计算机技术的成熟及网络的飞速发展,人们藉由网络可以快速而便利地获取各种多媒体信息,利用计算机技术处理及存储资料,并将这些取得的资料进行任意的修改、复制和再传播,因此对于个人私密性资料与知识产权的保护就显得非常重要。数字水印作为一种有效的保护机制,引起了学术界的广泛研究,早期的数字水印采用在空间域嵌入[1,2,3,4],但容易受到媒体处理的攻击,因此有文献报道采用在转换域嵌入[5,6,7],即采用离散余弦变换的方法,由于此方法具有不易被破坏的特点,因此受到越来越广泛的重视,但这个方法存在健壮性不理想的状况。针对存在的问题,本文在利用离散余弦变换的具有中/高频带系数平均值接近零的特性基础上,提出将数字水印乱序排列后,再进行数字水印的嵌入。为了验证提出方法的正确性,文中客观地以峰值信噪比评估嵌入与取出数字水印图像品质及关联系数来评估数字水印受到攻击的性能,并以主观的视觉评估嵌入数字水印的图像及取出的数字水印品质。结果表明:提出的方法不仅保留了离散余弦变换能在图像中较好地嵌入数字水印并较好地取出数字水印信息的优点,而且嵌入的数字水印具有较好的健壮性。

1 研究方法

1.1 系统架构

1.1.1 数字水印的嵌入

图1为提出的数字水印的嵌入流程。先输入一张64×64像素的数字水印,经过数字水印的前置处理,同时输入一张512×512像素的图像,将图像分割成数个互不重叠的8×8的区块,并对每一区块进行离散余弦变换,在经过变换后的每一区块中选择准备嵌入数字水印的区块,计算其平均值,取得T(threshold)、S(shift)值。在每一区块嵌入一个位元的数字水印,嵌入数字水印后并计算有无产生溢出的情况,若发生溢出,则移除该区块中的数字水印,并记录无法嵌入数字水印的位置,储存在辅助信息,最后将图像进行离散余弦的反变换,完成数字水印的嵌入。

1.1.2 数字水印的取出与图像还原

图2为提出的数字水印取出流程,将嵌入数字水印的图像分割成数个互不重叠的8×8区块,将每一区块进行离散余弦变换,对经过变换后的嵌有数字水印的区块,计算其平均值,取得嵌入数字水印后的图像的T、S值,再嵌入辅助信息(包含嵌入数字水印前的T、S值、无法嵌入数字水印的位置和数字水印前置处理方法),接着取出数字水印,最后将数字水印取出后的图像返转回空间域,得到重建的原始图像。

1.2 数字水印的前置处理——乱序排列法

为了增加数字水印的健壮性,在将数字水印嵌入图像之前 ,先将其阵列打乱,其大小为1×64的一维阵列,图3(a)是数字水印的原图,而打乱的方式是将数字水印的每一行产生的序列进行排序,将数字水印重新排序后,如图(3)所示。

1.3 溢出处理

当图像嵌入数字水印后,其灰度值可能会超过0—255的范围,也就是小于0或大于255,此情形称为溢出。溢出会破坏图像的品质,因此要避免溢出发生。

以图4(a)的图像为例,其尺寸为512×512像素,将其分割成数个互不重叠的区块。以每一区块尺寸为8×8像素分割成64×64个区块,如图4(b),再对每一区块按照它们的长条图(histogram)像素灰度的分布特性分类。

长条图灰度分布分为四种不同的类型,如图5。其中形态(a)是最完美的分布图形,其灰度分布在0-255的中间范围,分布曲线左右皆有空间;形态(b)其灰度分布偏向右端255,分布曲线只有左端有空间,一旦执行加法运算,图像会右移超出范围,造成溢出,只能进行左移的减法运算;形态(c) 与形态 (b)灰度分布相反,分布曲线只有右端有空间,若执行减法运算会造成左移的溢出问题,因此只能执行右移的加法运算;形态 (d)的灰度分布偏左右两端,因此无论加减运算皆会有移动后的溢出问题,所以形态 (d)不能进行运算。

1.4 数字水印嵌入

为了数字水印嵌入后的图像品质和嵌入的数字水印的健壮性,在每一区块嵌入一个位元的数字水印。

对将嵌入数字水印的图像以8×8区块切割并做离散余弦变换,利用离散余弦变换的中/高频系数很小且趋近0的特性,选择每一个8×8区块中16个像素嵌入水印,如图6所示。称这16个区块为MH频带。在公式(1)中,标记t为第t个区块,C $_{i j}^{t}$ 代表第t个区块的离散余弦变换后在(i,j)坐标位置的系数,由公式(1),计算每一区块的MH频带系数的平均值mean,找出其中最大系数的绝对平均值Mmax。由公式(2),设一个阈值为T,此T是大于Mmax的最小整数(ceil函数为取值上限)。找出T值后,由式(3)找出S量,有了S量,就可以用改变区块中MH频带的系数平均值。当某个区块需要嵌入信息时,则判断此区块MH系数平均值的正负,如果区块系数平均值为正时,在此区块的MH平均值加S,如果区块系数平均值为负时,在此区块的MH减S量。

将重新排序后的水印依区块顺序由左至右,由上到下嵌入到所要隐藏的非重叠区块中。若所嵌入的位元为1,此区块的MH平均值将会改变一个S量,此S量将使该区块的MH平均值之绝对值大或等于T。而如果所嵌入的位元为0时,此区块保持原来的值不变。在嵌入的过程中,若出现区块在空间域的溢出情况,则将不能嵌入的区块位置记录,并将T、S值同时记录,用于提取水印和还原图像时使用。

1.5 数字水印取出与图像还原

数字水印取出与图像还原的流程见图2。将原始图像分割成8×8不重叠区块,并进行离散余弦变换,载入辅助信息(T、S值等),区分嵌入水印的区块。计算出每个区块MH频带系数的平均值,若该平均值小于T,则取出的数字水印为位元0;若该平均值大于T,则取出的数字水印为位元1。该区域MH频带系数平均值如果为正则减去S量,若平均值为负则加上S量,当所有区块都判断完后则取出数字水印,加上不能嵌入区块的位置,即得到嵌入的数字水印信息。然后对数字水印进行后置处理,对图像进行反离散余弦变换以获得原图像,完成取出数字水印与图像还原的步骤。

2 实验结果与分析

(a)Peppers (b)sailboat (c)Airplane (d) man

为了验证提出方法的正确性,分别对图7的四张测试图像进行水印嵌入、取出、还原及受攻击的实验,每张图大小为512×512像素的灰度图像,数字水印图像如图3,大小为64×64像素的二进制图像。采用余弦变换技术和前置数字水印处理方式,观察嵌入与取出后的数字水印和图像的品质,使用PSNR评估嵌入与取出图像品质。PSNR定义如公式(4):

$Ρ S Ν R = 10 \lg \frac{Q^{2}}{Μ S E} (4)$

Q为图像的峰值255,MSE为原图像与处理后图像像素差的平方均值。并以关联系数来评估图像受攻击的性能,一般用以度量二变量随机数A和B的关联测试,以R代表关联系数,如式(5):

$\begin{array}{l} R = \\ \frac{\sum_{m} \sum_{n} (A_{m n} - \bar{A}) (B_{m n} - \bar{B})}{\sqrt{(\sum_{m} \sum_{n} (A_{m n} - \bar{A})^{2}) (\sum_{m} \sum_{n} (B_{m n} - \bar{B})^{2})}} (5) \end{array}$

式(5)中m、n表示它的维度, $\bar{A}$ 为A的平均值。R值从-1到+1,其值越大表示二变量A和B的关联性越高。

2.1 以改进的离散余弦变换进行数字水印嵌入与取回

根据前面所述数字水印的嵌入原理,在4幅测试图像中分别嵌入数字水印,并根据水印的取出和图像还原原理,提取数字水印和还原图像。实验结果如表1所示,为比较其性能,与传统的离散余弦变换方法比较,可以看出改进后的离散余弦变换方法的嵌入数字水印的图像具有较高的品质,嵌入数字水印的图像具有非常高的PSNR值,且还原后的原图像质量较好。

2.2 攻击实验

嵌入数字水印的图像经过裁剪(crop)、加入噪音、JPEG压缩的攻击实验后,所取出的数字水印失真并不太大,仍可清楚地呈现,是水印具有健壮性的体现。

以前面所描述的方法比较图像受攻击后的结果,裁剪实验是从图像的坐标(50,50)去掉一块200×200像素(红色框)、250×250像素(黄色框)、300×300像素(绿色框),如图8所示;加入噪音是将图像加入噪音(变异数为2);JPEG压缩是对图像进行JPEG压缩(压缩率为90%)。

裁剪实验的结果如表2,结果显示改进后的离散余弦法比传统的离散余弦法较能抵抗裁剪攻击。

加入噪音信息实验的结果,由表3可知,数字水印经过乱数序列法比直接嵌入法较能抵抗噪音的攻击。

JPEG压缩实验的结果,由表4可知,离散余弦变换法对于JPEG压缩均有较好的抵抗能力。

3 结论

本文在传统的离散余弦变换基础上,提出将数字水印进行乱数排列的前置处理新方法,和传统的离散余弦变换相比,此方法进行数字水印的嵌入和还原的数字处理非常简单,而且取出数字水印后的图像接近完美,健壮性较好。

参考文献

[1] van Schyndel R G, Tirkel A Z, Osborne C F. A digital watermark. In: Proc IEEE Int Conf Image Processing, vol. 2, Austin, TX,1994:86—90

[2] Pitas I, Kaskalis P H. Applying signatures on digital images. In: Proc IEEE Workshop Nonlinear Image and Signal Processing, Neos Marmaros, Greece, 1995:460—463

[3] Pitas I.A method for watermark casting on digital images.In:Pro-cedings of IEEE Int.Conf.on Image Procession 1996.Piscataway,HJ:IEEE Press,1996;3:215—218

[4] Delaigle J F,De Vleeschouwer D,Macq B.Low cost perceptive dig-ital picture watermarking method.In:Proc ECMAST’97,Milan,Ita-ly,1997:153—167

[5] Macq B, Delaigle J F, De Vlesschouwer C. Digital watermark. SPIE Proc 2659: Optical Security and Counterfeit Deterrence Techniques, 1996:99—110

[6] Hsu C T, Wu J L. Hidden signatures in images. In: Proceedings of the IEEE Int. Conf.on Image Processing 1996, Piscataway,NJ:IEEE Press, 1996: 223—226

离散余弦变换论文篇6

图像去噪是图像预处理的一个基本内容,与图像处理相关的许多应用如分割、配准、边缘提取等,通常均需要使用有效的去噪算法进行预处理来获得更可靠的效果。因此,图像去噪吸引了大量研究者的关注,其中图像中高斯白噪声的去除一直是图像处理中的一个重要研究方向。

Buades A,Coll B和Morel J M在对许多典型的去噪算法进行比较研究的基础上,提出了非局部均值(non-local means,NLM)去噪算法[1],并将其应用到图像和视频的去噪处理中。NLM算法无论从理论上还是实验上均优于其他经典的去噪方法,如双边滤波[2]、各向异性扩散方程算法[3]和小波的方法[4]。NLM算法是利用图像中的冗余信息,结构相似的像素上叠加的噪声是随机的,所以通过加权平均就可以有效地去除噪声,同时也可以消除传统邻域滤波算法中出现的伪影;但其自身也存在一些不足。NLM算法是利用图像块来表示像素点的特征,并通过图像块之间的相似度来度量像素点之间的相似度;图像块之间的相似度可根据块内灰度值向量空间之间的高斯加权欧氏距离来衡量,然而噪声的存在、特别是当噪声水平较高时,基于块内灰度值向量空间的高斯加权欧氏距离将不能很好地反映原始图像块之间的相似度,因而NLM算法去噪后的图像仍残留了大量的噪声,特别是边缘部分。此外,在NLM 算法去噪时,以参考像素点为中心的图像块要与以图像中所有像素点为中心的图像块或者局部区域中所有像素点为中心的图像块进行比较,计算量非常大。因此,有效改进NLM算法的去噪效果和加快计算速度是对该算法研究的两个重要方面。

为了得到更精确的高斯加权欧氏距离去除图像残留噪声,本文提出基于离散余弦变换(discrete cosine transform,DCT)的非局部均值滤波算法。对测试图像的实验结果表明,相对于NLM算法,该算法能够更为有效地去除噪声,具有更高的峰值信噪比(peak signal to noise ratio,PSNR),去噪图像内容更加清晰。

1 非局部均值去噪算法

设噪声图像为z=x+n,x为未受高斯白噪声污染的原始图像,n为高斯白噪声。对于噪声图像中的任何一个像素,非局部均值利用整幅图像中所有像素值的加权平均来得到该点的估计值,即:

$Ν L [z] (i) = \sum_{j \in R_{i}} ω (i, j) z (j) (1)$

式(1)中,权值ω(i,j)依赖于像素i与j之间的相似度,并满足0≤ω((i,j)≤1且 $\sum_{j} ω (i, j) = 1$ 。像素i和j之间的相似度由灰度值矩阵Ni与Nj之间的相似度决定,其中Ni表示以像素i为中心的大小为M×M的方形邻域,虽然理论上参与加权的像素是图像中所有的像素,但为了提高计算效率,往往限定为局部区域的像素。各邻域灰度矩阵之间的权值ω(i,j)通过高斯加权欧式距离来度量,即:

$ω ((i, j) = \frac{1}{C} \exp (- \frac{∥ z (Ν_{i}) - z (Ν_{j}) ∥_{2, α}^{2}}{h^{2}}) (2)$

$C_{i} = \sum_{j} \exp (- \frac{∥ z (Ν_{i}) - z (Ν_{j}) ∥_{2, α}^{2}}{h^{2}}) (3)$

其中,Ci是归一化因子,‖·‖2,α是高斯加权的欧氏距离函数,α是高斯核的标准差,h控制着指数函数的衰减速度,决定滤波的程度。

2 离散余弦变换

DCT是一种正交变换,其变换核为实数余弦函数。对一幅图像进行离散余弦变换后,有关图像的许多重要可视信息都集中在DCT变换的小部分低频系数中。因此,其经常在信号处理和图像处理中使用,用于图像压缩、数字水印和信号检测等。

假设给定大小为N×N的二维信号f,其DCT定义为:

$\begin{array}{l} F (u, v) = \frac{2}{Ν} c (u) c (v) \sum_{i = 0}^{Ν - 1} \sum_{j = 0}^{Ν - 1} f (i, j) \times \\ \cos [\frac{(2 i + 1) u π}{2 Ν}] \cos [\frac{(2 j + 1) v π}{2 Ν}] (4) \end{array}$

反离散余弦变换IDCT定义为:

$f (i, j) = \sum_{u = 0}^{Ν - 1} \sum_{v = 0}^{Ν - 1} c (u) c (v) F (u, v) \cos [\frac{(2 i + 1) u π}{2 Ν}] \times$

cos $\frac{(2 j + 1) v π}{2 Ν}] (5)$

式(5)中

正是由于离散余弦变换具有很强的“能量集中”特性,可以由通过少量低频DCT系数进行重构得到的重构图像代替噪声图像计算图像块之间的相似度权重值。如图1所示,(a)为加入10%高斯白噪声的噪声图像,(b)为由28%的低频DCT系数重构的重构图像。由图1可知,通过少量低频DCT系数进行重构得到的重构图像能够保护图像的主要内容,并且能够滤除部分噪声。

3 基于离散余弦变换的非局部均值算法

对大小为N×N的二维噪声图像f,其基于散余弦变换的非局部均值算法的具体流程如下:

(1)DCT变换:对噪声图像f进行DCT变换,F=DCT(f),F为经DCT变换后的频域信息。

(2)低频系数:定义大小N×N、值为0的矩阵F1,从F中通过Zigzag扫描选取28%低频DCT系数,赋给F1。

(3)IDCT变换:对低频系数矩阵F1进行IDCT变换得到重构图像,f1=IDCT(F1),f1为经IDCT变换后得到的重构图像。

(4)NLM算法:通过f1计算图像块之间的相似度权值ω(i,j),将NLM算法用于噪声图像f进行去噪处理,f2=NLM(f),f2为最终的滤波结果图像。

4 实验结果与分析

为了验证算法的有效性和可行性,现在Matlab7.0环境下以大小为128×128的Lena、Peppers图像作为测试图像对本文算法进行仿真实验,为了使不同算法具有可比性,根据文献[5,6,7,8,9,10]的大量研究和测试,搜索窗口范围为11×11,像素邻域大小为7×7,滤波参数h=12σ( σ为所加噪声的标准差)。

本文采用峰值信噪比PSNR作为评价的客观准则对不同算法进行比较,峰值信噪比定义为:

PSNR=10lg(2552/MSE) (6)

式(6)中,MSE为均方差。图2所示为被标准差分别为25和50的高斯噪声污染的Lena、Peppers图像,图3所示为不同算法对被标准差为25的高斯噪声污染的图像的去噪效果,图4所示为不同算法对被标准差为50的高斯噪声污染的图像的去噪效果。从整体上来看,本文算法去噪图像的主观视觉效果好于NLM算法和文献[5]的算法,有更少的模糊现象,保留了更多的边缘与细节信息。

表1给出了采用NLM算法、文献[5]算法及本文算法对被标准差为5、10、15、20、25、30、40、50的高斯白噪声污染的图像去噪后的PSNR。当噪声的标准差σ=5时,本文算法去噪图像的PSNR高于NLM算法,但略低于文献[5]算法;当噪声的标准差σ>5时,本文算法去噪图像的PSNR均不同程度的超过文献[5]算法及NLM算法。

5 结论

在分析传统滤波算法和一些改进算法的基础上,提出了一种基于离散余弦变换的非局部均值滤波算法。首先,利用DCT的低频系数重构图像,以达到滤除部分噪声的同时保护图像的主要内容。其次,利用重构图像较准确块计算图像块之间的欧氏距离,将NLM去噪算法用于噪声图像。仿真结果表明,较NLM算法,本文算法去噪后的图像视觉效果得到了较好的改善,并能够保留大量的细节信息;当噪声标准差σ大于5时,本文算法去噪效果提高更加明显。

摘要：要非局部均值(non-local means,NLM)去噪算法已成为较有效去除图像噪声的算法之一。然而,当噪声水平较高时,NLM不能准确地计算图像块之间的相似度权重值,影响图像的去噪效果。针对上述问题,结合离散余弦变换(discrete cosinetransform,DCT)提出了基于DCT的非局部均值滤波算法。首先,利用DCT的低频系数重构图像,以达到滤除部分噪声的同时保护图像的主要内容。其次,利用重构图像较准确地计算图像块之间的相似度权重值,将NLM去噪算法用于噪声图像。实验结果表明,该算法能够得到较高的峰值信噪比(peak signal to noise ratio,PSNR)和更好的视觉效果。

关键词：图像去噪,非局部均值(NLM),离散余弦变换(DCT)

参考文献

[1]Buades A,Coil B,Morel J M.A review of image denoising algo-rithms,with a new one.Multiscale Modeling and Simulation,2005;4(2):490-530

[2]蔡超,丁明跃,周成平,等.小波域中的双边滤波.电子学报,2004;32(1):128-131

[3]Perona P,Malik J.Scale-space and edge detection using anisotropicdiffusion.IEEE Transactions on Pattern Analysis and Machine Intelli-gence,1990;12(7):629-639

[4]Coifman R R,Donoho D L.Translation-invariant de-noising.Proceed-ings of Wavelets and Statistics Springer Lecture Notes in Statistics,New York:Springer,1995;103:125-150

[5]胡金蓉,蒲亦非,张意.DCT子空间的非局部均值去噪算法.计算机辅助设计与图形学学报,2012;24(1):89-96

[6]张权,罗立民,桂志国,等.一种基于优化参数的非局部均值滤波算法.计算机应用与软件,2012;29(3):78-138

[7]孙伟峰,彭玉华.一种改进的非局部平均去噪算法.电子学报,2010;38(4):923-928

[8]Brox T,Cremers D.Iterated nonlocal means for texture restoration.In:Proc International Conference on Scale Space and Variational Methodsin Computer Vision.F Sgallari,A Murli,N Paragios,et a1.New York:Springer,2007;4485:13-24

[9]Buades A,Con B,More1J M.Nonlocal image and movie denoising.International Journal of Computer Vi～on,2008;76(2):123-139

离散余弦变换论文篇7

数字视频水印是指将一个数据信息嵌入到视频媒体中, 该嵌入信息使视频媒体的所有者建立对视频的所有权。目前已提出的数字视频水印算法根据水印嵌入位置的不同可分为基于原始视频的水印方法和基于压缩视频的水印方法[2,3]。Haitsma提出了通过调制每一帧的平均亮度, 按帧嵌入水印信息的水印算法[4], 该算法可以较好地抵抗空间同步失真, 但其抗有损压缩的能力较弱。Niu等人提出的沿时间轴嵌入的水印可以抵抗一定频率的丢帧攻击, 同时对于有损压缩的抵抗力也较好[5], 但该算法对于选择水印嵌入点过于复杂。文献[6]提出在帧的亮度分量中固定位置嵌入标志水印, 再选取若干图像块在DCT直流系数中嵌入水印的方法。文献[7]提出一种基于HVS的DCT域稳健视频水印算法, 该算法对丢帧、加噪等攻击具有较强的鲁棒性。另外, Shang等人提出了一种用于MPEG压缩视频的可逆水印算法, 通过选取合适的DCT系数来提高水印的不可见性, 并标记DCT系数的修改用于无损还原原始视频[8]。文献[9]提出了一种在H.264压缩视频中嵌入灰度图像的水印算法, 水印嵌入通过修改4×4 DCT对角线系数的符号来实现。

数字视频水印的特点在于:视频的信息量庞大, 提取水印不应该用到原始视频信息, 即视频水印应实现盲提取;另外, 原始视频在传输和存储前往往要经过压缩编码, 因此视频水印必须能够抵抗主流的压缩处理或其他各类攻击。将水印嵌入到原始视频的方法比较多, 但缺点是算法往往比较复杂, 而且对于已压缩的视频, 需要先进行解码, 然后嵌入水印后再重新编码;压缩视频水印方法的复杂度较低, 容易满足实时性要求, 但是很难做到对各种针对视频的攻击都具有较好的鲁棒性。作为视频的所有者, 在拥有未压缩的视频的情况下, 要使水印能够抵抗各种格式的压缩以及其他常见的针对视频的攻击, 应该选择在未压缩的视频中嵌入水印。

1 算法相关理论

1.1 算法流程

本文从降低运算复杂度的角度出发, 提出了一种基于帧DCT变换的视频水印算法。该方法通过计算视频帧不同位置的嵌入强度来平衡水印不可见性和鲁棒性之间的关系, 在视频帧亮度分量分块DCT系数中嵌入经预处理后的水印信息, 并且采用多次嵌入等措施增强水印的鲁棒性。其嵌入和提取的流程如图1所示。

1.2 水印嵌入强度选择

在视频帧中嵌入水印信息时, 提高嵌入强度有利于增强水印鲁棒性, 但是与此同时势必会造成视觉质量的下降。为了平衡水印嵌入对视频质量的影响和鲁棒性之间的关系, 有必要针对视频帧的不同位置选择不同的嵌入强度。

1) 基于纹理的嵌入强度

视频帧8×8分块DCT变换后的交流分量可以用来反映视频帧的纹理平滑程度。设每帧的第k个分块DCT变换后的63个交流分量和值为ACk, 则该值越大表明分块的纹理越复杂。基于纹理的嵌入强度q1与分块的纹理复杂度有关, 其值已由实验确定。q1取值与ACk的关系如表1所示。

2) 基于边缘的嵌入强度

对视频帧进行边缘检测, 当分块处于明显的边缘时, 可以认为其纹理也比较复杂, 人眼对其不敏感, 可以加大该分块的嵌入强度。设Edge是分块中处于边缘的像素数量, Edge∈{0, 1, …, 64}, 则基于边缘的嵌入强度q2按式 (1) 取值

3) 基于亮度的嵌入强度

当视频帧分块的亮度较大时, 人眼对其不敏感, 可以加大嵌入强度。设第k个分块的DCT变换后对应的直流分量为DCk, 可用其反映第k个分块的平均亮度的强弱。则基于亮度的嵌入强度q3为

式中:h是视频帧亮度分量所有分块DC系数的平均值。

最后, 总的水印嵌入强度为

视频通常是以25 f/s (帧/秒) 的速率进行播放的。在1 s的时间内, 播放了25帧画面相似的图像, 所以相邻帧之间的差异并不明显。计算出视频的第1帧各分块的嵌入强度之后, 其后一定范围内的帧都可以参照此嵌入强度, 而不用对嵌入强度重新计算, 这样就大大减少了算法的复杂度。对于画面快速运动的视频, 则可以对不同邻域的帧重新计算新的嵌入强度, 使嵌入强度的选择更加准确。

1.3 水印的嵌入与强化

人类视觉系统 (HVS) 对图像的低频分量比高频分量敏感, 因此在视频帧的高频分量嵌入水印比在低频分量嵌入能达到更好的视觉效果。但是在高频分量嵌入的水印鲁棒性较差。因此, 考虑在视频帧的中频分量中嵌入水印。

在实际应用中, 为了节约传输带宽和存储空间, 原始视频往往要经压缩后才会送入信道传输。此外, 视频在传输过程中也面临各种噪声的干扰, 导致在接收端接收的视频出现各种失真。因此, 是否抗压缩和其他各类攻击是衡量水印实用价值的重要指标。为了使嵌入的水印能够具有较高的鲁棒性, 本文采取了多次嵌入的措施。在第1次水印嵌入完成后, 未嵌入水印的邻近视频帧使用相同的方法将水印重复嵌入2次。在水印提取时, 当相同位置的提取水印值不同时, 取多次提取结果中出现次数较多的值。

1.4 水印嵌入与提取质量的客观评价

PSNR (峰值信噪比) 是一个衡量噪声对图像质量影响的常用指标, 可用其衡量视频中的每一帧相对原始视频帧的客观差异, 其定义为

式中:M和N是载体视频帧的长和高;Iij是原始视频帧的像素值;I'ij是含水印视频帧的像素值。当PSNR≥30 d B时, 可认为水印具有较好的不可见性。

NC (归一化相关系数) 是一个用来衡量提取的水印信息和原始水印信息相似程度的常用指标, 其定义为

式中:wij为原始水印值;w'ij为提取的水印值;i和j为水印图像中像素的坐标。当NC=1时, 认为实现了水印的完全提取。

2 视频水印算法

2.1 水印预处理

水印通常是版权信息, 为了保护其不受破坏和减小水印嵌入对原始宿主信号能量的改变, 有必要在嵌入前对水印进行预处理, 使水印的像素值分布趋于均衡化和随机化, 从而提高其安全性。

设水印为正方形的二值图像, 对其进行如下预处理:

1) 利用一个密钥种子key来生成置乱矩阵A, A中元素为伪随机的0, 1构成。

2) 将二值水印W与置乱矩阵A相异或得到置乱水印

式中:⊕表示异或运算。

2.2 水印嵌入算法

1) 按下式计算视频每帧的嵌入量

式中:p为视频每帧可嵌入比特数;m和n分别是视频帧的高度和宽度;为下取整。

2) 将预处理后的水印转换为一维数组, 设其长度为l, 并将其每隔p比特划分一段, 最后一段不足p比特的位置补0, 将得到的个子段的一维数组转换为子矩阵。为上取整。

3) 按1.2节描述的方法计算每一分块的嵌入强度, 构成嵌入强度矩阵Q。

4) 对视频每帧做8×8分块DCT, 将水印的第i个子矩阵与第i个视频帧的亮度分量对应。按式 (8) 得到g, 再同时令d (4, 5) 和d (5, 4) 等于g, d (x, y) 为对应视频帧亮度分量每一分块DCT系数, x, y∈{1, 2, …, 8}, 表示系数坐标。

式中:a= (d (1, 8) +d (2, 7) +d (3, 6) +d (6, 3) +d (7, 2) +d (8, 1) ) /6;为的第i个子水印;。

5) 将嵌入了水印后的视频帧做8×8分块逆DCT。

6) 重复步骤4) ~5) , 将水印再嵌入到未嵌水印视频帧中2次, 以增强水印的鲁棒性, 最终得到含水印视频。

2.3 水印提取算法

1) 在水印嵌入帧做8×8分块DCT。

2) 在每一帧中按式 (9) 所示规则提取水印信息

式中:a'= (d' (1, 8) +d' (2, 7) +d' (3, 6) +d' (6, 3) +d' (7, 2) +d' (8, 1) ) /6;为提取的第i子段水印;。

3) 对未提取帧重复步骤2) ~3) , 得到第2次和第3次提取的水印信息, 然后按相同位置的值由多次出现值确定的原则, 得到分段子水印。

4) 将一维化后, 按水印嵌入时的顺序组成完整的一维数组, 再将其二维化, 最后做水印预处理逆运算, 得到提取的水印W'。

3 仿真实验与分析

本文采用了3个QCIF格式的原始视频 (Foreman, News和Coastguard) 作为宿主。利用上述算法完成了水印信息的预处理、嵌入和提取实验, 并在含水印视频的峰值信噪比和算法鲁棒性方面做了相关实验分析工作。

3.1 水印预处理实验

3.2 水印的嵌入与提取实验

将水印信息嵌入到3个原始视频中, 每个视频分别需要33帧来完成水印的嵌入。如图3所示, 图3a~图3c为3个原始视频的第10帧, 图3d为待嵌入的水印信息, 图3e~3g为3个含水印视频的第10帧, 可以看出它们都具有较好的不可见性, 其峰值信噪比分别为38.371 5 d B, 37.161 8 d B和38.610 9 d B, 图3h为提取的水印信息。从3个含水印视频中均能实现水印信息的完全提取, NC都为1.000 0。

3个视频含水印帧的平均峰值信噪比如表3所示。可以看出, 嵌入水印后平均峰值信噪比都在30 d B以上, 具有较好的不可见性。

3.3 水印的鲁棒性测试

对含水印视频进行各类攻击, 然后将提取的水印与原始水印比较, 通过计算其NC值来对算法的鲁棒性做出评价。本实验分别对3个含水印视频进行丢帧、帧平均、帧重组、亮度提升、亮度减弱和H.264压缩编码等攻击, 得出提取水印的NC值如表4所示。由此可知本文算法对于各类攻击具有较强的鲁棒性。各类攻击方法具体如下:

1) 丢帧, 每10帧丢失1帧;

2) 帧平均, 每5帧中随机抽取1帧F, 与它相邻的两帧 (F-1, F+1) 求平均, 用平均帧F'代替原始帧F;

3) 帧重组, 每10帧中随机调换两帧;

4) 亮度提升, 将视频的亮度分量整体提升15%;

5) 加噪, 在视频帧中加入椒盐噪声;

6) H.264压缩, 将含水印视频进行H.264压缩编码后再解码重建视频, 平均码率控制在25 kbyte/s。

将本文算法与文献[6]算法和文献[7]算法做鲁棒性比较实验, 实验中宿主统一采用Foreman, 结果如表5所示。可以看出, 本文算法抗丢帧、加噪攻击的能力优于文献[6]算法和文献[7]算法, 抗H.264压缩的能力优于文献[7]算法。

4 结论

本文结合了数字图像和视频的相关理论, 根据人眼对视频帧不同区域的敏感性大小选择了不同的嵌入强度, 提出一种在视频帧亮度分量分块DCT系数中嵌入水印的算法。实验表明本算法具有较好的不可见性和较强的鲁棒性, 在数字视频版权保护方面具有较广阔的应用前景。

参考文献

[1]COX I, MILLER M, BLOOM J.Digital watermarking[M].San Francisco:Elsevier Science, 2002.

[2]唐松生, 董颖.数字视频水印技术综述[J].计算机安全, 2007 (9) :31-33.

[3]SIMITOPOULOS D, TSAFTARIS S, BOULGOURIS N, et al.Compresseddomain video watermarking of MPEG streams[C]//Proc.2002 IEEE International Conference on Multimedia and Expo.[S.l.]:IEEE Press, 2002:569-572.

[4]HAITSMA J, KALKER T.A watermarking scheme for digital cinema[C]//Proc.2001 International Conference on Image Processing.New York:IEEE Press, 2001:487-489.

[5]NIU X, SCHMUCKER M, BUSCH C.Video watermarking resisting to rotation, scaling, and translation[C]//Proc.SPIE Security Watermarking of Multimedia Contents IV.San Jose:SPIE, 2002:512-519.

[6]高琦, 李人厚, 刘连山.基于帧间相关性的盲视频数字水印算法[J].通信学报, 2006, 27 (6) :43-48.

[7]谢斌, 任克强, 肖玲玲.一种基于HVS的DCT域稳健视频水印算法[J].电视技术, 2011, 35 (9) :30-32.

[8]SHANG Y.A new invertible data hiding in compressed videos or images[C]//Proc.the 3rd International Conference on Natural Computation.Washington DC, USA:IEEE Computer Society, 2007:576-580.

【离散余弦变换论文】推荐阅读：

余弦变换论文10-01

余弦效率08-15