余弦变换论文

2024-10-01

余弦变换论文（共8篇）

余弦变换论文篇1

0 引言

快速高效地进行身份鉴别是现代社会科技研究的一个热点。日常生活中,使用证件、磁卡、密码等验证身份的传统技术,在一定程度上存在伪造、丢失、窃取等安全隐患[1]。而基于生物特征的识别方法,如基因、指纹、虹膜、人脸、声音识别等,具有很强的自身稳定性和个体差异性,因此,被认为是一种更加可靠、方便的大众化身份识别手段[2]。

人脸识别技术通过计算机从动态视频或静态图像中检测人脸,提取人脸的面部特征和几何关系,再将提取的人脸与数据库中已有的人脸进行比较,从而实现个人身份鉴别。虽然人脸识别的准确率比指纹识别和基因识别低,但是人脸识别系统比其他生物特征识别系统更加友好,它的非接触性消除了使用者的抵触情绪; 同时人脸识别交互性好,直观快速,可跟踪。目前该技术已广泛应用在视频会议、出入控制、信息安全、刑事侦破等领域[3]。

从最初的单一背景的正面灰度人脸图像的识别,到能够动态识别多姿态的人脸,目前人脸识别技术正在向三维领域发展。虽然人脸识别技术不断完善,效率不断提高; 但到目前为止,自动人脸识别系统的建立还存在诸如人脸随年龄增长而变化,人脸图像受成像距离、姿态、表情、光照强度的影响,人脸上的遮挡物等等的难题。

1 识别方法

人脸识别的流程包括人脸检测/跟踪,特征提取,特征降维,匹配识别[4]四个步骤。其中匹配识别根据目的的不同可分为两种: 一种是对人脸图像的辨识,属于无监督的识别,即要确认输入人脸图像中的人的身份; 另一种是对人脸图像的验证,属于有监督的识别,即确认输入人脸图像中的人是否已有图像在数据库中[4]。

人脸识别常见的方法有: 基于几何特征的方法、基于人工神经网络的方法、基于模板匹配的方法、贝叶斯分类法、特征脸法、隐马尔可夫模型方法、等灰度线方法、支持向量机法和奇异值分析法等。

人脸特征的提取是为了降维得到一组分类错误率小且数目少的人脸特征向量,如此既可以从本质上描述人脸图像的特性,又降低了信息的冗余程度,同时也有利于进一步地分析和计算机分类识别。特征提取的优劣会直接影响识别率的高低。

目前已有的各种人脸特征提取方法在某些特定的情况下具有很好的识别率,但是如果条件改变( 如姿态、光线、表情的变化和噪声影响等) ,则会影响识别率。因此可以考虑通过多种算法的融合[5],减少算法对条件改变的敏感性,提高人脸识别系统的有效性。文献[6]指出,通过融合多种算法对同一个图像进行识别,可以提高系统的总准确率。

文献[7]中Ziad和Martin对整个人脸图像作离散余弦变换( DCT) ,取少量的DCT系数作为人脸特征在ORL人脸数据库上实验,得到91% 的正确识别率。DCT可减少因姿态、光线、表情变化对图像造成的影响,但是对整个人脸图像进行DCT提取的特征可能包含了一些与识别无关的信息,这对识别率会有一定的负面影响。文献[8]提出基于小波变换的PCA算法有效地降低了单纯使用PCA算法的复杂度。文献[9]先采用小波变换对人脸图像进行预处理,然后使用PCA降维,接着利用LDA提取人脸最显著的特征,这种结合比简单的使用PCA,或者DWT + PCA有更高的识别率。

本文主要从特征提取的角度,综合考虑文献[7 -9]的思路,着重从基于图像整体代数特征的主成分分析( PCA) 算法入手,针对传统的特征脸存在运算量大的缺点,提出一种融合二维离散小波变换( DWT)和离散余弦变换( DCT) 的PCA和LDA结合的特征提取算法。通过组合和改进以上几种特征提取算法[10]提高人脸识别的效率和鲁棒性。

小波变换能去除图像中的部分噪音数据[11],所以实验中先对整个原始人脸图像进行二维离散小波分解; 然后在小波分解后的一个亚波带上对人脸图像进行二维离散余弦变换得到对光照和姿态不敏感的DCT系数矩阵,接着取包含了原始图像大部分信息的少量DCT系数作PCA降维,再结合LDA提取人脸最显著特征,最后利用欧氏距离和最近邻分类器对人脸进行分类[12]。

1. 1 二维离散小波分解( DWT)

小波变换的实质是运用一组不同尺度的低通和高通滤波器族对信号进行滤波处理,将信号不同频率成分分解到不同的频带上,可一直重复上述滤波处理,直到达到预设的阈值[13]。

二维小波变换对人脸图像进行频域分解,可以得到四个不同区域,如图1 所示。

低频区域LL是图像的缩略图,它是图像数据能量集中的频带。高频区域LH、HL、HH分别包含图像水平方向、垂直方向、对角线方向的灰度变化信息和边缘信息。对变换得到的LL区域可继续进行小波变换。由于图像的噪声分量的主要能量一般集中在HH中,因此,可以通过忽略高频分量来减少噪声影响。

对给定的二维人脸图像:

则二维离散小波分解的递推公式为

上式中H是起平滑作用的低通滤波器,G是起差分作用的带通滤波器。

经过小波变换的图像,其低频部分保留了人脸绝大部分的能量和信息,因此能有效降低图像的维数,节省存储空间,提高计算效率。在人脸识别过程的实际操作中,当人脸数据库不是很大的时候,通常选取经过三级小波变换后的图像的低频子带作为后续的特征数据。

1. 2 离散余弦变换( DCT)

设人脸图像的维数为M* N,f( x,y) 是图像在( x,y) 位置上的灰度值,则图像的二维离散余弦变换公式为:

相应的二维离散余弦反变换公式如下:

其中:

上式中的F(u,v)又称为DCT系数。

在人脸图像中,人脸的显著信息( 如眼睛、鼻子、嘴巴的轮廓) 都存在于低频系数中,而表情变化则存在于高频部分。因此可以通过舍去高频分量,保留低频分量来实现图像信息的压缩。在实验过程中,可以采用z形扫描将DCT系数矩阵变成一维向量,再取这个一维向量的前几个分量构成一个列向量作为后续PCA的变量。

离散余弦变换计算简单快捷,可通过快速算法完成。DCT可以对每幅图像单独处理提取特征向量,当增加训练样本时不需要重新训练其他的图像,因此整个系统的训练时间可显著降低。

1. 3 主成分分析法( PCA)

主成分分析主要通过KL变换将高维向量投影到一个低维的向量空间,这个空间又称作特征脸空间,所以,PCA方法又叫做特征脸方法。PCA的基向量代表样本变化最大的方向,它的投影方向最大化所有样本之间的散布,可用于图像重建,并保证重构后的样本与原样本的均方误差最小。因为PCA能在最少损失信息的前提下获得最大的数据降维,所以在人脸识别中得到广泛应用。

设有N个训练样本,每个样本大小为l* h像素,将图像数据矩阵向量化为一个M = l* h维的列向量xi,其中M为人脸图像向量的维数。由向量构成的样本集为{ x1,x2,…,xN} 。该样本集的平均向量( 平均脸) 为:

每个训练样本与平均脸的偏差为 ,则样本集的偏差矩阵D=[y0,y1,y2,…,yN-1],其中D的维数为M*N。计算样本集的协方差矩阵为C,维数M*M。

由协方差矩阵C可求出特征向量ei和对应的特征值 λi。

以这些特征向量为人脸空间的正交基底,通过线性组合可以重构得到样本中任意的人脸图像。人脸图像的有效信息集中于特征值大的特征向量中,因此丢弃特征值小的向量也不会影响图像识别。将特征值按从大到小排序: λ1≥λ2≥…≥λm≥…≥λM,在实际操作中,一般取特征值的能量90% 来作为主成分,构成主成分变换矩阵W = [e1,e2,…,em],m << M。W的维数为M* m。每一幅人脸图像都可以投影到由[e1,e2,…,em]构成的特征脸子空间中,任何一幅人脸图像向其作投影得到一组坐标系数,称为K - L分解系数。这组系数表明了该图像在子空间中的位置,可作为人脸识别的依据。

1. 4 线性判别分析LDA

LDA是把人脸图像样本投影到一条直线上形成一维特征空间,这个特征空间又称为Fisherface[14,15]。然后用类的成员信息形成一组特征向量表现不同的人脸变化。

定义LDA类间散布矩阵Sb和类内散布矩阵SW的计算公式如下:

其中,μi是类Xi的图像均值,Ni是类Xi中的样本数。如果Sw非奇异,则最佳投影矩阵Wopt为:

其中,{ Wi| i = 1,2,…,m} 是特征向量。

文献[12]对用KL变换和Fisher准则分别求出一些特征脸进行比较后得出,特征脸很大程度上反映了光照等的差异,而Fisher脸则能压制图像之间的与识别信息无关的差异。

2 实验过程

基于PCA的特征提取方法简单,从整体上反应了人脸图像的灰度相关性,但是受人脸的姿态、光照等外界因素影响较大,算法复杂度为O( d3) ,其中d代表图像的大小,因此在样本较多的时候计算量大。基于DCT的人脸特征提取方法只需要提取少量的DCT系数作为特征,速度快; 同时保留了对表情、姿态、光照变化不敏感的类别信息,因此它有效地弥补了PCA方法的缺陷。但DCT提取的特征依旧存在一定的冗余,这对识别率会有一定的影响。而基于DWT的人脸识别算法能有效去除噪音数据,节省存贮空间。且其他文献研究表明,PCA和LDA的结合与PCA相比能有效地提高识别率。

鉴于此,将以上几种方法结合起来,取长补短,这样既提高了特征向量的精度,又降低了运算的复杂度,且不容易受噪声、姿态、表情和光线变化的影响。实验流程如下:

①人脸库选择。选择ORL人脸库,每人读取一定数量的图像构成训练集,剩余图像组成测试集。

②DWT变换。用离散小波变换后的低频子图像代替原始人脸图像,小波低频子图像描述了人脸的不变特征,有较高的稳定性,且冗余少。考虑到小波分解若分解的层次太少会使提取的分类信息不足,而分解层次太多又会造成计算量的增加,且分解的区域过小会增强小波变换的边界效应,从而影响分类的正确性。本文采用ORL人脸库的图像大小为92* 112,作一层小波分解就可达到较好的结果。

对低频子图像进行二维离散余弦变换得到DCT系数矩阵,用z扫描将系数矩阵转变为一维向量后选择前d个分量作为后续PCA的分量。若训练集的人脸图像数目为n1,测试集的人脸图像数目为n2,则训练集和测试集分别是一个d* n1和d* n2的矩阵。

③PCA分析。对提取出来的DCT系数向量进行KL变换构造特征子空间,然后将训练集和测试集分别向特征子空间投影,得到投影系数。

④LDA。根据公式计算Sw和Sb,求得Fisher脸。

⑤利用欧氏距离和最近邻分类器比较测试样本的特征向量与训练样本的特征向量。

本文所讨论的人脸识别基本流程如图2 所示。

3 实验结果比较和分析

为了验证算法的有效性,选取ORL标准人脸库中的图像进行人脸识别的实验。ORL人脸库共有40 人,每人10 张图像,每张人脸图像大小为92 *112,灰度级为256,每幅图像的光照、姿态、角度、表情各不相同。本实验在MATLABR2010a环境下运行。

由表1 可知,PCA算法当训练样本数达到总样本数的60% 时,已具备较高的人脸识别率,平均识别率超过96% 。当采用PCA和LDA相结合时,可以发现当每类选取不同的训练样本数的时候,PCA +LDA的识别效果都要比单一使用PCA算法要好。且随着训练样本数的增加,可以有效地减少最佳投影维数,减少存储空间。

根据文献[16],M. Sharkas和M. Abou Elenien经过实验得出用DWT处理人脸图像,可以细微地改善LDA算法的性能,而采用DCT处理人脸图像可以提高PCA的识别率。对光照、表情和姿态变化不敏感的类别信息。DCT系数不仅表达了图像的频率特性,且可直接从压缩域获得。将一幅人脸图像进行DCT变换,再进行压缩并用IDCT完成图像的重建,此时,图像中人眼并不敏感的中频的高频部分已被滤掉,如图3 所示。

比较表2 的实验结果,发现在PCA + LDA前采用DCT并不能有效地提高系统的识别率,但是实验发现,当使用DCT提取图像低频信息后,系统识别速度平均加快0. 75s。

在ORL人脸库基础上,选择每类样本的前5 幅图像作为训练样本,后5 幅图像作为测试样本,这样训练样本和测试样本的总数均为200。实验中分别采用单一特征提取算法,两种特征提取算法结合、三种特征提取算法结合、四种特征提取算法结合进行测试,取得表3 中不同识别方法的识别率比较结果。

实验表明,当同时结合DWT,DCT,PCA,LDA的时候,人脸识别率有所提高。虽然过程中融合了四种算法,但是每种算法在有效提取特征的同时都降低了人脸图像的维数,因此识别速度反而提高了。实验证明,这种融合是有效的。

4 结束语

本文讨论了将已有的DWT,DCT,PCA,LDA四中特征提取方法有效结合起来,取长补短,提高人脸识别效率的可行性。文中用计算速度快的DCT变换可减少PCA对光照和姿态、表情变化的敏感性;用DCT可以对每幅图像单独处理提取特征向量的这个优点,使训练样本增加时系统不需要重新训练其他的图像,整个系统训练时间显著降低; 用对噪声不敏感的DWT变换,既减少了DCT的冗余,节省了存储空间,又降低了PCA的效率; 用PCA和LDA算法的有效结合,相比单独使用PCA算法对于识别率有了很大的提高。

后续实验可以从分类器的角度考虑,比如利用人工神经网络进行识别匹配,进一步完善和提高人脸识别系统的效率。

余弦变换论文篇2

收稿日期： 20131217

基金项目：黑龙江省自然科学基金项目(F201227)

作者简介：宋鸿梅(1971),女,讲师,博士,主要从事数据压缩、图像压缩、图像处理方面的研究。

摘要：提出一种合成孔径雷达(synthetic aperture radar,SAR)原始数据幅相(amplitude and phase,AP)变换域压缩算法,该算法首先把以幅度、相位形式表示的SAR原始数据做离散余弦变换以降低数据间的相关性,并使数据的统计特性符合高斯分布,再对变换系数进行网格编码量化(TCQ)。对实测SAR数据进行了实验,结果表明该算法能够有效地控制相位精度,在同等量化标准下,平均误差和相位误差有了一定的降低,数据相似度、数据信噪比、图像信噪比等指标都有相应的改善。

关键词： SAR原始数据压缩; 离散余弦变换; 比特分配; 网格编码量化

中图分类号： TN 958文献标志码： Adoi： 10.3969/j.issn.10055630.2014.03.007

Compression algorithm for SAR AP raw data based on DCT

SONG Hongmei, LIU Xianglou, MU Haiwei, ZHAO Dongyan

(College of Electronic Science, Northeast Petroleum University, Daqing 163318, China)

Abstract： In this paper, a transform algorithm for compressing synthetic aperture radar (SAR) raw amplitude and phase (AP) data is proposed. This algorithm is based on combination of discrete cosine transform (DCT) and trellis coding quantization (TCQ). Firstly, the SAR raw data, expressed in the form of amplitude and phase, is done with the DCT in order to reduce the correlation of all data, and makes the statistical properties of the data in according to the Gaussian distribution. Then, the transform coefficients are done with the TCQ. Test results on the actual measurement SAR raw data show that the proposed algorithm can effectively control the precision of the phase data. Under the same quantization criteria, the average error and phase error has been reduced and the data similarity, the signal to noise ratio (SNR) of both data and image have been improved.

Key words： SAR raw data compression; discrete cosine transform; bit allocation; trellis coding quantization

引言合成孔径雷达(synthetic aperture radar，SAR)成像具有成像面积大的特点,能全天候全天时工作,在民用和军工领域都有广泛的应用。早在1951年科学家首次提出了利用频率分析方法改善雷达的角分辨率,经过数十年的发展,高分辨率、干涉、多极多频成像成为SAR成像的主要特点［1］,而相位精度对SAR高品质成像质量有着重要意义。经典的雷达原始数据压缩算法BAQ、分块浮点量化(BFPQ)以及后来发展的矢量量化、正交变换后量化等算法都着重于提高算法的信噪比,没有对相位数据进行专门处理。文献［2］提出的算法把SAR的 I、Q两路数据在极坐标下表示为幅度和相位数据,可以独立控制相位的精度,但算法的信噪比有待提高。SAR原始数据转换为极坐标下的幅度和相位数据,数据间存在着微弱的相关性,为了进一步改善压缩性能,采用了能够去除相关性的正交变换。在所有的正交变换中,离散余弦变换(DCT)具有仅次于最优正交变换KL的正交基,可以有效地去除数据间的相关性,并且DCT变换拥有二维可分离特性和快速数值计算方法［3］。因此本文提出了一种基于DCT变换的SAR原始数据的幅相变换域压缩方案。1SAR原始数据特点分析［4］SAR成像区域内的散射体很多,所以SAR回波信号可以看作是大量统计独立的随机矢量的和,可以表示为A(x,y,z)=∑N－1k=0Akexp(iΦk)(1)其中,N为分辨单元内所有独立散射体的总数,Ak为第k个散射体的回波数据幅度,Φk为第k个散射体的回波数据相位。所以SAR回波信号可以表示为极坐标下的幅度数据和相位数据,也可表示直角坐标下实部数据和虚部数据(I、Q两路数据)。大量实测数据说明,SAR的I、Q两路均符合高斯分布;SAR的幅度数据服从瑞利分布,相位数据服从［－π,π］的均匀分布。SAR成像面积较其他成像模式要大得多,数据量非常庞大,为了分析数据的概率分布特性和数据间的相关性,从SAR原始数据中截取大小为512×512的任意一块,分析计算幅度数据和相位数据的概率分布和相关系数,结果如图1～图4所示。光学仪器第36卷

第3期宋鸿梅，等：基于离散余弦变换的SAR原始数据幅相压缩算法

图1幅度和相位数据的概率分布

Fig.1The probability distribution of the AP data

图2幅度和相位数据的相关系数

Fig.2The correlation coefficients of the AP data

图3幅度和相位数据DCT系数的概率分布

Fig.3The probability distribution of the DCT coefficients of the AP data

图4幅度和相位数据DCT系数的相关系数

Fig.4The correlation of the DCT coefficients of the AP data

幅度和相位数据经DCT变换后,两者的变换系数均呈正态分布,这样不仅便于设计码书,同时数据间的相关性也被有效地去除。2本文算法解析本文数据压缩算法的流程具体包括:(1)把SAR原始数据转换为极坐标下的幅度数据和相位数据;(2)把SAR原始数据的幅度数据和相位数据分割成合适大小的数据块;(3)对幅度数据和相位数据分别做DCT变换;(4)按照数据信息熵进行比特分配;(5)用Viterbi算法对TCQ量化,输出压缩码流。解码流程为编码流程的逆过程。

nlc202309032023

2.1SAR原始数据分块SAR成像特点决定了SAR原始数据量非常庞大,为了加快处理速度,往往需要并行处理。在实际处理时通常要分块进行,数据分块还可以降低数据的动态范围,便于量化。不同统计特性的数据在量化时采用的量化码书不同,使用统计特性不符的码书量化会急剧恶化量化性能。数据分块过小,样本太少不能体现统计特性,无法选择合适的量化码书对数据进行量化。数据分块过大,相应数据的动态范围也很大,会带来很大的量化噪声而影响最终的压缩性能。经过DCT变换,系数按照频率重新组合,低频系数含有较多信息,高频系数含有较少信息。为使每组频率的DCT变换系数近似吻合高斯分布,经过核算可知,把SAR原始数据分为256×256的数据块进行处理是比较适中的。

2.2离散余弦变换离散余弦变换是由Ahmed等于70年代提出,正交变换可以有效去除数据间的相关性而不改变数据的信息熵,而DCT是性能最接近于KL变换的准最佳正交变换,并且DCT有二维可分离快速变换算法,计算复杂度小,便于硬件实现。因为DCT优异的去相关属性,使得变换后的SAR幅度和相位数据的统计特性均非常接近于白噪声,其概率与高斯分布更加吻合,两组数据均可使用高斯量化码书对其量化,简化了码书的设计。对于SAR原始数据做二维DCT采用行列分离算法,即直接利用一维DCT快速算法或硬件结构,方便实现。

2.3量化比特分配对于SAR原始数据的压缩处理,涉及到两个方面的比特分配。SAR的幅度数据和相位数据要分配量化比特,幅度数据和相位数据分别进行DCT后,各组DCT系数也要分配量化比特。SAR原始数据I、Q两路数据统计独立,转换为极坐标下的幅度和相位数据后,幅度、相位仍然统计独立,相位数据包含比幅度数据多的信息,相位数据的信息熵要大于幅度数据的信息熵,正交变换只是改变了数据的基向量,因而不会改变数据的信息熵。同幅SAR数据的幅度数据含有比相位数据少的信息量［5］,为了减小量化噪声,信息量多的分配较多比特,信息量少的分配较少比特。对于3比特/样本量化时,分配相位数据4比特/样本,幅度数据2比特/样本［5］。不同频率DCT系数的能量不同,能量大多聚集在低频系数上,重构时低频系数对于原始数据的贡献也大,因此可以对能量较高的低频系数分配较多量化比特数,而对能量较低的高频系数则分配较少的比特数,使得在总比特数不变,总的量化误差为最小,还可实现比特的非整数分配。下面是根据香农率失真理论对各组系数分配量化比特的定量计算。假设对信号无记忆标量量化,则量化失真可表示为d(R)=E［(X－X^)2］(2)其中,X为待量化信号,X^为信号重建值,R为量化比特率。对于高斯分布信号,其率失真函数可以表示为R(D)=12log2σ2D(3)其中，D表示最大平均失真,σ表示数据的方差。选择8×8的DCT变换块,共有64组矢量,则所有系数量化的平均失真为:DT(RT)=164∑63n=0dn(Rn)(4)其中，DT为平均失真,RT为平均比特率,dn为失真函数,Rn为第n组的比特率。由式(3)可以求出D=σ2×4－R(5)把式(5)代入式(4)中,可得DT(RT)=164∑63n=0σ2n×4－Rn(6)最优比特分配问题为:当所有系数量化的平均比特率RT=1M∑M－1n=0Rn为一定时,使得式(6)所定义的平均量化失真为最小。为此,建立目标函数:argminRnJ=argminRn1M∑M－1n=0σ2n×4－Rn+λ1M∑M－1n=0Rn－RT(7)求解上述最小化问题,需求解方程组JRn=σ2n(－ln4)4－Rn+λ=0,n=0,1,…,M－1

Jλ=1M∑M－1n=0Rn－RT=0(8)求解方程组(8),可得Rn=RT+12log2σ2n－1M∑M－1n=0log2σ2n(9)其中M=64。求得的Rn一般不能为整数,通常需要对其进行四舍五入取整。

2.4网格编码量化和Viterbi算法［6］网格编码量化(TCQ)具有网格的约束特性,是标量量化的一种,量化码书是同样量化标准的标量量化码书的两倍,从而量化噪声得以进一步抑制,TCQ从通信理论的网格编码调制(TCM)中借鉴了网格和集合划分的思想［7］,使其量化噪声接近于率失真理论下的均方误差,而不会消耗过多的运算资源。有限状态机的状态转移图可以构成网格,每一个状态有两个分支进入和离开的网格应用最为广泛。在量化编码时,从一个特定的初始状态依照网格的约束特性穿行网格,采用Viterbi算法进行网格编码,边穿行,边遗弃失真较大的路径,记录失真最小路径［6,8］。3实验结果分析比较采用本文提出算法对实测的SAR原始数据进行验证,一般来说,SAR原始数据非常庞大,为了能在台式机上顺利验证,截取一幅SAR原始数据中的方位向4 096点,距离向4 096点两路数据。把数据分为256×256的小块,采用3比特/样本量化进行实验,幅度数据分配2比特/样本,相位数据分配4比特/样本。对采用RD(距离多普勒)算法成像后的图像和原始数据进行性能评估,并与常用的原始数据压缩算法进行比较。图像评估参数选择信噪比(SNR)、相关系数(ρ);原始数据评估参数选择量化信噪比(SNR)、逼真度(K)、平均误差(ERMS)、相位误差(—)。评估参数的定义和意义参照文献［4］,实验结果如表1所示。

表1各种算法性能比较

Tab.1Performance comparison of different algorithms

压缩算法数据域性能指标SNR/dBKERMS—图像域性能指标SNR/dBρ本文算法15.267 30.989 43.962 30.125 522.935 20.997 7APTCQ15.187 40.989 05.269 30.173 622.842 40.997 4APBAQ14.424 70.976 05.752 90.151 121.736 70.996 7BAQ14.536 20.966 55.679 50.204 221.886 90.996 8

由表1可以看出本文算法相对于常用算法APTCQ、APBAQ和BAQ在各项性能评价指标上均有不同程度的提升,尤其相位误差有了较明显的降低,体现了对SAR原始数据相位精度的保护。4结论本文对SAR原始数据的特点进行了深入的讨论,在此基础上提出了一种SAR原始数据的幅相变换域压缩算法,该算法首先把SAR原始数据转换为极坐标下的相位、幅度数据,再分别对相位数据和幅度数据进行DCT变换,使两组数据的统计特性均符合高斯分布,可以使用统一的高斯量化码书量化,并有效降低了数据间的相关性;再分别对相位数据和幅度数据的变换系数进行TCQ量化和Viterbi编码,网格的约束特性使量化码书扩充了一倍,改善了压缩性能。实验结果表明,该算法相对于其他常用算法对SAR原始数据的各项压缩性能指标均有所改善。参考文献：

［1］林幼权.星载合成孔径成像雷达发展现状与趋势［J］.现代雷达,2009,31(10):1013.

［2］姚世超,王岩飞,张冰尘,等.合成孔径雷达原始数据幅相压缩算法［J］.电子与信息学,2002,24(11):16271633.

［3］付天舒,韩春杰,隋鑫,等.基于DCT变换的自适应图像水印实现［J］.光学仪器,2013,35(3):5157.

［4］潘志刚.低比特率合成孔径雷达数据压缩算法研究［D］.北京:中国科学院研究生院,2006.

［5］张文超,王岩飞,潘志刚.合成孔径雷达原始数据压缩AP算法幅相比特分配研究［J］.电子与信息学报,2008,30(4):10071010.

［6］UNGERBOECK G.Trellicscoded modulation with redundant signal setsPart Ⅱ:State of the art［J］.IEEE Communication Magazine,1987,25(2):1221.

［7］宋鸿梅,王岩飞,潘志刚.基于DCTTCQ的SAR原始数据压缩算法［J］.电子与信息学报,2010,25(2):10401044.

［8］TAUBMAN D S,MARCELLIN M W.JPEG2000Image Compression Fundamentals,Standards and Practice［M］.Boston:Kluwer Academic Publishers,2002.

基于离散余弦变换的数字水印技术篇3

关键词：DCT,水印,HVS,算法

0 引言

基于离散余弦变换 (Discrete Cosine Transform, DCT) 的数字水印根据对宿主图像的计算方法不同, 分有两类:一类是直接对整幅图像进行DCT计算, 选取合适频段的系数来嵌入水印;另一类是, 首先将整幅图像分成若干小块, 对每一小块分别进行DCT计算, 再在每一块中选取合适频段的系数, 将水印信息分散嵌入到所选取的系数中。这种方法称为分块DCT。下面我们主要针对分块DCT具体进行分析和论述, 并在此基础上, 讨论一种基于人类视觉特性的DCT数字水印设计方案与实现技术。

1 基于DCT变换域的数字水印模型

由于数字图像经DCT变换后以频率的形式表现出来, 如果直接对频率分量系数作修改以嵌入水印后再进行反变换, 即可得到含有水印的图像, 这样一来大大提高了数字水印的鲁棒性, 使得基于DCT变换域的数字水印理论与技术得到了较为广泛地应用。

数字水印的检测系统用来检测待检图像是否含有水印, 其输出是一个二值判断信息, 通常用l个bit来表示, 如“1”表示含水印, “0”表示不含水印。如果从待检图像中检测到水印, 则进一步提取出水印, 进行水印解码, 恢复原来嵌入到图像中的水印信息。

在许多实际应用中, 通常只需要证明图像中是否含有水印, 并不进行水印的提取。水印的解码方式与水印嵌入时采用的编码方法密切相关, 不同的编码方法采用不同的解码方法。图1是基于DCT变换域的水印检测与提取过程图。

如图1所示, DCT域水印的检测和提取过程, 将待测图像Y进行DCT运算;然后按着嵌入水印时选取的DCT系数, 选取其含有水印的系数, 进行水印提取;然后利用水印检测方法判断水印是否存在。如果水印检测器输出结果显示水印存在, 则根据需要可以用水印解码器, 对提取的水印进行解码, 恢复水印。

2 人类视觉系统感知模型

医学研究表明, 人类视觉系统 (Human Vision System, HVS) 类似于一个光学系统, 但不是普通意义上的光学系统, 它受到神经系统模型的调节。

研究HVS对于图像的感知特点, 建立HVS数学模型, 对于提高数字水印的不可感知性和鲁棒性具有重要意义。许多数字水印方法应用了HVS模型, 嵌入图像自适应水印, 对于减小水印对图像的影响, 增强鲁棒性, 取得了较好的效果。目前出现的很多水印算法都利用了HVS的特性来限制水印嵌入的位置和强度, 试图达到最大的嵌入强度和最好的视觉不可见性。

而对人类视觉影响最大的图像因素就是背景照度、背景纹理和信号频率, 而这三点决定了对比度门限值, 只要迭加的信号低于对比度门限, 视觉系统就无法感觉到信号的存在。因此应对这三个要素进行建模。

3 基于HVS的DCT域数字水印方案

下面我们结合HVS特性, 设计一个数字水印算法, 此算法采用通用加性水印模型:

设计一个图像自适应水印方法, 设计更优的水印嵌入强度, 即使其结合图像对HVS产生影响的三个主要因素, 确定H V S掩蔽因子, 进而根据图像局部纹理特性的不同而变化, 尽可能根据不同区域的特性加大水印嵌入强度, 增加鲁棒性的同时, 保证良好的透明性。

3.1 确定HVS掩蔽特性因子

下面我们具体说明HVS特性因子的确定方法。

3.1.1 背景照度掩蔽因子的确定

我们知道, 图像DCT系数的DC分量代表了图像的平均亮度, 因此块DCT的DC分量就代表了这一块图像的平均亮度。块DC分量是块DCT系数矩阵的第一个元素, 即ck (1, 1) 是第k块的DC分量, 用Lk表示。

令第k块的背景照度掩蔽因子是第k块的DC分量与整幅图像所有图像块的DC分量的平均值之比:

其中, 是所有图像块的DC分量的平均值, 表示整幅图像的平均亮度, 用下式计算:

从式 (1) 我们可以看出, 当图像块的亮度大于平均亮度时, 背景照度屏蔽因子的值就大于1, 否则小于1:

3.1.2 频率掩蔽因子的确定

令频率掩蔽因子是本块的频率掩蔽与全图所有块的频率掩蔽的平均值之比:

其中, 是平均频率掩蔽, 由下式计算:

从式 (4) 我们可以看出, 当图像块的频率掩蔽大于平均频率掩蔽时, 频率掩蔽因子的值就大于1, 否则小于1。

3.1.3 纹理掩蔽因子的确定

确定一个图像的纹理是否复杂, 我们可以对其进行边缘检测, 显然边缘多的图像区域纹理就复杂, 可嵌入的水印强度就大。我们利用边缘检测算子, 对整幅宿主图像进行边缘提取, 然后计算每一个8×8块的区域内位于边缘上的像素点个数。每块图像中含有的像素点的多少反映了这块图像的纹理复杂度。

纹理掩蔽因子就是本块的纹理复杂度与平均纹理复杂度之比, 即边缘点个数与平均边缘点个数之比:

其中, Pe, k表示第k块的位于边缘上的像素点个数, 表示平均边缘像素点个数, 其值由下式计算得出:

其中, Pe表示整幅图像位于边缘上的像素点的个数。

从式 (6) 我们可以看出, 当图像块的纹理复杂度大于平均纹理复杂度时, 纹理掩蔽因子的值就大于1, 否则小于1。

由以上三个HVS掩蔽因子的确定方法可以看出, 水印嵌入模型是根据图像局部特征自适应地嵌入水印的。对于纹理复杂, 高亮度, 高频率的区域嵌入水印强度就大, 反之嵌入强度小。

3.2 水印嵌入模型

对大小为M×N的宿主图像S进行8×8的块DCT变换, 则S被分成Bnum块:

对每一块从中频段取出系数ck (i, j) , 嵌入水印信号。其中, k表示第k个大小为8×8的DCT块, k∈{1, 2, …, Bnum}。 (i, j) 表示第k块的第个DCT系数, i, j=1, 2, …, 64。我们在中频域选取 (i, j) 。

图像自适应水印嵌入模型用下式表示:

其中分别为三个HVS特性因子:背景照度掩蔽因子、频率掩蔽因子和纹理掩蔽因子是常数, 表示平均的水印嵌入强度因子。

3.3 水印嵌入步骤

(1) 将宿主图像分成8×8的块, 每一块都进行DCT变换, 得到与宿主图像相同尺寸的DCT域系数矩阵:

(2) 对每个8×8的DCT系数矩阵, 按照上节所述, 计算HVS三个掩蔽因子:

(3) 我们用密钥生成长度为Nw的Guassian白噪声作为水印信号:

(4) 将每个8×8的DCT系数矩阵, 从每一块的中频段取出个系数:

(5) 按照下式嵌入水印:

(6) 用得到的新的DCT系数对原来位置的DCT系数进行置换。

(7) 对新的DCT系数矩阵进行DCT反变换, 得到了嵌入水印信号的图像X。

3.4 水印检测步骤

由于我们用Guassian白噪声作为水印嵌入到DCT系数中, 因此我们直接用相关检测法检测水印。

(1) 对含水印图像进行8×8的块DCT变换。

(2) 对每一块的DCT系数进行“之”字型排列, 从我们己知的嵌入位置取出可能含有水印的系数将所有提取出的系数, 按顺序组成新的系数序列:

(3) 用密钥生成水印信号:W～N (0, 1) 。

4) 利用相关法检测水印。

前面说过, 考虑到水印的鲁棒性和安全性, 水印信息一般首先被调制成伪随机序列, 然后再嵌入到宿主图像中。根据概率论可知, 两个互不相关的随机序列的相关系数 (或称为标准协方差) 为0, 如果是线性相关的, 则相关系数大于0, 最大相关系数为1。根据这一原理, 我们可以通过计算提取出的水印序列与原水印序列的相关系数来判断水印是否存在。

4 实验结果

实验中用标准Lena灰度图像作为宿主图像, 如图2所示。用另一幅文字图片作为水印, 格式为JPEG, 如图3所示。可宿主图像的每一个8×8DCT系数的中频段选取16个系数嵌入水印。图4为嵌入水印后的图像, 可见视觉效果很好。图5为水印检测后的输出结果。

5 结束语

本文对DCT域的数字水印进行了较为深入的探讨, 详细论述了DCT系数的选取原理和方法, 介绍了HVS三个主要特性在DCT域水印上的数学模型, 并在此基础上, 讨论了基于HVS特性的图像自适应DCT水印算法, 利用HVS模型根据图像局部特征实现水印自适应地嵌入。试验结果证明这种方法对于图像压缩、噪声攻击、直方图攻击和中值滤波等常见的攻击或图像处理具有很好的鲁棒性。

参考文献

[1]赵春晖, 王小辉, 孙兵.基于分块DCT变换的HVS模型加权数字水印算法[J].应用科技.2001.

[2]Chih-Wei Tang Hsueh-Ming Hang.A Feature-based Robust Digital Image Watermarking Scheme[J].IEEE Transactions on Sig-nal Processing.2003.

[3]Adnan M.Alattar Eugene T.L in Mehmet Utku Celik, DigitalWatermarking of Low Bit-Rate Advanced Simp leProfile MPEG-4Comp ressed Video.IEEE Transactions on Circuits and Systems forVideo Technology.2003.

余弦变换论文篇4

自1974年N.Ahmed等人提出了离散余弦变换(Discrete Cosine Transform,DCT)算法后,很多学者对DCT算法的实现进行了研究。陈禾等人[1]总结了前人的研究,将DCT算法的结构归纳为5类,其中基于乘法器的DCT结构一直是很多学者研究的对象,具有代表性的有W.H.Chen、LLM[2]、AAN[3]等算法。LLM算法将1-D DCT所需的乘法器个数减小到理论最小值11个。

在编解码器应用方面,Xvid的MPEG-4编解码器使用LLM算法的12个乘法器形式,而很多JPEG编码器用AAN算法。李晗等人[4]利用加法和移位器代替乘法器,在提高频率上取得了比较好的效果,但是即使将其运用到LLM算法中,2-D DCT仍需要使用184个加法器。

本研究通过引入整数变换矩阵和增加缩放模块,设计面积小、速度快、频率高的且可复用多个标准的2-D DCT。

1 离散余弦变换DCT原理

离散余弦变换DCT,是指对一帧图像以块为单位(通常是8×8或4×4像素块),通过2维DCT变换将图像从空间域变换到频域的过程,目的在于去除像素间的相关性。

二维N×N图像块的DCT变换的定义[5]如下:

2 二维DCT的VLSI结构优化设计

2.1 算法优化

整数矩阵的引入,一方面有效地减少计算量,另一方面由于Ef的运算被放到量化端和量化同时考虑,其矩阵系数由量化步长QP的大小决定。所以H.264标准对于DCT的处理和别的标准不同,很难用于其他标准中,即不具有普遍性。笔者考虑将Cf矩阵引入,得到Ef矩阵:

其中,a,b,c,d,e,f都是浮点数,由于在VISI中运算不方便,将其转化为定点数,经过扩展放大216得到a=8 192,b=7 740,c=10 486,d=7 346,e=9 777,f=13 159。

如果直接乘以缩放矩阵式(3)的64个元素需要64个乘法,耗费时钟多,面积大。本研究考虑引入流水线技术,具体有以下两种方案:

(1)通过在乘法器前面增加选择器可以压缩到8个乘法器。例如,如果2-D DCT按列输出,则每一列相应的元素都乘以上面矩阵中对应列的相应元素,由于对称性,可以在让每个乘法器在3个数之间选择,送出乘数,进行相乘,如第1个乘法器在a,b,c之间切换,如果当前输入列为第1列或者第4列,则输出到第1个乘法器的一个乘数为a,另一个乘数为相应列的第

写成矩阵形式为F=AfAT,其中A矩阵为浮点数矩阵,在H.264 High Profile标准中,将A阵进行整数化,矩阵形式等效为:Y=(CfXCfT)Ef,其中Cf矩阵[6]为:

1个数据,如果是第2、4、6、8列,则选择相应的乘数为b,如果是第3、7列则选择乘数为c。同理,其他6个乘法器类似。

(2)如果对频率要求比较高,考虑到乘法器的延迟比较大,将乘法器用加法器和移位寄存器替代。根据3种乘数并行计算出乘法结果。例如,由于第2维DCT送出的某一列的第1个像素结果,有可能进行的乘法是“×a”、“×b”、“×c”。为了取代这个乘法器,先用加法器和移位器取代这些乘数,如:b=213-29+26-22。这样可以通过加法和移位来计算出当前数据经过3种乘法之后的结果。通过计数当前列数即可选出最后的结果。由于每个系数最多有3个加法器即可实现,因此,方案1需要的一级乘法器延迟可以变成2级加法的延迟,提高了工作频率。取代8个乘法器所需加法器数量如表1所示。

由表1可知,每组改成2级加法提高工作频率后,用66个加法器取代8个乘法器。针对不同的应用需求(频率、面积)可以考虑不同的方案。

2.2 算法验证

对以上算法进行C语言建模,并将其移植到Xvid的MPEG-4的开源代码[7]编码器的DCT中。在不改变其他模块(包括IDCT)的前提下,通过输入不同的YUV原始视频序列(格式为4:2:0),先用标准代码进行编码,再用改进后的代码进行编码,分别通过Xvid的MPEG-4解码器进行解码。最后分别将解码得到的YUV文件和原始YUV文件,在亮度Y、色度Cb和Cr分量上进行PSNR值对比。统计每个序列300帧中每种成分的均值和所有序列在Y、Cb、Cr上的均值。本研究所用YUV原始视频序列均为标准测试序列,图像大小为CIF,比特率设为512 Kbps时统计所得结果如表2、表3所示。

YUV序列1~9视频序列分别是akiyo,coastguard,container,mother_daughter,stefan,tempete,flower,vectra,footbal,帧数为300。表中Y0,Cb0,Cr0分别代表Xvid标准算法编码所得视频序列的亮度Y和色度Cb,Cr分量的PSNR值,而Y1,Cb1,Cr1,Y2,Cb2,Cr2分别为方案1和方案2在各分量的PSNR值。

两种方案相对于Xvid标准算法信噪比变化如表4所示,数值如果为正,表明PSNR值有所改善,如果为负,表明PSNR值有所损失。由表4可以看到本研究的两种方案图像质量损失不超过0.015 d B,而且方案2显示出本研究算法在色度分量上分别改善了0.004 d B和0.015 d B。经过大量统计,结果表明本研究提出的算法保证了图像质量,精度满足要求。

3 二维DCT的硬件实现

3.1 整体结构

本研究采用行列分解法进行二维DCT的设计,其硬件实现框图如图1所示。

整个2-D DCT采用流水线设计,每个时钟输入为8个数据,输出也是8个数据,中间除了流水深度需要的时钟外,不需要任何多余的等待,速度快。同时可以根据不同的应用需求以及对频率和速度要求更改流水节拍,实现速度和频率的最优化。

3.2 一维DCT的实现

这里一维DCT要实现的是式(2)中的Cf矩阵,其硬件实现如图2所示。硬件实现的时候可以设计成4级流水或2级流水。

8×8块的一行数据经过4级加法器之后输出。如果对频率要求比较高,考虑用4级流水,图2的1、2、3、4分别为1D-DCT的对应4级加法,在第3级的加法中上半部分的数据需要进行寄存以保证数据的同步。如果需要时钟周期少,则用2级流水,图中5和6分别对应2级加法。图中的“”为右移操作。

为了保证数据不溢出,对于第1级一维DCT输入的数据精度为9 bit,输出数据精度为13 bit。对于第2级一维DCT输入的数据精度为13 bit,输出为17 bit。

3.3 转置的实现

为了保证速度,流水作业不能被打断,如果用单口RAM乒乓操作则实际所需要的RAM数为16个深度为1、宽度为104 bit的RAM,所以无论从RAM的产生还是面积的角度来考虑都不现实。A.Aggoun等人[8]使用2组三角矩阵堆实现了矩阵转置的功能,通过控制8个8选1选择器来连接,这种结构需要72个寄存器,流水的深度为9 clk。李晗等人实现4×4块只用了16个寄存器,节省了面积和时钟。

本研究使用64个寄存器的寄存器组进行转置的硬件实现方案,如图3所示。图中每个方框(如r00)都是由一个选择器和一个寄存器组成。举例说明,如果输入的数据是按照8×8的列顺序输入,依次是x0,x1,…,x7。在第1个时钟将x0~x7依次存入寄存器r70,r60,…,r00中,第2个时钟,第2列的寄存器将第一列r70~r00的数据依次存入r71~r01中,而r70~r00的数据还是从输入端取数据存入。如此执行下去,直到第8个时钟,整个8×8块的数据已经存入寄存器组中,此时寄存器r77,r76…r70的值已经有效,依次从中取出数据,经过选择器按顺序排好输出,此时输出的是上个矩阵的第1列。在第9个时钟,r77~r70从r67~r60中取数据并且更新寄存,而r67~r60从r57~r50中取数据并且寄存,其他行的数据类似操作,唯独r07~r00分别从输入端取数据x0~x7并且寄存。第16个时钟时第2个8×8块的数据已经寄存完毕,可以依次从r77~r07的寄存器中取数据。如此流水下去,便完成了行列转换,流水深度为8 clk,中间不需要等待,每个时钟每个寄存器都处于工作状态,提高了寄存器的利用率,并且节省了面积,提高了速度。

3.4 缩放模块的实现

(1)方案1:使用乘法器。

采用方案1的缩放模块的硬件实现如图4所示,使用8个乘法器来实现。通过8个3选1选择器分别选择不同的乘法器系数,control通过计数确定当前输出的数据是8×8块中的第几列。如果是第1、5列,则8个选择器依次选择8 192,7 740,10 486,7 740,8 192,7 740,10 486,7 740。如果是第2、4、6、8列,即依次选7 740,7 346,9 777,7 346,7 740,73 46,9 777,7 346。如果是第2、4、6、8列,则依次选择10 486,9 777,13 159,9 777,10 486,9 777,13 159,9 777。本方案的延时主要是1级乘法器。

(2)方案2:使用加法器和移位器代替乘法器。

采用两级的加法器和移位器代替乘法器,提高电路的工作频率,如图5所示。第1个数据经过并行的3路输入,每一路都由移位器和加减法器组成,通过control模块对输入的数据所在8×8块的列数进行选择,以面积换速度,通过3路并行工作,最后控制选择输出。本方案的延时主要在2级加法器。

两种方案都需进行缩放,由于这些系数都经过放大216倍来保证中间计算值的精度,最后DCT结果需要经过右移16 bit,需要注意数据的截断。

3.5 性能对比

本研究用Verilog HDL语言描述电路,分别用VCS和DC进行了仿真和综合,下面将本研究与其他文献所设计的2-D DCT进行性能对比。2-D DCT算法使用乘法器和加法器个数对比如表5所示。

由表5可见,本研究提出的2种方案计算复杂度比其他文献都小。其中,将文献[4]应用于LLM的24个乘法器和64个加法器2D-DCT方案需要184个加法器。若应用于理论上最低乘法器(11个)的结构时,也需要168个加法器。AAN算法中1D-DCT蝶形中用了5个乘法器,但每次一维DCT后要乘以8个缩放系数需要额外的6个乘法器,或二维DCT后乘以一个缩放矩阵,对于除JPEG外的其他标准不适用。

ASIC设计实现2-D DCT性能对比如表6所示[9,10],本研究所设计的2-D DCT完成单个8×8像素块的周期被降到20个时钟频率能达到510 MHz。在90 nm CMOS工艺下,DC综合最高可以达到840 MHz。若数据保持流水送入,则只需要经过3.09μs可完成一帧高清1 080 pixels图像的数据处理,满足工程应用需求。

FPGA原型验证采用的器件为Xilinx Virtex-5XC5VLX220-1 FF1760,综合工具采用Xilinx ISE。对于2-D DCT,计算周期为20 clk时,方案1综合频率为180 MHz,方案2为200 MHz,周期为25 clk时方案2为290 MHz。

4 结束语

本研究旨在通过设计适用于MPEG-4,H.263,JPEG,H.264等编码器芯片的快速8×8 DCT的IP核,研究并设计了适合于VLSI实现的快速2-D DCT结构,利用行列分解法,通过引入整数变换矩阵、增加缩放模块实现,经算法验证满足精度要求。转置的实现方案提高了寄存器的利用率,并且减小了流水深度。提供了2种实现方案实现缩放模块,可以根据不同的应用需求在面积、速度、频率之间权衡。采用流水线设计,并减小了流水深度,提高了速度和频率。具有灵活性和实用性。

用Verilog HDL进行硬件设计,并用VCS进行了仿真,在90 nm CMOS工艺下电路综合频率达到840 MHz,FPGA模拟验证频率达到290 MHz,完全满足设计要求。与其他文献2-D DCT算法结构相比,本研究提出的结构具有面积小、速度快、频率高的特点。不仅可以很好地应用于MPEG-4和H.263和JPEG等标准,还将H.264 High Profile中的8×8整数DCT进行了复用,是一个基于多标准的2-D DCT的IP核,可以很好地应用于支持多标准的编码器中。

摘要：针对多标准图像视频编码器中二维离散余弦变换的复用问题,设计了适用于MPEG-4,H.263,JPEG,H.264 High Profile编码器芯片的快速8×8 2-D DCT IP核,并完成了RTL设计、仿真和FPGA原型验证。通过引入H.264 High Profile 8×8整数变换矩阵和增加缩放模块,完成了多个标准中2-D DCT的复用。经Xvid MPEG-4编解码器验证,满足精度要求。设计采用流水线技术,并优化了速度和频率,在90 nm CMOS工艺下频率达到840 MHz。研究结果表明,该技术能很好地应用于多标准编码器中。

关键词：离散余弦变换,多标准图像与视频编码,JPEG,MPEG-4,H.264

参考文献

[1]陈禾,毛志刚,叶以正.DCT快速算法及其VLSI实现[J].信号处理,1998,14(A12):62-70.

[2]LOEFFLER C,LIGHTENBERG A,MOSCHYTZ G S.PracticalFast 1-D DCT Algorithms with 11 Multiplications[C]//Int ConfAcoustics,Speech and Signal Processing.Glasgow:[s.n.],1989:988-991.

[3]ARAI Y,AGUI T,NAKAJIMA M.A fast DCT-SQ schemefor images[J].Transactions of Institute of Electronics,Information and Communication Engineers,1988,E71(11):1095-1097.

[4]李晗,孙义和,向采兰.二维离散余弦变换及其逆变换的VLSI实现[J].微电子学,2008,38(3):326-329.

[5]毕厚杰.新一代视频压缩编码标准—H.264/AVC[M].北京:人民邮电出版社,2005:112-114.

[6]GORDON S,MARPE D,WIEGAND T.Simplified use of8×8 transforms[S].JVT Doc,JVT-K028,Munich,2004.

[7]XVID MPEG-4 VIDEO CODEC[DB/OL].[日期不详].www.xvid.org.

[8]AGGOUN A,JALLOH I.Two-dimensional DCT/IDCT ar-chitecture[J].IEEE Proc.Computer Digital Technolo-gy,2003,150(1):2-10.

[9]KURODA T.A 0.9 V,150 MHz,10 mV,4 mm2,2-D dis-crete cosine transform core processor with variable threshold-voltage(VT)scheme[J].IEEE J.SSC,1996,31(11):1770-1779.

余弦变换论文篇5

复杂信号的分选识别一直是电子对抗的关键技术和难题。随着技术的快速发展,常规脉冲信号在信号环境中的比例已越来越少,线性调频、非线性调频和相位编码等复杂调制脉冲信号逐渐增多,这对信号的分选识别提出了更高的要求,必须对信号的脉内特性进行识别分析。信号的脉内特性是信号细微特征的主要体现,是电子侦察中对信号分选和识别的重要参数,是设备个体特征识别的重要特征之一。因此,新一代辐射源识别系统一般都在原有的系统中加入了信号脉内调制特征信息的提取和识别。

通常,各种应用系统对脉内调制特性分析方法的要求是精度高、速度快、智能化程度高和便于实现等。然而已有的许多分析方法,如谱相关分析法、延时相关法、数字复倒谱法以及相位进程计数调制域分析技术等都存在这样或那样的缺点,很难满足实际系统的要求[1]。这里从速度快、便于实现角度考虑,提出了一种新的识别方法。

该方法以信号频谱为基础,充分利用调制信号频谱特性的差异对信号的脉内调制样式进行识别。与前述方法相比,运算量小,便于实现。

1 识别方法

相位编码信号的解析表达式如下:

s(t)=a(t)exp[jφ(t)]exp(j2πf0t)。 (1)

信号的复包络为:

u(t)=a(t)exp[jφ(t)]。 (2)

式中,a(t)为振幅;φ(t)为相位调制函数;f0为载频。对于二相编码(BPSK),φ(t)为0和π;四相编码信号(QPSK),φ(t)为 $0 ‚ \frac{π}{2} ‚ π ‚ \frac{3 π}{2}$ 。

对相位编码信号进行平方,即

s2(t)=a2(t)exp[j2φ(t)]exp(j4πf0t)。 (3)

相位差分法速度快,易于实现,但其对噪声比较敏感,在低信噪比下,性能严重下降,针对其不足,提出了本文的识别方法。以下就相位差分法和本文方法展开分析,并对2种方法的识别性能进行了仿真对比。

1.1 相位差分法[1,2]

利用相干混频的方法可以获得原信号的2路正交分量而不丢失任何相位和幅度信息。对中频信号s(t)相干混频后有:

sI(t)=b(t)cos(2πf2t+φ(t)), (4)

sQ(t)=b(t)sin(2πf2t+φ(t))。 (5)

式中,f2为第2中频,且b(t)=0.5a(t)。sI(t)和sQ(t)可构成解析信号,且该解析信号的幅角为:

p(t)=2πf2t+φ(t)。 (6)

实际计算时,根据式(4)和式(5)得到的幅角值p(t)是有模糊的,要分析相位特性和判断调制样式,必须对上述幅角值解模糊,解模糊过程可以参见文献[3]。

其一阶微分为:

$\frac{\partial p (t)}{\partial t} = 2 π f_{2} + 2 π f_{p s k}$ 。 (7)

式中,对于二相编码,fpsk可能的取值为0和fs/2;对于四相编码,fpsk可能的取值为0、fs/2、fs和3fs/2,fs为采样率。

在计算机上处理时需要将上式离散化,即将连续相位的一阶微分转换为相位序列的一阶差分。式(7)表示的一阶微分可以化为以下差分形式:

$θ (i) = \frac{p (i + 1) - p (i)}{2 π} f_{s} - f_{2}$ 。 (8)

式中,i=nTs,Ts为采样间隔;fs为中频采样频率。

由式(8)得到的相位差分序列的幅值会受到采样频率的影响,这会对识别和参数估计带来不便。为此对其进行归一化处理,归一化的相位差分序列用fg(i)表示为:

$f_{g} (i) = \frac{2 \times (θ (i) + f_{2})}{f_{s}} = \frac{p (i + 1) - p (i)}{π}$ 。 (9)

经过归一化以后的相位差分序列幅度范围为(-2,+2),对应于相位变化(-2π,2π)。

上面采用的相位差分是一重的,实际应用时可以采用多重相位差分,以提高算法对低信噪比信号的适应能力。对相位序列p(i)的N重相位差分序列fN(i)计算如下:

$f^{Ν} (i) = \frac{\sum_{j = 1}^{n} p (i + j) - \sum_{j = 0}^{Ν - 1} p (i - j)}{2 Ν^{2} π} f_{s}$ 。 (10)

假定噪声是不相关的,则求多重相位差分时噪声会部分抵消,所以通过求N重相位差分能够有效地减小噪声影响。

通过对相位进行差分运算,可有效检测出相位编码信号的突变点。利用高阶差分还可一定程度地去除噪声的影响。理论上,二相编码信号的相位进行差分后,相位跳变点处的幅值应相等,四相编码信号的相位进行差分后,相位跳变点处的幅值应呈比例。但是,通过差分运算之后的幅度由于噪声的影响,其规律性受到破坏。这样,通过差分运算后的幅值是否成比例来区分二相编码和四相编码信号就容易出错。由此,在低信噪比下(<5 dB),受噪声的影响,相位差分法的应用受到了一定的限制。为此,提出了一种基于频谱特征的调制识别方法——离散余弦变换方法(DCT)。

1.2 DCT变换法

不同脉内调制类型信号的频谱不同,并且频谱系数之间具有相关性,采用DCT的方法对频谱系数去相关。由于利用少数几个DCT变换系数可以表征信号的总体特征,故选取部分DCT变换系数来描述信号。

Karhunen-Loeve(KL)变换能够最大限度地去除信号之间的相关性。但为了得到正交特征向量必须求得相关矩阵:

R=E[xxT]。

式中,x为信号向量。这在实际情况下是不可行的。FFT和DCT也是有效的信号去相关方法,但FFT得到的是复信号。所以采用DCT去相关。

长度为N的矢量x的DCT变换定义为:

$\begin{array}{l} y (k) = a (k) \sum_{n = 0}^{Ν - 1} x (n) \cos (\frac{π (2 n + 1) k}{2 Ν}) ‚ \\ k = 0, 1, \dots Ν - 1 。 (11) \end{array}$

式中,

由于不同调制类型信号其频谱不同,采用离散余弦变换(DCT)的方法去相关后,其特征参数在特征平面的分布呈现了较为明显的差别。由于特征参数较多,可选取部分区分度较大的DCT变换系数来描述信号。通过计算选取的特征参数的平均离散度,可以将不同调制类型信号进行有效区分。

平均离散度的定义为:

$\hat{k}_{1} = \sum_{i = 1}^{Ν} k_{1} (i)$ ; $\hat{k}_{2} = \sum_{i = 1}^{Ν} k_{2} (i)$ ; (12)

$σ_{1} = \frac{1}{Ν} \sum_{i = 1}^{Ν} (k_{1} (i) - \hat{k}_{1})^{2}$ ; (13)

$σ_{2} = \frac{1}{Ν} \sum_{i = 1}^{Ν} (k_{2} (i) - \hat{k}_{2})^{2}$ 。 (14)

式中,k1为第1类特征参数;k2为第2类特征参数; $\hat{k}$ 1为第1类特征参数的平均值; $\hat{k}$ 2为第2类特征参数的平均值;σ1为第1类特征参数的平均离散度;σ2为第2类特征参数的平均离散度。

由以上分析可得,基于DCT变换的脉内调制特征识别方法的步骤如下:

① 利用FFT求信号的频谱并取模;

② 截取信号的3 dB有效带宽,进行能量归一化;

③ 对归一化后的频谱进行DCT变换;

④ 选取2个区分度较大的DCT变换系数来描述信号,并分别计算每一个系数的平均离散度;

⑤ 根据计算得到的平均离散度设置一门限。根据各种信号的平均离散度与门限的大小关系可进行分类识别。

BPSK和QPSK信号较难区分,这是因为BPSK和QPSK信号的频谱有很大的相似性。若直接对其频谱进行DCT变换,这2种信号变换后的特征参数在平面上的分布会混叠在一起,无法有效区分2种信号。在此提出了一种改进的方法,先对接收信号进行平方运算,然后再对信号平方后的频谱进行DCT变换,这样就将同类型调制信号的识别变换成不同类型调制信号的识别。

因此对这2种信号的区分可以分2步:

① 先对信号进行平方运算。此时二相编码信号的相位调制函数值为0,2π,四相编码信号的相位调制函数值为0,π,2π,3π。根据正弦信号周期性,此时二相编码的相位调制函数不具备相位调制能力,四相编码信号的相位调制函数只有0和π两个值。因此,二相编码信号变为常规信号,四相编码信号则变为二相编码信号;

② 对平方后的信号进行傅里叶变换,截取3 dB带宽,对其进行DCT变换,选取部分DCT特征参数来区分2种信号。

2 仿真分析

仿真条件:测试信号由信号模型产生。二相编码信号和四相编码信号的参数(参数进行了归一化)选取相同。频率值为0.2,采样点数为512,每个子脉冲内采样点数为64,噪声为高斯白噪声,均值为0,方差为1;信噪比范围为0～10 dB。2种信号各选取50个样本。这里选取前2个特征参数进行分析比较。仿真结果如图1和图2所示。

图1和图2所示为信噪比为3 dB时,2种信号经相关处理后的DCT参数分布图。图1中2种信号的DCT系数在平面上的分布混叠在了一起。这是因为BPSK和QPSK信号的频谱有很大的相似性,直接对其频谱进行DCT变换后,这2种信号的DCT系数也会有很大的相似性,从而在平面的分布会交叠在一起,进而无法有效区分2种信号。

图2为2种信号经过平方变换后的DCT系数,可以看出分布有明显的区别。这是因为二相编码信号平方后变为常规信号,其频谱有明显的尖峰,带宽很窄,能量高度集中,经DCT变换后能量仍然高度集中,而四相编码信号平方则变为二相编码信号,频谱仍然具有一定的带宽,经DCT变换后能量分布仍然比较分散。这说明常规信号变换后的能量聚集性较好,平均离散度σ较低,相位编码信号变换后的能量聚集性较差,平均离散度σ较高。同时,由仿真结果得出:2种信号经DCT变换后的第1个特征参数k1差别较大,故可以选取一适当的门限阈值Th。若k1<Th,判为二相编码信号,反之,判为四相编码信号。因此,根据2种信号进行相应变换后特征参数的分布规律,可以将2类信号进行有效区分。

2种方法的识别性能曲线如图3所示。从图3可以看出,本文方法具有较好的抗噪声能力,在2 dB时识别率仍然可达80%,而相位差分法在信噪比低于5 dB时,性能迅速下降,在2 dB时几乎无法识别2种信号。这是因为DCT变换具有能量压缩的性质,对信号进行处理后,仅用少数几个特征参数就可以表征信号的整体特征。因为噪声是均匀分布在整个频带上的,这里选择有效带宽可以有效滤除带外噪声的影响。在此基础上,进一步用DCT处理后,信号能量得到了更好的压缩,能更好地表征信号。而低信噪比下,噪声对信号的相位产生了严重的影响,真实相位突变点可能不会产生相位跳变,而没有相位突变点的地方,会产生大量的虚假跳变点,这样经过相位差分后,差分曲线会出现严重的失真。由此,通过比较差分曲线幅度来区分相位编码信号有较高的错误概率。当信噪比较高时,2种方法性能相近。但本文方法采用FFT处理信号,仍然具有较快的速度,在一定程度上能满足实时处理的要求。

3 结束语

这里提出了基于离散余弦变换(DCT)的二相编码和四相编码信号识别方法。在仿真条件相同的情况下,相比相位差分法,所提出的方法识别率较高,抗噪性能也有所提高。同时,该方法具有运算量小,提取特征参量稳定的特点。该方法充分利用不同调制信号频谱的差异进行分析,快速高效,同时频分析、谱相关法分析相比,不需要庞大的计算量即可提取有效的特征对信号进行分类识别,经济实用。但是,该方法在更低信噪比下(<0 dB),识别性能会严重下降。因此,如何在低信噪比下保持较高的正确识别率需要进一步研究。基于信号频谱的特征提取方法不仅可以成为提升信号分选可靠性的一种重要手段,而且可以进一步精细鉴别信号的个体特征,具有更广泛的应用前景。

参考文献

[1]王丰华,黄知涛,姜文利.一种有效的脉内调制信号识别方法[J].信号处理,2007,23(5):686-689.

[2]黄知涛,周一宇.一种有效的BPSK/QPSK信号调制识别方法[J].电子对抗技术,2005,20(2):10-13.

[3]黄知涛,周一宇,姜文利.基于相对无模糊相位重构的自动脉内调制特性分析[J].通信学报2003,24(4):153-160.

[4]温志津,王甲峰.PSK非相干差分解调[J].通信技术,2009,42(9):12-15.

[5]GARDNER W A.Exploitation of Spectral Redundancy in Cyclostationary Signals[J].IEEE ASSP Mag,1991,8(4):14-36.

余弦变换论文篇6

离散余弦变换(Discrete Cosine Transform,简称DCT)常被认为是对语音和图像信号进行变换的最佳方法。为了工程上实现的需要,国内外许多学者花费了很大精力去寻找或改进DCT的快速算法。由于近年来DSP的发展,加上专用集成电路设计上的优势,这就牢固地确立DCT在目前图像编码中的重要地位,成为H.261、JPEG、MPEG等国际上公用的编码标准的重要环节[1]。MATLAB是由美国Math-Works公司推出的用于数值计算和图形处理的科学计算软件,它集数值分析、矩阵计算、信号处理和图形显示多种功能于一体,构成了一个方便的界面友好的用户环境[2]。MATLAB中的图像处理工具箱是许多基于MATLAB技术计算环境的函数包的集合图形功能完备,本文主要讨论了DCT变换方法,并讨论了应用MATLAB中的图像处理工具箱中的相关函数和命令来实现离散余弦变换的信号压缩算法的仿真。

2 DCT变换及在matlab中的实现

DCT是一种与傅立叶变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。下面主要以二维变换为例介绍DCT变换。

2.1 离散余弦变换(DCT)正反变换公式

正变换公式:

式中:

反变换公式:

式中:x,y为空间域采样值;u,v为频率域采样值。其中f(x,y)是空间域二维向量之元素,F(u,v)是变换系数阵列元素。在二维离散余弦变换中,通常数字图像用像素方阵表示,即M=N[3],在这种情况下,二维离散余弦的正反变换可简化为

式中

2.2 在MATLAB仿真中的实现

主要是采用二维DCT变换的矩阵式定义来实现的,矩阵式定义可以表示为

其中[f(x,y)]是空间数据阵列,[F(u,v)]是变换系数阵列,[A]是变换矩阵,[A]T是[A]的转置[4]。

3 实验研究

离散余弦变换DCT的MATLAB实现方法,基于FFT的快速算法,这是通过MATLAB工具箱提供的dct和idct函数实现的,二维DCT变换和逆变换指令为dct2和idct2[5]。

1)对一语音信号进行压缩处理的matlab实现程序如下:

得到原始信号、原始信号的DCT变换波形、经过压缩后的DCT波形以及通过压缩后的DCT波形重建的信号波形如图1。

可以看出,当波形数据做DCT变换后压缩到原数据的12.94%左右时,根据压缩信号重建的时域波形存在失真,但在工程上这样的失真是允许的。在一定失真度指标下,通过DCT变换可以使数据得到很大程度的压缩。

2)对一图像进行压缩处理的matlab实现程序如下[6]:

程序结果如下:

图像进行离散余弦变换后的结果矩阵如图2所示,显示DCT的结果中能量大部分集中在左上角。

根据矩阵左上角部分数据就可以重建图像,不同门限下的压缩率是不同的,对应的原始图像、重建图像如图3所示。

4 结束语

DCT具有很好的能量压缩性能,而且DCT变换是实数变换,便于工程实现,重建信号失真较小,压缩质量令人满意。DCT在本文中用MATLAB来实现离散余弦变换的信号压缩,具有方法简单、速度快、误差小的优点,免去了大量矩阵计算。

参考文献

[1]徐明远,邵玉斌.MATLAB仿真在通信与电子工程中的应用[M].西安:西安电子科技大学出版社,2005:267-268.

[2]孙兆林.MATLAB6.x图像处理[M].北京:清华大学出版社,2002:163-164.

[3]贾永红.计算机图像处理与分析[M].武汉:武汉大学出版社,2001:201-203.

[4]朱秀昌,刘峰,胡栋.数字图像处理与图像通信[M].北京:北京邮电大学出版社,2002:154-155.

[5]飞思科技产品研发中心.MATLAB6.5辅助图像处理[M].北京:电子工业出版社,2003:72-73.

余弦变换论文篇7

1996年Cox等首次提出了在DCT变换域里嵌入水印[1], 随后很多研究者开始研究不同变换域的水印算法, 包括离散傅立叶变换 (Discrete Fourier Transform, DFT) 和离散小波变换 (Discrete Wavelet Transform, DWT) [2]。近几年来, 随着对变换域研究的深入, 人们又提出在contourlet、曲波 (curvelet) 、脊波等变换域嵌入水印。直到目前, 变换域水印算法仍然是研究热点之一, 尤其是鲁棒数字水印算法[3,4,5,6,7]。

目前基于DCT域的数字水印算法主要存在两个问题:

(1) 与contourlet变换、DWT相比, DCT缺乏多分辨率分析, 方向性等特点。例如, 对小波变换而言, 小波基和小波变换级数的选择给小波变换域数字水印算法的设计带来了很大的灵活性和优越性[7], 特别是小波变换的多尺度分解;另外contourlet变换的多方向性更是DCT所不具有的。因此将DWT多级变换的思想用于DCT 等变换域来设计数字水印算法会产生什么样的效果?这是一个值得研究的问题。

(2) 常规的DCT变换域水印算法对于JPEG有损压缩效果比较理想, 但对于加噪, 滤波等常规信号处理的性能达不到我们期望的要求, 特别是对于抗几何攻击, 比如旋转、缩放等变换鲁棒性较差。因此如何提高DCT变换域水印算法抗几何攻击也成为一个值得研究的问题。

针对以上两个问题, 我们提出一种基于Radon变换和多级离散余弦变换的鲁棒性水印算法。下面首先分析DCT变换的特性, 其次介绍一下基于多级离散余弦变换的鲁棒性水印算法和Radon变换检测算法, 然后对本算法进行分析, 最后给出本文结论。

2DCT变换的特性分析

Cox等提出水印应放在视觉系统感觉上最重要的分量上 (对应DCT域中的低频系数) 。其理由是感觉上最重要的分量是图像信号的主要成分, 携带较多的信号能量, 在图像有一定失真的情况下, 仍能保留主要成分。因此, 若水印嵌入到感觉上重要的分量, 则稳健性较好。当然, 为了保证不可见性, 对感觉上重要的分量的改进应谨慎进行。一些学者则进行了折中, 把水印放在DCT域中频系数上。尽管Cox等的观点已逐渐为人们所赞同和采纳, 但在基于块DCT的水印算法中, DC (直流) 分量总是被明确地排除在外, 这样处理是为了避免嵌入了水印出现块效应现象。

根据对图像块DCT系数定性和定量的分析, 黄继武等[8]提出一个新的嵌入对策:从稳健性的角度, 在保证水印不可见性的前提下, DC分量比AC (交流) 分量更适合于嵌入水印。在此基础上, 他们提出一种自适应水印算法。实验结果证实了所提出的隐形水印对于噪声干扰和常见图像处理 (如压缩、低通滤波、裁切和子抽样等) 是十分稳健的。

在DCT域, 不同的DCT系数做为水印载体对水印的稳健性有不同的影响。为了使水印具有较好的稳健性, 用来嵌入水印的DCT系数应满足如下条件:

(1) 在经过常见的信号处理和噪声干扰后仍能很好的保留, 即这些DCT系数不应过多的为信号处理和噪声干扰而改变。

(2) 具有较大的感觉容量, 以便嵌入水印后不会引起原始图像视觉质量的明显改变。

第一个要求是为了保证水印在嵌入图像后有较好的稳健性。当加入水印的DCT系数改变较小时, 水印便更能被保留, 这是显然的。第二个要求是同时针对不可见性和稳健性而提出。较大的感觉容量意味着在主观视觉效果不变的前提下有较大的改变冗余度。这也意味着可以嵌入较强的水印信号。根据这两个要求, 低频DCT系数作为嵌入水印的较好位置已被逐步采用, 并得到共识。然而被人们忽视的一个事实是, DC分量比任何AC分量更适合嵌入水印信号。这个事实有两方面的理由:

(1) 与AC系数相比DC系数的振幅大的多。在图像中嵌入水印可视为在强背景下叠加一个弱信号。根据Weber定律和视觉系统的照度掩蔽特性, 背景亮度越亮 (DC系数值越大) , 嵌入信号的可见性检测门限就越高, 即DC系数 (代表图像块的平均亮度) 的感觉容量越大。根据分析和实验结果表明, 与AC系数相比, 尽管DC系数可以被改变的比例不如AC系数大, 但可改变的绝对值却比AC系数大的多。这意味着DC系数具有比AC系数更大的感觉容量。

(2) 根据信号处理理论, 嵌入水印的图像最有可能遭遇到信号处理过程有数据压缩、低通滤波、次抽样、差值、D/A转换等, 保护DC分量比保护AC分量要好。实验结果表明, Gaussian噪声干扰对DC分量和AC分量的影响程度大致相同。

由以上理论可知, DC系数代表了图像块的平均亮度, 对水印的嵌入稳健性有着重要的意义。但是常规的DCT域的算法都是对原始数据做一次DCT得到的DC分量只有一个, 或者对原始数据进行分块DCT变换, 得到多个DC系数。这样的变换没有能够充分利用DC分量周围的低频系数, 不能体现能量集中的特性。

3DCT的能量集中特性

以Lena灰度图像载体为例, 在对图像进行一次DCT变换后, 变换系数矩阵左上角的数值较大, 这些系数相对较重要, 一般称为低频系数, 常用于嵌入水印信息。图 1 以 8×8 的图像块系数为例说明了DCT的能量集中特性, 其中图 1 (a) 显示的是一个图像块的空域系数矩阵, 图 1 (b) 显示的是对该块进行一次DCT后获得的变换域系数;图 1 (c) 显示的是对该块直接进行二次DCT后获得的变换域系数;图 1 (d) 显示的是对该低频4 ×4块进行二次DCT后获得的变换域系数。

正因为如此, DCT 经常被信号处理和图像处理所使用, 常用于对图像进行有损数据压缩, 同时DCT也倍受数字水印技术的青睐, Cox等[1]提出的第一个变换域扩频水印算法就是在 DCT域下实现的。与 Cox 等的第一个变换数字水印算法类似, 常规的DCT域数字水印算法仅对载体进行一次 DCT变换, 然后选择合适的变换系数嵌入水印信息。对比 DWT 的多级分解思想, 如果对载体进行多级DCT, 会得到怎样的结果?本文对图1 (b) 所示的DCT数据进行二次DCT, 得到图1 (c) 所示的系数矩阵。从图 1 (c) 可见, 直接进行二次 DCT 并不能对系数进行再次“能量集中”, 于是我们选择图 1 (b) 左上角 4×4 大小的低频系数块进行二次 DCT, 得到了图 1 (d) 所示的系数矩阵, 从中可以观察到能量被再次集中的特性。本文将进行多次 DCT 变换的操作称为 “多级DCT”, 并且对大量数据进行类似图 1 所示的实验得到了相同的结论:合理地进行多级 DCT 可以使DCT的 “能量集中” 特性得到更加充分的展示, 从而获得更多数值较大的数据。与多级DWT不同的是多级DCT并不要求必须针对 1/ 4 的 k - 1 级DCT系数进行第 k 级 DCT, 例如, 对256 ×256 的图像进行一级DCT后, 允许选择一级DCT系数矩阵中左上角128 ×128 的系数块进行二级DCT, 也允许选择一级 DCT 系数矩阵中左上角 64 ×64 的系数块进行二级 DCT。

4 基于多级DCT的抗几何鲁棒性水印算法

常规的DCT域数字水印算法只对载体数据进行一次DCT, 然后以适当的方式修改选择的变换系数实现水印信息的嵌入。为了充分利用DCT的 “能量集中” 特性, 本文对载体数据进行多级DCT, 使得系数进行多次能量集中, 然后选择合适的系数嵌入水印信息。下面介绍基于多级DCT的数字水印算法。

4.1 水印图像嵌入前的预处理算法 (图像置乱)

在水印嵌入之前, 为了增强水印图像安全性, 要对嵌入水印的图像进行置乱。常见的置乱变换有Arnold变换 (又称猫脸变换) , 排列变换, Fibonacci变换, 这些置乱图像后的直观效果各不相同, 但其计算复杂度是基本一致的, 因为它们均存在取模运算, 使得在作置乱时较费时间, 而且除了Arnold变换的逆变换易求外, 其余变换的逆变换不易求出。基于以上考虑本文对水印图像的置乱变换采用仿射变换。

仿射变换的一般形式:

其矩阵形式为

其中, undefined为原始坐标, undefined为变换后的坐标。a, b, c, d, e, f分别为变换的参数系数。该变换通过像素点的位置的置换来置乱图像。当遍历完所有的原始图像像素点之后, 便进行了一次完整的仿射变换置乱。

本算法采用的仿射变换正变换:

当x

当x≥y时:

其逆变换为

当x′+y′≤N+1时:

当x′+y′>N+1时:

用上述方法对二值水印图像进行置乱的效果如图2所示。

4.2 水印提取前的几何校正步骤 (Radon变换检测算法)

(1) 先对原始图像进行角度为0°的Radon变换得到参照向量R0 (R0可以在IPR信息版权保护中心进行注册, 以后在水印提取时可以不需要原始图像, 只需在信息版权保护中心注册的R0与待检测图像作运算即可, 因此该检测方法为盲检测) 作为下一步的比较参照对象。

(2) 对待检测图像进行一组Radon变换, 投影角度从到0°到359°, 增量为1° (即选取步长量为1°进行投影) 。每执行一次Radon 变换就可得到一个Radon 变换向量。根据投影角度取值, 共可获得360 个检测向量R (θ) , undefined, 检测向量与其对应的投影角度组成“角度-向量对”, 共有360 组。

(3) 计算每一组“角度-向量对”中的检测向量R (θ) , undefined与参照向量R0的相关系数。计算公式如下式所示。

undefined (7)

式 (2) 中:R*0, R*i (θ) 分别表示R0, Ri (θ) 的转置。通过计算共得到360 个相关系数。相关系数表明检测向量与参照向量的相似程度, 其中的系数最大值表示对应的检测向量与参照向量最相似, 说明为得到该向量对待检测图像执行Radon变换时的图像输入量与对原始图像执行Radon 变换时的图像输入量最相似, 即系数最大值对应的“角度-向量对”中的角度值就是图像经受旋转的角度值。

4.3 水印的嵌入和检测算法

4.3.1 水印的嵌入算法

Step1:对载体256×256灰度Lena图像进行一次DCT;

Step2:选择部分DCT系数进行第二次DCT, 然后进行第三次, …, 第N次得到期望是我能量集中程度。 (本文选择对载体Lena图像进行一次DCT后, 左上角M×M系数块进行二级DCT) ;

Step3:在二级DCT系数中选择最大的N个系数记为Ai (i=1, 2, 3...N) (N=1024) ;

Step4:选择32×32的二值图像做为水印图像Wi, 并作图像置乱后记为W′i (i=1, 2, 3...N) ;

Step5:按照乘性原则进行水印嵌入, 嵌入公式:Bi=Ai (1+αWi) 。α为调整因子, Bi为嵌入后的幅值系数。

Step6:进行二级IDCT和一级IDCT得到嵌入水印后的图像。

4.3.2 水印的检测算法

Step1:在待检测图像进行水印提取之前, 利用Radon变换检测算法对待检测图像进行几何校正。

Step2:分别对原始图像和几何校正之后的图像进行两级DCT得到各自的幅度系数为Ai和Bi。

Step3:通过公式:undefined得到提取后的图像w′i (i=1, 2, 3...N) , 并作图像复原就可以得到水印图像wi。

Step4:将提取的水印图像wi和原始水印图像Wi做相似度的计算。若相似度高于阈值门限, 则判定水印存在, 若低于门限则水印不存在。

5 实验仿真分析及结果

在实验仿真的过程中, 我们选取的载体图像都是256级的灰度图像, 其中水印图像为二值图像, 大小为32×32, 原始载体图像为256×256的Lena图像。Sim表示两幅图像之间的相似程度;对于图像的视觉质量的定量描述, 我们使用常用的基于像素的差分失真度量方法PSNR.。

undefined (8)

PSNR=10lg (2552/MSN) (9)

MSN表示两幅图像之间的均方误差, I (x, y) 和I′ (x, y) 分别表示在 (x, y) 处的灰度值。

sim=undefined (10)

为了验证算法的有效性, 本文进行了4组实验, 实验1是在正常情况下, 在原始Lena载体图像嵌入二值水印图像, 结果见图5;实验2是对Lena图像进行各种角度的旋转后进行水印检测, 结果见表1;实验3是对Lena图像进行加噪声和滤波常规信号处理, 结果见表2;实验4是JPEG压缩的测试结果, 见表3。由实验结果可以看出, 本文算法对常规的信号处理具有良好的鲁棒性, 同时对于旋转攻击具有很高的检测精度, 经过几何校正后能准确的提取出二值水印图像, 具有很好的鲁棒性。

6 结束语

本文提出了一种基于Radon变换和多级离散余弦变换的鲁棒性水印算法。常规的DCT域数字水印算法只是对载体数据进行一次DCT或进行分块DCT变换, 然后以适当的方式修改选择的变换系数实现水印信息的嵌入, 这样的算法并未充分利用DCT的“能量集中”特性, 因而实验结果不太理想, 而本文对载体数据进行多级DCT, 使得系数进行多次能量集中, 然后选择合适的系数嵌入水印信息。通过对载体图像实现多级DCT变换进行的一系列仿真实验发现该算法在保证载体图像的不可见性前提下, 对各种常规的信号处理 (比如加噪、滤波、有损压缩等) 以及不同角度的旋转攻击有很强的鲁棒性。由于Radon变换的检测算法具有较高精度, 即使图像经过任意的旋转几何攻击, 检测结果也表现出了稳定性, 检测结果中没有误差。尽管实验得到了较为理想的结果, 但是算法本身存在着一定的局限性。因为几何变换在事先是无法知道的, 因此对于旋转攻击的参数估计只能采用搜索判断的策略, 这是一项计算量比较大的工作, 整个检测过程执行需要较长的时间。因此, 今后的研究重点将放在如何减少穷举检测空间上, 从而缩短检测时间, 提高检测效率。

参考文献

[1]Cox I J, Kilian J, Leighton Tet al.Secure spread spectrum watermarking for multimedia.IEEE Transactions on Image Processing, 1997, 6 (12) :1673-1687

[2]王颖, 肖俊, 王蕴红.数字水印原理与技术.北京:科学出版社, 2007.

[3]陈真勇, 唐龙, 唐泽圣, 熊璋.以鲁棒性为目标的数字多水印研究.计算机学报, 2006, 29 (11) :2037-2043

[4]潘蓉, 高有行.基于小波变换的图像水印嵌入方法[J].中国图像图形学报, 2002, 7 (7) :667-671

[5]J.J.K.O'Ruanaidh, T.Pun, Rotation, scale and translation invariant spread spectrum digital image watermarking.Signal Pro-cessing, 1998, 66 (3) :303-317

[6]Cai Lian, Du Si dan, Gao Duntang, Geometrically invariant watermarking based on Radon transformation, Journal of electronics (chi-na) , 2005, 22 (5) :300-306

[7]Ge Weiwei, Cui Zhiming, Wu Jian.Robust gray level watermarking method based on wavelet.Journal of Information and Computa-tional Science, 2008, 5 (1) :391-396

[8]黄继武, YunQ.SHI, 程卫东.DCT域图像水印:嵌入对策和算法[J].电子学报, 2000, (04) :57-60

[9]俞龙江, 牛夏牧, 孙圣和.一种旋转尺度变换和平移鲁棒水印算法.电子学报, 2003, 31 (12) :2071-2073

[10]柏森, 曹长修, 柏林.基于仿射变换的数字图像置乱技术, 计算机工程与应用2002, 2 (10) :74-78

余弦变换论文篇8

图像去噪是图像预处理的一个基本内容,与图像处理相关的许多应用如分割、配准、边缘提取等,通常均需要使用有效的去噪算法进行预处理来获得更可靠的效果。因此,图像去噪吸引了大量研究者的关注,其中图像中高斯白噪声的去除一直是图像处理中的一个重要研究方向。

Buades A,Coll B和Morel J M在对许多典型的去噪算法进行比较研究的基础上,提出了非局部均值(non-local means,NLM)去噪算法[1],并将其应用到图像和视频的去噪处理中。NLM算法无论从理论上还是实验上均优于其他经典的去噪方法,如双边滤波[2]、各向异性扩散方程算法[3]和小波的方法[4]。NLM算法是利用图像中的冗余信息,结构相似的像素上叠加的噪声是随机的,所以通过加权平均就可以有效地去除噪声,同时也可以消除传统邻域滤波算法中出现的伪影;但其自身也存在一些不足。NLM算法是利用图像块来表示像素点的特征,并通过图像块之间的相似度来度量像素点之间的相似度;图像块之间的相似度可根据块内灰度值向量空间之间的高斯加权欧氏距离来衡量,然而噪声的存在、特别是当噪声水平较高时,基于块内灰度值向量空间的高斯加权欧氏距离将不能很好地反映原始图像块之间的相似度,因而NLM算法去噪后的图像仍残留了大量的噪声,特别是边缘部分。此外,在NLM 算法去噪时,以参考像素点为中心的图像块要与以图像中所有像素点为中心的图像块或者局部区域中所有像素点为中心的图像块进行比较,计算量非常大。因此,有效改进NLM算法的去噪效果和加快计算速度是对该算法研究的两个重要方面。

为了得到更精确的高斯加权欧氏距离去除图像残留噪声,本文提出基于离散余弦变换(discrete cosine transform,DCT)的非局部均值滤波算法。对测试图像的实验结果表明,相对于NLM算法,该算法能够更为有效地去除噪声,具有更高的峰值信噪比(peak signal to noise ratio,PSNR),去噪图像内容更加清晰。

1 非局部均值去噪算法

设噪声图像为z=x+n,x为未受高斯白噪声污染的原始图像,n为高斯白噪声。对于噪声图像中的任何一个像素,非局部均值利用整幅图像中所有像素值的加权平均来得到该点的估计值,即:

$Ν L [z] (i) = \sum_{j \in R_{i}} ω (i, j) z (j) (1)$

式(1)中,权值ω(i,j)依赖于像素i与j之间的相似度,并满足0≤ω((i,j)≤1且 $\sum_{j} ω (i, j) = 1$ 。像素i和j之间的相似度由灰度值矩阵Ni与Nj之间的相似度决定,其中Ni表示以像素i为中心的大小为M×M的方形邻域,虽然理论上参与加权的像素是图像中所有的像素,但为了提高计算效率,往往限定为局部区域的像素。各邻域灰度矩阵之间的权值ω(i,j)通过高斯加权欧式距离来度量,即:

$ω ((i, j) = \frac{1}{C} \exp (- \frac{∥ z (Ν_{i}) - z (Ν_{j}) ∥_{2, α}^{2}}{h^{2}}) (2)$

$C_{i} = \sum_{j} \exp (- \frac{∥ z (Ν_{i}) - z (Ν_{j}) ∥_{2, α}^{2}}{h^{2}}) (3)$

其中,Ci是归一化因子,‖·‖2,α是高斯加权的欧氏距离函数,α是高斯核的标准差,h控制着指数函数的衰减速度,决定滤波的程度。

2 离散余弦变换

DCT是一种正交变换,其变换核为实数余弦函数。对一幅图像进行离散余弦变换后,有关图像的许多重要可视信息都集中在DCT变换的小部分低频系数中。因此,其经常在信号处理和图像处理中使用,用于图像压缩、数字水印和信号检测等。

假设给定大小为N×N的二维信号f,其DCT定义为:

$\begin{array}{l} F (u, v) = \frac{2}{Ν} c (u) c (v) \sum_{i = 0}^{Ν - 1} \sum_{j = 0}^{Ν - 1} f (i, j) \times \\ \cos [\frac{(2 i + 1) u π}{2 Ν}] \cos [\frac{(2 j + 1) v π}{2 Ν}] (4) \end{array}$

反离散余弦变换IDCT定义为:

$f (i, j) = \sum_{u = 0}^{Ν - 1} \sum_{v = 0}^{Ν - 1} c (u) c (v) F (u, v) \cos [\frac{(2 i + 1) u π}{2 Ν}] \times$

cos $\frac{(2 j + 1) v π}{2 Ν}] (5)$

式(5)中

正是由于离散余弦变换具有很强的“能量集中”特性,可以由通过少量低频DCT系数进行重构得到的重构图像代替噪声图像计算图像块之间的相似度权重值。如图1所示,(a)为加入10%高斯白噪声的噪声图像,(b)为由28%的低频DCT系数重构的重构图像。由图1可知,通过少量低频DCT系数进行重构得到的重构图像能够保护图像的主要内容,并且能够滤除部分噪声。

3 基于离散余弦变换的非局部均值算法

对大小为N×N的二维噪声图像f,其基于散余弦变换的非局部均值算法的具体流程如下:

(1)DCT变换:对噪声图像f进行DCT变换,F=DCT(f),F为经DCT变换后的频域信息。

(2)低频系数:定义大小N×N、值为0的矩阵F1,从F中通过Zigzag扫描选取28%低频DCT系数,赋给F1。

(3)IDCT变换:对低频系数矩阵F1进行IDCT变换得到重构图像,f1=IDCT(F1),f1为经IDCT变换后得到的重构图像。

(4)NLM算法:通过f1计算图像块之间的相似度权值ω(i,j),将NLM算法用于噪声图像f进行去噪处理,f2=NLM(f),f2为最终的滤波结果图像。

4 实验结果与分析

为了验证算法的有效性和可行性,现在Matlab7.0环境下以大小为128×128的Lena、Peppers图像作为测试图像对本文算法进行仿真实验,为了使不同算法具有可比性,根据文献[5,6,7,8,9,10]的大量研究和测试,搜索窗口范围为11×11,像素邻域大小为7×7,滤波参数h=12σ( σ为所加噪声的标准差)。

本文采用峰值信噪比PSNR作为评价的客观准则对不同算法进行比较,峰值信噪比定义为:

PSNR=10lg(2552/MSE) (6)

式(6)中,MSE为均方差。图2所示为被标准差分别为25和50的高斯噪声污染的Lena、Peppers图像,图3所示为不同算法对被标准差为25的高斯噪声污染的图像的去噪效果,图4所示为不同算法对被标准差为50的高斯噪声污染的图像的去噪效果。从整体上来看,本文算法去噪图像的主观视觉效果好于NLM算法和文献[5]的算法,有更少的模糊现象,保留了更多的边缘与细节信息。

表1给出了采用NLM算法、文献[5]算法及本文算法对被标准差为5、10、15、20、25、30、40、50的高斯白噪声污染的图像去噪后的PSNR。当噪声的标准差σ=5时,本文算法去噪图像的PSNR高于NLM算法,但略低于文献[5]算法;当噪声的标准差σ>5时,本文算法去噪图像的PSNR均不同程度的超过文献[5]算法及NLM算法。

5 结论

在分析传统滤波算法和一些改进算法的基础上,提出了一种基于离散余弦变换的非局部均值滤波算法。首先,利用DCT的低频系数重构图像,以达到滤除部分噪声的同时保护图像的主要内容。其次,利用重构图像较准确块计算图像块之间的欧氏距离,将NLM去噪算法用于噪声图像。仿真结果表明,较NLM算法,本文算法去噪后的图像视觉效果得到了较好的改善,并能够保留大量的细节信息;当噪声标准差σ大于5时,本文算法去噪效果提高更加明显。

摘要：要非局部均值(non-local means,NLM)去噪算法已成为较有效去除图像噪声的算法之一。然而,当噪声水平较高时,NLM不能准确地计算图像块之间的相似度权重值,影响图像的去噪效果。针对上述问题,结合离散余弦变换(discrete cosinetransform,DCT)提出了基于DCT的非局部均值滤波算法。首先,利用DCT的低频系数重构图像,以达到滤除部分噪声的同时保护图像的主要内容。其次,利用重构图像较准确地计算图像块之间的相似度权重值,将NLM去噪算法用于噪声图像。实验结果表明,该算法能够得到较高的峰值信噪比(peak signal to noise ratio,PSNR)和更好的视觉效果。

关键词：图像去噪,非局部均值(NLM),离散余弦变换(DCT)

参考文献

[1]Buades A,Coil B,Morel J M.A review of image denoising algo-rithms,with a new one.Multiscale Modeling and Simulation,2005;4(2):490-530

[2]蔡超,丁明跃,周成平,等.小波域中的双边滤波.电子学报,2004;32(1):128-131

[3]Perona P,Malik J.Scale-space and edge detection using anisotropicdiffusion.IEEE Transactions on Pattern Analysis and Machine Intelli-gence,1990;12(7):629-639

[4]Coifman R R,Donoho D L.Translation-invariant de-noising.Proceed-ings of Wavelets and Statistics Springer Lecture Notes in Statistics,New York:Springer,1995;103:125-150

[5]胡金蓉,蒲亦非,张意.DCT子空间的非局部均值去噪算法.计算机辅助设计与图形学学报,2012;24(1):89-96

[6]张权,罗立民,桂志国,等.一种基于优化参数的非局部均值滤波算法.计算机应用与软件,2012;29(3):78-138

[7]孙伟峰,彭玉华.一种改进的非局部平均去噪算法.电子学报,2010;38(4):923-928

[8]Brox T,Cremers D.Iterated nonlocal means for texture restoration.In:Proc International Conference on Scale Space and Variational Methodsin Computer Vision.F Sgallari,A Murli,N Paragios,et a1.New York:Springer,2007;4485:13-24

[9]Buades A,Con B,More1J M.Nonlocal image and movie denoising.International Journal of Computer Vi～on,2008;76(2):123-139

【余弦变换论文】推荐阅读：

分数阶余弦变换08-22

基于块的离散余弦变换08-03

余弦效率08-15

余弦定理证明07-06

余弦滤波器09-06

正余弦编码器06-07