小波域增强(精选7篇)
小波域增强 篇1
目前,指纹增强方法采用Gabor滤波方法,Lin Hong等人[1]提出了一种基于Gabor滤波指纹增强算法,该方法同时考虑了指纹纹线的频率和方向,取得了比较好的效果。Lin Hong等人[2,3] 又将二维Gabor滤波分解为二次一维滤波,降低了计算量。Paul A M等人[4,5]使用结合小波变换和Gabor滤波的指纹增强算法,改进了指纹脊线结构的清晰程度和连续程度。
Gabor滤波器具有方向选择和频率选择的特性,采用Gabor滤波器不但能够去掉噪声,而且能把指纹的脊和谷的结构不失真地保留下来。但是二维Gabor滤波方法计算量大、运算复杂度高,直接使用很难满足实际工程的需要。为此利用二维卷积可分解为两次一维卷积的性质[3]对二维Gabor滤波进行分解,从而达到计算量下降的目的。基于Gabor函数的指纹图像增强,依赖于纹线方向的准确估计。指纹图像在局部区域内几乎所有像素点的方向是一致的,同时在小波域里仅对其低频系数图做纹线方向估计,因在小波分解后小波低频系数的分布与原指纹图像的像素分布非常相似。由此,提出了一种基于小波域的Gabor函数指纹增强算法。
1 小波变换
小波分析是一种窗口大小固定但其形状、时间窗和频率窗都可以改变的时频局部化分析方法。一幅大小为N×M像素的原始指纹图像用C
其中,h和g分别代表低通和高通滤波器。p是小波分解的级数,可以看出,在每一级小波分解中,上一级分解得到的低通分量C
小波基的选取非常重要,文中提出的算法仅考虑用低频图信息估计纹线方向。因此,需选择使高频图含有较少的信息量且具有紧致性的小波基dB7[5]。
指纹图像可被看作输入信号,用dB7小波将指纹图像进行一层小波分解得到1个低频图和3个高频图。
2 基于小波域的指纹图像增强算法
结合小波变换较强的去噪特性[4]和二维Gabor滤波分解算法处理时间较少[3]的优点,提出了一种基于Gabor滤波的小波域指纹增强算法,其流程共包括4个步骤:(1)规一化处理;(2)小波变换;(3)小波系数调整;(4)Gabor滤波和图像重构。
2.1 规一化处理
图像的规一化就是将原始指纹图像的灰度值的均值和方差调整到所期望的均值和方差。在原始灰度图像上,规格化按下式进行
式中,I(i,j)和N(i,j)分别为规格化前后点(i,j)处的指纹图像灰度值,M0和σ
2.2 小波变换
理论上,可在任意层数上对指纹图像进行小波分解。然而,太低的分辨率是不合适的。因为,指纹图像在小波分解的过程中进行了下采样,大量的下采样处理会减弱纹线的方向特性。所以,一般一层或两层小波分解是可取的,这样不仅保留了纹线的方向特性,而且提高了运算速度[4]。文中选取一层小波分解。
2.3 小波系数调整
规格化后的指纹图像经过一维小波分解后,可得到4个小波系数。纹线方向和频率都是指纹的固有结构信息,只有充分利用这些信息才能取得良好的增强效果。Gabor函数具有方向选择和频率选择的特性,采用Gabor函数不但能够去掉噪声,并能把指纹的脊线和谷线的结构不失真地保留下来。小波系数调整包括两个部分:(1)方向场和频率场估算;(2)图像分割。
2.3.1 方向场和频率场估算
方向场反映了指纹图像上纹线的方向。根据纹线方向在局部区域内基本一致的特点,先把低频子图分块,然后计算每一子块的纹线方向,最后用该方向代表对应子块内各个像素的方向。方法为:将小波分解后的低频子图分成16×16大小的互不重叠的子块。采用Sobel计算每个子块像素点(u,v)梯度值∂x(u,v)(沿水平方向)和∂y(u,v)(沿垂直方向),然后利用式(6)~式(8)估计中心在点(i,j)的子块的局部方向
其中,θ(i,j)为以像素点(i,j)为中心的子块的局部脊线方向;w为子块的边长。由于噪声、粘连、模糊以及断裂等原因,方向场中存在着方向突变块,指纹具有脊线方向变化平缓的特性,并且在一个小范围内具有相对稳定的变化趋势,采用高斯低通滤波器对指纹图像的方向场进行平滑处理,得到了相对平滑的方向场,记其为O。
由于低频系数图和高频系数图间像素点是一一对应的,由低频图估计得到的各像素的方向可作为高频图对应像素的纹线方向[5]。
2.3.2 图像分割
利用指纹图像梯度特性[3]对4个子图分别进行图像分割,方法为:将小波变换后的图像分为w×w的子块,取w=16,再利用式(9)~式(10)进行计算
其中,∂x(u,v)、∂y(u,v)分别为子块像素沿X轴和Y轴方向的梯度值;V
2.4 Gabor滤波和图像重构
偶对称的Gabor滤波器的一般形式如下
式中,。其中,θ是滤波器的方向;f0是脊线的频率;[xθ,yθ]为坐标轴[x,y]逆时针转角度θ,σx和σy分别是沿着x轴和y轴的高斯包络标准偏差。实验中,取块大小为8×8,指纹图像小波分解后各纹线间的像素点的平均个数为5,则Gabor函数的频率f0=0.2。σx和σy取值均为1.7时滤波效果理想。
利用上面设计的Gabor滤波器,对指纹图像进行滤波,即
其中,E(i,j)为滤波后的图像;N(i,j)为规格化图像;M(i,j)为区域掩码;w为Gabor滤波器的模板大小。
显然,式(12)计算量大、运算复杂度高,难以满足实际需要。为此利用二维卷积可分解为两次一维卷积的性质[3]对二维Gabor滤波进行分解,从而达到计算量下降的目的。
实现的具体步骤为:
(1)将小波变换后的4个子图分别进行计算,每个子图分成为M×M大小互不重叠的子块,以子块为中心对其进行扩展,扩展后子块大小为(M+N-1)2,其中N为一维滤波器的长度。
(2)将子块方向离散化为8个方向,分别为θ=0°,26.6°,45°,63.4°,90°,135°,153.4°,并根据子块方向和滤波器的长度确定两个一维滤波器的系数。
(3)垂直于脊线的方向对扩展子块进行一维带通滤波,并将滤波结果保存。
(4)沿脊线方向对步骤3的运算结果进行一维低通滤波,得到最终结果。
因此,低频子图的Gabor滤波,如图2所示。
指纹图像在小波分解过程中进行了下采样,低频子图为原始图像在下一尺度上的概貌,而高频子图分别体现了原始图像垂直方向、水平方向和沿对角线方向的细节信息,这些细节信息不仅包含了许多噪声,而且也具有大量的原始指纹图像信息,为了确保增强结果的准确、可靠,需对高频子图进行处理,采用同样的方法,对3个高频子图进行增强,增强沿纹线方向的细节信息,抑制其他方向的细节信息。对增强后的低频子图和3个高频子图进行小波重构,得到最终增强的指纹图像。
3 实验与结果分析
为了验证算法的实际性能,在指纹样本库上进行实验,后台数据库采用SQL Server 2000。指纹样本库中的图像,是由FPS200指纹采集仪[6]采集得到,实验图像大小为 256×300,分辨率为 500 dpi。样本库中的图像来自60根手指,每根手指采集3幅图像,共180幅指纹图像。
实验基于 Pentium 4(1.80 GHz)计算机,内存256 MB 的硬件环境,Visual C++6.0 编程语言的软件环境条件下。对180幅质量不同的指纹图像进行测试。结果表明,本算法快速有效,改进了指纹脊线结构的清晰程度和连续程度,具有较强的鲁棒性。选取两幅典型的低质量图像进行实验,实验结果,如图3所示。
图3(a)是来自干手指的指纹图像,图3(d)是来自湿手指的指纹图像,两幅指纹纹线均有明显的断裂。图3(c)中断裂区的纹线得到了有效的连接,其余部分滤波效果和图3(b)基本相同。图3(f)中粘连区的的脊线和谷线被合理地分离开了,同时也去掉了一定的噪声,其余部分滤波效果和图3(e)基本相同。
二维Gabor滤波分解算法和文中算法增强同一幅指纹图像,如图3(a)所示。平均用时结果,如表1所示。
s
文中提出的算法有两方面的优点:
(1)低频图的尺寸大小仅为原指纹图像的1/2,纹线方向的计算量会有所下降。处理过干指纹图3(a),二维 Gabor分解算法方向场时间为0.704 s, 而文中算法方向场时间为0.156 s,运算时间下降约77.8%。处理过湿指纹图3(d),二维 Gabor分解算法方向场时间为0.672 s,而本文算法方向场时间为0.172 s,运算时间下降约74.4%。同时,因为低频系数图较好地保留了原指纹图像的纹线方向和频率信息,且抑制了高频扰动对纹线方向和频率信息的影响。指纹过干或过湿的局部区域可看作是图像局部区域灰度的高频扰动。所以,在低频子图做纹线方向可有效抑制指纹过干或过湿的影响。(2)Gabor分离算法乘法运算次数明显小于二维Gabor算法的乘法次数。采用N×N的滤波器对M×M大小的图像块进行滤波,二维Gabor算法的乘法运算次数约为M2N2,而采用分离算法乘法运算次数会随角度的不同而略有不同。
4 结束语
现有的指纹增强算法是在空域里对图像进行Gabor滤波,文中提出了一个新的指纹增强算法,在小波域里对图像进行Gabor滤波,并将二维Gabor滤波分解为两次一维滤波。实验证明,该算法快速有效,并改进了指纹脊线结构的清晰程度和连续程度,但对部分低质量图像,该算法还存在不足,可考虑与别的算法结合使用。对于整个自动指纹识别系统而言,一种新的有效的指纹增强算法,可以明显提高后续指纹特征提取模块的准确性,并在最终的特征匹配模块中,快速地获得一个准确的身份验证效果。
参考文献
[1]Lin Hong,Jain AK,Pankanti S.Fingerprint Enhancement[C].Proceedings3rd IEEE Workshop on Application of Computer Vision,1996.
[2]Lin Hong,Wan Yifei,Jain A K.Fingerprint Image En-hancement:Algorithm and Performance Evaluation[J].IEEE Transactions on Pattern Analysis and Machine Intelli-gence,1998,20(8):777-789.
[3]夏振华,石玉,于盛林.基于Gabor滤波器的指纹图像增强[J].工程图学学报,2006(5):80-85.
[4]Paul A M,Lourde R M.A Study on Image Enhancement Techniques for Fingerprint Identification[C].Proceedings of the IEEE International Conference on Video and Signal Based Surveillance,2006.
[5]Wen Miaoli,Liang Yan,Pan Quan.A Gabor Filter Based Fingerprint Enhancement Algorithm in Wavelet Domain[C].Proceedings of the IEEE International Symposium on Communication and Information Technology,2005(2):1468-1471.
[6]贾珈,蔡莲红,董代洁.基于FPS200的指纹采集系统与图像增强机制[J].计算机工程,2005,31(15):148-150.
小波域增强 篇2
随着电子商务、网上贸易的发展,交易的安全性需要更加有效的保证,身份认证和识别显得越来越重要。指纹的惟一性和终身不变性,决定了通过指纹验证身份成为最合理的身份认证方法之一。自动指纹识别系统(Automated Fingerprint Identification System,AFIS)是目前性价比最高的生物特征识别系统,然而指纹的过干和过湿,导致采集到的指纹图像存在很多脊线中断和粘连。如果不对这样的指纹图像做增强处理,将会在指纹图像特征提取时得到很多伪特征点,对最终匹配的结果产生影响。因此,对指纹图像在提取特征信息之前进行有效地增强是很有必要的。
指纹图像的方向特性和频率特性是指纹图像固有的2种根本特性,目前的指纹增强算法也大都是利用指纹的这些特性来对图像进行滤波,主要有2种方法:方向滤波增强[1]和Gabor滤波增强[2]。Gabor滤波函数本身具有的方向和频率选择的特性,决定了它成为目前指纹图像增强方面研究的热点[2]。但是,基于Gabor的指纹增强主要是在空域进行的,利用原始指纹图像来估计纹线方向和频率信息,易受到图像的噪音等高频信息的影响,在指纹过干和过湿区域估计的纹线方向信息和频率信息可靠性差。温苗利等[3]提出了小波域的Gabor滤波增强算法,有效地抑制了高频扰动的影响,但是只估计了纹线方向,频率取固定值,导致最后的增强效果还不是很理想,并且通过梯度法估计纹线方向,运算的过程繁琐、耗时,不能达到实时处理的系统要求。目前估计纹线频率的方法主要是文献[4]的方法,基于方向窗计算频率,该方法复杂度较高,并且估计频率的准确度依赖于方向的准确度。本文为解决这些问题,对小波变换后的近似子图通过Radon变换估计纹线方向和频率。Radon变换是一种计算图像沿指定方向上的投影的方法,一个二维函数的投影为一个特定方向的线性积分[5]。本文算法首先对指纹图像归一化,对归一化后的图像进行小波变换,接着仅对小波变换近似子图进行Radon变换,估计纹线方向和频率,以这样得到的方向和频率为Gabor滤波器参数,分别对各个小波变换后的4个子图像进行Gabor滤波增强,最后,通过小波重构得到最后增强的结果。提高了估计Gabor滤波参数的可靠性和效率。
2指纹图像的增强算法
2.1 指纹图像的归一化处理
指纹图像归一化的目的是使得图像灰度值达到一个预先定义的平均值和方差;增强图像整体对比度。归一化处理能够有效地解决按压不均匀对采集到的指纹图像的影响。归一化采用式(1)实现[6]:
undefined
对于图像I(i,j),m,v分别为图像的灰度均值和方差;m0,v0为期望的灰度均值和方差,实验中取m0=100,v0=100见文献[6]。
2.2 小波域滤波器参数的估计
对指纹图像进行Gabor滤波增强,需要估计2个重要的参数:纹线方向和频率。在小波分解后,低频系数图很好地保留了原指纹图像的纹线方向和频率信息,且抑制了高频扰动对纹线方向和频率信息的影响。指纹过干和过湿区域可看作是图像局部区域灰度的高频扰动,因而在小波域仅对其低频系数图做纹线方向和频率估计将削弱指纹过干和过湿区域对参数估计结果的影响。同时要估计参数的图像大小减小到原图的一半,减少了运算的时间。本文提出的算法仅考虑低频图的信息来估计参数,小波基选择db1,在低频系数中保留较多的纹线信息。将指纹图像进行小波分解得到1个低频图和3个高频图,如图1(b)所示。
本文对小波变换近似子图分块,通过Radon变换计算纹线方向和频率。图像的Radon变换是将原始图像变换为它在各个方向上的投影表示。图像f(x,y)在角度θ上的投影定义为:
undefined
其中:
undefined
Radon变换可以形象地用图2所示:
基于指纹图像在一定分块内的方向和频率的一致性,对图像分块做Radon变换。得到的结果R是一个以角度θ为列,以x′为行的矩阵,矩阵里的元素为图像块的投影值。
指纹纹线具有局部方向性,所以图像块在垂直于纹线方向上的投影值的最大值也是180个方向上各个投影值的最大值。这样,可以认为:Radon域最大值所在的列j(投影角度(1°~180°)),将对应于脊线方向垂直的方向。这样得到的脊线方向精确到1°,并且运算的速度很快,为后面的滤波增强做好准备。脊线的方向α与j之间的关系如下:
undefined
图3所示的16×16的图像块(a)是从归一化后的指纹图像上随机选取的一块,对它进行Radon变换,得到的Radon域最大值所在列的值域分布如图3(b)所示。Radon域的最大值所在的列为第45列。应用式(4)估计纹线方向,知纹线的方向为135°。
指纹纹线具有局部频率性,所以图像块在每个方向上的投影值与行数x′成近似正弦曲线的关系。与脊线方向垂直的方向上的投影值与行数的这种正弦曲线关系就可以用来估计脊线或者谷线间距,从而估计纹线频率。图3(b)就是图3(a)所示16×16图像块在垂直于脊线方向上的投影值与行数的类似于正弦曲线关系的波形图。根据图3(b)中波峰间距或波谷间距,就可以估计纹线频率。对比图3所示的(a),(b)两个图,我们可以看到指纹图像上的脊线反映在波形上是波谷,谷线反映在波形上是波峰,则可以认为相邻波峰与波峰或者相邻波谷与波谷之间的距离就是纹线交替的周期,记为d,那么该图像块的纹线频率为:
undefined
这样,估计纹线频率的问题就转化成计算如图3(b)所示波峰与波峰或者波谷与波谷之间距离d的问题了。如果把分块的大小选得合适,波形图大致上可以分为以下几种情况:
(1) 只有1个波峰和1个波谷;
(2) 2个波峰,1个波谷;
(3) 2个波谷,1个波峰;
(4) 2个波峰,2个波谷;
(5) 2个波峰,3个波谷;
(6) 3个波峰,2个波谷;
(7) 只有1个波峰。
需要注意的是,这里的波峰应当满足Radon值为正数的条件,这样就可以保证它对应于指纹图像上的谷线;同样,波谷也应当满足Radon值为负数的条件,这样就可以保证它对应于图像上的脊线。
这里对这样七种波形分别计算周期d。对于第一种波形,峰顶与谷底之间的距离是周期d的一半;对于第二种波形,波峰与波峰之间的距离看作周期d;对于第三种波形,波谷与波谷之间的距离看作周期d;对于第四种波形,取波峰间距和波谷间距的平均值为周期d;对于第五种波形,它对应的图像块包含了2条完整的谷线,所以取波峰间距为周期d要比取波谷间距为周期d更加合理;对于第六种波形,同样的道理,对应的图像块包含2条完整的脊线,所以取波谷间距为周期d要比取波峰间距为周期d更加合理;对于最后一种情况的波形,这种波形对应的图像块为背景块,可以不对其做Gabor滤波处理,这样就在估计纹线频率的过程中潜在地对指纹图像加了一个掩膜,对归一化后的指纹图像的背景部分不做处理,更进一步加快了滤波处理的速度。
例如,对于图3(b)所示的波形,从图像块(a)来看,该块包含2个完整的脊线,所以波谷间距能够更准确地反映纹线周期。
需要注意的是,如果分块大小取得过大,将产生更多的波峰波谷,这使判断变得更加复杂,消耗了更多时间,却不一定能得到更加准确的周期d;如果分块的大小取得过小,在块内可能不具有局部频率性,将无法准确的得到纹线频率。一般地,分块大小取为16×16。
2.3 指纹图像的Gabor滤波增强
Gabor滤波器具有良好的频率选择性和方向选择性,与指纹图像的特性相符合;并且,根据Gabor函数在x方向带通,在y方向低通的特性,对Gabor滤波器做一定的旋转就可以很好地去掉脊线粘连和连接中断的脊线。
偶对称Gabor函数的表达式如下:
undefined
其中:
undefined
α为Gabor滤波器的方向,实际中取为估计得到的指纹图像块方向;(x,y)为像素点的坐标;f为脊线频率,δundefined,δundefined分别是沿着x和y轴的高斯包络的空间常量,通过实验,取δundefined,δundefined为4。
滤波增强后的指纹图像由式(4)得到:
undefined
在本文算法中,滤波器窗口大小w=10。
式(8)相当于将Gabor滤波函数(如式(6)所示)和指纹的小波域近似子图像二维卷积,由于各高频子图含有一些细节分量,同样要对其滤波处理,根据它们和近似子图像在像素位置上的对应关系,Gabor滤波器参数与估计的近似子图像的方向和频率相同。对滤波之后的各个子图像进行小波重构,得到最后的增强结果。
最后,对增强后的指纹图像采用分块阈值的方法进行二值化处理[7],得到最后的结果。
3实验结果
为了验证本文提出的指纹滤波增强算法,这里对FVC2000指纹数据库中一些低质量指纹图进行增强,结果如图4所示,其中,图(a1~a4)是原始指纹图像;图(b1~b4)是采用文献[3]算法增强的结果,文献[3]中方法是对图像分块,根据梯度法求纹线方向,基于方向窗求频率,最后进行Gabor滤波增强;图(c1~c4)是采用本文算法增强的结果。实验中取不为零的频率的平均值为指纹区域的频率。
可以看到,与文献[3]的方法相比,本文算法能够较好地增强指纹图像的对比度,连接指纹过干造成的脊线的断裂,也在一定程度上削弱了指纹过湿造成的图像模糊不清,有效地抑制了高频扰动对指纹图像的影响。这里在Pentium(R) 4,256 MB内存,Windons XP操作系统环境下,对经过最近邻插值法扩展后的512×512的指纹图像做增强处理,两种算法的运行时间如表1所示,可见,本文算法运算耗时较少。
4结语
利用本文的算法,用Matlab对FVC2000指纹数据库中部分低质量指纹图像的处理。通过实验验证,本文算法通过Radon变换能快速准确地得到指纹纹线方向和频率。只对小波域的近似子图求方向和频率,能有效抑制高频扰动对方向和频率信息的影响,减少了运算量。该算法能够更好地适应自动指纹识别系统对低质量指纹图像增强的要求。
摘要:面对采集的指纹图像质量较差的问题,提出一种在小波域对指纹图像滤波增强算法。该算法在小波域进行Ga-bor滤波增强,通过Radon变换后的投影估计Gabor滤波的方向和频率,对滤波增强后的子图进行小波重构得到最后的结果,有效地抑制高频扰动对指纹图像质量的影响,提高运算速度和准确性。通过对FVC2000指纹库中的部分低质量指纹图像进行增强,表明该算法对指纹图像的增强效果明显,并且处理速度较快。
关键词:指纹增强,小波变换,Radon变换,Gabor滤波
参考文献
[1]Sherlock D,Momro D M,Millard K.Fingerprint Enhance-ment by Directional Fourier Filter[J].IEEE Proceedings ofVision Image and Signal Processing,1994,141(2):87-94.
[2]Liu Yuanning,Li Zhihui.Research on Fingerprint Enhancementand Classification Algorithm[C].CIT′04.2004:199-204.
[3]温苗利,梁彦,潘泉,等.基于Gabor函数的小波域指纹图像增强算法[J].计算机应用,2006,26(3):589-594.
[4]Lin Hong,Wan Yifei,Anil Jain.Fingerprint Image Enhance-ment:Algorithm and Performance Evaluation[J].IEEETransactions on Pattern Analysis and Machine Intelligence,1998,20(8):777-789.
[5]李军宏,潘泉,陈玉春.基于radon变换的纹理图像多尺度不变量分析算法[J].中国图像图形学报,2005,10(9):1 117-1 123.
[6]夏振华,石玉,于盛林.基于Gabor滤波器的指纹图像增强[J].工程图学学报,2006(5):80-85.
小波域增强 篇3
关键词:小波变换,红外人脸识别,小波基
0 引言
红外人脸识别技术可实现全天候人脸识别,近几年来逐渐成为研究的热点[1,2]。伍世虔等[3]提出根据Stefan-Boltzmann定律将人脸温谱图转为辐射能量图,再将能量数据用于人脸识别,解决了由红外设备得到的人脸温谱图会随着环境、心理状况及生理状况的变化而改变,导致温谱图的变化是非线性的问题。高西奇等[4]提出基于小波变换的主元分析人脸图象识别,采用小波变换对人脸图像进行预处理,降低了图像训练的运算复杂度。但是小波基的时频特征各不相同,在应用时产生的结果也不一样。因此在小波变换的应用中存在一个小波基的选取问题。
本文对小波域红外能量图人脸识别问题中的小波基的选取进行了一些研究,挑选了几种常用的小波基分别进行了实验,并对实验结果进行了比较和总结。
1 选择小波基时考虑的几个因素
基于小波域的红外能量图人脸识别方法对小波基的选择一般较为看重以下几方面的性质:
(1)正交性
正交性描述了数据的小波表示的冗余程度,在多分辨率分析下,酉变换在不同子空间上的投影是意义的最佳逼近。严格的规范正交特性有利于小波分解系数的精确重构。用正交小波基由多尺度分解得到的各子带数据分别落在相互正交的子空间中,使各子带数据相关性减小。但能准确重建的正交的线性相位有限冲击响应滤波器组是不存在的,即除Harr系小波外,没有任何紧支集正交小波具有对称的特性,因此一般放宽条件用双正交滤波器。
用正交小波基由多尺度分解得到的各子带系数分别落在相互正交的子空间中,能使各子带相关性减小。
(2)紧支性与衰减性
如果小波φ(t)有紧支集,则称它是紧支的。如果当t→∞时,它快速衰减或具有指数规律衰减,则称小波φ(t)是急衰或急降的。紧支性与衰减性是小波的重要性质,紧支宽度越窄或衰减越快小波的局部化特性越好,但是一个函数不可能在时域和频域都是紧支。一般要求小波基是紧支撑集且在时域上具有紧支性。紧支小波基的重要性在于它在数字信号的离散小波分解过程中可以提供系数有限的、更实际的FIR滤波器,而非紧支撑小波在实际运算时必须截短。Daubechies小波是目前最常用的紧支正交小波之一[5]。
(3)对称性
对称或反对称的尺度函数和小波函数是非常重要的,因为可构造紧支的正则小波基,而且具有线性相位。Daubechies己经证明,除了Harr小波基,不存在对称的紧支正交小波基。而对于双正交小波基,可以合成具有对称或反对称的紧支撑小波基。
对称滤波器组具有两个优点:一方面人类的视觉系统对边缘附近对称的量化误差较非对称误差更不敏感;另一方面对称滤波器组具有线性相位,在对图像进行处理时,线性相位是很重要的,对图像边缘做对称边界延拓时,重构图像边缘部分失真较小,有利于获得较高质量的重构图像。
(4)正则性
正则性表现为小波基的可微性。设在点的Lipschitz指标为,正则度定义为上确界。连续可微的小波基对于小波变换中有效地发现信号的奇异点是必要的,对于大部分正交小波基正则性越高就意味着更高的消失矩。另一方正则性刻画了小波的光滑度,正则性与支撑集大小有关,支撑越大,正则性越好。小波基的正则性对最小化量化误差是很重要的,因此,正则性越大的小波基越好,小波基量化编码的性能更优。
(5)消失矩阶数
消失矩的大小决定了用小波逼近光滑函数的收敛率。当图像光滑时,越大的消失矩,将导致越小的小波系数。因此用消失矩越大的小波基进行分解后,图像的能量就越集中,压缩的空间就越大。
下面给出常用小波基的特性比较表如表一所示。
2 实验结果与分析
实验采用FLIR公司生产的Thermo Vision A40红外相机,得到的数据库中包含40个人,每人20张照片,共800张照片,拍摄距离在1米左右,拍摄时温度控制在25.6~26.3摄氏度左右。把图像数据库分成训练集和测试集两个集合,每个集合都包括了20个人的10张不同的照片,测试样本数为200。
实验结果表明,选取的几种小波基中,Haar小波基和Symlets小波基在红外人脸识别中能得到较高的结果,最高识别率均能达到97%,其中Haar小波所需的时间最短,为281.328000秒。这是因为,用正交小波基由两级小波分解后得到的各子带系数分别落在相互正交的子空间中,能使各子带相关性减小,Haar小波基和Symlets小波基的正交性使分解后的图像相关性更低,在达到压缩图像的同时减少识别产生的误差。又由于人类视觉系统对边缘附近对称的量化误差较非对称误差更不敏感,因此,在零延拓、周期延拓和对称延拓中,对称延拓更符合人眼视觉特性,量化误差更不敏感。
3 结束语
在小波域红外能量图人脸识别问题中,并不存在对任何图像都能实现最佳效果的“最优”小波,只能根据具体的应用要求来合理选择小波基。一般来说,小波基的对称性是首先要考虑的因素,具有对称性的双正交小波一般具有较好的压缩性能;具有较高正则性的小波对于光滑图像有着好的压缩效果。如何根据图像各自的特点快速准确地选择一个最优的小波基是下一步研究的重点。
参考文献
[1]Kong Seong G,Heo J,Abidi Besma R,et al.Recent advances in visual and infrared face recogni-tion—a Review[J].Computer Vision and Image Under-standing,2005,97(1):103-135.
[2]Prokoski F J,Riedel B,Coffin J S.Identifica-tion of individuals by means of facial thermography[A].In:Proceedings of IEEE International Camahan Conference on Security Technology,Crime Counter-measures[C],Atlanta GA,USA,1992:120-125.
[3]伍世虔,韦礼珍,方志军等.基于辐射能量的红外人脸识别[J].中国图象图形学报,2007,12(10):1845-4848.
[4]高西奇,周洪祥,何振亚.基于小波变换的主元分析人脸图象[J].东南大学学报,1996,26(2):137-141.
小波域增强 篇4
随着计算机和网络的飞速发展,数字媒体正在逐步取代传统媒体。因此数字产品比以前更容易被修改、复制和传播。有些作者并不希望通过网络发布自己的作品,而大量非法盗版数字产品的出现严重侵害了创作者的知识产权。这使得数字产品的版权保护不只是法律问题更是一个技术性难题[1]。音频水印技术的基本思想就是在音频信息中的“冗余成分”嵌入秘密信息来达到隐藏数据的目的。该技术将秘密信息设置成水印嵌入到原始音频中,在音频产品正常使用时不易被察觉,但很容易加以区别,这样既达到保护版权的作用又能保证数字产品的完整性。这项技术在数字产品的版权保护中已经得到了广泛的应用[2]。
1 混沌加密算法
Logistic映射的定义为Xk+1=μXk(1-Xk),其中0燮μ燮4,称为分支参数,Xk+1∈(0,1)。混沌动力系统的研究工作指出,当3.5699456燮μ燮4时,Logistic映射工作于混沌态。Logistic是一类简单且被广泛研究的动力系统,具有混沌系统所共有的性质,通过不同初值迭代而产生的序列是不相关、不收敛、非周期的序列,即对初值非常的敏感,且具有高斯白噪声的统计特性。
2 音频水印的嵌入
将原始音频信号进行等步长无交叠分段,对混沌序列选择的音频数据段进行L级小波分解。在第L级小波细节分量上嵌入水印,选择每个音频数据段的细节分量dL(t)中绝对值最大的系数M作为水印的嵌入位置。选定适当的μ1值(μ1≠μ)及初始值k2(k2≠k1)生成一个新的混沌序列,并在系数M中选择其中较大的数选作N(N<M),这N个点作为水印的嵌入位置。使用抖动量化调制技术实现水印的嵌入在提取水印的时候会有一定的容错,只有保证系数多元化在(-△/2,△/2)之间水印才能被正确提取。在音频数据段进行L级小波分解后,低频系数为dL(t),我们可以推导出商pLt,和余数QLt
选择部分音频帧作为隐藏帧,每帧隐藏一个比特位。我们可以把dL(t)系数做如下修改:
骔.」表示不超过这个数的最大整数,mod表示取模运算,sgn(.)表示信号函数,△>0表示量化步长。修改后的细节分量dL(t)′为(-△-1,△+1),量化步长△要保证音频水印的安全性和鲁棒性。
修改系数后进行原始音频信号的重构,即进行L级离散小波逆变换。重复上面提到的过程,便可以在数字音频中嵌入水印。
3 音频水印的提取
提取水印的过程是嵌入水印的逆过程。该水印算法在提取水印时不需要原始音频信号,即实现盲提取。
水印的提取过程如下:
(1)对待检测的数字音频水印信号做等步长无交叠分段,分段数与原始音频分段段数相同,对每一段音频都进行L级小波分解,提取出L级细节分量dL(t)′。
(2)通过密钥K(μ1,k2)生成混沌序列,以确定水印嵌入位置。
(3)用下面的公式提取位数据:C(j)=骔襔dL(t)′襔/△」mod2(5)
(4)通过密钥K(μ,k1)生成的混沌序列对加密水印进行解密,得到嵌入音频的原始水印信号。
4 仿真实验
实验条件:音频水印长1s,采样率16kHz;原始音频长25s,采样率44.1kHz;使用μ=3.567,初始值k1=0.2生成的混沌序列对音频水印进行混沌加密,使用db4小波对隐藏帧进行三级小波分解,选择第三级细节分量作为隐藏区域。利用μ=3.587,初始值k2=0.3的混沌系统选择部分音频帧作为隐藏帧。实验中,选择步长△=30。图1为原始音频信号的波形,图2为提取水印后的音频信号波形。
将实验结果与文献6进行了比较,可以得出水印嵌入小波域比嵌入倒频域的鲁棒性好,能更有效地抵抗各种攻击,音频信号嵌入水印后信噪比比文献6嵌入算法的信噪比高出5%左右。
5 结论
基于混沌理论,本文提出了一种基于混沌加密和混沌序列实现对隐藏位置保密的盲音频信息隐藏算法。水印算法实验和攻击测试结果表明,该算法具有良好的安全性和鲁棒性。
参考文献
[1]雷德明,严新平,吴智铭.多目标混沌进化算法[J].电子学报,2006(6):1142-1145.
小波域增强 篇5
近红外光谱分析技术作为一种快速、简便、非破坏性的定性和定量分析方法, 已广泛应用于食品、石油、化工、农业、医药等领域。近红外光谱除样品自身信息外, 还包含了噪声和无关信息, 如电噪声、样品背景和杂散光等。为建立稳定性好、预测精度高的模型, 消除光谱数据干扰信息和噪声变得十分重要[1]。传统的光谱预处理方法存在一定的局限性, 比如:微分处理会引人光谱噪声, 需要与降噪方法配合使用。小波变换能够将信号分解为不同频率、不同尺度的部分[2], 能够聚焦到信号的任意部分, 逐步被用于光谱降噪。
目前小波降噪在近红外光谱分析领域主要有三种类型方法[3]:第一种是Mallt提出的模极大值重构滤波;第二种是Xu提出的空域内系数相关滤波;第三种是Donoho提出的小波域阈值滤波。国内外学者围绕如何提高小波降噪性能, 提高近红外光谱模型预测精度展开了研究。彭丹等[4]用小波系数与浓度阵正交后滤除噪声, 建立了更具有抗干扰能力的牛奶成分近红外检测模型。张广军等[5]利用小波变换, 可将光谱信号分解为多尺度的近似成分与细节成分, 根据无用信息变量消除判据判定背景和噪声并加以去除。吴桂芳等[6]对比分析了三种小波阈值降噪模型 (Penalty阈值降噪模型、Brige-Massart阈值降噪模型、缺省阈值降噪模型) 的降噪性能。李正刚等[7]提出了一种利用小波域Firm阈值滤波去除随机噪声的方法, 提高了微型光谱仪的光谱采集精度。
文献[8]指出模极大值重构滤波方法计算量大速度慢, 而空域相关滤波对相关系数的定义要求严格, 容易出现偏差。文献[9]指出传统阈值估计方法存在抑制噪声污染与保留信号细节间的矛盾, 难以实现信号的有效消噪。本文针对上述问题, 提出了一种基于噪声方差估计的近红外光谱降噪方法。该方法对近红外光谱实施小波变换, 用两状态高斯混合模型 (GMM) 对高频系数建模, 混合模型的各项参数通过EM (Expectation Maximum) 算法迭代估算得到, 选取混合模型中最小标准方差作为近红外光谱噪声的标准方差用于小波降噪, 有效地缓解了抑制噪声污染与保留信号细节的矛盾。
1 模型与算法
1.1 小波细节系数的高斯混合模型
近红外光谱在采样过程中受广义高斯噪声的污染, 可证明带噪小波系数服从高斯混合分布[10]。对近红外光谱进行一维小波变换, 经一次一层小波变换后得到两个子带系统, 分别表示低通和高通滤波, 分别用逼近系数和细节系数表示。文献[11]验证了光谱随机噪声主要分布在高频细节部分, 可推知一维小波变换的细节系数服从高斯混合分布。
设di为光谱一维小波变换后的细节系数, 用式 (1) 所示两状态高斯混合模型对其概率密度函数建模:
其中:ka为各个混合成分分布的概率, 即单高斯分布的权重, θk是第k个成分分布的参数, θ={θ1, θ2, a1, a2}是所有参数的集合, 且须满足式 (2) 关系。
因所有成分分布都服从高斯分布, 所对应的高斯混合模型参数θk实际上由两个参数所决定:均值μk和方差σk。求解θ参数可用最大似然法 (MLE) 估计, 但由于数据的不完整性, 求解较为复杂, 一般采用EM算法。
1.2 利用EM算法进行高斯混合模型参数估计
EM算法是由DEMPSTER等[12]提出, 可根据已知的小波细节系数, 估计出模型的各个单高斯分布均值及标准方差等参数, 使GMM能最佳地表示细节系数的分布概率, 具有较可靠的全局收敛、较少的迭代次数、较少的存储量和易于编程实现等特点。
EM算法是一种迭代算法, 分为E步和M步。E步计算对数似然函数的期望, M步选择使期望最大的参数, 然后将选择的参数代入E步, 反复迭代, 寻找最优值。
E步骤, 首先初始化参数μk、σk和ka, 计算每个细节系数dn属于第k个成分的后验概率, 标准化后为
式p (d, θk) =2π-1/2σk-1∫exp (-d2/2σk2) dd服从一维高斯随机分布。
M步骤, 最大化式 (3) , 得到新的参数μk′、σk′和ak′, 具体计算过程如下:
利用式 (4) ~ (6) , 迭代收敛后, 可以得到细节系数dn属于第k个成分的后验概率, 完成高斯混合模型参数θk的估算。
1.3 噪声方差估计及消除
假设光谱受到零均值高斯白噪声污染, 经过小波分解后它的小波系数仍然服从高斯分布, 标准方差不变, 因此小波细节系数可写成d=x+n。x满足混合高斯分布px (x, θ) , n满足高斯分布N (, 0σn) , σn为噪声的标准方差。细节系数的标准方差可表示为
其中:σk′2=σk2+σn2。对于零均值高斯白噪声, σn2就是噪声的平均功率。由于σk′2≥σn2, 用σ=min (σk′) (k=, 12) 对噪声标准方差的准确估计。可对小波变换后的细节系数, 进行式 (9) 所示处理, 并将处理后的小波细节系数用于光谱重建, 完成降噪。
该方法用小波变换进行了光谱细节特征的提取, 并用两状态高斯混合模型估计了噪声的强度, 在保护细节特征同时更有利于对噪声方差的精确估计, 在消除噪声的同时最大限度地保留了光谱的细节特征。
2 实验结果及分析
实验采集了191个黄酒近红外透射光谱样本, 用小波域高斯混合模型噪声方差估计降噪法对光谱进行了处理, 建立了黄酒酒精度偏最小二乘定量预测模型。黄酒酒精度理化值采用蒸馏法测定, 样品酒精度范围为11.7%vol到17.82%vol。同时, 用Penalty阈值、Brige-Massart阈值和缺省阈值三种小波软阈值降噪方法对黄酒光谱进行处理, 根据田高友等[11]研究结论, 母小波选取Daubechies, 该小波分析精度高, 有利于信息的提取。对比分析了这三种传统方法和本文提出方法的建模效果。图1至图5显示了黄酒近红外透射光谱经上文提及的不同方法降噪处理后结果。
建模后采用“留一”交互验证法对模型进行评价, 模型的评价指标为交叉检验相关系数 (R2) 及交叉检验标准差 (RMSECV) , 见式 (10) 。其中, yitrue为样本测量真值, yipred为样本预测值, yimean为样本组真值的平均值, M为样本数。
模型的相关系数越高, 检验标准差越小, 模型的预测精度越高。表1显示了光谱经不同方法降噪处理后的黄酒酒精度快速预测偏最小二乘建模结果。
对比四种方法的建模结果, 可知本文提出小波域高斯混合模型噪声方差估计消噪法的R2和RMSECV分别为0.950和0.381 00, 效果最优。实验表明, 该方法能够对近红外光谱噪声的标准方差进行较为准确的估计, 与常用的方法比较, 它根据不同的光谱噪声来调整降噪滤波的阈值, 能在尽可能滤除噪声的同时保留光谱细节信息且有算法简单易于实现等优点。
3 结论
本文提出的利用高斯混合模型在小波域对噪声信号方差估计后降噪的方法, 充分挖掘高频子带系数的相近统计特性, 进行了更精细的噪声方差估计。试验证明, 光谱经该降噪方法后的建模效果, 优于现有其他阈值降噪模型, 为建立稳健和可靠的近红外定量检测模型提供了可靠的处理方法。
参考文献
[1]CHEN Da, SHAO Xue-guang, HU Bin, et al.A Background noise elimination method for quantitative calibration of nearinfrared spectra[J].Analytical Chemical Acta (S0378-5173) , 2004, 511 (1) :37-45.
[2]DONOHO D L, JOHNSTONE I M.Ideal spatial adaptation via wavelet shrinkage[J].Biometika (S0006-3444) , 1994, 81 (3) :425-455.
[3]田玉静, 左红伟.小波消噪阈值算法优化[J].声学技术, 2009, 28 (4) :503-506.TIAN Yu-jing, ZUO Hong-wei.Optimization threshold algorithm of wavelet de-noising[J].Technical Acoustics, 2009, 28 (4) :503-506.
[4]彭丹, 徐可欣, 李晨曦.小波多尺度正交校正在近红外牛奶成分测量中的应用[J].光谱学与光谱分析, 2008, 28 (4) :825-828.PENG Dan, XU Ke-xin, LI Chen-xi.Application of Wavelet Multi-Scale Orthogonal Signal Correction in Milk Components Measurement Using Near-Infrared Spectroscopy[J].Spectroscopy and Spectral Analysis, 2008, 28 (4) :825-828.
[5]张广军, 李丽娜, 李庆波, 等.基于小波变换的噪声及背景同时去除方法在血糖近红外无创检测中的应用[J].红外与毫米波学报, 2009, 28 (4) :107-110.ZHANG Guang-jun, LI Li-na, LI Qing-bo, et al.Application of Denoising and Background Elimination Based on Wavelet Transform to Blood Glucose Noninvasive Measurement of Near Infrared Spectroscopy[J].J.Infrared Millim.Waves, 2009, 28 (4) :107-110.
[6]吴桂芳, 何勇.小波阈值降噪模型在近红外光谱信号处理中的应用研究[J].光谱学与光谱分析, 2009, 29 (12) :3246-3249.WU Gui-fang, HE Yong.Application of Wavelet Threshold Denoising Model to Infrared Spectral Signal Processing[J].Spectroscopy and Spectral Analysis, 2009, 29 (12) :3246-3249.
[7]李正刚, 吴一辉, 宣明.应用小波Firm阈值滤波实现光谱实时采集[J].光学精密工程, 2010, 18 (2) :357-362.LI Zheng-gang, WU Yi-hui, XUAN Ming.Spectral Data Real-time Acquisition with Wavelet Firm Shrinkage Filtering[J].Optics and Precision Engineering, 2010, 18 (2) :357-362.
[8]潘泉, 张磊, 孟晋丽, 等.小波滤波方法及应用[M].北京:清华大学出版社, 2005.PAN Quan, ZHANG Lei, Meng Jin-li, et al.Application of Wavelet Filter Method[M].Beijing:Tsinghua University Press, 2005.
[9]张弦, 王宏力.进化小波消噪方法及其在滚动轴承故障诊断中的应用[J].机械工程学报, 2010, 46 (15) :76-81.ZHANG Xian, WANG Hong-li.Evolutionary Wavelet Denoising and Its Application to Ball Bearing Fault Diagnosis[J].Journal of Mechanical Engineering, 2010, 46 (15) :76-81.
[10]林哲民, 康学雷, 张立明.在小波域中进行图像噪声方差估计的EM方法[J].红外与毫米波学报, 2001, 20 (6) :199-202.LIN Zhe-min, KANG Xue-lei, ZHANG Li-ming.EM Algorithm for Estimating the Noise Deviation of the Image in the Wavelet domain[J].J.Infrared Millim.Waves, 2001, 20 (6) :199-202.
[11]田高友, 袁洪福, 刘慧颖, 等.小波变换用于近红外光谱性质分析[J].分析化学, 2004, 32 (9) :1125-1130.TIAN Gao-you, YUAN Hong-fu, LIU Hui-ying, et al.Application of Wavelet Transform on the Near Infrared Analysis[J].Chinese Journal of Analytical Chemistry, 2004, 32 (9) :1125-1130.
小波域增强 篇6
1 方案描述
作为能证明著作者版权信息的水印可以是有意义的字符,可以是一串伪随机序列,也可以是比较直观的图像,因为图像信息在没有受到严重损坏的情况下一般还能够辨认出来,故本次设计选用的是含数据量较小,但又不失一般性的二值图像作为水印来处理与隐藏。
1.1 可视密码术对水印的处理
为提高水印的抗攻击能力,用改进的(4,4)可视密码术对水印进行处理。如图1所示,C01~C03用于加密白色像素点,C10~C13用于加密黑色像素点。它们具有以下属性:任何一个单一的子密钥块包括5个黑子像素;C01~C03里的任意两个子密钥块的叠加包括7个黑子像素,任意3个和4个子密钥块的叠加包括8个黑子像素。C10~C13里的任意两个子密钥块的叠加包括7个黑子像素,任意3个子密钥块的叠加包括8个黑子像素,4个子密钥块的叠加包括9个黑子像素。可以看出,当子密钥块数目少于4的时候,黑子像素和白子像素是无法区分的。只有当4个子密钥块都叠加到一起的时候,视觉上才能区分黑(全黑)和白(8/9黑)。
1.2 水印的降维处理
假设W是M1×M2的二值图像,它可表示为:
undefined
式中w(i,j)∈{0,1},为了将二维的二值图像嵌入到一维的数字音频信号中,将其进行降维处理,将二维图像变为一维序列:
undefined
1.3 音频信号的分段处理
假设S是从wav文件中读取出的音频信号采样数据,长度为N,它可以表示为:
undefined
式中s(n)∈{0,1,…,(2p-1)}是第n个数据的幅度,p表示每个采样数据所用的信息位数。
我们把音频数据S分成两部分,一部分用来嵌入水印,一部分与水印嵌入无关,即:
undefined
式中Se={s(n),0≤n<(M1M2+3p)L}是与水印嵌入相关的部分(M1,M2是水印图像像素的宽度与高度,p是同步码的周期长度,并且在水印序列中插入了3个同步码序列,L是音频分段的长度),Sr={s(n),(M1M2+3p)L≤n
把用于嵌入水印的Se分成M1M2+3p个长度为L的数据段,即:
undefined
式中se(k)表示第k个音频数据段。
1.4 分段DWT变换并嵌入水印
分段完成之后,需要对每一个数据分段se(k)作H层的DWT变换。
(1) 对每一音频数据段se(k)分别作H层离散小波变换。
undefined
式中De(k)={de(k)(t),0≤t
(2) 在离散小波变换域内确定水印的嵌入区域。
音频段se(k)进行小波变换的结果Dundefined(k)中包含一组近似分量Dundefined(k)和H组细节分量Dundefined(k),Dundefined(k),…,Dundefined(k),即:
undefined
为了提高水印系统的鲁棒性,本方案选取小波系数的近似分量Dundefined(k)作为水印的嵌入区域,并且每个音频分段的Dundefined(k)只重复嵌入一个水印比特信息,重复次数为TIME,重复嵌入的次数最大TIMEmax=L/2H。
(3) 修改小波系数采用量化系数方法。
undefined
其中,为取整函数,即向绝对值小的方向取整。
undefined
(4) 小波反变换,重建音频信号
前面的过程完成了水印数据嵌入到小波域,然后需要把每个分段数据修改后的小波结果进行反变换复原成音频信号,并且把分段连在一起构成嵌入水印信息的音频S′e和与水印嵌入无关的Sr组合成完整的目标音频信号。
1.5 水印的检测
水印检测是水印嵌入的逆过程。
(1) 首先把待检测音频数据相应地分成两部分,即嵌入有水印的部分S′e和与嵌入无关的部分Sr。
(2) 把S′e进行与嵌入时相同的分段处理,即相同的分段起始位置和相同的分段长度L。然后把每一段分段数据S′e(k)(k表示第k段)进行H层的DWT变换得到小波变换系数D′e(k)={d′e(k)(t),0≤t
(3) 寻找水印嵌入的位置提取水印。在嵌入时本文选择的是在小波系数的近似分量(低频分量)中嵌入的,因此提取时也是通过检测近似分量提取水印比特。设检测出的水印比特为V′s(k)(t)。
undefined
V′s(k)(t)中,k(0≤k
(4) 根据多少判定的方法决定某个音频段嵌入的水印比特。初始化计数值num=0,依次检测TIME个V′s(k)(t),如果 V′s(k)(t)=1,就将计数值num自增1(即num+ +)。检测完一个数据分段中提取的V′s(k)(t),如果num>TIME/2,那么本段嵌入的二值数据V′s(k)=1;否则如果num
(5) 对一维的水印数据进行升维处理,变换成二维图像数据,并且在界面里显示出来。
2 水印系统实验仿真
以前面给出的(4,4)加密方案构造水印,设要隐藏的明文信息是“吉”字,由仿真程序生成的子密钥图片如图2所示。
将子密钥key4作为水印嵌入到上述音频信息中,提取出的子密钥图像如图3所示,将提取的子密钥图像与其余3幅子密钥图像进行叠加,最终恢复出的代表版权信息的水印图像如图4所示。
图5是提取子密钥图像和其余两幅子密钥图像的叠加结果,从图5可以看出,单幅子密钥和少于4幅子密钥的叠加结果都不能恢复原始的明文信息,只有4幅子密钥的叠加结果才能恢复原始的明文信息,当然,可视密钥的形成是将明文图像的每一个像素分成多个子像素来表示,恢复时会有对比度的损失,恢复得图像会变暗。
本论文方案也有不足仍需要继续深入研究,由于可视密码术方法是通过特定算法将秘密信息隐藏到多张图片中进行分存,使得图片单位面积对应的信息量减少,故从另一方面讲可视密码术在增加水印的安全性的同时也降低了水印信息的嵌入量。
摘要:提出的基于可视密码术的小波域量化系数音频数字水印方案,采用可视密码术的方法,通过特定算法将秘密信息隐藏到一定数量的图片中,这些图片作为水印嵌入到数字作品中,恢复者可以通过将特定数量的图片叠加在一起,通过人的视觉系统就能识别恢复出原来的秘密信息,无需大量的计算和密码学的知识,所以可以为更多的人使用。
关键词:数字水印,离散小波变换,可视密码术,量化
参考文献
[1]刘海燕,郑雪峰,王颖.数字音频水印主要算法的研究比较[J].计算机应用研究,2007,24(9):136-139.
[2]黄俊波,丁源源,王虹.一种新的基于量化的音频数字水印算法[J].电脑与信息技术,2004(1):24-27.
[3]Wu Shaoquan,Huang Ji wu,Huang Daren,et al.Self-Syn-chronized Audio Watermarkin DWT Domain.IEEE,2004.
[4]Naor M,Pinkas B.Visual Authentication and Identification.Advances in Cryptology:CRYPTO 97.Lecture Notes inComputer Science,1997:322-336.
小波域增强 篇7
关键词:音频数字水印,掩蔽效应,水印嵌入,水印提取
1 引言
随着数字技术的迅猛发展,数字图像、音频、视频等多媒体产品得到日益广泛的普及和应用。目前用于版权保护的音频水印算法中,基于小波变换的算法成为现在研究的热点。但仅仅通过小波变换来实现水印算法,其安全性不能得到很好的保证,于是许多文献在小波变换的基础上提出了水印算法,例如文献[1]中提出基于量化的小波域数字音频水印算法,文献[2]中提出的基于听觉掩蔽效应和小波变换的数字音频水印算法,都是结合小波变换提出新的算法。在此基础上,本文结合上述算法在鲁棒性、安全性方面的优点提出一种新的基于混沌扩频的小波域数字音频盲水印算法。
2 基于混沌扩频的水印序列
2.1 混沌
一般而言,混沌是非线性动力学系统所特有的一种运动形式。混沌运动是一种不稳定有限定常运动,是确定性系统中存在的有序又无序的类似随机性的过程,并且对初始值有极其敏感的依赖性[3]。把混沌归结为三个特征:不可预测性、不可分解性和具有规律性行为。现在许多映射例如Chebyshev映射、Logistic映射、Kent映射在一定约束条件下都能进入混沌状态而产生混沌序列,并且序列具有较理想的相关特性,类似白噪声性能,能够满足了对伪随机码的要求。
2.2 Chebyshev混沌序列(切比雪夫混沌序列)
k阶Chebyshev映射定义[4]如下:
其中xn为映射变量,确定参数k,以初始值x0代入方程开始迭代,就可以得到混沌序列xn。其概率函数为:
因此,Chebyshev混沌序列在理想情况下完全可以作为直接序列来扩频,但为了进一步增强其随机性,提高扩频系统的抗解码能力,需将混沌序列转化为数字序列。通常采用二值量化的方法得到二进制序列,量化函数为:
Chebyshev混沌序列的自相关性和互相关性(以500长度为例)如图1所示。
2.3水印的生成
设水印图像为P,可以表示为:P(i,j)∈[0,1]。由于音频信号是一维的,要将二维的图像嵌入音频,首先要将其降为一维序列P'(k)。接下来通过参数k和初始值x0,产生Chebyshev混沌二制序列,为了增加密钥的保密性,从序列的任一位置b开始截取新序列M,利用M对水印进行混沌加密。为了提高水印的抗攻击能力,用M和P'作混沌扩频调制得到加密后的水印序列。其中茚为异或运算,C为扩频因子。将参数k、初始值x0、起始位置b、扩频因子C共同作为用户的私钥key(k,x0,b,C),在不知道私钥的情况下,盗版者即使提取出水印信号也无法恢复水印图像。同时,利用混沌加密后的图像水印,消除了元素的相关性,提高了水印的鲁棒性。
3 基于均值量化的水印嵌入
为了实现水印信号的盲检测,增加算法的易检测性和安全性,采用量化的方法在小波域嵌入水印信号。
水印嵌入的过程如图2所示。
对系数(嵌入水印后的相应系数均值)量化处理与水印比特W的取值密切相关:当W=1时,使量化结果'等于与最接近的A区间集中某一区间的中间坐标值;当W=0时,使'等于与最接近的B区间集中某一区间的中间坐标值。设上述的水印嵌入算法中对均值进行量化所产生的误差为αi,即αi=Fi'-Fi。为了求得嵌有水印的音频信号,还需将量化引起的误差αi分别加到对应的每一个系数上,即
根据调整后的小波系数CAHi',CDHi,CD1i进行原始信号的重构,即进行离散小波逆变换,得到数字音频信号中含有水印信息的部分A'i。用A'i代替Ai,得到含有水印的音频信号A'。
4 水印的提取
该文的水印提取不需要原始数字音频信号,是一种公开(盲)水印算法。水印的提取过程如图3所示。
5 仿真实验与性能分析
5.1 仿真实验
为了验证本算法,在仿真实验中,选取了一段长度20秒古典音乐进行测试。原始数字音频信号是单声道,采样频率为44.1kHz,分辨率为16比特,共取882000个采样点,其波形图如图4所示。水印采用一64X64的普通黑白二值图像如图5所示。由于采用的水印在感觉上是可视的,所以提取的水印信息很容易辨别。量化步长定为Δ=0.05,选择K=8。通过听觉感知和波形图,原始信号和嵌入水印后的信号并没有明显的区别。从波形图中也可以看出,如图6所示。
5.2 性能分析
为了更好的验证本文算法的优越性,选取文献[5]中给出的水印算法与本算法一起,使用同一幅水印图像,同一段音频信号,同样的低频部分伸缩因子嵌入水印,并分别使用各自的检测算法检测水印。下面是用以上两种方法嵌入水印的音频信号进行的攻击测试。
1)重采样:重采样包括上采样和下采样两种。上采样是将信号采样频率由原来44.1kHz提升为48 kHz,再利用抽取技术还原为原采样频率;下采样是将音频信号的采样频率由原来44.1kHz降为22.05kHz,然后利用插值技术变回原来的44.1kHz。
2)低通滤波:低通滤波器的作用是允许低频率的信号通过,将高频信号衰减。采用阶数为6,截止频率为2kHz的巴特沃斯低通滤波器对含有水印的音频信号进行低通滤波操作。
3)加白噪声:白噪声是指功率谱密度在整个频域内均匀分布的噪声。给含有水印的音频信号加入高斯白噪声(均值为0,均方差为0.01)。
4)加有色噪声:白噪声通过一个截止频率为2kHz的低通滤波器。
5)随机裁剪:对含水印音频随机裁剪或增加若干样点,一般不会造成音频音质下降,但水印信息遭到一定程度的破坏,导致水印不再同步。实验中,在保证不影响音质的前提下,从含水印的音频信号中随机地抽去个别样点之后,再对其进行检测。
6)去噪:利用一维离散平稳小波分析方法对信号进行全局阀值去噪处理,采用DB3小波基对信号进行了三层分解。
7)MP3压缩:MP3是目前应用最广的数字音频压缩编码技术,因此能够在MP3编码后被正确提取是对音频水印的基本要求。针对含水印音频用128kBit/s速率进行MP3压缩,再将其解压为波形(即*.wav)文件,然后进行水印提取。
8)重量化:将嵌入水印后的音频信号由16比特量化为8比特,再量化为16比特。
图7是本文算法分别经过以上攻击后的含有水印的音频信号(古典音乐)中提取出的水印图像,图8是对比算法提取的水印图像。
6 总结
通过两种算法经过不同的攻击测试实验结果,可以很明显的看出本文算法的优越性和安全性。该文算法和对比算法在嵌入数据的隐蔽性方面,就有很大的区别,实验是按量化步长进行水印的嵌入,未被攻击时,对比算法已经不能完全提取出水印图像,在不断的实验中发现,当量化步长为0.01时,对比算法的水印才能基本上完全提取,相关系数达到0.9939。这表明了本文水印算法在数据的嵌入强度方面有了很大的提高。其次,含水印的音频信号受到攻击时,鲁棒性的差异也比较大,尤其是在加白噪声、去噪、MP3压缩、重量化四种攻击后,本文算法能完整提取水印,使相关系数达到1,表明本文算法具有很强的鲁棒性。
参考文献
[1]孙锐,孙洪,姚天任.基于量化的小波域数字音频水印算法[J].中科技大学学报:自然科学版,2002,30(5):12-15.
[2]周克兰,张玉华.基于听觉掩蔽效应和小波变换的数字音频水印[J].微电子学与计算机,2005,22(3):185-188.
[3]蔡国权,宋国文,于大鹏.Logistic映射混沌扩频序列的性能分析[J].通信学报,2000,21(1):60-63.
[4]凌聪,孙松庚.用于CDMA的四相混沌扩频序列[J].通信学报,1998(3):40-44.