HVS模型

2024-07-05

HVS模型（共6篇）

HVS模型篇1

1 引言

数字半色调技术(又称数字加网技术)是基于人眼的视觉特性和图像的成色特性,利用数学、计算机等工具,在二值设备或多色二值设备上实现图像再现的一门技术,是将连续色调图像经过处理后再输出以实现图像阶调再现的基础性研究[1,2]。

数字半色调技术的原理是将具有连续色调的图像转化为二值图像阵列,并打印到打印介质上,使输出的二值图像阵列给人造成一种视觉上的连续色调效果。它充分利用人眼的低通滤波特性,当人近距离观看打印输出的二值图像时,由于可以看到单个的点,所以视觉效果不连续,但如果在远距离观看,就察觉不到单个点的存在,打印出的半色调图像局部平均灰度值近似于原始图像的局部平均灰度值,从而在整体上产生了输出图像中的多种灰度感觉,在视觉上形成连续色调的效果。

数字半色调算法中处理性能最好的是误差扩散算法。其优点是获得的半色调图像效果好、色调丰富、像素点的分布具有各向异性。然而误差扩散算法中,由于未考虑人的视觉系统模型(HVS模型)对图像的识别情况以及采用固定的分散系数,高光和暗调部位出现与半色调处理方向相关的滞后现象造成了图像轮廓的失真。为了更好的使图像在频带上很好的过渡,在本算法中引入了双向反馈的思想。而由于最终判定图像的是人的眼睛,因此把HVS 模型对图像的影响引入本算法中。在这个算法中使用了两个滤波器,其中一个滤波器借助了基于HVS模型的误差核,另一个滤波器根据当前像素与领域像素的特征情况确定分散系数,而在考虑再现图像特征时不仅再现图像的灰度特征,而且再现图像的HVS特征。

2 传统的误差扩散算法的基本原理

误差扩散算法[3]由 Floyd 和 Steinberg 于1976年首次提出 ,其基本思想为先阈值量化图像像素,然后将量化的误差扩散到相邻的未处理的像素上。其原理和误差滤波器的权系数如图1所示。其中每个象素的误差扩散过程包括如下三个步骤。第一,将原始象素值加上扩散到此处的误差作为当前输入;第二,将当前输入进行阈值处理得到一个输出 ( 0 或 1,半色调研究中灰度值一般都归一化);第三,将输入与输出的误差值按照一定的规律扩散到未经处理的区域。

n为当前处理的图像单元,0为已处理的单元, h(1,0),h(1,1),h(0,1),h(-1,1)为未处理单元。滤波器的脉冲响应h(1,0)=7/16,h(1,1)=1/16,h(0,1)=5/16, h(-1,1)=3/16 ,其滤波过程也就是将当前处理像素的量化误差以上述权重传递给未处理的像素的过程。

观察图5(b),经过 Floyd-Steinberg 半色调处理后,获得的半色调图像效果好、色调丰富、像素点的分布具有各向异性,灰度过渡比较自然,具有很好的细节再现能力;但也存在以下不足:如在半色调图像中诸多网点处存在“龟纹”和“网点”现象,在高光和暗调部位出现的与半色调处理方向相关的滞后现象,边缘部位不连续的过渡现象以及处理速度相对较慢。

3 基于双向反馈的误差扩散算法

3.1 算法原理

通过分析传统的误差扩散半色调算法,其实质上是进行了高通滤波和低通滤波的处理 ,因此造成了“龟纹”和“伪轮廓”的出现,现在我们通过研究,在高频与低频中加入中间频带,这样图像在频带上具有很好的过渡,图像质量总体上来说应该更好。因此,我们在经典的误差扩散的单反馈的思想上,通过引入双向反馈,提出了基于双向反馈的误差扩散半色调算法。

双向反馈误差扩散半色调原理如图2所示。

其流程如下:

u(m,n)=x(m,n)-undefinedh(k,l)e(m-k,n-l)

g(m,n)=u(m,n)+undefined

undefined

此基于双向反馈误差扩散半色调算法与传统误差扩散算法相比,采用了两个误差滤波器,误差分散滤波器h和反馈滤波器 w。其中w采用了基于HVS模型的误差分散核,并且对误差扩散滤波器 w 继续进行小幅度的随机抖动,从而使得到的图像的视觉效果更好。而h采用了一与领域特征相关的滤波器,从而在一定程度上减轻了方向性纹理和人工纹理的出现。

3.2 HVS 模型

半色调之所以能够模拟连续色调图像是依赖于人眼视觉系统 ( human visual system, HVS) 的低通或带通滤波器的特性,如将图像从空间域变换到频域,那么频率越高,人眼的分辨能力就越低;频率越低,人眼的分辨能力就越高,这就是HVS的频域特性[4]。由人眼对高频细节敏感性较低可知,人眼相当于一个低通滤波器[5]。由于图像最终的服务对象是人的眼睛,尤其是半色调技术,判定一个算法优劣的标准最终由人眼决定,因此在半色调算法中引入HVS 具有重要意义。目前,对于数字半色调技术,Nasanen 的 HVS 模型具有最好的低通特性,通过它产生的半色调图像具有最好的主观视觉效果。又因为 Gaussian 函数具有许多适合半色调处理的特征,如光滑的单峰曲线使其具有很理想的低通特性,其滤波器的傅立叶反变换也是高斯的等,实际应用中常使用Gaussian 低通滤波器近似表示 Nasanen 模型。

3.2.1 HVS模型在频域中的表示

HVS 模型具有不同的表示方法,在频域中HVS 模型[5]可以定义为

undefined

式中:L 为每平方米亮度均值,其单位为 cd/m2,u和ν为朝向视网膜的单位角度内的光线周期变化频率,(u2+ν2)1/2则为光线的频率;□的值为角度的变化频率,定义为□=a·tan(u/ν);其它常数s(□)被定义为a=131.6;b=0.3188;c=0.525;d=3.91;s(□)=0.15×cos(4□)+0.85。

HVS函数具有以下三个方面的特征:①在频率域中,它是一个递减函数;②它沿45°线的响应是水平和垂直线响应的2～1/2;③在所有的频率域中,该函数值大于零。

3.2.2 HVS模型的亮度特性

人类视网膜由两大类视觉细胞构成,一类叫视杆体(rods),在暗光环境下特别敏感;另一类叫视锥体(cones),在亮光环境下特别敏感。实验表明,人们对物体亮度的感觉同进入人眼的光强成对数关系,但人们对物体亮度的感觉并不完全由物体本身亮度所决定,还与物体所处的背景亮度有关[6]。人眼主观上刚可察觉的最小亮度差,称为亮度的可见度阈值 (threshold),可见度阈值与背景亮度间的关系的示意曲线如图3所示,对于不同的物理亮度水平,此阈值的响应曲线呈现分段、非线性特点(移变非线性),这就是人眼的亮度适应性,它产生的根源是视细胞非线性地把接收到的光信号转换成电信号。当背景亮度大于10cd/m2时,亮度适应性可用著名的weber一Fencher定律描述,阈值与背景亮度为对数非线性关系;当背景亮度处于10cd/m2以下,阈值与背景亮度为平方根(或立方根)关系。由于感知亮度的非线性压缩作用,在高亮度区,视觉感知可以允许较大的图像误差,表现出亮度掩盖效应[7]。

3.3 反馈滤波器w和分散滤波器h

3.3.1 反馈滤波器w

由于图像最终的服务对象是人的眼睛,所以如果使用基于HVS模型的分散核作为反馈系数,则最终的视觉效果将会更好。在此算法中为了克服固定的反馈系数造成方向滞后的现象,对滤波器w进行了小幅度的随机抖动。

3.3.1.1 基于HVS模型的误差核

误差分散系统本身是一个非线性的模型,为了便于分析及对误差分散半调系统进行最优化处理,使用一种附加了噪声的线性增益模型,这一模型由Ardalan和Paulos[5]在一维的情况下使用,这里将其应用到误差分散系统。

在一维向量中由图1(a)知误差图像可由下式来表示:

e(n)=Q(u(n))-u(n) (1)

因为e(n)与x(n)相关,x(n)与u(n)相关,因此e(n)与u(n)相关。从式中可知Q(u(n))一u(n)与u(n)有关,对此相关性用下式来表示

Q(u(n))=K u(n)+m(n) (2)

其中,K是常数,m(n)是与原图无关的白噪声。将量化过程Q(.)建模成为线性增益K与无关白噪声源m(n)的叠加。

输出半调图中的噪声部分在Z域中表示如下:

Bz(z)=(I一H(z))N(z) (3)

对上式进行逆变换就可以得到输出噪声在空域中的表达式:

bm(n)=(1一h(n))*m(n) (4)

令v(n)表示一个完整的HVS模型,则(v(n)*bm(n))表示输出半调图中

的加权噪声能量。用函数J表示它的期望值,形式如下:

J=E[‖v(n)*(1-h(n))*m(n)‖2] (5)

由上式可确定基于人眼视觉模型的误差核[8]:

undefined

本算法采用的基于HVS模型的误差扩散系数矩阵[9]为

undefined

3.3.1.2 本算法中对此误差核的处理方式

基于HVS模型的分散系数的扩散原理和权重分配系数如表1所示:

其中**代表了当前点像素位置,其它位置的算术比值代表了与当前像素相对位置上的误差扩散权重,取值范围在[0,1],且满足:2×w1+4×w2+2×w3+2×w4+2×w1+5∈[0,1]。

一般情况下我们分配如下的权重系数:W1=1/134, W2=5/134, W3=12/134, W4=12/134, W5=32/134。对误差扩散滤波器 w 继续进行小幅度的随机抖动 ,其处理方法如下:

wrand=(r(i,j)/rand_max-0.5)×cDither[10]

w′1=w1+wrand

w′2=w2+wrand

w′3=w3+wrand

w′4=w4+wrand

w′5=w5+wrand

其中, wrand为抖动微调参数; r(i,j)为当前扫描点随机参数, rand_max为随机参数r(i,j)的最大值 , cDither为抖动幅度调整系数。w′1～w′5为误差扩散滤波器 w 小幅随机抖动后的权重分配系数。

3.3.2滤波器h

3.3.2.1 图像特征函数

图像的特征函数反映了再现图像的特征信息,在实现过程中,若需要再现图像的不同特征,应选取不同的特征函数。在此算法中主要考虑再现图像的灰度特征和HVS特征。所以在实现过程中选取了两个特征函数。在这里这两个特征函数采用加权求和的方式得到一个反映图像特征信息的复合函数。设图像的复合特征函数为F(x,y),图像的两个单个特征函数分别为f1(x,y),f2(x,y)则该图像的复合特征函数表示为F(x,y)=w1·f1(x,y)+w2·f2(x,y)。其中,w1,w2分别是图像不同特征函数的权值,且w1+w2=1,其值的大小可由用户根据再现图像特征信息的需要进行不同的设置。

a、灰度特征函数

将图像的每个像素的灰度值作为反映图像灰度特征的函数,以再现图像的灰度特征。

b、视觉特征函数

(1)利用3.2中HVS函数计算出H(u,v) (u∈[1,2,3…],v∈[1,2,3…])在频域中的值;

(2)将(l)的HVS函数H(u,v)进行反傅立叶变换,得到空间域中的相应函数h(x,y) (x∈[1,2,3…],y∈[1,2,3…])其变换方法为:

设待处理频率域中的二维离散化的函数为H(u,v),则该函数的反傅立叶变换的关系为:

undefinedundefinedH(u,v)ej(2π/M)xuej(2π/N)yv (1)

其中:x=0,1,2,…,M-1;y=0,1,2,…,N-1。

利用公式(1),在空间域中计算h(x,y) (x∈[1,2,3…],y∈[1,2,3…])函数的函数值,选取所得值的实数部分作为缘检测模板系数,利用这些模板系数与原图像进行卷积。根据卷积的结果,选取合适的系数,对原图像进行相应的线性变换,即得到具有HVS特征的特征图像。

3.3.2.2 滤波器组成

滤波器h由两部分来组成,如图4所示

在Hwang[11]算法中仅是考虑当前象素的灰度特征,在本算法中我把图像的视觉特征考虑进来。则图4中D(i,j) 和G(i,j)分别由如下公式得到:

undefinedundefined

undefined

其中D(i,j)为原图像中当前像素特征值与领域特征平均值的差,在此考虑领域为一3×3的窗口。G(i,j)为一权函数,其值与D(i,j)的符号相关。D(i,j)值为0时表示当前像素与领域像素具有相似的特征,说明这一领域的阶调变化是平缓的,因此经半色调得到的二进制图像中这一区域的阶调变化也是平缓的,因此可以采用图像中的分散系数;D(i,j)值为一正值时说明当前像素与领域像素相比其特征变化是剧烈的;D(i,j)值为一负值时说明当前像素与领域像素相比其特征变化同样是剧烈的,只不过与D(i,j)为正值相比,其走向是不同的。权函数G(i,j)中的a控制着边缘重建时的强调级别,b保护边缘以免被陡峭的阶调变化过分强调。

4 实验结果

在 MATLAB7.1环境下,对256级灰度256 ×256 分辨率的Lena图 (图5(a)),用本算法进行仿真试验。在此选用a=2.5,b=0.02,而复合函数中wi值较大些。从图5(b)、(c)可以看出,与标准误差扩散算法相比较经本算法处理后方向性纹理得到明显改善,图像的细节更加显现,更加符合人眼对于原图的视觉效果。

5 结论

与以往的误差扩散半色调算法相比,本文提出的基于双向反馈及HVS模型的误差扩散算法,处理后的图像很大程度上减少了“伪轮廓”和“龟纹”现象。由于图像最终的服务对象是人的眼睛,所以在分散滤波器与反馈滤波器的设置上均使用到了HVS模型。在本算法中分散滤波器采用了根据当前像素与领域像素的特征(灰度特征和视觉特征)确定分散系数;反馈滤波器采用了基于HVS模型的分散核,并在此基础上进行了小幅抖动。从而很好地克服了以往误差扩散滤波器中由于固定系数扩散所产生的方向性纹理缺陷,使图像的整体视觉效果更好。

摘要：针对传统误差扩散中的“龟纹”和“伪轮廓”现象,在基于标准误差扩散算法的基础上,提出一种基于双向反馈的误差扩散半色调算法。它不仅在误差扩散后的高频和低频成分中依据HVS模型加入了中间频带,使图像更趋于均匀和柔和,并且根据领域图像灰度特征和HVS特征动态修改误差扩散滤波器系数,尽可能的克服了由于固定系数扩散所产生的方向性纹理缺陷。

关键词：数字半色调,误差扩散,HVS模型,双向反馈

参考文献

[1]R.A.Ulichney,Digital Halftoning[M].The MIT Press,1987.

[2]D.Anastassion,K.Pennigton,Digital halftoning of image[C],IBMJ.Res.Devel,Vol.26.pp:687-697,1982.

[3]R.W.Floyd and L.Steinberg.An adaptive algo-rithm for spatial grayscale[C].Proceeding Of the society for Information Display,1976,Vol.17,No.2,PP:75-77.

[4]李晓东.非线性逆误差分散应用研究[D].西安:西安建筑科技大学,2008.

[5]S.Ardalan and J.Paulos.An analysis of nonlin-ear behavior in delta一sigmamodulators[J].IEEE Trans.Circuits Syst.,Vol.34,June1987.pp.593-603.

[6]侯志强,韩崇昭,郑林,肖李珍.一种基于视觉模型的边缘检测阈值选择策略[J].光电工程2004年,第31卷第2期,PP:59-62.

[7]曹圣群,黄普明,鞠德航.HVS模型及其在静止图像压缩质量评价中的应用[J].中国图像图形学报,APr2003,Vol.8(A),No.4,pp.379一385.

[8]袁龙飞.基于人眼视觉系统模型的彩色半调算法[D].西安:西安建筑科技大学,2007.

[9]ZHANG XIAOHUA,L IU FANG,J IAO LCHENG.An effective image halftoning and in-verse halftoning technique based on HVS[C]∥Proceedings of the fifth international conference on computational intelligence and multimedia applications.Xi’an:IEEE Computer Society Press,2003,441-445.

[10]钟平,钟建军,张伟,潘涌.基于双向反馈的自适应误差扩散半色调算法[J].应用激光,2008年,第28卷第4期:327-331.

[11]B.W.Hwang,T.H.Kang and T.S.Lee,”Dis-tortion-Free General Information with Edge Enhanced Error Diffussion Halftoning,”ICCSA2004,LNCS Vol.3046,pp.281-290,2004.

HVS模型篇2

关键词：DCT,人类视觉系统,JND模型,游程编码

1 引言

随着互联网和信息技术的飞速发展以及数字媒体(如数字图像、数字音频、数字视频等)的广泛应用,对医学图像、军事地图等数字产品的内容认证变得越来越重要。水印技术可以作为一种解决方案,它将数字签名、商标等信息作为水印信息嵌入到多媒体数据中,并在水印提取之后恢复原始信息。实际上,有效的水印嵌入必须有足够的嵌入容量和良好的视觉质量,足够的容量能承载足够多的信息,而良好的视觉质量保证了嵌入水印的不可见性。对于稳健性水印来说,水印还必须能经受住攻击的考验。而可逆水印在满足以上要求的同时必须做到在水印提取之后能够完全恢复原始图像[1,2]。

目前的可逆水印技术有数据压缩、差值扩展和直方图转换。

数据压缩的目的在于能够将恢复信息与水印同时嵌入原始图像,这样在水印提取之后能够根据恢复信息复原原始图像。Mohammad Awrangjeb[3]用算术编码的方法对恢复信息进行压缩,然后将其与水印信息进行连接,两者一起被嵌入到原始图像中。

差值扩展一般是利用相邻像素之间的差值作为因子,根据水印信息进行嵌入。Tian[4]提出的算法中利用相邻两像素之间的差值,根据水印信息修改此两像素值,达到嵌入的目的。

直方图转换利用的是图像的统计特性,首先得到某一部分的直方图,然后根据水印信息对其进行修改,达到嵌入水印的目的。如Vleeschouwer[5]提出在水印位为1时,将直方图循环左移,而在水印位为0时,直方图循环右移。而Ni[6]等人则提出了一种基于图像块分类的嵌入方法,利用一个稳健统计量和误差纠错码(ECC)来嵌入水印信息。

同时,为了达到足够好的视觉质量,人类视觉系统(Human Visual System,HVS)的感知模型已经越来越受到重视,模型的运用在于确定一个门限值,这样在水印嵌入时就可以使原始图像的改变值达到最小,人眼几乎感觉不到,从而保证了图像的视觉质量。

2 算法介绍

2.1 JND模型

本文利用文献[1]的JND模型,具体算法如下:

xi,j表示DCT系数,EAC表示计算每个分块DCT系数与直流系数的平均差统计值,即统计能量值。这里将分块大小确定为8,公式为

对于8位二进制表示的灰度图,G=255,为经验值。Emax表示最大能量值,Rb表示等级区分变量。

根据Rb的大小将分块分为几个等级,这里分为8个等级,用Ib表示,即有

▽Pi,j表示某像素点的梯度值,公式为

当梯度值大于一定值,且这样的像素点数目多于一定的值的时候,这样的像素点可用于进行水印嵌入。

表示JND的初始值,为Ib+2,J(i,j,b)表示最终的JND值,则有

式中:α是一个经验常量,文中取1282。

2.2 游程编码

游程编码又被称为“运行长度编码”或“行程编码”,它是一种统计的无损压缩编码。

游程编码的基本原理是:用一个符号值或者串长代替具有相同值的连续符号,使符号长度少于原始数据的长度。

对于非二进制序列,如8888999911111000000000,可以编码为:(8,4),(9,4),(1,5),(0,9)。这样,编码的数据远远少于原始字符串的数据。

对于二进制序列,该方法更加有效,因为只需要记下首次出现的是0还是1即可。如000000101000001111111,得到的编码序列为:(0,6),1,1,1,5,7。

2.3 嵌入/提取

1)将原始图像分成8×8的块,对每一分块进行DCT变换。根据式(1)~式(3)将分块分为8个等级。

2)根据式(5)计算出梯度值大的点,再根据式(6)将分块分为纹理区和边缘区,这里纹理区将作为水印嵌入区。

3)根据式(7)计算出每一像素点的JND值,以确定纹理区每一像素点应该提取的有效位的数目,公式如下

4)根据3)中的结果提取纹理区每一像素点的有效位。

5)将4)中的位串进行游程编码,得到压缩位串,再将压缩位串与水印信息进行连接,作为将要嵌入的信息。

6)将5)中信息位串嵌入原始图像,具体嵌入过程如下:

x1不变

其中,x1表示在(i,j)处提取的有效位的十进制值,x2表示信息位串的十进制值。

这里因为有些像素点并没有被改变,即有些位置并没有嵌入水印信息,所以需要有边信息作为索引。但在实际过程中,这些边信息是很少的。

在提取过程中,可以根据嵌入过程记录的边信息,用与嵌入类似的步骤提取出水印,并完全复原图像。

3 实验结果

将本文方法的实验结果与文献[1]的结果进行对比,如表1所示。

对比文献[1]的算法,本算法除了Tiffany之外,其余图像的嵌入容量都比前者高很多,甚至是前者的两倍。原因在于前者用的是算术编码,而本算法用的是游程编码,从理论上讲,算术编码的确是最接近熵编码,但是这只是统计结果,对于实际情况,特别是对于01序列,游程编码具有更高的编码效率,也即提取出的有效位串0或1连续出现并且出现长串的概率很大,这正是游程编码的优势所在。

对于视觉质量方面,因为对JND模型进行了修正,并且将边信息记录下来,而不是连同水印信息一同嵌入到原始图像中去,这样保证了原始图像的改变更小,从而获得更好的视觉质量。

4 小结

笔者将人类视觉系统与无损数据压缩相结合,提出了一种用于数字图像的可逆水印算法。由于算法中采用游程编码对边信息进行压缩,大大降低了边信息的大小,从而提高了嵌入容量。同时,通过对JND模型的修正,提高了水印图像的视觉质量。

参考文献

[1]FENG J B,LIN I C,TSAI C S.Reversible watermarking:current status and key issues[J].International Journal of Network Security,2006,2(3):161-171.

[2]GONZALEZ R C,WOODS R E,EDDINS S L.数字图像处理(Matlab版)[M].阮秋琦,译.北京:电子工业出版社,2008.

[3]AWRANGJEB M,KANKANHALLI M S.Lossless watermarking considering the Human Visual System[EB/OL].[2009-11-20].http://www.springerlink.com/content/5r5jgx37na2xvbuq/.

[4]TIAN J.Reversible data embedding using a difference expansion[J].IEEE Trans.Circuits Systems for Video Technology,2003,13(8):890-896.

[5]VLEESCHOUWER C D,DELAIGLE J,MACQ B.Circular interpretation of bijective transformations in lossless watermarking for media asset management[J].IEEE Trans.Multimedia,2003,5(1):97-105.

HVS模型篇3

从信号处理的角度看,嵌入的水印信号可看作是在强背景(即原始图像)下叠加一个视觉上看不到的弱信号(即水印)。由于人类视觉系统(Human Visual System)分辨率受到一定的限制,只要叠加的信号幅度低于HVS的对比度门限,叠加的信息位置处于人眼视觉不敏感区域,就无法感觉到信号的存在。因此可以利用人类视觉生理和图像处理知识来实现图像的水印嵌入。

1 图像DCT变换

DCT算法的基本原理是:利用傅里叶变换的对称性,采用图像边界折叠操作将图像变换为偶函数(余弦)形式,然后对这样的图像进行二维傅里叶变换,变化后的结果将仅包含余弦项。二维图像DCT变换是先将图像分成N×N像素块,然后对N×N像素块直接进行DCT变换[1,2]。

①DCT正变换

N×N像素矩阵I(i,j)的二维DCT变换定义为:

$\begin{array}{l} F (u, v) = \frac{1}{2 Ν} c (u) c (v) \sum_{i = 0}^{Ν - 1} \sum_{j = 0}^{Ν - 1} Ι (i, j) \times \\ \cos [\frac{(2 i + 1) u π}{2 Ν}] \cos [\frac{(2 j + 1) v π}{2 Ν}], i, j = 0, 1, \dots, \\ Ν - 1 (1) \end{array}$

②图像DCT反变换

$\begin{array}{l} Ι (i, j) = \sum_{u = 0}^{Ν - 1} \sum_{v = 0}^{Ν - 1} c (u) c (v) F (u, v) \times \\ \cos [\frac{(2 i + 1) u π}{2 Ν}] \cos [\frac{(2 j + 1) v π}{2 Ν}], u, v = 0, 1, \dots, \\ Ν - 1 (2) \end{array}$

2 人类视觉系统

人类视觉系统[2,3,4](Human Vision System)模型是研究人类视觉系统特性理论,人眼对图像信息的处理是提取图像空间、频率、色彩特征对其进行编码。因此从感知的角度图像中的某些特征信息并不重要,不需要详细表示。基于这一原理,数字水印的嵌入强度可以自适应调整。

2.1 JND模型

JND阈值(Just Noticeable Difference)是一个数字载体系数所能承受的且不会对图像质量产生出人眼能够分辨出来的影响的最大修改值。

2.2 Waston模型[3,4]

①视觉系统的频率响应函数

H(ω)=(a+bω)exp(-cω) (3)

其中,ω为视角正对的径向频率,单位为周/ 度(cycle/ degree),a 、b、c为决定HVS曲线形状的常数。

②适用于DFT变换的视觉响应函数

$\begin{array}{l} Η^{'} (ω) = Η (ω) | A (ω) | \\ {\begin{cases} 0.05 \exp (ω^{0.554}), ω ＜ 7 \\ \exp (- 9 | \lg ω - \lg 9 |^{2.3}), ω \geq 7 \end{cases}} (4) \end{array}$

其中,|A(ω)|=

可将二维DCT系数(u,v)对应的径向频率ω求出。

其中,ωd=(u2+v2)1/2/2N,u,v=0,1,…,N-1 (6)

ωs是依赖于观测距离的采样函数,N是DCT变换块的大小。这里,ωs可以取不同的值。选择不同的ωs值,对应选择不同的DCT系数。可以根据实际要求和图像的特征来选择ωs。本文取ωs=48,从而求得每个(u, v)对应的径向系数。

视觉系统频率响应函数曲线如图1所示,其中横轴表示径向频率ω的值,纵轴表示视觉系统的相应函数H(ω)的值。

由图1可以看出,人眼对8<ω<12之间的区域最敏感,此区域对应的图像的像素,即使做很小的改动,也会引起人眼的注意;然而对0<ω<8和12<ω的区域响应较低,其中,12<ω<22为中频部分,22<ω为高频部分。另一方面,根据JPEG有损压缩原理:一般将DCT变换的高频系数变为零,然后再将剩下的DCT系数进行编码,来完成图像的压缩。所以,如果在原始图像的高频DCT系数中嵌入水印信息,则很可能在进行JPEG有损压缩时将擦除水印信息。早期的DCT变换域的水印算法是把水印嵌入到原始图像的低频中,本文把水印嵌入到中频(12<ω<22)分量上以调节水印的稳健性与不可见性之间的矛盾。

$\begin{array}{l} ③ 亮度遮蔽修正 Q_{\min} (i, j) \\ Q_{k} (i, j) = \max {\begin{cases} Q^{'}_{k} (i, j) \\ | X_{k} (i, j) |^{R (i, j)} [Q^{'}_{k} (i, j)]^{1 - R (i, j)} \end{cases}} (7) \end{array}$

3 基于HVS的DCT域数字水印技术

3.1 水印的嵌入

水印嵌入基本框图如图2所示。

3.1.1 水印的预处理[5,6]

先将水印图像(二值图像)通过Arnold变换进行图像置乱。再给图像降维,即由二维变为一维,使置乱的水印图像{0,1}值转换为{-1,1}序列,以增强水印嵌入后图像的统计不可察觉性,转换方法如下:

$m_{i} = {\begin{cases} - 1, 如果像素值 = 0 \\ 1, 如果像素值 \neq 0 \end{cases}$

对转换后的mi,通过二值混沌序列pi,pi∈{-1,1}进行调制,得到水印序列为:

ωi=mi×pi,(0≤i≤Wi×Wj)。

其中,Arnold变换[4]是俄国数学家Vladimir I. Arnold提出的一种变换,一幅N×N的数字图像的二维Arnold变换定义为:

$(\begin{array}{l} x^{'} \\ y^{'} \end{array}) = (\begin{array}{l} 1 1 \\ 1 2 \end{array}) (\begin{array}{l} x \\ y \end{array}) (m o d Ν) (8)$

其中,x,y∈{0,1,…,N-1}表示变换前像素的位置,x′,y′表示变换之后的像素位置,mod为模运算。

数字图像可以看为一个二维矩阵,经过Arnold变换之后图像的像素位置会重新排列,这样图像会显得杂乱无章,从而实现了对图像的置乱加密效果。

Arnold置乱算法的周期性:经过一定次数的置乱后,图像变得杂乱无章,和原始图像已经完全不同。然而对于合法的用户,需要还原出原始图像。Arnold变换之所以成为一种得到广泛应用的置乱算法,是因为Arnold变换具有周期性,如果重复的进行Arnold变换,经过一定的次数之后必然会还原出原始图像。

3.1.2 原始图像DCT变换

将原始图像Im,n(u,v)分为互不覆盖的8×8的子块 ,得到(M1/8)×(M2/8)个8×8大小的子块,然后对每一子块进行DCT变换,得到每块DCT域的8×8个系数。

3.1.3 基于人类视觉系统的水印嵌入算法

①对每块的DCT系数进行Zig-Zag扫描,得到由低频到高频的一维数组。从而根据人类视觉频域特性选取每个子块系数矩阵中合适的中频系数作为嵌入水印的位置。并对选定的中频系数进行适当的交换调整。

图3是一个8×8的DCT块经过Zig-Zag扫描后的排列图,图4是根据公式(6)将DCT系数变换为相应径向频率ω值的排列图。

由图5是根据本文所提出的算法得到的嵌入水印的区域排列图。

②根据人类视觉掩蔽特征公式(7)求得每块图像里被选定区域的水印嵌入强度JND值。

③根据水印嵌入的乘性嵌入规则I′=I(1+ω×W)将水印信息嵌入到原始图像中,I为所选择的处理后的中频系数,I′为嵌入水印后的中频系数。

3.2 水印的提取

水印提取过程与水印嵌入逆过程,如图6所示。

3.2.1 DCT逆变换

将含水印的图像分为互不覆盖的8×8子块,对每个子块分别进行DCT变换,再进行Z扫描。同样,按照前面的结论选择出子块DCT系数矩阵中嵌入水印信号的中频系数的位置。

3.2.2 水印的提取

①根据其所对应的嵌入强度,利用变换式I′=I(1+ω×W)从嵌入位置上得到嵌入的水印分量:

W=(I′/I-1)/ω

再经过解调制,即:W′=W×P。这里P为嵌入时的混沌序列。然后对解调制后的水印信号进行解扩展,其中,ωi为提取出的原始水印分量:

$ω_{i} = {\begin{cases} 1, 其它 \\ 0, W^{'} ＜ 0 \end{cases}$

②当对所有嵌入水印的子块处理完后,最终的水印分量可构成一个二值序列,再对此序列进行置乱逆运算,将其转换成二维矩阵,从而得到水印图像。

3.3 MATLAB下基于HVS的DCT域数字水印技术的仿真

①水印嵌入流程如图7所示。

②水印提取流程图如图8所示。

③仿真结果如图9-12所示。

4 结束语

本文首先对水印图像进行Arnold变换置乱,根据人类视觉系统对图像中频区域较低频区域敏感度低的特点,将水印信息嵌入到原始图像中频区域,并根据JND阈值的计算自适应调整水印嵌入强度,提高水印的隐蔽性能。在Matlab下仿真实现了算法思想。

参考文献

[1]牛夏牧,孙圣和,陆哲明.数字水印技术和应用[M].北京:科学出版社,2004.

[2]余艳忠,王新伟,刘建华.DCT域水印嵌入新策略和算法[J].计算及应用与软件,2004(1):12-13.

[3]刘岩峰.HVS感知模型与鲁棒数字水印研究[D].南京理工大学,2006.

[4]胡影,周付根.一种基于HVS和DCT的数字水印算法[J].中国体视学与图像分析,2004,9(4):228-232.

[5]纪震,肖薇薇,王建华,等.基于混沌序列的多重数字图像水印算法[J].计算机学报,2003,26(11):1555-1560.

HVS模型篇4

当前,以数字视频图像为主体的多媒体业务正日益成为有线及无线网的主体业务形态。通过对视频图像质量的客观评价,可取代繁琐费时的主观评价方法,为数字节目制作、编解码器设计及优化、多媒体业务质量调整等诸多应用领域提供方便、快捷的技术保障。

最常用的评测方法是基于统计学理论的PSNR等,这些方法由于数学上处理容易、物理意义明确,广泛应用在视频图像质量评测的各个领域。然而其评价结果常与主观感受存在较大偏差,因此研制可有效替代PSNR的新的评测方法成为当前业界的重要课题,吸引着国内外越来越多院校及科研机构的研究兴趣。包括Intel、美国宇航局(NASA)、泰克仪器、皇家飞利浦等企业,以及ITU-T(SG9,SG12),ITU-R(WP6Q),IEEE(广播技术协会),ANSI(T1A1),VQEG(Video Quality Experts Group)等标准化组织都纷纷开展相关的方法研究和标准化测试。新的视频质量客观评价方法要取代广泛适用的PSNR,必须满足以下几个要求:首先,评价结果应比PSNR等具有更好的主观相似性;其次,评价方法需具有广泛普遍的适用性;最后,算法需简单可行,易于系统集成。基于人眼视觉特性构建HVS仿生模型是当前较流行的研究思路之一[1]。方法的通用做法是设计人眼HVS的仿生模型,模仿人眼对参考图像和待测图像之间差异的感知机制,得到相应的感知评价结果。然而,由于人眼生理响应机制十分复杂,这些方法在计算上常过于繁琐而无法实际推广。VQEG于2000年[2]和2003年[3]先后两次对全球各研究机构提交的视频质量评价模型进行评测。从其两次的报告看,目前视频图像质量的客观评价技术尚无法完全满足通用、可靠、简便的评价标准水平。

鉴于当前PSNR已在视频图像质量的评测中广为应用,具有相当规模的应用基础和普适性。本研究认为在PSNR算法基础上融合HVS的主要特性,能在不过多增加算法复杂性的前提下有效改善算法性能;同时,能保持PSNR的风格,具有较好的前向兼容性,更适合当前视频质量评价的应用需求。因此,本算法在PSNR的算法结构上,通过引入HVS特性以改善和优化PSNR算法的性能。算法是PSNR方法与HVS特性的融合体,其评价结果较PSNR具有更好的主观相关性,能在继承PSNR优势的同时提升其性能。为便于描述,文中称之为“增强PSNR”算法,即EPSNR(Enhanced PSNR)。

2 数字视频图像的客观评价

2.1 主观评价和客观评价

视频图像质量的评价主要有两类形式:主观评价和客观评价。主观评价是以人作为图像的观察者,在一定条件下对图像的优劣进行评分,将结果按诸如“非常好:5分”、“好:4分”、“过得去:3分”、“较差:2分”、“差:1分”或“无法察觉损伤:5分”、“轻微察觉但不讨厌:4分”、“察觉且有点讨厌:3分”、“察觉且讨厌:2分”、“非常讨厌:1分”的形式分档[4]。主观评价虽简单,但需人参与评测、复杂费时且结果易因人因时而异。

客观评价由仪器或软件对质量进行评估,其评价结果具有数值性、易操作性和可重复性等特点,因此在实际应用中具有广阔的应用前景。由于人是视频图像信息最后的接收者,其对质量的感受具有最终的审判权,因此客观评价的性能结果应与人的感受为参考依据。理想情况下客观评价结果应该与主观评价结果具有尽可能接近的相似性。

2.2 峰值信噪比及其缺陷

峰值信噪比(PSNR)是目前应用最广的视频图像客观评价算法,其定义为

其中:L表示图像中的最大的像素值(如8比特的量化则L为255);M和N则分别表示图像的行和列。从式(1)可知PSNR算法是基于噪声层的评价方式,通过像素点的对比能敏感捕获两幅图像(或两端视频)在像素层面上的细微失真,因此具有很高的敏感性。然而PSNR将构成图像或视频的像素点看成是相互独立的孤立个体,忽视了各像素的局部相关性;其次,PSNR忽略了HVS对相同差异出现位置、持续时间等是具有不同视觉感受的特点,将差异的影响等价化;此外,针对视频应用中,其不仅仅是空域信号,还包括时域上的差异,传统PSNR对时域检测则显得无能为力,只能简单将各帧的结果平均处理。

3 人眼主要视觉特性

视频图像是乘载人眼感受信息的特殊数据,如果采用一般数据差异的计算方式表达劣化值势必与主观结果相偏离。所以研究视频质量的基础是人眼的主要视觉特性。

3.1 多通道及视觉阈值

人的视觉系统是一个多通道结构,它把输入的图像分解成不同感觉分量。每个感觉通道都有其自己的阈值(称之为视觉阈值),如果激励值低于通道的视觉阈值,人眼就感觉不到该激励。视觉阈值主要有空间性和时间性两大特点。空间性特点体现在视觉的空间频率响应。研究表明人眼空间感知能力具有带通和低通滤波特性,对高频部分的失真较低频失真不敏感;此外,还与目标及背景的相对亮度有很大关系。时间性特点体现在视觉的时间频率响应。研究表明其响应也类似一个带通滤波器,通常的闪烁临界范围(高过此范围,人眼感觉不出闪烁)在20∼80Hz,而相应的范围取决于显示的平均亮度;显示亮度越高,则临界范围的阈值越高。

3.2 掩蔽效应

掩蔽效应是影响上述视觉阈值的重要原因。掩蔽是指当存在多个激励时,激励间的互相干扰导致视觉阈值发生变化的现象。视觉阈值的存在使低于阈值的损伤不被觉察;而掩蔽的存在则使视觉阈值变化提升,从而能够容纳更多无法察觉的损伤。只要人眼察觉不出损伤,其造成的影响事实上可忽略不计。典型的掩蔽效应[5]主要有:“对比掩蔽”(如人眼对损伤的敏感度在非常亮或非常暗的区域下降);“纹理掩蔽”(如人眼对损伤的敏感度在图像纹理复杂区比平坦区低);“运动掩蔽”(如人眼对内容随时间变化大的图像块的损伤敏感度低);“切换掩蔽”(如场景切换后的瞬间1∼3帧,人眼对损伤的可见性下降)等。

4 基于视觉特性的处理方法

视频是一组相关图像按一定速率播放的序列。因此,本研究先分别从“帧内”和“帧间”两个角度探讨结合HVS特性的图像处理方法,最后再根据特性对整体进行融合修正。

4.1 帧内图像的处理方法

帧内图像体现了空间频率响应特性。HVS的主要特征表明,人眼对图像边缘通常格外关注。边缘能量的损失大小将很大程度上影响评价分的高低。因此,可通过边缘滤波器提取边缘信息能量,计算这些边缘点上的像素差,以突出边缘区域的误码情况。此外,人眼具有方向选择性,对水平和垂直方向的敏感度相对其他方向大。研究中我们采用水平与垂直方向的边缘滤波[6],如下式所示:

其中:g(m,n)表示在像素位置(m,n)的梯度图像;gx和gy分别表示水平向和垂直向的梯度图像。

在视频压缩及通信应用中,方块效应常是最主要的帧内图像的误码形态之一。其误码形态在待测图案中会造成较多的边缘图案。如果这些边缘闭合,则提示该部分方块与背景的对比度级差超过一定值,可能存在严重失真[6];此外,人眼对视觉兴趣区域(ROI,Range of Interest)内的图像失真比其外失真会敏感很多[7]。因此,需要判断新增方块边缘的闭合程度、区域大小及出现位置,并据此修正边缘检测索引图。在索引图参考下计算边缘图案的均方误差,如下式所示:

其中:MSEedge(k)表示第k帧的边缘像素均方误差;Sedge(i,j,k)和Pedge(i,j,k)分别表示第k帧原始图像和待测图像在(i,j)位置的边缘图;Redge(i,j,k)表示经方块效应修正后的检测索引图;Q(k)表示Redge(i,j,k)内的总像素点。

4.2 帧间图像的处理方法

帧间图像主要体现了时间轴上的响应特性[5]。根据HVS的特性,当图像运动较快时人眼无法区分图像中较高的空间频率;而在图像静止时,却能分辨高得多的空间频率。本方法在帧间图像处理上设计了两个任务:“切换点记录”和“帧率估算”。“切换点记录”的目的是记录场景切换的帧号;而“帧率估算”的目的是检测待测帧流畅性是否劣于参考帧,从而可根据流畅性指标判断是否需要对最后结果进行加权。切换点及帧率的估算采用图像的帧间差值距离度量[8],定义为

其中:k表示当前帧序号;(i,j)表示其帧内轮廓边缘的像素点坐标;Y表示图像轮廓边缘的亮度值。

场景切换通常前后亮度差较大,视觉对前后亮度差较大点亦存在较高的时域掩盖门限值;换句话说也就是对这时候出现的劣化形态较不敏感。因此,可设定一阈值(∆Yedge)max,当计算出的∆Yedge超过(∆Yedge)max,则认为该帧是处于切换点,即记录其序号k。对帧率的测量,可通过比较原始视频的∆Sedge(k)与待测视频的∆Pedge(k)是否具有线性相关性来判定。如线性相关,则说明待测视频的帧率跟原始视频基本吻合;如∆Sedge(k)值较大而∆Pedge(k)较小,则说明待测视频的帧率没有跟上原始视频,从而估算出待测视频的帧率。

4.3 整体融合与修正

在视频文件处理后,需根据HVS特性对3.1和3.2的处理进行融合和修正,修正步骤如下:

首先,根据掩盖特性在“切换点记录”修正(3),忽略场景切换点前后3帧的MSEedge(k)差值影响,可得总体的边缘MSE值及边缘PSNR值为

其次是对所得的EPSNRtp,结合估计帧率进行加权。在图像通信中,视频重建时常会用内插或重复帧的方法恢复丢帧。因此,如原视频与测试视频在一段时间内的帧率差异超过一定门限,则说明待测图像可能出现人为内插图片或画面凝固现象,因此即可通过选择质量衰减因子λ的方式来修正影响,有如下表达式:

研究表明,帧率对主观质量的影响大小常受应用场合、终端设备以及素材内容活动性等前提条件的制约。不同应用场合对帧率大小有不同的期望。如在标准电视应用场合,通常帧率要求至少25帧(PAL)/30帧(NTSC)以上;而在一些监测应用场合,其对帧率的要求则相对宽松。其次,人眼感受的闪烁临界频率会随显示设备的亮度增高而提高。较低显示亮度的显示设备(如手机、PDA等),其对帧率大小的期望往往低于CRT显示器等其它显示终端。最后不同节目内容的空域和时域运动程度都不一样。空域或时域运动较剧烈的素材常会使视频的“可接受最低压缩码率”(即低于这个压缩码率,经压缩或传输的质量常难以被主观感受接受)的门限上升,从而导致丢帧或误码的出现。因此,式(6)中加权修正系数λ的选择需根据上述前提通过事先的分类训练获得。

5 实验及讨论

5.1 测试方案设计

实验目的是验证本算法对以PSNR为代表的传统算法的性能提升能力。测试分两大部分,其一是视频文件,其二是静止图片。对每部分都分别测试PSNR值和改进PSNR值,并结合主观感受进行对比。素材的误码形态分三类:第一类劣化形态是由Matlab函数生成高斯、椒盐、泊松等误码噪声;第二类劣化形态是诸如DPSK、QPSK等调制后在不同误码等级下的劣化失真;第三类则使用诸如WCDMA、CDMA2000等完整协议栈和空中接口的综合业务仿真,本研究中采用3GPP/3GPP2的3G视频流媒体和RTP传输测试环境[9],其模版和参数如表1,其中H1和H2模式针对的是视频流媒体业务,H3-H6针对会话类业务。主观评分采用5分损伤制,并将结果转换到(0~1)区间,分值越靠近1则质量越好。

此外,为便于与主观分值进行对比,利用转换公式(7)分别将式(1)和式(6)得到的分贝单位值转换到线性单位值。其中ScoreLinear表示线性单位的分值(0~1之间,越靠近1质量越好);ScoreLog表示分贝单位值。

5.2 结果及讨论

视频和图像均采用标准测试素材,受篇幅所限取表2所示的客观结果进行分析,其中黑体部分的主观效果在图1∼图3中给出。表2中前四个劣化视频的源文件分别为carphone.qcif,container.qcif,Claire.qcif,Suzie.qcif;后三个劣化的原图片为256×256格式lena.bmp和mom&baby.bmp。

从实验数据中,可得出以下结论:一方面,本算法与PSNR算法固定数据级差问题,即本算法结果与PSNR具可比性。如图1的Suzie(H2)主观分为0.9,其PSNR结果(33.196d B/0.8939)与本算法结果(32.925d B/0.8894)基本可认为等同。另一方面,在出现方块模糊的场合,本算法具有比PSNR更敏感的捕获能力。如图2的Claire(H2),其模糊出现在非兴趣区但可明显感觉。本算法(24.51d B/0.66)相对PSNR(28.70d B/0.8)更能准确体现主观的感受效果(0.70分)。此外,在较严重的误码出现ROI区域时,本算法能敏锐地进行适当的值修正,如图3的mom&babby(DPSK平坦衰落,10^-2)仿真中,本算法(13.281d B/0.2216)比PSNR(21.323db/0.5278)更好地近似主观感受(0.2分)。

6 结论

实验表明本算法具有以下优点:首先,算法融合了视频的空域处理和时域处理,突破了传统PSNR方法只能针对静止图像检测的局限。其对视频序列的检测并不是机械地将对各帧图像的测试结果求平均,而是结合时域特性进行修正。因此,相对PSNR算法而言本算法结果充分利用了视频的时域信息。其次,算法主要的计算量在先期检测索引图像构造和后期时域信息加权修正,算法计算量并不大,因此便于实现和系统集成。此外,相关实验表明本算法比PSNR具有更好的主观相关性;且当PSNR算法与主观感受具有较好相似性时,本算法亦可得到与PSNR算法相近的数值结果。因此本算法对PSNR算法具有较好的兼容性和数值可比性,可作为PSNR方法的改进乃至替代算法加以推广和应用。

参考文献

[1]佟雨兵,胡薇薇.视频质量评价方法综述[J].计算机辅助设计与图形学学报,2006,18(5):735-741.TONG Yu-bing,HU Wei-wei.A Review on Video Quality Assessment Methods[J].Journal of Computer-Aided Design&Computer Graphics,2006,18(5):735-741.

[2]VQEG.Final report from VQEG on the validation of objective models of video quality assessment[EB/OL].http://vqeg.its.bldrdoc.gov,2000.

[3]VQEG.Final report from VQEG on the validation of objective models of video quality assessment II[EB/OL].http://vqeg.its.bldrdoc.gov,2003.

[4]ITU-T.Objective perceptual assessment of video quality:Full reference television[EB/OL].Switzerland:ITU-T Telecommunication Standardization Bureau(TSB),http://vqeg.its.bldrdoc.gov,2004.

[5]Weisi Lin,Li Dong,Ping Xue.Visual distortion gauge baseds on discrimination of noticeable contrast changes[J].IEEE Transations on Circuits and Systems for Video Technology,2005,15(7):900-908.

[6]ITU-T.Recommendation J.144(Rev.1)-Objective perceptual video quality measurement techniques for digital cable television in the presence of a full reference[EB/OL].http://www.itu.int/itudoc/itu-t/aap/sg9aap/history/j144/index.html,2004.

[7]邢昕,沈兰荪,汪孔桥.一种基于视觉兴趣性的图像质量评价方法[J].中国图象图形学报,2000,5(4):300-303.XING Xin,SHEN Lan-sun,WANG Kong-qiao.A Quality Assessment Method of Image Based on Visual Interests[J].Journal of Image and Graphics,2000,5(4):300-303.

[8]S.Wolf and M.Pinson.Video quality measurement techniques[EB/OL].www.its.bldrdoc.gov/n3/video/documents.htm,2002.

HVS模型篇5

伴随多媒体技术和网络技术的发展，多媒体产权保护也成为热门话题。数字水印技术作为产权保护的有效办法引起人们极大的兴趣，同时也取得了较大的发展。

数字水印应当具有可证明性、不可见性和鲁棒性，也就是说数字水印能为版权保护提供可靠的证据，同时如果把数字水印看作一种有用的噪声，水印嵌入不能够影响载体的质量，使载体降质。除此以外，数字水印要保证在载体受到某种处理后仍能够正确检测到，从而做到识别版权功能。

数字水印的分类方法很多，按照水印嵌入位置的不同，数字水印可划分为(时)空域水印和变换域水印。(时)空域数字水印方法是直接在信号空间上叠加水印信息(如LSB算法)，变换域数字水印包括在DCT域、DFT域和小波变换域上叠加水印。而本文是基于小波变换的时-频特点，在图像小波域上叠加水印，并根据人类视觉对亮度和纹理的掩蔽特点，以及根据HVS(人眼视觉系统特性)，将不同强度的水印信息嵌入到代表不同亮度和纹理特性的小波系数中，平衡水印的鲁棒性与不可见性，并针对JPEG、加噪、中值滤波等图像处理来检测水印的鲁棒性。

1 水印的嵌入与提取原理

1.1 水印的嵌入

水印的嵌入就是把水印信号W={w(k)}嵌入到原始载体信息X={x(k)}，嵌入原如图一所示。

其中，X’表示生成的带有水印信息的对像，用X’=E(X,K,W)(E为嵌入算法)。这里基于对水印稳健性的考虑，可以通过密钥K对水印进行置乱或加密等预处理，从而使水印不易受攻击。本文将一个二值图像作为水印信息嵌入到一幅载体图像中，作为版权的标识。

1.2 水印的检测

水印的提取和检测是从嵌入水印的载体中X’=(x’(k))中提取水印信息或检测水印是否存在。水印检测是水印算法中最为重要的一步，其原理如图二所示。

设待测信息为X*，D为解码函数，则有:

或者

其中，W*为提取出的水印;K为密钥;C为水印的检测算法;δ为检测阈值。

2 DWT分解图像的特点

假设原始图像为I(x,y)经过二层离散小波变换后，得到变换系数如图三所示，图四则是对应小波系数的量化图像。

由图三、图四可知，左上角(LL2)最低频段滤波的低尺度逼近，图像的能量主要集中在低频部份，而水平、垂直和对角部份能量较少。低频部份可以称作亮度图像，水平、垂直和对角部份可以称作细节图像。从图四可以看出，细节图像中包含了图像的纹理或边缘。基于DWT分解的低频段集中了图像的大部份能量，在低频段嵌入水印不易受到攻击，本文提出的算法选择在低频部份嵌入水印。

3 根据HVS特点实现水印算法

由于在小波低频段集中了图像的主要能量，在这部份加入的水印信息量太大会导致图像质量下降，这就必须考虑到人类视觉的特性。根据HVS的视觉掩蔽性和纹理掩蔽性，在图像的高亮度、低亮度或强纹理区域，水印的可见性门限越高，即可以在图像的高亮度、低亮度或强纹理区域嵌入较高强度的水印信息。因此，对于低频系数LLk(k小波变换的的层数)，根据亮度和纹理性可将其分为四类:具有较高强度和较强纹理系数作为第一类，记作R1;具有低强度和较强纹理系数作为第二类，记作R2;具有中等亮度和弱纹理系数作为第三类，记作R3;其它作为第四类，记作R4。显然R1、R2区域门限较高，R4的门限次之，R3的门限最低。

对于LLk层集中了图像的亮度信息，确定阈值T1、T2，如果abs(LLk(i,j))>T1，则LLk(i,j)处在高亮度的区域，其中LLk(i,j)表示处在第k层小波变换，坐标为(i,j)点的小波系数;如果abs(LLk(i,j))

对于LLk纹理性强弱判定，设阈值T3、T4限确定，采用文献[1]的判别方法，取对应层的中频系数HLk。如果HLk(i,j)>T3，表示同层LLk(i,j)的系数是处在强纹理区域;如果HLk(i,j)

T1、T2、T3、T4的取值用如下的公式估算得到:

其中，Max取最大值，Ave为取平均值，||表示取平均值。

水印嵌入方法，采用乘法原则，公式如下:

其中，LLk(i,j)为坐标(i,j)的第K层低频系数值，LL'k(i,j)嵌入水印后的低频系数，a1、a2、a3、a4的值可由实验给出。本文中取a1=0.023,a2=0.022,a3=0.01,a4=0.016，通过式(3)得到嵌入水印后的小波系数，然后对修改后的小波系数进行小波逆变换，最终生成嵌有水印的图像。

3.1 水印的嵌入步骤

(1)水印的预处。为了便于检测，先将二值水印图像W按照式(4)进行值转换，设转换结果为W1，然后对W1进行置乱。这里采用Arnold置乱方法，具体的方法可以参考文献[4]。

(2)对原始载体图像进行三层离散小波变换，计算出阈值T1、T2、T3、T4的值。

(3)将置乱后的水印图像按照公式嵌入到LL3的小波系数中。

(4)将修改后的小波系数进行小波逆变换，生成嵌有水印的图像，完成水印的嵌入。

3.2 水印的检测

(1)将原始载体图像和待测图像分别进行三层离散小波变换，根据原始图的LL3、HL3，计算阈值T1、T2、T3、T4。

(2)根据式(3)的逆运算计算出水印信息W2。

(3)根据W2中值的正负来判别水印图像灰度值为1或0，将得到结果记为W3。然后将W3进行Arnold变换，最终恢复成水印信息W*。

采用PSNR(峰值信噪比)来计算图像的失真程度。PSNR的值越大，表示嵌入水印的质量越好，反之则较差。

同时用NC表示提取水印与原始水印的相似程度。NC的表达式如式(5)所示：

其中，W表示原始水印信息，W*为从待测的图中提取出的水印信息。NC的值越向1靠近，表示所提取的水印与原始水印越相似。

3.3 实现结果

实现采用512×512(256级灰度)的lena图像作为水印载体图像，水印图像为64×64的二值图像，算法中对水印图像进行Arnold 10次置乱，小波基选haar小波。实现结果如图五、图六所示。图五为嵌有水印后的载体图像PSNR=44.425，图六为提取出的水印图像与原水印图像。

下边是水印鲁棒性检测结果

上图中，图七～九是对加水印图像(图五所示)进行质量分别为8,5,3的JPEG压缩后提取出的水印图像，NC的值分别为0.9888,0.9570,0.9100;图十是加入3%的高斯噪声PSNR=29.8462所提取出的水印图像，NC=0.8404;图十一是将加水印图像剪掉周围75%(将周灰度值置0，只保留中间25%部份)后所提取出的水印图像，PSNR=6.5690,NC=0.4918;图十二、十三分别是5×5,7×7中值滤波后所提取出的水印图像，PSNR分别为31.6037,29.4305,NC值分别为0.6945,0.5107。由实现结果可知，本算法具有较强的鲁棒性。

4 结束语

本文在参考前人提出的数字水印算法的基础上，提出了一种基于HVS的数字水印算法，在保证图像不太失真和水印不可见性的情况下，将不同强度的水印信息嵌入代表到不同亮度和纹理性的小波系数，并检测了针对JPEG、加噪、中值滤波等操作后水印仍具有较强的鲁棒性。但是针对多种操作同时对水印进行攻击，水印的鲁棒性会有所下降，同时，水印的检测过程需要原始载体图像，这些是算法有待改进的地方。

参考文献

[1]王卫卫,杨波,宋国乡.基于图像小波变换的自适应数字水印[J].计算机科学,2002,01(05).

[2]王炳锡,陈琦,邓峰森.数字水印技术[M].西安:西安电子科技大学出版社,2003.

[3]刘明才.小波分析及其应用[M].北京:清华大学出版社,2005.

[4]孙新德,路玲.Arnold变换在数字图像水印中的应用研究[J].信息技术,2006.

[5]Tsai Injen.Joint Wavelet and Spatiral Trans-formation for Digital Watermarking[J].IEEE Trans.One Consumer Electonic,2000.

HVS模型篇6

随着信息技术的不断发展和网络的日益普及,数字产品的发布和获取变得越来越容易,人们可以通过网络轻而易举地得到他人的数字产品,甚至可以在未经作者同意的情况下对他人的数字产品进行修改和再传输等,这必将对原创作品的版权和所有权构成巨大的威胁,因此数字产品的版权保护问题是一个非常紧迫的课题。

数字水印是能够保护信息安全、实现防伪溯源和保护版权的一种有效办法。从载体上看,可分为图像水印、音频水印、视频水印、文本水印等。从水印的嵌入位置上看,可以分为时(空)域水印、频域水印、时/频域水印和时间/尺度域水印等。对于图像来说,空域水印就是通过直接修改图像的灰度值来嵌入水印[1]。频域水印就是先对载体图像做某种变换,然后通过修改其变换系数来嵌入水印[2]。目前比较流行的是小波域内数字水印算法,但小波域的水印算法抵抗各种仿射变换攻击的能力比较差[3,4],而基于分形图像压缩算法能够较好地抵抗仿射变换攻击[5];由于图像经过小波变换后的系数具有很好的相似性,而分形可以充分利用图像的自相似性,所以小波变换与分形技术相结合,可以优势互补,取长补短。据此,本文提出了一种基于分形的小波域水印算法,将分形技术和小波变换二者有机结合,同时利用人类视觉系统来控制水印嵌入的强度,以增强水印的不可见性。本算法在水印嵌入时并没有嵌入全部水印信息,减少了嵌入到载体图像中的水印信息量,既能使水印的不可见性得到很好的提高,又能保证在图像受到各种干扰时水印可以得到较好的保存,增强了水印的鲁棒性和安全性。

2 水印信号处理[6]

当采用的水印信号为一副图像时,为了增强其安全性,可用Arnold变换对其进行置乱。置乱的目的是将图像水印变得杂乱无章,使别人在不知道变换过程的情况下,不能获得水印,从而提高水印的安全性。Arnold变换为:

式中右端(x,y)T为原始图像水印点的坐标,左端(x’,y’)T为变换后的坐标,图像水印大小为N×N,其迭代过程如下:

式中n代表迭代的次数。因为N×N个像素所能表现的图像是有限的,所以迭代过程呈周期性T,变换T次之后又会还原成原始水印。

3 同方向小波树及小波域内人类视觉系统模型

3.1 同方向小波树

对一幅给定的图像,利用Haar小波变换对其进行分解,构建小波树。同方向小波树是由同一方向、不同分辨率且具有相同的相对空间位置的高频小波系数构成的树状结构,如图1所示(以三级小波分解为例),各方向子带中白色方块组成的树状结构即为同方向小波树。小波分解后的高频小波系数被分成三类同方向小波树:水平方向低频和垂直方向高频的小波树;水平方向高频和垂直方向低频的小波树;水平和垂直方向均含高频的小波树。

3.2 小波域内人类视觉系统模型

以四级小波分解为例,记Slθ为一个分解子带,其中l={0,1,2,3}表示分解尺度,θ={0,1,2,3}表示不同的方向,S33代表的是第四层分解的低频子带,其小波分解如图2所示:

图像小波域内的人类视觉系统HVS模型为[7]:

式中,A(l,θ)反映了人眼对不同频率部分的噪声敏感度不同(频率掩盖效应),其计算公式为:

式中,B(l,i,j)反映了人眼对不同亮度区域的噪声敏感度不同(亮度掩盖效应),其计算公式为:

式中,C(l,i,j)反映了人眼对纹理复杂的区域的噪声不敏感(纹理掩盖效应),其计算公式为:

人类视觉系统HVS模型综合考虑了人类视觉在不同频率、不同亮度以及不同纹理复杂度区域的敏感性差异,为水印的嵌入强度和嵌入位置提供了较好的依据。

4 水印嵌入算法

(1)嵌入域子树的确定[8]

对载体图像进行L层小波分解,构造同方向小波树,然后在三类同方向小波树中分别定义值子树和域子树。域子树Di是从第L级开始的同方向小波树,值子树Rj是从第L-1级开始的同方向小波树。由于域子树的一级小波系数所集中的能量相对于其他几个父节点的能量要小得多,所以略去第一级小波系数,使其与值子树的大小相同。在构造完域子树和值子树集合之后,用分形匹配的方法搜索给定的值子树Rj对应的最佳匹配的域子树Di,将搜索区域限定为与Rj同方向的各域子树,搜索过程如下:

①由于域子树和值子树都有三个节点,一共有21个系数,将这21个系数排成一个行向量,进行分形匹配时,首先搜索水平方向低频和垂直方向高频的第一个值子树R1的最佳匹配,计算R1与其处在同一方向的所有域子树的均方误差,选取均方误差最小值所对应的域子树就是R1最佳匹配的域子树。值子树R1与域子树D1间的均方误差定义为:

②用同步骤①的方法搜索R1所在方向的其他值子树对应的最佳匹配域子树。

③用同步骤①②的方法搜索其他方向子带值子树对应的最佳匹配域子树。在各个方向子带的匹配结果中选择均方误差最小的前M(M的值根据要嵌入的水印的大小进行取定)个域子树来进行水印的嵌入。

(2)图像水印的处理

本文选取的图像水印是一个二值图像W。利用Arnold变换将图像水印置乱,记录变换的次数。对Arnold变换后的图像水印进行L级小波变换,得到一个低频子图系数和三个方向上的高频子图系数,构造同方向小波树。将从第L层开始的同方向小波子树作为嵌入部分水印,忽略第一层的小波系数得到与域子树同样大小的小波子树。将第L层的低频系数和第一层三个方向的高频系数作为密钥保存起来。

(3)利用小波域内HVS模型嵌入水印

确定了可嵌入域子树之后即进行水印的嵌入,将图像水印的小波子树和原始图像同一方向的嵌入域子树系数进行融合,方法如下:

其中,Slθ(i,j)和Sl*θ(i,j)分别为水印嵌入前和水印嵌入后域子树Di的系数,qlθ(i,j)是小波域内点(i,j)处人类视觉系统HVS值,w(i,j)是与域子树Di同方向的水印信号,α为控制嵌入强度因子。

(4)将嵌入域子树的位置、系数及对应的HVS值保存。对嵌入水印信息的小波系数逆过程进行L层小波变换,即得到嵌入了水印的图像。

5 水印的提取

(1)读入水印嵌入过程中保存的参数。

(2)对待检测的图像进行L级小波分解,并根据读入的嵌入位置确定有水印信息的小波系数Sl*θ(i,j)。

(3)水印信息提取公式如下:

(4)然后根据读入的图像水印的第L层低频系数和第一层三个方向的高频系数将图像水印进行逆向小波变换,还原图像水印。

6 实验结果与分析

本文在Matlab2014a平台下进行仿真实验,选取的载体图像是256×256×8的灰度图像,图像水印为128×128的二值图像,进行小波变换时用的是Haar小波基,进行四层小波变换,经多次实验结果对比得出,α=0.05时水印的不可见性和鲁棒性较好。

通过对载体图像和嵌入水印之后的图像进行对比,发现水印嵌入后图像并没有明显变化,即算法具有较好的不可见性。

下面,本文对水印图像采取不同方式的攻击进行仿真实验,检验算法的鲁棒性。

(1)椒盐噪声攻击

在图像攻击中,椒盐噪声是一种比较有代表性的攻击方式。下面对水印图像加入强度为0.05的椒盐噪声,实验结果如图5所示,虽然图像质量已经明显下降,但是提取到的水印仍然很清晰。

(2)图像锐化处理

为了加强图像中的景物边缘和轮廓,经常需要对图像进行锐化处理,下图为对水印图像锐化攻击后的实验结果。从图6中可以看出,经过锐化之后,提取得到的水印还是很清楚。

(3)高斯低通滤波

经过高斯低通滤波,水印图像的一些细节信息遭到破坏,使得图像变得比较模糊,但提取的水印经仔细辨认仍然可以识别出来。

(4)JPEG压缩攻击

下图是水印图像经过JPEG压缩40%得到的,从图8中可以看出,经过压缩之后,图像变得模糊一部分,但是提取到的图像还是能够被辨认出来。

(5)剪切攻击

剪切攻击是一种常见的较强的几何失真攻击方式,剪切比例定义为剪切的区域宽度除以载体图像的宽度。当嵌入水印之后的图像被剪切之后会丢失部分信息,将会导致提取到的图像水印信息不全,剪切比例越大,提取到的图像水印越不清楚。

(6)图像旋转

旋转攻击是一种比较强的攻击形式,在对旋转之后的图像提取水印时,先将图像逆向旋转相同角度之后再进行水印提取。下图为水印图像经过旋转20o之后的实验结果,从图10中可以看出,经过旋转之后,仍然可以从水印图像中提取出较理想的图像水印。

通过以上六种不同方式的攻击可以看出,图像经过不同方式的攻击之后,从提取到的图像水印中,依然能够辨别出来图像水印中的字体,说明该算法具有较强的鲁棒性。

7 结束语

本文提出了一种基于分形和HVS的小波域水印算法,该算法融合了小波的多分辨率特性和分形抵抗仿射变换的优点,充分利用人眼的视觉敏感性,同时只嵌入部分水印信息,保留部分水印信息,减少了嵌入到载体图像中的水印的信息量,水印的不可见性得到了很好的提高;保证了图像受到各种干扰时,水印信息可以得到较好的保存,较好地解决了水印不可见性和鲁棒性之间的矛盾。

参考文献

[1]L.J Cox,J.Kilian,F.T Leighton,et at.Secure Spread Spectrum Watermarking for Multimedia[J].IEEE Trans on Image Processing,1997,6(12):1673-1687.

[2]王卫卫,杨波,宋国乡.基于图像小波变换低频系数的数字水印算法[J].信号处理,2001,17(6):554-559.

[3]Li Shao_fa,Yu Mian_shui,Yuan Li_yu.A wavelet_fractal hybrid code[J].华南理工大学学报(自然科学版),2001,29(10):42-46.

[4]Meng Wu,Ahmad M O,Swamy MNS.A new fractal zerotree coding for wavelet image[C].Geneva,Swizerlandm:IEEE International Symposium on Circuits and Systems,2000:21-24.

[5]Werner D,Ganguly S.An overview of fractal antenna engineering research[J].IEEE Antennas and Propagation Magazine,2003,45(1):45-49.

[6]高占威,张永梅,刘聪,等.基于Arnold置乱的小波变换数字视频水印[J].电脑开发与应用,2011,25(1):67-68.

[7]张宪明.小波域内基于分形理论的图像数字水印算法研究[D].青岛:青岛大学,2005.

【HVS模型】推荐阅读：

模型组织07-14

提升模型07-15

稳态模型07-17

演示模型07-17

机翼模型07-18

接头模型07-18

农户模型07-19

平均模型05-08