数字图像融合综述

2024-08-14

数字图像融合综述（精选7篇）

数字图像融合综述篇1

0 引言

二十世纪九十年代以来,图像融合技术的研究呈不断上升的趋势,应用领域也遍及遥感图像处理,可见光图像处理,红外图像处理,医学图像处理等。尤其是近几年来,多传感器图像融合技术已成为机器人,智能制造,智能交通,医疗诊断,遥感,保安,军事应用等领域的研究热点问题。

1 数字图像融合的主要研究内容

数字图像融合是将两个或者两个以上的传感器在同一时间(或不同时间)获取的关于某个具体场景的图像或者图像序列信息加以综合,以生成一个新的有关此场景的解释,而这个解释是从单一传感器获取的信息中无法得到的。图像融合的目的是减少不确定性,其作用包括:(1)图像增强。通过综合来自多传感器(或者单一传感器在不同时间)的图像,获得比原始图像清晰度更高的新图像。(2)特征提取。通过融合来自多传感器的图像更好地提取图像的特征,如线段,边缘等。(3)去噪。(4)目标识别与跟踪。(5)三维重构。

2 图像融合研究的发展现状和研究热点

多传感器图像融合是一个正在兴起的,并有着广泛应用前景的研究领域。当前图像融合在特征级的研究重点在于提高融合图像的空间分辨率的同时,尽量保持原图像的光谱特征,从而保证后续分析理解的有效性。另外,图像序列以及视频信息的融合问题也是非常有意义的研究课题。

3 几类典型的数字图像融合理论与方法

3.1 主成分分析法

主成分分析法的几何意义是把原始特征空间的特征轴旋转到平行于混合集群结构轴的方向去,得到新的特征轴。实际操作是将原来的各个因素指标重新组合,组合后的新指标是互不相关的。在由这些新指标组成的新特征轴中,只用前几个分量图像就能完全表征原始集群的有效信息,图像中彼此相关的数据被压缩,而特征得到了突出。

3.2 演化计算法

演化计算是模拟自然界生物演化过程产生的随机优化策略与技术。它具有稳健性,通用性等优点和自组织,自适应,自学习等职能特征,下面是几种常用的演化计算方法:

3.2.1 遗传算法GA(genetic algorithm)

遗传算法的基本思想是基于达尔文进化论和孟德尔遗传学说的。所以在算法中要用到进化和遗传学的概念,比如串(在算法中为二进制串,对应于遗传学中的染色体);群体(个体的集合,串是群体的元素);基因(串中的元素,如有一个串S=1001,其中1,0,0,1这四个元素分别成为基因);基因位置;串结构空间;参数空间;非线性;适应度等。遗传算法的原理可以简要给出如下:Choose an initial population;Determine the fitness of each individual;Perform selection.Repeat:Perform crossover;Perform mutation;Determine the fitness of each individual;Perform selection;Until some stopping criterion applies.

这儿所指的某种结束准则一般是指个体的适应度达到给定的阈值,或者个体的适应度的变化率为零。

3.2.2粒子群算法(PSO)

粒子群优化算法是一种进化计算技术,源于对鸟群捕食的行为研究。设想有这样一个场景:一群鸟在随机搜索食物,在这个区域里只有一块食物,所有的鸟都不知道食物在哪里,但是他们知道当前的位置离食物还有多远,那么找到食物的最优策略是什么呢?最简单有效的方法就是搜寻目前离食物最近的鸟的周围区域。PSO算法从这种模型中得到启示并用于解决优化问题。PSO中,每个优化问题的解都是搜索空间中的一只鸟,我们称之为“粒子”。所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定他们飞翔的方向和距离,然后粒子们就追随当前的最优粒子在解空间中搜索。PSO初始化为一群随机粒子(随机解),然后通过迭代找到最优解。

3.2.3 蚁群算法

蚁群算法(ant colony optimization,ACO),又称蚂蚁算法,是一种用来在图中寻找优化路径的机率型技术。它由Marco Dorigo于1992年在他的博士论文中引入,其灵感来源于蚂蚁在寻找食物过程中发现路径的行为。蚁群算法是一种求解组合最优化问题的新型通用启发式方法,该方法具有正反馈、分布式计算和富于建设性的贪婪启发式搜索的特点。

3.3 神经网络法

神经网络法是在现代神经生物学和认知科学对人类信息处理研究成果的基础上提出的,它有大规模并行处理、连续时间动力学和网络全局作用等特点,将存储体和操作合二为一。现实世界中图像噪声总是不可避免地存在,甚至有时信息会有缺失,在这种情况下,神经网络融合法也能以合理的方式进行推理。

3.4 小波变换法

自从1989年Mallat提出了二维小波分解方法后,小波变换在图像处理中迅速得到了广泛的应用。在图像融合领域,小波变换方法也是一种重要的方法。对于图像融合,在频率域进行比在时间域进行更为有效,融合算法的设计必须把融合的技术目的和图像的频率域表现结合起来考虑。

3.5 模糊图像融合

所谓模糊性是指客观事物在形态及类属方面的不分明性,其根源是在类似事物间存在一系列过渡状态,它们互相渗透,互相贯通,使得彼此之间没有明显的分界线。图像融合模糊算法的基本原理是利用模糊隶属度函数量化不同目标类型和相应像素值之间的关系。

4 结束语

图像融合是一个众多学科感兴趣的十分活跃的研究领域。图像融合也还有许多问题急需解决。首先,图像融合技术缺乏理论指导。虽然关于图像融合技术的公开报道很多,但每篇文章都是针对一个具体的应用问题,对图像融合技术还没有一个统一的理论框架。所以,建立图像融合的理论框架是目前的一个发展方向。再者由于图像的特殊性,在设计图像融合算法时一定要考虑到计算速度和所需的存储量,如何得到实时、可靠、稳定、实用的融合算法和硬件电路是目前研究的一个热点。另外,建立客观的图像融合技术评价标准也是急需解决的问题。

参考文献

[1]覃征等.数字图像融合[M].西安交通大学出版社,2004.

[2]吴秀清,周蓉.一种多分辨图像数据融合方法及实现[M].小型微型计算机系统,2002,21(8):833-835.

[3]王耀南,李树涛.多传感器信息融合及其应用综述[J].控制与决策,2001,16(5):518-522.

数字图像压缩综述篇2

数字图像压缩的概念

在当前这个信息化社会中, 多媒体技术已被人们频繁使用, 多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一, 发挥着越来越重要的作用;而传输图像需要占用大量的数据空间, 严重影响传输速率和实时处理量, 因而我们要将图像进行压缩, 来解决这一问题。

数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术, 图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息, 提高传输速率, 节省存储空间。

1 发展现状

目前数字图像压缩已取得了划时代的发展, 在国际上形成了一系列国际标准, 如JPEG标准。此标准是负责开发静止图像压缩标准的“联合图片专家组”于1989年形成的基于自适应DCT的JPEG技术规范的第一个草案, 后经多次修改, 最终在一年后形成国际标准。随着多媒体应用的不断增长, 为满足人们在图像压缩领域的迫切需要, 于2000年联合图片专家组又研究出新一代静态图像压缩标准——JPEG2000。系列的国际标准的提出标志着数字图像压缩技术已由学术研究转为产业化, 逐步走向成熟。它使通信、广播、计算机产业的界限变得模糊, 促使现有信息产业的结构发生巨大改变, 当前分形图像压缩和小波图像压缩是研究的新方向。

2 图像压缩基本方法

图像压缩有两种基本的压缩方法:一种是有损数据压缩;另一种是无损数据压缩。有损数据压缩一般采用变换编码方法, 例如, 基于离散余弦变换 (DCT) 的变换编码方法, 如JPEG;还有基于小波变换的方法, 例如JPEG2000、EZW、SPIHT等等。JPEG是有损数据压缩。通过DCT变换后选择性丢掉人眼不敏感的信号分量, 实现高压缩比率。PNG是无损数据压缩中图片压缩常采用的格式, 采用LZ77派生的无损数据压缩算法。而音频压缩格式Fl LAC、TTA和视频压缩格式HUFFYUV也是无损数据压缩常采用的压缩格式。

2.1 有损数据压缩

有损数据压缩是一种破坏性压缩。它在压缩过程中, 允许有一定信息的失真, 但此失真对原图像影响较小, 得到一个与原图像相近似的图像, 但压缩比却大大提高了。有损数据压缩常用于因特网、流媒体、视频以及电话领域。有损数据压缩方法有色彩空间、色度抽样、变换编码、分形压缩。

2.2 无损数据压缩

无损数据压缩采用数据的统计冗余进行压缩, 使数据通过其压缩后信息没有受到损失, 均可还原到压缩前的原样。比如在工程制图、计算机程序、医疗图像、指纹图像等方面此方法得到广泛应用。经常使用的无损压缩方法有Shannon-Fano编码、Huffman编码、游程 (Run-length) 编码、LZW (Lempel-Ziv-Welch) 编码和熵编码法等。无损压缩的优势有100%的保存, 没有任何信号丢失;音质高, 不受信号源的影响;转换方便。无损压缩的不足是缺乏硬件支持, 占用空间大, 压缩比不高。

3 图像压缩算法

比较常用的数字图像压缩方法有:基于傅立叶变换的图像压缩算法、基于离散余弦变换的图像压缩算法、基于小波变换的图像压缩算法。此外还有NNT (数论变换) 压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等。下面简单介绍近年来任意形状纹理编码的几种算法。

3.1 形状自适应离散小波变换

SA-DWT编码主要包含SA-DWT和零树熵编码的扩展以及嵌入式小波编码 (EZW) 。

其中经过SA-DWT之后的系数个数, 同原任意形状可视对象的像素个数相同;EZW则是采用渐进式量化和嵌入式编码, 算法复杂度低, 打破了常规, 即使用低复杂度的算法就可以完成高效的压缩编码器的编码。

3.2 Egge r方法

Egger方法使用了小波变换的局域特性, 把可视对象的行像素推到与边界框的右边界相平齐的位置, 然后对每行的有用像素进行小波变换, 接下来再进行另一方向的小波变换。此方法可能引起重要的高频部分同边界部分合并, 不能保证分布系数彼此之间有正确的相同相位。

3.3 形状自适应DCT (S A-DCT) 算法

SA-DCT把一个任意形状可视对象分成的图像块, 对每块进行DCT变换, 它实现一个类似于形状自适应Gilge DCT变换的有效变换, 但它比Gilge DCT变换的复杂度要低。可是, SA-DCT也有缺点, 它把像素推到与矩形边框的一个侧边相平齐, 因此一些空域相关性可能丢失, 这样再进行列DCT变换, 就有较大的失真了。

4 结论

今天, 数字图像压缩技术取得了卓越的成果, 它广泛应用于网络互联、媒体传播、医疗图像等生活的各个方面, 由于它的存在, 使我们大大减少了传输数量, 提高了通信速率, 使生活更加便捷, 同时也使多媒体技术上了一个新的台阶, 数字图像压缩技术在更深更广层次上的应用值得我们进一步研究。

参考文献

[1]刘方敏等.JPEG2000图像压缩过程厦原理概述[J].计算机辅助设计与图形学报, 2002.

[2]T Sikora, B Makai.Shape-adaptive DCT for genericcoding of video[J].IEEE Trans.Circuits Syst.Video Technol., 1995, 5 (1) :59-62.

[3]M Bi, S H Ong, Y H Ang.Comment on“Shape-adaptiveDCT for generic coding of video”[J].IEEE Trans.CircuitsSyst.Video Technol., 1996, 6 (6) :686-688.

[4]P Kauff, K Schuur.Shape-adaptive DCT with block-basedDC separation and Delta DC correction[J].IEEE Trans.CircuitsSyst.Video Technol., 1998, 8 (3) :237-242.

[5]吴乐南.数据压缩[M].电子工业出版社, 2005.

[6]张晓娣等.新一代的静止图像压缩标准JPEG2000[J].电信科学, 2001.

数字图像处理技术研究综述篇3

关键词：数字图像,修复技术,图像处理,算法模型

0 引言

图像处理技术分为模拟图像处理(Analog Image Pro-cessing)和数字图像处理(Digital Image Processing)两大类。数字图像处理指将图像信号转换成数字信号并采用计算机等硬件设备进行处理的过程。目的在于恢复图像的本来面目,改善人们的视觉效果,突出图像中目标物的某些特征,提取目标物的特征参数,以方便后续的图像存储、传输等操作。

1 数字图像处理技术发展

数字图像处理最早起源于上世纪20年代[1]。巴特兰电缆图片传输系统实现了将图片横跨大西洋的传输时间从10余天缩短到3小时。首次获得巨大成功的事件是美国喷气推进实验室利用该技术处理航天探测器徘徊者7号发回的大量月球照片,描绘出了月球的表面地图、地形图、彩色图及全景镶嵌图。

另一个巨大成功体现在医学上,1972 年英国EMI公司的工程师们使用该技术发明了用于头颅诊断的X射线计算机断层摄影装置CT,后又成功研制出用于全身的CT装置,可获得人体各部位的断层图像。从70年代中期开始,由于计算机技术和人工智能等技术的快速发展,极大地推动了数字图像处理技术的进步,数字图像处理技术已经成为一门获得广泛关注并拥有广阔前景的新型学科。

2 数字图像处理技术特点

(1)能进行复杂运算且处理精度高。图像处理工具主要是计算机及相关硬件设备,能完成人类无法完成的工作。现有技术手段能够将模拟图像数字化,转化为特定大小的多维数组,然后通过硬件设备把每个像素的灰度等级量化,也即人们常说的8位/16位图像,甚至更高位图像。

(2)再现性好。图像在数字化时不会因为图像的存储、传输或复制等一系列变换操作而导致图像质量退化,经过数字图像处理的一系列过程能够较好地再现图像。

(3)应用面广[2]。数字图像处理技术发展至今已近百年,现已广泛应用于各个领域。上到遥感、航空航天,下到利用数字图像处理软件(如MTALAB、Photoshop)修复图片、自制个性化照片等。其应用领域主要包括:生物医学工程、通信工程、工业工程、军事公安、机器人视觉以及各种日常用途,如视屏编辑、广告设计与制作、发型设计、老/旧照片修复、金融银行、建筑设计等。

(4)适用面宽。图像信息来源多样、分布广。小到电子显微镜、大到天文望远镜的图像,即使不同来源、不同大小,都可以按照数字图像处理的原理和流程转化为数字信号后进行编码。其原理和处理过程大同小异,大部分用多维数组表示,最后由计算机等硬件设备进行处理。

(5)灵活性高。数字图像处理将图像信号转换成数字信号后,能够利用数学手段和数学工具进行运算处理,既能完成相关的线性运算,又能实现非线性处理。

3 数字图像处理主要内容

数字图像处理研究内容主要包括:图像获取(Image acquisition)、图像重建(Image Reconstruction)、图像增强(Image Enhancement)、图像恢复(Image Restoration)、图像压缩/编码(Image Compression/Encoding)、图像多分辨率处理(Image Multi-resolution Processing)等[3]。

(1)图像获取。图像获取即物体成像并将模拟图像转换成数字图像的过程。为了满足人们正常使用的需要,需在计算机等硬件设备上对图像进行加工处理。其中图像获取至关重要,它是后续图像处理的关键前提,并且获取图像的质量好坏直接影响到后续处理与识别效果。该步骤通常由扫描仪、摄像机等获取图像的物理设备完成。

(2)图像重建[1]。通过对物体外部进行测量获得数据,并经数字图像处理后获得多维物体形状信息的技术。其原理较为简单,也可以用直观的方法来描述。图像重建中最早与最广泛的应用是X射线计算机断层CT。

(3)图像增强。利用数学方法和变换手段等方法,改善视觉效果,提高图像的对比度、清晰度,并突显图像细节和感兴趣的部分,为后续的图像处理操作提供更好的辨识度。图像增强包括图像变化、滤波等,实现图像增强的技术[4]主要有:基于单一图像自身的增强和基于多幅图像融合所进行的增强。

现阶段图像增强的主要算法有两种类型:空域算法和频域算法。前者直接对某一点的像素值作特定操作以获得图像增强的效果,例如灰度变换、直方均衡、直方匹配等;后者则首先将图像转换到频域,即傅立叶变换,然后再进行傅立叶逆变换,从而得到增强后的图像。

(4)图像恢复包括图像的复原、修复、补全等。在图像获取、复制等过程中可能导致信息丢失,最后造成图像缺损,无法满足视觉和正常使用要求,把这类缺损的图像恢复到真实图像的过程即图像复原。

现阶段采用的主要技术手段有:基于变分偏微分方程修复技术、基于纹理合成修复技术和基于图像分解的修复技术等[5]。基于偏微分方程思想的修复技术对尺度较小的图像缺损很有效。代表算法模型有:TV(Total Varia-tion)模型、BSCB模型、三阶偏微分方程的CDD(Curvature Driven Diffusions)模型、P-Laplace修复模型、Mumford-Shah模型、Mumford-Shah-Euler模型以及基于结构张量的修复模型等。利用纹理合成原理修复大块丢失信息的图像比较有优势。其主要思想在于寻找合适的像素点,后根据图像的相似纹理特征,用最相近的纹理配块填充修补区域。此外,还有将图像分解为结构部分和纹理部分,用PDE修复算法处理结构部分、用纹理合成方法处理纹理部分的基于图像分解的修复技术,其本质是将PDE修复技术和基于纹理合成技术相结合。有学者提出采用全变分将图像的结构部分分离出来,后用一个震动函数对纹理部分建模,再用BSCB模型修补结构部分,用非参数采样纹理合成技术填充纹理部分,最后叠加各自的修复效果以得到最终的修复图像。

(5)图像编码/压缩。根据相应规则对数字化图像进行排列、运算等操作的过程,称为图像编码。根据图像内在特性,通过特殊的编码方式,减少原图像数据时、空占用量的处理称为图像压缩。由于数字图像中各个像素不分离,且相关性大,因此图像处理中信息压缩的潜力很大[6]。

4 数字图像处理技术面临的挑战

(1)设备要求高。现阶段数字图像处理的信息大多是多维信息与彩色信息,处理信息量很大,因而对计算机设备硬件指标要求较高。

(2)占用频带宽。与其它信息相比,图像信息占用的频带更宽。因而在图像获取、传输、存储、处理等各个环节的实现上,技术难度较大、成本高,对频带压缩技术要求更高。

(3)知识工程问题。随着人类认知的不断提高,在处理图像时不仅局限于二维信息,还存在大量三维信息。单独一幅图像并没有包含三维物体所有信息,很多信息不能在二维图像上得到有效反映。将二维景像和三维景像进行有效地分析、引导、理解、结合是人工智能领域里需要解决的知识工程问题。

(4)标准化问题。图像处理完后需要由人眼观察,评价结果因人而异。人体的视觉系统极其复杂,还会受到环境条件、情绪及熟悉度的影响。尽管现在提出用数学方法来客观评价处理效果,但数学评价高的图像,效果不一定能够达到人眼的舒适度。因此,在图像质量标准化方面还有待进一步研究。

参考文献

[1]RAFAEL C GONZALEZ,RICHARD E WOODS.数字图像处理[M].第2版.阮秋琦,等,译.北京:电子工业出版社,2011.

[2]贺东霞,李竹林,等.浅谈数字图像处理的应用与发展趋势[J].延安大学学报,2013(4):18-21.

[3]章毓晋.中国图像工程:2014[J].中国图象图形学报,2015(5):585-598.

[4]李艳梅.图像增强的相关技术及应用研究[D].成都:电子科技大学,2013.

[5]张红英,彭启琮.数字图像修复技术综述[J].中国图象图形学报,2007(1):1-10.

数字图像盲取证技术研究综述篇4

1 数字图像取证

数字图像取证技术是一个多学科综合的研究问题, 它涉及计算机视觉、信号处理、计算机图形学、机器学习、成像传感器、模式识别等领域的知识。数字图像取证技术要解决的问题主要包括以下几个方面:能否确认一幅图像是真实 (原始) 图像, 还是经过篡改操作处理后的伪造图像;能否确认伪造图像的篡改区域和篡改程度;能否确认图片是由成像设备拍摄的照片, 还是由计算机生成的图片;能否确认拍摄照片的成像设备的类型或品牌。

目前, 通常有两种取证技术一是数字图像主动取证技术 (数字签名、数字水印) , 另一种是数字图像被动取证技术, 也通常称为数字图像盲取证技术。

数字签名技术, 它提取原始图像的内容摘要作为签名, 在图像使用端通过比对接收图像的内容摘要和签名文件, 从而验证图像的真实性。数字水印技术它利用数字作品中普遍存在的冗余数据与随机性把版权信息或内容信息嵌入到数字作品本身, 从而起到保护数字产品版权或真实性的目的, 用于数字图像检测的数字水印一般可以分为两类:脆弱水印和半脆弱水印。脆弱水印是一种在图像发生任何形式的改变时都会被损坏掉的水印;半脆弱水印是指能够容忍图像进行诸如JPEG压缩、加少量噪声的偶然修改, 但会被图像内容的恶意篡改损坏的水印。在图像使用端通过检测水印信号的修改情况, 判断出图像被篡改的位置以及被篡改的严重程度。数字签名和数字水印检测技术的一个共同特点是内容提供方必须对图像进行预处理, 提取签名或嵌入水印。换句话说, 只有所有的数字图像在发布之前都实现了签名提取或水印嵌入, 相应的鉴别技术才能真正有效, 而在实际应用中, 绝大多数数字图像事先并没有预处理, 这就大大限制了这两种数字图像检测技术的使用范围。

数字图像盲取证技术是指在不依赖任何预签名提取或预嵌入信息的前提下, 根据待取证数字图像自身的一些特征判断其是否经过篡改、合成和润饰等伪造处理, 判断识别及其可能的来源。

2 国内外的研究现状

基于数字图像盲取证技术是近几年发展起来的, 其研究还处于初级阶段, 挑战性高, 创新空间大, 因此许多高校和科研机构都投入到该领域的研究中来。如美国著名的Dartmouth学院、Binghamton大学、Columbia大学和Polytechnic大学等分别成立了专门的数字媒体检测技术研究小组。相比国外, 国内在该领域的研究起步较晚, 但由于该项研究在法律、公安实务中有重要的应用性, 所有国内许多大学, 尤其是公安类院校也开展了大量的研究工作, 主要有中山大学、国防科技大学、同济大学和北京邮电大学等。吴启[1]详细阐述了各种利用Photoshop软件对数字图像进行篡改的技术, 然后分析了各种伪造方法的缺陷, 以及从细节上识别这些篡改图像的方法。王渝霞[2]从图像光照一致性、各种物体的比例关系、色彩反差一致性、局部分辨率、边缘特征等方面阐述了静态图像原始性检验技术。吴琼[3]提出了一个数字图像盲取证技术的基本框架, 它包括图像建模、特征提取与特征分析、算法设计、测试与验证、图像盲取证技术定位与图像分类、相关的图像源特性以及图像数据库等主要组成部分。这些研究从各个方面阐述数字图像盲取证技术的一般方法, 但是这些方法大都是经验性的, 检测结果与检验操作者的熟练程度和经验。对于这一研究领域, 国际上近几年研究有较大的进展, 发展了一系列检测图像篡改的技术。主要有利用图像块之间的相关性可以检测克隆性图像篡改、拼接性图像篡改;利用图像放大、缩小重采样时像素之间的相关性可以检测替换性图像篡改;利用图像中数码相机的色彩滤镜矩阵的不一致性可以用来检测拼接性、替换性图像篡改;利用图像中数码相机的传感器噪声模式的不一致性, 也可以检测拼接性、替换性图像篡改;利用图像中色彩的偏差可以用来检测拼接性、替换性图像篡改;利用透视几何技术可以用来检测篡改图像中不符合透视几何原理的现象;图像拼接时光照条件是最难处理的环节, 利用光照的不一致性或不均匀性可以检测篡改图像[4,5,6,7,8,9,10,11]。

3 数字图像篡改的主要方法

目前数字图像篡改主要有以下几种篡改方法:一是图像区域替换, 篡改者通常将图像中的某一部分用另外一副图像的相应部分替换, 替换后图像边缘部分经过拼合模糊, 使得看起来比较完整。二是图像拼接, 通常是将两副照片按照一定规律连接成一副完整的图像, 并经过色阶调整、色彩平衡、色相以及饱和度调整, 使两张图像看起来比较协调。三是图像克隆, 将数字图像中的某些部分进行复制, 并粘贴到同一张图像中的另一个位置, 以加强图像中的某些效果。四是图像删减, 就是将图像上的某一区域剪切掉或删除掉某些内容。五是图像修复, 对图像上信息缺损区域、移走目标物体留下的信息空白区域进行信息填充, 并且使观察者无法觉察到图像曾经缺损或已被修复。其典型方法是基于样本纹理合成的修复技术, 该技术可以用来去除图像中的大目标。六是图像增强, 包括改变图像特定区域的颜色和对比度等, 这种操作明显地改变图像内容, 但可以模糊或突出某些细节, 或者改变照片的明暗程度等。任何形式的篡改操作都会不可避免地引起数字图像数据内部特征的变化。

4 数字图像盲取证技术

根据数字图像取证中所使用的检测特征依据不同, 可将数字图像盲取证技术分为三类:基于图像篡改过程遗留痕迹特征的取证技术;基于图像内在统计特性的取证技术;基于成像设备一致性的来源取证技术, 下面分别介绍。

4.1 基于图像篡改过程遗留痕迹特征的取证技术

该类技术通过寻找并利用图像篡改操作在伪造图像中的遗留痕迹对图像进行原始性检测, 这种遗留痕迹单凭人眼通常很难发现。不同的篡改手段会产生不同的伪造遗留痕迹, 如JPEG双重压缩操作会导致图像DCT变换系数的直方图产生周期性模式, 重采样操作会导致图像像素之间的相关性发生变化, 复制-粘贴操作会导致图像不同区域之间产生异常的相似性等。目前研究的方法主要包括JPEG双重压缩检测、重采样检测、复制-粘贴检测、照明条件不一致性检测和模糊检测等。

4.2 基于图像内在统计特性的真实性检测

篡改图像的手段多种多样, 大多数情况下从视觉上难以察觉图像是否被伪造过。但是, 篡改和伪造必然在一定程度上影响和破坏图像的内在统计特性, 基于这一观点, 基于图像内在统计特性的盲取证方法首先提取对图像篡改敏感的统计特性, 以形成区分性的特征向量, 然后构建分类器对待检测图像进行分类。该类技术的核心是提取作为区分性特征向量的图像统计特性, 然后依靠分类器来做出决策。目前研究的方法中提取的特征包括双相干特征、边缘百分比特征、图像质量度量特征和二元相似性度量特征等。

4.3 基于成像设备一致性的真实性检测

自然图像通常是由数字采集设备获取的, 不同的采集设备具有不同的特性, 如镜头的光学畸变不同、相机使用的颜色滤波阵列CFA (Color Filter Array) 和相应的插值算法不同等。而由同一设备采集的图像通常具有特殊的一致性规律以反映该设备的特性, 这些一致性的规律可用来确定图像的来源和检测图像是否被篡改。

5 数字图像盲取证方面存在的问题

近几年, 数字图像盲取证研究已经成为一个热点问题, 但随着各种各样的数字图像处理软件的不断进步和发展, 数字图像篡改技术也越来越成熟, 被动式的数字图像取证也越来越难, 从总体上来说, 数字图像盲取证技术的发展还处于初级阶段, 需要进一步深入研究。具体体现在以下两个方面。

5.1 现有的检测方法适用性差, 检测结果认可度不高

数字图像盲取证技术取得了一些研究成果和检测方法, 但目前大多数字图像盲取证检测方法是在很多约束条件下成立的, 其应用对象还存在一定的局限性, 算法依赖性高, 通用性差, 适用性低, 检测结果不够理想, 不能像指纹一样, 定性的检测数字图片是否被篡改, 很多方法只能作为篡改伪造的辅助证明手段, 还没有成为一个具有公信力的技术手段。

5.2 数字图像盲取证技术的体系不完善、缺乏对检测标准的研究

现有的数字图像检测方法大多数还是强调人的主观作用, 不论是那类检测方法, 都没有统一的检测标准, 强调人在检测中的主观判断作用, 而忽略了对这些检测手段的量化, 没有建立标准图像数据库和相关检测评价指标。

由于数字图像本身的复杂性和多样性, 数字图像的盲取证技术是一项难度很大的创新工作, 虽然已经成为当前多媒体信息安全领域研究的一个热点问题, 但取证检测毕竟是随着数字图像发展而带来的一项新课题, 取证检测中的许多问题还需要我们进一步深入研究和探索。

摘要：数字图像盲取证作为一种不依赖任何预签名提取或预嵌入信息来鉴别图像真伪和来源的新课题, 正逐步成为多媒体安全领域新的研究热点, 本文首先介绍了这一领域当前的研究现状和进展, 接着从图像篡改遗留痕迹特征、图像内在统计特性、成像设备一致性三个方面阐述了当前图像盲取证技术的主要方法, 并分析了不足之处。

关键词：数字图像取证,篡改检测

参考文献

[1]吴启.浅谈计算机伪造照片的检验[J].中国人民公安大学学报:自然科学版, 2005, (4) :73-75.

[2]王渝霞, 论静态图像的原始性检验[J].刑事侦查, 2006, 18 (1) :68-67.

[3]Wang J, Bhat P, Colburn R A, et al.Interactive video cutout.ACM Transactions on Graphics (SIGGRAPH'05) , 2005, 24 (3) :585~594.

[4]http://w w w.cs.da rtm outh.edu/fa rid/resea rch/digitaltampering/.

[5]Zhu B B, Swanson M D, Tewfik A H.When seeing isn't believing.IEEE Signal Processing Magazine, 2004, 21 (2) :40~49.

[6]Lin C Y, Chang S F.Semi-fragile watermarking for authentication JPEG visual content.Proceedings of SPIE, San Jose, CA, USA, 2000, 3971:140-151.

[7]Ng T T, Chang S F, Sun Q B.Blind detection of photomontage using higher order statistics.Proceedings of IEEE International Symposium on Circuits and ystems (ISCAS04) , Vanco uver, Canada, 2004, 5:688~691.

[8]Menezes A J, Oorchot P V, Vanstone S.Handbook of applied cryptography.BocaRaton, FL:CRC Press, 1997.

[9]吴金海, 林福宗.基于数字水印的图像认证技术.计算机学报, 2004, 27 (9) :1153-1161.

[10]Lin C Y.Watermarking and digital signature techniques for multimedia authentication and copyright protection.Doctor Thesis, Columbia University, 2000.

数字图像融合综述篇5

以网络电子版方式传播的知识产品在给人们带来信息共享和商业利润的同时,也面临着盗版、非法复制以及存取失控等日益严重的威胁。作为数字媒体作品知识产权保护的一种有效手段,数字水印(Digital Watermarking)技术得到了广泛关注,并已成为国际学术界研究的一个热点[1]。

目前虽然有许多文献讨论有关数字水印技术的问题,但数字水印始终没有一个明确的统一的定义。文献[2]中给出了如下的定义:数字水印是永久镶嵌在其他数据(宿主数据)中具有可鉴别性的数字信号或模式,而且并不影响宿主数据的可用性。根据所嵌入的宿主媒体的不同,主要可分为图像水印、音频水印、视频水印、文本水印、网络水印等。

数字水印技术是信息隐藏技术研究领域的重要分支, 它除应具备信息隐藏技术的一般特点外,还有着其固有的特点。数字水印技术基本特征主要有[3]:

(1)鲁棒性:指不因多媒体文件的某种改动而导致隐藏信息丢失的能力。

(2)透明性:利用人类视觉系统或听觉系统属性,经过一系列隐藏处理,使目标数据没有明显的降质现象,而隐藏的数据却无法人为地看见或听见。

(3)不可检测性:指隐藏载体与原始载体具有一致的特性。

(4)自恢复性:由于经过一些操作或变换后,可能会使原图产生较大的破坏,如果只从留下的片断数据仍能恢复隐藏信号,而且恢复过程不需要宿主信号,这就是所谓的自恢复性。

2 数字图像水印算法概述

图像数字水印技术大体上可分为时空域和变换域数字水印技术。时空域数字水印技术中,嵌入图像的水印信息不经过任何变换,直接嵌入到图像像素上,主要是基于改变图像数据统计特性的水印算法,如文献[4]提出的patchwork算法,它是基于统计的数字水印嵌入方案,该算法首先随机选择N对像素点,在增加其中一点的亮度值的同时,相应降低另一点的亮度值,从而隐藏水印信息.文献[5]提到了一个基于空域分块的方法,通过改变块均值来嵌入水印。

近几年,变换域算法如基于离散傅立叶变换、离散余弦变换(Discrete Cosine Transform , DCT)、离散小波变换(Discrete Wavelet Transform , DWT)等各种时频分析工具的算法受到广泛关注,这主要因为变换域算法中可以使嵌入的水印信号能量分散到空间的所有像素上,有利于保证水印的透明性,并且可以更方便地与人类视觉系统的特性相结合。

2.1 基于DCT域数字图像水印算法

由于离散余弦变换具有良好的聚能效应,因此在图像水印领域有很好的应用效果[6,7,8,9,10],文献[6]提出了一种基于离散余弦变换的图像水印方法,因为将水印加在低频区域可以具有较好的鲁棒性,但透明性差:将水印加在高频区域可以获得较好的透明性,但鲁棒性差,所以文中提出了将水印加在中频区。该方法是将原始灰度图像进行8×8分块,然后对每个图像块进行DCT变换,得到64个DCT系数,采用ZigZag扫描法选择部分中频系数进行水印嵌入,缓解了鲁棒性与透明性的矛盾。

近期比较流行的是采用二维图像(二值或灰度)作为私有水印信息[7,8],并通过对水印信息进行一定缩放处理,与DCT系数相叠加,为了具有较好的鲁棒性,这类算法所修改的系数一般集中在低频AC系数上。不难看出,现有绝大多数DCT域数字水印方案是将水印信息嵌入到AC系数上,对于DCT域中最稳健的DC(直流系数)则一直少有人问津,其主要原因是对DC系数的修改通常会引起图像质量的明显下降。然而实验证明,只要水印嵌入强度小于一定阈值,同样可以保持很好的透明性。文献[9]提出了一种新的DCT域静态图像水印嵌入算法,该算法打破通常DCT域数字水印方案将水印信息嵌入到AC系数的做法,而是将水印信息嵌入到直流系数DC中,该算法以二次DCT变换为基础,并可根据HVS的亮度掩蔽特性,对水印嵌入强度进行动态调节,不会引起图像质量的明显下降。

文献[10]与文献[9]同样把水印嵌入到DCT变换后的DC分量中,并采用了量化策略,实现了水印的盲检测。该算法中主要缺点是需要通过大量的实验才能选取出较好量化步长。

2.2 基于DWT变换的数学图像水印算法

近年来,小波域信息隐藏技术日益受到重视,与其他的水印技术相比,小波域水印显示出良好的鲁棒性,在经历了各种处理和攻击后,如加噪、滤波、剪切、有损压缩等,仍能保持很高的鲁棒性。对于水印的嵌入而言,小波变换的类型、水印的种类、水印嵌入的位置以及水印嵌入的强度,这四大要素决定了水印嵌入算法的类型。在图像水印中可将秘密数据嵌入到小波域系数中可以得到良好的鲁棒性。

文献[11]给出了一种在小波变换域中对静态图像加水印的方法。该方法利用了小波分析的优良性质,按水印图像小波变换后的系数块大小对小波变换后的载体图像进行分块,将分得的系数子块按不同层次不同方向重复嵌入相应的水印系数块,通过与原始载体图像进行比较实现水印的提取。最后与嵌入的水印进行相关性检测来检测提取出的水印是否有效。

文献[12]利用小波变换的图像多分辨率分解特性,在算法中对宿主图像进行3级小波分解,同时对水印图像进行一级小波分解。文中首先用实验证明对宿主图像做大于3级的小波分解对水印鲁棒性的提高并不明显,反而会加大算法运算量,所以该算法对宿主图像进行了3级小波分解。其次,基于鲁棒性考虑,希望水印的统计特性类似白噪声,均值为0,在嵌入水印之前,先将水印图像中的0和1变成-1和+1,考虑到嵌入水印的透明性及鲁棒性,将水印的低频信息嵌入到宿主图像的低频分量上,中、高频的细节信息嵌入到原始图像的对应分量上。但是当对图像整体性破坏时,该算法的鲁棒性较差,有待进一步完善。

文献[13]提出了一种自适应的数字图像水印,该算法主要利用的是DWT域嵌入水印可以提高水印对图像压缩处理的攻击这一特性。为了兼顾嵌入水印鲁棒性和透明性,该算法尽量把数字水印嵌入到最低频系数中,以保证其鲁棒性,同时,又考虑到水印的透明性,嵌入位置的选择不同于一般,该算法采用数字水印能量与载体图像经小波分解后子块能量相等的替换原则,针对不同子块能量而自适应的调整嵌入系数的值。算法很好地利用了小波变换的特性,同时嵌入强度自适应得出,显然本算法相对其他静态图像水印技术有很大改进之处。

对于DWT变换的四个子带LL1、LH1、HL1、HH1,文献[14]指出,理论上作为低频的LL1子带,对于JPEG压缩有更好的鲁棒性,但是,由于通过修改相邻小波系数大小关系来嵌入水印的方法对图像的降质比较明显。所以,虽然水印嵌入到LL1子带能够获得更好的抗JPEG性能,但却造成了水印嵌入后图像的严重失真,从而失去应用价值。因此,为了缓解抗JPEG压缩的鲁棒性与数字图像水印透明性的矛盾,一个好的算法应该是能够尽量提高抗JPEG压缩能力但不能造成太大的图像失真,同时还应遵循HVS的特性。

文献[15]利用小波变换的特性,选择在较低频子带的重要系数中加入水印。首先,选择需要添加水印的子带,并确定一组门限,构成一组区间;其次,通过改变幅值落在这些区间的小波系数来加载水印信息,水印为一伪随机序列;最后,检测时通过计算原始随机序列与恢复出的随机序列的相关性来判断水印是否存在。

文献[16]提出一种基于混沌序列加密的小波域数字图像水印算法。先将二值图像水印信号采用混沌序列加密,然后再通过另外一个混沌序列控制水印嵌入在小波变换域系数中的位置,实现小波系数中隐藏不可见水印的技术。该项技术具有非常好的安全性,水印提取在DWT域中进行,不需要原始图像,该方法嵌入的水印透明性好,对JPEG-2000压缩、图像剪切和图像加噪声攻击具有较好的鲁棒性。

文献[17]提出了一种可用于版权认证的基于小波变换域自适应量化步长的图像盲水印算法。该算法首先在离散小波变换的低频子带中选择感知重要系数作为水印的嵌入区间,然后选择一个同时可满足不可见性与鲁棒性要求的最小量化步长,对所选择的重要系数进行量化,再通过自适应增大量化步长,把二值水印信息交替地嵌入到不同的量化层上。

在数字水印和信息隐藏中,已经出现不少基于小波变换的算法,但在这些算法中,小波图像低频系数总是被明显地排除在外[18,19]。水印的鲁棒性与嵌入对策、嵌入公式、嵌入强度有关,针对此问题,而文献[20]根据小波图像系数的分布特点和对小波系数振幅的定性、定量分析,认为低频子带更适合水印嵌入。文献[21]也同样认为低频子带更适合水印嵌入,若有剩余,再按小波图像频带重要性的排序嵌入高频带。同时指出,水印嵌入到小波图像低频系数和高频系数需要用不同的嵌入公式及不同的嵌入强度:将小波系数组织成小波块,并将小波块分类,并根据分类的结果将不同强度的水印分量嵌入到不同的小波系数中。实验结果表明,应用该算法所实现的水印不可见,并对常见的图像处理和噪声干扰具有很好的稳健性。

2.3 DCT和DWT结合的数字图像水印算法

由于DCT和DWT具有各自的优点,因此目前DCT和DWT结合的数字图像水印算法[22,23,24]相继出现:

文献[23]利用了DCT的聚能特性和DWT的多分辨率特性提出算法,该算法能较好保持图像的质量,并且对常用的图像处理方法有较强的鲁棒性,是一种能抵抗多种攻击的比较稳健的水印算法。该算法的主要特点是:首先,对宿主图像进行L级DWT变换,得到低频的近似分量和高频的细节分量。其次,为了使嵌入的水印可以均匀分布在近似分量图像中,对近似分量图像进行DCT变换以得出DCT系数最大分量即决定图像中感知最具意义的频率部分进行水印嵌入。该算法具有易实现、易检测、较稳健的特性,但是当对加入水印的图像进行高斯噪声和中值滤波时提取出水印的效果不佳。

文献[24]打破了当前流行的水印算法在图像的时空域或变换域中感知重要的系数嵌入水印的局限性做法,由于感知重要的部分通常是图像的低频部分,当图像经历某些变换操作时,从低频提取的水印会产生严重的质量退化,因此该文献提出在图像小波包分解后的低频和高频部分选取适当系数分别嵌入同一个水印.总之这个方案比单重水印方案能够更有效地抵抗JPEG有损压缩,剪切等等水印攻击,也为数字水印算法提供新的改进方法。

文献[25]将DCT与DWT域相结合的向载体图像中嵌入灰度数字水印图像的自适应二维水印算法,利用DCT变换将灰度水印图像的数据压缩到最小,与图像进行一层小波变换后提取低频子带系数作为水印信息相比,其数据量只有后者的一半。另外,根据图像小波变换后小波系数的特点,结合人眼视觉掩盖特性,有效地提取出人眼视觉敏感度低且相对稳定的子带信息,通过这部分信息的调制实现水印的嵌入,达到水印的鲁棒性和不可见性的较好结合。

3 总结与展望

近年来,图像数字水印技术的研究取得了很大进展,陆续提出了诸如空间域、变换域、压缩域、基于统计学、基于生理模型等多种数字水印算法。其中, 以离散小波变换、离散余弦变换为代表的变换域数字水印技术因其水印信号能量可分布至空间域所有像素、易于引入人眼视觉特性、与国际压缩标准相兼容等特点,引起了人们的高度重视。

离散余弦变换将其能量的大部分集中于频率域的一个小范围内,描述不重要的分量只需要较少的比特数,离散余弦变换正是因其具有解相关能力和聚能作用,因此可改善隐藏算法的性能;同时,频率域分解映射了人类视觉系统的处理过程。

离散余弦变换的变换系数分为直流系数与交流系数,其中直流系数代表了块的平均亮度,对直流系数的改变不当容易导致分块效应;而交流系数很容易被低通滤波去掉,稳定性相对较差。

离散小波变换是一种时间-尺度(时间-频率)信号的多分辨率分析方法,在时频两域都具有表征信号局部特征的能力。根据人类感觉系统的掩蔽效应(特性),可以将数字水印信息嵌入到原始载体的不易被感知区域(如图像的纹理和边缘等)。小波分解将原始图像分解为一系列的低频分量和高频分量,而人类视觉系统对图像低频分量的改变非常敏感,对图像的纹理等高频部分改变的敏感性要小得多.可见小波变换为解决数字水印的透明性提供了新的思路。

事实上,无论是在离散小波变换或是在离散余弦变换后的低频子带还是在高频子带,只要嵌入强度不超过人类的可感知界限,都是可以嵌入水印的。低频系数的绝对值比高频系数的绝对值一般大得多,考虑到鲁棒性,水印嵌入到低频系数则具有一定的优势,而考虑到透明性,高频系数又是不错的选择. 但如何在鲁棒性与透明性这两个水印重要特征之间找到一个更好的平衡点将是进一步需要研究的工作。

一个好的数字图像水印算法,需考虑几点问题:①如何充分发挥DCT的聚能特性和DWT的多分辨率特性。②如何充分利用HVS的特点使得水印的鲁棒性和透明性都能得到满足。③如何充分利用现有仿真实验工具和图像处理工具不断完善算法的功能,使水印的嵌入更灵活多样。④各种算法的一个关键问题就是寻找好的嵌入位置,并在这些位置上找到适当的嵌入强度,完成水印的嵌入;嵌入的水印在经受各种信号处理攻击后,应当仍然存在,并可用水印检测器检测到,或者用相应的提取算法将其提取出来。⑤由于JPEG压缩的广泛应用,改进的算法应具有很强的抗JPEG压缩能力。

数字水印技术是近年来国际学术界兴起的一个前沿研究领域。它与信息安全、信息隐藏、密码学和隐写术等均有密切关系。数字水印技术还处于起步阶段,它有许多未知的领域等着人们去探索,根据水印的研究现状分析,水印的嵌入位置、嵌入强度嵌入方法及如何在鲁棒性与透明性之间找到平衡点均是图像数字水印技术研究的重要方向。

摘要：综述了基于离散小波变换及离散余弦变换的数字图像水印算法.由于小波变换具有良好的局部性时频分析特性和多分辨率分析,而离散余弦变换具有良好的聚能效应,因此两者在图像水印领域有很好的应用效果.对基于两种变换的数字水印技术的相关概念和现有方法进行了描述与分析,同时总结了两类算法优缺点,并讨论了几种可能的解决策略。另外,对基于两种变换的数字图像水印技术的未来发展方向和前景进行了预测。

数字图像融合综述篇6

关键词：图像认证,半脆弱水印,篡改检测

0 引言

数字水印作为数字媒体作品知识产权保护的一种有效手段,目前得到了广泛地研究和发展[1,2],并已成为国际学术界研究的一个热点[3]。对数字产品的保护技术一般可以分为两类:①用于版权保护的鲁棒数字水印技术;②用于内容完整性、真实性认证的脆弱性数字水印和半脆弱性数字水印。

图像认证系统在医学、商业、军事、法律和新闻等方面均有很广泛地应用。认证水印是利用人类视觉系统的冗余,在不影响数字媒体感官质量的前提下,将与媒体内容相关或不相关的标志信息作为水印嵌入到媒体内容中,当媒体内容需要认证时,则可以根据提取的信息来判断其是否真实完整。计算机网络传输中的图像认证一般分为两类[4]:精确认证和模糊认证。精确认证是把图像作为一个整体,对图像的任何篡改均是不允许的,即使图像有1 byte的改动,图像就不能通过认证系统的认证,它使用脆弱水印技术。而模糊认证则是指在图像作品内容基本不变的情况下,允许作品有一定程度的失真,但对图像内容有明显改变的恶意篡改则不允许通过认证,它使用的是半脆弱水印技术。半脆弱水印对保持图像内容基本不变的操作(如图像压缩、图像滤波和图像增强等)是鲁棒的,而对恶意篡改是脆弱的。它作为一种新的数字媒体认证技术,在近几年得到了迅速的发展,并在数字音频和视频领域也有了很大的发展。

本研究首先对图像认证半脆弱水印技术的研究目标和研究现状进行叙述和分析,并指出当前典型的半脆弱水印算法的不足之处,然后对半脆弱认证系统的攻击行为进行分析。最后展望图像水印认证技术未来的发展方向。

1 半脆弱水印技术发展和研究现状

在实际应用中,数字图像因其数量较大,通常以压缩方式存储或传输,同时图像处理软件各异,图像格式众多,最终用户所要认证的图像通常是原始图像经有损压缩或其它常规操作处理后的图像,因此,对图像进行内容认证的半脆弱水印技术在现实生活中更为实用。

基于半脆弱水印的认证系统应满足以下基本要求[5]:①鲁棒和脆弱的兼备性;②感知的透明性;③篡改的敏感性和可定位性;④盲检测性;⑤安全性。

半脆弱数字水印技术按照其实现方法可以分为空域法和变换域法。

1.1 空域法研究现状

空域水印算法是直接通过修改数字图像中的像素位来嵌入水印,如直接修改图像像素的最低位[6],该方法嵌入的水印信息量极少,算法鲁棒性差。水印信息很容易被滤波、图像压缩、图像增强等图像常规操作所破坏。Lin等人通过改进空域像素之间的相关性来提高检测效果[7]。通过密钥在原始图像DCT域提取伪随机的白噪声序列,并将此序列作为认证序列,把序列叠加到每个8×8的DCT块上的三角矩阵中,对DCT块反变换,并结合水印强度因子合成含水印图像。通过提取水印和原伪随机序列求相关来完成认证。此算法的优点是对于JPEG有损压缩后被篡改的图像检测准确率很高,但是对于图像边缘和纹理较多的情况,算法的检测率较低,可靠性差。

Dittmann[8]把提取的图像边缘特征作为水印信息嵌入到空间域中,并采用Canny边缘检测器,通过比较被测图像边缘和提取的水印信息是否一致来判断图像的真伪。该算法对图像常规操作和恶意篡改识别能力强,但对各种压缩操作表现敏感。此外,算法的缺点还有误检率比较高,因为一旦图像被篡改,它的特征会随之改变,因而造成比较时的错误。

1.2 变换域法研究现状

变换域半脆弱水印算法首先对图像进行可逆变换,然后修改变换域系数来实现水印的嵌入。变换域数字水印嵌入的信息量大、安全性高。目前大多数半脆弱水印算法采用DCT和DWT变换。

1.2.1 DCT域半脆弱水印算法

通常基于DCT域的半脆弱水印算法是为了抵抗JPEG压缩而提出的。Tewfik[9]提出一种基于JPEG编码方法的半脆弱水印技术。该方法首先对原始图像的每个8×8图像块进行DCT变换,然后把各个图像块的信号排序,用Hilbert对照JPEG量化表把向量分解成更小向量,再把子向量纵排列成Hadamard矩阵,采用Zig-Zag扫描法选取DCT系数进行奇偶性量化,将调制后的DCT系数嵌入水印的图像块,结合图像块形成含水印图像。最后通过比较待测图像的量化系数与原图量化系数的奇偶性相符情况来完成认证。此算法的优点是脆弱性强,但对常规处理反应敏感,因为系数的奇偶性在图像经过一般信号处理后是很容易改变的。Lin和Chang[10]给出了一种可以在一定程度上抵抗JPEG压缩和剪裁与替换操作的半脆弱水印技术,该技术可以识别被篡改的块的位置,并且可以利用来自原图的一个粗糙图像来对篡改块进行恢复。所提出的算法基于JPEG压缩前后DCT系数的两个不变特性:①如果DCT系数被修改为JPEG量化步长的倍数,那么在未来的JPEG压缩中,该系数可以被确切重建;②JPEG变换前后两个8×8子块相同位置的系数关系保持不变。算法利用第2个特性来形成认证信号,而利用第1个特性来将其嵌入到DCT系数中。此算法的优点是虚警率近似为0,并且对大多数攻击,比如去噪、剪切、直方图均衡等检测效果好,抗JPEG压缩能力强。但算法的篡改定位精度不够准确,只能定位到以块为单位的地方,而对于图像部分像素的改变无法准确定位,且恢复后的图像质量较差。Yang S Y[11]等人对原始图像进行每个8×8块DCT变换,然后选择嵌入水印区域和嵌入系数,计算差别敏感门限值、修正系数,以实现水印的生成和嵌入。认证时根据Zig-Zag系数序列和DCT系数之间的关系对DCT反变换以复原原始图像。此算法对常规操作和JPEG有损压缩有良好特性。Lin和Podilchuk[12]等人在原始图像的每个8×8块的DCT中频系数上叠加不同的伪随机序列,由于自然图像中一般平滑区较多,边缘区较少,认为在没有边缘存在的情况下,图像相邻像素差值信号的能量主要是由水印引起的,通过一个改进的运算来进行图像认证。算法的优点是对于JPEG有损压缩后被篡改的图像检测准确率很高,但算法的检测率较低,可靠性也差。

1.2.2 DWT域半脆弱水印算法

由于小波变换在时域和频域具有良好的局部定位性质,同时与现有的图像压缩标准JPEG2000相融合,故小波域的数字水印认证技术有更高的实用意义。Walton[13]和Kundur、Hatzinakos[14]通过量化小波系数来嵌入水印,利用小波空间域和频率域定位出篡改位置,并估计当前图像被篡改的程度。其中Walton对图像的Haar小波系数进行量化,根据量化步长的大小来控制水印的鲁棒性,最后利用攻击估计函数将图像遭受的恶意篡改与非恶意篡改区分开来。该算法的缺点是很容易让攻击者得知量化步长而改变图像内容使提取的水印信息仍然不变。Lu把小波系数分成掩蔽门限位(MTUS)[15]。在频域中选择同尺度、同方位、绝对值大于JND阈值的小波系数,再用CWS(Cocktail Watermarking Scheme)调整小波系数来完成水印嵌入,用原量化信息作为密钥储存来恢复原图像。两种水印的检测分别进行以完成认证。该方法考虑了两种水印的特性,但是用作图像认证时,必须存储原始水印信息,并且鲁棒性和脆弱性的均衡也是问题。Yu[16]等人通过量化小波系数的加权平均值来嵌入水印,认为小波系数的变化服从高斯分布,对图像进行恶意攻击导致小波系数的变化往往具有较大的方差,而由偶然因素造成图像失真引起的系数变化往往具有较小的方差,从而将恶意篡改与非恶意篡改区分开来。这种方法较直接量化小波系数有更好的鲁棒性。Paquet[17]等人则结合人类视觉系统(HVS)量化小波包系数。算法首先生成ID序列,并用此ID序列选择小波变换函数及分解层数;再运用此ID选择所要嵌入水印的区域及系数,利用人类视觉掩蔽特性,对不同的小波系数选择合适的嵌入强度,完成小波包系数的量化,经小波包重构后得到含水印的图像;最后用密钥提取水印,结合小波包系数区域分别进行带内频域及带间空域比较以得出认证结果。不足的是很容易遭遇搜索攻击。Eggers[18]先用Scalar编码器对水印信息进行编码得到二值码书,再用对应的Scalar量化函数对所选8×8块中的系数量化,即可把码书的各个元素嵌入相应宿主信息内。同时为了使嵌入随机化,嵌入过程引入二值伪随机序列。认证时,把待测信息与相应的量化函数、步长因子、二值伪随机序列混合运算得到验证值,若无水印则验证值近似为0,若水印存在,其验证值绝对值应接近步长因子值的一半,通过这种方法完成认证。该算法的优点是虚警率为0,且对JPEG压缩稳健,能容忍一般的图像处理操作,缺点是对直方图均衡及锐化敏感。Hu[19]提出由低频率领域图像特征产生二值水印进行水印生成及嵌入,由小波变换逆变换进行认证。此算法定位能力强,并具有篡改恢复能力,其安全性也较高,但对图像旋转等变形失真非常敏感。

1.2.3 其它算法

Lu[20]提出了一种基于矢量量化的半脆弱水印技术。先把原图编码分块,用图像尺寸和图像块大小进行相关运算并结合特定二值图像产生水印,把图像块视为矢量,用VQ编码器在码书中找出最佳匹配码字代替该图像块;用码字下标代替输入矢量作为索引值反向到解码器,对应每个水印比特在码书里寻找合适的匹配码字,并把水印嵌入图像块相应位置中。检测时,把待测图像分块,用解码器根据索引值用同一码书重构相应的码字,根据嵌入规则提取水印。此法对JPEG与VQ压缩具有较好性能。但对于拼贴攻击等的抗攻击能力相对比较薄弱。

2 半脆弱水印攻击行为分析

半脆弱水印主要是用来保证数字媒体内容的真实性,其本身具有一定脆弱性的。因此施加于鲁棒水印的攻击方法(如简单攻击、同步攻击、削去攻击、混沌攻击)对认证水印系统的影响是不明显的,而试图篡改图像内容却不损坏水印信息的“伪认证”攻击对认证水印系统的影响就较为明显了。目前,关于数字水印认证技术的攻击算法文献较少,就已有的文献来看,主要有以下几种:

(1) VQ攻击。该类攻击的前提条件是图像中每一个认证单元(比如一个图像块或图像的一个像素)所嵌入的水印信号与其它认证单元的内容无关。于是,只要在两个认证单元中嵌入的水印信号相同,就可以把它们互相替换来修改图像内容而不会导致认证失败。为了使攻击后得到的图像具有一定的意义和较好的质量,有时需要多幅图像,尤其是攻击彩色图像时。防止这种攻击的最有效方法就是使每个认证单元的认证信息依赖于其它认证单元的内容,这种改进方法的一个缺点就是对篡改定位能力有一定影响。

(2) Holliman-Memon攻击。密钥资源有限且密钥与图像无关致使当密钥和所嵌入的水印完全相同的情况下,同一位置可能会隐藏相同的水印信息,所以攻击者可以交换两个可信图像同一位置的图像块而不会影响提取的水印信息。

(3) 密码分析攻击。密码分析攻击的前提条件是攻击者拥有几幅用同样密钥嵌入相同水印信号的图像。其目的是找出图像认证算法中使用的秘密信息,比如密钥等。一种可以用来防止密码分析攻击的方法就是每幅图像使用不同的密钥嵌入水印;另一种方法是使图像内的每一个认证单元所嵌入的水印信号依赖于其它认证单元的内容或者全局信息;有时可以把这两种方法结合起来。

(4) 特征选取攻击。特征选取攻击的前提条件是设计者所选取的用来表达图像内容的特征并不能充分表达图像的全部内容,以致无法根据这些特征来区分可接受操作和恶意篡改。比如,当把图像的灰度直方图作为特征,那么构造一个与原有图像具有相同的灰度直方图而内容不同的图像就是攻击者的目标之一。对于特征选取攻击,目前尚无很有效的方法。

3 半脆弱水印的发展方向

半脆弱水印技术作为数字水印技术的一个重要分支,目前还是一个未成熟的研究领域,尚有许多亟待解决和进一步深入研究的问题,笔者认为未来半脆弱水印技术应在以下几个方面展开探讨和研究:

(1) 与图像压缩编码算法相结合。数字图像的网络传输发布都需要经过压缩编码(JPEG或JPEG2000等)。目前针对JPEG编、解码器设计的水印认证算法已有文献报道,但针对JPEG2000及其它图像压缩标准的认证水印算法还很少。随着JPEG2000编码标准的不断成熟,研究能够抵抗JPEG及JPEG2000压缩的半脆弱水印图像认证算法具有深远的意义。

(2) 安全性问题。安全性一直是水印认证系统的关键。实际应用对水印的保密安全有不同程度的要求。现有的半脆弱水印技术大多采用基于私钥的加密方案,大量私钥信息通常很难管理。对于一个完善的半脆弱水印认证系统,系统的各个环节,如密码的产生、发布和管理都是必不可少的考虑因素。如何将半脆弱水印认证系统与密码学中的公开密钥算法结合,设计安全可靠的公钥水印认证算法,同时建立相应的标准或协议也将是一个重要的研究方向。

(3) 完善音频、视频水印认证体系。大量消费类数字视频产品的推出,使得以半脆弱水印为重要组成部分的视、音频真伪鉴别技术的市场需求更加迫切。然而,由于包括时间域掩蔽效应等特性的更为精确的理论模型尚未完全建立,使得目前视频、音频半脆弱水印技术的性能不太理想,同时现有的音、视频的编码格式也在一定程度上限制了水印技术的引入。因此,未来音、视频半脆弱水印技术也将会成为一个研究热点。

(4) 水印认证系统评测标准的建立。水印认证技术要得到广泛的应用,就必须建立一套完善的标准,以适应各种不同水印认证系统的质量评测。同时需要解决许多的社会和法律问题。

4 结束语

图像认证的数字水印技术是当今研究的热点。本研究分析了图像认证半脆弱水印技术的研究目标和研究现状,介绍了几种典型的图像认证算法,重点指出了当前典型的半脆弱水印算法的不足之处,并对半脆弱认证系统的攻击行为进行分析,最后提出了认证数字水印技术未来的发展方向。

数字图像融合综述篇7

1 算法整体框架

文中介绍的图像文字算法主要包括文字区域检测、文字块增强、文字提取以及文字识别四个核心模块, 其中文字识别模块直接采用OCR软件识别技术, 算法的研究集中在前3个模块中。

2 视频文字检测

算法采用聚类技术奖图像中的边缘进行分解, 并形成多个子图像, 从而将不同颜色的图像文字与背景色进行隔离, 主要步骤包括累积边缘图像的创建、彩色边缘分层处理以及文字定位三个步骤。

2.1 边缘图像创建

通过定义累积边缘图像, 在原数字图像的Y、U以及V三个分量上进行检测, 得到更加丰富的边缘信息, 在图像水平方向、垂直方向以及对角线方向上进行三个维度的边缘检测, 假定Py、Pu与Pv分别代表数字图像在Y、U与V分量上的边缘图, 则计算公式如式1所示:

其中SBh、SBv、SBl与SBr分别表示采用Sobel检测算子计算得到的数字图像在水平方向、垂直方向及左右对角线分量上的边缘强度计算结果。

2.2 彩色边缘分层处理

边缘分层处理是通过对2.1中得到的边缘分量图进行着色处理, 并采用K-means聚类算法将着色处理后得到的数字图像进行像素分类, 从而得到不同层次的像素点集合, 分别代表背景色和文字像素。由于不同的边缘图对应着不同的颜色, 因此通过聚类处理后可以将边缘图中的不同颜色进行分类, 得到颜色值相对统一的边缘子图, 为文字区域的定位提供参考。

2.3 文字定位

由于数字图像中的文字区域一般分布比较集中, 所以在2.2中处理结果上通过水平方向、垂直方向上的投影操作即可实现对文字区域的初步定位, 其次采用基于SVM向量机的方法对得到的文字区域进行过滤处理, 并采用均值计算、方差处理、局部同次性等特征分析, 丢弃明显错误的文字区域识别结果, 从而能够大大提高文字区域的定位准确性。

3 文字块增强

通过过滤操作提高文字笔画的清晰度, 并将得到的文字笔画进行融合处理从而得到更为准确的文字区域识别结果。

3.1 文字区域过滤

当前的数字图像与视频大都经过了一定程度的压缩处理, 从而导致图像和视频中的文字笔画比较模糊, 所以算法首先对文字笔画进行增强处理, 具体方法是通过对文字块的水平方向、垂直方向以及两个对角线方向上采用如式2所示的检测算子进行增强处理:

其中, Text Inth、Text Intv、Text Intl、Text Intr分别代表水平方向、垂直方向以及左右对角线方向上增强处理后得到的强度。

3.2 文字区域融合

算法采用局部阈值设定的方法对文字块中的背景色进行进一步分离, 并在此基础上进行平均融合处理, 从而降低噪声对识别结果的影响。另外, 在背景色的融合方面, 算法采用最小值融合技术, 从而降低了算法的处理开销, 并提高了处理结果的对比对。其中局部阈值t的设置采用OTSU法进行计算得到, 并通过对不同文字区域进行平均像素计算得到各个文字区域的图像集合, 最后进行阈值判断, 如果图像集合中的元素大于t则将其归为文字部分, 否则归到背景色。

4 文字提取

4.1 二值化处理

算法在文字提取时首先采用基于颜色分量的聚类算法进行像素二值化处理。具体的操作时通过对融合后的文字块图像从Y、U和V三个分量上进行对比度检测, 并选择其中的最大值作为二值化处理的选择标准。对于单个像素, 算法通过对像素边缘区域的灰度进行分量计算, 从而得到用来分割的局部阈值, 最后将像素的灰度值与局部阈值进行对比, 确定其是否属于文字区域。

4.2 噪声去除

经二值化处理后文字块的前景文字具有较高的连通性, 但却包含了比较大的笔画噪声, 所以为了提高文字识别的精度, 还需对噪声进行去除。算法通过对连通分量进行考察, 采用灰度一致性进行噪声去除。首先, 采用K-means法进行连通分量聚类, 将聚类结果中的大集合作为文字区域, 将小集合作为噪声进行去除。最后采用灰度一致性分析将处理得到的文字块进行进一步噪声去除, 从而得到更为清晰的文字提取结果。

参考文献

[1]李英, 田春娜.一种图像中的文字区域检测新方法[J].西安电子科技大学学报, 2013 (6) .

【数字图像融合综述】推荐阅读：