隐写分析

2024-07-05

隐写分析(精选8篇)

隐写分析 篇1

1 信息隐写分析技术

隐写术分析是对隐藏信息的分析和攻击,有检测、提取、破坏等几种形式,目前隐写术分析主要集中在检测和破坏两种方式。隐写分析的目的是为了检测加密信息的存在并破坏隐秘通信。基于图像的隐写分析技术是信息隐写分析技术的一个重要组成部分。图像特征的提取包括特征的寻找与选择。根据特征提取与嵌入算法的关系,图像隐写分析有两条途径。一是针对某种具体的嵌入方法提取其专有特征,根据这些专有特征进行判别,可称为专用隐写分析技术;二是寻找独立于具体的嵌入算法之外的特征,根据这些特征进行判别,可称为通用隐写分析技术。在分析隐写对载体图像所产生的影响基础上,找出对隐写敏感的低阶或高阶统计量,通过学习训练建立模型,从而实现对未知图像进行检测分析,判断是否存在秘密消息,这就是通用隐写分析算法的基本原理。图1是通用隐写分析技术的实现过程。

通用隐写分析技术研究中较为重要的是特征向量的选择和分类器的构造。在图像特征向量的选择方面主要的研究方向为:空域位平面相关性、位平面随机性、频域高阶统计量等。在分类器的构造方面,目前常用的方法有Fisher线性判决、支持向量机分类器、神经网络分类器等。支持向量机具有直观的几何解释和良好的泛化能力,解决了模型选择与欠学习、过学习问题以及非线性问题;避免了局部最优解;有效地克服了“维数灾难”;且人为设定的参数少,便于使用,已经成功地应用于许多分类、识别和回归问题中。

2 算法实现

1)算法结构

(ⅰ)利用二维离散小波变换对原始输入训练样本xi∈Rn(1,……,n),进行3层小波分解,提取小波特征;

(ⅱ)对每组小波特征进行优化,获得特征空间上的标准分量特征;

(ⅲ)利用特征向量进行分类器识别训练,生成最优分类器;

(ⅳ)利用最优分类器对待测图像进行分析验证。

下面给出算法的结构框图如图2所示。

2)算法实现过程

在图像数据库中随机抽出800张图像,把每幅图像中心256×256的区域截取出来转化为灰度图像组成自然图像样本集。将自然图像样本集平均分为四组,在每组中利用隐写算法嵌入信息,嵌入率分别是1%(0.01bpp),5%(0.05bpp),10%(0.1bpp)和15%(0.15bpp)。100%(1bpp)相当于在图像每个像素都嵌入1比特信息。这样就形成了800张载密图像样本集。从自然图像样本集各组中选取一半作为训练样本集中的自然图像,剩下的作为测试样本集中的自然图像。同样的,从载密图像样本集中抽取一半图像作为训练样本集中的载密图像,剩下的作为测试样本集中的载密图像。

支持向量机常用的内核函数有线性、多项式、径向基RBF和Sigmoid函数等类型。我们选用径向基RBF内核式(1),并采用V-SVC类的SVM。

使用训练样本集对SVM分类器进行训练,在训练过程中采用交叉验证能使分类器获得比较好的分类准确率的内核函数参数。交叉验证的目的就是为了在寻找合适的内核函数参数时不失一般性。

首先用400张自然图像和400张载密图像组成的训练图像集对分类器进行训练。对每个图像进行小波分析,提取各级、各个方向上的均值、方差、峰度、斜度以及能量差共计45个特征值,经过二次优化处理后,输入到Libsvm进行训练,生成分类器。然后用训练好的分类器对待测图像进行检测。这里的Libsvm指的是一个简单、易用、高效的SVM分类软件。

3)实验结果及分析

采用该文所提出的算法对空域LSB替换、空域LSB随机加减和频域的F5三种隐写算法分别进行了实验,主要针对的是准确性。采用前面构造的分类器对测试图像样本集进行测试,实验结果如表1所示。从测试结果可以看出,空域LSB类隐写算法,检测准确率较高,嵌入信息量越大检测准确率越高,特别是当嵌入信息大于0.15bpp时,检测准确率有些时候甚至能达到90%以上。可能是因为F5算法是DCT域算法,并且算法利用了矩阵编码技术提高了嵌入效率所以对于隐写算法F5检测准确率相对较低。这说明算法还有进一步改进的空间。

将该文的算法SUE与Farid以及BSM中所提算法进行了比较,比较结果如图3所示。从比较结果可以看出,在三种隐写算法的嵌入率相同时,Farid提到的检测准确率最低;该文所提算法对于空域LSB类隐写算法嵌入率小于15%的载密图像的检测准确率低于BSM中提到的算法,但在嵌入信息高于15%时的检测准确率高于BSM中提到的算法;该文所提算法对于F5隐写算法嵌入率为1%时的检测准确率低于BSM中提到的算法,但在嵌入率为5%和10%时的检测准确率高于BSM中提到的算法,实验环境和训练测试样本的差异可能会影响比较的准确率。

3 结束语

该文所提出的通用隐写分析算法只对三种隐写算法进行了测试,理论上其它经典的隐写算法也可以检测。为了提高检测准确度和降低虚警率,可以考虑在算法测试中加入新的随机性测试,这需要进一步的试验。另外可以考虑把这种算法推广到音频、视频等其它载体中。

摘要:该文提出了一种基于小波变换和支持向量机分类的隐写分析算法。算法采用图象小波分解后的各子带系数的高阶统计量作为自然图象统计属性,利用支持向量机构造分类器完成对载密图象和自然图象的分类。并对提出的算法进行了测试,达到了预期的效果。

关键词:隐写分析技术,小波变换,支持向量机

参考文献

[1]“Steganalysis Using Color Wavelet Statistics and One-Class Support Vector”Machines Siwei Lyu and Hany Farid Departmentof Computer Science,Dartmouth College,Hanover,NH 03755,USA.

[2]“Detecting Hidden Messages Using Higher-Order Statistics and Support Vector Machines”Siwei Lyu and Hany Farid Dart mouth College,Hanover NH 03755,USA,flsw,faridg@cs.dartmouth.edu,

[3]“Image Steganalysis With Banary Simil Arity Measures”Ismail Avcibas,Mehdi Kharrazi,Nasir Memon,Bulent Sankur

[4]梁小萍,何军辉,李健乾.隐写分析——原理、现状与展望[J].中山大学学报:自然科学版,2004,11,43(16):93-96.

希波战争与古代隐写术(三) 篇2

上期讲到,新任波斯国王薛西斯一世为了完成父亲大流士的遗愿,花了整整五年的时间来秘密招兵买马增加军备,准备对以雅典为首的希腊城邦发动一场大逆袭,然而这一切都被流亡到波斯的斯巴达废王德玛拉托斯看在了眼里。为了把这个消息送回斯巴达,他得想个办法把要传递的信息隐藏起来,不能被薛西斯的耳目发现。

蜡板的“正确”用法

德玛拉托斯的目光落在了身边的一块蜡板上面,这种蜡板是当时人们常用的书写工具,刻在蜡板上的字可以通过加热的方式“擦掉”,所以蜡板可以重复使用,很受一些需要经常做些临时记录的人的欢迎。不过,把字写在蜡板上,还是会被人看到的啊,关键问题没解决呢。德玛拉托斯当然不能走寻常路,他的目标不在蜡上,而在蜡下面的底板上。

蜡板的结构是在木头做的框架里面填上蜡,形状有点像我们现在放照片的相框。德玛拉托斯想的主意是,把蜡板里的蜡先全部刮掉,露出木头做的框架底板,然后在底板上写上小薛即将出兵攻打希腊的计划,再用蜡重新把底板盖住。这样一来,从表面上看,这还是一块普通的空蜡板,什么不和谐的信息都没有。况且,蜡板在当时就像现在的记事本一样普及,大街上这么多人都带着蜡板,卫兵当然不会觉得有什么不对头啦。

当然,这里面还有一个问题,那就是把这块蜡板送到斯巴达之后,万一他们没发现真正的消息藏在蜡底下,那不就白折腾了吗?德玛拉托斯是被斯巴达国王流放到波斯的,肯定不能自己跑回去,如果派人送回去的话,也不能告诉他这里面有什么秘密,不然不小心说漏嘴了怎么办?当年奴隶剃头的案例中,送信的奴隶其实不知道自己头上刻了什么字,但他知道自己头上有秘密,也知道见到阿里斯塔格拉斯之后让他把自己的头发剃了。再加上希斯提亚埃乌斯找的这个奴隶靠谱,所以并没出什么幺蛾子。

不知道是德玛拉托斯找不到这么一个靠谱的信使呢,还是他不想在这件事上冒哪怕一丁点儿风险,反正他真的没告诉送信人这块蜡板是干啥的,只是告诉他这块蜡板很重要,务必把它送到斯巴达。这送信的人就照做了,但到了斯巴达之后,所有人都蒙圈了,说你送一块空蜡板过来是闹哪样呢?这时,有个人听说波斯秘使送了一块神秘的空蜡板,这个人马上提出把上面的蜡刮掉看看,说不定字就藏在下面的木头底板上。大家一听,嘿,这个想法有点意思,不试白不试呗——果然,玄机就藏在蜡下面的底板上呢!

那么,这个牛人是谁呢?她的名字叫果戈(GoNe),是斯巴达国王列奥尼达一世(Leonidas Ⅰ)的妻子,换句话说就是王后娘娘啦!然而果戈怎么会知道德玛拉托斯的这个神秘的玩法呢?这里面具体的原因大概已经搞不清楚了,不过果戈和德玛拉托斯的确是有交集的。果戈的父亲克里昂米尼一世(Cleomenes Ⅰ)是前任斯巴达国王,德玛拉托斯也是前任国王——没错,那一届有两个国王同时统治,也正是因为一山难容二虎,这两位国王关系一直很微妙,都想找机会把对方给踹走,德玛拉托斯就是因为输掉了这场宫斗戏,才落得被流放到波斯的下场。

第二次希波战争

不管果戈是因为如传说中一般智商爆表,还是因为德玛拉托斯以前告诉过她蜡板有这种玩法,总之,多亏了她的金口玉言,这块蜡板的秘密总算是得见天日了——波斯人就要打过来了,而且还是十几万大军!斯巴达人赶快把这个消息告诉了其他希腊城邦。各个希腊城邦一听说这个消息,说这可不得了,咱们得赶紧布阵呐!于是各城邦连夜开始造战舰,总算是在波斯人打过来之前凑出了一支规模还不算小的联合舰队。

不巧的是,斯巴达这回不仅赶上了过节,还赶上了传说中的奥运会,议会不愿意派兵,国王列奥尼达一拍桌子,大敌当前你们还有心思过节?你们不派兵,那老子自己去了!于是,列奥尼达亲自带了300名壮士作为“贴身护卫”,北上战略要地温泉关,准备从陆路阻击波斯大_车。

德玛拉托斯的蜡板密信果然不是瞎说的,公元前480年,波斯国王薛西斯率领十几万大军,几百艘战船,从海陆两线直扑希腊而来。尽管有德玛拉托斯的剧透在先,希腊人虽然做好了迎战的准备,但士兵并不会凭空冒出来,双方实力差距依然悬殊。列奥尼达的300壮士加上其他城邦派来的援军不过数千人,但面对十几万波斯大军,勇敢的斯巴达人依然在温泉关坚守了七天,遗憾的是,最终温泉关被攻破,列奥尼达也英勇地战死沙场。

攻破温泉关之后,波斯大军从陆路长驱直入,攻陷了雅典城,还好雅典城的居民已经提前疏散,不然得成为第二个米利都了。眼看连雅典都丢了,希腊联军不得不撤退到雅典西部外海上的萨拉米斯岛。这时,联军指挥官地米斯托克利斯(Themistocles)提出应该引诱波斯人在萨拉米斯决战,他有三个理由:第一,波斯军队远道而来,陆路要兜一个大圈,所以补给全靠海军,如果把他们海军干掉,就等于断了他们补给;第二,波斯军队来自内陆,都没几个会游泳的,这一点咱们优势大大的有;第三,萨拉米斯海湾狭窄,波斯舰队船再多也施展不开,咱们可以诱敌深入,各个击破。这个战术真是相当天才,当波斯舰队被引入萨拉米斯海湾之后,就像钻进了面口袋一样挤在一起动弹不得,这时早已等候多时的希腊舰队倾巢而出,几乎全灭了波斯海军。希腊联军在萨拉米斯海战的胜利让第二次希波战争的局势上演了惊天大逆转,联军发动大反击,夺回了被波斯人占领的领地——当然也包括雅典城,而不甘失败的波斯人尽管继续骚扰了希腊一阵子,但最终只能放弃了占领希腊的念头,夹着尾巴回老家了。

希腊人能打赢第二次希波战争,当然主要应该归功于地米斯托克利斯的英明神武,不过德玛拉托斯的“蜡板传书”至少多给了希腊人几个月的准备时间,不然斯巴达军队可能都来不及驻守温泉关,希腊海军可能也没办法调集足够的战船,战争的局势可能就会大不一样了。有历史学家说,如果希腊没能在两次希波战争中挺过来,或许整个西方文明都会被扼杀在摇篮里。所以说,德玛拉托斯的这块蜡板算得上是轻于鸿毛,重于泰山呢。

五花八门的隐写术

隐写术是人类最朴素的一种“密码”,它和真正的“密码术”的关系就像一只黑猫一只白猫,反正只要抓住老鼠就是好猫。只要能把信息给藏起来,都属于隐写术的范畴,所以除了希波战争中的这两个故事之外,人类历史上还出现过各种各样五花八门的隐写术。

nlc202309091006

中国古代也有关于如何隐藏信息的记载,比如有一本很有名的兵书《六韬》,里面就是周武王问各种问题,然后姜太公来回答。其中有一段说周武王问:在外打仗的时候我怎么才能安全地传递书信给别的部队呢?姜太公就出了个主意,说你可以把书信的内容分成三部分,只看其中的任何一部分都无法看懂整个内容,然后把这三部分写成三份书信,分别找三个人送出去,只有对方同时得到这三个人身上的书信,合起来之后才能知道你要说什么,敌人就算截获了其中一封,也猜不透其中的玄机呀!这个办法叫做“阴书”,现在看起来也挺不靠谱的,不过放在先秦时期也算是不容易了。

除了古希腊的蜡板,中国古代也有用蜡来隐藏信息的记载。《资治通鉴》等文献中都提到过“蜡丸”,就是把书信团成小团,然后外面用蜡包裹起来。至于为什么要用蜡丸传书,有很多推测,有的说蜡丸可以防水,所以游泳过河传个密信什么的很有用;也有的说蜡丸可以伪装成药丸,藏在药品里面可以混过检查;还有更夸张的说法是蜡丸可以直接吞到肚子里,因为蜡不消化,过两天就原样拉出来了(也不知道古人是不是真的有那么重口)……

既然隐写术主要是隐藏写出来的文字,那不如改进一下写字用的墨水吧。实际上,在人类历史上占主要地位的一些隐写术方法,都是通过各种各样的“隐形墨水”来实现的。比如宋代以来的很多文献上都提到过“矾书”,就是用明矾水在白纸上写字,晾干之后字迹就“隐形”了,而只要把纸弄湿,上面的字就又显现出来了。这里面的原理是利用明矾(硫酸铝钾)遇水形成的氢氧化铝沉淀,氢氧化铝本身是白色的,附着在白纸上之后当然看不出来,但纸淋湿之后会变半透明,就跟你衣服淋湿之后的效果一样,这时附着在上面的白色氢氧化铝字迹就显现出来了。

除了矾书之外,古今中外的隐形墨水也是层出不穷。比如我们化学课都玩过的酚酞试剂,酚酞溶液本身是透明的,但是遇到碱性物质就会变红,这不就是活脱脱的隐形墨水嘛。此外,还可以利用合蛋白质等有机物的溶液写字,比如牛奶就不错,蛋白质等有机物加热之后会变色(也就是焦掉了),因此把纸烤一烤,上面的字就显现出来了。

要说近几年生活中最常见的“隐形墨水”,恐怕应该算是日本某公司生产的一种“可擦圆珠笔”了,这种笔写出来的字,可以用另一头的“橡皮”擦掉。实际上,橡皮并不是真的擦掉了墨水,而是橡皮和纸的摩擦产生了局部高温,这种墨水中的显色剂在65℃以上时会发生分解,于是墨水本身就变成了透明的。但如果冷冻到-10℃,显色剂还会重新结合,擦掉的字就又回来了,感觉比前面提到的那些隐形墨水好用多啦。

除了隐形墨水之外,还有其他一些有趣的隐藏信息的方法,不过这些方法可能已经不能算是隐“写”术了,因为它们都跟“写”没什么关系了。比如在“一战”和“二战”中,德国特务大量使用一种叫“微点”(microdot)的玩意儿来传递情报,这是一种特殊的缩微胶片,可以把一张A4纸大小的文件缩小成直径1毫米大小,得拿显微镜才能看到里面的内容。这么小个微点,如果贴在普通报纸或者书信中的句点上,或者字母i和i头上的小点上,那真是明眼人也看不出来——不过不幸的是,聪明的英国人后来识破了这一招,还根据这一线索抓到了不少德国特务,也真是魔高一尺道高一丈吧。

(“希波战争与古代隐写术”讲完了,下期又是新的故事了,期待一下吧!)

隐写分析 篇3

随着计算机网络以及多媒体通信技术的快速发展,近年来数字图像隐写技术以及隐写分析技术在信息安全领域得到了普遍与持续的关注。数字图像隐写技术是“通过看起来无害的宿主图像隐藏并传输秘密信息的一种艺术”,使得隐写图像避免遭受密码传输过程一类的攻击;图像隐写分析则与之对抗,是检测、分析数字图像是否存在这类信息的科学。可见,作为完美的隐写技术,其基本技术指标要求是隐写图像视觉上与原图像无法区分,统计上也应保持一致[1]。

最著名的LSB替换算法理论基础是假设数字图像LSB在统计上与二项分布相似,因而能够“用另一个随机二进序列替换而不会导致统计上差异”。Westfeld等人[2]通过实验证明,这个猜想不正确,“由于结构上与原宿主图像仍具有一定相关性,替换后其直方图将产生明显的阶梯效应”。统计模型的正确与否直接关系到隐写算法的有效性。本文主要从图像像素及像素间关系的特征函数出发,观察其常见统计模型的变化,为设计有效的图像隐写算法及其隐写分析算法提供依据。

2. 数字图像LSB常见统计模型

2.1 二进随机比特流:二项分布

根据既有文献,最常见的统计模型是数字图像LSB作为二进随机比特流。将该模型用于图像LSB平面,可以看到其中取0与取1的频次大致相等,因此与二项分布相似。Westfeld等人针对这类统计模型进行分析觉察到其中像素比特位之间的相关性,发现了著名的“阶梯效应”现象,并在此基础上提出了“视觉攻击”的隐写分析方法。随后,他们进一步将LSB分析扩展到整个像素,提出了卡方测试的分析方法[3]。

通过对像素比特平面之间关系分析,LSB替换的等价变化可以用LSB翻转来模拟。在这个基础上,Fridrich与Dumitrescu分别提出RS分析[4]和SPA分析[5]。类似地,Zhang等人[6]于2003年通过计算横跨奇偶比特平面数的方式构造另一统计模型GPC,规律与LSB翻转统计规律非常接近。事实上,我们已经从数学上证明两者实际上是等价的[7]。

2.2 一维直方图

一维直方图,即面向灰度量级的频次统计模型。Westfeld等人[3]首先发现了LSB替换前后数字图像直方图的变化差异,并由此提出了效果良好的卡方检测方法。

Zhang与Ping等人[8]提出了图像与其水平偏移一个像素后生成的新图像差为该图像的差值图像,并假定其直方图即差值图像直方图(DIH,Difference Image Histogram)满足广义高斯分布,用若干平移系数构造LSB平面不变、LSB平面全部翻转、全部置0后差值图像直方图之间的关系,基于LSB平面与其它平面之间尚存的弱相关性,可以采用前面平移系数构造精确计算隐藏信息比特数的二次多项式模型的4个关键点。

Mahdavi等人[9]则对直方图形态在隐藏前后变化差异作了细致的分析,发现直方图相邻bin对根据嵌入信息是否同时影响两者而具有关联与不关联两种情况。这样,通过比较关联bin对与不关联bin对,可以得到隐藏信息长度。仿真结果表明,基于该模型的隐写分析,其结果优于RS分析。

2.3 高维直方图

如果一维直方图反映了图像像素的“点特征”,那么信息隐藏前后差异更多地可以通过“点间关系”改变来检测。作为一种常见邻居关系测度,二维共生矩阵在邻居关系突变方面效果较好。基于此一些研究人员提出二维直方图检测方法[10]。

采用文献[10]的标记方法,对于有N个灰度级的灰度图像,N×N阶共生矩阵可以定义如下:

其中r为步长,为方向,P为归一化概率,其离散形式即频次。显然,我们可以根据同类方式构造维度更高的共生矩阵,并得到相应维度的直方图。理论上,维度越高,表达像素之间关系类型越多,其信息隐藏前后差异特征数也越多,从而越容易检测出图像是否存在隐藏信息。但实际上不尽然。原因大抵有二:(1)计算量大。维度越高,特征数据集越大,分类算法越复杂,甚至有可能是NP完全问题;(2)未必有效。维度多,并非必然每个维度的差异对任意图像内容而言都同样显著,因此可能对某些图像检测有效的参数值,用于其它图像其效果甚微。

笔者认为,如果对维度选择恰当,例如3维或4维左右,则基本可以将像素邻居相关性约束利用干净,由此构造共生矩阵应该能够较好反映隐写前后像素点关系改变状况,取得较好的检测效果。事实上,我们当前正在进行相关模型的测试,预计不久将报道其检测结果。

3. 数字图像LSB统计模型的特征变化

注意到上述常见统计模型都直接来自图像像素或像素邻居关系的频次统计规律,能够在很多情况下表达图像隐写前后的差异。但是,这些直接统计关系常常忽略了不少有用的图像结构信息,例如空间相位信息等,使得当改变发生在这些区域内(例如采用成对、交替等规避方法),相应的统计规律不会产生任何变化,即其统计特征可以保全。因此,必须针对这些统计模型的特征变化作更为深入的探讨。

3.1 直方图特征函数的变化

Harmsen和Pearlman[11]将LSB信息隐藏过程视为一种加性噪声扰动。设宿主图像直方图为,加性噪声概率质量函数为,隐写图像直方图为,则隐写过程模型化为:

取离散傅里叶变换(DFT),有频域关系

称为直方图特征函数(HCF),其质心(COM)为

其中,,N为DFT长度。Harmsen和Pearlman指出,信息隐写后必有

成立,若经过有监督训练后能够得到合理的分类阈值。公式(5)所表达的几何特征即,图像直方图特征函数的质心在隐藏一些信息后有下降趋势,并且隐藏越多,这种下降趋势越强。

如果说LSB替换将导致图像直方图的整体改变,而经过LSB匹配算法后其直方图将不会有整体的改变,而表现为局部差异。事实上,Zhang等人[12]发现,采用LSB匹配算法隐藏信息后,图像直方图的局部最大值将减小,而局部最小值将增大。如果将大小为3×1或5×1的某个掩码求取相应直方图的局部最大值和最小值,那么可以构造基于这一最大、最小差异的“直方图包络”。据此,他们提出,由于隐写后“图像直方图的局部最大值将减小,而局部最小值将增大”,其包络面积必将大幅度减小,即

可见经过有监督训练后不难得到进行甄别的阈值。

3.2 图像质量评价指标特征函数的变化

Avcibas等人[13]指出,“隐写过程留下的统计差异可以用于检测是否隐写”。由此他们得到的一个基本结论是,“对未加隐写信息的图像滤波操作,其图像质量指标IQM改变与隐写信息所致变化不同”。通过实验选取多个图像质量指标IQM,根据训练阶段是否包含隐写信息分别将其得分归一化为1和-1,可以建立以下统计回归方程:

其中标记IQM得分,i=1,…,N表示第i个测试图像,j=1,…,q表示第j个IQM,β为相应回归系数,ε为均值为0的高斯噪声。回归系数确定后,用于检测的特征函数可表示为

其中仅仅选用q个IQM指标值。检测规则为,若则图像为隐写图像,否则不是隐写图像。尽管不失为一种有效的隐写分析方法,应该注意到其中也存在许多问题。首先,图像质量指标有很多,有基于像素的,有基于结构的,而且基于像素的易受噪声影响,基于结构的则对像素的局部微小变化不敏感,因此,如何选取这些指标,统计回归过程能否较好平衡上述矛盾关系,也许还需要进一步研究才能有所洞见。

4. 结论与展望

隐写分析 篇4

针对卷积码内容自适应隐写的检测,近年来的主流研究趋势是,借助机器学习的方法,构造集成分类检测器。在机器学习领域,目前较成熟的集成分类器是基于Fisher二值判别器的随机森林分类器。构造集成分类检测器最棘手的问题是,采用什么样的低维模型(特征向量)表示图像。目前最有影响力且具有奠基意义的是空域富模型SRM[2](spatial rich model),其中“富”字指融合多种相异特征于一体。投影富模型PSRM[3](projection spatial rich model)和最大修改率富模型max SRM[4]都是SRM的重要派生版本,还有多种其他变体[5,6,7]。SRM与PSRM的特征向量分别是量化残留噪声共生矩阵(co-occurrence)的并集与残留噪声随机投影直方图(histogram)的并集。这些特征在本质上分别是量化残噪随机向量与残噪投影随机变量的概率质量函数,是对残噪样本的一种统计量,刻画概率分布的形态,充当集成分类器的判据。2014年6月,文献[5]提出对SRM的改进,只根据部分修改率最高的像素计算共生矩阵,尽管参与的数据量有所减少,但对WOW[8](wavelet obtained weights)隐写算法的检测准确度却有所提高。2014年12月,文献[4]把文献[5]的方法进一步泛化提升,从全体像素采集信息,在共生矩阵中累加四个相邻像素修改率的最大值,成功实现了像素嵌入修改率这个内容自适应要素(已知的选择信道信息)的融入,对多种内容自适应嵌入算法的检测准确度均有不同程度提高,这个SRM派生版叫做max SRM。但是,文献[4]的方法只能在空域执行却无法在JPEG域工作(因DCT系数与残噪样值之间不存在双射关系),也不能向PSRM特征推广,特别地,像素修改率不是残噪本身的统计特性。本文提出的改进办法是,用残噪L1失真的期望值取代像素的修改率,并在共生矩阵或直方图中累加这个残噪统计量。

1 SRM、PSRM与max SRM概要

符号X与分别表示n1×n2的8位灰度载体与隐写图像,相应的小写符号xij与yij分别表示其中的像素。有限集S的元素个数用|S|表示。

1.1 SRM

SRM[2]与PSRM用相同方法计算图像残留噪声,但用不同方法表示残噪统计特性。SRM采用四维共生矩阵,而PSRM则用残噪投影的直方图。

残留噪声是对图像噪声分量的一种估计,是像素原值与其预测值之差,预测值由定义在原像素去心邻域上的预测器函数确定。这两个富模型均采用45个不同的像素预测器(线性与非线性两种类型)。线性预测器是平移不变、有限脉冲响应高通滤波器(由核矩阵K给出)。残噪矩阵Z与原图像X同维,由式(1)定义,即

式(1)中的*是卷积运算符。例如SRM的子模型spam14h的线性残噪计算式为zij=xi,j+1-xij,其中原像素xij的预测值为其水平右邻xi,j+1,相应核矩阵K=(-1,1)。SRM的所有非线性残噪值为2~5个线性残噪的最大/最小值,如式(2)和式(3)分别从水平与垂直两个方向计算线性残噪Zh=(zhij)与Zv=(zvij),即

由这两个spam线性残噪可得到式(4)和式(5)的两个minmax非线性残噪,即

构造SRM的第2步:用量化器Q-T,T对Z进行量化,得到式(6)的量化残噪rij,共(2T+1)个量化级Q-T,T={-Tq,(-T+1)q,…,Tq},其中T>0为整数量化截断门限,q>0为量化步长,即

构造SRM的第3步:按式(7)由量化残噪rij的4个相邻(水平与垂直)值计算整个图像的4阶共生矩阵CSRM∈Q4-T,T,即

式中[]代表命题运算符,意义是:若命题为真则[命题]取值为1,若命题为假则[命题]取值为0。例如:[8是偶数]=1,而[8是奇数]=0。为保证共生矩阵取值稠密而具有良好统计意义,文献[2]指出:T=2,q∈{1,1.5,2},因此共生矩阵的维数为|Q-T,T|4=(2T+1)4=625。

构造SRM的最后一步:利用图像对称性进一步降低共生矩阵维数并提高其样值稠密度,经对称化处理后,每个spam型共生矩阵维数由625降为169,而每一对minmax型共生矩阵维数由2×625降为325。

文献[4]指出,若采用‘d2’扫描方式计算共生矩阵,检测性能会略有提高。这种共生矩阵按式(8)计算,即

式(7)和式(8)的共生矩阵均按水平方向计算,垂直版本(略)容易仿写。采用3个量化步长的SRM总维数是34671,只采用1个量化步长的SRM总维数是12753,并用SRMqx表示,其中x∈{1,1.5,2}。

1.2 PSRM

PSRM[3]采用与SRM相同的预测器计算残噪,所得残噪矩阵Z与SRM的完全相同。与SRM不同的是:PSRM不用共生矩阵、而是采用残噪向多个随机方向投影的直方图(一阶统计量)来刻画残噪的统计特性。从残噪矩阵Z出发,构造PSRM的步骤如下。

(1)生成v个随机矩阵Πk∈Rr×s,其中R是全体实数集,k∈{1,…,v},r和s从{1,…,max}随机均匀选取,v、max是PSRM的整数参数,由实验确定。Πk的元素服从标准正态分布且须规范化。

(2)对每个k∈{1,…,v},计算残噪投影,其中*是卷积运算符。

(3)对于线性残噪投影,按式(9)用量化器QT对进行量化,共(T+1)个量化级QT={1/2,3/2,…,T+1/2},即

对于非线性残噪投影,按式(10)用量化器Q'-T,T对pkij/q进行量化,共2(T+1)个量化级Q'-T,T=-QT∪QT,即

(4)分别计算v个量化投影矩阵的直方图,对于spam线性残噪投影按式(11)计算,即

对于minmax非线性残噪投影按式(12)计算,即

为了提高直方图的稠密度,如同SRM一样,对v个随机矩阵Πk也要进行对称化处理。根据残噪与随机矩阵特点,共执行8种对称化操作。

基于图像库实验,PSRM的标准参数设置如下:不同方向的投影数v=55,投影矩阵维数上限max=8,量化步长q=1,量化截断门限T=3。这些参数设置决定了PSRM特征向量的总维数为12 870,与SRMqx的维数相当,便与进行性能比较。

1.3 max SRM

max SRM[4]是一种利用选择信道信息的SRM,是SRM的重要派生版。max SRM采用相同的预测器计算残噪,所得残噪矩阵Z与SRM的完全相同。与SRM不同的是:max SRM在共生矩阵中不再累加随机向量样值的出现次数,而是累加嵌入修改率(从目标图像估计而来),从而实现对概率选择信道信息(内容自适应要素)的利用。max SRM按式(13)计算共生矩阵,即

式(13)中的共生矩阵Cmax SRM是CSRM的改进版,其中融入了概率选择信道信息,不再累加随机向量样值的出现次数,而是累加4个相邻像素的嵌入修改率的最大值。因此以小概率被修改的像素四元组比至少含1个高修改率像素的组对共生矩阵值的影响更小一些。max SRM的其余构造步骤与SRM完全相同,所以max SRM的特征向量维数与SRM也完全相同。这里给出采取‘d2’扫描方式的共生矩阵计算式(14),即

式(14)中

2 用残噪L1失真期望取代修改率

上文提及,max SRM的“残噪”共生矩阵累加量却是对应“像素”的嵌入修改率,正是这种有点怪异的不一致性促使本文尝试残噪本身的统计量。假如模型特征是根据像素值而不是根据残噪构造出来的,那么像素修改率就与L1以及L2嵌入失真的期望成正比。这是因为大多数现代隐写算法均以修改率βij对载体像素xij执行±1修改,即yij=xij+1和yij=xij-1。因此E[|xij-yij|]=E[|xij-yij|2]=2βij。这就从反面证明了尝试本文改进思想的必要性。下面先针对线性残噪陈述本文的改进方案,再对非线性残噪的有关问题进行讨论。

2.1 线性残噪

SRM线性残噪矩阵Z直接依赖X,是X与核矩阵K的卷积,由式(15)表示,即

式(15)中,下标k、l的范围取决于K的支撑集。在PSRM中,式(15)的残噪还要与投影矩阵∏执行卷积,由式(16)表示,即

由于卷积运算遵守结合律,因此SRM和PSRM统计特征(4阶共生矩阵与1阶直方图)的样本源都是目标图像与一个核矩阵的卷积。对于利用卷积码使加性嵌入噪声最小化的隐写算法而言,隐写信息的嵌入等价于为载体图像叠加一种噪声,其分布依赖于像素位置,即yij=xij+ξij,其中ξij是噪声变量并在{-1,0,1}内以概率质量βij、1-βij和βij独立取值。因此残噪差Z(Y)-Z(X)的每个元素也是随机变量,其均值和方差可按式(17)计算,即

尽管可以按式(18)直接计算残噪L2平方失真的期望,即

但由于嵌入修改的独立性,要计算残噪L1绝对失真的期望E[|zij(Y)-zij(X)|]将困难很多。为此假定zij(Y)-zij(X)是均值为0方差同式(17)的高斯变量(简化问题),这样就容易确立式(19)的正比关系,即

实验表明,L1嵌入失真期望的高斯近似同L2失真相比要好很多,这正是本文在线性共生矩阵和直方图中把σij作为累加量的原因。本文对于线性残噪SRM特征的改进方案是:用σij替换式(13)和式(14)的,式(13)的改进版由式(20)给出,即

式(14)的改进版因易仿写而省略。

对于线性PSRM特征的改进方案是:用式(21)的σ版代替式(11)的样本个数版,即

其中运算符[]的意义同式(7)。

2.2 非线性残噪

非线性minmax残噪的情形要复杂很多,因为被计算最大/最小值的那些残噪是相关的随机变量。最极端情况是SRM的EDGE5×5残噪的minmax41子模型,最大/最小值要取自4个线性残噪值(每一个都依赖选自5×5像素块的15个相邻像素)。要计算这种L1/L2失真的期望需要计算拥有325个值的25维概率质量函数的边缘分布。不存在计算复杂性足够低的算法能在合理时间内完成特征的提取。还可以假定残噪服从高斯分布,反复化简两个高斯变量的最大/最小值分布的分析表达式。但是,高斯假设对支撑集较小(如minmax54)的残噪是无效的,而且这种简化处理还会导致性能的次优化。还有一种可能是利用Monte-Carlo模拟法估计期望值E[|zijmin(Y)-zijmin(X)|]。尽管这种方法的开销也相当大,但它能够在理论上给出检测性能的改进程度。

3 实验结果

实验选用BOSSbase标准图像库,内含10000幅8位512×512灰度图像。在等同先验条件下,基于测试集,采用差错概率评价检测器准确度,其中PFA和PMD分别是虚警和漏警概率。在实验结果插图中给出PE的平均值珔PE。

把以L1失真期望E[|zij(Y)-zij(X)|]为共生矩阵累加量的max SRM的改进版记为σmax SRM。根据式(19)计算线性残噪的σij,而minmax残噪的σij则通过对目标图像执行500次嵌入的样本,借助于Monte-Carlo模拟法求得。对于PSRM,只采用其对应线性残噪的spam子模型(维数减小到1980),记为σspam PSRM。

实验一用来说明本文改进方案的性能,选用含12 753个特征的σmax SRMq2d2富模型,其中d2表示计算共生矩阵时采用d2扫描方式。表1显示当载荷为0.5 bpp情况下,针对隐写算法WOW[8]、HILL[9]和MVG[10]的关于改进版σmax SRMq2d2与原版max SRMq2d2的检测差错率比对结果,检测差错率珔PE减小约0.3%~1.5%。

实验二只针对PSRM对应线性残噪的spam特征进行,把改进版σspam PSRM与文献[3]的spamPSRM进行比较(两者维数均为1 980),结果在图1~3中显示。对3种嵌入算法,检测准确度均有显著改善,对于WOW和HILL算法的改善尤为明显,检测差错率珔PE减小2.5%~6%。实际上,对于HILL和MVG隐写算法,这个只含有1 980个特征的σspam PSRM却达到了比含有34 671个特征、计算复杂度更高的max SRMd2更好的检测准确度。对于HILL算法,载荷为0.4 bpp情况下,σspam PSRM的检测准确度比max SRMd2提高0.5%,比文献[3]的spam PSRM提高2.3%。

4 结论

现代内容自适应隐写的检测要求在低维特征空间表示载体与隐写图像,并借助机器学习工具来构建检测器。目前,如何把像素嵌入修改率这种选择信道信息融入特征向量仍是悬而未决的问题。这些概率对于隐写分析者而言是可以利用的,因为像素修改代价可从隐写图像估计出来,还因载荷的不确知对隐写分析的准确度影响并不大。

目前的方法(max SRM特征集)要求在残噪共生矩阵中累加像素修改率。鉴于多个像素决定一个残噪样值,故应计算嵌入修改对于残噪本身的统计影响,并在共生矩阵中累加这个统计量。因此本文提出把嵌入所致的L1残噪失真的期望值作为共生矩阵累加量。对于线性spam像素预测器,嵌入对残噪的影响容易从嵌入修改的独立性与嵌入失真服从高斯分布的假定得到。而对于非线性minmax预测器,残噪的L1失真期望难以用数学分析方法得到。因为这需要计算本身依赖多达25个像素的5个相关随机变量的最大/最小值的期望。本文采用Monte-Carlo模拟法计算这种期望。

本文提出的改进思想适用于SRM特征集和仅由线性残噪构建的PSRM特征子集(维数1980)。对PSRM的这种减缩处理对保持较低计算复杂度是必要的。实验显示,本文提出的累加统计量的确提高了检测准确度为0.5%~1.5%;对于PSRM的情形,提高十分显著。与文献[3]的PSRM的相同特征子集相比,检测差错率下降多达6%,而且与计算复杂度更高的、34 671维的max SRMd2模型相比,其检测准确度相当,有时还略高一点(对HILL和MVG算法)。

本文提出的富模型特征改进方案并未增加模型维数,当模型被限制在与线性残噪对应的子模型时,计算开销的增长可以忽略,因为要计算一种残噪的L1失真期望只需三次卷积即可。

参考文献

[1] Pevny T,Filler T,Bas P.Using high-dimensional image models to perform highly undetectable steganography.Information Hiding,12th International Conference.Calgary,Canada,2010:161-177

[2] Fridrich J,Kodovsky J.Rich models for steganalysis of digital images.Information Forensics and Security,IEEE,2012;7(3):868-882

[3] Holub V,Fridrich J.Random projections of residuals for digital image steganalysis.Information Forensics and Security,IEEE,2013;8(12):1996-2006

[4] Denemark T,Sedighi V,Holub V.Selection channel aware rich model for steganalysis of digital images.IEEE International Workshop on Information Forensics and Security.Atlanta,America,2014:183-188

[5] Tang W,Li H,Luo W.Adaptive steganalysis against WOW embedding algorithm.2nd ACM IH&MMSec.Workshop.Salzburg,Austria,2014:91-96

[6]张聪,张敏情,刘佳.基于富模型的分层量化隐写分析算法.计算机应用研究,2016;33(1):255-258Zhang C,Zhang M Q,Liu J.Layered quantitative steganalysis using rich model.Application Research of Computers,2016;33(1):255-258

[7]张敏情,刘佳,马占山.基于仿射传播聚类的富模型降维方法.四川大学学报,2016;48(2):91-96Zhang M Q,Liu J,Ma Z S.Dimension reduction method of rich model using affinity propagation clustering algorithm.Journal of Sichuan University,2016;48(2):91-96

[8] Holub V,Fridrich J.Designing steganographic distortion using directional filters.IEEE International Workshop on Information Forensics and Security,Tenerife,Spain,2012:234-239

[9] Li B,Wang M,Huang J W.A new cost function for spatial image steganography.Proceedings IEEE,International Conference on Image Processing,ICIP,Paris,France,2014:4206-4210

隐写分析 篇5

随着网络信息技术飞速发展, 对信息隐藏的要求越来越高。隐写术[1] (steganography) 是信息隐藏技术[2]的一个重要分支, 一般是指将秘密信息嵌入或隐藏到其他不受怀疑的公开信息之中[3], 其实现算法可分为空域算法 (如LSB算法[4]) 和变换域算法。常用的变换域算法[5] (如:离散余弦变换 (Discrete Cosine Transform, DCT) 域算法[6]和离散小波变换域算法等) 是指, 首先对载体信号进行适当的变换, 然后对变换后的数据进行适当的处理, 从而嵌入秘密信息的过程。针对离散余弦变换域算法的实验仿真结果进行了研究, 主要分析了秘密信息在图像DCT域中的嵌入位置、载体图像对隐写效果的影响。

1 基于DCT域的数字图像隐写术

离散余弦变换是数字信号处理技术[7]中最常用的线性变换之一, 对一幅图像进行DCT变换, 许多有关图像的重要可视信息都集中在DCT变换的一部分系数中。一个M×N矩阵A的二维DCT变换定义为:

式中:Bpq称为A的DCT系数, B00为直流系数, 其他为交流系数,

为了和JPEG压缩标准一致, 一般把原始图像分成大小为8×8[8]的块, 然后对每个分块进行DCT变换。为了便于信息嵌入算法[9,10]的实现, 通常对变换后得到的8×8频域系数进行Z字形扫描, 从而使低频系数位于高频系数之前。8×8的图像块变换后得到64个系数, 其中 (0, 0) 为直流系数DC, 其余的63个为交流系数AC, 如图1所示。

秘密信息的嵌入 (秘密信息的提取, 是嵌入过程的逆过程) :

首先需要将JPEG标准推荐的亮度量化表[8]作为本算法的缺省Q表 (矩阵) 。

算法流程[11,12]及实例如图2所示。

2 仿真实验及结果分析

2.1 图像质量评价方法

图像质量评价方法[13]可分为客观评价和主观评价两类。采用主观评价和峰值信噪比 (Peak Signal to Noise Ratio) 客观评价2种方法对图像质量进行评价, 峰值信噪比PSNR计算公式如下:

2.2 仿真实验及结果分析

本算法在Windows XP操作系统和VC++6.0平台下设计实现。所采用的原图像为:512×512的Lena图像和mother图像。

按照本文的嵌入算法, 选择标准推荐的亮度量化表进行实验。实验中对嵌入的位置和嵌入的信息量进行变化, 得到图像的峰值信噪比如表1所示。

2.2.1 不同嵌入位置的仿真实验分析

在不同位置嵌入14 873 byte后, 观察图像的降质情况, 结果如图3、图4、图5和图6所示。

通过图像对比可以看出, 在嵌入相同信息量的情况下, 选择不同的嵌入位置, 图像有不同的隐写效果。图3、图4和图5的图像质量变化较小, 图6出现了明显的失真, 图像肩膀附近出现了一些黑点。在这个实验中, 当嵌入位置靠前时, 图像的隐写效果较好, 且隐写图像与原图像相比, 象素值分布较为接近;当嵌入位置靠后时, 图像的隐写效果欠佳, 隐写图像与原始图像相比象素值分布较远。因为, 8×8的系数块经过Z字形扫描后, 低频部分的数据集中在前面, 而高频部分的数据集中在后面, 又由于高频部分数据的变化更容易被检测, 也更容易被人眼察觉, 所以, 将信息嵌入在低频部分有较好的信息隐藏效果。

2.2.2 不同嵌入信息量的仿真实验

在2~14位嵌入不同信息量后, 观察图像的降质情况, 结果如图7、图8、图9和图10所示。

通过实验可以得出, 在嵌入较大的信息量后, 经隐写后的图像和原图像象素分布极为接近, 从肉眼上也难以分辨出图像的变化。

2.2.3 不同载体图像的仿真实验

在嵌入位置和嵌入信息量一定的情况下, 改变载体图像。实验中, 分别在Lena、mother图像的2~14位嵌入秘密信息, 并逐渐改变嵌入信息量, 观察图像的变化情况, 实验结果如表2所示。

用原图与在2~14位嵌入14 873 byte的载体图像对比, 观察图像的降质情况, 结果如图11所示。

通过实验可以得出, 在嵌入位置和嵌入总比特数都相同的情况下, 当载体图像不同时也会有不同的隐藏效果。在本实验的条件下, Lena图像隐写效果较好, 峰值信噪比大, 嵌入信息后的图像象素值分布和原图像的象素值分布相比极为接近, 且图像质量没有出现可视的变化。而mother图像的峰值信噪比相对较差, 图像质量的变化可以用肉眼看出, 且嵌入信息后的图像象素值分布和原图像的象素值分布相比, 也出现了较明显的改变。因此, 选取象素值分布较丰富的图像, 有利于提高图像的隐写效果。

3 结束语

介绍了基于DCT域的图像隐写术算法, 重点分析了该算法的实验仿真结果的数据和图像。分析结果表明:将信息嵌入图像的低频部分, 选择合适的信息量, 选取象素值分布较丰富的图像, 有利于提高信息在图像中的隐写效果。

摘要:在多媒体通信的安全问题上, 隐写术起着至关重要的作用。针对隐写术中常用的DCT域数字图像隐写方法, 对秘密信息在mother和Lena图像中的隐写效果进行了仿真, 研究了秘密信息在图像DCT域中的不同嵌入位置、不同的载体图像进行隐写时, 对图像质量所产生的影响。研究表明:将信息嵌入图像的低频部分、选取像素值分布较丰富的图像, 有利于提高信息在图像中的隐写效果, 增强秘密信息的隐蔽性。

隐写分析 篇6

随着信息科学技术的发展,日益快速的网络信息传递使人们的生活变得方便快捷,同时也使得信息安全问题日益突出。除了传统的密码技术,近几年兴起的一种通信安全技术———隐写术得到了人们高度重视。国内外的恐怖组织利用隐写术传递信息,并成功实施多起犯罪活动,其中利用图像作为载体的隐写术是最重要的技术之一。如何有效地检测图像中可能存在的隐写信息,成为人们研究的热点问题。

早期Fridrich等[1]提出了基于DCT域和DCT边界统计量的检测方法,该方法首先对测试JPEG图像进行解压、裁剪、再压缩处理得到校准图像,然后分别提取DCT系数统计特征,计算差值,得到23维特征向量。该方法对多种隐写术有较高的检测性能,但是对MB算法[7]检测效果较差。近几年,Shi等[2]提出了一种基于马尔科夫模型的隐写分析算法,该算法定义了JPEG 2-D数组,首先计算2-D数组沿水平、垂直、对角和反对角方向的差分数组,然后分别沿各自方向上计算马尔科夫矩阵特征值,构造324维特征向量,取得了较好的检测效果,但差分数组的构造不是分块进行的,不能很好地体现DCT块内系数的相关性。Pevny等将文献[1]提出的23维特征扩展到193维,结合文献[2]提出的马尔科夫特征,然后进行校准处理,得到274维特征向量,对常见的JPEG图像隐写术有很好的检测效果。Chen等[4]对文献[2]提出的算法进行了扩展,考虑了DCT块内和块间相关性,计算马尔科夫特征值,构造486维特征向量,取得了很好的检测性能。

本文在文献[1,2,4]的基础上,提出一种改进的JPEG图像通用隐写分析算法。该算法首先提取DCT块低频AC系数的统计特征,再利用联合概率密度矩阵提取DCT块内和块间统计特征,然后采用校准处理,最后得到243维特征向量。实验选用支持向量机构建分类模型。对CBIR图像抽取的600幅图像,采用F5[5]、Outguess[6]、MB1[7]三种常见的隐写算法,嵌入不同长度的信息,得到测试的隐密图像。实验证明,本文提出的JPEG图像通用隐写分析算法比文献[1,2]及其他常见的检测算法具有更好的检测效果。

1 相关概念

Shi等[2]提出在DCT域使用差分矩阵和马尔科夫矩阵构建二阶统计特征,实现对JPEG图像的隐藏检测,取得了不错的效果。Liu等[10]认为信息嵌入会导致相邻DCT系数的联合概率分布发生改变,而转移概率矩阵并不能完全捕获这种变化,所以采用联合概率密度矩阵取代马尔科夫转移概率矩阵,改进效果明显。本文引用了差分矩阵和联合概率密度矩阵的概念。

给定测试JPEG图像,该图像的DCT系数2-D矩阵的绝对值为F(u,v),(u∈[1,M],v∈[1,N]),其中M表示图像的高度,N表示图像的宽度。差分矩阵的产生公式如下:

其中u∈[1,M-1],v∈[1,N-1],Fh(u,v),Fv(u,v),Fd(u,v),Fm(u,v)表示在水平、垂直、对角和反对角方向上的差分矩阵。

目前常见的隐写算法都是对DCT系数修改来隐藏信息,相邻DCT系数的联合概率分布很有可能会发生改变,文献[10]提出使用联合概率密度矩阵来捕获DCT系数的相关性。相邻DCT系数的联合概率密度矩阵计算公式如下:

2 算法描述

本文算法采用了传统的“特征提取+分类”模式。因为大多数JPEG隐写术都是直接在DCT域进行数据隐写,所以本文直接在DCT域构建三类特征:块内统计特征、块间统计特征和低频AC系数统计特征,所有特征都进行校准处理,再用支持向量机分类器进行分类。

2.1 特征提取

1)DCT域块内特征

尽管在块DCT变换中,对应于块内不同系数的基函数是基本正交或近似正交的,但是两个DCT系数间是非独立的,也就是块内DCT系数间存在相关性。

构造块内特征步骤如下:

(2)对每个块Fi,根据式(1)-式(4)计算水平、垂直、对角和反对角4个方向的差分矩阵Fih、Fiv、Fid和Fim。

(3)然后再根据式(5)-式(8)计算差分矩阵的联合概率密度Cih、Civ、Cid和Cim。

(4)为了减少特征维数,先对4个差分矩阵的联合概率密度计算平均值,再计算所有联合概率密度的平均值。计算公式如下:

(5)参考文献[4],兼顾特征的复杂度和检测正确率,设置阈值T=4,构造81维特征。

2)DCT域块间特征

由于自然图像空域像素存在着强相关性,而块DCT变换的对象是8×8像素块,对于像素8×8块外的相关性在DCT变换后得到了很大的保留,这种关联在频域中表现为相邻系数块的相关性。DCT系数块间特征就是捕获处于相邻子块同一频率的两个DCT系数间的相关性。

构造块间特征的步骤如下:

(1)根据图1,从每个8×8块内的相同位置提取系数组成系数矩阵,得到63个相同频率的AC系数二维矩阵,记为F1~F63。

(2)对每个Fi,i∈[1,63],根据式(1)-式(4)计算水平、垂直、对角和反对角4个方向的差值矩阵Fih、Fiv、Fid和Fim。

(3)对4个差值矩阵,根据式(5)-式(8)计算各自的联合概率密度矩阵Cih、Civ、Cid和Cim。

(4)为了避免特征数量过多,先计算4个联合概率密度矩阵平均值,最后,计算所有63个块的联合概率密度矩阵的平均值。

(5)兼顾检测正确率和计算复杂度,选择阈值T=4,得到81维特征。

3)DCT域低频AC系数统计特征

假定JPEG图像的DCT系数矩阵表示为dij(k),其中i,j=1,2,…,8;k=1,2,…,NB;dij(k)表示第k个DCT系数块的(i,j)位置上的量化后的DCT系数。

由于JEPG图像的大部分能量主要集中在低频部分,因此,在低频部分提取特征能捕获信息嵌入对图像的改变。构建如下特征:

选择合理的变量d可以在保证信息量丢失极少的前提下减小统计特征的计算复杂度。根据表1,兼顾这两方面,设置变量d=4,构造81维特征。

4)校准特征

一般情况下,图像隐写检测是唯载密攻击,即检测方只能获得待检测的图像,无法获得原始图像。但是检测方可以构造出一幅统计特性与原图相近的参考图像。为此,文献[1]提出一种“解压、裁剪和再压缩”的校准技术来估计原始图像。校准过程如图2所示。

校准技术可以消除图像内容对检测效果的影响,能更敏感地捕获隐秘信息嵌入导致的图像统计规律的变化。对测试图像和校准图像分别提取DCT域块内特征、块间特征和低频AC系数统计特征,记为F(J1)和F(J2)。计算两者才差值,得到校准特征F=F(J1)-F(J2)。

2.2 支持向量机(SVM)

支持向量机的主要思想是建立一个超平面作决策曲面,使得正例和反例之间的隔离边缘被最大化。支持向量机是目前隐写检测领域广泛使用的分类器。本文使用文献[9]提出的LIBSVM开发包。在对样本进行训练和测试之前,需要对样本进行归一化处理。SVM采用径向基函数(RBF)内核,设置惩罚参数c=[2-8,28],RBF核参数g=[2-8,28],交叉验证参数v=5,参数寻优c和g的步进大小为cstep=0.5,gstep=0.5。采用网格寻优方法来选取最优参数,建立分类模型。

3 实验测试及结果分析

3.1 实验流程

首先,建立原始图像库和隐秘图像库。实验选用600幅来自CBIR图像库的彩色图像作为原始图像,图像的内容包括人物肖像、自然风景、建筑、动物等。将这些原始图像统一处理成大小为512×512、质量因子为75的JPEG图像,以此作为实验用的原始载体图像库。实验测试的隐藏方法为F5、MB1、Out Guess三种隐写算法,由于主要研究算法在低嵌入率下的表现,所以实验只用到了图像嵌入最大容量的10%、20%和40%一共三种嵌入率。分别对600幅图像以三种隐写算法三种嵌入率嵌入信息,共得到600×9=5 400幅隐秘图像。

每次随机选取400幅原始图像和400幅某种算法以某种嵌入率(10%、20%、40%)得到的载秘图像,作为训练样本,其余的作为测试样本。为了检验稳定性,程序运行10次,每次重新随机选择训练样本和测试样本,并求其平均值。实验流程如图3所示[8]。

3.2 实验结果及分析

低嵌入率下的隐写检测是目前该领域的一大难点。因为嵌入率越低,对DCT系数的修改就越少,从而隐秘图像与原始图像之间的差异也就越小,导致检测的难度变大。所以本文主要研究低嵌入率下对隐写算法的检测。本文选取了Fridrich[1]和Shi[2]作为对比算法,实验结果如表2所示,其中TNR(true negative rate)表示载体图像的检测率,TPR(true positive rate)表示隐秘图像的检测率,AR(accuracy rate)表示最终检测率,计算公式为AR=(TNR+TPR)/2。

从表2的数据可知,本文算法对MB1算法和F5算法的检测率都有很大的提高,Out Guess算法由于嵌入改变原始图像DCT系数直方图的特性,因此三种检测算法都有很好的检测率。MB1算法为了保持原始图像DCT系数整体分布特性,修改了更多的DCT系数值,从而使得图像的二阶特征变化更明显。文献[2]和本文都提取了DCT系数的二阶统计特征,因而能对MB1算法进行有效检测。F5算法通过矩阵编码有效提高了嵌入效率,但是嵌入过程出现分块效应,本文特征充分利用F5嵌入过程中的分块效应,有效地提高了对F5算法的检测率。

4 结语

本文提出一种基于校准DCT特征的JPEG图像通用隐写分析方法,算法利用校准处理得到近似原始图像,然后分别提取隐秘图像和近似原始图像的特征向量,计算差值得到校准特征。校准特征能更灵敏地捕获信息嵌入对图像的更改,从而有效提高检测率。本文主要研究低嵌入率情况下的检测率,对目前流行的JPEG隐写方法(MB1,F5,Out Guess)进行了隐写分析实验,检测率有明显的提高。

参考文献

[1]Fridrich J.Feature-based steganalysis for JPEG images and its implications for future design of steganographic schemes[C]//Proc of the 6th Information Hiding Workshop,Toronto,Canada,2004.

[2]Shi Y Q,Chen C H,Chen W.A Markov process based approach to effective attacking JPEG steganography[C]//Proc of the 8thInformation Hiding Workshop.Berlin:Springer,2006:249 264.

[3]Pevny T,Fridrich J.Merging Markov and DCT features for multi-class JPEG steganography[C]//Proc of SPIE,Electronic Imaging,Security,Steganography,and Watermarking of Multimedia Contents IX.San Jose:[s.n.],2007:3 4.

[4]Chen C H,Shi Y Q.JPEG image steganalysis utilizing both intrablock and interblock correlations[C]//IEEE International Symposium on Circuits and Systems.Seattle,Washington,USA:IEEE,2008:3029 3032.

[5]Westfeld A.F5-A steganographic algorithm:high capacity despite better steganalysis[C]//Proc of the 4th International Workshop on Information Hiding.Berlin:Springer,2001:289 302

[6]Provos N.Defending against statistical steganalysis[C]//Proc of the10thUSENIX Security Symposium.Berkeley,CA:USENIX Association,2001:323 335.

[7]Sallee P.Model-based methods for steganography and steganalysis[J].International Journal of Image and Graphics,2005,5(1):167 190.

[8]刘粉林,刘九芬,罗向阳,等.数字图像隐写分析[M].北京:机械工业出版社,2010.

[9]Chang C C,Lin C J.LIBSVM:A Library for Support Vector Machines[CP/OL].http://www.csie.ntu.edu.tw/cjlin/libsvm.

隐写分析 篇7

信息隐藏技术是信息安全领域的一个重要方面,主要包括隐匿技术(steganography)和水印技术两个方面的内容。隐匿技术一般用于安全通信中,即把要传递的重要信息隐藏到载体中,使其不易被察觉。由于隐匿技术也同样可以被不法分子用于通过Internet传递秘密信息、组织恐怖袭击等,因此隐写分析技术(Steganalysis)的研究变得越来越重要,隐写分析技术指能够检测、攻击和提取出隐藏信息的技术。

隐匿技术的载体可以是文本、图像、音频、视频等,现有的很多研究都是针对以图像为载体的情况。根据隐藏数据的嵌入方法不同,针对图像的隐匿技术可分为两种:直接在空间域嵌入隐藏信息和在变换域(FFT域、DCT域、DWT域等)嵌入信息。空间域上的嵌入实现简单,但对于信号滤波、加噪等操作的鲁棒性较差,且已出现了一些有效的针对空间域隐匿的隐写检测方法,因此现今的隐匿技术更多的是在变换域的隐藏。变换域上的嵌入是通过修改主信号某些指定的频域系数来嵌入数据,具有较好的鲁棒性。许多变换域隐匿方法都是直接针对JPEG图像,常用的隐匿方法有JSteg、JPHide、Out Guess和F5等[1]。

JSteg隐写系统是最早可公开获得的针对JPEG图像的隐写方法。该算法的嵌入过程是用秘密信息的比特流顺序替换图像DCT系数的最低有效位(LSB)。JPHide是由Allan Latham最先开发的针对JPEG图像的隐匿方法,在秘密信息嵌入前,使用用户提供的密钥通过Blowfish算法对信息进行加密,具有比JSteg更高的安全性和抗攻击能力。Niel Provos开发的Out Guess隐匿系统在抗统计攻击能力和安全性性上都有了极大提高。在嵌入秘密信息时,不是用信息顺序替换DCT系数,而是通过伪随机序列发生器随机选取DCT系数用于替换。并且嵌入前对秘密信息进行加密。Andreas Westfeld开发的F5隐匿系统,也是针对JPEG图像的隐匿技术。但与前面几种方法不同的是,它不是简单地用秘密信息替换DCT系数的最低有效位,而是用基于矩阵编码的方法嵌入信息。

与这些JPEG隐匿图像相对应,也出现了一些隐写分析方法。Provos等人提出了可检测JSteg和JPHide隐匿图像的隐写分析算法[1]。Provos等研究发现,与空间域图像LSB隐写后统计特性的变化相似,频率域图像隐写后频率域系数的直方图也有类似的变化,因此可将Westfeld等的直方图攻击法用于频率域隐匿图像的检测。该方法用卡方检测法判断待检测JPEG图像的DCT系数直方图与隐写图像DCT直方图是否匹配,从而判断该图像是否包含秘密信息。该算法已开发成实际使用的隐写检测系统stegdetect,对JSteg、JPHide等隐匿图像具有较好的检测效果。但即使该算法扩展后对Out Guess0.1等随机嵌入的隐匿图像仍不能较好地检测,检测率较低。对Out Guess 0.2等抗直方图攻击的隐匿图像无法检测。

Fridrich等提出了分别针对Out Guess和F5的检测算法[2,3]。简单的直方图攻击法不能检测OutGuess 0.2隐匿图像。Fridrich等通过实验发现将JPEG图像解压缩到空间域并作少量切割后,其边界不连续点的分布特性与原始载体图像接近,据此提出了针对OutGuess隐匿图像的检测算法。Fridrich还提出了针对F5隐匿图像的检测算法,该算法的基本思想与OutGuess检测算法相似,也是设法近似原始载体图像的某个统计特性,F5检测中将待检测JPEG图像解压缩到空间域,作适当切割再压缩回JPEG图像,用此时的DCT低频系数直方图近似原始未压缩图像的特性。由此可判断图像是否为F5隐写图像,

从上面的分析可以看出,这些JPEG隐写分析方法都是针对某种特定隐匿技术的,没有通用性,还没有较好的通用检测方法可用于JPEG隐匿图像。

针对这种情况,文中提出了一种JPEG隐匿图像的通用隐写分析方法。考虑到OutGuess和F5等隐匿技术都具有抗直方图攻击的特性,文中的方法基于对JPEG图像DCT系数差分直方图的分析。将JPEG图像变换到空间域后,水平和垂直方向分别切割4个像素点,研究切割前后差分直方图的变化规律。该方法对常用JPEG隐匿方法均有较好的检测效果,有一定的通用性。

1 本文中提出的隐写分析方法

1.1 信息隐藏对DCT差分直方图的影响

本文考察JPEG图像DCT系数的差分直方图。与空间域图像象素点的差分分布类似[4],可认为DCT域中水平方向相邻点系数差分也服从或2倍近似服从广义高斯分布,概率密度函数为

选512×512×3的标准彩色Lenna图像进行分析,图1(b)和图1(c)分别给出了未隐藏图像和Out Guess 0.2隐藏图像的DCT系数差分直方图。可以看出,隐藏图像与原始图像的差分直方图非常相似,也符合广义高斯模型。用一般的直方图攻击法不能检测出隐匿图像。

进一步考察将图像作少量切割后的差分直方图,即将图像反变换到空间域,在图像的水平和垂直方向分别切割四个像素点后,再变换回DCT域。图1(d)给出了未隐藏图像和OutGuess 0.2隐藏图像切割前后直方图变化情况,即切割后的差分直方图减去切割前的差分直方图得到的图形。从图中可以很明显地看出未隐藏图像和隐藏图像在切割前后直方图的变化有很大不同。

这是因为将解压缩的隐藏图像在空间域作少量切割后,其变换回JPEG图像时,8×8DCT块的重新组合造成了隐藏信息的丢失,使其恢复到未隐藏图像的特性,而对于未隐藏图像并没有这样的变化。

1.2 DCT差分直方图变化与隐藏率的关系

为了能定量地研究DCT差分直方图的变化情况,用能量中心点(COM)来表征DCT差分直方图的特性,COM的定义如式(2)和式(3)所示,其中h[n]为DCT系数差分直方图,N是DFT的长度。

设y为切割后的COM值减去切割前的COM值,p为隐藏率与最大隐藏率的比值,用Out Guess0.2对Lenna图像进行隐藏,选取p=0、10%、20%、30%、40%、50%、60%、70%、80%、90%、和100%,分别计算y值,y与p的关系如图2所示。从图中可以看出,可以用二次多项式对y与p的函数关系进行很好地拟合,y=ap2+bp+c。

1.3 引出的隐写分析方法

对大量图像实验表明,y与p的关系都可以用以上二次多项式来近似。综合以上分析,引出具体的JPEG隐匿图像的检测算法如下。

1)将待检测图像解压缩后在每个方向切割四个象素点,再用相同的压缩质量系数压缩回JPEG图像,求出y。

2)用不同的p值对待检测图像进行隐藏得到一组隐藏图像,对每幅图像重复步骤1),都到一组(y,p)。

3)以Lenna未隐藏图像的y-p函数模型为标准,根据所得(y,p)与标准y-p函数的拟合程度判断是否隐藏。

1.4 判决门限的设定

对一个隐写检测方法,查全率(隐写图像的检出率)和查错率(未隐写图像的错判率)之间总是存在矛盾,一方性能的提高需要以牺牲另一方的性能为代价。该方法通过判断待检测图像和标准图像的y-p函数的拟合度进行检测,通过大量实验研究,取拟合度等于85%为门限,大于85%判为未隐藏,反之判为隐藏,以使检测的查全率和查错率达到平衡。若要使检测结果更加精确,可针对不同隐匿方法分别设定判决门限。

2 实验结果与分析

2.1 性能测试

从USC-SIPI图像数据库中选择了16幅标准Tiff彩色图像做实验,其中8幅大小为256×256×3,8幅为512×512×3,将其压缩为JPEG格式。分别用JSteg、JPHide、Out Guess 0.2和F5等隐匿技术将文本、图像等信息隐藏到载体图像中,隐藏率从最大隐藏量的20%—100%平均分布,按上面所描述的检测算法分别对未隐藏图像和四组不同隐匿方法的隐匿图像进行检测,取拟合度等于85%为门限,大于85%判为未隐藏,反之判为隐藏,实验结果如表1所示。

从表1中可以看出,该检测算法对各种JPEG隐匿方式均有较好的检测效果,具有通用性。对JSteg和JPHide等采用简单LSB隐藏技术的隐匿图像检测正确率很高,对OutGuess和F5等抗统计攻击的隐匿图像的检测正确率也大于80%。

从前面的分析还可以看出,该算法物理意义简单,并且由于是对差分数据进行处理,数据量减少,所以可得到较快的检测速率。在配置为Intel Pentium4 1.8 GHz处理器,256 M内存的PC机上,检测速度为58 K B/s,可用于实时检测。

2.2 性能比较

文献[1]中提出的stegdetect系统,是现有比较成熟有效的DCT域隐写检测方法,该方法针对JPEG图像的隐写检测。为了进一步测试文中所提出方法的性能,将比较其与stegdetect系统最新版本(stegdetect 0.6)的检测结果。同样的样本图像进行检测,结果如表2所示。

从表2中可以看出,对于未隐藏图像,文中算法和stegdetect系统检测正确率相当;而对于JSteg和JPHide的检测正确率,文中的算法高于stegdetect系统;对于OutGuess和F5隐匿图像,stegdetect系统几乎不能检测,不具有通用性。因此文中提出的检测方法的检测效果明显优于stegdetect检测系统。

3 结论

通过对JPEG图像DCT系数差分直方图切割前后变化的分析,提出了一种全新的检测JPEG隐匿图像的方法。与现有检测方法相比,该方法对JPEG图像DCT域的LSB隐藏都可以检测,并且可以检测抗直方图攻击的Out Guess和F5隐匿图像,具有通用性。并且该方法实现简单,检测的正确率和速率都优于现有的通用隐写检测方法。

参考文献

[1]Provos N,Honeyman P.Hide and seek:an introduction to steganogra-phy.IEEE Security&Privacy,1540-7993/03,2003;3:2—44

[2]Fridrich J,Goljan M,Hogea D.Attacking the OutGuess.Proc of the ACM Workshop on Multimedia and Security2002,December6,2002:3—6

[3]Fridrich J,Goljan M,Hogea D.Steganalysis of JPEG images:breaking the F5algorithm.5th Information Hiding Workshop,7October2002;2578:310—323

隐写分析 篇8

随着互联网技术的快速发展, 信息安全问题越来越突出, 受关注程度持续走高。特别是9.11事件以来, 信息安全方面的相关问题更是引起相关科研人员和公众的强烈关注。信息隐藏作为信息安全中的一个重要课题受到普遍重视。信息隐藏技术是在表面看似正常的载体上确保信息嵌入的不可感知性和不可检测性, 隐藏信息而达到传输秘密信息的目的。隐写分析技术是对隐藏信息检测的过程, 采取相应措施阻止非法隐藏的信息传递。隐写分析主要分为两类:专用隐写分析和通用隐写分析。本文主要讨论的是图像隐藏信息检测问题。因此, 本文中的通用隐写分析是指对载体图像和隐藏图像进行分析, 提取具有一定区分能力的统计量作为特征向量集, 再利用神经网络、聚类算法或回归分析等方法进行训练构造分离器, 区分载体图像和载密图像[4]。

JPEG图像是网络上最为流行的图片格式, 具有压缩比大、分辨率强、传输方便等特点[2], 因此对JPEG图像格式的图片进行隐写分析的意义重大。Liu等在文献[3]中提出利用联合概率密度矩阵计算DCT系数块内和块间特征值, 组成特征向量以此区分载体图像与载密图。Shi等在文献[4]中提出了一种利用马尔科夫过程计算DCT系数块内相关性的方法, 组成324维特征, 该检测方法明显高于先前的一些检测方法。随后Chen在文献[1]中提出的方法对该方法进行改进, 考虑DCT系数块间的相关性, 构造DCT块内块间的差分数组, 组成486维特征向量进行隐写分析。

以上隐写分析方法的本质其实都是计算DCT系数单一方向间概率模型度量嵌入的秘密信息, 这是这些方法所共有的不足。本文通过分析DCT系数块内和块间的关系, 构造出DCT系数间多方向的相关性, 同时结合图像校准的方法, 提出一种新的检测隐写的JPEG图像格式的通用隐写分析方法, 力图提高隐写分析图像的检测效果。

2 隐写分析方法

图1中的训练图像包含载体图像与载密图像, 两类图像按照3.2的方法计算校准图像, 分别进行DCT变换, 并提取特征, 选择出能量较大代表性强的特征值, 对支持向量机进行训练。测试图像同样包含载体图像与载密图像, 提取DCT系数统计特征, 输入到已经训练好的S V M中进行检测, 得到最终的检测结果。

3 特征提取

本文特征提取的方法源于共生矩阵, 在介绍本文的特征提取之前, 首先分析下共生矩阵。共生矩阵描述了在一个矩阵中, 两个位置上的像素对的联合概率密度。如下式所示, 共生矩阵描述了矩阵I内部相距r, 角度为θ的两个元素, 出现为 (i, j) 的概率Pij (r, θ) 。概率Pij (r, θ) 可以通过下式计算:

本文是在共生矩阵基础上进行扩展, 考虑多个方向上的矩阵间的概率问题, 较好的描述像素间的相关性。设矩阵为I, 行数为L, 列数为C。为比较好描述D C T系数间的相关性, 首先给出如下函数:

用下式描述, DCT系数与周围系数差值绝对值d出现的次数, 累加和累计的是如图所示表示4个方向上的系数与周围系数间的关系。

遍历矩阵中所有系数与周围4个系数差值绝对值d出现的次数, 对于t=0的情况不予以考虑。

其中q= (L×C) / (8×8) , N为矩阵中提取的DCT系数的数量。

将计算出来的概率P (d, t) 按照 (d, t) 的排列顺序进行重新排列。举例说明, 假定d=0, t=1, 即为统计矩阵I中内部系数与周围4个系数差值绝对值为0出现1次的概率放在新矩阵中第一行第一列中。

3.1 JPEG图像DCT块内特征提取

将图像进行DCT变换并进行量化分成8×8的DCT小块。量化之后, DCT系数的主要能量集中在低中频分量, 即DCT系数值比较大。为此, 本文只提取前36个系数, 副对角线上方的系数。同时要求提取出的DCT系数不在边界线上, 为了提取的DCT系数与周围的4个系数直接有联系。因此, 主要考虑副对角线上方的未在边界上的21个系数与周围系数间关系。在进行特征提取之前, 首先对图像的DCT系数进行预处理, 将DCT系数钳位于[-7, 7]的范围内。特征提取按照上述步骤进行。新矩阵的维数为:15×4=60。

3.2 JPEG图像DCT块间特征提取

首先把图像D C T系数进行重新排列。在图2中, 圆形和菱形表示一幅图像中DCT系数的排列顺序, 如果按照顺序扫描8×8小块, 那么将组成右边图像DCT系数块。DCT系数重新排列用5种方式扫描DCT系数块:按照原来8×8小块顺序扫描, 还有行扫描、列扫描、Zigzag扫描、Hibert扫描方式进行扫描DCT系数块的前36个系数。这样5中扫描方式分别形成36个系数块。每个系数块内的系数重新计算与周围4个系数计算概率相关性。这种块间的DCT系数间的关系形成新的矩阵维数为:5×15×4=300。 (如图2图3)

载密图像很难被感知, 在统计上不容易被察觉。通常D C T隐写对DCT系数所做的修改比较会很小, 提取出图像敏感的统计差异不容易, 为有效区分载体图像与载密图像, 更好捕获图像统计差异, 采用图像校准方法。本文采用常见的JPEG图像移位剪切重压缩方法, 用以校准图像, 提高隐写检测的性能。校准图像具体的方法为:将原始待检测图像首先解压至空域, 剪裁掉上方4行和左侧4列, 8×8重新分块后, 对DCT系数量化, 得到内容相近的校准图像。

同时注意到提取的特征能量主要集中在前4行, 为减少计算量, 舍去第4行之后的特征值。待检测图像与校准图像分别提取DCT块内特征与D C T块间特征, 两两对应取得特征差值。

4 支持向量机 (SVM) 分类

支持向量机 (Support Vector Machine, SVM) 文献[5]以统计学习理论和结构风险最小理论为基础, 可以根据有限样本信息在特定训练样本的学习精度和无错误的识别人员样本能力间寻求最佳折中, 以期获得很好的泛化能力。支持向量机在解决小样本、非线性及高维模式识别的问题中表现出较强的优势。

图像隐写分析检测是小样本实验, 因此, 本文选用支持向量机作为分类器。支持向量机选用径向核函数 (RBF) , 惩罚参数c和核函数g采用交叉验证的方法获得, c和g的取值范围为C={2-5, 2-4, 2-3, …, 211, 212};g={2-12, 2-14, 2-13, …, 22, 25}。经过交叉实验测试, 取得比较好的一对 (C, g) 值为 (16, 0.00097656) , 此时交叉检验率为93.5714%。交叉验证的结果测试见下图。

5 实验与结果分析

通过以上分析, 可以看出整个隐写分析算法流程如下:

(1) 搜集训练图像, 对这些图像进行处理得到校准图像。

(2) 分别对两类图像进行DCT变换, 提取DCT系数块内与块间统计特征, 对应形成特征差值。

(3) 提取特征差值能量大的部分, 形成96维特征。

(4) 使用支持向量机分类, 以区分载体图像与载密图像。

从Camera[6]图像库与CBIR[7]图像库中随机选取7560幅JPEG图像, 统一处理成768×512或者512×768大小的图像格式。采用OUTGUESS、F5、MB1三种嵌入算法对处理好的图像嵌入信息, 嵌入率分别为0.05bpc、0.1bpc、0.2bpc。因此, 形成载体图像与载密图像9组图像实现组对。在这些组对中, 随机抽取50%图像组对, 计算特征值对支持向量机训练, 余下50%图像组对对实验结果进行测试, 实验结果见表1。表中tn表示正确识别原始图像的概率, t p表示正确识别嵌入图像的概率, t表示平均检测率t= (tp+tn) /2。

6 结语

本文提出一种基于多方向相关性的JPEG隐写分析方法, 隐写分析方法的特点主要体现在: (1) 采取计算载体图像的校准图像方法去除图像的个体性差异, 有利于提高分类效果。 (2) 特征提取方面对DCT域中图像块内、块间特征进行多方向的提取, 在比较大的程度上体现出图像的统计特征。 (3) 有效的控制特征维数, 捕捉能量大的特征, 减少计算量。

摘要:针对JPEG图像隐写问题, 本文提出一种基于多方向相关性JPEG图像通用检测方法。该检测方法首先对图像进行DCT域变换, 提取DCT域块内、块间多方向的DCT系数间的相关性作为统计特征, 共形成96维的统计特征。然后利用训练好的支持向量机对几种常见的JPEG图像隐写算法检测, 实验结果表明本文提出的算法与其他检测算法相比具有更好的检测结果。

关键词:多方向相关性,JPEG图像,通用隐写分析,支持向量机,DCT域

参考文献

[1]CHEN C H, SHI Y Q.JPEG image steganalysis utilizing both in-tra-block and inter-block correlations[C].IEEE InternationalSymposium on Circuits and Systems.Seattle, Washington, USA:IEEE, 2008:3029-3023.

[2]李卓, 陈健, 蒋晓宁等.基于多域特征的JPEG图像盲检测算法[J].浙江大学学报 (工学版) , 2011, 45 (9) :1528-1538.

[3]LIU Q Z, SUNG A H, QIAO M Y.Improved detection and evalua-tion for JPEG steganalysis[C].Proceedings of the Seventeen ACMInternational Conference on Multimedia, New York:[s.n.], 2009:873-876.

[4]SHI Y Q, CHEN C H, CHEN W.A Markov process based approach toeffective attacking JPEG steganography[C].Proceedings of the8th Information Hiding Workshop.A lexandria, VA, USA:Springer~Verlag, 2006:249-264.

[5]CHANG C, LINCL.LIBSVM:a library for support Vector Machines[CP].http://www.csie.ntu.edu.tw/-cjlinllibsvm.

[6]Doerr G.Image Database for Steganalysis Studies[EB/OL].[2012-05-15].http://www.cs.ucl.ac.uk/staff/I.Cox/Content/Downloads.html.2012.

上一篇:农村基本公共服务事业下一篇:SAP人力资源系统管理