文本数字水印技术

2024-09-20

文本数字水印技术（共5篇）

文本数字水印技术篇1

0 引言

计算机技术和网络技术的飞速发展, 极大地提高了信息交流的速度和精度。它在给人们生活带来便利的同时也使得盗版和侵权行为越来越严重。数字水印技术作为数字产品的版权保护和完整性认证有效手段日益受到人们关注。相对于图像、音频、视频等载体, 数字文本由于冗余空间小等特点使得数字文本水印发展相对缓慢。目前数字文本水印可分为:基于图像、基于自然语言和基于中文汉字特征的文本水印算法。

1 基于图像的文本水印算法

一些具有重要保护价值的文本, 如:银行凭据、契约、遗嘱、合同等资料常常是通过扫描转化为黑白二值图像进行处理的。因此许多学者有选择地应用和改进传统图像水印算法嵌入水印, 此类算法可分为空间域和变换域水印算法。

1.1 空间域

由于二值图像的像素值只有0, 1两种可能, 对其作任何不当的改动都会被觉察到, 因此嵌入水印时必须要考虑像素邻域的情况, 尽量使得图像的更改不可见。根据嵌入方法的不同可分为基于文档图像格式编码法和基于图像分块算法。

1.1.1 基于文档图像格式编码水印算法

该类算法最早是由Brassil[1,2]等人提出, 它将文档当作图像处理, 通过将文档某行向上 (下) 移动或将某字向左 (右) 移动或通过改变文档中文字特征 (字体、颜色、大小、下划线、笔划高度等) 来嵌入水印信息, 当某行 (字) 被移动时, 与其相邻的两行 (字) 或其中一行 (字) 保持不动作为译码时的参考位置。其中通过移动某行进行水印嵌入的为行移编码, 通过移动某字进行水印嵌入的为字移编码, 通过改变文字特征进行水印嵌入的为特征编码。该类算法是将水印信息嵌入到格式化文档文件的版面布局或格式化编排中来实现对文档的保护, 其安全性主要靠空间格式的隐蔽来保证, 它无法抵御对于文档格式方面的攻击。

1.1.2 基于图像分块文本水印算法

该类算法将文档图像进行不同分块后直接对像素进行修改实现水印嵌入。Min Wu等人[3]通过判断像素翻转的优先级, 然后经过置乱使可翻转像素点分散到整个图像。最后根据每个图像块中黑白像素的奇偶性进行水印嵌入。检测时, 根据图像块中黑白像素的奇偶性提取水印信息, 通过与原始水印的比较来判断图像是否被篡改。信息提取不需要原始图像的参与, 可用于内容的认证和篡改提示, 但确定可翻转像素是个复杂的过程。在此基础上Huijuan Yang[4]等提出根据像素翻转前后图像块连通性保持不变判断像素可翻转性实现水印嵌入。该算法简单, 含水印图像质量好。文献[5]将文档图像分块 (2×2) , 利用图像块中黑白像素的奇偶性将水印嵌入到黑白像素邻近的块中。该算法计算简单、水印嵌入量大, 但不可见性差。文献[6]提出先将文档按单词 (英文) 或字 (中文) 分块后, 然后将每个块分成一些正方形子块, 最后在子块的对角线上的点和中间点中随机选取一部分点嵌入水印信息。文献[7] 将文档按单词分块, 提取单词块的外边缘点将水印信息嵌入, 算法只对纯英文文档有效。此两种算法提高水印容量, 抗攻击性强, 是在一定鲁棒性条件下的脆弱。

分块嵌入算法简单, 水印嵌入容量大, 但抵抗扫描、打印、影印、传真等转换攻击的能力较低或根本经受不起这些二次量化引入的噪声的攻击。据此文献[8]提出一种抗打印扫描攻击的大容量文本水印算法, 它以打印扫描不变量为基础, 通过建立量化函数较好控制字符像素翻转量。可实现盲检测, 用于控制文档的非法复印。

1.2 基于变换域的文本水印

由于文档图像在从变换域返回到空间域时通常要进行二值化操作, 这往往会削弱水印强度, 甚至会除去水印信息, 这使得变换域水印算法发展缓慢。Lu[9]等人将文档图像模糊化处理转换为灰度图像, 然后将水印嵌入到DCT域的直流分量中。该算法对局部剪切和噪声具有一定的鲁棒性。在此基础上, 文献[10]通过将一个用于标识文档方向的水印信号和一个用于标识版权的水印信号嵌入图像DCT的直流分量中, 因此该算法能有效地防止因为旋转而引起的水印不可检测问题。但水印嵌入到DCT域的直流分量中, 等同于在文档的空间域上给所有像素施加了一个相等的常量, 因此算法的不可见性差。文献[11]提出将水印加在文档图像小波域的低频逼近子图中, 同时结合量化和加密技术, 实现了在文档图像中嵌入水印。提取时根据嵌入水印时生成的逻辑表和含水印信息的逼近子图系数, 求出嵌入的相应水印。该算法能抵抗高斯噪声、JPEG 压缩、剪切等攻击, 有较好的鲁棒性和不可见性, 且水印提取不需要原文本图像。文献[12]根据在打印-扫描过程前后文档图像的三级DWT域细节分量变化较小的特点, 将按字符分块的图像块经过线性规范化后进行离散小波变换 (DWT) , 通过调整细节子带系数的正负号的数量关系来嵌入水印信息。该算法能抵抗打印-扫描的攻击。文献[13]结合DCT和DWT二者的特点, 提出将水印信号进行分块DCT变换, 然后按照从低频到高频的顺序将其对应嵌入到原始图像的DWT子带中。水印提取时, 先将原始图像和待检测图像分别进行DWT 变换, 比较其各细节子图的对应系数, 得到长度为M×M 的序列, 将其按与嵌入过程相反的次序排序, 取其前L个系数进行DCT 反变换, 提取出原始水印图像。该算法水印不可见性好, 能抵抗JPEG压缩、加入高斯噪声、椒盐噪声以及剪切等攻击。但其只适用于纹理复杂的二值图像, 且提取水印时需原始图像。可以看出变换域水印算法的鲁棒性比较强。

2 基于自然语言的文本水印

基于自然语言的文档水印算法是在不改变文档原意的情况下利用自然语言处理技术通过对句子的变换以实现水印嵌入和提取。目前已有算法:同义词替换法、基于句法结构和基于语义文本水印算法。

2.1 同义词替换法

Bender等人提出通过对文本中特定单词 (词语) 进行同义词替换来实现水印嵌入。针对同义词获取方法不同产生许多水印算法。文献[14]通过依存句法分析来获取同义词。文献[15]基于WordNet同义词库和Internet 统计词的搭配分析做同义词替换。文献[16]提出选择词汇相似度低, 且义项相似度高的同义词进行替换来实现水印嵌入。文献[17]利用词语搭配验证的方法改进了同义词替换法。该类算法水印容量一般与同义词库的大小有关, 同义词库越大, 水印容量通常也越大。在提取信息时需要同义词替换表作为参考, 而且同义词替换后, 在特定的语境下有可能产生歧义。还有些学者[18]根据中、西文共有的标点符号相似的特点, 利用标点符号替换或删除某些影响不大的标点符号来嵌入水印。但该算法可能会影响文档的含义, 有时会被细心的读者发现。

2.2 基于句法结构的算法

该方法主要是对句子的句法结构进行转换以嵌入水印。最常用的变换方式[19]有:移动附加语的位置;主动式变被动式;加入形式主语 (只适用于英文文档) 等。文献[20]提出了一种基于句长的中文文本水印算法。该算法引入冗余嵌入和多数投票机制, 通过句式变换修改句子的长度来嵌入水印。为提高水印的鲁棒性, 采用DES加密算法并结合散列表技术对段和句子的索引序列进行置乱处理。文献[21]通过将中文文本按照虚词规则分组, 并根据可嵌入水印的关键字动态分层, 使文本形成一个多层的立体空间后, 在各层之间嵌入相关数据, 增强了水印的抗攻击能力。该算法在水印提取时需要原始文本文档。

2.3 基于语义水印的算法

语义水印方法是由Mikhail.J.Atallah[22,23]等人提出, 算法在对句子进行深层理解的基础上, 通过对TMR树的嫁接、剪枝和等价信息替换操作等方法来加入水印信息。文献[24]将词性标记串的统计特性与水印关联, 提出了一种基于词性标记串统计特性的文本水印算法, 基本思路是对文本先作词性标记处理, 统计词性标记串的频数, 选择部分标记串连同其频数构造一个完备概率空间, 通过修改文本改变标记串的概率分布使其信息熵与水印一致。本算法能抵抗同义词替换、句移位等攻击。文献[25]提出了一种基于汉字特征和语义的文本数字水印算法。它通过计算汉语句子的特征值进行最小程度的语义及特征变换进行水印嵌入。该算法水印嵌入容易, 隐蔽性好。

基于自然语言的文本水印算法没有改变文档的含义, 具有良好的鲁棒性和一定的抗攻击性, 其适用于格式化文档和非格式化文档, 但受限于自然语言处理技术, 含水印文本容易发生语义改变和难以理解的情况, 它不适用于要求文本内容不做任何修改的情况。

3 基于中文汉字特征的文本水印

由于中文汉字是形、音、义三者统一体, 而且字形结构复杂, 字符数量巨大。因此近年来许多学者经过深入研究后提出针对中文汉字特征的水印算法。本节主要介绍基于汉字结构、汉字拼音以及汉字使用频率等文本水印算法。

3.1 基于汉字结构

中文汉字结构独特、字体多样。一个汉字可以看作是笔划、偏旁、部首及汉字等组合而成的。许多学者提出了基于汉字结构的文本水印算法, 其中最具代表性的是孙星明[26]等提出将汉字表示成由部件作为操作数, 部件间的结构关系作为运算符号的数学表达式, 通过汉字的拆分与不拆分来表示“0”和“1”两种状态而嵌入水印。算法使水印能够嵌入到汉字结构内容之中, 鲁棒性强, 水印容量大。然而规定的部件库的存在却使得此算法的应用受到限制。文献[27]充分利用汉字的象形和会意特性, 提出将某些表具体概念的汉字拆分为表抽象概念的部首汉字和另一个汉字, 而在显示时通过格式调整将拆分后的两个汉字字形拼接为原汉字字形。该算法通过汉字字形的拆分, 增加了文档内容编码冗余, 提高了水印信道容量, 增强水印的隐蔽性。文献[28]提出基于汉字字型结构计算文本中每个句子的特征值, 通过修改一些特征值使其与水印信息一致实现水印嵌入。该算法具有嵌入水印简单、隐蔽性好, 鲁棒性强的特点。文献[29]通过适当改变字符的拓扑结构, 设计出语义上相同的字符的多种字形, 用字符字形映射的不同数学模型实现水印的嵌入。该技术同时具有携带隐藏信息容量大、鲁棒性强、视觉影响小、抗攻击能力强。文献[30]以文本中特定笔画数的汉字为标志, 提取其左右相邻汉字的特征作为文本特征, 将其与水印信息进行比较, 通过修改其左右相邻的汉字特征来实现水印信息的嵌入。该算法嵌入水印容量大, 具有较强的隐藏性和鲁棒性, 能有效地抵抗格式攻击, 以及识别文本字符的删除、添加等攻击。

3.2 基于汉语拼音和汉字声调

文献[31]提取出整个文档的汉字拼音, 利用拼音的特点将文档进行分层, 在各个层中通过字符水平缩放来嵌入水印。在嵌入过程中提出了一种安全的嵌入方法, 将有意义的水印信息放在文本之外。文献[32]提出基于统计特征来动态确定嵌入标志代码。先由标志代码确定水印插入区, 通过改变汉字集合声调的特征值使之与待嵌入的水印信息位一致来嵌入文本水印。该方法利用遗传算法和冗余机制, 提高了嵌入信息的容量和算法的抗攻击性。

3.3 基于汉字使用频率

文献[33]提出将汉字在文档中的出现频率作为文本特征提取出来构造零水印, 发送给可信的第三方 (IPC) 注册认证。同时加入了时间戳机制, 可以有效防止这种重构水印的攻击。文献[34]根据分析汉语中出现频率最高的词:“的”字结构词语特点, 在满足一定语法规则的条件下, 利用“的”字的增删嵌入水印。该算法水印嵌入和提取容易实现、鲁棒性强。文献[35]采用计算词频来抽取文本特征的零水印算法, 并将文本特征、水印和密钥存入于版权保护信息库中, 作为数据版权的凭证。水印检测可实现盲检测。该算法用于含有图像等多媒体信息的中英文文档, 对剪切、粘贴、内容顺序颠倒等攻击有较强的鲁棒性。

4 结束语

文本水印技术作为信息技术的一个新的研究方向, 是一个具有很大潜力的研究领域, 其在解决版权纠纷和防止文件篡改方面起到重要作用。需进一步研究工作包括:加强对文本载体特性的研究, 同时借鉴其他载体水印算法特点并充分利用密码学、数字签名等知识, 开发更多鲁棒性强、安全性高的文本水印算法;加强自然语言处理技术的研究, 推动自然语言文本水印算法研究, 特别是根据中文语言特点开发出更多算法。

摘要：数字化技术和网络技术的发展使得人们之间的信息交流更加广泛和深入的同时, 有关文本文档的数字产品的版权纠纷、非法拷贝和篡改等问题也越来越严重。文本数字水印技术作为文本文件的版权保护、完整性检测和真伪鉴定的有效方法之一, 近年来有了迅速发展。重点介绍了目前现有文本水印算法:包括基于格式编码、图像、自然语言处理技术和中文汉字特征等四类文本数字水印算法, 分析了其各自的优缺点, 并对其今后研究发展进行总结。

关键词：数字水印,文本水印,版权保护,内容认证

文本数字水印技术篇2

着力于研究一种在地理空间数据中隐藏和提取标识数据生产单位产权和数据用户使用权属的数字水印技术方法,作为一种辅助国家和测绘执法人员取证的技术手段,有效惩治数据非法流通,保障法律、测绘法规的执行,达到数据共享的安全性与最大化之间的平衡,实现地理空间数据共享的`有序性、安全性.从技术上使地理空间数据共享的安全性得到保护.

作者：贾培宏马劲松 JIA Pei-hong MA Jin-song 作者单位：贾培宏,JIA Pei-hong(南京大学,海岸与海岛开发教育部重点实验室,江苏,南京,210093;江苏省基础地理信息中心,江苏,南京,210013)

马劲松,MA Jin-song(南京大学,城市与资源学系,江苏,南京,210093)

文本数字水印技术篇3

关键词数字水印技术版权保护内容认证

中图分类号：TP309 文献标识码：A

在计算机以及网络通信快速发展的新时代，数字媒体中的图像、视频、音频等功能优势凸显，随着而来的数字媒体的信息安全、知识保护与认证成为一个重要课题。因此，要在数字水印技术上进行全面运用，提升加密处理的有效方法，形成在网络环境下知识产权保护与认证来源的技术运用。

1水印技术

水印技术是一种传统加密方法的技术运用方式，是不被感知地在作品中嵌入信息的操作行为。数字水印技术具有相应的特点，其中，水印是一种不可感知的，与传统的条形码不相同，水印不会减损图像的整体美观度。同时，水印与其嵌入的作品形成密不可分的关系，在作品进行相应转换以及格式变换的情况下，也不会出现消除的现象。此外，水印技术的运用，可以为查询变换情况提供良好的帮助。从目前水印技术的运用来看，主要包括有鲁棒型水印、脆弱型水印、半脆弱性水印三种，这三种水印技术分别运用与数字图像的知识产权保护、内容图像完整性以及可信度的验证等。通过数字水印技术的运用，具有一定的保护优势。其中，水印技术不需要辅助的数据，对于处理旧文件过程中，没有多余的空间储存数据等。还能承载作品相同的变换，在作品进行转换的过程中，内容变化，水印也会发生变化。通过相应的对比，可以清晰的查看出水印的修改情况，掌握基本的内容，对于修改的痕迹有很明显的把握。从目前水印技术的应用来看，主要包括有精准认证、选择认证以及局域化认证与作品重建等方面的内容。

2精准认证的运用方法

精准认证主要运用在对作品是否有被改变的判断中，可以从两个方面进行技术运用。

2.1脆弱水印技术

从数字水印精准认证的技术分析来看，脆弱水印是指作品在发生任何形态的转换之后，形成一些不可测的标志，脆弱水印技术能从中检测到一个非常脆弱的水印。这样可以判断出是否有被改变的可能性。对于是否有修改能形成精准的判断。比如，通过使用图像的半色调进行信息隐藏，采用视频利用MPEG编码表示水印，这样，可以有效的检测到是否有被恶意修改的可能。

2.2嵌入签名技术

嵌入签名技术主要是通过对认证签名嵌入载体作品之中，可以减少一般认证签名信息丢失的风险性，在格式被转换的情况下也不会轻易的丢失信息。因此，通过嵌入签名认证技术，可以有效的确认与作品计算出的签名是否相同。在有效的避免嵌入水印的过程中对作品造成的改变，可以从认证与存放水印两个方面进行控制。为了更好的实现精准度，可以通过擦除水印来解决这些问题。

3选择认证技术的运用

选择认证技术是指在图像与音频的剪辑过程中，在少年比特的改变不会造成原作品发生改变的情况下，即使有出现相应的修改之后的比特现象，但在整个视觉与听觉中不会出现相应的改变。

3.1半脆弱水印技术

在半脆弱水印技术的运用中，主要是指能承受合理失真，但又不会被不合理失真损坏的水印。半脆弱水印能在一定程度的信号处理中，将正常的信号处理与恶意篡改的形成有效的区分，在篡改现象出现的同时，可以提供篡改的破坏量精准的位置，并帮助分析被篡改的相应类型，这样，能有效的保护好内容的真实性。主要是通过鲁棒性水印，从而使其在失真达到相应程度实效的情况下，获取半脆弱水印。

3.2嵌入式半脆弱签名技术

半脆弱水印如同它们的脆弱部分一样常常不能抵抗恶意修改，因为他们都屈从于拷贝攻击。如认证水印只嵌入到高频的DCT块的系数中，一个不合理的失真只改变了低频部分，而保持高频不变，水印自然也不会受到影响，这时系统就会错误地认为图像可以通过认证。在通过嵌入式半脆弱水印技术的运用，对块状内容中出现的被修改或者被转换的内容，可以形成水印技术的检测。这种技术具有相应的技术优势，能形成不同的水印表现，不同作品具有不同的表现，也不会引起相应的保真度的问题。

4局部认证技术的运用

局部认证作为一种基于水印的认证方法，能有效的辨别出做作品被修改的次数与相应的区域，还可以对剩余没有被修改的内容进行有效的证明。并通过对被修改内容的精准分析，可以对修改动机、失真的合理性以及相关嫌疑人进行有效的认证。可以从基于块的内容认证与基于样本的内容认证两个方面进行技术分析。其中，基于块的内容认证主要是对作品许多郴相交的时间与空间区域，进行相应的认证运用，这样，在作品被修改的过程中，就能掌握具体的被修改的区域的内容。基于样本的内容认证，主要是对块内容进行系统局域化的空间敏锐性分析，在块大小上进行相应的技术处理，减少块尺寸大小对安全问题的风险控制等。在局部认证技术应用中，对于相应的个人身份显示，比如身份证、护照、驾驶证等形成一定的局部认证，能有效的辨别出真假，并对作品形成局部的保护，形成一种无法仿制与复制的整体功能，从而有效的加强对作品真实性的保护力度。

5作品重建技术运用

通过水印可以判断一幅作品是否被修改，甚至判断出修改位置及修改方式，同样，我们可以通过水印将被修改的作品重建。重建有两种策略：精确重建和近似重建。其中，精确重建将作品恢复到初始的状态（即目标是重建作品的每个比特都和原作一致）。将作品简单地看做比特的集合，纠错编码（ECC）是作品传输中表示的一部分，一个作品中可以有许多不同的纠错编码，而且这些元数据可以用水印来表示。近似重建是一个和原作品有一定差别的作品，但和原作没有显著差别。在技术重建的使用中，通过对作品重建技术的使用，能形成对作品整体功能的恢复，尤其是在被篡改的作品中，对于作品的失真性能构成很大的帮助，能有效的实现对作品的整体保护。并在重建的过程中，形成纠错编码的技术转换，在近似原作品的修复中，可以形成对目标控制的整体功能，从而为知识产权的保护提供良好的帮助。

6结语

数字水印技术与现代信息化发展有着很大的关联性，在图像处理以及内容认证方面有着很大的作用，尤其是在知识产权保护方面，通过数字水印技术与密码处理技术的有效结合，并采用智能开发技术，形成多种媒体类型的水印互操作的软件开发，能有效的对内容保护形成很大的效果，增强知识产权保护的整体力度。

参考文献

[1] 袁莉.数字水印的应用及攻击类型[J].长春师范学院学报，2005，11.

[2] 唐庆生，佘堃.基于离散小波变换的数字水印技术[J].成都信息工程学院学报，2005，01.

[3] 田震，陈高兴，李改肖，王斌.中国数字海图生产与版权保护[J].测绘科学，2005，04.

文本数字水印技术篇4

数字水印(Digital Watermarking)是实现版权保护的有效方法,成为多媒体信息安全研究领域的一个热点[1]。它通过在原始数据中嵌入秘密信息——水印(Watermark)来证实该数据的所有权。被嵌入的水印可以是一段文字、标识、序列号等。水印通常是不可见和不可感知的,它与原始数据(如图像、视频、音频、文本数据)紧密结合并隐藏其中,成为原数据不可分离的一部分,并可以经历一些有意或无意的破坏原数据的操作而存活下来。

对于文本水印来说,它应具备下列要求:

(1) 不可见性。即水印是视觉上不可见的,它的存在不应该使原数据发生可被人眼感知的变化。

(2) 稳健性。即嵌入了水印信息的载体数据,经过一些常见的改变后,水印信息仍然存在,并可以提取出来。

(3) 低复杂性。水印算法容易实现。

基于文本信息的特点,可以根据文本空间特征来嵌入秘密信息。通常来说,一个文本文件是由字、词、行和段落等有规律的结构组合而成的,在空间上对其做轻微的改动是难以被察觉的。但是,在文本中嵌入水印的前提是最好不要修改文本的任何内容,只能对文本行、字和词在页面上作不易被识别的轻微调整。本文提到的算法便是通过调整段落中的行间距,将水印信息嵌入到文本文件中。

1 行间距编码概述

行间距编码就是在文本的每—页中,每间隔一行轮流地嵌入水印信息。但嵌入信息的行的相邻上下两行位置不动,作为参照。需嵌入信息的行根据水印数据的比特流进行轻微的上移和下移。在移动过的一行中编码一个信息比持。如果这一行上移,则编码为“1”,如果这一行下移,则编码为“0”。一般来说,大部分的文档格式都有一个持点:一段内的各行的间距是均匀的。尽管人眼已熟练于区分不均衡的情况,但是经验告诉我们:当垂直位移量等于或小于1/300英寸时人眼将无法辨认,为了方便准确地提出水印信息,通常页面上第一行和最后一行都不作为嵌入的行。对较短的行也不动,不作编码。行间距编码提取水印信息可以采用质心检测法,质心定义为水平轴上一行的中心。用ΔR-表示移动行和其上一个不动行的质心之间的距离,用ΔR+表示移动行和其下一个不动行的质心之间的距离,并用ΔX-和ΔX+表示在原来未作修改文档中相应的质心距离。因此可以作如下判断,如果:

undefined

则它上一行的距离被增大,即这一行被下移。同样如果:

undefined

则它与上一行的距离被缩小,即这一行被上移。这样水印的数据流就随着行间距的改变而被嵌入到文本中[2]。

2 水印嵌入和提取算法说明

2.1 水印的嵌入算法

首先,假设待嵌入水印的文本为一个10页共450行的PDF格式的文档。

水印嵌入的步骤如下:

(1)将水印信息转为比特流。假设待嵌入的水印信息为一个序列号“DJTU2210”,它对应的比特流为“01000100010010100101010001010101001100100011 00100011000100110000”。转换的算法是首先按照系统的编码规则获得序列号对应的字节数组,然后再将每个字节用二进制表示,最后将这些二进制字符连成一个长字符串。

(2)读取待嵌入水印信息的PDF文件,获得它的总页数和总行数。

(3)分析PDF文件的内容,选取控制行和改动行。

控制行:保持原位置不变的行,用于参照使用。

改动行:被上移或下移的行,用于存储水印信息。

(4)按照水印比特流的顺序依次调整改动行。

调整方案依据下面的判定逻辑:

if(currentbit==1){

//将改动行上移。

}else if(currentbit==0){

//将改动行下移。

}

2.2 水印的提取算法

水印提取的步骤如下:

(1)首先读取已嵌入水印信息的PDF文件,获得它的总页数和总行数。

(2)将嵌入水印信息的PDF文件与原始PDF文件进行对比,找到改动行。

(3)取出改动行的信息,按照下面的两个公式进行计算:

undefined和undefined

关系A 关系B

if(改动行满足关系A){

//说明改动行存储的水印比特值为“0”

}else if(改动行满足关系B){

//说明改动行存储的水印比特值为“1”

}

(4)将获得的比特值连成一个长字符串“010001 00010010100101010001010101001100100011001000110 00100110000”,然后将其转化为当前系统字符集编码下的字符串“DJTU2210”。

3 水印嵌入和提取算法实现

//=====================

// 水印信息嵌入程序。

//=====================

public void embedDigitalWaterMark(String oriPDFFile,String wmPDFFile,String waterMark){

String binWaterMark=this.getBinaryStream(waterMark);

PDFReader pdfReader=new PDFReader(new File(oriPDFFile));

PDFDocument pdfDoc=pdfSeader.getDocument();

boolean moveLine=true;

boolean controlLine=false;

int moveLineCount=0;

PDFLine line=new PDFLine();

for(int lineNo=1; lineNo<=pdfDoc.getLines(); lineNo++){

if(lineNo !=1 && lineNo !=pdfDoc.getLastLine()){

if(moveLine==true){

line=pdfDoc.getLine(lineNo);

//移动行要保持一定的长度

if(line.length() > 10){

//获得水印行移动指令

char commandChar=binWaterMark.charAt(moveLineCount++);

if(commandChar==1){

//向上移动改动行

pdfDoc.moveLineUp(lineNo,0.00001);

}else if(commandChar==0){

//向下移动改动行

pdfDoc.moveLineDown(lineNo,0.00001);

}

moveLine=false;

}

}else{

moveLine=true;

}

//保存嵌入水印后的PDF文件

PDFWriter pdfWriter=new PDFWriter(pdfDoc,new File(wmPDFFile));

pdfWriter.save();

}

//=====================

// 水印信息提取程序。

//=====================

public String distillWaterMark(String oriPDFFile,String wmPDFFile){

String waterMark=″ ″;

StringBuffer binWaterMark=new StringBuffer();

PDFReader oriPdfReader=new PDFReader(new File(oriPDFFile));

PDFReader wmPdfReader=new PDFReader(new File(wmPDFFile));

PDFDocument oriPdfDoc=oriPdfReader.getDocument();

PDFDocument wmPdfDoc=wmPdfReader.getDocument();

boolean moveLine=true;

boolean controlLine=false;

for(int lineNo=1; lineNo<=oriPdfDoc.getLines(); lineNo++){

if(lineNo!=1 && lineNo!=oriPdfDoc.getLastLine()){

if(oriPdfDoc.getLine(lineNo).getVertical()==

wmPdfReader.getLine(lineNo).getVertical()){

//该行是控制行不是改动行

controlLine=true;

moveLine=false;

}else{

//该行是改动行不是控制行

controlLine=false;

moveLine=true;

}

//该行是改动行时

if(moveLine==true){

double currentLineVerOfOri=oriPdfDoc.getLine(lineNo).getVertical();

double currentLineVerOfWM=wmPdfDoc.getLine(lineNo).getVertical();

double nextLineVerOfOri=oriPdfDoc.getLine(lineNo+1).getVertical();

double nextLineVerOfWM=wmPdfDoc.getLine(lineNo+1).getVertical();

double lastLineVerOfOri=oriPdfDoc.getLine(lineNo-1).getVertical();

double lastLineVerOfWM=wmPdfDoc.getLine(lineNo-1).getVertical();

//上一行到当前行距离

double LastToCurrentOfOri=currentLineVerOfOri-lastLineVerOfOri;

double LastToCurrentOfWM=currentLineVerOfWM-lastLineVerOfWM;

//当前行到下一行距离

double CurrentToNextOfOri=nextLineVerOfOri-currentLineVerOfOri;

double CurrentToNextOfWM=nextLineVerOfWM-currentLineVerOfWM;

//上一行到下一行距离

double LastToNextOfOri=nextLineVerOfOri-lastLineVerOfOri;

double LastToNextOfWM=nextLineVerOfWM-lastLineVerOfWM;

//关系A

if(LastToCurrentOfOri-CurrentToNextOfOri/LastToNextOfOri>

LastToCurrentOfWM-CurrentToNextOfWM/LastToNextOfWM){

binWaterMark.append(″0″);

//关系B

}else if(CurrentToNextOfOri-LastToCurrentOfOri/LastToNextOfOri>

CurrentToNextOfWM-LastToCurrentOfWM/LastToNextOfWM){

binWaterMark.append(″1″);

}

waterMark=getStringStream(binWaterMark.toString());

return waterMark;

}

4 结束语

本文提出的基于行间距编码的水印算法经实验证明具有低复杂性,良好的不可感知性和一定的稳健性,但是在稳健性方面仍需加强改进。

可以预见文本水印在将来会有非常广阔的应用前景。它可以推动网上教学平台的飞速发展,让更多的人投入到教学资源的创作中来。同时它也会推动电子报刊等电子信息载体的网络发行,网络发行又可以大大提高生产和流通的速度,降低出版成本,而且发行的范围更广,覆盖面更宽。随着网络化办公的发展,在政府上网工程中将有更多的文本文档在互联网上传送,如果不采取有效的版权保护措施,一旦出现恶意篡改,而又无法证明真伪,后果是无法想象的,对于电子商务中的一些经济合同文本等也存在着这些问题。因此,数字文本水印对互联网时代的网上教学和电子商务等都具有非常重要的作用。尽管文本数字水印技术还是一个不完全成熟的技术,同时将数字水印作为版权争端的证据为法律所承认还尚待时日,但有理由相信这仍是一个极具潜力的研究方向。

参考文献

[1]王炳锡.数字水印技术[M].西安电子科技大学出版社,2003.

数字水印技术在电子商务中的应用篇5

关键词：电子商务；数字水印；版权保护；鲁棒性

一、数字水印技术

所谓数字水印是利用数字信号处理的相关技术，在多媒体数据中永久镶嵌具有可鉴别性的某些数字信息，用于文件真伪鉴别、版权保护并检查数据是否被破坏。嵌入的信息隐藏于宿主文件中，不影响原始文件的可用性和完整性。数字水印技术的基本思想是将某种信息嵌入到主数据中，使得如果嵌入的信息得到可靠的恢复后，那么该信息可以说明主数据和原始所有者之间的所属关系。数字水印技术并不能阻止盗版活动的发生，但它可以解决版权纠纷并为法庭提供证据。

1.数字产品的内嵌数字水印应具有以下基本特性

（1）鲁棒性

数字水印必须对各种信号处理过程具有很强的鲁棒性。鲁棒性是指数字水印应该能够承受大量的、不同的物理和几何失真，包括各种有意的或无意的，仍能保持水印的完整性和鉴别的准确性。成功的数字水印技术在解除信息不完备的情况下，任何试图去除水印的方法均应直接导致原始数据的严重损失。

（2）不易觉察性

一是指嵌入水印导致图像的变化对观察者的视觉系统来讲应该是不可见的，最理想的情况是水印图像与原图像在视觉上一模一样，这是绝大多数水印算法所应达到的要求；一是指水印用统计方法也是不能恢复的，即也无法提取水印或确定水印的存在。

（3）安全性

指隐藏算法有较强的抗攻击能力，难以篡改或伪造，数字水印往往结合密钥提高它的安全性。在没有密钥的情况下，未授权者即使知道含有水印信息和知道水印算法，也不能提取出水印信息或者破坏水印信息。

（4）抗攻击性

在水印能够承受合法的信号失真的同时，水印还应能抗击试图去除所含水印的破坏处理过程。除此之外，如果许多同样作品的复件存在不同的水印，当水印用作购买者的鉴定，就可能遭受许多购买者的合谋攻击。水印技术必须考虑这些攻击模式，确保水印探测的准确性。

（5）可证明性

（6）稳健性

数字水印必须难以被除去，如果只知道部分数字水印信息，那么试图除去或完全破坏数字水印将导致载体严重降质或不可用，而且好的水印能够确定对图像的破坏位置以及部分地恢复图像。

2.数字水印的嵌入与提取分析

数字水印的通用模型包括两个阶段：数字水印的嵌入阶段和数字水印的提取或检测阶段。在水印信息的嵌入和提取算法中，需考虑到嵌入水印信息后的宿主信息往往会经过许多无意的或恶意的攻击，这就要求在宿主信息的使用价值下降不太大的情况下，水印能可靠地被提取或检测出来。

（1）水印嵌入过程：数字水印的生成阶段，嵌入算法的目标是使数字水印在不可见性和鲁棒性之间找到一个较好的折中。

设有算法Ｅ，原始图像Ｉ和水印Ｗ，那么水印图像Ｉｗ可表示为：Ｉｗ=Ｅ(Ｉ，Ｗ)

水印嵌入过程如下图1所示：

图1.数字水印嵌入模型

（2）水印提取过程：提取阶段主要是设计一个相应于嵌入过程的检测算法。检测方案的目标是使错判与漏判的概率尽量小。为了给攻击者增加去除水印的不可预测的难度，目前大多数水印制作方案都在加入、提取时采用了密钥，只有掌握密钥的人才能读出水印。

水印提取是水印嵌入的逆操作。若将检测过程定义为解码函数Ｄ，已知原始图像Ｉ、有版权疑问的图像^Ｉｗ，水印Ｗ和，密码Ｋ。则有：Ｗ =Ｄ(^Ｉｗ，Ｉ)

水印提取过程如图2所示：

2.数字水印的提取模型

二、数字水印技术在电子商务中的应用

1.电子商务中，版权问题已经成为人们关注的热点问题。数字水印技术利用隐藏水印信息原理使版权标志不可见或不可听而存在于数字作品之中。当出现版权纠纷问题时，所有者可以从作品中获取水印信号作为版权依据，从而保护了所有者的正当合法权益。这种用于版权证明的水印要求是鲁棒数字水印，用户在不知密钥的情况下很难去除或破坏其中的水印。

2.随着电子商务的发展，电子票据的使用越来越频繁。数字水印技术是电子票据防伪的关键技术，可以在交易双方的电子票据中嵌入交易时间和签名等不可见的认证信息，使交易过程不可抵赖，降低了伪造的可能性。水印具有法律效力，可以在交易出现法律纠纷时，作为证据使用。

3.目前，加密技术对于电子形式的身份验证信息具有良好的保护功能，但无法作为书面凭证进行鉴别，使得“造假”、“买假”成风，已经严重地干扰了正常的经济秩序，对国家的形象也有不良影响。而通过数字水印技术，把电子身份验证信息隐藏到普通的凭证图像当中，使身份凭证具有不可复制和不可抵赖等特性，实现了电子信息和书面信息的双重保护。

4.“电子签章”也叫“数字签名”，它能够认定签署人身份、信息的来源、信息的完整性与安全性等，因此被广泛地应用在加密信件、商务活动、远程金融交易等电子商务和电子政务等领域。虽然数字签名在电子商务应用中已经具备了很高的安全性能，但仍存在风险。使用数字水印技术，鲁棒性水印和数字签名相结合，它能够将电子签章信息以数据形式隐藏到普通印章图像中，与图像合二为一，能够取得“白纸黑字”的书面凭证，而且可以对纸质文档进行签名。打印后仍能提取，使得文件具备双重安全效果。

三、结束語

数字水印技术作为一种新兴的安全保护技术应用到电子商务中，表现出其显著的作用和功效。随着数字水印的深入研究，其在电子商务中的应用也将日益广泛。

参考文献:

[1]王颖等.数字水印原理与技术[M].北京:科学出版社，2007.

【文本数字水印技术】推荐阅读：

数字水印技术05-26

基于MATLAB的数字水印技术研究10-21

数字模型水印07-20