实时视频水印技术(通用6篇)
实时视频水印技术 篇1
随着多媒体技术的快速发展,传播和获取视频信息也就变得越来越便利。但由于网络所具有的开放性和共享性,致使一些以数字媒介为载体的产品经常遭到恶意攻击、非法侵犯版权和信息篡改,严重损害了创作者的创作热情和利益。在这种情况下水印技术应运而生,同时也弥补了传统加密技术的不足。它的基本原理是在数字产品(如图像、音频、视频等)中嵌入可证明版权身份的信息,以达到保护版权的目的。数字水印技术是一门涉及到信息视频压缩及编码、视频分析及信息隐藏等多技术的边缘学科。
1 视频水印的原理及特点
1.1 数字视频水印原理
视频水印是利用视频中存在大量的数据冗余,将水印信息嵌入视频载体中作为版权保护的凭证,以达到保护版权的目的。一般数字视频水印系统包括3个部分:1) 水印的生成;2) 水印的嵌入及策略;3) 水印的提取或检测。由于水印技术在不同场合的不同应用,因此系统在这3部分上要求的侧重点也不尽相同。一般视频水印的流程图如图1所示。
1.1.1 水印生成
水印生成是视频水印中至关重要的一环,其生成过程的一般模型如图2所示。
先用伪随机发生器或混沌系统生成一维二值水印序列,然后再用密钥控制进行对水印信息置乱,最后再将一维水印序列转换成可嵌入视频数据的二维水印图案。
在水印的预处理中有几种常见的加密算法:1) 基于Arnold置换加密技术
Arnold变换是由A.L.Arnold提出的1种变换,又称猫脸变换[1]。变换公式为
式中,(x,y)∈{0,1,…,N-1}。
猫脸置换的基本思想是:把原始点处的像素转移到另外一处,从而使原来清晰的图像变得杂乱无章。把全部像素进行变换后,并未改变像素值的大小。此置乱变换不仅为可逆变换,而且效果好,简单易行,误差小。但也有些不足之处,此方法恢复时间较长且必须预先知道图像尺寸来求变换周期。文献[2]提出了矩阵变换模周期存在条件,文献[3]在借鉴传统Arnold算法的基础上,提出了1种新的Arnold对角相等置换算法。利用映射φ数值重新设置,使对角上数值相等,以使图像像素点改变。
2) 混沌置乱加密算法
混沌理论由于其优良的统计特性和不可预测性被广泛应用于信息加密领域,Voyatzis[4]等人正式将混沌理论引入水印领域,指发生在确定系统中的随机不确定运动。混沌加密是混沌系统产生混沌序列作为密钥序列,利用该序列对水印进行置乱加密,在接收端利用混沌同步的方法进行提取解密。直接采用混沌序列作为水印的研究较少,通常采用与其他理论相结合的方式。文献[5]中将图像先进行DCT变换,把水印密钥与DCT中频系数结合成Logistic混沌映射初值水印,然后将水印嵌入DCT高频系数。混沌加密算法比其他一般算法的保密性更好,由于其对初始条件的高敏感性和难预测性,具有运算速度快、保真度高、密钥量大、安全性好以及具有足够的带宽和较强的实时功能,但也有运算开销大、运算效率不高的不足之处。
3) 幻方置乱算法
此算法利用定义好的幻方变换矩阵对水印图像进行分块并按图像复杂度确定分块的大小,然后把置乱加密后二值水印图像嵌入经过变换后的载体数据中。幻方置乱的公式[6]为
式中,n为自然数。若满足
则称矩阵A为标准幻方矩阵。
文献[7]中提到了基于幻方变换和行列变换结合的置换算法,先将图像块置乱后再对行或列进行置乱。该算法运算速度快、安全性高、稳健性好,但图像不够清晰、置乱效果较差且计算复杂度较大。
1.1.2 水印的嵌入
水印嵌入就是把水印信号嵌入载体数据的过程。其嵌入方法中经常使用的方法是
xw(i)=x(i)+h(i)W(i) 加法规则 (4)
xw(i)=x(i)×(1+h(i)W(i)) 乘法规则 (5)
式中:变量x指采样强度/幅度(空域/时域),或是变换域的系数值,W(i)表示水印信号;h(i)表示水印嵌入能量权值。水印嵌入的一般模式如图3所示。
视频水印的嵌入方案可以分为3种:
1) 在原始视频中嵌入水印,即水印嵌入到原始码流中,生成带有水印信息的原始视频码流,然后压缩成含有水印的原始压缩码流,提取时再对其进行解码。该方法应用较多,空域和频域均可使用且算法比较成熟,但是该方法嵌入水印势必会增加视频流的比特率,降低视频质量,影响视频速率的恒定性,同时还需对已压缩视频先解码,嵌入水印后再编码,降低了水印嵌入的实时性。
2) 编码过程中嵌入水印,就是在编码压缩时嵌入水印,将水印算法和视频编码相结合。该方法的的优点为由于水印在视频载体中嵌入和提取相对简单高效,因此实时性相对较好。因为水印只是嵌入在变换域的量化系数中,所以既能抵抗各类攻击又不增加视频流码率。缺点为对视频水印编码后的视频质量会有一定程度上的影响,编码器和解码器需要修改,因此在一定程度上也限制了某些水印算法的引入。
3) 在压缩域嵌入水印,即直接在经过压缩的视频码流中嵌入水印。此方法不仅计算冗余小而且具有较高的保真度。缺点为由于压缩后的冗余度小所以导致可嵌入信息的容量相对较小,并且产生帧图像运动偏移,可能会对运动补偿环路的稳定性造成一定的影响。
1.1.3 视频水印的提取或检测
视频水印检测或提取过程如图4所示。
1) 水印检测:
视频水印检测可分为盲检测和非盲检测。视频水印检测一般都采用不需要原始视频的盲检测。(1)相关检测法的基本思想是计算含水印的视频数据与水印信号之间的相似性,用相似性度量与相关阈值的比较来判断是否在视频中嵌入了水印信息。文献[8]提出1种基于运动目标检测技术的算法,该算法具有较好的不可见性和隐藏性。(2)由于视频数据和水印的随机性,水印检测系统难以避免的会出现一些错误。漏检误差是指在视频数据中未检测出水印信息的存在,而水印信息确实存在于视频数据中。虚警误差是视频水印检测系统中检测显示水印信息存在,而实际上水印不存在。文献[9]中给出了基于小波的1种改进算法,可以有效降低虚警和漏检误差。
2) 水印提取:
水印提取就是水印嵌入的逆过程,首先根据算法进行检测来确定水印嵌入帧的位置,然后利用密钥和水印提取算法将水印从视频数据中提取出来。鉴于水印的冗余度和嵌入位置多样性,水印提取一般采用加权综合与“多数”判决的方法,水印经该法处理后转化为二值信息,再利用密钥恢复出水印信息。
1.2 视频水印的特征
视频是在时间轴上连续的静止图像序列,相邻帧间不仅具有高度相关性并且有大量的空间和时间冗余度。因此视频水印就会具有图像水印的一些特性,比如安全性、稳健性、不可感知性等特点。此外视频水印还有图像水印所没有的其他性质:
1) 信息量大。
由于视频的信息量大,因此要以压缩的格式进行存储和传播,水印信息也可以嵌入压缩域中。
2) 具有随机检测性。
视频水印可以在视频流中随时随处地检测出水印。
3) 实时处理性。
为了使视频水印可以实时地进行水印的嵌入、提取或检测,要求其嵌入和提取过程具有高效性,在不同的应用中对嵌入和提取过程中高效性的侧重点有所不同。
4) 与视频编码标准相结合,针对视频数据量大,冗余度高的特点,在传输和存储时一般要进行压缩编码。
在水印嵌入压缩视频流中时,必须结合视频压缩编码标准来进行,在原始视频嵌入水印时必须考虑视频压缩编码问题,否则会使水印在编码过程中造成一定程度的丢失。
5) 一些特有攻击。
视频容易受到诸如帧重组、帧频改变、帧剪切等攻击。
6) 码率恒定性。
视频和音频大多是同时传输的,两者间具有一定程度的同步相关性。由于传输信道有一定带宽限制,所以就要求水印的嵌入对视频流码率影响很小以保证视频的传输正常。
水印的不可见性、稳健性及水印信息容量3方面是矛盾的结合体,很难使这3方面同时达到最佳,由于在应用中对各方面的需求不同,所以也就对视频某一特性的要求有所侧重。
2 典型视频水印算法
2.1 原始视频水印
原始视频水印就是直接对未经压缩的视频处理,根据得到的视频数据流是否是原始数据流又可分为:空间域水印、变换域水印。
2.1.1 空间域视频水印
空间域水印,直接修改空域中采样点的幅度值来实现视频水印的嵌入,水印信号一般嵌入亮度分量或颜色分量中,水印信号一般不做预处理直接嵌入在视频空间域中。较有代表性的是最低有效位算法(Least Significant Bit,LSB)[10,11] ,此外借鉴于扩频通信原理思想的H&G算法和JAWS算法也在空域应用中较多[12]。文献[13]提出了1种可有效抵抗MC-TFA攻击的空域视频水印算法,其对原始视频做基于宏块的运动估计得到运动矢量,据此对原始水印进行宏块为单位的移位调整得到嵌入水印。空域视频水印算法优点为算法简单、复杂度低、出现时间较早、有很多成熟的算法且可以比较好的完成盗版追踪和版权保护。缺点为属性范围小,稳健性较差难以抵抗常见的各种攻击和噪声干扰,难以实现播放控制。
2.1.2 变换域水印
变换域水印,在宿主信号的某个变换域中嵌入水印信号。空间域水印容易被各种信号破坏,所以一般设计成易碎水印。频域中水印嵌入后被散布到频域的各处,不仅不容易被感知而且可以有效抵抗各种处理,一般被设计成稳健水印。常用的变换包括离散傅里叶变换(DFT)、离散余弦变换(DCT)、小波变换(DWT)及曲波变换。
离散傅里叶变换就是先对视频图像进行傅里叶变换,再将处理后的水印信息嵌入到 DFT系数中,最后经反DFT变换后就得到嵌有水印的视频图像。文献[14]提出将傅里叶变换算法应用到视频中,文献[15]提出1种DFT变换与DCT变换相结合的算法,先将DCT系数转换成二维离散傅里叶变换系数,然后在DFT系数上做对数极坐标映射以及DT-CWT变换,最终将水印信息嵌入到经过修改的DT-CWT低频系数中。目前关于DFT变换的视频水印算法较少但其研究方向大致分为两类:1)基于DFT域的缩放、平移及旋转的几何不变性的视频水印算法,但由于采用插值近似计算,嵌入后的视频水印失真较大,算法复杂度较高,实现起来困难较大。2)利用DFT域频谱信息嵌入水印的视频水印算法,嵌入方法有相位谱、幅度谱以及幅度和相位谱相结合等种方法。
离散余弦变换(DCT),采用的是从图像空间到频率空间的全局变换。典型DCT视频水印方法是Cox[16]等人提出采用扩频序列技术和人类视觉特性的相关性,将水印嵌入DCT低频系数中。随后有人研究出分块式DCT变换[17]和分层式DCT变换水印算法[18]。文献[19]提出结合HVS和DCT的算法,将水印信息嵌入在原始视频的绿色分量中,二值水印的嵌入深度根据视频内容自适应选择DCT低频系数来完成,该方法透明性强、抗攻击能力强。文献[20]中提出基于DCT-SVD域的原始视频水印算法,将不同水印嵌入不同场景,以抵抗共谋攻击,将相同水印嵌入相同的场景帧中以使水印对帧剪切具有稳健性,此方法不仅具有较好不可感知性且有较高的稳健性。DCT域嵌入水印优点是离散余弦变换具有比较好的去相关和压缩能力,缺点是一般容易在进行压缩中产生失真以及块效应。
小波变换是1种空间和频率的局部变换,在视频水印研究分析中有着广泛应用,成为水印研究的热点。由于连续小波变换复杂度高、计算量大,所以在视频水印方面一般使用离散小波变换(DWT)。文献[21]Hussein等提出利用运动估计的方法将水印信息嵌入小波变换的HL和LH频带中。文献[22]用二维离散小波变换将每个视频帧分解成子频带,然后将PCA变换应用到LL和HH频带中,并将水印信息嵌入到这2个频带的最大PCA系数。该算法不仅具有较高的不可见性和信噪比而且可以有效抵抗各种攻击。文献[23]提出了1种基于帧内与帧间边信息的小波视频水印算法。该算法以视频的运动特征与纹理特征为边信息且确定自适应抖动调制量化步长。小波变换算法不仅实现了较好的盲检测性、不可见性并且对高噪声帧平均、帧删除、帧置换等攻击具有较好的稳健性。但也存在一些缺点即不能最优化地表示含线或者面奇异的高维数,在视频压缩过程中容易产生模糊、振铃效应等形式的失真。
Contourlet变换是1种不可分离的多尺度信号表示方法,其可以有效跟踪图像的线奇异性和面奇异性,将多尺度分析和方向分析分开进行,因此Contourlet域变换因其多分辨力、多方向性和各向异性的性质能有效地捕捉到帧图像边缘轮廓,弥补了小波变换中的不足。此方法比小波域更适合嵌入水印,成为视频水印领域1个很有潜力的研究方向。文献[24]提出在Contourlet分解后的空域低频子带系数的动态成分和静止成分中嵌入水印信息;文献[25]提出了基于Contourlet变换的双重视频水印算法,对I帧进行Contourlet变换,在低频重要系数嵌入破坏原始水印在高频域嵌入稳健水印,因此具有较高的保真度。
空域算法和频域算法各有优缺点,空域变换提出的较早、信息容量大、算法简单且便于实现,但也有稳健性差的缺点。频域算法将人类视觉系统和水印编码算法进行了有效的结合且能与压缩编码兼容,有良好的不可见性和稳健性,同时在频域中嵌入水印的能量可以遍布图像所有像素中,使水印的抵抗攻击能力和信息隐藏能力大大提高,还可以在视频的压缩域进行水印嵌入。由于频域算法的变换和反变换时间比较长,所以不太适合进行实时性操作。
2.2 压缩域视频水印
压缩视频水印是1种在压缩编码过程中嵌入水印或者直接把处理后的水印嵌入编码压缩后的视频中的方法。这种方法的优点是可以在编码过程中对信息调制产生影响的因素进行控制及做出适时的处理。缺点是该算法一般只和特殊的视频压缩编码相匹配。
2.2.1 在运动向量中嵌入水印
在运动矢量中嵌入水印时主要是将水印信息嵌入在幅度值大、相角变换小的运动矢量中,大部分的帧在压缩视频序列中是运动补偿编码帧,所以把水印隐藏在运动矢量可以有效利用视频比特流信息。文献[26]针对对视频水印的时间同步攻击,提出1种基于运动矢量统计特性的MPEG-4视频水印算法,根据运动矢量幅值分布特点将水印嵌入特定运动矢量中,该算法对时间攻击来说具有较好的稳健性和不可见性。文献[27]中利用P帧的运动矢量和局部的运动矢量信息来嵌入水印信息,水印信息是按运动矢量的奇偶位来嵌入的,所以要搜寻的嵌入点就要减少一半,从而降低了计算复杂度,提高了视频水印处理的实时性。运动矢量的大多数方案具有容量大、实时性及视觉质量好等特点,但其稳健性一般较差。
2.2.2 在脸部运动参数中嵌入水印
脸部运动参数技术是1998年Frank Hartung提出的,该技术采用扩频通信思想在MPEG-4的脸部运动参数中嵌入水印,利用66个脸部运动参数使MPEG-4的脸部模型运动起来。其基本思想为:将1 bit水印信息散布到多于1个FAT中,先扩展需要嵌入的比特信息,并对其进行调制,然后低通滤波和振幅调制,最后再嵌入欲嵌入的FAP块中。但该方法的问题是水印提取速率不均衡,非盲检测,且没有考虑HVS特性。在运动矢量嵌入水印的好处是,对运动矢量只需进行简单的判断和加减运算,计算复杂度低。由于GoP中B帧和P帧图像远多于I帧图像数量,运动矢量资源丰富,信息嵌入强度大且不影响视频质量。
2.2.3 基于VLC域中嵌入水印
压缩的视频码流中可直接获得的基本编码单元是可变长码字(VLC),每个DCT系数都有相应的VLC对应,因此可在VLC域嵌入水印。不仅算法简单,而且实时性检测效果也较好。文献[28]提出通过修改视频流中的可变长编码来嵌入水印信息,该算法不需要对压缩视频解码,水印嵌入速率高且计算复杂度小,但对信道干扰和视频处理的抵抗能力稍差。文献[29]提出1种新颖的基于VLC域半脆弱水印算法,利用视频VLC域I宏块预测方式和CBP块编码模式来自适应地提取特征码的宏块,利用子宏块量化系数低频能量之间的关系构建宏块级别的内容特征码,同时可以通过修改子宏块拖尾系数的方式来嵌入半脆弱认证水印。该方法具有良好的不可感知性和码率恒定性。该算法对添加性噪声、锐化、帧平均、I帧删除、共谋攻击等具有稳健性,但拷贝攻击稳健性较差。水印化视频对嵌入过程在小的DCT系数进行时不具有稳健性,所以此算法有待改进。
2.2.4 在DCT系数中嵌入水印
一般基于DCT 域的视频水印的嵌入和提取过程是在视频编解码中进行,通过调制DCT变换或量化后的系数来完成嵌入的。在视频的DCT系数中嵌入水印的方法是目前研究最多、技术最成熟的视频水印技术。清华大学的吴国威教授等人在考虑人眼视觉特性的基础上了提出了1种针对MPEG-2码流的算法,通过修改特殊位置的DCT系数侵入水印。文献[30]提出了1种基于H.264 DCT域的算法,在I帧中4×4变化块中选择合适的位置,将水印值和变换块的能量值替换嵌入点系数值,并引入拉格朗日优化的编码控制模型来提高水印的失真性能。文献[31]提出1种基于DCT压缩域嵌入可逆性视频水印算法,在8×8编码块采用略加修改的哈弗曼编码方法,再将水印信息嵌入DCT压缩内容中,该算法实时性好,输出视频质量有很大改善但载体容量相对较小。
2.2.5 DEW算法
该算法也叫差分能量算法 ,文献[32] Langelaar针对压缩视频码流,提出1种在压缩码流中选择性丢弃部分高频DCT系数,通过相邻2个区域的DCT高频系数的能量差值来编码水印信息,该算法是有损压缩。
3 对视频水印的攻击分类
视频水印攻击就是指1种阻碍或是减弱视频水印的检测或可以对提取出的水印信息产生多义性的处理过程。一般把视频水印攻击分为无意攻击和有意攻击。
1) 无意攻击
对视频进行各种处理时不可避免地产生水印信号攻击。比如,利用各种压缩编码标准对视频进行压缩编码;视频格式间互相转换时所造成的帧速率和显示分辨力的改变;帧删除、帧重组等编辑处理;还有一些帧重排、帧间组合等新型攻击形式。对于无意攻击可以通过改善水印系统来解决。
2) 有意攻击
有意攻击是有目的、有准备地为达到破坏、伪造和抽取水印而进行的水印攻击。有意攻击的方法及其相应的对策有:
(1) IBM攻击,也称为解释攻击,产生的原因是有些水印方案中对检测到的水印可能存在多个解释。其实,在解释攻击中并没有去除水印而是嵌入了另一个具有相同强度的水印,使得原来的水印失去了意义。一般水印方案有3方面的缺点:一是无法检测出2个水印嵌入的先后顺序;二是水印和原作品没有同时注册;三是水印的可逆性为攻击者提供了可趁之机。针对这3方面的不足,提出了以下解决方法:一是时间戳机制,合理使用时间戳机制,通过判定水印添加时间顺序就可以轻而易举地解决版权纠纷问题;二是公证机制,作者在向公证机关注册水印序列时同时也注册原作品;三是单向水印机制,将作者的水印方案约束在单向水印范围内以消除水印嵌入的可逆性,从而有效阻止水印的伪造行为;四是双水印技术,利用双密钥体制在图像中嵌入1个稳健水印序列和1个脆弱水印序列,稳健水印需要知道图像情况下才能检测到,脆弱水印进行检测时无需原图像,一旦发生版权纠纷,只要合法拥有者持有嵌有合法水印的图像,提取出证明版权归属的水印信息,非法攻击者进行视频水印盲检测时无法得到其嵌入伪水印,从而使得攻击失败。
(2) 合谋攻击,就是利用多个作品的优势去除水印或是无法检测到水印。合谋攻击分2类:第1类是在不同作品的不同拷贝中嵌入同一水印,通过对每份拷贝进行水印估算从而精确提取水印信息,这样就可以通过去除水印来获得原始作品;第2类是在同一作品的不同拷贝中嵌入不同水印,对嵌入不同水印的不同作品拷贝进行比如帧平均的线性组合,就有可能产生出无水印的原始作品。在数量上一定程度地限制含水印作品的提供,使用随机密钥增加合谋攻击的复杂度,都可有效抵抗合谋攻击。同时将随机或伪随机机制应用于水印信号嵌入位置选择上,也有利于加强水印对分析攻击的抵抗能力。
4 数字视频水印技术面临的挑战及对未来的展望
视频水印技术目前是水印研究领域的一大热点课题,虽然该项技术在多年的研究中有了不少的成果,但现有的技术中仍有一些需要改进和提高的地方。本文将视频水印技术面临的挑战及对未来的展望归纳为以下几个方面:
1) 对于视频水印的实时性研究,虽然现在水印算法的实时性在多年的研究中有了很大提高,视频的正常播放基本可以得到满足,但一旦受到攻击就会影响正常播放,因此需要更有效的算法来进一步提高这一性能。
2) 视频水印在网络传输中的研究,视频水印技术在流媒体应用中受到诸如网络带宽,网络传输误码等因素的影响,同时还必须对传输中所引起的差错进行控制和处理。因此,如何使视频水印技术更好地适用于网络视频流媒体是另一个研究重点。
3) 特征视频水印技术的研究,统计特征数字水印一般比较容易受到非线性等变换方法的攻击,同时帧图像高层特征的数字水印技术比如基于边界信息等具有较好的强壮性,也可能成为视频水印研究的重点。
由于笔者知识面的局限,介绍的内容和所做的评述肯定存在不全面、不确切、不妥当的地方,希望读者给予指正。
摘要:视频水印是用来实现版权保护的有效技术,也是目前水印领域中的研究热点。在研究总结国内外视频数字水印现状的基础上,简要地介绍了视频水印的原理及特点,阐述了典型视频水印算法及各自的优缺点,分析了针对视频水印的各类攻击及对策,最后探讨了数字视频水印面临的挑战及今后的发展趋势。
关键词:视频水印,版权保护,算法优缺点,攻击及对策
实时视频水印技术 篇2
目前,信息隐藏作为一种保障数字图像通信安全的有效手段得到了迅速发展[1]。然而随着互联网与数字化多媒体技术的迅速普及,图像通信安全对实时性的需求越来越高,实时数字水印嵌入方案更具实际意义[2,3]。块截短编码(Block Truncation Coding,BTC)是一种简单、快速的图像编码技术[4,5],近年来众多研究员开始结合BTC编码与信息隐藏技术研究保证环境图像通信安全。Hu等[6]提出一种高容量彩色图像隐藏方案,算法将BTC编码的秘密图像进行加密后嵌入到彩色载体图像之中,这实际上只是用BTC编码对秘密信息进行预处理。Hong等[7]通过交换BTC编码中重建电平而设计一种BTC域无损数据隐藏算法。Lin等[8]实现了一种BTC域隐藏算法,通过应用LSB方法与嵌入误差最小原则将秘密信息嵌入到BTC域重建电平与位示图中。姜明芳、朱宁波设计一种BTC域图像脆弱水印算法[9],利用BTC编码器重建电平的奇偶性以嵌入水印,水印提取时无须原图像参与,算法透明性好,计算开销低,可应用于实时环境图像数据认证。这些算法[6,7,8,9]均为应用于隐匿通信的数据隐藏方案或用于数据认证的脆弱水印,而非针对数字图像版权保护。Guo等[10]利用void-and-cluster方法与有序抖动,实现一种ODBTC域稳健水印算法,但计算复杂度较高,难以满足实时应用需求。姜明芳等[11]结合块截短编码与秘密共享设计一种稳健BTC域图像水印算法,算法利用BTC编码由原图像构建特征共享,利用水印图像与特征共享一起生成私有共享,检测端由待验证图像构建的特征共享与私有共享一起恢复水印图像,水印嵌入没有引起图像质量的改变,拥有较高的水印稳健性,但该算法仅是利用BTC编码生成特征共享,水印嵌入并非在BTC编码域进行,同时嵌入和提取端需持有共同的和私有共享。
为实现BTC图像水印算法稳健性与透明性的较好平衡,本文充分利用Haar小波变换的时频局部特性,在挖掘图像BTC编码域视觉特性的基础上,提出一种稳健BTC图像水印算法。
1 BTC编码
BTC编码是一种简单快速的图像压缩方法,近年来开始被人们利用来与信息隐藏结合以实现实时环境图像通信安全[11]。图1给出了BTC编码基本原理,其中图1a是4×4的原始图像块,其均值μ≈128。经BTC编码后原始图像块由位示图B(如图1b所示)与两个重建电平u,v组成。原始图像中大于μ的像素在位示图B中用“1”标示,其对应区块像素均值u≈130;反之小于均值μ的用“0”标示,其对应区块像素均值v=125,大于块均值μ的像素个数q=10。图像解码由三元组(B,u,v)即得如图1c所示的重建图像。
2 BTC图像水印算法
为实现BTC图像水印算法透明性与稳健性的良好平衡,利用Haar小波时频局部特性与人类视觉感知特性的一致性,充分挖掘图像BTC编码域视觉特性,将水印嵌入到图像BTC编码重建电平之中。
2.1 水印嵌入
详细的水印嵌入步骤为:
1)读取原始灰度图像I,获得灰度矩阵X,读取秘密信息S(二进制比特信息,即水印)。
2)给定分块大小c×c,由灰度矩阵X获得图像I的BTC编码(Bi,ui,vi),其中i表示图像分块。
3)对于第i个分块的BTC编码(Bi,ui,vi),应用一层Haar小波变换于两重建电平ui,vi,得到
4)秘密信息嵌入。由于人眼对图像边缘信息比较敏感,不容许图像边缘区有较大改变。而差值越大,则说明对应边缘效应越明显,水印嵌入强度应越小,于是可根据差值hi的大小来确定水印嵌入强度。从秘密信息S中获取当前秘密信息比特s,给定阈值T,具体嵌入策略为
式中:RLSB(x,y,z)表示用比特z直接替换x的第y个LSB(Least Significant Bit)位。设修改后的均值与两重建电平分别为li′,ui′,vi′,经过上述修改,可能会导致逆Haar小波变换后两重电平ui′,vi′溢出,若信息嵌入导致溢出,则不对该块进行秘密信息嵌入,并对BTC三元组(Bi,ui,vi)进行置反操作[7],定义为
式中:¬Bi表示对Bi的元素进行取反操作。
5)重复步骤3)和步骤4),直至所有块处理完毕或秘密信息已全部嵌入为止,即得隐藏BTC编码图像。
2.2 水印提取
水印提取基本上是水印嵌入的逆过程,具体描述为:
1)读入隐秘图像I′,给定分块大小c×c,得到BTC编码三元组(Bi′,ui′,vi′)。
2)对于第i个分块的BTC编码(Bi′,ui′,vi′),应用一层Haar小波变换于两重建电平ui′,vi′,于是有
3)水印比特提取。由于水印嵌入没有改变两重建电平差值,所以当未发生溢出时,可根据差值hi′确定水印提取比特位(在均值li′中的LSB位),提取策略为
式中:LSB(x,y,z)表示直接提取x的第y个LSB位,得到比特z。
4)重复步骤2)和步骤3),直至所有块处理完毕或水印信息已全部恢复,即得恢复水印S′。
3 实验结果与分析
仿真实验中以大小为512×512的灰度图像为测试图像,取BTC分块大小为4×4,用伪随机产生的0,1比特序列作为水印信息。图2给出了两幅不同类型的测试图像,式(2)和式(5)中阈值T取值为8时,图3显示了一些相应的隐秘BTC图像,隐秘图像视觉质量较好,难以觉察到水印嵌入前后的视觉差别,此外,表1给出了阈值T取值不同时,不同类型图像的峰值信噪比(PSNR)与隐藏容量,进一步说明了提出算法对不同类型图像的良好透明性与隐藏容量性能,并且随着T值增加,算法将具有更高的隐藏容量,而隐秘图像PSNR值随之下降。
注:这里的PSNR值是隐秘BTC图像相对于原始载体图像进行计算的,而不是相对于BTC编码图像计算得到的。
另外,以Lena图像为例,针对多种不同类型攻击,对算法进行了稳健性测试,测试结果用归一化相关值(NC)进行评价,如表2所示。表2的测试结果表明算法对通常的低通滤波、噪声叠加、亮度调整、直方图均衡、JPEG压缩具有较好的稳健性。
最后,以Lena图像为例,测试了本文算法与Guo等算法[10]的隐藏容量,其对比实验结果如表3所示。由表3可以看出,在保持基本相同的隐秘图像视觉效果时,本文算法隐藏容量平均提高11 kbyte以上。
注:其中Lin等方案采用第5种替换策略。
4 小结
为实现实时环境数字图像版权保护,在直接利用BTC域视觉特性的基础上,利用Haar小波变换,提出一种稳健BTC图像水印算法,较好地实现了水印透明性、隐藏容量与稳健性的统一,对通常的低通滤波、噪声叠加、亮度调整、直方图均衡、JPEG压缩等通常的图像处理攻击是稳健的。水印嵌入直接在BTC域进行,计算开销低,可应用于数字电视实时通信环境图像版权保护。今后将进一步充分挖掘图像BTC编码域视觉特性,研究稳健的BTC图像无损水印算法与半脆弱水印算法,为数字电视提供版权通信的同时实现数字电视高质量传输。
参考文献
[1]李旭东.图像量化水印方法中量化公式的最优化分析[J].光电工程,2010,37(2):96-102.
[2]高瞻,周昊.用于无线网络用户识别的实时水印算法[J].电视技术,2008,32(S1):134-136.
[3]尹亚光.一种流媒体实时水印嵌入与检测方法[J].电视技术,2009,33(8):13-14.
[4]DELP E J,MITCHELL O R.Image compression using block truncationcoding[J].IEEE Trans.Communication,1979,27(9):1335-1342.
[5]杨恒伏,孙光,田祖伟.基于图像局部特性的自适应块截短编码算法[J].微电子学与计算机,2009,26(7):248-250.
[6]HU Yuchen,LIN Minhui,JIANG Jihan.A novel color image hidingscheme using block truncation coding[J].Fundamenta Informaticae,2006,70(4):317-331.
[7]WIEN H,CHEN T S,SHIU C W.Lossless steganography for AMBTC-compressed images[C]//Proc.IEEE Congress on Image and Signal Pro-cessing.Sanya:IEEE Press,2008:13-17.
[8]LIN M H,CHANG C C.A novel information hiding scheme based onBTC[C]//Proc.International Conference on Computer and InformationTechnology.Wuhan:IEEE Press,2004:66-71.
[9]姜明芳,朱宁波.基于BTC域的图像脆弱水印算法[J].科学技术与工程,2009,9(3):717-719.
[10]GUO J M,WU M F,KANG Y C.Watermarking in conjugate ordereddither block truncation coding images[J].Signal Processing,2009,89(10):1864-1882.
实时视频水印技术 篇3
本文将OFDM技术运用于对水印图像的预处理过程中, 将水印图像在随机化之后再进行OFDM编码, 随后进行正交变换, 从而使水印信息分布更加均匀, 并且提高了水印的鲁棒性能。将这种鲁棒的水印嵌入到载体视频, 该视频是未经压缩的原始视频, 嵌入位置处于DCT变换空间域进行, 通过修改视频某一帧的DCT系数来实现水印信息的嵌入。该方法能够比较准确的提取出原始水印图像, 水印信息能够抵抗MPEG - 2 压缩和解压缩。
1 水印图像预处理
在将水印图像嵌入视频之前, 首先要对水印图像进行一系列的预处理, 以提高它的随机性, 并提高水印抗攻击和抗干扰的能力。
1. 1 水印信息随机化
首先将原始水印信息进行随机化或者置乱操作, 可以将水印信息与伪随机序列进行异或操作, 或者采用置乱方式, 最常用的置乱方法有Arnold变换和幻方变换等。这样做的目的是增加水印信号的随机性, 使攻击者难以获取原始的水印信息。实验表明, 随机化之后的OFDM符号峰平比降低, 并且信噪比有一定程度的提高。
1. 2 OFDM编码
经过随机化之后的水印首先进行双极性映射{ 1→ - 1, 0→1} , 这样可以用实数域的乘法来代替逻辑域的异或运算, 提高了算法的便利性。载波调制选用QPSK的方式, 前面提到OFDM的过程可以等效为IDFT的过程, 所以最终生成的OFDM信号表示为:
这里将数据分为了M组, 对QPSK来说, 每组2 个比特, 所以经过QPSK调制之后生成的是M个复数, 再将M个复数经过2M点的IFFT变换, 这样就将频域内的M个复数变为时域中的2M个实数。
1. 3 正交变换
为了使水印信息的分布更加均匀, 在OFDM编码过后, 再将其进行一次正交变换, 生成的OFDM信号与正交矩阵进行乘法操作, 这样可以进一步降低信号的峰平比, 为嵌入和提取水印创造了有利的条件。
2 视频水印的嵌入和提取
本文将水印图像嵌入视频中选用的是基于变换域的视频水印算法, 该算法在未压缩的原始视频中嵌入和提取水印信息, 未经压缩的原始视频的每一帧可以看作是时间上连续的一系列图像, 将这些图像进行DCT变换, 变为空间域上的一组系数, 将水印图像嵌入到这些DCT系数中去。因为修改DCT系数的嵌入算法不需要完全解码和再编码的过程, 不会造成视频质量比较明显的下降, 并且不会增加视频流的数据比特率。
2. 1 MPEG - 2 压缩标准
MPEG定义了I、P、B三种图像格式, 分别为帧内图、向前预测图及双向预测图, 如图1 所示。
2. 2 水印嵌入过程
1) 原始水印信息经过Arnold变换进行置乱, 再进行OFDM编码, 再经过正交变换, 生成待嵌入的水印图像。
2) 将载体视频的这一帧分为互不重叠的8 × 8 的块aij, 选取视频的第8 帧作为嵌入水印的目标, 一个8 × 8 的块是进行DCT变换所需的最小单位, 该帧的每一个8 × 8 块进行DCT变换, 得到几组DCT系数。
3) 取每一块DCT系数中经过zigzag扫描编号为40 的中频系数作为水印的嵌入目标, 水印序列依照如下准则进行嵌入。
W' ( k) 为嵌入水印后的DCT系数, a为嵌入强度, sk为经过预处理的水印序列。
4) 将嵌入水印后的DCT系数W' ( k) 存放到原来的位置上去, 再将该帧进行IDCT变换, 得到水印化得视频, 即完成水印的嵌入过程。
5) 嵌入水印的视频再经过MPEG - 2 压缩编码, 使得视频能够在系统中传输。
2. 3 水印的提取
同样在接收端, 首先将经过MPEG - 2 压缩的水印视频进行解压缩, 对水印的提取过程就是对以上 ( 2) 到 ( 4) 过程的逆操作, 在这个过程中所需要检测的是解压缩后视频的第8 帧, 将这一帧进行DCT变换, 取出每一块的DCT系数矩阵, 从该矩阵的第5 行第5 列的DCT系数值中提取水印信息, 从这里所提取的数据就是所需要的水印信息。在获得了水印信息之后, 就需要对其进行OFDM解码, 并进行反Arnold置乱操作, 最终得到原始的水印图像。
摘要:介绍了一种基于OFDM技术的数字视频水印方案, 旨在保护数字产品的知识产权和阻止盗版。针对现有的基于OFDM的鲁棒水印技术进行进一步的应用, 将这种技术运用到视频加密中去。
关键词:数字水印,正交频分复用,视频水印,离散余弦变换,MPEG-2
参考文献
[1]朱叶.关于OFDM系统的仿真研究[J].科技信息, 2011 (5) .
[2]刘绍辉, 韩路, 姚鸿勋.抗共谋攻击的视频水印算法[J].通信学报, 2010 (1) :31.
实时视频水印技术 篇4
1 视频水印技术概述
1.1 视频水印技术的基本概念
数字水印技术(Digital Watermarking)其实就是一种信息隐藏技术,它的基本思想源于古代的密写术。古希腊人将重要的军事情报刻在木板上,然后用石蜡填平,收信方用火烤热木板将石蜡融化后,就可以看到隐藏在木板里的密信。
视频水印是指用数字信号处理的方法,在视频数据的冗余信息中嵌入版权标记,且不影响原始视频数据的质量,而人们无法从表面上感知到水印的存在,只有通过专用的水印检测器才可以检测出隐藏的数字水印信息。
1.2 视频水印技术的特征
数字水印作为一种信息隐藏技术,具有以下基本特征:1)不可见性,在多媒体信号中嵌入数字水印不会造成图像、音频或视频信号主观质量的明显下降;2)稳健性(Robust),在不严重破坏多媒体主观质量的前提下,对多媒体数据经过有意或无意的操作后,数字水印仍能保持完整性并能被检测出来;3)抗攻击能力,嵌入的视频水印信息能够有效地抵抗各种有针对性的攻击行为,保证水印信息不被破解。
视频水印作为数字水印技术在视频信号处理中的应用,还应该根据用户对视频观看必须实时的客观要求,具备实时实现性的特征,这就要求水印嵌入和提取算法的运算量不能太大,以保证视频质量的延时性要求。同时,视频水印信息的检测必须能够保证随时随地在视频流中的任何位置随机地检测出来。另外,视频水印在嵌入时,还要考虑视频数据采用的编码标准,若水印信号与视频信号采用了不同的编码标准进行编码,嵌入的水印信号在视频编码过程中会严重失真[1]。
1.3 视频水印技术的分类
根据视频水印技术的不同研究领域和不同应用环境,可以有多种不同的分类方法。例如,按照视频水印在不同变换域的研究,可以分为空域水印、时域水印和频域水印等。而根据视频数据是否被压缩处理,可以分为压缩域与非压缩域的视频水印[2]。总之,视频水印技术是基于研究对象和目的进行分类的,并没用固定的分类方法。
2 视频水印技术的基本原理
2.1 视频水印的数学模型
工程应用数学上常用相关系数来判定两个信号的相似性,而在图像处理领域一般用归一化的相关系数来衡量两幅图像的相似度。视频水印的嵌入和提取都是同一个水印信号,因此,也可以用归一化相关系数的数学模型来判定提取出的视频水印与原始嵌入水印的相关性。归一化相关系数的定义为
式中:X(i)是原始嵌入水印信号,Y(i)是提取出来的水印信号,M表示水印容量。
2.2 视频水印的系统模型
视频水印的系统模型如图1所示。
水印特征值通过设计好的嵌入算法计算后形成水印信号,经过水印编码器将水印信号嵌入到视频数据流中,并根据实际应用环境和加密级别采用相应的密钥体系进行加密;嵌入了水印的视频数据流在传输过程中可能会遭到各种针对视频内容的攻击;水印解码器只能在获取密钥的前提下,利用相应的水印提取算法检测出水印,若没有解密密钥,攻击者无法从视频数据中发现和修改水印。
2.3 视频水印的嵌入与提取
由于中国有线电视传输采用的是欧洲DVB-C标准,而DVB-C标准规定采用MPEG-2作为视频的压缩编码标准,所以下面主要探讨视频水印与MPEG-2压缩编码标准相结合的嵌入策略。
根据原始视频数据是否被压缩处理,以及视频信号处理的一般过程,视频水印的嵌入与提取可以有3种不同的策略,如图2所示。
将水印信息直接嵌入到原始视频数据中[3],由于原始视频本身的数据量就是巨大的,因此,当进行DCT和IDCT变换计算时,其计算量也是相当大的,很难保证视频的实时性要求;在MPEG-2编解码过程中嵌入和提取水印信息,需要对现有的编解码器要作修改,而且存在Go P(Group of Picture)的误差积累,会降低视频的质量;直接在MPEG-2视频流中嵌入和提取水印,不需要完全的解码和再编码过程,且计算复杂度低,但受压缩比特率的限制,限定了嵌入水印容量大小。
通过上述对3种水印嵌入和提取策略的分析比较,结合数字电视播出监控并不需要很大的水印容量,不难看出,采用低复杂度的策略3设计基于MPEG-2标准压缩域的视频水印算法比较适合有线数字电视的播出监测。
2.4 基于MPEG-2压缩域的视频水印技术
MPEG-2系统编解码过程的实质其实就是是对视频数据的压缩和解压缩过程。MPEG-2视频压缩标准主要使用了3种关键的压缩技术:离散余弦变换DCT、运动补偿和Huffman编码。在MPEG-2系统中存在5个档次(Profile)和4个等级(Level),采用层次化结构,自上到下分为图像序列层、图像组、图像、像条、宏块和块。MPEG-2图像的帧类型分为I帧、B帧和P帧。块(Block)是MPEG-2码流层次结构中的最小单元,也可以指DCT系数的编码数据单元。
DCT是MPEG-2压缩编码的核心技术,目前大多数基于MPEG-2压缩域的视频水印算法都是通过对DCT量化系数的处理实现嵌入水印。二维DCT变换的定义为
根据DCT变换的原理,图像经过二维DCT变换后,DCT系数中的低频DC系数(直流分量)集中了信号的大部分能量,其幅值远远大于高频AC系数(交流分量)。低频系数是视觉系统感知上重要的分量,结合人类视觉系统模型(HVS),将水印嵌入到DCT域的DC系数比AC系数更有助于水印的稳健性[4]。
视频水印的嵌入点一般选择视频的I帧数据,因为在MPEG-2系统中,P帧和B帧都是帧间预测编码,只对部分像素进行编码,而I帧是帧内编码,帧内全部像素都将进行编码,因此I帧的数据是最完整的,使得可以嵌入的水印容量较大,所以选择I帧作为水印信息嵌入的载体。图像组Go P的第一个数据帧一定是I帧,所以利用图像组头标记(group_start code)和图像标记(picture start_code)可以实现对I帧数据的查找。水印编码器对接收到的MPEG-2节目流进行解压缩并提取出用于嵌入水印信息的I帧数据,在I帧数据的亮度分量DCT量化系数中嵌入水印信息,然后将嵌入了水印信息的I帧数据重新打包成符合MPEG-2标准的视频流。
水印信号的组成主要包括节目PID和时间标签,不同的节目PID唯一对应不同的数字媒体内容,时间标签在MPEG-2节目复用输出时实时嵌入。水印检测器通过对检测到的节目PID和时间标签信息的处理,可以构成各种播出监控应用系统。
3 视频水印技术在数字电视监测中的应用
3.1 数字电视节目版权保护
视频水印技术作为目前数字媒体版权保护领域最有效的技术手段之一[5],也可以应用于数字电视节目版权保护。国内的广电运营商普遍采用基于DVB端到端加密的条件接收系统来实现数字电视节目传输过程中的加密保护。但是,在用户终端,失去CA系统的保护,解密后的数字媒体内容便可以任意的拷贝和传播,给广电运营商造成巨大的经济损失,也严重制约了数字电视业务的健康发展。
当电视节目播出时,代表运营商版权的水印信号被实时嵌入到数字电视节目中,同时,与嵌入水印相关的信息(节目PID、节目频道安排等)被存储在数据库中,可以对机顶盒解密后的多媒体内容提供进一步保护。在监测端,用水印检测器提取出嵌入的原始水印,在发生盗版行为和版权纠纷时,可以证明对该数字媒体内容的所有权,并可以作为侵权诉讼的证据。
3.2 前端信号源传输安全监控
有线电视网络前端的信号源主要包括省传光纤信号、微波信号,卫星信号和本地自办节目信号。对于地方卫视节目,一般都是通过卫星链路进行传输的,由于卫星信号是开路空间传输,上行链路容易受到恶意干扰、拦截、非法插播。
目前,各级广电运营商都已经建立了安全播出监控系统,并安排值班人员24 h监看。但是,目前的监控系统都是针对电视节目播出信号质量的监测,而针对非法插播的内容监控仍需要人为的操作,现有的监控系统无法实现对信号源内容的监控。基于视频水印的数字电视安全播出监控系统则可以实现对信号源节目内容的自动监控。监控系统示意图如图3所示。
在卫星节目发射上星传输之前,先通过视频水印编码器对播放的全频道电视图像信号进行数字水印嵌入,开路空间的卫星传输过程中经常会遭到恶意攻击,在接收卫星节目的有线电视前端安装视频水印解码器,对接收的卫星信号自动实时监测水印特征标,如果特征标丢失,可以告警值班人员并采取手动或自动应急切换系统切换到垫播信号防止非法信号的播出。借助视频水印技术进行内容自动监控,不仅可以减轻监控人员劳动强度,同时大大提高监控质量。
3.3 传输分配网信号的监控
广电运营商仅仅对前端信号源进行监控是不够的,由于HFC网络的拓扑结构主要是星型结构和树形结构,因此很容易被不法分子利用这种结构的缺陷,在很多地市都曾经发生过针对有线电视网络某个覆盖区域非法插播的事件。数字电视整转后,很多城中村居民为了逃避缴纳有线电视基础收视费,非法搭建电视播出小前端;区、县等二级广电运营商为了自身利益在电视节目中私自插播广告,这些行为都严重地损害了广电运营商的利益。部署数字电视水印监测系统,在传输分配网的不同地理位置上放置众多的水印监测终端,可以实现对有线电视网络覆盖区域的全面监控,如图4所示。
在前端机房,信号在送入HFC网传输前先通过水印编码器嵌入水印信息,再送往干线传输网络进行分配传输,电视信号在传输分配过程中可能会受到各种干扰和攻击,在接收端(或监控端),将信号送入水印解码器进行水印检测,若能检测到水印,表明是合法信号。若检测不到水印或检测到的水印与原始水印不相干,则提示信号是非法信号,并发出警告通知相关人员进行处理。
4 结束语
视频水印技术应用于有线数字电视业务中,可以有效地解决广电运营商开展有线数字电视业务中数字媒体版权保护、数字媒体安全播出等关键技术问题,保证数字电视业务的正常开展,是目前公认的实现数字内容版权保护的最有效解决方案之一。
摘要:在三网融合的大背景下,针对有线数字电视业务开展中的数字媒体版权保护问题,提出了采用视频水印技术进行内容监测的解决方案。首先简单介绍了视频水印技术的概况和基本原理,然后详细阐述了视频水印技术在数字电视系统中各监测节点的具体应用方案。
关键词:数字电视,视频水印,电视监控,版权保护
参考文献
[1]邵凤莲.数字水印在电视领域的应用及其关键技术[J].现代电视技术,2004(11):77-80.
[2]伍宏涛,张立和.视频水印技术发展分析[J].电视技术,2003,27(8):70-72.
[3]刘祥权.使用数字水印实现广播电视节目的精确监测[J].广播与电视技术,2009(3):135-137.
[4]徐先传,张琦.一种基于DCT域的数字水印方案研究[J].微计算机世界,2007(12):59-61.
电视实时路况视频业务及技术实现 篇5
数字视频技术在过去十年中获得了广泛应用, 数字视频广播、数字视频光盘、数码摄像机、远程教学、在线点播和视频会议等就是一些典型的例子。这些应用得以实现的关键就是数字视频压缩标准的制定, 它使得视频在获得了极高压缩比的同时又满足了人们对视频质量的要求[1]。
开展以电视机为接收终端, 向数字电视用户提供多路实时路况视频点播等电视交通导航服务的新业务研究与实现, 形成电视交通导航服务的业务体系、运营体系及相关技术支撑体系, 能够服务于广大电视用户, 带动信息内容产业、网络运营业、设备制造业等产业的发展。
1 基于电视平台的路况视频业务技术要求
基于电视平台的路况视频业务系统, 服务器端的系统主要由信息采集转码处理子系统、路况视频点播子系统、路况信息查询子系统及内容审查子系统等部分组成, 如图1所示。
用户使用实时路况视频业务要求在南方传媒所提供的双向机顶盒上展示前端信息以及所点播的交通视频内容。终端上交互工具是按键式遥控器。也就是说用户使用本系统, 最终是通过机顶盒和电视机作为业务终端。用户对系统操作的技术要求包括:
需要支持路况视频和其他路况信息关联使用。
需要支持实时的路况视频点播的功能 (整体延迟<3s) 。
需要支持选择多路视频同时点播的功能。
为了适应机顶盒的解码格式, 要求采用MPEG-2视频格式。
用户通过机顶盒和电视请求交通视频的应用场景如图2所示。
2 电视路况视频系统的技术实现
实现可运行的电视路况视频系统, 涉及到三方面的关键技术。其一是要在业务服务器上实现业务互动功能;其二是在视频服务器上实现视频格式转码以及多路视频合并功能;其三就是要实现DVB-C制式下的视频点播功能。
2.1 应用服务器技术
整个业务系统以应用服务器为核心, 由于南方传媒机顶盒支持基本的浏览器功能, 应用服务器软件采用典型的B/S模式的三层架构实现方式。B/S结构模式将系统架设在数据服务器、应用服务器、浏览器三个层次上, 数据服务器专门存放数据, 应用服务器提供各类服务组件来访问数据服务器和响应客户端的请求, 机顶盒上的浏览器端只显示结果和发出请求。这种模式的系统维护较为简单, 系统的修改和升级只需在应用服务器端进行即可。机顶盒上的浏览器软件相对计算机上的浏览器软件功能相对有限[2], 所以应用服务器软件要遵从机顶盒浏览器所支持的W3C规范, 如图3所示。
2.2 视频转码及合成技术
电视交通导航服务平台为电视机终端用户提供实时路况视频。在电视环境下, 要求支持四路视频同步播出。机顶盒的处理功能有限, 很难在机顶盒上对多路视频信号进行分屏显示。可行的技术方案是在视频服务器端, 对用户所选择的多路实时视频信号进行拼接处理, 整合为一路视频信号后下发到机顶盒再进行播放。
视频点播处理的功能模块采用实时视频流点播处理的方式。
从系统构成上看, 最终运行的系统之视频服务器应该是连接交通管理部门的交通管理视频服务器。本系统从交通管理部门获取的视频信号都是H.264格式。现在在电视服务平台上, 需要通过MPEG-2编码格式的TS视频流, 所以在视频服务器上需要实现高效率的转码。
在实现视频转码的同时, 本系统还要支持在用户选择查看多路的视频的情况下, 能够在视频服务器上实时完成多路视频合成为一路视频。这部分内容也是本文的技术重点。
H.264编码采用了基于宏块的视频压缩方法, H.264标准中的内部预测创造了一种从前面已编过码的一幅或多幅图像帧中预测新帧的模型。此模型是通过在参考帧中替换样本的方法做出来的 (运动补偿预测) 。其编码性能相对于MPEG-2有了大幅提高, 如图4所示。
由于H.264的编码效率更高, 现有参考文献很多都论述了从MPEG-2到H.264转码所涉及的优化方法和转换效率问题[3,4,5]。
MPEG-2的编码输入, 为H.264的解码输出的YUV数据。在多路视频合成的过程中, 需要对原始视频尺寸进行变换。
H.264解码过程在功能域有多个功能模块, 如运动补偿、帧间预测、帧内预测、反离散余弦变换、反量化、变长编码等。功能划分需要任务间的通信, 适合硬件实现, 数据流依次通过一组功能部件, 分别完成相应的计算, 但不太适合通用多处理器结构。而在数据域进行并行, 则有扩展性好, 易于软件实现的优点, 适合于通用的片上多处理器。本文在实现H.264解码过程中, 采用了数据域的并行加速。
MPEG-2编码采用帧间编码, H.264解码过程中保留的宏块关联信息可以加速的预测图像的比较, 计算出运动矢量, 由此运动矢量和参考帧生成原始图像的预测图像。而后, 将原始图像与预测像素差值所生成的差分图像数据进行DCT变换, 再经过量化器和比特流编码器生成输出的编码比特流。
2.3 视频点播技术
交通监控的视频格式兼容问题, 视频的转换问题, 视频点播处理的实时性能问题等。本项目需要确认交通视频的主要组成格式, 并确认通过视频转换的方式支持在南方传媒机顶盒上进行转换[6,7]。
目前的VOD系统的视频播出方案, 主要有两种方式, 一种是基于广电HFC网络广播方式下发视频信号的VOD, 另一种是基于IPTV模式点对点下发视频信号的VOD。本文采用基于广电HFC网络的VOD系统, 是面向传统广电网络架构的方案, 和原有的网络系统兼容。视频的下传采用HFC广播通道和DVB编码协议, 编码格式采用MPEG-2。其中IPQAM设备负责实现将视频流进行QAM调制和频率变换, 输出RF信号, 广播到用户对于的HFC网络中, 如图5所示。
我们对视频服务器点播功能的实现是基于D a r w i n S t r e a m i n gServer (简称DSS) 。DSS符合ISMA规范, 支持多种标准协议和格式。
每个DSS模块都必须提供一个Dispatch函数。Dispatch函数的格式如下所示:
void MyModuleDispatch (QTSS_Role inRole, QTSS_RoleParamPtr inParams) ;
在路况视频项目中, 我们对DSS进行了扩展, 以实现对MPEG-2 TS流的支持, 扩展实现RTSP协支持MPEG-2 TS流;并且使它能够通过UDP协议直接发送TS流。
使用扩展后的RTSP协议实现MPEG-2 TS流点播时, 与通常的RTSP交互过程相比, 在SETUP阶段有所不同。为了让RTSP协议能支持QAM传输, 需要对标准的RTSP协议做扩展, 即在SETUP阶段, 终端告诉服务器需要QAM传输, 服务器会为该终端分配传输资源, 并告诉终端相应的参数 (包括频点和节目号等) 。
为了实现MPEG-2 TS流通过Cable下发, 关键点是视频服务器能够采用UDP协议将TS流依特定速率发送到IPQAM设备。采用UDP协议把TS包发送到IPQAM设备, 实现相对比较简单, 假定TS包的大小是188字节的, 只要遵照一个UDP包不应大于以太网最大传输单元的原则, 将7个TS包打包成一个UDP包, 发送给IPQAM设备即可实现。
3 电视路况视频系统的性能测试
针对上述设计, 整个系统的性能消耗最关键的环节是视频转码和合成部分。我们对视频服务器的视频转码和合成部分进行了相关性能测试。
本文以惠普ML330 G6为测试平台, 对标准的测试序列进了转码和多路视频合成, 服务器的配置为双核至强2.26CPU, 4G内存, 250G硬盘。不同转码及视频合并的延时情况测试结果如表1所示。
在高清视频头的情况下, 视频转换和合成所需要的时间延迟明显大于标清情况。目前部署的视频摄像头, 还是以640×480分辨率的标清摄像头为主。
并且测试了通过IPQAM进行视频点播的功能。视频点播业务处理的时间延迟约为1s。图6是对四路视频进行合并后, 通过机顶盒在电视机上的显示效果。
测试结果显示, 本文所提出的技术实现方案, 能够很好满足实时路况视频业务需求。
4 结束语
电视实时路况视频业务能够通过电视平台为老百姓提供有效出行服务。本文重点研究了基于电视视频点播平台实现多路交通视频点播的技术难点, 针对难以在机顶盒终端上进行多路视频合成的问题, 设计了一种在服务器端快速实现视频转码和合成的算法, 该算法具有较低的复杂度和较短的时间消耗, 能够满足路况视频业务的实时性要求。本文提出的视频转码机制与视频点播方法计划应用于实际运营的系统中。
参考文献
[1]孟蕾.双向机顶盒的特色增值业务应用[J].有线电视技术, 2008.
[2]杨超.数字电视嵌入式浏览器的研究与实现.电子科技大学, 2005.
[3]肖友能, 薛向阳, 曾玮.视频转码技术回顾[J].通信学报, Vol 23, No.8, Aug.2002.
[4]柳羽中, 严肃, 陈启美.低复杂度的MPEG-2到H.264快速转码算法[J].计算机工程与应用, 2009, 45 (4) .
[5]LEI Zhi jun.Video transcoding techniques for wireless video communications[D].Ottawa:University of Ottawa, 2004.
[6]POON W F, LOK T, FENG J.Provision of continuous VCR functions in interactive broadcast VoD systems[J].IEEE Transition Broadcasting, 2005, 51 (4) :460-472.
实时视频水印技术 篇6
1实时化视频网络传输系统架构形态观察研究
任何一类完整格式的视频网络传输系统,长期联合视频精确化采集、引导程序科学编码、控制协议统一调试等工序加以舒展, 确保能够在既有时延和丢包特性控制范畴内,建立起以TCP/IP通信网络为基础的视频多元化应用服务流程。如今广泛沿用的视频网络传输系统,其对于视频流发送端采样工作加以高效模拟演练,在数字视频资料获取完善之后立即加以编码操作,进一步从中衍生能够直接面向网络通信工作的视频码流。之后在标准反馈信息指导下, 细致估计网络传输带宽度,同时完成编码器输出效率自适应调试任务,避免最终视频码流和网络既有传输带宽交接期间滋生任何不必要的限制危机。同样地,对于接收端来讲,技术人员也应联合内部视频流信息加以精确化解码验证,并且实现内部视频信号、网络传输参与、反馈控制内容的重新定义发送指标。
2视频采集模块单元技术支持性特征验证解析
此类模块主要利用视频A/D与D/A、同步逻辑控制与数据多元化存储器具搭建形成。其中A/D结构单元,主张将不同标准样式的模拟视频信号快速转换成为数字形式的视频信号资源,并将此设定为内部支持性子单元特有的输入校验数据。相对地,逻辑产生区域,会集中一切手段将FPGA、CPLD筛选完毕,进一步贯彻同步逻辑掌控指标,避免今后数据信息采集期间滋生任何与实时特性冲突的因素。需要加以强调的是,核心技术人员在进行视频数据精准解析和科学处置活动中,模块信息采集和运算工作量着实难以估计,为了将预设实时性指标稳固发挥,相关操作主体会自然地将核心注意力投射在专业性处理芯片层面之上,相信经过高速化DSP、FPGA等媒介百般交接过后,有关视频最终传输任务便也顺利交接完成。对于此类采样芯片选取工作来讲,工作人员完全可以将视线锁定在TI公司开发的数字视频解码器TVP5145结构之中, 其可以将一切和NTSC、PAL等相关的制式模拟视频功能快速转化为数字复合样式。结合笔者创新式网络视频传输系统搭建要求观察, 有关视频A/D单元主要利用飞利浦公司提供的可编程视频输入引导芯片SAA7111。须知此类部件主要凸显CMOS既有工艺特性, 当中穿插着四路模拟视频输入交接通道,尤其经过I2C总线接入过后,主机终端便能够更加方便地完成特定器件初始化调试任务。另外,SAA7111芯片之中自行产生模拟通道最优选择功能,能够针对输入视频加以抗混叠滤波填充,当中包含的8位样式的A/D转换器至少存在两个。再就是此类芯片已经完全实现钳位、增益自动化控制预设指标,其中时钟产生和多制式解码功能,都相应地在视频亮度、色度以及饱和度方面加以片内疏导管理。
3视频编码与解码模块的细致性开发和高度转接沿用
单纯透过笔者构筑的传输用户终端平台结构形态观察,其中核心编码模块主要结合Anabg公司提供的实时化视频压缩解压芯片,如ADV611等加以编码操控。这部分芯片主要在小波变换视频解码工作中发挥独特适应能效,并且保留独有的质量窗特性,能够集中一切手段将单位场视频图像内部元素进行更高程度的解压。 这类强调的质量窗,实质上就是将方框尺度和位置定义主导权力交托给用户,而内部图像便依照预设比例进行自由压缩,并且不会对图像对比度质量造成过度影响。借由既定实践结果整理判定,涉及编码、解码期间相关的压缩、解压参数,具体是配合主机、主机接口进行ADV611单元传输的,相应地就是强调主机必须针对ADV611提供丰富样式的编码指导性参数内容。所以,结合AD公司开发的ADSP2185能够对ADZ611急需的各类参数计算、高精度传输提供技术支撑保障,并且在ADV611编码工作处理完备过后,有关裸压缩数据流便可以自动完成网络传输编码任务,进一步生成可以高度迎合网络传输的视频流信息内容。
4结语