视频数字压缩

2024-10-15

视频数字压缩(精选7篇)

视频数字压缩 篇1

随着社会高清数字电视视频压缩编码技术的发展, 数字视频压缩编码在很多个领域进行进行了广泛的应用, 视频编码技术在压缩编码的过程当中会产生块效应, 这种块效应的发生导致了压缩图像质量的下降, 而预处理完全可以很好的的制止块效应, 所以, 视频信号在编码之前一定要进行预处理, 首先是噪声的问题, 还有一些人不能看到的高频信息, 以此来达到最好的编码效果。预处理主要是应用在电视上, 电视广播行业在我国有了几十年的发展, 电视行业发展到今天有了卓越的进步, 从以前的黑白电视到现在的高清数字电视。人们对生活不断的要求, 极大的促使了电视产品的更新换代的步伐。在一些发达的国家, 对于高清数字电视已经全面的普及了, 并且开始研发超高清数字电视。在我国高清数字电视技术的发展, 很大程度上丰富了人们的生活, 缓解了工作上的压力, 也为自己的业余生活带来了很大的乐趣。

1 对高清数字电视视频压缩编码的概述

在对高清数字电视视频压缩编码色度采样为例进行概括, 我们对高清数字电视视频压缩编码技术有效研究的目的是更新视频压缩标准, 用新的压缩标准来满足宽带传输高标准要求, 这样可以提高数字电视画面的分辨率。我们在平时用电视在接收4K信号图像的时候, 这个时候我们电视接收到的这个信号图像, 它的用一个原始数据率, 通过原始数据率我们可以归总出来一个结果:2.78Gbit/s。假如我们接收到一个8K的图像信号, 它相应的也应该有一个原始数据率, 这个原始数据率是11Gbit/s, 我们在运用传统的视频压缩标准的时候, 在一定程度上我们用H.264的形式对4K进行模式图像, 然后对其开始压缩, 在对4K图像进行压缩的时候, 它的压缩量会变小。这样的话就不能满足视频图像处理要求, 但是这种压缩方式对宽带传输有很大的要求。降低宽带传输时的限制要求, 世界研究人员经过精心的研究, 研究出了HEVC技术, 它是从264/AVC新一代视频编码技术, 它的主要功能是在对其压缩的时候, 这样电视会给电视一个很好的视频压缩效率, 它与原来的视频图像压缩效果相比不仅性能提高了, 而提高了一倍。所以, 它在领先于其他编码技术的同时, 也在高清电视压缩技术上取代了传统视频编码技术。

2 电视压缩编码技术

2.1 HEVC编码结构技术

电视编码技术主要是HEVC编码技术, 它采用的是H.264中的编码框架, HEVC编码采用H264的同时在内容结构上也运用先进的技术得到了更新, 让他在性能上更具有应变度。有关人士通过研究, 在HEVC编码技术的基础上通过精心研究, 发明了新型的, 在新能上更具优势的超大尺寸的编码结构, 该编码还加入了三种不同的结构方式, 并且还运用这三种方式来进行有效的分隔、编码, 这样做的好处是很大程度上保障了的编码压缩后的效果。还有就是HEVC编码技术在结构上要比H.264编码结构很大程度上大很多。有了HEVC编码结构, HEVC编码结构中的CU代表的是编码单元, CU的内部结构方式和整体上的结构是相同的, 在整个CU编码中, 最大的CU是64×64, 最小的CU甚至可以达到8×8。这就说明了划分出的CU单元它的形状应该都是正方形。TU的作用和CU相关, 它的功能是是对预测CU。TU在预测CU时, TU单元的大小要小于CU的大小, 在划分中可以成为任何形状, 完全不受限制。

2.2 帧内预测编码技术

HEVC不单单是只有压缩编码的功能, 它还有帧内预测编码的技术, 就是可以对高清电视视频进行编码。它的这种功能, 也是在H.264编码技术的基础上发展出来的。在HEVC帧内预测编码技术中, 在HEVC编码中, 预测单元的PU大小是不相同的, 他们的分布分别在一个规中规矩的位置。但是在实际预测的过程中, HEVC对大小不同的PU提供出了相应的非方向性预测方法, 并且它还为此提供了多方向性帧内预测的有效方法, 很好的为PU预测单元操作成功提供了有利条件。

2.3 编码环路滤波技术

提到环路滤波技术, 我们就必须要提到SAO了。SAO在类型方面有两种类型:一种是带状补偿;另一种是边缘补偿。边缘补偿是把一种像素和它旁边的像素, 两者充分的进行优势对比, 完成之后, 要把像素分类标识的方法进行合理的分类。解码的过程应该根据对应的分类标识有效的补偿。各个模板只对相邻的像素产生相比较现象, 因此在实际操作的时候非常简单。LCU能够在一定环境下进入独立解码状态, 在顶行和底行的LCU像素一般不对模板进行有效处理;根据这个现象我们可以看出, 任何一个LCU的左右两列, 它们的像素也不对模板进行信息处理工作。一般重建图像很容易在一定环境下失真, 为了避免这种失真现象进一步发生, 科技人员用HEVC引入了一项自适应环路滤波器技术。这种技术是采用了一种叫树形的自适应环路滤波器, 科技人员采用这种形式的滤波器主要是为了防止编码图像产生噪声。自适应环路滤波器对于亮度分量来说, 滤波器在形状上是以点对称的二维滤波器;在色度分量上, 滤波器形状又变为一个正方形点对称矩形二维滤波器。

3 结语

高清数字电视在技术已经发展到领先地位, 在短时期内不会有更新的产品, 但是IVIPEG2在数字电视上还会起很长时间的作用。高清数字电视内部结构标准有很大的开放性, 所以它有非常广泛的应用, 在高清数字电视方面有很大的竞争力。它在很长一段时间内不管是在多媒体领域还是在移动视频领域都会有个一很好的前景。

参考文献

[1]王玉柱.浅析超高清数字电视视频压缩编码技术[J].黑龙江科技信息, 2014, (4) :17.

[2]李强, 贺晓华.数字电视视频压缩标准[J].湖南人文科技学院学报, 2006, (3) :82.

[3]王子微, 杨盈昀.浅析超高清数字电视视频压缩编码技术[J].电视技术, 2013, 37 (13) :1.

视频数字压缩 篇2

关键词:高清数字,电视视频,压缩编码

随着人们对精神生活的要求不断提高,电视产品不断更新换代。高清数字电视具有较高的分辨率,能满足用户对画质的要求,丰富了人们的精神生活。视频压缩编码技术则在高清数字电视中具有重要作用,下面对此加以研究,旨在提高压缩效率及质量。

1 高清数字电视视频压缩编码的概述

本文以高清数字电视视频压缩编码色度为4:2:0的色度为例,对高清数字电视视频压缩编码技术有效研究的目的是更新视频压缩标准。用新的压缩标准来满足宽带传输高标准要求,可以提高数字电视画面的分辨率。平时用电视在接收4K信号图像时,所接收到的信号图像,用的是一个原始数据率即2.78Gbit/s。假如接收到一个8K的图像信号,相应的也应有一个原始数据率是11Gbit/s。在运用传统的视频压缩标准时,采用H.264的形式对4K进行模式图像,然后对其开始压缩。在对4K图像进行压缩时,压缩量会变小,不能满足视频图像处理要求,但这种压缩方式对宽带传输有很大的要求。降低宽带传输时的限制要求,已有研究人员对其加以研究表明HEVC技术是从264/AVC新一代视频编码技术,主要功能是在对其压缩时,会提供一个较好的视频压缩效率,与原来的视频图像压缩效果相比使性能提高了一倍。因此,在领先于其他编码技术的同时,也在高清电视压缩技术上取代了传统视频编码技术。

2 电视视频压缩编码技术

2.1 HEVC编码结构技术

电视编码技术主要是HEVC编码技术,采用的是H.264中的编码框架。HEVC编码采用H264的同时,在内容结构上也运用了先进的技术,使其在性能上更具有应变度。已有学者在HEVC编码技术的基础上研究发明了在新能上更具优势的超大尺寸的编码结构,该编码还加入了三种不同的结构方式,即CU、PU、TU,来进行有效的分隔、编码,保障了编码压缩后的效果。HEVC编码技术在结构上要比H.264编码结构大很多。在HEVC编码结构中CU代表的是编码单元,CU的内部结构方式和整体上的结构是相同的,同样采用四叉树递归方式加以划分,最小块的CU为8×8,最大块的CU是64×64,说明划分出的CU单元的形状应该都是正方形。TU的作用和CU相关,其功能是预测CU。TU在预测CU时,TU单元的大小要小于CU的大小,在划分中可以成为任何形状,完全不受限制。较为常用的TU划分方法主要有不对称或对称分割,其形状可以为长方形,也可以为正方形。

2.2 帧内预测编码技术

HEVC不单单是只有压缩编码的功能,还有帧内预测编码的技术,可以对高清电视视频进行编码。它的这种功能,也是在H.264编码技术的基础上发展出来的。在HEVC帧内预测编码技术中,预测单元的PU大小不同,且分布位置中规中矩。但在实际预测的过程中,HEVC对大小不同的PU提供出了相应的非方向性预测方法,且为此提供了多方向性帧内预测的有效方法,为PU预测单元操作成功提供了有利条件。

2.3 编码环路滤波技术

提到环路滤波技术,就必须提到SAO。SAO在类型方面有两种类型:一种是带状补偿,另一种是边缘补偿。边缘补偿是把一种像素和它旁边的像素,两者充分的进行优势对比,完成之后,要把像素分类标识的方法进行合理的分类。解码的过程应根据对应的分类标识有效的补偿。各个模板只对相邻的像素产生相比较现象,所以实际操作时非常简单。LCU能够在一定环境下进入独立解码状态,在顶行和底行的LCU像素一般不对模板进行有效处理;根据这个现象可看出,任何一个LCU的左右两列,其像素也不对模板进行信息处理工作。目前,HEVC主要有像素与区域的ALF分类方法。一般重建图像很容易在一定环境下失真,为了避免这种失真现象的发生,科技人员可采用HEVC引入自适应环路滤波器技术。这种技术是采用了一种叫树形的自适应环路滤波器,科技人员采用这种形式的滤波器主要是为了防止编码图像产生噪声。自适应环路滤波器对于亮度分量来说,滤波器在形状上是以点对称的二维滤波器;在色度分量上,滤波器形状又变为一个正方形点对称矩形二维FER滤波器。

3 结语

总之,随着科学技术不断发展,视频压缩编码技术也在不断进步。当前,国际间加强了合作交流,新的研究成果已逐渐得到应用。在今后一段时期内,在高清数字电视中仍具有较大作用。当然,在今后一段时间内,还应不断创新,研究出更好的视频压缩编码技术,提高电视视频质量。

参考文献

[1]阮若林,胡瑞敏.数字视频压缩编码技术标准现状与展望[J].电视技术,2014,38(3):7-11.

视频数字压缩 篇3

很多家庭以及企业的业务活动都开始使用计算机、录像机以及电视等, 很长一段时间以来, 多数都是利用模拟格式来存储和传输视频影像, 相对于模拟视频来讲, 数字视频具有很多优势, 同模拟视频不同的是, 数字视频能够比较容易被压缩, 具有较高的传输和存储效率, 可以被重构和传输, 并且影响不会具有比较明显的损伤, 数字格式也可以对用户提供可以随机获得的更高编辑能力。

2 数字视频压缩算法的性能分析

M o t i o n J P E G所具有的特点。Motion JPEG是当前在节目制作的过程中使用广泛的一种压缩标准, 采用Matrox公司所生产的Digi LE视频卡能够实现Motion JPEG的解压缩以及压缩功能, 并可以组成原型系统用来对Motion JPEG的压缩算法性能进行相应的测试, 结果如下表所示:

因为采用的是帧内压缩, 能够便于对帧的精度进行编辑, 从而实现质量可调的相关有损压缩, 由于不能利用视频流所具备的时间冗余, 就会使得压缩比受到一定的限制, 如果压缩比比较大, 就会使得图像产生明显的方块效应, 在压缩比在8:1的情况下能够达到演播室所要求的视频播放质量, 为了可以保证节目质量在多次解压和压缩之后仍然可以保持广播级, 就必须要将其压缩比控制在4:1之下。图像的数据交换中, Motion JPEG并不是一个完整的结构, 对Motion JPEG的数据流所下的定义基本是根据译码器所需要的具体内容来实现的, 这就使得Motion JPEG并没有较为标准的一个文件格式, 容易造成不同的数字视频在进行系统间的数据交换时会遇到一定的困难。

3 对非线性编辑系统所进行的设计

3.1 非线性编辑的定义

电视主要是通过电子的方式对磁带进行顺序搜索, 要调换节目的顺序就必须对视频进行重新录制, 多次的复制很容易对图像的质量造成损坏, 这样的方式被称作是线性编辑, 顺序的概念指的就是磁带录制时间的先后顺序, 电视编辑多年以来采用的都是录、放像机所录制的电视节目。近些年理啊, 电视编辑逐渐开始将计算机作为主要使用工具, 利用类似于电影编辑的的方法对节目进行编辑, 即快捷方便, 又不会损害图像的质量, 这种方式就是所谓的非线性编辑, 非线性所指的是一种时间顺序, 并不是数学意义上的概念。

3.2 非线性编辑系统所具有的特点

电视系统主要是由播、编、录、摄四个主要部分构成, 利用非线性的编辑系统可以代替字幕机、调音台、帧同步机、切换台、特技发生器、编辑控制器以及数字录像机等, 是电视后期制作由模拟化向数字化过渡的一条有效途径。

3.3 非线性编辑系统设计

要想彻底解决视频压缩格式所具有的不兼容性, 使得系统能够具有比较强的独立性是最好的办法, 采用Matrox公司所设计的Digi LE卡能够提供实时的双通道音频视频IO以及实时的切换方法, 在系统的设计过程中加入一层硬件的抽象层 (Hardware Abstraction Layer) , 能够有效减小系统对特定的视频卡所产生的依赖性, 有助于使系统可以支持多种的视频硬件以及压缩格式, 随着视频的硬件系统不断进步和发展, 可以将系统快速移植到具有更好性能的视频卡上, 应用层不会直接同Digi LEAPI有关系, 而是通过HAL所提供接口的调用视频卡产生一定的功能, 在系统进行移植时, 可以只修改硬件的抽象层, 不需要对系统的应用程序代码进行改动, 充分保证移植的稳定性和效率。硬件抽象层的对象模型如下图所示:

硬件的抽象层主要包括压缩、解压缩、采集、播放四个主要接口部件, 如图1所示, 播放部件能够提供给视频图文字幕以及音频素材的一系列播放功能, 在进行播放时能够加入进多种的实时特技, 主要包括动态背景、抠像、放缩、位移以及切换特技等, 所播放的画面可以再专业的监视器以及计算机屏幕上显示出来, 采集的部件提供的主要是手动采集以及批处理的采集功能, 能够分别通过计算机遥控录像以及人工控制的录像机对音频和视频信号进行采集, 压缩以及解压缩的部件可以把所播放的音频和视频信息通过压缩所形成的文件存储到相应的硬盘上, 在以后使用时可以反复使用。

4 结语

当今社会, 多媒体技术伴随着互联网技术得以快速发展, 使得音视频内容能够快速传播到网络上, 不同的媒体格式不断出现, 怎样在最小程度上降低视频条件的情况下减小宽带的需求以及视频文件的大小, 成为视频压缩技术发展的重点, 数字视频压缩技术是非线性编辑系统中的一项关键应用技术, Motion JPG和MPEG-2 P@ML是用于节目制作的两种主要的视频压缩格式, Motion J PEG的不同硬件平台之间具有不兼容性, 这就为非线性编辑系统的实现和设计造成一定的困难, 在对非线性编辑系统进行设计时加入一定的硬件抽象层, 不断减少应用系统对硬件所产生的依赖性, 是一种比较好的解决办法。

参考文献

[1]A.Murat Tekalp, Di gital Video Proces sing[Z], Prentice Hall, 2007.

[2]水.下一代移动通信系统的MPEG-4成熟应用方案[J].世界电子元器件, 2007, (02)

[3]王海婴, 史光宇.LAN上实现Mpeg通信系统的研究与尝试[J].电信科学, 2008, (10)

[4]Sony MPEG系统解决方案赢得中国用户青睐——湖南电视台新购进近200台MPEG IMX设备[J].现代电视技术, 2009, (05)

视频数字压缩 篇4

1 MPEG-4的标准及其技术概述

针对现有MPEG-4的应用现状, 可将其具体特点总结如下:第一, 交互性。通过对相关内容的操作与对码流的编辑, MPEG-4能有效实现混合编码, 使各类码流在时间域内实现随机存取, 表现出极强的交互性特点。第二, 无论是从主观或是客观角度来讲, MPEG-4的压缩比均优于MPEG-1, 表现出明显的高压缩比特征。第三, 存储规律性。利用MPEG-4编码技术, 能够有效实现对不同类型图像的统一性存储, 虽说在图像存储过程中可能会出现对不同图像的细节进行丰富的程度不一等现象, 或者在存储过程中可能涉及到不同码率的采用, 但这并不影响对图像的统一性存储。

根据MPEG-4的标准视频框架, 可将基于MPEG-4标准的数字视频压缩的具体实现过程归纳如下:首先根据编码控制的有关机制, 确定其编码模式, 随后对有关数据进行处理, 若为帧内编码则进行DCT数据变换, 再交由合成器加工使之形成视频流重构预测帧, 作为下一帧的编码参考帧。如此往复直至所有图像帧处理完毕。

2 基于MPEG-4的运动估计分析

在视频压缩的相关技术中, 对运动估计与补偿进行帧间预测是其关键因素。而这一技术的核心内容在于对运动向量的计算。但在实际应用过程中, 对于图像静止区域及运动区域的实时分解及对有关矢量加以计算等问题, 仍存在一定难度, 这也是现今有关研究人员的工作重点内容。运动估计常用于处理帧间编码内容, 在对两帧图像的对比中获取信息, 进而对运动矢量以及当前帧进行合理预测。一般情况下使用运动矢量对各像素块间的相对位置变动进行描述。运动估计的具体实现步骤为: (1) 划分待处理图像序列中的每一帧, 使其形成多个局部结构; (2) 利用参考帧图像, 并使其与实际图像对比, 以获取每帧图像中的运动矢量。这一方法的运用可在很大程度上降低图像的帧间相关性, 使图像的压缩效率得到提升, 避免出现视频时间相关的现象。

2.1 块匹配基础上的运动估计是立足于算法中的匹配规则, 在参考帧与当前帧的不同模块间进行搜索与匹配, 从而得出估计值。

若假定当前帧在分割后形成了m×n的像素块, 每一像素块各不相同, 在X与Y两个方向上的搜索宽度分别设置为Wx与Wy;并假设划分后的同一区域块内各像素具有相同位移。在此条件下, 若设搜索区域范围为 (m+2Wx) × (n+2Wy) , 此时即可在这一搜索范围内获取目标子块的最佳匹配, 并最终经比对计算后得出运动矢量的估计值 (Mx, My) 。而在这一算法的具体应用过程中, 通常采用m=n=8或16, Wx=Wy=w。

2.2 另一种应用较为广泛的算法为自适应运动估计算法, 是在传统算法基础上改进与加工而来本文按照这一算法进行视频压缩, 并将压缩结果与其它算法进行仿真比较, 结果如图1所示。通过读图1可知, 自适应运动估计算法与全搜索算法 (FS) 的输出码率以及PSNR具有相似性, 且搜索效率更高;而相较于另两种算法而言, 在相同图像质量要求的条件下, 自适应算法编写每一帧的时间也有明显缩短, 具有较高的现实应用意义。

3 纹理编码技术的实现

纹理编码的对象具有多样化特征, 既有帧内编码模式的I-VOP, 也可对帧间编码模式B-VOP或P-VOP进行编码处理。纹理编码的主要编码方法仍以8×8像素块DCT编码方法为主, 在帧内编码时, 全部位于VOP内的像素块可进行经典DCT编码;均不位于VOP内像素块则不编码;部分位于VOP内的像素块, 对于超出VOP范围的像素块, 应先利用图像填充技术对VOP外的参考值进行准确获取, 随后再将其与VOP内像素块一起进行DCT编码处理。

需注意的是, 在帧内编码过程中, 还要求对经DCT处理后的DC与AC因子进行有效性预测;而帧间编码时, 出于编码B-VOP或P-VOP运动补偿后预测误差的目的, 一般编码人员灰浆超过VOP范围的像素值设置为128, 以实现编码目标。

结束语

综上所述, MPEG-4现已在多个视频处理的有关操作中受到重视并得到广泛应用, 该标准中还涉及到小波变换、形状多变VOP编码等多种实用性算法。上述算法在MPEG-4标准中的应用也促使MPEG-4更为完善, 其性能也得到了进一步提升, 在现有的应用中也已取得不错效果。目前, 编码人员应加大对减少编码计算量的研究, 通过对现有技术的改进, 以及对具体应用过程中的某些问题进行分析, 并在此基础上提出系统性的改进方案, 有利于推动MPEG-4在更广泛视频处理领域中得到应用。考虑到MPEG-4标准的多方面优点, 该编码技术将在多种类型的视频通信领域中得到应用, 具有较为广阔的发展空间。

摘要:信息化技术的日益普及, 使得数字视频技术成为移动通信、网络及家电信息化发展等领域的核心研究内容。数字视频压缩编码技术很好地将多种高效的图像编码技术进行有机结合, 为图像编码技术的发展与完善提供了具体方向。MPEG-4是数字视频领域的常见标准, 并凭借其优越性得到广泛运用。本文首先对MPEG-4的有关标准与技术进行概述, 随后分别分析了在该标准上建立运动估计和纹理编码的有关知识, 旨在为数字视频压缩编码人员提供参考。

关键词:数字视频,压缩算法,MPEG-4,运动估计,纹理编码

参考文献

[1]陈妍妍.基于MPEG-4视频压缩技术的自适应运动估计搜索算法研究[D].成都:电子科技大学, 2013.

AVS+视频压缩技术及其应用 篇5

在人类所获取的信息中, 通过视觉和听觉获取的信息约占外界信息的90%以上。以视频信息和音频信息为主的多媒体技术是21世纪最具时代特征和最富有活力的研究和应用领域之一。人们对于数字技术下视频的实时性、流畅性、清晰性等的要求越来越高, H.264国际标准的专利费非常昂贵, 各个环节都要收费, 还有后续的广播费、点播费、软件费等。鉴于这种情况, 我国在音视频领域进行了研究规划, 取得了技术突破, 自主制定了数字音视频解码技术标准AVS (Audio Videocoding Standard) 。继AVS标准之后, 国家广电总局在2012年7月正式颁布了广播电影电视行业标准GY/T257.1-2012《广播电视先进音视频编码解码第1部分:视频》行业标准, 简称AVS+。

1 AVS+

AVS+是2012年7月发布的《广播电视先进音视频编解码第1部分:视频》行业标准, 要想知道什么是AVS+必须先了解AVS。AVS标准的正式名称是《信息技术先进音视频编码》, 音视频编解码标准的作用是把数字视频和音频数据压缩为原来的2%以下, 以保证传输带宽和存储容量能够被最有效地利用[1]。

AVS标准分为9个部分, 包括系统、视频、音频、数字版权管理等4个技术标准, 如图1所示。AVS标准的视频标准与H.264相类似, 分为变换、量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块。此外, AVS视频标准还定义了3种不同类型的图像:I帧、P帧和B帧, I帧中的宏块负责帧内预测, P帧和B帧的宏块负责帧内预测或帧间预测。AVS视频编码器框图如图2所示[2]。

AVS采用的是混合编码方案, 视频编码并非单一的算法, 而是一整套的编码工具。起初各条技术主线平行开展, 每个主要的工具都是作为视频编码的完整解决方案而提出, 最后各性能最佳者汇合成为完整的解决方案, 这样综合起来就可以达到压缩比较高的综合压缩效果[3]。

2 AVS+关键技术

随着数字高清电视和3D高清电视的快速发展, 为了节约带宽和存储, 就需要对视频进行更好的压缩。AVS同MPEG-2、H.264的编码框架一样, 都属于混合编码, AVS的关键技术与H.264也是基本对应的, AVS+是在AVS基础上完成的, 二者大部分内容是相符合的, AVS+向下兼容AVS, 即AVS编码的视频码流AVS+可以解码, 同时在AVS基础上增加了4项新技术———高级熵编码、图像级自适应加权量化、同极性场跳过模式编码、增强场编码技术, 可以说是对AVS标准的优化升级[4]。AVS+相对更简单一些, 对硬件资源的消耗更少, 这些相对于H.264来说可以大大降低国内音视频产业的专利费负担, 同时也更易于硬件技术和设备的实现, 如表1所示。

根据“AVS技术应用联合推进工作组”联合组长高文院士介绍, AVS+标准在核心工具中的熵编码 (算术编码CBAC) , 以及次要工具加权量化 (AWQ) 、增强场编码 (B-Direct、P-Skip) 方面都有所更新[5]。我们将AVS+的关键技术与H.264High 4:2:2进行对比, 从表2中可以清晰地看出AVS+在预测、运动补偿、变换、熵编码等多个方面都有所改变。例如, 运动补偿去掉了“8×4、4×8、4×4”;多参考帧改为“最多2个或者4个”;滤波则变为“8×8块边界”。在熵编码中摒弃了变长编码, 选择性能优良的算数编码, H.264使用的是CAVLC和CABAC这两种编码方法, 而AVS+选择使用的则是复杂程度比较小的自适应2DVLC和新的内容自适应算数编码。因为我国的数字电视的高清标准是隔行扫描的, 在新技术增加之后, 运动场景的场编码图像就会比老技术标准清晰很多。

3 AVS+应用前景

AVS标准是一套适应面十分广阔的技术标准, 技术性能先进、实现复杂度低、专利负担费用低, 能提升国内企业的核心竞争力。AVS技术应用联合推进工作组在一年内完成AVS+标准的制定、优化、测试、验证、颁布、产品研发等一系列工作, AVS+标准的产业链正在逐步建立和完善。

为了使高标清节目编码向AVS+过渡, 工作组做出了以下部署:

(1) 卫星传输高清频道与地面高清频道将全部采用AVS+。卫星传输高清频道是新开展的业务, 还有地面的高清频道将在全国推广普及, 新开展的业务一开始就采用AVS+有利于AVS+的快速发展和部署。

(2) 以城市为单位, 逐步将目前地面标清节目的编码器由MPEG2改为AVS+, 同时配合直播星户户通的推进, 在农村的地面数字电视网准备大规模建设, 直接采用AVS+。

(3) 要求 (在3D实验频道之后) 新开办的3D电视频道采用AVS+。

从模拟到数字、从标清到高清, 从单向到双向, 从传统电视到智能电视, 电视业在不断向前演进。2009年, 电影业的3D风潮很快波及到电视。在CES 2011国际消费电子展上, Sony、Samsung、Panasonic等家电巨头纷纷推出全线3D电视产品。AVS+的应用和推广, 满足了高清晰度电视、3D电视等广播电影电视新业务发展的需要, 将带动我国直播星进入高清时代, 并快速带动各地有线、无线和网络电视转播和制播AVS+节目。同时, 在IPTV、CM-MB手机电视方面也有着广阔的应用空间。

摘要:视频技术从标清到高清, 电视从模拟到数字, 视频压缩技术成为重要的研究和应用领域。介绍了我国研究制定的AVS+标准, 将其关键技术与H.264进行了对比, 并介绍了AVS+的应用领域。

关键词:AVS+,视频技术,编码

参考文献

[1]高文, 黄铁军, 吴枫, 等.信息技术-先进音视频编码:第2部分:视频 (GB/T 20090.2-2006) [S].北京:中国标准出版社, 2006.

[2]广播电视先进音视频编解码:第1部分 (GY/T 257.1-2012) :视频[EB/OL].http://www.spsp.gov.cn/Page/QT/2012/GYT%20257-2012.shtml.

[3]黄铁军.AVS标准的背景、进展与产业应用展望[J].信息技术与标准化, 2003 (9) :4-8.

[4]鲁晨.AVS+产业化加速将全面推广使用[EB/OL].http://www.sarft.net/a/82765.aspx, 2013-10-9.

[5]董文辉, 邓向冬.AVS+视频压缩技术及应用[J].广播与电视技术, 2012 (12) :41-43.

[6]黄铁军, 高文.AVS标准制定背景与知识产权状况[J].电视技术, 2005 (7) :4-7.

[7]梁凡.AVS视频标准的技术特点[J].数字电视与数字视频, 2005 (7) :12-15.

[8]侯金亭, 马思伟, 高文.AVS标准综述[J].计算机工程, 2009, 35 (8) :247-252.

视频数字压缩 篇6

1 FPGA硬件平台

在实际中需要的是灵活的设计方法,即根据需要在实验室就能设计、更改大规模数字逻辑,研制自己的ASIC并马上投入使用,这就是可编程逻辑器件的基本思想。FPGA/CPLD既继承了ASIC的大规模、高集成度、高可靠性的优点,又克服了普通ASIC设计周期长、投资大、灵活性差的缺点,逐步成为复杂电路设计的理想首选。

FPGA硬件系统主要是基于算法的复杂程度来进行选择。本文选用方法为:将整个系统集成在一个芯片内部,选用大规模的FPGA芯片,使用专用软件采用“自上而下”的设计方法将系统在芯片内部划分为子模块。这种方法的优点在于其电路设计更趋合理,不受通用元器件的限制,降低了硬件电路的设计难度。各个子模块间在内部连接,减少电磁干扰并且降低了功耗。其缺点是可测性较差,很难观测中间电路的波形和时序,需要靠软件仿真来解决测试问题。

FPGA一般由三种可编程电路和一个用于存放编程数据的内嵌存储器SRAM组成。这三种可编程电路分别是:二维可编程逻辑块CLB(Configurable Logic Block)、输入/输出模块IO(I/O Block)和互连资源模块IR(Interconnect Resource)。输入/输出模块是芯片与外界的接口,完成不同电气特性下的输入/输出功能要求;二维可编程逻辑快是编程逻辑的主体,可以根据设计灵活地改变连接与配置,完成不同的逻辑功能;互连资源连接所有的二维可编程逻辑块和输入/输出模块,连线长度和工艺决定着信号在连线上的驱动能力和传输速度;内嵌存储器SRAM可以在芯片内部存储数据。

在设计可编程逻辑器件时,会碰到区分FPGA和CPLD的问题。其实FPGA和CPLD只是其内部结构稍有不同,FPGA的二维逻辑阵列模块是基于查找表(Look-Up-Table)结构的,其本质上就是一个RAM。而CPLD的二维逻辑阵列块是基于乘积项(ProductTerm)结构的。通常FPGA中寄存器资源比较丰富,适合做同步时序电路较多的设计:CPLD中组合逻辑资源比较丰富,适合做组合电路较多的设计。

这里,选择了Altera公司的CycloneⅡ系列芯片作为视频编码算法的主芯片。Altera是全球最大的可编程逻辑器件供应商之一,其FPGA器件具有良好的性能,主要体现在技术和结构上,Altera器件采用铜铝布线的先进CMOS技术,具有非常低的功耗和相当高的速度;采用互连结构,提供快速、连续的信号延时和具有相同延时的时钟总线结构;逻辑集成度高,可将更多的数字逻辑集成进更少的器件中来缩小印制板的尺寸和降低系统研发成本;具有短的开发周期,使用专用的软件设计输入、处理、校验以及器件编程一共仅需几个小时,一天内可完成几个完整设计。

CycloneⅡ系列是目前主流的大规模FPAG之一,它基于1.2V电压,0.09um工艺,全铜层覆盖的SRAM架构。内部有大量的LE和RAM。CycloneⅡ芯片同时提供22个数字信号处理器模块用来完成复杂的运算。在后面的说明中可以看出,多个并行乘法器对完成DCT模块的功能提供了良好的硬件环境。另外,CycloneⅡ芯片支持各种I/O标准和完整的层次化时钟管理方案,可以达到最高420MHz的运算速度,其内部还有4个PLL(Phase-Lock Loops锁相环),使得系统性能得到极大的提高。

2 开发平台关键技术分析

2.1 硬件描述语言

硬件描述语言HDL是一种用形式化方法描述数字电路和系统的语言。利用这种语言,数字电路系统的设计可以从上层到下层(从抽象到具体)逐层描述自己的设计思想,用一系列分层次的模块来表示极其复杂的数字系统。然后,利用电子设计自动化(EDA)工具,逐层进行仿真验证,再把其中需要变为实际电路的模块组合,经过自动综合工具转换到门级电路网表。接下去,再用专用集成电路ASIC或现场可编程门阵列FPGA自动布局布线工具,把网表转换为要实现的具体电路布线结构。

Verilog HDL和VHDL作为描述硬件电路设计的语言,其共同特点在于:能形式化地抽象表示电路的行为和结构;支持逻辑设计中层次与范围的描述;可借用高级语言的精巧结构来简化电路行为的描述等等。由于Verilog语言灵活且和C语言类似,便于算法的实现,本文中采用它进行FPGA编程。

2.2 软件开发平台

在进行FPGA设计时,通常使用集成的PLD/FPGA开发环境。这类软件都是由PLD/FPGA芯片厂家提供,基本上都可以完成所有的设计输入(原理图或硬件描述语言)、仿真、综合、布线、下载等工作。Altera提供的集成开发环境为Quartus II,课题中使用的是6.0版本。FPGA的设计已经形成了一个完整的体系,设计过程明了,设计工具详尽,验证手段真实可信。

3 系统整体设计方法

3.1 自顶向下设计方法

从底向上的设计在某种意义上可以看作是Top-Down设计的逆过程。虽然设计也是从系统开始,即从设计树的树根开始对设计进行逐次划分,但划分时首先考虑的是单元是否存在,即设计划分过程必须从存在的基本单元出发,设计树最末枝上的单元要么是己经制造出的单元,要么是其他项目已经开发好的单元,或者是可以得到的单元。

自顶向下的设计过程中在每一层次划分时都要对某些目标作优化Top-Down的设计过程是理想的设计过程,它的缺点是得到的最小单元不标准,制造成本可能很高。从底向上的设计过程采用标准的设计单元,通常比较经济,但有时可能不能满足一定特定的指标要求。复杂数字逻辑电路和系统的设计过程通常是这两种设计方法的结合,设计时需要考虑多个目标的综合平衡。

3.2 有限状态机

控制单元的实现方式有:有限状态机、控制寄存器和微代码控制器等。有限状态机在时间尺度上对其控制信号进行离散化控制,利用状态转移使控制信号在有限状态机的状态节拍控制下变化,以实现对被控对象的控制。

在本文的FPGA编程中,大多数模块采用有限状态机模型。模块复位时处于空闲状态,只要外部触发信号在时钟的上升沿无效,模块一直处于空闲状态。当有数据需要该模块处理时,其它模块使得此模块的外部触发信号有效,从而使他脱离空闲状态,进入有效状态。在外部时钟的触发下,模块依次进入状态1,2,…,N。当本次任务完成后,模块又进入空闲状态。

3.3 流水线设计技术

流水线的设计方法已经在高性能的、需要经常进行大规模运算的系统中得到广泛的应用。高性能的DSP系统也在它的构件中使用了流水线技术。所谓流水线设计实际上是把规模较大、层次较多的组合逻辑电路分为几个级,在每一级插入寄存器组并暂存中间数据。K级的流水线就是从组合逻辑的输入到输出恰好有K个寄存器组。

组合逻辑包括两级:第一级的延迟是T1和T2中最大的一个,第二级延迟是T3的延迟。为了得到稳定的输出结果,需要的延迟时间为max(T1,T3)+T2个时间单位。图1采用了流水线技术,在每一级的输出加了一个寄存器。第一级存储器所具有的总的延迟为T1与T2的最大值加上寄存器的触发时间Ti。第二级的延迟为T3加上Ti。因此,采用流水线设计为了取得稳定的输出总的延迟为max(max(T1,T2)十Ti,T3+Ti)。对于FPGA来说TI和T2的值相对于寄存器触发时间Ti要长的多。流水线设计的优势在于它提高了系统的吞吐量。这种性能上的提高是以消耗较多的寄存器资源为代价的。

3.4 I2C总线

I2C(Inter-Integrated Circuit)总线是由PHILIPS公司开发的串行两线总线,自80年代产生以来,由于其简单性和可靠性,而被广泛应用于集成电路及外围设备。

1)I2C总线特点。仅两条线工作,串行数据线SDA(Serial Data Line)和串行时钟线SCL(Serial Clock Line)。每个设备通过软件编址,或为主设备,或为从设备,通过唯一的地址连到I2C总线上,或为主设备,或为从设备,这取决于其在某时刻所起的功能,由主设备发起数据传输。在标准模式传输中,串行8位传输方式和双向传输方式能达到100Kbit/S的速度,在快速模式传输中,能达到400Kbit/S,在高速模式传输中,能达到3.4Mbit/s的速度。

2)工作原理。由于I2C总线是多主控制总线,即连到I2C总线上的主设备可以有多个。因通常主设备为微控制器,故以下对I2C总线的讨论以两个连到I2C上的微控制器为例。数据传输过程如下:当A控制器传输数据到B控制器时,此时,A控制器发起传输,则为主设备,B控制器为从设备,传输步骤为:(1)A控制器(主设备)寻址B控制器;(2)A控制器发送数据(主传输)到B控制器(从接收);(3)A控制器终止传输。当B控制器传输数据到A控制器时,此时,B控制器发起传输,则为主设备,A控制器为从设备,传输步骤同上,只不过方向向反。

4 视频采集模块的FPGA的实现

4.1 采集模块系统设计

本文主要对视频采集模块进行了设计和实现。其中视频源有DVD影碟机提供,从DVD影碟机出来的视频信号被采集进FPGA里面,经过处理之后,通过VGA显示器播放出来。

4.2 系统硬件设计

本系统选用的FPGA芯片是美国Altera公司最新推出的CycloneII系列的EP2C35。该芯片具有35000个逻辑单元、672个引脚、475个用户自定义I/O接口、35个嵌入式乘法器和4个锁相环,是一个集成度极高和功能强大的FPGA芯片。在FPGA中设计有NiosII软核CPU和挂接在该NiosII系统的Avalon总线上的I2C配置接口模块、输入控制接口(FIFO_IN CONTROL),输出控制接口(FIFO_OUT CONTROL)、存储器控制接口(SDRAM CONTROL)、输入控制器(DMA_IN)、输出控制器(DMA_OUT),TV编码器(TV_EN-CODER)和用于接收按键信息的通用并行接口(PIO)等模块。FPGA外连接有视频解码芯片(ADV7181)、编码芯片ADV7123、图像数据存储模块(SDRAM)和控制按键(KEYBORD)等。系统以FPGA芯片EP2C35为基础配置了NiosⅡ软核处理器作为控制核心,又在Avalon总线上挂接相应的接口模块,与FPGA的外围单元一起共同完成视频采集的功能。其中,ADV7181输出的是ITU656 YUV 42:2的数字信号,而ADV7123是对RGB格式的数字信号进行D/A转换。TV编码器的功能就是实现这两种不同格式的数字信号的格式转换。

4.3 ADV7181的I2C总线接口设计

本设计对模拟视频信号进行A/D转换的功能是通过ADV7181来实现的。ADV7181是ADI公司近期退出的一颗低功耗多功能的高速视频解码芯片。芯片能自动检测并转换标准的PAL、NTSC和SECAM制式的全电视信号为ITU656。YUV 4:2:2格式的复合视频数字信号。ADV 7181的控制寄存器是通过I2C总线方式实现配置的,采用Verilog硬件描述语言设计。该接口的功能由两个模块来完成:I2C_Controll模块用来产生I2C总线规范的时序,I2C_Config模块用来产生需要配置的寄存器的地址和配置参数该模块主要是依据查找表算法来设计的。

5 结束语

本系统较好地利用FPGA强大的可编程功能,构建了硬件结构简单、高集成度,高性能和高灵活性的视频压缩处理系统。方案设计中还考虑到了系统的适应性、可靠性需求,选用芯片均能适应复杂环境和高可靠性的特殊环境需要。

参考文献

[1]王彩霞,赵刚,刘三民.H.264的视频压缩技术的研究与分析[J].计算机与信息技术,2009,Z1.

视频压缩编码对运动检测的影响 篇7

关键词:运动检测,视频压缩,量化参数,方差

1 研究背景及目的

运动检测是从视频序列中将运动或发生变化的区域从背景中标识出来的一项技术, 也是进行更高层次视频图像分析处理的重要基础, 以及图像分析和处理的关键, 广泛应用于视频分析之中。所以, 有必要对视频图像序列中的运动目标进行分析和检测。近几年来, 很多学者专家对运动目标检测进行了研究, 提出了很多有效的算法:初秀琴等[1]主要对物体平面运动进行了检测和分析;司红伟等[2]提出了基于背景估计的运动检测算法;RHess等[3,4]在体育视频中球员的运动检测方面做出了卓越贡献;Brox等提出LDOF光流法来进行运动检测[5], 本文也选择采用该方法。

随着众多如数码相机、互联网高清视频、数字电视、数码摄像机等高清数码产品的逐渐普及, 现有的视频编解码标准已经不能满足要求。尤其对于有着平滑背景的高分辨率视频, 需要一种高效率的视频压缩编码技术, 当前视频压缩编码技术的国际组织有两个:一个是国际标准化组织 (ISO) , 另一个是国际电联 (ITU-T) 。视频编码压缩标准有两套[6]:一套是由VCEG制定的ITU-T 标准, 另一套是由MPEG制定的MPEG标准。其中, ITU-T 标准有H.261、H.262、H.263、H.263v2、H.264;MPEG 标准有MPEG-1、MPEG-2、 (MPEG-3) 、MPEG-4、MPEG-7、MPEG-21。

近几年, ITU-T/VCEG和ISO-IEC/MPEG两大国际标准化组织成立了视频编码联合开发小组 (JCT-VC) , 其目标是开发新一代国际视频标准, 名称为高性能视频编码标准 (HEVC) 。该标准的目标是在保持H.264/AVC标准视频质量的基础上, 使比特率降低一半, 即压缩率提高一倍。据HEVC参考软件HM仿真结果显示, 目前针对HEVC标准提出的各个提案还未达到压缩率提升一半的目标。与H.264/AVC视频标准一样, HEVC也包含帧内预测、帧间预测、运动估计与补偿、正交变换、量化、滤波、熵编码和重建等编解码流程[7]。

本文选择最新的HEVC和H.264两种标准, 来探究视频压缩编码对运动检测的影响。通过实验结果来分析每一种压缩编码对运动检测的影响。并找出影响较小的一种。

2 实验步骤

本文先对未压缩的视频进行分析, 检测运动信息, 采集原始数据。然后选择H.264和HEVC两种编码标准进行压缩实验。由于在同一压缩标准下, 量化参数越大, 视频压缩比也就越大。所以, 在每种编码标准中, 本文采用3个不同的量化参数, 即20、26和32, 分别进行3组实验, 进行纵向对比。然后, 再进行同压缩比下两种方法的横向对比。在这一系列实验中, 每组的实验步骤大致相同, 如下所述。

2.1 视频图像采集

本文从视频数据Hallmonitor (352×288) 中, 均匀提取了25个 (352×288) 大小的帧, 然后用这25帧图像作为原始视频图像序列来进行运动检测。

2.2 基于光流的运动检测

本文用LDOF光流方法[5]来检测原始视频图像序列中相邻两帧之间的运动信息, 包括由于光照变化造成的阴影。

本文用任意相邻两帧举例说明。提取运动信息后, 得到一个二维的光流矩阵。对于该矩阵的每个像素点来说, 第一个维度表明了其在相邻两帧中, 水平方向上移动的距离 (以下表示为x) ;第二个维度表示其在相邻两帧中, 垂直方向上移动的距离 (以下表示为y) 。

之后, 本文设置一个值作为每个像素点在相邻两帧之间移动的绝对距离 (以下表示为y) 。定义如下:

l=x2+y2 (1)

设定一个l的值, 作为运动检测的门限值。显然, 门限值设定得越小, 运动检测的精度越高。 所以, 设定门限值为1, 也就意味着, 在相邻两帧之间, 每个对应像素点移动的绝对位移在1以上, 就把其考虑进去, 作为运动对象。为了对比明显, 本文把发生运动的像素点的值设定为0, 没有运动的像素点的值设定为255。在处理所有25个原始采样帧中24对两两相邻的帧后, 得到了24个大小为 (352×288) 的二值矩阵, 即24帧二值运动信息图像, 其中检测到运动信息的区域为黑色, 静止区域为白色。

由于原始采样帧中的第25帧只作为与第24帧的比较求光流之用, 所以, 为了与二值光流图像进行一一对比, 在实验数据中将其舍掉。

图1为在未压缩的视频中得到的原始采样帧, 以及通过LDOF光流方法[5]得出的原始二值运动信息图像。然后在同一压缩标准下, 设定不同的量化参数来进行视频压缩实验。

图2-4是压缩标准设定为H.264时, 量化参数分别为20、26、32的实验结果图。

图5-7是压缩标准设定为HEVC时, 量化参数分别为20、26、32的实验结果图。其中图1-7中的左边的三个图像为视频中25个采样帧中的第1、第13和第24帧, 右边三个图像为24个二值运动信息图像的第1、第13和第24帧。

3 实验结果分析

在经过压缩的每组实验数据中, 本文将每一帧二值运动信息图像分别与对应的未压缩的每帧二值运动信息图像, 在每一个对应像素求方差值。进而得到每组实验所有二值运动细心图像的方差最大值和平均值, 如表1-2所示。

从表中可以看出, 在同一个视频压缩编码标准中, 设定的量化参数越大, 方差平均值就越大。也就意味着压缩前后的二值运动信息图像的差距, 与量化参数成正比。可以得出结论:量化参数越大, 对运动检测的影响越大。从表中还可得知, 在同一个量化参数下, HEVC压缩标准下的方差平均值比H.264压缩标准下的明显要小, 在大部分实验组中, 方差最大值也要小。说明, 相对于H.264压缩标准来说, HEVC压缩标准对运动检测产生的影响也就小很多。

4 结束语

本文首先介绍了几种运动检测的方法和当前流行的一些视频编码压缩标准。然后选用目前最先进的HEVC和H.264, 在不同的量化参数下对同一段视频图像序列进行实验, 分析了这两种视频压缩技术对运动检测的影响。实验结果显示, 在同一个压缩标准中, 量化参数越大, 对运动检测影响越大。在同一个压缩比率下, HEVC压缩标准对运动检测产生的影响, 相对于H.264压缩标准来说要小。由此得知, 目前先进的几个视频压缩标准中, HEVC对于运动检测的影响较小。

参考文献

[1]初秀琴, 李玉山, 杨莉.运动物体参数估计与跟踪的线对应新算法[J].西安电子科技大学学报, 2003, 30 (2) :174-178.

[2]司红伟, 全蕾, 张杰.基于背景估计的运动检测算法[J].计算机工程与设计, 2011, 32 (1) :262-265.

[3]Hess R, Fern A, Mortensen E.Mixture-of-parts pictorial struc-tures for objects with variable part sets[C].IEEE 11th InternationalConference on Computer Vision, 2007:1-8.

[4]Hess R, Fern A.Improved video registration using non-distinctivelocal image features[C].Proc IEEE Conf on Computer Vision andPattern Recognition, 2007:1-8.

[5]Brox T, Malik J.Large displacement optical flow:descriptor mat-ching in variational motion estimation[J].IEEE Transactions on Pat-tern Analysis and Machine Intelligence, 2010, 33 (3) :500-513.

[6]Szczerba K.Fast Compressed Domain Motion Detection in H.264Video Streams for Video Surveillance Applications[C].IEEE Inter-national Conference on Advanced Video and Signal Based Surveil-lance, 2009:478-483.

上一篇:真情满人间下一篇:新时期幼儿园创新教育