转码技术

2024-10-21

转码技术（共9篇）

转码技术篇1

摘要：研究了IPTV实时转码的关键技术,解决了IPTV实时转码过程的媒体编解码、传输及播控等关键问题,提出了基于按需点播的IPTV实时转码解决方案,实现了广东电信ITV业务对天翼云上各类音视频资源的利用。该方案实现了转码平台对各型机顶盒的直接播控操作,创新性地提出了根据时间跳跃式抽取媒体数据的方法,实现了机顶盒播控请求的快速响应。

关键词：IPTV,实时转码,流媒体,播控

1 前言

广东电信为差异化ITV业务的竞争力,规模化发展ITV业务,提出了ITV云播产品。通过云播,用户可在ITV上点播天翼云上任意格式的视频。但目前IPTV平台支持的媒体格式非常有限,另外,平台也需要为不同的用户提供IPTV高清、IPTV标清、互联网视频、移动清晰、移动流畅等[1]不同规格的视频。

若采用现有的点播方式,则需对云盘上所有媒体文件进行预转码,预先制作各个规格的点播副本,但被大量重复点播的仅是少数视频,大部分是少量点播和零点播视频。因此,预转码方式既浪费了大量的媒体处理计算资源及存储空间,又增加了媒体内容的维护成本。

本文提出的基于按需点播的IPTV实时转码解决方案,实现了ITV上轻松点播云盘上任意格式的音视频内容,大大提高了媒体处理能力及海量媒体的存储效率,减轻了运维人员日常转码处理与媒体数据的维护工作量。

2 IPTV实时转码关键技术

IPTV点播业务本质上是实时流媒体业务,具有“边下载边观看”的特性,并支持类VCR(Video CassetteRecorder)播控操作,即播放、暂停、拖动、快进快退、停止等操作。与预转码相比较,实时转码需解决两个技术难点:(1)任意视频格式帧级别响应速度的即时转码并封装为机顶盒(STB)支持的TS流;(2)在实时帧编码过程中支持播控操作。

2.1 流媒体封装技术

RTP(Real-time Transport Protocol)/RTCP(Real-timeTransport Control Protocol)常用于承载IP实时音/视频组播或单播。RTSP(Real Time Streaming Protocol)则用于建立和控制媒体服务器和客户端之间的连续音/视频流,协同RTP、RSVP等提供流媒体传输服务[2]。TS(TransportStream)媒体封装标准支持多种媒体流和编码标准,且具有较强的抵抗传输误码的能力。IPTV采用标准MPEG-2TS格式在IP网络传输音视频媒体流。

实时转码系统的流媒体传输方案采用了如图1所示的传输及控制协议栈[3],在ITV机顶盒和实时转码平台之间建立信令与媒体两个通道,将实时编码生成的音视频裸数据分组成封装成TS包,然后通过UDP/TCP协议在IP网上传输。

(1) 媒体发送和接收通道:如图1左侧部分,实时转码平台和ITV机顶盒之间按照图中所示的协议来完成音视频媒体流数据的传输和解包,其中RTP协议为可选性支持;

(2) 媒体流会话控制通道:如图1右侧部分,IPTV实时转码平台和ITV机顶盒之间按照图中所示的RTSP协议来实现对音视频媒体流的交互控制;

(3) 实时转码输出的音频(AAC)、视频数据(MPEG4/H.264),分组后以188 Bytes定长的TS包封装到IP包进行传输,约7个TS包封装到一个IP数据包。

2.2 实时播控处理技术

IPTV点播业务支持播放、暂停、拖动、快进快退和停止等操作,称播控。其中最典型的快进快退操作具有下述特点:

(1) 用户以几倍于正常播放的速度向前或向后观看影片;

(2) 播放器有选择地跳跃着解码所需的视频I帧;

(3) 服务器以几倍于正常播放的速度解码视频数据,并挑选关键帧发送,如图2所示,服务器需要过滤读取的视频数据,P帧、B帧等被丢弃[4]。

要解决的关键问题在于,快进快退模式下实时转码服务器要以几倍于正常播放的速度读取网盘视频,并转码出合适的关键帧发送。目前IPTV平台是根据各倍速要求预先将关键帧提取出来分成几个独立文件存放,在快进快退时只用读取对应的仅含关键帧的文件,但这显然不符合基于实时转码的点播要求。

为了降低对云盘的下载压力,本文对图2的方法进行了优化,先根据时间定位视频的大致位置并跳跃式读取少量媒体数据。如图3所示,媒体数据的读取与发送流程如下:

(1) 第一步:假设当前播放到T0位置,当前时间t=0,用户请求N倍快进/快退。通常的方法是从T0开始每1秒输出N秒的数据,优化后从T0开始每1秒输出1帧关键帧,每帧关键帧的时间戳相差N秒。

(2) 第二步:服务器直接定位(Seek)到视频位置,读取少量数据并按IPTV标准格式转码,直到输出关键帧(I帧)。服务器只发送这个I帧到客户端,丢弃其它数据如音频、P帧、B帧等。

(3) 第三步:服务器侦听用户请求,若到下一秒,仍未收到“取消”,转到第二步;

(4) 第四步:收到用户“取消”请求,退出快进/快退模式,并从当前位置开始顺序读取视频数据。

3 IPTV实时转码解决方案

基于上述关键技术,本文提出IPTV实时转码解决方案,如图4所示,特点如下:

(1) 基于TS媒体封装标准,转码任意格式视频并实时输出到机顶盒(STB);

(2) 基于RTSP协议与STB进行信令交互,接收STB的播控请求,如播放、暂停、快进快退等;

(3) 根据时间快速定位视频的大致位置,并跳跃着从云盘抽取媒体数据,转码输出关键帧,实现在转码过程中实时响应STB的播控请求。

实时转码平台由流媒体服务器负责与STB建立信令、媒体流通道,并把播控请求转发给转码引擎,由转码引擎下载源视频并实时转码,转码后的音视频数据经TS封装后,最后通过流媒体服务器与STB间的媒体流通道传输。以点播流程为例,如图5所示。机顶盒获得播放URL后,与实时转码平台建立信令通道并发送请求,随后建立视频、音频通道,最后通过PLAY指令启动媒体数据下载,至此完成“开始播放”。

4 总结

本文首先对IPTV实时转码的关键技术,包括流媒体传输技术、IPTV播控技术等进行了研究,提出了IPTV实时转码解决方案,现已应用于广东电信ITV平台。通过该方案,机顶盒可实现天翼云上任意格式视频的点播,同时支持播控操作而无需预转码,大大提高了媒体处理能力及海量媒体的存储效率,简化了运维人员日常转码处理与媒体数据的维护工作。

我们为什么要转码篇2

也许你会感觉这个问题问的很奇怪，因为不转码就没有办法看到视频，很多精心制作的片子都不能按要求播放出来，所以我们必须要转码。

其实这只是其中之一，转码通常都是一些补救视频和降质输出的手段，很多是因为在前期没有使用适合的码率视频进行拍摄，在后期带来很多麻烦。或者就是要由高格式的视频变成码率适中的视频进行输出，例如AVI制作DVD就是一种很普通的码率优化和降质输出过程，原因大家也都知道，这就是因为我们的播放器还没有办法流畅播放庞大的无损压缩格式，流通起来也不方便。

我给大家的建议是，如果能直接编辑，那么能不转码就不要转码，转的次数越多质量越不能保证，转码只是补救并不是视频的新生，所以请大家一定要记住这一点。

2．我们转码的目的是什么？

上面也说到了一些转码的目的，除了为了满足播放器的需要，还有一方面是为了视频更好的多平台运用，例如：RMVB格式和WMV格式就很放便在网络上传播，现在网上有很多的播客网站，甚至一些手机3GP格式和MP4也可以轻松的上传，将大视频修改成小视频是非常必要的过程。

另外的目的就是方便编辑，现在前期拍摄使用的很多格式还没有办法轻松编辑，并不是这些格式不实用，也不是这些格式真的不方便，而是因为现在正处在标清向高清过渡的时期，硬件要求并不确定，模糊的状态下，标清时代的“元老”并不能发挥优良的身手，一切就只能通过视频转码来改头换面重新编辑了。

现在很多AVCHD格式的硬盘摄像机素材在制作起来就有些繁琐，除非要求硬件配置非常高端，否则使用过去的编辑方式在软件使用和实时编辑方面都有一些欠缺，针对这样的格式就必须转码，要不编辑起来就非常痛苦，而且事倍功半。

还有很多素材备份的时候也需要转码，不重要的影片就没有必要留无损压缩版的视频了，只要能满足普通放映的要求就好，使用转码缩小容量也是备份和给硬盘腾空间的好方法。

了解了这些制作转码的目的，我们应该针对自己的情况来选择转码方式，有时候修改了文件后缀名看似就完成了转码，其实那样的手段只是蒙骗了编辑软件而已，所以这样的方式也慎用。

现在市面上的播放器多种多样，有些兼容的码率多，有些兼容的码率少，所以经常碰到码率不通用的情况。很多播放器都是基于码率开发出来的，很多朋友使用的MP4过去使用起来很不方便，码率提供的也很“单薄”，现在很多都宣称已经兼容了RMVB格式，甚至可以提供TV-OUT接口，这样的变化真是实用。码率的变化拯救了很多硬件，当然这也从另一个方面说明了，码率兼容性任重道远的发展过程。

3．我们怎么转码？

前段时间制作了一个片子，素材码率针对编辑而言非常别扭，不兼容、导入无法实时、运动镜头和闪光灯画面有严重的“拉丝”现象，针对这样的视频必须转它？

我使用了网络上免费下载的小软件WinAVI，当时只是被动的选择，但是使用了一段时间后感觉给长使用，现在就将这款软件及其使用方式一并推荐给大家。

总结：

转码技术篇3

本台的非编制作网络以大洋ME和创新DV制作系统为主, 并配备了多台无卡工作站, 选用MPEG-2I帧50Mbps码率的格式进行素材上载, 编辑后经非编系统合成MPEG-2 IBP帧15Mbps码率的视频格式, 由转码系统转码为视频服务器专属格式并送入硬盘播出系统编排播出, 既保证了播出信号的质量, 又提高了视频数据压缩效率, 节约了大量储存空间。非编系统与硬盘播出网之间的文件交换是实现数字化制播的关键, 而转码技术在其中起到核心作用。

1 视频转码技术简介

视频转码技术, 即通过某种手段改变现有视频数据的编码方式。

1.1 不同编码格式之间的视频数据转码

不同编码格式之间的数据转码, 指通过转码方法改变视频数据的编码格式。通常这种数据转码会改变视频数据的现有码流和分辨率。这种转码方式设计的算法较为复杂, 其实质是一个重新编码的过程, 涉及的算法复杂度和系统开销, 是由转码所需图像质量要求及转码前后两种编码方式的相关度所决定的。

1.2 相同编码格式之间的视频数据转码

相同编码格式的数据转码, 指不改变压缩格式, 只通过转码手段改变其码流或文件信息, 可分为改变码流和不改变码流两种。本台应用的就是这种形式, 把MPEG-2全I帧50Mbps码流的视频数据转码为MPEG-2IBP帧8Mbps码流的视频数据, 直接用于播出服务器播出。同时也可以将视频服务器上的MPEG-2全I帧50Mbps码流的视频文件, 改变其头文件和封装形式, 可在非编系统上直接编辑使用。这种转码方式在视频工程上应用的比较广泛。

2 我台转码系统组成

我台转码系统由转码服务器、转码调度服务器、转码客户端及相应的网络联接交换设备组成。需要转码的节目通过网络交换机传送到转码工作站转码成为播出格式文件, 并传送到视频服务器, 同时将节目数据信息 (名称、类型、时长等) 写入到播出数据库。

2.1 转码服务器

转码服务器由多台安装有转码软件的高性能计算机设备组成。数据通过千兆以太接口进入转码服务器, 经转码处理后通过千兆以太接口输出至播出二级储存阵列。用户通过用户控制界面对转码调度服务器进行设置, 指定转码的编码方式及码流。转码调度服务器通过以太连接控制转码服务器进行转码工作。转码服务器在把素材文件取入本地缓存时, 改变视频数据的编码方式或文件封装格式, 将视频数据文件由制作文件格式转换为视频服务器所识别和可使用的视频文件格式, 通过以太网送入指向存储体。

2.2 转码调度服务器

转码调度服务器主要负责接收和处理所有的转码请求, 分析请求所包含的任务然后调度分配给转码工作站执行转码任务, 并返馈给转码客户端相关转码任务的执行状态和结果信息。转码调度服务器可同时管理多台转码工作站, 将转码任务分配在多台转码工作站上。

2.3 转码客户端

转码客户端是转码系统的用户操作界面, 提供转码任务申请和提交功能, 可设置详细的转码任务参数, 如选择转码的源文件路径、类型、出入点、特效处理方法、目标格式编码参数等。通过转码参数设置, 可实现直接的格式转换, 也可在转码的同时实现一些简单的视音频处理, 可对视音频文件进行参数调解, 并可实时预览处理效果方便用户操作。

3 与播出系统连接

节目传输到播出系统, 可分为信号方式下载或文件传输方式。信号下载是通过播出系统中的播控工作站控制上传上、下载工作站输出视音频信号给视频服务器录制为视频服务器的文件格式准备播出。文件传输方式是通过转码服务器将编辑好的节目转码为视频服务器的文件格式, 通过网络传输给视频服务器。我台主要应用的是文件传输方式。

3.1 硬盘播出与非编连接

由于我台各制作部门比较分散, 因此各类节目都是通过各自的非编系统进行素材上载。在制作环节, 把每个编辑好的节目进行本地快速打包转码, 就是把带有字幕和特技信息的一个节目转码成为视频服务器可以接受的文件格式, 转码的速度随着系统硬件性能的提高而不断加快, 这种转码形成的文件通过网络传输到视频服务器的硬盘中, 该传输过程为超实时, 可达到6~15倍的传输速度。

3.2 采用这种转码方式的优点

采用这种转码的方式有效地打通了制作和播出两个环节之间的格式瓶颈。

(1) 解决了远距离传输问题。由于文件通过网络传输, 布线比较方便, 各部门间只需建立网络连接, 就可实现资源共享, 可以利用网络系统进行远距离传输。

(2) 传输过程是文件方式交互。媒体文件携带的元数据信息同步入播出库, 不存在两个系统之间进行重新上载的同步控制和入出点的重新定位问题。转码和文件传输方式在一定程度上降低了整体系统造价。

(3) 提升了系统整体效率。我台制播一体的转码系统相对于以往制作播出方式, 节省了大量时间, 并将各部门的制作系统与播出系统有机地联系起来, 提高了硬盘播出服务器的利用率。

4 结语

转码系统在我台应用几年来, 工作比较稳定可靠, 大大提高了制作和播出效率, 原来必须使用昂贵的专业硬件设备才能进行的视频数据编解码、码流转换等工作, 随着计算机技术的发展, 可以利用转码软件来完成, 转码技术在视频数据的传输、存储和通用性增强方面也可以提供很好的解决方案, 在东宁电视台的制播数字化进程中起到了关键作用。

摘要：电视节目的数字化使得视频转码技术在电视台的制作播出系统中得到了广泛应用, 转码技术实现了非编系统与硬盘播出系统间的文件交换, 本文主要介绍转码系统组成以及在我台制作播出系统中的具体应用。

导游词讲解中的口语转码问题篇4

【摘要】导游讲解是一门艺术，在实际景点讲解过程中，导游需要对书面导游词进行口语转码。一般来说，口语转码手段包括语句的转码、声音的转码及情感的转码三个方面。其中语句的转码就是长句化短、多用口语词；声音的转码包括导游本身的音色、音调使用和语音修辞两层含义；情感的转码主要指导游的传情手段。三种转码手段综合运用能达到导游传播信息的最佳效果。

【关键词】导游讲解；口语转码；传播

【中图分类号】G712 【文献标识码】A

“转码”一词主要用于电子信息领域，比如视频转码技术就是将视频信号从一种格式转换成另一种格式。转码具有两个面向不同领域的重要功能。旅行社导游在带团活动中，所讲解的内容一般都有脚本（导游词），属书面语；导游服务最重要的任务是面对游客进行景点讲解，讲解属口头语。导游要将书面导游词用口语的形式传播，需要高超的“口语转码”技术。同样一篇导游词，有的导游照本宣科，很难吸引游客；而有的导游却能根据自己带团的经验及游客的需求进行修改，再采取口语转码手段，使之能与游客产生共鸣，达到最佳的讲解效果。一般来说，导游词讲解的口语转码手段包括语句的转码、声音的转码及情感的转码三个方面。三种转码手段综合运用能达到导游传播信息的最佳效果。

一、语句的转码

在传播学上，媒介信息能被受众理解的程度称为易读性。易读性主要取决于两个变量，即词汇难度和句子复杂性。[1]导游词撰写者的出发点主要是进行景点信息传播，信息密度大，长句词汇多，且用长句和复句以表达复杂的逻辑关系，要求语法的规范性、严谨性。导游讲解主要是作用于游客的听觉，在旅游景点往往容易受到噪声、环境对信息传播的干扰，再照搬照背导游词极不妥当，需对导游词进行修改，包括多用短句、省略句、单句等口语交际中的口语句式，从词语的语体色彩角度选择口语词汇，使得讲解简洁、明快，通俗易懂。

句子承担着传情达意的主要任务，是言语交际的基本单位，往往包括话题和述题两个部分，其中话题是言谈的对象，述题是对话题的说明，人物事地时等都可充当话题，[2]导游讲解中的任一处景点对象都是话题，比较简单；述题是传递、解答话题，构成述题的句子可能不止一个，比较复杂，需要恰当安排，述题句式处理上需考虑长句化短、繁句化简，整散句错开，这样才能显示修辞的效果。例如：

①正上方的汉白玉石匾上镶嵌着原国民党湖南省政府主席兼第九战区司令长官薛岳题写的“南岳忠烈祠”五个镏金大字。

《湖南导游词》──《南岳衡山》

②最里面的那块“道南正脉”匾是乾隆皇帝为了表彰岳麓书院在传播理学方面的功绩所赐的，其意思是岳麓书院所传播的朱张湖湘学是理学向南传播后的正统。

《湖南导游词》──《岳麓书院》

③欢迎来凤凰古城做客。凤凰是个风景秀丽的地方，名胜古迹很多，历来是人们游览的胜地。城内的古代城楼、明清古院和石板小街现在仍是风采依然；城外，还有南华山国家森林公园、唐代修建的至今仍保存完好的黄丝桥古城。

《湖南导游词》──《凤凰古城》

例①有汉字49个，是较为典型的长句，信息密度大，游客在听导游讲解时获取的信息量有限，实际讲解中需要明确话题、述题，其中述题需将长句化短，改为“大家请看正上方的汉白玉石匾，上面有‘南岳忠烈祠五个镏金大字，这是原国民党湖南省政府主席兼第九战区司令长官薛岳题写的”。例②的话题是“道南正脉匾”，述题可繁句化简，改为“大家看最里面的‘道南正脉匾，是乾隆皇帝所赐，用意在于表彰岳麓书院在传播理学方面的功绩，另外也说明了岳麓书院所传播的朱张湖湘学是理学向南传播后的正统”。例③是凤凰古城景点导游词的开头概说，在句式上虽有整散变化但不明显，改为“欢迎来凤凰古城做客。沱江、吊脚楼、‘翠翠般美丽的少女，酒吧、左立、咖啡馆，文青们在这里邂逅浪漫，这就是凤凰。城内有石板小街，古代城楼，明清古院；城外有沱江蜿蜒，丝桥古城，南方长城，宁静而祥和，这就是凤凰。凤凰之美，不仅在于水乡的温婉风光，更在于沈从文笔下诗意的《边城》。”这样整散搭配鲜明的句式，更能一下吸引游客的注意力。

词语是构成语句的基础，导游讲解需要从词语角度进行口语转码，主要表现在一是用词准确、得体，二是选择摹形、摹色的词语为口语讲解增色。例如：

④……郴州旅舍也从此声名鹊起，但原来的郴州旅舍早已毁弃……

《湖南导游词》──《苏仙岭》

⑤各种质地的象，经常是皇帝的陈设品，象高大威严、体躯粗壮，性情温柔，粗大的四蹄直立于地，稳如泰山，象征着社会的安定和皇权的巩固。这是一对铜胎珐琅嵌料石的太平有象，它能通四夷之语，身驮宝瓶而来，给皇帝带来了农业的丰收和社会的太平，故御名曰“太平有象”。

魏星.《导游翻译语言修炼》，中国旅游出版社，2004，p26

例④中的“声名鹊起”“毁弃”等为书面词语，用在口语讲解中略显晦涩，改为“名扬天下”“被毁”等口语中常用的词语更具表达效果。例⑤中的体躯粗壮”“通四夷之语”“身驮宝瓶而来”“故御名曰”等词语国语书面化，给游客的理解带来困难。

⑥金鞭溪就好比是张家界这位“绝代佳丽”身上的一条蓝色丝巾。

《湖南导游词》──《金鞭溪》

⑦珙桐是多年生木本花卉，通常在春末夏初的时间开花，花呈白色，柱头上略带一点儿紫红，很像鸽子的头和嘴，花身有两片又大又长的苞片，像是一对翅膀，整个花朵的形状就像是一只放飞的鸽子。这是我国特有的珍贵树种，因而，外国人亲切的称它为“中国鸽子花”。

《湖南导游词》──《金鞭溪》

⑧为什么叫牛鼻寨呢，原来在东面那块大石的右侧可以看到许许多多成对出现的牛鼻孔，当地的老百姓称为牛鼻山。

《湖南导游词》──《崀山》

例⑥、⑦、⑧中用词或着意突出颜色，或注重描摹形状，给人以丰富的联想和感受。导游讲解中多用富有形象色彩、描绘色彩的词语，可使游客在接受信息的同时，体味其中蕴含的意境，从而产生审美愉悦。

二、声音的转码

曾有人说过，“景点美不美，全靠导游一张嘴”，这虽有些夸张，但也反映出导游讲解的作用。导游讲解需要声音这个媒介传递信息，最起码的要求是导游说起来顺口，游客听起来悦耳。声音的转码包括两层含义，一是导游本身的音色、音调，二是导游处理导游词时的语音修辞手段。

导游讲解活动中其声音特色及语调特色决定了讲解能否成功，因为“音到了耳朵，还将有使人觉得愉快或觉得不愉快等情调的反应”。[3]如果导游员的音色明亮柔和、声音充满热情，讲解中注意根据景点内容适当运用句调、语速、重音、停连等语调要素，其讲解在第一时间就能拉近与游客的距离。这要求导游在平时注重训练自己的音色，包括发音吐字的字正腔圆、清晰有力，讲解时的语调要素合理使用，使表达抒情达意。

导游处理导游词时运用语音修辞的能力相对而言比较难具备，但这却是导游词口语化能力中一个非常重要的因素。汉语具有元音占优势，乐音多，响亮悦耳，四声分明，平仄相配，抑扬有致，柔美动听，音节组合灵活容易形成音律效果等特征，这使得汉语具有音乐性。语音修辞就是利用汉语的语音手段取得积极的表达效果，导游员可以在讲解中充分调动语音修辞手段，运用押韵、平仄、叠音、音节搭配以及顺口溜、拟声等，在语境中创设声音的表情功能，从而吸引游客。[4]例如：

①她头别（戴）发簪，怀抱花篮，面如满月，嘴含微笑，正深情地把朵朵鲜花撒向人间，因而称之为“天女献花”。

《湖南导游词》──《天子山》

②眼前的这个人工风景点就是六奇阁，六奇准确的说是山奇、水奇、云奇、石奇、动物奇和植物奇。

《湖南导游词》──《黄石寨》

③我们现在登上的是岳阳楼的顶层三楼，站在这儿，凭窗远眺，可以领略到“衔远山、吞长江”的磅礴气势，欣赏到“朝晖夕阴、气象万千”的湖光山色，大家可以看到，洞庭湖水天相接，浑然一色，山色湖光荟萃一楼，得到的感觉不正是“水天一色、风月无边”吗？

《湖南导游词》──《岳阳楼》

④金鞭岩是整个张家界景区最高、最陡、最壮观的石峰，人们称赞它是“名山大川处处有，惟有金鞭奇上奇”。

《湖南导游词》──《金鞭溪》

例①在介绍天子山天女献花景点时，第一二句中的“簪、篮”押an韵，而且自然入韵，说起来朗朗上口。导游词作为讲解语言，主要是介绍、描述、说明、议论景观，押韵不必像韵文那样刻意追求，但因为经常引用诗文，所以押韵的现象比较普遍，还有些是稍加调整即可入韵，不论哪种，注意使用会使讲解增色不少。例②注重了音节的调配，选用了六个相同音节的词排列在一起，语音节奏整齐，解说起来使本来平淡的内容变得富有韵味。例③的讲解中镶嵌不少四音节短语，呈2+2的音步整齐、协调，很有音响效果，极具节奏感。例④使用了“顺口溜”，这是为讲解时增加景物、现象的直观性、概括性、形象性、生动性而运用的，这种段子是民间流传较广的比较整齐押韵的语言形式，因它朗朗上口、表现力强，成为导游讲解中经常运用的语音修辞手段。

三、情感的转码

传播学认为，在人际传播中传播内容的同时，也能播出传播者与受众之间关系的信息，即传播者与受众之间亲疏度的关系，这种亲疏度对传播内容起一定的作用，如果形成“自己人”效应，就缩短了传受双方的心理距离。[5]导游讲解时要有这种情感的转码，把游客变成“自己人”，从而达到景点信息的最佳传播效果。表现在导游词讲解中就是一声音的动情性，二合适的称谓语，三相对固定的倾诉对象。

声音的动情性表现在用声音传情，情感色彩变化无限丰富细致，可以说无一瞬间相同，与之相适应的声音色彩的变化也必须生动丰富，[6]这需要导游在语音训练时加上内心细致的体验、玩味，才能进入情声融合的自由之境。合适的称谓语在导游讲解中能很好达到口语转码的效果。英国语言学家Leech的礼貌原则分为得体准则、慷慨准则、赞誉准则、谦虚准则、一致准则、同情准则等六条准则，导游讲解中遵从这些准则，使用合适、得体的称谓语，如“亲爱的游客朋友”“朋友们”“您”“我们”“大家”“我们大家”等，称谓语能起到缩距功能、定位功能、增强话语的交际性等作用，相对而言，“你”“你们”等第二人称使用不多，主要是因为导游职责的服务性质，要主动将受话人（游客）放置于权力优势一方，而避免将自己放置于权势高位。[7]

相对固定的倾诉对象能帮助讲解时具有对象感，这样声音传情才能有倾诉对象。很多新导游进行讲解时，心中较多的会想到导游词怎么写的，较少考虑游客，换言之讲解时照本宣科没有情感。如果能在熟悉导游词基础上尽可能多的考虑我要讲给谁听、对方喜不喜欢听，或者在现场讲解时眼神相对固定一群人，这样声音有了对象感，内容也有了对象感，感情转码就能完成，口语化就强。

导游讲解的表达要求是准确恰当、鲜明生动、风趣活泼、优雅文明、浅白易懂、清楚圆润等，事实上不少导游依托导游词进行讲解时是将背诵的导游词照搬出来，书面色彩严重，传递信息效果差，这与导游表达艺术化标准相去甚远。导游讲解的音声化过程是导游词通过口语表达进行传播的过程，导游词讲解中的口语转码手段能帮助导游较好地进行讲解，从而传递知觉形象、文化内涵、价值标准等方面的审美信息，全心全意为游客服务。

参考文献

[1]陈智群，张晓夫.试谈主持语言“口语化”[J].北华大学学报（社会科学版），2003，9.

[2]倪宝元.大学修辞[M].上海：上海教育出版社，1994：98.

[3]陈望道.修辞学发凡[M].上海：上海教育出版社，2001：30.

[4]廖广莉.非韵文中的语音修辞研究[M].海口：海南出版社，2009：124.

[5]迟名.我看“说”新闻[A].播音主持艺术3[C].北京：北京广播学院出版社，2001：123.

[6]董传亮.说声音的适应性[A].播音主持艺术4[C].北京：北京广播学院出版社，2012：54.

[7]纪娅妮.导游语言研究[D].武汉：华中师范大学，2013.

[8]湖南省旅游局.湖南导游词[M].长沙：湖南科学技术出版社，2011，7.

基金项目：湖南省教育厅资助科研项目，项目名称《湘南地区双方言分布及接触研究》，编号：13C017。湖南省十二五教育科学规划资助课题，课题名称《应用型本科院校汉语言课程教学模式研究》，编号：XJK013CGD010。

作者简介：廖广莉，女，1968年生，湖南永兴人，硕士，郴州职业技术学院教授，主要研究方向：应用语言学；滕丽，女，1969年生，四川德阳人，硕士，湘南学院副教授，主要研究方向：媒体语言。

基于云计算框架的视频转码系统篇5

在通常的视频服务访问中,播放终端的数据处理能力和显示能力不同,网络的带宽、丢包率等信道特性不同,因此视频的编码需要根据这些客观条件进行相应的转换,从而保证用户的正常观看,视频转码正是解决这一问题的关键技术。常见的视频转码方案分为硬件转码和软件转码两大类。前者主要应用于对转码延时敏感、稳定性要求高、输出格式相对固定的场景中,如视频直播流的转码,一般采用专用的ASIC芯片或FPGA可编程器件,输入输出格式和参数很难改变,每台设备通常能够支持4～8路直播流的转换。后者主要应用在对转码延时和稳定性要求不那么高、输入输出格式复杂的场景中,如基于视频文件的转码或者非广播级质量要求的直播流转码。从目前视频服务的主要应用而言,由于点播类(VOD)的应用比重较大,因此软件转码方案是业界的主要选择。

从软件转码器所依赖的计算平台来看,视频转码软件的实现从最初单纯简单依靠单个CPU的通用计算能力,发展到利用CPU的多功能指令集(如MMX、3D Now、SSE等)。但在经历了CPU核心的计算能力快速提高的阶段后,单个核心的计算能力已经接近瓶颈,而人们对视频质量的需求却与日俱增,从最早的VCD(分辨率352×288,码率约1.5Mbps),到标清DVD(分辨率720×576,码率约4.5Mbps),再到高清蓝光(分辨率1920×1080,码率约25Mbps),使得相应的转码复杂度也大大增加。随着多核计算机和并行计算思想的普及,视频转码的并行化成为大势所趋。

利用多线程技术,视频转码可以充分发挥多核CPU的并行处理性能,实现图像组级的、帧级的、片级的或宏块级的并行策略[1,2,3,4],但这种方法依旧受制于单机的CPU数量或转码算法本身的并发能力,使得并发率上升较为有限。采用分布式计算机集群,以单个转码任务为最小粒度的并发调度机制,可以增加系统整体的吞吐量,也不受制于转码算法,但是无法提升单个转码任务的转码速度。本文利用云计算的“Map-Reduce”计算框架,将单个转码任务并发至多个计算节点,每个计算节点同时对同一个视频文件的不同部分分别进行转码,分段转码完成后系统再将转码后的视频文件合并,完成单个转码任务。该系统的并发能力不会受限于单个计算节点的物理条件和转码算法,具备较大的并发能力提升空间,可以显著提升单个转码任务的速度。

1系统架构

“Map-Reduce”[5]是一种适用于TB规模以上数据量的并行运算框架,“Map”(映射)是一个将大任务拆分成多个独立的小任务,并使它们可以平行地映射到多个节点的过程,“Reduce”(化简)是将节点独立的小任务完成并将其合并的过程。在本文提出的转码系统由以下几部分组成:存储系统、任务调度、码流预处理、码流后处理、码流分割、码流合并、转码节点。其中,“码流预处理”和“码流分割”实现了将大段视频码流拆分成多个独立的小段视频码流的过程,称为“映射器”(Mapper);“转码节点”、“码流合并”、“码流后处理”实现了小段视频码流转码、合并和复用的过程,称为“化简器”(Reducer)。系统整体架构如图1所示。

存储系统主要是用于存储用户通过视频接收接口提交的待转码视频,以及转码系统成功转码后的视频,用户可通过内容发送接口获取视频和相关信息。

任务调度是转码系统的核心,它负责管理系统内的所有计算资源,当它发现有新的转码任务到达时,它首先根据该任务的优先级以及当前系统的可用资源,分配适当的计算资源依次去完成码流预处理、码流分割、转码、码流合并、码流后处理这几个步骤。

码流预处理需要对用户提交的待转码视频进行分析,解析文件容器,按照用户定制的转码需求进行码流解复用,实现视音频码流分离。

码流分割按照任务调度模块的指示,将指定的视频码流(由于音频转码的复杂度远远低于视频,因此音频码流不做分割,直接转码)分割成段(打出入点标记,不生成实际的物理文件),分割时需要考虑转码后合并码流的图像连续性,避免产生跳帧或重帧等现象。

转码节点根据任务调度模块的指令,读取特定的分割后的视频码流段(或完整的音频码流),根据用户设置的转码参数完成转码过程。转码节点上需要安装编解码库,编解码库以插件的形式的部署,使得每个转码节点支持的码流格式具有可扩展性。

码流合并是码流分割的逆操作,其主要目的是将转码后的视频码流段重新组合到一起,形成完整的视频码流,保持原始的码流先后顺序。

码流后处理对转码合并后的视频码流以及转码后的音频码流按照用户指定的文件格式进行复用,生成成品文件。

2任务调度

当任务请求到达后,任务分析根据任务的属性将任务分为“非紧急任务”与“紧急任务”。非紧急任务带有可量化的优先级标记,进入任务队列后依据优先级进行排队,在任务队列中的任务优先级会随着在队列中的时间的增长而提高,这样可以防止“饿死”的问题出现,即某个较低优先级的任务由于一直排在较高优先级任务后面而一直无法得到转码服务。

紧急任务具有非常高的优先级,可以绕过一般的任务队列,直接请求计算资源以完成转码。在可用计算资源不足的情况下,可以通过调度将其他正在进行的非紧急转码任务暂停,腾出足够的计算资源服务于该紧急转码任务,保证紧急转码任务在较低的时间内完成。

转码系统内的所有计算节点都要向任务调度模块以心跳信号的形式汇报自身状况,包括当前负载、任务优先级、任务执行进度。资源调度一方面通过节点监控传达的信息,得到集群的负载分布,再根据节点计算能力库中存储的信息,得到实时的集群可用计算资源分布情况;另一方面根据任务情况(紧急任务和非紧急任务队列),调配可用的计算资源。当新任务的优先级特别高时,任务调度模块可以暂停集群中优先级较低的转码任务,将更多的计算资源集中起来服务紧急的转码任务。最终,形成一系列的控制命令发给节点控制模块。

节点控制执行由资源调度模块发来的节点控制命令,使计算节点执行、暂停或恢复某个特定任务,包括码流预处理、码流分割、转码、码流合并和码流后处理,控制命令除了执行、暂停和恢复基本操作外,还指定了任务的输入和输出,以及相关的参数设置。

节点监控接受从所有计算节点发来的心跳信号,心跳信号包含节点当前负载、当前执行的任务优先级和进度或结果,将这些信息汇总后形成集群负载分布报告,提供给资源调度模块。一旦转码节点因为软件或硬件故障导致心跳信号中断,或转码失败,任务调度模块及时回收该转码子任务并重新调度,直至所有转码子任务成功结束。

3视频拆分

视频码流中的图像组GOP(Group Of Pictures)是由一系列连续的图像组成的,每段视频码流包含了若干个连续的图像组。每个图像组至少有一个I帧,并且I帧处于图像组的开头。I帧可以独立解码而无需依赖其他帧,因此一般说来,一个图像组内出现的错误最多延续至下一个I帧。在视频文件分割的过程中,图像组级别的粒度比较适中,相比单帧的粒度而言,有更好的解码独立性;相比一整段完整的视频粒度,有更好的转码并发性。

因此,在视频文件拆分的过程中,需要对码流的图像组结构进行判断,分别针对Open GOP和Close GOP的情况采取不同的分割策略,即Open GOP时需要对每一段分割码流片断的前部增加一个GOP的冗余,保证解码器能够解出这个片断中的所有帧。同时在进行分割时还要记录下分割策略的选择情况,供合并程序参考使用。视频文件分割的流程如图3所示。

如果拆分点后的第一个GOP 是Close GOP,就不用考虑其他策略,即在拆分点将视频分为前后两段,不会使其中一段视频无法解码。反之,如果拆分点后的第一个GOP 是Open GOP,就需要使后一段视频前多加一个GOP。

另外,视频拆分中还有一点需要注意的是,对于解码器而言,每次对一段视频进行解码时,都要先寻找该段视频中的序列头信息。然而,通常一整段视频可能仅在开始处包含一个序列头,也可能在每个GOP 前都附带有相同的序列头,这要视码流而定。这时,若碰到前一种情况,则需要在拆分之后的每一段子视频前都添加上序列头,以保证解码器的正常运行。如果碰到后一种情况,那么就在拆分时将每个序列头都视为GOP 结构的一部分进行整体分割。

4实验结果

4.1实验环境

为了测量本文提出的转码系统的性能,我们将其部署在一个计算机集群上。该集群采用千兆以太网进行互联,以满足集群节点间大量的IO访问(读取待转码文件、生成临时文件和最终视频文件)。每个集群节点的基础硬件配置为:双4核CPU,主频2.8GHz,6M缓存,8GB内存,存储服务器的硬盘容量为2TB,其他计算节点的硬盘容量为137GB。在软件配置方面,部署Windows 2003 64bit操作系统,使用ffmpeg(版本为0.8)来完成码流的预处理、合并和后处理,使用x264(版本为0.116.2057)完成单段视频的转码。码流分割、任务调度程序以及每个节点上的心跳服务程序用Visual Studio 2008开发。存储服务器、调度服务器、码流预处理及分割服务器、码流合并及后处理服务器各占用1台物理机,转码节点共有5台物理机,整个集群有9个节点。图4为实验环境图。

4.2单个视频实验

我们先将一段时长约20分钟、码率为50Mbps的高清1080i的MPEG-2测试视频转为10Mbps的H.264,考察在不同计算节点数量的条件下系统的转码速率。

如图5所示,当转码节点只有1个时,转码任务未被拆分并分散至该集群上,只能单纯依靠在单个节点上的多线程并发,由于输入源视频的码率很高,转码的复杂度大,单个节点的计算能力有限,转码时间远远超过视频时长(在图中用红色水平虚线表示)。随着转码节点的增加,转码任务被拆分,转码所需时间大幅度降低,当转码节点数达到4个时,转码所需时间已经低于视频时长,意味着实现了高清视频的超实时转码。

当然,由于视频的拆分、合并都会带来一定的开销,使得转码速度的提升和转码节点数量的增加不会呈线性关系,但总的说来,这个基于云计算框架的转码系统极大拓展了转码速度的提升空间,而且,单个节点能力的提升(转码算法改进、CPU核心数增加)并不制约系统整体的性能提升。

4.3多个视频实验

我们再将一批总计约50小时(75个文件,约1.1TB)、码率为50Mbps的高清1080i的MPEG-2测试视频转为10Mbps的H.264。如果将这一批视频转码当做一个单独的任务来看待,那么衡量系统完成该任务的速度可以用“吞吐量”这个指标来考察,当系统架构和核心算法未改变的情况下,系统和外部的吞吐量越大,总体处理时间越短。而如果将每一个视频文件的转码都当做是一个单独的转码任务来看待,我们可以用“超时率”这个指标来考察系统的性能,其定义为:超时率 = 视频时长 ÷ 转码时长 – 1。当1个小时的视频用1个小时转完,其超时率为0,即实时转码;超时率为负意味着实现了超实时转码。我们通过调节任务并发数量(即一个视频文件用多少个转码节点进行转码)来观察该转码系统的性能能力的变化情况,结果如表1所示。

从中,我们可以看到,随着并发数的增加,系统对外的吞吐能力略有下降,是因为拆分、合并等操作引入了额外的开销,但是单个文件的转码速度得到了提升,由单个节点的严重滞后到4个或5个节点并发时的超实时速度。并行化计算势必带来额外的开销,从而引起成本的上升,但是它也缩短了单个任务的执行时间,对于需要尽可能缩短单个转码任务执行时长的应用场景(如最新热点新闻的发布),采用集群并行化是一个比较廉价可行的解决方案。

5结语

在视频服务日趋丰富的今天,视频服务提供商对视频转码的需求越来越大,而高清化的视频使得转码的复杂度也随之提高。当单个计算节点的转码能力达到瓶颈后,本文提出了一个基于云计算框架的视频转码系统,利用计算机集群的并发能力,将单个转码任务拆分后并发执行,从而进一步显著提升了转码速度。

目前,该系统已应用于我司高清最新热点点播节目的生产发布,显著提高了高清点播节目的上线速度。

参考文献

[1]蒋兴昌,周军,罗传飞.H.264并行编码算法的研究[J].电视技术,2008,32(2):33-35.

[2]魏妃妃,梁久祯,柴志雷.基于X264多线程并行编码研究[J].电视技术,2011,35(19):7-10.

[3]宋阳,章晓燕.基于片上多核的H.264编码的并行加速性研究[J].计算机时代,2011(4).

[4]冯飞龙,陈耀武.基于H.264实时编码的多核并行算法[J].计算机工程,2010(24).

视频实时转码方法的研究与比较篇6

(1) PC客户端和手机客户端的硬件性能是不一样的。手机客户端CPU性能普遍较弱, 大部分手机客户端CPU无法胜任高清视频的解码任务。使用这些设备进行高清解码时, 会出现视频丢帧、卡顿现象, 并且增加设备功耗, 减少待机时间。

(2) 由于手机屏幕较小, 提供高清码流并没有太大意义, 并不能提升客户体验, 只会增加数据流量带宽, 增加不必要的成本。因此, 通过转码降低业务带宽能够带来明显的经济效益。

1 基于GPU单元的转码

GPU (Graphics Processing Unit) 实时转码利用图形处理单元内部强大的硬件并行处理单元来执行转码中的部分运算。GPU原本被设计成用来执行图形处理, 提供GUI接口, 并非针对编解码处理。但是GPU拥有强大的并行通用计算能力, 这些计算能力能够执行视频编码中的大部分运算, 加速转码处理。使用GPU进行实时转码时, 由于视频解码这部分计算量不大, 仍然使用CPU进行软件处理。视频编码部分可以将计算量最大的步骤如运动估计、模式选择放在GPU上来加速实现, 而运算量较小的的步骤如量化与反量化、VLD、VLC以及DCT和i DCT等均放在CPU上用软件来实现。通过GPU硬件加速和CPU软件运算, 可以有效的实现视频实时转码, 目前Intel和Nvida的GPU均提供SDK开发接口, 可以在这些图形芯片上轻松地实现多路视频实时转码。

2 基于专用转码芯片的设计

这类转码方案的原理是使用专用转码芯片, 利用芯片的硬件功能直接实现转码, 不需要软件参与运算。例如Fujiso的MB86M01芯片能够实现一路H264高清转两路H264低清码流, 可以应用在大多数视频实时转码的场合。

MB86M01的转码过程如下所述:H264视频流进入芯片后解码得到原始码流, 然后经过两路编码, 生成两路视频流输出。整个过程由硬件完成, 无需软件进行处理。该方案比较简单。但是缺点是转码密度不高, 一颗芯片只能实现两路转码。如果一个服务器集成20路芯片, 也只能实现40路的转码, 不适合大规模的转码应用。并且该方案有另外一个缺点:灵活性不高, 很多转码参数不能设置, 输入视频流格式固定, 一些特殊场景下无法应用。

3 基于视频处理CPU的设计

现在有一种专门针对视频处理的CPU, 这种转码方法比较灵活, CPU内部集成了通用CPU和硬件视频处理单元。下面以TI的TMS320DM8168视频/成像数字信号处理器为例, 来介绍这类转码方案的实现。

该芯片内部集成一个ARM Cortex-A8内核, 一个DSP内核和一个视频处理硬件辅助单元。Cortex-A8内核给予了该方案足够的灵活性, 通过对A8内核进行编程, 可以直接实现大多数的实时视频流协议。处理器内部的视频处理硬件辅助单元功能强大, 能够实现视频的捕捉、视频的编解码运算和视频输出的硬件处理。处理器内部的DSP能够实现一些高级的视频处理功能, 如人脸识别、叠加水印等等功能, 结合CPU的三个功能单元, 既能够实现高强度的多路视频实时转码, 又能够灵活地实现智能识别和叠加水印等高级视频处理功能。

4 三种实时转码技术的比较

上述三种实时转码技术各有优缺点, 针对这三种技术, 我们对转码的主要特性进行综合比较, 比较结果如下表1所示:

通过上表我们可以发现, GPU转码方法功耗比较高, 转码能力强, 转码质量一般, 但是由于x86构架大量应用于服务器以及PC机, 只要对现有的系统进行软件升级, 就可以快速地实现视频实时转码;专用硬件芯片的方法转码效果好, 功耗低, 但是并行处理能力低, 可以用于一些专用转码终端的开发。视频处理CPU转码方法具有转码能力强, 功耗低, 性价比高的特点, 可以大量用于一些转码工作量比较大的通用转码设备, 如转码服务器的开发。

5 结语

本文对GPU转码、专用芯片转码、视频处理CPU三种实时视频转码技术进行了分析和比较。三种转码技术各有自己的特点和长处, 灵活应用这几种实时视频转码技术, 可以满足各种不同应用场合的视频实时转码需求。

摘要：为了满足不同应用场合下视频实时转码的需求, 分析和比较了几种不同的基于硬件加速的视频实时转码方法, 并通过实际测试统计了不同转码方法的性能。结果表明:采用GPU单元的转码方法适用于现有服务器的技术升级;采用专用转码芯片的方法适用于专用转码终端的开发;采用视频处理CPU的转码方法适用于通用多路转码服务器的开发。这对于选择合适的视频实时转码方式, 以最少的资源实现预期的转码效果具有参考指导意义。

关键词：视频,实时,转码

参考文献

[1]黄兴.基于GPU的视频转码技术研究[J].电视技术, 2012, 36 (1) .

离线转码器图像质量主观评价方法篇7

1视频质量主观评价方法

长期以来, 无论是模拟视频还是数字压缩编码视频, 人们都是采用主观评价方法来评估视频图像质量, 国际和国内都有成熟的技术和标准。通常, 视频质量主观评价就是选择一批非专家类型的受测者 (15人以上) , 让他们在一个特定受控环境中, 连续观看一系列测试序列10至30分钟, 然后采用不同方法让他们对视频序列的质量进行评分 (表1为视频主观评价得分标准) , 最后求得平均意见分 (Mean Opinion Score, MOS) , 并对所得数据进行分析。测试环境中的受控因素包括:观看距离、观测环境、测试序列的选择、序列的显示时间间隔等。根据不同的测试环境、测试目的, 有下列几种视频主观质量评价方法:DSIS、DSCQS、SSM、SSCQE。所有这些主观评价方法都有其优点和局限性, 目前还没有一种通用性强的主观评价方法, 在实际应用中, 往往依靠研究者自身的判断去选择适合实际情况的主观评价方法。

2改造的主观视频评价方法

2.1测试目的

首先, 本测试旨在从两套转码方案中选出转码质量更优秀的 (高质量低码率) 转码方案。其次, 通过改变一些重要参数, 在胜出的转码方案中选择更适宜 (质量和效率之间寻找一个平衡) 的转码参数。最后, 与OTT视频进行比较, 得出视频效果不低于OTT视频质量的转码参数。

2.2测试环境的搭建

(1) 准备两台相同型号65寸高清电视机, 并将电视并排放置, 间隔距离小于20cm。受测人员在电视前分左右两列坐好, 人眼距离电视1.5~5m, 测试期间受测人员左右交换位置, 也可以任意走动观看视频。

(2) 选择两台相同型号的机顶盒 (硬件配置及视频播放器相同) , 分别与两台电视机连接, 播放相同质量的高清电视直播节目, 根据受测人员的反馈, 调整电视或机顶盒的视频输出参数 (电视机视频模式、对比度、亮度、色温) , 至两台电视机输出视频质量主观对比结论相同。

(3) 将拷贝有测试视频的两个U盘分别连接测试机顶盒, 使用机顶盒的视频播放功能进行播放对比。用一个遥控器对两个机顶盒进行操作, 方便确保两个视频播放进度同步。

2.3测试方法

(1) 受测人员10人以上, 视频播放人员一人。

(2) 组织者依据测试目的, 准备好待测视频及测试顺序。

(3) 向受测人员发放测试表格, 表格如表1所示。受测人员在每轮对比中选择视频质量优秀的那个。

2.4视频准备

(1) 选择一部亮度明暗适中、色彩丰富的电影作为视频源, 这样能全面有效地验证转码质量的优劣, 避免因光线或颜色过于单一造成的局限性。

(2) 针对多屏视频业务, 分别用不同的编码方案将给定视频源转成视频带宽为3.5Mb/s、2.5Mb/s、1.5Mb/s、0.8Mb/s的视频。通过调整视频分辨率、CBR/VBR、one/two pass、质量等级 (某一编码方案中参数) , 生成20分钟左右的视频段, 其他非常用参数如GOP长度、B帧、P帧、视频级型等默认采用方案提供商的建议, 还有一些参数如帧率、长宽比则采用“跟随源”的方式。

(3) 选择电视猫中乐视片源作为OTT业务对比视频, 其清晰度分别为乐视超清、乐视高清、乐视标清, 其中乐视超清为最高清晰度。

3测试结果

3.1转码方案对比

经过统计, 去掉无效数据, 转码甲方案优于乙方案。

(1) 在四种视频码率的对比中, 转码甲方案的视频清晰度均高于乙方案。

(2) 转码速度。在采用同一视频源和相近转码参数进行比较时, 甲方案转码速度能达到15.7X (较长时间运行时能稳定达到20X) 。若想进一步提高质量, 则要降低速度, 那么把转码速度降低到9.5X。B方案转码效率为0.9X左右, 采用较高的服务器硬件配置, 其转码效率不超过2X。

3.2甲方案转码的最优参数

通过改变甲方案中的转码质量等级、one/two pass、小码率CBR/VBR、1080P/720P中一项参数, 进行对比发现:

其他参数固定, 当视频码率为3.5Mb/s, 视频分辨率为720P时质量好于1080P;只改变one/two pass, 差别不明显;视频码率为0.8Mb/s时, CBR质量好于VBR质量。

3.3与OTT视频比较结果

与OTT视频比较结果如表2所示。

3.4转码主要参数

结合运营商片源及网络条件现状, 建议转码后的视频片源基本参数如表3所示。

4结语

在测试中发现, 当一些前提条件成立时, 有些实际测试结果并不完全符合理论结果, 如小码率视频时VBR质量低于CBR视频质量, 当视频带宽为3.2Mb/s时, one pass和two pass之间差别并不明显。当然这不能完全排除测试过程产品的误差。值得注意的是, 在选择编码方案和确定编码参数时, 一方面要具体结合转码器及终端芯片给出最优的转码方案;另一方面, 要结合运营商自身实际情况, 平衡质量和效率。由于时间、环境等原因, 本次测试有些地方不够严谨, 样本源不够丰富 (应尽量准备不同类型的视频如电影、电视剧、童话片、风光纪录片、体育赛事等) , 不同类型的视频可采用不同的转码参数配置。OTT对比源单一, 可以对比爱奇异、搜狐视频等客户端。

参考文献

[1]王新岱, 杨付正.视频质量的主客观评估方法研究[J].电视技术, 2003 (8) :81.

[2]国家广播电影电视总局广播科学研究院电视研究所.GY/T 134-1998数字电视图像质量主观评价方法[S].北京:国家广播电影电视总局标准化规划研究所, 1999.

转码技术篇8

网络视频已成为人们生活中不可或缺的一部分。截止到2012 年, 美国有将近90% 的人通过网络获取高清视频［1］, 如何保证各种移动终端得到不同的服务质量, 提供可靠的服务面临严峻的挑战。

视频转码就是从一种视频码流到另外一种码流的转换, 目的是把输入的压缩流转换成符合接收端要求的压缩流。随着视频数据量的急剧增长, 传统的视频转码系统存在存储能力不足、存储能力和处理能力不可扩展的缺点。近年来, 研究人员提出多种基于Hadoop的视频转码系统［2 － 5］, 用来提高转码效率。文献[2]在集群机器配置完全一样的情况下, 把视频分别按时间、机器数目和视频相关性分段, 进行了3 组对比实验; 文献[3]提出了一个面向移动设备的云转码系统, 引入了视频资源预测与缓冲区置换的算法; 文献[4]利用开源软件Vmoox设计了一个面向智能手机的转码系统, 而文献[5]根据视频切片大小、不同的机器节点数和Hadoop本身的block大小进行对比实验。

针对现有视频转码系统大多没有考虑到根据机器处理能力分配转码任务量这一问题, 提出一种新的任务调度算法。输入视频被分成段, 根据视频段的复杂度和机器的处理能力进行映射, 类似“能者多劳”机制, 从而减少并行转码时间。

1 Hadoop转码系统

1. 1 Hadoop介绍

Hadoop是一个开源的云计算框架, 如图1 所示, 是一个适合处理海量数据的并行编程系统, 可以根据输入数据分布信息自动创建几个并行子任务, 并将子任务调度到合适的集群节点上并行执行, 所以此模型能够很好地适用于多个视频文件进行转码。Hadoop使用Map/Reduce作为编程模型, Map/ Reduce通过将大型分布式计算分解为一系列对数据键值对的操作实现并行处理。HDFS是Hadoop主要的分布式存储系统, 它和现有的分布式文件系统有许多相似之处。HDFS的设计目标是: 支持大的数据文件, 这些文件以顺序读为主, 以文件读的高吞吐量为目标, 并且与Map/Reduce框架紧密结合。

1. 2 视频转码

视频技术和视频压缩标准的不断发展以及视频节目在不同应用环境的需要, 促使了视频转码研究的出现和不断发展。转码的主要目的就是使得异质网络之间、不同的接入设备之间以及不同视频数据格式之间能够互相兼容。视频转码主要有以下几种类型: 码率转换 ( Bitrate reduction) 、空间分辨率转换 ( Spatial reduction) 、时间分辨率转换 ( Temporal reso- lution reduction) 和语法转换等［6］。

视频转码的过程是: 对原始视频进行解码、重新调整和视频编码。在网络视频应用中, 网络带宽随着时间波动。视频转码的主要用途是使视频适应于网络带宽, 类似于可伸缩视频编码 ( scalable video coding) ［7］。视频压缩的标准格式有多种, 如MPEG- 1、MPEG-2、H. 263、MPEG-4 和H. 264 等。

1. 3 云转码方案

首先提出一种基于hadoop的视频转码框架, 如图2 所示。视频由mkvtoolnix软件进行切片, 通过MapReduce中的map函数封装ffmpeg转码功能, 当大量视频转码任务提交到集群时, 系统把任务分配到集群节点上, 利用集群系统的计算能力和已有视频转码开源软件实现多视频同时转码。

视频转码分为离线预转码和在线转码, 系统处理一个普通的用户的视频请求可分为以下几个步骤:

① 视频请求: 用户从远端向Web Server发送获取视频的请求, 包括视频名称与用户设备规格;

② 设定参数: Web Server根据用户设备参数及所要求的分辨率, 向Streaming Server请求视频资源;

③ Streaming server检查Prestore video data中是否有与用户请求相匹配的数据;

④ 若存在, Streaming Server从Prestore video da- ta中取出视频数据;

⑤ 将视频块返回给用户;

⑥ 否则向NameNode发出转码任务的命令, NameNode调度集群进行分布式转码; 分布式转码完成后, NameNode向Streaming Server返回转码完成后的视频文件所在位置Transcoded video data;

⑦ Streaming Server从Transcoded video data中读取视频文件;

⑧ 将视频块返回给用户同⑤。

2 关键技术

2. 1 问题模型

此处要考虑的是如何快速地把复杂度不等的子任务调度到多个处理能力不一致的处理节点上。文献[8]比较了11 种调度算法的执行效率, 发现Min- min效率最高。但是Max-Min算法与其相比, 资源负载性能上要好的多。Max-Min算法把所有节点的完成时间进行平均化, 从而减少了转码时间, 提高转码效率。

首先把资源的动态分发问题建立数学模型[9]:

假设:有n个具有不同复杂度的视频段, J= ( 1, 2, 3, . . . n) , C = ( c1, c2, . . . cn) , m个不同处理能力的计算节点, P = ( p1, p2, . . . pm) , 若转码时间与视频块的复杂度成正比, 与机器处理能力成反比, 则视频块i分发到机器j上的转码时间为 ( 只考虑转码时间, 其余负载均忽略) :

视频块分发完之后, 机器j上获得的视频块的集合设为sj, 集合sj的完成时间为:

设L = { s1, s2, . . . , sm} , A ( i) : J - > L , 意味着把所有视频块映射到处理机器上, 目标是找到最优的调度算法最小化全部完成时间。因此可以找到完成时间相对较长的机器, 然后将其最小化, 整个转码过程的效率才会提高。即:

2. 2 模型参数评估

2. 2. 1 节点转码能力评估算法

影响机器转码性能的因素有很多: 比如处理器、内存、网络和磁盘读写速度等。参照PageRank算法来综合评估机器的转码性能。首先设定配置方式:

2 种不同网络状况和ffmpeg的2 种版本, 这样总共有4 种配置方案, 再用基准程序测试各个模块的数据, 然后使用PageRank算法进行数据分析［10］。

① 运行基准程序生成原始数据矩阵D, D ( i, j) 代表第i项配置方式下第j项的测试输出值;

② 对初始数据进行抽象, 将原始数据矩阵看作由列向量组成, 即D ( d1, d2, . . . d7) , 每列表示每个测试项在各种配置中的输出数据序列;

③ 计算邻接矩阵A, A ( u，v) = correlation ( du, dv) , u = 1, 2, 3, 4, v =1, 2, . . . 7;

④ 使用PageRank对各测试项计算出PageRank得分。得分高的测试项表明该项较多地反映了大多数测试项的变化特征, 得分较低的项说明该项具有较多跟其他测试项不同的数据变化特征。根据被参考机器的转码性能, 来计算出其他机器的转码能力。

2. 2. 2 视频块复杂度

视频复杂度的评价方法有很多: 如视频编码、视频大小、TM ( the spatial detail metric) 和SD ( the tem- poral motion metric) 等, 选择视频大小作为评估视频复杂度的唯一标准。

2. 3 动态规划法

假设2. 1 节中的问题为NP问题, 要想解决此问题, 首先要对数学模型进行分析。本文是想找到一个算法, 快速得把n个视频块分发到m台处理能力不同的机器上, 并且m台机器要在一定的时间误差内完成转码。类似背包问题 ( Knapsack problem) , 从一堆物品中挑选出几个, 在不超过总重量的前提下, 使总价最高。背包问题是一种组合优化的NP完全问题。

对于背包问题, 已有的求解方法可分为精确算法 ( 如枚举法、动态规划法、分支定界法、图论法和指数级方法) 和近似算法 ( 如贪心算法、蚂蚁算法和遗传算法等) 。其中动态规划法是解决多阶段决策过程最优化的一种数学方法。通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划方法所耗时间往往远少于朴素解法。动态规划背后的基本思想非常简单。若要解一个给定问题, 需要解其不同部分 ( 即子问题) , 再合并子问题的解以得出原问题的解。

2. 4 Min-MM算法

本文提出一种Min-MM算法, 此算法结合虚拟背包问题和Max-Min算法的思想。首先将平均转码时间作为分布式转码时间的下限, 计算每台机器所能接收的总复杂度, 然后选取视频块分发到机器上。

2. 4. 1 设定平均转码时间

根据2. 2 节可计算, n个视频块的总的复杂度为:

m台机器的总的处理能力为:

则理想状态下n个视频块分发到m台机器后, 平均转码时间为:

则机器j在faverage时间内可以完成的视频块复杂度为:

2. 4. 2 虚拟背包过程

将n个视频块根据复杂度从高到低的顺序进行排序, m台机器根据处理能力从强到弱的顺序进行排序。如图3 所示, 由处理能力强的机器首先选择视频块, 若vj*+ ci< vj, vj*+ ci+ ci +1> vj, 则计算vj*+ ci+ ci +2的值, 若vj*+ ci+ ci +2vj, ( vj*为目前已选择的视频块的复杂度) 则停止选择; 否则继续计算vj*+ ci+ ci +3, 直到vj*+ ci+ ci +l, 若vj*+ ci+ ci +lvj, 则停止选择, 否则将vj*+ ci赋予机器j。被选择过的块标记为1, 没被选择的块标记为0。第2 台机器从所有标记为0 的视频块中选择, 遵循上述规律。

2. 4. 3 Max-Min算法

当所有的机器都进行选择之后, 可能会有些剩余的视频块, 并且部分机器所选择的视频总复杂度没有达到vj ( 图3 机器1 中的空白处) , 此时再根据Max-Min算法将剩余视频块分发到机器上。

3 实验与分析

3. 1 实验设计

实验环境: Hadoop集群: 17 台服务器, 型号分别为DELL R620、R610 和R520 等, 其中一台机器作为NameNode, 并安装Mkvtoolnix软件, 负责切片; 其他16 台作为DataNodes, 并安装ffmpeg负责转码任务。

首先, 使用云转码系统进行转码, 验证其所能支持的视频格式、转码时间, 其次是使用Min-MM算法前后的对比。

( 1) 视频输入格式为mp4、mkv、mov、rm和ts; 视频输出格式为mp4、mov、mkv和ts。

(2) 测试总的转码时间

转码参数如表2所示。

①改变视频大小:0.5 G、1 G、2 G、4 G、8 G、16 G;

②改变集群的机器数目:1、2、4、8、16;

③ 不同的切片大小: 16 M、32 M、64 M。

⑶ 当集群有4 台计算节点, 视频分段大小不一样, 其余条件都一致的情况下, 使用Min-MM算法前后转码时间的对比。

3. 2 结果分析

针对上节提出的3 种实验方案, 得到以下实验结果, 并对其进行评价分析。

① 提出的基于hadoop的转码系统支持mp4、 mkv、mov和ts等格式之间的互相转码, 并且由实验可以看出, mp4 和mkv转码过程时间相对较慢, mov和ts则相对较快, 这跟视频本身的构成有密切的联系;

② 切片大小为32 M时, 不同大小视频在1 到16 台处理节点的集群中的转码时间, 如图4 所示。从图中可以看出8 G, 16 G的大视频块的转码加速效果比512 M到4 G的更明显。4 台处理节点, 切片大小为16 M、32 M和64 M时的转码时间对比, 如图5 所示。从图中可以看出: 当视频大小为0. 5 ~ 2 G时, 切片大小为32 M转码时间最小; 4 ~16 G时, 切片大小为64 M时, 转码时间最少;

③ 可以看出使用Min-MM算法之后的转码时间明显小于使用之前, 如图6 所示。

4 结束语

在Hadoop的视频转码框架基础上提出了一种新的任务调度算法Min-MM。云视频转码框架使用的是Hadoop云平台、mkvtoolnix切片工具和ffmpeg转码工具, 结合任务调度算法, 来提高转码效率, 改善转码系统的性能。任务调度算法Min-MM针对各个DataNode处理能力不一致的问题进行数学建模, 首先对视频块复杂度和机器的处理能力进行评估, 然后利用虚拟背包问题和Max-Min算法将n个复杂度不同的视频块分发到m台不同处理能力的机器上, 使总的转码时间平均化。

实验结果验证了云转码系统能够对大视频数据进行快速转码, 及视频切片大小对转码总时间的影响。Min-MM算法在节点处理能力不一致的情况下, 最大化地缩短了整个系统的转码时间。

参考文献

[1]ZHANG Hao, SUN Shu-xia.Application of Hadoop in Video Transcoding Based on Cloud Computing[J].Computer&Telecommunication, 2011 (12) :36-37.

[2]ADRIANA G, HARI K, BORKO F.A Study of Transcoding on Cloud Environments for Video Content Delivery[C]∥Proceedings of the 2010 ACM Multimedia Workshop on Mobile Cloud Media Computing.Italy:Firenze, 2010:13-18.

[3]LI zhen-hua, HU ANG Yan, LIU Gang.Cloud Transcoder:Bridging the Format and Resolution Gap between Internet Videos and Mobile Devices[C]∥Proceedings of the 22nd International Workshop on Network and Operating System Support for Digital Audio and Video, Canada:Toronto, 2012, :33-38.

[4]SHEFER L D, MARCHESE F T.A System for Real-Time Transcoding and Delivery of Video to Smartphones:Information Visualisation (IV) [C]∥2010 14th International Conference.London, 2010:494-499.

[5]KIM M, CUI Y, HAN S, et al.Towards Efficient Design and Implementation of a Hadoop-based Distributed Video Transcoding System in Cloud Computing Environment[J].International Journal of Multimedia and Ubiquitous Engineering, 2013, 8 (2) :213-224.

[6]尚书林, 杜清秀, 卢汉清.视频转码技术研究现状与进展[J].自动化学报, 2007, 33 (12) :1233-1241.

[7]余圣发, 陈曾平, 庄钊文.针对网络视频应用的视频转码技术综述[J].通信学报, 2007, 28 (1) :111-118.

[8]BRAUN T.A Comparison of Eleven Static Heuristics for Mapping a class of Independent Tasks onto Heterogeneous Distributed Computing Systems[J].Journal of Parallel and Distributed Computing, 2001, 61 (7) :810-837.

[9]LAO Feng, ZHANG Xing-gong, Guo Zong-ming.Parallelizing Video Transcoding Using Map-Reduce-based Cloud Computing:Circuits and Systems (ISCAS) , 2012 IEEE International Symposium on[C].Seoul, 2012:2905-2908.

转码技术篇9

Hadoop是并行编程系统,适合于处理大规模数据,可根据输入的数据分布信息,自动创建并行子任务形成一个集合,使子任务在合适的集群节点上并行执行的一个开源云计算框架。Hadoop系统的核心模块就是MapReduce,该模块极大地方便了程序员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。程序员要做的仅仅是按照MapReduce编程规范定义好map(映射)函数、reduce(规约)函数,而不需要关心节点和任务的失效及任务之间的数据等问题,就能完成分布式数据处理问题。在本文中通过基于云计算平台的MapReduce开发框架,将转码任务并发到多个计算节点,每个计算节点在同一时间对同一个视频文件的不同部分各自进行转码,系统再将分段转码结束后的视频文件整合成单个视频,即完成单个转码任务。

1 基于云计算平台的视频转码系统

1.1 系统设计原理

本系统设计是本着以提升转码任务的速度为原则,因为单个计算节点的物理条件和转码算法不会影响并发能力,使得转码任务的速度具备较大的提升空间。基于Hadoop云计算平台的视频转码系统可以满足大批量、多用户视频转码对资源的需求。本系统使用音视频转换软件来实现视频转码,将转码功能用MapReduce中map函数封装起来。当集群出现大量视频转码任务时,系统会利用集群计算能力和视频转码软件在集群节点上自动随机分配任务,实现多视频同时在线转码。码率转换、空间分辨率转换、时间分辨率转换、语法转换、容错视频转码等的工作全交给已有的转码软件来实现。

在本系统设计中,使用Java脚本提供的Runtime类函数调用转码功能代码。此方法的优点是:只要打包后最终的结果是可执行文件,无论视频处理功能是由什么语言编译的,都可以被MapReduce框架调用。Java虚拟机的运行时环境可以通过Runtime类函数获取,Runtime类函数调用可执行文件只要一个取代调用进程的内容的函数Exec。Exec函数的参数是要被调用的可执行文件RuntimeExecExec的命令行,该命令行的值取决于视频处理功能的具体实现。的命令行,该命令行的值取决于视频处理功能的具体实现。

1.2 系统架构实现

系统整体架构采用Google提出的适用于大规模数据量的并行运算软件架构“Map-Reduce”,主要思想是使用一个映射(Map)函数使用他的拆分功能,将一个将一个大任务拆分成若干个独立互不干扰的多个小任务,同时将这些小任务映射到多个相应节点的算法,或使用一个化简(Reduce)函数实现一个逆操作(多个相互独立任务合并成一个任务)。本系统是由存储系统、任务调度、码流预处理、码流后处理、码流分割、码流合并、转码节点等部分组成。映射器承载了将大视频码流拆分成多个小段视频码流的过程,包括码流预处理和码流分割。化简器承载了将小段视频码流转码、合并和复用的过程,包括转码节点、码流合并和码流后处理。

存储用户提交的待转码视频通过视频接收接口到达存储系统,用户可通过视频接收接口获取转码系统成功转码后的视频和相关信息。转码系统的核心是任务调度,主要是管理系统内的需要进行计算的所有资源,如遇到新的转码任务到达时任务中心时,本系统会自动根据优先级以及当前系统的空闲资源进行分配,然后分配适当的计算资源按顺序去完成码流预处理、码流分割、转码、码流合并、码流后处理等步骤。

码流预处理对用户提交的转码视频分析、容器解析,流解复用进行自定义转码需求,使视频和音频流分离。码流分割任务调度模块按照指示,指定的视频流被划分成段,分割时需要连续的流图像避免跳帧或重帧现象。任务调度模块的指令分配转码节点,读取分割后的视频码流段,根据用户设置的转码参数完成转码过程。码流后处理对转码合并后的视频码流以及转码后的音频码流按照用户指定的文件格式进行复用,生成成品文件。

1.3 视频拆分算法

一系列连续的图像组成Group Of Pictures(视频码流中的图像组)。在MPEG编码中,图片组即I帧和I帧之间的帧排列。每个图像组至少有一个I帧,并且I帧处于图像组的开头。I帧无需依赖其他帧可以独立解码,若干个连续的图像组组成了一段视频码流。视频分割的过程中图像组级别粒子大小适中,相比单一帧的粒子而言,图像组解码的独立性更好;相比完整视频有更好的转码并发性。

所以,判断码流图像组的结构在视频文件拆分的过程中得以体现,需要视Open-Gop和Colse-Gop的不同情况分别采取不同的分割策略。例如要保证解码器能够解出这个视频文件中的所有帧,Open-Gop就必须在每一段分割码流片断的前面增加一个图像组的冗余。同时在进行分割时还要将分割策略的选择情况记录下来,供编制合并程序时参考使用。

在拆分后,如果拆分点后的第一个GOP是Open-Gop,需要多加一个GOP在后一段视频前。相反,如果拆分点后的第一个GOP是Colse-Gop,就不可能会出现无法解码视频的情况,因为视频通常被拆分点划分成为两段,拆分过程中还要注意解码器一段视频进行每一次解码时,都要查找对应视频中的序列头信息。视码流的不同会出现每个GOP前都附带有相同的序列头,也可能仅仅只开始处包含序列头。这时,如果出现前者状态,那么就在拆分时整体分割每个序列头。如果出现后者状态,则序列头添加在拆分之后的每一段子视频前面。

2 视频转码系统实验实施

为检测本系统的效果,我们将总时长为60小时的85个高清1080i测试视频(码率为50Mbps)进行实验。当系统架构和核心算法在固定的情况下,如果将这批的视频转码作为单独的任务,可以用“吞吐量”来考验衡量系统完成该任务的速度,任务处理时间越短表示系统和外部的吞吐量越大。同理,如果将每一个视频的转码作为单独的任务,则系统的性能可以使用“超时率”来进行评测,其公式为:超时率=1视频时长÷转码时长。从这个公式可以看出如果想实时转码就是要使超时率为0,也就是说用1个小时转完1个小时的视频。当超时率为正表示超实时转码。该转码系统的性能能力的变化通过调节任务并发数量来控制,实验结果如表1所示。

从实验结果中,我们可以看到,随着并发吞吐数量的增加,外部吞吐能能力略有下降,因为视频文件拆分、合并等操作引发了额外的系统开销,但单个文件转码速度已有显著提高,由单个节点的速度严重滞后提升到4、5个节点并发实时速度。当然,并行计算会带来额外的开销,从而导致上升成本,但它缩短了单个任务执行时间,需要缩短单个转码任务执行时间,采用计算机集群并行化是可行的首选方案。

3 结束语

【转码技术】推荐阅读：