音视频通信论文

2024-12-21

音视频通信论文（精选11篇）

音视频通信论文篇1

如今, 全球4G市场趋于成熟, 5G研发大幕已经开启, 更快的速度、更大的容量和更高的效率逐步实现, 这就为实时音视频通信服务提供了可能。业界普遍认为, 继文本短信、语音IM之后, 实时音视频通信将成为用户的又一沟通选择。

不过, 目前我国实时音视频通信仍处于起步阶段, “无专业书籍、无行业会议、无搜索引擎收录”是其市场状况的真实写照。为此, 以声网Agora为代表的公司已经开始行动起来。

智能硬件普及为引入Web RTC打基础

数据显示, 全球智能手机用户数量已经超过20亿, 80%的互联网用户至少拥有一部智能手机。与固定端相比, 用户在移动端的在线时长更长、支付意愿更高, 同时用户的线上社交和游戏行为的区域范围也在不断扩展, 期望与全球各地的用户一起分享信息和进行沟通。“正是在这种全球移动互联网的情况下, 把实时通信功能加入移动或Web应用中, 并且让用户在世界任何地方都可以进行跨区域的语音通话、视频通话成为大势所趋。”声网Agora创始人赵斌表示。

不过, 目前移动端的实时音视频通信仍存在一些问题。例如:如何在互联网上打造与传统通信专线同样的服务质量, 如何建立沟通所需的信令, 如何防止通话可能被中断的问题?此外还有一个问题是, 如果通信的双方所使用的终端不同、网络制式也不一样, 能否在两者之间建立畅通的沟通?

在这样的背景下, Web RTC的引入就成为必须。Web RTC (网页实时通信, Web Real-Time Communication) 是一个支持网页浏览器进行实时语音对话或视频对话的技术, 由谷歌于2011年推出。“Web RTC是互联网行业在实时通信领域影响深远的一项努力, 它的目标是通过互联网为每个用户创建完整的实时音视频通话能力, 同时还大幅降低了开发人员实现实时音视频通信功能的门槛。”赵斌表示。

国内外发展热度不均成问题

Web RTC目前已经得到了业界的广泛支持, 包括Mozilla、Opera、思科、英特尔、Oracle、AT&T、微软等在内的厂商都是Web RTC的支持者。在过去4年时间里, Web RTC已经变成了一个全球性平台, 超过700家公司和项目在移动端和Web端提供了基于RTC的创新应用。

然而, 在全球风生水起的Web RTC在中国仍面临着一些问题。赵斌表示:“尽管web RTC已经很强大了, 但是中国市场还存在管制不清晰、市场不透明和不专业的问题。”另外, Web RTC还存在着编译困难、信令实现较难、不支持多方通话、覆盖区域不全等问题。

赵斌介绍, 声网Agora想做的就是帮助更多合作伙伴在移动应用或者Web应用中实现实时通信功能, 并且能够在全球纷繁复杂的网络环境中保证通话质量, 推动Web RTC在中国市场更快地发展。赵斌认为, 这甚至会对许多行业的创新模式起到推波助澜的作用。

近日, 声网Agora在Web RTC领域动作频频, 例如:与国外专家合作, 在国内出版中文版《Web RTC权威指南》, 为相关从业者提供技术指导;此外与小米互娱合作, 基于声网Agora的高清实时通信云服务为“米粉”提供高清、稳定的音视频通信产品。

音视频通信论文篇2

男，26，北京邮电大学信息光子学与光通信研究院（国重）

(+86)182-1061-9787，V58@bupt.edu.cn

已经顺利取得毕业证、学位证，面试完即可签三方协议

基本信息性别男学历硕士生源地湖南省张家界市出生年月

六级451

邮箱v58@bupt.edu.cn 1988年1月政治面貌入党积极分子英语四级499 民族土家族婚否未婚

教育背景2011.09 – 2014.03北京邮电大学电子与通信工程专业硕士

主要课程：c++，通信网理论基础，电磁场与微波技术，随机过程，计算机网络，现代数字通信，宽带通信网，现代信号处理，知识产权与信息检索，纳米光电子技术等

2007.09 – 2011.06 长春理工大学无机非金属材料工程本科

主要课程：高等数学，大学英语，线性代数，概率论与数理统计，c语言，信号与系统，通信原

理等

实践经历2011.12在android2.1版本下开发过一款“疯狂投篮”的3D游戏

游戏公共类的设计与实现，游戏菜单界面的设计与实现

2011.8用c++语言设计图书管理系统

学生社团2011.09 – 2014.03北京邮电大学院研究生会

北京邮电大学信息光子学与光通信研究院助管

语言能力

英语通过CET-6级，可以熟练的阅读专业相关领域英文专业文献资料，具有很强的技术文档及规范写作能力。

IT&综合能力

掌握电子/通信领域知识体系，熟悉GSM/UMTS移动通信网络与架构，了解LTE

熟悉PPT、word、excel办公软件，了解Photoshop等图像处理工具

熟悉C/C++、汇编语言，掌握代码编译与分析技巧，了解MYSQL数据库

熟悉TCP/IP等网络协议，熟悉WAP等移动互联网协议及架构

熟悉Linux、Windows操作系统，掌握Linux、Windows下常用命令、故障排除的能力

校内奖励2011-2012学年，荣获北京邮电大学校一等奖学金；

2012年，荣获北京邮电大学-“电联”优秀学生奖学金；

2012-2013学年，荣获北京邮电大学校一等奖学金；

视频通信改变沟通方式篇3

毫无疑问，在今天全球化经济的大趋势下，这种消除距离的障碍，用犹如现场般面对面的沟通形式，替代书信、传真、电子邮件以及电话交流的视频会议系统，对于一个企业、一家机构、一个组织来说有多么的重要，可以说有着不可替代的价值。

视频通信正当时

视频会议系统是实现远距离实时信息交流并协同工作的应用系统。它可实时传输视频与音频信息，使人们可以远距离进行直观和真实的视音频交流。同时，利用多媒体技术，视频会议系统还可以帮助使用者对工作中各种信息进行处理，如共享数据、共享应用程序等，从而构造出一个多人共享的工作空间。

当前，随着经济全球化的高速发展，一方面，企业跨地域、跨国界在不同的城市和国家建立分支机构已成为寻常事，因此，企业遍布全球的各机构间的远程沟通与协作是否顺畅，直接关系到企业业务能否成功开展。另一方面，“时间就是金钱”这句话在当今世界已经被完美诠释，争时间、抢速度、快节奏已然成为全球商业环境的主流，市场机遇常常转瞬即逝，留给企业决策的时间越来越短，因此，快速反应、快速决策才能抓住机遇，提高效率、缩短周期才能提升竞争力。再有，在现在全球协作的趋势下，产业分工日益细化，仅靠某个企业单打独斗就能称雄的时代早已经过去，企业需要与上下游合作伙伴密切合作，才能达到共赢，这其中沟通和协作的重要性显而易见。

由此，我们不难看出，以上这一切都是构筑在团队之间、与客户和合作伙伴之间充分、有效、及时的沟通基础之上的，而最高效、最直接的沟通莫过于沟通双方甚至多方的面对面。有人曾对全球不同企业的业务领导做过调查，结果表明，有75%以上的业务领导表示，面对面沟通对业务的成功与否密不可分；同时，他们认为，重大项目和战略方案如果缺乏面对面沟通会导致误解，并使业务面临风险，相反，面对面合作可能使关键业务流程生产效率和业务产出提高20%。而视频会议系统正是实现跨地域面对面沟通交流的理想方式。对此，Gartner的预测也佐证了这一趋势：到2015年，全球企业将有2000万员工使用视频办公。

近年来，中国视频会议市场打破了多年的沉寂而迅速发展起来，除了一些国际大厂商先后进入中国市场外，国内厂商像华为公司等也异军突起，并开始与国际厂商一争高下，而令人刮目相看。

智真系统引领潮流

在中国，视频会议系统已经发展了多年。华为企业业务视讯解决方案销售部部长刘学军在回忆华为视讯的发展史时曾介绍说，华为在1993年到2000年期间就推出了业界首台全交换架构MCU（视频会议多点控制单元）和国内首款自主品牌的视讯终端，至今华为视讯已经走过了20年的路程。

今年9月，IDC发布了《中国视频会议市场半年度跟踪报告（2013年上半年）》，报告显示，华为视讯在2013年上半年新增市场份额中排名第一，占据34.9%的市场份额。截至2013年上半年，华为视讯设备累计全球发货量超过16万台，智真系统超过6500套，已在全球超过60个国家规模部署。由此可以看出，有着20年历史的华为视讯目前已经发展成为全球领先的视频通信解决方案供应商，而背后的支撑来自于华为多年来持续的技术积累。目前，华为视讯已在视频通信领域获得了700多项专利受理、400多件专利授权，其中国际专利申请达300多件，已授权120多件。在掌握核心技术的同时，华为还在ITU、MPEG、3GPP等多个国际标准组织中担任不同的职位。

以笔者看来，让华为视讯占据1/3的市场份额，并能与国外大品牌媲美甚至略胜一筹的杀手锏莫过于它的智真系统。在华为的视讯产品线中，智真系统至今已经推出了三代，而最新的全景智真系统无疑代表着华为的技术实力，其中无论是华为的专利技术共光心摄像机的采用，还是1080P60全高清，以及低带宽、低能耗的设计，都在引领业界的技术潮流，带给用户的是一种更真实、更清晰的面对面体验。

对于目前视频会议系统的发展趋势，刘学军认为，首先，视频会议系统正向着普及化与多样化发展，在华为的产品线中，不乏为应对这一趋势而设计的桌面终端和软终端，让用户在办公桌面或通过手机和Pad等移动终端实现自由互通，以帮助用户实现随时随地的面对面交流。其次，简单便捷和高清视讯系统得到更多用户的青睐，像华为推出的精巧时尚的TE30一体化终端，就是一款集简单与高清于一身的产品；而全景智真系统则是全球首款5760×1080P 60帧系统，是视频会议真实感的完美体验。第三，视频会议的网络适应能力更强，像华为TE30系统，就比其他厂商的同类产品节省50%的带宽，能让用户在Internet上轻松实现高清视频交流。同时，刘学军认为，一系列智能技术的应用，包括触控操作、语音呼叫入会、智能人脸识别等技术的应用，都能让用户更加简单轻松地获得更好的体验效果。华为TE系列就在业界率先推出了语音呼叫入会功能。

从这些发展趋势中，我们可以看出，对于视频会议系统，用户的体验很重要，这体现在多个方面，不仅包括产品的性能、安全性、易用性，还有用户界面、高清视频等，刘学军在谈到视讯产品未来的发展方向时，首先提出的就是要有更好的用户体验，同时，他认为，3D技术、智能化技术、全息技术等创新科技的应用也是未来值得关注的方向。

应用处处可见

除了技术趋势外，应该说，在应用上，视频会议系统早已走出了办公室，走向更广泛的垂直行业应用，像在远程教育、远程医疗、远程应急指挥、远程法庭、远程信访等行业均具备显著的应用价值，这些行业市场将为视频会议带来广阔的空间。

中国气象局负责每日气象报告、空气质量预报、灾害预警等与人民密切相关的职能。气象局每日召开一个小时左右的全国会商会议，由总部的专家与各省气象部门进行会商，讨论天气预报情况，在交流的过程中，各气象部门之间要进行大量的图文数据交换以确保沟通内容的形象性、有效性。华为视频会商系统不仅提供了高清画质便于与会者高效进行语音和视频沟通，更是通过稳定的系统和先进的辅流技术使设备运行和资料传输成为了各部门沟通的重要手段，提升了气象局的工作效率。

在应急指挥中，视频会议系统常常发挥出重要的作用。例如国家电网应急视频系统就采用了华为智真、MCU、高清终端等设备，为其构建了应急网和行政网。该平台在实现MCU全业务备份的同时，进行双机热备，重点会场终端1+1备份，确保系统万无一失。华为应急指挥专用解决方案使任意会场电视墙都可随时调度，从而保障电网安全，提高日常工作效率。

高清系统的出现为远程医疗等对清晰度要求较高的行业应用带来了契机。在目前医疗资源过于集中、边远地区看病难的情况下，远程医疗在一定程度上缓解了这一困境。河南省郑州大学第一附属医院采用120多套智真系统，构建了中国最大的远程医疗平台，覆盖河南省118个县市，建设了远端会诊中心、专家诊断室、远端手术室、卫星通信视频救护车等创新业务，全面改善了全省的医疗水平，让偏远地区的人们通过面对面的方式在家门口就能享受先进的医疗服务。据悉，现在每天通过视频会议系统平台进行的会诊多达70多场。

四川灾区视频连线北京通信展篇4

本刊讯10月21—25日，2008年中国国际信息通信展览会在北京举行。在中国电信展台上，成都都江堰中学、德阳什邡抗震英雄、资阳国盛农牧养猪场的现场场景，以及德阳什邡灾区与广东视频招聘现场，通过大屏幕实时进行展示，吸引了所有参观者的眼球。

据悉，四川电信积极配合集团公司的安排，通过“新视通”传输平台，分别将位于都江堰、德阳什邡、资阳等地不同环境下的实景，以稳定、清晰、优质的实时画面传送到北京会展中心主会场，充分体现了远程视频监控在学校教育、招聘行业以及农村畜牧业中的成功运用。

音视频通信论文篇5

关键词：3G视频通信H.264／AVC容错技术

0引言

传统的视频编码标准都是围绕比特流的概念组织的。实际上用于传送数字视频的大多数网络体系结构并不适合直接传输比特流。在许多网络体系结构中，比特流需要拆分为数据分组。这些分组的特性，如最小／最大尺寸、相关开销和差错属性等在网络体系结构间、甚至在某个给定的网络体系结构内也是很不相同的。假如视频编码器自身能和网络特性很好的匹配，将能够获得更好的视频QoS。问题是如何容错地支持易差错的无线移动网络?为了解决无线移动信道视频的容错传输，我们将采用如前向纠错编码及支持差错复原的视频压缩编码技术来解决。H.264编解码器可以很好的解决易差错信道的视频容错传输。在3GPP／3GPP2的传输环境下通过选择适当的条带长度使H.264编解码器和无线移动信道的网络特性得到很好的匹配，实现无线移动信道视频的容错传输。H.264标准适用于无线网络传输的主要原因之一就是在概念上分为两层；视频编码层VCL(video Coding Lay-en和网络抽象层NAL(Net work Abstraction Layen，其中VCL负责高效的视频内容表示，它被设计成尽可能独立的网络，NAL负责对编码信息进行打包封装并通过指定网络进行传输。H.264中还定义了两种新的帧编码类型，即SP帧和SI帧来完成不同流的切换，可以根据传输网络和用户终端的具体情况自适应地在不同码率的视频流之间切换，这大大改善了视频流对3G网络的适应性。

13G视频通信中容错技术的应用

3G通信技术的出现使对话式无线视频业务成为可能，虽然3G网络在移动环境下的带宽可达384kbps，在静止环境下的带宽可以达到2Mbps，但是由于信道衰减、建筑物遮挡、终端移动、多用户干涉等原因影响，使得信道是时变且高误码的，因此，在3G网络上传输视频流时，仅仅追求高的压缩效率是不够的，必须有一定的容错和错误掩盖措施。最新的3GPP／3GPP2标准要求3G终端支持H.264／AVC视频编解码技术，同时由于硬件的限制，3G终端只支持部分H.264／AVC的容错工具。H.264中虽然提供了一些容错工具，但是它们有各自不同的用途和目的，即在不同的场合需要选择不同的组合来使用。

1.1错误隐藏技术由于错误隐藏技术能够利用接收到的数据来恢复丢失的数据，因此一般都应用在解码器端。在无线网络环境中，解码器的这种能力尤其重要，因为无线网络环境中误码率高，很多RTP包在传输中被网关或者路由器丢弃，而这些丢失的数据又必须在解码器端根据空间和时间上的相关性来恢复。错误隐藏技术的实现方法也很多，在JVT参考软件中，就使用了一种空间相关性的方法，即使用被丢失宏块周围的4个宏块来恢复被丢失的数据，其选用的标准是使恢复后边缘数据的SAD(sum ofabsoIute dlffer-ence)差最小。这种方法的效果虽不是最好，但是计算简单有效。

1.2 2Slice结构为了满足MTU大小的要求，在3G网络视频传输中对视频进行分片压缩显得尤其重要。经过分片压缩后的视频中每个RTP包中包含一个片，一般每个slice中包含一个或者几个宏块，并以RTP包的大小满足MTU的要求为准。

1.3帧内编码块刷新由于帧内编码不依赖时间上相邻帧的数据，所以帧内编码块能有效地阻止由于包丢失甚至帧丢失而引起的错误传播。对于对话式视频业务来说，由于实时性要求高，而且I帧刷新的频率较低，因此可以用帧内编码块来部分代替I帧的作用。H.264／AVC提供了两种帧内编码块刷新(intrablockrefreshing)模式：其中，一种是随机模式，即用户可以选择帧内编码块的数目，而由编码器随机决定哪些哪些位置上的宏块实行帧内编码；另一种是行刷新模式，即编码器在图像中依次选择一行进行帧内编码，但图像分辨率大小不同，每次需要帧内编码块的数目也不同，例如在QC JF格式图像中，每次需要选择一行，即11个宏块进行帧内编码，而在CIF格式图像中，这个数字变成22。

1.4参数集(Parameter Sets)H_264标准中，取消了序列层和图像层，将原本属于序列和图像头部的大部分句法元素分离出来形成序列参数集SPS(Sequence Parameter Set)和图像参数集PPS(Picture Parame2ter Set)。序列参数集包括了与一个图像序列有关的所有信息，如编码所用的档次和级别、图像大小等，应用于视频序列。图像参数集包含了属于一个图像的所有片的信息，如编编码方法、FMO，宏块到片组的映射方式等，应用视频序列中的一个或多个独立的图像。多个不同序列参数集和图像参数集被解码器正确接收后，被存储于不同的己编码位置，解码器依据每个己编码片的片头的存储位置选择合适的图像参数集来使用。

1.5冗余片(Redundant SIice)H.264编码器除了对片内的宏块进行一次编码外，还可以采用不同的编码参数对同一个宏块进行一次或多次编码，生成冗余片，冗余片的信息也被编码进同一个视频流中。解码器在能够使用主片的情况下会抛弃冗余片，反之如果主片丢失，也可以通过冗余片来重构质量。

1.6灵活的宏块排序(FMO)FMO技术通过片组(slicegroup)技术来实现。片组是由一个或者多个片组成，而每个片中通常包括一系列的宏块。采用FMO进行视频编码的好处在于，可以使因信道传输而引起的错误分散。具体实施方法是：帧图中的宏块可以组成一个或几个片组，每一个片组单独传输，当一个片组发生丢失时，可以利用与之临近的已经正确接收到的另一片组中的宏块进行有效的错误掩盖。片组组成方式可以是矩形方式或有规则的分散方式(例如，棋盘状)，也可以是完全随机的分散方式。采用FMO提高了码流的容错能力，却使编码效率有所降低，同时也会增加编码延迟时间。

2结论

通信技术的飞速发展，第三代数字无线移动通信网络以及多媒体信息服务(MMS)的兴起为无线移动环境下的多媒体通信业务(特别是视频)提供了应用和发展的需求.多媒体业务是3G的基本业务之一，然而视频通信业务对3G网络还是一种挑战，这是由于无线网络是一种易错网络，容易受到多径干扰、阴影衰落等多种条件的影响，致使视频传输流中的RTP包会大量丢失，因此对于3G无线网络中的视频通信业务，容错技术是不容忽视的。H.264／AVC视频编码标准本身提供了许多容错工具，可以很好的解决易差错信道的视频容错传输，提高3G视频通信的可用性。

参考文献：

[1]潘全卫DHCP服务器容错方案[J]网管员世界2009.(5)：55-56

[2]柳林，张引，张三元，叶修梓.3G对话式视频业务中H.264／AVC的容错策略[J].中国图象图形学报2006(9)：1223-1229

音视频通信论文篇6

通信技术主要研究信号的产生、信息的传输、交换和处理, 研究领域包括计算机通信、视频通信、数字通信、卫星通信、光纤通信、蜂窝通信、个人通信、平流层通信等方面。近20年来, 随着视频业务需求的迅速增长和业务质量要求的提高, 视频通信已经成为通信的主要方式之一。视频通信是对视频业务进行采集、压缩、传输和恢复的过程。

视频编码是视频通信中一个非常重要的组成部分。多年来, 媒体存储、会议电视、可视电话、IPTV、网络电视、视频监控和移动流媒体等一系列的应用, 促使了视频编码标准的产生和发展。国际电信联盟远程通信标准化组 (ITU-T for ITU Telecommunication Standardization Sector, ITU-T) 与国际标准化组织 (International standard organization, ISO) 是制定视频编码国际标准的两大组织, 已经制定出H.261、MPEG-1、MPEG-2、H.263、MPEG-4和H.264/AVC等多个标准。近年来, 随着高清晰度电视、DVD、蓝光盘等设备的出现, 分辨率越来越高的视频得到广泛的应用, 从而相应地产生了对这些视频进行高效率且低复杂度编码的需求, 新一代视频编码国际标准即高效视频编码标准 (High Efficiency Video Coding, HEVC) 正是为满足此需求而制定的。作为即将流行的视频编码标准, 世界上许多电视厂商和媒体运营商已经把HEVC作为未来主要研发的媒体格式。可以看出, HEVC会以强劲的压缩效率表现, 将视频编码推向一个全新的高度。

目前, HEVC标准已经制定完成。然而, 为了满足更多的应用需求, 标准制定组织对HEVC主要进行了2个方面的扩展, 包括可伸缩扩展和精度扩展。可伸缩扩展主要在HEVC的基础上提供不同帧率、不同分辨率和不同质量等可伸缩编码。精度扩展主要对HEVC所支持的比特深度和颜色采用格式进行扩展。本文将详细介绍HEVC的扩展部分。

2 SHVC

为了满足不同用户终端对不同视频分辨率和不同帧率的需求, 以及解决已出现的一些异构网络和不可靠网络等问题, 标准化组织提出基于HEVC的可伸缩扩展, 即可伸缩高效视频编码 (Scalable High Efficiency Video Coding, SHVC) 。

2.1 基本架构

基于H.264/AVC的可伸缩扩展即可伸缩视频编码 (Scalable Video Coding, SVC) 只支持三种可伸缩性:时域可伸缩、空域可伸缩以及质量可伸缩。SHVC不仅支持这三种可伸缩性, 还支持其他的可伸缩性, 主要包括时域可伸缩、空域可伸缩、粗纹理信噪比可伸缩、比特深度可伸缩、交错连续可伸缩、色域可伸缩、外部基本层可伸缩、多种可伸缩性结合等等。SHVC采用多级循环解码框架, 对于相同访问单元的不同层之间的图像, 按照层索引的顺序从小到大地进行编码并放到比特流中。

以一个三层空域可伸缩SHVC编码器为例, 原始输入视频帧经过两次下采样后, 使用HEVC编码器或者H.264/AVC编码器编码成基本层 (Base Layer, BL) 比特流。基本层的重构图像不仅用于编码基本层下一个视频帧的帧间预测, 还生成层间参考图像用于增强层1中相同时域位置视频帧的层间预测。同理, 增强层1的重构图像要用于该层下一个视频帧的帧间预测, 还用于增强层2相同时域位置视频帧的层间预测。增强层的编码方法除了和基本层的一样之外, 还使用了层间预测技术。为了提高增强层的编码效率, SHVC使用较低参考层已经编码好的数据用于层间预测, 包括重构图像和运动参数。

2.2 SHVC中的层间预测机制和采用过程

SHVC编码当前增强层图像时, 可将参考层相同时域位置的重构图像用作层间参考图像。层间参考图像的生成, 主要包括三个模块:重采样、色域映射以及运动域映射。

原始输入视频通过两次下采样得到基本层, 通过1次下采样得到增强层1, 这样基本层和增强层之间以及不同增强层之间的视频图像分辨率是不同的。为了给高层提供层间纹理预测, 就需要为低参考层的重构图像进行重采样。在重采用中, SHVC首先对低参考层的重构图像进行上采样, 然后对参考图像的水平和垂直方向进行填充, 生成和当前增强层相同分辨率的层间参考图像。

参考层可能与增强层采用不同的颜色空间表示。为了提供层间预测, SHVC根据基于颜色的映射表使用颜色插值方法将颜色的三基色从参考层转换到增强层, 提高了色域可伸缩的编码效率。在生成层间参考图像时, 若需要上采样, 色域映射过程应在上采样之前进行。

利用运动域映射可以推导出层间参考图像的运动域, 以提高当前增强层的编码效率。在运动域映射过程中, 层间参考图像的运动域是基于较低分辨率的参考层重构图像的运动域获得的。层间参考图像的每个16x16块的运动参数和预测模式是根据参考层重构图像中相同位置块的相应运动参数和预测模式进行推导得到的。

SHVC中的层间预测机制包括有层间纹理预测和层间运动预测。对于当前增强层中高运动场景视频帧, 若其对应基本层采用帧内预测编码, 则增强层可以采用层间纹理预测方法来减少预测残差。另外, 增强层和参考层之间的运动信息存在一定的相关性, 则可以通过层间运动预测, 在层间参考图像的运动参数的基础上, 预测当前增强层的运动参数。

3 基于HEVC的精度扩展

3.1 基本知识

HEVC支持4∶2∶0的色度格式, 在水平和垂直方向其色度信息是亮度信息的一半。虽然这种色度格式已经可以满足用户娱乐的需求, 但是随着视频会议、电视广播、因特网流等应用的出现, 这种4∶2∶0的色度格式已经远远不能满足这些应用对编码的要求。在这种情形下, 我们就需要4∶4∶4色度格式或者4∶2∶2色度格式, 其中4∶2∶2格式是在水平方向其色度信息是亮度信息的一半, 而在垂直方向其色度信息等于亮度信息。显然, 这和拥有高效率的HEVC标准所支持的4∶2∶0格式发生冲突, 因此, 为此需求制定了基于HEVC的精度扩展。所谓的精度扩展涉及到两方面:一方面是色度格式的扩展, 由HEVC所支持的4∶2∶0格式, 扩展到精度扩展中的4∶4∶4格式和4∶2∶2格式;另一方面是比特深度的扩展, 将表示视频序列亮度和色度矩阵中每一成分 (Y、Cb或Cr) 的比特从8比特扩展到10比特以上。HEVC精度扩展以一种灵活的方式在多种网络环境中编码视频, 满足了各种应用对图像编码的要求, 并且增强了网络环境中的鲁棒性。

然而随着无线局域网、远程教育以及屏幕共享等新兴应用的出现, 对色度格式和比特深度的扩展并没有达到很好的编码效率。因此, 在基于HEVC精度扩展的基础上, 为了满足这些应用中对计算机产生的屏幕图像等非连续色调内容和由相机捕捉到的连续色调内容的编码需求, 提出屏幕内容编码 (screen content coding, SCC) 。不同于由相机所捕捉到的连续色调内容, 屏幕内容有一些新特征:对比度高的文字、大的运动以及重复的模式等。屏幕内容和由相机捕捉到的内容之间特征的不同, 使得编码方法也随之不同。SCC不仅要对文字和图片等的边缘处高频成分进行无损编码, 而且还要同时满足编码效率的要求。

3.2 SCC中的关键技术

3.2.1 帧内块拷贝 (Intra Block Copy, IBC)

屏幕图像包含了大量重复的模式, 为了充分利用屏幕内容的相关性, 帧内块拷贝技术成为屏幕内容编码过程中一种非常重要的技术。为了更好的理解IBC技术, 下面分三部分进行介绍, 分别是:IBC块矢量搜索、IBC块矢量预测和IBC块矢量差异 (Block Vector Difference, BVD) 编码。

IBC的块矢量搜索, 就是在编码时对每一个编码单元 (Coding Unit, CU) 进行块匹配找到最优的块矢量。在搜索过程中, 首先要进行局部区域搜索, 然后进行全局搜索。全局搜索时仅仅搜索8×8和16×16大小的块, 对于16×16大小的块只进行一维搜索, 也就是说, 搜索仅仅是水平或是垂直的, 对于8×8大小的块进行搜索时采用了基于hash的方法。

在进行IBC块矢量预测过程中, 最关键的就是创建预测的候选列表。首先, 从空域相邻的块中选取两个候选者, 如图1所示的a1和b1。然后, 从当前编码树块 (Coding Tree Block, CTB) 中选取最近采用Intra BC编码的2个块矢量作为候选。再从当前CU的 (-2x CU_width, 0) 和 (-CU_width, 0) 位置, 这里CU_width表示一个CU的宽度, 分别选取这两个CU的运动矢量的水平值作为候选。最后, 从以上的六个候选中, 选取前两个可用且不同的候选作为块矢量预测。

BVD的计算方法如下:

其中BVD_x是BVD的水平值, BVD_y是BVD的垂直值, (BV_x, BV_y) 是IBC编码块的块矢量, (BVP_x, BVP_y) 是块矢量预测。

IBC技术是研究人员重点研究的技术之一。目前可以将IBC的研究方向大体分为两类:一类是在保证编码效率的前提下, 通过加快CU分割模式判决或者在满足某些条件下跳过IBC编码, 从而达到减少编码时间的目的;另一类是在保证解码时间不变的前提下, 通过改进IBC编码方法, 达到提高编码效率的目的。

在减少编码时间方面, 可以进一步把相关研究分为两种。一种是针对屏幕内容中存在的大量重复模式而进行改进的算法。例如基于BVD和CBF的快速帧内预测判决算法, 快速IBC搜索跳过算法。另一种是针对实时性高的屏幕内容应用而进行改进的算法, 例如基于边缘方向的CU分割算法, 基于熵和编码比特的快速CU分割算法。

在提高编码效率方面, 目前已提出一些相应的算法。基于线的IBC技术, 基本思想是要在比2N×2N更小的块分割层次上进行IBC, 该文章还提出一种翻转拷贝的IBC预测技术, 以更好的利用屏幕内容之间的相关性。用于SCC的帧内线拷贝算法, 给IBC技术提供了一种具有较好间隔尺寸的块分割结构, 首先沿垂直或水平方向将一个预测块分割成一个像素宽的行 (或列) , 然后从当前帧的重构像素中一行行 (或一列列) 进行帧内拷贝。

3.2.2 调色板编码

IBC技术是为了减少块与块之间的冗余, 而调色板编码技术是为了减少块中的冗余。调色板编码充分利用了屏幕内容编码块中颜色数少的特点, 调色板模式位于CU层面, 并且当一个CU中的像素可由一个有代表性的颜色集合进行表示时, 才会使用调色板模式。图2是一个调色板编码的例子, 调色板数目为4, 编码块中前三个样本的调色板索引值分别为2、0、3, 蓝色标注的样本表明不是一个常用的颜色, 在调色板中没有表示, 需要特殊标志。

调色板索引的编码是调色板编码中不可或缺的一个环节, 如图3所示, 可以沿水平和垂直方向来编码调色板索引。

结论

新一代视频编码国际标准HEVC及其扩展, 包括SHVC和基于HEVC的精度扩展, 都是由ITU-T和ISO联合成立的视频编码联合协作小组 (the Joint Collaborative Team on Video Coding, JCTVC) 制定的。

HEVC沿用了传统的基于块的混合补偿编码结构, 但是使用了一些不同于以往标准的重要技术。相比于上一代视频编码标准H.264/AVC, HEVC标准可以把视频内容的压缩效率提高很多, 甚至到50%以上, 从而提高视频内容的重构质量, 同时节省大量的网络带宽。随着应用需求的提高, 有必要制定SHVC和基于HEVC的精度扩展。目前, SHVC已经制定完成, 而SCC还在制定中。SHVC可以支持丰富的可伸缩特征及高的可伸缩编码性能, 能够满足对更高质量和更多视频内容日益增长的市场需求。

摘要：视频通信已经成为通信的主要方式之一, 视频编码是视频通信中一个非常重要的组成部分。近年来, 随着高清晰度电视、DVD、蓝光盘等设备的出现, 分辨率越来越高的视频得到广泛的应用, 高效视频编码标准 (High Efficiency Video Coding, HEVC) 正是为满足此需求而制定的。然而, 为了满足更多的应用需求, 需要对HEVC进行扩展, 主要包括可伸缩扩展和精度扩展。本文主要对HEVC扩展的基本概念、关键编码技术和研究热点进行了详细介绍。

关键词：视频编码,HEVC,可伸缩扩展,精度扩展

参考文献

视频通信技术的新突破篇7

业内专家普遍认为,此次向H.264High Profile的过渡是一项比以往出现的视频技术进步更大、更重要的突破,其意义堪比2003年从H.263向H.264过渡的价值。由High Profile获得的性能优势在任意带宽下都能保持一致。目前正在迅速普及的高清视频系统将是High Profile的最大受益者。不仅如此,包括CIF、标清、高清等各种视频标准均会不同程度的受益。

High Profile可以降低部署视频通信的成本

宝利通对High Profile的支持其价值体现在:能够有效地帮助采用视频的企业大幅降低网络资源的消耗。预算问题迎刃而解,企业可以更少的资源解决更多问题,从而减少或避免由于带宽增加所带来的成本问题。

High Profile的采用使原有的网络带宽需求减少50%。原来需要1Mbps的高清视频通话现在只需512kbps即可实现。而原来需要256kbps的标清通话现在只需128kbps就能解决问题。

High Profile消除了视频通信的技术瓶颈,使更多的企业能够更广泛地采用视频协作方式。那些担心因为增加视频应用会影响网络带宽的企业现在可以打消顾虑随时部署,而无需重新对网络进行设计和规划。

High Profile可以降低现有视频通信系统的成本

现有宝利通HDX?系统的用户只需将HDX软件升级到2.6版本,即可轻松过渡到High Profile。由于目前大多数视频通话仍采用512-768kbps速率,那么升级就意味着实现了从标清向高清视频的过渡。高清视频已被公认为提高生产力,并获得身临其境体验的双重利器。它有效地取代了面对面会议为企业节省差旅费用实现立竿见影的成本节约。

对于网管人员来说,High Profile吹响了一个大规模推广视频的号角:

·过去能够运行1000个视频通话的网络带宽现在足以支持多达2000个视频通话。

·由于所有HDX远程呈现系统都支持High Profile,其带来的优势在各种规模的会议室中随处可见。

·High Profile能够获得更高画质和更高扩展能力;满足企业不断增长的高清通信需求。

宝利通的H.264 High Profile技术普遍适用于网络中的视频应用。因此,它将在2010年进一步应用到更多的宝利通产品中,并为客户带来更多价值。

High Profile可以加速投资回报

High Profile的推出保持了宝利通解决方案与其它标准化系统的互操作性。升级到High Profile的宝利通HDX系统与其它采用High Profile的视频网络组件通信时,通常会选择使用High Profile。宝利通HDX继续支持传统视频系统通信中采用的H264Baseline Profile向下兼容,如VSX或第三方不支持High Profile的系统。因此宝利通High Profile的推出保持了视频通信的互操作性,保护了客户投资。

High Profile在系统扩容时提供了更多选择,可以选择部分升级IP网络或不升级。IP网络升级通常在总体部署成本中占有很大比重,而减少带宽需求的系统则可以节省这部分费用。前期成本的减少更可以缩短投资回报的周期。

High Profile是宝利通新增加的视频功能,不会影响客户已经拥有的功能。宝利通独有的Lost Packet Recovery™(丢包恢复™)技术,可与High Profile无缝协作,即使在相对恶劣的网络条件下,依然能提供卓越的视、音频品质。High Profile的推出对宝利通的内容共享技术-Polycom People+Content™也不会造成任何影响。

视频通信现状及其发展新趋势篇8

一、当前发展现状

1.1通信协议已更新到SIP

当前各大运营商视频通信所采用的协议主要是H.323协议, 不过随着视频通信在互联网上的应用不断发展, SIP因为其自身的诸多优势逐渐得到广泛的应用, 未来或将取代H.323协议。

1.2视频会议已逐步市场化

初期, 视频系统主要运用在政府机关或者大型企业。目前国内运营商都推出视频通信业务。与初期相比较, 目前系统主要表现在覆盖范围、标准化程度以及可扩展性等方面。用户无需前期的高额投入, 主要购买或者是租用终端设备, 就能享受电信级的服务。

1.3视频会议已逐步大众化

在国, 内各大运营商都开始瞄准公众及家庭用户, 推出中小企业以及个人和家庭用户适用的业务。

二、当前发展遇到的问题

2.1系统终端成本高

视频通信系统中, 终端具有重要地位, 但因其成本高, 从而对整个行业的发展具有一定的限制。因此, 当前面对的重要问题就是如何降低其成本。

2.2系统标准化程度还待完善

目前, 客户对视频通信的需求并不是仅停留在视频会议的阶段, 而是对系统的可管、可控等方面提出了更高的要求。为此, 很多的设备制造厂商都在推出管理支撑系统的设备, 却没用考虑不同厂商之间的互通方面。在这种情况下, 将导致视频通信系统与其它厂家的终端设备也存在兼容性问题。

2.3保障QOS力度还需提高

网络质量对于视频通信系统影响很大, 当前设备中普遍存在缺乏有效的故障诊断手段, 其中对一些网络故障的监测和对信令的跟踪能力不足, 导致用户无法对故障进行预断, 在故障产生之后, 不能够及时进行故障的定位, 导致运营商视频业务的开展收到很大的影响。

三、未来发展新趋势

3.1具有更适宜的系统网络

视频通信系统对承载它的网络要求很高, 目前的宽带接入承载方式多种多样, 以及接入环境存在差异, 导致接入网络质量存在存在一定差异, 为此提高终端对网络的适应性显得十分重要。视频设备制造商不光要采用高效压缩、最新的编码算法, 更加要重视设备对抗误码能力的提高, 通过采用先进的线路补偿机制和带宽处理机制来适应线路质量的变化, 进一步加强和改善设备的Qo S机制。

3.2视频系统更具智能化运用

智能化就是要充分挖掘抽取视频资源中的关键信息, 并利用这种信息为用户提供有价值的服务。智能化监控系统除了提供事前预警以外, 还可以将视频分析信息进行记录, 在事后取证时大大减少安伞人员搜索录像所需要花费的时间, 并提高录像记录对取证工作的帮助。

3.3更为丰富增值业务服务

目前的可视终端采用宽带IP网络作为承载, 大尺寸的LCD作为视频呈现手段, 使用高速处理及存储能力硬件作为平台, 具有支持下一代宽带业务的良好优势。此外, 互联网上随着视频新应用的不断推出, 用户往往希望不论在公众运营模或是在专营模式下, 都能够不断的体验新业务。这就要求相应系统平台具有提供增值业务的能力, 系统应支持开放的能力接口, 以利于第三方应用提供商灵活的业务开发能力实现快速的业务部署。

3.4移动视频成新亮点

随着4G网络的规模部署, 高带宽和智能终端的高压态势, 给视频系统提供了更具有广阔的运用空间, 更成为行政执法应对和规避风险的重要工具。

例如, 在重大事故或案件中, 现场的实时视频不仅仅可以传到公安指挥中心, 甚至直接传输到就近的巡逻车或有关人员手中的终端上。从公安部门的角度来看, 可以更好了解现场情况和制定应急措施。从行业用户的角度来看, 它能更好地保护他们的工作人员, 以及他们的财产。对于被抢劫的银行工作人员、被劫持交通工具的司机和面临校园突发事件的校长来说, 更灵敏的报警系统、实时的视频信息意味着更少的财产损失及人员伤亡。

四、结束语

近几年来通信环境发生了巨大变化, 视频通信也随之有较快的发展, 但是在发展中存在着一定的问题, 只有不断地摸索和完善, 其也是运营商以及设备商在激烈的竞争中生存的关键, 同时也是满足不同用户的使用需求。

摘要：视频业务已是人们工作生活具有意义的运用。本文描述了我国目前视频通信发展的现状和面临的问题, 同时分析了视频监控在数字网络中的应用趋势。

关键词：视频通信,发展,问题,趋势

参考文献

[1]支金龙.视频通信现状及未来发展趋势[J].通信世界, 2006年41期

[2]赵魏.视频通信的现状及发展趋势[J].城市建设理论研究, 2013年44期

应急通信中视频应用关键技术分析篇9

我国是多自然灾害,多突发事件的大国,因此应急处突对减少损失,维护社会安定有着重要的意义。在信息时代,应急通信在处理突发事件体系中也发挥着越来越大的作用。如今随着技术的飞速进步,无线移动图像传输在应急通信中的地位与日俱增,扮演着越来越重要的角色。本文通过重点介绍采用COFDM技术和H.264技术的移动系统在应急通信中需要关注的问题和相关解决方案,为应用通信更好地应用提供相关的建议。

2 应急通信的应用基本要求

无线应急通信系统需要独立于公众网络之外,打造出信息高速公路上的应急专用车道。在平时作为公众网络的补充,一旦发生应急事件,出现通信基础设施遭到破坏,或公众通信拥塞或瘫痪,既无法进行调度指挥,也无法保障政府决策与支持系统的信息传输畅通时,发挥信息专用网络的作用。在应对诸如反恐等重大突发公共安全事件时,通常需要创造不对称的通讯环境,在切断恐怖分子通信的同时,政府和公安人员仍然可以通过专网进行调度指挥,并通过无线宽带网络将现场视频图像传回指挥中心,及时掌握恐怖分子动向。图 1为典型的无线应急通信系统的示意图。

无线应急通信系统一般分为指挥调度中心、固定(移动车载)、单兵。调制方式通常为自适应,确保在可变带宽的情况下的通信流畅。通信方式目前基于IP技术的较为普遍。IP技术的引入可以提高指挥中心与一线警员的执行效率。指挥中心可以随时与一线警员多路、多画面进行视频会议,同时弥补了一线警员在取证、汇报现场信息等情况下的滞后性与盲目性,并可以实现各类IP终端接入系统,扩展了系统的应用范围。无线应急通信系统必须满足以下几个基本要求。

(1) 小型机动灵活性,常规情况下,系统是大区制的、广泛覆盖的,基站设备功能完善,可以满足公安、交警以及政府其它职能机关的工作要求。在特殊情况下,诸如地震、洪水、雪灾等破坏性的自然灾害面前,基础设施部分或全部受损,这时的无线应急通信设备需要具有小型化的特点,以便迅速运输、快速布设、节约能源,同时对设备适应环境能力有极高的要求。

(2) 移动便携性,应对突发事件,要求系统结构是由可携带的、可重新部署的或完全机动的设施组成。使指挥人员可以根据实际情况从容地应对各种应急场合。终端的隐蔽便携化,也使得一线人员可以灵活地收集具体现场的信息,以便指挥人员决策。

(3) 系统简单易操作互联互通性强,无线应急通信系统要求设备简单、易操作、易维护,能够快速的建立、部署、组网。操作界面友好、直观,硬件系统连接端口越少越好。在突发事件出现时,往往会出现多种保障设备,指挥人员需要汇总各类信息。采用IP模式的设备,所有接口标准化、模块化,并能兼容现有的各种通信系统,是确保系统发挥最大效果的基础。

3 COFDM传输技术

考虑到应急通信在使用中无线信道、使用设备可变的特点,本文重点介绍COFDM技术即编码正交频分复用技术在移动图传方面的特点。

3.1 COFDM技术

COFDM(coded orthogonal frequency division multiplexing),既编码正交频分复用的简称,COFDM技术的推出其实是为了提高载波的频谱利用率,或者是为了改进对多载波的调制,它的特点是各子载波相互正交,使扩频调制后的频谱可以相互重叠,从而减小了子载波间的相互干扰。COFDM每个载波所使用的调制方法可以不同。各个载波能够根据信道状况的不同选择不同的调制方式,比如BPSK、QPSK、8PSK、16QAM、64QAM等等,以频谱利用率和误码率之间的最佳平衡为原则。OFDM技术使用了自适应调制,根据信道条件的好坏来选择不同的调制方式。COFDM还采用了功率控制和自适应调制相协调工作方式。信道好的时候,发射功率不变,可以增强调制方式(如64QAM),或者在低调制方式(如QPSK)时降低发射功率。

正是由于系统具有以上特点,因而具备较强的非视距下高带宽传输能力,在无线移动图像传输中得到了广泛的应用,尤其是在楼宇密集的城市地区。

3.2 COFDM无线移动视频技术优点

随着图像编解码和无线数字调制技术的发展,无线数字图像传输成为目前的技术中坚。其基本结构均为视音频编码-无线信道数字调制-视音频解码,框图如下。

由图 2可见传输移动视频需要在移动情况下,处理好变化带宽和压缩编码的对应关系,确保在用户终端和指挥中心显示实时清晰的图像是无线应急系统可用的前提。在无线信道的地理位置移动可变、信号强度可变、电磁环境可变的情况下,采用COFDMA技术有以下优点:

1) 抗多径能力强:COFDM设备传输距离远,适合在城区、城郊、建筑物内等非通视和有阻挡的环境中应用。其多载波技术特点具备"非视距"、"绕射"传输的优势,在城区、山地、建筑物内外等不能通视及有阻挡的环境中,该设备能够以高概率实现图像的稳定传输,不受环境影响或受环境影响小。

2) 适合高速移动中传输:COFDM设备,它不需要任何附加装置,就可实现固定-移动,移动-移动间的使用,非常适合安装到车辆、船舶、无人机、汽艇等移动平台上。不仅传输有高可靠性,而且表现出很高的性价比。

3) 提供可用数据传输:载波带宽、信号强度、接收灵敏度、电磁环境匹配的情况下,系统速率一般大于2M bit/s,满足高质量视音频数据的传输。一旦使用条件发生变化,COFDM技术每个子载波可以自适应选择QPSK、16QAM、64QAM等调制方式,根据具体信道的参数,提供可变的匹配速率,配合H.264的编解码方式,系统可在最大限度上保持图像清晰流畅,不会出现采用无线微波或PAL制式的系统出现图像中断的现象。

4) COFDM具备优异的抗电磁干扰性能:COFDM具有对抗频率选择性衰落或窄带干扰及信号波形间的干扰性能的优势,其通过各个子载波的联合编码,具有很强的抗衰落能力。在单载波系统中(如数字微波,扩频微波等),单个衰落或干扰能够导致整个通信链路失败,但是在多载波COFDM系统中,仅仅有很小一部分子载波会受到干扰,并且这些子信道还可以采用纠错码来进行纠错,确保传输的低误码率。

5) 信道利用率很高:这一点在频谱资源有限的无线环境中尤为重要。当1MHz载波子载波数为1028时,系统的频谱利用率为3bit/s/Hz。

COFDM技术也有其局限性,其非视距通信能力是相对的、不是无限制的,而且其通信范围受制于基站的覆盖范围。

4 移动视频技术在无线应急系统中的应用分析

4.1 无线应急通信系统的特点决定了移动视频要具备如下能力

1) 图像传输信道的可靠性:

在发生重大突发事件,灾难性事件现场等,这种场合往往传输条件恶劣,干扰大,在这种情况下借助公共移动网络搭建图像传输系统,很难保证其可用性,所以,建设使用专用的图像传输网络是非常必要的。

2) 图像传输质量要求:

考虑到指挥决策需要,现场图像必须保证高清晰的图像质量,视频编码分辨率应不低于4CIF(704*576),帧率不低于20fps,并在高速运动中保证图像清晰流畅,这就要求必须使用效率较高的视频编码格式,如H.264。

3) 信道载波带宽要求:

无线频率资源非常有限,即使公安的图像传输使用的频率带宽也很有限(6-8M),而且考虑到多业务需要,因此在一定频谱带宽范围内通常还划分更小的带宽作为传输信道,所以,应该尽可能高效率地利用有限的频带资源。

4) 传输距离和移动性要求:

根据应急业务特点,图像传输距离通常会在百米到几十公里范围内,而且要求在高速移动下能够保证传输的稳定性。

5) 联网及安全性要求:

如果以独立形态存在的应急图像传输系统,其使用效能也只能限制在局部范围内。只有将该系统接入到指挥中心应用平台,才能充分保证视频信息与其他资源的互联互通,保证为各级指挥或相关部门所使用,真正做到快速反应,协同作战。并且系统安全性也非常重要,必须要考虑如何保证系统及接入网络的合法性,系统所传输信息的安全性。这样,才可以实现合法的信息进入合法的设备,保密的视频数据不会被非法盗取。

4.2 采用H.264技术是无线宽带应急通信图像编解码器理想的选择

H.264是一种高性能的视频编解码技术。它是由两大标准化组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。H.264技术可以很好地适应无线宽带通道的特点,与系统有效地结合。其具体优势如下:

(1) 具有较高的压缩效率:H.264编码视频流与H.263或MPEG-4Simple Profile编码视频流相比,平均可节省39%的比特率。通过引入一系列新特性,H.264的压缩率提升近1倍,大大节省了无线的传输带宽。目前,国内的H.264编解码器厂商可以在1.2Mbit/s的编码码率下实现D1(720×576)分辨率的连续清晰图像。

(2) 图象恢复能力强:H.264基于UDP即用户数据报协议,是OSI参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务,可实现图像即时恢复。由于受到遮挡及干扰,无线宽带系统经常发生无线链路中断的现象,在无线信号恢复后,编解码系统要能够以最快的速度恢复图像传输。H.264可以把关键信息分离出来,减小断流再恢复的同步时间,同时,H.264编解码器可以建立在UDP基础之上,能够快速重建链路,目前国内的编解码器厂商已经实现图像即时恢复。此外,在出现无线链路中断或误码率过高时,实现了画面停留在最后清晰的一帧上,在实现了在信号恢复之后,画面从接收到的清晰的一帧开始。H.264技术内置的多种错误恢复工具有利于解码端进行错误掩盖,误码超过一定阈值后跳过该帧,断流后则保持在最后一正常帧的静止画面,码流恢复后从第一个正常解码的IDR帧开始显示。

(3) 具有较强地抗干扰能力:系统中的摄像头有时会引入较大干扰,特别在低照度的环境中干扰对图像质量有非常大的影响。根据分析主要有两种噪声会影响视频质量,一种是相邻色素之间产生的伪颜色噪声,一种是由于信号强度而产生的泊松噪声(会影响物体的边缘清晰度)。H.264技术使用了高级图像预处理方法,能够减小低照度环境下噪点影响,并通过实时滤波技术的应用,使得在压缩之前就排除了信号中的干扰,压缩还原的图像有很大提高,同时也降低了传输码率。

(4) 网络适应性强:H.264包含一个内置的互联网协议适配层(Internet Protocol Adaptive Layer),所以,H.264可以被映射到任何固定IP、无线IP、存储装置或广播网络中,而这就是目前厂商都准备支持H.264的原因。H.264作为最新的视频编码标准,采取了一系列切合实际的技术措施,如视频编码层和网络提取层分离、封装NALUnits、指定参数集等提高了网络适应性,增强了数据抗误码的顽健性,从而保证了视频传输后压缩视频的Qos。

5 总结

无线宽带系统采用COFDM技术配合采用H.264标准的编解码器,可以适应复杂无线环境,经受住了实战的洗礼。已经在城市应急救灾、突发紧急状况中大量地使用。目前,国内的有关科研单位及生产厂家已经开始着手较窄带宽下适合无线移动传输的基于H.264技术的高清编解码器的研发工作。随着技术的不断发展、整体结构的不断完善、算法的不断优化以及芯片处理能力的不断提高,相信不久便可以看见H.264编解码器在较窄的无线带宽下实现高清品质的图像传输。图 3为典型的系统应用的示意图。

图 3为示意基于移动视频应急处置的过程,该方案以移动视频采集模块为中心,通过手持单兵、车载单兵作为移动监控端多媒体终端,采集到的移动视频实时地以H.264编码方式通过无线网络传送给指挥中心,如果需要,指挥中心可以将相关数据传送到远程指挥中心。

实验结果显示,在无线信道、接收电平等变化的情况下,传输速率在100kbit/s-2Mbit/s之间,系统可较为流畅地提供双向图象,实现指挥中心与单兵、车载之间的图像传输及单兵车载之间的图像传输,可以较好地满足日常应急事件处置的需求。

该系统实现了移动视频采集,视频信号的高效编解码,视频信号的无线网络传输、移动视频管理、查看等功能,使得基于无线传输的移动视频技术在应急系统中发挥了相应的作用,从而摆脱了传统视频对于地理位置的束缚,提高了整个视频监控模块的移动性、实时性、可控性和灵活性,既可以为突发事件提供独立可用的系统,也可以为各类行业用户及公众场所提供与其他实时全方位监控相结合的实用的解决方案。

随着无线宽带系统发展和H.264等编解码技术的提高,该系统会提供速度更快、质量更高的移动视频传输功能,有着非常广泛的应用前景。

摘要：无线应急通信的核心是无线信道的可用性,如何在突发时间、高速移动、复杂环境下提供稳定可用的系统是应用部门关注的重点。本文通过重点介绍采用COFDM技术和H.264技术的移动系统在应急通信中的应用,提出了在可变信道、可变环境、可变速率下需要关注的问题和相关的解决方案,更好地为应急通信提供相关建议。

关键词：无线应急通信,COFDM,H.264

参考文献

[1]许路,陈光.H.264在动中通应急图像传输中的应用[J].通信世界,2008,43(1).

[2]侯志强,胡瑞敏,王中元,周楚.应急指挥系统中移动多媒体技术应用与瓶颈[J].电声技术,2011,35(11):49-51.

[3]王海涛.应急通信发展现状和技术手段分析[J].电力系统通信,2011,32(220).

音视频通信论文篇10

随着语音通信度过一个让人惊羡的高峰期后，谁会主宰下一个通信时代？当时间的标尺迈过2007年这个刻度的时候，各大IT巨头用实际行动回答了这个问题：视频通信！

2007年4月3日，思科首席开发官Charlie Giancarlo在“思科2007全球合作伙伴峰会”上认为，视频通信的发展，将驱动下一代服务提供商的成长。而在之前的3月27日，全球领先的视频系统、软件和服务供应商腾博视通首席执行官贺富德（Fredrik Halvorsen）来京，推介其能创造高度协作性、具有面对面会议体验的腾博视通视频会议解决方案。通过现场的视频工具，就令远隔重洋的与会者如同置身会场，坐在会议桌对面和本地的与会者进行讨论。

而在此前，IT巨头企业微软和思科、惠普都推出了针对视频通信市场的计划。

俗话说无利不起早！据了解，这些IT巨头对视频通信市场虎视眈眈，无非是看到了这一市场潜藏的巨大财富。据市场咨询公司的研究报告显示，2010年美国的互联网视频服务收入将达到70亿美元以上。中国市场在2010年互联网视频收入也将达到34亿美元。

在这一新兴市场面前，谁能率先获得成功？

视频通信的春天来临

视频通信从沉默到引人注意，经历了一个曲折而漫长的过程。从1993年到1997年，当时的中国电信陆续建立起一套专用的视频通信，除了满足自己的通信需求外，还向社会提供这方面的业务，只不过使用者需要到中国电信的会议电视室来才能使用。而且当时这套系统话音图像质量非常模糊，用得起这个业务的也只是很少的单位。

这一问题严重削弱了用户对它的兴趣。现在，一切问题都已迎刃而解。据了解，视频通信能够让企业用户与同事、商务伙伴的沟通延伸到每个人的桌面。无论是企业希望员工兼顧生活和工作的时候，还是遭遇SARS 或禽流感这样的突发疫情，令员工无法在办公室工作的时候，都可以让员工在安全场所为企业办公。

这一切，在腾博视通公司的演示现场得到验证。会议桌前， 50英寸的大屏幕等离子显示器，图像质量很高，对方脸上胡子茬、甚至手中报纸的字迹清晰可见。纽约、伦敦、挪威、中国上海4方的人说话感觉不到延迟，仿佛大家就在一个房间里，坐在一张大桌子旁开会。与会者的手势、皱眉、微笑、体态尽收眼中。

该公司首席执行官贺富德表示：“视频通信在今年有突飞猛进的发展。商业品质的个人视频系统的推出为视频通信的应用开拓了会议室以外的市场。这些产品将公共网络的普遍性和使用者的易用性相结合，令视频电话如使用电视遥控器一样简单，而费用则像发一封电子邮件那么便宜！”

现在，视频通信不仅为电信企业创造机会，而且催生出更广泛的商业机会。以流媒体为核心的视频网站如雨后春笋般涌现，正在形成IP时代新的视频通信价值产业。以美国市场为例， 2010年美国的互联网视频服务收入将从2006年大约10亿美元增长到70亿美元以上。对于中国市场，分析数据也十分乐观，预计2010年互联网视频收入达到34亿元，较2006年复合年增长率60%左右。分析显示，全球移动视频服务收入将会在2009年达到56亿美元。

在日本，很多企业已经变成了全球化公司。由于地域跨度非常广泛，所以都采用视频会议系统，这对公司而言，能够大大增强核心竞争力。如日本三菱公司，前一段时间仅为部署日本本土公司分部，就采购了上10亿美元的产品。

据IDG、WainHouse等国际权威研究机构预测，在2002年~2007年期间，中国视频会议市场将以29%的累计年均增长率增长，该设备市场销售额在2007年将达到2.74亿美元。到2008年，全球视频会议系统市场的销售收入将从2003年的大约5.30亿美元增长到近11亿美元。视频通信正成为IT行业的新增值点。

客户的疯狂进入，产业的巨大前景，正诱使更多的企业进入这一市场，也预示着视频通信这一产业的春天已经来临。

争斗伊始

俗话说“眼见为实”。视频通信与语音通信相比，更真实也更自然！这一优势成为IT巨头参与的兴趣。

《IT时代周刊》记者在采访中发现一组有趣的现象：人们55%的有效信息来自于面对面的视觉，38%依赖于语音，而只有7%依赖于内容。而从通信的发展来看，从电报、到话音、到图像、到生动的视频和流媒体，这一通信变迁的轨迹也在证明一个逻辑，视频通信应该是最具生命力的通信方式。正是这一态势，促使各方开始抢夺这一市场。

2006年10月，思科推出了名为网真的视频会议产品。这款产品能够将视频会议的质量提高到一个新水平，使与会者能够感觉到他们是真正地坐在一个房间内开会。

尽管思科现在推出的视频会议产品面向大企业，但思科计划将它整合在消费者机顶盒产品中。这意味着无论是家庭中的老奶奶还是公司的老总，在进行视频聊天的同时还能够与喜欢的人保持联系。思科首席执行官钱伯斯曾表示，他预计未来5年内视频会议市场将带来10亿美元的销售收入。

对思科的大举进入，另一IT巨头微软也毫不示弱，紧接着进军视频领域。据国外媒体报道，在推出测试版视频站点Soapbox一周后，微软MSN的官员访问了Revver位于洛杉矶的总部。据了解二者谈判情况的人士称，MSN在考虑是否能够将Revver的技术和员工整合到Soapbox中。业界人士认为，微软此举急于进入视频共享领域。

而除了思科、微软此举，另一IT巨头惠普也从来没放弃过在这一领域内的奋斗。

2007年1月，惠普科技与视频会议厂商腾博(TANDBERG)视通公司宣布结成策略联盟，将结合双方分别在网真(Telepresence)与视频会议的优势，共同为消费群提供高质量视觉沟通体验。通过这项合作，企业可将惠普Halo协同作业工作室的融入式网真体验与腾博得大会议室以及基于桌面的系统协同使用。而与惠普合作的腾博(TANDBERG)视通公司，本身就是视频通信市场的领军企业。

据权威咨询机构 Wainhouse 的研究统计，目前腾博视通在全球的市场份额已超过 37%，其用户群涵盖了财富 500 强企业的前 100 强中超过三分之一的企业、世界 25 大银行中的 21 家银行、世界 25 大经纪公司的 17 家公司，超过半数的全球著名制造企业，其中包括德国大众、壳牌、英特尔、Google等世界知名企业，在业界享有盛名。

而现在，在中国已有超过 500 家的企业和机构在使用腾博（TANDBERG）视通的视频通信解决方案，其中包括中国电力投资集团公司、水利部、国家开发投资公司、新华社、中国农业银行、中国银行、宝钢集团等等。

而今随着这些IT巨头的加入，他们在视频领域势必将拼得头破血流。

胜败取决于价格

惠普、思科和腾博视通在视频会议通信市场上的角逐，没想到最后决定成功的因素，却是价格因素。

思科推出网真向视频领域进军的策略遇到了分析人士的怀疑。Forrester Research的分析师埃伦向《IT时代周刊》表示：“我知道钱伯斯和思科的其他官员对这一技术非常激动。远程呈现技术确实很酷，但价格太昂贵了，普通大众无法利用它享受虚拟会议的好处。”

思科公布的视频会议产品有2个版本：TelePresence 3000的售价高达299000美元，而且要求有10Gbps的带宽，每个月的连接费用高达3000~5000美元；精简版产品Cisco TelePresence 1000的售价约为79000美元。

但是，与惠普等其他公司的类似产品相比，思科的视频会议产品还算是便宜的。惠普一年前推出了Halo视频会议产品，售价高达425000美元，惠普为客户管理它的价格为每月18000美元。

与这些对手相比，腾博视通公司却将产品价格下调了三分之二，使得视频产品的价格与台式电脑、高端 PDA 和 3G 电话相差无几。以此引诱更多的桌面及个人用户、中小企业使用视频通信系统。

埃伦说，毫无疑问，惠普的解决方案更昂贵。思科的产品要便宜一些，它们能够更好地与思科的其他产品进行集成，但是，我仍然认为它适用于企业官员，而不是普通员工。但思科与AT&T等合作伙伴坚称，视频会议硬件产品和服务物有所值。企业能够降低旅行费用，提高运营效率。AT&T负责新兴服务的副总裁乔伊说，他支持这种观点。他说，企业每月的旅行费用高达数十万美元，即使只减少一部分也意味着巨额资金的节约。

现在，思科还计划将这一技术用于消费者产品中。马辛说，在未来2年内，思科将在机顶盒技术中整合远程呈现技术。

无线语音通信及视频监控系统设计篇11

关键词：视频监控,语音通信,语音广播,自适应差分脉冲编码调制,离散余弦变换

0引言

随着电子技术与计算机技术的发展, 视频监控主要经历了3个发展阶段:本地模拟视频信号监控、基于PC的数字化视频监控、基于嵌入式的网络数字视频监控。本地模拟视频信号监控系统由于结构复杂, 可扩展性差, 容易受现场条件限制, 逐渐被淘汰。基于PC的数字化视频监控系统采用网络传输, 不受布线限制, 能够实现远距离传输, 可靠性也大大提高, 但其前端视频信号采集、压缩和通信结构复杂, 成本高, 难以应用于灵活性要求高的环境。基于嵌入式的网络数字视频监控系统将摄像机输出的模拟视频信号通过嵌入式视频编码器直接转换成IP数字信号, 性能更稳定, 且便于安装、维护, 易于实现系统的模块化设计, 但目前的监控系统只有视频监控, 缺少语音通信[1]。鉴此, 本文提出了一种基于ARM的无线语音通信及视频监控系统设计方案。

1系统总体设计

基于ARM的无线语音通信及视频监控系统由监控终端和监控中心组成。监控终端位于监控现场, 采用ARM9系列芯片S3C2440嵌入式微处理器作为核心处理器, 由CMOS摄像头、语音芯片、TP- Link无线网卡等组成。监控终端完成音频信号的采集与编解码、视频信号的采集与编码、数据的无线传输等功能。监控中心是一台连入局域网的PC机, 负责整个系统的协调与控制, 完成与监控现场进行点对点语音通信、视频监控、报警处理等功能。

2系统硬件设计

系统硬件主要分为核心板和外围扩展电路板2个部分。核心板主要包括2 MB NOR FLASH、 256 MB NAND FLASH、64 MB SDRAM、晶振、电源;外围扩展电路主要包括摄像头模块、USB接口、 LCD显示模块、音频模块、摄像头辅助照明模块等, 如图1所示。

3系统软件设计

系统软件结构如图2所示。通过PC机进行功能选择, 选择结果以控制参数的形式发送到监控终端。可选择的功能包括视频监控、语音广播、点对点语音通信。在视频监控功能中, 由OV9650CMOS传感器摄像头采集监控终端图像数据, 该数据通过相应接口输入ARM9[2-3];处理器对图像数据进行JPEG编码压缩, 处理后的数据通过局域网发送到监控中心PC机上;PC机将接收到的编码数据进行JPEG解压缩, 最后将获得的图像及数据进行显示。在点对点语音通信功能中, 监控中心与监控终端需要同时完成语音数据的编码与解码, 采用自适应差分脉冲编码调制 (Adaptive Differential Pulse Code Modulation, ADPCM) 编解码算法。在语音广播功能中, 监控中心与监控终端的网络通信通过Windows Socket通信技术实现。

3.1视频监控

在ARM端, 视频压缩采用C+ + 语言实现。在S3C2440内部的camera接口有2个DMA通道: 预览DMA、编码DMA。这2个DMA在AHB总线上是分离的, 可以同时独立运行。预览DMA通道支持预览缩放、镜像、RGB格式输出, 编码DMA通道支持视频模块的镜像、旋转、YCrCb格式, 支持服务器对视频压缩比的设置。

摄像头P通道采集的图像格式设为RGB 5:6:5, 为了调试方便, 调用Display_Cam_Image () 函数在LCD屏上输出预览图像。由于P通道预览视频比较简单, 直接在驱动函数视频中断线程中完成。摄像头C通道采集的图像格式为YCrCb420。对C通道YCrCb格式的数据进行处理, 首先需要将该数据从内核中提取出来, 传递到应用程序开辟的空间中;然后采用基于离散余弦变换 (Discrete Cosine Transform, DCT) 的视频压缩算法对YCrCb格式的数据进行压缩, 流程如图3所示。

3.2音频通信

音频数据的采集和播放分别用Record () 和Display () 函数实现。音频的循环采集和播放是由DMA实现的, 但音频编码和解码是由CPU实现的, CPU占用率较高, 因此, 将解码和编码放在2个线程中执行[4-5]。采用ADPCM算法压缩采集到的音频信号。语音通信流程如图4所示。

3.3 Socket通信的实现

(1) 控制命令和重要数据的传输采用基于TCP的流式套接字编程。

(2) 语音、视频数据帧的传输采用基于UDP的数据报套接字编程。

4系统测试

将3个装载同样系统与程序的监控终端, 通过TP-Link、无线路由与PC机组成一个局域网, 再为3个系统分配不同的IP地址, 进行如下测试:

(1) 选择对3个监控终端进行视频监控, 可以观察到PC机上显示的视频图像较清晰流畅。

(2) 选择对3个监控终端进行点对点语音通信, 可通过耳麦与监控终端进行较清晰的语音通信。

(3) 选择语音广播功能, PC机与所有监控终端同时通信, 监控终端可以通过耳机听到PC机控制人员发出的语音命令。

5结语

基于ARM的无线语音通信及视频监控系统采用嵌入式Windows CE操作系统进行音视频的采集, 对数据进行压缩处理后, 采用TCP/IP协议, 通过无线局域网将数据传输给监控PC机。测试结果表明, 该系统实现了清晰的语音通信和流畅的视频图像监控, 具有集成度高、可靠性好、成本低的优点, 可满足复杂环境下的监控要求。

参考文献

[1]韩观振.基于ARM的无线视频流媒体传输系统的设计与实现[D].吉林:吉林大学, 2011.

[2]杨辉, 刘海龙, 高子洁.基于ARM及Windows CE6.0的塔机安全监控系统[J].计算机测量与控制, 2012, 20 (1) :78-80.

[3]李尚柏, 钟睿, 粟思科.基于ARM的嵌入式Windows CE系统高级开发技术[M].北京:清华大学出版社, 2011:8-10.

[4]郭欣佳.基于ZigBee的语音通信终端系统的设计与实现[D].武汉:武汉理工大学, 2012.

[5]童林.基于ZigBee的区域无线控制系统[D].合肥:中国科学技术大学, 2010.

【音视频通信论文】推荐阅读：

音视频IP化论文01-27

音视频播放01-20

音视频设备07-08

数字音视频10-22

音视频流11-11