T-DMB标准

2024-06-05

T-DMB标准(共5篇)

T-DMB标准 篇1

1 概述

由于移动电视特殊的接收环境,压缩后视音频数据流在无线信道上传播时不可避免地会产生误码。由于目前大多数的视音频编码标准都采用了变长编码技术,误码不仅影响出错数据的正常译码,同时还会影响到与之相关的数据的译码,造成错误扩散,严重影响移动电视终端的视音频解码质量。针对以上问题,笔者以T-DMB标准[1]中的视音频编码为基础,首先从编码端的角度分析了T-DMB系统的容错特性,在此基础上总结了基于解码端的视音频错误隐藏(Error Concealment)技术。

T-DMB系统[1,2]是在DAB系统基础上发展而来的,其视音频业务采取TS流的组织方式,图1中给出了T-DMB系统视音频业务的处理流程。

对编码后的视音频数据,首先使用MPEG-4同步层(synchronization layer)数据包格式进行封装,进而把同步包复用到MPEG-2 TS传输流中,最后DMB系统为TS流添加前向纠错保护,并以流模式方式复用到DAB主业务信道中。

2 T-DMB系统信源编码

2.1 音频压缩编码

音频业务可采用MPEG-4 ER-BASC和MPEG-4HE AAC V2两种编码方式,目前国内试播的T-DMB系统均采用MPEG-4 HE AAC V2压缩编码标准。该压缩编码标准融合了MPEG-4 AAC-LC、频带复制(Spectral Band Replication,SBR)和参数立体声(Parametric Stereo,PS)3种技术[3],是目前压缩效率最高的音频压缩编码标准:

1)MPEG-4 AAC-LC:为MPEG-4高级音频编码(Advanced Audio Coding,AAC)的低复杂度(Low Complexity)档次。它充分利用了人耳的听觉特性,利用一系列的工具来降低音频的主观冗余度,这些工具包括滤波器组(Filter Bank)、时域噪声整形(Temporal Noise Shaping)、强度立体声(Intensity Stereo)编码、M/S立体声(M/S Strereo)编码、量化、无失真编码和知觉噪音代替(Perceptual Noise Substitution)[4]。

2)SBR:利用音频信号中低频部分与高频部分之间的强相关性,使用低频到高频的变换方法来获得对原始输入信号高频部分的替代。传输时,就无须直接传输音频信号的高频部分,只需在AAC编码后的比特流中加入小部分的SBR控制信息来保证高频部分的重构[5,6]。

3)PS:利用立体声信号声道间的相关性,编码过程中仅编码单声道信号,同时提取出声道间相关性参数,在解码器端利用相关性参数和单声道信号就能重建立体声信号[6]。

2.2 视频压缩编码

视频业务采用MPEG-4 AVC/H.264压缩编码标准的基本档(Baseline Profile)。H.264采用了一系列先进的编解码技术,如帧内预测、帧间预测、整数变换、基于上下文自适应的熵编码等,使得在同等的带宽条件下,它的视频图像质量超过了以往的任何编码标准。

1)帧内预测:H.264使用了多种不同的帧内预测方法,最大程度地减少了图像的空间冗余信息,就亮度信号而言,帧内预测可分为4×4和16×16两种预测方式,其中4×4方式有9种可选的预测模式,16×16方式有4种可选的预测模式。

2)帧间预测:帧间预测利用已编码视频帧/场和基于块的运动补偿的预测模式。与以往标准帧间预测的区别在于块尺寸范围更广,且具有亚像素运动矢量的使用及多参考帧的使用等。

3)整数变换:采用一种4×4整数变换来对帧内预测和帧间预测的差值数据进行变换编码。与以前视频编码标准相比,减小了块效应的不良影响,同时又提高了运算速度。

4)熵编码:在H.264的基本档次中对于残差数据采用基于上下文的自适应变长编码方案进行编码,而对于辅助信息(如预测模式、运动矢量等参数)则采用指数哥伦布编码方案。其特点在于编码器能够根据已经传输的变换系数的统计规律,自适应切换码表,提升了熵编码的压缩效率。

3 基于编码端的容错工具

3.1 传输层容错工具分析

CRC校验:T-DMB标准将封装后的视音频数据打包复用到MPEG-2的TS流中,其中每个188 byte的包都有4 byte为CRC校验部分。在接收端,可以通过CRC校验来判断接收到的包是否存在误码,为后续是否采用相应的容错算法提供依据。

前向纠错编码(Forward Error Correction):T-DMB标准使用RS(204,188)码对MPEG-2 TS流进行编码,然后再进行卷积交织。每188 byte的TS包经过RS编码变成204 byte的包,其中有16 byte是纠错编码,提高了T-DMB系统的抗误码性能。经过RS编码之后,每隔11个RS编码的数据包作一次卷积循环,这样就可以把在时间域中突发的错误分散在各个部分,减少了连续错误出现的概率[7]。

3.2 AAC音频编码容错特性分析

AAC-LC编码算法的固有特性,在一定程度上减轻了误码对解码质量的影响,主要表现在以下几个方面[8]:

1)以帧为单位的编码结构,相邻帧之间的编码相互独立,没有共用的编码信息。因此,如果一帧存在误码或丢失,并不影响到其余帧的解码。

2)时频变换时采用修正的离散余弦变换(MDCT)运算,在变换前时域有50%的重叠区间。解码重建时域信号时各相邻解码帧之间有一个重叠相加的过程,即取前一解码帧的后半部分与当前解码帧的前半部分相加,最终得到一帧的音频时域采样信号。因此,一帧的音频时域信号,其信息分布的两个相邻的编码帧中,若解码过程中前一帧因误码丢失,由后一帧解码出的信号中与正确信号的相差不会太大,如果持续时间较短,主观听觉上的失真不会太明显。

3)进行MDCT时所用的窗函数在边缘部分逐渐接近于零值,因此,若有多个编码帧丢失,解码后丢失段后与丢失段前的信号会有一个渐强和渐弱的过程,避免产生明显的听觉噪声。

此外,在MPEG-4 AAC标准中还引入了专门的容错工具,这些工具包括虚拟霍夫曼码表(Virtual Codebook)、霍夫曼码字重排(Huffman Codeword Reordering)和可逆变长编码(Reversible Variable Length Coding)[8]。这些工具可用来进行错误检测和防止误码扩散,但在现行T-DMB标准中使用的AAL-LC档次中并未使用以上3种容错工具。

3.3 H.264视频编码容错特性分析

H.264作为最新的视频编码标准,采取了一系列切合实际的措施,提高了压缩数据的抗误码性能[9],在T-DMB标准中涉及到的容错工具主要表现在以下两个方面[10,11]:

独立分区解码:在编码时,图像帧各部分被划分到多个片(slice)结构中去,每个slice都可以被独立解码不受其他部分的影响。

参数集:H.264把解码所需的一些关键信息分离出来,统一到相应的参数集中传输。通过重复发送等手段,增加了解码关键数据可靠到达的机率,提高了系统的容错能力。

此外,H.264标准中的容错工具还有任意的片排序、灵活的宏块排序、冗余片编码、数据分割、多参考帧、帧内编码块更新和SI/SP帧切换。这些工具有的在H.264扩展档次中使用,如数据分割和SI/SP切换。有的需要和反馈信道一起联合使用,如多参考帧和帧内编码块更新。

4 基于解码端的错误隐藏

错误隐藏技术是一种基于解码端的容错工具,不需要编码端添加冗余信息。它利用信号本身的各种相关性,利用已正确解码的部分信息来修复丢失信息,尽可能地提高视音频的播放质量。

4.1 音频错误隐藏技术

音频错误隐藏技术利用声音信号的短时平稳特征,结合人的听觉特性,掩盖掉因误码而产生错误的解码数据,提高音频的回放质量[12,13],主要包括以下3类方法:

1)插入(Insertion)技术

插入技术是指在丢失帧处插入一个简单的波形来隐藏丢失帧的方法。常用的方法有静音替代、噪声替代和包复制替代。这类方法实现起来比较简单,对丢失帧持续时间较短且误码率较小情况下的信号效果较好。

静音替代:静音就是简单地用静音段来代替丢失帧处的波形,以维持帧之间的时序关系。

噪声替代:用随机产生的背景噪声信号来替代丢失信号。这种方法利用了人脑下意识用正确声音修复丢失波形的能力,与静音替代法相比,噪声替代能给人带来更好的主观听觉感受。

包复制替代:将丢失帧前正确接收的音频信号复制到该丢失帧中,在此基础上,可以通过逐渐减弱复制的包来改善主观质量。这种方法的计算复杂度很低,性能也不错。

2)插值(Interpolation)技术

插值技术是指在丢帧处用与其相似的波形填充。这种技术相对插入技术比较复杂,它必须利用丢失帧周围的数据对丢失帧进行估计,然后用最相似的波形替代丢失波形,所以比插入技术带来更好的主观感受。

波形替代:通过在丢帧处周围的波形中寻找与丢失帧波形相似的一段信号,并对其进行加工来填补丢失波形。一种有效的实现方式是通过模式匹配获得重建波形[14],文献[15]在此基础上,提出了一种基于基音检测的波形替代方法,首先通过峰值检测计算基音周期,然后根据基音周期对该帧进行清浊音判断。如果是清音,则用丢包前最近的波形替代,否则用丢包之前长度为基音周期的一段适合的波形来替代。

时域修正[16,17]:利用波形替代方法重建的丢失帧与相邻帧之间相位存在突变,文献[17]中介绍的时域修正技术用丢失帧两侧的波形向丢失帧方向延展来填补缺口,避免了边界的相位不连续现象,在丢帧接合处听不到“咔嚓”声和爆破声,听觉效果好于波形替代法。

3)基于模型的方法

该方法首先对音频信号进行建模,目前常用的方法有基于自回归(Auto Regressive,AR)模型[18]的方法和基于正弦模型的方法。

基于自回归模型的方法将声音信号看作是激励信号通过一个全极点系统的输出结果。该类算法首先确定自回归模型的阶数,然后利用丢失帧周围正确接收的数据得到模型参数和激励信号。最后用将激励信号通过该模型得到修复信号。

文献[19]利用丢失帧左右两侧的信号来估计模型参数,降低了AR模型对信号平稳性的要求,但只有当模型阶数接近差错数据长度时才能取得较好的处理效果,所以运算量大,延迟时间长,当阶数降低时,重建帧中央会出现明显的功率衰减。针对以上问题,文献[20]对AR模型的激励源进行了扩展,克服了阶数太低引起的功率衰减问题,取得了较好的效果。

基于正弦模型的重建技术[21]将声音信号看成是一系列正弦信号的合成,在解码端,利用正确接收的数据,计算出这些正弦信号的幅度、频率和相位信息,最后利用这些信息重建丢失帧信号。

基于模型的方法在修复效果上明显比其他方法要好,但该类方法计算量大,延迟时间长,解码过程中需存储部分已解码的音频数据,系统开销较大。

4.2 视频错误隐藏技术

视频错误隐藏技术是利用视频信号在空间和时间上的相关性以及人眼的视觉系统特性,对发生错误的图像区域参考已正确译码的数据进行重建以提高图像质量。

视频错误隐藏技术一般可以分为以下两类:

1)时间域错误隐藏技术

时域错误隐藏技术主要利用帧间冗余信息对丢失块内容进行恢复[10,11]。在这个过程中,运动矢量起着非常重要的作用,通过它可以在参考帧找到与当前块内容相似的块。按其有无使用运动矢量,时域错误隐藏可以分为无运动补偿的时域掩盖和有运动补偿的时域掩盖。

无运动补偿的时域隐藏不使用运动矢量,即用上一帧相应位置的宏块直接来替换当前丢失宏块的数据,这种方法对于相对静止或运动较小的图像,恢复质量较好,但当运动程度较剧烈时恢复质量很差。

有运动补偿的时域隐藏技术首先估计出丢失宏块的运动矢量,再根据运动补偿原理从参考帧中找到相应的宏块,替代当前帧中的丢失宏块。技术的关键在于对错误块运动矢量的估计。一般情况下,由于当前宏块与相邻宏块具有相似的运动方向,因此可以利用相邻宏块的运动矢量来估计当前宏块的运动矢量。可供选择的运动矢量很多,如:使用当前丢失块周围正确接收的某一宏块的运动矢量;使用前一帧的对应位置宏块的运动矢量;使用丢失块周围宏块运动矢量的平均值;使用丢失宏块周围宏块运动矢量的中值[21]。

2)空间域错误隐藏技术

在某些情况下,如参考帧中的丢失块,图像运动剧烈等,不能使用时域错误隐藏或时域错误隐藏不能取得令人满意的效果,此时可以利用空间域错误隐藏技术来进行恢复。空间域错误隐藏主要利用单帧图像中的冗余度来对丢失块内容进行恢复。传统的空间域错误隐藏算法主要有双线性内插和方向性插值。

双线性内插利用丢失块周围正确接收的像素来对丢失像素进行插值重建。这种方法没有考虑图像的纹理特征,当丢失块内存在边缘时,重建图像将变的模糊。

方向性插值主要考虑图像中边缘的完整性,首先利用边缘检测算法对丢失宏块中的边缘进行预测,并假设预测的边缘近似为一条直线,最后沿边缘方向对丢失宏块进行插值以恢复出该边缘。

5 小结与展望

针对压缩数据对误码敏感问题,介绍了T-DMB标准中视音频编码标准的容错工具,考虑到系统的实时性要求和复杂度,有些容错工具并未在标准中使用,这就对解码终端提出了更高的要求。基于解码端的错误隐藏技术,不需要编码端改变编码模式,不需要添加冗余信息,对视音频播放质量的提高有较大的帮助。对移动电视、3G等无线视音频通信系统,都有重要的利用和参考价值。

当前,研究人员已经提出了很多视音频错误隐藏算法,取得了良好的修复效果,但算法复杂度往往过高,计算量大,很难在实时环境中应用。因此,寻求一种能高效应用于实际系统中视音频错误隐藏算法,仍然是下一步研究工作的重点。

摘要:从视音频编码角度出发,对提高T-DMB系统视音频播放质量的一些容错技术进行了总结归纳。介绍了T-DMB标准视音频编码的基本原理,讨论了T-DMB系统固有的容错特性,对基于解码端容错工具的错误隐藏技术进行了总结。

关键词:T-DMB标准,H.264标准,HEAACV2,容错,错误隐藏

T-DMB无线网络覆盖技术 篇2

数字多媒体广播T-DMB是在数字音频广播DAB基础上发展起来的, T-DMB充分地利用DAB的技术优势, 能在高速移动环境下可靠接收信号, 在功能上将传输单一的音频信息扩展为数据﹑文字﹑图形与视频等多种载体, 可实现高质量传输。具有频谱利用率高﹑同时兼具多媒体特性, 可提供容量大﹑效率高﹑可靠性强的数据信息服务。与移动通信比, 传输带宽更宽, 节目更丰富;与数字移动电视比, 移动和便携性更强。T-DMB手机电视整体解决方案由T-D M B播控系统、T-D M B传输系统、T-DMB终端系统组成。T-DMB传输系统由室外覆盖单频网子系统和网络优化子系统构成。T-DMB传输系统一般工作在L波段或Ⅲ波段。

Ⅲ波段频率低, 无线信号的空间衰减小, 网络优化子系统造价会低一些, 但需单独建网, 终端需独立天线。L波段频率高, 无线信号的空间衰减大, 网络优化子系统造价会高一些, 可与移动通信网络优化系统共用天馈系统。室外覆盖单频网子系统通过主发射机和辅助发射机组成。该子系统能够覆盖室外大部分地区。

2、T-DMB无线网络结构

T-D M B系统由播控系统、前端系统、传输系统、发射系统和天馈系统五部分构成。播控系统主要分为节目收集和制作系统、节目资产化管理系统、硬盘播出系统等。硬盘播出控制系统主要包括以下部分:视频服务器系统、总控系统和播出系统周边设备。视频服务器系统以视频服务器为核心, 将图像和声音压缩编码后存储在硬盘阵列中, 然后根据节目播出需要自动、可靠地进行节目编排、播出。此外, 播控系统应实现播出控制 (如直播、插播以及多种节目编排方式) 、节目上载和实时播出监视, 并保证硬盘播出系统各个部分的稳定性和可靠性。总控系统解决电视台的信号调度和切换问题, 应配置整个播出机房的同步系统, 并对各个频道播出系统节目进行技术监播以及应急处理。播出系统周边设备包括台标机、字幕机等。

前端系统主要完成信源编码、复用、信道编码和交织, 将信号转换为ETI信号输送到发射端。前端系统主要包括以下几部分:视频和音频编码器、数据服务器、网关 (包括DMB网关和IP网关) 、群组复用器以及相应的管理监控设备。

传输系统主要完成信号的远距离传送。

发射系统主要完成信号的调制、上变频, 进行功率放大后输送到天馈系统进行发射。

T-DMB五大系统的各自构成如图1所示。

T-DMB无线网络结构如图2所示, 节目经播控系统处理后输出到前端系统进行编码后, 经复用器复用后经传输分配网络后分别传送到其它发射站进行COFDM调制和上变频以及功率放大后, 输送至发射天线进行发射。

T-D M B组网时可采用地面单频网 (S F N) 或多频网 (M F N) 的方式, 从节约频率资源的角度, 采用单频网的组网方式。在一个SFN中包含多个同步无线发射机, 这些发射机以完全相同的频率发射完全相同的比特流。DAB同步网, 又称单频网 (Single Frequency Network, 即SFN) , 是由处于不同地点的许多发射台构成的, 这些发射台工作于相同的频率, 时间同步地发射相同的节目。“单频”是指同步网中的所有发射机都使用中心频率相同的带宽为1.536MHz的频率块。基于DAB的同步工作能力, 可以根据需要构成任意大小的地面覆盖网。在同步覆盖区域中, 接收机移动接收不需要更换频率。

单频网具有许多优点:节约频率资源、节约发射机功率和确保在恶劣的地理条件下的良好覆盖。但是, 在同步网中, 对载波频率的同步和数据流的同步有较高的要求。为了确保单频网中各同步发射台的良好同步运行, 必须同时满足两个条件:各发射台的发射频率相同;发射的相同节目在时间上要同步。

电磁波在空间的传输损耗较大, 受地理环境、建筑物遮挡等因素的影响, 会造成楼宇﹑地下室﹑地铁﹑隧道等区域的广播信号微弱甚至成为盲区。这一问题可通过由手机电视直放站﹑干线放大器构建的网络优化系统来解决。手机电视网络优化系统可广泛应用于因信号屏蔽不能直接穿透的区域的覆盖, 包含室内和室外, 可有效提高覆盖区的信号强度, 使得在多种场合用手机及掌上终端收看数字电视成为可能, 运营商在更广泛的区域可为客户提供优质多媒体广播业务。为此, 奥维通信顾问有限公司研制出了用于解决手机电视地面网络信号覆盖问题的设备——手机电视网络优化直放站和干线放大器。

3、网络系统优化

手机电视网络优化直放站共有四种结构形式, 分别为专用型室内分布系统结构、通用型室内分布系统结构、室外型同频 (或选频) 直放站系统结构和室外型移频直放站系统结构。

1) 、专用型室内分布系统结构

手机电视网络优化系统可分为两种方式:一是单独建网我们称之为通用型, 二是借用移动网络优化系统, 我们称之为专用型。

目前中国移动、中国联通、中国电信、中国网通分别建了各自的移动通信网络优化系统, 用于GSM、CDMA、DCS、PHS、W-CDMA、TD-SCDMA等通信系统。各家的网络优化系统无源部分 (功分器、耦合器、天线、馈线) 支持800~2500MHz频段。其中中国移动的网络优化系统最为完善, 覆盖范围最广。在一个移动通信网络优化系统中, 无源部分占总投资的30~75%。手机电视网络优化系统如能与移动通信网络优化系统共用无源部分, 不但能节省大量投资, 而且施工将非常简单。L波段手机电视工作于1452~1492频段, 刚好符合这一条件。可借用中国移动网络优化系统。手机电视直放站施主天线接收手机电视主发射机信号, 经直放站放大后, 通过一个特殊合路器将手机电视信号和移动通信信号合为一路, 传送到无源分布网络或干线放大器。为使结构紧凑, 将这一特殊合路器置于直放站内。直放站是提供信号源的设备。在室内分布系统中, 当功率电平不够高时必需用干线放大器放大信号以提高功率电平。一般, 在移动通信网络优化系统中有干线放大器的地放, 也必须加一个手机电视的干线放大器。用一个特殊的分路器将移动通信信号和手机电视信号分开。移动通信信号送到移动通信的分路器或干线放大器放大。手机电视信号送到手机电视干线放大器放大。然后再用一个特殊合路器将放大后的手机电视信号和移动通信信号合为一路。传到无源分布网络。为使结构紧凑, 将分路器﹑合路器置于干线放大器内。分路器﹑合路器对所有移动通信信号必须透明传输, 插入损耗要尽量小。

2) 、通用型室内分布系统结构

手机电视直放站施主天线接收手机电视主发射机信号, 经直放站放大后。接室内分布网络的天线或干线放大器用于覆盖室内服务区域。直放站用作信号源, 干线放大器用于补偿线路损耗提高功率电平。Ⅲ波段手机电视系统因无法与移动通信网络优化系统共用无源部分。

3) 、室外型同频 (或选频) 直放站系统结构

手机电视直放站施主天线接收手机电视主发射机信号, 经直放站放大后。通过服务天线发射到服务区。完成收手机电视主发射机到信号盲区手机电视的信号联接。L波段和Ⅲ波段在解决室外盲区覆盖时都必须用这种方式。这种方式必须用通用型同频直放站。

室外型结构的缺点是在工程安装时必须保证收发天线的隔离。否则会造成系统自激。如果工程现场条件不能保证足够的天线隔离, 则不能采用这种方式, 而必须采用室外型移频直放站系统结构的移频方式。

4) 、室外型移频直放站系统结构

手机电视移频直放站近端机施主天线接收手机电视主发射机信号, 经低噪声放大。移频到指定的传输频点, 在传输频段上进行功率放大, 然后通过传输天线发送给远端机。远端机接收来自近端机的传输信号, 经低噪声放大, 移频回信号频点, 再经功率放大, 通过服务天线发射到服务区。完成收手机电视主发射机到信号盲区手机电视的信号联接。L波段和Ⅲ波段在解决室外盲区覆盖时都会经常采用这种方式。这种方式的优点是收发不同频, 不要求很高的天线隔离, 工程难度小。

4、结束语

随着移动通信技术的发展, 移动通信网络必将与广播电视网络走向融合, 而奥运会在中国北京的举行, 将促进这个融合的过程, 手机电视为两网融合提高了一种契机。手机电视的出现, 使移动通信成为真正意义的多媒体通信, 本文基于国内正在实验的手机电视T-DMB网络, 提出了手机电视网络的优化系统, 探讨了广播电视网络和移动通信网络融合的优化模式, 设计了网络优化系统, 相信对手机电视及其移动通信的发展有着一定的参考和促进意义。

摘要:随着移动通信技术的发展, 手机电视越来越成为人们关注的焦点。本文基于T-DMB标准, 研究手机电视的无线网络覆盖技术, 探讨手机电视盲点区域的网络设计和覆盖方案, 优化手机电视网络系统。

T-DMB标准 篇3

DMB作为DAB标准的继承与发展, 是目前正在蓬勃发展的新技术, 目前手机电视, 巴士、地铁、出租车等交通工具上的移动电视、数字广播等多种数字移动多媒体广播形式得到了广泛应用, 为经营空间渐趋饱和的广电媒介带来了新的发展机遇。

由数字音频广播DAB发展起来的移动多媒体技术T-DMB, 在DAB的MSC (主业务信道) 中划分出一个独立的子信道用于视频业务, 视频压缩上采用了适合低比特速率视频业务的视频编码标准MPEG-4 AVC/H.264, 节目伴音压缩则采用BSAC, 而原DAB中所固有的音频业务和数据业务都保持不变。DAB与MPEG-4技术的成功结合有效地解决了人们对数字多媒体业务的需求, 具有广阔的应用前景。

本文设计了一种手持式数字多媒体广播接收终端, 能够接收Ⅲ波段和L波段DAB/T-DMB信号, 实现视音频节目的播放, 非常适合在移动场合中应用。

2 系统方案设计

本系统主要由信号接收单元, 控制与解码单元、显示单元、电源管理单元四部分组成。信号接收单元完成DAB/T-DMB广播信号的接收, 并对信号进行解调;控制与解码单元主要完成信号接收芯片和LCD、键盘电路的控制以及TS流解复用和H.264解码等工作;电源管理单元负责系统供电和锂电池的充电管理。本文主要对信号接收, 控制与解码单元进行了介绍。

系统中采用的D A B信号接收芯片为P N M 3 0 3 0, PNM3030是高效能的集成芯片, 其兼容DAB/T-DMB标准, 支持III波段和L波段信号接收, 它适用于T-DMB和DAB的解决方案, 具有体积小, 功耗低的特点, 能够使数字多媒体方案在不同的手持移动产品中得到应用, 芯片本身具有I2S音频接口、I2C、SPI、HPI和TS等传输接口。

控制与解码单元的核心是处理器MV8720, 该芯片是一款针对手持式多媒体应用解决方案的移动多媒体处理器, 其内置了ARM926EJ内核, 具有丰富的片上资源, 可以实现H.264解码以及MPEG-4、AAC、MP3等多种视音频的编解码, MV8720具有SPI, MPEG-2 TS、HPI、I2C等多种接口, 可以非常方便地与PNM3030连接。

显示屏采用的是2.8英寸的TFT LCD, 其内置R61505U控制器, 18位数据接口, 具有SPI、80系统总线接口。此外, 接收终端还包含了五维方向键盘电路、AC97音频输出电路、SD存储卡电路。

系统方案设计框图如图1所示。

3 系统硬件设计

3.1 DAB/T-DMB信号接收模块

本设计中采用的高性能D A B/T-D M B信号接收芯片PNM3030, 可以接收III波段与L波段信号, 通常情况下在信号接收前端需要设计双路分离接收电路。为了简化电路设计, 利于设备的小型化, 本设计对信号接收前端电路进行了复用, 电路示意图如图2所示。

L波段与III波段信号在同一信号处理电路中传输, 经合路器处理后分离成两路信号分别进入PNM3030芯片进行检波解调, 由于L波段与III波段的频率值相差较大, 因此对信号接收前端的电路设计要求非常苛刻, 为了不降低L波段信号接收的灵敏度, 本设计在复用电路中加入了高频低噪声放大器来对L波段的信号进行放大, 同时保证了III波段信号接收的灵敏度。

经实际测试后, L波段与III波段信号接收的灵敏度都比较好, 在发射信号强度比较弱的情况下也能良好接收, 成功实现了L波段和III波段双频段接收功能, L波段接收频率范围为:1450~1490MHz, III波段接收频率范围为:170~230MHz。

如前所述, PNM3030具有多种接口, 但I2C接口数据传输速度太慢, TS接口只能传输TS流数据, 因此本设计中控制接口采用SPI接口, TS流数据输出接口采用的是TS传输接口, 接口示意图如图3所示。

3.2 LCD显示电路

本设计采用的LCD内置R61505U控制器, 使用18位80系统总线接口与多媒体处理器MV8720相连, 分辨率为240×320, 其接口示意图与工作时序图如图4、图5所示。

3.3 音频输出与键盘输入电路

音频输出芯片我们采用的是单芯片16位立体声A/D和D/A转换器AK4642, 该器件内置了麦克风均衡器、麦克风、耳机放大器、立体声ADC和立体声DAC、风噪滤波器和立体声分离补偿电路, 工作电压为2.6~3.6V, 控制接口支持3线串行和I2C总线两种, 在本设计中采用I2C作为控制接口。

键盘输入电路采用的是独立式键盘, 非中断方式触发, 五个方向键作为菜单选择按键, 一个退出键作为菜单退出按键。

3.4 SD卡存储与锂电池电路

SD卡用以存储MP4、3GP、MP3等视音频文件, 可以在手持终端上播放这些多媒体文件, 在本设计中, 最大可支持2G容量的micro SD卡。锂电池作为接收终端的供电电源提供3.6V电压, 当锂电池电量不足时, 可以通过USB电缆给手持终端供电和充电。

4 系统软件设计

4.1 PNM3030驱动程序设计

在本设计中使用了SPI总线接口作为PNM3030的控制接口, 因此, 首先需要在MV8720开发平台上编写SPI接口的底层驱动程序, 包括SPI接口初始化、字节读、字节写函数, 然后编写P N M 3 0 3 0的驱动程序, 主要工作是完成对PNM3030的初始化, 设置工作模式以及信号接收频率等, PNNM3030的SPI接口控制命令时序图如图6和图7所示。

如图6和图7所示, 在写地址数据到PNM3030时, 需要先发送“D0”命令字, 而在读取PNM3030内部寄存器值时, 要先发送“D1”命令字。

PNM3030的驱动程序流程图如图8所示。

PNM3030内部集成了DAB/T-DMB Tuner, 在初始化过程中首先要对Tuner进行设置, PNM3030内部基带部分通过RF I2C接口控制Tuner, 在对Tuner进行初始化时, 将初始化数据写入PNM3030内部的数据区寄存器中, 然后发送, 能使RF I2C接口命令PNM3030通过内部RF I2C接口将数据区寄存器内的数据传送给Tuner。在初始化过程中, 每次使能RF I2C接口后都要等待几百毫秒, 以等待数据区寄存器内的数据传输完毕, 否则Tuner将不能正确的初始化。当Tuner初始化完毕后, 再对OFDM、音频子信道和TS流子信道进行复位, 设置信号接收频率, 延时等待500ms后, 读取PNM3030内部寄存器值, 以判断接收频率是否锁定。

当PNM3030初始化完成后, 即可开始设置接收子信道, PNM3030将接收到的信号进行解调, 得到T S流数据, MV8720通过TS接口获得TS流, 再对TS流进行解复用、H.264解码, 在LCD上播放视频图像。DAB/T-DMB信号强度, 信噪比, 传输模式等信息都可以通过查询PNM3030内部相关寄存器值, 进行计算后得到, 这些信息数据的传输都是通过SPI接口完成。

4.2 操作系统移植与人机交互界面建立

为了完成DAB/DMB信号接收芯片的初始化、TS流数据的获取、TS流解复用、H.264解码、LCD驱动, 对SD卡文件管理等工作, 本设计在接收终端上移植了Nucleus操作系统内核, 并移植了文件系统, 支持FAT16和FAT32两种文件系统。

本设计选择Nucleus操作系统作为移植对象是因为其具有以下优秀的特性:

(1) 快速的响应时间:对临界资源的检测时间不依赖于占有该临界资源的线程执行时间的长短, 一旦低优先级线程释放掉临界资源 (不管其是否执行完) , 高优先级线程就会抢占运行。

(2) 每个任务的执行时间和其他任务的处理时间无关。

(3) 较高吞吐量:随着任务数目的增多, 任务的调度时间为常数。

(4) 可扩展性:利用现有系统调用的结合可得到新的系统调用。

在操作系统移植完成后, 本设计在应用程序中建立了多个任务, 以实现PNM3030初始化、TS流获取与解复用、H.264解码、视频播放、键盘扫描、文件管理等功能。

人机交互界面共包括GUI界面和键盘输入两部分。本设计在Nucleus操作系统上移植了GUI模块, 在LCD上建立了GUI界面, 然后编写了键盘扫描程序, 在GUI界面和键盘之间建立映射关系, 这样即可使用方向键来选择菜单各项, 实现接收频率的选择、节目的选择和WMA、3GP、MP3、MP4等多媒体文件的选择播放。

5 小结

本文所设计的手持式数字多媒体广播接收终端成功实现了DAB/T-DMB信号的III波段和L波段的接收功能, 两个波段的信号接收灵敏度都达到了-101dBm;同时本系统采用硬件解码方案, 可以对H.264/MPEG-4 AVC、码率512kb/s的CIF格式下的视频压缩码流进行实时解码, 解码能力达到30fps (每秒30帧图像) , 图像清晰度为QVGA (320×240) , 此外, 本设计还具有体积小, 功耗低, 操控简单等优点, 达到了实用化的要求。

摘要:针对数字多媒体广播的要求, 设计实现了一种手持式数字多媒体广播接收终端, 详细介绍了系统的软硬件设计方案, 该终端实现了L波段和Ⅲ波段的DAB/T-DMB信号接收以及视频播放, 其接收灵敏度高、结构简单、功耗低, 具有一定的实用价值和应用前景。

关键词:数字多媒体广播,信号接收,多媒体处理器,Nucleus

参考文献

[1]高峰.数字音频广播与数字高清晰度电视[M].北京:中国广播电视出版社, 2003.

[2]余兆明.移动数字电视技术[M].北京:人民邮电出版社, 2007.

[3]秦娟, 王彤, 吴剑东.T-DMB技术及其应用[J].电视工程, 2006 (2) :12-14.

T-DMB标准 篇4

关键词:T-DMB,MPEG-2TS,ES包,视频解码

1 引言

由于业界的广泛关注, 目前国际上对移动数字电视的研究十分热情, 与之相关的传输技术已达十余种, 概括起来可以分为以下三种类型:1) 基于移动网络的实现技术;2) 基于地面数字广播网 (DMB) 的实现技术;3) 基于卫星的实现技术;从技术和成本上考虑, 数字电视广播 (DMB) 是最具竞争力的移动电视的是实现方案。

2 T-DMB原理分析

2.1 T-DMB系统结构

T-DMB发送端系统所支持业务主要包括三个部分:

1) 视频业务。视频编码部分采用H.264, 音频编码部分采用MPEG-4比特切片算术编码 (BSAC) , 与视频内容有关的交互场景数据采用场景描述二进制格式 (BIFS) , 多路复用采用MPEG-4 SL和MPEG-2 TS的组合, 并有针对性地增加了RS编码和卷积交织作为附加信道保护措施, 以流模式传输。2) 音频业务。采用DAB标准引用的MUSICAM编码, 以音频帧流模式传输。3) 数据业务。一般采用数据包模式传输。

T-DMB系统传输部分以DAB标准为基础, 增加了一些适合视频业务传输的扩展定义。信道带宽1.54MHz, 一般移动接收情况下, 其主业务信道 (MSC) 的可用净码率为1.152Mbps (卷积编码1/2) 。如果采用384kbps的视频码率, 在每1路1.54MHz信道带宽内可以传输两路视频节目;如果采用更高的512kbps的视频码率, 则可以传输1路视频节目和3路音频节目 (64kbps, CD音质) 以及1路数据业务。试验证明, 在时速200km以上的车上可以稳定接收T-DMB/DAB信号。

2.2 MPEG-2TS码流分析

传输流TS的结构长度为188字节, 分成包头和包负荷两部分。包头主要包括同步字节和PID以及其他的信息, 同步字节用来指示一个TS包开始, PID用于标志改TS包属于那条数据流。例如一个节目里的一条音频数据流, 在转换成为TS包后会具备同样的PID, 这样, 接收端只需要接收具有此PID的TS包, 就可以将该节目的音频解出来了。包负荷是包的实际内容, 根据具体情况, 可以放置节目数据或节目特殊信息, 节目数据格式为PES包, 节目特殊信息PSI格式为SECTION。

3 数据解析实现

数据解析的主要工作是将通过Tuner接收到的传输流按照其协议封装的格式将其解析出来, 例如节目特殊信息 (节目关联表、映射表等) , 需要Section解析才能得到, 而视频业务的数据, 则需要通过解析PES、同步层包才能得到音频、视频的原始数据。

3.1 TS包头解析

系统中对TS包头进行解析的函数是ddm_parse_ts (UB*tsbuf) , 参数tsbuf存放的是一个完整的TS包。对TS包头解析可以按照MPEG-2中的定义逐比特解析, 解析过程中需要充分利用包头中的各种信息, 从而使得解析过程最优化。

解析时首先需要判断同步字, 是tsbuf的第一个字节, 如果为0x47则表示正确, 否则同步出现错误, 不再对包进行解析, 并放回出错原因。接着提取传输错误指示位, 如果此位为1, 表明包在传输时出现了严重的错误, 此时不再对包做解析, 并返回返回出错原因。接着提取负载单元起始指示符, 将该标志保存起来, 在判断包是否是开始部分时使用。在PID有效的情况下我们就可以获得相应的ES所在的缓存指针, 然后对适应域存在与否做相应的位域提取。

3.2 TS负载解析

对负载解析的任务就是要得到最原始的ES包。负载有两种格式:PES和PSI。下面将阐述对应的解析流程。

1) PES解析:通过TS包头中的负载单元起始符来判断负载中的PES是否是PES包的开始部分, 是的话进行包头解析, 若不是则直接将其负载内容得到存入相应的缓存中。包头解析中需要提取包的长度、PTS_DTS标志位及包头的长度等。根据PTS_DTS位可以判断在PES包头中是否含有PTS (时间显示标签) , DTS (解码时间标签) 信息。T-DMB系统中仅使用了PTS, DTS等于PTS。在实际进行解码设计时, PTS允许和当前系统时钟有一定的差值, 从而便于适应实际网络的延迟, 差值限定在用户所能承受的范围之内。

2) SECTION解析:提取table_id, 判断其值。如果为0x00, 则表明此段是PAT;如果为0x01, 表明此段是PMT;如果为0x02, 表明此段为CAT。其他值可作为用户自己定义私用。根据table_id的值分别进行不同的SECTION解码, 并分别得到相应的SECTION长度, 该长度代表从该字段往后的长度, 占用12bit位。

3) PAT解析:主要是提取节目号和此节目号对应的节目映射表的PID。其中节目号为0的PID是网络信息表的PID, 然后才是具体的节目信息。

4) PMT解析:提取PCR_PID, 它提供了节目参考时钟数据流的PID, 节目参考时钟数据流提供了该套节目的参考时钟信息, 通过它来保持和发射台时间上的同步;提取stream_type, 它表明了数据类型, 如音频、视频等, T-DMB协议规定stream_type=0x12表示音频或视频, 0x12表示是对象描述流或者场景描述数据流。elementary_pid指出了属于该套节目的PID。

5) CAT解析:提取CA_s ys te m_ID, 该位占用16bit, 它指示出CA系统适用于ECM流或EMM流或两者都使用;CA_PID, 占用13bit, 表示了传输流分组的PID, 此分组中包含由相应CA_s yste m_ID指明的CA系统的ECM或EMM信息, 由CA_PID指明的分组的内容 (ECM或EMM) 有CA_PID所在的上下文决定, 即传输流中的程序映射表或CA表或程序流中的stream_id字段。

4 试验结果及总结

下图是基于上述解码过程的节目播放效果图。画面清晰、声音流畅, 声音与画面完全同步, 用户评价极好。

参考文献

[1]岑斌.T-DMB手机电视电视接收终端探讨[J].电视技术, 2005.

T-DMB标准 篇5

根据ETSI EN 300 401规定,DAB有4种传输模式,分别应用于不同的工作频率,其主要参数如表1所示。目前在北京、上海、广州已建成的T-DMB商用网络中,北京和广东采用的是中国VHF-III波段(168 MHz~240 MHz),对应DAB的模式I;上海采用的是L波段(1 452 MHz~1 492 MHz),对应DAB的模式Ⅲ。DAB在VHF-Ⅲ波段中包含41个信道,标记号为5A、5B~13F;L波段中包含23个信道,标记号为LA~LW;每个信道的典型间隔均为1.712 MHz,信号带宽均为1.536 MHz[1]。

传统的便携设备一般屏幕较小,长时间观看时用户易疲劳。吸取英国和韩国的市场发展经验,移动多媒体广播接收的终端应该多样化,本文设计了一种具有USB接口的T-DMB便携设备,可以使用户在移动PC机终端上使用大屏幕来接收T-DMB信息。

1 系统设计

该接收机总体设计上将尽可能依托PC机完成数据处理,逻辑上分为硬件、固件设计、软件和用户界面4个模块,如图1所示。设计要求接收机支持VHF-III波段和L波段,外部的数据接口需支持USB2.0协议,能够正确解码多媒体广播的音视频信息。

2 硬件和固件设计

硬件设计要综合考虑不同芯片间的性能需求:射频处理芯片应具有较高的接收灵敏度并支持信号的跟踪和锁定;ADC应具有较高的带宽和精度;解调芯片能同时处理的信号带宽越大越好,但是性能较高的芯片往往价格较高,在芯片选择上需要综合考虑性价比[2]。同时选取的MCU芯片应支持前段RF芯片和解调芯片的通信总线[3]。选取的天线应该在增益和尺寸上取得均衡。

便携设备一般采取USB接口直接取电,设计时,尤其要注意USB接口能提供的最大电流仅为500 mA(需要响应USB总线的配置,一般模式下仅提供100 mA电流),这对硬件的总体功耗提出了明确的要求。

在本方案的硬件设计中,选用输入阻抗为50Ω的SMA0.062天线,其增益约3 dB,采取MAX2170ETL作为RF芯片,采用MAX1191ETI作为ADC,ID200Q48作为解调芯片,AT91SAM7S64作为MCU和USB接口控制器,其设计框图如图2所示。

MAX2170ETL芯片是美信公司专门针对T-DMB设计的接收芯片,工作电压3.3 V,支持FM波段,并能够接收VHF-III和L波段的信号转换为2.048 MHz的低中频I、Q信号,其接收精度为-100 dbm;通过I2C总线设置片内寄存器后改变Vturn引脚电压来实现频段的选择;MAX2170ETI芯片依靠外部的24.576 MHz晶振提供时钟。

MAX1191ETI是一款双通道ADC,对OFDM信号的I、Q分量分别进行8位的采样。

ISISIP ID200芯片是西安西芯微公司的基带处理芯片,支持最大至512 kb/s的COFDM解调,功率消耗仅为30 mW;提供RFpwd输出,配合MAX2170的使能输入,可作为RF的电源管理;同时还为ADC芯片提供增益控制信号和电源管理信号。ISISIPID200芯片通过SPI接口与AT91SAM7S64芯片连接,完成解调后根据内容,向AT91SAM7S64发送中断请求,并传输EPG、FIC和DATA数据。在SPI接口中,AT91SAM7S64芯片是主机,ISISIPID200芯片是从机。

AT91SAM7S64芯片中使用ARM7TDMI内核,支持通过JTAF/ICE接口的数据录入和通过DBGU接口的数据调试。通过对内部PIOA复用控制,可提供USB、I2C、SPI等多种接口,本设计方案配置如图3所示,引脚16、21、22、27、28配置为SPI总线,引脚36、43配置为I2C总线,引脚56、57为USB数据总线。

在AT91SAM7S64芯片提供的USB接口解决方案中,不仅支持USB2.0的全速12 Mb/s设备,而且集成了USB控制器;USB接口通过先分频再倍频并利用外部时钟产生48 MHz时钟;同时该芯片具有USB接口的基础包(ADS的at6124BasicUSB开发包),在驱动开发上比较有利。设计中需要特别注意的是:要控制好数据的“实时”读取,在该芯片接收到基带芯片的中断请求后,会先将数据存入片上收发器,然后通过USB协议将数据输出至外部PC机,在数据传输的逻辑控制上要严格设计逻辑,这也是硬件设计中的难点。

3 软件设计

3.1 软件处理流程

T-DMB对视频业务的处理流程如图4所示。

3.2 RS解码和时间解交织

因基带解码芯片未包含RS解码器和内部解交织器,所以在PC机端接收到每帧204 B数据后,由于解码时解交织的延迟(一般为384 ms)、编码端的延迟和网络传输延时,在转播现有电视节目时,移动多媒体广播最大有3 s的延时,因此,需要进行RS(204,188)解码,并对RS解码后的数据进行深度为12的解交织[4]。

RS解码可调用MATLAB中的rsdec(msg,n,k)函数,其中,msg为待解码信息,n取204,k取188。需要注意的是:在调用该函数前,需要将msg信息转换为GF域类型。

3.3 解复用

T-DMB传输流中包含了MPEG-2的传输层、MPEG-4的同步层、H.264的NAL头以及相关的配置信息,传输流的解复用是软件设计的难点所在。

对每帧的传输比特流,通过解复用器分为同步信道、快速业务信道、主业务信道,并根据快速信道中的复用配置信息(MCI),将主信道分为每个子信道的逻辑帧。一般一个子信道上承载一路音频、视频或数据业务。每一路节目的解复用可按照下述流程处理[5]:

(1)在传输流中依据PID=0x00 00搜索PAT,并从PAT信息中获取PMT信息。

(2)在传输流中依据PMT的PID搜索PMT。

(3)在PMT信息中搜索IOD描述符,获取IOD信息。

(4)根据(3)中获取的IOD信息中,搜索ES描述符,并获取场景和对象描述信息。

(5)根据(4)中获取的ES描述符信息,获取ES_IDs,并在PMT的描述循环中获取与每个ES_IDs对应的基本流信息。

(6)根据(5)中获取的基本流信息,获取与每个ES_IDs对应的PID和流类型信息;然后传输流中依据PID信息,搜索各自的传输包。

(7)根据(4)中场景描述符信息,获取对象描述符标识,并从对象描述流中获取与之对应的对象描述符。

(8)根据ES_ID中的对象描述符和PID的对应关系,识别流类型,并重建场景,依据OD中的同步信息,设置缓冲区。

在进行文件处理时,从ES描述符中,获取时间戳精度和传输码率,从OD的解码特殊信息中获取音视频解码的配置信息,形成音频文件头和视频文件头。

(9)获取场景描述信息。

3.4 音视频解码和同步

在解复用后可获得某一路中的音视频数据,视频信息符合ITU-T H.264 Baseline Profile规范,图像格式一般为CIF(Common Intermediate Format,352×288像素),支持的最大帧率为30fps。音频信息符合MPEG-4 ER-BSAC(Error-Reliance Bit-Sliced Arithmetic Coding)规范或符合MPEG-4 HE AAC V2规范;在音视频的同步上,音频流中含有CTS(Composition Time Stamp)和OCR(Object Clock Reference),视频流中含有PTS(Position Time Stamp),时间戳的语义符合13818-1[3]规范;依据CTS、PTS和OCR的同步方法符合14496-1[4]规范。

在视频音频解码的处理中,采用微软的DirectShow框架,在注册H.264解码器后,只需将解复用后的数据传递给对应的Filter即可[6]。

例如,视频解码器的注册在Dlg类中的OnButtonPlay()函数中实现:

本文设计了一种具有USB接口的T-DMB接收机,其USB接口增强了便携性和易用性,为人们在接收信息时带来更大的便利。在实际开发过程中,硬件部分的难点是USB接口设计和接收机的小型化,软件部分的难点是T-DMB码流的解复用和Direct Show应用框架的设计。

参考文献

[1]ETSI EN300401V1.3.3.Radio broadcasting systems;digital audio broadcasting(DAB)to mobile,portable and fixed receivers.2001-05.

[2]宋伟.基于T-DMB的手机电视软硬件设计.电子设计与应用,2007(11).

[3]USBDMB_EV_Chinese.西安西芯微公司网站.www.isisip.com.2008.

[4]ETSI TS102427V1.1.1.Digital audio broadcasting(DAB);data broadcasting-MPEG-2TS streaming.2005-07.

[5]ETSI TS102428V1.1.1.Digital audio broadcasting(DAB);DMB video service;User Application Specification.2005-06.

上一篇:表面晶体下一篇:影像营销之道