VoIP语音

2024-06-15

VoIP语音（精选7篇）

VoIP语音篇1

0 引言

基于IP的语音通信(VoIP)是在IP网上通过传输控制协议(TCP)/IP协议实时传送语音信息的技术,这种方式提供了低成本、高灵活性和高效率的应用环境。由于网络只提供尽力而为的服务,语音的质量问题就凸显出来,受到了越来越多的关注。在目前的网络条件下得到满意的通话质量是我们首要考虑的问题。通过研究语音质量的评价模型来达到对VoIP语音质量的监控,并使之能够保持一定的服务水平,是很有必要的。

1 主观评价

主观评价方法的依据是ITU-T P.800( 传输质量的主观评价方法),主观评价是一种以人为主体的评价方法,它利用人主观感觉的满意度以可懂度为原则给听到的语音打分,并通过得分情况来评价端到端的语音质量。主观评价试验需要参加的人数众多,准备和执行费时费力,但可以准确测量用户感知。通过对众多评价数据进行收集、统计,最后得到一个统计结果(每一次主观评价试验的结果可能不同)——平均鉴定评分(MOS)。平均主观值MOS是被业界广泛认同的语音质量标准,因此,无论采用何种方法,其测量结果都必须对应到最终的MOS。用户满意度与MOS的对应关系如表1所示。

2 客观评价模型

与主观评价不同的另一种评价方法是客观评价(在测试条件没有变化的情况下能够得到相同的评价分数),它是根据声学特性及人的心理声学模型归纳出客观评价指标,通过测量终端和网络的特征参数,给出语音质量的评价。任何客观评价方法都是以主观评价为基础的。

2.1 感知评估通话质量(PESQ)的测量

PESQ是基于样本的评估方法。该方法是在语音网络上发起一个测试呼叫来通知通话对端开始记录整个通话过程,随着样本语音信号在通话连接上的传输,对端在记录过程中持续与原始样本信号比对,以便检测传输系统和编解码器引入的失真。

2.2 E模型(E-Model)

E模型的前提是假设语音质量损伤因素总是物理附加的。R值是E模型的最终结果,被称为全面的网络传输等级要素,取值范围为0～100。R的计算从R=R0(R0是无网络延时和设备损伤因素的基本信号与收发噪声以及电流、背景噪声之比,即基本信噪比)即没有网络和设备的损伤影响开始,此时语音质量是最好的,但是因为网络和设备损伤因素的存在,降低了通过网络的语音质量。R值的计算公式如下:R=R0-Is-Id-Ie+A,式中,Is为语音信号传输同步的损伤,Id为语音信号传输延时后的损伤,Ie为设备引入的损伤(例如编码器损伤),A为优势因素,致力于考虑呼叫者的期望因素,在部分情况下,一般设置为0。由公式可知,R的计算是首先估计一个连接的信噪比(R0),然后从中减去网络损伤(Is、Id和Ie),最后再用呼叫者对语音质量的期望(A)进行补偿。实际应用中,基本公式中的每一个输入R0、Is、Id和Ie都需要考虑各种各样的实际网络损伤因素,通过非常复杂的数学计算而得到。

3 评价模型的比较

PESQ能够考虑到语音从编码、传输到解码的全过程,因此在VoIP语音评估中得到了广泛应用。但由于网络中损伤的不确定性及信号复杂性的存在,使得这种计算密集型的评测方法不适合实时性的VoIP质量监控。它的缺点在于,测量不是基于数据网络的,而是从收发信号差异的角度分析网络语音问题,不能反映诸如延时、抖动和丢包等数据网络特有的问题,并没有考虑网络故障对用户感知造成的影响。

E模型在VoIP中获得了广泛应用的同时,还存在以下缺点:(1) 对于大数量的可能输入参数的组合情况未经过足够的界内验证和充分的实验室测量;(2) 其前提是假设语音质量损伤因素独立且总是物理附加的,但研究表明这种假设的可靠性在某些情况下存在疑问;(3) 它是建立在300～3 400 Hz电话语音带宽的基础上的,因此不能准确地用于宽带语音的质量评定,所以扩展E模型的使用范围非常必要。

4 主客观模型对语音质量评价的结果

以下是使用一款语音设备在局域网环境下分别进行主观评价和客观评价得到的结果。该款语音设备所采用的语音编码协议如图中所列。其中,agam1和agam2代表两种不同的网络环境;01和02代表两种不同的语音样本(随机抽取);m代表男性,f代表女性。

图1所示为主观评价的结果,图2所示为PESQ模型的评价结果。不同语音编码的速率不同或不同速率的相同编码,压缩率不同,占用网络带宽不同,因此语音质量也不同。从图中可以看出,相同的编码在相同的网络环境下不同样本信号的语音质量不同,不同的编码相同的网络环境相同的样本信号的语音质量也不同。主观评价的这种差异性较小,是由于人耳对某些差异无法感受到。

5 客观模型对语音质量评价的结果

对比E模型与PESQ,在同等丢包的情况下,两种算法对语音质量的评分如图3所示。实验条件:声音来源于中英文广播节目两男两女的对话,G.711、G.723和G.729采用静音取代丢包隐藏模式仿真。

如图3所示,语音质量随丢包增加而下降。从图中可以看出这两种评价模式在相同的编码方式下得出的结果比较接近。同时,采用G.711编码时语音质量受丢包的影响最小,并且对应表1可以看出语音质量能满足用户要求。

6 结束语

通过比较以上两组结果可以看出,仅实现语音通信时,采用主观评价就可以实现对语音质量的评估。但是,通常市场的需求是在实现语音通信的同时还要实现数据业务的通信,而费时费力的主观评价下的语音质量并不能满足要求,这时就必须采用更合理、更准确的客观评价模型。

摘要：文章介绍了基于IP的语音通信(VoIP)中语音质量的评价方法。通过研究语音质量的评价方法来达到对VoIP语音质量的监控,并使之能够保持一定的服务水平是很有必要的。文章还分析了主观评价模型与客观评价模型的实现原理,最后给出了主观评价模型与客观评价模型试验的量化比较结果以及不同客观评价模型试验的量化比较结果。

关键词：基于IP的语音通信,语音质量,感知评估通话质量,E模型

参考文献

[1]段洁.语音质量测量新方法E-model[J].中国数据通信,2004,(09):63-67.

[2]张薇.VoIP语音服务质量评测[J].电信网技术,2005,6(6):59-63.

[3]姚中华,黄建国,张义.VoIP语音质量客观评价方法及发展[J].学术研究,2005,(10):69-71.

[4]吴一新,肖会会.VoIP中为提高语音质量所采用的关键技术[J].计算机仿真,2004,(3):153-161.

[5]曾德攀,成立新.VoIP网络中的端到端音频测试[J].解放军理工大学学报,2000,12(6):44-48.

[6]王伟,王贞松.马尔可夫模型在VoIP通话质量实时评估中的应用[J].计算机应用,2007,12(12):2 969-2 972.

[7]黄俪声,周明天,汪文勇.骨干网中VoIP语音质量的快速评估方法[J].计算机应用研究,2008,10(10):3 119-3 121.

[8]ITU-T Recommendation P.861-1998,Objective quali-ty measurement of telephone-band(300-3 400 Hz)speech codecs[S].

[9]Takahashi A,Yoshino H,Kitawaki N.PerceptualQOS assessment technologies for VoIP[J].Communi-cations Magazine,2007,42(7):28-38.

[10]ITU-T Recommendation G.108-2001,Application ofthe E-model:A planning guide[S].

[11]Markopoulou A,Tobagi F,Karam M.Assessment ofVoIP quality over Internet backbones[A].IEEEINF-COM2002[C].New York:IEEE,2002.

VoIP语音篇2

在地空通信中,语音通信作为一种重要的指挥手段,能够实现指挥员与飞行员的直接对话,更好地完成战术配合,在地空通信中发挥着极其重要的作用。短波在远程语音通信中优势突出,但现有短波语音通信还存在对空指挥通信盲区、跨区飞行时难以实时了解飞行通信指挥情况等问题需要解决。

因此要解决这些问题,短波地面台站和各级指挥所的话音IP组网势在必行。引入VoIP技术不仅可以实现短波台站的共享、消除话音盲区,而且为话音的记录与监听,还为台站的扩展提供了方便。而且近年来随着网络的不断发展和普及,VoIP作为一种新兴的网络业务得到了广泛的运用,VoIP的QoS技术也得到了完善和发展,可以满足航空通信的需求。

承载网络的性能(包括时延、时延抖动、丢包率等)是影响语音质量的主要因素[1]。语音编码技术直接影响语音重构后的质量,特别是用于短波地空通信中,地面网络采用的VoIP技术,在到达电台后,语音解码重构、重构后的语音能否适应短波信道的传输、会造成多大程度的语音质量损失在很大程度上受到地面VoIP的编码技术的影响。

1 语音传输流程以及现有的编码技术

在实现短波地面台站和各级指挥所的话音IP组网后,语音从指挥席送到飞行器要经过地面有线IP网和短波无线信道,流程如图1所示。

现有的语音压缩编码技术[2,3]主要有脉冲编码调制(PCM)、适应脉冲编码调制(ADPCM)、低延时代码激励线性预测器(LD-CELP)、共扼结构代数码激线性预测(CS-ACELP)和多脉冲最大似然量化技术(MP-MLQ)。

语音编码技术比较如表1所示。

欧洲的单一欧洲天空计划(SERSA)最早提出在航空通信中采用VoIP技术,并很快得到了国际民航组织(ICAO)的认可,在2009年起草的ED-137文件中推荐采用的语音编码标准有G.711 A率和μ率,G.728和G.729[4]。在本文中将对这4种编码标准用于短波地空通信中的效果进行评估。

2 仿真环境的设置与实现

本文主要是研究不同编码技术对短波地空通信语音质量的影响,因此首先将地面网络理想化,暂不考虑网络性能对语音质量的影响。G.711 A率(A=86.7)和μ率(μ=100),G.728和G.729语音编解码[5]通过Matlab7.8软件编程实现。语音样本采用含有中年男子和女子的语音片段“a.wav”,时长为10.6 s,语音的时域和频域波形如图2、图3所示。

短波传输的仿真环境使用Matlab7.8的Simulink进行搭建。主要采用的技术和参数设置如下:

短波信道采用Watterson短波信道模型。短波传输以电离层为中继的特点决定了短波信道存在着多径时延、衰落、多普勒频移、频谱扩散、近似高斯白噪声和电台干扰等复杂现象。在此采用了Watterson短波信道模型[5],Watterson信道模型全面描述了短波信道的各种特性,经国际电信科学机构和实践的研究证明是一个非常好的短波信道模型。Watterson模型如图4所示。

Watterson模型利用N个抽头延迟线来等效N条路径。每个抽头延迟不仅都有独立的延迟τi,而且还具有一个增益函数Gi(t)与延迟了的信号x(t-τi)相乘。处理后信号的幅度和相位就进行了调整。Gi(t)是相互独立的,它反映了衰落、频谱扩散和多普勒频移成分。Gi(t)可以表示为

Gi(t)=Gia(t)ej2πviat+Gib(t)ej2πvibt (1)

式中:下标i代表第i条路径;a,b表示对应路径的2个磁离子分量;via,vib为指数因子,反映了第i条路径2个磁离子分量的频率扩散和多普勒频移程度;Gia(t),Gib(t)代表第i条路径两个磁离子分量的幅度变量,是均值为零、相互独立的复低通高斯过程样本函数,反映了每条路径的衰落程度;Gi(t)代表了乘性干扰。另外短波信道中还存在着加性干扰,可分为两种类型:一类是高斯白噪声NG(t),服从均值为零的正态分布;另一类是冲激噪声NI(t),服从对数正态分布。那么,Watterson模型的输出信号可表示为

$y (t) = \sum_{i = 1}^{Ν} G_{i} (t) x (t - τ_{i}) + Ν_{G} (t) + Ν_{Ι} (t) (2)$

使用Simulink实现短波语音Watterson模型[7],模型如图5所示,首先将要发送的语音信号通过Wavread函数读入到M文件中,然后对获得语音信号进行Hilbert变换,得到实部和虚部正交的复信号,再通过To Frame模块将基于采样的格式转换为基于帧的格式,之后将信号送入模型的核心单元Multipath Fading和AWGN信道,最后再将格式转换为基于采样的格式,分离实部和虚部,输出到M文件中。

参数设置时,在Multipath Rayleigh Fading Channel和AWGN Channel中设置信道的多普勒频扩(Doppler Spread)、多径延迟时间(Delay Vector)和各路径增益(Gain Vector)。采样速率为12 000 Hz,载频为1 800 Hz,采用双径模式(一条为主径,一条为多径),时延设为20 ms,衰落设为10 Hz,多普勒扩展为20 Hz,在AWGN Channel模块中设置信道的信噪比为10 dB。

3 仿真结果及分析

3.1 地面网络理想情况下的质量评估

首先要采用不同的语音编码技术对样本a.wav进行编解码,分别得到重构后的语音,再将重构后的语音送入短波电台在接收端接收到最终的话音,不同编码标准得到的话音如表2所示。

编解码后的话音以及经过短波传输后的部分话音波形如图6～10所示。

通过PESQ模型[8],对经过编解码和短波信道后的语音质量进行评估。PESQ评估模型是一种基于输入-输出方式的客观评价模型,效果良好。与其他客观评估算法相比,PESQ评估模型不仅采取了听觉模型等比较先进的技术,同时也考虑了语音端到端的时延,对通信时延、环境噪声都有较好的稳健性。

PESQ评估模型是将原始语音和输出的语音信号经过电平调整、输入滤波器、时间对准和补偿、听觉变换之后,综合时频特性,得到PESQ分数,最后将得分映射到主观平均意见分(MOS)上,模型流程如图11所示,PESQMOS值为-0.5～+4.5,语音质量等级与MOS值(取值范围0～5)类似。不同的语音编码技术对应的PESQMOS值如表3所示。

3.2 地面网络丢包率对语音质量的影响

丢包率是影响质量的重要因素之一,在此利用Matlab程序对丢包率进行人为控制,通过50次重复仿真,得到不同丢包率下4种编码算法的平均值如图12所示。

通过仿真结果可以看到编解码后的语音质量评估值都能达到良好以上,而且G.711 A率和μ率编解码后的语音质量要明显好于G.728和G.729标准,但经过短波信道后,接收端的语音质量G.729,G.711 A率和μ率比较接近,G.728的值却相对较小。由图12可知,在丢包率小于3%前语音质量都未受到明显影响,当丢包率逐渐增大时G.728和G.729受影响较大,当丢包率大于7%以后4种编码技术下的语音质量急剧下降,语音质量损失严重,MOS值小于0.5,人耳识别困难。

以上结果说明,虽然经过G.728和G.729标准编解码后的语音信号具有较为相近的PESQMOS值,但G.729标准重构后的语音信号对短波信道的适应能力要优于G.728标准。G.729标准重构后的语音信号与G.711 A率和μ率相比虽然对短波信道的适应能力相对较弱,但相差不大,如果再考虑地面IP网络中语音包(ED137文件中推荐以20 ms的数据为一个语音包)的负载,G.729标准又相对占据了优势。因此,如果地面IP网络的带宽足够宽,建议采用G.711 A率或μ率,而如果带宽受限,则建议采用G.729标准。

4 小结

VoIP应用与航空通信领域,是近年来才提出的新课题,还未进入实用阶段。本文以短波地空通信为背景,通过仿真实验,为短波地空组网中地面VoIP话音编码的选择提供了参考意见。但由于短波信道采用的仿真环境与不稳定的真实传输环境还有差别,所以只能作为实际使用的参考。下一步的工作将以G.729标准为例,引入具体IP网络,研究时延、时延抖动对航空语音通信的影响权值,从而设计出更适合与航空语音通信的QoS保证技术,提高接收端的语音质量。

参考文献

[1]章学静,何素娜,李金平.基于TMS320DM642的VoIP可视电话的关键设计[J].电视技术,2009,33(06):105-108.

[2]贾懋珅,鲍长春,李锐.8～64Kb/s超宽带嵌入式语音频编码方法[J].通信学报,2009,30(5):27-34.

[3]张继东,陆义宁.ITU-T中两种低码率语音编码系统的性能比较[J].电声技术,2001(12):6-8.

[4]ED-137,Interoperability standards for VoIP ATM components[S].2009.

[5]范睿,鲍长春,李锐.基于ACELP的嵌入式语音编码算法[J].通信学报,2007,28(10):48-54.

[6]张尔扬,王莹,路军.短波通信技术[M].北京:国防工业出版社,2002.

[7]权明波,朱小明,吴江.基于Watterson模型的短波信道的Simulink研究与仿真[J].无线通信,2007,242(3):20-22.

VoIP语音篇3

1 语音拨号方案设计

本案例中Vo IP电话网由分布在各地的10个路由器组成, 大部分路由器都利用FXS模块连接了4到8部模拟电话 (与程控交换机互联的路由器不连接模拟电话, 仅配置了E1语音模块) 。程控交换机所在的语音网络使用5位号码方案, 分配给Vo IP电话网的局号为559xx。因此, 按照每台路由器占用第1位号码, 每部电话占用第2位, 即可达到充分利用号码资源、简化路由器设置的目的, 又为未来电话终端扩充预留了余地。

因Vo IP电话网内电话业务量较多, 进行方案设计考虑三个方面的内容:Vo IP电话网内部通话时直接拨两位号码即可;拨打程控交换网时通过拨0再拨五位号码实现外部通话;Vo IP电话网部分电话设置为热线电话, 即一方拿起话机, 设定的另一部电话即可振铃, 实现热线功能。

2 Vo IP电话网的构建

Vo IP电话网典型设备的语音硬件配置如下表所示:

拓扑示意图如下:

Vo IP电话网的调试工作非常简单, 设置各路由器相应的语音配置, 以及12与22之间的热线电话设置。

3 实现与程控交换网的双向语音通讯

通过2M数字电路 (利用运营商或者租用卫星链路) , 基于一号信令与程控交换机实现语音双向通讯。中国1号信令为随路信令, 为30/32时隙2048K局间中继传输方式, Timeslot 16被用来传递其话音通道的信令, 记发器信令为MFC (多频互控) , 线路信令a, b, c, d为xx11。

首先, 在ZJ2851上配置E1卡, 使之与PBX能够互相识别并通讯。配置顺序如下:

通过show controller和show voice port命令可以确认线路和端口均被正确配置无误。

其次, 在ZJ2851上继续配置有关命令。最后, 在BJ2851、ZS3825、JS3825上分别设置以下命令:

当程控交换机的操作管理员也相应设置完毕后, 就可以开始双向语音测试了。

4 总结

VoIP语音篇4

Vo IP (Voice over Internet Protocol) 又称作IP电话, 是建立在IP技术上的分组化、数字化传输技术, 其基本原理是:通过语音压缩算法对语音数据进行压缩编码处理, 然后把这些语音数据按IP等相关协议进行打包, 经过IP网络把数据包传输到接收地, 再把这些语音数据包串起来, 经过解码解压处理后, 恢复成原来的语音信号, 从而达到由IP网络传送语音的目的。基本传输过程可以分为五步:模拟语音的数字化、原始数据到IP的转换、传送、IP包到数据的转换以及数字语音转换为模拟语音[2]。

由于Vo IP技术低廉的通话费以及清晰稳定低时延的语音质量、灵活的体系结构, 本文用其实现无线语音通信系统。

系统采用802.11b无线标准, 工作在2.4GHz的自由开放ISM频段, 比较适合煤矿井下的无线电环境。

AP (Access Point, 接入点) 是网络中无线和有线网络之间的桥接, 由一个无线输出口和一个有线的网络接口构成, 相当于网络中的基站, 将语音通信网中的终端Wi-Fi手机聚合到网络中;Wi-Fi手机支持SIP协议, 网络无线终端设备, 可以实现无线语音通信;语音服务器IP-PBX的作用是对网络中的终端设备进行管理。系统中选用IP02作为IP-PBX。IP02是一个两端口的IP-PBX, 这两个端口分别为FXS口 (简称为S口) , 将模拟电话连接到S口上, 此模拟电话就可以成为系统中的一个终端, 实现普通模拟电话和系统中Wi-Fi手机的通信;另一个为FXO口 (简称为O口) , 将PSTN与O口相连可以实现PSTN内的电话与系统内部Wi-Fi手机的通信。

2 井下实验

井下实验选在内蒙古上湾煤矿地下150m处的一条水平巷道, 该巷道的宽度和高度均为4.2m, 移动PC上装有用于抓取无线网络数据的软件Omni Peek, 通过Omni Peek抓取的数据可以对网络中的语音包进行分析。两个Wi-Fi手机的号码分别为6001和6002 (实验布线图略) 。

3 实验结果

实验中通过两个手机的互拨来验证在煤矿井下该系统是否可以实现语音通信。实验证明, 该系统的语音通信质量良好。由于煤矿井下没有其他同频段的无线系统产生干扰, 通话时声音清楚没有杂音。

IP02可以保存经过它的所有呼叫的详细呼叫纪录 (CDR, CallDetail Record) , 在CDR中, 每一行代表着一次呼叫的详细记录, 包括呼叫双方、呼叫号码、通话开始时间、通话结束时间、通话持续时间以及呼叫时的各种状态, 每一个值都由逗号分隔开来。

通过CDR可以清楚地看到两个手机之间的通信记录。

CDR中记录的各项有:计费码accountcode, 如果使用了Set Account应用, 或者通道配置文件已经配置好了, 计费码将会作为基础信息分配到每一个通道中;接收到的主叫方I D;目的地Extension;目的地context;文本格式的主叫方ID;使用的通道;可能存在的目的通道;可能存在的最后一个应用;最后一个应用的数据;呼叫开始的时间;呼叫接通的时间;呼叫结束的时间;整个呼叫持续的时间, 也就是呼叫从开始到结束, 规定使用秒来计费;整个呼叫通话的时间, 也就是从呼叫接通开始到通话结束, 规定使用秒来计费;这个呼叫的情况, 也就是说该呼叫时接通、没有接通或者是忙音, 以及此次呼叫使用什么样的标识符, 文档、计费还是忽略, 使用在每个基础的通道中, 就像是accountcode一样。

从CDR中还可以看出, 该呼叫由6001发起, 被呼叫分机号码为6002, 由于此次呼叫为局域网内部的分机呼叫, 所以为免费, 可能存在的目的通道是SIP/6002&IAX2/6002&Zap/2, 整个呼叫持续的时间为80秒, 整个呼叫通话的时间为60秒, 呼叫的情况为接通, 并且此次呼叫使用的标识符为文档。其他呼叫也可以从各自的记录中得到具体信息。

还有一个重要指标就是语音延时, 如果语音延时超过1s, 则一个正常的通话几乎不能忍受。

下面就对本文的无线语音通信系统的延时进行测试。

由RTP协议可知, 在语音包延时测试中, 只要在发送端和接收端中找到具有相同RTP时间戳的语音包, 并将语音包在接收端的接收时间和在发送端的发送时间相减就可以得到语音包的延时。实验中语音数据包的发送端为Wi-Fi手机, IP地址为192.168.1.108或192.168.1.107, 经过IP02 (IP地址为192.168.1.141) 后最终达到目的端, 数据包的接收端同为Wi-Fi手机, IP地址为192.168.1.107或192.168.1.108。

为了使测试结果更加准确, 取9个语音包计算相应的延时, 然后取平均值所得结果如表1。

从表1中可以看出, 此无线语音通信系统在煤矿井下通信时语音延迟很小, 具有良好的通信效果。

4 结语

本文针对现有煤矿井下通信系统中存在的问题提出了一个基于Vo IP技术的无线语音通信系统, 通过实验证明, 该系统可以实现煤矿井下的通信并且具有良好的通信效果。

摘要：煤矿井下通信系统是整个煤矿安全生产的重要部分, 现代化的通信技术能迅速掌控局面, 使损失降到最低。而我国目前井下通信系统一般都是有线通信, 存在着一旦有一处线路发生故障, 将会导致整个通信系统瘫痪的风险[1]。基于Vo IP技术的无线语音通信系统可以解决此类问题, 实现井下现代化管理, 提高劳动生产率, 保障矿工和国家财产安全。

关键词：煤矿井下,VoIP,无线通信

参考文献

[1]黄伟, 姚善化.矿井移动通信技术难题及解决方案探讨.煤矿机械, 2003 (12) .

VoIP语音篇5

VoIP是基于Internet的新型数字化传输技术,是IP网上通过TCP/IP协议实现的一种电话应用技术。这种应用包括PC对PC、PC对电话、电话对电话等连接方式,其业务主要包括语音业务、E-mail、实时电话、实时传真等多种形式。与传统电话相比,IP电话的优点主要是节省带宽、通话费用低、易于开发增值业务、体系结构开放,有利于多种通信方式的统一。对VoIP技术的研究主要围绕改善IP电话服务质量来进行,尤其是使用先进的硬件技术、可靠的实时传输技术和能随着网络状况自适应调整速率的低速率语音编码技术等研究及工程热点。

研究与实现基于嵌入式处理器的Vo IP语音传输系统,可集成嵌入式系统、网络通讯、多媒体和语音处理等应用领域内的前沿技术,将嵌入式系统的高性能、低功耗、网络通讯的低成本特性融合于一体,经过进一步完善后可以取代固定电话,并发展可视电话等信息终端,可以实现电话网、广播电视网与Internet网的整合,具有很大的经济和技术优势。

1 PXA255嵌入式处理器

本文研究与设计的嵌入式IP数字语音系统将在以太网环境中工作。与目前大多数基于PC的IP电话终端相比,选择嵌入式IP电话终端具有如下优势:

(1)嵌入式硬件平台可以进行裁减和定制,因而可以大幅降低IP电话终端成本;

(2)可以定制嵌入式软件平台,容易升级,实时性好,而基于PC机的IP电话占用资源多,操作系统复杂,容易死机;

(3)嵌入式IP电话终端功耗低,可以使用电池进行供电,因而系统具有小型化、便携的特点,这是PC所无法比拟的。

PXA255处理器是Intel公司带ARM核的多媒体处理器。PXA255处理器的内部功能模块框图见图1所示。

PXA255处理器具有如下特色:核心频率支持100~400MHz;多种系统存储器接口;外设资源非常丰富:有PCMCIA/Compact Flash卡控制引脚、LCD控制器、全功能UART、USB客户端、AC97控制器、15个灵活的GPIO引脚等。

2 VoIP的嵌入式Linux环境构建

嵌入式IP语音终端使用的嵌入式Linux平台可分为三个层次:应用软件层次、Linux内核层次和设备驱动层次。其中平台无关部分包括:Linux实时内核、文件系统、应用软件等部分;平台相关部分包括:硬件驱动的改造和启动过程改造,我们需要针对不同平台进行代码改造,编写各种驱动。由图2可知,Linux对各种设备的操作都是以文件的形式进行的。

基于RTP协议的语音实时网络传输软件,位于Linux网络结构的Socket应用层,如图3所示。在嵌入式Linux平台上利用Socket系统函数实现语音传输的RTP应用。在具体编程时,Linux平台上可供选用的语言有C、C++等。在这里我们也采用C语言,并采用编译器Arm-Linux-Gcc。语音处理的音频库函数使用OSS(Open Sound System)。

嵌入式IP终端系统软件界面采用QT/Embed编程。利用qte的界面编程辅助工具QT Designer能很方便地实现界面规划布局。由于是可视化编程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML语言编写的.ui文件,通过QT附带的工具UIC,能让*.ui文件生成*.h和*.cpp的文件格式。使用QT Designer大大降低了编程的工作量,并且能得到所见即所得的图形效果。

3 语音编解码器选型

对语音信号,有许多压缩算法和标准。这些编码算法可按照编码系统码率大小、输入信号频带宽度、所采用的编码技术等方面进行分类。编码系统优劣的评价主要体现在编解码系统的性能指标上,一个编解码器系统有输出声音的质量、编码速率、复杂度、迟延和容错性等性能指标。

(1)编码速率。编码速率指的是编码器对输入声音经过压缩后每秒的比特数,即压缩后的传码率。这是编码系统的一个十分重要的指标。降低比特率而维持较高的解码声音质量,是语音和音频信号压缩编码的主要任务和主要目标。对电话级别的语音带宽而言,通常认为比特率超过16kb/s的为高速编码,而速率在8~16kb/s范围的为中速率编码,速率在8kb/s以下的为低速率编码。

(2)输出声音的质量。输出声音的质量是指经过编码系统再经过接收方的解码后恢复出的声音质量。衡量输出声音质量主要有二个指标:客观质量和主观质量。客观质量法易测量,但往往不能精确反映语音质量。由于声音的最终接收者是人,所以主观法更能反映声音质量的真正好坏,但它测试不易,费时费力。

(3)复杂度。在传统电话应用中,很少使用压缩,是因为压缩算法的复杂度太大,算法执行时间长,算法的延迟也一起带入到通信系统中。随着技术的进步,芯片处理速度越来越快。现在工程上一般采用单片数字信号处理器DSP芯片来实时实现语音编解码。语音编解码算法的复杂度可由算法所需的计算量、存储量、硬件尺寸、消耗功率及价格来衡量。

(4)时延。时延指完成编解码算法所需的时间。对于语音编解码器来说,时延也是一个非常重要的指标,如果时延太大,听起来很不舒服。对于时延,不同的应用场合有不同规定,如对长话网不加回波抑制的单向编解码时延不得大于10ms。对可视电话则放松到不超过500ms。对VOIP语音系统的时延要求不超过300ms。

(5)容错能力或鲁棒性。容错能力指编解码系统抗误差、线路噪声等各种干扰的能力。

表1对几种编码器的比特率、主观平均意见分法(MOS)、复杂度(以G.711为基准)和时延(帧大小)做了比较。

本系统选用GSM 06.10语音标准算法,该算法在1988年被确定为数字移动通信的语音编码标准,其编码速率为13kb/s,算法简单,运算量小,语音质量高,接近32kb/s的ADPCM(ITU-G.712)。

4 IP语音实时传输系统设计

本文采用Intel公司推出的PXA255处理器,该芯片专用于网络和多媒体。其最高工作频率可达400MHz,并带内存管理单元MMU和DSP协处理器,可方便与高清晰的彩色LCD接口,同时该芯片可扩展连接AC97音频芯片CS4201、高性能网络接口芯片LANC9196,可方便移植嵌入式Linux和图形界面等。

基于PXA255处理器的IP语音系统用方案具有如下优势:将先进的硬件技术和软件技术有机融合,充分利用PXA255和Linux的强大功能,克服了传统的基于单片机功能不足和基于PC的非实时性的缺点,具有实时性、低成本、小型化、专用化和高可靠性的优点,能让IP数字语音终端系统具有更好的可扩展性和可移植性,与ARM7或DSP的方案相比,在技术上同样具有一定优越性。

系统设计硬件框图见图4所示。

系统设计语音流程框图见图5。

5 系统测试

将两个语音终端连接到局域网,分别设置其IP地址为192.168.0.100、192.168.0.101。整个软件的运行过程:在语音传输之前,首先由网络连接(通话双方的呼叫连接)模块进行呼叫连接,呼叫连接建立后,双方就可以进行接下来的语音通话,实现语音传输。

在送话方即发起会话的一方:语音首先通过麦克风进入系统,在语音录入与播放功能模块内进行录音,然后进入语音数据压缩、解压模块进行压缩,压缩后的语音数据打包后,以语音数据包的方式发送。

在受话方即接收会话的一方:通过网络传输过来的语音数据拆包后,首先进入语音数据缓存模块进行缓存,这种缓存方式可以保证语音回放连续和不失真,然后进入语音数据压缩与解压模块对其进行解压。经过语音解压缩过程以后,语音数据送入语音录入与播放功能模块内,通过扬声器进行播放,最终还原成语音。

测试过程中,我们使用RTP工具集rtptools-1.18中的rtpplay、rtpdump、rtpsend等命令截取语音实时传输模块在网络中的语音包,观察其RTP和RTCP报文,分析网络的当前状况等。网络的当前状况与语音传输延迟有很强的正相关性。网络状况好,传输延迟小,网络状况不好,传输延迟增大。

语音延时测试方法:因为语音传输的延迟时间在1s以内,用秒表或其他外设来测量,误差大、精度不高,所以我们基于软件的方式测量。通过在RTP工具集中设置一个计时器,计算时间差,记录端到端的语音延时。最后求平均值,延时数据见表2。测试分8组,每组10到40个延迟数据不等,表中数据为每组的延迟平均值。

8组的所有测试数据有210个,所有测试数据的平均延时计算过程:

由计算可知,平均延时约为272ms。满足本文第三节中VoIP语音时延的上限300ms的要求。

6小结

论文研究了IP语音传输系统的总体架构,实现了一个基于PXA255处理器的嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10的语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能,通过系统测试,语音时延符合工程要求,具有较好的实时性。

摘要：文章研究IP语音传输系统的总体架构,实现了一个基于PXA255处理器的嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能。

关键词：语音压缩,网络电话,嵌入式Linux,实时传输

参考文献

[1]Caputo R.Cisco分组语音与数据集成技术[M].章立生,等译.北京:机械工业出版社,2000.

[2]舒华英,赖平漳,区锐.IP电话原理技术应用[M].北京:人民邮电出版社,2000.

[3]Goncalves M.IP网络语音技术[M].王文东,等译.北京:机械工业出版社,1999.

[4]Black U.VoIP:IP语音技术[M].,温斌,等译.北京:机械工业出版社,2000.

[5]易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2000.

[6]杨行峻,迟惠生,等.语音信号数字处理[M].北京:电子工业出版社,1995.

[7]贾龙涛,鲍长春.基于NS的自适应多速率网络语音通信的性能分析[J].通信学报,2006,27(6):121-125.

[8]焦传斌,于保华,李治柱新型宽带语音编解码器AMR-WB的研究[J].计算机仿真,2005,22(1):50-52.

VoIP语音篇6

传统语音通信系统使用公众电话网 (PSTN) 作为传输媒介, 采用电路交换方式, 传输的是模拟信号。电话通信的电路一旦接通后, 电话用户就占用了一个信道, 无论用户是否在讲话, 只要用户不挂断, 信道就一直被占用着。因此用电路交换方式时线路利用率很低, 至少有60%以上的时间被浪费掉。

目前, 公共电话交换网 (PSTN) 在企业中仍然应用广泛, 但是这种语音通信方式通话资费高昂, 企业每年花费巨大。近年来计算机和网络技术发展迅猛, 企业自建的办公互联网已经初具规模, 但是这些网络一般只是用来进行数据传输, 网络带宽没有得到充分利用, 浪费严重。随着光网络技术、通信技术、各种信息技术的快速发展和数字传输技术的应用, 推动了IP技术的飞速发展, 网络的带宽和稳定性都得到了很大的提高, VOIP (又称IP电话) 已经可以逐步取代传统语音通信。使用IP电话不仅可以为企业集团节省昂贵的长途电话费, 同时还能充分利用企业已建办公网络资源, 发挥办公网络潜力, 大大降低企业运作成本。

2 VOIP 原理

传统电话传输的模拟信号可以被IP电话系统转换为数字信号, 再将数字信号按照IP协议打包, 通过互联网进行传输, 同时在接收端再把数据包转换成模拟信号最终变成声音信号。IP电话系统对带宽的利用率是传统电话的5.8倍, IP电话的传输速率约占用8.1kbit /s带宽, 而普通电话约占用64kbit / s带宽。在VOIP系统中起核心作用的是IP电话网关。IP电话网关将地区IP地址与各地区电话区号一一对应, 这些对应信息存放在一个专门的数据库中。VOIP系统拨打电话的过程是, 在拨打完电话号码后, 处理器在数据库中查询, 找到该区号对应的IP地址, 然后将IP数据包, 按照该地址选择最短的路径进行传输, 到达对方的IP电话网关。如果对方所处的地区没有互联网或者没有IP电话网关, 那么IP数据包就先传输到离对方最近的IP网关, 然后再转换为普通电话信号, 接入到PSTN, 最终到达对方的电话机上。

3 基于 IP 电话技术的语音通信系统设计

企业集团建立的办公网络模式不一, 有的总部和分公司的办公网络采用专线接入互联网, 通过虚拟专用网络 (VPN) 或多协议标签交换 (MPLS) 技术连接到一起, 并具有固定IP地址和足够使用的网络带宽。这种情况下要组建VOIP, 只需要购置IP电话网关、IP电话机等设备即可。有的总部和分公司的办公网络没有连接在一起, 组建VOIP系统时, 首先要通过VPN或者MPLS技术把两者的办公网络连接起来, 再增加一些IP电话网关设备和相应的IP电话机等即可构建。另外, 企业集团内部是否设置了自己的PBX交换机, 也会使VOIP系统的构建方式有所不同。当然, 设置有PBX交换机的企业也可以另外建立VOIP系统。

3.1 应用企业已有的 PBX 交换机

利用企业现有的PBX交换机组建VOIP, 可以为企业省掉部分投资费用。为了组建VOIP, 需要在总部和分公司各购置一台IP电话网关。然后将网关的中继线接口与现有的PBX交换机连接, 再将企业的办公网络接入到网关的LAN ( 局域网 ) 接口。在使用时, 通过对PBX进行设置, 来选择是拨打传统电话, 还是拨打IP电话。例如当通过数字中继接入系统时, 拨9接入PSTN, 拨0接入IP网络。当通过模拟中继接入系统时, 中继线的条数可以根据具体的话务量来选择, 同样可以对PBX进行设置, 拨9时选择1 ~ 4条中继线接人PSTN, 拨0选择5—8中继线接入VOIP系统。

3.2 采用 IP PBX 交换机

如果不利用现有的PBX交换机, 可以另行购置IPPBX交换机来组建VOIP系统。IPPBX交换机整合了IP网关和交换机的功能。IPPBX交换机具有模拟和数字中继模块, 通过中继接口可以接入到PSTN, 通过配备的LAN口可以接入到互联网络。IP电话机可以由网线直接接入到VOIP系统, 普通电话机和传真机则可以由模拟中继模块的FXS接入。同样需要对IPPBX进行设置, 来选择是拨打传统电话, 还是拨打IP电话。

由于VOIP系统依托互联网进行传输, 所以存在着因互联网故障或者系统断电而导致整个VOIP无法使用的风险。这个问题目前无法克服, 因此要适当保留几部传统电话以备不时之需。

4 总结

随着计算机技术、网络技术的快速发展, IP电话系统终将会取代传统的电话通信系统。新建的语音通信系统可以完全采取IP电话技术进行设计, 已有的传统语音通信系统也可以通过改进, 接入IP语音通信网络。企业采用IP语音通信系统, 不仅可以节省大量的通信资费, 也可以很方便的接入一些基于IP技术的多媒体业务, 更为以后的语音技术发展预留了升级的空间。

参考文献

[1]白雪.Vo IP系统在大型企业的应用[J].大连理工大学, 2008.

[2]舒华英, 赖平漳.IP电话技术及其应用[M].人民邮电出版社, 2000.

VoIP语音篇7

根据国际Soft Swich论坛ISC的定义, Soft Swich (软交换) 是基于分组网利用程控软件提供呼叫控制功能和媒体处理相分离的设备和系统。因此, 软交换的基本含义就是将呼叫控制功能从媒体网关 (传输层) 中分离出来, 通过软件实现基本呼叫控制功能, 从而实现呼叫传输与呼叫控制的分离, 为控制、交换和软件可编程功能建立分离的平面。软交换主要是提供连接控制、翻译和选路、网关管理、呼叫控制、宽带管理、信令、安全性和呼叫详细记录等功能。与此同时, 软交换还将网络资源、网络能力封装起来, 通过标准开放的业务接口和业务应用层相连, 可方便地在网络上快速提供新的业务。

一、软交换技术的网络结构

软交换是下一代网络的核心设备之一, 各运营商在组建基于软交换技术的网络机构时, 必须考虑到与其它各种网络的互通。在新一代网络中, 应有一个统一的网络系统结构。

在软交换技术的网络结构中, 软交换位于网络控制层, 较好地实现了基于分组网利用程控软件提供呼叫控制功能和媒体处理相分离的功能。

软交换与应用/业务层之间的接口提供访问各种数据库、三方应用平台、功能服务器等接口, 实现对增值业务、管理业务和三方应用的支持。其中:软交换与应用服务器间的接口可采用SIP、API, 如Pararlay, 提供对三方应用和增值业务的支持;软交换与策略服务器间的接口对网络设备工作进行动态干预, 可采用COPS协议;软交换与网关中心间的接口实现网络管理, 采用SNMP;软交换与智能网SCP之间的接口实现对现有智能网业务的支持, 采用INAP协议。

通过核心分组网与媒体层网关的交互, 接受处理中的呼叫相关信息, 指示网关完成呼叫。其主要人物是在各点之间建立联系, 这些联系可以简单的呼叫, 也可以是一个较为复杂的处理。软交换技术主要用于处理实时业务, 如话音业务、视频业务、多媒体业务等。

软交换之间的接口实现不同与软交换之间的交互, 可采用SIP-T、H.323或BICC协议。

二、软交换技术的设计原理及其实现目标

软交换技术是一个分布式的软件系统, 可以在基于各种不同技术、协议和设备的网络之间提供无缝的互操作性, 其基本设计原理是设法创建一个具有很好的伸缩性、接口标准性、业务开放性等特点的分布式软件系统, 它独立于特定的底层硬件/操作系统, 并能够很好的处理各种业务所需要的同步通信协议, 在一个理想的位置上把该架构推向摩尔曲线轨道。并且它应该有能力支持下列基本要求: (1) 独立于协议和设备的呼叫处理和同步会晤管理应用的开发; (2) 在其软交换网络中能够安全地执行多个第三方应用而不存在由恶意或错误行为的应用所引起的任何有害影响; (3) 第三方硬件销售商能增加所支持新设备和协议的能力; (4) 业务和应用提供者能增加支持全系统范围的策略能力而不会危害其性能和安全; (5) 有能力进行同步通信控制, 以支持包括帐单、网络管理和其他运行支持系统的各种各样的后营业室系统; (6) 支持运行时间捆绑或有助于结构改善的同步通信控制网络的动态拓扑; (7) 从小到大的网络和生错信和支持彻底的故障恢复能力。

软交换的实现目标是在媒体设备和媒体网关的配合下, 通过计算机编程的方式来实现对各种媒体流进行协议转换, 并基于分组网络 (IP/ATM) 的架构实现IP网、ATM网、PSTN网等的互连, 以提供和电路交换机具有相同功能并便于业务增值和灵活性伸缩的设备。

三、软交换多使用的主要协议

软交换体系涉及协议非常众多, 包括H.248、SCTP、ISUP、TUP、INAP、H.323、RADIUS、SNMP、SIP、M3UA、MGCP、BICC、PRI、BRI等。国际上, IETF、ITU-T、Soft Switch ORG等组织对软交换机及协议的研究工作一直起着积极的主导作用, 许多关键协议都已制定完成, 或趋于完成。这些协议将规范整个软交换的研发工作, 使产品从使用各厂家私有协议阶段进入使用业界共同标准协议阶段, 各家之间产品互通成为可能, 真正实现软交换产生的初衷———提供一个标准、开放的系统结构, 各网络不见可独立发展。

四、软交换技术的主要特点和功能

1. 软交换技术的主要特点。

(1) 支持各种不同的PSIN、ATM和IP协议等各种网络的可编程呼叫处理系统; (2) 可方便地运用在各种商用计算机和操作系统上; (3) 高效灵活性; (4) 开放性:通过一个开放的和灵活的号码簿接口便可以再利用IN (智能网) 业务。例如, 它提供一个具有接入带关系数据库管理系统、轻量级号码簿访问协议和事务能力应用部分号簿的号码簿潜入机制; (5) 为第三方开发者创建下一代业务提供开放的应用编程接口 (API) ; (6) 具有可编程的后营业室特性。例如:可编程的时间详细记录、详细呼叫时间写道一个业务提供者的收集事件装 (下转第6页) (上接第56页) 置中; (7) 具有先进的基于策略服务器的管理所有软件组件的特性。包括展露给所有组件的简单网络管理协议接口、策略描述语言和一个编写及执行客户策略的系统。

2. 软交换多种逻辑功能实体的结合。

它提供综合业务的呼叫控制、连接和部分业务功能, 是下一代电信网语音/数据/视频业务呼叫、控制、业务提供的核心设备。主要功能表现在以下几个方面: (1) 呼叫控制和处理为基本呼叫的建立、维持和释放提供控制功能; (2) 协议功能支持相应标准协议, 包括H248、SCTP、H.323、SNMP、SIP等; (3) 业务提供功能可提供各种通用的或个性化的业务; (4) 业务交换功能; (5) 互通功能可提供各种网关实现与响应设备的互通; (6) 资源管理功能对系统中的各种资源进行集中管理, 如资源的分配、释放和控制; (7) 计费功能根据运营需求将话单传送至计费中心; (8) 认真授权功能可进行认证与授权, 防止非法用户或设备接入; (9) 地址解析功能和语音处理功能。

五、基于软交换的应用

随着通信网络技术的不断发展和软交换各种标准的制定与补充, 不少厂家都推出了软交换的解决方案, 各运营商也在积极进行相关试验。目前, 国内许多电信设备制造商, 如西门子、阿尔卡特、爱立信、北电、中兴等都在积极发展新的交换机过渡平台, 提出了软交换在下一代网络中的解决方案。这里简要介绍以下软交换在VOIP中的应用。它的功能非常类似于现行电路交换传送系统间的交换/长途网, C4交换机用软交换系统和一组中继网关的组合体所取代。中继网关自身是由软交换技术利用主/被叫协议控制, 这个协议就是与来自某个具有指定源/目的的RTP UDP/IP流的电路交换机的一个制定时隙相关的MGCP/IPDC协议。

软交换技术作为呼叫出力的组成部分, 其表示要被用来终结该呼叫的最有可能的出口网关, 并利用这个信息来命令中继网关执行所指定的功能, 亦即软交换技术能够通过选择一个最小代价的路由来完成每次呼叫, 已使所选择的出口网关最接近目的电话。于是, 就完成了原有通过电路交换网执行的呼叫操作功能。接入网关既可以中介ISDN的PRI, 也可以终结来自企业PBX的CAS信令。这种接入网关能够被软交换以基于分组电话协议的多种方式进行控制;对于基于H.323协议的网关, 软交换能够像一个H.323网关那样动作;如果接入网关隧道PRI (Q>931或CAS信令返回到软交换, 那么软交换还能够使用像MGCP/IPDC协议以更好的方式控制介入网关。这也体现了软交换技术处理接入网关的能力。

软交换技术通过SIP协议街道电缆网络上, 以支持企业的IP PBX及IP电话。它还能够通过TCP/IP协议介入SCP, 也可通过TCP/SCCP协议接入到SS&网络上, 使无缝互联成为可能。

【VoIP语音】推荐阅读：

语音语音教学计划06-08

语音知识07-14

语音研究07-16

语音问题07-20

数字语音07-21

语音功能05-09

语音变化05-15

语音处理05-23

语音理论06-03

语音传输06-06