语音传输系统

2024-08-11

语音传输系统(精选12篇)

语音传输系统 篇1

1. 引言

语音教学对语言学习起着重要作用,发音错误就导致读不好、听不准,从而直接影响到词汇的记忆、积累以及听说能力。目前英语语音教学一般采用教师朗读,学生跟读;教师演示发音口形,学生模仿;教师播放录音,学生跟读等常规教学方式。这些方式单调、枯燥、抽象,受授课地点、时间的限制,调动不起学生的学习积极性。

为了解决英语语音学习中所出现的问题,提高语音教学质量,笔者设计了一个基于语音合成技术的可视英语语音教学辅助系统。系统可把学习者任意输入的单词、短语、句子用高质量的合成语音播放出来,同时将对应口形以动画形式生动形象地同步表现出来,学习者可参照系统模仿跟读,改进发音。

2. 英语语音教学系统软件设计与实现

除了听到的声音外,人说话时口形的变化有助于学习者对语言的理解,是人获取信息的重要渠道,学习者可根据口形变化模仿、对比、调整发音,语音中称之为视位。音位和视位是语音的两个基本特性,因此本系统在合成语音同时显示出口形变化,来改善传统语音软件只能听声的弊端。

2.1 设计思路

系统主要通过Microsoft Speech SDK提供的关于语音处理的应用程序编程接口SAPI进行可视语音合成开发。通过调用相关接口,系统允许学习者自己设定男女发音音调、音量和朗读速度,可以根据通知消息实时获得当前音素或视位信息并转换为口形动态显示出来。

2.2 总体设计

基于语音合成技术的可视语音教学系统的主体部分实现过程如下:

(l) 初始化引擎,注册回调函数,载入所有口形图片;

(2) 用户设定语速语调,输人文本;

(3) 调用SAPI函数朗读;

(4) 接收音素通知消息,根据音素值,变换为口形并同步显示。

2.3 详细设计

国际标准MPEG-4对视位的定义为与某一音位相对应的嘴唇、舌头、下愕等可视发音器官所处的物理状态,在此我们将其简化为口形。通过对英语发音口形的大量研究,将英语的音素发音按照口形进行分类。有些音素单从口形上看基本相同,比如[p][b[m],虽然三个音素气流、舌位变化不同,但其口形都是先闭合后张开。最终确定了常用单音素和22个基本静态口形的映射规则,如图1所示,系统初始化时须将此22个口形载入。

系统初始化完成后,学习者根据实际学习情况调整语速、语调、音量、语气,自行输入单词或句子,系统根据设定值调用以下函数朗读文本:

SpVoice1->Speak (WideString (UserText) , SVSFDefault) ;

朗读开始,声音将被合成并播放,遇到音素或视位变化时,系统会接收到SAPI发送的反馈消息,此时可根据当前音素或视位信息显示对应口形图像,关键代码如下:

为了得到自然的语音口形动画,可以通过图像变形方法在两个口形之间插入若干补间帧来平滑过度。

3. 结束语

利用此种可视语音合成技术进行英语语音教学, 可以提高学习效率,因人施教。但要想达到好的教学效果,语音库的选择很重要。微软、IBM、Nextup.com等多家公司都在研发自己的语音库,对比发现,好的语音引擎发音标准,相应嘴形配合到位,学习者可以更好的掌握发音。

摘要:语音合成技术是人机智能交互的关键技术, 本文描述了一种利用语音合成技术产生实时语音及其口形变化的英语语音辅助教学软件。该软件系统可以使语音教学更加生动形象, 增强学习交互性, 灵活性, 提高学生参与学习的主动性和积极性, 使学生更加容易和牢固地掌握语音知识。

关键词:英语语音教学,语音合成,可视语音

参考文献

[1]MPEG-4, 国际标准ISO/IEC14496[S].

[2]Microsoft.Speech API[EB/OL]http://www.microsoft.com/speech/developers.aspx, 2010

[3]胡壮麟.语言学教程 (修订版) [M].北京:北京大学出版社, 2001

[4]张鸽.创新性英语音素教学模式--多媒体人机互动式自主学习模式的理论与设计[J].外语电化教学, 2008.

[5]鲁杰, 王永斌.利用SmartRead SDK实现文本的语音合成[J].计算机与数字工程, 2009.

语音传输系统 篇2

点击主面板右上角菜单中的基本设置

启动和登录

勾选开机时自动启动之后会在每次启动电脑的时候,会自动启动软件

勾选启动时自动登录之后会在每次电脑启动软件的时候,软件会自动登录

主面板

选择最小化时当点击主面板关闭按钮时,会直接把主面板最小化到任务栏通知区域

选择退出程序当点击主面板关闭按钮时,会直接关闭,

 

QT语音系统基本设置

热键设置

热键设置,为了方便您有习惯键盘操作软件的习惯

显示主窗口,主窗口指QT语音主界面

增加音量,是指增加扬声器音量

减少音量,是指减少扬声器音量

极速模式,是指极速模式主界面

单片机倒车防撞语音播报系统 篇3

【摘 要】单片机倒车防撞话音播报本系统由超声波测距仪、温度补偿装置、液晶显示器、单片机微处理器、语音播报器和电源组成。本系统克服了现有倒车雷达系统的不健全用问题,降低了倒车碰撞事故的发生概率。

【关键词】单片机倒车防撞语音播报系统 ISD4004语音模块 超声波测距 倒车防撞

随着社会的发展,汽车的数量也在大幅攀升。汽车在倒车时屡屡发生碰撞事件,造成了人身伤亡和经济损失。针对这种情况,本文设计了单片机倒车防撞语音播报系统以单片机STC89C52为核心,通过超声波测距模块,在整个倒车过程中自动测量出车尾到最近障碍物的距离,然后通过语音模块播报并在液晶显示屏显示距离,提醒驾驶员注意刹车。

单片机倒车防撞语音播报系统框图如图1所示:

图1 单片机倒车防撞语音播报系统框图

一、硬件设计

(一)主控制器

采用STC89C52单片机。它有8kb的FPEROM和256字节RAM,可满足系统编程需要,并且价格低廉,性价比高,可以支持TTL电平直接下载程序,不需要专门编程器烧写程序。

(二)显示部分

采用LCD16O2液晶显示屏。它是一种专门用于显示字母、数字、符号等点阵式LCD,其拥有友好的人机界面及强大的显示功能,特别适用于智能控制的可编程人性化显示。与中文液晶显示相比,英文液晶显示其编程更简单,具有功耗低,体积小,重量轻,寿命长,不产生电磁辐射污染等优点。

(三)语音提示模块

使用ISD4004语音模块。ISD4004系列单片语音录放电路是美国ISD公司的新一代产品,同早期美国ISD公司产品一样,它采用了ISD公司的Chip-Corder专利技术,多级存储技术,既声音无须A/D转换和D/A转换,采用直接模拟量存贮技术,因此能够真实、自然地再现语音、音乐效果声音,避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。

(四)超声波测距电路

采用HC-SR04 超声波测距模块。它可提供 2cm-400cm 的非接触式距离感测功能, 测距精度可达高到 3mm。模块包括超声波发射器、接收器与控制电路。 工作时,采用IO口TRIG触发测距,给至少10us的高电平信号,模块自动发送8个40KHZ的方波,自动检测是否有信号返回,有信号返回,通过IO口ECHO输出一个高电平,高电平持续的时间就是超声波从发射到返回的时间。测试距离=(高电平时间*声速(331.5+0.607*当前温度M/S))/2。

二、软件设计

软件系统采用模块化程序设计方法,分为主程序、显示程序、温度传感器程序、语音模块程序等。

(一)主程序主要完成1602LCD液晶屏的初始化,测量当前温度,发信号给超声波模块开始测距,计算距离(采用温度补偿),查询静音按键是否按下,按下关闭语音,没按下进入录音模式,然后进行语音播报距离等工作。

(二)1602LCD液晶显示程序主要完成显示模式初始化,模式设置,关闭显示,屏幕清屏,显示开启及设置光标起始位置,写地址,写数据,直到数据全部写完等工作。

(三)温度传感器程序主要完成对温度的读取,以便超声波模块计算距离时进行温度补偿,提高测距的精度。

(四)语音模块程序主要完成读取距离信息进行录音,调用语音片段进行播放测量出的距离等工作。

三、结束语

本文采用超声波测距,以声音和直观的LCD显示屏告知驾驶员汽车尾部障碍物的情况,解除了驾驶员在倒车时前后左右探视所引起的烦扰。由于采用了语音芯片,能够及时播报出当前的距离,克服了现有倒车雷达系统不健全的问题,降低了倒车碰撞事故的发生概率。

【参考文献】

[1]元红妍.电子综合设计实验教程[M].济南:山东大学出版社, 2005.

[2]雷思孝,李伯成,雷向莉.单片机原理及实用技术[M].西安:西安电子科技大学出版社, 2004.

ZigBee语音传输分析 篇4

无线语音技术从早期的模拟无线语音到目前的数字无线语音技术, 经历了一个比较漫长的过程。随着无线通信技术的发展, 特别是无线射频收发器成本的逐年下降, 数字无线语音通信逐渐成为市场应用主流。最简单的例子莫过于对讲机, 目前仍然广泛使用的是模拟对讲机, 而高档的数字对讲机正在降低成本, 逐渐蚕食模拟对讲机的市场。

ZigBee原本定位于小数据量的通信, 但是本身250 kb/s的通信速率也是足以满足基本语音通信的, 几大射频芯片厂商都有基于ZigBee的语音通信方案, 本文将对ZigBee语音通信技术做一些探讨。

2 ZigBee语音通信分析

ZigBee传输语音数据属于数字传输, 数字通信系统在本质上有着一些巨大的优势:首先是抗干扰能力强。模拟信号在传输过程中很难与叠加的噪声分离, 噪声会随着信号被传输、放大, 严重影响通信质量。数字通信中的信息是包含在脉冲的有无之中的, 只要噪声绝对值不超过某一门限值, 接收端便可判别脉冲的有无, 以保证通信的可靠性。其次是远距离传输仍能保证质量。因为数字通信是采用再生中继方式, 能够消除噪音, 再生的数字信号和原来的数字信号一样, 可继续传输下去, 这样通信质量便不受距离的影响, 可高质量地进行远距离通信。此外, 它还具有适应各种通信业务要求 (如电话、电报、图像、数据等) , 便于实现统一的综合业务数字网, 便于采用大规模集成电路, 便于实现加密处理, 便于实现通信网的计算机管理等优点。

标准的ZigBee传输数据率为250 kb/s, 目前厂商支持的传输速率可以达到1 Mb/s, 更高的传输速率意味着更低的接收灵敏度, 也意味着更短的通信距离, 因此在话音质量要求不高的场合, 尽量使用最低可接受最差通话质量, 即最低通信流量, 以保证通话距离。

在250 kb/s的通信速率下, 理论上有25 kB/s的传输流量, 可以满足电话质量, 即ITU-TG·711标准, 8 kHz取样, 8 bit量化, 码率64 kb/s, 而AM广播采用ITU-TG·722标准, 16 kHz取样, 14 bit量化, 码率224 kb/s, 标准ZigBee 250 kb/s也是可以满足的。

无线语音通信因为传输的数据量要尽量少, 因此通常需要采用语音压缩算法先将数据进行压缩, 然后再传输, 接收方按照对应的解压算法解压后播放, 常见的三种语音编码解码算法为:μ-law、a-law、ADPCM。

μ-law算法是一种压扩算法 (companding algorithm) , 主要用于北美和日本的数字通信系统。与其他压扩算法一样, 其目的是减少音频信号的动态范围。在模拟域中, 这可以提高发送过程中的信噪比 (SNR) ;在数字域中, 则可以减少量化误差 (quantization error) (因而提高了信号-量子化噪声比 (SQNR) ) 。反过来, SNR的这些改善又可以减少带宽和等效SNR。

a-law算法也是一种标准的压扩算法, 被欧洲数字通信系统用来优化/修改数字化模拟信号的动态范围。

a-law算法以更坏的小信号比例失真 (proportional distortion) 为代价, 提供的动态范围比μ-law稍微宽一点。

自适应差值脉冲编码调制 (ADPCM) 是在差值 (或增量) 脉冲编码调制 (DPCM) 基础上发展起来的, 它主要改变了量化级数, 从而可以进一步减小某一特定信噪比所需的带宽。DPCM将PCM值编码成当前值和之前值的差。对于音频, 这种编码方法可以将每次采样的位数相对PCM减少25%左右。

3 系统构成

ZigBee语音通信系统由音频ADC芯片采集语音数据, 经由I2S总线传输到带语音处理单元的单片机 (如ZICM2410芯片) 中, 经过硬件编解码单元, 进行数据压缩, 可选μ-law、A-law和ADPCM等, 然后进入MAC层的FIFO, 最后通过PHY层调制成射频信号发射出去。接收端的结构与发射端相同。

因为采用射频数据打包的分组传输方式, 因此可以实现数字全双工通信, 这也是普通模拟对讲机不能实现的。系统数据流图如图1所示。

为保证语音数据的高速传输, 语音芯片和CPU最好使用I2S总线, I2S (Inter—IC Sound) 总线是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准, 该总线专责于音频设备之间的数据传输, 广泛应用于各种多媒体系统。它采用了沿独立的导线传输时钟与数据信号的设计, 通过将数据和时钟信号分离, 避免了因时差诱发的失真, 为用户节省了购买抵抗音频抖动的专业设备的费用。CPU和音频编解码芯片的连接如图2所示。

4 ZigBee语音路由分析

点对点的通信通常距离不远, 在语音通信中更是如此, 因为数据量本身已经接近最大带宽, 又考虑到音频图像等的传输对于细节数据不太敏感, 一般不做确认重发机制, 所以通信距离甚至只能达到数据通信距离的一半。如果要增加通信距离, 则必须增加中继节点, 随之而来的是音质降低了一半。

以已经实现的一个无线语音中继系统为例, ZICM2410模块本身可以实现16 kHz采样率, 8 bit位采样 (单身道) , 也就是每秒钟可以传输16 KB的数据, 但是为满足中继需要, 只能降到8 kHz采样率, 时隙上的分析如下。

如图3所示, 16 kHz, 8 bit采样, 每4 ms发送一次64 B的语音数据, 8 kHz, 8 bit采样, 每8 ms发送一次, 增加中继之后, 源节点每8 ms发送一次 (8 kHz, 8 bit) , 而中继节点收到数据后, 会有一个存储转发的过程, 大致4 ms, 这时, 如果通过ZigBee分析仪查看, 依然会看到每4 ms一个无线数据包, 和之前16 kHz采样时的时间占用是一样的。

这样的时隙下, 即使发送机、接收机和中继器放在一起, 也是不会有影响的, 因为接收机接收时会有帧序号比对, 收到中继的重复数据包会立即丢掉, 一旦离开源节点信号覆盖范围, 接收节点就只能收到中继节点的数据了。

如果位置选择合适, 则这种中继可以延续下去;否则再加一级中继, 会打乱原先系统的时隙。

5 ZigBee语音应用

ZigBee语音传输比较合适的是导游解说系统。在同一处旅游景点, 可能有不同的导游向不同的游客介绍景观。如果使用一般的扩音系统, 往往会出现导游之间互相比嗓子, 或者抢游客的尴尬局面, 在一些文化底蕴很浓的场合, 这样闹哄哄的场面往往会破坏景点本身的意境。

使用ZigBee技术可以非常容易地解决这个问题, 如图1所示的点对点通信, 只要发送端设置为广播模式发送数据, 即可在有效通信范围内, 配置不限数目的接听节点 (因为接收节点并不发数据, 因此技术上不存在节点限制, 只有空间上的体积限制) , 而不同导游之间, 采用不同的物理频段 (标准ZigBee总共16个) , 彼此之间是不会干扰的。

6 小结

基于激光天线语音通信系统的研制 篇5

摘要:通过对电磁波无线、光纤及现有的激光无线通信的优缺点分析,介绍了一种结构简单的激光无线语音通信系统的结构及主要硬件的设计。经实际应用表明:该系统能够灵活地适应各种场合。

关键词:激光 无线通信 语音

电磁波作为无线通信的信号载体由来已久,至今仍广泛应用于短波、微波、毫米波无线通信。但它们存在致命的缺陷:保密性差、通信容量低、波段资源受限制等。光纤通信以光作为载体,以光纤作为传输介质。由于光的频带资源十分丰富,故通信容量巨大,已成为现代通信的主体。但光纤通信网络包括光端机、光缆等通信基础设施的建设是事先规划的、固定的,将会出现光缆没有到达或光缆不便到达的地址,无法进行光纤通信。早在二十世纪70年代,人们就开始了激光大气通信技术的研究,但由于当时光纤通信较为成功,激光自由空间的通信未能得到充分重视。近几年来,由于移动通信的需要和微波通信的带宽限制,光自由空间的通信取得了很大的进展。美国朗讯公司采用1.55μm波段的半导体激光器加光纤放大器(EDFA)作为发射光源,并采用波分复用结构,实现10Gbps容量的空间光通信。日本、欧洲等国家也报道了几种空间激光通信装置。我国电子科技大学采用二氧化碳激光器(10.6μm波长,内腔式),实现定点双工四线制三路电话的大气通信(技术成果编号88210414);中山大学激光与光谱学研究所采用音频或数字信号的调幅激光制式工作实现大气通信传输(技术成果编号89209283)。但它们都因通信容量低,在通信系统的结构上,没有与其他通信设备(包括光纤通信、微波通信)的接口,故实用价值小。为解决上述问题,中国科学院上海光学精密机械研究所报导了一种无线激光通信端机实现了与其它通信设施的接口(技术成果编号00217069.8),但由于该端机设备昂贵,未能得到广泛应用。本文提出了基本激光无线语音通信系统的研制,目的在于提供一种价格便宜、携带方便、同机具有激光信号发射和接收装置,且激光接收装置具自动跟踪激光发射装置的双工通信功能的设备。该设备发射装置发出调制激光信号不仅可在自由空间传输,也能直接利用光纤作为载体传输,克服了在天气恶劣情况下无法通信的缺陷;该设备信号传输容量大,可直接与光纤通信、微波通信网络并网,并能灵活地适应各种场合的使用。

图1 空间激光无线通讯系统原理框图

1 总体方案设计

激光天线通信系统主要由激光发射装置、激光接收装置和光学望远镜三部份组成(如图1所示)。其工作原理是:发射端的轴电缆通过高频电缆与发射机码型变换器相接;光纤适配器通过光纤与发射机光电转换器相连;码型变换器与光电转换器均与制式选择开关相连,然后经信号处理模块进行整形、放大、时钟提取等处理,输入激光驱动器使激光器组件产生调制的激光光束,通过激光发射天线定向向空间发射。经光接收天线收集的调制激光信号接进探测器,转换成信号输入信号处理模块,再接进制式选择开关后分两路:一路连接激光驱动器,经光纤适配器连接光纤通信线路;另一路则与码型变换器相接,再接入同轴电缆至电传输线路上。对于本系统所设计的语音激光无线通信系统主要由图2所示的各部分组成。

(本网网收集整理)

2 主要硬件的设计

2.1 激光器件的选择

空间激光通信波长选择主要考虑:尽量避免太阳辐射的影响、减小光束发射角、减小收发天线的尺寸、光波在大气中的透过率以及器件的现实性或预期的可行性,包括器件性能价格比的预计。从激光天线通信的角度分析,大气的透射率是个重要影响因素。在小于300nm的紫外波段,大气的透过率急剧下降。显然,紫外线光不利于大气通信。可见波段的激光,例如二次倍频YAG激光器,也不利于避免太阳光引起的背景辐射噪声。常用的`激光波段有830~860nm、980~1060nm和1550~1600nm,都是良好的大气窗口。

2.2 光发射与接收天线

由于光学天线的功能是将需传输的光信号有效地发向对方并将对传来的信号光高效接收,因此,光天线的设计是在满足总体设计的前提下,保证系统在设定的通信距离及大气衰减时能正常工作,合理选取发射远镜的远场发散角、接收望远镜的接收视场角及光学系统的其他参数。下面分别予以介绍。

(1)设计考虑

主要光学性能要求:高的光学质量(λ/20RMS);低的遮挡率;高的光透射率(T≥0.92);低的散射光。此外,要求材料热膨胀系数小、机械强度纺高、重量轻、使用寿命长。

图3 (a)光发射天线系统原理图(b)光发射天线系统原理图

光学设计考虑:为了满足空间通信对天线的要求,笔者选择卡塞格伦天线。主要包括:抛物面初级反射镜;双曲线次级反射镜;聚焦镜,使成像在天线结构的外部。

(2)性能分析

假设光源电场强度满足高斯幅度分布,即

其中,ω为光腰大小,R表示曲率半径。

利用非涅尔近似场区的辐射定律以及天线增益定义,得到观测点(r,θ)处的天线增益值:

其中,

定义:

α=a/ω,γ=b/a,X=kasinθ,β=(ka2/2)[(1/r)+(1/R)]

次级反射镜的遮挡率,天线的误指向效应以及光学天线的桁架对天线增益都有较大影响。此外,对接收无线的增益,检测方式也有较大影响。

在光学设计时,为了满足空间通信对天线的要求,光发射天线系统如图3(a)所示,它由半导体激光器和设置于其光路上的发射镜构成。光接收天线系统如3(b)所示,主要由校正镜、校正镜2次镜胶合镜、主镜、滤光片、聚光镜胶合镜和滤光片聚光镜、探测器等组成。其中,探测器采用SI-PIN GT101型复合光电二极管完成光信号转换为相应的电信号。该器件在反向偏置条件下工作,当光照时,半导体吸收光,在耗尽层或离耗尽层一个扩散长度内产生电子空穴时,最后被电场分开。当载流子漂移通过耗尽层时,在外部电路中形成电流,从而实现光电转换。

图4 激光无线通信(发送器)原理图

2.3 主要电路设计

・电源电路选用了集成稳压器。

・前置处理电路主要包括前置放大器和功率放大器两部分。经内调制转换的电信号通常比较微弱,需经前置放大电路将前级电路的输出电压放大。故前置处理器质量的优劣,在很大程序上标志着系统整体的音质水平。即前置处理器与功率放大器的选择对于本系统非常重要。本系统采用集成芯片NE5532作为前置放大器,LA4101作为功率放大器。同时,为获得较好的效果,减小干扰,在信号输入前置放大器之前,设计了高通滤波器。

・调制电路对光源进行调制的方法有若干扰,但从光源与调制器之间的关系可分:光源的内调制、光源的外调制。本系统采用了光源的内调制方式。

・功率放大电路因光电探测器的电信号较弱,需经功率放大器放大电压信号,产生足够的不失真的输出功率,以推动扬声器发音。放大器的种类较多,本系统采用集成电路功率放大器LA4101。

上述设计的发射电路如图4所示,接收电路如图5所示。

图5 激光无线通信(接受器)原理图

3 试验样机及结论

在上述设计思想指导下,完成了一个5km的激光无线大气通信机试制。通信光源采用波长为0.885μm的半导体单模量子阱激光器 ,用芯径为200μm的光纤耦合,出纤光功率为200mW。光天线发射/接收望远镜的通光孔径为φ110mm,激光远场发射角为1.5mrad,接收视场角为3mrad。

本系统兼容128/256/512/1024/2048kbps速率,并具有AMI及HDB3,码两种接口功能。该系统已进行了户外开通试验。将其设备分别设在相距约5km的两栋高楼之间(要求视距无遮挡),进行了长达360h的开通试验,其中经历了大雾、大雨、小雨、晴天等天气变化。试验结果表明,除能见度极你的大雾天气外,通信系统都能正常工作,通话质量良好。该个有以下优点:

(1)具有双工位功能;

(2)可实现单对多的多通道通信;

(3)通过光学望远镜检测发射部分与接收部分之间的对正情况;

(4)结构简单,携带方便;

(5)具有与光纤通信接口,适用范围广,特别适用于两河对岸、高山之间、高层建筑之间的无线通信;

语音传输系统 篇6

【关键词】语音同传;FPGA;数字锁相

引言

DSL是一种数字用户线路技术,针对该技术的研究及应用,在上世纪90年代初开始,当时的DSL为HDSL(高速数字用户线),传输速率一般为2M,解决交换机之间数字中继的传输,传输距离比较近,为3Km左右,用户主要为电信局[1]。本论文研究正是基于DSL、高速数據复分接、FPGA数据处理、模拟驱动前端、话音编解码等技术,构建一个在通信容量、实时性、抗干扰能力、可靠性和低功耗等方面比传统通信网有明显的提高的有线语音同传系统的设计与实现。

1.系统工作原理及组成

1.1 系统原理分析

PCM(脉冲编码调制)通信系统模型在发送端通过抽样、量化、编码将模拟信号变换成数字信号,经信道传输到达接收端,在接收端先由译码器恢复抽样值序列,然后经低通滤波器滤出模拟基带信号[2]。PCM时分多路复用系统模型在各路PCM通信系统模型的基础上增加了利用FPGA作为数据处理器的复用器和分路器。

1.2 系统结构

数话同传设备电路主要是由主处理器模块、数据复分解模块、用户接口模块、显示模块、收发器模块、电源变换模块、工作模式设置模块和网络接口模块等组成。主处理器模块主要是用FPGA芯片和ARM芯片来实现的。采用Altera公司的FPGA芯片EP1C3T144C8N为处理器,主要完成收发器模块的初始化管理和控制、工作模式的设置和控制、工作状态的显示等。ARM芯片主要是处理视频文件的播放,采用SAMSUNG公司的S3C2440作为为核心处理器来处理视频播放文件。数据复分接单元主要由串口数据、网络接口单元、用户接口单元,控制信令、数据复分接单元和收发器单元组成的。收发器单元由曼彻斯特编码器模块、曼彻斯特解码器模块、发送缓冲器、接收缓冲器、配置寄存器、通讯存储器控制单元和主控制单元FPGA等部分组成。用户接口电路主要是完成与子机终端的接口,主要是由安全保护电路、用户馈电电路和话音编解码电路组成。电源电路主要采用DC/DC,主要实现12v直流电源到+5v、-5v、+9v、+1.8v和+3.3v的变换。显示模块分为两部分,主机通过液晶屏来显示当前的播放模式和图像的播放,子机通过数码管来显示当前语音通道的选择和音量的大小。

2.系统硬件组成

系统分成主机部分和从机部分,传输线采用常用的5类以太网双绞线,各子机模块通过分路器并联连接在总线上,且总线上带有12V的直流馈电,各子机供电均来自总线上。

主机可最大输入30路的语音信号,语音信号通过前级的300Hz~3400Hz带通并放大后,送入到脉冲编码(PCM)芯片进行模拟信号数字化过程,转换成8位串行信号,输入到FPGA芯片,FPGA将30路的串行信号进行复接并插入帧同步码元和控制码得到码元速率为2Mbit/s的码元流。为了提高信号在信道中的传输距离,FPGA对2Mbit/s的码元流进行编码,从而得到4Mbit/s的CMI码元流,并把CMI编码进行单极性码到双极性码的变换,经过隔离变压器后送入双绞线进行传输。考虑到子机的供电问题,双绞线采用常用的5类以太网网络线,包含了4对双绞线,其中1对用于传送码元,1对用来传送12V直流馈电,另外2对为地线。子机可以通过按键任意切换30个来自主机的语音信号进行接收,子机首先通过在双绞线上取得直流馈电,并从将总线上的双极性信号转换成单极性信号送入FPGA进行数据的分接处理,分接后得到当前时隙的串行语音数据,送入PCM译码芯片进行数模转换,将音频信号进行数字音量的控制和放大后输出。

3.系统软件组成

帧复接与分接部分软件。该系统软件主要由FPGA复接和分接软件组成,FPGA编译器采用ALTERA公司的Quatrst II9.0,该编译器编译界面友好,生成代码效率高,占用资源空间小,使得控制起来更为实时、方便、高效,也使得程序可读性和可维护性更强。

为了能够保证在子机具有很好的同步性,分接软件中核心部分为位同步信号的提取。位同步的方法有插入导频法(外同步法)和直接法(自同步法)2种[3],直接法又分为滤波法和锁相法2种,本系统选用数字通信中常使用的数字锁相法进行位同步信号的提取。

系统采用了改进型的30/32路PCM的帧结构,一帧由32个时隙组成;一个时隙为8位码组。时隙1~30共30个时隙用来传送30路语音信号;时隙0(TS0)是“帧定位码组”,用于发/收端同步,固定内容为00011111;时隙31(TS31)用于传送主机到子机的控制指令。

FPGA数字锁相法提取位同步信号过程主要包括:本地高速时钟源、位同步基准提取、相位比较器和分频器等构成。

总线上传输数据为差分的双极性码元,通过变换后输入到FPGA的码元是不归零的随机二进制序列,不包含同步信息,进入FPGA后需要将该码元进行微分、整流,使之成为归零脉冲,才能从中提取位同步信息。信号提取的过程:利用FPGA芯片EP1C3T100C8N中的内置锁相环(PLL)将本地的32.768MHz时钟6倍频后得到196.608MHz的高速时钟,然后以这个高速的时钟为基准对输入的2Mbit/S的码元进行微分整流得到位同步基准,并将他送入相位比较器,相位比较器将他和分频计数器的输出进行比较,并判断是同步、滞后还是超前,然后输出相应的控制信号给控制器,控制器再对分频值进行相应的调整,直到输入和输出同步为止,最终锁相输出256KHz的位同步信号。

在总线帧结构中,一共包含了32个时隙,其中的TS32时隙用于传送数据指令,也就是说可以通过主机下达除语音信号以外的广播控制指令。主机广播下达的八位二进制值0000,0000代表所有子机关机;八位二进制值0100,0000代表所有子机开机;八位二进制值10XX,XXXX代表主机广播子机音量控制(6Bit);八位二进制值1100,0000为预留位。

4.结论

本系统很好的利用了PCM时分复用结构,以FPGA为核心实现了将多路语音信号和数据指令同时按照时分复用的方式复接在传输线上,到达接收端后,子机可以通过按键任意选取通道进行语音数据的接收,所有子机也可以通过主机进行广播控制。由于本系统采用全数字方式进行传输,传输过程中语音信号清晰、无杂音,可以很好的运用在国际会议上的同声传译、飞机和旅游巴士中的音频同传等系统当中,具有很好的实用价值。

参考文献

[1]许博.高速有线数话同传技术研究[M].北京:北京邮电大学,2010.

[2]樊昌信.通信原理[M].北京:国防工业出版社,2001.

车站列车信息语音提示系统 篇7

铁路运输系统是一个大型综合性系统, 为保证整个系统的安全、稳期的维护是必要的, 但随着列车运行速度的不断提高, 特别是近几年多次大提速之后, 如何在正常施工维护设备的过程中保证铁路职工的人身安全的问题变得越来越难解决;长期以来, 老式室内室外分别盯看、配合通知的方式已无法解决运输速度与人身安全的矛盾, 因此, 如何利用现代成熟的先进技术, 正确及时地获取列车的运行实际位置, 自动给予施工者以声音提示, 已成为当前保障施工防护中人身安全的当务之急。

1 方案介绍

全自动站场信息无线语音提示系统由监测采集机 (既有) 、监测站机 (既有) 、地面信息处理机、手持电台 (既有) 等组成。

整个功能实现的系统结构图见图1。

1.1 各部分组成及作用

1.1.1 监测采集机:

实时在线采集站场开关量和模拟量。

1.1.2 监测站机:

对监测采集机上送的开关量和模拟量进行综合处理, 形成语音提示信息, 以串口通讯的方式, 在符合发送条件时, 将“列车接近、信号开放”等语音提示信息通过声卡发送给地面信息处理机。

1.1.3 地面信息处理机:

把监测站机送达的语音信息, 进行电平转换后加到电台的音频输入接口发射。

1.1.4 手持电台:

收听地面信息处理机发送的语音提示信息。

1.2 具体功能实现过程

在微机监测站机中增加声音驱动卡, 端口扩展卡。通过专用通讯线连接微机监测站机和地面信息处理机。

在监测软件中增加对进站与出发信号机、熔丝断丝报警、信号机灯丝断丝等关键信号设备的分析, 使列车在一接近、二接近、进站信号开放、出发信号开放、熔丝断丝、灯丝断丝、轨道电路异常红光带、信号非正常关闭时输出声音提示信息。

在信号机械室内安装地面信息处理机, 接收站机声卡输出的语音信息, 然后通过无线对外发送。

室外手持电台与地面信息处理机在相同频点时, 即可接收室内发出的无线声音信息。

2 系统功能

2.1 基本功能

自动发送“列车接近、信号开放”等语音提示信息;

自动发送“灯丝断丝、熔丝断丝、异常红光带”等关键报警信息;

监测站机对所产生的语音提示信息进行记录并存储, 并提供查询窗口。

2.2 系统特点

投资少。利用既有的微机监测系统, 既有的手持台对讲系统, 增加少量设备即可完成系统功能。

高可靠性。由于利用了微机监测系统的采样, 保证了采样数据的高稳定性和高可靠性。微机监测站机软件又对数据进行了更加全面的分析判断, 保证了报警信息的多样性。

自动通知。系统通讯采用自动发送方式, 使地面信息处理机以无线方式自动向有关人员通知关键报警信息, 使现场施工人员和信号值班员能够及时准确地获取相关信息。

2.3 扩展功能

可利用微机监测的既有网络, 将各车站的语音报警信息传送到监测服务器, 监测各终端可调看所管辖范围内车站的语音提示信息。

3 设备技术条件

3.1 供电电源

地面信息处理机采用交流电源和蓄电池供电。交流供电电源220V (1±20%) 50Hz。在正常情况下, 交流供电并对备用蓄电池进行充电 (最大充电电流不大于5A) , 并具有过充过放保护功能。交流电源故障时, 自动转换至备用蓄电池供电 (标称电压12V) 。交流供电恢复后, 自动转换至交流供电。

3.2 工作环境要求:工作环境要求应符合表1规定。

3.3 安全要求

3.3.1 应符合GB.15842-1995标准的中5.2节有关规定。

3.3.2 产品所有可触及部分之间或可触及部分与地之间的峰值电压均不允许超过72V。

3.3.3 产品设有独立的安全接地端子, 并标有安全接地符号。

3.3.4 产品应装有有效断电的熔断器。

3.4 结构要求

3.4.1 结构工艺的一般要求

a.设备的结构应做到构件坚固、造型优美、色彩协调、面板表示清楚, 文字使用标准汉字, 操作方便、按键可靠。b.设备结构应在不打开机壳就能测量电性能, 应留有调制入等必须的测量接口。c.设备结构应便于维修、检测。装卸构件牢固耐用, 同型号设备的相同部件应能互换。

3.4.2 天线:

天线结构设计应牢固, 安装架设方便, 应防水、防电化学腐蚀。

3.5 可靠性指标

可靠性指标采用产品平均故障间隔时间MTBF值表示。地面信息处理机MTBF值应不低于600h。

可靠性试验方法应符合GB/T15844.3标准中第9节的有关规定。

3.6 地面信息处理机发射电台性能

3.6.1 发射频率:150.875MHz

3.6.2 频率容差:≤5*10-6

3.6.3 发射功率:5W可调

3.7 天馈线系统技术要求

工作频率范围:150.875±4MHz。

天线增益:4~8d B (全向)

天线端的标准阻抗:50Ω

电压驻波比 (VSWR) ≤1.5

极化方向:垂直极化

最大输出功率:不小于10W。

3.8 系统功能指标

3.8.1 列车接近

一是能准确提示接近方向 (上行、下行或其它方向)

二是能准确提示一接近、二接近

三是能准确提示进几股道

进站信号开放:能准确提示方向 (上行、下行或其它方向)

3.8.2 出发信号开放

一是能准确提示方向 (上行、下行或其它方向)

二是能准确提示几道出发

反向列车接近:能准确提示方向 (上行、下行或其它方向)

反向列车通知出发:能准确提示方向 (上行、下行或其它方向)

信号非正常关闭:能准确提示非正常关闭的信号机名称

熔丝断丝:能准确提示几排几架熔丝断丝

灯丝断丝:能准确提示灯丝断丝的信号机名称

异常红光带:能准确提示出现异常红光带的区段名称

道岔断表示:能准确提示出现道岔断表示的道岔名称

4 结束语

通过以上内容可知:本方案利用既有的信号设备, 增加少量的设备就能解决信号工现场维护维修的实际问题。本系统已经在本公司研制成功, 应用于铁路信号产品中。

摘要:文章提供种车站列车信息全自动无线语音提示系统的种设计方案, 它包括车站列车位置信息的自动生成、无线语音发送装置和手持电台部分。该方案利用既有的信号设备, 通过增加简单的设备就能够完成及时通知现场施工人员和信号值班人员“列车接近、信号放”及关键设备报警的语音信息。

关键词:无线,防护,自动,语音,报警

参考文献

[1]GB 15842-1995.移动通信设备安全要求和试验方法.

语音传输系统 篇8

VoIP是基于Internet的新型数字化传输技术,是IP网上通过TCP/IP协议实现的一种电话应用技术。这种应用包括PC对PC、PC对电话、电话对电话等连接方式,其业务主要包括语音业务、E-mail、实时电话、实时传真等多种形式。与传统电话相比,IP电话的优点主要是节省带宽、通话费用低、易于开发增值业务、体系结构开放,有利于多种通信方式的统一。对VoIP技术的研究主要围绕改善IP电话服务质量来进行,尤其是使用先进的硬件技术、可靠的实时传输技术和能随着网络状况自适应调整速率的低速率语音编码技术等研究及工程热点。

研究与实现基于嵌入式处理器的Vo IP语音传输系统,可集成嵌入式系统、网络通讯、多媒体和语音处理等应用领域内的前沿技术,将嵌入式系统的高性能、低功耗、网络通讯的低成本特性融合于一体,经过进一步完善后可以取代固定电话,并发展可视电话等信息终端,可以实现电话网、广播电视网与Internet网的整合,具有很大的经济和技术优势。

1 PXA255嵌入式处理器

本文研究与设计的嵌入式IP数字语音系统将在以太网环境中工作。与目前大多数基于PC的IP电话终端相比,选择嵌入式IP电话终端具有如下优势:

(1)嵌入式硬件平台可以进行裁减和定制,因而可以大幅降低IP电话终端成本;

(2)可以定制嵌入式软件平台,容易升级,实时性好,而基于PC机的IP电话占用资源多,操作系统复杂,容易死机;

(3)嵌入式IP电话终端功耗低,可以使用电池进行供电,因而系统具有小型化、便携的特点,这是PC所无法比拟的。

PXA255处理器是Intel公司带ARM核的多媒体处理器。PXA255处理器的内部功能模块框图见图1所示。

PXA255处理器具有如下特色:核心频率支持100~400MHz;多种系统存储器接口;外设资源非常丰富:有PCMCIA/Compact Flash卡控制引脚、LCD控制器、全功能UART、USB客户端、AC97控制器、15个灵活的GPIO引脚等。

2 VoIP的嵌入式Linux环境构建

嵌入式IP语音终端使用的嵌入式Linux平台可分为三个层次:应用软件层次、Linux内核层次和设备驱动层次。其中平台无关部分包括:Linux实时内核、文件系统、应用软件等部分;平台相关部分包括:硬件驱动的改造和启动过程改造,我们需要针对不同平台进行代码改造,编写各种驱动。由图2可知,Linux对各种设备的操作都是以文件的形式进行的。

基于RTP协议的语音实时网络传输软件,位于Linux网络结构的Socket应用层,如图3所示。在嵌入式Linux平台上利用Socket系统函数实现语音传输的RTP应用。在具体编程时,Linux平台上可供选用的语言有C、C++等。在这里我们也采用C语言,并采用编译器Arm-Linux-Gcc。语音处理的音频库函数使用OSS(Open Sound System)。

嵌入式IP终端系统软件界面采用QT/Embed编程。利用qte的界面编程辅助工具QT Designer能很方便地实现界面规划布局。由于是可视化编程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML语言编写的.ui文件,通过QT附带的工具UIC,能让*.ui文件生成*.h和*.cpp的文件格式。使用QT Designer大大降低了编程的工作量,并且能得到所见即所得的图形效果。

3 语音编解码器选型

对语音信号,有许多压缩算法和标准。这些编码算法可按照编码系统码率大小、输入信号频带宽度、所采用的编码技术等方面进行分类。编码系统优劣的评价主要体现在编解码系统的性能指标上,一个编解码器系统有输出声音的质量、编码速率、复杂度、迟延和容错性等性能指标。

(1)编码速率。编码速率指的是编码器对输入声音经过压缩后每秒的比特数,即压缩后的传码率。这是编码系统的一个十分重要的指标。降低比特率而维持较高的解码声音质量,是语音和音频信号压缩编码的主要任务和主要目标。对电话级别的语音带宽而言,通常认为比特率超过16kb/s的为高速编码,而速率在8~16kb/s范围的为中速率编码,速率在8kb/s以下的为低速率编码。

(2)输出声音的质量。输出声音的质量是指经过编码系统再经过接收方的解码后恢复出的声音质量。衡量输出声音质量主要有二个指标:客观质量和主观质量。客观质量法易测量,但往往不能精确反映语音质量。由于声音的最终接收者是人,所以主观法更能反映声音质量的真正好坏,但它测试不易,费时费力。

(3)复杂度。在传统电话应用中,很少使用压缩,是因为压缩算法的复杂度太大,算法执行时间长,算法的延迟也一起带入到通信系统中。随着技术的进步,芯片处理速度越来越快。现在工程上一般采用单片数字信号处理器DSP芯片来实时实现语音编解码。语音编解码算法的复杂度可由算法所需的计算量、存储量、硬件尺寸、消耗功率及价格来衡量。

(4)时延。时延指完成编解码算法所需的时间。对于语音编解码器来说,时延也是一个非常重要的指标,如果时延太大,听起来很不舒服。对于时延,不同的应用场合有不同规定,如对长话网不加回波抑制的单向编解码时延不得大于10ms。对可视电话则放松到不超过500ms。对VOIP语音系统的时延要求不超过300ms。

(5)容错能力或鲁棒性。容错能力指编解码系统抗误差、线路噪声等各种干扰的能力。

表1对几种编码器的比特率、主观平均意见分法(MOS)、复杂度(以G.711为基准)和时延(帧大小)做了比较。

本系统选用GSM 06.10语音标准算法,该算法在1988年被确定为数字移动通信的语音编码标准,其编码速率为13kb/s,算法简单,运算量小,语音质量高,接近32kb/s的ADPCM(ITU-G.712)。

4 IP语音实时传输系统设计

本文采用Intel公司推出的PXA255处理器,该芯片专用于网络和多媒体。其最高工作频率可达400MHz,并带内存管理单元MMU和DSP协处理器,可方便与高清晰的彩色LCD接口,同时该芯片可扩展连接AC97音频芯片CS4201、高性能网络接口芯片LANC9196,可方便移植嵌入式Linux和图形界面等。

基于PXA255处理器的IP语音系统用方案具有如下优势:将先进的硬件技术和软件技术有机融合,充分利用PXA255和Linux的强大功能,克服了传统的基于单片机功能不足和基于PC的非实时性的缺点,具有实时性、低成本、小型化、专用化和高可靠性的优点,能让IP数字语音终端系统具有更好的可扩展性和可移植性,与ARM7或DSP的方案相比,在技术上同样具有一定优越性。

系统设计硬件框图见图4所示。

系统设计语音流程框图见图5。

5 系统测试

将两个语音终端连接到局域网,分别设置其IP地址为192.168.0.100、192.168.0.101。整个软件的运行过程:在语音传输之前,首先由网络连接(通话双方的呼叫连接)模块进行呼叫连接,呼叫连接建立后,双方就可以进行接下来的语音通话,实现语音传输。

在送话方即发起会话的一方:语音首先通过麦克风进入系统,在语音录入与播放功能模块内进行录音,然后进入语音数据压缩、解压模块进行压缩,压缩后的语音数据打包后,以语音数据包的方式发送。

在受话方即接收会话的一方:通过网络传输过来的语音数据拆包后,首先进入语音数据缓存模块进行缓存,这种缓存方式可以保证语音回放连续和不失真,然后进入语音数据压缩与解压模块对其进行解压。经过语音解压缩过程以后,语音数据送入语音录入与播放功能模块内,通过扬声器进行播放,最终还原成语音。

测试过程中,我们使用RTP工具集rtptools-1.18中的rtpplay、rtpdump、rtpsend等命令截取语音实时传输模块在网络中的语音包,观察其RTP和RTCP报文,分析网络的当前状况等。网络的当前状况与语音传输延迟有很强的正相关性。网络状况好,传输延迟小,网络状况不好,传输延迟增大。

语音延时测试方法:因为语音传输的延迟时间在1s以内,用秒表或其他外设来测量,误差大、精度不高,所以我们基于软件的方式测量。通过在RTP工具集中设置一个计时器,计算时间差,记录端到端的语音延时。最后求平均值,延时数据见表2。测试分8组,每组10到40个延迟数据不等,表中数据为每组的延迟平均值。

8组的所有测试数据有210个,所有测试数据的平均延时计算过程:

由计算可知,平均延时约为272ms。满足本文第三节中VoIP语音时延的上限300ms的要求。

6小结

论文研究了IP语音传输系统的总体架构,实现了一个基于PXA255处理器的嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10的语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能,通过系统测试,语音时延符合工程要求,具有较好的实时性。

摘要:文章研究IP语音传输系统的总体架构,实现了一个基于PXA255处理器的嵌入式IP电话终端硬件平台,为该平台建立了一个优化的嵌入式Linux环境,并研究基于GSM 06.10语音编解码实现,设计了一个IP语音实时传输系统,实现了IP语音的网络实时传输功能。

关键词:语音压缩,网络电话,嵌入式Linux,实时传输

参考文献

[1]Caputo R.Cisco分组语音与数据集成技术[M].章立生,等译.北京:机械工业出版社,2000.

[2]舒华英,赖平漳,区锐.IP电话原理技术应用[M].北京:人民邮电出版社,2000.

[3]Goncalves M.IP网络语音技术[M].王文东,等译.北京:机械工业出版社,1999.

[4]Black U.VoIP:IP语音技术[M].,温斌,等译.北京:机械工业出版社,2000.

[5]易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2000.

[6]杨行峻,迟惠生,等.语音信号数字处理[M].北京:电子工业出版社,1995.

[7]贾龙涛,鲍长春.基于NS的自适应多速率网络语音通信的性能分析[J].通信学报,2006,27(6):121-125.

[8]焦传斌,于保华,李治柱新型宽带语音编解码器AMR-WB的研究[J].计算机仿真,2005,22(1):50-52.

智能语音驱鸟系统设计与实现 篇9

鸟类对农业生产的危害日趋严重,导致农产品产量和质量下降,造成巨大经济损失。农业生产中的传统驱鸟手段是利用巨大声响或视觉效果使鸟类受到惊吓来驱鸟,如敲锣、放炮、装稻草人等,这些方法由于具有单一性,驱鸟效果不佳。近年来,国外专家研究基于鸟类生活习性的防护技术,主要针对鸟类的听觉、视觉、嗅觉,并开发出一系列驱鸟产品,如超声波驱鸟器、激光驱鸟器、无公害化学驱鸟剂等。这些产品在国外应用初期都取得比较好的效果,但都面临鸟类适应性的问题,引进国内使用效果不佳,尤其以天敌鸣声为声音资料的驱鸟设备,由于种间差异性和地域差异性,国外鸟种的天敌鸣叫不一定适用于国内鸟种。此外,国外设备价格昂贵,难被国内用户接受[1]。

针对以上难题,需要研究低成本、抗适应性、适用于我国鸟种的驱鸟器。智能语音驱鸟系统以低功耗单片机为控制核心,利用音频加密技术,以语音芯片作为语音资料存储器,设计高保真、多模式语音播放实现良好的驱鸟效果。该系统低成本、易操作、驱鸟效果好等优点有利于在农业生产中推广,从而提高我国农业生产的科技水平。

1 系统方案设计

本系统主要从以下3个方面解决成本、适应性、鸟种差异性的问题:

1)采用低功耗、低成本51单片机作为控制核心,采用地址锁存器将16位地址总线扩展至20位地址总线,实现1MB的外部数据存储空间,可以存储8段语音数据,在语音输出过程中,并没有将其读入单片机内部,而是直接进行解密输出,降低了对单片机的要求,同时也保障了语音数据的安全,大大降低了系统成本;电源的设计也充分考虑到农田、果园等户外场所供电便捷性和安全性等因素,本系统为用户提供电源适配器和蓄电池两种供电方式,并增加了蓄电池保护电路,有效避免了蓄电池过度放电带来不必要的损失。

2)采用多模式播放方式抵抗鸟类对单一重复播放方式的适应性,可根据不同鸟类的生活习性设置“白天”“夜晚”“持续”3种工作方式;可以设置语音播放时间间隔,系统预设4种不同时间间隔,可根据实际情况来设置;可以设置语音片段的播放顺序,既可以针对一种鸟持续播放一种语音,也可以循环顺序播放多种语音,还可以随机无序播放;可以设置音量变化方式,既可以通过定位器来调节音量,也可以选择随机和渐变两种变化模式。由单片机自动调节音量的变化,以便有效克服鸟类对长时间固定音量播放的适应性。

3)采用语音芯片作为语音资料存储器,语音资料来源于对我国不同地区、不同季节的鸟害进行大量调研后采集的各种鸟类及其天敌的声音并经过处理和试验得到的有效驱鸟声音资料,针对不同地区和不同季节的不同鸟种,选择相应的语音芯片并及时更换。

2 系统硬件设计

2.1 系统硬件结构框图

系统硬件电路共有10个单元组成:电源、单片机微控制器、模式设定、实时时钟、光敏感应、音量调节、模式指示、语音存储、语音功放、语音播放。系统硬件结构框图如图1所示。

2.2 单片机微控制器[2]

本系统选用STC89C51RC系列单片机作为微控制器,该微控制器为增强型8051单片机,采用PQFP小型封装;内部集成4K的Flash程序存储器和512字节RAM以及2K的EEPROM;4个8位可编程并行I/O口(附加P4.0-P4.34个I/O端口); 8个中断源包括4个外部中断、3个定时器/计数器溢出中断和1个串行口的发送/接收中断,4个中断优先级;内置看门狗。该单片机成本低、性能好、防解密、功耗低(掉电模式:0.5μA,空闲模式:2mA)。单片机时钟引脚接12M晶振。

2.3 光敏感应

光敏感应[6]单元是根据检测光线的强弱来判断当前时间是白天还是夜晚,从而实现“白天/夜晚”两种工作模式,当设置为“白天”工作模式时,系统只在白天工作,夜间自动进入休眠待机状态;同理,当设置为“夜晚”工作模式时,系统只在夜间工作。电路主要由光敏电池、集成运放、与非门等器件组成。其电路图如图2所示。

当白天太阳光照射光电池,与光电池连接的运放输入端便产生一个电压信号,经放大后成为高电平信号,再经过与非门U1a转为低电平接到单片机外部中断0引脚,单片机作出相应的中断响应。

夜晚由于光线很暗,光电池产生电压极其微弱,此时U1b输出低电平到单片机外部中断1引脚,单片机作出相应的中断响应。

运放选用LM324;与非门选用74HC00,要求输入高电平最低2V,低电平最高0.8V。光电池在晴天阳光照射下产生电压在0.3~0.5V,需要通过定位器来调节放大倍数,使输出电压高于2V,达到与非门的输入要求;定位器起到调节光强检测灵敏度的作用,在阴天光线不足的情况下可以通过调节定位器提高光线感应灵敏度,或者将工作模式设置为“持续”,使系统在白天和晚上持续工作,不受光线影响。

2.4 语音存储

语音存储单元由存储芯片、锁存器和D/A转换芯片组成,原理图如图3所示。

语音存储芯片选用M27C801,该芯片存储容量为1M×8bit,需要20位地址线,8位数据线。为了节省单片机I/O端口资源,单片机的P0口分时提供所有20位地址总线,用两个8位地址锁存器74HC573管理地址信号,锁存使能端分别接到单片机不同的I/O端口,单片机通过控制片选实现分时发送20位地址线数据;存储芯片的片选接单片机的RD,低电平有效,数据输出使能端接单片机的P2.7端口,当P2.7端口电平负跳变时,存储器的数据输出端Q0~Q7读出语音信号;读出的数字语音信号经过D/A转换芯片AD557转换成模拟语音信号,以上便实现语音信号读出控制和数/模转换功能[7]。

经过D/A转换输出的模拟语音信号需要进行放大才能驱动扬声器,本系统功放芯片选用TDA1517,其固定功率放大增益为20db,并且具有静音/待机切换功能,可以由单片机的I/O端口配合开关器件控制语音功放输出。

2.5 音量调节

本系统在音量调节方面增加自动音量调节功能,利用带I2C总线功能的可编程数字定位器CAT5221,通过单片机程序控制电阻变化来控制功放输入信号电流的大小,实现音量自动调节,因此可以在程序中设置多种电阻变化的方式及幅度和快慢,从而实现相应的音量调节。

单片机可以利用两个I/O端口模拟I2C接口,I2C总线协议允许总线接入多个外围器件;数字定位器可以与实时时钟芯片共用数据线SDA和时钟线SCL,I2C总线的数据传输采用主从方式,即主器件(单片机控制器)寻址从器件(数字定位器和时钟芯片),启动数据传输,因此在数据传输过程中只需指定对应的器件地址即可[8]。

3 系统软件设计

系统软件主要分两部分:一是单片机控制程序;二是PC机环境下的声音加密程序。

3.1 单片机控制程序

单片机控制程序流程图如图4所示。

单片机控制程序的功能模块主要包括:定时模块、语音信号读取模块和播放控制模块。定时模块的功能是设定多个精确的播放时间间隔;语音信号读取模块的功能是按照播放要求准确地读取存储在语音芯片中的语音信号并进行解密;播放控制模块的功能是根据检测按键来设定不同的播放模式。

3.2 音频加密[3]

语音资料来源于对我国不同地区、不同季节的鸟害进行大量调研后采集的各种鸟类及其天敌的声音,为防止非法拷贝,不能直接存放在语音芯片中,需对其加密处理。

语音资料是以.wav为扩展名的波形音频文件,格式是资源交换文件格式(RIFF)。WAV文件格式是Windows中基本的声音格式,由于其文件格式固定,因此可以直接对其数据区进行加密和解密处理。WAV文件由两个子块构成:一个是“fmt”子块,用于存储波形格式信息;另一个是“data”子块,用于存储波形数据信息[4]。语音资料中的WAV文件采用PCM(脉冲编码调制)编码方式,其文件头为44字节,存放一些基本标志信息,从第45个字节开始就是“data”子块中的数据,存放的是声音数据[5]。单声道8位量化的PCM格式的WAV文件的声音数据存放形式如图5所示。

对WAV文件的声音数据采用具有良好随机性、难于破译的离散混沌系统序列加密方法进行加密,首先利用混沌系统产生混沌序列,再对混沌序列进行适当处理,然后利用处理后得到的序列与明文(声音数据序列)进行运算,得到密文,然后将加密后的WAV文件存放在语音芯片。用wav波形查看软件观察某声音片段加密前后的WAV文件声音波形如图6和图7所示。

从以上加密前后波形对比可以看出,经过加密后的声音波形与原语音信号的波形相差甚远,反映出良好的加密性。解密则是加密的逆过程,在单片机控制程序的播放子程序中,利用密钥产生混沌序列,与密文运算后回复出原始WAV文件的声音数据,将解密后的语音信号输出到语音功放单元,如此便实现了对语音资料的加密存储和解密播放。因为整个加密过程在本地PC机上完成,并且实现解密功能的单片机控制程序存储在具有良好防解密性能的MCU中,所以本系统充分保证了语音资料的安全。

4 结语与展望

本文提出了一种针对农田、果园鸟害的解决方案,从硬件和软件两个方面详细介绍了智能语音驱鸟系统的设计。该系统具有低功耗、抗干扰、抗适应性、声音加密、方便升级语音资料等特色,经多次农田、果园试验,驱鸟作用明显、持续,平均帮助用户挽回30%~70%的损失,有效作用面积为1~3hm2,适用于农田、果园、机场、工厂仓库、鱼虾池塘、办公楼宇等,可以驱赶喜鹊、乌鸦、八哥、鸽子、山雀等中国常见鸟类。

驱鸟技术的应用在农业生产、电力、机场等受鸟类危害的环境必不可少,本系统虽然达到了预期的驱鸟效果 ,但为了实现更高效、更智能化的驱鸟技术,需要进一步完善。下一步需要解决地问题主要有以下两个方面:

1)模拟鸟类飞行,研究鸟类飞行及捕食过程中的声音变化特点,通过同时控制多个扬声器,模拟鸟类飞行的动态声音变化效果,更好地抵抗鸟类对目前静态声音的适应性。

2)远程控制,通过客户端PC机、手机等常用通信设备或手持控制器与应用场合的驱鸟器之间的通信,实现远程控制驱鸟器的工作和升级语音资料等。

参考文献

[1]佚名.智能驱鸟器[EB/OL].2009-12-01.中国驱鸟网:http://www.packer.net.cn.

[2]宝利民,马宝山,王曰承,等.16位单片机在机场驱鸟器系统中的应用[J].大连海事大学学报,2006,32(3):79-80.

[3]王卫锋.混沌序列在多媒体信息加密中的应用研究[D].南京:东南大学,2002.

[4]张敬怀,马道钧.WAV语音文件格式的分析与处理[J].北京电子科技学院学报,2004,12(2):47-49.

[5]李敏.音频文件格式WAVE的转换[D].南京:东南大学无线电工程系,2005.

[6]张庆双,姜立华.农业电子技术应用电路集萃[M].北京:机械工业出版社,2005.

[7]姜志海,黄玉清,刘连鑫,等.单片机原理及应用[M].北京:电子工业出版社,2005.

语音频谱分析仿真系统的实现 篇10

一、仿真系统结构的设计

开发一个系统, 首先需要建立整个系统的框架, 确定系统的体系结构由哪些模块组成, 模块间的调用关系如何, 需要哪些全局变量等。通过分析, 设计出如图1所示的系统结构图, 图中每个方框代表一个GUI, 箭头表示调用关系。按照系统结构框图的要求, 需制作9个GUI, 且要满足模块间的调用关系。先在每个GUI中选择所需的控件, 再对每个控件的属性进行设置, 保存并编程。界面设计好后, 需要对一些控件进行编码, 以实现相应的功能。采用MATLAB语言进行编程比较简单, 许多地方与C语言相似, 且由于SPTOOL工具箱的开发, 许多功能可直接调用函数就可实现。限于篇幅, 这里不作具体介绍了。

考虑到MATLAB是以矩阵的形式组织数据的, 单声道的语音数据在MATLAB中是一维数组。而MATLAB中的函数wavread () 和wavwrite () 可分别能实现将.wav格式语音流文件转换为数组格式数据和将数组格式数据转换为.wav语音流文件。利用Windows附件中的录音机可将其它格式的语音流文件转换为.wav语音流文件。本实验中录制的语音为my heart will go on.wav, 利用等支持格式的流媒体播放器播放处理前后的文件, 通过对比处理前后的语音效果, 并结合MATLAB制图函数显示处理前后的语音频谱得到更进一步地理解与分析。

二、仿真系统的测试和演示

在系统开发过程中, 先对每一个开发好的模块分别进行单元测试, 在模块组装成系统时再进行集成测试, 下面介绍系统测试和演示过程, 看其是否完成了预定的功能。仿真实验系统演示效果如图2所示, 图 (a) 是仿真系统参数选择界面, 可以选择进行频谱分析的语音文件、时域/频域滤波。图 (b) ~图 (e) 是语音滤波前后的频谱图。在显示界面中“原声”和“滤波后”两个按键为滤器前语音音频流文件和滤波后的语音音频流文件的播放按键, 通过PC机的耳机或音箱的声音输出可对比滤波前后的语音音频的差别。比如点击图 (b) 的“滤波后”按钮, 听到的声音很低沉, 因为高频部分被滤除或衰减。

三、结论

该仿真系统可使用在《数字信号处理》课程的教学中, 系统涉及到了信号采样、卷积运算、FFT、时域和频域的各种类型的滤波器等。在系统演示界面上设计了多媒体播放器按钮, 可选择播放滤波前后的音频效果, 将复杂抽象的信号处理算法变成直观的可演示的效果, 既有利于学习数字信号处理的相关算法的物理意义, 又可激发学习者的学习兴趣, 因此, 该系统有一定的实用价值。

摘要:利用Matlab软件在可视化编程和数值计算的优势, 设计出针对语音信号频谱分析的仿真系统。该系统可作为《数字信号处理》课程教学的实验仿真系统, 既能丰富老师辅助教学的手段, 又能提高学生学习质量。

关键词:数字信号处理,仿真系统,Matlab编程

参考文献

语音传输系统 篇11

关键词:语音控制 安全保障 蓝牙 车用系统 模块化

中图分类号:TP273 文献标识码:A 文章编号:1674-098X(2016)02(b)-0007-02

随着信息产业的快速发展,简单的控制操作机器已经不能满足人类的欲望,利用语音识别技术让机器理解人类的语言,以及实现人机交互成为新的研究内容。对用户来说,这种人机交互的方式当是最自然的一种方式。同时,使人们在车内的时间也可以产生许多的综合效益,将成为未来汽车厂商竞争的焦点。依靠大量物理按钮的传统车载终端无疑分散了驾驶者的注意力,非常危险。在这种情况下,语音识别技术被日渐应用在汽车上来实现一些智能操作。使车主“只动嘴不动手”的车载语音识别技术将是一个非常有效的解决方案。

基于此,笔者创造性地提出基于QNX的车机蓝牙无线监控系统,运用模块化的设计理念,采用蓝牙短距离无线传输技术、体征监测技术和语音识别技术,完成驾驶员与车载终端的无线交互。该方案不仅增强用户操控的便捷性,对于提升汽车品牌人性化方面和行车安全系数也具有极其重要的意义。

1 方案介绍

1.1 人机交互模块

该模块以蓝牙耳机为载体向车载终端发送请求命令,或主动接收推送信息,以实时监测和显示车辆的运行状态参数。方案采用基于Multi-agent、面向任务的人机交互框架。将人的命令通过人机交互模块,转换为汽车ECU控制的信号,使人与车和谐统一起来。蓝牙是实现无线通信的硬件基础。该方案采用的是ROK101007/1模块,支持USB、UART和IIC,具有声音和数据传输功能,符合蓝牙1.1版本并通过了FCC/ETST认证。

1.2 传感器模块

该方案采用的是MEMS传感器与光纤光栅传感器相结合的传感器监测技术。MEMS传感器是采用微电子和微机械加工技术制造出来的新型传感器,将微电子技术和精密机械加工技术融合在一起,实现微电子与机械系统的一体化,其体积和能耗小,可实现许多全新的功能,便于大批量和高精度生产,单件成本低,易构成大规模和多功能阵列。光纤布拉格光栅传感器的传感信号为波长调制,测量信号不受光源起伏、光纤弯曲损耗等的影响,是实时生命体征监测系统的理想选择。

根据两种传感器的特点,在驾驶座椅背上安装光纤光栅传感器,用以对驾驶者进行生命体征的实时监测。在汽车中控方向盘、底盘安装MEMS传感器,对汽车行驶状况进行监测并及时反馈。可以说,该模块给驾驶者和车辆提供了全面的保护,大大增加了行车的安全性。

1.3 语音识别模块

识别系统本身由训练和识别两个部分组成:训练就是建模的过程,预先分析出语音特征参数,制作成语音模板存放在语音参数库中;识别过程就是把得到的语音参数通过处理与库中已知参数模板作对比,采用判决方法找到最接近语音特征的模板,就可得到识别结果。这一过程由固定在车载终端中的微型计算机实现,计算机中存储有语音数据库,并可以对声音信号进行处理。

鉴于语音识别技术还不够成熟,同时驾驶环境复杂,这个模块多用于对驾驶者对汽车非的驾驶性操作,不仅使驾驶更加智能高效,还可以大大减少非驾驶性操作对驾驶者的影响,使驾驶者更能全身心投入到驾驶中,极大地避免了安全事故的发生。

1.4 信号切换模块

该模块完全通过蓝牙、车载终端和手机之间的信号传递实现,通过按下蓝牙耳机上的控制按钮,蓝牙会向车载终端发送断开连接的请求,车载终端在接收到信号后自动断开与蓝牙耳机的连接,同时内部的智能连接系统控制驾驶者的手机与蓝牙耳机建立连接,此时驾驶者便可以实现对手机的语音操控。这一模块完全虚拟化数字化,体现了未来驾驶操作的数字化发展方向。

2 工作流程简介

此方案采用模块化的工作方式。布置在汽车座椅后背的光纤光栅传感器对驾驶员的身体状况进行实时监测,布置在汽车中控方向盘、底盘的MEMS传感器对汽车行驶状况进行实时监测。驾驶员通过车内蓝牙耳机和人机交互系统进行信息处理对汽车实行语音控制。

2.1 驾驶者体征及汽车行驶监测

通过安装在座椅后背上的光纤光栅传感器,车载系统可以在行车过程中实时监控驾驶者的呼吸、血流、心跳等生命体征,当驾驶员在行车过程中其数值达到监测临界时,车载系统会通过车载音响语音提示+座椅震动提醒驾驶员生命体征出现问题,需停车休息。若此时还没有刹车,车载系统会自动对汽车进行制动,直至驾驶者的生命体征恢复正常。

通过安装在汽车中控方向盘、底盘的MEMS传感器,车载系统可以对汽车行驶状况进行监测,当汽车在行驶过程中出现异常时传感器会迅速将信息传递给车载系统,并通过显示屏报警。通过存储在系统数据库中的错误应对方案,显示屏上会同时提供驾驶者几条解决建议,驾驶者可通过反馈的信息自行处理。

2.2 蓝牙语音智能控制

通过蓝牙耳机,驾驶者可以建立与车载系统之间的无线连接,并且同时启动语音识别模块,从而通过语音指令代替传统的手动操控,实现开关空调、开关音乐、开关窗户顶棚等非驾驶性操作,保证驾驶者坐在座位上只需对着话筒,按需要发出语音指令,就可以实现对系统的语音控制,而驾驶员的注意力仍能专心驾驶,提高驾驶乐趣的同时保证了安全性。

2.3 来电无线接听

该方案通过信号切换模块,使得通过蓝牙接听来电与语音控制车载系统得以共存,当有电话来时,驾驶者通过按下蓝牙耳机上的控制按钮,来进行车载终端和手机等移动设备的信号切换,便可以无线接听电话,免去了传统接听电话时需要一只手拿手机的麻烦。当电话挂断时,驾驶者可以选择再次按下控制按钮恢复与车载终端的信号连接,也可以保持与手机的信号连接,通过Siri系统来语音控制手机。

2.4 附加功能

2.4.1 车辆自锁及防盗功能

本功能实现携带蓝牙耳机的驾驶员在离开车一定距离后,车载终端接受不到蓝牙信号,车辆会自行落锁,避免忘记关锁,从而有效防盗。

2.4.2 车辆位置监控

该功能建立在车载GPS系统、蓝牙信号传输与其云同步的APP相结合的基础上,驾驶者可通过手机上的配套APP查看汽车所在位置及汽车与人距离的,方便驾驶者在车海中找到自己的爱车。

2.4.3 一键求救

该功能是在与120求救系统互联的前提下,车主可在车辆或人发生事故或不适时按下蓝牙耳机上的求救按钮,车载系统接收到蓝牙信号后向120急救中心发出求救。

参考文献

[1]王淑华.MEMS传感器现状及应用[J].微纳电子技术,2011,48(8):516-522.

[2]蔡欢欢.MEMS传感器在汽车电子中的应用[J].电子原件与材料,2014,33(5):97-98.

[3]李海涛.基于QNX的车机蓝牙无线监控系统[J].电子与应用,2014,40(2):115-117.

工资语音查询系统的研发 篇12

我公司工资管理早已实现信息化, 然工资仍然以传统的工资条方式发放和查询, 为方便公司员工查询工资, 提高查询效率, 我公司设计实施了“工资语音查询系统”。由于语音处理技术的日益成熟, 目前国内外生产语音卡的厂商众多, 价格便宜, 而且随卡发行有语音处理的各种库函数, 减少了二次开发的工作量, 降低了开发难度。只要购置一定数量的语音卡, 通过开发相应的应用的软件, 就可以自建一个自动或半自动语音查询系统, 既可以节约资金, 又提高了查询效率。

1 系统设计目标

1.1 工作方式

本系统采用自动方式, 电话打入后, 按语音提示输入查询条件后, 有电脑完成自动播报工作。

1.2 功能划分

(1) 号码查询:完成手机号、固定电话的查询, 即通过用户名可查询到所需号码。

(2) 工资查询:根据账户密码查询个人分月工资和年度工资汇总。

(3) 接口管理:系统与公司现有工资信息库实现对接。

(4) 资料管理:系统对资料库进行增加、删除和修改的功能。

(5) 语音服务:系统支持后期录音, 并对查询信息进行语音合成并播放。

1.3 技术要求

从技术上, 满足几个需求:

(1) 支持4个并发查询。

(2) 系统响应速度快, 查询操作方便、快捷。

(3) 支持内线电话和普通手机、固话查询。

2 总体设计

2.1 硬件结构

PC机一台 (操作系统windows2000, 数据库oracle) , 语音卡一块、电话分机一部, 能接入公司局域网。

(1) 座机电话通过电话线与电话交换机连接, 电话交换机通过国家电信网络与电话终端客户连接, 实现电话模拟信号的传输。

(2) PC机通过网络设备与服务器连接, 服务器中的数据信息通过网络传递给PC机, 数据接口自行开发。

(3) PC机与座机电话通过语音卡、语音服务软件实现查询功能。

(4) 语音卡负责通讯和语音输出, 语音服务软件实现排队、语音合成和播放功能。

2.2软件设计与实现

2.2.1 根据需求, 设计如下流程图

2.2.2 数据库及其结构

本系统数据库主要的数据表有2个:用户基本信息表和语音播放信息表。所有数据表全部放在公司现有服务器上, 查询时通过语音查询系统进行访问。

关键数据表的设计如下:

(1) 用户基本信息表。该表用来存放所有待查的用户电话资料, 主要字段定义下 (表1) , 即:“用户ID, 用户名, 部门名称, 电话号码, 其它联系号码, 家庭地址”。

(2) 语音播放信息表。该表用来存放临时数据信息, 即为语音服务软件提供通道信息、语音播放信息、链路状态信息等, 也是前台应用软件与后台语音服务软件联系的桥梁。该表随着系统进程的不断变化对相关字段自行修改。主要字段及定义如下 (表2) :

2.2.3 前台应用软件

前台应用软件为用户提供友好的图形化操作界面。主要功能是数据库信息管理。由于前台应用软件主要是对数据库的操作, 所以不存在特别的算法。对数据库的操作要进行权限限制和操作确认, 以增加其安全性。

2.2.4 后台语音服务软件

后台语音服务软件是整个系统的核心部分。其工作原理是:查询用户通过公用交换网拨打查询号码, 通过语音卡输入线路, 线路检测函数检测通道状态, 如通道空闲, 进入查询状态。当查询到正确的信息串后, 通过语音卡通道传播出去, 完成整个查询过程。

3 结论

该系统成本低, 实用性强, 员工可以随时随地拨打查询电话, 查询用户信息和工资信息。系统采用了发音标准的语音合成库, 音质接近自然。通过实际验证, 系统响应速度快, 运行可靠, 提高了查询效率, 受到广大职工的好评。

摘要:为方便公司员工查询工资, 提高查询效率, 我公司设计实施了“工资语音查询系统”。现对其进行简要论述。

上一篇:公路填砂路基施工问题下一篇:思考合作