无线语音传输系统(共8篇)
无线语音传输系统 篇1
1 引言
以往设计的无线数据传输产品往往需要相当的无线电专业知识和价格高昂的专业设备, 传统的电路方案不是电路繁琐就是调试困难, 因而影响了用户的使用和新产品的开发。随着无线传输技术的发展, 由于采用了低发射功率以及高接收灵敏度的设计, 因而满足了大量无线传输的要求。这些无线数据传输系统可以广泛应用于遥控装置、工业控制、无线通信、电信终端、车辆安全、自动测试、家庭自动化、报警和安全系统等[1]。对于一些信息传输实时性要求比较高的自组织网络, 如何及时、准确地传输信息是提高系统性能的关键因素。本文即提出了一种有效解决数据传输冲突的无线语音传输系统设计方案。
2 无线语音传输系统体系结构
本文设计的无线语音传输系统采用三层结构:中央服务器层、工作站层和呼叫器层。无线数据传输主要在一台主机 (工作站) 和多台分机 (呼叫器) 之间, 通过射频收发模块完成。呼叫器层主要实现各种呼叫信息和数据的采集, 并通过工作站和后台中央服务器连接。后台中央服务器由普通PC机组成, 其功能是响应和处理各类呼叫信息。中央服务器和工作站之间采用通用以太网连接, 呼叫和处理的信息可以以电子文档形式存储在后台服务器中。
无线语音传输系统结构如图1所示。
本文主要对工作站和呼叫器层之间通信过程所涉及的数据传输问题做出讨论。
图2给出了无线呼叫系统工作站和呼叫器部分的硬件结构框图。系统的工作站与呼叫器的控制功能由微控制器实现, 射频收发模块主要由射频集成芯片构成。微控制器主要用来控制射频集成芯片的收发, 数据的识别和提取, 进行反碰撞处理。射频集成芯片选用Nordic公司的nRF401。该芯片集成了高频发射、高频接收、PLL合成、FSK调制、FSK解调、双频道切换等功能。nRF401接收机采用具有较强抗干扰能力的FSK频移键 (Frequency-Shift-Keying) 调制方式, 改善了噪声环境下的系统性能;采用DSS+PLL频率合成技术, 工作频率稳定可靠。与ASK幅移键控 (Amplitude-Shift-Keying) 和OOK开关键控 (On-Off Keying) 方式相比, 这种方式的通信范围更广, 特别是在附近有类似设备工作的场合。
3 数据传输防碰撞技术研究
3.1 防碰撞问题的提出
无线语音传输系统在遥控装置、工业控制、无线通信、电信终端、车辆安全、自动测试、家庭自动化、报警和安全系统等都有广泛应用。以服务行业的营业场所中较为常见的呼叫系统为例。顾客需要服务人员能够提供准确、及时的服务, 要求所设计的系统要有较好的实时性和可靠性。一方面, 顾客提出的申请能够很快地得到响应, 使顾客感觉不到时间的浪费;另一方面, 中央服务器不能由于接收到的是错误信息, 使服务员打扰并未提出服务申请的顾客。针对系统的要求, 可以得出导致服务中出现错误的原因有二:一是由于无线信道的复杂性, 信息在无线信道的传输过程极易受到干扰而产生错误, 接收方无法接收到正确的信息;其二是由于多个呼叫器同时竞争通信信道向中央服务器发出呼叫, 各个呼叫器发出的数据相互干扰, 使中央服务器不能正确地辨别出是哪一台呼叫器发出的申请。这两种错误可能使没有发出呼叫申请的顾客得到了不需要的服务, 而有服务要求的顾客又得不到满足, 反而降低了服务的效率和准确度, 起不到服务行业中需要的无线呼叫系统的作用[2]。对于前一种情况可以采用适当的校验和纠错方式, 降低中央服务器向服务员提供错误呼叫信息的概率, 无需本文详细讨论。而对后一种情况, 需要找到一种合适的反碰撞方法, 这正是本文要解决的问题。
在分机请求发送数据的同时, 另一台分机请求发送数据, 或一台分机在发送数据的过程中, 另一台分机请求发送数据, 都会造成通讯冲突。为了防止因通讯冲突而造成的数据传输错误, 本系统参考CSMA/CD (Carrier Sense Multiple Access /Collision Detect) 技术。CSMA/CD即载波监听多路访问/冲突检测[3], 它的工作原理可用8个字来表示:“先听后说, 边听边说”。呼叫分机在发送数据前, 先检测信道是否空闲, 若空闲, 则发送数据。在发送数据的同时, 仍继续监听信道, 以检测是否存在冲突。一旦检测到冲突, 就立即停止发送, 并向总线上发一串阻塞信号, 通知总线上其他各有关站点停止数据传输。这样, 通道容量就不致因白白传送已受损的帧而浪费[4]。
本次设计的语音传输系统对于信息传输的实时性及抗干扰性要求较高。要解决这个问题, 必须尽可能避免重复冲突现象的发生。即要求如果发生多台通讯冲突现象, 各分机的“等待时间”应不同。延时等待算法和冲突等待算法有“错时等待”的特点, 能有效地解决重复冲突问题。
3.2 监听信道忙延时等待
系统采用“先听后说”的工作方式, 分机在发送呼叫信息前, 先监听信道状态。如果信道忙, 说明有其他分机正在占用信道传输数据。根据前述数据帧格式, 一帧数据共128位, 一台分机传输数据所需的时间为:T=128 bit/波特率。
因此, 本次数据传输还需占用0到T的信道时间。为了避免同时监听到信道空闲而发生的冲突现象, 各分机采用下列延时等待公式决定延时监听时间:
undefined
上式中, ti为第i台分机的延时时间, n是分机的总台数, E是应急呼叫设置位 (若为应急呼叫, 则设置E为1) 。如果某些分机相对其他所有分机优先级别较高可由系统呼叫主机设定设置为应急状态。
分机i以ti的间隔时间监听信道, 当监听到信道处于空闲状态时, 即可进行到工作流程的下一步。
3.3 通讯冲突延时等待
尽管系统采用“先听后说”的工作方式, 但也可能发生两个站点因同时监听到信道空闲而同时发送数据的现象, 即发生通讯冲突。检测通讯冲突的方法是:发送数据的呼叫分机将接收到的信息与原来发送的信息逐个比特位进行比较, 如果两者一致, 说明没有冲突;如果两者不一致, 则说明发生了冲突。
造成这种通讯冲突的原因与信号在信道上的传播时延有关。传播时延是信号由信道上的一个站点传播到另一个站点的时间, 信息传播时延可由式 (2) 计算:
undefined
设A、B是系统中的两台呼叫分机, 它们之间的传播时延是tpab。分机A检测到信道空闲后, 就发送数据;分机B在分机A开始发送数据的 (0, tpab) 的时间内检测信道, 由于信号还没有传播到分机B, 因此分机B检测到信道状态仍处于空闲状态, 分机B也发送数据, 造成通讯冲突。分机检测到通讯冲突后, 立即停止发送, 并向总线上发一串阻塞信号, 用以通知总线上其他各有关站点等待。冲突等待时延采用式 (3) 计算:
tj=tpmax (j+1-E*j) (3)
上式中, tj为第j台分机时延检测时间, tpmax为任意两个站之间的最大传播时延, 由公式 (2) 计算得到。E的含义同式 (1) 。
无论是 (1) 式还是 (3) 式, i (j) 值小的分机先检测信道, 在数据传输比较繁忙的时段, i (j) 值大的分机总是要持续一个较长的时延才能检测信道, 这就会造成系统中各分机竞争不均衡的现象。为了避免这种现象, 我们将i (j) 设置为分机检测总线的优先级别, 并把系统设置成优先级循环的工作方式。初始状态, i (j) 的值为分机编号, 优先级分别为1、2、……、n。当优先级为k的分机传输数据后, 系统主机将原来优先级为k+1至n的分机的优先级分别设置为1至n-k, 将原优先级为1至k的分机的优先级设置为n-k+1至n。
基于防碰撞技术的数据传输系统的软件流程图如图3所示。
4 小结
参考CSMA/CD构建载波监听多路访问/冲突检测工作原理, 设计基于“错时等待”策略的监听信道忙延时等待算法和通讯冲突延时等待算法, 有效地降低信道争用的冲突问题。特别是处理信道争用二次冲突方面, 与一般的CSMA/CD退避算法[5]比较, 有着明显的优势, 从而大大提高了信息传输的实时性。
参考文献
[1]陈红梅, 陈健.一种无线语音传输系统设计方案[J].西安电子科技大学通信工程学院 (710071)
[2]防数据碰撞的无线呼叫系统设计[J].单片机嵌入式系统应用, 2004 (2) .
[3]黎琼, 徐海峰.智能家居中红外控制系统通讯协议分析[J].微计算机信息 (测控自动化) , 2007 (1) :28-30.
[4]林雪明.医院护理呼叫通讯系统设计及防冲突算法研究[J].电子技术应用2009 (6) .
[5]金顺福.基于1坚持指数退避算法的时隙CS-MA/CD协议的排队模型的建立与分析[J].计算机工程与应用, 2002 (5) :51-52.
无线语音何去何从 篇2
无线语音技术仍处于起步阶段,还没有经过验证的业务模型,而且人们对这一趋势将如何发展还存在着很大分歧。不过,多数专家认为,VoIP最终将与新型无线宽带结合,改变企业和消费者获得语音服务的方式。
这意味着,你可以走在大街上通过手机网络交谈,走进办公室后,呼叫可以无缝地切换到WLAN语音技术,从而减少必须购买的手机通信时间。其他例子还有:在手机信号很弱的仓库里,手机中的软件会自动把呼叫转移到WLAN语音系统上; 而当你处在WLAN覆盖范围之外时,呼叫将切换到手机网络。
更重要的是,这一新趋势及其背后的融合技术,会给手机和地面通信线路运营商带来新的挑战。反过来也可能造成新的、更加激烈的竞争。
电话市场研究与咨询公司Kerton Group的负责人Derek Kerton说:“手机运营商对这种想法并不‘感冒’。如果想到用户可以减少手机服务的使用时间,比如说,从1000分钟到200分钟,那么运营商就不会对这项技术感兴趣。”
Sprint公司产品开发副总裁Tony Krueck承认:“一切都开始融合,由谁来提供哪种服务并不存在一条明确的界线,谜底需要一段时间才能揭晓。”
新技术层出不穷
问题的关键在于,一些全新技术和翻新的老技术,将把高速地面通信线路、无线网络接入和VoIP融合在一起,使已经应用在许多家庭和办公室中的VoIP技术具有移动性。
这些新兴的无线技术范围广泛,最高端的是宽域Wi-Fi网状网络,号称可以覆盖整个城市地区。美国费城就因其城市范围的网状网络计划而吸引了极大关注,在很多较小的城市也已经应用了这项技术。
一些人认为,仅城市范围的Wi-Fi技术就将改变移动语音的前景,为更广泛地使用移动VoIP技术铺平道路。但是,另一些人,如Gartner调查公司研究副总裁Phil Redman则认为,Wi-Fi网状网不能胜任这项任务。他说:“城市Wi-Fi服务不能完成这一任务的一个主要原因是缺少控制。这是个无需授权的频带,因此如果我用我的私人网络干扰你的话,你对此无可奈何。”
此外,他指出,当前的Wi-Fi标准无法保证语音质量的内置服务质量。这个问题将在下一个Wi-Fi标准——802.11n在今年年底或明年年初得到批准时得到解决。
Wi-Fi的这些缺点并没有让Sprint公司灰心。Krueck透露,他的公司正在开发一种消费型手机,这种内部称之为Combophone的手机既可以处理Wi-Fi语音,也可以处理手机呼叫。
Krueck说:“当你走进家门时,特殊的无线(Wi-Fi)路由器将与Combophone配对,你一走出家门,就可以通过手机网络打电话。”
不过,Krueck强调说,Combophone不能在家庭之外的Wi-Fi网上使用。计划中的Sprint路由器是运行VoIP必不可少的一部分,而这种路由器只能在住宅内部安装。Combophone预计将于明年上半年推出。
将Wi-Fi用于VoIP遭到了一些人的批评,同时,各种更强健的、传输距离更远的移动无线技术也在涌现,其中最著名的技术是移动WiMax。固定WiMax已经是一项获得完全批准的标准,而其移动版本最早可能在今年年底得到批准。
此外,IPWireless的UMTS TDD和Qualcomm的FLASH-OFDM已经有了移动版本,并且可供使用。这三种技术都可以建立宽域的基于IP的网络,而且通常运行在频带的授权部分,从而比Wi-Fi技术更不容易受到干扰等问题的影响。
技术融合好处多
所有这些技术,可以让用户拥有一部集手机、固定和移动VoIP于一体的电话,这对医疗保健领域具有很大的吸引力。医院等大型机构中的医生和护士们,一天中花很多时间在四处走动查看病人、会见同事和参加会议上。同前面提到的仓库中的情景一样,建筑内部的手机网络覆盖可能质量不一。另外VoIP价格比较便宜。因此,很多医疗保健机构已经为医疗人员配备了WLAN语音电话,而集手机和VoIP于一体的电话更加有吸引力。
实现这种语音融合的设想,需要有在手机网络和基于IP的网络之间切换呼叫的技术。这方面出现的具有发展潜力的两种新技术分别是非授权移动接入(UMA)和IP媒体子系统(IMS)。简单来说,前一种技术用于基于GSM的手机网络,如Cingular和 在美国部署的T-Mobile网络;而IMS是基于IP的,使用在固定VoIP系统中已经很常用的SIP技术中。
要想把手机与VoIP呼叫搭配使用的设想变为现实,这种技术是不可缺少的。只有手机运营商和制造商将这类技术整合到它们的基础设施和电话中,网络之间透明的切换才可能实现。电话制造商一直在测试这类技术并推动运营商使用。同样,生产手机运营商使用的基础设施设备(如基站)的厂商也在测试这类技术。但是,这种变化会导致手机使用时间转移到VoIP上,因此运营商并不热心,特别是这还可能带来很多新竞争对手。
缺失的业务模型
如果推动这一潜在的巨大变化的技术仍悬而未决的话,那么,业务模型则更是如此。没有人清楚谁将是主要参与者以及他们将提供什么服务。
手机运营商显然希望参与到这场游戏中。例如,Sprint公司的Combophone让该公司具有从其手机用户住宅内的固定线路收录语音的潜力。但是,很多较小的提供商也在试图分一杯羹。
TowerStream公司向美国6个城市的企业提供固定WiMax接入,而且已经赢利。该公司的CEO Jeff Thompson说:“我们对语音服务非常感兴趣,因为它仍是一种吸引人的应用。”他说,他的公司在利用移动VoIP上处于十分有利的位置。
Thompson说:“使用WiMax,成本比传统基础设施低很多,此外,它是完全基于IP的。”不过,他又提到了一个可能有点复杂的问题:“所有人都喜欢移动性,但如何靠移动性赚钱呢?我们的确认为语音是一种杀手级应用,并且我们必须支持它。但是,对于是作为合作伙伴来提供它,还是我们自己提供它,我们还没有最终做出决定。”
Gartner调查公司的Redman则反对上述观点,他不十分肯定是否会有很多新的竞争者参加到这场移动语音游戏中。
Redman说:“数万亿美元已经花在了建设强健的手机网络上,没有人能与之竞争。”不过,尽管他怀疑像TowerStream这样的公司将成为主要提供商,但他承认新的无线VoIP应用将要出现。
他说:“它将填补空缺,帮助提高建筑内的通信能力,满足特殊行业应用的需要。可是它会撼动手机技术吗?像TowerStream这样的公司可能这样认为,但想一想像Cingular这样的公司——它们是十分庞大的。”
Sprint公司Krueck的观点介于Thompson和Redman之间。该公司具有美国其他手机移动商所不具备的优势——与Nextel公司合并时获得的大量的2.5-GHz范围的授权频带。联邦通信委员会提醒Sprint公司,说它必须使用这些频带,否则将失去它们。
Krueck证实了很多行业分析人士的推测:Sprint公司计划将这些频带用于无线宽带,并可能用于VoIP。Nextel在合并前曾进行FLASH-OFDM现场试验,而Sprint目前正在测试WiMax和UMTS TDD。
Krueck说:“我们今年将试验两种不同的无线宽带技术,然后实际选择其中一种。到2007年的时候,我们可能开始运营某种服务。”
不过,Krueck说,利用新技术干什么,特别是新技术是否会被用于语音,Sprint还没有决定。
Krueck说:“对于IP网络上不同类型的应用接入,采用什么样的业务模型,我们正在制定战略。对于VoIP,我们可以阻止它,也可以接受它或与像VoIP提供商Vonage那样的厂商建立一种业务模型。按照这种业务模型,如果你想实现VoIP的移动性,我们可以对这种服务收取费用。这些讨论都还没有进行,这只是一种选择。”
他说:“将我们5000万客户迁出已有的基础设施没有什么意义。不过,经过一段时间后,我们可能会停止发展那个网络,而去发展其他基于IP的网络。”
TowerStream公司的Thompson承认,像他们这样的潜在竞争者仍在尝试找出切合实际的业务模型。
Thompson说:“现在还很难预测未来,不过我发现,很多可以部署VoIP(如果它们找到合适的业务模型的话)的技术正在成熟。”他承认,像Sprint一样,他的公司仍在设法寻找合适的业务模型。
尽管观点不同,但市场研究机构Kerton认为,这些新的语音技术将在未来发挥作用,让企业和个人用户受益。这种作用可能是巨大的,但取决于到时出现的业务模型。
一种无线保密语音通信系统的设计 篇3
1 AMBE-1000特点及接口
AMBE-1000是一款具有极大的灵活性, 高性能, 单片的语音压缩编解码芯片[1]。AMBE-1000通常采用的数据格式为帧格式, 对于帧格式, 它以20ms为一个周期进行全双工工作, 它先将AD转换器送来的数字化语音进行压缩, 按其帧格式打成数据包后送到输出缓存, 同时将输入缓存中的数据包解压还原送入DA转换器以完成对数字语音的编解码。AMBE-1000的AD/DA转换器的接口信号可以是标准的µ律或A律压扩量化的PCM信号, 也可以是14位或16位线性量化的PCM[2]。
2 系统架构
2.1 系统框图
本系统属于模拟信号数字传输的系统[3], 其系统框图如图1所示:
2.2 系统模块组成
2.2.1 PCM编解码模块
首先由语音信号的输入端开始介绍:音频信号经PCM编解码模块MC14LC5480采样和量化, 产生原始的PCM信号, 其中对信号的压缩可以采用µ律或A律, 本系统默认为µ律, 如果系统需要用A律, 可通过软件进行更改。本模块由时钟部分和PCM芯片部分组成。时钟部分提供系统所需采样和同步时钟, PCM芯片部分则完成对语音信号量化成PCM信号的操作。
2.2.2 AMBE-1000主芯片模块
PCM信号从PCM编解码模块出来, 将被送到AMBE-1000主芯片模块进行数据压缩处理。AMBE-1000为本系统的核心模块, 它使用的是TQPF-100封装。AMBE-1000的工作模式分为主动模式、被动模式、并行模式和串行模式。在主动模式下, 数据选通信号由芯片自身提供;在被动模式下, 数据选通信号由外部提供;在并行模式下, 所有“通道数据” (包括控制功能字) 的传输全部在8位总线上进行;在串行模式下, 所有数据只能在串行口上进行传输。在此, 把AMBE-1000设置在一个简单的工作模式下:并行被动模式。
3 程序编写
3.1 程序流程图
在发送端, 程序首先应完成各器件的初始化, 包括系统的初始化和AMBE-1000的初始化, 其中对串行口的初始化工作也在系统的初始化中完成。接下来, 程序应调用AMBE-1000数据处理程序, 完成AMBE-1000与单片机的数据交换, 然后再调用DES加密程序对数据进行分组加密, 最后调节器用串行口通信程序, 把数据发送到无线模块或串口上, 完成对数据的发送;在接收端则反之。程序的流程图如图2所示:
3.2 DES加密程序
由于传输的是分组语音, 所以必然要采用一种分组加密算法进行数据加密, DES是一种常规的分组密码, 应用比较广泛[4]。它使用的是64bits的分组长度, 密钥长度为64bits, 有8bits奇偶校验, 有效密钥长度为56bits。对于56bit的密钥长度来说, 一共有256种可能的密钥, 也就是大约7.2×1016种密钥, 相对于现阶段的硬件发展来说, 56bit密钥抗穷举攻击能力大大下降, 已经是不安全的了。但是如果我们能在每传送一次数据就要变换一次密钥, 则在这段相对较短的时间内是没有人可以破解的, 所以这样使用DES算法是相对安全的。鉴于此, 我们在本系统中仍然使用DES进行数据加密。DES的加密流程图如图3所示:
4 设计中的相关问题
4.1 硬件设计中的问题
系统还是由原来的5V供电, 采用LM2596T-5, TO-220封装, 其外围元件中的二极管采用贴片封装, 电感采用半封闭式贴片型, 为了减小体积, 整流用的全桥二极管用了一个桥堆来替代;考虑到一个加密程序要占用较大的程序存储空间, 最后选择了DIP-40封装的单片机SST89E564RD, 此单片机的ROM有64K, 足够装一个加密程序。在调试过程中, 首先通电检查各芯片的电源和地之间是否有电压, 电压值是否正确。这项检查通过之后再插上AMBE-1000, 在写入自收发程序的时候, 如果输出端并没有声音输出, 可以分模块检查。
4.2 加密算法的选择问题
除了DES, 我们还考虑过使用流密码:混沌流密码。目前, 对混沌保密通信系统的分析工作才刚刚起步, 我们还是选择了研究比较成熟和应用比较广泛的DES算法。对于DES的安全性, 业界中较为一致的看法是DES的密钥短了些。由于DES是对称加密, 所以, 加密和解密是用同一个过程, 但是在写程序的时候就有一点不同, 需要将密钥的使用顺序反过来。
5 总结
本文介绍了一款无线语音加密通信系统, 该系统可以实现无线语音通信的功能, 并且对其进行了加密设计。当前无线通信系统发展迅速, 该加密系统可以适应许多需要保密通信的场合, 有相当广泛的实用价值。
参考文献
[1]AMBE-1000TM Vocoder Chip User’Manual, Version3.1.Digital Voice Systems, Inc, 2000.
[2]LM2596 Simple Switcher Power Converter 150KHz 3A Step-down Voltage Regulator, Nation al Semiconductor Inc, 2002.
[3]黄增锋, 王雨生, 覃团发.AMBE-1000声码器接口电路设计方法, 电子工程师, 2004, 30 (7) :20-23.
医疗环境中无线网络语音系统设计 篇4
关键词:SIP通信,医院SIP系统,医院无线通信,语音呼叫
1 引言
SIP是一种应用层协议, 可以用UDP或TCP作为其传输协议。与H.323不同的是:SIP是一种基于文本的协议, 用SIP规则资源定位语言描述, 这样易于实现和调试, 更重要的是灵活性和扩展性好。由于SIP仅作于初始化呼叫, 而不是传输媒体数据, 因而造成的附加传输代价也不大。SIP的URL甚至可以嵌入到web页或其他超文本链路中, 用户只需要用鼠标一点即可发送出一个呼叫。与H.323相比, SIP还有建立呼叫快, 支持传送电话号码的特点。本文基于SIP, 面向医疗语音应用环境, 设计实现了一套VOIP应用系统。
2 SIP协议简述
基于SIP的网络主要包括以下几个部分:用户代理客户 (User Agent Client) 、用户代理服务器 (User Agent Server) 、代理服务器 (Proxy Server) 、重定向服务器 (Redirect Server) 、注册服务器 (Register Server) 、定位服务器 (Location Server) 等, 其网络构架如图所示。
3 系统总体设计
医院SIP系统主要针对用户代理进行设计, 可以划分为以下三个模块: (1) 主控模块。主控模块是本终端的核心模块, 也是本终端设计中唯一能同SIP协议栈进行交互的模块。主控模块便是由一个主线程和SIP协议栈所提供的各种API组成, 通过和协议栈进行交互, 负责处理几乎全部的事务。该模块使得SIP协议栈的操作和其他模块很好地隔离开来, 极大地降低了各模块之间的耦合度。 (2) 主UI模块。主UI模块是本设计的主界面, 负责初始化用户界面并报告和显示当前用户状态。该模块初始化主线程和查询线程, 并随时按要求传送和接收各种状态参数, 将用户当前的状态展示在主界面上, 呈现给用户。 (3) 注册模块。注册模块由两个小模块组成:注册UI模块和查询模块。其中注册UI模块由注册界面组成, 负责获取用户填入的信息, 并将这些信息发送给主UI模块;查询模块由一个查询线程组成, 其实现的功能为每隔一秒钟向主控模块发起一次询问, 使得主控模块可以了解当前用户所处的状态, 并根据相应状态机判断应该执行的下一步操作, 最终将当前状态反馈到主UI模块, 呈现给用户。
4 系统运行描述
系统客户端运行过程中, 首先遵循以下工作步骤:首先终端启动并进行初始化操作, 初始化操作完成后根据是否登录成功进行判断;登录成功则可以选择是否进行通话, 若登录不成功则保持在初始化状态, 不能进行通话, 等待用户注册;若登录成功则可选择是否进行通话, 若要通话则创建对等实体的语音传输, 通话结束后可选择退出, 所有线程结束。对于主控模块来说, 其利用有限状态机 (FSM) 进行运作, 其状态转换图如图2-3所示。
通话功能的实现:通话功能只有在用户登陆成功后才能进行, 在未登陆状态时, 发起的通话状态会被主线程根据状态机进行判断并屏蔽掉。点击“通话”按钮, 主界面将界面上的电话号码作为参数, 向PJLOOP主线程发起msg_call消息, 主线程根据on_call_state的消息绑定调用PJSIP协议栈的通话发起函数, 此时PJSIP内置的通话线程开始运作, 当收到消息后, 协议栈会根据自身的状态机判断并返回给主界面对应的状态参数, 由主界面进行处理并显示在主界面的左下角, 呈现给用户。通话过程消息调用流程如图4所示。
参考文献
[1]糜正棍, 王文鼎.软交换技术与协议[M].北京:人民邮电出版社, 2003年5月.
[2]司端锋, 韩心慧, 龙勤, 潘爱民.SIP标准中心的核心技术与研究进展[J].软件学报, 2005.
无线语音传输系统 篇5
随着通信技术的迅猛发展,电话通讯已可达到世界的各个角落,电话通讯已是人们必不可少的信息交换工具。为了保障人们财产和公共设施的免遭盗窃,防盗设施的研制和使用正在日益受到人们的高度重视,各种防盗报警产品应运而生。本文介绍了笔者设计制作的报警系统。
2 系统组成及工作原理
该系统是一种与电话线相连的无线联网远程报警系统,在其工作期间,若有警情发生,报警信号以无线的方式被传送到电话报警系统,然后报警系统会悄然无息地向远处的用户电话进行拨号,用户摘机后,它会以语音的形式自动循环报出用户预先录好的报警信息,如警情发生地点、位置或警情发生单位等信息。除了上述主要功能之外,它还可以通过电话机进行有关信息的输入,如语音的录放、电话号码的存储及更改等。此外,为方便用户的使用,还可通过无线电遥控的方式或接收用户远程拨号的方式对系统进行遥控,如发送系统的撤防或预警命令等。
系统组成如图1。
由热释电红外传感器及其放大器、无线电发射及接收解码模块、语音电话报警控制器等组成。限于篇幅,本文重点对语音电话报警控制器的设计进行论述。
3 硬件电路设计
语音电话报警控制器硬件框图如图2所示。
其主要构成包括:
1)选用ATMEL公司的单片机AT89C52为核心,时钟频率为3.58MHz。AT89C52单片机的硬件资源分配如表1所示。
2)选用ISD公司的60秒语音芯片ISD1425P作为语音电路,存储预先录好的各个语音信息段,语音的播报由单片机进行智能控制。
3)上电复位及看门狗电路采用了具有I2C接口的24C021微处理器监控电路。同时它还具有2K字节的电可擦除的存储器,用于有关信息的存储。通过软件模拟I2C时序来完成对串行E2PROM的存取。
4)日历时钟选用了PHILIPS公司的PCF8563芯片,PCF8563是I2C总线兼容的低功耗的CMOS实时时钟电路。通过软件模拟I2C时序来完成对时钟的读取。
5)双音频接收由双音频译码器MT8870来完成。
6)电话呼叫进程音译码由PHILIPS公司的NE5900来完成。主要负责拨号呼叫过程中的状态,如回铃音,忙音等的识别。为了增强识别的正确率,设计时还采用了软件硬件相结合的方法,来正确地识别回铃音、忙音。
7)双音频(DTMF)信号发送电路采用了台湾hotek公司的HT9200A双音频信号发生器来担任DTMF信号的发送。
8)液晶显示,采用串行接口的八位段式液晶显示器EDMC002A。通过单片机的串行口工作在方式0输出方式,来完成有关状态信息的显示。
4 软件设计
基于状态分析的方法,用MCS51汇编语言编写语音报警控制器的软件。其程序长度约7.2K字节。主要包括主程序,定时器T0中断服务程序。主程序作为前台,主要完成上电后初始化、双音频拨号及接收存储;被叫摘挂机识别;呼叫进程识别;振铃信号识别;语音播报;报警语音录入及试播;监测报警信号及接收控制命令译码等任务。
1)主程序流程图如图3所示
2)定时器T0中断服务程序
定时器T0每5ms溢出中断一次,主要完成定时基准标志的形成、密码等参数的查询及更改。
3)语音播报子程序
ISD1420预先分段录好有关语音如:零、幺……玖。录制方法,可通过人工录制或专用设备。以0.5秒为间隔。录音时记好各段语音的起始地址,以这些地址建立一个表,将这些表顺序写入程序存储器中。放音由单片机进行控制。进行号码播报时,单片机根据数字查表播放语音。流程图如图4所示。
4)呼叫进程识别程序
控制器摘机拨号完成后,先正确检测呼叫过程的状态。即检测拨号完毕后程控交换机返回的信号音。如果检测到的信号音是忙音,说明被叫忙(占线),则控制器挂机延时5秒后再重新摘机拨号。只有当检测到的信号音是回铃音时,控制器检测振铃的次数并且在回铃音消失后循环播报报警内容。直到检测到被叫挂机后(出现忙音)才退出播报。
5 结束语
该系统通过单片机采集警情信号,并以无线传输的方式把报警信号送到电话报警系统,以语音的形式自动循环报出用户预先录好的报警信息。该系统已经在生活中得到了广泛的应用。
参考文献
[1]何立民.I2C总线应用系统设计[M].北京:北京航空航天大学出版社,2004.
[2]何立民.单片机应用系统设计系统配置与接口技术[M].北京:北京航空航天大学出版社,2003.
[3]郎德山.DPY01高品质单片语音录放电路[J].微型机与应用,1995.4:37-39.
无线语音传输系统 篇6
Vo IP (Voice over Internet Protocol) 又称作IP电话, 是建立在IP技术上的分组化、数字化传输技术, 其基本原理是:通过语音压缩算法对语音数据进行压缩编码处理, 然后把这些语音数据按IP等相关协议进行打包, 经过IP网络把数据包传输到接收地, 再把这些语音数据包串起来, 经过解码解压处理后, 恢复成原来的语音信号, 从而达到由IP网络传送语音的目的。基本传输过程可以分为五步:模拟语音的数字化、原始数据到IP的转换、传送、IP包到数据的转换以及数字语音转换为模拟语音[2]。
由于Vo IP技术低廉的通话费以及清晰稳定低时延的语音质量、灵活的体系结构, 本文用其实现无线语音通信系统。
系统采用802.11b无线标准, 工作在2.4GHz的自由开放ISM频段, 比较适合煤矿井下的无线电环境。
AP (Access Point, 接入点) 是网络中无线和有线网络之间的桥接, 由一个无线输出口和一个有线的网络接口构成, 相当于网络中的基站, 将语音通信网中的终端Wi-Fi手机聚合到网络中;Wi-Fi手机支持SIP协议, 网络无线终端设备, 可以实现无线语音通信;语音服务器IP-PBX的作用是对网络中的终端设备进行管理。系统中选用IP02作为IP-PBX。IP02是一个两端口的IP-PBX, 这两个端口分别为FXS口 (简称为S口) , 将模拟电话连接到S口上, 此模拟电话就可以成为系统中的一个终端, 实现普通模拟电话和系统中Wi-Fi手机的通信;另一个为FXO口 (简称为O口) , 将PSTN与O口相连可以实现PSTN内的电话与系统内部Wi-Fi手机的通信。
2 井下实验
井下实验选在内蒙古上湾煤矿地下150m处的一条水平巷道, 该巷道的宽度和高度均为4.2m, 移动PC上装有用于抓取无线网络数据的软件Omni Peek, 通过Omni Peek抓取的数据可以对网络中的语音包进行分析。两个Wi-Fi手机的号码分别为6001和6002 (实验布线图略) 。
3 实验结果
实验中通过两个手机的互拨来验证在煤矿井下该系统是否可以实现语音通信。实验证明, 该系统的语音通信质量良好。由于煤矿井下没有其他同频段的无线系统产生干扰, 通话时声音清楚没有杂音。
IP02可以保存经过它的所有呼叫的详细呼叫纪录 (CDR, CallDetail Record) , 在CDR中, 每一行代表着一次呼叫的详细记录, 包括呼叫双方、呼叫号码、通话开始时间、通话结束时间、通话持续时间以及呼叫时的各种状态, 每一个值都由逗号分隔开来。
通过CDR可以清楚地看到两个手机之间的通信记录。
CDR中记录的各项有:计费码accountcode, 如果使用了Set Account应用, 或者通道配置文件已经配置好了, 计费码将会作为基础信息分配到每一个通道中;接收到的主叫方I D;目的地Extension;目的地context;文本格式的主叫方ID;使用的通道;可能存在的目的通道;可能存在的最后一个应用;最后一个应用的数据;呼叫开始的时间;呼叫接通的时间;呼叫结束的时间;整个呼叫持续的时间, 也就是呼叫从开始到结束, 规定使用秒来计费;整个呼叫通话的时间, 也就是从呼叫接通开始到通话结束, 规定使用秒来计费;这个呼叫的情况, 也就是说该呼叫时接通、没有接通或者是忙音, 以及此次呼叫使用什么样的标识符, 文档、计费还是忽略, 使用在每个基础的通道中, 就像是accountcode一样。
从CDR中还可以看出, 该呼叫由6001发起, 被呼叫分机号码为6002, 由于此次呼叫为局域网内部的分机呼叫, 所以为免费, 可能存在的目的通道是SIP/6002&IAX2/6002&Zap/2, 整个呼叫持续的时间为80秒, 整个呼叫通话的时间为60秒, 呼叫的情况为接通, 并且此次呼叫使用的标识符为文档。其他呼叫也可以从各自的记录中得到具体信息。
还有一个重要指标就是语音延时, 如果语音延时超过1s, 则一个正常的通话几乎不能忍受。
下面就对本文的无线语音通信系统的延时进行测试。
由RTP协议可知, 在语音包延时测试中, 只要在发送端和接收端中找到具有相同RTP时间戳的语音包, 并将语音包在接收端的接收时间和在发送端的发送时间相减就可以得到语音包的延时。实验中语音数据包的发送端为Wi-Fi手机, IP地址为192.168.1.108或192.168.1.107, 经过IP02 (IP地址为192.168.1.141) 后最终达到目的端, 数据包的接收端同为Wi-Fi手机, IP地址为192.168.1.107或192.168.1.108。
为了使测试结果更加准确, 取9个语音包计算相应的延时, 然后取平均值所得结果如表1。
从表1中可以看出, 此无线语音通信系统在煤矿井下通信时语音延迟很小, 具有良好的通信效果。
4 结语
本文针对现有煤矿井下通信系统中存在的问题提出了一个基于Vo IP技术的无线语音通信系统, 通过实验证明, 该系统可以实现煤矿井下的通信并且具有良好的通信效果。
摘要:煤矿井下通信系统是整个煤矿安全生产的重要部分, 现代化的通信技术能迅速掌控局面, 使损失降到最低。而我国目前井下通信系统一般都是有线通信, 存在着一旦有一处线路发生故障, 将会导致整个通信系统瘫痪的风险[1]。基于Vo IP技术的无线语音通信系统可以解决此类问题, 实现井下现代化管理, 提高劳动生产率, 保障矿工和国家财产安全。
关键词:煤矿井下,VoIP,无线通信
参考文献
[1]黄伟, 姚善化.矿井移动通信技术难题及解决方案探讨.煤矿机械, 2003 (12) .
无线语音传输系统 篇7
随着中国社会经济的发展和城市现代化进程的加快, 小汽车已经逐步走进千家万户。停车场逐渐不能满足越来越多的停车需求, 提高泊车诱导效率是当前停车场急需解决的关键问题。
目前大部分停车场采用标志牌实现泊车诱导, 如文献[1]中车位诱导系统采用LED显示屏和指示灯等进行停车诱导, 但这种诱导方式可视距离有限, 需要逐级安装诱导屏。虽然国内外文献对无线语音有大量的研究, 但是对停车场内无线语音泊车诱导研究甚少, 文献[2]实现了车辆进场时语音提示功能, 对进场后的车辆没有提供语音诱导信息, 文献[3]研究了基于停车场外的语音识别技术的停车诱导系统, 未对对场内语音诱导进行研究。基于当前停车场内泊车诱导系统上述存在的问题和语音泊车诱导研究的不足, 本文提出一种用于停车场内的全程无线语音泊车诱导系统。
2 无线语音泊车诱导系统
车位诱导系统是专门为中、大型停车场提供场内车位信息“采集”、“处理”、“发布”和“停车位置指引”的一套高效智能化管理系统[4]。全程无线语音泊车诱导系统, 主要由控制中心主机、数据库服务器、射频卡阅读器、车辆射频卡、传输天线、单片机语音系统、车位探测器、信号传输设备、车辆定位系统等部分组成, 系统结构如图1所示。管理中心和每个停车用户分别配置一套单片机语音系统 (称为主机和从机) , 主机可以和多个从机进行语音通讯, 将最佳行车路线传送给驾驶员。
3 停车场车位信息系统设计
3.1 车位探测器的选择和安装
目前停车场内车位检测方法主要有地感线圈检测、超声波检测、地磁传感器检测、红外传感器检测等, 各种检测方法优缺点如表1所示。
综合比较以上几种检测方式, 激光传感器虽然易受人为干扰, 但优势明显, 适合用于检测车位状态。激光入侵传感器属于主动入侵探测器类, 主要由两部分构成, 一部分为激光发射机, 另一部分为激光接收机[5]。根据车位地理环境, 提出激光传感器的两种安装方案。方案一是在车位一侧安装发射机, 另一侧安装接收机;方案二是在车位底部和顶部分别安装发射机和接收机。前一种方案会引起不同车位之间的激光传感器发光信号互相干扰, 而且大型车辆进入车位时, 车位两侧传感器容易受碰撞, 因此选择方案二。
3.2 车位信息检测和采集模块设计
采用激光传感器检测车位状态, 其结构原理如图2所示, IN1为输入单片机的信号, OUT1为单片机I/O口控制发光信号。发射部分由一个振荡管发出一定频率的振荡波后, 经三极管放大, 激光管发光;接收部分由一个频率相匹配的接收管接收返回的光强, 经电容滤波后直接接入单片机接口, 检测返回电压的高低。激光传感器使用了调制处理, 接收管只接收相同频率的反射光, 因而可以有效防止可见光对反射光的影响。
当车位未停车时, 激光发射管光线未被遮挡, 单片机输入脚为高电平, 接收管导通, ;当车位有车时, 激光发射管光线被遮挡, 接收管不导通, 单片机输入脚为初始信号, 即低电平;因此, 可根据输入的高低电平来判断车位的空闲状态。
车位检测系统必须考虑外界干扰, 如人或动物从某车位上走过时, 会瞬间阻断激光接收机接收激光照射产生一个高电平信号。为了防止车位状态误判, 设计了3 0秒延时程序。这样系统可以正确判断出是停车信号还是干扰信号, 单片机程序设计流程如图3所示。
3.3 车位信息传输模块
随着互联网的推广, 利用网络取代现场总线, 实现设备联网是一种趋势。由于单片机没有以太网接口, 且T C P/I P协议比较复杂, 在单片机上实现网络功能是很困难的。E-Link网络连接控制器内含高速微处理器和以太网接口电路, 串口设备经过它可方便地进人因特网来实现测控系统的数据资源共享, 它是连接以太网和串口设备的桥梁[6]。
图4是停车场A区和B区的车位信息传输网络, 每个区分配一个E-link数据传输器, 通过TCP/IP连接到太网交换机, 再将车位信息传输到服务器。
从串口到E-l i n k, 单片机作为主动方, 发送一个"S E T S I P:"+I P地址数据串。E-l i n k向网络查询该I P的物理地址, 如果成功则返回数据串{“S”, “E”, “T”, “S”, “B”, “E”, “O”, “K”, 0x0d, 0x0a}, E-Link按照申请的物理地址和目标I P发送车位数据变量, 即车位的“空”、“闲”状态信息。在串行通信中, 核心元件C8051F020具有硬件实现的SPI、SMBUS/I2C和2个U ART串行接口, 都可以进行数据的串行通信[7]。单片机串口通信流程如图5所示。
4 无线语音泊车诱导的实现
4.1 停车场泊车诱导监控系统
基于Microsoft Visual Basic与Map Info平台开发停车场泊车诱导监控系统, 如图6所示。激光传感器检测到车位有车时, 该车位信息通过以太网传输到服务器后, 地图上的车位显示车辆图标, 反之, 不显示。此外系统还有统计空余车位数量、计费、车辆跟踪、报表打印等功能。
4.2 无线语音播报系统设计
利用凌阳SPCE061A单片机和NRF24L01无线收发芯片设计了两种无线语音通讯方案, 如图7所示。SPCE061A具有7通道10位模/数转换器 (ADC) 、单通道音频模/数转换器、内置麦克风放大器、自动增益控制 (AGC) 功能和双通道10位DAC (数/模转换) 输出通道等资源[8]。NRF24L01是一款工作在2.4~2.5GHz世界通用ISM频段的单片无线收发芯片, 输出功率频道选择和协议的设置可通过SPI接口进行设置[9]。
方案 (a) 中主机和从机采用点对点分时语音通讯, 这种方法缺点是后一辆车需要等待前一辆车诱导结束后, 才能获取语音诱导泊车服务, 如果停泊车辆较多时, 会造成停车场门口主干道堵塞。为了提高泊车诱导效率设计了方案 (b) 实现并行语音通讯。方案 (b) 中, 主机有32个I/O口, 至少可以级联6个NRF24L01射频芯片, 那么主机至少可以与6个从机 (6辆车) 并行语音通讯。对多个从机的NRF24L01芯片进行编码和分组, 通过软件编程实现主机与进入停车场的所有停泊车辆的语音通讯。在主从机语音通讯过程中, 主机 (管理员) 采用凌阳SPCE061A自带的ADC通过其MIC通道将语音转换成数字量, 按照一定的格式编码, 通过NRF240L01无线射频模块将编码数据发送出去。从机 (驾驶员) 通过无线射频模块接收编码数据后进行解码, 解码后的数据通过SPCE061A自带的DAC输出, 实现声音还原, 即驾驶员收听到来自主机发出的语音泊车诱导信息。
4.3 无线语音传输测试结果
利用不同地理环境下的语音传输试验分析比较系统的性能和影响因素, 试验结果如下:
(1) 在学校体育场的有效传输距离为300米;
(2) 在野外开阔地3 0 0米以上从机可以清晰收听到来自主机的语音;
(3) 在公路沿线, 高架桥和架空线密集, 距离达到260米;
(4) 在重庆市某地下停车场, 没有障碍物, 无拐弯时, 有效距离为2 0 0-2 5 0米, 有障碍物时, 有效距离是150-200米。
通过测试结果表明该语音系统可靠性高, 语音传输距离和实际环境及天线都有很大关系, 该系统可用于停车场内泊车诱导。
4.4 最优行车路线确定和无线语音诱导方法
4.4.1 基于改进A*算法的最短泊车路径搜索研究
为了提高泊车效率, 寻找最短泊车路径是关键, 因此本文对A*算法进行了研究和改进。A*算法的核心步骤是从OPEN表中取出具有最小F值的节点并进行扩展, 选择下一个被检查的节点时引入了已知的全局信息, 对当前节点的距离作出估计, 作为评价该节点处于最优路线上的可能性量度, 就可以先搜索可能性较大的节点, 从而提高了搜索效率[10]。但是, 这些点在OPEN表中是无序存放的, 每次选择F值最小节点时, 必须把所有点都重新扫描一遍再进行判断。在大型停车场的路网数据量比较大的情况下, 会影响计算速度。
改进A*算法的程序流程如图8所示, 改进A*算法核心思想是从OPEN表中取出具有最小F值的节点并进行扩展, 把那些待排序的无序序列看作一棵完全二叉树, 从最后一个非终端节点[n/2]元素开始, 到第一个元素结束, 反复筛选, 采用最小二叉堆排序后, 堆顶的元素就是最小值点, 这样每次只需取出堆顶元素。当堆顶元素取出后, 选择堆中最后一个元素来替代堆顶元素, 再与根节点的值比较, 并和其中节点值较小者进行交换不断重复以上操作直到叶子节点。
在VC环境中仿真了改进A*算法的实现过程, 建立一个60×60的网格, 每一个小方格代表停车场路网中的节点。用黑点表示起点和终点, 用浅灰色方格 (此格不可通过) 表示障碍物, 用深灰色方格表示路径。仿真结果如图9所示, 图 (a) 是没有障碍物情况下, 改进A*算法找出的最短路径, 图 (b) 是设置障碍物后找出的最短路径用红点跟踪其动态寻优过程。
将停车场入口、交叉路口、空闲车位均看成一个节点, 每一条行车方向上的路径对应一条边, 边上的权值为两节点间的路径长度。因此停车场空闲车位分布就转化为一带权有向图G= (N, E, L) 。其中N表示图中所有结点的集合, E表示连接结点的弧段的集合, L是路权集合。泊车诱导的工作流程是利用下位机采集的到车位信息更新数据库中的车位状态表, 系统根据停车位占用情况为停泊车辆分配空闲车位, 设目标点为N, 通过A*算法计算入口到车位的最佳引导方案。
表2是在重庆市某大型停车场路网数据研究的基础上, 对原A*算法和改进后的A*算法的对比验证实验结果。选取起始和终点节点ID不同的四组数据, 对改进前后两种算法搜索节点的耗时量进行了比较。分析实验数据得知:改进后的A*算法搜索的路网节点数目要明显少于原A*算法, 提高了搜索效率。
4.4.2 无线语音泊车诱导方法
在A*算法确定了停车场入口处到每个车位的最佳行车路线后, 利用单片机语音系统对每个车位的最佳行车路线进行录音。当车辆到达停车场入口处时, 给驾驶员分发一套无线语音通讯系统 (从机) , 系统根据车位状态表计算出当前离入口处最近的车位, 将最近车位和行车路线语音信息进行绑定。当系统检测到车辆行驶到特殊位置 (如入口和交叉口) , 主机语音系统调用录制好的相应行车路线语音信息, 无线射频模块将语音信息传输给从机, 驾驶员按照语音提示来行车, 可在最短时间内完成车辆的停泊。
5 结束语
本文将无线语音通讯技术引入停车场泊车诱导系统, 实现语音自动播报, 引导驾驶员快速、有序泊车。下位机是以单片机为核心的车位信息采集系统, 价格低廉, 性能可靠, 利用E-link数据传输器实现车位信号网络传输, 无需铺设现场总线。设计的单片机语音系统可实现一个主机语音系统和多个从机并行无线语音通讯开发了停车场泊车诱导监控系统, 实现车位电子地图可视化操作, 并对A*算法进行了改进和仿真研究, 确定车辆最短泊车路径。全程无线语音泊车诱导系统可以消除传统诱导标志牌可视距离有限、逐级安装等弊端, 提高泊车管理系统的信息化水平和泊车效率。
参考文献
[1]周巧仪, 孙全.大型停车场车位诱导系统方案探析[J].今日科技.2010 (7) :43-45.
[2]夏继媛, 李欣, 冯明发.停车场控制系统中语音提示功能的实现[J].哈尔滨理工大学学报, 2005, 10 (1) :135-138.
[3]贺振欢, 孙壮志.基于语音识别技术的停车诱导系统研究[J].交通标准化.2009, (11) :58-61.
[4]HUCHAO, CHANG TIANHAI.The research onoptimal parking space choice model in parking lots[C].International Conference on Computer Research andDevelopment, 2011, (2) :93-97.
[5]郭荣庆, 孙家永, 徐世维等.基于激光传感器的车辆超高检测系统研究[J].科技导报, 2011, 29 (8) :63-66.
[6]李建设.基于E-Link数据传输器的应用技术探讨[J].国外电子元器件, 2006 (4) :71-74.
[7]毛君, 刘克铭, 徐广明.基于C8051F020单片机的串口通信应用[J].煤矿机械, 2005, (5) :79-81.
[8]王健, 常攀峰, 冯洁.基于SPCE061A的智能测重系统[J].仪器仪表学报, 2006, 27 (6) :240-246.
[9]张琛, 耿标, 杨敏杰.基于NRF24L01的点对点无线通信[J].科技博览, 2010, (29) :51-52.
无线语音传输系统 篇8
现代家用电器被人们设计的越来越人性化, 越来越便于使用, 由于生活的高节奏, 人们对解放双手的需求也越来越迫切, 传统的手动遥控家电控制的方式已经不能满足这方面的要求, 单片机技术和语音识别技术的出现, 使人们找到了一种可以替代按键的操作方式。本文利用具有语音处理功能的低成本SPCE061A单片机作为无线语音控制器的核心器件, 通过对语音资料的压缩和解压缩, 采用信息容量较少的低频段数据传输, 软件系统采用了特定发音人语音识别的策略, 能以较高的识别率实现对照明系统、空调和电视机等家用电器的语音控制, 根据初始训练的语音命令来控制家电, 具有友好智能的人机交互方式。
二、系统功能设计
(一) 硬件平台。分析家用电器的工作特点, 我们要完成语音控制家电需要两个工作终端, 一个我们称为发送端, 即为实现语音控制的终端;另一个我们称为接收端, 主要完成接收来自控制端的语音指令并执行的终端。这两个终端均由以SPCE061A为核心的开发板和一个n RF2401模块组成, 硬件结构是相同的, 发送端接的喇叭用在语音训练时使用, 接收端接有喇叭用对语音输出。发送端利用SPCE061A自带的ADC, 通过其MIC通道将语音转换为数字量, 按照一定的格式编码通过n RF2401无线模块将数据发送出去;接收端通过n RF2401无线模块接收到来自发射端的编码数据, 并对之解码, 然后执行相应的操作。在初期试验中, 我们设计了一个发送端 (控制端) 和两个接收端 (模拟家用电视机和空调) 。
(二) 系统软件设计。系统运行后, 当发送端训练成功则一直处于等待状态, 在等待状态下判断是否有语音输入。如果检测到有语音输入, 进行录音判断并发送相应的数据;另一端在接收到数据后进行指令的判断, 进而执行相应的动作。如发送端没有发送, 接收端就一直处在等待状态。
两个接收端的硬件组成和软件的主要部分是一样的, 它们只是里面的语音资源不一样, 一个里面放的关于电视的语音资源, 另一个放的是关于空调的语音资源, 因此这两个发送端可以归并成一个, 即可称为发送端。下面将详细介绍这两大部分 (接收端和发送端) 的实现。
1.发送端程序设计思想。SPCE061A训练模式启动后, 系统播放语音提示, 提示用户语音训练己启动, 接下来用户可按照系统提示依次对各条命令进行训练, 在训练过程中, 如训练成功则有语音提示进行下一条命令进行训练, 如出现训练失败, 也会提示用户继续训练此条语音, 直到全部命令训练完毕后系统将准备进行语音识别。当人向控制器发出语音命令时, 声波通过Mic输入, 将相应的信号传递到SPCE061A处理芯片, 经编解码电路和数字信号处理后, 在芯片中通过相关程序与预先植入的语音库中的命令进行比较识别, 根据识别的结果进行判断, 转换为能被系统识别的信号, 从而对被监控的家用电器进行控制。
2.语音训练程序设计思想。该程序主要包括两个部分, 即语音训练部分和语音识别部分。通过语音训练可以使系统适应特定人的发音。语音识别部分则实现对特定人发出的语音命令与系统存储的语音命令的比较, 并根据比较结果产生相应的控制信号。程序执行步骤如下:程序开始运行, 首先将Flash (闪存) 中的语音模式擦除, 为下面语音训练的存储做准备。然后将播放训练提示音“一一”开始训练, 训练人听到提示音后开始训练, 此后开始第一条命令的训练。训练前先要训练触发名称像“电视”, 而后逐条命令进行训练。本系统设置了十五条语音命令, 分别为“遥控器”、“电视”、“空调”、“电灯”, “关机”等, 每五条指令为一组, 共分三组。每一条语音命令需要训练两次, 这两次训练系统会自动做出比较判断。当训练人两次发出的语音命令在误差允许的范围内, 系统则认为训练人发出的语音命令与系统存储的语音命令相同, 并判断为训练成功, 同时将训练人的发音特征存储到系统中。当训练人两次发出的语音命令不在误差允许的范围内时, 程序返回上一层对该条语音命令再次进行训练, 直到训练成功。像这样继续对余下的几条语音命令进行训练, 直到十五条语音命令完全训练成功。语音训练成功后, 程序进入语音识别阶段。首先初始化语音识别器, 播放提示音, 此时训练人可以对控制系统发出语音命令。然后, 系统将采集的语音进行处理, 并与存储器中训练人的语音样本进行比较。如果采集的语音是训练人的语音, 系统则将该语音与存储的语音命令比较, 根据比较结果产生相应的控制信号, 否则不产生控制信号。语音识别过程循环进行, 完成一条语音命令的控制任务后系统将等待训练人再次发出语音命令。如果训练人不再发出语音命令, 系统将一直处于等待状态。
3.接收端程序设计思想。接收端就是和家电相连接的控制器, 当收到指令时, 由控制器进行判断, 然后对相应的家电进行控制, 以达到语音通过无线传输来控制家电。接收端不需要进行语音的训练, 它主要的作用就是对收到的数据做出正确的判断。发送端在不发数据的情况下, 接收端处于空闲状态, 也就是一直处于等待的状态, 不断的进行检测, 看是否有数据的到来。
三、系统的实现说明
利用凌阳科技的集成开发环境IDE2.0进行设计, 程序编制完成后下载装入, 运行。分别把发送端和接收端的程序相应的装入单片机, 这个装入顺序不分先后, 当把发送端的程序装入并运行时, 作为发送端的单片机会出现提示音, 这是就开始训练了。训练完并成功时会有稍微长的提示音, 这时若接收端没有打开电源, 把电源打开, 就可以无线语音遥控。若是脱机运行即程序已经下载到单片机里面, 这时分别打开接收端和发送端的电源, 对接收端进行训练, 训练成功后可以无线语音遥控。
按以下的顺序对发送端进行训练:遥控器, 电视, 空调, 电灯, 关机, 电视, 开机, 河北卫视, 频道加, 频道搜索, 空调, 开机, 自动模式, 制冷模式, 制热模式。训练成功后, 无线语音遥控器就可以使用, 但每次触发一个命令时, 必须先触发“遥控器”这个名称, 然后在执行相应的指令。
以SPCE061A单片机为核心器件设计的无线语音接收、无线发送模块共同组成了无线语音单向通话系统。在程序的编制过程中, 由于要用到许多函数, 不仅要用到C语言的, 还需要用到汇编语言的一些指令, 所以为了简化程序的编制流程, 在设计时, 定义了许多模块, 便于程序中的调用。
四、结语
本文所述基于凌阳SPCE061A单片机的语音控制系统, 经过多次试验证明其控制效果较好。在训练过程中也发现训练人语气的强弱、声音的大小、背景噪音都会影响系统的灵敏性, 因此为使系统具有更强的适应能力, 还需要深人研究和改进。该语音控制系统有一个显著特点, 这就是只有经过训练的特定训练人发出的语音命令系统才会做出响应, 因而在安全保密系统中将具有一定的应用前景。由于该系统体积小, 可靠性好, 性价比高, 可用于设备的语音智能控制, 应用前景看好, 如加以完善可以实现非特定说话人的语音识别。
参考文献
[1].黄军辉, 董晓倩, 李建波.单片机原理与应用-凌阳SPCE061A[M].北京:人民邮电出版社