语音门禁系统(精选12篇)
语音门禁系统 篇1
1. 引言
语音教学对语言学习起着重要作用,发音错误就导致读不好、听不准,从而直接影响到词汇的记忆、积累以及听说能力。目前英语语音教学一般采用教师朗读,学生跟读;教师演示发音口形,学生模仿;教师播放录音,学生跟读等常规教学方式。这些方式单调、枯燥、抽象,受授课地点、时间的限制,调动不起学生的学习积极性。
为了解决英语语音学习中所出现的问题,提高语音教学质量,笔者设计了一个基于语音合成技术的可视英语语音教学辅助系统。系统可把学习者任意输入的单词、短语、句子用高质量的合成语音播放出来,同时将对应口形以动画形式生动形象地同步表现出来,学习者可参照系统模仿跟读,改进发音。
2. 英语语音教学系统软件设计与实现
除了听到的声音外,人说话时口形的变化有助于学习者对语言的理解,是人获取信息的重要渠道,学习者可根据口形变化模仿、对比、调整发音,语音中称之为视位。音位和视位是语音的两个基本特性,因此本系统在合成语音同时显示出口形变化,来改善传统语音软件只能听声的弊端。
2.1 设计思路
系统主要通过Microsoft Speech SDK提供的关于语音处理的应用程序编程接口SAPI进行可视语音合成开发。通过调用相关接口,系统允许学习者自己设定男女发音音调、音量和朗读速度,可以根据通知消息实时获得当前音素或视位信息并转换为口形动态显示出来。
2.2 总体设计
基于语音合成技术的可视语音教学系统的主体部分实现过程如下:
(l) 初始化引擎,注册回调函数,载入所有口形图片;
(2) 用户设定语速语调,输人文本;
(3) 调用SAPI函数朗读;
(4) 接收音素通知消息,根据音素值,变换为口形并同步显示。
2.3 详细设计
国际标准MPEG-4对视位的定义为与某一音位相对应的嘴唇、舌头、下愕等可视发音器官所处的物理状态,在此我们将其简化为口形。通过对英语发音口形的大量研究,将英语的音素发音按照口形进行分类。有些音素单从口形上看基本相同,比如[p][b[m],虽然三个音素气流、舌位变化不同,但其口形都是先闭合后张开。最终确定了常用单音素和22个基本静态口形的映射规则,如图1所示,系统初始化时须将此22个口形载入。
系统初始化完成后,学习者根据实际学习情况调整语速、语调、音量、语气,自行输入单词或句子,系统根据设定值调用以下函数朗读文本:
SpVoice1->Speak (WideString (UserText) , SVSFDefault) ;
朗读开始,声音将被合成并播放,遇到音素或视位变化时,系统会接收到SAPI发送的反馈消息,此时可根据当前音素或视位信息显示对应口形图像,关键代码如下:
为了得到自然的语音口形动画,可以通过图像变形方法在两个口形之间插入若干补间帧来平滑过度。
3. 结束语
利用此种可视语音合成技术进行英语语音教学, 可以提高学习效率,因人施教。但要想达到好的教学效果,语音库的选择很重要。微软、IBM、Nextup.com等多家公司都在研发自己的语音库,对比发现,好的语音引擎发音标准,相应嘴形配合到位,学习者可以更好的掌握发音。
摘要:语音合成技术是人机智能交互的关键技术, 本文描述了一种利用语音合成技术产生实时语音及其口形变化的英语语音辅助教学软件。该软件系统可以使语音教学更加生动形象, 增强学习交互性, 灵活性, 提高学生参与学习的主动性和积极性, 使学生更加容易和牢固地掌握语音知识。
关键词:英语语音教学,语音合成,可视语音
参考文献
[1]MPEG-4, 国际标准ISO/IEC14496[S].
[2]Microsoft.Speech API[EB/OL]http://www.microsoft.com/speech/developers.aspx, 2010
[3]胡壮麟.语言学教程 (修订版) [M].北京:北京大学出版社, 2001
[4]张鸽.创新性英语音素教学模式--多媒体人机互动式自主学习模式的理论与设计[J].外语电化教学, 2008.
[5]鲁杰, 王永斌.利用SmartRead SDK实现文本的语音合成[J].计算机与数字工程, 2009.
语音门禁系统 篇2
----“畅言智能语音教具系统”应用案例
随着天祝二中这所新学校在天祝这块美丽的藏乡之地日益茁壮,“教学点数字教学资源全覆盖”项目也逐步在藏乡的每一所学校得到推广。数字教学资源在我校得到了充分有效的利用,电子教具成为了我们每一位教师的得力助手,成为了每一个莘莘学子的良师益友,也成了我们二中得以迅速发展的后盾力量。
作为一名英语教师我深刻体会到了电子教具,尤其是畅言语音教具系统给我们英语课堂教学提供了优越的条件。畅言智能语音教具系统的合理使用实现了教材内容的标准带读、学生的互动口语评测,以及实物的有声教学等功能,丰富了教学手段,形象了教学内容,提高了学习兴趣。更为师生们拓展了广阔的想象空间,让师生们的创新能力得到了充分的发挥。
以往去上英语课就是一本书,一支粉笔,一块黑板,一张嘴加一台录音机,长期下来形成了枯燥无味的应试教学模式。而且每天都是上两三个班的英语课,一旦各班上课进度不一样时,每次上课前都要事先把磁带倒好,往往会耽误很多宝贵的课堂时间。使用畅言教具系统,只需一张小小的存储卡,就可以把几十盘磁带的内容全部存放进去,再也不用换来换去,倒来倒去,想听哪里或是想多听一遍,只需拿识别笔在想播放的地方轻轻一点,立刻就可以听到,大大提高了课堂教学的效率。
畅言语音教具系统的标准语音带读功能给予学生标准的语 音示范,便于学生模仿正确的语音语调,使用起来方便快捷,彻底克服了那种老师念学生读的机械、枯燥的练习方法。在动物类单词的教学中,通过智能语音隐形码制作卡片呈现一首和动物有关的自编的小诗“Do you like this zoo? Here’s the horse,there’s the cat.Here’s the cow,there’s the rabbit.”以及一个小型的动物园来复习已学过的动物类单词;随后,引出这节课要教授的新单词“sheep, hen,lamb,等”;最后以学到的新单词进行练习,音乐又响起那首自编的小诗,请学生亲自来做代入练习。在这种看、想、说的过程中,学生在较短的时间内完成了对动物类单词的掌握,开阔了眼界。同时,畅言智能教具系统为我们Listening训练教学提供了极大的方便,有些听力材料中常有新词、生词出现,这给学生听力带来了极大的阻碍,为了消除学生听力恐惧怔,提高听力效果,我们可以运用点读笔点出文中生词、新词,让学生多听几遍,多读几遍,扫清听力障碍,这是以往录音机无法做到的,之后我们就可以通听听力材料了。如果遇到难一点的听力材料,可以点重点多听几遍,哪里不会点哪里。同样,畅言智能语音系统还让学生们兴趣倍增,如在教学七年级上册Unit11《How was your school thrip?》,学生们随着畅言智能语音教具播放的优美音乐《Yesterday once more》一首回顾过去生活的英文歌曲,步入本单元过去时态的学习。再如,教学时间表达法这一单元时,我采用了以下的教学方法:首先,出示实物闹钟,问学生 “ What’s this in English? What time is it?” , 学生第一个问题会回答,但是第二个可能不会。然后,创设情境、困难转移,利用课前制作好的有声课件与闹钟进行问答。教师:Ok,you can’t answer it , it doesn’t matter, let’s ask the clock.“Who are you? ” “What time is it? ” 闹表回答(点读有声课件闹钟上的即时贴“I’m a clock.”“ It’s seven o’clock ”)学生认真听、跟读并学习时间的表达法。最后利用这种方式让学生上前点读即时贴,调动他们的兴趣进行更多时间表达法的学习。(twenty-seven past nine, a quarter to ten, half past twelve…)其次,在教授课文方面,我利用语音教具辅助教学法制作了能够说话和唱歌的洋娃娃、圣诞老人等一系列有声教具,使其代替我的角色朗读课文、唱英文歌曲,达到了寓教于乐,以趣激学之目的。在如此美妙的声音和愉快的气氛中,学生在乐中学,在学中乐,教学效果良好。
总而言之,畅言智能教具系统为学生提供了更加科学的学习空间,学生能更加清晰而准确地聆听录音材料,集中精力投入学习状态这些有声材料吸引学生们注意力的同时,势必会大大提高学生们的学习兴趣,从而更好地提高学生的英语水平和英语课堂教学的实效性。
单片机倒车防撞语音播报系统 篇3
【摘 要】单片机倒车防撞话音播报本系统由超声波测距仪、温度补偿装置、液晶显示器、单片机微处理器、语音播报器和电源组成。本系统克服了现有倒车雷达系统的不健全用问题,降低了倒车碰撞事故的发生概率。
【关键词】单片机倒车防撞语音播报系统 ISD4004语音模块 超声波测距 倒车防撞
随着社会的发展,汽车的数量也在大幅攀升。汽车在倒车时屡屡发生碰撞事件,造成了人身伤亡和经济损失。针对这种情况,本文设计了单片机倒车防撞语音播报系统以单片机STC89C52为核心,通过超声波测距模块,在整个倒车过程中自动测量出车尾到最近障碍物的距离,然后通过语音模块播报并在液晶显示屏显示距离,提醒驾驶员注意刹车。
单片机倒车防撞语音播报系统框图如图1所示:
图1 单片机倒车防撞语音播报系统框图
一、硬件设计
(一)主控制器
采用STC89C52单片机。它有8kb的FPEROM和256字节RAM,可满足系统编程需要,并且价格低廉,性价比高,可以支持TTL电平直接下载程序,不需要专门编程器烧写程序。
(二)显示部分
采用LCD16O2液晶显示屏。它是一种专门用于显示字母、数字、符号等点阵式LCD,其拥有友好的人机界面及强大的显示功能,特别适用于智能控制的可编程人性化显示。与中文液晶显示相比,英文液晶显示其编程更简单,具有功耗低,体积小,重量轻,寿命长,不产生电磁辐射污染等优点。
(三)语音提示模块
使用ISD4004语音模块。ISD4004系列单片语音录放电路是美国ISD公司的新一代产品,同早期美国ISD公司产品一样,它采用了ISD公司的Chip-Corder专利技术,多级存储技术,既声音无须A/D转换和D/A转换,采用直接模拟量存贮技术,因此能够真实、自然地再现语音、音乐效果声音,避免了一般固体录音电路量化和压缩造成的量化噪声和金属声。
(四)超声波测距电路
采用HC-SR04 超声波测距模块。它可提供 2cm-400cm 的非接触式距离感测功能, 测距精度可达高到 3mm。模块包括超声波发射器、接收器与控制电路。 工作时,采用IO口TRIG触发测距,给至少10us的高电平信号,模块自动发送8个40KHZ的方波,自动检测是否有信号返回,有信号返回,通过IO口ECHO输出一个高电平,高电平持续的时间就是超声波从发射到返回的时间。测试距离=(高电平时间*声速(331.5+0.607*当前温度M/S))/2。
二、软件设计
软件系统采用模块化程序设计方法,分为主程序、显示程序、温度传感器程序、语音模块程序等。
(一)主程序主要完成1602LCD液晶屏的初始化,测量当前温度,发信号给超声波模块开始测距,计算距离(采用温度补偿),查询静音按键是否按下,按下关闭语音,没按下进入录音模式,然后进行语音播报距离等工作。
(二)1602LCD液晶显示程序主要完成显示模式初始化,模式设置,关闭显示,屏幕清屏,显示开启及设置光标起始位置,写地址,写数据,直到数据全部写完等工作。
(三)温度传感器程序主要完成对温度的读取,以便超声波模块计算距离时进行温度补偿,提高测距的精度。
(四)语音模块程序主要完成读取距离信息进行录音,调用语音片段进行播放测量出的距离等工作。
三、结束语
本文采用超声波测距,以声音和直观的LCD显示屏告知驾驶员汽车尾部障碍物的情况,解除了驾驶员在倒车时前后左右探视所引起的烦扰。由于采用了语音芯片,能够及时播报出当前的距离,克服了现有倒车雷达系统不健全的问题,降低了倒车碰撞事故的发生概率。
【参考文献】
[1]元红妍.电子综合设计实验教程[M].济南:山东大学出版社, 2005.
[2]雷思孝,李伯成,雷向莉.单片机原理及实用技术[M].西安:西安电子科技大学出版社, 2004.
语音门禁系统的硬件设计 篇4
随着科学技术的飞速发展以及社会经济水平的不断提高, 促使家庭生活自动化, 智能大厦也正在向着舒适化、安全化、信息交流的快捷化的方向发展。智能大厦具有节能和省地的优势, 已经成为未来房地产住宅市场发展的大趋势。随着现代通信技术的发展, 近几年发展起来了语音门禁系统, 它是一种智能化的系统, 能够实现多种功能。语音门禁系统具有许多优点, 例如, 操作快捷、防碰撞能力强、工作距离远、安全性高等等。在智能大厦安防系统中, 语音门禁系统有着广阔的市场前景。因此, 智能大厦语音门禁系统的应用具有重要的意义。为了保证智能大厦的安全可靠性, 应用于智能大厦的语音门禁系统尤为重要。
1 语音门禁系统的主要功能
语音门禁系统这种流行的管理方式目前已经被物业公司普遍采用。而且, 语音门禁系统有利于提高智能大厦的形象, 使智能大厦房屋的附加值得到提高。下面分别详细阐述应用于智能大厦的语音门禁系统的主要功能。
1.1 可视化对讲功能
每位智能大厦访客可在智能大厦的单元门口主机上拨号, 对住户的分机进行呼叫, 在系统正常工作的情况下, 住户室内分机就会振铃, 在分机显示屏上能够显示出来智能大厦访客的录像, 住户拿起话机, 就能够与智能大厦访客进行通话, 通过声音和图像两个方面对于智能大厦访客的身份进行辨别。
1.2 自动关门功能
住户与智能大厦访客通话后, 住户允许智能大厦访客进入时, 可以通过按住户分机上的开锁键给智能大厦的单元门遥控开锁, 智能大厦访客进入智能大厦的单元门之后, 单元门在闭门器的拉动下自动关门。
1.3 防盗报警功能
智能大厦住户室内分机与报警控制器连接, 设置了红外探测器和紧急事故报警按钮。通常情况下, 智能大厦的单元门口的防盗门是关闭的, 非本单元的智能大厦住户无法进入智能大厦的单元楼道内, 从而使一些外来的闲杂人员进入智能大厦单元楼道的情况得到有效避免, 更使小偷进入楼道内进行非法行窃的情况得到有效避免。
1.4 密码开锁功能
在智能大厦住户回家时, 不仅可以通过钥匙进行开锁, 而且也可以通过在智能大厦的单元门口主机输入开锁密码进行开锁, 密码开锁功能可以实现一家住户具有唯一的密码的制度, 并且住户能够随时进行开锁密码的更改。同时, 智能大厦的监控中心每个智能大厦单元的出入情况进行实时的监控和记录。
1.5 紧急救护及紧急呼叫功能
在智能大厦住户生病需要紧急救护时, 可以通过按智能大厦住户室内分机上的紧急按钮向智能大厦物业管理中心报警, 进行紧急求助, 也可以将紧急按钮安装在智能大厦住户老人和儿童的床边或者卧室内, 有利于在发生紧急情况时能够及时进行报警求助, 智能大厦物业管理中心接到智能大厦住户的求救信息后, 可以马上与医疗救护单位取得联系, 及时进行紧急救护。在发生火灾、地震等紧急事件时, 智能大厦物业管理中心可通过中心管理机向小区内各个住户紧急报警通知紧急事件的发生, 以便大家都做好防范措施。
1.6 双向通话功能
智能大厦单元的门口主机、智能大厦管理中心机、智能大厦室内分机这三者之间都能够互相进行通话。而且, 智能大厦管理中心小区能够对小区住户分机的事故紧急求助报警、燃气泄漏自动报警等信息进行实时接收和储存。
2 语音门禁系统的硬件设计
2.1 单片机
本文介绍的语音门禁系统使用AT89S52单片机。这种单片机是美国的ATMEL公司的产品, 是一种功耗非常低而且性能非常高的8位CMOS微处理器。在该单片机内部, 有一个8KB的可编程Flash存储器, 同时, 双数据指针和看门狗在片内集成, 而且本系统还具有低功耗休闲状态及关电方式。
2.2 数字信号传输电路
从单片机串行口传出的数字信号传输距离是非常短的, 只有几米的距离, 要进行长距离传输, 必须使用长线驱动器。本系统选择MAX483作为数字信号的长线驱动器。
MAX483是一种功率收发器, 而且是适用于RS-485和RS-422这两种通信协议的。在每个MAX483中, 都有一个驱动器和一个接收器, 主要用来进行半双工通信;有一个下降的变换速率驱动器, 它的电磁干扰是非常微弱的, 而且由于终端电缆不合适而引起的反射降低, 所以, 在数据传输速度达到250kb/s时, 能够允许进行无差错数据传输;不限制驱动器的转换速率, 可以让驱动器以2.5Mbps速率进行传输;输入阻抗是标准的, 可以在总线上添加32个收发器, 如果需要添加更多的收发器, 可以使用MAX487, 它能够携带128个收发器;传输距离能够达到1 000m, 驱动和接收转换时间小于3μs。
2.3 视频传输电路
本系统为了保证视频的传输更加有效, 选择了MAX4447和MAX4444两种芯片。在这两种芯片中, MAX4447是一种线性驱动器, 进行单路视频输入和双路差分输出;MAX4444也是一种线性接收器, 进行差分信号输入和单端信号输出。MAX4447和MAX4444采用电流反馈技术使带宽得到增加。MAX4447能够进行传输的最大信号带宽可以达到430MHz, 信号传输速率能够达到1.544Mbit/s, 输出驱动电流为130m A。在低功耗的模式下, 电流损耗小于5.5m A, 输出是高阻抗状态。
3 结论
总之, 语音门禁系统作为智能大厦的重要组成部分之一, 能够提供客人与住户之间的双向可视通话, 实现图像和语音的双重识别, 从而增加居民在智能大厦居住的安全可靠性, 为在智能大厦居住的居民提供一个安全、方便、舒适的生活空间, 而且也能够使智能大厦的物业管理更加便捷、高效、科学, 节省大量的时间, 提高工作效率。可以预见, 将来语音门禁系统将会得到越来越广泛的使用。
参考文献
[1]唐艳, 孟俊焕, 王洪博.可视对讲智能化系统在国华经典小区中的应用[J].自动化技术与应用, 2006 (5) .
[2]戎玲, 李瑛琦.数字可视对讲系统与小区宽带共享物理网络应用的可行性分析[J].中国安防, 2009 (5) .
基于激光天线语音通信系统的研制 篇5
摘要:通过对电磁波无线、光纤及现有的激光无线通信的优缺点分析,介绍了一种结构简单的激光无线语音通信系统的结构及主要硬件的设计。经实际应用表明:该系统能够灵活地适应各种场合。
关键词:激光 无线通信 语音
电磁波作为无线通信的信号载体由来已久,至今仍广泛应用于短波、微波、毫米波无线通信。但它们存在致命的缺陷:保密性差、通信容量低、波段资源受限制等。光纤通信以光作为载体,以光纤作为传输介质。由于光的频带资源十分丰富,故通信容量巨大,已成为现代通信的主体。但光纤通信网络包括光端机、光缆等通信基础设施的建设是事先规划的、固定的,将会出现光缆没有到达或光缆不便到达的地址,无法进行光纤通信。早在二十世纪70年代,人们就开始了激光大气通信技术的研究,但由于当时光纤通信较为成功,激光自由空间的通信未能得到充分重视。近几年来,由于移动通信的需要和微波通信的带宽限制,光自由空间的通信取得了很大的进展。美国朗讯公司采用1.55μm波段的半导体激光器加光纤放大器(EDFA)作为发射光源,并采用波分复用结构,实现10Gbps容量的空间光通信。日本、欧洲等国家也报道了几种空间激光通信装置。我国电子科技大学采用二氧化碳激光器(10.6μm波长,内腔式),实现定点双工四线制三路电话的大气通信(技术成果编号88210414);中山大学激光与光谱学研究所采用音频或数字信号的调幅激光制式工作实现大气通信传输(技术成果编号89209283)。但它们都因通信容量低,在通信系统的结构上,没有与其他通信设备(包括光纤通信、微波通信)的接口,故实用价值小。为解决上述问题,中国科学院上海光学精密机械研究所报导了一种无线激光通信端机实现了与其它通信设施的接口(技术成果编号00217069.8),但由于该端机设备昂贵,未能得到广泛应用。本文提出了基本激光无线语音通信系统的研制,目的在于提供一种价格便宜、携带方便、同机具有激光信号发射和接收装置,且激光接收装置具自动跟踪激光发射装置的双工通信功能的设备。该设备发射装置发出调制激光信号不仅可在自由空间传输,也能直接利用光纤作为载体传输,克服了在天气恶劣情况下无法通信的缺陷;该设备信号传输容量大,可直接与光纤通信、微波通信网络并网,并能灵活地适应各种场合的使用。
图1 空间激光无线通讯系统原理框图
1 总体方案设计
激光天线通信系统主要由激光发射装置、激光接收装置和光学望远镜三部份组成(如图1所示)。其工作原理是:发射端的轴电缆通过高频电缆与发射机码型变换器相接;光纤适配器通过光纤与发射机光电转换器相连;码型变换器与光电转换器均与制式选择开关相连,然后经信号处理模块进行整形、放大、时钟提取等处理,输入激光驱动器使激光器组件产生调制的激光光束,通过激光发射天线定向向空间发射。经光接收天线收集的调制激光信号接进探测器,转换成信号输入信号处理模块,再接进制式选择开关后分两路:一路连接激光驱动器,经光纤适配器连接光纤通信线路;另一路则与码型变换器相接,再接入同轴电缆至电传输线路上。对于本系统所设计的语音激光无线通信系统主要由图2所示的各部分组成。
(本网网收集整理)
2 主要硬件的设计
2.1 激光器件的选择
空间激光通信波长选择主要考虑:尽量避免太阳辐射的影响、减小光束发射角、减小收发天线的尺寸、光波在大气中的透过率以及器件的现实性或预期的可行性,包括器件性能价格比的预计。从激光天线通信的角度分析,大气的透射率是个重要影响因素。在小于300nm的紫外波段,大气的透过率急剧下降。显然,紫外线光不利于大气通信。可见波段的激光,例如二次倍频YAG激光器,也不利于避免太阳光引起的背景辐射噪声。常用的`激光波段有830~860nm、980~1060nm和1550~1600nm,都是良好的大气窗口。
2.2 光发射与接收天线
由于光学天线的功能是将需传输的光信号有效地发向对方并将对传来的信号光高效接收,因此,光天线的设计是在满足总体设计的前提下,保证系统在设定的通信距离及大气衰减时能正常工作,合理选取发射远镜的远场发散角、接收望远镜的接收视场角及光学系统的其他参数。下面分别予以介绍。
(1)设计考虑
主要光学性能要求:高的光学质量(λ/20RMS);低的遮挡率;高的光透射率(T≥0.92);低的散射光。此外,要求材料热膨胀系数小、机械强度纺高、重量轻、使用寿命长。
图3 (a)光发射天线系统原理图(b)光发射天线系统原理图
光学设计考虑:为了满足空间通信对天线的要求,笔者选择卡塞格伦天线。主要包括:抛物面初级反射镜;双曲线次级反射镜;聚焦镜,使成像在天线结构的外部。
(2)性能分析
假设光源电场强度满足高斯幅度分布,即
其中,ω为光腰大小,R表示曲率半径。
利用非涅尔近似场区的辐射定律以及天线增益定义,得到观测点(r,θ)处的天线增益值:
其中,
定义:
α=a/ω,γ=b/a,X=kasinθ,β=(ka2/2)[(1/r)+(1/R)]
次级反射镜的遮挡率,天线的误指向效应以及光学天线的桁架对天线增益都有较大影响。此外,对接收无线的增益,检测方式也有较大影响。
在光学设计时,为了满足空间通信对天线的要求,光发射天线系统如图3(a)所示,它由半导体激光器和设置于其光路上的发射镜构成。光接收天线系统如3(b)所示,主要由校正镜、校正镜2次镜胶合镜、主镜、滤光片、聚光镜胶合镜和滤光片聚光镜、探测器等组成。其中,探测器采用SI-PIN GT101型复合光电二极管完成光信号转换为相应的电信号。该器件在反向偏置条件下工作,当光照时,半导体吸收光,在耗尽层或离耗尽层一个扩散长度内产生电子空穴时,最后被电场分开。当载流子漂移通过耗尽层时,在外部电路中形成电流,从而实现光电转换。
图4 激光无线通信(发送器)原理图
2.3 主要电路设计
・电源电路选用了集成稳压器。
・前置处理电路主要包括前置放大器和功率放大器两部分。经内调制转换的电信号通常比较微弱,需经前置放大电路将前级电路的输出电压放大。故前置处理器质量的优劣,在很大程序上标志着系统整体的音质水平。即前置处理器与功率放大器的选择对于本系统非常重要。本系统采用集成芯片NE5532作为前置放大器,LA4101作为功率放大器。同时,为获得较好的效果,减小干扰,在信号输入前置放大器之前,设计了高通滤波器。
・调制电路对光源进行调制的方法有若干扰,但从光源与调制器之间的关系可分:光源的内调制、光源的外调制。本系统采用了光源的内调制方式。
・功率放大电路因光电探测器的电信号较弱,需经功率放大器放大电压信号,产生足够的不失真的输出功率,以推动扬声器发音。放大器的种类较多,本系统采用集成电路功率放大器LA4101。
上述设计的发射电路如图4所示,接收电路如图5所示。
图5 激光无线通信(接受器)原理图
3 试验样机及结论
在上述设计思想指导下,完成了一个5km的激光无线大气通信机试制。通信光源采用波长为0.885μm的半导体单模量子阱激光器 ,用芯径为200μm的光纤耦合,出纤光功率为200mW。光天线发射/接收望远镜的通光孔径为φ110mm,激光远场发射角为1.5mrad,接收视场角为3mrad。
本系统兼容128/256/512/1024/2048kbps速率,并具有AMI及HDB3,码两种接口功能。该系统已进行了户外开通试验。将其设备分别设在相距约5km的两栋高楼之间(要求视距无遮挡),进行了长达360h的开通试验,其中经历了大雾、大雨、小雨、晴天等天气变化。试验结果表明,除能见度极你的大雾天气外,通信系统都能正常工作,通话质量良好。该个有以下优点:
(1)具有双工位功能;
(2)可实现单对多的多通道通信;
(3)通过光学望远镜检测发射部分与接收部分之间的对正情况;
(4)结构简单,携带方便;
(5)具有与光纤通信接口,适用范围广,特别适用于两河对岸、高山之间、高层建筑之间的无线通信;
语音门禁系统 篇6
关键词:小学;语文;学习情境;语音系统
情境,是运用实物、多媒体、语言等手段,创设真实生动的情境,激发学生积极的情感,对学生进行个性的陶冶和人格的培养,提高学生的自主精神和合作精神,培养学生欣赏美、感受美、创造美的能力。
苏霍姆林斯基说:“所谓课上得有趣,这就是说,学生带着一种高潮的激动的情绪从事学习、思考和写作,在学习中感受到自己的智慧力量,体会到创造的欢乐,为人的智慧和意志的伟大而感到骄傲。”而我认为在课余拓展建设校园语音系统,拓展语文学习情境全过程地激发起学生学习的兴趣,给学生营造出真实、快乐的语文学习环境,对提高学生学习语文成就感和语文综合素养有很好地促进作用。
一、校园语音系统的含义和功能
《文字转语音播音系统》是一款把文字转成语音的朗读软件,是专为您提供的电脑播音员。它采用国际领先的语音合成技术,播音效果可与专业播音员相媲美,是一款学习和语音宣传的完美软件。
《文字转语音播音系统》的特色功能:可以朗读任意中文、英文、韩文、日文等文字内容,效果清晰、流畅、自然。其支持男声、女声等多种音色,可以根据喜好自由选择。文字朗读可以带背景音乐导出为MP3文件,背景音乐可以自由更换,让朗读效果更具特色。
二、校园语音系统的具体应用
1.创设习作展示情境,提高学生成就感
孩子都希望被尊重和赏识,创设习作展示情境对促进其成长意义非凡。学生有了习作能力,能写出好的习作当然要为学生多多创造展示的机会,培养习作成就感,加深习作的兴趣。如,校园内部红领巾广播宣读范文,校园网站展示或合订内部小期刊发给家长传阅都不失为一种好方法。可是如果利用这个《文字转语音播音系统》就能更好地把学生的作文在课堂以标准的普通话和优美的背景音乐搭配起来并打包成为赏识教育的范文,让学生有一种受宠若惊的感觉。我做过这样一篇优秀作文转化MP3效果的学生作文后,效果真就如同CCTV的播音效果,这名学生不仅名气大增,而且他那心气儿和成就感不断高涨。同时一下子刺激带动其他学生努力习作,争取播发,提高整个班级习作兴趣和创作氛围。
2.创设普通话情境,提高学生普通话水平
现在的学生因为父母的工作原因,每年都会有新转学来的学生。他们来自五湖四海,这些学生的普通话受地域和父母口音影响,家乡味很浓,这些学生显得格格不入,自信心受到很大打击。尤其是拼音音调一时半会儿很难纠正。语文教师除了在课堂上正确教授新课音形义,对这些新来学生的音调还得创新点子循序渐进地更正过来。我利用《文字转语音播音系统》来为学生创设情境,让学生亲身经历、亲身体验他们语音的问题所在,寻找自己普通话的缺点。让方言重的同学专门对比联系朗读课文或句子,还专门做了诸如“l、n;z、c、s、zh、ch、sh;yin、yinɡ”词句的对比朗读。不但学生不觉得枯燥了,而且普通话进步的速度也快多了。现在这些孩子说起话来字正腔圆,学习的自信心十足。
3.创设校园活动情境,提高学校美誉度
语文是具有工具性的特性,老师不但要让学生学语文、用语文,还要让学生爱上语文。我认为创设校园活动情境可以提高学校活动的美誉度和学生语文的综合素养。校园活动的主持台词中间适当穿插文字转换的语音,就像火车站播发发车的语音、大型超市宣传的语音给人一种新奇和智慧的感觉。这样的语音穿插很好地提升了活动的乐趣,提升了活动的整体品味,让活动更加显得正规、庄重。同时活动中穿插的台词有力地训练了学生应用语文过渡段落的能力,提高了学生语言组织的能力。
综上所述,拓展创设语音情境将有利于学生语文兴趣的培养,是语文学习的补充,能进一步提高学生的语文能力。
参考文献:
[1]李炳南.语文课堂教学技能训练.湖南大学出版社,2001.
[2]韦志成.语文教学情景论.广西教育出版社,2001-01.
《玉篇直音》的语音系统 篇7
樊维城等人纂修的《海盐县图经》卷十二“顾野王”下说:“所撰《玉篇》《舆地志》各三十卷, 《符瑞图》《顾氏谱传》各十卷, 《分野枢要》《续洞冥记》《玄象表》各十卷, 《文集》二十卷, 并行于时。”并没有提到这本《玉篇直音》。
明末文人著书的一个风气是不具自己的名字, 而是署所谓名人的名字, 以提高所著书的名望, 《四库全书总目提要》就批评《玉篇直音》署“顾野王”的名字是作假行为, 所谓“舛谬”。
樊维城, 黄冈人, 万历四十七年 (1619) 进士, 除海盐知县①, 清人王彬修、徐用仪纂的《海盐县志》②记载樊维城是“天启初年任知县……修辑县图经, 并刻艺文、前编志林” , 天启元年是公元1621年, 海盐县志编纂委员会编的《海盐县志》载樊维城“万历47年任海盐知县”, 《盐邑志林》是中国第一部郡邑丛书, 汇集了该县历代人士的著述41种, 刊于明天启三年, 即1623年。那么《玉篇直音》的编纂是在樊维城到海盐任知县一职时开始组织编纂, 他聘请姚士粦等三人参与具体工作, 它的成书应该是在1619-1623之间。
《玉篇直音》共有13964条注音, 全书基本采用直音的形式注音, 也有434例用纽四声法的形式注音。我们主要运用了反切比较法和统计法, 结合音位分析法、文献参证法和方音参证法对其进行了研究, 发现《玉篇直音》的语音面貌如下:
一、声母有27个, 其主要特点是:
1.全浊声母基本保存, 但有约为10%左右的字与清声母互注, 如並母字与帮、滂互注的分别是32例、20例, 而並母字自注的达305例;奉母字与非、敷互注的分别是18例、7例, 而奉母字自注的有164例;定母字与端、透互注的分别是21例、19例, 而定母自注的517例。例如:
備 平祕 並至三去止 /庇 必至 帮至三去止③
甹 普丁 滂青四平梗/平 符兵 並庚三平梗
2.非敷合流, 敷母字自注48例, 而与非母互注有64例, 奉母字也有一部分与非敷合流, 奉母与非、敷互注的分别是18例、7例, 自注的164例。
3.零声母扩大, 影喻合流, 疑母只有洪音还保存, 微母部分字也变为零声母。
4.泥娘合流, 娘母自注有4例, 与泥母互注23次。
5.知二庄精、知三章分别合并, 知三章有一部分字流入精组, 知二组自注35例, 庄组自注 (不计生母) 192例, 知二与庄组互注35例, 与知组自注的数量相当, 庄母自注80次, 与精、从互注42次, 互注占庄母总数的34.4%。知三与章组互注的有200例, 其中知母自注49次, 与章母互注109例, 彻母自注42次, 与昌互注70次, 互注数比自注数要多, 因此说知章、彻昌合并没问题, 根据语言演变的系统性、平行性原则, 可知知三与章组已经合并。
6.非敷奉与晓匣的部分合口字相混, 非敷奉与晓匣互注的有22例。
7.禅日 (互注有10例, 还有1例是书日互注, 1例心日互注) 、奉微、匣喻相混。
8.船禅、从邪不分。
9.有各种声母类混注。如:
帔 披义 滂寘三去止/辔 兵媚 帮至三去止
坤 苦昆 溪魂合一平臻/昆 古浑 见魂合一平臻
龐 薄江 並江二平江/防 符方 奉阳三平宕
戊 莫候 明候一去流 /父 扶雨 奉麌三上遇
夕连 邪仙开三平山 /延 以然 以仙开三平山
囂 许娇 晓宵开三平效 /枭 古尧 见萧开四平效
赥 许激 晓锡开四入梗 /隙 绮戟 溪陌开三入梗
媸 赤之 昌之开三平止 /尸 式之 书之开三平止
二、韵部共24个, 韵母有47个, 其主要特点有:
1.-m尾韵基本消失, 臻深、山咸分别合并, 但-m尾可能尚未完全消失。侵韵自注129次, 与臻摄的真、臻、欣有33例互注, 互注占侵韵总数的20.4%, 而且很多字为常用字, 如牝品、淫寅、饮引等。咸摄与山摄互注有107例, 占两韵总字数的6.25%, 比例较低, 但有好多为常用字, 如含寒、贪摊、甘干。相对于总字数来说, 深、咸摄与臻、山摄互注的比例都不算高, 对于这个问题, 我们还要注意到深、咸摄 (除凡韵) 都只有开口, 如果统计时不计算臻、山摄的合口字, 那么互注的比例就要大为提高;“根据有关的材料, 吴方言中的闭口韵消失较晚, 明末清初仍在有些方言中保存着闭口韵。”④《玉篇直音》-m、-n互注的数量不算太多, 也许正反映了注者的方言里还有-m尾字的残存。另外, 《玉篇直音》出现了43例-n、-ŋ为相混的音注。
2.入声-p、-t、-k的区别消失, 都转化为-。
3.重韵、重纽的区别均已不存在。
4.异摄各韵大量合并, 韵部大大简化, 如蟹摄三、四等韵自注259次, 与止摄互注258次;登韵与庚二韵、耕韵互注49次, 与自注52次相当。再如江宕二摄有40例互注, 梗曾二摄有51例互注。
5.三、四等韵合并;少数开口二等喉牙音字已经产生-i-介音, 与三、四等韵同音, 如《玉篇直音》有少量的二等字开始与三、四等字互注:
江自注19 与阳互注5 (溪)
庚二自注47 与庚三互注1 (影) 与青互注1 (匣)
耕自注48 与青互注1 (匣)
删自注57 与元互注2 (影) 与先互注2 (见影) 与盐互注1 (影)
山自注32 与先互注1 (匣) 与盐互注1 (见)
咸自注20 与盐互注1 (匣以) 与元互注1 (晓匣) 与仙互注3 (见2匣以1)
肴自注131 与宵互注4 (见晓疑) 与萧互注9 (见溪晓匣)
但又有不少一、二等韵的字 (不限于舌齿音) 互注。
6.很多《切韵》音系的合口字读作开口。如:
顫 之膳 章线开三去山 /专去 职缘 章仙合三平山
查 侧加 庄麻开二平假 /挝 张瓜 (集) 知麻合二平假
攫 居缚 见药合三入宕 /脚 居勺 见药开三入宕
俊 子峻 精稕合三去臻 /进 即刃 精震开三去臻
湍 他端 透桓合一平山 /滩 他干 透寒开一平山
7.止/遇摄、效/流摄、果/假摄分别有少数字读音相混。
8.-n、-ŋ尾韵在界限基本清楚的前提下, 有部分臻深摄与通曾梗摄的字相混。
9.“鳥”有[t][n]两读。
10.有各种韵母类混注。如:
都 当孤 端模合一平遇 /多 得何 端歌开一平果
播 补过 帮过一去果 /布 博故 帮暮一去遇
助 床据 崇御合三去遇 /坐 徂卧 从过合一去果
什 是执 禅缉开三入深 /二 而至 日至开三去止
三、声调
1.有平、上、去、入四声, 各分阴阳, 因此有八个声调, 平声共有4926例, 自注的数量是4851例, 占总数的98.5%;清浊互注的数量是66例, 占总数的1.3%。上声共1963例, 自注1935例, 占总数的98.52%;清浊互注的有28例, 占总数的1.43%。去声自注数量是1987, 占总数的95.6%, 清浊互注的有91例, 占总数的4.4%。入声自注的数量是1791例, 占总数的95.5%, 清浊互注的有85例, 占总数的4.5%。
2.全浊上声绝大多数已变为去声, 还有极少数残余。全浊上声与去声互注共156次, 占全浊上声总数的31%。
直音这种注音方法决定了它反映的是一种实际语音系统, 因此研究、整理出《玉篇直音》的音系面貌, 对于明代语音及汉语音韵史的研究都有重要的理论和实际意义。
从史书的记载看, 樊维城和姚士粦二人学问渊博, 郑端胤、刘祖钟也有家学渊源 (郑端胤的曾祖父是一个藏书家) , 而且本人也是文人, 他们合作给《玉篇》注音, 当是依据一种四个人都能讲、能听得懂、能认可的语音, 实际上这只能是一种文人中通行的语音, 亦即所谓官话, 当然免不了受到方言口语的影响。
海盐话本身也比较有特点, 它处于北部吴语区, 距离杭州不远, 受官话的影响可能比较大, 所以明人顾起元《客座赘语》称:“海盐多官话, 两京人用之。”
通过前面的叙述, 我们看到《玉篇直音》的音系并不是一种“一尘不染”的纯语音系统, 它既有很明显的吴语特色, 如基本保留全浊声母, 从邪、船禅不分, 匣喻、奉微相混, 端、精组开合口相混等, 又有官话色彩, 比如全浊声母的清化, 浊上变去, 开合界限基本清楚, 某些字的特殊读音与现代汉语普通话相同, 山咸摄一、二等错综复杂的关系等, 梅祖麟⑤举例说明北部吴语仍有个鱼虞有别的层次, 前面第三章所举鱼虞互注的近200例中, 不仅有见系, 而且有大量的知章组字, 看不出鱼虞有别的痕迹。
综上所述, 《玉篇直音》反映的是一种颇受官话尤其是南系官话影响的吴语区知识分子或者说文人讲的读书音, 它不可避免地有口语的成分, 通俗的讲, 这是一种海盐普通话, 我们可以称之为海盐官话。
这种语音现象, 在现代汉语方言中也有体现, 如陈松岑⑥描写的绍兴五级普通话, 其中的三级普通话 (绍兴普通话) ts与ts相混, 四级普通话 (绍兴官话) 就保留了全浊声母。《玉篇直音》反映的这种海盐官话可能就相当于介乎绍兴普通话和绍兴官话之间, 也许就是顾起元提及的海盐官话的详细描述。
另外, 明代南曲的用韵依据的究竟是《洪武正韵》, 还是“自然之音”?如果是依据“自然之音”, 那么这“自然之音”又是怎样的一副面孔?曾经兴盛一时的海盐腔用韵情况又如何呢?也许, 《玉篇直音》还有助于探讨明代戏曲海盐腔的用韵及中国戏曲声腔史。
注释
1 张廷玉《明史》, 中华书局, 1974。
2《中国地方志集成·浙江府县志辑·海盐县志》, 江苏古籍出版社、上海书店、巴蜀书社, 1993。
3 “備”是被注音字, “平祕”是反切, 然后是声、韵、呼 (唇音不分开合) 、等、调、摄, 斜线后是注音字和它的反切、音韵地位和拟音, 此后概依此例。
4 耿振生《明清等韵学通论》, 语文出版社, 1992。
5 《现代吴语和“支脂鱼虞, 共为不韵”》, 《中国语文》2001年第1期。
智能语音驱鸟系统设计与实现 篇8
鸟类对农业生产的危害日趋严重,导致农产品产量和质量下降,造成巨大经济损失。农业生产中的传统驱鸟手段是利用巨大声响或视觉效果使鸟类受到惊吓来驱鸟,如敲锣、放炮、装稻草人等,这些方法由于具有单一性,驱鸟效果不佳。近年来,国外专家研究基于鸟类生活习性的防护技术,主要针对鸟类的听觉、视觉、嗅觉,并开发出一系列驱鸟产品,如超声波驱鸟器、激光驱鸟器、无公害化学驱鸟剂等。这些产品在国外应用初期都取得比较好的效果,但都面临鸟类适应性的问题,引进国内使用效果不佳,尤其以天敌鸣声为声音资料的驱鸟设备,由于种间差异性和地域差异性,国外鸟种的天敌鸣叫不一定适用于国内鸟种。此外,国外设备价格昂贵,难被国内用户接受[1]。
针对以上难题,需要研究低成本、抗适应性、适用于我国鸟种的驱鸟器。智能语音驱鸟系统以低功耗单片机为控制核心,利用音频加密技术,以语音芯片作为语音资料存储器,设计高保真、多模式语音播放实现良好的驱鸟效果。该系统低成本、易操作、驱鸟效果好等优点有利于在农业生产中推广,从而提高我国农业生产的科技水平。
1 系统方案设计
本系统主要从以下3个方面解决成本、适应性、鸟种差异性的问题:
1)采用低功耗、低成本51单片机作为控制核心,采用地址锁存器将16位地址总线扩展至20位地址总线,实现1MB的外部数据存储空间,可以存储8段语音数据,在语音输出过程中,并没有将其读入单片机内部,而是直接进行解密输出,降低了对单片机的要求,同时也保障了语音数据的安全,大大降低了系统成本;电源的设计也充分考虑到农田、果园等户外场所供电便捷性和安全性等因素,本系统为用户提供电源适配器和蓄电池两种供电方式,并增加了蓄电池保护电路,有效避免了蓄电池过度放电带来不必要的损失。
2)采用多模式播放方式抵抗鸟类对单一重复播放方式的适应性,可根据不同鸟类的生活习性设置“白天”“夜晚”“持续”3种工作方式;可以设置语音播放时间间隔,系统预设4种不同时间间隔,可根据实际情况来设置;可以设置语音片段的播放顺序,既可以针对一种鸟持续播放一种语音,也可以循环顺序播放多种语音,还可以随机无序播放;可以设置音量变化方式,既可以通过定位器来调节音量,也可以选择随机和渐变两种变化模式。由单片机自动调节音量的变化,以便有效克服鸟类对长时间固定音量播放的适应性。
3)采用语音芯片作为语音资料存储器,语音资料来源于对我国不同地区、不同季节的鸟害进行大量调研后采集的各种鸟类及其天敌的声音并经过处理和试验得到的有效驱鸟声音资料,针对不同地区和不同季节的不同鸟种,选择相应的语音芯片并及时更换。
2 系统硬件设计
2.1 系统硬件结构框图
系统硬件电路共有10个单元组成:电源、单片机微控制器、模式设定、实时时钟、光敏感应、音量调节、模式指示、语音存储、语音功放、语音播放。系统硬件结构框图如图1所示。
2.2 单片机微控制器[2]
本系统选用STC89C51RC系列单片机作为微控制器,该微控制器为增强型8051单片机,采用PQFP小型封装;内部集成4K的Flash程序存储器和512字节RAM以及2K的EEPROM;4个8位可编程并行I/O口(附加P4.0-P4.34个I/O端口); 8个中断源包括4个外部中断、3个定时器/计数器溢出中断和1个串行口的发送/接收中断,4个中断优先级;内置看门狗。该单片机成本低、性能好、防解密、功耗低(掉电模式:0.5μA,空闲模式:2mA)。单片机时钟引脚接12M晶振。
2.3 光敏感应
光敏感应[6]单元是根据检测光线的强弱来判断当前时间是白天还是夜晚,从而实现“白天/夜晚”两种工作模式,当设置为“白天”工作模式时,系统只在白天工作,夜间自动进入休眠待机状态;同理,当设置为“夜晚”工作模式时,系统只在夜间工作。电路主要由光敏电池、集成运放、与非门等器件组成。其电路图如图2所示。
当白天太阳光照射光电池,与光电池连接的运放输入端便产生一个电压信号,经放大后成为高电平信号,再经过与非门U1a转为低电平接到单片机外部中断0引脚,单片机作出相应的中断响应。
夜晚由于光线很暗,光电池产生电压极其微弱,此时U1b输出低电平到单片机外部中断1引脚,单片机作出相应的中断响应。
运放选用LM324;与非门选用74HC00,要求输入高电平最低2V,低电平最高0.8V。光电池在晴天阳光照射下产生电压在0.3~0.5V,需要通过定位器来调节放大倍数,使输出电压高于2V,达到与非门的输入要求;定位器起到调节光强检测灵敏度的作用,在阴天光线不足的情况下可以通过调节定位器提高光线感应灵敏度,或者将工作模式设置为“持续”,使系统在白天和晚上持续工作,不受光线影响。
2.4 语音存储
语音存储单元由存储芯片、锁存器和D/A转换芯片组成,原理图如图3所示。
语音存储芯片选用M27C801,该芯片存储容量为1M×8bit,需要20位地址线,8位数据线。为了节省单片机I/O端口资源,单片机的P0口分时提供所有20位地址总线,用两个8位地址锁存器74HC573管理地址信号,锁存使能端分别接到单片机不同的I/O端口,单片机通过控制片选实现分时发送20位地址线数据;存储芯片的片选接单片机的RD,低电平有效,数据输出使能端接单片机的P2.7端口,当P2.7端口电平负跳变时,存储器的数据输出端Q0~Q7读出语音信号;读出的数字语音信号经过D/A转换芯片AD557转换成模拟语音信号,以上便实现语音信号读出控制和数/模转换功能[7]。
经过D/A转换输出的模拟语音信号需要进行放大才能驱动扬声器,本系统功放芯片选用TDA1517,其固定功率放大增益为20db,并且具有静音/待机切换功能,可以由单片机的I/O端口配合开关器件控制语音功放输出。
2.5 音量调节
本系统在音量调节方面增加自动音量调节功能,利用带I2C总线功能的可编程数字定位器CAT5221,通过单片机程序控制电阻变化来控制功放输入信号电流的大小,实现音量自动调节,因此可以在程序中设置多种电阻变化的方式及幅度和快慢,从而实现相应的音量调节。
单片机可以利用两个I/O端口模拟I2C接口,I2C总线协议允许总线接入多个外围器件;数字定位器可以与实时时钟芯片共用数据线SDA和时钟线SCL,I2C总线的数据传输采用主从方式,即主器件(单片机控制器)寻址从器件(数字定位器和时钟芯片),启动数据传输,因此在数据传输过程中只需指定对应的器件地址即可[8]。
3 系统软件设计
系统软件主要分两部分:一是单片机控制程序;二是PC机环境下的声音加密程序。
3.1 单片机控制程序
单片机控制程序流程图如图4所示。
单片机控制程序的功能模块主要包括:定时模块、语音信号读取模块和播放控制模块。定时模块的功能是设定多个精确的播放时间间隔;语音信号读取模块的功能是按照播放要求准确地读取存储在语音芯片中的语音信号并进行解密;播放控制模块的功能是根据检测按键来设定不同的播放模式。
3.2 音频加密[3]
语音资料来源于对我国不同地区、不同季节的鸟害进行大量调研后采集的各种鸟类及其天敌的声音,为防止非法拷贝,不能直接存放在语音芯片中,需对其加密处理。
语音资料是以.wav为扩展名的波形音频文件,格式是资源交换文件格式(RIFF)。WAV文件格式是Windows中基本的声音格式,由于其文件格式固定,因此可以直接对其数据区进行加密和解密处理。WAV文件由两个子块构成:一个是“fmt”子块,用于存储波形格式信息;另一个是“data”子块,用于存储波形数据信息[4]。语音资料中的WAV文件采用PCM(脉冲编码调制)编码方式,其文件头为44字节,存放一些基本标志信息,从第45个字节开始就是“data”子块中的数据,存放的是声音数据[5]。单声道8位量化的PCM格式的WAV文件的声音数据存放形式如图5所示。
对WAV文件的声音数据采用具有良好随机性、难于破译的离散混沌系统序列加密方法进行加密,首先利用混沌系统产生混沌序列,再对混沌序列进行适当处理,然后利用处理后得到的序列与明文(声音数据序列)进行运算,得到密文,然后将加密后的WAV文件存放在语音芯片。用wav波形查看软件观察某声音片段加密前后的WAV文件声音波形如图6和图7所示。
从以上加密前后波形对比可以看出,经过加密后的声音波形与原语音信号的波形相差甚远,反映出良好的加密性。解密则是加密的逆过程,在单片机控制程序的播放子程序中,利用密钥产生混沌序列,与密文运算后回复出原始WAV文件的声音数据,将解密后的语音信号输出到语音功放单元,如此便实现了对语音资料的加密存储和解密播放。因为整个加密过程在本地PC机上完成,并且实现解密功能的单片机控制程序存储在具有良好防解密性能的MCU中,所以本系统充分保证了语音资料的安全。
4 结语与展望
本文提出了一种针对农田、果园鸟害的解决方案,从硬件和软件两个方面详细介绍了智能语音驱鸟系统的设计。该系统具有低功耗、抗干扰、抗适应性、声音加密、方便升级语音资料等特色,经多次农田、果园试验,驱鸟作用明显、持续,平均帮助用户挽回30%~70%的损失,有效作用面积为1~3hm2,适用于农田、果园、机场、工厂仓库、鱼虾池塘、办公楼宇等,可以驱赶喜鹊、乌鸦、八哥、鸽子、山雀等中国常见鸟类。
驱鸟技术的应用在农业生产、电力、机场等受鸟类危害的环境必不可少,本系统虽然达到了预期的驱鸟效果 ,但为了实现更高效、更智能化的驱鸟技术,需要进一步完善。下一步需要解决地问题主要有以下两个方面:
1)模拟鸟类飞行,研究鸟类飞行及捕食过程中的声音变化特点,通过同时控制多个扬声器,模拟鸟类飞行的动态声音变化效果,更好地抵抗鸟类对目前静态声音的适应性。
2)远程控制,通过客户端PC机、手机等常用通信设备或手持控制器与应用场合的驱鸟器之间的通信,实现远程控制驱鸟器的工作和升级语音资料等。
参考文献
[1]佚名.智能驱鸟器[EB/OL].2009-12-01.中国驱鸟网:http://www.packer.net.cn.
[2]宝利民,马宝山,王曰承,等.16位单片机在机场驱鸟器系统中的应用[J].大连海事大学学报,2006,32(3):79-80.
[3]王卫锋.混沌序列在多媒体信息加密中的应用研究[D].南京:东南大学,2002.
[4]张敬怀,马道钧.WAV语音文件格式的分析与处理[J].北京电子科技学院学报,2004,12(2):47-49.
[5]李敏.音频文件格式WAVE的转换[D].南京:东南大学无线电工程系,2005.
[6]张庆双,姜立华.农业电子技术应用电路集萃[M].北京:机械工业出版社,2005.
[7]姜志海,黄玉清,刘连鑫,等.单片机原理及应用[M].北京:电子工业出版社,2005.
嵌入式语音识别系统研究 篇9
1 系统硬件平台
系统硬件以S3C2410为核心,配以外围语音模块、通信模块、存储模块、电源模块等,如图1所示。
1.1 微处理器的选择
嵌入式语音识别系统通常以高性能的微处理器和DSP为双核来构成,也可以高性能的微处理器为单核来构成,应根据实际需要来选择,对于孤立词、小词汇量识别系统用单核就能胜任了。微处理器一般采用ARM9或ARM11,ARM11的性能要比ARM9强很多,当然价格也贵很多,应根据系统的性能要求来选择微处理器,一般的识别系统采用ARM9就能够完成 了。ARM9处理器的 类型很多 包括AR M926EJ-S、ARM946E-S、ARM966E-S、ARM968E-S、ARM996HS、ARM920T和ARM922T。Samsung公司S3C2410A处理器是一款低功耗,高性能的小型处理器,有助于嵌入式系统的成本控制。S3C2410A采用了ARM920T内核,0.18umCMOS工艺,内部集成了内存管理单元(MMU), 支持WinCE,EPOC 32和Linux等嵌入式操作系统,支持多种总线接口。1通道IIC总线可进行8位串行双向数据传输,标准模式下数据传输速度可达100kbit/s,最高可达到400kbit/s;1通道音频IIS总线接口,可基于DMA方式工作;兼容2通道SPI协议2.11版。时钟频率为200MHz,最高可达266MHz[2]。
1.2 外围电路
1.2.1 语音芯片
UDA1341TS是Philips公司生产的专用语音处理芯片,能对语音信号进行程控放大、内插滤波、DAC滤波、支持IIS音频接口,具有DSP处理能力, 因此,UDA1341TS是嵌入式语音识别系统的首选语音芯片。此外,Infineon公司生产的SDA80D51语音芯片也是不错的选择。
1.2.2 存储芯片
S3C2410微处理器内置的内存容量较小,要运行Linux或WinCE需要扩展内存,通常采用SDRAM芯片。SDRAM (Synchronous Dynamic Random Access Memory),即同步动态随机存储器。它是一种动态存储器,即信息是存放在MOS管的寄生电容上的,需要定时刷新。它的主要特点是成本低、容量大、速度快(存取时间小于10ns) 被广泛应用于嵌入式系统中。SDRAM芯片大多数是8位 /16位数据宽度,而ARM9是32位的,因此需要通过位扩展的方式将SDRAM芯片扩展成32位的。例如可将两片16位64MBytes的SDRAM芯片(HY57V561620)扩展为32位64MBytes的。系统运行时首先将启动代码从闪存复制到SDRAM中,此外系统运行时产生的临时数据、变量、堆栈也都存放在SDRAM中。
FLASH存储器(闪存)是嵌入式系统的另一种重要的内存芯片。Flash Memory和SDRAM不同, SDRAM是挥发性的存储器,即断电后上面的信息全部丢失,所以SDRAM存储器需要刷新电路不断刷新,以保持上面的数据,而flash memory是非挥发性存储器,即断电后信息仍然能保存(能保存10年以上)。目前闪存主要有两种类型,Nor Flash和Nand Flash,Nor Flash采用并行数据传输方式,因此存取数据速度快,Nand Flash采用串行数据传输方式,因此存取数据速度慢,但Nand Flash占用系统的端口少,为了节省系统资源,通常都采用Nand Flash来构成。嵌入式操作系统和识别算法代码都存放在FLASH存储系统中。
1.2.3 通信接口电路
S3C2410A支持RS-232串行接口,RS-232采用负逻辑,即高电平(+5V~+15V) 为逻辑0,低电平 (-5V~-15V)为逻辑1,而系统板是采用正逻辑,因此需要电平转换芯片,常用的电平转换芯片有MC1489、MAX232、MC1488等 ,MAXIM公司生产 的MAX232应用最广泛。
2 系统软件平台
常见的嵌入式操作系统主要有Windows CE、Vxworks、NetBSD、pSOS、Rtems、QNX、Linux等[3]。其中Linux最受嵌入式工程师的青睐,Linux的优点: (1)完全免费,开放源代码,这样设计人员可以通过网络免费获得,并可以通过简单的改造就能获得自己需要的操作系统;(2)支持多用户、多任务,各个用户可同时开发,互不影响,多个应用程序能同时并独立地运行;(3) 支持多种硬件平台,支持x86、ARM. ALPHA. SPARC,MIPS等硬件平台。
2.1 系统软件设计思路
在目标板上建立Linux系统,通常可分四步进行[4]:(1)确定系统的组件配置。(2)创建系统内核。 (3)创建根文件。(4)设置引导软件。嵌入式系统是资源受限的一个微型系统,存储空间通常都不大,因此一般都采用交叉编译的方式进行开发,即将Linux开发工具、引导程序、系统内核都安装在宿主机 (HOST)上,然后在目标板(TARGET)上运行。
2.2 系统引导文件 BootLoader
BootLoader的作用类似于PC机的BIOS,在Lin- ux内核运行之前先由BootLoader将系统的硬件设备初始化,建立内存空间映射表,将系统环境设置在一个合适的状态。BootLoader的启动过程分两个阶段, 第一阶段:进行宏定义,初始化一些常量、变量,设置中断向量表,初始化硬件、寄存器、堆栈;第二阶段: 调用初始化函数,加载系统内核,设置启动参数。常用的BootLoader引导文件有:U-boot、armboot、blob、vivi等[5]。
2.3 linux 向 ARM 处理器的移植
一个完整的嵌入式Linux系统主要由Linux内核和根文件系统组成。由于嵌入式系统的存储空间有限,因此需要将标准的Linux内核进行瘦身并重新配置,然后编译生成内核映文件。Linux的根文件系统可直接复制拷贝到NANDFLASH中。
3 识别算法
语音识别算法有:动态时间规整(DTW)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、人工神经网络(ANN)、支持向量机(SVM)等。嵌入式语音识别系统主要为孤立词或小词汇量的识别系统, 同时它是个资源受限的系统,因此,识别算法的选择在识别精度满足要求的前提下应尽可能简单。动态时间规整 (DTW)和隐马尔可夫模型(HMM)是嵌入式识别系统最常用的两种识别算法。
3.1 动态时间规整(DTW)
动态时间规整(DTW)将时间规整和距离测度结合起来的一种非线性规整技术, 它成功地解决了语音信号发音长短不一的模板匹配问题。它实质上是用线性方式来描述在时间上或空间上是非线性的两个序列之间的相似度的一种算法[6]。对于孤立词系统,DTW识别原理为:首先用部分语音信号进行模式匹配训练得到最佳匹配模板;然后将未知语音帧与全部参考模板进行相似度计算, 距离最小的参考模板即为识别的结果。
3.2 隐马尔可夫模型(HMM)
HMM是一个双内嵌的随机过程,一个描述状态的转移,另一个描述状态和观察值之间的统计关系[7]。而人类的言语过程也刚好是一种双重随机过程,因为语音是听得见的(可观察的),但它的产生是由人类的大脑根据思维状态(不可观察的)、及语言知识、语法规则决定的。因此,HMM模型非常适合对语音信号建模。HMM是基于统计概率的分离器模型,其特点是系统的扩展性好,即可任意增加新样本,只需对新样本进行训练,而不需要对所有的样本进行训练,因此适合小词汇量的嵌入式语音识别系统。HMM识别原理:首先语音信号经过分帧、加窗、端点检测等预处理;然后进行特征参数提取,特征参数有:线性预测倒谱系数 (LPCC) 、美尔频倒谱系数 (MFCC)等;最后用维特比(vietrbi)算法进行识别。
4 结束语
工资语音查询系统的研发 篇10
我公司工资管理早已实现信息化, 然工资仍然以传统的工资条方式发放和查询, 为方便公司员工查询工资, 提高查询效率, 我公司设计实施了“工资语音查询系统”。由于语音处理技术的日益成熟, 目前国内外生产语音卡的厂商众多, 价格便宜, 而且随卡发行有语音处理的各种库函数, 减少了二次开发的工作量, 降低了开发难度。只要购置一定数量的语音卡, 通过开发相应的应用的软件, 就可以自建一个自动或半自动语音查询系统, 既可以节约资金, 又提高了查询效率。
1 系统设计目标
1.1 工作方式
本系统采用自动方式, 电话打入后, 按语音提示输入查询条件后, 有电脑完成自动播报工作。
1.2 功能划分
(1) 号码查询:完成手机号、固定电话的查询, 即通过用户名可查询到所需号码。
(2) 工资查询:根据账户密码查询个人分月工资和年度工资汇总。
(3) 接口管理:系统与公司现有工资信息库实现对接。
(4) 资料管理:系统对资料库进行增加、删除和修改的功能。
(5) 语音服务:系统支持后期录音, 并对查询信息进行语音合成并播放。
1.3 技术要求
从技术上, 满足几个需求:
(1) 支持4个并发查询。
(2) 系统响应速度快, 查询操作方便、快捷。
(3) 支持内线电话和普通手机、固话查询。
2 总体设计
2.1 硬件结构
PC机一台 (操作系统windows2000, 数据库oracle) , 语音卡一块、电话分机一部, 能接入公司局域网。
(1) 座机电话通过电话线与电话交换机连接, 电话交换机通过国家电信网络与电话终端客户连接, 实现电话模拟信号的传输。
(2) PC机通过网络设备与服务器连接, 服务器中的数据信息通过网络传递给PC机, 数据接口自行开发。
(3) PC机与座机电话通过语音卡、语音服务软件实现查询功能。
(4) 语音卡负责通讯和语音输出, 语音服务软件实现排队、语音合成和播放功能。
2.2软件设计与实现
2.2.1 根据需求, 设计如下流程图
2.2.2 数据库及其结构
本系统数据库主要的数据表有2个:用户基本信息表和语音播放信息表。所有数据表全部放在公司现有服务器上, 查询时通过语音查询系统进行访问。
关键数据表的设计如下:
(1) 用户基本信息表。该表用来存放所有待查的用户电话资料, 主要字段定义下 (表1) , 即:“用户ID, 用户名, 部门名称, 电话号码, 其它联系号码, 家庭地址”。
(2) 语音播放信息表。该表用来存放临时数据信息, 即为语音服务软件提供通道信息、语音播放信息、链路状态信息等, 也是前台应用软件与后台语音服务软件联系的桥梁。该表随着系统进程的不断变化对相关字段自行修改。主要字段及定义如下 (表2) :
2.2.3 前台应用软件
前台应用软件为用户提供友好的图形化操作界面。主要功能是数据库信息管理。由于前台应用软件主要是对数据库的操作, 所以不存在特别的算法。对数据库的操作要进行权限限制和操作确认, 以增加其安全性。
2.2.4 后台语音服务软件
后台语音服务软件是整个系统的核心部分。其工作原理是:查询用户通过公用交换网拨打查询号码, 通过语音卡输入线路, 线路检测函数检测通道状态, 如通道空闲, 进入查询状态。当查询到正确的信息串后, 通过语音卡通道传播出去, 完成整个查询过程。
3 结论
该系统成本低, 实用性强, 员工可以随时随地拨打查询电话, 查询用户信息和工资信息。系统采用了发音标准的语音合成库, 音质接近自然。通过实际验证, 系统响应速度快, 运行可靠, 提高了查询效率, 受到广大职工的好评。
摘要:为方便公司员工查询工资, 提高查询效率, 我公司设计实施了“工资语音查询系统”。现对其进行简要论述。
语音门禁系统 篇11
关键词:语音云;移动;通讯录
中图分类号:TP311.52
随着工作节奏的加快和工作地点的经常变动,企业面临越来越多的管理效率问题,企业对能够突破时间和地域限制且经济便捷的应用系统提出了强烈的需求。
大型企业人员多,机构设置繁杂,系统中记录的人员信息量大,且修改不便。人员之间相互查询信息更加不方便,急需一套易于操作和维护的通讯录系统。然而,传统的纸质通讯录和在线通讯录在信息准确性和便携性上存在一定的局限性,迫切需要利用移动设备的特性,开发基于移动设备的通讯录系统,解决企业在移动互联网时代的管理需求。
1 传统企业通讯录应用功能的不足
传统的企业通讯录分为纸质打印通讯录和在线通讯录两种。纸质打印通讯录易于携带,使用也较为方便,但是更新频率较低,容易造成信息不准确,同时制作和分发成本也较高。在线通信录一般基于B/S架构,用户需要使用个人电脑通过浏览器进行访问,限制了员工在外出时随时随地访问。此外,如果用户需要记录查询到的联系人,只能手工将信息录入到手机中,也增加了用户操作的复杂度。
企业员工迫切需要一款既具备纸质通讯录的便携性,又具备在线通讯准确性的企业通讯录产品。
2 企业移动通讯录的功能设计
在移动互联网时代,移动设备的便携性突破了固定范围内、基于PC的应用服务,用户可以通过智能手机等移动设备直接访问企业内部信息系统。企业移动通讯录通过在移动设备上实时获取组织架构和人员信息,满足了随时随地查询人员信息的需求,提高了通讯录应用的便捷性和易用性。
企业移动通讯录应具备以下功能:
组织架构浏览功能。员工可以根据组织架构查找人员信息,按照公司、部门、处室的层级进行定位和检索。
语音和关键字搜索。用户可以借助移动设备丰富的人机交互方式,通过语音进行信息搜索。系统将用户录入的语音提交到语音云平台进行识别,并返回相应的人员列表供用户选择。
电话、短信和邮件集成。移动通讯录与终端设备系统功能无缝集成,用户可以在应用中直接点击查询到的电话号码拨打电话,点击邮件地址可以直接调出移动终端的邮件处理程序,同时可以直接向手机号码发送短信等。
个人信息维护功能。用户可以在移动终端直接修改个人信息,修改后的个人信息实时同步到企业内部应用系统中。
与手机操作系统和其它应用的集成。用户可以直接将查找到的人员信息保存在手机的系统通讯录中,同时可以通过短信,邮件以及微信等方式,分享联系人信息。
3 与企业内部信息系统的集成
3.1 企业现有应用系统
大型企业内部一般有多套业务应用系统,如语音云平台、ERP系统、员工自助服务系统、在线通讯录系统和AD用户认证系统等。
语音云平台可以提供语音识别和语音合成功能。语音识别室根据关键字列表,将语音转换成文字的过程。语音合成是将文字信息实时转化为语音并进行朗读的过程。
ERP系统中存储了完整的组织架构和岗位信息。ERP的用户主要是人力资源管理人员,一般用户无法登录ERP系统中查询员工信息,也不能修改个人信息。
员工自助服务系统是一般员工查询和修改个人信息的应用系统。然而,员工只能通过自助服务系统查询自己的个人信息,而无法进行组织架构查询和查看公司内其他员工的联系方式和岗位职责等信息。
在线通讯录系统存储了所有员工的电话、电子邮件等通讯信息,员工可以通过在线通讯录系统查询其他人的联系方式。然而由于在线通讯录系统不支持用户登录,因此员工只能进行信息查询,不能修改信息。在线通讯录由系统管理员手工进行维护,如果员工更换了手机号码等信息而没有及时通知系统管理员进行更新,在线通讯录中就会发生信息不准确的情况。
AD用户认证系统存储了员工个人账号和密码,为企业内部各个业务应用系统提供用户认证和登录服务。
以上这些应用系统分别提供了组织架构、员工资料和基础服务等信息和功能。如果能够有效的利用这些应用系统中的现有数据和服务,就可以在较短的时间内开发出一套完整的企业移动通讯录系统。
3.2 与现有应用系统的集成
通过中间件平台将企业移动通讯录系统与现有应用系统进行集成,使用Web Service方式提供数据和系统服务,可以实现这些应用系统的协同运作。
与语音云平台的集成。企业移动通讯录可以使用语音云平台的语音识别功能,将用户的语音转换成组织名称和员工姓名等文本进行关键字匹配,实现通过语音进行人员搜索的功能。
与AD用户认证系统集成。企业移动通讯录只面向企业内部员工提供人员信息的查询服务。为了保证人员信息的安全保密,需要确保只有内部人员才能登录和访问该系统。因此,需要使用AD用户认证系统提供用户登录服务验证用户身份。
与ERP系统集成。大型企业会进行不定期组织架构调整,员工也会经常发生进行岗位调整和工作调动,这些更新的信息需要实时反映到企业移动通讯录系统中。企业移动通讯录系统需要定期与ERP系统进行数据同步,从ERP系统中获取更新的组织架构和人员岗位信息。
与员工自助服务系统进行集成。员工自助服务系统和企业移动通讯录系统都是面向员工的信息录入平台。通过将企业移动通讯录系统与员工自助服务系统进行集成,用户在移动设备上更新的个人信息可以实时同步到员工自助服务系统中。同时,员工在自助服务平台更新电话、邮箱和个人工作职责等信息也需要实时同步到企业移动通讯录系统中。
与原有在线通讯录系统进行集成。在线通讯录系统作为桌面端的信息查询系统,可以作为企业移动通讯录系统的补充,为没有智能手机的用户提供信息查询服务。在线通讯录系统定期从企业移动通讯录系统中导入信息,可以提高信息的及时性和准确性。
4 结论
本文首先分析了传统的纸质通讯录和在线通讯录在信息准确性和便携性上的问题和不足。然后,提出了基于移动设备的企业移动通讯录的优势和功能设计。最后,说明了企业内现有应用系统与移动通讯录系统的互补关系,以及系统间的数据集成和功能协作的方法。
参考文献:
[1]韩秀红,张全英.基于企业单位通讯录系统设计与实现[J].硅谷,2012,17.
语音门禁系统 篇12
康特针对未来网络发展的特点, 成功设计了VoIP系统, 使运营商在开展数据业务的同时, 可充分利用EPON+EoC高速数据通道, 开展互联网电话业务。图1为应用该产品搭建的三网融合语音业务系统结构图。
VoIP语音产品的构成部分:
●内置VoIP语音模块的EoC终端
该产品可提供3个以太网口及1个RJ11语音接口, 用户可将普通电话机连接至该语音接口实现通话功能, 连接如图2所示。
●外置式VoIP语音单元
该产品可以配合EoC终端等数据终端, 使普通电话机通过数据网络实现通话功能, 如图3所示。
●语音交换系统
单台语音交换设备可支持100~2 000线语音电话互通, 可通逐步增加设备的方式进行扩容。
●综合业务管理系统
支持网络设备管理和话单计费、查询等功能, 并支持多业务扩展和标准接口对接等业务服务。
●语音网关产品 (公共交换电话网络网关)
单台设备支持1~8个E1/T1接口, 支持SIP和H.323协议, 支持PRI, 可升级到7号信令。
地址:成都市武侯科技园武科东三路9号
邮编:610045
电话:028-85362299, 85361199
E-mail:ktcatv@ktcatv.com