歌剧院的声环境设计(通用4篇)
歌剧院的声环境设计 篇1
0 引言
声纹识别技术[1]为生物识别技术的一种,也称为说话人识别,分为说话人辨认和说话人确认[2]。目前,市场上已经出现了一些声纹识别的应用,比如在军事情报方面,用于电话领域的监听与追踪;在监狱管理中,用于亲情通话对象的管控;在司法取证方面,语音声纹分析识别用于司法鉴定,还有社保身份认证、电话语音声纹考勤甚至现在非常流行的声纹锁屏[3]等等。
每个人的说话声音由于音色的不同可以被区分开来,本文所涉及到的声纹识别系统软件的设计[4]便是提取了声纹中的特征参数,把它作为本系统声纹识别技术的依据。与此同时,声纹识别分为文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种[4]。本识别系统为与文本相关[5]的声纹识别系统,要求用户按照规定的内容发音,建立好说话人的声纹模型,在后期进行语音识别时需要按规定的内容发音进而进行说话人身份的辨别。
1 声纹识别系统设计
本系统整体流程分为设计分为5步:预处理、提取特征参数(基音周期、倒谱系数等)、建立参考模型、带入测试模型、进行匹配。
(1)预处理:包括采样和量化(即A/D转换)、预加重处理、加窗、依据短时能量谱的语音端点检测等几个处理过程。
(2)提取特征参数:为了能够表征说话人语音中说话人特定器官结构或习惯行为,便需要提取特征参数,并且该特征参数对同一说话人应具有相对稳定性。
①基音周期[6]:产生发音时声门的开启和闭合引起声带的周期性振动,形成周期性的脉冲串,用来描述这一串脉冲气流的周期称为基音周期。这种参数的提取主要是基于说话人发声器官,如声门、声道和鼻腔等的特殊结构而提取出说话人语音的短时谱特征(即基音频率谱及其轮廓)。
本系统利用自相关函数法(ACF)检测基音周期,由于周期信号的自相关函数将在时延等于函数周期的点产生一极大值,因此通过计算自相关函数可以估计语音信号的基音频率,以此方法获得基音周期(基音频率的倒数就是基音周期)。自相关函数的数学计算公式为:
②倒谱系数[7]:目前主流的声纹特征参数有LPC以及基于Mel频率的倒谱系数(Mel—frequency cepstral coefficients,MFCC)。实验中证明,MFCC是目前声纹特征中识别率最高的一种,本系统便是提取Me频率倒谱系数MFCC用来模拟人耳听觉系统的感知能力,描述语音信号在频率域上的能量分布。Mel倒谱系数MFCC的提取过程如下:
A.对语音信号进行预处理。
B.离散傅里叶变换(DFT):是信号完成从时域至频域的转换。
C.生成Mel滤波器组。
D.计算经Mel滤波器组加权后的能量值。
E.做离散余弦DCT变换。
(3)建立参考模型:常见的识别模型有模板模型(动态时间规整方法DTW、矢量量化方法VQ)、概率模型(隐马尔科夫模型HMM、高斯混合模型GMM),以及目前正在发展中的人工神经网络(ANN)方法。本实验采用的隐马尔科夫模型HMM[8],并将该模型确定为本系统的模式匹配方法。使用HMM模型可以用短时模型描述平稳段的信号,而且还可以解决每个短时平稳段是如何转变到下一个短时平稳段的问题。
本过程目的是对所提取出来的说话人语音特征进行学习训练,建立声纹模板或语音模型库,或对系统中已有的声纹模板或语音模型库进行适应性修改。
(4)带入测试模型:将用于测试的语音样本参数代入,得测试模型,与参考模型一一匹配。
(5)进行匹配:在识别过程中,声纹识别系统要根据系统已有的声纹模板或语音模型库对输入语音的特征参数进行模式匹配计算,从而实现识别判断,得出识别结果。
2 实验与结果
在声纹识别系统的测试实验中,从所在班级随机抽取了15名学生(其中男生10名、女士5名),每人6个样本,共计90个语音样本,男性说话人有Yjd,Zsl,Mj,Zqy,Gcx,Mgj,Mz,Mjp,Srf,Jd,女性说话人有Hj,Whj,Gxx,Yhr,Zm。在使用该语音库的前提下,要求他们对指定文本“温州医科大学”应用普通话进行自然发音,录制环境为室内。并把每一个说话人的6份样本中3份样本用于训练,3份样本用于测试,建立不同的HMM模型,观察不同训练的样本数对识别结果的影响。
实验表明,运用MATLAB建立的HMM模型确实可以进行说话人身份的识别,本系统的识别率为85%以上,但如果增加训练次数,则识别率也会相应地得到提高。在系统实时处理上,由于MFCC参数计算量比较大,所花费的计算时间较长,使得本系统的实时性受到了考验,另外由于MFCC参数的计算涉及到DFT计算、对数计算,这使得整个计算的动态范围受到了影响以至于影响本系统的精确度。
3 声纹识别技术的研究进展
声纹识别技术仍需要在研究方法和市场应用进行相应的改进,一方面,要寻找更为优良的研究方法,另一方面,由于建模方法的选择与使用都会对声纹识别结果带来很大的影响,这要求我们能够寻找到一种更为稳定的声纹特征参数来帮助说话人身份的识别,一方面,要保证乃至提高系统的精确性,另一方面,也要保证独一性,能够区分不同说话人的特质。随着声纹技术的不断发展,所对应的声纹市场也日趋成熟,必定会与当今的信息化时代相契合,提供一种切实有效的安全保障。
参考文献
[1]http://baike.baidu.com/view/116450.htm[OL].
[2]Joseph P.Campbell,Jr.Speaker recognition:a tutorial[J].Proceedings of the IEEE,1997,85:1437-1462.
[3]http://www.dragonvoice.cn/[OL].
[4]陈怀琛.数字信号处理教程:MATLAB释义与实现[M].2版.北京:电子工业出版社,2008.
[5]Chi-Wei Che,Qi-guang Lin,Dong-SukYuk.An HMM Approach to Text-Prompted Speaker Verification[C]//The1996IEEE International Conference on Acoustics,Speech and Signal.Processing Conference Proceedings,1996,2:673-676.
[6]蔡莲红,黄德智,蔡锐.现代语音技术基础与应用[M].北京:清华大学出版社,2003.
[7]张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报,2005,22(2):5.
[8]王书沼.基于高斯混合模型的说话人识别系统的研究[D].大连理工大学,2006.
歌剧院的声环境设计 篇2
《走进中国歌剧》教学设计
[教学目标]
1、欣赏中国歌剧的经典唱段,了解具有代表性的中华民族歌剧及其经典唱段,从而培养学生民族精神和爱国主义情怀。
2、在听辩赏析、角色表演、演唱体验等过程中,增强对歌剧中音乐塑造的人物形象的分析力和判断力以及表现能力。
3、了解音乐要素在塑造音乐人物形象时的主要表现形式,了解歌剧的定义、特点及相关知识。
[教学重点]
通过对中国歌剧经典选段的欣赏,感受判断歌剧中的几个重要人物形象;分析歌剧音乐的特点,了解音乐要素在塑造人物形象的主要表现形式。
[教学难点]
感受音乐塑造的人物形象,结合故事发生的背景引发学生的深层思考。
[教学过程]
一、对比欣赏,激发学生兴趣。
1、欣赏歌唱演员张也演唱的中国歌剧《洪湖赤卫队》选段《红湖水,浪打浪》。
2、欣赏歌剧选段《红湖水,浪打浪》。
提问:
1、你听到的歌曲选自中国的哪部歌剧?
2、歌唱演员和歌剧演员在扮相上有何不同?
二、听赏体验,自主探究学习。
1、欣赏中国歌剧《党的女儿》选段《万里春色满家园》。
(1)交流课外收集的有关中国歌剧《党的女儿》的知识。
(2)作品介绍
(3)欣赏并思考,这段音乐给你怎样的感觉?唱段从内容来分,可分为几个部分?音乐的情绪有何变化(从速度上感受)?歌曲表达了何种思想感情?
(4)学生通过小组探究对各个段落的旋律、力度、速度、音色及表达的情感进行小结。
2、分别欣赏中国歌剧选段
(1)欣赏并思考:三个唱段分别用了哪些演唱形式?表达了剧中人物怎样的情感?
(2)学生通过小组探究对几首歌曲的演唱形式及思想情感进行小结:
3、探索结论:
思考:什么是歌剧?歌剧通常有哪些演唱形式?
三、学唱歌剧,实践角色表演。
1、听赏《洪湖赤卫队》选段《这一仗打得最漂亮》。
2、学唱歌曲。
3、分析角色。
4、分角色进行表演。
四、拓展延伸,弘扬民族文化。
1、教师范唱中国歌剧的优美唱段《看天下劳苦人民都解放》。
2、学生交流课外收集的有关中国歌剧知识。
3、要求学生课外学唱1-2个中国歌剧选段。
歌剧院的声环境设计 篇3
1 声学方面的设计
语言清晰度是节目录制过程中的重要指标,声学设计的好坏将直接影响电视节目声音质量。声学设计主要包括噪声控制和音频系统设被选用两方面。
演播室的位置,应处于相对安静的环境中,所以选择了在办公楼最里端建设演播室。为避免噪声对节目录制的干扰,墙面采用吸声浮箱体结构布局,控制室采用隔断砖混结构,并采用木质防火隔音门。音响系统选用独立专线供电,尽量避免电源对音响系统的干扰,演播室的供电系统采用了三相六线制,加用专门的信号接地,将所有音响设备通过心型的形式进行接地,采用具有输出接口、平衡输入的系统设备,有效减少了前后级的设备由于地阻抗与电平差异而发生的自耦干扰。此外,还在室内装设多频点的手机信号屏蔽设备,以保证节目在录制的过程中,不受到外界无线信号的干扰,保证演播室内无驻波、无啸叫、无干扰,从而确保节目录制中获得较好的音质效果。
在音频系统设备选择方面,我台选择一些设备技术先进、性价比高、安全可靠且便于维护的设备。
音频系统的核心设备就是调音台,它是将音源信号进行放大、均衡、定位、混合、监听、分配的综合性电子设备。我台选用了性价比较高的soundcraft声艺EPM8调音台,8路单声道与2组立体声输入,频率响应为(20Hz~20KHz)+1dB/-3dB,单声道输入最大电平为+30dBu。EPM8调音台操作简便,信号流通顺畅,音质优良,操作界面简单明了,非常适合县级电视台演播室使用。以EPM8为中心,把各种声源设备、输出设备和信号处理设备连接起来,完成录音工作。选用合适的周边设备,可以对声音进行更准确的调整,弥补一些原始声音的不足。话筒是拾音最重要、最基本的设备,我台选用AREDA专业播音话筒MK6,该话筒音质优异,清晰度高,不容易引起声音反馈。根据动态需要还配置一些UHF频段无线话筒,包括无线手持话筒、无线领夹话筒,无线话筒采用分级接收,频率调整简单,具备增益调整,咝声切除、压缩控制、直通选择等功能,使用起来非常方便。根据录制节目的不同需要,我们还配置了DVD、CD、数字录音机、笔记本电脑等音源设备。除了上述设备外,监听系统也是非常重要的,选择优质的监听音箱以使录音师更加准确的监听声音,我们选择音质较好的音箱进行录制监听。
作为电视节目制作场所中的一个重要组成部分,音频系统设计的好坏将直接影响节目质量的优劣。声音从话筒到调音台直至输出通道,每一个环节都要安全可靠,才能使播出效果达到最佳。
2 光学设计方案
演播室是利用声光进行艺术创作的地方,光学设计的好坏直接影响彩色画面的色调、层次以及主持人的荧幕形象。灯光师在布光时,要悉心调整灯具的角度,也就是调整光的方向,随着角度的变化,被摄人物的外貌逐步地出现细微的变化。不同的节目,灯光造型的处理也不一样。
我台的灯具采用轨道安装的方式,通过调光台的控制,灯具可以自由移动,调光台我台选用HDL-10032调光台,该调光台性能稳定、功能齐全,操作灯光系统界面直观、操作简单方便。下面就以我台新闻栏目布光为例,谈一下灯位的确定。
新闻主播区一般为2名主持人同时播音,主持人位于摄像机与背景之间,离摄像机3.5m,离背景2.5m左右,此区域布光方案考虑到需同时照亮两名主播和相关背景,所以我们从面光、背景光、逆光、顶光、背景光逐一进行布置。
面光布置:面光也称为主光,它能使主持人面部光照均匀、细腻,起着主要造型和确定光影格调的作用,将主光灯设计在主持人左前方呈弧型排列,且略向下照射,最佳位置为正面水平方向30~60°,垂直方向上30~45°以内,距地面高2m,距主持人面部2.5m左右。主光采用3组灯箱,每组灯箱装配6只36W三基色柔光灯。
背景光布置:背景光能打亮整个背景,突出背景层次和立体感,让画面看起来更加清晰,背景光也是选用三基色柔光灯,采用两组,每组装配4只柔光灯。背景灯与背景平行,灯光略向下照射,距地面高2.5m,距背景1.5m左右。
逆光布置:逆光也叫轮廓光,它能让主持人轮廓明显、突出,提高人物图像整体画面的效果,采用55W柔光灯6只,位于主持人背后两侧对称布置,距地面2.5m左右,距主持人2m左右。
顶光布置,顶光的作用是使主持人头发质感增加及补充肩部的光源,一般使用4只36W三基色灯,高度距地面2.5m左右;
地脚光布置:地脚光主要用于消除主持人下部,如嘴巴下部、鼻下部位、眼窝等处的阴影来完成造型任务。我台采用1组4只柔光灯,位于摄像机右侧10°左右,离地面高1m,离主持人2m左右,并略向上照射。
灯光调整过程中、调光师应通过摄像机、监视器边看效果边调整,使灯位、照度、光比达到最佳位置和效果。
3结语
歌剧院的声环境设计 篇4
关键词:TMS320C6711D-167,多DSP,目标定向,目标识别
声探测技术用声传感器阵列接收各种军事目标运动所产生的特征声信号,运用阵列信号处理、信号识别、信息融合等技术,确定目标的位置、航迹、类型。声探测技术具有被动探测、不受电磁干扰、能够全天候工作、成本较低等突出优点,特别是在夜间、雾天及能见度不良、通视度较差的情况或者复杂电磁环境下,是战场信息感知不可缺少的重要手段之一。
并行DSP处理的目的是采用多个处理单元(DSP)同时对任务处理以减少任务的执行时间。多DSP并行处理系统设计的核心是实现多DSP之间的统筹协调、任务分配、数据交换、信号处理及通信控制。
因此,应用高性能DSP作为数据实时处理单元,借助多DSP并行处理技术实现实时性强、精度高、动态范围大和高数据吞吐量的大规模并行处理系统,既打破了单处理器性能提升空间的限制,又大大增强了系统的兼容性和在线升级能力,为声探测系统的研制提供了强大的技术支持。
TMS320C67x是TI公司C6000上具有最高性能的浮点DSP,具有第二代的超长指令字(VLIW)结构。本文基于国内外日益发展的声探测技术研究成果和先进成熟的电子技术,提出一种以多片TMS320C6711D DSP为信号处理单元,用FPGA实现各DSP的EMIF接口总线互联,从而构成松耦合级、可再编程的多DSP并行处理模式,实现了一种具有高实时性、良好的扩展性和容量可变等特点的多DSP声探测系统。
1 系统设计
系统由前端声传感器基阵和声探测系统两大部分构成。
声传感器基阵是由若干个传声器组成的阵列,利用传声器阵列接收目标辐射噪声(如直升机飞行时旋翼扰动空气引起的噪声和发动机自身辐射的噪声信号)。
声探测系统由模拟电路、数字电路和控制电路组成。模拟电路完成对传声器阵列送来的微弱信号的放大、调理、均衡,并将预处理后的信号送至后端电路处理。数字电路实现对目标声信号的采集、定向算法、识别算法、增益控制、电路逻辑控制以及外部接口功能。控制电路由电源管理和人机界面组成。图1为系统构成图。
2 硬件设计
2.1 模拟电路
根据声目标信号的特征及探测对信号拾取和处理的要求,传声器及相应各通道间应具有较好的低频响应特性,而且相位一致性必须很好。
为保证各个模拟信号通道的电路一致性,特别是放大滤波电路部分,在设计中采用了厚膜电路技术实现。通过对放大滤波电路的深入分析,确定影响电路相位的各种因素和关键的阻容元件的允许误差范围,将其应用到厚膜电路的设计中,并筛选阻容器件,以控制系统的稳定性。
最终通过对前端模拟电路的二次集成方法来确保产品的一致性,更好地保证传声器相位一致性,提高探测精度。模拟电路功能组成如图2所示。
2.2 数字电路
数字信号处理采用基于FPGA的多DSP并行处理模式,增强处理能力和实时性。FPGA实现类似AD DSP的LINK PORT功能,形成了分布式松耦合系统;完成数字电路的逻辑控制功能、外部通信接口协议(RS232、FSK、并行通信等)、DSP之间的波形数据采集存储、交换以及相互间的通信。
用于实现高速数字信号处理的DSP,一片作为主DSP,实现信号的预处理、增益控制、外界通信、数据关联等工作;另一片作为目标识别DSP,完成已定向目标的类型识别功能。其余5片,完成主DSP分配的目标频点的信号处理及定向。每片DSP具有独立的程序、数据空间。数字电路设计模块图如图3所示。
2.3 控制电路
控制电路主要实现电源管理、人机界面功能。
电源管理主要完成对模拟和数字电路的电源分配、滤波处理以及控制。
人机界面完成对目标的重要信息的显示(目标方位、目标类型、批次)、参数的设置(编号、传输方式、测试)及检测功能。
控制电路以C8051F020单片机为核心器件。其功能框图如图4所示。
3 软件设计
声探测系统软件完成对数字化声信号采集、模拟电路放大电路的增益动态实时调整、系统参数的初始化配置,核心是实现声目标信号的高速实时处理后的定向、识别功能。软件分为两大部分,即目标定向软件和目标识别软件。软件构成如图5所示。
3.1 目标定向软件设计
诸如直升机、坦克等目标,其辐射噪声是一种宽带信号,能量主要集中在500 Hz以下的低频段。由于其在结构上具有周期转动机制(螺旋桨、发动机等),声信号的功率谱具有鲜明特征:主要是由离散谱叠加在连续谱上组成的,存在稳定的基频和较强的线谱,且线谱间具有明显的谐波关系。
目标定向软件完成了对单个或多个声目标的远距离声学被动定向。软件利用目标的宽谱和多谐波特性,采用了多频段、多频点模式的窄带子空间类高分辨阵列信号处理方法,并结合时域累积置信度方法和数据处理后的关联和跟踪滤波,较好地实现了对相互靠近的多个声目标的有效跟踪。
目标定向软件由1个主DSP和5个从DSP完成。主从DSP之间通过FPGA构建数据交换通道,完成并行处理。
3.1.1 主DSP软件设计
主DSP实现了目标频点检测和定向跟踪。目标频点检测是在目标信号的宽谱和多谐波特征基础上的目标频点提取。在频点检测中,设计了合适的检验统计量与准则,并且通过大量外场实验验证,获得了理想的恒虚警似然比门限。
定向跟踪完成了对目标频点的管理,实现了对各个从DSP的频点目标定向结果的关联与融合处理及伪目标的消除,同时采用角度和角速度的二维信息跟踪方法,实现对复杂噪声条件下目标的稳定跟踪。
主DSP软件流程如图6所示。
3.1.2 从DSP软件设计
从DSP的目标定向特征是根据获取的频点信息,针对性地对目标信号在指定频点上进行检测,采用MUSIC方法逐个解算各频率对应的定向结果。将各谐波信号与对应的定向结果以及频率能量信息建立文件记录,并传送给主DSP进行综合处理,获得目标定向结果。目标定向软件的软件流程如图7所示。
3.2 目标识别软件设计
目标识别软件是采用数学和智能方法对各种传感器信号进行统计、分析、学习和融合,提取和选择目标特征,与目标样本库进行比较和匹配,确定复杂环境下的目标类型。软件采用了包括特征参数提取及其筛选、分类器训练和识别等方法。
波束形成是一种空域滤波器,能无失真地接收感兴趣方位或区域内的目标噪声信号,同时抑制其他方位获取区域内的干扰及噪声,能显著提高目标信号的信噪比,改善探测方向的灵敏度。考虑到本设计针对的目标噪声特性和后续处理要求,波束形成器设计为宽带的,频带范围覆盖3~5个倍频程,在全空间形成多个相互叠加的固定波束,通过目标方位估计结果选择对应波束输出进行直升机特征参数提取。
针对系统对实时性要求较高且硬件资源优化的要求,功率谱估计采用改进的平均周期图法估算其功率谱,获得目标辐射噪声大类区分。功率谱估计方法包括参数法和非参数法。
目标特征提取是通过对各种诸如直升机、坦克等声目标信号的多次分析,从时、频二维抽取典型特征量,如幅度、周期等,作为对信号判断与识别的依据,结合各种参数的数学统计特征和模式可分性进行反复的算法仿真,优选出一些最有效、最有代表性的特征参数。主要方法有时频分析、小波变换、短时傅立叶变换等。
人工神经网络分类算法由输入层节点、输出层节点、隐层节点组成。对于输入信号,要先向前传播到隐节点,经过作用函数后,再把隐节点的输出信息传播到输出节点,最后给出输出结果。算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各层神经元的权值,使得误差信号最小。与传统计算机技术相比,人工神经网络计算机具有处理速度快、容错性好、抗干扰性好、自组织性好(能自动找出规律)等优点。
谐波集检测方法的特征是:对提取的所有线谱频率向量,逐个选择目标主频范围内的频率及其谐波集合,寻找能量最强的一组作为主谐波集合。在剩余的频率向量和谐波向量中,对照目标类型模板,寻找能量最强的一组为次谐波集合,最终实现声目标的主次谐波集检测。目标识别软件流程如图8所示。
4 系统验证
声探测系统设计完成后,经过大量的试验测试可知,各类指标满足要求,具有较强的实用性。
声探测系统利用多DSP并行处理方式,解决大容量数据的实时处理和目标辐射噪声的宽带处理问题。利用一种创新的方法,综合运用多手段、多技术和宽带处理方法,实现了对低空和超低空声目标的微弱辐射噪声信号提取、远距离预警探测和目标识别。
参考文献
[1]TMS320C6711D floating-point digital signal processor(Rev.B) [M].USA:T I,2006.
[2]Virtex-Ⅱplatform FPGAs:complete data sheet(v3.5)[M]. USA:Xilinx,2007.
[3]张贤达.现代信号处理(第二版)[M].北京:清华大学出版社,2002.