音频电子产品

2024-09-23

音频电子产品（精选11篇）

音频电子产品篇1

不同含义的效率

D类音频放大器最具吸引力的特性是高效率。音频放大器的效率有多种含义不同的效率, 传统定义是输出电功率与总输入功率之比。对于音频放大器, 转换为可听声音的电功率与总输入功率之比需要最大, 这引出了另一个含义的效率。请注意这两个效率定义之间的差别:

A.总电气效率=输出功率/输入功率;

B.可听声音电气效率=可听声音电气输出功率/输入功率。

音频电气效率总是低于总电气效率, D类音频放大器尤其如此。

下面是一些提高可听声音电气效率的常用方法:

一、不要使用低于扬声器响应频率范围的信号来驱动扬声器。例如, 大多数手机使用的小尺寸扬声器不能有效地响应低于400Hz的信号, 而音频信号源可能输出低至30Hz的频率分量。用低于该频率的信号驱动这些扬声器, 不仅会浪费电能和降低可听声音电气效率, 而且还会因为将扬声器驱动到线性位移范围之外而增大扬声器非线性产生的失真。由于大多数音频信号源发出的最低信号频率低于400Hz, 因此需在音频放大器前面放置高通滤波器。可利用输入耦合电容和放大器的固定输入阻抗简单地形成高通滤波器来加以实现。该滤波器的截止频率可设置为扬声器低端截止频率的几分之一。

二、不要使用高于扬声器高端截止频率的信号来驱动扬声器。对于手机中使用的典型小尺寸扬声器, 这个频率在4KHz到10KHz之间, 而有些音频信号源的信号最高频率可高达20kHz。以高于这个频率的信号驱动这些扬声器不仅会浪费电能和降低可听声音电气效率, 而且也使音频信号的波峰因数 (峰值/RMS值) 很高, 增大了输出信号被输出级截断以致增加失真的可能性。为了防止信号源的高端信号频率高于扬声器的高端截止频率, 可在信号源和音频放大器输入之间插入低通滤波器, 它可以是简单的RC滤波器。将低通滤波器放在输出级之后效果不好, 由于信号的波峰因数高, 信号可能在到达低通滤波器之前已被输出级截断。

三、尽量减小扬声器中的开关频率电流。依赖于D类放大器使用的调制方案, 扬声器两端的差分电压在开关频率下变化幅度很大。应选择具有“无滤波”调制方案且开关频率足够高的放大器, 否则, 需在放大器输出端用外部电感滤掉开关频率分量。8Ω手机扬声器的典型固有电感在10μH到15μH之间, 当开关频率为1MHz时, 15μH电感与8Ω直流电阻的总阻抗为94.6Ω。SSM2301/2302/2304/2306系列产品使用Σ-Δ脉冲密度调制 (PDM) , 开关频率为1.8MHz。这种调制方案在扬声器两端产生的开关频率电压较低, 而高开关频率使扬声器能利用固有电感有效地阻断开关信号, 因而这些器件无需使用外部电感就可把扬声器中的开关频率电流保持在低水平。

将电磁干扰降至最低

D类音频放大器的工作原理决定它需要使用开关型输出级, 而这种输出级会发射出很强的电磁干扰。参见图1中的原理图, 插入电感或铁氧体磁珠和使用电容进行旁路的措施可把电磁干扰降到低于一定水平进而通过标准的EMI测试。下面是选择电感和铁氧体磁珠的一些基本准则:

一、使用额定电流高和开放式磁回路磁芯电感, 以避免电感器饱和非线性所产生的失真。屏蔽型电感的饱和曲线常常很“硬”。

与相同额定电流的电感相比, 铁氧体磁珠尺寸较小但造成的失真较大。

二、调制方案对输出电磁干扰会产生重大影响。A D I公司的SSM2301/2302/2304所使用的Σ-Δ脉冲密度调制可使电磁干扰均匀地散播出去, 更易于通过EMI测试。

PCB (印制电路板) 布局对降低电磁干扰有非常重要的作用。一个关键措施是让电源和输出去耦电容器彼此靠近, 这样就可以将它们的地线端子直接焊在一起, 参见图2给出的PCB布局, 它是基于图1的原理图实现的。

另外请注意, 所有连接到扬声器端子的PCB走线始于去耦电容焊盘而不是铁氧体磁珠焊盘, 否则, 电磁干扰无法降到最低限度。对于Vdd轨, 我们对C6使用了同样的技术。放大器的引脚5和8节点发射的电磁干扰最大, 这些节点的物理连接尺寸应尽可能地小, 同时不要在这些节点上布局长的PCB走线。

尽量减少失真和噪声

下面是一些实现低失真的技术:

1、对于要求失真极低的系统, 如T H D+N (总谐波失真+噪声) ←65dB, 应在输出端加电感而不是加铁氧体磁珠, 因为后者具有较高的非线性。

2、采用额定电压为25V到50V甚至更高、使用X7R材料制造的高压多层陶瓷电容器作为输入耦合电容 (图1中的C1和C2) 。同额定电压高的电容器相比, 低压电容器的电容值随偏置电压变化的幅度更大。

3、将负的输入节点连接到信号源 (如音频数模转换器或编码解码器) 的地线, 而不要简单地把它连接到自己的接地点上。这种连接方式可最大限度地降低共模噪声。

4、避免将音频信号源器件放在远离放大器的地方, 避免对输入节点使用长PCB走线。如果迫不得已, 将输入节点线对平行布线:一条走线放在板的正面, 另一条放在反面。这种方式可最大限度地降低回路所接收到的电磁干扰。

5、避免将高频 (>1MHz) 电磁干扰引入到输入端口, 否则, 整流效应可能把高频电磁干扰转换成可听噪声。图3显示了这种整流效应。

其它需关注的问题

消除喀哒声和噼啪声:在开机或关机时, 关断引脚的切换可使放大器启动或停止, 如果放大器IC的设计不合适, 扬声器在此时会发出某种“喀哒”声或“劈啪”声。前者由窄脉冲产生, 而后者由缓慢衰减的阶跃函数产生。通常, D类音频放大器IC (如SSM2301/2302/2304/2306) 具备消除“喀哒”声和“噼啪”声的功能。在产品投入量产之前应全面测试这些功能。

如果放大器一直与电池相连, 关断电流可能是另一个需要关注的问题。在选择放大器IC时, 注意留意这个参数。

PSRR (电源抑制比) :对于手机应用, 这个指标特别重要, 但它常常通过IC设计来实现, 在系统层面做不了什么。

收听效果

音频系统设计的最终目标获得良好的收听效果, 它对系统设计是否成功拥有最终决定权。实现这一目标需要声学设计和电子设计的完美结合。在不久的将来, 便携式电子音频放大器可能会结合一些可均衡频率响应、降低失真和优化收听效果的智能或自动化方法。

摘要：大多数便携式电子产品需要使用失真低、效率高、体积小、成本低的高性能音频放大器, 只有设计优良的D类音频放大器才能同时满足所有这些需求。本文将探讨如何解决在为便携式电子产品设计D类音频放大器时经常遇到的一些问题, 包括效率、电磁干扰 (EMI) 、失真和噪声等。

关键词：D类放大器,便携式,音频,扬声器,无滤波

参考文献

[1]王莹.音频放大器发展趋势[J].电子产品世界, 2009 (4) :11

[2]SSM2301:Filterless high efficiency mono1.4W Class-D audio amplifier[R/OL].http://www.analog.com/static/imported-files/data_sheets/SSM2301.pdf

[3]Katz D, Gentile R, Lukasiak T.嵌入式音频处理基础 (一) [J].电子产品世界, 2008 (8) :121～124

[4]Katz D, Gentile R, Lukasiak T.嵌入式音频处理基础 (二) [J].电子产品世界, 2008 (9) :123-127

[5]Katz D, Gentile R, Lukasiak T.嵌入式音频处理基础 (三) [J].电子产品世界, 2008 (11) :124-127

音频电子产品篇2

 需求分析

随着信息技术的不断发展，法律机制的日趋完善，政法行业以及相关的司法行业对本系统的数字化、信息化改造需求也日趋强烈，数字信息科技的发展是推进检察机关和法院工作改革和发展的重要因素，改变传统提讯、庭审模式，实现公正与效率已经成为国内各级检察机关和法院的工作主题，更是时代发展和进步的必然趋势，由此远程提审应运而生。

远程审讯，即对嫌疑人或证人的整个询问过程通过网络视频、无线传输、远程监控等高科技手段，建立声音、视频远程网络传输，并将整个询问过程进行全程录音录像，制作成光盘保存。这种办案方式不仅解决了办案效率低下，司法成本过高的弊病，真正实现了向科技要效率；同时也为社会各界提供了一种日益公开、民主、便捷、高效而新型的交流平台；针对疑难案件，主管领导或相关专家更可以随时对案件进行远程指导，案件的质量也随之提高。远程视频提审、庭审实现了案件审理“足不出户”，节约了时间，提高了效率，节省成本。艾力特音频针对远程审讯系统，也推出了基于OS-300，MC-U200等产品的音频解决方案。

远程审讯的音频要求，需要拾音和双向通话需求，尤其是在审讯室里面，一般的装修条件比较简朴，不可能有软包或者其它装饰材料进行使用。这就需要在审讯室里面有较远的拾音和远端的回声消除能力，尤其审讯室内部空间变化差异较大，需要有较好的回声消除能力和双讲能力。远程提审区域，根据实际情况，可以配置麦克风端或者全向拾音产品，随着产品的适当超前性，也需要去麦克风化，中心端能够直接进行无距离审讯。 系统组成

根据上图所示，在艾力特远程审讯音频解决方案中包括在审讯室和控制中心两端，在审讯室里面，需要拾音和对讲，一般使用OS-300回声消除拾音器，其可以接入网络摄像机，网络音视频服务器等终端设备进行拾音和对讲。

在控制中心端，根据实际使用情况，可以选配OS-300，MC-U100和MC-U200设备，其中OS-300仍然为模拟的音频输入输出接口，可以无限制接入各种模拟接口终端，而MC-U100和MC-U200均为数字USB接口规范，可以支持有USB协议的各种终端设备，MC-U200为自带喇叭，MC-U100为外置音箱，可以根据实际情况进行选配。上述音频设备，可以基于现有的远程审讯系统，无缝链接。 方案特点

在上述音频解决方案中，艾力特高保真拾音器可配合大多数安防监控后端设备，包括硬盘录像机，网络视频服务器、网络摄像机、网络硬盘录像机等。其网络架构图跟目前主流监控网络体系是一致的，只是加了一个音频终端设备，跟目前市场上的主流设备都有良好的兼容性。

4、推荐型号

OS-300 MC-U200 MC-U200(用图片表示)

OS-300 回声抑制拾音器

操作简单，较高的音频性能，为双向语音对讲提供更接近人声的麦克风信号；拥有消除对讲中产生的回声与啸叫声功能；频响范围符合增强型语音音频宽带要求；符合传输所能够支持的最大音频带宽标准；真正的全双工音频，使发言和收听能够同时进行；

自动噪声电平平衡控制功能，有效抑制房间环境噪声和系统热噪声，提高整体音频信号清晰度；即插即用，方便连接各类品牌声卡和DVR设备，不必手持MIC或正对MIC即可

MC-U100 会议全向麦克风系列

环境电平控制功能，回声消除，噪声抑制；

自带静音按键，确保多方通话时，各个阶段的切换；

清晰的聆听，连接功放设备，实现全面的双工通话；

兼容各种即时通讯软件及视频会议系统及其硬件视频会议终端；采用抗干扰技术，能抵抗移动电话和其他无线设备的干扰；优秀的地隔离技术，确保不产生共地音频干扰；

3米距离高清晰通话

配合电脑即插即用，免设定可以实现语音互动。

MC-U200 会议全向麦克风简约的外观设计、时尚大方；

震撼的高清音质，全方位的音质体验3W高保真扬声器环境电平控制功能，回声消除，噪声抑制；

兼容各种即时通讯软件及视频会议系统及其硬件视频会议终端；采用抗干扰技术，能抵抗移动电和其他无线设备的干扰；

配合电脑即插即用，免设定可以实现语音互动。

真正的全双工音效，使发音和收听能够同时进行。不必在会议进行中，进行收听和发言的选择，也不影响会议语音连贯性；

音频电子产品篇3

董事长周宝宁介绍，音响行业或演艺行业，经历了从电子管到晶体管，再到数字化、网络化时代的发展，企业必须与时俱进。近十年来，“宝业恒”以数字技术为发展核心，向数字音频领域全面转型，延伸配套产品线，自主研制的数字调音台、全数字功放机和AUDIONET网络音频平台产品以高效、节能、环保为理念，并具有音质出色、安全可靠。

宝业恒有5款产品荣获了“2014年度PALM展参展商产品技术进步奖”，其中，C-MARK CDM24数字调音台和C-MARK TC4960四通道数字功放机获专业音响类一等奖，C-MARK US12A网络音频数字有源音箱、PAL QH2400数字功放机和PAL VARYAG12数字调音台获专业音响类二等奖。

新款数字调音台CDM24外观时尚、简洁，界面模仿模拟调音台的界面，具有网络化、多功能、易操作、高性价比特点。特别在数字接口、音效处理、安全稳定性等方面做了进一步的优化和升级。

副总经理周其麟表示，面对现实，“宝业恒”迎难而进，不走寻常路，组织研发团队，根据用户需求，所有的网络节点设备，从输入到输出，以及信號的传输与控制、数字信号的处理设备，都配套生产，形成整体方案。

音频电子产品篇4

1 常用消噪电路

如图1所示Ui是信号输入端, U。为输出信号, C1是静噪电容, 通常选用47ūF的有极性电解电容。在加入静噪电容C1后, RP1上的任何交流噪声都被静噪电容C1旁路到地, 因为C1容量大, 对这些交流噪声的容抗很小, 达到消除音量噪音的目的。

2 消噪电容电路

图2是改进后的消噪电路, 电路中C1为消噪电容, VT1和VT2为静噪三级管。

电容C1具有消除开关S1动作时产生的噪声的作用, 电容有消噪的作用, 那么消噪的效果与什么因素有关?研究发现, 信号经过电容后, 不仅噪声信号被消弱, 原信号也发生了变化.而噪声信号和原信号的变化程度均与电容的大小有关。为保证后续电路正确识别电压, 电容取值范围是:0.16nf�C�0.22nf。其原理是:若没有C1, , 在S1接通瞬间, 由于VT1和VT2突然从截至状态进入导通状态, 电路会产生噪声, 同样在VT1和VT2从导通状态转换到截止状态时, 也会产生噪声。

接入C1后, 当S1接通时, 由于电容C1两端的电压不能发生突变, 随着电容通过电阻R7的充电, C1上的电压渐渐增大, 这样VT1和VT2由截止状态较缓慢地进入导通状态, 这样可以消除上述噪声。同理, 当S1断开之后, C1中的电荷通过R4、R5和两管的发射结放点, 是两管渐渐由导通转换为截止, 达到消除噪声的目的。

3 新型消噪电路在电视机中的应用

通讯信号经数据线接入端口 (Line口) 进入电视机后, 首先经过过压保护管进行一次的防护, 过高的能量 (如雷电, 高压脉冲等) 首先被滤除, 然后进入低通滤波电路, 该部分电路通过提高磁性元件的耐电流抗饱和的性能, 从而能更好更有效的抑制数据信号传输时遇到脉冲噪声, 在信号进入家庭接入网关前, 在线路中添加了过压过流检测以及消噪电路, 以进一步的减弱经前面电路滤除后残存在线路中的脉冲噪声, 当线路中检测到过压或过流时, 通过开关MOS管控制变压器TRI, 去改变线路中的阻抗, 从而消除线路中的脉冲噪声, 再经过该噪声消除电路后, 经过噪声滤波电路进入家庭综合接入网关。

4 结束语

消噪电路是音频电子设备中必不可少的一部分, 是电视机电路中的重要环节, 采用新型电容消噪电路后, 消除了电视机开关机噪声。

参考文献

[1]高岩, 闻跃, 杜普选.基础电路分析 (第2版修订本) [M].北京:北京交通大学出版社, 2008.

演讲与口才,音频篇5

摘要：演讲与口才是高等院校普遍开设的一门课程，其教学目标就是培养高素质的应用型人才。在高校演讲与口才教学中，教师应注重实践教学，使学生掌握和具备高素质应用型人才所必需口语表达知识与技能，提高他们的岗位适应能力，增强他们创新意识和职业道德意识，进而全面提升学生的人文素养。

关键词：应用型人才演讲与口才实践教学

为适应把我国建设成创新型国家的需要，培养应用型人才已成为高校人才培养的核心任务之一。应用型人才的一个突出特点就是能够学以致用、立足实际，务求实效，能够把理论知识和实际应用联合起来，能够将自身所学的理论知识转化为能力，形成学以致用、用以促学、学用相长的良性循环。我国自上世纪80年代大专院校相继开设了演讲与口才课程，时至今日，越来越多的高等院校开始重视学生应用能力和实践操作的培养，“演讲与口才”也成为继“大学语文”之后走进高等院校课堂的人文课程。

一、合理编排实践教学内容

演讲与口才课的实践教学内容主要包括发音实训、态势语言实训、情境应用实训。

发音实训主要针对普通话这一章节的内容进行设计，教师在理论授课课时系统讲解普通话的语音基础、现代汉语相关知识以及普通话水平测试的相关要求，在实践教学课时需要将理论知识进行夯实，并将理论知识内化为能力。发音实训内容主要包括对普通话的声母、韵母、声调、归音进行训练，对方言进行纠音、正音训练，对普通话水平测试内容进行训练。态势语言实训主要针对态势语言这一章节内容进行编排，教师在理论授课课时讲解态势语言的作用、含义等知识，在实践课时主要训练包括表情语言、体态语言、手势语言在内的相关内容。

针对口才应用的领域、场合、对象的不同，教师可将情境应用设计为三大板块，主要包括：表演板块（朗诵口才、演讲口才、辩论口才）、交际板块（社交口才、求职口才）、工作板块（主持口才、谈判口才、推销口才、导游口才等），在实践教学环节，创设不同的情境，完成即兴演讲、解说词撰写与讲解、模拟面试、辩论赛等实训项目。此外，教师编排实践教学内容还应结合社会实际情况和学生的专业特点，以及他们的岗位需求，优化实训项目结构，进行有重点的训练与突破。例如，市场营销、工商管理、国际贸易等专业学生的工作需要运用谈判口才、推销口才来赢得客户、获取商机、实现合作双赢；文秘、行政管理专业对于学生的普通话水平要求颇高，而且交际场合及工作场合的介绍、说服、拒绝批评、赞美等交际口才使用频率颇高；辩论口才更是法律专业的学生训练与实践的重点。

二、科学构建实践教学模式

发音实训、态势语言实训、情境应用实训等三方面的教学内容可以通过训练、鉴赏、实践三个层次进行操作。

“训练”主要包括普通话正音训练、朗诵训练、演讲训练。普通话正音训练包括七个部分，分别为唇形舌位训练、吐字归音训练、气息控制训练、共鸣控制训练、声音弹性训练、用声与嗓音保护训练，重点是唇形舌位训练、吐字归音训练。在实训时教师可以根据普通话声母、韵母、声调进行正音训练，还可以根据方言与普通话在发音、语言、语法等方面的差别，对学生进行有针对性的普通话纠音训练，培养其正确运用普通话进行沟通交流的能力。

“鉴赏”主要是通过欣赏范文朗诵音频和视频，从中了解并掌握诵读的技巧；通过欣赏著名演讲文稿与名人演讲音频、视频，从中体味演讲的感染力与魅力，掌握演讲内容的编排和态势语言的运用；通过实地观看论辩赛或者欣赏辩论赛视频，从中感悟思辨的力量与团队协作的精神，培养流畅练达的语言表达能力、大方自信的礼仪风度以及敏捷机敏的思辨能力。“实践”是指结合学生生活和工作实际，创设仿真的情境，如组织模拟招聘会、辩论赛等活动。口才表达在学生求职阶段发挥着极大作用，所以模拟招聘会既是锻炼学生面试口才的机会，更是学生走上社会前的预演，实训内容可包括面试阶段自我介绍实训、面试阶段回答面试官问题阶段、面试阶段礼仪礼貌实训等。在实训中，教师应注重培养学生的面对面试问题的应变能力，提高其分析问题、解答问题的能力，注重学生素质、礼仪修养等方面的提升。

三、努力拓展实践教学空间

演讲与口才不应囿于几十平米教室和几十分钟的课堂，教师应为学生搭建与社会、与实际生活联系更加紧密的实践教学平台。

在演讲与口才的实践教学中，教师还可以让学生“走出去”，进行实地口才实践。如谈判口才的实践教学环节可让学生亲临二手车市场、购物、租房、产品促销会等简单商务活动，让学生观摩或参与报价、讨价还价、磋商较量的过程。现今的大学生多数为90后，有争强好胜的心理和不轻易服输的信念，教师可以让学生尝试参与各级各类演讲比赛、朗诵比赛、辩论赛等竞技性口才实践，在提高口语表达技能的同时，锻炼他们的心理素质，激发他们的学习热情。毕业季的招聘会既是学生谋职应聘的舞台，也是他们磨练口才的机会，教师可带领学生亲临招聘会，将招聘会现场作为学生的口才实训场地，使学生在成功中积累经验，在失败的沮丧中总结教训。此外，大四的实习是实践教学重要的组成部分，学生在实习中不仅锻炼了行业口才能力，还锻炼了社交口才能力，而且实习过程没有教师全程参与和现场指导，所以更加能够检验学生对于知识和技能独立的掌握和运用能力。

四、改革考核评估方式

演讲与口才课程的教学目标是为了提高学生口语表达能力，提升学生的沟通技巧，因此，其课程考核评估方式就应紧紧围绕这一目标制定。因实践教学具有应用性、技能性强的特点，所以演讲与口才课程的考试应采用口试考核，口试内容主要包括普通话测试、朗诵、演讲、模拟应聘四项。学生的成绩由平时成绩和实践成绩构成，为突出实践教学的重要性和必要性，实践教学成绩要占学期总评成绩的70%。

总之，演讲与口才教学的培养目标应符合高素质应用型人才的定位，教师需要结合不同专业学生的岗位需求，科学合理设计实践教学环节，夯实理论知识、强化技能培养，以此加强学生语言表达能力、应变能力、沟通能力，进而提升他们的综合素养。参考文献：

姚小玲.视频公开课“演讲与口才”教学模式的改革与实践[j].中国大学教学，2012（5）.篇二：【校园广播剧】随风逝去的日子[视频剧本mp3下载随风逝去的日子 [前奏] 很多年以后我还依然记得那个冬天。阳光很好。空气中有晒过的棉被暖暖的味道。在每个天晴的日子里，我都会默默的回想起那段老不去的时光，那些——随风逝去的日子。场景：空旷的演奏厅

23岁司徒雅单指敲琴键哼曲手机铃声雅接电话雅：„„ 蔚：喂

雅：是蔚吗？蔚：你好吗？雅：我„„很好

蔚：要演奏了吧..加油雅：恩„„加油(电话嘟嘟声„„渐远)主音乐起雅独白：(23岁雅声音渐弱18岁雅声音渐强)原来时光是会跑的.我曾以为，蔚.小杏子.阿文，我们会一直在一起，慢慢的，一个个散在天涯了。蔚应该漫步在英国校园里，抱着一大摞书，对着满地的梧桐叶叹息。阿文呢，在东北的冰天雪地里爽朗的笑，激烈的辩驳着。可爱的小杏子经常会跟我联系，她说要和我去最南边的海享受阳光沐浴。而我游走在东部许多个陌生而又相同的城市，举办着一场又一场演奏会，让梦想跳跃在黑白色的琴键上......(缓)其实我一直在想关于爱，回想那些在我生命里闪耀的瞬间，我们欢笑.我们难过.我们吵闹。那是上帝赐予的一幅名为“爱”的画，即使我们老去，即将老去。当再次触碰那些微笑的脸，它们依旧温暖，而友情.爱情，淡化成岁月里一抹七彩的光，照射在我心灵最干涩的土壤上，然后一点一滴地从我的指间流出，成为如水的情感，幻化出最动人的乐章......蔚，你好吗？你实现了你的梦想了吗？

当华美的叶片落尽，生命的脉络才依依可见/是不是我们的爱情，也会象冬天北方的树干，一样清晰、勇敢、而又坚强！[第一幕]相遇

场景：教室(教室嘈杂声)雅：你们好，我叫司徒雅，来自音乐学院，我和小杏子是同学也是从小一起长大的小杏子：我叫黎杏，叫小杏子就可以了！嘿！胖子，你真叫欧文啊？雅：小杏子，别这么说话！

文：杏子同学，本人行不改名，坐不改姓，欧文！就是我！还有啊，我也就微胖，能算胖的吗？

小杏子：你还是健壮啊，摆脱，我看你都快赛过一头幼年大象了文：瞧你个小孩样，没成年装什么大学生

蔚：司徒雅，你好，我叫蔚蓝，跟你们一样，我和阿文是一起来的...老师：安静！安静！各位同学，你们好，欢迎你们来到假期演讲与口才训练班来。我姓蓝，记住了！不要是男，我是位女士。你们可以叫我蓝老师。我希望在一个月后，在座的35个同学都能学有所成，下面请大家按我点的名字的顺序依次上来做自我介绍。首先是黎杏。小杏子：你们好，我叫小杏子，我说话的口音比较重，所以希望改好。我的爱好是音乐，很愿意和爱音乐的人做朋友。谢谢。老师：好，下一个，欧文

文：欧文！男，不是蓝啊，19岁，未婚！你们叫我阿文吧，不过我喜欢的是篮球，至于为什么取名叫欧文，不清楚原因，来学口才是因为平常废话太多，恩，好，我完了。不，不，我说完了。

老师：欧文同学，你只要能认真学习，便能够改正。文：是！男老师！哦不，是蓝老师。老师：接下来，是，蔚蓝。文：喂喂，蔚，该你拉！上！

蔚：恩，我是蔚蓝，平常因为比较内向所以不多话，来学习只想能大声说出自己...就这样.谢谢

18岁雅：(画外音)蔚总是很安静的样子，会呆呆地望着天空出神，或是微笑着看阿文和小杏子拌嘴，有时我回站在小杏子一边，有时会站在蔚的身边，看他眼里的浮云，那个冬天，我们四个走在了一起，带着不相识又似曾相识的缘分度过了短短的一个月，冬日里的阳光漂浮在每天呼吸的空气里，那时的我们，轻快的像五月的花海，风吹过便有瑟瑟的笑声，追逐的年轻，坚定的目光„„ [第二幕]爱情场景：教室(嘈杂声)小杏子：蔚！你怎么老是不讲话的啊？跟个闷葫芦一样。蔚：我比较喜欢看书

雅：蔚，今天看的是什么书呢？蔚：就这个„„

文：我来念！我来念！爱情是什么？它是全然的空想，全然的热情，全然的愿望，全然的崇拜，恭顺和尊敬，全然的谦卑，全然的忍耐和焦心，全然的纯洁，全然的磨练，全然的服从„„ 小杏子：停„停，摆脱，你这人做什么事都这么激动的吗？雅：小杏子，阿文念的挺好的啊。蔚：是啊，我就没这样的激情。雅：蔚你也很棒的，是莎翁的„

小杏子：拜托，什么爱情爱情的，阿文才不懂呢，瞎念的嘞文：杏子，你跟我扛上了是吧

小杏子：怎样！单挑吗？我跟你比五线谱！来不来？

文：行，算你狠，不过有种你跟我单挑篮球，我让你三个。小杏子：除了篮球你还懂什么呀，你这个文明世界的野蛮人！雅：小杏子，别闹了

蔚：阿文，别跟小孩子计较啊

小杏子：喂喂„闷葫芦！我哪里是小孩啊！哼！

雅：爱情，原本是很奇妙的东西吧。在阿文和小杏子的打闹里，我和蔚有了另外的默契，点滴滴的萌发，蔚也发觉了，然而它只是悄悄长着，一直一直的生长 [第三幕]关于梦想

场景：麦当劳餐厅内背景广播声

蔚：图雅，东西都差不多了吧，一会还要买点什么，你再点点看。

雅：恩，两个帐篷，还有被子。烤肉的工具是阿文带，材料我拿，水果是小杏子负责的，对了，对了，一会再去买点调味料。蔚：恩，记得还有喝的啊

小杏子：雅雅雅雅！报纸上说今晚的流星雨有上百颗流星啊！太棒了！我还没见过啊！要许什么愿望啊！雅雅你有什么愿望啊！

文：杏子，你还是把愿望都写下来吧，别一会都给忘了。杏子：这注意倒不错！诶，死阿文，那我也发挥一下我善良的本性，你有什么愿望没，我一起帮你许了。文：我吗，我到是没有，要不这样吧，我就愿你早日由女孩变成女人吧。小杏子：臭屁文！缺不缺德是你！哼！我跟你说„

雅：诶！小杏子，小杏子，你想不想知道我小时侯的梦想啊？小杏子：恩？好啊好啊！

雅：呵呵，别笑话我就是了，我小时候最大的梦想就是想拥有一个功能的塑料文具盒。文：我！我也是，还特别想要一块手表，就是那种液晶的电子表，很便宜的，大概五块钱一个。小杏子：幼稚！诶？我怎么就没特别记得的梦想啊？蔚，你呢？

蔚：有啊，6岁的时候，我希望长大后能当个卖冰棍的叔叔，这样就有一车的冰棍可以吃了，左手一根，右手一根„ 雅：这个冬天没有下雪，一个月满是阳光灿烂，但一开始就注定了，只有一个月，蔚要走了，去遥远的国度。生活在日日夜夜的轮回中悄悄的演绎，一切都安静的延续着，在这个月里我们享受着简单的快乐，体验着酣畅的生活。走过的每一天，都六下了我们深深浅浅的足迹，那时候，梦想是我们执着的追求。在学习班的最后一天，我们大家约着一起去看狮子座的流星雨，在这之前，我没见过流星，在这之后也就再也没见过，而我们的梦想也许都已一一实现，也许我们的分开就是为了梦想的实现！

小杏子：都几点拉，再不来，我铁定就睡着了，啊蔚：说是要凌晨两点吧

阿文：美女啊，星星啊，快出来让帅哥我看一看吧。

雅：再晚些，天空更黑点，也就看得更清楚吧，恩，还有一段时间呢，要不，我们来讲故事吧，轮着来。

文：好好！这个注意不错，我先来，好，我想好了一个：从前有座山，山上有座庙，庙里有个很老和尚正在和小和尚讲故事„

小杏子：是个很胖的和尚吧！死啊文，有没有搞错，你有点建设性好不好，再这么讲，我们全都给你弄睡着了

雅：要不，我来讲吧。有一次，国王为美丽的公主开宴会，有个士兵在一旁站岗看到公主经过他面前，他立刻爱上了她，可是一个卑微的士兵怎能佩得上国王的女儿，但终于有一天士兵勇敢的走到公主面前，说他爱她，并告诉公主没有她活不下去。公主被士兵的深情感动，她对士兵说：“如果你能等我一百天，并且日日夜夜在我的阳台下等我，一百天之后，我将是你的„„”，听了这话，士兵在阳台下等，一天.两天.十天.二十天，公主每晚都往外看，士兵仍然屹立通宵，风雨都阻挡不了，一直一直等着„„到第九十天时，士兵的全身已经苍白而消瘦，眼泪从眼眶里流出来，他支撑不住了，甚至连睡觉的力气也没有，公主一直注视着他，最后，在第九十九天的晚上，士兵站了起来，转身离开了，他走了„„ 小杏子：然后呢？

雅：恩.，没有然后了。

小杏子：这就是结局吗？士兵为什么离开了？他为什么不和公主一起？

文：恩，哦觉得这个很真实吗，什么王子啊，公主啊，从此过着幸福的日子，都是骗你这样从幼稚园跑出来的小孩的，哪有那么完美的啊。

雅：呵呵，告诉我这个故事的人说总有人会知道士兵为什么离去。蔚：恩，我想我知道的。

小杏子.文：是什么？是什么？

小杏子：你不是说这是骗人的嘛么，那你干嘛想知道。文：这叫打破沙锅问到底，懂不懂啊你！

雅：你们俩别闹哦，听蔚怎么说。

蔚：我也是猜的，我想，也许士兵觉得如果到了第一百天，公主不兑现承诺，那他会伤心一辈子，但是只要他再最后一天离开，那公主便会记住他一辈子„„ 雅：蔚，如果你是那个士兵，你也会这么做吗？蔚：我没有一百天可以等啊，我过几天就要走了。

小杏子：喂蔚闷葫芦，你要是走了，不要忘记我们啊，我一定会给你写信的！文：我也要会东北了，杏子！你会我写信么？

小杏子：你搞什么，那么沉闷干吗。得了！得了！你走了也就别回来，祸害党和人民！雅：都最后一天了，小杏子，不和阿文斗气了噢。蔚：我会记住你们的，恩，也会写信。小杏子：怎么一个月过这么快啊？雅雅也要去外地学钢琴，你们全走了就只剩我一个了！文：傻杏子！放心拉，又不是一辈子都不见了。再说„ 小杏子：再说什么？蔚：再说可以写信

雅：还有打电话，上网啊！小杏子：恩，可是你们不在，我还是很难过的，哎„„ 雅：杏子！杏子！快看！文.蔚：流星！

小杏子：看到了看到了！好多啊！文：杏子！别傻楞着啊！快许愿！

文：我！欧文！要当一个最能干的律师！惩处罪犯！维护法律！伸张正义！

雅：我！司徒雅！要，要成为钢琴家！办一场最大的演奏会！弹奏自己写的曲子！蔚：恩，我！蔚蓝！要到英国去读文学，我要成为一名出色的文学家！小杏子：我要我们的梦想全都实现！四人：耶！！

文：走！咱们去更高点儿的地方！

雅：满天的星光，满天的烟火，满天的快乐，我们带着崭新的希望和憧憬，倾听着彼此的梦想，让思绪摇曳在条条思绪和点点星光之间，守侯着一片安宁，也让满天的流星陪着我们，一起守侯希望的到来。四人：欢呼结局：实现场景：演奏厅(嘈杂声：“灯光，音响，准备！司徒雅，准备，演奏会马上开始”)(安静„脚步声)23岁司徒雅：今天，我的梦想实现了。每个人都有梦想，为了追求梦想，我们也许错过了许多东西，但是，我们不曾后悔，因为，有了梦想，我们才懂得飞翔。下面这首曲子，是我写给我的朋友的，献给那些随风逝去的日子。小杏子：喂蔚闷葫芦！再见！

文：再见啊！保重！18岁雅：蔚，再见，再见„„

蔚独白：很多年以后我还依然记得那个冬天。阳光很好。空气中有晒过的棉被暖暖的味道。我的朋友还在我的身边，依然有快乐的笑容，依然会有无畏的吵嘴。一切是那么的美好。徒雅的琴声还在空旷的教室里响起。小杏子不小心跑调了的歌曲。阿文大大咧咧的笑。在每一个天晴的日子里我都会在阳光下回想那段时光。那段老不去的时光总是浸透着最纯透的希望，像冬日里的颓痕，萌发着风的季节，像丛生的衰草，掩不住青春的流殇。现在的我们，依然年轻，但却退却了往昔的稚气，我们都会长大，有些美好终将过去，有些奇迹也将欣欣而来，世事总是轮回往复，往事总是如风般散去，而我们却无能挽留。只能静静的观望，只能让我们曾经的约定，只能让我们美好的青春时光，在岁月里悠然沉淀。梦里我们不知花落了多少，心里我们总是不断的寻找，窗外，依旧风淡云轻„„ 篇三：演讲妙招

公众演讲何惧之有？20条黄金法则让你爱上它

章节演讲日之前选择一个你真正关心的主题 3 分为开头、主体和结尾三部分 4 想像一下演讲成功的场景 5 与活动主办方讨论设备需求

很多人对于公众演讲都有与生俱来的恐惧感，这种感觉让他们不敢勇敢站起来发表自己的观点，也让他们总是甘于现状。无论他们的工作或者当下情况有多窘迫，都不敢跨越“雷池”一步。１

演员乔治·约瑟说过：“人脑从出生的那刻起就开始辛勤工作，从未停止；但要你当着大家的面站起来讲话的时候，它却会一片空白。”你可能觉得你不可能达到那些演讲大师的水平，他们不但字字珠玑、聪明睿智，而且感染力十足。但你绝对能够自学成才，打破公众演讲的枷锁，迈上一个新的层次。

公众演讲是一种可以后天习得的技巧，就像弹钢琴或画画那样，可以通过训练学得。当然，这需要一定时间，也需要不断的练习以及行家的指导。但是，因为对其有着天生的恐惧，我们往往会错失一些学习和练习的机会，选择逃避而不是直面挑战。这我能理解。因为以前，逃避也是我惯用的伎俩。

在我上大学的时候，我特意不去选那些可能需要进行公众演讲的课程。唯一的一次强制演讲也成了机械背诵练习。

对于这第一次的演讲，我事先早已将内容背得滚瓜烂熟，当天就好像一个机器人走上讲台说话一样。我结束演讲之后还是紧张的不能自已，甚至都记不清到底说了什么。

当我把话一字一句说出来的时候，就像是在经历一场九死一生的痛苦征程一样。但结果是，我成功做完了这第一场演讲，顺利毕业并进入了金融业，开始了我光明的职业发展轨迹。我相信每个人都可以做到，你也可以。２

开始工作后，我还是不断地回避着公众演讲。作为一家大企业的管理培训生，我经常会坐在硕大的会议桌上，周围被陌生脸孔包围着。当大家开始依次作自我介绍的时候，我就会开始浑身冒汗。听上去要讲的东西一点都不绕弯，无非是：“我叫„„，我是谁谁谁”之类的。我就纳闷了，为什么我觉得当众讲话会这么难呢？

后来我发现，我并不是唯一一个碰到演讲就会冒汗的人。一项盖洛普民意测验显示，40%美国的调查对象害怕在众人面前说话。伴随着这种焦虑感，身体上就会反应出一系列特殊的症状，比如盗汗，膝盖和手会不由自主的抖动，声音颤抖，脸红，心跳加速以及恶心等。在培训期间，公司强烈建议我参加toastmaster俱乐部，后来一想，我真是交了好运，如果不是公司的关系，我估计这辈子都不会主动去参加这一改变人生的活动。我在toastmaster的第一次演讲上，我终于大胆地张开了嘴，而更加重要的是，这次演讲帮助我打开了眼界。在这个“漫长如一生”的五分钟演讲中，我竟然说了33次“啊”或“恩”。你可能会觉得这难以置信，但更加令人吃惊的是，我一个都没有听到。

而多年之后的今天，经历了大大小小无数次演讲的我，已经很少说“啊”和“呃”这样的停顿词了，但是想想多年前的第一次经历还是会大笑不止。虽然现在的我还是会紧张（没错，每次都会紧张），但我已经学会如何控制住这种情绪了。我相信你也可以。沃尔特·克朗凯特说过：“是人都会紧张得心里直打鼓，秘诀是如何克服紧张，让心里的小鼓打的有节奏。”接下来就是公众演讲的秘诀：演讲日之前

如果你要防止演讲前过于紧张的话，早作准备无意识最有用的。如果一个婚礼没有好好的计划和组织，你不会期待它办的盛大隆重而又顺利成功。同样道理，如果你要做一次成功的演讲，提前多日精心准备是必须的。准备工作尽早开始

从你得知要做演讲的那一刻起就开始准备吧。千万不能拖。想一想你的主题，把想说的东西写下来，即便它可能只是一个草稿而已。３

如果想写的简单一点，就先做一份提纲出来。找一个演讲主题先产生可以发展成为演讲主题的大想法，然后再将小的想法贯彻到大的主题当中。注意细节，特别要注意你周围的生活和环境细节。打个比方，摄影师荣恩·塔沃曾发文说，他有一次在报道纽约国庆阅兵的时候被堵在了路上，一位女士转过来就问他：“真有黑人牛仔吗？”塔沃写道：“那一刻起，我就有一个小故事可以写了。”.选择一个你真正关心的主题

你选的主题要和你息息相关，同时它也要是一个大家都比较熟悉或者接触过的东西。亲身经历的故事传达的信息不但强有力而且可以引起共鸣。

一个战胜乳腺癌的患者在将自己患病经历介绍给同事听的时候，主要侧重点并不是这种疾病的医学知识，而更多的是放在朋友和家人能够如何帮助癌症患者，比如为他们烧饭或者载他们去上班等等。

即使题目是已定的无法选择，你也要尽量把它与个人经历相结合。

把你的演讲准备得吸引人一点，至少对你来说要有趣，这样别人才会感兴趣。假设你现在要做一个金融报道，你完全可以把净收入数据用另一种方式表达出来，比如说用所赚的钱可以去夏威夷度假多少次。

将演讲结构组织得富有逻辑线索

要使你的演讲富有逻辑，你有很多方法可以选择，比如根据时间节点来进行前后串联。有了主线之后，不光你自己可以更好地记住要说的内容，而且听众也能更容易跟上你的思路。有了一个清晰地逻辑路径可以帮助你减缓忘词的恐惧感。马尼托巴大学的研究结果显示，在所有对公众演讲过度焦虑紧张的人当中，有74%的人害怕演讲时“大脑一片空白”。分为开头、主体和结尾三部分

所有成功的演讲都由这三大部分组成。开头的话，首先要吸引大家的注意力，可以提出一个发人深省的问题，讲述一个相关的趣闻轶事，引用一段合适的名人名言或者提出一个富有挑战性的论点等等。

通过开头，你要慢慢地过渡到演讲的主题，用清晰明了且容易理解的方式，娓娓道来。最后的结尾一定要有力，方法不一而足，可以进行总结陈述，呼吁某种行为，或者提出相关问题，讲述故事，或者引用等等。４

预演

一旦你写好了说稿，最有用的无疑是三个词：练习、练习、再练习。自己说自己听是最好的、无可替代的方式。频繁地练习吧：洗澡的时候练习，照镜子的时候练习，车停在路口等红灯的时候也可以张嘴说说。

美国西雅图一家癌症研究中心博士后瑞秋·布雷姆在她的名为《聚光灯中眨眼》的文章中这样写道：她在研讨会上作发言之前练习了无数次；她在家里一个人的时候练习，在工作上司面前练习，在演讲前一天宾馆里也没有停过。她甚至还对着空无一人的沙发练习“眼神交流”。想像一下演讲成功的场景

最方便、不需要高科技的方法就是闭上眼睛，想象一下面前的观众听了你的演讲内容后持续不断地鼓掌。说到另一种高科技手法，你可以用一下最新版本的模拟现实（vr）电脑程序。有些vr程序是特别为那些弱于公众演讲的人设计的——甚至还有专为结巴的人设计的程序。乔治·华盛顿大学演讲与听力科学系的副教授舍利·布隆达运用佐治亚州virtually better公司的软件对使用vr软件的益处做了调查。她解释道：“现在连着电脑的耳机大小和橄榄球差不多，以后的更新款应该可以进一步缩小到帽头灯这么小，这样的话，视觉效果会更好。” 这些三维影像再加上仿真的声效，可以模仿出“好”的听众，视频上会有点头、认真倾听、眼神交流；也可以模仿出富有挑战的听众，模拟的人们心不在焉，电话时不时会响起，甚至会有人走来走去。在这个系统中，使用者可以看到面前摆放着一个仿真的小讲台，讲台上放着自己的笔记。一转头还能看得到自己制作的ppt。布隆达博士说，vr软件最大的好处就在于“它让你在一个安全的环境下进行练习，一切尽在掌握中。你随时可以把系统关掉停止练习，模拟听众不会找茬。”

与活动主办方讨论设备需求

确认一下所需的设备都可用，反复确认。如果你依靠幻灯片或者要用电脑展示图片的话，一定要有一个备选方案。一定要事先想好，如果设备不能用的话怎么办。熟悉演讲环境

如果可以的话，在演讲之前去一下现场，这么做可以帮助你想象一下演讲成功的场景。到了现场之后，了解一下场地的布局，在讲台上站一站，测试一下麦克风。你对于演讲环境越熟悉越好。演讲当天穿着得体

挑选舒适且职业性较强的衣服，1968年的人际交往调查研究表明：一个人的外表是表明自己身份和特性的主要来源，穿衣的品位不仅会影响自己的信心，更会影响别人对你的态度。你要对自己的外表感觉舒服，要确信别人直视你的时候，你不会因为自己的外表而分心，进而无法传递正确信息早点到

要预留一些时间比防不测，比如道路整修，堵车或者停车难等问题等等。乐观一点

专注于你要传递的信息，时刻牢记，最重要的是观众要听你说的话。把每一个消极的思想用积极的想法替换掉，比如当你打退堂鼓的时候，你可以鼓励自己说“我能努力做到最好，这也是一个让我学习的好机会。”

如果方便的话，准备一篇介绍自己的短文给主持人，在短文里要包含相关的个人信息以保证这篇介绍可以很好的引入演讲的内容和基调。介绍词应至少包含四方面的信息：主题是什么；为何选这一主题；主讲人是谁；为何由他主讲。举个例子，介绍词可以像这样写：“在当下的商业世界里，公众演讲是一个至关重要的课题。我们一直以来都坚信，每个人都能够成为一个很好的公众演讲者。今天的主讲人是夏威夷大学传播学硕士，她已经针对公众演讲的主题作了无数次的研讨会发言。今天我们有幸请她来到现场与我们交流一些演讲的技巧。她就是cheri orator，大家欢迎！” 缓解紧张情绪

你到达现场察看了演讲厅之后，找一个安静的地方，在那里理一遍自己的思路，尽量放松。外界刺激越少，你就越是容易集中于自己要传递的信息。如果无法将自己与外界隔离几分钟的话，即使在人群中，尽量从思想上重新聚焦到演讲内容上，汇聚自己的小宇宙。在你准备演讲之前等待的时候，可以尝试做以下几个小练习。

捏紧拳头并保持3-5秒，然后放松。你可以发现，在手掌放松的时候，你的肩膀和下巴也会放松。重复这个动作三次。在主持人介绍你之前，做深呼吸，慢慢呼气，然后将空气吐尽，此动作也重复三次。

不论你有多紧张，前往不要告诉听众相信我，很可能你告诉了听众，听众也不鸟你；就算鸟了你，他们也很可能只会同情一下你，然后更加认真的听讲。就算你很紧张，还是就直接开始演讲吧，不需要用道歉来让听众专心听讲。

用一些与主题相关的视觉辅助手段

研究表明，单单靠说来传递的信息，三天之后还保留在脑中的比例仅为10%，但如果边说边用视觉辅助手段进行演示的话，这个比例就会上升至65%。

视觉辅助手段可以帮助听众更长久地记住你的信息，这也意味着他们能更长久地记住你。这无疑对未来的提升以及源源不断的机会是一大利好。

演讲的时候要吐字清楚、抑扬顿挫，不要嗯嗯啊啊的结巴。要清楚什么时候作停顿，如何作停顿。有些讲者太过重视开头，却忘了结尾一样很重要，因为这是听众脑海中最后留下印象的内容。训练开头的同时，同样要多练练结尾。大功告成

寻求对未来演讲有帮助的建设性反馈

toastmaster为大家提供了不同的评估方法，都十分有效。其中最好的一个就是win（英语wonderful，improvement和nice的首字母）公式：首先告诉讲者演讲的某一部分特别好；然后给出一个改善的建议；最后总结时不忘夸赞讲者两句，这能够鼓励演讲者，使其以后有更大的动力。

这种评价打个比方可以是：“玛丽，你开篇的那个小故事相关性很强而且很有力，它让我想要更认真地听你接下去要说的话了，如果你能再具体说说演讲当天如何放松的话就更好了。尽管如此，我还是认为，你针对演讲准备的建议很有帮助，你可以想想你个人经历里喜欢的部分，然后想想可以如何改进。”

如果条件允许，将你的演讲视频或者录音录下来。事后回放音频或视频，找出一些需要改进的地方。

继续与toastmaster国际组织一起锻炼演讲和领导才能

前toastmaster成员、现夏威夷州州长琳达·林格尔将她早期政治生涯里演讲技巧的提升归功于toastmaster。她说，只有在这个组织里，她才有机会在一群志同道合的人面前进行练习，通过一次次的尝试提高自己的演讲和领导力。林格尔州长还说：“我觉得与人交流沟通是十分重要的，而toastmaster就给了我这样一个每周演讲的机会，每一个观众都十分支持我，因为参与的人都有一个共同的目的——互相学习提高。”

拉尔夫·沃尔多·爱默生说过：“演讲就是力量，演讲的目的是说服别人、传递信息、征服思想。”公众演讲力是可以后天习得的，就像学骑自行车一样，也许一开始会摔几跤，但每次的上车就会对于平衡更加熟悉。慢慢的，我们会有无穷的动力，因为发现自己喜欢上了清风吹过秀发的瞬间快感，这离驾轻就熟地骑车也就不远了。同样道理，过不了多久，在演讲的时候你会丰富地运用肢体语言，熟练地对自己的声音进行调整，在演讲内容里也会加上一些小趣事。

谁知道呢？随着演讲技巧的提升，说不定下一次升迁就快到了。参考资料：

音频电子产品篇6

CX20662 和 CX20663分别面向单声道和立体声应用，都采用了科胜讯的专有宽频带回声衰减和降噪数字信号处理器（DSP），有利于捕捉各种语音信号，产生听起来更自然的语音。该技术降低了扬声器至麦克风的“回声”和声音反馈，这对于免提电话和 VoIP 应用尤其重要。这两款高度集成的器件还采用了双集成音频编解码器、可编程麦克风来提升功能，以放大声音、耳机驱动器和 D 类放大器。此外，SPoC 可在没有外部微控制器的条件下运行。这些功能组合降低了物料成本，加快了产品开发周期。

为了改善内部通信应用的音质，CX20662 集成了线回声抑制 DSP，降低了由电话网络或双绞线结构线路引起的回声。科胜讯还提供了内部通信参考设计，以简化产品开发工作。

对于智能手机底座系统，CX20663 能够简单、迅速地从免提电话模式切换到立体音乐播放模式，以实现 MP3 音乐功能。另一个重要特点是科胜讯的 3D 技术，采用专有心理声学相位虚拟算法以“重新配置”声场，为听者创建身临其境的或扩展的“立体声段”音频体验，而不增加实际的音频流量。

音频电子产品篇7

7月13日,由工业和信息化部通信发展司指导,《中国多媒体通信》杂志社、《视频天空网》主办的“2016(第15届)中国国际多媒体视音频通信高峰论坛暨产品展示会”于北京新世纪日航酒店开幕。此次论坛暨产品展示会以“融合创新”为主题,展览内容汇集视音频通信、统一通信、多媒体会议室等多媒体通信领域内的创新技术、新产品、新业务应用等各个层面。

参展企业展出的多媒体通信产品和解决方案受到了业界专家以及行业媒体的瞩目。其中,高清投影机、高标清摄像头、音频处理器、视频会议系统、信号处理系统等新技术和产品,对业界的交流与合作起到了积极推动作用,并与观众进行了有效的信息交流和资源平台的对接。

来源:中国智信网

音频电子产品篇8

“录”和“播”都是声音传播的技术环节, 除录播人员的专业水平外, 良好的硬件支撑同样是好声音的重要保障。市场上的音频设备品牌比比皆是, Sennheiser无疑是其中的佼佼者。从电台节目到户外音乐节, 从体育赛事到文艺汇演, Sennheiser是凭借怎样的魅力渗透到广电各处呢?在BIRTV2014展会上, 森海塞尔电子 (北京) 有限公司市场主管王宇飞先生向本刊记者尽述了“音频专家”如何撑起广电这片天。

十年磨一剑引领音频潮

对影音作品来说, 数据处理、信道传输到终端解码, 环环相扣、缺一不可。要想终端用户听到理想的声音, 从前期录制到后期制作, 每个环节都会对最终的音质产生不同程度的影响。实现完全真实的还原声音, 是所有音频工作者的夙愿。

对此, 森海塞尔本次展会的主打产品——数字9000无线系列可谓出类拔萃。在对本刊记者的介绍中王宇飞先生提到, “Sennheiser用十年时间研发数字无线话筒, 其中的数字9000无线系列, 音质方面可实现无压缩的数字音频传输, 射频方面无互调失真, 并且赢得了2014年美国第29届TEC杰出技术成就奖。自2012年发布至今, Sennheiser旗舰无线产品数字9000系列已被国内许多卫视及大型演出商肯定并采用, 逐渐成为广电、演出等领域无线话筒配备的新标杆。”

随后, 记者询问该系列产品具体都应用到哪些节目或者场合中, 王先生表示:“我们的9000系列产品应用极广。比如在国外, 第56届格莱美颁奖典礼、Lady Antebellum北美巡演、2014年欧洲歌唱大赛等都有使用数字9000系列。在国内, 2013年湖南卫视的《我是歌手》, 在歌王之战中选用了9000系列无线话筒, 而在今年的第二季节目中即全程配备9000系列。正在浙江卫视热播的《中国好声音》第三季, 也选择了9000系列。在演播室之外, 国内的大型音乐节, 如上海爵士音乐节、北京迷笛音乐节, 都在主舞台配备了9000系列。可以说, Sennheiser的数字无线话筒标新立异, 引领了音频前级的数字化新潮流。”

剑指广电业数字新疆界

在广电音频工作流程链中, 在节目制作前端和后端都需要高效、优质的音频解决方案。为满足受众的音质诉求, 从话筒拾音、现场返送、演播室扩声到控制室监听、录音棚配音等一系列的音频相关处理环节都需要优秀的硬件设备支撑。为了制作更优质的节目, 特别对于与声音关联度很高的节目 (如歌唱比赛) , 各大广播电台、文艺活动制作人、节目赞助商等都希望能够配备更好的音频采集、制作、传输、播放设备。

“提起广电行业, 其实是Sennheiser引以为傲的一块。Sennheiser的3000/5000系列无线话筒早已成为了电视台演播室的无线前级标准。只要你打开电视, 绝大多数的电视综艺节目都会选用这款经典的无线话筒。”王宇飞先生如是说。

“而说到广电行业的数字化, Sennheiser在2013年BIRTV展会上就以‘数字新疆界’为主题参展, 而前面提到的数字9000系列无线话筒, 就是这样一款数字产品。没有压扩处理, 声音更加的通透;没有互调失真, 在同一频段内就可以使用更多的通道。我认为, 数字化的意义不仅仅是在‘数字控制’, Sennheiser已经将数字化向音频的制作前端扩展。”

会当凌绝顶优势最大化

目前, 广电行业中已有成熟的音频会议系统、公共广播系统等。Sennheiser也专门打造了“适合任何地点的解决方案”, 以适应多种场合的音频集成, 比如:会议室、演示、导游、办公室、酒店、政府、大学、博物馆等。但市场上很少见到专用于演播室的音频整体解决方案, 集音频拾取、制作、监听、传输、调控于一体, 更加便捷、完备地满足广播电视节目制作的需求。

对于这个问题, 王先生谈到:“在音频工作流中, 森海塞尔在前端和后端都有他的解决方案。前端的无线话筒, 包括各大卫视的综艺节目都会选用的无线前级设备3000/5000无线系列, 适用于流动演出的2000无线系列;播报员常选用的经典的MD441有线话筒。后端有我们代理的K-array音箱, 它外形纤细、具有优秀的便携性、声音能量大, 可以用于演播室的扩声和返听。在录音棚和控制室, 有我们旗下的品牌Neumann, 除了经典的录音话筒外, Neumann KH310三分频音箱品质相当高, 可以当作监听音箱使用。Sennheiser的优势是他的无线射频技术以及对音质的不懈追求, ‘集成’这个概念的话, 我们在一些偏向民用的市场会做相关的产品, 比如会议系统、LSP 500音箱等。广电行业, 我们还是注重把自己的优势最大化。”

“森海塞尔有完整的话筒产品线, 从无线话筒到evolution、MKH有线系列再到Neumann的录音棚话筒, 可以说在任何场合, 只要你需要话筒, 就总有一款Sennheiser的产品适合你。”王先生自豪地谈及森海塞尔的产品。

音频电子产品篇9

音视频中暴力与色情内容的自动分析与检测已然成为近年来研究工作的新鲜热点之一, 而倍受各方广泛关注。尤其在网络发达的今天, 包含过多儿童不宜观看内容的音视频, 如果只是依靠人工审核, 即使耗费大量的人力及财力也难以即时发现不良信息。本文即针对电影中所包含的音频暴力片段进行研究, 提出了基于音频长短时特征与统计特征相融合的组合量特征, 由此而实现了一种基于音频的长短时特征与统计特征融合的暴力内容自动分析系统。

对于什么是暴力, 一直没有给出过权威的定义。目前以Media Eval竞赛为标准的暴力定义[1]是:“身体暴力或事故导致的人体伤害或疼痛。”鉴于视频数据的直观、特征可分性强等优势, 前期暴力检测工作的重点多是关注于视频数据的分析, Chen等就使用了平均运动强度等特征检测了打斗、流血等暴力镜头, 平均识别率达到了85%[2]。Zhang、Chen等则使用了基于内容的HOF特征进行打斗场景的识别, 也取得了86%的识别结果[3]。而基于暴力场景中经常采用特定音频事件来渲染气氛的特点分析, 随之即进一步展开了对基于音频特征暴力场景识别的有关分析与研究。其中, 由于能量熵可以反映短时间内的能量突变, Jeho和Ahmed就将其作为运动强度、火焰特征、流血特征等视频特征的辅助性能来完成基于事件的视频摘要提取工作[4]。为此, Theodoros等即使用了能量、过零率等八种音频特征对固定长度的音频段进行了暴力与非暴力的分类[5], 并且取得了90.5%的识别结果。时下大多数工作也只尝试对一种或少量几种暴力音频事件进行了检测。例如, Huang等使用能量和基频特征对尖叫事件所进行的检测, 最终取得了86%的识别结果[6]。Pikrakis等更使用了MFCC、能量熵、基频等在内的统计特征进行了枪击的检测, 相应地取得了90.6%的识别结果[7]。Penet又使用MFCC、能量等特征, 对枪击和爆炸产生的音响进行了识别, 分别取得了80%和72%的识别结果[8]。

在电影暴力内容的分析工作中, 基本单位多为镜头, 但每个镜头的持续时间却有所不同。因此, 除了镜头内的短时音频特征, 同时更要提取短时音频特征的长时统计特征, 如此才能进一步体现镜头内特征的变化。与其相应地, 本文即提出一种基于音频多尺度时长特征的暴力镜头中音频事件的自动分析与检测技术。

本文的主要结构安排如下:第一部分为基于长时特征以及统计特征的音频特征提取, 对暴力音频事件音频特征进行分析与提取;第二部分即对实验结果进行分析;最后进行总结以及给出对下一步工作的展望。

1 多尺度时长下暴力音频特征的定义与提取方法

电影中的声音对电影信息表达起着至关重要的作用, 尤其是在暴力镜头中, 声音的作用更是突出。若要对音频事件进行有效的识别, 就需要选择合适的特征。大多数音频场景分析通常采用短时特征, 且特征所对应的音频信号单元也多为定长[9,10,11], 如MFCC、短时过零率、LPC等特征都是研究过程的常见选择。

而电影中的镜头构成场景的声学事件多为不定长的音频片段。并且, 由于音频事件差异性较大, 使其持续的时长与特征也有本质不同。例如爆炸声和尖叫声、枪击声在子带能量、频谱质心和过零率等特征上均呈现不同的分布。本文中的长时特征, 即为体现出特征在一段时间内的变化, 可通过计算相应的统计信息而得到, 具体来说包括了子带能量的均值和方差、音频能量的均值和方差、帧间的一阶以及二阶差分等。

1.1 定时长短时音频特征的提取

定时长短时特征, 即通过对音频信息进行预处理、分帧之后提取的每帧的特征, 包括MFCC、基频、LPC、能量熵等。现在将各个特征的提取方式依次给出, 具体内容如下:

(1) MFCC是将人耳听觉感知特性和语音的产生机制相结合而来, 因此将更加接近人们的听觉认知习惯, 已经广泛用于音频信息分析。在此, 可划分26个mel频带, mel系数选取12, 这样本文共提取12维MFCC特征。

(2) 基频体现的是声音的知觉特性, 并且这种知觉特性在人们听闻和理解不同的声响中发挥着重要的作用。对于暴力声音, 如:尖叫、枪击等来说, 其音高均不相同, 因此可以采用音高特征作为本文音频事件的识别特征。

(3) LPC是根据理想的声道模型计算得到的, 为此根据爆炸、枪击和尖叫所发出声音的通道也是不同的, 可应用LPC及其倒谱系数LPCC特征来共同确定暴力音频的声源性质。

(4) 能量熵。能量熵是一帧信号中的能量变化程度。通过将每帧音频信号分为固定长度的K个大小相同的子窗口, 而对于每个子窗口i均要计算其经过标准化的能量σ2, 标准化过程就是将每个子窗口的能量除以整帧信号的能量, 具体计算如公式 (1) 所示。

本文中, K=5, 即每个子窗口长度为5ms, 在这个时间内的信号可定义为是稳定的。

1.2 变时长音频特征的提取

由于音频事件差异性较大, 且持续的时长与特征多有本质不同, 只是单纯提取短时特征即会造成大量信息丢失。因此本文工作中给出了根据暴力音频持续的时间差异, 分析获得不同时间长度内的统计特征, 包括能量谱质心和频谱质心特征、子带能量的均值和方差、音频能量的均值和方差、帧间的一阶及二阶差分等。下面将逐一分列其对应的计算模型, 详情如下。

(1) 能量谱质心和频谱质心特征

频谱质心是功率谱分布的重心位置, 能够作为度量音频亮度的近似指标, 并且不同暴力音频场景 (尖叫、爆炸、枪击) 会有不同音频亮度。因此频谱质心即是一种检测音频事件的有效特征。同时, 不同音频事件的音频信号频谱在其频谱质心周围的分布情况也是不同的。本文计算信号在经过傅里叶变换后将统计前256个频带的μ (μ=1, 2) , 也就是频谱质心和能量谱质心计算如公式 (2) 所示。

相应地, 当μ=1时, 计算可得频谱质心, 当μ=2时, 计算得到的则是能量谱质心。

在本文中, 还将计算语音信号频谱在其频谱质心周围的分布情况, 即频谱散度 (Spectral Spread, SS) , 其计算可见公式 (3) 。

(2) 归一化子带能量的均值和方差

子带的能量可以反映信号的不同声学特性。不失一般性, 本文应用数据的采样率为8k Hz。在此采样率下, 划分了十六个频率子带, 分别为[0-500 Hz], [500-1 000Hz], ..., [7 500-8 000Hz], 统计计算不同暴力音频事件在每个子带能量的均值和方差, 再将相同子带上的能量取均值并归一化, 使得各子带上的能量累加和为1, 从而得到能量在不同子带上的分布。

(3) 能量均值和方差

在不同的电影中, 整体的能量可能偏大或偏小。因此, 为了能够使相应的识别效果具有一定的鲁棒性, 即提取了一个镜头内音频能量的均值和方差。

(4) 帧间差分

通过帧间差分提取一个镜头内的特征的差异程度, 体现镜头内的一个长时的变化, 本文则采用HTK中计算差分的方法, 对文中提取的特征计算其一阶差分和二阶差分。其中, 一阶差分的具体计算公式如下:

式中, ct表示当前帧, Θ取2。

得到一帧信号的一阶差分后, 在一阶差分的基础上再进行一重差分, 就得到信号的二阶差分at, 其计算公式可表述如下。

综上所述, 本文中所提取特征及维数则如表1所示。

2 实验结果及分析

Media Eval 2012 Workshop[1]是目前公开的、较权威的暴力检测竞赛, 该竞赛所使用的视频数据主要选自Hollywood电影。本文即采用Media Eval 2012 Workshop所提供的数据库, 具体可称作VSD (Video Scenes Dataset) 。

数据的预处理, 主要对音频信号进行预加重, 并加汉明窗。本文中数据采用帧长为25ms, 帧移10ms。本文所使用数据库中包含的电影名称以及每个电影中包含特定暴力音频事件的镜头数目统计如表2所示。对于每一种音频事件皆选取4/5的镜头特征作为训练, 剩余的1/5作为测试集。

评测指标采用经典AED (Audio Event Detect) 中获得广泛采用的评价指标, 也就是Precision、Recall、F1, 其计算即如公式 (6) 所示。

其中, β表示Precision和Recall之间的平衡因子, 本文中β=1。

本文主要设计三组实验, 分别针对三种暴力音频事件和正常音频场景的识别、三种暴力音频事件之间的识别以及三种暴力音频事件和正常音频的四类问题。其中分类器采用的则是SVM[12]。

实验一:针对三种暴力音频事件和非暴力音频的识别, 即爆炸和非爆炸, 枪击和非枪击, 尖叫和非尖叫。其中设定了5折实验, 而且分别使用短时特征以及长短时特征的结合来进行实验, 具体识别结果如表3、表4所示。

通过表3, 表4可以看出, 仅仅使用短时特征虽然能够取得较好的结果, 但如果能够加入长时特征, 整体的识别结果仍会得到更为显著的提升。同时, 由上述实验结果也可以看出, Precision普遍较低。这一结果则与选取数据库中的暴力镜头和非暴力镜头的数量差异直接相关。

实验二:主要针对三种暴力音频事件的两两组合间的识别, 以此来验证本文所提取的特征在不同暴力音频事件上的各自识别效果。此处, 只是选取爆炸、枪击和尖叫的镜头进行实验。同样, 本实验也是使用短时特征以及长短时特征的结合而设定了两组实验, 实验结果则如表5、表6所示。

通过表5和表6可以看出, 整体来说爆炸和枪击对尖叫的区分效果较好, 但爆炸和枪击二者的区分却要差上一些。这可能是由二者的特性所导致, 毕竟二者在发声上有较大的近似。只是进一步地, 通过加入长时特征, 就可以将三种暴力音频事件实现有效的区分。

实验三:四类识别。实验数据包括三种暴力音频事件镜头的特征, 以及所有不包含三种音频事件镜头的特征。共四类数据。与上述实验一样, 采用了5折验证, 并且也使用了短时特征以及长短时特征进行实验, 实验结果分别如表7、表8所示。

由表7和表8可知, 在进行多类的识别时, 加入长时特征, 也可以提高实验的识别效果。总体来说, 对于当前所使用的数据库, 加以客观条件所限, 本文取得的结果已是较为理想。而且, 对于处理不定长的音频段, 利用长短时特征的融合, 亦可以有效地提高相应的识别效果。

3 结束语

现阶段对于电影中的暴力检测研究仍属稀少, 而且已有研究基本都采用视频数据进行对暴力镜头的检测。使用音频进行检测仍尚属罕见, 尤其是暴力电影中的音频事件 (爆炸、枪击、尖叫等) 检测。本文使用上述所介绍的音频特征同时对爆炸、枪击、尖叫等三种具有代表性的暴力音频事件进行了检测。取得了较好的结果:最高的为爆炸, 达到了93.3%;最低的为尖叫, 也达到了81%。总体来讲, 本文提取的特征是有效的, 而且能够产生较好的识别结果。大部分的暴力音频检测在较短的音频段进行和实现, 而对电影中以镜头为检测粒度的工作及文献还较少见到, 因此, 对于一个镜头中的音频特征的提取和使用则是后续需要进一步深度研究的工作内容之一。与此同时, 在后续的工作中还要考虑使用其他的分类算法, 以在更大程度上提高研究的识别结果。另一方面, 暴力音频事件的检测更是对电影中暴力镜头检测工作的一部分。因此, 未来应该可以与视频特征相结合进行暴力镜头检测。

摘要：暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征, 由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性, 现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进行检测。为此提出了一种基于多尺度时长的特征提取方法。提取了除MFCC、LPC、能量等短时特征以外, 还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征。暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种。本文以电影的镜头为识别单位, 使用支持向量机分类算法实现了一个检测系统。通过在15部好莱坞电影上的实验, 表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中, 能够取得较好的结果。

关键词：暴力镜头检测,多尺度时长特征,音频事件检测,支持向量机

参考文献

[1]DEMARTY C H, PENET C, GRAVIER G, et al.The mediaeval2012 affect task:violent scenes detection in hollywood movies.MediaEval 2012 Workshop, Pisa, Italy, October 2012:4–5.

[2]CHEN L H, HSU H W, WANG L Y, et al.Violence detection in movies[C]//Computer Graphics, Imaging and Visualization (CGIV) , 2011 Eighth International Conference on.IEEE, 2011:119-124.

[3]CHEN Y, ZHANG L, LIN B, et al.Fighting detection based on optical flow context histogram[C]//Innovations in Bio-inspired Computing and Applications (IBICA) , 2011 Second International Conference on.IEEE, 2011:95-98.

[4]NAM J, TEWFIK A H.Event-driven video abstraction and visualization[J].Multimedia Tools Appl, 2002, 16 (1-2) :55–77.

[5]GIANNAKOPOULOS T, KOSMOPOULOS D, ANDREASARISTIDOU, et al.Violence content classification using audio features[C]//SETN, 2006:502–507.

[6]HUANG Weimin, et al.Scream detection for home applications[C]//Industrial Electronics and Applications (ICIEA) , 2010 the5thIEEE Conference on.IEEE, 2010.

[7]PIKRAKIS, AGGELOS, GIANNAKOPOULOS T, et al.Gunshot detection in audio streams from movies by means of dynamic programming and bayesian networks[C]//Acoustics, Speech and Signal Processing, 2008.ICASSP 2008.IEEE International Conference on.IEEE, 2008.

[8]PENET, CDRIC, et al.Audio event detection in movies using multiple audio words and contextual Bayesian networks[C]//Content-Based Multimedia Indexing (CBMI) , 2013 11thInternational Workshop on.IEEE, 2013.

[9]CHENG W, CHU W, WU J.Semantic context detection based on hierarchical audio models[C]//Proceedings of the 5thACM SIGMM international Workshop on Multimedia in-formation Retrieval, 2003:109–115.

[10]NAM J, ALGHONIEMY M, TEWFIK A H.Audio-visual content-based violent scene characterization[C]//IEEE International Conference on Image Processing, 1998:353–357.

[11]Temko A, Nadeu C, Biel J I.Acoustic event detection:SVMbased system and evaluation setup in CLEAR’07[M].Multimodal Technologies for Perception of Humans.Springer Berlin Heidelberg, 2008:354-363.

音频电子产品篇10

关键词：音频指纹,压缩域音频,音频识别,鲁棒性

随着多媒体信息量的急剧增加, 如何从一个音频数据库中快速而准确的查找到自己所需要的音频文件已经变得越来越困难。当前主流的基于关键信息的音频索引方式要求查找者事先知晓待查音频的至少某一项关键信息 (如作者、文件名称、关键词等) [1], 并且检索结果一般不唯一, 还需要人工进行二次筛选。因此, 国内外学者于20世纪末开始研究基于音频指纹的音频自动识别理论和技术。音频指纹是指可以代表一段音频重要声学特征的基于内容的紧致数字签名, 其主要目的是建立一种有效机制来比较两个音频数据的感知听觉质量[2]。

在众多的音频指纹识别方案中, Philips算法[3]当属经典, 随后出现的音频指纹算法绝大多数都是基于Philips算法的改进方案。但是这类算法一般针对wav格式的音频进行研究, 不符合当前大多数音频文件都以压缩格式 (如MP3格式) 进行存储和传输的现状。所以, 直接从压缩域音频提取指纹已经成为了研究音频识别技术一个新的热点。压缩域音频指纹是指从经过有损压缩后的音频文件 (如MP3和AAC) 中直接提取指纹, 其过程并不对压缩域音频文件进行完全解码。目前压缩域音频指纹算法主要集中于选用从MP3解码得到的MDCT (Modified Discrete Cosine Transform, 修正离散余弦变换) 频谱系数来计算指纹。根据对现有压缩域音频指纹算法的总结, 仅有数十篇文献对其进行研究, 主要分为以下两类。文献[4, 5]首先由MDCT系数来计算MFCC系数, 从而根据MFCC系数的统计特征来获得指纹。文献[6, 7]把从若干帧MP3解码出来的MDCT系数作为一个块, 接着按照某种刻度将每个MDCT块划分为多个子带, 根据子带能量来计算每个块的子带能量期望或者子带能量熵, 最后由相邻块的期望差或熵差来定义指纹。虽然大部分上述指纹方案均取得了很好的正确识别率, 但是它们对指纹算法的鲁棒性测试均不够。且算法[6,7]在应对随机剪切带来的音频片段边界不对齐的问题时效果较差, 即使用于比较的两个音频片段具有相同的听觉内容。

提出了一种基于MDCT频谱的对数带能量的压缩域音频指纹算法。相比于其它同类算法, 该算法的指纹尺寸更小, 识别率更高, 鲁棒性更好。

1 压缩域音频指纹算法

MP3格式由于其在压缩率和音质两方面具有很好的平衡性, 它已成为了绝对主流的音频压缩格式。本文选择MP3音频文件作为研究和实验的对象, 由于MP3编解码的理论和技术都比较成熟, 且MP3编解码过程不是本文的研究重点, 因此在这里不对MP3的编解码步骤进行叙述。本文算法也选用MDCT频谱来计算指纹, 对于MP3编码和解码过程中得到MDCT频谱的具体流程, 可以根据文献[8]来实现。并将从得到MDCT频谱后开始介绍压缩域音频指纹算法, 其详细过程如图1所示。

把从10帧MP3解码出来的MDCT系数作为一个MDCT块, 相邻块之间有95%的重叠。由于一帧MP3包含两个节, 即相邻块之间具有一个节的跳距。从一个MDCT块, 能提取出一个长为24 bit的子指纹。一个子指纹一般不足以用于识别出相应的完整的音频, 所以把208个子指纹组成一个指纹块, 称之为查询指纹块, 它可以用于进行有效地音频识别。采用此指纹计算策略的结果是从一个长约0.26 s的MDCT块提取一个子指纹, 而相邻块的差距仅为13.06 ms。这样在识别过程中, 使用的查询指纹块与事先存储在数据库中的指纹块的边界不对称的最大误差为6.53 ms。也就是说大的重叠, 可以确保即使在最坏的情况下, 待识别的音频片段的绝大多数子指纹仍然和数据库中相同片段的子指纹是非常相似的。从而可以确保算法具有较高的正确识别率。实验中选择的MP3格式的音频信号的属性为:44.1 k Hz采样率、1 141 kbps码率, 则一个查询指纹块对应的音频片段的长度约为3 s, 即只需要一段长为3 s的未知音频片段即可识别出完整的音频, 因此该算法的指纹粒度为3 s, 指纹尺寸为4 992bits (=208×24) 。参见图1, 压缩域音频指纹算法的具体实现步骤如下

(1) 在得到MDCT系数后, 首先用式 (1) 对其进行预加重处理, 以提高MDCT频谱能量的信噪比;

(2) 对MDCT系数进行重叠分块。

(3) 由于对数刻度能够很好地反应人耳对声音频率高低的听觉特性[3], 在300 Hz~fs频率范围 (与指纹识别算法最相关的频率范围) 内按照对数刻度把每节MDCT块划分成25个子带, 这样可以确保提取出的指纹与听觉内容具有很大的相关性。

(4) 计算同一块内的具有相同子带序号的能量和:如果用SEN (i, j) 来表示MDCT频域的第i块第j个子带的能量;s (m, n) 表示第m个节中的第n个MDCT系数;MDCTi和MDCTj分别表示属于某个子带的MDCT系数索引的上下界限, 因此第i块第j个子带的MDCT谱能量可依式 (2) 来计算。

(5) 其实指纹序列是一组二进制比特流, 按式 (3) 对音频指纹的每个比特进行定义。

2 算法测试

2.1 有效性

首先来测试指纹算法是否能主要根据听觉内容来进行音频识别, 且不考虑音频文件的格式 (压缩域或者非压缩域) 。在Method Man的“All I Need”歌曲中节选一段长为3 s的音频片段 (32 Kbps@MP3格式) , 并且选择其相应的wav格式的版本, 两个片段的采样率均为44.1 k Hz, 根据这两个具有相同听觉内容的音频片段来观察该算法在指纹相似性方面的性能。用第2节所述的指纹算法计算二者的音频指纹 (一个含有208个子指纹的指纹块) 分别见图2 (a) 和图2 (b) 。在图2中, 黑点代表“1”, 白点代表“0”。图2 (c) 中的黑点即反应了指纹图2 (a) 和图2 (b) 的差距。为了测试不同音频片段的指纹之间的相似性, 也可以称之为指纹间的区分性, 图2 (d) 示出了Oasis的“Live Forever”歌曲 (MP3格式, 采样率44.1 k Hz, 码率为32 Kbps) 中一段长为3s的音频片段的指纹图。图2 (e) 中的黑点表示了指纹图2 (a) 和图2 (d) 的误码位置。

从图2 (c) 中比较少的黑点数量 (实为1 171点) 可知, 即使音频格式不同 (原始音频为wav格

(a) :“All I Need”32 Kbps@MP3版本的指纹图; (b) :“All I Need”的wav格式的指纹图; (c) : (a) 与 (b) 的误码图; (d) :“Live Forever”32 Kbps@MP3版本的指纹图; (e) : (a) 和 (d) 的误码图

式, 另一个为MP3格式) , 指纹算法从相同听觉内容中提取出的指纹仍然具有很大的相似性, 即算法可适用于压缩域音频和非压缩域音频的指纹在同一个指纹数据库中进行有效检索。从图2 (e) 中许多杂乱的黑点 (实为2 339点) 可知, 对于不同听觉内容的音频, 其指纹之间的汉明距离相当大。因此, 指纹算法能很好的根据听觉内容来判定两个音频片段的相似程度。

2.2 误码率阈值

选择误码率 (bit error rate, BER) 用于度量两个音频片段的相似程度。假设用于比较的两个指纹片段的长度分别为N1、N2 (设N1≤N2) , 指纹间的汉明距离为M, 则BER可以定义如下

通过多次指纹相似性测试实验得到BER阈值λ=0.355, 即当BER<0.355时, 就认为两个音频片段的内容相似;反之当BER>0.355时, 可以判定两段音频的内容不相同。计算图2 (c) 和图2 (e) 中的误码率分别0.234 6和0.468 5, 与3.1节的实验结论一致。对于可靠的音频指纹识别系统, 要求不同听觉内容的音频片段对应的指纹之间的BER应该大于判决阈值, 这就要求误码率阈值不仅能衡量指纹之间的相似性, 还要能体现出良好的区分性。通过如下实验来测试误码率阈值对不同听觉内容的区分能力:实验样本为随机选择的1 000个不同的长约为3秒的音频片段 (MP3或wav格式, 立体声, 16bit量化, 44.1 k Hz采样率) , 这些音频片段涵盖了民谣、轻音乐、摇滚、DJ、电子、嘻哈、乡村、布鲁斯、爵士、古典等10种不同的音乐类型。使用本文算法计算每个音频片段的指纹 (一个查询指纹块大小, 208×24=4 992比特) , 再对这1 000个指纹块互相之间进行两两对比, 计算出所有的BER, 则总共可以得到499 500 (=999+998+…+1) 个BER数据, 最后对这499 500个BER数据做分布图, 结果如图3所示。同时, 采用相同的实验样本, 分析文献[6]和文献[9]中的压缩域音频指纹算法的BER分布。在图3中, 横轴为BER的值, 纵轴为具有相同BER值的指纹的个数, 它们的和为499 500。

从图3中可看出BER近似于呈正态分布, 这是因为不同感知内容的音频之间其指纹分布规律是随机的。理论上所有的BER数据应该在0.5两边完全对称, 图3中所示的异常情况是由于BER的统计数据并不是足够多。本文算法所产生的全部BER数据的均值为0.499、方差为0.030 3;在文献[6]的算法中, 这一结果分别为0.501 2和0.030 7。在文献[9]中, 这一结果更糟, 仅有0.501 8和0.031 9。这意味着根据本文的算法, 从不同音频内容所生成的音频指纹之间具有更好的区分性。此外, 本文算法的BER数据中没有出现BER<0.35, 由此可知本文的指纹提取算法能很好地很据听觉内容对音频片段的相似程度做出正确的判断。

2.3 鲁棒性

这里仍然采用3.2节所述的实验样本。对每个音频片段按照如下11种方式进行时频域失真处理:回声 (延迟0.5 s) 、白噪声 (+10 d B) 、带通滤波 (截止频率100 Hz~5 000 Hz) 、MP3 32 kbps编码、MP3128 kbps编码、偏移 (+0.2) 、均衡器 (+1.0 d B) 、音量 (±1.5 d B) 、音调 (±3%) 、频谱滤波 (+1.0 d B) 、线性速度变化 (linear speed change, LSC±3%) 。对这1 000个原始音频片段与它们的失真处理版本进行指纹提取, 再计算每个原始音频的指纹与每种失真版本的指纹之间的BER。对于每一种失真, 都可以得到1 000个BER数据, 把这1 000个BER数据的平均值以及正确识别率 (1 000个BER值中低于误码率阈值的比例) 作为本文算法对该失真的鲁棒性结果, 可以得到如表1所示的鲁棒性测试结果。此外, 采用文献[6]和文献[9]中的指纹算法做相同的鲁棒性测试。

由表1可知, 本文的指纹算法对于常见的时频域失真处理均具有非常好的鲁棒性, 除了+10 d B白噪声处理外, 正确识别率均大于90%, 在实际应用中, 这是一个可以接受的结果。算法对白噪声的鲁棒性效果较差的原因在于:实验样本中的1 000个音频片段是随机截取的, 部分片段可能会含有较多的低音 (声音幅值较小) 信号, 白噪声会将这些低音部分淹没, 以致于这些片段在加入白噪声前后, 其指纹出现了较大的差异, 造成了正确识别率稍微偏低。但是白噪声处理所对应的BER平均值却不是最大的, 这说明对于不含有太多低音信号成分的音频片段, 指纹算法具有很好的鲁棒性。根据表1, 本文算法的鲁棒性强于文献[6]和文献[9], 尤其是对于抵抗LSC和音调变化。这是由于文献[6]和文献[9]中的算法是从更长的时间 (算法[6]为0.130 6 s, 算法[9]为0.095 8 s, 而本文为0.014 1 s) 中提取1比特指纹, 这将导致它们在应付音频数据线性移位方面的能力降低。进一步的实验还表明, 对超过±4.8%范围的LSC处理, 本文算法会失去鲁棒性。

3 结论

提出了一种基于音频指纹的压缩域音频识别方法, 它能实现压缩域音频和非压缩域音频的指纹在同一个指纹数据库进行有效检索。算法对约0.26 s内容提取24比特的子指纹, 相比于指纹尺寸同为3 s的类Philips算法 (8 192 bit=256×32) , 其指纹尺寸 (4 992 bit) 大大减小, 这可以缩短指纹的比较时间, 提高检索效率。实验表明, 算法对各种常见的时频域失真处理都具有较好的鲁棒性, 尤其是它能应对±4.8%以内的线性速度变化, 这对于商业应用 (例如广告和广播) 中常见的音频加速播放具有很好的识别效果。此外, 算法的多项特性均优于现有的压缩域音频指纹算法。本文后续工作的重点将围绕在大型指纹数据库中进行指纹的快速索引和匹配而展开。

参考文献

[1] Stephen A, Natalie L, Erica B, et al.Recognition of elderly speech and voice-drivendocument retrieval.Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing.Phoenix, USA, 1999:145—148

[2] 李伟, 李晓强, 陈芳, 等.数字音频指纹技术综述.小型微型计算机系统, 2008;29 (11) :2124—2130Li Wei, Li Xiaoqian, Chen Fan, et al.Review of digital audio fingerprjnting.Journal of Chinese Computer Systems, 2008;29 (11) :2124—2130

[3] Haitsma J, Kalker T.A highly robust audio fingerprinting system.Proceedings of the Intemational Symposium on Music Information Retrieval.Paris, France, 2002:107—115

[4] Saenz-Lecho N, Osma-Ruiz V, Godino-Llorente J I, et al.Effects of audio compression in automatic detection of voice pathologies.IEEE Transactions on Biomedical Engineering, 2008;55 (12) :2831—2835

[5] Liu Chih-Chin, Chang Po-Feng.An efficient audio fingerprint design for MP3 music.Proceedings of the 9th International Conference on Advances in Mobile Multimedia, Hue City, Vietnam, 2011:190 —193

[6] Wu Liming, Han Wei, Deng Yaohua, et al.A compression-domain audio fingerprint technique based on the mathematical expectation of MDCT spectrum.International Journal of Advancements in Computing Technology, 2013;5 (9) :291—298

[7] Zhou Ruili, Zhu Yuesheng.A robust audio fingerprinting algorithm in MP3 compressed domain.World Academy of Science, Engineering and Technology, 2011;55:715—719

[8] International Organization for Standardization.ISO/IEC 11172—3, 1993

音频接口设计篇11

当今各式各样的音频设备层出不穷, 附有外部扬声器音频功能的便携设备日趋增多, 它们的输出根据配置和驱动的不同而各异。以往通用的音频接口已经远远不能满足需要, 所以急于设计出一个新的音频接口电路已满足不同设备, 下面将对于传统接口进行分析, 以及新的音频电路设计的必要性及优点。

2. 音频接口的种类

根据输出的不同, 我们可以区分音频为:单端信号、差分信号。

例如MP3播放器或手机的输出是单端信号, 适合驱动32Ω的听筒扬声器。典型外置扬声器系统的扬声器阻抗是4至8Ω, 每个声道可能会有多个扬声器。然而32Ω的驱动器难以驱动这些低阻抗扬声器, 也就无法提供足够的音量。

外部扬声器系统因品质、音量及扬声器数目的不同而有所区别, 因此通用的放大器将不适于驱动这些扬声器。如MP3播放器的扬声器系统具有耳机插孔输入端, 并能支持单端输出的立体声信号。某些新型高端扬声器系统可支持差分信号, 为了后向兼容, 这些系统也支持单端信号。

由于差分信号是单端信号的两倍, 因而单端信号和差分信号将产生不同的音量。人的听力和声音大小的关系符合对数曲线规律, 因此就不能采用线性的控制方式 (图1) 。

对于将输入信号放大为相等输出的单端/差分音频放大器来说, 有几种方法可以对其进行检测和实现。系统之间的接口连接器应至少有5个引脚才能提供差分信号。两个器件之间的共地连接是必须的。乍看起来, 由于信号是直流隔离的, 因而交流耦合电容无需与地连接, 但实际上这是提供理想噪声性能的需要。

3. 检测输入信号方法

在诸多电路中, 有两种电路用连接器的一个外部引脚来测试输入信号的直流电平。

一、指定连接器的一个外部引脚很容易, 但对于空间狭小的应用来说却不可行。源器件既能使该引脚开路也能使该器件接地。

二、是利用比较器来测试信号的直流电平, 看后者是接地的还是差分信号。

以上两种方法的输入信号都必须通过低通滤波器。原始信号必须分离为其直流电平的50%至25%, 如果系统在低频、高峰峰值交流信号的差分模式下, 这将导致错误的检测结果 (图2) 。若原始信号的直流电平是地电平的话, 这种技术也不能使用。

4. 电路设计

音频电路除上述检测电路外还有第二个部分是音频放大器。该电路的解决方案和所需的声音质量有关。真正的差分输入比进入一个放大器的差分信号能提供更高的声音质量, 实际的差分放大器需要一个附加电路将单端信号转换为差分输入。

对音频放大器来说最简单的办法是将信号输入到一个放大器中 (图3) 。在单端模式下, 该差分输入不产生信号, 允许不经转换的输入设置于0.5Vcc上, 这就是标准的单端输入配置。模拟开关保持在断开状态, 以使放大器输出2倍的增益。在差分模式下, 模拟开关闭合, 增益变为1。因此对不同的输入模式, 这两种输入信号都会产生相同的输出信号幅度。

第二种实现方法是采用真正的差分放大器来驱动扬声器。这种放大器可提供较好的噪声抑止。与上一方法不同, 此时输入音频放大器的信号必须是差分信号。差分信号可利用运算放大器或变压器来实现。

运算放大器的实现方法有利于系统的尺寸, 但对平衡输入信号则存在困难 (图4) 。该运算放大器的增益为-1, 以将单端输入信号变成反向信号。模拟开关在输入之间转换以实现音频放大器的输入。这种差分信号可以直接送入音频放大器中。 (下转第193页) (上接第191页)

替代运算放大器产生差分信号的另一个方法是采用1:1的变压器。该变压器可简化电路 (图5) , 但增加了尺寸, 特别是高度。需要注意的是, 变压器的频率范围必须在系统能够放大的音频信号范围之内。原始的输入信号必须采用交流旁路电容来使直流与地隔离。模拟开关可用来使该放大器的增益在2倍 (单端输入) 和1倍 (差分输入) 之间进行转换。

5. 音量控制

利用标准单向电位器通过几种方法可以实现对音量的控制。如前面所述, 旋转旋纽时, 具有对数特性的电位器才能产生平滑的音量控制。该电位器可以对电路进行计数, 从而产生线性的响应。对于差分输入, 单声道系统需要2个电位器, 而立体声系统则需要4个电位器。

最简单的方法是在电位器中的输入音频信号和地之间放置一个电阻, 滑动端与音频放大器的输入相连接。滑动端的输出与输入信号成比例。如果音频放大器需要大电流输入, 则将影响音频放大器的输入电阻比例, 因而不会产生期望的增益。当电容与电位器阻抗相关时, 会出现其它问题, 很可能产生旁路滤波器 (在电位器中滤掉某些频率的信号) 。

另一个解决方案是在电位器的滑动端增加一个运算放大器 (图6) 。对于输入端该电路呈现的是电位器的静态阻抗。运算放大器直接驱动音频放大器, 因而消除了增益的不同。对该电路来说, 由于音频放大器无法真正实现满幅 (rail-to-rai) 输出, 因此电位器不能通过接地来消除输出信号的噪声。

6. 结束语

音频接口设计是个比较复杂的设计, 不仅仅需要考虑信号的通用性, 而且还需要考虑其通用性。设计者对于传统各种音频设计需要有较深的了解, 然后综合这些众多音频设计, 总结优缺点, 从而设计出满足人们需要的, 通用性强的音频设计。

摘要：随着人们物质生活的提高, 各式各样的音频设备大量的进入到我们的生活中, 传统音频接口简单, 通用性较弱。随着不同设备的配置驱动的不同, 通用音频接口越来越值得关注。本文将讨论音频接口是现代通用化音频接口中重点考虑的问题。

关键词：音频,单端信号,差分信号

参考文献

[1]《电子工程专辑》, 2008

【音频电子产品】推荐阅读：

音频信号07-20

音频管理06-08

音频技巧06-19

网络音频10-09