语音信号的采样与分析

2024-11-12

语音信号的采样与分析(通用7篇)

语音信号的采样与分析 篇1

0 引言

连续信号的数据采样遵循采样定律[1,2],满足ws≥2wm,其中ws为采样频率,wm为被测信号的上限截止频率。但在实际操作中,由于被测信号的复杂性和其他因素的限制,合理选取采样频率会存在一定的困难,由此产生的误差不易发现。本文利用MATLAB软件[3,4]仿真平台再现了采样信号与频谱,分析了两者关系,以此探讨影响采样周期的因素以及信号重构的可行性。

1 信号采样与信号重构

1. 1 信号采样

理想信号采样器可以看成是一个载波为理想单位脉冲序列δT( t) 的幅值调制器,即理想采样器的输出信号e*( t) 是连续输入信号e( t) 调制在载波δT( t) 上的结果[5]。

用数学表达式描述理想采样器调制过程,则有e*( t) = e( t) δT( t) ,理想单位脉冲序列δT( t) 可以表示为:

式中,δ( t - n T) 是出现在时刻t = n T、强度为1的单位脉冲。由于e( t) 的数值仅在采样瞬时才有意义,同时,假设e( t) =0t <0,所以e#*( t) 又可表示为:

1. 2 信号重构

设信号f( t) 被采样后形成的采样信号为fs( t) ,信号的重构是指由fs( t) 经过内插处理后,恢复出原来信号f( t) 的过程。若设f( t) 是带限信号,带宽为ωm,经采样后 的频谱为Fs( jω) 。设采样频 率ωs≥2ωm,现选取一个频率特性为:

ωs

( 式中截止频率ωc满足ωm≤ωc≤ωs/2的理想低通滤波器与Fs( jω) 相乘,得到的频谱即为原信号的频谱F( jω) 。

显然,F( jω) = Fs( jω) H( jω) ,与之对应的时域表达式为:

将h( t) 及fs( t) 代入得:

上式为f( n Ts) 求解f( t) 的表达式。

通过分析,得到时域采样定理: 一个带宽为ωm的带限信号f( t) ,可唯一地由它的均匀取样信号fs( nts) 确定,其中,取样间隔ts< π / ωm,该取样间隔又称为奈奎斯特间隔。根据时域卷积定理,求出信号重构的数学表达式为:

式中的抽样函数Sa( wct) 起着内插函数的作用,信号的恢复可以视为将抽样函数进行不同时刻移位后加权求和的结果,其加权的权值为采样信号在相应时刻的定义值。利用MATLAB的抽样函数sinc( t) =sin( πt)/πt来表示Sa( t) ,有Sa( t) = sinc(t/π) ,于是,信号重构的内插公式也可表示为[6,7]:

2 仿真与分析

连续信号是指自变量的取值范围是连续的,且对于一切自变量的取值,除了有若干个不连续点以外,信号都有确定的值与之对应。MATLAB并不能处理连续信号,而是用等时间间隔点的样值来近似表示连续信号。当取样时间间隔足够小时,这些离散的样值就能较好地近似连续信号。时域对连续时间信号进行采样,是给它乘以一个采样脉冲序列,就可以得到采样点上的样本值,信号被采样前后在频域的变化,可以通过时域频域的对应关系分别求得采样信号的频谱[8]。

2. 1 Sa( t) 的临界采样及重构

当采样频率小于一个连续的同信号最大频率的2倍,即ws= 2ωm时,称为临界采样。修改门信号宽度和采样周期等参数,得到的采样信号时域和频域特性,以及重构信号与误差信号 的变化,如图1所示。

为了比较由采样信号恢复后的信号与原信号的误差,可以计算出2个信号的绝对误差。当t选取的数据越大,起止的宽度越大。

2. 2 Sa( t) 的过采样及重构分析

当采样频率大于一个连续的同信号最大频率的2倍,即ws> 2ωm时,称为过采样。在不同采样频率的条件下,观察对应采样信号的时域和频域特性,以及重构信号与误差信号的变化,如图2所示。

从图2可看出将原始信号分别修改为抽样函数Sa( t) 、正弦信号sin( 20 * π* t) + cos( 20 * π* t) 、指数信号e - 2tu( t) 时,在不同采样频率的条件下,可以观察到对应采样信号的时域和频域特性,以及重构信号与误差信号的变化[9]。

2. 3 Sa( t) 的欠采样及重构分析

当采样频率小于一个连续的同信号最大频率的2倍,即ws< 2ωm时,称为过采样。利用频域滤波的方法修改实验中的部分程序,完成对采样信号的重构,结果如图3所示。

通过图3可以看出,绝对误差error已大为增加,其原因是因采样信号的频谱混叠,使得在|ω| <ωc区域内的频谱相互“干扰”所致。

3 结束语

利用MATLAB所生成的临界采样、过采样和欠采样3种状态下的采样信号、重构信号及两信号的绝对误差图,可以直观地看到在不同采样频率的条件下,对应采样信号的时域、频域特性以及重构信号与误差信号也随之产生变化,一个连续时间信号完全可以用该信号在等时间间隔上的瞬时值来表示[10],并且可以用这些样本值把信号完全恢复过来。

语音信号的采样与分析 篇2

1 语音信号的采集

课题使用麦克风录取声音, 通过声卡转换器进行格式转换, 然后得到MATLAB环境下的.wav文件。在MATLAB环境下对原始语音信号进行了抽样, 并在时域和频域进行了对比, 结果如图1所示。

2语音信号的分析

语音信号幅度值的变化一般用短时能量显示, 鉴于短时能量对高电平非常敏感, 可以采用短时平均幅度用来表征语音信号能量大小, 结果如图2所示。两者的主要区别在于计算时取样值的大小不同, 但这些参数在处理时对取样值都做平方处理, 在一些应用上可能会带来一些好处。图3为语音信号的语谱图。

3 语音信号的加噪和滤波处理

图4为原始和加噪之后信号波形和频谱对比, 从图中可以看到, 加了噪声之后的信号, 频谱明显发生了变化, 幅值明显增大。通过sound函数可以听到明显的杂音, 通过调整加噪声的幅度值倍数大小可以改变原始语音和噪声的比例, 实现各种效果的加噪。图5和图6为分别设计FIR和IIR滤波器对加噪后的信号进行滤波分析的比较。在FIR滤波中, 滤波后的波形与加噪之前的很接近, 语音信号变化不大, 但仍存在杂音;在IIR低通滤波中, 可听辨出明显不同的滤波效果, 较FIR低通的音质效果明显提高, 杂音减少。

4 语音信号的处理和GUI界面的设计

回声和添加背景音乐语音特效的处理结果如图7和图8所示, 处理前后信号发生明显变化, 通过sound函数可以感受不一样的听觉效果。综合以上, 课题设计了GUI人机交互界面操作平台, 如图9, 可以方便地实现对语音信号的采集分析和处理。

5 结语

课题基于MATLAB完成了对语音信号的仿真和处理, 在时频域方面进行了分析, 通过人为添加噪声和滤波进行分析, 通过DSP技术进行了特殊效果处理, 最后设计了GUI界面对语音信号的各模块处理功能进行了集成。

摘要:基于MATLAB平台对语音信号进行了仿真与处理, 包括对语音信号的录取和导入, 信号时域和频域方面的分析, 添加噪声前后的差异对比, 滤波分析, 语音特效处理。最后基于GUI技术完成了系统界面平台的设计。

关键词:GUI,语音信号处理,滤波,加噪

参考文献

[1]陈怀琛.数字信号处理教程—MATLAB释义与实现[M].北京:电子工业出版社, 2003.

[2]刘敏, 魏玲.MATLAB通信仿真与应用[M].北京:国防工业出版社, 2001.

[3]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社, 2000.

语音信号的采样与分析 篇3

1 实验原理及说明

频谱变换电路是现代通信中最为重要的电路之一, 同样这种电路也是最基本的电路之一。现代通信技术在不断的发展, 国家的相关部门又不断的提出我们要降低通讯成本, 降低能耗, 建设资源节约型社会。为了应对这种发展趋势, 我们进行的电路设计已经摒弃了原来的一条线路只能传输一条信号的的设计方案, 那样的方案应用率太低, 成本很高。我们现在设计的电路需要实现各个语言信号的整合, 使其可以通过提条线路进行传输, 但是又不能产生干扰现象, 这就要求我们所设计的电路。

调制解调过程就是将低频信号搬移到高频段或从高频段搬移到低频段的过程。所谓的振幅调制, 就是要实现低频调制信号对于高频震荡的幅度进行有效的控制, 使高频震荡信号通过低频信号反应出来;解调的过程比较简单, 他就是将低频信号从调幅波中取出。可以进行调幅与解调的方式有很多, 随着计算机的高速发展和软件的不断进步, 现在的仿真电路种类很多, 但是就现阶段而言, Multisim仿真软件的市场份额还是存在其绝对优势的。Multisim仿真软件在多路语音信号调制与解调实验中的过程比较简单, 该软件的调幅功能的实现借助了集成乘法器, 而对于检波功能我们通过二极管实现的, 在具体的实验过程中, 我们把实验电路进行了有效的模块分类, 实现了多路语言的调制和解调, 具体设计如 (图1) 所示:

2 实验电路的确定及仿真结果

实验原理中我们可以清楚的看到, Multisim仿真软件中的仿真窗口中的是设计多路电路的关键所在, 我们必须在这些窗口中创立创建和设计多条语音信号的调制和解调电路, 只有这样才能是吸纳多条实验电路公用一条通道的设想。在此过程中, 我们要注意电阻、电容这些最为基本的电路元件需要从系统的原器件库中进行统一的调用;而电路中的语音信号和被加直流电压以及载波信号的来源我们通常借助电源信号库来实现;我们系统中的的控制件器库可以为我们提供电路设计中所需要的集成加法器和集成乘法器。这是我们整体的仿真系统中各个器件的来源和设计方式, 最后我们按照试验线路中的但参数对试验器件的电参数进行设置就可以了。

2.1 多路语音信号调制部分

我们所设计的多路信号调制电路中主要部分由:乘法电路、加法电路、多路加法电路、滤波电路和直流叠加电路等等。打开系统进入仿真界面, 我们可以观察到每个单元必须在输出端连接双踪示波器, 之后打开我们系统的仿真开关, 这时系统开始工作并进入仿真状态, 对电路的实际工作进行模拟演示, 我们可以通过观察示波器的输出信号, 从而得出调制部分各个单元电路的电压波形, 当然这个波形反应的是输出电压的情况。

2.2 多路语音信号解调部分

相对于调制电路而言, 解调电路的复杂程度要简单一些, 在Multisim仿真软件的工作系统中带通滤波电路、低通滤波电路、检波电路、多路加法电路共同组成了Multisim仿真软件的各端仿真波形多路语音信号解调电路。同我们的调制部分相似, 把双踪示波器和各个单元的电路输出端进行连接以后, 我们就可以打开模拟开关了, 这时我们的仿真系统便开始工作, 我们同样需要观察示波器反应出的波形, 这个波形就是调制部分各单元电路的输出电压波形这就是Multisim仿真软件的多路语音信号解调部分。

3 结语

本文针对Multisim仿真软件在多路语音信号调制与解调实验的原理和具体步骤进行了一系列的分析, 可以看出该软件的设计比较合理, 操作相对而言比较简单, 而且该仿真系统所反应的实验结果具有很高的实际价值, 在此类实验电路的模拟检测中有很重要的意义。另外, Multisim仿真软件对于其他的电路模拟分析也有着很大的优势, 在实际的应用中受到了大家的青睐。

参考文献

[1]黄智伟.基于Multisim2001的电子电路计算机仿真设计与分析[M].北京:电子工业出版社, 2004.1.

一种激光信号采样保持电路分析 篇4

1 设计过程

1.1 技术指标

技术指标如表1所示,VCC=15.0±0.2 V,VEE=-15.0±0.2 V;输入脉冲信号Vin;脉宽为30 ns;上升沿为5~15 ns;幅度为0.6~5 V;频率为100 Hz。

注:A组分组中1、2、3分别表示+25 ℃、+125 ℃、-55 ℃下静态试验;4、5、6分别表示+25 ℃、+125 ℃、-55 ℃下动态试验。

1.2 外形结构

外形结构如图1所示。

本产品是将脉宽30 ns、上升沿5~15 ns、幅度0.6~5 V、频率100 Hz的激光脉冲信号进行采样处理,实现正峰值保持功能。其设计思路遵循可靠、实用的原则,在满足用户性能指标的前提下,集中保证产品的高可靠本质,并针对模块处理的高速激光信号,设计思路以线路简洁、器件反应速度快为目标。

1.3 确立方案

采样保持电路如图2所示。

1.4 确定线路

通过仿真手段在用户的协助下确定线路图。

(1)传统的正峰值采样保持电路。

图3所示为传统的正峰值采样保持电路,由于受仿真模型的限制,仿真使用MAX4182运放模型和1N914二极管模型,输入信号采用脉宽为200 μs的脉冲进行仿真。

如图3所示,输出与输入差异较小,即正峰值保持基本未得到有效的实现,根据技术要求,在用户的协助下文中增加了一级闭环回路给电容充放电来实现正峰值保持指标。

(2)改进型正峰值采样保持电路,如图4所示。

图4中用SW1模拟开关控制节点V51状态,改变VOUT输出,SW1闭合,V51接GND,若VOUT输出幅值低于0.7 V的窄脉冲,则SW1断开,V51悬空,其输出幅值为2.7 V窄脉冲的整流保持。如图4所示,增加一级闭环回路给电容充放电有效解决了正峰值保持问题。

1.5 元器件的选取

通过仿真确定了基本线路,针对输入激光信号的需求选择高速响应的元器件进行试验。图4中关键元件是运放MAX4182和二极管1N914,必须寻找高速运放和高速二极管才能满足输入激光信号的要求[2]。

第一次试验中运放选用OP27、高速三极管,试验结果显示:(1)捕获的波形发生畸变,上升沿很差。(2)峰保功能输出幅值变化大。与用户沟通后,在用户的建议下高速运放选用AD810,高速采样选用2EK80B型砷化镓二极管,结果表明,基本功能已实现,但电压跌落率指标差,经分析发现由于AD810的输入偏置电流较大,造成充放电电容C5的保持电荷泄放快,从而导致电压跌落率指标差。将C5改为阻容并联网络来改善电压跌落率。

仿真线路中的控制开关选用高速开关AD201HS来控制电容C5的充放电。开关的输入信号接地,控制信号为逻辑“0”时,开关打开,峰值保持电路正常工作;反之,当开关的控制信号为逻辑“1”时,开关闭合,将C5直接短接至地,瞬间放电,峰值保持电路不工作。电路原理图如图5所示。

其工作过程如下:第一级AD810高速运放U1处理的结果,通过ADG201HS高速开关U6直接送至U2和U3组成的正峰值检出保持电路,再经U4、U5、D3、D4组成的闭环回路送至C5,通过C5的充放电实现峰值保持功能。

2 可靠性要求

采样保持电路应用于激光报警设备,对可靠性有一定的要求,所以可靠性贯穿于整个设计过程。

(1)从器件选择上进行优化:

采用裸芯片的集成电路、二极管、稳压管、指定厂家电容、厚膜印刷电阻、96 %的Al2O3基片。

(2)平面布局和结构设计:

根据线路特点及外形尺寸要求,采用28线全金属平行缝焊结构,由于该模块本身属于小功率模块,28线金属结构可充分散发模块工作时自身产生的热量,保证器件长期工作的稳定性。

2.1 可靠性预计全电路失效率

λP=πλb (1)

其中

π=πE·πL·πQ·πT·πF (2)

经查阅相关文件资料:环境系数为πE=1;成熟系数为πL=3;湿度应力系数为πT=1;质量系数为πQ=0.25;电路功能系数为πF=1.2。

代入得

π=0.9 (3)

基本失效率

λb=ASλC+λRTNRT+∑λDCNDC+λSF (4)

衬底面积为AS=3.5×1.9=6.65 cm2;网络复杂度失效率为λC=0.16;工艺封装失效率为λSF=0.4;膜电阻数为NRT=26;膜电阻网络失效率为λRT=0.005;二极管NDC=6,λDC=0.065;模拟电路NDC=7、λDC=0.16;片电容NDC=35、λDC=0.04。得

λDCNDC=0.065×6+0.16×7+0.04×35=0.39+0.96+1.4=2.75 (5)

ASλCλRT、NRT、λSF、及式(5)代入式(4)得

λb=6.65×0.16+0.005×26+2.75+0.4=1.064+0.13+2.75+0.4=4.344 (6)

将式(3)、式(6)代入式(1)得

λP=0.9×4.344=3.909 6(10-6/h)

即可靠性指标理论计算值为

1/λP=1/3.909 6×106 h≈2.6×105 h

2.2 试验情况

产品经125 ℃,1 000 h负荷试验后,指标合格,无失效[3,4,5]。综上所述预计该产品可靠性高,其指标为2.6×105 h。

3 结束语

本品可对激光信号进行预处理,完成峰值保持,对窄脉冲信号的捕捉尤为灵敏。峰值保持功能电压跌落率低,可通过充放电网络调节、控制精度高。其特点为:

(1)体积仅为:39.5×27.0×7.1。(2)全金属屏蔽密封外壳,整机调试方便。(3)集成度、灵敏度高,且易于控制。经对工艺的优化,提高了质量可靠性,因此产品被广泛应用于激光报警设备当中。

摘要:由于经典的正峰值保持电路频带窄、转换速率慢、线性差、且下垂速率快,不适于高速采集。文中在经典的正峰值保持电路基础上,通过改进获得了一种厚膜集成的改进型的激光信号保持电路,并根据技术要求,在用户协助下通过增加一级闭环回路给电容充放电来实现正峰值保持指标。通过仿真论证了电路的模块化和高可靠性设计原则。

关键词:激光信号,采样保持电路,高速运放,厚膜集成

参考文献

[1]童诗白.模拟电子技术基础[M].北京:高等教育出版社,2010.

[2]段尚枢.运算放大器应用基础[M].哈尔滨:哈尔滨工业大学出版社,2010.

[3]王锡吉.电子设备可靠性工程[M].西安:陕西科学技术出版社,1999.

[4]丁振东,王娟锋,朱祺.实现激光角度欺骗干扰的几个条件[J].电子科技,2012,25(10):122-124.

语音信号的采样与分析 篇5

近几十年以来, 信息技术的飞速发展使得人们对信息的需求量日益提升。传统上, 信号从模拟到数字的转换一直都严格遵循奈奎斯特采样定理。该定理指出, 为避免信号失真, 信号的采样频率不得低于信号最高频率的2倍。随着各种信号处理系统获取数据能力的不断加强, 需要后期处理的数据量也以惊人的速度增加, 这无疑给系统的处理能力提出了更高的要求, 也给相应的硬件设备的设计带来了极大的挑战。因此在奈奎斯特采样定理指导下的信息获取、存储、融合、处理及传输已成为目前信息领域进一步发展的主要瓶颈之一[1]。

2004年, 由Donoho与Candés等人提出的压缩感知 ( Compressed Sensing, CS) 理论表明, 可以在不丢失逼近原信号所需信息的情况下, 用最少的观测数来采样信号, 实现信号的降维处理。即直接对信号进行较少采样得到信号的压缩表示, 从而在节约采样和传输成本的情况下, 达到了在采样的同时进行压缩的目的。当信号具有稀疏性或可压缩性时, 通过采集少量的信号投影值就可实现信号的准确或近似重构[2]。

压缩感知理论主要包括三个核心问题: 信号的稀疏表示、测量矩阵的设计和高效稳定的重构算法。信号的稀疏表示就是将信号投影到正交变换基时, 绝大部分变换系数的绝对值很小, 所得到的变换向量是稀疏或者近似稀疏的, 可以将其看作原始信号的一种简洁表达, 这是压缩传感的先验条件, 即信号必须在某种变换下可以稀疏表示。为了确保信号的线性投影能够保持信号的原始结构, 选择稳定的投影矩阵也十分重要, 且投影矩阵必须满足约束等距性 ( Restricted Isometry Property, RIP) 条件, 然后通过原始信号与测量矩阵的乘积获得原始信号的线性投影测量。最后, 运用重构算法由测量值以及投影矩阵重构原始信号。压缩感知理论框架如图1所示[4]。

目前, CS理论与应用研究正在如火如荼地进行: 在美国、欧洲等许多国家的知名大学如麻省理工学院、莱斯大学、斯坦福大学、杜克大学等都成立了专门课题组对CS进行研究:2008年, 贝尔实验室, Intel, Google等知名公司也开始组织研究CS;2009年, 美国空军实验室和杜克大学联合召开了CS研讨会, 美国国防先期研究计划署 ( DARPA) 和国家地理空间情报局 ( NGA) 等政府部门成员与数学、信号处理、微波遥感等领域的专家共同探讨了CS应用中的关键问题; 第二次以《压缩感知和高维数据分析》为主题的研讨会也在2011年的7月26 ~28日在杜克大学召开[5]。在国内, 一些高校和科研机构也开始跟踪CS的研究, 如清华大学、中科院电子所、西安交通大学和西安电子科技大学等。自从2006年CS的提出, 在IEEE的信号处理汇刊、信号处理快报汇刊、信号处理杂志、信息论汇刊等国际知名期刊上开始涌现出上百篇关于CS理论与应用方面的文献。国家自然科学基金委也自2009年起资助了多项压缩感知方法的研究, 涉及认知无线电、雷达成像、信号稀疏表示、多媒体编码、人脸识别等领域。

近年来, 压缩感知技术已经被广泛研究并应用于很多领域。其中, 加利福尼亚大学洛杉矶分校的Charbiwala等人率先将压缩感知技术 ( CS) 应用于获取神经动作电位信号的研究[6], 期望进一步简化神经动作电位的压缩采样, 实现复杂度通常低于传统的同类测量系统, 更适用于高通量神经信号的无线传输。该研究提出了相关思想并进行软件仿真, 将无线接收的不同种类神经动作电位信号进行分类, 但并未将接收后的重构信号与原始信号进行比较。

目前国内外无线神经信号检测的主要实现方案主要有以下六种:

( 1) 美国三角公司的方案———直接发送模拟信号;

( 2) 德国Multichannal公司的方案———将模拟信号数字化后再发送 ;

( 3) 仅提取动作电位的实现方案———提取了动作电位之后再发送[7,8];

( 4) 用DWT ( discrete wavelet transform) 方法实现压缩方案———用DWT方法对信号进行压缩后再发送[9];

( 5) 用CS方法实现压缩的方案———用CS的方法对信号进行压缩后再发送[10];

( 6) 用低采样率进行信号采样的实现方案[11]。

其中前两种方法压缩比为1∶1, 数据量并未减少, 传输负担比较重。第三种方法压缩比由测得神经信号发放率而定, 且提取过程较为复杂。第四种方法涉及到相当复杂的数字逻辑和硬件电路, 不易实现。第五种方法和第六种方法只是已提出初步想法, 并未进一步研究实现。但第五种方法已有压缩感知理论作为基础, 而第六种方法理论可行性还有待进一步考证。

目前研究的神经动作电位信号压缩采样与重构没有进行相关重构算法研究和重构前后信号的定量对比。本文的创新点在于采用4层db8小波对信号进行压缩, 并利用数学上的OMP算法对信号进行重构, 之后通过仿真软件进行波形对比且对重构信号与原信号关键点的相对误差进行计算, 误差均在15%以内且目测重构效果良好, 表明采用的压缩与重构算法对神经动作电位信号的可行性。具体操作过程如图2所示:

2 神经动作电位信号压缩采样与恢复算法

2. 1 神经动作电位信号的稀疏矩阵模型

神经动作电位是神经元活跃时的记录, 它包含了神经元活动的最关键信息。同其它生物电信号类似, 神经动作电位可以在正交小波基下被稀疏化。利用该特性, 可以在小波域内构造神经信号的稀疏矩阵。

采用非压缩的方法从脑神经信号记录中提取出一段动作电位数据, 为了方便正交小波计算, 将动作电位数据对齐在包含64个采样点的时间窗口内。以4层db8 ( 是我自己写的db8) 小波作为稀疏基得到小波系数, 其中可只包含少数显著的非零元素。设原始64位神经信号为x, 根据其稀疏特性, 原始信号可以表示成稀疏矩阵Ψ与稀疏系数s的乘积形式, 即x =Ψs。则所要构造的稀疏矩阵P =Ψ- 1, 使得将x与P相乘, 可以将原始信号稀疏化, 即s =xΨ- 1= xP。

稀疏矩阵的构造以离散小波变换 ( DWT) 的Mallat算法为基础而进行, 该算法由小波滤波器对信号进行分解, 具体过程可用式 ( 1) 表示[12]:

式 ( 1) 中, t为离散时间序列号, t =1, 2, …, N; f ( t) 为原始信号; j为层数, j =1, 2, …, J, 其中J = log2N。H, G为时域中的小波分解滤波器, 实际上是滤波器系数; Aj为信号f ( t) 在第j层的近似部分 ( 即低频部分) 的小波系数, Dj为信号f ( t) 在第j层的细节部分 ( 即高频部分) 的小波系数。

具体分解过程可由图3和图4表示[13]。

给定长度为N的信号, 那么DWT顶多包含log2N层。第一步由信号x产生两个系数集: 低频系数cA1和高频系数cD1。cA1由x和低通滤波器Lo_D卷积并隔2采样获得, cD1由x和高通滤波器Hi_D卷积并隔2采样获得。每个滤波器的长度为2N, 如果n =length ( x) , 则信号F和G的长度为n +2N -1, 系数cA1和cD1的长度为

接下来的每一步就是使用同样的方法将低频系数分解, cA1分解成为cA2和cD2, 依此类推, 如图4所示。信号x在第j层的分解结构为[cAj, cDj, …, cD1], 即为稀疏系数构成的矩阵, 包含信号重构所含有的信息。

这样, 已知原始信号x和稀疏矩阵s, 就可以求出稀疏矩阵P =Ψ- 1, 使得对于任意64位的神经动作电位信号, 都能通过4层db8小波变换将其稀疏化。

2. 2 测量矩阵的设计

为了重构稀疏信号, Candés和Tao给出并证明来传感矩阵珦Φ =ΦΨ必须满足约束等距性条件[3]。由于Ψ是固定的, 要使得珦Φ = ΦΨ满足约束等距条件, 可以通过设计测量矩阵Φ解决。文献[14,15]证明了当Φ是高斯随机矩阵时, 传感矩阵珦Φ能以较大概率满足约束等距性条件。因此可以通过选择一个大小为M×N的高斯测量矩阵得到, 其中每一个值都满足N ( 0, 1/N) 的独立正态分布。在本设计中, 取重构稀疏度为K =10, 同时, 为了便于硬件电路的实现, 测量矩阵选取由1、- 1组成的高斯随机矩阵来重构信号。

2. 3 神经动作电位信号的 OMP 重构算法

从数学意义上讲, 基于压缩感知理论的神经动作电位信号重构问题就是寻找欠定方程组 ( 方程的数量少于待解的未知数) 的最简单解的问题, L0范数刻画得就是信号中非零元素的个数, 因而能够使得结果尽可能地稀疏。

匹配追踪类稀疏重建算法解决的是最小L0范数问题, 最早提出的有匹配追踪 ( Matching Pursuit, MP) 算法和正交匹配追踪 ( Orthogonal Matching Pursuit, OMP) 算法。其中, 后者沿用了前者中的原子选择准则, 不同的是OMP算法要将所选原子利用Gram -Schmidt正交化方法进行正交处理, 再将信号在这些正交原子构成的空间上投影, 得到信号在各个已选原子上的分量和余量, 然后用相同方法分解余量。在每一步分解中, 所选原子均满足一定条件, 因此余量随着分解过程迅速减小。通过递归地对已选择原子集合进行正交化保证了迭代的最优性, 从而减少了迭代次数。另一方面, OMP的重建算法是在给定迭代次数的条件下重建, 这种强制迭代过程停止的方法使得OMP需要非常多的线性测量来保证信号的精确重建[4,16]。

先对OMP算法中的参数和计算公式加以说明。匹配追踪类算法中, 相关系数u的求解是通过公式 ( 2) 中求余量r和测量矩阵Φ中各原子之间的内积绝对值来实现的:

使用最小二乘法实现信号逼近和余量更新:

2. 4 实测数据压缩采样与恢复仿真验证方法

本实验的目的是首先构造出神经信号在小波域的稀疏矩阵, 使得压缩后的神经信号投影到小波域是K - 稀疏的。然后利用的合适的压缩测量矩阵和构造出的稀疏矩阵重构出原始信号来。其中, 原始信号是采用平面离体微电极阵列及Multichannel公司电生理检测系统记录的大鼠海马脑区切片神经电生理信号[17]。如图5所示, 该电生理信号的噪声基线约为±10μV, 在此基础上, 可观察到由活体神经元发放的动作电位脉冲信号 ( Neural Spike) , 脉冲幅度达±90μV, 脉冲发放间隔约250ms, 记录信噪比为9∶1。由于通常神经信号分析中只关心动作电位脉冲的幅度、波形及发放时刻, 而仅记录到噪声基线的部分属于冗余信息。因此采用压缩采样的方法, 有望提高数据获取和传输的效率。以下将仅对动作电位信号部分进行压缩采样。

截取一个时间段内产生的8个神经动作电位信号, 对其进行采样, 使得每个信号由64位离散点组成。

本次实验利用仿真软件进行数据处理和仿真。根据离散小波变换的Mallat算法构造压缩矩阵, 然后编写程序利用OMP算法进行求解, 完成神经信号重构。

实验数据为滤波后的8组64位神经动作电位信号, 信号压缩比为2∶1。

3 实验结果与分析

将重构后的信号与原信号进行对比, 如图6所示。

由图6可以看出, 重构信号和原始信号的目测重合度较好。采用重构误差来定量判断信号重构程度的好坏, 具体来讲, 由重构信号与原始信号最高点 ( 波峰) 、最低点 ( 波谷) 以及时程的相对误差来评判。其中, 时程起点和终点的判断采用阈值法, 由于在平稳状态时, 噪声在 -10μV到10μV的范围内波动, 故由平稳状态下小于 -10μV视为时程起点, 由峰值回落小于10μV视为时程终点。统计结果如表1所示。

由表1可以看出, 原始信号与重构信号的最高点 ( 波峰) 、最低点 ( 波谷) 和时程的相对误差计算值都比较小, 且基本小于10%, 全部小于15%。这表明重构信号与原始信号非常接近, 即本文采用的方法对滤波后高信噪比的神经动作电位信号进行采样重构取得了较好的结果。

4 结束语

本文阐述了对神经动作电位信号压缩测量并且重构的方法。以压缩感知理论为背景, 首先利用神经信号在小波域的稀疏性构建稀疏矩阵, 然后用高斯随机分布的测量矩阵将信号进行2∶1压缩, 再以OMP算法进行信号重构。结合选定的测量矩阵和构造出的稀疏矩阵, 可以实现信噪比较高信号的高精度重构。

本文的创新点有以下几点:

( 1) 采用矩阵进行稀疏采样测量, 跟普通的观测矩阵相比, 能大大节省资源、减少计算量、减少数据传输量、降低功耗、减小传输带宽。

( 2) 采用压缩感知技术采集并恢复神经动作电位信号。相对于直接压缩, 该方法具有片上电路实现复杂度低的优势, 能降低神经传感芯片的规模和功耗。

( 3) 对单个神经动作电位信号能够达到1∶2的压缩比, 考虑到神经spike信号约占整个神经信号记录的1 /30, 实际压缩比可以达到1∶60到1∶90。

本文所做研究的具有很好的应用前景:

( 1) 可用于降低神经信号的获取数据率, 以便于进行网络传输。

语音信号的采样与分析 篇6

关键词:语音信号,时频分析,改进S变换

语音信号是一种非平稳的时变信号,单纯的时域、频域信息不能刻画任一时刻的频率成分,因此国内外学者开始研究时频分析技术(STFT、小波变换、HHT、WVD等)处理语音信号。时频分析技术同时在时域和频域对语音信号进行分析,不仅能够表示出信号中包含的频率分量,而且能够表示出每一频率分量所对应的时间[1],是近年来信号处理等领域一个研究热点。

STFT窗长固定,不能对语音信号的低频分量进行很好检测,同时高频分量的时间分辨率也很低;小波变换克服了此类问题,但会出现局部相位信息且它的时间-尺度不适合直观视觉分析。R.G.Stockwell等吸收STFT和小波变换的优点,提出S变换,它采用依赖频率的高斯窗函数,具有多分辨率,克服了STFT固定分辨率的不足。同时,S变换中含有相位因子,这是小波变换所不具备的特性。而且由于是一种线性时频表示,因此不存在Cohen类分布的交叉项的干扰[2]。因此被广泛的应用于地震信号、医学信号,雷达信号方面。传统的S变换的小波函数固定,使其应用具有一定局限性,针对语音信号,将样条小波作为变换母小波,对S变换提出改进,然后利用改进的S变换对语音信号进行时频分析。仿真结果显示该方法的时频结构图更加清晰直观。

1 S变换基本原理

S变换本质上是连续小波变换的“相位校正”。设函数f(t)∈L2(R),w(t,d)称为基本小波,d是小波的尺度(分辨率)。则该函数的小波变换定义[3]:

函数f(t)的S变换定义为具有特定母小波的连续小波变换乘以相位因子

记f为频率,则小波尺度d=f-1,母小波 S变换表达式定义为

式(3)中:τ为高斯窗函数的中心,标志时间轴上窗函数位置。 随频率f变换,克服了STFT固定窗长的不足;另外,S变换将具有特定母小波的连续小波变换乘以相位因子ei2πfτ,实现了相位校正[3,4,5,6]。

S变换采用高斯窗,时窗宽度跟频率f成反比,在低频段的时间窗较宽,获得较高的频率分辨率,而高频段的时间窗较窄,故获得较高的时间分辨率[6]。

2 改进的S变换语音时频分析

从上节S变换的表达式中,看出母小波w(t,f)固定,这使S变换在应用中受到限制。文献[7]中对多种小波函数处理语音信号效果进行比较,理论和实验分析样条小波分析语音信号的最低相对准确率约98%,明显高于其它几种小波,即样条小波比起其它几种小波,分析语音信号的效果更好,将B样条小波应用到S变换中,提出改进的S变换。

n次B样条小波记作βn(t),一次B样条β1(t)=1,0≤t<1,就是Harr小波。

为二次B样条,以此类推,三次B样条β3(t)为,

为讨论方便,这里记三次B样条窗为Bf(t)=A f[tfβ1(tf)-(2-tf)β2(tf)],利用三次B样条小波[8]作为S变换的窗函数,得到改进S变换的基本小波为

式(4)中,A是基本小波幅度。

设f(t)为输入的一段语音信号,则改进的S变换的表达式为

将式(5)离散化得到离散的S变换,其中n为频率采样点数,F(f)是输入语音信号的傅里叶谱

利用改进S变换计算语音信号的S变换谱[6],首先计算语音信号f(t)和样条窗Bf(t)的快速傅里叶变换,分别得到 然后按频率采样点计算 最后将得到的结果进行快速傅里叶逆变换,便得到语音信号的改进S变换谱

改进S变换提供的三次B样条窗随f不断改变,提高了处理语音信号的分辨率,同时乘以相位因子,保持每一频率绝对相位不变,对小波变换结果实现相位校正。幅度乘以A f,改进的S变换,不同频率处的样条小波的幅度不同,在低频处用幅度小的样条小波,在高频处用幅度大的样条小波,这样增强了语音信号高频处的S变换谱的能量[3,4,5,6]。

3 实验仿真

为分析改进S变换方法提取语音信号的时频域信息的可行性、有效性,实验语音采用女声朗读,文本信息“abovousqueadmala”,采样频率11 025Hz,从1 801点取一段长度为2 048的语音段进行分析。图1是该语音信号时域波形图,其它时频方法和改进S变换语音信号时频分布见图2。从时域图可以看出语音信号主要集中在两段,分别在时刻0.08s附近和0.16s—0.18s这一时间段,那么对这段语音信号的时频分析也主要集中在这两段。

从图2(a)中,可以看出STFT的时间分辨率和频谱分辨率是一对矛盾体,窗长固定,分辨率很低,得到的时频结构大致能反映信号的集中分布情况,但是很模糊。图2(b)的小波变换为语音信号提供了自适应窗口,具有多分辨率,其时频结构图效果比起STFT有明显的提高。S变换对小波进行了“相位校准”,从图2(c)中看出,改进的S变换的时频分布图具有更高的时频分辨率和能量聚集性,S变换在时频面上的效果更为清晰和直观,它清晰直观地反映出该段语音从低频到高频其频率随时间变化情况。而且比较图2(b)和图2(c),看出改进的S变换在语音信号的高频部分的时频结构更加细致。但这是以牺牲其运行时间为代价的,如表1所示,S变换时频分布运行时间约3.5s,比起独立的小波变换和STFT,其运行时间明显较长。

4 结论

提出改进S变换用于语音信号时频分析。针对语音信号特点,将样条小波用作母小波函数对传统的S变换进行改进,改进的S变换具有多分辨率,并含有相位因子,比起小波变换的时间-尺度关系更适合直观视觉分析。最后通过仿真对比验证改进S变换的优越性。

参考文献

[1]徐春光.非平稳信号的时频分析与处理方法研究,博士学位论文.西安:西安电子科技大学,1999

[2]王殿伟,李言俊,张科.基于S变换的时频特征提取与目标识别.航空学报,2009;30(2):305—310

[3] Stockwell R G,Mansinha L,Lowe R P.Localization of the complexspectrum:theStransform.IEEE Transactions on Signal Processing,1996;44(4):998—1001

[4] Ventosa S,Simon C.TheS-transform from a wavelet point of view.IEEE Transactions on Signal Processing,2008;56(7):2771—2780

[5] Sahu S S,Panda G,George N V.An improvedS-transform for time-frequency analysis.IEEE International Advance Computing Confer-ence,India,2009:315—319

[6]陈学华,贺振华.改进的S变换及在地震信号处理中的应用.数据采集与处理,2005;20(4):449—453

[7] Kadambe S.Acomparison of a wavelet functions for pitch detection ofspeech signals.IEEE Acoustics,Speech,and Signal Processing,1991;1:449—452

语音信号的采样与分析 篇7

关键词:语音信号,短时能量分析,平均过零率,语谱图,滤波器

1原理概述

语音信号是一种典型的非平稳信号,但是由于语音的形成过程是与发音器官的运动密切相关的,这种物理运动比起声音振动速度要缓慢得多。因此,语音信号常常可以被假定为短时平稳的,即可以认为在10-30ms的时间内其性质不变。[1]根据语音信号的短时不变特性,对其进行分帧处理,每个时间短段都是相对稳定的持续语音片段。假设有离散语音信号x(m) ,把它乘以 窗函数w(m - n) 后即得到 分桢后的 信号xn(m)= x(m)*w(m - n)(其中n代表窗的位置),然后对xn(m) 进行分析。[2]

2语音信号时域分析

基于短时稳定的假设,可以对语音信号进行短时时域分析。通过过零率分析和短时能量分析方法来分析音频的时域特性。

2.1短时能量分析

短时平均能量分析是一种常用的时域分析方法。它可以区分浊音和清音,声母和韵母,在高信噪比条件下可以区分有无语音。[3]图1是对一段语音原始信号和左右声道的短时能量分析。从短时能量图中可以明显地看出在0-0.3s时为无声区, 而在有声区部分是分段分布,即为各个字所对应的时间位置。 每一段波的峰值并不是在正中间而是比较靠前,正是每个字声母所在的位置。因此,证明声母的短时能量要高于韵母的短时能量。再观察从1.2-1.4s时的波形,该位置本应该是声母x的高短时能量,但由于它的是清音,所以能量较前面三个浊音声母小。通过以上分析,就可以清楚的辨别出一段音频各音素的位置。

2.2平均过零率分析

短时过零率表示一帧语音信号波形穿过横轴的次数。对于离散时间信号,如果相邻的取样值改变符号则称为过零。结合上述的清浊音判别方法和图2平均过零率分析的图像,可以看出平均过零率的峰值出现在清音位置,而且清音的分界线比较明显。因此,可以将这一特性用在端点检测上,特别是用来估计清音的起始位置和结束位置。[4]对语音信号进行分析,发现发浊音时,尽管声道有若干共振峰,但由于声门波引起波谱的高频跌落。而发清音时,多数能量出现在较高频率上。高频就意味着高的平均过零率,低频意味着低的平均过零率。但是,通常的噪声都为高频波,具有较高的平均过零率,这就容易将噪声误认为音频信号中的清音,如0-0.3s之间的高峰,所以在音频分析时要结合多种分析方法。

3频域分析——语谱图

3.1语谱图的原理

设离散时域采样信号为x(m) ,m = 0,1,...,N - 1 ,其中n为时域采样点序号,N是信号长度。然后对信号进行加窗分帧处理,则信号x(m) 的短时离散傅里叶变换(DFT)为:

其中 {w(m)} 为窗序列,n代表窗序列的位置,k为频域变量。此时频谱不仅与频域变量k有关,也与时域变量n有关。 |X(n,k)|就是x(n) 的短时幅度谱估计,而时间n处频谱能量密度函数(或功率谱函数)P(n,k) 为:

用时间n作为横坐标,k作纵坐标,将的值表示为灰度级所构成的二维图像就是语谱图。[5]通过变换10 log 10(P(n,k)) 能得到语谱图的d B表示。

3.2语谱图分析

图3为灰度语谱图,Winsiz=2048,Shift=128,Base=0,Mode=0,Gray=64。在此宽带语谱图上,功率谱的谐波结构在频率轴方向被平滑掉,谐波间隙被填平,因此在频域看不出基音频率和频谱的谐波形式结构,但可以明显地看出共振峰结构和语谱包络,特别是时间分辨率高,可以清楚地看到浊音共振峰时变过程。[6]

图4参数为:Winsiz=8192,Shift=512,Base=0,Mode=0,Gray=64。在此窄带语谱图上,滤波器的带宽能在浊音区分辨出每个谐波。语谱的谐波形式的结构在频率方向清晰可见,并能看到基音频率的时变过程。

4结束语

上一篇:网络课件的开发应用下一篇:中国味道的图画书论文