参数提取

2024-05-31

参数提取(共7篇)

参数提取 篇1

1 语音学概述

1.1 汉语的音素、音节和音调

我们发现依据人类声音产生的机制, 由于激励方式的不同会形成清音和浊音两种不同的语音。由这两种语音又可以组合成两种不一样音素:元音及辅音。构成语音的最小单位是音素。元音由不相同的口腔形状发声而形成, 辅音的形成由发声的部位以及发声的方法决定。

音节是构成汉语的最小单位。我们所说的音节指的是一个元音加上一或两个辅音所构成的音素的组合。汉语当中包括以下4种音节, 即:元音、元音+辅音、辅音+元音, 辅音+元音+鼻音。一般汉语可以简单划分为声母+韵母两个部分。音节前部分的辅音称之为声母, 元音和元音后面有时候出现的鼻音称之为韵母。汉语可认为是一种声调语言, 根据声调的不同所表达的意思很可能完全不一样, 汉语共有阴平、阳平、上声及去声四种声调。而声调的变化可以看成浊音周期的变化。声调曲线从韵母起始点至韵母的终止点。

1.2 语音信号的数学模型

语音的产生是因为声道激励发生共振, 因为发声过程中声道是振动的, 所以能够用一个时变线性系统来描述。可以用如图1所示描述语音生成模型。

由图1可知一个完整的语音信号模型由激励模型、声道模型、及辐射模型三个子模型串联而成。激励模型由浊音激励与清音激励组成。对清音部分来说, 激励信号等同于白噪声, 而对于浊音部分来说, 因为声带在不断地张开与闭合, 所以会有间隙性的脉冲波产生。共振峰模型是当前广泛使用的一种声道模型。声道的终端是人类口与唇, 速度波通过声道输出, 然而语音信号是一种声压波。

2 语音信号的前端处理

为了得到我们所需要的信号, 须先对模拟语音信号进行数字化, 接着进行预处理与加窗。

2.1 语音信号的数字化

为将模拟语音信号转变为数字信号, 先对信号进行采样与量化。在采样与量化之前, 须进行语音信号的预滤波, 其目的在于:第一, 滤除高频噪声;第二, 防止50Hz的工频干扰。

2.2 语音信号的预处理与加窗

因为语音信号的平均功率受到鼻辐射以及声门激励的很大影响, 因此在语音信号频谱的求取时, 随着频率的增高相应的响应成分越小, 也就是说高频部分频谱比起低频部分来不够精确, 为此我们需要对信号进行预加重。为了平滑频域信号, 使得信号处理的后面阶段对有限长响应不那么敏感, 通常情况下让数字语音信号通过一个低阶的系统。目前广泛使用的是固定的一阶数字滤波器, 即

式中a为预加重系数, 通常取值0.95左右。

因为语音信号的特性是随时间变化的, 而非平稳过程, 但由于人的发音器官的肌肉运动速度比较慢, 因此可以认为语音信号是个局部的短时平稳的信号。因此, 我们对对语音信号进行分帧加窗的处理。通常情况下语音信号帧长取为10ms~30ms, 每秒帧数约为33~100, 分帧可以是连续的, 有可以是交叠分段的, 在语音信号的分析当中常用“短时分析”来表述。我们一般采用窗函数来乘语音信号, 常用的窗函数是Hamming窗。

Hamming窗函数是:

2.3 语音信号的端点检测

端点检测指的是找出语音信号中的各段落的起始点以及终止点的位置。语音信号的时域处理方法包括:短时平均幅度、短时能量、短时过零率以及短时自相关。端点检测一般要用到语音信号的短时能量以及短时平均过零率两中参数。

用En来表示第m帧的短时能量, 其计算式如下:

短时平均幅度Mn的计算式如下:1N-

短时能量En的最主要作用是:区分清音与浊音、区分声母与韵母的分界、无声与有声的分界、连字的分界以及能够用于进行语音识别。

“过零率”指的是在单位时间内信号通过零的次数。短时过零率z (m) 是用来描述频谱的简单有效的方法之一, 计算公式如下:

在短时处理技术中, 描述一个随机信号的其中一个重要特征是自相关函数Rn, 可以用自相关函数区分清音与浊音, 计算公式如下:

短时频域处理作为语音信号处理的基本方法之一。短时频域处理适合缓慢变化的语音信号。第m帧的短时傅立叶变换计算式如下:

3 语音特征参数提取

在完成语音信号的预加重、分帧、及端点检测之后, 下一步关键的是提取特征参数。我们不可能直接识别原始波形, 语音信号需要经过变换, 提取出其特征参数后再进行识别, 特征参数需要满足:反映语音的本质、参数个分量之间耦合尽量小、参数的提取方便等几方面的要求。目前语音识别中线性预测倒普参数LPCC、美尔倒普参数MFCC使两种较为常用的参数。LPCC利用线性预测编码技术求取倒普参数。MFCC则构造人的听觉模型, 以语音信号经过该模型的输出值作为声学特征, 直接利用离散傅里叶变换得到。

3.1 线性预测倒普参数LPCC的提取

线性预测分析是语音特征分析方法之一, 能够有效的解决短时语音信号的模型化问题。LPCC的基本原理:语音信号的每个样值可以通过过去的若干个值的线性组合逼近求得, 也能够用实际语音信号的抽样与线性预测的均方差值最小的方式, 求出一组预测值。

其中a为加权系数, p为线性预测倒普参数的预测阶数。

LPCC系数表示的是语音信号频谱极值点的变化, 用该系数来表征语音信号, 能够获得比较平滑的语音频谱图。

3.2 美尔倒普参数MFCC的提取

MFCC参数与LPCC参数不同, 它考虑了人耳的听觉特性, 先将频谱转变为美尔频标的非线性频谱, 接着再转换到倒普域上。因为MFCC比较地充分考觉特性, 所以MFCC参数有很好的识别性能与抗噪能力。由测试可得, MFCC参数性能在汉语语音识别中要明显优于LPCC参数, 由于人类在对1 000Hz频率以上的声音的感知能力并不遵循通常的线性关系, 它遵循的是对数频率坐标上的线性关系。

首先, 语音信号在经过预处理、分帧加窗后转变为短时信号, 经过FFT变换将x (n) 转化为X (m) , 并计算出其短时能量谱P (f) 。在将P (f) 在频率轴上的频谱转化为在美尔坐标上的P (M) 。接着在美尔频域内将在美尔坐标上加入三角带通滤波器得到滤波器组Hm (K) , 再计算美尔坐标上的能量谱P (M) 通过该滤波器组的输出值。最后在美尔刻度谱上能够采取修改的离散余弦反变换来求取美尔倒普参数:

式中, p为MFCC阶数。

4 结论

本文主要介绍了语音学的基础知识、语音信号的数字化及其特征提取, 为语音模型的训练做了很好的铺垫。在计算机普及的今天能够让计算机识别出人的自然语言是人们一直努力的一个方向, 对计算机直接用语言信息发号施令, 我们的双手才能真正得到解放。

参考文献

[1]胡航.语音信号处理.2版.哈尔滨:哈尔滨工业大学出版社, 2002:256.

[2]刘幺和, 宋庭新.语音识别与控制应用技术.北京:科学出版社, 2008:201.

[3]易克初.语音信号处理.北京:国防工业出版社, 2000, 14:363.

[4]李波, 王成友, 杨聪, 等.基于语音频谱包络抽取的MFCC算法.长沙:国防科技大学学报, 2004.

[5]桂苹, 吴镇扬, 赵力, 等.基于VQ的说话人自动识别系统的实现[D].东南大学, 2003.

管制指令特征参数提取研究 篇2

管制模拟机训练对空中交通管制学员的培养十分重要。但是,目前管制模拟机存在一个很大的不足,即需要学员或者老师轮流担任飞行员席位人员,配合完成训练。因此,研究将计算机语音识别技术[2]应用于空中交通管制学员的培训中,采用自动飞行员席位代替专人飞行员席位具有重要意义。

目前,美国、澳大利亚等研究将计算机语音识别技术应用于管制模拟训练机中,已有具体的研发产品。国内2000年后陆续有过相关研究,但都没有实质性的进展,原因主要有:

(1)现有的成熟语音识别引擎,其孤立词汇的识别率能达到97.1%[3],特定人的连续语音识别率也能达到90%以上;但是陆空通话中的语句几乎都是格式固定的句子,且非特定人,因此研究具有高识别率的语音识别引擎是一难点。

(2)管制指令词汇量相对较少,但较为特殊,发音与标准的英语或普通话有明显区别,即便利用成熟的语音识别引擎系统进行二次开发,语音模板库的建立和训练也异常复杂。

(3)从事陆空通话语音识别研究的科研机构或团队相对较少,目前主要是川大智胜、南京航空航天大学、民航大学等进行了初步探索[1,4,5,6,7,8]。

计算机语音识别的主要流程如图1所示。特征参数提取是识别结果的重要影响因素之一。好的特征参数必须能很好地反映语音的特征,并且各参数之间应有良好的独立性,易于提取,计算方便。

目前,最常用的特征参数提取方法主要有提取线性预测倒谱参数(linear prediction cepstrum coefficien,LPCC)和梅尔频率倒谱参数(Mel frequency cepstmm coefficient,MFCC)[9]。现有的管制指令语音识别相关文献中,特征参数提取方法对识别率的影响研究较少,本文研究上述两种方法分别对特定人和非特定人管制指令语音识别系统识别率影响。

1 管制指令的特征分析

管制指令专业特征强,发音和拼读极具特色,是一种严格程序化、标准化的语言。从语音到语法都包含二次人造痕迹,要求发音高度清晰、指令公式化、简练性、词语的单一意旨性及结构祈使性等。同时,管制指令词汇样本空间小、指令较少、重复率高且工作环境噪声低。

2 LPCC线性预测倒谱参数

LPCC参数方法是语音识别研究者采用最多的特征参数提取方法[10]。线性预测(LPC)分析的基本思想是用加权的过去若干个语音信号的采样值进行线性组合来近似出当前的语音信号的值[11]。LPCC由LPC推算得到,反应声道的响应,一般只需十几个倒谱系数就能较好的描述语音的共振峰特性[12]。

LPC分析的声道模型系统函数为:

式(1)中,p是LPC分析的阶数;ak为线性预测系数(k=1,2,…,p)。采用Durbin法来完成LPC系数的计算,求得p阶线性预测系数ak。

设H(z)的冲激响应为h(m),由式(1)变换得:

令式(2)中左右两边常数项和z的各次幂的系数分别相等,推出ak和之间的递推关系,如式(3)所示。

由式(3)可从预测系数{ak}求出倒谱便得到倒谱特征的统一表达式。

3 Mel倒谱参数

Mel频率倒谱参数的分析是基于人的听觉机理[13],即依据人的听觉实验结果分析语音的频谱,获得语音特性。MFCC分析依据的听觉机理包括:

(1)人主观感知域的划定并非线性,根据Stevens和Volkman的工作[14],有式(4):

式(4)中,Fmel是感知频率,mel;f是实际频率,Hz。Fmel和f的关系曲线如图2所示。将语音信号的频谱变换到感知域中,便能更好的模拟听觉过程。

(2)临界带。频率群相当于将人耳基底膜分成许多很小的部分,每一部分对应一个频率群,对应于同一频率群那些频率的声音,在大脑中是叠加在一起进行评价的[15]。按临界带的划分,将语音在频域上划分成一系列的频率群组成了Mel滤波器组。

在语音的频谱范围内设置若干带通滤波器,为滤波器的个数。每个滤波器具有三角形滤波特性,其中心频率为f(m),在Mel频率范围内这些滤波器是等带宽的。每个滤波器的传递函数如式(5)所示。其频率响应波形如图3所示,其中,

f(m)可以定义为:

式(6)中,f1和fh分别为滤波器频率范围的最低和最高频率;N为DFT(或者FFT)时的长度;fs为采样频率;F-1mel为Fmel的逆函数:F-1mel(b)=700(eb/1 125-1)。

每个滤波器组输出的能量为:

经离散余弦变换得到MFCC参数:

4 算例分析

4.1 隐马尔科夫(HMM)声学模型[16]实现

以管制指令中0~9十个数字的录音识别为例进行仿真分析,每个数字的发音见表1。用于模版训练的语音均是在实验室环境下录制的标准陆空通话男生和女生发音,8 kHz采样,16 bit编码,单声道输出,存储格式为*.wav。用“录音软件V3.91”共采集了0~9十个数字的录音250个,每个数字均为25个录音(其中男生三人15个录音,女生二人10个录音)。用于识别率检测的语音由2人录制完成,共100个,每个数字10个录音。

具体实现步骤为:

4.1.1 语音信号预处理

包括了语音信号的预加重、分帧和加窗、端点检测三部分。

(1)预加重。

预加重的目的是补偿高频分量的损失,提升高频分量。预加重的滤波器为:

式(9)中,a为预加重系数,本文取0.937 5。

(2)分帧加窗。

语音信号为准稳态信号,将其分为较短的帧(10~30 ms),每帧可以看做为稳态信号,便可用稳态的方法进行处理。同时,相邻两帧之间有(1/2~1/3帧长)的重叠部分,以便于帧与帧之间能平稳的过渡。

采用汉明窗,窗函数为:

式(10)中,N为窗长,本文取N=256;n为采样点。

(3)端点检测。

采用语音信号的短时平均能量和过零率进行端点检测[12],具有算法简单,易于实现,且能够较好的区分噪音和语音等优点。

4.1.2 语音的训练与识别

对语音信号进行预处理后,管制指令语音训练和识别过程中分别采用公式(3)和公式(8)的方法进行特征参数提取。采用HMM为管制指令语音建立声学模型。在识别时,采用后验概率的方法[17]对数字进行筛选及确认,以便更好地实现训练语音与待识别语音之间的匹配。

4.1.3 程序实现

采用Matlab软件进行实验仿真分析,为了避免繁琐的程序代码和大量的数值运算操作,利用Matlab GUI(图形用户界面)设计操作界面,如图4所示。该操作界面嵌入预先编辑成功的仿真程序,在后续的操作中无需知道代码的具体内容,只要了解操作步骤即可操作界面。

GUI界面的主要功能有实现语音特征参数提取方法的选择,利用HMM模型对语音进行训练,并显示训练的时间、识别时间及识别率。也可用于实现语音实时识别,语音的波形、识别时间及识别结果的显示。训练的进度由图5所示的进度界面显示。

4.2 实验结果及分析

试验中语音训练要求的精度均为5×10-6[18],语音模版的训练和语音识别分为特定人和非特定人,经十次训练和识别的实验结果平均值如下。

4.2.1 特定人

如表2和图6~图7所示,特定人的管制指令语音模板训练和语音识别中,特征参数提取环节采用LPCC参数的训练和识别速度分别约为运用MF-CC参数的2倍和1.7倍;训练和识别稳定性均为运用MFCC参数的1.5倍。运用二者的语音识别率均为100%。

4.2.2 非特定人

如表3和图8~图10所示,非特定人的管制指令语音模板训练和语音识别中,特征参数提取环节采用MFCC参数的训练和识别速度比运用LPCC参数的分别快150 s和5 s;训练和识别的稳定性都略高于运用LPCC参数的。运用MFCC参数的识别率比LPCC参数的高13%。

由实验结果可知,特定人的语音识别中识别率都为100%,但是模板训练和识别的时间却相差较大,若研究记录特定管制员发送指令的次数和时间、管制员疲劳的评估等,可采用速度快、效率高的LPCC特征参数提取方法。若研究对象为非特定管制员,则可采用语音模板训练和识别速度快、识别率高的MFCC特征参数提取方法。

5 结束语

参数提取 篇3

未知干扰信号调制方式的识别[1], 无论是在军事上对战场电磁环境的监测, 还是民用上对通信信号的监测都有着重要的意义。它是信号侦察和电子监测的一项重要功能, 对未知信号的识别分类有助于确定辐射源的电子等级, 了解对方的设备类型以及干扰信号的威胁程度。

随着电子技术的发展, 未知干扰信号的自动分类识别已成为国内外电子侦察领域的研究重点[2]。一些比较先进的信号处理技术已经应用在未知干扰信号的识 别分类中, 如基于循 环谱估计 的方法[3,4,5]、基于高阶累积量的方法[6,7,8,9]、基于小波变换的方法[10,11,12]、基于星座图聚类分析的方法[13,14]等, 但是这些方法都是以提取复杂的特征参数为前提的, 结构复杂、计算量较大, 不适于算法在实际工程上的应用。

本文针对未知干扰信号的识别在实际工程中的应用, 提出一种基于瞬时参数特征提取的未知干扰信号识别方法, 该算法提取中频信号特征参数中的4个瞬时特征参数作为识别参量, 采用决策论的方法设计识别分类器, 实现了6种常见干扰信号的分类识别, 本文从理论上分析了算法的有效性, 并通过计算机仿真验证了算法的识别性能。

1 干扰数据预处理

基于瞬时特征提取的模式识别方法具有计算复杂度低、结构简单的特点, 从而得到广泛的应用。接收到干扰信号后首先需要对接收信号进行预处理。对于接收到的实信号, 瞬时特征提取的方法通常是将信号进行Hilbert变换求信号的解析信号。解析信号z (t) 构造的最简单方法是用接收到的实信号x ( t) 作其实部, 并另外构造一虚拟信号x° ( t) 作其虚部, 即

虚拟信号x° (t) 构造的最简单方法是让原实信号通过一个线性滤波器, 其输出作为虚拟信号, 设滤波器的冲击响应为h (t) , 则

即复信号可表示为:

式中, * 表示函数的卷积。对式 (3) 两边做Fourier变换, 则频谱表达式为:

对式 (4) 两边做Fourier反变换, 得到滤波器的冲击响应为:

将式 (5) 代入式 (2) 可得:

式中, t和τ为实变量;滤波器函数h (t) 的作用是将实信号x (t) 变成它的Hilbert变换。

对于常用的实窄带信号, 可表示为:

式中, fc为载波频率。上述信号的正负频率明显分开, 负频容易被滤除, 保留其正频部分, 并将幅度加倍, 即可得到其解析信号为:

将两边同时乘以e- j2πfct, 变为零载频, 得到一新信号为:

式中, a (t) 表示信号的瞬时幅度; ej ( t) 表示信号的瞬时相位。

信号的瞬时幅度和瞬时相位可分别表示为:

式中, H[s (t) ] 表示s (t) 的Hilbert变换。瞬时相位是根据截获 信号的解 析式计算 得到, 由于按照式 (11) 提取的相位信息可能存在相位的卷叠, 必须保证离散化后的相位序列{φ ( i) } 相邻2次的相位差小于2π, 因此必须对离散化后的相位序列进行修正。修正的公式如下所示:

去卷叠后的相位序列有一个线性分量, 载波频率是引起线性分量的主要因素, 噪声和调制信号对线性相位也有一定的影响。采样后的非线性相位分量可表示为:

式中, fc为信号的载波频率; fs为信号的采样频率;NL (i) 为反应调制信息的非线性分量, 瞬时频率由瞬时相位的导数计算求得:

2 识别流程设计

基本的调制方式识别是通过对信号的一些频率、幅度及相位等参数进行精确提取的基础之上, 选取恰当的识别参数, 采用决策分类器的结构对干扰信号进行分类识别。本文对4ASK、2FSK、2PSK、LFM、AM和脉冲信号进行识别。

2. 1 待识别参数

通过对算法复杂度, 识别概率的综合考虑, 选取如下4个瞬时特征参数进行信号的分类。

1待识别信号零中心归一化瞬时幅度谱密度的最大值。

式中, Acn (i) 为待识别 信号在时 刻t =i / fs (i = 1, 2, …, N s) 零中心归一 化瞬时幅 度值, Acn (i) 可通过如下方式求得:

式中, A (i) 为待识别信号各时刻的瞬时幅度值;ma为该信号段信号瞬时幅度的平均值。可以看出, 信号零中心归一化瞬时幅度谱密度的最大值反映信号包络的幅值变化情况, 幅值越大, 信号的幅值变化越大, 可以用来区分恒包络信号和非恒包络信号。

2瞬时幅度标准偏差。

用来判别数字调制信号中是否是幅度调制。

3信号复包络同相分量和正交分量的相关系数的绝对值r , 即

式中,

r反映了同相分量下x ( i) 和正交分量y ( i) 之间的线性关系的密切程度。显然有r≤1。当r = 1时, x (i) 和y (i) 完全线性相关;当r = 0时, x (i) 和y ( i) 线性无关; 越接近1, 表明线性相关的程度越大。r可以区分线性星座图调制样式和非线性星座图调制样式。

4瞬时频率绝对值的标准偏差σaf, 即

用来判断信号的瞬时频率是否含有绝对调制信息。

采用待识别信号零中心归一化瞬时幅度谱密度的最大值、瞬时幅度标准偏差、信号复包络同相分量和正交分量的相关系数的绝对值和瞬时频率绝对值的标准偏差作为识别参量, 来构造识别分类器。根据仿真实验, 这4个参量能够将4ASK、2FSK、2PSK、LFM、AM和脉冲信号区分出来。

2. 2 仿真设计识别流程

首先在接收信号数据预处理的基础上计算这6种信号的复包络同相分量和正交分量的相关系数的在不同信噪比下的绝对值, 仿真结果如图1所示。

从图1中可以看出, 2FSK的信号复包络同相分量和正交分量的相关系数的绝对值随着信噪比的增大是增大的, 而其他类型的信号的复包络同相分量和正交分量随信噪比的变化都分布在0左右, 因此特征可以将2FSK从其他信号中识别出来。

4ASK、2PSK、LFM、AM和脉冲信号的零中心归一化瞬时幅度谱密度的最大值随信噪比的变化而变化的曲线如图2所示。

从图2中可以看出, AM和脉冲信号随着信噪比的增大零中心归一化瞬时幅度谱密度的最大值是增大的, 而4ASK、2PSK和LFM信号的中心归一化瞬时幅度谱密度的最大值随信噪比的增大保持在一个比较平稳的数值上, 因此可用零中心归一化瞬时幅度谱密度的最大值把剩余的5种信号分为2组: (AM、脉冲信号) 和 (4ASK、2PSK、LFM) 。

4ASK、2PSK和LFM信号的瞬时频率绝对值的标准偏差如图3所示。

从图3中可以看出, 4ASK信号的瞬时频率绝对值的标准偏差随着信噪比的增大在减小, 且逐渐趋于平稳;2PSK信号的瞬时频率绝对值的标准偏差随着信噪比的增大逐渐增大, 增大到一定值后也趋于平稳;LFM信号的瞬时频率绝对值的标准偏差随着信噪比的增大维持在一个相对平稳的数值上, 且这3种信号的此瞬时特征有一定的空间距离, 因此可利用此特征将这3种信号区分出来。

AM信号和脉冲信号的瞬时幅度标准偏差随信噪比的变化率如图4所示。

从图4中可以看出, 这2种信号的瞬时幅度标准偏差随信噪比变化相对变化较为平缓, 且瞬时幅度标准偏差的幅值相对距离较远, 可通过这个特征参数可以将这2种信号较好的区分出来。

整个识别的流程可用一个决策树分类器表示, 整个分类识别结构较为简单, 实现复杂度较低, 决策器分类识别的流程图如图5所示。

从图5中可以看出, 这种基于瞬时特征提取的树形决策器仅采用4个识别参数就实现了6种不同类型信号的识别, 且结构只有3层, 结构较为简单。

3 性能仿真与分析

利用仿真试验来评估基于瞬时特征提取的识别分类器性能。对所要识别的信号在不同的信噪比下分别进行1 000次独立的 蒙特卡罗 试验, 并取1 000次均值。采用的卫星导航信号为C / A码, 信噪比为 - 10 d B, 6种干扰信号调制方式分别为4ASK、2FSK、2PSK、LFM、脉冲和AM。采样频率Fs= 20 MHz, 载波频率为5 MHz, 2ASK、4ASK、2PSK、4PSK、LFM和脉冲信号的带宽均为5 MHz, 其中脉冲信号占空比为10% , 2FSK的2个频偏量分别为1 100 Hz和1 700 Hz。在不同干噪比下, 本文设计的分类识别器对6种干扰信号识别概率如图6所示。

从图6中可以看出, 对LFM和4ASK信号的识别性能较好, 在 - 1 d B时也能达到100% 识别, 在信噪比为6 d B时对其他几种信号的识别概率也达到100% 。该识别分类器的结构较为简单, 不同信号的识别性能相差较大, 说明在识别门限的选取和识别流程的设计上还有进一步的优化空间。

4 结束语

在充分考虑实际工程应用的前提下, 本文提出一种基于瞬时参数特征提取的干扰信号识别方法, 该方法基于决策论的原理设计了一种树形识别分类器, 实现了6种常见干扰信号的识别分类, 具有结构简单、计算量低的特点。仿真结果表明:该方法对6种常见的干扰信号均具有较好的识别概率, 在实际工程应用中具有较好的推广应用价值。

摘要:针对干扰信号监测中对干扰类型进行实时识别的问题, 提出一种基于瞬时参数提取的干扰信号识别方法, 采用树形决策分类器结构, 分选出一组对信噪比不敏感的识别特征参数, 实现了6种常见干扰的分类识别, 该分类识别器结构简单, 易于实时处理的实现。仿真结果表明, 在信噪比不低于5 dB的情况下, 该识别分类算法对不同类型的干扰信号均能实现95%以上的正确识别概率。

参数提取 篇4

农业是我国国民经济的基础,提高农业生产效率和自动化程度是实现农业自动化的根本途径[1]。随着数字图像处理技术的发展和计算机处理速度的迅速提高,数字图像处理技术已在许多领域得到了广泛的应用。利用飞速发展的图像处理技术改造传统农业,提高农业生产的科技含量,用现代科技知识武装传统农业,已是越来越多农业工作者的共识。植物的叶片形状是传统识别植物的重要和常用形态特征,是认识和识别植物的基础和出发点。与其它植物器官比较,叶片具有诸多优点,常作为识别特征和人们认识植物的主要参照器官。对于研究物种的形态变异和分化,叶形是一个非常好的指标[2]。传统的叶片形状分析方法大部分是以手工测量为基础,效率低下,同时由于叶片形状的不规则,肉眼观测造成的误差也比较大。植物叶片是一个二维的平面系统,相对而言,更容易进行图像的处理和加工。

1 实验材料

本文实验所用的材料为3片长椭圆状榕树叶片,分别如图1~图3所示。

2 植物叶片轮廓线的链码表示

植物叶片图像经预处理和Ostu自动阈值二值化处理,然后通过寻找最大连通域的方法,得到一个背景为全黑,前景为全白的二值图像,最后经过轮廓化处理得到轮廓曲线。

链码是图像处理中出现较早的概念,其的定义如图4所示,用中心像素指向它的8个邻点的方向来定义,取值0~7,按逆时针递增,称为8连通链码。也有指向它的4邻点的链码,取值0~3,如图5所示,称为4连通链码。

因为植物叶片边缘属于柔性物质边缘,方向变化比较复杂,4连通链码和8连通链码的分辨率分别为90°和45°,若用原始链码提取特征参数,如角点等误差比较大,虚假目标比较多。为了提高分辨率,本文根据实验情况,提出以下链码编码方式。

16方向链码如图6所示。

设当前像素为5×5模板的中心像素(i,j)若轮廓线跟踪的下一像素点为模板16邻域中(即链码表示的相邻的两个边缘像素中间间隔1个像素)的右边像素(i+2,j),则定义链码为0,其它按逆时针增定义,如像素(i+2,j-1)对应的链码为15。基于该链码编码方式,分辨率为22.5°。于是,由植物的边缘曲线连续性质和曲线的跟踪算法得到链码表示的植物叶片轮廓曲线集。

算法实现描述如下:

1) 找到一起开始点(i,j),以其为中心点依次搜索(i+2,j),(i+2,j+1)…找到目标点后立即停止本次搜索,取得第一个链码数字,该目标点设置为下一中心点。

2) 设中心点为(x,y),依次搜索(x+2,y),(x+2,y+1)…找到目标点后判断其是否为上一目标点,如果是则继续搜索;如果不是,则停止搜索,取得链码值,把该目标点设置为下一中心点。

3)当搜索不到目标点时,则结束搜索,然后返回链码表。

3 植物叶片相关参数提取

3.1 轮廓曲线角点提取

角点是轮廓曲线上的高曲率点[3]。由微分几何原理:曲线的曲率为运动的不变量。因此,角点的准确提取对于匹配、识别及有关参数正确计算非常重要。曲线上某点 (x,y)的曲率定义为

ρ=(x,y)=|y〃|/(1+y′2)3/2 (1)

其中,y′,y〃分别为曲线上点(x,y)处的一阶和二阶导数。为简化运算、提高计算速度,不直接用曲率定义而是利用链码和链码差值性质确定轮廓曲线高曲率点。链码实际上为曲线点的方向矢量,具有位移不变性。链码链上相邻链码之差,反映该点的曲率性质,具有旋转不变性。为区别式(1)的定义,定义链码差表示的曲率为链码曲率。若方向矢量差值为逆时针旋转22.5°,定义链码曲率值为1;转45°,链码曲率值为2;依此类推,转157.5°,链码曲率值为7;180°,不可能。若顺时针旋转,则链码曲率值取负。如果顺时针旋转22.5°,其链码曲率值取-1,依此类推,不旋转,取0。轮廓线的链码曲率的数学表达式为

undefined

其中,Δ=tagi-tag(i-1)为第i个链码值。

不同于式(1)曲率定义,链码曲率的正负号与曲线跟踪的起点有关。曲线跟踪的方向不同,同一曲线的同一位置的链码曲率值符号相反,但绝对值相同,整个轮廓线链码曲率分布的相对关系与曲线跟踪的起止点的顺序无关。

由于量化、噪声和其它干扰,链码表示的轮廓线具有明显的阶梯效应,因此由式(2)定义的链码曲率检测高曲率点误差很大。作低通滤波修正,以该点邻域的链码差值的平均值代替式(2)中相邻链码差。修正表达式表示如下

undefined

3.2 植物叶片周长和面积的测量

3.2.1 尺寸的标定

要计算图片中的植物叶片的实际周长和面积,首先必须进行尺寸的标定,即单位长度和单位面积像素分别代表的实际的长度和面积。

取一个已知长度为m和宽度n的白色纸板(如图7所示),让其与待拍摄的植物叶片处于相对于摄像头的同一平面,对其进行二值化,再求它们的像素数。由于计算机视觉技术在计算某一区域的像素数时, 区域边界的像素完全被计算进来, 实际上, 边界的像素一半在物体内部, 另一半不属于物体[4],所以应在计算的像素数中减掉物体边界像素数的1/2, 作为物体的有效像素数。测量出参考物面积的像素数为SN0,其周长的像素数为LN0, 则有效面积像素数N0=SN0-LN0; 叶片面积的素数为SN, 其周长的像素数为LN,则叶片有效面积像素数为N=SN-LN。则叶片的实际周长为undefined,实际面积为mnundefined。

3.2.2 利用边缘链码计算叶片周长和面积的像素数

1) 周长像素数为

undefined

其中,m表示方向链中链码,n∈ (0,1,2,3)。

因为边界不为水平或垂直时,长度需要权重修正,修正后的边界的长度检测时可以弥补图像的离散化的误差。

2) 面积像素数。

设方向链为{a1 a2 a3 a4…αn},定义ai在x轴上的分量为aix,在y轴上的分量为aiy,设{x0,y0}是起点坐标,则

undefined

undefined

4 结论与分析

对植物叶片角点的提取,链码曲率越大对应边缘形状变化的角度越大,链码曲率值为正表示变化的角度为逆时针变化,为内角;为负表示变化的角度为顺时针变化,为外角;链码曲率值的绝对值a 对应变化的角度22.5°a,通过对a的判别,可以判断出叶片边缘的形状特征。如图8所示,标记出的点为本文识别出来的特征点,效果比较理想。

对植物叶片周长和面积的提取,通过标定,能够准确地计算出叶片的周长和面积,实验中采用的没有空洞的叶片,对于有空洞的叶片,可以同时检测内边缘,计算出空洞的面积,两者相减,即可得实际面积。

本文算法判别出的叶片拐点,基本反映出叶片的形状特征点。计算出的叶片周长和面积如表1所示。

参考文献

[1]苏玉梅.植物叶片图像分析方法的研究与实现[D].南京:南京理工大学,2007.

[2]刘关君,王大海,郭晓瑞,等.植物叶面积的快速精确测定方法[J].东北林业大学学报,2004(9):82-83.

[3]李翊华,胡匡祜,苏万芳.一种提取微血管边缘曲线角点策略[J].中国生物工程学报,1998(12):293-294.

[4]陆宗骐,童韬.链码和在边界形状分析中的应用[J].中国图像图形学报,2002(12):1323-1328.

[5]徐贵力,毛罕平,胡永光.基于计算机视觉技术参考物法测量叶片面积[J].农业工程学报,2002(1):154-157.

参数提取 篇5

关键词:面向对象,影像分割,纹理滤波,边缘检测

0 引言

当前智慧城市建设如火如荼, 其发展离不开基础数据的支撑。遥感影像分割技术作为信息提取的核心之一, 对信息提取的质量具有决定性意义。遥感影像信息量丰富, 地物形状结构复杂多样, 是影像分割过程中需要克服的难点。

面向对象影像分割有两个主要影响因素:分割尺度和分割参数。分割尺度决定生成影像对象的图斑大小。影像的分辨率差具有不连续性, 存在一定的阶梯类型现象, 不同类别的地物需要选择不同的分割尺度。传统影像分割技术主要依靠影像的光谱信息, 面向对象影像分割过程中, 除可以设置光谱因子、形状因子外, 还可以加入纹理、DEM等作为专题信息, 从而生成高同质性的影像图斑对象。为提高影像分割的质量, 本文提出将纹理信息和边缘检测信息作为专题, 参与面向对象影像分割的方法。

1 纹理信息提取

为获取较好的纹理信息, 本文在纹理信息提取过程中进行了大量的实验对比:一是对比五种纹理概率统计滤波与8种二阶概率统计滤波的提取效果, 并确定二阶概率统计滤波效果更好;二是分别选用3×3, 5×5以及7×7的窗口提取纹理滤波, 对比提取结果发现窗口大小为3×3时效果最好;三是对比二阶概率统计的8个纹理滤波, 并分别参与影像分割, 结果显示相关性 (Correlation) 纹理滤波参与分割的效果最佳。图1为分割结果。

从实验结果来看, 加入非相似性、同质度、方差以及对比度等纹理信息, 显示的分割结果特别破碎。而加入相关性纹理信息后分割效果相比不加纹理的分割效果有明显提高, 尤其是房屋的完整性及边缘分割效果非常好。

2 影像分割试验

利用canny算法对遥感影像的边缘进行检测, 不仅可以有效抑制非边缘信息的干扰, 而且还可以尽量定位到边缘的中心位置, 故而得到的边缘检测结果精度较高。将边缘检测的结果作为专题层参与影像分割, 对建筑物等边缘较为敏感的地物具有突出优势。

2.1 基本参数设置

本文采用面向对象的多尺度分割算法, 基于异质性最小原则进行区域合并。异质性指混合光谱 (标准偏差) 和形状 (紧致度和光滑度的偏差) 的异质性, 即以光谱度、光滑度、紧密度异质性最小为原则执行分割。影像对象的异质性计算公式如下:

光谱异质性计算公式为:

其中nObj1, nObj2, σcObj1, σcObj2为相邻区域的面积和方差, σc为像元内部象元值的标准差, wc为参与分割合并波段权重。

形状因子的平滑度 (hsmooth) 和紧密度 (hcompact) 的计算公式如下:

2.2 影像分割

本文将基本分割参数设置为尺度50, 形状因子0.3, 紧致度因子0.4, 并在此基础上添加边缘和纹理专题执行分割, 图2为分割效果的对比。

对比分析图2的分割结果看到, 只利用光谱信息参与分割, 会产生地物类别的混分现象, 不同性质的地块因为亮度值相似而被合并为一个影像多边形对象。而加入纹理和边缘专题后, 生成的多边形对象同质度较高, 且边缘清晰、完整, 使得分割效果有了非常明显的改善。

3 建筑物信息提取实验

本文选取了沈阳市和平区一块大小为2345pixel×2345pixel的IKONOS高分辨率遥感影像作为数据源。该影像拍摄于2010年, 其全色波段的空间分辨率为1m, 多光谱波段为4m。实验基于前面阐述的分割方法对影像进行分割, 然后针对建筑物的特征建立了知识规则, 并对影像中的建筑物信息进行了提取, 提取结果如图3所示。

图3为提取建筑物信息后叠加在原始影像上的结果, 红色部分为提取的建筑物信息。叠加结果显示:建筑物整体提取效果很好, 提取信息与原始影像中建筑物的大小、形状、位置基本吻合。

4 结论与展望

多尺度分割技术是面向对象分类方法的关键, 信息提取结果的好坏在很大程度上由前期影像分割结果的质量决定。就目前国内外的研究成果而言, 尚未形成最优分割参数的一致评价标准, 只能依靠进行大量的实验。

本文提出的将纹理和边缘检测结果作为专题层参与分割的方法, 大大降低了影像对象的异质性, 提高了影像分割的整体效果, 从根本上改善了建筑物信息提取的质量。面向对象多尺度分割过程中, 各参数的权重系数也是一个很重要的影响因子, 这也是下一步需要重点研究的内容。

参考文献

[1]CHEN Jianyu, PAN Delu, MAO zhihua.Optimum segmentation of simple objects in high-resolution remote sensing imagery in coastal areas[J].Science in china Series D:Earth Sciences, 2006, 49 (11) :1195-1203.

[2]孙晓霞, 张继贤, 刘正军.利用面向对象的分类方法从IKONOS全色影像中提取河流和道路[J].测绘科学, 2006, 31 (01) :62-63.

[3]Haralick R M.Statistical and Structural Approaches to Texture[J].Proceeding of the IEEE, 1979, (67) :768-804.

[4]张俊, 朱国龙, 李妍.面向对象高分辨率影像信息提取中的尺度效应及最优尺度研究[J].测绘科学, 2011, 36 (2) :107-109.

[5]Baatz M, Schape A.Multi-resolution Segmentation:An Optimization Approach for High Quality Multi-scale Image Segmentation[C].Information sverarbeitung XⅡ, 2000, (6) :12-23.

[6]Canny J.A Computational Approach to Edge Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, 8 (6) :679-698.

一种微波滤波器的参数提取方法 篇6

在微波滤波器的计算机辅助调试技术中, 首先要知道滤波器的状态参数, 比如耦合系数、频率漂移等。提取滤波器的状态参数的办法有提取它的耦合矩阵, 该方法通过采集矢量网络分析仪上被测滤波器的网络S参数, 通过优化、拟合得到网络参数的有理函数模型, 运用网络综合理论和矩阵旋转变换理论, 提取被测滤波器的耦合矩阵。对于耦合矩阵, 不同的拓扑结构会有不同的旋转序列。优化过程涉及到算法, 虽然有很多算法可以完成优化过程, 但其中的一些方法优化结果不稳定, 直接影响到网络综合的准确性。目前有2种算法能获得较稳定的优化结果。本文介绍的参数提取办法是通过建立滤波器的等效电路模型来实现的, 只要建立的电路模型比较精确, 它产生的S参数能够与根据指标综合得到的S参数基本吻合, 就能运用软件Designer的优化、拟合功能提取出电路模型的参数值。

1 参数提取的原理

软件Ansoft Designer有一个功能模块N-Port, 它的特性随用户定义的网络参数数据形式而定, 除了网络参数外没有其他相关的函数提供给它, 因此, 它被叫着黑匣子元件。提供的网络参数可以是复S参数、复导纳、复阻抗、复传播常数或者复终端阻抗。网络分析仪测量的S参数就是通过N-Port模块导入到软件中, 利用软件的优化功能, 完成参数提取。

参数提取首先要根据滤波器结构、指标建立滤波器等效电路模型, 等效电路模型的精确程度直接关系到参数提取的准确度, 因此, 在建立等效电路模型时, 除了要考虑滤波器结构外, 还要考虑各种影响因素, 比如网络分析仪的测试传输线对S参数相位的影响。参数提取前, 电路模型参数值的初值是根据滤波器的设计指标计算出来的理想状态下的电路模型参数值。将网络分析仪测量的S参数采集到计算机中, 通过软件Designer的优化、拟合功能, 最小化代价函数为:

undefined。 (1)

式中, Sundefined为电路模型产生的S参数;Smeasuredij为矢量网络分析仪实测的S参数。

通过软件让理想状态下的S参数曲线不断地逼近实测的S参数曲线, 最后理想状态下的S曲线与实测的S曲线拟合在一起, 这时电路模型的参数值就由理想状态下的参数值变成了实际状态下的参数值, 从而完成参数提取[1]。这种提取滤波器状态参数的方法与其他的方法相比在于它不用进行复杂的矩阵运算, 只要搭建的滤波器电路模型精确度较高, 就可以快速而准确地提取出滤波器的状态参数。

2 仿真实验及结果

通过对一个4节梳状线腔体滤波器实际状态参数进行提取, 来证明该方法的有效性。图1虚线框内是4节梳状线滤波器的等效电路模型。串联的RLC代表了一个谐振器, 其中R代表了谐振器的损耗。Z=K12、Z=K23、Z=K34的1/4波长传输线代表了谐振器之间的耦合, Z=K01、Z=K45的1/4波长传输线代表了谐振器与输入输出的耦合, Z=sqrt (50) 的1/4波长传输线代表阻抗变换, 阻抗为50 Ω的均匀传输线代表了由于输入输出耦合引起的频率漂移[2]。

电路模型中的参数通过式 (2) ~ (8) 计算出来。

式中, RW为滤波器的相对带宽;gi为滤波器低通原型的归一化元件值;f0为滤波器的中心频率;Q0为滤波器的未加载Q值。Q0可由下式求出[3]。

undefined。 (8)

式中, Cn为常数, 它与滤波器的节数和通带内起伏有关;ΔLA为滤波器中心频率处的插损的增量。

参数提取的电路图如图1所示。图中有一个模块N-Port, 通过它将网络分析仪测量的S参数导入到Designer中, 图1中电路参数的初始值是根据滤波器指标由式 (2) ~式 (8) 计算出的理想值。通过随机优化和梯度优化使得电路模型产生的理想S21曲线 (虚线) 不断地逼近实测的S21曲线 (实线) , 最后2种状态地S21参数拟合在一起, 就可以提取出滤波器实际状态地参数值。图2是拟合前的S21曲线, 图3是优化拟合完毕的S21曲线。从图中可以看出, 优化拟合的效果非常好。表1是理想状态参数值和失谐状态下提取的参数值。

3 结束语

本文介绍了一种微波滤波器的状态参数提取办法, 该方法通过建立微波滤波器等效电路模型, 运用软件的优化拟合功能, 对滤波器的状态参数进行提取。实验证明, 这一参数提取办法简单有效, 能够很快找出滤波器对应状态下的电路模型参数值。在滤波器计算机辅助调试中, 运用它可以进行灵敏度分析和状态参数的提取。

摘要:在微波滤波器的计算机辅助调试技术中, 必须要知道滤波器的状态参数。以往的方法主要是通过滤波器的耦合矩阵来求得它的状态参数, 但计算起来相当复杂。介绍一种简单易行的提取滤波器状态参数的方法, 该方法通过建立滤波器的等效电路模型, 运用软件的优化拟合功能, 从而提取出等效电路模型的参数值。实验证明, 只要搭建的电路模型精确度较高, 就能够迅速、准确地提取出滤波器的状态参数。

关键词:微波滤波器,参数提取,等效电路,状态参数,滤波器调试

参考文献

[1]HARSCHER P, VAHLDIECK R, AMARI S.Automated Test and Tuning Systemfor Microwave Filters[J].IEEE MTT-S, 2001, 29 (6) :1543-1546.

参数提取 篇7

关键词:说话人识别,特征提取,MFCC参数,随机共振

语音特征提取是指从语音信号中获取一组能够描述语音信号特征参数的过程。在理想情况下,这些特征应该具有以下特点:相对保持稳定;不易被模仿;尽量不随时间和空间变化等。MFCC参数具有良好的识别性能和抗噪能力,在目前的语音识别和说话人识别中极为常用。同时由于语音信号具有类混沌的特性[1],因而,部分学者利用随机共振原理对语音信号进行处理[2]。本文尝试了一种根据人耳听觉机理和随机共振理论[3,4]相结合的方法,将随机共振理论运用到提取MFCC参数的过程中。对标准MFCC参数提取过程和改进的MFCC参数提取过程进行研究,并对其在说话人识别中的效果做出了实验比较。

1标准的MFCC参数提取方法[5,6]

在语音识别和说话人识别中,MFCC(Mel频标倒谱系数)参数是将人耳的听觉感知特性和语音的产生的机理相结合,是目前大多数语音识别中广泛使用的特征参数。人耳具有一些特殊的功能,这些功能使得人耳在嘈杂的环境中,以及各种变异情况下仍能够正常地分辨出各种语音,其中耳蜗起了关键的作用。耳蜗实质上相当于一个滤波器组,耳蜗的滤波作用是在对数频率尺度上进行的,在1 000 Hz以下为线性尺度,而在1 000 Hz以上为对数尺度,这使得人耳对低频信号比对高频信号更加敏感。根据这一原则,研究者根据心理实验得到了类似于耳蜗作用的一组滤波器组,这就是Mel滤波器组。

MFCC参数的提取流程框图如图1所示,具体计算步骤如下。

(1) 语音信号经过预加重、加窗分帧处理后变为短时信号,用FFT将这些时域信号转化为频域信号。

(2) 求出频谱平方,即能量谱,并通过Mel频率滤波器组得到Mel频谱,并通过对数能量的处理得到对数频谱。

(3) 将上述对数频谱经过离散余弦变换(DCT)得到L个Mel频率倒谱系数。MFCC系数为

undefined。

(4) 将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。

2 改进的MFCC参数提取方法

2.1 基本原理

世界上所有的声音都是物体振动产生的声波在介质中传递的结果,因此声音的产生离不开振动的动力、振动的源头和振动的共鸣腔。语音说到底也是一种声音,因而也离不开振动的动力、源头和共鸣腔,只不过语音是由人类的发音器官各部分协同动作所产生的,比如说由声带颤动而产生的声带音是通过喉腔、咽腔、口腔、唇腔和鼻腔这五个共振腔才传到人的耳朵里。

同时,人的听觉器官内耳中的耳蜗也相当于一个共振器。耳蜗是一螺旋形骨管,绕蜗轴卷曲两周半。整个耳蜗由耳蜗隔膜隔成三个区域,中间的隔膜叫基底膜,上部为瑞士膜,中间区域称为耳蜗导管,上下两个区域分别称为前庭阶和鼓阶,前庭阶和鼓阶在尖端部分相通。1960年Von Bekesy用正弦信号对基底膜进行了详细的研究,原来,基底膜的听觉响应与刺激的频率有关,频率较低时,靠近耳蜗底部的基底膜产生响应,反之,频率较高时,靠近圆形窗的窄而紧的基底膜产生响应 [7]。

根据人的发音机理和听觉机理,我们认为可以用随机共振的原理对语音信号进行处理。从信号处理的角度来讲,在非线性系统中,当输入带噪信号时,以适宜的物理量来衡量系统特性,如信噪比等,通过调节输入噪声强度或系统参数[8],使系统特性达到一个最大值,此时,我们称信号、噪声和非线性随机系统产生的协同现象为随机共振。由于说话人语音信号自身的特性——语音信号中包含有准周期性信号和类噪声信号。因而,从理论上利用随机共振理论,是可以获得说话人语音信号的基本特征。

2.2 改进的MFCC参数提取过程

从上述基本原理,我们考虑将随机共振的原理运用到MFCC参数的提取过程中,这样就更加符合人耳的听觉特性,以期能够分辨多种语音,它的提取过程如图2所示,具体步骤如下。

(1) 抗混叠滤波指滤除高于1/2采样频率的信号成分或噪声,一般用低通滤波器实现。典型的抗混叠滤波器的技术指标是:通带内波动绝对值小于1 dB,通带带宽3 400 Hz,阻带衰减50 dB以上。

(2) 抗混叠滤波后,为了提升高频部分,使信号的频谱变得平坦,将滤波后的信号经过预加重数字滤波器H(z)=1-0.937 5 z-1。

(3) 将预加重后的信号,经过非线性随机共振系统(如图3),然后进行加窗分帧,这里使用的是汉明窗,再经过FFT变换得到频谱,并计算其短时功率谱。

(4) Mel滤波器组的设计。将短时功率谱从频域映射到Mel域,这里采用的24阶Mel滤波器组。

(5) 将短时功率谱经过滤波器后再作对数运算和DCT,就可以得到MFCC参数了。

3 实验和分析

实验采用自己录制的语音,录音人数为10人,其中6男4女。录音内容为贵州大学校训“明德至善,博学笃行”,长度为7 s。 将标准的和改进的MFCC参数提取方法在MATLAB2010b环境下进行仿真设计。图4为非线性随机共振系统的传输函数的特性。

以1号女生的语音信号作为测试语音,其他语音信号处理方法同1号。其测试结果如图5,图6,图7,图8。

从图7和图8可以看出,改进的MFCC参数输出线条更加清晰,更容易读取其特性。

同时,实验还对相同说话人和不同说话人进行仿真对比,其结果如图9和图10。

分别将标准的MFCC参数和改进的MFCC参数作为特征矢量通过识别系统,通过实验得到两种参数下系统的识别率如表1所示。

实验结果表明,改进的MFCC参数提取方法所得到的特征矢量提高了系统的识别率,说明基于随机共振的MFCC参数提取方法可行且非常有效。

4 总结和展望

本文介绍了说话人识别中MFCC参数的提取方法及其基于随机共振的改进方法,并对两种方法进行了比较,得出改进的MFCC参数提取方法在说话人识别中起到了更好的识别效果。在以后的实验和仿真过程中,将不断改进提取过程中的算法,可以进一步提高说话人识别的识别率。

参考文献

[1] Kumar A,Mullick S K.Nonlinear dynamical analysis of speech.JAcoust Soc Am,1996:615—628

[2]潘平,杨平,何朝霞.基于随机共振的说话人识别方法.电信科学,2010;(52):

[3]聂春燕.混沌系统与弱信号检测.北京:清华大学出版社,2009

[4]王俊国,周建中,付波,等.基于Duffing振子的微弱信号混沌检测.电子器件,2007:1380—1383

[5]韩纪庆,张磊,郑浩然.语音信号处理.北京:清华大学出版社,2008:84—85

[6]王炳锡,屈丹,彭煊.实用语音识别基础.北京:国防工业出版社,2004:148—149

[7]陈伟兵,周凌宏,肖中举.耳蜗基底膜振动模型的建立与应用.中国医学物理学杂志,2007:221—223

上一篇:复杂先天性心脏畸形下一篇:渗透特征