特征参数提取

2024-06-10

特征参数提取(精选11篇)

特征参数提取 篇1

1 语音学概述

1.1 汉语的音素、音节和音调

我们发现依据人类声音产生的机制, 由于激励方式的不同会形成清音和浊音两种不同的语音。由这两种语音又可以组合成两种不一样音素:元音及辅音。构成语音的最小单位是音素。元音由不相同的口腔形状发声而形成, 辅音的形成由发声的部位以及发声的方法决定。

音节是构成汉语的最小单位。我们所说的音节指的是一个元音加上一或两个辅音所构成的音素的组合。汉语当中包括以下4种音节, 即:元音、元音+辅音、辅音+元音, 辅音+元音+鼻音。一般汉语可以简单划分为声母+韵母两个部分。音节前部分的辅音称之为声母, 元音和元音后面有时候出现的鼻音称之为韵母。汉语可认为是一种声调语言, 根据声调的不同所表达的意思很可能完全不一样, 汉语共有阴平、阳平、上声及去声四种声调。而声调的变化可以看成浊音周期的变化。声调曲线从韵母起始点至韵母的终止点。

1.2 语音信号的数学模型

语音的产生是因为声道激励发生共振, 因为发声过程中声道是振动的, 所以能够用一个时变线性系统来描述。可以用如图1所示描述语音生成模型。

由图1可知一个完整的语音信号模型由激励模型、声道模型、及辐射模型三个子模型串联而成。激励模型由浊音激励与清音激励组成。对清音部分来说, 激励信号等同于白噪声, 而对于浊音部分来说, 因为声带在不断地张开与闭合, 所以会有间隙性的脉冲波产生。共振峰模型是当前广泛使用的一种声道模型。声道的终端是人类口与唇, 速度波通过声道输出, 然而语音信号是一种声压波。

2 语音信号的前端处理

为了得到我们所需要的信号, 须先对模拟语音信号进行数字化, 接着进行预处理与加窗。

2.1 语音信号的数字化

为将模拟语音信号转变为数字信号, 先对信号进行采样与量化。在采样与量化之前, 须进行语音信号的预滤波, 其目的在于:第一, 滤除高频噪声;第二, 防止50Hz的工频干扰。

2.2 语音信号的预处理与加窗

因为语音信号的平均功率受到鼻辐射以及声门激励的很大影响, 因此在语音信号频谱的求取时, 随着频率的增高相应的响应成分越小, 也就是说高频部分频谱比起低频部分来不够精确, 为此我们需要对信号进行预加重。为了平滑频域信号, 使得信号处理的后面阶段对有限长响应不那么敏感, 通常情况下让数字语音信号通过一个低阶的系统。目前广泛使用的是固定的一阶数字滤波器, 即

式中a为预加重系数, 通常取值0.95左右。

因为语音信号的特性是随时间变化的, 而非平稳过程, 但由于人的发音器官的肌肉运动速度比较慢, 因此可以认为语音信号是个局部的短时平稳的信号。因此, 我们对对语音信号进行分帧加窗的处理。通常情况下语音信号帧长取为10ms~30ms, 每秒帧数约为33~100, 分帧可以是连续的, 有可以是交叠分段的, 在语音信号的分析当中常用“短时分析”来表述。我们一般采用窗函数来乘语音信号, 常用的窗函数是Hamming窗。

Hamming窗函数是:

2.3 语音信号的端点检测

端点检测指的是找出语音信号中的各段落的起始点以及终止点的位置。语音信号的时域处理方法包括:短时平均幅度、短时能量、短时过零率以及短时自相关。端点检测一般要用到语音信号的短时能量以及短时平均过零率两中参数。

用En来表示第m帧的短时能量, 其计算式如下:

短时平均幅度Mn的计算式如下:1N-

短时能量En的最主要作用是:区分清音与浊音、区分声母与韵母的分界、无声与有声的分界、连字的分界以及能够用于进行语音识别。

“过零率”指的是在单位时间内信号通过零的次数。短时过零率z (m) 是用来描述频谱的简单有效的方法之一, 计算公式如下:

在短时处理技术中, 描述一个随机信号的其中一个重要特征是自相关函数Rn, 可以用自相关函数区分清音与浊音, 计算公式如下:

短时频域处理作为语音信号处理的基本方法之一。短时频域处理适合缓慢变化的语音信号。第m帧的短时傅立叶变换计算式如下:

3 语音特征参数提取

在完成语音信号的预加重、分帧、及端点检测之后, 下一步关键的是提取特征参数。我们不可能直接识别原始波形, 语音信号需要经过变换, 提取出其特征参数后再进行识别, 特征参数需要满足:反映语音的本质、参数个分量之间耦合尽量小、参数的提取方便等几方面的要求。目前语音识别中线性预测倒普参数LPCC、美尔倒普参数MFCC使两种较为常用的参数。LPCC利用线性预测编码技术求取倒普参数。MFCC则构造人的听觉模型, 以语音信号经过该模型的输出值作为声学特征, 直接利用离散傅里叶变换得到。

3.1 线性预测倒普参数LPCC的提取

线性预测分析是语音特征分析方法之一, 能够有效的解决短时语音信号的模型化问题。LPCC的基本原理:语音信号的每个样值可以通过过去的若干个值的线性组合逼近求得, 也能够用实际语音信号的抽样与线性预测的均方差值最小的方式, 求出一组预测值。

其中a为加权系数, p为线性预测倒普参数的预测阶数。

LPCC系数表示的是语音信号频谱极值点的变化, 用该系数来表征语音信号, 能够获得比较平滑的语音频谱图。

3.2 美尔倒普参数MFCC的提取

MFCC参数与LPCC参数不同, 它考虑了人耳的听觉特性, 先将频谱转变为美尔频标的非线性频谱, 接着再转换到倒普域上。因为MFCC比较地充分考觉特性, 所以MFCC参数有很好的识别性能与抗噪能力。由测试可得, MFCC参数性能在汉语语音识别中要明显优于LPCC参数, 由于人类在对1 000Hz频率以上的声音的感知能力并不遵循通常的线性关系, 它遵循的是对数频率坐标上的线性关系。

首先, 语音信号在经过预处理、分帧加窗后转变为短时信号, 经过FFT变换将x (n) 转化为X (m) , 并计算出其短时能量谱P (f) 。在将P (f) 在频率轴上的频谱转化为在美尔坐标上的P (M) 。接着在美尔频域内将在美尔坐标上加入三角带通滤波器得到滤波器组Hm (K) , 再计算美尔坐标上的能量谱P (M) 通过该滤波器组的输出值。最后在美尔刻度谱上能够采取修改的离散余弦反变换来求取美尔倒普参数:

式中, p为MFCC阶数。

4 结论

本文主要介绍了语音学的基础知识、语音信号的数字化及其特征提取, 为语音模型的训练做了很好的铺垫。在计算机普及的今天能够让计算机识别出人的自然语言是人们一直努力的一个方向, 对计算机直接用语言信息发号施令, 我们的双手才能真正得到解放。

参考文献

[1]胡航.语音信号处理.2版.哈尔滨:哈尔滨工业大学出版社, 2002:256.

[2]刘幺和, 宋庭新.语音识别与控制应用技术.北京:科学出版社, 2008:201.

[3]易克初.语音信号处理.北京:国防工业出版社, 2000, 14:363.

[4]李波, 王成友, 杨聪, 等.基于语音频谱包络抽取的MFCC算法.长沙:国防科技大学学报, 2004.

[5]桂苹, 吴镇扬, 赵力, 等.基于VQ的说话人自动识别系统的实现[D].东南大学, 2003.

特征参数提取 篇2

利用T/P卫星测高数据提取潮汐参数的研究

采用8年的T/P卫星测高数据在重复轨迹上以0.1°的密度进行中国近海及西北太平洋海域的`潮汐调和分析,通过上升与下降轨迹数据在交叉点处的分析结果的比较及沿轨分析结果与验潮站数据的比较,验证计算精度和可靠性,证实在大陆架浅海区域沿轨分析结果的精度与深海相当,现有全球潮汐模型在近海的不准确性完全是由于分析方法的分辨率不够造成的.

作 者:孙新轩 许军 暴景阳 SUN Xin-xuan XU Jun BAO Jing-yang  作者单位:海军大连舰艇学院,海洋测绘系,辽宁,大连,116018 刊 名:测绘通报  ISTIC PKU英文刊名:BULLETIN OF SURVEYING AND MAPPING 年,卷(期):2006 “”(7) 分类号:P2 关键词:沿迹分析   潮汐分析   精度  

以括号为特征提取字符 篇3

由于这些数据比较有规律,因此我们可以考虑使用公式进行提取,选择B2单元格,在编辑栏输入公式“=MID(A2,FlND("[",A2)+1,FIND("]",A2)-FIND("[",A2)-1)”,这里通过FIND函数以“[”和“]”作为关键字进行查找确定起始位置,利用MID函数从指定的起始位置起返回指定长度的字符;选择C2单元格,在编辑栏输入公式“=SUBSTITUTE(A2,TEXT(B2,"![0!"),)”,SUBSTITUTE函数是将A2单元格中的部分字符串以TEXT函数得到的内容进行替换.事实上就是A2单元格去除B2单元格的内容,执行之后向下拖拽或双击填充柄,很快就可以看到图2所示的效果。

如果使用的是Excel 2013/2016版本,那么也可以使用快速填充的方法实现上述要求,在B2单元格手工输入1234作为填充示例,选择B2:B12单元格,在“编辑”功能组依次选择“填充→快速填充”,或者按下“Ctrl+E”组合键即可,C列的数据提取可以采取类似的方法进行填充最终效果如图3所示。

提示:

管制指令特征参数提取研究 篇4

管制模拟机训练对空中交通管制学员的培养十分重要。但是,目前管制模拟机存在一个很大的不足,即需要学员或者老师轮流担任飞行员席位人员,配合完成训练。因此,研究将计算机语音识别技术[2]应用于空中交通管制学员的培训中,采用自动飞行员席位代替专人飞行员席位具有重要意义。

目前,美国、澳大利亚等研究将计算机语音识别技术应用于管制模拟训练机中,已有具体的研发产品。国内2000年后陆续有过相关研究,但都没有实质性的进展,原因主要有:

(1)现有的成熟语音识别引擎,其孤立词汇的识别率能达到97.1%[3],特定人的连续语音识别率也能达到90%以上;但是陆空通话中的语句几乎都是格式固定的句子,且非特定人,因此研究具有高识别率的语音识别引擎是一难点。

(2)管制指令词汇量相对较少,但较为特殊,发音与标准的英语或普通话有明显区别,即便利用成熟的语音识别引擎系统进行二次开发,语音模板库的建立和训练也异常复杂。

(3)从事陆空通话语音识别研究的科研机构或团队相对较少,目前主要是川大智胜、南京航空航天大学、民航大学等进行了初步探索[1,4,5,6,7,8]。

计算机语音识别的主要流程如图1所示。特征参数提取是识别结果的重要影响因素之一。好的特征参数必须能很好地反映语音的特征,并且各参数之间应有良好的独立性,易于提取,计算方便。

目前,最常用的特征参数提取方法主要有提取线性预测倒谱参数(linear prediction cepstrum coefficien,LPCC)和梅尔频率倒谱参数(Mel frequency cepstmm coefficient,MFCC)[9]。现有的管制指令语音识别相关文献中,特征参数提取方法对识别率的影响研究较少,本文研究上述两种方法分别对特定人和非特定人管制指令语音识别系统识别率影响。

1 管制指令的特征分析

管制指令专业特征强,发音和拼读极具特色,是一种严格程序化、标准化的语言。从语音到语法都包含二次人造痕迹,要求发音高度清晰、指令公式化、简练性、词语的单一意旨性及结构祈使性等。同时,管制指令词汇样本空间小、指令较少、重复率高且工作环境噪声低。

2 LPCC线性预测倒谱参数

LPCC参数方法是语音识别研究者采用最多的特征参数提取方法[10]。线性预测(LPC)分析的基本思想是用加权的过去若干个语音信号的采样值进行线性组合来近似出当前的语音信号的值[11]。LPCC由LPC推算得到,反应声道的响应,一般只需十几个倒谱系数就能较好的描述语音的共振峰特性[12]。

LPC分析的声道模型系统函数为:

式(1)中,p是LPC分析的阶数;ak为线性预测系数(k=1,2,…,p)。采用Durbin法来完成LPC系数的计算,求得p阶线性预测系数ak。

设H(z)的冲激响应为h(m),由式(1)变换得:

令式(2)中左右两边常数项和z的各次幂的系数分别相等,推出ak和之间的递推关系,如式(3)所示。

由式(3)可从预测系数{ak}求出倒谱便得到倒谱特征的统一表达式。

3 Mel倒谱参数

Mel频率倒谱参数的分析是基于人的听觉机理[13],即依据人的听觉实验结果分析语音的频谱,获得语音特性。MFCC分析依据的听觉机理包括:

(1)人主观感知域的划定并非线性,根据Stevens和Volkman的工作[14],有式(4):

式(4)中,Fmel是感知频率,mel;f是实际频率,Hz。Fmel和f的关系曲线如图2所示。将语音信号的频谱变换到感知域中,便能更好的模拟听觉过程。

(2)临界带。频率群相当于将人耳基底膜分成许多很小的部分,每一部分对应一个频率群,对应于同一频率群那些频率的声音,在大脑中是叠加在一起进行评价的[15]。按临界带的划分,将语音在频域上划分成一系列的频率群组成了Mel滤波器组。

在语音的频谱范围内设置若干带通滤波器,为滤波器的个数。每个滤波器具有三角形滤波特性,其中心频率为f(m),在Mel频率范围内这些滤波器是等带宽的。每个滤波器的传递函数如式(5)所示。其频率响应波形如图3所示,其中,

f(m)可以定义为:

式(6)中,f1和fh分别为滤波器频率范围的最低和最高频率;N为DFT(或者FFT)时的长度;fs为采样频率;F-1mel为Fmel的逆函数:F-1mel(b)=700(eb/1 125-1)。

每个滤波器组输出的能量为:

经离散余弦变换得到MFCC参数:

4 算例分析

4.1 隐马尔科夫(HMM)声学模型[16]实现

以管制指令中0~9十个数字的录音识别为例进行仿真分析,每个数字的发音见表1。用于模版训练的语音均是在实验室环境下录制的标准陆空通话男生和女生发音,8 kHz采样,16 bit编码,单声道输出,存储格式为*.wav。用“录音软件V3.91”共采集了0~9十个数字的录音250个,每个数字均为25个录音(其中男生三人15个录音,女生二人10个录音)。用于识别率检测的语音由2人录制完成,共100个,每个数字10个录音。

具体实现步骤为:

4.1.1 语音信号预处理

包括了语音信号的预加重、分帧和加窗、端点检测三部分。

(1)预加重。

预加重的目的是补偿高频分量的损失,提升高频分量。预加重的滤波器为:

式(9)中,a为预加重系数,本文取0.937 5。

(2)分帧加窗。

语音信号为准稳态信号,将其分为较短的帧(10~30 ms),每帧可以看做为稳态信号,便可用稳态的方法进行处理。同时,相邻两帧之间有(1/2~1/3帧长)的重叠部分,以便于帧与帧之间能平稳的过渡。

采用汉明窗,窗函数为:

式(10)中,N为窗长,本文取N=256;n为采样点。

(3)端点检测。

采用语音信号的短时平均能量和过零率进行端点检测[12],具有算法简单,易于实现,且能够较好的区分噪音和语音等优点。

4.1.2 语音的训练与识别

对语音信号进行预处理后,管制指令语音训练和识别过程中分别采用公式(3)和公式(8)的方法进行特征参数提取。采用HMM为管制指令语音建立声学模型。在识别时,采用后验概率的方法[17]对数字进行筛选及确认,以便更好地实现训练语音与待识别语音之间的匹配。

4.1.3 程序实现

采用Matlab软件进行实验仿真分析,为了避免繁琐的程序代码和大量的数值运算操作,利用Matlab GUI(图形用户界面)设计操作界面,如图4所示。该操作界面嵌入预先编辑成功的仿真程序,在后续的操作中无需知道代码的具体内容,只要了解操作步骤即可操作界面。

GUI界面的主要功能有实现语音特征参数提取方法的选择,利用HMM模型对语音进行训练,并显示训练的时间、识别时间及识别率。也可用于实现语音实时识别,语音的波形、识别时间及识别结果的显示。训练的进度由图5所示的进度界面显示。

4.2 实验结果及分析

试验中语音训练要求的精度均为5×10-6[18],语音模版的训练和语音识别分为特定人和非特定人,经十次训练和识别的实验结果平均值如下。

4.2.1 特定人

如表2和图6~图7所示,特定人的管制指令语音模板训练和语音识别中,特征参数提取环节采用LPCC参数的训练和识别速度分别约为运用MF-CC参数的2倍和1.7倍;训练和识别稳定性均为运用MFCC参数的1.5倍。运用二者的语音识别率均为100%。

4.2.2 非特定人

如表3和图8~图10所示,非特定人的管制指令语音模板训练和语音识别中,特征参数提取环节采用MFCC参数的训练和识别速度比运用LPCC参数的分别快150 s和5 s;训练和识别的稳定性都略高于运用LPCC参数的。运用MFCC参数的识别率比LPCC参数的高13%。

由实验结果可知,特定人的语音识别中识别率都为100%,但是模板训练和识别的时间却相差较大,若研究记录特定管制员发送指令的次数和时间、管制员疲劳的评估等,可采用速度快、效率高的LPCC特征参数提取方法。若研究对象为非特定管制员,则可采用语音模板训练和识别速度快、识别率高的MFCC特征参数提取方法。

5 结束语

特征参数提取 篇5

摘要:脉冲神经元可以被用于处理生物刺激并且可以解释大脑复杂的智能行为。脉冲神经网络以非常逼近生物的神经元模型作为处理单元,可以直接用来仿真脑科学中发现的神经网络计算模型,输出的脉冲信号还可与生物神经系统对接。而小波变换是一个非常有利的时频分析工具,它可以有效的压缩图像并且提取图像的特征。本文中将提出一种与人类视觉系统的开/关神经元阵列相结合的脉冲神经网络,来实现针对视觉图像的快速小波变换。仿真结果显示,这个脉冲神经网络可以很好地保留视觉图像的关键特征。

关键词:快速小波变换;脉冲神经元网络;图像压缩;特征提取

中图分类号:TP183文献标识码:A

1引言

众所周知,拥有超级智能的大脑通过一个非常庞大且复杂的神经网络来处理信息。随着脑神经科学研究进展,发现了许多大脑处理感知信息的神经网络计算模型。Hodgkin-Huxley脉冲神经元模型于1952年由Hodgkin和Huxley提出。以此神经元模型为基础,之后的科研工作者提出了一套更加靠近生物神经网络的脉冲神经网络理论,这被称为第三代人工神经网络。脉冲神经网络以非常逼近生物的神经元模型作为处理单元,可以直接用来仿真脑科学中发现的神经网络计算模型,输出的脉冲信号还可与生物神经系统对接。因此,可将脑神经科学与人工智能科学有机地结合起来,这对于人工智能系统和计算机视觉的研究有重要意义。近年来基于这种模型的神经网络的研究层出不穷[1-3]。但是这种模型一旦被应用于大型网络仍将会面临非常复杂的计算量[4]。因此,针对脉冲神经元网络(spikingneuronnetwork,SNN)中的各个单个神经元,我们将使用简化后的基于电导率的累积放电模型进行计算[5]。在人类视觉系统中,从初级视觉皮层中的细胞到视网膜和外侧膝状体核中的简单细胞都有着不同的感受野[6-8]。视觉图像在这些神经元中以脉冲训练的形式通过ON或OFF通道进行传输[9-10]。假设每一个神经元都接收来自开神经元的激励型突触和关神经元的抑制型突触的脉冲训练。不同的开/关通路以一种生物方式被用于构建特定的网络[11]。在神经网络的研究方面,国内学者也有着出色的进展。如蔺想红等人在脉冲神经网络的理论研究方面进行了细致的研究[12-13],而在其应用方面也有着可喜的进展,具体可参考文献[14-15]。另一方面,基于小波变换能够有效的提取图像的关键特征[16-18],在本文中,一个特定的基于小波变换算法的脉冲神经元网络将被提出并用于模拟人类视觉系统中的脉冲神经元的行为,同时此网络可以提取出视觉图像的主要特征信息。

2快速小波变换算法

Mallat于1987年提出了快速小波变换(fastwavelettransform,FWT)[19-20]。快速小波变换是一种实现离散小波变换的高效计算方法。二维快速小波变换的计算流程图如图1所示。

如图1所示,f(m,n)为数字输入信号,h0(m,n)是低通滤波器的冲激响应,h1(m,n)是高通滤波器的冲激响应,h0(m,n)和h1(m,n)共同组成了分析滤波器组。2表示间隔性下采样。当输入信号连续通过各个滤波器并分别作下采样操作后,最终得到的四个信号即为小波变换的近似系数wA,水平分量wH,垂直分量wV和对角分量wD。

3构建基于快速小波变换算法的脉冲神经

元网络

基于Mallat算法和视觉系统开/关通道机制[11,21,22],本文建立了一个累积放电的脉冲神经元模型,记为SNNFWT模型,如图2所示。

计算技术与自动化2016年3月

第35卷第1期张振敏等:基于生物机制脉冲神经网络的特征提取

其中,输入神经元阵列的维度是M×N。图像的每一个像素相当于一个信号接收器。假设Gm,n(t)表示一幅图像像素的灰度级,每一个光接收器都将像素亮度转化为突触电流Im,n(t)[23-25]。那么电流Im,n(t)和神经元的膜电压vm,n)(t)将满足以下公式:

dlm,n(t)dt=-1τIm,n(t)+αGx,y(t)(1)

cdvm,n(t)dt=gl(El-vm,n(t))+Im,n(t)+I0(2)

其中m=1,…,M;n=1,…,N;a,τ是常数,gl是膜电导,El是反转电势,c表示膜电容,I0是背景噪声。如果膜电压超过了门限值vth,那么神经元就发出一个脉冲。令Sm,n(t)表示这个神经元所产生的脉冲训练:

Sm,n(t)=1ifneuron(m,n)firesattimet.

0ifneuron(m,n)doesnotfireattimet.(3)

中间神经元阵列第一层由三个维度是M×(N+1)的神经元阵列构成,如图2所示。前两个是开神经元阵列,记为1ON1(p,q)和1ON2(p,q),第三个是关神经元阵列,记为1OFF(p,q),其中p=1,…,M;q=1,…,N+1。快速小波变换的卷积运算就相当于不同神经元阵列的累加。假设脉冲训练通过激励型突触W1ON1(p,q),W1ON2(p,q)和抑制型突触W1OFF(p,q)被传送至开/关神经元阵列。突触强度分布设置为:

W1ON1(p,k)=αONf(p,q),W1OFFi(p,q)=αOFFf(p,q)(4)

其中i={1,2},1≤p≤M,1≤q≤N。如果i=1,k=q,那么k=q+1。aON=1/√2,aOFF=-1/2。突触电流I1ON1(p,q)(t)和I1OFF(p,q)(t)由电流约束方程计算得到:

dI1σ(p,q)(t)dt=-1τI1σ(p,q)(t)+

∑Mp=1∑N+1q=1W1σ(p,q)β1Sσ(p,q)(t)(5)

其中σ∈{ON,OFF},Sσ(p,q)(t)表示脉冲训练。开/关阵列的神经元电压则由电压约束方程得到。

中间神经元阵列第二层由两个维度是M×(N+1)的神经元阵列2ON(p,q)和2OFF(p,q)构成。每一个神经元都接收来自激励型突触W2ON(p,q)和抑制型突触W2OFF(p,q)的脉冲训练,设置方式如下:

W2ON(p,q)=

W1ON2(p,2)-W1OFF(p,q),ifW1ON2(p,q)-W1OFF(p,q)>0

0ifW1ON2(p,q)-W1OFF(p,q)≤0(6)

W2ON(p,q)=

-(W1ON2(p,2)-W1OFF(p,q)ifW1ON2(p,q)-W1OFF(p,q)<0

0ifW1ON2(p,q)-W1OFF(p,q)≥0(7)

其中1≤p≤M,1≤q≤N+1。开/关阵列中的突触电流和神经元电压仍旧由电流和电压约束方程计算得到。

中间神经元阵列第三层同样由两个维度为M×(N+1)的神经元组成。在这些阵列中神经元被记为3CN1*(p,q)和3CN2*(p,q)。其中的突触强度分布可以通过下述方程计算得到:

W3CN1*(p,q)=W1ON1(p,q)+W1ON2(p,q)(8)

W3CN2*(p,q)=W2ON(p,q)+W2OFF(p,q)(9)

突触电流的计算方程为:

dl3CN1*(p,q)(t)dt=-1τI3CN1*(p,q)(t)+

∑Mp=1∑N+1q=1W1ON1(p,q)β2Sp,q(t)-

∑Mp=1∑N+1q=1W1ON2(p,q)β2Sp,q(t)-(10)

dI3CN2*(p,q)(t)dt=-1τI3CN2*(p,q)(t)+

∑Mp=1∑N+1q=1W2ON1(p,q)β2Sp,q(t)-

∑Mp=1∑N+1q=1W2OFF(p,q)β2Sp,q(t)-(11)

其中,β1,β2是常量。

在信号累加完成之后,对3CN1*和3CN2*层的神经元进行设置,即令只有偶数列的神经元会被激发从而发出脉冲信号,而奇数列的神经元则不会被激发。之后将两个新得到的神经元阵列记为3CN1和3CN2。突触强度将由下式计算得到:

W3CNi(p,q)=W3CNi*(p,2k)(12)

其中i={1,2},i=1,2,…,N/2;1≤p≤M,1≤q≤N/2。此后网络中的剩余的突触强度分布的计算都由类似的迭代方式和下采样方法计算得到。最终我们可以获得四个输出神经元阵列OUT1,OUT2,OUT3和OUT4,这些神经元层的激发率的计算公式如下:

rOUT{j}(m,n)(t)=1T∑t+TtSOUT{j}(m,n)(t)(13)

其中j={1,2,3,4},SOUT{j}(m,n)(t)表示输出阵列的脉冲训练。

4基于SNNFWT网络提取图像特征

本文中将利用Matlab软件对所构建的脉冲神经元网络SNNFWT进行仿真测试。在实验中根据Euler方法,步长设置为0.1ms。根据生物神经元特性将参数设置如下:vth=-60mv,El=-70mv,gl=1.0ms/mm2,c=8nF/mm2,τ=16ms,T=400ms,α=0.02,β1=4.3,β2=5.1,I0=7μA。这些参数可以被调整以获得高质量的输出图像。

实验中所使用的测试图像如图3所示。图3(a)为高斯灰度分布图像,像素为16×16。图3(b)为Lena图像,该图像是在图像处理领域广泛使用的基准图像,大小为512×512。

(a)高斯分布图(b)Lena图像

图中横纵坐标均表示像素位置,黑白色条表示图像灰度范围在0~255

高斯图像的测试结果如图4所示。其中,图4(a)-(d)是高斯图像经过Mallat小波变换得到的四个变换系数。图4(e)-(h)则是通过SNNFWT脉冲神经元网络所得到的四个近似结果。图4中所有图像维度为8×8,分辨率为原始图像的四分之一。

Lena图像的实验结果如图5所示。实验中,由于该图像维度超过了Matlab默认的矩阵维度,因此该图像被切割为32×32个子块,每个子块的像素数是16×16。图5(a)-(d)是通过数学方法所得到的结果,图5(e)-(h)的结果则来自于脉冲神经元网络。以上实验结果说明所构建的脉冲神经元网络可以实现与小波变换类似的特征提取工作,同时又忽略了微弱的噪声信息。众所周知,图像的主要能量,即图像的主要信息被保存在其低频分量中,而高频分量则只含有较少的能量信息。与数学方法实现小波变换相比,尽管视觉图像信号通过了复杂庞大的神经元网络并且丢失了一些细节,但是最终保留了所有的低频分量,只有一些最高频分量损失。

图6显示了原始图像和经过SNNFWT网络的一阶和二阶的近似系数图像。从二阶图像效果上看,尽管信号经过了两组复杂神经元网络,整体能量有所降低,但是图像的关键信息,比如人物和背景轮廓,草帽以及面部细节信息都仍然被很好的保留下来。

5讨论

在文章中,我们提出了一个结合了生物神经元开/关通道和突触电流机制的累积放电脉冲神经元网络来提取视觉图像的特征信息。在模型构建的过程中,不同神经元阵列的累加被用于实现FWT的卷积运算,而神经元的选择性激发替代了下采样算法。仿真结果显示了这种SNN算法可以实现FWT。并且在通过了复杂的脉冲神经元网络之后,图像的关键信息得以很好保存。

参考文献

[1]MEROLLAPA,ARTHURJV,ALVAREZR.ARTIFICIALBRAINSAmillionspikingneuronintegratedcircuitwithascalablecommunicationnetworkandinterface[J].Science,2014,345(6197):668-673.

[2]RICHMONDP,COPEA,GURMEYK.FromModelSpecificationtoSimulationofBiologicallyConstrainedNetworksofSpikingNeurons[J].Neuroinformatics,2014,12(2):307-323.

[3]HUT,GENKINA,CHKIOVSKIIDB.ANetworkofSpikingNeuronsforComputingSparseRepresentationsinanEnergyEfficientWay[J].Neuralcomputation,2012,24(11):2852-2872.

[4]HODGKINAL,HUXLEYAF.Aquantitativedescriptionofmembranecurrentanditsapplicationtoconductionandexcitationinnerve[J].TheJournalofphysiology,1952,117(4):500-544.

[5]MULLERE.SimulationofHighConductanceStatesinCorticalNeuralNetworks[M].Mastersthesis.UniversityofHeidelberg,2003.

[6]MASLANDRH.Thefundamentalplanoftheretina[J].Natureneuroscience,2001,4(9):877-886.

[7]TAYLORWR,VANEYDI.Newdirectionsinretinalresearch[J].Trendsinneurosciences,2003,26(7):379-385.

[8]KANDELER,SHWARTZJH.PrinciplesofNeuralScience[M].EdwardAmold(Publishers)Ltd,1981.

[9]DEMBJB.Cellularmechanismsfordirectionselectivityintheretina[J].Neuron,2007,55(2):179-186.

[10]NELSONR,KOLBH.OnandOffPathwaysintheVertebrateRetinaandVisualSystem[M].MITPress,Cambridge,Lonton,2003.

[11]WUQX,MCGINNITYTM,MAGUIREL,eta1.SpikingNeuralNetworkPerformsDiscreteCosineTransformforVisualImages[C].EmergingIntelligentComputingTechnologyandApplications:WithAspectsofArtificialIntelligence,2009,5755:21-29.

[12]蔺想红,王向文,张宁,等.脉冲神经网络的监督学习算法研究综述[J].电子学报,2015,43(3):577-586.

[13]张玉平,蔺想红.基于卷积计算的多层脉冲神经网络的监督学习[J].计算机工程与科学,2015,37(2):348-353.

[14]刘海华,庄如云.脉冲神经网络自适应侧连接的运动检测[J].中南民族大学学报,2014,33(2):65-71.

[15]李奕,吴小俊.粒子群进化学习自适应双通道脉冲耦合神经网络图像融合方法研究[J].电子学报,2014,42(2):217-222.

[16]DAUBECHIESI.TenLecturesOnWavelets[M].SocietyforIndustrialandAppliedMathematics,61,1992.

[17]CHUICK.AnIntroductiontoWavelets[M].AcademicPress,NewYork,1992.

[18]CLIN,L.ATutorialoftheWaveletTransform[D].GraduateInstituteofCommunicationEngineeringofNTU,2010.

[19]MALLATSG.Atheoryformultiresolutionsignaldecomposition:thewaveletrepresentation[J].IEEETransactionsonpatternanalysisandmachineintelligence,1989,11(7):674-693.

[20]MALLATS.AWaveletTourofSignalProcessing[M].AcademicPress,2008.

[21]WUQX,MCGINNITYTM,MAGUIREL,etal.2Dcoordinatetransformationbasedonaspiketimingdependentplasticitylearningmechanism[J].NeuralNetworks,2008,21(9):1318-1327.

[22]WUQX,MCGINNITYM,MAGUIREL,etal.LearningMechanismsinNetworksofSpikingNeurons,StudiesinComputationalIntelligence[J].StudiesinComputationalIntelligence,2006,35:171-197.

[23]WUQX,MCGINNITYM,MAGUIREL,etal.EdgeDetectionBasedonSpikingNeuralNetworkModel[M].SpringerBerlinHeidelberg,2007.

[24]WUQX,MCGINNITYTM,MAGUIRELP,etal.Learningunderweightconstraintsinnetworksoftemporalencodingspikingneurons[J].Neurocomputing,2006,69(16-18):1912-1922.

特征参数提取 篇6

可靠性一词源于1957年AGREE的学术报告, 它在说话人识别技术应用中具有丰富的涵义。具体到技术运行的可靠性, 通常称为支持可靠性[1]。支持可靠性通过固有可靠性和使用可靠性两方面来表现, 这两方面涵盖了技术研究和投入使用两方面的全过程。固有可靠性是指技术内在的可靠性, 它在技术的研发过程中得以确立。技术的仿真、结构的设计、工艺的科学性以及检验方法决定了固有可靠性, 而使用可靠性则与技术的实现环境和实现方法密切相关, 它更多的取决于技术的操作方法等众多外界因素, 另外产品的研发者的素质对使用可靠性也会产生很大的影响。[2]

1 我国说话人识别技术研究现状

在我国, 由于汉语在发音和结构上的独特性, 语音信号的特征参数和行为规范比较复杂而多变, 国外的说话人识别技术无法直接应用, 这给中国的说话人识别技术带来了很大的困难和挑战。但是近几年来, 国内外众多科研机构、高校实验室以及高科技公司都对汉语的说话人识别技术投入了很大的精力, 国内外一些重点实验室、研究所以及一些公司等都通过自身的努力和互相间的合作, 对说话人识别技术的研究做出了很大的贡献。

2 语音特征参数提取及组合

2.1 线性预测倒谱系数提取的实现

本文中所做实验中语音特征参数选用线性预测倒谱系数 (LPCC) 、美尔倒谱系数 (M FCC) 。

实验中需要先取取线性预测系数 (LPC) , 在LPC的参数求出的条件下再进行LPCC计算, 这是因为由于不能直接提取到线性预测倒谱系数。这一过程的实现可采用MATLAB软件语音处理工具箱中的lpc函数进行提取, 它的实现语句是:

这里x为一帧语音, p为计算LPC参数的阶数。MATLAB语音处理工具箱中也提供了计算实复倒谱系数的函数cceps, 如果不考虑计算量, 可以用下面的函数计算一帧语音信号x的LPCC系数:

该程序中首先计算x的LPC系数, 由于函数cceps不是基于递推公式的, 因此要保留所有阶的LPC系数, 即a的长度与序列x的长度相同。当然, 这种方法在一个实际的语音系统中是不能采纳的, 因为计算量太大。因此, 采用迭代算法计算LPCC参数的程序如下[3]:

此段代码中, 假设LPC系数的阶数为14, LPCC系数的阶数为16, 前10阶LPCC系数通过10阶LPC迭代计算, 后2阶LPCC则是通过外推得到的。

2.2 美尔倒谱系数提取的实现

在MATLAB语音处理工具箱中, 计算MFCC的函数为melcepst, 其中调用了计算滤波器系数的melbankm函数, melbankm的语法为:

其中, m为滤波器个数, n为语音帧长度, fs为采样频率。例如, 设计一个滤波器组, 包含24个滤波器, 语音信号的帧长度为256, 信号采样频率为8000Hz, 所用的命令为:

利用函数melcepst可以直接计算语音信号s的MFCC参数

这一命令默认地以256点为帧长计算12阶的MFCC参数。如果s比较长, 将会按照128点的间隔将s分为若干帧, 再分别计算。由于本系统要获取16阶的MFCC系数, 且语音的帧长为256点, 帧移128点, 因此不能直接采melcepst函数。修改后的计算MFCC的函数如下:

2.3 语音参数的特征组合

图1为本文所采用的组合方式, 将LPCC与MFCC两个特征组合为一个特征Com。具体特征组合方法如下:

其中, p为MFCC的维数, q为LPCC的维数。

通过仿真得出的组合特征参数的图如图1所示。

组合特征参数图中, 横坐标取MFCC和LPCC各20帧, 纵坐标为所对应参数值的数值。语音参数中不同的特征是基于不同的模型, 本文中LPCC是基于声道模型, MFCC则是基于人的听觉模型, 不同类型的特征向量表征了人的不同特性, 通过特征组合采用多种向量组合有利于从不同的角度体现说话人个性。

单独使用某一参数只能反映某一方面的特性, MFCC反映的是说话人语音的听觉频率非线性特性, LPCC反映的是说话人声道生理结构的差异, 使用组合特征参数LPCC弥补了MFCC声道不能描述声道的特征, 语音识别中利用组合特征参数能较好的反映说话人的个性特征, 能够提高说话人识别率。

3 结语

本论文主要目的是对语音特征参数的组合进行研究, 通过参数的特征组合从不同的角度来反映说话人的个性特征, 能够大大提高说话人识别系统的识别率。本文首先对说话人识别的基本知识及研究历程做了介绍, 其中涉及到了说话人识别常用的特征参数以及利用特征参数进行说话人识别存在的技术难点。其次对语音信号的基本处理进行阐述, 说话人识别归根到底就是对说话人语音的识别, 所以对语音信号的处理是一项很重要的工作, 本文所用的特征参数 (MFCC及LPCC) 的特性及提取过程进行了详细的解释。

摘要:本论文重点对语音特征参数的组合进行了研究, 通过参数的特征组合从不同的角度来反映说话人的个性特征, 能够大大提高说话人识别系统的识别率。对其中的特征参数 (MFCC及LPCC) 的特性及提取过程进行了详细的解释和仿真。

关键词:说话人识别技术,线性预测倒谱系数,语音参数

参考文献

[1]史绍强.基于多级小波神经网络的模糊说话人识别研究[D].长沙理工大学学位论文, 长沙:长沙理工大学, 2004.

特征参数提取 篇7

当今说话人识别领域使用的特征参数有多种, 它们各具特点, 能够用于各种不一样的场合, 其中应用较为广泛的具有代表性的特征参数是:基音频率、线性预测系数 (LPC) 、线性预测倒谱系数 (LPCC) 、梅尔倒谱系数 (MFCC) 。

2 MFCC的提取与分析

梅尔倒谱系数 (MFCC) , MFCC是利用人耳听觉模型建立的倒谱系数, 人类的听觉系统可以看成一个非线性系统, 它对于不同的频率信号的灵敏度是不一样的, 一般是对数型关系。正是由于Mel倒谱系数基于人耳感知这种特殊的特性, Mel倒谱系数在抗噪声能力以及鲁棒性这些方面都比其它特征参数要优秀了很多。

对于不一样频率的语音, 人耳有不一样的感知能力, 声音的物理频率表示单位是梅尔 (Mel) 。频率和MFCC系数的关系如下式:

其中, f的单位为Hz。参照Zvick的研究所说, 临界带宽按照频率不同而改变, 在1000Hz以下时, 维持线性分布, 带宽在100Hz附近;在1000Hz以上时, 表现为对数增长形式, 如图1所示。

Mel参数的提取过程:

(1) 把之前预处理过的语音信号, 即时域信号做傅里叶变化 (DFT) 。计算得到线性频谱x (k) , 其转换公式为:

(2) 把上面的频谱x (k) 通过Mel滤波器组生成Mel频谱。

(3) 接着对Mel频谱做对数能量处理, 得到对数频谱S (m) 。图2所列即为得到的线性能量谱, Mel能量谱和对数能量谱。

最后, 将S (m) 通过离散余弦变换 (DCT) 获得倒谱频域, 即Mel频谱倒谱系数 (MFCC参数) :

摘要:提取特征参数在说话人识别系统内是非常重要的步骤, 说话人语音的很多特有个性信息包含于特征参数内, 例如发声特征或者语义特征, 利用特征提取的方法一方面可以去掉声音里没用的冗余信息, 剩下有用的体现说话人个性不同的特征信息, 特别是可以有效减少计算量、模板数目以及存储空间。选用的特征参数的会直接关系到整个系统的工作性能, 良好的特征参数需要拥有好的稳定性和好的独立性, 一方面可以不受到外界情况的干扰, 不容易为其他的声音所替代, 另一方面, 能够较好的辨别不同说话人, 说明说话人之间的差异。

关键词:特征参数,倒谱系数,LPCC,MFCC

参考文献

[1]M.Chetouani, M.Faundez-Zanuy, B.Gas, and JL.Zarader.Investigation on LP-residual representation for speaker identification, Pattern Recognition.2009, 3 (42) :487-494.

[2]林琳, 王树勋, 郭刚.短语音说话人识别新方法的研究.系统仿真学报, 2007, 19 (10) :2272-2275.

特征参数提取 篇8

关键词:番木瓜,逆向工程,曲面重建,参数提取

0 引言

获取番木瓜果实三维体表形状和几何特征信息是研制开发番木瓜自动采摘装备的前提与基础[1,2]。现有测量果实体表形态和几何特征参数的方法主要有游标卡尺测量和二维图像采集分析方法。游标卡尺测量仅能获取果实二维最大轮廓极限数据; 图像采集分析方法以计算机图像处理为基础,可拟合出果实二维外形曲线,获得果实二维外形轮廓特征,但仍难以准确再现果实三维非规则的自由曲面形状[3,4,5,6]。逆向工程( Reverse Engineering,RE) 是一项对复杂外形曲面有很好适应性的工程反求技术,是将实物转变为三维CAD模型的数字化技术、几何建模技术和产品制造技术的总称,具有快速、精确地获取实物三维几何数据信息的优点,已经成为CAD /CAM系统中一个研究和应用热点[7,8,9,10,11,12]。为此,本文基于逆向工程对番木瓜果实进行三维扫描和处理,实现番木瓜体表数据信息的采集与三维实体重构,提取并分析番木瓜果实外形特征参数,为番木瓜机械采摘末端执行器的结构设计提供基础。

1 番木瓜的点云数据采集和预处理

1. 1 材料与方法

根据测量探头是否与零件表面接触,逆向工程中物体表面三维点云数据获取方式大致可以分为接触式和非接触式两大类。非接触式同时拥有捕获速度快和精度高的特点,在逆向工程中应用最为广泛。我国常见番木瓜品种三维尺寸在100mm × 100mm ×200mm范围内[13],依据采摘装置设计与分析要求,番木瓜体表几何数据信息采集精度应在#0. 1mm之内。综合测量对象、测量精度、测量灵活性与性价比等因素,选取非接触式的Sense 3D激光扫描仪,其三维方向扫描尺寸为0. 2 ~ 3m,分辨率为0. 4mm,具有外形尺寸小、扫描范围广、扫描速度快、成像显著等优点。其配套Sense软件能使整个扫描操作简单,并带有编辑工具,能对扫描的点云数据进行预处理。

扫描对象选取华南农业大学园艺学院种植试验田的台农2 号品种的番木瓜,果实成熟度为一线黄。将番木瓜的上部果梗处及底部固定在转动支架上,将室内灯光调节均匀明亮,使扫描物体颜色更加真实。根据番木瓜果体大小选择Sense软件中的物体类型和大小,定位校准扫描距离为380mm,确保扫描图像放置在软件屏幕中心后开始扫描。扫描开始后,缓慢转动支架,确保扫描图像放置在软件屏幕中心,如扫描过程中出现Lost Tracking,需重新定位扫描。

1. 2 点云数据预处理

扫描完成的图像存在大量杂质,且带有支架等特征信息,需要进行点云数据预处理,如图1( a) 所示。首先利用Sense软件自动滤除杂质,分割图像仅保留与研究相关的番木瓜果体,如图1( b) 所示; 再剪裁由于去除模型扫描干扰产生的棱角,填充分割模型产生的孔洞; 最后经由渲染、实体化处理得到点云数为41568、三角形数为83 043 的初步的番木瓜模型,如图1( c) 所示。

2 番木瓜模型曲面重建

2. 1 曲面重建方法

测量数据处理是逆向工程的关键环节,其结果直接影响后续模型重建质量。Geomagic公司的Geomagic Studio是当前市场上具有代表性的逆向工程设计软件之一,能对点云进行很好的拼接和精简,支持多种测量设备文件格式读取和转换、海量点云数据的预处理、智能化NURBS曲面构建等。其新增的Fashion模块可以通过定义曲面特征类型来捕获物理原型的原始设计意图,并拟合成精准的CAD曲面[14],因此选取Geomagic Studio软件进行对点云数据的处理和曲面重建。

基于Geomagic Studio软件对番木瓜的点云数据精简处理及曲面重建主要包括点阶段、多边形阶段和形状阶段。点阶段主要进行数据格式转换、数据对齐、噪声去除、数据平滑、数据精简和点云数据三角形网格化,目的是建立完整、整齐、有序及可提高处理效率的点云数据。多边形阶段主要进行缺失数据修补、边界编辑、修复相交三角形和截面特征线提取,目的是获取光顺、完整的三角面片网格及零件的轮廓几何特征线。形状阶段是对具有复杂、不规则曲面且曲面质量和模型精度要求不高的模型,对三角面片网格分片得到子网格曲面直接拟合NURBS曲面,从而得到一个理想的曲面模型,具体工作流程如图2 所示。

2. 2 点阶段处理

将点云数据预处理生成的番木瓜模型PLY文件导入Geomagic Studio软件进行点阶段处理。通过Adjust Colors将点云进行着色,更清晰、方便地观察番木瓜点云的形状,如图3 ( a) 所示。利用Select Disconnected和Delete Outliers模块中的Low Separation去除离主点云很近但不属于它们一部分的223 个点,结合Sensitivity把离番木瓜主体较远的点云全部删除,如图3( b) 所示。分离去除不多于Size 5. 0 的点云数据,即去除5% 的点云总量,点云数减少到39 277,减少点云数量的同时提高后续处理效率,如图3 ( c) 所示。进行Reduce Noise处理时,Third Smoothness Level使数据平滑,Deviation Limit降低模型偏差点的偏差值为0. 1mm,其他参数保持默认值,以便于封装时点云数据统一排布,更好地表现真实的番木瓜形状。再利用Uniform Sample模块中的0. 6mm Spacing保持模型精确度,减少点云数据量,提高运算效率。最后,确定Surface Wrap Type,依据初始番木瓜三角形数量67 926个调节Target Triangles完成封装,使点云数据转换为多边形模型,如图3( d) 所示。

2. 3 多边形阶段处理

创建Open Manifold模式,删除模型中的非流型的三角形数据。扫描过程中存在人为或光线等原因使部分点云数据未获取成功,根据孔洞类型用Fill Holes模块进行填补,如图4( a) 所示。应用Decimate Polygons模块中的Reduce to Percentage 60 ,在不妨碍模型表面细节和颜色的前提下减少三角形的数量到66 818个,进一步通过Curvature Priority保证简化后的模型特征与原模型保持一致,防止变形,如图4( b) 所示。利用Sandpaper重建多边形网格,去除污点及不规则的三角形网格使番木瓜模型表面更加平滑,确保Fix Boundary防止打磨强度过大,出现局部变形,如图4( c) 所示。运用Relax Polygon调整三角形的抗皱夹角,使三角形网格更加平坦和光滑,完成Fix Intersections,使界面提示没有相交的三角形,如图4( d) 所示。

2. 4 形状阶段处理

根据番木瓜的外形特征,利用Detect Curvature模块定义Curvature Level,按照探测粒度和曲率级别生成的黑色轮廓线和橘黄色轮廓线( 模型最高曲率线)将曲面划分为多个曲面片,如图5( a) 所示。利用Promote / Constrain轮廓线,完成橘黄色的轮廓线与黑色轮廓线之间的相互转化,如图5( b) 所示。以橘黄色轮廓线为主曲率线进行Shuffle Panels,移动黑色轮廓线,使曲面片等量分布,如图5( c) 所示。完成Edit Contours模块,调整边界轮廓线,松弛轮廓线和曲面片,使其分布均匀,如图5( d) 所示。结合Construct Grids在模型表面进行格栅的构建,如图5 ( e) 所示。通过NURBS( 非均匀有理B样条方法,能精确表示二次曲线弧和二次曲面的方法) 曲面处理技术,Fit Surface拟合一个连续的曲面到格栅网上,完成曲面的拟合,如图5( f) 所示。

2. 5 曲面偏差分析

通过Geomagic Studio将拟合的曲面与拟合前的点云数据进行比较来,可分析拟合曲面的几何精度偏差,并可适当调整曲面模型来减小偏差,使拟合曲面模型满足几何精度的要求。以点云为参考对象,通过3D compare分析,得到变差分析结果,如图6 所示。其最大偏差距离为+ 0. 08mm和- 0. 08mm,平均偏差距离为0. 004mm,标准偏差为0. 015mm。曲面偏差分析结果表明: 该番木瓜重构模型能够满足#0. 1mm几何精度要求,可应用到摘取装置的设计与分析中。

3 番木瓜特征参数提取和分析

3. 1 特征参数提取目的

为获取番木瓜采摘末端执行机构设计尺寸参数,基于上述曲面三维重建方法,获取番木瓜三维重构模型; 利用Pro /Engineer软件对番木瓜三维模型进行参数测量,提取番木瓜外形特征参数。如图7 所示,番木瓜沿果梗方向为纵向,与果梗垂直方向为横向; 横径为番木瓜横向直径最大截面的直径; 上、下部高度是指番木瓜横径所处截面到番木瓜顶点、底端的垂直高度; 纵径指番木瓜顶点到底端沿纵向的长度; 果形指数为纵径与横径比值。

3. 2 特征参数提取方法

选取广东岭南和台农2 号番木瓜各20 个,进行体表数据采集与三维曲面重建。考虑番木瓜外形不规则,首先利用Pro /E软件创建横径所在截面,在横径截面上做出最大外接圆和最小内切圆,分别测量最大外接圆和最小内切圆直径,取二者均值作为横径尺寸; 再通过Pro /E软件中的距离测量模块得到番木瓜的纵径、上部高度和下部高度尺寸; 最后,由纵径和横径比值计算出果形指数; 每个特征参数测量3 次取平均值。

3. 3 特征参数提取结果分析

特征参数提取结果如表1 所示。

岭南和台农2 番木瓜样本外形尺寸差异均小于10% ,果形与尺寸大小具有较好的一致性。岭南比台农2 号番木瓜横径均值大2 . 25 mm,纵径均值小4. 03mm,果形指数均值小0. 10,表明岭南品种属于粗短型,台农2 号品种属于细长型。依据番木瓜类长椭球形果型特征,采摘果实抓取位置选取在横径处,岭南番木瓜抓取直径应大于86. 02mm,抓取点沿纵径方向距离末端执行机构应大于89. 1mm; 台农2号番木瓜抓取直径应大于89. 07mm,抓取点沿纵径方向距离末端执行机构应大于73. 41mm。

4 结论

1) 基于逆向工程技术,选取非接触式Sense 3D激光扫描仪,获取番木瓜果实体表点云数据,经Sense软件处理得到初步的番木瓜点云数据模型。

2) 利用Geomagic Studio软件对番木瓜模型进行点阶段、多边形阶段、形状阶段的数据处理,拟合形成NURBS曲面,构建番木瓜曲面模型。

3) 通过偏差分析,得到番木瓜曲面模型最大偏差距离为+ 0. 08mm和- 0. 08mm,平均偏差距离为0.004mm,标准偏差为0. 015mm,表明该番木瓜重构曲面模型能满足几何精度要求,可应用到摘取装置的设计与分析中。

特征参数提取 篇9

认知无线电是一种智能频谱共享技术,它可以不间断地对周围的用频环境进行感知,分析、理解和判断环境信息,然后据此自动调整其通信参数( 如工作频率或调制方式等) 以适应环境的变化[1,2]。

跳频通信是一种低截获概率技术,具有良好的抗干扰性能和安全保密性能,被大范围运用在军事通信中,给通信对抗方带来了严峻的挑战,因此对跳频信号的侦察截获进行研究,寻找对跳频通信信号进行检测的方法,具有重大的意义[3]。

1 算法原理

1. 1 信号检测

实际通信环境中,电磁环境非常复杂,定频信号、噪声信号、干扰信号以及各种突发信号相互交织,跳频信号的检测因而变得非常困难[4]。这里采用的算法首先通过频谱对消去除定频信号等在整段数据中始终存在的信号,然后再进行跳频信号检测。

1. 1. 1 定频干扰的频谱对消处理

首先将接收到的数据分成Q段,每段的长度为M点,然后分别对每一段数据进行傅里叶变换,再将Q段数据各自的FFT结果点对点相加,并除以Q求平均值,得到该段信号的平均频谱[5,6]。

定频信号在接收数据的整个时间段内都是始终存在的,且在整段数据内其功率是缓慢变化的,所以定频信号在每段M点长的数据中的频谱与整段数据的平均频谱几乎是一样的。

而对于跳频信号,若假设其在接收数据的整个时间段内共出现了m次,则对于所有的分段数据来说,在一段含有该跳频信号的数据频谱中将包含跳频信号的幅频响应,而在一段不含该跳频信号的数据频谱中将不包含跳频信号的幅频响应,所以,若分别对Q段数据进行傅里叶变换,然后再通过求取它们的平均值得到的频谱中,跳频信号的幅度将变为其实际幅度的m/Q ,通常又有m < < Q ,从而很大程度上降低了该跳频信号在平均频谱中的功率。

综上所述,如果使每段数据的频谱都减去整段数据的平均频谱,然后再做傅里叶反变换,则可以将原来定频信号的干扰对消除去了,在求得的时域数据中,跳频信号的功率减少得并不多,这就是定频干扰的频谱对消处理。

1. 1. 2 跳频信号检测

首先进行频谱对消处理,并对处理后的数据进行N点FFT运算,然后对运算结果进行过基本门限检测,该基本门限是指认为检测到信号的一个较低的单根谱线的幅度,该门限应高于噪声基底电平,是软件可控的[7]。

若存在超过该基本门限的信号,则对该信号进行带宽和功率的测量。带宽测量是指对信号的带宽进行粗测,这里采用的是超过基本门限的单根谱线的位置中最大值到最小值的差乘以FFT的频率分辨率来求带宽的;功率测量时可将带宽内信号谱线的幅度累加,乘以频率间隔,作为信号功率。

再应用所测量的带宽,查找信号应达到的功率门限,该功率门限可由侦察分析结果归纳,由软件设置,硬件存储,可用查表法进行比较。若所测量的功率超过该功率门限,则认为检测到信号; 否则,认为没有检测到信号。

1. 2 信号驻留时间估计

1. 2. 1 短时傅里叶变换[8]

由于截取的信号中可能含有不止一跳数据,所以首先对其采用短时傅里叶变换( STFT) 来进行时频分析来找到某个频点的一跳数据。

用一个以t为中心、持续时间很短的窗函数η*( t' - t) 与信号z( t') 滑动相乘后进行傅里叶变换,可以得到信号z( t') 在窗函数的中心时间点t处的短时傅里叶变换,如下所示:

为了消除边缘效应的影响,滑动窗的2 次相邻滑动之间应该存在一些重叠的点,通常为进行傅里叶变换的点数的二分之一。

1. 2. 2 校时算法

时域校时是信号驻留时间估计的关键,一般情况下,经常通过求斜率然后计算其拐点的方法进行校时,具体实现方法如下所述:

首先对至少包含跳频信号的一跳时长数据的信号滤波,得到其时域包络,并对包络积分。然后分别求积分后的信号对其起始点和终止点的斜率,然后分别寻找两次处理结果的最大值,这2 个最大值对应的时间点分别称为包络的左右拐点,也就是跳频信号一跳数据的精确起跳时刻和终止时刻[9]。

1. 2. 3 补零法则

然而在低信噪比下,信号包络不是很平滑,使得校时结果存在较大的误差。为此,采用前后补零的方法来延长数据的长度,可以精确定位出拐点的位置,这就需要用到补零法则。

补零法则的范围计算公式如下[10]:

计算左拐点时:

计算右拐点时:

式中,0 ≤ x ≤ 1 表示校时时可能存在的不同情况,p ( p ≠ 1 ) 为占空比,N为一跳数据的点数,如图1所示,可以通过分别在当前数据的首尾补充一定个数的零点来准确求得图中所标示的拐点位置。

这里选择的补零长度与数据长度相等,求起始点时右侧补零对终止点求斜率选择斜率最大处为拐点也即起始点Dstart ,求终止点时左侧补零对起始点求斜率选择斜率最大处为拐点也即终止点Dover 。

1. 3 信号信噪比估计

1. 3. 1 估计信号带宽

若要估计信号的信噪比,首先要估计其频带宽度。也就是要估计信号功率谱的起始频点和终止频点,从数学建模意义上来说,这仍是一种求拐点的问题,不同的地方仅是将时域波形变成了频域表示,所以仍可以考虑采用上节提供的校时算法来求信号功率分布函数中的拐点,从而可以精确估计信号的带宽[8]。估计流程如下:

① 首先估计功率谱P( f) ,这里采用了Welch修正平均周期图法;

② 然后求功率谱密度的积分以求得功率分布函数R( f) ;

③ 通过补零法则和校时算法,计算功率分布函数的拐点;

④ 由2 个拐点计算信号带宽两端频率位置序号NH和NL,则信号带宽为: Bs= ( NH- NL) ·ΔF 。式中,ΔF为谱线分辨率,即 ΔF = fs/ N 。

1. 3. 2 估计信号信噪比

假设进入接收机的加噪信号为y( t) :

式中,s( t) 表示信号,假设其功率为S ; n( t) 为高斯白噪声,假设其功率为N 。

由上节信号带宽估计结果可知,信号功率谱分布于NH和NL之间,则对位于该频段内的功率谱幅值累加可求得加噪信号的平均功率谱[11,12],即:

式中,Y( f) 表示加噪信号的功率谱。

设FFT点数为2 NFFT,则根据接收带宽内信号频带以外的功率谱可以估算出噪声的平均功率谱,即:

从而信噪比估计值为:

2认知无线电信号检测和多维特征参数提取

认知无线电跳频信号检测和多维特征参数提取的流程图如图2 所示。

首先进行信号检测。若是未检测到信号则继续向后截取N点数据进行重新检测,直到检测到信号或者接收数据消失。若已经检测到信号,则从检测点处向前N个点处截取一段数据data ,截取的数据长度可由经验跳速( 经验下的最低跳速) 结合采样频率估计的一跳内的采样点数N1 来确定,一般截取N1 的1. 25 倍长度的数据,其中经验跳速应该小于实际的跳速才能保证至少完整的截取一跳信号data 。

然后估计信号驻留时间。对data进行短时傅里叶变换,截取出某一频率对应的一个时间切片,如果频率分辨率足够,则在该时间切片上将只有该频率对应的频谱,或者有其他频率对应的频谱但是幅值很小,即截取的是在该时间切片对应的时刻存在的一跳数据的频谱[10]。然后针对这一频谱利用校时算法和补零法则估计频谱的起始点Dstart1 和终止点Dover1 ,并结合短时傅里叶变换的分析窗窗长变换到时域信号data中该跳信号的起始点Tstart1和终止点Tover1。根据Tstart1和Tover1从原始采样数据data中粗略截取一跳数据Edata 。接着对截取的时域数据Edata利用校时算法和补零法则精确估计信号的起始和终止时刻Tstart和Tover;从而信号驻留时间T = Tover- Tstart。

然后根据精确估计的从Edata中精确的截取一跳数据Rdata ,进行信号带宽估计,然后利用信号带宽信息根据式( 10) 进行信噪比估计。

3 仿真实验

针对调制样式为FM、FSK和MSK的跳频仿真信号进行了仿真实验。

在Matlab仿真信号设置采样频率为704 MHz,驻留时间为0. 001 s时,对于FM信号该算法求得的一跳内的采样点数误差小于3 个点,从而驻留时间估计误差小于( 4. 261 4 × 10- 9) s; 而对于FSK信号该算法求得的一跳内的采样点数误差小于30 个点,从而驻留时间估计误差小于( 4. 261 4 × 10- 8) s。

在Matlab仿真信号设置采样频率为240 MHz,驻留时间为0. 001 s时,对于MSK定频信号该算法求得的一跳内的采样点数误差小于3 个点,从而驻留时间估计误差小于( 1. 25 × 10- 8) s。同时由仿真实验可知,信噪比的估计误差小于3 d B。

4 电台实验

数据长度为10 M点,采样频率为12. 5 MHz,信号驻留时间为0. 001 5 s,信噪比为45 d B。经蒙特卡罗仿真实验统计出信号检测正确率达99% 。

驻留时间估计的结果如图3 和图4 所示,其中图3 为根据Tstart( 估计的一跳数据的起始位置) 截取的数据与源数据的位置对照,表明估计起始点的精度较高。

图4 为根据Tover( 估计的一跳数据的终止位置) 截取的数据与源数据的位置对照,表明估计终止点的精度也较高。

根据起始位置和终止位置Tstart和Tover计算一跳数据内的点数L为192 36,并结合采样频率计算一跳的驻留时间T为0. 001 500 24 s,得出驻留时间估计误差为2. 4 × 10- 7。根据截取的数据估计的信号的信噪比为Rsn = 41. 998 5 d B,误差为3. 001 5 d B。

5 结束语

针对调制样式为FM、FSK和MSK的跳频模拟仿真信号和实际电台信号,进行信号检测和时频参数测量,其中时频参数包括驻留时间和SNR。要求信噪比大于等于12 d B,信号类型为FM、FSK和MSK。仿真实验和电台实验显示信号驻留时间估计误差的数量级在驻留时间为毫秒量级时为10- 7; 信噪比估计误差为3 d B。

摘要:侦察截获是电子攻击的前提。针对认知无线电系统中的新型跳频信号,为了实现对目标信号的快速侦察截获,研究快速准确的信号检测和参数测量方法成为必要。根据认知电台的信号特征,采用宽开接收和数字信道化接收体制,所有信道同时采用功率谱附加能量检测的方法检测信号的有无。然后利用短时傅里叶变换、校时算法、补零法则和Welch修正平均周期图等处理方法提取信号特征参数。最后针对仿真信号和实际电台信号进行了无线电信号检测和多维特征参数提取的仿真实验,信号驻留时间估计误差的数量级在驻留时间为毫秒量级时为10-7;信噪比估计误差为3 d B。

关键词:认知无线电,信号检测,特征参数提取

参考文献

[1]熊俊俏.STFT算法在短波差分跳频信号检测中的应用[J].电讯技术,2010(8):52-56.

[2]齐昶,王斌,颜羡卿.短波环境下跳频信号检测[J].雷达科学技术,2011(4):335-340.

[3]张珊,吴瑛,陈秋华.短波新倒下跳频信号检测[J].计算机应用与软件,2011(2):211-214.

[4]钱怡,武传华.跳频信号检测和参数估计技术研究[J].空间电子技术,2007(02):14-18.

[5]冯文江,郭瑜,胡志远.认知无线电中的频谱感知技术[J].重庆大学学报,2007(11):46-49.

[6]方志,贾峰.复杂电磁环境下跳频信号检测及拼接算法[J].无线电工程,2010,40(8):13-15.

[7]张建立,张海瑛.跳频信号侦听技术和实现方法[J].无线电通信技术,1998,24(1):1-2.

[8]张海瑛,袁超伟.一种实用的通信信号信噪比盲估计方法[J].无线电通信技术,2007,33(2):49-51.

[9]司春丽,刘娟,认知无线电中的频谱感知技术研究与应用[J].清远职业技术学院学报,2010(6):49-51.

[10]陈超,徐长纯,王玥,梁保卫.一种改进的信噪比估计算法[J].无线电工程,2012,42(2):62-64.

[11]徐健,吴占分.影响跳频信号截获概率的因素分析[J].无线电通信技术,2007,33(1):38-39.

特征参数提取 篇10

关键词:特征提取;时序数据;波形形态;结构算子;感知器

引言

模式识别大致可以划分为统计和结构化模式识别两种方法。结构化方法特别适用于面向波形形态并具有领域专家对数据进行分类的已知领域,例如:语音识别、医用信号分析、雷达信号侦测和过程处理。要对一个不了解的专业领域实行结构模式识别,必须首先获取该领域的专业知识,而这往往要耗费很多的时间和精力。为了将结构模式识别应用到未知的领域,我们需要一种独立于领域知识的结构模式识别方法。

特征参数提取 篇11

光伏电池直流模型广泛应用于光伏电池和光伏电池阵列的分析中,经过长期实践检验证明该模型在工程应用上具有足够的准确性[1]。因为光伏电池正向模型是一个包含多个参数的复杂非线性模型,包含多个未知参数,其中绝大部分的参数是厂家没有提供的。因此,通过已知的多组光伏电池的输出电压、输出电流提取模型参数,在工程精度下复现组件及由相应组件构成的阵列在不同光照强度、不同温度下的伏安特性非常重要[2,3]。

由于光伏电池模型中参数数量多,电压电流强耦合,常规参数提取方法应用于光伏电池模型面临初值选取困难、优化约束条件要求精确、计算速度慢、关键参数提取准确度低的问题。对此,本文定量分析了各个参数对光伏电池电气特性的影响,进行了参数灵敏度分析,提出了一种基于关键参数的参数提取方法。该方法将对光伏电池影响不大的参数设为标准值,只对关键参数进行提取,可以极大降低参数提取的难度,提高参数提取速度,增加关键参数提取的准确度。

利用上述方法,本文对5种不同种类、不同品牌的单晶硅、多晶硅、铜铟镓硒(CIGS)电池进行了参数提取,并对仿真结果进行了实验验证,证明了该灵敏度分析和参数提取方法的有效性和可靠性。给出了不同种类光伏组件模型具体参数,可供相关技术科研人员查询。

1 光伏电池正向直流模型的建立和实现

光伏电池本质上就是一块经过精心设计和制造的可以将光照能量转化为电能的半导体二极管。光伏电池正向模型的基本方程如下:

其中,I为电池输出电流;U为电池端电压;Iph为光生电流;Iscr为参考温度下、光照强度为1 000 W/m2时的光生电流;λ为光照强度;q为电子电量;Tr为参考温度;T为电池温度;Ego为能带系能量;k为波尔兹曼常数;Rs为串联电阻;Rsh为并联电阻;A、B为曲线拟合常数,二者相等;Ios为光伏电池内部等效二极管PN结的反向电流;Ior为二极管反向电流;KI为温度系数[4,5,6,7,8]。

2 光伏电池模型参数灵敏度分析基本算法

光伏电池的数学模型如式(1)—(3)所示,其中最重要的电气参数是短路电流Isc和开路电压Uoc,一旦确定了短路电流和开路电压,光伏电池伏安特性曲线将会基本确定。所以对短路情况和开路情况进行参数灵敏度分析即可基本确定该参数对光伏电池电气特性的影响。对光伏电池的短路情况和开路情况进行灵敏度分析可以利用数学上的局部法,分析特定参数在局部点的参数梯度。因为光伏电池各个参数数量级相差极大,若要比较各个参数对光伏电池的影响程度,还需要对参数梯度进行标幺化处理。求解短路情况和开路情况参数灵敏度的具体思路如下。

定义灵敏度S:若y=f(p1,p2,p3,…,pn,x),其中,p1、p2、p3、…、pn为可变参数,x为自变量。某一点处y对参数pi在这一点的局部敏感度S定义为[9]:

具体到光伏电池模型,求解步骤如图1所示。

由于光伏电池基本模型非常复杂,本文中借助了符号运算软件MAPLE进行上述求解。

3 参数灵敏度分析

本节灵敏度分析以一块实际单晶硅光伏电池为参考,如非特殊说明,光伏组件参数设置为典型实际参数如下[1]:T=25℃,λ=1 000 W/m2,Rs=0.346 3Ω,Rsh=193.7Ω,A=49.53,Iscr=4.784 A,Ior=0.228 7μA,KI=0.001 6 A/K,Ego=45.08 V。由于S函数表达式过于复杂,本文中灵敏度求解结果用parameter-S图的形式给出。

3.1 光照强度灵敏度分析

光照强度在0~1000 W/m2变化时,开路电压Uoc和短路电流Isc对光照强度的灵敏度S取值见图2。

由图2可知,对开路电压,S为正数,开路电压随着光照强度的增加而增加,常规情况下最大灵敏度不超过0.1,说明光照强度对开路电压的影响不大;对短路电流,S为正数,短路电流Isc随着光照强度的增加而增加,常规情况下灵敏度等于1,说明光照强度对短路电流的的影响很大,短路电流与光照强度呈等比变化[9]。

3.2 温度灵敏度分析

温度在-10~80℃变化时,开路电压Uoc和短路电流Isc对温度的灵敏度S取值如图3所示。

由图3可知,开路电压与温度近似反比关系变化,S<0,所以开路电压随着温度的增加而减小,因为S绝对值较大,接近0.5,所以,正常范围变化时温度对开路电压的影响较大;短路电流与温度呈正比关系变化,S为正数,所以短路电流随着温度的增加而增加,温度在正常范围变化时S<0.05,所以温度对短路电流的影响不大。

3.3 Iscr灵敏度分析

Iscr在1~20 A变化时,开路电压Uoc和短路电流Isc对Iscr的灵敏度S取值如图4所示。

由图4可知,关于开路电压,S为正数,开路电压随着Iscr的增加而增加。因为Iscr在正常范围内变化时,S最大值小于0.1,Iscr对开路电压影响很小。关于短路电流,由于S为正数,因此短路电流Isc随着Iscr的增加而增加。Iscr在0~20 A变化时,灵敏度等于1,说明Iscr对短路电流的的影响很大,二者呈等比例变化。

3.4 KI灵敏度分析

当温度为25℃时,KI前的系数等于0,KI对光伏电池电气特性没有影响,所以分析KI对光伏电池电气特性影响时,此处设定温度等于30℃。KI在0~0.01变化时,开路电压Uoc和短路电流Isc对KI的灵敏度S取值如图5所示。

由图5可知,开路电压随KI变化呈正比关系变化,且S为正数,所以随着KI的增加,开路电压增加。因为当KI在正常范围变化时灵敏度S<0.001,所以KI对开路电压的影响非常小,可以忽略。短路电流与KI呈正比关系变化,且S为正数,所以随着KI的增加,短路电流增加。因为KI在正常范围变化时,灵敏度S<0.02,所以KI对短路电流的影响很小,几乎可以忽略,但相对开路电压的影响要大。

3.5 Ior灵敏度分析

Ior在0~1μA变化时,开路电压Uoc和短路电流Isc对Ior的灵敏度S取值如图6所示。

由图6可知,在Ior常规的取值范围内,S<0,随着Ior增加,开路电压降低,并且Ior越大,Ior对开路电压的影响越大。针对开路电压,S的绝对值小于0.1,Ior对开路电压的影响较小。对于短路电流,因为S约等于0,因此Ior对短路电流的影响非常小,几乎可以忽略不计。

3.6 Ego灵敏度分析

当温度为25℃时,Ego前的系数为0,此时Ego对光伏电池的电气特性没有影响,因此此处设定温度为30℃。Ego在正常范围变化时,开路电压Uoc和短路电流Isc对Ego的灵敏度S取值如图7所示。

由图7可知,对于开路电压,S<0,所以随着Ego的增加,开路电压减小,开路电压与Ego呈对数关系变化,随着Ego增大,Ego对开路电压的影响也变大。因为S绝对值较大,所以Ego对于开路电压有较大的影响。对于短路电流,因为S<0,所以随着Ego的增大,短路电流减小,短路电流与Ego呈对数关系变化,Ego越大,对短路电流的影响越大。因为在Ego的常规取值范围内,S的绝对值很小,所以Ego对短路电流的影响很小。

3.7 A灵敏度分析

A在0~200变化时,开路电压Uoc和短路电流Isc对A的灵敏度S取值如图8所示。

由图8可知,对于开路电压,因为S为正数,所以随着系数A的增加,开路电压增加。正常范围A变化时,灵敏度恒等于1,说明开路电压与系数A呈正比例变化。对于短路电流,因为S>0,所以随着A的增加,短路电流增加。A正常取值范围内,S约等于0,短路电流几乎不受A的影响。

3.8 Rs灵敏度分析

开路时,因为Rs前的系数I=0,所以Rs对开路电压没有影响。Rs在0~10Ω变化时,开路电压Uoc和短路电流Isc对Rs的灵敏度S取值如图9所示。

由图9可知,对于开路电压,Rs无影响;对于短路电流,S<0,所以短路电流随着Rs的增大而减小。在Rs较小时,对短路电流的影响很小,超过一定范围后,Rs对短路电流的影响迅速增加,Rs越大,其对短路电流的影响也越大,Rs对短路电流的灵敏度S趋于-1,Rs与短路电流在Rs较大时呈等比例变化。通常Rs<0.1Ω,相对应的S的绝对值小于0.02,说明在通常的取值范围内,Rs对短路电流影响很小。

3.9 Rsh灵敏度分析

Rsh在0~100Ω变化时,开路电压Uoc和短路电流Isc对Rsh的灵敏度S取值如图10所示。

由图10可知,对于开路电压,S>0,开路电压随着Rsh增加而增加,影响大小随着Rsh增加而减小。Rsh较小时,S=1,开路电压与Rsh等比例变化,正常范围内,Rsh较大,取值为几千欧姆,对开路电压的影响很小,可以忽略不计。对于短路电流S>0,短路电流随着Rsh增加而增加,影响大小随着Rsh增加而减小。在正常取值范围Rsh对短路电流的影响很小,几乎为0。

3.1 0 各参数灵敏度分析总结

对以上灵敏度分析总结如表1所示。

从表1可以看到λ、T、A、Iscr这4个参数对光伏电池电气特性影响最大;Rs、Rsh、Ego、Ior对电气特性有一定影响;KI对光伏电池的电气特性影响很小,工程条件下可以忽略。在上述参数中,T、A、Iscr、Ior、Ego对开路电压有较大的影响;λ、A、Iscr对短路电流有较大的影响[10,11,12,13,14,15]。

4 基于灵敏度分析的参数提取方法的实现

从上述灵敏度分析中可以得到光伏电池模型中A、Iscr、Rs、Rsh、Ego5个参数对于模型特性具有较大影响,其余参数为常数或影响不大。为了提高参数提取效率,降低初值选取难度,放松优化约束条件并提高关键参数提取精度,将这5个参数设为待提取参数,其余参数设定为标准常数。光伏电池正向模型基本方程如式(1)—(3)所示。

参数提取的主要思路是利用非线性最小二乘拟合理论进行优化。因为各个参数的取值范围比较固定,所以本文利用MATLAB中自带的有约束非线性规划函数fmincon进行求解[16]。为保证在不同温度和光照下模型均有较高的精度,采样点至少要来自于2条温度、光照有显著差异的光伏组件伏安特性曲线。本文中采样点来自北京地区2011年4月18日08:17和12:20测量到的实验数据。测量条件如表2所示,光伏组件参数提取结果如表3所示。

将表3中根据实验数据提取的参数结果代入光伏电池模型中,在不同光照和温度条件下进行实验和仿真结果的对比验证。实验平台包含有不同品牌的多晶硅光伏组件3块,单晶硅光伏组件1块,CIGS光伏组件1块。

以2011年4月18日测试为例,实验测试条件如表4所示,仿真和实验对比结果如图11所示。

可以看到利用非线性最小二乘法所提取的参数可以很好地拟合实际光伏电池在不同温度不同光照下的电气特性曲线,该模型对晶体硅电池、CIGS电池不同光照不同温度下电气特性的拟合较为理想。

对比2011年4月18日一天当中不同时刻不同种类光伏电池的最大输出功率。随着光照和温度的变化,5种光伏电池板一天当中每一时刻所能输出的最大功率的仿真和实验曲线如图12所示。

实验平台每2 min测量一次。由图12可见,仿真曲线与实验曲线吻合良好,说明在不同温度和光照强度下,仿真模型均能较准确地模拟实际情况,进电气特性曲线。

一步验证了模型参数的有效性。

5 结论

本文利用符号运算软件MAPLE对光伏电池直流模型中各个参数对开路电压和短路电流的灵敏度进行了定量分析。其中λ、T、A、Iscr4个参数对光伏电池电气特性影响最大;T、A、Iscr、Ior、Ego对开路电压有较大的影响;λ、A、Iscr对短路电流有较大的影响。本文利用MATLAB优化工具箱,根据非线性最小二乘法原理,实现了光伏电池正向直流模型中各参数的提取,所提取的参数可以较好地拟合实际光伏电池

摘要:针对光伏电池的短路和开路情况进行参数灵敏度分析,以确定光伏电池基本参数对光伏电池电气特性的影响。通过分析特定参数在局部点的参数梯度,借助符号运算软件MAPLE定量分析光照强度、温度以及模型中各个参数对光伏组件电气特性的影响。实现了对5种不同种类、不同品牌的单晶硅、多晶硅、铜铟镓硒(CIGS)光伏组件直流模型的参数提取工作,提取了对电气特性影响最大的5个参数。利用所提取的参数对光伏组件建模,实验结果验证了该模型具有较高的精确度。

上一篇:签约式服务模式下一篇:四川铁塔