参数特征

2024-08-14

参数特征(通用10篇)

参数特征 篇1

1 引言

在语音识别的发展过程中使用了大量的语音信号特征参数。特征参数的提取是关系到语音识别系统性能好坏的一个关键技术, 其基本思想是将预处理过的信号通过一次变换, 去掉冗余部分, 而把代表语音本质的特征参数抽出来。接下去所要作的识别处理都是建立在特征参数之上的, 如果特征参数不能很好地反映语音信号的本质, 识别就不能成功。

语音信号特征参数是分帧提取的, 每帧特征参数一般构成一个矢量, 所以语音信号特征是一个矢量序列。我们将语音信号切成一帧一帧, 每帧大小大约是20~30ms。帧太大就不能得到语音信号随时间变化的特性, 帧太小就不能提取出语音信号的特征, 每帧语音信号中包含数个语音信号的基本周期。有时希望相邻帧之间的变化不是太大, 帧之间就要有重叠, 帧叠往往是帧长的1/2或1/3。帧叠大, 相应的计算量也大。

常用的语音特征参数有平均能量、平价跨零数或跨零率、共振峰、LPC参数、倒谱参数、临界带倒谱等。下一节介绍一些常用的语音特征。

2 语音信号特征参数介绍

(1) 基音周期 (Pitch)

人的语音基本上由两类构成, 一类是浊音 (voice) , 另一类是清音 (unvoice) 。浊音的语音信号具有较强的周期性, 不同的浊音波形是不同的。浊音的这种周期叫基音周期, 其倒数叫做基音频率, 它主要和声带的特性有关。一般来说, 成年男性的语音的基音频率在60Hz~200Hz, 而成年女性和儿童语音的基音频率在200Hz~450Hz。清音的语音信号具有随机噪声的特点, 一般来说清音的幅度小于浊音的幅度。基音周期 (Pitch) 是指发浊音时声带震动所引起的周期运动时间间隔, 代表声带震动的快慢, 震动越快音高会越高, 基音周期是声带振动频率F0的倒数, 它是语音信号分析的一个重要参数。

(2) 短时频谱

语音信号特征在较短的时间间隔中保持基本不变, 即语音信号具有时变特性, 因而可以将语音信号看作是一个短时平稳过程。语音信号具有一些重要的短时特征。短时频谱是语音信号的一个重要的短时特性。可以用下列公式计算:

也即sw (n) 的离散傅立叶变换。|Sw (k) |2称为s (n) 的短时功率谱。

(3) 短时自相关函数

sw (n) 的自相关函数Rw (τ) 称为s (n) 的短时自相关函数。可用公式 (4) 计算:

(4) 短时能量

s (n) 的短时能量计算公式如下:

短时能量代表声音的尺寸, 可由声音信号的震幅来类比。

(5) 短时平均幅度

s (n) 的短时平均幅度计算公式如下:

短时能量和短时平均幅度都是表示一段语音信号能量大小的参数。

(6) 短时过零率

信号按段分割就称为短时, 段可是帧大小。过零就是信号的幅度值从正值到负值、负值到正值要经过零点, 统计信号在一秒钟内有几次过零就是过零率。s (n) 的短时过零率表示一段语音信号中语音信号波形与横轴相交的次数。可以用式 (5) 计算:

其中sgn (x) 是符号函数:

以短时能量为主, 短时过零率为辅, 可对语音信号中的清音进行较精密的检测。

(7) 倒谱

倒谱是一段语音信号的一组重要参数。要计算信号sw (n) 的倒谱, 首先要计算sw (n) 的离散傅立叶变换:

然后对离散傅立叶变换的模取对数:

最后再做傅立叶反变换:

这样得到的c (n) 被称做是“倒频谱”或“倒谱”。

(8) 线性预测编码 (LPC) 参数

考虑语音信号序列s (n) 。假设某时刻n之前的P个语音信号值s (n-1) , s (n-2) , …, s (n-P) 已知, 但时刻n的语音信号值s (n) 未知。如果用前P个已知的信号值的某种线性组合预测s (n) 的值, 则预测值s! (n) 可以表示为:

其中αi都是实数, 称作预测系数。预测值s! (n) 与真值s (n) 之间的预测误差ε (n) 可以用下式计算:

由于s (n) 是一个随机序列, 所以ε (n) 也是一个随机序列。可以用ε (n) 的均方差来衡量线性预测的准确性。δε2越小, 预测的准确性在均方误差最小意义下越好。

还有以下几类特征参数:线谱对 (LSP) 参数、线性预测倒谱参数 (Linear Prediction Cepstrum Coefficient, LPCC) 、美尔频标倒谱系数 (Mel Frequency Cepstrum Coefficient, MFCC) 、感觉加权线性预测特征 (Perceptual Linear Predictive, PLP) (PLP参数、RASTA-PLP参数) 、动态差分参数、高阶信号谱类特征等[3]。

3 语音信号特征选择

短时自相关分析可用来区分清音和浊音, 浊音信号是准周期性的, 用短时自相关函数求出语音波形序列的基音周期。对语音信号进行线性预测分析时也要用到短时自相关函数。

短时能量序列反映了语音振幅或能量随着时间缓慢变化的规律, 清音段的幅度一般比浊音段的幅度小很多, 根据语音信号短时能量值的变化, 可大致判定浊音变为清音或清音变为浊音的时刻。短时能量在高信噪比的语音信号中, 可以用来区分静音, 静音的噪声能量很小, 而有语音信号时短时能量值显著地增大到某一数值, 通过这一点也可以区分语音信号的起点和终点 (也即端点) 。

可以根据平均过零数来粗略区分清音和浊音, 发清音时具有较高的平均过零数, 发浊音时具有较低的平均过零数。短时平均过零数还可以用于识别语音信号的起点和终点。

具体应用领域对语音信号特征有不同的要求, 特征的选择很重要, 它强烈地影响应用系统的效率。我们要对具体的应用选择合适的特征, 在一个说话人识别系统中倒谱特征、倒谱与差值倒谱特征组合以及倒谱、差值倒谱、基音、差值基音组合有更好的识别准确率[2]。由此可见多特征组合有更高的识别准确率。

4 语音信号特征提取实验

我们对采样频率 (fs) 为16k HZ的sunday.wav来提取上一节中介绍的特征参数:短时能量、短时平均幅度。其中每帧大小为256 (即每帧包含256个取样点) , 帧叠为0。

我们可用公式 (3) 计算得到图2所示的短时能量图。我们希望短时能量图平滑一些, 采用减去每帧中的中位值后再进行绝对值求和的方法, 如公式 (12) 所示, 公式 (12) 中的median为每帧帧向量的中位值, 所得的短时能量图如图3所示。但这短时能量图没变化多少, 且短时能量对于高电平信号非常敏感, 我们采用对数短时能量计算方式来得到短时能量, 如公式 (13) 所示, 公式 (13) 中的δ为一个无穷小量, 是为防止对0取对数而加入的, 计算后所得的短时能量图如图4所示。根据公式 (6) 所得的短时平均幅度为图5所示。它与图3很接近。

5 结束语

语音信号具有很大的信息冗余, 我们提取出最能表征语音信号的特征能极大地提高语音识别准确率, 也能极大的压缩语音信号。在本文第2节中介绍了大量语音信号特征;在第3节中介绍了语音信号特征的选择;第4节中对部分语音信号特征进行了提取, 并用可视化的方法展示了部分语音信号特征。提取出语音信号特征后, 接下来就可以对语音信号进行语音识别, 这就是我们接下来的工作。在语音信号特征提取之前可先对语音信号进行端点检测, 准确标记出语音信号的起止点, 这样也能提高语音识别的准确率, 这也是我们接下来想进行的工作。以及有关语音信号特征的线性、非线性组合以提高语音识别的准确率也是我们接下来想进行的工作。

参考文献

[1]张智星.音讯处理与辨识[EB/OL].网上在线课程.[2008-01-23].]http://www.cs.nthu.edu.tw/ ̄jang.

[2]边肇祺.张学工.模式识别[M].北京:清华大学出版社, 2005.

[3]王炳锡.实用语音识别基础[M].北京:国防工业出版社, 2005.

参数特征 篇2

如下图,是去除特征后的图

法一、利用EditFaceDelete Face 功能

1. 选中要去掉的faces.

2. “Trim Existing Faces”

3. 反面也如法炮制,

UG非参数化模型中特征的去除方法

法二、利用InsertFeature OperationSimplify功能

1. 选择背面的任一面做”Retained Faces”

2. 选择要移去特征四周的面做为“Boundary Faces”

参数特征 篇3

关键词: 玉米;吐丝期;高光谱;倒伏角度

中图分类号: S127;S513.04 文献标志码: A

文章编号:1002-1302(2016)03-0085-03

从2012年开始,玉米取代稻谷成为我国第一大粮食作物。近年来,我国玉米产量不断提高,玉米密植与倒伏的矛盾日益突出,玉米倒伏引发的产量损失呈加剧趋势。夏季暴雨、大风在我国呈常态化发生,玉米倒伏风险很大,减产幅度在10%~30%[1]。基于地面高光谱数据,研究玉米不同程度倒伏的光谱特性,可以为光学遥感监测玉米及其他作物倒伏提供依据。高光谱遥感技术是20世纪80年代发展起来的遥感前沿技术,目前该技术已经在农业信息化领域得到应用,在小麦病害[2]、虫灾[3] 等方面都取得了一系列成果。倒伏是生产中主要的自然灾害,关于小麦[4-6]、水稻[7]倒伏研究成果较多,对玉米倒伏也有相应研究[8]。本研究通过玉米不同程度倒伏模拟试验,利用相关分析法探讨玉米冠层高光谱特征参量的变化规律,筛选敏感特征参数,以期为玉米倒伏产量损失评估提供理论依据。

1 材料与方法

1.1 试验设计

试验在北京市小汤山国家精准农业研究示范基地进行。该基地位于北京市昌平区小汤山镇,40°10′ N,116°26′ E,研究区地势平坦,种植方式为冬小麦-玉米轮作一年两熟制,当季种植玉米前为小麦茬口。玉米种植品种为京华8号,2013年6月23日播种,大田留苗密度67 500株/hm2,纯氮用量180 kg/hm2,其他按常规田管理。实施玉米吐丝期人工模拟根倒不同等级处理。试验区于8月19日开始抽雄,8月20日对大田进行灌水处理,使大田表面保持浅水层,8月21日进行模拟倒伏处理,设3种倒伏角度处理,分别为正常、倾斜、严重倒伏,每种处理设置30行12 m。在玉米近地茎秆施加一定推力,使处理区内玉米倒伏程度分为倾斜、严重倒伏2级。以玉米茎秆与垂直方向的夹角为倒伏角度(α),45°≤α<90°定义为严重倒伏,0°<α<45°定义为倾斜。于倒伏后第2天、第5天、第9天分别测定田间相关指标及冠层光谱。

1.2 冠层光谱测定

用ASD Field-Spec FR2500光谱仪、1050光谱仪、2500光谱仪(均购自美国ASD公司)测量各倒伏样点的玉米冠层光谱,波段值为350~2 500 nm,光谱仪的采样间隔为1.4 nm(350~1 000 nm区间) 和2.0 nm(1 000~2 500 nm区间)。1050光谱仪的波段范围是350~1 050 nm,采样间隔(波段宽)为1.438 nm。选择在天气晴朗或少云、无风条件下测定光谱,光谱测定时间范围为10:00—15:00。测定步骤为:首先开启光谱仪预热,再次测量之前都先进行光谱仪优化,冠层光谱测定前后都进行参考板测定,冠层光谱测定时探头垂直向下,距冠层垂直高度约1 m,光谱仪视场角25°,在视场范围内重复10次,以其平均值作为该样点的冠层光谱值。为了方便运算数据,统一选择350~1 050 nm的光谱值进行分析。

1.3 冠层倒伏程度测定

冠层倒伏程度用倒伏角度来表示,倒伏角度(α)为玉米茎秆与垂直方向的夹角。根据倒伏后玉米茎秆某点距离地面的高度和该点到根部的长度,求解倒伏角度。处理地块内设置24个2 m×2 m的倒伏均匀的小区,每小区选择有代表性的5株进行测定,平均值为该小区的倒伏角度。

1.4 数据分析方法

采用常用的高光谱数据平均值,微分及对数变换方法,对R的对数变换和一阶微分变换见如下公式:

2 结果与分析

2.1 反射光谱特征分析

对24个小区对应的正常生长玉米、不同程度倒伏玉米冠层的光谱分别进行测定。对光谱反射率ρ及其分式1/ρ、lg ρ及ρ的一阶导数Kρ进行比较。结果发现,lg ρ能更好地反映玉米冠层光谱的波形特征,并能对大气效应、土壤背景等噪声起到平滑作用。Kρ能部分消除噪声影响,明显地展示红边部位的光谱差异。采用Kρ、lg ρ进行光谱分析。

图1为对数光谱,图1-a、图1-b、图1-c光谱测定时间分别是倒伏后第2天、第5天、第9天。从图1-a可以看出,受倒伏胁迫的玉米冠层在可见光区、近红外区的光谱特征都发生了明显变异。与正常生长的玉米相比,倒伏后第2天,受倒伏胁迫的玉米光谱在全波段的反射率均增加,可见光波段增加幅度高于近红外波段,这种变化与前人对作物倒伏冠层光谱变化规律的研究结论[4]一致。从图1-b、图1-c可以看出,随着倒伏后时间的延长,这种差异逐渐缩小,近红外波段的差异在倒伏后第9天基本消失,可见光波段的差异尚存在。图2是正常生长和受倒伏胁迫危害玉米的一阶导数光谱曲线,图2-a、图2-b、图2-c分别代表倒伏后第2天、第5天、第9天光谱。较之正常生长的玉米,倒伏玉米冠层的“红边”(680~760 nm红光范围的反射光谱)向短波方向偏移,即所谓“蓝移”。

nlc202309040926

2.2 高光谱特征参数的定量分析

从原始光谱及由一阶微分光谱提取的基于高光谱的位置变量、面积變量等16种高光谱特征参数,进一步定量分析正常生长的玉米与倒伏玉米冠层光谱的差异,寻找差异最明显的特征参数。从表1可见,较之正常生长的玉米,倒伏玉米冠层的光谱发生了以下变化:红谷吸收深度变浅,反射绿峰的高度降低,尤以倒伏第2天反应最强烈,后期有一定的恢复生长,差异缩小;红谷吸收深度和反射绿峰高度的比值和归一化变形参数变化也有相似的变化规律;蓝边位置无变化;红边位置、近红外平台位置均向短波方向移动,红边位置移动较少,近红外平台位置移动较多;红边内一阶微分光谱所包围的面积变化差异小;蓝边内和近红外平台的一阶微分光谱所包围的面积增加显著。

产生以上变化的主要原因是玉米倒伏后,冠层结构发生变化,倒伏冠层结构平坦,正常生长状态下冠层立体结构内存在的大量阴影在倒伏状态下消失,取而代之的是重叠在一起的叶片、茎秆,呈现出独特的冠层光谱,这种变化不同于其他病虫害、缺素、洪涝、干旱时叶面积下降或叶绿素合成受阻时表现的可见光吸收减少、近红外波段降低的现象。

2.3 高光谱特征参数与玉米倒伏角度的相关分析

分析3次测定的倒伏冠层光谱与倒伏角度的相关系数,从[CM(25]表2可以看出,在3次测定中表现稳定且关系显著的高光谱特征参数有红谷吸收深度(D),蓝边内和近红外平台内一阶微分所包围的面积,以及由红边内、蓝边内和近红外平台内一阶微分包围面积组成的比值参数和归一化参数。其中以D、SDr/SDb、(SDr-SDb)/(SDr+SDb)相关系数最高,可以作为监测玉米倒伏程度的高光谱特征参数指标。

3 结论与讨论

吐丝期是玉米生长发育的关键时期,玉米处于旺盛的代谢时期,倒伏后恢复活跃生长,随着时间的推移,倒伏群体的光谱特性会发生一定变化。本研究结果表明,10 d内正常生长的玉米随着时间推移,冠层光谱变化很小,倒伏群体的冠层光谱随着时间的推移出现规律性变化。此外,可见光波段的变化较近红外波段的变化幅度大且持久,因此利用光学手段进行倒伏监测时间宜早不宜晚,且宜利用可见光波段信息。玉米倒伏后冠层结构改变,视场内组分改变,群体的光学特性也随之改变,使得遥感探测与评价成为可能。本研究分析了吐丝期正常生长和受不同倒伏程度胁迫的玉米冠层光谱,并研究了其高光谱特征参数的差异,分析了倒伏角度与冠层高光谱特征参数的相关系数。结果表明:玉米吐丝期倒伏初期,受倒伏胁迫的玉米光谱在全波段的反射率均增加,可见光波段增加幅度高于近红外波段。随着倒伏后时间的延长,这种差异逐渐缩小,近红外波段的差异在倒伏后第9天基本消失,可见光波段差异仍然存在。玉米吐丝期倒伏后红谷吸收深度变浅,反射绿峰高度降低,红边位置和近红外平台位置均向短波方向移动。红边内一阶微分光谱所包围的面积变化差异小;蓝边内和近红外平台的一阶微分光谱所包围的面积增加显著。D、SDr/SDb、(SDr-SDb)/(SDr+SDb)与倒伏角度的相关系数最高,可以作为监测玉米倒伏程度的高光谱特征参数指标。本试验地点在北京市,采用夏播玉米品种进行试验,试验结果仍需在其他生态区或采用其他不同类型品种进行验证和完善。今后研究重点是通过数学方法研究高光谱特征参数优化或植被指数的应用,探索其在光学卫星影像上的应用。

参考文献:

[1]曹庆军,曹铁华,杨粉团,等. 灌浆期风灾倒伏对玉米籽粒灌浆特性及品质的影响[J]. 中国生态农业学报,2013,21(9):1107-1113.

[2]冯 伟,王晓宇,宋 晓,等. 基于冠层反射光谱的小麦白粉病严重度估测[J]. 作物学报,2013,39(8):1469-1477.

[3]吴 彤,倪绍祥,李云梅,等. 基于地面高光谱数据的东亚飞蝗危害程度监测[J]. 遥感学报,2007,11(1):103-108.

[4]刘良云,王纪华,宋晓宇,等. 小麦倒伏的光谱特征及遥感监测[J]. 遥感学报,2005,9(3):323-327.

[5]胡宗杰,张 杰,王召海. 灌浆期小麦倒伏后光谱变化特征[J]. 安徽农业科学,2011,39(6):3190-3192.

[6]吴尚蓉,刘 佳,王利民,等. 基于图像和光谱技术的倒伏冬小麦产量评估研究[J]. 中国农业资源与区划,2013,34(1):39-46.

[7]刘占宇,王大成,李 波,等. 基于可见光/近红外光谱技术的倒伏水稻识别研究[J]. 红外与毫米波学报,2009,28(5):342-345.

[8]包玉龙,张继权,刘晓静,等. 受风灾影响后的农作物冠层反射信息测量与分析[J]. 光谱学与光谱分析,2013,33(4):1057-1060.

语音信号特征参数的提取 篇4

1.1 汉语的音素、音节和音调

我们发现依据人类声音产生的机制, 由于激励方式的不同会形成清音和浊音两种不同的语音。由这两种语音又可以组合成两种不一样音素:元音及辅音。构成语音的最小单位是音素。元音由不相同的口腔形状发声而形成, 辅音的形成由发声的部位以及发声的方法决定。

音节是构成汉语的最小单位。我们所说的音节指的是一个元音加上一或两个辅音所构成的音素的组合。汉语当中包括以下4种音节, 即:元音、元音+辅音、辅音+元音, 辅音+元音+鼻音。一般汉语可以简单划分为声母+韵母两个部分。音节前部分的辅音称之为声母, 元音和元音后面有时候出现的鼻音称之为韵母。汉语可认为是一种声调语言, 根据声调的不同所表达的意思很可能完全不一样, 汉语共有阴平、阳平、上声及去声四种声调。而声调的变化可以看成浊音周期的变化。声调曲线从韵母起始点至韵母的终止点。

1.2 语音信号的数学模型

语音的产生是因为声道激励发生共振, 因为发声过程中声道是振动的, 所以能够用一个时变线性系统来描述。可以用如图1所示描述语音生成模型。

由图1可知一个完整的语音信号模型由激励模型、声道模型、及辐射模型三个子模型串联而成。激励模型由浊音激励与清音激励组成。对清音部分来说, 激励信号等同于白噪声, 而对于浊音部分来说, 因为声带在不断地张开与闭合, 所以会有间隙性的脉冲波产生。共振峰模型是当前广泛使用的一种声道模型。声道的终端是人类口与唇, 速度波通过声道输出, 然而语音信号是一种声压波。

2 语音信号的前端处理

为了得到我们所需要的信号, 须先对模拟语音信号进行数字化, 接着进行预处理与加窗。

2.1 语音信号的数字化

为将模拟语音信号转变为数字信号, 先对信号进行采样与量化。在采样与量化之前, 须进行语音信号的预滤波, 其目的在于:第一, 滤除高频噪声;第二, 防止50Hz的工频干扰。

2.2 语音信号的预处理与加窗

因为语音信号的平均功率受到鼻辐射以及声门激励的很大影响, 因此在语音信号频谱的求取时, 随着频率的增高相应的响应成分越小, 也就是说高频部分频谱比起低频部分来不够精确, 为此我们需要对信号进行预加重。为了平滑频域信号, 使得信号处理的后面阶段对有限长响应不那么敏感, 通常情况下让数字语音信号通过一个低阶的系统。目前广泛使用的是固定的一阶数字滤波器, 即

式中a为预加重系数, 通常取值0.95左右。

因为语音信号的特性是随时间变化的, 而非平稳过程, 但由于人的发音器官的肌肉运动速度比较慢, 因此可以认为语音信号是个局部的短时平稳的信号。因此, 我们对对语音信号进行分帧加窗的处理。通常情况下语音信号帧长取为10ms~30ms, 每秒帧数约为33~100, 分帧可以是连续的, 有可以是交叠分段的, 在语音信号的分析当中常用“短时分析”来表述。我们一般采用窗函数来乘语音信号, 常用的窗函数是Hamming窗。

Hamming窗函数是:

2.3 语音信号的端点检测

端点检测指的是找出语音信号中的各段落的起始点以及终止点的位置。语音信号的时域处理方法包括:短时平均幅度、短时能量、短时过零率以及短时自相关。端点检测一般要用到语音信号的短时能量以及短时平均过零率两中参数。

用En来表示第m帧的短时能量, 其计算式如下:

短时平均幅度Mn的计算式如下:1N-

短时能量En的最主要作用是:区分清音与浊音、区分声母与韵母的分界、无声与有声的分界、连字的分界以及能够用于进行语音识别。

“过零率”指的是在单位时间内信号通过零的次数。短时过零率z (m) 是用来描述频谱的简单有效的方法之一, 计算公式如下:

在短时处理技术中, 描述一个随机信号的其中一个重要特征是自相关函数Rn, 可以用自相关函数区分清音与浊音, 计算公式如下:

短时频域处理作为语音信号处理的基本方法之一。短时频域处理适合缓慢变化的语音信号。第m帧的短时傅立叶变换计算式如下:

3 语音特征参数提取

在完成语音信号的预加重、分帧、及端点检测之后, 下一步关键的是提取特征参数。我们不可能直接识别原始波形, 语音信号需要经过变换, 提取出其特征参数后再进行识别, 特征参数需要满足:反映语音的本质、参数个分量之间耦合尽量小、参数的提取方便等几方面的要求。目前语音识别中线性预测倒普参数LPCC、美尔倒普参数MFCC使两种较为常用的参数。LPCC利用线性预测编码技术求取倒普参数。MFCC则构造人的听觉模型, 以语音信号经过该模型的输出值作为声学特征, 直接利用离散傅里叶变换得到。

3.1 线性预测倒普参数LPCC的提取

线性预测分析是语音特征分析方法之一, 能够有效的解决短时语音信号的模型化问题。LPCC的基本原理:语音信号的每个样值可以通过过去的若干个值的线性组合逼近求得, 也能够用实际语音信号的抽样与线性预测的均方差值最小的方式, 求出一组预测值。

其中a为加权系数, p为线性预测倒普参数的预测阶数。

LPCC系数表示的是语音信号频谱极值点的变化, 用该系数来表征语音信号, 能够获得比较平滑的语音频谱图。

3.2 美尔倒普参数MFCC的提取

MFCC参数与LPCC参数不同, 它考虑了人耳的听觉特性, 先将频谱转变为美尔频标的非线性频谱, 接着再转换到倒普域上。因为MFCC比较地充分考觉特性, 所以MFCC参数有很好的识别性能与抗噪能力。由测试可得, MFCC参数性能在汉语语音识别中要明显优于LPCC参数, 由于人类在对1 000Hz频率以上的声音的感知能力并不遵循通常的线性关系, 它遵循的是对数频率坐标上的线性关系。

首先, 语音信号在经过预处理、分帧加窗后转变为短时信号, 经过FFT变换将x (n) 转化为X (m) , 并计算出其短时能量谱P (f) 。在将P (f) 在频率轴上的频谱转化为在美尔坐标上的P (M) 。接着在美尔频域内将在美尔坐标上加入三角带通滤波器得到滤波器组Hm (K) , 再计算美尔坐标上的能量谱P (M) 通过该滤波器组的输出值。最后在美尔刻度谱上能够采取修改的离散余弦反变换来求取美尔倒普参数:

式中, p为MFCC阶数。

4 结论

本文主要介绍了语音学的基础知识、语音信号的数字化及其特征提取, 为语音模型的训练做了很好的铺垫。在计算机普及的今天能够让计算机识别出人的自然语言是人们一直努力的一个方向, 对计算机直接用语言信息发号施令, 我们的双手才能真正得到解放。

参考文献

[1]胡航.语音信号处理.2版.哈尔滨:哈尔滨工业大学出版社, 2002:256.

[2]刘幺和, 宋庭新.语音识别与控制应用技术.北京:科学出版社, 2008:201.

[3]易克初.语音信号处理.北京:国防工业出版社, 2000, 14:363.

[4]李波, 王成友, 杨聪, 等.基于语音频谱包络抽取的MFCC算法.长沙:国防科技大学学报, 2004.

参数特征 篇5

利用安徽及邻近地区的数字化地震资料, 详细研究了“霍山地震窗口”小震序列的构造环境背景应力和视应力变化特征. 结果表明, 环境应力值和视应力值不仅能反映震“源”区的.应力背景强弱, 在距未来强震震中比较远的特殊构造部位, 即素有“地震活动穴位”的地震窗口的小地震, 同样能较客观反映出孕震区附近应力环境的信息, 在华东中强地震前后应力状态的差异性是显著的.

作 者:陈宇卫 张军 庆梅 王行舟 章兵 CHEN Yu-wei ZHANG Jun QING Mei WANG Xing-zhou Zhang Bing  作者单位:陈宇卫,张军,庆梅,王行舟,CHEN Yu-wei,ZHANG Jun,QING Mei,WANG Xing-zhou(安徽省地震局,安徽,合肥,230031)

章兵,Zhang Bing(铜陵市地震局,安徽,铜陵,244001)

刊 名:地震  ISTIC PKU英文刊名:EARTHQUAKE 年,卷(期):2007 27(1) 分类号:P315.7 关键词:霍山地震窗口   环境应力   视应力   华东地区中强震  

★ 基于MATLAB的三维地震参数处理研究

★ 飞机实时监控数据挖掘方法研究

★ 浅谈高填土路基的质量监控

★ 晴天地表太阳辐射的参数化

★ 分数与小数的互化

★ 百分数和分数、小数互化和复习教案

★ 《百分数和分数、小数的互化》复习题

★ 互操作联邦数字图书馆研究

★ 上海近海水域质量检测与分析方法研究

煤尘爆炸特征参数影响因素研究 篇6

在采矿业中, 煤尘爆炸事故频出。1949年以来, 中国共发生24起死亡人数超过100人的煤矿事故, 其中12起爆炸事故有煤尘参与, 9起爆炸事故有瓦斯和煤尘共同参与。

煤尘爆炸的发生必须满足3个条件:煤尘本身具有可燃烧性;煤尘粒径大小和空间分布满足一定要求;有点火源。张奇等对煤尘爆炸的相关研究方法、装置、点火系统、压力发展过程以及爆炸的预防和控制做了详细介绍[1]。Chapman和Wheeler进行了管道内火焰传播试验, 发现火焰不断加速的现象及存在障碍物情况下管道内火焰传播速度和爆炸压力增大的现象[2]。司荣军在大型实验巷道内研究了瓦斯-煤尘混合爆炸时火焰及冲击波的传播特性[3]。杨书召利用爆炸实验管道进行了管道和巷道内煤尘爆炸传播特性的物理对比实验, 得出不同尺寸巷道内煤尘爆炸存在尺度效应的结论[4]。蔡周全等在大型模拟实验巷道内对瓦斯-煤尘爆炸过程中冲击波的能量、传播速度、衰减规律及其灾害波及范围进行了研究[5]。曹卫国等对煤尘爆炸的最低引燃温度进行了研究, 获得了不同条件下煤尘的最低引燃温度[6]。李庆钊等对不同煤质煤尘及煤尘-瓦斯混合物的爆炸特性进行了研究, 获得了不同条件下的煤尘爆炸特征参数[7]。周同龄利用长12m、截面为80mm×80mm的方管对瓦斯-煤尘混合爆炸火焰流场进行了实验观测, 通过理论分析验证了气-粒两相爆炸火焰高内聚力的存在[8]。李元等对瓦斯-煤尘混合物爆炸初始压力进行了研究, 得出不同煤质和点火能量对初始压力的影响[9]。刘贞堂对瓦斯-煤尘混合爆炸后的气固残留物进行了研究, 得出了不同煤尘含量下残留物成分的变化趋势[10]。

目前针对煤尘爆炸机理及爆炸特征参数的研究较多, 但对爆炸特征参数影响因素的研究不足。本文采用20L球形爆炸装置研究了煤尘浓度、粒径、点火能量等对煤尘爆炸特征参数的影响。

1 实验系统

实验系统采用标准20L球形爆炸装置, 由装置本体、喷粉装置、点火系统、爆炸控制系统、数据采集系统组成, 如图1所示。该装置可用于测试煤尘的爆炸极限 (下限) 、爆炸最大压力、爆炸最大压力上升速率和极限氧体积分数, 也可用于测试煤尘是否具有爆炸性。

2 实验样品

根据MT/T 934—2005《煤矿许用炸药煤尘———可燃气安全度试验方法及判定》, 实验所选用的煤尘粒径分别为>150, 48~75, 38~48, <25μm。煤尘均在实验前置于50℃恒温干燥箱中干燥24h以上, 实验室环境湿度<0.001%。

实验主要通过改变煤尘浓度、粒径以及点火能量, 分析爆炸最大压力及其上升速率的变化规律, 研究煤尘浓度、粒径以及点火能量对煤尘爆炸特征参数的影响。点火能量分别为5, 8, 10, 15kJ。

3 实验结果及分析

3.1 煤尘浓度对爆炸特征参数的影响

为了研究不同煤尘浓度对爆炸特征参数的影响, 在点火能量为10kJ条件下, 分别加入浓度为100, 300, 400, 450, 480, 600, 800g/m3的煤尘进行爆炸实验, 结果如图2所示。

从图2可看出, 随着煤尘浓度的增加, 爆炸最大压力及其上升速率的变化趋势是一致的, 均为先增大后减小。以煤尘粒径<25μm的情况为例, 煤尘浓度为100g/m3时测得爆炸最大压力为0.6MPa, 爆炸最大压力上升速率为13.67 MPa/s;煤尘浓度增大到480g/m3时, 测得爆炸最大压力上升为0.94 MPa, 爆炸最大压力上升速率为28.79MPa/s;煤尘浓度增大到800g/m3时, 测得爆炸最大压力下降为0.76 MPa, 爆炸最大压力上升速率为27.33 MPa/s。在煤尘粒径<25μm情况下, 爆炸最大压力及其上升速率在煤尘浓度为480g/m3时测得最大值。在煤尘粒径>150μm情况下, 爆炸最大压力在煤尘浓度为400g/m3时测得最大值, 为0.78 MPa, 爆炸最大压力上升速率在煤尘浓度为450g/m3时测得最大值, 为21.43 MPa/s。

根据煤尘爆炸相关理论[11,12], 分布在密闭空间的煤尘吸收一定的热量后分解、挥发, 挥发出的气体和空气形成可燃混合气体, 在此基础上才会发生燃烧和爆炸。当爆炸空间一定时, 改变煤尘浓度首先会引起单个煤尘粒子吸收的点火能量发生变化, 煤尘粒子的热分解反应速率也会不同;其次在氧含量一定的情况下, 每个粒子所得到的氧含量也会不同。因此存在一个最佳的煤尘浓度, 在该煤尘浓度下, 单位空间内粒子数和点火能量以及空间内氧含量达到最佳匹配, 从而产生最大的爆炸强度。

煤尘浓度的增加会造成剩余的未反应的煤尘颗粒大量增加。在爆炸过程中, 这些煤尘颗粒通过吸热、碰撞以及气固两相间能量交换等方式, 大量损耗爆炸反应产生的能量, 导致爆炸最大压力及其上升速率随煤尘浓度的增加而逐渐下降。

3.2 煤尘粒径对爆炸特征参数的影响

为了研究不同煤尘粒径对爆炸特征参数的影响, 在点火能量为10kJ, 煤尘浓度分别为100, 450, 600g/m3条件下, 分别加入粒径>150, 48~75, 38~48, <25μm的煤尘进行爆炸实验, 结果如图3所示。

从图3可看出, 在确定的煤尘浓度条件下, 煤尘粒径对爆炸最大压力的影响较为明显。在煤尘浓度为450g/m3情况下, 爆炸最大压力由煤尘粒径>150μm时的0.76 MPa增大到煤尘粒径<25μm时的0.91MPa;在煤尘浓度为600g/m3情况下, 煤尘粒径<25μm时的爆炸最大压力比煤尘粒径>150μm时大0.13MPa;煤尘浓度为100g/m3情况下, 爆炸最大压力并没有随煤尘粒径的减小而单调增加, 煤尘粒径<25μm时的爆炸最大压力较煤尘粒径为38~48μm时减小了0.01 MPa。

在煤尘浓度一定的条件下, 爆炸压力上升速率随煤尘粒径的减小明显增大。煤尘浓度为100g/m3时, 爆炸最大压力上升速率由煤尘粒径>150μm时的7.32 MPa/s增大到煤尘粒径<25μm时的13.67 MPa/s。煤尘浓度为600g/m3时, 爆炸最大压力上升速率由粒径>150μm时的25.4 MPa/s增大到煤尘粒径<25μm时的41.32 MPa/s。

随着煤尘粒径的减小, 同质量条件下煤尘的比表面积呈指数增加。一定浓度的煤尘分布在腔体内, 可以充分利用点火能量加速粒子的分解, 挥发出可燃气体, 而较大的比表面积与氧气接触更充分, 所以当煤尘粒径减小时爆炸最大压力会增大, 爆炸最大压力上升速率也逐渐升高。由煤尘爆炸机理[13]可知, 粒径越小的煤尘越容易挥发出可燃气体, 但当粒径小到一定程度时, 由于爆炸前煤尘的处理过程 (煤尘的保存、过筛、恒温干燥处理等) 造成煤尘氧化、挥发分大量逸散等, 煤尘中残留了大量的可抑制爆炸传播的灰分, 导致煤尘浓度较低时, 粒径小的煤尘其爆炸最大压力反而降低。

3.3 点火能量对爆炸特征参数的影响

采用浓度为450g/m3, 粒径分别为38~48, 48~75μm的煤尘, 用不同能量的点火头引爆煤尘, 实验结果如图4所示。

从图4可看出, 随着点火能量的增大, 煤尘爆炸最大压力及其上升速率都呈现逐渐增大的趋势。在煤尘粒径及浓度一定的情况下, 增大点火能量即增大了每个煤尘粒子吸收的热量, 加速了煤尘粒子的分解、挥发。释放出的大量可燃气体与空气形成可燃混合气体并发生气相反应, 反应热引燃混合气体。点火能量越大, 挥发出的可燃气体越多, 气相反应越剧烈, 测得的爆炸最大压力及其上升速率越大。

4 结论

(1) 在煤尘粒径一定的条件下, 随着煤尘浓度的增大, 爆炸最大压力及其上升速率先增大后减小。煤尘浓度在400~480g/m3范围内可测得爆炸最大压力及其上升速率的最大值。

(2) 在煤尘浓度一定的情况下, 随着煤尘粒径的减小, 爆炸最大压力上升速率逐渐升高。煤尘浓度为100g/m3时, 随着煤尘粒径的减小, 爆炸最大压力先逐渐增大, 当煤尘粒径<25μm时, 爆炸最大压力比煤尘粒径为38~48μm时低, 表明存在一个最佳粒径范围, 该范围内爆炸最大压力及其上升速率达到最大值。

汽车数据流基本参数特征分析 篇7

在进行数值分析时, 首先应分清读出的各个参数是电控装置中的传感器输送给微机的输入信号, 还是微机送出给电控装置执行器的输出指令。输入信号参数可以是状态参数, 也可以是数值参数。输出指令参数大部分是状态参数, 也有少部分是数值参数。数据流中的参数可以按汽车和发动机的各个系统进行分类。不同类型或不同系统的参数的分析方法各不相同。在进行电控装置故障诊断时, 还应当将几种不同类型或不同系统的参数进行综合对照分析。不同厂牌及不同车型的汽车, 其电控装置的数据流参数的名称和内容都不完全相同。

1 发动机转速

读取电控装置数据流时, 在检测仪上所显示出来的发动机转速是由电控汽油喷射系统微机或汽车动力系统微机根据发动机点火信号或曲轴位置传感器的脉冲信号计算而得的, 它反映了发动机的实际转速。发动机转速的单位一般采用r/min, 其变化范围为0至发动机的最高转速。该参数本身并无分析的价值, 一般用于对其他参数进行分析时作为参考基准。

2 发动机启动转速

该参数是发动机启动时由启动机带动的发动机转速, 其单位为r/min, 显示的数值范围为0~800r/min。该参数是发动机微机控制启动喷油量的依据。分析发动机启动转速可以分析其启动困难的故障原因, 也可分析发动机的启动性能。

3 氧传感器工作状态

该参数表示由发动机排气管上的氧传感器所测得的排气中的含氧量确定混和气浓稀状况。有些双排气管的汽车将这一参数显示为左氧传感器工作状态和右氧传感器工作状态两种参数。氧传感器是测量发动机混合气浓稀状态的主要传感器。氧传感器必须被加热至300℃以上才能向微机提供正确的信号, 而发动机微机必须处于闭环控制状态才能对氧传感器的信号做出反应。氧传感器工作状态参数的类型依车型不同而不同, 有些车型是以状态参数的形式显示出来, 其变化为浓或稀;也有些车型是以数值参数的形式显示出来。

数据分析:数值参数显示的车型如桑塔纳3000轿车, 该参数在发动机热车后, 呈现浓稀的交替变化或输出电压在0.0-1.1V之间的来回变化, 每10s内的变化次数应大于8次

(0.8Hz) 。

若该参数在0.00-0.30V之间连续变化, 则排气中剩余氧气过多或传感器本身及线路故障。故障原因主要有:各种原因引起的混合气过稀、排气管泄露、传感器本身及线路故障。

若该参数在0.70-1.10V之间连续变化, 则排气中剩余氧气过少或传感器本身及线路故障。主要原因有:各种原因引起的混合气过浓、传感器本身及线路故障。

变化缓慢或不变化或数值保持在0.45-0.50V之间, 则说明氧传感器及线路或微机内的反馈控制系统有故障。

4 开环或闭环

发动机达到正常工作温度后不能进入闭环的主要原因:

1) 有些故障会使发动机微机回到开环控制状态;

2) 有些车型在怠速运转一段时间之后也会回到开环状态 (多数因为氧传感器在怠速时温度太低;

3) 氧传感器故障;

4) 发动机燃油系统有故障。

5 发动机负荷

发动机负荷是一个数值参数, 单位为ms或%, 其数值范围因车型而异, 桑塔纳3000、帕萨特B5、和通用别克轿车怠速时标准数值范围为1.0-2.5ms;上海通用凯迪拉克轿车怠速时数值范围为0%-5%;上海通用陆尊商务车怠速时数值范围为2%-10%。

发动机负荷是由控制单元根据传感器参数计算出来并由进气压力或喷油量加以显示, 一般观察怠速时的发动机负荷来判断车辆是否存在故障。

发动机负荷的喷射时间是一个纯计算的理论值。在怠速下的发动机负荷可以理解为发动机克服自身摩擦力和驱动相关附件装置所需的喷油量。发动机负荷的喷射时间与基本喷油量仅与发动机曲轴转速和负荷有关, 不包括喷油修正量。

1) 正常数值如下

(1) 怠速时, 即负荷为O时的正常显示范围为1.0~2.sms;

(2) 海拔高度每升高1000m, 发动机负荷 (输出功率) 降低约10%;

(3) 当外界温度很高时, 发动机输出功率也会降低, 最大降低幅度可达10%。

2) 发动机负荷数值超过2.50ms的主要原因有:

(1) 空气流量计及线路损坏;

(2) 节气门控制单元损坏;

(3) 转向盘位于中止点;

(4) 用电器用电;

(5) 配气正时错误;

(6) 进气系统故障。

6 冷却液温度

这是一个数值参数, 其单位可以通过检测仪选择为℃或℉多数解码器冷却液温度单位可以自己选择。在单位为℃时通用别克轿车变化范围为-40℃-151℃ (各车型范围各不相同) 。该参数表示发动机电控单元根据水温传感器送来的信号计算后得出的水温数值。

在有些车型中, 发动机水温参数的单位为V, 表示这一参数的数值直接来自冷却液温度的信号电压。该电压和水温之间的比例关系依控制电路方式的不同而不同, 通常成反比例关系, 即水温低时电压高, 水温高时电压低, 但也可能成正比例关系。在水温传感器正常工作时, 该参数值的范围为0-

5V。

数值分析:如果发动机工作时, 冷却系统的节温器已完全打开, 而冷却液温度不是逐渐上升, 而是下降好几度, 这就表明冷却液温度传感器已损坏。冷却液温度传感器损坏引发的故障现象有发动机冒黑烟、车辆不易启动、加速不良、怠速不稳、有时熄火等。

1) 热车后正常值:该参数的数值应能在发动机冷车启动至热车的过程中逐渐升高, 在发动机完全热车后怠速运转时的水温应为85-105℃。

2) 该参数显示为-40℃或接近-40℃水温传感器损坏或线

3) 小于85℃发动机太冷 (多数为冷却系统故障) , 冷却液温度传感器或同发动机电控单元的连接导线故障。

4) 大于105℃发动机过热 (多为散热器、冷却风扇、节温器等冷却系统故障) ;冷却液温度传感器或同发动机电控单元的连接导线故障。

5) 显示的数值接近或等于151℃, 则说明水温传感器或线路短路。

7 启动时冷却液温度

某些车型点火开关打开时, 电控单元立即检测冷却液温度传感器的信号, 得到启动时发动机冷却液的温度, 确定是否是冷启动, 以及决定是否给加热型氧传感器加热。并且储存在存储器内, 一直保存至发动机熄火后下一次启动时。在进行数值分析时, 检测仪会将微机数据流中的这一信号以启动温度的形式显示出来, 可以将该参数的数值和发动机水温的数值进行比较, 以判断水温传感器是否正常。在发动机冷车启动时, 启动温度和此时的发动机水温数值是相等的。随着发动机的热起, 发动机水温应逐渐升高, 而启动温度仍然保持不变。若启动后两个数值始终保持相同, 则说明水温传感器或线路有故障。

8 车速

车速参数是由发动机或自动变速器微机根据车速传感器的信号计算出的汽车车速数值。车速参数是微机控制自动变速器的主要参数, 也是进行巡航控制的重要参数。该参数一般作为对自动变速器的其他控制参数进行分析的参考依据。

9 结束语

总之, 运用数据流功能进行故障分析可准确发现故障部位, 避免凭借经验法, 盲目拆卸而造成损失, 提高故障诊断的准确率, 同时又是故障代码分析法的有力补充。一般来讲, 若能读出故障码, 可按故障码的内容诊断故障;若读不出故障码, 则需借助动态数据流来进一步诊断故障。特别是由传感器特性发生变化而引起的故障, 数据流功能更具有其特殊的优势。因此, 在电控汽车的故障诊断中, 凭借经验法和使用故障代码功能的同时, 要充分利用数据流功能。

摘要:目前常见汽车电控装置数据流中的各个参数按不同的系统和类型分类, 并说明其含义!参数的形式及数值的单位和变化范围。由于不同车型的微机决定了自己的数据参数的内容, 因此, 在检测某一车型时, 下列所有的参数只有部分会在检测仪上显示出来。本文主要以大众和通用车系为例, 介绍汽车的主要参数。

关键词:汽车维修,故障诊断,参数特征,数据流参数,启动性能,控制状态

参考文献

[1]卫邵元.数据流功能在电控汽车故障诊断中的应用[J].汽车技术, 2000 (8) :32-33.

基于谱特征参数的图像稀疏降噪 篇8

基于稀疏重构理论的图像降噪 (稀疏降噪) 算法的核心思想是将图像信号在稀疏域中进行表示。稀疏理论指出图像信号可以由若干个有限的结构元素表示, 即结构元素具有稀疏性, 而噪声本身并无特定结构, 即不具备稀疏条件。在该理论的基础上, 稀疏降噪通过对少数结构元素的提取达到逼近原始图像的目的, 从而实现降噪。相比于DCT域、小波域等传统变换域的降噪算法, 稀疏降噪算法中引入的稀疏域是一个可自学习的字典空间。该空间中的结构元素 (原子) 可以使用本身噪声图像进行训练获得, 故在稀疏域对信号进行表示更加灵活, 更能发掘图像内部隐含的固有结构。因此, 稀疏降噪算法逐渐成为当前研究的主流算法之一。例如, Aharon等人提出一种基于稀疏模型的字典训练算法, 即K-SVD算法[6], Elad等人将其用于图像降噪[7], 实现了很好的效果且优于经典的降噪算法。

然而, 稀疏降噪模型中也存在着弊端, 即求解过程中缺少对稀疏解的稳定性进行必要的限制。其后很多研究人员在该方面作了进一步的研究[8—10], 并且使得降噪效果有进一步的提高。近年来, 图论的理论内容更多的与图像处理理论进行交叉融合, 并且成功应用于图像处理的多个方面, 如图像分割、图像聚类、图像降噪等, 而且取得很好的效果。Tang等人指出, 一副图像虽然可能被各种噪声所污染, 但是在图像块间仍然存在着一些结构 (诸如纹理和轮廓等) 的相关性。并且该文通过使用流形学习算法构建图像块关系图形并求解其拉普拉斯矩阵, 然后通过拉普拉斯映射形成一项稀疏表示模型正则项, 实验结果显示其降噪效果较传统稀疏降噪结果有较大的提高[9]。Kheradmand等人指出图像关系图形的拉普拉斯矩阵中融入了图像结构, 许多图像降噪算法均可归结到一个使用核的基于图像相似性的结构框架下, 即对图像使用合适的核构建图形并求解相应的拉普拉斯矩阵, 利用该矩阵构建一个大的降噪框架, 许多较为经典的图像降噪算法可归结到该框架下面[11]。F.G.Meyer等人通过对噪声图像构建关系图, 并使用该图的拉普拉斯特征向量组成的矩阵作为映射对象, 取得了很好的降噪效果, 实验结果显示在某些情况下该算法的降噪效果优于经典的BM3D算法[12]。文献[13]指出, 图形的拉普拉斯特征向量也具有频率的性质。对应于较大特征值的特征向量具有高频的性质, 即向量内元素具有较大的波动幅度;对应于较小特征值的特征向量具有低频的性质, 即向量内元素具有较小的波动幅度;而值为0的特征值对应的特征向量是一个元素相等的向量。

依据图形拉普拉斯矩阵的性质和稀疏理论在图像降噪中的应用, 提出了基于谱特征参数的图像稀疏降噪算法。首先, 将噪声图像进行分块, 将每个图像块作为一个点构建图像块关系图形, 进而得到邻接矩阵。然后, 利用关系图形的邻接矩阵求得拉普拉斯矩阵, 对该矩阵进行特征分解得到相应的特征值和和特征值对应的特征向量, 即谱特征参数;最后, 将图像块矩阵与一定数目该高频谱特征参数所组成矩阵的乘积作为稀疏模型的正则项形成本文的算法模型。对该算法模型进行测试, 测试对象为在不同类型噪声下的标准灰度图像。测试结果表明, 在较大噪声情况下该算法可以使图像在峰值信噪比 (peak signal to noise ratio, PSNR) 值上和图像结构相似度 (structural similatity image measurement, SSIM) 值上较传统的稀疏降噪算法都有较大提高。

1 基于K-SVD的图像降噪框架

稀疏信号的表示和重建大致包含两方面的内容, 即稀疏编码和字典学习。稀疏编码是寻求信号在稀疏域上的稀疏解。从数学上来说, 稀疏编码可归结为稀疏域上的范数优化问题, 但是范数的优化是一个NP-hard问题, 因此实际中常将该优化问题放宽至范数条件下解决。求解该问题的经典的算法主要有匹配追踪 (matching pursuit, MP) [14]、正交匹配追踪 (orthogonal matching pursuit, OMP) [15—18]、基追踪 (basis pursuit, BP) [19]、迭代软/硬门限 (iterative soft/hard thresholding, IST/IHT) [20,21]算法等。另一方面, 字典学习的目的是获取对于投影信号的最优稀疏域, 也就是通过学习获得优化的稀疏空间, 从而实现稀疏系数范数的最小化, 即用最少的稀疏系数获得最大信号特征的表示。因此, 字典学习是一个自适应学习信号特征的过程。较为经典的字典学习算法主要有最优方向算法 (method of optimized directions, MOD) [22]、K均值奇异值分解 (K-means singular value decomposition, K-SVD) [6]、递归最小二乘法 (recursive least squares, RLS) [23]等。由于K-SVD算法是一种较为经典的字典学习算法, 其优化过程具有较高的计算效率和较好的稀疏表示效果, 本文在K-SVD框架下进行字典学习。

稀疏表示中, 信号可以被一个过完备字典中少数原子的线性组合表示。给出一个输入数据矩阵, 其有两种稀疏优化模型, 即稀疏度控制模型和残差控制模型。本文使用稀疏度控制优化模型, 则相应的稀疏优化问题可表示为下式

式 (1) 中, 为字典, dk为字典中的原子, ‖·‖2为2范数, ‖·‖0为范数, X={xi}iN=1为稀疏系数矩阵, T是稀疏度, 即xi中非零元素最大个数。在图像降噪中, Y中的每一列即yi代表一个含噪图像块。在K-SVD框架下, 为对字典进行学习, 先将字典D固定, 再通过稀疏表示算法 (如OMP) 求得每个稀疏系数xi;然后将稀疏系数{xi}固定, 对字典进行学习。字典学习是对每个原子逐个优化学习的, 对单个原子dm的优化可表示为

式 (3) 中, U和V为酉矩阵, Σ为对角阵, U (:, 1) 和V (:, 1) 分别为U和V的第一列向量, Σ (1, 1) 为Σ中对应的最大值。

2 谱特征参数的求解

对于一幅图像, 首先按照给定的块尺寸和分块步长进行分块, 然后将图像块集合向量化得到图像块矩阵, 即对应以上的Y。将Y中的每个列向量当作一个数据点, 便可以对该图像块集合构建图像块关系图形。目前, 比较流行的构建图形的方法有:K最邻近节点算 (K-nearest-neighbor, KNN) 、ε-球法、1-graph算法[24]等。用一种图形构建算法 (这里使用KNN) 对Y构建关系图形, 得到邻接矩阵W, 为使邻接矩阵为对称矩阵, 令

由邻接矩阵计算次数矩阵Φ=[φij], Φ为对角矩阵, 其对角元素为φij=∑jWij。则由邻接矩阵和次数矩阵可得到标准拉普拉斯矩阵为

式 (5) 中I为单位矩阵。对标准化的拉普拉斯矩阵进行特征分解, 即Lμ=λμ, 便可得到图像块关系图形的N个从小到大排列的拉普拉斯特征值λ1, …, λN和特征值对应的N个特征向量μ1, …, μN, 即谱特征参数。谱特征参数具有频率的性质, 其频率大小取决于其对应的特征值的大小。

3 基于谱特征参数的稀疏降噪

3.1 谱特征参数稀疏降噪模型的构建

根据上述分析, 图像关系图形的拉普拉斯矩阵中融入了图像结构, 且其特征向量具有频率性质, 而一副图像中的大部分能量分布在低频部分。因此, 将图像块向量投影到图形拉普拉斯高频特征向量上可以实现高通滤波的作用, 将此项的加权Frobenius范数作为正则项引入稀疏降噪模型形成本文提出的基于谱特征参数的图像稀疏降噪模型, 对该模型进行最小化约束可以对高频部分进行最大限制, 进而实现对噪声高频部分的抑制。现提出的降噪模型相比传统稀疏降噪模型加入了对高频抑制作用的正则项, 可以得到稳定抑制高频作用的稀疏解, 从而实现稳定抑制高频部分的目的。提出的基于谱特征参数的图像稀疏降噪模型为

式 (6) 中, β和γ为权重系数, D为初始化字典, X为由稀疏系数{xi}组成的矩阵, H为由C (C≤N) 个高频拉普拉斯特征向量组成的矩阵, 即H=[μN, μN-1, …, μN-C+1]。该模型可看作是对传统稀疏降噪模型的优化, 即使得稀疏模型有稳定的抑制高频作用的稀疏解。模型降噪后的图像块矩阵为

将Y~按照图像块分割的方式恢复, 即可得到降噪后的图像。

3.2 谱特征参数稀疏降噪模型的优化求解

这里先进行字典训练, 然后求解矩阵Y对训练后字典D的稀疏系数矩阵X, 最后对矩阵X进行优化。首先在K-SVD框架下训练字典, 固定初始化字典, 用稀疏表示算法求得Y对字典的稀疏系数矩阵, 再固定系数矩阵, 通过式 (3) 的奇异值分解, 用式 (2) 对每个字典原子进行优化, 重复以上优化过程, 得到训练的字典D。然后, 求解得到Y对该训练后字典的稀疏系数矩阵X, 由于得到的矩阵X为传统稀疏降噪的稀疏系数矩阵, 并不是优化的稀疏系数矩阵, 最后对该矩阵进行如下的优化。

从式 (6) 中可以看出, 该模型含有两个正则项, 因此无法用传统的稀疏求解算法进行求解, 下面对该模型的优化求解进行推导。从式 (6) 中可见, 第一项和第二项都是在Frobenius范数下, 因此可以将这两项合并成为一项, 得到式 (8) 。

式 (8) 中, 0是元素全为0的矩阵, I是单位矩阵。为简化式 (8) , 令Β= (Y, 0) , , 则式 (8) 可转化为

这里要优化的参量为X, 而X这里右乘矩阵A, 因此对矩阵X而言, 该式也并不是传统稀疏表示模型形式, 因此不能使用传统稀疏表示算法进行求解。对式 (9) 进行转化使其可以利用现有稀疏表示求解算法进行求解。

已知式 (9) 等价于:

借鉴K-SVD的字典学习中每次对单个原子进行训练的方式, 这里对X进行逐列的优化, 即对X中第i列稀疏系数向量xi进行优化时, 将X中所有其他列向量进行固定。为便于观察求解, 将式 (10) 中稀疏系数矩阵转为向量化形式

式 (11) 中aiT为与xi对应的矩阵A中的行向量, 则对xi的优化可写为式 (12) 。

因为固定了系数矩阵X中除xi外的其他列向量, 可令误差矩阵, 则式 (12) 转化为式 (13) 。

式 (13) 中字典D右乘部分为xiaiT, 仍不能使用求解传统稀疏表示的算法对xi进行优化求解。为求解上式得到优化的xi, 这里参考双稀疏字典的求解[25]。先将aiT单位化, 即令αT=aiT/‖aiT‖2 (α是希腊字母, 其转置表示向量aT的单位化向量) , 则对xi的优化求解可转为求解式 (14)

式 (14) 中令τ=Γiα, 则为传统稀疏表示模型, 因此可使用求解稀疏表示模型的算法进行优化求解, 本文使用OMP算法。将上式求解得到的稀疏系数向量记为, 则最终得到的优化xi如下。

依次对稀疏系数矩阵X的每列向量进行以上优化求解过程, 可得到最终优化的稀疏系数矩阵X。则最终的降噪图像块矩阵为式 (7) 中所示。模型的具体算法步骤如算法1所示。

4 实验结果及分析

为验证提出的算法相比传统的基于K-SVD的稀疏降噪算法的效果, 在相同的条件下对两种算法做比较测试。另外, 由于算法加强了对高频部分的抑制, 因此较大噪声情况下更能突出算法的降噪效果, 这里主要在较大噪声环境下进行测试。选取大小为128×128的标准灰度图像Barbara、Lena、Pepper、House、Boat和Cameraman作为测试对象, 分别在高斯噪声、椒盐噪声、斑点噪声和泊松噪声的环境下进行测试。经过实验且为简化计算, 将加权系数β值取为1, 块尺寸取为8×8, 分块步长取为[2, 2], 字典原子个数取为256。在实际应用中, 由于稀疏求解的误差控制模型中需要先验的噪声幅度值, 而噪声幅度值的估计较为繁琐而且不够精确, 因而对模型的降噪效果有较大影响。另外, 有些种类的噪声如椒盐噪声并不存在幅度值。而在噪声较大的情况下稀疏度控制可以取得很好的效果, 而且不需要进行噪声幅度估计, 因此采用稀疏度控制。在本文设置噪声环境下, 经过实验稀疏度T取为1较取其它值得到更好的降噪效果, 因此将稀疏度T设置为1。

图1为在高斯噪声标准差 (零均值) 分别为50、40和30的情况下, 算法 (C=2 500) 和K-SVD稀疏降噪算法对House图像的降噪结果比较。从图1可以看出算法的降噪结果无论是在视觉上还是在数值上均优于K-SVD稀疏降噪的结果, 特别是墙体等变化较平缓部分由噪声引起的模糊程度相比后者有明显改善, 这是因为该部分图像高频分量较少, 算法抑制高频的特性更有利于该部分的恢复。为进一步验证算法在较大噪声情况下相对于K-SVD稀疏降噪的优势, 将以上六幅标准灰度图像分别在以上所述四种噪声情况下进行测试。为展示降噪结果与正则项谱特征参数个数的关系, 算法中将C分别设置为1 500和2 500两种情况。

表1为高斯噪声降噪测试结果的统计, 可以看出在标准差为50、40、和30的高斯噪声下, 算法 (C=2500/1 500) 对Barbara、Lena、Pepper和House的降噪结果在PSNR值和SSIM值上相比K-SVD稀疏降噪均有较大提高。这是因为噪声高频部分较多, 算法相比K-SVD稀疏降噪得到对高频稳定抑制的稀疏解, 因而算法较后者具有更强的去除高频噪声的能力。特别是House图像, 在噪声标准差为50情况下, 算法 (C=2 500) 较K-SVD稀疏降噪在PSNR值上提高1.04 d B, SSIM值上提高0.06;但算法对Boat和Cameraman图像的降噪结果相比House等图像提高较少, 甚至在标准差为30的时候算法对这两幅图像的PSNR值小于K-SVD稀疏降噪。这是因为这两幅图像本身含有较丰富的高频部分 (如较多的细节部分和急剧变化的边缘) , 而且由于算法对高频的抑制作用, 使得这两幅图像本身高频部分受到较大损失, 所以算法对这两幅图像的降噪效果较其它四幅图像的降噪结果有所下降。表1中对六幅图像的降噪结果有一个共同的趋势, 即随着噪声幅度的减小, 算法相对K-SVD稀疏降噪性能提高幅度也逐渐减小, 这是因为随着噪声幅度减小, 噪声图像中噪声高频部分随之减少, 算法的正则项对噪声高频的抑制作用也相对减少。从表1中可以看出另外一个现象, 即当噪声标准差为50和40时, 算法在C=2 500时对Barbara和Lena的降噪效果好于C=1 500时的效果;在标准差为30时, 算法在C=1 500时对这两幅图像的降噪效果优于C=2500时的效果。

这是因为正则项使用2 500个特征向量时比使用1 500个特征向量对高频的抑制范围更大, 而这两幅图像本身的高频部分又相对较多。因此在噪声幅度较小时, 增加噪声高频抑制范围带来的提升小于增加抑制图像本身高频范围带来的损害。

为更加直观的显示高频特征向量即谱特征参数个数C的选取与降噪效果的关系, 选取使用算法降噪效果较好的House图像和降噪效果稍差的Boat图像进行测试。图2所示为高斯噪声标准差为50、40和30的情况下, House和Boat图像在算法和K-SVD稀疏降噪算法下由谱特征参数个数C控制的PSNR值和SSIM值的曲线图。因为K-SVD稀疏降噪的结果与谱特征参数个数的选取无关, 图2四幅图中从上到下三条直线分别为标准差为30、40和50噪声幅度下的K-SVD稀疏降噪的结果, 三条曲线分别为相应噪声幅度下算法的结果。由于算法正则项对高频的抑制范围随着C的增大而增大, 而且House图像本身高频部分相对较少, 因此算法对House图像进行降噪的PSNR值和SSIM值随着C的增大而增长, 特别是在标准差为50的情况下, 增长的斜率更大。其中噪声标准差为50和C大于等于3 500的情况下, 算法的SSIM值超过了噪声标准差为40情况下的K-SVD稀疏降噪的结果, 这体现了算法在大噪声情况下对高频较少图像的降噪优势。相比之下, 算法对Boat图像的降噪结果相对K-SVD稀疏降噪其优势没有那么明显。由于Boat图像含有较丰富的高频部分, 在设置的三种噪声幅度下当C=1 500时达到了最高值, 之后的PSNR值和SSIM值均随着C的增加而递减。图2中的四幅图中还有一个共同的特性, 即当C达到3 721 (谱特征参数的总个数) 时, 除了噪声标准差50情况下算法对House图像的SSIM值外, PSNR值曲线和SSIM值曲线均出现大幅度急剧下降。这是因为C为3 721情况下算法的正则项不但对高频部分进行抑制同时对低频和直流部分也产生抑制, 即这时对图像本身各个频率部分均产生了抑制的原因。

注:K-SVD代表K-SVD稀疏降噪;本文算法 (2500) 代表本文算法取C=2 500情况;本文算法 (1500) 代表本文算法取C=1 500情况。黑体表示该情况下最优结果。

图3为在高斯噪声 (标准差为50) 、椒盐噪声 (噪声密度为0.1) 、斑点噪声 (噪声方差为0.1) 和泊松噪声 (峰值为10) 情况下, 算法 (C=2 500) 和K-SVD稀疏降噪对Barbara图像的降噪结果比较。从图中可以看出算法 (C=2 500) 无论在PSNR值上还是在SSIM值上都较K-SVD稀疏降噪有显著的提高, 特别是在Barbara图像的面部等较平滑区域, 算法 (C=2 500) 的结果相比K-SVD稀疏降噪结果有显著的改善, 噪声引起的模糊度有明显的减轻。这说明在以上四种噪声环境下, 算法对高频抑制均产生了很好的效果。为进一步验证本文算法的降噪效果, 下面分别再对椒盐噪声、斑点噪声和泊松噪声的降噪效果进行测试统计。

椒盐噪声下的降噪统计结果如表2所示。将噪声密度分别设置为0.1、0.08和0.06三种情况。算法 (C=2 500) 对Barbara、Lena、Pepper和House图像的降噪结果在三种噪声密度下的PSNR值和SSIM值均高于K-SVD稀疏降噪算法。算法 (C=1 500) 在三种噪声密度下对Cameraman图像的降噪效果无论是PSNR值还是SSIM值均取得较好的数值, 这是因为椒盐噪声具有特殊的频谱结构以及该图像有较丰富的高频部分。在噪声密度为0.08和0.06的情况下, 本文算法 (C=2 500) 对Boat图像的降噪结果在PSNR值上高于K-SVD稀疏降噪算法, 但在SSIM值上低于K-SVD稀疏降噪算法。这是因为Boat图像含有较丰富的高频部分且分布面积较大, 而椒盐噪声中高频分量也同样较大, 因此不易恢复出Boat图像的细节信息。可以看出, 算法对椒盐噪声的降噪结果基本与高斯噪声下降噪结果一致, 均有效抑制了噪声高频而使得结果较K-SVD稀疏降噪有较大提高。

注:K-SVD代表K-SVD稀疏降噪;本文算法 (2 500) 代表本文算法取C=2 500情况;本文算法 (1 500) 代表本文算法取C=1 500情况。黑体表示该情况下最优结果。

斑点噪声下的降噪结果统计如表3所示。在噪声方差分别为0.1、0.08和0.06的情况下, 本文算法 (C=2 500) 对Barbara、Lena和Pepper图像均取得较优的降噪效果。算法对House和Boat图像也取得了优于K-SVD稀疏降噪的效果。只有在噪声方差为0.08和0.06的时候, K-SVD稀疏降噪对Cameraman图像的PSNR值高于算法, 但在SSIM值上算法高于K-SVD稀疏降噪算法, 这是因为虽然Cameraman图像也含有较多的高频部分, 但分布面积相对较小, 对高频的抑制有利于其它高频含量相对较少图像部分的细节恢复。可见斑点噪声下的降噪结果与以上两种噪声下的结果基本一致, 仅存在因为噪声种类不同和图像本身构成不同而产生的较小差别。

泊松噪声下的降噪统计结果如表4所示。峰值为10、20及30的情况下, 本文算法 (C=2 500) 对Barbara、Lena、Pepper和House图像均取得较优的降噪效果。本文算法 (C=2 500) 在峰值为10和20时, 对Boat图像也取得了较优的降噪效果, 在峰值为30时算法 (C=1 500) 对Boat图像取得较优的降噪效果, 这也是图像本身结构不同及C取值不同造成高频抑制范围不同的结果。在峰值为10和20情况下, 算法对Cameraman图像也取得了较好的降噪效果, 只有在峰值为30的时候K-SVD稀疏降噪取得了较高的PSNR值, 但本文算法 (C=2 500) 取得了较高的SSIM值, 同样这也是因为Cameraman图像高频分布面积相对较小。可以看出, 泊松噪声下的测试结果与以上三种噪声情况下基本一致, 仅因为噪声特性不同而引起降噪结果有较小差别。

综上所述, 对不同种类噪声的去噪效果略有不同, 但在噪声较大的情况下, 算法在高斯噪声、椒盐噪声、斑点噪声和泊松噪声环境下均取得优于K-SVD稀疏降噪算法的效果。简而言之, 本文将图论的谱特征参数引入稀疏降噪模型可以得到稳定的抑制高频的稀疏解, 且可以通过调节C的大小对所要抑制的高频范围进行调节。但是引入的正则项不但对噪声高频部分有抑制作用同时对图像本身的高频部分也有抑制作用, 所以在噪声较大的情况下, 本文算法对噪声高频的抑制产生的提高将远远大于因抑制图像本身高频部分所带来的图像降质, 且对本身含有较少高频部分的图像能够取得更好的效果。当噪声幅度较小且图像含有丰富的高频部分时, 可以适当减小C的数值以得到更好的结果, 但当噪声小到一定情况下时本文算法的降噪效果并不理想。

注:K-SVD代表K-SVD稀疏降噪;本文算法 (2 500) 代表本文算法取C=2 500情况;本文算法 (1 500) 代表本文算法取C=1 500情况。黑体表示该情况下最优结果。

注:K-SVD代表K-SVD稀疏降噪;本文算法 (2 500) 代表本文算法取C=2 500情况;本文算法 (1 500) 代表本文算法取C=1 500情况。黑体表示该情况下最优结果。

5 结束语

结合图形拉普拉斯矩阵的性质, 使用噪声图像块构建关系图形, 然后将图像块矩阵映射到由一定数目高频谱特征参数组成的矩阵上, 将映射结果引入稀疏降噪模型, 可以得到稳定抑制高频的稀疏解, 从而达到更好的降噪效果。实验表明, 在相同条件下本文算法与传统K-SVD稀疏降噪相比, 在较大噪声情况下可以实现更好的降噪性能 (包括PSNR值和SSIM值) 。但是本文算法在噪声较小且图像高频丰富的情况下效果没有那么显著, 因为此时噪声高频较少但图像高频相对较多, 所以此时降噪效果并不理想。

摘要:提出一种基于谱特征参数的图像稀疏降噪算法。其采用稀疏重构理论为图像降噪框架, 并将图论中的谱特征参数作为一约束条件, 以有效克服传统稀疏重构中稀疏解不稳定的问题。该降噪算法将噪声图像块作为基础元素进行关系图构建, 进而得到邻接矩阵。然后, 求解该邻接矩阵对应的拉普拉斯矩阵, 并对其进行特征分解, 得到对应的特征向量, 即谱特征参数。最后, 将图像块矩阵与一定数目该高频谱特征参数所组成矩阵的乘积作为稀疏模型的正则项形成提出的算法模型。实验结果表明, 与基于K-SVD的稀疏表示降噪算法相比, 在相同参数的情况下提出的算法在多种类型噪声下对多幅图像的降噪效果都有着显著的提高。

关键词:图像降噪,稀疏表示,K-SVD,谱特征参数

参考文献

参数特征 篇9

关键词:超声造影,时间-强度曲线,肝脏肿瘤

肝脏由肝动脉和门静脉双重供血,易出现恶性肿瘤。恶性肿瘤新生血管的结构和功能影响着肿瘤的生物学特点。超声造影可反映肿瘤的功能血管结构,为肿瘤的诊断及鉴别提供依据。

1 对象与方法

1.1 研究对象

2009年2月至2010年3月,选取32例肝脏恶性肿瘤患者作为试验组,并进行超声造影(contrast-enhanced ultrasound,CEUS)检查。其中,男19例,女13例,年龄32~75岁,平均(45.69±9.35)岁;病灶直径1.5~9.2 cm,平均(3.47±2.16)cm。其中,原发性肝癌16例,肝转移癌16例(原发肿瘤包括结肠癌4例,胃癌4例,肺癌3例,前列腺癌2例,乳腺癌2例,子宫内膜癌1例)。选取20例肝血管瘤患者作为对照组。其中,原发性肝癌10例,肝血管瘤经病理证实12例,其余病灶经增强CT、增强MRI、实验室检查及原发肿瘤病理证实。

1.2 方法

采用Philips iU22彩色多普勒超声诊断仪,C5-2探头,频率2~5 MHz,应用反向脉冲谐波显像技术。造影前先以二维超声扫描全肝脏,观察记录肝内病灶的位置、大小、数目、回声特征及病灶内部和周边的血流分布情况。在病灶显示的最佳切面固定探头,多发病灶选择病灶显示完全且受呼吸影响较小者作为对象,切换至造影模式,经肘部浅静脉以团注的方式注入配制好的SonoVue造影剂2.4mL。在注射造影剂的同时开始计时,并将整个造影过程录制于仪器内。仪器的增益、深度等在整个造影过程中保持不变,机械指数设定为0.06。实时观察病灶动态灌注过程及回声变化情况,造影结束后将录制的动态图像回放分析。

1.3 图像分析

造影完成后将动态图像导入计算机。启动QLAB定量软件,选择注射造影剂后120s内的动态图像。感兴趣区为病灶增强最明显处及同水平的正常肝脏实质。仪器可自动绘制时间强度曲线(time-intensity curve,TIC),分析曲线形态,以获取定量指标。可直接获得的定量指标包括:始增时间、始增强度、达峰时间、达峰强度、增强时间、120s强度。计算后得出的指标包括:增强时间、强度增量、上升支斜率、下降支斜率。增强时间=达峰时间-始增时间;强度增量=峰值强度-始增强度;上升支斜率=(峰值强度-始增强度)/(峰值时间-始增时间);下降支斜率=(峰值强度-120s强度)/(120s-峰值时间)。

1.4 统计学分析

用SPSS12.0统计软件进行统计学分析;样本中两个均数的比较采用t检验;P<0.05为差异有统计学意义。

2 结果

2.1 肝脏恶性肿瘤TIC特点

注:红线为病灶区TIC;黄线为肝实质TIC

注:红线为病灶区TIC;黄线为肝实质TIC

试验组TIC上升支较陡直,达峰值强度后迅速下降,动脉相晚期或门脉相早期与正常肝实质TIC有交叉,即“快上快下”型(图1~2)。对照组TIC上升支较缓,达峰值强度后维持一段峰值平台期,下降较平缓,曲线强度高于周围肝实质曲线的强度,与肝实质TIC无交叉,即“慢上慢下”型。

2.2 肝脏恶性肿瘤TIC声学定量参数特征

试验组与对照组TIC的声学定量参数相比较:恶性病灶始增时间、达峰时间、增强时间小于良性病灶,差异有统计学意义(P<0.05);恶性病灶上升支斜率及下降支斜率大于良性病灶,差异有统计学意义(P<0.05),见表1。

3 讨论

1979年,Folkman[1]提出恶性肿瘤生长依赖于新生血管的形成这一新概念。肿瘤血管生成在恶性肿瘤发生、发展及转移的过程中均起到重要作用。了解恶性肿瘤的血管结构和功能特点有助于对肿瘤生物学行为的认识,可以针对性地进行病例筛选和治疗,从而改善疗效和预后。恶性肿瘤的快速生长需要更多的血氧供应,肿瘤血管的大量增生使肿瘤的血流灌注面积和灌注量明显增加。恶性肿瘤新生血管与正常毛细血管结构不同,其管径粗细不等、分支紊乱、管腔形态不规则。因此,血液黏滞度和血流阻力也相应增加;同时由于存在广泛的动、静脉瘘,肿瘤内部压力因血管通透性增加及缺乏淋巴管引流而增加(为正常间质组织的3~5倍)[2],所以肿瘤中心部位易缺氧坏死,无血管结构,造影剂不能到达,导致恶性肿瘤中央可出现无增强区。病灶中心新生血管在缺氧的诱导下大量增殖,但多为较幼稚的、不成熟的血管,边缘则以成熟的血管居多。而成熟血管数目对肿瘤血供起主要作用,因此肿瘤边缘的血液供应明显优于病灶中心。由于肿瘤血管存在结构和功能的异质性,造影剂的分布和代谢也较为复杂,恶性肿瘤不同部位超声造影的增强程度及方式不尽一致,在选择感兴趣区时,应选择病灶增强最明显处,并且避开较大的血管分支,以免绘制的曲线不能正确反映病灶内的血供情况。

肝脏是由肝动脉和门静脉双重供血并以门静脉供血为主的脏器。随着肝内病灶良恶性成分的变化,供血比例也发生相应改变[3]。高分化肿瘤可接受门静脉及肝动脉的双重供血。随着分化程度的降低,门脉血供不断减少,动脉血供不断增加。由于门静脉可以吸收多个消化系统脏器的血流至肝脏,故肝脏是转移瘤的好发部位之一。从理论上讲,转移性肝癌大部分应以门静脉供血为主。早期活体动物模型研究显示肝动脉与门静脉在肿瘤周围相交通,<10 mm的转移灶门静脉供血比例较大[4]。近年来的研究表明[5],早期肿瘤肝转移新生血管几乎均来自于肝动脉系统,且肿瘤血管在直径200μm的肝转移癌中即可形成。原发性肝癌与肝转移肿瘤具有相似的血供特点,即肿瘤新生血管增多,且以肝动脉供血为主。因此,肿瘤血流灌注量增加,灌注加快,故恶性病灶开始增强时间及达峰时间均较早,增强时间较短,TIC上升陡直,斜率较大。同时几乎所有的肝癌结节都存在着不同程度和不同情形的门静脉供血或引流,故TIC下降支较陡直,斜率较大,病灶声强很快低于周围肝实质,病灶TIC与肝实质的TIC有交点。

了解了血管形成的过程和肿瘤血管的结构、功能差异对于理解肝癌超声造影上的增强机理至关重要。肿瘤血管形成导致的超声造影增强的改变可以为肝癌的定性、定量诊断提供依据。

参考文献

[1]Folkman J.Tumor angiogenesis:therapeutic implication[J].NEngl J Med,1971,285:1182-1186.

[2]Anderson H,Price P,Blomley M,et al.Measuring changesin human tumour vasculature in response to therapy usingfunctional imaging techniques[J].Br J Cancer,2001,85(8):1085-1093.

[3]Hayashi M,Matsui O,Ueda K,et al.Progression to hypervascularhepatocellular carcinoma:correlation with intranodular bloodsupply evaluated with CT during intraarterial injection ofcontrast material[J].Radiology,2002,225(1):143-149.

[4]Kan Z,Ivancev K,Lund erquist A,et al.Invivo microscopy ofhepatic tumors in animal models:a dynamic investigationof bloodsupply to hepatic metastases[J].Radiology,1993,187(3):621-626.

参数特征 篇10

可靠性一词源于1957年AGREE的学术报告, 它在说话人识别技术应用中具有丰富的涵义。具体到技术运行的可靠性, 通常称为支持可靠性[1]。支持可靠性通过固有可靠性和使用可靠性两方面来表现, 这两方面涵盖了技术研究和投入使用两方面的全过程。固有可靠性是指技术内在的可靠性, 它在技术的研发过程中得以确立。技术的仿真、结构的设计、工艺的科学性以及检验方法决定了固有可靠性, 而使用可靠性则与技术的实现环境和实现方法密切相关, 它更多的取决于技术的操作方法等众多外界因素, 另外产品的研发者的素质对使用可靠性也会产生很大的影响。[2]

1 我国说话人识别技术研究现状

在我国, 由于汉语在发音和结构上的独特性, 语音信号的特征参数和行为规范比较复杂而多变, 国外的说话人识别技术无法直接应用, 这给中国的说话人识别技术带来了很大的困难和挑战。但是近几年来, 国内外众多科研机构、高校实验室以及高科技公司都对汉语的说话人识别技术投入了很大的精力, 国内外一些重点实验室、研究所以及一些公司等都通过自身的努力和互相间的合作, 对说话人识别技术的研究做出了很大的贡献。

2 语音特征参数提取及组合

2.1 线性预测倒谱系数提取的实现

本文中所做实验中语音特征参数选用线性预测倒谱系数 (LPCC) 、美尔倒谱系数 (M FCC) 。

实验中需要先取取线性预测系数 (LPC) , 在LPC的参数求出的条件下再进行LPCC计算, 这是因为由于不能直接提取到线性预测倒谱系数。这一过程的实现可采用MATLAB软件语音处理工具箱中的lpc函数进行提取, 它的实现语句是:

这里x为一帧语音, p为计算LPC参数的阶数。MATLAB语音处理工具箱中也提供了计算实复倒谱系数的函数cceps, 如果不考虑计算量, 可以用下面的函数计算一帧语音信号x的LPCC系数:

该程序中首先计算x的LPC系数, 由于函数cceps不是基于递推公式的, 因此要保留所有阶的LPC系数, 即a的长度与序列x的长度相同。当然, 这种方法在一个实际的语音系统中是不能采纳的, 因为计算量太大。因此, 采用迭代算法计算LPCC参数的程序如下[3]:

此段代码中, 假设LPC系数的阶数为14, LPCC系数的阶数为16, 前10阶LPCC系数通过10阶LPC迭代计算, 后2阶LPCC则是通过外推得到的。

2.2 美尔倒谱系数提取的实现

在MATLAB语音处理工具箱中, 计算MFCC的函数为melcepst, 其中调用了计算滤波器系数的melbankm函数, melbankm的语法为:

其中, m为滤波器个数, n为语音帧长度, fs为采样频率。例如, 设计一个滤波器组, 包含24个滤波器, 语音信号的帧长度为256, 信号采样频率为8000Hz, 所用的命令为:

利用函数melcepst可以直接计算语音信号s的MFCC参数

这一命令默认地以256点为帧长计算12阶的MFCC参数。如果s比较长, 将会按照128点的间隔将s分为若干帧, 再分别计算。由于本系统要获取16阶的MFCC系数, 且语音的帧长为256点, 帧移128点, 因此不能直接采melcepst函数。修改后的计算MFCC的函数如下:

2.3 语音参数的特征组合

图1为本文所采用的组合方式, 将LPCC与MFCC两个特征组合为一个特征Com。具体特征组合方法如下:

其中, p为MFCC的维数, q为LPCC的维数。

通过仿真得出的组合特征参数的图如图1所示。

组合特征参数图中, 横坐标取MFCC和LPCC各20帧, 纵坐标为所对应参数值的数值。语音参数中不同的特征是基于不同的模型, 本文中LPCC是基于声道模型, MFCC则是基于人的听觉模型, 不同类型的特征向量表征了人的不同特性, 通过特征组合采用多种向量组合有利于从不同的角度体现说话人个性。

单独使用某一参数只能反映某一方面的特性, MFCC反映的是说话人语音的听觉频率非线性特性, LPCC反映的是说话人声道生理结构的差异, 使用组合特征参数LPCC弥补了MFCC声道不能描述声道的特征, 语音识别中利用组合特征参数能较好的反映说话人的个性特征, 能够提高说话人识别率。

3 结语

本论文主要目的是对语音特征参数的组合进行研究, 通过参数的特征组合从不同的角度来反映说话人的个性特征, 能够大大提高说话人识别系统的识别率。本文首先对说话人识别的基本知识及研究历程做了介绍, 其中涉及到了说话人识别常用的特征参数以及利用特征参数进行说话人识别存在的技术难点。其次对语音信号的基本处理进行阐述, 说话人识别归根到底就是对说话人语音的识别, 所以对语音信号的处理是一项很重要的工作, 本文所用的特征参数 (MFCC及LPCC) 的特性及提取过程进行了详细的解释。

摘要:本论文重点对语音特征参数的组合进行了研究, 通过参数的特征组合从不同的角度来反映说话人的个性特征, 能够大大提高说话人识别系统的识别率。对其中的特征参数 (MFCC及LPCC) 的特性及提取过程进行了详细的解释和仿真。

关键词:说话人识别技术,线性预测倒谱系数,语音参数

参考文献

[1]史绍强.基于多级小波神经网络的模糊说话人识别研究[D].长沙理工大学学位论文, 长沙:长沙理工大学, 2004.

上一篇:桦树皮文化论文下一篇:航空食品配餐