物种识别(共2篇)
物种识别 篇1
1 引言
人类有人类的语言,动物也有动物的语言,不同的动物所发出的叫声是不同的,因此可以通过提取不同动物的叫声特征来识别动物的种类。
根据不同的识别目的,可将动物叫声识别与现代的语音识别技术进行类比:若想对某个动物的个体进行识别,就要根据这种动物的种群发声特征和其本身的发声特征来进行识别,因此这种识别系统类似于语音识别中的说话人识别,可以在现有的说话人识别系统的模型基础之上加以改进,来实现其目的;如想对某种动物的种群进行识别,则应根据这种动物的整体发声特征来进行识别,这与语音识别中的语种识别系统和孤立词识别系统有相似之处,因此可以利用这两种识别系统现有的模型并适当的加以改进来实现。本文所研究的是基于动物叫声的物种识别,属于第二种情况。
本文在孤立词识别系统的相关理论基础之上,采用基于人耳听觉特征的Mel频率倒谱参数(MFCC)的改进形式——小波Mel频率倒谱参数(Wavelet Transform Mel-Frequency Cepstral Coefficients,WTMFCC),作为特征参数,并使用隐马尔可夫模型来进行识别。
由于关于动物叫声的研究目前较少,因此本文对动物叫声的识别是在人的发声模型的基础之上,并去除清音和浊音的概念后,所进行的研究。并且本文所研究的动物叫声均是人耳可听的叫声,对于人耳不可听的叫声,由于获取数据的问题,本文未对其进行探讨。
2 静态离散小波变换
小波变换具有分辨率可变、无平稳性要求和在时频两域突出信号局部特征的能力等优点,因此,语音信号经过小波变换后,在各尺度空间内的近似信号和细节信号能提供原始语音信号的时频局部信息,特别是能提供不同频段上语音信号的构成信息[1]。
目前在信号处理中被广泛使用的是离散小波变换(Discrete Wavelet Transform,DWT),这是因为离散小波变换具有快速算法,如Mallat塔式算法[2],但是为了实现这些快速算法,离散小波变换在进行计算时要对变换后的系数进行下采样,从而使原始信号的部分信息丢失了。而静态离散小波变换(Static Discrete Wavelet Transform,SDWT)与DWT不同,在对信号分解的过程中,不对分解的系数进行下采样,所以每次分解的系数长度都与原信号相同,同时也将原始信号信息全部保留了下来[3]。当然这是以计算时间为代价的,但是由于现代技术的发展,对于这一点已经不是主要问题了。
SDWT的单步的分解算法如图1所示:
其中c Aj为第j层的近似系数,c Dj为第j层的细节系数,Fj,Gj为每次分解用到的低通滤波器和高通滤波器,这里使用的滤波器在不同层次分解上是不同的,每一步的滤波器设计如图2所示:第j+1步采用的滤波器是第j步滤波器的上采样。
在初始状态,c A0为原始信号,F0为小波函数所对应的低通滤波器,G0小波函数所对应的高通滤波器,随着分解步数的增加,滤波器也逐步变大。
在进行静态离散小波变换重建(Inverse Static Discrete Wavelet Transform,ISDWT)时,由于在分解的过程中并没有进行下采样,所以在近似系数和细节系数分别作用重建低通和高通滤波器后,直接相加就可以得到重建的上一层次的近似系数(或原始信号),而不需要再做上采样,由于每次重建信号的总长度不变,所以滤波器也不需要进行下采样。重建算法的流程如图3所示。
通过分析可以看出,在进行ISDWT时,如果指定细节系数为零,那么所获得的结果就是近似系数的重建结果;如果指定近似系数为零,那么就可以得到细节系数的重建结果。将近似系数和细节系数的重建结果相加,就可以得到原始信号,也就是说,这样所得的重建方法,不但可以获得原始信号各个频段的信号,而且消除了变换时小波函数所带来的影响。下文所述的WTMFCC参数的提取正是基于这一点来实现的。
3 WTMFCC参数提取
人耳可听的语音信号主要是由10k Hz频率范围内的信号所组成的,并且不同的频段所反映的信息不同。例如,对于人的语音,低频部分主要反映说话人所说的内容,而高频部分则包含了相对较多的说话人本身的特征。因此对于不同目的的识别,由不同频段的信号所提取出的特征参数的重要性应该有所不同。例如对于孤立词识别,就应该使由低频段信号所提取出的特征参数占主导的地位,同时削弱高频段的特征参数的重要性,而对于说话人识别,则应恰恰相反。基于这一推理,本文对不同频段的信号分别进行了特征参数提取,然后利用加权值将不同频段信号的特征参数进行合并,再利用合并后的特征参数进行训练和识别。
要对不同频段的信号进行处理,一般是使用小波变换或小波包变换将原信号分解,获得各频段的系数,然后进行相应的处理。但是如果直接使用小波变换或小波包变换所得的结果进行加权处理,识别效果是不理想的,其原因是在变换的过程之中,对原始信号引入了小波函数,变换后的结果实际上是原信号与小波函数相互作用的结果,从而影响了系统性能。因此本文使用上文所述的静态离散小波变换(SDWT)和其重建理论(ISDWT),将原始信号表示为不同频段的信号相加的形式,这样不仅可以消除小波函数对原信号的影响,还提高了不同频段信号的信噪比,进而增强了系统的鲁棒性[4]。
由于MFCC参数的提取过程是非线性的,不满足可加性,因此不能对重构后的信号先进行加权处理再提取MFCC参数,而只能先获各自的MFCC参数,然后再对其进行加权处理,进而获得WTMFCC参数。参数提取的过程如图4所示。设PAM F C C是重构近似信号MFCC参数的矩阵,PDMFCC[i]是第i层重构细节信号MFCC参数的矩阵。因为重构后的信号与原信号长度相同,因此可以将参数矩阵直接相加。设W为加权值矩阵,其中W[0]为近似信号的加权值,W[i]为第i层细节信号的加权值。设PWTMFCC为原始信号的WTMFCC参数矩阵,则有:
其中K为小波变换的层数。
由上述提取过程可知,对于中介参数的选择是任意的,既可以选择MFCC作为中介参数,也可以选择LPCC作为中介参数。在本文中选择MFCC参数作为中介参数的原因如下:(1)对于动物的叫声的研究还很有限,还不能确定每种动物都有共振峰、基音周期等特征,因而不能统一的使用这些参数来进行识别;(2)MFCC参数的分析是基于人耳的听觉特性的,不受叫声来源的限制,即对所有人耳可听范围内的动物叫声都是适用的;(3)大量研究表明,MFCC参数能够比基于发声模型所获得的LPCC参数更好的提高系统的识别性能[5]。
本文在对原信号进行分解时,所使用的是db5小波,进行5层分解,这是因为Daubechies[6]系列的小波具有很好的正则性,并且扩展性比较好,可以比较灵活地权衡增加支集长度带来的边界问题,并且如果分解的层数如果太小则无法起到有效分解信号的目的,太大又会增加计算量,而且过多的分解所产生的改进效果并不十分明显。应该指出的是,这里采用db5小波只是一种比较合理的选择,它并不是最优的。
4 训练和识别
根据前面的论述可知,本文所使用的方法对于任何种类的、人耳可听的动物叫声都是适用的,并没有对某种动物叫声作特殊的处理,因此对于系统所用的叫声数据没有什么特殊要求。系统中所使用的声音是狗、牛、猫和羊等的叫声。
本文采用连续混合高斯HMM,模型的状态数取4,每个状态有3个混合高斯概率密度函数。对各状态的混合高斯函数的均值、方差和权系数的初始化采用k均值算法。在训练过程中,使用WTMFCC参数和其一阶差分作为信号的特征参数,从而获得信号的静态和动态特征,提高识别率。
因同一种类动物的叫声也会有较大的差距(如图5所示),因此为了使识别更加准确,在训练前可先将同种动物的叫声使用径向基概率神经网络进行分类,然后对分类后的叫声分别进行训练,产生同一种类动物的多个模型,从而提高识别率。在本文中,在建立狗的叫声模型时就根据其叫声中是否有前音设置了两个模型。
在使用MFCC参数进行识别时,图6所示叫声会被误认为是狗的叫声,但是在使用加权值为[1 2 2 3 4 6]的WTMFCC参数进行识别时,可以很准确地将其识别为羊的叫声。
通过实验表明,对于相同的训练数据和识别数据,使用不同的加权值所获得的WTMFCC参数的准确识别率是不同的,代表性的实验结果如表1所示。
表1中的识别率可由式(2)、式(3)获得:
识别率=正确识别数/叫声总数(2)
其中正确识别个数为:
正确识别数=正确接受数+正确拒绝数(3)
通过表1中的数据可以看出,对于信号的不同频段,所含信息的重要性是不同:(1)低频段部分虽然包含了发音内容的大部分信息,但是如过于强调,而忽略其他频段的所包含的信息,反而会使识别率下降,因为不同物种间的叫声有可能有类似的,这时就要靠其他频段的信息来进行区别;(2)对于最高频段的系数,虽然受噪声的影响最大,但是其中也包含了信号的部分特征;(3)如果将信号的高频部分加重,也可以得到良好的识别效果,这是因为信号的高频部分包含了发声者本身的特征,而对于不同种类的动物而言,这种特征在同一物种间的差距比不同物种间的差距要小,因此也可以使用这些特征进行识别;(4)由于MFCC参数不是线性可加的,从而导致在加权值全为1的情况下所获得的WTMFCC参数没有MFCC参数的识别效果好。
5 结束语
本文主要对WTMFCC特征参数的灵活性和可行性进行了说明和验证,对于不同的识别系统,可以使用不同加权值的WTMFCC参数来取得令人满意的识别效果。在本文讨论的系统中,所使用的加权值是通过试验的方式获得的,其值为[1 2 2 3 46],其识别率相对于MFCC参数提高了7%,当然这并不是最优加权值,而且如果使用不同的小波函数进行不同层数的信号分解,其加权值也必将改变。
需要说明的是,在本文中,对于不同种类动物叫声的特征参数使用同一加权值进行处理,不是很恰当,因为对于不同种类动物的叫声,不同频段信号的特征参数的重要性不可能完全相同,全部使用同一个加权值进行处理显然是有缺陷的,这就需要一种通过理论计算获得最优加权值的方法,以便快速准确的为每个模型绑定一个加权值,从而更好地提高识别率,这将是以后的研究重点。
摘要:本文所研究的基于动物叫声的物种识别系统,是在孤立词识别系统的理论基础之上,对传统的MFCC参数作适当的改进,提出了基于小波变换的WTMFCC参数。此参数比传统的MFCC参数具有更好的灵活性和鲁棒性,可以根据不同的统和模型,调整其加权值,从而提高识别率,获得更好的识别效果。
关键词:语音识别,MFCC,小波变换,物种识别
参考文献
[1]CHING-TANG HSIEH,WANG YOU-CHUANG.“A robust speaker identification system based on wavelet transform”[C].IEICE Trans.Inf.&Syst,2001,E84-D(7).
[2]MALLAT S.“A theory for multiresolution decomposition:the wavelet representation”[C].IEEE Trans.Acoustics Speech and Signal processing,1988,37(1):674-693.
[3]H.N.NOUNOU,M.N.NOUNOU.”Multiscale fuzzy Kalman filtering[”J].Engineering Applications of Artificial Intelligence,2006:(19)439-450
[4]FU,QIANG.“Research on parameter representation and objective quality assessment of speech”[D].A Dissertation Submit-ted to Xidian University in Partial Fulfillment of the Requirementsfor the Degree of Doctor of Philosophy In Electrical Engineering.2000.9,23-32
[5]Benjamin J.Shannon,Kuldip K.Paliwal.“Feature extrac-tion from higher-lag autocorrelation coefficients for robust speechrecognition”[J].Speech Communication,2006,48:1458-1485.
[6]DAUBECHIES.“Orthonormal bases of compactly sup-ported wavelets”[J].Communications on Pure and Applied Mathematics,1988,41(7):909-99
十、物种起源序言 篇2
一、学习重点
(一)筛选主要观点
(二)筛选关键语句
二、教学设想
(一)初读课文、辩析内容,默读一遍课文,只要求学生找出本文的主要内容,集中在哪几段,把注意力集中在第四至第七段,为筛选信息作好准备。
(二)研读课文把握内容,先把力气在把握课文内容上,例如弄懂每段大意,弄清《物种起源》是本什么样 的书,它的主要内容是什么?作者申明了哪些观点?
(三)按照要求筛选信息
认真完成课后练习有关筛选信息的题目,掌握筛选方法。二教时
三、教学过程
第一教时
一、达尔文和《物种起源》
达尔文(1809-1882)是“进化论”的创始人。出生于英国
一位名医之家,1825年进爱丁堡大学学医,1828年进剑桥大学学神学,但他从小就热心研究自然科学,特别是生物学。1831年至1836年,由于汉斯罗教授的推荐,以自然科学家身份,随英国皇家军舰贝格尔号环球旅行。五年间,他考察了许多地方,对各种生物进行了搜集研究,人此确定了他一生的事业。1859年达尔文发表了《物种起源》,从根本上否定了当时甚嚣尘上的“神创论”“物种不变论“的传统观念,成为划时代的世著,产生了深远的影响。马克思曾这样评价《物种起源》:“达尔文的著作非常有意义,这本书我可以用来当作历史上的阶段斗争的自然科学根据。„„虽然存在许多缺点,但是在这里不仅第一次给了自然科学的‘目的性’以致命的打击,而且也根据经验阐明了它的合理的意义。”(《马克思致斐•拉萨尔(1861年1月)》)
达尔文还有《动物与植物在训养下的变异》《人类起源》等 名著。
二、导言
导言:亦称绪论。是指著作前的概述部分。用于作者说明自
己撰写著作的目的、过程、资料来源,并扼要地说明书中所阐述的观点或结论,使读者先得到一个总概念,帮助理解整部著作。
三、名词解释 物种、变异、变种
物种:生物分类的基本单位,种是种类的意思,在生物的分
类中采用几级分类单位,一般是种、属、科、目、纲、门等,种就是物种。同一属的不同物种就是相近的物种,例如老虎和狮子都属于豹属、猫科、食肉目、哺乳纲,脊椎动物。
变异:同一物种的不同个体间的差异和区别。变异在饲养动
物和栽培植物中是普遍存在的。例如马有躯体壮大适宜于曳重的品种,也有躯体俊健适宜于快跑的品种。小麦有无芒的品种,也有有芒的品种,有短芒的品种,也有长芒的品种,至于金鱼和菊花的品种,那就更加繁多了。
变种:指变异比较显著的个体或个体群。变异比较显著的个体群就相当于变种(物种以下的分类单位)。例如,东北虎和华南虎就是两个变种。
四、初读课文,辩析内容
默读一遍课文,找出本文的主要内容集中在哪几段? ——第四至七段,介绍了物种起源的主要内容。
五、研读课文,把握内容 仔细画出本文每一自然段中能概括本段主旨的核心句吗?根据这些句子及其相互关系,你认为本文可分部分?
解析:每自然段核心句—— “我并没有轻率地下结论” “我早日发表这个摘要的原因” “本书还是摘要的性质,未必完备”
“生物的种,和变种一样,是由以前别的种演变而来,而不是分别创造出来的。” “要解决这个困难问题,应当人研究家养动物和栽培植物着手。” “我把家养变异的问题,放在本书的第一章。”
“我深信生物的种不是不变的;所谓同属的种,都是其他大概已经灭亡的种所传下来的直系后代,而现在认为同种的各项变种,都是这同种的后代。我又确信自然选择作用,它虽然不是物种变异的唯一条件,也该是最重要的条件。”
据此,本文可分为两部分——
第一部分(第1—3节)说明《物种起源》一书的写作经过和摘要发表的有关情况。第二部分(第4—7节)扼要介绍《物种起源》一书的内容体系。
要学会辩析文章内容的能力,首先要学会辩析哪些是主要内容,哪些是一般内容,如果你浏览全文,你就会发现第4至7段是文章的主要内容,而第1至3段只是交代了《物种起源》的写作,提早发表的原因,说明读书“还是摘要的性质。”
其次要分清哪些是观点,哪些是材料,对文章主体部分的内容进行信息筛选的时候,首先要筛选出作者阐明的是《物种起源》问题的两个主要观点。
六、速读课文,筛选出作者阐明的关于物种起源内题的两个基本观点。——
1、我深信„„(或生物的种„„)
2、我又确信„„
第二教时
一、继续辩析课文内容
(一)在研究第5、6段内容时,应该注意找出作者研究家 养动物和栽培植物的目的、意义和由此获得的认识。
略
(二)在文章第2段中作者从两个方面归纳了关于物种起源 还需要弄清楚的内题。
——我们对于生活在我们四周的许多生物的相互关系还有很 多不了解的。
对于生活在过去的地质时代的无数生物的相互关系我们所知 道的就更少了。
在整体把握文章内容的基础上,我们还应能全面准确地把 握语句所传达出来的信息,这就要求能够对语句作细致严密的分析。
(三)辩析文章的语言
辩析文章语言的能力,体现在准确,全面地把握语句表达的
信息,主要体现在(一)把握语句中心的关键词语,(二)把握长句的信息量。
在1837年我就想到,如果耐心搜集与这个问题有关的材料,加以整理研究,也许可以得到一些结果。(1)在这句话中,作者告诉我们,他在写作《物种起源》 时,经历了三个必不可少的过程,这三个过程是:搜集、整理、研究。(2)在这句话中,作者所透露的搜集过程的关键是什么? 答:
“耐心”而全面“各种”
。(3)“也许”、“一些”两词体现了达尔文在科学研究中的何 种态度?
答:
说明了估计的谨慎。
2、下面句子中加点的词语都很有表现力,试结合语境加以 分析。
(1)我虽然力求审慎,使一切能根据正确的证据,但是错 误的窜入,还是不可避免的。
答:“窜入”准确生动地说明在这项科学研究中,出现错误 是不可避免的。
(2)我又确信自然选择作用,它虽然不是物种变异的唯一 条件,也该是最重要的条件。
答: “该“,既表达了”确信“的语气,又恰如其分地说 明了对自然选择与物种变异的关系的。
(3)、关于物种起源的内题: 认识还是一种推断。
关于物种起源的问题,如果一位博物学家,对于生物相互间的亲缘关系,它们的胚胎的关系、地理的分布以及在地质期内出现的程序等等事实,加以思考,那么,我们可以推想得到,生物的种,和变种一样,是由以前别的种演变而来的,而不是分别创造出来的。
[讨论]分析,就是拆开来。拆开来,有这样几点:
①“对于生物相互间的亲缘关系、它们的胚胎的关系、地理的分而以及在地质期内出现的程序等等事实”,是“思考”的对象,也就是研究的资料,可以概括为“研究物种起源所凭借的事实基础。
②“对于„„事实,加以思考,那么,我们可以推想得到”,可以概括为“研究物种起源的方法”。③“生物的种,和变种一样,是由以前别的种演变而来”,这是对物种起源的推断,也就是物种起源的基本观点。
④“不是分别创造出来的”,所谓“分别创造出来的”正是“神创论”,“不是”即否定。这一点可以概括为“对神创论的否定”。
又如槲寄生,它是从某些树木吸取养料。它需要鸟类传播它的种子,更因它雌雄异花,又必须依赖昆虫才能完成传粉作用。我们假使仅取外部环境,或习性的影响,或植物本身的倾向,来解释这种寄生植物的构造以及它和好几种其他生物的关系,必定是同样不合理的。
这段话的主要意思是()
A、以槲寄生为例,说明一切生物(包括植物)的构造和相 互之间的关系都是十分复杂而又难以理解的。
B、我们想正确解释生物的构造、生物之间的关系,就不能 归因于某一方面。槲寄生就是一个例证。
C、若只以外部环境、植物习性的影响以及本身的倾向来解 释植物(如槲寄)的构造和相互关系,必定是不合理的。
D、在研究槲寄生时,往往同研究其他生物一样,对它的结 构以及和其他生物的关系不能做到合理的解释。
我深信生物的种不是不变的。双重否定句 一是加强了语气,肯定了物种变异这一认识。二是增强了文章诠释的力量,是对“不变”论的有力批驳。
我又确信自然选择作用„„
该,既表达了“确信”语气,又恰如其分地说明了对自然选 择物种变异关系的认识还只是一种推断。
二、总结
纵观全文,可以看出达尔文的学说批判了形而上学的观点,分别是: ——物种不变论
神创论