精彩的器乐比赛

2024-10-10

精彩的器乐比赛(精选2篇)

精彩的器乐比赛 篇1

0 引言

随着多媒体信息的日益膨胀,有效地对多媒体数据进行内容分析和摘要变得愈发重要。体育比赛精彩片段的自动提取即为研究的热点之一[1,2,3,4,5,6]。利用这一功能,用户可以从大量数据中方便地获取比赛中的重要事件(如足球比赛的进球)。目前,精彩片断提取问题仍然没有很好地解决,其中的关键困难在于如何将底层的声学/视觉特征和高层的特定事件联系起来。为解决这一问题,目前广泛采用的方法是引入一个描述语义关键字的中间层[1,3]。常用的中间层语义关键字包括摄像机模式(远景/近景)、镜头位置(前场/中场)、解说是否兴奋、哨声、掌声等。中层关键字的检测精度直接影响了整个系统的性能。本文重点研究兴奋解说这一重要的中间层关键字。这一研究成果被用于一个达到领先水平的体育视频精彩片断检测系统中[5,6]。

兴奋解说被认为是最明显和可靠的指示精彩片断的中间层关键字之一[2,3,4]。一段兴奋的解说通常会对应体育比赛中一个较为重要的片断。兴奋解说提取的方法一般可以分为两类:基于学习的和基于规则的。基于学习的方法[2,3]使用训练数据建立产生式模型,如高斯混合模型(GMM);或直接训练分类器,如支持向量机(SVM),来实现对兴奋解说的提取。基于规则的方法通常利用简单的声学特征(能量、基音等)和一些简单的门限得到兴奋解说[4]。一般而言,基于学习的方法的性能高于基于规则的方法,而基于规则的方法通常复杂度低、实现简单。

在实际使用中,基于学习的检测方法的性能经常受到训练与测试数据失配的影响。如何克服失配成为一个重要的问题,而这一问题在体育比赛视频中尤为突出。体育比赛中的音频构成非常复杂,包括解说声音、背景音乐、来自观众的噪声(掌声、笑声等)。另外,在录制过程中加入的自动增益控制(AGC)进一步增加了问题的复杂性。另一个重要的问题是,现有的兴奋解说检测[2,3,4]大多假设兴奋语音的持续长度较长,忽略了时间很短但兴奋度很高的片断,而这些短的片断可能表征了重要的事件。例如,在足球比赛中,短而兴奋的解说可能表示远射或严重犯规,这些事件不应该被忽略。

考虑到上述的问题,我们提出了一种基于GMM和无监督、自适应的兴奋解说检测方法,进而提取出体育比赛的精彩片断。其主要思想是:首先利用训练得到的初始模型对测试数据进行分类,而后利用对应类的测试数据更新模型,达到减少训练与测试数据失配的目的,提高分类的灵敏度和精确度。我们对足球比赛视频的实验结果验证了提出方法的有效性。

1 兴奋解说的检测

1.1 兴奋解说和普通解说的建模

从语谱图上可以较容易地观察到兴奋语音和普通语音的区别(如图1所示)。兴奋语音和普通语音的差别主要表现为以下三点:

1)兴奋语音的基音明显升高;

2)兴奋语音的能量较大;

3)相比普通语音,兴奋语音的能量分布更趋于高频段(2000Hz-3000Hz)。

尽管如此,简单地使用基音、能量以及能量分布只能滤除明显非兴奋的语音部分,而不能作为可靠的检测兴奋语音的手段。首先,有多种原因可能导致基音升高,如惊讶、疑问等。其次,体育比赛中语音受到自动增益控制和背景噪声的影响,其能量和能量分布很难准确估计。有鉴于此,我们使用高斯混合模型(GMM)来描述兴奋语音和普通语音。GMM可以更为准确地刻画兴奋语音和普通语音条件下的特征的联合概率分布,进而有效提高模型的稳健性。

一个D-维矢量x的GMM分布定义为:

这里N(x|μ,∑)表示均值为μ,协方差矩阵为∑的高斯分布。K表示GMM中高斯分量的个数,ωk是第k个高斯分布的权重。我们用λ表示GMM中的所有参数。给定一个训练向量集,GMM参数的最大似然估计可以由EM算法[7]得到。

1.2用MAP更新GMM

我们用λe,λn分别表示兴奋语音和普通语音对应的GMM模型参数。λe,λn的初始模型可以从标注好的训练数据中训练得到。系统运行时的测试数据是与训练数据有差别的,属于训练集外数据。我们希望λe,λn能匹配测试中的音频环境。然而,在高度变化的体育比赛中,初始模型一般很难满足这种条件。

为了补偿训练和测试中的失配,我们利用最大后验(MAP)方法更新λe,λn。由于在测试中,兴奋语音和普通语音的准确划分无法得到,我们使用根据初始模型进行初分类得到的假定的兴奋语音和普通语音更新初始模型。

高斯混合模型的MAP估计可以用式(3)、式(4)求出[8]。在本文的具体应用中,我们只更新GMM中各个高斯分量的均值和协方差矩阵,保持权重不变。

在这里,T为训练数据的帧数,P(k|xt)表示第k个高斯分量的后验概率。α1,α2是用于控制更新的程度的经验参数。

1.3 兴奋解说检测

假设我们已经利用手工标注的数据训练出兴奋语音和普通语音的初始GMM模型。这两个模型描述了兴奋语音和普通语音的平均统计特性,提供了检测中的先验知识。兴奋语音的检测过程可以用图2表示。

由于兴奋语音的特性主要体现在浊音区域,所以无论是在训练还是在测试中,我们仅取语音浊音段数据进行处理。输入的音频流首先经过VAD(Voice Activity Detection)滤除非浊音部分。接着,从得到的浊音段提取特征并缓存。

经过特征提取,无监督的模型更新开始。首先使用λe和λn初始模型计算各个浊音段的对数似然比得分,利用得分将浊音段分为3类:

A)和兴奋语音很接近的浊音段(得分很高的浊音段);

B)和普通语音很接近的浊音段(得分很低的浊音段);

C)其它浊音段。

接着,我们利用类A和B中的浊音段对应的特征,根据式(3)和式(4)分别更新λe和λn,得到更新后的模型λe*和λn*。

最后,我们利用更新后的模型再次计算各个浊音段的似然比得分,提取出得分最高的片段。经过合并,输出兴奋语音段。

1.4 利用兴奋解说进行精彩片断提取

从得到的中间层关键字出发,准确地推断出高层事件目前依然是一个有待解决的问题。在本文中,我们使用一种简单的后处理方法,根据兴奋解说直接提取精彩片断。文献[5,6]介绍了本文方法在更复杂的体育视频精彩片断检测系统中的应用。

具体来说,我们根据得到的每个兴奋语音片段的对数似然比得分和持续时间,利用式(5)进行打分。

式中,llr是对数似然比得分,τ是该片断的持续长度。通过调整参数β,我们可以选择偏向短时间但兴奋度高的语音(增大β)或者偏向长时间但兴奋程度一般的语音(减小β)。最后,得分最高的前N个片断被选出,经过合并后作为兴奋片断的候选。

2 实验

我们进行了两个实验来分别测试算法用于兴奋解说检测和精彩片断提取的有效性。在实验中,我们选用19维特征,其中包括14维MFCC特征,4维的基音特征(基音、一阶差分、二阶差分、置信度)以及一维能量。其中MFCC特征能够有效地描述语音的能量分布,基音和能量则是兴奋语音的重要特征。

初始的兴奋语音模型由手工标注的8个半场足球比赛中的兴奋语音训练得到。初始的普通语音模型由广播数据(Hub4-NE)[9]训练得出。每个GMM模型含有128个高斯分量。

2.1 兴奋解说检测实验

我们从训练集外,随机选取了6个半场足球比赛来测试兴奋解说检测的准确度。在每个半场中,系统自动选取15或20个兴奋语音片段。经过人工检验,正确检出的片段为62(15候选)和87(120候选),正确率为68.9%和72.5%。具体的结果如表1所示。兴奋解说的判别由几个实验者共同决定。

对于表1中较差的结果(如第一个半场比赛),经过进一步的检验,这一性能的下降主要是背景噪声过强和解说鼻音过重造成的。考虑到测试数据是随机抽取的,其中的解说者、解说风格、比赛类型以及激烈程度各不相同,本文算法取得了较为令人满意的性能。

2.2 精彩片段提取实验

为了测试精彩片段提取系统的整体性能,我们从训练集外,随机选取了13个半场球赛,共包含23个进球。为了评价的一致性和测试方便,我们仅使用是否包含进球作为精彩片段识别正确的标志,并统计召回率。值得注意的是,这种评价方式忽略了除进球外的其它重要事件,因而得出的只是系统性能的保守估计。实验的结果如表2所示。在实验中,我们从每个半场中提取出的候选精彩片段数固定为5和10,结果表明在10候选的情况下,87%的进球被成功召回。

我们还测试了无监督自适应对系统性能造成的影响,结果列入表2。经过无监督自适应后,对5候选和10候选的情况,召回率分别提高9.5%和4.4%。

摘要:提出一种通过兴奋解说检测进行体育比赛精彩片断提取的方法。该方法包括训练和检测两个阶段:在训练中,基于训练数据对兴奋语音和普通语音分别建立高斯混合模型GMM(Gaussian Mixture Model),构成初始的分类器;在集外检测中,首先使用最大后验方法MAP(Maximum A Posteriori),基于测试数据对初始模型进行无监督自适应,进而利用更新后模型构成分类器识别体育解说的兴奋部分,经进一步处理得到精彩片断。将该方法用于足球比赛视频,实验表明,该方法能够召回87%的进球。引入无监督自适应有效地减少了由干训练数据与测试数据失配造成的性能下降,提高了兴奋解说检测和精彩片段提取的性能。

关键词:体育比赛精彩片断提取,无监督自适应,高斯混合模型

参考文献

[1]Xiong Z,Radhakrishnan R,Divakaran A,Huang T S.Effective and effi- cient sports highlights extraction using the minimum description length criterion in selecting GMM structures.ICME Conference,2004.

[2]Bui Y,Gupta A,Acero A.Automatically extracting highlights for TV baseball programs.ACM Multimedia Conference,2000:105-115.

[3]Coldefy F,Bouthemy P.Unsupervised soccer video abstraction based on pitch,dominant color and camera motion analysis.ACM Multimedia ??Conferenco,2004.

[4]Tjondronegoro D,Chen Y P,Pham B.Sports video summarization using highlights and play-breaks.Proc.of the 5th ACM SIGMM international workshop on Multimedia information retrieval,2003.

[5]Wang T,Li J,Diao Q,Hu W,Zhang Y.Semantic event detection using conditional random fields.International Workshop on Semantic Learn- ing Applications in Multimedia,2006.

[6]Li J,Wang T,Hu W,Sun M,Zhang Y.Soccer highlight detection using two-dependence bayesian network.ICME Conference,2006.

[7]Dempster A P,Laird N M,Rubin D.Maximum-likelihood from incom- plete data via the EM algorithm.Journal of the Royal Statistical Socie- ty,Series B,39,1977.

[8]Gauvain J L,Lee C H.Maximum a posteriori estimation for multivariate Gaussian mixture observations of Markov chains.IEEE Trans.Speech Audio Proc.,1994,4(2):291-298.

[9]http://www.ldc.upenn.edu/catalog/catalogentry.jsp?catalogId=LDC 98S73.

精彩的器乐比赛 篇2

学生在演奏中学习和感受音乐,既培养了其音乐表现能力,又提高了审美能力。自新课程开展以来,笔者一直致力于乐器进课堂的教学研究。在教学中,笔者发现,器乐入门教学如果课程没有设计好,教学没有组织好,学生会很快出现两极分化现象,能力差的学生会对器乐学习失去兴趣,甚至成为教学中的阻力。如何在器乐入门教学中让所有学生始终保持学习兴趣,让器乐学习成为学生提高音乐素养的台阶,这对课堂器乐教学来说是个大难题。因此,器乐入门教学是学生对学习乐器的关键期。笔者根据近几年的教学积累,注重提高学生对各类器乐曲的欣赏辨析能力,积极尝试让器乐进课堂,鼓励学生学会器乐演奏,让学生在吹拉弹奏中听、辨、赏,仿、演、创,逐步提升音乐素养,收到了一定的效果。

一、引导器乐欣赏,强化学生的音乐理解力

所谓音乐理解力,就是指个体对一段乐曲的感受和理解,以及由此生发的联想和想象等各种体验能力。作为音乐的基本表现形式,器乐演奏对于表现作品主题、激发情感共鸣有着重要作用,无论是铿锵激昂的打击乐器,还是悠远深长的管弦演奏,会给听者不同的音乐体验,产生不一样的审美效果。教师应借助器乐欣赏这一主要途径,通过形式多样的欣赏活动,培养学生的音乐理解力。

如在教学《鸭子拌嘴》这首中国民间打击乐曲时,我先让学生们说说自己认识的打击乐器,然后让大家听听这首曲子里有哪些打击乐器。同学们很快确定有钹、木鱼、锣等。然后,我逐个介绍这首乐曲中艺术家手中使用的乐器:小钹、水钹、圪塔钹、大锣、木鱼、云锣,通过对乐器外形、音色、作用的了解,大大激发了学生器乐欣赏的自觉意识,也让同学们在兴趣盎然中对中国民间打击乐曲有了初步认识。为加深对这首打击乐曲的理解,我把这首乐曲分为三段,请同学们分段欣赏,并发挥自己的想象,创编“同名故事”。第一部分:清晨,一群小鸭子摇摇摆摆出去散步,在池塘里快乐地游戏……第二部分:不好,它们怎么能为一点小事吵架呢?第三部分:大家认识错误,和好如初。如何用自己的方式记住它、表达它呢?第一部分,我采用了体态律动的形式,让学生们演一演小鸭子摇摇摆摆散步的情景。第二部分,我把全班分成两大组,控制拍手强弱,来表达吵架的过程,学生们模仿艺术家们的节奏和强弱,居然将吵架过程表现得惟妙惟肖。第三部分,我采用歌词创编形式,“别生气呀别生气,给你吃呀给你吃!真好吃呀真好吃,谢谢你呀谢谢你!……”一节课下来,既训练了学生的节奏感,又训练了学生对器乐音色的辨别力和想象力,在他们心中播下了器乐欣赏的种子。

二、开展器乐训练,提升学生的音乐表现力

音乐教学中,教师引导学生开展器乐训练,是培养学生音乐表现力的重要手段,也是开发学生智力、提升学生综合素养的重要形式。我常常将器乐教学有意无意地融入其他形式的教学训练中。如在音乐欣赏中,引导学生弄清楚乐曲的结构后,通过拍手、拍腿、敲击桌面等为乐曲伴奏;在唱歌教学中,编写、简化伴奏谱,请学生用自己熟悉的乐器为演唱者伴奏,引导学生相互配合。

三年级学生刚接触学习竖笛,为了激发学生的演奏热情,我每多教一个音,都会编一两个和这个音相关的小曲子,请同学们和我合奏,使学生们体验学习的成就感。在期末音乐测评中,我加入了器乐演奏考查,并且划分了两个等级,一是演奏《五月星》《小蜜蜂》等音乐教材中的曲目,通过的给予“达标”评价;二是选择自己喜欢的课外曲目,一经通过将给予“优秀”评价,并建议班主任将其评为“班级演奏之星”记入素质报告书。考核时,有半数以上的学生选择了后者。在学生演奏的过程中,我适时和大家交流,对学生的演奏情况进行评价,引导学生能根据歌曲的情绪控制吹奏的速度和力度,进一步提高了学生们的音乐表现力。

三、参与器乐创作,激发学生的音乐创造力

音乐是一门抽象的艺术,其独特的多元性,为学生提供了广阔的想象和艺术再创作的空间。特别是器乐演奏,具有较强的冲击力和感染力,容易调动学生参与的热情,激发创作冲动。在教学中,我借助器乐教学,大胆尝试培养学生的音乐创造力,通过开展形式多样的实践活动,有意识地引导学生进行音乐创作。

如在三年级的竖笛教学中,每教完一个音,我都会请同学们自己随意创编四个小结以上的乐句,吹一吹,比一比谁的欢快,谁的抒情,谁的悲伤。渐渐地,学生们也掌握了一些小小的规律,如短促、跳跃的音更能够表现欢快的情绪,低沉、悠长的音更能表现悲伤的情绪……有了一定的积累后,我尝试让学生自己将学过的喜欢的歌曲改编后用竖笛吹奏出来,说一说、比一比谁的创作更独特,更有新意。开展器乐演奏探究实践活动,我鼓励学生借助现有的条件,哪怕是把桌子、盆子作为“器乐”,创新演奏的组合形式,进行“翻版”演奏等,在一次次的实践中收获这样或那样的惊喜。

四、组织器乐演奏,增强学生的协调合作力

新课标指出,音乐教学不单要培养学生对音乐的兴趣,陶冶学生的道德情操,提升学生的音乐素养,还应在音乐实践中积极锻炼和增强学生团结、协作的意识,培养学生参与、合作的精神。这需要教师积极创设实践情境,调动学生的参与意识,做好角色定位,明确自己在群体中的地位和作用,积极发挥自己应有的作用。

开学初,经过了解,我所教的五年级班级中,有三分之一以上的学生在校外学过乐器,虽然有相当一部分没有长期坚持下来。于是,我和学生们设下一个一学期之约,用自己学过的、熟悉的、擅长的乐器和同学们合作一首C大调的乐曲,如《剪羊毛》《茉莉花》等,同学们积极响应,弹古筝、拉二胡、吹竖笛、吹萨克斯、敲铃鼓、摇沙锤……在第一次的尝试中,各种乐器一哄而起,杂乱无章。于是,我引导同学们分析问题出在哪里,该如何解决。经过讨论,大家知道了乐队演奏绝不能“各敲各的锣,各打各的鼓”,需要相互协调,步调一致,才能奏出和谐的乐章。于是,我对学生们进行分组,如民族乐器组、西洋乐器组、打击乐器组等,并在演奏中进行分工合作,自觉做到减少干扰;并对演奏的乐曲进行处理,让学生尝试编写合奏谱;推选和培养乐队指挥。经过一段时间的训练,同学们都有了很大进步。

上一篇:美食类节目下一篇:艺术摄影