新闻单元论文

2024-10-09

新闻单元论文(通用4篇)

新闻单元论文 篇1

摘要:提出利用新闻视频中特定的视音频事件在时间上的规律性划分新闻单元的方法。检测视频中出现的特定视音频事件、搜索和匹配根据这些事件生成的数据流,通过确定对应的序列片断划分新闻单元,实验和视频新闻编目的应用表明了该方法有效。

关键词:新闻视频,新闻单元,镜头检测,主持人镜头

1 引言

对于视频信息处理的关注正从低层特征转向视频内容中高层语义,然而,寻找一种通用的视频内容分析和理解方法非常困难。对于特定领域的视频,结合相应领域中的先验知识,可以使底层特征与高层语义建立某种联系变得相对简单。新闻视频是一种非常重要和常见的视频类型,在结构和内容上都有着显明的特征,这些特征为分析新闻视频的高层语义提供了重要线索[1]。

新闻节目由多个独立的新闻单元(News Story)组成,分割新闻视频中的新闻单元是新闻视频结构化、编目检索和语义信息分析的基础。新闻视频有比较固定的结构特征,除去片头和可能出现的广告外,其主体由一系列内容相互独立、具有完整的新闻要素并可单独理解的新闻单元组成。根据这一特点和新闻单元的语义,把1个视频新闻节目划分成5层结构,如图1所示,每个新闻单元由一个或多个视频场景组成。

新闻视频的特点是视频分析的重要线索,如果能够在原始的视频数据中找到与上述特征相关联的事件,利用上述特征可分析新闻视频,可进行报道划分。

2 视音频事件检测

2.1 镜头分割

镜头是视频的基本单元。根据镜头之间连接方式的不同,可以把镜头分为切变和渐变。2个镜头间的切变是将2个镜头直接连接在一起得到的,中间未使用任何视频编辑特效。镜头切变对应前一镜头的最后一帧图像与相邻镜头的第一帧图像之间视觉内容的突然变化。对镜头切变的检测一般采用特征量的变化来衡量视觉内容的变化,将视觉上的镜头切变转化为数学量上的变化。

在新闻视频中,镜头间的连接基本采用切变,这里采用基于投影函数的检测方法,投影函数具有很低的时间复杂度,对视频中的随机噪声有很好的抑制作用[2]。该方法中选取基于投影函数的特征,采用视频帧间差向量的欧氏距离FFD作为帧间距离,通过帧间距离与一自适应阈值的比较来判定镜头切变的存在。

首先将帧间差向量的长度作为帧间距离,即

式中:DHi,j是视频中第i个帧的第j个水平投影函数,DVi,j是视频的第i帧的第j个垂直投影函数值。

判断第i与i+1帧之间是否为边界的自适应阈值T(i)按如下方式确定:在视频帧序列中取第i帧为中心的一个滑动窗口,分别找出窗口范围内最大和次大的相邻帧的帧间距离,记为Dmax和Dsec-max,取自适应阈值

式中:a为某一常数,可根据视频类型的实际情况确定。镜头按下列条件判断第i和第i+1帧是否为边界

式中:N为滑动窗口的宽度。如果是滑动窗口中的最大值,并且大于滑动窗口中第2大值的a倍,则认为第i帧和第i+1帧之间存在镜头切变。该方法使用了镜头切变在时间轴上形成的模式信息,a相当于镜头切变形成的帧间差曲线的形状参数。

2.2 主持人镜头检测

主持人镜头检测主持人镜头是新闻单元检测的最重要依据,在自动处理大量视频时,为了避免事先为不同的新闻节目指定特定的主持人模板,需要构造一个通用模板和相应的算法。一般,通用模板算法比较复杂,检测精度也相对较低,而采用专用模板则可大大降低检测算法的复杂性,提高检测精度和检测速度。本文结合通用模板和专用模板检测算法,在检测新闻视频的第一个主持人镜头时,先采用通用模板检测算法检测第一个主持人镜头,当检测到第一个主持人帧时,把该主持人帧作为专用模板,采用基于专用模板的检测算法进行匹配。

通用模板可以预先选定,提取图像特征,并将特征数据集成在系统中作为检测依据。通用模板的构造可以采用推广的广义Hough变换[3],步骤如下:任意截取标准的主持人帧灰度图像,检测图像边缘,生成边缘图像,并去除边缘图像中的噪声和短小边缘;在边缘图像中边缘曲线的采样点上提取一组参数构成R数组,作为通用模板的特征数据。

专用模板与当前被检测视频序列相关,采用彩色直方图交运算(Color Histogram Intersection,CHI)。当采用CHI算法进行相似度的比较时,画面上不同位置的区域对检测所起的作用是不同的,因此对CHI算法作如下改进:将图像划分成若干个矩形区域,根据各个区域在检测中的重要性赋予[0,1]的权重,由于主持人居于画面中间或中间附近,一般给中间区域赋予较大的权重,而对边缘区域赋予较小的权重。

式中:Sim(A,B)∈[0,1],表示相似度,A和B分别为两幅图像的彩色直方图,n为彩色直方图bin的个数,而Ai(Y,U,V)和Bi(Y,U,V)则分别是直方图中第i个bin中的像素数目,r表示区域个数,wj则是第j个区域的权重。

2.3 语音检测

在音频方面,和新闻单元检测关系密切的音频事件为静音、环境音、语音3个类型。

第一步,静音与非静音的判别。静音与非静音的特征相对明显,较容易识别。利用音频短时能量和过零率特征可以有效识别静音[4],如果短时段的短时能量和过零率低于一个事先设定的阈值,则认为该段为静音。

第二步,语音与环境音识别。首先,根据前面特征分析,过零率、短时能量和频谱流是识别语音的有效特征,以这3个特征为分量组成特征向量,构造分类器,识别语音与非语音。音频流是连续的,通常音频类型不会频繁或突然交替改变。基于这个特性,可以识别类型的短时段进行平滑处理,尽可能地消除错误识别[4]。

3 新闻单元分割

在处理事件流时有两种方案:对视音频事件分别单独处理或先把视音频事件流合并,再对合并后的混合事件流处理[5]。前者需要2个事件流进行实现同步,对2个流中的事件起止点有一定限制,本文把视频和音频事件流合并为一个混合事件流,并且约定当视频事件和音频事件开始时间相同时,视频事件出现在事件流的前面。

为了在混合事件流中保持事件的时域信息,参考文献[5]把一个新闻节目转化为视音频事件的混合流。例如,在图2中,用字母(A,B,C,D)分别表示事件(主持人,非主持人,解说,静音),用字母后面的数字(0,1,2)分别表示相邻事件的关系(包含,重叠,相邻),图2显示了一个典型的新闻单元的原始视频转换成混合事件流,字母代表事件,数字表示和相邻的事件之间的时序间隔。

在图2所示的新闻单元中,首先是主持人场景,对该新闻作了简要报道,因此,该片断包含主持人和播音事件,这2个事件在时间上是重叠的,当视频事件和音频事件在时间上重叠时,视频事件排在音频之前,图中用A2,C1表示,其中数字2表示主持人场景和其前面的事件在时间上相邻关系,数字1则表示播音事件和主持人场景是重叠关系;接着是3个现场镜头组成的一个场景和一段解说、一段静音,由于现场场景和前面的播音在时间上是相邻关系,所以把现场场景表示成B2,而后的一个解说和现场场景是包含关系,静音则和解说是相邻关系,因此它们分别是C2和D1。

生成对应的数据流以后,根据事先对新闻节目的分析,归纳新闻单元对应的模板,利用字符串匹配算法,搜索与这些模板匹配的字符片断,确定新闻单元的出点和入点。对于匹配的片断,系统记录并统计,对于多次出现的未匹配片断,系统自动加入到匹配模板中。

4 实验结果

采用上述算法,对多个新闻节目进行单元划分,这些节目分别来自2个电视台在历史节目数字化和编目中的新闻节目,并截取新闻的详细报道部分(去除片头、提要及回顾等)。

首先对节目音频事件检测和视频进行镜头划分和关键帧提取,以镜头为单位检测视频事件,合并属同一事件的相邻镜头,并记录视音频事件的起止时间,分别生成视音频事件序列;然后按第3节的方法根据事件之间的时序关系合并视音频事件序列,生成事件数据流;最后,利用匹配算法在数据流中匹配各种可能序列,从而确定对应的新闻单元。表1给出了实验的部分结果。

实验结果表明,本文的算法对新闻节目单元检测较好的效果。不仅适用同类新闻节目,也同样适合多种类型混合的新闻节目库。

对实验中的错误分析,发现引起错误的原因有2个方面:1)事件检测错误导致的数据流错误;2)新闻单元结构和新闻单元边界的多样性。前者可以通过提高事件检测精度得到改善;而后者引起的错误应该采用其他辅助方法,单一采用本文算法有一定的局限性。

5 小结

新闻单元的计算机自动划分是新闻视频结构化的重要环节,是基于内容的视频检索、视频新闻主题检测和跟踪等研究的基础。本文通过检测特定的视频和音频事件,利用新闻节目中这些视音频事件出现的规律,通过与预先设定的模式匹配来分割新闻单元。采用该方法的新闻单元的自动定位,在某电视台保存的历史新闻节目编目工作中,发挥了很好的作用。

随着视音频处理技术的发展和节目制作水平的提高,新闻节目从内容到编排方式日益丰富,如果在本文的算法基础上,配合对节目部分视频画面和语音内容的理解,将提高划分准确性和对节目变化的适应性。

参考文献

[1]ZHUANG Y T,XIAO R G,WU F.Key issues in video summa-rization and its application[C]//Proc.Pacific-Rim Conference on Multimedia.Singapore:[s.n.],2003:885-889.

[2]LING J,LIAN Y,ZHUANG Y T.A new method for shot gradual transition detection using support vector machine[C]//Proc.4th International Conference on Machine Learning and Cybernetics.Guanzhou:[s.n.],2005,9:5599-5604.

[3]马宇飞,白雪生,徐光祐,等.新闻视频中口播帧方法研究[J].软件学报,2001,12(3):377-382.

[4]LIU Z,HUANG J,WANG Y,et al.Audio feature extraction and analysis for scene classification[C]//Proc.IEEE multimedia Work-shop.[S.l.]:IEEE Press,1997:343-348.

[5]CEES G,SNOEK M,WORRING M.Multimedia event-based video indexing using time intervals[J].IEEE Trans.Multimedia,2005,7(4):636-647.

新闻单元论文 篇2

单元分析:

本单元是“博观约取”(广泛地阅读、扼要地选取)单元,学习新闻和报告文学,所选的都是这两类文体中的典范作品。共有四篇课文:《别了,不列颠尼亚》和《奥斯维辛没有什么新闻》属于短新闻(消息|新闻特写);《包身工》是一篇典范的报告文学(高中传统名篇);《飞向太空的航程》则是一篇通讯。

对应高考中比较稳定的一种题型“一句话新闻”。

一、新闻

1、含义:广义的泛指整个新闻事业;狭义的是指一种文体,包括消息、通讯、评论、特写、访问记录等。

2、特点:及时性、真实性。

3、六要素:时间、地点、人物、事件、原因、结果。5w、1h

4、结构:标题、导语、主体、背景、结语

(一)新闻特写(《短新闻两则》)

新闻特写是一种以描写为主要手法,摄取新闻事实中最富有特征和表现力的片断和场面,形象地再现新闻事件和新闻人物的报道形式。它不像通讯那样要求写新闻事件发生、发展的全过程,而只是选取全过程中最富特征的一两个片断、场景来加以刻画,将它们绘声绘色地描绘出来,报道面比通讯更为集中、更为细腻。

(二)通讯(《飞向太空的航程》)

通讯是一种采用多种表现手法详尽生动地报道新闻事物或典型人物的新闻体裁。它的特点是:

1、详细深入,过程完整

2、生动形象、具体感人

3、议论抒情并用,感情充沛

二、报告文学(《包身工》)

报告文学脱胎于新闻,又具有一定的文学性,是新闻性与文学性的高度融合。主要有三个特点:一是真实性;一是文学笔法;一是作家的主观参与性。真实性都是相对的,它并不是刻板地反映生活,在一些细节上,允许作者对所涉及的事件和人物进行合理的艺术加工,也可以充分表达自己的思想感情。学情分析:

消息:《北京喜获2008年奥运会主办权》(八上)电视新闻:《生命之舟》声画合一,语言准确生动简明(八上)人物通讯:《杂交水稻之父——袁隆平》(八上)

《寻找时传祥》(八下)报告文学:《南京大屠杀》(八下)新闻特写:《开国大典》(九上)

高一学生在初一阶段已经学习过新闻和报告文学,但只是初步了解,而且印象很浅。需要引导他们回忆,复习新闻和报告文学的文体知识,让学生能真正理解记忆并学会使用。

高一学生独立倾向很强,不满于满堂灌的死板教学,可以通过合作探究的方式,让他们自己归纳总结。注意引导。教学目标:

1、了解新闻与报告文学的相关文体知识,培养新闻速读的能力和提取信息的能力。

2、学会区分新闻事实与新闻背景、客观叙述与主观评价,在此过程中掌握分析新闻内部结构和写作特点的方法。

3、引导学生关注社会,关注时事,树立正确的新闻观和审美观。教学重点:

1、培养新闻速读的能力和提取信息的能力。(一句话新闻)

2、增强关注社会的意识和树立正确的新闻观。教学难点:

培养新闻速读的能力和提取信息的能力。

第一课时

单元总体介绍

一、结合生活,导入新课

“跟我说说,大家星期天都做了什么?除了吃饭睡觉。”(笑)“大家的生活都很„„不知道你们有没有跟我一样的感觉,我特别烦一件事儿。那就是我发现我的星期天除了吃饭睡觉看书,剩余时间全用在扣手机上了,只要一有空就看空间刷微博玩微信,在这个信息爆炸的时代,我们每天都在接触大量的信息,你愿意接收的不愿意接收的,都涌到你面前,让你没有时间看书,没有时间与人交心,甚至没有时间过真正属于自己的生活。我特别特别想回到那个没有手机没有电脑的‘飞鸽传书’的时代,用十天半个月的时间,等一封家书,等一份思念,等一个人,安安静静地,过着慢慢的日子。当然,那是不可能的。但是,我们可以降低要求,我们至少可以回到看新闻读报纸的时代,放下手机,离开电脑,坐在藤椅上,喝茶,读报,看世界。今天,就请大家跟我一起,看看报纸,学学新闻,回望一下过去的时光。”

“报纸在哪里?抱歉,我也没有。咱们课本上有。请大家把课本翻到39页前面的那一页,我们一起来学习怎样看新闻。”

二、师生互动,学习文体

“给大家五分钟时间,仔细阅读一下这一页的内容,并结合学习指导74页的相关内容,归纳总结一下,看看我们这一单元要学什么,怎么学,待会儿我们找人起来给大家讲讲。”(注意,我这儿有十个问题,也就是说至少要有十个人起来回答问题,谁要是自愿站起来回答,前面的问题比较简单,越到后面越难,没有人回答了我就提问,提问道谁不会了课代表记一下,课后来我这儿背诵十个问题和答案。所以,每个人都要认认真真地看。好了,开始吧。)

1、这一单元学什么?

2、什么是新闻?

3、什么是报告文学?

4、新闻的特点是什么?

5、新闻的六要素5W1H是什么?

6、新闻的结构是什么?

7、新闻与报告文学的不同?

8、怎样学习新闻作品?

9、怎样学习报告文学?

10、结合《别了,不列颠尼亚》,说说什么是新闻特写?(初中学过)

1、新闻特写:

新闻特写是一种以描写为主要手法,摄取新闻事实中最富有特征和表现力的片断和场面,形象地再现新闻事件和新闻人物的报道形式。

新闻特写是新闻体裁中最富表现力的,记者在现场,以眼睛为“摄像机”,以耳朵为“录音机”,简笔勾勒出清晰可视的一个个场景,一幅幅画面,“再现”新闻事件、新闻人物“一瞬间”的形象化报道,使读者如临其境,如见其人,如闻其声。

它不像通讯那样要求写新闻事件发生、发展的全过程,而只是选取全过程中最富特征的一两个片断、场景来加以刻画,将它们绘声绘色地描绘出来,报道面比通讯更为集中、更为细腻。

2、通讯

通讯是一种采用多种表现手法详尽生动地报道新闻事物或典型人物的新闻体裁。它的特点是:(1)、详细深入,过程完整(2)、生动形象、具体感人(3)、议论抒情并用,感情充沛

3、报告文学

报告文学脱胎于新闻,又具有一定的文学性,是新闻性与文学性的高度融合。主要有三个特点:一是真实性;一是文学笔法;一是作家的主观参与性。真实性都是相对的,它并不是刻板地反映生活,在一些细节上,允许作者对所涉及的事件和人物进行合理的艺术加工,也可以充分表达自己的思想感情。

三、博观约取,内容简析

“咱们这一单元呢,选取了四篇课文,都是新闻和报告文学的典范作品,《别了,“不列颠尼亚”》记录了英国撤离香港,香港回归祖国这一重大新闻事件,它选取了英国撤离香港的一系列场景,并把它们放在历史的背景中,使回归祖国这一新闻事件有了一种历史的纵深感;

《奥斯维辛没有什么新闻》则是打破客观报道的传统,直接讲述记者自己参观奥斯维辛集中营的所见所感;

《包身工》是中国报告文学史上具有划时代意义的作品。作者以铁的事实、精确的数据、精辟地分析和评论,把劳动强度最重、地位最低、待遇最差、痛苦最深的奴隶一样做工的女孩子们的遭遇公诸于众,愤怒控诉了帝国主义和买办势力的残酷剥削和掠夺中国工人的罪行;

《飞向太空的航程》选取了“神舟”五号飞船发射这一极具新闻价值的事件,并依此回顾了中国人的飞天梦,透露出自豪与骄傲之情,突出了这一事件的重要意义。“神舟”五号载人飞行的圆满成功,标志着经过一代又一代航天人的不懈努力,中国人民在攀登世界科技高峰的征程上又迈出了具有历史意义的一步,在历史和现实的对照中,凸显国人的喜悦和自豪。

四、学以致用,作业布置

新闻单元论文 篇3

关键词:多特征融合,新闻单元分割,聚类,人脸识别,串联单

近年来,视频检索、索引、浏览、表示等技术引起了学术界和工业界的广泛关注。在大多数视频应用中,需要首先根据内容将视频分割成多个独立的片段。但是由于视频内容多样化、结构复杂且数据量巨大(长度仅1分钟的视频就包含了多达15 000帧图像),因此视频自动分割的难度较大。尽管过去已经有大量学者致力于视频结构分析研究,但是目前还没有成熟的商业软件用于视频分割。大多数视频编辑工具根据固定时长将视频分割成多个片断,如“i Movie”,但是无法根据视频内容进行准确的片断分割。

由于视频内容和结构的复杂性,很难找到针对所有视频的自动化分割方法,因此当前的研究工作主要针对特殊类型的视频,如新闻、采访、体育等。一般说来,新闻视频通常由多个独立单元组成,每个新闻单元有各自的主题内容,具有“口播镜头+新闻单元”的结构,因此研究新闻单元的自动分割具有可行性。天津大学的冀中等人[1]对新闻单元分割技术作了综述,将现有方法进行了分类,分析了各类方法的特点,并指出存在的问题和今后发展的趋势。余骁捷等人[2]利用语音识别技术实现了基于语义信息的新闻故事单元划分,然而该方法依赖于语音识别结果的质量,可靠性不高。口播镜头是新闻视频的重要内容,大量研究工作提出了基于口播检测的新闻单元分割方法[3,4]。以上方法主要根据口播镜头的颜色和音频特征实现单元分割,适用于口播画面简单且变化不大的情况。然而,当前新闻节目的内容和形式多样,经常根据具体内容变换主持人的位置和背景。图1给出了同一节目中不同口播镜头画面和对应的直方图分布,可以看出同一主播的多个口播画面的差异较大。本文的研究工作正是为了实现更加鲁棒高效的新闻单元分割,以适应当前新闻节目内容、形式多样化的特点。

1 总体设计

图2给出了算法流程图,输入是一段新闻视频,经过镜头检测、基于口播镜头检测的新闻单元分割、基于串联单解析的优化等处理,输出结果是分割后的多个新闻单元。本文的主要贡献在于提出了多特征融合的新闻单元自动分割算法。

图3给出了新闻视频的层次结构图,形象地描绘了新闻单元分割的具体过程。其中第一行的色块表示所有视频帧;第二行的色块是经过镜头边界检测后的所有镜头;第三行是根据镜头相似性聚类后识别出的口播镜头,以及根据口播镜头得到的新闻单元分割结果;第四行是根据串联单解析的新闻单元分割结果;最后一行是根据串联单解析结果对基于口播检测的单元分割结果进行优化后的新闻单元分割结果。下面将具体介绍本文的新闻单元分割算法。

2 新闻单元高效分割

2.1 镜头边界检测

镜头边界检测是基于内容的视频分析与处理的重要步骤。多年来,国内外学者进行了大量研究[5,6,7],他们的方法大多根据颜色统计信息检测镜头间的突变和渐变。本文提出了基于重要性区域分析的局部直方图比较方法,实现了新闻镜头的准确检测。如图4所示,首先将视频画面平均分割成18×18的小方格,然后分别计算相邻两帧图像对应方格的直方图距离,最后统计直方图特征相似的方格数量。若相似方格的数目超过30%,则认为两帧之间没有发生镜头切换。为了减少由动态背景引起的口播镜头分割错误,对相似性较大的方格,适当增加其权重。如图4所示的例子中(背景和左下角方格分别表示变化不大和变化较大的区域),虽然主持人背后大屏幕的内容发生动态变化,但是通过分块统计相似性,能够准确地检测出主持人口播镜头。实验表明,镜头检测的准确率能够达到95%以上。

2.2 主持人口播镜头检测

得到视频的镜头边界后,需要进一步识别出其中的主持人口播镜头,进而实现新闻单元分割。然而视频中的主持人口播镜头很可能根据内容不断变化,如图1所示,此时基于直方图统计的方法很难实现主持人镜头的正确聚类。为了准确地检测出口播镜头,提出了基于直方图和人脸识别的聚类方法。首先提取出关键帧图像并检测出其中的人脸图像,然后进行基于直方图和人脸特征的关键帧聚类,最后自动定位口播镜头并得到相应的新闻单元。下面具体介绍口播镜头自动检测方法。

2.2.1 人脸检测

采用基于不变特征量的Adaboost算法[8],通过基于Haar特征的弱分类器构建出强分类器。将待检测图像进行灰度化和直方图均衡化处理,利用训练得到的分类器进行多尺度的人脸检测。

2.2.2 基于单样本的人脸识别

对于所有关键帧(k1,k2,…,kn),以其中任意一个包含人脸的关键帧ki作为训练样本,匹配其余关键帧中检测出的人脸图像。采用基于自适应加权LBP的人脸识别方法[9],通过自适应权重提升基于单样本的识别效果,大量实验表明,识别准确率达到93%以上。

2.2.3 基于局部直方图和人脸识别的口播镜头检测

采用基于局部直方图统计和人脸识别的方法实现镜头关键帧聚类。对所有关键帧图像进行两两比较,若只是直方图相似,则相似性定义为直方图距离的倒数;若只是人脸特征相似,则相似性定义为很大的正整数(实验中取100);若直方图和人脸特征均相似,则定义其相似性为正无穷大(实验中取10 000);若人脸和直方图特征均不相似,则定义其相似性为负无穷大(实验中取-10 000)。如式(1)所示

得到相似性矩阵后,采用相似性传播(AP)[10]的方法进行关键帧聚类。与其他方法相比较,AP聚类方法更加灵活有效。该算法的输入是相似性矩阵Sn×n,输出是每个关键帧对应的标签,其中聚类到一起的关键帧的标签一致,算法细节请见文献[10]。大量实验表明,主持人口播镜头在新闻中通常出现最多,包含关键帧数量最多的聚类即为口播聚类。进一步地,建立多个电视台常见主持人的人脸特征库,通过将聚类中心的人脸分别与特征库中的人脸进行匹配,能够保证主持人口播镜头检测的准确性和稳定性。

图3的第3行内容表示经过聚类后的结果。每个色块表示一个新闻单元,其中深色小块表示聚类得到的口播镜头,每个新闻单元都是以口播镜头为开始标志,直到下一个口播镜头结束。

2.3 基于串联单解析的优化

口播镜头是新闻单元自动分割的重要依据,然而很多新闻单元并不是由主持人口播开始的,连续两个口播镜头之间可能包含多个新闻单元。先前的方法通过音频识别来检测新闻单元边界,但是其准确性和稳定性不够[9]。为了准确分割没有明显界限的新闻单元,调研了浙江省、市、县多个电视台的新闻制作过程,提出了基于串联单解析的方案。如图5所示,串联单是电视台新闻节目播出的重要脚本,包含了新闻内容的详细信息,包括每个片段的时间长度和文字描述,以及转场、广告等提示信息。通过正则表达式解析能够从串联单中准确提取出每个新闻片段的入出时间点和文字内容。然而串联单中包含大量无效片断,如转场、口播提示等,此外串联单的时间点精确度不够。

具体算法如下:

其主要思想是利用串联单解析结果进一步优化基于口播镜头检测的新闻单元分割结果。主要过程为:根据主播镜头的单元分割结果对基于串联单的单元分割结果进行配准,若入出点配准成功,则首先校正基于串联单解析的新闻单元入出点,并将其中不包含口播镜头的新闻单元添加到基于口播的单元分割结果中,最终输出优化后的新闻单元。图3的3~5行表明通过利用串联单信息,本文提出的方法不但能够准确检测出新闻单元边界,而且能够区分无口播镜头的新闻单元,具有准确性和稳定性。

3 实验结果及分析

图6给出了系统的软件界面,通过简单操作,用户能够方便高效地实现新闻单元分割。在配置为Intel i5-3470 3.4 GHz,16 Gbyte RAM,NVIDIA Geforce GTX 650的PC机上,一段30 min,600×480,1 Mbit/s的新闻视频的单元分割时间为30~35 s。图7给出了两组新闻单元分割的结果,其中上面两条色带分别表示基于口播检测和串联单解析的单元分割结果。可以看出,基于串联单解析的新闻单元数量较多,且包含很多短小的片段,最后一条色带是最终的处理结果。虚线部分给出了基于口播的分割结果和最终结果的比较,并给出了多个新闻单元切换前后的画面。可以看出,本文的方法不但能够准确分割出以口播镜头的为标志的单元,而且能够准确分割出不包含口播镜头的新闻单元。

为了证明本文提出算法的有效性,与当前最新的新闻单元分割算法[3,4]进行比较,其中文献[3]采用了基于直方图和SIFT特征聚类的方法,文献[4]采用了视频、音频和字幕等多模态特征结合的方法。选取近两年央视、浙江省、杭州市、桐乡等各级电视台的多档热门新闻节目作为实验数据,分别使用文献[3,4]和本文提出方法进行新闻单元分割。表2给出了以上三种方法的查全率和查准率比较。图8给出了平均查准率和查全率比较。可以看出本文提出的方法比文献[3,4][3,4]具有明显优势,其原因在于:文献[3]的方法难以处理主持人口播画面变化较大,且对于无口播镜头的新闻单元容易造成错检和漏检;文献[4]提出方法中的静音误判、字幕误检等问题容易造成新闻单元分割的错误;本文提出的方法通过主持人的人脸检测聚类和串联单解析,能够较好地解决新闻单元错检、漏检、准确性不高等难点问题。因此本文提出的方法能够显著提高新闻单元分割的准确率和稳定性,并且能够处理内容和形式多样的新闻节目,具有很强的适应性。

4 小结

提出了多特征融合的新闻单元分割算法,通过结合基于口播检测和串联单解析两种方法的优势,显著提升了新闻单元分割的性能。在算法研究的基础上,开发了软件系统实现准确高效的新闻单元分割。研究的新闻单元分割方法能够应用于新闻快速编目、检索等,满足新媒体时代节目快速制作和发布的要求。

今后,将进一步研究高效的视频单元分割方法,应用于更多类型的视频节目,如体育、电影、综艺节目。需要面临更多具有挑战性的难题,如特征表示、关键帧选取、相似性度量等。将利用更多特征信息,如声音、字幕、运动等,实现更加高效的视频结构分析。

参考文献

[1]冀中,张春田,苏育挺.新闻视频故事单元分割技术综述[J].中国图象图形学报,2007,12(11):1952-1960.

[2]余骁捷.新闻播报节目的内容自动标注系统[D].北京:清华大学,2014.

[3]张赟.新闻视频单元高效切分方法的研究与实现[J].电视技术,2014,38(23):170-173.

[4]刘嘉琦,封化民,闫建鹏.基于多模态特征融合的新闻故事单元分割[J].计算机工程,2012,38(24):161-165.

[5]凌坚,练益群.新闻单元的自动快速分割方法[J].电视技术,2009,33(7):59-63.

[6]刘群,江伟,吴渝.采用多特征融合的镜头边界检测方法[J].计算机工程与应用,2010,46(13):171-174.

[7]LU Z M,SHI Y.Fast video shot boundary detection based on SVD and pattern matching[J].IEEE transactions on image processing,2013,22(12):5136-5145.

[8]VIOLA P A,JONES M J.Rapid object detection using a boosted cascade of simple features[C]//Proc.IEEE Conference on Computer Vision and Pattern Recognition.[S.l.]:IEEE,2001:511-518.

[9]赵汝哲,房斌,文静.自适应加权LBP的单样本人脸识别方法[J].计算机工程与应用,2012,48(31):146-149.

新闻单元论文 篇4

一、基础知识

(一)(新华社长江前线22日22时电)人民解放军百万大军,从 lqD余华里的战线上,冲破敌阵,横渡长江。西起九江(不含),东至江阴,均是人民解放军的渡江区域。

1、“新华社长江前线22日22时电”是(电头)。交代了(通讯社名称)(电

文发出的时间)(地点)。其作用是(A)。A、表明材料真实,报道及时。

B、表明所报道的事实是有根有据的。C、增强了文章的真实性。D、表明发电时间、地点。

2、本段文字是《人民解放军百万大军横渡长江》一文中的导语部分。

3、语点明新闻人物是人民解放军,其中“百万”说明了渡江人数之多、声势之浩大。导语点明的事件是 横渡长江,“横渡”写出了遇难而上,所向披靡的气势。

4、导语在新闻中的作用是概括地报道事实或中心。

5、概括人民解放军所向披靡、战绩辉煌的词语是百万大军横渡长江。(不得超过8个字)。

6、1000余华里的战线”指的是西起九江(不含),东至江阴。

7、“„„均是人民解放军的渡江区域”中的“均”,在这里表示的意思

是都,它在这里的作用是表示战线之长、胜利之大。

(二)① 20日夜起,长江北岸人民解放军中路军首先突破安庆、芜湖线,渡至繁昌、铜陵、青阳、荻港、鲁港地区,24小时内即已渡过30万人。②21日下午5时起,我西路军开始渡江,地点在九江、安庆段。③至发电时止,该路35万人民解放军已渡过三分之二,余部四日可渡完。④这一路现已占领贵池、殷家汇、东流、至德、彭泽之线的广大南岸阵地,正向南扩展中。⑤和中路军所遇故情一样,我西路军当面之敌亦纷纷溃退,毫无斗志,我军所遇之抵抗,甚为微弱。⑥此种情况,一方面由于人民解放军英勇善战,锐不可当;另一方面,这和国民党反动派拒绝签订和平协定,有很大关系。⑦国民党的广大官兵一致希望和平,不想再打了,听见南京拒绝和平,都很泄气。⑧战犯汤恩伯21日到芜湖督战,不起丝毫作用。⑨汤思伯认为南京江阴段防线是很巩固的,弱点只存在于南京九江一线。⑩不料正是汤恩伯到芜湖的那一天,东面防线又被我 军突破了。11我东路35万大军与西路同日同时发起渡江作战。12所有预定计划,都已实现。

13至发电时止,我东路各军已大部渡过南岸,余部四日可以渡完。14此处敌军抵抗较为顽强,然在ZI日下午至H日下午的整天激战中,我已歼灭及击溃一切抵抗之敌,占领扬扒镇江、江 阴诸县的广大地区,并控制江阴要塞,封锁长江。15我军前锋,业已切断镇江无锡段铁路线。

8、本段是新闻结构中的8、主体。,其结构十分严密。9、本段共15句,可分为三个层次,其划分正确的一项是:(A)

A、①/②一⑧/⑨-15B、①/②-⑦/⑧-15

C、①/②一⑤/⑥-15D、①/②-⑨/⑩-1510、在记叙三路军渡江情况时,作者并没有平均使用笔墨,而是有详有略,详写的是西路军和东路军。

11、“我军当面之敌纷纷演退,毫无斗志,抵抗也甚为微弱”的原因是:另一方面„„都很泄气;(用原文回答)主观原因人民解放军英勇善战。客观原因:。

12、本段中⑥⑦两句是议论句,对这两句理解有误的一项是:(D)

A、说明战犯汤恩伯指挥失当,懦弱无能。

B、露国民党反动政府拒绝签订和平协定的本质。

C、赞扬我人民解放军英勇无畏、所向披靡的英雄气概。

D、析了西路军当面之敌的溃退是因为力量甚为微弱。

13、本段中⑨⑩两句在结构上起的作用是承上启下。新闻一则

致富不忘求知更望知识富有

专业户王求晓夫妻双双考上大学

本报彭泽讯张金杨、记者朱晓峰报道:盛夏七月,彭泽县爆出一则新闻:龙城镇马湖村青年、水上运输专业户王求晓和爱人高晓华,同时接到中国人民大学录取通知书,夫妻双双以优异的成绩考上了该校新闻系经济新闻专业,自费攻读经济新闻理论。日前,记者来到王朱晓家采访了他们。

今年36岁的王求晓和33岁的高晓华,有 10多年的驾船历史,是远近闻名的水上运输专业户。王求晓1984年购买了两艘110吨位的机帆船,同时代管村里5艘机帆船,担任马湖村农氏船队队长。他常年驾驶机帆船,装载着各种农业生产资料和生活资料,上武汉,跑江浙,闯上海,航线遍及10多个省市,每年纯收入数万元。

王求晓劳动致富后并不满足,他有新的追求。他说:“金钱上、物质上的富有是暂时的、有限的,精神上、知识上的富有,才是真正的富有,它是金钱买不到的。”王求晓和高晓华分别于1966年初中和小学毕业,在学业上是被耽误了的一代。他们在多年的驾船生涯中,深感搞经营、办企业,仅有实践经验是不够的,必须掌握现代企业管理知识和经济理论,只有学了文化科学知识,才能更好地致富。近几年,王求晓买了许多有关专业书籍,订阅了不少报刊,夫妻刻苦自学,潜心钻研,互相帮助,进步很快。今年5月,他俩一试身手,勇敢地参加了全国高等院校抓自学考试。辛勤的汗水浇开了“并蒂莲”,王求晓夫妻双双被中国人民大学录取。7月,当他们接到录取通知书时,激动不已,喜泪盈眶。

王求晓夫妇将于9月初启程赴中国人民大学深造。他俩准备把家里的两艘机帆船承包给乡亲们管理。王求晓仍兼任马湖村农民船队名誉队长,他将在北京通过通信工具,为船队出谋献策,传递经济信息。他表示:在校努力学好本领,毕业后,回来更好地为家乡建设出力。

14.一般新闻常用的标题有多种行式:主题引题和副题。“致富不忘求知,更望知识富有”是本文的,起的作用是,“专业户王求晓夫妻双方考上大学”是本文的,交代了,包括和_。

15.指出哪一段是背景介绍,这个介绍对新闻有些什么作用?

16.第三段王求晓的话,在文章中有什么重要作用?

17.第四段是新闻的18.第四段写“王求晓仍兼任马湖农民船队名誉队长”说明了王求晓

19.文章最后写王求晓表示毕业后回家乡为家乡建设服务,表明了学习的目的是

答案

1、电头;通讯社名称;电文发出的时间;地点;A(联系新闻的特点来理解)。

2、导语。

3、人民解放军;渡江人数之多,声势之浩大;横渡长江;遇难而上,所向披靡。

4、概括地报道事实或中心。

5、百万大军横渡长江。

6、西起九江(不含),东至江阴。

7、都;表示战线之长、胜利之大。

8、主体。

9、A

10、西路军;东路军。

11、另一方面„„都很泄气;人民解放军英勇善战。

12、D(没有反映出新闻的主题)

13、承上启下。新闻一则

14、引题;点明新闻的中心,揭示新闻的背景;主题;主要事实;人;事。

15、第二段是背景介绍,简略介绍了王求晓的致富经过和富到什么程度,增强了新闻的真实性,提高了可信度。

16、这段话揭示了新闻人物的思想,也是这条新闻的主题。

17、结尾。

18、热爱自己的事业,学习、事业两不误。

上一篇:故障应急处理下一篇:教育取向