词媒体

2024-05-14

词媒体(精选7篇)

词媒体 篇1

摘要:语言畅通交流是人类发展和社会进步基本要求。而如今媒体使用外文缩略词却引发争议甚至受到政府部门的干预。本文围绕央视屏蔽英文缩略词的做法及引发的争议进行阐述, 并就其他学者对此事的观点, 给出自己粗浅的看法。

关键词:语言,英语,缩略词,评论

今年上半年, 媒体上出现这么一条消息:央视接到有关部门的通知, 要求在今后的转播中尽量屏蔽外文缩略词, 而使用赛事的中文全称 (4月6日《今日早报》) 。简单说, 就是大家所熟悉的“NBA”、“F1”、“GDP”等缩略词通通要换成“美国男子篮球职业联赛”、“一级方程式赛车锦标赛”、“国内生产总值”……消息传来, 社会各界反应强烈, 但总体上持反对意见, 有专家学者认为这是“文化洁癖”, 甚至喊出了“先取消‘CCTV’再说”。就此, 笔者谈谈自己粗浅的看法。

首先, 我们来先了解下什么是缩略词, 它究竟有什么用处。缩略词是指人们出于求省求便的心理所造成的一种词的简略形式, 它是较长较复杂的词语的经济化了的再现, 主要包括中文缩略词和英文缩略词。中文缩略词中, 如“政协” (中国人民政治协商会议) 、“人大” (中华人民共和国全国人民代表大会) 都是大家非常熟悉的, 缩略规则也比较简单, 这里不再赘述。英文缩略词, 主要包括两种:缩短词和首字母缩略词。缩短词指的是把一个词或词组中的部分字母删掉而构成的新词

那么, 央视为什么要屏蔽英文缩略词呢?有观点认为“不是所有观众都懂‘NBA’”。就是说很多观众并不了解英文缩略词的具体含义。不可否认, 不同受众的文化层次、爱好兴趣和专业背景不同, 他们中的一部分人无法认知或准确理解某些首字母缩略词的确切含义。如“CBA”这个词就有多达七个以上的含义 (国际航空货物订舱单、溴化氢活化、中国篮球协会、中国生物学文献数据库、劳资协议条款、成本效益分析、商业经纪人协会等) , 若受众没有相关方面的背景知识或不结合实际的语境, 是无法准确把握其含义的。但是, 从上面的例子中也可以折射出另一方面的意义:当观众都是某一行业、某一领域的人员时, 使用其相关领域的专有英文缩略词, 他们是不是能够准确地理解, 甚至更好地进行沟通呢?如中央五台的电视观众基本上都是体育爱好者, 对常用的英文缩略词“NBA”、“CBA”、“F1”等体育领域特有的专有名词非常熟悉, 很大程度上他们是能够准确把握这些词的具体含义的。这是因为接触时间较长、使用频率高, 这些词语在一定程度上在他们的圈子里, 能够方便交流传递信息。在他们看来, 这些英文缩略词, 远比“美国男子篮球职业联赛”、“中国篮球协会”、“一级方程式赛车锦标赛”亲切得多。

还有观点认为, 使用英文缩略词影响了汉语的“纯洁性”。这倒是有一定的道理。近年来, 英文缩略词的引入确实改变了人们使用语言的习惯。例如, 在计算机领域, 很多人熟悉了CPU、ADSL、BIOS这些常用的词汇。虽然大部分人甚至不知道其确切含义, 但他们能够用这些词进行交流:因为在他们的脑海里有了共同的模糊概念, 已经有了“约定俗成”。从语言的发展规律来看, 英文缩略词的引进和使用, 是符合语言学规律的。语言作为人类最重要的交流工具, 是思维的工具, 首要任务就是达到便捷、准确地进行交流。汉语是一种开放的包容的语言, 它是为人们更好地传递信息、交流思想服务的, 从汉语对佛教语言和其他语言的吸收就可以看出这一点。英文缩略词作为汉语言中词汇使用的一种现象, 已经是一种既合法又合理的使用习惯, 它的作用是有目共睹的。CCTV之所以这么多年来一直使用英文缩略词, 原因不外乎两个, 一是方便主持人准确快捷地传递信息, 以“NBA”为例, 三个音节总比“美国男子篮球职业联赛”十个音节要方便很多;另外, 和一位体育爱好者谈“NBA”一般是不会引起误解的, 这也就体现了交流的准确性。

要说英文缩略词给部分人员带来了误解或歧义, 那只能说明这是语言发展的不平衡性的一种表现, 因为造成这种不便很有可能是那“部分人员”首次接触这些文字, 需要一个学习的过程;或者说这些缩略词还不够“流行”, “上镜率”太低。对于这种现象, 相关媒体完全可以通过采用新闻小知识等形式向大众普及, 而不是一味地打压、“屏蔽”。

笔者反而认为有关部门的通知有违语言发展规律之嫌。语言发展的另一个规律是渐变性。斯大林指出:“语言从旧质过渡到新质不是经过爆发, 不是经过消灭现存在语言和创造新的语言, 而是经过新质的要素的逐渐积累, 也就是经过旧质要素的逐渐死亡来实现的。”英文缩略词的使用是因为国人接触到一些新事物, 一些新概念, 需要了解相关信息而使用的便捷词汇, 是随着人民生活水平提高满足物质文化需要的一种体现, 它的过程也是缓慢的, 是渐变的。有关部门的通知是试图在电视传播领域进行“消灭现存在语言”, 是语言的“爆发”, 是不符合语言规律的。

总而言之, 笔者认为媒体屏蔽外文缩略词的做法欠妥。语言发展会引入新事物, 不要因为它是新事物不能被所有人接受就将其摒弃。我们应该抱有宽容的态度去包容它、接受它, 让它在社会进步、人类发展中发挥应有的作用。

参考文献

[1]杜英秋:《英语缩略词浅析》, 《电大理工》, 2006年, 第2期:42-43。

[2]肖楠、肖文:《英语首字母缩略词的构词特点》, 《北京林业大学学报》 (社会科学版) , 2008年第7卷第3期:67-72。

词媒体 篇2

尊敬的XXX、XXX:

大家下午好!

为适应高速发展的网络信息化时代,提高舆情危机应对与处置的自觉性和主动性。维护社会舆论和网络环境的和谐稳定,进一步提高学院新闻信息写作质量,建设一支高水平的信息员伍。我院特举办媒体及网络舆情应对讲座暨新闻写作培训班。

今天,我们特别邀请到XXX同志在百忙之中为我们授课。首先请允许我代表XXXX单位,对XXX同志莅临我院指导表示衷心的感谢,让我们以热烈的掌声欢迎XXX同志!

参加此次讲座活动的有:XXX、XXX、XXX、XXX、XXX、XXX、XXX

XXX同志基本情况介绍

今天的讲座培训分为两个议程:

一、媒体及网络舆情应对讲座;

二、新闻写作培训。

下面进行第一项议程媒体及网络舆情应对讲座,※ ※ ※ ※ ※ ※ 下面进行第二项议程新闻写作培训。

※ ※ ※ ※ ※ ※ 感谢XXX同志给我们作了内容丰富、生动精彩的讲座,系统地讲解了当前媒体及网络舆论总体态势、网络舆情易发领域及热点成因、网络舆情工作中存在的问题、应对和处置突发网络舆情策略等等,为我们明确了目标、理清了思路、找到了方法。XXX同志的讲座深入浅出、旁征博引,融学术性、实用性、指导性于一体,具有较强的可操作性,符合我院的实际,使我们受益匪浅。

希望大家不断学习,深刻领会。切实做好舆情应对工作,加强互联网舆情的汇总分析,进一步提高科学应对舆情的能力;同时,要充分发挥新闻宣传工作、宣传政策、报道典型、引导舆论、促进发展的功能。紧紧围绕XXX创“XXXX”的奋斗目标,积极宣传XX建设和各项事业发展的新思路、新举措、新成果、新经验,唱响主旋律,为XX改革、发展、稳定营造良好的社会环境和舆论氛围。

词媒体 记录时代声音 篇3

“犀利哥”、“裸婚”、“炒蒜团”、“楼歪歪”、“独二代”、“高富帅”、“舌尖上的XX”……或许你已经发现,回忆近两年发生的社会热点事件,留在人们脑海中的已经不再是一个个长句子似的新闻标题,而是只有寥寥数字的词语。

随着应接不暇的网络热词在互联网上涌现,这些热词也鲜明地表现出共同点:有着非凡创造力的网民对热点新闻事件或社会现象进行包装、提炼和总结,最终浓缩成一个个形象生动、脍炙人口的网络锐词。也就是说,一个本来难以扩大影响的社会信息,由于被人提炼出具有强烈讽刺性乃至黑色幽默意味的隐喻词语,从而产生了“陌生化”的情景修辞效果,吸引了广泛关注和分享。

事实上,互联网自初级的远程数据交换网络演变到公共交流平台起,就开始出现和发展起自己特有的交流语汇与方式——网络语言。产生网络语言的一个重要原因是技术性的,即为了文字输入的快捷方便,所以在各种语言的网络中,都可以看到简化的字母和词语组合代替规范的单词和句型。而中文输入的复杂性更造就了错别字化的表达,由起初的输入错误变成快乐的联想化语言,这一特点在“杯具”、“洗具”之类时下流行的网络热词中展现无遗。而从快捷的输入法到网络词典的使用,则使得这种词语狂欢升级到了更新版本,把几近消逝的大量生僻字又复活改造成了网络特有的词语娱乐内容。

网络热词来源于新闻事件或一类社会现象,通过形象生动的词恰当鲜明地总结后,让人们更深刻地记住关键信息。但近年来在中国互联网上流行的热词,已不仅仅是一般意义上的新潮网络语言。“打酱油”、“俯卧撑”、“很黄很暴力”、“被XX”乃至“你妈妈喊你回家吃饭”之类的热词,从词语本身找不到任何流行的理由,而且这些词语往往不是逐渐扩散式的流行,而是瞬间的爆发。显然,这类热词并非像以往许多网络语言那样因语言本身的娱乐性导致了流行,大多是因突发的社会事件传播而派生的焦点词语,而且这类热词几乎无一例外具有较多的讽刺和批判性意味。

凝练精准的词语表达,加之互联网的广泛传播,令不少热词在海量的信息时代一击即中,它们的流行也就变得顺理成章。不仅如此,这些网络词汇的“热效应”已经传递到大众的日常生活中。

“词语正在帮助我们记住这个时代。”互联网热词时代的到来,必然会带来新的传播载体、传播途径和传播终端,来满足公众快速了解社会,获取有价值信息的需求,一种以词作为核心传播内容的全新媒体形态——“词媒体”由此出现。其利用“词”具有的对特定时间、地点、人物、事件进行超浓缩、利于口口相传的特性优势,最大限度地加快了媒体信息的传播和记忆速度。无怪乎有专家称,“高度浓缩的网络流行语,是网友间的接头暗号,甚至成为网络传播的犀利武器,这代表着草根智慧的词媒体时代正在到来。”

回溯历史,词媒体传播最典型的例子堪称1972年6月17日发生的“水门事件”。“水门事件”是美国历史上最不光彩的政治丑闻之一,对美国本国历史以及整个新闻界都有着长远影响。“水门事件”之后,每当国家领导人遭遇执政危机或执政丑闻,便通常会被国际新闻界冠之以“门”(gate)的名称。几十年过去了,如今关于“门”的热词也早已从政治事件扩展到社会的多个层面,例如网络上曾热炒的“肯德基秒杀门”、“惠普质量门”等等。

词媒体热潮的出现,与当前社会信息过载、信息爆炸不无关系。随着互联网时代的到来,当前社会的信息量已经达到空前水平。据统计,一个人所掌握的知识半衰期在18世纪为80年左右,19~20世纪为30年,现在已经缩短到不足3年。换句话说,近30年来,人类生产的信息已超过过去5000年信息生产的总和。

《简明牛津英语词典》的作者之一安格斯·史蒂文森就曾表示:“越来越看不懂每天的日报了”。因为根据牛津的惯例,一个新词一定要五年内在各类主流传媒至少被使用5次才能被编入牛津字典。比如,单词“Internet”早在1992年出现,但直到1997~1998年才为主流媒体普遍使用,因而才被收录。而随着互联网的蓬勃发展,越来越多的网民开始成为新词的创造者和传播者,牛津字典的编写速度已经远远跟不上新词更新的速度。

作为网络时代的必然产物,当互联网传播越来越趋向碎片化的同时,词媒体这种微阅读方式的优势就凸显出来:对单一事件超强的总结性,对相同性质事件的统一概括性,以及对公众记忆和公众情绪超强的调动性,它就像是一个又一个接头暗号,每个掌握词媒体真正含义的人,都会对其指向和寓意心照不宣。而这些热词、锐词的频繁闪现,迅速普及到广播、电视、报刊、杂志、图书等传统领域,由此各种平面与网络媒体被冠之以“词媒体”。

专家指出,在信息繁杂且速朽的互联网世界,词媒体时代的到来解决了生活中的垃圾信息污染问题——将海量信息中最精华、最值得受众汲取的知识和资讯,更加简明地呈现,让人们能够在有限的时间里尽可能获得更广、更多的资讯,或帮助他们更全面地了解所处的社会现实和动态,或帮助他们在瞬息万变的环境中做出准确判断和决定,或帮助他们更容易在交流中找到共同话题……

因此有人评价,词媒体是继翻翻时代、标题时代之后的微文化时代的产物。从某种意义上说,将词作为传递信息载体的词媒体其实是一种中文本义——古汉语的回归与复古。接力出版社副总编辑、语词收藏人黄集伟甚至认为:“信息到一定程度以后,会自动压缩,建议把词媒体改成词媒。”

“你不懂词,在互联网里没法活。”著名学者、北京大学中文系教授张颐武则一针见血地指出,“新词出现的频率太高了,你会发现每个人无法掌控,最新锐的人也不知道怎么回事。过去只有报纸或者权威传播工具才能造词,在互联网上的传播却是自下而上,只要你创造出好玩的,互联网上自然会有很多人会帮你传播,这个词会一下子传得很快。”

nlc202309020434

“蚁族”一词正是其中的典型代表。“蚁族”并不是一种昆虫族群,而是“大学毕业生低收入聚居群体”,指的是毕业后无法找到工作或工作收入很低而聚居在城乡结合部的大学生。他们是有如蚂蚁般的“弱小强者”,也是鲜为人知的庞大群体。

在“蚁族”一词的背后,反映的是众多“80后”最深切的无奈。而这也意味着,网友无需直白地发表意见和看法,只需要一个简单的网络词汇来代替,公众就可以明白发言网友对事件所持的态度,从而“曲线”表达内心的想法。而类似的热词,还有“车奴、房奴、孩奴(为了车子、房子、孩子奔波劳苦的人)”等等。

从某种程度来说,网络热词的发源地正是民意代表阵地。因为每一个网络热词的背后,都有一个个鲜活的事件,网民的高度参与使一个个事件在互联网上迅速放大,备受世人关注,以至于有些词语已经成为热点事件传播过程中的标志性符号。正如在论坛、微博等平台上热议的“被就业”、“躲猫猫”、“欺实马”等,无不融入了网友的智慧和想象。其中,“欺实马”其实是互动百科的网友杜撰出来的新物种,以此表示对于杭州2009年5月7日晚杭州富家子弟驾驶跑车撞死浙大学生事件的不满,该词讽刺了杭州交警召开新闻发布会时将肇事车辆车速认定为70码,央视、南方周末等媒体在事件报道中纷纷引用了“欺实马”一词。

与此同时,随着大量热词的流行,热词的输出方和传播方——以互动百科、百度百科、天涯社区、新浪微博等为代表的网站,也在有意无意间成为词媒体的平台。以互动百科为例,凭借近年来的积淀,网友把从其他新闻、社区网站看到的热词或现象进行归纳、总结和提炼,形成一个个热点词汇,其他网友看到后再进行二次甚至多次传播,令互动百科成为词的集散地;同时如“欺实马”一样带有个性特色的网友原创词条,则开始令互动百科逐渐成为词的发源地。

如今的年轻人正在经历从读图时代到读词时代的转变,而伴随着词时代的到来,如何应对这一潮流,实现年轻化、与读者互动,成为摆在传统媒体面前的新课题。近一两年来,杂志、报纸、广播、电视等不少媒体相继开辟热词栏目,如《南都周刊》的“新词”、《新周刊》的“锐词”,新媒体中的中国移动手机报开辟“IN词”栏目等等,这些媒体正尝试通过引用来自网友创造和编辑的热词锐词报道、解读社会热点事件,勾勒网络民意的清晰走向。而这些热词锐词,大多来自互动百科“词媒体”的免费输出内容。

“互动百科将自己定位为‘词媒体’,并把最能代表互动百科的内容传递给传统媒体,来帮助传统媒体更加理解互联网现在新的网络语言,也帮助传统媒体拉近与读者的距离。”互动百科副总裁吴彦鹏如是解释二者之间的合作。而这一理念也得到了众多传统媒体的支持,据悉,互动百科已经与国内近500家媒体联手成立“知识媒体联盟”,免费向联盟内的伙伴提供由互动百科网友创建的网络热词。

对于传统媒体而言,热词栏目无疑扩展了媒体的报道形态。“就像生活于传统的人不能抗拒高科技一样,最好的方式自然是为我所用,用新词来扩展媒体的报道形态。”《南都周刊》副主编林斌如是说。在他看来,“一个杂志的新锐不仅表现在立场和选题,其实也表现在杂志形态和传播形态的探讨,这种合作形式是被读者认可的,新词栏目起到了非常有效的作用。”

在热词风靡的社会环境下,以词媒体平台为核心的“知识媒体联盟”的成立,表明传统媒体与互联网媒体产生了真正的互动和价值整合。词媒体这一互联网时代全新的流行媒体形态,正在成为伴随互联网成长起来的一代人的阅读习惯,而这或将引发媒体形式和内容的更深层次变革。

“词媒体”在舆论监督中的作用 篇4

如此庞大的用户群不断制造着“词媒体”,也就是说,每个网络热词的背后都是舆情的浓缩,而舆情的出现则是公众运用舆论监督权的结果。因此,研究“词媒体”的意义不仅仅是丰富了汉语言的词汇,更重要的是让政府能够掌握舆情,及时做出判断,有利于引导舆论,符合习近平总书记提出的“坚持正确方向创新方法手段,提高新闻舆论传播力引导力”的要求。

1 什么是“词媒体”

“词媒体”有别于报纸、杂志、广播、电视以及户外媒体等传统媒体,它是随着网络媒体出现而诞生的以文字信息的传递为载体的新兴媒介。“词媒体”在各类教科书中并未有显著定义,最早出现在2010年的互动百科上,被定义为以词作为核心传播内容,对特定时间、地点、人物、事件进行提炼,用最简洁的方式进行信息最大限度的传播。

从语言文字的角度来看,“词媒体”是语言文字对舆情的简洁表达,被创造出来的“热词”由网民提炼,不需要通过权威语言文字机构认证就可以在网络上发布出来。“词媒体”可以看作是古汉语的回归,用极简的词语描述新闻事件的特征,并起到指代作用。公众在接受这些词汇后,对同一性质的事件或现象都会用相同结构的词汇来形容,周而复始,为舆情的传播推波助澜。

笔者发现,“词媒体”中的热词大多在10字以下,言简意赅,易于记忆,是强烈的新闻背景下对整个新闻事件的浓缩,更是对具有相同性质的事件的统一概括。由于热词的来源是广大网民,所以每个“词媒体”中所包含的热词背后有着极大的群众基础,对受众情绪具有很强的调动性。

其实,“词媒体”自古已有,世界各国也都有类似的情况。以“水门事件”为例,1972年6月17日,美国发生“水门事件”,自此之后,每当国家领导人身上出现执政危机或丑闻,几乎所有媒体都会对这些事件用“门”(gate)来概括,如“伊朗门”“拉链门”“虐囚门”等。但用“门”进行概括传播事件能够追溯到我国古代,明代《永乐大典》中就有“句法门”“丽人门”等。如今,“门”已经从政治事件扩展到社会的多个层面,如“故宫门”“章子怡诈捐门”等。

2“词媒体”改变网络舆论监督的生态

与传统舆论监督相比,网络舆论监督是网民依靠互联网对国家机关及其工作人员、社会公众人物、公共事件进行监督,广泛、充分地交流和发表自己的看法、观点和意见,从而引起社会公众和社会管理层面重视的一种舆论监督形式。网络舆论监督已经成为社会监督体系中一个不可或缺的组成部分,它将现代科技文明与政治的开放需求相结合,从而为公众的知情权、参与权、表达权和监督权的实现提供了一个广泛的平台。

在此背景下,当社会上某个标志性事件发生,其核心词瞬间被网民概括、提炼成热词,通过微博、微信等更快捷的方式首先以独立于事件的形式广泛传播,将“词媒体”的作用发挥到最大化。“表哥”“房姐”“郭美美事件”“艳照门”等这一个个热词代表的“词媒体”使我国舆论监督的主体结构发生了转变,公众由新闻媒介的背后逐渐走向了幕前,舆论监督中公民地位相对于传统媒体时代在慢慢变得透明化和直接化。

“词媒体”的出现也改变着舆论监督主体的结构,正在成为实时民意调查系统。在我国未进入网络时代前,舆论监督依靠新闻媒介。但舆论监督的主体不应以新闻媒介的发挥作用作为唯一衡量的标准,也不应由公众表达的自由程度来成为决定舆论监督主体资格的绝对因素。舆论监督应当是新闻舆论监督(监督形式为公开报道和新闻批评)与非新闻舆论监督(监督形式为公众舆论)的有机结合。“词媒体”的出现,使公众能够直接或间接参与社会事务,广泛地表达社情民意,并促使公众主动去维护公共利益,弥补了依靠电话、信件等沟通方式进行传统舆论监督的短板,使公民进行舆论监督的表达更加直接化、透明化。

3“词媒体”舆论监督的积极效应

“词媒体”以迅猛之势席卷舆论场,反映出公众对于自身舆论监督权意识的逐渐清晰,也从一个侧面反映出公众对渴望成为舆论监督主体的一部分的诉求。

3.1“词媒体”有效实现了公民对媒体的“使用与满足”

盛行于20世纪20年代至40年代的“枪弹论”或“皮下注射论”对媒体发展影响深远,直到现在还有部分新闻管理者、从业者认为大众传媒有着不可抗拒的巨大力量,受众被动的接受信息,就像射击场的靶子,无法抗拒子弹的射击。但“词媒体”的出现使“枪弹论”强有力地被推翻。如“俯卧撑”“躲猫猫”“打酱油”“蜗居”“被就业”“表哥”等词语的出现,表明中国网络社会的信息传播具有较高的公众参与性和交互性,所谓的“微博反腐”也是网民对媒体的“使用与满足”模式应用的有力阐述。

3.2 有利于缓解受众情绪

“词媒体”本质是民众争取话语权的一种体现,即使现实不易改变,但也要说出来。在一定范围内允许“词媒体”的出现能对民众的不满情绪起到缓解作用。此外,这种公众参与社会公共事务的意识应当鼓励,正确引导可以激发公众对社会事务的参与热情,树立他们的监督意识,促进民众政治素养的提高。

3.3 有利于发展协商民主,促进问题解决

党的十八大以来,习近平总书记从不同角度对社会主义民主政治建设做出了重要论述,做出了“协商民主是我国社会主义民主政治的特有形式和独特优势,是党的群众路线在政治领域的重要体现”等新论断。

协商民主是一种共同参与公共决策和公共治理的民主形式,其“实质是要实现和推进公民有序的政治参与……民众用合理、合法的形式表达自己的利益需求、解决利益矛盾,在此基础上才能共同构建出一个和谐的社会”。以“表哥”“房叔”还是“房姐”等“词媒体”为例,每个词语掀起的舆论最终都引起政府重视,并得出有效率令大众满意的结果,这正是“公民有序的政治参与”的开始。通过“词媒体”的快速传播和深刻影响,不仅能引发社会思考,也推动了政府加快解决相关问题的步伐。

4 密切注意“词媒体”的消极表现

诞生于网络的“词媒体”自带着网络的弊端,每次传播的信息也并不是都经过理性思考的。在关注“词媒体”发展的过程中,需要密切关注它的弊端,加以管理,进行导向引领,防止传播性质和方向出现偏颇。

4.1 避免舆论势力的审判权

每个“词媒体”诞生后,都会在网络中成几何倍数传播,如果被随意运用或“误用”,就会使舆论监督权力在网民舆论监督的过程中演变成舆论势力,从而使得舆论监督的性质发生消极的转变。

如2015年清明节,“少林寺僧人劝捐100元”这一假新闻在网上流传后引起网友热议,纷纷指责该行为,并对河南进行地域性攻击,对少林寺以及河南形象造成极大损害。4月8日,经过核实,少林寺官方网站发声明称并无此事。

因此,网络中一些没经过核实的事件传播开后,很容易被不明所以的网民大肆围观并用有负面意义的“词媒体”去传播,迅速组成强大的舆论势力,有的甚至直接无视司法用舆论得出最终结论甚至做出审判,如“药家鑫案”中,将当事人药家鑫用“富二代”热词加以标注。这种情形应当避免。

4.2 过分强调平民化,有失客观公正

由于网络背后的平民数量庞大,又可以借助互联网平台自由表达意见,因此平民大众的价值和理想总会被推崇,同时平民的需求、情绪或愿望等总会被首先当作考虑或者判断问题的前提或归宿。于是,此时“词媒体”中一旦出现跟平民价值或理想稍有不同的热词,无论真伪都会在“瞬间”被推于舆论的风口浪尖,如果不加以分辨,而是一味推波助澜,势必会造成信息传播的肤浅化倾向,也给事件当事人造成强大的舆论压力。电影《搜索》就将这种情况展现得淋漓尽致。

4.3 过于泛滥使用会扭曲主流价值观

“词媒体”的使用频率如今越来越频繁,涵盖范围越来越大,自由度也越来越高。据统计,现在每分钟有1个新词产生,每天有1 400个新词产生。尽管“词媒体”丰富了我们的语言,但无序泛滥的使用也令人感到乏味,甚至冲击着我们传统的价值观。比如“哥、姐、叔”本是一种亲人间的称谓,但现在网络出现这些字眼就充满调侃和蔑视,造成汉语表达的粗鄙化现象,有可能引发一系列社会问题。

5 结论

“词媒体”在传播学和舆论监督方面具有一定的现实意义和价值。它适应碎片化阅读方式,带来了高涨的舆论监督热情,使得公众在舆论监督中发挥的作用更加直接和清晰。研究它,正是为了更清醒地认识它,我们在肯定“词媒体”传播对信息传播、舆论监督带来有益作用的同时,也要充分重视它自身的种种弊端。尤其是媒体应当按照习近平总书记所说的“高举旗帜、引领导向,围绕中心、服务大局,团结人民、鼓舞士气,成风化人、凝心聚力,澄清谬误、明辨是非,联接中外、沟通世界”48字方针,树立严格的把关理念,规范“词媒体”的使用,使其在舆论监督和协商民主建设中发挥正能量的作用。

参考文献

[1]张挺,魏晖.互联网环境下语言文字舆情监测与实证研究[J].语言文字应用,2011(2):6-12.

[2]张淑华.网络民意与公共决策:权利和权力的对话[M].上海:复旦大学出版社,2010.

[3]刘家林,黄利飞.探析词媒体传播[J].新闻知识,2011(3):18-20.

词媒体 篇5

关键词:Grice合作原则;网络热词;会话分析

丹尼斯·麦奎尔曾归纳:“媒介使用起源于一定的社会或精神情境——问题无处不在,而媒介被用于解决问题(满足需求),诸如收集信息、社会接触、娱乐、社会性学习与发展等”。媒介文化变成我们当代日常生活的仪式和景观,也是我们所面临的现实文化情境。在社交媒体时代,对于微信聊天或朋友圈评论、QQ、微博等情境下会话“不合作”现象,笔者从会话分析及深层的符号解构来阐释。

1 Grace合作原则概述

美国著名语言学家格瑞斯(Grice)1967年在哈佛大学的演讲中提出会话“合作原则”,并在1975年的著作《逻辑与会话》中指出,“我们的交谈通常不是由一串不相关的话语组成的,否则就会不合情理。它们常常是合作举动,至少在某种程度上,参与者都在某种程度上承认其中有一个或一组共同目标,至少有一个彼此都接受的方向。”这种相互配合的意愿促使交际各方遵守合作原则,即数量准则,质量准则,关系准则,方式准则。

“合作原则”的四条准则描述了一个有序合理的会话过程。然而实际交际中,人们总是“有意无意”地违反合作原则。格莱斯概括了违反合作原则的四种情况,一是交际者悄悄违反第一条准则,二是交际者公开宣称不遵守合作原则,三是交际者无法遵守某条准则,因为会和其他的准则产生抵触,四是交际者故意违反某一准则,并知道听话者能体会出说话人的“别有用心”,从而透过文字表面的不合作,得出话语所隐藏的深层含义。其中,违反合作原则的第四种情况是格莱斯最关心的,也是日常交际的会话中最常见的。

2 社交媒体时代的网络热词会话分析

在新媒体时代,基于微信、微博、QQ等为网络热词传播搭建了平台。根据CNNIC报告,截至2015年12月,中国网民规模达6.88亿,手机网民规模达6.20亿。2016《新媒体蓝皮书》指出,截至2015年底,微信及WeChat合并,月活跃用户数达6.97亿。可见总体社交媒体使用数量之庞大,活跃度之高,极大地促进了网络热词传播。网络热词是由网民创造的,在网络上广泛传播和使用的热门词汇,反映出一个时事热点、一种社会现象、甚至一种时代特征,所表达的意义已远远超出词语本身的字面含义,可称为“词媒体”。

近几年的网络热词如2016上半年热词“猴赛雷、友谊的小船说翻就翻、宝宝心里苦但宝宝不说、我开始方(慌)了”等。2015年度则涌现了各行各业热词排行榜,由教育部和国家语委发布的中国语言生活状况报告(2016)统计了2015年度十大新词语、十大流行语、十大网络用语等,如“你们城里人真会玩、吓死宝宝了、我的内心几乎是崩溃的、主要看气质”等。新浪微博大数据统计列出《2014年在微博中出镜率最高的20个流行词》譬如——“萌萌哒、有钱就是任性、也是蛮拼的、安静地做个美男子、那么问题来了、我读书少你可别骗我”等。本文采用网络虚拟田野调查法,选取身边大学生常用的社交媒体,摘录几个有代表性的语料文本进行具体分析。

2.1 违反数量准则(The Maxim of Quantity)

数量原则要求。所说的话应包含当前交谈目的所需要的信息;所说的话不应包含超出需要的信息。要求说话人提供充足又不过多的信息,提供正好满足听者期望的信息量。如某同学M在QQ空间发了一条说说“号被盗了”,其友开始各种神回复,现摘取M和A的会话分析。

M:号被盗了,实在不好意思。

A:尼煤,借完钱就说号被盗了?

M:别说,私聊。

A:私聊什么,赶紧还钱,昨天刚给你打3700,现就不认了?

M:昨天是骗人转账,你还给我打钱。

A:是啊,要我建行卡号,你说你没建行卡,说同学欠你钱,要打到建行卡上。然后打完我没收到,说网络有延迟;然后你又说你急用钱,让我马上转你农行卡上我就转了3700,你特么不会不认了吧。

M:撒比,我说的是交通银行,一看你也是专业骗子。

说话人M表示号被盗了,这样意味着盗号者可能通过他的QQ发送一些诈骗消息。而回复者A故意“拟造”了一个情境,违反了“所说的话不应包含多于需要的信息”,说M借完钱就不认账了……M则套路性诙谐的回复“别说,私聊”,可是A不配合,故意继续复制了一大段网络上流行套路的评论出来,故意违反数量原则,同时不表达对朋友的同情,反而“趁火打劫”的、情感倾向异化的回复。然而M也机智地识别了A的谎言。两人的一席对话营造了无奈又滑稽的效果,用到小众化的网络口头禅“撒比”“泥煤”等。

2.2 违反质量准则(The Maxim of Quality)

质量原则要求:不要说那些你相信是虚假的话,不要说那些证据不足的话;违反质量准则表现为用反语、夸张等修辞或者极端的表述。

例如,学生M在2015年终于结束,2016的元旦发了一条消息吐槽,然后M的众多好友回复开始了,比较多的不是正面表达对他的关心祝福,而是给予反面的恶搞。这里M的朋友们故意引用热词说的是证据不足的违反质量原则的话,只为求一种审丑心理、戏谑效果。

M:2015是一部不幸进化为刘海狗的血泪史(附一张憔悴上课讲PPT照)。

A:王叫兽。

M:求不黑。

B:我能说我当年一直暗自感叹着帅,有男人味的你,真真是越长越残了吗?

M:只能说明当年您瞎,现在眼光正常了。

2.3 违反关系准则

关系准则要求:要有关联,即话题要切题,对话的双/多方不能你说东我说西。

关联准则后来发展为语用学中的关联理论(Relevance Theory):每一个明示交际行为都传递一种假定,该行为木身具有最佳关联也就是说,说话者有同样的认知,达到默契。违反关系准则有时候会造成一种顾左右而言他的印象,需透过字面意思来理解另一层面的含义。

L:“爱不是法庭,任何一句话都得记录在案,好用来定罪。爱是善意疏忽。”

A:发这种说说是你的风格么?二逼装文艺(配抠鼻表情)

B:说的就好像你有女朋友似的

C:戇(gàng)

某单身狗L在微信朋友圈发一条文艺格言:会话中L发了一条爱情箴言后,得到的回复不是关于爱情哲学的思考和探讨,而是跑题好远说话很“跳”,回复都是好朋友之间的骂、损、揭露、恶搞。一个当代青年的生活有多欢乐或者苦逼,都可通过社交媒体会话略知。

2.4 违反方式准则

方式准则要求:要清楚明白,话语简练,避免晦涩,避免歧义,井井有条。它与以上三个准则的区别在于:数量、质量、关联准则规范了说什么,而方式准则规范了“怎么说”,即清楚明白地表达内容,避免晦涩歧义,要简练而有条理。

2012年刷爆荧屏的《甄嬛传》剧火起来的“甄嬛体”会话,就是繁复绕口表达婉转如下:

L:“算算日子已经进了五月,原想着这个月流量慢慢用,到时有个什么急事本宫也好省些电话费,奈何才这几日流量就已经用光,这叫本宫如何对内务府再开口要流量阿。”

A:“说人话!”

L:“手机流量超了,没钱交网费了”

这段中L的一段话看晕了不少人。方式准则要求考虑情境,面对不同的会话对象使用合适的文体进行表达。

3 符号解构下的社交媒体网络热词会话

一种新媒介就是一种新维度和新路径,这构成了当前媒介文化研究的基础。在微信、微博等社交媒体的个性的、自由表达情境下,会话消息、语言符号“能指”刷屏的情况下,不同主体间互动的“所指”、意义表达的沟通有其价值性。符号互动,意义解构。

3.1 词媒体传播的媒介功能

网络热词作为大众化的“词媒体”,尽显其媒介功能。从拉斯韦尔提出传播的“三功能说”:环境监视、社会协调、社会遗产传承功能,到1984年沃森和希尔《传播学和媒介研究词典》提出的传播八项功能之表达功能、社会联系功能、减轻忧虑功能、刺激功能、明确角色功能。词媒体会话不仅促进交流,加强朋友间的联系,还对社会潮流监测,减轻周围世界无知的忧虑。

3.2 亚文化属性下的网络热词

网络热词中有一些来自“二次元”世界,源自日本ACG(动画Animation、漫画Comic、电子游戏Game的缩写)文化,在一定程度上反映了消费主义、解构主义,强调个体、个性解构、重建世界的后现代性。萌萌哒、本宝宝、小鲜肉、傲娇、萌妹纸等个体描述热词,也反映网络用户群紧跟80后、90后、00后等所代表的亚文化属性演替。从80后非主流——闷骚性格及追求形(非主流、小清新、小资、森林系),到90后二次元ACG促脑洞系——AB站弹幕视频、垂直兴趣社区、个性华表达(小时代、bilibili、lovelive!)充满了萌化、娘化、无厘头、吐槽、内涵等元素,再到00后“小学生”存在系——好爱,感觉不会再累了,吐槽真诚直接。

3.3 身份认同或异化的热词会话

通过双向互动的热词评论会话,个体可在网络热词“虚拟共同体”中实现身份认同。正如彭兰教授所言,“网络信息消费的社会化的结果是,人们实际上越来越没有个性,而个性化,不过是在加速人们信息消费的社会化,最终便是在加速人们的趋同过程”。网络流行语、弹幕、表情符号“emoji”等符号消遣,表达并刺激着个体的某种感性体验,是社交媒体好友在互动中建构的意义特质所在。

然而作为传播者的个体,在会话中一句或一段故意攻击对方的话和“别黑我”的回复,则在某种程度上呈现情感表达的异化。随着现代生活节奏不断加快,这种自我贬低甚至故意互相对立、打破和谐的异化狂欢需要找到正常的释放途径;个体在传播某些恶意的流行语之前要学会“把关”,提高媒介素养,理性对待词媒体。

参考文献:

[1]阿瑟·A.伯格.媒介批评经典译丛:写给传媒、传播、文化研究专业学生的课堂游戏[M].清华大学出版社,2011.

[2]H.P.Grice . Logic and Conversation[M] . In.P.Cole.

[3]词媒体[DB/OL] . http://www.baike.com/wiki/词媒体.

[4]新媒体蓝皮书:中国新媒体发展报告No.7(2016)[DB/OL] . http://tt.cssn.cn/zk/zk_zkbg/201606/t20160624_3083727.shtml,2016-06-24.

[5]何道宽,蒋原伦.“生命在于运动,意义成于互动”——关于新媒介文化及思想路径的对话[J].文艺研究,2013(10).

[6]彭兰.个性化与社会化:web2.0时代信息消费的双重旋律[J].国际新闻界,2008(3).

词媒体 篇6

出现这种情况有以下几个方面的原因。

一是一期新闻节目内容的构成,主要由值班的责任编辑负责。在规定播出时间长度内,稿件内容的搭配、单条内容的长度、整体条数的多少以及提要与串词,基本上靠其把控。由于受不确定的因素影响,如一期稿件的组成时间是否充裕?责任编辑的业务水准是否较高?记者的稿件修改程度如何等。很容易出现“重内容构成,轻串词推敲”的现象,在时间紧张的情况下,随意把分量重的稿件标题择出来充当串词,忽略了新闻节目版块的整体性。

二是稿件的来源充足与否决定着一期新闻栏目的构成,同样决定着这期新闻内容之间是不是存在着逻辑关系。在稿件数量不足的情况下,容易出现有什么上什么,有多少上多少的现象,从而使串词产生的难度加大。

三是主持人没有切实起到新闻的“导播”作用。其自身在备稿时,只注意熟悉稿件的具体内容,而完全忽略串词的存在。除了直播外,往往是在进入播出间录音像的间隙,才对串词做简单的浏览,或者是在录完全部内容后才对串词进行补录,自己来不及也没有思考对串词的即兴发挥,更不考虑稿件内容之间的相互关系,而不对串词进行再加工。从而“照本宣科”,有什么播出什么。

四是对串词在新闻节目中的地位认识不到位,工作中没有把其放到一定的重视高度,“可轻可重,可有可无,可多可少”,是一种普遍象。如有的串词有时竟是一条新闻导语的全文摘抄,而不做一点修饰加工;有的是为写串词而写串词,随意择取一条新闻的标题,不考虑其在整个新闻栏目中应起的作用,以至串词失去功效。

五是对串词写作的要求行不成持之以恒制度,在宏观上没有一个统一的规矩,长久以来,无章可循。各自随心所欲编排,发现问题抓一抓,紧一紧。事情过后,一如既往,该怎样还怎样。

找出问题,是为了解决问题。要想使串词真正起到“一线串珠”的作用,除了根据实际情况有针对性地对存在的问题进行相应的处理外,关键的一点还是要切实解决对其作用的认识问题。

首先,要明白它在新闻节目中起着重要的衔接与桥梁作用。如果我们把一组新闻节目中的每条新闻分割开来看,条与条之间除了在新闻性上是一致的外,别的可以说是各自成章,互不相关。如何使这些“单个”的新闻内容形成一个有机的结合体?对观众产生强烈的视觉冲击?这是宣传中需要解决的一个实际问题。实践说明,发挥串词的特殊功能,让其承担起桥梁作用,对各条新闻之间进行衔接过渡,行之有效。除此之外,没有更有效的、操作性强的、方便快捷的办法。

其次,电视新闻的不可重复性,决定了受众对新闻内容了解的深度不够。尤其是在报道中,经常涉及一些政策法规等内容,对此,运用串词灵活地进行短词、短句式点评,重复解释,进一步阐明立场观点,明确是非,正确引导观众,能起到四两拨千斤的作用。所以,串词要在电视新闻主持人的口中,成为有力的宣传工具。那种播出几条新闻后主持人露一下脸,有时甚至用提前录好的画面,说几句天天不变的“老掉牙”套话的做法,已经不能满足观众的需要。他们需要的是把串词恰如其分地融入到不同新闻之间,“说”的形式,需要的是主持人的即兴有感而发。只有这样,电视新闻才能更进一步体现出独特的魅力。

再次,是要解决好串词的写作方式方法。从一定程度上看,电视新闻的串词是为新闻而生并为其而存在的。因为,没有新闻内容串词就没有存在的意义。但如果用一分为二的观点来看,事物既然存在,那它就有一定的生存法则和应遵循的内在规律。也就是说串词的写作有一定的规律可循,有一定的技巧可以掌握。纵观现实,常用的有效果的有以下几种。

1)用关联词串联,达到承上启下的目的。一期新闻节目的内容由多个不同侧面的新闻事实构成,这些事实中上一条与下一条或是上一条与下几条中,往往存在着类同性,也就是具有共性。将具有共性的新闻之间,找出一个关联的词或句,形成主题串词,把它们“一线串珠”联起来。如在五一节期间,我们的一期新闻节目内容中有这样的三条内容,《县委、县政府领导看望五一间坚守岗位的一线职工》《教师xxx放弃五一结婚,深入山区小学体验生活》《旅游景点节日气氛浓》,这三条新闻之间用“五一”这个主题词来联接,既间洁又明了。这就要求组稿时责任编辑要有意识地创造这方面的条件,将同类型的内容依轻、重、缓、急放在一起,同时考虑出相关成熟的串词,整理成文字通顺、面上整洁的文字稿,给主持人的即兴发挥提供便利的条件。对个别的没有共性的新闻内容,可以用串词对之进行点评,可以说出自己的观点看法,也可以谈一点自己的独特感受,三言两语,点到为止,不要长篇大论,喧宾夺主。

2)用语气词串联,达到感染观众的效果。由于一期新闻的内容不确定性,自然会造成串词的多样化,什么样的内容用什么样的串联词,才能达到感染观众的效果?这是摆在稿件组织者和主持人面前的一道难题。要想破解,行之有效的办法之一,就是切实地熟悉稿件,理出稿件与稿件之间的逻辑关系,针对不同内容的稿件,使用带有不同感情色彩的语气词做为串词。这类的词语很多,表达范畴也广,如吧、吗、呢、哟、啊等,在串词中用的恰到好处,可以无形中缩短与观众的距离,制造出一种亲和力的氛围,带给观众一种产生感染力的环境。如上面几条稿件的内容比较严肃,那么,下面的串词就要为观众着想,用“看一组别的消息吧,它会带给你好心情”,或者是“下面告诉大家几个好消息”之类都可以。总之,在串词中多用语气词,可以改变原来枯燥无味的、距人与门外的、一成不变的串联模式,能使严肃的内容变得轻松起来,达到寓教于乐的目的。

3)用渐进式词语串联,达到指引路径的作用。一期新闻节目内容很多,在提要中不可能一下子全部说到,对于没有看到提要的观众来说,指引路径的作用就十分重要,因为这是能不能引起他对下一条新闻兴趣与否的关键,左右着他做出看与否的决定的前奏。而渐进式的串词就是将上下两条新闻内容之间存在的逻辑联系找出来,看两者之间是不是近邻,也就是看它们之间是不是存在着渐近关系,并以这种关系为切入点,用串词把下一条新闻有要素推出来。如我们上条新闻是“古稀老人忙致富”,下条是“工人趣味运动会”,这两条新闻看似两码事。其实,二者之间存在着一定的逻辑关系,可以这样分析:“人在日常生活中,如果没好体魄,好心态,即使活到古稀之年,也没有精力去忙致富。而“工人趣味运动会”就给我们提供了一个放飞心情,愉悦精神的好机会”,这样,就轻而易举地将两条看似不相干的内容联起来了。应该注意的是很多时候,上下条新闻之间是不是存在着一定的逻辑关系,仅从表面是不好看出来的。有时即使有关系,也不是简单的一层关系,而是经过层层传导才能过渡到后一条的内容上。遇到这种存在多重关系的情况时,就需要多层次分析,才能写出得体的串词。如我们的稿子中有这样两条新闻,上一条是“当地的菜价涨居高不下”,下一条是“促进残疾人灵活就业”串词就应写成“菜价有涨有落,本是常事。那我们就得多赚些钱来应对。作为残疾人也不例外,不少人灵活就业,收入不少。”我们对这个串词梳理一下,可以看出这几句话之间包含的意思。一层是对上一条新闻的点评。“菜价有涨就有落,与我们多赚些钱应对有一定的因果关系,自然会推到下层意思上。灵活就业,收入不少,下一条新闻的要素自然导了出来。这样,串词就在无形中给观众起了“引导”观看新闻的作用。

总之,主持人新闻串词在电视新闻栏目中起着至关重要的作用,串词运用的得体与否直接影响着新闻栏目的收听收视效果,也影响着主持人与该栏目的良好形象,因而,串词在编辑过程中,一定要“一线串珠,浑然天成”。

摘要:从一定程度上看,电视新闻的串词是为新闻而生并为其而存在的。因为没有新闻内容,串词就没有存在的意义。但如果用一分为二的观点来看,事物既然存在,那它就有一定的生存法则和应遵循的内在规律。也就是说串词的写作有一定的规律可循,有一定的技巧可以掌握。

关键词:新闻,串词,规律,应用

参考文献

[1]张子让.当代新闻编辑[M].上海:复旦大学出版社,2005.

[2]冉华.电视传播与电视文化[M].武汉:武汉大学出版社,1998.

[3]郭庆光.传播学教程[M].北京:中国人民大学出版社,2011.

[4]何志武.视听评论[M].北京:北京大学出版社,2013.

词媒体 篇7

在信息技术的推动下,人类社会进入了新媒体时代,微课、慕课和翻转课堂等在线视频教育模式逐步兴起和推广,互联网上的教学视频资源呈爆炸式增长。一方面,海量视频资源为知识传播提供了便利,另一方面急剧膨胀的视频资源规模给视频资源搜索带来了困难。传统的视频资源检索方式主要依赖视频中的手工标注文本或图像内容进行检索。手工标注方式费时费力,标注信息不能完整反映视频内容,并且带有一定的主观性,因此迫切需要一种针对多媒体的检索方式以快速、准确地检索所需要的视频资源。

基于内容的跨媒体检索方式为多媒体检索提供了解决方案。视频是一种图像、语音和文字等多种模态的媒体以某种特定的规则组成的有序媒体形式[1]。不同媒体形式在底层特征上可能千差万别,而在高层语义特征上却相互联系。不同语言在表现形式上可能完全不同,但在语义上却是相通的。跨媒体分析和检索的主要目的就是发现这种隐含的语义关联。微课视频通常围绕某个知识点展开,时长在10分钟左右,主题比较明确,为检索提供了便利。本文通过词袋模型和TF-IDF技术,搭建不同媒体之间的语义桥梁,利用各种媒体存在的相关性找到用户感兴趣的不同类型的媒体对象,学习者可以根据需求通过文字描述、图像或视频片断来检索。

1 系统模型

词袋模型的思想来源于自然语言处理和检索,在自然语言理解过程中,将文档看成是由词汇构成的无序集合,根据文档中词汇的各类统计信息来完成文档分类。与文本相似,图像是由图像子块构成,图像子块是视觉意义上的词汇,可以将图像理解为由视觉词汇组成的无序集合。比如,人脸图像可理解为装有眼睛、鼻子、嘴巴和耳朵等视觉词汇的袋子[2]。

基于词袋模型的跨媒体的检索系统分为视频索引库构建和在线检索两个部分。视频索引库构建包括数据采集、特征提取、词典构建、描述向量生成等模块,系统流程如图1所示。

词袋模型用于视频检索的具体实现过程如下:

(1)多模态数据局部化。通过关键帧识别提取关键帧数据,通过音频数据分帧得到音频帧,采用网页标注抓取和文字自动识别技术获取文本信息。

(2)特征提取和描述。对视频关键帧和音频分别采用SURF算法和Mel倒谱系数提取相应的图像和音频特征。

(3)采用聚类算法生成音视频词汇和词典。采用K-Means算法对音视频特征进行聚类,并构建词汇和词典。文本信息采用分词技术形成文本词典。

(4)采用TF-IDF算法生成各模态的描述向量。针对3种模态的词汇,采用TF-IDF算法计算各词汇的重要程度,并构建3种模态下的描述向量(即词袋)。一个视频文件由3种模态的词袋来表示。

(5)跨媒体检索。通过视频文件与3个描述向量之间的关联关系构建视频索引库,比较用户查询与描述向量的相似性,向用户提供跨媒体检索服务。

2 局部化与特征提取

一个微课视频主要由文本、视频和音频3种模态的数据组成。微课视频文本包括视频所在网页上的标注文本、黑/白板或PPT上的文字以及字幕等。网页上的标注文本通过爬虫自动抓取,而黑/白板和PPT上的文字通过OCR技术识别。通过采集这些文本,然后进行分词处理,得到视频文本词汇。

从视频结构化角度分析,采用不同的粒度可以将视频分为帧、镜头、场景。同一镜头的视频帧之间存在时间和空间冗余,镜头可以用其中的关键帧来表示,因此词袋模型场景的关键帧为单位提取视觉词汇。采用帧间差法、颜色直方图或矩不变量等方法可以检测镜头的边缘,并用边界镜头、颜色特征或聚类分析等方法提取关键帧。SIFT是经典的图像特征点检测和提取算法,SIFT算法提取的图像局部特征具有很强的独特性,对图像平移、缩放、旋转和噪声都具有较强的鲁棒性,但计算复杂度较高。SURF特征提取算法是SIFT的改进算法,SURF算法采用积分图和箱式滤波器建立金字塔尺度空间,然后在尺度空间上进行特征点筛选,提高特征点检测速度,并采用Harr小波响应的和作为生成特征描述子的要素。SURF特征不仅满足尺度、平移和旋转的不变性,而且对仿射、透视和光照变化具有部分不变性[3]。本文采用SURF算法提取关键帧的图像特征向量来描述视频特征。

音频部分与视频图像处理的方式类似,可以提取音频的特征来生成音频词汇,音频特征数据包括音高、强度、共振峰、Lsp频率、Mel倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、线性预测分析(LPC)、感知线性预测系数(PLP)、功率光谱分析FFT等,其中Mel倒谱系数考虑了人耳听觉感知系统且抗噪性强而得到广泛应用[4]。Mel倒谱系数对语音进行预加重、分帧和加窗处理,通过快速傅立叶变换得到对应的频谱,并通过Mel滤波器组得到Mel频谱,进行倒谱分析后得到Mel倒谱系统MFCC,每一帧语音信号可用对应的MFCC倒谱特征向量来描述。

3 聚类与和词典构建

由特征提取算法提取到的特征描述是一个多维空间中的向量,由于各个特征向量之间都存在或大或小的差别,如果每个向量都作为一个视觉词汇,词典将变得非常庞大,因此需要将特征向量经过聚类算法进行聚类。采用的聚类方法和词典规模会对检索效果产生直接影响。较大的词汇表能够增加词典对视频文件的区别力,但牺牲了部分泛化能力,且容易受噪声的影响;较小的词汇表具有较强的泛化能力,却有可能将完全不同的视觉特征映射到同一个视觉词汇上,从而降低了词典的区别力[5]。常用构建词典的方法有向量量化、K-Means、谱聚类、高斯混合模型GMM、稀疏编码等。

K-Means聚类算法是一种简单实用的无监督聚类算法。在K-Means算法中,首先随机初始化K个样本中心,然后计算所有样本点与K个样本中心的距离值,将样本划分到距离最近的样本中心所在的类中,由于样本重新分布,重新计算样本中心后再进行样本归类,直到收敛。聚类得到的样本中心就是词汇,全体词汇的集合构成了词典。每个视频文件对应的词袋是整个词典的子集。

4 TF-IDF生成描述向量

词袋方法是将每个视频文件表示成一个向量,向量元素就是词典中的词项,元素的值通过TF-IDF计算得到。通过比较两个视频的TF-IDF向量的余弦相似度来比较两篇文章的相似度。TF-IDF方法广泛用于文本检索领域,是文本相似度较典型的度量方法。TF-IDF方法的主要思想是筛选出区别能力强的词汇,区别能力主要从两个方面衡量[6]:

(1)词频(Term Frequency,TF):如果一个词汇在一篇文章中出现的频率很高,而在其它文章中出现不多,则认为这个词汇的区别能力很强。TF表示词汇在一篇文章中出现的频率,通常用以下公式计算:

其中,表示词汇i在视频j中出现的次数,k表示视频中所有的词汇。分母表示视频中所有词汇出现的次数之和。求比是将词数进行归一化处理,防止偏向词汇数多的视频文件。

(2)逆文档频率(Inverse Document Frequency,IDF):是对词汇的普遍重要性的衡量,对于一些常用词汇,可能词汇很高,但其区别能力却较弱。IDF由以下公式计算:

某个词汇的逆文档频率是由语料库D的总文件数除以包含该词汇的文件数,再取对数得到。其中|D|表示语料库中的文件数,而分母的第一项表示包含当前词汇的文档数。

TF-IDF值是词汇i相对于文档j的区分能力,与它在文档中出现的次数成反比,与在语料库中出现的频率成反比,TF-IDF倾向于过滤掉常见的词汇,而保留特殊的有代表性的词汇。用以下公式计算:

针对3种模态的词汇,用TF-IDF算法计算相对于每个视频文件的TF-IDF值,得到3种模态的TF-IDF权重的向量:

其中,m代表三种模态,w表示各模态下的词汇,i是视频文件号,两个视频在同种模态上的相似度比较可以通过同种模态的两个描述向量的夹角余弦来计算,余弦值越大,则表示两个视频越相似[7]。

5 跨媒体检索

系统通过爬虫技术定期从指定视频网站下载并分析微课视频,预先完成对视频内容结构的分析和索引工作,并构建视频索引库,每个视频都有相应的文本、视频和音频3种描述向量。用户对视频的检索可能有两种情况:一类是提供单一模态的数据进行检索,如根据文本、图像或一段音频进行检索;另一类是同时提供多种模的数据进行混合检索。系统将用户的检索条件,也就是用户提交的文本或图像等数据像视频文件一样提取描述向量。通过与视频索引库中描述向量的相似度比较,完成检索工作。跨媒体检索的主要步骤如下:

(1)描述向量提取。对用户检索对象提取文本、图像和音频3个TF-IDF描述向量,如果检索对象只包括一种模态数据,则只生成一种描述向量。

(2)单模态检索。分别用文本、图像和音频3种单模态的描述向量进行检索,得到结果集A。

(3)跨模态检索。以结果集A中的前k个视频的描述向量为检索条件进行检索,得到结果集B,结果集B中的相似度计算为Sim(q1,Ai)*Sim(q2,Bj),Sim(q1,Ai)表示初始检索条件与结果集A中的视频相似度,而Sim(q2,Bj)表示第二次的检索条件与结果集B中的视频的相似度。

(4)检索结果融合。对结果集A和B按相似度从高到低进行排序,得到检索结果,反馈给用户。

通过单模态和跨模态的两阶段检索完成跨媒体的检索过程。例如,用户输入文本检索条件时,系统首先会从文本角度进行检索,并从第一步检索得到的视频文件中提取3种模态的描述向量,第二步从图像和音频两个角度继续进行检索,从而得到文本、图像和音频3个方面的与检索条件相似的检索结果。

6 结语

跨媒体检索是近几年研究热点,是搜索引擎未来发展的方向。本文描述了词袋技术用于微课视频跨媒体检索的实现方案,通过特征提取和聚类,形成模态词汇,采用TF-IDF生成多模态描述向量,通过描述向量的两阶段检索完成跨媒体检索过程。系统还存在很多待改进的地方。例如:特征描述对检索至关重要,可以从模仿人类图像理解的角度,在SURF特征的基础上,再结合形状、色彩、纹理等高层次的特征;教师的语音讲解可以通过语音识别转化为文本,以充实文本词汇;类似WordNet,可以预先建立文本、视频和音频词汇之间的关联关系,对实现特征层语义鸿沟的跨越有较大帮助。

参考文献

[1]HU W,XIE N,LI L,et al.A survey on visual content-based video indexing and retrieval[C].IEEE Transactions,2011,41(6);797-819.

[2]PIERRE TIRILLY,VINCENT CLAVEAU,PATRICK GROS.Language modeling for bag-of-visual-words image categorization[C].In Proceedings of the International Conference on Contentbased Image and Video Retrieval,2008:249-258.

[3]HERBERT BAY,ANDREAS ESS,TINNE TUYTELAARS,et al.SURF:speeded up robust features[J].Computer Vision and Image Understanding(CVIU),2008,110(3):346-359.

[4]华斌.基于加权MFCC的音频检索[J].计算机工程与应用,2015,51(8):200-2014.

[5]JUN YANG,YU-GANG JIANG,ALEXANDER G,et al.Evaluating bag-of-visual-words representations in scene classification[C].Proceedings of the international workshop on Workshop on multimedia information retrieval.New York:ACM,2007,197-206.

[6]黄承慧.一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J].计算机学报,2011(5):856-864.

上一篇:供电监测下一篇:接受能力