语料库文体学

2024-08-12

语料库文体学(精选5篇)

语料库文体学 篇1

尼克是海明威短篇小说集唯一一个中反复出现的角色, 是海明威笔下塑造的最重要的一个人物, 占有其他形象不可比拟的地位。尼克不仅在海明威的人物中, 而且在美国文学中都是很特别的 (约瑟夫, 1862) 。海明威短篇小说中的尼克这一形象的研究一直备受中外学者关注, 以往的研究重心主要集中在叙事模式、海明威的自传形象、准则英雄的雏形、死亡主题等方面。本文借助语料库文体学的分析方法, 描述并分析24篇短篇小说中有助于表达主题意义的语言特征, 通过这些语言特征去发现海明威笔下“硬汉”形象尼克的成长轨迹, 探索尼克的成长历程。

1 语料库文体学

近几年, 随着语料库语言学的飞速发展, 语料库文体学这门将语料库语言学与文体学相结合的新兴研究领域也有了长足的进展。赵永刚 (2011) 认为“以往的文体学研究大多基于个人阅读体验, 以阐释性为主, 因此分析结果存在一定的主观差异性;而利用语料库方法对文学文本进行量化研究, 不仅可为人工的文学阐释提供实证支持, 而且可以使分析结果变得更为客观、可靠”。[1]

用语料库语言学的方法, 有助于发现以往研究中未能发现的文本特征, 是传统文体学的一大进步。主题词是语料库语言学研究的重要范式。主题词指的是与参照语料库比较, 在一篇文本或一个语料库中高频出现的词。[2]察并分析这些主题词以及与它们的索引、搭配词等可以观察文章的主题。在语料库语言学中, 索引指的是运用索引软件在语料库中查询某词或短语的使用实例, 然后将所有符合条件的语言使用实例及其语境以清单的形式列出。[3]这一概念由英国著名语言学家Firth提出, 他认为, 搭配是词语之间的结伴关系。搭配不仅仅是词的简单并置, 它体现了词与词之间的相互期待 (mutual expectancy) 。[4]本文借助语料库语言学的上述研究范式, 描述24篇短篇小说中有助于表达主题意义的语言特征, 进而进行文本文体特征分析。

2 语料库创建及检索软件的使用

在菲利普·杨的《尼克·亚当斯故事集》中, 他把24篇以尼克为主人公的小说按照尼克的童年、青年顺序编排。因此, 可以以《尼克·亚当斯的故事集》电子文本为内容, 建立小型观察语料库。并按照菲利普·杨的对24篇短篇小说的划分, 将语料库分为5个子库, 北方森林 (The Northern Woods) 、他独自 (On His Own) 、战争 (War) 、退伍军人之家 (A Soldier Home) 、两人为伴 (Company of the Two) 。观察语料库的五个子库及基本词频信息如下表:

另外, 抽取创建于20世纪60年代初的Brown语料库中的小说部分为参照语料库。观察语料库和参照语料库的基本词频信息如下表:

本文所使用的是免费检索软件Ant Conc3.4.3。这款软件安装使用便捷, 统计信息速度快, 能够在词、词组、搭配等不同的层面上进行检索和统计。

3 主题词检索及分析

本文中只有在第五个子库两人为伴中分析尼克的婚姻, 所以保留了主题词表中的人物Helen, 在其它子库中不探讨作品中人物之间的关系, 所以将主题词表中的其他人物删除。另外, 还去掉了虚词。最后得到按照主题性排序排在前15位的各子库的主题词如下表:

3.1 北方森林

从这五个子库的主题词表可以看出, 中心人物尼克一直贯穿始终。在第一个子库中, 阅读尼克93条索引行, 较为突出的是表达尼克感受的索引行:

Nick began to be frightened

Nick lay still and tried to go to sleep

Nick had realized that some day he must die

联系这索引行的语境, 夜晚, 在森林中, 尼克感到害怕, 尼克初步认识到人性中尚存的软弱, 感到迷茫和恐惧, 这是他认识自己、认识世界的开端。而父亲鼓励尼克走出恐惧“There is nothing that can hurt you.”

尼克的父亲是一名医生, 擅长打猎、捕鱼, 经常去给印第安人看病。主题词father一词的左一搭配词频率最高的是代词his。代词his的功能在于作者以第三人称视角叙述尼克童年成长故事, 旁观尼克的童年。尼克陪父亲去看诊, 而父亲经常带尼克去钓鱼、打猎。尼克从父亲身上学到很多知识, 受父亲的影响很大, 并继承了父亲亲近自然的特点, 热爱野外活动, 富有冒险精神。

Indians、India、woods、lake这四个词排在主题词表的前列。其他主题词反映了少年尼克的生活情况和成长环境。尼克小时候生活的地方有森林, 湖泊, 印第安人。在父亲的陪伴下, 尼克克服童年的迷茫和恐惧, 在大自然中, 快乐成长。

3.2 他独自

在第二个子库中, don’t一词出现在主题词表中, 是突出的语言现象。don’t一词的右一搭配的动词, 按照频率从高到低依次如下, know/want/have/think/like/mind/need。其中don’t have搭配出现频率为11, 只有1个have表示“有”的含义, 其余10个是don’t have to搭配。don’t及其搭配词的功能在于表达不知道、不必要、不认为、不喜欢、不介意、不需要的含义和厌弃及逆反的情绪。尼克离家出走, 一个人步入社会、尼克开始思考人性与人生、感到困惑与迷茫, 因为他看到了人性的邪恶和社会对人的伤害, 感受到生命在威胁、邪恶面前无能为力。

3.3 战争

尼克走上战场, 认识到战争的残酷无情以及生命在战争面前的脆弱不堪, 深刻地体验到痛苦与死亡。在15个主题词中, 7个与战争相关的词:battalion, machine, major, uniform, medals, adjutant, machines。特别值得注意的是反映战争的冰冷与残酷的两个词machine, machines。通过Ant Conc的concordance功能, 可以得到这两个词的出现频率以及具体所指的含义。

通过上表可以看出machine与machines这两个词在文中指的是战争中所使用的武器, 以及医治战争中身体创伤的医疗器材。在战争中, 身体上创伤, 可以借助医疗器材慢慢地恢复, 但是精神上所受的创伤, 却是一道永不愈合的伤口伴其一生。

主题词表中另外一个突出的语言现象sleep一词。sleep出现频率为29, 阅读sleep一词的索引行, 可以看到在战争中尼克经常无法入睡, 或是借助酒精才能入睡, 或是表达能够她是安然入睡的希望。sleep一词表达了战争中人们极度恐惧不安。尼克在战争中也患了失眠症, 身心受到伤害, 疲惫不堪。作者借此反映战争给人们带来的创伤并否定战争的意义。

3.4 退伍军人之家

这几篇小说主要描述的是尼克从战场回来后, 心灰意冷, 对人生感到茫然, 带着战争的创伤返回家园, 失落地回到少年时代生活的密执安北部。而观察主题词表, 可以看到一个特殊的语言现象, 在15个主题词中, 与森林、河流和钓鱼有关的词就有10个:trout、water、current、stream、rod、log、swamp、line、pine、river。这说明尼克将自己置身于美丽、宁静的大自然中, 从打猎、钓鱼中寻求慰藉, 感受心灵的自由与平静, 安抚战争带来的精神创伤, 重新找回自我, 燃起对生活的美好希望, 完成了人生的重大转折。另外一个非常特殊的语言现象是, 定冠词the作为主题词出现, 而且排在第三位, 说明作者过多地使用定冠词。使用检索软件的搭配 (collocate) 功能, 可以检索到定冠词the的频率大于20的右一搭配词如下表:

定冠词the指某个或某些特定的人或物, 而the修饰的词全是尼克儿时熟悉的那片水, 那个太阳, 那条路等。作者过多地使用定冠词的含义在于, 就是在尼克的故乡密执安北部, 尼克重新找回了自我。

3.5 两人为伴

最后的五个短篇, 作者描述的是尼克的婚姻与家庭生活。主题词表中15个主题词有8个涉及滑雪、捕鱼:skis、snow、fishing、lake、skiing、hemlock、stream、woods, 这些主题词说明尼克在婚后, 仍然流连于森林、湖泊, 热衷于滑雪、捕鱼。通过检索软件, 发现在Helen的索引行中有这样两句话:

He’d been married to it (fishing) before he married Helen.Really married to it.It wasn’t any joke.

He always worked best when Helen was unwell.Just that much discontent and friction.

这两行索引足以说明尼克的婚姻并不幸福, 在尼克心中, 妻子的地位远比不上写作和钓鱼, 这是尼克人生中的一大缺憾。

4 结束语

海明威在这24篇短篇小说中断断续续地描述了尼克的成长历程。借助语料库文体学的研究范式, 可以看到海明威塑造的尼克, 并不完美, 会感到恐惧、迷茫、疲惫、失落;热爱自然、喜欢打猎、钓鱼、滑雪, 家庭生活也不是很幸福, 但是在困难和挫折不断的磨砺下, 尼克成长为一个有血有肉的硬汉。尼克在面对成长过程中的各种困难、矛盾、死亡、暴力、邪恶时, 表现出了重压之下的优雅风度, 是海明威笔下的硬汉形象的雏形。在这24篇短篇小说中, 海明威借助尼克这样的形象来表达自己对人生、对社会、对时代的不断思考。分析尼克的成长历程有助于更深刻的理解海明威笔下其他的硬汉形象, 对于我们如何面对人生中遇到的各种困境具有启发意义。

参考文献

[1]赵永刚.当代文学批评的语料库语言学方法探索[J].湖北社会科学, 2011 (4) :131-133.

[2]Scott M.Wordsmith Tools Manual[M].Oxford:Oxford Uni-versity Press, 1997:51.

[3]梁茂成.语料库应用教程[M].北京:外语教学与研究出版社, 2010.

[4]卫乃兴.搭配研究50年:概念的演变与方法的发展[J].解放军外国语学院学报, 2003 (2) :11-15.

语料库文体学 篇2

一、语料库文体学分析

1.研究方法与工具。本文收集《追风筝的人》小说文本及电影字幕,其中电影字幕从http://www.opensubtitles.org网站上下载得到。首先运用Ultra Edit对两个文本进行处理,然后再运用Word Smith 4.0及GOTagger赋码工具对两个文本进行分析解读。

2. 对小说及同名电影《追风筝的人》的具体分析。

(1)词汇。形符数(token)指文本一共有多少个词,类符(types)指文本一共有多少个不同的词形,类符/形符比(typetoken ratio,TTR)主要表明文章所用词汇的多样性和差异性,类符/形符比越大,说明文章所用词汇的种类越多,相同词汇的使用比例低。首先,从文本大小可以看出,小说文本为583797,远大于电影字幕文本的10401。再比较形符数和类符数。小说文本的形符数为108006,类符数为9072,电影字幕的形符数为1934,类符数为572,一般超过1000字以上,就会采用标准类符/形符比(standardised TTR),鉴于两个文本均为100字以上,在此采用的是标准类符/形符比,即小说文本的标准类符/形符比为44.90,电影文本为37。从标准类符/形符比这个数值可以看出,小说文本的词汇使用要比电影文本的词汇使用更加丰富多样,这也说明了小说中语言的变化较之电影语言更为多样,语言表达方式更加丰富,文学性色彩更强。

平均词长(mean word length)是指文本中词的平均长度,以字母数为单位。平均词长反映了文本用词的复杂程度。词长标准差(word length std.dev.)反映了文本中每个单词长度与文本平均词长的差异,标准差越大,说明文本中各单词词长之间的差异就越大。通过软件分析,小说文本中平均词长为4.16,电影字幕文本中为3.94,小说文本的平均词长比电影字幕文本中的平均词长要长,但两者相差不多,小说文本中词长标准差为2.09,电影字幕中为1.93,说明两个文本中使用的单词词长大致相同,相差并不多。电影台词的特点之一就是口语化程度较高,易于被受众所理解,故电影字幕文本的词长标准差比小说文本的要小,而小说文本的词长标准差与电影字幕的相差并不多则说明小说的用词也并不复杂,也很容易被受众所理解。小说《追风筝的人》自2003年出版以来就受到全世界范围内读者的喜爱,小说一经发行,立即受到了文学评论界的好评,并雄踞《纽约时报》等权威畅销书排行榜长达101周,这与其自身通俗易懂有很大关系,小说的行文使用受众更易接受的更易懂的词汇,使受众能够感同身受,更能理解体会作品中人物的感情世界。

(2)衔接。将小说文本和电影字幕文本分别用GOTagger软件进行赋码,然后分别查找出其中所用连接词的数目,其中小说文本用了3691次,而电影文本用了45次,相对于其整体的文本大小而言,即小说为583797,电影字幕为10401,小说中连接词使用的程度也要大于其在电影中的使用程度。这表明小说中的语言更加连贯流畅,小说要将故事情节描述得更加有连贯性才能使读者更好理解整个小说的结构脉络以及情节发展,电影中则画面感更为突出,更多使用画面来为故事情节做连接。

(3)句子。小说文本中共有9791个句子,平均每句中有11.03个单词,电影字幕中有381句,平均每句有5.08个单词,虽然句子的长度与句子的复杂程度并不是一回事,但就整个语料库而言,句子的长短在一定程度上反映了句子的复杂程度,电影字幕中的句子较短,因而电影中的语言较小说中语言而言更为简单容易理解,因电影中多为人物对话,故句子较简短,信息比较集中,要让受众在短时间内能够理解电影所要传达的内容信息及情感。小说中则会有许多描述性的语言,描述性语言有渲染气氛的效果,也增加了文学性,而这些描述性语言在电影中有时仅仅只会以画面的形式出现。

二、结语

基于语料库的译者文体研究 篇3

译者文体研究是文学翻译研究的重要议题。传统的文体学研究侧重于原作者的风格在译者翻译中的是如何体现的, 到20世纪90年代, 中西方已有很多学者尝试把不同的文体概念应用于翻译研究, 侧重于译者自身的风格在翻译过程中的呈现。以语料库为基础的研究方法渗透到了语言研究的各个领域, 为译者文体研究提供了有效途径。

1 基于语料库的译者文体研究

1.1 什么是译者文体

译者文体这一概念涵盖非常广泛。最初, 翻译研究中的问题研究主要是探讨原文的文体和原文作者的风格怎么体现。霍斯试图设计一种模式, 用来描写原文语言和语境的特性, 对原文与译文进行比较, 从中得出关于两者之间的对应程度的详细报告, 然后再用这些报告来评价译文的好坏。产生阶段是指人们开始从翻译策略和翻译的社会表现形式等角度观察译者的风格。Hermans提出了译者声音 (Translator’s voice) 的概念, 认为译者的声音“有时可能完全隐藏在叙述者的背后, 使读者无法觉察到他的存在” (1996:27) , 译者不断会“冲出语篇层面, 为自己说话, 用自己的名字, 譬如在译文后的注释中用第一人称解释所述之事”。 (同上) 译者文体研究的发展归功于语料库翻译学, 它使译者文体研究从感性走向理性, 从个性走向共性, 从局部走向整体, 可以用科学的方法进行验证和说明。

1.2 基于语料库的译者文体研究概述

1993年 , 英国学者Baker发表了《语料库语言学与翻译研究 :启示和应用》, 将语料库研究方法引入翻译研究, 标志着语料库翻译研究的开端。国内的语料库翻译始于杨惠中教授1993年发表的“语料库语言学与机器翻译”, 几乎与国外语料库翻译研究同时起步。基于语料库对译者文体研究要稍晚一些。从中国期刊全文数据库来看, 发表有关基于语料库研究译者文体的文章始于2002年, 截止2014年共有71篇。

Baker教授于2000年发表了《文学作品译者风格考察方法论探索》, 提出了语料库翻译学的又一重要课题———“译者风格”研究, 她以翻译英语语料库 (TEC) 为研究平台, 把语料库技术应用到译文文体研究中可以使译文的文体研究更加系统和客观, “Baker的研究为翻译文体的分析建立了一套可行的模式”。 (廖七一, 2000:382) 2004年, Olohan (153-167) 通过“个体译者的缩略词模式调查”和“应用关键词分析探究译者的词汇选择”两个个案介绍了译者文体研究的具体操作。Olohan在Baker之后利用翻译英语语料库调查具体译者风格的实证性研究进一步证实了以语料库为辅助的译者文体多维研究模式的可能性, 并且探索了基于语料库的描述性译者文体研究和从文化和社会的宏观层面出发的译者风格成因解释机制相结合的研究模式。Munday对于译者文体研究的关注点主要是译者有意识或者无意识地表现在语言层面上的“个性语言”, 并且这种“个性语言”部分来源于社会语言学研究领域内的“特定言语群体对个体产生的影响”、另外部分则来源于“译者个人的风格体系” (Munday, 2008:7-8) 。从周小玲所写的《近十年国外基于语料库的译者文体研究的发展 (2000-2009) 》中从“语言偏好和译者文体”、“翻译选材与译者文体”、“叙事结构与译者文体”和“翻译策略与译者文体”几个方面来谈论基于语料库的译者文体研究现状。

2 基于语料库的译者文体研究内容和模式

基于语料库的译者文体研究就是一种把定量统计和定性分析相结合, 从而对翻译文本的语言特征进行定量统计, 以数据为出发点, 在文学和文化层面进行定性的分析和归纳。研究者一般会从整体上根据已有的语料库观察译文的文体特征, 从语言和非语言层面进行考察, 提出假设, 随后进行量化描写、理论分析和定性解释。

对译者文体的描写通常是从历时和共时两个角度出发。译者文体的历时描写主要是研究同一个原文在不同时期的译文, 或者是同一个译者在不同时期的译文作品。译者文体的共时描写可以对同一时期内同一原著的不同译本进行比较研究, 或对同一时期不同原著的译本的语言特征进行归纳。历时描写可以看出不同时期译者文体中语言使用的变化和文化背景等因素对译者的影响, 而共时描写可以比较不同译本的差异看出同一时期不同译者的翻译策略、翻译观念等。

译者文体研究是很复杂的, 目前国内外运用语料库研究译者文体时主要有三种模式: (1) 针对同一个译者翻译不同文本时所体现出来的普遍性特征; (2) 不同译者对不同文本的翻译所体现出来的个体差异研究; (3) 不同译者对于同一文本的翻译研究所体现的译者风格研究。 (于涛, 2011:130) 译者文体的形成是译者个人素养与社会文化语境相互作用的结果, 因此对译者文体的描写既要关注译者自身的语言表达习惯, 也要关注社会文化语境对译者语言风格的形成所产生的作用。

3 结束语

近代西方翻译研究经历了从经验式研究到语言学的转向, 继而又出现了文化转向, 在20世纪90年代出现语料库语言学与翻译研究结合下的语料库翻译学。语料库与翻译的结合拓展了翻译的研究范围, 提出了新的研究思路。有了语料库的强大支持, 研究者可以对译文进行文体风格的量化研究、对译者个人所偏爱的语言表达形式进行统计分析, 从而考察译者的风格特征。但是, 要建立一套有效的界定与评价译者文体的方法, 有不少问题仍需做进一步的探讨, 并需做更大范围的调查研究。

摘要:本文从探讨译者文体的概念入手, 揭示其产生发展的不同阶段, 从而引出语料库框架下的译者文体研究模式, 介绍该框架下译者文体研究的内容和模式, 从而展示译者文体的成因。

关键词:语料库,译者文体,研究

参考文献

[1]Baker, M.Towards a Methodology for Investigating the Style of a Literary Translator[J].Target, 2000, 12 (2) :241-266.

[2]Hermans, T.The Translator’s Voice in Translated Narrative[J].Target, 1996 (8) 1:23-48.

[3]Olohan, Maeve.Introducing corpora in translation studies[M].London:Routledge, 2004.

[4]Munday, Jeremy, Introducing Translation Studies:Theories and Applications[M].London and New York:Routledge, 2001.

[5]霍跃红.典籍英译译者文体分析与文本的译者识别[D].大连理工大学, 2010.

[6]卢静.历时与共时视阈下的译者风格研究[D].上海外国语大学, 2013.

[7]刘家荣.文体学方法论[J].西南师范大学学报:人文社会科学版, 2004 (4) .

语料库文体学 篇4

审计报告是指具体承办审计事项的审计人员或审计组织在实施审计后, 就审计工作的结果向其委托人、授权人或其他法定报告对象提交的书面文件。其作用体现在鉴证、保护和证明三个方面:即审计报告对被审计单位会计报表中所反映的财务状况、经营成果和现金流量情况的合法、公允和一贯具有鉴证作用;在一定程度上对被审计单位的财产、债权人和股东的权益及企业利害关系人的利益起到保护作用;以及证明注册会计师审计责任的履行情况。

全球经济一体化趋势下, 国内越来越多的会计师事务所承接了中外合资企业的审计业务, 同时, 国内很多企业的审计工作也越来越多地由海外会计师事务所承担, 这些业务大多都会出具英文审计报告。为便于与国际接轨, 掌握英文审计报告的文体特点十分重要。为揭示审计英语的主要特点, 本文以英文审计报告为研究对象, 选取国际四大会计师事务所:普华永道、安永、德勤、毕马威等公司出具的8篇审计报告为样本, 自建35000余字的小型语料库, 从书写、词汇和语法三个角度着手, 与BROWN和LOB两个普通英语语料库进行对比研究。

一、研究方法

本文运用定量分析方法研究英文审计报告的文体特征, 自建小型英文审计报告语料库 (Auditor’s Reports Corpus, 以下简称为ARC) , 主要采用AntConc和WordSmith软件进行数据分析, 与BROWN和LOB语料库进行对比分析以归纳英文审计报告的文体特征。

1. 数据收集

鉴于许多会计师事务所将其出具的审计报告公开, 因此公众可以从事务所网站上查阅到相应的审计报告信息。本文中自建语料库来源的审计报告信息均取自互联网。自建语料库时将各会计师事务所的标识以及员工手写签名进行了处理, 英文标识和手写签名未计入库内。为便于研究, 所有审计报告均已转换为纯文本格式。

2. 语料库简介

本文将自建英文审计报告语料库 (ARC) 与BROWN和LOB语料库进行对比分析。布朗语料库 (Brown Corpus) 是世界上第一个根据系统性原则采集样本的标准语料库, 选自美国人撰写出版的普通语体的文本, 包括15种题材, 共500个样本, 其中每个样本不少于2000词, 总计约100万词。LOB语料库由英国Lancaster大学建成, 研究英国英语, 包含500语篇, 每个语篇约2000词。自建英文审计报告语料库 (ARC) 取自四大会计师事务所出具的8篇审计报告, 共计约35000词。

3. 研究工具

鉴于语料库提供了大量的语篇实证数据资源, 从而能够基于实际使用中出现的结构和形式来对相关文本进行文体分析。语料库分析方法可以从一个新的视角认识语言, 并且一定程度上可以对文本进行自动分析。运用AntConc和WordSmith等特定软件能够快速并准确地检索出相应标点符号、词语搭配以及语法结构等。本文采用AntConc和WordSmith软件以及微软word的查找替换功能对英文审计报告的文体特点进行统计分析。

二、分析与讨论

基于文体学相关理论, 本文从书写、词汇和语法三个方面分析英文审计报告的文体特征。

1. 英文审计报告的书写特征

英文审计报告采用了多种书写手段以使其结构、内容和逻辑更加明确和清晰。这些手段主要包括:版面结构、图表的运用以及标点符号的使用。

(1) 版面结构

从8篇审计报告样本可以看出, 尽管具体格式不一, 但总体而言, 其版面格式有较为统一的规定:开篇部分为总结性的审计情况阐述, 包含审计双方情况、审计目的、结果及建议等, 其末尾处附有相关部门或责任人手写签名。随后是具体审计内容、操作方法和结论等的详细介绍, 构成了整份报告的主体, 包括审计情况介绍、审计结果、审计建议及附录等。这一部分内容前附有详细目录, 并在目录的末尾附上了文中使用的所有缩写对照表。以上内容是英文审计报告在版面安排上的基本特点。此外, 在8篇英文审计报告样本中还大量采用了数字和字母对段落进行标注, 同时, 为便于读者阅读还使用了大量下划线和粗体字以突出相应内容和重点。

(2) 图表使用

英文审计报告中使用了大量图表, 尤其是表格, 这些表格大多取自被审计公司的财务报表, 同时审计报告中使用的缩略语和缩写词也常以表格的形式列出。如:

(3) 标点符号

标点符号在英文审计报告文本中起到了重要的作用。使用标点符号的目的是为了意义表达更加清晰。标点符号主要有两大功能:分隔功能 (即用来分隔相连的单位或被包容的单位) 和指明功能 (即用来指明语法、语义或语用关系) (Randolph Quirk, 1985) 。通过使用AntConc和Wordsmith软件以及微软word的查找和替换功能, 得出三个语料库中标点符号的分布和比例如下:

由表1看出, 自建ARC语料库中使用频率最高的标点符号是逗号和句号, 这一结论同样适用于LOB和BROWN语料库。连字符主要用于连接数字和单词, 在英文审计报告中的使用频率也较高。冒号与分号在英文审计报告中也时有出现。但基于统计数据发现, 英文审计报告中几乎不使用单引号、感叹号和问号。

2. 英文审计报告的词汇特征

与会计英语类似, 许多审计英语单词来源于普通英语, 但却被赋予了不同的意思。英文审计报告的词汇特征将从以下几个方面进行探讨:

(1) 词汇的丰富度

运用Wordsmith软件可以计算出类符/形符比 (type/token ratio) 来探讨语言的词汇多样性。在此, 考虑到三个语料库的容量不等, 笔者随机选取了BROWN和LOB库的一部分使得三个语料库容量接近, 进而对三者的类符/形符比进行比较。结果见表2:

由表2看出, 自建ARC语料库的类符/形符比低于LOB和BROWN语料库的类符/形符比, 也就是说, 与英美国家的书面文本如印刷品、书籍、报刊、杂志等相比, 英文审计报告中使用的词汇极为有限。

鉴于类符/形符比的高低受文本长度的影响, 为排除文本长度这一因素的干扰, 采用标准化类符/形符比来进一步对类符/形符比的比较结果进行验证。

表3中自建ARC语料库的标准化类符/形符比低于LOB和BROWN语料库的标准化类符/形符比, 这一结论进一步验证了英文审计报告中使用词汇的有限性。与普通英语书面文本相比, 英文审计报告的词汇丰富程度不高, 这是因为英文审计报告中使用的英语多为会计、审计专业英语, 是在审计这一特殊语域下使用的特定英语, 故而词汇总量极为有限。

(2) 词长

由表4看出, 与BROWN和LOB语料库相比, 自建ARC语料库的平均词长值最高, 说明在英文审计报告的选词上使用较长的单词以提高文本的正式程度并引起读者的关注。

(3) 词频

与BROWN和LOB语料库类似, 自建ARC语料库使用词频较高的有冠词、连词、介词、助词等。此外, 自建ARC语料库词频统计也有其独特的特点。审计报告作为一种特殊的文体, 其写作格式和内容有着严格的规定。运用Wordsmith对自建ARC语料库进行词频统计, 发现词频统计排名前30位的单词中出现了较多实词, 如:financial, lending, management, predatory, office, information, audit, travel等, 而BROWN与LOB词频统计居前30位的以虚词居多。

3. 英文审计报告的语法特征

英文审计报告的语法特征将从句子长度、句子特点、不同时态的转换、名词定语的使用、被动语态的使用等方面进行探讨。

(1) 句子长度

英文审计报告中长句与短句交替使用。句子越长, 其理解难度越大, 同时其语言也更正式。运用Wordsmith统计软件得出自建ARC语料库平均句长为26.73。与英语句子平均句长为17.8个单词 (Leech&Short, 2001) 相比, 英文审计报告的平均句长远高于普通英语句子的平均句长。由此说明英文审计报告相较于普通英语其理解难度更大。同时, 选取与ARC容量相近的部分BROWN和LOB语料库进行平均句长比较, BROWN为24.93, LOB为21.89。这一结果表明, 英文审计报告理解难度大于英美国家的普通书面文本, 同时也表明审计报告作为一种正式文体, 其表达要求准确、明晰并体现出权威性。

(2) 句子特点

8篇英文审计报告样本的句子总数为1330, 且全部为陈述句, 没有疑问句、祈使句和感叹句。这是由审计报告内容的客观性决定的。同时, 复句在英文审计报告中十分常见。复句往往由多个小句构成, 它可以是并列句、复合句或者并列复合句。例如以下英文审计报告中的句子:“OFEO is currently re-establishing two internal OFEO groups to ensure that it has the proper focus on future automated systems:a) an automation steering group made up of OFEO’s senior leadership who will provide strategic direction and oversight, and b) an advisory group made up of key OFEO personnel and other functional experts who will work closely with the technical systems group to articulate OFEOrequirements and effect implementation.”

(3) 时态转换

英文审计报告往往使用多种时态进行表述。在英文审计报告样本中, 情况简介部分的审计目的、审计范围和审计方法部分使用了过去时, 如“The audit was included in our fiscal year 2002plan because the National Museum of the American Indian (NMAI) Mall Museum project is one of the largest construction projects at the Institution”;而结论部分则混合使用了将来时和现在时, 如“The Institution will be implementing a new financial system beginning October 1, 2002.”, “the new ERP system has a stronger, more user-friendly reporting and query capability than SFS”.

(4) 名词定语的使用

英文审计报告中出现较多直接以名词做定语的形式, 用一个名词做定语修饰另一个名词。英文审计报告中很多复杂的会计和审计概念都以名词定语的形式来表达。如:construction budgetconstruction costs, construction price, institution facilities, accounting records, management advisor etc.

(5) 被动语态的使用

英文审计报告中使用了大量的被动表达。通过Wordsmith软件的Concord功能, 以“am*ed/is*ed/are*ed/was*ed/were*ed/be*ed/been*ed”条件进行搜索, 得出了8篇英文审计报告样本中的359个被动表达句, 与句子总数1330相比, 被动句占27%。大量被动结构的运用使得英文审计报告在语言表达上更加客观。

三、结论

基于以上分析, 在书写方面, 英文审计报告的版面有较为统一的格式要求, 采用了大量数字和字母来标明段落并运用下划线和粗体字以突出重点, 表格、逗号、句号、连字符使用较多。在词汇方面, 英文审计报告词汇较为有限, 长单词、实词较多, 文本的正式程度高。在语法方面, 英文审计报告的句子较长, 理解难度大, 其用语要求准确、明晰并能体现其权威性。审计报告的客观性决定其句子均为陈述句, 并使用大量复句表达。同时, 英文审计报告使用的时态多样, 不同部分采用的时态不尽相同。此外, 运用了较多的名词定语以便更加清楚、简便的表达概念;运用了大量的被动结构以体现其客观。通过对英文审计报告进行文体分析, 有助于读者更好的理解和把握英文审计报告的内容, 同时也希望能对国内的会计师事务所以及会计、审计从业人员出具英文审计报告提供一定的参考。

摘要:以国际知名会计师事务所出具的8篇审计报告为研究样本, 自建小型英文审计报告语料库, 结合文体学理论与定量分析方法, 运用AntConc和WordSmith软件对自建语料库、BROWN以及LOB语料库进行统计和对比分析, 从书写、词汇和语法角度分析英文审计报告的文体特征。

关键词:英文审计报告,语料库,文体特征

参考文献

[1]Bradford, Richard. (1997) .Stylistics Routledge.

[2]Crystal, David&Davy, Derek. (1969) .Investigating English Style.London:Longman

[3]Leech, G.and M.Short. (1981) Style in Fiction[M].London:Longman

[4]Quirk, R., S.Greenbaum, G.Leech, and J.Svartvik. (1985) .A Comprehensive Grammar of the English Language[M].London and New York:Longman

[5]Wynne, M. (2005) .Stylistics:corpus approaches.Encyclopedia of Linguistics.London:Oxford

语料库文体学 篇5

近些年来, 有许多关于英语新闻报道的语言学研究。以往, 对于书面新闻报道例如报纸为语料的语言学研究较多, 但是基于语料库的广播新闻报道的文本特征进行定量的研究很少。广播新闻报道以电子媒介为传播途径, 其语言风格也必然受到影响, 形成一定的文体特色。本文以下载的43篇BBC新闻报道英语为语料, 自建小型语料库, 把定量统计引入语言研究, 结合韩里德的功能语法, 从词汇, 句法, 篇章三个层面上揭示了BBC英语新闻报道的文体特征。

二、语料的选取及研究方法

依据的语料来源于BBC官网http://www.bbc.co.uk/news/, 共下载43篇BBC的最新英语新闻报道, 主要是从2012年4月到2012年5月底有关政治、经济、文化等各个方面的新闻报道。本文运用统计检索工具 (Antconc) , 通过对所生成词表的分析和频率统计以及对语料库的句法结构分析, 总结出了BBC英语新闻报道的文体特征。

三、语料的分析与讨论

(一) 词汇层面分析

1、词汇特征分析

功能文体学的创始人韩礼德认为, 语言是社会符号, 语篇受制于情景语境。情景语境有三个主要成分:语场、语旨和语式。语场指语言发生的环境, 包括谈话话题 (topic) 、讲话者及其他参加者所参加的整个活动;语旨指语言交际者之间的角色关系与交际目的;语式指交际的渠道或媒介, 如口语或书面语。

通过软件统计, 类符和形符之比为16.88﹪, 而英语国家语料库是 (BNC) 33﹪。这说明BBC英语新闻报道的词汇重复率较高。BBC英语新闻报道的听众来自世界各地, 英语语言水平差异较大, 考虑到该新闻广播的目的在于传递信息, 促进文化交流, 因此BBC英语新闻报道的话语应该简洁利落, 表达准确, 通俗易懂, 用词短小而意义丰富。

从语场上讲, 广播新闻报道可涉及政治、经济、社会、教育、艺术等社会活动领域。语场主要制约对概念意义的选择, 尤其表现在对词汇的选择上。从词频统计列表来看, “said”的出现频率最高, “says”, “say”的出现频率也较高。因为在BBC英语广播报道中, 为了报道的客观真实, 记者常需直接或间接引用他人的观点或讲话。“said”的出现频率高于“say”和“says”表明新闻报道最常引用的是最近已发生过事件的相关人员讲话, 这符合新闻广播时效性的特点。

2、人称代词分析

从语旨角度来说, 广播新闻报道的参与者是广播媒体和公众, 媒体向公众提供世界范围内各种重大事件的最新消息。因此, 代词的选择有助于建立和维持与听众之间的人际关系。从表3的数据, 我们可以看出第三人称代词的使用频率最高。然而据研究发现, 广播新闻报道英语第一、第二人称代词频繁出现, 播报新闻的广播电台或播音记者为吸引听众, 缩短与听众之间的距离, 使广播更具亲和力, 有时称自己为we或I, 称听众为you, 或将双方称为we。由此可见, BBC英语新闻报道有其独特的口语文体特征。BBC英语新闻报道大量使用第三人称, 目的在于向听众提供真实可靠的最新信息, 信息内容客观, 具有较强的可信度。

(二) 句法层面分析

该语料的平均句长为18.77个词, 与英语各类文体的17.8个 (Leech&Short1981:113) 相差不大。从句子长度看, 句法结构应该不是很复杂, 便于普通大众理解。从语式上讲, BBC英语新闻报道通过声音进行传播, 具有一定的口语特征。

1、句式简洁明了

从句子长度看, 为便于广大听众理解, 句法结构较为简单, 常用短语表达来迅速抓住听众的注意力。

During his presidential campaign, he called for a new emphasis within the European Union on promoting economic growth as a way to combat the high levels of debts and unemployment.

以上例子是从43篇语料中抽取的句子, 我们可以看出, 在BBC英语新闻报道中, 用动词短语来引起读者注意是很重要的手段。这可以帮助听者迅速抓住重点, 更好地理解新闻内容, 同时对于用到考试中的BBC听力素材, 可以帮助考生掌握答题的技巧。

2、在BBC英语新闻报道中, 有一种特殊的撰写方式, 即导语中用一般现在时表示过去发生的动作, 而在全部过程中又全部采用过去时态。

例、Activists in Syria say government forces have killed as many as 130 civilians across the country in an escalation of violence ahead of a ceasefire deadline.Troops were reported to have shelled, then attempted to storm the town of Latamna in Hama province.Jim Muir reports from neighbouring Lebanon.

在BBC英语新闻报道中运用这样时态的原因是, 一般现在时在新闻中的大量使用能做到表意清晰, 突出“新”使听众觉得新闻事件历历在目, 感到刚刚发生而且和现在有着密切联系。用一般现在时来突出“新”, 用过去时可以把新闻事件的来龙去脉说清楚, 给听众以既“新鲜”又“清楚”的印象。

(三) 语篇层面分析

新闻报道多采用“倒金字塔”结构, 分为导语和正文两部分。导语开门见山, 先道出新闻的主要内容, 正文则按内容的重要性逐步作进一步的解释和说明, 最次要的内容置于最后。BBC英语广播也遵循这一模式, 分为导语和正文两部分, 篇章结构简短清晰。

新闻英语的六要素包括WHO, WHAT, WHEN, WHERE, HOW和WHY, 在BBC英语新闻报道导语中只点明了最主要的新闻要素WHO, WHAT和WHEN, 内容简洁清晰, 听众一听就明白。

例、BBC news with Stewart Macintosh

Officials in the United States say they and their allies have disrupted a plot to bomb a plane involving an upgraded device similar to that used unsuccessfully by a underwear bomber on a flight from Yemen to the US in 2009.The device is in the possession of US officials.Mark Mardell reports from Washington.

从上面例子可以看出, BBC的新闻报道都很短小精悍, 只报道所发生的时间, 而不做任何评论。句子间很少使用衔接手段例如替代 (如so) 和连接成分衔接 (如And, But和Then) 。但是整篇新闻读下来很有连贯性, 衔接紧密, 说明BBC新闻报道的连贯大都通过语篇内部的隐性连贯来实现。四、结语

语料库及语料库方法借助计算机这种强有力的信息处理工具, 在语言研究中日益起着重要的作用。本文利用语料库及Antconc软件, 采用定性与定量相结合的方法, 分析了BBC英语新闻报道的语言特点, 分析结果基本与现有相关研究结果相互印证。通过分析, 有助于中国听众在听BBC英语新闻报道时, 迅速抓住重点, 更好地理解新闻内容。

摘要:本文选取了BBC英语新闻广播听力文本, 以语料库为基本的研究方法, 以数据统计为支持, 从词汇特征、句法特征, 修辞三方面对BBC英语广播新闻报道的文体特征进行了分析。

关键词:基于语料库,文体分析,BBC英语广播新闻报道

参考文献

[1]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社, 2002:33.

上一篇:电视回看下一篇:开征遗产税的法律思考