双语平行语料库

2025-01-26

双语平行语料库(精选7篇)

双语平行语料库 篇1

随着中国对外交流活动日趋频繁, 商务英语的语言经济价值越来越凸显, 商务英语翻译在这一新的形势下应运而生。 但目前商务翻译整体质量不高, 不能满足日益增长的社会需求。语料库是基于当代信息技术的真实语言材料处理、存储和检索系统, 以语料库为基础的计算语言学将为商务翻译开辟一条崭新的途径。

一、语料库研究回顾

回顾语料库研究的历史, 国外学者Mona Baker在1993年发表了Corpus linguistics and translation studies一文, 掀起了翻译界的一场革命。此后陆续有研究者 (Leech, Barlow) 利用语料库来探讨翻译规范和语言对比等问题, 研究成果丰富。随着中国关于促进教育信息化政策的出台, 国内学者也就语料库进行了大量研究, 研究领域多集中在语言对比、双语词典编纂和翻译研究等方面 (王克非, 胡开宝等) 。但纵观当前所建的语料库, 主要是通用型的综合语料库以及文学翻译类的平行语料库, 以某一专门用途为导向的双语语料库较为少见, 将语料库应用于商务英语翻译的研究也才刚刚起步。

二、商务双语平行语料库的构建方法

建设服务于商务翻译工作的语料库平台, 需要从整体设计和具体操作两个层面入手, 使语料入库成为可管理的数据系统。在整体设计层面, 要考虑语料库的子库构成及语料的搜集整理。在具体操作层面, 要考虑语料文本的数字化、语料对齐及校对、语料标注及检索技术支持等实际问题。其具体技术路线如下:

第一步, 搜集整理内容涉及商务函电、商务合同等常见类型的双语商务语篇, 并完成纸质版本语料的电子化及不同格式文件的纯文本化;第二步, 对中英文语料均采用Para Conc软件以句为单位进行粗略对齐, 辅之以人工校对, 在语料实现对齐后, 将文本转换成XML格式, 以方便其格式编码和检索;第三步, 利用中科院计算所的分词系统开源版本, 采用北京大学计算语言学研究所的汉语文本词性标注标记集, 对汉语文本进行词类赋码处理, 利用Treetagger对英文文本进行相应的词类赋码处理;最后, 对机器标注的语料辅以人工校对, 使用concordancer进行检索。

三、商务双语平行语料库的研发价值

在经济全球化的背景下, 商务英语作为专门用途英语的重要分支, 其双语语料库的研究将具有重要的现实意义和研发价值。从技术上看, 利用检索软件便于译者快速提取译文参考, 查找商务领域中特定表达方式和专业术语的译法, 比双语词典语料新、语境丰富, 有助于提高翻译速度和准确率。从素材上看, 能够提供关于某一语言结构在不同语境下的真实译例, 有助于研究商务文本的语言特征, 直观地揭示汉英商务文本从词汇到语篇各个层面的共性与差异, 提炼翻译过程的转化规律与机制, 为商务译本评价提供科学统一的标准。从商务翻译的发展前景来看, 利用信息技术构建商务双语语料库是提高翻译质量的有益探索。基于语料库的商务英语翻译研究也将随着语料库语言学的发展拓展到一个全新的领域。

参考文献

[1]王克非.语料库翻译学探索[M].上海:上海交通大学出版社, 2012.

双语平行语料库 篇2

1矿业英语翻译现状

在中国一些大学, 如中国矿业大学, 矿业英语翻译已经成为英语专业及采矿专业学生的必修课程。矿业英语翻译作为科技文本翻译的一类, 其文本既有科技文本的共性, 如准确性、 客观性、逻辑性等, 又具有独特之处。这些共性和特性都注定了在翻译过程当中会出现一系列相关问题。

1.1矿业英语的特点

1) 范围广

矿业不仅仅局限于采矿环节, 还包括勘测、加工、销售等环节。因此矿业英语的内容也会涉及各行各业的专业知识, 学习者不仅需了解矿业方面知识, 也应当涉猎物理、化学、生物、电气自动化、法律、市场营销等方面。如:

原文:Coat bed methane is naturally occurring methane (CH4, ) with small amounts of other hydrocarbon and non-hydrocar- bon gases contained in coal seams as a result of chemical and phys-ical processes.

译文:煤层气是煤层中自然产生的甲烷 (CH4) 、少量其他烃类和非烃类气体, 它是化学和物理过程作用的结果。

2) 普通名词和半专业名词专业化

矿业英语包含大量术语, 专业性极强, 而当中的很多词汇其实是由普通词汇和半专业词汇转化而来的。这些词汇给翻译增加了很大的难度, 把握这类词汇的翻译往往成为翻译准确性的关键。例如:floatation原意是“漂浮”, 但在矿业当中译为 “浮选”;再如face一词普通翻译就是“脸、面子”, 但在矿业中多翻为“工作面”。这类词还有很多, 如:monitor (水枪) , moment (力矩) , lip (前缘, 过梁) , library (程序库) , lavatory (金矿选洗库) 等。

3) 一词多义

矿业英语当中, 同一个专业名词在不同的语境下会呈现不同的意思。比如:

原文1:The spacing between holes and burden is related to a number of factors and varies for almost every quarry.

原文2:...so that the burdens of holes are within acceptable parameters.

译文1:炮眼和抵抗线的间距同许多因素相关, 且不同的采场间距各不相同。

译文2:……因而炮眼的负载皆在可接受范围之内。

同是burden一词, 在不同的语境下需分别译为抵抗线和负载, 这就要求学习者需仔细研读上下文, 把握词汇的准确意思。

4) 词缀广泛使用

矿业英语追求准确、严密细致的表达, 因此大量使用名词和名词词组。这个时候, 词缀构成的派生词就派上大用场了。 矿业英语中有许多抽象名词均是在动词或形容词后加上-ment, -sion, -ance, -tion, -ure, -ity等后缀构成的;前缀de-, an-ti-, a-等构成的派生词也不少。如:rectification (整流精馏) 、det-onation (爆轰) 、ventilation (通风) , dehydrator (除水) 、demethaniz-er (脱甲烷塔) 等。

5) 长难句大量存在

总的来说, 科技英语的句法特点主要包括“结构复杂, 层次纷纭;连环套接, 难解难分;穿插过多, 脉络难寻;词序颠倒, 结构变形” (孙新法, 2008) 。矿业英语也一样, 为了确保文章的客观性和严谨性, 复杂句出现频率非常高。比如:

原文:Longwall retreating working consists of first driving roadways through the solid coal at such intervals as may be neces-sary for the extraction of the coal in a later operation and of such lengths as may reach either the boundary of the area of coal to be worked, or an arbitrary boundary.

进行长难句翻译时, 需先分析句子结构, 区别主干, 选择事宜的翻译手段进行切割翻译。

6) 多被动语态和一般现在时

科技英语当中, 为保证篇章严谨缜密, 准确传达技术原理和阐释客观事实, 通常会使用被动语态, 避免提及动作执行者以造成主观臆断的印象。矿业英语当中自然也不例外。被动语态的频繁使用确保了矿业文本的科学性和专业性。如:

原文:When all the ore in the stops has been transported up to surface, some pillars can be removed, since they still have valuable mineral content, while some must be left standing to provide active support for the ceiling.

一般现在时是表示通常性、规律性、习惯性、真理性的状态或者动作 (有时间规律发生的事件) 的一种时间状态。在矿业英语中大量使用一般现在时来说明客观事实、表达概念、理论, 使语言更加缜密、准确。如:

原文:Sublevel stopping is a mining method in which ore is blasted from different levels of elevation but is removed from one level at the bottom of the mine.

1.2矿业英语翻译现有问题

矿业英语的特点注定了其翻译绝不是一件易事。对于英语学习者而言, 翻译当中会遇到很多专业名词, 且可能是一词多义, 学习者不仅需要知道该词的意思, 还要揣摩在当前语境下的具体含义。而对于矿业学习者来说, 相比于非矿业专业学生, 专业词汇的表达可能不是太大的问题, 但矿业文本的句子结构就成了一个负担。

此外, 虽然当下已有矿业专业的纸质词典, 比如中国矿业大学姬长生教授编写的《露天采矿词汇》, 但当中只是列出了矿业词汇的中英对照, 并没有涉及实际应用, 且存在少量误译现象。而翻译软件, 例如有道词典、金山词霸等也只能查到普通常见的意思, 并不能解决矿业英语学习者的困惑。工具的缺失也是矿业英语学习无法快速发展的一大阻碍。

2矿业双语平行语料库建设的作用和意义

当前矿业英语翻译存在的各种问题导致翻译速度缓慢, 翻译质量不高。语料库语言学的发展为矿业英语翻译打开了一扇新大门, 提供了一种新的支撑技术。而矿业英语亦能够丰富语料库语言学的内容。与矿业语料库的建设息息相关的有两类人群, 即英语学习者和矿业学习者, 对于这两类群体而言, 建立矿业语料库的意义不尽相同。

2.1对英语学习者的意义

英语学习者更倾向于语言方面的研究。建立矿业双语平行语料能够突出矿业相关领域的语言特征。语料库建成后, 英语学习者可以利用语料库就中英文语料开展语言对比分析。 研究同通用型语料库相比, 矿业文本的中英版本在词汇、句法和语篇方面所存在的共同之处和差异体现在哪些地方, 从而可以总结出矿业文本特有的语言现象和语篇规律, 研究翻译当中的转换机制。语料库能够为研究提供大量实例, 帮助学习者以量化的方式分析语言表达形式, 体会不同译者的翻译风格和手段, 为矿业类文本的翻译提供参考。此外, 语料库还可用于翻译教学, 可通过设计数据驱动教学引导学生利用语料库进行自主学习, 帮助学生自主发掘英语和汉语之间的转换规律, 促进矿业文本翻译的综合研究。

2.2对矿业学习者的意义

对于矿业学习者而言, 相比于英语学习者, 语言的潜在规律、语篇机制等就不显得那么重要了。矿业学习者或需要了解当下国际社会上新兴的矿业知识, 或需要在国际刊物上发表自己在这一领域的相关看法, 或需要同国外同行交流见解。这样一来, 语料库主要就是为了翻译实践而服务的。能够了解外语矿业资料, 得到高质量的译文就是矿业学习者最根本的目标。 这种情况下, 语料库可用于资源提取与机器辅助翻译。容量达到一定规模的语料库能够以量化和实例方式整理出相对整齐规划的转化规则和翻译表达。就矿业文本来讲, 最重要的双语对比表达, 就是术语。从语料库可以提取出相关术语在不同语境下的翻译表达方式, 帮助学习者在翻译过程中确定术语的准确意思, 弥补普通专业词典在语境、例句方面的不足, 从而得到高质量的翻译文本。

3语料库拟建设环节

同通用型语料库的建设流程一样, 矿业平行语料库也需经过语料搜集与加工、对齐标注、搜索引擎设计等环节。不过, 在正式开始建库之前, 还需确定即将建设的语料库的相关参数, 即设计语料库。

3.1语料库的设计

王克非教授2004年提出建立双语对应语料库需考虑十点, 包括设计目的、语库规模、语料范围、代表性与均衡性、双语比例、共时/历时性、语言类型、语言质量、取样策略和标注加工 (王克非, 2004) 。我们所要建立的矿业英语语料库的十个参数设计情况如下表所示。

3.2语料库的建设

确定上述语料设计参数及特征之后, 就正式进入到语料库建设阶段。

1) 语料选择与采集

语料库的使用群体为在校英语专业和采矿专业师生, 因此语料主要来源是中国矿业大学教授老师编写的矿业英语教材、 学生多次修改后的矿业文本译文、国际矿业法规、矿业论文等翻译文本。所选译文文本翻译质量较高, 且语料具有一定复现率。不收录为研究语料库建设专门翻译的文本, 不收录过于直译或意译的文本。

语料采集方法以扫描输入为主, 辅以人工输入和现有电子文本的利用。语料汉英双语匹配, 也就是说具有翻译关系。对于这三种采集方法收录的文本都应进行再次校对和编辑, 去除杂质, 包括多余的空行、空格、图形、符号等, 统一文本格式。

语料采集完毕之后, 应将中英文文本对应存放, 即文件名保持一致, 只在最后分别加以EN和CN的标记区分开来。如 “煤层气EN”“煤层气CN”, 这样做是为了后续加工处理文本的时候方便查询和加载。

2) 语料的分词标注

英语以词为单位, 之间有空格, 不需进行分词处理。而汉字以字为单位, 需进行分词处理。汉语语料的分词软件首选中国科学院研究所研发的ICTCLAS。该软件可在官网下载, 现更名为NLPIR汉语分词系统, 最新一版本在2015年8月5日更新。这一软件采用了中国国家标准GB13715“信息处理用现代汉语分词规范”, 可以实现自动切分词汇和词性标注。该软件的分词准确率在97%左右, 仍需进行人工校对和修改, 识别不出的地方主要集中在专有名字、缩略词和新型词汇等方面。

语料的标注常用COCOA参考系统模式和TEI文本编码计划模式, 在本语料库建设当中, 拟使用TEI模式, 因为其更容易让人理解和操作。除了使用ICT进行的词性标注之外, 语料的标注还包括篇头信息标注, 包括语体、内容所属领域、文体、年代、作者名、译者名、出版信息、文本字数等和其他类的篇体标注描述 (词性标注属于此类) , 如段落标注、句子结构标注、语法和语义标注等。现有的软件平台, 如谢菲尔德大学开发的GATE语言工程/语料库仍仅限于标注浅层次的句子成分, 复杂的篇体标注仍需靠人工标注。

3) 语料的平行对齐

双语语料的平行对齐是语料库建设的关键环节。对齐包括篇章、段落、句子和词汇层次上的对齐, 篇章和段落对齐依据WORD就可实现, 另外也可借助软件Para Conc, 这一软件由新西兰奥克兰大学Michael Barlow研制, 对齐准确率在80%左右, 后期仍需进行人口校对。由于语料库和语言工程软件尚未开发彻底, 词汇方面的对齐实现难度过高, 因此现阶段多数对齐方式都限定于句子层面。本语料所选语料先确保在段落上实现对齐, 再借助Para Conc的“分割对齐单位”和“向下或向上合并对齐单位”实现段落的拆分合并, 再辅以人工对齐方式实现语料句级对齐。另外, 翻译记忆系统软件TRADOS当中的Wi- n Align也支持手工调整句对, 进行拆分合并工作, 实现人工对齐句子。语料对齐是语料库研发关注的重点问题, 随着该方面技术的不断成熟, 已经有专门的句对齐软件研制开发出来了, 例如Multiconcord, 不过目前其对齐准确度只有60%左右, 需辅以大量人工操作。

4) 语料检索工具

语料完成所有加工整理过程之后, 便可投入使用。可用于检索语料库的软件平台包括Para Conc, Word Smith等, 前者适用于小型语料库和初级检索, 后者则多用于大型语料库的高级检索。这些检索平台的处理对象都应为Text文本。使用检索功能, 就可对某个词汇或短语在文本中的使用频次等进行统计分析, 实现语料库的建设价值。

4结束语

矿业英语是专业用途英语之一, 目前矿业翻译仍存在大量问题和困难, 随着中外交流日益加深, 将会受到越来越多的关注。语料库语言学几乎是与专业用途英语同一时间发展起来的, 两者的结合却整整滞后了十多年。虽然起步晚, 我们仍应相信, 将语料库语言学与矿业英语进行有机结合在当下和未来对于矿业英语学习者而言都将是非常有帮助的, 这也是语料库语言学研究的一个新方向。矿业双语平行语料库的建设与推广不仅可以帮助译者提高翻译速度和质量, 促进矿业翻译实践和教学研究, 也将丰富语料库内容。以上是该语料库建设的理论基础, 其实践将一步步展开, 期间必定需要投入大量时间、人力和资金, 但从长远来看, 语料库具备的优点是其他教材、工具书、翻译软件所不具备的, 建库具有较高实用价值。

参考文献

[1]丁树德.浅谈西方翻译语料研究[J].外国语, 2001 (5) :61-66.

[2]黄俊红, 范云, 黄萍.双语平行语料库对齐技术述评[J].外语电化教学, 2007 (6) :21-25.

[3]胡开宝.语料库翻译学概论[M].上海:上海交通大学出版社, 2011.

[4]孙新法.谈科技英语长句的理解与翻译[J].中国科技翻译, 2008 (4) :10-11.

[5]王克非.新型双语对应语料库的设计与构建[J].中国翻译, 2004 (6) :73-75.

[6]王克非.双语对应语料库:研制与应用[M].北京:外语教学与研究出版社, 2004.

[7]王正, 孙东云.利用翻译记忆系统自建双语平行语料库[J].外语研究, 2009 (5) :80-85.

[8]谢家成.小型英汉平行语料库的建立与运用[J].解放军外国语学院学报, 2004 (3) :45-48.

双语平行语料库 篇3

关键词:平行语料库,旅游,翻译,地方经济

0 引言

素有“四省通衢,五路总头”之称的衢州城有着7000多年的文明史,1800多年的建城史。悠久的历史,独特的自然生态环境孕育了丰富的旅游资源。至2014年上半年全市现有5A级景区1个,4A级景区11个、3A级景区9个,以及众多人文、自然景点。近年来,衢州的旅游环境不断改善,随着“国家级历史文化名城”、“中国优秀旅游城市”、“中国十佳宜居城市”、“国家森林城市”、“国家园林城市”等荣誉的获得,城市形象和知名度不断得以提升,其独特的自然生态旅游资源和地域风情也吸引了大批国内外的游客。此外,衢州在对外关系发展上取得的发展,如3个国际友好城市的建立,各类国际性赛事以及活动的举办都使得衢州逐渐走上国际舞台。

相比于日趋完善的旅游硬件设施建设,作为软件设施建设中的衢州旅游外宣翻译却相对发展滞后。衢州大多数景区(点)包括南孔家庙,衢州博物馆这类国外游客必访之地的纸质宣传资料上都未配备相应的英文解说,作为衢州旅游重要窗口之一的衢州旅游网迄今为止尚无相应的英文网页,老牌4星级酒店衢州饭店的英文网站上关于衢州景点的介绍却是完全不通顺的伪英文,这一切都让本应不俗的衢州文化软实力打下折扣。而有道词典、金山词霸等常见双语语料库收录的关于衢州景点介绍的相关语料屈指可数,且误译频频,如果能建立起一个规范的关于衢州旅游外宣资料的双语语料库,则不仅能直接应用于政府部门和企业的外宣、推广,同时也能指导翻译人员、导游从业人员和相关研究者规范所译的旅游外宣文本或导游词,提高译者的工作效率,此外也为研究衢州旅游外宣翻译的研究人员提供可资借鉴的研究平台,使得衢州旅游资源外宣翻译的质量监督更具规范性和科学性。为此,建立一个“衢州生态旅游汉英双语平行语料库”的构想便应运而生。该语料库将整合现今所有衢州景区(点)的汉语介绍、导游词及英文翻译,修订和补充现有资料,再经过专业软件工具进行语料平行对齐、语料标注,从而达到为国外游客及外宣翻译人士所用,为衢州市外事、旅游、招商等部门的外宣及衢州旅游网英文版的创建打下坚实的基础。

1 国内外平行语料库研究现状

语料库(corpus)是一个将真实情况下使用的海量语言信息经过科学收集和组织而集成的专供研究使用的资料库。平行语料库属于双语语料库,是指能将原语文本和其译语文本进行全文检索并对照显示的语料库。双语平行语料库是由某种语言的源文本及其具有词、句或段级平行对应关系的译语文本组成,是两种语言间对应关系的宝藏,可以为译者提供丰富的对译样例。目前国际上比较知名的平行语料库多以文学文本为主,或是以收集百科文本为特色,而针对某一特定文类或某一地域特色而专门构建的专门用途双语平行语料库仍不多见。

旅游平行语料库是近年来随着旅游产业的飞速发展,同时亦是为满足语言学及应用语言学的研究需要应运而生的一个专门语料库类别。目前国内外最知名的旅游语料库有四库:芬兰Michael Wilkinson所创建的英语旅游文本语料库;英国Carlota Alcantar所建的英语旅游文本语料库;日本Kiyomi等人所创建的“京都旅游语料库”;香港理工大学所建的新型双语平行旅游语料库。

国内已建成或在建的有河北省导游词平行语料库、新疆外宣翻译平行语料库、山东省旅游外宣小型语料库、贵州对外宣传汉英平行语料库等等。这些地域性的专门用途的双语语料库的建立有效提升了当地的旅游品牌和知名度、扩大了地方特色旅游资源的外宣力度。由于各地有着各自独特的自然与人文景观,各地旅游资源迥异,建立高质量的本土化的旅游平行语料库至关重要。而这些优秀的同类型语料库的建成无疑为衢州构建自己的生态旅游资源汉英双语平行语料库提供了宝贵的经验,使之成为可能。

2 语料库构建意义

(1)成功构建衢州生态旅游汉英双语平行语料库能服务于衢州生态旅游资源外宣,推动衢州旅游产业发展。这种网络数据库可供国内外游客、导游从业人员和翻译工作者免费查询,这无疑能有效提升衢州市生态旅游资源品牌、扩大衢州市生态旅游资源及特色景区的知名度、提高旅游服务质量。

(2)在地方旅游产业的发展和学术研究之间架起桥梁,规范和健全衢州地区生态旅游资源汉英翻译。由于语料入库前需经过专家审核、修订,所以建成的衢州生态旅游汉英双语平行语料库能对原有的译本进行修正和润色,提供可靠的翻译参考,从而有效地提高旅游外宣资料文本翻译质量,提升旅游景点档次。针对一些特色景区外宣翻译的缺失,该库还将补全缺失的内容,从而健全衢州地区生态旅游资源的汉英翻译。

(3)该语料库可直接应用于各类与旅游产品相关的商业活动,服务于地方经济,如为企业开发衢州市旅游景点电子语音讲解器提供数据支持;其中关于衢州特色小吃的英文介绍、特色食品药材的英文介绍等可为旅游特产打入国际市场创造条件等等。

(4)衢州生态旅游汉英双语平行语料库可为语言研究人员提供对比研究的素材,探究不同类型的旅游文本及其英译文本的语言特点,结合翻译理论,进一步研究衢州旅游文本外宣翻译的翻译策略、翻译方法,为衢州旅游文本的翻译提供理论基础。

(5)衢州生态旅游汉英双语平行语料库还可应用于本地高校的翻译教学,有助于培养高素质的翻译人才。语料库由于能够提供客观、真实和富于时效性的译文实例,应用于翻译课堂更能激发学生学习热情,有利于培养学生自主化学习的能力,从而进一步提高翻译课的教学效果,为培养高素质的翻译人才提供智力支持。

3 衢州生态旅游汉英双语平行语料库的构建框架

3.1 语料的选取

建设任何语料库首先需要考虑的问题就是语料的代表性,这是语料选择的最基本问题。虽然衢州市旅游资源丰富,但是也只是在近几年才开始注重旅游资料的英译问题。当前市面上的衢州市旅游资源双语资料非常有限,且良莠不齐,在进行语料的选取时需要设定严格的标准,对收集到的文本中的语言材料的质量进行评估,以免质量不高的语言材料入库,造成负面效果。在语料选取过程中,主要搜集这几类汉英对照的文本材料:景区(点)介绍,宣传册;观光指南;博物馆陈列说明;景区公示语;餐饮住宿介绍等。首选正规出版的书籍,其次是实物景点的中英文资料、网络等其他途径。组织外语专业研究人员对语料进行评估。所选文本若含有语法、翻译错误或翻译质量低下等问题,则不予收录。对于确需翻译却没有相应英文翻译和翻译质量较差的文本组织人员进行翻译,再经过资深翻译专家和外教的校对后进行录入。

3.2 语料的录入与保存

确定了语料库内容以后,就要进入语料的录入与保存阶段,也就是语料的处理阶段。由于在资料收集过程中涉及多种形式的语料文本,录入的语料均需转换成统一的格式存档备用。对于纸质文档可先扫描并通过字符识别软件把文档转换成能够编辑的电子文档;拍摄的图片资料则需要人工输入。将所有选取的材料保存为整齐干净的电子文本文档格式,以方便程序处理。

3.3 语料标注

语料标注分为篇头标注和文内标注,目的是使原语料中的相关信息能够在处理后的文档中得以体现。篇头标注可包含:标题、景区所在地、译者信息、时间、出版信息等;文内标注可利用语料库词汇切分和词性赋码软件工具分别对汉语和英语语料进行词性标注。需要指出的是虽然有现成的CLAWS7或ICTCLAS系统等软件进行计算机词性标注,然而机器自动标注的准确率并不能达到百分之百,因此,在完成自动标注后需要对标注后的文本进行人工修正。

3.4 语料平行对齐

语料对齐是构建平行语料库的关键步骤,经过对齐处理才能够使用平行语料库检索软件进行检索和处理。由于汉、英两种语言在语序、句子结构和逻辑语义的表达等方面都存在着明显的差异,有时候一句中文原文可能译成多句英文,有时候多句中文可能只需译成一句英文,要做到语句的一一对应难度相当大。目前市面上的大部分软件自动对齐正确率也并不高,因此语料对齐时要做到机器对齐和人工对齐相结合的办法,尽量做到句子层面的对齐,辅以段落对齐。

3.5 检索技术的运用

经过上述步骤的完成,就能够使用平行语料库的检索软件进行检索了。检索工具既可使用目前已知的Concordance,Para Conc等软件,也可由计算机编程人员开发针对上述数据且可用于网络上检索的查询工具,以方便用户查询。

初步建成的语料库还应允许不断添加新的材料进去,使语料库的规模能不断扩大。

4 结语

双语平行语料库 篇4

当今全球化进程中, 国际间交往和互动频繁, 作为发展中国家, 中国在积极地引进和学习国外先进的科学技术, 各个领域的外文科技文献源源不断地涌进中国, 并成为中国学者、技术人员等学习和研究的第一手材料。翻译外文科技文献过程中, 不可避免地会遇到许多科技术语, 需要准确翻译, 以使读者能够很好地理解, 不致疑惑。英国萨里大学 (Surrey University) 翻译学教授Peter Newmark (2001) 指出:尽管术语只占全文的约5%-10%, 但是他们却构成科技英语翻译与其它文体翻译的根本区别。科技术语的翻译应具有准确性、规范性和统一性。

一般认为, 科技术语可分为三类, 即专业技术术语 (各科技领域的专有术语) 、准技术术语 (本身由多种普通义, 在科技领域中获得扩展的新义) 和新创造的术语 (为表达新概念而创的术语) 。对于人工翻译来说, 科技术语的翻译可采用音译法、意译法、形译法、意音兼顾法和创造新词法等, 译者可以调动多年训练和储备的知识对某一领域的科技术语进行灵活的翻译。但是, 高度信息化的今天, 仅采用人工翻译显然不足以满足人们的需求。因为翻译者不可能通晓较多的专业, 不同译者对同一术语的翻译也可能有所不同, 而且时效性也比较差。而实践中可以看到, 目前基于规则、基于统计及基于实例的机器翻译在准确性上尚存在很大不足, 且尚未出现较为完整的科技术语翻译理论规则以支持科技术语的准确翻译。于是, 我们可以考虑使用基于语料库进行研究。

2. 平行语料库研究

自上世纪60年代美国Brown大学建立第一个电子语料库———Brown语料库的近几十年来, 语料库技术蓬勃发展。在国内外, 构建了大量的用于不同研究目的的语料库, 这些语料库按语体分, 有口语语料库和书面语语料库;按介质分, 有文字语料库和声音语料库;按时间分, 有共时语料库和历时语料库;按处理程度分有生语料库和熟语料库, 另外, 还有专有名词标注语料库、学习语料库等。20世纪90年代, Mona Baker等人将与翻译研究有关的语料库分为平行语料库 (Parallel Corpus) 、可比语料库 (Comparable Corpus) 和多语语料库 (Multilingual Corpus) 。本文中主要使用英汉双语平行语料库。

关于平行语料库的定义目前尚未得到统一, 本文使用的平行语料库按以下规则:即, 源语文本和译语文本在句子层面互为译文关系的语料库。英汉双语平行语料库即指互为对译关系的英语和汉语语料组成的语料库。

近年来, 从事语言研究和机器翻译研究的国内外很多研究机构都在致力于建设平行语料库, 现今已建立的英汉双语语料库有英国伯明翰大学 (the University of Birminham) 建立的中英对应语料库、英国兰卡斯特大学 (Lancaster University) 建立的Babel英汉语料库、北京外国语大学中国外语教育研究中心的通用汉英对应语料库、北京大学计算语言学研究所的汉英/汉日双语语料库、中国科学院自动化研究所的英汉双语语料库和哈尔滨工业大学的英汉双语语料库等。对这些平行语料库的研究包括建设、对齐和抽取信息等。

目前, 一些语料库采取双语自动对齐技术在篇章级、段落级、句子级以及短语级的水平上使源语文本和译语文本进行了对齐, 即, 通过一定算法将意义相同的源语和目标语自动对应起来。本文中, 由于是针对科技术语, 所以主要通过短语对齐技术进行加工处理。另外, 为在平行语料库中找到科技术语的源语和目标语, 还需要使用术语抽取技术。术语抽取技术通常结合了统计学和语言学的方法, 即, 使用统计学的方法获取候选术语, 再利用语言学的方法来筛选、过滤和修正。

应当注意:本文中所述科技术语仅限定为名词, 并且科技术语的翻译仅限定为由英语翻译成汉语 (即英译汉) 的过程。事实上, 因为汉语中的科学技术名词大多是近现代科技进入中国后通过翻译得到的, 所以仅就科技术语而言, 由汉语翻译成英语往往只是英译汉的逆向过程。

3. 科技术语的翻译问题

由于词汇的相对有限性和科技发展的无限性, 对新发明创造的事物的命名往往依赖于现有词汇。借助于各种手段用已有的词汇来表达, 使得在英语中不同科技领域往往会使用同一科技术语, 而这同样的科技术语翻译成汉语时往往会用不同的表达方式或词语, 即虽然源语言词语相同, 但译法却有所不同。而即使在同一领域中, 不同的事物上使用同一术语也会存在译法不一致的情况。通常有以下几种情况:替用词、多义词和词典无义项词。

3.1 替用词

英语作者在将某些部件命名时, 往往会使用众所熟知的形象的词汇以便于理解, 这种准技术术语不能直接翻译成原义, 否则不合文体, 但又不宜用其它符合文义但远离词语本义的词汇代替。如elbow本义指“肘”, 但在机械技术文献中经常用于表示位于两个构件之间可相对于其彼此运动的部分, 如同动物体的肘关节, 但不宜翻译成“关节”或“接合部”, 这样的词一般可译成“肘部”;同样地, finger可表示为“指部”或“指形部” (构件在形象上像伸出的指头) 等。

3.2 多义词

跟普通词汇一样, 有的科技术语在同一领域中也具有多种意义。如机械领域中的“tab”一词, 若出现在介绍易拉罐及相似物体等的科技文献中, 则翻译成“拉环”, 在其它特定结构的文献中有时可翻译成“挂环”, 或者“凸舌”, 总之, 就是指位于某个机械构件上便于对此构件进行某种特定操作的突出部分。但是, 有的新发明中的大致符合此特征的某些部分也被英语母语作者命名为“tab”, 这时, 再翻译成前述只有特定上下文使用的“挂环”“拉环”“凸舌”等便不再合适, 于是可以音译成“提攀”等。

3.3 词典无义项词

科技术语的翻译中, 理想的是, 仅利用传统的对比词典 (如英汉电子词典) 中列举的义项 (或者经过标注说明特定用法的义项) 与源语文本中的词语进行简单对应, 从而得到相应译文。但是, 在实际翻译过程中发现, 传统词典在面对一个词项的多种用途时往往表现地无能为力, 经常需要根据实际技术语境来创造新词, 这时则需要调用专业领域中独有的专业术语库。如“rib”一词在特定机械中称为“筋板”, 而这个义项在传统词典中一直未予收录。

虽然人们已经总结出各种译法或思想, 如音译法、意译法、形译法、意音兼顾法和创造新词法等, 但是对于计算机而言, 由于利用这些方法翻译时随机性和主观性较强, 故很难且尚未能将这些译法或思想用程序的方式较好地表现出来。所以有赖于使用平行语料库等已存在并正在不断扩充、更新的大量语言事实进行归纳总结, 择取较优译法或通用译法作为规范表达以用于机器翻译, 从而使翻译语言达到正确性和一致性。

4. 利用平行语料库进行加工处理

在平行语料库中, 首先, 利用术语抽取技术, 获取尽可能多的科技术语;然后, 使用短语对齐技术实现这些术语的源语文本和目标语文本之间的对齐。这时, 需要建立术语和领域相关性数据库、上下文相关性数据库, 对数据库进行动态更新, 另外, 还需要考虑交叉领域的术语翻译。

4.1 建立术语和领域相关性数据库

要建立同一科技术语与不同科技领域之间的相关性数据库, 需要以下工作:

(1) 将汉英平行语料库中搜集的语料所属的领域进行分类, 并标记其属性 (如医学领域, 可标记为英文;机械领域可标记为) ;

(2) 求出某一个领域同一个科技术语的各种译法所出现的概率P;统一各种表达中出现概率最高的几种 (最少一种) 形成一小组, 定为译语文本的候选规范表达;

(3) 将该术语的译文规范表达与该科技领域相关联, 即一旦确定该科技领域, 则当遇到该术语时, 根据第二步统一翻译成此规范表达小组中的一个。

如下所示:

可以看出, 同一英语科技术语也可以在不同的领域中译成同一汉语词语, 这是由各领域之间的相近性和词语涵义的相对稳定性决定的。但这并不影响特定领域中的具体翻译。

4.2 建立上下文相关性数据库

同一领域中, 科技术语之间需要有上下文相关性数据库。科技术语之间有上下位概念相关、局部和整体相关、同级相关等固有关系。由于这种固有关系, 使得某些科技术语之间的彼此同现机率很高。同一领域中, 很多词也有不同的翻译方法, 而这些译法多数与上下文中同现的上述某些词语相关, 所以可以用之以示区分。

例如, 机械领域中tab有多种译法, 但是如果上下文中出现或多次出现pop can (易拉罐) , 则意味着其意思是“拉环”的概率最大;如果上下文中出现或多次出现housing (壳体) 或container (容器) , 则意味着tab的意思是“凸舌”的概率最大;如果前述二者都未出现, 则音译表达“提攀”的概率最大。

由此可以在第一步的基础上, 将规范表达数组中的各个元素和其所在领域中同现的其它术语 (或称“特征词”) 通过计算最大概率而进行关联, 即, 如果在规范表达数组中同一领域同一特征词出现时有多个译法, 则可以取最大概率者建立相关性。此处“上下文同现”指同一句子中同现、同一段中同现或者同一文献中同现, 而不单纯指相邻的同现关系。术语间建立相关性如下所示:

机械领域:

显然, 这个过程可以采用现今比较常用的互信息 (mutual information) 的方法来实现。另外, 还可以使用与这些术语上下文同现概率较高的形容词或动词来作为特征词。

4.3 动态更新数据库

科学技术的发展日新月异, 新型技术产品不断涌现, 技术交流更加频繁, 汉英平行语料库的规模也在持续扩大, 英语科技术语持续增加, 同一领域同一术语的某一译法在其所有译法中所占的概率在相对稳定中也势必会发生相应的变化。我们必须利用各种有效的途径不断地扩充和完善科技术语相关性数据库。例如, 依靠强大的搜索引擎功能搜集互联网上丰富的双语语料资源, 并运用各种技术对所搜集的信息进行加工、处理和完善, 以满足正确处理科技术语所满足的条件。对于个体软件而言, 可以利用翻译记忆机制, 不断地记录翻译过程中所得到新的翻译结果, 并实时地在后台进行整理归总, 动态地得出用于后继科技术语翻译所需的数据。事实上, 这一点已在一些翻译软件中初见端倪, 如翻译记忆软件Trandos、Transit等。

4.4 交叉领域中科技术语的处理

当今世界科技领域的发展已经不再是单纯的独立的发展, 跨学科、跨领域的研究或技术开发已经成为是不可忽略的一大趋势。原来应用于两个特定领域的由同一源语词语表达的术语很有可能在同一篇跨领域的科技文献中同时出现, 此时便有区分这些术语的必要。仍以上述elbow为例, 虽然在医学领域和机械领域可以进行不同的翻译, 但是, 在医疗器械中则有可能混合两种用法, 如一种医疗器械所要作用的位置与肘关节 (即elbow) 相关, 而同时这种医疗器械的某些构件之间的连接处也有可能被源语作者命名为elbow。当然这种情况较为少见, 但不可完全忽视。这种情况下, 可以尝试在相对较小范围内寻找与源语关联的特征词, 如可仅在一小段或一句中寻找。这样可以降低不同译语混淆的可能性。

综上所述, 基于平行语料库的科技术语翻译处理过程的实现可以用下图表示:

5. 所存在的问题:

同一领域中科技术语的特定用法和其一般用法的冲突问题。由于某些准技术术语来源于一般表达, 当在某一领域的科技文献中使用时很有可能出现这种情况:即, 该术语既有一般用法, 又有该领域的专门用法, 这时可能会使得具有一般用法的词也翻译成专门用法。如“tab”在机械领域的文献中可能用作上述“提攀”“拉环”等的意思, 同时也可能有“标签”的用法 (如在机器上贴的标签) , 如果忽略了这种基本用法, 势必会造成某些错误。而如果将一般用法也通过特征词加入到相关性数据库的话, 则可能会由于一般用法的特征词较多而在翻译中喧宾夺主, 从而大大降低该术语翻译的准确度。这一点还需要在构建科技术语相关性数据库时做进一步的考虑。

另外, 当前汉英平行语料库质量参差不齐, 构建语料库时所抽取的语料中对某些科技术语的翻译有很多尚不到位, 而且通过网络扩展和更新, 或加入更多的质量不均的语料, 从而使统计出的译法难免有失偏颇。

摘要:本文分析了英汉科技翻译中针对科技术语的翻译问题, 并提出了应用英汉平行语料库解决这些问题的方法。通过英汉平行语料库建立同一科技术语与不同科技领域之间的相关性数据库以及同一领域中科技术语之间的上下文相关性数据库, 并借助互联网等途径不断地对之进行动态更新, 从而为准确翻译科技术语提供有力的支持。

关键词:平行语料库,科技术语,英汉翻译,相关性,特征词

参考文献

[1]王思宽;基于规则和基于统计相结合的中英双语平行句对短语对齐方法[D].北京邮电大学, 2010.

[2]屈刚.英汉双语短语对齐[D].上海交通大学, 2007.

[3]孙乐, 金友兵, 杜林, 孙玉芳;平行语料库中双语术语词典的自动抽取[J].中文信息学报, 2000 (06) .

[4]张文静, 梁颖红.术语抽取技术研究[J].信息技术, 2008 (03) .

[5]张锋, 许云, 侯艳, 樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究.2005 (05) .

[6]石春让, 赵巍;科技术语翻译:归化是正途[J].山东外语教学.2010 (01) .

[7]刘超朋.平行语料库概述.燕山大学学报 (哲学社会科学版) , 2007 (S1) .

[8]廖七一.语料库与翻译研究[J].外语教学与研究, 2000 (05) .

[9]杨晓军.基于语料库翻译研究和译者教育[J].外语与外语教学, 2007 (10) .

[10]柏晓静, 常宝宝, 詹卫东, 吴拥华.构建大规模的汉英双语平行语料库[A].机器翻译研究进展——2002年全国机器翻译研讨会论文集[C].2002.

[11]李安兴.双语语料库与汉英词典词目翻译质量的进一步提高[D].复旦大学, 2005.

双语平行语料库 篇5

1 英汉红色文化平行语料库的构建

语料库 (corpus) 指经科学取样和加工的大规模电子文本库。借助计算机分析工具, 研究者可开展相关的语言理论及应用研究。语料库分为单语语料库、双语平行语料库和多语平行语料库。按照语料的采集单位, 语料库又可以分为语篇的、语句的、短语的。语料库最重要的特征是语料库中存放的是在语言的实际使用中真实出现过的语言材料。 (一) 红色文化语料的收集。目前, 国内尚未发现有英汉红色文化平行语料库。但已建有许多通用的大型英汉双语平行语料库。如北大的英汉平行语料库, 中科院软件所的英汉双语语料库, 绍兴文理学院的中国汉英平行语料库大世界等。平行语料库是在英语和汉语两种语言句对句之间建立很强的对应关系。每行中文都有一行英文与之对应。这对语言学习和翻译教学有很大的帮助。目前, 国内建有很多大型的红色文化网站。如红色文化网、中国红色文化研究院网、中国红色文化网、中国九源红色文化网、上杭红色文化网等。这些网站收录了大量的红色文化信息。将这些信息进行适当的分类、筛选、翻译、对齐、加工、标注, 就能建成一定规模的双语平行语料库。由于红色文化信息浩如烟海, 而所构建的语料库属于小型语料库。因此, 收集语料时主要遵循以下几个原则:1) 代表性。只选取红色文化中最重要、最精华的部分;2) 时代性。选取能够反映各个时期典型的、具有时代感的内容; (3) 实用性。选取对当前实际有应用价值的内容。根据以上原则, 最后确定语料库如下主题:红色人物, 红色故事, 红色地标, 红色事件, 红歌, 红书, 红色影像, 红色文物, 红色格言, 红色旅游, 红色精神。 (二) 红色文化语料的翻译。红色文化语料的翻译以翻译阐释学为理论根据, 译文在忠实原文的同时力求在形式风格上与原文保持一致, 并遵循以下原则:1) 人名的翻译。 (1) 按照汉语习惯音译。例如:毛泽东、朱德译成Mao Zedong, Zhu De, 这样比Zedong Mao, De Zhu显得更亲切。 (2) 意译。例如“小萝卜头”学文化译成Little Radish Head Learning Words。2) 地名的翻译。 (1) 完全音译。例如:井冈山革命博物馆Jinggangshan revolution museum。 (2) 完全意译。例如:清风楼 (邓小平旧址) 译成The wind tower (Deng Xiaoping's old site) 。 (3) 正文翻译方法。综合运用词类转译法、增补法、省译法、顺译法、逆译法、分译法、综合法、增益法等翻译技巧对原文进行翻译处理。 (三) 红色文化平行语料库的构建。英汉双语平行语料库的构建分为两部分:以电子文本形式存储于计算机的平行语料和检索这些语料的定位检索软件。1) 语料对齐。由于所建的语料库规模较小, 因此采用人工语料对齐方式。操作可直接在Word软件中进行。编辑完成后将语料保存为纯文本格式即可被语料库定位软件识别。语料对齐步骤:先将两种语言的文本分成句子, 每个句子占一行。顶格排列, 汉语在前, 英语在后。句子前面不得添加任何项目符号, 否则软件不能识别。句子的定义是以句号、问号、感叹号、分号结尾的一串字符。行的定义是一串以回车换行符结尾的字符。另外, 如果两种语言的文本在句子的切分上有差异, 应尽量保持原文句子不动, 调整译文以适应原文。2) 定位检索软件。定位检索软件选用免费绿色软件Hy Conc V3.9.8。该软件可对汉、英语料进行含有某个关键词语、多个关键词语的句子检索, 正则表达式检索, 替换。对多语平行语料检索, 可以检索一对一、一对多的平行语料, 可以检索任意对齐语料。

2 英汉红色文化平行语料库的应用

平行语料库是某种语言的原创文本和相应翻译成另一种文字的文本。可用来进行语言对比研究, 通过比较原文文本和译文文本在词汇、句子和文体上的差异, 读者能发现两个文本在词汇和结构上的对应关系。其最大特点是可以通过关键词英汉双向检索, 能提供大量英汉对照语言实例, 用途十分广泛。 (一) 在翻译理论与实践教学中的应用。通过关键词检索, 能对汉英对译、汉英双语搭配等进行全面调查。这对了解和掌握双语转换复杂而丰富的对应关系, 选择最佳翻译对等词, 丰富英语表达能力非常有益。各种翻译技巧, 如词类转译法、增补法、省译法、顺译法、逆译法、分译法、综合法、增益法等在该语料库中都能够找到具体实例。通过检索具体实例, 使学生亲身感受到各种翻译技巧的实际应用, 积累感性认识。1) 增译法:指根据英汉两种语言不同的思维方式、语言习惯和表达方式, 在翻译时增添一些词、短句或句子, 以便更准确地表达出原文所包含的意义。例1:我们应该谦虚, 谨慎, 戒骄, 戒躁, 全心全意地为人民服务。We should be modest and prudent, quit arrogant, quit rashness, and serve the people heart and soul.这里, 汉语没用连词而英语添加了连词“and”。2) 转换法:指翻译过程中为了使译文符合目标语的表述方式、方法和习惯而对原句中的词类、句型和语态等进行转换。例如:钱三强:威武不屈壮士心。Qian Sanqiang:A strong man’s heart can not be yielded by force。“威武”在汉语里做主语, 而译成英语时做宾语。语态从汉语句子的主动语态转换为英语句子的被动语态。3) 合并法:合并法是把若干个短句合并成一个长句。例如:人固有一死, 或重于泰山, 或轻于鸿毛。为人民利益而死, 就比泰山还重;替法西斯卖力, 替剥削人民和压迫人民的人去死, 就比鸿毛还轻。All men must die whether weightier than Mount Tai or lighter than a goose feather."To die for the interests of the people is weightier than Mount Tai;To work for the fascists and die for the exploiters and oppressors is lighter than a feather.这里, 汉语有八句, 在翻译时把短句合并为长句, 并成了三句。4) 拆分法:根据需要, 把一个句子拆分成若干个句子。例如:你们青年人朝气蓬勃。You young people, full of youthful spirit.5) 直译法:指译文仍然采用原文的表现手段, 句子结构和语序不作调整或不作大的调整。例如:世界是你们的, 也是我们的, 但是归根结底是你们的。The world is yours, as well as ours, but in the final analysis is yours.6) 意译法:指译文中采用新的等效的表现手段, 句子结构也有可能做较大的调整。例如:黄显声虎入笼中威不倒。Though imprisoned, Huang Xiansheng still powerful.这里的“虎入笼中”不能直译为“a tiger in the cage”, 而应该意译为“be imprisoned” (坐牢) 。7) 顺译法:指按照英语表达的层次顺序, 依次翻译英语句子, 从而使译文与英语原文的顺序基本一致。例如:下定决心, 不怕牺牲, 排除万难, 去争取胜利。Be resolute, fear no sacrifice and surmount every difficulty to win victory.8、逆译法:指先翻译全句的后部, 在依次向前逆序翻译前面的句子。例如:他不会因为虚度年华而悔恨, 也不会因为碌碌无为而羞愧。译成He will feel no torturing regrets for wasted years and nev er know the burning shame of a mean and petty past。这里先译句子后部的“悔恨和羞愧”, 然后再译前面的“虚度年华和碌碌无为”。 (二) 在对外宣传方面的应用。为外国人了解和学习中国红色文化提供一条有效的途径。外国人通过输入某个英文关键词, 便能够检索到相关的红色文化内容。例如:在英文搜索框中输入“The Red”, 便会出现相关红色文化主题的内容。

(三) 在德育方面的应用。爱国主义是社会主义核心价值观, 利用英汉红色文化平行语料库对大、中学生进行革命传统教育和爱国主义教育。例如, 在关键词框中输入“精神”一词, 便可得到所有有关红色精神的句子和对应译文。可以用来对学生开展红色精神教育。

3 结束语

文章介绍了一个小型的英汉红色文化平行语料库的构建方法及其主要应用。由于受到人力物力的制约, 该语料库还不够完善。如语料库的容量还不够大, 内容还不够丰富, 没有对语料进行详细标注等。随着时间的推移, 一定会有更好的英汉红色文化平行语料库出现。红色文化在语料库语言学中的应用也必将会更加深入广泛。

摘要:中国红色文化是一种宝贵的资源, 正在各个领域中不断地得到深度挖掘和利用。英汉红色文化语料库就是在红色文化与语料库语言学有机结合的产物。文章详细介绍了小型英汉红色文化语料库的构建过程及其主要应用。

关键词:英汉,红色文化,平行语料库,构建应用

参考文献

[1]谢家成.小型英汉平行语料库的建立与运用[J].长江大学外国语学院, 2004 (5) .

双语平行语料库 篇6

1 翻译教学模式与现状

在传统的翻译教学模式中, 教师一般先介绍翻译的理论, 在讲解翻译技巧时给学生大量的练习进行翻译实践, 尤其以练习单句为主。这种教学的缺点是, 第一, 学生对翻译理论认识不深;提及翻译理论或标准, 学生言必称“信达雅”, 或记得几位翻译家的名字, 其他则不甚了解, 更不用说形成自己的认识和看法。第二, 学生通过大量机械操练可以使掌握一些翻译技巧, 但不能很好的融会贯通。第三, 学生的整体篇章分析能力较差。许钧 (2000:3) 提出我国的翻译教学普遍存在的一些问题:第一, 翻译教学的指导思想认识模糊。第二, 翻译教学缺乏理论指导;第三, 翻译教材不统一, 内容比较陈旧;第四, 翻译教学队伍建设缺乏长期规划, 课程设置不够合理, 而且, 翻译课程的设置存在较大的随意性。

穆雷 (2004:26) 指出我国的翻译教学方法滞后, “大多数教师依然采用传统的讲评方法”, 这种翻译教学方法阻碍了学生个性发展, 学生对翻译理论的讲授觉得乏味无趣, 而在翻译实践方面又因为没能形成自己的认识而无从下手, 只能转向大量的机械式翻译练习。由于无从体会翻译课的乐趣, 实践动机便丧失殆尽。动机不存, 能力则不进。因此, “结果是翻译教学效率低下, 一些原本应该提高翻译能力的课程被上成熟练语言能力的后续课程, 教师疲惫不堪收效甚小, 学生也觉得兴趣不大”。

单一的教学模式导致课堂信息量小、教学节奏缓慢、学生主动性不高。鲍川运 (2009:45-46) 对于大学本科翻译教学的课程设计提出两个理念:一是建立以过程为基础的翻译教学规范, 二是建立操作性较强的翻译教学规范。基于该理念, 翻译人才培养模式应实现学生自主型的转化, 从传统的以教师为中心的讲评法转向以学生为中心的过程教学法。教师不是简单地告诉学生译文的对错, 使学生处于被动的听讲地位, 而是强调翻译是一个非直线性的、探索的生成过程。教师引导学生熟悉现实翻译市场中的操作流程, 学生通过译前分析, 收集翻译任务的相关背景资料、术语对照、平行文本采集等, 形成译文, 最后再做译后分析, 提高自身的翻译素养。通过培养学生的独立思考能力, 引发学生的参与意识, 提供参与机会, 解决翻译过程中产生的问题, 了解并熟知翻译过程, 从而提高教学质量。

翻译教学中, 应利用现代信息技术来提高翻译教学和培训的效率与质量。鼓励并指导学生善用网络资源, 如翻译网站、翻译软件、在线词典等;建立多学科翻译语料库、学习者个人语料库。因此, 引进语料库作为翻译教学平台是技术进步的必然结果。

2 基于语料库的翻译教学

2.1 创建双语平行语料库

建立自用语料库应以本地化为原则, 即服务于本地社会经济需求为主, 步骤包括语料库的设计、语料的选择和输入、语料的加工整理等流程。我国是一个统一的多民族国家, 少数民族人口占全国总人口的8.49%, 民族自治地方面积占我国国土总面积的64%;我国陆地边界线长2.2万公里, 其中1.9万公里在民族地区。少数民族文化是中华文化的重要组成部分。近年来, 伴随着民族文化走出去步伐的加快, 少数民族文化艺术在海外引起强烈反响, 深受各国观众喜爱, 为塑造我国良好的国际形象, 提升中华文化软实力做出了重大贡献。广西不仅是一个多民族地区, 还处于中国-东盟自由贸易区的核心区域。近年来, 随着广西对外开放的深入, 民族地区已从昔日对外开放的大后方变成最前沿, 成为展示广西形象的重要窗口之一。建设少数民族民俗文化双语平行语料库并以此为基础进行翻译教学, 能够方便地进行大规模广西少数民族民俗文化文献资料的查询、检索、统计和研究, 对翻译教学和翻译实践具有重大的历史和现实意义。创建步骤为:1) 确定语料库的规模和组成, 语料采样方法, 以保证语料库达到预期的效果;2) 收集汉英原始语料, 进行语料整理和语料加工, 即文本格式处理和文本描述;3) 实现双语语料之间的平行对齐, 根据语料库建设目的对语料进行标注等。

2.2 基于语料库的翻译教学应用

黎土旺 (2007:48) 指出, 与传统的翻译教学相比, 基于语料库的翻译教学具有文本电子化、学习直观化、分析多元化、结论科学化和成果有机化的特点和优势。语料库丰富的双语平行文本资源能够提供关于某一语言结构在不同语境下的大量译例。教师备课和使用者查阅资料可以节省大量时间, 并且通过对这些真实语境下的译例进行归纳和总结, 可消除传统翻译课堂教学中译例单一、缺乏真实性等弊端, 有助于提升教学时效性。学习者和使用者可直观地观察到不同语境中所采用的翻译策略, 培养其在推理和归纳方面更加优化的翻译技巧和能力。语料库不仅对翻译教学和翻译研究起到支撑作用, 而且对于从整体上进一步提高翻译课件的开发和使用以及教室网络环境的建设可以使教学手段的多样化。总之, 研制语料库教学平台使学生在翻译学习方面不在局限于课堂之中。信息技术辅助翻译教学是课堂教学的自然延伸, 有助于学生自主学习和交互式教学活动的深入。

2.3 基于语料库的翻译教学内容

在翻译教学中应用语料库和检索工具, 具有其他教科书和工具书不可替代的优势。与汉英词典和英汉词典相比, 平行语料库的语料内容广、语料新、语境丰富, 而且检索功能强大, 能对双语对译、双语搭配等进行全面调查, 有助于揭示双语转换复杂而丰富的对应关系, 为学生选择译语表达手段提供量化等级概念 (倪传斌, 刘治, 2005:25) 。因此, 语料库的应用能为学生提供丰富的电子资源, 有效地促进学生的学习。王克非 (2004) 曾提出双语平行语料库可用于翻译教学:1) 对某一检索词或短语提供丰富多样的双语对译样例;2) 对常用结构提供多种双语对译样例, 供讲授者讲解, 学习者仿习;3) 提供丰富的可随机提取的一本多译作为对照参考。不仅如此, 以文化为主题的语料库为平台, 还可以将文化语境纳入语料库研究方法的视野, 通过语料库来探究文化语境带给目标语的语言变化, 翻译研究中的对比模式因为少数民族的身份和文化差异, 使得翻译结果等更复杂一些。此外, 还可以进一步加强翻译教学的实证性和跨学科性两个方面。将语言现象与社会、文化、认知等因素紧密结合, 从社会和文化等视角探究解释这些翻译行为。

3 结论

在全球化时代背景下, 区域地方经济社会发展需要各种人才的支持。复合型、应用型翻译人才的紧缺已成为不争的事实, 为适应改革开放和经济建设对翻译人才的多方面需求, 翻译教学需革新方法和模式, 这也是高校在社会发展的同时谋求自身的发展的动力。教学方法是教师为教学目标而采用的一种实际实行的程序。语料库翻译教学可以全面提高学生的综合能力, 因此, 在翻译教学实践中合理、科学地进行改革, 将提高学生的专业素质与翻译技能以适应社会的需要。双语平行语料库的研制对翻译教学和翻译研究起到支撑作用。对于从整体上进一步提高高校翻译教学水平, 培养出更加适合地方需要的翻译人才, 进一步加强社会服务功能, 以及构建整个区域国际化教学, 都将产生积极的意义。

摘要:随着语料库技术的发展, 以语料库为新的研究范式进入翻译教学和实践领域。在审视当前翻译教学现状后, 从自建少数民族民俗文化双语平行语料库、翻译教学应用和翻译教学内容方面探讨平行语料库在当前翻译教学中的运用, 旨在推动翻译教学改革, 以期适应区域社会经济发展的需求。

关键词:语料库,翻译教学,教学改革,教学模式

参考文献

[1]鲍川运.翻译师资培训:翻译教学成功的关键[J].中国翻译, 2009 (2) .

[2]何安平.谈语料库研究[J].外国语, 1997 (5) .

[3]胡开宝.语料库翻译学概论[M].上海交通大学出版社, 2011.

[4]黎土旺.语料库与翻译教学[J].中国科技翻译, 2007 (8) .

[5]穆雷.翻译教学发展的路径[J].中国翻译, 2004 (5) .

[6]倪传斌, 刘治.语料库数据驱动技术在科技翻译教学中的应用[J].中国科技翻译, 2005 (6) .

[7]王克非.双语平行语料库在翻译教学上的用途[J].外语电化教学, 2004 (12) .

双语平行语料库 篇7

词义的理解是翻译的最基本最重要的一步, 有时候难的词用法并不难, 往往越简单的词越难翻译, 基本义和引申义不少, 词义相当灵活, 只有通过上下文, 也就是语境才能理解其词义。“词本无义, 义随人生”。该文通过绍兴文理学院的《京华烟云》平行语料库来进行检索, 以man为例, 探究语境是如何影响词义的选择。平行语料库 (即某类语料库包含源语文本及其与之平行的译语文本) 的产生, 为翻译研究提供新的视野和角度, 从规定性向描写性转换, 如Bell所说, 在分析译文的过程中, 可以发现翻译过程中特定因素及系统性关联, 从而更好地探讨译者行为。[1]平行语料库可提供更丰富的语料、更具体的上下文语境, 还可以更便捷地检索平行句子, 便于研究者观察。

2 纽马克的语境说

自英国人类学家马林诺夫斯基 (Bronislaw Malinowiski) 提出“语境”概念后, 并将其分为文化语境 (context of culture) 和情景语境 (context of situation) , 学者对于语境概念进行更加深入的研究和探讨。翻译理论家纽马克在其著作A Textbook of Translation中提出了四种语境:“I am not suggesting you translate isolated words.You translate words that are more or less linguistically, referentially, culturally and subjectively influenced in their meaning, words conditioned by a certain linguistic, referential, cultural and personal context.”[2]以下就此四种语境来分析Moment in Peking两个中文译本man的词义选择。

3 关于man翻译的语境维度

林语堂英文小说Moment in Peking (中文译名《京华烟云》或《瞬息京华》) 在西方文坛引起极大的反响, 被中国学者誉为英文的《红楼梦》。该书于1938年至1939年写于巴黎, 以义和团运动和抗日战争期间30多年为宏大的历史背景, 主人公姚木兰的命运为线索, 描写了北平曾、姚、牛三大家族的兴衰及恩怨情仇。书中涉及中国文化的方方面面, 是西方人了解中国的一扇窗口, 也为研究者提供了丰富的语料。绍兴文理学院《京华烟云》的平行语料库收录了林语堂的英语原著Moment in Peking及张振玉的汉语译本《京华烟云》和郁飞的汉语译本《瞬息京华》, 共检索出关于man的427个例子, 下面就从语言语境、文化语境、个人语境及文本语境进行分析。 (为了行文方便, Moment指代林语堂Moment in Peking一书。)

3.1 语言语境 (linguistic context)

纽马克所指的语言语境包括了词的搭配 (占了90%) , 语用及语体。[3]

3.1.1 搭配语境

根据牛津词典的定义, 搭配意为“the fact of two or more words often being used together, in a way that happens more frequently than would happen by chance”.[4]换而言之, 就是习以为常的搭配, 并非出自偶然性, 英汉两种语言习惯搭配就有很大的区别。以下几个例子中, man都能翻译成“人”, 但在中文里有更丰富的表达方式, 如the common man (平民百姓) , deceased man (死者) , righteous man (正人君子) , old man (老翁、老先生、老者) 。

3.1.2 语用语境

从语用角度来说, 要明白说话人的目的和语气, 了解其暗含意思。如:

例1 The students looked upon that thin, short, and wellsmoked man with prodigious respect. (Book113E011)

学生对这个又矮又瘦的烟鬼十分尊敬。 (Book113Y011)

例2 He worked the girl to a pitch of burning hatred for the young man and deep sympathy for His daughter. (Book222E193)

他说得那个女子对那恶棍满腔怒火, 而对他的女儿深切同情。 (Book222Y193)

富商鼓其如簧之舌, 终使此青楼艳妓, 对牛家无赖, 怒火如焚, 对富商之女同情万分。

(Book222Z193)

例3 When Yuan died, he publicly and privately denounced Yuan as an ambitious old man who did not know the spirit of the times and"the forces of democracy." (Book335E268)

袁世凯死后他在公开场合和私下里都抨击袁是个野心勃勃的老朽, 不知道时代精神和“民主的力量。” (Book335Y268)

袁世凯一死, 怀瑜不管是在公开或私下, 他都对袁责骂, 说他是个野心勃勃的老贼, 既不懂得时代精神, 又昧于“民主势力”。 (Book335Z268)

这三个例子对man的翻译带有一定的感情色彩, 从前后事情的发展来判断其语用意义。“鬼”带有对人的蔑称, 此人外貌招人嫌, 但学生却对他尊敬有加。“恶棍”或“无赖”表明了富商和义妓对玩弄感情的牛家浪子的憎恨。“老朽”“老贼”都表示怀玉 (怀瑜) 对袁世凯的不满。

3.1.3 语体语境

一般来说, 语体分为正式和非正式两种, 如对于old man的翻译, 除了考虑说话人的态度身份, 还要考虑其语体特征。对话中词汇一般比较口语化, 如:

例4“Has that old man turned up again?”Taiyun asked. (Book343E551)

黛云问:“那老东西露过面没有?” (Book343Y551)

黛云问:“那老东西又来了吗?” (Book343Z551)

而其他叙述部分对old man的翻译比较书面化, 如:

例5 She passed cities and hamlets and towers and temples on hilltops on the bank and was approaching a bridge when she saw an old man trudging on the bridge, and recognized him as her husband. (Book102E318)

她经过沿岸的城镇和村落, 山顶上的宝塔和庙宇, 临近一座桥时看到桥上有位老者蹒跚而行, 认出是她丈夫。 (Book102Y318)

她经过了城镇、村庄、山顶的佛塔, 正漂近一座桥时, 看见一个老翁在桥上疲惫而行, 一看, 原来是自己的丈夫。 (Book102Z318)

例6 He was a soft-voiced old man, with a flowing white beard, and he was now holding in his mouth a pipe two feet long. (Book110E208)

这位老先生声气柔和, 白髯飘飘, 手捧嘴上一根两尺来长的烟管。 (Book110Y208)

他这个老人说话声音温和, 胡子飘飘然, 现在嘴里抽着旱烟袋, 有二尺长。 (Book110Y208)

在Moment的译本中, 除了纽马克所述, 还包括语义语境。从上下文选择不同的语义, 如可表示泛称的人或指代前面提及的人;与女性相对而言, 译为“男子、男人”或大丈夫;表示亲属关系的有可译为丈夫 (男人) 、婆家、儿子等;表示手下的士兵或仆人。这些语义、搭配、语用和语体语境并不是一个个割裂独立, 往往是交叉作用来共同决定。

3.2 文化语境 (cultural context)

文化涉及某一群体特定的思维方式和行为。Moment的书写背景置于民国时期, 曾、姚、牛三大家族为大户人家, 旧有的文化依然存在。同时处于新旧时期, 义和团运动、袁世凯篡国、军阀割据混战、五四运动、三一八惨案, 等等, 具有一定的历史性, 郁译及张译中都体现了man的文化语境。

例7 But they tacitly assumed that her parents would not engage her to any other young man without speaking to them first. (Book112E005)

但是他们料想木兰的父母若要把她许配给别家的少爷不会不事先对他们说起。

(Book112Y005)

例8 Before she got up again to carry the corpse, she sighed and said to her husband, “My good man, next time you go out to cure a patient, you should pick a thin one!” (Book116E518)

她起身再抬死尸之前叹口气对丈夫说:“良人啊, 下回你去看病人, 千万挑个瘦点的!”

(Book116Y518)

例9 Soon the man was able to bring to him a member of the gang. (Book103E337)

掌柜的很快带来一个帮中人。 (Book103Y337)

例10 The man pleaded that he also had seen the posters, but had no knowledge of the child’s whereabouts or whether she was held by their gang at all. (Book103E340)

那个头目说看到过告白, 但是不知孩子在何处, 也不知她是否在本帮手里。 (Book103Y340)

少爷, 指旧时官宦或大户人家的子弟;良人, 古代用于夫妻之间互称, 后主要为妻子称呼丈夫。后面两例中的man都是指代前面所提到的人, 掌柜是古代对店主的俗称, 头目意为部落或集团中的首脑 (含贬义) , 都是旧称, 符合当时的文化及时代背景。

3.3 个人语境 (personal context)

作家都有自己个人的风格 (idiolect) , 尤其个人特殊的言语方式, 使用特定的词汇或搭配。

郁飞的译本更符合地道的京话, 如译成“爷们”在整本小说中共出现14处, 而张振玉没有选择这类词汇。示例如下:

例11“You are a man, and this is a domestic affair, that is why he hasn’t told you, ”replied the Mother. (Book110E175)

“你是爷们。这是家务事, 所以他没有告诉你。”他太太答道。 (Book110Y175)

太太说:“你是个男人, 这是家里的事, 所以他没跟你说。” (Book110Z175)

例12 The men talked in whispers, if at all, each occupied with his own thoughts. (Book233E709)

爷们各有心思, 偶尔开口也是悄悄的。 (Book233Y709)

男人们若说话, 也是压低了声音, 各有心思占据心头。 (Book233Z709)

3.4 文本类型语境 (referential context)

纽马克提出词汇意义选择与文本的话题有关。[5]科技文献有其特有的词汇, 同一个词在不同的学科领域含义也各不相同。Man如果出现在科技文献中, 其含义通常为人类或男性, 客观陈述, 不带主观感情色彩。而《京华烟云》为小说类, man的含义就非常的丰富, 有十几种大类。如:男子、男人、男仆、儿子、大丈夫、恶棍、鬼子, 等等, 具备一定的语体、感情色彩, 时代和文化特征。

4 结束语

《京华烟云》平行语料库为研究选词提供更广阔的语境, 词本身不能独立存在, 其意义要在上下文、文内及文外、才得以彰显。通过平行语料库观察man的含义, 可以更加全面、深入了解作品, 甚至译者的偏好与风格。Baker说, “语料库技术在翻译研究中最关键的任务是阐释译语 (作为语际交际媒介) 的本质。”“可以理解翻译是什么, 翻译又是如何进行的”。[6]

参考文献

[1]Bell Roger T.Translation and Translating:Theory and Practice[M].London:Longman, 1991:39.

[2]Newmark Peter.A Textbook of Translation[M].Shanghai:Shanghai Foreign Language Education Press, 2007:193.

[3]Ibid.

[4]霍恩比.牛津高阶英汉双解词典[M].6版.北京:商务印书馆, 2004:317.

[5]Ibid.

上一篇:计量标准下一篇:大学萨克斯教学