语料库与机器翻译

2024-12-25

语料库与机器翻译(精选12篇)

语料库与机器翻译 篇1

摘要:本文介绍了翻译教学语料库平台的设计与构建, 并着重探讨了语料库应用于翻译教学实践具体操作模式:基于整合翻译课程群资源, 实现师生教学互动的原则, 创建英汉双语翻译语料库系统平台, 该平台由两大模块构成:一是便于教师备课和研究的教师教学研究平行语料库, 所采集的语料集权威性、代表性、开放性为一体, 二是学生习作平行语料库, 学生可以通过该模块自主学习, 教师亦可以此为平台讲评作业。该语料库平台可应用于翻译实训, 以及服务于诸如研究译者风格等更深层次的翻译研究。

关键词:语料库,翻译教学,翻译研究

1 引言

当今的翻译研究已经超越了单纯语言研究的范畴, 成为跨学科的、兼容并包的综合研究学科, 而语料库技术的引入使得翻译研究走向更加科学的轨道。翻译研究者期待一个解决翻译实践问题的科学工具, 这个科学的工具就是翻译研究语料库。 (罗选民、董娜、黎土旺, 2005) 自1993年英国学者Mona Baker将语料库研究方法引入翻译研究以来, 语料库用于翻译和翻译教学的研究始终没有间断。国内语料库翻译研究与国外同时起步, 研究内容涉及语料库翻译研究方法、语料库建设及应用、机器翻译、翻译教学和翻译普遍性的理论研究。在语料库用于翻译教学方面, 现有成果包括王克非通过语料呈现实验探讨双语对应语料库翻译教学平台的应用效果 (王克非, 2004) 和一些学者利用自建小型语料库进行的实证研究。这些研究证明, 语料库对于提高学生翻译意识和学生译文质量有一定作用, 但是, 这些研究对于理论的探讨远远超过对翻译教学的实践探讨, 所以, 如何将语料库技术应用于翻译教学实践, 仍然是一个值得深入研究的问题。

2 创建目的

本文介绍的翻译教学语料库平台是教育部中央高校基本科研业务费专项资金青年教师计划项目资助下建设的整合翻译课程群教学资源, 实现翻译教师之间资源共享并将之运用于不同翻译课程教学实践的英汉双语翻译语料库系统平台。Baker认为与翻译有关的语料库有三类:平行语料库、可比语料库和多语语料库。平行语料库中的“平行”指的是某种语言的原创文本和另一种文字的翻译文本之间的平行, 用于探索的是同一内容不同的语言形式, 为研究一种语言所包含的意思如何转换成另一种语言提供了借鉴, 但不可否认的是, 平行语料库中的译文会不可避免地带有“翻译腔”;可比语料库的“可比”指的是某种语言的原文文本和从其他语言翻译成该种语言的文本之间的对比。本文所介绍的语料库属于英汉双语平行语料库, 从语言转化类型上来看, 主要分为英译汉模块和汉译英模块。

创建这一语料库平台的目的有四:一是实现教师备课资源的整合与共享。翻译课程群涉及英汉互译基础课程、英汉互译高级课程、翻译概论课程和翻译集中实训课程。各门课程任课教师不同, 而教学内容有交叉重合部分, 利用语料库平台备课可以有效避免重复教学。二是为教师提供翻译研究的素材。任何一门翻译课程的任课教师都可以在任何时间把比较理想的翻译素材输入开放式语料库平台中, 因为可以资源共享, 每位教师在备课或做研究时都可随时调用。三是实现学生作业网上提交, 并利用语料库技术自动生成句级对应, 每句原文对应多个学生译文, 方便教师发现典型问题, 对翻译作业进行有针对性的讲评。四是方便翻译集中实训课程的展开, 实现学生合作学习。

为了实现设想的目标, 参与该项目的教师搜索了大量文献资料, 跟踪国内外相关研究进展, 精心设计, 不断讨论、改进, 在济南卓金信息技术有限公司的技术支持下, 初步建成了“英汉双语翻译语料库系统”平台。下面就该语料库平台的设计原则进行简要介绍。

3 设计原则

语料库平台的设计是其创建过程中最关键的一步, 因为这一步直接影响到平台的科学性、适用性和目标实现的可能性。具体来说, 在建库之间, 应明确语料库的分类与规模、语料的采集与整理。本文研究的主要是翻译语料库如何应用于教学实践, 因此除了教师平台之外, 应充分考虑学生平台设计的实用性, 做到界面友好、信息量充足、趣味性强, 尽可能吸引学生利用此平台自主学习。根据教学与研究需要, 对语料库平台的设计主要提出了六项原则:

(1) 语料库平台首先是一个网络平台, 服务于翻译课程群所有任课教师。

(2) 语料库平台要促进教师协作, 帮助打造一支高水平翻译教学团队。

(3) 语料库平台要为翻译课程群的教学改革提供新视野、新方法。

(4) 语料库设计既要满足教师备课与研究需要, 还要能用于师生互动的教学实践。

(5) 语料库设计保持开放式, 保证翻译教学与研究语料的时效性。

(6) 语料库平台不仅为翻译集中实训提供材料, 也提供学生合作学习平台。

4 平台构成

语料库实际上只是语料的存储文库, 只有服务于一定的目的时, 才具有真正的价值。正如Hunston所言:“语料库本身并不包含和语言相关的新信息, 但基于语料库的检索引擎给我们提供了观测旧信息的新视角。” (Hunston, 2002:3) 本项目的语料库平台基于其服务目的拟分为两部分:教师教学研究平行语料库和学生翻译习作平行语料库。

(1) 教师教学研究平行语料库:根据翻译课程组各门课程的不同需要分为涉及翻译理论与实践的四个模块:句子模块、句群模块、篇章模块和翻译鉴赏模块。句子模块直接是双语一对一对齐, 而句群、篇章和鉴赏模块既可以一对一对齐, 也可以一对多对齐。对应的译文多数是公开发表的译文, 也有少数没有现成译文的文本, 则由课程组教师讨论出一个参考译文。每个模块都下设英汉翻译和汉英翻译两个子模块, 每个模块都设有不同检索条目, 可进行多途径检索, 便于教师备课和研究。

(2) 学生翻译习作平行语料库:根据翻译课程群不同课程教师的需要分为八个模块:英译汉基础模块、汉译英基础模块、翻译概论模块、高级英汉笔译模块、高级汉英笔译模块、翻译鉴赏模块、集中翻译实训模块和其它翻译课程模块。教师可根据具体课程需要在平台上布置作业, 学生在线提交。教师把学生提交的作业进行简单整理, 把发现的典型问题进行综合, 到课堂上集中演示给学生, 提高作业讲评效率, 改善教学效果。

该语料库平台的构成如图表1所示:

5 语料采集

(1) 采集范围

语料库的语料采集范围包括互联网、翻译类教科书、翻译公司可公开素材以及博物馆、旅游区等有双语语料的地方。根据语料库的设计, 语料分为句子、句群和篇章模块。各类语料又分为英译汉和汉译英两种。

(2) 语料的代表性

采集的语料要求具有代表性, 即能代表某种翻译技巧的使用, 属于某个特别的题材或体裁, 或者可以作为某个翻译理论流派的案例。另外, 语料还要符合具体课程的教学需要。语料主题要求丰富多样, 既有文学文本, 也有不同领域的实用文本。以句群库为例, 系统平台的界面如下图所示:

需要特别指出的是, 为了确保语料库语料的代表性, 采集语料时要确保语料没有语言问题, 原文一般容易做到这点, 但照搬译文往往会有各种问题, 因此, 语料采集者需要对译文进行审校, 必要时可能还需要重新翻译。为确保重新翻译的译文具有权威性, 项目组教师需要集体对译文进行讨论, 直至没有问题, 才能录入。在教学与研究过程中, 如果发现某些语料还有改进的余地, 仍可以对已录入语料进行编辑, 这种开放式语料库能保证语料始终具有代表性。

6 深度开发

语料库平台在基本满足教学研究需要的同时, 在应用过程中还涉及进一步的深度开发问题。就目前的情况看, 该平台的深度开发主要涉及三个方面:翻译实训、学生习作和翻译研究。

(1) 翻译实训

翻译实训是在学生掌握一定翻译理论和技巧的基础上, 通过集中翻译实践, 将学生的英汉语知识转化为翻译能力。这种转换需要通过大量的翻译实践来实现。

最早进行翻译实训的是晚清时期的京师同文馆。同文馆设立之初以培养外语翻译, 洋务人才为目的。在同文馆的八年课程计划中, 翻译课程占据着重要地位, 如图3所示。

从同文馆的课程设置可以看到, 学生从第二年开始进行翻译实训, 从翻译条子到翻译选编到翻译公文再到译书, 循序渐进, 最终培养出一大批优秀的外事人才。特殊历史环境下的教学模式无法复制, 但对今天的翻译教学却有着很强的借鉴意义。这种借鉴意义体现在大量翻译实训对人才培养的至关重要的作用。

以学生身份连续七年进行翻译实训已经不可能, 但是今天, 利用实训学期 (夏季小学期) 进行翻译集中实训还是可以做到的, 这种实训可能只是短短的几周, 但如果设计合理, 还是有成效的。而且, 计算机技术的迅猛发展也为翻译实训提供了助力。目前在国内外已经有多家公司对翻译教学软件进行了开发和推广, 其中不乏翻译实训的设计, 例如东方雅信和传神公司的翻译教学系统都考虑到了实训的需要, 但是其设计比较复杂, 成本也比较高。本项目的翻译实训模块是基于整合各类翻译教学资源的目的, 更好地服务于本校的教学实际, 即一方面要能够调用现有平台语料库的语料, 方便教师备课, 另一方面要在几周的集中翻译实训中, 让学生了解在岗翻译的基本流程, 进行团队合作翻译。

目前该翻译实训模块已具备初步框架, 还需要进行深度开发, 并在翻译实训中经受检验。

(2) 学生习作

“翻译练习的布置与管理是翻译教学中容易被人忽视的问题。” (穆雷, 2004) 而对于翻译课程而言, 翻译练习是掌握相关知识的唯一捷径。在传统的翻译教学中, 教师一般每次课后都要布置翻译练习, 并且多数教师会对学生每次的翻译习作进行批改。如果教师教授的学生人数多, 教师批作业的负担就会很重。批阅之后再进行总结分析准备讲评, 教师的备课量会很大。要解决这个问题, 在语料库平台中设计一个学生翻译习作平行语料库模块很有必要。

该语料库平台的设计使所有教师都可以布置自己所授课程的作业, 而这些作业的来源是不断充实的语料库语料。学生网上提交作业到系统平台, 教师根据实际情况选择全部批阅或抽查部分作业, 选取有代表性的作业一对多双语导出, 作业情况显示在同一个界面上, 便于教师进行对比分析和讲评, 发现学生规律性的错误。学生提交后教师看到的界面如图表4所示:

学生进行翻译作业网上提交, 一方面方便了教师备课和讲评, 另一方面, 系统会自动保存学生习作, 形成学生习作语料库。习作语料除了用于讲评之外, 还可用于教师进行翻译研究, 但以怎样的方式研究仍然是一个值得深入探讨的问题。

另外, 布置的翻译练习如果是句子或句群, 教师操作起来会比较容易。但如果是篇章, 就要考虑句级或段级对齐。目前该语料库平台设计中, 教师需要事先将语篇按句或段布置作业。如果以语篇为单位布置, 那么学生也只能以语篇为单位提交。如何能在语篇导出时实现句级或段级一对多对齐还是需要进一步研究解决的问题。

(3) 翻译研究

随着越来越多单语、双语和多语语料库的建设, 翻译的语料库研究日益受到学者重视。这些人们实际使用过的、有代表性的大量真实翻译语料为研究者提供了广阔的翻译研究空间。研究者可以利用翻译语料库探讨各类翻译相关问题, 比如翻译文本的性质、译者的风格、源语对目的语的影响以及翻译实践中“作者——译者——读者”三者之间的互动关系。 (罗选民、董娜、黎土旺, 2005) 英国学者梅芙·奥罗汉在《翻译研究语料库入门》 (Introducing Corpora in Translation Studies) 中重点介绍了两种适于翻译研究的语料库:平行语料库和可比语料库。国内英汉双语平行语料库建设与研究已经取得一定成果, 比如北京外国语大学中国外语教育与研究中心建立了通用汉英平行语料库, 北京大学计算语言学研究所同中国科学院计算技术研究所、清华大学智能技术国家重点实验室联合开发了汉英双语平行语料库, 上海交大建立了莎士比亚戏剧英汉平行语料库 (胡开宝、邹颂兵, 2009) , 燕山大学建立了《红楼梦》中英文语料库 (刘泽权, 2010) 。这些比较大型的语料库使学者的研究从规约性转向描写性, 在语言对比 (包括词汇、句子和文体差异方面) 、译者风格研究和文化阐释方面都有了新突破。

本课题建设的英汉双语平行语料库属于明确服务于翻译教学的语料库, 在翻译研究方面的利用价值还有待于进一步研究开发。从目前的建设情况看, 要进行翻译研究, 还需要补充大量语料, 并对语料进行适当标注。在语料充足的情况下, 可以考虑基于语料库的翻译教材编写, 翻译试题库建设, 学习者翻译问题研究, 英汉语言转换研究, 译本比较研究和译者风格研究。

7 结语

本文从创建目的、设计原则、平台构成、语料采集和深度开发六方面对翻译教学语料库平台的设计和构建进行了介绍。目前平台建设已经初步完成并投入试运行。在运行过程中, 课题组在不断发现问题、解决问题, 努力使翻译教学语料库平台更好地服务于教学一线, 同时也在积极思考如何使其在翻译研究方面提供更多方向与途径。

参考文献

[1]Baker, Mona.Corpus linguistics and translation studies:Implications and applications[A].In M.Baker, G.Francis, E.Tognini-Bonelli&J.M.Sinclair (eds.) Text and Technology:In Honour of John Sinclair[C].Philadelphia:J.Benjamins, 1993.

[2]Hunston, Susan.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press, 2003.

[3]Maeve, Olohan.Introducing Corpora in Translation Studies[M].London and New York Routledge Taylor&Francis Group, 2004:25, 35

[4]毕乃德.洋务学堂[M].杭州:杭州大学出版社, 1993.

[5]胡开宝, 邹颂兵.莎士比亚戏剧英汉平行语料库的创建和应用[J].外语研究, 2009 (5) .

[6]穆雷.中国翻译教学研究[M].上海外语教育出版社, 2004:85-86.

[7]罗选民, 董娜, 黎土旺.语料库与翻译研究——兼评Maeve Olohan的《翻译研究语料库入门》[J].外语与外语教学, 2005 (12) :52-56.

[8]刘泽权.《红楼梦》中英文语料库的创建及应用研究[M].光明日报出版社, 2010 (5) .

[9]王克非.新型双语对应语料库的设计与构建[J].中国翻译, 2004 (6) :73-75.

语料库与机器翻译 篇2

基于语料库的东盟博览会翻译研究

语料库不仅为翻译研究提供了新的工具,而且扩展了翻译的研究范围,提出了新的研究思路.本文从翻译语料库对翻译研究的重要意义入手,重点介绍了基于自建的中国东盟博览会平行语料库的翻译批评研究,通过Antconc、Wordsmith等语料库软件分析得到中文文本和英文文本这两者的.词频、字数、词汇类别等信息进行双语间的比较,找出两种语言文本的差别,以及其中的翻译现象.作者认为基于语料库的翻译批评方法不仅有助于在整体上比较客观地把握文本,而且提出了新的研究思路.

作 者:何正国 连建峰 史忠志  作者单位:何正国,连建峰(广西大学,外国语学院)

史忠志(广西大学,新闻传播学院,广西,南宁,530004)

刊 名:文教资料 英文刊名:DATA OF CULTURE AND EDUCATION 年,卷(期): “”(14) 分类号:H3 关键词:东盟博览会   平行语料库   翻译批评   文本  

语料库与机器翻译 篇3

【关键词】语料库翻译学 翻译共性 译者风格

从1993年Mona Baker 发表《语料库语言学与翻译研究:启示和应用》,到2014年,语料库翻译学已经走过了22个年头。国内语料库翻译研究,几乎和国外同时起步,始于1993年杨惠中教授发表的《语料库语言学与机器翻译》。近些年关于语料库翻译学的专著和论文如雨后春笋般涌现,国家社科基金和教育部人文社科基金对该领域的研究也进行了倾斜,除此之外,大量的学术会议也以此为主题召开。鉴于语料库翻译学如此快速的发展,对其发展脉络进行梳理和分析就显得尤为重要。因此,本文统计了22年来(1993-2014)中国知网收录的外语核心期刊中以“语料库+翻译学”为主题的共143篇论文,并对论文主题进行了归类整理。

一、翻译共性研究

翻译共性,又称翻译普遍性或翻译普遍性特征,是指翻译语言,相对于原创语言而言,在整体上表现出来的一些规律性语言特征。近些年来,对翻译共性的讨论主要有简化、显化、隐化、范化、集中化、整齐化、非典型搭配等。

基于语料库的翻译共性的相关研究大多集中于对显化、隐化、简化和范化等翻译共性的实证研究上,尤其是显化研究。胡开宝、朱一凡对莎士比亚戏剧《哈姆雷特》梁实秋译本和朱生毫译本中的显化进行了定量分析。王克非和胡显耀对汉语翻译文学语料和汉语原创文学语料进行对比分析,探讨汉语翻译文学作品在人称代词使用方面是否存在显化优势。

二、翻译语言的词汇、句法特征研究

词汇应用的总体特征可以通过类符/形符比、词汇密度和高频词的相关数据来分析。如王克非、胡显耀基于北京外国语大学通用汉英对应语料库,从类符/形符比、词汇密度和高频词的使用等角度对译自英语的翻译汉语和原创汉语的词汇使用特征进行比较分析。

翻译语言的句法特征可以从句法总体特征和典型语句结构的应用特征两个层面来理解。句法的总体特征包括翻译文本的平均句长、平均句段长、结构容量、简单句和复杂句的使用频率等。如秦洪武基于英汉多译本翻译语料库,重点分析了“介词…方位词”和“指示代词…名词”的结构容量。典型语句结构是指目的语言所特有或受原语语言影响而频繁应用的目的语语句结构。胡显耀、曾佳利用汉语翻译小说语料库,分析了汉语翻译小说中“被”字句的使用频率和结构。

三、译者风格研究

根据Baker的观点,译者风格是指“留在文本中的一系列语言及非语言的个性特征”。近年来,国内学者也开始将视线投向基于语料库的译者风格研究,并如火如荼地进行研究。王青、刘莉通过对比萧乾与金隄的《尤利西斯》汉译本,结合萧乾的汉语原创作品,对《尤利西斯》汉译本体现的译者词汇型式化风格进行研究,旨在探索把译者风格从原作者风格和所谓的“翻译腔”中有效识别出来的语料库途径。

四、翻译教学研究

语料库在翻译教学中的应用主要表现在两方面:一是利用语料库加强翻译课堂互动,提高课堂教学效果,建立基于语料库的翻译教学模式;二是利用双语语料库编写翻译教材,实现翻译教材编写理念和方法的创新。在国内,基于语料库的翻译教学模式的研究也取得了一些进展。余军、王朝晖讨论了教学型语料库的构建及其在翻译教学中的应用,认为应结合翻译课程具体的教学法以及相应的教学步骤,以学生为中心进行教学型语料库的构建与应用。

五、口译研究

国内基于语料库的口译研究开始于2007年,在这一年,胡开宝、吴勇和陶庆分析了基于语料库的口译研究所面临的困难及其重要性。但学者依然克服种种困难,建设并应用了一些口译语料库,开展基于语料库的口译研究并取得了一定的进展。研究主要集中于口译语言特征研究以及口译规范研究。潘峰、胡开宝基于自建的汉英会议口译语料库,对汉英会议口译中some的应用进行了研究。

六、存在的问题

1.语料库翻译学在技术层面上存有问题.语料库建设的高技术要求以及语料的代表性和收录标准问题,是目前国内建成的用于翻译研究的平行语料库数量较少的重要原因所在。虽然语料库的运用,使翻译研究显得十分科学、客观,但在选择译本过程中,很难避免直觉的判断。

2.研究方法上存在一定的缺陷。语料库翻译研究主要采用语料库方法和定量分析法,可以使研究建立在严密的数据分析的基础之上,使研究结论更具科学性。但目前大多数翻译领域的定量研究多限于词频和平均句长等数据的分析,这种相对初级的定量分析对翻译规律的解释力明显不足,而且一味强调量化分析。

本文对 1993—2014年间国内语料库翻译学的研究成果进行了梳理,清晰呈现了语料库翻译学的主要研究内容。国内语料库翻译研究在数量上已经有了很大的发展,在语料库翻译理论和实证研究上都取得了一定的成果,但还在技术方面、研究方法以及研究的广度和深度上存在一定的局限。总体而言,国内语料库翻译研究目前还处于发展的初级阶段,今后语料库翻译研究者还有很长的路要走,但在现在这个大数据时代,语料库翻译学这一全新的研究范式将进一步成为翻译研究的主流,凸显其优势。

参考文献:

[1]胡开宝.语料库翻译学:内涵与意义[J].外国语,2012(5).

语料库翻译学研究述评 篇4

语料库翻译学是指在语料库的基础上,以真实的翻译语料或者双语语料为研究文本,以理论分析和数据统计为研究方法,根据文学、语言学和翻译学理论,分析翻译过程、翻译本质和翻译现象的翻译学中的新兴分支学科。Laviosa(1998)认为语料库翻译学是“一种全面的、连贯而丰富的研究模式,该模式涉及了翻译理论、翻译实践和描写等诸多方面,已经成为描写性翻译研究的新模式”。语料库翻译学最先由Baker(1993)提出,并详细阐释了语料库在翻译学研究中的理论价值和应用价值。从此,语料库翻译学开始了蓬勃的发展,并且在翻译语言特征、译者风格、口译研究等领域取得了令人瞩目的成就。

2. 国内外基于语料库翻译学的研究

2.1 对翻译共性的研究

翻译共性,又称翻译普遍性,是指翻译文本具有的有别于原创文本的普遍特征,主要包括隐化、显化、范化和简化等。Laviosa(1998)从信息容载、词汇变化和平均句长对翻译文本的简化趋势进了考察。研究表明,翻译文本的实词比率较低,平均句长较短。Olohan和Baker(2000)探讨了英语国家语料库和翻译英语语料库中say/tell that结构的使用,发现前者的使用率明显高于后者。国内关于翻译共性研究具有代表性的是:王克非、黄立波(2008)介绍了翻译共性的几个术语并且提出了净化等概念;胡显耀(2004,2011)提出了用语料库进行翻译共性研究的优势,并综述了其理论方法和概念等。有部分学者还对共性研究中的显化做出了阐释,例如王克非、秦洪武(2009),王克非、胡显耀(2010),柯飞(2004)刘泽权、候羽(2008),胡显耀(2009)戴光荣、肖忠华(2010)。

2.2 对译者风格的研究

译者风格是指“文本中所呈现的一系列语言和非语言的个性化特征”(Baker,2000),是译者在翻译文本中所体现的典型特征。Baker(2000)利用英语翻译语料库,对比了英国翻译家Peter Bush和Peter Clark的翻译风格,研究发现,两者的时态使用,句长,直接和间接引语使用都存在着差别,相比之下Clark的译文更加简洁、明了。国内近几年也有部分学者进行了这项研究。刘泽权(2011)采用量化分析的方法分析了《红楼梦》四个英译本在词汇和句法层面的特点,并且探讨了他们翻译风格的异同。黄立波(2009)尝试从翻译与文本的关系入手,建立翻译文体学的研究框架。

2.3 口译研究

口译语料库的建立与笔译语料库相比,建设较难,口译语料的转写和标注经常耗费大量的物力和人力。尽管困难重重,但是一些口译语料库还是相继建成,并被应用于口译规范和语言特征等方面。Gumul(2006)在口译语料库的基础上对同声传译中的不同类别的显化现象做了实证分析。Schjodager(1995)基于英语-丹麦语口译语料库,从文化限定词的翻译角度,探讨了口译人员所应遵守的规范。国内基于口译语料库的研究也有了一定进展。例如,胡开宝、陶庆(2009)分析了汉英会议中语篇意义显化程度及其原因。

结语

语料库翻译学是一门近年刚刚兴起的学科,虽然它对传统的翻译研究提供了一个新的视角,奠定了学科的基础理论,但其本身的理论积淀还是存在一些明显的不足。例如,它的研究范围相对狭窄,跨学科性不足;同时定量研究还不够深化,语料库的建设还存在力量分散,没有得到一个合理的整合等方面的具体问题。期待这方面问题的研究能够在学术界引起足够重视,并有更多更好的语料库相继建成,尤其是口语语料库,开创具有原创性的语料库翻译学研究。

参考文献

[1]Baker,M.1993.Corpus linguistics and translation studies:Implications and applications.In M.Baker,G.Francis,and E.Tognini-Bonelli,eds.,Text and Technology:In Honour of John Sinclair.Amsterdam/Philadelphia:John Benjamins.Pp.233-50.

[2]Baker,M.2000.Toward a methodology for investigating the style of a literary translator.Target 12,2:241-66.

[3]Laviosa,S.1998.The Corpus-based approach:A new paradigm in translation studies.Meta 43,4:474-9.

[4]Olohan,M.and M.Baker.2000.Reporting that in translated English:Evidence for subliminal processes of explicitation?Across Languages and Cultures 1,2:141-58.

[5]黄立波.翻译研究的文体学视角探索[J].外语教学,2009(5).

[6]胡显耀.语料库翻译研究与翻译普遍性[J].上海翻译,2004(4).

[7]胡显耀.基于语料库的汉语翻译预提特征多维分析[J].外语教学与研究,2010(6).

[8]刘泽权.《红楼梦》四个英译本的译者风格初探——基于语料库的统计与分析[J].中国翻译,2011(1).

浅论语料库与英语教学论文 篇5

摘要:随着信息技术的不断发展,语料库在英语教学中的应用越来越广泛。本文介绍了语料库的发展及现状,分析了语料库这种新型的教学资源在英语词汇、翻译、写作、阅读等方面的应用。利用语料库构建新的学习模式,有效地利用语料库进行英语教学,必定会为英语教学的发展提供新的方向和启示,从而促进英语教学的发展。

关键词:语料库数据驱动学习英语教学

一、语料库简介

随着现代信息技术的迅猛发展,人们对于语料库的认识越来越深。语料库是指按着一定的语言原则,运用随机抽样的方法,收集自然出现的连续语言,运用文本或话语片段而建成的具有一定容量的大型电子文本库。最早的语料库是美国的布朗语料库(BrownCorpus)。之后,许多大规模的语料库随之出现,例如英国的COBUILD语料库、国际英语语料库(InternationalCorpusofEnglish)、BNC英国国家语料库(TheBritishNationalCorpus)、COCA美国当代英语语料库(CorpusofContemporaryAmericanEnglish)等。其中BNC英国国家语料库拥有近1亿词次,是目前世界上最具代表性的当代英语语料库之一。COCA美国当代英语语料库是美国最新当代英语语料库,是当今世界上最大的英语平衡语料库,是一种动态的语料库资源,处于不断更新与发展中。相比之下,我国的语料库建设取得了巨大的成就,例如交通大学科技英语语料库(JDEST语料库)、中国学习者英语语料库(CLEC)、中国学习者英语口语语料库(COLSEC)、中国学生英语口笔语语料库(SWECCL)等。

数据驱动学习(Data-drivenLearning)是由TimJohns在1991年提出的。数据驱动学习(DDL)的基本理念在于鼓励语言学习者充分利用语料库资源,通过观察和分析大量客观真实的语料,找寻语言语法规则、意义表达及语用特征。这种基于语料库的学习模式充分调动了学生学习的主动性,学习者可以自主地查询语料库。语料库为学习者提供了大量真实的语言实例,这是其他学习模式无法提供的。利用这些语料库资源,使这些语料库资源更好地为英语教学服务,值得我们不断地探讨、研究。在教学中运用语料库资源,将极大地提高英语教学效率,丰富英语教学手段,提高学生的学习兴趣和自主学习能力。

二、语料库在英语教学中的应用

众多研究表明,大学生缺乏与外语环境直接接触的机会可能是引起大学生英语词汇习得费时、低效的根本原因。语料库的语料资源来源于真实的语言,具有相当的可靠性和真实性,在一定程度上可以弥补与外语环境接触的不足。英语教师或者英语学习者可以通过大量真实的例子,自己分析、研究个别词汇的语用规律。同样,因为语料库中的语料数量庞大,来源于现实,以语料库为基础的研究是十分真实可靠的,这为许多学者的研究提供了可靠的依据。语料库的真实语料对于词语的意义和用法做了客观的描述,这对于学习者了解词语的实际运用情况非常有帮助。

在英语学习过程中遇到不懂的问题,学生可能会查词典。词典与语料库相比,词典的举例有限,不能够提供充足的词汇用法和词语运用的具体语境。例如,在《牛津高级学习词典》中查阅good这个词,可以看到good有形容词、副词、名词三种词性。但是在BNC的语料库中检索可以看到good还可以作为专有名词。参考书与语料库相比,参考书有时有时效的限制,也就是说参考书的更新有时候会滞后,提供的解释不够全面,或者有些新的用法没有在参考书中更新。学生在学习英语的过程中,遇到不懂的地方请教老师,那么不同的老师可能会根据个人的看法给出解答。对于二语学习者或者外语学习者来说,以语法和规则为基础的学习固然不可缺少,大量地掌握英语短语和多次系列则更有助于提高学习效率和表达的地道性(Nattinger&DeCarrico,1992;Lewis,)。运用语料库可以发现词汇、语法、篇章方面的真实规律。

在教学过程中,语料库提供的信息可以让我们先教那些使用频率最高、最有使用价值的词汇语法和表达方式,在有限的时间内先学习使用频率高、最常用的词汇。在学习英语词汇的过程中,经常会遇到一词多义,或者拥有相同词义的词语。借助语料库,教师可以把词语应用的具体语句、语境展示给学生,这样不仅使得学生对于词语有了更真实的理解、可以更加清楚该词的用法。在讲解同义词时,可以借助语料库,检索词语的搭配,或者预制语块,词语出现在哪种语域中,可用于帮助学生了解不同的词语在不同体裁中使用的差异,区分不同体裁的特征,特别是口语和书面语的区别,避免在写作中大量使用口语化的词语。同时,可以通过观察与词语经常反复地、习惯性地一起共现的词语,观察这个词语营造的语义氛围,也就是“语义韵”。语义韵可以分为积极语义韵、消极语义韵、中性语义韵。消极语义韵指搭配词所指事物或品质令人不快;积极语义韵指搭配词产生的联想意义是正面的`、积极的或令人愉快的;如果搭配词没有明显的褒义或贬义倾向,则将它归为中性语义韵。通过观察词语的语义韵,也是区分同义词的一种方法。而且通过语料库检索,可以进一步归纳出所谓的同义词在使用过程中的差别。

基于多媒体语料库的大学英语视听说数据驱动学习模式,需要在语料库和学习者之间设计一个学习的平台,不仅要收集涵盖各类题材的文本语料,还要选取语音、视频等多媒体文件作为主要语料,语料来源可以有英文歌曲、英语演讲、英语新闻、英语电影、英剧、美剧,再把这些收集到的文本、音频、视频和语料库索引有机结合。这种模式为学习者语言输入提供了真实情景和文化背景知识。多媒体语料充分调动了学习者的学习主动性,便于学习者直观地学习和模仿。

语料库辅助英语阅读是非常有效的途径。语料库能提供大量语境共现,通过充足的语境,学生猜测词义会更加容易,有助于学生深入理解生词的含义。另外,根据语境总结词汇的搭配、语法的搭配。运用语料库还可以检索出某篇文章的词频表和关键词词表,进而可以帮助学生总结阅读文章的主题和中心思想,有助于学生对整篇文章的理解。

写作在英语教学中十分重要,把语料库引入英语写作教学中受到关注。根据二语习得中的输入和输出理论,输入和输出相互作用、相互影响。没有适当的语言输入,语言输出就会遇到困难和障碍。输出又可以反过来促进输入,增强可理解性输入效果。语料库为写作学习提供了很好的输入和输出平台。在学生着手写作前,利用语料库网络资源收集与话题相关的大量资料,在课上进行讨论、分享。课堂点评时,针对一些典型和普遍存在的问题,教师引用语料库中的语言实例,引领学生分析语言实例,发现目的语语言特点和规律,提高学生语言表达的准确型性和地道性。以往的研究表明,网络语料库辅助写作模式有助于增强写作积极主动性和自主写作意识。

在翻译教学中,平行语料库可以帮助我们发现词语和搭配的实际运用,找到它们在翻译中恰当得体的对等语。通过观察语料库中的源语文本和目的语文本的语言模式和差别,能让译者深刻地理解和掌握翻译过程中的具体步骤。与此同时,译者还能通过平行语料库树立源语文本和目的语文本中对文化因素的批判意识,从而提高文化技能和敏感度。教师和学生可以通过语料库发现和熟悉翻译中的语言和文化模式。

三、语料库应用的具体实施方法

介绍网络语料库平台,并且进行语料库使用培训,这样可以避免学生因不熟悉语料库资源而产生畏惧、抵触情绪,培养学生学习的兴趣。为了让学生运用语料库辅助学习,教师应在课下提前准备好需要运用语料库的材料,以便在课上给学生展示相关的词语分析、句法分析。在课下要求学生运用语料库查找与课堂内容相关的资源,让他们亲自运用语料库收集资源、探索、发现语言使用的内在规律。并且,可以把收集到的资源带到下一次课堂中进行讨论、分享。通过这样的学习方法,可以增强学生的自主学习意识,解决传统课堂教学模式单一、空间和时间受限等问题。在教师的帮助下,学生通过利用语料库资源,英语学习能力会得到显著的提高,但是语料库资源庞大,必须有教师的引导和帮助。

四、结语

语料库与机器翻译 篇6

【关键词】翻译语言 tend to 对应 平行语料库

引言

对翻译语言特征的系统描写出现在上世纪80年代至90年代。这些方面的研究发现,译语语言通常会“偏离”(decenter)目的语而更靠向源语。之所以出现偏离,是因为译语语言受到源语文本的干预,其中的一些语言形式明显偏离了目的语语言的一般模式。如Blum-Kulka(1986)发现译语语言中衔接手段会受源语文本影响。译语文本在产生过程中或多或少受到源语语言对目的语施加的影响,这样的译文语言通常被称为翻译腔。但也有人认为,翻译语言是两种语言之间的“中间地带”。这种处于中间阶段的语言在翻译理论中被称为“语际语”,既包含着源语的分析特征,也有目的语语篇的合成特征。然而,对于翻译语言的研究要突破直觉和感性认识,就需要充分的语料支持。因此,语料库语言学与描述翻译学的结合恰恰起到了推动作用。

Baker(1993)预见,语料库能收录大量源语文本及译语文本,辅以新的语料库研究方法,翻译学者能揭示译语文本的内在规律。Tymoczko(1998)也表示基于语料库的翻译研究能使翻译学者查询并获得大量数据。这些数据能帮助翻译学者更全面客观地描写和分析翻译语言。随着众多英汉/汉英平行语料库的创建和应用,涌现出一批针对汉语翻译语言的研究。其中,汉语翻译语言中词汇-句法特征受到广泛的关注。秦洪武、王克非(2004)利用“北外通用汉英平行语料库”,发现“so…that”的主要对应形式是零对应,而非“如此……以致”等“前后对应”结构,且汉语原文中没有与“so…that”对应的固定结构;胡开宝(2009)基于莎士比亚戏剧翻译语料库,分析了“把”字句在《哈姆雷特》两个译本中的分布和应用,以及英语语句译为“把”字句的规律和特点,得出其动因分别为认知、句法和语用;胡显耀、曾佳(2010)基于“当代汉语翻译小说语料库 ”, “兰开斯特现代汉语语料库 ”及其汉语原创小说子库,分析了现代汉语翻译小说中“被”字句的使用频率及其对应结构,并指出汉语翻译语言中“被”字句体现出“传统化”的特征,即趋从和夸大汉语自身传统的趋势;许文胜、张柏然(2006)利用学英汉名著翻译语料库,对英汉因果关系连词的使用进行了对比分析;类似的研究还涉及“and”的汉语翻译、人称代词及连接词的翻译等。这些研究的对象具体且围观,有利于发现汉语翻译语言中非常规的应用。

一、检索项及语料库的选择

1.检索项的选择。本文选择“tend to + 动词”结构及其对应的汉语译文为检索项。通常,我们认为“tend to”对应的汉语译文是“倾向于”,这一方面是受到了“tend to/towards+名词(sth.)”结构“趋向,倾向,趋于”定义的影响,另一方面是,也因为中国学习者常将“tend to”与“intend to”混淆。然而,该结构的翻译并不为人关注。本文通过检索并比较“tend to + 动词”结构及其在汉语中对应的形式,试图找出该结构在汉语译文中常用的处理方式。

2.英汉平行语料库的选择。本文使用的语料库是北京外国语大学及兰卡斯特大学搭建的基于网络的第四代语料库分析工具CQPweb中的Babel英汉平行语料子库。

CQPweb 的查询页面具备词表生成、索引分析、词语搭配计算、主题词分析等当前主流单机版语料库工具的几乎所有功能。这使得研究人员能如浏览网页一般轻松使用语料库(ibid.)。Babel英汉平行语料子库共收录327篇英文文章及其汉语翻译,其中115篇收录自《英语世界》(World of English),212篇收录自《时代周刊》(Time),共有语料54.4万字/词。

二、检索过程

本文利用Babel英汉平行语料子库自带的检索功能,使用“tend* >>5>> to >>5>> +_V*”作为检索项,即搜索“tend”一词的所有形态(tendency, tends, tended, tending),其后5個单词范围内出现“to”,并在之后5个单词范围内出现动词,得到英语原文中的“tend to”结构及其汉语译文的平行对应索引。检索项中设置的5个单词跨距,是为了避免遗漏“tend not to”及“tend to, in some cases”等形式。随后,在检索到的语料中将不符合“tend to + 动词”结构的平行语料索引删除,将剩余的索引进行分类。

三、“tend to + 动词”结构对应的汉语译文形式

经过检索,符合本文要求的索引结果频次共有23对,在本文所用的语料库中的频率为93.99次每百万字/词。“tend to + 动词”结构内的不定式动词与汉语译文句子的谓语动词对应,而“tend to”的对应方式可以分为五类,分别是:频率副词、概率副词、“倾向于”、能愿动词、零对应。其分布如下表:

1.频率副词。“tend to + 动词”结构对应到汉语译文中的频率副词包括“常常”、“总是”、“个个”、“一般都”,等。这些频率副词修饰谓语,说明动作发生的客观频率高。如:

(1)There are a few misspellings that children tend to make, but the courtesy and the emotions are vivid.

信中有几处小孩子常出的拼写错误,但礼貌的言辞和感激之情跃然纸上。

(2)NBA stars, of course, tend to be tall, but theres usually a sense of elongation, of a body, like gum stretched long and thin.

雖然NBA球星个个身材高大,但是一般情况下,身高和形总有一定的反比关系,就像口香糖,越长就越细。

通过上面的例子可以得出,“tend to + 动词”结构对应的频率副词所修饰的动作或情况,不受外在条件限制,而是一般规律,本身就有较高的频率发生。

2.概率副词。“tend to + 动词”结构对应到汉语译文中的概率副词包括“容易”、“就会”、“可能”等。它们表示说话人对于事件的判断,并对小句的命题进行说明(ibid.),如:

(3)With a nail file always within reach, they tended to groom rather than bite.

由于指甲挫总能伸手可及,他们就会去修指甲,而不啃指甲了。

(4)In nature viral diseases tend to break out when populations soar and become densely packed.

在自然界中,当生物种群的数量迅猛增长,达到高度密集的时候,病毒性疾病就容易爆发。

在汉语译文中,“就会”对应了“由于”形成因果关系,“就容易”对应了“当”形成条件关系。因此得出,“tend to + 动词”结构对应的概率副词是对前文条件或原因的一种反馈,表示在前文所述情况的限制下,某种结果会有较高的概率出现。

3.“倾向于”。通过本次检索发现,确实存在将“tend to + 动词”结构翻译成“倾向于”(或“趋向于”)的情况,如:

(5)“The technology gives us another way to reach them, especially parents of secondary school students, who tend to be less involved.”

技术给了我们另一种方式去接近家长,特别是中学生的家长,因为他们都倾向于少参与学校事务。

4.零对应。在某些检索结果中,并没有发现明显对应“tend to + 动词”结构的汉语译文。如:

(6)But people who, for genetic reasons, tend to get Alzheimer's at an early age in their 40s or 50s seem to shape the protein into a stickier version that is more likely to clump together.

不过,对那些因遗传因素在较早年龄段——四五十岁——患阿耳茨海默氏病的人群而言,他们内的蛋白质粘度较高,凝结的可能性较大。

(7)TOMATOES-Scientists have long known that men who eat cooked tomatoes, such as in pasta sauces, tend to have lower rates of prostate cancer.

西红柿:科学家们很早就知道,一些吃西红柿熟食,比如番茄酱的男士,他们得前列腺癌的比例较低。

但是,从例(6)和例(7)原文不难发现,这两个句子与对应概率副词的原文例句非常相似,前文含有影响后文的限制条件,相应的,其汉语译文可以添加概率副词如下:

(6i)不过,对那些因遗传因素(容易)在较早年龄段──四五十岁──患阿耳茨海默氏病的人群而言,他们内的蛋白质粘度较高,凝结的可能性较大。

(7i)西红柿:科学家们很早就知道,一些吃西红柿熟食,比如番茄酱的男士,他们得前列腺癌的比例(会)较低。

一般认为,汉语属于意合语言,逻辑关系常隐而不显。在“tend to + 动词”结构的零对应汉语译文中,可以认为是省略了承载逻辑关系的概率副词。这也说明汉语意合特征对译文有很重要的影响。

5.能愿动词。通常来说,汉语能愿动词的情态意义可以分为“主观判断类”和“推测类”。主观判断类表示对于某些主客观条件、某些价值、某些情理或者事理的一种主观判断(赵延, 2014)。本文中“tend to + 动词”结构对应的就是表达意愿的主观判断类能愿动词,包括“想”和“喜欢”。如:

(8)I tended to veer slightly away from the edge of the roadway and the drop-off beyond.

我极力想把车开向里侧一些,躲开那可能滑下陡坡的边沿。

四、“tend to + 动词”结构与“倾向于”

本文以“倾向于”为检索项分别在兰卡斯特汉语语料库第二版(LCMCv2)和浙江大学汉语译文语料库(ZCTC)进行检索,结果显示“倾向于”在汉语原文中的出现频率仅为4.9次/百万字,而在汉语译文中的出现频率明显要高(13.76次/百万字)。而且,汉语原文中,“倾向于”之后衔接的成分基本为名词,相对比而言,本文对应“倾向于”的索引中,其后衔接成分全部为动词,与汉语原文中“倾向于”的用法出入较大。因此,本文认为,与“tend to + 动词”结构对应的“倾向于”明显偏离了目的语语言的一般模式,造成了“翻译腔”。

通过对本文中对应“倾向于”的索引进一步观察,发现其中有一个索引结果,汉语译文中包含了“都”和“倾向于”两种对应:

(9)“The technology gives us another way to reach them, especially parents of secondary school students, who tend to be less involved.”

技术给了我们另一种方式去接近家长,特别是中学生的家长,因为他们都倾向于少参与学校事务。

剩余的4个索引结果对应的译文中,“倾向于”(或“趋向于”)都可以替换成频率副词。以下给出剩余索引结果的英语原文和对应的汉语译文,括号内的频率副词替换了原本译文中此处的“倾向于”:

(10)I tend to be tolerant of most vices in life, and also in investing.

我(一般都)容忍生活中的大部分不道德行为,在投资方面也是如此。

(11)The keiretsu tend to protect their money-losing businesses.

系列(往往)保護那些亏损企业。

(12)In the past, so-called licensed goods from European companies were often cheap promotional giveaways, so retailers tend to view licensed products as a form of advertising not worthy of shelf space.

在过去,来自欧洲公司的所谓特许经营产品通常是廉价促销赠品,所以零售商们(一般)把特许经营产品看作是一种广告形式而不值得在零售商店展示。

(13)Indeed, in cultures where women still give birth exclusively in the company of other women, births tend to rely on fewer drugs and less surgical intervention.

在一些妇女分娩时仍然完全由女性陪伴的不同文化背景的社会里,妇女生产的确(一般)较少依赖药物或受手术的干预。

由此可以看出,将“tend to + 动词”结构翻译成“倾向于”,受到了源语语言对目的语施加的影响。“倾向于”包含源语的分析特征,即语法结构贴近源语,汉语译文中“倾向于”后连接动词。根据英语原文提供的语境,汉语译文中的“倾向于”可以替换成频率副词。

五、结语

范文卿表示,也因为中国学习者常将“tend to”与“intend to”混淆。而且受“tend to/towards + 名词(sth.)”结构“趋向,倾向,趋于”定义的影响,常将“tend to + 动词”结构译为“倾向于”。本文通过检索“tend to + 动词”结构,归类并分析了该结构的各种对应形式,结果如下:

1.确实存在“tend to + 动词”结构与汉语译文“倾向于”对应的情况,但不是主要对应形式。其主要对应形式是汉语译文中表示频率及概率的副词,修饰不定式动词对应在汉语译文中的谓语动词;

2.与“tend to + 动词”结构对应的汉语译文“倾向于”可以替换成频率副词,表示客观情况出现的高频率和规律性;

3.英语原文中“tend to + 动词”结构承载对应前文的逻辑关系时,在其汉语译文中可能出现零对应;

4.只有少数情况下,“tend to + 动词”结构对应汉语译文中的能愿动词。

参考文献:

[1]Baker,M.(1993).Corpus linguistics and translation studies:Implications and applications.Text and technology:In honour of John Sinclair,233,250.

[2]Blum-Kulka,S.(1986).Shifts of cohesion and coherence in translation.Interlingual and intercultural communication:Discourse and cognition in translation and second language acquisition studies,17-35.

[3]Cettolo,M.,Girardi,C.,& Federico,M.(2012,May).Wit3:Web inventory of transcribed and translated talks.In Proceedings of the 16th Conference of the European Association for Machine Translation (EAMT) (pp.261-268).

[4]Hardie,A.(2012).CQPweb—combining power,flexibility and usability in a corpus analysis tool.International journal of corpus linguistics,17(3),380-409.

[5]James,C.(1980).Contrastive Analysis.Essex:Longman Group Ltd.

[6]Toury,G.(2012).Descriptive Translation Studies and beyond:Revised edition (Vol.100).John Benjamins Publishing.

[7]Tymoczko,M.(1998).Computerized corpora and the future of translation studies.Meta,43(4),págs.652-660.

[8]范文卿.基于語料库的近义词辨析及其在外语教学中的应用[J].佳木斯职业学院学报,2015a(9).

[9]范文卿.语料库视角下的近义词tend和intend辨析[J].扬州职业大学学报,2015b,19(3):33-36.

[10]胡开宝.基于语料库的莎剧《哈姆雷特》汉译文本中“把”字句应用及其动因研究[J].外语学刊2009(1):111-115.

[11]胡显耀,曾佳.翻译小说“被”字句的频率、结构及语义韵研究[J].外国语(上海外国语大学学报),2010(3):73-79.

[12]李雯雯.基于双语平行语料库的英汉翻译语言分析[J].才智,2014(26).

[13]吕孟巧.基于平行语料库的汉语译文语言分析——以“and”的汉语翻译为例[D].Doctoral dissertation,广西大学,2013.

[14][英]韦迈尔.牛津高阶英语词典:第7版:英语版[M].商务印书馆,2009.

[15]秦洪武,李婵,王玉.基于语料库的汉语翻译语言研究十年回顾[J].解放军外国语学院学报,2014,37(1),64-71.

[16]秦洪武,王克非.基于语料库的翻译语言分析——以“so…that”的汉语对应结构为例[J].现代外语,2004,27(1),40-48.

[17]石定栩,孙嘉铭.频率副词与概率副词——从“常常”与“往往”说起[J].世界汉语教学,2016(3).

[18]许家金,吴良平.基于网络的第四代语料库分析工具CQPweb及应用实例[J].外语电化教学,2014(5):10-15.

[19]许文胜,张柏然.基于英汉名著语料库的因果关系连词对比研究[J].外语教学与研究:外国语文双月刊,2006,38(4):292-296.

语料库与机器翻译 篇7

一、翻译共性研究

翻译共性,又称翻译普遍性或翻译普遍性特征,是指翻译语言,相对于原创语言而言,在整体上表现出来的一些规律性语言特征。近些年来,对翻译共性的讨论主要有简化、显化、隐化、范化、集中化、整齐化、非典型搭配等。

基于语料库的翻译共性的相关研究大多集中于对显化、隐化、简化和范化等翻译共性的实证研究上,尤其是显化研究。胡开宝、朱一凡对莎士比亚戏剧《哈姆雷特》梁实秋译本和朱生毫译本中的显化进行了定量分析。王克非和胡显耀对汉语翻译文学语料和汉语原创文学语料进行对比分析,探讨汉语翻译文学作品在人称代词使用方面是否存在显化优势。

二、翻译语言的词汇、句法特征研究

词汇应用的总体特征可以通过类符/形符比、词汇密度和高频词的相关数据来分析。如王克非、胡显耀基于北京外国语大学通用汉英对应语料库,从类符/形符比、词汇密度和高频词的使用等角度对译自英语的翻译汉语和原创汉语的词汇使用特征进行比较分析。

翻译语言的句法特征可以从句法总体特征和典型语句结构的应用特征两个层面来理解。句法的总体特征包括翻译文本的平均句长、平均句段长、结构容量、简单句和复杂句的使用频率等。如秦洪武基于英汉多译本翻译语料库,重点分析了“介词…方位词”和“指示代词…名词”的结构容量。典型语句结构是指目的语言所特有或受原语语言影响而频繁应用的目的语语句结构。胡显耀、曾佳利用汉语翻译小说语料库,分析了汉语翻译小说中“被”字句的使用频率和结构。

三、译者风格研究

根据Baker的观点,译者风格是指“留在文本中的一系列语言及非语言的个性特征”。近年来,国内学者也开始将视线投向基于语料库的译者风格研究,并如火如荼地进行研究。王青、刘莉通过对比萧乾与金隄的《尤利西斯》汉译本,结合萧乾的汉语原创作品,对《尤利西斯》汉译本体现的译者词汇型式化风格进行研究,旨在探索把译者风格从原作者风格和所谓的“翻译腔”中有效识别出来的语料库途径。

四、翻译教学研究

语料库在翻译教学中的应用主要表现在两方面:一是利用语料库加强翻译课堂互动,提高课堂教学效果,建立基于语料库的翻译教学模式;二是利用双语语料库编写翻译教材,实现翻译教材编写理念和方法的创新。在国内,基于语料库的翻译教学模式的研究也取得了一些进展。余军、王朝晖讨论了教学型语料库的构建及其在翻译教学中的应用,认为应结合翻译课程具体的教学法以及相应的教学步骤,以学生为中心进行教学型语料库的构建与应用。

五、口译研究

国内基于语料库的口译研究开始于2007年,在这一年,胡开宝、吴勇和陶庆分析了基于语料库的口译研究所面临的困难及其重要性。但学者依然克服种种困难,建设并应用了一些口译语料库,开展基于语料库的口译研究并取得了一定的进展。研究主要集中于口译语言特征研究以及口译规范研究。潘峰、胡开宝基于自建的汉英会议口译语料库,对汉英会议口译中some的应用进行了研究。

六、存在的问题

1.语料库翻译学在技术层面上存有问题.语料库建设的高技术要求以及语料的代表性和收录标准问题,是目前国内建成的用于翻译研究的平行语料库数量较少的重要原因所在。虽然语料库的运用,使翻译研究显得十分科学、客观,但在选择译本过程中,很难避免直觉的判断。

2.研究方法上存在一定的缺陷。语料库翻译研究主要采用语料库方法和定量分析法,可以使研究建立在严密的数据分析的基础之上,使研究结论更具科学性。但目前大多数翻译领域的定量研究多限于词频和平均句长等数据的分析,这种相对初级的定量分析对翻译规律的解释力明显不足,而且一味强调量化分析。

语料库与机器翻译 篇8

关键词:语料库,翻译教学,学生能力

一、现今我国翻译教学工作的情况

对于专门进行英语专业学习的学生来说, 翻译知识的学习是必不可少的, 对于那些不是学习英语专业的学生来说, 是没有机会学习到翻译知识的。随着社会的不断发展进步, 全球化浪潮的兴起, 我国同世界各国在许多领域都进行着竞争与合作, 在进行竞争与合作的过程中, 我国对人才的能力和综合素质提出了新的要求, 应该将翻译教学延伸到大学教育的其他专业的教学之中去, 使大学生都可以掌握一些基础的翻译知识。

现今我国进行翻译教学的方式都是这样的:翻译教师根据教材内容, 将教材中所涉及到的理论知识先向同学们讲述清楚, 接着在相关资料中找一些与讲述的理论知识相关的句子, 先让同学们尝试着进行翻译, 对于章节中所涉及到的重点和难点, 也是依照上述的方法, 最后将标准的翻译结果展示给同学们, 让同学们对比自己的翻译结果, 找出学习中存在的问题, 教师再对学生存在的问题进行分析和解答。这种翻译教学的方法学生依旧是在被动的接受着老师所传授的知识, 这就不利于学生自主学习能力的培养以及学习兴趣的产生, 从授课的结果上看, 学生对重点和难点知识掌握的程度往往不高。这种传统的教育教学方式受到了越来越多相关专家及学者们的质疑, 也呼吁着对翻译教学方式的创新和发展, 专家学者们认为翻译教学工作应该将学生的地位从被动转为主动, 教师也应充分地发挥其引导作用, 让翻译教学的课堂通过师生互动的方式变得更加生动活泼, 翻译教学中应该积极给学生们创造相应的语言环境, 给学生们真实的文字材料让其翻译, 充分锻炼学生的翻译能力。若将语料库应用与翻译教学中, 专家学者们所提出的这些意见或建议很大程度上可以落实了。

二、语料库的运用对学生翻译能力提升的优势

语料库具备语境共现、词频、词汇表等基础功能, 通过运用这些功能, 学生可以运用互联网等搜索工具在语料库中查找到所要学习的词汇、短语、语法等, 从而对所要学习的知识有一个清醒的认识。教师在授课的过程中, 可以运用语料库全面的语料信息给学生们创造出一个模拟真实的语言环境, 在这种环境下, 学生的词汇运用能力、口语表达能力和翻译能力都得到了充分的锻炼。在讲授重点和难点知识时, 教师可以先让学生们根据在语料库查阅的资料对句子或文章尝试着进行翻译, 然后引导学生们发现自己在翻译时存在的问题, 通过学生自己总结正确的翻译方法或教师旁敲侧击的点醒, 使学生对所学习的翻译知识加深印象, 最后运用语料库所创造出的模拟真实的语境, 让学生们亲自实践, 进行锻炼, 强化学生对掌握知识的灵活运用能力。

教师在进行翻译知识的授课之前, 应该在语料库中查找出与授课内容相关的语料信息, 在进行收集和整理之后, 应用与课堂教学当中, 学生在课堂上所看到的相关资料, 都是经过教师在成百上千的语料信息中挑选出来的精华, 这对学生所需要掌握的理论知识学习是非常有帮助的, 只有将理论知识良好的理解并掌握了, 从能够在实践中更好地运用知识。

语料库的出现很大程度上弥补了翻译教材中资料、信息不全面的情况, 教师通过对语料库的使用使课堂教学的内容更加完善, 已往教师在备课的过程中, 需要翻阅查找许多书籍、资料, 语料库的出现使教师备课的工作负担减轻, 让教师可以将更多的精力投入到帮助同学理解知识、运用知识当中, 这不但提升了翻译教学的课堂效率, 更给学生翻译知识的学习提供了更多的帮助, 有利于学生翻译能力的提升。

三、语料库在翻译教学中的教学模式

语料库根据所存储和收率的语料信息的不同, 可以分为不同种类的语料库, 在种类繁多的语料库中, 可以应用于翻译教学的语料库主要有平行和可比这两种, 这两种语料库虽然在内容上各有千秋, 但无论哪种应用与翻译教学中, 其所能带来的优势和效果都是明显的。就拿平行语料库来说, 其存储和收录的是某种语言的原文文本和与之相对应的翻译语文本, 对学生翻译知识的学习有很大的借鉴作用, 在教学中学生根据所学内容选择相关的英汉对齐语料进行翻译练习, 通过对中文和英文不同的语言表达方式来体会翻译的方法。

在进行翻译教学的过程中, 要积极鼓励学生运用语料库这种先进、科学的方式来辅助学习, 教师在课堂上所能讲授的知识毕竟是有限的, 只有帮助学生掌握了语料库的使用方法, 在课后学生才能更好地完成自主学习。

四、结束语

语料库的研究很长时间都是为语言学研究服务, 将语料库运用于翻译教学领域的实践时间还很短, 还有许多需要进一步完善的地方, 虽然语料库自身也存在着一定的缺陷, 但是运用语料库来进行翻译教学对学生翻译能力的提升有着很好的效果。语料库作为社会发展的新事物, 还需要更多的实践和探索使其不断成熟, 更好地为翻译教学工作服务。

参考文献

[1]孔雁, 范艳梅.信息全媒体关照下开放式翻译教学模式的构建研究[J].中国教育信息化·高教职教, 2015.

语料库与机器翻译 篇9

当今全球化进程中, 国际间交往和互动频繁, 作为发展中国家, 中国在积极地引进和学习国外先进的科学技术, 各个领域的外文科技文献源源不断地涌进中国, 并成为中国学者、技术人员等学习和研究的第一手材料。翻译外文科技文献过程中, 不可避免地会遇到许多科技术语, 需要准确翻译, 以使读者能够很好地理解, 不致疑惑。英国萨里大学 (Surrey University) 翻译学教授Peter Newmark (2001) 指出:尽管术语只占全文的约5%-10%, 但是他们却构成科技英语翻译与其它文体翻译的根本区别。科技术语的翻译应具有准确性、规范性和统一性。

一般认为, 科技术语可分为三类, 即专业技术术语 (各科技领域的专有术语) 、准技术术语 (本身由多种普通义, 在科技领域中获得扩展的新义) 和新创造的术语 (为表达新概念而创的术语) 。对于人工翻译来说, 科技术语的翻译可采用音译法、意译法、形译法、意音兼顾法和创造新词法等, 译者可以调动多年训练和储备的知识对某一领域的科技术语进行灵活的翻译。但是, 高度信息化的今天, 仅采用人工翻译显然不足以满足人们的需求。因为翻译者不可能通晓较多的专业, 不同译者对同一术语的翻译也可能有所不同, 而且时效性也比较差。而实践中可以看到, 目前基于规则、基于统计及基于实例的机器翻译在准确性上尚存在很大不足, 且尚未出现较为完整的科技术语翻译理论规则以支持科技术语的准确翻译。于是, 我们可以考虑使用基于语料库进行研究。

2. 平行语料库研究

自上世纪60年代美国Brown大学建立第一个电子语料库———Brown语料库的近几十年来, 语料库技术蓬勃发展。在国内外, 构建了大量的用于不同研究目的的语料库, 这些语料库按语体分, 有口语语料库和书面语语料库;按介质分, 有文字语料库和声音语料库;按时间分, 有共时语料库和历时语料库;按处理程度分有生语料库和熟语料库, 另外, 还有专有名词标注语料库、学习语料库等。20世纪90年代, Mona Baker等人将与翻译研究有关的语料库分为平行语料库 (Parallel Corpus) 、可比语料库 (Comparable Corpus) 和多语语料库 (Multilingual Corpus) 。本文中主要使用英汉双语平行语料库。

关于平行语料库的定义目前尚未得到统一, 本文使用的平行语料库按以下规则:即, 源语文本和译语文本在句子层面互为译文关系的语料库。英汉双语平行语料库即指互为对译关系的英语和汉语语料组成的语料库。

近年来, 从事语言研究和机器翻译研究的国内外很多研究机构都在致力于建设平行语料库, 现今已建立的英汉双语语料库有英国伯明翰大学 (the University of Birminham) 建立的中英对应语料库、英国兰卡斯特大学 (Lancaster University) 建立的Babel英汉语料库、北京外国语大学中国外语教育研究中心的通用汉英对应语料库、北京大学计算语言学研究所的汉英/汉日双语语料库、中国科学院自动化研究所的英汉双语语料库和哈尔滨工业大学的英汉双语语料库等。对这些平行语料库的研究包括建设、对齐和抽取信息等。

目前, 一些语料库采取双语自动对齐技术在篇章级、段落级、句子级以及短语级的水平上使源语文本和译语文本进行了对齐, 即, 通过一定算法将意义相同的源语和目标语自动对应起来。本文中, 由于是针对科技术语, 所以主要通过短语对齐技术进行加工处理。另外, 为在平行语料库中找到科技术语的源语和目标语, 还需要使用术语抽取技术。术语抽取技术通常结合了统计学和语言学的方法, 即, 使用统计学的方法获取候选术语, 再利用语言学的方法来筛选、过滤和修正。

应当注意:本文中所述科技术语仅限定为名词, 并且科技术语的翻译仅限定为由英语翻译成汉语 (即英译汉) 的过程。事实上, 因为汉语中的科学技术名词大多是近现代科技进入中国后通过翻译得到的, 所以仅就科技术语而言, 由汉语翻译成英语往往只是英译汉的逆向过程。

3. 科技术语的翻译问题

由于词汇的相对有限性和科技发展的无限性, 对新发明创造的事物的命名往往依赖于现有词汇。借助于各种手段用已有的词汇来表达, 使得在英语中不同科技领域往往会使用同一科技术语, 而这同样的科技术语翻译成汉语时往往会用不同的表达方式或词语, 即虽然源语言词语相同, 但译法却有所不同。而即使在同一领域中, 不同的事物上使用同一术语也会存在译法不一致的情况。通常有以下几种情况:替用词、多义词和词典无义项词。

3.1 替用词

英语作者在将某些部件命名时, 往往会使用众所熟知的形象的词汇以便于理解, 这种准技术术语不能直接翻译成原义, 否则不合文体, 但又不宜用其它符合文义但远离词语本义的词汇代替。如elbow本义指“肘”, 但在机械技术文献中经常用于表示位于两个构件之间可相对于其彼此运动的部分, 如同动物体的肘关节, 但不宜翻译成“关节”或“接合部”, 这样的词一般可译成“肘部”;同样地, finger可表示为“指部”或“指形部” (构件在形象上像伸出的指头) 等。

3.2 多义词

跟普通词汇一样, 有的科技术语在同一领域中也具有多种意义。如机械领域中的“tab”一词, 若出现在介绍易拉罐及相似物体等的科技文献中, 则翻译成“拉环”, 在其它特定结构的文献中有时可翻译成“挂环”, 或者“凸舌”, 总之, 就是指位于某个机械构件上便于对此构件进行某种特定操作的突出部分。但是, 有的新发明中的大致符合此特征的某些部分也被英语母语作者命名为“tab”, 这时, 再翻译成前述只有特定上下文使用的“挂环”“拉环”“凸舌”等便不再合适, 于是可以音译成“提攀”等。

3.3 词典无义项词

科技术语的翻译中, 理想的是, 仅利用传统的对比词典 (如英汉电子词典) 中列举的义项 (或者经过标注说明特定用法的义项) 与源语文本中的词语进行简单对应, 从而得到相应译文。但是, 在实际翻译过程中发现, 传统词典在面对一个词项的多种用途时往往表现地无能为力, 经常需要根据实际技术语境来创造新词, 这时则需要调用专业领域中独有的专业术语库。如“rib”一词在特定机械中称为“筋板”, 而这个义项在传统词典中一直未予收录。

虽然人们已经总结出各种译法或思想, 如音译法、意译法、形译法、意音兼顾法和创造新词法等, 但是对于计算机而言, 由于利用这些方法翻译时随机性和主观性较强, 故很难且尚未能将这些译法或思想用程序的方式较好地表现出来。所以有赖于使用平行语料库等已存在并正在不断扩充、更新的大量语言事实进行归纳总结, 择取较优译法或通用译法作为规范表达以用于机器翻译, 从而使翻译语言达到正确性和一致性。

4. 利用平行语料库进行加工处理

在平行语料库中, 首先, 利用术语抽取技术, 获取尽可能多的科技术语;然后, 使用短语对齐技术实现这些术语的源语文本和目标语文本之间的对齐。这时, 需要建立术语和领域相关性数据库、上下文相关性数据库, 对数据库进行动态更新, 另外, 还需要考虑交叉领域的术语翻译。

4.1 建立术语和领域相关性数据库

要建立同一科技术语与不同科技领域之间的相关性数据库, 需要以下工作:

(1) 将汉英平行语料库中搜集的语料所属的领域进行分类, 并标记其属性 (如医学领域, 可标记为英文;机械领域可标记为) ;

(2) 求出某一个领域同一个科技术语的各种译法所出现的概率P;统一各种表达中出现概率最高的几种 (最少一种) 形成一小组, 定为译语文本的候选规范表达;

(3) 将该术语的译文规范表达与该科技领域相关联, 即一旦确定该科技领域, 则当遇到该术语时, 根据第二步统一翻译成此规范表达小组中的一个。

如下所示:

可以看出, 同一英语科技术语也可以在不同的领域中译成同一汉语词语, 这是由各领域之间的相近性和词语涵义的相对稳定性决定的。但这并不影响特定领域中的具体翻译。

4.2 建立上下文相关性数据库

同一领域中, 科技术语之间需要有上下文相关性数据库。科技术语之间有上下位概念相关、局部和整体相关、同级相关等固有关系。由于这种固有关系, 使得某些科技术语之间的彼此同现机率很高。同一领域中, 很多词也有不同的翻译方法, 而这些译法多数与上下文中同现的上述某些词语相关, 所以可以用之以示区分。

例如, 机械领域中tab有多种译法, 但是如果上下文中出现或多次出现pop can (易拉罐) , 则意味着其意思是“拉环”的概率最大;如果上下文中出现或多次出现housing (壳体) 或container (容器) , 则意味着tab的意思是“凸舌”的概率最大;如果前述二者都未出现, 则音译表达“提攀”的概率最大。

由此可以在第一步的基础上, 将规范表达数组中的各个元素和其所在领域中同现的其它术语 (或称“特征词”) 通过计算最大概率而进行关联, 即, 如果在规范表达数组中同一领域同一特征词出现时有多个译法, 则可以取最大概率者建立相关性。此处“上下文同现”指同一句子中同现、同一段中同现或者同一文献中同现, 而不单纯指相邻的同现关系。术语间建立相关性如下所示:

机械领域:

显然, 这个过程可以采用现今比较常用的互信息 (mutual information) 的方法来实现。另外, 还可以使用与这些术语上下文同现概率较高的形容词或动词来作为特征词。

4.3 动态更新数据库

科学技术的发展日新月异, 新型技术产品不断涌现, 技术交流更加频繁, 汉英平行语料库的规模也在持续扩大, 英语科技术语持续增加, 同一领域同一术语的某一译法在其所有译法中所占的概率在相对稳定中也势必会发生相应的变化。我们必须利用各种有效的途径不断地扩充和完善科技术语相关性数据库。例如, 依靠强大的搜索引擎功能搜集互联网上丰富的双语语料资源, 并运用各种技术对所搜集的信息进行加工、处理和完善, 以满足正确处理科技术语所满足的条件。对于个体软件而言, 可以利用翻译记忆机制, 不断地记录翻译过程中所得到新的翻译结果, 并实时地在后台进行整理归总, 动态地得出用于后继科技术语翻译所需的数据。事实上, 这一点已在一些翻译软件中初见端倪, 如翻译记忆软件Trandos、Transit等。

4.4 交叉领域中科技术语的处理

当今世界科技领域的发展已经不再是单纯的独立的发展, 跨学科、跨领域的研究或技术开发已经成为是不可忽略的一大趋势。原来应用于两个特定领域的由同一源语词语表达的术语很有可能在同一篇跨领域的科技文献中同时出现, 此时便有区分这些术语的必要。仍以上述elbow为例, 虽然在医学领域和机械领域可以进行不同的翻译, 但是, 在医疗器械中则有可能混合两种用法, 如一种医疗器械所要作用的位置与肘关节 (即elbow) 相关, 而同时这种医疗器械的某些构件之间的连接处也有可能被源语作者命名为elbow。当然这种情况较为少见, 但不可完全忽视。这种情况下, 可以尝试在相对较小范围内寻找与源语关联的特征词, 如可仅在一小段或一句中寻找。这样可以降低不同译语混淆的可能性。

综上所述, 基于平行语料库的科技术语翻译处理过程的实现可以用下图表示:

5. 所存在的问题:

同一领域中科技术语的特定用法和其一般用法的冲突问题。由于某些准技术术语来源于一般表达, 当在某一领域的科技文献中使用时很有可能出现这种情况:即, 该术语既有一般用法, 又有该领域的专门用法, 这时可能会使得具有一般用法的词也翻译成专门用法。如“tab”在机械领域的文献中可能用作上述“提攀”“拉环”等的意思, 同时也可能有“标签”的用法 (如在机器上贴的标签) , 如果忽略了这种基本用法, 势必会造成某些错误。而如果将一般用法也通过特征词加入到相关性数据库的话, 则可能会由于一般用法的特征词较多而在翻译中喧宾夺主, 从而大大降低该术语翻译的准确度。这一点还需要在构建科技术语相关性数据库时做进一步的考虑。

另外, 当前汉英平行语料库质量参差不齐, 构建语料库时所抽取的语料中对某些科技术语的翻译有很多尚不到位, 而且通过网络扩展和更新, 或加入更多的质量不均的语料, 从而使统计出的译法难免有失偏颇。

摘要:本文分析了英汉科技翻译中针对科技术语的翻译问题, 并提出了应用英汉平行语料库解决这些问题的方法。通过英汉平行语料库建立同一科技术语与不同科技领域之间的相关性数据库以及同一领域中科技术语之间的上下文相关性数据库, 并借助互联网等途径不断地对之进行动态更新, 从而为准确翻译科技术语提供有力的支持。

关键词:平行语料库,科技术语,英汉翻译,相关性,特征词

参考文献

[1]王思宽;基于规则和基于统计相结合的中英双语平行句对短语对齐方法[D].北京邮电大学, 2010.

[2]屈刚.英汉双语短语对齐[D].上海交通大学, 2007.

[3]孙乐, 金友兵, 杜林, 孙玉芳;平行语料库中双语术语词典的自动抽取[J].中文信息学报, 2000 (06) .

[4]张文静, 梁颖红.术语抽取技术研究[J].信息技术, 2008 (03) .

[5]张锋, 许云, 侯艳, 樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究.2005 (05) .

[6]石春让, 赵巍;科技术语翻译:归化是正途[J].山东外语教学.2010 (01) .

[7]刘超朋.平行语料库概述.燕山大学学报 (哲学社会科学版) , 2007 (S1) .

[8]廖七一.语料库与翻译研究[J].外语教学与研究, 2000 (05) .

[9]杨晓军.基于语料库翻译研究和译者教育[J].外语与外语教学, 2007 (10) .

[10]柏晓静, 常宝宝, 詹卫东, 吴拥华.构建大规模的汉英双语平行语料库[A].机器翻译研究进展——2002年全国机器翻译研讨会论文集[C].2002.

[11]李安兴.双语语料库与汉英词典词目翻译质量的进一步提高[D].复旦大学, 2005.

语料库与机器翻译 篇10

关键词:商务翻译,语料库,教学改革

“随着国际商务活动范畴的不断扩展和现代中国社会对复合型人才的需求,商务英语已经成为一个独立的本科专业。”[1]目前,全国已经有七百多所高校开设了商务英语专业或商务英语方向,发展势头迅猛。但是,问题也随之而来。由于历史较短,我国的商务英语专业建设还面临着诸多问题,学科定位和人才培养模式都有待规范化。随着近年来语料库语言学的蓬勃发展,大型语料库的建设与研究为话语分析等语言研究领域提供大量的真实素材,使得辞典、教材以及试卷的编写都发生天翻地覆的变化。在语料库的驱动下,以真实语言生活状况为基础的教学模式改革可以提高商务翻译实践教学的效率,改善教学效果,推进商务翻译实践教学的进一步发展。

一、商务英语语料库概述

Nelson(2000)建立的102万词次的“商务英语语料库”,收录28类商务文本,是最早的商务英语语料库。其中,书面语料为56%,口语语料为44%。全库语料由“关于商务的”(about business)和“商务实践”(to do business)两类构成。其中,商务实践类语料大部分来自于各公司的真实商务文件,对于研究真实语境中的商务英语特点具有重要意义。Nelson呼吁以真实语料为对象的商务话语研究,并利用语料库软件将自建的商务英语语料库与英国国家语料库、公开资料语料库进行对比,分析商务英语与日常英语在词汇选择上的异同,发现在礼貌程度、句型及句式等方面二者的差异很大。Nelson(2000)首次采用语料库的方法揭示商务英语的语言特点和语用特点,在一定程度上显示出商务实践与商务教学衔接中的问题[2]。

剑桥出版社出资、诺丁汉大学Carter和Mc Carthy教授组织建设的“剑桥与诺丁汉商务英语语料库”是目前世界上规模最大的商务口语语料库[3]。该语料由采集自26个英国公司的64场录音组成,共912734词次,其中完整地保留了停顿、打断和修正等语言特征。在语料分类上,作者区分公司间与公司内的语料,并让互动者自己对语料的分类进行判断,避免观察者的参与对语料自然性的影响。Handford(2010)以该语料库为基础,分别从商务洽谈的体裁、词汇、话语互动标记与互动、人际语言以及话轮转换等方面深入剖析商务互动,为商务英语教学提供很多改革建议。

二、语料库的特点

首先,语料库能够反映商务话语实践的真实状况。随着研究的不断深入,学者们逐渐发现以模拟语料和人工语料为基础的商务翻译教学存在很多弊端,商务实践中的应用性不强。究其原因,模拟语料和人工语料大多由研究者主观推测产生,与现实情况的切合度不高。

其次,语料库能够丰富商务翻译教学材料。由模拟语料或人工语料构成的教学材料说服力不强,与商务翻译实践连接不够紧密,导致教学效果不理想,学生获得的知识与实践相脱节。语料库驱动的商务翻译教学改革可以改善这一状况,为商务翻译教学提供真实生动的教学材料,改善翻译教学模式,提供教学效率,改善教学效果。

再次,基于语料库的教学改革有利于使商务翻译实践与教学紧密结合,改善教学效果。商务活动由于与各方经济利益紧密相关,因此多年来一直带着神秘的面纱。学者的研究和教学均以参与人员的经验为基础,这使得教学的材料过于陈旧、单一,不能真实地反映商务翻译活动现状,使得翻译教学与实践严重脱节,导致教学效果不理想。基于语料库的研究能够保证材料的时效性与真实性,因此可以使教学内容与商务翻译实践紧密衔接,提高教学质量,改善教学效果。

最后,基于语料库的研究有利于改善商务翻译人才的培养模式。随着我国经济蓬勃发展,国际影响力不断提升,与各国的商务往来日趋频繁,更加凸显商务翻译人才的需求与重要性。语料库驱动研究有助于改善商务翻译人才的培养模式,提高翻译人才的素质,以便能更快更好地为国家培养与输送商务翻译人才,整体提高我国企业参与国际竞争的“软实力”,为我国在商务实战与研究中争得一席之地。

三、商务翻译教学的重点与难点

商务活动的特殊性对翻译的恰当性与准确性提出很高的要求。商场如战场,丝毫失误都有可能影响商务活动的成败。跨语种的商务活动由于受到双方母语不同的限制而需要翻译人员。但是,商务翻译与其他类型的翻译活动不同,对翻译人员的语用能力要求较高,需要有很好的临场应变力。这些是由商务活动自身的特性决定的。商务话语不同于其他类型的机构话语,其形式化的限制相对较少,一切活动均以双方的经济目的为导向。因此,在话语的选择上呈现多样性,并辅以多种话语手段,采用直接言语行为的时候较少。这些语言特点都给商务翻译人员的工作造成很多难点,自然也给商务翻译实践教学提出更大的难题。

首先,商务翻译教学缺乏合理有效的教学材料。商务活动与经济利益密切相关,使得其私密性强,语料的获取难度大。这在一定程度上影响了商务翻译教材的编写与发展。其次,商务翻译教学缺乏实战性。商务翻译要求译者具有很好的语用能力和语境分析能力,而这些在现有的教材编写与教学中都很难实现。再次,商务翻译教学需要重视翻译理论的传授。理论源于实践,也能指导实践。掌握一些先进的翻译学理论可以有助于译者更好地分析翻译语境,选择自己的翻译策略。最后,商务翻译教学需重视商务体裁知识。不同的体裁具有不同的特点,自然也会选择不同的商务话语。译者明晰各类体裁的特征有助于更好地把握原文与译文的语言特点,尽可能恰当准确地进行翻译活动。

四、基于语料库的商务翻译教学改革路径

语料库语言学的发展为很多领域的语言教学研究提供了更多、更好的语言资源。不仅教师和研究者开始使用语料库辅助教学与研究,很多学生也开始使用语料库进行语言学习。可以说,在当今的大数据时代,语料库的建立与使用是推动语言教学改革的重要力量。语料库的引入对于商务翻译教学的改革主要体现在以下几个方面。

第一,语料库有助于商务英语词表的建立。作为机构话语的一种,商务英语具有自己的常用词汇与体裁。语料库作为大型的词汇库,可以通过软件检索并建立商务英语专业词表。这样可以有助于重点词汇和常用词汇的确定,可以为商务翻译教学中的词汇教学部分提供参考。同时,语料库配套检索软件的使用也可以帮助教师和学生在学习过程中查找例句,掌握词汇的具体用法,尽量避免语用失误现象。

第二,语料库驱动的商务翻译教学有助于减少实践中的语言不虞现象。商务活动是双方利益的面对面交锋,双方通过语言上的较量来争取各自利益的最大化。翻译在其中起到至关重要的作用。商务翻译不仅要求准确,更重要的是恰当、合适。商务翻译教学往往缺少现实语料的支撑,使得教学内容与实践相脱节,导致学生培养水平不高,教学质量难以提升。引入语料库后,语料库可以提供大量真实的翻译案例,并可以对某些用法的出现频率进行统计。这样可以有助于教师和学生了解商务翻译中的常用固定搭配和语言表达方式。

第三,语料库可应用于商务翻译教学多媒体课件开发。目前,多模态语料库成为国内外学者的研究热点。将译员在翻译实践中的真实表现进行录像,改建为多模态的商务话语语料库,可以编写成多媒体课件直接应用于课堂教学,使得教学活动更加生动、有趣,教学内容更加直观,可以提高学生的学习兴趣,进而改善教学效果。

第四,语料库可应用于教学大纲的编写与人才培养模式的改善。基于真实语料的教学活动在国外已经得到广泛开展,并且取得良好效果。因此,语料库驱动的商务翻译教学改革研究结果可以应用于改写现有的翻译教学大纲,将基于真实语料的翻译教学引入课堂,进而改变现有的机械、死板并且应用性不强的人才培养模式,使得译员的培养可以更加高效、高质。

“与传统英语教学相比,商务英语专业是一个多元化,并且在不断发展、完善中的专业。”[4]因此,专业建设的很多方面都有待提高和完善。商务英语专业的课程设置要求学生能够在双语环境下熟练应用各类商贸技能,以便应对未来商场实战的需要。商务翻译能力作为商务话语能力中的重要部分,要求学生具有较好的知识储备和较高的语言能力,同时也对商务翻译教学提出挑战。如何能够把握瞬息万变的商场局势,提供尽可能准确、恰当的翻译是译者需要不断揣摩和训练的。语料库驱动的商务翻译教学不仅可以为学生提供更多的语料资源,使其有机会甚至全面地了解商务翻译实践的真实状况,同时也可以帮助教师更好地向学生展现和讲解商务翻译活动的过程,提高学生的商务沟通能力与商务翻译能力,以便更好地满足社会需要,为我国经济的快速全球化输送人才。

参考文献

[1]严明.商务英语能力构念界定和测试[J].当代外语研究,2012,(2).

[2]谢群.商务谈判话语互动研究[D].武汉:华中师范大学,2013.

[3]谢群,廖美珍.《商务洽谈语言研究》介绍[J].当代语言学,2013,(1).

语料库与机器翻译 篇11

摘要:语料库正日益应用于文学作品研究。莫言小说代表中国文学作品“走出去”,翻译功不可没。本文以葛浩文英译本和杜特莱夫妇法译本为蓝本,基于研制的莫言小说汉英法三语语料库,旨在找出莫言作品翻译中具有规律性的因素。同时通过对葛氏及杜特莱夫妇译著全面和系统的探讨,深入研究翻译策略、译者风格,为以齐鲁文化为背景的文学作品对外翻译传播提供参考借鉴。

关键词:语料库;翻译策略;莫言作品英法译本

莫言作为首位获得诺贝尔文学奖的中国作家,其作品被译成外文的数量之多是不多见的。传统的翻译研究以原语文本为参照,以忠实程度为取向,主要探讨译文与原文之间的关系或对应关系。(王克非,2006)[1]现在学界形成的共识是利用语料库进行翻译研究是一种不可或缺且可靠的手段(胡开宝,2012)[2]与多语语料库相比,双语平行语料库更多一些,这就制约了多语种之间的翻译对比研究。曹大峰预测“双语平行语料库正在向多语平行语料库发展”。

本研究所采用的语料库驱动下的研究方法即具体研究之前并不做过多假设,通过对语料库中的语言实例进行数据统计,穷尽性分析得出译者翻译策略使用情况,进而分析译者风格。该语料库在语种类别和数量上都是创新,英法两种语言属于同一语系,这种对比可以使研究中更关注翻译策略本身的异同,减少无关因素的影响。

一、莫言小说中英法三语平行语料库的建立

研究选择莫言《蛙》和《丰乳肥臀》(共约66万汉字)的葛浩文英译本和杜莱特法译本为蓝本,实现三语平行语料库句接,并在语料库中进行翻译策略的标注。该语料库容量如下:

字数句对

《蛙》699,4057,377

《丰乳肥臀》1,047,98215,232

总计1,747,38722,609

本研究将翻译策略分为词汇层面和句式篇章层面。词汇层面包括对方言、俗语、文化附载词的翻译;句式篇章层面包括改译、增译、省译、合并、调整语序及一汉多译的翻译策略。

二、语料库驱动下的莫言小说英法译本译者翻译分析

(一)翻译策略的选择

语料库翻译学对语言事实进行解释,既选取语言学视角,也有文化理论视角。下面对部分类型给予例证分析:每一类型下是译者对同一类型翻译策略的使用情况,每一例中又是英法两译者翻译策略对比。

1.【原文】肥胖的兔子们,在雪地里像长尾巴蛆一样爬行,连小脚女人都能活捉它们。

【英译】The plump little rabbits crawled across the snowy ground tike maggots, so lethargic even women with bound feet easily caught them.

【法译】Les lièvres bien en chair rampaient comme de longs vers et même les femmes aux pieds bandés arrivaient à les capturer vivants.

分析:文化附载词。小脚女子脚骨受损行动不便,小脚女人都能抓得到兔子,说明在冬天抓野兔子是一件很容易的事情。葛浩文意译“bound feet”让外国读者想象束脚的形态行动不便,如果按照字面“small feet”则会让读者产生疑问,为什么脚小的女人不能抓兔子呢,曲解作者本意;杜特莱也采用同样的意译方式,达到了理想效果。

2.【原文】“姑姑生于公历1937年6月13日,农历五月初五,乳名端阳,学名万心。”

【英译】”She was born on 13 June 1937, the fifth day of the fifth lunar month, which is Duanyang, the day of the Dragon Boat Festival. They called her Duanyang until she started school, and was then called Wan Xin (Heart).”

【法译】”Elle est née le 13 juin 1937, le cinquième jour du cinquième mois de Tannée lunaire. ? la naissance, on lui a donné pour nom de lait ?Double Cinq?, plus tard son père lui choisit comme nom officiel d'écolière ? Wan le C?ur?.”

分析:农历五月初五月是中国传统节日端午节,中国读者看到日期就会很自然地联想到节日,也就对姑姑的乳名叫“端阳”的含义有深层的理解。但西方读者在农历五月初五和端阳之间不会有任何的联想。因此葛浩文对农历五月初五做了增译阐释,这样读者了解姑姑乳名“端阳”的真正含义和来源。法译里将“端阳”翻译为“Double Cinq”意为“双五”,彻底抛开端午节这层含义,改译为读者易于接受的形式。

3.①【原文】德国丽人牌自行车铃声如爆豆,司马库风一样驰来。

【英译】The German bicycle bell rang out, heralding his arrival, as if on the wind.

【法译】La sonnette de la bicyclette Sch?neman grelottait sans fin, Sima Ku arrivait à la vitesse du vent.

②【原文】上官鲁氏的肚皮可怕地痉挛着,鲜血从双腿间一股股冒出来,伴随着鲜血,一个满头柔软黄毛的婴儿鱼儿一样游出来。

【英译】Shangguan Lu's belly was jerking and twitching horribly; blood gushing from between her legs washed out another down–covered infant.

【法译】Le ventre de Shangguan Lushi se convulsa de fa?on effrayante, du sang frais sortait à gros bouillons entre ses cuisses où un bébé, la tête couverte de fins cheveux blonds, se faufila comme un poisson.

分析:省译。①中“如爆豆”是有些方言性质的俗语,比喻长时间发出声音但不连续,像嘣豆子一样。英译对其进行了省译,法译为“sans fin”即“不停地”。②英译对比喻等描述性内容进行了省略,法语直译。

英法两种语言由于表达习惯的差异,译者在处理同一句原文时,采用的方法经常是不同的,但共同点是尽力遵循译入语的语言规则和表达习惯,将原文的意义按照英法思维传递给读者。

葛浩文习惯对较短的、不影响文义的比喻等描述性文字省译,将汉语简单句揉合成一句层次分明、错落有致的长句,形成其简洁的翻译特色。也说明英语在处理句子内部逻辑关系的能力上要比汉语更加方便;而法语虽然与英语更加亲近,但是通过例证分析却发现杜莱特选择的法语表达方式经常与汉语如出一辙。法语和汉语一样,允许一个句子中依次罗列几个地位相同的谓语动词,而不需要像英语一个句子中只允许一个谓语动词。虽然法语中也存在各种复合关系代词,但杜莱特却用得不多,多数句式都按汉语原文进行翻译。可以说这是造成法译本比英译本篇幅长很多的一个原因。

(二)译者翻译风格的共性

从总体上看,翻译风格应是翻译家的一种体系,往往在其为数众多的译作中反复地体现出来。(但汉源,1996)优秀译作的翻译风格,应该基本上是源语作品的的真实风格,但译者的风格在其译作中也明显可见。

英译法译

《蛙》2.657%2.169%

《丰乳肥臀》3.532%2.173%

对策略进行频率统计可以看出英译整体比法译采用的翻译策略更多,即杜式相对直译更多;同一译者在翻译不同作品时,采用翻译策略处理的句对占总句对百分比相差不大,在杜译中体现更明显。这两方面印证了上述理论:翻译风格是译者表现出的稳定、一贯的特点。另外,不同语言译者在处理同一文本时,使用翻译策略的句对比例相差不大,即葛式与杜式的策略选择上确实存在共性,这为具体句例分析结论提供数据支撑,也正体现了语料库翻译研究的科学性与可靠性。

莫言的创作在内容和形式上都独具特色,包含方言、俗语、文化附载词的句对分别达到7%(《蛙》)和8%(《丰》)左右,在全文比例非常高,西方读者理解起来难免有难度,对译者也是挑战。二者在这些内容的处理上呈现出一定的相似性。比如:

【原文】他们都用双手拉着马缰,踩着马蹬的腿伸得笔直,八字形劈开。

【英译】their legs in a rigid inverted V.

【法译】deux mains, leurs jambes tendues sur les étriers, toutes droites, formant un V renversé.

分析:改译。英语和法语中均没有汉字“八”形这个概念,葛浩文和杜莱特均将“八字形劈开”一词转译为字母文字“倒V形”,巧妙地转入西方概念,容易想象人骑在马上的双腿的摆放形状。

需要说明的一点是,不少人不认同葛浩文的翻译观,认为他的译本译者介入过多。对此葛解释美国编辑会从读者的角度对译作进行大量的修改,读者所能看到的删减可能并不是葛浩文的省译策略,而是编辑为之。至于哪些是省译,哪些是编辑删减已无从考证,因此在本项目研究中只能一并归为省译。

三、结语

近年来文学翻译在国内处于相对弱势,国家在汉译外推广中国文化方面遇到各种问题,因此探索各类译本中国小说在语言、文体等方面及其在海外接受度的差异就显得尤为重要(黄立波.2013)。不可否认的是,正是由于葛浩文和杜莱特坚实的语言功底,巧妙的翻译策略,才使得《蛙》和《丰乳肥臀》英法译本最大程度地展现了莫言原著的魅力,使得“鲁军”作品、中国文化走出国门。

参考文献:

[1]王克非,语料库翻译学——新研究范式 [J]中国外语,2006,3(3):8–9.

语料库与机器翻译 篇12

关键词:语料库,翻译研究,定量定性研究

西方语言学理论的不断发展为翻译研究注入了新鲜的血液。20世纪50年代,语料库语言学兴起,之后语料库被广泛运用于语言学、句法学、语义学、外语教学和词典编纂等方面的研究,并取得丰硕的研究成果。语料库语言学首先是一种语言研究方法,它的研究基础是真实语言数据构成的数据库,采用定性和定量相结合的研究方法,系统分析海量的语言事实。这一语言学研究的重大突破深刻影响了翻译研究,实证方法在翻译研究中逐步受到重视。随着语料库语言学的不断深入发展以及西方翻译理论从最初归纳式经验式的总结到描述性翻译研究的兴起,使得翻译研究的视角不断得到拓展和更新。20世纪90年代以来,语料库翻译研究——种新的译学研究范式应运而生。

基于语料库的翻译研究以语料库为研究对象,采用定量和定性结合的方法对翻译过程和翻译产品进行实证性研究。通常认为,语料库翻译研究肇始于莫娜·贝克(Mona Baker)。贝克(1993,1995)很早就倡导利用语料库进行翻译研究,并主持建立了世界上第一个翻译英语语料库(Translational English Corpus,TEC)。胡显耀(2007:214)认为,“语料库翻译研究的根本思想是用语料库语言学的工具、技术和方法对大量真实的翻译现象进行描述,并从所描述的翻译‘自身’语言特征中寻找翻译固有的规律性特征”。虽然语料库翻译研究历史尚不长,但已呈现出强劲的发展势头。本文拟将粗浅梳理、探讨语料库翻译研究的适用范围及其优劣势,以便给语料库翻译研究方法的发展和进一步完善提供一些借鉴。

1 语料库翻译研究的适用范围

莫娜·贝克在前人研究的基础上,提出了基于语料库的翻译普遍特征(universal features of translation)的假设。吴昂、黄立波(2006:296-297)认为,“它包括六个方面:(1)译文显化程度显著提高;(2)消歧和简化;(3)合乎语法性;(4)避免重复;(5)超额再现目标语言特征;(6)翻译过程往往会导致某些语言特征表现出特定的分布类型”。在验证和阐述这一假设的过程中,贝克提出的翻译普遍特征被简单归纳成简略化(simplification)、明晰化(explicitation)和规范化(normalization)。随着语料库在翻译研究中的广泛应用,许多研究者借助语料库分析工具对语料库数据进行检索,从类符形符比、词汇密度、搭配模式、平均句长、句型等这些反映语言特征的指标进行数据统计和分析,进而考察翻译文本中的词汇多样性和信息负载。另外,也有一些研究者结合理论阐释和实证研究,探讨翻译文本的特征等等。这些也正是目前语料库翻译研究方法的主要手段。较之于与传统的翻译研究方法,语料库翻译研究更具科学性。贝克进一步指出,可以为翻译研究所用的语料库类型有三类:一是平行语料库(Parallel Corpus);二是多语语料库(Multilingual Corpus);三是可比语料库(Comparable Corpus)。所谓平行语料库,指的是双语平行的语料库,它收集某种语言的原文文本及其在另一种语言的翻译文本,可以说是真正意义上的翻译语料库。所谓多语语料库收集,是指收集来自两种或多种语言、体裁相同或相似的文本的语料库。所谓可比语料库,是指那些同时收集某种语言的原创文本和从其他语言译入该语言的、体裁相同或相似的文本(例如英语可比语料库收集某一体裁的英语原创文本和从汉语或德语译成英语的文本)的语料库。据贝克的观点,可比语料库的建立对翻译研究最具实际应用价值,因为研究者可以借助可比语料库,通过分析、比较同一语言里原创文本和外来翻译文本,揭示其从词汇到句法到文体风格方面的差异,从而进一步发现在特定历史、文化环境中翻译的翻译规范和翻译活动中的普遍规律。由此可以看出,研究翻译规范、翻译普遍性借助语料库这一工具具备了更加广阔的视野。语料库翻译研究方法在翻译研究领域的广泛适用前景,主要体现在以下几方面。

首先,表现在翻译普遍性(translation universals)研究方面。翻译普遍性研究是语料库翻译研究最主要的应用领域之一,揭示并验证翻译普遍性的存在是语料库翻译研究迄今为止所取得的最大成就。莫娜·贝克最早采用平行语料库进行翻译普遍性研究,揭示了翻译文本具有简略化、明晰化和规范化的普遍性特征,并进一步指出翻译普遍性特征是翻译文本本身所固有的典型特征。贝克(Baker,1993:243-246)认为,“与翻译过程中涉及的两种语言的影响无关”。除了上述三个翻译普遍性的表现之外,研究者们对翻译普遍性进行了更深入的研究,并发现翻译文本还具有整齐化(leveling out)和集中化(convergence)的普遍性表现。戴光荣、肖忠华(2010:76-80)采用汉语母语语料库、汉语译文语料库和对齐英汉平行语料库,探讨了翻译明晰化研究。

然而,目前翻译普遍性的研究也只是语料库翻译研究的初期成果,有关翻译普遍性的结论不可避免地受到当时客观条件的制约,如语料库的规模大小、语料加工程度的深浅、相关检索软件的功能强弱以及检验和分析方法的成熟性等。受上述客观条件的所囿,基于语料库的翻译普遍性研究无论是从研究方法方面,还是从研究过程方面来讲都有待于进一步完善。

其次,表现翻译规范研究方面。描写翻译学派代表人物Toury系统地研究了翻译规范,他认为,既然任何翻译活动都离不开特定的社会文化背景,那么翻译的策略和产品必然要受到语言规范和社会规范的制约。因此,译学界对翻译规范的探讨主要集中在翻译的产品规范、规约性准则的制定上。但传统译学研究基本上都是定性研究,主观性较强。基于此,语料库的应用为翻译规范研究提供了全新的视角。语料库翻译研究的优势之一便是其大量的文本语料,基于这些语料可以描写和分析影响译文的各种规范因素,更具科学性和客观性。胡显耀(2006)将翻译规范划分为内部规范和外部规范,其中,内部规范又具体细分为义务规范、交际规范和操作规范,外部规范则细分为选择规范、期待规范等。他通过自建的当代汉语翻译小说语料库,量化、对比分析了汉语翻译小说与非翻译小说在词汇、句法特征,借此再现控制小说翻译的规范。这种基于语料库的翻译规范研究为翻译规范的描写性研究提供了范式。王家义(2011:128-131)则研究了基于语料库的译文分析的可行性和实现途径。

需要指出的是,翻译规范研究尚有很多问题有待进一步探讨。余国文(2010:118-119)认为当前翻译规范研究方面有不少问题尚待深入探究,“如哪类规范占主导地位,操作规范是否受原语社会或文化等因素的影响,不同时代背景下的翻译规范有哪些不同,将不同的原语文本译成同一目标语文本遵循的翻译规范有哪些异同”。周小玲、蒋坚松(2008:156)还指出了其他方面的问题,如汉译外和外译汉遵循的规范有哪些相似或相异等。

另外一个表现是译者文体研究方面。在语料库翻译研究兴起之前,翻译文体研究大多从文本中抽取典型例句作为依据,以印象式、经验式的点评为主,主观性很强,难以对大规模的翻译文本进行全面整体的量化研究。莫娜·贝克(2000:241-265)在利用语料库研究文学翻译中的译者文体方面也开了先河,开辟了语料库翻译研究的新领域,也为研究译者文体提供了新的范式。借助语料库,译者文体研究的范围也更广阔,既可研究原作和原作者的语言风格及模式、译文和译者的语言风格及模式,或是某一原作多个译本的文体风格,又可研究不同译者对同一原文本的类似处理和不同的把握,进行译者的认知过程和社会文化定位等问题的探索。简而言之,基于语料库翻译研究方法研究译者文体,通过进一步的定量研究去考察影响译者文体的诸多因素,避免了主观臆断性,是译者文体研究的新范式。

作为一种研究手段和方法,语料库翻译研究的适用范围并不仅限于研究翻译普遍性、翻译规范和译者文体等问题,它还涉及其他多个领域,如翻译文本词汇创新(Kenny,2001)、翻译教学(Zanettin et al.2003)、口译研究(Shlesinger,1998)等等。陈伟(2007:72)论述了TEC(Translational English Corpus)语料库的应用潜力,指出“现阶段可开拓的研究领域包括:译语文化中的翻译研究,翻译中的省略问题研究,译者性格和性别对译文的影响的研究,不同时期、同一时期文学作品翻译的共时和历时研究,女性翻译研究,主体文化的规范如何制约和影响翻译政策和策略的研究,不同文体的翻译技巧和翻译策略的差异研究等”。文中还提到把类似于TEC翻译语料库与其他类比语料库相结合以研究文本的风格、新语新词(hapax legomena)的翻译特点、语言习惯等问题。由此可以看出,语料库翻译研究的应用越来越广泛,其不断涌现的重要发现和研究成果也令人瞩目。

2 语料库翻译研究的优势与劣势

2.1 语料库翻译研究的优势

许钧、穆雷(2009:352)认为,语料库研究方法的优势主要表现在两个方面:一方面,对研究者来说,语料库可以帮助研究者把他们的一些直觉式的设想或者命题发展成为可操作可验证的理论假设或者是理论,使翻译研究的成果更具说服力;另一方面,语料库可以为译者提供丰富的译文参考资料,包括具体的语言环境以及其他译者的操作手法。Douglas Biber较准确而全面地概括了语料库翻译研究方法的优势,他指出:“以语料库为基础的研究方法具有以下三大优点:第一、能通过计算机进行快速、准确和复杂的分析;第二、语料库规模大,包括的语域全面,文本量大,语言信息范围广;第三、既有定量分析,又有定性的功能解释,对语言的描写全面(转引自潘永樑,2000)”。罗选民(2005:52-56)认为,语料库使翻译研究从直觉式变为具体的可操作的研究。同时,语料库翻译研究结合定量和定性的方法,并没有受囿于语言学的发展,而是将研究范围扩展到了社会文化因素;也不只是做数据上的描写,还在描写的基础上阐释翻译现象背后的社会动因。

语料库翻译研究方法对于翻译培训和翻译教学以及译者的翻译实践来说,其优势也无可比拟。将语料库作为教学资源,引入翻译课堂教学的最大优势就在于语料本身的真实性和实效性。另一方面,由于现代语料库的语料都由电子版本构成,可供教师和学生重复使用,使教学具有自主性和开放性的特点,促进学生的数据驱动学习(罗选民等,2005:52-56)。对译者翻译实践而言,语料库提供的例证丰富、信息量大,可以快速、方便地检索,译者有很大的选择余地和很强的自主性,加之语料库中的语料可以提取编辑,也极大地提高了译者的翻译效率和翻译质量。

此外,随着机器翻译研究的不断深入,语料库研究对于自动翻译系统的研发起着推动和促进作用,基于语料库的自动翻译系统的研究方法为未来翻译系统的研制开创了一条新道路,相关研究也正在进一步地开展当中。语料库为译员培训提供了工作平台,同时也为开发机器翻译及计算机辅助翻译应用软件打下了基础。

2.2 语料库翻译研究劣势

作为一种新的研究范式,语料库翻译研究潜力巨大,但其缺点也是研究者们有目共睹的。Tymoczko(1998:43)认为语料库翻译研究是对“科学主义的狂热可能导致大量空洞的、不必要的量化研究”;Malmkjaer(1998:43)指出语料库的使用可能使翻译理论家过于注意翻译的共性而忽略翻译中的难题或将翻译中的难题当作次要问题来处理;Laviosa(2002:26-27)指出语料库翻译研究存在不少问题:第一,分析工具的词语索引有时不能提供足够的语境,从而妨碍对整篇文本或语义现象进行分析。第二,平行语料库在设计时,针对一个原文文本通常只收录一个译文文本,这样就会遮盖翻译现象的一个重要方面,即同一原文的不同译文之间的差异。Tiina Puurtinen(2007:150)也指出“语料库可能会忽视文本的宏观结构特征”。许钧、穆雷(2009:352)也指出,语料库翻译研究具有很强的实证主义倾向,十分强调客观性,若使用不当,很容易扼杀个人的主观能动性和创造性。此外,由于语料库翻译研究依赖于语料库的建设,其复杂的操作步骤和分析工具也给翻译研究带来了新的难题,如对语料库的深加工不够,这些因素将直接导致对文本的研究不够充分。在今后的研究中需要不断克服上述问题,从而使语料库翻译研究更加完善。

3 结论

上一篇:自锚式体系下一篇:载波线路