基于语料库的机器翻译

2024-06-25

基于语料库的机器翻译(通用12篇)

基于语料库的机器翻译 篇1

1. 引言

当今全球化进程中, 国际间交往和互动频繁, 作为发展中国家, 中国在积极地引进和学习国外先进的科学技术, 各个领域的外文科技文献源源不断地涌进中国, 并成为中国学者、技术人员等学习和研究的第一手材料。翻译外文科技文献过程中, 不可避免地会遇到许多科技术语, 需要准确翻译, 以使读者能够很好地理解, 不致疑惑。英国萨里大学 (Surrey University) 翻译学教授Peter Newmark (2001) 指出:尽管术语只占全文的约5%-10%, 但是他们却构成科技英语翻译与其它文体翻译的根本区别。科技术语的翻译应具有准确性、规范性和统一性。

一般认为, 科技术语可分为三类, 即专业技术术语 (各科技领域的专有术语) 、准技术术语 (本身由多种普通义, 在科技领域中获得扩展的新义) 和新创造的术语 (为表达新概念而创的术语) 。对于人工翻译来说, 科技术语的翻译可采用音译法、意译法、形译法、意音兼顾法和创造新词法等, 译者可以调动多年训练和储备的知识对某一领域的科技术语进行灵活的翻译。但是, 高度信息化的今天, 仅采用人工翻译显然不足以满足人们的需求。因为翻译者不可能通晓较多的专业, 不同译者对同一术语的翻译也可能有所不同, 而且时效性也比较差。而实践中可以看到, 目前基于规则、基于统计及基于实例的机器翻译在准确性上尚存在很大不足, 且尚未出现较为完整的科技术语翻译理论规则以支持科技术语的准确翻译。于是, 我们可以考虑使用基于语料库进行研究。

2. 平行语料库研究

自上世纪60年代美国Brown大学建立第一个电子语料库———Brown语料库的近几十年来, 语料库技术蓬勃发展。在国内外, 构建了大量的用于不同研究目的的语料库, 这些语料库按语体分, 有口语语料库和书面语语料库;按介质分, 有文字语料库和声音语料库;按时间分, 有共时语料库和历时语料库;按处理程度分有生语料库和熟语料库, 另外, 还有专有名词标注语料库、学习语料库等。20世纪90年代, Mona Baker等人将与翻译研究有关的语料库分为平行语料库 (Parallel Corpus) 、可比语料库 (Comparable Corpus) 和多语语料库 (Multilingual Corpus) 。本文中主要使用英汉双语平行语料库。

关于平行语料库的定义目前尚未得到统一, 本文使用的平行语料库按以下规则:即, 源语文本和译语文本在句子层面互为译文关系的语料库。英汉双语平行语料库即指互为对译关系的英语和汉语语料组成的语料库。

近年来, 从事语言研究和机器翻译研究的国内外很多研究机构都在致力于建设平行语料库, 现今已建立的英汉双语语料库有英国伯明翰大学 (the University of Birminham) 建立的中英对应语料库、英国兰卡斯特大学 (Lancaster University) 建立的Babel英汉语料库、北京外国语大学中国外语教育研究中心的通用汉英对应语料库、北京大学计算语言学研究所的汉英/汉日双语语料库、中国科学院自动化研究所的英汉双语语料库和哈尔滨工业大学的英汉双语语料库等。对这些平行语料库的研究包括建设、对齐和抽取信息等。

目前, 一些语料库采取双语自动对齐技术在篇章级、段落级、句子级以及短语级的水平上使源语文本和译语文本进行了对齐, 即, 通过一定算法将意义相同的源语和目标语自动对应起来。本文中, 由于是针对科技术语, 所以主要通过短语对齐技术进行加工处理。另外, 为在平行语料库中找到科技术语的源语和目标语, 还需要使用术语抽取技术。术语抽取技术通常结合了统计学和语言学的方法, 即, 使用统计学的方法获取候选术语, 再利用语言学的方法来筛选、过滤和修正。

应当注意:本文中所述科技术语仅限定为名词, 并且科技术语的翻译仅限定为由英语翻译成汉语 (即英译汉) 的过程。事实上, 因为汉语中的科学技术名词大多是近现代科技进入中国后通过翻译得到的, 所以仅就科技术语而言, 由汉语翻译成英语往往只是英译汉的逆向过程。

3. 科技术语的翻译问题

由于词汇的相对有限性和科技发展的无限性, 对新发明创造的事物的命名往往依赖于现有词汇。借助于各种手段用已有的词汇来表达, 使得在英语中不同科技领域往往会使用同一科技术语, 而这同样的科技术语翻译成汉语时往往会用不同的表达方式或词语, 即虽然源语言词语相同, 但译法却有所不同。而即使在同一领域中, 不同的事物上使用同一术语也会存在译法不一致的情况。通常有以下几种情况:替用词、多义词和词典无义项词。

3.1 替用词

英语作者在将某些部件命名时, 往往会使用众所熟知的形象的词汇以便于理解, 这种准技术术语不能直接翻译成原义, 否则不合文体, 但又不宜用其它符合文义但远离词语本义的词汇代替。如elbow本义指“肘”, 但在机械技术文献中经常用于表示位于两个构件之间可相对于其彼此运动的部分, 如同动物体的肘关节, 但不宜翻译成“关节”或“接合部”, 这样的词一般可译成“肘部”;同样地, finger可表示为“指部”或“指形部” (构件在形象上像伸出的指头) 等。

3.2 多义词

跟普通词汇一样, 有的科技术语在同一领域中也具有多种意义。如机械领域中的“tab”一词, 若出现在介绍易拉罐及相似物体等的科技文献中, 则翻译成“拉环”, 在其它特定结构的文献中有时可翻译成“挂环”, 或者“凸舌”, 总之, 就是指位于某个机械构件上便于对此构件进行某种特定操作的突出部分。但是, 有的新发明中的大致符合此特征的某些部分也被英语母语作者命名为“tab”, 这时, 再翻译成前述只有特定上下文使用的“挂环”“拉环”“凸舌”等便不再合适, 于是可以音译成“提攀”等。

3.3 词典无义项词

科技术语的翻译中, 理想的是, 仅利用传统的对比词典 (如英汉电子词典) 中列举的义项 (或者经过标注说明特定用法的义项) 与源语文本中的词语进行简单对应, 从而得到相应译文。但是, 在实际翻译过程中发现, 传统词典在面对一个词项的多种用途时往往表现地无能为力, 经常需要根据实际技术语境来创造新词, 这时则需要调用专业领域中独有的专业术语库。如“rib”一词在特定机械中称为“筋板”, 而这个义项在传统词典中一直未予收录。

虽然人们已经总结出各种译法或思想, 如音译法、意译法、形译法、意音兼顾法和创造新词法等, 但是对于计算机而言, 由于利用这些方法翻译时随机性和主观性较强, 故很难且尚未能将这些译法或思想用程序的方式较好地表现出来。所以有赖于使用平行语料库等已存在并正在不断扩充、更新的大量语言事实进行归纳总结, 择取较优译法或通用译法作为规范表达以用于机器翻译, 从而使翻译语言达到正确性和一致性。

4. 利用平行语料库进行加工处理

在平行语料库中, 首先, 利用术语抽取技术, 获取尽可能多的科技术语;然后, 使用短语对齐技术实现这些术语的源语文本和目标语文本之间的对齐。这时, 需要建立术语和领域相关性数据库、上下文相关性数据库, 对数据库进行动态更新, 另外, 还需要考虑交叉领域的术语翻译。

4.1 建立术语和领域相关性数据库

要建立同一科技术语与不同科技领域之间的相关性数据库, 需要以下工作:

(1) 将汉英平行语料库中搜集的语料所属的领域进行分类, 并标记其属性 (如医学领域, 可标记为英文;机械领域可标记为) ;

(2) 求出某一个领域同一个科技术语的各种译法所出现的概率P;统一各种表达中出现概率最高的几种 (最少一种) 形成一小组, 定为译语文本的候选规范表达;

(3) 将该术语的译文规范表达与该科技领域相关联, 即一旦确定该科技领域, 则当遇到该术语时, 根据第二步统一翻译成此规范表达小组中的一个。

如下所示:

可以看出, 同一英语科技术语也可以在不同的领域中译成同一汉语词语, 这是由各领域之间的相近性和词语涵义的相对稳定性决定的。但这并不影响特定领域中的具体翻译。

4.2 建立上下文相关性数据库

同一领域中, 科技术语之间需要有上下文相关性数据库。科技术语之间有上下位概念相关、局部和整体相关、同级相关等固有关系。由于这种固有关系, 使得某些科技术语之间的彼此同现机率很高。同一领域中, 很多词也有不同的翻译方法, 而这些译法多数与上下文中同现的上述某些词语相关, 所以可以用之以示区分。

例如, 机械领域中tab有多种译法, 但是如果上下文中出现或多次出现pop can (易拉罐) , 则意味着其意思是“拉环”的概率最大;如果上下文中出现或多次出现housing (壳体) 或container (容器) , 则意味着tab的意思是“凸舌”的概率最大;如果前述二者都未出现, 则音译表达“提攀”的概率最大。

由此可以在第一步的基础上, 将规范表达数组中的各个元素和其所在领域中同现的其它术语 (或称“特征词”) 通过计算最大概率而进行关联, 即, 如果在规范表达数组中同一领域同一特征词出现时有多个译法, 则可以取最大概率者建立相关性。此处“上下文同现”指同一句子中同现、同一段中同现或者同一文献中同现, 而不单纯指相邻的同现关系。术语间建立相关性如下所示:

机械领域:

显然, 这个过程可以采用现今比较常用的互信息 (mutual information) 的方法来实现。另外, 还可以使用与这些术语上下文同现概率较高的形容词或动词来作为特征词。

4.3 动态更新数据库

科学技术的发展日新月异, 新型技术产品不断涌现, 技术交流更加频繁, 汉英平行语料库的规模也在持续扩大, 英语科技术语持续增加, 同一领域同一术语的某一译法在其所有译法中所占的概率在相对稳定中也势必会发生相应的变化。我们必须利用各种有效的途径不断地扩充和完善科技术语相关性数据库。例如, 依靠强大的搜索引擎功能搜集互联网上丰富的双语语料资源, 并运用各种技术对所搜集的信息进行加工、处理和完善, 以满足正确处理科技术语所满足的条件。对于个体软件而言, 可以利用翻译记忆机制, 不断地记录翻译过程中所得到新的翻译结果, 并实时地在后台进行整理归总, 动态地得出用于后继科技术语翻译所需的数据。事实上, 这一点已在一些翻译软件中初见端倪, 如翻译记忆软件Trandos、Transit等。

4.4 交叉领域中科技术语的处理

当今世界科技领域的发展已经不再是单纯的独立的发展, 跨学科、跨领域的研究或技术开发已经成为是不可忽略的一大趋势。原来应用于两个特定领域的由同一源语词语表达的术语很有可能在同一篇跨领域的科技文献中同时出现, 此时便有区分这些术语的必要。仍以上述elbow为例, 虽然在医学领域和机械领域可以进行不同的翻译, 但是, 在医疗器械中则有可能混合两种用法, 如一种医疗器械所要作用的位置与肘关节 (即elbow) 相关, 而同时这种医疗器械的某些构件之间的连接处也有可能被源语作者命名为elbow。当然这种情况较为少见, 但不可完全忽视。这种情况下, 可以尝试在相对较小范围内寻找与源语关联的特征词, 如可仅在一小段或一句中寻找。这样可以降低不同译语混淆的可能性。

综上所述, 基于平行语料库的科技术语翻译处理过程的实现可以用下图表示:

5. 所存在的问题:

同一领域中科技术语的特定用法和其一般用法的冲突问题。由于某些准技术术语来源于一般表达, 当在某一领域的科技文献中使用时很有可能出现这种情况:即, 该术语既有一般用法, 又有该领域的专门用法, 这时可能会使得具有一般用法的词也翻译成专门用法。如“tab”在机械领域的文献中可能用作上述“提攀”“拉环”等的意思, 同时也可能有“标签”的用法 (如在机器上贴的标签) , 如果忽略了这种基本用法, 势必会造成某些错误。而如果将一般用法也通过特征词加入到相关性数据库的话, 则可能会由于一般用法的特征词较多而在翻译中喧宾夺主, 从而大大降低该术语翻译的准确度。这一点还需要在构建科技术语相关性数据库时做进一步的考虑。

另外, 当前汉英平行语料库质量参差不齐, 构建语料库时所抽取的语料中对某些科技术语的翻译有很多尚不到位, 而且通过网络扩展和更新, 或加入更多的质量不均的语料, 从而使统计出的译法难免有失偏颇。

摘要:本文分析了英汉科技翻译中针对科技术语的翻译问题, 并提出了应用英汉平行语料库解决这些问题的方法。通过英汉平行语料库建立同一科技术语与不同科技领域之间的相关性数据库以及同一领域中科技术语之间的上下文相关性数据库, 并借助互联网等途径不断地对之进行动态更新, 从而为准确翻译科技术语提供有力的支持。

关键词:平行语料库,科技术语,英汉翻译,相关性,特征词

参考文献

[1]王思宽;基于规则和基于统计相结合的中英双语平行句对短语对齐方法[D].北京邮电大学, 2010.

[2]屈刚.英汉双语短语对齐[D].上海交通大学, 2007.

[3]孙乐, 金友兵, 杜林, 孙玉芳;平行语料库中双语术语词典的自动抽取[J].中文信息学报, 2000 (06) .

[4]张文静, 梁颖红.术语抽取技术研究[J].信息技术, 2008 (03) .

[5]张锋, 许云, 侯艳, 樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究.2005 (05) .

[6]石春让, 赵巍;科技术语翻译:归化是正途[J].山东外语教学.2010 (01) .

[7]刘超朋.平行语料库概述.燕山大学学报 (哲学社会科学版) , 2007 (S1) .

[8]廖七一.语料库与翻译研究[J].外语教学与研究, 2000 (05) .

[9]杨晓军.基于语料库翻译研究和译者教育[J].外语与外语教学, 2007 (10) .

[10]柏晓静, 常宝宝, 詹卫东, 吴拥华.构建大规模的汉英双语平行语料库[A].机器翻译研究进展——2002年全国机器翻译研讨会论文集[C].2002.

[11]李安兴.双语语料库与汉英词典词目翻译质量的进一步提高[D].复旦大学, 2005.

[12]谢家成.自建英汉平行语料库与翻译研究.长江大学学报 (社会科学版) , 2007 (01)

基于语料库的机器翻译 篇2

翻译教学旨在培养学生的.翻译能力和强化其翻译认识.语料库强大的语料存储功能为翻译教学提供了丰富的例句,因此翻译教学中引进语料库对学生素质的培养有着特殊的作用.本文介绍了平行语料库、可比语料库和自建小型语料库的应用.

作 者:赵玉闪 史娟  作者单位:华北电力大学外国语学院,北京,102206 刊 名:中国电力教育 英文刊名:CHINA ELECTRIC POWER EDUCATION 年,卷(期): “”(10) 分类号:H3 关键词:翻译教学   语料库   应用  

基于语料库的机器翻译 篇3

【关键词】语料库;译文分析;翻译策略;比较研究

一、引言

语料库和翻译研究的结合产生了一种连贯、综合和丰富的研究范式,它涉及了翻译理论、描写和实践等方面的诸多问题。语料库分析方法可以从一个新的视角认识语言,并且一定程度上可以对文本进行自动分析。本文采用AntConc和ParaConc软件以及微软word的查找替换功能对《荷塘月色》的两种英译文的翻译策略进行统计和对比。

二、研究结果和分析

(一)词汇密度

本文主要使用了数据库处理软件antconc,在生成词汇表的同时生成了两个译文的基本信息,包括:两个文本的形符、类符、类符形符比。两个译文的基本信息如下:

表1两个译本中类符/形符的相关统计

项目朱纯深译文《中国文学》译文类符392345形符789697类符/形符比49.68%49.50%计算词汇密度的方法是:

词汇密度=不同单词的数量/所有词汇×100

根据表1显示,朱纯深译文的形符数多于《中国文学》译文,且类符/形符比略高于《中国文学》译文。表明《中国文学》译文的用词变化度不如可比文本,重复率较高,词汇密度小,而朱纯深译文语言使用较灵活,更趋于创造性。

(二)两个译文按频率排列TOP10词的比较

表2

Rank12345678910朱译theainofisandIlikemypond中译theandofainwasIlotuspoolfrom 两种译文排列前几位的高频词汇基本上均是the, a , in, of,and. 尽管顺序不一样,基本与英语国家语料库中高频词使用的前六位(to除外)一致,说明两种译文都较符合英语语言表达。

(三)原文中比喻词的翻译比较

原文中采用了较多的比喻句来描写景色,其中用到了“像”,“如”,“仿佛”等比喻词,为了对比译文中对这些比喻词的翻译,使用paraconc软件中的parallel concordance功能分别对两种译文与原文中的比喻词进行对比分析:

表3

原文出现频率朱纯深译文出现频率《中国文学》

译文出现频率像3like2seem1like1/1as1又像1like1seem1如3/1like2like3正如1like1like1又如2like2like2仿佛2like1like1as if1seem1其中“/”表示译文将原文中的明喻作暗喻处理,即译文中没有比喻词出现。例如:在朱纯深译文中:

The moon sheds her liquid light silently over the leaves and flowers.

(月光如流水一般,静静地泻在这一片叶子和花上。)

在《中国文学》译文中:

...while in a flash the scent was carried away.

(像闪电般霎时传过荷塘的那边去了。)

从表3中可以看出,朱纯深使用like一词共9次,seem共1次,as if共1次,暗喻处理1次;《中国文学》译文使用like一词共8次,seem共2次,as共1次,暗喻处理1次。虽然整体基本相同,相较之下,《中国文学》译文使用比喻词的基础译词“like”的次数少于朱译文,因此它在翻译比喻句时的词汇丰富程度上略高一筹。

(四)平均句长

首先运用AntConc软件分别统计两个译文文本的总形符数,然后用word软件的查找替换功能,通过查找替换,计算出句子总数,最后计算出平均句长。平均句长=总形符数/句子总数。通过以上方法计算出:

朱纯深译文的总形符数为789,句子总数为36,平均句长为21.9

《中国文学》译文的总形符数为697,句子总数为29, 平均句长为24.0

句子越长,其理解难度越大,同时其语言也更正式。与英语句子平均句长为17.8个单词相比,两种译文的平均句长远高于普通英语句子的平均句长,说明两种译文相较于普通英语其理解难度大,且《中》译文比朱译文平均句长大,所以《中国文学》译文的理解难度更大。

三、结论

本文运用语料库的统计方法,从词汇和句法两方面对《荷塘月色》的两种英译本——朱纯深译文和《中国文学》译文进行了粗浅的分析,通过比较《荷塘月色》两个译文在类符/形符比、高频词、比喻词的翻译、平均句长等方面,可以发现不同的译者在这些方面表现出不同的特征。通过高频词比较,发现两种译文都比较符合英语语言表达。朱纯深译文词汇密度较高,语言使用灵活,有创造性。《中国文学》译文降低了词汇密度,使文本容易读懂,但平均句长比朱纯深译文大,所以在句式理解方面又有了些许难度。总的来说,《中国文学》译文在内容和形式上更忠实原文。另外由于所选取的语料较小,得出的结论还待使用更大的语料库来进一步考证。

【參考文献】

[1]王立菲.计算机辅助第二语言研究方法与应用[M].北京:外语教学与研究出版社,2007.

[2]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2011.

[3]田行宇,梁梅红.基于语料库的英文审计报告文体特征分析[J].商业现代化,2011,(3).

[4]张思.中西媒体英文报道词汇特征比较[J].重庆科技学院学报,2010.

[5]张文令.语料库与译者培养探索[J].改革与开放,2010,(6).

【作者简介】

张家铭(1990— ),女,陕西咸阳人,西安外国语大学外国语言学及应用语言学专业研究生。研究方向:商务英语。

基于语料库的机器翻译 篇4

关键词:商务翻译,语料库,教学改革

“随着国际商务活动范畴的不断扩展和现代中国社会对复合型人才的需求,商务英语已经成为一个独立的本科专业。”[1]目前,全国已经有七百多所高校开设了商务英语专业或商务英语方向,发展势头迅猛。但是,问题也随之而来。由于历史较短,我国的商务英语专业建设还面临着诸多问题,学科定位和人才培养模式都有待规范化。随着近年来语料库语言学的蓬勃发展,大型语料库的建设与研究为话语分析等语言研究领域提供大量的真实素材,使得辞典、教材以及试卷的编写都发生天翻地覆的变化。在语料库的驱动下,以真实语言生活状况为基础的教学模式改革可以提高商务翻译实践教学的效率,改善教学效果,推进商务翻译实践教学的进一步发展。

一、商务英语语料库概述

Nelson(2000)建立的102万词次的“商务英语语料库”,收录28类商务文本,是最早的商务英语语料库。其中,书面语料为56%,口语语料为44%。全库语料由“关于商务的”(about business)和“商务实践”(to do business)两类构成。其中,商务实践类语料大部分来自于各公司的真实商务文件,对于研究真实语境中的商务英语特点具有重要意义。Nelson呼吁以真实语料为对象的商务话语研究,并利用语料库软件将自建的商务英语语料库与英国国家语料库、公开资料语料库进行对比,分析商务英语与日常英语在词汇选择上的异同,发现在礼貌程度、句型及句式等方面二者的差异很大。Nelson(2000)首次采用语料库的方法揭示商务英语的语言特点和语用特点,在一定程度上显示出商务实践与商务教学衔接中的问题[2]。

剑桥出版社出资、诺丁汉大学Carter和Mc Carthy教授组织建设的“剑桥与诺丁汉商务英语语料库”是目前世界上规模最大的商务口语语料库[3]。该语料由采集自26个英国公司的64场录音组成,共912734词次,其中完整地保留了停顿、打断和修正等语言特征。在语料分类上,作者区分公司间与公司内的语料,并让互动者自己对语料的分类进行判断,避免观察者的参与对语料自然性的影响。Handford(2010)以该语料库为基础,分别从商务洽谈的体裁、词汇、话语互动标记与互动、人际语言以及话轮转换等方面深入剖析商务互动,为商务英语教学提供很多改革建议。

二、语料库的特点

首先,语料库能够反映商务话语实践的真实状况。随着研究的不断深入,学者们逐渐发现以模拟语料和人工语料为基础的商务翻译教学存在很多弊端,商务实践中的应用性不强。究其原因,模拟语料和人工语料大多由研究者主观推测产生,与现实情况的切合度不高。

其次,语料库能够丰富商务翻译教学材料。由模拟语料或人工语料构成的教学材料说服力不强,与商务翻译实践连接不够紧密,导致教学效果不理想,学生获得的知识与实践相脱节。语料库驱动的商务翻译教学改革可以改善这一状况,为商务翻译教学提供真实生动的教学材料,改善翻译教学模式,提供教学效率,改善教学效果。

再次,基于语料库的教学改革有利于使商务翻译实践与教学紧密结合,改善教学效果。商务活动由于与各方经济利益紧密相关,因此多年来一直带着神秘的面纱。学者的研究和教学均以参与人员的经验为基础,这使得教学的材料过于陈旧、单一,不能真实地反映商务翻译活动现状,使得翻译教学与实践严重脱节,导致教学效果不理想。基于语料库的研究能够保证材料的时效性与真实性,因此可以使教学内容与商务翻译实践紧密衔接,提高教学质量,改善教学效果。

最后,基于语料库的研究有利于改善商务翻译人才的培养模式。随着我国经济蓬勃发展,国际影响力不断提升,与各国的商务往来日趋频繁,更加凸显商务翻译人才的需求与重要性。语料库驱动研究有助于改善商务翻译人才的培养模式,提高翻译人才的素质,以便能更快更好地为国家培养与输送商务翻译人才,整体提高我国企业参与国际竞争的“软实力”,为我国在商务实战与研究中争得一席之地。

三、商务翻译教学的重点与难点

商务活动的特殊性对翻译的恰当性与准确性提出很高的要求。商场如战场,丝毫失误都有可能影响商务活动的成败。跨语种的商务活动由于受到双方母语不同的限制而需要翻译人员。但是,商务翻译与其他类型的翻译活动不同,对翻译人员的语用能力要求较高,需要有很好的临场应变力。这些是由商务活动自身的特性决定的。商务话语不同于其他类型的机构话语,其形式化的限制相对较少,一切活动均以双方的经济目的为导向。因此,在话语的选择上呈现多样性,并辅以多种话语手段,采用直接言语行为的时候较少。这些语言特点都给商务翻译人员的工作造成很多难点,自然也给商务翻译实践教学提出更大的难题。

首先,商务翻译教学缺乏合理有效的教学材料。商务活动与经济利益密切相关,使得其私密性强,语料的获取难度大。这在一定程度上影响了商务翻译教材的编写与发展。其次,商务翻译教学缺乏实战性。商务翻译要求译者具有很好的语用能力和语境分析能力,而这些在现有的教材编写与教学中都很难实现。再次,商务翻译教学需要重视翻译理论的传授。理论源于实践,也能指导实践。掌握一些先进的翻译学理论可以有助于译者更好地分析翻译语境,选择自己的翻译策略。最后,商务翻译教学需重视商务体裁知识。不同的体裁具有不同的特点,自然也会选择不同的商务话语。译者明晰各类体裁的特征有助于更好地把握原文与译文的语言特点,尽可能恰当准确地进行翻译活动。

四、基于语料库的商务翻译教学改革路径

语料库语言学的发展为很多领域的语言教学研究提供了更多、更好的语言资源。不仅教师和研究者开始使用语料库辅助教学与研究,很多学生也开始使用语料库进行语言学习。可以说,在当今的大数据时代,语料库的建立与使用是推动语言教学改革的重要力量。语料库的引入对于商务翻译教学的改革主要体现在以下几个方面。

第一,语料库有助于商务英语词表的建立。作为机构话语的一种,商务英语具有自己的常用词汇与体裁。语料库作为大型的词汇库,可以通过软件检索并建立商务英语专业词表。这样可以有助于重点词汇和常用词汇的确定,可以为商务翻译教学中的词汇教学部分提供参考。同时,语料库配套检索软件的使用也可以帮助教师和学生在学习过程中查找例句,掌握词汇的具体用法,尽量避免语用失误现象。

第二,语料库驱动的商务翻译教学有助于减少实践中的语言不虞现象。商务活动是双方利益的面对面交锋,双方通过语言上的较量来争取各自利益的最大化。翻译在其中起到至关重要的作用。商务翻译不仅要求准确,更重要的是恰当、合适。商务翻译教学往往缺少现实语料的支撑,使得教学内容与实践相脱节,导致学生培养水平不高,教学质量难以提升。引入语料库后,语料库可以提供大量真实的翻译案例,并可以对某些用法的出现频率进行统计。这样可以有助于教师和学生了解商务翻译中的常用固定搭配和语言表达方式。

第三,语料库可应用于商务翻译教学多媒体课件开发。目前,多模态语料库成为国内外学者的研究热点。将译员在翻译实践中的真实表现进行录像,改建为多模态的商务话语语料库,可以编写成多媒体课件直接应用于课堂教学,使得教学活动更加生动、有趣,教学内容更加直观,可以提高学生的学习兴趣,进而改善教学效果。

第四,语料库可应用于教学大纲的编写与人才培养模式的改善。基于真实语料的教学活动在国外已经得到广泛开展,并且取得良好效果。因此,语料库驱动的商务翻译教学改革研究结果可以应用于改写现有的翻译教学大纲,将基于真实语料的翻译教学引入课堂,进而改变现有的机械、死板并且应用性不强的人才培养模式,使得译员的培养可以更加高效、高质。

“与传统英语教学相比,商务英语专业是一个多元化,并且在不断发展、完善中的专业。”[4]因此,专业建设的很多方面都有待提高和完善。商务英语专业的课程设置要求学生能够在双语环境下熟练应用各类商贸技能,以便应对未来商场实战的需要。商务翻译能力作为商务话语能力中的重要部分,要求学生具有较好的知识储备和较高的语言能力,同时也对商务翻译教学提出挑战。如何能够把握瞬息万变的商场局势,提供尽可能准确、恰当的翻译是译者需要不断揣摩和训练的。语料库驱动的商务翻译教学不仅可以为学生提供更多的语料资源,使其有机会甚至全面地了解商务翻译实践的真实状况,同时也可以帮助教师更好地向学生展现和讲解商务翻译活动的过程,提高学生的商务沟通能力与商务翻译能力,以便更好地满足社会需要,为我国经济的快速全球化输送人才。

参考文献

[1]严明.商务英语能力构念界定和测试[J].当代外语研究,2012,(2).

[2]谢群.商务谈判话语互动研究[D].武汉:华中师范大学,2013.

[3]谢群,廖美珍.《商务洽谈语言研究》介绍[J].当代语言学,2013,(1).

基于语料库的网络语言的隐喻研究 篇5

基于语料库的网络语言的隐喻研究

采用问卷调查和访谈的方式,对网络语言(CML)交流现象进行研究.通过自行建造的英文文本语料库手段,发现参与聊天的.年轻人网络语言简练,隐喻俯拾可见.认为在观察网络语言的框架中.通过对隐喻处理的认知的、语言的和话语交际的分析,把隐喻能力作为处理网络语言交际的指导.从而建立隐喻理论在网络语言交流中的应用实施框架.

作 者:刘先宽 作者单位:沈阳师范大学,外国语学院,辽宁洗阳,110034刊 名:重庆科技学院学报(社会科学版)英文刊名:JOURNAL OF CHONGQING UNIVERSITY OF SCIENCE AND TECHNOLOGY(SOCIAL SCIENCES EDITION)年,卷(期):2008“”(2)分类号:H030关键词:网络语言 隐喻 语料库 实施框架

基于语料库的机器翻译 篇6

国外学者较早地进行了网络语料库在外语教学中的应用,Johns(1997)早在20 世纪末就提出以语料为基础的“研究-操练-即兴产出”模式。Gilmore(2009)利用BNC和COBUILD网络语料库来帮助日本学生修正英文写作中的语法错误,结果表明有61.14%经过修改的作文的语言准确性得到了提高。

网络语料库的开发和利用在我国虽然起步较晚,但是相关的研究也在近年来层出不穷。陈建生(2004)论证了网络语料库语言学研究和描述英语的方法在教学大纲制定、教材编写和课堂教学中得到广泛应用的合理性。吴军(2010)主张改革传统的语法教材,用网络语料库中真实、鲜活的语言来解释语法规则,实现语法和词汇(尤其是词串)的结合。

将网络语料库应用于语块教学也是近年来的研究热点。语块被认为是语言输出的基本构成单位。Lewis(1993:89)甚至认为“语言是由语法化的词汇而不是词汇化的语法构成”,并提出词汇中心教学法(Lexical Approach)观点。

笔者认为,英语中语块数量繁多,要提高语块运用能力,关键还是靠培养学生的语块意识,自主地提高语块运用的能力。2013年大学英语四级考试中的翻译部分出现了新的调整,原先单句汉译英调整为段落汉译英。同时,翻译的内容将会涉及中国的历史、文化、经济、社会发展等。这与近年来外语教学中注重学生文化与人文精神的培养有关,有利于传播中国文化。由此可以将中国历史和文化作为大学英语翻译教学中一个很好的切入点。翻译教学中可能会涉及到中国的节日、旅游活动,以及体现社会文化发展的特殊表达方式与新兴词汇,大部分都是由一些词组或固定搭配的短语构成。为了帮助学生开展自主高效的翻译练习,教学中会利用网络语料库资源对学生进行有针对的语块教学。故笔者尝试利用句酷网,来提高学生在大学英语四级考试中的翻译水平,实现自主性、探究性和数据驱动学习。

一 研究设计

1 研究问题

(1)基于网络语料库的语块教学能否提高学生的语块运用能力与翻译水平。

(2)学生的语块运用能力与翻译水平是否存在相关性。若存在,相关性如何。

2 研究对象

陕西省某高校非英语专业学前教育专业二年级的学生,共60名学生,分布于两个同质平行班,每班30人。实验第一周对两个班进行了前测,并对测试结果进行了独立样本t检验。检验结果为,控制班的均值为14.83,标准差为1.85,实验班的为14.93和2.43,数值非常接近,没有显著差异( sig=0.311>0.05)。从整体上讲,两个班的语块运用能力与翻译水平大致相当。实验过程中,授课采用同一个教师,同一个教材,教学模式相当,教学周为18周,实验持续17周。

3 研究工具

(1)网络平行语料库:句酷网(http://www.jukuu.com/)。

(2)数据分析工具:SPSS 20.0 ,Excel。

(3)测试评分方法及标准:满分30分,分为两部分。第一部分:汉译英段落翻译得分,满分15分(参照大学英语四级翻译评分标准);第二部分:语块应用得分,满分15分,每个语块计1分,重复使用不计分,用到15个语块及以上,按15分计。每次测试评分由三位老师分别批改,分别给出段落翻译、语块应用得分及两者相加的总分,最后取各部分平均分作为每位学生段落翻译的总分、翻译得分和语块应用得分。

4 实验步骤

(1)第1周:前测。其试题为120字左右的段落汉译英练习题,来源于改革后的四级模拟题汉译英部分,与后测试题难度相当,语块核心词词频和词块种类分布相同;参考大学英语四级汉译英段落翻译时长,测试时间为30分钟。前测结束后,以课堂讲座的形式(20分钟)培训实验班学生使用网络平行语料库。

(2)第2周到第16周:实验班与对照班由同一教师授课,实验班教师在授课过程中,指导学生识别语块并使用网络平行语料库学习语块;借助网络平行语料库,用语块教学法讲解课堂上的翻译练习;要求学生使用网络平行语料库完成每周课后汉译英段落翻译练习题。对照班教师在授课过程中不使用网络平行语料库进行语块教学;不要求学生使用网络平行语料库完成每周课后汉译英段落翻译练习题。课后汉译英段落翻译练习共12次,第2到第16周(除第5、9、13周外)每周一次,练习题与前后测试题同质,来源于改革后的四级模拟题汉译英部分。

(3)第17周,后测: 其试题与前测试题同质,测试时间为30分钟。

二 数据分析

1 基于网络语料库的语块教学对学生的语块运用能力与翻译水平的影响

实验前,两个班级在翻译中的水平基本相当,短文中平均语块使用数分别为 4.31 和4.19个( p>0.05)。实验后,控制组语块使用的数量有所增加, 而实验组则进步明显, 从 4.19 个增加到 8.13个, 两组具有显著性差异( p < 0.01)。通过进一步观察,我们发现,通过培训的实验组学生翻译中的语块使用趋向于准确性和地道性,尤其在过渡语的使用上,能较多地使用语块,与传统的翻译教学模式相比,基于网络语料库的语块教学模式能显著提高学生的语块运用能力与翻译水平。

2 学生的语块运用能力与翻译水平的相关性

实验前,两个班级在语块综合能力方面水平相当,在满分为30分的测试中,两个班级均取得14分以上的平均分,两组成绩无显著性差异( p>0.05)。在实验后,实验组和控制组均取得不错的成绩,这主要跟部分语块来自于课本新词汇有关,两个班级对新词汇的语块整体掌握都不错。但是,实验组的语块水平要明显高于控制组,两者具有显著性差异(p<0.01)。也就是说,在语块的识别和产出性方面,尤其是在实验阶段新学的词汇,实验组得分率要高于控制组。可见,学生在翻译中偏向于使用新学的词汇,利用语料库检索并使用新学词汇,强化了新词汇的语言输出,有助于学生对词汇的深层次掌握。词汇的加工越深,词汇越容易被记住。同时可以看出,学生的语块运用能力与翻译水平存在正相关关系,即学生语块运用能力越强,翻译水平也就越高。但是,我们应该承认这个进步并不大,究其原因是实验时间长度的问题。在一个学期的实践中,学生尝试的时间并不多,要进一步提高翻译语块运用能力需要一个更为漫长的时间段。

三 总结与启示

本文基于网络语料库,针对改革后大学四级汉译英翻译教学,探究了语块教学在大学英语四级汉译英翻译教学中的作用。实验结果证明,基于网络语料库的语块教学能够提高学生的语块运用能力,并且提高了学生的翻译水平;学生的语块运用能力与翻译水平存在正相关关系,即学生语块运用能力越强,翻译水平也就越高。因此,为了提高学生的翻译水平,在翻译工具方面,首先,教师应该考虑运用调动学生自主学习积极性的工具。其次,鼓励学生及时整理复习已有语块知识,加强已有语块知识的记忆和保持。本文研究得到的结果还有待更多的实验去进一步验证,也希望能为以后的研究提供一定的参考和借鉴。

参考文献

[1]罗选民.中国的翻译教学:问题与前景[J].中国翻译,2002(4).

[2]楼捷.网络英语语料库对促进汉英翻译语块准确性的作用[J].英语教师,2011(11).

[3]Johns,T.Context:The Background, Development and Trialling of a Concordance-based CALL Program. In Wichmann. A, S, Fligelstone, T. McEnery& G. Knowles (eds.). Teaching and Language Corpora[M].New York: Addison Wesley Longman,1997.

[4]Gabrielatos C. Corpora and Language Teaching:Just a Fling or Wedding Bells? [J].Teaching English as a Second or Foreign Language,2005(4).

[5]Gilmore A. 2009. Using Online Corpora to Develop StudentsWriting Skills. ELT Journal(3), 363-372.

[6]陈建生.语料库语言学与英语教学[J].解放军外国语学院学报,2004(1).

[7]吴军.语料库与英语语法教学[J].外语学刊,2010(1).

[8]何安平.语料库在外语教育中的应用:理论与实践[M].广州:广东高等教育出版社,2004.

基于语料库的机器翻译 篇7

公示语翻译是一个国家对外交流水平和人文环境的具体体现。因此其翻译质量将会响到游客的旅游线路、兴致、感受及印象, 进而间接影响我国旅游业的发展。因此, 对旅游景区公示语的特点和翻译策略进行探讨具有很强的现实意义。

公示语就是公开和面对公众, 告示、指示、提示、显示、警示、标示与其生活、生产、生命、生态休戚相关的文字及图形信息。凡公示给公众、旅游者、海外宾客、驻华外籍人士、在外旅游经商的中国公民等, 涉及衣、食、住、行、游、娱、购行为与需求的基本公示文字信息内容都在公示语的研究范畴之内[1:2007]。该文主要围绕无锡市4A级和5A级旅游景区的公示语翻译展开研究, 旨在研究公示语文字信息内容, 主要包括导游图、票价、景点解说、景区设施说明等景区内公示语的翻译。

近几年来, 国内学术界逐渐开始关注旅游景区公示语, , 对此展开了一系列的研究。通过梳理国内在景区公示语研究方面的研究成果, 我们可以归纳出我国目前景区公示语研究主要呈现以下特征:研究成果总量不多, 但呈现逐年增长的趋势;高质量的研究成果太少, 在公开发表的51篇相关论文中, 只有一篇发表在核心期刊上;愈来愈多的学者尝试借用相关翻译理论分析研究景区公示语翻译, 其中目的论功能翻译理论做受欢迎;大多数研究采用了定量与定性相结合的研究方法, 但研究样本总体偏小;研究方法大多以零星调查和个人主观感受为主, 缺少研究方法上的突破。北京第二外国语学院于2008年建成的全国公示语翻译语料库让学术界看到了语料库语言学方法在景区公示语研究方面的应用价值, 为国内相关研究开启了新的视角。但遗憾的是, 该语料库目前一直处于瘫痪状态, 未能有效的发挥其应有的应用价值。而同样遗憾的是, 国内景区公示语研究方面的学者对语料库方法并不是很感兴趣, 在公开发表的相关论文中, 通过语料库语言学途径对景区公示语展开研究尚属凤毛麟角。有鉴于此, 该文试图在此方面进行一些尝试, 采用语料库语言学的研究方法对无锡各大旅游景区的公示语翻译展开研究。

2 语料库的创建

2.1 语料收集

本文的研究对象主要为无锡市4A级和5A级旅游景区的导游图、票价、景点解说、景区设施说明等景区内公示语的翻译, 所以语料的收集过程比较繁琐。作者首先深入到各大景区拍摄了近200张相关公示语翻译的图片, 然后通过汉王OCR图片识别软件将图片信息转换成Word文档, 辅助以人工校对, 再转换为文本文档, 从而构成无锡旅游景区公示语英汉平行语料库 (以下简称为WXTEC) 的语料来源, 该库共包含680个句对。

2.2 语料的整理、标注和对齐

在语料文本的整理过程中, 作者使用了一款叫做“文本整理器”的免费软件, 该软件作者署名为“风林”。界面友好直观, 操作简单。可单个处理文本, 也可批量处理文本[2:33-34]。

本研究的标注首先采用词性赋码。通过CLAWS词性赋码器, 我们对英文文本进行了词性标注, 该软件是兰卡斯特大学计算机语料库研究中心研制开发的, 赋码准确率一直维持在96%~97%之间。另外, 为了便于对公示语英译策略展开研究, 我们在句子层面上对无锡市旅游景区公示语语料库中的680个句对进行了翻译策略标注。

鉴于研究目的, 本研究要求英汉语料实现句子层面上的对齐, 但由于语料本身的特点, 中英语料实现自动句子对齐错误太多, 所以本语料库的语料对齐主要采用人工对齐方式。

3 数据统计与分析

3.1 基本数据统计与分析

以普通英语语料库FLOB作为参照语料库, 通过语料库软件Wordsmith 5.0, 我们可以得到以下关于两个语料库的基本数据。

类符/形符比在一定程度上反映了文本用词的变化性。但是当文本容量达到一定程度时, 两者的比率无法反映用词的变化性。因此我们需要采用标准化类符形符比来反映用词的变化性。从表1的标准化类符/形符比来看:WXTEC的用词变化性大于FLOB;平均词长稍长与FLOB;平均句长和平均句长标准差均大于FLOB。这说明和普通英语相比, 无锡旅游景区公示语英译文本的用词更为丰富、难度更大, 句子更长、句式变化更大。

借助Antconc软件我们分别检索了WXTEC和Flob中名词和动词的比重, 名词的比重分别为39.03%和33.73%;动词的比重分别为12.43%和17.78。这说明了无锡旅游景区公示语英译文本中名词使用比重较大, 而动词偏少。

3.2 翻译策略统计分析

借助于多语种语料处理软件 (HyConc) v3.9.6, 我们对经过翻译策略标注的WXTEC的680个句对进行了检索, 从而得出了各个翻译策略的使用情况。

如图1所示, 无锡市旅游景区公示语英译采用的翻译策略依次为直译、分译、音译加直译、音译、漏译、省译、合译和死译。我们通过软件 (HyConc) v3.9.6, 对采用相应策略的英汉平行语料进行了检索分析, 结果显示各大景区在公示语英译时首先考虑的便是直译;在翻译较长的中文源文本时, 最常用的策略便是把源文先进行拆分, 然后翻译成多个英文句子, 极少数景点采用合译的策略;在翻译景点名称时几乎毫无例外的采用音译加直译的策略, 有些景区竟然全用拼音拼出, 甚至出现死译硬译现象;在牵涉到历史典故或者历史事件介绍时, 大部分景点都选择了漏译或者不译, 少数景区采用了省译;在涉及中国特色文化时, 部分景点采用了直译加注解的增译策略, 而大部分景点只是采用音译策略。

4 结论和不足之处

本文首先以Flob为参照语料库, 通过语料库软件Word-smith 5.0和Antconc统计分析了无锡市旅游景区公示语英译文本的主要语言特征:大量使用名词;动词使用偏少;用词更为丰富;词汇难度更大;句子更长, 存在明显的句式扩张现象。在此基础上, 结合无锡市旅游景区翻译策略的使用情况, 我们可以得出如下结论:

第一, 直译是各个景点最常用的翻译策略, 但要注意, 在英汉句子结构差别较大时适当采取分译、合译等其它策略, 否则便可能出现死译硬译或者句式扩张的现象;

第二, 在景点名称的翻译方面, 可以参照《江苏省旅游景点景区名称英文译写规范》:以历史事件命名的景点, 应将专名意义译出;以历史建筑命名的景点, 专名可用汉语拼音拼写, 也可用英文将其意义译出;以传说、典故、特定文化命名的景点景区, 应将专名意义译出;以独具特色的本地特产命名的景点, 应将专名意义译出。决不能一刀切地采用“音译加直译”的策略, 更不能采用全用拼音拼写的做法, 从而使翻译的文化传递功能遗失殆尽;

第三, 在历史典故、历史故事以及中国特色文化的翻译方面, 我们应该考虑外国游客的文化期待, 尽量满足游客的文化猎奇心理, 采用直译加注解的策略, 而不能一味漏译或者回避不译。

无锡市“十二五”旅游发展规划提出要全力打造国际化旅游休闲目的地城市。该文试图采用语料库语言学的研究方法对旅游景区的公示语翻译展开研究, 有助于规范旅游景区的公示语翻译, 从而有效维护无锡市国际旅游目的地形象;在寻求新的景区公示语研究方法方面做出了一些尝试, 但语料的规模太小, 目前仅限于无锡境内;平行语料的翻译策略标注是否具有说服力, 有待学术界的进一步验证。期待今后的研究能在这些方面取得更大的进展。

参考文献

[1]王颖, 吕和发.公示语汉英翻译[M].北京:中国对外翻译出版公司, 2007:13-14.

[2]梁茂成, 李文中, 许家金.语料库应用教程[M].北京:外语教学与研究出版社, 2010:33-34.

[3]刘笑歌, 钟庆伦.开封旅游景区公示语汉英翻译失误分析及规范[J].海外英语, 2012 (1) :155-158.

[4]吴敏.顺应论视角下旅游景区公示语英译原则分析[J].阜阳师范学院学报:社会科学版, 2011 (4) :53-56.

基于语料库的机器翻译 篇8

语料库是指按照一定的语言规则,收集自然出现的连续语言,运用语言片段建立的具有一定容量的大型电子文本库,是一种基于语料检索和频率统计功能的语言研究工具。它能够帮助使用者观察和把握语言事实,分析和研究语言规律,检测和验证语言词汇、语法、语义。从语言教学层面来看,语料库的比较、统计、筛选等方法能为外语教学者提供必要参考信息。从语言学习角度上看,掌握语料库的基本功能,能帮助学习者更好地获取专业知识,学习专业术语,借鉴表达方法。段中燕、胡丽娟[1]指出,翻译课程是一门以理论为指导、以实践为基础的专业课程,在教学阶段需要教学者与学习者之间的相互配合。语料库在其日渐发展完善的过程中,能够同时为教学者和学习者提供丰富的资源和科学的途径,为英语翻译教学提供新的思路,解决其中的问题。

2 英语翻译教学的发展现状

近年来,随着翻译实践领域的不断拓展与深入,传统的教学手段和途径已不能满足市场的形势需求和学生们的学习需要。各高校不断提高对翻译教学质量和标准的要求,吴春梅[2]指出,英语翻译主流教学方式存在教学观念陈旧、讲授的内容受教材限制、课堂输入量小等局限。在英语翻译教学的过程中,教师们常常面临现有教材与测试模式无法体现教学成果的情况。此外,在课堂教学的过程中,如何使汉英翻译语序和表达最大化地贴近读者,如何让翻译素材的表达更加地道,帮助学生在翻译过程中对英语译文进行审校,也是英语教学者亟须解决的问题。

3 COCA语料库特征简述

3.1 更新快

COCA语料库(Corpus of Contemporary American English)是由美国杨百翰大学的Mark Davis教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库,于2008年2月份正式上线,此后每年不断更新以扩大库容,以保证其内容的时效性,目前最新的语料更新于2015年12月。每年约2000万词汇的增长速度为语料的扩充提供了持续发展、完善的支撑,也为英语翻译教学的研究及实践提供了良好的基础。此外,COCA语料库适应时代发展的需求,为教学研究者们提供了一个免费使用的在线检索平台,操作便捷、迅速。周韵[3]指出,COCA语料库帮助研究者切实有效的对美国当代英语使用的海量范例进行提取,实现了资源与时相适的优越性,适应了信息化时代发展的创新大潮。

3.2 规模大

语料库的特点在于将大量语言使用者的语言直觉汇集起来,从而使语言分析更为客观。方玲和汪兴富[4]指出,自然发生的语言数据的最大优势是可观察性和可检验性,基于语料库的观察本质上比内省式的判断更经得起实证检测。作为一个汇集5.2亿词的庞大语料库,COCA能够为教学者和研究者提供丰富而客观的语料资源,翔实而具有可靠性。孔雁[5]指出,在语料库检索的过程中,其界面设计可帮助使用者了解单词、短语以及句子的频率,用户也能根据自己的需求进行操作,进行简单查询、语义查询和搭配用法的查询等。

3.3 语料全

汪兴富、Mark Davies和刘国辉[6]三位学者曾共同撰文,详细介绍该语料库。COCA有着5.2亿词的庞大语料信息,这些信息由口语、小说、流行杂志、报纸和学术文章五个不同板块组成,具有均衡分布、全面整合的特色和优势。在翻译教学的过程中,为了充分适应目的语的文化与意识,多领域的集成资源的利用十分重要。COCA丰富的语料资源、集成全面的检索范围不仅能够帮助用户在使用过程中对信息进行有目的地筛选,还能进一步为用户提供相关术语或词汇搭配的检索功能,从而让教学研究者加深对英语的整体把握,提升应用能力,创造更丰硕的成果。

4 基于COCA语料库的英语翻译教学探讨

4.1 提高教学效率

对于翻译教学者而言,在有限的课堂时间内为学生提供有价值和方便吸收的学习内容,这一点尤为重要。在教学的各个阶段中,COCA语料库基于其自身的独特优势,能提高教学效率,并集中体现在备课阶段及授课阶段对于教学素材的提供。

备课阶段:素材资源由传统向创新过渡。在翻译教学过程中,大部分教学者选择采取传统的备课方式,即利用教材、参考书和词典进行课堂内容的选取。稍具创新性的做法,是通过网络检索获取更多的新鲜素材及资源。但教材及出版书籍具有滞后性,部分书籍和网络资源的可靠程度及客观性仍待考量。这就为备课过程带来了不可避免的局限。尽可能避免这样的客观局限一直是教学者们的力之所向。相较而言,COCA作为一个优质整合资源,有着语言实例客观性、来源主体多样性、检索方式便捷性的优势,增强了可选取内容的客观度和准确度,也能为教学者提供更多可供选择的话题和素材。例如在课前,教师在整理为学生准备的术语翻译文件时,可在COCA语料库中对参考翻译进行检索和校验,这样提高了译文的可信度,也提高了课堂内容的学习意义和参考价值。

授课阶段:课程内容由理论向实践转变。翻译教学的课堂上常常涉及理论知识的教授与讲解,在理论教学过程中,如果连翻译实例的讲解也来自照本宣科式的授课方式,即生硬地为学生提供词句以及对应的翻译,容易使教学模式陷入僵局。这样易使教学对象产生厌烦情绪,也不利于学生透彻理解翻译的思路、策略的形成。而COCA语料库所收录的词句均有证可查,即用户能够在检索英文词汇的同时,得到原句上下文对应搭配的显示,这样有利于翻译语境的带入,从而提高语言实践的程度。把握教学正式开展过程中的每一个细节,呈现出最科学的课堂内容。

4.2 促进教学内化

教学是一个综合性的活动过程。其中每一个环节都对最终的结果产生影响,能否使这个过程展现其内容,传达其思想,深化其精髓。除了在备课阶段进行充分准备,授课阶段呈现精致内容,还应注重后效,保证学生对知识进行有效吸收,实现教学内化。翻译教学内化的过程,恰如一个输送—接收信息的流程。教学者在翻译课堂上向学生传达翻译的用语、搭配、策略和技巧,而学生们在课后通过翻译任务及作业的形式向教学者反映了结果,即翻译水平有无明显提升或存在何种问题等。一来一回的双向交流,既能让教学者及时了解学生对于知识的接纳程度,也能使学生直观感受和观察语言实例。那么教学者在此过程中则应着重考虑两个层面:一是输送信息时的相对完善,二是接收信息后的相应反馈。

输送信息时的相对完善。主要体现在教师在给出自己的翻译或选择译文时应避免可能受到的主观限制,包括翻译得不够精准,语序表达上不够到位,或无法体现讲解某个篇章或语句实例时的实际意图。COCA语料库能帮助教学者搜索近似义单词,进行翻译文本中的替换;能够对易混淆用法的词汇分别进行检索,分析它们各自侧重的意义,从而规范使用。例如在翻译时,若想表达“抛弃”之意,在COCA语料库中检索“aban⁃don”的同义词(如图1),得到“leave”、“desert”和“discard”等词,每个单词的使用频次一目了然。译者在翻译过程中可对这些同义词进行替换,斟酌使用,使表达更加丰富。而在讲解文学翻译用词时,“desert”和“forsake”都表示“抛弃、放弃”,为了区分它们的用法区别,可以在COCA语料库中限定“Fiction”类别的语料,查询这两个词的相关例句。笔者在检索后发现“des⁃ert”后面接“sense”、“faith”等词,着重指违背自己的信仰与誓言的行为;而“forsake”后多接某物或某人,侧重自愿抛弃所喜欢的人或物。将翻译的需求转变成检索的需要,再约束为公式化的表达。因此,对用语的区分可以在COCA语料库中得到最直观的体会,从而在判断筛选后再进行运用。

接收信息后的相应反馈。为了体现翻译教学成效,老师们在教学过程中布置的翻译任务等往往十分直接而有效。而在此之后的反馈也是一个重要阶段。反馈可以集中体现在对学生译文的审阅、检验和修改等角度。如检索语搭配或词频实例。英汉的语序差别和表达习惯的不同,使译者在翻译过程中易受语言思维习惯的束缚。COCA作为全面的当代英语语料库,查询结果显然具备科学性和说服力,也因此能在翻译教学过程中可发挥检验以及校对的作用,使翻译更为精准。如在某中英翻译文本中,“怪石嶙峋”一词在查询在线术语库时找到两种搭配:“odd rocks”和“jagged rocks”。不确定选择哪个词,这时可在语料库中进行检索(如表1),通过共现频率来确定用法的规范性。最终通过短语的实际使用频率确定“jagged rocks”这一翻译更为恰当。

4.3 拓展教育素质

翻译教学不同于其他类型的教学,其目的更多地在于引导学生学习范例,锤炼技能,并最终建立起自己的翻译体系。因此在教学过程中需更多地采取适应其特点的方式。课堂的时间和资源毕竟是有限的,如果仅通过课堂上对知识进行传输,现有的课程配置往往难以培养出高素质人才。因此,在翻译教学的阶段,教师应更多地扮演引导学生进行思考的角色,培养学生的自主学习能力,使其真正掌握有用的技能,从而拓展翻译素质。而教师对学生的引导和建议一般包含以下几个方面:课下学习任务的完成,课后学科知识的积累(包括词汇、语用搭配等),翻译策略和翻译工具的自主使用。COCA无疑是教学推荐中一个好的选择。

教学者可以通过教学推荐的形式,帮助学生掌握语料库的一些基本技能。首先是词汇、词组的积累和查询。一方面,学生可以在COCA语料库中检索不懂的专业术语,另一方面,也可以通过查询对一般词汇的词性、词义和情感得到最直观的感受。其次学生能获得地道表达和用语的参考,因为COCA语料库的一大特色即反映美国当代英语的变体特征。此外,通过对单词和词组进行查询,学生也能够获得搭配和语法上的借鉴。最后是语体和语域方面的区分和判断。COCA语料库涵盖口语、小说、流行杂志、报纸和学术文章五大不同领域的语料信息,在课后的翻译实践中,无疑能为翻译文本中的用词、用语选择提供详细的参考价值。COCA语料库操作便捷,兼具技能性和实用性,能够在学生翻译自主学习的过程中发挥重要作用。通过引导学生接触并熟练使用COCA语料库,教学者能将课堂中的教学影响延展到课外,使英语翻译教学成效得以体现,并拓展教育素质。

5 结语

本文探讨了COCA语料库与英语翻译教学之间的关系。Mark Davies[7]指出,COCA语料库具备了一个好语料库的三项最基本条件:规模(Size)、速度(Speed)以及词性标注(Annotation),以其充分、客观、地道的语料特性与翻译教学中存在的诸多问题相适应,能在英语翻译教学过程中作为有效工具起到提高教学效率、促进学习内化、拓展教育素质的作用。诚然,COCA作为单语语料库,在翻译过程中不免存在英汉翻译空缺、难以实现源语和目的语对等的局限性。双语对齐语料库中的对齐层级更多,此点优势固然好,但我们在翻译过程中并非总能找到别人已经翻译过、存有数据的句子。Wolfgang Teubert[8]指出,语料库研究已经成为几乎所有语言研究的重要元素。从语言客观性角度来看,外语教学者更加需要能分析该语言使用规则的窗口,借助语料检索系统,他们可以得到远远超过辞典和语法书的语用知识,从而更好地应用于教学中。总而言之,COCA语料库作为一项有效工具,在英语翻译教学过程中发挥的作用日益明显,也值得广大教学者进行更加深入的摸索和探究。

摘要:文章以语料库与教学关系为视角,立足于美国杨百翰大学系列英语语料库,选取其中的COCA语料库(Corpus of Contemporary American English),结合英语翻译教学的现状进行实例分析,深入探讨了COCA语料库与英语翻译教学之间的关系。COCA语料库具有免费、量大、质高、检索方便等优点,能在英语翻译教学过程中作为有效工具起到提高教学效率、促进学习内化、拓展教育素质的作用。借助COCA语料库的独特优势,语言教学者可以有效解决翻译教学领域现存的部分问题,并进一步探究英语翻译教学的新思路。

关键词:COCA,语料库,翻译教学,杨百翰大学,工具

参考文献

[1]段中燕,胡丽娟.开发内化教学模式对翻译教学的促进作用[J].科教导刊,2013(06):62.

[2]吴春梅.语料库在翻译教学中的应用[J].山西广播电视大学学报,2007(05):71-72.

[3]周韵.基于美国当代英语语料库的自主写作模式研究[J].英语教师,2013(07):57-63.

[4]方玲,汪兴富.美国当代英语语料库的自主学习应用[J].中国外语,2010(06):79-91.

[5]孔雁.基于COCA语料库的汉语新词英译研究[J].长春理工大学学报,2012(02):58.

[6]汪兴富,Mark Davies,刘国辉.美国当代英语语料库(CO-CA)--英语教学与研究的良好平台[J].外语电化教学,2008(09):27-33.

[7]Davies M.The advantage of using relational databases for large corpora:speed,advanced queries,and unlimited annotation[J].International Journal of Corpus Linguistics,2005(10):301.

基于语料库的机器翻译 篇9

关键词:语料库,任务型翻译教学,评估方式

0 引言

本文将专注于评估和技术资源的使用给教学带来的变化, 以及评估什么、如何进行评估。为此, 我们描述了学生从语料库翻译教学中获取的经验并评估了学生的表现。

1 评估方式

评估不仅是对翻译的成品进行评估, 而且是对学生使用语料库资源过程的评估。这个概念在形成性评价中是至关重要的, 并可以帮助改进翻译教学和学习。换句话说, 评估的目的不仅仅是分配或获得分数, 而是教师和学生了解学习过程和进步的方式。就翻译而言, 成品和过程都可以评估。我们开发了在整个学期评估学生学习语料库的使用的方法, 列举如下:教师的观察图表可以记录学生的可观察到的进步;学生的学习日记记录他们觉得自己所学到的东西;学生的自我评价问卷来评估自己在每一个教学单元的学习;在每个教学单元结束时, 学生的问卷调查来评估教学内容和方法是否得当。

我们设计了其他工具来测试学生在翻译中使用语料库的方式。这些工具用于教学单元的最后任务中, 要求学生只使用语料库进行文本翻译。这些工具列举如下:源文本翻译;对与语料库相关的项目进行评估;问卷调查:学生为了解决一定的翻译问题使用语料库时所采取的步骤;评估量表:评价翻译语料库的使用, 结合从每个学生获得的翻译文本图表数据和使用语料库时所采取的步骤。

2 选择源文本、学习目标和项目列表

选择源文本的原则是其具有代表性、主题性和参考性。最好就某一个主体选择一系列的文本让学生在不同的翻译任务中进行练习, 使其对某个主题具有较深刻和具体的认识。

尽管一个教学单元可能覆盖几个学习目标, 只有少数几个在最终任务中进行评估。这些学习目标是:使用与语料库相关的软件的高级功能;提取词语搭配:使用截断搜索, 使用上下文单词 (复习) ;在词语搭配里选择最合适的排序方法 (复习) ;重新排序上下文 (复习) ;提取和解释搭配;提取和解释意群;使用语料库解决高难度的翻译问题;根据翻译的需求选择适当的语料库和语料库软件 (复习) ;使用词语搭配的上下文信息。

完整的教学方案中包括了在翻译中使用语料库时将被评估的项目的清单。这个清单是开放式的和项目列表没有特定的顺序。 (1) 能够建设专用语料库; (2) 能够命名语料库中的文件; (3) 选择适当的语料库; (4) 使用适当的软件; (5) 输入适当的搜索字符串; (6) 应用适当的搜索限制; (7) 选择适当的排序结果; (8) 确保文本对齐方式; (9) 恰当地使用可用的软件功能 (提取搭配、集群、词组、关键字等) ; (10) 恰当地使用注释;?对等式的可接受性。应该强调, 任务中评估的每个项目都与学习目标直接相关。例如, 一个教学单元的给定任务的学习目标可能包括确认关键词两端的词语, 以便提取概念或搭配信息。在这种情况下, 评估的相关项目就是排序的结果的适当性 (按字母顺序重新排序关键字旁边的单词) 。

3 调查问卷

问卷调查是为了测试学生在教学过程的某个点使用语料库的情况, 以评估他们在使用语料库进行翻译时的能力习得和进步。一份调查问卷包含五个不同的预选类型的翻译问题, 以便获得学生在解决上述问题所采取的步骤信息。知道在最终任务中学生所采用的语料库和软件, 同时确保学生没有使用其他的文献资源, 老师能够在教学单元中针对学生预期达到的学习目标做具体的准备。因此, 评估学生的翻译和问题答案能够了解学生学习目标的完成情况。

4 评估量表

本研究开发了一个评估量表, 即使用语料库翻译文本的过程中被评估的项目。分值范围从0到2分, 分配的原则是否每个学生在使用语料库解决翻译问题时采取的步骤是不正确的 (0分) 、可改进的 (1分) 、正确的 (2分) 。需要注意的是, 评估量表并不能应用到项目"对等式的可接受性", 这项使用"正确" (√) 或"错误" (X) 进行评估。

5 结语

本文主要阐述了在语料库的视角下任务型翻译教学法的评估方式, 其中包括源文本、学习目标、项目列表、调查问卷、评估量表。以及这些评估项目是如何使用和具体操作的。这样的方式不仅能够评估学生的翻译成品同时能够评估学生的翻译过程以及他们所习得的翻译能力。

参考文献

[1]Beeby, A.1996.Teaching Translation from Spanish to English.Ottawa:University of Ottawa Press.

基于语料库的机器翻译 篇10

国外学者较早地进行了网络语料库在外语教学中的应用, Johns (1997) 早在20世纪末就提出以语料为基础的“研究-操练-即兴产出”模式。Gilmore (2009) 利用BNC和COBUILD网络语料库来帮助日本学生修正英文写作中的语法错误, 结果表明有61.14%经过修改的作文的语言准确性得到了提高。

网络语料库的开发和利用在我国虽然起步较晚, 但是相关的研究也在近年来层出不穷。陈建生 (2004) 论证了网络语料库语言学研究和描述英语的方法在教学大纲制定、教材编写和课堂教学中得到广泛应用的合理性。吴军 (2010) 主张改革传统的语法教材, 用网络语料库中真实、鲜活的语言来解释语法规则, 实现语法和词汇 (尤其是词串) 的结合。

将网络语料库应用于语块教学也是近年来的研究热点。语块被认为是语言输出的基本构成单位。Lewis (1993:89) 甚至认为“语言是由语法化的词汇而不是词汇化的语法构成”, 并提出词汇中心教学法 (Lexical Approach) 观点。

笔者认为, 英语中语块数量繁多, 要提高语块运用能力, 关键还是靠培养学生的语块意识, 自主地提高语块运用的能力。2013年大学英语四级考试中的翻译部分出现了新的调整, 原先单句汉译英调整为段落汉译英。同时, 翻译的内容将会涉及中国的历史、文化、经济、社会发展等。这与近年来外语教学中注重学生文化与人文精神的培养有关, 有利于传播中国文化。由此可以将中国历史和文化作为大学英语翻译教学中一个很好的切入点。翻译教学中可能会涉及到中国的节日、旅游活动, 以及体现社会文化发展的特殊表达方式与新兴词汇, 大部分都是由一些词组或固定搭配的短语构成。为了帮助学生开展自主高效的翻译练习, 教学中会利用网络语料库资源对学生进行有针对的语块教学。故笔者尝试利用句酷网, 来提高学生在大学英语四级考试中的翻译水平, 实现自主性、探究性和数据驱动学习。

一研究设计

1研究问题

(1) 基于网络语料库的语块教学能否提高学生的语块运用能力与翻译水平。

(2) 学生的语块运用能力与翻译水平是否存在相关性。若存在, 相关性如何。

2研究对象

陕西省某高校非英语专业学前教育专业二年级的学生, 共60名学生, 分布于两个同质平行班, 每班30人。实验第一周对两个班进行了前测, 并对测试结果进行了独立样本t检验。检验结果为, 控制班的均值为14.83, 标准差为1.85, 实验班的为14.93和2.43, 数值非常接近, 没有显著差异 (sig=0.311>0.05) 。从整体上讲, 两个班的语块运用能力与翻译水平大致相当。实验过程中, 授课采用同一个教师, 同一个教材, 教学模式相当, 教学周为18周, 实验持续17周。

3研究工具

(1) 网络平行语料库:句酷网 (http://www.jukuu.com/) 。

(2) 数据分析工具:SPSS 20.0, Excel。

(3) 测试评分方法及标准:满分30分, 分为两部分。第一部分:汉译英段落翻译得分, 满分15分 (参照大学英语四级翻译评分标准) ;第二部分:语块应用得分, 满分15分, 每个语块计1分, 重复使用不计分, 用到15个语块及以上, 按15分计。每次测试评分由三位老师分别批改, 分别给出段落翻译、语块应用得分及两者相加的总分, 最后取各部分平均分作为每位学生段落翻译的总分、翻译得分和语块应用得分。

4实验步骤

(1) 第1周:前测。其试题为120字左右的段落汉译英练习题, 来源于改革后的四级模拟题汉译英部分, 与后测试题难度相当, 语块核心词词频和词块种类分布相同;参考大学英语四级汉译英段落翻译时长, 测试时间为30分钟。前测结束后, 以课堂讲座的形式 (20分钟) 培训实验班学生使用网络平行语料库。

(2) 第2周到第16周:实验班与对照班由同一教师授课, 实验班教师在授课过程中, 指导学生识别语块并使用网络平行语料库学习语块;借助网络平行语料库, 用语块教学法讲解课堂上的翻译练习;要求学生使用网络平行语料库完成每周课后汉译英段落翻译练习题。对照班教师在授课过程中不使用网络平行语料库进行语块教学;不要求学生使用网络平行语料库完成每周课后汉译英段落翻译练习题。课后汉译英段落翻译练习共12次, 第2到第16周 (除第5、9、13周外) 每周一次, 练习题与前后测试题同质, 来源于改革后的四级模拟题汉译英部分。

(3) 第17周, 后测:其试题与前测试题同质, 测试时间为30分钟。

二数据分析

1基于网络语料库的语块教学对学生的语块运用能力与翻译水平的影响

实验前, 两个班级在翻译中的水平基本相当, 短文中平均语块使用数分别为4.31和4.19个 (p>0.05) 。实验后, 控制组语块使用的数量有所增加, 而实验组则进步明显, 从4.19个增加到8.13个, 两组具有显著性差异 (p<0.01) 。通过进一步观察, 我们发现, 通过培训的实验组学生翻译中的语块使用趋向于准确性和地道性, 尤其在过渡语的使用上, 能较多地使用语块, 与传统的翻译教学模式相比, 基于网络语料库的语块教学模式能显著提高学生的语块运用能力与翻译水平。

2学生的语块运用能力与翻译水平的相关性

实验前, 两个班级在语块综合能力方面水平相当, 在满分为30分的测试中, 两个班级均取得14分以上的平均分, 两组成绩无显著性差异 (p>0.05) 。在实验后, 实验组和控制组均取得不错的成绩, 这主要跟部分语块来自于课本新词汇有关, 两个班级对新词汇的语块整体掌握都不错。但是, 实验组的语块水平要明显高于控制组, 两者具有显著性差异 (p<0.01) 。也就是说, 在语块的识别和产出性方面, 尤其是在实验阶段新学的词汇, 实验组得分率要高于控制组。可见, 学生在翻译中偏向于使用新学的词汇, 利用语料库检索并使用新学词汇, 强化了新词汇的语言输出, 有助于学生对词汇的深层次掌握。词汇的加工越深, 词汇越容易被记住。同时可以看出, 学生的语块运用能力与翻译水平存在正相关关系, 即学生语块运用能力越强, 翻译水平也就越高。但是, 我们应该承认这个进步并不大, 究其原因是实验时间长度的问题。在一个学期的实践中, 学生尝试的时间并不多, 要进一步提高翻译语块运用能力需要一个更为漫长的时间段。

三总结与启示

本文基于网络语料库, 针对改革后大学四级汉译英翻译教学, 探究了语块教学在大学英语四级汉译英翻译教学中的作用。实验结果证明, 基于网络语料库的语块教学能够提高学生的语块运用能力, 并且提高了学生的翻译水平;学生的语块运用能力与翻译水平存在正相关关系, 即学生语块运用能力越强, 翻译水平也就越高。因此, 为了提高学生的翻译水平, 在翻译工具方面, 首先, 教师应该考虑运用调动学生自主学习积极性的工具。其次, 鼓励学生及时整理复习已有语块知识, 加强已有语块知识的记忆和保持。本文研究得到的结果还有待更多的实验去进一步验证, 也希望能为以后的研究提供一定的参考和借鉴。

参考文献

[1]罗选民.中国的翻译教学:问题与前景[J].中国翻译, 2002 (4) .

[2]楼捷.网络英语语料库对促进汉英翻译语块准确性的作用[J].英语教师, 2011 (11) .

[3]Johns, T.Context:The Background, Development and Trialling of a Concordance-based CALL Program.In Wichmann.A, S, Fligelstone, T.Mc Enery&G.Knowles (eds.) .Teaching and Language Corpora[M].New York:Addison Wesley Longman, 1997.

[4]Gabrielatos C.Corpora and Language Teaching:Just a Fling or Wedding Bells?[J].Teaching English as a Second or Foreign Language, 2005 (4) .

[5]Gilmore A.2009.Using Online Corpora to Develop Students’Writing Skills.ELT Journal (3) , 363-372.

[6]陈建生.语料库语言学与英语教学[J].解放军外国语学院学报, 2004 (1) .

[7]吴军.语料库与英语语法教学[J].外语学刊, 2010 (1) .

[8]何安平.语料库在外语教育中的应用:理论与实践[M].广州:广东高等教育出版社, 2004.

基于语料库的机器翻译 篇11

【关键词】语料库 翻译教学 学生能力

一、现今我国翻译教学工作的情况

对于专门进行英语专业学习的学生来说,翻译知识的学习是必不可少的,对于那些不是学习英语专业的学生来说,是没有机会学习到翻译知识的。随着社会的不断发展进步,全球化浪潮的兴起,我国同世界各国在许多领域都进行着竞争与合作,在进行竞争与合作的过程中,我国对人才的能力和综合素质提出了新的要求,应该将翻译教学延伸到大学教育的其他专业的教学之中去,使大学生都可以掌握一些基础的翻译知识。

现今我国进行翻译教学的方式都是这样的:翻译教师根据教材内容,将教材中所涉及到的理论知识先向同学们讲述清楚,接着在相关资料中找一些与讲述的理论知识相关的句子,先让同学们尝试着进行翻译,对于章节中所涉及到的重点和难点,也是依照上述的方法,最后将标准的翻译结果展示给同学们,让同学们对比自己的翻译结果,找出学习中存在的问题,教师再对学生存在的问题进行分析和解答。这种翻译教学的方法学生依旧是在被动的接受着老师所传授的知识,这就不利于学生自主学习能力的培养以及学习兴趣的产生,从授课的结果上看,学生对重点和难点知识掌握的程度往往不高。这种传统的教育教学方式受到了越来越多相关专家及学者们的质疑,也呼吁着对翻译教学方式的创新和发展,专家学者们认为翻译教学工作应该将学生的地位从被动转为主动,教师也应充分地发挥其引导作用,让翻译教学的课堂通过师生互动的方式变得更加生动活泼,翻译教学中应该积极给学生们创造相应的语言环境,给学生们真实的文字材料让其翻译,充分锻炼学生的翻译能力。若将语料库应用与翻译教学中,专家学者们所提出的这些意见或建议很大程度上可以落实了。

二、语料库的运用对学生翻译能力提升的优势

语料库具备语境共现、词频、词汇表等基础功能,通过运用这些功能,学生可以运用互联网等搜索工具在语料库中查找到所要学习的词汇、短语、语法等,从而对所要学习的知识有一个清醒的认识。教师在授课的过程中,可以运用语料库全面的语料信息给学生们创造出一个模拟真实的语言环境,在这种环境下,学生的词汇运用能力、口语表达能力和翻译能力都得到了充分的锻炼。在讲授重点和难点知识时,教师可以先让学生们根据在语料库查阅的资料对句子或文章尝试着进行翻译,然后引导学生们发现自己在翻译时存在的问题,通过学生自己总结正确的翻译方法或教师旁敲侧击的点醒,使学生对所学习的翻译知识加深印象,最后运用语料库所创造出的模拟真实的语境,让学生们亲自实践,进行锻炼,强化学生对掌握知识的灵活运用能力。

教师在进行翻译知识的授课之前,应该在语料库中查找出与授课内容相关的语料信息,在进行收集和整理之后,应用与课堂教学当中,学生在课堂上所看到的相关资料,都是经过教师在成百上千的语料信息中挑选出来的精华,这对学生所需要掌握的理论知识学习是非常有帮助的,只有将理论知识良好的理解并掌握了,从能够在实践中更好地运用知识。

语料库的出现很大程度上弥补了翻译教材中资料、信息不全面的情况,教师通过对语料库的使用使课堂教学的内容更加完善,已往教师在备课的过程中,需要翻阅查找许多书籍、资料,语料库的出现使教师备课的工作负担减轻,让教师可以将更多的精力投入到帮助同学理解知识、运用知识当中,这不但提升了翻译教学的课堂效率,更给学生翻译知识的学习提供了更多的帮助,有利于学生翻译能力的提升。

三、语料库在翻译教学中的教学模式

语料库根据所存储和收率的语料信息的不同,可以分为不同种类的语料库,在种类繁多的语料库中,可以应用于翻译教学的语料库主要有平行和可比这两种,这两种语料库虽然在内容上各有千秋,但无论哪种应用与翻译教学中,其所能带来的优势和效果都是明显的。就拿平行语料库来说,其存储和收录的是某种语言的原文文本和与之相对应的翻译语文本,对学生翻译知识的学习有很大的借鉴作用,在教学中学生根据所学内容选择相关的英汉对齐语料进行翻译练习,通过对中文和英文不同的语言表达方式来体会翻译的方法。

在进行翻译教学的过程中,要积极鼓励学生运用语料库这种先进、科学的方式来辅助学习,教师在课堂上所能讲授的知识毕竟是有限的,只有帮助学生掌握了语料库的使用方法,在课后学生才能更好地完成自主学习。

四、结束语

语料库的研究很长时间都是为语言学研究服务,将语料库运用于翻译教学领域的实践时间还很短,还有许多需要进一步完善的地方,虽然语料库自身也存在着一定的缺陷,但是运用语料库来进行翻译教学对学生翻译能力的提升有着很好的效果。语料库作为社会发展的新事物,还需要更多的实践和探索使其不断成熟,更好地为翻译教学工作服务。

参考文献:

[1]孔雁,范艳梅.信息全媒体关照下开放式翻译教学模式的构建研究[J].中国教育信息化·高教职教,2015.

基于语料库的机器翻译 篇12

以往关于酒店简介翻译的研究主要有语言学角度、功能主义角度以及误译角度。语言学角度譬如丛丽君 (2011) 采取词块理论角度;功能主义角度譬如莫红利 (2009) 的研究;而误译批评研究角度如胡立敏, &缪肖强 (2009) 的研究。

先前酒店简介研究少有从信息论角度切入, 以目的语为研究对象, 通过定量方法来研究翻译策略。该文通过建立微型语料库, 检索出不同信息种类在英文酒店介绍中的分布频率, 以期得出对酒店介绍英译的启示。

1 理论框架

本文的理论依据主要是信息理论对翻译的启示、学者曾利沙 (2005) 对信息的分类、和功能目的论。理论框架如图1。

1.1 信息论

20世纪40年代末申农 (Shannon) 提出的信息沟通模式 (communication mode) 应用于翻译研究一般被称之为“信息论” (Nida, 1964) 。该理论关注信息的不可预测性 (unpredictability) :不可预测性越高, 传达的信息量越大。噪音或其他因素会影响沟通的效果。沟通的过程听者往往选择对他们来说最重要的信息, 而忽略其他的。信息论对翻译的启示是:翻译并非也不可能将源语文本的所有信息都传达到位, 因此, 译者应该考虑选择目的语受众最有可能感兴趣的信息, 以达到最佳的交际效果。

1.2 酒店介绍信息分类

曾利沙 (2005) 在《论旅游指南翻译的主题信息突出策略原则》一文中将旅游指南的文字信息分为8大类型, 分别是:事实性信息、描述性信息、评价性信息、文化信息、召唤性信息、美学信息、风格信息和提示性信息。笔者根据搜集到的英文资料, 结合酒店营销的特点, 运用其中的事实性信息、描述性信息、评价性信息、召唤性信息以及提示性信息五个信息类别进行标注分析。

1.2.1 事实性信息

介绍酒店的基本信息, 包括位置 (地理位置以及周边环境、) 功能 (客房数量以及特色功能与服务) 、历史 (成立与成长) 以及诸如交通、酒店设计、公司使命、目标客户群等信息。事实性信息客观性较强, 也是英语读者最关心的一个方面。

1.2.2 描述性信息

描述酒店的特色, 包括外观、装修、结构和氛围等。描述性信息的作用是帮助潜在客户更好地了解酒店的特点。它兼具客观性与主观性。

1.2.3 评价信息

评价酒店以及特色, 包括自我评价和外界评价, 譬如获得的奖项。评价信息加强读者对酒店的了解和信心。此类信息主观性强, 往往具暗示性与诱导性。

1.2.4 召唤信息

通常出现在篇首或篇末, 调动读者的热情与兴趣。因此, 召唤信息一般以祈使句形式出现。

1.2.5 提示信息

告知读者联系方式、服务时间、购物指南或文化禁忌等。这类信息至关重要, 有时直接决定一个潜在客户的去留。

1.3 功能目的论

德国功能派诺德 (2001) 在其著作Translating as a purposeful Activity:Functional Approaches Explained具体论述了目的论的三个原则:目的原则、连贯原则和忠实原则。按照诺德 (2001) 的思路, 翻译策略和方法的选择是由目标文本的目的及其用途决定的。若翻译的目的是保留文本的功能不变, 那么表达功能的信息应该能适应目标文化的标准 (Nord, 2001:45) 。

本文根据英文的数据, 通过统计方法来窥视目标读者的需求, 以期提出能真正满足目标读者需求的翻译策略。

2 数据搜集与分析

2.1 数据搜集

笔者从网站一共搜集到101个美国酒店简介, 其中17个是五星级豪华酒店、40个四星级、31个三星级以及13个三星级以下。这些酒店主要分布在大城市, 例如纽约、华盛顿、芝加哥等。周边环境好, 吸引大批的客户, 包括当地人和其他西方国家以及亚洲的客户。笔者根据搜集到的酒店简介, 建立起微型语料库, 根据信息分类的标准进行标注:代表事实性信息, 代表描述性信息, 代表评价信息, 代表召唤信息, 代表提示信息。事实性信息的子类别酒店位置、功能和历史分别标注为, 。接着, 笔者运用Antconc的索引功能, 检索每种信息类别分布的频率。

2.2 数据分析

经检索, 每种酒店类别的信息类别分布如表1所示。

从表1可以看出, 四种类别的酒店简介里面, 事实性信息的比例最大, 占50%左右, 第二是评价信息, 占20-30%, 紧接着是召唤信息、描述信息, 最后是提示信息。并且, 星级越低, 越注重事实性信息;而星级越高, 评价信息的比例越大。而事实性信息下面的位置、功能和历史子类别的比例分别为表2:

其中, 位置信息和功能信息占了大部分比例, 酒店历史以及其他信息的重要性显得没那么大了。这是由于潜在客户的需求还是在于方便入住与优质的服务。

从以上英文数据可以得出结论, 英语读者最关心的是铁铮铮的事实。评价信息与描述性信息在加深读者印象方面、和召唤信息和提示信息在促进读者行动方面都起着一定作用。于是, 好的翻译文本应该能包含这五种信息, 并且它们的比例应该与本文检索的结果大概一致。

3 翻译启示及例子

3.1 启示

根据以上的分析结果, 笔者总结出关于酒店简介翻译的启示:

第一, 若中英文本之间信息类别的分布频率不一致, 那么逐字翻译法建议放弃。此时, 建议译者将信息重组, 以满足目标读者的需求。

第二, 既然英语酒店简介突显事实性信息, 那么译者在目标语文本中也应该保留其地位。分析各个信息类别后, 译者决定哪些保留, 哪些剔除。一般来说, 事实性信息特别是酒店位置和功能信息应该全部翻译, 而历史、评价信息和描述信息则根据需要保留精华。召唤信息和提示信息尽管比例极小, 但也很有必要保留。

3.2 例子

在这一部分, 笔者根据本文的分析结果以及翻译策略, 将广州鸣泉居度假村网站www.oriental-resort.com的英文简介进行修整。

源语文本:

鸣泉居度假村

沿着环形罗马柱廊转过一道优雅的弧线, 在礼宾的致敬中穿过典雅的大门, 驶入远离尘嚣的山道。大金钟湖畔, 白云山脚下, 青山绿意中, 一座高贵的宫殿缓缓展现在您眼前, 广州鸣泉居, 都市中的桃源。

广州鸣泉居度假村位于国家4A级景区和国家重点风景名胜区白云山麓, 交通便利, 是度假、会议、商务首选之胜地。

文化是豪华中最高贵的格调。鸣泉居的美学经典设计理念, 源自欧洲古典主义和后现代主义风格。借助依山傍湖的独特地形, 引自欧洲大理石, 建筑与自然的和谐, 营造恢弘的王者气势。引自澳洲的绿化从木, 百余种珍贵花草, 广阔的视野和清新的空气, 让人感受自然之美。宏伟的建筑已是世间难求, 置身如此美景更超出想象。接待无数国宾政要、巨贾名流, 誉声广为流传, 昔日“红墙”尊耀, 今日亲身体会。

度假村在外界被广誉为至尊无限的“南国钓鱼台”, 名流汇聚的“都市桃源”。2005年, 度假村荣获有“酒店业奥斯卡”之称的中国酒店星光奖之“广东十大最具魅力酒店”, “广东最具尊贵酒店”, 2006年度假村还获得了中国酒店星光奖之“中国最具生态酒店”。

原版英译文本:

Guangzhou Oriental Resort:Luxury!Elegance!Zoology!

Leading a graceful curve along the orbicular Roman colonnade, and the through the elegant gate as the receptionists greeting, we drive on down the mountain road far away from fuss and crowd.There, by Dajinzhong Lake at the foot of White Cloud Mountain, among a light green air, appears before you a magnificent palace—the Oriental Resort, the urban Xanadu.

Culture is the noblest character of luxury.The Oriental Resort blends the designing style of European classicism and post-modernism.By right of the unique landform by the lake and the mountain, it constructs harmony with nature and creates a grand royal atmosphere.Green trees imported from Australia, hundreds of sorts of rare plants, wide field of vision and fresh air, all of these give you the space to feel the beauty of nature.

Both the majestic building and the beautiful scenery are beyond your imagination.The Oriental Resort has long been a legend for accommodating countless state guests and famous persons.The“red wall”once only opened for the noble is now ready for your experience.

首先, 笔者将汉语文本信息进行类别标注如下:

沿着环形罗马柱廊转过一道优雅的弧线, 在礼宾的致敬中穿过典雅的大门, 驶入远离尘嚣的山道。大金钟湖畔, 白云山脚下, 青山绿意中, 一座高贵的宫殿缓缓展现在您眼前, 广州鸣泉居, 都市中的桃源。

广州鸣泉居度假村位于国家4A级景区和国家重点风景名胜区白云山麓, 交通便利, 是度假、会议、商务首选之胜地。

文化是豪华中最高贵的格调。鸣泉居的美学经典设计理念, 源自欧洲古典主义和后现代主义风格。借助依山傍湖的独特地形, 引自欧洲大理石, 建筑与自然的和谐, 营造恢弘的王者气势。引自澳洲的绿化从木, 百余种珍贵花草, 广阔的视野和清新的空气, 让人感受自然之美。宏伟的建筑已是世间难求, 置身如此美景更超出想象。接待无数国宾政要、巨贾名流, 誉声广为流传, 昔日“红墙”尊耀, 今日亲身体会。

度假村在外界被广誉为至尊无限的“南国钓鱼台”, 名流汇聚的“都市桃源”。2005年, 度假村荣获有“酒店业奥斯卡”之称的中国酒店星光奖之“广东十大最具魅力酒店”, “广东最具尊贵酒店”, 2006年度假村还获得了中国酒店星光奖之“中国最具生态酒店”。

从以上标注可以看出, 汉语简介一共包含18个信息点, 其中7个事实性信息、4个描述信息、6个评价信息以及1个召唤信息。然而事实性信息下的功能信息为0。各个信息类别的分布如表3:

针对该文本, 具体翻译策略如下:强化事实性信息、适当弱化描述信息和评价信息、同时保留召唤信息。其它不相关信息可以直接剔除, 如“文化是豪华中最高贵的格调 (Culture is the noblest character of luxury) ”。修改后的译文如下:

Located at the foot of Baiyun Mountain beside the Dajinzhong Lake, a national 4A level scenic spot, the magnificent palace—oriental-resort is a the premier choice for vacation, convention and business due to the convenient transportation.Having gone along the orbicular Roman colonnade, through the gate, our destination far from the madding crowd is there.

The design concept of oriental resort is originated from the European classicism and post-modernism.The breathtaking building with marble introduced from Europe and plants from Australia enjoys a reputation by proving excellent service to a number of state guests and celebrities.

Oriental resort has obtained a series of awards such as one of top 10 fascinating hotels, top 1 ecological hotel etc.

Come and stay at the amazing oriental resort!

4 结束语

本文作者对美国酒店简介信息进行信息研究, 目的在于为汉语酒店简介的翻译提供应用策略。研究结果表明, 外国读者最关注的是事实性信息。因此, 翻译时译者应该适当重构信息, 以突显事实性信息。

参考文献

[1]Nord Christiane.Translating as a Purposeful Activity:Function-alist Approaches Explained[M].Shanghai:Shanghai ForeignLanguage Education Press, 2001.

[2]Eugene A Nida.Towards a Science of Translating[M].Leiden:E.J.Brill, 1964.

[3]丛丽君.基于词块理论的酒店简介语篇英译[J].湖南科技学院学报, 2011 (5) .

[4]胡立敏, 林宗豪, 缪肖强.酒店简介英语文本误译评析[J].内蒙古农业大学学报, 2009 (3) .

[5]莫红利.功能翻译理论视域下的酒店对外推介的英译[J].韶关学院学报, 2009 (5) .

上一篇:水城下一篇:本色回归