小型语料库(共5篇)
小型语料库 篇1
1引言
中国加入WTO后正以前所未有的深度和广度参与经济全球化的进程, 对外贸易的飞速发展带动和促进了商务英语的发展。形势的变化, 使国际商务类复合型人才具有更广阔的择业和发展前景, 商务英语人才需求量越来越大。目前, 无论大型三资企业, 还是国营、民营中小企业都存在开拓海外市场、参与对外商务活动的意图和行为, 这就要求我们培养越来越多的“具有较强的英语语言技能+ 一定的商务专业知识”的复合型、应用型人才。
2四川旅游学院商务英语教学状况调查
据统计, 截止2014 年, 全国有216 所本科高校开设了商务英语本科专业, 涵盖的高校类型包括外语类、理工类、农林类、师范类、经贸类等。四川旅游学院从2002 年开始设立商务英语专业, 虽然开设时间不短, 学生一次性就业率也在95% 以上, 但是担任专业课程的老师都认为商务英语教学方面存在一些问题, 比如:课程设置不够合理、很难选择到适合的教材、学生的专业实践能力缺乏、教学模式和方法亟待改进等。针对这些问题, 课题组比对了即将出台的《高等学校商务英语专业本科质量国家标准》, 在四川旅游学院外语系2013、2014、2015 级商务英语专业在校学生中进行了一次问卷调查, 从学生学习情况的自我检测、学习效果的反馈以及学生对商务英语课程的期望值入手, 了解商务英语教学效果并找到适合的商务英语教学模式。此次共发出问卷430 份, 回收问卷430 份。
(1) 学习效果调查结果
课题组通过对回收问卷的分析, 得到以下的数据: (1) 听力方面:对于普通题材的听力练习, 31% 的学生能够完全听懂;对于涉及商务题材方面的听力, 只有10% 的学生能够完全听懂; (2) 口语交际方面:能用全英语回答教师课堂提问的学生占35%, 而根据商务情景进行自由会话的学生只有26%, 另外还有20% 的同学几乎完全无法用英语进行商务交流; (3) 阅读方面:不借助字典能读懂简易读物及一般题材文章的学生占42%, 不借助字典能读懂英文报刊杂志、商务文章的只有10% ; (4) 写作方面:不参照模板能用英语完成email, memo, letter, report和其他函电写作的学生也只有10%, 能够借助提示完成这项任务的学生占35%。这些数据显示学生在商务英语的听说读写方面还存在很大的困难。
(2) 课程教学效果评价结果
课题组通过对问卷中学生对商务英语教学模式的评价分析, 得到以下相关数据: (1) 教学模式方面, 有45%的学生认为教师授课模式以陈旧的讲授型为主, 23% 的学生认为授课教师用交际法引导学生思考问题; (2) 教学手段方面, 22% 的学生认为粉笔和黑板仍是教师上课的主要工具;有41% 的学生认为计算机参与了辅助教学。学生还对商务英语课程教学提出了自己的期望, 从这些反馈情况看出学生对目前的教学综合评价不高。
通过对调查数据的分析, 课题组认为目前四川旅游学院外语系的商务英语教学在教学手段、教学方法和教学模式上还存在着诸多不足, 有很大的提升空间。商务英语教师需要从学生实际情况和需求出发, 转变教学观念, 调整教学思路, 运用现代化教学手段, 提高教学水平。
3商务英语小型语料库与商务英语教学的结合
“语料库是指按照一定的语言学原则, 运用随机抽样方法, 收集自然出现的连续的语言文本或话语片段而建成的具有一定容量的大型电子文库” (杨惠中, 2002) 。语料库是语料库语言学研究的基础资源, 应用于传统语言研究、词典编纂、语言教学以及自然语言处理中基于统计或实例的研究等方面。国外最早对语料库的研究可以追溯到20 世纪30 年代, 而比较有代表性的要算20 世纪50 年代由Quirk建立的SEU手工语料库。虽然没有计算机的介入, 但是Quirk却在这个语料库的帮助之下编纂了《现代英语语法》和《英语语法大全》。在SEU之后, 语料库进入了电子语料库飞速发展的时代, 比如有COBUILD语料库、英国国家语料库、国际英语语料库、朗文语料库网等。我国的首个语料库应当是在1982年由杨慧中和黄人杰两位教授带领建成的上海交通大学JDEST语料库。在参考这个语料库的基础上, 我国颁布了大学英语教学大纲词汇。 (刘满堂, 2004) 此后, 有更多的学者投入到语料库的研究之中, 尤其是语料库辅助二语习得, 比如国外的ICLE, LINDSEI语料库, 以及国内的CLEC, SWECCL, PACCEL语料库等。语料库对搜集的语料进行了定性和定量的统计学分析, 使这些丰富的语言资料更加真实、检索也更加迅速, 正因为如此语料库在二语习得中得到了越来越广泛的应用。在商务英语教学中也可以根据所选教材、时事新闻资料等建立小型的语料库, 这样在给教师提供大容量的语言资料的同时也能够促进学生利用数据进行自主学习, 大量输入语料, 从而最终习得语言。
商务英语小型语料库可以帮助授课教师设计更加行之有效的教学法。著名语料库语言学家John Sinclair认为词汇可以作为外语教学的切入点, 大部分教科书却只从语法方面讲词汇而脱离实际语境。其实这也是我们在商务英语教学中普遍存在的问题。根据上文课题组的调查结果反映出商务英语学习的一大难点是对商务英语词汇的理解和运用。而课堂上教师为了讲单词而讲单词, 除了单词的语法意义没有其他内容, 学生觉得枯燥, 也不能掌握这些词汇。语料库强调的是从语块看词汇, 商务英语的语块搭配稳定, 同时有着固定的语法结构限制和特定的语用环境。 (胡春雨, 2012) Lewis在词汇大纲的基础上也提出了“词汇法” (Lexical Approach) 。其中一个很重要的理念就是语块是语言学习者领会语言模式、词法和传统语法的原始数据。 (Lewis, 1993) 因此在商务英语教学中, 教师在课堂上可以避开单独讲授单词, 也不对目的语进行过多的分析, 而是把学生的注意力引入到一个一个的语块上, 使学生结合语境看词汇, 学生在学习过程中, 能够提取并利用语料库中的语块进行举一反三的练习, 最终能够熟练使用词汇。
商务英语小型语料库可以提高学生的学习积极性和自主学习能力。调查中, 学生普遍认为死记硬背的方式不仅枯燥而且效率不高。德国语言学家Schmidt指出:语言形式出现的频率越高, 越容易引起学习者的注意。 (李忠堂, 2011) 语料库的优势在于它不仅提供带有语境的实例, 而且还能显示各种不同语境的特征, 这样就形成了学习者注意力的聚焦点。学生在学习中根据个人的需要进行语料检索, 而不是听教师对词汇做单个的讲解, 学生通过语境获取意义的技能增强了, 也实现了自主学习模式和语料库驱动模式的结合。
4结语
在利用语料库的商务英语课堂教学中, 学生的自觉性和兴趣增强了, 能够更多地参与学习过程的自我管理。而作为学习过程中组织者的教师, 也可以从语法知识以及词汇讲解中走出来, 真正起到学习过程中引导者的作用, 鼓励学生之间相互合作交流, 指导学生观察目的语的使用现象, 并总结其中的规律, 最终实现熟练运用目的语的目标。在整个教与学的过程中, 学生和教师的地位发生转变, 学生是主体而教师只是引路人, 实现了教学相长。课题组将进一步研究, 探索语料库对于商务英语教学中听、说、读、写各方面的指导作用, 以期让教师和学生都能从中获益。
摘要:随着国际化交流的日益加深, 社会对商务复合型人才的需求也越来越多, 众多高校顺应市场需要开设了商务英语专业。文章从四川旅游学院商务英语教学现状出发, 根据学院商务英语专业学生调查表的反馈情况, 结合语料库语言学的理论, 认为建立商务英语小型语料库有利于商务英语教学模式的转变, 使教师和学生都从中受益。
关键词:商务英语,教学模式,语料库
参考文献
[1]Lewis.The lexical approach[M].Hove, UK:Language Teaching Publications, 1993.
[2]胡春雨.语料库与商务英语课堂教学[J].英语教师, 2012 (6) :43.
[3]李忠堂.基于网络的语料库在外语教学中的应用[J].科技教育创新, 2011 (4) :236.
[4]刘满堂.近40年英语语料库及语料库语言学研究的回顾与展望[J].陕西教育学院学报, 2004 (2) .
[5]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社, 2002.
小型语料库 篇2
关键词:语料库;建库流程;写作;语料分析
一、语料库的定义及其价值
20世纪中后期语言学及应用语言学研究领域的一大发展特点就语料库的建立及研究,语料库研究已经有近50年的历史,并
已逐步成为应用语言学领域的一个独立的分支,即语料库语言学。具体来说,语料库是指为语言研究而收集的、用电子数据形式保存的语言材料。目前在国内使用较多的有上海交通大学和广东外语外贸大学联合建立的中国学习者英语语料库(CLEC)、华南师范大
学的中国英语教育语料库、美国国家语料库等。
按照Leech的归纳,语料库在教学上的应用可体现在两个方
面:一是在教学中作为教学资源而直接使用。二是对语料库的一系列间接的应用,包括参考资料的出版、教材的编写和为了分析及了解学习者特点而开发的语料素材库。语料库的建立为探究语言在使用过程中呈现出来的规律提供了宝贵的数据,通过语料库的研
究可以发现某些词汇的实际使用频率、反复出现的习语或搭配模
式以及与某类语篇相关联的语法结构和语篇结构的使用特征等。
二、中学小型语料库建立的可行性实践操作
1.建库的可行性
语料库的建立是一个费时费力的过程,一个语料库的建立需
要多人长时间的工作,大型、系统的语料库可能要耗费研究者数年甚至是数十年的艰辛劳动。但是,语料库既可以复杂、详尽,当然根据其目的和对象的不同,也可以是比较简单的。随着计算机技术和互联网的飞速发展以及语料库辅助英语教学知识的进一步普及,广大教师完全可以根据学生的特点和需求,自己动手创建适合自
己教学需求的教学与研究小型语料库。相对于专业语料库而言,小型语料库容量不大,标注和分析也相对较为容易,不需要多人长时间的大规模合作,实践起来,难度大大降低,还可以在教学的过程中不断补充和深化,以具有时效性和发展性。
2.中学小型语料库的实践操作
笔者对所任教学校的高三年级的两个班级85名学生学期初统测中所完成的写作作品为语料建立小型高中生写作语料库,且目前已略具规模并积累了一定的实际操作经验,得出了一些分析数据和结论,对下一步的写作教学也有一定的帮助和启发。
3.语料的收集
期初考试后,笔者首先借助数码相机,将每一个学生的写作作品拍照存档并记录该部分得分。然后请学生将自己的作品不做修改地输入,形成Word文本,以力图保持原作品的原貌。收集完成后请几位同学帮助检查输入是否真实不做改动,形成初步的语料
库文本资源。
4.语料的标注
笔者对自己所任教班级学生的写作语料的标注从篇章结构、句法多样性和词汇短语等三个方面进行。首先运用WordSmith 5.0对语料进行描述性统计,然后采用PowerGrep 3.0分别对语料的篇章结构、主题句位置、句子类型和衔接手段等内容进行检索和统计。同时借助首都师范大学设计的软件Concordancer对词汇短语方面单词总数、句子总数、生成词频列表等进行分析,并在此基础上计算句长,分析句子复杂程度。
三、语料的分析
1.词汇短语的分析
词汇短语的使用有利于改善语言流利性和增强学习者的语用意识,可以说,学习者的词汇能力是其写作能力的一个十分重要的构成因素。对于高中生而言,词汇短语按功能可以分为与主题相
关、对题目的展开提供帮助和支持的话题短语;具有衔接功能、连接句子内部或句子间成分的语篇短语和表达态度和立场的交际短语。从此次统测的语料分析来看,词汇短语的频数与其长度成反
比。三词词汇的使用占比例最高,占词汇短语总量的54.9%,四词短语的使用数量次之,约占词汇短语总量的21.1%,而五词短语和六词短语的使用相对所占比例就要小得多。从词汇短语的功能方面,试以表达态度立场的词汇短语为例进行分析。学生常常使用的第一人称态度立场词汇短语,包括I think...,I believe...,I hold the
view...,As far as I am concerned...,From my point of view,..., In my view,...,等。学生使用第一人称态度立场短语平均每篇语料多达两次以上,缺乏变化,且出现的重复率极高,而稍为复杂的,如by and large, generally speaking, it is surprising/ necessary/ obvious that...等结构来表示态度和立场非常少出现在语料中。
2.句法多样性的分析
句法多样性是二语写作发展的重要指标,甚至从一定程度上
可以说,句法多样性与写作质量成正相关。对于此次统测作文语料的分析主要从句子类型、从属子句的多样性及特殊句型的方向展开。通过对此次学生统测结果进行分析,结果发现,处于高三初始阶段的学生较常用简单句来写作,简单句数占全篇作文总句数的比例高达76.5%。再通过对各从属子句的使用差异来分析,学生较多地使用定语从句和名词性从句中的宾语从句,而对于状语从句
小型语料库 篇3
语料库语言学出现于20世纪60年代。伴随着现代计算机技术的快速发展, 出现了语料库检索软件。目前, 语料库检索正在逐渐成为语言研究中的一种主流实证方法, 并已经被广泛地应用于语言学的各个方面, 如外语教学大纲设计、教材编写、批判话语分析、翻译等研究。特别是随着语料库检索的出现, 过去以定性为主的文体分析, 可以引入科学的定量分析, 从而提供了一个全新的语篇分析视角。这种定性和定量相结合的研究方式, 能够更为客观地揭示语篇的文体特征和语言风格。基于此, 尝试利用语料库检索软件AntConc对英文公司简介从词汇、句子、篇章三个层面进行分析, 以求揭示英文企业简介的文体特征, 为此类英文应用文的写作提供参考。
随机抽取来自伦敦证券交易所上市公司、纽约证券交易所上市公司以及公司网站企业, 共20篇英文企业简介为样本选用较普遍采用的英语本族语Brown语料库 (Brown语料库由美国布朗大学的两位语言学家在20世纪60年代建立, 选取了大量英文语篇, 被认为是一定程度上代表了通用英语的语料库) 。通过进行对比, 分析英文企业简介这种有特定对象和交际目的的应用文体的特点。
二、词汇特征
根据顺应论的观点, 使用语言的过程就是选择语言的过程, 而这种选择又必须与交际语境相顺应。在不同的语境中, 语言呈现不同的特点。作为一种介绍性的商业文本, 企业简介的阅读对象除了有一定行业相关知识的采购方、供货方人员, 也包括具有很少或不具有专业知识的普通消费者 (对于日用消费品企业) 和行业内外投资者, 因此要求企业简介遵循简洁、准确、易于理解的原则, 尽量使用简单、易于理解的日常用语。如在20篇企业简介中出现次数统计生成的词频列表 (见表1) 中company, business使用频率较高, 而更正式的用词enterprise竟然未出现。可见, 企业简介带有明确的交际目的性, 力求使阅读者能够以最小的努力, 理解企业想传达的关于自身的信息, 用词上以简单、短小、易于理解为主。
同时, 根据检索软件对于词语出现频率的统计, 在20篇文本中, is出现了58次, has出现了34次, are出现了19次, 均排在前30位。而过去时态的was, were则使用频率不高。这说明公司简介采用一般现在时为主, 所强调的信息是目前公司正在进行的活动, 以及过去所进行的活动对现在公司运营、财务水平的影响。着重点都是展现公司目前的经营信息, 这也是企业简介的阅读者最关心、最希望获得的信息。
此外, 对于人称代词, 第一人称代词we和We在20篇简介中, 被使用了51次, our被使用了17次, 属于使用频率最高的人称代词。考察其出现的词群 (clusters) , 第一人称经常出现在如“We offer……”, “we believe……”“We move forward……”等句子中, 在这些语境中指代“本公司”, 而不用第三人称“it”。第一人称“we”的使用, 将“公司”一词人格化, 这样更能够提高企业在阅读者心中的好感, 暗示未来的合作伙伴或消费者, 您所面对的是“我们”, 而不是一个冷冰冰的机构组织。同时, “we”的复数属性, 向阅读者表明“我们”是一个集体团队。简介所述的企业行为, 所持的经营信条是来自于集体的共识, 而这种共识往往比个人的独断更为理性可靠。
三、句子特征
不同文体的选择往往体现在句子层面上。从词频列表中分析, 在使用频率最高的前30个词中, 可作为连接词的包括that (24次) , which (20次) , 其中大部分的that和which都是起定语从句、名词性从句连接词的作用, 这表明企业简介仍然采用了较多的复合句, 使文体连接更为紧密, 传达的信息量更大, 同时, 由于从句的加入, 可以对主句的某一信息进行补充说明, 使表达更加清晰, 易于理解。如“As a company with industry-leading brands, a number of which have been in existence for over a century, we have a track record of innovation in bringing new products to market to meet emerging consumer preferences and demands.” 该句的中心意思是表达我公司积极推行产品创新以满足市场需要, 从而建立了许多行业领先的品牌。在句中, 通过引入连接词which, 向读者补充说明这些品牌中的许多已经存在了超过一个世纪, 从而说明了这种创新不只是让品牌迎合短暂的流行风潮, 而是赋予其可靠的、稳定的竞争力。
这种复合句式的使用是正式文体的一个显著特点。通过以上对于词语层面和句子层面的分析, 可以总结出, 企业简介仍然是正式的商业文体, 但是在选词上偏向简单、易于理解的用词, 不拘泥于冗长的正式词语, 但是, 又不回避某些专业用词, 如molectra, radian等。文体风格倾向于在正式和非正式之间。总之, 企业简介文体特别强调信息的准确、清晰表达, 这些在用词和造句时得到很好的强调。
四、语篇特征
利用Brown语料库作为参照语料, 随机抽取一篇企业简介, 通过AntConc软件的主题词检索功能 (keyword list) , 将该简介和Brown语料库的关键词进行对比, 可以生成该企业简介自身的主题词图。配合检索词语分布功能 (concordance plot) , 来探究语篇发展模式与词语的关系。
以Molectra公司的企业简介为例, 主题词排在前面的有molectra, Pty, MGL, 前20个关键词还包括tyre、recycling、Australia等 (见表2) , 通过这些关键词的组合, 可以分析出Molectra公司简介要传达的主题信息包括三个方面:1.Molectra公司的服务和产品——轮胎回收 (recycling, tyre, tyres) ;2.公司技术符合环保的特点 (environmental, waste, Greenhouse) ;3.技术具有创新性 (technology, Award, innovative, Smart) 。
通过以上主题词的归纳, 这三个信息就是该篇简介所要传达给阅读者的主要信息点。下面通过语料库的词语检索功能 (Concordance) 和检索词语分布功能 (Concordance Plot) , 得出这些主题词出现在文章中的先后位置, 并结合上下文, 分析这些信息点是如何在文章的篇章安排中得到体现。文章主要由四部分组成:1.Molectra公司的全称, 经营范围和历史;2.Molectra公司的产品和服务介绍;3.经营目标和愿景;4.目标客户;5.主要成就和荣誉。
选取以上三个信息中最有代表性的关键词tyre、environmental、innovative进行分析。检索“tyre”在文章中的分布, “tyre”分布在文章的前50%的范围内。尤其在第二部分使用最多。这是由于产品服务的种类介绍主要在第二部分呈现。而tyre一般是与recycling一起使用, 表示公司的主营业务。这说明第一个信息点 (公司的服务和产品) 主要集中在文章开篇的部分。
对于第二个信息点的代表性主题词environmental, 在文章中则分布较均匀, 如在第二部分“产品服务介绍”中出现 “develop dynamic alternative products and product solutions to a major environmental concern.”在介绍产品时强调产品和服务最大限度的满足环保要求。第四部分“目标客户”中也出现“Molectra's niche ability to be flexible allows us the ability to work with industry designers and developers to find, design and produce purpose built products as an environmental solution or rubber alternative for applications normally produced from other virgin materials.”在这里, 相同的信息得到又一次的明示, 说明环保的这一特性与目标客户接受度的关系。另外, environmental也出现在第二部分“企业愿景”和最后一部分“主要成就和荣誉”中。
对于第三个信息点的代表性主题词innovative, 情况也比较相似。它分布在第一、第二和第四部分, 并每次都与technology搭配, 组成词组。如在第一部分介绍企业总体情况时“Molectra Technologies Pty Ltd was established as a private company in March 2000 to fully develop and commercialise an innovative and patented tyre recycling technology.”第三部分阐述企业经营目标时“Molectra recognizes the fragile nature of our world and through innovative technology aims to revolutionize the business of recycling tyres and develop dynamic alternative products and product solutions to a major environmental concern.”这说明第二信息点“环保”和第三信息点“创新”穿插在整个语篇中。
由以上信息的分布可知该语篇主要有以下三个信息点:1.产品和服务介绍;2.环保;3.创新。在这三个信息点中, 产品和服务介绍主要集中在文章开篇部分, 而对于环保和创新企业认为是最具竞争力、最具有区分度的关于产品特点的信息, 则在文章中的各部分都进行强调, 使其在阅读者的印象中得到凸显。这种语篇特征也在其他抽取的文章中得到验证。作为企业简介, 其目的是向阅读者介绍企业的大体情况, 推荐产品和服务, 理应在文章的最显著位置得到体现。其次, 企业简介必须向读者明示其具有的与众不同的竞争力, 以树立阅读者对于企业和其产品的正面印象。这些信息往往通过一定的评价语言, 贯穿企业简介始终, 通过不断的提示, 向读者明示这种信息。
通过建立小型语料库, 运用语料库检索软件与通用英语语料库进行对比, 可以为我们分析文本的文体特征提供定量的研究材料。通过以上分析, 得出企业简介具有的语言特点, 以及企业简介如何运用篇章结构, 达到最优地传达企业明示信息的目的。这种定量和定性相结合的语料库检索分析方法, 可以丰富研究文本的视角, 得到对文本更理性的诠释。
参考文献
[1]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社, 2004.
[2]李晓红.基于语料库的effect搭配行为对比研究[J].外语教学, 2004 (6) :21-24.
[3]钟珊辉.基于语料库的Seek搭配行为对比研究[J].外国语文, 2009 (5) :36-40.
[4]韩芹, 任平.基于语料库的商务英语词汇研究[J].黑龙江对外经贸, 2009 (11) :47-49.
[5]王宏俐, 郭继荣.体裁分析与商务促销类语篇[J]外语教学, 2006 (7) :32-36.
[6]秦秀白.语篇的体裁分析[J].华南理工大学学报, 1997 (增刊) :6-11.
小型语料库 篇4
B2B平台为英文Business-toBusiness的缩写, 即企业对企业, 或者说是进出口商之间的外贸电子商务平台。B2B外贸平台是外贸购销市场的领域的一种, 是出口方对进口方的国际营销关系, 其具体的运作方式主要是出口方以会员的身份在B2B平台上用英语发布公司、销售产品信息、付款方式及运输等信息, 而进口方则可以在外贸平台上发布采购信息, 双方都可以在B2B平台看到对方的信息后向另一方发Email询盘或者通过Trade manager等软件在线交流, 从而使得外贸得以顺利进行。目前国内著名的B2B外贸平台主要有Global sources Alibaba及Madein-China等。
小型语料库因其灵活适用性在语料库的研究中成为一种较热的研究项目, 大型的语料库主要是研究范围较广的综合性研究, 而小型语料库一般是精心采集的, 旨在帮助语言学习者理解语言现象的语料库, 尤其是在商务英语专业翻译教学与研究过中, 可以充分利用海量网络资源及语料库工具创建小型翻译语料库以辅助教学与科研。
二、小型翻译语料库的建立
在创建B2B翻译的小型语料库前, 首先应根据该语料库国际贸易用途及B2B网页框架设定一些基本原则, 在日常的商务翻译教学过程中需要编撰一系列专用翻译素材与教学辅导素材, 如果以B2B平台的翻译为素材, 自建小型语料库, 对翻译教学将有较大的帮助。目前小型语料库仍未有统一明确的规范与标准, 但就其建立过程而言, 主要分为料采集、格式转换、标注及赋码、语料的整合生成、语料库的检索四个主要的过程。
1. 语料采集和格式转换
开发大型的语料库是一浩繁的系统工程, 需要耗费大量的人力物力, 对于一般的商务英语翻译教学而言, 只需有针对性地建立小型语料库即可, 建立B2B翻译教学用小型语料库首要工作就是要进行语料采集和格式转换, 欲善其事, 必先利其器, 须了解常用的工具件。
信息采集工具:因B2B商务平台主要是网页在线信息, 故需运用一些网络语料批采集软件, 常用的网络信息收集软件主要有Wordsmith Tools里面的网页资料下载工具Webgetter以及Httrack等软件;文字编制的软件主要有Editpad Pro、Ultra Edit、Edit Plus等软件。
文字识别转换工具:常见的文字识别及转换工具主要有将PDF文档转换成word格式的Solid Converter PDF软件;Adobe Acrobat Pro、CAJ Viewer等, 如果是要将扫描的文档传话识别成电子文档还需要ABBYY Finereader软件。
专门针对B2B平台的网页语料采集, 一般采用Httrack软件, 将要采集的企业的B2B平台信息采集下载。
2. 语料的赋码
从网络上下载的文本一般还不是清洁文本, 需要清除杂质与多余的标点符号, 将清洁前后的文本进行分类命名保存。语料赋码工作的第一步通常是加Text header, 即给语料标注篇名、作者、字数、领域、文体、来源、关键词等, 一般做法是将上述项目分别填入尖括号中并放置在文本句首。
目前还没有自动编写Text header的软件, 需要手动编写, 一般的小型与语料库是可以根据个人实际需要不编写Text header。
目前较通用的语料进行赋码的软件有Tree Tagger自动词性赋码器, 使用该赋码器对英语赋码准确率在96%~97%之间, 以下为基本的操作步骤:
第一步, 双击打开Tree Tagger软件。
第二步, 点击左上角的File菜单, 选择其中的“Open File”选项或者“open Direction”选项, 打开对话框。
第三步, 在对话框中选取需要词性赋码的文档, 选中后点击“Open”按钮。
第四步, 在界面的上方“English, German, French, Italian”语言框中选取文本语言的种类。
第五步, 点击“Start Tagging”按钮, 软件就开始对打开的文本进行词性赋码。
Tree Tagger软件对所选文本词性赋码完成后, 会在原文本所在文件夹中生成同名文件, 只是扩展名已经变成了“.pos”, 此文件就是赋码后的文件。
3. 语料的整合
在对B2B平台采集的语料进行赋码后, 需要对这些赋码的语料进行整合后, 才能做检索工作。目前做语料整合检索的软件主要有Word Smith, Compulang Word Pilot以及Antconc等软件。在建立一般小型的语料库时, 我们一般采用wordpilot软件整合语料库, 具体的步骤如下:
第一步, 在“wordpilot”安装路径所在系统盘所在文件夹中找到“libraries”子文件夹, 在子文件夹中创建一个自建语料库的文件夹, 将以上搜集赋码的B2B清洁语料复制到该文件夹中。
第二步, 双击运行“wordpilot”软件, 选择“file”菜单里面的“new”选项, 出现对话框, 选择系统文件里面的“library”文件夹。
第三步, 选择“Edit”菜单中的“Add text file”选项, 软件会弹出对话框, 在对话框中找到新建在“libraries”文件夹中的语料库纯文档, 选择后对话框会自动关闭。
第四步, 选择“File”菜单中文件保存的“Save”选项, 键入自己命名的语料库的名词, 比如说“B2B platform”保存即可, 这样一个小型的语料库就生成了。
4. 语料的检索
语料库的检索的目的是导出索引行, 以便于研究者观察类似的语言现象, 洞察其中的秘密, 这些规律主要包括这几个规律: (1) 有关词语搭配的规律。一个词语惯常与哪些词语搭配出现, 词语的搭配一方面是与意义有关, 另一方面是与搭配形式有关, 分析词语的搭配对翻译教学具有重要的意义。 (2) 有关类联结及形式的规律, 搭配研究中主要是考虑词与词的共现关系。根据检索的难度系数来分, 可以分为简单检索与复杂检索, 简单检索的检索项目主要是检索一些明确的字面字符串和较为简单的通配符, 检索项中主要是常量检索, 变化形式不大。而复杂检索中的检索项是模糊综合性的, 检索表达式中常包含一系列变量, 比如对赋码语料中词性的检索。本文主要以Antconc软件为例说明语料库的整合及检索。Antconc软件是由日本早稻田大学科技学院与工程学院英语教育中心的Laurence Anthony教授编写的一款跨平台语料处理软件, 该软件具有索引, 词表生成, 主题词计算, 搭配和词组提取等多种功能。语料库建库及检索过程的具体方法如下:
第一步, 点击file菜单窗口出现“open files”, 选择要打开的语料文件。
第二步, 在“Search Term”一栏键入要检索的关键词词项, 如tea, trade term, 等等。
第三步, 在“Search Window Size”一栏设置显示的词语数量。
第四步, 点击“start”开始检索。
三、结语
语料库的建立在我国目前正在发展阶段, 语料库的建立及其软件的应用为商务英语教学提供了新的教学方法与教学手段。通过建立小型的B2B商务英语语料库的建设, 可以对国际贸易商务平台上面常用的项目进行模块化, 每一个模块的语料都有重叠之处, 通过建立这样的语料库, 可以为商务英语B2B平台的翻译提供有力的教学与练习工具, 促进商务英语翻译教学的发展。
摘要:本文基于外贸企业的B2B的销售平台角度, 探讨了小型语料库的建立的四个步骤:料采集、格式转换、标注及赋码、语料的整合生成、语料库的检索, 将小型语料库用于商务英语翻译教学, 能丰富教学手段、提高教学效果。
关键词:B2B外贸平台,商务翻译教学,语料库
参考文献
[1]桂诗春, 杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社, 2003.
[2]王克菲.新型双语对应语料库的设计与构建[J].中国翻译, 2004 (6) .
[3]赵宏展.小型翻译语料库的DIY[J].中国科技翻译, 2007 (2) .
[4]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社, 2002.
[5]阳光武.社会建构主义模式与汉英翻译教学[J].四川外语学院学报, 2004 (2) .
小型语料库 篇5
一、自建小型语料库的建立
网络互动托福写作教学中的语料库可以归为学习者语料库,分为学生习作语料库和错误语料库。笔者在长期的教学实践中积累了各类学生习作1000余篇,整理出了500多个具有代表性的含有各种错误的句子;又从前者整理出了主旨明确、结构完整、表达流畅、内容丰富且含有亮点的优秀范文100余篇,组成优秀范文语料库。以上共同构成了网络互动托福写作教学中的动态的小型语料库,在日常的教学实践中发挥了巨大的作用。
二、自建小型语料库在网络互动托福写作教学中的应用
1.提供真实客观的语言数据。学生习作语料库的建立可以为在线教师提供关于托福考生写作情况的真实客观的语言数据。由于报考托福的学生整体的英语水平参差不齐,因此用一套教案去教授所有的学生是不科学的,也是不负责任的。教师应该针对不同的学生制定不同的教案和教法,做到因材施教,这样学生的托福写作水平才会有针对性地提高。学生习作语料库正是教师制定各类教案和教法的参考资料。笔者按照年龄、教育背景的不同将学生习作语料库又分为中学生习作语料库、大学生习作语料库和成人习作语料库三大 类,每一类又制定了相应的教案和教法。通过分析、对比中学生习作语料库,笔者发现,大部分中学生在词汇方面存在欠缺,因此针对中学生的托福写作教案和教法要突出词汇的比重,建立以词汇为核心的中学生托福写作教学体系;通过分析、对比大学生习作语料库,笔者发现,大部分学生在语法方面或多或少存在漏洞,因此针对大学生的托福写作教案和教法要突出语法的比重,建立以语法为核心的大学生托福写作教学体系;通过分析、对比成人习作语料库,笔者发现,大部分成年人在词汇和语法方面都存在欠缺,因此针对成人的托福写作教案和教法要突出词汇和语法的比重,建立以词汇和语法为核心的成人托福写作教学体系。这种分类在日常的网络互动托福写作教学中发挥了巨大的作用,学生的学习反馈和考试成绩证明了这一点。
2.提供科学有效的教学素材。错误语料库的建立可以为在线教师提供科学有效的教学素材。笔者从1000余篇学生习作中整理出了500多个具有代表性的含有各种错误的句子, 用于日常的网络互动托福写作教学,事实证明这种方式可以有效地帮助学生避免在写作中犯此类错误。比如,在错误语料库中有这么一句:“In fact, there are many people cannotsleep without mobile phones. ”教师将这句话在线发给学生, 让学生修改。部分学生感觉无从下手,因为他们感觉这话非常正确。这时教师适时引导,将"In fact, there are manypeople."这句话再发给学生,学生会说这句话也没有错误。这时教师可以说,既然"In fact, there are many people."没有错,是一个完整句子,那怎么可以在后面突然出现一个动词短语cannot sleep呢?这时学生往往会恍然大悟,明白此句错在一个主语同时跟了两个谓语部分,可以删除there are,或者将后面的动词短语放在一个定语从句中,即在cannot前面加who。教师可以进一步点拨关于定语从句的相关知识,比如关系代词什么情况下可以省略,什么情况下一定不可以省略等。通过这种在线互动启发式教学,学生可以很快很好地找出错误的根源,从而有效避免在写作中犯同样错误。
3.提供活学活用的写作范例。优秀范文语料库的建立可以为在线学生提供活学活用的写作范例。这类学习者语料库的建立可以是动态监控性的,教师可以从共时和历时两个维度去研究整理。从学生习作语料库1000余篇习作中,笔者遴选整理出了主旨明确、结构完整、表达流畅、内容丰富且含有亮点的优秀范文100余篇,上课时根据学生特点挑选合适的范文,按照“学生朗读——教师讲解——学生翻译”的顺序在线共同欣赏学习。帮助学生提高托福写作水平离不开欣赏借鉴优秀的学生习作,在这过程中教师起着监督和指导的作用,学生在发音方面出问题时教师可以及时纠正,在表达方面有困惑时教师可以及时点拨,每学完一篇优秀范文便让学生课下及时总结巩固,识记其中较好的词汇、短语和句型, 并用到自己的写作当中。经过一段时间的训练,学生在表达方面自然会有所提高。
总之,随着在线教育越来越受到重视,如何快速有效地提高在线教学质量成为广大教育工作者热议的话题。尽管也有一定局限,但整体来看自建小型语料库可以为网络互动托福写作教学提供真实客观的语言数据、提供科学有效的教学素材、提供活学活用的写作范例,因此不失为一种提高在线教学质量的有益尝试。
参考文献
[1]唐洁仪,何安平.语料库在外语教学中的应用[J].外语电化教学.2004(10).