数据词典论文

2024-05-31

数据词典论文(共7篇)

数据词典论文 篇1

摘要:本文主要讨论目前主流数据压缩算法的优缺点,介绍《基于Unicode多语种-多媒体电子词典生成系统(3MLDM DRPS)》的数据压缩程序的设计与实现,。本文详细阐述PPMD算法,在PPMD算法的基础上实现英汉维电子词典的压缩算法。

关键词:数据压缩,PPM,PPMD

引言

数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度,达到增大数据密度,最终使数据的存储空间减少的技术。数据压缩就是将字符串的一种表示方式转换为另一种表示方式,新的表示方式包含相同的信息量,但是长度比原来的方式尽可能的短。对于无损压缩而言,PPM模型与算术编码相结合,已经可以最大程度地逼近信息熵的极限。看起来,压缩技术的发展可以到此为止了。不幸的是,事情往往不像想象中的那样简单:算术编码虽然可以获得最短的编码长度,但其本身的复杂性也使得算术编码的任何具体实现在运行时都慢如蜗牛。

1. 常用数据压缩算法

1.1 Huffman编码

哈夫曼编码是无损压缩当中最好的方法。它使用预先二进制描述来替换每个符号,长度由特殊符号出现的频率决定。基本的原理是为每个符号找到新的二进制表示,从而通常符号使用很少的位,不常见的符号使用较多的位。

1.2 LZW压缩算法

LZW是Lempel—Ziv—Welch的缩写,主要用于图像数据压缩.对于简单平滑图像且噪声小的信号源具有较高的压缩比,并且其压缩和解压缩速度也比较快。

1.3 算数编码

Huffman编码解决的是整数位编码问题,而这一点有时可能成为一个问题。例如,如果一个字符的概率是1/3,则编码该字符的最优位数是1.6位左右但Huffman编码却必须给代码指定1位或2位,而无论哪一种选择都将导致比理论上可能的长度更长的压缩信息。

1.4 PPM数据解压缩算法

PPM(Prediction by Partial Matching)是一种上下文统计模型技术。它根据输入字符串中一定长度的上下文后面字符出现的次数,得出每个上下文的预测概率,然后利用多个上下文模型来得出输入字符出现的概率,最后根据该概率用算术编码对该字符进行编码。

根据最近输入的字符,来预测即将输入的下一个字符,可以达到数据压缩的目的。PPM就是利用了这种方法。利用最近输入的几个字符(叫做上下文模型),来预测下一个字符。其中,上下文模型的长度k可以从0到已输入字符的最大长度k不等。

对于k长度的上下文模型来说,首先要计算在已输入字符串中,每个k长度的子串后面不同的字符出现的次数,然后可以得到该上下文模型的预测概率。预测概率主要用于计算在该上下文模型后面输入字符出现的概率,以便于用算术编码对该字字符进行编码。这样每个不同长度的上下文模型可以得到相应的预测概率。

因为每个模型具有不同的k值。在计算输入字符出现的概率时,一般都是从最长的模型开始的。对于某个k长度的模型来说,当输入的字符已经被该上下文模型预测出时,该输入字符出现的概率就是预测概率。而当一个新字符,也就是说该上下文模型不能预测出的字符出现时,输入字符出现的概率就无法得到,也就不能对该字符进行编码。这时,就需要用到”跳转”(Esc)概率将不同长度上下文模型各自的预测概率联系起来。”跳转”概率就可以将模型从k跳f,lk-1,看k-1长度的模型能不能预测出该字符。如果可以,该字符的概率就是”跳转”概率k-1模型的预测概率;如果不能,”跳转”过程将一直进行直到某个模型可以预测出该字符。有了”跳转”机制以后,某个字符的预测概率就由可以预测出该字符模型和它以前的所有模型中的”跳转”概率来决定。为了保证无论出现什么字符,最后”跳转”过程都能结束,最低长度的模型中必须包括字母表中所有的字符。根据计算”跳转”概率的方法不同,PPM算法有很多类型,有A,B,C,D,P等形式。

2. 词库压缩程序的设计和实现

2.1 选择PPMD算法为词库解压缩算法的依据

根据计算”逃避”或“跳转”概率的方法不同,PPM算法有很多类型,有A,B,C,D,P等形式。这些不同的模型的“逃避”概率计算方法如下图所示:

以上图中所示的表中:为已输入字符串中的总字符数;U为已输入字符串中不同字符类型总数;t,为已输入字符串中字符出现次的总字符数.越往下版本越高,压缩效果也就越好。

PPMD算法在运行时,对内存的要求不是特别高,运行速度比较快。PPMD算法的阶数可以取1-16的阶数。当阶数落在2-3范围时的压缩率跟ZIP,BZIP2可比较,阶数在4-6范围之内时,压缩率比ZIP,BZIP2快,而且运行速度比ZIP,BZIP2快。在高阶数范围8-16之内时,PPMD算法各方面的表现极为突出。因此,在此系统的词库压缩程序中使用了PPMD算法,并且把阶数选为16。

2.2 词库压缩程序的设计

设计词库压缩程序思路:

使用Dao技术操作数据库。当用户选择某数据库时,首先检查次数据库是否包含名称为DictTag和Tags的两个数据表。当用户选择某个数据表时检查该表是否符合压缩程序的要求。若不符合,则提示给用户。选择好压缩的数据表之后,首先对数据进行分析。在分析过程中主要完成单词和解释字符串的长度,写入压缩文件时使用的数据包编号的计算等。压缩后的词库的名称填写,源语言和目标语言的选择,排序规则的选择等。其中,排序表必须为Excel文件,而且表的结构也要符合规定。生成词库文件时,首先读取单词和单词的长度和解释的长度,先把这些写入文件,然后再把单词解释部分压缩后写入词库文件。

为了方便使用我们在C++中设计了两个类,第一个类是包含PPMD算法功能的类,第二个类是对外提供接口的操作类。在第一个类中还设计了保存上下文环境的结构体PPM_Context。以下是此结构体详细设计结构:

第一个类包含了Start Sub Allocator,Stop Sub Allocator,GetUseMemory,EncodeStream,DecodeStream等五个函数,其中对外可见的有GetUseMemory,EncodeStream,DecodeStream。

第二个类包含了CompressStream,DecompressStream,GetRatio GetCompressTime,GetDecompressStream,GetInputSize,GetOutPutSiz e,GetMemUsage等函数。

3. 小结

对数据压缩技术进行了论述,还有提出了基于PPMD算法的词库压缩程序的设计和实现过程。

参考文献

[1]Shkarin,D.(2001)Improving the efficiency of PPM algorithm.Problems of Information Trans-mission,34(3):44-54,in Russian.

[2]Cleary,J.G.and Witten,I.H.(1984)Data compression using adaptive coding and partial string matching.IEEE Trans.on Comm.,32(4):396-402.

[3]Moffat,A.(1990)Implementing the PPM data compression scheme.IEEE Trans.on Comm.,8(11):1917-1921.

[4]Howard,P.G.(1993)The Design and Analysis of Efficient Lossless Data Compression Systems.PhD thesis,Brown University.

[5]李晓翔,王淑华,赵正校PPM缩算法在图像压缩中的应用[A]计算机工程2002年7月第28卷第7期.

[6]艾尼瓦尔.买买提吐尔根.依布拉音维吾尔文字母频率统计及其应用计算语言研讨会论文集2004年8月.

译学词典与双语词典之辨 篇2

关键词:译学词典,双语词典,对比

1 概述

词典是帮助学习者正确理解和运用各种词语的工具。译学词典和双语词典都是词典的一种。译学词典是翻译学习和研究必不可少的助手。“译学词典是译学知识的工具书,它汇集译学词语,按某种次序排列,构成体系,描写译学的历史和现状,解释各词语所代表的事物和概念,为读者提供了解和研究译学的相关信息”(孙迎春,2002:53)。

随着译学词典的出现和翻译实践的繁荣,相关的研究也层出不穷,这两个领域也取得了长足的进步。然而,译学词典和翻译实践交错重叠的部分,即译学词典在翻译实践中的应用却鲜有人涉及。从理论上讲,这种应用是非常有价值的。一方面,译者可以查询、借鉴译学词典的内容,以辅助他们做好翻译实践;另一方面,翻译实践可以促进译学词典的发展和创新。只有词典真正应用于实践时,编纂的差错和瑕疵才能被发现,修订和更正才能及时进行,以完善译学词典,来帮助更多的译者和学者。

译学词典与双语词典虽同属广义上的词典之类,但两者在很多方面都有所不同,笔者不揣浅陋,试在本文加以对比译学词典和双语词典。

2 译学词典和双语词典的不同

2.1 性质

根据孙迎春讲义,译学词典的本质特征在于运用形态各异的词条之特殊形式,通过词目释义和词条之间的内在联系,凸显翻译学的系统性、科学性、知识性、理论性、实践性、综合性,为读者的学术研究和翻译实践两个方面提供参考信息。译学词典作为译学与词典学结合的产物,必然具有两者的性质,在词目内容的收录上要体现译学的知识性和系统性,而在总体结构上要符合词典学的特征。(刘立胜,2009)

词典学之下的另一个领域——双语词典的研究历史已经很长,成果也相对不少,但一般的双语词典只是提供不同词语的释义,“双语词典的本质特征是对译,即两套符号的对应。”(黄建华,2001:128)

2.2 功能

关于译学词典的功能,众说纷纭,大体上都包含了一下几点:⑴检索信息资料;⑵释疑解惑;⑶规范译学话语;⑷进行译事研究;⑸延伸补充;⑹介绍概况;⑺勘误纠偏。

兹古斯塔指出,“双语词典的基本目的是在一种语言的词汇单位与另一种语言的词汇单位之间找出意义相等的对应词”(1983:404),其具备以下几个功能:⑴信息储存功能;⑵帮助提高词汇习得速度;⑶帮助减轻“词汇习得负担”。

不同类型的词典所面向的读者群体是不同的,读者对象是词典编纂所要考虑的一个重要因素。从语言学习及研究着眼,词典使用者可分为两大类:信息获取者和信息研究者。在使用词典时,前者较集中在信息获取即信息的认知,后者则获取与研究活动同时进行。

翻译学词典的对象有:

1)以翻译(口译)为职业的专业人员:专业翻译、翻译学术研究人员与翻译教师,以及翻译学(MA)、翻译硕士(MTI)研究生、翻译专业本科生(BTI)等。

2)图书馆专业人员:图书馆管理人员、流通人员、采编人员,以及各个层次的学生。

3)以翻译作为辅助工具的专业人员:使用翻译(口译)的专业人士及学生。

而双语词典的读者对象大致可以分为两大类:一类是掌握词目语言的读者,另一类是掌握释义语言的读者。前者对词典功能的要求侧重于使用,要求释义简洁明了,最好是对译性的词语以及供选择用的同义词语;而后者要求侧重于学习理解,他们要求在词条中提供诸如音标、词性、词汇的曲折变化、词组搭配、同义词辨析等等信息。(高玲玲,2001)

2.3 内容

一般来说,译学词典包括以下几内容:1)翻译史;2)翻译理论;3)翻译实践;4)翻译方法与技巧;5)翻译术语与专名;6)翻译人物;7)翻译分类;8)翻译教学与培训;9)翻译批评;10)翻译学的相关学科;11)译学名人名著;12)翻译学校、组织、机构与刊物;13)译事知识。其中1-10为译学词典的主体,11-13可作为词典的附录。(冯春波,2009)例如,《译学大词典》在“名词、术语、理论概念”和“翻译的方法与技巧”一章介绍了近500条相关条目,在“译学名人”部分介绍了近600位翻译界名人,在“学术著作选介”一章介绍了650余种著作或文章(其中200余种为简介,400余种为索引),在“著名译作选介”部分介绍了330余种译作(其中60余种为索引),“虽离全面尚有距离,但已能够为译学学者提供大量资料,并让译界以外的人士一观而觉其强大阵容和累累硕果”。(孙迎春,2001:403)

双语词典的内容相对比较单一一些,有包含不同词语的释义的词典正文,研习专页,主题页,地图以及不规则动词表、地名表、人名表等。

2.4 研究现状

世界范围内译学词典编纂的浪潮从1990年代前后开始,这个年代也是翻译学科发展迅猛的时代。迄今为止,我国出版的译学词典主要有:《中国翻译家辞典》(1988)、《中国科技翻译家词典》(1991)、《中英·英中翻译百科全书》(1995)、《中国翻译词典》(1997)、《译学大词典》(1999)、《中国当代翻译工作者大辞典》(2001)、《译学辞典》(2004)、《翻译研究关键词》(2004)等多部。国外已出版或即将出版的主要包括:《翻译研究词典》(1997)、《劳特利奇翻译学百科全书》(1998),《文学翻译(外译英)百科全书》(2000),《翻译百科全书》(2003),《国际译学百科全书》(即将出版)。

而双语词典出现的历史相对于译学词典来说要久远得多,关于双语词典的研究成果也是比较丰硕,“双语词典学”也渐渐成为一个常见的称谓。“据《中国辞书学论文索引》资料,至1989年为止,我国发表的关于双语词典的研究论文已达300余篇(含涉及少数民族语言词典的文章),而据广东外语外贸大学双语词典研究中心最新统计,至1998年止,已逾1700篇”(黄建华等,2001概述:1)

3 结束语

译学词典的编研和翻译实践是翻译这门学科里头重要的分支,一定程度上他们是独立存在的,各自有着不同的质的规定性、客观规律、原则以及特点;但是他们又是相互联系,相互制约,相互促进的。译学词典的编研是翻译理论和翻译实践发展的必然产物,对翻译理论和实践的发展也受益于译学词典;反过来,翻译理论和翻译实践的发展也会促进译学词典的完善。

由以上的比较可以看出,译学词典与双语词典,分属两个不同的领域,有很多不同之处,之间仅有很小一部分的重叠。对于翻译工作者来说,译学词典是不可或缺的工具。反思现状,放眼未来,译学词典的发展愈来愈快,定会和双语词典一起为翻译事业做出巨大贡献。

参考文献

[1]黄希玲,孙迎春.论译学词典的研编[J].外语与外语教学,2005(1).

[2]刘立胜.译学词典编撰理论发展现状研究[M].上海:上海外语教育出版社,2009.

[3]孙迎春.论综合性译学词典的编纂[J].山东外语教学,2001(1).

[4]孙迎春.译学大词典[Z].北京:中国世界语出版社,1999.

[5]孙迎春.论译学词典的性质[C]//孙迎春.2004翻译学词典与译学理论文集.天津:天津教育出版社,2005.

数据词典论文 篇3

著名的英国词词典学家R.R.K..Hartmann是最早对词典使用社会学予以关注的学者, 他提倡从用户视角进行系统实证研究, 有力地推动了词典使用研究的发展。在他的《词典用户社会学:假设和实证假设》一文中, Hartmann在实证的基础上, 提出了一些亟待解决的研究假设, 进一步发展了用户研究的方法论。1989年, 他提出的关于词典使用的十二条原则对于正确处理词典编者和词典用户之间的关系, 具有非常重要的启示意义。 (Hartmann, 1989:102-103)

(1) 词典编者应设身处地的为词典用户着想。

(2) 理想中的词典与现实中词典不可能完全一致。

(3) 词典的类型应依据词典用户的需求。

(4) 词典编者的设想与词典用户对词典的认识也不可能完全一致;用户“不买账”的情况也是时有发生的。

(5) 词典用户需求的分析应该先于词典的设计。

(6) 不同用户群体的需求也不尽相同。

(7) 用户的需求取决于各种因素, 其中最重要的是查找词典的目的。

(8) 用户的需求具有嬗变性, 如随着时间、地点的变化而变化。

(9) 词典说明部分 (参引、标注等) 的水平也应该通过一系列心理语言学的过程得以体现。

(10) 编纂词典的技艺能够并且必须得到传授。

(11) 词典的说明必须针对用户, 词典编者也必须了解自己所使用的方法。

(12) 词典用户需求的调查、研究也应该进一步得到支持。

以上的十二条原则体现了当代词典学新的理论模式——将词典看做是词典编者和词典用户之间相互作用的信息交流和传输系统。 (雍和名, 2003:17) 词典编者在编纂词典时遵循的最高准则, 即“以用户为中心”的原则, 同时还要考虑一系列静态和动态的因素:首先, 要考虑词典的类型, 从词典用户的视角来看, 要考虑词典为谁而编, 用户有何种需求和知识结构等问题, 这也是词典编纂的宗旨——尽编者之所能使用户理想中的词典与现实的词典相一致;但要编纂出满足所有用户需求的词典, 那是不现实的, 也是不可能的, 只有对指定用户进行全面深入的了解研究, 才能确定词典的类型、大小、内容以及编排等。其次, 要足够地重视词典编纂这门技艺;最基本的包括词典编纂的原则和释义方法。要对词典从整体构架上作好规划和设想, 包括词典的宏观结构、微观结构、中观结构以及检索结构设计, 都要考虑到用户的心理认知能力;编纂词典既是一门科学, 也是一门艺术, 同时也是一项复杂精密的系统工程。 (陈楚祥, 2003:214) 他不仅要求编者学识渊博, 具有百科知识, 而且还要具备多方面解决实际问题的能力。一部词典从制定编纂方案到组织成员编写, 再到最后完成出版, 整个过程中不知会出现多少问题需要一一解决, 其中的编写过程更是重中之中。所以编纂词典这门技艺无疑具有继承性, 应该也必须得以传授。再者, 就是对词典用户需求的研究及其培训;词典使用社会学的研究内容主要包括对词典用户的调查及词典用户培训等活动。词典编者编纂的所有词典都是受用户需求的刺激而产生的, 可以说, 词典编者对用户了解的越多, 就越可能编纂出迎合用户需求的类型的词典。通过对以上Hartmann的词典使用十二条原则的深入分析, 笔者认为要想提高编纂技艺的水平, 编纂出高质量的辞书, 就必须从词典使用社会学的两大主体——词典编者和词典用户的角度着手, 在实践中加强对编者的培养、对用户的培训才是最行之有效的手段。

一、词典编者的培养

词典作为一种工具, 不仅是沟通各个国家、各个民族的桥梁, 也是维系词典编者和词典用户的桥梁。 (张金忠, 2009:93) 随着社会对词典需求的日益增长以及词典用户对词典期望值也越来越高, 词典编纂工作也要求词典编者的技术水平得到不断的提高。可以说, 编者的专业水平和文化素养决定了所编词典质量的优劣。现今词典编者的身份已不仅局限于是拥有较高专业水平和实践技能的词典学家, 而是作为词典用户可靠的代理人, 以及能够最大限度地满足其需求的专家 (Морковкин, Морковина, 1997, с, 114) 。系统的对词典编者进行培养最早应兴起于20世纪美国的芝加哥、宾夕法尼亚等几所知名大学;开设这些课程的目的既是针对初学者, 同时也是为了帮助年青一代经验不足者提高专业技能。俄罗斯的普希金学院、维诺格拉多夫俄语学院以及乌克兰的切尔诺夫策大学等学校均开设过词典学课程的培训。我国对词典编者专业的培养相对要滞后一些, 直到20世纪末才有所发展, 现在已有多所高校和研究机构招收词典学方向的硕士和博士研究生。

对词典编者的培训主要遵循“用户中心”的原则, 过去的词典编者主要关注词典的信息内容、信息结构和信息呈现的方式, 忽视了词典用户的不同需求、技能、习惯及其偏好、从而导致了词典所提供的信息与词典用户所得到的帮助之间的差距。Hartmann 得出了四个研究参数, 对词典编者编纂出“以用户为中心”的词典提供了很好思路。

(1) 词典的类型, 即信息范畴的界定 (词典的内容和类型, 从一般化到具体的专业化的描写) ——回答了词典的类型的问题。

(2) 词典用户的类型, 即社会角色的定位 (使用者所处的场所和地位, 从家庭型到职业型) ——回答了谁需要词典。

(3) 词典用户需求的分析, 即活动语境的确定 (查找词典的场合和目的, 从普遍的阅读需要到解决一些复杂的问题) ——回答了为什么需要词典。

(4) 词典技能的分析, 即对词典说明质量的评定 (查词典的方法, 从普遍的目录法到各式各样的查找法) ——回答了怎么能在词典中找所需的信息 (Hartmann, 1989:105) 。

在我国, 对词典编者的培养不仅要遵循“用户为中心”的原则, 还要综合国内高校研究机构的实际情况, 制定切实可行的有效方案。大体可以从以下三点考虑:一是针对词典学专业的教育, 主要教授词典学理论与实践的知识, 其对象主要是词典学专业的硕士研究生, 教学内容要详细且具有相当的专业性, 主要包括词典学、语言学与词典学、语义学与词典学、认知语言学与词典学、翻译学与双语词典编纂、语料库与词典编纂等。二是可以开展针对个别专题或主题的讲习班和研讨会, 讲习班讲授的内容可以具体是哪一部词典, 或是宽泛的词典学一般问题。研讨会也可以单独进行一个专题, 也可以围绕几个相关的专题同时进行。讲习班和研讨会的范围不限于同专业, 同区域, 应是趋向跨专业综合性、国际化。三是在高校设置词典学选修课, 普及词典学常识。语言学专业的学生应开设专业选修课, 如, 词典学基础理论、词典编纂理论与实践、词典史等课程, 使其初步涉略词典学的理论和实践, 旨在将有志于词典事业的学生引向词典学的研究;而在非语言专业可以开设一些实用性较强的选修课, 如词典与词典使用、词典与词典的信息检索、词典的编纂与使用等, 重在将词典使用技能与所学专业结合起来。

随着科技的进步, 知识也在不断更新, 词典编者也需要不断的学习, 扩展自己的知识面, 适应与日俱增多元化读者的需求。所以对词典编者的培养也应紧跟时代的脚步, 编纂一部高质量的词典既有大量的学术工作, 也有大量的技术性工作和组织领导工作。现代词典编者, 已不是过去大多数人误解的“剪刀加浆糊“的工作方式, 而是从资料的搜集、建立数据库、进行标准化研究到制定大纲、细则、设计框架、确定工艺流程、运用现代化技术等一系列严密的工艺流程。编纂词典工作同时也是一项具有长期性、复杂性、艰巨性的任务, 这就要求词典编者还要具有吃苦耐劳、甘于奉献、不求名利的精神。

二、词典用户的培训

培养词典编者只是词典学教学的一个方面, 而对词典用户的培训则是词典学教育的另一个重要方面, 后者在一定程度上要比前者更重要。这方面我们完全可以借鉴世界其他国家的成功经验。对词典用户教育, 法国是走在前列的, 从小学开始就有意识地培养运用词典的能力, 国家出版机构给予全力支持。他们认为教授学生正确地使用词典, 可以使他们养成良好的独立解决问题的能力, 有利于学生的学习, 又能够最大限度地开发辞书市场。在我国情况却截然相反, 词典用户的培训一直备受冷落。传统的词典学过多地强调如何编纂出版高质量的词典, 有意无意地忽视了词典使用的培训, 因此, 用户在查找词典时往往遇到一些棘手的问题:用户可能不理解词典中的一些信息, 如标注、体例等;词典中的信息并非以传统方式体现出来的, 如对一些复杂语法现象的描述以及词汇单位的组合诠释;有些用户在使用词典时常常会犯“一条道跑到黑”的错误, 认为词典中的释义就是对词汇的终极释义, 不会创造性地对词典所提供的信息进行处理;甚至, 很多的用户根本没有读过词典的前言。一部优秀的词典的出版往往要花费一个工作团队甚至几代人的心血编纂而成, 而词典用户不懂得如何根据自己的需求选择适合的词典, 更不懂得如何充分地挖掘出词典的功能和信息, 无法发挥其自身的价值, 这不能不说是一个莫大的遗憾。

词典用户培训能够指导学习者借助于词典进一步掌握所学语言, 在学习过程中获得独立解决问题的技能, 从而自主地完成学习任务。为了达到这一理想的目标, 合格的词典用户也应具备相应的技能, 如, 要擅于选择所需的词典, 明确的了解自己能在词典中找到什么信息, 找不到什么信息, 并且能够忠实的领会词典所传达的信息。Henry Bejoint 曾对词典用户培训提出四点要求, 颇有建树。

(1) 词典用户的培训应更侧重于实践, 而非理论 (更注重如何使用, 而非编纂) 。

(2) 培训应针对语言, 而非词典。

(3) 培训应该推广面向整个教学周期。

(4) 培训应根据预先的用户需求分析, 而有计划的进行。

词典用户的培训最终目的是要帮助用户增强语言知识, 锻炼交际能力, 提高综合素质。随着词典编纂活动进一步计算机化, 词典的使用能力已经大大减弱, 但词典用户培训任务却变得更加复杂化, 这些变化在进行词典用户教学时也是必须考虑在内的。在词典用户培训这一问题上, 我们不妨遵照以下几条原则, 虽然未必行之有效、立竿见影, 但至少可供参考:

(1) 重视出版机构的教育职能。一直以来, 出版的编辑人员只顾埋头编书, 而忽视辞书用户的教育问题, 没有充分的意识到, 词典的潜在用户数量是大大超过现有用户的, 而大量读者在面对琳琅满目的词典时, 又不知该“何去何从”, 以至于使许多优秀的大部头辞书著作, 面临着无人问津的尴尬局面。

(2) 发挥高校的培养作用。在高校中教授这门课程是进行用户培训工作的重中之重;首先要分专业进行, 在不同的专业采取不同的教学大纲、教学内容和教学方法;一般分为语言学专业和非语言学专业, 语言学专业使用语言类、百科类和综合类词典的频率较高, 而非语言学专业在从事语言学习时使用语言类词典频率高些, 而其他情况下则使用专业词典频率较高。在高校中的培训还要具有选择性和针对性, 要做到有的放矢;学生在生活阅历、教育背景、知识兴趣、语言需求等方面存在极大的差异, 这也要求高校的用户培训更具实用性和启发性。

(3) 发挥大众传媒、新闻媒体的宣传力度。现今的信息渠道的多元化为用户教育提供了良好的机遇, 利用一切可以利用的传播媒介普及辞书知识。如广播电视、报刊杂志、网上视频教学等;如果条件允许可以联合传媒单位举办讲座、座谈会等, 真正使词典走进千家万户, 成为生活中必不可少的“良师益友”。

摘要:著名的英国词词典学家R.R.K..Hartm ann是最早对词典使用社会学予以关注的学者, 他提出的关于词典使用的十二条原则对于正确处理词典编者和词典用户之间的关系, 具有非常重要的启示意义。从词典使用社会学的两大主体——词典编者和词典用户的角度着手, 主要探讨了编者的培养、词典用户的培训两大问题, 希望对编纂出“以用户为中心”的辞书提供一定的借鉴作用。

关键词:词典使用社会学,词典编者,词典用户

参考文献

[1]ГакВ.Г.Онекоторы хзакономерностях развития лексикографии[G]/А/ктуа льные проб лем ы учебной лексигкографии-M, 1977.C.11-27.

[2]Hartmann R.R.K.Sociology of the D ictionary User:Hy-pothese and Empirical Studies[G].//W.D.D.1989.V.1.P.102-111.

[3]雍和明.交际词典学[M].上海:上海外语教育出版社, 2003.

[4]黄建华, 陈楚祥.双语词典学导论[M].北京:商务印书馆, 2003.

数据词典论文 篇4

1 从学习者角度看词典类型的划分

词典从不同角度可以做不同类型的划分。就其释义方式而言, 有单语词典和双语或多语词典。就词典的篇幅来说, 可分为袖珍词典、简明词典以及中型和大型词典。就词典的类型来说, 有综合性词典和专门性词典两大类。就学习者方便学习的角度而言以下几种划分最为有效:学习型词典、原版词典和各种专业词典。

英语学习型词典 (English learner’s dictionary) , 也称英语教学词典 (English pedagogical dictionary) 。这种类型的词典主要是为英语作为外语或第二语言的学习者设计的。学习型词典的设计编纂一般根据服务对象的语言能力, 认知水平和目标语的词汇特征。目前在国内出版了几种主要的学习型词典包括:商务印书馆的朗文当代英语大辞典 (英文原名是朗文英语语言文化词典) 和牛津高阶英语词典, 外研社出的朗文当代英语词典和朗文当代高级英语辞典 (该词典实际为朗文当代英语词典的1995年第3版的增补版的汉语翻译本) 以及韦氏蓝登学习词典还有麦克米伦高级英语词典, 上海外语教育出版社出的科林斯合作英语词典和剑桥国际英语词典。如果从英文版的角度来说, 牛津高阶英语词典, 韦氏蓝登学习词典, 麦克米伦高级英语词典, 科林斯合作英语词典, 剑桥国际英语词典在中国的知名度都很高, 牛津和朗文更是英文学习者的首选。

原版词典的好处就是用来解释的单词虽然难, 却让学习者能更精妙地使用它们来表达自己对主客观世界微妙的认知。主要有英国出的牛津简明英语词典, 美国出的梅林-韦氏大学英语词典, 蓝登书屋大学英语词典, 韦氏新世界词典大学版, 这3本美国出的大学词典分别由3所不同的出版社出版, 互为竞争对手。这些也是GRE和托福考试中出题者专用的参考词典。

专业词典, 以同义词、反义词词典为例。如梅林-韦氏公司出的韦氏小同义词和反义词词典。1997年牛津出了一本DK.牛津英语图解大词典, 1999年被外研社买了版权, 在大陆出版。2005年9月此英文版翻译成了汉语双解版DK·牛津英汉双解大词典。

通过调查发现, 英语专业学习者通常选用的学习词典多为商务印书馆出的朗文当代英语大辞典;原版词典为外研社出的K·牛津英汉双解大词典和美国蓝登书屋出版社出的蓝登书屋大学英语词典;专业词典如韦氏小同义词和反义词词典。

2 关照语言对比的设计意图和学习者中心的编纂表现形式的本土化设计特征

英语学习不仅仅是一个词汇理解输入的过程, 还需要提高写作, 听力和口语的语言输出能力。就一般学习者而言, 大部头的词典令人无从下手, 以本校为例, 推荐外研社出版的《新英汉词典》给非英语专业学生或将成为英语学习者的一种尝试。

外研社出版的《新英汉词典》[Concise English-Chinese Dictionary]作者为台湾三民书局股份公司。其收录单词、短语14万余条, 其中词目79, 500个, 短语19, 401个, 派生词14, 502个。收词量为便携式袖珍英汉词典之冠的收词量为便携式袖珍英汉词典之冠。就其收词量和袖珍开本而言, 实属难能可贵。

举例来看bloom一词:在原版进口《朗文当代英语词典》[Longman Dictionary of Contemporary English]中, P.166 bloom n.1[c, u]a flower or flowers:beautiful red blooms︱a mass of bloom on the apple trees 2 in (full) bloom with the flowers fully open 3[singular, u]the healthy happy appearance that someone has, especially when they are young:the rosy bloom of her cheeks had faded.bloom v.[I]1.if a plant or flower blooms, its flowers appear or open 2 to become happier, healthier, or more successful in a way that is very noticeable SYN blossom:She was blooming the last time I saw her.

在原版进口《蓝登韦氏大学英英语词典》[Random House Webster’s College Dictionary]中, bloom一词作为名词的主要释义多达9条。作为不及物动词的释义有4条, 作为及物动词有2条, 另外还有作为名词的其他用法2条。这是一部母语本词典, 给母语是英语的美国大学生用, 解释难, 但最地道精确。在美国英语词典中, 它的地位相当于中国商务印书馆出版的《现代汉语词典》。它所收词条达20万之多, 除语词外, 百科词条非常丰富, 包括各国重要历史人物、河流山脉、主要城市及其人口、耐用、常用缩略语、动、植、矿物的拉丁学名、高等学校、政治团体、学术机构等各科知识。除一般词典都有的同义词、反义词、方言、修辞、百科名称外, 特别重视同一个词在英美两国应用时的词义与发音上的差异。它还有一个鲜明的特点:十分重视同源。英语受其他印欧语系中的语言的影响很大, 因此提供简明的词源知识有助于对词义的更为确切的理解。

在《牛津高阶英汉双解词典》中, bloom一词的释义也相当全面, 与韦氏中的基本相同, 加上了详尽的汉语解释, 并配有大量例句。

那么对一般学习者而言, 我们来看这部部头并不大的《新英汉词典》就可以一目了然了。bloom1 n.1 (观赏用的) 花.2开花 (状态) ;最盛期, 全盛期.the~of youth.3 (脸颊、肌肤的) 玫瑰色, 健康的色泽; (覆盖在果实表面或叶子上的) 粉衣.4 (浮游生物等的) 密集孳生.In~花正开着.in full~盛开.out of~ (花) 已凋谢.take the~off使失去新鲜感.——vi.开花, 花盛开;繁荣.——vt.[摄]给 (透镜) 加膜.bloom2 n.铁块, 铜片 (cf.slab, billet) 首先, 部词典并没有因为是简洁版词典而省略背景详解。相反, 对大多数百科词条, 包括大量的普通词汇都提供背景知识解说, 帮助学习者更深刻地了解语言背后的文化。很多还会提示词源:标出大量词汇的来源、外来语原意, 揭开词语身世之谜;第二, 对这个词还使用了醒目的红颜色特别标注, 有的词还会加注图表, 这样做特别表明了日常实用高频词汇及四、六级考试、托福考试核心词汇及日常使用高频词汇, 帮助学习者在查阅词义的同时学会地道的遣词造句, 并进行备考、自测词汇量等, 一举多得;第三, 虽然不一定是本身的设计意图, 但这本词典的汉语解释在由于是台湾人翻译的, 所以也比较细致到位。就像商务印书馆出的《朗文当代英语大辞典》, 由于香港被英国殖民百年, 对英语的理解有着中国其它地区不及的优势, 翻译严谨, 特别是带括号部分的语境都解释出来。就这一点而言绝对是洋词典所无法比拟的。

3《新英汉词典》的局限之处

但这部词典也有它不尽如人意的地方。再举一个例词, 在《新英汉词典》中, abacus n. (pl.~.es, -ci) 1算盘.2[建] (圆柱) 顶板、冠板.与原版和双解词典比较使用后就会轻松发现, 我们知道在使学习者在查阅词典过程中有一种类似于母语学习的认知方式来学习第二语言是最为有效的。但限于英汉词典和简洁型词典本身的特点, 无法提供这一语境。比如abacus这个单词, 汉语中一般对应的是“算盘”的意思, 所以我们来看它的解释。但其实不尽如此, 它是在一个长方形的框子内, 有一些呈平行状分布的杆, 这些杆上面有可以移动用来作筹码的珠子, 该设备是用来计算之用, 在东方国家很常见。再配上一幅算盘的插图, 现在一个神形兼备的算盘就走进了读者的心里。长方形, 框子, 呈平行状, 杆, 筹码。珠子, 该设备, 计算, 东方的, 这些词其实才揭示出了它真正的内涵。这种效果用原版或双解词典自然很容易达到。但对于大多数普通学习者而言, 就很难接触到这样的语言实质。abacus汉语意思算盘和衍生出的单词的汉语意思包括长方形, 框子, 呈平行状, 杆, 筹码。珠子, 该设备, 计算, 东方的, 这些词就形成了一个意群, 都和算盘有着相互联系。这种认知方式对语言学习来说无疑更有意义。

最后说到学习词典对语言的输出能力的帮助方面。这些年比较流行的电子词典、网络词典、智能手机软件的力量不可小觑。写作, 听力和口语能力的提高就是在语境和真实交流环境中逐步提高的。传统的学习词典限于版权问题, 虽然原版词典配有CD-ROM光盘, 但国内的大部分学习词典在这方面做的不尽如人意。以网络上常用的百度词典和手机上常用的欧路软件为例。在你查阅任一词汇时, 首先都会听到英音、美音的正确发音对比, 百度词典和百度翻译中甚至是例句的整句阅读。配有中、英文双语释义, 正、反义词, 大量双语短语和来自网络资源自动生成的整句。

主要参考词典:

[1]《新英汉词典》Concise English-Chinese Dictionary, 台湾三民书局股份有限公司编, 北京:外语教学与研究出版社, 2011.

[2]Longman Dictionary of Contemporary English, (new edition, for advanced learners, third impression《) 朗文当代英语词典》, Pearson Education Limited, 2010.

[3]Random House Webster’s College Dictionary《蓝登韦氏大学英英语词典》, Second Random House Edition, 1999.

[4]《牛津高阶英汉双解词典》Oxford Advanced Learner’s Eng-lish-Chinese Dictionary (Fourth Edition) , 商务印书馆, 牛津大学出版社.

参考文献

[1]田兵, 陈国华.英语高阶学习词典设计特征研究——兼及多义词的认知语义结构和义项特征[M].北京:科学出版社, 2009.

[2]桂诗春.新编心理语言学[M].上海:上海外语教育出版社, 2000.

[3]束定芳.认知语义学[M].上海:上海外语教育出版社, 2008.

开心词典 篇5

杰克炸薯条的时候油锅突然起火, 他急忙打电话向消防局求助。事后, 消防员警告他, 以后炸薯条时要小心些。可是两星期后, 杰克又在炸薯条时引发了火灾, 消防队员再次匆匆赶来……

第二天, 杰克见到自家门前有一个小包裹, 包上面贴了张字条:“今后数周本消防局人手不足, 敬希合作为盼!”杰克打开包裹一看, 里面是一大包炸薯条。

坏消息

小杜打算辞职, 他兴奋地告诉同事:“终于不用再受这个领导的气了, 我一会儿就去递辞职信。”可是, 等小杜从领导办公室出来, 脸上满是失望。

同事问道:“怎么了?领导没同意?”小杜嘟囔道:“比这还糟糕——领导拿到我的辞职信, 一看就笑了, 说:你跟我跳的是同一家公司。”

没鱼

一位先生大清早来到湖边钓鱼, 他等呀等, 鱼就是不上钩。到了下午, 他肚子有点饿了, 就到附近的餐馆吃东西。

先生问:“你们这里有什么东西吃?”

服务员说:“有糖醋鲤鱼、红烧鲫鱼、干炸带鱼、清蒸鲈鱼, 还有……”

那位先生听了, 自言自语道:“原来鱼都在你们这儿啊, 我说湖里怎么钓不到鱼呢?”

浪漫举报

小王路过一家花店, 看到橱窗里贴着一则广告:“本店情人节当天玫瑰涨至每枝50元, 若提前预订仍按每枝5元结算, 欢迎预订。”

小王的男朋友在工商局上班, 各方面都不错, 就是不懂浪漫, 小王想趁这个机会点拨点拨他, 让男朋友先订好玫瑰, 情人节那天再送给自己。于是她拨通了电话, 委婉地对男朋友说:“刚才路过一家花店, 人家说情人节那天玫瑰要涨到50块钱, 但现在预订的话只要5块钱, 你看……”

电话那头马上说:“哦, 知道了, 那家花店叫什么名字?在哪儿啊?”

小王一听男朋友开了窍, 高兴地把花店的名字和地址告诉了他。

整个上午, 小王都沉浸在幸福中。没多久, 她男朋友回电话了:“刚才我把你说的向执法队汇报了, 人家说情人节期间玫瑰涨价属于正常价格波动, 不违法, 我们没法查……”

上海话

小李来到上海某外企应聘面试, 刚坐定, 面试官就用英文问他问题。

小李愣了一下, 说:“请你不要跟我说上海话, 我不是上海人。”

面试官闻言雷倒。

霸道的美眉

学校里有个美眉, 每次上课都要占第一排左边的那个位子, 占不到就和别人大吵。久而久之, 大家都默认那个位子是她的, 不和她争。

一次, 一个新来的男生坐到了这个位子上, 美眉走进教室一看, 立刻对着男生嚷嚷, 说这座位是她的, 她都坐了几个月了。男生愣了一下, 冷笑道:“坐了几个月就霸占了?我脚下的地球都踩了快二十年, 到现在都不敢说是我的!”

唯恐太迟

一个男人手拿纸袋在路上狂奔, 恰巧被一位巡警遇上, 巡警怀疑他可能偷了什么东西, 于是就上前把他拦住了:“喂, 站住!袋子里是什么东西?”

男人一惊, 答道:“是一套时装。”巡警问:“哪里来的?”

男人说:“时装店里刚买

巡警问:“到哪里去?”

巡警问:“到哪里去?”

男人答:“回家给我老婆。”

巡警奇怪了, 问:“那你为什么要这样狂奔?”

男人叹了口气, 说:“迟了, 恐怕她又嫌式样旧了。”

你爱嫁谁就嫁谁

女孩对爸爸说, 她喜欢隔壁的帅哥, 结果爸爸小声告诉她:“那是你同父异母的哥哥, 你们只能做普通朋友。”

几个月后, 女孩又对爸爸说, 她喜欢上了巷口那家的帅哥。爸爸说:“不行, 那是你另一个同父异母的哥哥, 你们也只能做普通朋友。”

女孩受不了, 哭着对妈妈说了一切, 妈妈安慰她说:“孩子, 你爱嫁谁就嫁谁, 你根本就不是你爸的女儿。”

好借口

一名男子在公路上超速开车, 他从后视镜中看到一辆闪着红灯的警车, 就想:我比这家伙开得快, 一定能逃脱, 于是他把油门踩到底, 一场竞赛开始了。两辆车在公路上飞驰, 时速越来越快……最后, 这名男子还是被警察追上了。

警察从巡逻车里出来, 走向这名男子的车, 对他说道:“听着, 先生, 我今天非常累, 现在只想下班回家。你找个像样的借口, 我就放你走。”

那男子想了一会儿后说:“三个星期前, 我老婆跟一个警察跑了。刚才我在后视镜里看见你的巡逻车, 以为你就是那个警察, 想要把老婆还给我!因为, 没有人能够忍受她超过一个月……”

没人磨墨

一个富家之子要去参加科举考试, 父亲事先考了他一下, 成绩很好, 满以为一定能录取, 不料竟然榜上无名。

父亲赶去找考官评理。考官调来卷子查看, 只见卷子上面淡淡一层灰雾, 看不到有字。

父亲一回家便责骂儿子:“你的考卷怎么写得叫人看也看不清?”儿子哭道:“考场上没人替我磨墨, 我只得用笔在砚上蘸着水写呀!”

多少钱不算贵

阿明乔迁新居, 朋友送来一个水族箱, 阿明便买了二十多条热带鱼放在里面。老婆下班回来后见阿明买了鱼, 就指着一对“红剑”, 问:“这鱼多少钱买的?”阿明忙说:“5元一对。”谁料老婆一撇嘴:“贵了, 最多值3元。这对‘珍珠鱼’呢?”

“6元。”

“贵了贵了, 也就值3元……”

老婆一口气问了好几种鱼, 都说阿明买贵了, 那口气仿佛他是个白痴, 让人狠宰了一顿!最后老婆指着一对“小吻嘴”问:“这个多少钱?”

阿明心里不痛快, 就没好气地说:“一毛钱两条, 不贵了吧?”

谁知老婆大喝一声:“太贵了!你买了那么多鱼, 这对就该白送!”

包子的儿子

丽丽有一次问妈妈:“妈妈, 我从哪里来的?”妈妈说:“从我的肚子里挖出来的, 不信你看, 我肚子上还有一个口子呢。”由于是剖腹产, 丽丽一看, 妈妈肚子上还真有一条伤疤。

开心词典 篇6

“姓名?”

“伊伊伊万诺诺夫·斯斯基·劳劳德……”

“请等一下, 您口吃吗?”

“不!我父亲口吃, 而那个给我做出生登记的简直就是个笨蛋!”

问路

MM找清华大学, 不料迷路了。幸好遇见一位文质彬彬、抱着几本厚书的教授。“请问, 我怎样才能到清华大学去?”教授思索了一会, 语重心长道:“读书, 只有不断地努力读书, 你才可以去清华大学。”

吱声

语文课, 老师叫起一名昏睡同学回答问题, 该同学迷迷糊糊啥也说不出。老师无奈地说:“你会不会呀?不会也吱一声啊!”该同学:“吱——”

非洲野猫

初中时, 一次生物老师讲非洲草原上的生态环境, 全班无人听讲, 遂怒, 曰:“你们都看我呀!你们不看我, 怎么知道非洲野猫长什么样子啊!”

不要妹妹

狗吧, 要白颜色的。”邻居阿姨生了个小妹妹, 母亲问明明想不想要个小妹妹。明明说:“妹妹有啥好玩的。妈妈, 你给我生只小

恶作剧

小明告诉妈妈, 今天客人来家里玩的时候, 哥哥放了一颗图钉在客人的椅子上, 被他看到了。妈妈说:“那你是怎么做的呢?”小明说:“我在一旁站着, 等客人刚要坐下来的时候, 我将椅子从他后面拿走了。”

白头发

宝宝:爸爸, 为什么你有那么多白头发?

爸爸:因为你不乖, 所以爸爸有好多白头发啊。

宝宝:那为什么爷爷全部都是白头发?

物归原主

诊所门前坐着两个小男孩。

“小朋友, 你哪儿不舒服?”护士问。“我吞下了一个玻璃球。”

“你呢?”护士问另一个。“那个玻璃球是我的。”

词典 篇7

3G通信即第三代数字通信。1995年问世的第一代数字手机只能进行语音通话;1996年~1997年出现的第二代数字手机增加了接收数据的功能, 如接收电子邮件或网页;第三代与前两代的主要区别在传输声音和数据的速度上的提升, 它能够处理图像、音乐、视频流等多种媒体形式, 提供包括网页浏览、电话会议、电子商务等多种信息服务。为了提供这种服务, 无线网络必须能够支持不同的数据传输速度, 也就是说在室内、室外和行车环境中能够分别支持至少2Mbps (兆字节/秒) 、384kbps (千字节/秒) 以及144kbps的传输速度。

热电材料热电效应是将不同材料的导体连接起来, 并通入电流, 在不同导体的接触点, 即结点, 将会吸收 (或放出) 热量。1834年, 法国物理学家佩尔捷 (J.C.A.Peltier) 发现了热电效应。

热电技术可分为热电制冷和热电发电两种。以无量纲优值系数ZT来衡量热电材料:BiSb系列适用于50K~150K温区;Bi2Te3系列适用于250K~500K温区;PbTe系列适用于500K~800K温区;SiGe系列适用于1100K~1300K温区。低温热电器件 (T≤220K) 主要用于冷却计算机芯片和红外探测。高温热电设备可将太阳能和核能转化成电能, 主要用于航天探测器和海上漂浮无人监测站的供电。

富氧燃烧技术燃料在传统锅炉中燃烧时, 以空气作助燃剂, 而空气中含有约80%的氮气。燃烧过程中, 空气中只有氧气得到利用。因此传统燃烧方法造成了大量的氮排放。富氧燃烧技术是使用氧气与再循环烟气的混合物作燃料。这一过程消除了传统燃烧方法中空气里含有的大量氮, 从而减少了烟气中氮的排放。富氧燃烧工艺非常利于二氧化碳的压缩与净化, 燃烧中产生的二氧化碳有90%被分离。

点云点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点集合。根据激光测量原理得到的点云, 包括三维坐标 (XYZ) 和激光反射强度 (Itensity) 。根据摄影测量原理得到的点云, 包括三维坐标 (XYZ) 和颜色信息 (RGB) 。结合激光测量和摄影测量原理得到点云, 包括三维坐标 (XYZ) 、激光反射强度 (Itensity) 和颜色信息 (RGB) 。点云的属性包括:空间分辨率, 点位精度, 表面法向量等。

上一篇:网络是把双刃剑下一篇:再设计