中文语言环境(精选3篇)
中文语言环境 篇1
1. 文化空缺的起源
空缺现象最早是在二十世纪五十年代由美国语言学家霍凯特发现的,他在对比两种语言的语法模式中提出了“偶然的缺口(random holes in patterns)” (Hockett, 1954)。到了七十年代,对于空缺现象的讨论引起了更多学者的兴趣,前苏联翻译理论家巴学胡达罗夫(1975)在对比不同语言的词汇时,采用了“无等值物词汇”的术语;美国文化人类学家赫尔在研究澳大利亚土族居民的语言颜色场时,发现该民族缺少其他民族所具有的基本颜色的名称,从而启用了“空白,间隙”的术语(Hale, 1975)。到了八十年代末,梭罗金等人在论述话语及其名族文化特点时提出了“空缺(vacancy)”理论,至此,空缺理论应运而生。
世界各国的人们有着不同的思维方式和价值观念,有着不同的现实世界的观察方式,因而也就使得自己的语言在形成发展过程中表现出独特的风貌和民族特征,由于各民族在历史背景、社会习俗、宗教文化、意识形态等方面的差异,在一种语言中具有的概念、事物或现象在另一种语言中找不到对应或相近的表达方式,就形成了语言文化的空缺。世界上各个民族生活在一个地球上,其生产方式、思维习惯必定具有某些相同之处,但一定的民族在其发展的过程中,却往往有自己独特的社会生活状况、独特的世情风俗。例如在传统结婚仪式上,中国的传统婚俗有“三书六礼”“三拜九叩”这些繁俗礼节 (1) 。在西方国家中,婚礼时有旧(Something Old)、新 (Something New) 、借 (Something Borrowed) 、蓝 (Something Blue) 等习俗 (2) 。由于我国与绝大部分英语国家相隔万里, 地理位置、自然现象、历史背景、审美心理等千差万别, 人们对于颜色、数字等客观世界存在物体的感受和表达不尽相同。这样, 它们的象征意义在中西文化之间自然又会产生很大的差异。下面举一个实例:Mr Brown is a very white man.He was looking rather green the other day.He has been feeling blue lately.When I saw him, he was in a grown study.I hope he will soon be in his pink again.从上面这段话来看, 一定让人看后觉得莫名其妙。只有了解这些单词所具有的情感含义, 才可知其意:布朗先生是一位非常可靠的男人。那天他脸上有病色, 进来一直闷闷不乐。我见到他时, 他正在极度沉思。我希望他早日康复。
文化空缺词又是了解一个民族文化最有效的途径。它留给不同语言民族的人们更多的想象空间,为跨文化交流提供了一扇窗口。人们通过对其内涵的发掘、研究和阐述,可以增进不同民族的人们之间的相互了解和沟通,从而使跨文化言语交际得以实现。
2. 翻译的可译性
语言和文化决定了翻译的可译性。文化与可译性成反比。如果词语的可译性越小,文化内涵就越大。如果在译入语中找不到对应词,就采取音译、意译、加注法。
有些词语在英汉两种语言中虽然功能相似,但各自的文化内涵却不尽相同。例如:有些中国人介绍自己的爱人时用lover一词,外国人对此颇为惊讶(因为lover表示情夫或情妇的意思)。应该记住,与汉语中“爱人”一词意思对等的英语词应是:husband(丈夫)或wife(妻子)。
某些事物或概念在一种文化中有,在另一种文化中则没有。如中国人注重人际关系,有许多对应的亲属用词。在与不同文化背景的人进行交际时,表示亲属的词语常常在理解上造成很大困难,因为不是所有的称呼都可以找到令人满意的对应词。有许多称呼指具体的关系,如婆婆、公公、岳父、岳母、姐夫、姨公(婆)、堂(表)兄弟(姐妹)、弟妹、小舅子、表侄等用细致的方式来区分的亲属关系,在交际中易造成困难。还有中国的二十四节气 (3) ,很难用英语传达相应的意思。汉语中谚语“夏练三伏,冬练三九”,激励人们坚持锻炼身体。“三伏”和“三九”在英语里是什么呢?有一个年轻翻译对几个加拿大人说three fu和three nine。听的人当然莫名其妙。其实他只要说“Insummer keep exercising during the hottest days;In winter do the same thing during the coldest weather.”就可以了。
3. 文化空缺的翻译策略
每个民族的文化都有某些独特之处,其术语的名称常为其他民族文化所空缺。面对可译性障碍,并不是束手无策,我们可以采用一些方法来弥补这种空缺,让跨文化交际得以实现。翻译的方法一般可归纳为直译法、音译法、意译法和加注法。
3.1 直译法
直译法既能使译文简洁明快,又能保留文化词语的原汁原味。例如:葱油饼(crisp shot cake with chive and lark)、八宝饭(eight-treasure rice-pudding)、油条(deep-fried twisted dough sticks)、涮羊肉(instant boiled mutton)、北京烤鸭(Beijing roast duck)。最为传神的范例:可口可乐(Coca-Cola);一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃。(One boy is a boy, two boys half a boy, three boys no boy.)有一些英汉习语所用设喻相似而意义相近,翻译起来也很容易。如:Great minds think alike.(英雄所见略同);know something like the palm or back of one’s hand(了如指掌);Constant dropping wears the stone.(滴水穿石);pour oil on the flame(火上加油);Give somebody an inch and he’ll take an mile.(得寸进尺);Strike while the iron is hot.(趁热打铁);Walls have ears.(隔墙有耳);at one’s wit’s end(才穷智尽);The spirit is willing but the flesh is weak.(心有余而力不足)。
3.2 音译法
具有中国独特内涵的文化词汇,在英语中很难找到对应的词汇,英语中具有民族特色的词汇也是如此。这时可以采用音译法将这些具有特殊文化内涵的词语“移植”到另一方的文化中去。来自生活娱乐的音译词有:马拉松(marathon)、高尔夫(golf)、沙龙(salon)、芭蕾(ballet)、迪斯科(disco)、探戈(tango)、伦巴(rumba)、吉他(guitar)、扑克(poker);bonsai(盆栽),sampan(舢板),silk(丝绸)、mahjong(麻将),Confucius(孔子),Tao(道教),fengshui(风水)。来自饮食类的有:色拉(salad)、布丁(pudding)、三明治(sandwich)、汉堡包(hamburger)、比萨(pizza)、巧克力(chocolate)、龙眼(longan)、白兰地(brandy)、威士忌(whisky)、雪茄(cigar)、豆腐(tofu)、台风(typhoon)、武术(wushu)、人参(ginseng)、炒面(chow mein)。表示地点的有:汉口(hankow)、北京(peking)、哈尔滨(harbin)、西藏(tibet)。其他的有:旗袍(cheongsam)、高岭土(kaolin)、比基尼(bikini)、摩登(modern)、坦克(tank)、法西斯(Fascist)、雷达(radar)、尼龙(nylon)、拷贝(copy)、蒙太奇(montage)、荷尔蒙(hormone)、尼古丁(nicotine)、淋巴(lymph)、休克(shock)、木乃伊(mummy)、歇斯底里(hysteria)、阿司匹林(aspirin)、艾滋病(AIDS)、酷(cool)、声纳(sonar)、克隆(clone)。
3.3 意译法
意译法常用来翻译具有文化特色的词语。它舍弃了词语的语言形式和字面意义,注重传达词语的文化气息。比如中国科举选拔产生的状元、榜眼、探花、举人、进士、秀才。
意译词:快餐(fast food)、自助餐(self-service)、鸡尾酒(cocktail)、绿色食物(green food)、超市(supermarket)、连锁店(chain store)、交谊舞(social dance)、狐步舞(foxtrot)、移动电话(mobile phone)、传真(fax)、软件(software)、万维网(World Wild Web)、数字通讯(digital communication)、机器人(robot)、飞碟(flying saucer)、多媒体(multimedia)、试管婴儿(test-tube baby)、热线(hot line)、白领阶层(white collar)、冷战(cold war)、第三产业(third industry)、传销(multi-level marketing)、代沟(generation gap)、黑色幽默(black humor)、绿卡(green card)、知识产权(intellectual property)、冲浪运动(surfing)、软着陆(soft landing)、贸易战(trade war)。
习语的意译法。例如:智者千虑,必有一失。(Homer sometimes nod.);一败涂地(meet one’s Waterloo);华而不实(Barmecide’s feast)。英汉语言中所用设喻形象各异,意义却相近的习语,如:Don’t cry over spilt milk.(生米已成熟饭);The longest day must have an end.(世上没有不散的宴席);birds of a feather(物以类聚,人以群分);apple of one’s eye(掌上明珠);The pot calls the kettle black.(五十步笑一百步);place all one’s cards on the table(打开天窗说亮话)。
3.4 加注法
为了保留原文的民族特色和形象,一些带有民族色彩、地方色彩、典故的英汉语言,翻译中常用加注法来补充诸如背景材料、词语起源等相关信息,让读者了解词语文化内涵,促进中西方文化交流。成语、历史典故、寓言、神话和民间传说的翻译常用加注法。下面是一些具体的实例:
毛遂自荐:recommend oneself for a position as Mao Sui did (now, it is used to refer to those who volunteer to offer one’s services for a task or a job) .
三顾茅庐:Three personal calls at the thatched cottage (referring to Liu Bei’s three calls at Zhuge Liang’s cottage to solicit his help) ———repeated and sincere invitations.
塞翁失马, 安知非福:When the man on the frontier lost his mare, he guessed it was a blessing in disguise———misfortune may be an actual blessing.
另有:
叶公好龙:Lord Ye’s love of dragons———professed love of what one fears.
东施效颦:Dong Shi, an ugly woman, knitting her brows in imitation of the famous beauty Xi Shi, only to make herself all the uglier.Now is its used to satirize the blind imitation with ludicrous effect.
画蛇添足:to draw a snake and add feet to it———to ruin the effect by superfluous work.Now it refers to spoiling the effect by doing something entirely unnecessary.
南辕北辙:to go south by driving the chariot northward-to act in a way that defeats one’s purpose.Now it is used to meand being poles apart or acting in a way that defeats one’s purpose.
守株待兔:To stand by a tree trunk wainting for more hares to dash themselves against it———wait for a windfall.Now it is used to satirize those who rigidly adhere to limited experience and refuse to adapt themselves to the changing situations or those who trust foolishly to chance and luck.
司马昭之心, 路人皆知:Siam Zhao is obvious to every man in the street.Siam Zhao was a prime minister of Wei who nursed a secret ambition to usurp the throne.
正如《史记》、《左传》等对汉语的影响一样,《圣经》和莎翁剧作及《伊索寓言》对英语也产生了重大影响。如果这些词语非中国人常见常用,翻译时必须注明出处,便于读者查阅资料加深理解。莎翁作品的习语如“paint the lily”,源自《约翰王》第四幕第二场“To gild refined gold, to paint the lily, is wasteful land ridiculous excess.”这个成语相当于汉语成语“画蛇添足”。成语“eat one’s leek”出自《亨利五世》中“If you can mock a leek, you can eat a leek.”形容忍受侮辱。还有成语“To swift arrives as tardy as too slow.”源于《罗密欧与朱丽叶》中“Therefore love moderately;long love doth so;Too swift arrives as tardy as too slow.”此成语相当于“欲速则不达”。又如:screw one’s courage(鼓起勇气,壮起胆子),源自《麦克白》;to the manner born(与生俱来的),源自《哈姆雷特》;more sinned against than sinning(受罪过),源自《李尔王》;pond of flesh(合情但悖于情理的要求),源自《威尼斯商人》。
圣经故事上帝造人的传说是西方人固有的观念,就如同中国女娲补天的传说一样,在英美国家人们的心目中上帝是万能的、神圣的。圣经故事中关于上帝、耶稣、魔鬼、亚当,以及一些带有教诲意义的故事中的某个片段,因人们的喜好甚至某些历史、政治原因而作为习语的形式流传了下来。源自圣经故事的英语习语:after someone’s heart(称某人的心), (4) raise Cain(闹事;发脾气), (5) Daniel in the Lion’s Den(狮子坑中的但以理), (6) make bricks without straw(作无米之炊;搭架空中楼阁) (7) 。
4. 翻译的有效性
合理性、可接受性到有效性,这是一条逻辑发展链。翻译的合理性基础形成了翻译的有效性。那么怎么才算得合理呢?开头所列的四种方法分别就有其合理之处,所以得以流传至今。这四种方法适用于汉译英,也同样可适用于英译汉来翻译民族文化中一些独特的词语。
5. 结语
每个民族都有其发展的历史,形成其特色的文化。文化是一个国家独具的,反映了国家的特色。翻译时,虽然完全展现出原语言的原汁原味,不能完全体会异国的文化内涵,但我们要从欣赏的角度出发,品味其文化韵味。
注释:
(1) 所谓“三书”,就是指聘书、礼书、迎亲书。“六礼”是指纳采、问名、纳吉、纳征、请期、亲迎。而在这之间更有换庚谱、过文定、过大礼、安床等一系列的活动。
(2) 旧是指母亲传下来的婚纱、头饰或首饰,代表承受美好的一切;新是指朋友送的礼物如裙子、饰物,象征新的生活;借是指可向任何人借东西回来,据说从富裕亲友借来金或银放在鞋内,象征带来财运;蓝是指新娘的一些小饰物或花束用蓝色,意味着新娘的纯洁及贞洁。
(3) 有些“节气”的名称在英语中确实有对应词:春分=Spring Equinox;夏至=Summer Solstice;秋分=Autumnal Equinox;冬至=Winter Solstice。
(4) 据《旧约圣经·撒母耳记上》记载,撒母耳(Samuel)是以色列的先知,他遵照上帝的旨意立扫罗(Saul)为以色列王。扫罗为王以后,一再违背神的戒命,撒母耳于是指责扫罗说:上帝要另立一位服从他的王,而他也找到了适当的人选(the LORD hath sought him a man after his own heart,...)。最终,撒母耳遵照神谕,废了扫罗,立大卫(David)为王。后来,after one’s heart常用来指“称心如意”。
(5) 据《圣经·创世记》里说,亚当和夏娃生有两个儿子,哥哥叫该隐(Cain),弟弟叫亚伯(Abel);该隐性情暴戾,竟然杀了弟弟。照字面意义,raise Cain就是“唤起该隐”;可以想象,把这样的人吵醒该会惹出多少麻烦事;故有此义。
(6) 源自《旧约圣经·但以理书》。先知但以理遭人陷害而被扔进狮子坑中。大利乌王(Darius)于心不忍,次日清晨来到坑边哀声呼叫但以理,没想到但以理竟安然无恙。国王赦免了他,并将那些陷害者扔进坑中让狮子撕食。指“绝处逢生”、“真金不怕火炼”。
(7) 来自《旧约圣经·出埃及记》。据说埃及法老不允许以色列人离开埃及,故意刁难他们,下令叫他们造砖,而又不给他们稻草。据说当时没有稻草是造不出砖的,故有此义。
参考文献
[1]陈宏薇, 李亚丹主编.新编汉英翻译教程.上海:上海外国语学院出版社, 2004.
[2]范振辉.英汉两种语言的差异与翻译[J].广西教育学院学报, 2003, (02) .
[3]高莉莉.由文化缺省现象看可译性限度问题[D].山东师范大学, 2006.
[4]李磊荣.论民族文化的可译性[D].上海外国语大学, 2004.
[5]魏万德, 杨卿.汉英翻译中的文化空缺现像初探[J].理工高教研究, 2005, (06) :114-116
[6]王峥.习语的文化内涵及其翻译的归化和异化[A].福建省外文学会2007年会暨华东地区第四届外语教学研讨会论文集[C], 2007.
[7]魏红, 卜毅.文化因素对翻译的影响[J].中国科技信息, 2006, (23) :163-164.
[8]杨敏, 王克奇, 王恒展.中国文化通览.高等教育出版社, 2006.
[9]章放维.文化图式视角下的文化空缺及其在翻译中的应对[D].湘潭大学, 2006.
[10]Larry A.Samovar and Richard E.Porter.跨文化交流[M].北京大学出版社.
中文语言环境 篇2
1.语法、词汇、语音有密切的联系
语法、词汇、语音,是语言的三大要素,它们在语言内部各有相对的独立性。各民族或社会集团特定时期的语言都有自己的语法系统、词汇系统、语音系统。对某个族语的三要素进行系统的研究,就分别有某种族语(比如汉语或英语)的语法学、词汇学、语音学。语法、词汇、语音虽然是语言的三种不同的要素,但它们之间是密切联系着的,相互间有一定的制约关系。
语法指词语组成句子的结构和功能的规律,即利用词汇(准确地说,是词汇中的词语)来生成句子的规律;词汇(也称“语汇”)指一种语言中词和成语(或熟语)的总和;语音指词语和句子的声音,即表示词语和句子意义的有声的物质外壳。
语法的建筑材料是词语,没有词汇,就不可能有句子,也就不可能有语法;反之,没有语法,词汇中的词语只是一堆构造句子的材料,把一种语言的词语汇集在一起,充其量只能编成一部词典,而不可能成为句子,只有把一定的词语按照语法规则组合起来,才能成为句子,才能表达思想和进行言语交际。
语法有形式和意义,即语法形式和语法意义。任何语法范畴都是语法意义和语法形式的统一。表示语法意义的形式或手段是多种多样的,如在汉语里,除了语序、虚词、词的分布等,语音节律(包括轻重、停顿、音节多少、连读变调、特定音素、语调等)也是重要的语法形式或手段。反之,语句中的语音节律的种种变化,也决定于语法中的各种语法意义。词汇中的词语是语音和意义的结合体,语音是“能指”,意义是“所指”,二者合二为一:没有语音,意义只是头脑中的概念,词语也就无法显示;反之,没有语言的词汇系统,也不可能概括或描写出一种语言的语音系统。
2.语法和语音的关系
2.1 语法对语音的影响
如果从语法出发来考察语音,就会发现语法对于语音的影响是多方面的,这里仅从语法与语音的轻重为例说点看法。
(1)“句法-语义”②结构制约结构重音
结构重音(有的称作“语法重音”,有的称作“意群重音”,有的称作“常规重音”)指短语中“句法-语义”结构的重音。它是由短语的“句法-语义”结构决定的。静态的短语结构的重音的一般规律是:
1)主谓结构中谓语和动核重读,如“骏马奔驰、技术革新、天气晴朗”之类;
2)述宾结构中宾语和客事重读,如“造房子、割小麦、写诗歌”之类;
3)述补结构中补语和第二动核重读,如“吃饱、说清楚、跑得累”之类;1 ①
4)定心结构中定语和限定元重读,如“好天气、木头房子、大型拖拉机”之类;
5)状心结构中状语和状态元重读。如“埋头读书、慢慢说、非常聪明”之类;
6)联合结构中,联合的成分无轻重之别。如“工农兵、哥哥和弟弟、多快好省”之类。在静态短语里,上述规律比较严格,相对固定。在动态短语(动态句子里出现的短语)③里,其结构重音一般也是这样,或者说有这种倾向性;但由于受语用表达的限制,有时比较灵活,可能会突破上述规律,比较:
A. 跌伤(“跌伤”为静态短语,“伤”重读)
B. 他跌得怎么样?――他跌伤了。(“跌伤”为动态短语,“伤”重读)
C. 他怎么受伤的?――他是跌伤的。(“跌伤”为动态短语,“跌”重读)
(2)语用因素制约表达重音
表达重音(有的称作“逻辑重音”,有的称作“强调重音”,有的称作“对比重音”)指具体句子中对某成分强调的重音,它是由语用中的焦点决定的,从这个意义上说,表达重音实质上是表达句子焦点的重音。
以陈述句而言,静态孤立句④的表达重音的规律是:句末成分一般是表达重音,这是因为在陈述性的孤立句中,句子的焦点通常在句末。句末焦点一般称为常规焦点,所以句末重音是常规的表达重音。但句子类型很多,不同的句子句末成分的情况不完全一样,所以对不同句子的“句末成分”的重音配置必须作进一步的说明:
1)在“SV”句里,如果V是单个动词或形容词,则句末重音落在该动词或形容词上,如如“他休息了”中,句末重音落在“休息”上。
2)在“SV”句里,如果R是一个状心短语,句末重音则落在状心短语中作状语的那个词上,如“你快点儿走啊”、“今天的天气非常好”中,句末重音分别落在“慢慢”和“非常”上。
2)在“SVO”句里,如果O是单个名词(包括动元化的谓词),句末重音则落在作O的那个名词(包括动元化的谓词)上,如“张三批评了李四”、“她渴望学习”中,句末重音分别落在“李四”和“学习”上。
3)在“SVO”句里,如果O是一个定心短语,句末重音则落在定心短语中作定语的那个词上,如“我们的祖国是伟大的祖国”中,句末重音落在“伟大”上。
4)在“S把OV”或“O被SV”里,句末重音落在V上,如“张三把李四批评了”和“李四被张三批评了”中,句末重音落在“批评”上。
5)在“SVR”句里,句末重音落在R上,如“他吃饱了”、“我来早了”中,句末重音在分别落在“饱”和“早”上。
5)在“SV得R”里,如果R是单个谓词(动词或形容词),句末重音落在该谓词上,如“他说得对”中,句末重音在“对”上。
6)在“SV得R”里,如果R是一个状心短语,句末重音则落在状心短语中作状语的那个词上,如“我吃得太饱了”中,句末重音落在“太”上。
在动态的语境句里,其表达重音一般也是这样。这是因为:孤立句中的常规焦点,是语境句对比焦点的一种倾向性,孤立句中的表达重音也是语境句表达重音的一种倾向性。语境句中的表达重音往往跟孤立句中的表达重音具有同一性;但由于受语用表达的限制,语境句中的对比焦点常有变化,相应地,表示对比焦点的表达重音也会常有变化,如“他在写诗歌”,此句出现在不同的语境里时会有不同的对比焦点和表达重音,比较:
①谁在写诗歌?他在写诗歌。
②他在写什么?他在写诗歌。
③他在干什么?他在写诗歌。
上面三句重音落点不一样,表示了句子语用上的焦点或强调重点不一样:例 ①“他”重读,焦点或强调重点落在“他”上;例②“诗歌”重读,焦点或强调重点落在“诗歌”上;例③“写”重读,焦点或强调重点落在“写”上。
由此可知,区分孤立句和语境句,有助于说明句子的常规焦点和对比焦点,也有助于说明句子表达重音从静态角度观察具有规律性,从动态角度观察具有灵活性。
2.2 语音对语法的影响
如果从语音对语法的影响出发来考察语法,就会发现句中词语的语音节律不一样会影响句子的句法、语义或语用。这表现在:
(1)语音的轻重会影响语法
语音的轻读或重读,会影响句法、语义和语用,例如:
“起来”若重读,是谓语动词,表示动作的趋向,“想起来”为动宾结构;“起来”若是轻读,则是动态助词,“想起来”为“动词+开始体”。相应地句子也就表示不同的意思。⑤②我要学习文件。
如果“文件”重读,则“学习文件”为述宾结构;如果“学习”重读,则“学习文件”为定心结构。重音位置不同,意义也完全不一样。
③a.[谁去北京?]----b.[你去哪里?]----
③a中的重音落在“我”上,③b的重音落在“北京”上。表达重音的不同,反映句子表达重点的不同,也就是焦点的不同。
(2)语音的停顿会影响语法
停顿或不停顿会影响句法、语义或语用,例如:
①a.他说/我爱上你了。b.他说我/爱上你了。
这两句停顿不一样,意思也不一样:a句的谓语“说我爱上你”为动宾短语,则“他”和“我”是同一人;b句的谓语“说我爱上你”为述补短语(一般语法书称为“兼语短语”),则“他”和“我”不是同一人。
②a.他是一个大学生。b.他,是一个大学生。
这两句的句法结构和语义结构相同,但语用上有差别:例②a“他”后面无停顿,“大学生”
是强调重点,一般要重读;例②b“他”后面有停顿,“他”是强调重点,一般要重读。
(3)句子的语调会影响语法
语调会影响句法、语义或语用,例如:
①a.中国足球队出线了。b.中国足球队出线了!C.中国足球队出线了? 这三句语调不一样,表达用途也就不一样:a句表示陈述,b句表示感叹,c句表示询问。②a.你了解/我不了解。b.你了解我/不了解?
这两句既涉及停顿,又涉及语调。a句和b句由于停顿和语调都不一样,所以意思也就完全不一样:a句表陈述,句中两个“了解”的施事分别是“你”和“我”;b句表询问,句中两个“了解”的施事都是“你”。
(4)音节会影响语法(略)
(5)连读变调、特定音素等都会影响语法(略)
3.词汇和语音
3.1语音对词汇的影响
(1)音节、音素对构词的影响
汉语双音节象声词很象形容词,构成四音节和三音节的生动形式的象声词是有规律的。这种规律跟两字的音节、声母或韵母都有密切的关系。这种情形在上海话里表现得非常丰富。下面以上海话为例来说明音节、音素对构词的影响。
如果把上海话双音节象声词记作AB,其构成的四音节和三音节生动形式有两种:
1)音节重叠
通过音节重叠,上海话双音节象声词可以构成以下4种生动形式:ABAB式、AABB式、AAB式、ABB式。例如:
AB→AABB:劈拍→劈劈拍拍;滴答→滴滴答答;历录→历历录录
AB→ABAB:劈拍→劈拍劈拍;滴答→滴答滴答;历录→历录历录
AB→AAB: 劈拍→劈劈拍;滴答→滴滴答;历录→历历录
AB→ABB: 轰隆→轰隆隆;发辣→发辣辣;五里→五里里
但值得注意的是:有些双音节象声词不能构成以上几式,这和双音节象声词的声母有关。其规则是:AB中的A的声母若是m、n、f、v、k、g、h等鼻音、擦音、舌根音,就不能构成AABB和AAB式;AB中的A的声母若不是L声母,则不能构成ABB式,如:
发辣→*发发辣辣→*发发辣;五里→*五五里里→*五五里
格支→*格格支支→*格格支;轰隆→*轰轰隆隆→*轰轰隆
劈拍→*劈拍拍;→*格支支;发辣→*发辣辣;五里*五里里
2)增加新音节
通过增加新音节,上海话双音节象声词可以构成以下2种生动形式:ALBL、ALB 式。这两种生动形式的象声词里,双音节象声词与前后两字的声母和韵母有密切的关系,而且音
素(或声母)“L”在构词上起了很大的作用。例如:
1)ALBL式(ALBL为四个不同的字,AL叠韵,BL叠韵)
AB→A里B拉:咪麻→咪里麻拉;唧喳→唧里喳拉
AB→A里B喽:叽勾→叽里勾喽;欺口→欺里口喽
AB→A里B噜:叽咕→叽里咕噜;欺库→欺里库噜
AB→A令B啷:叮当→叮令当啷;乒乓→乒令乓啷
AB→A令B隆:叮咚→叮令咚隆;平篷→平令篷隆
AB→A历B辣:劈拍→劈历拍辣;滴答→滴历答辣
AB→A历B录:毕卜→毕历卜录;悉索→悉历索录
上海话双音节象声词构ALBL式生动形式的规则是:
第一,A和B后的音节必是L声母;A后的L和A韵母构成音节,B后的L和B韵母构成音节。
第二,AB两字韵母必须不同;如果两字同韵,则不能构成ALBL式,如“拍塔、哐啷、咚隆”之类。
第三,AB中B的声母不能是L,B的声母必须能同声母L搭配;如果不是这样,则不能构成ALBL式,如“拍辣、咕噜、轰隆”的声母都是L,“格支”的B声母不能同L搭配,所以不能构成ALBL式。
第四,AB的韵母必须都是舒声或都是入声;如果AB中一个是舒声,另一个是入声,则不能构成ALBL式,如“咯铛、壳汤”之类。
1)ALB式(ALB为三个不同的字,AL叠韵)
AB→A啷B:拍汤→拍啷汤;白堂→白啷堂
AB→A楞B:钵登→钵楞登;泼吞→泼楞吞
AB→A令B:叮当→叮令当;定堂→定令堂
AB→A隆B:扑通→扑隆通;谷咚→谷隆咚
AB→A里B:叽咕→叽里咕;叽勾→叽里勾
AB→A辣B:柏嗒→柏辣嗒;拍辣→拍辣塔
AB→A录B:卜督→卜录督;谷督→谷录督
AB→A历B:劈扑→劈历扑;滴督→滴历督
上海话双音节象声词构ALB式生动形式的规则是:
第一,A和B之后的音节声母必是L,韵母必和A同韵。
第二,AB中B的韵母不能是必须不同;如果两字同韵,则不能构成ALB式,如“拍塔、哐啷、咚隆”之类。
第三,AB中B的声母不能是L,B的声母必须能同声母L搭配;如果不是这样,则不不能构成ALB式,如“咕噜、轰隆、五里、咯吱”等便是。
第四,AB中B的AB中B若是舒声字,则ALB中的L所代表的字也必是舒声字;反之,B若是入声字,则ALB中的L所代表的字也必是入声字。
(2)连读变调对构词的影响(如上海话的“炒青菜”)。
(3)从吴语的几个合音词看语音和词汇的关系(如“勿要、勿曾、阿曾”之类)。
3.2 词汇对语音的影响
(1)构词的词缀一般轻读
汉语词汇中的词,如果是有两个或两个以上的语素组成的合成词,其内部语素有的有轻声(轻读),有的没有。合成词的构词语素如果是虚素(词缀),一般轻读,如“子、儿、头、老、第、们”等。还有一些“老资格的口语词”的语素,很多含有轻声。所以,一个合成词内部的语素是重读还是轻读“纯粹是词汇问题,只能一个一个地编入词典”。
(2)实词转化为虚词,语音也就轻读
汉语中的虚词,绝大部分是从实词演变转化过来的。它们在汉语历史的某个阶段曾经是实词,但一旦成为虚词,一般就得轻读。这样的虚词如:结构助词(“的、地、得”之类),动态助词(“了、着、过、起来、下去”之类),语气词(“的、了、吗、呢、吧”之类),介词(“把、被、自、从、往、在、对、给、比”之类),单音节的方位词(“上、下、前、后、里、外”之类),量词(“个、只、本、棵、支、条”之类)。
另外,有些正在演变中词也都轻读,如动结式中作结果补语表“实现、着落”的“好、见、住、着(zhao)、掉、死”之类。
附注:
①参看范晓《语法研究中意义和形式相结合的原则》,《语法研究和探索》四,北京大学出版社,1988年。语法结构体都包含有句法和语义,所以它是句法结构和语义结构的结合体。
③关于静态短语和动态短语,可参看范晓《三个平面的语法观》,第231-241页,北京语言学院出版社1996年。期;《试论语境句和孤立句》,《第一届中国语言文字国际学术研讨会论文》(香港)。④关于孤立句和语境句的区分,请参看范晓《关于句子合语法或不合语法问题》,《中国语文》1993年5期;《试论语境句和孤立句》,《第一届中国语言文字国际学术研讨会论文》(香港)。
⑤参看赵元任《汉语口语语法》(吕叔湘译)第27页,商务印书馆,1979年。②⑤
中文语言环境 篇3
1.1 自然语言处理技术的发展历程
语言在人类社会的形成和发展过程中有至关重要的作用, 只有掌握自然语言, 人与人之间才能更好地沟通和交流。在人类的大脑皮层中有专门处理自然语言的区域, 这也是人类智慧的根源和开发人工智能的关键。
自然语言处理技术是所有与自然语言的计算机处理有关的技术的统称, 其目标是给计算机配备各种语言知识, 使其能够接受人们采用自然语言给它输入的命令, 理解人们所要表达的意思, 实现从一种语言到另一种语言的翻译等功能。
用自然语言与计算机进行通信, 这是人们长期以来所追求的。因为它既有明显的实际意义, 同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机, 而无需再花大量的时间和精力去学习不很自然和习惯的各种计算机语言;人们也可通过它进一步了解人类的语言能力和智能的机制。
最早的自然语言理解方面的研究工作是机器翻译。1949年, 美国人威弗首先提出了机器翻译设计方案。20世纪60年代, 国外对机器翻译曾开展大规模的研究工作, 耗费了巨额费用, 但人们当时显然是低估了自然语言的复杂性, 语言处理的理论和技术均不成熟, 所以进展不大。主要的做法是存储两种语言的单词、短语对应译法的大辞典, 翻译时一一对应, 技术上只是调整语言的同条顺序。但日常生活中语言的翻译远不是如此简单, 很多时候还要参考某句话前后的意思。
大约90年代开始, 自然语言处理领域发生了巨大的变化。这种变化的两个明显的特征是: (1) 对系统的输入, 要求研制的自然语言处理系统能处理大规模的真实文本, 而不是如以前的研究性系统那样, 只能处理很少的词条和典型句子, 只有这样, 研制的系统才有真正的实用价值; (2) 对系统的输出, 鉴于真实地理解自然语言是十分困难的, 并不要求系统能深层理解自然语言文本, 但要能从中抽取有用的信息, 例如, 对自然语言文本进行自动提取索引词, 过滤、检索、自动提取重要信息, 进行自动摘要等。
1.2 自然语言处理技术的主要研究问题
自然语言处理的研究分为基础性研究和应用性研究两部分, 这两类研究都是从语音和文本两方面进行的。基础性研究主要集中在语言学、数学、计算机科学等领域, 比如消除歧义、语法形式化、计算语言学理论基础以及语言资源库等。应用性研究主要集中在一些需要应用自然语言处理技术的领域, 比如信息检索、文本分类、自动文摘、机器翻译等。
作为计算机科学与数学建设所用的计算机语言, 通过建立形式化的计算模型来分析、理解和处理自然语言的学科, 自然语言处理致力于处理人和机器之间的交流沟通问题。目前科学家们已研制出了能处理计算机文本和语音的自然语言处理系统, 最终将会开发出能理解并生成人类语言的计算机系统。
1.3 自然语言处理技术的应用场景
自然语言处理技术研究的最终目的在于应用, 如机器翻译、智能检索、自动文摘、信息检索等。下面仅从机器翻译、搜索引擎两方面介绍国内企业对于自然语言处理技术的使用情况。
1.3.1 机器翻译
20世纪90年代以来, 国内机器翻译研究有了长足的进步。目前正在从事机器翻译研究的高校包括北京大学、清华大学、哈尔滨工业大学等, 研究所包括中国科学院计算技术研究所、自动化研究所等, 公司有译星公司、华建公司等。这些单位的研究成果在产品开发中得到了充分运用。例如, 译星、高立、通译等全自动翻译系统, 采用全自动机器翻译技术, 有简单的全自动翻译功能, 采用的主要技术不是全自动的机器翻译, 而是翻译记忆 (TM) 技术。
很多网站提供的在线翻译服务, 为网上阅读者快速理解和使用外文资源提供了方便, Google公司的快速翻译就是典型的应用事例。
1.3.2 中文搜索引擎
中文搜索引擎是以网络上的中文信息为主要对象, 可提供信息的自动收集、索引和检索等服务的数据库服务系统。常见的搜索引擎公司有Google、百度等。尽管这些企业所开发的搜索引擎产品各有特色, 其采用的自然语言处理技术却大致相近, 包括以下几种。
(1) 中文自动分词技术。目前大多数搜索引擎采用的都是关键词匹配查询方法。关键词查询的前提是将查询任务分解为关键词, 中文与西文的不同在于中文需要人为进行分词, 完善的中文自动分词技术可以有效排除各种歧义, 提高分词的准确率, 从而提高查询准确率。
(2) 短语自动识别技术。通常情况下, 用户所提出的查询请求以短语形式呈现, 如用户要查询“北京的建筑”, 应将“北京”和“建筑”联合起来作为一个短语查询, 过滤掉那些只有“北京”或只有“建筑”的文档。因此, 短语识别技术是搜索引擎公司常用的自然语言处理技术。
(3) 同义词处理技术。对专用领域的搜索引擎, 人工构造同义词表的方法能有效解决同义词问题。而对一般领域的搜索引擎, 需要从语料中自动取得同义词, 在给出一个关键词的情况下, 搜索引擎应能自动查找, 找到其同义词。
2 中文分词研究背景、目的及意义
2.1 背景
随着社会的发展和计算机科学的进步, 人机交互问题亟待解决, 虽然有了键盘和鼠标, 但依然不能满足人们日常生活的需要, 人们希望能有更方便、更快捷的方式与计算机进行交互, 语音交互成为一个研究的重点。语音交互特别是中文与计算机之间的交互问题, 对中国人来说是很重要的一个问题, 从使用中文与计算机进行交互以来, 一直没有完美的解决途径。中文与其他语言不同, 中文中字与字之间没有很好的标识符, 不像英文单词之间有空格, 所以, 中文中对句子进行分词, 是一个难点, 也是一个重点, 如果中文的分词问题都解决不好, 后面的处理效果就会非常差, 不能让人满意。
目前最常用、最基本的中文分词算法基于词典的方法, 正向最大匹配与逆向最大匹配的方法, 能对句子进行简单的分词。
2.2 目的
中文分词是自然语言处理技术中最基本和最重要的部分, 分词的好坏直接影响到后面的句法分析、语义分析, 只有分词分对了, 后面的处理效果才会好, 如果一句话连分词都分错了, 很可能这句话的意思就被理解反了, 例如, 一句话本来想表达的是“不高兴”的意思, 分词分错了, 可能就表达成了“高兴”的意思。所以, 研究中文分词, 如何提高分词的准确率, 是很重要的一个问题。
2.3 意义
解决了中文分词这个难题, 可以为后面的研究打下一个很好的基础。当自然语言处理技术的每一个小的方向都提高了以后, 就能方便快捷地与计算机使用自然语言进行沟通, 我们的生活也将变得更加丰富多彩。
3 现代中文词语切分的方法
中文自动切分就是把一句活自动转换为多个词的过程, 但由于中文的词汇间没有间隔, 同英语相比, 中文的切分较为困难。中文的切分是中文中句法分析、语义分析等的基础。
3.1 基本方法
(1) 基于词表的方法。
最大匹配法:正向最大匹配法、逆向最大匹配法。
全切分+路要选择。
(2) 字序列标记方法 (非基于词表方法) 。
3.2 中文分词的关键问题
在中文的切分中有两大关键问题至今仍未能得到很好的解决, 它们是歧义识别和未登录词识别。
3.2.1 歧义问题
切分歧义包括混合型歧义和交集型歧义以及二者结合所形成的组合型歧义。
(1) 交集型歧义。在一个字符串中若An与前m项和右P项都可结合成一个词, 此时对于字符An有两种不同的切法, 我们称对于此字符串中的An有交集型歧义。如字符串“从小学”中字符“小”既能与字符“从”组合成词“从小”, 又能与字符“学”组合成词“小学”。若不根据语境, 很难判断字符串“从小学”的正确切分方法, 那么这个字符串便存在着交集型歧义。
(2) 组合型歧义。对于字符串A, 若“Am Am+1”可成一个词, “Am”和“Am”也可以单独成词, 即称对于字符串A存在组合型歧义, 如“美军中将竞公然说”中的“中将”既可单独成词, 也可组合成词, 所以这句话存在组合型歧义。组合型歧义占常见的歧义问题的90%以上, 是最难避免的一类歧义, 值得研究人员予以重视。
(3) 混合型歧义。若字符串中存在混合型歧义, 那么此字符串中一定同时出现交集型和混合型两类歧义, 如“这样的人才能经受住考验”, 既可以切分成“这样的/人/才/能/经受住考验”, 也可切分成“这样的人/才能/经受住考验”。在这种情况下很难说清楚到底哪种切分才是正确的切分方式, 似乎各自有各自的道理, 所以混合型歧义是最难消除的一类歧义。
在上述歧义类型中有些歧义是可以避免的, 可以称为“伪歧义”。如对“切分成”能切分成“切/分成”和“切分/成”, 很明显只有后种切分方式是正确的, 即此字符串中不存在“真歧义”, 而是“伪歧义”。在真实的文本歧义中, 伪歧义的比例达94%, 可见大部分歧义在理论上是可以避免的。
3.2.2 未登录词的识别
未登录词即没有被收录在分词词表中但必须切分出来的词, 包括各类专有名词 (人名、地名、企业名等) 、缩写词、新增词汇等。
3.2.3 切分结果的评价指标
准确率在中文分词中能很好地评定一个分词系统的查准率, 主要针对单篇文章;召回率则能评定一个分词系统对于大量文档的覆盖范围, 即查全率;对于F值, 简单地来说就是两者的调和平均数, 对于一个分词系统的科学评定是非常重要的。例如对于文档“该书对地理学的贡献甚至达到了西方地理学的现代水平”, 分词系统的切分结果为“该书对地理学的贡献甚至达到了西方地理学的现代水平”, 正确的切分结果为“该书对地理学的贡献甚至达到了西方地理学的现代水平”。
4 中文分词基本算法介绍
基于词典的方法 (字符串匹配、机械分词方法) :按照一定策略将待分析的汉字串与一个提前生成好的词典中的词条进行匹配, 若在词典中找到某个字符串, 则匹配成功。按照扫描方向的不同分为:正向匹配和逆向匹配。
4.1 正向最大匹配算法MM
(1) 从左向右取待切分中文句的m个字符作为匹配字段, m为词典中最长词条个数。
(2) 查找词典并进行匹配。若匹配成功, 则将这个匹配字段作为一个词切分出来。若匹配不成功, 则将这个匹配字段的最后一个字去掉, 剩下的字符串作为新的匹配字段, 进行再次匹配, 重复以上过程, 直到切分出所有词为止。
4.2 逆向最大匹配算法RMM
该算法是正向最大匹配的逆向思维, 从右向左去匹配, 匹配不成功, 将匹配字段的最前一个字去掉。
5 结语
中文分词技术在数字资源处理、在线翻译、搜索引擎技术中有大量的应用, 值得我们关注并认真探究, 在不断的探究中, 不断开发更加便捷实用的算法以达到更好的效果。只有实践才是硬道理, 只有不断探索, 敢于创新才能总结出更佳的办法。
中文分词, 作为一个需要进行长期研究的领域, 虽然国内自然语言处理的研究已取得了不少成果, 但准确率还没有达到让人很满意的程度, 随着研究的不断深入, 分词技术会越来越成熟, 一定会推动自然语言处理技术向前发展。
摘要:中文分词是自然语言处理处理的基础, 有着极其广泛的实际应用。可以说, 在各类中文信息处理软件 (系统) 中, 中文分词都是不可或缺的环节。随着互联网在中国的兴起, 对中文信息处理提出更高要求, 即在语义层面上处理中文, 这使得中文分词算法的研究显得更加困难, 中文分词技术的发展显得更为重要。
【中文语言环境】推荐阅读:
sql语言中文10-13
中文系汉语言文学毕业自荐信08-17
日语基本用语中文发音-中文谐音12-02
语言交流环境05-11
高校语言环境05-16
生活语言环境05-22
英语语言环境09-30
语言发展环境11-16
创设语言环境11-20
语言环境建设06-04