音节划分

2024-10-18

音节划分(精选3篇)

音节划分 篇1

0 引 言

藏文信息化和网络化是藏民族发展的必然趋势。在藏文信息化的发展过程中,文本是自然语言处理的主流领域和基本范式。因此,国内外不少专家对藏文字进行过深入的研究,为藏文在计算机中的处理奠定了良好的理论基础,并对在计算机中的实现进行过有效的研究。“现代藏文音节的程序判定”正是对藏文文本信息处理的尝试性研究,目的是在音节判定程序中对随机输入的藏文字符判定其是否符合现代藏文音节结构,并且判定该藏文字符是否具有现代藏文文字的语义。

一个现代藏文音节是藏文字母的横向和纵向组合,具有特定的二维结构,但计算机中却只能存成一维的编码序列。例如:二维的现代藏文音节只能存为一维的编码序列:0F56 0F66 0F92 0FB2 0F72 0F42 0F66。在音节层面上,藏文音节串的排序规则和汉文字符串相同:一个汉文字符串的顺序由串中各个汉字依次决定,一个藏文音节串的顺序也由串中各个音节依次决定。二者不同的是:每个汉字的顺序直接由排序码确定,而每个藏文音节的顺序进一步由它的构成字母依次确定。因此,要实现藏文音节的排序需要为每个藏文字母赋予适当的排序码,在对藏文字符的构成组件的字母赋予排序码之前的首要任务就是对藏文字符进行音节的判定,拆分其构成组件。因为任意几个藏文编码形成的序列不一定表示一个现代藏文音节,要使一个藏文编码序列表示一个现代藏文音节需要满足两个条件:首先,该编码序列满足特定的藏文音节结构;其次,结构中各个位置上的字母必须符合正字法的要求。

一个藏文音节的字典顺序是依次由基本辅音、前加辅音、上加辅音、下加辅音、元音、后加辅音和又后加辅音决定的,在对藏文排序中有引入排序码实现藏文字符的排序,和针对藏文“大字丁字符集”编码方案,也有通过引入有(无 )前加基字符的概念 ,把待排序的藏字预处理为有 (无 )前加基字母、前加字母、基字 (基字符或者字丁 )、后加字母、再后加字母串后 ,再行比较 、排序。对藏文字符进行音节的判定、拆分构成组件的过程是将一维的编码序列恢复成二维的藏文音节结构,然后对于二维的藏文音节结构进行组件的拆分,这样才能用计算机为一个藏文音节按照字典顺序进行排序。对一个编码序列而言,这个过程就是对藏文计算机中的一维编码来确定哪个编码是基本辅音、哪个编码是前加辅音、哪个编码是后加辅音、哪个编码是又后加辅音等的过程。对于这些判定过程,最关键的是要找出藏文字符中组合字符的编码,而要找出组合字符的前提首先是需要判定占位编码和不占位编码的位置。

1 占位编码和不占位编码判定

现代藏文有30个辅音和4个元音。最多3个辅音和最多1个元音的垂直叠加形成组合字符。组合字符中有一个“中心”辅音,称为基本辅音;其它辅音根据它们相对于基本辅音的位置而分别称为上加辅音或者下加辅音。藏文字符显示时,一个组合字符只占据一个字母的宽度,这个宽度由第一层辅音决定,这个辅音称为占位辅音,这个辅音的编码也就称为占位辅音编码,其它字母只是叠加在占位辅音的上方或者下方而不单独占据宽度,称为不占位字母或不占位编码。例如,组合字符中辅音是占位字母而辅音以及元音是不占位字母。由于每个辅音可能占位也可能不占位,因此每个辅音有两个编码分别表示占位和不占位。例如,组合字符中辅音是占位字母,辅音的占位编码是U+0F66 ,而不占位编码是U+0FB6。由于前加辅音、后加辅音和又后加辅音都是占位的,这意味着不占位编码只能出现在组合字符中,利用这点可以从一个编码序列中定位构成组合字符的编码。

如图1所示,“现代藏文音节结构”中垂直叠加部分就是组合字符,一个完整的组合字符由基本辅音、上加辅音、下加辅音和元音构成,基本辅音前最多有一个辅音,称为前加辅音;基本辅音后最多有两个辅音分别称为后加辅音和又后加辅音。实线表示该位置的字母不能空缺,而虚线表示该位置的字母可以空缺。

判断一个藏文音节结构及各个位置字母的限定前题是:判定是否有、无占位的辅音编码,由此在整个藏文音节中占位编码的判定是解决问题的根本。

现代常用藏文的占位、不占位字母及编码如下:

30个藏文辅音占位字母及编码如下所示:

33个藏文辅音不占位字母及编码如下所示:

4个藏文元音不占位字母及编码如下所示:

组合字符的编码是按照书写顺序存储的,即按照上加辅音、基本辅音、下加辅音、元音的顺序储存的,由于组合字符的第一层辅音是占位的而其它字母都是不占位的,并且一个组合字符对应的编码特点是:一个占位编码紧接着最多三个连续的不占位编码。利用这点可以将构成组合字符的所有编码找出来。对于一个藏文音节组合字符的判定,最重要的前提是需要判定一个藏文字符的编码序列中哪些编码占位,哪些编码不占位。对所有的藏文占位字符编码和不占位字符编码建立数据库,不占位编码数据库需要包括33个藏文不占位辅音编码和4个元音编码。

对于检测一个编码串是不是组合字符可依据对应的编码特点:一个占位编码紧接着最多三个连续的不占位编码。取出第一个编码和占位编码数据库进行比对,如果是占位编码,则取出第二个编码和不占位编码数据库比对,如果属于不占位编码数据库,则取出第三个和不占位编码数据库比对,如果是则取出最后一个编码和不占位编码数据库比对,若属于不占位编码数据库,则推出该串编码就是组合字符的编码。所以说在整个音节的判定过程中对于辅音编码占位和不占位的判定就是解决问题的根本。

以为例来说明,它的组合字符的结构如图2所示,其存储结构如图3所示。

例如:我们取输入到“藏文音节占位编码和不占位编码判定程序”(界面见图4所示)中检测,可以判定出藏文音节占位编码、不占位编码。

2 现代藏文音节结构的判定

一个编码序列为了要表示一个现代藏文音节,首先得满足特定的音节结构,而判断编码序列所满足的音节结构的过程,也就是判断哪个编码是基本辅音、哪个编码是前加辅音、……以及哪个编码是又后加辅音的过程,其中基本辅音的确定是关键。为此,将编码序列根据有无不占位编码分情况讨论:如果有不占位编码则编码序列中有组合字符,这时基本辅音一定在这个组合字符中,组合字符的前一个占位辅音编码就可能是前加音,组合字符后的编码有可能是后加辅音和又后加辅音,否则根据占位辅音的个数以及占位辅音间的关系来确定基本辅音。

2.1 有不占位编码时的音节结构

一个藏文编码序列有不占位编码则说明现代藏文音节中有组合字符。由于基本辅音只能出现在组合字符中,因此应先找出那些构成组合字符的编码。由于不占位编码只出现在组合字符中,并且组合字符的编码特点是一个占位编码紧接着最多三个不占位编码,因而利用这些特点可以为组合字符定位并且能找出构成组合字符的所有编码。

当构成组合字符的编码确定后,进一步需要判断它们在组合字符中的位置,即确定哪个编码是基本辅音、哪个编码是上加辅音等。根据编码序列中辅音的个数分情况讨论,如果:

1) 只有一个占位辅音,则它就是基本辅音;

2) 如有两个辅音,则音节结构可能是基本辅音+下加辅音,也可能是上加辅音+基本辅音;

3) 如有三个辅音,则音节结构可能是上加辅音+基本辅音+下加辅音。

这样就找出了构成组合字符的编码并且确定了编码间的位置关系,进一步还需确定前加辅音、后加辅音和又后加辅音。如果组合字符前有一个占位辅音则是前加辅音,否则前加辅音为空;如果组合字符后有一个占位辅音则是后加辅音,否则后加辅音为空;如果后加辅音后有一个占位辅音则是又后加辅音,否则又后加辅音为空。

2.2 无不占位编码时的音节结构

一个现代藏文编码序列中,如果没有不占位编码,则相应的现代藏文音节中没有组合字符,这个音节是由最多4个占位辅音的横向组合。根据占位辅音的个数分情况确定基本辅音以及辅音间的关系,如果:

1) 只有1个辅音,则它就是基本辅音,音节中其它位置上的字母空缺;

2) 如有2个辅音,则音节结构可能是前加辅音+基本辅音,也可能是基本辅音+后加辅音;

3) 共有3个辅音,则音节结构可能是前加辅音+基本辅音+后加辅音,也可能是基本辅音+后加辅音+又后加辅音;

4) 共有4个辅音,则音节结构可能是前加辅音+基本辅音+后加辅音+又后加辅音。

根据上述内容,针对有无占位编码时,组合字符辅音编码的个数和音节结构类型有固定的联系。组合字符辅音编码的个数与音节结构类型关系如表1所示。

3 现代藏文音节中各个位置上字母的限定条件

通过以上音节程序的判定,仅仅判断出一个编码序列可能满足的结构,但仍有其他问题需要解决。虽然有些编码序列满足藏文音节结构,但是满足藏文音节结构的编码序列并不一定表示一个现代藏文音节。

这些编码(字母)还需满足正字法的要求。也就是对各个位置上的字母有限制:1) 正字法对前加辅音、上加辅音和下加辅音的限制;2) 正字法对元音、后加辅音和又后加辅音的限制。具体的限定如下。在现代藏文音节结构中能充当前加辅音的有5个藏文字母,这5个藏文字母及编码是:

在现代藏文音节结构中能充当上加辅音的有3个字母,这3个藏文字母及编码是:

在现代藏文音节结构中能充当下加辅音的有4个字母,这4个藏文字母及编码是:

在现代藏文音节结构中能充当元音的有4个藏文字母,这4个藏文字母及编码是:

在现代藏文音节结构中能充当后加辅音的有10个藏文字母,这10个藏文字母及编码是:

如果音节中既有后加辅音也有又后加辅音,则正字法限定后加辅音和又后加辅音有4种组合,这4种组合的藏文字母和编码是:

在无组合字符中,如若有2个辅音则需要首先判断这2个辅音组合是不是属于限定的16种组合,这16种组合藏文字母及编码是:

然后再进一步利用正字法的其他限定条件来判断辅音字母的类型,比如前加辅音的判定和后加辅音的判定。通过上述正字法的限定,可以判定一个藏文音节结构是否符合现代藏文音节结构,以及是否是一个现代藏文音节。

4 结 语

通过对占位和不占位编码的判定来找出组合字符;确定了组合字符以后根据正字法的限定判定一个藏文音节的结构以及该藏文音节是否是现代藏文音节。由于时间、技术等方面的限制,藏文音节的判定在很多方面还存在不足之处,需要进一步的研究。相信随着大家共同的努力,我国的藏文信息化发展会越来越好。

摘要:在藏文信息处理中,实现藏文字符的字典排序是一个比较重要的问题,实现藏文字符排序的关键是准确地判定藏文音节。藏文音节的判定关键是组合字符的判定。判定组合字符的瓶颈是藏文字符编码的占位和不占位的判定。通过应用程序对藏文编码的占位和不占位的有效判定,即可找出组合字符。对找出组合字符的藏文字符可通过藏文正字法的限定对藏文音节进行有效的判定和音节组件的拆分,从而为藏文字符的字典排序奠定基础。

关键词:藏文音节,辅音,占位

参考文献

[1]曾士熊.Unicode与ISO10646[J].资讯话题,2005(1510).

[2]张兴亮,等.藏文编码字符集的扩充集在Linux上的实现[J].中文信息学报,2007,21(2):122-128.

[3]珠杰,欧珠.基于藏文编码GB的藏文排序方法研究[J].西藏大学学报,2008(1).

[4]周炜.民族语言文字信息技术发展背景下的藏文编码国际标准研制工作[J].中国藏学,2007(2).

[5]黄鹤鸣,达飞鹏.基于排序的藏文音节类型判定[J].计算机应用,2009,29(7):2003-2005.

音节划分 篇2

一、如何划分单词的音节

1. 元音是音节的核心, 元音是由元音字母 (组合) 所发出的音。所以, 一个单词有几个发音的元音字母 (组合) , 该单词就有几个音节。如:window有一个元音字母i, 还有一个元音字母组合ow, 而且它们都是发音的。因此, 该单词有两个音节, 是一个双音节词。

2. 在以“辅音字母+le”结尾的单词中, 该辅音字母和le也可以组成一个音节。如:people, table, apple等都是双音节词。

3. 半元音字母y和其前的辅音字母也可以组成一个音节。如:my, try, family等。

4. 辅音字母+元音字母 (组合) +n:在非重读音节中也可以组成一个音节, 此处的元音字母 (组合) 不发音。如:listen:'lis-ten;lesson:'les-son;certainly:'cer-tain-ly等。

但是, 要注意结尾不发音的e和其他不发音的元音字母不能构成音节。如:bike是单音节词。every, interest中带点的e也不发音, 因此它们是双音节词。

二、如何确定重读和非重读音节

1. 单音节词一般都是重读音节, 重音符号省略;

2. 双音节词的重读音节一般是第一个, 第二个则是非重读音节。如:'win-dow, 'af-ter等。

3. 多音节词的重读音节一般是倒数第三个。如:'fam-i-ly, im'possible等。

但具有以下特征的双音节词的重读音节是第二个:

1.以a+辅音字母开头的。如:a'bout, a'way, ad'dress等。

2.以be开头的。如:be'gin, be'fore等。

3.以re开头的。如:re'lax, re'ply等。

除此之外, 还有以de-, ex-, im-, mis-开头的大多数双音节词的重音也在第二个音节上。

三、双音节词和多音节词音节的划分和重音规则

1. 双音节词。

(1) 代表音节的元音字母 (组合) 和另一个元音字母 (组合) 之间如果有一个辅音字母, 该辅音字母划归后一个音节, 则第一个音节为重读开音节, 元音字母读其长音。如:student:'stu-dent;open:'o-pen等。 (2) 代表音节的两个元音字母 (组合) 中间的辅音字母如果是v时, v一般划归第一个音节, 第一个音节则为重读闭音节, 元音字母读短音。元音字母 (组合) +ve结尾的单音节词也是如此。如:seven:'sev—en;clever:'clev—er;never:'nev—er live, give, have等。 (3) 以-dy、-ty或-ry结尾的重读音节中元音字母也读短音。如:study、city、body、very等。 (4) 代表音节的元音字母 (组合) 之间如有两个或两个以上的辅音字母, 则第一个辅音字母划归重读音节, 因此该音节为闭音节, 元音字母读短音。如:yellow:'yel-low;under:'un-der等。但仍有不少双音节词的重读音节不符合以上规则, 我们在学习时要多加注意。如:second、present、modern、secret等。

2. 多音节词。

(1) 多音节词的重读音节一般是倒数第三个, 而且无论重读音节和非重读音节的元音字母中间有几个辅音字母, 重读音节至少要有一个辅音字母, 因此多音节词的重读音节一般都是闭音节, 元音字母读短音。如:American:A'mer-ican;family:'fam-ily;interesting:'interesting;holiday:'hol-iday等。 (2) 有些多音节词除了重读音节外, 还有次重读音节, 该音节一般也要划为闭音节。如:competition:, compe'tition;television:'tele-, vision等。 (3) 元音字母u在双音节和多音节的重读音节中, 一般要读字母名称音。如:student、university、funeral等。 (4) 以-tion结尾的双音节词和多音节词的重读音节, 一般在其前的这个音节上。如:infor'mation、in'vention、'mention等。

四、派生词的重音规则

什么叫派生词呢?就是以一个词作为词根, 在其前或其后加一个字母或几个字母, 而派生出另一种词性或词义的词。在大多数派生词中, 词根的重读音节在什么位置, 派生词的重读音节也就在这个位置, 即词根的重读音节和派生词的重读音节一致。如:'happy-un'happy;'care-'careful-'carfully等。

五、非重读音节的读音规则

1. 元音字母a, o, u, e一般读[ə].如:about supply等。

2. 元音字母e, i (y) 一般读[i].如:begin thirty等。

3. 字母组合ar, er.or, ure一般读[ə].如:radar, doctor, picture等。

4. 字母组合ay, ey一般读[i].如:Sunday, volleyball等。

5. 元音字母o在词尾非重读音节中仍读其名称音。如:tomato, radio, photo, Negro等。

音节划分 篇3

目前我们教师队伍首先对单词音节划分不明确,更没有教给学生这种方法的意识,有的老师只是自己凭感觉会划分,但没有系统单词音节划分方法,因此从来都不给学生传授音节记忆法。下面就着重谈谈常见的单词音节划分规则:

划分方法一:主要是以单词音标发音为准来划分原单词音节,为了拼读方便,这里不谈开音节,闭音节。有的划分方法遇到开音节,闭音节与正规音节划分不一致。例如:mo/ther(根据音标),正规划分:math/er.在音标中,一个音节只有一个元音,往往是辅音+元音=一个音节,如:元音前如果没有辅音,这个元音可单独构成一个音节,如:,如果两个元音中间有重音则要分两个音节,如:。如果/m/,/n/,/l/前有辅音则可构成一个音节,如:如果两个元音中间有三个辅音则一个为前,两个为后,如:

划分方法二:此方法要考虑到开音节和闭音节,对单词的发音判断很重要。方法如下:

1.一个音节至少有一个元音字母,即a,e,I,o,u有时也为发元音的y字母。与一个辅音字母构成一个音节,例如re/port,com/for/ta/ble,for/ty.

2.单音节无须划分音节。只有一个元音字母或元音字母组合(ee,ea,oi,ui,ear,air,are,oo等等).元音字母组合在音标发一个元音音素,也就是两个辅音字母之间不管有多少个元音字母都为一个音节(元音字母中重音除外)例如:pink,look,wait,play,bee,beat,show,wear ,hair ,pare等。

3.两个元音字母间有一个辅音字母,这个辅音字母分为右面这个音节,也就是说发音的元音字母总是需要一个辅音成为一个音节。例如:di/rect be/hind a/ward In/de/pen/dence.

4.两个元音之间有两个不同的辅音字母,各自分左右两边的音节中,例如:ad/mire cus/tom bet/ter yel/low

5.如果单词以不发音的e结尾,字母e不能构成一个音节。例如:starve(一个)for/give science(一个音节)

6.成音节辅音:l,m,n的前面如果由一个其他的辅音字母,这个辅音字母可以同l,m,n构成音节,这时把l,m,n叫成音节辅音。例如:bot/tle but/ton rhy/thm

7.加前缀时,前缀单独划为一个或一个以上的音节。例如:dis/like be/head

8 . 加后缀时,后缀不影响其他音节的划分。如 - i n g , ed(id),-ly ,-ness,–ty,–ment -tion单独划分音节,但是-ed结尾发/d/或/t/不构成一个音节例如:paint/er fall/ing,agree/ment,pre/dict/ed,fol/lowed.

9.辅音字母组合不能划分开ph th sh ch gl pr wh qu tr dr gn ex等。例如;te/le/phone,bo/ther,sha/dow,chil/dren,pro/tec/tion,glo/ble,e/quip/ment,in/tro/duc/tion,ex/plain,fo/reign等等。

以上为词汇音节划分的常见方法,词汇音节划分对单词的发音和单词拼读至关重要。学生掌握了单词的发音,就有了自信去大声朗读文章,加强了英语语感,有了学习英语的兴趣,对记忆词义也有了信心和目标。因此,掌握了词汇音节划分,是突破词汇记忆方法之死记硬背的第一步,也是克服反复忘记的关键,只要不忘记发音就不容易忘记单词的拼写。希望代课教师细致,认真的把这个方法传授给学生,并在平时上课注重长单词的划分,划分要与发音结合起来。能让学生见到大量单词的划分,养成看到新单词就能正确划分音节的习惯。

摘要:单词音节划分在拼读和单词发音规则中至关重要,是高一学生必须要掌握的一部分内容。本文主要谈了单词音节的划分对单词拼读的重要性,不考虑开音节和闭音节。只要学生能根据单词音节划分提高单词的拼读,并对以后的英语学习有很大帮助。

上一篇:塑料产品生产下一篇:平巷施工