away的短语搭配初中

2024-10-16

away的短语搭配初中(精选9篇)

away的短语搭配初中 篇1

基于词的统计翻译模型模型[1,2]是早期机器翻译的一种方法。然而,词作为翻译的基本单元,不能很好地解决词在翻译时对上下文的依赖问题。因此,更有效的基于短语的模型出现并成为统计机器翻译方法的主流。基于短语模型的方法在翻译时将邻近的词串作为一个整体进行处理,因词之间的重排序问题变成了短语内部的问题 ,降低了翻译模型的复杂程度 ,翻译质量有所提高[3,4,5,6,7]。

短语切分不像词语切分那样,它没有统一的标准,也没有已切分好的训练语料库,这给切分工作带来了很大的困难。从语料库中发现重复串作为短语库是一种有效方法,而且只用单语的语料库,单语的语料库通常是很容易获得的。然而用于机器翻译时,也带来了问题: 一般统计机器翻译中的短语库都是从词对齐的双语语料库中自动抽取的,短语库中短语是对应的,这与单语料短语切分使用的短语库是不一致的:短语切分的结果不一定都能找到对应的翻译,这种不一致会影响到翻译质量[6],这样就要回退到基于词的翻译。因此,从双语语料中获得对齐的短语搭配,可以有效消除上述弊端。

1相关工作

文献[8]采用条件随机域建立统计模型,有针对性地研究了复杂最长名词短语的识别,并给出了一种带置信度估计的解码算法,提高了识别的正确率。

文献[9]提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中,首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名、地名和机构名等,然后依次采取高层隐马尔可夫模型识别出嵌套了人名、地名的复杂地名和机构名,实验结果显示了优异的效果。

文献[10]提出了一种基于非连续短语的统计翻译模型,模型可以使翻译的基本单元从连续短语扩展到带有间隔的非连续短语,更好地解决了词语翻译时的上下文依赖问题。同时,由于该方法抽取的短语数量较少,也使得解码的效率得到了提高。

文献[6]提出了一种短语切分方法,将句子的短语切分概率化,识别出汉语语料库中出现次数大于2次的词语串作为汉语短语,然后用最短路径方法进行短语切分,实验表明,对于长句子,短语切分模型的加入有助于提高翻译质量。

上述文献都是对单语语料的短语或组块进行识别和抽取。对于平行语料,许多研究人员也进行了深入研究。

文献[11]提出了基于N-gram的频率统计 。该方法认为当共现词语的频率达到一定值时,则认为它们构成搭配 ,但也存在很大的缺点,因为同现频率很高的词在很多情况下并不搭配,如英语语料中同现频率最高的往往是一些不具有实际义的语法功能词:of,the,in,a等。文献[12]提出的 Xtract方法,基于方差,通过分析同现词语的分布特征推断其语法结构,从而实现了抽取被其他词语隔开的搭配和含有两个以上词语构成的搭配 。文献[13]提出了基于“有效句型”概念和“翻译中相对不变准则”的短语对齐模型,在翻译异常的情况下,从源语言、目标语言候选句法树集中排除歧义,选出正确的句法树 ,并揭示了其短语层次上的对应关系。文献[14]给出了一种直接计算短语对列表和相应概率值的方法;文献[15]用一个双语框架Bracketing 的方法来抽取短语。这两种方法的计算复杂性太高。文献[16,17]为双语句子对建立一个互信息矩阵 ,矩阵中的每一个单元格是词对的点式互信息,从这个矩阵中抽取互信息相似的矩形区域即得到短语对,此方法并不要求词对齐,而是充分利用词对的互信息。

文献[18]实现了一种针对并行语料库进行双语语块自动识别方法:将统计和规则相结合,同时保证双语语块的语义特性和句法规范。通过在一个6万句的旅馆预定领域口语语料库中的实验,该方法对汉英并行语料的双语语块该方识别正确率可达到80%左右。

本文提出了一种基于互信息的汉维语短语搭配的抽取方法。该方法不需要汉语分词、词性标注等预处理工作,根据语料中汉语字和维语单词的共现信息,同时避免语料中个别词汇数目极少而共现信息值较大出现噪音,采用T检验消除,相对于利用分词和词性标注等技术的抽取方法,该算法简单且时间效率较高。

2无分词模型

互信息(Mutual Information)

Ι(Cword,Uword)=log2prob(Cword,Uword)prob(Cword)prob(Uword)

其中prob(Cword)、prob(Uword)分别表示汉维语词汇在语料中出现的概率,prob(Cword,Uword)表示汉维语词汇在语料中对应出现的概率)表示源文和译文中两个词汇互译的可能性,I(Cword,Uword)值越大,互译的可能性越大。为了避免语料中个别词汇数目极少而I(Cword,Uword)值较大出现噪音,采用t检验消除:

tprob(Cword,Uword)-prob(Cword)prob(Uword)1Μprob(Cword,Uword)

其中,M是语料的总的词汇量。

由于汉语分词存在一定误差,且时间复杂度较高,本文采用了一种基于字扩展算法,识别汉维语搭配词汇:

设一个汉维语句子对齐<C,U> C的汉字数目为lc,维语单词数目lu,构建lc×lu的二维矩阵,矩阵元素的值是对应的汉维语词汇的t检验值。从该矩阵中进行词汇扩展,获得汉维语搭配词汇。具体步骤是:

1) 从矩阵中查找值最大的元素,若该元素的值不小于t检验值,则转步骤2;否则结束。

2) 以该最大值元素为中心向四周扩展。扩展限制条件是:如果扩展的新元素的值与该最大元素值的比值不小于threshhold,则扩展;否则停止扩展。扩展应当保证扩展矩阵区域的所有元素的值均符合限制条件。

3) 输出扩展区域对应的汉维语搭配词汇,将扩展区域所在的行列值均赋值为-999,转步骤1。

4) 将剩余没有扩展的序列直接合并作为汉维语短语搭配输出。

限制条件:当扩展后得到的短语中汉语只有一个字,并且维语的单词只有一个,则在电子词典中验证该搭配的正确性,如正确,则输出;否则,放弃该短语搭配,并将该扩展区域的数值均减去threshhold。

如:一个汉维语对齐,C =“三是保险服务功能不断拓展”,U=则对应矩阵如图1。依据上述步骤,首先找到元素值最大值:7行4列的29.63,然后向四周扩展,周围元素有6行4列符合条件,所以输出汉维语词汇搭配:=服务,然后将第6、7行和第2列的值均改为-1;重新执行上述步骤,输出其它词汇搭配:保险=;不断=。这样汉语C =“三是保险服务功能不断拓展”抽取了“保险、服务、不断”三个短语,相应的维语部分类同;将剩余的部分合并,即得到:三是=;功能=;拓展=。

该无分词模型的最大特点是方法简单,并且由于没有进行汉语的分词,因此效率高;而分词模型事先对语料的汉语部分进行分词,然后计算汉维语互信息时,汉语的互信息单位不是无分词模型的字而是分词后的词语。

3实验和分析

以政府文献政府公文领域内的共6万句平行语料作为实验语料。随机选取语料句子的99%作为训练语料,获得汉维语的字和词汇的共现概率,其余1%分为3组作为测试语料。事先,语言学专家对测试语料进行了人工切分,标记出短语搭配和对齐关系。

从表1中可以看出,无分词模型短语搭配识别在语料较少的情况下,仍能达到较好的识别效果。

分词模型较无分词模型效果提高并不明显,分析原因,由于汉语进行了分词,所以组块的正确率有所提高,而对齐信息的共现T检验值的获取并没有较无分词模型提高,因此对齐正确率并没有改善。相反,由于分词模型使用了分词预处理,因此算法的时间效率要比无分词模型差。如表2所示。

典型错误分析:

• 不完整抽取现象

对一个汉维语对齐抽取短语搭配,汉语句子为:“加快发展各项社会事业。”维语句子为:

利用上述算法计算得到的模型如表3(为了醒目,在矩阵的每个维语单词前增加了汉语翻译)。

从这个汉维语对齐中,抽取的汉维语搭配有:

社会=

发展=

加快=

事业=

其中,前三个短语搭配抽取正确,最后一个短语中维语“”的含义是“事业”但该单词是复数格,而在该短语搭配中的汉语“事业”无复数意义,在汉语句子中和“各项”结合才具有复数意义,在这个抽取中,并没有完整的抽取出来。分析原因,汉语句子“加快发展各项社会事业。”中实际存在一个非连续的修饰短语“各项…事业”,该短语由于中间夹有词汇,而抽取模型只能抽取连续的短语,所以仅能做到部分识别,因此出现了不完整抽取现象。

• 剩余短语合并错误

由于剩余短语是在符合条件的短语搭配抽取后,在搭配矩阵将剩余没有搭配的汉维语字词直接合并而成的,一些t检验值较低的剩余部分自动合并,造成了错误。分析原因,是由于矩阵共现概率的t检验值较小,搭配共现信息不足。

4结语

本文给出了一种简单实用的汉维语短语搭配的抽取方法。该方法不需要汉语分词、词性标注等预处理工作,根据语料中汉语字和维语单词的共现信息,避免语料中个别词汇数目极少而共现信息值较大出现噪音,采用T检验消除,相对于利用分词和词性标注等技术的抽取方法,该算法简单且时间效率较高。实验结果表明,该方法利用较小规模的语料库也能达到较好的短语搭配抽取效果。

未来的工作是继续扩大汉维语平行语料库。根据经验,大规模语料库的统计信息更加充分和精确,能够有效减少本文提及到的典型抽取错误。

away的短语搭配初中 篇2

由动词开头构成的短语、词组很多。复习时应分类处理为:

一、动词+介词

1.look at…看…,look like … 看上去像……,look after …照料… 2.listen to…听…… 3.welcome to…欢迎到…… 4.say hello to …向……问好

5.speak to…对……说话

此类短语相当于及物动词,其后必须带宾语,但宾语无论是名词还是代词,都要放在介词之后。如:

This is my new bike.Please look it after.(×)This is my new bike.Please look after it.(√)

二、动词+副词

“动词+副词”所构成的短语义分为两类:

A.动词(vt.)+副词

1.put on 穿上 2.take off脱下 3.write down记下

此类短语可以带宾语,宾语若是名词,放在副词前后皆可;宾语若是人称代词,只能放在副词的前面。试比较:

First listen to the tape, then write down the answer/write the answer down.(√)First listen to the answer, then write down it.(×)First listen to the answer, then write it down.(√)B.动词(vi)+副词。

1.come on赶快 2.get up起床 3.go home回家 4.come in进来 5.sit down坐下 6.stand up起立

此类短语属于不及物动词,不可以带宾语。

三、其它类动词词组

1.close the door 2.1ook the same 3.go to work/class 4.be ill 5.have a look/seat 6.have supper 7.1ook young 8.go shopping 9.watch TV/games 10.play games.介词短语聚焦

“介词+名词/代词”所构成的短语称为介词短语。现将Unitsl-16常用的介词短语按用法进行归类。

1.in+语言/颜色/衣帽等,表示使用某种语言或穿着……。如:in English,in the hat 2.in + Row/ Team/ Class/ Grade等,表示“在……排/队/班级/年级”等。

3.in the morning/ afternoon/ evening/ 表示“在上午/下午/傍晚”等一段时间。

4.in the desk/ pencil-box/bedroom 等表示“在书桌/铅笔盒/卧室里”。5.in the tree表示“在树上(非树本身所有)”;on the tree表示“在树上(为树本身所有)”。如:There are some in the tree.There are many apples on the trees.6.in the wall表示“在墙上(凹陷进去)”;on the wall表示“在墙上(指墙的表面)”。如:There’re four windows in the wall, and there is a map on the back wall.7.at work(在工作)/at school(上学)/at home(在家)应注意此类短语中无the。

8.at + 时刻表示钟点。如:at six, at half , past ten.9.like this/that表示方式,意为“像……这/那样”。

10.of短语表示所属关系。如:a picture of a classroom, a map of China.11.behind/ beside/ near/ under+ 名词等,表示方位、处所。如:beside/ near the door, under/ behind the tree.12.from与to多表示方向,前者意为“从……”,后者意为“到……”。如:from one to ten,(go)to school/ bed/ work.另外,以下这些短语也必须掌握。如:on duty, after breakfast, at night, at the door, in the middle, in the sky, on one’s bike等。

重点句型大回放

1.I think…意为“我认为……”,是对某人或某事的看法或态度的一种句型。其否定式常用I don’t think…,如:I think he’s Mr Zhinag.(L17)I don’t think you are right.2.give sth.to sb./ give sb.sth.意为“把……给……”,动词give之后可接双宾语,可用这两种句型;若指物的宾语是人称代词时,则只能用give it/ them to sb.如:

His parents give him a nice purse./His parents give a nice purse to him.Give it to Mr Hu.(L57)

3.take sb./ sth.to…意为“把……(送)带到……”,后常接地点,也可接人。如:

Please take the new books to the classroom.4.One…, the other…/One is…and one is…意为“一个是……;另一个是……”,必须是两者中。如:One is red and one is grey.(L50)或 One is red, the other is grey.5.Let sb.do sth.意为“让某人做某事”,人后应用不带to的动词不定式,其否定式为Don’t let sb,do sth.,或Let sb.not do sth.另外,Let’s 与Let us的含义不完全相同,前者包括听者在内,后者不包括听者在内,如:Let’s go for a walk./Let us try once more, please.6.help sb.(to)do sth./help sb.with sth.意为“帮助某人做某事”,前者用不定式作宾补,后者用介词短语作宾补,二者可以互换。如:Let me help you find it.(L42)/Let me help you with it.7.What about…?/How about…?意为“……怎么样?”是用来询问或征求对方的观点、意见、看法等。about为介词,其后须接名词、代词或V-ing等形式。如:What/How playing chess?

8.It’s time to do…/ It’s time for sth.意为“该做……的时间了”,其中to后须接原形动词,for后可接名词或V-ing形式。如:It’s time to have supper.=It’s time for supper.9.like to do sth./like doing sth.意为“喜欢做某事”,如:Li Lei and his friends like to play in the tree house.(L 43)前一种句型侧重具体的一次性的动作;后一种句型侧重习惯性的动作,试比较:

Tom likes swimming, but doesn’t like to swim this afternoon.10.ask sb.(not)to do sth.意为“让某人(不要)做某事”,其中ask sb.后应接动词不定式,如:

Ask your friends to guess what is in it.(L44)

11.show sb.sth./ show sth.to do.意为“把某物给某人看”,该句型的用法同前面第2点。如:

die的短语搭配 篇3

die可以用作动词:

die的基本意思是指动植物因生命终止而“死亡”。引申可表示“消失,停止运行”“枯萎”等。

die主要用作不及物动词,也可用作系动词,接名词或形容词作表语,表示死时的`身份或状态。die有时也可用作及物动词,但必须接同源名词death作宾语, death前常可有形容词修饰。die不用于被动结构。

die和副词小品词连用可组成短语如die away, die down, die out,均表示由大到小,由近到远,由有到无,指灯光、火光、声音等逐渐消失。

die用作动词的用法例句:

Nowadays many people die of cancer.现在有很多人死于癌症。

Many people die from famine in Africa.在非洲许多人死于饥荒。

walk的短语搭配 篇4

你愿意步行还是坐公共汽车?

The school is within easy walking distance of the train station.

学校离火车站不远,不费劲就走到了。

We would often have a walk of an evening.

我们过去常在晚上散步。

It takes me an hour to walk there and back.

我步行往返要花一个小时。

She took the dog for a walk around the block.

cut的短语搭配 篇5

1、cut according to 根据…切;

2、cut across 抄近路穿过,遮断;

3、cut after 追赶;

4、cut against (被…)碰伤;

5、cut at 向…猛bai击,破坏;

6、cut at the rope 割绳子;

7、cut from 从…切下;

8、cut into 切开;

9、cut into a conversation 插嘴;

10、cut into cubes 切成方块;

11、cut into shreds 切成条;

12、cut into slices 切成片;

14、cut off 切断;

15、cut back 削减;

16、cut through 刺穿;

17、cut back on 削减;

18、power cut 供电中断;

19、cut flowern 切花;

20、cut out for 适合于;

【cut的词性释义】

(v.):切;割;割破;划破;(用刀等从某物上)切下,割下;(用刀等将某物)切成,割成;

(n.):伤口;划口;(锋利物留下的`)开口,破口;(数量、尺寸、供应等的)削减,减少,缩减;

例句:I cut a piece of birthday cake for them all.

我给他们每个人都切了一块生日蛋糕。

例句:There have been large cuts in government funding for scientific research.

abroad的短语搭配 篇6

from abroad从国外;

home and abroad国内外,海内外;

at home and abroad国内外;

study abroad出国留学;海外学习;

go abroad去国外,出国;

studying abroad出国留学;出国学习;

went abroad出国;

travel abroad vi. 出国旅行;

spread abroad传播;

market abroad海外市场;

student abroad n. 留学生;

简单up的短语搭配 篇7

把这个包放到架子顶格上去。

I got up early this morning.

今天早晨我起床很早。

The import of cotton goods went up sharply in 1981.

一九八一年棉织品的`进口量急遽上升。

The old man knocked the hoe handle up.

那位老人把锄头柄往上敲。

It is an up elevator.

这是向上运行的电梯。

The up train leaves every hour.

带out的短语搭配 篇8

他们听见了一声狂吠就跑出了屋外。

He stared vacantly out of the window.

他茫然若失地从窗子往外看。

Mr Green is out of town this week.

格林先生本星期不在伦敦。

I was outed by my wife.

我让老婆给赶出来了。

And the fire was outed.

而且火也已经熄灭了。

A crocodile cannot out its tongue.

鳄鱼的舌头伸不出来。

The tabloid article has outed a well-known politician.

与off搭配的英语短语 篇9

我开始对这一想法失去兴趣了。

Four officers were told to go off duty and rest at home

四名官员已经被通知停职在家休整。

You go off round the world, and leave me to hold the baby.

你满世界地跑,把苦差事都扔给我。

He heard the alarm go off.

他听见警报响了。

The alarm did go off but all I did was yawn, turn over and go back to sleep.

上一篇:我喜欢的体育运动的作文下一篇:日记手指破了流血