文本关联

2024-09-23

文本关联(精选3篇)

文本关联 篇1

要想解决题眼与文本线索的关联,我们先要明白什么是题眼。题眼是文章题目中的字眼。元朝杨载有段诗论能说明问题,他说:“诗要炼字,字者,眼也,如老杜诗,‘飞星过白水,落叶动檐虚,’炼中间一字。”(《诗法家数》) 所谓字眼就是句子篇章中的语用价值最大的字词,由此引申,字眼用于文章中就是文眼,用于题目之中就是题眼。

题眼限定文章的内容重点,换言之,题眼就是文章内容的聚集点(或辐射点),行文线索或线索的交叉点,记叙描写的着眼点,议论抒情的触发点。总之,题眼就是题目中语用价值最大的字词。题眼的语用价值在教学中的体现,将通过以下三个方面来说明。

一、由“题眼”入手,梳理文章线索

写作文的时候,我们要求学生紧扣题目,注意点题。同样,教材中选编的课文均出自大家之手,对于题目的点睛作用更是突出。一读到文章,先来观察题目与文章的必然联系,对于整篇课文的解读与教学的实施都有建设性意义。

以人教版三年级下册第五单元的第一篇课文《可贵的沉默》来说,课文以课堂教学进程为线索,以师生对话交流为主要形式,以孩子们的情绪变化为描写的主要内容:由兴奋、快乐到沉默,又从沉默渐渐回到热闹。文题中“沉默”是全文中的一个转折点也是一个思考点,处理好沉默二字,就可以处理好整篇文章的教学。

教师在教学中,可以请学生找一找题目中的关键词,学生很容易就能找到“沉默”这个题眼。教师通过对教材的研读,还能找出一些和“沉默”二字意思相呼应的词语,这样一来,文章的线索就会自然而然地被梳理出来。此时,请学生在预习的基础上再读课文,找到与“沉默”意思相反、描写教室里热闹情形的两个词语“异口同声”和“七嘴八舌”,再稍加分析,故事的线索即浮于纸上。至此,由题眼梳理出文章的叙事线索,为后面的学习打下基础。

二、由“题眼”着眼,突显人物感情

《她是我的朋友》是这一单元的第二篇课文,战争中孤儿院里的小女孩受伤了,“如果不马上输血她可能死去。”小男孩冒着“生命危险”为小女孩———他的朋友输血,尽管害怕,尽管矛盾,他依然故我,因为“他是我的朋友”。这是一篇很感人的文章,通过朴实无华的叙事方法,通过对小男孩动作、神态的刻画,让读者看到了闪光的友谊。题目“他是我的朋友”中的“朋友”一词的分量一下子变得重了起来。

题眼确定为“朋友”,那么什么样才能称之为朋友?朋友之间如何相处?如何对待自己的朋友?联系这些问题,引导学生读课文,找关键语句“一阵沉默之后,一只小手颤抖地举起来。忽然又放下去,然后又举起来。”文章通过动作描写表达了阮恒对死亡的惧怕,但无论多么惧怕,多么犹豫,他依然做出了决定———用自己的生命换取“朋友”的生命。我们且不去探讨文本所传递的价值观,就朋友之间的情谊已经通过这一系列的描写具体化了。由“朋友”回到题眼,学生的理解会深刻起来。因为是朋友,所以阮恒愿意用自己的生命来换取朋友的生命,那种朋友之间深深的关爱,那种无私奉献的精神跃然于学生的脑海中。

三、由“题眼”深入,升华情感内涵

三年级上册第八组编排了四篇关于“献爱心”的课文,让学生在学习课文的过程中,从别人的故事片里体会这种感情。本单元内容有所拓展,也更为深入。教师可以将课文的学习与综合性学习活动相结合,使学生在学习课文、感受“爱与真情”的同时行动起来,在生活中深入体验这种感情,学会表达和回报父母对自己的爱,懂得关心别人。这个单元的最后一篇略读课文《妈妈的账单》正是建立在这样的教学基础之上的。题目中最让人关注的是“账单”二字。这是怎样的账单?为什么做账单?学习者的视线很容易集中到此,于是在读通课文的基础上,直奔账单而去,找到小彼得的账单和妈妈的账单进行对比。通过账单间的对比,学习者很容易发现妈妈付出的比小彼得的多得多,但是妈妈却并没有索要报酬,这是多么深沉的母爱。从“题眼”深入文章内涵,挖掘出妈妈的辛苦和伟大,母爱的无私与宽广,学生对小彼得后来的羞愧万分随即找到理由,同时在他们心里升腾起对母亲的尊敬。

综上所述,抓住题眼就相当于找到行文的线索,找到文章的感情基调,升华课文的现实意义,对我们的语文课堂教学有很大的帮助。

时态文本挖掘的关联规则研究 篇2

现代化的企业搜集了大量时态文本数据, 但信息超载和无结构化, 使得企业决策部门无法有效利用现存的信息, 时态数据挖掘技术便应运而生。目前有关时态关联规则算法已较多, 但是如果运用到时态文本关联规则的挖掘中则时间复杂度都太高。所以本文将对时态文本关联规则挖掘进行研究。

1. 时态文本预处理

1.1 时态文本处理

在挖掘时态文本关联规则之前, 需要先对文本进行预处理, 对英文而言需进行Stemming处理[5], 中文的情况则不同, 因为中文词和词之间没有固定的间隔, 需进行分词处理。

对于本文研究的是医学病毒论文数据库, 是一个英文数据库, 文本预处理的具体内容如下:

(1) 英文大写换小写 (都以小写字母表示, 方便文本识别) ; (2) 删除空白记录; (3) 将论文信息中的标题和摘要进行 (可以提高关键词的比重, 增加提取文本向量的精度) ; (4) 处理论文发表时间DP列, 只保留年份数字, 方便提取有效时间; (5) 对于记录太多的库, 适当拆分表格 (否则在程序处理时会内存溢出) ; (6) 根据文本内容提取合适的停用词表, 对文本内容进行去停用词处理。

1.2 时态文本表示

在对时态文本进行清理后, 需将其进行表示。在文本处理时我们已提取论文的发表时间, 所以将时间和文本分列处理, 然后将文本单独表示。本文采用向量空间模型 (VSM, Vector Space Model) 进行表示[6]。

2. 时态关联规则算法概述

以前的算法不能有效应用到时态文本数据库中, 主要原因有:1) 这些算法计算时时间复杂度仍太高。2) 没有考虑每个独立文本项各自存在的有效时间;3) 每个项目缺少一个合理的可以浮动的支持度数。所以本文根据时态事件模型及Apriori原则, 本文在快速更新算法思想上产生新的算法:SP-FM (Segment-Progressive-Filter-Miner)

该算法主要包括三步:1.数据库不断更新;2.对数据库按不同时间段进行划分;3.对每个时间段的事务集挖掘频繁项集。拆分后的数据库, 每个阶段部分有不同的支持度阈值, 我们按不同的支持度阈值进行计算来产生候选项集。

SPFM算法主要有三个特点:1) 算法预处理时将文本数据转换成垂直数据格式, 可大大提高程序效率;2) 在挖掘时态数据库的频繁项集时, 通过更新不同时间粒度的支持度数来确定频繁项集, 并判断频繁项集在时间粒度上的连续性;3) 如2) 所述, 时态数据库是和时间粒度有关的, 那么从时态数据库挖掘出的关联规则也应该是和时间粒度有关的, 即存在“有效时间”, 本算法引入一种判断机制, 使得发现的有效时间是由频繁项集本身决定的, 最终我们获得的是一组浮动的“有效时间”。

3. 实验测试

为了测试SPFM的算法性能, 用Visual C++进行编程。对象为医学病毒论文数据库中1970~2010年间约50万条的记录, 每条记录的属性包括fileno (论文标号) 、TI (标题) 、AB (摘要) 、DP (发表时间) 等。以“年”作为时间粒度, 将数据库划分为40个阶段部分。minsup为0.5‰, minconf为35%, 然后进行频繁项集的挖掘, 并确定每个频繁项集的有效时间, 依次循环直至2010年为止。

比如rous (含铁血黄素) 和sarcoma (1979年、1981年、1983年) , 都是强关联规则, 且COS判断值为0.8165>0.5, 说明该规则有意义, 这两者在1979~1983年是一个共同研究热点, 它们之间有可能存在一些密切的联系, 在医学上也可以深入研究。

通过对医学文本数据库的挖掘, 我们挖掘出上百条时态文本关联规则, 从这些规则当中我们能得到近40年学者们对病毒研究的规律以及病毒的发展规律, 这些规律会是对以往病毒研究的较好总结, 也会有助于更有效地治疗已产生的病毒。

在文本数据挖掘技术已经日渐成熟的背景下, 把时态数据与文本挖掘联合起来, 可将时态文本数据挖掘应用于医学、经营、管理等各个方面, 通过对海量的时态文本数据进行关联分析, 为管理者做决策提供参考数据;还能为新的经营模式提供目标和思路, 减少盲目性, 以获得更大利益。

4. 结束语

本文提出了对医学病毒论文数据库中的时态文本如何进行预处理, 需先将时间和文本分为不同的列, 将文本表示为向量空间模型。然后确实频繁项集的有效时间, 将文本数据转换成垂直数据格式, 再通过新的算法挖掘频繁项集, 最后对时态文进行强关联规则的挖掘。该实验是对时态文本进行预处理后再进行关联规则挖掘的, 最后验证了该算法的有效性。

摘要:由于现代企业的数据库频繁更新, 且大部分数据库为文本数据库, 所以需要挖掘时态文本的关联规则。本文以时态文本为对象进行了时态关联规则的研究, 最后通过实验进行了有效性验证, 结果表明该研究方法是正确可行的。

关键词:文本,时态,关联规则,垂直数据,有效时间

参考文献

文本关联 篇3

作为一种日常现象, 幽默日益成为人们生活中不可或缺的一部分。学会幽默将对人的一生有重大意义。对英语学习者来说, 学习英语的言语幽默有助于提高他们的英语学习兴趣, 促进他们的英语学习。

(1) 什么是言语幽默?

幽默, 作为一门学科已被研究了数千年, 但如何确切地定义“幽默”却是仁者见仁, 智者见智。17世纪末, 《牛津英汉词典》将幽默概括为:

a.行为、谈吐或文章的品质, 他们逗人快乐;怪诞、诙谐、滑稽、可笑、有趣。

b.察觉什么是荒谬的或逗人发笑的能力, 在谈吐上、写作上或其他构成中表达, 或作为主题的表述及滑稽的想象力。 (李军华, 1996:5)

刘乃实博士在其《言语幽默的图论模型》一书中将幽默定义为:

a.that quality which appeals to a sense of the ludicrous or absurdly incongruous;

b.the mental faculty of discovering, expressing, or appreciating the ludicrous or absurdly incongruous;

c.something that is or is designed to be comical or amusing. (刘乃实, 2008:4)

本文旨在通过几个语言实例分析《阿甘正传》中交际的幽默言语。众所周知, 任何语言都离不开语境。语言本身并无幽默。只有把语言放到相应的语境中, 与具体的语境结合起来, 与它想要表达的思想结合起来, 与幽默所传达的不和谐中的和谐结合起来, 幽默言语才能被幽默接收者所理解, 从而更好地享受幽默效果。

所谓的幽默, 是能产生幽默的言语。只有当某种言语能带来幽默效果时, 它才能称之为幽默单位。否则, 是不能算一个言语幽默单位。也就是说, 只有当两个或两个以上的说话者的话语被包含在一个幽默话语中时, 幽默效果才能产生。因此, 下面这个摘自《阿甘正传》中的对话可以称作一个幽默言语单位。

1) Bubba:My given name is Benjamin Beau Ford Blue.People call me Bubba.

Forrest:My name’s Forrest Gump.People call me Forrest Gump.

任何所谓的幽默言语, 只要其脱离了语境, 脱离了背景, 都不能产生幽默。只有将他们视作一个整体单位时, 才能产生幽默。比如上面的这个例子, 这是Bubba和Forrest第一次见面时的对话。分别单独看Burra和Forrest这两个人的话, 是没有任何幽默而言的, 因为纯粹就是两个陌生人的自我介绍。而一旦放入了这个特定的语境和背景中, 观众才会接收到其幽默之处。对于Bubba来说, 他的全名太长了, 通常缩略成人们易称呼的Bubba。

听了Bubba的自我介绍后, 我们会很自然地认为Forrest会很精彩地介绍自己“My name’s Forrest.Forrest Gump.”但是剧作者并没有落入俗套。他认为, 作为一个智商仅为74的低能儿, Forrest也许会琢磨“Bubba said his complete name firstly and then told me the shorten name.I shall answer it in the sameway, which will be polite.”因此, 影片中, Forrest先介绍了自己的全名Forrest Gump, 然后, 他本来应该告诉我们一般人直接称呼他的名字。同时, 我们还非常想搞清楚, “人们通常是怎么称呼他的啊?是叫‘Forrest’还是别的什么呢?”。然而, 即使是Forrest他自己都不清楚!冥思苦想之后, 他告诉了Bubba的还是Forrest Gump, 幽默也就由此产生了。

2 幽默言语和关联性

(1) 幽默与语用

表面上看, 幽默可以自发产生, 即听众或幽默接收者不需要做任何努力就可以感知幽默。这样分析就太片面了, 只是对幽默的一种静态分析。而实际上, 我们不仅要对幽默进行静态分析, 还要分析幽默的获得过程。因为幽默是不和谐因素的产物。根据Palmer的理论, 我们可以得知一个事实是:在产生幽默的过程中, 幽默接收者在整个交际过程中起着与幽默发出者、信息、信息渠道以及上下文同等重要的作用 (Palmer, 1994:163) 。也就是说, 为了将实现幽默的这种可能性变成现实, 幽默接收者要能够发现幽默发出者的意图, 去发现言语中的不和谐因素, 根据语境及背景信息, 找出其中的和谐, 从而实现幽默效果, 愉悦身心。

因此, 从本质上说, 上面的理解其实可以说是语用层面的问题, 因为, 幽默不是孤零零地, 而是存在于言语的意义之中。正如Blackmore所说, 幽默的接收者很多时候注意的是话语意义而不是字面意义。

2) Forrest:I only caught five.

Boat Salesman:A couple more and you can have yourself a cocktail.

要看懂这个对话, 必须先了解shrimp cocktail (鸡尾虾) 。鸡尾虾是经久不衰和极受欢迎的餐前小吃, 也是鸡尾酒会上的常见食品, 因此鸡尾虾的用量并不是那么大。此处那个船员只是用Forrest钓到鸡尾虾的数量之小来取乐。从字面上看, Boat Salesman的话是相关的, 但对Forrest来说, 对方的回答是出乎意料的。因为与Forrest的问话相应的答话应该是说他钓的鱼多少的问题, 而上面的这个对话中, 言语之间产生了不和谐。首先, 接收者所获得的幽默是来自于接收者结合语境对幽默发出者意图的认识, 而不是来自其字面意义。其次, 正如上面所提到的, 语境在幽默理解过程中的作用也是相当重要的。在幽默言语中, 如何识破幽默发出者的意图, 发现不和谐因素, 幽默效果的获得, 都离不开语境。

(2) 幽默与关联

在Grice的合作原则基础上, D.Sperber和D.Wilson于1986年提出了关联理论:每一个明示的交际行为都应设想为这个交际行为本身具备最佳的关联性。 (D.Sperber&D.Wilson, 1986:158) 。最佳的关联性来自最好的语境效果。该理论认为, 人们在理解言语时, 总是希望被理解的言语与其对之所做的假设相互作用, 语境效果便是由这种相互作用所产生的。但在说话和理解幽默话言语时, 人们不但想要获得关联信息, 还想获得最佳关联的信息。而要取得语境效果, 则必须要以付出时间和努力为代价, 而且代价和关联性成反比, 即付出的代价越大, 该信息的相关性就越小;反之, 则越大。言语之间的关联性还和语境的假设、设想、思辨、推理相关。而且, 这些假设、设想、思辨、推理越相关, 其言语之间的内关联就越大。此时, 即使不付出太多的努力, 也能收获较好的语境效果, 从而更好地理解话语, 获得相应的幽默效果。

3) Officer:Private Gump.

Forrest:Yes, sir.

Officer:As you were.I have your discharge papers.Your service is up, son.

Forrest:Does this mean, I can’t play ping pong no more?

Officer:For the army it does.

对长官来说, 他知道Forrest智商不高, 所以他没有直接回答Forrest的愚蠢问题, 而是换了个角度, 但是还是把这件事解释清楚了, 甚至也给Forrest解释清楚了。

3 结论

本文在关联理论的框架下, 结合奥斯卡电影Forrest Gump中的几个实例, 浅析了幽默言语是如何在具体的语境中表达幽默发出者的交际意图, 从而得出为什么关联理论可以更好地解释幽默发出者总是间接地表达意图——这是因为付出的努力越多, 获得的语境效果就更好, 最终让读者更好地欣赏幽默, 尤其是电影中的幽默。

摘要:本文以D.Sperber和D.Wilson的关联理论为理论框架, 对奥斯卡电影中的幽默进行了尝试性研究。集中精力分析了奥斯卡最有名的电影之一《阿甘正传》中的关联幽默。《阿甘正传》中各种幽默的具体分析既为关联理论的应用树立了很好的榜样, 也为其在电影中分析幽默提供了一个新的视角。与此同时, 它也让那些奥斯卡电影迷们能够更好地欣赏电影。

关键词:关联理论,幽默,《阿甘正传》

参考文献

[1]Blackmore, Diane.Understanding Utterances[M].Blackwell publisher, 1992.

[2]Forrest, Gump.疯狂英语[M].江西文化音像出版社, 1998.

[3]Palmer, Herry.Taking Humor Seriously[M].Routledge, 1994.

[4]Sperber, D and Wilson, D.Relevance:Communication and Cognition[M].Oxford:Blackwell, 1986.

[5]何自然.推理和关联[J].外语教学, 1997 (4) :1-10.

[6]李军华.幽默语言[M].北京:社会科学文献出版社, 1996.

[7]刘乃实.言语幽默的图论模型[M].上海:上海交通大学出版社, 2008.

【文本关联】推荐阅读:

关联波动07-16

关联效应07-17

关联计算05-10

意义关联05-14

关联关系05-15

智能关联05-17

政府关联05-22

关联准则05-22

关联加权05-28

空间关联05-29

上一篇:能力发散下一篇:访谈研究