文本话题(共3篇)
文本话题 篇1
0 引言
随着互联网行业的飞速发展,微博的注册用户数量持续升高,微博变得越来越深入大家的日常生活,成为了互联网用户分享生活、联络关系的一个重要平台。最早的微博应用模式来源于2006 年诞生于美国的twitter,随后中国新浪公司在2009 年推出了新浪微博,自此微博正式进入了中文上网人群的视野。随着微博的出现以及爆炸性发展,刷微博逐渐成为了人们获取信息和发表意见的重要方式,从微博中监控舆论也因此成为一种重要的舆论监控方式。
与传统的新闻文本不同,微博的内容简短,长度一般不超过140 字,因此包含的词语数量较少[1]。微博的文风也不像长篇新闻报道那样正式,它的写法随意,语言丰富多彩,行文措辞不规范。微博具有很强的实时性,针对这种特征对微博内容进行处理分析,可以及时检测事件的发生,发现大众观点,从而进行舆论的监控。传统的新闻话题识别[2,3]一般将长文本中的词语视为特征,先利用特征向量来表示文本,再采用一定的聚类算法根据文本向量间的距离对文本进行聚类,然而由于微博的文本简短、词语稀疏、写法随意、发布实时等特点使得传统的聚类或分类方法在微博话题检测方面变得不再适用。
本文仔细分析了微博的特点,提出一种基于微博文本和元数据的话题发现方法,先进行主题词聚类再对微博文本进行二次聚类。首先从词语的角度出发,而不是从整个微博文本比对的角度,使得单条微博中词语稀疏的问题得以解决,同时也使得热点词语的检测变得更加重要。本文在获取微博数据后,采用中科院的ICTCLAS分词库对微博文本进行分词与词性标注,把一个时间段内所有微博包含的词语集合看成一个整体单元,充分结合微博元数据找到该时间段内的TOP-N个热点词语; 然后计算热点词语在微博文本里共同出现的概率,如果两个词语共同出现概率超过一个阈值则可以确定它们之间的语义关系,根据这些关系可以构造出一个N顶点图,由图得到主题词汇簇;最后基于主题词汇簇对微博文本进行二次聚类,从而得到微博中的隐含话题以及相关的微博文本。
1 相关研究
话题检测旨在将输入的报道归入不同的话题簇,本质上等同于无指导的聚类。常用的聚类方法有单通道聚类、凝聚式聚类、层次聚类、增量聚类和K-Means聚类等。CMU的Y. Yang和UMASS的J. Allan等人运用单路径聚类方式实现了话题检测[4; 5]。而CMU的Yiming Yang结合了凝聚式聚类算法与平均聚类算法,使TD系统同时可以用于回顾相关事件[6]。虽然以上算法在特征丰富的传统长文本中取得了不错的效果,但并不适合特征稀疏的短文本类型。随着微博的兴起,针对微博话题检测的研究也越来越多。Changchun Yang等人针对微博的特性使用LSI模型达到降维和去噪的目的[7]。Silong Zhang等人利用LDA来拓展文本特征空间,基于上下文相似度和语义相似度在微博话题检测中取得了不错的效果[8]。上述两种方法都起到了数据降维的作用,并在一定程度上解决了微博特征稀疏的问题,但效果并不明显。之后赖锦辉等人提出了一种消除孤立点的微博热点话题发现方法[9],该方法可以较大程度上提高话题检测的准确性,但文本特征稀疏的问题仍未得到很好的解决。Wenqing Zhao等人不再从微博文本相似度比对的角度出发,而是根据一段时间内词语的变化检测话题,提出了一种基于词共现图的中文微博话题识别方法,从而较好地解决了短文本特征稀疏的问题,更适用于微博的话题检测[10]。之后Suzhi Xue等人对微博话题发现问题引入了二元组的时间序列,提出了基于速度增长的微博热点话题发现方法[11]。微博时间的引入提高了热点话题发现的准确度。Feifei Peng等人则在研究中引入了微博的转发评论量作为热点词语的修正权值,但是他们对微博元数据的考虑还不够充分[12],比如对发布微博者的用户信息的考量。具有不同影响力的用户发布的微博应拥有不同的权值,用户信息的引入将更为有效的提高微博话题检测的准确率。
本文首先从词语的角度出发,与从整个微博文本比对的角度不同,充分利用微博发布时间、用户信息、微博转发评论等元数据来构造描述微博词汇能量的复合权值,找到TOP-N个能量最高的热点词语; 然后基于上下文关系对热点词语构造主题词汇簇; 最后基于主题词汇簇对微博文本进行二次聚类,从而得到微博中的隐含话题以及相关的微博文本。
2 微博话题检测算法
本文采取的基于微博文本和元数据的话题检测算法主要包括以下步骤: 收集数据和数据预处理,结合微博元数据发现热点词语,聚类出主题词汇簇,微博文本二次聚类,聚类效果分析。微博话题检测算法流程图如图1 所示。
2. 1 数据预处理和分词
数据预处理和分词作为微博话题检测的准备工作,有着不可忽视的作用。数据预处理能在一定程度上达到去噪、降维的目的,同时在一定程度上解决了特征稀疏的问题。文本分词效果的好坏则在很大程度上决定着后期的聚类效果。该过程的具体步骤如下:
( 1) 过滤掉互粉人数低于阈值F的用户的微博文本。如果互粉人数过低的一般可以认为是广告账号或者僵尸账号,这些账号所发的微博噪音过大,会对后面的聚类产生干扰,因此提前过滤掉。
( 2) 因为微博文本中常常包含@ 符号,它表示该条微博想让@ 的用户看到。这些用户名可能会对我们后面的分词产生影响,而且用户名并不能表征出微博中所说的话题,因此过滤掉文本中的“@ 用户”。
( 3) 将微博的评论信息和原始微博文本信息进行合并。对一条微博的评论可以看成是对该微博的补充,它们叙说的一般是同一话题。微博与其评论的合并使得文本长度增加,文本包含词语数增多,一定程度上解决了短文本特征稀疏的问题。
( 4) 有不少较为成熟的中文分词算法和工具,本文采用的是中科院的ICTCLAS分词系统的JAVA版本。该工具因分词效果好、使用简单、带有详细词性标注等特点而被广泛应用于科研工作中。通过该分词系统分词后,微博文本转化为一系列的词语,每个词语都带有词性标注,如动词、名词、形容词、副词等等。不同词性的词语对主题表达的贡献程度不同,其中动词和名词具有最高的主题辨识度,因此本文中将主要考虑这两种词性的词语,过滤掉其他词性的词语。
2. 2 热点词检测
我们发现在之前的研究中多采用单纯的词频方式,而忽略了微博所特有的一些元数据,这些元数据包括该条微博的转发量、评论量和微博的用户属性等。一个拥有大量粉丝、经常发布微博的加V用户的微博影响力应比只有少量粉丝、不经常使用用户的微博影响力大。因此在计算微博能量的时候不仅要考虑微博的转发量和评论量,而且要考虑微博发布者的用户属性。微博的能量公式如下:
其中numreplies表示微博的评论数量,numretransmits表示微博的转发数量,u( U) 表示用户信息的影响权值,k表示微博能量。其中u( U) 的计算方式如下:
根据U值的范围决定u( U) 的最终取值。其中U的计算方式如下:
其中numfollowers表示微博用户的粉丝量,numstatuses表示微博用户发布的微博数量,numbi_followers表示微博用户的互粉好友的数量,v用于表示用户是否为认证用户,如果是认证用户则v为100,否则为0。
每条微博文本分词后,词语的出现量将乘以参数k。例如一条关于“中国好声音”的微博文本中“歌曲”这个词语出现了2 次,则这条微博中“歌曲”这个词语的加权出现量将为2k个。
实时性是微博的一个重要特征,微博中热门话题会随着时间的变化而改变。比如关于“李天一案件”的微博文本数量随着时间的变化先增后减,在案件开庭前后的相关微博文本数量最多,这说明了微博是有历史属性的。因此我们不仅要考虑一个时间段内微博词语的出现量,而且要考虑两个连续时间段相同词语出现量的变化。把词语的增长或者减少趋势考虑进来,从而得到关于词语出现量的时间权值t,计算方式如下:
其中numword_now表示当前时间段内词语word的出现量,numword_past表示过去一个时间段内词语word的出现量。如果当前时间段比过去时间段的相应词语多,则t的值大于1,否则小于1。词语最终得分公式如下:
其中t为时间权值,ki为第i条微博的能量,numword_i为第i条微博词语word的出现量,M为微博的总条数。之后根据词语得分进行降序排列得到一个序列,该序列具有明显的长尾现象,得分较低的词语占据了序列的绝大部分,因此只需取top-N个词语作为当前的热点词语。这些热点词语很有可能决定了当前微博的隐含话题,称其为主题词。
2. 3 主题词聚类
如果在一个大规模的语料库中,2 个词语经常出现在同一个单元中( 例如一句话、一段文字、一篇文章等) ,则可以认为这两个词语的组合比较稳定,在语义上存在关联。词语的共现率越高,代表它们之间的关联性越强。每个微博文本可以理解为一个简短的自然段或者文章,当两个词语经常出现在一个微博中时,则可以认为这两个词语存在语义上的关联。
不同主题词在文本中共同出现的现象称为主题词的共现,而存在主题词共现现象的微博文本在总文本中的比率称为主题词的共现率。比如,一共有1000 个微博文本,主题词A和主题词B在其中的100 个微博中同时出现,则主题词A和主题词B的共现率为0. 1。把所有主题词当作点,当两个主题词的共现率超过阈值F时,就连接两点建立边,最终得到一个非连通图。该图中的每个连通子图构成了一个主题词汇簇,由此得到所有的主题词汇簇。
如图2 所示,每一个黑色的圆点代表一个主题词,圆点之间连接的边代表两个主题词共现率超过了阈值F。每一个连通的图构成了一个主题词汇簇,例如图中word 1 - word 4 为一个主题词汇簇,word 5 - word 8 为另一个主题词汇簇,二者分别用于确定一个话题。主题词聚类算法流程图如图3 所示,具体描述如下:
输入:top-N个主题词和主题词之间的共现率
输出:多个主题词汇簇
步骤1 以第一个主题词作为初始簇的第一个词语;
步骤2 输入下一个主题词,分别计算该主题词与每个词汇簇中所有词语的共现率的平均值,并找到最大的平均共现率K,以及对应的词汇簇X;
步骤3 判断最大平均共现率K是否超过阈值F,如果超过则主题词归入词汇簇X; 否则生成一个包含该主题词的新词汇簇;
步骤4 读取top-N列表里的下一个主题词。重复步骤2、步骤3 直到列表里的每个主题词都划入相应的簇中;
步骤5 输出结果。
2. 4 微博文本二次聚类
前面得到的主题词汇簇即可用来确定一个话题原型,词汇簇中包含的主题词具有较好的话题区分度。把微博文本中的每个词语当成一个元素,微博文本可以转化成一个包含n个元素的微博向量t( a1,a2,…,ak,…,an) ,其中下标1 ~ n对应top-N个主题词,ak( 1≤k≤n) 为对应主题词是否存在的逻辑值,如果存在则为1,否则为0。同理,由多个主题词构成的主题词汇簇也可以转换为包含n个元素的主题词汇簇向量w( b1,b2,…,bk,…,bn) 。由向量t和向量w可以求出它们之间的夹角余弦值,夹角余弦值越大代表向量间的相似度越高,而微博向量与主题词汇簇向量的相似度越高,代表微博文本离主题词汇簇越近。根据微博向量和主题词汇簇向量相似度的大小来确定微博文本应该划入哪个主题词汇簇中。微博文本二次聚类算法流程如图4 所示,具体描述如下:
输入: 主题词汇簇和微博文本
输出: 每条微博文本所属的主题词汇簇
步骤1 所有的主题词汇簇转换为主题词汇簇向量;
步骤2 输入一条微博文本,转换为微博向量。计算微博向量与各个主题词汇簇向量的相似度,找到最大相似度simmax和对应的主题词汇簇向量W;
步骤3 判断最大相似度simmax是否超过阈值G,如果超过则将微博向量对应的微博文本划入主题词汇簇向量W对应的主题词汇簇中; 否则该微博不属于任何一个热门话题;
步骤4 重复执行步骤2、步骤3 直到所有微博文本都判断完成;
步骤5 输出结果。
3 实验
本文实验环境为Intel Core i5 - 2400 3. 10 GHz CPU、4 GB内存、500 GB硬盘的PC机。操作系统为Win7,实验工具为eclipse3. 7. 2,JDK版本为1. 7. 0。实验所采用的原始数据集来自于数据堂,内容包括新浪微博几天内与15 个话题相关的4 千多条微博。每条微博都已标注了所属的话题,话题包括“斯诺登棱镜事件”、“李天一案件”等。然后使用新浪微博官方API提取与这些微博相关的元数据,例如微博发布者的用户信息,微博的转发评论数量等。
3. 1 主题词聚类结果分析
主题词聚类为本文话题检测方法的一个重要部分。对实验数据集进行数据预处理、分词和热点词检测,得到top-N个主题词以及这些主题词之间的共现率。把这些主题词以及它们之间的共现率作为微博主题词聚类算法的输入,得到多个主题词汇簇。每个主题词汇簇有着不同的能量值,首先对每个主题词汇簇中包含的主题词的能量进行加和运算以得到该主题词汇簇的能量值,然后将其排序,最后选取数值超过阈值J的主题词汇簇,结果如表1 所示。
从表1 可以看出通过主题词聚类得到的主题词汇簇和对应的话题高度吻合,例如话题“李天一案件”对应的主题词汇簇里的“律师”、“轮奸”、“受害人”等主题词都明显与该话题高度相关。而且主题词汇簇的数量刚好为15 个,与所选的实验数据集中话题的数量一致并且逐一对应,因此可以看出本文采用的主题词聚类算法取得了较好的效果。
3. 2 微博文本二次聚类结果分析
传统的话题检测多采用聚类算法,结合文本间相似度进行聚类。经典聚类算法包括single Pass、kmeans等,它们虽然在传统长文本上取得了不错效果,但是在微博这种短文本上效果却不佳。而单纯基于词频的话题检测虽然适合特征稀疏的短文本,但未考虑微博特有元数据对微博能量的影响。本文提出的方法将微博文本和主题词汇簇作为输入,经过微博文本二次聚类算法得到最终的话题检测结果。为了验证本文所述方法更适合微博的话题检测,将本文方法与single Pass聚类方法、kmeans聚类方法和单纯基于词频方法进行效果评价,结果如图5、图6所示。评价指标为查全率、准确率、漏检率和错检率,各个参数的计算方法如下:
其中a为检测到的话题相关微博文本数; b为检测到的话题不相关微博文本数; c为未检测到的话题相关微博文本数。
由图5 所示: single Pass聚类的准确率和查全率都明显不如本文方法; kmeans聚类虽然由于本身算法特点使得查全率为百分百,但准确率却比本文方法低了很多; 单纯基于词频的话题检测方法由于未考虑微博元数据对微博能量的影响,准确率和查全率不如本文方法。
由图6 所示: 本文方法的错检率相比较其他方法有所下降,特别是对比传统的single Pass聚类和kmeans聚类方式; 本文方法的漏检率相比较single Pass聚类和词频方法也有所降低。
综上所述,本文采用的话题检测方法在实验数据集上取得了较好的效果。
4 结语
微博热点话题的识别有着重要的应用价值,本文在仔细分析微博的特有属性后,提出了一种基于微博文本和元数据的话题发现方法,先进行主题词聚类再对微博文本进行二次聚类。通过数据预处理、分词、发现热点词语、基于上下文关系聚类出主题词汇簇、微博文本二次聚类等步骤最终得到微博中的隐含话题以及相关的微博文本。基于真实数据的实验结果证明了该方法的有效性,但是该方法受限于文本的数量,在大数据时代,实际的数据量往往是TB级,甚至PB级。为了保证算法的效率,有必要将算法移植到分布式平台下并行处理。在保证效率的同时,准确率和查全率的提升也是本文后续研究的重点。
摘要:在微博热点话题发现中,微博文本短、词量少、时效性高,传统的话题检测方法不再适用。针对这些新的特点,提出一种基于微博文本和元数据的话题发现方法。首先利用微博发布时间、用户信息、微博转发评论等元数据构造描述微博词汇能量的复合权值,进而提取出话题的主题词汇,然后基于上下文关系构造主题词汇簇,最后对微博文本进行二次聚类,从而得到微博中的隐含话题以及相关微博文本。在真实微博数据上的实验表明,该方法能有效发现热门话题,提高话题检测的准确率和查全率。
关键词:微博,元数据,聚类,话题检测
参考文献
[1]Kwak H,Lee C,Park H,et al.What is Twitter,a social network or a news media?[C]//Proceedings of the 19th international conference on World wide web,2010:591-600.
[2]Mori M,Miura T,Shioya I.Topic detection and tracking for news web pages[C]//Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence,2006:338-342.
[3]Allan J,Carbonell J G,Doddington G,et al.Topic detection and tracking pilot study final report[R].UMass Amherst,1998.
[4]Yang Y,Carbonell J,Brown R,et al.Multi-strategy learning for topic detection and tracking[M].Topic detection and tracking.Springer US,2002:85-114.
[5]Allan J,Lavrenko V,Swan R.Explorations within topic tracking and detection[M].Topic detection and tracking.Springer US,2002:197-224.
[6]Yang Y,Pierce T,Carbonell J.A study of retrospective and on-line event detection[C]//Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval,1998:28-36.
[7]Yang C,Yang J,Ding H,et al.A Hot Topic Detection Approach on Chinese Microblogging[C]//Proceedings of the International Conference on Information Engineering and Applications(IEA)2012,2013:411-420.
[8]Zhang S,Luo J,Liu Y,et al.Hotspots detection on microblog[C]//Multimedia Information Networking and Security(MINES),2012Fourth International Conference on,2012:922-925.
[9]赖锦辉,梁松.一种消除孤立点的微博热点话题发现方法[J].计算机应用与软件,2014,31(1):105-107,139.
[10]赵文清,侯小可.基于词共现图的中文微博新闻话题识别[J].智能系统学报,2012,7(5):444-449.
[11]薛素芝,鲁燃,任圆圆.基于速度增长的微博热点话题发现[J].计算机应用研究,2013,30(9):2598-2601.
[12]Peng F,Qian X,Li G.A Research of Hot Topic Detection through Microblogging[C]//Intelligent Human-Machine Systems and Cybernetics(IHMSC),2012 4th International Conference on,2012:185-188.
文本话题 篇2
文体常识
(一)、说明文概念:指以说明为主要表达方式,介绍事物或说明事理的文章。
(二)、说明对象:指说明文中被介绍、说明的事物或事理。
(三)、说明对象的特征:说明对象区别于其他事物或事理的独特之处。具体事物,包括事物的状态、性质、功能和特征等;抽象事理,包括事理的本质、性质、规律、内在联系等。
(四)、说明文的分类:
1、根据说明对象的性质:分事物说明文和事理说明文。
2、根据语言风格:分平实型说明文和生动型说明文。
3、根据写作目的:分实用性说明文和科学小品文。
(五)、说明顺序:
(六)、说明方法
(七)、说明文的结构:
1、时间结构:依照时间先后为顺序安排。
2、空间结构:依地点(空间方位)转换安排。
3、逻辑结构:总分式(总分总、分总、总分)和递进式。
(八)、说明文的语言:
准确,是说明文语言的最重要的特点。说明时间、空间、数量、范围、程度、特征、性质、程序等,都要求准确无误。特别要注意说明文中的术语和修饰限制性的词语,它们往往体现出说明语言的准确性。
在准确的前提下,说明的语言有的以平实见长,有的以生动活泼见长。由于说明的对象和作者语言风格的不同,说明的语言的特点也是多种多样的:或概括,或简洁,或丰腴;或精练,或详尽;或平易朴实,或幽默风趣,总之不拘一格。
考点类解
考点题型一
概括主要内容
(1)整体感知的基础上,概括全文或语段的主要说明内容或要点;(2)把握说明对象及其特征。
1、方法思路:
(1)概括说明内容
①概括全文的说明内容
可从三方面入手:一看题目——分析题目中的有效信息;二看全文的文首段和文尾端——提炼关键信息;三看重点语段的首尾句——提炼关键信息,加以综合。
答题模式:说明对象+说明内容。
②拟定说明标题
此类题目实际上是概括说明内容的另一种形式。拟题方式一般有三种:一是直接以说明对象为题,二是“说明对象+特征”式,三是设疑式:说明对象+疑问+特征。③分析全文说明对象及其特征
准确把握说明对象:首先要弄明白说明对象是具体事物,还是抽象事理(原理)。其次,分析说明的角度或方面。一般来说,事物说明文从形状、性质、方位、构造、类别、功能等方面进行说明,说明内容“聚焦”的事物即是说明对象。同样,事理说明文从概念、原理、成因、规律、联系等方面进行说明,说明内容“聚焦”的事理即是说明对象。注意:很多说明文的题目中就包含有说明对象。
准确把握对象特征:一是从标题中修饰语中寻找,二是从文首段和文尾段中提炼,三是从文中关键词句(重点段的段首句、段尾句和过渡句)中概括。
2、典题例解:
(1)2007年·广东题:请给本文加一个标题。
例文此略
【解题思路】
此题要求拟标题。借用上述方法,根据文章内容,我们很容易判断出本文的说明对象是“头发”,说明内容是变白的“过程”和“原因”,以“原因”为主,把二者整合起来就是文章的标题:“头发变白的原因”或“头发为什么会变白”。
考点题型二
筛选信息,概括要点:从文中筛选、概括指定的信息或要点。
1、方法思路:
(1)从找关键句(中心句)入手:特别关注文首句和文尾句、段首句和段尾句、过渡句等。说明文大多采用总分式的结构,整篇文章和主要段落都可能如此。一般会有“总领(起)句”或“总结句”或段落,另外进行内容转换时还会有过渡句。它们在文章中或概括内容,或总结规律,或直接点明被说明对象的本质……应尽量把它们找出来,根据题目要求概括、归纳。
(2)从分析每个句子入手:如果语段没有总起句和总结句,就逐一分析每个句子,提炼主要信息,加以综合。
(3)从分析材料入手。即逐段分析作者价绍了有关事物的哪一方面特征,然后根据题目要求逐一归纳概括。
2、典题例解:
(1)2005年·广东题:根据③④段,把文中空缺的内容补出来。A、鼻行动物最大的特征是();B、鼻行动物另一特征是()。
《奇特的鼻行动物》节选 „„
③鼻行动物的最大特征是 ______。有的只有1个奇怪的鼻子,有的有4个鼻子或更多的鼻子。它们的鼻子千姿百态,有的像根柱子,有的像个喇叭,有的像只蜗牛。其鼻子也有多种功能,不但可用鼻子爬行、跳跃,甚至能用鼻子捕捉虫子:鼻子在它们的生活中起着第一位的作用。动物学家给它们的鼻子起个名字叫“鼻子步行器官”,简称“鼻器”。所谓“鼻器”,只是一种功能性概念,而不是形态学上的概念。它们的鼻子决不可与象、猪或其他动物的鼻子同日而语。
【解题思路】
此题要求填写说明对象的特征。从分析第③段入手,第二句说明鼻子数量,第三句说明鼻子的形状,第四句说明鼻子的功能,第五、六句说明鼻子的命名,第七句运用比较法说明鼻子特殊。每一句都说明鼻行动物鼻子的特殊或与众不同,由此得出第一空的答案:鼻子极为特殊。依照此法可概括出第二空的答案。
考点题型三
分析说明顺序
1、方法思路:
依据时间顺序、空间顺序和逻辑顺序的特点分析,常用方法有以下两种:
①看内容,辨顺序。介绍事物的特征、种类、成因、功用等,一般用逻辑顺序;说明事物发展变化过程,一般用时间顺序;说明事物的形状、构造,一般用空间顺序。
②找重点词句辨顺序。空间顺序一般用方位词;时间顺序一般用时间名词;逻辑顺序一般用因为、所以、首先、其次、总之、综上所述等词语。
2、典题例解:
(1)2010年·临沂题:本文最突出的说明顺序是什么?从哪里可以看出来?
……
③山东展馆具体展示内容分为3个板块:“过去—— 文明礼仪的齐鲁”、“现在—— 科学发展的山东”、“未来—— 和谐美好的家园”。在定位的把握上,历史文化部分重在文化,现代城市部分重在城市,未来发展部分重在家园;在展馆设计的空间布局上设置“一廊”、“一厅”、“一家园”。
④第一板块为“智慧长廊”,承担展馆的序厅功能。这一部分重点展示山东古代城市文明,展示山东人对城市文明进步所贡献的智慧。观众进入该区域,将感受“文化山东”。
⑸第二板块为“城市窗口”,承担展馆的主展厅功能,将给观众展现一个继承了传统的齐风鲁韵,开放进取、科学发展的山东。这一部分重点展示当代山东城市发展的成果,展现城市发展的文化内涵和人文精神。该区域将给观众留下“魅力山东”的印象。
⑥第三板块为“齐鲁家园”,承担展馆的尾厅功能。这一部分重点展示对未来城市发展的展望,和对未来生活、未来家庭的追求。该区域主要以互动方式使观众切身体验“好客山东”。……
【解题思路】
此题要求分析说明顺序。从文章可以看出,第③自然段先总体介绍山东展馆所包括的三个展示板块,第④⑸⑥自然段再逐一介绍各板块所承担的功能和主要展示内容,属于典型的先总后分的结构,由此可知本文采用的是逻辑顺序。
考点题型四
分析说明方法及作用
1)、方法思路:
1、根据说明方法的特点判断所用的说明方法,避免张冠李戴。
2、根据语言标志判断说明方法。
(见本节第II级——“
六、说明方法”中的表格)
3、掌握说明方法的作用,结合语境分析,运用答题模式回答:
2、典题例解:
(1)2011年·江西题:文中以“打喷嚏”“感冒”来说明太阳风暴对地球的影响,这样写有什么表达效果?
„„
太阳每隔11年就会进入一次活动高峰年,会向外面抛出很多物质,就像“打喷嚏”一样,这让离它1.5亿万千米的地球也“感冒”。其实太阳风暴对人类的影响一直存在,只是近年来随着科学技术的发展,人类建立的高科技系统规模越来越大,对这些系统的依赖程度越来越高。„„
【解题思路】
此题考查说明方法的运用效果。根据说明方法的特点和语境判断,以“打喷嚏”“感冒”来说明太阳风暴对地球的影响,运用的是打比方的说明方法;再对照打比方的说明方法的作用,就能组织出答案:采用打比方的说明方法,把地球“向外面抛出很多物质”比喻成“打喷嚏”“感冒”,生动形象地说明了太阳风暴对地球的影响,使人易于理解,也增添了情趣。
考点题型五
品味说明语言:①根据语境,分析说明语言的准确性;②根据语境,理解代词的指代意义或内容;③理解重点词句的含义。
1、方法思路:
(1)品味说明语言的准确性
类型1: 加点字词有何作用?
抓住说明文语言准确性这一特点答题。格式:该词准确生动形象地说明了事物(事理)“……”的特征。
类型2:能否替换为另一个词语?并说明理由。
①表态:可以或不可以。②解释原词的意思或作用。③解释所换词语的意思或作用。④结合语境分析换后语意发生的变化。⑤说明与实际是否相符,说明是否准确。类型3:限制性词语能否删去?
①表态:能删还是不能删。②结合语境分析该词的作用。如“比较”“几乎”“相当”等词表程度修辞;“大约”“可能”“左右”等表估计,“多”“有余”等表数量。③分析删去后,语意发生的变化和后果(是否符合实际、是否太绝对,是否准确)。④说明该词体现了语言的准确性。
类型4:从文章中找出一个能体现说明文语言“准确性”的词句,并分析。
①找出语言准确的词句。找能体现准确性的词语可以从以下几个方面入手:
①找表示数据的词;②找表示限制性词语的词,如主要、一般等。
②结合语境分析所选词语的作用:该词准确生动形象地说明了事物(事理)……的特征。(2)理解代词的指代意义或内容
一般在代词所在句的本身或前后语句中查找,由前到后、由近到远。值得注意的是:代词指代内容,有时可能不是整句话,而只是其中的一部分;也可能不在一个完整句子中,而是“零散”地隐蔽在整个几个句子,甚至语段中,比较复杂……要根据题目要求分析、归纳、改编、整合,最后再“代入验证”。
(3)理解重点词句的含义
根据语境理解(解释)词语:①理解语境;②抓关键词语组合。
给指定概念下定义:①理解语境,理解概念的内涵;②运用下定义的格式表述:概念+是+种差(与临近概念的区别)+种属概念。
(4)品味整篇文章的语言特点(风格)
①着眼全文语言风格;②明确一般说明文语言特点:具体准确、生动形象、简明平实;③列举原文例子说明;④运用答题模式表述:这篇文章语言具体准确或生动形或简明平实。例如“……”就具体准确或生动形或简明平实地说明了事物(事理)的……特点(特征)。
2、典题例解:
(1)2011年·资阳题:下列句中加点词语用得非常准确,为什么?
它们(蜻蜓)在飞行中捕食活的昆虫,主要是虻、苍蝇、蚊子,也吃蝴蝶。
【解题思路】
此题属“类型1”。解答方法:根据语境,直接分析即可。示例:“主要”一词准确地说明了蜻蜓的食谱中这些昆虫占绝大多数,也不排除捕食其他昆虫。
考点题型六
判断文中观点:根据题干要求判断文中观点(说法)对错,并发表看法。
1、方法思路:紧扣文本,仔细分析,确定对错,发表看法或阐明理由。
2、典题例解:
2011年·重庆题:第①段中写到:“害羞者似乎就成了异类。”他们真的是异类吗?为什么?请根据文章内容谈谈你的看法。例文《揭开害羞之谜》(此略)
【解题思路】
此题要求对文中观点发表自己的看法。首先,仔细研究文本,搞清楚作者的观点;然后,作出判断,并依据作者观点发表看法。答案示例:从文中的2—5自然段可以看出,害羞是一种先天的复杂的心理状态;从第6自然段可以知道,害羞是可以改变的;从第7自然段可以看出,害羞者有很多优势能强烈地体验积极的情绪,比如成就感,能帮助他们走向成功,它们更容易会将注意力集中在一件事上,他们涉及暴力犯罪或团伙犯罪的几率也更低。综上所述,我们不能将害羞者看成异类。
考点题型七
知识运用:运用文本说明的知识或理论(观点)解决实际问题,谈认识或提建议、方案。
1、方法思路:
①先从文本中归纳出与解决题干中要求解决的问题的知识或理论。
②运用文本中的这些知识解决题干中的实际问题。
③根据文意谈认识,实际上是归纳文本中说明的观点(内容、知识、理论等)。
④所提建议和方案与文本介绍的内容有关,简明扼要,可操作性强。
★温馨提示:此类题目,和记叙文、议论文中的“谈认识或启示”之类的题目不同,答题时要区别开。
2、典题例解:
(1)2011年·义乌题:读了本文后,你在日常生活中会采取哪些措施来防止辐射对人体的危害? 例文《我们身边的辐射》节选(此略)
【解题思路】
此题要求运用知识解决生活中的实际问题。这篇文章虽然没有提到具体防止辐射的有效措施,但文章写了各种辐射源及危害——转换思维:远离“这些”辐射源就是防止辐射对人体的危害的有效措施——再结合平常自己积累的防辐射知识,就可以找到答案:不佩带异常光彩的或廉价合成的首饰,房屋装修后不马上入住,不在燃煤污染严重的地方停留,劝诫吸烟者戒烟,不随便做CT检查,少看电视,少用电脑等。
考点题型八
选择题:涉及的考点面广,几乎涵盖所有考点,但都可以运用本部分列举的方法解决,具体问题要具体分析。
1、方法思路:
(1)牢记顺口溜:先读原文通大意,再读题干做标记,找出范围对应句,比较选项看差异。
(2)具体方法和步骤:
①阅读题干,明确要求:选择指向?选对错?选几项?
②细读选项,弄清观点(说明内容):例如先读选项A,弄清观点,进入下一步③,再到下一步④……
再回到选项B。注意:不是把选项从A到D全部读一遍,再依次进行。
③回到文本,找到出题点(与选项内容相关的句段),分析观点;
④认真比照,判断对错:把选项说明内容和出题点说明内容进行仔细比对,找出相同或不同点,判断对错。
⑤综合结论,作出选择。
2、典题例解:
2011年·广东题:下列说法不符合原文意思的一项是()A.青藏高原的隆起,阻挡了来自印度洋湿润的西南季风,在中亚和我国的西北地区形成了大范围的干旱和荒漠区。
B.如果人类消灭了沙尘暴及沙漠干旱地区,也就消灭了地球上的多种自然生态,绝灭了一切物种,甚至引发我们难以想象的灾难。
C.沙尘含有丰富的营养物。沙尘暴带人海洋中的营养物促进了该海域生物的繁茂。
D.沙尘暴之所以会被妖魔化,主要是因为人们只看到沙尘暴所造成的危害,而忽略了它有利的一面。
选文见本节下文第IV级“典题评改”部分:2011年广东省题《被妖魔化的沙尘暴》 【解题思路】
文本话题 篇3
【训练方法】读写结合, 合作探究。
【课时安排】两课时
【资料准备】学案
【教程预设】
一、新闻图片导入, 设置情境
(一) 三个情境
1.2013年11月25日早上, 浙江金华一道口的非机动车道上, 一位八旬老人突然踉跄摔倒, 脸部朝下, 爬不起来。正是早高峰, 来往的行人和车辆很多, 路过的人们不敢轻易地搬动扶起老人, 在拨打了120后, 路人陆续地停下来挡在了老人前面, 很有默契地围出一个“安全岛”, 将老人围在中央, 默默守护着, 等待救护车到来……
2.2013 年 9 月, 全班学生自发去长沙市雨花区敬老院慰问老人。 (走近老人, 倾听那遥远的故事)
3.《羊城晚报》上的一则图片新闻“鸭子过马路, 警察护送”。 (以新闻和学生随笔导入, 两张来自于新闻, 一张来自于学生, 既紧扣时代气息, 又贴近学生心理。简单;轻松;亲切;利于导入) 。
问:你从三则图片材料中体悟到怎样的一种情感? (关爱善良同情弱者, 归于心中的悲悯情怀)
二、引出本次训练的主题———悲悯的情怀
什么是悲悯?悲是慈悲, 悯是体恤, 悲悯是源于同情、高于同情的一种博大的情怀。什么是同情, 北大教授曹文轩这样告诉我们, 同情就是一个人处在一种悲剧性的境况中, 另一个人面对着, 心灵忽然受到触动, 然后生出扶持与援助的欲望。当他在进行这种扶持、援助之时或在完成这种扶持、援助之后, 心里感到有一种温热的暖流流过, 并且因为实施了他的高尚行为, 从而使他的人格提升了一步, 灵魂受到了一次净化, 更加愿意在以后的日子里, 继续去实施这种高尚的行为。
以慈悲体恤之心去关注人世间的苦难, 感同身受地去抚慰苦难中的人们。
悲悯之心自古传承, 洗涤俗世的铅华, 这种情感令人充满爱心, 从而影响着你去关爱他人, 进而使你的精神世界更丰盈。
三、阅读探究, 激活情感
悲悯情怀是文学作品中一个古老的命题, 是人类情感中弥足珍贵的一部分。
(一) 渗透悲悯情怀的作品
我们学过的哪些作品中渗透作者这种悲悯的情怀?或者作品中的哪些人物深深地触动你的悲悯之心, 令人产生同情、怜悯、悲伤等等繁杂的情感?
1.屈原:《离骚》中“长太息以掩涕兮, 哀民生之多艰。”
2.白居易时任县尉, 他目睹了农民割麦、贫苦者拾麦的情景写下了《观刈麦》:“足蒸暑土气, 背灼炎天光。力尽不知热, 但惜夏日长。复有贫妇人, 抱子在其旁。右手秉遗穗, 左臂悬敝筐。”字里行间充满了对农民的同情和怜悯, 之后他发出愧叹:“今我何功德, 曾不事农桑。吏禄三百石, 岁晏有余粮。念此私自愧, 尽日不能忘。”
3.杜甫《茅屋为秋风所破歌》:“安得广厦千万间, 大庇天下寒士俱欢颜。”
4.范仲淹《岳阳楼记》:“先天下之忧而忧, 后天下之乐而乐。”
5.鲁迅笔下的祥林嫂。
6.莫泊桑笔下的于勒叔叔。
……
(二) 美文阅读
【课预设见后面】
在我们周围, 有一些像老王这样生活艰难的人, 他们不被人重视, 却有一颗金子般的心。你体悟到这些人的善良了吗?你是怎样对待他们的?回忆这篇课文吧, 也许你会有不少感触。
阅读两篇文章:
《老王》 (杨绛) (义务教育人教版8年级上册)
《山羊兹拉特》 (〔美〕艾萨克·什维斯·辛格) (人教语文选修《外国小说欣赏》)
(三) 合作探究
1.现实生活中, 你有过类似的经历吗?说说看。
【预设】如果学生说不出多少东西, 就联系文本追问:
你关注过身边孤苦伶仃的老人吗?
你与你家楼前做卫生的阿姨或者前来收捡废品的大爷攀谈过吗?
你是否某一天突然对体态蹒跚的爷爷奶奶, 白发渐多的父母的态度温柔了许多呢?
你在是否喂养过或者收养过小动物?对他们是否怀念或者歉疚过吗?
你是否曾经给予了在困境中艰难的人们一份帮助, 现在想起来内心是否有一份甜蜜的回味?
悲悯是指对人间苦难中的人并不轻视蔑视甚至可怜, 而是以感同身受的情感来看待。
2.如果让你把这丰盈的内心情感用文字表达出来, 你将如何来构思?
从下面的两篇文章分析, 关于这一类主题的文章写作, 在素材选取和写作方法上你有什么样的收获?
【素材选取的预设答案】
一是着眼于“小”。在写作时, 不一定要写大人物、大事件, 生活中的平凡人、平凡事, 只要我们感受独到, 写出来就是一篇好文章。正如艺术家罗丹所说:“所谓大师, 就是这样的人, 他们用自己的眼睛去看别人看过的东西, 在别人司空见惯的东西上, 能够发现出美来。” (《罗丹艺术论》) 只要认真观察生活、体验生活, 抓住生活中那些有意义的“小”事, 深入挖掘, 是可以写出好文章来的。如《小名》仅就母亲对我的称呼变化就写出了亲情之深厚浓烈。
二是着眼于“真”。如《老王》中送冰、送香油、送鸡蛋等生活中的琐事符合老王的身份, 《山羊兹拉特》中野外没有设置木屋, 而采用躲于草堆中显得非常真实。但总有一些学生写作时逃不出选材虚假、陈旧的“怪圈”。比如, 他们写老师总是固定的选材套路:雨天里的一把伞 (学生忘带雨具, 老师出手相助) 、病痛中的一片药 (学生高烧难耐, 老师授以良方) 、缺席后的一堂课 (学生卧病在床, 老师排忧解难) 、失败后的一番话 (学生失败沮丧, 老师开导解惑) 、暗夜里的一盏灯 (夜半时分, 孤灯一盏, 老师奋笔疾书, 默默奉献) , 这“五个一”近乎笑话, 但我们却随处可以看见它的影子。这些脱离了生活真实的“故事”, 自己读了也要反胃, 更不用说以情动人了。当然, 文章中的真, 并不是客观描绘生活实录, 而是经过提炼、升华的真实, 是一种艺术上的真, 是“一种生活中的可能”。
三是着眼于“深”。要深入挖掘材料本身的意义, 并把这种影响施加给读者, 以期引起一种感情上的共鸣。如《老王》中的最后一段, 作者以善良体察善良, 以善良回报善良。要想深入挖掘材料的意义、价值, 除了自己的思考, 还要多读书, 弄明白成功的作品是怎么做的, 模仿、借鉴会对提高自己的水平有很大帮助的, 正如梅兰芳所说“不看别人的戏, 就演不好自己的戏”, 写作也是这样。
【写作方法的预设答案】
1.质朴的语言表达
2.曲折的情节
3.细腻的心理感受
4.外貌呈现
5.议论升华
6.夸张美饰对比凸爱
7.矛盾透露
8.节制胜于放纵
9.场面描写:《老王》中老王临终前送鸡蛋和香油的场面。
从情感来说, 羊始终处于常态之中, 但人暂时处于非常态之中, 在羊的引导下, 人回归了常态。作者用小说情感酝酿发展轨迹来揭示这样一个主题:只有当人成为大写的人的时候, 人和羊 (动物) 的相处, 才能构成美好的境界。
随着社会网络时代的到来, 现代人正面临着“情感的暖死亡”, “嗜新症”使人类毫无保留地抛弃一切———不止是物品, 而且包括亲情、友情与故土。
(康得拉·洛伦茨《文明人类的八大罪孽》)
一个民族的文明程度和良知所在, 就系与他如何对待那些处境不利的人们, 海明威在《丧钟为谁而鸣》中写道:所有的人其实是一个整体, 别人的不幸就是你的不幸, 不要以为丧钟是为谁而鸣, 它就是为你而鸣。一个人的不幸就是所有人的不幸。
(四) 小结
也许你曾有过亲身帮扶弱小者的经历;
也许你曾经留意过陌生流浪者并为他的命运深深的担忧;
也许你曾经因漠视过陷于困顿中的不幸者而留下了愧疚;
也许你正在因某个作家的视角或者某部作品中的人物引起了思考;
……
那么, 怀着悲悯的情怀提笔而书吧。
如果你写下的是喜悦, 那就让读者陪着你欢笑;如果你写下的是忧愁, 那就让读者陪着你叹息;如果你写下深深的伤感、痛苦, 那就让读者为你无声地流泪。
概括地讲, 就是所写的人和事要能触动人心。
四、随堂训练, 迁移运用
人应该常怀悲悯之心, 一个不具有悲悯之心的人, 是断不会懂得珍爱自己, 更谈不上去关爱和扶助别人的。如果一个社会, 一个民族, 一点点丢掉它的悲悯之心, 最终丢掉的将是社会的良知和道德文化的灵魂。我们不能对人类的不幸和苦难熟视无睹、无动于衷, 而应该常怀悲悯之心, 用悲天悯人的情怀相互扶持、彼此慰藉。悲悯是善的本质, 是善的源头, 是善的表现。
怀着悲悯之心, 描绘他们的生活
怀着悲悯之心, 感受他们的痛苦;
怀着悲悯之心, 思考他们的命运;
怀着悲悯之心, 抚慰他们的心灵。
注意运用你学到的方法。 (写完之后, 有学生自己诵读, 与大家分享, 时间够的话可以相互点评。)
【附片段预设】
时光转瞬即逝, 奶奶和老猫也一天天地老去。终于在一个清晨, 老猫趴在奶奶身上不再动弹, 只是望着她, 静静地凝望, 乌黑的眼球里渐渐闪闪发光, 眼眶边的白毛也渐渐湿润。奶奶也红着眼圈, 抚着它着力仰起的头说:“走吧, 走吧, 在那头等我。”老猫舔舐奶奶干枯的手渐渐慢下去。那双孤傲的眼睛缓缓合上。奶奶将老猫葬在了爷爷的坟边, 逢年过节, 也不忘摆上“三牲”。
(摘选自长沙市实验中学1207班彭鑫)
从那以后, 姐姐好像变了, 她不敢去爱一样东西, 因为她怕失去。
人类随意的举动就主宰了动物的生死。倘若当时爸妈多一丝悲悯之心, 我和姐姐幼小的心灵也不必承受这一生的愧疚和痛苦啊!
(摘选自长沙市实验中学1207班贺周易)
五、写作实践, 心手相应
【参考素材】 (教师收集)
六、类文链接, 强化情感
(这一部分的阅读放在课后完成。)
《咬舌自尽的狗》 (林清玄)
《大悲悯具有拷问灵魂的深度》 (莫言)
【阅读提示】
文章首先从反面提出论题, 指出“什么是悲悯”。然后, 阐述“什么是大悲悯”。
最后指出作家怎样才能做到真正的大悲悯。
【思考】