基于文本(共12篇)
基于文本 篇1
0 引 言
由于当前面向互联网的内容发布缺少内容监控机制, 从而使大量不良信息在互联网上流传。为了构建一个和谐安全的网络环境, 研发一个针对互联网的不良文本信息快速识别系统具有重要意义。针对不良文本过滤问题, 国内外研究者做了很多有益的尝试。文献[1]提出了基于近似类别构建和分类。构建色情文本和相关主题的医学文本的近似文本集, 在此基础上进行基于向量空间模型的分类。文献[2]提出了使用概念网技术进行文本表示。概念网通过样本学习获取概念之间联系的权重, 对这些权重利用支持向量积进行分类。文献[3]采用了基于语义分析的方法进行文本过滤。首先将文本进行语法分析和语义分析, 填充相应的语义框架;最后与过滤模板的阈值比较得到过滤结果。文献[4]使用潜在语义索引技术将文本表示为压缩后的概念组合, 并在此基础上进行文本过滤。
以上不良文本识别方法主要采用基于主题的文本分类思想, 然而相似文本 (指与不良文本相似的正常文本) 在主题上与不良文本非常的一致, 其不同主要体现在倾向性、体裁等特性。由于传统的主题分类方法利用文本中主题词的分布进行分类, 其对区分正面还是反面文本没有获得很好的效果。主题词代表了文本所叙述的内容, 而文本观点的区分主要体现在对整个句子的意义描述, 而不仅仅是一些主题词的不同。
含主题词的句子中的上下文的词汇代表了句子的基本观点。利用这些上下文词汇可以在当前还不能完全进行句子理解的基础上进行句子观点的区分。在本文中, 这些存在主题词附近的上下文词汇被称为主题词的上下文信息。上下文词汇在与主题词相互作用上表现了一种内在的语义相关特性。在具有不同观点句子中, 主题词所拥有的上下文存在明显不一样。利用这种不同的上下文信息, 可以区分主题词所在句子代表的不同观点。虽然主题词的上下文词汇可以直接作为特征词进行分类, 但是脱离了主题词的影响, 这些词的区分能力并不强, 而且容易造成对不相关文本的错分。
基于以上的分析, 本文提出了一种基于文本倾向性的不良文本识别方法。该方法先进行基于主题的文本分类, 然后进行文本倾向性分类 (观点分类) 。文本的倾向性通过主题词的上下文信息进行分类。
1 方法介绍
为了快速准确地进行不良文本的识别, 本文采用了层级分类方法。该方法首先利用基于主题词的主题确认方法排除不相关的文本, 再对相关主题文本进行文本倾向性分析识别不良文本信息。方法整体框架如图1所示。
本方法分为训练过程和测试过程两个部分。训练过程包括主题词获取、主题词上下文信息构建、SVM模型学习过程。测试过程分为基于主题词的主题确认、测试文本的主题词倾向性获取、SVM分类三个过程。
主题确认方法采用基于主题词匹配方法。该方法通过字符串匹配, 如果文本中出现预先设定的主题词列表中的词则将该文本分为主题相关文本, 否则排除该文本。该方法能排除那些明显的主题不相关文本, 从而避免后续的过滤操作在这些文本上的计算, 提高整个系统的效率。
主题词倾向性获取方法是假设具有同一倾向性的文本中主题词上下文信息比较一致, 而且在大量的文本中重复出现, 利用机器学习算法可以从训练样本中获取主题词的上下文信息, 通过主题词上下文信息与测试句子中主题词的上下文词汇匹配计算出主题词的倾向性值, 然后将主题词的倾向性值作为SVM的特征值进行分类, 识别出不良文本。
1.1 主题词上下文信息获取
在包含主题词的句子中可能存在很多相关性不是很大的上下文词汇, 这些词汇对主题词倾向性的作用并不是很大, 所以应该减少这些词汇对主题词倾向性的作用。考虑到上述原因, 本方法采用了χ2统计量方法[8]获取主题词的上下文信息。其详细的算法流程步骤如下所示:
1) 提取训练样本中某主题词的所有句子。
2) 对所提取的句子进行分词和词性标注。
3) 滤除停用词, 获取名词、形容词、副词、动词四种词性的词汇作为候选词汇。
4) 计算正面和反面样本中所有候选词汇出现的频率和正反面的含主题词句子数。
5) 把正反候选词汇作为训练样本, 计算χ2统计量, 并选取统计量最大的N个词汇作为该主题词的上下文信息。
1.2 主题词倾向性值计算
主题词的上下文信息作为本方法训练获得的知识, 主要通过主题词上下文信息与测试文本中包含主题词句子中的词汇共现来发生作用。如果包含主题词的句子中拥有该主题词上下文信息词汇的时候, 就认为该词对该主题词有一个倾向性的贡献, 贡献值是该词对主题词作用的权重。主题词上下文信息词汇对主题词的贡献权重通过共现频率计算, 计算方法如下:
Weight= (Num+ (word, Term) -
Num- (word, Term) ) /Num (Term) (1)
其中word是上下文信息词汇, 而Term是主题词。Num+ (word, Term) 表示word和Term在正面文本集中的共现次数, 而Num- (word, Term) 则表示在负样本中的共现次数, 两者相减表示了正面例子给予倾向性一个正值, 而反面的给予一个负值。主题词的倾向性由主题词句中词汇对主题词权重的和表示。
通过对每个包含主题词句子的操作, 将整篇文本表示成为主题词倾向性值的向量。这些主题词的倾向性值考虑了主题词的上下文信息, 并进行了量化。
2 实验及结果分析
2.1 训练和测试样本
本文在测试本方法的有效性时收集了大量的文本用于分类器的训练和主题词上下文信息的构建。为了能够区分不良主题和正常主题, 本文使用复旦大学的文本分类数据集作为本实验的正常主题内容, 即不相关文本集。同时我们收集正面和反面文本分别为4285篇和6871篇作为训练样本。测试数据库中包括:正面和反面测试文本分别为405篇和425篇, 无关主题文本数为1300篇。
2.2 测试方法选择
本方法在实验中使用开放源代码的LIBSVM[6]作为我们实验SVM分类部分。在实验中, 每个主题词作为SVM特征向量的一维, 选择径向基函数作为SVM的核函数, 核函数的带宽σ使用基于交叉验证的方式获取, 惩罚系数C固定设置为1000。
实验选择基于主题词词频的SVM方法作为本方法的对比实验, 基于词频的文本分类方法是选择主题词作为特征, 主题词在文本中的出现频率作为向量的权重, 分类器选择与本文提出的方法一样是利用SVM进行分类, 该对比实验可以有效地说明文本分类中主题词权重的不同计算方法对整体分类性能的影响。
本文建议方法称为基于文本倾向性的SVM方法。主题词上下文信息构建通过在正负训练样本集上构建, 除了利用SVM进行分类, 由于通过上下文信息, 主题词本身带有的正负值就代表了主题词的语义倾向性, 所以本文尝试使用主题词语义倾向性值的和作为整个文本的分类标准, 并用一个阈值确认文本为正面还是反面。在实验中我们选择阈值为零, 如果小于零则认为文本属于反面文本, 否则认为是正面文本。该方法称为基于文本倾向性的阈值方法。
2.3 测试评价标准
方法评测的标准采用召回率和准确率作为主要标准;召回率反映了系统发现不良信息的能力;准确率反映了系统识别的准确性;召回率和准确率的定义如下:
Recall=Num (found harmful texts) /
Num (all harmful texts) (2)
precision=Num (found harmful texts) /
Num (return harmful texts) (3)
其中Num (found harmful texts) 表示系统正确识别的不良文本数;Num (all harmful texts) 表示测试数据库中所有的不良文本总数;Num (return harmful texts) 表示系统识别的不良文本总数。同时我们给出了系统在不同类别样本集下分类的准确率作为系统的性能描述, 其类别主要分为三类:正面、反面、不相关。对正面样本的分类准确率定义为确认是正面的文本数除于正面文本总数;同样反面和不相关文本的准确率具有类似的定义。总体样本主要有正面样本、反面样本和不相关样本组合而成, 其主要通过召回率和准确率来表示系统总体性能。
2.4 测试结果与分析
实验结果如表1、表2和表3所示。表1和表2表示了主题数对文本倾向性分类的准确率和召回率的影响, 表3表示了层级过滤方法对文本效率和准确率的影响。
从表1中, 我们发现基于词频的方法获得了更高的召回率, 其主要原因是主题词数的增加可以增加系统关于过滤文本的信息, 但是一些区分能力不强的主题词被列入到主题词列表中, 对不相关的文本的区分能力显著下降。而在实际应用中, 不相关的文本占主要部分, 针对不相关文本的分类准确率低会导致系统的识别准确率低, 而无法满足实际的应用。基于上下文信息方法在针对不相关文本的分类中显示了其比基于词频方法更好的准确率。
从表2中, 我们观察到减少主题词数, 明显地提高了系统针对不相关文本的识别准确率, 对测试的不相关文本集达到了100%的准确率, 而且基于上下文信息的分类性能比基于词频的分类方法有了很大的提升, 这主要在于主题词数的减少, 关键主题词的文本倾向性能够表示文本的主要倾向性, 而减少了一些区分能力弱的主题词的影响, 而且基于上下文信息的识别的召回率和准确率明显地高于基于主题词词频的方法。
表3表示了层级分类方法对识别效率和性能的影响。从表中我们可以发现基于关键词过滤方法虽然效率较高, 但是其准确率和召回率都较高;而完全的基于上下文信息的方法虽然获得了较高的识别准确率和召回率, 但是其效率较低;而通过基于关键词过滤和基于上下文信息识别的层级过滤方法, 保证了系统识别的准确率和召回率的情况下, 过滤的效率得到了显著提高。
总的来说, 基于文本倾向性的不良文本识别方法获得了比基于词频的文本分类方法更好的分类性能。而且与基于主题的文本分类方法组成层级的分类过程提高了系统的识别效率。
3 总 结
本文将不良文本识别过程分为主题分类和倾向性分类两个步骤。利用主题词匹配的主题分类使系统在不降低召回率的情况下提高了执行效率。对难以区分的相似文本, 识别上采用了文本倾向性分类方法。在现有的句法分析准确率不高以及句子理解比较困难的情况下, 本文提出的一种基于主题词相关句子的倾向性计算方法。实验结果也显示了本方法的有效性。
摘要:针对网络不良文本信息的过滤问题提出了一种基于文本倾向性的不良文本识别方法。首先采用基于主题的文本分类方法, 然后对不良主题的相关文本利用倾向性分析方法识别不良文本。基于文本倾向性由文本主题词的上下文词汇确定的假设, 提出了一种基于主题词上下文的文本倾向性分类方法。实验结果显示该方法对已有基于主题分类方法很难区分的文本具有较好识别效果。
关键词:文本信息过滤,倾向性分类,文本分类
参考文献
[1]苏贵洋, 马颖华, 李建华.一种基于内容的信息过滤改进模型[J].上海交通大学学报, 2004, 38 (12) :31-36.
[2]熊静娴, 李生红.面向不良文本信息监控的概念网技术研究[J].计算机工程与应用, 2006, 42 (3) :183-186.
[3]刘永丹, 曾海泉, 李荣陆, 等.基于语义分析的倾向性文本过滤[J].通信学报, 2004, 25 (7) :78-85.
[4]Foltz P W.Using Latent Semantic Indexing for Information Filtering[C]//Proceedings of the Conference on Office Information Systems, Cambridge, MA:40-47.
[5]Masand, Linoff.Classifying news stories using memory based reasoning[C]//15th Ann Int ACMSIGIR Conference on Research and Develop-ment in Information Retrieval, 1992:59-64.
[6]黄萱菁, 夏迎炬, 吴立德.基于向量空间模型的文本过滤系统[J].软件学报, 2003, 14 (3) :435-442.
[7]Chih-Chung Chang, Chih-Jen Lin.LIBSVM:a library for supportvector machines.2001.http://www.csie.ntu.edu.tw/~cjlin/libsvm.
[8]Fabrizio Sebastiani.Machine learning in automated text categorization[J].ACMComputing Surveys, 2002, 34 (1) :1-47.
基于文本 篇2
文本编辑器
一:基本任务
设计一个基于对话框的文本编辑器,实现常用文本编辑器的基本功能。
二:要求和评分标准
1、基本要求
(1)按照题目要求独立设计文本编辑器所需的所有按钮,并完成程序源码编写、调试及关键代码注释。(40分)
(2)能够实现文本文档的创建与保存。(10分)
(3)能够实现文本信息的编辑。(15分)
(4)能够实现文字的字体、颜色等设置。(15分)
2、发挥部分
能够实现文本编辑器的其它功能。(20分)
三、实训报告格式
1、任务题目;
2、性能、指标、要求;
3、方案设计:
① 方案论证
② 工作原理
4、软件设计
5、制作与调试过程;
基于文本的有效教学 篇3
李劲松老师执教的《学会合作》第一课时,给我们做出了很好的示范。李老师紧紧围绕“让学习真正发生”这一教学理念,精心设计每一个教学环节,让学生在大量的言语实践活动中学习语言、积累语言,在读中感悟、学习作者的说理方法。李老师这节课,准确定位高年级阅读教学目标和第一课时的教学目标,教学效果好,其亮点主要表现在如下几个方面:
一、能很好地体现课时教学目标要求
教学目标设定是否准确,直接关系到课堂教学效益。不同的课时,应当有不同的教学目标要求。然而,在日常教学中,特别是高年级的阅读教学中,有相当一部分教师已不再重视应当在第一课时完成的字词、朗读、整体把握文章的教学,错误地认为这是一二年级教师要做的事,到了高年级就是对课文进行分析、讲解。新课标对小学三个学段的识字、写字教学都有明确的目标要求。也就是说,小学一到六年级每一篇课文都承担着识字、写字教学的任务,即使到了高年级,学生的识字、写字仍然是阅读教学的目标要求之一。李老师教学时,让学生在课前预习中自行解决生字、新词的认读、理解及课文的朗读等问题,在课堂上通过听写词语、指导对“牺牲”一词的理解等,检查学生对生字、新词的掌握情况。李老师对字词教学的处理,不再像低、中学段那样逐字、逐词识写、理解,而是通过检查预习情况以及重点指导难读、易写错、难理解的字词,从而省时、高效地完成字词教学任务。随后,在了解学生预习情况的基础上,指导学生整体把握文本,了解课文的主要内容,并让学生通过与过去学习的说理文进行比较,初步了解演讲稿这种文体的基本特点,最后让学生试着进行简短的演讲。李老师这种明晰的教学目标定位以及合理的课时任务分配,值得高年级语文教师学习和借鉴。
二、能充分利用文体资源进行教学
《学会合作》是篇演讲稿,这种文体在生活中运用很多,因此,教师在教学中要充分用好这个“例子”,让学生感受这种文体的特点,并初步学会运用这种文体。李老师先是引导学生从整体上感受演讲稿的特点,让学生把这篇课文和过去所学的一般课文进行比较,使学生初步感受不同文体的表达形式和表达方法不一样,再和过去学过的几篇说理文相比,进一步感受演讲稿特有的表达方法;接着,让学生读课文第2小节和最后一小节,感悟作者是怎样表达为什么要合作及合作的意义的,并通过抓关键词句,体会“总—分—总”的构段方法;然后,让学生默读课文第4、5、6小节,感悟作者是通过什么方法来写“怎样才能卓有成效地合作”的,并让学生比较两个事例的叙述顺序能不能对调,进一步揣摩文章的表达顺序;最后,让学生试着进行演讲,切实感受演讲稿的文本魅力。李老师这些教学环节的设计,不仅体现了高年级阅读教学的要求,也很好地体现了不同文体独特的教学要求。
三、让学生真正成为学习的主人
新课改明确提出:学生是学习的主体。如何落实这一理念,让学生真正成为学习的主人?这是一件说起来容易做起来却有点困难的事。李老师的课让我眼前一亮,感到振奋。在他的课上,已经没有了传统的教师“牵着”学生逐段、逐句分析、讲解课文的教条做法,有的是利用身边的教学资源,激发、引导学生去阅读文本、质疑问难、感悟体验、交流研讨,最后自己解决问题、得出结论。特别是在揣摩文章的表达顺序及体会作者是如何进行说理、论证的时候,李老师没有直接去讲、去告知,而是让学生去读、去悟。在李老师的课堂上,学生的思维活跃,学习热情很高,能积极、主动地去学习。正是因为李老师心中有学生,他才把课堂交给了学生,这是李老师这节课最大的特色,也是最大的亮点。
基于核心问题的文本梳理 篇4
我们要论述的, 就是第三个境界:如何从文章筋骨脉络的角度来梳理文本。庖丁解牛, 靠的是经验和解牛刀, 而教师梳理文本, 则主要是围绕核心问题设置问题组。
“核心问题”, 指能激发和推进学生主动活动、整合现行教材中应该学习的重点内容、能与学生生活实际和思维水平密切相关联的、能贯穿整节课的问题或者任务。 (1) 那么, 围绕核心问题构设的课堂教学环节则应该具有如下特征:问题组围绕核心问题而设置, 目标集中, 纲举目张;问题由3-5个构成, 符合思维的层递行, 由浅及深、环环相扣;问题为激发思维推动活动而设置, 促思激疑。而关键步骤则是找出文章的筋骨脉络, 从整体感知、把握进入局部分析。文章的脉络骨架, 则可从两个角度去探查, 一为文体, 形式结构;二为主旨, 内在风骨。问题的价值并不在于获得唯一答案, 而在于激发学生思考、探究。
从策略上来讲, 我们可以在预设核心问题组时注意以下情况, 并通过一些办法来解决相应问题:
一.目标聚焦功能。
聚焦功能最大的体现在教学目标的聚焦。问题是一种情境, 是当前状态向目标状态的转化与操作。问题的预设或生成, 就决定了要想达到的目标状态的指向。对应于教学中, 就是教学目标的选择。问题的功能就在于能够通过提问, 选择教学内容, 简化教学目标, 突出教学重点。在进行梳理文章的教学中, 问题不能太多, 以3-5个为宜, 其中应该有总摄或核心的问题, 聚焦于文章的结构与内容, 能够通过解决问题披文见情、披文见理。
二.环节组织功能。
课堂是一个活动的思维流, 问题可以决定流程, 具有环节组织功能。好的问题应该是逐层深入, 问题之间有思维的递进关系、环环相扣, 解决问题的过程实际就是教师在不断训练和提升学生思维能力的过程。由此可见, 问题构成课堂流程, 流程影响思维活动发展。梳理课文时, 学生认知活动层次应该由低到高、文章分析应该由浅及深。
三.思维激发功能。
问题促进思维活动。课文的梳理是以学生的研读、讨论、辩驳、师生的对话为主。教师仅仅起组织的作用, 给大家创设一个思考的对象, 提供一个对话的平台。“我们应该发现问题教学的课堂优势, 这就是课堂里的诸多思维个体以及这些个体之间通过对话而形成脑风暴并最终将会带来的无穷的方法空间。” (2) 这里所说的方法, 就是学生发现问题、探究问题、解决问题的方法。所以, 梳理课文时, 教师不是答案的提供者, 也不要做绝对的评判者, 而应该是一场论辩的组织者, 顺水行舟、迎风扬帆, 把握着课堂活动的方向与节奏。
君子之学必好问。梳理文章, 问得其法, 问得其妙。倘能用基于“核心问题”的问题组来梳理文章, 定能使文章“謋然已解, 如土委地”, 收到事半功倍的效果。综
参考文献
[1]周光岑:《核心问题教学研究》, 电子科技大学出版社。
基于文本 篇5
珙县洛表民族中学校
蕙质兰心
尊敬的各位评委、老师们:
大家上午好!请允许我代表我们团队来陈述对《荷塘月色》文本的解读。首先我认为对文本的解读就是一次读者与文本的对话,它需要我们沉下心来调动自己的生活积累、情感积累、阅读积累去体悟文本,你才能真正走进文本、读懂、读准文本,把握文本的核心价值。根据这个要求,我们对《荷塘月色》进行了多次解读,收获颇丰。“弱水三千,我只取一瓢饮”,下面我将围绕“内容结构、作者情感、写作技巧、备教策略”四个方面来谈谈我们对《荷塘月色》文本的解读。
一、内容解读 1.关于主旨:
《荷塘月色》是朱自清先生的散文名篇,也是一篇以写景为主的抒情散文。写于1927年7月,当时正值大革命失败,白色恐怖笼罩着中国大地,朱自清也处于苦闷彷徨中,《荷塘月色》正是作者自己想“超然”而又想“挣扎”心理的真实描摹和生动写照。
也有人认为散文大家朱自清用极具传统意味的意象“荷塘”和“月色”状写自己的心灵,诉说印象,哀伤与希望、超脱与执著,“月下荷塘、塘上月色”无疑成了作者的生命场。《荷塘月色》承载的情感信息是很复杂的,对其所抒发的情感历来是见仁见智。但我们认为主题的多义性,既是本文学习的难点又恰好是引导学生多元解读文章主旨的良好契机。2.关于结构:
全文以作者的游踪为序,写了作者出家门——踱小径——赏荷塘——回家门,以作者情感变化为线索写了作者从不宁静——求宁静——得宁静——出宁静的心路历程,一明一暗形成独特的双线圆形结构,不失为初中学生阅读与写作的典范文章。在教学中,我们也可巧妙的利用理清结构来把握作者情感,有效的突破教学重难点。3.关于意象
《荷塘月色》用了大量的中国古典诗歌的传统意象,除却文题中的“荷塘”“月色”,还有“蝉声”“蛙声”“江南采莲”盛况等等。古色古香、典雅华丽。幽静、神秘、优美。作者是丹青妙手,轻轻挥洒笔墨,便点染出月下荷塘奇异之花,邀足了月色,造就一种既明丽又静谧的梦幻般美的情调与境界。神秘迷惘,这是至美,这是绝美,如果仿写有着深深的中国情绪的台湾诗人余光中的诗就是:等你,在月色荷塘下。蝉声沉落,蛙声升起,一池的荷花如图画,一池的月色如绝响。无限的月色荷塘,以月光统领荷塘,以荷塘印证月光,寄寓深情,千种风流,万种婉转,情景交融,令人扼腕咏叹玩味无穷。
在教学中,我们也可以引导学生在阅读散文时要善于去抓住文中意象,充分调动想象和生活积累去感悟散文含蓄而隽永的情感内容,从而提高鉴赏散文的能力。
二、关于语言
对于《荷塘月色》,我们对它的内在的技巧和精神比之主题更感兴趣。是什么样的语言技巧使之具有美的神秘境界呢?它是如何为普通的荷塘月色罩上了一层迷人的面纱,造就一种神秘的气氛,又是如何用寥寥数语勾勒出一幅真切动人的画面,使其如诗如画并渗进作者情绪的呢?
1.《荷塘月色》用了大量的比喻和拟人的修辞,使满塘月色婆娑,荷花、荷叶、流水、月色共生共语。这种比喻,不是科学家毫厘不爽的细致观察,而只是作家敏感诗心的表现,像情人的眼睛一样敏锐,像母亲的直觉一般可靠而正确。于是“荷叶”像“亭亭的舞女的裙”,荷花像珍珠、像星星,流水脉脉含情,“灯光”是“渴睡人的眼”,月光朗照是“酣眠”,隔着一层淡淡的月光是“小睡”。这灵巧的隐喻表现了作者用尽自己的情感力量,迫使“月下荷塘”与自己分担审美和情感。这种融情于景的技巧,在中国一切优秀的诗歌中都极为普遍。
2.《荷塘月色》极具炼字之美,语言的刻意精工达到了天衣无缝的地步,特别是对动词的推敲极具匠心。这一幅淡墨水彩一个“泻”字写出了月光的鲜明欲滴,一个“浮”字写出了月光的缥缈轻柔,一个“画”字写出了月光的如诗如画、美丽绝伦。
3.《荷塘月色》中大量的叠词是语言的另一亮色。朱自清先生在《荷塘月色》中用了三十几处叠词,增添了文章的音乐美、节奏感,尤以文章的第四、第五段居多,平添了几多华彩。如“曲曲折折”“田田”“亭亭”“层层”“粒粒”“缕缕”“密密”“脉脉”“静静”“薄薄”等,其中以形容词叠词居多,也有数量词叠词。音节响亮,音韵和谐,字正腔圆,历历在耳,不绝如缕。
这是一座极具审美价值的富矿,语言的富矿,学生不能入宝山而空归。所以我们认为诵读应该贯穿整个教学过程,一读,二读,再读语言之美可以得到彰显,在多种形式的读中学生语感得到培养。其次,在教学中还要引导学生进一步去探究文中作者运用了哪些写作技巧把笔下之景写点如此之美?通过语言的品味和分析,让学生在阅读中获得一种方法,培养一种能力,受到一点启迪——这就是我们阅读教学的使命和功绩!
基于语用角度的文本解读策略 篇6
一、 关注文章的言语个性
“言语形式”是语文教学的立足点,是特定的教学对象。在日常生活中,常态的文章阅读通常着眼于获取文章的内容信息,这使得我们往往“得意忘言”。但在语文教学中,阅读目的不仅在于获取文章所负载、传递的内容,更在语言本身,这就要求我们既要“得意”又不能“忘言”。
不少语文教师在课堂教学中首先解决的第一个问题,往往是文章“写了什么”,对于言语内容的关注,当然无可厚非,因为“写了什么”是对文章内容的确认。然而,言语个性立足于言语形式。就作品的个性本质而言,更重要的却不在于“内容”而在于“形式”。作品的价值往往不在于它产生了前人没想过、说过的内容,而在于它不同寻常的想与说的方式,在于想与说“形式”的与众不同的佳妙处。这就是文章的言语个性。
言语个性是文章作者或编者的个人言语风格的彰显,是个性化的言语表达智慧。关注言语个性,需要关注作者的言说方式。许多语文教师对作者的关注方式,往往是在课堂上向学生介绍作者生平轶事。事实上,这只是关注文学常识。甚至,很多教师往往忽略了作者的存在,把作者的言说方式当作语言材料进行分析学习。以人教版四年级上册课文《白鹅》为例。《白鹅》一文,它所呈现的内容有三个层面:第一是白鹅的活动特点,第二是丰子恺眼中的“有趣”的、“高傲”的白鹅,第三层面是丰子恺喜爱的、恋恋不忘的“好一个高傲的动物”!有些教师把时间花在第一层面,仔细分析写了白鹅的哪些内容,这是很不够的。我们应当关注第三个层面:作者丰子恺如何通过文字叙述,呈现了基于喜爱之情所感觉到的白鹅的“有趣”和“高傲”。如果教师忽略作者的存在,一味强调白鹅的高傲表现在哪些方面,很容易产生的后果就是要么是关于“动物可爱”的人文熏陶,要么是关于“动物特点”的写作迁移。
语文教材的作品,这一篇与那一篇的不同,就在于作者的个性表达的不同,因此,语文教学要关注作者对我们的“触发”,也就是作者如何表达他的有意义和有启发的思考。作者丰子恺是一个漫画家,在散文的创作实践中,他常以漫画家的眼睛观察生活,以漫画家的笔调反映生活。这样,他的散文除了具有散文的特点之外,也渗入了画的元素,营造出了特有的“画境”。其笔法之一是白描:文字简练单纯,不加渲染,寥寥数笔就能勾勒出事物的特征。例如,文中说鸭的步态“步调急速,有局促不安之相”,鹅的步态则“大模大样”,“像净角出场”,遇见人也“毫不相让”。教学时,教师应当关注丰子恺这一言语个性。
二、 关注文章的语体因素
语体是运用语言的体裁,是在一定交际场景中使用相关的语言材料所形成的不同特点的语言体系。语体不同于文艺学、文章学的“文体”。文体是文章的体式,一定的文体必然使用相应的书面语体。不同语体的外显性的语境框架给对话理解带来不同程度的限制性。根据语言的功能和特点,语体可分为实用语体、交叉语体和艺术语体。语文教材内关于新闻、政论、说明性文章和科技作品属于实用语体,它们偏重于客观事实的陈述;杂文和散文,属于交叉语体,既有客观事实的陈述,又伴随着比较强烈的主观意向和情感;诗歌、小说和戏剧则归类于艺术语体,其倾向于表达个人与客观世界的关系,构建的是可能的、虚拟的、概念化的主观世界。
对于不同语体的作品,教师应当引导学生采用不同的对话方式。对于实用语体,教师应当关注其交际功能,注意文章如何运用言语反映人与人之间、人与客观世界的联系。对于艺术语体,凸显的是作者言语的独创性、变异性,教师要引导学生运用想象去感受和体验,从而理解作者由某些“不可能”的描写所营造的“可能”世界所蕴含的语用意义。某语文教学曾出现对《斑羚飞渡》故事真实性的质疑,正是将艺术语体的“可能”等同于生活的“不可能”,从而对动物小说的的情节构思进行的纯客观的判断导致。对于交叉语体,由于它主要与语言的情感功能相适应,教学时要关注作者的言语个性,尤其是关注带着作者强烈感情色彩的话语。
例如《白鹅》一文。此文选入教材经过删减,仔细体味原文,不妨关注作者丰子恺的言语表达。他在《白鹅》原文中说:“它(指白鹅)对我们,物质上和精神上都有贡献。”“物质上的贡献,是生蛋。”“比鹅蛋更好的,还是它的精神的贡献。因为我们这屋实在太简陋,环境实在太荒凉,生活实在太沉寂了。赖有这一只白鹅,点缀庭院,增加生气,慰我寂寥。”因为“它有那么庞大的身体,那么雪白的颜色,那么雄壮的叫声,那么轩昂的态度,那么高傲的脾气,和那么可笑的行为。在这荒凉沉寂的环境中,这鹅竟成了一个焦点”。“惟有这伟大雪白的东西,高擎着琥珀色的喙,在雨中昂然独步,好像一个武装的守卫,使得这小屋有了保障,这院子有了主宰,这环境有了生气。”可见,这个白鹅不是普通语言概念的白鹅,而是作者所体察到有个性的白鹅。丰子恺是把白鹅当作一个朋友来言说,在作者眼中,这个朋友是可爱、可笑,但又有可敬之处的。在原文的结尾处,丰子恺的感概是:“感觉与诀别一个人的时候所发生的感觉完全相同,不过分量较轻一些而已。原来一切众生,本是同根,凡属血气,皆有共感”。这篇文章被选为课文后,编者作了较大幅度的改编,淡化了写作的时代背景,删除了作者很多的抒情和议论。这样使得文章的内容重点突出了鹅的“高傲”特点。但是,鹅的“高傲”特点是基于作者对鹅的“有趣”的喜爱之情,把白鹅当作一个可敬、可爱又有点可笑的朋友来描写,这些在教学时应当引导学生透过语句的把握而感受带有感情色彩的话语。
三、 关注文章的文化语境
语文教学是言语活动过程,言语活动依托语境而存在。这一语境蕴含着文章作者或编者个人的文化知识所营造的文化语境,也包含着学生自身的文化水平所具有的文化语境。在语文教学中,这两种语境会互相影响。作者或编者的文化语境与学生所持的文化观念认识存在着时空差异和民族文化差异,这必然对学生理解作品形成一定的阻碍。同时,学生自身所拥有的背景知识和文化语境也影响着对作品的再创造。例如《白鹅》一文的学习。就学生的文化语境和背景知识而言,如今乡下农村很少养鹅,城里更难得一见家养的鹅。学生对家鹅的叫声、动作、样子和生活习性很不熟悉。这对学生体会作者运用语言文字的准确性和趣味性,有一定的难度。此外,由于学生和作者生活的时代差距很远,以致文章表达所带有的二十世纪上半叶的语言特点,作者丰子恺所营造的文化语境和文中表现出来那种文人心态以及成人化的审美情趣,对孩子来说缺少亲切感,给学生读通文本增加了障碍。
因而,语文教师面临一个挑战,那就是如何减少作者文化语境与学生文化语境的代沟,让学生在特定语境的学习中,体验、感悟文章中成熟的、典范的言语经验和言语智慧,把握它们的特点与运用规律,培养学生的言语交际能力。正因为如此,语文教学要注重创设语文教学的体验性学习环节,其教学设计的关键是以学生的文化立场为出发点,通过创设某种情境,建立与课文文化语境相关的情境联系,使得学生在相关语境的学习中,感悟作者独特的言说方式的运用,并理解其中缄默的文化内容。语文课标有一句话,大家都非常熟悉:“阅读是学生的个性化行为”。其实说的就是,选入教材的文章由于不是为某一学生而写,它的表达是不定向的,而是多向的。每一位学生都可以在语境中找到自己所能接受表达的言说方式,确定自己独特的阅读角色意识。
例如《白鹅》一文,对于白鹅的高傲,教师可以设计以下教学环节帮助学生建立体验联系:
这只高傲的白鹅叫声也非同一般,同学们能找到相应的词吗?这只高傲的白鹅,它在叫什么呢?
(课件出示待补充的句子)
凡有生客进来,鹅厉声叫嚣,它在说_________;
凡篱笆外有人经过,鹅引吭大叫,它在说_________。
《白鹅》一文中关于白鹅的“高傲”,这样一种气质、风度,小学生难以理解“高傲”这种见了肃然起敬的内涵,更难以理解一个动物何以高傲。由于学习内容远离学生实际生活,学生缺少相应的言语经验难以理解的时候,语文教师需要还原特定言语出现的语境,尽可能撤除一切与学习材料相隔离的障碍——空间障碍、时间障碍及心理障碍。教师设计这一虚拟语境,引导学生通过想象建立一种意想中的情境,从而产生联想和体验,说出他们对高傲的理解,教师据此或引导、或矫正、或深化认识。
参考文献
[1] 韩雪屏.语文课程的知识内容[J].语文教学通讯,2003(3).
[2] 韩雪屏.语文课程知识初论[M].南京:江苏教育出版社,2011.
[3] 王荣生.语文知识是个什么样的问题?怎样讨论?[J].语文教学通讯:初中刊,2005(4).
[4] 李海林.语文知识:不能再回避的理论问题[J].人民教育,2006(5).
[5] 教育部.义务教育语文课程标准(2011年版)[M].北京:北京师范大学出版集团,2012.
[6] 王建华.语用学与语文教学[M].杭州:浙江大学出版社,2000.
基于文本的读写结合策略探究 篇7
一、积累经典, 内化吸收
纵观苏教版1~6 年级的教材, 其中不乏文质兼美的文章。对于这些文章, 无论从内容、形式或从思想上对学生的语言积累是大有裨益的。加强学生的背诵不失为一种行之有效的积累方法, 这也在课文后面的练习中有所体现。那么, 对于一些课后练习中没有特别提到或者是教师参考书上没有注明的文章, 是不是就可以一读而过呢?显然不是!
如苏教版课文《秦兵马俑》一课, 通过描写秦兵马俑的恢弘气势、惟妙惟肖, 展现了古代人民的智慧。课文中有这样一段话——“每个兵马俑都是极为精美的艺术珍品。仔细端详, 神态各异:有的颔首低眉, 若有所思, 好像在考虑如何相互配合, 战胜敌人;有的目光炯炯, 神态庄重, 好像在暗下决心, 誓为秦国统一天下做殊死拼搏;有的紧握双拳, 好像在听候号角, 待命出征;有的凝视远方, 好像在思念家乡的亲人……走近它们的身旁, 似乎能感受到轻微的呼吸声。”对于这一段话, 课文后的练习并没有明确要求背诵, 但笔者认为需要进行一定的积累。这段话不仅形象准确地描绘了兵马俑的各种不同姿态, 而且运用了总分的写作结构, 其中更不乏观察和想象。这又和本册语文课本上训练学生的观察力和想象力的作文要求不谋而合。当上完这篇课文, 再去写一段对操场上学生活动的场面描写时, 由于学生在头脑中形成了一定的积累基础, 自然而然地就会借用这个段落的表达方式。这样, 既理解了课文, 又训练了表达, 可谓一举多得。
二、灵活摄取, 实际运用
当学生所积累的语文词汇达到一定量时, 是否就意味着一定会形成质变呢?这显然不正确。学生小学毕业时, 按理说词汇的积累量达到了一定的数量, 写一篇600 字的文章应该完全不成问题。可结果往往是不令人满意。看着他们拿着笔拼命地咬笔杆子的时候, 你就会切身体会到写作文对他们来说有多难。拿着他们写的作文, 细细看时, 心中难免有困惑:这几年的语文学哪儿去了?为什么写的和三年级刚入门的时候一样?那些经典的词语、成语、句段都去哪儿了?而当你把词语报出来听写的时候, 他们又能一字不错地默写出来。显然, 他们知道这个词语, 但就是不会用, 这样的词语其实已成了消极词汇了。
笔者曾经看过薛法根老师写的《为言语智能而教》一书。里面提到对《黄山奇松》一课中“饱经风霜”一词的教学探讨。在用这个词语进行造句的时候, 一个班的43 名学生, 几乎造了同样一个句子“农民伯伯饱经风霜的脸上露出了丰收的喜悦”, 连上课的老师一时也“造”不出三个不同的句子来。如果按照应试教育的要求, 这明显过关了, 以后一旦考到这个词语, 学生也不会错, 但是如果等孩子们长大了, 踏上了社会, 特别是在高度发达的地区, 在基本上见不到农田的地区, 这个“饱经风霜”显然也被深深地埋入钢筋混凝土下了。这对他们来说又有什么好处呢?薛老师的方法非常巧妙, 他用了三步:1. 除了农民伯伯的脸是饱经风霜的, 还有谁的脸是饱经风霜的?他是做什么的?除了脸, 这个人的哪些地方看起来也是饱经风霜的?2.农民工、拾荒者饱经风霜, 迎客松饱经风霜, 还有哪些事物看起来也是饱经风霜的?3.除了那些看得见的人、物可以用饱经风霜来形容, 还有什么也可以用饱经风霜来形容?……如此, 学生在教师的指导下, 思路层层打开, “饱经风霜”这个词语的运用范围一下子变得具体了, 学生可以把握了, 用词造句就不再是一件难事了。回到生活中, 我相信孩子们也会不断地用这个词语, 这样的学会才是真正的学会, 对学生行文表达的作用可想而知。
三、情趣炼字、升华提高
在中国几千年的文化发展历程中, 诗歌占了举足轻重的地位。古人能在短短的几十个字中包含自己浓重的个人感情, 可谓每个字都是经过深思熟虑的, 细细地品味每个字就会发现出不同的乐趣。当然要求我们的学生像古人那样做到字斟句酌几乎是不可能的, 但在我们的阅读教学中, 是能够通过文章中某个字的引领, 来激发学生炼字的兴趣的。如在一些文章中, 某个字的恰当运用, 往往就是画龙点睛之笔。
如苏教版五年级上册《在大海中永生》这篇课文中出现了一句看似简单但并非简单的话:“飞机在高空盘旋, 鲜花伴着骨灰, 撒向无垠的大海。大海呜咽, 寒风卷着浪花, 痛悼伟人的离去……”这句话中为什么不用“搅拌”的“拌”而用“陪伴”的“伴”呢?这个“伴”字实际上更多的是表达作者和广大人民对邓小平的怀念和不舍, 用这个字能更好地融入这种感情。通过这种头脑风暴式的训练, 既可以激发学生炼字的兴趣, 也便于学生积累语言, 久而久之, 学生的文笔自然而然就会变得纯净而优美起来。
四、阅读批注、开发思维
在阅读教学中, 有些教师往往不敢放手让学生和文本直接对话, 怕学生会毫无约束地放任思考, 出现和教参背道而驰的情况。其实这种做法是错误的。我们教师仅仅是学生和文本两者之间的“摆渡人”, 只有在学生误解、漏读、浅解的时候, 做些必要的修正, 以增加学生对作者的了解, 如此而已。过度的讲解往往会抹杀学生的个性体验, 消减学生学习的兴趣, 就像“填鸭式”教育那样。而学生一旦离开教师, 就会变得无所适从, 那我们何不现在就适度地放手呢?
如《最后的姿势》一课, 其中有这样一段细节描写:
“忽然, 课桌摇晃起来!整栋楼房都摇晃起来!地震!他意识到情况不妙, 来不及多想, 就大声喊道:‘大家快跑!什么也不要拿!快……’同学们迅速冲出教室, 往操场跑去。
但是, 那短暂的几秒钟, 哪里容得了所有的学生都能跑出去?在教学楼即将坍塌的瞬间, 还有四位同学冲不出去了!谭老师立即将他们拉到课桌底下, 双手撑在课桌上, 用自己的身体护住了四个学生。”
对于这两段内容, 在教学时不同的学生批注了不同的看法:1.这样的瞬间让我终生难忘。2.谭千秋老师真是个恪尽职守、舍己为人的好老师, 我以后也要当这样一个老师。3.第一段中用了很多很多的感叹号, 表明当时的情况非常非常危急, 比大江保卫战那时还要危急。4. 在危急时候, 谭老师不顾自己, 还指挥其他人先走, 更加显示出了他的品质……
学生的思维是多方面的, 有的是从字里行间去体会, 有的是从标点符号去体会, 还有的是设身处地把自己想成了目击者……这样的批注无疑是好的, 学生们的思维是活的, 是向外延伸的, 这不就是阅读理解水平的提高吗?简要的词句也可以对学生进行表达能力的训练。
基于阅读文本的情感体验策略 篇8
一、创设情境, 激发兴趣, 孕育文本情感
兴趣是语文学习的动力。教学实践表明, 在语文阅读课堂教学中, 通过引入媒体创设教学情境, 能够激发学生的学习兴趣, 孕育文本学习的情感。例:一位教师公开教学《林冲棒打洪教头》一文时, 利用电视剧《水浒传》的主题曲———《好汉歌》导入文本, 让学生听歌激情。“上课前, 老师请大家听一首歌。谁知道这是什么歌?你喜欢里面哪一位好汉?什么样的人才叫好汉?” (生自由回答) 师:“我觉得能够在这么多老师和同学面前说出自己的观点, 展示自己风采的人一样是好汉。所以我宣布刚才回答问题的男同学, 老师送你们一个称号———‘须眉’, 刚才回答问题的女同学, 老师也送给你们一个称号———‘巾帼’。”再如, 教学一些描写自然景物的课文, 如《三亚落日》、《瀑布》, 还可通过展示大量图片, 让学生在充分感受瀑布雄伟气势和落日壮美景色的基础上学习新课文。
二、品词析句, 指导诵读, 读出文本情感
优秀的语文课堂充满着情趣与智慧, 而这样的情趣与智慧又必定源自于教者对文本语言的敏锐捕捉与灵活运用。叶圣陶老先生在《语文教学二十韵》中说:“一字未宜忽, 语语司其神。”当前的小学语文教材大部分文质兼美, 词语精炼, 可以说融“景美、境远、情深”为一体。朗读作为阅读教学的重要任务之一, 教者应加强学生朗读, 通过运用正确的语调, 抑扬顿挫的节奏, 快慢合适的速度, 读出文本情感, 感知朗读的规律和技巧。
(1) 以读悟情。例:教学《草原》一文, 可针对文本的自然美、人情美、语言美, 引导学生运用恰当的语调、语速, 有情读文。如, 读“那里的天比别处的天更可爱, 空气是那么清鲜, 天空是那么明朗, 使我总想高歌一曲, 表示我的愉快”一句时, 可着力指导学生从两方面训练朗读:一是要正确地停顿;二是要读出重音。在重音方面, 可突出程度副词“更”、“那么”、“总”。
(2) 以情促读。例:教学《祖国, 我终于回来了》一文, 指导结尾句:他激动地说:“我相信我一定能回到祖国, 现在终于回来了!”时, 教者没有直接地提出具体的朗读技巧, 而是让学生在感悟文本情感的基础上自由把握。生1:“这句话激荡着钱学森当时无比激动和幸福之情, 因此我觉得应该激昂一点”;生2:“这句话应读得深沉些, 因为其中更多地浓缩了钱学森回国时的艰辛”;生3:“我还要补充一点, 这句话里面还蕴含着钱学森对众多国际友人和正义人士的感激之情, 因此还应读得深情些”。……针对诸多学生对文本朗读的多元理解, 教者都作了肯定与评价。
三、巧设问题, 层层追问, 深入体验情感
语文新课程标准明确指出:“语文教学应在师生平等对话的过程中进行。学生是语文学习的主人。”阅读教学的课堂应是一个“动态的平衡系统”, 应作“变化”与“平衡”的统一。如果教学情境变化过快, 就会把教学过程搞得支离破碎。应在平衡的系统之下, 通过层层追问, 诱发学生深层次的思维、情感活动。
例:一位特级教师教学《我和祖父的园子》一文时, 纵观全文, 着重从三大板块方面进行教学: (1) 走进祖父的内心; (2) 倾吐作者的心声; (3) 体会形神的契合, 巧设贯穿全文, 富有针对性的层次性追问, 以此引领学生充分读文悟情, 并最终尝试归纳抒情性散文的阅读策略。
第一层追问:抓住文句“祖父大笑起来, 笑得够了”追问:当辛辛苦苦耕种的谷穗, 被作者割掉之后, 祖父为什么一点不生气, 反而大笑呢?从中体会到这对祖孙俩之间怎样的感情呢? (祖父的慈爱、关系的亲密以及祖父那一颗孩子般的童心)
第二层追问:学完全文。追问:时光如流, 多年后萧红已长大成人, 经历人生的风风雨雨、颠沛流离, 再次回想起唯一关爱自己的祖父, 以及度过快乐童年的园子, 写下了《我和祖父的园子》这篇文章。那么萧红写这篇文章的目的是什么?以及要抒发怎样的情怀呢? (作者的心声:对童年的眷恋、对祖父的感激与怀念)
第三层追问:在此基础上, 继续发问:“对于作者这样的心声, 萧红并没有直接在文章中写出来, 而是间接地蕴藏在哪里呢?你能从中找出来吗?” (此问引导学生深入文本细节, 从字里行间品悟深情:眷恋、感激与怀念)
本节课中, 教者通过三个层次的追问学习, 最后总结归纳出“抒情类散文”的阅读策略要诀:深入关注文本的字里行间, 抓住文章的细节与景物描写, 读懂其中“流淌出的情感”。
四、注重练笔, 强化表达, 促进情感体悟
语文教材中的课文无非是个例子。通过例子的学习, 可引导学生学习作者在遣词造句、内容叙述、感情表达等方面的方法。“随文练笔”作为一种综合性的语言实践形式, 是一项需要学生对文本内容作深度阅读后方能完成的学习任务。可以说, 它是一把促进学生理解文本、体验文本情感的钥匙。如一位教师教学课文《大瀑布的葬礼》时, 在文本的结尾处设计了系列“拓展延伸性”的练笔: (1) 如果你就是菲格雷特总统, 你又会怎么说呢? (2) 如果你是一位大瀑布的游客, 你还想对哪些人说些什么呢?如此拓展练笔, 让我们看到的不仅是充满真情的习作, 更让我们看到的是其丰富的想象力。这其中更有学生“心灵颤动”、情感体悟火花的闪现。
参考文献
基于文本的图片检索系统研究 篇9
关键词:互联网,基于文本的图片检索,相关文本,提取文本
现代科学技术的迅速发展给互联网技术与多媒体技术的发展不断带来新的机遇与挑战, 而图片作为承载重要信息的工具, 其数据规模也在不断壮大。但是面对海量的图片, 我们所常用的检索WEB图片的技术和方法还未得到完善, 图片检索的过程经常会遇到各种问题。这是因为基于文本的图片检索技术未充分考虑到WEB的复杂程度以及影响词条权重的种种因素, 通常只对词条进行组织索引, 并使用固定的模式来提取图片中的文本信息, 导致检索结果以偏概全, 提取效果不尽人意。因此, 应对不同布局的图片要采用不同模式的基于文本的图片检索 (包括图片相关文本的提取) 技术, 充分利用图片名信息, 提高WEB图片的检索率。
1 相关技术
WEB图片检索中提取图片信息的技术主要有基于内容的提取和基于文本的提取两种形式。基于内容的提取技术是通过分析图片本身的像素来提取图片表征的一些特性, 并对图片的这些特性建立相应的索引。如此一来, 用户在检索时, 基于内容的提取技术通过比较检索示例图片的相似度特征来衡量各种图片之间的相似性, 并从中挑选匹配度最高的图片返回给检索的用户。基于文本的信息提取技术则以与图片相关的文字信息为检索重点, 并对这些文本信息建立索引, 在获得用户提供的文本信息后, 利用传统的检索文本信息的技术进行组织和查询, 以提供所要检索的图片。
基于内容的检索技术借鉴文本检索技术, 对带检索的图片通常进行预处理工作, 将图片中的可视化信息包括图片的颜色、纹理和形状等提取出来并建立索引, 利用相关的匹配算法查找图片。基于内容的检索技术最大的特点是它可对图片本身包含的信息进行分析, 而不必费心分析图片来源, 这样就可扩大用于检索图片的领域。
基于文本的检索技术则通过分析互联网上的网络资源, 利用HTML文档工具以获取所要检索图片的相关文本信息。利用启发式规则通过分析HTML中的标记来获取所要检索的图片与文字等, 在对抽象的语义和概念的查询方面有很大的优势, 能够有效提高系统的查准率和查全率, 本文将重点讨论基于文本的检索技术。
2 基于文本的图片检索技术
基于文本的图片检索技术要完成的第一个工作就是确定能够描述图片所要表达意思的相关文本, 当然, 人工确定文本有较高的查准率和查全率, 但是面对每天增加的上百万的海量图片, 人工确定文本显然是不实际的。实际的工作情况是:提取图片所在的HTML文档的文本信息作为相关文本。这就要求网页开发人员仔细分析HTML源文件, 在描述图片区域的语言中寻找有关图片的“相关”信息。
2.1 相关文本的定义
图片的相关文本在图片检索过程中为图片进行“代理”工作, 它是与图片所含意义相关的所有文本信息 (包括文件名、图片URL、周围文本、标签文本、网页标题以及栏目名等) 的组合。
2.2 词条的权重
可反映图片内容的各种相关文本的信息的侧重点都有所不同, 一般来说, 图片锚文字要比HTML页面标题的重要性大得多。因此, 基于文本的图片检索技术要建立新颖的权重模式来衡量各种词条的重要性, 以便使图片检索工作更加快捷、准确。
2.3 为图片建立索引
为了方便检索图片, 通常会为每个图片的所有相关文本 (用集合{Li}表示) 建立一组“属性”, 即O1···Ok, 要做到每个相关文本都相应地有一组包含足够信息的属性值来唯一表示本对象Li。这些属性值就是我们所说的索引向量, 为海量图片资源的相关文本寻找属性值的过程便是为图片建立索引的过程。图片的文本索引要尽量做到能够全面并真实地反映图片相关信息, 支持海量图片信息的查询工作, 建立索引是基于文本的图片检索技术的核心。
2.4 为图片嵌入相关的HTML标记
网页开发的语言多种多样, 而HTML语言则是最常用的, 一般都会采用HTML语言生成最后的可供浏览的网页。因此, 如何准确地为图片嵌入相关的HTML标记具有十分重要的意义。与图片相关的常用的HTML标记大约有5种。分别为字符属性标记……, 网页标题标记
, 网页之间或网页与多媒体之间的导航标记……, 图片嵌入标记
……
。
3 HTML信息的提取方法
HTML信息的提取方法有三种, 包括基于DOM的提取方法、基于字符串的提取方法以及基于Wrapper的提取方法。其中第一种方法中的DOM是用来对网页文档进行解析和操作的一种对象模型, 现在主要应用于XML文档的处理工作中, 早起则为处理HTML文档服务, 它在HTML文档的组织结构以及各个标记之间的关系的了解方面具有更强的优势, 能够更方便地利用结构信息来提取文本信息, 但是这个过程需要耗费大量时间, 效率不高。第二种方法把HTML文档当做顺序字符串, 检索过程要遍历整个文档, 用字符串匹配方法来获取信息。这种方法效率较高, 但是不能准确提取一些依赖于结构的信息。基于Wrapper的提取方法可以帮助用户准确得到结构类型网页中图片的相关文本信息, 提高了处理能力以及系统检索效率。
从HTML页面信息中提取图片相关文本可包括以下几个内容:提取图片的URL、提取图片的文件名 (可从URL中获取) 、提取图片所在网页的URL、提取图片所在网页的标题和图片链接网页的标题、提取图片超链接URL、提取图片所在网页的栏目名以及提取图片标签等。
4 从图片周围文本中提取图片的相关文本
从分布在图片周围 (上下左右) 并与图片内容含义相关联的文本中也可提取图片的相关文本, 一般图片周围的文本是设计人员对图片所添加的说明。
5 提取图片相关文本的启发式方法
WEB图片一般分为装饰页面的图片和无装饰性的图片两类, 在检索前要排除装饰性的图片, 并根据图片以及周围文本复杂的布局情况按照规则模式、图片组模式、视距距离、语法距离以及短文本优先等准则对图片的相关文本进行提取, 每种准则对应不同的“图片—文本”布局:规则模式准则主要应用于图片与周围文本位于表格中的布局模式;而图片组准则适用于一个说明文本对应多个图片的布局模式;视觉距离准则则要求计算视距距离, 把文本信息赋予多个图片之中视距距离最近的图片;语法距离准则应用的前提是两图片视距距离相等, 这时要把文本信息赋予给语法距离最小的图片;在视距距离和语法距离都相等的情况下则要应用短文本优先准则, 短文本的长度不到长文本的1/X时淘汰长文本, 否则将两文本合并并赋予图片。
6 结语
随着计算机网络的迅速发展, 互联网技术得到全球性范围的普及, 有力地推动了信息检索技术的发展。基于文本的图片检索技术要借鉴发展成熟的文本检索技术, 致力于解决图片内容与文本信息相关度不高的问题, 以更省力、有效的方法来提高图片检索的质量, 将基于文本的图片检索技术的检索效果提高到更高档次, 巩固其在图片检索领域的重要地位, 以更高的查准率、查全率为图片检索提供更好的服务。
参考文献
[1]陈佳.与众不同的以"图"找"图"[J].电脑知识与技术-经验技巧, 2010, 34 (1) :45-46
[2]热依玛依.买买提, 维尼拉.木沙江.基于维吾尔文网页的图片相关文本提取技术研究[J].现代计算机 (专业版) , 2010, 12 (9) :76-77
[3]焦蕾, 殷锋社.图像搜索引擎检索模式分析与研究[J].电子设计工程, 2012, 20 (5) :23-24
基于核心素养导向的文本解读 篇10
语文是口头语言与书面语言的合称。语文其职能是培养学生的语用能力。这个语用能力的培养包括两个方面即:第一,词汇、修辞。写作手法等语文知识性的东西,这也是从文章学和语言学角度来看得外部形式。第二,语言在特定情境下的表达,透过这个特定的语言环境去挖掘深层次的人文性,进而潜移默化的影响学生,也就是内部形式。这两者的结合就体现了语文学科工具性与人文性的辩证统一。
长期以来阅读教学占据了语文课堂的半壁江山。在应试教育的背景下,语文成为了考试的工具,至于语文素养、核心素养的实现更是遥不可及。在现代语文教学观下,在语文核心素养的呼唤下,语文阅读教学这一语文课堂的具体实践,如何摆脱传统的知识的传授,如何在文本的学习中由浅入深,如何真正的通过课堂上教师、文本、学生的多元对话,达到语文课程致力于学生“核心素养”的构建,这是值得我们深思的。文本解读的定义是一个文学审美和文学接受的过程,在这个过程中,读者运用自己独特的人生的经历和知识对文本进行诠释和丰富。在语文阅读教学中,文本解读是语文教师上好一节课的基础,有效的文本解读策略,才会真正的有助于学生“核心素养”的构建。
根据语文“核心素养”的提出,我们进一步去探讨文本解读的策略。
第一,语言建构与运用。语言建构与运用是指学生在丰富的语言实践中,通过主动的积累、梳理和整合,逐步掌握祖国语言文字特点及其运用规律,形成个体的言语经验,在具体的语言情境中正确有效地运用祖国语言文字进行交流沟通的能力。根据“核心素养”这一要求,我们在进行文本解读的时候,可以通过文本细读这一策略,抓住关键词语,通过朗读引领学生去品味语言,借此对文本作出深刻,个性化的解析,体味语言运用。以人教版初中语文教材中一篇课文《俗世奇人》为例,这篇课文向我们呈现了两位有着独特性格和技艺的民间高人,其语言特色极具表现力,作者在描述是选用一个微小的视角,通过一件事去表现一个人。这篇文章的语言朴实,但却透露出朴实的语言反衬出两位奇人高超的技艺。我们在解读这篇课文的时候,可以抓住描写两位奇人的关键词语,通过朗读,比较鉴赏培养学生的语用能力。我们在引领学生朗读的时候,可以指导学生有表情的去阅读,通过阅读过程中揣摩和控制语言的气势、节奏、停顿,进而去识别和感悟语言的情感色彩。在引领学生的朗读过程中可以抓住关键词语,利用相近的词语去制造出比较参照,进而使学生感触到语言的“优和劣”、“褒与贬”“轻与重”等,通过品味关键词达到选词知问的效果,从而培养学生的语言感悟能力。
第二,思维发展与提升。思维发展与提升是指学生在语文学习过程中获得的思维能力发展和思维品质的提升。正如爱因斯坦所言:“一个人智力的发展和他形成概念的方法,在很大程度上取决于语言。”通过语文的学习使学生应该能获得对语言和文学形象的直觉体验;能在阅读与鉴赏、表达与交流、梳理与探究活动中运用联想和想象,丰富自己对现实生活和文学形象的感受与理解,丰富自己的经验与语言表达;能够辨识、分析、比较、归纳和概括基本的语言现象和文学形象,并能有依据、有条理的表达自己的观点和发现;能运用基本的语言规律和逻辑规则分析、判别语言,有效地运用口头语言和书面语言与人交流沟通,准确、清晰、生动、有逻辑性地表达自己的认识;提高语言运用的能力和思维的深刻性、灵活性、敏捷性、批判性、独创性。在进行文本解读的时候,我们可以采用的解读策略师批判性的解读。批判性的解读是一种思维的批判,是对文本或别人解读中出现的谬误或与自己的意见不符而作出的批判。例如在人教版高一的语文教材中选了一篇朱自清的散文《荷塘月色》,历来朱自清的散文都被称作是文质兼美的典范,但是人教版高一语文教材在编撰的时候,在课后习题增加了几个作家对朱自清的散文的评价,只有余光中产生称道:“朱自清的散文其实并没有那么好”。在语文的传统教学里,甚至教参中无不称赞朱自清的散文文质兼美。我们知道散文要追求真实性,但是在朱自清笔下,在月光下的荷塘,在他的眼中荷塘的美景竟然呈现的如此淋漓尽致,我们在引导学生进行这篇散文的阅读时,我们是不是需要进行一步去探讨一下这篇散文的语言修辞,而不是仅仅把我们传统意义的解读直接灌输于我们的学生。
第三,审美鉴赏与创造。语文活动是人形成审美体验、发展审美能力的重要途径。在语文学习中,学生是通过阅读鉴赏优秀作品、品味语言艺术而体验丰富情感、激发审美想象、感受思想魅力、领悟人生哲理。从某种意义上来讲语言的运用和表达是审美鉴赏的基础,审美鉴赏也促进了语言的运用和表达。商品经济造就了应试教育,在应试教育背景下,学生们学习急功近利,认为教育其目的便是功利的,甚至很多学生出现了轻视劳动人民,对待穷苦的劳动人民竟然有这样的认识:可怜之人必有可恨之处!我们努力学习的目的就是为了将来不成为他们一样的人。这样可悲的社会现状,造就了我们教育的人文性的缺失,学生缺乏一个正确的审美意识。在这样一种价值观的影响下,透过语言的学习,正确的审美意识的构建成为了必然。我们在利用语文教材这一工具的时候,我们是否想过我们进行文本解读时可以打破教材的编排体系,以正确的人生观、价值观、世界观为导向进行文本的主题性组合解读,通过一个一个鲜明的主题去呼唤我们学生的人性。例如:我们就可以以平凡背后的不平凡为主题进行语文教材课文的解读,以这一主题贯穿单元教学的始终。以人教版八年级上册第二单元为例:这一单元的课文主题是“爱”。总共包括了五篇课文,分别是《阿长与<山海经>》、《背影》、《台阶》、《老王》、《信客》,这几篇文章描写的人物都是小人物,是我们在日常生活中极其容易忽略掉的。这些小人物他们生活在这个社会的底层,很多学生在学习这组课文时候,仅仅只是看到他们不幸的人生,极少人透过他们不幸的人生去探索他们背后的人性的至善美。我们在进行文本解读的时候,可以引领学生去挖掘他们这些平凡人背后的不平凡。例如在教授《阿长与<山海经>》的时候,这样一个生活在最底层的劳动人民,甚至连确切名字都没有的人,在学生眼中是愚昧无知的人,她竟然为了满足鲁迅的读书愿望,为他找来《山海经》。还有这组课文中《老王》,生活在社会最底层,在杨绛笔下的老王的形象是那么的让我们深刻,但是杨绛为什么会对他感到愧怍,在杨绛夫妇受到文化大革命的打压之下,任何人都避之不及,只有老王,这个被人看不起的人,他没有这么去做。我们要引导我们的学生有正确的审美和审丑的意识。那个时代下,有着那个时代的不完美,所以造就了许多人不完美的人生,但是在他们不完美的人生,他们所折射出的人性的光辉是不可泯灭的。我们要引领学生,通过鉴赏品味语言,形成正确的审美意识。
第四,文化传承与理解是指学生在语文学习中,能继承中华优秀传统文化,理解、借鉴不同民族和地区文化的能力;以及在语文学习过程中表现出来的文化视野、文化自觉的意识和文化自信的态度。在进行语文阅读教学时,在语言的学习中,吸收和继承中华优秀的传统文化。我们可以采用文本的解读策略是立足于文化资源,进行课外课内语文资源的整合。例如在教授《马说》,就可以引领学生搜集有关“马”的历史典故、成语、象征意义、谚语、对联等等。通过学习,去研究马的文化。
在语文阅读教学中,基于“核心素养”的构建,需要我们去变革的不仅仅是教师的教,还有学生的学,真正培养符合社会需要和学生实际生存需要的“核心素养”是我们需要不断去探索的。
摘要:近两年来“核心素养”成为了人们热议的话题。语文在基础教育课程中处于一个奠基性的地位。关于教育的基本职能究竟是什么也成为了人们的争论的焦点,本文立足于教育的基本职能是培养学生将来走向社会的学会生存、满足社会发展需要为目标,以核心素养为立足点,试探讨文本解读策略对于学生核心素养培养。
关键词:核心素养,文本解读,阅读教学
参考文献
[1]张娜.关于核心素养的研究和启示[J].教育科学研究,2013.10.
[2]于漪.语文教师的文本解读[J].中小学教材教学,2015.2.
基于“语用”思考的教材文本处理 篇11
一、 进一步明确教材要教什么
基于“学习语言文字运用”理念下的运用教材,就是要将教材中各类文本的教学目标统整到为学生学习语言文字运用这个高度上来,在课堂教学中要以语用为着眼点,从教材文本的语言文字出发,帮助学生在理解课文内容、体验丰富情感、感悟人生智慧的同时,要学会感知课文内容的独特表达形式与方法,体悟词句运用的精妙与准确,形成灵动丰富的语感,逐步提升语文素养。应从学段、学期、单元、课堂四个层面确立综合性教学目标。
1.以“课标”为主导学段为向导,从整体上确立教材运用的学期目标。在教材运用处理中首先当明确“课标”中关于学段目标的要求,要对本学期教材文本中语言文字的价值及学习要点有一个宏观的把控,要能够提取适合学段内容的文本价值,确立学期教学的重点与核心。如同样是写景的课文,在不同学段、不同学期,文本处理的教学价值各不相同。低年级学习《夕阳真美》主要引导学生感受语言的节奏感和韵律美;中年级学习《庐山的云雾》就要指导学生感受“围绕一句话进行表达”的方法;到了高年级学习《三亚落日》时就要感悟作者联想与想象的表达方式,学习把自己的感情倾泻在语言文字之中,要努力做到“内容完整,表达有序,文字有情。”再如,科学小品文的教学在不同学段中处理方法也各异,低年级学习《小松鼠找花生果》时,让学生在充满童趣的文字中进行识字写字,感受语言的形式;到了第二学段,则要引导学生在认知科学知识的同时,了解说明的方法;到了第三学段,不仅要让学生在文字中感受科学
基于的神奇与重要,还要学会运用相关的说明方法进行合理表达,学用结合。
2.以同类训练点为核心确立单元教学目标。在教材安排中,编者总是有意识地将同类的文章排放在一起,这些内容或是共同拥有某种美好的情感,或是呈现相似性格与品性的人物或事物。在同一单元中,这些隐藏在其中的相似点要引起我们的关注,成为教材文本价值解读时不容忽视的重要部分。虽然文本的内容具有某一方面的共同点,但作者在表达方法、结构安排以及遣词用句上都存在着或多或少的差异,这也正能更好地丰富学生的语言文字感知,培养学生语言表达的多元视角。如教学五下《爱如茉莉》《月光启蒙》《我和祖父的园子》这一单元,“爱”是本单元的情感核心,如何表现生活中的“爱”就成为了这一单元教材处理的重点,而不同课文的表达方法和表达特点就应成为重要的学习内容。
3.要注重联系文本特性设计单篇课文教学目标。在学期目标和单元目标的导向下,不同的课文在教学时要体现文本的独特性,寻找属于这一篇课文的独特的结构形式、巧妙的表达方法、丰富的情感展现、蕴含其中的人文价值。如教学《水》一课时,引导学生关注本文的写作特色,即作者用生动的动作神态描写来展现有水时的快乐,并以此反衬缺水时的痛苦,同时采用恰当的比喻来为情感表达增色的写法,在课堂教学中要围绕这一特点着力体现。
4.要借助个性化的表达运用落实课时教学目标。教材的文本语用价值最终体现在帮助学生学会运用语言进行合理准确地表达上。要实现这样的目标只有在平时的每一节课中进行有序安排,扎实训练,发挥每一课的课堂效益。这里的语言表达训练不强求要写完整的一篇文章,哪怕只是学会能准确使用一个词,学会将一句话表达完整,学会借助文本中的结构形式表达一段有序的内容等,这些训练内容的选择要经过教师的仔细琢磨,要充分联系课时教学环节,让学生真真切切、一步一步夯实表达的基石。只有将教材运用的目标清晰设定,教材的文本价值有序提取,学生的语言文字运用能力才能在课堂学习中循序渐进,层层提升。
二、 深一步思考教材要怎么教
确立了合理适度的教学目标,教师在课堂教学中就要注重科学有效的教学方法,要帮助学生借助教材内容进行语言文字表达运用的学习与实践。这里的语言实践不是机械呆板的完成作文,而是在课文学习中有序、有度、有法地进行,要注重循序渐进,将理解内容、感悟情感与习得表达方法进行语言运用层面的结合。
1.要注重将习得的表达方法在同类课文中进行验证。在教学某一类文章时,教师要有意识将同类课文的表达方式进行对照,帮助学生加深对这类文章表达方式的了解,从而形成深刻的印象。如在进行单元复习时,可以采用以下教学策略:(1)整体把握,了解单元课文表达的主题。(2)分篇章体会,提炼文章内在的表达方法。(3)总体吸收,学习运用语言表达形式。如上面提到的“爱”这一单元复习时,首先让学生感知这几篇课文都为了展示“爱”这一美好情感,但作者着眼点不同,选择的事例也就各有特色。所以,在表达时,或是以生活细节(如父母之间平淡无奇的爱就在那执子之手,与之共眠中),以点带面;或是通过记忆犹新的童年经历(如我在祖父的园子里胡闹折腾,而祖父从不呵斥),以情动人;或是用具体可感的事例(如母亲为我唱童谣歌谣,讲神话故事等),以事感人。最后,让学生从这些文章中提取出自己喜欢的写作方法和结构安排,可以借鉴模仿,也可自由发挥,表达自己心中对某一个人的独特情感,效果颇好。
2.开展语用实践要联系学段要求体现层次与梯度。语言文字的运用在不同学段有着不同的教学要求,在具体的课堂教学中指导学生进行语言文字运用的训练也应当体现出层次与梯度,要杜绝拔苗助长,尤其在同类型内容的语言表达上的比较,要让学生逐层深入,不可急功近利。如同样是进行描写人物的表达训练,在第二学段只要学生能够将人物基本的外貌、性格、特点等简单叙述即可,而到了第三学段则要更多地关注人物的语言、动作、神态、心理等细节描写,并可适当加以联想和环境渲染,使语言表达更为丰富精彩。
3.要充分观照学生的表达兴趣。当下的课堂教学中注重学习语言文字运用是对传统教学的一种改革与创新,彰显了语文学科的实践性特征。但是学习语言文字运用不是让学生单纯写作,也不是教师进行概念、技法的讲授。教师要依据学生的年龄特征,注重学生的童心童趣,善于联系学生的学习兴趣点进行巧妙融合,让学生的学习与乐趣相伴,让学生的表达有现实的需求。
4.要巧妙结合习得的语用方法进行有效运用。语言文字的表达灵活多变,相同的内容也会有各不相同的表达形式,因此,在课堂教学中,教师要帮助学生及时总结与回顾学习过的相关方法与内容,要善于在同类型课文或同单元课文学习后,及时整理出具有共性规律的表达方法与表达形式,以此来促进其他相似课文的学习,丰富自我的语言表达素材和习惯,形成扎实的语言文字运用能力。
基于文本的留言本的设计 篇12
随着网络的发展和cn域名的普及, 越来越多的网民利用虚拟主机建设自己的网站, 为了更好地与用户交流, 一般都会提供留言本这一功能。目前留言本以数据库方式为主, 而虚拟主机服务商对于数据库的提供不是免费的, 为了降低费用, 我们利用JSP技术设计了基于文本的留言本, 利用文本文件来保存留言。
2 系统实现
2.1 表单设计
留言本的功能是与用户进行交流, 因此提交留言的表单除了包含姓名、主题、留言内容三个必须填写的内容之外, 还包含电子邮件、QQ号码、个人主页三个选择填写的内容, 这样方便相互之间的交流。而对于留言的发表时间是在提交表单时由提交页面自动生成并保存在文本文件中。表单的必填内容不能为空, 在提交表单时, 利用javascript代码进行检测, 若为空, 提示用户进行输入。
2.2 保存留言
在把留言写入文本文件之前, 首先把从表单中获取的数据进行组织。在组织数据的时候, 要考虑如何组织数据才能在浏览器中更好地显示。虚拟主机的带宽一般是有限的, 因此显示留言的页面要设计的简洁一些。所以对于留言的显示不用表格进行组织, 而是用换行 (<br>标签) 分隔留言中的每一项信息, 用横线 (<hr>标签) 分隔不同的留言信息。在组织数据时, 对于姓名、电子邮件、QQ号码、个人主页、主题和发表时间这六项是一项占据一行, 在获取这六项数据时, 在每一项后面连接一个字符串”<br>”以组合成新的信息, 用于在浏览器显示时进行换行。其中电子邮件、Q Q号码、个人主页三个是选择填写的内容, 用户有可能不填写, 因此需要判断用户是否输入, 只有当用户输入相关的信息才进行数据的组织, 否则不生成相应的数据。对于留言需要单独处理, 留言中的内容可能包含多行文本, 此时要把回车符号用<br>标签代替, 方便显示。
数据组织好之后, 就可以Java的输出流来保存留言到文本文件, 其代码如下:
2.3 显示留言
由于在保存留言时已经把留言的显示格式进行了处理, 因此显示留言数据时只需要利用Java的输入流从文本文件中逐行的读入留言就可以了, 其代码如下:
3 结束语
经过测试, 系统能够很好地工作。但该留言本的功能比较简单, 下一步的工作是继续完善留言本的功能, 增加分页浏览以及管理功能 (如编辑、删除留言等) 。
摘要:随着网络的发展和cn域名的普及, 个人网站得到迅速发展。留言本是个人网站的一个重要的功能之一, 本文利用JSP技术设计了基于文本的留言本, 既可以满足个人网站的需要, 又节省了数据库的费用。
关键词:JSP,文本,留言本
参考文献
[1]吴其庆.JSP网站设计经典教程[M].北京:冶金工业出版社.2001