汉字字形的作用(精选11篇)
汉字字形的作用 篇1
我国现行汉字的楷体和宋体在字形上存在诸多差异, 如宋体“辶、艹”与楷体“辶、艹”在笔形上是有区别的。小学生在最初识读书写的字形是楷体, 如楷体“辶”的第二笔是两折, 楷体“艹”的第三笔是撇, 楷体“日、月、白、目”等字中的横只与左竖相接, 与右竖相离, 等等。但到了小学高年级或初中以后, 他们的教材和相关学习资料转用印刷宋体。随着宋体字形的出现, 教学过程中常常会碰到印刷字形与实际教写的字形有差别, 起初学生惊呼错字, 大多数老师不知其所以然, 只是告诉学生这是手写和印刷的区别;对外汉语教师在对外国留学生的识字教学中也遇到同样的问题。对现行汉字宋体和楷体字形存在差异的类型和数量, 语文教师都很茫然, 识字教学缺乏系统性、指导性。宋体楷体字形的不一致给学生识字增加了难度, 也给语文教师的识字教学带来一些难题。教师如何做好宋体、楷体之间的衔接, 如何处理宋体、楷体之间以及宋体、楷体内部的不一致, 是语文教师颇感困惑的问题。
有鉴于此, 笔者以河北教育出版社 (简称冀教版, 字种比人教版课本多, 故以此为对象做穷尽性的调查统计) 的小学语文教材为调查对象, 将1-12册课后生字表的会写、会认字一一录入, 去除重复字样, 共得字种2775, 经过宋体楷体字形的一一对比, 其中1639字的宋体和楷体字形的笔形、结构等完全相同, 占总字种59%;其余1136字的宋体楷体字形有细微差别, 占总字种41%。这些字形差别主要表现在两个方面:笔形、笔画交接关系。
冀教版中有536字的宋体、楷体字形存在笔形差异, 可以归纳为八类 (半字线“-”前为宋体后为楷体, 字量超出20个的仅举出部分字例, 以便对照分析) :
1.宋体是横折, 楷体是横折折折, 分布在以“辶-辶”为构件的字里, 差别在第二笔, 共63字。如:这-这、达-达、道-道、过-过、近-近、远-远、谜-谜、腿-腿、逊-逊、随-随。
2.宋体写为竖, 楷体写为撇, 分布在以“艹-艹”为构件的字里, 差别主要在第三笔, 共127字。如:苗-苗、花-花、莲-莲、猫-猫、散-散、灌-灌、苟-苟、敬-敬、蔑-蔑、满-满;另有8字的“艹”位于中间部位:垂-垂、锤-锤、捶-捶、睡-睡、唾-唾、愤-愤、喷-喷、宽-宽。
3.宋体提起笔出折, 楷体为提, 分布在以“氵-氵”和“冫-冫”为构件的字里, 差别都在末笔, 共150字。如:澳-澳、江-江、波-波、泪-泪、流-流、深-深, 冰-冰、冲-冲、准-准、资-资。
4.宋体为竖折横折钩, 楷体为弯钩, 分布在“心-心”以及以之为构件的字里, 差别在第二笔, 共46字。如:心-心、必-必、愁-愁、忽-忽、想-想、愿-愿、感-感、闷-闷、秘-秘、蜜-蜜。
5.宋体为撇点, 楷体为侧点, 分布在“火-火”以及以之为构件的字里, 差别在首笔, 共38字。如:火-火、炎-炎、伙-伙、焚-焚、灯-灯、秋-秋、烧-烧、灾-灾、盔-盔、炭-炭。
6.宋体为横, 楷体为点, 分布在以“雨”为上部件的字里。单字“雨-雨”的宋体楷体字形一致, 但雨作上部件时, 宋体将中间的四点写为四短横, 楷体写为点, 共15字, 如:霸-霸、雷-雷、雹-雹、蕾-蕾、零-零、露-露、霉-霉、霎-霎、霜-霜、雾-雾、霞-霞、需-需、雪-雪、震-震。雨做下部件时, 宋体楷体都将中间写为点, 如漏-漏。
7.宋体为短撇, 楷体为点, 分布在以“小-小、少-少、示-示、系-系、东-东”以及以之为构件的字里和以“尗”、“朩”、“”为构件的字里, 差别在左侧, 共68字。如:小-小、京-京、尘-尘, 少-少、抄-抄、劣-劣、雀-雀、步-步, 示-示、标-标、宗-宗, 系-系、累-累、繁-繁, 东-东、陈-陈, 叔-叔、寂-寂, 杀-杀、茶-茶、杂-杂、亲-亲、涤-涤、余-余, 恋-恋、弯-弯, 赤-赤。
8.宋体为横, 楷体为提, 分布在以“舟、丰、半、辛、手、王”为左部件的字里, 共30字。单字“舟-舟”宋体楷体字形一致, 但作左部件时, 宋体的中横右不出头, 楷体将中横变提右出头, 共12字, 如:般-般、船-船、搬-搬、舷-舷、舶-舶、舱-舱、舵-舵、航-航、舰-舰、艘-艘、艇-艇、舷-舷。单字“丰、半、辛、手、王”的宋体楷体字形相同, 但作左部件时, 楷体将下端的横变提, 共18字, 如:艳-艳, 邦-邦、帮-帮、绑-绑、梆-梆、慧-慧、契-契, 判-判、叛-叛, 瓣-瓣、辫-辫、辩-辩、辨-辨、辣-辣, 拜-拜、湃-湃, 琴-琴、瑟-瑟。
冀教版中有723字的宋体、楷体字形存在笔画交接关系差异, 有两种形式:
1.包围或半包围结构中的横, 宋体是与左右竖相接, 楷体是与左竖相接与右竖相离, 如:日-日、暗-暗、曰-曰、最-最、白-白、柏-柏、自-自、息-息、目-目、看-看、月-月、朋-朋、且-且、助-助、直-直、值-值、真-真、填-填、具-具、惧-惧、其-其、棋-棋、耳-耳、敢-敢、身-身、射-射、甘-甘、甜-甜、县-县、悬-悬、良-良、粮-粮、朗-朗、艮-艮、很-很、即-即、面-面, 共473字。
2.包围或半包围结构中间的横, 宋体是与左右竖相接, 楷体是与左右竖相离, 如:甲-甲、闸-闸、酬-酬 (酉-酉) 、扁-扁、遍-遍、角-角、解-解、由-由、庙-庙、申-申、神-神、曹-曹、遭-遭、再-再、惠-惠、禺-禺、偶-偶、用-用、庸-庸、涌-涌、更-更、硬-硬、电-电、掩-掩、绳-绳、田-田、备-备、鱼-鱼、鲁-鲁、里-里、重-重、单-单、弹-弹、甫-甫、博-博、果-果、课-课、鬼-鬼、魂-魂、曲-曲、典-典、演-演、那-那、谁-谁、准-准、当-当、录-录, 共250字。
宋体、楷体笔形和笔画交接关系差异涉及到1259字次, 比1136字多出123字次, 这是因为有些字存在多个差异点统计多次, 如“腿”存在三个区别点就统计三次。这些差异点基本涵盖了我国现行汉字宋体和楷体字形存在的差异, 这些差异随着学习的深入提高, 对阅读基本不造成障碍, 但对初学者而言, 要经过从楷体到宋体字形的过渡阶段, 如小学和初中老师都说考试中如果“辶”的第二笔没有折就算错别字, 而对楷体字形的笔画交接关系小学生需要将473字与250字 (冀教版小学语文教材) 的书写区别开来, 这未免太琐碎了。有鉴于此, 特向语文教师和对外汉语教师提出一些参考建议:
第一, 对于宋体、楷体的笔形差异, 老师可在学生掌握了一定量的汉字后 (小学三年级以后) , 根据文字出现的先后顺序逐项归纳总结以上八类笔形差异, 有效沟通宋体、楷体字形, 这样可以使学生在今后的识字用字中收到以简驭繁的效果。
第二, 对宋体、楷体笔画交接关系的两种差异现象, 总结它们笔画交接差异的规律, 同样可以起到以简驭繁的效果。这两类字的区别是包围或半包围结构中有无竖笔, 第一类无竖笔, 第二类有竖笔。其实还有第三类情况:包围或半包围结构中的“横”与边框都相离, 楷体和宋体字形相同, 如:固-固、国-国、困-困、因-因、内-内、区-区、凿-凿、南-南, 这类字中间部件多可以切分出下位部件, 前两类是不能再做切分的。这三类字中“横”与左右边框的相接相离都没有区别字义的作用, 属于纯书法技巧问题。教师可以从书法美学的角度阐述书写的要领, 不必做出鲜明严格的书写要求。
第三, 对宋体、楷体的字形差异应持统一的标准, 保留书写一定的自由度。调查中发现, 多数语文老师对“辶”有严格要求, 而对其他的笔形差异和笔画交接差异不做严格要求, 如对“心”写为卧钩“”或竖弯钩“乚”不做硬性要求, “日月田甲”中横的相接相离关系更是忽略不计。标准的不统一往往造成汉字驳杂繁难的印象, 不利于教学的高效性。我国现行汉字宋体、楷体字形存在不一致是客观现象, 这样的差别基本不影响阅读, 所以在书写上应给予一定的自由度, 如“辶”第二笔是否折笔或折笔明显与否不能判定为错字。建议对现行汉字宋体、楷体字形差异持宽容的态度, 在实际运用中实现字符的优选优化, 这也符合汉字字形发展演变的规律。
概括总结宋体、楷体字形差异的类别和规律, 以便教师对现行汉字宋体、楷体字形的不一致之处了然于心, 从而在教学中采取相应的对策来指导学生成批成系统地识读、书写汉字。
摘要:现行汉字的楷体和宋体字形存在一些不一致之处, 小学基础教育近3000字中约有40%的字形存在宋体和楷体字形的差异, 主要表现在两个方面:笔形、笔画交接关系。这些差异随着学习的深入提高, 对阅读基本不造成障碍, 但对初学者而言, 要经过从楷体到宋体字形的过渡阶段。本文在梳理宋体楷体字形差异的基础上对语文教师和对外汉语教师的识字教学提出一些参考建议, 也希望能对当前的汉字字形整理工作提供一定的参考。
关键词:汉字,宋体,楷体,字形
汉字字形的作用 篇2
汉字字形加工的关键特征模型
现有的汉字识别模型对汉字的字形加工过程并没有达成共识.争论的焦点是汉字识别中的字形加工究竟是特征分析还是整字加工占优势.汉字字形加工中采用的是任务引导的`识别策略,汉字字形加工的关键特征验证模型包括了汉字字形加工过程中的自上而下和自下而上两种信息加工,强调识别过程中根据字形的关键特征的验证.
作 者:管益杰 李燕芳 宋艳 Guan Yijie Li Yanfang Song Yan 作者单位:管益杰,宋艳,Guan Yijie,Song Yan(北京师范大学认知神经科学与学习国家重点实验室,北京,100875)李燕芳,Li Yanfang(北京师范大学认知神经科学与学习研究所,北京,100875)
刊 名:山东师范大学学报(人文社会科学版) PKU英文刊名:JOURNAL OF SHANDONG NORMAL UNIVERSITY(HUMANITIES AND SOCIAL SCIENCES) 年,卷(期):2006 51(2) 分类号:B84 关键词:汉字识别 字形加工 关键特征汉字字形的作用 篇3
关键词:网格模型;规整化处理;手写汉字
中图分类号:TP391文献标识码:A文章编号:1007-9599 (2011) 05-0000-01
Grid Structured Treatment Key Steps of Chinese Characters
Zheng Jun
(InnerMongolia Baotou Teachers College,Information Science and Technology Institute,Baotou014030,China)
Abstract:Grid model of Chinese characters established is very important.This paper introduces the Chinese characters grid model established steps and the involved algorithms.
Keywords:Grid model;Structured treatment;Handwritten Chinese
一、引言
汉字造型、汉字结构等形状信息是汉字的表现形式,通过这些形状信息我们可以区分出不同的汉字。汉字字形特征比对计算,汉字字形结构进行统计分析[1]是汉字进行信息化处理的基础。而这些方面的处理都需要把汉字规范到统一的模型下。本文针对这一问题,主要介绍对使用鼠标手工输入的汉字字形进行规整处理的步骤与方法。
二、网格规整处理的实现步骤
(一)手写字形大小的网格规整处理
通过鼠标输入的手写汉字字形,其大小是不统一的。这个步骤就是要统一输入的汉字到合适大小,为后面的处理做准备。经过这一步骤的处理,可以得到一个大小与位置合适的手写汉字字形。
(二)单笔画的起止特征信息的提取
这里所指的笔画是指使用鼠标描绘汉字时从按下鼠标到松开鼠标其间所绘制出的一条曲线。单个笔画信息主要有:端点位置信息、笔画方向信息、笔画长度信息。
(三)笔画之间关联信息的检测和识别
使用鼠标手工输入汉字的各个笔画之间不是孤立的,各笔画之间有位置关系。汉字笔画之间的位置关系是汉字的一个特征,直接影响到汉字的呈现效果,这些位置关系对于准确区分汉字是非常重要的。对汉字字形笔画之间关联信息的检测和识别,主要是要检测和识别出连接点和滑动点。连接点是指:两个不同笔画之间的端点的距离特别小,在网格规整后,这两个点必须要连接在一起的点。滑动点是指:一条笔画的某个端点到另一条笔画中部的距离特别小,在网格规整后,必须仍然要保持这样的位置关系。例如:“刀”与“力”这两个字如果不能很好地处理“丿”与“”的位置关系,就不能准确的定义这两个汉字。“刀”字中“丿”与“”的位置关系是滑动点的位置关系。
(四)简单笔画和复杂笔画的识别及处理
简单笔画是指只需要用起点和终点两个点就可以描述的笔画。复杂笔画是指只除了使用起点和终点,还需要用起点和终点之间的其它点才能描述的笔画。利用Douglas—Peucker算法[2]对笔画提取特征点可以区分这两种笔画。这种算法的基本思路是:对每一条曲线的首末两点虚连一条直线,求其间所有点到直线的距离,并找到最大距离值dmax,用dmax与限差D相比:
若dmax
(五)笔画方向的网格规整处理
在网格线中每条网格线都有固定的方向,其情况是可以列举出的。要想把手写汉字笔画规整到网格线上,首先就必须把手写汉字的方向映射成网格线的方向。这里采用正弦与余弦定理来解决这个问题。在简单笔画数组中拿出一条简单笔画,取出这条笔画的正弦值sin与余弦值cos,如果cos的绝对值小于等于10-3,那么就把方向值规整成这样的值:cos=0,sin=sin/|sin|;如果cos的绝对值大于10-3那么进行下面的规整处理:
通过公式|sin/cos|求出正切值tan,如果tan<1/4,那么方向规整的结果是:sin=0,cos=cos/|cos|;如果1/4<=tan<3/4,那么方向规整的结果是:sin=(sin/|sin|)*0.5/(0.52+12)1/2,cos=(cos/|cos|)*1/(0.52+12)1/2;如果3/4<=tan<4/3,那么方向规整的结果是:sin=(sin/|sin|)*1/(12+12)1/2,cos=(cos/|cos|)*1/(12+12)1/2;如果4/3<=tan<4,那么方向规整的结果是:sin=(sin/|sin|)*1/(0.52+12)1/2,cos=(cos/|cos|)*0.5/(0.52+12)1/2;如果4<=tan,那么方向规整的结果是:sin=(sin/|sin|),cos=0。
(六)笔画点位置的网格规整处理
在这一步将要做的工作是将各个端点以及特征点规整到网格线上的网格点上。这一步主要采用了四舍五入的近似算法。把点规整到最靠近的网格上。
(七)特殊笔画的规整处理
在进行网格规整处理时发现还有一些特殊的笔画需要拿出来单独进行处理。它们分别是:
双端点滑动笔画:如果一个简单笔画的两个端点都是滑动点,那么这个笔画就叫双端点滑动笔画。
单端点滑动笔画:如果一个简单笔画只有一个端点是滑动点,那么这个笔画就叫单端点滑动笔画。
可增长笔画:如果一个简单笔画的两个端点都具有连接点的性质,那么这个笔画就是可增长笔画。
双性质笔画:如果一个简单笔画的一个端点既有滑动点的性质,又有连接点的性质,那么这个笔画就是双性质笔画。
三、结束语
以上处理步骤和算法均已在Windows XP环境下编程实现,并调试通过。实验表明,经过以上步骤,最终能够完成手写汉字字形的网格规整处理。其实现结果是令人满意。
参考文献:
[1]汉字部件规范研制组.关于制定汉字部件规范的若干问题[N].计算机世界,1998,15:1-6
[2]王净,江刚武,管华.增强型道格拉斯—普克压缩算法的设计与实现[J].北京测绘,2002,3:13-16
浅谈汉字字形基本知识的学习 篇4
对外汉字教学方法可以是多种多样的,目前教学届比较多采用的有先语后文、语文并进、拼音文字交叉出现、字本位、语文双规[1]。就我个人而言,我更倾向于语文双规的教学模式,单独设立读写课,从汉字入手,逐步过渡到读写技能的训练。
一.学习汉字基本知识的必要性
汉字读写技能的掌握虽然难,但并不是完全学不会的。心理学上认为“技能的形成是以知识的掌握为基础的”,所以,我们不能忽视对外汉字教学中的基础知识教学。
如果留学生不首先具备汉字笔画书写、汉字笔顺知识,没有人多次反复强调汉字的结构特点和构成规则的话,要想很快的读写汉字基本上是不可能的。分析汉字的各个基本笔画发现汉字的基本笔画,但是每个基本笔画又有很多不同的变体,如果混淆会使汉字字形字义都发生变化,如“升”和“开”之间就是“平撇”和“横”的区别。汉字的结构关系更为复杂,基本结构有五种,但是具体到每种结构中又有很多变体,比如上下结构,有上小下大型的,如“安”,也有上大下小型的,如“熟”,还有上下相等的,如“尖”。所以说,对于汉字笔画、笔顺、结构等基本知识的系统学习是必须的也是必要的,否则撇开知识学习单谈汉字读写技能的学习就像“空中楼阁”一样是不切合实际的,是违背认知规律的。
我们中国人学习汉字也是先从笔画入手,从结构着眼,以字形区分汉字字义。没有汉字知识做基础,留学生在开始学习之初的很长一段时间里都会认为这种方块汉字就像一幅幅图画,笔画复杂多变毫无规律可循,面对一个个汉字始终无从下手,找不到落笔的地方,只能盲目地描画这些汉字。机械的模仿毫无兴趣可言,时间长了很有可能会有一些学生索性放弃了汉字学习,只求能听懂会说,结果,这些学生就此成了“文盲”,上课只能靠汉语拼音。这样,不仅读写技能受到影响,而且也影响到听说能力的继续深造和提高。因此,汉字的学习应该先从汉字的基本知识学起。
二.汉字的基本知识
汉字的基本知识主要包括汉字笔画、部件、结构和笔顺。学生学习汉字的基本知识一般是在语音阶段结束以后,汉语知识积累的并不多,所以汉字的基本知识的讲解要注意结合学生的认知规律、心理特征,化繁为简,尽量用直观的方式来展示汉字的基本知识。
1.笔画。汉字的最基本、最小的构成单位是笔画,笔画知识对认字写字都起着重要的作用。汉字的基本笔画有五种,“横、竖、点、撇、折”[2],但为了方便教学,可以汉字笔画先分为两类:基本笔画和复合笔画。从基本笔画的教学入手,进而掌握复合笔画。教师单独设置课时、集中讲授笔画的基本知识,可以帮助学习者认识到汉字都是由基本笔画组成的,而不是毫无规律可循,简单堆砌的符号,既让学习者减轻了学习汉字的心理负担、也为日后部件与整字的教学打下良好的基础。
2.部件。部件是由笔画组成的具有组配汉字功能的构字单位,有的部件能独立成字,有的则只能和其他部件组合成字。在我们的汉字部件教学中,只要求学生熟练掌握118个基本部件[3],这是整个汉字学习的基本功。这些部件,无论是形式还是意义都很简单、浅显,为学习者初学汉字减小了难度。学习者熟练掌握了这些基本部件的书写之后,再去学习其它较为繁难的部件及汉字,就会熟能生巧,举一反三。要让学生在汉字学习的最初阶段就写像“她”“哪”“宿”“谢”“馆”这样的汉字,无疑是相当困难的。而要是部件结构教学中进行了基本部件“女、口、宀、讠、饣”等的训练后,再来学写这些汉字就会容易的多。
3.结构。学习者在学习汉字之前先了解以下汉字结构方面的知识将有助于他们的汉字学习,因为汉字的布局讲究对称,讲究偏旁部件的层层组合。汉字的结构大致包括8种基本形式:左右结构(明)、左中右结构(街)、上下结构(早)、上中下结构(器)、全包围结构(国)、半包围结构(区)、品字形结构(晶)、对称结构(爽)。
4.笔顺。笔顺是基于汉字以一种最为简练、平衡、连续、快速、美观的方式写成而形成的,错误的笔顺不但会使学习者写出的字容易错漏百出,更会使汉字在错误的笔顺下失去汉字原来的理据意义,而不容易让学生感觉出汉字的构字规律。汉字的笔顺即笔画书写的先后顺序,汉字的笔顺规则主要有以下几点:先横后竖(十)、先撇后捺(人)、从上到下(二)、从左到右(川)、从外到内(月)、从外到内后封口(国)、先中间后两边(小)。有些笔顺会影响到学生对汉字结构的把握,比如半包围的结构“过”,应该先写被包围部分,即“寸”,后写“辶”,如果先写“辶”,容易写成左右结构。
三.汉字基本知识的教学方法
1.熟悉概念,形成图式。奥苏泊尔认为,学生原有的认知结构中是否具有与新知识挂钩、对新知识起固定作用的观念对学习的效果起着重要作用[4]。为了让学生对汉字有一个整体的、清晰地认知,我们需要通过学习汉字基本知识,帮助学生熟悉概念,形成有关汉字的基本图式。在初级阶段学习者的教学初期,老师可以在黑板上一笔一画地教写汉字,让学生在头脑中形成笔画、部件、笔顺的概念,并内化为自己知识框架中的一部分,作为心理工具来指引之后对汉字的认读和书写。
要把笔画、部件组合成整字,是有特定的布局规则的,这个规则就是汉字的结构。汉字结构对应着心理学的“图式”概念,心理学家普遍认为图式对于信息的储存提取起到组织作用。因此,在合体字学习初期,可以通过汉字结构图形帮助学生分析和记忆。如下:
2.结合例证,建立字感。随着学生笔画知识的积累,可以根据学生学过的笔画,把笔画组成简单的例字,让学生练习笔画在汉字中的位置和书写,如一横一竖可以组成“十”,两横一竖可以组成“干、土、士”等,一撇一捺可以组成“人、入”等,既能练习笔画、也能逐渐掌握一些简单的汉字,有利于汉字字感的形成。教师还可以用学生学过的简单汉字来设计教学,请学生补上缺少的笔画,或增加笔画、或变化其中的一笔,变成自己认识的汉字,如学生在学过“日”“旦”“田”后可以给学生“口”字,请他们增加一笔变成一个汉字。学生学习笔画就是接受汉字书写习惯训练的开始,当他们知道竖应该是从上往下写,横应该是从左往右写,就是学生的汉字字感在逐渐建立。
3.反复练习,强化记忆。教师在课堂上的讲解属于短时记忆。短时记忆容量小、储存时间短,学生容易记住的同时也容易忘记。保持记忆的最有效方式是使短时记忆转化为长时记忆,就要依靠知识的反复刺激,在平时反复出现、学生反复辨认和应用。从心理学的生理层面来看就是,让传递信息的神经元之间的突触有紧密而频繁的联系,这样就可以在大脑皮层上刻下深深的痕迹,留下深刻印象,以后需要用到这些知识时就能提取出来加以应用。
在学生掌握了一些字音字义简单常用的部件、独体字后,进行笔画、部件的强化训练。比如一、十、氵、天等为例,要求熟练说出各笔画的名称以及书写顺序。而对于合体字,还要要求学生说出汉字的结构类型,如“红”,可以描述为“左右结构,纟旁在左边,工字在右边”。在强化训练之前,教师最好先做一些示范性的练习,一边写汉字,一边说出各个笔画的名称数学顺序,让学生在反复的练习中形成习惯。
四.结论
外国学生书写汉字时最容易犯的毛病就是笔画增损,部件错置只认轮廓,不辨细微。其病根就是开始阶段的笔画、部件、结构、笔顺这些组合汉字的基本零件和规则没掌握好。这一阶段为汉字教学的初期,看似简单,但是其中所包含的内容繁杂,术语多,又颇为枯燥,在实际操作中还有很多问题有待发掘。本文提到的几个教学方法可以同时交叉进行,在不同的汉语教学阶段,有侧重地、逐步地进行,当然也要考虑学生的汉语水平,以及学生们的文化知识年龄。
参考文献
[1]张和生.汉语可以这样教—语言要素篇[M].商务印书馆,第115-142页.
[2]刘珣.对外汉语教育学引论[M].北京语言大学出版社,第159页.
[3]蒋可心.对外汉语教学法研究[M].黑龙江教育出版社.第170-172页.
[4]黄伯荣,廖序东.现代汉语(增订三版)[M].高等教育出版社.第179-188页.
[5]徐子亮.对外汉语教学心理学[M].华东师范大学出版社.第137-149页.
汉字字形的作用 篇5
二、识记现代汉字的字形
一、考点总结
探究出现错别字的原因
出现错别字的原因:绝大多数多是由于缺乏一丝不苟的态度,以致形成多笔、少笔、改笔、替换而致错的。
错字主要错在增、减笔画上:
不应增加
一点的字:庄纸荒浇含步染贪
一横的字:易策惕壶县昨考
一竖的字:喉统叔假贼
一撇的字:武展序畏预幻丧
不应减少
一点的字:诉添初省蔑梁
一横的字:束拜气盼承慎威
一撇的字:或幼矛究戒柳
出现别字的主要原因有:①形近致错,②音近易误,③形、音相近致别,④随意简化字致别,⑤意义相近而致别。
①形近致错。 如“病入膏肓”别为“病入膏盲”;“为虎作伥”别为“为虎作怅”;“暴戾恣睢”别为“暴戾恣雎” 。
[练习1]改正下列短语中的错别字:
中流抵柱 飞扬拔扈 民生凋敞 精神焕散 张驰有度 工程峻工
②音近易误。如“振奋”别为“振愤” ;“迫不及待”别为“迫不急待”;“英雄辈出”别为“英雄倍出”
[练习2]改正下列短语中的错别字:
世外桃园 残无人道 搬门弄斧 墨守陈规 纠纠武夫
③形、音相近致别。 如“虎视眈眈”的“眈”别为“耽”;“心灰意冷”的“灰”别为“恢”;“肆无忌惮”的“惮”别为“弹”。
[练习3]改正下列短语中的错别字:
明辩是非 言简意垓 规规距距 豪迈气慨 龙盘虎据 滥芋充数
④随意简化字致别。如“蓝天白云”的“蓝”别为“兰”;“入不敷出”的“敷”别为“付”;“惨绝人寰”的“寰”别为“环” 。
[练习4]改正下列短语中的.错别字:
褒贬时敝 面面具到 书写了草 混肴乾坤 史无前列 免强答应
⑤意义相近而致别。 如“清澈见底”的“澈”别为“彻”;“浪费金钱”的“费”别为“废” ;“漠不关心”的“漠”别为“寞” 。
[练习5] 改正下列各短语中的错别字:
巧装打扮 一口同声 前倨后躬 梳装穿戴 歪风斜气 出奇致胜
二、复习注意
1、仔细认真,比较细微差别。注意纠正马虎大意的认读书写的毛病,重视汉字的正确书写。如“己”、“已”、“巳”;“戊”、“戌”“戍”。
2、重点掌握常用字中的同音(近音)字、形近字和容易弄错的成语用字。
3、集中形似字,分析字形结构。把形似字集中,加以比较,找出各自的笔画特点,帮助记忆汉字的字形。
4、把握汉字音、形、义的关系,了解汉字中蕴含的文化传统。特别要结合造字法来理解和记忆。
(1)加强意义识记。如“脉搏”的“搏”,常同“博”混淆,“脉搏”指血脉跳动,是一个动作场景;“搏”有“搏动、跳动”义,而“博”则是博取、赌博等义。再如“融会贯通”,意为“参合多方面道理进行体会而得到全面透彻的领悟”,“融”有“融合”义,“会”应有“体会”、“理解”、“懂得”义,“会”就不会错为“汇聚”的“汇”了。
(2)加强形旁识记。汉字中有80%是形声字,而形旁是表义的,这就可据形推义,由义辨字。如“讴、呕、沤”,“讴歌”的“讴”字,“讠”旁表示该字与语言有关,“讴歌”当然要用语言,必须写作“讴”;“呕”的形旁是“口”,“呕吐”“呕心沥血”必须是“呕”;“沤”形旁是“氵”,表明与水有关,“沤肥”属此。
(3)探索词源识记。如“针砭”的“砭”是中医治病的石针,不能为“贬”,“名列前茅”,“茅”,古时楚国行军时走在前面的军士均持茅草。
5、正确运用排除法。
三、考查重点
1.词语(包括成语)中写错的字
例题① 下列各组词语中,没有错别字的一项是
A.相形见绌 暗然消魂 吉详 掂量
B.火中取粟 墨守成规 陷井 追溯
C.戮力同心 矫揉造作 博览 提要
D.插科打浑 委曲求全 证券 换散
2.句子中的错别字
例题② 下面句子中,有两个错别字的一句是
A.虽然百灵鸟不见踪影,但有多少暄闹而美丽的鸟儿路过这儿,在河边栖息和休憩。
B.这只是一个长方形的土堆而已,无人守护,无人管理,只有几株大树荫敝。
C.他的深刻的思想时时散发出犀利的光采,说话时态度镇静,亲切而从容,使听的人心情舒畅。
D.《ブ战》中的秦穆公,始而刚腹自用,一意孤行,经过战败教训,终能引疚自责,宽厚待人。
四、解题技巧
(一)音辨法 即通过朗读该词,发现词中字的书写错误。
例如:(1)缀学 [“辍学”的“辍”音 ,“缀”音 ]
(2)惦量 [“掂量”的“掂”音 ,“惦”音 ]
(3)无耻滥言 [“无耻谰言”的“谰”音 ,“滥”音 ]
(4)赎于职守 [“渎于职守”的“渎”音 ,“赎”音 ]
(5)切腹之痛 [“切肤之痛”的“肤”音 ,“腹”音 ]
(二)形辨法 在我国汉字中,形声字占80%以上,其形旁为我们领悟词义辨析字形提供了有利条件。
例如:(1)眼花潦乱 [“缭”是指丝织品的缠绕]
(2)插科打浑 [“诨”跟言语有关]
(3)国藉 [“籍”古代书写常用竹简]
(4)寒喧 [“暄”跟太阳有关]
(5)风弛电掣 [“驰”快跑(多指车马)]
(三)义辨法 即通过掌握、分析词语的意义来辨析字的书写是否正确。俗话说“字不离词、词不离句、句不离篇”。在理解词语含义的基础上去掌握字形,更不易出错。
例如:(1)一愁莫展 [“筹”本义是指“竹木或象牙等制成的小棍儿或小片儿,主要是用来计数或作为领取物品的凭证”。引申为“计策”“办法”,“一筹莫展”即一个办法也想不出。]
(2)不径而走 [“胫”是“小腿”,“不胫而走”指没有腿却能跑,形容传布迅速。]
(3)针贬时弊 [“砭”是指古代治病的石头针,“针砭”比喻发现或指出错误。]
(4)誓不两立 [“势”是指情势。]
(5)功亏一匮 [“篑”是盛土的筐。]
(四)结构辨析法 即借助词语(特别是成语)语法结构、词义对应来判断字形书写是否正确。
例如:(1)人情事故 [“事”应改为“世”,因为“情”“故”对应,“人”“世”对应,意思是为人处世的道理。]
(2)惹事生非 [“事”应改为“是”,因为“惹”“生”对应,“是”“非”对应(没有“事”“非”对应的)]
(3)嘻笑怒骂 [“嘻”应改为“嬉”,我们可看出“笑”“怒”“骂”均为动词,从词语的结构对应的角度可判断前边不应该是可作叹词或象声词的“嘻”,而应该是可作动词的“嬉”。]
(4)仗义直言 [“直”应该为“执”,这个成语由两个动宾短语“仗义”和“执言”组成,而不是由一个动宾短语“仗义”、一个偏正短语“直言”组成。]
五、能力训练
1.选出书写有错误的一组
A.睚眦必报 叱咤风云 呕心沥血 犯而不校
B.万籁俱静 秋行夏令 毛骨悚然 奸狡诡谲
C.言简意赅 晶萦玲珑 泽被后世 哗众取宠
D.完璧归赵 刎颈之交 破釜沉舟 青出于蓝、
2.选出书写完全正确的一组
A.斑剥陆离 肆无忌惮 再所不惜 惝恍迷离
B.腾挪跌宕 凤毛鳞角 汗牛充栋 人心唯危
C.百无聊赖 煞废苦心 繁冗拖沓 从容不迫
D.面面相觑 恬退隐忍 臻于郅治 折衷是非
3.选出书写完全正确的一组
A.觥筹交错 鞭长莫及 明眸善睐 脍炙人口
B.雕章琢句 潜移默化 长篇累牍 云蒸霞尉
C.荒诞不精 孽根祸种 风弛电掣 殒身不恤
D.素昧平生 怡笑大方 残羹冷灸 虚怀若谷
4.下列句子没有错别字的是:
A.遇到挫折,他就自抱自弃,从此旧习毕露,写过的计划也就作废了。
B.对假冒和作伪,我们不能掉以轻心,必须健全法制,严加防犯。
C.社会上总有那么一些人对健康向上的事物置若罔闻,而对低级下流的东西趋之若鹜
D.当前荧屏上色情、恐饰、撕杀、打斗的镜头太多,这无疑会给青少年带来不良的影响。
5.下列十二个词语书写全对的一组是:
①老奸巨滑 ②恶惯满盈 ③改弦更张 ④见贤思奇 ⑤漫不经心 ⑥拾人牙惠
⑦条分缕析 ⑧洗心革面 ⑨箪食壶浆 ⑩怨声在道 ⑾沤心沥血 ⑿醍醐灌顶
A ①③⑥⑧⑾ B ②④⑦⑨⑩ C ③⑤⑧⑾⑿ D ③⑦⑧⑨⑿
6.下面句子都有错别字,请一一指出:
①这是一篇针砭时弊的文章,对当前产生的腐败现象产生的缘因分析的十分中肯。
②我市按装公司声誉较好,工人的服务态度也不错。
③其实这座活生生的近代历史薄物馆,应该打开大门,欢迎外宾来看看。
④他带着帽子,胸前佩戴着校徽,精神抖擞地向学校走来。
⑤其目的之一是希望早期发现病变,以免病入膏肓;一是防止可能的疏忽,宁可未雨筹谋。
⑥仅管他废了很大的劲,还是一无所获。
7.选出书写完全正确的一组
A.涸泽而鱼 锲而不舍 濯濯童山 沸反盈天
B.桀骜锋利 烟霏云敛 司马青衫 鄙夷不屑
C.完壁归赵 必恭必敬 聚精会神 泰然处之
D.休戚相关 迥乎不同 昏昏噩噩 鞠躬尽碎
纠错百字练习:划出下列句中错别字,将正确的字填在后边括号中。
1.义气用事(意) 2.平水相逢( 萍) 3.直迷不悟(执 ) 4.永保青春(葆 )
5.进升职务( ) 6.新闻报到( 道 ) 7.举一返三(反) 8.强努之末(强弩之末 )
9.推已急人(推己及人 ) 10.出神入画(出神入化 ) 11.气势凶凶( 气势汹汹 ) 12.史无前列(史无前例 )
13.趁伙打劫( 趁火打劫 ) 14.犬牙交挫(犬牙交错 ) 15.水泻不通(水泄不通 ) 16.智理名言( 至理名言 )
17.指高气扬(趾高气扬 ) 18.怙恶不俊( 股恶不俊) 19.坐想其成(坐享其成 ) 20.正音正意( )
21.冒然行动( ) 22.出类拔翠( ) 23.趋之若骛( ) 24.入不付出( )
25.受治于人( ) 26.言不由中( ) 27.害人听闻( ) 28.遗笑大方( )
29.自吹自雷( ) 30.事在必行( ) 31.狗且偷安( ) 32.其貌不洋( )
33.自立更生( ) 34.稼祸于人( ) 35.鲜而易见( ) 36.上蹿下跳( )
37.以逸代劳( ) 38.涛涛不绝( ) 39.前扑后继( ) 40.势力小人( )
41.山呼海哮( ) 42.哀声叹气( ) 43.密而不宣( ) 44.莫可明状( )
45.风尘朴朴( ) 46.水火不融( ) 47.鬼鬼崇崇( ) 48.不识时物( )
49.轰堂大笑( ) 50.情不自尽( ) 51.不卑不抗( ) 52.随声附合( )
53.穷愁了倒( ) 54.棉里藏针( ) 55.洽如其分( ) 56.儒子可教( )
57.试目以待( ) 58.一踏糊涂( ) 59.无用讳言( ) 60.当物之急( )
61.慰然成风( ) 62.容光涣发( ) 63.整齐化一( ) 64.冠免堂皇( )
65.倾窠出动( ) 66.无则加免( ) 67.变换莫测( ) 68.打报不平( )
69.莫忠一是( ) 70.失口否认( ) 71.因咽废食( ) 72.雨露甘林( )
73.憨态可鞠( ) 74.脑羞成怒( ) 75.诩诩如生( ) 76.激流勇退( )
77.削足适屐( ) 78.相倚为命( ) 79.承上起下( ) 80.贪脏枉法( )
81.鸣罗开道( ) 82.忠贞不瑜( ) 83.故技重演( ) 84.耳儒目染( )
85.稀来攘往( ) 86.忧柔寡断( ) 87.死不溟目( ) 88.大相经庭( )
89.针贬时弊( ) 90.五彩宾纷( ) 91.班发奖状( ) 92.一发千均( )
93.巧取毫夺( ) 94.形势严竣( ) 95.虎居龙盘( ) 96.题纲挈领( )
97.腆不知耻( ) 98.为国捐驱( ) 99.病入膏盲( )100.接长补短( )
近三年高考汉字字形题比较分析 篇6
一、近三年已考查的错别字全记录
1.2005年考查过的错别字(括号内为正确字)
按迹寻(循)踪白内瘴(障)裨(稗)官野史察颜(言)观色沉缅(湎)船仓(舱)唇枪舌箭(剑)烦燥(躁)蜚(斐)然成章幅(辐)射赋与(予)涵概(盖)记忆尤(犹)新既(即)便箭(剑)拔弩张金壁(碧)辉煌禁止赌搏(博)痉孪(挛)拢(笼)络人心脉博(搏)名(明)信片日没(暮)途穷跚(姗)跚来迟盛名之下,其实难负(副)世外桃园(源)试(拭)目以待水笼(龙)头悬梁刺骨(股)循(徇)私舞弊揠(偃)旗息鼓衣衫烂(褴)褛义(意)气相投异曲同功(工)缘份(分)蕴籍(藉)糟塌(蹋)坐阵(镇)指挥
2.2006年考查过的错别字(括号内为正确字)
班(斑)马的脑袋——头头是道卑恭(躬)屈膝毕其攻(功)于一役彪柄(炳)彬彬有理(礼)泊(舶)来品不径(胫)而走凑和(合)大有稗(裨)益惮(殚)精竭虑貂婵(蝉)顶礼摩(膜)拜侯(候)车室辑(缉)拿简炼(练)见风驶(使)舵竭泽而鱼(渔)精(经)典举步为(维)艰嗑(磕)碰罗(啰)唆民生凋蔽(敝)名(明)信片摩娑(挲)能曲(屈)能伸沤(呕)心沥血凭(平)心而论前事不忘,后世(事)之师亲(青)睐磬(罄)竹难书去逝(世)弱不经(禁)风声名雀(鹊)起誓(视)死如归捅漏(娄)子挖墙角(脚)慰籍(藉)纹(文)身渲(宣)泄演译(绎)一幅(副)对联一诺千斤(金)雍荣(容)华贵针贬(砭)直接(截)了当珠光宝器(气)主弦(旋)律
3.2007年考查过的错别字(括号内为正确字)
哀(唉)声叹气百废待新(兴)暴燥(躁)苍(沧)桑独挡(当)一面锻练(炼)对薄(簿)公堂奋(愤)而辞职赋以(予)汗流夹(浃)背合(和)盘托出急功进(近)利娇(矫)健精(经)络鞠躬尽悴(瘁),死而后已朗颂(诵)门可落(罗)雀篷(蓬)荜生辉膨涨(胀)披沙捡(拣)金频律(率)凭(平)心而论青出于兰(蓝)磬(罄)竹难书屈(曲)意逢迎如愿以尝(偿)拾人牙惠(慧)同甘共苦,祸福予(与)共细水常(长)流协(胁)迫要言不繁(烦)一愁(筹)莫展一言即(既)出,驷马难追赢(羸)弱优哉悠(游)哉再(在)所不惜
二、近三年考查之比较分析
1.重复考查的比率较低
2005年13套试卷的考查涉及37个错别字,当年重复考查的有“幅(辐)射”(天津卷、浙江卷、湖南卷)、“唇枪舌箭(剑)”(广东卷)与“箭(剑)拔弩张”(江苏卷)。
2006年15套试卷的考查共涉及47个错别字,当年重复考查的有“名(明)信片”(北京卷、辽宁卷)、“泊(舶)来品”(北京卷、江苏卷)。2006年与2005年考查重复的是“名(明)信片”、“裨(稗)官野史”“大有稗(裨)益”。
2007年12套试卷的考查涉及的错别字计36个,当年重复考查的没有。2007年与2005年考查重复的是“赋与(予)”(2005年湖北卷)与“赋以(予)”(2007年辽宁卷),“烦燥(躁)”(2005年全国卷Ⅰ)与“暴燥(躁)”(2007年江西卷)。2007年与2006年考查重复的只有“凭(平)心而论”(2006年安徽卷、2007年湖北卷)和“磬(罄)竹难书”(2006年全国卷Ⅱ、2007年全国卷Ⅰ)。
从以上数据我们可以看出,对错别字的考查,各套试卷的出题者似乎在遵守着一种潜规则,这就是尽量不考查已在全国高考各套试卷中出现过的错别字。这一现象值得关注,也可以指导我们的复习。
2.近两年考查题型基本稳定
2005年高考的字形题只有“下列各组词语中,没有错别字的一组是()”和“下列各句中,没有错别字的一句是()”两种题型。后一种题型只有江苏卷采用,其余全部为第一种题型。
2006年和2007年高考的字形题共有5种:①下列词语中没有错别字的一组是()。②下列各组词语中,有错别字的一组是()。③下列各组词语中,有两个错别字的一组是()。④下列句子中,有错别字的一组是()。⑤下列各句中,没有错别字且注音全对的一项是()。其中,第④种为湖南卷采用,第⑤种为江苏卷采用,大多数试卷采用第①种。
估计2008年高考字形题题型将不会有大的变化。
三、2008年字形题复习策略
近几年,高考字形题的考查对象主要是“三常字”(即常见字、常用字、常混字),特别是其中的“常混字”。在复习时,我们可以从以下几个方面多加注意:
1.平时留心,注意错别字的成因
分析近几年的高考试题,可以发现形成错别字的主要原因有:
(1)形近致错。如把“拭目以待”误为“试目以待”,把“演绎”误为“演译”,把“暴躁”误为“暴燥”。
(2)音近致误。如把“愤而辞职”误为“奋而辞职”,把“珠光宝气”误为“珠光宝器”,把“世外桃源”误为“世外桃园”。
(3)形、音相近致误。如把“如愿以偿”的“偿”误为“尝”,把“舶来品”的“舶”误为“泊”,把“沉湎”的“湎”误为“缅”。
(4)随意简化致误。如把“青出于蓝”的“蓝”误为“兰”,把“入不敷出”的“敷”误为“付”。
(5)意义相近致误。如把“意气相投”的“意气”误为“义气”,把“一副对联”的“一副”误为“一幅”,把“细水长流”的“长流”误为“常流”。
2.巧用对称法训练思维
高考辨识错别字的出题材料主要是词语或成语。粗略看来,所给的词语或成语的确有时让人如坠云雾,难辨对错。然而如果用对称法稍加分析,往往又比较容易识别。因此,平时注意用对称法来训练自己的思维,不失为一种好的方法。
对称法有近义对称和反义对称两种。近义对称指在一个词语对称位置上的字,它们的意义往往是相同或相近的。反义对称指在一个词语对称位置上的字,它们的意义往往是相对或相反的。
我们运用近义对称来分析一下“前事不忘,后世之师”(2006年天津卷),“前事”与“后世”,相同的位置,同样的事情,因此,很容易辨别出“后世”应是“后事”。又如“哀声叹气”(2007年重庆卷),“哀”是悲伤、悲痛,不能与“叹”(叹息)构成对称,只有“唉”(表示叹息)与“叹”构成对称,都表示叹息,所以“哀”应为“唉”。
我们运用反义对称来分析一下“百废待新”(2007年江西卷),与“废”形成对称的应该是“兴”(兴旺),“新”只能与“旧”形成对称,所以“新”应为“兴”。
3.理解字义,以意辨形
汉字是表意文字,准确把握字义,是正确辨别字形的关键。因此,在平时的学习过程中,我们一定要特别用心地根据字义、词义来辨别书写正误。
比如“独挡一面”(2007年安徽卷)的“挡”应为“当”。“独当一面”意为单独担当一个方面的任务。“当”是“担当”的意思,不是“阻挡、抵挡”的意思,所以不能写成“挡”。“一诺千斤”(2006年辽宁卷)显然不是说“诺言”有千斤重,而是说“诺言”算数、值钱,“斤”应为“金”。
浅谈还原汉字字形、字意的重要性 篇7
一、对经典古文的误解
对字意的理解错误首要影响的就是对我国古典著作的误读。例如, 唐代诗人王勃的《送杜少府之任蜀州》中脍炙人口的佳句“海内存知己, 天涯若比邻。”经常被解释成:海内有知心的朋友, 即使远隔天涯, 也像是近邻一样。语意通顺, 好像没问题, 但通过考证, 我发现其中的“存”字意思不对。它最早字形是小篆“”, 左右结构, 左上是“才”, 指草木初生;右下是“子”, 指男女初生。都指“幼小”, 而人见幼小总生怜爱之情, 因此派生出“牵挂、思念”等意。现在细想:“有”知己和“思念”知己, 语境可是天壤之别。正因为相互思念, 知己的音容才会浮现脑海, 好像穿过时空, 近若比邻。而这恰是此联的妙解, “存”则是这句的诗眼。
再如《论语》中《学而》的第一句“学而时习之, 不亦说乎”, 意思是:学完功课要经常复习, 是非常快乐的。可按人之常情, 学习是件苦差事, 少有快乐可言, 更别说还要“复习”了。而且这句太普通了, 没有深意, 特别是开篇第一句, 应该很有份量。后来发现是“习”字理解错误。“习”的甲骨文是“”, 从“羽”从“日”, 那“习”就是指鸟类每天学飞, 说的是”“实践”。这样再解释原句:要将所学付诸行动, 是非常快乐的。好比做物理或化学实验, 学生一定很积极。可见这里讲的是“知行合一”, 与“复习功课”的语境同样是天壤之别。
二、对日常事物的解读
我国现在正在大力构建社会主义和谐社会, 正确理解“和谐”就尤为重要, 而中国自古讲究“以和为贵”, 看来“和”是重中之重。“和”的字形变化不大 (简体字除外) , 以楷书为例是“”。左“龠”为古时吹管乐器, 就是现在的笙, 而它是一件多管和声性乐器, 高低不同的音能够同时发声, 而不相互吃掉, 并产生音色相融合的独特听觉, 即声音的立体感;右“禾”指成熟的谷子, 意为庆丰收时, 人们的幸福感受。合意为笙所带来的立体感的音效给人们精神的享受。而这种音效恰是由不同音高经过合理编配形成的, 所以, “和”的首要条件就是不同, 甚至对立, 同时又不会互相吃掉。用《论语·子路》中的一句“君子和而不同, 小人同而不和”来注解“和”最恰当了。可见, 和谐社会就是让每人都有平等发展的机会, 从而最大限度的实现人生价值和目标, 同时, 还不能影响他人的正常发展, 社会最终达到一种良性的、动态的平衡, 而这需要完善严格的法制体系作保障。龢
说到法, 其实古人对法的认识早已有之, 其最早字形是金文, 到楷书变化都不大, 字形是“灋”。《说文解字》解释:“刑也。平之如水, 从水;廌 (zhì) , 所以触不直者;去之, 从去。”意为:法就是要象水一样公平, 并通过“廌”的惩罚达到驱除罪恶的目的。公平、刑罚、驱恶就是法的核心。可见, 在当时的人治社会, 古人就已经有了很先进的法律意识, 其核心内容与现代社会无异。
在音乐会、晚会上, 我们经常会听到“小提琴独奏”、“笛子独奏”、“钢琴独奏”、“打击乐合奏”等词语, 但对应每类乐器最准确的动词应该是:拉、吹、弹、打。可见, “奏”字不一般。“奏”的甲骨文是“”两边是“手”的象形, 并且双手向上, 表进奉。中间是“求”, 合意为“双手进奉以求”, 这样的动作不就是祭拜吗!可见, “奏”与原始人的祭祀活动有关。现在细想:祭祀的目的就是与神、与祖先沟通, 以求得护佑, 必须向上进奉, 就有了“奉献”的语意, 如“奏折”;再有, 祭祀是聚众的行为, 所以有“聚集”的语意;而且在祭祀活动中, 一定会有乐器的烘托, 所以有“奏乐”的语意。而最重要的是, 祭祀是一项神圣的活动, 要求人从内心深处表示敬畏和虔诚, 从而达到人神合一的境界, 获得上天的福佑, 因此还有一种“意境”的成分。现在再理解“奏”取代“吹、拉、弹、打”, 是因为音乐是演奏者奉献给观众的, 内含“聚众”, 从而使演员和观众一起随着音乐向高级的精神享受升华, 同样神圣。
三、对先人哲学思维的认识
人一生都在追求幸福, 但幸福的定义却众说纷纭, 而古人对“幸”的理解却是带有辩证思想的。其陶文是“”, 表示押送囚犯用的刑具, 相当于今天的手铐。细想, 人只有在沙漠中才知道水的宝贵;同理, 人只有失去自由, 才向往自由。在钦佩古人的智慧的同时, 我们也明白只有“苦尽甘来”, 才是“幸”的核心。
综上所述, 汉字是我国先人智慧的结晶体, 浓缩了先人对世间万物的认识, 同时, 将我国悠久灿烂的文化传承至今, 因此, 正确还原汉字的字形、字意不仅恢复了汉字的本貌, 还原古籍经典的真实意境和中心思想, 还让我们认识到了古人的思想及其先进性, 甚至对我们今天的思想意识和行为方式起着重要的指导作用。只有这样, 我们才能真正将中国灿烂的文明最大限度的传承和发扬。
参考文献
[1]赵世民.汉字, 中国文化的基因——世民解字 (一) [M].桂林:广西人民出版社, 2003.
[2]许慎.说文解字[M].南京:凤凰出版社, 2004.
汉字错字字形动态生成和编辑系统 篇8
汉语以其独特的魅力引来世人广泛关注,作为一种结构复杂的文字,学习起来具有一定的难度,其中以汉字书写最难学。对于初学者来说很容易写错字,而不同汉语学习者出现的书写错误又有不同的规律,但目前还没有大规模的错字书写偏误统计分析研究成果为汉字教学提供指导和参考。究其原因,一方面是错字的计算机处理(错字的编辑、编码,错字的输入输出,错字的印刷排版等)还存在很多困难;另一方面是目前该领域内缺乏符合国际标准的错字编码方案和简易有效的错字输入方法,由此给计算机处理汉字错字信息方面造成了困难。因此研究设计一种简单有效的汉字错字生成与处理方案就显得极为必要。
1 汉字错字生成系统的应用需求与现状
利用计算机进行汉字输入、排版和印刷,是目前办公自动化和印刷领域内一件极平常的事。但是,如果要输入并印刷计算机字库中没有的汉字,往往需要大费周折,常用的办法有两种一是利用造字程序制造字库中没有的汉字;二是临时做一个汉字图片来替代。错字属于字库中没有的字,少量的错字可以用上述方法来进行,但随着我国汉语教学特别是对外汉语教学的发展,学写汉字的人越来越多,由于汉字学习的复杂性,出现了汉字书写的错误种类和数量成倍增长的现象,使用字库制造错字和编辑错字图片的方式远远不能适应数字化汉语教学的需要。
为此许多学者开始在错字编辑和识别方面进行研究,并且已经取得了一些成果。比较典型的有李小庆等人的“基于国际标准的错字处理方案”[1,2],在该方案中,基于Unicode 5.1标准的表意文字变体序列标准IVS(ideographic variation sequences)设计并实现了以正字为中心、使用正字加变体选择符IVS表示错字编码,并应用Open Type字库技术进行输入输出的错字处理方案。
上述错字处理方法是在原有字库的基础上利用标准字库中的空闲区域或不常使用的汉字内码区域来存放错字,这类方法最大的不足就是占用了汉字宝贵的编码空间,随着错字规模的扩大,这些预留区间很快会被用完。例如,Unicode编码的自定义区域为[E000-F8FF]共6400个[3],即使每个汉字取一个错字也只能存放6400个,而实际情况是,错字的数量远不是一个汉字只有一个错字。因此现有的错字输入和处理方案在处理大批量错字方面还存在很多缺陷。另外现代汉字字形库是以字体文件为单位,每一个字体文件包含一类不同编码的汉字,每一个汉字是以字形的轮廓来描述,但是汉字错字产生的缘由决定了其种类繁多,用字形轮廓来描述会变得更加麻烦。轮廓字形虽然保证了字形输出的质量,但不利于错字字形的编辑和动态生成[4,5,6]。
因此,需要找到一种基于字形描述的汉字错字输入和编辑方法[7,8,9],借以开放错字的编辑数量,方便用户输入,更好地服务于汉字错字的出版和印刷,为汉语教学特别是对外汉语教学提供数字化的错字编辑和印刷环境。
2 错字字形动态描述库
针对上述需求,我们提出了一种基于错字字形进行编码的方法,该方法首先通过建立错字字形动态描述库DDL,使用有向笔段和笔元对错字字形进行动态矢量化描述[10,11],然后在字形骨架上找出特征点,并通过特征点进行量化和存储,最终实现错字的字形编码。DDL的应用,解决了由于使用字形轮廓描述汉字错字而存在的字形动态编辑和字形变换的困难,解决了汉字错字教学中的编辑难、书写难的问题。
2.1 错字字形描述
参照现代汉字的书写方法,在错字字形动态描述库中引入有向笔段和笔元的概念来描述错字的字形骨架。有向笔段是一条有方向的线段,将笔段定义为有向的意义在于错字字形生成过程中的起笔、运笔和落笔的识别。每个笔段的起始点和结束点的坐标分别用势点和驻点来表示,设(Xi,Yi)是势点,(Xj,Yj)是驻点,则这个有向笔段用一维向量Sij描述如下:
笔元是由一个或者多个有向笔段组成的一个完整的笔画结构,设一个笔元由n个笔段组成,则这个笔元可以用向量En描述,即En=(Si1j1,Si2j2,…,Sinjn)。对于任意的K∈{1,2,…,n},记Sikjk为Sk,则上述笔元可简记为:
其中,En的第一个笔段S1的势点叫做En的始点,最后一个笔段Sn的驻点叫做En的终点。
2.2 笔元的界定
在字形描述库中,使用界点对各个笔元进行分隔。每一个笔元都有始点和终点,为了使多个笔元之间的始点和终点不发生错乱,通过在每个笔元的始点之前添加界定符号的方式来界定笔元,界定符号叫做笔元的界点。若界点为D=(D1,D2),则笔元En的描述向量为:
2.3 错字编码描述
一个汉字错字是其笔元的集合,为了便于计算机识别,我们将这个集合表示为笔元的排列,排列顺序按照汉字的书写顺序进行,设一个汉字错字由m个笔元:En1,En2,…,Enm,则这个错字的描述向量为:
错字的描述向量经处理转化为描述库中的编码存放在一个文本文件中,为了界定不同错字的编码,在每个错字编码的第一个笔元之前和最后一个笔元之后分别加上界定符号H=(H1,H2)和T=(T1,T2),则这个错字的描述向量就成为:
2.4 动态描述算法
动态描述算法的主要作用是将绘制或调整后的笔元信息进行规范和存储。算法步骤如下:
步骤1打开字形描述库;并初始化变量。
变量的初始化要对界点D、始点H、终点T、笔元数ele_num和字形描述库ZXDATA(i)进行初始化操作。
步骤2选择操作类型。若操作为“Ins”,则插入笔元;若操作为“Mov”,则移动笔元;若操作为“Del”,则删除笔元;若操作为“MovDot”,则移动选择点(势点或驻点);若操作为“DelDot”,则删除选择点(势点或驻点);若操作为“Change”,则改变笔元粗细;若操作为“Copy”,则透明临摹;若操作为“No Oper”,则转向步骤3。
步骤3保存操作,关闭字形描述库。
插入笔元是通过逐个插入该笔元的笔段来实现,移动整体笔元是通过修改笔元的各个点(界点除外)来实现。综上所述,DDL的建立过程如图1所示。
由图1可知,错字由正字经动态编辑得来。为了建立两者之间的联系,我们通过链表来匹配它们之间的关联,链表结点结构如图2所示。其中标志域Tag取值0和1,Tag为“0”表示该字是正字,Tag为“1”表示该字是错字,链域Link存储指向同一链表中下一个结点的指针,编码域Code存储该字的编码。
编辑错字时,先在Word文档里输入一个正确的字,然后利用软件的“透明临摹”对该正字描绘骨架(即笔元),系统会记录特征点信息并将该正字的编码存储到链表的头结点中。然后在该正字的字形基础上通过软件提供的操作(如移动笔元)编辑错字,编辑好后保存,则该错字的编码被存入结点插入到对应链表中,依此类推。如果要编辑一个新的字,则会存储到另一个链表中,同时我们对所有链表的头结点建立正字索引以方便检索。退出系统时,系统会自动更新本次所有字形编码,生成最新的文本文件,保证下次打开描述库时初始化工作的顺利执行。
2.5 特征点的提取及编码
根据上述动态描述库中的描述可知,特征点的提取与错字字形中的笔元和笔段的提取有关,错字字形中笔元的提取算法可以通过查找界点来实现,笔段的提取算法可以通过分析笔元中的势点和驻点来实现,因此特征点的提取算法实现如下:
步骤1打开字形描述库;并初始化变量。这里主要对界点D、始点H、终点T、笔元数ele_num和字形描述库ZXDATA(i)进行初始化操作。
步骤2对比特征点类型。若特征点类型为“界点”,则转步骤2.1;若特征点类型为“势点”,则转步骤2.2;若特征点类型为“驻点”,则转步骤2.3;否则,转步骤2.4。
步骤2.1笔元数加1,by_num=by_num+1。
步骤2.2笔段数加1,bd_num=bd_num+1。
步骤2.3存储特征点坐标。
步骤2.4第一个文字特征点提取结束。
转步骤2继续提取下一个字。
步骤3保存,关闭字形描述库。
若字形描述库中的字形描述向量为:ZX=(H1,H2,En1,En2,…,Enm,T1,T2),则通过特征提取算法得到该错字字形的特征点编码为:En=(by_num,bd_num,S1,S2,…,Sn)。
例如:由特征点提取算法得到“”字的特征点(如图3(a)所示),错字识别程序根据这些特征点编码通过连线得到错字“”的字形(如图3(b)所示)。因此,任何错字字形在系统中均可动态显现。
3 错字动态生成与编辑系统
结合上述算法思想,本文创建了通过自建错字字形库进行实时动态编辑的错字输入系统。该系统包括:错字字形库编辑模块、错字字形特征提取模块,错字字形编码模块、错字输入模块、错字实时动态编辑模块(如图4所示)。
(1)错字字形库编辑模块:实时动态编辑用户需要输入的错字,在正字的基础上对笔画结构进行基于可视化的修改和组合,这些修改包括增加笔元、移动笔元、删除笔元、增加选择点、删除选择点、笔画临摹、改变笔画粗细等,系统会将编辑好的错字字形结构信息传递给错字字形特征提取模块。
(2)错字字形特征提取模块:分析接收到的错字字形结构数据,采用错字特征提取算法提取错字中的特征点,并将特征点数据传递给错字字形编码模块。
(3)错字字形编码模块:通过错字字形编码算法将错字字形特征提取模块中提取的特征数据进行编码处理并存储。
(4)错字输入模块:通过键盘输入错字对应的键码(该系统暂时只能使用26个字母键和10个数字键进行错字输入),程序会根据这个键码对应的编码在编辑器中显示该错字,以便编辑、制版和印刷。
(5)错字实时动态编辑模块:接收需要调整和编辑的错字信息,调用错字字形库编辑模块对文档中的错字进行实时动态编辑处理。
4 错字动态生成实例演示
下面以“笔”的某个错字字形通过本系统演示如下:
(1)在错字字形编辑模块中挑选正字“笔”作为临摹对象,通过笔元编辑只改变笔字的竹字头结构使之变成一个错字“”,保存编辑后的错字“”(如图5所示)。
(2)由特征提取模块的特征提取算法将错字“”的每一笔画用若干个二维表(Xi,Yi)组成的序列来表示(该序列表的值支持动态修改),若干个序列表和一个对应正字“笔”的索引码组成了错字“”的特征码(如图6所示)。
(3)错字输入时,编辑完成后,在编辑环境下“”输入该错字对应的数字或字母键,则出现该错字,对应的数字或字母就是该错字的键码(如图7所示)。
(4)对错字进行动态编辑时,首先通过键盘输入该错字,然后右键点击改错字,进入编辑状态,根据需要修改错字字型,修改后的错字会重新加入到错字字形表中并被存储下来(如图8所示)。
5 结语
本文针对印刷和数字化汉语教学中存在的汉字错字输入问题及现状,研究设计一种基于错字字形的动态实时编辑系统,用于错字的输入与处理;另外,充分利用了现代汉字的结构多变,字形复杂的特性,将错字字形库的编辑和修改与汉字的临摹有机结合起来,保证了在不改变原有字形结构的情况下,动态制作多种形式的错字字形,为数字化的汉语教学和错字印刷排版提供了一种错字获取源,是一种简单方便而又高效地错字输入法。
摘要:汉语的独特性使得汉语成为当今语言学习的一大热点。针对当前汉语教学中出现的汉字错字方面的教学问题,提供一种简单、方便、高效的错字输入法并设计实现了汉字错字字形动态生成与编辑系统,该系统使用动态编辑技术解决了编辑过程中错字的实时编辑、编码和输入的问题,为错字的编辑、印刷和排版及数字化汉语教学研究提供了一种方便的错字输入方法。此方法还可用于古籍异体字、甲骨文、金文、民俗拼合字等字形的动态编辑、生成与处理。
关键词:汉字,错字输入法,动态编辑,数字化汉语教学
参考文献
[1]李小庆,林民,塔娜,等.基于国际标准的错字处理方案设计与实现[J].计算机工程与设计,2010,31(10):2387-2391.
[2]李小庆.面向汉字教学的错字处理工具设计与实现[D].呼和浩特:内蒙古师范大学,2010.
[3]朱巧明,李培峰,吴娴,等.中文信息处理技术教程[M].北京:清华大学出版社,2005.
[4]林民,宋柔.一种笔段网格汉字字形描述方法[J].计算机研究与发展,2010,47(2):318-327.
[5]林民,宋柔.一种面向构型计算的汉字字形形式化描述方法[J].中文信息学报,2008,20(3):115-123.
[6]林民,宋柔.汉字的笔段网格字形描述及字形比对算法[J].计算机辅助设计与图形学学报,2009,21(9):1298-1306.
[7]王瑜,黄源,张福炎.Windows中TrueT ype字形数据的存取技术[J].小型微型计算机系统,1997,18(11):75-81.
[8]郑军.一种面向字形分析的汉字输入输出处理系统的设计与实现[D].呼和浩特:内蒙古师范大学,2009.
[9]韩东妹.汉字字形描述技术研究[D].呼和浩特:内蒙古师范大学,2007.
[10]吴琴霞,栗青生.基于动态描述库的汉字字形自动生成技术研究[J].科学技术与工程,2013,13(15):295-299.
汉字字形的作用 篇9
Autocad系统本身提供了各种英文字库和汉字库 (单线体矢量字) , 我们在实际应用中如设计规划图、制作漂亮的文字封面等, 常常需要将空心字的文字填实、涂黑, 因此提出了如何将空心文字的形打碎分解的问题。
1基本思想
将空心文字进行分解其中心问题是如何解释AutoCAD的形文件, 要深入分析AutoCAD的字形文件格式及动作原理, 用Lisp程序与ADS程序相结合完成上述工作。
Lisp程序负责从屏幕选取要分解的文字 (包括汉字、英文字等) , 从中提取出相关的属性, 象起点位置、字高、高宽比、文字内容、字体文件名……, 提供给ADS程序作为其输入信息。
因为要解释AutoCAD形文件, 涉及到读字库 (读二进制文件) , 用Lisp程序无法实现, 可以用AutoCAD提供的另一个开发工具ADS来完成此项工作, ADS由一些C语言函数程序库所组成, 大部分是与Autolisp相对应的相同功能函数。ADS程序接受LISP程序提供的属性表, 提取有关的属性信息。分别打开大字体, ASCⅡ码字库文件, 比较捕捉到的字形码与字库中的字型码是否相同, 如果相同找到相应形的地址, 读出该文字的形描述进行解释, 将其分解为线或弧等可编辑的一般实体。字形分解方法:按照字形文件的结构进行字形的分解。
1.1ASCⅡ字形文件结构
(1) 标准线段的描述。
描述直线矢量占用一个字节, 每一个字节高4位表示矢量长度, 低4位表示矢量的方向, 共有16个标准矢量方向, 凡是符合这16个标准方向的矢量就可以写出其编码表示其大小和方向。
(2) 专用码。
由于要定义的对象不同, 如线段、圆弧, 以及要描述的各种状态如抬笔、落笔、形结束等, AutoCAD采用了专用码, 用000~00E来描述非标准的线段和圆弧。
1.2汉字形文件的结构
汉字形文件的结构比英文形文件的结构要简单的多, 除解释一些专用码外, 无论是单体矢量字还是空心字, 其形文件均是用连续的非标准矢量来描述。这样除了一些状态码抬笔、落笔、形结束码必须解释外, 只需重点解释专用码8和9 即可, 将非标准矢量解释为Autocad系统能够处理的标准矢量, 保证分解好的文字均是原型字。
2字形文件分解过程
2.1如何从字库中找到相应的字码
ASCⅡ字型文件与大字体文件格式不同, ASCⅡ字形文件的字码均按由小到大的顺序排列, 可以利用数据库的二分法搜索, 平均搜索次数为log2n (n为字码总数) , 这样256个字码最多8次便能找到所有的字码位置, 提高了检索速度。
英文ASCⅡ字码排列结构为:字码1, 长度1, 字码2, 长度2……大字形文件bigfout字码排列是随机的, 可以用直接法搜索找到相应的汉字字码, 大字形文件的字码排列结构:字形码1, 长度1, 形的地址1 (长整形) , 字码2, 长度2, 形的地址2……, 这样在字库中只要找到匹配的字码, 便可找到该字码描述的地址、形的长度。
2.2解释形
确定形描述的位置后, 便可以按形的定义解释每一个形, 使其成为AutoCAD可以编辑的画线、画弧命令, 因此就实现了字的打碎。
3程序的实现流程
4程序的执行
在AutoCAD环境下执行以下命令。
Command :exptext
Select object :选取要打碎的字
总之, 程序实现起来比较麻烦, 涉及到ASCⅡ码字与汉字两个字库的读取方法不同, 字高、比例也不同, 需要分别解释分别处理, 但对用户来讲, 程序的执行非常简单, 只需敲入一个命令便可实现字的分解功能。
摘要:AutoCAD系统本身提供的汉字、英文字均为单线体空心字, 没有实心字。为了满足实际应用需要, 编制了将空心字各种字体的形文件打碎、分解程序, 使得空心字变成实心字得以实现。
汉字字形的作用 篇10
1 字形描述库的生成过程
考虑到人工建立字形库费时费力,让计算机来建立字形库无疑会大大提高字形库的制作效率并保证数据质量。但是,汉字字形库不仅包含笔画顺序,而且还有关键点坐标等数据信息,如果仅仅依靠计算机来完成这些工作,计算机并不能正确地识别通用汉字的笔画顺序(楷体字除外),因此,我们采用人机交互的方法来实现[4]。
动态描述算法的主要作用是将汉字进行数字化,通过描述算法将汉字的骨架提取出来,以坐标点的形式保存在动态描述库中。汉字的每一笔画都将对应两个或多个坐标点信息,坐标点间的连线组成汉字的骨架,这些连线称为有向笔端[5]。动态描述库不但可以表示出正确的汉字信息,还可以表达出错字、别字以及特殊字的信息,只需调整笔画信息并进行规范存储即可[6]。算法如下:
Step1:建立或打开字形描述库;并初始化变量。
对界点D、始点H、终点T、笔画数ele_num和字形描述库ZXDATA(i)进行初始化操作。
Open ZXData;//打开字形描述库
Int ele_num←0,m;
Point D←(m,0),H←(m,0),T←(m,m);
ZXDATA(i)←{m,0,m,m};//描述库初始化
Step2:选择操作类型。若需增加笔画调用“Ins()”,转step2.1;若需移动笔画调用“Mov()”,转step2.2;若需删除笔画则调用“Del()”,则转step2.3;若需编辑笔画则调用“Edit()”,则转向step2.4;若需保存编辑结果则调用“NoOper()”,则转向step3。
Step2.1:增加笔画。
插入具有n个有向笔段的笔画En是通过逐个插入该笔画的笔段来实现的。
整体移动笔画是通过修改笔画中各个点的坐标(界点除外)来实现的,设Vertex[i]是待移动笔画中的第i个点,dx和dy分别是水平增量和垂直增量,VerCount是待移动笔画中除界点之外的点数:
Step 2.3:删除笔画。
删除笔画是通过删除笔画的各个点来实现的。设Vertex[i]是待移动笔元中的第i个点,VerCount是待删除笔画中除界点之外的点数。
Step 2.4:编辑笔画。
编辑笔画主要是指移动笔画中的某个笔段,这主要通过移动相应笔段的势点或驻点来实现。设待移动的笔段的势点或驻点为Vertex[i],dx和dy分别是水平增量和垂直增量,移动该点的方法为:
转步step2。
Step 3:保存修改,关闭字形描述库。
人机交互的汉字描述算法,按照汉字内码扩展规范(GBK)的汉字排列顺序,使用“人机交互的字形描述系统”来临摹每个汉字的字形信息,得到对应字形的特征点和拓扑结构信息(如图1所示)。然后将这些信息保存于描述库文件中(如图2所示),并建立相应的目录对照表(如图3所示),即每个汉字对应自己的字形数据,实现“汉字→数据”的转换。
2 汉字骨架提取
汉字字形由各种不同的笔划组成,因而比拼音文字复杂得多。起先汉字字形以点阵方式,不仅存储量大,且只能产生固定大小的字形。
汉字的结构字形是经过多种形体的不断演变而形成的,纵观汉字几千年的演变过程,概括地分,大致可分为篆、隶、草、真(楷书)、行五大类。长期以来,人们将一个个供组配汉字用的最小的构字单位,称为基础部件,如:“氵、又、宀、子、纟……”,将这些基础部件按照汉字结构规则进行组配及可生成其他汉字。由此可见,汉字字形是有层次的,汉字可以分解为部件,部件可以分解为笔画。笔画怎样排列,基础部件怎样组配,都是有规律的。如:“氵、纟、扌、亻、彳、讠、忄”等部件一般都放在字形的左边,“刂、攵、卩”等部件一般都放在字形的右边,都是按照汉字的构字方式和规则进行的。因此,汉字笔画的自动提取,是汉字信息处理的核心技术[7]。
采用“人机交互”的交互模式,用“字形编辑编码工具”采集汉字字形的骨架信息,通过对采集的数据进行分析将笔画的骨架单独提取出来,然后对骨架进行还原,进而实现其它字体风格的相同汉字集合(例如:宋体、楷体等)的笔画自动提取。将提取的笔画按照汉字的构字方式和规则又可进行二次拼接,在实现笔画自动提取的基础上,又实现了汉字的自动生成技术。
用户通过输入法输入汉字,通过查找“字形库”中的目录来找到对应的汉字字形的骨架信息,然后提取出笔画骨架。由于数据采集时按照汉字的书写顺序依次采集,并对笔画加有标记位,所以我们的数据包含笔画的类型、笔画个数以及骨架信息等简单的拓扑关系。通过对数据的逆向处理,我们将用户通过输入法输入汉字,通过查找“字形库”中的目录来找到对应的汉字字形的骨架信息,然后提取出笔画骨架。以“阿”为例,在描述库中保存的信息为:
先将上述的骨架信息还原为汉字字形信息。其中每一个笔画的骨架信息都能单独提取出来。如图4所示,“阿”字的每一个笔画骨架的数据信息经过处理后显示于下部的列表中。同样还可以将笔画骨架还原得到如图5所示的列表中。
3 骨架还原处理
汉字笔画依据笔势和走向可以分为数10种,将数十种笔画进行归类,大体可以分类为以下五种笔形,所有的汉字,都是由这五种笔形构成的:
(1)横,从左向右平行运动一段线为“横”,形状是“一”,从下向右上方运动一段线为“提”,属横类。
(2)竖,从上向下垂直运动一段线为“竖”,形状是“丨”。
(3)撇,从上向左下方运动一段线为“撇”,形状是“丿”。
(4)点,在原地点一下形成的短线为“点”,形状是“丶”,从上向右下方运动一段线为“捺”,属点类。
(5)折,根据字的需要向不同方向运动而形成的不间断的曲线为“折”,形状是“”。
目前汉字有28种笔画,每种笔画都是固定的格式。因此,对于28种笔画和五种笔形进行分析,找到各自的特点,通过对数据的转换就可以把骨架信息还原为字形信息[8,9]。
3.1 三次贝塞尔曲线辅助骨架还原
每个笔画都有固定的模式,我们给出如下的点、横、撇、捺的生成算法。在描述库中每一个笔画都由一些离散的点组成,例如“点”笔画的定义为start和end两点,起点start的坐标设为(X0,Y0)和终点坐标end设为(X1,Y1)。各个笔画的还原借助直线和三次贝塞尔曲线来完成[10]。
三次贝塞尔曲线是有四个点(p0,p1,p2,p3)控制的,曲线起始于p0走向p1,并从p2的方向来到p3。三次贝塞尔曲线一般不会经过p1或p2;这两个点只控制方向。p0和p1之间的间距决定了曲线在转而趋进p3之前,走向p2的方向的长度有多长。贝塞尔曲线的通用公式如式(1)。
三次贝塞尔曲线即n=3,式(1)简化为式(2)。
“点”的实现可以使用一条直线和一个三次贝塞尔曲线来实现。具体步骤如下:
Step 1:初始化
以汉字1/5比例长为基准,设定一个可以正向或负向的增量ΔX,将一个以坐标轴正向为起始边的135度角为基准,设定一个可以增加或减少的增量Δθ。
Step 2:确定四个控制点
三次贝塞尔曲线有四个控制点,通过设计生成函数ComputeBezier(point*cp,intnumberOfPoints,point*curve)来生成第一个控制点P0,P0=start。
Step2.1:其它三个点的选取方法为:以选取向量(start,end)方向为正向为基线,以点end为原点逆时针旋转90度,即P1=a处,为第二个点,同样以点end为原点逆时针旋转315度,即P2=b处,为第三个点,以点end为原点逆时针旋转225度,即P3=c处,为第四个点。
Step 3:弧线生成
a、b、c三点的选取要通过辅助线段(p,a)、(p,b)、(p,c)来实现。这三点可以通过函数B(scalling,L1,L2,start,end,angle1,angle2)取得。函数中的Scalling定比例数(可以确定p点在线段(start,end)中位置的参数,L1、L2分别是向量(start,end)正方向左边和右边的取点所在线的长度,angle1、angle2分别是取点所在直线相对于直线向量(start,end)正方向的角度。通过对L1、L2和angle1、angle2的调整,可产生不同的解,如图6所示。
组成点的另一条直线可以直接由start和P3(即C点)直接连接,通过多次实验,找出最优解,即最佳的生成方法。如图7所示。
“横”笔画的生成过程与上例所描述的思想相同,不同的是点用一段贝塞尔曲线生成,而横画用四段贝塞尔曲线生成,竖、撇和捺与横画一样,具体生成过程如图8。总之,根据笔画的长度来确定所取的点与笔画的比例关系。
在撇和捺的生成过程中,根据不同控制点的有向笔端通过贝塞尔曲线,生成不同的解。实验结果见图9。
4 结论
通过“汉字字形描述库”为桥梁,将各种汉字字形映射到“字形描述库”中,通过对字形库中的数据进行处理,进而将汉字字形库对应的笔画骨架提取出来,最后通过骨架还原技术将骨架数据还原为各种汉字笔画字形,以便自动生成各种汉字字形库。目前我们仅作个别字体的实验,尽管生成字形与原字形有所区别(如图10所示)。但随着我们研究的深入,使用我们设计的笔画骨架还原算法可以将骨架数据尽可能还原为标准字形。
参考文献
[1]潘志庚,马小虎,石教英.动态汉字字库自动生成算法.自动化学报,1996;22(5):561-567
[2]严伟荣,蔡士杰.基于笔划特征的宋体字形衍生方法.中文信息学报,1995;9(1):16-24
[3]高晓,蔡士杰.一种从黑体到隶书的汉字自动变体方法.软件学报,1995;6(9):542-550
[4] LI Qingshen,Yang Yuxing.A human-computer interactive dynamicdescription method for jiaguwen characters.Procedia Engineering,2012;29:1013-1017
[5]栗青生,吴琴霞.基于甲骨文字形动态描述库的甲骨文输入方法。中文信息学报,2012;26(4):28-33
[6]吴琴霞,栗青生.基于有向笔端甲骨文输入方法的设计与实现.计算机应用,2012;32(8):2374-2377
[7]赵青,唐英敏.基于图形识别的汉字笔画分类方法.计算机技术与发展,2009;19(10):14-17
[8]刘玉兰,葛庆平.一种间接提取轮廓特征点的算法.计算机工程与应用,2004;40(1):51-52
[9]潘志庚,马小虎,张明敏,等.基于Fourier级数描述器的多种汉字字形自动生成系统.软件学报,1996;7(6):332-338
汉字字形的作用 篇11
师:今天我们主要学习的是由相同的单字组成的品字形结构的汉字。老师这里有一杯茶, (师端杯品茶, 并发出饮茶时的咂嘴声) 你们看看老师在干什么。 (生:老师在喝茶。)
师:老师怎么喝的, 是口渴了一大口一大口地往嘴里灌吗?
生:不是, 是一小口一小口地喝。
师:对, 像这样一小口一小口地尝出茶的味道, 可以用这个词来表示 (出示课件“品茶”) 。
师:“品”字是由什么字组成的呀? (生齐:“口”字。) 老师刚才喝了几小口茶? (生:三小口茶。) 如果老师品了很多口茶, 是不是要用很多个“口”字来表示呢? (生:不是。) 我们中国汉字有一个特点, 就是由一个单字重复几次组成一个字, 每重复一次, 这个字的意思就加强一次。在我们的汉语中, “三”常用来表示多的意思。“品”字由三个“口”组成, 就表示品尝了很多口茶的意思。
(课件出示“茶”字, 指导读好翘舌音, 并让学生说“茶”字是怎样组成的。)
师:“茶”字为什么由“艹、人、木”组成呢?
(在老师的引导下, 同学们经过相互交流讨论理解了“茶”字的基本字理:茶叶是长在茶树上的, 所以“茶”字下面是“木”字;茶叶是采摘茶树上的嫩芽制成的, 嫩芽像嫩草一样尖细, 所以“茶”字上面是个“艹”;茶叶是“人”从茶树上采摘的, 泡制成茶后给“人”喝的, 所以“茶”字的中间是个“人”。)
(给学生简单介绍茶的分类, 读文中句子, 写生字。)
(出示课件“木”, 指导学生读“木”字, 并组词——树木)
师:如果有很多树木, 几十棵、几百棵, 这地方叫什么? (投影出一片树林的画面。) (生:树林。) “林”是什么结构的字? (生:左右结构)
(引导学生用“林”组词) (课件投出一大片茂密森林的画面)
师:这里有成千上万棵树木, 一棵挨一棵, 一眼望不到边, 这地方叫什么? (生:森林) “森”字是怎样组成的?叫什么结构呢?
(教师引导学生理解“森”字的结构, 然后强调:凡是由三个相同的单字叠累而成的字, 我们都叫它品字形结构的字, 相同的单字每重复一次, 意思就加强一次。)
师:森林里有这么多树, 如果我们人类乱砍滥伐, “森林”就会变成 (生:树林。) 再继续乱砍滥伐下去, “树林”就变成 (生:树木。) 树木越来越少, 如果再继续砍伐下去就会出现什么情况呢? (出示课件:光秃秃的山岭和一截截树桩的画面。文字也递变成“森林——树林——树木——树桩”)
生:树木砍完了, 人类就没有氧气了。
生:没有树木, 洪水一来就会把房子冲走。
师:说得真好。人类乱砍滥伐, 没有树木, 就容易造成水土流失, 这也是造成我国近年长江中下游地区发生百年不遇的洪水灾害的重要原因之一。现在我们该怎样做才能保护我们的环境呢?谁能把“木———林——森”先组词然后连起来说一段话呢?
(在教师的指导下, 同学们先同桌对说, 后指名四个同学说。同学们一般都能如是连说:我们要多栽树木, 还要保护树木, 树木越种越多, 变成树林, 树林越长越茂密, 变成森林, 这样才能保护好我们的环境。)
(教师总结学法:1.读准字音;2.分析字形;3.根据字形理解字理。而后继续用这种方法学习“众”和“晶”两字)
【评析】
【汉字字形的作用】推荐阅读:
高三语文识记现代汉语普通话的字音、识记现代汉字的字形教案12-10
小语教学中的字形教学10-23
字形结构10-20
高考字形11-26
字形教案10-20
字形专题教案05-18
人字形桥梁09-01
语音字形训练题12-10
工字形截面柱08-28
高考字形题解题技巧10-30