抄袭检测(共10篇)
抄袭检测 篇1
1.背 景
随着校园网和Internet的不断普及,师生的生活、学习、工作方式发生了巨大变化, 学生作业的上传不再是单一传统的手工书写批改模式,开始采用网络上传方式,网络广泛使用极大地方便了师生的教与学,但是作业直接在网络上传让部分学生钻了空子,直接拷贝同学的作业或是直接从网上拷贝。这种连答案里面写的内容都不清楚的行为严重影响了教学效果,但是若靠老师的手工检测,工作量太大,则现实中难以实现。
前期已经有不少专家针对抄袭检测推出了不少系统及方案, 但是前期的系统及方案主要解决在现有数据库中查找抄袭情况[1,2,3]。目前网络资源瞬息万变,有很多从网络抄袭的情况无法检测出来。针对现状,笔者结合Map Reduce及Nutch提出了新的抄袭检测方案。
2.相关概念
Mapreduce[4]:Map Reduce是一种编程模型 ,用于大规模数据集的并行运算。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
Nutch:是一个网络搜索引擎,是在Java平台上开发的开源网络爬虫工具。该引擎主要分为两个部分: 爬虫crawler和查询searcher。Crawler主要用于从网络上抓取网页并为这些网页建立索引。Searcher主要利用这些索引检索用户的查找关键词来产生查找结果。
N-Gram模型 [5]:是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM,ChineseLanguage Model)。该模型基于这样一种假设 ,第n个词的出现只与前面N-1个词相关,而与其他任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。
3.作业抄袭的模块的分析与设计
根据题目的种类(主观题、客观题),我们采用两种不同的检测机制,教师可以根据需要针对主观题或是客观题进行抄袭检测。
客观题:本地检测,抄袭判断条件:错误题目的答案都一致。
主观题:网络检测,抄袭判断条件:满足Z.B.Andrei定义的文档相似性度量公式[6]。
3.1客 观 题 部 分 抄 袭 检 测
客观题包括单选题、多选题、判断题,对于此部分作业,若同学间错误的答案完全一致, 我们就认为此同学间存在抄袭嫌疑。判断流程如下图所示:
各部分操作步骤如下(下面各步骤序号与上图中的序号保持一致):
步骤1:输入学生作业的客观题部分。
学生作业上传可能包含主观题与客观题,在此部分只截取学生作业的客观题部分。
步骤2:对文档进行预处理。
目前系统要求学生客观题部分的标准输入是题号答案( 如1A, 代表第1题的答案是A), 但是学生输入的时候可能会存在如下与标准不符的答案,对于这部分的输入,系统先进行预处理:
(1)学生直接输出的答案 , 没有题号 , 答案之间用空格相隔。
处理办法:从左到右扫描,在空格处补上题号。
(2)对于没有答案的题目直接省略 ,如直接输出1A3C,缺少题号2与第2题的答案
处理办法:在1A的答案后面补充2___(空格)。
(3)题号或答案前后有空格
处理办法:删除空格。
步骤3:与老师答案匹配。
按照整篇文本的粒度对文本进行分块,字符逐个匹配。
步骤4:答案有错的学生作业。
与老师的答案出现不一致,说明学生作业中的部分答案是错误的,以学生的作业作为一个输出单位,每个输出文档中包含学生所有的客观题部分的答案, 包括正确的与错误的。
步骤5:是否存在完全一致的作业比较。
在这个步骤中采用两两匹配的算法:
3.2主 观 题 部 分 的 抄 袭 检 测
目前因特网规模飞速膨胀,每天都会产生大量的新网页,且有大量网页失效, 如何获取有效信息至关重要,Nutch让这个想法成了可能。在这轮检测中我们先利用Nutch crawler帮助获取有用的网络信息, 然后利用Nutch Searcher通过关键字查询获取教师所需的文本放入对应的数据库中。整个主观题检测的运行流程有两个方案,具体如下描述:
3.2.1方 案一 :在主观题相似性检测方案一中 ,各部分操作步骤如下(下面各步骤序号与上图中的序号保持一致):
步骤1:Nutch crawler操作。
此处利用Nutch crawler从网络上搜索我们指定网站或全网的相关网页信息,并放入数据库A中。
步骤2:教师查询请求操作。
此处用到了Nutch Searcher功能, 教师根据作业中将会涉文本信息放入分布式数据库中,即查询结果数据库Part1,查询结果数据库Part2……查询结果数据库Part n,同时教师输入认定有抄袭嫌疑的阀值。
步骤3:学生作业上传。
把所有学生作业中主观题部分按学生作业1,2……n上传到各个分布式系统中,以便与网络上的信息进行相似度检测。
步骤4:相似度检测。
通用的文档复制(抄袭)检测系统如下图所示[7]
输入模块:输入待检测文档与数据库中存储已注册的文档。在本系统中待检测的文档就是学生上传的作业,数据库中存储的已注册文档即为从网络中获取的文档信息。
比较模块:基于N-Gram模型[8,9],结合Z.B.Andrei给出的文档相似性度量公式计算文档的相似度。
Z.B.Andrei定义的文档相似性的度量公式 ,如下所示 :
公式中:A为待检测文档,B为数据库中已有文档;S(A,w)和S(B,w)分别表示文档A、B中大小为w的所有子序列的集合。
两个文档A,B的相似性是在0到1中的某个数字,两篇文档的相似性越高,说明这两篇文档雷同的成分越多。反之,则说明两篇文档的雷同成分越少。假设系统规定的阀值为。如果Sim W(A,B)≥阀值,那么就认为查询文档A抄袭了已注册文档B的内容。
步骤5:合并。
输出有抄袭嫌疑多个作业清单,部分同学的作业可能与网络多个文档相似度都高于老师设定的阀值, 取相似度最高的纪录,删除该同学的其他记录,以保证获取最有可能抄袭的网络信息。
3.2.2方案二 :
步骤1:同方案一中的步骤1。
步骤2:同方案一中的步骤2。
步骤3:jobtracker在hadoop中监控分布式系统中每个节点运行情况, 在本方案中是用来监控哪个作业与网络资源的相似度已经超过了老师设定的阀值, 并通知其他分布式设备节点无需再对此作业进行相似度匹配。
步骤4:jobtracker有两个功能:(1)发现有作业与网络资源的相似度已经超过了老师设定的阀值, 上报给jobtracker;(2)接收jobtracker的广播, 即接收来自jobtracker关于哪份作业已经有抄袭嫌疑的通知,对此作业进行标记,该分布式节点后续不再进行相似度检测。
步骤5:学生作业主观部分上传:学生的作业按序错开上传到各个分布式设备中, 如学生作业1,2……n上传到分布式设备1中,学生作业10,11……n,1,2……9上传到分布式设备2中,以此类推。用错开方式上传的目的是当该学生与网络中文档相似度检测时达到老师设定的阀值,jobtracker可以在该作业还没有被其他设备检测前及时通知到这些分布式设备,以便提高检测效率;
步骤6:同方案一中的步骤4。
步骤7:合并,简单把前面输出的各个抄袭嫌疑,清单归并,输出给教师。
3.2.3两种方案比较
4.结 语
抄袭检测研究虽然已经有多年历史, 但是结合大数据的抄袭研究还是一个较新的研究领域。本文探讨了基于mapre-duce与Nutch的抄袭检测方案 , 给出了相应的实现方案 , 采用了此方案可以让数据库中存储的已注册文档为网络中的最新文档, 以适应网络资源的快速发展。同时本方案中采用的mapreduce思想可以使用户更方便 ,快捷地使用大规模数据集并行运算,以减轻服务器的负担。
摘要:作业是检验教学效果的一种重要手段,但是不可避免存在作业抄袭的现象。随着网络的进一步发展,学生作业的抄袭从简单的同学间抄袭延伸到从网络抄袭,如何从几十亿网页中找到抄袭的源头成了亟待解决的问题。文章结合Map Reduce及Nutch提出在大数据环境下作业抄袭检测的设计方案。
关键词:MapReduce,Nutch,抄袭检测
抄袭检测 篇2
当前,抄袭剽窃等学术不端行为在大学生中屡见不鲜。华东师范大学进行的《大学生网络道德状况调查》报告显示:57%的大学生承认在网络上抄袭过论文。而在英国,检讨14至19岁青少年学习情况的《纳菲尔德报告》(Nuffield Review)表明,越来越多的学生不能应付在高等教育中独立阅读学习的要求,学生论文造假频繁从互联网上抄袭文章,导致阅读技能严重弱化。
“大学生论文抄袭检测系统”在此背景下由清华同方知网自主开发。大学生论文抄袭检测系统”(简称PMLC)2010年8月“正式发布,它将全面应用于高等院校的日常教学,帮助高校检查学生论文、作业中是否存在抄袭剽窃行为。据同方知网科研诚信管理系统研究中心主任孙雄勇博士介绍,PMLC系统主要用于检测大学生的毕业论文、课程作业、实验报告、调研报告等,具有“论文检测”、“大学生诚信档案记录”、“大学生论文联合比对”、“作业互检”、“多级账号管理”等特色功能。
据同方知网副总工程师兼软件公司总经理张宏伟介绍,PMLC是同方知网“防学术不端行为(TMLC)”产品开发战略的三大核心系统之一。此前同方知网已成功开发面向期刊编辑部的“期刊学术不端文献检测系统”和面向研究生培养单位的“学位论文学术不端行为检测系统”。
系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇已发表文献进行实时检测,快速给出检测结果。论文检测:主要实现论文实时在线检测功能。问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户无权使用。
如“大学生论文联合比对”可把提交检测的大学生论文自动建成各院校的大学生论文库,并将其纳入比对范围,该功能可有效防止学生直接抄袭指导材料、已毕业学生论文等,并可有效防止同学之间论文或作业互抄;“大学生诚信档案记录”可查到每个大学生的论文抄袭检测的历史记录情况,以便老师掌握每名学生的论文诚信情况,做出针对性指导。
这“抄袭”不是那“抄袭” 篇3
谷林先生的著述,先后购得两册:《书边杂写》、《淡墨痕》。后来多事,亦确因地僻难寻,冒昧直接向著者讨购(汇款)《书简三叠》,并声言请题签,先生不以为忤,满足了我的愿望。今天想来,实在有些痴气。2010年,从报上见到谷林编外文由止庵费心集齐印出,成《上水船》甲、乙二册,又四下搜寻,小城仍见不到,便从网上购回。书是小开精装,封面用白色作底,只一条紫边加框,书名字号不大,黑色,在下一幅笺画搭配,十分雅洁,一如谷林文字。
谷林文章是颇为好读又耐读的,所以可以长时间搁在枕边。有时内容虽已熟知,可那精致的文字,氤氲出一片清雅的气韵,到底异样,值得再三进进出出。有人说,好的文字可以随手从任意一页读起,这大不易。谷林先生文字富这样的魅力,虽然在枕边,可并不见得要一气从头至尾读毕。搁着翻着,有些篇目已看过数次,有些章节却似乎没有打开。
昨天晚间,在床上卧读。取起的是《上水船》乙集,随手打开,是《学英文及其它》一篇。文章言作者小学到中学修习英语的情况,其间穿插当年有关英文的轶闻,煞是有趣。譬如举了当时有一权威之“论断”,说中国“四万万同胞”,“于英文一道,称得上精通的,总共才不过三个半!”那个整数“三”,姓名作者也未听人说起,而那“半个”,竟然是大名鼎鼎的林语堂。平时在言传中,笔者也曾听过类似传闻,可见诸文字,谷林先生当为首次。随手捡来好段子,植入文中,收到助兴增趣效果,这其实是生命阅历不意间给人的财富。
接下,作者又谈起并质疑了另一件与英文课本有关的情事:在其中学那几年,英文课本不断改变“系列”,先是采用周越然所编《英语模范读本》,以后改用由开明书店印行的林语堂所编课本。“其时还听到有眉有眼的指说:《模范读本》被开明书店和林语堂告发‘抄袭’,受罚判偿损失若干万云云。我们同学间似乎多数听信不疑,还颇自作聪明地猜想那就是我们学校以后学期改变选用课本的原委”。
在引了周越然的《〈模范〉小史》一段文章后,谷林接下说:“开明书店创建于1926年,可证断无前书抄袭后书之理。作为中学生的我,一度轻信流言,是不读书、不看报之过,犹幸天生就笨嘴拙舌,寡言少语,因之未曾添油加酱,随声起哄,也去掺和播扬这类没影儿的是非。”其实,抄袭林语堂英文课本,倒并非“没影儿的是非”。这在当年出版界也算得上一件热闹的大事,不过牵涉者不是周越然及《英文模范读本》,抄袭之事另有其人。
二
那是1928至1929年间,一套三册装帧讲究、图文并茂的《开明英文读本》问世。该读本由在文坛上颇有声誉的林语堂编写,其中插图为擅长儿童画的丰子恺所绘。由于编写确有特色,很短时间,这套“读本”便为全国许多学校采用为课本;编者林语堂由此书获得丰厚的回报,开明书店也借助这套书大大赚了一笔,并在上海立下了根基。
教科书的编写,在当时有相当的回报。谷林先生所言周越然,便是借助编写的一套《模范英文读本》,靠抽版税,不仅在上海盖起了洋房,还搜藏了大量稀有珍本和禁书,过上了叫一般人眼热的富翁生活。林语堂所编《开明英文读本》畅销之后,也引起了同行的眼热。当时上海有一家世界书局,经理叫沈知方,他看到此情形后,便委托当时大学毕业未久的林汉达(1949年后曾任《中国语文》杂志总编辑;编写过《春秋五霸》、《西汉故事》、《三国故事》、《上下五千年》等通俗读物)也来编一套英文教材。为赶学校开学使用,这套英文教材在很短时间编成。1930年2月,林汉达所编这套《标准英语读本》开始推出。据笔者在当时报纸查阅时见到,世界书局当年在多家报刊打出的广告词为:“采取直接教授法,注重表演,学习者既循自然,又有兴味。”“取材精审,体裁活泼,生字平均,成语丰富,文法简易,会话自然,语音准确,插图新颖”云云。
从常理看去,林语堂早年就读的是教会所办的寻源书院,四年间基本以英语为书面及口语,打下了很好的基础,后入教会学校圣约翰大学;之后又到美国“哈佛”留学,再转赴德国莱比锡大学,研究语言学,获哲学博士学位。由他来编写英语教材,自然十分适当。林汉达当时大学毕业未久,又很短时间编出《标准英文读本》,这虽并非不可能,可要达到林语堂所编教材的水准,或完全另起锅灶,无所依托地编出一套合适教材,大约就不很容易;更重要的,他编的这套书影响到了林语堂和开明书店的利益。
此时,《开明英文读本》销路正旺,对于开明书店,这几乎成了他们的命根子。编者林语堂当然也从中大大获益。眼下冷不丁冒出世界书局《标准英语读本》,自然引起他们高度关注。不久,有人向开明书店老板章锡琛举报:世界书局那本英文教科书,同开明书店的书很相像。莫不是抄了些,仿了些?章锡琛一听,马上令人买来一套,交林语堂审核。
对这影响书店同时影响自己收益的情况,林语堂自然格外关注。他将林汉达所编与自己所编书一比较,马上认为:《标准英语读本》形式上全与《开明英文读本》相同,而且一些课文都是从自己课文中抄下的;其他类似、雷同处也很不少。在与书店老板章锡琛商量后,他们便将书中抄袭、雷同之处一并附上,写信通告世界书局,希望他们停止出版。世界书局好不容易才搞到一套英文教材,又借着与“开明”教材相仿的便利,正准备多捞一把,对开明书店的来函,自然搁置,不愿理睬。
见到世界书局如此态度,开明书店有些恼火。他们便请自己的法律顾问,起草函文,对世界书局提出严正警告,要求他们立即停止发行此英文教材,并赔偿损失。世界书局老板接到来函,不以为意,甚至有些推脱;他只把这封函交给该书编写人林汉达,让他个人“负责解决”。
三
林汉达当时只三十挂零,大学毕业未久,骤然遇到这样的“官司”,自然毫无办法。无奈之下,他只好向世界书局编辑所长范云六求助。范云六原以为只是一般纠葛,便好心为林汉达写给开明书店老板章锡琛一封介绍信:“兹启者,鄙局出版‘标准英语’,闻与贵处出版‘开明英语’有相似的嫌疑,刻由鄙处原编辑人林汉达君来声明一切,希望免除误会……”
林汉达持这封介绍信见到章锡琛后,章本有和解之意,可此事牵涉编写者,便让林汉达直接去与林语堂见面相商。林汉达几番寻不到林语堂,便留下一张名片。在名片背后略微转述自己的意思:“语堂先生,今为和平解决英语读本,讨教如何修改,以便答复三条办法……”这里所说“三条办法”,是林语堂提出要求世界书局应修改之法:一、文句抄袭者;二、一篇中雷同之数处者;三、编排中形式故意模仿者。
林汉达见到林语堂后,林语堂将此三条的依据一一指出,林汉达无话可说。回到世界书局,他将逐条悉数反映。书局却认为,如此修改,那该课本就几乎无法存在,于是便给开明书店复函,只承认在课本第三册上,有一首诗系从林语堂教材直接录取,其余部分,或辩称“不谋而合”;或什么“智者所见略同”云云,指望以拖的法子,达到不了了之的结果。
世界书局这些作为,显然不能令开明书店满意。他们便将世界书局抄袭自己教材之事,捅到报界,试图以舆论施加压力。世界书局不甘示弱,他们也让律师在报刊上刊登“启事”,以“公然毁损本书局名誉”,向开明书店提出“警告”。世界书局不仅不对自己教材抄袭之处作出修订,反而言之凿凿,“警告”开明书店一番。为有力回应,开明书店随即将世界书局编辑所长致章锡琛的介绍函,林汉达在名片上留给林语堂的文字等,一一照相制版,发表在多家报纸头条,作为“世界书局承认《标准英语读本》抄袭《开明英文读本》之铁证”。
世界书局当时在上海,实力排在“商务”、“中华”之后,比起开明书店,力量显然雄厚。见到开明书店在多家报刊刊发往来函件作为“抄袭”证据,便以事关“诽谤”,将“开明”告上租界的特区地方法院。为保证诉讼成功,他们还花重金为林汉达聘请了上海著名女律师郑毓秀,希望一举击败开明书店。
面对如此情形,开明书店感到无奈又可笑。这些主事者虽身在商海,可到底是文人,无奈之际,他们便花钱,在多家报纸上刊出一则旧时代的“笑话”。笑话大意是说一个人住店,丢了狐皮大衣,最后在旅店另一人的箱子里寻见。这位旅客说,我是偶然借一下,不是偷,还给你就是了。丢大衣的人说,你既然承认偷了大衣,我要到官府去告你。那位偷大衣者却说:你诬蔑我是贼,是“毁损余之名誉信用,子罪大矣!吾将愬诸有司”。反客为主,反而要将丢大衣者告上法庭。“笑话”的寓意一目了然,不过这笑话也让“开明”付出了一定代价。
四
说实在的,当时“开明”手里虽然有世界书局抄袭的证据,可司法不公、政治黑暗,自己不仅没有充分胜算,反而颇为紧张,恐怕一旦“诽谤”罪成立,赔偿起来,在上海滩刚有些起色的书店有些吃不消。没法子,老板章锡琛一方面继续在报刊上发文辨正,一方面与林语堂一道,将两部英语教材雷同、相似、抄袭之处,一一加以对照说明,并将结果交南京教育部鉴定,希望能获得著作权保护。
正在此时,世界书局的英文课本也送到教育部。编审处读了这两部教材,也形成了两派。对抄袭一说,有人认为,这些资料均为外文,大家都可以引录。另有多数人经过比照,认为确实存在“抄袭”,两边争执不下,最后采取票决。结果,认定世界书局英文课本确有“抄袭”、“冒效”开明书店课本的地方,于是决定对世界书局《标准英文读本》不予审定,禁止发行。
教育部审查结果下发,由上海市教育局转达开明书店。此时正值法院准备对“世界”、“开明”诉讼案判决之时。见到教育部的审查结果,法院当然不能判开明书店在报刊宣传世界书局“抄袭”为诬枉,只好在判词中,认为开明书店在文中用了“以后编辑图书,希望多聘通人,慎重将事”的话,是指责对方编辑皆为“不通”,属“公然侵慢之辞”;再一点,是开明书店在报纸上刊登“笑话”,把对方“譬诸窃盗”,“应构成侮辱罪”,因此判处罚金三十元。
在接下来的几天,“开明”以“开明书店为英文读本讼案答垂询诸君并谢各界”为题,在报刊上登出一组文字:一、法院“刑事判决书”;二、教育部审查结果及上海教育局给该店的“训令”;三、对各界人士表示感谢!表面看去,开明书店被判“公然侮辱罪”,并被判处罚金,可明显是象征性的——区区“三十元”。最重要的,是世界书局“抄袭”,“冒效”开明书店教材事实成立,并被判“停止发行”,这才是实质最要紧的,是开明书店最乐意看到的结果。
这一番折腾,许多已经采用了世界书局《标准英语读本》的学校,纷纷要求退还书款。不仅此书,还连带影响到该书局其它相关书籍的销售。另一方的开明书店,因为官司的实际胜利,经报纸公布,等于给自己的教材打了难得的广告。从此之后,《开明英文读本》销路直线上升,连老资格的“商务”所出周越然《模范英文读本》等同类书籍,也望尘莫及。
此次诉讼案后,林语堂所编的这套三册《开明英文读本》从此更加风行。陆续发行二十多年,他个人所获版税数十万元(当时这堪称天文数字);开明书店也因为这套书大大获利,渐渐发展成上海商界不可小觑的大书店。《标准英语读本》的编者林汉达,在此事件中颇受挫折,可他更加发奋读起书来,事后不久他到美国留学,获硕士学位。回国后从事拉丁化新文字研究,著有《西洋教育史讲话》、《中国拼音文字的整理》等研究著作。从后果看,此事的教训成了他生活道路上的助推力量。
抄袭检测 篇4
程序代码抄袭检测关键是计算代码的相似程度即相似度。相似度越高,抄袭可能性越大;相似度越低,抄袭可能性越小。但是,个别语句相同的程序不能算作抄袭。只有当两个程序代码的相似程度超过某个给定的阈值时,就可以判定为抄袭。
1 发展现状
国外对程序代码抄袭检测技术的研究开展比较早,最早在20世纪70年代初就有学者开始研究检测大规模代码复制的技术。而国内在这方面研究从本世纪初逐渐多了起来。到目前为止对程序代码复制检测技术的研究基本被分成两类:属性计数技术和结构度量技术。
1.1 属性计数技术
属性计数法是最早使用的计算程序代码相似度的方法。此方法在计算相似度时不考虑程序代码的内部结构,而只对代码的一些特定属性进行处理。它的实现过程首先是将程序代码的一些预定属性抽取出来,然后采用某种公式进行计算,最后得到相似度结果。
20世纪70年代,Halstead[1]最早提出了属性计数法,之后Ottenstein[2]使用该方法实现了第一个代码抄袭检测系统,用于自动检测FORTRAN语言编写的程序代码的抄袭。随后还有一些更复杂的抄袭检测系统应用属性计数法检测程序代码的相似度,如:Grier的Accuse[3]系统以及Faidhi和Robinson的系统[4]。
1.2 结构度量技术
属性计数法在计算相似度时不考虑程序的内部结构,但在程序设计中,程序的内部结构至关重要,对相似度的计算结果会有很大的影响。比如程序中过程、函数的调用,语句的书写顺序等。结构度量法就是在计算程序代码的相似度时考虑了程序的内部结构特点,使相似度的计算结果能更真实的反映程序的相似情况。
现在比较好的抄袭检测系统主要应用结构度量技术检测程序代码的相似度。具体方法是:首先对程序源代码进行处理得到能代表程序的、包含其内容和结构信息的特征串(token);然后采用一种比较好的字符串比较算法对特征串进行比较,根据比较结果计算相似度。比如YAP系列等著名的抄袭检测系统就主要应用结构度量法检测相似度。而这些系统在对特征串进行比较时都采用了效率比较高的串最大匹配算法,比如YAP系列中的YAP3中就采用了高效的RKR-GST算法。
2 关键问题
检测程序代码抄袭的关键是计算代码相似度。计算相似度时首先需要对程序源代码进行处理,提取到能代表程序的包含其内容和结构信息的特征串,即特征值。提取特征值的方式有多种,如计算属性,提取指纹,计算圈复杂度等,据此可将代码抄袭检测方法划分为两类:采用基于词频统计的方法和采用基于字符串比较的方法。下面就采用字符串比较方法中的几个关键问题进行研究。
2.1 预处理
在编程序时,不管用哪种计算机语言,都会在程序中加入适当的注释和空格,而这些注释和空格对程序结构和内容没有本质影响,但会对程序代码的特征值产生影响。程序抄袭者往往会利用这一点来逃避代码抄袭检测,比如可以在程序代码中允许的位置随意添加、删除注释、空白等。这种修改很容易,修改后的代码和原代码没什么区别,但提取到的特征值是不同的。因此在提取程序特征值前首先要对程序代码进行预处理。在预处理过程中,通过扫描所有的代码文件,过滤掉其中的注释和无用空格,留下的只是数量繁多的字符串,这样可以杜绝它们可能给相似度检测带来的任何不好影响。接下来的特征字符串生成和代码相似度计算,都是针对经过过滤的不含注释和无用空白的代码。
2.2 生成标记串
抄袭者在抄袭程序代码时,很少是把原代码原封不动地复制过来,常常要力所能及地做一些简单的修改。除了上面提到的插入、删除空格和注释外,常遇到的还包括对程序代码的一些表面上的改动。比如修改变量名,如果只把源代码的变量名做了修改,其他元素都相同,那么这两段代码的结构基本一样,语义也不会发生改变,如果仅对代码做这样的修改之后作为自己的使用本身也是抄袭。还比如对语句的执行顺序的简单调整等,都是对程序代码的表面的修改,不会影响抄袭关系。所以检测抄袭过程中必须能够忽视程序表面上的不同,集中在实质的相似性比较上。因此,比较前要对提交上来的源代码进行分析,分解出其中的词法元素并进行标记化处理,忽略与程序结构无关的表面因素,提取出代表程序结构和内容信息的特征串,这样才能提高相似度的准确性。在软件抄袭检测技术中,多数是将源程序的词法元素表示成某种特定的形式,整个程序段转化为一个标记字符串,然后再选择某种字符串比较算法来度量两个标记串的相似度。
对程序的标记化处理是一个较复杂的过程,需要对源程序根据程序所使用的语言特点进行词法分析并对结构等信息进行抽取。例如国外Dr.L.van Zijl等人实现的抄袭自动检测系统COPY-D-TEC[5]的标记转换过程使用的是antrl[6]词法分析工具。antrl对源程序进行标记化处理,以获取标识串。
2.3 转换规则
程序代码经预处理后剔除掉空格、注释等无用信息,然后再做词法分析分解出词法元素,将其按特定的转换规则转换为待计算相似度的标记字符串。转换规则是生成标记字符串的依据之一,语言不同则转换规则不同。一般根据所选择的语言,用可扩展标识语言(eXtensible Markup Language,XML)分别定义它们的转换规则。
2.4 相似度比较
程序代码经过标记化处理后提取出能代表程序的标记字符串,即包含程序结构和内容信息的特征串。比较程序代码的相似度就是采用某种字符串比较算法计算程序特征串的相似度。字符串比较也叫字符串匹配,是计算程序间相似度的关键。可将每个特征串看成由若干个子串组成,那么两个特征串中相同的子串为它们的公共子串,因而,它们的相似性可用所有公共子串在整个串中所占的百分比表示。计算方法如公式1[7]:
式中:|A|、|B|为token串A、B的长度;match(i,j,length)为在A中起始位置为i,在B中起始位置为j,长度为n的子串;Matches为公共子串集合。
字符串匹配算法可在两个待比较程序段的特征串中搜索出最大匹配子串。然后统计匹配字符串,作为计算字符串相似度的依据。进行字符串比较的算法比较多,下面以BF算法为例介绍一下串匹配的原理。
BF算法即蛮力匹配算法,其算法简单,容易理解。主要思想是:模式的第一个字符与文本的第一个字符进行比较,如果相同,就继续比较后面的字符,否则,文本的起始位置加1,即模式右移一个位置,再进行比较。如果模式与文本中一段连续字符串都相同,则匹配成功,返回当时文本的起始比较位置,否则匹配不成功。
BF算法如下:
其中,文本:text[0…n],n为文本长度;模式:pat[0…m],m为模式长度,且不为空串。文本串和模式串的长度都存放在对应数组的0号单元,串中字符从1号单元开始存放;且n≥m。
3 结语
程序代码抄袭现象越来越严重,高效自动的代码抄袭检测系统成为反抄袭的必要工具。检测程序代码的抄袭关键是计算代码相似度。计算相似度时首先需要对程序源代码进行处理,提取到能代表程序的包含其内容和结构信息特征值。根据提取特征值的方法可将代码抄袭检测方法划分为两类:采用基于词频统计的方法和采用基于字符串比较的方法。
参考文献
[1]M.H.Halstead.Elements of software science.North Holland,New York,1977,17:5-7.
[2]KARL J.OTTENSTEIN,An Algorithmic Approach to the Det-ection and Prevention of Plagiarism.ACM SIGCSE Bulletin,1976,8(4):30-41.
[3]GRIER,SAM.A Tool that Detects Plagiarism in Pascal Prog-rams.Twelfth SIGCSE Technical Symposium,St Louis,Missouri,1981:15-20.
[4]FAIDHI,J.A.W.AND S.K.ROBINSON.An Empirical App-roach for Detecting Program Similarity within a UniversityProgramming Environment.Computers and Education,1987,11(1):11-19.
[5]McElory Hoffmann.The Plagiarism Detector COPY-D-TEC
[6]龙世滔,吴信才,郑晓峰.基于ANTLR的XML解释器的设计与实现.现代计算机,2004,06(189):6-9.
抄袭检测 篇5
第一:检测系统没想象中可怕,检测比对的是相同字段,而不是相同意思,所以只要大家换一种表达方式,意思是一样的,也查不出来,修改方式有改词、换句、改变描述方式(变原句为倒装句、被动句、主动句等)、打乱段落顺序、删除关键词汇、关键句,增加句子与句子之间关联词等。经过实践证明,使用以上方法结合,可有效降低复制比,保证顺利通过。
例如下句:过热故障中的过热与变压器正常运行下的发热是有区别的,正常运行时的其发热源来自于绕组和铁芯,即铜损和铁损,而变压器过热故障是由于受到有效热应力而造成的绝缘加速劣化,它具有中等水平的能量密度。
几乎被标红,说明与相似文献存在重合和高度相似,经过以上方式结合,本句可改为:
过热故障中出现的过热容易与变压器正常运行下的发热相混淆,后者是因为其绕组和铁芯会出现铜损和铁损的现象,这是正常运行过程中的发热,而变压器过热故障是受到有效热应力造成的绝缘加速劣化,具有中等水平的能力密度。
第二:尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。
第三:知网论文检测的条件是13字单位以上的相似或抄袭都会被红字标注,但是必你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。
第四:投机办法(不推荐):
1、用谷歌翻译工具先把标红内容译成英文,再译成中文,在整理整理就测不出来了。
2、将标红的重合内容做成图片形式,测不出来。
例如下句:
过热故障中的过热与变压器正常运行下的发热是有区别的,正常运行时的其发热源来自于绕组和铁芯,即铜损和铁损,而变压器过热故障是由于受到有效热应力而造成的绝缘加速劣化,它具有中等水平的能量密度。
几乎被标红,说明与相似文献存在重合和高度相似,经过以上方式结合,本句可改为:
过热故障中出现的过热容易与变压器正常运行下的发热相混淆,后者是因为其绕组和铁芯会出现铜损和铁损的现象,这是正常运行过程中的发热,而变压器过热故障是受到有效热应力造成的绝缘加速劣化,具有中等水平的能力密度。
这样修改几乎可以降低抄袭率一半。
再举一例:
标红抄袭段落:
上世纪九十年代以来,在生产力提高、科技进步、跨国公司活跃等因素的共同驱动下,经济全球化席卷全球,世界经济越来越成为一个整体,跨国公司根据其战略部署在世界范围内对生产要素和资源进行优化配置和重新整合,这导致国际贸易和分工的方式悄然发生了变化,由传统的产业间分工模式逐步演化为同一产品不同工序和区段上的分工体系,即产品内分工。
论文更改为:
从20世纪末以来,在新的科技革命及跨国公司迅速发展的带动下,全球经济日趋一体化,各国经济在世界范围内实现了竞争与协作相结合的良好共存局
面。在全球范围内,各生产要素由于跨国公司的快速发展实现了优化配置和重新整合,从而使国陈贸易和世界分工的方式产生了适应新时代要求的变化,传统的产业分工方式开始转变为因产品在工序和区段上的差异而进行的分工方式,这也就是我们所说的产品之中的分工。
例三:在透明水杯的清水中放入少量纤维进行搅动,便可以直观地发现纤维呈立体悬浮状乱向分散,且长时间放置都不会有太大变化,说明合成纤维的质量较好;质量差的纤维经搅动后可能分散,但时隔不久便会上浮为一絮状层。质量差的纤维在混凝土的实际配制过程中多不易均匀分散。
本段完全被标红,修改方式只有一种,就是打乱顺序,重新组织。
将少量纤维放入盛装清水的透明容器中,边搅动边观察纤维变化情况,如果合成纤维质量较好,那么就可以直观地看到纤维呈立体悬浮状分散,随着时间的推移,位置也不会发生明显的变化;若合成纤维质量较差,那么搅动的过程中,纤维可能分散,并且容易上浮形成絮状层。质量差的纤维在混凝土的实际配制过程中多不易均匀分散。
例四:对施工单位或业主提出的设计变更要求要进行统筹考虑,确定其必要性,同时将设计变更对施工工期和费用的影响进行全面分析,非改不可的要调整施工计划,以尽可能减少对工程的不利影响。
修改为:
施工单位或业主一旦提出设计变更要求,要进行统筹考虑,考察变更的必要性,同时,将设计变更对施工工期、费用等方面可能造成的影响进行全面而科学的分析,遇到非改不可的变更要调整施工计划,尽可能将其对工程的不利影响降到最小
第五:(网上盛传,仅供参考)
应对cnki中国知网学术不端论文检测系统之修改论文技巧
论文测谎仪(cnki中国知网学术不端论文检测系统)在一定程度上遏制了明目张胆的学术作假行为,但也助长了造假的水平进化。
“反抄袭”软件遭遇大学生“反反抄袭”,越来越多的学生已经开动了“脑筋”。毕竟大家从小就在应试教育中摸爬滚打,大家早就练就了一身超常的反侦察功夫,“道高一尺,魔高一丈”,为了对付“反抄袭”软件,大学生想出了五花八门的“反反抄袭”密招。
“反反抄袭”密招一:改写
躲避“论文测谎仪”的方法听起来有些笨,但却很“实用”,那就是——改写。“不是论文不能抄,要看你会抄不会抄!”。
东拼西凑其实并没有过时,关键在于要仔细,不能露出马脚。首先在不同的资料当中找到我需要的东西,然后把每句话变变句式,换换说法,加一些解释性的扩充,略作增删,最后把这些部分组织到一起,论文就大功告成了。虽然繁琐一点,但是最后出炉的论文,绝对就像去韩国做了整容手术,焕然一新!再牛的测谎仪见到我这论文,估计也只有哀叹的份儿。
多加参考书目,把脚注一通乱加,那就是双重保险了!”有的时候,东拼西凑出一大段话,但是又不知道怎么改写更好,就干脆给这段话原封不动地加上一个引号,然后再给这段话编一个相应的脚注。首先,‘引用’部分不算作抄袭,论文测谎仪会自动剔除;其次,老师根本不可能有精力去检查我的每个脚注是否真实。这样一来,我的抄袭怎么可能被发现呢?
“反反抄袭”密招二:翻译
要抄,就不能留下任何痕迹。她的方法更加繁琐,但也更加保险,那就是翻译。跨语言的论文测谎系统还没有研发出来。广泛查阅外文资料,挑出可以为我所用的部分,按照一定框架合在一起,一篇拼凑的英文论文就诞生啦!再把它翻译成中文,毕业论文不就有着落了吗?说抄袭,测谎仪软件查得出来吗?
这种方法对英语水平有很高要求,不过,英语一般的同学也有自己的“门道”。有些同学付钱给学校里英语专业的研究生,请他们对自己的“双语论文”全程把关。“很多学校的墙上贴着这种小广告,英语专业的学生为人操刀论文,价格也不菲,少则几百元多则上千元。
“反反抄袭”密招三:取巧
改写也好,翻译也罢,都是力气活儿。几万字的论文,如果字字改写,句句翻译,恐怕论文没写完,已经是人比黄花瘦,华发上鬓头了。理工科学生是天下最幸福的人,因为“理工科的论文,变变数据图表啊,变变操作环节啊,就可以变成自己的东西了,反抄袭软件根本查不出来”。理工科的个人成果要好出一些,数据不一样,画图不一样,结果就不一样。自己写个软件,下载一个源代码,然后根据需要加以修改,就能把代码变成自己的啦!最后用自己的框架搭建起来,毕业设计就完成了。
“反反抄袭”密招四:Google新用
如果说以上所有同学的“反反抄袭”密招都还在大家的理解范围之内的话,那么这种“反反抄袭”法,则让人瞠目结舌,以为自己遇到了火星人。
这种方法,命名为“Google法”。“所谓‘Google法’,就是找一篇现成的论文,把论文的每一段都用Google在线翻译成英文,然后将翻译好的英文用Google在线翻译全部转回中文。猛地看上去,跟原文差不多;可是仔细一看,其实每句话都不一样!只要自己再把少量的语病改一改,就大功告成了。”
提交论文之前,上淘宝网,有很多卖家会提供论文检测服务!卖家也持有类似的论文检测软件,通过卖家可以查看自己的论文有哪些破绽,再把露出马脚的部分精心修改。这样一来,把毕业论文交上去,就不会有什么风险了。有很多同学都准备这样做,花钱买个放心呗!
第六:万方检测与知网检测的区别:中国现在论文检测只有知网系统和万方系统(市场份额知网占90%,万方占10%),二者分属于不同的公司,犹如通讯行业中的联系和移动;知网和万方互有优缺点。万方收录的文献不如知网的全,但是万方检测比知网优惠很多!所以万方的查出的抄袭率会低一点。根据多年的经验,一般情况下在2到10个百分点左右,意外情况也有,如果一篇文章万方没有收录,知网收录了,但是您大量抄袭这篇文章,这样的话万方检测就查不出来,检测结果差距就大了(见过差别在50%以上的,实在是让人无语).【专家建议】:第一:如果您刚刚开始写论文建议参考万方的数据库的论文,可以规避高校的知网检测,因为中国大部分高校是知网检测。第二,如果您的论文已经完成,建议您到万方检索下自己参考的文献,如果都有就不会差别很大。
“李鬼”何必抄袭 篇6
盗版商品会给名牌企业带来巨大的伤害,但不管仿制品做得有多“A”,终归都是违法的。和盗版一样令名牌企业感到头大的乃是品牌中的“傍大款”者,钻法律的空子,占尽名牌的便宜。
其实“傍大款”也有高下之分,手段高明者乃是沿着先行者走过的道路,规避开拓新市场的风险,理性判断市场容量和品牌存在之可能,打造属于自己的独特的传播和营销道路,这一类仿效跟风者是无可厚非的。最令人讨厌的乃是钻《商标法》的空子,在字眼上做文章的那部分企业,所谓大牌的“李鬼”说的正是这一部分企业。记得很早就有一段电视小品讽刺过这种作为,你出“郎酒”,他出“狼酒”;你出肯德基,他出“啃的鸡”。中国汉字博大精深,遇上此等情形,怎不令人挠头?订阅《成功营销》请点击http://www.vmarketing.cn/dingyue
“李鬼”群起,结果是许多企业创世之初先将各种可能的名称一律注册到位,维护自身品牌的成本无形中增加了许多。对品牌一知半解的消费者则更是云里雾里,买一块“劳斯丹顿”,真不如去秀水淘一款名表的仿品。
不过老话题又有了新状况,故事还得从一款名为“阿迪王”的鞋子说起。
我是一年多以前在广东佛山看见这款鞋子的专卖店的,开得有模有样,还请了外国球星做代言,从广告词到LOGO,都活脱脱让人感觉这个阿迪王是阿迪达斯的远方表亲。
话说大部分的“李鬼”多是猫在消费水平不高的城镇乃至乡村满足部分消费者对名牌的奢望,所以“李鬼”虽多,对正品其实构不成真正意义上的挑战,也未曾见有哪个“李鬼”大摇大摆露出头了。然而,这个阿迪王不然,不仅分号开得火热,甚至开始在大众媒体上投广告了!
这家企业的前景将如何,还得看他们的造化。我想说的是,化用成名品牌本身已经给自己的品牌打上了缺乏原创性的烙印,想要在更为广阔的市场,在更高级别的游戏环境中获得成功是很难的。因为创造力本身就是品牌成功的灵魂所在。订阅《成功营销》请点击http://www.vmarketing.cn/dingyue
有梦、有对市场的企图心是好的,如何跟随成功者的脚步创造后进品牌的奇迹,有这样两个品牌很值得阿迪王们仔细揣摩:一是蒙牛,二是仁和药业。
蒙牛大概是成功企业中最为有名的“老二”了,从“老二”起步,蒙牛正慢慢接近当老大的梦想。当年蒙牛斥资上亿在央视投标,也曾招来业界的一片质疑之声,需要注意的是,媒体的运用之外,对市场容量的精确判断和传播手法上的出人意料,才是他们获得今天成功的关键所在。
另外再看仁和,无论是女士洗液还是滴眼露,仁和都不是先创者,然而在这两个品类上都占到了很大的市场份额。蒙牛以“老二”起家,最终要去分割的是老大的市场,要挑战的是老大的地位。仁和则不然,他们会去判断市场中的先进品牌已经拿下了哪些市场,在哪些市场上还存在机会。通过定价策略和渠道建设上的差异化,仁和迎来了长尾的胜利。
要么你的策略能另辟蹊径,要么你对市场有过人的洞察力,依靠低级的抄袭终归不是正道。我们的很多企业一方面对成名品牌盲目崇拜,另一方面对基本的品牌建设原则和道理缺乏学习;一方面是中国的业界研究专家们已经将营销理论推至一定境界,一方面却又是大量的中小企业仍旧保持很大程度的无知……订阅《成功营销》请点击http://www.vmarketing.cn/dingyue
阿迪王们缺乏的不是资金,缺乏的是自信和必要的学习,所以我诚恳地建议所有的阿迪王们,如果你真的想要做属于自己的品牌梦,与其花时间去拾他人牙慧,不如好好沉下心来学习一下《成功营销》,或为自己仔细挑选一家合适的广告代理公司吧。
更多精彩内容请浏览成功营销网站:www.vmarketing.cn
订阅《V-MARKETING成功营销》杂志请点击http://www.vmarketing.cn/dingyue
订阅电话:010—85650313
认真抄袭,大胆创新 篇7
某日, 某农机QQ群一帮闲人, 也包括笔者, 聊起中国农机如何赶上国外水平的话题。七嘴八舌一通议论, 一个核心问题, 即抄袭与创新。论点罗列如下:
关于差距:发动机技术、液压提升、智能化控制、换挡技术、舒适性以及材质、做工、用油差距太大。排放标准现在实行国2, 国外已欧4了。国外的今天就是我们的明天。
关于提高:现阶段我们走别人的脚印, 虽然说起来不怎么好听, 但却是解决问题最有效的办法。总是走别人的脚印, 没有突破。要想提高制造技术, 首先要提高人的素质。
关于抄袭:抄袭之风由来已久, 很多厂家拿来主义, 节省研发经费。即使申请专利有时也是废纸一张。为什么会担心别人抄袭, 就是现在的很多产品技术含量太低, 太容易被模仿。从技术角度说, 那就是产品没有含金量。很多厂家只会依葫芦画瓢, 但掌握不了核心技术。
这也是不自信的表现之一, 有时间担心, 还不如踏踏实实地提高自己产品的技术水平。
为什么会抄袭成风?违法成本低是关键。打个漂亮的擦边球, 对方只能干瞪眼, 没辙!
关于国外产品:有很多简单的技术却是最实用的技术。动力换挡技术国内很多厂无法仿制。
注意看国外的产品, 很多很简单的东西申请了专利, 没有人敢仿。CAN总线、智能控制等技术, 看到了才知道其实也很简单。
关于赶超:我们要向动力换挡、CVT等高端技术进军。我们差距还是很大的, 不过有信心, 也有决心赶超他们。中国农机的发展之路:抄袭 (模仿) ———研发———再模仿———再研发.........。模仿国外的技术是可以的, 模仿自己人的东西那就大可不必了, 这是一个必须的过程, 还是必然的过程?模仿是否必然走向超越?现阶段, 对国外的技术而言, 是必须的。
关于研发:只有研发才能超越。有些研发并不用多少成本, 细心地去观察, 还是可以发现很多东西的。坐在办公室是无法搞研发的。农机厂家闭门造车的比较多。生产厂家研发, 应该多跟使用者沟通, 多听听他们的意见, 会有意想不到的收获。国家应该加大扶持真正意义上的农机研发项目。
以上是原汁原味的网谈会内容, 笔者只是把修饰语略去, 把观点性的话语摘录出来, 围绕着抄袭与创新, 虽然有些观点偏颇, 却也真言直感, 形散神不散, 极富思考价值。
读者要问了, 发了一堆网帖, 你的看法是什么?笔者的看法, 其实在本文开初就有所言明, 模仿是所有人学习、研究、开发的基础。我们所有的成就都是在学习、总结前人、别人的基础上进行的, 没有《雷锋日记》, 我们那代人真不知道怎么写日记。当然, 我们也不都写成《雷锋日记》, 或叫雷一、雷二, 版本不同而已, 全国都千篇一律, 这就要求创新和超越。
先从抄袭开始 (文雅点叫模仿) , 再从质地与功能等方面局部创新, 再整体创新。这是永远绕不过去的过程, 毕竟我们无法建造空中楼阁, 接地气就要在前人、别人的基础上再发展。
遏制抄袭,教育在行动 篇8
似乎从有作业以来, 学生抄袭作业现象就已经存在, 而且形式多种多样 :有在早晨到校抄袭的, 有在课间10分钟抄袭的, 有在中午教室里抄袭的, 有找样题抄答案的, 甚至还有请同学代做作业的, 现在甚至发展到利用互联网抄袭作业了。这一现象不能不重视, 也不能放任不管。问及学生为什么抄作业, 无外乎这几点 :不会做、懒得做、做不完、忘记做……从学生的回答中, 其实不难发现造成学生抄作业的原因是多方面的, 有学生的主观原因, 也有外界的客观原因。无论什么原因, 抄袭作业终归是一件让老师、家长不愉快的事情, 而且大有“除之而后快”的决心。
诚然, 学生抄袭作业会滋生惰性, 妨碍正常的教学工作。从表面上看, 抄袭作业的主要责任在学生, 但作为教师, 在批评学生的同时, 是否也应当反思一下自己的教学 :是否拥有先进的教育理念和适合学生自身发展的教学行为?布置的作业是否能激发学生的兴趣和求知欲?作为家长, 你是否在老师布置的作业以外又增加了“优+”作业, 在孩子做作业时你是否将样题答案或网络答案无意识或有意识地提供给孩子作为参考?作为社会, 在指责抄袭的同时, 是否也应当整治一下市场 :是否提供了合适的教辅资料和引导学生自主学习的学习方式?提供的作业是否能提升学生的四基能力和素质?
我们要减掉的是学生过重的课业负担。
二、试问, 作业的价值是什么
学生到底为什么抄袭作业呢?对于这个问题, 笔者曾经调查过学生, 归纳起来无非是不会做、作业太多做不完、懒得做、忘记做。究其原因 :不会做, 可能是教师课堂教学任务没完成造成的, 要么作业太难, 要么学生没有学会 ;作业太多做不完, 是因为除了课堂作业, 还有教师和家长布置的课外作业 ;当然还有学习成绩好的, 觉得一些简单的题不值得做 ;而忘记做, 则是教师忽视了学生品德教育的结果。
由此不难看出, 学生抄袭作业的主要原因是部分教师、家长对作业价值的认知存在一定的片面性, 他们过分夸大了作业在深化知识、巩固知识、检验学习效果方面的作用, 从而产生了违背教育规律的做法。
因此, 教师要在正确的作业价值观指导下设置作业。作业的设置要符合相应阶段的教育目标, 要适应教材的编排结构, 选择的作业题目要难易适度, 有利于激发学生的认知冲突。
前苏联心理学家维果茨基的“最近发展区”概念指出 :“只有那种走在发展前面的教学才是良好的教学。”要使学生有做作业的动机, 必须适时激发学生的认知冲突, 与学生知识水平平行的题目不能使学生产生不断的心理需要, 过难的题目则会挫伤学生的积极性。因此设置作业时, 基本题、综合题和开放题的设置比例应该是适当的。在设计作业时, 要善于整合多种资源, 兼顾作业的知识性、趣味性、多样性、实践性、挑战性, 给学生提供独立获得新知的机会, 让学生体验成功探索与发现的快乐。当学生边玩边学习时, 他们还会抄袭作业吗?
再就是作业形式的多样化, 多元化同样可激发学生做作业的动力。为此, 要交替采用书面作业、课堂口述、集体讨论、习题归类编辑等多种方式激发学生的兴趣。作业设置的开放性、层次性以及选择性同样也能让学生在做作业的同时, 选择适合自己发展的“有效作业”。如成绩优异的学生可选择综合题, 提高自己的思维水平 ; 成绩平常的学生可只选择基础性作业, 巩固所学内容, 作业不一定“一刀切”, 这样也减少学生抄袭作业的机会。除此之外, 评价学生作业的方法也非常重要。教师既要客观地判断正误, 也要善于在作业的错误中发现其中蕴含的思维火花, 并及时给予鼓励。即便是发现抄作业的学生, 也可以正确引导, 比如让他说出从同学的作业中学到了什么, 哪些对自己有用, 哪些对自己不实用。通过对作业的评价, 达到检验教学效果的目的, 并为调节控制教学过程提供信息。
三、抄袭, 到底该怎么解决
治理学生抄袭作业的初期, 作为班主任, 笔者协调各科任老师, 发动班干部, 师生全员上阵抓“现行”。定期轮值到班上转一转, 瞅一瞅, 抓“现场”;或采用突袭方式, 来个措手不及“人赃俱获”;或采用调查、培养“密探”、举报有奖等形式。对于“抄袭者”与“被抄者”严肃处理 :①对心理素质较好的抄袭者, 对他来一场“杀一儆百”的帮助会 ;②让抄袭者写一份300字以上的“心理活动说明书”, 反思抄袭的弊端 ;③罚扫卫生区3次。经过初期的整治, 班级抄袭作业之风得到了一定的遏制, 但并未杜绝。“抄袭”转入课下或校外进行。多科教师反映, 作业在规定时间内不能收齐, 逃作业现象愈发明显, 特别是学困生不能按时完成作业, 不交作业的比原来多了起来。这表明“堵”有效果, 但是治标不治本, 不是上策。
班主任有时就像“老中医”, 学生发生问题, 班主任就得想办法解决。班主任治疗学生抄袭作业这种“病”, 也要先找准“病因”, 然后“对症下药”。
1. 贪玩VS提醒。对于贪玩的孩子, 时常玩过了头, 忘记了还有作业要做, 到交作业时, 又没有时间再去独立思考, 只好拿别人的作业抄袭。其实这类学生并不是不想做, 只要善意提醒, 他们就会按时完成。对把这类学生单独管理, 让科任老师、学习组长、同桌或朋友时刻提醒他们按时做作业。这样一来, 由于贪玩而抄作业的现象就减少了。
2. 懒惰VS动力。新生代的学生大部分是独生子女, “拿来主义”的生活成就了“惰性”。抄袭替代了他们独立思考、独立完成作业的能力。这类学生必须从严要求, 从易做的文科作业到需要思维量的理科作业统一要求, 不能因学科难易度让“惰性”的种子萌芽, 最终形成“难题抄袭”“易题懒得做”。这就需要班主任和学科老师帮助这类学生提高学习兴趣, 调动他们的学习积极性, 源源不断地充实他们的学习动力, 他们就慢慢地“忘掉”了抄袭作业。
3. 做不完VS精选题。个别学校把学生的成绩与教师的绩效、职称晋升、评优选模挂钩, 个别科任老师为了提高学科的成绩, 搞“题海战术”, 加大作业量, 导致学生作业做不完, 要交的时候只有抄袭。对于这种现象, 教师要经常与科任老师交流, 尝试课堂上精讲多练, 尽可能做到“堂堂清”, 即使有课后作业也尽可能少而精, 绝不把一些题反反复复做好几遍。再就是在作业量和作业时间两个层面统筹兼顾, 让学生有足够的时间独立完成, 也有效地降低抄袭率。
4. 不会做VS多元评。部分小学基础较差的学生, 由于没有养成良好的学习习惯, 进人初中后因为学习的科目增多, 难度加大, 很长时间适应不了初中“快、紧、难”的学习节奏, 就慢慢掉队, 沦为“学困生”, 要他们独立思考, 独立完成作业, 几乎是不可能的, 只好抄袭别人的。对于这类学生, 可以注意协商科任老师, 布置作业要因人而异, 因材施“业”。对于难度较小的作业, 可以统一布置、统一要求 ;难度较大的作业, 不再强求学困生和优生一样完成, 也不因为学困生完不成作业而责备、批评他们 ;采用一些变通的方法, 如请优生先给学困生讲解, 学困生理解后自己再做一遍, 也可以把难题换成同样数量的简单题让学困生去做, 以提高学困生的信心和学习兴趣。灵活多元的评价学生作业的方式, 也较为有效地避免了部分“抄袭者”。
班主任就是“老中医”, 学生发生问题, 班主任就得想办法解决。班主任治疗学生抄袭作业这种“病”, 也要先找准“病因”, 然后“对症下药”。
为了让学生知道抄袭之害, 教师可以利用家长会或班会时间现场进行调查。“您好, 您是××同学的家长吗?这里有几个小问题向您了解一下。”“请问您平时为您孩子买过教辅书之类的吗?”“嗯, 买过。”“那么主要的目的是什么呢?”“嗯? 书上有很多题, 平时可以让孩子做一做呀, 有些知识点有总结。”“那您知道书后面有答案吗?”“这个不太清楚。”“您有知道孩子平时在学校或在家有过抄作业的经历吗?”“这个也不是特别清楚, 我想应该不会吧。”“那您怎样看待抄作业这个问题呢。”“如果经常这样的话自己都没有独立性, 养成习惯后不会做的题会越积越多。”
加德纳的多元智力理论告诉我们, 每一名学生都是可造之材, 教师的任务就是帮助他们认识自己、发展自己。
“××同学请问你买过教辅书吗?”“嗯, 买过, 比如《倍速》《教材全解》。”“那你平时都作为什么用途呢?”“查资料, 然后每天可以对答案。确实查不到, 还借助于网络查答案。”“嗯, 那你觉得这么做很方便吗?”“是呀, 自己做了再对, 错了改了就好了。第二天全对呢。”“××同学, 你抄过别人作业吗?”“呵呵, 老实说抄过几次。”“那是出于什么目的呢?”“有一次是懒得做了, 全是选择题, 第二天来早点去看就行了。另外几次是不会做, 空着会挨骂的。”“那你觉得这样做对吗?”“肯定不对, 但是总是控制不住自己。”……
调查还在继续, 最终的结果显示在两张统计图中 (如右) , 统计图让学生直观地感受到了“抄袭之害”。学生从心理上认识到抄袭作业的结果是考试时的失利, 遇到不会的问题不能只想抄袭, 还要自己多动脑筋, 只有自己独立思考完成作业, 才能真正提升自己的学业水平。
“那, 老师, 我们知道抄袭最终害了自己, 但有时候, 我们的作业量确实大了一些, 怎么办?”“这个可以让课代表或学习组长与科任老师协商, 减少作业量。”“但是, 同学们也应该端正做作业的态度, 提高做作业的效率, 真正思考老师精心准备的作业题, 巩固好所学知识。”“老师, 我们能自主选择作业吗?”“既要减量, 又要自主选择, 你们可不能得寸进尺呀。”“……好的, 那我们就给他起个名字叫‘作业自助餐’吧。”笔者也就随着学生的意愿, 在没有“预设”的主题班会中“生成”了这样一个“匪夷所思”的作业方式。“那我们来个‘君子协定’, 老师设计适当作业素材和问题, 同学们据自己的情况……【君子协定 :①科任老师针对课本的重点、难点、易错点以及基本的规律、技巧, 基于每个同学的学习基础和学习能力设计不同的作业类型, 如作业A、B、C、D (四种类型的作业要有梯度, 有层次) 。②同学们根据自己的实际情况选择适合的作业, 对于学有余力的同学, 可以选用1~2类解决。③完成作业时, 学生可以根据实际情况或1人独立完成, 或2~3人合作完成。④合作完成作业不只是“交流讨论解决问题”, 还必须给其他同学出1~2个“命题作业” (可以是基础题也可以是提高题) 。④作业完成情况的检查和落实可以用四种方式 :一是教师改评, 好的作业给予表扬、展示, 一般的作业鼓励为主, 较差的作业给予辅导 ;二是学生互查, 让同学之间相互检查并记录汇总 ;三是师生合作改评, 对有些课后作业, 如果时间允许, 学生与教师共同对作业进行改评、整理 ;四是教师合作改评, 有些课后作业涉及到新的观点, 需要同组老师共同探讨、改评。最后教师进行总结, 把学生“独到的见解、新的发现”整理展示。】
实践表明, “作业自助餐”的方式激发了学生学习的兴趣, 为学生思维创新与个性化发展提供了平台。课后作业是教学的重要环节, 课后作业方式转变, 满足了不同层次学生发展的需求, 推动了他们探究、归纳、思维能力的发展, 并在主动探索反思的过程中总结出对问题的认识, 体验到学习的成功, 从而更加积极主动地学习。
浅谈学生抄袭作业现象 篇9
抄袭作业是一种不诚信的行为, 欺骗老师和自己, 抄袭作业不能达到巩固和运用知识的目的。抄袭作业的后果是十分严重的, 它败坏了学风, 助长了惰性, 影响了学业成绩, 严重妨碍了正常的教学工作。学生成绩下滑是表面的, 不劳而获、弄虚作假思想的滋生和蔓延才是可怕的, 甚至会影响学生的一生。
在日常的教学工作中, 通过观察和分析, 我发现学生抄袭作业的现象发生有多方面的原因, 主要表现在:
1、学生作业量过大。
以初中学生为例, 一天上六节课, 基本上每节课都有正式作业和练习作业, 再加上一些相应的教学辅导资料, 要独立完成所有任务最少需要三到四小时。另外, 还有一些需要强化记忆的英语单词、语文中的字词, 老师常常要求英5汉1或字词5拼1, (即英语单词5遍汉语1遍, 语文是字词5遍拼音1遍) 。还有一些理科老师搞题海战, 一个类型的题反复练, 如用公式法解一元二次方程, 一位老师当天的正式作业布置五道, 家庭作业布置了二十道, 再加五道变式题, 额外增加了学生的学习负担。
2、自由支配时间少。
学生除了完成老师布置的作业外, 有些学生还要参加一些由家长安排的课外辅导班、兴趣班, 这样学生就很少有自由支配的时间了, 毕竟他们是孩子, 爱玩是他们的天性。那么他们就会从做作业中挤些时间来自由支配。既要完成任务, 又要尽量少的占用时间, 唯有抄袭别人的作业才能达到目的。
3、独立完成作业有困难。学生的基础有好有差, 因此独立完成作业的能力就有差别, 有一部分学生不能独立完成作业, 而老师布置的作业全班一样, 又要求按时完成作业, 那么他们就只能抄袭别人的作业来应付差事了。
4、逃避老师的责备。学生抄作业当然是他们的错, 但我们教师也应该反思一下, 我们的教学有没有问题, 课堂上是否调动起学生的兴趣?是否关注每位学生?面对因不会做而没有完成作业的学生我们是不是一味的责怪?“为什么没完成?”、“为什么别人都完成了就你没完成?下次再完成不了作业把家长叫来。”如果我们这样做了, 学生会为了逃避责怪, 为了不叫家长就只好抄别人作业, 这种现象就越来越严重。
那么, 如何遏制或杜绝学生抄袭作业现象的发生, 我想, 大概应从以下方面着手:
1、端正学习态度, 树立正确的荣辱观。我们要采取多种方式做好学生思想教育工作, 让学生明白抄袭作业是不道德的行为, 是不诚信的表现, 只有现在认真独立完成作业, 将来才会做一名有信誉的人, 要让学生明白抄袭作业的严重后果, 教育学生树立“以抄袭作业为耻, 以独立完成为荣”的荣辱观。
2、严格要求, 个别辅导。如果第一次抄作业不严加制止, 个别学生尝到了“甜头”, 会愈来愈“自信”, 还会有更多的学生仿效, 逐渐加入到抄作业的队伍中来, 逐渐形式“燎原”之势, 因为得来全不费功夫的做法对青少年有着太大的吸引力。因此, 我们除了严格要求学生外, 对实在不会做的学生利用辅导课多关心他们, 引导他们完成作业, 并进行适当的鼓励和表扬, 以激发他们的学习兴趣。
3、减轻学生作业负担。
老师不要给学生布置大量抄写性的作业, 对一些需要识记的单词或字词, 我认为没必要非写几遍, 让学生根据自己的情况选择记忆方法, 只要学生能记住就行, 老师只需进行督促检查, 老师可以总结一些有趣的记忆方法帮助学生记忆, 要坚决避免使用“题海战术”, 以切实减轻学生作业负担。
4、分层布置作业。
传统的一刀切的布置作业的弊端表现在, 一方面优等生“吃不饱”, 感觉没味道, 对他们达不到更优更高更尖的目的;另一方面学困生“吃不了”, 作业不会做, 只有抄了, 就等于放弃了这些学生。如果这样, 那我们的教学就等于只面对百分之五十的学生了。我们可转变思路, 变换方式, 分层次有梯度的布置作业, 其效果将会大不一样。所谓分层作业就是把作业分成很容易的 (即今天学过的基本概念基本知识的直接运用, 一步就能得出答案) 、简单的 (即当天知识的直接运用, 再加上所学知识经过二三步推理就可得到答案) 、有点小难度 (即运用所学知识带有一点技巧, 目的是培养学有余力的学生发散思维能力) 的三个层次, 与此同时, 把学生分成三个组, 第一组叫奋进组 (学困生, 占不超过全班人数的百分之二十) 做一层次作业, 第二组叫攀登组 (中等生, 占全班人数的百分之五十) 做二层次作业, 第三组叫夺冠组 (优等生, 占全班人数的百分之三十) 做三层次作业。当然中等以上的学生也可以做二三两个层次的作业, 奋进组也可以做一二层次的作用。这样做的好处是, 激发不同层次学生的学习兴趣和潜能, 体现了因材施教的教学原理, 优等生能力得到有效的提升、二三层次的学生还会有上一个台阶的想法, 激发了他们的争胜心和求知欲。还可以有效地杜绝学生抄袭作业, 避免为了作业而作业, 使学困生感到原来独立完成作业并不是很难的事。从而树立他们的自信心, 提高他们的学习兴趣。因此, 教师要认真思考、反复斟酌、精心设计作业, 不能仅仅限于课后习题, 把分层作业设计成像练习册一样老师分层布置作业就容易了。
对学生抄袭作业的现象, 作为教师司空见惯, 大部分人认为是小事一桩, 如果我们仔细地分析和研究, 我们绝不可以掉以轻心, 要千方百计予以引导, 并采取有效措施加以遏制, 甚至杜绝其现象发生, 否则, 作为教师, 将误人子弟, 遗恨终生。
摘要:学生抄袭作业之风泛滥, 它败坏了学风, 助长了惰性, 弄虚作假的思想不断地滋生和蔓延, 严重冲击学生正确荣辱观的树立;发生抄袭作业现象的原因是多方面的, 主要表现在作业量太大、学生自由支配时间少、独立完成作业有困难及逃避老师的责备等;应从引导学生树立正确的人荣辱观、个别辅导、减轻作业负担、教学中分层布置作业等方面入手, 遏制或杜绝抄袭作业现象的发生。
《爱情公寓》抄袭门 篇10
从网友所披露的情况来看,很多经典剧的部分桥段,都能在《爱情公寓》里找到,甚至连对话和画面都一样。借鉴、抄袭国外经典剧情和网络段子,《爱情公寓》剧组走了一条捷径。但从尊重原创版权的角度来看,《爱情公寓》剧组确实错了,理应向原创者道歉,并支付合理酬劳。不仅《爱情公寓》有抄袭、借鉴原创作品行为,很多国内影视剧、娱乐节目都存在类似问题。这种行为暴露出原创软肋。大家都不愿花精力去创新,而是乐于采取省事的“拿来主义”。这样就陷入一个死循环,越是对版权保护不力,原创就越不受到重视,影视业也就越难以突破创新,只能在狭小空间里打转。
事后,《爱情公寓》剧组通过微博发表道歉信,除向赖宝道歉外,还表示愿以每千字1万元的标准补偿稿酬。为抄袭而道歉并承诺补偿稿费,《爱情公寓》剧组的坦率认错态度,给“抄袭门”暂时画上了休止符,也为国内影视行业做了一回“榜样”。
【简要点评】《爱情公寓》向原创者道歉和赔偿的决定,打破了长期以来的“潜规则”,具有突破性意义。只有真正尊重原创版权,版权保护环境才会越来越好,创新也将成为推动文艺发展的发动机。
【适用话题】创新、原创与抄袭……