问答质量评价(共4篇)
问答质量评价 篇1
0 引言
随着Internet的迅猛发展,用户产生内容的网络模式得到人们越来越多的关注。知识共享型网站如百度知道、人人网、天涯社区等由于广泛的用户参与,其网站资源快速增长,对人类知识的积累和传播起到了很大的作用。其中百度知道作为全球最大的知识分享社区[1],每天平均产生71 308个问题,223 907个回答,平均每一个问题吸引3.14个用户参与互动,通过百度知道分享知识的用户累计超过1.5亿人次[2],其中在2010年解决的问题数量就达到近6 000万个,为中文互联网贡献了大量有价值的内容。
百度知道的基本形式是由用户提出问题,其他用户回答问题,提出问题的用户从多个答案中选择一个最佳答案,如果提问用户没有选择答案,则将由其他用户投票选择出最佳答案。由于所有用户都可以随意创建问题及答案内容,因此答案的信息质量差异非常大,提问用户有时可以从多个答案中找到令自己满意的答案,也有可能找不到,因为有的答案只是闲聊或者广告信息。例如:
问题1:日头为什么从东边出来?
回答1:日头本来就是从东边出来的。
回答2:因为他要从西边下去!
回答3:日头本来就是从东边出来的,因为他要从西边下去。
问题2:求一个90年代找鞋子钥匙的过关小游戏
回答1:buzhid
回答2:有这个游戏吗?
回答3:好像被删了,我也在找
因此如何识别出对提问用户有用的最佳答案是问答社区发展需要解决的重要问题。本文在基于回答文本特征的基础上,将问题和每个答案看成一个独立的文本单元,研究基于相似度的问答质量评价方法。
1 相关研究
在问答社区中问答质量的评价方法上,Jeon等[3]选取了问题和回答上下文信息的特征并构建了基于语言建模的检索模型;Agichtein[4]等提出了更丰富的特征,包括结构特征、文本特征、社区特征等;Liu等[5]根据问答社区的统计信息如用户积分、答案票数、点击次数等来评价问答质量;Bian等[6]提出了进行问答社区检索排序的GBRank算法,算法综合了提交查询与问答的相关性、用户交互信息和问答社区中用户的反馈信息以检索客观的内容,并探讨了问答社区中用户恶意的交互,提出了应对用户恶意投票的问答社区检索排序算法[7]。一些研究人员还发现问答社区中专家用户和回答的问题质量有很强的相关性,Zhang等[8]提出了Expertise Rank算法识别专家用户,孔维泽等[9]研究了基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征来衡量问答质量。
基于特征的方法是从网页中提取特征,使用机器学习方法进行分类。一般来说,提取的特征有以下几个方面:
(1)问题和回答的文本属性特征
文本长度:问题或回答的句子长度。
标点符号比重:回答中是否大量使用表情或者省略号等。
内容词密度:问题或回答中实词如名词、动词、代词等出现的比例。
最大单字散串:错误的用法可能导致分词后出现多个连续单字串。
内容词覆盖率:问题中的实词和回答中的实词的重复比例。
类别距离:问题和回答的类别距离。
(2)问题和回答的非文本属性特征
是否被采纳:该回答是否被选为最佳答案。
投票数:该回答获得的票数。
提问者评论:提问题对回答做出的评论。
回答时间:回答问题用户发表回答的时间,一般认为,越晚时间发表的回答,可能综合考虑了之前用户的回答,其完备性和准确性较高,更有可能是最佳答案。
(3)用户属性特征
用户最佳答案率:用户的回答被采纳为最佳答案的比例。
用户经验值:百度知道系统根据用户的历史操作累积用户经验值。
回答得分:百度知道系统根据用户的历史回答操作累积回答得分,它是衡量用户的活跃性的有效评价。
这些特征对于判断答案质量问题有一定帮助,本文选择其中基于文本属性和非文本属性的方法,选取出特征,使用SVM分类器判断选取语料中问题的回答中的最佳答案作为本文实验的比较方法。
经过观察语料特征,大部分问题和回答是较短文本,因此可以计算问题及各个回答之间的相似度来判断最佳答案。例如:
问题:推荐给我的笔记本电脑,要上大学了,主要是玩游戏好,一些笔记本这不兼容那又不兼容的,价格5 000-10 000之间。
最佳答案:谁告诉你笔记本这不兼容那不兼容的?你那个价格买啥笔记本都可以流畅的玩游戏了。性能约好价格越高,去电脑城选一个你喜欢的品牌跟外观就可以了。
其他答案1:上学买这么好的笔记本没有必要,不如买个4 000的笔记本用着,宿舍里放个5 000块钱的台式机更牛。
其他答案2:自己去找哦。这样才能找到一款适合自己和自己喜欢的!
因此本文在选取回答特征进行分类的基础上,研究了基于相似度的问答质量判断方法,将网页文本中的各问题和答案划分为一个单元,通过计算问题及回答之间的相似度以及权值的计算,识别出回答中的最佳答案。
2 基于相似度的问答质量评价
2.1 网页文档预处理
本文首先将抓取的百度知道网页文档使用Nekohtml开源工具包转换为文本文档,Nekohtml是一个Java语言的HTML扫描器和标签补全器,借助Nekohtml可以解析网页文档并得到网页文档包含的所有纯文本信息。转换时,本文使用“n”作为Element节点信息的结束标志。转换结束后,以问题或每个回答定义为一个语言单位并使用“n”对文本信息进行划分。每个文档的文本信息由多个单位组成(从抓取的网页中去除只有一个答案的问题的网页)。
2.2 词语相似度的计算
由于大部分问题的句子长度及答案的句子长度都较短,因此本文选择了利用“正向迭代最细粒度切分算法”分词后的公共子词语方式来计算每个文档中的文本单位间的相似度。比如“空气质量标准”的“正向迭代最细粒度切分算法”分词后为:“空气”、“质量”、“空气质量”、“标准”、“质量标准”、“空气质量标准”。基于该方法的相似度计算会将进行比较的两个单位中的词语的前后位置关系一起考虑,提高了相似度的准确性。
考虑到计算量的问题,本文采用《同义词词林》广义的相关词[10]来计算文档中单位间的相似度,该词典中不仅包括了一个词语的同义词,也包含了一定数量的同类词。《同义词词林》采用5层分类体系:第一层表示大类如“物”,共12个大类;第二层表示中类如“植物、动物”,共97个中类;第三层表示小类如“树、猴”,共1 400个小类;第四层表示词群如“树木、猿猴”;第五层表示原子词群如“杨树、猕猴”等。
两个事物之间的相似度可以用表示两个事物的词语间的语义相似度替代,在同义词词林中,两个词语的共性体现在两个词语上一层的高度,其个性主要体现在同一层词语所在层分支的密度和词语之间重合度。综合考虑词语的共性和个性信息,本文词语之间的语义相似度D(Wi,Wj)的计算公式如下:
其中Len(Wi,Wj)是两个词语Wi和Wj第一次到达同一个交集层节点所经过的最长路径长度,Density(Wi)是词语Wi的同层兄弟节点数与同一层中所有节点数的比值,Height(p)是词语Wi和Wj的共同父节点距离第一层的绝对高度。
根据式(1),本文使用Java语言开发了“词语相似度计算工具”,文档中各单位经过工具的计算,可以得到词语间的语义相似度。本文计算的部分词语的相似度结果如表1所示。
根据实验结果,本文选择词语间语义相似度的阈值为0.5,大于该值,认为是语义相同的词语。
2.3 单位相似度的计算
根据公式(1)计算出文档中各单位的词语之间的语义相似度之后,可以计算出文档中两个单位间的相似度即两个单位中词语集合的语义相似度,计算公式如下:
其中S1和S2分别为需要计算的两个单位U1和U2的词语集合。S集合内的数据结构为<word,count>,其中word为词语,count为word出现的次数,如果集合中出现了相同的词语,只保留一个词语,且词语的数值为该集合中词语出现的次数。经过了词语的语义相似度计算之后,句子“我只有初中学历,能参加成人高考吗?”中的“高考”和句子“可以参加考试!”中的“考试”认为是相同的词语。same CT为S1和S2两个集合的共同词语数之和,和的值等于共同词语的数值相加。此时两个单位有3个共同词语{能(可以)、参加、高考(考试)},same CT的值为3。size(S)表示S集合的长度。
2.4 权值的计算及调整
本文将HITS(Hyperlink-induced Topic Search)算法应用到文本文档的各个单位之间,首先将文本文档表示成图G。图G的各个顶点对应文档中的各个单位。顶点之间的边是否存在取决于顶点对应的单位之间相似度的大小,如果两个单位的相似度值为0,则顶点之间不存在边。边的权值大小为相似度的值,值大于0;顶点的初始权重为式(2)计算出的权值大小。
根据式(2)计算出的单位之间的相似度,将某单位与其他各单位间的相似度相加,可以得到文档中每个单位的权值计算公式:
其中,Ui为需要计算的单位。Sim(Ui,Uj)为Ui与Uj之间的相似度。N为文档中的单位的数目。
根据图G的定义,借鉴Page Rank算法思想,本文对式(3)计算出的单位的权值进行了调整:
W(Ui)为Ui的初始权重,link CT为图G中单位Ui对应顶点的度。式(4)表明,对于文本文档内部的各个单位而言,若一个顶点的度越大,那么其对应的单位的重要性也就越大。
回答的文本长度也对权值有贡献,相似的两个文本单位,长度越长的回答越有可能是最佳答案,因此本文在式(4)计算的权值的基础上,根据回答文本的长度对权值进行了第二次调整:
其中Len(Uj)是回答单位中文本长度最小的回答长度,λ是参数值,实验测试选取。
2.5 最佳答案的选取步骤
本文将抓取的每个多答案问题的文档以“n”划分为多个单元,通过词语的语义相似度和文档单元的相似度及权值的计算后,得到了每个单元的权值,表示成Sort List<Ui,Wi>。以下是最佳答案的选取步骤:
(1)首先对Sort List按照文档中的单位的权值W'(Ui)升序排序;
(2)计算TTCT(所有定点的度数和)和PCT(顶点权值大于等于的单位的总个数)的值:
其中,为参数值,实验测试,取∂=1.0较合适。
(3)计算文档中所有单位的平均度数ave CT作为判断阈值:
其中,ave CT用于控制权值过小的单位。当link CT(Ui)<ave CT时,该单位不是理想的单位,不考虑将该单位作为最佳答案,将该单位从Sort List中移出。
(4)从Sort List列表中选取index序号较大的两个单位作为候选最佳答案,因为单元的序号按照文档中的内容顺序产生,序号较大说明回答问题的时间越晚,参考了之前的答案,更有可能是最佳答案。
比较选出的两个候选单位的权值,最终选取权值较大的单位作为该网页的问题的最佳答案。
3 实验结果及分析
本文根据收集到的百度知道用户访问日志数据,从百度知道抓取了2010年10月份的百度知道问题网页中用户访问次数超过5次的网页,共提取出问题566 738个,去除了其中只有一个答案的问题的网页,共得到126 707个多答案问题,其中已解决问题107 689个,回答数共463 114个。这些问题数据来自14个一级类别下的861个子类别,其中“电脑/网络”、“教育/科学”、“娱乐休闲”是语料中占问题最多的3个一级类别,分别占18%、18%和12%。
本文选取了“教育/科学”类别的“升学入学”子类别和“电脑/网络”中的“硬件”子类别的数据分成两组进行实验。语料数据统计如表2所示。
本文实验数据集中问题的正确答案标注为社区用户评选出的最佳答案,该答案一般由该问题的提问用户指定或者由其他用户投票选出。
本文采用准确率P、召回率R、F-1值和ROC曲线面积AUC来衡量最佳答案的识别情况,实验结果如表3所示。
为了和基于答案文本特征的方法进行比较,本文验证了使用SVM分类器中加入回答文本特征和用户特征,实验的对比结果如图1所示。
从图1中可以看出,和基于答案文本特征的分类方法相比,该方法能明显的提高最佳答案的识别准确率。
为了进一步分析问答质量的评测效果,我们将使用相似度方法给出的分类概率作为回答质量评分,将分数最高的回答作为该问题的最佳答案,对最佳答案进行预测。表4的实验结果中滤掉了只获得了一个回答的问题的数据。
表4中的最佳答案预测准确率为准确预测的最佳答案数与问题数的比值。本文最佳答案预测准确率高于80%,远高于随机判断的结果,优于文献[11]中70%左右的结果,也优于文献[9]中接近80%的结果。
4 结语
对于问答社区中的问答质量评价问题,本文提出了基于相似度的评价策略,通过计算文本中各单元的相似度和权重,确定问题的最佳答案。实验结果表明,本文提出的基于相似度的方法能够有效提高问答质量的评价效果。下一步我们将研究其他方式的文本单元相似度权重的计算方法,以获得更高准确率的最佳答案自动识别结果,并尝试将问答质量的评价应用到问答系统中。
参考文献
[1]百度公司.中国人知识搜索行为研究报告[R].2007-07-11.ht-tp://cimg3.163.com/tech/school/other/chinasearch.pdf.
[2]李敬.百度知道—分享创造奇迹[N].计算机世界,2011-1-31:17.
[3]Jeon J,Croft W,et al.A framework to predict the quality of answerswith nontextual features[C]//Proceedings of SIGIR,2006.
[4]Agichtein E,Castillo C,et al.Finding high quality content in socialmedia[C]//Proceeding s of SIGIR,2008.
[5]Liu Jingjing,Cao Yunbo.Low quality Product Review Detection in O-pinion Summarization[C]//Proceedings of the 2007Joint Conferenceon Empirical Methods in Natural Language Processing and Computational Natural Language Learning.Prague,2007:334-342.
[6]Bian J,Liu Y,et al.Finding the right facts in the crowd:Factoid ques-tion answering over social media[C]//Proceedings of the 17th interna-tional conference on World Wide Web,2008.
[7]Bian J,Liu Y,et al.A few bad votes too many Towards robust rankingin social media[C]//Proceedings of AIRWeb,2008.
[8]Zhang J,Ackerman M,Adamic L.Expertise networks in online commu-nities:Structure and algorithms[C]//Proceedings of the 16th inter-national conference on World Wide Web,2007.
[9]孔维泽,刘奕群,张敏,等.问答社区中回答质量的评价方法研究[J].中文信息学报,2011,25(1):3-8.
[10]梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1983.
[11]Adamic L,Zhang J,Bakshy E,et al.Knowledge sharing and yahoo an-swers:everyone knows something[C]//Proceeding of the 17th interna-tional conference on World Wide Web,2009.
浅析数学课堂问答的科学评价 篇2
关键词:课堂提问,教师评价,学习兴趣
一、教师评价中的常规陋习
1.公式化.有的教师在课堂上提出问题让学生回答,学生回答正确,就用“你答对了”;如果回答错误,就用“你答错了”等公式化的语言,没有根据学生的具体情况对回答作详细地分析,特别是投有在关键处点拨,没有对学生回答问题的思路进行分析指导,这不仅不利于学生思维能力的培养,更不利于学生个性的发展,无法引起学生主动学习的动机.教学是师生的双边活动,按照现代系统科学理论,教学过程是一个由教师调控的工作系统.在这个系统中,教师要根据学生输出的大量反馈信息来调控教学活动,学生也要根据教师调控的结果作出新的反映,以保证教学活动的信息传输取得动态平衡,从而实现教学目标.教师课堂提问的评价,实际上就是教师对学生反馈作出的调控,如果评价模棱两可,千篇一律,学生只能笼统地知道对或错,进一步的学习行为便会偏离教师的要求,教师的主导作用无法实现,教学过程也会失去动态平衡.
2.内含讽苦.我们在一些课堂上经常看到这种现象,学生发言说错了,教师的表情常常是不高兴甚至会有讽刺的言语.这种漠然的情感和讽刺的言语伤害了学生的自尊心和积极性,使原本生动活泼的青少年一到课堂上就变了样:不敢想,不敢说,呆头呆脑,沉默寡言.如果教师能用一种真诚的情感,热切地期望学生,有意无意间,他的这种情感、价值观和信念就会传递给学生,他对学生的这种热情会在学生身上产生积极的暗示作用,潜移默化地促使学生养成健康的心态,使学生热情、真诚,从而向往学习,向往发展与成功.如果学生回答完提问后,得不到教师适当的评价,只是冷冷冰冰地一声“坐下吧”,长此下去,学生肯定不愿再回答问题,师生在情感上便难以沟通.
3.表扬泛化.有的教师对学生回答问题的评价不切实际,过分拔高,容易使一些学生飘飘然,滋长骄做自满的情绪,更容易造成学生学习上的混乱.由于部分学生对教师的评价产生怀疑,会严重影响教师的尊严和威信.因此,教师在课堂提问的评价上要客观、公正、实事求是,使评价真正起到评定、反馈、激励、促进的作用.
4.细数家珍式.课堂时间是有限的,如果教师在提问中对每个回答的问题都详细点评,没有侧重,势必会造成教学任务不能全部完成.教师在课堂上应注意提高教学效率,应及时解决大多数同学的问题.如果有个别同学出现理解上的个别误区,可以在课后及时与他沟通交流,从而消除他的误解.
二、科学地评价学生的回答
1.积极肯定.课堂上,对于相当一部分能够做出正确或基本正确回答的学生,可采用积极肯定的评价语言.如用“你回答得很好”、“你归纳得很全面”、“你分析得很透彻”等语句做出恰如其分的评价.而对于那些有创造性答问的学生,除了给予肯定外,还要对其勇于思考、探索的学习精神大加褒奖.这样既是对回答问题学生的鼓励,又会激发全班学生主动探究的积极性.
2.指导激励.由于学生的知识面窄、理解与概括能力不强、分析问题角度单一等原因,回答问题时常常顾此失彼,不够严密、周全.这时,教师首先要对学生回答正确的内容予以肯定,然后用“如果……就更……”的句式点拨.用委婉的语句指出学生答问中的不足,学生不仅乐于接受,而且在今后的学习中会更加注意,其他学生也能从中受益.另外,还可以用“追问”的方式指导学生继续思考作答.因为教学中,有很多学生似懂非懂,甚至不懂,这时教师就应充分发挥引导者、组织者的作用,利用“追问”把那些似懂非懂的学生完全问明白,让那些不懂的学生听明白.
3.避重就轻.学生回答问题出现错误或答非所问时,教师不必就答案本身直接否定,而是就学生发言过程中其他细小环节的可取之处予以肯定.如,“某个步骤很好、某种方法很新颖、很实用、进行了大胆探究”等.这样,鼓励学生大胆发言,即使是错误的,也不会受到嘲笑,让有心的学生能从教师的评价中扬其所长.同时,对全体学生也起到了积极的影响作用,使评价不着痕迹却又及时恰到好处.
三、结语
问答质量评价 篇3
我深深相信, 学习的最大动力并不是外界的命令和压力, 而是学生自己内心的渴望。如果能有一个方法, 让孩子们从内心深处想要去展现自我, 那该多好。
由此, 我把班上的孩子按前后座位4人分成一个小组, 组成“课堂互助小组”, 四个小组, 又组成一个“互促大组”。在组织时, 我会着意让平时积极的孩子和内向的孩子、成绩突出的孩子和处于潜力阶段的孩子进行搭配, 制定一个可以激励他们的规则, 让他们去挑战。
规则内容:在小组中, 如果每个成员每天至少积极发言两次, 这个小组就能成为当天的优秀小组;如果发言十分精彩, 受到老师的表扬, 就另外给予小标志的奖励。如果在一周之内都被评为优秀小组的话, 就可以晋级为一周明星小组, 若连续保持一个月, 就能评选为当月明星小组。而每一天的成功, 都会有相对应的小标志奖励, 如果取得了周明星和月明星小组, 还有精美的小奖品相送。
在每天放学评比时, 我会留出几分钟的时间让小组成员讨论, 反思今天的情况, 称之为“爱心加油时间”。我鼓励孩子们总结自己的表现, 说说自己哪里做得好, 哪里做得还不够;对别人则只说鼓励的话, 不讨论、不责备表现不好的同学。周明星、月明星小组的评选要求还包括:组内必须团结友爱, 不能排斥其他同学, 小组之间必须和谐互助, 这样才算得上真正的优秀小组。
“互助小组”活动的展开, 不仅使回答问题积极的学生带动了消极的学生, 而且也使活动先进小组不断激励落后的小组。无论个人还是小组, 在积极的带动下, 让他们内心有一种动力, 有一种集体荣誉感。人与人、组与组的互促过程, 是充满尊重和关爱的, 渐渐地孩子都会感受到, 原来竞争不是进步的唯一方式, 还有一种更加温暖的方法, 叫作合作。
问答质量评价 篇4
答:2014年, 国务院发布深化考试招生制度改革的实施意见, 提出“探索基于统一高考和高中学业水平考试成绩、参考综合素质评价的多元录取机制”;教育部印发《关于加强和改进普通高中学生综合素质评价的意见》, 把开展学生综合素质评价作为高中课程改革的重要内容之一, 就规范和落实综合素质评价工作提出具体指导意见。本办法的出台, 是为了贯彻落实国务院关于深化考试招生制度改革的精神和要求, 在原有工作基础上, 进一步完善评价内容, 改进评价方式, 规范评价过程, 保证评价程序公开透明、评价结果真实可信。
实施综合素质评价是促进学生德智体美全面发展、培养个性特长、扭转唯分数论的重要举措, 意义重大。一方面, 有助于推进素质教育走向深入, 促进学生认识自我、规划人生, 激发潜能、主动发展, 实现自我的完善与进步;另一方面, 有助于高校全面考察学生的综合素质及水平, 扭转以考试成绩为唯一标准评价学生的做法, 使人才选拔更加全面, 方式更加科学, 实现知行合一。
教育部下发《关于加强和改进普通高中学生综合素质评价的意见》后, 我省成立了文件起草小组, 由有关专家、高中校长、一线教师和教育行政管理人员等组成。本办法研制历时一年多, 经历了广泛调研、文本起草、反复论证三个阶段。研制过程中, 组织专业人员对相关基础理论、政策要求和实践操作等进行了认真的研讨;考察学习了部分先行先试省份开展综合素质评价工作的做法;广泛听取了高中学校的校长、教师、学生和家长代表, 基层教育行政部门负责人和高校招生部门负责人等方面的意见;多次召开专门会议征求意见, 最终通过教育部审核备案。
二、综合素质评价的功能和作用是什么?
答:综合素质评价的功能和作用主要体现三个方面:一是作为指导学生成长的依据。学校通过综合素质评价, 对学生成长过程进行科学分析, 引导学生发现自我、明确方向, 更好地促进学生全面而有个性发展。二是作为高等院校招生、录取的重要参考。高校根据学校办学特色和人才培养要求, 在招生时制定科学规范的综合素质评价办法, 对学生做出客观评价。三是作为评价教师教学效果、学校办学水平的依据。通过评价, 促进学校和教师反思教育教学行为, 提高管理和教育教学水平。
三、综合素质评价应遵循哪些基本原则?
答:《实施办法》强调了四个基本原则:一是导向性原则, 引导学生践行社会主义核心价值观, 热爱中国共产党, 弘扬中华民族传统美德;把握学生的个性特点, 关注成长过程, 激发每一个学生的发展潜能, 鼓励学生不断进步;引导学校建立健全多元评价体系, 全面实施素质教育。二是全面性原则。着眼于学生的成长过程和整体表现, 实施综合、全面的评价, 既反映学生全面发展的情况, 又彰显学生的个性特长;既关注学生的学业成绩, 又重视学生思想品德、身心健康和核心素养的发展, 激励学生健康、主动、全面地发展。三是客观性原则。以事实为依据, 如实记录学生成长过程中的突出表现, 真实反映学生的发展状况, 确保评价内容客观真实;严格规范评价程序, 强化有效监督, 确保评价过程公开透明, 评价结果可信可用。四是可操作性原则。建立符合学生身心发展规律和素质教育要求的评价标准和指标体系, 实现评价操作与管理的科学化、规范化、信息化。评价过程应简便、直观、易操作, 让学生易参与、让老师易指导、让各方易监督, 确保公开透明。
四、综合素质评价主要评什么?
答:综合素质评价包括学生思想品德、学业水平、身心健康、艺术素养、社会实践五个方面。思想品德主要考察学生在爱党爱国、理想信念、诚实守信、仁爱友善、责任义务、遵纪守法等方面的表现。学业水平主要考察学生各门课程基础知识、基本技能掌握情况以及运用知识解决问题的能力等。身心健康主要考察学生的生活方式、体育锻炼习惯、身体机能、运动技能和心理素质等。艺术素养主要考察学生对艺术的审美感受、理解、鉴赏和表现的能力。社会实践主要考察学生在社会生活中动手操作、体验经历等情况。
高中学校要基于学生发展的年龄特征, 结合当地教育教学实际, 科学确定学生综合素质评价的具体内容和要求。
五、综合素质评价的程序有哪些?
答:综合素质评价主要有写实记录、公示确认、形成档案三个基本环节。
写实记录指学生在教师的指导下, 采用写实的办法客观记录集中反映综合素质主要内容的具体活动, 由学生本人收集相关事实材料, 填写活动记录单, 在每学期末整理并记录本人的《纪实报告》。活动记录、事实材料务求客观真实、有据可查。
公示确认是指在每学期末, 学校将学生的《纪实报告》及活动记录和事实材料进行公示, 公示无异议后, 班主任和有关教师要对公示材料进行审核并签字, 最终结果须经学生签名确认, 信息确认后原则上不得更改。如有异议, 应及时反馈, 经核查后如确需更改, 学校须书面提出申请, 逐级报批。
形成档案是指毕业时, 学生撰写自我陈述, 班主任和相关教师撰写综合评语, 学校为每位学生建立综合素质档案。综合素质档案的内容必须是每学期所填报的内容, 不能随意添加。
六、如何保证综合素质评价真实、可信?
答:实施高中学生综合素质评价的重点是确保程序公开公正、内容客观真实。一是规范评价内容。综合素质评价如实记录学生成长过程中的突出活动和表现, 并收集相关事实材料, 全面、充分反映学生高中阶段学生思想品德、学业水平、身心健康、艺术素养、社会实践等方面的发展情况, 做到有据可查。二是建立综合素质评价信息管理系统。通过写实记录、整理遴选、公示审核, 学校将相关信息导入信息管理系统, 建立规范的学生综合素质档案, 严禁修改。三是强化监督。通过建立公示、抽查、申诉、复议和责任追究制度, 确保评价公开透明、内容真实可靠。
七、综合素质评价工作实施中对教育行政部门和学校有什么要求?
答:综合素质评价关系到每个学生的切身利益, 涉及面广, 工作任务繁重复杂, 各级教育行政部门和学校要高度重视, 切实履行好自己的职责。
各级教育行政部门要切实加强综合素质评价的政策解读与宣传, 协调各方面专业力量, 指导学校做好综合素质评价工作。加强监督检查, 对弄虚作假者, 按照有关规定给予严肃处理。省教育厅将建立全省统一的综合素质评价信息管理系统并开展培训, 为高中学校记录评价信息、上传事实材料提供平台, 为高等院校招生录取和各级教育行政部门管理使用提供服务。
各普通高中学校负责学生综合素质评价工作的组织实施, 校长是综合素质评价工作的第一责任人。学校要制定本校学生综合素质评价工作实施方案和细则, 建立工作制度和机制, 对教职工、学生及家长进行培训, 指导学生规范进行写实记录, 对记录内容的真实性进行审核, 对举报事项进行核查, 对失信行为进行追责等。
八、高校如何使用综合素质评价结果?