关系强化学习

2024-06-23

关系强化学习(精选3篇)

关系强化学习 篇1

政府要想提高执行力和公信力, 树立良好的政府形象是一个根本性问题。而政府公关 (包括政府行为、与社会各界的关系) 恰能展现政府的形象, 可产生社会影响, 有利于处理与社会各界的关系。通过政府公关这个平台, 政府的理念、行为与社会各界的预期、要求产生互动、发生关联。在民主和法制时代, 政府公关的作用日益广泛, 影响更加深远。

我国政府公关已取得了明显的成效, 从中央到地方, 各级政府运用公关策划, 举办了各种各样的社会活动, 设立了公关机构如新闻办公室等。政府公关在一些城市已形成制度化, 如设立市长电话、市长接待日, 加强与群众的沟通, 既密切了与群众的联系, 也有助于提高政府形象和行政管理效率。但仍存在一些问题, 影响了政府的公信力和执行力, 其负面作用不可小觑。为此政府应加强公共关系管理。

政府部门应树立公关意识, 实践人民民主, 推行法治行政

政府部门应牢固树立民本意识和法制意识的行政观念, 这是建设现代政府的思想基础。还应树立为群众服务的行政观、以为民谋利为目的的行政权力观、以法律至上为核心的行政执法观。

1. 践行“以人为本”。

“全心全意为人民服务”是政府的宗旨, 只有遵循这个宗旨, 加强依法行政, 才能赢得人民的信任;只有摒弃“官本位”思想, 敞开心扉与人民进行沟通, 政府公关才能进一步良性发展。

2. 实行“全员公关”。

公关不仅是政府专职部门的任务, 而是渗透在各具体职能中, 要求全员参与。政府工作人员必须提高素质, 纠正不正之风, 清除腐败现象, 明确自己的言行代表着政府的意志和倾向, 自己的形象代表着政府的形象, 做到人人公关、时时公关、处处公关。

3.推行法治行政。法治行政是现代行政管理的必然要求, 也是法治国家的重要标志。行政能否依法, 直接关系行政管理体制能否正常运转, 关系一个国家能否实现法治。法治行政是市场经济的必然选择, 违法行政则会给国民经济、市场秩序和公众的合法权益带来严重危害。法治行政是公共治理的基本要求, 是实现公共利益的重要保障。从公共性的角度分析, 公共行政存在的目的就是为提供公共服务、促进公共利益的实现。没有法治行政的保障, 公共利益往往会被私人利益所侵蚀, 公共目标也会被“经济人”的自利动机扭曲, 最终降低公共行政的合法性。

政府应注重公关传播, 完善协调沟通机制

组织内的信息沟通, 正如人体血液循环一样, 若无沟通活动, 组织就会趋于死亡。加强双向信息协调沟通可实现“内求团结, 外求发展”。

1.注重公关传播。政府公关传播要围绕“平衡理论”进行, 在沟通的同时充分考虑不同公众的心理感受, 善于把握时机, 采取多种沟通方式, 将直接沟通与间接沟通结合起来, 正式沟通与非正式沟通结合起来, 综合运用。

2. 全方位开拓民意沟通渠道。

通过信访、会见公众代表、征集群众建议等方式, 可使公众参政议政。对公众的质询和申诉, 要作出负责任的答复, 答复之后要跟踪查办落实。政府还应加快电子政务建设, 能够公开的都要向社会公开, 保障人民群众对政府工作的知情权、参与权和监督权。

3. 加强对政府公关的监督。

行政部门由于掌握了行政权, 难以建立以权力为中心的服务意识, 因此必须对政府部门进行有效的监督。政府公关也不例外。在政府部门公关活动中, 无论是新闻发言人制度、信息公开制度, 还是信访制度, 都要进行严格的监督, 政府才能本着负责、认真的态度将其贯彻执行下去。对政府公关的监督, 不仅要有政府内部监督机构的监督, 更重要的是要有有效的外部监督。比如, 积极引导公众通过各种大众传播媒体形成舆论进行监督, 使政府公关进一步朝着维护公共利益、体现公共精神的方向发展。

我国政府公关建设是构建和谐社会和建设服务型政府所必须的。应结合我国的国情, 对较成熟的公关理论和实务进行吸收、创新, 发展和谐社会背景下的政府公关, 使政府部门与民众之间有更好的沟通, 使民众更加信任和依赖政府, 使政府部门真正成为为民众服务的政府。■

关系强化学习 篇2

尽管我们从小接受的教育告诉我们,市场是完美无缺的,但管理团队却时常感到,有很多时候,他们的业务没能得到正确的评价。对于公司究竟价值几何,他们自己的看法与市场之间存在差异。至于这种差异源自何处,或者明显的估价错误究竟是否与对公司的认识有关,往往无人知晓。

在力图解决这一难题方面,CEO和CFO们并非孤军奋战。大型上市公司通常会聘用一位直接向CFO汇报的投资关系总监,并为其配备两位分析师担任助理。理论上,投资者关系的作用旨在协助管理团队理解投资者行为,并把资源集中于至关重要的领域。

在实践中,投资者关系的作用却主要是忙于令人精疲力竭的后勤事务。在英国,这包括每年组织大约60次基金经理会议,4次分析师简报会议,年度股东大会和几次海外路演,以及编辑年报等。其他日常工作还包括编辑网站,及每天回复大约50封个人投资者的电子邮件。由于任务繁重而资源有限,主管们几乎

没有机会深入分析市场对公司潜力的明显错估问题。

当涉及到基金经理的管理时,一个最令人沮丧的问题就是很难找出谁在左右股价,以及应该把精力放在哪些投资者身上。我们对美国和英国市场的研究显示,每家公司的股东登记薄平均由40家基金控制,但其中只有少数几家积极参与了股票的定价。

这意味着,股市上多达90%的基金经理并未仔细研究公司的战略,而是实际上采取一种与指数挂钩的投资策略。大约20%的基金经理遵循的命令是,明确追踪指数进行投资,另外30%则秘密跟踪指数走势。我们的研究表明,在其他投资活动中,只有10%是非常积极的。由于大多数英国基金经理的业绩是根据金融时报精算全股指数,但大多数经纪人仍要为别的事务分心:他们要为其投资银行的同事带来佣金和公司融资业务,从而无法顾及对客户股东的基本分析,

对于公司价值是否确实被错估,他们可能也无法提供可靠的指导。说到底,经纪人无法取代公司自己对股东的分析以及对评估模型的运用。

一家公司要建立并维持一种富有成效的评估模型,并以此保持与分析师和投资者的联系,并非一项轻而易举的工作。这就是为何很少有公司这样做的原因。对股东登记的变化进行分析,并全面了解那些推动股价走向的投资者交易活动,也不是无关紧要的任务。

如果投资者关系部门的规模只有平均水平,那就根本不可能实现这些目标。它不仅需要战略集团、金融集团以及投资者关系部门间的密切合作,还需要在通常只有经纪人才使用的分析工具和数据资源方面投入巨额资金。

然而,即使高级主管们找出了活跃的基金经理,并对他们有所了解,但能否影响他

们又另当别论。首先,公司主管向他们透露更多的信息是非法的。如果能对某项战略将如何实现公司价值作出更明确、更令人信服的解释,或许可以直接影响一些基金经理。在平等获取信息的监管约束下,其他基金经理也可能会对更有针对性的交流沟通作出反应。

剩下的基金经理仍可能受到间接价值信号的影响。这类信号的形式是多种多样的,从分红或回购政策的变化,到更复杂的非执行董事组成或管理层薪酬政策等都有。类似地,力图如此深入了解投资者的公司也寥寥无几。

假如公司的价值总能得到正确评价,这些也就变得无关紧要了。如果真是这样,那么投资者关系工作就简化为维持和监督工作,从而能让高级管理人员集中精力,做好公司的运营。可在现实中,经理们却感到,他们不断面临着要向现有及潜在的基金经理“兜售”公司的压力。

他们还面临着中间机构,特别是经纪人的压力,以提升业务的增长前景,并开展那些能够带来强劲预期的业务。这其中,经常隐藏在背后的目标便是要把股价保持在最高水平。经理们受了这个目标的诱惑,却完全是自讨苦吃,因为由此造成的错估代价非常高昂。一旦价值被高估的公司无法实现预期,必然要作出重大修正。

高级经理们花费大量时间处理投资者关系,或许情有可原,因为他们几乎别无选择。同样毫无疑问的是,他们完全有机会将精力集中在真正重要的事务上,比如临时出现的积极投资活动,并利用更深入、更基本的分析来管理投资者关系。

论强化与惩罚的辩证关系 篇3

一、强化与惩罚的理解

“强化”与“惩罚”是一对既相互对立又相互统一的概念。“强化”原本来自通常所说的奖赏,巴甫洛夫首先应用了“强化”概念,他称一切使行为得到加强的事件为强化。在巴甫洛夫的实验中,强化物与刺激物相联系,使条件刺激物具有能引起行为的信号意义。斯金纳从操作性作用或操作性条件作用的观点赋予强化以新的含义,他认为,生活和活动于环境中的有机体,在多方面改变着环境,在改变环境中往往又影响着有机体自身的变化,其中某些变化使人们得到通常所说的奖赏,就具有一般专业用语中叫做“强化”的含义。[1]斯金纳把能起强化作用的刺激物称为强化物,在操作行为中,强化物与反应相联系,所谓某种反应受到强化,指的是这种反应出现的概率增加,即该操作行为更容易出现。

斯金纳按照强化的属性将它分为“正强化”和“负强化”两种类型。建立操作反应时,在有机体做出一个操作反应后,如果呈现某一后继的刺激物,有机体的操作反应概率增加,那么该刺激产生的作用称为正强化,该刺激物就是这一反应的正强化物;如果建立操作反应时,在有机体做出一个操作反应后,撤走某一刺激物,有机体的操作反应概率增加,那么该刺激产生的作用就是负强化,该刺激物就是这一反应的负强化物。[2]斯金纳认为:正强化和负强化在人类学习中都是经常被应用的方法。比如,给予儿童微笑、赞扬、奖品,提供学生喜欢的活动等都可以对教师希望学生出现的某种行为或本领进行正强化;而避免批评、避免打骂、取消学生不感兴趣的活动等都是在对上述行为进行负强化。

对于“惩罚”这一概念,国内有学者认为“惩罚”是指“在一种行为发生后随即出现厌恶事件,导致行为出现率下降的训练程序。”[3]还有学者认为,“惩罚与强化相反,指一个行为发生之后伴随的结果使这种行为被弱化,以后遇到类似情景就可能不再出现,惩罚的直接结果是使行为削弱或消除。”[4]

对应“强化”的两种类型,惩罚经常被分为“呈现性惩罚”与“取消性惩罚”两种类型。呈现性惩罚就是使用不愉快的结果或厌恶性刺激,如指责一名学生,从而减少特定消极行为的过程。取消性惩罚就是愉快结果的取消,比如特权的丧失、剥夺课间休息、放学后留校等,旨在消除或减少特定的消极行为。[5]由此可见,“惩罚”有两种不同形式:一种是通过呈现一个令人不愉快或否定性刺激实现的,另一种则是通过取消一个令人愉快的或有益的刺激完成的。国内一些学者在使用“惩罚”概念时,对应“正强化”与“负强化”的概念表述,将“惩罚”分为“正惩罚”与“负惩罚”。认为“呈现某事物、导致行动者痛苦并使行动者特定行为表现消失,就叫正惩罚;移去某事物、导致行动者痛苦并使行动者特定行为表现消失,就叫做负惩罚”。[6]如果按照通常理解,呈现某事物,就叫做“正”,那么上述呈现性惩罚即为正惩罚,两者都是指呈现某种令人不愉快的结果或厌恶性的刺激,以导致行动者痛苦从而减少特定行为表现,或使特定行为表现消失的过程;同样,如果某事物消失,就叫做“负”,那么上述“取消性惩罚”即为“负惩罚”,两者都是指某种愉快结果的取消,导致行动者痛苦从而减少特定行为表现,或使特定行为表现消失的过程。可见,按照上述概念解释及人们的使用习惯,“呈现性惩罚”与“取消性惩罚”亦可对应地称作“正惩罚”和“负惩罚”,以下在“惩罚”概念的使用上,将沿袭国内的使用习惯。

二、强化与惩罚的辩证关系

在理解“强化”与“惩罚”概念的基础上,进一步分析其辩证关系,不仅有助于在实践中正确使用,反过来也可以巩固与加强对其概念内涵的理解。“强化”与“惩罚”存在着对立统一的辩证关系,其对立性较为明显,其统一性较为复杂,在理解其辩证统一关系时,要善于从“强化”与“惩罚”这对矛盾的相互转化上着手分析。

1.强化与惩罚的对立

“强化”与“惩罚”这对概念具有对立统一的辩证关系,其最根本的对立性表现在:“强化”旨在增强行为发生的概率,而“惩罚”旨在减少行为发生的概率。表面上看,“强化”与“惩罚”的对立包括行为动机或出发点的对立、强化物与惩罚物这两种刺激物性质的对立以及行为结果的对立,但实质上,在以上三种对立中各对矛盾的地位是不平衡的。根据“强化”与“惩罚”的概念界定,在以上三种对立关系中,行为结果的对立是强化与惩罚矛盾对立中的主要矛盾,即最后的行为结果是加强特定行为反应还是减弱特定行为反应,将最终决定特定刺激物产生的是强化还是惩罚。而其他两种对立关系往往不能作为判断强化与惩罚的依据,因为,动机与效果往往具有不对应性,特定的动机未必会产生相应的效果,因此动机无法成为判断强化与惩罚的主要依据;此外,强化物与惩罚物中,刺激物的性质往往因人而异也具有较强的不确定性,故刺激物本身的对立也无法成为区别强化与惩罚的主要依据。事实上,行为的目的与结果经常是不对应的,当行为的目的与结果出现不一致时,我们可以依据最终的结果是在于加强行为反应还是减弱行为反应,从而对行为结果产生的是强化还是惩罚做出判断。需要强调的是:强化,无论是正强化,还是负强化,最终的结果是导致相应行为反应的增加,只是前者是通过施加一个愉快的刺激而实现的,而后者则是通过取消一个厌恶性的刺激完成的;而惩罚,无论是正惩罚,还是负惩罚,最终的结果是导致相应行为反应的减少或降低。无论是在行为反应后施加一个厌恶性刺激还是在行为反应后取消一个愉快刺激,其作用都是可以减少受罚行为再次出现的可能性。目前在理论研究与实践应用领域经常出现的关于正负强化与正负惩罚概念使用上的错误,往往都是由于不能从根本上把握两者最本质的对立与区别,混淆了两者的界限。

2.强化与惩罚的辩证统一

强化与惩罚在矛盾对立的同时又是辩证统一的,两者在一定条件下可以相互转化。

(1)正强化与正惩罚的相互转化。

正强化即呈现积极的、令人愉快的刺激以加强个体某种行为,而正惩罚即呈现消极的、令人不愉快的刺激,以消退个体的特定行为。因此,不少教育学者或教育工作者认为两者的区别极为明显,甚至泾渭分明。但事实上,正强化与正惩罚在一定条件下是可以相互转化的,正强化可以转化为正惩罚,反之,正惩罚也可以转化为正强化。区分正强化与正惩罚首先应该因时因地制宜,其次应该因人而异。

首先,正强化可以转化为正惩罚。正强化与正惩罚的区别在于施加于个体身上的刺激物的性质是令人愉快的、有助于加强行为反应的,还是令人厌恶的、有助于减少行为反应的。而刺激物令人愉快与否,取决于个体的特定状态,如兴趣和需要,往往会随时发生变化,之前令人愉快、有助于加强行为反应的刺激,超过一定的度则可能令人痛苦、减少行为反应,此时正强化就转化成了正惩罚。譬如,对于一个饥肠辘辘的人而言,特定行动之后呈现一般性的食物则是令他极为愉快的,故而此时食物便是积极的刺激,以食物作为强化物可加强其特定的行为,产生正强化。而一旦这个饥肠辘辘的人进食后,充分地满足了其饮食需要,此时再呈现同样的食物则无法令其感到愉快,故而再用食物作为奖赏或强化物则无法加强其相应行为,此时原有的正强化作用趋于消失。在此情况下,如果个体仍然继续被动进食,则之前那些令他满足与愉快的食物此时则变成厌恶刺激,故而个体不但不会再趋向这些食物,反而会避之不及,之前发生的正强化此时则转化为正惩罚。我们生活中经常有一些厌食者正是由于同样的食物食之过量所导致的,这正是正强化转变为正惩罚的极好例证。

其次,正惩罚也可以转化为正强化。诚如在课堂教学过程中,学生违纪时教师会做出一定的惩罚,如罚站。表面上看,从教师的角度来看,这是一种典型的正惩罚或呈现性惩罚,旨在消除特定的违纪行为。事实上从学生的角度来看,最初在开始被罚站的那一刻,该学生也感受到了羞愧等负性情绪,因此罚站起到了一定的消退违纪行为的作用,此时此刻我们看到了正惩罚在发挥作用。然而事实上这种反应也在随着事态的进展而发生变化,比如随着其他儿童对被罚站儿童的关注,学校中的教师们往往发现罚站儿童的兴奋性在不断提高,此时由这种被关注所导致的兴奋感和愉快感替代了原有的羞愧感成为主要感受或主要矛盾。因此随着事态的进展,原来的正惩罚此时则转变成了正强化。再如在《阿Q正传》中鲁迅先生所刻画的阿Q在每次被打后,使用精神胜利法最终能将遭受到侮辱和打骂这种正惩罚进行自我转化,最终产生心满意足的胜利感受,则很明显将之前的正惩罚转化成了正强化。

由此可见,在判断哪些情况下是正强化,哪些情况下是正惩罚,取决于诸多因素的影响,需要具体问题具体分析,而不能大而化之地将某种结果简单看成是正强化或正惩罚。具体来看,一种行动其结果是得到正强化还是正惩罚,首先取决于行动主体的内在身心状态与需要。行动主体作为当事人,他的心向与态度极为重要,不同的个体有不同的兴趣与需要特点。与此同时,即使是同一个行动主体在不同时机与场合也有不同的兴趣与需要。因此,特定的刺激给当事人带来的是愉快还是不愉快或没有明显的情绪体验,将直接决定该刺激的性质相对当事人的特定状态和需要来说是积极的刺激还是消极的刺激,而刺激的相对性质则最终决定行为结果是受到正强化还是受到正惩罚;其次,从长远来看,最终发生的是正强化还是正惩罚还取决于外部的情境因素,塞翁失马、福祸相倚便是此种情形。一种行为或与其相关的系列行为发生之后,其结果是福是祸,除了受行动者内在主观因素的影响之外,还受外在不确定因素的影响,最终使得“福与祸”这对矛盾相互转化,有时因福得祸,有时则因祸得福。故而当事人行为的结果“是福是祸”最终决定了在特定时期特定行为受到的是正强化还是正惩罚。

(2)负强化与正惩罚的相互转化。

负强化是个体为了避免某种厌恶刺激,从而增加某种行为概率的强化作用,在负强化中个体避免的厌恶刺激就是行为反应中的负强化物。正惩罚是呈现某种厌恶刺激,导致行动者痛苦并使行动者特定行为表现消失的过程,在正惩罚中施加在个体身上的厌恶刺激就是行为反应中的正惩罚物。通过比较可以发现:负强化中的强化物与正惩罚中的惩罚物同样都是使个体厌恶的刺激,这是负强化与正惩罚中的共同点,这可能是导致不少教育工作者甚至教育学者们将负强化与正惩罚相混淆的根本原因。事实上,判断行为结果是得到负强化还是正惩罚,不是单纯由刺激物所决定的,而是结合刺激物的性质以及刺激物对特定行为的作用结果是加强行为还是减弱行为综合决定的。比如,如果学生完成了家庭作业,那么家长就可以不要求孩子洗碗碟,那么大多数不爱洗碗碟的孩子为了摆脱这种令人厌恶的家务劳动,则会努力完成家庭作业,最终如愿以偿地避免了洗碗碟。可见,在这种情况下,洗碗碟这种令人厌恶的家务劳动对这个学生的“完成家庭作业”的良好行为产生了负强化。但是,这只限于这个学生完成家庭作业的情况,事实上,即便家长对孩子提出这样的要求,在最初儿童规则意识尚未明确或试图挑战家长设定的规则时,不少儿童最终往往仍旧未能完成家庭作业,那么在这种情况下,结果家长只好令其洗碗碟,以示惩罚。可见,在这种情况下,洗碗碟这种令人厌恶的家务劳动则对这个学生的“未完成家庭作业”的不良行为产生了正惩罚,从而使得最初预计的负强化转变成正惩罚。而该名儿童有过这次正惩罚的经历之后,可能就明确了家长在家庭教育中的规则,体会到了洗碗碟过程中家务劳动的不快,以后为了避免洗碗碟,每天都能按时完成家庭作业,在这种情况下,洗碗碟则又重新对其“完成家庭作业”的行为产生负强化。因此,从以上行为情景中可以看出,同样是洗碗碟这种一般人厌恶的刺激,当学生表现出积极行为的情况下移去该刺激,结果是对学生积极良好的行为产生负强化。当学生表现出消极行为的情况下呈现该刺激,那么结果则是对学生消极的不符合要求的行为产生正惩罚。

可见,积极行为与消极行为是矛盾运动过程中相互对立的两个方面,积极行为与消极行为的相互转化过程中,在特定的时间段出现的是积极行为还是消极行为,最终决定了厌恶刺激消失或者呈现,因而从本质上决定了负强化与正惩罚的出现及其相互转化。因此如果不针对具体的行为以及具体的对象,我们很难简单地说特定的刺激物对行为产生了负强化还是正惩罚。在教育实践中,凡是混淆负强化与正惩罚的现象都是忽略了刺激物与特定行为、特定对象的对应关系所导致。例如2011年10月西安未央区第一实验小学为“激励学习及思想品德稍差的学生上进”,特意为这部分学生发放和佩戴绿领巾,从而引起全国上下尤其是教育界的关注,在此后CCTV13节目中录制的“绿领巾事件”专家点评中,同样有专家简单地将该学校在教育中使用“绿领巾”这种厌恶刺激理解为在教育中使用负强化。但事实上,对于已经佩戴绿领巾的学生来说,从绿领巾实实在在地戴在他们颈中的那一刻起,就意味着厌恶刺激已经呈现,因此对他们来说得到的绝对不是负强化,而是实实在在的正惩罚。

(3)正强化与负惩罚的相互转化。

正强化与负惩罚也存在着相互转化的关系。正强化转化为负惩罚的现象在实践中比比皆是,例如在管理学领域我们经常可以发现,在组织凝聚力欠佳或正式组织与非正式组织愿景不一致的情况下,个体在正式组织中得到奖励与肯定,反而会导致在非正式组织中特权与地位的丧失。在这种情况下,最初正式组织给予奖励的初衷在于对员工积极行为进行正强化,但结果却是导致员工在非正式组织中归属感的消失与地位的丧失,此时最初的正强化转化成了负惩罚,在整个转化过程中,个体往往体会到一种强烈的趋避冲突。

负惩罚也可以转化为正强化。如当学生上课迟到或在课堂教学中违纪时,有些教师试图使用负惩罚进行管理,如让学生离开座位到教室外面反省。其初衷是剥夺学生听课的权利以给其带来的不愉快感,从而减少迟到或课堂违纪行为,这是典型的负惩罚。但事实上,正如在类似案例中经常观察到的一样,不少学生在被剥夺听课权利后,起初或多或少会表现出一定的羞耻感或不适感,但一段时间之后,情况往往发生逆转:一些外倾型的学生,其活动性较强且喜欢被人关注,借这种机会他们往往可能获得被关注感或与众不同感,一旦这些学生因违纪获得一种被关注感、与众不同感,那么此时所发生的不仅不再是负惩罚,反而演变成了正强化,即因为违纪被剥夺听课权后会获得更多关注,故日后会故意违纪。在这种转化中,喜欢受人关注的学生因违纪获得了被人关注或与众不同的良好感受,所以教师眼中的剥夺听课权利的“负性惩罚”给这部分学生带来的却是实实在在的正性“奖赏”,负惩罚最终转化为正强化。

(4)负强化与负惩罚的相互转化。

负强化可以转化为负惩罚。实践中发现不少家长会这样激励孩子“只要好好读书就可以不用做家务”来加强其学习行为。一般情况下,“做家务”是人们所不喜欢的活动,是厌恶刺激,因此避免“做家务”这种厌恶刺激以加强特定预期行为被认为是一个负强化过程。但事实上,仍需要具体问题具体分析,对特定的将做家务视为兴趣爱好的个体来说,“做家务”不但不是厌恶刺激,反而是愉快刺激,那么“不用做家务”则是剥夺了个体的某种愉快刺激,因此,对其行为而言成了负惩罚,从而使得家长心目中的负强化转化成了少数儿童心目中的负惩罚。

负惩罚也可以转化为负强化。如上述因学生课堂违纪教师使用负惩罚剥夺学生听课权利以减少学生违纪现象的案例中,有时会发现最终的结果往往事与愿违。如,一些学生本身对学习不感兴趣,因此被剥夺听课权利后,这部分学生站到教室外面后,渐渐地不会感到不愉快或难过,他们反而发现表面上因违纪被“罚”,实际上却可以因违纪而避免厌恶刺激——坐在教室听课。因此他们日后会乐此不疲,不断地违反课堂教学纪律或迟到,故意使教师剥夺他们听课的权利,此时发生的也不再是负惩罚,而是演变成了负强化。在这两种转化中,教师眼中的坐在教室听课的权利在学生眼中无法具有同样的价值与吸引力,因此剥夺这种权利后,在度过最初的不适或不愉快后,学生内在的心理感受渐渐地发生了变化,因受罚而最初感受到的不愉快感在逐渐减少甚至趋于消失,在这种情况下,负惩罚的效果已经消失并开始发生转化。即原本就不喜欢上课的学生因违纪获得了避免上课的机会,此时教师眼中听课这一特权反而成了学生唯恐避之不及的灾难,为了避免上课,学生很快学会各种违纪行为,最初教师眼中的负惩罚此时则转化为学生眼中的负强化,即为了可以不用听课而频繁违纪。

从以上强化与惩罚的辩证关系中可以看出,强化与惩罚表面上似乎存在明显的对立关系,实际上则存在复杂的辩证关系。事实上,在矛盾运动的过程中,正强化与正惩罚、负强化与正惩罚、正强化与负惩罚、负强化与负惩罚各占矛盾对立的两端,在由量变走向质变的过程中,突破特定的点,矛盾的两端即发生转化,而这一特定的点却往往因人而异,因情境而异。正是这一复杂性使得强化与惩罚的概念走向复杂,故而在实践中,不少教育工作者,甚至一些知名学者,也会发生误用,而要从根本上解决概念混淆与误用的问题,明确其概念内涵固然是重要的,但更为重要的是,应能在明确概念内涵的基础上,深刻分析与理解其辩证关系,尤其应能明确,随着主体、对象、刺激物性质与情境特征的变化,强化与惩罚这两个概念往往不是静止不变的,而是存在复杂的转化关系。因此,特定刺激物所产生的结果最终是增强行为,还是降低行为,往往因人、因时、因地而异,具有不确定性。也就是说,同样的刺激对于不同的个体、在不同阶段或在不同情境下,其意义是不同的,有时是令人愉快的积极刺激,有时则是令人厌恶的消极刺激。因此,对个体特定行为产生的是强化还是惩罚,往往需要具体问题具体分析,需要结合特定的主体、刺激、情境、行为、结果因时因地制宜,不能大而化之,也不能简单归类,只有这样才能真正理解强化与惩罚的概念内涵,解决复杂的行为问题。

摘要:“强化”与“惩罚”是学习理论中的重要概念,也是个体行为管理的有效手段,在教育实践中有着非常广泛的应用。表面上看,“强化”旨在加强行为,“惩罚”旨在降低行为出现的概率,两者存在明显的区别,似乎极易区分。但进一步研究往往会发现,两者存在复杂的辩证关系,从而使得无论是在研究领域还是在应用领域,都经常出现“强化”与“惩罚”概念的误用,甚而将强化与惩罚的概念相混淆。因此,正确理解“强化”与“惩罚”系列相关概念,厘清两者的辩证关系极为重要。在把握两者的辩证关系时,既要认识到强化与惩罚的对立,也要认识到其辩证统一,即正、负强化与正、负惩罚在一定条件下存在复杂的相互转化关系。

关键词:强化,惩罚,辩证关系,转化

参考文献

[1]张厚粲.行为主义心理学[M].杭州:浙江教育出版社,2003:344.

[2]莫雷.教育心理学[M].广州:广东高等教育出版社,2007:74.

[3]林崇德,杨治良,黄希庭.心理学大词典[K].上海:上海教育出版社,2003:138.

[4]赵坤,陈辉.论教育中强化与惩罚的使用[J].教育实践与研究,2010(9):8.

上一篇:人力资源强省下一篇:媒体形象危机