高校百度贴吧舆情研究

2024-08-14

高校百度贴吧舆情研究(精选3篇)

高校百度贴吧舆情研究 篇1

引言

舆情是指在一定的社会空间内, 围绕中介性社会事件的发生、发展和变化, 民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。网络舆情指网民基于网络主题的情绪、意见、态度等的集体反映。

百度高校贴吧自2003年年底创立以来, 深受网民欢迎。在2008年, 该贴吧高踞全国高校第二, 是学生乃至教师经常访问的网络社区, 诸多颇有争议的热点或焦点在此呈现或演化, 具有校园舆情风向标的意义。

百度高校园贴吧舆情的特点

毫无疑问, 在全国高校停开BBS之后, 百度高校贴吧已风靡至今, 深受师生认可, 是高校重要的校园网络社区, 成为师生网络人际传播的第一处所, 深刻地影响着其对校园事务认可和决断。通过长期对贴吧的关注, 结合舆论学相关理论进行分析, 综合起来可以看出百度高校贴吧的舆情具有以下四个方面的特点。

舆情营造的主体与主题校本化。与很多社区不同的是, 贴吧创造的社区往往是一个话题非常封闭的社区, 如高校贴吧, 其不仅表现在主体的校本化, 即吧友绝大部分是本校生, 而且表现在主题校本化, 即90%以上的事件与学校有密切的关系。虽然理论上贴吧可以有更开放的讨论主题, 但是多数贴吧的成员更愿意围绕一个封闭的主题来展开交流, 这就促进了互动的深度的不断挖掘, 营造舆情事件。

舆情诱发的事件类型广泛。高校贴吧舆情诱发的事件首先为学生利益事件, 如奖助学金遴选、入党、评优评先、学生干部、就业等与学生利益密切相关的事件, 其次是教师利益事件, 例如工资、职称评定、对学校发展的看法等, 再次是师生集体关注的事件, 如本科教学评估、行政行风、后勤、校园建设、校园重点人物、重大活动事项、突发事件等。

舆情演化的机制复杂。一般来说, 事件舆情的开始是某个吧友个体事件的独立的体会的普通帖, 然后经诸多吧友点击或跟帖, 较短时间内飙升人气, 形成“热贴”, 进而吧主将该帖置顶或设为“精华帖”;然后引发更多普通吧友的跟帖或回复或点击, 吧社区的群体感受的诉求喷涌而起, 同时吧友线下对该事件反思与聚议或同时在线的顶帖, 至此舆情形成, 并对现实事件产生不断的影响;随之, 在一段时间内, 贴吧舆情诉求与现实诉求同步与异步发展, 引导该舆情事件现实中处置方式的变化;进入到舆情再激发对事件深层次的反思的阶段, 如实际已经解决仍然引起网络关注, 或处置的方式引起争议, 或曝料, 引发对事件更热度关注, 促使舆情诉求方向转变;最后, 舆情及其事件的平息与湮灭, 该事件主体参与表达, 澄清表达本意, 或事件妥善处置, 或突发事件或重大事件出现分散关注度, 或随时间延续, 最终该事件舆情渐微乃至湮灭。

舆情形成中的群体极化与群体涣散。高校贴吧的吧友来自该校的各个院系专业, 分布于各个年级, 各类层次, 每个吧友加入的贴吧动机各不相同, 首次进入贴吧的方式也各不相同;在初期阶段, 基本处于吧主或重要吧友的从属意识下, 进行着无意识的顶帖或跟帖, 多为简略的浅层次的表达, 无法引起楼主关注或形成社区影响力, 但是诸多此类吧友此类网络行为就会形成群集效应, 造成群体极化, 该层级吧友是舆情事件形成的重要帮手。在进入毕业阶段或遭遇贴吧暴力体验或厌倦贴吧方式或追求新的网络诉求方式;吧友进入有ID而匿名的形式逃匿期, 然后逐步脱离贴吧, 该层级吧友易造成群体涣散, 是舆情及其事件的平息与湮灭的另类力量。

高校百度园贴吧舆情目前的问题

目前, 高校贴吧舆情呈现出以下三个方面的问题。

舆情形成事件的主体对主题表述的情绪化。个体的情绪体验在表述中为寻求更多关注, 往往拟出一个极具“点燃性”的题目来承载主题内容, 对主题内容表述恣意行文, 尽量渲染悲情色彩, 从而使该事件的舆情的形成往往非常迅速, 一“触”即“燃”, 一“燃”即“火”。一个热点事件的存在加上一种情绪化的表达, 就可以成为点燃一片舆情的导火索。

舆情事件的解读的消极化与无限极化。吧友在现实生活中遇到种种挫折, 对社会问题及校园问题片面认识等, 都会利用贴吧得以宣泄, 借助舆情事件这一载体, 从感性视角尽情发泄, 甚至漠视事件本身的处置。长期以来, 由于吧友身份隐蔽, 并且缺少有效的规则限制和有效监督, 贴吧自然成为师生情绪的空间, 因此在贴吧上很容易对舆情事件进行消极解读, 甚至群体消极情绪进行无限的舆情事件的极化消极效应, 极度影响现实中该舆情事件的最终处置。

舆情发展态势认可度的群体差异性较大。大学生群体的青春期特征决定在校园空间必然存在一个各种诉求充分表达的空间, 同时, 社会转型期、高校发展转型期、个人发展转型期交织在一起不可避免地存在诸多潜在的矛盾, 个体容易出现情绪化冲动与表达, 诱发潜在舆情事件。在没有其他表达空间的前提下, 目前高校师生比较认可贴吧的诉求表达的方式, 但是学校管理者对校园舆情习惯于自下而上的汇报, 即使出现舆情也多是回避或堵塞, 更为关键是对网络化诉求表达鄙夷与不信任。二者的认识差异导致在舆情事件中对事态的趋向与强度认可度极不同步, 其结果易造成舆情事件蔓延至邻近高校, 连锁反应, 造成区域范围内高校群体性学生事件。

高校百度园贴吧舆情问题的策略性建议

对于贴吧舆情的问题, 高校管理者应当了然于心, 能做出及时反馈, 防微杜渐, 防患于未然。通过以上分析, 充分考虑高校百度贴吧及高校管理的实际, 结合舆论学, 社会学, 传播学的相关原理, 针对以上问题提出以下策略性建议。

首先, 校园管理者要保持信息的公开通畅。社会学规律表明, 当权威信息缺失时, 就给小道消息传播提供了契机。因此, 当贴吧舆情危机出现时, 要最大程度地争取现实群体的支持, 利用校园媒体的公信力和权威性。建立校园重大事件恳谈会制度, 通过该平台既向师生传递权威而且实事求是的信息, 又满足了个体利益的表达内在诉求, 同时加强各群体的交流与沟通, 易化解潜在的冲突与矛盾, 促进相互理解与支持, 营造解决舆情事件的良好的现实情境。

其次, 发挥重点吧友的“舆论领袖”作用。就目前我国一些较有影响力的论坛的参与情况看, 培养论坛的“舆论领袖”, 利用这些“舆论领袖”来引导网上舆论, 已成为普遍做法。这些“舆论领袖”有见地、有代表性的发言一般被版主用醒目的字号和色彩加以强调, 放在网页的突出位置, 以强化主流言论, 孤立非主流言论。高校要积极组织具有较强社会责任感, 主体意识和大局意识的, 语言与文字表达能力较强师生与普通吧友一道, 营造良好贴吧舆论空间, 平等平心地进行网络表达与交流, 尊重网络诉求, 应用网络大众传播的规律因势利导地进行引导贴吧的舆论。

再次, 强化各级吧主及管理员的“把关人”角色。任何信息传播, 都是信息选择的过程, 其间充满了各种各样的“把关人”。贴吧把关人包括各级吧主、百度贴吧管理员等, 在信息选择、引导舆论方面的作用至关重要。贴吧把关人应是信息提供者、信息引路人、信息规范者和监督人, 设置好有关话题或议题, 吸引终端上的个人参与到公共话语空间, 通过自由热烈的网络交互, 及时的事实报道, 再加上详尽的背景材料, 对不同空间的话语进行整合, 在交流中引导大众舆情, 促成正确舆情的形成。在把关中, 切忌简单粗暴地删帖, 要注重运用动之以情、晓之以理的引导艺术, 使网民产生理性和情感上的认同与共鸣。

最后, 做好日常监测和突发事件监测。日常监测是指将贴吧舆情监测作为高校管理部门的一项日常工作不间断进行, 随时掌握贴吧舆情的导向、特点和趋势。突发事件监测是指当发生校园群体性突发事件时, 对贴吧相关舆情的监测。由于突发事件中的矛盾双方往往处于对立状态, 社会影响大、给决策者思考的时间短, 原有信息沟通渠道的不再畅通, 各种“小道消息”有机可乘, 若不及时准确获得最新信息并加以判断处理, 产生的后果非常严重。

结束语

高校百度贴吧舆情问题仅是目前网络舆论问题的一个侧面, 其有效解决更有赖于现实社会的民主化进程不断前行, 网民普遍自律的形成, 网络法律法规的不断完善, 以及高校日常管理的科学化、民主化的不断深入与完善。 (本文为河南省教育厅人文社会科学研究项目“网络社区舆情管理问题研究”成果, 项目批准号为2008-GH-034)

参考文献

[1].吴绍忠、李淑华:《互联网络舆情预警机制研究》, 《中国人民公安大学学报 (自然科学版) 》, 2008 (3) 。

[2].杜先涛、吕婷:《网络舆情视野下的思想政治教育方法》, 《现代教育科学》, 2008 (2) 。

高校百度贴吧舆情研究 篇2

摘要:随着高校网络的日益普及,大学生越来越依赖于网络平台,网络舆情成为校园舆情的一个重要组成部分。高校网络舆情的形成原因来自于网络自身的特点以及大学生的需要。针对高校校园网络舆情的成因,进行积极有效地引导,可以更好地满足大学生的需要,营造和谐的校园环境。

关键词:大学生网络舆情 成因 引导策略

高校校园网络舆情,是指高校大学生通过互联网媒介对社会热点问题或与自身利益密切相关问题所表达的具有一定影响力和倾向性的态度、意见、情绪的总和。[1]网络时代,越来越多的大学生喜欢在网络空间里记录自己的所见、所闻、所感,借助微博、人人网、QQ空间等新媒体工具,随时阅读、评论、转发。这种轻松、便捷的交流方式受到大学生的青睐,使得高校网络舆情的影响力逐渐增强,进而加深了对大学生思想和行为的影响。

但是,高校在网络舆情引导方面暴露出的问题也越来越多。因此,研究高校校园网络舆情的成因,加强高校校园网络舆情引导工作迫在眉睫。

一、高校校园网络舆情的成因

在商品市场经济中,有需求就有生产,同理,从受众的角度出发,正是因为网络媒介的

独特之处满足了受众的需求和愿望,给人们带来了心理上和行为上的效用,高校网络舆情便应运而生。

(一)网络信息量大,能满足大学生获取信息的需求

信息和知识共享是互联网的基本精神,互联网是当代大学生获取信息的主要渠道,网络成为越来越重要的信息共享与交流平台。网络内容包罗万象,有着极为丰富的信息,其中讨论的话题各式各样,从学业到就业、从购物到旅游,从体育健身到休闲娱乐,从社会问题到校园文化等等,应有尽有。在大学生的眼中,实用是网络的最大功能,遇到什么事,都倾向于在网上发出求助,有些热心的同学会及时回复,提供一些有建设性的意见和建议,并经常把一些有意义的网络资源分享到网络上,与他人共同分享。这就是高校网络舆情形成的主要原因。

总之,在校园网络舆情载体上,承载着大量的信息资源,家事、国事、天下事都能成为大学生舆论的话题,网络上海量信息,使得高校校园网络舆情应运而生。

(二)网络的交互性,能给大学生提供情感交流的平台

情感交流是人们生活中不可或缺的内容之一,交流与沟通是人们传递情感,以获得心灵慰藉的必经之路。随着现代社会的竞争越来越激烈,大学生所面临的学业、生活的困惑,考研、就业的压力越来越大,紧迫感和危机感也越来越强烈。随着年龄的增长,大学生在现实生活中不愿意向熟人表露自己的情感,找人倾诉时会犹豫不决、不好意思开口。

再者,校园生活的人际交际圈较小,学生之间彼此的交流的范围有限。因此,他们的社交需求在现实生活中往往难以得到满足,他们迫切需要寻求其他的途径来结交朋友,需要一个可以进行情感交流和宣泄的渠道。

社会化网络服务特定的群体,使得网站的群体表现出“同辈群体”的特点,成员有大致相同的智力发展水平、兴趣爱好、共同语言、生活方式等,具有很强的群体认同感,易形成自己的亚文化,并在此基础上形成一致的价值观和行为规范。[2]相同的知识背景、兴趣爱好是交流感情的前提之一。因此,高校校园网络的“同辈群体”如校园官方微博、人人网、QQ空间等恰恰为他们提供了这种方便。

总之,由于互联网的互动性、平等性、隐匿性,在很大程度上激发了当代高校大学生的自我认知的需要,使得他们有强烈的欲望来表达和倾吐内心的声音,从另一个侧面引发了高校网络舆情的空前繁荣。

(三)网络的自由与开放,开通了大学生表达利益的渠道

现实生活中大学生意见表达的不畅,也是导致校园网络舆情兴起的重要原因。当学生在遇到挫折或者对不满想提出意见的时候,在常规渠道上,比如学校的报纸、校园广播、座谈会等不能顺畅地表达自己的观点的时候,寻求网络便是学生一个便捷的选择。

校园网络凭借它的天然亲和力和吸引力成功地打造成为一个汇集校园意见的新平台,成为大学生表达利益诉求的新渠道。第一,可以达到宣泄的目的;第二,在舆情达到一定的程度下,能够引起相关工作人员的重视,便于问题的解决。

(四)网络的平等性,能满足大学生对尊重理解的需要

互联网为大学生营造了一个平等的交往空间,使得他们在交流感情、发表言论的时候不受性别、身份、地位的束缚,在网上可以畅所欲言、自由交流,充分享受这种互相尊重、互相理解的交往模式。

通过网络平台对某些焦点问题来表达自己具有深刻思想的看法和观点,对学校的改革和服务质量等发表深刻意义的意见和提出建设性的建议,激发学生积极地参与讨论,这样具有逻辑思维能力和语言表达能力的大学生会受到网友的极力追捧。而且,大学生可以从互联网上获得在日常生活中难以得到的认同感,满足了他们的自尊心,也满足了他们被理解与被尊重的需要。

当然,校园网络舆情的形成,也与当今社会存在的分配不公、贫富差距扩大、官员腐败、就业等热点问题密不可分。包括一些敏感的政治问题、国际关系也会触动促发大学生的情绪,造成校园舆情热点。

二、高校校园网络舆情的引导策略

(一)主动介入,打造健康的校园网络舆情平台

高校网络舆情主要借助校园官方微博、校园门户网站等载体进行发布和传播。打造健康的校园网络舆论平台,是大学生自身的需要,也是建设和谐校园的需要。

自媒体时代里,人人都有“麦克风”,网络上的信息层出不穷。但如果信息泛滥,或者一些扭曲的言论,则会对校园网络舆情产生恶劣的影响。高校可以加强主题网站的建设,网站上设置一些具有教育性、思想性和趣味性为一体的议题,立足于学生的需要,贴近学生、贴近校园、贴近生活。高校还可以在主页面设置网络意见箱,提高学生表达意见的渠道,拉近大学生网民与主题网站的距离,使主题网站具有吸引力和生命力。

此外,高校还可以充分运用诸如人民网、新华网、搜狐网等校外主流网站,在校园网站上建立相应官方论坛、微博等,让主流媒体声音的覆盖面更加扩大化,让学生的信息获取更加完整和正确,积极进行网络舆情引导,营造和谐的网络舆论氛围。

当前,大多数高校主流网站内容比较单一,以校内新闻、通知公告等为主,缺乏一定的吸引力。对此,高校应当完善校园主流媒体建设,充分利用好学校新闻广播、校报等主流媒体,营造健康的校园舆情环境。

(二)强化熏陶,提高大学生的网络素养

大学生群体面对网络中充斥的鱼龙混杂的信息,往往缺乏理性的判断,容易人云亦云。在使用网络平台传播信息的过程中,更容易扩大言论发起者和转发者因理性缺失而助长的负面效应。美国学者埃瑟?戴森指出:“网络比大多数环境拥有较少的普遍规则,也较少需要这样的规则,它更多地信赖于每个公民的判断与积极参与。” [3]因此,要做好网络时代下的网络舆情疏导,不仅要靠社会大环境的净化,还有赖于大学生网络素养的提高。

首先,大学生要加强媒介素养的培养。大学生自身要加强获取信息的能力,提高媒介价值判断的能力,以及加强自身的道德意识和社会责任感,履行好作为信息制造者和传播者的道德义务。

其次,高校应该加强网络道德教育,提高大学生的网络素养,规范大学生的网络行为,培养大学生的道德自律意识和法制观念,自觉遵守网络法律法规,抵制网络不良信息的腐蚀。

最后,高校还可以将网络道德教育延伸到高校校园官方微博、官方人人网主页面上,通过留言、发帖等采用图片、文字、音频、视频文件、网络链接等方式,潜移默化地影响并积极地引导大学生的思想和行为,培养大学生的道德自律意识。

(三)健全队伍,扮好“把关人”的角色

高校要重视校园微博的建设,充分发挥好微博的交流沟通和服务功能。高校微博是大学生主要的舆论场所,也是高校自主管理、自我教育的主要阵地。高校要扮演好“把关人”的角色,加强微博的管理。

微博上存在着各种复杂的舆论甚至谣言,因此,高校要密切关注学生的舆论动态,有必要安排教师或者专家、网络技术过硬的人对微博上的言论进行清理、严格把关,一旦发现虚假的、低俗的、反动的或者错误价值取向的,要迅速鉴别并加以查封,从源头上杜绝反面性、虚假性的言论在校园网上传播。对于那些恶意的情绪宣泄信息,不是盲目地“堵”,而是要重“疏”,及时进行疏通和引导。因为,大学生是有思想、有感情、有独立人格、尊严和价值的人,要充分尊重他们的人格。我们尊重他们的兴趣爱好,在理解他们的基础上认真倾听来自不同角落的声音。

(四)交流互动,做好大学生的服务工作

网络的自由和开放性为大学生提供了一个表达思想的新空间,网络空间日益成为了大学生的精神家园。校园网络舆情载体,集中着大学生大量的观点,心声的倾吐,情绪的宣泄等。高校应充分利用这个平台与广大学生进行交流互动,倾听他们的呼声,了解他们的需要,有效解决他们的困难和问题。学校党委可以要求思想政治教育工作者和“两课”教师都要申请一个微博账号,在网上与学生进行交流。[4]针对大学生的学业迷茫、情感挫折、就业压力和成长困惑等各方面的问题,应给予及时的解答和提出有效的建议,多为学生提供一些正能量。针对大学生讨论的社会热点问题,高校要进行有效的辨别和引导。

当这种热点问题可能会对大学生带来积极的影响的,高校则可以让更多的学生加以关注,进行积极的互动交流,从而达成有利于社会的观念和行为;当这种热点问题可能会带来消极的影响的,则应减少大学生对此事的关注,转移对此问题的关注度。如针对大学生对学校制度、食堂质量、宿舍情况等问题的反映,高校应给与正面的解释以及做出相应的调整和改善,以学生为本,尽量做到一切为学生服务。

参考文献:

[1]曹银忠.高校网络舆情引导研究[J].毛泽东思想研究,2012(6):146-150.[2]王思斌.社会学教程[M].北京: 北京大学出版社,2005:152.[3](美)埃瑟?戴森.2.0 版数字化时代的生活设计[M].海口: 海南出版社,1998:18.[4]陈树春,黄华强.高校校园网络舆论的特点和引导策略探究[J].广西民族大学学报:哲学社会科学版,2008(6):132-134.此课题为:江苏大学第12批大学生科研立项资助项目,编号:12C027。

作者简介:

曹新燕,江苏大学2012级研究生,研究方向:高校思想政治教育与管理创新。

高校百度贴吧舆情研究 篇3

高校贴吧属于百度公司运营管理的网络产品,由于其具有操作简单、互动性强的特点,是高校学生和教师群体访问较多的交流平台,是呈现和传播校园舆情的重要场所,其中发布的帖子内容不仅直接反映了师生对校园热点、焦点事件的态度和情绪,也折射出学生的心理健康状况和思想动态等信息。根据查阅资料、采集分析帖子内容等手段,本研究认为高校贴吧的网络舆情主要具备以下三个特点:

1、讨论主题集中化、本土化

由于参与高校贴吧的群体主要是来自同一所高校的学生,讨论的话题主要围绕着校园突发事件、学校政策、个人学习生活等内容展开,严重影响高校和师生的整体形象,特别是在特定时期,会出现大量与某一主题相关的帖子。例如:在高考报名、录取和新生报到前后,贴吧上会集中出现批量询问学校、专业和生活环境等情况相关的帖子;在高校确立某项制度和政策后,在贴吧上也会展开广泛的讨论。因此,为及时掌握学生对重大事件的观点态度,减轻网络舆情对高校形象的负面影响,高校网络监管部门应在特殊时期加强对贴吧的干预工作。

2、学生群体是主角,高校相关部门与之缺乏必要的互动

在高校贴吧的主要活跃群体中,大部分积极参与者都是学生,只有个别教师有访问、浏览过帖子内容,但是缺少与学生的主动互动,高校等相关部门对贴吧也缺少必要的关注。教师和高校官方部门的角色缺失导致大学生对于突发热点事件的人云亦云,容易造成负面舆论的恶性传播。针对以上特点,高校不仅应增强官方网站的运营管理,还需要在贴吧等论坛上与学生建立一种良性互动关系,特别是高校宣传部门和心理健康咨询干预等部门应组织必要人力及时对学生表现出的问题、困惑和心理问题等进行解答、疏导。

3、价值观多元化,相互有影响和冲突

根据现有的调查统计,高校帖子的内容以娱乐和吐槽为主,娱乐类话题包括发布交友信息、调侃他人、展示自我个性、谈论娱乐八卦等,吐槽类话题以表达不满、抨击社会、发泄不良情绪等,另外还有少量不符合法律法规要求的帖子存在。帖子发布和回复的内容反映出学生不同的价值观念、心理需求和普遍心态等信息,由于大学生的法律意识、辨别能力和控制能力较弱,是非观念极易受到影响,有差别和冲突的观点还极有可能导致网络恶性争议事件。总体来说,大学生应加强学习,建立积极上的价值观,增进自己对社会的认识,具备较强的明辨是非的能力,消除网络负面言论对自己的影响。

二、基于贴吧的高校舆情预警系统的架构设计

从功能上来说,该系统应包含两个核心部分:贴吧内容分析部分、预警部分。

1、贴吧内容分析部分

检索高校贴吧网页,获取网页代码,从代码中分析出用户发表的主贴和回帖的文字信息,并对文字信息进行分析,获取关键字,关键字作为内容分析部分的最终结果。使用关键字而不是帖子内容或主题句作为最终结果的原因在于,细粒度的关键字更易于聚类,而稍大力度的句子很难作为聚类统计的依据。

2、预警部分

根据预设的预警规则对一段时间内的帖子内容进行统计,依据为关键字,如符合预警规则,则触发警告。预警规则一般设置为单位时间内某关键字出现的次数、发帖人数等相关统计参数是否超出预设阈值,因为热点话题的特征为时间局部性;最为典型的,当单位时间内某关键字在帖子中呈现井喷状态时,则说明较多数量的用户对此予以了更多的关注、讨论,并吸引着更多的用户参与到相关讨论中。

本系统的功能设计包括爬取网页、提取内容、存储数据和设定预警规则等部分,具体结构如图1所示:

其中:

(1)页面爬取器是一个简单的爬虫模块,负责完整地爬取贴吧各主贴、回帖的页面内容,输出结果为页面代码。该爬虫模块采用的页面检索方式类似于广度优先搜索策略,优先对主贴进行搜索,即首先将未被检索的主贴链接置入“待下载队列”,而后依次下载链接,同时分析出各主贴的回帖链接,并置入“待下载队列”,最后依次下载所有的回帖链接。

(2)内容提取器页面爬取器的结果为网页源代码,包括html、css、javascript代码,内容提取器的功能是对网页源码进行分析,从格式代码中提取出帖子的主体内容信息,忽略html标签之类的网页代码信息。

(3)关键字抽取器帖子文字内容一般为与上下文相关、语义完整的中文句子,使用计算机进行中文语言处理的第一步是进行分词,将句子划分为多个词语,本文从中取出“名词”作为帖子的关键字,忽略帖子内动词、形容词之类的语言要素。

(4)数据库部分帖子内容不仅具有时效性,还体现了发帖人的个性,为便于对可疑发帖的信息进行更深层次的分析,数据库将爬取的所有帖子内容、关键字、附带发帖人和发帖时间都进行保存。

(5)预警规则系统使用者设置的预警条件,一般设置为一段时间内某关键词出现次数的阈值,格式为<days,keyword,threshold>,其中keyword支持通配符。

例如,<1,“校历”,20>,表示当一天内“校历”关键字在贴吧中出现的次数超过20次时,则预警,可能原因在于校历的下发环节或校历的某项安排出了问题;<1,”%%”,50>,表示当一天内任何一个关键字超出50次出现时,即触发报警,需要引起检测部门的人工关注。

(6)预警器负责解析预警规则,将其转化成对应的数据库检索条件,定时发起检索,如果满足检索条件则采用具体的形式给监测者发送预警消息,比如短信、电子邮件等形式。

三、基于贴吧的高校舆情预警系统的技术实现

1、贴吧页面爬取技术

爬取网页可采用三种方式:编程语言直接访问URL网络流的方式、模拟浏览器的方式和官方访问API的方式。直接使用URL网络流进行爬取的优点在于性能较好,但实现时考虑因素较多,另外,很多网站程序会对请求来源进行筛选,过滤掉部分通过简单编程的方式直接访问网页的请求。本系统在实现初期采用直接使用URL网络流爬取网页的方法,但在后续阶段,爬取帖子的请求被网站屏蔽掉,为了保证系统的稳定性,爬取过程采用了模拟浏览器的方式。模拟浏览器,即模拟浏览器的各项HTTP请求参数,本系统应用java语言,通过采用apache的Http Client开源项目设置各种HTTP请求参数来模拟真实的浏览器请求,并提供一系列的请求及响应相关处理方法。

2、网页内容提取技术

从html网页代码中提取出具体的信息,需要对网页结构进行分析,可以采用两种技术:基于正则表达式的方式、基于第三方html解析库。本系统采用第二种技术,即应用了Jsoup解析器。Jsoup提供了一套非常简洁的API,可以通过DOM,CSS以及类似于j Query的方式来取出数据。

3、关键字抽取技术

即中文分词技术,将中文文本内容划分为多个词语。本系统采用新浪应用引擎提供的SAESegment进行分词,其功能有方面:第一是进行中文分词划分,第二是提供划分词语的词性,比如是形容词、名词还是动词。

4、预警器

将抽取的关键字需要存储到数据库中,其格式采用元组的方式表示为<帖子ID,关键字,本贴内关键字出现次数>。预警器负责根据语境规则组织对该表的检索语句,并执行检索。

四、总结

本文介绍了当前高校百度贴吧的舆情特点,并且针对其网页特征设计搭建了舆情预警系统,本系统能对帖子内容实现自动爬取,通过采集数据分析学生关注所关注的热点话题,并且根据设定阈值实现预警的功能,为高校相关部门掌握和引导舆情的发展动向提供了辅助技术手段。

上一篇:船舶机舱火灾下一篇:一体多面