舆情监控系统论文

2024-07-15|版权声明|我要投稿

舆情监控系统论文(精选12篇)

舆情监控系统论文 篇1

摘要:本研究结合中国石油XX油田的发展状况, 相信阐述了网络舆情对石油企业的影响, 并根据影响提出了有针对性的舆情监控建议, 以有效促进石油企业的稳定发展。

关键词:网络舆情,企业,舆情监控

网络是继报纸、电视等媒介之后而产生的、以反映社会舆情为主要内容的现代化媒介, 网络舆情是社会舆论的重要呈现方式[1]。中国石油近些年来的快速发展要求必须要重视对网络舆情的监控, 避免因网络舆情对石油企业发展造成的不稳定性因素的产生。

1 石油企业网络舆情发展的特点分析

由于石油多产生于荒芜的地区, 因此石油企业发展具有自身特定的地理环境特点, 中国石油XX油田地处XX地区, 石油开采周边环境相对较差, 且发部分油区均远离居住区, 导致企业内员工常年处于奔波的状态, 出现了很多家庭问题。另外现阶段国家对石油有巨大的需求, 而油气的产量又不能很好的满足需求, 很大程度上加大了石油企业员工的工作压力, 会在很大程度上诱发网络舆情。

从石油企业的网民角度分析可以发现, 石油企业的网民上网率相对较高, 因此具备一定的网络舆情发生的基础。据相关数据显示, 石油企业的网民通过网络诉求的方式来表达自己的意愿的比率相对较高。同时石油企业受自身工作生产属性以及国家关于石油信息安全管理的规定等方面的影响, 企业内部很多网民的需求得不到应有的满足, 导致网络舆论的潜在诱发因素持续存在。

2 如何提高石油企业网络舆情监控

近些年以来, 中国石油发生了一系列的网络舆情事件, 使人们更加强烈且普遍的认识到网络舆情对企业持续稳定发展的重要影响, 石油企业如何从根本上防范网络舆情的产生是现阶段石油企业需要重点分析和考虑的问题。

第一, 石油企业需要建立合适的网络舆情引导渠道。引导渠道的有效建立能够较好的预防网络舆情的产生与泛滥, 石油企业应重点搭建诉求平台, 开发多元诉求渠道, 不断丰富石油企业门户网站, 为网民提供一个相对开放的沟通平台, 以更好的了解民意。另外石油企业还需要深入完善内部管理制度, 突出管理的透明性与公平性, 比如可以建立网络发言机制, 架构起企业与网民之间有效沟通的桥梁, 定期向网民发布企业的重大决定与热点事件、定期回复网民问题, 给网民足够的参与权与监督权力[2]。

第二, 石油企业需要重点把握网络舆论的走向。石油企业要首先掌握网络宣传的主动权, 强化门户网站的管理, 围绕企业的重大事件与决策开设专栏, 主动发布重大公共事件的权威信息, 以营造良好的企业内部舆论环境。在此基础上, 石油企业还需要重点突出发展主旋律, 通过开辟网络平台与专栏, 来引导网民积极讨论, 将网民的关注点引入油气生产工作中, 使网民认识到企业良好的发展环境以及员工与企业的根本利益一致性关系。

第三, 石油企业需要不断完善石油企业内部信息数据库, 包括建立企业内部石油地质信息库, 以为网民提供更加丰富完善的勘探开发、管理经营等方面的信息, 充分发挥企业门户网站的功能, 满足网民对石油信息的多样化需求。

第四, 石油企业需要不断完善企业内部舆情监管体系。首先要建立并不断完善石油企业内部网络舆情的监测机制, 成立网络舆情监测部门, 由相关人员来对企业门户网站搜集到的舆情信息进行检测, 以为企业应对突发的舆情事件提供预测与参考数据, 并给网络舆情提供一定的引导性建议。其次还要建立并不断完善企业内部网络舆情信息的管理机制, 定期对网民发布的信息进行收集与分析, 并提出有效的解决方案。最后要建立企业内部关于网络舆情的甄别制度, 比如建立特定的IP地址并分配使用, 进行用户实名制认证, 不断分析舆情产生的原因与舆情发展动态, 甄别舆情类别并强化对网民网络活动方向与领域的关注。

第五, 石油企业需要不断完善关于网络舆情的引导机制。引导机制的建立需要首先建设一支网络宣传队伍, 及时发布有关石油勘探开发与经营的状况, 围绕网民所关注的重点与热点, 主动撰写文章, 吸引网民分享, 以有效引导舆论发展走向, 将舆论所关注的热点引导到企业发展上来, 以形成正面良性的舆论形式。同时企业还需要加强关于员工的思想政治教育, 强化石油企业网络文明教育, 不断提高石油企业内部网民的网络道德层次, 引导网民自觉的遵守相关规章制度, 积极传播有利于石油企业发展的信息。

第六, 石油企业需要需要充分完善关于网民上网的管理与监督机制。企业要根据自身发展的特点, 建立员工上网管理办法, 规范员工上网行为, 将上网行为与员工考核结合起来。另外还需要企业投入先进的监督控制网络体系, 强化硬件投入, 建立企业内部网络舆情监督与控制系统, 自动对话题进行采集、分类与统计[3], 以实现企业对热点话题与突发事件的实时跟踪, 以充分保障石油企业的稳定发展。

3 结论

综上所述, 网络舆情作为影响石油企业和谐稳定发展的重要因素, 需要石油企业充分重视并引导, 积极发挥网络舆情的良性影响作用, 避免不道德的网络行为的产生, 以有效推动石油企业实现自身的和谐与稳定发展。

参考文献

[1]李占彬.企业应有效应对网络舆论[J].中国石油企业, 2010, (7) :93.[1]李占彬.企业应有效应对网络舆论[J].中国石油企业, 2010, (7) :93.

[2]于顺安.石油企业网络信息安全的监控系统研究与应用[J].中国信息界, 2012, (12) :83-84.[2]于顺安.石油企业网络信息安全的监控系统研究与应用[J].中国信息界, 2012, (12) :83-84.

[3]胡新录.对石油企业如何应对和引导网络舆情工作的思考[J].东方企业文化, 2013, (2) .[3]胡新录.对石油企业如何应对和引导网络舆情工作的思考[J].东方企业文化, 2013, (2) .

舆情监控系统论文 篇2

1、舆情监控制度是指对天涯论坛(天涯社区)、强国论坛(人民网)、红网论坛(红网)、华声论坛(华声在线)等网站涉及我县的负面信息进行监控的制度。

2、网上舆情监控重点为:网上散布的对我县经济社会发展不利的信息,有损县委、县政府和各单位形象的信息,有损县领导个人形象的信息。

3、网站定期对中央省市重大决策以及突发新闻事件等网上报道进行整理,编辑成《舆情信息清样》,供领导参阅;舆情信息清样出台要按程序报相关领导签发。

4、网络舆论监控由相关技术人员负责,随时对上述网站、论坛等以关键字进行搜索监控,及时捕捉网上舆情动态,并分析研判。

5、网络舆论监控实行24小时值班制度,发现情况及时向主任汇报,由主任向分管领导汇报,然后酌情向部长和各相关领导汇报;是否编辑舆情信息,由部长决定。

高校网络舆情监控体系的构建研究 篇3

关键词:高校;互联网;舆情;监控

中图分类号:TP393 文献标志码:A 文章编号:1673-8454(2016)16-0086-03

一、引言

随着互联网在全球范围的飞速发展,网络媒体已经成为继报纸、广播、电视之后的“第四媒体”。根据中国互联网络信息中心(CNNIC)的第37次互联网发展状况调查报告显示,截至2015年12月,中国网民规模达6.88亿,互联网普及率为50.3%。网民的上网设备正在向智能终端集中,智能终端成为拉动网民规模增长的主要因素。在众多网民中,高校学生由于数量较大、知识丰富、思维活跃,成为所占网民比例非常大、影响也极为广泛的一个群体。随着高校信息化建设的不断加速,网络已经渗透到高校各个角落,在高校学生的学习、生活中扮演着极其重要的角色。从互联网时代兴起的留言跟帖、BBS论坛、博客,到后来兴起的QQ群、微博,再到最近兴起的微信群,各种互联网媒介层出不穷,作为新兴的交流工具走进了普通民众特别是大学生的学习生活,个人言论自由权利因此得到了极大的发挥。特别近年来,手机、即时通讯软件迅猛发展,使得通过互联网进行的信息交流和观点发表变得即时、方便甚至时尚,因而受到了大学生的热烈追捧。即时通讯工具的便捷、互联网媒介的日益丰富,大学生群体思想活跃、乐于表达意见,由此形成的网络舆情成为影响大学生世界观、人生观和价值观形成的重要力量。因此,对高校网络舆情进行研究,成为当前高校教育行政部门、学生主管部门以及信息技术部门面临的重要课题。

二、高校网络舆情的特点

1.网络舆情的含义

王来华[1]在《舆情研究概论》中,对舆情的定义是:在一定的社会空间内,围绕中介性社会事项的发生、发展和变化,作为社会主体的民众对作为客体的国家管理者产生和持有的社会政治态度。简言之,舆情就是民众的社会政治态度。还有观点认为,舆情是由个人以及各种社会群体构成的公众,对自己关心或与自身利益密切相关的各种公共事务所持有的多种情绪、意愿、态度和意见交错的总和[2]。而且随着社会的发展和民众表达意愿、诉求机制的不断完善,舆情所涉及的内容越来越宽泛,不仅局限于社会政治、国家方针、政策措施,同时对自己关心的社会热点和突发事件都表现出极大的关注,并通过各种媒介进行表述。

2.高校网络舆情的特点

高校大学生有着较高的文化素质,对政治以及社会事务抱有极大的热情,参与性强[3],往往对国家政治和社会热点有自己独特的看法和见解,互联网在传播信息方面的优势,使得大学生表达情感、意见、建议更加便捷,以上因素形成了高校网络空间中的舆情。因此高校网络舆情可以理解为在高校网络这一特定的空间中,高校学生对自己关心或者自身利益密切相关的各种事务所持有的情绪、态度、意见、建议的总和。

一是表达的自由性。互联网颠覆了关于传统表达的理论,由于互联网在信息传播技术方面所具有的独特优势,使得他很难使用传统法制进行规范和限制。互联网作为新型媒体,是一个开放、共享的平台,每个人都可以成为信息的制造者和接受者。高校学生可以利用门户网站、论坛、贴吧、博客、微博、微信等方式,自由地表达对某一事件的看法,互联网让高校学生的舆情表达变得自由与直接。

二是表达主体的隐匿性。在传统的舆情表达中,人们考虑到自身角色和言行之间的关系,往往在舆情表达上受到了限制。网络提供给人们的是一个虚拟的空间,舆情表达主体往往以匿名或者化名的身份出现。因此在网络空间中,大学生的信息表达可以摆脱身份、性别、年龄、学历等诸多因素的限制,使得不能通过传统方式表达的意见、建议、态度、情感能够得到充分的表达。这种充分表达的背后,一方面体现了表达主体的隐匿性,另一方面,使大学生群体摆脱了道德的束缚,很容易导致舆情表达的非理性。这种非理性的情感宣泄,很容易在网络上蔓延,非理性的表述,也很容易在网络上进一步失真、放大。

三是影响的扩散性。互联网具有信息传播范围广、传播速度快等特点。加上高校学生在网络中表现活跃,使得高校网络舆情表达呈现出传播速度快、影响广泛的特点。由于每个学生都可以成为信息的发布者和信息的传递者,因此高校网络舆情会呈现出时效性强、信息渠道广泛、信息量庞杂、影响广泛等特点。但高校网络舆情影响持久力低,如能早期发现则相对易控制[4]。

三、高校舆情监控系统的基本功能

单纯依靠人工从海量的舆情数据中获取有用信息是无法完成的,因此有效利用舆情监控系统等技术手段,以实现舆情信息的自动收集、分类、分析、预警。

1.高校网络舆情监控系统特点和存在的问题

舆情监控系统共同的特点:基于自然语言理解技术,按照话题组织内容,将众多话题自动分类、分析,并进行动态展示、跟踪、评估其发展趋势。系统实现对各大搜索引擎、新闻门户、博客、论坛、微信公众号等多种信息载体的监控。实现对重大事件、突发事件、危机事件、民众诉求、正面报道等的监控。

存在的问题主要有:高校舆情监控系统采集数据的覆盖范围不够,互联网是一个巨大的空间,海量的数据是其最大的特点,大部分舆情监控系统对主流的网站进行监控,但网络中每一个区域都受到不同人的关注,任何一个空间的缺失都将导致监控失败;舆情深度加工与智能处理不足[5],舆情监控系统收集的信息无法直接使用,必须经过大量的人工处理、分析才能形成可用的舆情简报。同时无法对舆情发展趋势给出可用的参考信息; 舆情主题中垃圾信息太多,由于汉语语法有着自己独特的特点,语义多议性,导致在某一监控的主题中不相关的垃圾信息过多,增加了人工处理的成本 ,基于中文信息处理和文本挖掘的热点发现算法需要进行一点提高完善。

2.高校网络舆情监控系统主要功能

由于高校网络舆情涉及海量数据的采集与分析,单纯依靠人工无法完成,因此使用网络舆情监控系统是高校舆情监控部门的重要技术手段,网络舆情监控系统主要由采集子系统、分析子系统、检索子系统组成,如图1所示,通过使用网络舆情系统,能够对事件的来源、热度、传播范围、传播趋势进行准确的分析。

舆情分析技术是用于舆情信息分类和判断,按照关注的人物、地域、单位、事件、主题等要素进行舆情分类,并对敏感舆情的传播情况包括传播源头、发布人、传播媒体、传播内容、传播路径进行抽取和分析,提供各类统计数据和图表,掌握舆情事件在网络中传播的全貌。

(1)分类技术:系统内置一套较为科学和完整的舆情分类体系,通过自动分类技术,对用户关注的敏感信息和国计民生的各个重点领域进行实时监控,及时发现负面、有害信息。

(2)敏感信息分析技术:负面敏感信息分析是本系统最重要的功能之一,通过预警功能在第一时间将负面或敏感信息告知用户。支持对负面信息分等级预警,参考关注度和负面内容来划分四个预警等级(初级、中级、高级、特级)。系统还提供对有害信息原始网页快照存留来提供证据存取。

(3)热点发现与跟踪热点自动发现:自动识别热点新闻事件,发现网民的关注焦点和热点,提供1天、3天、7天等时间序列的符合用户精确度要求的分类热点排序。

(4)热点自动追踪:对热点信息进行持续追踪,通过趋势分析图和传播路线图等技术展示热点事件的传播趋势。

(5)专题分析技术:专题分析技术用于分析舆情事件或热点事件在网络中的传播情况。根据用户设定的专题条件,自动聚合该专题的相关信息,并对传播媒体、每日传播情况、传播全过程进行分析。

(6)炒手分析技术:通过对发布者网络发言倾向、发言的网友关注情况和媒体关注情况的综合分析,对发布人进行打分,分析出疑似炒手和关注炒手。

(7)导控技术:导控技术又称为信息探针,用于追踪舆论的传播影响力和检验处置结果。传播影响力的指标包括:各时段点击数增减情况、各时段回复数增减情况、转载量、搜索引擎快照搜录情况;处置结果检验包括原文删除、快照删除。

(8)趋势分析及预警:根据结构化信息分析关注热点话题在不同的时间段内社会的关注程度,对舆情事件多维度的综合分析,以多种方式展现主题事件关注趋势,获知事件发生的全过程并以此为基础预测事件的发展趋势。

(9)提供实时信息预警机制,可将短时间内发生的突发热点事件以及敏感新闻通过短信、邮件或者弹窗方式通知用户,并帮助用户快速制作出关于此热点事件的统计简报。

(10)舆情统计分析动态生成日报、周报、月报,同时为用户提供强大的自定义统计报表,可自己定义监测范围、监测时段、监测对象、图表显示方式(可定义横坐标、纵坐标以及图形)等,以生成不同报表满足多种个性化需求。

四、建立高校网络舆情突发事件应急预案

除使用舆情监控系统等技术手段外,高校还应配套完善的高校网络舆情突发事件应急预案等工作制度。二者相结合才能快速妥当处置高校突发重大网络舆情,有序引导网络舆论,减少和消除突发重大网络舆情对学校造成的负面影响,切实提升应对网络媒体的能力,营造建设和谐稳定校园和推动高校全面健康发展的良好网络舆论环境。

高校网络舆情突发事件应急预案应包括舆情安全防御体系架构图(如图2),明确各部门责任分工,同时按照统一领导、分级负责、及早防范的原则,制定处理程序及办法。建立以网络舆情工作小组为核心的网络舆情安全防御体系,处理各种网络舆情突发事件。其中管理部门包括学校办公室、党委宣传部、保卫处、后勤管理处、信息网络中心、学生管理部门、校团委等。院系包括各院系主管领导、班主任、学生干部、学生党员。技术处理团队包括舆情监控人员、IT学生助理、校内论坛站务。技术处理团队负责日常监控、研判预警,结合使用网络舆情监控系统等技术手段,发现舆情信息后立即上报网络舆情工作小组,网络舆情工作小组根据信息涉及到的范围具体要求相关管理部门和院系处理,并根据情况由班主任、学生干部、学生党员进行安抚,由技术团队进行网络舆论的引导。网络舆情工作小组将事件过程定时向领导层汇报以提供决策支持。

五、结束语

建立高校网络舆情监控体系,应深刻认识到高校网络舆情的特点,同时高度重视高校网络舆情信息,坚持正确的价值导向,树立服务学校全局和学生工作的思想。学校管理层可通过网络舆情分析,准确了解学生的呼声和要求,为学校制定管理制度与管理决策提供科学依据,有助于保障学校决策的合理性与科学性,维护校园的和谐稳定。

参考文献

[1]王玉华.舆情研究概论[M].天津:天津社会科学院出版社, 2003:10-20.

[2]刘毅.网络舆情信息理论体系的构建研究[D].天津:天津外国语大学,2007.

[3]董亚倩.高校网络舆情演变规律及安全评估指标体系构建研究[D].淄博:山东理工大学,2012.

[4]曾润喜.高校网络舆情的控制与引导[J].实践研究,2009[11]:79-80.

[5]焦小刚.网络舆情监控系统存在的问题及策略[J].网络天地,2015[19]:1-2.

舆情系统设计研究 篇4

appraisement

industry

point

舆情信息传播迅速且影响力高, 日益受到社会各界的关注。本文根据舆情系统的业务员需求, 设计了舆情系统的流程及框架, 通过信息采集模块、信息智能处理模块、信息存储模块、信息发布模块、事件跟踪模块、预警管理模块、统计分析模块、舆情报告模块、权限管理模块构建舆情系统, 就一些关键技术进行了探讨。

舆情是指在一定的社会空间内, 围绕中介性社会事件的发生、发展和变化, 民众对社会管理者产生和持有的社会政治态度。传统舆情通过报纸、杂志、广播电台、电视等传统媒介散播, 信息源易于定位, 易于掌握舆情的传播范围、影响等。随着互联网的兴起, 信息的传播不再仅仅依靠传统媒介, 人人都是信息的产生者, 人人都是信息的宣传员, 任何信息都有可能借助互联网形成强大的舆论力量影响整个社会的发展。

如何快速有效的聚集互联网舆情信息, 如何从互联网的海量数据中发现社会热点问题, 如何跟踪关注网络舆情的演变过程, 为相关决策者提供参考依据已成为一个研究热点问题。舆情系统就是在这个社会背景下应运而生的, 目前市场上的大多数舆情系统均以采集到的大量互联网数据为基础, 通过算法模型分析呈现社会热点问题, 再由舆情分析师撰写舆情报告提交给决策者完成对舆情的监测和分析, 其中如何采集有效准确的信息, 如何进行模型分析是学界研究的热点问题, 本文从网络舆情采集和模型分析的角度出发, 设计一个基于反馈式搜集和分析的舆情系统。

系统功能及框架

舆情系统的业务需求包括: (1) 分析自身业务, 建立关键词库和信息采集点, 借助网络爬虫实现目标数据的抽取; (2) 抽取得到的数据通过数据预处理、数据模型分析发现社会热点问题及负面舆情信息; (3) 跟踪发现的社会热点问题及负面舆情信息, 确定信息的发展起源, 完成对该类舆情信息的趋势分析; (4) 形成各种舆情信息的可视化提交给舆情分析师完成舆情分析报告。系统流程图如图1所示。

舆情系统因其自身的特殊性, 在建设过程中一定遵循高可靠性、安全性的设计原则, 通过较好的技术框架, 才能确保系统的安全平稳的运行, 降低系统的运营成本, 因此本次设计采用高内聚低耦合模块化设计思想。

系统由下向上共分为5个层次, 从下向上依次为基础层、数据资源层、服务层、应用层和展示层, 层级之间向上为提供支撑及服务, 向下提供数据交换和数据处理功能, 如图2所示。

(1) 基础层

基础层是整个系统的运行的前提条件, 主要提供软硬件支撑, 提供数据存储的服务器环境及软件运行的系统环境。

(2) 数据资源层

数据资源层为系统提供了数据支撑, 通过数据交换、数据采集等多种方式将海量数据汇聚于此, 为上层提供数据支撑。

(3) 服务层

服务层是系统中最重要的部分, 它向上为应用层提供了功能支撑, 向下封装了相关的数据服务, 使得系统以模块化的方式提供各种服务, 实现了高内聚低耦合的设计思想。

(4) 应用层

应用层从业务需求角度出发, 实现了舆情系统与用户的业务相结合, 更好地服务使用者。

(5) 展示层

展示层通过多种数据展现形式为用户提供直观的舆情分析文本、图形报告等, 方便用户了解、研判舆情原因动态及趋势等。

系统功能模块设计

舆情系统的功能模块包括信息采集模块、信息智能处理模块、信息存储模块、信息发布模块、事件跟踪模块、预警管理模块、统计分析模块、舆情报告模块、权限管理模块九大功能模块, 如图3所示。

信息采集模块

信息采集功能对互联网信息进行实时监控, 将采集到的数据存储到服务器中。监控的信息源主要有网络信息、新闻、电子报纸、论坛、博客、贴吧、视频、微博。采集工具支持网页结构自动分析、元数据解析、RSS解析、以及内嵌Javascript脚本执行引擎, 从而能够实现对各类型信息的及时精确采集。信息采集采取分布式结构部署, 实现多线程采集, 保证对监测信息源能够在规定时间内完成采集。

信息采集的方式主要以三种方式进行:一是利用国内外互联网引擎全网采集的特点, 对检索后的结果集进行采集的元采集;二是确定监测的网站列表的定点采集;三是通过反馈词库完成精准采集。

具体如下:

(1) 元采集

元采集范围包含百度、谷歌、搜狗、必应、雅虎等国内外搜索引擎。采集策略的制定采用数十到上百个关键词组成的符合布尔逻辑运算的检索式配置。元采集技术可模仿人工通过搜索引擎输入检索词并获取结果的方式, 从多个搜索引擎上获得搜索结果, 将它们结合定点采集结果共同完成智能排重后再进行相似性聚类, 以解决相同数据的重复问题。

(2) 定点采集

定点采集将事先确定需要监测的信息源进行配置, 对不同的信息源配置不同的模板, 一次性配置完成后, 即可在保证采全率和采准率的前提下进行循环监测和全部信息采集。

(3) 反馈词库采集

反馈词库是由历史舆情报告、舆情热点经过模型自动分析、聚类形成的采集词库, 其采集策略由舆情知识库生成的模型进行抓取时配置确保采集信息的准确性。

采集模块要根据不同的信息资源类型进行区分处理, 如微博采集、电子报纸采集、新闻媒体采集等, 不同类型的数据源其信息抓取的实现方式是不同的。此外采集模块也要注意采集效率, 实现对访问速度快慢不同的网站区分处理, 保证采集过程中的安全稳定。

采集模块应允许人工干预, 可进行人工抓取相关数据信息放入到信息采集库中同自动抓取信息一同处理。

信息智能处理模块

采集信息的智能处理实现自动内容过滤、自动信息提取、自动信息排重、自动内容分类及聚类、内码转换功能无缝集成在系统内部, 并实现所有过程自动处理的高集成度。

内容过滤采用自动过滤技术, 利用网页结构分析, 自动分析有用的网页, 自动提取元数据, 自动过滤掉不需要采集的网页和媒体文件, 有效避免垃圾信息的下载以及对带宽的浪费。利用自动过滤技术, 滤除网页中广告、版权等无用信息, 并能自动识别网页真正的标题。

信息提取可使系统可完整识别并记录每个网页的详细元数据信息, 包括网站名称、信息日期、标题、来源、作者、栏目、网页链接地址、正文内容、转载量、评论量、作者属性等。

信息排重使得系统能够根据URL直接去重, 同时能够根据信息内容进行相似度比较去重。实现基于文本内容的相似性自动处理, 确定两条信息是否为转载关系, 以实现信息溯源、传播路径分析功能。

利用相似性检索技术, 对于标题不同而内容近似或者对标题或内容有一定重复性的信息自动排重后归类予以显示, 防止因为标题或内容的少许变化而产生的漏判和漏采。

信息分类将采集到的信息根据关键词 (可设置一组或多组关键词) 对应到指定的类目下, 系统支持机器自动分类和人工自定义分类两种模式, 同时支持对采集到的信息进行多维度的标注和分析。

通过自动聚类系统实现对已采集信息提供自动聚类功能, 方便用户发现各个时期的热点事件及热点事件随时间的演变趋势。

信息存储模块

系统采集下来的信息和人工补充的信息都存入到服务器中的指定数据库中并建立索引以提供全文检索功能。系统可按来源、时间、信息源类型、内容、标题提供多种分类检索、关键词检索、高级检索。

信息发布模块

系统将最终的信息服务产品通过用户应用端予以展现, 可采用互联网个性化服务门户和专项推送的方式实现。

事件跟踪模块

事件跟踪模块是指系统对已经发现的事件进行持续的跟踪和深度的挖掘, 以期对该事件有一个全面的了解和掌握。在关注方向的信息监测过程中如果发现需监控的事件可通过采取特定关注的方式 (例如可设置“跟踪”按钮) , 进入跟踪监测过程, 也可在跟踪监控中由用户自定义创建跟踪事件 (不针对某一特定文章而是针对一个事件) 。

系统通过监控事件的新闻报道、网民关注、时间传播的情况对该事件的特点进行总体描述, 包括来源、发布时间、事件人物、事件组织、事件关键词、相关新闻、相关博客、相关帖子、原文链接、内容分类。

预警管理模块

系统建设相应预警策略, 实现预警处理的全过程管理。重大突发事件能及时通过邮件和手机短信的方式通知相关人员。

在敏感信息突发时, 系统自动启动发送功能, 将敏感信息通知到指定用户/用户组, 主要有以下两种方式:

短信预警:可以向指定手机号进行短信预警, 发送内容为预警文章标题或文章正文;

邮件预警:向指定的电子邮箱进行邮件预警, 发送内容为预警文章标题和文章正文。

统计分析模块

系统能够对采集到的舆情信息进行分析与统计, 并将结果通过可视化的形式 (图表形式) 予以展现, 自动生成图形和数表并支持图表的导出及舆情简报生成时的便捷调用。同时支持对用户指定的舆情类目信息进行统计分析。统计方式包括但不限于以下几种: (1) 总体统计, 针对针对舆情关注点从新闻、博客、论坛、视频、微博的角度反映其传播总体情况。 (2) 趋势分析, 在指定时间范畴内反映舆情发展情况, 可按照类目或者来源类型进行时间趋势分析。 (3) 媒体及传播分析, 对信息内容的媒体属性深度研判, 包括传播链分析、TOP媒体分析、媒体分布分析等。

舆情报告模块

舆情统计报告是舆情系统的一个重要组成部分, 一份清晰的数据报告可以让用户准确的了解和追踪网络热点事件, 对于一般舆情系统, 需要人工来生成报告, 包括报告的基础数据和统计分析数据, 这样, 无论是报告的舆情数据, 还是报告的时效性都很难保证。在本系统的设计中使用报告生成模块自动的生成用户期望的各种报告, 报告中会记录舆情数据的详细内容、链接、发表时间、来源等, 还会包括各种图表以及各种统计数据。

权限管理模块

权限模块是舆情系统中很重要的一个模块, 从控制力度来看, 将权限管理分为两个部分。

1.功能级权限管理

根据不同的权限设置, 访问系统的不同功能。权限模块使用角色访问控制技术RBAC (Role Based Access Control) 。当登录用户访问特定功能的时候, 权限验证查看该当前登录用户的角色是否包含该功能的权限。如果有, 则表示有权访问, 否则表示无权访问。

2.数据级权限管理

根据不同的权限设置, 访问系统中的不同的数据。权限模块中使用规则引擎, 将不同级别的数据进行不同权限的设置。用户在进行数据访问的时候, 会通过规则判断, 是否该用户具有权限。如果该用户不具有访问数据权限, 权限模块就会拒绝用户使用;如果该用户可以访问, 那么权限模块就会通过验证, 允许用户在系统中使用该类数据。

结语

本文提出了一个舆情系统的设计方案, 从系统的框架及功能模块的设计角度加以详细讨论, 下一步工作是实现该方案提出的舆情系统, 并通过实际的使用对系统存在的问题加以改善。

观点建议

1、移动互联网目前已成为当今世界发展最快、市场潜力最大、前景最为诱人的业务, 其增长速度和规模都远远超过传统互联网, 它通过移动设备终端渗透到了人生活的方方面面, 从衣食住行到吃喝玩乐, 从网上购物到挂号看病, 其通过便捷的方式正在改变人们生活的方方面面, 它的发展改变了以往业务为导向的软件开发模式, 而是从需求角度出发, 从市场出发, 只有把握好市场和人们的需求才能在移动互联时代占的先机。

2.传统软件行业都已业务角度出发满足用户的各种业务从而通过办公自动化的方式服务于客户, 但随着大数据和各种云平台的建立, 现有的信息系统都改变了传统的以业务为导向而变为了以数据为导向, 大家都认识到了数据的力量, 如何从数据中发现以前未知的信息成为了一个热门的学术问题和研究热点。

互联网舆情监控系统需求分析 篇5

一、建设目标

为了实现高效的互联网舆情监测和控制管理,项目建设应完成如下目标:

1)对指定主流门户网站(WEB网站)的网页、论坛、数字报、电子杂志、博客、微博、播客、音视频多媒体等实时信息的采集和处理。

2)对指定的主流的网页、微博、音视频流等实时信息的采集和处理。

3)对指定的主流网页、图片等实时信息采集和处理。4)全网(元搜索引擎)实时信息采集和处理。5)对指定到境外网站实时信息采集和处理。6)对收集到的海量信息进行检索。7)对收集到的海量信息进行自动分析。8)对基本舆情数据进行各种加工处理。9)建立网评管理系统,为舆论引导服务。10)建立查处管理系统,为官方行为提供服务。

11)为方便资源共享,系统网络可以弹性扩展、应用平台可以二次开发。

二、系统实现功能

互联网舆情监控系统应实现以下几个功能:  动态的全面的收集社会民生信息内容

 过滤、消重网民曝光的违法违规信息、敏感信息  获取互联网信息热点焦点和趋势分析  分析网络舆情的爆发点和峰值  发现民意话题传播关系和演化规律

 实时向上级领导通报最新情报信息、辅助领导决策  更充分了解网络社情民意  网络新闻自动获取

通过网络技术,自动获取网络新闻,并且提取新闻的作者、时间、标题、正文等数据。 网络论坛自动获取

通过论坛获取模块,自动抓取论坛的发贴。并且提取帖子的发贴人名称,发贴时间,主贴,回贴人名称,回贴时间,回贴内容,论坛贴子的人气和热度。 智能语言理解和分析处理

互联网信息资讯的分析工作分为对单一信息文档的分析和对文档集合的分析处理。对于单文档的加工,本系统中应用知识管理技术,实现信息的自动消重过滤、自动分类、自动摘要提取与自动关键词提取。 互联网信息搜索

系统支持全文信息检索,检索结果按照相关度排序。系统支持模糊检索,例如:同音词检索、同意词检索。系统支持“以文找文”的方式,通过输入单篇情报信息,检索内容相似的互联网新闻或论坛帖子。

三、主要功能简介

1、舆情采集和处理

1)根据指定的互联网信息源或检索条件,用定向采集和全网覆盖监控两种方式,连续不间断和自动的对WEB资源进行采集。并进行预处理(分词、标注、语法分析、语义分析等)和优化处理(自动消重等),建立供进一步分析使用的基本索引库。

2)采集对象一般为中央重点新闻网站、有影响力的商业网站、地方重点新闻网站、地方有影响力的社会网站、重点境外网站等。

3)信息源内容包括:WEB网站网页、论坛、贴吧、数字报、博客、播客、微博等。

4)全网覆盖监控采用元搜索引擎方式。通过集成不同的通用搜索引擎(百度、谷歌、雅虎等),全面和高效的获取信息。

2、舆情检索

1)对各种来源、多种格式、结构化和非结构化的社会公开信息源进行检索。

2)提供全文检索、关键词(热点词)检索、组合词(布尔逻辑组合方式)检索、短语检索、拼音检索、主题检索、相似检索、分类检索(针对新闻、论坛、博客、播博、微博、视频、各地市、国内、国外)、高级检索(针对标题、作者、时间、正文)等。

3)提供复杂检索条件检索(针对目标网站、时间区间、检索类型、匹配度、排序方式)。

4)提供智能化检索(按字索引、词索引、字词混合索引)。5)提供二次检索(在一次检索的基础上)。6)提供整段内容做为检索条件的检索。

7)根据信息源周边内容的文本信息,对图片和音视频等多媒体信息源进行检索。

8)提供检索结果的相关推荐。9)提供各种检索结果统计。

10)检索结果的查全率和查准率达到较高水准。

3、舆情分析

1)自动关键字提取。

2)对某一完整的文本信息源进行自动内容(静态摘要)摘要提取。

3)根据预先给定的检索条件进行自动多文档(动态摘要)摘要提取。

4)自动主题检索和跟踪。5)自动关联分析和趋势分析。6)根据预先给定的规则进行自动分类。

7)在没有给定规则的前提下,自动聚类(自动识别)出新的模式归档到数据库,以供用户分析使用。

4、舆情加工和处理

1)所有采集及经过处理入库的信息保留半年。2)通过设置关键词、有害词、敏感词,或通过设置某一舆情的潜在专题信息做出舆情预警。

3)将人工检索以及自动生成热点的相关联多种特征数据(时间分布、传播路径、话题演化、地域分布等)整合处理,并以多种形式输出,包括Word、Excel、网页、XML、多种统计图表(饼图、柱状图、趋势图、报表、曲线图)等。

4)对所有来源的基本数据(采集数据量、舆情数据、发帖数据等)进行统计分析,并以多种形式输出,并以E-mail、RTX、手机短信等方式报警提示。同时在报警提示中辅以警示颜色(超过设定监控阀值的采集信息)等特征信息加强直观警示效果。

5)按照预定格式,自动生成舆情报告。简报分为日报、周报、月报、专报。

6)对舆情数据信息进行痕迹处理(标注、推介、上报、批示等),使舆情数据信息进入办公操作流程。

舆情监控系统论文 篇6

摘 要:随着移动互联网的发展和智能手机在高校的普及,大学生借助网络媒介进行交往和信息交流已成时代发展的主流。伴随着社会竞争的加剧和就业形势的严峻化,大学生群体积压的负性情绪也在增加,他们常常通过网络途径抒发观点和情绪,从而使网络舆情成为高校维稳工作所关注的信息预报站。研判移动互联网时代高校网络舆情的发生发展趋势,进行信息监控和合理引导,对于高校维稳工作具有重要意义。

关键词:互联网;网络舆情;维稳

当前,“90后”大学生成为高校大学生的主体。伴随着社会矛盾的不断尖锐化及就业形势的严峻化,以及网络媒体对大学生价值观及行为方式的颠覆性影响,校园整体安全稳定形势日趋严峻。与此同时,随着智能手机和互联网通信技术的不断更新换代,使得大学生的人际交往呈现网络化、即时化的特点。大学生的个性尚不稳定,容易在群体环境下产生从众等心理行为,对于迅速传播的网络负面信息往往不加识别直接转发,从而增加了网络舆情监管的难度,也给高校管理与维护校园稳定工作带来了新的挑战。

高校网络舆情是指“以在校大学生为主的群体通过互联网对校园生活中的某些现象、校园管理,以及其所关注的其他社会现象、社会问题所表达的态度、意见和情绪的总和”。高校网络舆情与国家政治和社会生活关系非常密切,是整个社会的重要窗口,是社会的“晴雨表”,也是社会各种思潮和矛盾的汇集点。对高校舆情的分析和有效引导,是做好高校稳定工作的重要任务。

一、移动互联网背景下高校维稳工作和网络舆情的关系

中国互联网络信息中心(CNNIC)第34次互联网报告显示,截至2014年6月,我国网民规模达6.32亿,其中手机网民达5.27亿,网民中使用手机上网的人群占比提升至83.4%。手机成为我国网民最重要的上网终端,其中高校教师和大学生无疑是移动互联网的主要受众群体。据调查显示:学生使用手机上网达到100%,其中每天使用手机上网平均超过1个小时的达到80%以上。高校是传承文化、培养人才、传播知识的重要场所,其网络舆情管理的最终目标是通过对网络舆情有序的管理净化校园舆论环境,从而维护高校稳定和谐的环境。

二、移动互联网背景下高校维稳工作环境和教育载体的转变

目前,教育部、部分省级教育部门和高校纷纷建立大学生主题教育网站、官方微博、官方微信平台等,通过相互衔接和呼应,共同构筑大学生网络思想政治教育平台。伴随着手机互联网的普及,高校正着力打造微信、微博、微站APP和官网“四位一体”的网络途径的思想政治教育载体和维稳工作宣传窗口。在主题教育网站方面,国内先后出现了众多优秀网站。国家级的有两个,分别是中国大学生在线、易班网;省级教育部门主办的有十余个,包括辽宁大学生在线联盟、陕西大学生在线、江西大学生在线、重庆大学生在线等。教育部思政司连续7年举办全国百佳网站评选,涌现出了一批优秀主题网站,比如清华大学的学子清华网站,天津大学的天外天网站等。从教育部到省级地方教育部门,再到高校,形成了比较完善的PC端主题教育网站体系。

手机微站是PC端主题网站的手机版,先后经历了WAP形式、APP形式、手机WAP版,目前WAP、APP等形式逐渐被淘汰,手机WAP版针对手机屏幕重新设计和优化,成为手机微站发展的趋势。目前,各级主题网站已经有部分进行了升级改造,但仍有相当多的网站没有针对手机访问进行设计升级。对于官方微博的建设,各级教育部门和高校表现得相对谨慎,仅有不到四分之一的高校建立了官方微博。官方微信建设近期发展迅速,一半以上的高校建立了高校官方微信平台,内部相关部门也开设了公众微信平台。

三、加强移动互联网背景下高校维稳工作的建议和思考

目前,高校的网络舆情监控还处于被动收集信息和被动应对的状态,通常是危机事件发生并通过网络渠道大量传播扩散之后才启动危机应对和公关宣传程序。另一方面,学生管理工作者现有的行政措施与学生主体的愿望诉求隔离,信息沟通不畅,致使其在处理高校群体危机事件中处于信息盲区,不利于处理由于负面网络舆情播散所导致的高校稳定工作危机。

1.加强网络舆情管理,建立专门收集反馈网络舆情信息的工作平台。当前很多高校都开放了无线上网的即时通信环境,大学生越来越依赖网络手段参与人际交往,进行观点交流。网络信息也是高校共享信息资源的重要组成部分,但是大多数高校都通过“微信、微博、官方微站和官网”单方推送信息,没有开通“校方—学生方”的互动沟通网络平台。因此,高校管理人员需要密切关注高校教师和学生通过百度贴吧、校内网、BBS、各种形式的论坛等所发布的信息,定期收集汇总并加以反馈,要特别关注网络舆情中负面情绪的苗头,因为一旦出现个别学生对某一问题的不正确的看法,这一信息就有可能迅速扩展开来,造成一些不良后果。因此,我们要时刻关注网络舆情的产生和传播,主动了解大学生所思所想并进行反馈回应,及时控制不良信息的传递。

2.研究网络舆情的产生和传播规律,促进正向网络舆论的有效传播。“沉默螺旋”理论是德国政治学家、传播学者伊丽莎白·诺尔-诺依曼于20世纪70年代初提出的传播学理论。该理论描述了这样一种社会现象:人是一种社会动物,为避免自己陷入孤立状态,总是力图从周围环境中寻求支持。这种社会天性导致其在发表个人观点时,如果发现自己的观点受到较多的追捧和赞同,就会越发大胆地将其表达出来,并形成愈来愈有影响力的舆论环境;但如果自己的意见被他人反对或无人问津,人们就宁愿保持沉默。为了有效地管理高校舆情,减少高校群体危机事件的触发和升级,需要进一步研究高校网络舆情发生、发酵、传播以及消亡的规律,利用“沉默螺旋”的教学反效应,占领网络舆情传播的主阵地,避免网络危机事件的发酵及升级导致危机事件的频发。高校管理人员需要根据大学生的心理特点,积极主动地利用新媒体切入大学生的日常思想政治教育,净化思想政治教育环境,帮助大学生合理宣泄负面情绪,促进健康人格的塑造。

参考文献:

[1]李新萌.浅析高校网络舆情的特点、成因与引导[J].福建论坛(社科教育版),2010(6):86-87.

[2]张兵,陈静.移动互联网下高职院校班级管理机制探究[J].科教文汇,2015(4):93-94.

[3]李伟东,刘敏姬.论大学生网络舆情监控与校园稳定维护[J].教育与职业,2011(21):71-73.

[4]梅元媛,马可,姜剑.网络环境下高校思想政治教育工作研究[J].职业时空,2010(10):179-180.

[5]陈纯柱,敖永春.网络环境下高校舆情的传播及引导机制研究[J].重庆大学学报,2011,17(2):154-155.

[6]陈媛.基于“沉默螺旋”理论的网络用户信息行为研究[J].经营管理者,2016(4):242.

作者简介:吴心灵(1980— ),女,大连医科大学人文与社会科学学院讲师,毕业于中山大学医学院,主要从事大学生心理健康教育工作。

舆情监控系统论文 篇7

1 高校网络舆情监控系统架构

通过详细分析与设计, 高校网络舆情监控系统架构如图2所示, 主要完成以下6方面的工作。

①系统初始化, 设置搜索主题词库、相近术语库和同义词库, 网页爬行器初始爬行的网站。

②通过HTTP协议获取互联网返回的数据流信息, 对其进行信息过滤和提取, 并对抽取的结果记录集进行解析、建立索引。

③根据HTML的标记解析网页内容, 进行分词处理抽取关键信息, 过滤掉无用信息, 用处理后的词汇结果构建一个多维向量, 计算该向量的主题相关度, 并将提取出来的网页内的网址交给网页爬行器。

④对网页内容与主题相关度高于预设阈值的网页提取标题、提交时间和部分正文内容等信息聚类和建立索引用于用户检索。

⑤通过相近术语库对查询内容进行语料分类确定扩展词集合, 找出查询词的共现词, 提取出权重价值最大的几个词与同义词库中的词作交集, 将交集后的词汇作为最终扩展词加入到查询中, 完成查询扩展。

⑥用户通过查询模块进行信息检索, 通过查询扩展模块完成查询扩展, 最后将排序好的结果提交给用户。

2 高校网络舆情监控系统关键技术

2.1 云模型概念

云模型[3]是李德毅院士提出的一种定性定量转换模型, 能够实现定性概念与其数值表示之间的不确定性转换, 已经在智能控制、模糊评测等多个领域得到应用。云模型表达概念的整体特性可以用云的数字特征 (期望Ex、熵En、超熵He) 来反映, Ex是在论域U中最能代表概念的点;En是定性概念不确定性的度量, 由概念的随机性和模糊性共同决定;He是熵的不确定性度量, 由熵的随机性和模糊性共同决定。云算法主要分为正向云算法和逆向运算法。对于一维论域的情况, 设Ex, En, He分别是表示定性概念的三个数字特征, 则正向云发生器的算法如下:

①产生以En为均值, He2为方差的正态分布的随机数E'n。

②产生以Ex为均值, E'n2为方差的正态分布的随机数x。

③令x为定性概念的一次具体量化值, 称为云滴, 其对于的确定度为:

逆向云发生器的算法如下:假设输入为随机变量X的N个采样点{x1, x2, x3, …, xN}, 输出为随机变量X的Ex, En, He, 则求解步骤:

①首先计算数据样本均值, 一阶样本绝对中心矩, 样本方差。

②进而求得Ex的估计值为。

③进而求得He的估计值为。

④进而求得En的估计值为。

2.2 基于云模型的网页爬行技术

高校舆情监控系统能否及时准确采集到有效信息取决于网页爬行器的爬行策略。互联网信息资源分布具有群聚性和隧道性的特点, 如果解析后的网页内容和网页链接蕴涵了较多和主题相关的内容, 则选用注重发掘的基于立即价值的搜索策略;否则可以采用基于未来价值评价的方法来预测链接的未来价值, 进而引导爬虫从主题无关区域穿过隧道搜索到主题相关区域, 预测未来价值文中采取巩固学习方法。

基于立即价值评价的评价方式要考虑内容评价和网页链接结构综合评价方法, 即在判定主题时既考虑网页主题的相关度, 也考虑网页的重要程度[4]。网页主题相关度用主题特征和网页文档这两个向量之间的夹角余弦值来计算, 如公式 (2) 所示:

其中, T表示为主题向量, D表示文档向量。

采用改进的PageRank的算法来计算网页的重要程度, 公式如 (3) 所示:

其中, d是衰退因子, 在0和1之间取值, 主要为了减小Ti对页面P的影响;1-d是弥补因子;PR (Ti) /C (Ti) 为网页Ti的权值PR (Ti) 被平均分成C (Ti) 份后对网页P的贡献程度。

网页的立即价值计算公式 (4) 如下:

网页的综合价值计算公式 (5) 如下:

式中, It (url) 为网页链接立即价值, Ft (url) 为网页链接未来价值, α、β为动态权值, 本文采用正态云模型来产生ω (Ex=0.6, En=0.1, He=0.03) 和αEx=0.5, En=0.1, He=0.02的值, 进而求出β的值。

2.3 基于云模型的网页聚类技术

聚类不需要训练语料, 具有很强的自动性和灵活性, 是对文本信息进行有效组织, 合理导航的重要手段。舆情热点发现需将文本中内容相似的划分为一类。常用的方法有基于划分的方法 (K-means) 、基于层次的方法 (CRUE, Chameleon, BIRCH) 、SOM神经网络聚类方法等[5], 本文提出一种基于云模型的网页文档聚类算法, 该算法利用聚类云模型的估计对样本数据进行模糊分类, 再利用分类的结果重新估计聚类云模型, 避开了K-means需要归一化的约束条件, 进而完成文本数据聚类。

①令b=0, 随机初始化U (0) =[u (0) ik]c×n。

②由最大隶属度规则, 通过U (b) 把文档集{x1, x2, x3, …, xN}分成m个不同的类。对于m个类的文本, 利用逆向云发生器计算云模型。

③根据每个聚类的云模型, 计算新的分类矩阵

式中xkl (l=1, …, p) 表示第k个样本的第l维, (Ex) (b) il表示第i类的第l维云模型的均值, (E'n) (b) il是由第i类的第l维云模型的熵 (En) (b) il和超熵 (He) (b) il生成的随机数。

④计算聚类目标函数, 式中是由每类的云模型均值矢量, 构成的矩阵。

⑤若, 则文档聚类算法结束;否则, 令b=b+1, 并返回到第②步。

2.4 信息检索扩展技术

受知识、经验水平等主客观条件的局限性, 用户输入的关键字往往不能全面的表示想要检索的信息, 基于信息检索领域长期存在着查询词多义性的问题[6], 本文通过相近术语群结合同义词库对查询关键字进行扩展查询, 扩展流程如图3所示。

3 系统实现

根据上述理论构建如下结构的应用系统如图4所示, 首先由舆情采集系统对各种教育网站、各种搜索引擎网站、各大门户网站及一些论坛、贴吧等进行信息采集、分类, 然后通过术语库管理和同义词库管理进行查询扩展, 通过全文信息检索将结果提交给用户。

4 结束语

本文构建了高校网络舆情监控系统, 详细介绍了实现原理和关键技术, 提出了基于云模型的网页爬行与聚类算法, 并对查询主题进行查询扩展, 提高了网络舆情分析的精度与效率。本文的研究虽然是应用到教育领域, 但可通过更换其他领域的术语库和同义词库, 修改某些特征参数便可推广到其他领域, 具有一定的实际应用价值。

摘要:设计了一种基于云模型的高校网络舆情监控系统, 该系统采用基于立即价值和未来价值综合评价的方式指导网页爬行策略, 采用云模型指导爬行方向, 同时通过正向和逆向云模型对主题网页进行聚类, 并通过查询扩展技术提高网页查全率, 取得了很好的实际应用效果。

关键词:舆情,云模型,聚类,查询扩展

参考文献

[1]中国互联网络信息中心.第90期中国互联网络发展状况统计报告[EB/OL].[2013-08].http://www.cnnic.net.cn/hlwfzyj/hlwfzzx/qwfb/201308/W020130801530858725742.pdf.

[2]刘瑾.高校网络舆情分析[J].西安邮电学院学报, 2012, 7 (17) :85-88.

[3]付斌, 李道国, 王慕快.云模型研究的回顾与展望[J].计算机应用研究, 2011, 28 (2) :420-425.

[4]刘丽杰.垂直搜索引擎中聚焦爬虫技术的研究[D].哈尔滨:哈尔滨工程大学, 2012.

[5]万剑.文本数据挖掘中基于云模型的特征选择方法研究[D].武汉:华中师范大学, 2012.

网络舆情监测引导系统研究 篇8

互联网时代是人类历史上一个空前伟大的技术革命时代。现代信息技术、通讯传播技术、网络技术等众多现代化的传播技术已渗透到社会生活的各个领域。互联网广泛性、即时性、开放性、共享性和互动性的特点及丰富多彩、方便实用的应用形式决定其日益成为反映社情民意的重要阵地, 网上热点层出不穷, 网络舆情对国家事务、公共事务决策的影响力也日益加大。历史原因曾使中国长期处于封闭状态, 国内关于舆情的研究起步较晚, 目前迫切需要提升与之相应的理论和技术支持。舆情分析与监测是信息深加工, 以往“剪报”式低价值粗加工的信息服务, 虽可按主题范围搜集, 但提供的结果仅局限于单一的信息内容, 传统的单一线性收集方式已不能够满足人类大脑发散思维的需要。

二、网络舆情监测引导的技术支撑

在浩瀚的网络中, 政府如果仅仅依靠人工完成网络海量信息的收集和处理是不现实的。而Web数据挖掘能快速、准确的获得有价值的网络信息, 利用历史数据预测未来的行为以及从海量数据中发现知识。它克服了普通数据库管理系统无法发现数据中隐藏的关系和规则及根据现有数据预测未来的弱点。Web数据挖掘的出现为自动和智能的把互联网上的海量数据转化为有用信息和知识提供了条件。可有效地从Web获取并分析相关舆情, 达到监测、辅助决策和引导的目的, 为网络舆情预警提供了极大的帮助。

(一) Web数据挖掘

Web数据挖掘由传统数据库领域的数据挖掘技术演变而来。数据挖掘是指从大型数据库的数据中提取出人们感兴趣的、可信的、隐含的、明显未知的、新颖的、有效的、具有潜在用处的信息的过程[1]。随着互联网的蓬勃发展, 数据挖掘技术被运用到网络上, 并根据网络信息的特点发展出新的理论与方法, 演变成网络数据挖掘技术。Web数据挖掘是指对目标样本进行分析提取特征, 以此为依据从Web文档和Web活动中抽取人们感兴趣、潜在的有用模式和隐藏的信息, 所挖掘出的知识能够用于信息管理、查询处理、决策支持、过程控制等方面。

根据挖掘对象的不同, 可将Web数据挖掘技术分为三大类[2]:Web内容挖掘、Web结构挖掘和Web使用挖掘。Web内容挖掘是指从Web上检索资源, 从相关文件内容及描述信息中获取有价值的潜在信息。根据处理对象的不同, Web内容挖掘分为文本挖掘和多媒体挖掘。Web结构挖掘的目标是Web文档的链接结构, 目的在于揭示蕴含于文档结构中的信息, 主要方法是通过对Web站点的结构进行分析、变形和归纳, 将Web页面进行分类, 以利于信息的搜索。结构挖掘的重点在于链接信息。Web使用挖掘是从服务器访问日志、用户策略、用户对话和事物处理信息中得到用户的访问模式和感兴趣的信息, 利用这种方法, 可以获知Web使用者的行为偏好, 从而预测其行为。

(二) Web挖掘过程

Web数据挖掘依然遵循数据挖掘的研究思路, 挖掘过程分为四个阶段:数据收集、数据预处理、模式发现和模式分析 (如图1所示) [3]。

1. 数据收集。

网络信息的收集是网络舆情监测的源头, 其广度和深度决定了监测效果。对于明确主题的舆情信息采集, 可以采用搜索引擎方法。由于各个现存搜索引擎索引数据库的构造方法不同, 其索引数据不尽完整, 所以应将多个单搜索引擎搜索结果进行整合、调用、控制和优化。搜索中可以以宽度优先、深度优先或启发方式循环地在互联网中发现相关信息, 可将网络空间按域名、IP地址或国别域名划分为独立子空间详细搜索;或以信息类型为划分, 如HTML格式、XML格式、FTP文件、Word文档、newsgroup文章和各种音、视频文件等。舆情信息检索结果可按不同维度展现, 包括按内容分类、舆情分类、相关人物、相关机构、相关地区、正负面分类等。每个维度下把搜索结果自动分类统计展示, 以便短时间内检索到精确信息。

2. 数据预处理。

因原始Web访问数据的文件格式是半结构化的, 包含不完整、冗余、错误的数据, 需进行提取、分解、合并, 转化为适合挖掘的格式, 保存到关系型数据库表或数据仓库中, 等待进一步处理。数据预处理可改进数据质量, 提高后续舆情挖掘过程的精度和性能。对采集到的舆情进行初步加工处理, 如格式转换、数据清理、数据统计, 对于新闻评论, 需过滤无关信息, 保存新闻标题、出处、发布时间、内容、点击次数、评论人、评论内容和评论数量等。对于论坛, 需记录帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等, 最后形成格式化信息。条件允许时甚至可直接对网站服务器的数据库进行操作。

3. 模式发现。

利用数据挖掘的算法可发现用户聚类、页面聚类、频繁访问页组、频繁访问路径等隐藏的用户访问模式。若在挖掘用户浏览模式过程中发现选择的数据或属性有偏差, 或挖掘技术达不到预期结果, 需根据反馈结果不断重复以上过程, 通过数据挖掘, 创建和更新用户模式库。模式发现可应用许多相关领域的方法, 但需针对Web数据挖掘的特点做出相应的改进。

统计分析。通过分析会话文件, 可对页视图、浏览时间和浏览路径长度进行各种不同的描述性统计分析 (频繁访问页、频率、均值、中间值和访问量的时间分布等) , 提高网络舆情挖掘的效率和质量。

路径分析。发现站点中最常被访问的路径及其他相关路径信息。信息采集过程中的静态数据可采用该技术, 采用图的方法来分析Web页面间的路径关系。G= (V, E) , 其中:V是页面的集合, E是页面之间的超链接集合, 页面定义为图中的顶点, 而页面间的超链接定义为图中的有向边。顶点v的入边表示对v的引用, 出边表示v引用了其他的页面, 这样形成网站的结构图, 从中可确定最频繁访问路径, 此路径指向的信息极有可能就是互联网上的“热点”和“焦点”。

关联规则。挖掘的是客户的不同浏览事务所涉及的大量数据中项集间的联系规律。利用该算法可从纷杂的网络信息中找出促使网络舆情产生、变化的内在因素, 帮助揭示舆情的变动规律, 挖掘出影响因素间的相互关系。

序列模式。挖掘出交易集间有时间序列关系的模式, 由此确定用户将来访问趋势和模式。在舆情信息汇集和分析的基础上, 可将社会运行接近负向质变的临界值的程度进行早期预报, 提前发现不良事件的苗头, 尽早梳理, 快速应对, 达到预防和控制作用。

分类。先从数据中选出已分类的训练集, 运用分类技术, 建立分类模型, 对未分类数据分类。分类模型由分类器或分类函数确定相应类别, 分类模型类别可由特征化了的属性集合描述。分类发现可描述特殊群体的公共属性。在网络舆情研究中, 可根据自身需求对大量的网络信息初步筛选, 进行分类、分组, 如设置“民生问题”、“突发事件”、“公共安全”、“经济危机”等。然后有针对地进行数据选择, 进行数据集合, 缩小挖掘范围, 避免盲目搜索。从而得到更精确、更有价值的信息。

聚类。聚类和分类的主要目的都是对Web对象归类, 不同之处是聚类未事先定义好主题类别, 需将Web对象特征化后归类分析, 使同类的对象具较高相似度, 而不同的类中对象差别较大[4]。

预测分析。利用历史数据中找出的变化规律, 建立专用模型, 通过此模型对未来数据的种类及特征等其他方面进行预测, 得出未来可能出现的结果。提前预测, 提前防范意外, 为后续工作做好准备, 预测关心的是精度和不确定性, 通常利用预测方差来进行度量。

偏差分析。指发现数据库中的异常数据, 其检验的基本方法是寻找观察结果与参照之间的差别。偏差分析可以对网上虚假信息和不良信息进行及时批驳, 在纠正偏差中使造假和诽谤不攻自破;可以准确及时地挖掘提取与热点事件相关的真实信息, 以形成网上正面舆论导向。

4. 模式分析。

模式分析主要是为了从模式发现算法找到的模式集合中筛选出有趣的模式。精确的分析方法通常由Web挖掘的具体应用来控制。模式分析的形式可以是类似SQL的知识查询机制, 也可以把Web使用数据装入数据仓库, 以便执行OLAP操作。另外, 可视化技术在视图分析中被广泛应用, 数据模型中的变量特征、操作子模式都可用图形化的工具标识, 这对揭示数据中内在本质及分布规律起到很强的作用。

三、网络舆情监测引导系统

为加强对网络信息的控制能力, 特别是动态信息的监测, 有必要利用Web数据挖掘技术建立一套网络舆情监测系统, 实现对舆情采集、监测和预警的信息需求, 为使用者全面掌握群众思想动态, 做出正确舆论引导, 提供分析依据。网络舆情监测引导系统以信息资源管理制度和安全保障体系为支撑, 基于软硬件、数据管理平台, 依托搜索引擎和Web数据挖掘技术。该系统包含四个功能模块:Web舆情采集模块、Web舆情预处理模块、Web舆情挖掘分析模块、Web舆情辅助决策模块 (如下页图2所示) 。

1.Web舆情采集模块。系统应能根据用户信息需求, 设定主题、关键词目标, 通过人工参与和自动信息采集结合来完成信息收集任务。根据不同舆情专题需要输入不同的待采集的目标网址, 自动采集新闻信息, 统一加工过滤、自动分类, 保存新闻标题、出处、发布时间、正文、新闻相关图片等信息, 支持多媒体数据采集, 可自动解析RSS的XML文件, 抽取网页的链接、标题、时间等信息, 支持网页快照功能等。高效、全方位的网络舆情采集, 最大限度地保证信息的时效性、可用性和全面性, 从而为决策分析提供事实依据和数据参考。

2.Web舆情预处理模块。围绕集中管理、分布存储、跨平台发布、实用性, 覆盖舆情监测引导系统的整个生命周期, 保证系统的可扩展性、灵活性和稳定性。

3.Web舆情挖掘分析模块。利用关联规则、聚类、分类、预测、时序模式和偏差分析等多种技术对收集来的舆情进行分析和处理, 提高舆情研判的准确性及内容分析的确定性, 为舆情引导做准备。其功能包括:热点话题、敏感话题识别。图2网络舆情监测引导系统的总体架构即可根据信息出处权威度、评论数量、发言时间密集程度等, 识别给定时间段内的热门话题, 通过关键字布控和语义分析, 识别敏感话题。倾向性分析, 即对于每个话题、每个发信人发表的文章的观点与倾向性进行分析与统计, 了解舆情可能的发展趋势。主题跟踪, 即跟踪某个热门主题回复、跟帖、修改、阅读等情况, 为管理者及时了解该主题的舆情发展状态。自动摘要, 即对各类主题、各类倾向能形成自动摘要, 供决策参考。趋势分析, 即分析某个主题在不同的时间段内, 人们所关注的程度, 并对未来作出科学预测。突发事件分析, 即对突发事件进行跨时间、跨空间综合分析, 获知事件发生的全貌并预测事件发展的趋势。

4.Web舆情辅助决策模块。对可能的突发事件、内容安全性、敏感话题及时发现并报警。通过舆情预警、舆情监测、舆情报告和发布个性化信息等手段, 为管理者和工作人员提供经过舆情分析处理后的有针对性的结果生成报告, 并提供指定条件对热点话题、倾向性进行浏览、检索, 达到辅助决策, 引导舆情向积极健康的方向发展的目的。

四、结论

网络舆情监测与引导是个复杂的技术和管理过程, 必须充分利用Web数据挖掘技术的优势, 建立完善网络舆情监测引导系统, 进一步提升信息化、自动化和智能化, 自觉地把互联网的优势转化为推进社会治理的现实动力和强大合力。

摘要:网络舆情监测与引导是个复杂的技术和管理过程, 必须充分利用Web数据挖掘技术的优势, 建立完善网络舆情监测引导系统, 进一步提升信息化、自动化和智能化, 自觉地把互联网的优势转化为推进社会治理的现实动力和强大合力。

关键词:网络舆情,监测引导,Web数据挖掘

参考文献

[1]Jiawei Han, Micheline Kamber.数据挖掘:概念与技术[M].北京:机械工业出版社, 2001:3.

[2]Raymond Kosala, Hendrik Blockeel.Web mining research:A survey SIDKDD Explorations, 2000:7.

[3]W Hseush, C Pu.A Practical Technique for Asynchronous Transaction Processing[C].In Proc.Of the 15th Inter.Conf, on DistributedComputing Systems, 1995:110-117.

舆情监测系统报警功能设计 篇9

关键词:网络舆情监测,报警系统

1概述

随着互联网信息的不断发展,越来越多的舆论信息主要以互联网为载体进行发布和传播,由于信息量大,来源广泛,因此人工很难在海量信息中获取所需的舆情信息。为了更好的把握舆情走势和获取最新的、有价值的舆情信息,诞生了网络舆情监测系统。

网络舆情监测系统可以实时监测互联网上舆情信息,并根据用户特定需求持续关注。可通过对互联网上舆情信息进行抓取,根据关键词进行分类、判断正负面等分析和处理,以方便了解、把握和分类查看、监测和预警舆情走势及对相关舆论情况进行处理等。能够处理涵盖传统媒体和新兴媒体等绝大多数范围的网络舆情信息,具有抓取范围广泛、处理及时、分析准确度高的特点。

2舆情信息预警

一般的,舆情监测系统的预警功能大多采用的是邮件预警,向预警接收人发送相关预警邮件进行预警提醒。随着对舆情信息的预警提醒要求不断提升,仅有的邮件预警已经不能完全满足用户的需求,因此根据实际工作需要,需要对舆情系统预警功能进行升级改造,扩展舆情系统的预警方式,以便针对舆情信息的尽早做出判断,并做好应对措施。

根据工作需要,舆情监测系统增加了邮件实时预警、系统内弹窗预警、手机客户端预警等功能,同时,系统还支持通过设备向手机发送预警短信,其中系统内弹窗预警和手机客户端预警可播放声音提醒,另外,系统还增加了客户端外置声光报警设备预警。

3报警系统技术实现

3.1手机客户端

手机客户端在满足直接与原系统对接的前提下,可提供用户关注的重要舆情、预警信息的获取和推送。在安全验证方面,手机客户端使用用户身份鉴别,需要使用用户名和密码登录,保证了信息的安全性。在手机客户端上可以接收原系统实时的预警信息,实现手机弹窗和声音提醒,同时还能显示最新的系统信息,支持显示舆情信息的标题、作者、日期、正文和来源网站名称等。手机客户端还支持区分正负面网络舆情信息,正面和负面信息的标题使用不同的颜色表示。此外当客户端接收到新的预警信息的时候还可以设置声音提醒,方便预警接收人员及时查看和处理。

相关技术的关键代码如下:

3.2短信实时预警

在原舆情监测系统基础上新增实时短信预警功能,可支持对接短信设备(短信设备由供应商提供),支持群发短信功能,同时对于短信接收的人数不设数量上限,这样可以方便向多人发送预警信息。预警短信的内容主要包含信息标题和摘要,方便使用人员在最快的时间内接收到最新的网络舆情信息。

相关技术的关键代码如下:

3.3 PC客户端

PC客户端与原系统可以完全融合,提供展示系统重要舆情的功能,同时能够及时获取推送的预警信息。PC客户端可接收原系统实时预警信息,实现声音提醒。PC客户端接收到原系统实时预警信息后具备弹窗提醒功能(类似QQ新消息弹窗模式)。同时PC客户端还可以显示最新系统信息,支持显示信息标题,作者,日期,正文,来源网站名称等信息;PC客户端还支持区分正负面信息,对于正面和负面信息的标题由不同的颜色显示,可以较明显的区别。另外,在PC客户端中也具备设置提示声音的功能,当PC客户端接收到预警信息后,可以设置声音提醒,方便查看和处理。

相关技术的关键代码如下:

3.4声光设备报警

为了更及时的提醒相关人员查看预警信息,系统改造还增加了外置声光报警设备,可以将声光报警设备安装在网络舆情监测系统终端上,与PC客户端结合在一起使用,当PC客户端接收到新的预警信息后,声光报警设备会有灯光闪烁和发出声音提醒工作人员查看新的预警信息。

相关技术的关键代码如下:

通过对以上几个形式的报警功能扩展升级,升级改造后的系统能够从多个角度对系统抓取的预警信息以最快的、最明显的方式通知、展示出来,方便相关值班工作人员在最短时间内了解和把握舆情信息,及时处置。

4结语

舆情监控系统论文 篇10

本文结合网页信息采集、中文信息处理以及web内容挖掘等技术设计构建了高校网络舆情监控预警系统, 实现了热点话题的推送与跟踪, 舆情内容的筛选和判定, 以及公共危机和热点事件的检测预警功能。

2 系统功能设计分析

高校网络舆情监控系统需要对互联网上各类信息, 如:各大网站、百度贴吧、微博、校内BBS等进行24小时监控, 随时采集话题性强、时效性新的各类消息和意见, 在对收集到的数据进行格式转换、内容清洗过滤、关键词提取等预处理后, 利用文本分类、聚类等方法对处理后得到的舆情信息进行分析、挖掘, 实现热点信息的发现和跟踪。此外, 系统通过与用户的交互界面, 将舆情分析结果反馈上报给高校网络监管人员, 以帮助他们及早发现舆情信息, 实现对高校重大舆情事件的及时响应。系统模块主要包括以下部分:

2.1 舆情信息采集

舆情信息采集模块是整个系统数据分析的信息源, 指的是抓取Web网页和存储相关数据, 即通过网页的链接地址来寻找网页。从网站的初始页面开始, 舆情信息采集模块抓取网页内容, 并且获得当前网页的全部链接URL放到有序的待采集队列里。完成初始页面的抓取后, 舆情信息采集模块依次取出队列中的URL, 在抓取网页内容的同时, 获取它所指向的链接URL放到待采集的队列里。上述过程一直循环, 直到整个网站的全部网页都被采集完为止。

2.2 信息预处理

除正文内容外, Web页面包含广告链接、版权信息等其他大量信息, 因此, 信息采集模块抓取到的数据含有大量噪声。另外, 与传统结构化数据相比, web文档中的数据结构较为复杂, 难以直接处理。因此, 信息预处理模块是信息采集后的关键步骤, 主要工作包括:读取采集到的Web信息数据后, 首先对数据进行页面清洗与内容提取以去除文本中的无关信息, 然后对文本进行分词索引, 通过特征和关键词提取技术提取有效的关键信息为舆情信息分析模块提供数据资源。

页面清洗的主要工作是对网页的注释、导航、广告和版权说明等噪声信息去噪, 达到在Web页面中划分出精确的信息单位的目的, 然后通过内容提取将复杂的Web数据格式转化成具有固定模式、操作性强的信息。常用的Web信息提取方法有基于规则的提取方法, 基于应用本体的提取方法等。文本分词是将网页中连续的字词序列以一定的规则重新分割成词的序列的过程。常用的分词算法有基于字符串匹配、基于理解和基于统计的分词方法, 其中, 基于统计的分词方法具备识别能力强、分词准确率高及便于实施等优势, 更适合网络舆情监控预警系统的研究要求。特征与关键词提取是指从分词后的文档中提取有效的关键信息, 达到减少数据维数的目的。常用的特征抽取的方法包括基于词性和词义的特征提取方法。

2.3 舆情信息分析

舆情分析模块是系统中最为关键的处理模块, 主要利用文本分类和聚类等方法对预处理的舆情数据信息进行分析、挖掘, 以实现热点信息和敏感话题的发现、跟踪。

热点信息发现的算法本质上属于文本聚类算法, 其实现目的是通过对预处理的文档按照话题进行聚类, 以获取聚类中心, 也就是舆情热点。热点事件跟踪是为方便用户跟踪自己所关心的热点事件而进行的操作, 首先由用户将已获得的热点样本信息以系统学习的方式交给系统, 然后系统通过文本挖掘技术对不断获取的信息进行分类, 判断其是否为用户感兴趣的内容。在判断的同时, 系统也通过用户的反馈信息不断地修正系统的学习算法, 使得交给用户的信息越来越接近用户感兴趣的内容。本质上来说, 热点事件跟踪是一种特殊的二元分类问题。敏感话题识别就是通过分析话题参与规模、评论观点对立度等相关因素统计某个主题在不同的时间段内被人们所关注的程度。如果参与讨论某个话题的学生数量较多, 并且评论对立度较大, 则其容易成为敏感话题, 在满足了规模和对立度的阈值后, 就会触发预警系统。

2.4 舆情预警上报

舆情预警与上报模块的主要功能为:通过系统的用户交互界面将舆情分析模块交付的热点信息和敏感话题等信息以图表、排行榜等方式反馈给高校网络监管人员;针对某一网络舆情信息, 系统将其安全级别划分为安全、较安全、临界、较危险、危险等五个级别, 必要时系统将对危险事件自动触发预警机制。监管人员通过舆情信息的直观展示和预警提醒对热点话题和敏感信息实施在线分析, 确定舆情在网站中的发展变化, 以达到及早发现、及时响应高校重大舆情事件的目的。

3 总结

为充分利用高校网络舆情信息, 全面了解和正确引导高校学生的思想言论, 本文设计构建了高校网络舆情监控预警系统, 在采集和预处理相关网页信息后, 实现热点与敏感话题的推送与跟踪, 并进一步分析判定舆情内容的观点与安全级别, 这对及时采取有效措施干预高校重大事件, 缓解舆论压力, 建设和谐校园提供了有效的技术手段。

摘要:针对高校传统舆情监控与预警手段的不足, 本文设计构建了一个基于中文信息处理与挖掘技术的高校网络舆情监控预警系统, 系统结合相关技术实现了互联网信息的采集、识别分析、热点推送与预警功能, 为高校监测和解决公共危机和热点事件提供了技术手段。

关键词:高校舆情,监控,信息挖掘

参考文献

[1]李彦丽.高校网络舆情的管理与引导[J].信息系统工程, 2011 (2) :90-92.

每周消费舆情 篇11

7月4日

超量

送检了康恩贝、禾博士、纽崔莱、汤臣倍健、自然之宝、健美生和恒健7品牌的B族维生素片,就其主要成分的实际含量进行了检测。康恩贝达尔斯康牌B族维生素片中的维B1实际含量甚至是标示值的3.5倍。健美生牌维生素B族复合片的实际维B12含量不仅高出标示值将近一倍,更比其他产品高出许多。超量可能会带来代谢负担。

《消费者报道》

“在一些发达地区,反而会出现B族维生素不足的情况。”中山大学附属第三医院膳食营养科主任卞华伟说。由于城市人吃的米通常都是陈米,陈米经过长期储存,其维生素含量会减少,谷物的精加工也会使所含的维生素减少。海王星辰连锁药店2013年销售数据显示,B族维生素产品约占保健品总销售额的2%。这说明了人们并不重视维B的补充。

大多数人忽视了,重视的人超量了。

中移动

7月4日

漫游费

北京、天津、河北三地消协公开致函国家发改委、国家工信部、中国移动、中国联通、中国电信等,呼吁逐步降低、取消京津冀地区长途及漫游通讯资费。这些费用已影响京津冀一体化进程。消协认为,逐步降低并取消“两费”不仅对电信企业的整体利润影响越来越小,反而有利于挽留因跨区域通信成本过高而造成的消费群体的流失。

北京市消费者协会

通讯费用问题久远,比如在北京市区工作、家住燕郊的上班族。中国联通湖南公司在1999年将长沙、株洲、湘潭三地电话资费统一,取消了两费,中国移动湖南公司也于2009年跟进。有运营商内部人士认为,如今运营商的3G、4G业务套餐上,已不再收取长途和漫游资费,尚存长漫资费的套餐,基本都是2G时代的老套餐。

白天,北京移动欢迎你!晚上,河北移动欢迎你

麦当劳

7月7日

被抛弃

有3万多名费者参与的美国快餐连锁消费者调查报告显示,越来越多的美国消费者喜欢In-N-OutBurger、Chipotle MexicanGrill、Chick-fil-A等食物和配料上更为健康、服务更好的速食品牌。肯德基的排名第八,麦当劳仅排名第21位。

中国经济网

全球消费者都开始追求新鲜、健康的快餐食品。In-N-Out Burger总裁、30岁的林西·托里斯是全美最年轻的10亿美元富姐。她继承了祖父母创办的这家汉堡连锁餐馆。它以“新鲜”为特点,汉堡里牛肉用新鲜非冷冻品,薯条用新鲜的土豆直接压制成条状后现炸出炉,汉堡夹层的西红柿、生菜、洋葱也是当场切片使用。

一代新人换旧人。

中美史克

7月8日

红花

世界杯期间,中美史克推广新康泰克牌喉爽润喉软糖。职业打假人陈书伟起诉称,这种软糖中违法添加了“植物(红花)提取物”,索赔500元,深圳市福田区法院受理了该案。2013年,广东省卫生厅曾表示,“植物(红花)提取物”不能作为普通食品原料使用。

《羊城晚报》

深圳市市场监督管理局对打假人购得该软糖的家乐福超市作出行政处罚,认定该软糖违反了食品安全法有关规定,没收家乐福违法所得,罚款2000元。中美史克成立于1987年,是全球最大药厂之一的葛兰素史克(GSK)与中国企业共同投资设立的消费保健用品公司。

花不罪人人自罪。

特斯拉

7月9日

解体

7月4日,特斯拉Model S车型在洛杉矶发生罕见事故,高速行驶S撞上灯柱后,完全解体成两半,随后电池起火烧毁车体。7月7日,特斯拉官方首次确认事故属实。一位汽车安全专家说:“从事汽车安全研究二十多年,这种完全解体的事故几乎没有见过,特别是售价超过60万元的豪华车。”从去年下半年开始,特斯拉已经发生六起起火事件。

《21世纪经济报道》

特斯拉不是基于整体性开发的零部件,每当发现问题,零部件公司要重新为特斯拉开发产品、模具,这将增加成本。特斯拉去年销量2.2万辆,今年的目标仅为3.5万辆,短期内无法通过规模化摊薄成本。特斯拉CEO马斯克对此心知肚明,推进规模化计划:宣布在欧洲的销量目标为16万辆,并建造工厂,长远全球目标是年销售50万辆。

咦,谁家生产的灯柱质量这么好?

北京瓶桶装水市场所

7月9日

高风险

上半年北京抽查了82家瓶桶装饮用水生产企业,不合格产品7批次:桶装水中,“基岩”纯净水、“青龙湖”饮用水、“水月洞天”饮用纯净水、“凯思潞”饮用纯净水、“民喜”纯净水菌落总数超标,“龙涧”天然山泉水亚硝酸盐超标。瓶装水中,“燕兴隆”牌350毫升瓶装的富硒弱碱山泉水菌落总数超标。

北京市食药监局

北京市将桶装饮用水生产企业列为高风险产品,全年安排市级监督抽检3次。发现问题的,撤销其相关证照。无证照生产的,必要时查封扣押违法生产工具、设备、原料等物品,通报工商部门吊销营业执照,取缔非法生产场所。

北京假水泛滥,从本刊记者实地采访来看,违法生产者违法风险不大。

百合网

7月9日

欺诈

石家庄市“如果爱”公司诉“百合网”案开庭。2012年,双方签约,百合网在如果爱公司设立“婚姻家庭咨询师”培训基地,三七分成。但随后遭到工商部门查禁。“如果爱”质疑百合网不具备资质,百合网则认为,培训与中国婚姻家庭研究会合作,百合公司只是提供平台,并无过错。

《法治周末》

因为质疑百合网培训资质,“如果爱”向北京市工商局、北京市朝阳区地税局、北京市通信管理局、工信部、民政部、人力资源和社会保障部等申请了关于百合公司的信息公开。因对公开的信息不满意,“如果爱”除了提出行政复议外,先后对民政部、人力资源和社会保障部、北京市工商局等部门提起了行政诉讼。其中,对于民政部胜诉。

一个小公司,搅动了三大部委。

厦门楼市

7月10日

限购消亡

厦门岛外限购全部解除,购买不限套数,且外地户口可以不用再交社保证明;岛内,外地户口限买1套住宅,但也无须再交社保证明。此外260平方米以上住宅的限购也有所放松。“厦门已经放松限购,但没有公开发文,到办事窗口可以得到答案。”厦门市房管局工作人员说。厦门房价已连续25个月上涨

《华夏时报》

这是厦门在今年作出的第二次暗中放松限购尝试。今年4月福建传出“闽十条”救市文件时,厦门就曾经酝酿放松限购,但救市消息很快被官方否认,厦门限购放松就此夭折。2014年上半年,厦门全市住宅共成交14348套,下跌了46.67%。根据百城价格指数,厦门6月新建住宅平均价格为20365元/平方米,同比涨幅12.65%,居全国第一。

舆情监测系统的研究与开发 篇12

1.1 需求概述

舆情监测系统需要实时采集网络舆情信息, 从论坛、博客、新闻、微博等信息来源, 对用户输入的关键词进行信息搜集并对其分析。以此来掌握网络舆情信息导向, 为政府、企业决策提供参考信息依据, 及时了解民生、群众反映。

“网络舆情”是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速, 对社会影响巨大, 加强互联网信息监管的同时, 组织力量开展信息汇集整理和分析, 对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。

1.2 功能概述

●图形界面

●用户能在文本框内输入需要监控的关键词进行搜索

●可以显示网络上关于此关键词的网页信息 (标题、摘要、URL等)

●可以对网页上的内容进行情感评价

●可以显示网络上对该关键词的舆论导向 (总体评价为褒扬或贬低)

●提供多种信息来源, 用户可从其中选择一个或多个信息来源

●提供设置页面, 用户可从中设置信息来源、获取新闻数量等

2. 概要设计

2.1 功能模块分析

根据前期的目标分析, 将系统分为三个模块:

Meta Search Engine:此模块可以根据用户输入关键字与设置, 在网络上搜索对应资源并将其关键内容提取;

情感分析:此模块可以判断指定文本资源的情感并对文本资源按情感分类;

用户界面:此模块包含用户所使用的开始界面、设置界面、输入输出及以上功能的整合利用;

2.2 系统流程图

2.3 需要解决的关键技术

●META Search Engine

●Spider

●HTML信息提取

●训练分类器

●中文分词

●词语情感分析

●NET

3. 情感分析

进行中文分析, 首先需要解决中文分词, 这里采用了盘古分词插件对中文文章进行分词处理:

情感分析首先需要训练分类器, 这里我们从各个新闻网站人工选择了若干篇正面言论较强烈的新闻和同等数量负面言论较犀利的新闻, 对分类器进行训练, 得到情感关键词词库。

对于文章的情感分类, 需要根据文章词汇感情综合将文章分为正面文章、负面文章和中性文章, 代码如下:

参考文献

[1]王国华, 曾润喜, 方付建.解码网络舆情.华中科技大学出版社2011.9

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com

上一篇:高校科研成果下一篇:青少年学校品德教育

付费复制
期刊天下网10年专业运营,值得您的信赖

限时特价:7.98元/篇

原价:20元
微信支付
已付款请点这里联系客服
欢迎使用微信支付
扫一扫微信支付
微信支付:
支付成功
已获得文章复制权限
确定
常见问题