微博舆情

2024-07-20

微博舆情（共9篇）

微博舆情篇1

舆情是“舆论情况”的简称, 它是民众对社会管理者行为所持有的一种态度、意见和情绪的总和。微博是一种新型的社会化媒介, 作为一种舆情传播和表达的平台, 为观点沟通提供了一种全新的模式。舆情的发生有一定的规律, 对于政府来说, 掌握好舆情生成和变化的机理, 有助于网络议题的设置, 组织有关正面信息主动地推送到网民面前, 防止舆情向不利于自己的方向无限传播。故本文从“5·28招远故意杀人案”出发, 尝试分析舆情传导和变化的机理。

一、事件回顾

5月28日21时许, 有微博网友爆料, 一女子在山东招远市一麦当劳快餐店内就餐时, 被6人殴打, 后经抢救无效死亡。

5月29日上午, 有目击者发布事发过程的长微博和视频。同时, @招远市公安局通报称, 5月28日, 张某某等6人在招远市一麦当劳与就餐的吴某发生口角, 吴某被殴打, 后经抢救无效死亡。除1人因未达刑事责任年龄另行处理外, 其余5人均因涉嫌故意杀人被刑拘。

5月30日晚, 一段手机拍摄的视频在微博上火热传播。视频显示, 打人者用椅子和钢制拖把猛击受害女子头部, 场面残忍。新华社等多家媒体开始介入报道。

5月31日上午, @公安部打四黑除四害证实:6名犯罪嫌疑人系邪教组织成员, 为发展成员, 向在事发餐厅就餐的人索要电话号码。招远警方已开展打击邪教专项行动。同日, 招远市公安局分别通过微博与新闻发布会, 回应出警过程, 称“民警4分钟内赶到现场”, 并播放案发时的监控视频。

6月2日下午, 招远警方通报, 5名嫌疑人因涉嫌故意杀人罪, 经招远检方批准, 被依法逮捕。嫌疑人还涉嫌组织、利用邪教组织破坏法律实施罪, 公安机关正继续侦查。

二、微博讨论度分析

案件发生在28日, 但是28日关于招远的讨论数量只有58条微博, 其中关于招远杀人事件只有4条。30日, 大量图片和视频在微博上传开。微博大咖“happy张江”对招远杀人事件进行了发文, 从5月30日17:00开始, 微博上讨论招远杀人事件的微博从139条锐增到939, 360条, 舆情开始发酵。31日, 多位微博名人披露了事件更多细节。单日微博量达到2, 203, 376条。6月1日、2日, 微博上讨论的更多是邪教问题与嫌疑人被捕, 相关微博舆情热度有所降低。

三、微博观点倾向性分析

本文选取了微博热度最高的前五条对该事件描述的微博进行分析。因为对转发分析有难度, 且本次分析并不是围绕舆情的传播, 故只对微博的评论进行了相关的文本分析。将所获取的评论样本进行观点归类, 由微博热度可知, 5月31日是此次事件微博舆情变化一个重要的节点。因此以此为界限, 统计31日前后的微博观点倾向。5月31日之前微博观点倾向最多的为真相诉求, 其次为后台说和、质疑公安局办事不力。5月31日之后微博观点倾向最多的为是否见义勇为, 其次为谴责凶手。

四、招远事件舆情特点

1. 在此次“招远故意杀人案”中, 邪教背景的真相大白及各级公安机关“后来居上”的“以公开换公信”, 使得招远公安局压力减轻。

5月31日前的微博舆论质疑法制、后台说的比重明显高于5月31日后的舆论。

2. 案件发生在28号, 而警方首度公开通报却发生在29号。

且二次通报再被指“公文体”, 仅说明快速出警却未公布具体案情, 让“打人者与公安有关系”的臆测扩散传播。

3. 在事件发展的后期招远警方借助发布会和央媒详细释疑, 将案情关键点——涉嫌故意杀人背后的邪教驱动力主动设置为议题, 对冲“处置不力”质疑之声, 引导舆论注意力转至“打击邪教”上。

, 舆情就从“后台说”、“真相诉求”转为热议是否应该见义勇为上来。

4. 在招远警方公布了邪教的背景前后, 存在着对邪教背景的真实性的热议。

有相当一部分微博在质疑招远警方为了为凶手减刑而使用邪教来做说辞。

5. 随着邪教背景的公布, 关于招远事件的热议程度明显下降。

在一定程度上说明“政府”“公平”这些主题词比“见义勇为”更具热议性。

6.

在招远事件中, 话题的热度在最初期出现大幅度的跃, 从讨论度这个指标可以看出微博用户在看到招远事件的微博时会做出一些集体性的行为。

7.31日前后尽管舆情内容发生了转变, 但是舆情情绪布在31日前后都表现为愤怒、厌恶和悲伤这类情绪。

而当微博用户处于这种负面情绪时, 使得微博用户参与到舆情的生成机制中。

本文尝试从社会心理学对舆情进行探讨, 但由于舆情的分析仍是停留在比较简单的抽样调查的阶段, 这样理论所建筑的基础不够深厚。如果要对舆情充分的认识, 需对微博数据进行深入挖掘, 进而剖析问题本质。

政务微博舆情影响力构成要素分析篇2

[摘要]进一步完善政务微博舆情影响力相关研究，同时为探索提高微博平台应用效果提供科学依据。构建结构方程模型，对舆情影响力构成要素进行实证研究。以政务微博为研究对象，结合交互功能，多角度分析影响力构成要素及其相互关系。

[关键字]影响力；政务微博；结构方程模型

1.引言

政务微博，通常是指以政府部门或政府行政人员为主体创办的，主要用于发布政务信息、倾听民众心声、收集民意的政府官方微博平台。作为舆情影响力在微博领域的延伸，政务微博舆情影响力逐渐成为微博领域的热点研究问题。对政务微博影响力构成要素的研究，有利于全面掌握我国政务微博整体发展水平和发展态势；有利于政府掌握自身官方微博发展现状，提升政府公信力和影响力。因此，本文在进行政务微博用户行为挖掘和归纳的基础上，构建政务微博舆情影响力评价模型，对政务微博舆情影响力构成要素进行定量分析、评价和比较，为加强政务微博的应对能力、提升网络政务建设等方面提供科学依据。

2.理论模型与假设

2.1理论分析

政务微博的舆情影响力是通过用户之间的交互得以体现，交互模式是衡量微博影响力的重要因素。微博平台最核心的交互功能主要为：发布功能、转发功能、评论功能、关注功能和搜索功能。

微博平台的交互功能帮助形成了用户之间的交互模式，影响力也在彼此之间的不断交互中逐渐形成。对单个微博用户来说，发布功能可以统计的指标包括其发布的各种微博数量，如微博总数、含图微博数、含视频微博数等：转发功能可以统计的指标包括微博被转发总数、平均被转发数等：评论功能对应的统计包括被评论总数、平均被评论数等：关注功能可以统计的指标包括关注其他用户数量、粉丝数等：基于搜索功能则可以统计包含微博用户名称的各种信息数量及内容。

2.2研究假设

原创微博数、含图微博数、含视频微博数、发布微博总数可从原创性、多媒体化、量化等不同角度衡量微博用户的宣传力度，不同类型的微博数量越多，意味着用户的宣传力度越大。从间接效果上讲，对其他用户的关注数越多，微博用户的宣传力度越大。基于上述观点，定义政务微博用户的“宣传力度”为潜在变量，并提出如下假设：原创微博数、含图微博数、含视频微博数、微博总数正向反映宣传力度、关注数正向反映宣传力度。

定义微博用户的“互动程度”为潜在变量，并提出如下假设：平均被转发数正向反映互动程度、平均被评论数正向反映互动程度。从概率上讲，用户粉丝数越多，产生互动的可能性越大。鉴于此，提出如下假设：粉丝数正向反映互动程度。

定义某微博用户的“影响力”为潜在变量，定义检索出的当前由所有用户发布的包含某用户名称的微博数为“实时检索数”，原创性的包含某用户名称的微博数为“原创提及数”，短期集中出现的包含某用户名称的微博数为“热门提及数”，所有用户发布的包含某用户名称的微博总数为“综合检索数”，并提出如下假设：实时检索数正向反映影响力、原创提及数正向反映影响力、热门提及数正向反映影响力、综合检索数正向反映影响力。提出以下假设：宣传力度对影响力产生正向影响、宣传力度对互动程度产生正向影响、互动程度对影响力产生正向影响。

3.实证研究

使用通用爬虫软件和人工相结合的方式，抓取有代表性的政务微博用户的相应数据：①自动抓取微博用户所属数据，包括关注数、粉丝数、微博总数、原创微博数、含图微博数和含视频微博数。②利用新浪微博搜索引擎手动检索包含各微博用户名称的实时检索数、原创提及数、热门提及数和综合检索数。③针对每个微博用户，随机选取其发布的微博内容，汇总被转发数和被评论数，平均后得出平均被转发数和平均被评论数。

3.1模型评价

利用Amos进行结构方程分析以验证研究提出的假设。定义潜在变量与对应的观测变量及观测变量名如表1所示

构建微博用户影响力构成因素模型。采用极大似然法对结构方程模型进行估值并修正，输出标准化估值结果。

3.2模型分析

3.2.1宣传力度到其观测变量的载荷系数分别为0.67、0.89、0.34、0.41和0.34，表明原创微博数、含图微博数、含视频微博数、微博总数、关注数均与宣传力度成正比，但对宣传力度的反映程度有所不同。最大值为0.89，说明含图微博数（X2）最能反映宣传力度的大小。原创微博数（x1）的载荷系数为0.67，说明原创微博数量对宣传力度的反映程度也比较强。

3.2.2与含图微博数（x2）的载荷系数形成对比的是，宣传力度到含视频微博数（X3）的载荷系数仅为0.34，为最小值，说明发布含视频的微博并不是非常有效的展示手段。

3.23互动程度到平均被转发数（Y1）和平均被评论数（Y2）的路径系数均为1.00，验证了平均被转发数和被评论数是衡量微博用户与粉丝互动程度的非常重要的指标。微博用户与粉丝互动效果如何，主要基于微博内容被转发和评论的数量，而且被转发的数量和被评论的数量同样重要。相比较而言，粉丝数（Y3）的载荷系数为0.42，对互动程度的反映能力一般，这也符合现实逻辑：一用户对另一用户感兴趣即可能成为其粉丝，但也可能随着感兴趣程度的降低而不再关注，也就无从谈起彼此间的互动。综上所述，平均被转发数、平均被评论数、粉丝数对互动程度均有正向的反映能力且前两者的反映能力更强。微博用户应该注重提高微博内容质量，吸引粉丝注意，产生转发或评论行为，增强互动性，继而转化为实际影响力的提升。

3.2.4影响力到其观测变量的载荷系数分别为0.9、0.70、0.80和1.00，表明实时检索数（Z1）、原创提及数（z2）、熱门提及数（Z3）和综合检索数（Z4）等检索数值均能够正向反映影响力且反映程度均比较高。综合检索数（Z4）对应的载荷系数最高，意味着讨论某用户名称的各类微博总数越多，微博的影响力就越明显。事实上通过网站搜索引擎检索出的实时提及某用户名称的微博数、原创提及该用户名称的微博数是综合检索数在不同维度上的分解体现。因此，影响力的几个观测变量均是构成微博影响力的重要指标，换言之，提到或包含某用户名称的各类微博不管是出自哪类用户、通过哪种形式、哪个时间段提及的，只要数量越多，微博影响力也就随之越来越大。

4结语

微博舆情话题传播行为预测研究篇3

目前,微博已经成为舆情话题传播的重要渠道之一,对微博网络中的舆情话题传播过程进行监控及预测, 将有利于相关部门对不良舆情进行有效地疏导和澄清。本文以新浪微博为例,在深入分析用户转发行为的基础上, 提取出了影响微博个体转发行为的4类特征,利用逻辑回归模型(Logistic Regression,LR)对微博用户的舆情话题转发概率进行预测, 并在此基础上给出了一种基于个体行为的微博舆情话题转发规模预测算法。

2微博舆情话题的个体转发行为预测

2.1转发概率预测模型

本文利用有向无权图G(U,E)来对微博网络进行描述。其中U为网络中所有节点构成的集合 ;E为网络中所有边构成的集合,且eu,v∈E表示节点u指向节点v的有向边,即节点u对节点v的关注关系 ,信息的传播方向与关注方向相反。假设用户v发布了一条话题消息topic,则y=f(v,u,topic)表示节点v的粉丝节点u在看到该话题后采取的行为:y=1表示节点u对该话题进行转发;y=0表示节点u不对该话题进行转发。因此,研究微博用户的个体转发行为,即是在给定话题信息topic以及用户关系网络G(U,E)的情况下,预测用户u转发话题信息topic的概率。

本文借鉴文献[2]和文献[3]的研究结论,使用LR模型对微博用户的舆情话题转发概率进行预测,其预测公式如下:

其中,Fu(topic,G)为影响用户u转发话题的行为特征集合 ; yu表示用户u的转发行为;ω 为权值向量, 其值可以采用极大似然函数进行估计。

2.2用户转发行为特征提取

2.2.1话题接收者特征

(1)话题接收者的兴趣度。本文利用了Jaccard相似度计算方法,通过计算微博话题内容与用户感兴趣内容的相似程度,来对用户兴趣度进行量化。

步骤1:兴趣收集。收集某时间段内用户u发布的所有Ns条微博,构建用户u的语句级兴趣空间IS={S1,S2,…,SNs}。

步骤2: 分词。本文采用中科院计算技术研究所开发的ICTCLAS系统[4]对IS中的语句进行分词 ,得到用户u的词语级兴趣空间IW={W1,W2,…,WNw}。

步骤3:从中剔除停用词。本文利用CSDN(2010)提供的停用词列表,以去除IW中的停用词,最终得到用户u的兴趣空间。

步骤4:针对某一舆情话题topic,按照步骤2~步骤3,对该话题进行处理,得到话题topic的特征空间TP={T1,T2,…,TNt}。

步骤5:计算INT和TP的Jaccard系数。 Jacccard系数是样本集交集与样本集合集的比值[5],即微博舆情话题特征空间与接收用户兴趣空间的相似度为:

SIMu,topic表示了用户u对目标话题topic的感兴趣程度。

(2)话题接收者的活跃度。本文利用式 (3)计算话题接收者的活跃度Ra:

其中,ri,ci,oi分别为用户在n天内转发、评论和原创的微博总数。

(3)话题接收者的重复接收次数。研究表明 ,用户会因为信息的重复接收,而对该信息的转发倾向发生改变[6]。因此,本文认为话题接收者的关注对象中转发目标话题信息的数量, 会影响该话题接收者的转发行为。

2.2.2话题发布者的特征

(1)话题发布者的影响力。微博网络中 ,发布者的影响力大小势必会对其粉丝的转发行为产生影响[6]。本文采用文献[7]给出的UIR算法来评价话题发布者的影响力,该算法可以描述为:

其中,UIR(v)为节点v的影响力,d为[0,1]区间上的阻尼系数,通常情况下,取经验值d=0.85,本文假设节点的初始UIR值为1。 f(v)表示节点v的粉丝集合,Au,v为节点v分配给节点u的UIR值的比例:

其中,Nf是节点v的粉丝节点总数,Ra为节点v的第k个粉k丝节点的活跃度,Ra可由式(3)计算得到,通过有限次的反复迭k代,就可以获得目标节点v的UIR值。

(2)话题发布者与接收者之间的社会关系。研究表明 ,与具有“单向关注”关系的用户相比,具有“双向关注关系”(“互粉”) 的用户间的亲密程度更高[8]。此外,用户间的互动次数也从另一个方面反映了用户间的关系亲密程度,本文定义用户u和用户v之间的互动次数为

其中,Cu,v为用户u和用户v转发对方微博的数量,Ru,v为用户u和用户v评论对方微博的数量,Mu,v为用户u和用户v在微博中提及(“@”)对方的次数。

2.2.3话题的内容特征

研究表明, 微博话题中是否包含图片、视频、URL、Hashtag以及“@”等内容,均会对用户的转发行为产生影响[3]。

2.2.4外部媒体关注度

本文利用目标舆情话题传播过程中, 网络媒体对此舆情事件的新闻报道数量,来描述外部媒体的关注度。针对某一目标舆情话题topic,首先得到该话题的特征空间TP=(T1,T2,… ,TNt),并提取出相应舆情事件的关键词, 然后利用百度搜索引擎得到该舆情事件的相关新闻报道数量NMtopic。

通过以上分析, 本文共提取了影响微博用户舆情话题转发行为的11个数值化特征,见表1。特征6、7、8、9、10均采用二元表示方法。

3微博网络舆情话题转发规模预测算法

3.1微博网络中的话题转发规则

微博网络中,用户节点对某一目标话题topic的转发规则如下:

(1)定义微博舆情话题的传播底图为有向网络G(U,E),其中U为该网络中所有节点的集合,E为网络中所有边的集合,节点总数为N。

(2)定义U中的节点仅具有两种状态,即易感状态S和传播状态I, 其中S态表示节点没有对目标话题进行转发,I态表示节点对目标话题进行了转发;USt、UIt分别表示t时刻,网络中的S态节点集合和I态节点集合。

(3)定义节点u所关注的节点集合为FL(u)={v|eu,v∈E}。

(4)定义t时刻节点u所关注的S态节点集合为FLSt(u)={v|v∈ FL(u),且v为S态};t时刻节点u所关注的I态节点集合为FLIt(u)= {v|v∈FL(u),且v为I态}。此处假设FLIt(u)中的每个节点均会影响节点u的转发行为,且其中所有节点对节点u转发行为的影响相互独立。

(5)根据式(1)确定节点u对话题topic的转发概率Pu,topic

(6)假设节点u对话题topic产生转发行为的阈值为 λu,且 λu= [0,1],则当Pu,topic≥λu时,节点u将产生转发行为,并由S态转变成为I态。

(7)FLI(u)中每增加一个I态节点时,需要对特征集合Fu,topic中的话题发布者特征进行更新,即更新表1中的特征4、5、6。由此得到目标舆情话题在网络G(U,E)中的传播过程。

3.2PRALR算法

本文根据上述话题转发规则,给出了一种微博舆情话题转发规模的预测算法———PRALR算法,其实现过程如下。

步骤1:网络初始化。获取微博网络上舆情话题传播的历史数据集,得到传播底图G(U,E),并为网络中的每一个节点用1,2,…,N进行编号,其中N为节点集合U中的节点总数;利用式(1)给出的逻辑回归模型,通过训练得到权值向量 ω,进而建立每个节点的转发概率预测公式; 为U中的每个节点设置随机的转发阈值 λ∈[0,1];初始状态下,网络中所有节点均设置为易感状态S,即US0中的节点数为N,UI0中的节点数为0;根据网络中边的集合E,为U中的每个节点i建立集合FLS0(i)、FLI0(i)(i=1,2,…,N)。

步骤2:t=1时刻, 设置网络中某一节点v为I态, 即v为话题topic在该网络中的入口节点,将其从对应的FLS0(i)中移除,放入相应的FLI0(i)中,并更新US1、UI1。

步骤3:t时刻,对于网络中任意节点u,根据集合FLIt-1(u)中各节点状态的改变,对节点u的特征4、5、6进行更新,得到更新后的Fu(topic,G),并重新计算节点u此时的转发概率函数Pu,topic,如果Pu,topic≥ λu,则节点u产生转发行为。

步骤4: 将在步骤3中产生转发行为的节点u从对应的FLSt-1(i)中移除,加入到相应的集合FLIt-1(i)中,即将FLSt-1、FLIt-1分别更新成为FLSt、FLIt,同时更新USt、UIt。

步骤5:t=t+1,重复步骤3~步骤4,直到网络中再也没有新的节点产生转发行为为止。此时,集合UI中的节点数,即为话题topic在该网络中的最终转发次数。

4实验仿真

4.1实验数据集

本文利用自行开发的爬虫工具从新浪微博中抓取了1 000条用户特征数据, 及这些用户在采样时间段内发布的95 783条微博数据, 并最终从原始数据集中提取出15 276条舆情话题数据,构成实验数据集,其中包括6 814条转发数据,8 762条非转发微博数据。

4.2舆情话题转发行为预测结果及分析

本文利用Matlab工具对微博用户舆情话题转发行为进行预测。首先,从实验数据集中提取出表1所描述的11个话题转发行为特征,构建每个用户的话题转发行为特征集合Fu,topic;然后 , 将实验数据集分成训练数据集和测试数据集两部分, 其中训练集中的微博数量占70%,测试集中的微博数量占30%;最后,利用训练集估计出式(1)中的权值向量 ω,进而建立每个用户的微博舆情话题转发概率模型, 并利用测试集对用户的转发行为进行预测,预测结果见表2。结果表明,本文给出的微博舆情话题转发行为预测模型具有较高的预测准确度。

4.3舆情话题转发规模预测结果及分析

本文从数据集中选取了2个舆情话题,其中话题1为“奥巴马2013年就职典礼”,其在本文选取的微博子网中被转发了595次(采样时间为2013年1月21日-2013年3月31日);话题2为“长春盗车杀婴案”,其在传播子网中被转发了1 057次(采样时间为2013年3月4日-2013年3月31日)。利用PRALR算法对以上两个话题的转发规模进行预测, 分别得到了其转发次数随时间的变化趋势,如图1所示。结果表明,PRALR算法可以有效地预测微博舆情话题转发规模的演化趋势。

5结论

本文分析了影响微博用户舆情话题转发行为的相关因素, 利用逻辑回归模型, 对微博用户的舆情话题转发行为进行了预测。此外,本文还将微观层面上的个体用户行为与宏观层面上的微博网络话题传播过程相结合, 给出了一个基于个体行为的微博舆情话题转发规模预测算法———PRALR算法。实验结果表明, 本文给出的微博用户舆情话题转发概率预测模型, 及预测微博舆情话题转发规模的PRALR算法,均具有较高的预测精度。本文的研究工作将为相关部门制订有效的微博舆情话题控制策略提供一定的理论依据。

摘要：本文分别从接收用户特征、发布用户特征、微博内容特征以及外部媒体关注度4个角度,分析了微博用户舆情话题转发行为,建立了基于LR的微博舆情话题转发行为预测模型,并给出了一个基于个体行为的微博舆情话题转发规模预测算法(PRALR)。实验结果表明,基于LR的微博舆情话题转发行为预测模型及PRALR算法均具有较高的预测精度。

微博舆情篇4

摘要：公信力是衡量政府是否有效的重要指标，它还是政府对公众的凝聚力和动员力的重要决定因素。在微博时代的背景下，针对微博舆情的特点分析政府公信力缺失的原因，并探讨其重塑路径，以使政府公信力得到不断提升。

关键词：政府公信力；微博；微博舆情

中图分类号：D63 文献标志码：A 文章编号：1002-2589（2013）11-0020-02

近两年来，微博潜移默化地改变着大众的生活，中国互联网也在微博的影响下进入全民围观时代。微博的发展方便了公众的网络政治参与，公众通过网络监督政府，若政府不能在公众的监督下做到政务信息公开、政府官员清正廉洁等，这会导致公民对政府的质疑与不信任，政府公信力必然逐步受损。在微博时代，微博舆情已成为政府公信力缺失的巨大挑战，也能为政府公信力的重塑提供契机和支持。

一、微博的定义及发展

微博——微小的微；博大的博，英文名micro blog，它是一个基于用户关系的信息分享、传播以及获取平台，用户可以通过WEB、WAP以及各种客户端组建个人社区，并实现即时分享。据中国互联网络信息中心（CNNIC）报告显示，截至2012年12月底，我国微博用户规模3.09亿，较2011年底增长了5 873万人，网民中的微博比例比上年提高了六个百分点，达到54.7%。

微博的出现，使得微博报道新闻、微博新闻热点讨论、微博问政等公共政治应用方式不断进入我们的视野。微博成为许多重要新闻发布的第一现场，温州723动车追尾、郭美美炫富等事件，其第一手的信息来源都是微博。

二、微博舆情的定义与特点

网络舆情是指民众通过互联网对社会公共热点问题或者与自身切身利益相关的社会公共事务表达和传播的各种不同情绪、态度和意见交错的总和，它反映着公众的情绪和社会政治态度[1]。而随着微博热的兴起，微博已经逐渐取代其他网络舆情工具，成为民众自由表达舆论最重要的窗口和平台。微博舆情则是民众通过微博的发布、转发、留言等功能对社会公共热点问题与自身切身利益相关的社会公共事务表达和传播的各种不同情绪、态度和意见交错的总和。微博舆情在其传播过程中，主要有如下特点。

1.草根化

微博的门槛较低，用户只需用电子邮箱或者手机号码申请注册即可拥有自己的微博账号，普通大众成为信息发布的主角，随时随地分享自己的生活和记录身边发生的新鲜事儿，并就新近发生的热点问题自由地发表自己的看法和观点。微博的产生，打破传统专业媒体和精英人士等网络意见领袖的话语霸权，进一步下放了话语权，并形成了社会各个阶层、各个领域之间的平等信息互动。

2.广泛性

从微博账号ID属性看，有个人微博、企业微博、资讯类微博等，政府职能机构也纷纷开设政务微博主动与民众交流，截至2011年11月初，通过新浪微博认证的各领域政府机构及官员微博已经超过18 500家，其中政府机构微博9 960家，个人官员微博8 628个，覆盖全国34个省、自治区、直辖市及特别行政区；从舆情议题上看，微博的议题标签也是极其丰富的，政治、经济、历史、娱乐等包罗万象。

3.公共性

在微博这个广阔的信息传播交流平台之上，公民网络参与意识空前提高，公众对公共领域的关注加强，越来越多的公众参与讨论公共政治问题，政府政策法规、官员素质、产品质量安全等都是公众关注的焦点，公众成为网络舆论的监督者，并对有关自己切身利益的议题进行持续关注、转发、评论，提出自己的质疑并希望政府能够听到自己的心声。

三、微博舆情下政府公信力的缺失

所谓政府公信力，就是公众对政府的信任的程度，是政府能力在公众心中的综合评价和公众对政府提供公共服务的满意度。它是衡量现代政府是不是一个有效政府的重要指标[2]。在微博时代，公众可以更快速更全面地获取大量新闻信息，对于政府政务信息公开、民生问题、官员腐败、司法公正等几大类热点关注度很高，民主诉求也空前高涨。“温州动车事故”、“皮鞋制老酸奶”“湖南湘潭90后女副局长”等事件都是第一时间在微博上引起轰动，得到了广大微博网友的强烈关注，对事件的原因、处置方式、处置结果等都进行了追踪了解，并对该类事件背后的种种真相与利益牵扯产生强烈质疑，给我国政府公信力带来很大程度的负面影响。

1.微博舆情的群体极化现象造成政府公信力的缺失

所谓“群体极化”，是指团体成员一开始即有某些偏向，在商议后，人们朝偏向的方向继续移动，最后形成极端的观点[3]。微博为公众表达和宣泄情绪提供了渠道，但微博舆情的表达总是倾注了个人的意志和情感，在表达中有可能掺杂个人偏见而缺少客观性，一旦偏激的情绪或态度形成规模和影响后，很容易导致舆论失控，形成“群体极化”现象。这些消极的、非理性的舆情信息借由微博迅速传播，引起社会群众的盲从和冲动，造成恶劣的社会影响。

2.微博舆情的真伪难辨造成政府公信力的缺失

微博因其信息发布的随时随意性，发布消息的人群和机构也纷繁复杂，在没有专门机构对流言进行控制的情况下，面临着信息“真伪难辨”的难题。因此，微博容易成为攻击他人、发动大规模诋毁活动的工具，或者沦为一些投机者肆意炒作、扩散谣言的工具，其中难免有一些恶意歪曲事实真相者和动机不纯的造谣者。

3.微博舆情的匿名性造成政府公信力的缺失

每一个微博用户都有一个自己独一无二的虚拟微博名，尽管现今微博已实行实名制认证，但是微博名表面上还是虚拟的网名形式，正是这样的匿名性，每一个微博用户似乎都带上了保护伞，抑制了现实生活中法律、行政、道德的种种约束，微博发言更加肆无忌惮，相对于现实生活中的敢怒不敢言，微博上公众对于收入不均衡、贪污腐败、政府公共服务等问题的批判和发泄更加大胆，使得政府问题不断被放大，从而造成政府公信力的缺失。

4.微博舆情的民主参与诉求的提高造成政府公信力的缺失

微博为公众提供了发表言论的最大自由，在这个相对自由的网络空间里，公众的民主诉求越来越高，他们积极要求政府政务信息公开、监督政府官员的贪污腐败、积极关注公共政策的走向、考验政府突发事件应变能力等。每当网络舆情危机爆发后，舆情的诉求表达是想了解真相，要求政府公开信息，如果相关政府含糊其辞，迟迟不肯公布事件的真相，公开不及时不主动，或者在网民质疑时候才公开，且公开还是有选择性的，与公众对信息公开的渴求形成对立，那么在这种公众民主参与与政府信息不公开的矛盾对立之下，政府公信力的缺失也在所难免。

四、微博舆情下政府公信力的重塑

在微博舆情时代，政府公信力在面临着巨大挑战的同时，也迎来很大的契机。政府如何利用微博舆情的契机重塑公信力，笔者认为，目前需要解决五大问题。

1.增强政府微博公关，打造阳光政府

微博问政时代的到来，面对舆情危机，考验的不光是政府的公关技巧，也是政府官员的智慧。由于微博受众范围大，传播速度快，更是要求政府在微博平台上做好政府公关，政府利用微博公关与民沟通正是公信力建设的良好契机。首先应该建立和规范政务微博，通过政务微博一是及时公布政情、资讯，获取与民众更多更直接更快的沟通；二是在增加亲民性，吸引公众的关注，及时地回答公众关心的问题。其次，加强微博舆情危机应变能力，在有损政府形象的微博舆情发生后，政府应率先在微博上做好辟谣工作，核实关键信息，消除不实传言，理顺民意，消除群众不必要的猜测和恐慌。在网络舆情突发事件的初期做好权威信息发布者，中期能通过对事件的诠释和评论成为舆情的引导者，在后期成为政府和公众舆情互动的连接者[4]，推动政府与公众双方沟通对话的进一步加强。

2.利用微博反腐，打造廉洁政府

我国反腐倡廉的监督机制尚不完善，除了权力监督和法制监督机制不健全外，群众监督机制和舆论监督机制也没有发挥到真正的作用。微博的出现，为群众监督和舆论监督提供了一条捷径，其实时性和动态性大大节省了沟通的时间成本，其文本碎片化、监督主体大众化、揭露腐败便利化、话题设置多样化、腐败情报发布实时化等优点都促使微博成为了反腐利器。微博反腐，对政府而言，多了一个制约监督权力的平台；对反腐败职能部门而言，多了一条获取腐败信息和线索的渠道；对腐败分子而言，多了一种威慑力量；对公众来说，多了一种快速便捷监督官员、举报腐败的途径。一方面，反腐机构应合理使用微博的腐败信息线索，做出积极回应，真正把微博作为发现、预防、查处腐败的有力工具。另一反面，政府工作人员应该在微博的监督下，自觉提高自己的责任意识，真正做到为民服务，与贪污腐败行为划清界限。

3.微博决策参与，打造民主政府

随着微博的发展，微博已成为政府了解社情民意的重要窗口，与以往自上而下的公共决策制度相比，政府更应该透过微博这个窗口，听取公众的心声，改变以政府为绝对主导的政府决策方式，采用政府主导、民众参与的民主协商决策模式。政府应该事先主动通过微博展开大规模的民意调查，在广泛尊重民意的基础上，再进行内部商议，最终敲定决策方案。另外，微博议题讨论的聚焦和升温，会促成社会公共领域的议论，引发政府等公共管理主体的重点关注，形成社会话题的“公共议程”，并使之最终上升为政策议程，促进政策法律法规的完善。

参考文献：

[1]刘毅.网络舆情研究概论[M].天津：天津人民出版社，2007：53.

[2]马效奇.网络时代政府公信力的缺失与提升研究[J].经营管理者，2011，（21）.

[3][美]凯斯·桑斯坦.网络共和国——网络社会中的民主问题[M].黄维明，译.上海：上海人民出版社，2003：171.

[4]涂章志，刘丽文.论网络舆情视角下我国地方政府公信力[J].北京邮电大学学报：社会科学版，2011，（4）.

微博舆情地方化的应对与管理篇5

一、微博舆情的地方化

据中国互联网络信息中心 (CNNIC) 发布的第30次中国互联网络报告显示, 截至2012年6月底, 中国网民数量达到5.38亿, 其中微博用户达2.74亿, 网民使用率为50.9%, 远超过42.9%的世界平均水平。在这个微博迅猛发展的年代, 正如美国互联网趋势研究者谢尔·以色列所言:“我们正处在一个转换的年代——一个全新的交流年代正在替代老朽的、运转不灵的传播时代。在这个微博推动的、正在到来的交流时代, 如果我们还没能跟上它的脚步, 那么就可能会被这个时代所抛弃。”[1]因此, 如何面对微博舆情这一新事物并进行有效的管理, 是摆在各级政府面前的一个重要课题。

微博舆情, 就其影响范围而言, 可以分为全国性和地方性两种类型。全国性的微博舆情影响范围广, 参与人数众, 对政府应对和解决的能力要求高;地方性的微博舆情影响范围小, 仅及于本地区, 且参与者大多为本地用户, 政府的应对和解决也相对容易。但是二者并非是截然区分的, 正如学者所指出, 每一起舆情热点事件的产生背后都隐藏着一种普遍的社会情绪、态度或价值观。在微博平台上, 比较容易形成舆情热点事件的类型有: (1) 灾害事故类; (2) 公共卫生类; (3) “三公”部门的舆情[2]。不同的热点事件对于不同的人群而言, 其重要性是不同的, 要在短时间内吸引不同地域众多微博用户的关注, 该事件必然具备足够的震撼性, 但是这么一些重大事件的发生往往是偶然的。因而, 全国性的微博舆情并非常有, 对于地方政府而言, 更需要关注的是常态化的地方微博舆情, 而且往往因为地方政府的应对不当, 而导致舆情向全国的扩展。

二、微博舆情地方化的传播特性

要应对地方化的微博舆情, 首先要认识地方化的微博舆情具有怎样的传播特性, 在这基础上才能够制定合理的应对策略。

(一) 微群的圈子化

微博上海量且多元的信息, 加之用户间的互动交流, 为网络群体的形成提供了可能, 这种基于用户的自我偏好而相互聚合形成的微博群体, 称之为微群。不同的用户出于不同的目的和需要聚合成群。对于跨地域的用户而言, 相互聚合的原因大多是源于对共同话题的兴趣以及相近的价值判断, 这是一种基于信息获取需要的结合。但是对于同一地域, 尤其是地方城市的用户而言, 获取本地信息渠道的多样化且便捷, 使得微博更类似于一个社交平台, 成为人们沟通交流的工具, 这是一种出于交往需要的结合。在这样的微群中, 人们现实社会中的关系, 诸如同事、同学、朋友等, 在微博虚拟世界中得以延伸, 一个微群就是一个私密性强的圈子, 这些微群圈子首先是排他的, 圈子以外的用户即便是本地区的, 由于缺乏现实交往中的关系而难以融入;同时, 这些圈子所讨论的话题又是小众的, 因为这些微群圈子聚集着彼此相互熟悉的用户, 他们共同分享着身边的事情, 讨论着感兴趣的话题, 而这些事情与话题对于圈子以外的用户, 因为缺乏共同的生活背景, 要么全然陌生, 要么了无趣味。

(二) 信息传播的强连带

所谓的强连带, 即双方相互间交流互动频繁, 形成紧密的关系, 与强连带相对应的是弱连带, 就是相互间的联系较少, 有特殊需要时才会发生联系。强、弱连带被广泛应用于分析不同微博群体中的信息传播方式。一般而言, 在大量粉丝聚集的微群中, 更利于信息的广泛传播, 却不利于用户之间的充分交流, 用户之间呈现弱连带关系;而粉丝量少的微群中, 用户之间能更好地交流互动, 形成强连带关系。

对于地方城市的微博舆情传播而言, 用户间的圈子化聚合方式, 使得微群私密性强且排他, 群组内的人数有限;加之用户间基于现实社会关系在微博世界的延伸, 导致微群中的交流互动异常频繁活跃, 这种圈子化的微群内部呈现出明显的强连带方式的信息传播特性。但是, 强连带总体上并不利于信息在微博的广泛传播, 相反, 弱连带却有利于信息传播。因此, 社会学家格兰诺维特认为, “强连带往往形成小圈圈, 弱连带却会形成一张大网络。”[3]

(三) 意见领袖影响力的弱化

微博为意见领袖突破传统媒体的信息垄断和话语霸权提供了一个重要的工具。当前国内发生的众多网络公共事件中, 我们常常可以看到意见领袖活跃的身影。但是相较于那些有全国性影响的微博舆情事件中, 意见领袖“兴风作浪”的巨大能量, 在地方城市的微博舆情中, 意见领袖的影响力受制于各种因素而被弱化, 这些因素包括:一是圈子化的微群, 这种基于现实社会关系在微博中组建的群组, 私密性强且排他, 使得意见领袖所能影响的粉丝数量有限;二是强连带的传播方式, 导致了意见领袖言论影响范围的收窄, 突出表现在其微博言论被转发和评论次数较低。无疑, 粉丝数量少、言论被转发和评论次数少标志着地方城市微博意见领袖影响力的弱化。

(四) 群组之间的对立易激化微博舆情

人们使用微博易于结成群组, 群组之间或沟通交流, 或对立激辩, 二者都可以强化微博舆情。群组间的交流从广度上扩展舆情的范围, 而群组间的激辩则在程度上激化了舆情。对于地方城市而言, 受制于微博用户总体数量少的现实情况, 微博舆情一旦发生, 在广度上的扩展将十分有限, 我们尤为要注意的是群组间的激辩可能对微博舆情发展的推波助澜作用。

为何群组之间的对立会激化微博舆情呢?原因在于背后的群体极化。所谓的群体极化, 是美国学者凯斯·桑斯坦提出的概念, 指的是“团体成员一开始即有某些偏向, 在商议后, 人们朝偏向的方向继续移动, 最后形成极端的观点。”[4]作为自媒体新形式的微博, 实际上是大大强化了群体极化效应。微博用户通过关注与被关注的功能, 与志同道合者结成群组, 并就共同感兴趣的话题讨论, 这样不但人为地屏蔽了与差异观点接触的机会, 反而会强化既有的观点, 最终在群体的协同过滤下导致成员的极端化。这种极端化的形成又会反过来给予每个成员以自我催化的责任感和自豪感, 让发帖者给自身的发帖行为赋予一种自我实现的价值, 积极置身于舆情发展的角色扮演中。正是这种群体极化效应, 往往导致地方城市微博舆情的激烈化。

三、微博舆情地方化的应对

面对微博这个新兴的舆论场, 地方政府能否有效应对突发舆情, 不仅是对政府执政理念的检验, 更是对政府舆论引导能力的考量。针对地方化微博舆情传播的基本特点, 本文提出以下的建议和对策:

(一) 不断提高政府应对微博舆情的博弈能力

首先, 第一时间占领信息发布的高地是应对地方微博舆情的首要准则。美国社会心理学家奥尔波特曾经提出过一个著名的谣言强度公式:R=ixa。R表示的是谣言传播的广度, i表示的是事件对相关人员的重要性, a指的是涉及该事件主题证据的模糊性[5]。微博的出现, 极大地便利了谣言的传播。人们使用微博, 只需轻按一下转发键就可以轻松地将信息传播开去, 加之微博的裂变式信息传播特点, 谣言瞬间之内就可以广为人知。这种低成本的传播方式助长了微博谣言的扩展, 也增加了管理部门防控的难度。因此, 有学者指出, 根据奥尔波特的谣言公式, 信息匮乏是导致谣言产生的根源, 所以要应对微博谣言, 首先就是要第一时间详细地公开信息, 消除事件的模糊性。政府必须严格遵守消息发布的3T原则, 即快速 (Tell it fast) 、全面 (Tell it all) 、以我为中心 (Tell you own tale) , 对虚假信息要及时证伪, 对令人误解的信息要及时澄清, 对公众存在疑惑的地方要及时解释, 以预防谣言的滋生。

其次, 地方政府还应该有合理的博弈策略。网民和政府无疑是微博舆情中博弈的双方, 政府要成为一个理性的博弈者, 应该是能够从微博舆情中寻找有用的信息, 并据此制定实现利益最大化的博弈策略。互联网时代的网民并非是以往信息闭塞时代的顺民, 伴随着信息爆炸带来的眼界开阔, 以及从不断增多的舆情事件中的学习, 网民也开始熟悉政府的行事方式, 如不闹大不处理, 闹大后就息事宁人等等, 所以, 地方政府应对微博舆情的博弈策略也应该与时俱进。首先要客观分析舆情的性质和内容, 在切实保障群众利益的前提下, 适当考虑舆情群体的诉求;其次是要合理地分析舆情群体的声音, 比如他们怨恨的根源是什么, 他们要表达的是利益的要求还是价值的呼喊等等, 以此有针对性地提出解决措施;最后还要科学地分析舆情群体的动员框架, 用事实和行动来解构网络的群体动员, 最终平息舆情。

(二) 建设民意微博平台

要有效应对微博舆情, 大体可以从两个方面着手:一是从原因角度出发, 侧重于从源头消除产生舆情的根源;二是从结果角度出发, 注重提高应对危机的能力。这两种不同的思路就其功效而言, 前者耗时长, 成本高, 却能够从根本上减少微博舆情的发生;后者见效快, 效果彰, 但是显得被动。对于地方政府而言, 要有效地应对本地微博舆情, 应该将这两种思路有效地结合起来, 既注重平时的预防, 也着意于提升舆情的应对能力。如果说及时发布信息, 提高政府的博弈策略是从结果上解决地方微博舆情的举措, 那么努力将微博建设成一个把握本地民意的新平台, 则是从原因的角度出发预防微博舆情的措施。微博为民意的汇聚提供了一个广阔的平台, 其即时互动交流的形式相当于开通了一个面对面的民意窗口, 地方政府是能够通过微博及时地了解民情、汇聚民智、把握民心。

要将微博建设成一个把握民意的新平台, 制度建设是关键。一是要着力建设一个民意表达的微博载体。为此, 可以从横向和纵向两个方面入手, 在横向上, 将政府有关职能部门集成在微博平台的一个页面中, 方便本地网民的查看;在纵向上, 以政府某一职能部门为线, 实现市、区、镇三级同一职能部门的微博集成, 方便本地不同区域网民的查看。构建横向和纵向的民意微博平台, 有利于实现群众问需于政府和政府问计于群众的有机统一。二是要保证表达民意的处理。建设民意微博平台的根本目的在于切实保障群众利益, 解决群众的困难问题。如果民意微博平台只是一个摆设, 群众的声音得不到重视, 那么将会深深地挫伤老百姓对政府的信任, 甚至可能引发新的舆情危机。因此, 必须认真对待微博平台上的民声民意, 要保证群众反映的问题能够及时地传达到所属的职能部门, 而且政府系统内部应该有制度规范限时限质地处理群众意见, 以防推诿拖沓。

(三) 完善政务微博建设

虽然在纷繁热闹的微博发展过程中, 许多政府职能部门也都“不甘寂寞”, 纷纷“试水”开通各自的官方政务微博, 但其实很多政府职能部门对政务微博的心态是复杂的, 有心存疑虑不想开通的, 有信心不足不敢开通的, 有赶时髦而开通的, 也有做样子而开通的。殊不知在这个新媒体时代, 与其被动消极不如积极进驻。搞好政务微博, 不仅是与民沟通、提高部门效能的举措, 更能够在舆情发生时发挥有效应对的积极作用。

完善本地政务微博建设, 首先要完善组织机制。当前, 很多地方政府对政务微博的建设缺乏统一的规划, 大多尚未在微博平台上有一个市级层面的统一出口, 造成了各职能部门政务微博的自行其是。为此, 建议成立政务微博管理部门, 统一管理各单位的政务微博, 该部门作为明确责任、协调分工的机构有利于改变地方政府政务微博多头管理, 部门之间缺乏协调, 易于推诿的状况。

完善本地政务微博建设, 还要加强人员培训。首先是要设立专职管理人员, 并加强对管理人员的政策法规、网络传播规律、以及语言交流、文字写作能力的培训;其次要明确工作绩效奖惩, 按照信息公开、互动交流、突发事件处理、网民评价等指标设计考核体系, 对工作成绩突出或出现重大失误的部门及责任人给予相应的奖惩。

完善本地政务微博建设, 关键在于做好信息发布。第一是要规范发布的内容, 要多从老百姓的角度出发, 主要发布与民众生活息息相关的政务信息, 并确保信息的真实性、准确性和可靠性。第二是要与民众进行有效地互动交流, 提高沟通技巧, 以诚待人, 尽量使用网民愿意听、乐于听的语言, 少讲官话、大话和雷话。

(四) 充分发挥传统媒体的作用

即便是在网络媒体日益发达的今天, 传统媒体由于其严格的新闻把关制度保证了信息的真实准确而仍旧为公众所认可。这种权威性是任何新媒体, 包括微博所不可替代的, 尤其是在突发微博舆情出现时, 地方政府部门更应该充分发挥传统媒体在缓和及平息舆情中的重要作用。

一是让传统媒体全面参与突发事件的报道。在突发公共事件面前, 政府应该主动向媒体发布消息, 提供条件协助媒体核实信息的真伪, 这是减少谣言传播的有效手段。政府既要利用平面媒体及时迅速的报道优势, 第一时间发布信息;又要借助广播、电视等立体媒介的报道效果, 全方位地展示事件的真相, 提高对突发公共事件信息的披露, 正确地引导微博舆论。

二是要合理地引导传统媒体的报道。在一些地方官员的思维定势中, 总是认为本地媒体听招呼, 在舆情发生时易于掌控;而外地媒体总是添乱, 不断地质疑事件、拷问政府, 所以, 常常是厚此薄彼, 照顾“自己人”, 歧视外地媒体。这样一种思维定势的错误在于:一是试图控制媒体, 让某些媒体成为自己的传声筒;二是在于区别对待, 反而会将外地媒体推向地方政府的对立面。因此, 在舆情发生时, 政府一是要加强与各媒体的沟通, 一视同仁, 发布信息;二是要借助不同媒体的传播优势, 或发放消息, 或设置议程, 以有效地疏导舆情。

(五) 团结和培养意见领袖

对于地方政府而言, 虽然本地微博意见领袖的影响力弱小, 但是众人拾柴火焰高, 每个意见领袖影响着的那一批网民累加起来也将是一股不可轻视的网络力量, 所以地方政府应该注意团结和培养微博意见领袖。

第一, 积极主动与各类微博意见领袖沟通。政府首先要转变观念, 从轻视、拒斥意见领袖转变为重视、接纳意见领袖。只要相关部门能够真正做到坦诚相待, 给予名义、给予支持, 不怕人家说话, 意见领袖也是能够配合舆论宣传的。其次是要搭建沟通平台, 在突发公共事件的应急处理中应该吸纳意见领袖的加入, 并主动提供信息, 尤其是借助他们“第三方信源”的正面作用, 在公众质疑政府的时候, 让意见领袖站出来说话, 以化解舆情危机。

第二, 培养政府自己的微博意见领袖。一是要鼓励政府官员开通微博, 要为官员开通微博创造条件, 加强对官员相关知识和技能的培训;而且还要鼓励官员积极在微博上发声, 多听民意、多与公众交流, 积极引导微博舆论, 争取成为微博意见领袖。二是要重视传统媒体从业者的微博, 媒体从业人员由于自身的职业要求, 大多开设了微博, 加之他们在接触信息上的便利以及专业的媒介素养, 使得他们往往成为微博上最活跃、最易受到网民关注的一群, 政府应该高度重视各类媒体从业人员, 积极培养和协助他们成为微博意见领袖。

摘要：微博舆情就其影响范围而言可划分为全国性和地方性两类, 地方政府更应重视常态化的地方微博舆情。地方化微博舆情呈现微群圈子化、强连带传播、意见领袖影响弱化和群组易于对立等传播特性。为有效应对地方化微博舆情, 政府应提高博弈能力, 完善民意微博和政务微博的建设, 重视传统媒体和意见领袖的作用。

关键词：微博舆情,地方化,微群,强连带,意见领袖

参考文献

[1]谢尔.以色列.微博力:140字推爆全世界[M].任文科, 译.北京:中国人民大学出版社, 2010:33.

[2]谢耘耕, 荣婷.微博舆论生成演变机制和舆论引导策略[J].现代传播, 2011, (5) :70-74.

[3]马克.格兰诺维特.镶嵌:社会网与经济行动[M].罗家德, 译.北京:社会科学文献出版社, 2007:13.

[4]凯斯.桑斯坦.网络共和国[M].黄维明, 译.上海:上海人民出版社, 2003:47.

微博舆情篇6

微博作为Web2.0时代新兴起的开放化的互联网社交服务,至2006年Evan Williams等人联合推出Twitter以来,发展迅猛。2007年,王兴首先建立了饭否网,将微博概念引入国内。其他类似的微博网站相继出现,如叽歪、做啥、嘀咕、贫嘴、同学网、9911等。除了上述专业类微博网站外,2010年国内微博迎来春天,微博像雨后春笋般崛起,四大门户网站均开设微博。其中,新浪借助网站平台及名人资源优势使得其用户数超过1亿。2011年上半年,我国微博用户数量从6331万增至1.95亿,半年增幅高达208.9%。微博在网民中的普及率从13.8%增至40.2%。从2010年底至今,手机微博在网民中的使用率从15.5%上升到34%。

微博快速发展的同时,不可避免地会带来一些新的问题,其中一个突出问题就是虚假信息。比较典型的事件就是2009年西方媒体借助“Twitter”散发小道消息,导致伊朗在大选后政治动荡。由于微博信息共享便捷迅速,内容短小精悍,内容限定为140字左右,这样产生大量的信息内容,使得现有的系统审核方式或人工实时监控模式难以达到杜绝虚假信息的目的。微博在带来沟通的流畅和信息分享的高效的同时,也带来了虚假信息的泛滥。一则未经核实的具备轰动效应的消息,常会在极短时间以几何级数爆炸式传播,如果消息不实,事后的澄清和辟谣将非常困难。可见,微博在网络媒体中作用越来越显著。

舆情分析指标体系大多针对互联网舆情设计,但互联网中传播渠道和交流平台复杂多样,如:新闻、BBS以及博客、维客、即时通信软件、Email等,指标体系构建太过庞大,专业性不强。鉴于微博在互联网舆情中充当的角色越来越重要,加强微博舆情的预警和监管势在必行。针对微博自身的特点,建立一套微博专用的舆情监测指标体系,迅速捕获到微博中扩展迅速的敏感舆情信息,将负面的网络舆情影响控制在警戒线以下,便于管理者针对敏感舆情信息早作决策。

1 微博中的信息传播

微博快速兴起,成为整个互联网系统的重要一环,其信息传递的模式与其他信息传播媒介并不相同。微博用户在成功注册之后,可以选择需要关注的其他用户,微博特有的信息传播机制会自动收集所关注的人发布的信息,聚合到自己的主页,排序方式是按时间先后顺序,时间越近的排得越前。微博信息传递模式如图一如示:

微博在信息传播上,具有以下几个特点:

1.1 信息的快速生产与消费

与其他互联网工具相比,信息在微博中被快速地生产与消费。这是由微博的技术特质决定的。在微博中信息以140甚至更少的字符生产出来,然后由于其简短的特性又易于消费,因此,微博中信息流动也是快速的。传播技术的改变影响思维方式的转变,信息的获取与消费速度加快从而导致了用户对信息的快餐式消费。

1.2 信息的生产与消费的不对等性

由于微博兼具私人和公共平台的性质,因此造成了一部分信息是用户闲言碎语的唠叨,成为一部分用户自我表达、抒发情感、心理宣泄的场所。然而,微博的技术特质允许这种无意义的信息存在。一般来说,私语化的信息对众多的其他互联网用户来说是毫无意义、不具备任何价值的信息。因此,这部分信息被大量生产,却基本上不会被消费,形成了信息的生产与消费的不平衡性。

1.3 信息的流动完全由用户主导

用户的自组织在微博中体现得更为明显。用户一方面自己发布信息,另一方面用户关注其他用户,自己定制信息。用户定制信息的过程与信息的流动特点类似于用RSS阅读器定向订阅其他人的博客或某些网站的信息。在微博中,用户把其他用户的信息聚合到自己的主页上,从而信息的流动完全是由用户的行为决定的。

由上面微博信息传播特点,可以看出这种传播是网民自发进行的活动,不同于传统网站的自上而下、点对面的发布方式,人人都可以分享自己的信息,在“节点”中发布信息,每个“节点”对应一个微博注册用户。为研究微博信息的传播效果,下面对微博信息传递模式图进行分析:一是从主体角度出发,包括两种类型,一种为信息发布者,一种为信息接受者;二是从客体角度出发,同样包括两种类型,一种为发布的信息,另一为信息传播媒介。只有从主客体两种角度来分析,我们才能更为全面地建立舆情分析指标体系。

每个主体对象(微博)在网络中意味着一个节点,每个节点之间都有或强或弱的关系,根据其信息传播的特点,微博所处节点和关注该用户微博的节点可看做存在一种“强关系”,其他类型的节点与该节点之间的关系则可视为“弱关系”。关注博主的微博,被称为“粉丝”。这些“粉丝”可能来源于博主在现实生活中的好友、同事,也可能是通过阅读博主发表的微博文认同博主价值观念的微博客。博主的“强关系”越多,即“粉丝”越多,意味着该博主发布的信息传播的链条越多,其传播能量越强,该节点在舆情分析指标体系就应该受到更多关注。

除了博主自身的传播能量外,“粉丝”的转发和微博平台的推荐机制也是影响博主传播能量的重要因素。一条微博的构成有两种方式:一种原创微博,转发它并加评论就构成了第二种,暂称为原创+评论型。正是转发这种病毒式传播机制导致信息多级流动与扩散速度的提升,是否转发,转发时评论为正向导论还是负向,全都由信息的受众来决定,当受众对该信息产生同鸣时才会进行转发加上自己的评语。转发过程可以看做信息的过滤。微博平台的推荐机制决定了该信息超越博主通过“粉丝”传播能量进行传播的能力。例如新浪平台提供的微博达人、风云榜、微话题、微博精选、随便看看、同城微博和热门微博等方式,都可以带来信息传播速度和幅度的大范围提升。

有人实证过,在某微客平台发表的一条微博总共被转发了260次,直接转发原始微博的人数(一次转发)占比仅有29%,余下71%的转发人都是中间人转发的(二次转发)。由此可以看出,微博信息传播中,舆情受众对信息的扩散效果起着决定性的作用。受众通过自己对信息进行筛选决定进行“转载”或“评论”,进而影响到信息传播的广度。

2 微博舆情监测指标体系

网络舆情安全评估指标体系的构建具有非常重要的理论指导和现实应用价值,它恰恰能将网络舆情相关理论与技术研究有机地契合起来,为网络舆情分析及预警应用系统的实现和应用提供一个系统化、整体性、宏观性的基础性平台,从而为政府和国家舆情安全监管等业务部门提供一个把握各阶层民众之民意的平台。通过捕捉和识别出苗头性、敏感性、倾向性的网络舆情信息,及时作出警示性反应,实现对网络舆情安全态势的把握,将其牢牢控制在安全警戒的基线之下,防范负面网络舆情危害社会于未然。该指标体系也能从理论和实际操作层面指导网络舆情监控预警一体化的应用架构形成整体性效果,从而形成高效畅通的网上舆情发现、分析、监管、预警、处置和反馈机制[1]。

构建能客观反映我国网络舆情安全评估指标体系应遵循以下原则:具有全面性和准确性、具有可计量性和可操作性、具有导向性和可延续性。

微博网络舆情作为信息传播的方式同样符合信息空间的特征,可以采用信息空间的方法,将微博舆情的三维空间关系构造出来,便于了解网络舆情的内涵及其表达形式,从而为微博舆情监测指标体系设计提供理论依据。根据信息空间模型构建可编码、可抽象和可扩散三个维度,其中舆情要素对应信息空间中的抽象维、舆情受众对应编码维、舆情传播对应扩散维,其中舆情要素包括舆情信息和舆情主体。

由于微博信息传播具有及时性的特征,信息一经发布,经过转载与评论,级级扩散,整个扩展过程可以划分为两个过程:舆情阅览阶段和舆情转载评论阶段.整个过程需要舆情主体、舆情受众和微博平台三方的参与。舆情影响力的大小需要统筹三方得到最终结果。

网络舆情安全评估指标体系包括两个方面:一个是网络,一个是舆情。网络属于技术层面的研究范畴,是需要定量表征的客观概念。舆情即社情民意,属于社会层面的研究范畴,是需要定性描述的主观概念。在两方面的研究基础上,需要将舆情这一定性描述的主观概念映射到网络这一定量表征的客观概念中去,深入挖掘网络上所体现的舆情演变规律,对具体的网络舆情信息的安全程度进行评估研究,通过科学的方法选取各层次评估指标,从而构建起安全评估指标体系。

微博系统舆情监测指标体系的构建同样需要将主观概念的舆情与技术层面的网络整合在一起,而且结合微博自身的特点。微博舆情监测评价指标体系如图二所示。

从微博舆情监测评价指标体系图中可以看出,微博舆情监测评价体系可再分为三个二级指标,即微博舆情流通指标、微博舆情要素指标、微博舆情受体指标。

2.1 微博舆情流通指标

微博舆情流通指标反映了微博舆情信息在扩散速度上的特性。由于微博自身的传播方式确定,舆情传播效果主要与微博自身的影响力及微博平台的推荐度有关,并可通过微博排名、微博推荐、博文点击频度和博文点击率反映出来[2]。

微博排名指数指微博在微博系统中的排名,反映其影响力。

博文推荐度是舆情博文在微博平台中被推荐的程度。微博平台会定期整合热门、重点信息后统一加以推荐,吸引更多的微博客浏览自己的平台,微博平台推荐的力度在一定程度上对舆情大范围的扩散传播起到重要影响。

博文的点击率是微博用户点击该博文的次数占总点击的比例。假定当前时间该博文的点击量是r,总点击为R,则博文点击率ω=r/R。

博文点击频度是博文点击率在某时间段变化的快慢,主要反映其扩散程度。假定在时刻t1博文的点击率是r1,总点击为R1,在时刻t2博文的点击量是r2,总点击为R2,则博文点击频度为:

2.2 微博舆情要素指标

微博舆情要素指标反映了舆情本身扩散的影响,主要从两方面来考虑:一是人(微博客),一是物(舆情博文)。其中微博指微博所有者的相关舆情信息影响力指标,包括号召力、粉丝人数、历史发帖数、历史转载数以及历史评论数[3]。

博主的号召力大多与博主的现实身份和虚拟身份有关,若博主在现实中是某个领域的名人学者,或者是虚拟网络中的标志性人物,都会在很大程度上提高舆情的传播效果;粉丝的比例是该博客的粉丝人数在全部博客用户所占的百分比,所体现的是博客的人气;历史发帖率是博主已发的博文条数占全部博文的百分比;历史转载率是该博客中博文被转发的次数占全部博文数量的百分比;历史评论率是其他用户对博客中的博文的评论条数占全部评论条数的百分比,历史转载率与历史评论率共同反映出其他用户对该博客的共鸣度。

舆情内容指标反映了舆情的敏感程度、自身的危害程度以及受关注的程度。

舆情的敏感度由预设的敏感关键词和信息点的热度的变化两个因素决定,可以采用不变的静态指标和可变的动态指标来进行评价。静态指标是指社会民众在很长时期中普遍关注的中介性社会事项,如:公共教育、公共医疗、社会就业、权力腐败等主题。动态指标则体现了舆情的时效性和突发性,是在某一时间段内社会民众较高关注的中介性社会事项,如:伦敦奥运会、2012欧洲杯、黄岩岛等。动态指标有着其一定的时效性和突发性,可通过网络热点的自动更新机制来获取。

舆情的危害度指通过舆情挖掘技术挖掘出舆情内容的褒贬义词并智能分析,按照一定的标准得出一个数值来表示其危害程度的大小。具体标准设计时,可以根据国家管理者对其关注的舆情内容的重要程度判断,对其赋予不同的权重。

舆情的关注度指的是当前舆情在博客中被转载的次数占全部博文的比例。

2.3 舆情的受体指标

舆情的受体指标反映了受众所处的地域信息,以及对舆情的共鸣度和回应态度,主要包括区域分布度、受众响应度、参与频度和负面响应指数。

区域分布度指的是受众的地理范围和密集程度,通过对博客受众的IP地址、手机号码归属地进行追踪得到归属地信息,按照归属地信息分类后得到该归属地的微博用户数量除以微博用户的总数量即可得到。通过区域分布度,可以知道该区域的稳定程度,若一个地区的不稳定程度越高,越容易激发受众的负面情绪,从而导致一些不稳定的社会情况发生。

受众响应度反映的舆情在用户中产生共鸣的程度,可由对当前博客条文发表评论的人数除上浏览当前博文人数的比例。

参与频度指的是某用户阅读、转载或评论舆情的次数,该指标可用做监测网络中刻意制造事端的网民。

负面响应指数反应舆情在受众中产生的负面影响的程度,用负面评论条数占全部评论条数的比例作为参考。

在上面微博舆情监测指标的具体计算方法基础上,如何确定各个指标的权重?可先对各指标进行问卷调查,然后交予专家反复的论证,专家们对各个指标的重要程度进行打分,对最终的分数进行加权平均,得到最终的权重值。

根据权重值,设定微博舆情的监测等级为5级,危险程度由1级到5级逐级加强。根据微博舆情综合分值大小确定其对应的区间,得出舆情监测的级别,并适时动态地作出预警,为决策者提供决策支持。

3 结束语

目前,尚未有关于微博舆情的监测指标体系出现。本文在分析微博中信息传播机制的基础上,尝试提出了微博舆情监测指标体系,该体系很好地结合了微博自身的特性,并给出了指标的量化计算方法,针对性强,实用性高。不但考虑了微博主体、舆情信息自身的影响力,还充分考虑了舆情受众的能动性作用。针对微博的信息传播机制,区分了“强关系用户”和“弱关系用户”对舆情传播的贡献;对舆情受众指标进行了详细的区分,区域稳定度能更好地客观地预测舆情作用的效果,通过参与频度能够及时发现刻意制造事端的网民。

博文点击频度指标,可及时反映出信息聚集的快慢,另外还将区域稳定度作为三级指标,一方面更加符合微博舆情的三维空间关系。区域本身是舆情受众所在的区域,从隶属关系上区域稳定度应从属于舆情受众这个二级指标,受众的指标,未能体现舆情受众对舆情的能动作用,而微博本身就具有双向传播的特征,因而其本身就不适用于微博中的舆情监测。

微博舆情监测指标体系给出了舆情指标的量化计算方法,但由于缺少大量的科学统计数据,如何对其进行实际验证还需要进一步的研究。因此本文的下一步工作重点是在搜集大量有效的微博相关数据基础上,将指标体系应用到微博舆情的实时预警中,从而根据验证效果对其不断地改进和完善。

参考文献

[1]戴媛,郝晓伟,郭岩,余智华.基于多级模糊综合评判的网络舆情安全评估模型研究[J].信息网络安全,2010,(05):60-62.

[2]高承实,荣星,陈越.微博舆情监测指标体系研究[J].情报杂志,2011,30(09):66-70.

微博舆情篇7

国内已有一些舆情指标体系的研究, 这些研究多数建立在舆情分析和网络安全的基础上, 国内外已有一些相关的研究工作, 如基于网络性能度量指标[1], 社会学角度计量社会稳定指标体系[2]等。还有一些系统开发工作, 如:中国传媒大学网络舆情研究所的IRI网络舆情指数和Imonitor舆情系统, 中科院计算所的网络安全舆情指数和天玑监测系统, TRS公司的网络舆情指标体系和网络舆情监控解决方案以及skeye舆情监控系统。

前人的研究[3]一般针对常规社会化媒体来构建舆情指标体系, 然而微博在传播机制、聚合力、影响力等特点与传统社会化媒体有很大的不同, 常规的舆情指标体系和监测工具已不完全适用。因此, 文章针对微博的特点, 提出了专门的微博舆情监测指标体系, 基于该体系实现了微博监控与分析系统, 并通过“A自动化世界活动”实例分析, 验证该指标体系和系统的有效性。

2 微博舆情监测指标体系构建

微博用户及传播的信息具有自由化、隐蔽化、发散化、复杂化等特点, 微博舆情指标的选取要有相对稳定性或具有自动更新机制, 能够在时间上延续和空间上扩展, 从而用于衡量话题/事件的舆情态势进行有效的引导。其定义如下:

定义1:MBPOI={Quantity Index (QI) , Intensity Index (II) , Relation Index (RI) , Polarity Index (PI) , Confidence Index (CI) }

其中QI表示量度指标, II表示强度指标, RI表示关联指标, PI表示情感倾向指标, CI信度指标。

2.1 量度

量度体现了总体演化趋势, 事件持续、舆情参与度等宏观方面的度量。

量度将加入分类模型, 对话题相关信息更有效的过滤, 增加量度的准确度;同时, 引入聚类模型, 有效的发现领域相关热点话题, 提炼关联话题。

2.2 强度

强度体现了舆情热点和行为活跃性分布、涉及话题/事件的重要程度、兴趣热点等方面的度量。

分析的数据来源是将整体数据集中进行过滤、归类获得。强度可以对话题/事件相关博主影响力进行计算, 以确定话题意见领袖;同时, 话题/事件一般有产生、热议、消减的周期, 强度计算将话题周期也纳入计算范围, 进行及时预警。

2.3 关联度

关联度体现了波及的传播关联网络、层次维度, 涉及话题/事件的覆盖面、影响力等方面的度量。

分析来源于整体数据中抽取的用户粉丝和关注信息。关联度可以在网络图中, 增加话题相关博主重要性, 关联紧密度的分析, 并以节点的大小, 弧的粗细来可视化展示。同时, 可将话题相关微博在博主中转博的路径进行勾勒, 以便捷的进行溯源和追踪。

2.4 情感度

情感度体现了情绪倾向和社会状态, 涉及关注、社会心理、和谐等方面的度量。

分析数据来源于话题相关博文和用户发布的博文的评论内容, 文章采取基于How Net1的词粒度语义倾向性分析方法, 建立具有强烈褒贬倾向的词典, 在设定种子情感词后, 使用How Net计算相似度。根据博文中情感词语与词典中词语的语义倾向相似度来判断博文内容和评论的支持度分布。

2.5 信任度

信任度体现了权威性和可信度, 涉及话题/事件的准确、真实、有用性等方面的度量。

信任度的数据来源为话题相关的某一条博文内容发布用户发布站点的相关属性数据。以上属性建立影响力模型, 基于模型判断某条博文的可信度。信任度将建立不同细分领域的影响力模型, 并结合领域专家知识不断调整模型, 以达到对信息可信度的有效判断。

3 微博客实时监控分析系统

在微博舆情指标体系的基础上, 文章实现了微博客实时监控分析分布式系统, server负责分配站点、调度URL、抽取与分析任务分配等以实现采集分析系统的负载均衡, client端实现其具体监控与分析功能, 图2为系统client的模块设计, 由微博用户登陆模块、采集模块、抽取模块、中文信息处理模块、分析模块组成。

文章采集时使用Http Client2和Heritrix3开源工具, 将网页下载的同时以ARC文件形式保存到本地, 本地ARC文件作为备份, 用于系统评测。信息抽取模块采用x Path定位html网页中所需的内容, 对html树进行进行抽取, 实现对各个站点以可配置的形式对微博内容定向抽取有价值信息, 使用了JS异步加载模式, 无法直接获得, 文章实现了Json插件用于处理动态页面内容。

分析模块以微博舆情指标体系为理论, 在中文信息处理处理模块的基础上进行, 中文信息处理模块包括分词、名词短语识别、共指消解、语义相似度计算[9]等, 使用哈工大自然语言处理工具进行内容识别与预处理, 识别内容将作为指标体系分析五种方法的数据输入, 由各分析算法进行处理, 具体处理方法在第2节已做详细介绍。

4 微博舆情指标体系实例分析

根据用户单位的具体微博活动主题监测的需求, 选取A公司自动化活动为主题做实例研究。A公司在新浪设有官方微博, 本次实验在微博监测分析指标数据选取时, 选取新浪微博数据作为量度、情感度、关联度的分析源, 强度的数据源则有主流的11个微博网站构成, 网站列表在图5中有所展示。

本次实验收集2011年3月1日至2011年8月2日时间段内11个微博网站的话题相关数据, 其中, 在新浪微博中A公司自动化相关的微博和A公司自动化世界官方发布的微博数据量, 如图3所示。

4.1 量度分析结果

量度分析相关话题发布内容的总量, 量度分析结果如图4所示, A公司自动化世界3月入驻的新浪微博, 评论数值在3月下旬比转发和微博量高出很多, 5月上旬量度达到顶峰, 相关的微博和评论出现了井喷的异常现象, 随后量度值降低。通过查阅采集数据不难发现这是由于5月10-12日有A公司自动化世界活动, 相关博主纷纷发布展会参会心得体验, 公司官方博主也加强与粉丝的互动;6月下旬的评论和转发量度升高幅度较大, 通过分析发现这段时间A公司自动化世界发布了一些用户感兴趣的工厂照片并发起了一个有奖投票, 增加互动获得较多的转发和评论。

该指标为企业微博营销管理措施提供了有效的实时跟踪和效果反馈功能。

4.2 强度分析结果

强度分析话题各个微博站点中出现的强度分布, 图5为截止到2011年8月2日所有监控站点微博相关信息量。统计图表明A公司自动化世界活动话题强度分布, 有效话题统计依次为新浪微博、腾讯微博和搜狐微博, 百度i贴吧虽然信息量较多, 但以水贴为主, 去噪后有效信息较少。同时部分站点话题强度基本为零, 如同学网、做啥、嘀咕等。

该分析结果可以为A公司自动化世界活动下一步官方参与互动, 设置官方微博的站点提供有效的支持。

4.3 情感度分析结果

情感度分析话题中的大众博文中体现的总体舆情倾向, 图6可看出5月份自动化世界活动期间中立情感度值更高, 用户对A公司自动化活动多是客观的描述, 包括各界媒体的报道、活动的通知以及活动情况的互相转述等信息。其次用户是正面评价居多反映出此次活动的新引力, 以及对A公司自动化世界的认可, 如“大爱自动化世界”, “太专业了, 希望有一套”等信息。同时包括极少量的负面信息, 如“为什么没有我, 恨死了”等信息。

该分析结果可以直接为自动化世界提供清晰的整理出意见和建议, 并及时解决负面话题进行危机公关。

4.4 关联度分析结果

关联度分析构建出话题相关博主的社会化网络关联, 分析其核心任务和核心群体。分析结果可以清晰的分析出话题相关的意见领袖和核心群体, 便于公司自动化世界活动对此类用户增加公关互动, 使得营销策略得意迅速推广。

5 结束语

文章提出的微博舆情监测指标体系, 与其他传统舆情指标体系相比, 微博舆情监测指标体系融合了多层面和多粒度指标, 各项熵值指标相互融合又相对独立, 共同标识事件、活动、话题的微博舆情态势。同时, 在该体系的基础上实现微博监控分析系统, 系统智能的采集微博数据并自动分析统计指标结果。最后以A公司自动化世界为实例初步验证该舆情指标体系的有效性和可行性。

下一步, 指标体系将融合社会学、传播学的领域专家构建模型支持, 精细化舆情指标的计算方法, 并融入微博监测与分析系统, 更好的为个人、企业、国家提供全方位把握微博舆情的分析指标与系统支持。

参考文献

[1]Salim Hariri, Qu Guangzhi, Tushneem Dharmagadda, et al.Impact analysis offaults and attacks in large-scale networks.IEEE Security&Privacy.2003, 1 (5) :49-54.

[2]阎耀军.社会稳定的计量及预警预控管理系统的构建[J].社会学研究, 2004 (3) :54-60.

[3]Kanagasabi Rajaraman, Ah-Hwee Tan.Topic Detection, Tracking, and Trend Analysis Using Self-Organizing Neural Networks.Lecture Notes in Computer Science, 2001 (LANI2035) :102-107.

[4]http://rp-www.cs.usyd.edu.au/~aquigley/3dfade.

[5]S.A.Golder, D.Willkinson, B.A.Huberman.Rhythms of Social Interaction:Messaging within a Massive Online Network[J].3rd International Conference on Communities and Technologies, 2010, 10 (6) :583~593.

微博舆情篇8

关键词：微博舆情分析,领域文法,文法设计,反贪腐领域

0 引言

随着网络技术的迅猛发展,网络舆情以舆论多元化为最大的特点,而网络舆情信息的丰富程度呈现“爆炸”的趋势。造成这个现象的主要原因一是网络舆情信息量非常庞大;二是舆情的类别繁多;三是背景信息复杂[1,2]。

如今,微博已经成为最流行的社交工具之一,它变成人们实时了解社会与获取新闻的流行形式。而微博的起源是国外的Twitter[3],它的主要功能是实现即时的分享。随着微博的产生,一些隐蔽的、不为人知的消息变得透明化[4]。如果可以有效地分析微博、博客以及论坛等内容,不仅对及时掌握百姓的舆情具有重要的意义,而且对国家安全、政府官员行为、企业产品声誉、个人形象等信息的及时掌握具有重要作用[5]。

目前,舆情分析的主要研究方法都是依靠关键字进行测试验证,然而这种方法的准确率较低[6]。为了提高对舆情文本内容分析的准确率,提出领域文法设计这一思想。该方法的主要目标是对文本内容进行文法分析,建立形式文法到语义的一个映射,利用语义文法将无结构的网络舆情文本转化成结构化的网络舆情语义表示[7,8]。

一般而言,常用的自然语言处理方法主要分为词法分析、文法分析和语义分析等。其中,文法分析的主要工作是跟据语料总结文法以及它们之间的相互关系来产生一个文法库。上下文无关文法CFG(Context Free Grammar)是被看作接近自然语言的表示形式。为了解决文法的歧义问题,有人还提出了概率上下文无关文法和概率词汇化上下文无关文法等方法[9,10,11]。

虽然上下文无关文法有很强的表达能力,但是一般文法的编写结构是混乱的,文法之间也没有联系,缺乏语义理解的信息。因此,我们引入“领域文法”的概念。领域文法与候圣峦提出的语义文法[12]类似,但是不同的是,领域文法强调某领域的文法,即在文法中加入领域的语义信息,可以给出文本中丰富的领域语义结构,得到丰富的领域信息。

领域文法与普通的文法相比有自己的特点,主要特点包括:

(1)领域文法的建立一定适合某个具体的领域

就像上述介绍的领域文法一样,领域文法中包含特定的领域语义信息。因为不同的领域有自己的领域特点,语句中也会有适合自己的特点,因此对于不同领域建立特定的领域文法,可以突出各个领域的特点。

(2)领域文法的建立是结合本体的思想,设计过程中突出该领域的语义,并且用非终结符表示出来

本体是人工智能领域提出的思想,是用来研究特定领域内的知识的对象分类、对象属性及对象间关系,它为领域知识提供描述术语。一个领域本体对该领域进行了一个清晰的、可共享的刻画,保持了语义上的一致[13]。一般文法的建立,通常采用的方法是巴科斯范式BNF[14,15]。我们在BNF中融入语义,与本体相结合。这是通过非终结符来体现的,即在非终结符命名中加入语义信息。

(3)文法设计过程中,按照领域进行文法设计任务分解

领域文法中领域语义与本体相结合,还可以按照领域对文法设计的任务进行分解。也就是对文法进行领域分析,对整个领域的特点和内容进行描述和划分。

本文提到的基于领域文法的分析方式相较于统计的方法主要的优点和创新点包括:

(1)当关键信息以及相关信息数据稀疏的情况下,领域文法的方式依然可以很好地监测到,但是统计的方式却因为数据稀疏丢掉重要内容。

(2)领域文法的方式不需要对信息进行统计,这样就可以避免相关信息内容因为距离太远而不能找到的情况,同时领域文法可以更好地精确查找信息。

(3)从搭配的角度来看,有些词汇之间只有搭配起来使用才会起到一定的作用和意义,统计的方法会受到无用冗余信息的影响,而领域文法的方法可以很好地提取真正有用的信息。

但基于领域文法的方式也存在相应的弱点:

(1)领域文法并不是万能的和开放的,只是针对一个具体领域。

(2)正是因为第一条,因此领域文法并不能解决所有领域的大规模数据,但是却可以通过并行解析,实行一个领域中的大规模数据分析。

(3)由于是针对特定领域的(包括电子产品或是有行情等都进行过尝试和运用),如果出现缺少文法的情况会影响分析率。因此我们正在研究文法的自动学习算法,重点是对已经形成的种子的文法而自动产生新的文法。

在反贪腐领域的文法,在舆情分析中的主要作用是抓住舆情的苗头,而不受到关注度以及转发度、评论以及是否热门的影响,从而达到最快抓住苗头的目标。

1 领域文法的设计原则

在文法设计的过程中,为了使文法更容易维护更健壮,且文法之间不会出现重叠,我们总结出以下文法设计原则。遵守以下原则,可以更容易地进行文法设计工作。我们中间以贪腐主题语料的文法设计为例来解释说明每条原则。

1.1 语料采集原则

在文法设计之前,为了使文法有更好准确率和覆盖面,语料的准备和采集变得至关重要,因此在前期语料准备工作中我们应该遵守和参考以下原则:

①语料采样、覆盖面要足够广。

在查找语料时,要选择尽量涉及不同类别内容的语料;语句也尽量涉及更多不同类型、不同结构。只有语料的选择面、采样面广,才能使得文法的涉及面更广,对领域分析带来帮助。

②语料要选择对文法有意义的语句,要选择符合要求内容的语句。

选择对自己设计的文法有意义的语料,选择符合领域且对目的有帮助的语句。文法的筛选过程就是参照该原则。

1.2 顶层设计原则

在语料准备完成以后进入语句文法设计之前,首先要进行一个顶层的设计。该设计就是建立语法树根基,只有根基建立得稳定才会使整个语法树更加健壮、稳定,也更容易维护。该过程我们应遵守以下原则:

①顶层设计要方便维护。

对于整个大的知识系统来说,必不可少要面对维护的问题,因此在设计顶层的时候一定要方便以后的维护。我们采用的方式是将结构自顶向下进行层层分类,以后维护时只维护某一层的某一项即可。

例如:在贪腐领域的应用中,当出现一个语句不属于某一类时,可以直接将一个形成一个新类进行提升。当要修改其中一个类别的内容以及语句文法时,也不用顾忌其他的语句文法和类别。这样对于维护来说,变得更加容易省时。

②顶层设计的各类之间不要有重叠。

对于某一层的各类之间不要出现语句的重叠,这样会使得整个顶层看起来干净清晰。

例如:“<指名道姓腐败描述语句_不明房产>”和“<指名道姓腐败描述语句_买卖官职>”下面的文法语句中,不会出现重复的内容,分类清晰明了。这样不仅使得整个文法结构分明还可以帮助我们更加方便查看和修改。

③语法树的结构越清晰越好。

设计的文法最终会转化成一棵语法树,因此顶层设计的好坏决定了该语法树的结构。语法树的结构越清晰越好,因此顶层设计的结构和类之间越清晰越好。

1.3 语句文法设计原则

顶层设计后是对语句进行文法编写,在文法设计的过程中,我们要不断地修改顶层设计以及非终结符设计从而适应语料、语句增多的变化。在文法设计过程中,要遵照一定的原则,才会使得每个语句文法准确、简单以及涵盖面广等。

①文法编写要采用正规的BNF语法。

该原则是文法编写的主要以及首要原则,所有的语句编写文法时必须采用正规的BNF语法。

②编写文法的语句划分,主要采用“,”进行断句。

在文法设计时,语料中编写文法的语句以“,”为一句,对于每一句有用的语句都要进行文法编写。

③当一个句子的同一位置可以由两个非终结字符的选择时,我们可以选择将两个终结符合并或者写成两个语句。

在文法编写时出现同一个语法结构和句型,某一个非终结符换成另一个非终结符依然成立。这时处理办法主要有两种:一是将可以替换的非终结符进行合并,二是形成多个文法语句。对于两种方法的选择,要考虑非终结符是否可以合并,以及多个文法语句是否累赘等因素。

例如:文法“<指名道姓贪腐主语>[<任职期间>]<无视><法律法规>”和文法“<指名道姓贪腐主语>[<任职期间>]<无视><党纪词连用>”两者之前句型类似,但这里我们选择写成两句,因为两者在语义上理解不适合合并。

④文法设计过程中要时刻注意保证文法的可读性。

文法的可读性是指编写的文法可以很容易看出中心思想、相应的句子结构以及所属的类型。对于贪腐领域文法来说,文法应该可以一眼就看出是跟贪污腐败相关。

例如:对于语句“XX省药监局长黄某坐拥84套房产”,我们设计的文法为“<指名道姓贪腐主语><含有词><房产数量词><房产词连用>”,很容易看出来文法很好地反映了语句是关于有过多非法房产的贪污腐败语句。这样设计的文法可读性很强,也很容易他人和自己理解。

⑤当某些语句本身并不与主题相关,但是却是辅助和说明语句,这时我们也要将该句也编写成文法。

当一个语句要与前面或后面连起来才会反应出主题,这时我们也要将其用文法编写出,因为只有这样才是一个完整的语句,才可以反映出中心思想。

例如:语句“通过各种非法途径,获取住宅楼房和沿街商品房共70套”,前半句单独使用时,不符合语法也不能反映出贪污腐败的事实,而“,”设置成可省。最后形成的语句文法是“[<指名道姓贪腐主语>][<其>][<本人>]<通过>[<各种>]<非法><方法>[<间隔标点>]<获取><房产>[<共>]<房产数量词>”。

⑥文法非终结符的可选要注意可选后语句是否通顺,是否符合文法的主题和中心思想,一般修饰性的、做状语的等非终结符都是可以省略的。

为了扩展文法,最简单的方法就是对非终结符进行可选的操作,判断一个非终结符是否可以可选,主要遵从以下原则:首先要看不加该非终结符以后,整个文法语句是否通顺是否符合我们的语法要求;然后判断省略该非终结符后的文法是否还符合整体主题;最后则是判断省略该非终结符后的文法是否还符合之前所属分类,如果属于则不用修改,若不属于,则要将省略后的文法放置本该属于的类中。

例如:文法“<看来><指名道姓贪腐主语><先后><收受><人称代词><的><价值数量词><好处费>”中,可以很明显地看出非终结符“<看来>”、“<先后>”、“<人称代词>”以及“<的>”、“<价值数量词>”都是可以省略的。通过上述的分析我们得到最后的文法为“[<看来>][<指名道姓贪腐主语>][<先后>]<收受>[<人称代词>][<的>][<价值数量词>]<好处费>”。

⑦设置非终结符可选时要注意文法没有主语的情况。

虽然规则6中已经给出了文法中非终结符可选的原则,但是当非终结符为主语时,在考虑是否可选时,要注意文法缺少主语时是否文法所表达的意义符合中心思想,且不会匹配到其他无关的语句。

例如:文法“<指名道姓贪腐主语><玩弄包养>[<多个>]<女受害者>”中的非终结符“<指名道姓贪腐主语>”在句中做主语,而如果将该主语设置为可选,文法“<玩弄包养>[<多个>]<女受害者>”却不只是可以匹配官员贪污腐败的情况,还可以匹配其他商人等一些其他方面内容,因此该主语就不能设置成为可选。

⑧文法编写时,要适当的对文法进行扩充。

文法扩充主要包括两个方法。一是改变文法的结构从而形成一个新的文法;二则是根据一个文法进行联想,可以是对同一个语意的不同说法,也可以是同一种结构的不同语意。

例如:文法“<指名道姓贪腐主语><长期><以来><贪污受贿成语连用>”可以联想到将非终结符“<贪污受贿成语连用>”换成“<贪污受贿短语>”,也符合要求的文法,因此产生了一个新的文法“<指名道姓贪腐主语><长期><以来><贪污受贿短语>”。

1.4 非终结符设计原则

在整个文法设计中另外一个重要的部分就是非终结符的设计。在文法语句设计进行过程中,要同时对非终结符进行设计,非终结符设计的好坏也对文法设计的质量有影响。为了更好地进行非终结符设计,我们要遵守以下几条原则:

①非终结字符的名字定义,要符合终结字符的共同表达,能够反映终结字符的含义,并可以看出文法的中心思想。

例如:非终结符“<程度副词>”可以看出它定义的终结符是表示程度的,还可以看出在句子中是作为副词使用的。

②对于非终结字符来说,为了更好地维护和更准确地表示其含义,有时要对非终结符继续进行细分。

例如:非终结符“<政府管理部门>”这个非终结字符,包含的范围很广,因此按照不同的级别进行划分,得到的非终结符为“<国家政府管理部门>”、“<省政府管理部门>”等。这样可以很好地维护非终结符,也使他们的定义更加准确单一。

③根据句法的应用,有时要对非终结字符进行合并。

例如:文法“<指名道姓贪腐主语><娶有><人数数量词><妻>”中非终结符“<娶有>”可以换成“<含有词>”,合并两者,文法就变得简单并容易维护。

④当表示两个非终结符的终结字符出现交叉的时候,对这两个非终结字符要进行合并。

在设计非终结符使,如果出现两个非终结符定义的终结符有重叠,这时要考虑这两个非终结符是否可以合并。

例如:非终结符“<女受害者>”和“<有夫之妇>”,定义时出现了重叠,这时将两者合并形成一个非终结符“<女受害者>”。这样文法就减少了冗余。

⑤在合并非终结符时,我们要考虑是否可以合并。

验证是否可以合并最好的方法是在出现一个非终结符的句子中替换成另一个非终结符,若句子是通顺的,相反亦然时就可以将两个非终结符合并。

例如:非终结符“<贩卖>”和“<出让>”两者都有卖的意思,在“XX贩卖土地谋取私利”可以替换,但是“XX贩卖官职”这时并不能将“贩卖”替换为“出让”,这样做可保证文法的准确性。

⑥当多个非终结符经常成组出现,考虑合并抽象成更高层的非终结符,这样可以简化文法增加文法的可维护性。

例如:非终结符“<利用>”和“<职权>”在句子中经常一起出现,这时可以将两者组合形成高一层的非终结符“<利用职权>”,采用这种方式可以使文法更加简洁且更方便维护。

2 领域文法的设计过程

本文主要采用领域文法分析的方式对微博进行舆情分析,而为了得到的结果更加准确以及文法的涉及面够广,领域文法设计的过程变得非常重要。

对贪污腐败语料分析可以起到对政府官员们监督和督促的作用,减少现当今官员贪污腐败、不受信赖的现状。本节主要以领域文法设计在贪污腐败语料的应用来说明文法设计的主要过程。

2.1 领域分析

领域分析主要是根据本体的思想理念,结合领域自身的特点来对整个领域文法从语义方面进行划分和刻画。我们可以通过观察语料对语句进行分析,将贪腐舆情领域划分不同的类,而划分的标准则是使类与类之间可以很好的区别开,结果可以很明显看出属于贪腐舆情的范围。

首先,我们可以大致对类进行划分,然后根据语料进行修改和扩展。本文通过语句的语义,按照贪腐的不同表现对整个贪腐舆情领域进行划分。划分的类的结果如图1所示。

2.2 语料准备

在领域文法设计之前,我们要做好准备工作,而准备工作当中最重要的则是对语料的准备。

对于语料的查找,可以先根据初步的领域分析,来进行语料的查找,并在语料的过程中对领域分析进行修改,并对新产生的类进行语料的查找,如此循环进行,完成语料的准备工作和领域分析的工作。语料查找方式有很多,使用微博的语料主要采用的准备方法有以下两种:

(1)关键字搜索,并搭配复杂的搜索

直接通过关键字的查找对微博进行搜索,并可以采用多个关键字的复杂形式;关键字主要是与贪腐相关的字眼。

(2)关注用户,从而获取用户发布的相关内容

因为当前微博的用户很多是以机构、单位以及团体等形式的用户,我们可以根据要搜索的语料类型来对相应的用户搜索,再对该用户发布的帖子进行查看,再筛选出相应的语料。

因为关键字的查询,准确率并不高,这时需要对语料进行筛选。首先要选择真正属于贪腐的语料,其次在筛选语料时,只选择原创性和第一次爆料的。因为只有第一次爆料原创性的语料,才会帮助有关部门得到第一手消息对相关人员进行调查。

2.3 领域文法设计

完成语料准备工作以后,进入领域文法设计阶段。该步骤中,主要是对标注的语句进行分析和文法总结。整个文法设计过程中,我们不仅是对句子进行文法设计,还包括其他方面的设计。其过程如下:

2.3.1 顶层设计

顶层设计主要在顶层设计原则的指导下针对各个语句文法的上层进行设计。因此在具体语句文法设计之前,要先对顶层进行设计,同时为了形成一个更好维护的分析树,顶层设计也要具有层次性。从根到语句文法设计成层次清楚、结构鲜明的形式。

对于贪污腐败文法的顶层设计,我们首先考虑根的设计。既然我们主要工作是对贪污腐败的描述进行文法设计,因此我们的根就可以设计成<贪腐描述语句>,下面则是对语句进行细分。为了更好地维护和扩展,要保证每类文法的区分度要大,并且可以很好地表现该类文法的特点。之前领域分析的结果可以很好地满足需求,因此对于类的划分可以采用参考领域分析的结果。处理语句的过程中,发现了有些句子是没有主语的,因此在划分类之前先对有无主语进行划分,划分为<指名道姓贪腐描述语句>和<非指名道姓贪腐描述语句>;然后则是根据其贪污腐败内容也就是领域分析的结果进行分类,最后我们得到的顶层如图2所示。

2.3.2 语句文法设计

在完成顶层设计以后,开始进行语句的文法设计。对语句进行文法设计时,要遵照语句文法设计原则进行领域文法的编写。

根据每一个语句中的词语或词组来设置非终结符,而文法语句就是靠非终结符的连接形成。非终结符的定义可以是终结符、非终结符以及终结符和非终结符的组合。

例如:语句“XX省委罗某昏官!”写成的简单文法为“<省><官职><官员名字><昏官>”。

2.3.3 非终结符设计

当语句文法完成,要根据非终结符设计原则进行非终结符设计。非终结符设计要对终结符进行联想,联想出意思相近或是符合语句的其他词语,一些情况下还要考虑将非终结符进行合并。

例如:如非终结符“<国外目的地>”可以联想到的类似词语有“海外”、“境外”、“国外”等,但是除了这些统称词语以外,当语句文法中该位置换成某个国家的名称,语句也符合。因此“<国外目的地>”最后定义为“<国外目的地>::=海外|境外|国外|外国|<具体国家名称>”

2.4 领域文法修改、合并以及扩充

领域文法设计完成以后,随着文法语句的增多,要在语句文法设计原则的指导下对文法进行修改合并或扩充。进行文法的修改和合并,主要是检查是否存在类似的文法,是否存在不通顺的文法,是否存在不准确的语句文法。文法的扩充则是为了使文法的涵盖面更广通过改变说法、改变句型结构以及联想等方式来增加文法。

2.4.1 文法修改

文法的修改,针对的问题是文法中可选的非终结符导致句子成分残缺而不成句子或文法语句的结构等不符合我们的习惯,以及文法并不能体现出语句意义的情况。而改进的方法主要是改变文法语法结构、直接删除或修改非终结符。

例如:文法“[<指名道姓贪腐主语>][<的>]<财产>[<全都词>]<转移>[<到>][<国外目的地>]”该语句的主语为“<财产>”可以匹配出不是贪污腐败的语句,因此在“<财产>”前加入“<非法>”的非终结符。

2.4.2 文法合并

文法合并针对的问题包括两个文法之间类似或一个文法包含另一个文法的情况。这时改进方法是合并文法并改变非终结符的定义,同时适当地对非终结符进行合并;或者对非终结符进行可选设置,从而使得长句子通过可选方式从而形成包含的短句子。

例如:文法“[<指名道姓贪腐主语>][<自己>][<在某地>]<当官><贪污>”和文法“[<指名道姓贪腐主语>][<自己>][<在某地>]<当官><受贿>”,我们可以看到两句文法类似,这时我们将“<贪污>”“<受贿>”进行合并形成新的非终结符“<贪污受贿>”,最后形成一句文法“[<指名道姓贪腐主语>][<自己>][<在某地>]<当官><贪污受贿>”,新形成的文法更容易维护且文法涵盖面更广。

2.4.3 文法扩充

虽然完成现有语料的所有语句文法,但是不能保证总结的文法涵盖所有的语句,特别是语法结构不同,就会变成不同的语句,所以我们要通过改变语法结构或者联想来扩充文法。

例如:文法“[<原>]<指名道姓贪腐主语><人数数量词><含有词><房产数量词><房产词连用>”中非终结符“<房产数量词>”和“<房产词连用>”交换位置依然成立。因此产生一个新的文法“[<原>]<指名道姓贪腐主语><人数数量词><含有词><房产词连用><房产数量词>”。

3 实验

为了验证上述提出的文法设计方法和原则的有效性,本文将上述方法应用到贪污腐败主题的舆情分析中,并采用LL(1)分析方法进行实验[8]。我们从新浪微博中下载了涉及贪腐的语料,对系统进行了初步的测试。

3.1 文法分析器设计

本文选择通用的分析器,可以从外界导入文法,建立推导、分析树等。该文法分析器的设计和实现主要参考了一个开源语法分析器,并在此基础上进行了补充和完善。完善了语句推导过程和文法树建立过程,补充添加了语句推导导出功能和文法树保存输出功能。

文法分析器是一个分析文法并验证某一个语句是否符合该文法的系统,

整个文法分析器的主要流程包括以下三个步骤:

(1)导入文法。该系统采用从外界导入文法的形式,用户将文法写入一个txt中,然后选择导入文法功能,将文法导入。

(2)语句推导。在完成了文法导入操作以后,只要选择创建推导功能,输入要判断的语句进行推导;推导完成后可以选择查看推导功能,这时系统将显示推导过程。

(3)分析树建立。在完成语句推导之后,可以选择建立分析树来更形象的观察语句的推导过程,还能根据需要将分析树进行输出。

根据主要步骤得到的流程如图3所示。

3.2 文法验证

3.2.1 实验

依照上述描述的过程,使用LL(1)文法分析器,根据语料完成的文法数量为526条,共分为38类。语料的主要来源于新浪微博,所有语料准备为重点贪腐语以及首发语句,处理后分成句子223条,其中随机挑出了100条语料进行文法编写,所有的223条语料在分析器上进行了运行。下面以几条例句为例来进行结果的演示:

(1)“XX市国税局局长任职期间含有三辆豪华高级轿车”

该语句属于生活腐败类中,使用文法分析器根据领域文法得到的文法推导过程如图4所示。

根据推导可以分析得到一棵完整的例句的文法分析树,分析树可以很清晰地看出例句到文法的对应关系,得到的文法分析树如图5所示。

(2)“XX市武装部部长买支书给妻子当”

该语句属于买卖官职类,使用文法分析器得到的结果会与上述过程一致,而最终的结果得到的文法树如图6所示。

(3)“村干部周某任职我们村主任7年,期间利用职权便利,非法变卖霸占村委集体土地”

本语句表达的方面是关于贪腐关于非法抢占土地的问题,根据文法,可以分析得到一棵完整的例句的文法分析树。分析树可以很清晰地看出例句到文法的对应关系,得到的文法分析树如图7所示。

3.2.2 结果分析

采用以上几个典型的例句进行分析,可以很容易地看出我们方法的优越性和准确性。

以上的例句都很容易地可以看出属于贪腐语句。但如果只是单纯地采用关键字的搜索,例如一般搜索关键字“高级轿车”、“买官”等,会得到很多冗余的信息。因为同样的说法也可能试用于商业人士或一些明星等,这时为了得到想要的贪腐相关语句,就要对所有的语料进行查看筛选;而如果采用领域文法的形式,就可以很容易地直接得到贪腐的语句,并将一些无关的相似语句排除。另外如果为了准确率而输入多个关键字,限制就会更多,很多相关语句会被过滤掉;而采用领域文法的分析的方式,因为有非终结符可选的灵活使用,就可以对相关的内容很充分地晒选出来。对于微博来说,一些重要事件的暴露主要依靠网友的转发以及评论,当达到一定数目才会被发觉,而这些是需要时间的;如果采用领域文法的形式,那么再出现的时候就可以很容易地监测出来,实时性更好。

通过以上的分析,可以看出文法分析的优越性以及实时性,以及领域文法分析在舆情分析中的特色。

4 结语

为了解决语义舆情分析基于关键字准确率较低的问题,本文提出基于领域文法设计的方式,并详细总结和说明了领域文法设计过程和涉及到的原则。本文首先对文法和领域文法进行简单的介绍,为领域文法设计打下了技术基础。然后对领域文法设计进行了总结,总结了领域文法设计的原则和过程。

随后将领域文法设计的过程和原则在贪腐主题的网络舆情分析中进行应用,形成贪腐领域文法并进行实验,结果表明该方法对文本分析是有效的。而本研究总结的领域文法设计过程和原则对所有的领域文法设计通用,为基于语义的舆情监测系统的文法设计提供理论基础,有利于帮助相关工作合理地设计和编写领域文法,具有重要的理论意义和实用价值。

本文方法相较于统计的方法主要的优点和创新点包括:

(1)当关键信息数据稀疏的情况下,领域文法的方式依然可以很好地监测;

(2)领域文法的方式不需要对信息进行统计,可以避免相关信息内容因为距离太远而不能找到,同时可以更好地精确查找信息;

(3)领域文法的方法可以很好地提取真正有用的信息,避免统计方法的容易受到无用冗余信息的影响,因为有些词汇之间只有搭配起来使用才会起到一定的作用和意义。

微博舆情篇9

“2014年5月22日7时50分许, 乌鲁木齐市沙依巴克区公园北街早市发生一起爆炸案, 造成人员伤亡。截止5月22日13点19分, 该事件已造成31人死亡, 90余人受伤。”这无疑是5月22日当天最受人关注的新闻, 新疆的安全问题、民族问题再一次被推到风口浪尖。

新疆因其特殊的地理位置、人口构成以及历史原因, 多年来都是我国处理边疆工作和民族问题的重中之重。据《中国国家安全报告》的数据显示, 仅2013年, 我国境内一共发生大型暴恐事件十起, 全部与新疆问题有直接或间接的关系。2014年, 从3月1日昆明特大暴恐事件到4月30日乌鲁木齐火车站恐怖袭击案, 暴力袭击事件从疆内针对地方政府、警察局, 转而发展为针对疆外其他地区、平民。

5·22暴恐袭击出现以后, 新疆地区出现了不同以往的舆情导向, 部分新疆本地居民倾向高压的民族政策, 一些质疑我国民族政策的言论在社交平台上出现。新疆是一个多民族、多宗教、多种文化并存地区, 民族团结和社会稳定任务艰巨, 这样的舆论出现之后, 对新疆地方的稳定以及民族政策的推行都极为不利, [1]所以, 正当而有效的舆论分析和引导在此刻显得尤为重要。由此, 本文拟回答以下三个问题:

1“5·22暴恐案”前后, 新疆地区微博热议内容有何变化?

2“5·22暴恐案”前后, 新疆地区微博情绪分布有何变化?

3“5·22暴恐案”后, 新疆地区各种微博情绪分别集中于那些议题?

2 研究方法与步骤

2.1 抽样时段

根据事件爆发前后为期一周的百度指数显示, 新疆地区对于关键词“5·22”的搜索在5月22、23日达到峰值, 故笔者将事件发生前后40小时作为抽样时段。

2.2 样本选取

为了考察暴恐案对新疆本地舆情的影响, 笔者在新浪微博的高级搜索中输入“暴恐”为关键词, 在地点一栏中选择“新疆”, 以小时为单位进行搜索。以5月22日8时事件发生之时作为事件分界点, 在此时间点前、后分别得到样本6432条和17790条, 作为新疆地区爆恐事件前、后的舆论分析样本。

2.3 文本内容分析

文本的内容分析以词频统计和语义网分析为主。笔者分别将事件发生前后的文本样本分别导入ICTCLAS中进行词频分析, 删除结果中无意义的词, 如“和”、“的”, 再将因微博页面设置而被错误收录的词剔除, 按照词语出现的频率由高到低选取50个高频词予以保留, 同时将同一舆论场的高频词和全文本导入ROSTCM6生成语义网。

2.4 情感倾向性分析

文本的情感分析使用国家语言资源研究中心——有声媒体中心情感倾向性分析软件作为分析工具, 将微博样本以TXT格式导入情感倾向性分析软件, 并逐条进行情感分析。

3 研究结果

3.1 词频分析

为了回答问题1, 笔者对文本进行了词频分析, 通过统计相关核心词汇在“新疆”相关文本中所出现的频次, 判别该事件在舆论场中被关注的角度和理解态度, 词频分析可以确定“新疆”在网络上不同时段的若干特征。结果显示, “5·22暴恐”事件前后微博中与“新疆”相关文本的高频词有明显区别。通过对两组高频词之间重合度的对比, 可以发现二者之间的高频词重合度只有五个词, 占总数的20%。具体来看, 事件发生之前, 新疆地区微博舆论提及“新疆”时, 更多出现的是与旅游、美食、当地文化相关的名词以及部分正向形容词, 如“哈密”、“天山”、“摄影”、“馕”、“大盘鸡”、“幸福”等, 而“5·22暴恐”事件发生后, 舆论高频词几乎全部指向与恐怖袭击相关的内容, 如地点名词“文化宫”、“早市”、“沙依巴克区”、“北街公园”, 动词“搏斗”、“袭击”、“祈福”等, 以及负向形容词“恐怖”、“无辜”等。

3.2 语义网分析

从事件发生前后的高频词相似性比对结果可知, 两个时间段内, 大众对于新疆的讨论热点并不一致, 下面结合语义网分析比较舆论场中“新疆”网络传播中心性的特征。

语义网络分析可以描绘“新疆”的认知特征, 形象地呈现各个概念之间的联系。从图1中可以看出, 事件发生前, 高频特征词以“安全”、“天山”、“北京”、“小伙伴”为中心, 并形成若干子网, 主要词簇包括“乌鲁木齐”、“足球”、“快乐”、“摄影”、“美丽”, 而事件发生后则以“团结”、“早市”、“恐怖”为中心词, 主要词簇包括“受伤”、“爆炸”、“生活”、“暴力”、“稳定”。从以图1的中心词簇和主要词簇的分布情况可以看出, “5·22暴恐”事件发生前后, 新疆地区微博舆论场中“新疆”网络传播特征的语义网络分析, 基本验证了高频词汇分析的基本结论。

3.3 情感分析

为了回答问题2, 笔者对微博中样本导入情感倾向性软件进行分析, 将所有微博分为正向情绪、负向情绪和中立三类, 并逐条对其进行赋值, 取值范围为1到-1, 从0到1, 正向情绪强度逐次递增, 反之亦然。

数据结果显示, 有2482条微博的情感值介于-0.1和0.1之间, 约占所有微博的38%。正向区间中所含微博数为3600条, 约占总数的56%, 主要集中在0.05到0.5之间, 两个波峰分别位于0.2和0.5处。在负向情绪区间中, 从-0.3到-1, 呈缓减状态, -1处略有回升, 占总数的15%。事件发生前后的微博情绪分布走势大致相同, 不同之处在于, 事件发生后, 微博舆论中, 正向情绪只占到总数的44%, 而负向情绪上升到32%, 且在负向情绪区间中, 情感值位于-0.1到-0.3的微博最多。

3.4 民众舆论场中负向情感议题分析

为了回答问题3, 笔者将“5·22暴恐”事件发生后新疆地区微博舆论场中负面情绪的样本分别列出, 进行议题统计, 由于部分微博内容涉及多个议题, 所以在不同议题数量统计上有重复统计的情况。

数据结果显示, 微博舆论场中正面情绪中所涉及的议题大致可以概括为对以下几个方面的质疑和不满:“赞美家乡”、“民族团结”、“祈福”、“美食”、“教育”、“法制”、“美景”等几个方面, 正面情绪多积聚在“民族团结”、“赞美家园”以及“美食”的议题, 如“@清水幽幽竹冉冉:新疆的落日很美, 似乎来了这就没有见过日出。新疆还有很祥和的地方, 我们要敞开胸怀接纳他, 包容他……”、“@青春飞扬技师学院:2013、2014暴恐事件虽时有发生, 但这只能使我们更加坚定地维护我们伟大祖国的统一、维护我们大美新疆!让我们为了孩子的脸上能永远绽放笑容, 老人的眼里不再充满忧愁, 而团结一心, 抵制到底!”这三类议题约占到总数的近60%。而在负面情绪中, 所涉及的议题大致可以概括为对以下几个方面的质疑和不满:“爆恐事件描述”、“谴责民族分裂”、“天气情况”、“谴责暴徒”、“事故救援”、“领导人讲话”、“哀悼逝者”、“民族政策”、“地域/民族歧视”等几个方面, 负面情绪多积聚在“谴责暴徒”、“谴责民族分裂”以及“地域/民族歧视”议题上, 如“@BABE豹哥哥:畜生们造完了痛快了么新疆是你越闹越联合抵制你们的地方真的是越来越丧心病狂了恐吓别人家老人的时候有没有想过你自己也有爸妈人作自有天收没有遭到报应也迟早会被抽死。”这三类议题占到总数的近55%。

4 结论

从以上词频分析和语义网分析中不难看出, “5·22暴恐”事件前后, 新疆地区微博舆论场的高频词重合率较低。具体来说, 事发前的正面情绪相比负面情绪在舆论场中占到大多数, 而议题主要集中在“旅游”、“美食”、“美景”。事件发生之后, 负面情绪急剧上涨, 且正、负面情绪的议题皆围绕“5·22暴恐”事件展开。从危机传播的角度来看, 原先的理念已经难以适用, 事件发生的24小时内, 危机信息已经全面得到传播且发酵, 这从一个方面可以解释为何新疆地区开始流传对民族政策质疑的声音。另外, 在“信息茧房”的作用下, 群体极化效果使得民众舆论场中的负面情绪得以放大, 公众在自己的圈子中只注意自己选择的东西和领域, 久而久之, 会将自身桎梏于像蚕茧一般的茧房中。[2]在自媒体中, “信息茧房”这一现象被进一步放大, 人们因为不同的阶层、爱好、价值观等属性聚集在一起, 形成一个个形同蜂巢的圈子, 圈子之间相互隔离, 如此一来, 群体之间的相似性消失殆尽, 而差异将会被进一步放大, 直至彼此之间出现深度分裂, 完全缺乏可沟通性。[3]

作为政府部门, 在应对社交网络中的舆论引导时, 应了解不同圈子的话语体系, 有针对性地设计舆论引导路径。

摘要：2014年5月22日, 乌鲁木齐爆炸事件再次将国人的目光聚焦于新疆地区的恐怖袭击, 本文拟通过词频统计、语义分析以及情感倾向性分析的方法, 对该事件发生后新疆地区的微博舆情进行研究, 并尝试提出突发事件在微博中负面舆论出现的原因。

关键词：5·22暴恐,微博,词频,语义网,情感倾向

注释

1[1]马大正, 论百余年来新疆反分裂的几个问题[J], 《新疆师范大学学报》 (哲学社会科学版) , 2014年02月:9-16页

2[2]梁锋, 信息茧房Information COCOONS[J], 《新闻前哨》, 2013.1:87页

【微博舆情】推荐阅读：

舆情处理10-20

舆情应对05-19

公共舆情06-24

城市舆情07-02

舆情素养08-01