用户分析

2024-10-22

用户分析(共12篇)

用户分析 篇1

档案利用工作是档案工作的目的和宗旨。要想更好地开展利用工作, 就必须深入了解档案用户利用需求, 做到有的放矢地制定对策。笔者通过对不同档案用户利用需求的分析, 探寻档案用户利用需求的规律, 进而提出有效满足档案用户利用需求的对策。

一、档案用户不同利用需求分析

1. 个体档案用户利用需求

不同的档案用户利用档案的目的不同, 其需求也呈现出个体差异性。档案部门要重视个体档案用户的利用需求, 提供优质的服务。

(1) 个体档案用户利用心理。一是求实心理。个体利用用户希望通过查阅档案有效解决问题。这是档案用户最基本的心理, 也是将利用需求付诸行动的根本原因。二是求快心理。利用者需求欲望越强烈, 求快心理也越强。三是求准心理。只有提供全面准确的资料, 利用者的需求才可能得到满足。四是求尊心理。利用者希望在查阅档案过程中获得尊重。档案工作人员要随时观察、研究不同档案利用者维护自我形象的心理特点, 有针对性地采取适宜的服务方式。

(2) 个体档案用户利用需求特点。一是个体档案用户利用需求具有局限性。个体档案用户需求的产生是为了解决其自身的生产或是生活中的问题, 如婚姻、财产、学历等。二是个体档案用户利用需求具有迫切性。由于其利用需求与自身密切相关, 因而这类用户希望档案部门可以快速地满足其需求, 尽快获得档案信息。三是个体档案用户利用需求具有盲目性。多数个体档案用户在表述档案需求时不够清楚, 档案部门的工作人员应给予必要的引导和帮助, 协助其查询。

2. 群体档案用户利用需求

档案用户的需求虽各不相同, 但分析其利用行为的趋同性, 又很有关联。因此, 可以将档案用户大致分为三个群体, 即一般用户利用群体、实际工作利用群体和学术利用群体。

(1) 一般用户利用群体利用需求。一般用户利用群体主要是指普通群众, 其利用需求大多因为日常生活中信息的匮乏。这类用户群体是所有用户中所占比例最大的, 但利用需求相对较少, 只有在遇到与自身利益密切相关的问题时才查阅档案, 且查阅档案大多为会计档案、婚姻档案和文书档案, 查阅内容比较单一。此外, 一般用户利用群体的利用需求还呈现突发性, 其需求的产生很急迫, 且由于档案利用意识和相关知识的欠缺, 希望档案部门给予协助。

(2) 实际工作利用群体利用需求。实际工作利用群体包括政府机关的工作人员及企事业单位的管理人员和决策人员, 他们多因为工作开展需要, 查询近年间政策文件, 其所需档案具有明显的针对性。同时, 这类群体需要的档案不要求很专业、很系统, 而是简洁明了的实用档案信息, 因而档案部门编纂的二次文献基本上能满足其利用需求。

(3) 学术利用群体利用需求。学术研究利用群体主要包括从事社会科学以及自然科学研究的人员, 他们的利用需求一般都很专业, 且要求档案内容的全面和完整。只有这样, 研究人员才可全面、系统地了解不同时代、不同形式的内容, 为学术研究提供一个完整的环境。

二、档案用户利用需求规律分析

1. 档案用户需求的普遍性。

虽然档案用户利用需求的目的性有所不同, 但是他们都有利用需求已经成为一种共识。随着社会的发展和进步, 各个阶层、各个行业的档案意识逐步增强, 利用需求日益增加, 而且这种需求的普遍性将继续延续下去, 会随着文明的进步而进一步扩大。

2. 档案用户需求的层次性。

不同档案用户需求内容不同, 层次也不同。按照档案利用行为可将档案需求分为学术利用需求、实际利用需求和普通利用需求, 其中普通利用需求是最普遍的, 而学术利用需求是层级较高的。

3. 档案用户需求的地域性。

不同地区政治、经济、文化、科技等情况的不同, 必然影响到该地区档案需求。以经济因素的影响为例, 因经济发展的不平衡导致了不同地区对档案事业的投入不平衡, 如我国东部地区的用户需求明显多于西部。针对这种地区差异, 经济欠发达地区的档案部门要尽量加大宣传, 加大投入, 努力改善档案利用服务的条件。

三、提升档案用户利用需求的对策

1. 有的放矢, 了解档案用户的利用需求。

深入了解档案用户的需求是提升需求的第一步, 也是最重要的一步。档案部门可通过问卷调查或调研的方式, 了解不同人群、不同层次的用户需求, 从而总结出需求的一般形式, 提供最佳的服务。这种需求了解, 不仅要了解群体需求, 还要重视个体需求, 尤其是有特殊需求的个人的需要, 从而完善需求的种类。

2. 加大宣传, 引导用户利用需求的实现。

为了避免用户有需求却难于实现的局面, 提高用户的档案利用意识, 满足用户潜意识里的利用需求, 档案部门要加大宣传力度, 举办知识讲座或咨询会, 提高人们的档案利用意识, 积极引导用户的需求, 能有效满足其利用需求。

3. 优化馆藏, 为用户利用需求实现奠定资源基础。

满足用户的利用需求不仅需要档案部门提供一个舒适的场地, 更重要的是档案部门的馆藏可以满足需求。档案部门要加强档案的接收和征集工作, 适当扩大档案的接收范围和征集门类, 力争建成档案数量充足、内容丰富、结构合理、质量优化并富有特色的档案信息资源保障体系, 为用户利用需求的实现奠定资源基础。

4. 提升服务质量, 最优化地满足用户利用需求。

档案工作人员作为满足用户需求的直接参与者, 责任重大。档案部门应强化服务意识, 提升工作人员的综合素质, 使其服务质量、服务水平都上一个台阶。档案工作人员还要树立良好的职业道德, 拥有丰富的专业知识, 为用户提供优质服务。

参考文献

[1].马仁杰.邵华.论档案利用者利用行为过程中的利用心理[J].兰台世界, 2007.1

[2].王娟.黄存勋.浅谈档案馆普通用户需求的特点及满足的需求的途径[J].湖北档案, 2010.8

用户分析 篇2

1、第一次访问首页的用户需求分析

第一次访问首页的用户,可能是通过搜索引擎直接进入首页,也可能是通过搜索引擎进入二级或三级页面,然后再通过导航进入首页;也可能是通过朋友介绍,或通过线上或线下的广告进入首页;也可能是通过销售人员的推销,输入网址进入了首页等等,其大部分用户需求主要表现为以下几个方面:

A、有的会以最快的速度扫描一遍首页,看有没有自己喜欢的好的内容;或者喜欢的栏目,直接点某个栏目去看更多内容,找到了或者没有找到好的内容或栏目,成为他是否成为回头客的条件之一;

B、通过输入关键词搜索,快速的找到相关商机或行业知识,搜索是他们最重要的需求之一,也是再次展现网站精华内容的最好手段;

C、如果是大行业B2B网站,用户会通过首页的产品分类导航,或社区分类导航,直接进入属于他自己的领域;如果是细分行业B2B网站,用户到网站的任何模块,可能都是属于他的领域,这个时候选择类别的几率会很小,直接进入二级栏目;

D、对网站首页广告,第一次访问的用户点击的几率会更高,因为对他们来讲,广告也即是供应商或同行,也是属于内容的一个部分;

E、对底部的广告、友情链接/合作伙伴等比较关注,因为他们为了了解网站的现状,需要将网站拉到底部,对友情链接、合作伙伴等广告是的关注有时会超过对广告位的关注;

F、对顶部和底部的导航比较注重,有时会看看网站简介、网站动态、联系我们这几个部分,想看看这个网站的实力、诚信度等,目的在于是否信任这个网站的内容。

2、访问了几次或10多次首页的用户需求分析

访问了几次或10多次首页的用户,可能是通过收藏夹进入网站的首页,也可能是仅仅记得中文名称,然后在BAIDU输入中文名称进入网站首页,也可能是域名比较好记,直接输入网址进入等,其大部分用户主要需求表现为以下几个方面:

A、有的人虽然访问了几次,但是每次都很忙,没有静下心来好好研究这个网站,可能仅仅是从表面觉得这个网站还不错,有自己想要的内容,他的行为与第一部分基本相同;

B、有的人通过几次访问,已经找到自己喜欢的栏目,通过BAIDU、收藏夹等进入首页,仅仅为了把首页作为跳板,直接进入网站二级栏目,首页可能他根本就不看;

C、如果首页有一个内容聚合的模块,将整个网站最精华的内容列出来,即使他通过收藏夹直接到二级栏目,可能也会回到首页,去看看今天整个网站有那些最精华的内容;

D、如果是大行业B2B网站,用户可能会通过首页的产品分类导航进入二级栏目,比如综合B2B网站阿里巴巴在去年的时候首页几次改版,最后他还是把大量的产品分类放到网站首页最重要的位置,并占据了大量的篇幅,实际这与用户需求是分不开的,

再比如大行业B2B网站中国化工网,其首页下部就有详细的产品分类导航;

E、如果是细分行业B2B网站,用户可能会将首页作为跳板,直接进入二级栏目。通过以上分析实际我们就明白了,为什么大家做细分行业B2B网站不能完全模仿阿里巴巴,也在首页整一大堆类别导航,是因为需求决定的;

F、用户已经来几次了,可能基本了解这个网站了,想注册会员、发布信息,互动沟通,这个时候会找网站注册、登录、信息发布、帮助说明等链接。

3、访问了几十或上百次的忠实用户需求分析

A、通过BAIDU或收藏夹等进入首页,或者是直接进入二级栏目,甚至是通过自己发布的信息进入网站,可能首页可能他根本就不看;

B、如果首页有内容聚合的模块,将整个网站最精华的内容列出来,即使他通过收藏夹直接到二级栏目或内容页,可能也会回到首页,去看看今天整个网站有那些最精华的内容;

C、直接进入二级或最终内容页时,在搜索上满足了需求,可能会到网站,搜索全站的内容,找到自己想看的内容。同时有可能直接进入首页,然后点登录,互动;

4、准备成为收费会员或广告客户的需求分析

A、无论是以前或现在,要成为收费会员,都可能会通过首页点击收费会员或广告介绍,充分了解成为收费会员或广告客户的好处;

B、如果是首页广告客户,会分析提供的广告位置,是第一屏还是第二屏,是否符合用户的浏览习惯,离内容是远还是近,从而决定他是否选择这个位置;

C、如果是会员客户,可能会通过首页提供的收费信息,了解成为会员的好处,同时首页提供的一些信息,也会吸引或促使他成为收费会员,比如:把收费会员的信息放在很重要的位置,比较靠前的位置等等;

档案用户数据分析引擎建设研究 篇3

关键词:档案用户;分析引擎;协同过滤;档案模型;推荐系统

本文从分析用户数据来提升档案服务的目的出发,立足于档案馆实践需求和实际数据建设能力,提出一个档案用户数据分析引擎架构模型方案。该方案的核心思想是,通过建立档案馆对用户数据的分析机制,指导和促进自身服务的提升。

1  档案用户数据分析引擎模型

本文所称的档案用户数据,是指用户在利用档案过程中所形成的反映档案利用行为、利用主体及客体特征的数据。要实现通过关注档案用户数据促进档案服务的提升,就要建立对这部分数据进行分析、知识抽取以及采取相应行动的机制,这就是档案用户数据分析引擎。该分析引擎的意义在于,使得档案部门可以利用对用户行为数据分析的技术手段,将原本的“数据废气”[1]变废为宝,为档案部门的服务提升和管理进步提供了现实支持。

为此,我们提出一个档案用户数据分析引擎模型,如图1所示:

图1 档案用户数据分析引擎模型

该引擎总体上分为五个层次:存储层、知识提取层、知识表示层、行为层和反馈层。其中存储层主要负责实施对档案用户数据收集、存储和向上层调用控制。该层次中的档案用户数据收集模块负责对档案用户特征、档案利用行为、用户对档案评价等数据的收集,数据整理清洗模块负责规整收集到的数据、消除数据噪声等。随后将收集到的数据存储至档案用户数据库中。隐私保护和密级保护规则模块,负责防止数据向上层调用时违反隐私和保密规则。

存储层之上是知识提取层,其根据收集存储的用户利用数据,运用数据挖掘工具提取出有用知识。主要包括以下的几个功能单元:1.分类模型。对档案用户和所利用档案数据资源进行分类和聚类,按照用户以及利用档案资源之间的相似度判定其各自的所属类别,对用户评价的原因进行分类。2.推荐引擎。主要根据档案用户的利用行为、身份属性或档案资源所获得的评价,为用户推荐档案数据资源,提供档案数据个性化推荐的系统服务。3.评价分析。对档案数据资源所获得的评价进行整理和统计分析,得出用户对所利用的档案资源、服务情况等方面的信息。4.关联分析。对档案用户数据中所体现的规律和联系进行分析,如用户利用目的与利用档案类型的关系,档案数据信息之间在利用中的联系,档案利用行为与特定时间之间的关系,等等。5.异常检测。识别档案用户数据中不常见的、反常的实例,包括异常的评价、利用行为、用户属性信息等,提供给分析引擎的上层进行鉴别与决策,判定这是新的档案利用趋势,还是需要特殊服务的用户,或是对档案利用数据的恶意干扰等。

知识提取层之上是知识表示层,其将知识提取层所抽取的知识,表达成为对于档案服务提升、支持决策有用的、可理解的知识形态。主要包括:1.用户特征表征。例如,对用户的身份特征、利用目的等进行分析和展现,表征档案用户可以分为哪些类型、用户身份特征的变化情况等。2.档案利用特征呈现。这一部分主要展现档案数据资源获得利用的情况、档案资源所获得的评价信息、用户属性与档案利用项目和种类的关系等。3.趋势变动及预估。主要表现随时间变动的档案资源所获评价、用户利用档案以及评价档案的时间特点、对用户未来档案利用行为的预计,等等。

知识表示层之上是行为层,是根据分析引擎所表示的知识规则,提示档案馆应采取策略的功能层次。主要包括:1.服务提升。主要可包括:档案资源个性化推荐、档案数据智能检索、档案用户间交流群建设及相应好友推荐等内容。2.资源建设。根据分析引擎提供的知识来改进档案数据资源的收集与构成,如进行以下工作:档案资源评价分类、用户差评分析、档案数据资源利用关联分析、用户未能检索到的档案资源分析等。3.支持决策。应用分析引擎提取的知识支持档案馆的管理决策,实现循数管理[2]的思想。如通过对档案用户进行分类与聚类、实现小众化服务;通过对档案用户数据中异常实例的感知和分析,确定档案馆应采取的相应措施;通过档案项目所获评价的趋势分析,实施档案开放以及利用工作的前瞻性安排等。

用户满意度是对分析引擎效能的最终极评价指标,用户的反馈意见是引擎优化的根本依据。因此本引擎在设计上设置了反馈层,用以收集档案用户对于引擎驱动的档案服务提升的满意度信息,根据用户实际满意度来调整和完善分析引擎的架构与技术方案。

2  档案用户数据分析引擎的实施与部署

以上我们所提出的分析引擎,从概念模型的角度阐释了引擎总体架构和所包含的功能。下面,我们结合当前档案馆的实际,探讨一下对该引擎进行实施和部署应采取的几方面工作措施:

2.1  完善当前档案信息系统用户数据采集功能。目前在开展了档案信息化的档案部门,一般均采用了基于数据库系统加管理软件的档案信息系统(典型的如“南大之星”系统),大多数档案部门所用到这类系统的主要功能是存储和检索档案数据文件,而较少关注和利用这些信息系统所具有的用户数据采集功能。而且在一些型号的档案信息系统中,对该类别数据的采集功能支持度也不够。所以,档案部门应当从现在起,除了重视档案数据本身,还要重视对档案用户数据的采集与存储工作。要充分将自身已有的档案信息系统用户数据采集功能利用起来,或是依托相关技术力量来开发与完善此部分数据的采集功能,为部署分析引擎提供必要的数据基础。

2.2  选择适用于档案馆自身的分析引擎实现技术。档案馆要充分考虑到自身的现实数据分析需求、技术力量和馆藏资源特点,选择恰当的信息技术来实现分析引擎的主要功能。正如选择软件的一种原则一样:功能强大的傻瓜软件才是最好的。因此,档案部门为了实际部署档案用户数据分析引擎,所选择的具体数据技术应当是对于自身易于实现、功能较强,既符合档案部门实际应用需求又不超越自身的技术力量。这样,使分析引擎既发挥积极作用,又不使档案部门陷入“技术泥潭”。

2.3  结合自身情况实现分析引擎的具体功能。所提出的档案用户数据分析引擎所具有的实际功能包含很多种,每种功能面对档案部门的实际环境也会具有不同的表现形式。因此,档案部门可根据自身所面对的用户群体与档案资源状况,应用自身所选择的引擎实现技术,实现符合自身服务需要的分析引擎功能。例如,可以根据自身所面对用户的身份特征信息,开展对档案数据资源的个性化推荐;建立对档案用户属性的多维分析资源库;开发对档案数据资源的辅助检索系统,应对用户检索多样化的应用环境;为了防止档案资源流失,通过异常检测分析潜在的不守信用用户并进行预警;通过趋势变动及预估来感知用户对档案需求或反馈意见的变化趋势等。从总体讲,这些具体功能的根本目的,就是为了将用户数据驱动服务提升与管理进步的宗旨落到实处。

2.4  建立与完善分析引擎的配套制度。对于档案部门来说,信息技术要与配套制度相结合,才能实现档案服务与管理的真正进步。用户数据分析引擎在档案馆部署运行的过程中,档案部门要制定有效的管理制度和使用规范,确保其发挥良好的作用。例如,应研究建立档案数据个性化推荐系统使用规则、用户数据收集实施办法、用户数据安全性责任规范、用户意见反馈收集实施办法等。通过这一系列的工作制度和纪律规范,明确用户数据分析引擎运行过程中档案工作人员的任务职责,以制度的形式确保分析引擎的良好运行以及对档案部门进步的促进作用。

3  档案用户数据分析引擎实现技术选择的探讨

基于以上分析,我们以下探讨对分析引擎实现技术的选择问题。从总体上说,数据挖掘领域的关联规则(Association Rule)、协同过滤(Collaborative Filter)、对项目的向量建模是与该分析引擎相关的几项技术。其中,关联规则技术的优点是:对其的研究比较深入、技术较成熟,其实现的软件产品与技术人员等也比较丰富。其缺点在于:1.在模型建立的阶段计算量往往很大,难以实时完成。关联规则的模型建立、存储后,也一般不能做到经常修改模型、进行关联规则集的更新,应变度不好。2.对于所产生的关联规则的解释和应用,本身就是一个复杂的、在很大程度上具有超技术特征的哲学式任务。且误导的关联规则和负相关问题需要额外的处理关注。3.关联规则对于用户个性化特征体现和服务支持不足。关联规则方法在于从整体上了解数据库事务较为普遍的、宏观的发生规律,是在考察整体,而非“关照个体”。例如,其应用在资源个性化推荐的场景中,除非目标用户与大多数人行为模式相似,否则难以得到满意的推荐。

协同过滤技术[3]的基本原理是基于最近邻居的评分数据对目标用户产生推荐。协同过滤技术的核心是用户—评分矩阵,用来表示用户对每个项目的评价。基本的推荐步骤是用户评价、最近邻查找、推荐结果生成。

项目的向量建模技术主要思想是,将目标项目提取为特征向量,用于匹配计算等场景。这项技术的个性化程度较高,但其难点在于对推荐项目(如文档)特征的提取,如文献[4]中介绍了对于文本的特征提取公式等。而对于那些难以提取特征、准确表达成向量形式的推荐项目(如音像档案等)则较难应用。

考虑到目前我国档案馆的现实数据分析需求、技术力量以及馆藏资源特点,在此我们提出主要选择协同过滤技术作为用户分析引擎的实现技术,并辅以向量建模技术以提高分析效果。

基于本节的分析,以下我们阐述几种分析引擎典型功能的技术实现方案。

4   档案用户数据分析引擎若干典型功能技术方案

4.1  档案数据资源个性化推荐。当前用户对档案资源的需求主要属于因办理某事务而对档案资料的刚性需求。所以在实际应用场景中,用户的档案需求往往在档案类别上有共性、在具体文件上有个性,因此,我们提出如下的推荐方案:

①对档案用户进行建模,采用向量形式描述用户属性集合。将档案文件按照所属全宗类别进行建模,每一类别作为协同过滤矩阵中的一个项目。

②根据档案利用数据,建立“用户属性-档案文件类别”二值观测值矩阵,其中以0、1数值的形式记录具有某属性的用户利用过某类档案文件的情况。

③当目标用户在档案利用中输入自身属性信息,分析引擎的推荐引擎模块即根据其属性信息在用户向量模型空间中计算查找最相似用户,然后检索这些最相似用户在“用户属性-档案文件类别”矩阵中利用过什么类别的档案文件。

④将检索到的文件类别(并集)与目标用户自身属性相结合,在档案系统数据库中检索到具体的档案数据文件推荐给用户。

该方案实际上是对经典协同过滤技术的一种变形,主要是将其“用户-项目”矩阵变为“用户属性-档案文件类别”矩阵,并结合用户属性向量实施推荐。对于目标用户的最近邻查找是在用户属性向量模型空间中完成的,而推荐结果的生成则划分为两步:一是在矩阵中直接读取最近邻用户的档案文件类别,二是结合目标用户自身属性检索具体档案文件。这种策略大大缓解了传统协同过滤的稀疏性与冷启动问题。更为重要的是,其更加适用于档案领域的实际场景。

4.2  档案利用关联分析。档案利用关联分析的目的是要揭示用户属性(如身份信息、利用目的等)与所利用档案类别集合之间的关系。这种分析得出的结果主要有两个方面的重要用途:一是为档案馆识别用户、安排与优化档案资源提供决策依据;二是为实现上述的档案数据资源个性化提供建模支持。

基于4.1节中所提出的协同过滤矩阵,建立利用分析模型。重点是根据档案馆实际情况分别建立档案用户模型与档案资源类别模型。其中用户模型的建模目的是将档案用户映射为不同的特征向量。例如,在档案资源个性化推荐中,使得目标用户能通过模型映射找到与其特征相似近邻用户;而对于档案项目的建模,目标是使资源模型可以准确刻画档案数据文件从属于何种类别,该类别的划分有助于揭示此类文件的共性,且有助于其与用户属性结合后准确地直接检索到用户所需的具体文件。

具体的建模策略实际可视为一个分类模型(classification model)问题,即将“用户属性-档案文件类别”二值观测值矩阵中的每一行视为一个独特状态。档案馆通过分析总结档案利用数据与馆藏档案类别,首先归纳得出若干不同的利用状态(矩阵行),然后利用分类模型技术,将档案用户身份属性信息映射到各自唯一对应的档案利用状态(也就是分类决策树的叶节点)。如图2所示:

图2  用户利用档案类别分析模型

所建立的分类决策树模型,每个叶节点应对应“用户属性-档案文件类别”矩阵中的一行,决策树中的每个非叶节点代表一个应当体现在用户向量模型中的用户属性项目。从而以此指导建立档案用户向量模型。而之所以不将该决策树直接用于推荐引擎,是因为决策树模型往往存在误差,且直接在树上查询至叶节点也往往存在效率上的问题。因此,以协同过滤技术实现推荐服务可具有更好的容错性和运行效率。

在建立分类模型过程中,可以应用诸如C4.5等[5]分类模型技术,通过信息增益率来确定用户属性项目的价值(即属性选择度量),这对于完善档案用户向量模型是一种直接而有效的方法。而建立分类模型需要训练集(training set)与检验集(test set)。对此可以将档案馆人员分析得出的用户属性-利用档案文件类别数据集,分为训练集与检验集两部分,前者建立决策树,后者进行模型的验证和完善。而且,这个过程在实践中可以通过新得出的数据定期进行,以完善和优化所建立的分类模型。

4.3  档案未命中检索词分析。用户检索档案数据所使用的关键词,体现出用户对档案资源的实际需求以及自身表达特点。若是用户在档案信息系统中经过一系列尝试后未检索到所需的档案文件,那么,档案馆应该定期对这些“未命中检索关键词”进行分析(通过操作日志等),找出检索未命中的原因。该原因一般可归结为三类:资源不存在、检索词笔误、资源命名不匹配。在经过认真分析确定原因后,档案馆应分别采取如下的处理措施:对于资源不存在,应在对检索词统计汇总后,研究加强今后的档案资源建设,调整所需档案收集的项目,以使馆藏档案资源的扩充向用户实际需求方向发展;对于检索词笔误,可将用户输入有误的检索词作为“规则”与其应该命中的文件建立链接,今后系统再遇到该错误时,即可将正确的文件推送到用户,增强档案检索系统的容错性;对于资源命名不匹配问题,也可按照该方式,将用户所用检索词与应命中文件链接,增强档案检索系统的适应性。在此提出的技术策略,实际上是通过倒排文件的思想,来提升档案信息系统检索的智能化水平。

5  档案用户数据分析引擎的优化及制度建设

任何成功的制度设计,都应具备有效的自我完善机制。因此,我们提出的档案用户数据分析引擎设置了反馈层,用以收集分析引擎运行后用户对档案服务的满意度和反馈意见等信息。以此为依据,对分析引擎的功能、实现机制、技术方案等做出优化调整。

对于分析引擎在实践中的优化,一方面,需要根据实际运行中的用户反馈对引擎进行改进,另一方面,也需要测试基准(benchmark)对其进行有效验证,这种测试基准就是典型档案用户案例。建立这种用户案例的主要考虑原则包括:1.代表性。典型档案用户案例主要特点在于“典型”,即用相对可行的用户数量,全面反映各种类的档案用户特点。2.反馈性。组成典型档案用户案例的用户应与档案馆之间建立有充分的、及时的信息反馈机制,将档案服务的实际质量、存在的问题等及时、真实有效地反馈给档案馆。3.可控性。典型档案用户案例相对于档案馆应是可控的,这意味着双方彼此间应建立良好的互信关系,对于档案服务引擎可能存在的问题与不足进行友好的沟通与探讨,而不致因某些不足造成不可控的影响。通过在典型用户案例上的实际测试和完善,面向实际提高档案用户数据分析引擎的效能。

对于档案数据分析引擎的配套制度建设,目前我们应该重点关注两点:一是有效收集档案用户数据的问题,二是对系统中档案用户隐私保护问题。

对于有效收集档案用户数据的问题,档案用户数据的主要内容包括对档案利用行为的数据、档案用户自身属性的数据、所利用档案具有属性的数据三个主要的部分。对于它们的收集要本着准确、及时、全面的原则,因为它们是整个档案用户数据分析引擎运行的基石。对于档案利用行为数据,在数字化档案馆条件下,可基于档案信息系统自动完成。档案部门也可对以往档案利用登记数据进行汇总,获得更为全面的利用规律。对于档案具有属性的数据,应基于档案元数据来获得,这就要求档案部门今后要更加重视档案元数据的收集、存储和利用。

对于档案用户自身属性的数据,相关研究中[6]亦称为用户人口统计信息(Demographic Information)等。对于其的收集,档案部门首先是调查搞清:哪些信息项目对于分析引擎的功能是需要的,要收集加以考虑,而哪些信息项目不重要,不可盲目收集。另外还要注意哪些是用户“最不愿意填写”的信息项目,这些项目用户要么就不会提供、要么即使填写也是不真实的信息,从而影响引擎的分析功能正常发挥。对此,档案馆要充分地向用户宣传与沟通,积极促进用户提供自身真实有效的属性信息。

例如,4.2节中所提出的分类模型,其在建模过程中就会逐步筛选出对于分析有意义的用户属性项目,因此在实践中应对用户的这些属性加以重点收集、确保其正确和真实,这就意味着档案部门要通过有效的策略鼓励用户提供这些信息项目的真实信息。

对于分析引擎中用户隐私保护问题,当前相关研究中[7]提出了一系列的用户隐私保护措施,如收集主体的合法性、隐私管理者的保密及忠实义务、贯彻落实相关的法律规定等,在分析引擎实际运行中可以参照这些措施对用户的信息实施保护。这实际与有效收集用户属性信息问题是相辅相成的,只有用户的信息受到良好的保护、进行正确的利用,才能促使用户更加顺畅地提供自身属性数据供分析引擎正常运行,从而形成档案用户、档案部门与分析引擎之间的良性互动。

6  总结

本文重点关注了如何通过对用户数据的分析来驱动档案服务提升的问题。提出了档案用户数据分析引擎的模型架构,并基于协同过滤和向量建模等技术提出了若干具体的功能实现策略。在设计和部署数字化以及智慧档案馆的信息系统时,可将本文提出的策略作为设计要求和实现说明,将对用户数据的感知及分析功能融入档案系统中加以实现。

*本文系2014年度国家档案局科技项目“大数据时代档案馆服务创新与发展趋势研究”(课题编号:2014-X-16)的阶段性研究成果之一。

参考文献:

[1]张倩. 高校档案用户行为大数据分析技术应用研究[J]. 档案与建设.2014(08):16~21.

[2]周枫. 资源.技术.思维——大数据时代档案馆的三维诠释[J]. 档案学研究.2013(06):61~64.

[3]孔维梁. 协同过滤推荐系统关键问题研究[D].博士学位论文.华中师范大学.2013.

[4]林鸿飞,姚天顺.基于示例的中文文本过滤模型[J].大连理工大学学报,2000,40(03):375~378.

[5]徐鹏,林森. 基于C4.5决策树的流量分类方法[J].软件学报, 2009,20(10):2692~2704.

[6]袁先虎. 基于混合用户模型的协同过滤推荐算法研究[D].硕士学位论文.重庆大学.2010.

[7]孙强. 档案利用中的个人隐私保护问题探析[J].档案学研究,2014,(04):40~43.

用户认证协议的安全分析 篇4

关键词:Needham-Schroeder协议,规范化,Casper和FDR2

1 概述

当今, 企业、政府或个人每天都需要通过网络进行信息交换。随着网络的普及, 安全问题也日益突出。认证是安全通信的基础, 也是网络安全中最重要的一个安全目标, 所有其他的安全属性例如完整性、不可否认性、可信性等都依赖于通信双方的认证。因此, 很多安全认证协议被提出。但协议的设计极其容易出错, 使之不能正常工作。在实现和使用这些协议前, 他们声称的安全属性应该被验证, 而普通的常用的方法是模拟。模拟只能证明模拟的协议在特定的模拟环境下可以达到的安全目标。而对于正常的各种情况无法真实反应。需要一个更有效的方法来完成这个功能。模型检测就是其中之一。通过模型检测协议的安全属性可以在系统能达到的任何状态被验证。常用的工具是Ban logic[5,6], CAPl-es[2]和SPIN[3,4], 安全协议的正式验证仍然是一个新的领域。文献1和文献7采用BAN逻辑对特定协议进行了验证和分析。但由于BAN逻辑存在着初始假设没有明确依据的方法、协议理想化、语义定义不明确、对协议的攻击探测能力较弱等问题, 使得协议分析的结果还有待进一步验证。在这篇论文中, 我们采用Casper和FDR2工具对一种经典的用户认证协议进行了模型检测和验证。这种方法不是新的, 只是将这种方法应用在用户认证中是之前没有的。

2 协议描述

经典的Needham-Schroeder用户认证协议是基于对称加密和第三方仲裁机构的。整个系统的结构包括申请发起用户、第三方仲裁机构和目标用户三个部分。每个用户都有与第三方仲裁机构共享的秘密密钥。当用户之间要进行通信时, 需先通过第三方仲裁机构完成用户之间的认证。认证过程如图1所示:

A、B是用户的身份, S是第三方仲裁机构的身份, Na是用户A产生的随机数, Nb是用户B产生的随机数。Kas是用户A与第三方机构S的共享密钥, Kbs是用户B与第三方机构的共享密钥, Kab是第三方机构为用户A和B通信产生的会话密钥。我们给出对应的协议描述如下:

第一步中, 用户A向第三方第三方仲裁机构S发出申请自己想和用户B通信的请求, 第二步:收到消息的第三方仲裁机构查找与用户的共享密钥Kas, 并产生用户A、B之间通信的会话密钥Kab, 用与用户B的共享密钥Kbs加密信息Kab, A即{Kab, A}Kbs, 然后将Na, B, Kab, {Kab, A}Kbs信息用Kas加密之后发送给用户A, 在第三步中, 用户A用Kas解密收到的信息, 得到与用户B的会话密钥Kab, 将{Kab, A}Kbs发送给用户B。第四步:用户B用与第三方仲裁机构的共享密钥解密收到的信息得到Kab, A, 然后生成一个随机数Nb, 用得到的会话密钥Kab加密之后发送给用户A。第五步:用户A收到B的信息后, 用Kab解密得到随机数Nb, 计算Nb-1, 并用会话密钥加密后发给用户B, 用户B收到信息后, 得到A是合法用户, 从而认证A的身份, 认证过程结束。

3 协议的形式化验证

根据协议中用户的工作方式, 我们选择模型检查器FDR2来验证模型的安全性, 这是一个基于并发理论和CSP的模型检测器。它主要用来检查系统的安全属性例如访问控制、认证、电子商务、移动代理、web服务、AXML文档等。FDR2中的规范化语言是CSP。但使用这种语言来模型化系统是耗时的并且易于出错。所以我们使用Casper产生CSP模型。Casper传递安全协议的规范给CSP以便于被FDR2分析。它也可以用于传递输出消息到可读格式。

验证认证协议的第一步是用Casper模型化协议。协议的模型化包括两部分:带有形式变量的模板参数的协议描述和协议实际使用的场景描述。形式变量最终会被实际变量所替代。

关于用户认证协议的模板如下:

协议的描述用来规范化消息交换。第1步对应协议中的第1步, 用户将自己的身份A、用户B的身份B和随机数Na发给第三方机构。第2步对应协议第2步, 第三方机构回复信息给用户A, 用户A用密钥Kas解密消息得到Na, B, Kab, {Kab, A}Kbs, 与自己存储的Na比较看是否相等, 若相等证实信息是第三方机构发来的。第3步对应协议第3步, 用户A将{Kab, A}Kbs发送给用户B, 用户B解密信息, 得到Kab, A, 从而知道是用户A要与自己通信。第4步对应协议第4步, 用户B生成一个随机数Nb并用Kab加密之后发送给用户A来验证A的身份的真实性。用户A解密得到Nb。第5步对应协议第5步, 用户A将得到的随机数减一, 用Kab加密之后发送给用户B, 用户B比较自己存储的随机数与收到随机数之间是否差一, 若是, 认证通过。

我们只给出了一对用户之间认证的模型, 事实上, 所有用户之间的通信都是相同的, 因此检测一对用户结点的安全属性是足够的。如果对一对用户结点有效, 那么对所有用户节点都有效。这对FDR2的验证也是非常有益的。如果有很多个用户结点同时验证的话, 机器的内存会全部耗尽, 检查无法终止。

定义了协议的模板后, 需要检测的安全属性也就规范化了。在用户认证协议中, 安全属性是用户之间的认证。相应的输入文件是#specification。这个认证规范可以用下面的声明来完成:Agreement[A, B, [Nb]]协议规定A被B认证, Agreement[B, A, [Nb]]协议规定B被A认证。

正如我们之前提到的, 协议的安全验证不是在协议的模板上来完成, 而是在一个特定的场景中。对用户认证协议来说, 场景包括二个部分:协议的初始方 (想去被认证的用户) 和响应方 (第三方仲裁机构和执行认证的用户) 。场景的定义使用真实变量来给出:

在模型化协议的最后一步是关于恶意分子的规范说明, 恶意分子可以破坏协议, 它知道所有用户和第三方的身份, 由于本协议是建立在第三方仲裁机构是可信的、公平的基础上的。如果第三方机构与恶意分子勾结来产生对应的会话密钥Kis, 并产生一个随机数am, 那相应的恶意分子的场景描述如下:

完成输入文件后, Casper用来生成协议的CSP规范, 这个规范用作FDR2的输入。完成协议的模型化之后, 在linux环境中采用FDR2进行验证, FDR2验证的第一步是构造模型化系统的状态。然后指定的属性在每种状态下被验证。如果在每个状态下都可以通过验证, 则协议的属性是安全的。否则被认为是无效的。在正常的状态下即只有用户和第三方仲裁机构的情况下, 协议运行正常, 认证安全属性得到验证。在有恶意分子存在情况下或者第三方仲裁机构与恶意分子勾结情况下, 协议的认证安全属性验证错误。由此可以分析出Needham-Schroeder协议的安全性有待改进, 可以对第三方仲裁机构设置可信值来评估他的真实可信性或者采用公钥基础设施来进一步完善协议, 从而提高协议的认证安全。

4 总结

在这篇论文中, 我们演示了如何用规范化验证技术来检测一个安全协议的有效性。使用的工具是Casper和FDR2。这个方法也可以适用于任何模型检测。首先, 使用验证工具的规范化语言明确规定协议的各个部分。转换成一个验证执行的实际协议。这步很重要, 如果模型错误或者与实际协议比较缺少相关限制条件的话, 验证结果将会出错。接下来制定需要验证的安全属性。在这里我们只验证了认证属性, 其他的属性也可以被验证。最后一步是实际执行的验证情况。FDR2证明了该协议的安全性有待提高, 没有达到安全目标。接下来我们可以完成对称密钥的建立或者公钥基础设施的改进等工作, 协议的使用范围可以进一步扩展。

参考文献

[1]田建波, 王育民.认证协议的形式分析[J].通信保密, 1998, 76 (4) :8-12.

[2]John D.Aprshall, an analysis of the secure routing protocol for mobile ad hoc network route discovery:using intuitive.reasoning and formal verification to identify flaws, Msc thesis, Florida State University, 2003.

[3]Davor Obradovic, Formal Analysis of convergence of routing protocols, PH.D thesis, university of pensylvania, 2000.

[4]Todd R.Andel, Formal Security Evaluation of ad hoc routing protocols, PH.D thesis, , Florida State University, 2007.

[5]张玉清, 李继红, 肖国镇.密码协议分析工具—BAN逻辑及其缺陷[J].西安电子科技大学学报, 1999, 26 (3) :376-378.

[6]张玉清, 吴建平, 李星.BAN类逻辑的由来与发展[J].清华大学学报, 2002, 42 (1) :96-99.

SEO与网站用户体验分析 篇5

1、seo与网站用户体验的概念

seo是搜索引擎优化,是面向搜索引擎的,

网站用户体验是指网站的可用性。根据用户的习惯,心理等等设计的,符合人机交互,符合人体工程学的网站是用户体验好的网站。网站用户体验是面向用户的。

2、seo与网站用户体验的关系是对立统一的

a、seo与网站用户体验是对立的

从seo出现的那天起,就已经跟用户体验相对立了,以前包括现在,很多的网站都是只面向搜索引擎,只要搜索引擎能够收录,能够有排名就可以,用户体验无从考虑,所以很长一段时间seo与网站用户体验是对立的,这种对立也将持续下去,

b、seo与网站用户体验是统一的

没有seo的用户体验是没有用的用户体验,没有用户体验的SEO是不会长久的seo,从搜索引擎的发展看seo与网站用户体验的统一越来越明显,基本上是seo与网站用户体验“一荣俱荣,一损俱损”,这也是搜索引擎发展的趋势。

3、怎么样使seo与网站用户体验和谐发展

我们从seo与网站用户体验的关系看出,seo与网站用户体验不是一种东西,他们是对立统一的,seo面向搜索引擎,网站用户体验面向用户,那么怎样使这两种东西和谐呢?

用户分析 篇6

关键词:移动社交网络;信息需求;青年用户

中图分类号:G203 文献标识码:A 文章编号:1671-864X(2016)05-0149-01

一、问题的提出

如今,随着移动互联网用户数的激增,各大移动社交网站都幵始蓬勃发展,探索社交网络新的发展模式。与此同时,各大媒体和企业、机构等也试图利用各类移动社交网络平台来开展企业的营销或者政府的宣传交流工作。但移动社交网络平台却面临着不能准确满足用户需求,不能不断扩大吸引使用者群体并维持用户粘性的现象。因此,为了解决现有问题,帮助各类用户科学的运用移动社交网络这一新兴社会化媒体,应当从认识用户的信息需求,识别信息需求的影响因素入手,探索用户使用移动社交网络的主要信息需求和影响信息行为的因素。

二、研究综述

移动社交网络是在固有社交网络服务的基础上发展起来的,以移动互联网技术为支撑,以真实的社会关系为基础,以可携带移动终端设备为载体,更有效地满足用户的需求的网络服务。主要有社交网站、手机微博、即时通信工具、博客、论坛等等[1]。

除上所述外,本论文还认为移动社交网络的设计抓住了年轻人的性格特征,是以移动社交网络还拥有实时性、用户青年化、局限性较小、安全性更高的特点。

通过对研究成果的梳理可以发现当前国内外对移动社交类应用用户的接受意愿、使用动机的研究已趋向成熟,但是对移动社交应用用户的信息需求和信息行为的深入研究较少,可以认为其将成为移动社交类应用用户研究的趋势之一。

三、移动社交网络青年用户信息需求研究

(一)问卷设计。

本文问卷共分两个部分:第一部分是对参与调查的用户的人口统计特征的问题,主要包括用的性别、教育水平和收入等;第二部分,是有关被测试用户的信息需求的内容调查,将具体信息需求具体化。

(二)数据搜集。

本文的问卷的主要是通过网络方式进行问卷的发放与回收,于2014年11月1日至2016年1月1日通過中国最大的免费网络调查平台问卷网(http://www.wenjuan.com)调查网站来发布研究问卷(问卷地址https://www.wenjuan.com/s/JjiIji/)。主要利用微博、微信、QQ群等向移动社交网络用户推送问卷链接。在剔除了无效问卷43份后回收有效问卷210份,有效率约为88.1%。

(三)数据分析。

1.信息需求的分布

有关移动社交网络青年用户的信息需求内容分布如下表所示。

由上表可以看出,移动社交网络青年用户的信息需求种类多样,大部分青年用户对信息需求的类型至少都在3种以上。而其中居于首位的是对时事新闻信息的需求,占了20.69%,超过四成用户主要是为了满足时事新闻和关于好友的信息需求。其余的较为强烈的信息需求中,以生活消费、兴趣爱好为主,而兴趣爱好的比重更大,生活消费比重与其所差无几。这与青年群体主张个性张扬、电子商务消费意识逐渐增强而热衷于电子商务有很大的关系。如上表显示,除了时事新闻、好友信息、生活消费、兴趣爱好以外,休闲娱乐、学术专业知识也占一定的比例,分别占据着第五、第四六位,多种的信息需求内容说明了青年用户丰富的感情。

本研究将以上具体信息需求内容归结为四大类:社交沟通需求,包括好友信息;情感表达需求,包括兴趣爱好、群体归属、朋友圈等;新闻资讯需求,包括时事新闻、专业知识;消遣娱乐需求,包括生活消费、休闲娱乐。

四、结论

移动社交网络在创始之初,便是致力于用户的社交关系的扩展维护,而通过对中国互联网网络信息中心近几次调查结果的对比,以及本文的调查研究,得出,移动社交网络用户的新闻资讯需求已经远远超过了社交沟通需求,移动社交网络不再单纯地作为用户用来维护和扩展社交关系的平台,更多地成为用户获得新闻资讯,跟随时事热点的一种工具,用户也可以对获得的新闻资讯进行评论,发表自己的看法,为用户与用户所处的社会环境架起了一坐桥梁。移动社交网络的便捷性、互动性以及信息资源的丰富性和服务的多样化,使更多的用户将移动社交网络当作获取信息的主要渠道。

参考文献

[1]张利,王欢.我国当前移动社交网络用户的基本特征[J].重庆邮电大学学报(社会科学版),2013,29(5):119-123.

[2]杨喜.消费者移动SNS业务使用意愿影响因素研究[D].浙江:浙江大学,2012.

[3]CNNIC.第36次中国互联网络发展状况统计报告[EB/OL].[2015-07-27].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/P020150723549500667087.pdf.

分析用户心理做好参考咨询 篇7

一个多世纪以来, 参考咨询工作从最初的“帮助读者使用馆中庋藏”, 到“提供适当的情报源”, 及完成“知识信息转移”;从“手工检索”服务, 到“计算机和网络参考咨询”服务。其目的只有一个, 引领读者在知识的海洋扬帆远航。

在当今信息化社会里, 存在相当数量的用户, 虽然有现实的信息咨询需求, 但并没有主动走向咨询台。G.A科萨在一篇研究报告中指出, 在959个被调查者中, 37%的人找文献遇到问题时首先求助于朋友, 18%求助于流通人员, 10%求助于教师, 4%谢绝任何帮助, 走向咨询台的仅占31%。有的研究文献把这些有问题而不寻求参考咨询的用户称为“沉默的大多数”, “非提问型信息需求者”。作为图书馆员要让这些沉默的大多数不再沉默, 势必要了解用户信息咨询中的心理特点, 分析影响用户咨询行为的心理因素, 用“心”做好用户的信息咨询工作。

1 用户咨询的心理特点

用户咨询心理是指用户对信息的需求、获取、吸收和利用等方面的心理。在信息咨询活动中, 用户的心理因素起着很关键的作用。用户咨询心理表现出以下几个特点:

1.1 价值心理

用户的价值心理主要表现在两个方面。一方面是依价值而行, 总是希望获得最有参考价值的有用信息, 这里的“有用”完全是个人的认定, 依个人的需要与观念而定。另一方面是唯价值而行。即过份注重信息价值所形成的价值心理。表现为对自己以为无价值的信息进行排斥, 利用单一的标准判定信息的取舍。这是不可取的, 因为信息是多方面的、多层次的, 作为知识, 其价值不能以个人标准来简单评价。

1.2 求便心理

人们在解决问题时, 一般要求找到一个比较便捷、令人满意的方法, 这就是求便心理。用户在利用信息时, 总是倾向于选择距离较近、手续简便、容易获得的信息来源。往往首先想到的是自己手头的现有资料, 其次才想到利用咨询部门的资料。

1.3 求全心理

在有信息需求时, 用户总是希望咨询人员提供的相关信息尽量全面, 并且可以通过不同手段、不同途径同时获取相关资源。

1.4 求新心理

用户的求新心理表现在对信息源的选择上, 倾向于内容新含量大的;在各类型信息的利用上, 除文献信息外, 还注重大众传媒信息的利用;在信息的时效性上, 希望获得最新, 最前沿的资料。

1.5 依赖心理

一方面表现在用户希望可以通过计算机, 网络等技术查找到所需要的一切资料;另一方面表现在, 有些用户对咨询人员的完全信任与依赖, 希望咨询人员可以帮助自己做任何事。

1.6 散漫心理

即脱离时空限制, 产生一种“即时利用”的趋势, 没有系统性和计划性, 散用散记, 要什么就找什么, 找到什么就用什么, 浮于阅读的表层, 流于低层次的“眼到, 手到”, 而失之于“心到”。

1.7 对主动服务的期待心理

越来越多的用户不再满足于有问才答的咨询服务, 面对图书馆越来越丰富也越来越复杂的信息资源, 用户有时也会产生一种无所适从的感觉, 因此就更希望咨询人员可以提供一些在他们想象之外的服务, 主动地向他们传递一些信息。

2 影响用户咨询的心理因素

2.1 用户的气质和性格

气质和性格是比较稳定的心理特征。不同的人有不同的气质、性格特征, 不同的气质和性格特征又会表现出不一样的咨询行为。一般说接近于粘液质、抑郁气质类型和内倾型性格类型的人往往比较稳定、内向和敏感。遇到问题也常会不愿启齿, 不愿与人交流, 或者不善于表达。他们往往习惯于自己查找。而接近多血质, 胆汁质类型和外倾型性格的人, 相对要比前一类型的用户开朗, 热情, 愿意与人接触, 遇到问题也乐于走向咨询台, 接受参考咨询人员的帮助。

2.2 用户的“刻板成见”

美国政治学者Ualte Lippmann在其《舆论》一书中提出“刻板成见”的观点。它指的是对某一类人或事物产生的比较固定的看法, 由此容易形成一种先入为主的印象, 阻碍人与人之间的相互认知。在咨询接谈中, 用户可能因为对咨询的馆员产生不良印象而形成某些成见或偏见, 将咨询馆员定型化甚至在潜意识中通过这种定型将某些品质归于咨询馆员。比如当用户在咨询台提出问题后, 咨询馆员若是神情冷淡或将嘴角一撇 (可能是无意的) , 但用户也许会认为这是对自己提出的问题不屑一顾, 心理障碍由此形成, 随之将产生不满情绪, 影响到交流的进行。更严重的是, 在以后的咨询活动中, 该用户可能将已经形成的印象固定化, 势必将妨碍对对馆员性格特点和职业素养的真正认知, 因而作出错误的判断。所以作为一名优秀的咨询馆员, 应当注意用户的心理状态, 力求避免用户“刻板成见”的产生并及时消除已形成的成见带来的不良影响。

2.3 馆员的“意志疲竭”

意志是指人们自觉调节行动以克服困难、达到预期目标的一种心理。而“意志疲竭” (Burn Out) 是心理学上的一种典型现象, 在咨询接谈中表现为咨询馆员的情绪不稳定、行为倦怠、缺乏耐心等。咨询馆员长期从事固定且重复度较高的工作, 烦躁不安, 厌倦懈怠的情绪极易滋生, 此时意志已逐步丧失对行为的控制力, 从而导致咨询接谈的失败。但心理学上同时认为, 这种意志的波动是暂时的, 正常的, 只要咨询馆员针对“意志疲竭”产生的动因加以适时调节, 这种消极状态的产生是可以避免的。

2.4 双方的心理障碍

国外有关用户咨询接谈的调查研究一再表明, 用户在图书馆里会感到不安。而“图书馆员一般难以体会读者的这种心情, 特别是很少亲自去到生疏的图书馆, 不会充分察觉咨询者陷入脆弱的心理状态”。 (Grogan, Drnis.Practical Regerence Work[R].1978.) 用户的心理障碍通常表现为害羞, 顾虑, 自卑等, 导致其在咨询过程中不能有效地提出问题。一方面由于他们内心中的羞怯心理, 使其不能成功地将潜在的信息需求转化为显性的信息行为, 无法清晰流畅地表述想咨询的问题;另一方面, 在清楚自己信息需求的情况下, 他们也不愿意暴露自己某方面的欠缺甚至无知, 或是不确信咨询馆员能为他们提供有效帮助, 因此对提出的问题含糊其辞甚至干脆缄口不语。不光是用户, 咨询馆员本身也可能存在一定程度的心理障碍。可能对自身专业知识, 业务技能的不足感到自卑, 可能认为职业地位不高而困惑, 迷惘, 诸如此类的心理劣势都将影响咨询接谈的正常进行。尽管咨询双方的心理障碍都难以避免, 咨询馆员仍应当通过自身健康, 自然的言行举止和亲和力来逐步消除由此产生的负面影响。

除此之外, 用户信息咨询还受以下因素的影响。比如用户的性别, 年龄, 职业, 受教育程度, 专业特长, 以及咨询人员的素质, 咨询服务的收费, 信息市场的发育程度等。

3 如何用“心”做好咨询服务

3.1 树立良好的第一印象

咨询接谈作为咨询馆员与用户间面对面的人际交流活动, 很多情况下都始于第一印象。所谓“好的开始是成功的一半”, 如果咨询馆员能够在咨询接谈开始之初充分展示良好的个人素质和友善态度, 激发起用户进一步提问的内心需求和兴趣, 在很大程度上就确保了咨询活动的有序进行。从心理学上来说, 第一印象的产生有赖于人们知觉因素与情感因素的互相结合。咨询接谈时用户的知觉, 主要包括用户进入图书馆时对咨询台及其周围环境的陈设, 布置等情况的整体印象以及对咨询馆员服饰, 谈吐, 面部表情, 身体姿势等方面的综合感知。这些最初的印象将直接影响到用户情感的变化, 从而影响到与咨询馆员的下一步交流。当前, 面对面的直接交流方式越来越多地被以计算机网络为媒介的间接方式所取代。这主要表现为网上虚拟参考台, 实时在线咨询, FAQ解答等, 使用户无须亲自到馆找咨询馆员就能享受到信息服务。咨询接谈中所谓的“第一印象”似乎已从台前退至幕后, 其实不然。比如在图书馆网络参考咨询服务的主页设计上, 要注意界面的有序化, 个性化和友好度, 咨询栏目和窗口设置要充分考虑到用户的直观感受和心理, 要力求给用户留下良好的第一印象, 使其潜在的信息需求被调动起来, 产生咨询渴望和现实的情报行为。在咨询馆员利用网络解答咨询时, 同样需要在一问一答开始之初让用户于字里行间感受到馆员的热情与友善, 从而消除内心顾虑, 大胆明白地表达出提问意图, 为咨询活动的顺利进行铺设一个良好的开端, 从而愿意以愉悦的心情继续利用图书馆。

3.2 运用科学的咨询接谈技巧。

3.2.1 积极的倾听

一方面要做到积极主动, 专心致志地倾听用户所提出的问题, 以全面客观的态度接收信息, 力求最大程度理解用户的真实意图。另一方面, 咨询馆员还应当有意识地记下关键信息, 能用自己的语言复述和解释用户所说的主要内容。

3.2.2 有效的提问

在现代咨询接谈中, 当咨询馆员和用户通过BBS, E-mail, 网上聊天等方式交流时, “有效倾听”能使馆员与用户积极互动。应当特别注意的是, 网络的共享性, 互通性使得对个人隐私的保护变得尤为重要。咨询馆员应具备相关的法律常识, 未经用户同意, 不能随意公布或传播用户的个人情况, 电话等信息。

3.2.3 非语言行为

非语言行为在咨询接谈中发挥着很大的作用。当用户面对咨询馆员时, 直接进入其认知范围的就是咨询馆员的衣着打扮, 表情动作, 举手投足等。咨询馆员的一颦一笑, 一个眼神, 一个细小的动作都可能影响到用户的心理, 导致其咨询意图的转变。一位表情和善亲切, 微笑自然得体的咨询馆员必然会在用户心中留下良好的印象, 让人有如沐春风之感。

用户作为图书馆活力的源泉, 其数量的增加对图书馆很重要, 因此对咨询馆员来说, 必须要认真分析用户咨询心理, 运用科学方法进行参考咨询, 不断总结经验, 提高工作效率。用“心”工作, 在咨询馆员与用户之间架起一道沟通与理解的桥梁, 让“冰冷无情”的机器变得温情脉脉, 使图书馆服务中浓厚隽永的人文关怀通过快速便捷的网络得以有效传递, 使图书馆的服务宗旨和服务特色得以经久不衰地传承与发扬, 引领读者在知识的海洋扬帆远航。

摘要:本文分析了用户咨询的心理特点, 及影响用户咨询的心理因素, 指出了做好参考咨询服务的具体方法。

关键词:咨询,心理特点,心理因素,方法

参考文献

[1]詹德优.信息咨询理论与方法, [M]武汉大学出版社2010、3.

[2]朱慧.利用数字参考咨询服务解决读者心理问题, [J]河南图书馆学刊, 2008、10.

宽带用户障碍分析与处理 篇8

1.1用户终端Modem的Pow工作状态

根据Modem的指示灯Pow状态灯不亮

现象1:电话可以打, 上不了网, Modem没有电。

判断:电源线没有接好

处理结果:重新接好电源线、插排队插头后, 上网正常。

现象2:电话可以打, 上不了网, Modem没有电, 电源线已接好, 仍然没有电。

判断:Modem电源变压器坏

处理结果:更换Modem上网正常。

现象3:电话可以打, 上不了网, Modem没有电, 电源线已接好, 仍然没有电Modem电源变压器没坏。

判断:Modem坏了, 加不上电

处理结果:更换Modem后上网正常。

1.2用户终端Modem的网卡Link灯工作状态不亮

现象1:电话可以打, 上不了网, 拨号后显示错误678超时与服务器连接不上

判断1:Modem死掉

处理结果:重开启Modem电源, 激活后上网正常

现象2:电话可以打, 上不了网, 拨号后显示错误678超时与服务器连接不上

判断1:网卡驱动有问题、网卡坏、pc机插槽不好、拨号网络有问题

处理结果:检查网卡是否正常工作, 具体办法是:在计算机桌面上找到“我的电脑”单击鼠标右键, 选择“属性”如果是win2000系统或xp系统选择“硬件”选择“设备管理器”[如果是win98系统可直接选择“设备管理器”], 并查看“网卡”或“网络适配器”栏目下有没有带“?”或“!”的设备。如果有, 先删除该设备后, 单击“刷新”重新安装网卡驱动程序如计算机找不到网卡将网卡更换个槽位。如果还不行只有更换网卡并安装网卡驱动程序。将被破坏的拨号网络卸载, 再重新安装, 同时建立拨号网络输入正确的帐号与密码后, 上网正常。

判断2:检查从Modem到主机之间网线类型是否正确。

处理结果:网线类型不正确更换网线后, 上网正常。

判断3:检查网线连接是否有效。

处理结果:用户计算机网卡接口与网线插头没有接好, 重新插接牢固后上网正常。

判断4:Modem内部参数值;检查Modem的vpi与vci的参数值设置是否符合网络要求。

处理结果:将pc机网卡ip设置为192.168.1.2子网码设置为255.255.255.0保存后, 进入设置网址192.168.1.1页面上将原初厂vpi和vci的参数值为0, 35 (8, 35) 改成0, 67 (龙井上网值) 保存后重起。上网正常。

判断5:上行接口数据数据pvc没有加。

处理结果:通知网管人员检查并添加后上网正常。

现象2:电话可以打, 上不了网, 拨号后显示错误679, 超时与服务器连接不上。

判断:网卡被禁用

处理结果:如果网卡被关闭, 按上述方法找到“网卡”或网络适配器中是否有带“红X”[网卡关闭]如果有点中网卡“按鼠标右键”选择“启用”后“红X”消失重起动系统, 上网正常。

1.3用户终端Modem线路Adsl/Link灯工作状态不亮

现象1:电话通, 上不了网LINK/ACT灯不亮。

判断1:检查电话线和分离器连接是否正确、分离器是否好

处理结果1:用户将分离器中外线口link与电话口phone线换位, 重接后上网正常。

处理结果2:电话线插头与modem插座错位, 更换电话插头后上网正常。

处理结果3:更换分离器后上网正常。

判断2:使用电话机检查电话线路是否有故障, 是否断线、是否有绝缘、它混。拨该用户电话后在电话中听是否有正常拨号音、能否接通电话、如电话不通, 证明线路断线, 若拨通电话, 在通话中听到有地气声[呜….]证明该线路绝缘不良, 在通话中, 如果有串音现象, 可能线路有它混。

处理结果1:用户线路环阻无穷大[线路环阻应小于1000欧姆为正常]、质量差, 通知机线员更换线路后上网正常。

处理结果2:该用户绝缘不良[对地电阻应大于或等于20兆欧为正常], 通知机线员更换外线后上网正常。

处理结果3:电话通但有杂音, 不能达到上网线路指标, 通知机线员更换线路后上网正常。

判断3:检查link与phone线在局端总配线架交叉[将link端线配到电话端, 将phone端线配到外线侧]此时, 用户端Modem显示不正常, 不能正常上网, 但电话通话正常。

处理结果:通知112机房将link线配到外线端, 将phone端线配到电话端, 后上网正常。

判断4:检查电话线连接是否可靠。

处理结果1:用户端家中电话线接头太多已老化接触不良, 更换用户室内电话线、或插头、插座后上网正常。

判断5:检查用户端modem的link外线侧是否有串接电话机[上网时断时续]

处理结果:将modem端外侧串接电话机改为modem端phone接口侧, 用户上网正常。

1.4电话通, 用户终端Modem的ADSL灯、网卡Link灯均正常, 上不了网。

现象:电话可以打, 上不了网, 拨号连接后不能上网, 计算机显示错误信息为E0037p[请确认正确的用户名与密码]。E0691p[访问被拒绝是因为在本局域网中用户名与密码无效]。

处理结果:1:局端数据没有做, 数据做好后上网正常。

判断2:数据做的是否正确

处理结果:做错, 更改局端数据后上网正常。

判断3、用户帐号与密码格式错误

处理结果:在用户端拨号网络中输入正确的用户帐号、密码后上网正常。

判断4用户帐号及密码被挂死

处理结果:在局端机房内将挂死用户帐号清链接后, 用户上网恢复正常。

2能上网但速度慢

现象:用户能上网但打开网页特别慢、在网上测试下载速率为5k、6k.左右

判断:用户线路质量不好、用户终端软件是否有问题、用户Modem是否有问题、上行端口是否有问题。

处理结果1:用户线路质量差导致用户上网速度慢, 通知线路员更换外线后上网正常。

处理结果2:用户PC机IE浏览器有有问题、其它软件有问题造成, 系统重新安装后上网正常。

处理结果3:宽带Modem有问题, 更换后上网正常。

处理结果4:物理连接速率是正常查上网慢, 用户端口物理连接速率与文件传输速率相差太大, 改变上行节点速率瓶颈问题后上网正常。

3能上网但经常掉线、有瞬断现象。

3.1能上网但经常掉线

判断1:线路质量不好、过长, 线路噪声大

处理结果:通知线路员更换言之外线后正常。

判断2:室内接头多接触不好。

处理结果:重新换室内线或重接接头后上网正常。

判断3:局内端口参数设置不当, 打开网页后频频掉线。

处理结果:重新调整端口参数后用户上网比较稳定。

判断4:用户端没有安装分离器, 数据线与音频线没有分开, 造成上网掉线。

处理结果:装上分离器重新接好Adsl与Phone线后上网正常。

3.2能上网有瞬断现象

判断1:用户能上网但瞬间断, 用户PC机安装了某种特殊软件所造成。

处理结果:先检查用户PC机其它软件是否有影响上网可能, 如果有关闭或删除该程序, 重起计算机后上网正常。

判断2:用户PC机或IE浏览器有病毒造成。

处理结果:杀毒或重做系统。

判断3:用户在Modem设备中设置上网时间段造成

处理结果:将设置在Modem设备中上网时间取消后上网正常。

判断4:用户PC机 (接色网的网口) 没有上网的业务时收到大量不正常网络报文, 可以查看网卡灯闪亮情况进行确定用户被攻击阻塞造成。

处理结果:查出网络攻击源, 采取措施

判断5:用户线路故障导致Adsl瞬间断

用户分析 篇9

1 用户属性及关系数据的采集

分析用户影响力的一般过程, 首先是通过采集器采集用户属性数据及其关系数据, 然后对采集到的数据进行规整和建模, 最后建立评价指标对用户影响力进行评价。

1.1 采集策略的制定

采集论坛用户数据的最有效方法是论坛管理员直接获得后台数据, 但是这种方法往往难以实施, 常用的方法是使用网络爬虫对特定论坛进行抓取。要想高效地获取有价值的用户数据, 必须遵循一定的抓取策略。抓取策略主要包括初始用户集合的确定、搜索算法的选取、干扰用户的鉴别、终止条件的确定等方面。

(1) 初始用户集合的确定。可以有多种方法, 例如可以选择论坛热帖的楼主和跟帖者作为初始用户集合, 也可以选择某主题新帖的楼主和跟帖者作为初始用户集合, 还可以以各版块版主作为初始用户集合等。

(2) 搜索算法的选取。主要分为广度优先、深度优先和最佳优先策略三种算法。广度优先算法以初始用户集合为中心进行逐层扩展, 采集的用户与初始用户关系密切;深度优先算法以初始用户集合为起点进行深度搜索, 易搜索出复杂的关系网。

(3) 干扰用户的鉴别。论坛中除了大量的僵尸用户外, 还有不少水军, 排除这些用户更利于提高用户分析的效率和准确性。可以通过查看用户登录时间、发帖数量、发帖质量来进行有效鉴别。

(4) 终止条件的确定。用户搜索必须设置终止条件, 例如:可以设定用户数量上限、可以设定搜索次数、可以设定搜索深度等。不同的用户分析需求应该选择不同的终止条件。

依据采集目的, 本文采取的策略为:以涉军板块新帖楼主和跟帖者为初始用户集合, 采用广度优先的搜索算法, 屏蔽长时间没有登录的用户和发帖质量较低的用户, 直至搜索不到新的有效用户为止。

1.2 采集步骤的设计

本文采集的论坛中, 用户可以通过添加关注的方式将其他用户加自己的“好友”, 好友的最近动态将被自动推送给关注用户。关注某用户的用户称之为被关注用户的“粉丝”。

本文以涉军板块近期新帖楼主和跟帖者为初始用户集合, 采用广度优先搜索近期登录的用户和发帖质量较高的用户, 循环以上步骤直至搜索不到新的有效用户为止。采集步骤设计如下。

(1) 查找该论坛11个涉军板块近一个月的新帖, 将楼主和跟帖用户确定为待搜索用户集合。 (2) 遍历待搜索用户集合中的用户, 选择粉丝数大于10或者年发帖量大于50或者年精华帖大于2的用户, 采集该用户的粉丝。 (3) 遍历待搜索用户集合中的用户, 选择关注数大于10或者年发帖量大于50或者年精华帖大于2的用户, 采集该用户的好友。 (4) 将待搜索用户集合清空, 并将步骤 (2) 和步骤 (3) 中采集到的新用户添加到待搜索集合。 (5) 重复 (2) 、 (3) 、 (4) 步骤, 直至待搜索集合为空。

1.3 采集的量化结果

经过两天时间的采集, 用户关系网络得到收敛, 获得一个联通有向图。本次采集, 共抓取用户14 509个, 用户关系163 647个。分析该联通有向图, 存在13个环, 平均度数为22.56。用户网龄最长的为12年, 用户最多发帖222 076个, 用户最多精华帖1 604个, 用户最多粉丝数432个, 用户最多好友数为353个。

2 从用户属性分析用户的影响力

用户影响力是指用户驱使其他用户认同某观点或使信息广泛传播的能力。国外较早开始对社交网络的研究, 主要是针对Twitter用户, 多数算法是基于著名的网页排名算法Page Rank算法, 对影响因子的选取主要有转贴、回复、提及的能力。不同论坛的用户属性数据有所区别, 但最重要的是发帖数量、精华贴数量及点赞数等属性。

2.1 用户影响力相关主要属性

直接采集到的论坛用户属性主要包括发帖数量、精华帖数、好友数和粉丝数。

(1) 发帖数量。发帖数量指的是用户发表的主题帖和评论帖的总数。发帖数量的多少直接体现了用户的活跃度, 显然用户发帖数量越多, 影响力就可能越大。经统计, 用户发帖量符合二八原则, 发帖最多的前21.7%用户发布了80%的帖子, 而近3%的用户没有发帖。用户发帖量与用户数分布近似指数分布。

(2) 精华帖。精华帖是指引起热议的原创帖。精华帖数体现了用户的发帖质量, 是其他用户对该用户发帖的认可度, 可以体现出用户影响力。

(3) 好友数。好友数是指用户关注其他用户的数量。好友数的多少反映了该用户获取信息的愿望和能力, 可以在一定程度上提高用户影响力。经统计, 26.7%的用户关注了多于10名的好友, 其中1%的用户关注了多于100名的好友, 没有好友的用户几乎没有。

(4) 粉丝数。粉丝数是其他用户对该用户关注程度的直接反映, 是反映用户影响力最为直接的属性。经统计, 35.3%的用户拥有超过10名的粉丝, 其中1.3%的用户拥有超过100名的粉丝, 56%的用户没有粉丝。

2.2 用户影响力分析

用户属性中与用户影响力相关的属性主要有发帖数量、精华帖数、好友数和粉丝数。使用4种属性对用户进行评价并对用户进行排序, 得到4种不同的结果, 见表1。

2.3 属性相关性分析

用户的发帖数量、精华帖数、好友数和粉丝数是与用户影响力最为相关的几个属性。经分析, 发帖数量、精华帖数与粉丝数均没有明显的线性相关性, 存在很多精华帖不多、但粉丝数很多的用户;也存在不少精华帖较多、但粉丝数较少的用户。发帖数量、精华帖数与好友数也不存在明显的线性相关性, 发帖数量与精华贴数也不存在明显线性相关性, 好友数与粉丝数也不存在明显线性相关性。

3 从用户关系分析用户影响力

社会网络分析方法是由社会学家根据数学方法﹑图论等发展起来的定量分析方法, 以社会结构为主要研究对象, 而不特别关注个体属性。

3.1 社会网络中的用户影响力

从社会网络角度分析, 用户影响力主要表现为信息获取能力、信息传播能力和信息控制能力。

信息获取能力是指用户收集特定主题信息的能力。在社会网络中, 好友越多, 越容易获得信息;好友影响力越大, 越容易获得高质量信息。信息传播能力是指用户发布的帖子传播的广度和速度。在社会网络中, 粉丝越多的用户, 发布的帖子传播越广;粉丝的影响力越大, 发布的帖子传播得越快。信息控制能力是指用户在信息传播过程中作为“消息中间人”所发挥的作用。在社会网络中, 经常作为其他用户中间人的用户信息控制能力较强。

在社会网络分析中, “中心度”是用来描述个人或组织在社会网络中居于怎样地位的一种度量, 主要度量有“度数中心度”“中间中心度”和“邻近中心度”等。

(1) 度数中心度是描述节点度数的一种度量, 用节点的度数表示。如果某节点具有较高的度数, 自然与其他节点“关系密切”。在有向图中又分为“内中心度”和“外中心度”, 分别对应“点入度”和“点出度”。“内中心度”可以描述用户传播信息的能力, 粉丝越多, 传播能力越强;“外中心度”可以描述用户获取信息的能力, 好友越多, 获取信息能力越强, 从而进一步影响其粉丝。

(2) 中间中心度是描述节点发挥“中间人”作用的一种度量, 用节点通过任意其他两个节点最短路径的次数表示。如果最短路径是某两个节点的唯一最短路径, 则次数增加1, 否则增加m/n (其中n为最短路径的条数, m为经过该节点的最短路径条数) 。如果一个节点多次位于其他节点的最短路径上, 则此节点居于重要地位。该指标可以描述用户在传播信息中发挥“消息中间人”作用的重要程度。

(3) 邻近中心度是描述节点与其他节点邻近程度的一种度量, 用节点与其他节点最短路径之和的倒数表示。如果某节点与其他所有节点的总距离较短, 则该节点对其他节点的影响则较为直接。在有向图中, 该度量又分为内邻近性和外邻近性。内邻近性越大表示该节点的消息扩散越快, 外邻近性越大表示该节点能够较快获得其他节点的消息。

3.2 用户影响力分析

使用复杂网络分析软件, 计算用户关系网络的“度数中心度”“中间中心度”和“邻近中心度”3个度量共5个指标, 并对用户进行排序, 得到5种不同的结果, 见表2。5种结果从不同角度分析了用户在关系网络中的中心地位。

3.3 指标相关性分析

“度数中心度”“中间中心度”和“邻近中心度”从不同角度分析了用户在社会网络中的地位, 从计算方法来看, 可能有一定的相关性。经分析用户度数中心度与邻近中心度存在相关性, 内中心度与外中心度不存在明显的相关性, 中间中心度与其他中心度指标不存在明显的相关性。

4 用户影响力的综合评价

从用户属性分析用户的影响力, 主要关注用户创造信息的能力, 而从社会网络分析用户的影响力, 则主要关注用户传播信息的能力。笔者使用投票法对多种结果进行综合评价, 对该投票法计算方法进行如下所述。

假设存在m种评价指标, 分别表示为Ci (i=1, 2, …, m) 。用Ci (n) 表示节点n在第i种评价指标中的得分, 用Si (n) 表示节点n在第i种评价指标中的排名, 用Nia={n|Si (n) ≤a}表示在第i种评价指标中排名在前a名的节点集合。用C表示使用m种评价指标进行投票的综合评价指标, 则Ca (n) =F1a (n) +F2a (n) +…+Fma (n) (其中Fia (n) =1当且仅当n∈Nia, 否则=0) 。用Sa (n) 表示节点n在综合评价指标中的排名, 用Nba={n|Sa (n) ≤b}表示在综合评价指标中排名在前b (b≤a) 名的节点集合, 则Nba即为综合评价的结果。

从两种视角共9种指标中选取相互独立的发帖数量、精华贴数、好友数、粉丝数和中间中心度5种指标对用户进行综合评价, 取a=20, b=10, 则可以计算出综合影响力排名前10名的用户, 见表3。

从表3中看出, 影响力前10名的用户中, “1306246”和“1857202”在关系网络中地位最为重要, 在5项分指标中3次进入前20名;其他用户则仅有2次进入前20名。因此, 用户影响力综合评价方法充分考虑了用户的主要属性和社会网络关系, 能较为客观地对用户按照影响力进行了排名。

参考文献

[1]张殿芳.基于网页分块的论坛爬虫关键技术研究[D].哈尔滨:哈尔滨工业大学, 2009.

[2]唐飞龙, 叶施仁, 肖春.基于用户质量的微博社区博主影响力排序算法[J].计算机工程与应用, 2015 (4) .

[3]路远聪, 刘云.基于用户能量排序的论坛用户影响力分析[J].铁路计算机应用, 2014 (12) .

用户分析 篇10

集群通信采用PTT (Push To Talk) 的方式实现群组通信, 以一按即通的方式接续, 被叫无须摘机即可接听, 且接续速度较快, 并能支持群组呼叫等功能。由于具有组群灵活快捷、通话方便的特征, 集群通信越来越得到广泛应用。

为了满足多种行业用户以及各种场所工作人员的集群调度需求, 必须要采用信道共享方式来满足集群用户在容量上的需求。反之而言, 对于每个群组, 其容量设计成为群组配置时必须考虑的重要因素。

2 GoTa系统模型

GoTa (GlobalopenTrunkingarchitecture) 集群通信系统基于cdma2000 1X网络, 具有较强的共网运营能力和业务发展能力。

GoTa集群通信原理为:对于群组内的多用户, 共享两条前向业务信道和两条反向业务信道。在两条共享前向信道中, 一条前向语音信道, 所有听用户接听该信道信号, 获取说用户的语音;一条前向信令信道, 所有听用户接听该信道信号, 接收前向信令消息。在两条共享反向链路中, 一条反向语音信道, 说用户占用该信道发送反向语音和信令;一条反向信令信道, 听用户分共享该信道发送反向信令。同时, 群组设置有队列缓冲器, 当某一用户申请话权而此时共享业务信道占用时, 用户进入队列排队等待。如果队列已满, 则用户获得话权失败。

根据以上原理并考虑到用户接入, GoTa系统模型可以简化为:

接入:小区群组内的用户等效共享1个接入信道 (空口) , 接入时间为60 ms。如果1个用户A正在接入, 其他在用户在A用户的接入期间 (60 ms) 接入, 那么这些用户 (除用户A外) 将会接入失败;

通话:一个用户接入后将进行通话。当一个用户A正在通话时, 根据不同的话务模型, 其他用户无接入或者可以进行接入过程。对于在A用户通话期间接入成功的用户, 如果队列不满, 将进入队列进行排队, 等候A用户通话完毕再进行通话;如果队列已满, 那么该用户会话将失败。

3 话务模型

传统地, 集群通信系统主要用于集团调度指挥。群组内的大量用户集中在单个或几个小区内进行集群调度, 其应用场景包括码头、机场、运动场馆、大型集会等工作人员数量众多的场所, 也包括酒店服务、大厦保安、电力保障等人员工作区域相对集中的行业。在该话务模型下, 由于调度需要, 在通话进程中无新用户接入申请话权。

实际上, 除调度指挥外, 集群通信还常用于由某一特定目的的用户组成的群组。群组内用户平等无组织调度关系, 其用户行为与一般话务相同。在该模型下, 在通话进程中新用户可以接入申请话权。

平等用户模型下的话务模型可以描述为:

(1) 用户到达符合指数分布, 即

其中λ为用户到达频率;

(2) 接入时长为0.06 s;

(3) 单用户话务量为0.02Erl, 平均通话时长5 s, 则用户到达频度为

单用户话务量/平均通话时间长=N*0.02/5=0.004N (次/秒)

其中N为用户数;

(4) 用户通话时长符合指数分布, 平均通话时长5 s, 即

其中Tav为每次通话平均时长。

(5) 等待队列长度为3;

(6) 不考虑用户优先级。

4 平等用户模型下群组用户容量仿真分析

(1) 固定每用户平均话务量、平均通话时长的情况下, 用户变化对呼叫失败率的影响仿真

根据平等用户群组的话务模型进行容量仿真。仿真步骤为:

(1) 设置需要仿真的群组用户数目;

(2) 产生某群组用户数目下的会话序列 (指数分布) 、会话时长 (指数分布) ;

(3) 对每个会话进行处理, 确定接入区间和通话区间;

(4) 判断当前会话的后续通话是否落入接入区间或者通话区间;

(5) 记录接入失败和通话失败的用户数;

(6) 遍历所有后续通话;

(7) 遍历某群组用户数目条件下的所有会话;

(8) 得到该群组用户数目条件下的通话失败比例;

(9) 遍历所有群组用户数目条件下的通话;

(10) 得到所有群组用户数目条件下的通话失败比例。

仿真结果如图1所示:

由上可知, 当用户数增加为20时, 呼叫失败率约为1%。在用户数<15时, 呼叫失败率较小, 且变化也较小;当用户数>15时, 随着用户数的增加, 呼叫失败率也急剧增加。

(2) 目标失败率为1%, 在平均通话时长、接入时长固定的情况下, 仿真呼叫到达频度与用户数的关系

仿真条件为:

目标失败率=1%;接入时长=0.06 s;每用户平均通话时长=5 s。

仿真步骤为:

⑴设置目标失败率为1%;

⑵产生每小时每用户到达频度序列;

⑶尝试某个用户数;

⑷产生会话序列 (指数分布) 、会话时长序列 (指数分布) ;

⑸对每个会话进行处理, 确定接入区间和通话区间;

⑹判断当前会话的后续通话是否落入接入区间或者通话区间;

⑺记录接入失败和通话失败的用户数;

⑻遍历所有后续通话;

⑼遍历某群组用户数目条件下的所有会话;

⑽得到该群组用户数目条件下的通话失败比率;

⑾通话失败比率与目标失败率相比较, 如果小于目标失败率, 则增加用户数, 重复4~10;如果大于, 则往下执行;

⑿遍历所有每小时每用户到达频度序列;

⒀得到呼叫到达频度与用户数的关系。

仿真结果具体数值为:

从表2仿真结果可知, 在目标失败率固定 (实际上由于单用户呼叫到达频度与用户数都是整数, 因此会有细微变化, 见表2) 的情况下, 小区支持的用户数随呼叫到达的频度增加 (1~30) 而减少。仔细观察, 在单用户呼叫到达频度为17时, 用户数目为19, 大于频度为16、18时的用户数目18。仿真结果表明, 单用户呼叫到达频度为17、用户数目为19时, 对应的呼叫失败概率为0.012, 而用户数目为18时对应的呼叫失败概率为0.0087, 即与目标失败概率1%更为接近, 因此取单用户呼叫到达频度为17时, 用户数目为18。仍然符合小区支持的用户数随呼叫到达的频度增加 (1~30) 而逐渐减少的规律。

上述误差是由于仿真循环的计数值增加方法造成的, 因此需要对±1数据进行处理, 结果如下:

从图2可知, 每用户呼叫到达频度<12时, 随呼叫到达频度的增加, 小区支持用户数急剧下降;每用户呼叫到达频度>=12时, 随呼叫到达频度的增加, 小区支持用户数开始缓慢下降, 尤其是频度从19~30时, 小区支持用户数仅从15变化为10。

(3) 目标失败率为5%, 在平均通话时长、接入时长固定的情况下, 仿真呼叫到达频度与用户数的关系

仿真条件为:

目标失败率=5%;接入时长=0.06 s;每用户平均通话时长=5 s;

仿真步骤同2。

进行±1数据处理后的仿真结果如图3所示:

从图3可知, 每用户呼叫到达频度<13时, 随呼叫到达频度的增加, 小区支持用户数急剧下降;每用户呼叫到达频度>=13时, 随呼叫到达频度的增加, 小区支持用户数开始缓慢下降, 尤其是频度从22~30时, 小区支持用户数仅从23变化为18。

5 传统模型与平等用户模型下群组容量的比较

对于传统模型, 由于在通话进程中新用户不进行呼叫请求, 群组容量主要受限于接入碰撞。根据中兴计算结果, 传统模型的接入碰撞 (通信失败) 概率如表5所示:

比较表3、表4、表5, 可以发现在相同的用户到达频度条件下, 传统模型和平等用户模型下的单小区群组内容量有很大差距, 如表6所示:

相同条件下传统模型单小区群组内用户容量是平等模型的几十倍。可见不同的用户模型下群组能支持的用户数有明显不同。

6 结论

在给出GoTa系统模型的前提下, 本文描述了平等用户模型, 然后仿真分析了固定每用户平均话务量、平均通话时长的情况下, 用户变化对呼叫失败率的影响, 以及目标失败率为1%与5%, 在平均通话时长、接入时长固定的情况下, 仿真呼叫到达频度与用户数的关系。通过与传统模型比较表明, 相同条件下传统模型单小区群组内用户容量是平等模型的几十倍。

参考文献

[1]中兴通讯, GoTa系统无线技术, 2008

用户分析 篇11

【关键词】重选;周期性位置更新;周期性路由区更新;深度覆盖;RRC连接;ECIO;弱覆盖

引言

联通WCDMA采用2.1G频点,相对于GSM频点,3G的穿透、绕射能力相对较差,导致3G深度覆盖不足现象。常规评估网络覆盖是基于DT测试、投诉测试,这需要耗费大量的人力物力,效率低下。同时DT一般仅限于路面覆盖,无法有效评估深度覆盖。投诉测试是补救措施。本文介绍一种更及时、更有针对性的评估3G网络深度覆盖情况的方法—基于用户的覆盖分析。

一、基于用户的覆盖分析

基于用户的覆盖评估是通过分析每个小区上驻留用户的数量、覆盖情况(即ECIO值),从而评估小区的覆盖情况。用户数量越多、用户分布越均匀,评估结果越准确。

首先我们定义,当小区有一定的驻留用户数量,且处于弱覆盖用户比例超过一定门限,该小区即有较大概述存在覆盖问题。

我们分两种情况分析3G用户的覆盖情况,一是重选至GSM小区的用户。3G网络以ECIO为做重选测量量,一般异系统重选测量门限是-12dB或者-14dB。即当UE的ECIO<-12/-14dB且持续一段时间后,UE启动异系统测试,并进行R准则排序,满足条件则重选至异系统。所以我们判断,驻留在GSM小区的3G用户其相应的ECIO<-12/-14dB,这类用户为弱覆盖用户。

二是驻留在3G网络中的3G用户,统计这些用户空闲状态下的ECIO值,根据ECIO值是否小于-10dB来判断是否处于弱覆盖。

将上述2种统计得来的结果综合分析,即可知道每小3G小区当中有多少用户处于弱覆盖,占用户总数的比例,从而实现基于用户的覆盖分析。

二、周期性位置更新

周期性位置更新是网络在特定的时间内没有收到UE的任何消息,即特定的时间段内,UE没有和网络发生交互。系统则会采取强制登记措施,要求UE在一特定时间内,登记一次,这种位置登记过程就叫做周期性位置更新。

利用周期性位置更新这种特性,我们从系统侧收集用户驻留信息以及相关的覆盖情况。针对驻留在GSM小区上的用户,我们只需要了解用户驻留的小区号即可。驻留在3G网络中的用户,我们还需要收集用户发生周期性位置更新期间的ECIO值。下面我们将分两种情况分别介绍如何收集用户驻留信息和相关的覆盖情况。

三、驻留在GSM小区上的用户覆盖分析

1:利用周期性位置更新特性,从核心网提取所有驻留在GSM网络上用户的信息,信息包括用户当前所驻留的小区。

2:从上述用户中,区分出3G用户,这里所指的3G用户不仅仅是3G号码,还需要具备3G终端,有能力在3G网络驻留。

核心网利用GSM用户周期性位置更新或者最后一次业务可以获取用户所驻留的小区,但这类信息有一定的延迟性,如核心网当前记录A用户驻留在1小区上面,但一段时间后(不超过周期性位置更新时长)A用户一直处于空闲态,且在同一个LAC中移动,则A用户实际驻留到2小区,而核心网还是记录A用户的驻留小区依然是1小区,这对覆盖评估准确性有很大的影響。针对此问题,我们结合福州用户生活习惯—凌晨3-6点之间,绝大多数用户处于深睡眠状态,相应的用户终端处于静止状态。即对绝大多数用户来说,最后一次周期性位置更新时所上报的驻留小区,也是当前驻留的小区。

四、驻留在3G小区上用户的覆盖分析

相对于GSM网络,WCDMA网络核心网增加了PS域,相应的在WCDMA无线网络增加了路由区这个概念。新增加的PS域也需要保留最新的UE信息,以保证下发寻呼的准确性,这就涉及到周期性路由区更新。

福州周期性路由区更新的定时器为36分钟,即用户36分钟内无业务发生,没有和网络侧交互,则定时器到期时,UE将主动发起周期性位置更新。PS域据此获取UE的驻留信息,以保证寻呼成功率。

通过EXCEL处理,即可得到每个小区驻留多少用户,有多少用户的ECIO>-10dB、-12dB、-14dB。经处理好的数据如下表所示,由下表可以获知,每个3G小区ECIO<-10dB、-12dB、-14dB的用户量,这代表了3G覆盖区域内存在弱覆盖。

结合驻留在GSM上的3G用户情况和驻留在WCDMA上的覆盖情况,即可获知每个3G小区内处于弱覆盖的用户数和总用户数,通过计算可得每个小区处于弱覆盖用户的比例。当3G小区有一定的用户量(福州取值28个),且小区中处于弱覆盖用户的比例超过一定门限(福州取值10%)时,则筛选出来优化处理覆盖问题。

案例:

按上述方法,我们评估福州主城区内的深度覆盖情况。发现福州仓山师范大学-2处于弱覆盖用户的比例高达38.3%,且有一定的用户量,同时分析周边小区福州仓山滨海大厦-3、福州仓山政法学院-1,这两小区的弱覆盖用户比例也大于10%。由此我们判断这3小区当中存在3G弱覆盖,安排测试人员对该区域进行DT、CQT测试,发现该区域内新建一高层小区,小区存在内存在局部弱覆盖,室内存在大面积弱覆盖。经协调沟通后,在该小区内新加一宏站。加站前后室内覆盖情况恢复正常。

加站后重新对上述3个扇区进行复评估,评估结果如下表所示:

用户浏览轨迹算法分析与应用 篇12

随着计算机网络的迅速发展, 越来越多的企业和机构都通过互联网树立形象、宣传产品。但在竞争日益激烈的网络经济中, 只有赢得用户, 才能最终赢得竞争的优势。作为一个企业网站的管理员或拥有者, 应该知道访问网站的用户都需要些什么, 知道网站哪些内容最为用户所喜爱, 哪些不受用户关注, 什么样的改动带来了显著的用户满意度提高, 什么样的改动反而丢失了用户等等。而基于WEB数据挖掘技术正能满足这些需求。

基于WEB数据挖掘, 就是利用数据挖掘技术自动地从网络文档以及服务中发现和抽取信息的过程。根据挖掘的对象不同可分为三大类:基于WEB内容的挖掘、基于WEB结构的挖掘以及基于WEB使用的挖掘。

本文所提出的算法, 属于基于WEB使用挖掘的范畴, 对包含用户访问网站时的点击行为的日志文件进行挖掘和归纳, 从而了解用户的行为数据所具有的意义。笔者认为, 传统上对用户点击行为的分析, 均从宏观的角度出发, 着眼于群体用户的点击行为分析, 往往不太重视对个体用户行为进行有效的分析, 并忽略了用户行为的时间特性。有鉴于此, 本文将着眼于个体用户的点击行为, 挖掘其点击序列, 并从多个序列中总结出共性, 分析出隐藏在点击行为后的浏览习惯, 并将分析结果用于网页内容的调整与自动推送。

2. 分析用户浏览轨迹前的准备

用户在进入网站浏览的过程中, 对网页上各种信息的点击按时间先后顺序形成点击序列, 称之为用户浏览轨迹。通过对用户浏览轨迹的分析, 我们可以发现用户浏览页面和网上行为之间的潜在关系。例如, 在多个确定的浏览轨迹中发现存在这样的一个共同规律:用户在访问某一户外运动产品 (例如登山包) 网页后, 有27%的用户接下来访问户外帐篷这一产品的页面, 有21%的用户访问望眼镜这一产品页面, 12%的用户访问了军刀这一产品页面, 另有40%的用户选择浏览其他网页或是离开该网站。根据这一发现, 可以重组网站内容, 将用户潜在的最有可能浏览的网页内容进行实时推送。

在进行具体分析前, 需要先考虑以下几个方面的问题:

2.1 用户识别

由于用户轨迹分析是建立在单用户粒度上的分析和统计, 所以如何识别单个用户的身份就显得尤为重要。由于代理服务器、防火墙、Internet服务提供商采用动态分配IP地址等问题, 使得用户识别变得复杂。目前识别用户常用的方法有:IP地址、嵌入Session ID、Cookies和注册等方法。由于本文研究对象是用户某一次浏览过程中的点击行为, 对于某一访问用户, 只需分析其从进入网站到离开网站之间的点击行为, 无论该用户是否注册, 其点击数据均具有研究价值, 故除已注册用户外, 需通过启发规则来识别用户, 即不同的IP地址代表不同的用户。

2.2 数据准备

实验环境下的用户行为和真实网络环境下的用户行为是有所差异的。为了研究真实网络用户的点击行为, 笔者在某一商品网站中加入日志采集功能, 收集到一段时间内的真实网络环境下的用户点击日志。日志表中包含用户名、用户IP、点击时间以及商品ID共计4个信息项。其中, 用户名是用户注册后, 系统区别用户的唯一标识, 通过它可以确保是对同一用户的日志信息进行聚集, 实现对同一个用户点击行为的分析研究;用户IP是系统区别非注册用户的身份标示, 作用与用户名相同;点击时间是用户发生点击操作时的时间, 是构成点击序列的重要依据, 通过对该网站历史访问量的分析, 决定将其精度定为秒;商品ID是商品的标示指用户点击某一页面时, 该页面所呈现。在用户身份确定的前提下, 商品ID按点击时间的排序就为该用户的浏览轨迹。

3. 用户浏览轨迹分析及应用

3.1 模型分析

通过数理模型的分析, 从用户点击日志表的大量数据中有针对性的获取以下信息:如在点击日志表的某个时间段内, 浏览某件商品的每一位用户接下来最喜欢浏览的商品是哪些, 这些商品在“接下来浏览”的行为中被浏览的次数是多少, 并对其浏览次数进行统计。其过程如图1所示:

统计数据可用于预测出最可能被用户浏览的商品信息, 并在用户浏览相应商品页面时, 将相应产品信息推送给该用户。

3.2 算法实现

以用户访问商品ID编号为17的页面为例, 描述该算法的详细实现过程。

(1) 当访问某件商品页面时, 由页面链接参数值得到该商品的ID值。以该ID值为关键字, 查询用户点击日志表内某段时间内所有关于该商品的访问记录, 并将查询到的所有记录存放到一个数组中。

(2) 通过判断点击记录中, 同一用户的点击时间间隔, 可以划分出用户的一次完整浏览过程, 即用户从进入网站到离开网站的过程。在用户点击日志表中查询该ID商品一段时间内的访问记录, 结果如表1所示:

(3) 将该数组的记录数作为循环次数, 进入循环。每次循环取出数组中一条记录, 记录中包括用户名称、用户IP、商品ID和访问时间。以前3个值为关键字, 以最后一个值的访问时间为范围限定, 从点击日志表中查询到在这条记录之后, 同一位用户浏览的下一个商品的访问行为的详细信息, 并记录在另外3个一维数组中, 3个数组分别记录用户名或IP、商品ID和访问时间。在查询操作中, 分为两种情况, 有用户名和用户名为空, 如果有用户名, 则以用户名作为查询关键字之一, 若无用户名, 则以IP作为查询关键字, 关键是要保证每次分析的是同一位用户的访问行为。

(4) 循环结束后, 3个一维数组中, 记录了每一位用户在离开当前访问的商品页面后, 访问的下一个商品的记录信息。此时得到如表2所示数据:

(5) 另外新定义一个二维数组, 以上一步的有效记录条数作为循环的次数, 通过嵌套循环的形式, 统计出每个商品被访问的记录, 将对应的商品ID和被访问次数存放在这个二维数组中。通过冒泡排序, 将二维数组中的元素, 按访问数由高至低排序。此时得到点击次数排列表。通过该表, 我们可以得到这样一个结论, 在一段时期内, 访问该网站的用户, 在浏览了id为17的商品后, 接下来最喜欢访问的产品id是28、27、11等等。由此, 对于访问商品id编号为17的页面的用户, 我们可以在他们访问页面时, 将表中排在前几位的商品信息同时推送到该页面内, 这样就能达到改善用户体验的目的。

4. 结束语

网络用户行为蕴含大量有价值的信息, 分析这些信息可以帮助了解客户的行为从而改进网站的结构。本文讨论了一种基于web使用挖掘技术的算法来了解用户的兴趣和爱好, 分析用户的浏览模式, 并根据用户的当前访问需要, 自动实时地为用户提供推荐页面。由于推送内容均是根据算法自动得出, 在实际的浏览中, 这些推送的内容对用户的吸引度如何?换而言之, 推送内容在用户的实际浏览点击命中率又是多少?如何根据这些命中率来改进该算法, 从而提高推送准确度, 将是以后的研究方向。

参考文献

[1]岑荣伟, 刘奕群, 张敏, 茹立云, 马少平.网络检索用户行为可靠性分析[J], 软件学报, 2010, (21)

[2]董富强.网络用户行为分析研究及其应用[D]西安电子科技大学, 2005

[3]刘立军, 周军, 梅红岩.Web使用挖掘的数据预处理[J]计算机科学, 2007, (05)

[4]王斓樾.用户行为分析在搜索引擎中的应用[D]沈阳工业大学, 2007

上一篇:空间需求下一篇:现代建筑风格