用户个性

2024-08-23

用户个性（共10篇）

用户个性篇1

随着Internet技术的发展和日益普及,网络为人们提供了海量的知识资源,并成为人们进行学习、终身教育的最便利的学习方式,但是面对浩瀚的知识海洋如何快速有效定位到自己感兴趣的知识成为了人们关注的焦点。搜索引擎随之应运而生,在人们的日常生活和学习中发挥着无法替代的重要作用。但由于搜索引擎的通用性,不能满足不同背景、不同目的和不同时期的查询请求。针对这个问题推出了个性化学习系统,即通过收集和统计学习者访问过的历史数据,挖掘当前学习者感兴趣的页面,获取学习者兴趣模型,以便在学习者以后的访问过程中根据兴趣模型自动向学习者推荐他们感兴趣的内容,指导学习者的浏览行为,营造了一个以学生为中心的个性化学习环境。

个性化学习系统使用的用户历史数据主要来自Web日志数据。Web日志中包含了大量的用户浏览信息,一般包含日期、时间、用户IP地址、用户名、方法、URI资源(URL)、Win32状态、发送字节数、接受字节数、所花时间、协议版本、用户代理等信息字段。分析Web日志,发现用户浏览路径的行为偏好,从而可以“投其所好”,为用户提供个性化服务。

1 Web日志挖掘

为了把Web日志转化为适合进行数据挖掘的数据,要对原始Web日志进行预处理。数据预处理包括数据净化、用户识别、会话识别等。

1.1 数据净化

数据净化是指删除Web日志中与挖掘无关的数据。当用户请求一个网页时,与这个网页有关的图片、音频等信息会自动下载,并记录在日志文件中;如果我们挖掘的目的是用户访问模式,这些信息对我们来说显然没有多大用处,所以可以把日志中文件的后缀为gif、jpg、jpeg、GIF、JPG、JPEG等的记录删除。

1.2 用户识别

用户识别[5]是将用户和请求的页面相关联的过程。由于用户机器中缓存、防火墙、代理服务器的使用,使Web日志没有精确记录用户的浏览行为,因此从净化日志中识别用户工作相对比较复杂。

目前主要的用户识别方法主要有三种,分别为基于cookie的技术[2]、基于IP地址的用户识别[3]以及基于网络拓扑结构的路径分析[4]。方法一通过在Web日志文件中添加更多的附加信息如用户机器名、内部IP名来标示用户,从而能识别通过同一代理服务器上网的不同用户。方法二是指不同的IP地址代表不同的用户。方法三要求根据网络拓朴结构分析Web日志文件中的用户请求,构造用户浏览网页的路径,通过一些启发式规则来识别用户。

1.3 会话识别

在跨越时间区段比较大的Web日志中,用户可能多次访问该站点,会话识别的目的就是将用户的访问记录分为单个会话。最简单的方法是用超时的技术,如果两个页面之间请求的时间差值超过了一定界限就认为用户开始了一个新的会话。

2 浏览行为分析

从心理学角度来讲,人的行为可以反映人的兴趣和目的。在日常生活中,人们经常通过“察言观色”来推测一个人的兴趣和意图。同样的道理,在用户访问网络的过程中,也可以通过用户的浏览行为来推测用户的兴趣。比如用户频繁访问一个页面,可以推测用户对该页面感兴趣;用户在某页面上驻留时间较长,可以推测用户较为认真地阅读了该页面,对该页面有着比较浓厚的兴趣。

2.1 浏览兴趣度[6]

用户浏览网站时的浏览兴趣度是由浏览频度、时间和文档长度等几方面的因素决定。

Tij为用户从页面i进入页面j的浏览时间;Sij表示从页面i页面j进入接收的字节数;Fij表示从页面i进入页面j的访问次数。

用户在页面的浏览时间越长说明用户对该页面越感兴趣,而浏览时间又与浏览速度有关,页面的浏览速度在Web日志中则对应页面的接收字节数,速度越快,接收字节数越多。

2.2 路径选择偏爱度

设U是网站中所有URL的集合,W是所有浏览子路径的集合,如果存在w奂W,对于坌x∈w(x是坌u∈U组成的浏览页面序列,称其中每j个浏览页面为第j位),它们的前m位都相同,而m+1位有n种不同的浏览页面,则称在m位上有n种不同的选择,其中第k(k=1,2,……,n)种选择的路径选择偏爱度(Pc)可定义为

其中,Pj表示第j种选择的浏览兴趣度。

2.3 访问矩阵的建立

Web日志中记录了用户对网站的访问情况。我们首先对Web日志进行预处理,预处理后的日志可以表示成L=的集合,其中,URL_R为引用页,URL表示访问的网页,然后建立用户访问矩阵。

用户访问矩阵以URL_R为行,URL为列,建立URL-URL矩阵,元素值为页面兴趣度,即路径访问的页面平均兴趣度。在矩阵的行列都要添一个空NULL值,在行向量里出现表示用户不通过网页链接而是通过直接输入URL、用书签来访问或从其它网站链接进入目的网页;在列向量里出现表示用户在此页结束浏览或链接到其它网站网页。如果网站有m个URL,那么矩阵是m+1方阵。

2.4 发现偏爱路径

根据用户访问矩阵,发现用户偏爱路径。对访问矩阵每行进行扫描,选择页面兴趣度大于阈值的记录,把放到偏爱子路径的2项集中。

发现用户偏爱路径算法[6]如下:

输入:Web访问矩阵M,偏爱度阈值P,支持度阈值S;

输出:用户浏览偏爱路径集合

3 提取用户偏爱内容

采用2.4的用户偏爱路径发现算法,可以得到用户浏览偏爱路径集合,然后在网站中搜索这些网页文件,提取出来对这些页面的内容进行分析。

下面的工作主要是根据用户偏爱页面的内容提取用户感兴趣的主题,把与该主题密切相关的内容推荐给用户。

向量空间模型(Vector Space Model,VSM)作为一种最常用的文本表示方法。本文用向量空间模型来表示页面的内容,在VSM中,文档视为由一组词条(t1,t2,…,tn)构成,每一词条都赋以一定的权值w,文档被映射为由一组词条矢量组成的向量空间中的一个向量。每个文档表示为特征向量:di={t1,w1;t2,w2;…;tk,wk;…;tn,wn},其中tk表示词条,wk表示词条tk的权值。

3.1 提取用户偏爱内容的步骤

Step1:对用户偏爱的页面的内容进行分词、去掉停用词等预处理,提取出关键词,把页面内容表示成基于向量空间模型的向量形式。

Step2:由于用户感兴趣的主题不止一个,首先要对用户偏爱路径对应的网页文件进行聚类。常用的聚类算法有kmeans算法、DBSCAN算法等,kmeans算法中聚类的个数k需要预先给定。由于不同主题的网页都是放在各自的目录下面,我们根据用户偏爱路径可以大致确定主题的个数,即确定k值,因此在文中我们采用kmeans算法对网页文件进行聚类,找出各个主题的聚类中心C={c1c2,…,ck},其中ci为聚类中心向量。

Step3:根据用户偏爱页面的主题提出相应类别下面的所有页面,把这些页面同样经过step1的处理,形成文档向量集D。

Step4:计算文档向量集中D的文档向量dj和ci的相似度,得到用户偏爱内容集Pw,常用的相似度的计算公式有:余弦距离、欧氏距离等,本文采用余弦距离计算方法。

当文档dj和ci的相似度大于给定的阈值时,就认为dj是用户感兴趣的内容,应该把该文档推荐给用户。

Step5:把Pw包含的页面的URL保存在用户的个性化设置中,下次用户登陆网站时,可以动态地推荐给用户。

3.2 用户偏好的更新

用户的兴趣是随时都在发生变化,在个性化学习系统中用户偏好的及时更新是非常重要的。对于学习型网站,网站上面包含知识的更新相对于新闻网站内容的更新速度要缓慢些,并且用户的兴趣也相对稳定,根据学习知识的时间规律,每周对近期的Web日志分析一次,及时地把用户偏好更新到用户的个性化设置。

4 结束语

为用户提供个性化信息服务是时代发展的需要,其技术的关键在于如何描述和更新用户的兴趣。本文提出一种基于用户的浏览行为和浏览内容的用户兴趣的提取方法。这种方法能够隐式地发现用户的兴趣,对实现个性化的学习推荐系统具有很高的价值。本只是从用户浏览行为上挖掘用户的偏好内容为用户服务,如果要真正做到智能、准确的推荐用户感兴趣的内容,在以后的研究工作中要对知识的表示和学习策略上多做研究,对学生的学习情况进行评价,根据学习评价,引导学生是进一步学习。

参考文献

[1]王勋,凌云,费玉莲.基于Web日志和缓存数据挖掘的个性化推荐系统[J].情报学报.2005,24(3):68-72.

[2]Pitkow J.In Search of Reliable Usage Data on theWWW[A].sixth International World Wide WebConference[C].Santa Clara,CA:[s.n.],1997:451-463.

[3]Cooley R,Mobasher B,Srivasta J.Data Prepatation formining world wide web browsing patterns[J].Journal of Knowledge an Information System,1999,1(1):5-32.

[4]Pirolli P,Pitkow J,Rao R.Silk from a Sow’s Ear:Extracting Usable Structure from the Web[A].Proceedings of CHI’96.ACM Press,1996:118-125.

[5]刘立军,周军,梅红岩.Web使用挖掘的数据预处理.计算机科学.2007,34(5):200-202.

[6]任永功,付玉,张亮,吕君义.一种新的基于Web日志的挖掘用户浏览偏爱路径的方法.计算机科学.2008,135(110):192-196.

用户个性篇2

上一篇：网页设计心得:设计师理解搜索结果页SERP

60页的PDF下载地址填上你的名字和联系方式就可以免费下载了，万一RP问题导致无法下载的同学，如确实有兴趣，请留下邮箱地址，我会发给你。

报告很长，涉及到几个话题：个性化会影响用户的浏览时间吗?商业目的的客户和非商业目的的客户浏览行为有不同吗?在多种形式内容组合的SERP上，用户行为是怎么样的?

产生于年的报告，里面使用了大量的眼动仪测试以及专家访谈，再推荐您下载一下。

我选择了其中一个点：个性化对用户行为的影响。

—————————————————————————————————————————————————————————————————

左图为非个性化的google SERP, 右图相应的白色框内区域为个性化内容，在报告中指出如何实现个性化，他们会让测试者先用google的账户登录，tracking他们的浏览行为，记录他们访问的网站，借以判断他们的需求——下一步的动作会是什么?

比如，一个网络购买者，他是停留在研究分析对比阶段还是即将购买?这两种用户关注的信息是不同的，因此给个性化设计提供了依据。

通过眼动仪测试，可以明显看出：

即使个性化条目并不是出现在顶部的黄金位置，还是得到了几乎同等的关注度和点击数。而左边是没有根据用户的行为推荐的相同区域的内容，仅仅得到了少量的关注度，和三个点击数。

用户行为的改变：

用户还是F型浏览这个列表页吗?什么是F型浏览

我们看一下图片和个性化是如何改变了通用的用户行为。

在不考虑图片和个性化的基础上，我们预测用户的浏览行为是这样的：

他首先看到最上面的结果(E区域)，然后从这里开始线状的浏览。

而事实上，一旦有了图片和个性化的影响，用户F型浏览行为被打乱了。

1. 他首先被图片吸引到(A区域)。

2. 然后这个有图片的条目B区域引起他的注意。

在做了判断后，如果没有下方的个性化内容，我们预测用户会将目光上移到EC区域，再从上到下浏览。

而有了个性化的内容后，由于其相关性，用户的注意力首先被D区域的内容吸引。

下面是有时间线的对比，下面两个是没有图片和个性化内容影响的SERP，上面两张是有图片和个性化内容的SERP.

给我们的启示：

由于google和其他搜索引擎结果日益丰富化，在相关性和媒体的丰富性上都在进步。原来我们认为的放到顶部的结果一定能够得到关注的假设逐步受到影响，这意味着页面的sponsored links也应该在相关性和视觉方面跟上脚步。

Google SERP 2010：

在报告中，研究人员做了一个设想中的google的搜索结果页在2010年会变成什么样，

2007年的设想，我发现20的google已经呈现了设想中的一些元素。比如google在会员登录状态下会出现允许用户删除、排序的功能：

研究人员大胆设想中的GOOGLE SERP的个性化样子：

1. 对于即将要购买的用户

A：店铺广告(Sponsored Links)，根据用户所在地，进行店铺推荐，广告商能够靠此进行效果最好的人群定位。

诚如以上分析，sponsored links开始考虑丰富性的表现，以期用户能够在更加丰富的SERP上关注到。

B.删除的功能(哈哈，是不是正是现在google在做的)，提供给用户更多影响自己的SERP的功能。

C.看更多结果——由于2010年搜索引擎更精准化，所以首页就不给用户提供过多的选择。用户可以通过单击more results展开一个传统的搜索结果列表页。

D.当用户进行了一个搜索后就会展开一个tab。

E.当地店铺——整合google地图。

F.搜索过滤

G.online retailer的推广——给出在线销售该产品的店铺名称和链接，并且有当前产品的价格。

以下是这个页面的眼动仪测试结果：

通过上图我们可以看到：

1. 网页搜索页面区域(A)依然占据了绝大多数点击。

2. Shop local区域吸引到了较多的点击和关注。

3. buy it now区域或许是因为位置偏低吸引到了较少的点击。

4. 顶部的搜素过滤吸引到关注和点击。

5. 右栏的广告虽然形式比较丰富，但是关注度和点击率对比其他板块偏低。

研究人员同时做了另外一个个性化的SERP, 针对“尚处在研究和分析阶段”的用户。他们选取了一批根据浏览行为和搜索行为，被定义为在research而不是购买的测试者进行这个页面的测试。

在这个SERP上，针对这批用户，做了一些板块和内容的调整。

比如：在搜索结果里，增加了customer review条目，其他的条目内容也做了个性化处理，偏向于消费者评价网站多过具体的商业网站。

同时在下方的C区域，做了blog的搜索条目。

D区域的google book，SNS的营销工具。

对这个页面的眼动仪测试结果如下：

通过上图可以看出：

1. 最热门的区域是Customer Review(消费者评测)。

2. 其次是个性化的关联性条目(B)区域——B区域以上的sponsored links(C)几乎丧失了关注度。

3. buy it now关注度很少，甚至有用户直接越过这个区域去看之下的博客文章。

用户个性篇3

关键词：农业信息；用户兴趣模型；信息推送技术

中图分类号： S126文献标志码： A文章编号：1002-1302（2015）09-0458-03

农业信息化是发展现代农业的动力引擎，而相比于发达国家农业信息化程度，我国农业信息化的发展还相对落后[1]。近年来我国农业和农村经济虽发展迅速，但由于我国农民的知识水平普遍较低使得实现农业全面信息化仍是一项相当艰巨的任务。其中，如何使得从事农业的人员及时获得有效可靠的农业信息是实现农业信息化的重要内容之一[2]。传统的农业信息服务方式已经不能满足农户、农商等从事农业人员对信息的需求。因此，部分传统的农业信息服务诸如信息中心、图书馆、资料室等，必须革新其信息服务方式，充分利用当前先进的信息传播技术实现高效率、高质量的信息服务[3]。与此同时，随着Internet技术的发展，网络上的信息资源呈指数增长，其膨胀趋势日益增多，但采用Internet信息浏览方式获取信息效率低且准确性差，且由于农业从业人员尤其是广大的农民受物质条件和自身科技文化水平的限制，获取信息等能力较弱。因此，如何使用户识别信息、及时获得信息服务是当前农业信息服务面临的实际需求[4]。推送技术是一种新的信息服务模型，根据用户的特定需求，对其搜索的信息进行过滤、处理、分类之后提供个性化的信息服务[5]。推送技术可充分利用已有的信息资源，主动开展信息推送服务，为农业相关人员及时提供市场供需信息、病虫害防治信息、气象信息推送等，进一步深化农业信息化进程[6]。针对如上的问题，本研究构建了农户兴趣模型，利用Web Services技术和信息推送设计实现了个性化农业信息推送系统，该系统可将信息服务提升到知识服务，以便广大农民或从事与农业相关职业的人员实时有效地获得所需的农业科技信息，以此提高我国农业信息服务的水平。

1系统需求分析

个性化农业信息服务的系统主要解决“信息获取”“信息推送”“信息应用”这3个问题，即获取什么信息推送给用户，获取的信息如何推送给用户，推送的信息服务于谁的问题[7-8]。解决这些问题首先需要了解农户的需求，然后采用信息检索技术获取所需数据，最终根据用户的需求将获取的信息利用推送技术推送给用户。农村信息服务的主体对象主要包括广大农民、农村基层农业技术人员、农村党员干部、大学生村干部、农业企业、农业经纪人、种养大户、回乡创业者和农业科技园区管理者等，可见农业经营的群体规模十分巨大[8]。目前，大多数农业从业人员的科技文化素质还不高，但他们对信息和知识的需求十分迫切。为了实现信息的准确推送，需要根据用户的需求实现对用户分类即建立用户兴趣模型，满足不同用户对信息的需求[9]。通过需求分析确定了本系统主体架构与流程，如图1所示：系统基于B/S架构进行设计，客户端用户通过浏览器访问站点资源，同时系统通过浏览器和注册信息建立用户兴趣模型。服务器端是推送系统的主要部分，首先服务器端定时从网站采集关于农业的信息资源，存入数据库；同时服务器需采集站点的访问日志并依据技术要求对日志进行处理，建立用户访问模式并结合用户访问网页内容建立用户访问模式描述文件，构建用户兴趣模型库。

2用户兴趣模型

用户兴趣模型是农业信息服务系统个性化信息推送的重要依据，即根据系统获得的用户信息构建用于表示用户个性化需求的模型。目前建立用户兴趣模型的方法多种，如用户信息抽取、用户信息反馈，通常采用多种方式组合的方法进行用户模型构建。图2为本系统的用户兴趣模型构建方法，系统主要采用用户信息抽取（注册、浏览行为、浏览内容等）和用户信息反馈2种方法组合对用户模型进行构建，弥补了仅采用注册信息建立模型不可更新的缺点，并通过用户信息反馈针对性地修改用户兴趣模型，从而建立一个相对全面准确的用户兴趣模型，为农业信息的准确推送奠定基础。

2.1用户信息抽取与反馈

用户兴趣模型初建时提取用户的注册信息，形成用户的初步兴趣库并将提取的信息按照规则存入后台用户兴趣数据库中。由于根据用户注册信息初步构建的模型过于简单，且简单关健词筛选机制容易造成信息的准确性差问题，因此需根据辅助信息（浏览行为、浏览内容等）对用户的模型进行修改。同时，为更准确地表达用户的信息需求，采用用户反馈的方法，即引入用户的兴趣偏好对建立的兴趣模型及时进行修改。

2.2三元组用户兴趣表达

利用三元组实现用户兴趣表达。农业网络信息分类比较简单明确，可以利用关键词对信息进行分类，因此用Keyword表示关键词组向量，用Person表示用户分类，即用表示了用户对信息的需求。为得到更加准确的兴趣模型，采用了用户反馈的方式对该模型进行实时修改。其中用户反馈信息用Situation表示，该特征是用户对所收到的推送信息给予的主观评价，表示了用户的兴趣度。最终将用户兴趣模型定义为一个三元组：。其中Keyword的定义如下：Keyword=，其中R表示关键词之间的逻辑与、或、非关系。Person为上述的用户所期待的目标分类，使用1，2，3，…，n表示分类代号。Situation对应于用户对信息的反馈评价，将situation根据用户对信息的兴趣度按照从高到低的顺序分成5类：很好、好、一般、差、很差，在数据库中分别用数字5、4、3、2、1来表示信息的权值。

2.3用户兴趣模型构建流程

随着用户查询次数和反馈次数的增多，将形成大量的三元组合，对其进一步挖掘，即可构建用户兴趣模型。当用户收到系统推送过来的信息并给出相应的评价后，推送给用户的来自Person（类）含有Keyword（关键词）的信息将属于一个特定的Situation。这样经过用户与系统的反复交互过程，每个Situation都有1个对应于一系列三元向量的词典。初期，词典为空，每收到用户1次反馈信息，都根据对应的Person和Keyword更新对应的Situation词典。若相应的第1次出现，则将它记录到词典中，若词典中有该二元向量，则将它的数量传到词典中。由此，将用户接收的来自某一个category含Keyword的信息表示为1个的三元组，每个用户的兴趣都可以描述成多个这样的三元组。每个对应1个Situation，Situation可等于5个不同的值，每个Situation都有1个词典。这几个概念以及实际的数据结构组成了表示用户对特定信息的感兴趣程度，据此建立相应的用户兴趣模裂，如图2所示。由于用户的兴趣、知识等会随时间变化而变化，因而建立的用户兴趣模型也要随之变化。用户兴趣模块会根据每一条用户反馈更新对应的Situation词典，这样就能及时地更新、完善系统对用户兴趣的理解。

3系统设计

3.1系统架构

系统的总体架构如图3所示。它主要由服务层、网络层和应用层3部分构成，其中服务层由服务器和中间服务器构成，网络层中数据与信息可通过Internet、3G/WLAN等网络传输。服务层包括农业信息数据库和农业数据仓库，主要信息来自于与农业信息相关的互联网；中间服务器可自动利用Heritrix框架进行特定农业信息的收集，并结合基于Web的数据挖掘技术获取农民直接关心的最新的农业科技信息、市场供求信息、国家政策信息、市场行情等；应用层中的手机客户端是面向android智能手机用户而开发的应用，主要功能包括两大部分，一是农业信息浏览查询；二是农产品供需信息发布。

3.2系统功能模块设计

系统的服务对象主要为涉农人员，例如农民、农产品贸易人员、农技人员、农业科研人员等。系统的目标是针对这些用户的需求，根据用户兴趣模型，定时为农户提供最新农业信息。本系统中信息源主要来自农业综合信息服务平台，所有的农业信息都来自该平台的数据库。系统的功能模块如图4所示：

（1）用户管理模块：用户管理模块对用户信息进行管理，该模块重点实现用户兴趣模型的构建。该模块可抽取用户的注册信息、浏览信息、反馈信息等存入到数据库中，根据兴趣模型的构建方法构建兴趣模型。因此，该模块是系统重要的组成部分，是实现个性化农业信息推送的关键环节之一。

（2）信息采集模块：信息采集模块从农业综合信息服务平台上获取农业科技信息、市场供求信息、国家政策信息、市场行情等农业信息。

（3）信息推送模块：信息推送模块主要包括RSS（really simple syndication，简易信息聚合，也叫聚合内容）信息发布功能、邮件推送功能、短信推送功能。RSS信息发布功能是负责将采集的信息资源进行再组织，使信息资源符合RSS规范再发布，以便供用户使用。邮件推送功能和短信推送功能是系统的最终目的，是根据用户需求选择的服务方式。

（4）后台管理模块：后台管理模块主要对后台的数据库、系统参数及用户的权限等功能进行管理。

3.3系统流程设计

系统的流程设计如图5所示。首先用户注册登录，该步骤可以获得用户的原始信息；然后根据用户的浏览信息、反馈信息等构建用户的兴趣模型；最后，系统将获得的农业信息根据用户兴趣模型，以RSS信息、邮件及短信的方式推送农业信息服务。

3.4关键技术

本系统中涉及的关键技术包括RSS信息发布、信息推送等，具体如下：

（1）RSS信息发布技术：RSS为一种新的推送技术，获得了广泛的应用，并极大地推动了信息服务的发展。RSS信息推送服务的原理为：内容提供者提供RSS feed并根据内容的变化实时更新RSS feed，用户借助RSS阅读器把RSS feed的URL地址添加到阅读器中，定时同步RSS feed的信息即可阅读，同时也可以根据自己的需求进行订阅服务。

（2）信息推送技术：信息推送主要是短信推送和邮件推送。短信推送是该系统的首要设计，该推送技术是继广播、报纸、电视和网络四大媒体之后的一种新兴的大众传播媒体，业内人士称之为第五媒体。由于手机短信具有接收简单、价格低廉、覆盖面广等优势得到了农民广泛的应用。邮件推送则是以E-mail推送的方式，是最简单也是目前应用最广泛的一种推送方式。随着网络的日益普及，电子邮件已经成为人们交流的一种常用工具和人们获取信息的一种重要手段。

4结束语

将传统网络环境下的农业信息推送和信息服务扩展到农业知识推送和知识服务，是农村信息服务的必然趋势和发展方向。本研究在Web Service开发平台的基础上，构建了三元组用户兴趣模型，结合RSS发布技术、信息推送技术、数据库技术等分析研究了个性化农业信息推送系统。该系统可构建动态用户兴趣模型并对其实时更新，有效、准确地实现了农业信息推送。通过本系统，用户可以随时随地通过手机学习和了解感兴趣的最新农业科技信息，也可对农产品的需求、价格等信息进行发布与收集，还可实现物流配送往来的信息交流，最终解决农业信息推送和农产品流通难题，提高农民在市场中的竞争力，增加农民收入。

参考文献：

[1]陈威，郭书普. 中国农业信息化技术发展现状及存在的问题[J]. 农业工程学报，2013（22）：196-205.

[2]孙艳梅，谭峰. 农业信息化发展的意义与对策[J]. 农民致富之友，2013（13）：122-122.

[3]李期位. 农业信息智能推送技术的研究与实现[D]. 北京：中国农业科学院，2006.

[4]戴起伟，董钊，曹静，等. 面向农村社区的信息推送服务平台技术设计与应用[J]. 科技与经济，2009，22（4）：49-52.

[5]綦科，谢冬青. 基于内容的短信分类系统的设计与实现[J]. 广州大学学报：自然科学版，2011，10（5）：43-47.

[6]孙小华，王福顺，杨会英，等. 基于智能手机的农业信息服务系统研究[J]. 科技和产业，2013，13（6）：33-36.

[7]沈典. 基于信息推送的领域垂直搜索引擎研究[J]. 电子世界，2012（8）：86-87.

[8]李志芳，冯秀芳，赵红旗. 基于用户兴趣模型的信息推送系统研究[J]. 太原理工大学学报，2011，42（5）：503-505，509.

用户个性篇4

关键词：档案,个性化服务,用户

用户需求驱动的个性化服务是以用户为中心的理念设计的, 个性化服务是相对于标准化服务和一般化服务而言的概念。标准化的重点是用户需求的共性和利用效率, 个性化则更加看重用户需求的个性和用户满意度。用户需求的档案个性化服务, 正是基于对用户兴趣、角色、背景等因素的高度关注, 根据用户个性化的需求提供特色服务而构建的。笔者从以下3个方面进行探讨:

一、培育用户的档案意识

用户档案意识的培育主要是指档案部门对其服务的对象进行档案意识、档案信息及服务业务等诸多方面的宣传、介绍, 实施档案利用的技术培训, 以提高用户的档案素质和利用档案的能力。开展档案用户教育有利于用户信息需求的表达, 有利于用户掌握利用档案信息的方法和技术。

1. 明确档案用户教育的主要内容。

第一, 档案的经济价值和社会价值。让用户了解档案是什么、有什么功能以及档案的经济价值和社会价值实现的实际案例等。例如, 北京市档案馆在北京申办2008奥运会之际, 在莫斯科举办了名为“百年北京”的档案展览, 使各国人士更多地了解中国、了解北京, 为申奥成功起到了重要推动作用。第二, 利用档案的法规、政策。档案产生于社会, 每个公民都有合法利用档案的权利。但是, 由于档案的特殊性, 并不是所有档案、所有内容都能无限制地向公众开放。档案的利用必须符合相关的法律法规。档案部门应积极宣传《档案法》、《档案法实施办法》等法规文件, 既保证用户利用档案的权利, 又使国家利益、公民权益不受到侵害。第三, 档案信息资源的内容。档案部门应建立档案信息资源发布机制, 使档案用户能够知晓哪些档案是开放的、有哪些主要类型、哪些档案能够全文上网、不同的馆藏资源的访问途径是怎样的等问题。这样用户才能产生明确的档案需求, 有针对性地、确切地表达自己的需要。第四, 利用档案的技术和方法。在丰富馆藏的基础上, 档案部门还必须提供高效的检索工具。特别是网络环境下, 档案部门应该让用户明确以下几个问题:怎样访问数字档案馆、提供哪些检索工具、不同的检索工具有什么特点和功能、访问的权限、收费问题等。

2. 制定档案用户教育的策略和方法。

第一, 依托互联网和政务网宣传档案工作。数字档案馆要实现和互联网、政务网的对接, 使公众在浏览网上信息的同时能访问数字档案馆, 从而产生对档案的利用兴趣。第二, 举办档案展览。发挥档案的资源优势, 选定合适的主题, 定期或不定期地举办各种类型的档案展览, 向社会宣传档案的作用。特别是要开办网上展览窗口, 以文字、图片、声音等多种形式吸引公众的注意。第三, 加强爱国主义教育基地建设。档案部门要利用青少年参观爱国主义教育基地的机会, 向其宣传档案和档案工作, 使青少年从小就树立利用档案的意识。第四, 在实践中培训用户。档案工作人员可直接对用户进行有针对性的培训, 使用户在最短的时间内掌握利用档案的方法。通过培训和座谈, 使用户能够与档案工作人员有互动的交流, 从而迅速获得利用档案的途径和技术方法。

二、预测用户需求

各行各业对用户的利用需要是多方面的, 不同时期、不同任务对档案的需要也有所不同。如果不对客观需要进行调查研究, 利用工作只能坐等利用者上门。即使档案馆愿意主动开展档案利用工作, 也往往由于无的放失而不能取得很好的效果。档案人员要熟悉国家的政治经济文化环境, 把握档案需求热点和方向;要进行经常性的调查研究, 倾听用户的声音, 确切了解其需要哪方面的档案信息。此外, 在服务过程中档案人员要注意用户的反馈, 经常性地与用户保持良性的互动关系, 促进档案馆改善服务, 为用户提供深层次的档案信息服务。用户反馈包括他们对网站视觉上的评价、对登陆页面的感受、对检索工具的评价、对服务内容的满意度等。当然, 对用户需求的预测必须要建立在对馆藏充分了解的基础上, 通过预测用户的需求而对某方面的档案信息加大开发的力度。

三、确定集中用户群

集中用户群确定的本质是对档案用户信息的收集, 通过用户访问档案信息资源所反映出来的兴趣、爱好、基本行为等特征, 确定用户访问网站的目的, 从而确定哪些用户会经常性、持续性地利用档案。采集用户信息要充分地考虑以下几个方面的问题:一是找到真正的用户, 他应是所有用户的典型代表人。二是获得用户访问网站的真正任务和目的, 不仅是进行页面的浏览, 而是看网站能否解决专门的问题。三是让读者把他们的感受、意见和建议明确地表达出来。基于这样的考虑, 数字档案馆在设计用户登陆界面上, 要充分尊重用户的感受。在创设用户问题时, 要尽可能简短;明确用户所要查找的主题以及他们是否可找到所需要的信息;当需要的信息特别多的时, 用户需要填写问题表格提供一些详细的信息, 描述他们所要完成的任务。

用户个性篇5

摘要：面向用户需求构建个性化学习环境是当前E-learning领域研究的热点。自适应学习系统（Adaptive Learning System，ALS）是E-learning个性化学习支持服务的解决方案。针对ALS推荐学习资源的精准性与有效性问题，文章尝试性从用户学习路径的视角出发，在对学习者与领域知识建模的基础上通过关联规则挖掘技术动态匹配与重组学习资源，进而实现ALS个性化学习路径推荐机制。仿真实验结果表明，利用本推荐机制在一定程度上能有效推荐学习资源，进而较好地满足当前用户个性化学习需求。

关键词：自适应学习系统；个性化学习路径；学习者模型；领域知识模型；关联规则

中图分类号：G434 文献标志码：A 文章编号：1673-8454（2016）21-0028-04

当前，数字化学习（E-learning）席卷远程教育领域，成为网络信息时代盛行的一种重要学习方式。E-learning打破了传统面授式教育模式的常态化，突破学习的时空限制，为学习者“随时随地”学习提供了可能。然而，调查显示，当前许多E-learning支持平台的实际应用效果并不理想，其中最为突出的问题是平台忽视了“以学习者为中心”的现代教学理念，不能根据用户的个性化需求准确提供学习资源，进而导致在线学习效果不明显。[1]正因如此，关于E-learning环境下的个性化学习理论与实践研究受到众多学者关注，构建支持用户个性化学习需求的E-learning系统成为当前迫切而重要的研究主题。

一、ALS及其研究现状

ALS，即自适应学习系统，亦称适应性学习系统，是在建构主义“以学习者为中心”的现代教育模式引领下提出的一种针对当前学习者的个体特征差异（如年龄、专业背景、兴趣偏好、认知水平等）而动态提供其个性化学习支持服务的系统，其最早由国外以智能教学系统和适应性超媒体系统的术语提出，近年已成为E-learning远程教育领域研究的热点。[2][3]个性化推荐机制是ALS的核心部件，其主要功能是对学习资源的有效匹配与重组，进而满足当前用户的个性化学习需求。

目前，关于ALS的研究尚处于探索时期。国外介入该领域研究较早，典型的代表主要有：Brusilovsky等人首次提出了适应性学习系统，并认为可以从课程序列化与适应性导航技术实现系统的适应性效果；[4]Tang等人采用聚类分析与协同过滤方法将用户访问页面序列和内容进行筛选与分类并推荐给用户，进而构建了ALS系统原型；[5]美国匹兹堡大学Weber G等人通过个性化导航策略实现了ALS适应机制，并开发了ELM-ART、Knowledge Sea系统原型；[6]Castro等人阐述了数据挖掘技术在网络学习过程中的重要作用，为基于数据挖掘的E-learning个性化学习研究奠定了基础。[7]国内该领域研究起步较晚，典型的代表有：华南师范大学陈品德教授从内容呈现和导航支持两方面考虑适应性，设计了A-Tutor原型系统；[8]中国台湾淡江大学利用Agent技术研发了分布式智能学习系统MMU，该系统具有一些简单的智能交互功能。[9]

纵观上述研究，国内外提出的许多ALS系统仍处于原型实验阶段，其适应性及个性化推荐机制还需要不断探索。因此，本研究拟尝试性地从用户学习路径的视角出发，在对学习者与领域知识建模的基础上，通过关联规则挖掘技术动态匹配与重组个性化学习路径，进而实现ALS推荐机制，以期满足当前用户个性化学习需求，同时为本领域相关研究提供参考借鉴。

二、ALS个性化学习路径推荐的解决方案

1.学习者建模

学习者是ALS的主要参与者与体验者，也是个性化资源获取的主体，因此ALS的设计首先应重点考虑学习者的个性化需求特性。为了更清晰地表征学习者对象在系统中的属性，我们需要将其实例化，即对学习者进行建模。可以说，学习者模型是ALS实现的基础，其主要借助用户建模组件或第三方代理软件实时收集并处理学习者个性化信息来实现。[3]本研究鉴于IMS LIP（Learner Information Package）标准，采用四元组的形式从基本特征、学习风格、认知水平和学习记录四个维度来表征学习者模型，其方法如下：

LearnerModel=（BaseInformation，LearningStyle，CognitiveLevel，AccessRecords）。

其中，BaseInformation用于表示学习者一些基本的静态信息，例如昵称、姓名、性别、年龄、专业背景、个人简介等。LearningStyle表示学习者的学习风格，其可借鉴Felder学习风格模型构建，包含值域定义为：{“直觉型-感知型”，“视觉型-言语型”，“活跃型-反思型”，“全局型-序列型”}，该值域可通过ALS系统设定或完成Felder学习风格量表（ILSs）的形式获得。CognitiveLevel表示学习者当前所达到的认知水平，可以从“初级”、“中级”、“高级”三个层次表征，其主要以学习者的单元测试成绩为参考依据由系统自动评定。AccessRecords表示学习者在整个学习过程中的访问记录，包含访问者编号、访问时间、访问地址以及访问内容描述等基本信息，AccessRecords的表示方法为AccessRecords（Ri）=（LearnerId，AccessTime，AccessAdress，ContentInfo）。

2.领域知识建模

领域知识泛指专业领域内所有经验、理论、方法论的知识单元集群，而在计算机世界中我们将其界定为：针对某特定领域需要，采用某种（或若干种）表示方法将知识实体化与结构化，使其能在计算机存储、系统组织和管理方面具有易操作等特性的知识集群。[10]ALS中领域知识是对学习资源的结构化，其为学习者个性化学习提供数据来源。领域知识模型要求知识体系具有良好的结构关系，以便系统推荐资源路径时做出准确的判断。通常情况下，领域知识可用课程、知识单元和知识点（或知识项）三种粒度表征，知识之间的关系包括前驱后继关系、并列或包含关系以及相关关系三种类型，而每个知识单元或知识点都应包含难度、风格和学习任务属性。根据它们之间的逻辑关系，我们给出了领域知识模型的一般结构，如图1所示。

根据以上分析，我们将领域知识的结构模型表征为：KObject={Kid，Kname，Klevel，Kstyle，Kcontent，KOR}。其中，Kid表示知识点的唯一标识，Klevel表示知识点难度水平，Kstyle表示知识点的偏向风格，Kname表示知识点名称，Kcontent表示知识点内容信息，KOR表示知识点所属关系集合。基于上述三种关系类型，本研究中领域知识对象间的关系模型KOR可用如下表达式表示：

KOR（a，b）={，Ktype，Kweight}。

其中，Ktype表示关系类型（Ktype {“前驱”，“后继”，“并列”，“包含”，“相关”}），Kweight关系的权重值（Kweight [0，1]，该值越高代表知识间的相关性越大）。例如，某领域知识a与b的关系记为KOR（a，b）={，“并列”，0.5}，表示知识a与知识b之间是并列关系，其关系权重为0.5。一般而言，领域知识点间的关系类型及关系权重值由创建学习资源的系统管理员（或任课教师）设定。

3.关联规则定义及其推荐方法

关联规则是数据挖掘领域研究的一个范畴，其最早由Agrawal等人提出，主要用于从数据集合中发现频繁项并找出项集间的关联关系。从本质上讲，关联规则挖掘是在事务数据集合D中发现满足用户给定的最小支持度min_support和最小置信度min_conf的频繁项集并挖掘其关联关系。[11]为了更清晰地反映ALS基于关联规则挖掘的推荐过程与方法，在此我们设定用户访问记录集（即日志事务集合）结构如表1所示。

（1）产生频繁项集

频繁项集是关联规则挖掘的第一环节，需要利用AprioriAll算法将表1中知识项集中频繁项找出。在此，设定最小支持度为0.6，则最小支持度计数为0.6×len（users）=1.8，频繁项集产生过程为：通过第一轮扫描得到候选集C1（Item，Support）={，，，，}，从C1中剔除Support小于1.8的项，即获得频繁项集L1（Item，Support）={，，}；按同样的方法进行第二轮扫描，L2（Item，Support）={<（K1，K3），3>，<（K1，K5），2>，<（K3，K5），2>}；同理，进行第三轮扫描最终获得L3（Item，Support）={<（K1，K3，K5），2>}。

（2）产生路径关联规则

通过上述频繁项集产生过程，用户访问记录集合产生的知识项集I={K1，K3，K5}，设定最小置信度min_conf为0.8，那么得到候选关联规则置信度如表2所示。

由表2可知，当最小置信度为0.8时得到三条强关联规则，即：{K1，K5}？圯{K3}，{K3，K5}？圯{K1}，{K5}？圯{K1，K3}。由此得到当前用户的学习路径存在三种可能：KPa={K1，K5，K3}，KPb={K3，K5，K1}或KPc={K5，K1，K3}。

（3）推荐路径预处理

推荐路径预处理是对学习路径的优化处理，该过程主要根据领域知识的关系模型KOR对强关联规则路径进行匹配，以选择最优学习路径。例如，设定本例中K1、K3和K5之间存在如下关系：KOR（1，3）={，“前驱”，0.8}、KOR（1，5）={，“前驱”，0.9}和KOR（3，5）={，“后继”，0.6}，那么可推理为当前用户最优学习路径。此时，得到的最优学习路径需要进一步与领域知识模型Kobject进行匹配与隐射处理，将其按照生成的路径规则转换为资源集合提供给学习者。

三、仿真实验及其结果分析

为了检测本研究中ALS个性化学习路径的推荐效果，我们利用VC工具与C语言开发了ALS仿真运行环境。实验初始化数据由系统按照预先定义的权重参数随机自动生成，且设定系统每次随机生成30个知识项集，当最小支持度和最小置信度分别设置为0.6和0.8时，其运行效果如图2所示。

实验中，我们首先固定最小支持度和最小置信度阈值分别为0.8和0.6，经过10轮实验后从知识项平均访问频次与系统推荐频次两个维度对ALS推荐效果进行的分析，结果发现满足最小支持度时知识项平均访问轨迹与系统推荐路径轨迹趋势基本相似，说明系统推荐路径基本有效。然后，我们尝试性以0.05递增幅度调整最小支持度，再次经过10轮试验后从最小支持度Minsup与推荐知识项个数Kcount的分布关系进行分析（见图3），结果显示系统推荐知识项数量会随着Minsup的不断增加而减少，进一步说明系统推荐路径的精确性会随着Minsup的增加而提高。

四、结束语

基于Web的ALS是未来远程学习的一种有效途径，是个性化学习环境建设的趋势，目前仍有很大的探究空间。ALS主要是通过个性化推荐机制对学习内容进行有效筛选与重组来实现的，而学习者模型、领域知识模型以及关联规则挖掘技术是ALS个性化推荐机制形成的有效保障，对改进系统的推荐质量、提高学习者学习效率起着关键性作用。当然，由于诸多局限性因素，本研究仍存在不足之处，例如，ALS推荐路径的优化处理、推荐机制的效率问题等，这也是本研究下一步的趋向。

参考文献：

[1]刘丽萍，魏书敏，赵新云.个性化网络学习支持系统的研究[J].中国教育信息化，2010（23）：47-51.

[2]牟连佳.网络化学习系统的适应性研究[J].电化教育研究.2009（5）：48-53.

[3]赵学孔，徐晓东，龙世荣.B/S模式下自适应学习系统个性化推荐服务研究[J].中国远程教育，2015（10）：71-80.

[4]Brusilovsky，P.（2001）Adaptive hypermedia.User Modeling and User Adapted Interaction，Ten Year Anniversary Issue（Aifred Kobsa，ed.）11（1/2）：87-110.

[5]TangC.，Yin H.，LiT.，LauR.，LiQ.，&Kilis D.： Personalized courseware construction based on web data mining[C].In Proceedings of the first international conference on web information systems engineering，2000：204-211.

[6]Weber G，Brusilovsky P.ELM-ART： an adaptive versatile system for Web-based instruction [J].International Journal of Artificial Intelligence in Education，2001：351-384.

[7]CastroF.，VellidoA.，NebotA.，MugieaF.：Applying Data Mining Techniques to E-learning Problems[J].Studies in Computational Intelligence.2007（62）：183-221.

[8]陈品德，李克东.适应性教育超媒体系统——模型、方法与技术[J].现代教育技术，2002（1）：11-16.

[9]莫赞，冯珊，唐超.智能教学系统的发展与前瞻[J].计算机工程与应用，2002（6）：6-7.

[10]李卫.领域知识的获取[D].北京：北京邮电大学，2008.

[11]Agarwal S. Data Mining： Data Mining Concepts and Techniques.International Conference on Machine Intelligence and Research Advancement.IEEE，2013：203-207.

用户个性篇6

随着Internet网络的普及和WWW的迅猛发展, 网络已成为人们获得信息的必要途径和重要手段, 网络中的海量信息既给人们带来方便, 也带来了许多问题。信息浩如烟海, 为找到有用信息, 人们经常要耗费大量宝贵的时间, 因而近年来Internet个性化搜索服务越来越引起人们的关注。虽然现有搜索引擎可以对搜索结果进行打分并按得分的高低来呈现给用户, 但是由于没有考虑到用户个人的兴趣爱好, 不同用户对于同样的搜索关键词搜索出的信息是相同的, 这样做并不能完全满足用户的要求, 如何从中快速准确地发掘所需信息已经成为人们所关注的一个重要问题。

1 个性化搜索系统的关键问题

系统的工作流程是当用户进行输入关键字进行查询之后, 将用户兴趣库中的关键字信息与用户输入的进行过滤和拼凑, 得出最符合用户信息的查询条件, 通过信息查询接口与常用的搜索引擎进行连接, 从而得到最初的由常用搜索引擎得到的结果, 再通过用户兴趣对查询结果进行二次处理排序, 得到针对每个用户不同的查询结果, 从而实现信息的个性化查询, 同时及时地对用户的兴趣进行更新。系统的具体结构模块如图1所示。

1.1 用户兴趣库的建立

系统选择将显示获取与隐式获取相结合的方式进行用户兴趣信息搜集, 这样减少了单纯显式搜集方法中的搜集步骤, 也在大多数时间上避免用户在使用中感到不便。克服了以关键字方式提供用户兴趣而用户经常不能准确地表达自己的兴趣的缺陷。

除了在用户自愿的情况下, 填写用户兴趣以外, 系统可以通过智能Agent技术不断地接收用户在Web浏览时的相关信息, 对用户信息需求、偏好进行甄别、归纳、总结, 分析用户的兴趣, 并将信息进行整理、组织, 从中分析出用户的信息偏好, 再根据用户这些信息建立用户兴趣库, 其中包含兴趣项, 关键词 (包含相关词语) , 兴趣度, 出现次数以及创建时间, 更新时间等。当用户进行信息查询的时候, 将用户兴趣库中的信息与用户查询条件进行拼合和过滤, 从而得到更加符合用户需求的查询条件。而信息查询接口主要是为了与Internet上的搜索引擎进行连接, 得到更加全面的查询结果。

1.2 用户兴趣反馈信息

反馈信息的使用是为了及时地更新用户兴趣库的内容, 以便满足用户不停变化的需求, 系统中进行反馈的方式有两种, 一种是用户通过自己的主观判断, 可以修改用户自身的兴趣, 这是可选择性的。另一种是主要是针对不同关键词之间的、包含用户兴趣特征的语义相关度, 以便于对用户的查询条件进行处理。系统采用改进的基于词频统计反馈学习算法。

相关度:设x为一查询关键词, y为其语义相关词, 并且设x和y在搜索结果中被用户选中的文档中出现的次数分别是∫xsel和∫ysel, 出现在同一篇文档中的次数为y乙sel;相应地, 设x和y在搜索结果中未被用户选中的文档中出现的频率分别是∫xunsel, ∫yunsel和, ∫x, ynsel, 那么y与x的相关度可用下式表示:

相应地, 相异度可以表示成:

进一步, 语义相关度为:

当simx, y>divx, y时, 取min, 否则取max。其中SRx, y是y与x在用户偏好关键词表中的原始语义相关度。当用户的兴趣库进行更新时, 系统按语义相关度公式重新计算, 完成用户兴趣库的调整。

1.3 结果排序问题

由于Internet上流行的搜索引擎搜索到得结果都比较庞大, 由实际经验默认取原始搜索结果的前200条, 不足200条的取全部来进行排序。排序算法将直接影响个性化搜索中搜索效果, 将重要的搜索结果列在较为靠前的位置, 能够让搜索用户更快捷地找到这些更有价值的信息。通过计算原始的搜索结果与用户兴趣的相似度得到其相关的程度, 根据相似度进行排序。假设用户兴趣项的向量为Q (q1, q2, q3, …, qn) 及兴趣度的向量D (d1, d2, d3, …, dn) , 每一个兴趣项qi在文档中出现的次数为ti, 则用户的兴趣项出现的词频向量为T (t1, t2, t3, ……, tn) , 那么文档和用户兴趣的相似度S:

2 结束语

对于搜索引擎来说, 检索效果评价指标有查准率和查全率。该系统能够有效地解决用户在Internet上进行搜索时面对众多结果无从找起的问题, 使用户能够从系统返回的查询结果中迅速得到有用的信息, 提高了查准率, 同时系统是对常用的搜索引擎返回的结果进行二次处理, 充分地利用了已有技术的可靠性, 保证了查全率。当然也存在着一定的不足, 比如如何更准全面地了解用户的兴趣, 还需进一步的研究。

摘要：针对目前常用搜索引擎在查询时返回结果数量巨大且杂乱无章的现象, 在Web客户端为实现对用户的个性化信息服务设计了一种基于用户兴趣的搜索系统。利用用户的兴趣对于用户提出的搜索条件进行处理, 再通过常用的搜索引擎进行查询, 并将得到的结果进行二次排序, 同时通过反馈信息不断更新用户的兴趣, 以满足用户不断变化的需求。实验证明这样在保证了查全率的基础上, 提高了查准率, 从而提高了搜索效率。

关键词：个性化搜索,用户兴趣,反馈,相关度

参考文献

[1]陶跃华, 孙茂松.搜索引擎搜索结果的评价技术[J].情报科学, 2001 (8) .

[2]赵艳秋, 封志宏.基于XML的Web搜索推荐系统中的用户兴趣模型的建立研究[J].网络安全技术与应用, 2009 (3) .

[3]杨文忠, 章兢.一种基于常用搜索引擎的智能信息检索系统[J].微计算机应用, 2007 (2) .

用户个性篇7

关键词：用户偏好,个性化信息服务,信息推荐

在世界信息化进程加速的推动下, 互联网在深度和广度上一直都呈现出飞速发展的趋势, 用户可以获取的信息不仅变得越来越丰富也变得越来越繁杂, 互联网已经成为当今世界人们获取信息服务的最重要的途径。从“新摩尔定律”可以看出, www中的信息量正以半年翻倍的速度爆炸性增长着。面对这浩如烟海的信息, 如何让用户快速精准地获取到自己所需的信息而不至于迷失成为Web站点吸引用户的关键。如何从用户的行为出发挖掘出用户的需求针对其个人特征向其提供个性化的信息服务成为获取用户吸引用户以及扩充用户群体的关键。

现有的Web信息服务主要存在以下问题。第一, 很多Web站点仅根据用户的初始静态信息简单地进行网络链接呈现, 而由于现今信息量的急速膨胀, 大量链接容易使用户在互联网复杂的信息空间中迷失方向。第二, 网页中为用户提供的大量信息对特定用户来说往往是多余的, 没有充分考虑到用户的需求差异, 要从大量无用的信息中获取到用户所感兴趣的信息相当繁琐。第三, 对于绝大多数网站仍然是被动的对用户提供信息服务, 没有主动去挖掘用户的需求, 更没有实现对用户感兴趣的信息进行主动推送。第四, 能够进行个性化信息服务的Web系统大多都极大地依赖于用户主动提供的显式静态偏好信息, 无法主动感知用户的需求变化。

1 国内外相关工作

个性化信息服务早已成为国内外专家学者研究的热门课题, 也不乏很多成功案例。获取用户偏好属于数据挖掘的范畴, 由于互联网信息呈现出动态的无结构化特点, 要想通过在Web中的用户行为及Web资源中提取潜在的有价值的信息变得更困难。根据Web挖掘的数据对象差异可将基于Web的数据挖掘分为以下几个类型。第一, 基于Web结构挖掘:从Web站点的组织架构和链接结构中挖掘出有价值的信息。第二, 基于Web内容挖掘:从Web站点页面展示的信息、数据库中的结构化信息和其他如多媒体这样的非结构化数据中挖掘出有价值的信息。第三, 基于Web使用挖掘:从Web服务器中所记录的用户行为记录等信息中挖掘出用户感兴趣的信息。

2 用户偏好模型

对用户偏好建模, 就是要对用户的固有兴趣或一段时间内相对稳定不易改变的信息需求进行抽象和描述。用户的兴趣包含甚广, 如仅仅是语言文字描述没有任何意义, 为了建立起在电子信息平台上的用户偏好模型, 要将用户的兴趣变得可计算性, 也就是用一种面向算法的思维对用户的需求进行具备特定数据结构的形式化的描述。由于用户的兴趣不时的会新增、衰退和遗忘, 如何模拟兴趣的遗忘是一个难点, 在此应建立一个遗忘函数对用户的兴趣赋予一个初始兴趣度, 随着时间推移该值逐渐衰减, 直到降到一定阈值, 就定义该兴趣被用户完全遗忘。在此基础上, 建立起能实时捕捉动态更新的用户偏好模型, 将用户的兴趣划分为短期和长期两类P= (S, L) , 根据各自特点分别进行不同的处理, 短期兴趣S经过一定时间通过验证用户的行为如果达到条件就将转变为长期兴趣L, 否则就将减弱消退被用户所遗忘, 而长期兴趣经过较长时间也可能渐渐被遗忘, 定义兴趣度的概念作为衡量指标来模拟用户偏好的遗忘, 它是一个随时间递减的函数, 用来反应随着时间推移用户对某一方面的兴趣偏好逐渐衰退的过程, 其计算公式如下。

2.1 短期偏好

用户短期兴趣的定义:短期内会发生改变或者转移的兴趣, 除一部分经过时间推移会转变成固定的长期兴趣, 大部分短期兴趣总是因为特定的时间或环境突然出现而又速度消失, 所以不用过细地去对短期兴趣特定分类, 我们用S表示短期兴趣, 它由一个关键字的集合来表示即S= (s_1, s_2, …, s_n) , 其中s= (k, v) , k表示关键字, v表示该关键字对应的权重。

对于获取到的用户相关信息, 将其抽象归纳为一组特征关键字的集合来表示, 每一个关键字对应一个集合, 该集合包括 (关键字元k, 初始权重v, 时间t, 文档d, 时间衰减度r) 。

用户短期兴趣生成算法:对关键字K有

K的t时刻累积权重为

输入:关键字向量集合

输出:用户短期兴趣向量

While存在用户关键字向量集合

begin

找出向量集合中存在关键字相同的全部向量

计算t时刻该关键字的累积权重

end

找出权重最大的m项作为用户的短期偏好。

2.2 长期偏好

用户长期兴趣的定义:由于长期兴趣相对稳定不易变动且信息量很大, 所以考虑将用户长期兴趣按领域来进行分类。表现形式如下。

l:用户感兴趣的一个领域;

a:用户关注的该领域的文档数量;

q:定义为, 表示用户对该领域感兴趣的程度。

对于某一长期兴趣l, 可以通过对文本信息聚类来得到。而每个文档类都对应着一个特征关键字集, 于是可以先对每类文档统计其特征关键字的词频, 组合起来便可得到对应每个类的特征关键字和全中的向量, 对于同一类型的信息每个用户的侧重点都不同, 这样更能准确反应出用户的偏好。

用户长期兴趣生成算法如下。

输入:关键字向量

输出:长期偏好

第一, 取出时刻用户所有关键字向量, 根据计算每个关键字的累积权重。

第二, 重复1 直至一个较长时间每个向量都被计算过。设定阈值, 选中权重高于阈值的关键字组成集合A。根据关键字向量得到文本集合。

第三, 筛选文档, 提升关键字和文本的关联性, 设定阈值 ( 关键字的初始权重) 并计算得出初始阈值大于的文档集合。将集合分类得到用户一部分长期偏好, 表示一个偏好领域。

第四, 对没有达到阈值进一步考察:

将一段时间分成前后两个时间段:

对于关键字, 计算初始权重和经过后的权重累积增量:

若增量相差小于认为设定的阈值, 则将该关键字对应文档集合重复步骤3 得到集合, 进一步得到

第五, 合并得到分别统计各文档数量。

第六, 定义为用户对各类别偏好程度, 最后得到

3 结语

用户个性篇8

网络教学随着Internet的发展被越来越多的人所使用, 而如何针对学习者的兴趣推荐相应的学习资源, 也成为了网络教学中被关注的问题。随着学习内容的推进, 学习者的兴趣相应地会发生转变, 针对这一特点, 本文设计了基于浏览行为的个性化推荐系统 (Browsing Behavior Personalized Information Recommendation System, BBIRS) 。

1 用户兴趣模型的建立

1.1 基于向量空间模型的混合模型

在个性化推荐系统中, 用户的兴趣模型会在很大程度上影响到推荐效果, 文中采用了图1所示的二层树状结构模型。

图1用二层树状结构模型来表示用户兴趣。用一组兴趣主题词 (I1, I2, …Ik) 来代表用户的k个兴趣类型, 每一兴趣类II根据用户兴趣度的高低赋予一定的权值InterestDregree (Ii) , 因此用户的兴趣可以表示为 ( (I1, InterestDegree (I1) ) 的加权矢量形式[1,2]。

树状模型的第一级节点表示了用户的兴趣类型, 及其对每一兴趣类的兴趣度高低。树状模型的第二级节点是用户某一兴趣类的向量空间模型表示, 这样就使得用户的兴趣类的表示和页面文档的表示统一了起来, 那么在兴趣模型更新的时候就可以直接采用前面讨论的相似度计算公式计算新浏览页面与兴趣类的相似性, 简化了用户兴趣模型的更新。

本文从两个方面考虑一张页面在其兴趣类页面集合中的兴趣等级:①用户在这张页面上的浏览行为动作;②页面内容与兴趣类主题的相关程度。

1.2 通过浏览速度计算用户的兴趣度

设用户在时间段TimeSpan内共依序浏览了N个页面, 记为b1, b2, …, bN。由于用户可能多次访问同一个页面, 因此用户在时间段Timespan内浏览的各不相同的页面数n≤N。记用户在时间段Timespan内访问的各不相同的页面为p1, p2, …, pn, 访问pi (i=1, 2, …, n) 的次数为Fre (pi) 。

令Interest (p) 为用户对页面P的兴趣度, Duration (pi) 表示用户在页面pi上驻留的时间,

用户的浏览速度定义为单位时间内用户浏览的字节数, 即

$S p e e d (p) = \frac{S i z e (p)}{D u r a t i o n (p)} (1)$

则用户兴趣度可以通过下式来估计:

$Ι n t e r e s t (p) = \frac{1 / S p e e d (p)}{\max_{v \in Ρ} (1 / S p e e d (v))} (2)$

对浏览速度进行非线性归一化, 用户对页面p的兴趣度可以通过下式得到:

$\begin{array}{l} Ι n t e r e s t (p) = \\ \frac{\log_{10} (1 / S p e e d (p)) - \min_{v \in Ρ} {\log_{10} (1 / S p e e d (v))}}{\max_{v \in Ρ} ({\log_{10} (1 / S p e e d (v)))} - \min_{v \in Ρ} {\log_{10} (1 / S p e e d (v))}} (3) \end{array}$

2 BBIRS系统

2.1 BBIRS系统结构图

BBIRS系统可以分为在线部分和离线部分[3]两个过程来进行, 如图2所示。

2.2 PPTIS系统结构

该系统主要包含Web使用挖掘、用户兴趣分析和个性化推荐三个模块。其中, 框架的基础是Web使用挖掘, 其首要任务就是利用Web结构数据预处理的结果和Web站点服务器日志完成Web使用数据预处理工作, 即从大量的Web日志中识别用户、识别会话并进行路径补充, 以形成访问事务集。访问事务集也就成为各种Web使用挖掘方法的处理对象。比如, 可以利用聚类算法对访问事务进行聚类, 并利用基于决策树的快速关联规则挖掘算法[4]对访问事务集进行处理。

用户兴趣分析模块首先需要利用用户的浏览行为和浏览内容分析用户对页面的兴趣, 以形成用户当前会话;然后, 将频繁Web页面集与用户当前会话进行匹配, 以形成推荐页面集。同时, 该模块可以自适应用户的兴趣模型[5]。

个性化推荐阶段只需要推荐引擎依据用户偏好视图将用户所偏好的页面以超级链接的形式附加在用户的学习页面中。

3 推荐策略

BBIRS系统采用了Web使用挖掘和分析用户兴趣的两种方法进行推荐, 但这两种方法不同的特点。首先, 二者来源不同, 访问日志记录了关于用户访问的信息;交互数据则记录了用户和远程教育系统之间的交互信息。再者, 对二者的兴趣点不同, 日志记录中本文主要关心的是用户访问的行为方式, 如:兴趣的转移、页面滞留时间、访问次数等;交互数据中本文主要感兴趣的是用户访问记录的具体内容, 例如:作业、考试完成情况和答案, 答疑时给老师提的问题, 与同学交流的主题等。因此, Web使用挖掘方式适合于用户的兴趣没发生很大改变的时候进行推荐, 而分析用户兴趣方式适合用户的兴趣发生变化时进行推荐, 而用户的兴趣变化主要通过其浏览行为体现, 而浏览速度是最能体现用户兴趣的浏览行为之一。

推荐算法如下:

设定阈值α

If (Interest (p) >α) then

更新用户兴趣库;

采用用户兴趣分析方式推荐;

Else

采用Web使用挖掘方式推荐;

end

需要说明的是:当用户对页面的浏览速度speed (p) 比较慢, 即interest (p) >阈值时, 有两种情况, 第一种情况很显然说明用户对页面很感兴趣;第二种情况可能是用户对该页面的内容是第一次学习或学习次数较少, 在这种情况下, 访问日志中记录的该页面的信息就可能较少, 所以采用用户兴趣分析方式推荐, 同时更新用户的兴趣库。

4 结束语

本文所设计的系统具有以下特点:

①有两个基本平行的挖掘过程分别对访问日志和交互数据进行挖掘, 使得每一个挖掘过程相对简单, 又能各自独立地处理不同的数据源。因此, 用两个相对独立的挖掘模块进行挖掘, 更能充分利用这些信息来个性化用户群。

②该模型体现了以用户为中心的思想, 从用户出发, 最终反馈到用户, 变被动为主动, 能够尽可能地迎合每个学习者的浏览 (学习) 兴趣, 并且不断调整自己来适应学习者浏览 (学习) 兴趣的变化, 进行个性化教学服务。在模型中, 对两种不同数据库一般会采用不同的挖掘算法, 以期望使个性化得到最好的体现, 本文的目标不是个性化到每个相似的用户群体, 而是个性化到每个不同的用户, 使每个用户感觉到整个教育过程就是专门为他量身定做的一样。

摘要：网络教育已成为现代教育技术主流的发展方向。提出了二层树状结构模型, 并在此基础上, 设计了一个基于基于浏览行为的个性化推荐系统 (BB IRS) 。系统可以通过离线和在线方式对用户的访问日志和交互数据分别进行挖掘, 并通过根据用户的浏览速度计算用户对页面的兴趣度, 根据该兴趣度是否大于阈值, 系统采用不同的推荐策略。

关键词：E-learning,个性化推荐,Web挖掘,推荐模型

参考文献

[1]冯是聪, 单松巍.基于Web挖掘的个性化技术研究[J].计算机工程与设计, 2004, 1:4-6.

[2]潘延军.基于用户浏览内容的Web用户浏览行为个性化研究[D].天津大学硕士论文, 2005.

[3]侯伟, 吴晨生, 杨炳儒, 等.一种高效的离线数据流频繁模式挖掘算法[J].计算机科学, 2009, 7:246-251.

[4]陈雪飞.一种基于决策树的快速关联规则挖掘算法[J].计算机科学, 2008, 35 (7) :252-254.

用户个性篇9

关键词：个性化推荐,用户兴趣模型

1 引言

Internet从产生至今不过20多年的时间, 但目前Internet上的信息量相当于人类过去100年产生的信息总量, 已经成为一个全球性信息服务中心。随着其规模和覆盖面的迅速发展, 在提供越来越多信息服务的同时, 其结构也变得越来越复杂, 这反而降低了信息利用率, 带来信息过载问题。面对统一的界面和内容, 人们很容易迷失在Internet的“信息海”之中。为了解决Internet信息过载问题, 基于Web推荐系统应运而生。

推荐系统分为非个性化推荐系统和个性化推荐系统[1]。非个性化推荐系统向所有用户提供同样内容的推荐, 而个性化推荐系统按照用户的浏览习惯和兴趣, 为用户提供动态的浏览建议, 这样就可以过滤掉无用信息, 并根据用户的兴趣订制推荐。个性化推荐系统因具备这种优势, 被越来越广泛地研究和应用。

目前大部分高校就业网站提供信息的方式就是堆积海量的用人单位需求信息, 用户只能借助分类浏览、搜索等通用网站工具来查找他们所感兴趣的信息, 这需要用户对所要查找的信息 (如招聘时间、用人单位名称、需求岗位的详细信息等等) 有非常清楚的了解。面对每天频繁更新的大量需求信息, 用户不能有效地利用网站信息资源。为高校就业网站提供个性化推荐系统, 让用户更便捷、高效地利用就业网站是十分必要的。

个性化推荐系统实现个性化推荐要经过用户建模、项目匹配和推荐输出三个阶段。用户建模是获取和维护与用户兴趣、需求和习惯相关知识的过程, 其结果是产生一个能够表示出用户特有背景知识或兴趣的用户模型。用户建模是个性化推荐系统实现个性化推荐的主要知识源, 其获取用户兴趣的能力很大程度上决定了推荐是否成功。

用户兴趣获取方式一般包括显性方式和隐性方式两种。显性方式是通过用户主动描述来获取用户的兴趣, 这种方式简单而且直接, 有助于加快学习算法的速度, 但它要求用户明确兴趣并花费相应的时间和精力。隐性方式不需要用户参与, 是系统在用户的使用过程中从用户的访问路径、访问过的文档集合等特征自动完成的, 会包含很多冗余和无效信息, 这将大大增加学习过程的时间。这两种用户兴趣获取方式各有利弊, 把两者相结合取长补短才是最好的方法, 因此本文在研究现有用户兴趣建模方法后, 针对高校就业网站信息源及用户对象的具体特点, 提出一种针对就业网站个性化推荐系统的建模方法, 此方法能有效的为用户对象进行推荐。

2 用户兴趣模型的分析和建立方案

2.1 高校就业网站个性化推荐系统特点

针对不同的信息源特点, 推荐系统的侧重也各不相同, 目前讨论最广泛的有搜索引擎系统、电子商务系统和图书馆推荐系统。对于高校就业网站个性化推荐系统, 信息来源就是用人单位的需求信息, 主要包括学生专业、学历、个人素质的基本要求, 信息源十分规范。

基于Web的推荐系统的用户对象无论在年龄、学历还是兴趣爱好等各方面都有着很大差异, 需要考虑的用户对象范围十分广泛, 而高校就业网站的用户对象有较明确的年龄范围、学历层次和专业背景, 用户对象群体相对稳定。

2.2 用户兴趣模型的建立方案

根据以上对高校就业网站个性化推荐系统信息源及用户对象特点的分析, 本文对用户对象静态及动态信息进行有机结合, 提出基于用户对象显性兴趣和隐性兴趣的建模方法。

用户兴趣模型刻画的是用户信息从提交到注销这段时间里用户信息需求的一体化描述, 包括动态进行更新以精确反映用户的兴趣倾向。用户兴趣模型可以形象地描述成一个3元组P[2]:P={S, F, Ψ}

其中, S={S (0) , S (1) , …S (i) , …S (n) }, F={F (1) , F (2) , …F (i) , …F (n) },

Ψ:S×F→S, {S (i+1) = (Ψ (S (i) ) , F (i+1) ) , i=0, 1, …, n}

这里, S是该用户兴趣模型在系统使用过程中产生的全部状态集;F是系统为该用户模型采集到的全部反馈信息集, 其作用是驱动更新过程;Ψ是该用户模型的更新函数。其中, S (0) 是该用户模型的初始状态, S (i) 是经过i次更新后的用户兴趣模型, F (i) 表示系统第i次反馈的用以更新P (i+1) 的信息。这个形式化描述反映了用户兴趣模型处于不断地更新状态, 及时的反映了用户的兴趣倾向。

根据实践经验, 我们将用户登录时必须输入的基本信息作为显性兴趣的采集来源。通过每学期就业工作总结, 我们发现学生专业、生源所在地、学历、性别以及是否担任过学生干部等方面的差异很大程度决定学生兴趣倾向。例如用户对本专业就业信息选择倾向大于其他专业用户对此的需求, 而对于相同专业学历层次的高低会影响需求信息的选择倾向, 博士高于硕士, 硕士高于本科生。就我校情况分析, 生源所在地信息也是学生兴趣倾向的一个重要指标, 一方面学生对于全国一线城市及各省会城市有地区倾向, 另一方面对生源所在地有一定的地区依赖, 这也很大程度上决定了学生兴趣倾向。

但是以上并不是绝对的, 有时也会出现一些不符合显性兴趣甚至与显性兴趣相反的情况, 近年来教师编制紧张, 出现硕士甚至博士抢占本科生基础教育市场的现象, 有一些行业对专业的限制越来越模糊, 跨专业择业现象越来越多。这些现象表明, 一些用户在某段时间内对某些需求信息感兴趣, 在令一段时间将兴趣转向其他需求信息, 所以不能忽略用户需求信息的变化。隐性兴趣把用户浏览某网页的时间、浏览该网页的次数作为隐性兴趣信息的来源, 隐性兴趣能更准确、更真实地反映用户当前的兴趣倾向。

我们设定DI (dominate interesting) 为显性兴趣特征向量, RI (recessive interesting) 为隐性兴趣特征向量, 确定用户兴趣模型为αDI+ (1-α) RI, 其中α∈[0, 1], 该参数可以调节显性兴趣和隐性兴趣对用户模型的影响程度。

每学期开学, 我们都会组织应届毕业生登录就业网站采集显性兴趣倾向信息, DI={专业}∪{生源所在地}∪{学历}。隐性兴趣倾向信息RI={搜索关键字}∪{访问行为}。较复杂。访问行为由用户在一定时间段内访问的网页集和对各个网页感兴趣程度组成[3], 而用户对某一网页的感兴趣程度, 则要依据用户对该网页的访问次数和访问时间来决定。设用户访问页面page (i) 的访问次数为f req (page (i) ) , 第j次访问page (i) 的时间为time (p age (i) , j) , 用户对象对页面page (i) 的兴趣度为i nte (page (i) ) , 那么用户访问页面page (i) 的访问时间为假设用户本次查询页面列表中共访问了N个页面, 构成本次用户访问页面集T, T中所有页面的总访问时间可以看成一个数列, 计算该数列的平均值μ和标准方差σ, 然后用高斯归一化公式[4]处理, 根据3-σ规则, 数列中的每个数字落入[-1, 1]区间内的概率为99%, 然后再通过平移操作使inte (page (i) ) 的值最终落在[0, 1]上。用户对页面的感兴趣程度可以计算为:

需要注意的是, 在这里对time (page (i) , j) 有个说明, 用户对象在实际浏览中会出现两种特殊状态:一种是用户驻留时间太短。当用户打开一个页面却发现不感兴趣, 立刻关闭;另一种是用户驻留时间太长。当用户打开一个页面, 其驻留时间远远超过正常浏览时间, 造成系统对该页面反馈度远远小于1。这两种情况严重影响系统分析页面感兴趣程度的结果, 于是把系统设置两个阀值:最小浏览时间Min-time和最大浏览时间Maxtime。根据一般规律, 把Min-time设定为10秒。根据Claypool等人对75个用户2000多次访问的驻留时间进行记录[5]可知, 用户在绝大部分访问中驻留时间小于3分钟, 设定Ma x-time为3分钟 (即180秒) 。

对于用户访问时间小于Min-time的页面, 在算法中视为无效操作, 不予考虑;对于用户访问时间属于[Min-time, Max-time]的页面, 则保持其访问时间原值;对于用户访问时间大于Max-time的页面, 则其访问时间赋值为Max-time。

3 结语

用户兴趣模型是推荐系统产生个性化推荐的主要知识源, 用户兴趣模型的建立是个性化推荐系统的基础, 也是实现个性化推荐的关键。如何针对不同应用领域特征建立科学高效的用户兴趣模型、如何对信息特征化以及优化推荐算法是我们研究的方向。

参考文献

[1]吴丽花、刘鲁, 《个性化推荐系统用户建模技术综述》, 2006, 25 (1) :55-62.

[2]黄希全, 数字图书馆推荐系统中用户偏好的建模方法《, 情报杂志》, 2006 (1) :28-3 0.

[3]袁薇, 搜索引擎系统中个性化机制的研究《, 微电子学与计算机》, 2006 (2) :68-75.

[4]庄越挺、潘云鹤、吴飞《, 网上多媒体信息分析与检索》, 2002 (9) :59.

用户个性篇10

关键词：互联网,用户参与平台,个性化,本土化,人文化

在网络科技令人眼花缭乱的信息时代, 互联网的触角已经深入到人类生活的方方面面, 影响到每个人的行为方式和信息观念, 导致每个人对信息需求的内容、需求方式以至于获取速度或者说效率都发生了相应的变化。

对于以提供知识信息服务为核心和目的的图书馆来说, 针对这种客观变化而进行服务手段和方式的创新是不可回避的话题, 许多学者和图书馆界人士也陆续提出了自己的理论观点。本文对于服务创新的必要性和意义不再赘述, 仅从实践的角度提出一种网络技术和中国本土国情相结合从而实现本土化和个性化的图书馆服务类型。

1网络技术本土化的可实现性根源

互联网是全球技术, 它拉近了人类的距离, 相对于网前时代, 互联网时代的最大特征就是任何一件事情的发生和信息的传递都可以通过互联网让尽可能多的人迅速甚至同时参与其中, 打破了空间、地域和时间的限制。图书馆自诞生以来就以知识的收集和保存为任务, 最终目的却是传播知识, 可以说互联网的特性恰恰是满足图书馆终极目的现今为止最合适的途径。不少人曾经因为互联网和数字技术的发展而忧虑图书馆是否会因此而消亡, 现在事实证明, 网络时代的图书馆相对于网前时代的图书馆来说, 只不过收集、保存、传播知识的方式更加多样化而已。

2用户参与平台是适合中国国情的图书馆服务创新形式

用户是图书馆的核心组成要素, 是能够利用或得到图书馆服务的一切人或人群。图书馆是用户的图书馆, 强调用户及其需要在图书馆理论和实践中必然处于核心地位。这是用户参与平台构建作为图书馆服务创新方式的认识前提。

本文的用户参与平台框架参考互联网著名的中文互动问答平台———百度知道。“百度知道”是用户自己具有针对性地提出问题, 通过积分奖励机制发动其他用户, 来解决该问题的一种搜索模式, 这些问题的答案又会进一步作为搜索结果, 提供给其他有类似疑问的用户, 达到分享知识的效果。百度知道的最大特点, 就在于和搜索引擎的完美结合, 让用户所拥有的隐性知识转化成显性知识, 用户既是百度知道内容的使用者, 同时又是百度知道的创造者, 在这里累积的知识数据可以反映到搜索结果中。将百度知道划定一个边界, 即问题和答案必须与图书馆分类检索和图书馆知识内容相关, 就是图书馆服务的用户参与平台基本框架。

为何要建立这种形式的框架?

首先, 这是中国图书资源利用情况和读者分布和信息需求现状决定的。

我国人口众多, 对情报信息资源有需求的用户基数非常大, 互动问答平台是一个随着参与用户增多而越有效率的服务形式, 是充分发挥人口优势的一种设计。另一方面, 虽然随着数字科技、信息科技的发展以及互联网的利用使得各图书馆之间一部分已经实现有限的资源共享, 我国大型图书馆和高校图书馆的可利用图书情报资源越来越丰富, 但是实际使用率并不高, 并没有充分发掘图书馆现有的资源潜力。图书馆服务采用这种互动问答平台, 实质上是寻求最佳答案或最大智慧, 当参与的人越多, 这个“最”字就越名副其实, 它能够节省重复的工作, 找出达到目标的最佳路线, 并让其他人能够感受整个过程并作出选择。

同时, 知识的专业化使得一个人对不属于自身领域的知识不熟悉、不懂、完全陌生, 当需要这一部分知识时, 可能不知道上哪里去获取, 不知道怎样获取相对正确的知识, 不知道获取的知识是否符合自己需要, 或者无法用最快的速度获取, 平台可以让非专业用户获得专业用户的帮助, 让不同专业、不同水平、不同领域之间进行信息流动。

实际上, 互动问答平台的服务方式最适合高校图书馆, 那里有最集中的信息资源需求用户群, 高校师生都是最活跃最易接受新事物的群体, 电脑和互联网最普及的场所, 一般高校中都会有一间以上的电子阅览室, 几乎不构成使用网络的障碍。

另外, 科技的发展以及发展的不平衡导致双重馆藏的状态可能在一个较长时间内存在, 数字化信息资源与实物图书资源必然有重合和非重合的部分, 不同阅读习惯的用户可以通过平台交流并给予他人指导, 形成数字化图书馆和纸质化 (实物) 图书馆的良好链接。

其次, 用户参与平台的建立有利于增加“社会馆员”的功能, 弥补图书馆功能的不足。

图书馆内部活动的实质是知识组织与管理。促进知识流通, 了解不同用户群体对知识信息的不同需求, 引导读者在资料大海中寻求有用的信息, 提升读者的知识水平, 是图书馆和图书馆员的重要任务。在网络信息时代, 图书馆员的天然职业内容对其自身提出了更高要求, 需要图书馆员更有效的提升和发挥知识能力和潜能, 能够以自己的专业知识为用户提供满意的解决方案, 成为一名“知识工作者”。但是由于制度上和图书馆社会地位等各方面的原因, 在短时间内提高图书馆员的多方面知识达到专业水平或者大量引进具有专业知识水平的人员又是不现实的。解决这个矛盾的方法之一就是增加“社会馆员”的功能, 在平台中用户既可以是读者提出问题寻求服务, 也可以充当馆员的角色指导他人提供服务。

另一方面, 人一生中获得的知识是有限度的, 但是无数人的知识集合是无限的, 在平台的知识信息交流过程中还会不断产生新的知识信息, 图书馆馆员对系统产生的知识片段进行整理, 又形成了新的知识集合, 所有的用户都成为知识信息的提供者, 是对图书馆知识收藏功能的弥补。

再次, 平台的创建有利于图书馆增加和扩大用户群。

在网络条件下, 世界各地的社会成员都有可能成为图书馆用户, 但是将这些“潜在用户”转变成现实用户, 馆内宣传、传媒宣传等手段都受到空间和经费限制, 而可以无视空间的一个受图书馆主导的网上交流平台是很好的增加图书馆用户群的方式。我们可以设想这样的情况:一个潜在用户在平台上发出自己的信息意愿, 然后迅速得到了另一个现实用户的回应, 这个回应往往是不会完全满足潜在用户的信息需求, 他需要追诉已得到信息的源头, 而在平台所有的信息源必然是图书馆, 因此潜在用户必然会有意无意向信息资源所在图书馆发出服务请求, 接受图书馆的服务, 成为一名新的现实用户。

最后, 平台的创建是图书馆个性化、人文化的尝试。

个性化和本土化是任何国家的图书馆学都需要经历的重要过程。提到世界各国的图书馆, 我们会有这样的鲜明印象:例如印度图书馆学强调社会教育、注重人文关怀, 将传播知识与引导和鼓励群众对生命持有心身融合的观念相结合, 前苏联图书馆学重视读者的阅读研究, 提升读者的知识素养, 日本图书馆学将情报学作为重要的研究内容, 德国图书馆学学术色彩浓厚、英国图书馆学具有管理特点、美国图书馆学侧重实用和技术, 优先使用先进技术和管理制度等。而中国现代图书馆学从建立到发展长期受西方图书馆学影响, 割裂了古代图书馆重视文献研究的传统, 却又没有形成新的自己的个性化特色。

笔者认为, 图书馆学的个性化要以本土化为出发点, 以人文化为中心和目标。图书馆学大师谢拉曾经说过:“图书馆是人文主义的事业, 图书馆学始于人文主义、图书馆发展根植于人文主义, 图书馆从一开始, 它就体现了人文主义的精神和实质。”西方图书馆是西方人文主义的体现, 中国图书馆的人文主义精神则要从中国的传统人文主义中寻求精神指导。中国的传统人文“以人为贵”、“以仁为本”、“以民为本”, 强调互助仁爱, 对于图书馆来说, 就是要以用户、以读者为本。用户参与平台的创建就是图书馆学人文化的一种体现, 它注重图书馆读者之间的交流、读者与非读者之间的交流。平台的每一个用户既是读者又是馆员, 既是需求者又是服务者, 互相帮助、互相提升、互相服务、互相关怀, 是人文精神内涵的具现化, 是对知识自由的追求。

参考文献

[1]刘兹恒.图书馆学研究的本土化思考[M].北京:北京图书馆出版社, 2007.

[2]王子舟.图书馆学基础教程[M].武汉:武汉大学出版社, 2003.

[3]于良芝.图书馆学导论[M].北京:科学出版社, 2003.

[4]朱江岭, 主编.网络信息资源检索于利用[M].北京:海洋出版社, 2007.

[5]盛剑锋.图书馆知识管理与服务研究[M].北京:科学出版社, 2012.

[6]吴慰慈, 主编.图书馆学基础[M].北京:高等教育出版社, 2004.

[7]方敏编.图书馆人文管理[M].哈尔滨:黑龙江人民出版社, 2008.

[8]刘勇.用户参与:互联网时代图书馆服务创新发展的必然选择[J].浙江高校图书情报工作, 2012 (4) :41-45.

[9]张燕.高校图书馆服务创新趋势探究[J].群文天地, 2012 (10) :227.

[10]郭学军, 曾光中, 曹冠英.基于用户体验的高校图书馆服务创新[J].当代教育理论与实践, 2012 (10) :63-65.

【用户个性】推荐阅读：