个性化推荐系统研究(通用11篇)
个性化推荐系统研究 篇1
毋庸置疑, 一个好的推荐系统一定要有好的推荐技术作为支撑, 但是除此之外, 如何获取大量的、准确的用户信息也是十分重要的。准确的用户信息对于提高推荐系统的准确性有着很重要的意义。因此, 如何获得有效的、准确的用户信息就成为一个优秀的推荐系统的首要问题。只有获得准确的、有效的用户信息并结合一个好的推荐技术才能为用户最佳推荐。
一用户数据获取
获得用户信息有两种方法:一种是显示获取, 一种是隐式获取;其中第一种方式获取用户信息是目前最常用的一种方法。显示获取就是通过用户注册信息和用户对网络资源的显示评分来获取用户可能感兴趣的信息特征。隐式获取就是以web数据挖掘、人工智能等技术辅助获取用户浏览网页的相关信息。通过用户浏览记录提取用户的兴趣和爱好, 并将用户的偏好转化为结构化数据并存储在数据库中。信息获取过程, 用户无需参与, 能够获取很多用户兴趣偏好的反馈信息。但是隐式获取用户信息, 由于没有用户的主动参与, 所以存在很多随机性和不确定性。
豆瓣是中国最富盛名的评论和社交网站, 上面有大量用户的读书行为数据。对于一个用户来讲, 其有关读书的行为数据包括已读、浏览等类型, 一旦某本图书出现在已读、浏览两者之一的列表中, 我们就认为用户对这本书感兴趣, 我们的目的就是获取用户这样的行为数据, 并利用这样的数据来衡量推荐系统的质量。我们利用网络爬虫从豆瓣上抓取用户以及该用户的读书记录, 并将结果保存到数据库当中。
二图书文本预处理
当前, 在处理文本信息的过程中, 一般情况下, 选取词作为文本的特征项表现要优于选择词组或者字。因此, 本文选择使用词作为文本的特征项。我们首先将小说文本分成词, 由这些词组成向量元素来表示文本。但是, 我们使用中文分词器切分词条时, 经常含有大量的单个独立字, 这些独立字不仅携带信息量较少, 而且对文本分类的准确性和处理效率产生极大影响。因此, 我们在进行文本分词时, 首先要过滤单个独立字。此外, 一些数学符号以及英文字符对文本分类贡献极小, 可以忽略。最后, 需要过滤掉纯英文词条。经过上述预处理过程, 可以有效地降低文本词条向量的维数。提高文本特征向量的中文纯度。图书文本预处理实现过程如图1。
图书文本预处理后, 就可以把表示为相应的特征向量, 假设我们通过特征抽取技术抽取到的特征词个数为M, 第i个特征词表示为Ti, 那么一本图书文本表示为:{WT1, WT2, …, WTM}, 其中WTi表示特征词的权重。权重计算通常采用TF-IDF方法。
三图书文本相似度计算
本文采用向量空间模型来计算图书之间的相似性。向量空间模型 (VSM) 是由Salton等人于上个世纪60年代提出的, 目前
在信息检索、知识挖掘等领域都有着广泛的应用。其基本思想是将图书看成是由彼此之间相互独立的一个个词组成的, 即上文所说的特征向量, 同时根据每个词在文档中的重要程度为其赋予一定的权重, 即上文所说的词频-反文档频率, 这样就可以将一本图书表示为 (ω1, ω2, …, ωn) 这样的向量形式。进而我们可以用如下的公式来计算两本图书之间的相似性。其中Ti表示文本i的特征向量, T1, i表示文本1的第i个特征词对应的权重。
四图书推荐
当用户浏览网页时, 我们可以根据用户历史的浏览记录, 计算出用户的可能的兴趣爱好, 并把用户的图书浏览记录利用特征抽取技术抽取成特征向量, 然后和网络图书相比较, 通过计算图书之间的文本相似度, 把最相似的前5本图书推荐给用户。至此, 我们的图书推荐系统构建完毕。图书推荐系统流程图如下图。
五总结
本文构建了一个基于内容的图书推荐系统, 通过用户行为数据获取, 图书文本向量提取技术, 以及图书相似度计算对用户进行图书推荐, 实现了图书推荐的个性化和准确性的统一。
参考文献
[1]刘建国, 周涛, 汪秉宏.个性化推荐系统的研究进展[J].自然科学进展, 2009, 19 (1) :1-15
[2]顾犇.信息过载问题及其研究[J].中国图书馆学报, 2000, :26 (129) :42-45, 76
个性化推荐系统研究 篇2
随着社会的发展,“持续而和谐的发展”已经成为了新的教育理念。营造个性化班级文化氛围既能够让每个学生的个性得到充分展示,又能够让学生实现可持续发展的目标。新课程改革需要班级文化不断地更新,实行新型的班级管理制度,让学生感受到良好的班集体文化。个性化班级文化建设是班级成员利用和创设文化环境、文化制度、文化关系等,来熏陶和培育集体成员创造性人格的一系列影响活动。它通过个性化的班规、班歌、班名,来实现个性化的班风、学风的目标,并且以个性化的班级活动为载体,让学生主动地参与到其中,以此来培养学生良好的人文素养、思想道德素养,从而实现自主创新的班级文化建设的目标[1]。
一、建设个性化班级文化
个性化班级文化建设,注重为学生提供一个有利于学生身心健康成长的环境。班级文化建设是教师进行班级管理中重要的一个环节,它需要摆脱传统的教育观念,实行现代新型的教育管理方法。在此过程中,教师不能不理会现代教育改革的背景,而继续施行陈旧的班级管理理念,陈旧的班级管理理念没有考虑到学生的长远发展,也因此会阻碍个性化班级文化的建设。个性化的班级文化不仅教育作用,还具有社会作用。通过班级共同的目标、榜样示范作用以及各种教育手段来影响学生就是个性化班级文化的教育作用,它能够促进学生的智育发展。而个性化班级文化的社会功能是它具有制约和示范功能,能形成良好的班风促进学生的自律,其次,它还具有凝聚和引导功能,优秀的班级文化能促使学生形成正确的价值取向。另外,它还具有平衡和保障功能,也就是它能在各种矛盾出现时,调节矛盾,保证学生的平等性。
二、个性化班级文化建设中所存在的问题
1.缺乏民主意识,采取家长式管理。在进行个性化班级文化建设中,通常的问题就是没有突出学生的主体意识。班级管理制度能够避免师生在开展活动中出现问题,同时其又是一种强制手段,不但为学生提供了评定品格行为的内在尺度,还约束了学生的言行。但是,受古代尊师教育的影响,教师拥有绝对的权威,使得在班级管理中教师占据着绝对地位。教师用“保姆式”、“警察式”、“裁判式”的管理方式管理着班级,并且施行着“专制化”的制度。从而没有注意到学生的个性发展,缩小了学生自己的活动空间。教育是一种群体行为,它需要教师、家长和学生来共同完成,它更是一个需要学生和教师以及家长和学生能够双向交流的过程。所以,在个性化班级文化建设中要让学生处于主体地位,不能因为不平等的观念,来影响学生的个性发展[2]。
2.忽视培养学生的合作意识和创新能力。学生的健康成长会影响到整个社会,甚至整个民族的长远发展。班级是一个社会的缩影,它能够为学生今后在适应社会方面提供一些帮助。个性化班级建设不是一项短期的工作,它是一项综合性的工作。教师是影响班级文化的主要因素,所以教师要为学生提供一个发展的平台[3]。但是在进行教学或者是课外活动中,教师却忽视了培养学生的合作意识,只注重个体的发展,注重课本知识的教授,而没有注重发掘学生的创新能力。
3.开展班级文化活动缺乏实际意义。班级文化需要通过班级活动来呈现,但是高中生的任务重压力大,所以学校就要求尽量地减少他们的活动,而他们能参与的活动大多都是形势要求,并非他们所愿。此外,班级在开展活动中并没有遵循以下几个原则:第一,没有遵循发挥学生是主体价值的原则;第二,没有遵循发展性原则;第三,没有遵循实效性原则;第四,活动大多数都比较“标准化”;这种“标准化”的活动在内容和形式都没有丰富的色彩,以至于并不能提起学生的兴趣,学生们通过活动没有得到任何提升,更别说让学生在活动中体现价值。
三、个性化班级文化建设的实践对策
班级文化建设是需要以共同的奋斗目标为前提来逐步完善的,而并不是通过某一个人的想象得来的,其需要通过具体的实践来总结出具体的方案措施。以下就是对个性化班级文化建设的实践方向的探讨。
1.制定个性化班级文化的建设计划。制定个性化班级文化的建设计划是建设个性化班级文化的基础。而要制定个性化班级文化的建设计划,就需要从两方面着手。一方面是确立一个班级个性化发展目标,另一方面是营造个性化的班级环境文化。首先来说确立班级个性化发展目标。为了实现学校的教学理念,促进学生全面发展,各个班级教师需要把具体内容落实到班级当中,通过对学生的综合调查分析,再加上与家长和学生一起沟通,来为学生量身定制班级发展目标、班级的发展计划、班级的管理制度以及班级的活动方案等。根据高中学生的特点,可以让他们为自己的班级起一个特殊的名字,并且制定一个统一的口号,以此来加强班级的环境建设,向学生传递积极健康的思想教育。这种文化环境建设会潜移默化地影响学生,使他们学习更加奋进。
2.创建个性化班级的育人理念。班级作为学校教育和教学工作的第一线,班级的个性化发展不但要求学生的积极参与,更要求班主任具备正确、独特且富有艺术性的设计和班级管理能力。这是因为,教师不仅是班集体当中的一员,更扮演着引导者的角色。班主任在平时的班级活动中不能够一概而论,不能阻碍学生的发展空间,要倡导学生个性化发展,实施个性化的评价。不能抛弃以人为本的教育理念,不能阻碍学生实现自我成长的目标。这就要求教师不能忽视学生的主体差异,不能只以自己为主体进行教学,要为学生的个性化发展创设真正的教育空间,不能用消极的眼光去区别对待个别学生。因为这样会不利于学生的全面发展,会阻碍学生向个性和特长方向的发展。另外,还要求教师要弘扬具有地方特色的现代学校精神,让学生能够时时刻刻以校训为激励目标,为自己健康发展提供支持。
3.推行柔性的个性化班级管理。从现代教育的人本特征来看,教育的出发点已经改变,更多的是解放思想,不反对学生释放个性。所以,每个班级要积极营造张扬班级个性的活动空间,选择“因材施教,因班施育”的理念,来进行个性化班级管理,让班级个性在文化上得以体现。以下是几种可以推行的个性化管理方式。第一种是“小组竞赛积分法”管理,通过分组的形式选出每一组的组长,在课堂活动中制定相应的规则,让学生们累积分数。这种管理方法让高中生们,在遵守班规班约的情况下增强了凝聚力,使自身的集体荣誉感也得到升华。第二种是“班级文学社团”的管理模式。这样通过激发学生的兴趣,可以让班级活动顺利地开展,同时也能通过竞争机制加强每位学生的自律性。要成立社团就要制定相应的规则,来促进学生的自律性。学生在丰富了课余活动中,能感到不一样的学习氛围。第三种就是“领导带头”的管理模式,就是让全体同学都能够参与到班级管理当中,学科带头实行轮换制,并对每一位带头人进行分数评定,最后给予奖励。进行个性化班级管理并不是天马行空的想象,需要具体的细则来规范[4]。
4.实现丰富的多元个性评价。要创建个性化的班级文化,离不开举办班级特色活动。虽然高中生已经进入到非常时期,但是围绕个性化班级文化建设特色班级活动,能缓解一些高中生的压力。在班级中要有效地利用各种渠道来组建各种文化设施,举办学习技巧交流会、读书作文比赛等等[5]。但是在这一过程中,一定要注重活动的价值体现,不能为了活动而活动,要为了思想而进行活动。每个学生、每个班级都有自己的长处,也都有自己的短处,所以要建立多元的评价体系来衡量他们。并且,这把衡量的标尺是依情况而定的,并不是一成不变的。建立多元的评价体系,不仅仅是为了选出最优秀的学生,更多的是为了使每个学生、每个班级班级能对自己进行反思,进而获得全面的提升与和谐的发展。
四、结语
总而言之,文化是一个非简单的概念,而个性化班级文化所呈现出的也并不是单一的特点。个性化班级文化建设是一项十分具体而且细致的工作,它包含的内容也不是单一方面的,其中主要包含了物质文化、制度文化、精神文化以及活动文化四个方面的内容。所以根据这四方面的内容,来提出具有建设性意义的实施对策是正确的。个性化班级文化不但有利于学生的全面发展,而且班级文化规范也为班级成员和任课教师的行为提供了标准,另外,建设个性化班级文化还有利于加强群体的凝聚力,培养学生的团队意识。
作者:任俊信 单位:甘肃省靖远县第二中学
参考文献:
个性化推荐系统研究 篇3
随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。
个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,为其提供个性化服务。
二、个性化推荐系统概述
个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求。
2000年,我国正式开始了个性化推荐的研究,清华大学的陆海明等提出了基于Agent多混合智能实现个性化推荐;2001年清华大学的冯翱等人提出了基于Agent的个性化信息过滤系统Open Bookmark;南京大学的潘金贵等人设计并实现了个性化信息搜集智能体DOLTRL-Agent。近几年来,个性化信息推荐服务逐渐从理论走向实践,从探索走向完善,逐步成为商业界的焦点。
三、常用的个性化推荐系统算法分析
下面对常用的个性化推荐系统的算法进行简要的分析。根据算法的不同,当前已有的个性化推荐系统大致可以分为以下几类:基于规则的推荐系统;基于内容的推荐系统;协同过滤系统;基于用戶-产品二部图网络结构的推荐系统;以及混合式推荐系统。
1、基于规则(Rule-based)的推荐系统
关联规则挖掘是数据挖掘领域的一个重要分支。对于基于关联规则的推荐算法来说,其作用机理就是:首先统计得到挖掘出的规则前件,然后针对目标客户的历史购买行为,向顾客推荐规则后件。该算法的优点是容易理解,研究基础广泛且成熟,支持其实现的软件丰富,有较好的实践条件;缺点是随着事务的增多,规则的发现将非常耗时,并且规则难以解释。
2、基于内容(Content-based)的推荐系统
基于内容的推荐起源于信息检索领域,它利用资源和用户兴趣的相似性来过滤信息。首先分析项目的内容,根据用户评价过的项目建立用户的兴趣模型,即用户描述文件。根据用户描述文件的不同又可以分为基于向量空间模型的推荐、基于关键词分类的推荐、基于领域分类的推荐和基于潜在语义索引的推荐。
基于内容的算法的优点是直接、简单,推荐结果易于解释。但也存在一定的局限:首先,特征提取能力有限,它仅适用于产品特征容易抽取的领域,当项目特征很难被一组关键词来清晰描述时,基于内容的推荐算法就显得苍白无力了。
3、协同过滤(Collaborative filtering)系统
协同过滤是目前应用研究的最为广泛最成熟的个性化推荐技术。主要分为基于用户的协同过滤系统和基于项目的协同过滤系统。其核心思想是:首先,基于系统中已有评分数据,计算给定用户(或项目)之间的相似性;然后根据计算得到的相似性,寻找目标用户(或项目)的最近邻居集合;最后使用最近邻居集合中的用户(或项目)的评分情况来预测目标用户对目标项目的评分值。
协同过滤的推荐系统主要优点有:
(1)对内容信息不易抽取的项目能产生完全自动化的推荐;
(2)能根据项目的质量和用户的品味产生推荐;
(3)能为用户发现新的兴趣。当然,协同过滤推荐系统也存在一些弊端:
(1)数据稀疏性问题,这也是协同过滤系统目前存在的最普遍的问题。
(2)冷启动问题,当一个新项目刚加入系统的时候,由于没有任何用户对它进行过评分,该项目便无法得到推荐。
(3)同一性问题,对于名称不同本质相同的项目,协同过滤无法发现潜在的联系;
(4)扩展性问题,随着系统中项目和用户数量的增多数据库将变得非常庞大,为用户产生推荐的精度和实时性都因此而降低。
4、基于用户-产品二部图网络结构(Network-based)的推荐系统
基于网络结构的推荐算法不考虑用户和产品的内容特征,而仅仅把它们看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系之中.分别利用用户一产品用二部分图建立用户—产品关联关系,并据此就提出了基于网络结构的推荐算法。其中,提出了一种全新的基予资源分配的算法,通过在协同过滤算法中引入二部分图上的扩散动力学,部分解决了数据稀疏性的问题。
5、混合式(Hybrid)推荐系统
基于规则的、基于内容的以及协同过滤的推荐算法由于自身的特点,在实际应用中都存在一些缺陷,因此就提出了把多种不同算法结合起来形成混合算法的解决方案。
四、个性化推荐系统对电子商务网站的意义
个性化推荐系统作为一种电子商务服务,是网络营销的重要手段。据VentureBeat统计,Amazon的推荐系统为其提供了35%的商品销售额。个性化推荐系统能够有效地留住顾客、防止顾客流失,提高销售额,因此受到越来越多的关注。综合来看,个性化推荐系统对电子商务网站的意义,主要可以概括为以下几点:
1、把网站浏览者转变为购买者
有些用户浏览网站并非有有购买目的,如果网站通过个性化推荐系统对其进行推荐,有可能使顾客形成购物冲动,从而促进销售。
nlc202309012336
2、提高电子商务网站的交叉销售能力
个性化推荐系统可以发现顾客所购买商品之间存在的内在关联,网站可以根据推荐算法的输出结果,对相关商品进行组合推荐、捆绑销售等,从而促进销售。
3、提高顾客对电子商务网站的忠诚度
个性化推荐系统可以让顾客受困于海量的信息当中,因此适当的使用个性化推荐系统对顾客进行商品信息推送可以提高顾客的购物舒适度和满意度,从而提高顾客的忠诚度。
4、优化电子商务网站
根据Web日志数据分析用户的行为模式,推荐超连接列表,或者动态地生成可能的网页超链接。尽可能迎合每个用户的浏览兴趣并且不断调整网站链接结构适应用户浏览兴趣的变化,使每个用户在浏览网站时都有该网站的唯一用户的感觉。
五、结语
网络交易量不断增长的时代,已经出现了很多实用的个性化推荐系统。它能够利用顾客期望的产品单、购物车、顾客提交的评价以及购买记录等,为顾客推荐适合的产品,提供多项推荐服务。本文简单介绍了几类基于不同推荐算法的推荐系统.虽然这些推荐系统都已经投入应用,并且取得了可观的经济效益,然而,这些系统都面临着许多问题,需要从理论和应用角度进行深入的研究。(作者单位:山西省运城市广播电视台)
参考文献
[1]张靖.网络个性化服务资源综合推荐研究[J].计算机仿真.2009.26(11):157-165)
[2]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展.2009.19(1):1-15
[3]李智琦,陈世颖,杨怡凝.基于数据挖掘的个性化推荐在SNS中的应用[J].电脑知识与技术.Vol.7,No.28,October 2011.
[4]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报.2002.13(10):1592-1561
[5]吴丽花,刘鲁.个性化推荐系统用户建模技术综述[J],情报学报,2006,25:55-62
[6]王茜,杨莉云,杨德礼,面向用户偏好的属性值評分分布协同过滤算法[J],系统工程学报,2010.04
[7]Lin Hongfei,et al Text Browsing Based on Latent Semantic Indexing[J]. Joural of Chinese Information Processing, 2000, 14(5):241-245.
[8]B Leite ,et al.C2::A Collaborative Recommendation System Based on Modal Symbolic User Profile [C]. Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence. 2006: 673-679
[9]余力.电子商务个性化——理论、方法与应用[M].清华大学出版社.2007
个性化推荐系统研究 篇4
关键词:个性化推荐,用户兴趣模型
1 引言
Internet从产生至今不过20多年的时间, 但目前Internet上的信息量相当于人类过去100年产生的信息总量, 已经成为一个全球性信息服务中心。随着其规模和覆盖面的迅速发展, 在提供越来越多信息服务的同时, 其结构也变得越来越复杂, 这反而降低了信息利用率, 带来信息过载问题。面对统一的界面和内容, 人们很容易迷失在Internet的“信息海”之中。为了解决Internet信息过载问题, 基于Web推荐系统应运而生。
推荐系统分为非个性化推荐系统和个性化推荐系统[1]。非个性化推荐系统向所有用户提供同样内容的推荐, 而个性化推荐系统按照用户的浏览习惯和兴趣, 为用户提供动态的浏览建议, 这样就可以过滤掉无用信息, 并根据用户的兴趣订制推荐。个性化推荐系统因具备这种优势, 被越来越广泛地研究和应用。
目前大部分高校就业网站提供信息的方式就是堆积海量的用人单位需求信息, 用户只能借助分类浏览、搜索等通用网站工具来查找他们所感兴趣的信息, 这需要用户对所要查找的信息 (如招聘时间、用人单位名称、需求岗位的详细信息等等) 有非常清楚的了解。面对每天频繁更新的大量需求信息, 用户不能有效地利用网站信息资源。为高校就业网站提供个性化推荐系统, 让用户更便捷、高效地利用就业网站是十分必要的。
个性化推荐系统实现个性化推荐要经过用户建模、项目匹配和推荐输出三个阶段。用户建模是获取和维护与用户兴趣、需求和习惯相关知识的过程, 其结果是产生一个能够表示出用户特有背景知识或兴趣的用户模型。用户建模是个性化推荐系统实现个性化推荐的主要知识源, 其获取用户兴趣的能力很大程度上决定了推荐是否成功。
用户兴趣获取方式一般包括显性方式和隐性方式两种。显性方式是通过用户主动描述来获取用户的兴趣, 这种方式简单而且直接, 有助于加快学习算法的速度, 但它要求用户明确兴趣并花费相应的时间和精力。隐性方式不需要用户参与, 是系统在用户的使用过程中从用户的访问路径、访问过的文档集合等特征自动完成的, 会包含很多冗余和无效信息, 这将大大增加学习过程的时间。这两种用户兴趣获取方式各有利弊, 把两者相结合取长补短才是最好的方法, 因此本文在研究现有用户兴趣建模方法后, 针对高校就业网站信息源及用户对象的具体特点, 提出一种针对就业网站个性化推荐系统的建模方法, 此方法能有效的为用户对象进行推荐。
2 用户兴趣模型的分析和建立方案
2.1 高校就业网站个性化推荐系统特点
针对不同的信息源特点, 推荐系统的侧重也各不相同, 目前讨论最广泛的有搜索引擎系统、电子商务系统和图书馆推荐系统。对于高校就业网站个性化推荐系统, 信息来源就是用人单位的需求信息, 主要包括学生专业、学历、个人素质的基本要求, 信息源十分规范。
基于Web的推荐系统的用户对象无论在年龄、学历还是兴趣爱好等各方面都有着很大差异, 需要考虑的用户对象范围十分广泛, 而高校就业网站的用户对象有较明确的年龄范围、学历层次和专业背景, 用户对象群体相对稳定。
2.2 用户兴趣模型的建立方案
根据以上对高校就业网站个性化推荐系统信息源及用户对象特点的分析, 本文对用户对象静态及动态信息进行有机结合, 提出基于用户对象显性兴趣和隐性兴趣的建模方法。
用户兴趣模型刻画的是用户信息从提交到注销这段时间里用户信息需求的一体化描述, 包括动态进行更新以精确反映用户的兴趣倾向。用户兴趣模型可以形象地描述成一个3元组P[2]:P={S, F, Ψ}
其中, S={S (0) , S (1) , …S (i) , …S (n) }, F={F (1) , F (2) , …F (i) , …F (n) },
Ψ:S×F→S, {S (i+1) = (Ψ (S (i) ) , F (i+1) ) , i=0, 1, …, n}
这里, S是该用户兴趣模型在系统使用过程中产生的全部状态集;F是系统为该用户模型采集到的全部反馈信息集, 其作用是驱动更新过程;Ψ是该用户模型的更新函数。其中, S (0) 是该用户模型的初始状态, S (i) 是经过i次更新后的用户兴趣模型, F (i) 表示系统第i次反馈的用以更新P (i+1) 的信息。这个形式化描述反映了用户兴趣模型处于不断地更新状态, 及时的反映了用户的兴趣倾向。
根据实践经验, 我们将用户登录时必须输入的基本信息作为显性兴趣的采集来源。通过每学期就业工作总结, 我们发现学生专业、生源所在地、学历、性别以及是否担任过学生干部等方面的差异很大程度决定学生兴趣倾向。例如用户对本专业就业信息选择倾向大于其他专业用户对此的需求, 而对于相同专业学历层次的高低会影响需求信息的选择倾向, 博士高于硕士, 硕士高于本科生。就我校情况分析, 生源所在地信息也是学生兴趣倾向的一个重要指标, 一方面学生对于全国一线城市及各省会城市有地区倾向, 另一方面对生源所在地有一定的地区依赖, 这也很大程度上决定了学生兴趣倾向。
但是以上并不是绝对的, 有时也会出现一些不符合显性兴趣甚至与显性兴趣相反的情况, 近年来教师编制紧张, 出现硕士甚至博士抢占本科生基础教育市场的现象, 有一些行业对专业的限制越来越模糊, 跨专业择业现象越来越多。这些现象表明, 一些用户在某段时间内对某些需求信息感兴趣, 在令一段时间将兴趣转向其他需求信息, 所以不能忽略用户需求信息的变化。隐性兴趣把用户浏览某网页的时间、浏览该网页的次数作为隐性兴趣信息的来源, 隐性兴趣能更准确、更真实地反映用户当前的兴趣倾向。
我们设定DI (dominate interesting) 为显性兴趣特征向量, RI (recessive interesting) 为隐性兴趣特征向量, 确定用户兴趣模型为αDI+ (1-α) RI, 其中α∈[0, 1], 该参数可以调节显性兴趣和隐性兴趣对用户模型的影响程度。
每学期开学, 我们都会组织应届毕业生登录就业网站采集显性兴趣倾向信息, DI={专业}∪{生源所在地}∪{学历}。隐性兴趣倾向信息RI={搜索关键字}∪{访问行为}。较复杂。访问行为由用户在一定时间段内访问的网页集和对各个网页感兴趣程度组成[3], 而用户对某一网页的感兴趣程度, 则要依据用户对该网页的访问次数和访问时间来决定。设用户访问页面page (i) 的访问次数为f req (page (i) ) , 第j次访问page (i) 的时间为time (p age (i) , j) , 用户对象对页面page (i) 的兴趣度为i nte (page (i) ) , 那么用户访问页面page (i) 的访问时间为假设用户本次查询页面列表中共访问了N个页面, 构成本次用户访问页面集T, T中所有页面的总访问时间可以看成一个数列, 计算该数列的平均值μ和标准方差σ, 然后用高斯归一化公式[4]处理, 根据3-σ规则, 数列中的每个数字落入[-1, 1]区间内的概率为99%, 然后再通过平移操作使inte (page (i) ) 的值最终落在[0, 1]上。用户对页面的感兴趣程度可以计算为:
需要注意的是, 在这里对time (page (i) , j) 有个说明, 用户对象在实际浏览中会出现两种特殊状态:一种是用户驻留时间太短。当用户打开一个页面却发现不感兴趣, 立刻关闭;另一种是用户驻留时间太长。当用户打开一个页面, 其驻留时间远远超过正常浏览时间, 造成系统对该页面反馈度远远小于1。这两种情况严重影响系统分析页面感兴趣程度的结果, 于是把系统设置两个阀值:最小浏览时间Min-time和最大浏览时间Maxtime。根据一般规律, 把Min-time设定为10秒。根据Claypool等人对75个用户2000多次访问的驻留时间进行记录[5]可知, 用户在绝大部分访问中驻留时间小于3分钟, 设定Ma x-time为3分钟 (即180秒) 。
对于用户访问时间小于Min-time的页面, 在算法中视为无效操作, 不予考虑;对于用户访问时间属于[Min-time, Max-time]的页面, 则保持其访问时间原值;对于用户访问时间大于Max-time的页面, 则其访问时间赋值为Max-time。
3 结语
用户兴趣模型是推荐系统产生个性化推荐的主要知识源, 用户兴趣模型的建立是个性化推荐系统的基础, 也是实现个性化推荐的关键。如何针对不同应用领域特征建立科学高效的用户兴趣模型、如何对信息特征化以及优化推荐算法是我们研究的方向。
参考文献
[1]吴丽花、刘鲁, 《个性化推荐系统用户建模技术综述》, 2006, 25 (1) :55-62.
[2]黄希全, 数字图书馆推荐系统中用户偏好的建模方法《, 情报杂志》, 2006 (1) :28-3 0.
[3]袁薇, 搜索引擎系统中个性化机制的研究《, 微电子学与计算机》, 2006 (2) :68-75.
[4]庄越挺、潘云鹤、吴飞《, 网上多媒体信息分析与检索》, 2002 (9) :59.
个性化推荐系统研究 篇5
关键词:用户浏览行为;电子商务;个性化推荐系统;兴趣度
中图分类号:F713文献标识码:A文章编号:1009-3044(2007)12-21528-02
An E-commerce Recommend System based on User Browse Behavior's Mining
HE Ying1,2,JIANG Wai-wen1
(1.School of Information Science and Engineering,Central South University,Changsha 410008,Cina;2.Hunan Vocational College of Commerce,Changsha 410205)
Abstract:This paper,we introduce the personalized recommend system for E-commerce and propose a new recommend system model based on user's browse behavior to mine his interests and gives its flow chart and mining algorithms in detail.
Key words:browse behavior; E-commerce;personal recommendation system;interest
1 引言
近年来,因特网的规模正以惊人的速度发展。人们越来越希望网页的内容能够从原先的以“网站”为中心转变成以“用户”为中心,尽可能地自动调整以迎合每个用户的浏览兴趣,从而让每个用户能够感觉到他是网站的唯一用户。在日趋激烈的竞争环境下,电子商务网站要想有效保留用户、防止用户流失、提高销售量,就必须实现个性化服务,即对不同用户投其所好,采取不同的服务策略,提供不同的服务内容,这就需要建立电子商务网站的个性化推荐系统。
2 电子商务网站的个性化推荐系统
电子商务中的推荐系统是利用统计学、人工智能、数据挖掘等技术,分析访问者在电子商务网站的访问行为,产生能帮助顾客访问感兴趣的产品信息的推荐结果,引导顾客的购买行为,从而产生可观的利润。推荐系统首先要分析以前顾客行为数据,建立表示顾客行为的模型,并充分利用模型对其它顾客推荐有兴趣购买的产品信息。这就要求推荐系统首先必须知道用户的兴趣、偏好和访问模式等信息。而在电子商务中,用户很多浏览行为都能很好地反映用户的兴趣。基于用户浏览行为的Web挖掘技术就是通过对用户浏览Web时的访问行为、访问频度、访问内容等浏览信息进行挖掘,发现蕴涵的、未知的、有潜在应用价值的非平凡的模式,从而获得用户兴趣,提取出用户的特征,获取用户访问Web的模式,为用户实现主动推荐,提供个性化服务。
3 基于用户浏览行为的挖掘流程
3.1在客户端获取行为数据:输入Web文档,当用户浏览完网页后,输出用户在该文档上的浏览行为,同时记录Web文档的相关信息
3.2數据预处理:对数据进行清洗,滤掉脏数据,保留一些能表示用户对某页面兴趣度的信息。
3.3用户兴趣度计算:根据选取出来的行为数据建立兴趣模型,进而计算出能反映用户兴趣的网页兴趣度。
3.4推荐:主要根据挖掘结果实施推荐,将用户感兴趣的内容的链接添加到用户正在浏览的网页。
3.5结果修正:根据用户浏览行为的反馈对推荐进行修正,如果用户接受推荐,则进行巩固;否则,根据用户的反馈进行重新推荐。
4 基于用户浏览行为的挖掘算法
4.1行为数据的选取
一个用户浏览网页时的行为数据是非常丰富的,大致可以分为以下几类:
(1)表示用户兴趣的显式行为 如利用问卷调查等形式收集用户感兴趣的信息。
(2)表示用户兴趣的标记行为 如执行保存、打印页面等动作。
(3)表示用户兴趣的操作行为 如执行剪切、复制、粘贴、搜索文本等操作行为。
(4)表示用户兴趣的链接行为 指用户在浏览页面时点击某个超链接或没有点击某个超链接等行为。
(5)表示用户兴趣的重复行为 指某个用户在某个页面上点击了 “更多”,就可以认为用户对这个页面有更多的兴趣。
(6)表示用户不感兴趣的行为 如某用户经常访问某网站,但经常只浏览其中某些页面,则认为此用户对该网站其他网页不感兴趣。
4.2网页兴趣度计算
虽然能够揭示用户对网页的兴趣度PageInterest的浏览行为很多,常规使用浏览时长、网页字节数乘积与总浏览时长、总信息数乘积的比值作为网页的兴趣度。定义为:
而经研究表明,不但用户停留在网页的浏览时间PageTotalTime能揭示用户兴趣,另外还有一种关键行为:翻页/拉动滚动条次数Number同样也表达了用户对该网页的关心程度。经仔细的分析和实验,发现PageTotalTime, Number与网页兴趣度PageInterest之间的定量关系为:
PageInterest=0.1123*PageTotalTime+ 0.0711*Number+ 95.8883
因此改进的网页兴趣度计算算法如下:
输入:用户浏览信息矩阵
输出:网页兴趣度矩阵
function PageInterest;
begin for logx=1 to n
//找出该网页的最大允许访问时间
maxtime=find(maxtime,topic);
//找出该网页的最小允许访问时间
mintime=find(mintime,topic);
//如果用户时间小于最小时间或大于最大时间,但进行了保存操作,则将其转化为对等的标准时间。
If browsetime>maxtime or browsetime if issaved browsetime=standtime; endif endif //确定该网页的位置,并修改总浏览时长 k=locate(browtime,page_logx); browtime(k)=browtime(k)+browtime; endfor; //以路径为单位计算总浏览时长、翻页/拉动滚动条次数 for j=1 to pagenum totaltime=totaltime+browtime(j); totalnumber=totalnumber+number (j); endfor for j=1 to pagenum interest(j)= 0.1123*totaltime+ 0.0711* totalnumber + 95.8883 endfor end function 时间复杂度分析:每条浏览行为记录计算一次,执行时间与浏览记录数量成正比,时间复杂度为O(n)。 空间复杂度分析:需要的存储空间与网页为数目成正比,最大为网页数,因此空间复杂度为O(n)。 4.3 基于用户浏览行为的挖掘算法 输入:用户浏览行为矩阵 输出:用户浏览模式 function PreferedBrow(browdata as browdatarr); //计算前缀为path路径数 amount=count(s,path) for i=1 to amount interest=browdata(s,path) if interest>mininterest addpath(path) endif endfor end function 算法的时间复杂度与用户浏览事务集合元素和浏览的最大路径长度有关,是O(M*N),其中,M表示用户浏览集体的元素数,N表示最大浏览路径长度。另外,由于该算法是一个递归算法,需要的辅助空间栈的深度为最大浏览路径长度数。 5 结束语 随着电子商务、电子政务以及网络远程教育等电子服务的发展,研究 Web环境下的个性化服务具有重要且现实的意义。本文提出的算法使得 Web 信息服务提供者根据用户网络浏览行为可正确把握其兴趣所在并可动态地对其兴趣改变进行跟踪,根据这些个性化信息调整 Web 信息资源的组织方式,最大效率地为用户提供方便快捷且实用的个性化服务。 参考文献: [1]韩家炜,孟小峰.等. Web挖掘研究[M].计算机研究与发展,2001,38(4)405-413. [2]Claypool M., Le E, Waseda M., et al. Implicit interest indicators. In: Campbell M,ed.Proceeding of the ACM Intelligent User Interfaces Conference (IUI), New York: ACM Press,2001.14-17. [3]劉培刚.Web挖掘技术在电子商务中的应用研究[J].情报学报,2002(6). 关键词:实时推荐系统,R语言,BP算法,FP-tree关联规则算法,商品时效 0 引言 近几年来,电子商务推荐系统发展迅速,个性化及多样化的推荐系统为企业带来了丰厚的利润。有研究表明,电子商务零售行业提供个性化推荐服务后,其销售额会提高2%~8%。目前推荐方式主要有:协同过滤推荐、基于内容的推荐、基于知识的推荐、混合推荐。随着大数据时代到来,数据量急剧增长以及用户多样性的需求对推荐系统的实时性提出了更高要求。因此,更有效、更多样性的实时推荐系统已成为电子商务领域研究的热点之一。 1 实时推荐相关技术 在提高电子商务推荐系统实时性的问题上,国内外专家学者研究出一些切实可行的解决方案,其中主要包括云计算技术、Cookie技术、站外广告推荐技术等。 1.1 基于云计算的实时推荐技术 国内著名的电子商务平台阿里云主要采用云计算推荐方式,它是基于先进的云计算系统,支持海量网页数据和用户行为数据的分析计算,从而可以在很短时间内完成对大量用户数据的分析及计算,从而达到实时推荐的目的。目前运用较多的基于云的实时推荐框架主要有Spark框架、Kiji框架和Storm框架3种[3]。一定程度上,这些框架都是通过缩短模型训练时间,从而提高实时推荐速度。 1.2 基于Cookies的实时推荐技术 基于Cookie的实时推荐是将Cookie技术与模式识别算法相结合,根据用户与相关站点、内容或服务互动时所提供的信息,实时捕捉用户兴趣偏好,然后在电子商务平台所有站点以及其它站点上显示以兴趣为基础的广告。亚马逊电子商务平台就使用了这种推荐方式,使得企业可以快速了解用户浏览了哪些广告、点击了哪些广告,以及追踪用户在各种站点上进行了哪些操作,以便收集用户的站点操作数据,并实时分析用户的兴趣偏好,为用户提供更有效的推荐。 1.3 站外广告推荐的实时推荐方式 随着Web2.0技术发展的成熟,许多电子商务网站都采用了站外广告推荐,它们采用将推荐广告投放到其它网站的方式进行实时推荐,当用户浏览某门户网站时,会发现网站上投放的广告会是不久前搜索过的商品。这种推荐方式使用户浏览网站的同时可以点击了解自己心仪的商品详情,这样做既符合用户心理,又可提高商家的销售额。 1.4 存在的问题 综合以上3种实时推荐方式发现:云推荐系统搭建成本很高;基于Cookies技术推荐方式存在较大的用户隐私泄漏风险;基于站外广告投放的实时推荐方式,相对而言其成本较低,运用也很广泛,但目前该平台是基于社会广告的投放方式,在推荐时根据用户搜索过的商品进行实时推荐,会造成推荐浪费,即:用户通过推荐购买了推荐的商品,下次仍出现相似甚至相同商品的推荐,但对于一些商品,用户在短时间内,一般不会购买同样商品,而更愿意看到更多样化的商品实时推荐。 2 系统框架 为解决实时推荐系统推荐效率不高、推荐商品多样性不强,造成企业推荐成本浪费并影响用户满意度的问题,本文重点对用户历史行为数据进行研究,运用挖掘算法挖掘用户购物商品的特征属性,根据每位用户对应的商品特征属性集合,为用户制定个性化的实时推荐。本文所设计的推荐系统主要创新点就在于可以追踪用户在一段时间内所购买商品的特征属性,为用户制定更有效、更多样的商品实时推荐。推荐系统框架如图1所示。 如图1所示,本文设计的个性化实时推荐系统框架主要包括以下3个部分:数据预处理、数据挖掘、实时推荐,其中实时推荐是推荐系统的核心部分。本文采用基于FP-Tree关联规则的推荐模型[4],并在其基础上提出建立商品时序推荐模型,根据商品的特征属性设定主动推荐商品的时序。例如,对于服装类商品,用户在购买搜索过的商品后,通常在很短时间内不会重新购买类似产品,此时可将此类商品推荐时效后延,保证推荐的多样性和新颖性。 3 系统实现 3.1 数据预处理 本文运用R语言工具对收集的输入数据进行预处理,R语言是一个用于统计计算和统计制图的优秀工具,具有一套完整的数据处理、计算和制图软件系统。对用户购买商品的历史表格进行统计,按照用户ID统计购买对应的商品信息,然后对数据进行筛选,检查数据类型是否统一,是否存在明显的数据错误。另外,从服务器上收集的Web日志数据也同样需要进行处理,一般Web数据预处理主要包括数据融合与清理、用户识别、交互识别、路径完善阶段。 3.2 基于商品特征属性的数据挖掘 通过以上两个阶段的数据预处理,“脏数据”已基本被清理干净。利用电商平台提供的商品分类表及商品对应的属性编码库,整理并统计出每位用户在最近一段时间的购物情况表,然后运用数据挖掘方法探究商品的哪些属性影响用户购买行为。本文主要采用BP神经网络算法对数据进行训练并挖掘出商品属性中影响用户购买行为的特征属性。 现假设用户集合为Q={q1,q2,q3…qi},其中qi表示第i个用户的属性集合;商品集合为X={X1,X2,X3…Xi},其中Xi表示第i种商品的属性集合,每种商品具有相应的属性值,用xij表示第i种商品的第j个属性编码值;用0、1标记已购买和未购买两种行为,则yi={0,1}。本文随机抽取了一部分用户历史购物情况数据,其中包括一定量的正例和反例两种样本数据。 神经网络模型结构主要包括:节点输出模型、作用函数模型、误差计算模型、自学习模型。其中,作用函数模型:反映下层输入对上层节点刺激脉冲强度;自学习模型:Δwij(n+1)=h*δi*oj+a*Δwij(n),h为学习因子,δi为输出节点i的计算误差,oj为输出节点的计算输出,a为动量因子。 运用以上模型训练数据后,可挖掘出商品属性集合中有几种属性对用户购买行为发生的权重较大,将这些权重较大的属性提取出来即为特定用户偏好的商品属性,即商品特征属性。当然每位用户因为购买的商品不同,其商品特征属性也是不相同的,因此针对不同的用户,需不断通过神经网络模型来挖掘其特征属性集合。 3.3 基于商品特征属性的实时推荐 假设提取商品的特征属性值的集合为P{p1,p2,p3…pi},从每位用户对应的商品特征属性集合,就可基本掌握该用户的购物偏好。例如,商品特征属性中若包括单价,则该用户购买商品时应比较看重商品单价这一因素,可根据其购买商品的平均价格为其进行实时推荐。本文通过对挖掘出的商品的特征属性集合进行研究,根据相关文献提出建立基于商品特征属性的关联规则模型及基于商品时效属性的推荐模型。 3.3.1 基于商品特征属性关联规则的推荐模型 基于关联规则的推荐模型也属于经典的推荐算法之一,其主要优点在于可以提高推荐结果的多样性。将这一算法运用于探索商品的特征属性集合的关联规则,可为用户提供更为精准多样的推荐,提高用户满意度。 已知用户所购商品的特征属性值的集合为P{p1,p2,p3…pi},则可结合用户购物情况表,可提取出用户所偏爱购买的商品记录。假设存在如下购物记录{a,b,c,d;a,b,c;d,e;a,c,d,e;e,f;d,f;a,b,c,d,e,f},运用FP-tree关联规则算法进行频繁项集的搜索,首先对数据库扫描一遍,将其中的频集按照关联的方式生成一棵频繁模式树(FP-tree),随后将其划分,形成若干条件库,每个库都和长度为1的频集相关,最后分别对具体的条件库实行挖掘。在用户购物时,该关联规则推荐模型可为用户推荐其感兴趣的产品及其相关产品,提高实时推荐的多样性,从而进一步提高用户满意度,达到留住客户的目的。 3.3.2 基于商品特征属性的时序推荐模型 为提高实时推荐效率,在基于商品特征属性关联规则的推荐模型上,考虑商品属性的时效性。商品时效是指商品可被使用的一般时长或者为用户对某种商品的喜好时长。根据一般购物经验,用户在接受某个商品推荐后即购买该产品,短时间内若系统多次向其推荐相同或相似商品,则用户购买的兴趣度会大打折扣,甚至可能会拒绝推荐,从而影响实时推荐效率。 本文主要以电子商务领域中涉及到的衣、食、用为研究对象。不同类别的商品所对应商品的时效不同,因此本文在商品属性关联规则推荐的基础上,提出建立基于商品特征属性的时序推荐模型。假设挖掘出涉及衣、食、用这3个方面的商品类别属性集合分别为N{n1,n2,n3…ni}、M{m1,m2,m3…mi}、O{o1,o2,o3…oi},设推荐时效权重值集合为Wj={w1,w2,w3…wi}。 本文结合一定的统计信息及相关的专业领域知识,为商品设定以下几条时序规则:(1)在用户可接受价格的范围内,畅销类品牌的食品、服饰、日用品优先推荐,即在进行关联规则推荐时,为这类商品及其相关商品设定较大的权重值Max{wi},使其排序靠前;(2)对于用户在短时间内购买过的食品,可根据其含量及专家建议食用意见,给予定时推荐,即实时推荐,时间间隔T一定,T值大小由商品用途及含量决定;(3)对于用户购买过的同类服饰,可在一定时间内不予推荐,即推荐时权重值设定得较小或直接滤过,另可结合当前用户所在地区的天气情况,给予每日主动推荐;(4)与人类健康有关的用品,结合领域专家的意见定时推荐,如内衣、牙刷、抹布等。 这些商品时效推荐规则构成了商品时效推荐模型,在搭建好实时推荐平台后,运用这一模型可为用户带来专属的个性化实时推荐。 4 结语 本文通过研究用户购买商品的数据,提取出商品的特征属性,并将其作为主要研究对象,探索用户购买商品的偏好,提出建立基于商品特征属性的个性化实时推荐系统框架,在一定程度上可以有效捕捉用户的购物偏好,并可为用户提供推荐效率更高、多样性更加丰富的实时推荐,具有较强的智能性、实用性。但其也存在一些不足,主要表现在商品实时推荐模型中的规则很简洁,后续可深入研究。 参考文献 [1]ZAIANE.Building a recommender agent for e-leafing systems[C].2002International Conference on Computers in Education,2002:55-59. [2]应毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111-117. [3]陈敏敏,王新春,黄奉线.Storm技术内幕与大数据实践[M].北京:人民邮电出版社,2015. [4]卢健,刁雅静.Web日志挖掘中的数据预处理研究[J].江苏科技大学学报:自然科学版,2012(1):81-85. [5]NORMAN MATLOFF.R语言编程艺术[M].陈堰平,邱怡轩,潘岚峰,等.译.北京:机械工业出版社,2013. [6]刘华,张亚昕.基于FP-tree算法的推荐系统设计与实现[J].电子设计工程,2015(2):81-84. [7]朱智林,左天军,牛淑龄.基于日志的脏数据检测与恢复[J].电子科技,2004(5):9-12. [8]刘钊,蒋良孝.基于神经网络的数据挖掘研究[J].计算机工程与应用,2004(3):172-173,190. [9]邓星,邓珍荣,许亮,等.基于用户潜在时效偏好的推荐算法[J].计算机应用研究,2016(9):1-6. 在商务智能平台中个性化推荐系统占主导地位, 它挖掘了大量数据, 从而为用户提供个性化的决策支持以及信息服务。购物网站的个性化推荐系统为客户智能推荐商品, 这种基于用户习惯的在线商品推荐算法就相当于我们实际生活中的导购员, 在了解客户的基本需求以及偏爱的商品的特征后, 就可以向用户提供有价值的建议, 算法基于信息:网购平台客户购买商品的历史行为记录。近几年来, 搜索引擎技术由于被广泛应用, 其发展较快, 比较有代表性的谷歌, 百度等, 由“信息爆炸”和“信息过载”引发的信息丢失问题, 在一定程度上可以被缓解[1]。 但客户对于个性化的要求越来越迫切, 这种能够实现基于用户习惯做出推荐的算法无论是在国内还是国外, 都有专业的研究机构投入大量资源进行相应数学模型的研究。 2 电商系统中个性化推荐算法原理 个性化推荐系统的运行遵循输入、处理和输出的程序经典处理流程。用户基本信息模块负责接受输入信息、个性化推荐模块负责处理信息和评价反馈模块负责输出信息, 个性化推荐系统首先接受用户输入的注册信息、用户的行为记录信息等, 再按照使用的算法对得到的信息进行筛选, 最终将筛选的结果通过网站设定的模式推荐给用户。 用户喜好的信息主要来源于“输入一处理一输出”模式中输入阶段的用户输入的信息, 这些信息直接影响网站最终给出的推荐效果, 因此要脱离网络对数据进行筛选去噪, 确定能够实现合理化推荐的物理结构来进行展现。依据用户的习惯进行推荐的流程的实现, 还是脱离不了算法对于初期收集的存储于系统中的数据的处理, 包括修改、过滤、提取、传递等, 最终实现通过网站平台将适合的信息展现给用户以便他们做出合理的选择。一些网站还提供给用户一些选项, 用户可以根据喜好来进行选择, 例如可以通过选择“收藏店铺”、“收藏宝贝”、“我已经拥有”、“不感兴趣”等明确告诉系统自己对哪些商品感兴趣。用户是否能够客观的选择对于推荐系统的优化是非常关键的, 系统通过这些反馈信息可以捕捉到用户的兴趣点以及兴趣的动态变化, 强化推荐算法的运行效率与选择精准度, 同时对用户购买偏好模型进行实时调整, 在运行过程中实现良性循环[2]。 3 实现用户个性化推荐系统的关键技术 3.1 COOKIE缓存文件 Cookie是将少量的数据存储到客户的电脑存储设备中, 或可以使网站服务器在客户的电脑中获取数据的一种方法。它通过在客户端PC上生成一个小文件, 用于客户端与服务器之间传递关键信息。当你浏览某个网站时, 网站的数据库服务器可以通过它获取你浏览过的网页以及浏览的时间等信息, 这时的Cookie文件就具有了日期和时间, 同时就变相的减轻了各个电子商务网站的数据库服务器的存储压力[3]。 当你再次访问该网站时, 网站通过读取客户电脑中的Cookies, 得知你的相关信息, 就会因人而异地给出不同的首页提示, 包括登录用户的用户名都会显示出来, 或者有些网站可以在两周之内直接登录, 因为你的用户名及对应密码系统可以从Cookies中获得等等。这就好像我们的身份证, 但当你换电脑操作这样的功能就不能实现。Cookies是每个用户专属的信息, 只能有对应网站的数据库服务器来识别, 所以它们会以不用名字存储加以区分。这些不同网站的Cookies存储在电脑的同一个文件夹中, 但都经过了加密技术的处理, 我们即使打开也都是一些乱码形式, 不用担心重要信息的丢失。 当前, 绝大部分互联网广告推荐技术都是以cookies技术为核心为构建的, 例如你通过浏览器搜索了某一类商品的信息, 你的搜索信息会被记录在cookies文件中, 广告报务商会通过分析这些cookies信息有针对性的向你推荐相类似的产品。 3.2 聚类分析算法 人们常说“物以类聚, 人以群分”, 聚类就是这样的一种行为。聚类分析的分类就是依据不同分类标准进行信息的划分, 就像按照肤色分为白人、黑人和黄种人, 按照职业分为工人、农民、知识分子。现实生活中, 人们都是通过聚类模式来区分不同的实物, 包括一些程序设计语言中都会用到类的概念进行程序代码的封装。聚类分析就是依据对象的共同点进行分类, 将相似度较高的对象放在一起, 它们的共同点就是与其它类区分的关键。所以在应用中, 一个类的对象就被看做一个整体。在数据挖掘技术中会用到聚类算法, 它可以使个性化推荐系统在客户群中将客户进行分类对待, 划分出不同的客户群, 继而可以确定他们不同的购买模式作出合理的推荐[4]。 3.3 基于内容的过滤技术 基于内容的过滤主要是通过各种方法 (包括机械学习等) 从事例中得到用户的兴趣情况, 并将相似的物品推荐给用户。它以获得的物品的内容信息 (包括物品特征信息和项目内容信息) 为基础进行信息过滤, 找到这些物品之间的相关性, 不需要搜集用户的评价意见以及行为信息, 而是它不涉及冷启动和稀疏问题, 它通过对物品的信息进行分析以及建模, 从而进行推荐。如果物品信息完整度以及全面度较高, 则推荐质量就会相对高一些, 这样才能吸引更多的客户。但是这种推荐对于物品相似度的分析完全依赖于物品自身的一些特征, 离不开用户以往的一些行为记录、喜好历史。 3.4 协同过滤介绍 协同过滤通过对用户登录网站的浏览记录以及行为记录产生的信息进行分析过滤, 得到用户的兴趣喜好, 然后将具有相同喜好的用户进行分类, 对于目标用户就可以找到与他兴趣喜好最相近的邻居用户, 从而预测目标用户还有可能的喜好, 给出目标用户最准确的个性化推荐。 这种过滤方式既可以基于用户过滤又可以基于商品进行过滤, 第一种过滤的方式就是按照用户的兴趣和对商品的喜好, 将用户进行分片, 使他们成为“邻居”, 让这些邻居之间互通有无, 交换彼此的感兴趣的商品的信息给当前用户。而划分邻居的量尺就是他们之间对商品的偏好, 通过用户A对商品的喜好找到邻居用户B, 根据他们之间相似喜好的程度, 计算出当前用户暂未涉及的商品并给出推荐。而第二种过滤的方式与第一种方式类似, 区别就是从商品的角度出发, 对于A用户基于他对商品的喜好再找到类似的商品, 并结合A用户的历史行为信息推荐商品, 所以, 划分商品的量尺就是商品之间的相似度, 找到A用户喜好商品的类似商品之后, 按照该用户历史行为推荐商品。 4 结论 随着我国电子商务信息化建设快速发展, 如何为用户提供更加准确、高效、便捷的信息化服务成为电子商务建设中的一个重要任务。个性化推荐系统在获取用户的浏览偏好与历史购物信息的基础上, 模拟导购流程与用户进行直接交互, 帮助用户找到所需要的商品, 它是解决用户对信息过滤问题的最好的也是最有效的方法。通过对用户行为的分析, 个性化推荐系统就可以预测出用户的喜好, 使用户能够更轻松地找到他们所需要的不同的信息, 用户能够自行在模拟状态下通过销售人员的帮助来完成所有的购买过程。通过对用户行为的分析, 个性化推荐系统就可以预测出用户的喜好, 使用户能够更轻松地找到他们所需要的不同的信息。 参考文献 [1]蒋翀.电子商务个性化推荐系统研究[D].长沙:中南大学, 2009:10-33. [2]邢春晓, 高风荣, 战思南, 等.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展, 2007, 44 (2) :296-301. [3]张光卫, 李德毅, 李鹏, 等.基于云模型的协同过滤推荐算法[J].软件学报, 2007, 18 (10) :2403-2411. 1 现状与存在的问题及研究目标 目前, 很多高校图书馆添购新的书籍或者增加新的服务, 但是师生不能及时得到最新的信息, 使得新增的书籍或者服务不能得到很好的利用。另外, 图书馆中一些知名度较高的书籍, 其借阅率一直很高, 导致很多师生想借阅却一直借阅不到, 但是事实上图书馆中还有许多相似的书籍可以借阅, 由于师生搜寻查阅技巧有限, 使许多师生没有发现其感兴趣的书籍。因此高校图书馆丰富的书籍和最新的服务没有被充分利用, 这样不但浪费图书馆的资源, 同时也是师生的损失。 针对当前绝大部分高校的图书馆状况, 结合本院数字图书馆的建设进程, 本着服务和提高利用率的原则, 经过充分调研后, 决定对本院图书馆相关数据进行挖掘, 在分析、统计的基础上, 研究、设计并开发一款个性化推荐原型系统, 并将其运用到本院图书馆。 2 所要解决的主要问题 2.1 解决图书馆图书信息的个性化推荐算法 随着信息技术的飞速发展, 带动了图书馆信息化的巨大变革。传统的信息检索的服务方式已经很难满足师生的需求, 传统通过输入关键字检索方式已经远远不能达到师生的需求。所以提供个性化的推荐服务受到了越来越广泛的关注。它可以通过挖掘师生的基本情况、图书借阅记录以及师生对网站的浏览记录等信息来挖掘数据间隐藏的关系, 通过数据挖掘技术得到有用的信息推荐给师生。推荐算法是图书馆推荐系统的研究核心, 在比较了几种国内外广泛研究和应用的推荐算法后, 并结合本院图书馆的情况进行改造, 提出适合的推荐算法。 2.2 解决高校图书馆个性化推荐系统的推荐模型架构问题 根据改进算法, 建设高校图书馆个性化推荐系统模型。系统建模是软件设计开发过程中采用统一建模语言 (UML) 来实现的。统一建模语言 (UML) 是由单一模型支持的一组图示法。这些图示法有助于开发者来设计软件系统, 尤其是采用面向对象方法构造的MIS系统。统一建模语言作为系统分析和设计的工具, 可以逐步精化原来的分析和设计成果。 2.3 合理挖掘图书馆图书信息, 实现以个性化服务为特色的图书馆推荐系统 图书馆作为本院的集散与交流中心, 是师生获取资源的非常重要渠道。随着本院图书馆的馆藏图书数量剧增和图书馆规模的不断扩大, 师生如何在规模宏大的图书馆花最少的时间及精力查找到自己感兴趣的图书, 这对于图书管理员以及广大师生来说是一件比较复杂的事情。为了让图书管理员从繁重的工作中解脱出来, 并且让师生尽快找到自己感兴趣的、满足自己需求的书籍, 因此有必要开发一个以个性化服务为特色的图书馆推荐系统。 3 系统的关键技术 3.1 ASP.NET+SQLSERVER 本系统采用Visual Studio 2010开发而成, 后台数据库采用SQLSERVER 2008。在系统功能上, 除了图书馆管理系统常用功能之外, 添加了推荐系统模块, 一方面, 为学生提供个性化的服务, 使学生快速的找到自己想要的书籍, 另一方面, 为图书馆工作人员采购图书提供决策支持。 ASP.NET是基于.NET平台创建动态网页的一种服务器端技术, 是基于B/S的应用技术, 使用它可创建动态可交互的Web页面。其生成的代码与浏览器无关, 方便设置断点, 易于调试, 代码后置, 使代码更清晰, 正是由于其有这些特色与优势, 所以决定采用ASP.NET来开发个性化推荐系统。 3.2 DIV+CSS 高职图书馆个性化推荐系统是为师生服务的, 所以美观清晰的界面设计非常重要。CSS为层叠样式表, 使用CSS可以实现W3C提倡的结构和样式分离的思想, 这样做的好处:能够设计结构清晰的界面, 提高开发者的开发效率等。 3.3 数据挖掘技术 数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程。在高职图书馆推荐系统中, 根据学生以往的借书记录、年龄、专业等背景不同, 通过数据挖掘技术分析学生的特征和使用习惯等方式来发现其潜在的需求, 主动向师生提供可能感兴趣的服务。 4 结束语 通过对图书馆相关数据进行挖掘, 实现一个图书馆个性化推荐系统, 并将其运用到本院图书馆。该系统实现师生推荐功能, 根据对师生流通记录以及相似图书借阅情况的数据分析, 将师生有可能感兴趣的图书进行推荐, 提高师生的检索效率和书籍利用率。该系统实现管理员推荐功能, 对本院图书馆日常产生的借阅数据、web查询数据、数目检索数据等进行挖掘, 将借阅率高或流通速度快的书推荐给管理员, 以求图书馆采购工作更加科学有效。该系统经过两年的实践, 普遍受到师生的好评。 参考文献 [1]吴伶琳.基于LINQ技术的小区物业管理系统[J].计算机系统应用, 2013 (11) . [2]蔡昭权.基于.Net的新闻发布系统的设计与实现[J].计算机工程与设计, 2005 (9) . [3]朱翠苗, 郑广成.基于ITSS的高职软件技术专业“产学并行”教学模式创新与实践[J].软件, 2013, 34 (6) :134-136. [4]北京阿博泰克北大青鸟信息技术有限公司.使用ASP.NET技术开发网上书店[M].科学技术文献出版社, 2011. [5]郑广成.MVC和.NET相结合的高职课程形成性考核系统开发[J].计算机和数字工程, 2011 (1) . 关键词:Web挖掘,Web使用挖掘,电子商务 随着互联网的普及和电子商务的发展, 电子商务系统在为用户提供越来越多选择的同时, 其结构也变得更加复杂, 用户经常会迷失在大量的商品信息空间中, 无法顺利找到自己需要的商品。电子商务推荐系统直接与用户交互, 模拟商店销售人员向用户提供商品推荐, 帮助用户找到所需商品, 从而顺利完成购买过程。在日趋激烈的竞争环境下, 电子商务推荐系统能有效保留用户、防止用户流失, 将电子商务网站的浏览者转变为购买者, 提高电子商务网站的交叉销售能力, 提高客户对电子商务网站的忠诚度, 从而提高电子商务系统的销售。推荐系统在电子商务系统中具有良好的发展和应用前景, 但是随着电子商务系统规模的进一步扩大, 电子商务推荐系统也面临如何提高准确性、及时性为每个客户提供个性化的商品推荐服务的问题。 1 Web挖掘技术 Web挖掘是数据挖掘在Web上的应用, 它利用数据挖掘技术从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息。将Web挖掘技术引入到电子商务推荐系统中, 借助于数据挖掘技术, 将之运用于日志数据中, 自动、快速地发现访问者的浏览模式 (如频繁访问页组、用户群等) , 在得到客户的浏览模式后, 高效地、自动地根据每个客户的浏览模式, 动态地调整、定制商品页面的内容和推荐用户喜好的商品, 为每个客户提供个性化商品推荐服务。只有提供个性化商品推荐服务才能较好地吸引大量的访问者。 2 电子商务个性化推荐系统体系结构 电子商务个性化推荐系统利用Web日志挖掘技术从Web日志中获取用户的访问模式, 根据用户的访问情况, 实时推荐用户可能感兴趣的商品超链接页面。主要分两个模块实现: (1) 离线部分 此部分主要是从日志文件中发现网站访问者的浏览模式, 对这些模式筛选后, 建立用户群体聚类, 如图1所示。 (2) 在线部分 实时推荐引擎识别用户的当前会话 (session) , 得到每个用户的当前访问序列, 然后把序列送入模式库中, 运算得到用户下一步可能访问的一些商品页面, 这些页面的地址可以附加到用户当前访问页面的底部进行推荐, 如图2所示。 3 电子商务推荐系统个性化推荐过程 电子商务个性化推荐系统的离线部分主要使用Web日志挖掘技术。 客户在Web站点上的商业活动和浏览访问的大部分信息都记录在日志文件中。所谓日志[1], 是指在服务器上有关访问的各种Web日志文件, 包括访问日志、引用日志、代理日志、错误日志等文件。这些文件里包含了大量的用户访问信息, 如用户的IP地址、所访问的URL、访问日期和时间、访问方法 (GET或POST) 、访问结果 (成功、失败、错误) 、访问的信息大小等。 以下是某商务网站Web服务器2008-10-29的日志片断: 虽然不同用户在不同的时期可能有不同的浏览模式, 但其长期趋势应该是稳定的。Web日志挖掘, 就是通过对Web日志记录的挖掘, 发现用户访问页面的模式, 从而进一步分析和研究日志记录中的规律, 以期改进站点的性能和组织结构, 提高用户查找信息的质量和效率, 并通过统计和关联的分析找出相似用户群体, 页面之间的内在联系, 这在电子商务等领域是大有作为的。 Web日志挖掘过程大体分为:数据预处理、日志挖掘算法实施。通过挖掘算法分析得到用户兴趣模式和用户聚类。 3.1 数据预处理 通常情况下, Web日志挖掘的预处理就是将原始的日志文件经过一系列的数据处理转化为用户会话, 主要包括:数据净化、用户识别、会话识别。 数据净化主要是过滤掉无关项或冗余项。例如:在log文件中, 扩展名为.gif、.ico、.css、.jpg的log记录可以删去, 而并不会对挖掘分析产生影响。再例如, 通常首页中会有一个计数器的脚本文件“count.cgi”, 这也同样可以删除。 用户识别是Web挖掘的重要一环, 它的成功与否直接关系到挖掘结果的准确性, 同时也是用户个性化聚类分析和个性化智能推荐服务的基础。会话识别的目的是划分用户的访问到不同的会话。最简单的方法是时间窗方式, 如果两个不同访问之间的时差超过某个值, 则认为, 用户开始了另一个新的会话。例如采用60分钟作为缺省的时间窗。 3.2 实施数据挖掘算法 数据挖掘技术是实现智能分析, 得到隐藏在大量繁杂数据内部知识的关键。通过对用户访问网站的历史数据应用各种数据挖掘技术, 得到高层知识, 提供给用户作决策支持, 或利用这些知识动态生成网页, 为用户提供访问建议。本文重点探讨用户聚类应用于电子商务个性化推荐系统。 针对电子商务Web站点拓扑结构和用户的浏览信息进行处理, 即以UserID (用户的IP地址) 为行, 以电子商务Web站点的URL (页面) 为列建立UserID-URL关联矩阵, 元素值为用户的访问次数。在此基础上, 对行向量进行聚类分析找出相似用户群体, 对列向量进行分析找出相似页面, 对后者可进一步发现频繁页集 (频繁访问路径) 。 (1) 用户行为的描述 对日志进行一定的预处理后, 我们以L= (2) 建立UserID-URL关联矩阵 根据日志信息, 可以建立如下所示UserID-URL关联矩阵: 其中, hi, j是i用户在一段时间内访问第j个页面 (URL) 的次数;每一行向量表示用户对网站的页面 (URL) 访问情况;每一列向量表示所有用户对此页面 (URL) 访问情况。因此, 可以这样认为, 行向量既反映了用户类型, 也勾勒出用户的个性化访问。而列向量则代表站点的结构, 也蕴含有用户共同的访问模式。那么, 分别度量行向量和列向量的相似性, 就能直接得到相似用户群体, 找出相似页面, 进一步分析可以得到用户的访问模式即频繁页集。 (3) 相似性度量 向量间相似性度量可以根据hamming距离进行计算。首先对于上UserID-URL关联矩阵的M[i, j]>0, 则令M[i, j]=1, 这样处理的目的是简化计算复杂度, 相当于不考虑用户在页面的停留时间而是考虑是否用户访问过此页面。然后, 计算向量间的hamming距离。hamming距离越小, 其相似程度越高。 hamming距离定义: 设X, Y是多个只能取0或1的向量, 那么X, Y间hamming距离Hd (X, Y) 为: 假设X= (1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1) , Y= (1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1) ;分别表示用户X和用户Y对12个页面的访问记录。从中我们发现用户X浏览了页面1, 3, 4, 5, 7, 12共6个, 而用户Y浏览了页面1, 3, 4, 7, 12共5个。两者只有一个页面的区别, 我们可以直观得出两者比较相似, 通过hamming距离公式计算得出距离为1, 即相似程度较高。若Y= (0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0) , 我们发现与用户X浏览的页面恰恰相反, 通过hamming距离公式计算得出距离为12, 即不具有相似性。 (4) 用户聚类 用户聚类时, 首先对UserID-URL关联矩阵Mm×n进行预处理, 如果M[i, j]>0, 则令M[i, j]=1。然后计算行向量间的hamming距离, 从而建立行向量间的距离矩阵Mm×m。在对称的距离矩阵Mm×m中的任意元素di, j表示第i个行向量与第j个行向量间的hamming距离, 对角线元素的值为0。 接下来根据以下公式计算临界值的大小: 采用以上数据挖掘算法, 得出聚类 (客户群) 存入模式库。在电子商务推荐系统在线部分中, 如何发现在线访问用户i被聚类到一个聚类 (客户群) 中, 则推荐系统可以将此聚类 (客户群) 的其他用户浏览过的商品推荐给在线访问用户i, 从而达到个性化商品推荐目的。原因是我们认为一个聚类 (客户群) 中的用户具有相似的爱好习惯。当然也可使企业对此客户群提供个性化信息服务和开展有针对性的电子商务活动。 4 结语 本文根据日志信息, 引入了UserID-URL矩阵, 由于算法本质的改进, 无需如关联规则Apriori算法存储候选集。处理简单, 易于实现。对挖掘结果进行有效的解释和评估, 就可有效地向用户个性化地推荐用户可能喜好的商品, 同时也可使企业对客户群提供个性化信息服务和开展有针对性的电子商务活动, 从而增加电子商务站点商品的销售量。 参考文献 [1]石晶, 龚震宇.基于Web挖掘的个性化服务技术[J].计算机科学, 2006 (8) :34-36. 关键词:知识产权;个性化推荐;保护 一、个性化推荐技术及其知识产权侵权 现今的个性化推荐技术服务包括了三种类型。第一,基于内容的推荐服务。它利用资源和用户兴趣的相似性来过滤信息,根据用户评价过的项目建立用户的兴趣模型,在根据用户描述的文件不同分为基于向量空间模型的推荐、基于关键词分类的推荐、基于领域分类的推荐和基于潜在语义索引的推荐,根据内容从庞大的数据库中读取用户需要的数据。第二,协同过滤推荐服务。协同过滤技术推荐是根据其他用户的偏好信息产生推荐,通过分析用户评价信息把有相似需求或者品味的用户联系起来,用户之间共享对项目的观点和评价,更好做出判断和选择。根据算法运行期间所用到的数据不同,协同过滤推荐可以分为基于内存的协同过滤和基于模型的协同过滤。第三,基于关联规则的推荐服务。基于关联规则的推荐技术是利用关联规则找出事物间的相关性,如果把每个兴趣组作为规则的前件,那么规则的后件就是这个兴趣组的推荐且必须是用户,主要是通过一些算法来实现关联规则的推荐。这种推荐系统简单、直接、具有通用性,它的缺点就是规则的发现需要耗一定的时间去发现运行,相对来说就会造成推荐内容的缓慢呈现。 个性化推荐技术服务中知识产权侵权现象时有发生。个性化信息组织与服务都是以数字化信息和计算机为基础的,有更多的机会和渠道收集用户的数据,同时也就有滥用数据的这种可能,不论是有意的还是无意的,同样,用户提出请求的内容也应当得到保护,不能够随意的处理,还极大多数涉及到版权著作权的问题。在个性化推荐服务提供信息的过程中,不可避免的使用到复制、分享、转载、或者超链接来指引用户访问原来有的数据信息,那在这一系列的操作中会涉及到复制权、发行权和网络传播权等方面的问题。网络服务提供者面临的知识产权问题是保护作品的完整权,保护作品完整权是指“保护作品不受歪曲、篡改的权利”,那用户自己改变了文字章节作为自己的文章时,那时候的知识产权保护受到了挑战。Cookie案件是个经典的个性化推荐侵权案件,在2015年6月12日,法院认为一匿名信息来进行个性化推荐服务,网络服务提供者仅仅需要做到明示告知就可以了,同时在网页列明相关规则的链接,用户任然使用该服务,视为用户选择模式同意。 二、个性化推荐技术的知识产权保护困境 在日常生活中,知识产权涉及到每件日用产品,每天浏览的网页乃至每天看到的书籍,更为重要的是知识产权在企业竞争中起到的关键作用,尤其是在专利和商标方面,几乎是哪个企业拥有的专利数量多哪个企业就具有巨大的竞争优势在同行业甚至是相邻相关企业之间都会有无限潜在的商业经济价值,但是每个硬币都有两面,在利益经济效益巨大的背面也暗藏着很多的知识产权保护漏洞。法律在保护公民财产和精神方面所表现出来的法律效力不可能做到面面俱到,因此总会有一些不法分子利用法律的空子,利用他们手里掌握的法律知识,专门被利益蒙蔽了双眼,为了一己私利往往将法律道德至于利益之下,这样也就给知识产权保护工作着带来极大的挑战,他们要随时准备着严厉打击不法分子,保护合法权利人的利益。 在个性化推荐服务中最主要面临的知识产权保护则是大多数是著作权的问题,当系统自动向用户推荐相关词条和文章的时候,这篇文章的作者是谁以及他授权给什么网站发表,允不允许别人私自转载等等问题的涉及,更主要比较难控制的是用户自己的选择,虽然网站公开申明禁止转载一系列公告,但是还是有部分用户会自己转载过来稍微编辑篡改作者的部分变为自己的,侵犯了作者的文章篡改权。在这方面又会牵扯到作者与网站管理者之间的相关利益问题,但是好在提前公告了相关的权限设置,用户有自己的选择,投稿者把发表权交给网站也就是相当于同意了这种方式,同时也就承担了他将要面临的风险。 三、个性化推荐技术的知识产权保护建议 (1)要特别重视信息服务体系的建设,提高网站管理者对信息的保障能力。知识经济社会是信息高速传播与充分利用的社会,信息服务体系的完善、工作水平与能力对技术创新将产生一定得影响,现在的科技信息服务体系的建设在初步阶段,有很多地方需要完善解决,加大数据库容量建设。 (2)對知识产权评估机构、产权市场、技术市场进一步完善,加大投入、鼓励、扶持企业进行技术创新成果的保护和转化。 (3)规范个性化推荐服务中的知识产权细分规则,制定详细的标准来衡量和加强对权利人的知识产权保护,同时也规范相关网站的个性化服务技术完整,使他们做到有法可依,有合法合理理由为用户做到更好的个性化服务。 (4)积极发展专利池,它由专利权人组成专利交易平台,专利权人在这个平台上可以横向纵向发展,形成一个庞大的专利池子,消除专利实施中的授权障碍,有利于专利技术的推广应用,也降低了专利许可中的交易成本。 (5)用户本身也需要具备一定得素养,成为道德和法律的合格用户,认真做到尊重权利人的智慧成果,不为自己的一己私利侵犯权利人的相关权利。加强对自身的知识产权知识培养,提高自己的文化水平,为共同维护和谐的网络环境贡献自己的一点力量。 参考文献: [1]宋雅婷,徐天伟.《基于用户兴趣的个性化推荐技术综述》,云南大学学报(自然科学版),2012(07). [2]张玉敏.《知识产权法》,法律出版社,2005年. [3]王迁,李雨峰,刘有东.《著作权法》,厦门大学出版社,2006年. 作者简介: 尹靓(1995~),女,汉族,江苏仪征人,华东交通大学人文学院法学系法学专业本科生,研究方向:知识产权法。 随着互联网的普及和智能手机的广泛应用, 以及现代电子商务的快速发展, 充斥在网络中的资源数量增长非常迅猛。大量的信息同时呈现在用户面前, 使得用户很难从中找到自己真正感兴趣的资源, 或者要耗费大量的时间和精力才能找到自己所需要的资源。 如何在众多资源中, 快速地找到我们真正感兴趣或者需要的资源呢?个性化推荐系统就是在这种背景下诞生的。个性化推荐系统是通过建立用户与信息产品之间的二元关系, 利用已有的选择过程或相似性关系, 挖掘每个用户潜在感兴趣的对象, 进而进行个性化推荐。高效的推荐系统可以挖掘用户潜在的消费倾向, 为众多的用户个性化服务。 个性化推荐系统目前已被广泛应用于电子商务、广告推送、电影推荐等包含海量信息并需要提供个性化服务的应用领域。因此, 研究个性化推荐技术与系统具有非常重要的意义。 2 概念及组成部分 从本质上讲, 个性化推荐系统就是一种预测用户对某一种资源兴趣程度的应用软件, 它通过分析用户的身份信息和行为来构建用户兴趣模型, 并且由推荐算法根据该模型来预测用户对资源的评分或者向用户推荐一系列更符合用户实际需求的资源。 一个完整的推荐系统主要由三个部分组成:收集用户信息的用户建模模块;分析用户喜好的推荐对象建模模块和推荐算法模块。通用的推荐系统模型流程如图1所示。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配, 同时使用相应的推荐算法进行计算筛选, 找到用户可能感兴趣的推荐对象, 然后推荐给用户。 3 常见的推荐系统 推荐系统的核心是推荐算法, 根据推荐算法的不同, 常见的推荐系统可以分为基于内容的推荐系统、基于协同过滤的推荐系统以及混合型推荐系统。 3.1 基于内容的推荐系统 首先根据历史信息 (如用户评价、收藏或分享过) 为系统用户建立一个偏好描述文件, 同时为资源项目也建立一个描述文件;然后通过比较计算推荐资源项目与用户偏好文件之间的相似性;最后选择相似性程度较高的资源项目推荐给用户。它不是根据用户对资源项目的评分信息, 而是根据用户已经选择了的项目内容信息来进行相应的推荐。例如, 在电影推荐中, 基于内容的推荐系统, 首先分析和提取用户已经评分过的且评分值较高的电影共性 (如演员、导演、风格等) , 然后将这些共性与其他电影的特征进行比较, 最后将相似性程度最高的电影推荐给该用户。 基于内容的推荐系统不需要使用系统用户的评分信息, 而只需要获取用户和资源项目的描述文件, 因此, 它具有如下优点:通过使用用户和商品的描述文件, 可以较好地解决冷启动问题;由于不需要用户的评分数据, 因此, 可以较好地缓解系统评分数据稀疏性的问题;可以发现隐藏的“暗信息”, 从而推荐新出现的资源项目;通过列出推荐项目的内容特征, 可以较好地解释推荐该项目的理由, 使得该系统具有较好的用户体验。 然而, 基于内容的推荐系统由于受到信息检索技术的约束, 仍有一些难以克服的缺点: (1) 特征提取的能力有限。通常只能分析一些容易提取的文本类内容, 对于多媒体 (图形、视频流等) 数据缺乏有效的特征提取方法。 (2) 推荐的资源范围过于狭窄。这是由于系统总是尽可能向用户推荐与其描述文件最符合的资源项目, 因此, 往往无法发现用户描述文件以外的潜在兴趣。 (3) 新用户问题。当一个新的用户没有或很少对任何资源进行评分时, 系统无法向该用户提供可信的推荐。 3.2 基于协同过滤的推荐系统 目前, 应用最为广泛的个性化推荐系统, 是一种基于一组兴趣相同的用户或项目进行的推荐, 它根据邻居用户 (与目标用户兴趣相似的用户) 的偏好信息产生对目标用户的推荐列表。 基于协同过滤的推荐系统主要采用的基本算法是:基于用户 (User-based) 的协同过滤算法和基于项目 (Item-based) 的协同过滤算法。其中, User-based协同过滤是根据邻居用户的偏好信息产生对目标用户的推荐。它以用户-项目评分矩阵中的行 (用户) 为基础来计算用户之间的相似性;相反, Item-based协同过滤技术则是以用户-项目评分矩阵中的列 (项目) 为基础来计算项目之间的相似性。这两个算法的共同点在于二者都是基于用户-项目评分矩阵来建立推荐系统模型, 进而为用户提供个性化推荐服务。 基于协同过滤的推荐系统的优点如下:具有推荐新信息、产生新奇推荐的能力, 能够发现用户潜在的但尚未察觉的兴趣爱好;适用于推荐难以进行内容分析的资源:协同过滤不需要使用资源的具体内容, 因此在资源内容 (如图像、视频、音乐等) 难以分析的情况下, 协同过滤是很好的选择。 然而, 由于协同过滤自身算法的特点, 以及随着互联网用户和项目数量的爆增, 基于协同过滤的推荐系统也存在以下缺点:用户对商品的评价非常稀疏, 这样基于用户的评价所得到的用户间的相似性可能不准确 (即稀疏性问题) ;随着用户和商品的增多, 系统的性能会越来越低 (即可扩展性问题) ;如果从来没有用户对某一商品进行评价, 则这个商品就不可能被推荐 (即冷启动问题) 等。 3.3 混合型推荐系统 混合型推荐系统就是把多种不同的推荐算法结合起来, 利用不同算法的优点而避免相关的缺点, 提高推荐系统的性能和质量。常见的混合型推荐系统包含以下几种形式。 1) 在协同过滤推荐系统中加入基于内容的技术。与传统协同过滤方法直接使用用户评分信息来计算用户相似性不同。该方法使用用户的描述来件来计算用户之间的相似性, 从而可以缓解协同过滤系统中用户评分数据的稀疏性问题;同时对于新项目, 如果其内容与用户描述文件很相似, 也可以得到推荐, 缓解系统冷启动问题。 2) 在基于内容的推荐系统中加入协同过滤技术。该方法通过将用户的评分信息加入用户描述文件和项目描述文件, 可以缓解基于内容推荐系统对一些难以分析项目无法进行推荐的缺点。 3) 其他的混合推荐系统。 4 研究展望 就目前来说, 个性化推荐系统仍没有达到完善的地步, 还存在一些问题需要研究解决。 4.1 推荐系统的安全问题 随着个性化推荐系统的广泛应用, 尤其是在电子商务上的应用, 一些黑客或商家受到利益的驱使, 开始采取一些非法手段来攻击推荐系统, 或者利用推荐系统固有的缺点来进行危害客户利益的非法营销。这些不法行为不仅损害了系统的客户以及一些竞争商家的直接利益, 同时也导致了推荐系统的信任问题。因此, 如何解决推荐系统的安全问题是亟待解决的一个重点。 4.2 推荐算法的适用性问题 不同的产品类目, 由于数据情况的不同, 产品类型的不同等原因, 可能需要使用不同的推荐算法。因此, 需要对不同算法在不同类目上的推荐预测准确率和覆盖率展开探索和研究。 4.3 时效性问题 在推荐系统中, 除了利用用户的喜好、商品的特性、用户对商品浏览、购买等行为进行分析和预测用户对商品的兴趣外, 推荐系统还要能及时捕捉用户需求的变化, 反馈到模型中, 并及时响应用户请求, 实时提供在线服务。因为用户是挑剔的、也是缺乏耐心的, 新用户尤其如此, 如果一个推荐系统无法在较短的时间内调整结果以迎合用户, 那么用户就会迅速流失。因此, 时间这个维度对预测的准确性也会产生相当大的作用, 如何将已有的研究成果应用到推荐系统, 甚至创新一些模式, 使得推荐系统时效性更强, 也是一个重要的研究内容。 5 结语 个性化推荐系统是一个系统工程, 依赖数据、架构、算法、人机交互等环节的有机结合。本文只是简要的介绍, 希望大家在享受个性化推荐系统带给我们便利时, 适时地表达我们的需求, 利于更人性化、更丰富、更方便的个性化推荐系统出现。 摘要:随着互联网的普及和智能手机的广泛应用, 信息过载问题也日趋严重, 推荐在我们身边也无处不在。个性化推荐系统是当前解决信息过载问题的有力工具之一, 受到了众多的关注和研究。阐述了推荐系统的背景和意义, 以及推荐系统的概念三大组成部分, 提出了常用的三类个性化推荐系统及其优缺点, 并展望了个性化推荐系统未来研究的重点和难点问题。 【个性化推荐系统研究】推荐阅读: 个性化资源推荐05-31 个性化推荐模型09-09 酒店个性化服务研究11-03 个性化旅游服务系统06-27 个性化学习系统论文08-18 个性化教学的文化研究08-12 学生个性化作文素质的培养研究07-08 语文审美教育个性化研究论文09-21 变个性研究09-30 浅析个性化网络教学系统设计与实现08-20个性化推荐系统研究 篇6
个性化推荐系统研究 篇7
个性化推荐系统研究 篇8
个性化推荐系统研究 篇9
个性化推荐系统研究 篇10
个性化推荐系统概述 篇11