推荐系统

2024-06-02

推荐系统(共12篇)

推荐系统 篇1

0 引言

个性化推荐帮助用户发现电影,音乐和感兴趣的商品,为用户推荐志趣相同的新朋友,为用户提供个性化的搜索结果,解决用户“信息过载”问题。推荐模型根据用户的行为分析得到不用用户的喜好,并提供相应的服务。随着智能手机的不断发展,移动推荐系统已经成为下一代智能手机研究领域最为活跃的课题之一。许多研究者已经对相关领域进行了深入的研究,如移动信息检索、传感器的研究、数据挖掘和知识发现、人机交互等。

1 移动推荐系统及其关键技术

移动推荐系统是传统推荐系统在移动领域的进一步扩展。随着社会高速发展,移动用户大量增加,中国互联网中心在2016年1月最新公布的《第37次中国互联网络发展状况统计报告》中指出,截止2015年12月,中国手机网民达6.20亿,半数中国人通过手机接入互联网。如何为用户提供更好、更准确的推荐信息成为推荐系统研究者们研究的重点。移动用户虽然存在异构的移动网络环境,但只要能准确提取用户在移动环境行为进行分析,就能有效地为用户进行个性化推荐。

1.1 移动上下文推荐

作为“普适计算”核心领域的上下文感知计算理论,自动发现和利用位置、环境等上下文信息为用户提供服务已经取得许多研究成果。由于移动设备的易携带性,研究者们可以通过设备感知用户所处上下文环境。用户偏好通常会受到周围环境的影响,如有的用户喜欢在办公室而不是家中购物,有的用户喜欢在晚上学习而不是白天。

1.2 移动社会化推荐

互联网的高速发展使得虚拟交互变得越来越重要,用户在社交网络中分享信息,在移动互联网上通信。通过用户行为可以为用户构建社交网络,网络中的用户之间存在某些特定的联系,一些研究者将社会网络引入推荐系统中,有效缓解了传统推荐中存在的冷启动问题。近年来,随着智能手机的普及性,通过收集手机用户在社交网络中的行为更能够有效为用户建模并进行个性化推荐。

2 基于位置的移动推荐系统

传统的推荐系统特点之一在于用户交互,推荐系统通过用户历史行为为其进行推荐。基于位置的移动推荐系统,通过访问移动设备的位置数据,收集并分析用户的位置与历史信息。最为重要的是根据以上信息为用户提供个性化的推荐。

移动推荐系统用户信息的采集分为两种方法:显式方法通过收集用户输入的显式信息,如用户在注册账户时的年龄,住址等;隐式方法是系统根据用户的历史信息和活跃行为中分析构建用户行为信息。如电子邮件的收发方,社交网站的浏览行为等。当研究人员收集到数据后,需要利用数据挖掘工具对采集的信息进行预处理,对用户建模并以各种形式为用户进行个性化推荐。

3 移动推荐系统研究难点与应用前景

个性化和实时性使得移动推荐系统拥有者广阔的发展前景,本节就其研究难点和应用前景进行分析总结。

3.1 研究难点

(1)移动用户的信息获取,在移动推荐中,由于终端设备的特殊性,显式获取用户信息常常会影响用户体验。因此隐式获取用户信息的方式更为常见,在保证用户隐私的前提下,有效准确地获取用户信息,依然是移动推荐研究的重中之重。

(2)移动推荐系统的冷启动问题,新用户进入推荐系统时,由于信息缺失,不能准确地获取用户偏好,新项目进入系统时,过少的评价信息也使得推荐系统无法准确进行推荐。

(3)移动推荐的隐私和安全问题,移动用户的隐私保护问题严重制约了移动信息系统的发展,移动推荐系统为收集用户信息,通常对移动用户信息、行为、位置等进行分析。但部分移动用户不愿向推荐系统提供完整准确的信息,认为存在隐私泄漏等安全问题。

3.2 应用前景

移动新闻推荐作为互联网推荐的研究领域之一,在移动推荐领域同样收到研究者们的关注,Daily Learner新闻推荐系统通过挖掘用户的兴趣变化向用户推送新闻,利用用户注册时的信息,缓解了冷启动问题。移动旅游推荐是兴起的新型推荐领域应用。Cyberguide根据用户位置上下文信息以及历史行为为用户进行基于位置的移动旅游推荐。

随着智能设备的普及,移动设备已经成为人们生活中不可或缺的工具。近年来,利用移动推荐系统来缓解用户“信息过载”问题已经得到研究者们的广泛关注,但依然存在大量问题需要进行深入研究。

摘要:随着移动终端的普及,移动设备成为了推荐系统理想的获取用户信息的接口,用来帮助系统发现,学习用户的周围物理环境。对近几年移动推荐系统研究进行综述,对其关键技术进行对比分析。最后对移动推荐系统的发展趋势进行展望。

关键词:移动设备,推荐系统,移动推荐,综述

参考文献

[1]Church K,Smyth B.Understanding the Intent behind Mobile Information Needs[C]//Proceedings of the 14th International Conference on Intelligent User Interfaces:ACM,2009:247-256.

[2]Dey AK,Wac K,Ferreira D,et al.Getting Closer:An Empirical Investigation of the Proximity of User to Their Smart Phones[C]//Proceedings of the 13th International Conference on Ubiquitous Computing:ACM,2011:163-172.

[3]Cho E,Myers SA,Leskovec J.Friendship and Mobility:User Movement in Location-based Social Networks[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining:ACM,2011:1082-1090.

[4]Baltrunas L.Exploiting Contextual Information in Recommender Systems[C]//Proceedings of the 2008 ACM Conference on Recommender Systems:ACM,2008:295-298.

[5]Girardello A,Michahelles F.Appaware:Which Mobile Applications Are Hot?[C]//Proceedings of the 12th International Conference on Human Computer Interaction with Mobile Devices and Services:ACM,2010:431-434.

[6]孟祥武,胡勋,王立才,等.移动推荐系统及其应用[J].软件学报,2013,24(1).

推荐系统 篇2

一、供应部

主要原材料计划使用表生产部到货通知备品备件计划采购单采购合同合同送审书变更送审书使用部门入库单卸车验收通知单采购管理使用资金申请单费用报销审核单储运部企划部原料检验报告单各项支出预计明细表财务部质管部

1、需要各生产分厂或部门每月做采购计划,如果各生产分厂或部门每次在需要时才做采购计划,而且需求比较紧急,这样供应部门总是疲于应付这些“紧急采购”,工作比较被动。各生产分厂及部门可在月底按日常需求做好下一个月的采购计划,供应部门则可以及时安排下月的工作,这样也不影响各部门的正常使用。当然对一些无法预料的计划可在做少量的“紧急采购计划”。

2、需要了解原料库、物资库的库存情况,以及各种物料的最低库存、最高库存、安全库存情况。

3、从质量部门了解到货检验结果。

二、销售部

经营目标生产部生产计划质管部湿浆质检报告单产品提货单成品库存日报磅码单销售管理湿浆提货单付款情况分厂产品发运单产品发运清单销售发票产成品库产品出库清单财务

1、了解成品库的情况。

2、了解生产情况,包括日报及生产计划。

3、需要质量部门对成品浆板及湿浆的检验结果。

4、需要财务部门反馈到货付款情况。

三、质量部

质量管理各需要检验的部门各需要检验结果的部门

四、财务部门

1、需要销售部门的产品发运单、发运清单及销售发票数据。

五、储运部

领料单生产部产品入库单分厂库存定额出库单设备材料采购入库单采购发票采购部仓库管理入库单木片送验单原材料检验通知单财务出库清单XX材料检验报告提货单

1、需要采购系统的采购计划,用来确定到货物资的有效性(是否有此到货的订单)。

2、出库单和入库单与财务部门对帐。质量部销售

六、生产技术部门

生产计划日报表、生产完成情况生产车间仓 库领料单生产计划日报表、生产完成情况销售部物料需求供应部

备品备件计划采购单供应部固定资产明细分类财务部设备管理备品备件计划采购单车间1.设备维修 统计表2.月维修材料 消耗统计表3.月备品备件 更换统计表

1.需要及备品备件库存情况。2.需要成品库库存情况。

3.需要向销售部门提供生产日报。

其他业务问题

1、采购物资入库手续的处理

即采购物资到货(到仓库或生产厂)以后要填写采购收料单、通知检验部门检验、填写入库单,这三个环节由哪个部门负责办理及组织?

2、物料分类及物料档案整理

物料档案是ERP中最基础的元素,从采购、库存、销售到生产、质量、财务都不可缺少的数据,因此物料档案的建立也是最要的一个步骤,物料档案包含了许多属性,比如物料分类、物料名称、编码、规格型号、主计量单位、所属仓库、计划价、参考成本、参考售价、最新入库成本、最新出库成本、最高库存、最低库存等大约四十几个属性,因此物料档案的建立也是一个艰巨而繁重的工作,需要几个部门共同协作才能完成。

3、仓库的盘点

在物料档案完成后,上系统之前要对仓库进行一次认真的盘点,确保帐面与实际库存完全一致,对一些永远都不会用到的物料(比如建厂期间的建材等)进行处理,这样一是可以减少物料档案的建立数量,二是减少数据库的数据量提高运行速度,三是减少不必要的积压库存。对一些无法处理的财务挂帐进行一次性处理,没有必要对这些物资进行不平挂帐。

4、非标设备采购、外协加工等业务流程的系统归属

家庭卡拉OK系统推荐 篇3

大房间卡拉OK系统

这里所说的大房间一般指25-40左右平方米的房间,比如客厅或者影音室,这样的房间要有好的K歌效果和经济方案,专业箱是不错的选择。我们推荐一個方案:主音箱惠威12寸专业音箱+BASSCO 500W专业功放+声工厂效果器+国产无线话筒+音王4T高清点歌机。这套系统完工调试后在30平方米的影音室和50平方米左右平方的客厅表现都非常不错,主要表现为,唱歌非常轻松,话筒声音比较有磁性,伴奏的低频比较饱满,具有极高的性价比。

系统造价为1万8左右

中小房间卡拉OK系统

这里所说的中房间一般指15-20平方米左右的房间,比如客厅或者影音室,这样的房间卡包箱比较理想的选择。我们推荐一個方案:主音箱BMB450(C)卡包箱+BASSCO500W专业功放+声工厂效果器+国产无线话筒+音王4T高清点歌机。BMB是KTV音响系统的领头羊,也是国内KTV音响生产业一直模仿的对象,国内代工的新款BMB450延续了BMB好唱的特点,这套系统完工调试后在15-20平方米左右的影音室和25平方米左右的客厅表现都非常不错,主要表现为:音乐低频比较饱满自然,中频有力,高频不刺耳也比较靓丽,唱歌不费力气!

系统造价为2万左右

专业级别卡拉OK系统

这套推荐的系统适合的房间在20-30平方米左右,最好为密封的独立房间或者影音室,配置为:主音箱JBLSRX715+皇冠XTI6000功放+韵乐数字效果器+AKG无线话筒+音王4T高清点歌机。这套系统完工调试后,话筒和音乐的声音都非常干净清晰,整体演唱效果感觉就像专业演出出来的声音,不过这套系统对人声没有过多的修饰,更适合唱歌比较专业追求保真度的人士。对于一般的卡拉OK爱好者未必会很喜欢这样的效果!

系统造价为4万左右

超高性价比的卡拉OK系统

对于有部分客户来说,由于考虑整套系统的预算,所以需要追求非常高的性价比,我们这里给大家推荐一個经济又具有性价比的方案:惠威10寸卡包箱+300W专业功放+爱威效果器+国产无线话筒+歌绅2T点歌机。这套系统适应的房间大小就不能苛求,因为既然得考虑预算,就不能按照标准来做配置了,所须注意的是如果房间比较大,沙发的摆放位置或者说演唱者的位置不能离音箱太远,一般要控制在4米以内,不然会因为离音箱比较远导致声压不够唱得累真声音无包围感。

系统造价为1万以上

如何衡量家庭卡拉OK系统的标准

家庭卡拉OK系统由视频显示部分、点歌系统和音响系统组成。视频显示部分一股由1080P大屏幕高清投影或者电视组成。这里就不介绍了。好的家庭单机点歌系统我们觉得应该具备以下特点:1.具备独立的高清接口输出,让点歌机里的高清歌曲的画质可以完美地体现。2.歌曲文件格式应该以DVD或者MPG-2为主,当然应该有部分高清歌曲。3.点歌系统的触摸屏应该灵敏准确。4.应该具备iPad点歌功能,让点歌和控制可以更加灵活方便点歌系统的触摸屏应该灵敏准确点歌界面应该明了、简洁、时尚。5.声音输出应该有较好的效果。目前国内比较有名气和市场占有率比较高的家庭单机版有音王、雷客、视易等。一套良好的家庭卡拉OK音响系统除了要耐用、稳定,总的来说应该具备好唱和好听两個重要的体现。卡拉OK是以唱为主的,所以首先要考虑演唱者的主观感受,好唱是指话筒声音厚实饱满,有穿透力,唱歌轻松不费力气。再者是好听,好听是指在场的观众的感受,音乐方面应该表现为低频饱满富有弹性,高频清晰亮丽,音乐感强。人声方面应该表现为厚实圆润,不刺耳不失真。

个性化推荐系统概述 篇4

随着互联网的普及和智能手机的广泛应用, 以及现代电子商务的快速发展, 充斥在网络中的资源数量增长非常迅猛。大量的信息同时呈现在用户面前, 使得用户很难从中找到自己真正感兴趣的资源, 或者要耗费大量的时间和精力才能找到自己所需要的资源。

如何在众多资源中, 快速地找到我们真正感兴趣或者需要的资源呢?个性化推荐系统就是在这种背景下诞生的。个性化推荐系统是通过建立用户与信息产品之间的二元关系, 利用已有的选择过程或相似性关系, 挖掘每个用户潜在感兴趣的对象, 进而进行个性化推荐。高效的推荐系统可以挖掘用户潜在的消费倾向, 为众多的用户个性化服务。

个性化推荐系统目前已被广泛应用于电子商务、广告推送、电影推荐等包含海量信息并需要提供个性化服务的应用领域。因此, 研究个性化推荐技术与系统具有非常重要的意义。

2 概念及组成部分

从本质上讲, 个性化推荐系统就是一种预测用户对某一种资源兴趣程度的应用软件, 它通过分析用户的身份信息和行为来构建用户兴趣模型, 并且由推荐算法根据该模型来预测用户对资源的评分或者向用户推荐一系列更符合用户实际需求的资源。

一个完整的推荐系统主要由三个部分组成:收集用户信息的用户建模模块;分析用户喜好的推荐对象建模模块和推荐算法模块。通用的推荐系统模型流程如图1所示。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配, 同时使用相应的推荐算法进行计算筛选, 找到用户可能感兴趣的推荐对象, 然后推荐给用户。

3 常见的推荐系统

推荐系统的核心是推荐算法, 根据推荐算法的不同, 常见的推荐系统可以分为基于内容的推荐系统、基于协同过滤的推荐系统以及混合型推荐系统。

3.1 基于内容的推荐系统

首先根据历史信息 (如用户评价、收藏或分享过) 为系统用户建立一个偏好描述文件, 同时为资源项目也建立一个描述文件;然后通过比较计算推荐资源项目与用户偏好文件之间的相似性;最后选择相似性程度较高的资源项目推荐给用户。它不是根据用户对资源项目的评分信息, 而是根据用户已经选择了的项目内容信息来进行相应的推荐。例如, 在电影推荐中, 基于内容的推荐系统, 首先分析和提取用户已经评分过的且评分值较高的电影共性 (如演员、导演、风格等) , 然后将这些共性与其他电影的特征进行比较, 最后将相似性程度最高的电影推荐给该用户。

基于内容的推荐系统不需要使用系统用户的评分信息, 而只需要获取用户和资源项目的描述文件, 因此, 它具有如下优点:通过使用用户和商品的描述文件, 可以较好地解决冷启动问题;由于不需要用户的评分数据, 因此, 可以较好地缓解系统评分数据稀疏性的问题;可以发现隐藏的“暗信息”, 从而推荐新出现的资源项目;通过列出推荐项目的内容特征, 可以较好地解释推荐该项目的理由, 使得该系统具有较好的用户体验。

然而, 基于内容的推荐系统由于受到信息检索技术的约束, 仍有一些难以克服的缺点: (1) 特征提取的能力有限。通常只能分析一些容易提取的文本类内容, 对于多媒体 (图形、视频流等) 数据缺乏有效的特征提取方法。 (2) 推荐的资源范围过于狭窄。这是由于系统总是尽可能向用户推荐与其描述文件最符合的资源项目, 因此, 往往无法发现用户描述文件以外的潜在兴趣。 (3) 新用户问题。当一个新的用户没有或很少对任何资源进行评分时, 系统无法向该用户提供可信的推荐。

3.2 基于协同过滤的推荐系统

目前, 应用最为广泛的个性化推荐系统, 是一种基于一组兴趣相同的用户或项目进行的推荐, 它根据邻居用户 (与目标用户兴趣相似的用户) 的偏好信息产生对目标用户的推荐列表。

基于协同过滤的推荐系统主要采用的基本算法是:基于用户 (User-based) 的协同过滤算法和基于项目 (Item-based) 的协同过滤算法。其中, User-based协同过滤是根据邻居用户的偏好信息产生对目标用户的推荐。它以用户-项目评分矩阵中的行 (用户) 为基础来计算用户之间的相似性;相反, Item-based协同过滤技术则是以用户-项目评分矩阵中的列 (项目) 为基础来计算项目之间的相似性。这两个算法的共同点在于二者都是基于用户-项目评分矩阵来建立推荐系统模型, 进而为用户提供个性化推荐服务。

基于协同过滤的推荐系统的优点如下:具有推荐新信息、产生新奇推荐的能力, 能够发现用户潜在的但尚未察觉的兴趣爱好;适用于推荐难以进行内容分析的资源:协同过滤不需要使用资源的具体内容, 因此在资源内容 (如图像、视频、音乐等) 难以分析的情况下, 协同过滤是很好的选择。

然而, 由于协同过滤自身算法的特点, 以及随着互联网用户和项目数量的爆增, 基于协同过滤的推荐系统也存在以下缺点:用户对商品的评价非常稀疏, 这样基于用户的评价所得到的用户间的相似性可能不准确 (即稀疏性问题) ;随着用户和商品的增多, 系统的性能会越来越低 (即可扩展性问题) ;如果从来没有用户对某一商品进行评价, 则这个商品就不可能被推荐 (即冷启动问题) 等。

3.3 混合型推荐系统

混合型推荐系统就是把多种不同的推荐算法结合起来, 利用不同算法的优点而避免相关的缺点, 提高推荐系统的性能和质量。常见的混合型推荐系统包含以下几种形式。

1) 在协同过滤推荐系统中加入基于内容的技术。与传统协同过滤方法直接使用用户评分信息来计算用户相似性不同。该方法使用用户的描述来件来计算用户之间的相似性, 从而可以缓解协同过滤系统中用户评分数据的稀疏性问题;同时对于新项目, 如果其内容与用户描述文件很相似, 也可以得到推荐, 缓解系统冷启动问题。

2) 在基于内容的推荐系统中加入协同过滤技术。该方法通过将用户的评分信息加入用户描述文件和项目描述文件, 可以缓解基于内容推荐系统对一些难以分析项目无法进行推荐的缺点。

3) 其他的混合推荐系统。

4 研究展望

就目前来说, 个性化推荐系统仍没有达到完善的地步, 还存在一些问题需要研究解决。

4.1 推荐系统的安全问题

随着个性化推荐系统的广泛应用, 尤其是在电子商务上的应用, 一些黑客或商家受到利益的驱使, 开始采取一些非法手段来攻击推荐系统, 或者利用推荐系统固有的缺点来进行危害客户利益的非法营销。这些不法行为不仅损害了系统的客户以及一些竞争商家的直接利益, 同时也导致了推荐系统的信任问题。因此, 如何解决推荐系统的安全问题是亟待解决的一个重点。

4.2 推荐算法的适用性问题

不同的产品类目, 由于数据情况的不同, 产品类型的不同等原因, 可能需要使用不同的推荐算法。因此, 需要对不同算法在不同类目上的推荐预测准确率和覆盖率展开探索和研究。

4.3 时效性问题

在推荐系统中, 除了利用用户的喜好、商品的特性、用户对商品浏览、购买等行为进行分析和预测用户对商品的兴趣外, 推荐系统还要能及时捕捉用户需求的变化, 反馈到模型中, 并及时响应用户请求, 实时提供在线服务。因为用户是挑剔的、也是缺乏耐心的, 新用户尤其如此, 如果一个推荐系统无法在较短的时间内调整结果以迎合用户, 那么用户就会迅速流失。因此, 时间这个维度对预测的准确性也会产生相当大的作用, 如何将已有的研究成果应用到推荐系统, 甚至创新一些模式, 使得推荐系统时效性更强, 也是一个重要的研究内容。

5 结语

个性化推荐系统是一个系统工程, 依赖数据、架构、算法、人机交互等环节的有机结合。本文只是简要的介绍, 希望大家在享受个性化推荐系统带给我们便利时, 适时地表达我们的需求, 利于更人性化、更丰富、更方便的个性化推荐系统出现。

摘要:随着互联网的普及和智能手机的广泛应用, 信息过载问题也日趋严重, 推荐在我们身边也无处不在。个性化推荐系统是当前解决信息过载问题的有力工具之一, 受到了众多的关注和研究。阐述了推荐系统的背景和意义, 以及推荐系统的概念三大组成部分, 提出了常用的三类个性化推荐系统及其优缺点, 并展望了个性化推荐系统未来研究的重点和难点问题。

个性化推荐系统综述 篇5

以下内容摘自《个性化推荐系统的研究进展》,该文发表于1月的《自然科学进展》专题评述,作者是刘建国、周涛、汪秉宏。

我略去了具体的算法和许多公式,重点看原理、思路和比较。

互联网技术的迅速发展使得大量的信息同时呈现在我们面前,传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息的爆炸使得信息的利用率反而降低,这种现象被称之为信息超载。个性化推荐,包括个性化搜索,被认为是当前解决这个问题最有效的工具之一。推荐问题从根本上说是代替用户评估它从未看过的产品,这些产品包括书、电影、CD、网页、甚至可以是饭店、音乐、绘画等等。

个性化推荐系统通过建立用户与信息产品之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐。高效的推荐系统可以挖掘用户潜在的消费倾向,为众多的用户提供个性化服务。 一个完整的推荐系统由3个部分组成:

1、收集用户信息的行为记录模块

2、分析用户喜好的模型分析模块

3、推荐算法模块

推荐算法模块是最核心的部分。根据推荐算法的不同,推荐系统可以分为如下几类:

协同过滤(collaborative filtering)系统

基于内容(content-based)的推荐系统

基于用户-产品二部图网络结构(network-based)的推荐系统

混合(hybrid)推荐系统

其他

1. 协同过滤系统

第一代被提出并得到广泛应用的推荐系统。如amazon的书籍推荐,Jester的笑话推荐,等等。

1)核心思想:利用用户的历史信息计算用户之间的相似性——》利用与目标用户相似性较高的用户对其他产品的评价来预测目标用户对特定产品的喜好程度——》根据喜好程度来对目标用户进行推荐。

在计算用户之间相似度时,大部分都是基于用户对共同喜好产品的打分。最常用的方法是Pearson相关性和夹角余弦。

协同过滤推荐系统的算法可以分为两类,基于记忆(memory-based)&基于模型(model-based)。前者是根据系统中所有被打过分的产品信息进行预测,注重于预测用户的相对偏好而不是评分绝对值;后者是收集打分数据进行学习并推断用户行为模型,再对某个产品进行预测打分。

2)优点:

发现用户潜在的兴趣偏好,推荐新信息

能推荐难以进行内容分析的产品

3)缺点:

由于是基于用户对产品的评分,所以对新用户进行推荐或者是对用户推荐新产品,精度不高

随着用户量的增多,计算量呈线性增加,影响系统的性能

2. 基于内容的推荐系统

是协同过滤技术的延续与发展。

1)核心思想:分别对用户和产品建立配置文件——》比较用户与产品配置文件的相似度——》推荐与其配置文件最相似的产品,

例如,在电影推荐中,基于内容的系统首先分析用户已经看过的打分较高的电影的共性(演员、导演、风格等),再推荐与这些用户感兴趣的电影内容相似度很高的其他电影。基于内容的推荐算法根本在于信息获取和信息过滤。因为在文本信息获取与过滤方面的研究较为成熟,现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐。 在信息获取中,最常用的是TF-IDF方法。

2)优点:

能处理新用户、新产品的问题(冷启动)

实际系统中用户对产品的打分信息非常少,基于内容的推荐系统可以不受打分稀疏性问题的约束

能推荐新出现的产品和非流行的产品,发现隐藏信息

通过列出推荐内容的特征,可以解释为什么推荐这些产品,使用户在使用时具有更好的用户体验

3)缺点:

受到信息获取技术的约束,例如自动提取多媒体数据(图形、视频流、声音流等)的内容特征具有技术上的困难

如果两个不同的产品恰好用相同的特征词表示,这两个产品就无法区分

如果一个系统只推荐与用户的配置文件高度相关的产品,那么推荐的只能是与用户之前购买过的产品非常相似的产品,无法保证推荐的多样性

3. 基于网络结构的推荐算法

仅仅把用户和产品的内容特征看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系中。

1)核心思想:建立用户—产品二部图关联网络

对于任意目标用户i,假设i选择过所有的产品,每种产品都具有向i推荐其他产品的能力,把所有i没有选择过的产品按照他喜欢的程度进行排序,把排名靠前的推荐给i。

在同样的用户喜好程度下,推荐冷门的产品要比推荐热门的产品意义更大。在同样精确度下,推荐的产品数量越少越好。

提高精确度的方法还有:

去除重复性

通过引入耦合阈值(即只考虑相似性大于或等于给定阈值的用户以及和这些用户连接的产品)

2)优点:开辟了推荐算法研究的新方向

3)缺点:

同样面临着新用户新产品的问题。新用户或新产品刚进入系统时没有任何选择或被选信息,系统无法与其他用户或产品建立关联网络

受到用户选择关系建立时间的影响,如果把用户与产品的所有关联关系都考虑在内,无法区分出长期兴趣和短期兴趣点,过多地考虑长期兴趣点会使系统无法给出满足用户短期兴趣的产品,大大降低推荐准确度

4. 混合推荐

将上述几种推荐方法有机结合,实际的推荐系统中最常见的是基于协同过滤和基于内容的。

1)独立系统相互结合

独立的应用协同过滤,基于内容和基于网络结构的算法进行推荐,然后将两种或多种系统的推荐结果结合,利用预测打分的线性组合进行推荐。或者,只推荐某一时刻在某一评价指标下表现更好的算法的结果。

2)在协同过滤系统中加入基于内容的算法

利用用户的配置文件进行传统的协同过滤计算,用户的相似度通过基于内容的配置文件计算得出,而非共同打过分的产品的信息。这样可以克服协同过滤系统中的稀疏性问题,另外,不仅仅是当产品被配置文件相似的用户打了分才能被推荐,如果产品与用户的配置文件很相似也会被直接推荐。

5. 其他方法

1)关联规则分析:关注用户行为的关联模式。如买了香烟的人大多会购买打火机,因此可以在香烟和打火机间建立关联关系,通过这种关系推荐其他产品。

基于多属性评分的酒店推荐系统 篇6

【关键词】推荐系统;协同过滤;属性;偏好

引言

如今互联网已经深入到各个行业,和酒店结合产生了酒店电子商务。据相关报告显示,中国酒店市场总交易额为2986.3亿元,其中在线酒店市场交易额为614.6亿元,占总交易额的20.6%[1]。为了从在线交易市场中获得更大的蛋糕,酒店企业加大了在互联网的信息量。酒店信息量的剧增拓展了消费者选择空间,但同时也带来很大的信息负担。如何帮助游客快速查询所需信息,将潜在游客变为购买者是酒店电子商务面临的挑战。

个性化推荐系统是一种解决信息过载问题的技术,它是根据用户的兴趣爱好,推荐符合用户个性化的对象。它已广泛应用于许多领域,如商业领域,教育领域等。

1.相似性计算方法

1.1 传统的相似性计算方法

协同过滤推荐是根据其他用户的观点产生对目标用户的推荐列表,它是基于这样一种假设:如果用户对一些项目的评分比较接近,那么他们对其他项目的评分也会比较接近。目前协同过滤已是电子商务推荐系统中应用最广泛的算法[2]。相似性计算是协同过滤算法中最关键的一步,计算相似性的方法主要有:余弦相似性、相关相似性以及修正的余弦相似性[3]。

余弦相似性:用户评分被看做是n维项目空间上的向量,用户间的相似性通过向量间的余弦夹角来度量,余弦值越大表明两个用户的相似度越高。计算公式如式(1)所示。

(1)

相关相似性:设Iij表示用户i与用户j共同评分项目集,则用户i、j之间的相似性如式(2)所示。

(2)

修正的余弦相似性:在余弦相似性计算方法上没有考虑不同用户的评分尺寸问题,修正的余弦相似性计算方法通过减去用户对项目的平均评分来改善上述缺陷,设经用户i和用户j共同评分的项目集合用Iij表示,Ii和Ij分别表示经用户i和j评分的项目集合,则用户i和j之间的相似性sim(i,j)如式(3)所示,其中Ri,c表示用户i对项目c的评分,和分别表示用户i和用户j对项目的平均评分。RR

(3)

在计算相似性时使用的数据集是用户-评分矩阵,它表达了用户对项目的评价情况。这种用户-评分矩阵都是基于用户对单个项目的打分数据,而单个打分无法非常准确地描述用户的偏好,从而不能根据用户的偏好向用户提供个性化的推荐。

1.2 基于多属性评分的相似性计算方法

酒店作为服务行业,应该考虑客户的偏好,提供更趋向于个性化的服务。对酒店通过多个属性来描述和提供用户评分,考虑用户在不同属性上的偏好能够进行更有效的推荐[4]。例如携程网、美团网等为用户在对酒店评价时除了总体评价外提供了多个属性的打分。在多维度打分的情况下,用户可以为项目的多个属性评分,表达了对不同方面关注的差异,也更精确地反映出用户的偏好。本文将研究用户的多属性评分,提出一直基于多属性评分的协同过滤推荐算法,由用户的多属性评分矩阵计算出用户对各个属性的偏好,得出偏好序列,根据所有用户偏好组成的偏好矩阵找到相似用户,这样不仅可以降低由于引入多属性增加的计算复杂度,而且可以有效的解决数据稀疏性问题,从而提高对用户推荐信息的满意度。

1)计算偏好序列

对项目总体打分只能够反映用户对该项目的喜欢程度,而通过多属性打分却能进一步表明为什么。根据这种情况可以从用户对项目的多属性打分矩阵中挖掘出用户对属性的偏好。用户在对项目打分时,通常用户重视的属性评价对总体评价影响更大,属性评分与总体评分差异大,则说明该属性在用户心目中不重要。因此对于一个用户i给项目p打分,Rip0表示用户i对项目p的总体评分,Ripc表示用户对项目p中属性c的评分,定义Dc表示用户对项目的总评分和属性c评分相差的绝对值,Dc=|Rip0-Ripc|,Dc差值越小,说明用户对该属性重视程度大;Dc差值越大,说明用户对该属性重视程度小。然后在用户i所有评分项目的集合Ii中求Dc的平均值,如式(4)所示。

(4)

Dic’揭示了用户对属性c的偏好程度,它们之间成反比例关系,这里用公式(5)表示。

(5)

其中Wic表示用户i在属性c上的偏好,|c|表示项目属性的个数,由于分母Dic’值有可能为0,进行了加1处理,最后四舍五入取整。

按照這个方法计算所有的属性的偏好值,将得到用户i偏好序列。

2)基于属性矩阵的相似性计算方法

不同用户的评分尺寸问题,造成在计算偏好序列时同样会存在差异,所以在计算用户相似性时选择修正的余弦相似性方法。基于用户属性矩阵的相似性计算公式如式(6)所示。

(6)

其中Wic和Wjc是用户i和用户j在属性c上的偏好值,和是用户i和用户j所有属性偏好的平均值,n为属性的个数。

2.实验结果

2.1 数据集

本文是提供的是应用于酒店的推荐系统,由于没有现成的数据集,本文使用的是从携程网(www.ctrip.com)上抓取并整理的。携程网是我国最先进的综合性旅行服务公司,会员酒店的注册量超过3万家,注册的会员用户超过1.4亿,每月的酒店预定量超过1000万/夜。从携程网抓取的数据中筛选出8000条评分数据作为实验数据集,并保证数据集的稀疏等级。

2.2 实验结果

为了检验本文提出的算法的有效性,以传统的总体评分数据集作为对照,使用相同的修正余弦相似性算法,计算其MAE,邻居个数从5增加到20,间隔为5,实验结果如图1所示。

图1 算法比较

3.结束语

本文根据传统的协同过滤在酒店推荐系统的局限性,提出了基于多属性评分的协同过滤算法,并通过实验证实在推荐质量上优于传统的协同过滤算法。因此本文提出的算法可以应用到酒店的推荐系统,甚至其他领域的多属性打分环境中,因而本文的研究具有一定的实际意义。

参考文献

[1]劲旅咨询.2013年中国在线酒店市场研究报告[OL].http://www.ctcnn.com/html/2014-01-14/357805809.htm.

[2]刘鲁,任晓丽.推荐系统研究进展及展望[J].信息系统学报,2008,2(1).

[3]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003(09).

[4]曾子明,张李义.基于多属性决策和协同过滤的智能导购系统[J].武汉大学学报(工学版),2008(2).

基于网络结构的推荐系统 篇7

个性化推荐研究开始于20世纪90年代, 它被作为一个独立的概念提出来, 被认为是当前解决信息超载问题最有效的工具之一。准确、高效的推荐系统可以挖掘用户潜在的消费倾向, 为众多的用户提供个性化服务。

目前, 个性化推荐算法主要包括基于规则的推荐算法、协同过滤推荐算法、基于内容的推荐算法、混合推荐算法以及最近兴起的基于网络结构的推荐算法。本文基于用户-产品二部图网络结构的推荐系统, 建立用户和产品的关联网络, 分别利用Probs和Heats算法产生目标用户未选择产品的排序列表, 并把排名靠前的那些产品推荐给目标用户。Probs解决推荐的准确性问题, 而Heats算法解决推荐的多样性问题。

一、二部图与推荐算法

考虑从一个由m个用户和n个产品构成的推荐系统, 用一个m+n个节点的二部图G (U, O, E) 表示, 其中U={u1, u2, …um}、O={o1, o2, …on}、E={e1, e2, …eg}分别表示用户、产品和连边。Amn是邻接矩阵, 若ui和oj之间有连边, 则元素aij=1, 否则aij=0。

不失一般性, 考虑5个用户、7个产品的二部图网络结构。邻接矩阵为:

若把用户1设为目标用户, 用户1选择过的产品的初始值设为1, 其他设为0。由此得到一个7维矢量f= (0, 1, 1, 0, 1, 0, 1) , 表示针对该个体的资源分配初始构型。显然, 这个初始构型针对不同的用户是不相同的。

产品oα和产品oβ之间的边权wαβ表示产品oβ推荐产品oα的强度, 用户和产品之间的边认为是无权的。在资源分配过程中, 每个产品将自己所有的资源通过二部图的边平均分配给该产品的每个用户;反过来, 每个用户又将自己所有分到的资源再次通过二部图的边平均分配给与之相连的产品。通过上述过程得到最终的资源分配矢量可以表示为:

把目标用户没有看过的所有产品, 按照矢量f'中对应元素的大小进行排序, 排序值越大就说明该用户越喜欢, 排序靠前的产品, 可以推荐给目标用户。

1. Probs算法。任意产品oβ分配给产品oα的资源权重计算公式为:

其中:kul表示用户ul的度, 即与用户ul相连的产品的个数;koβ表示产品oβ的度, 即产品oβ相连的用户的个数;alα为邻接矩阵Amn第l行第α列的值。

图1表示采用Probs算法产品通过二部图进行资源分配的过程。资源分配的过程分两步:第一步是从产品到用户, Probs算法将产品的资源按照产品的度平均分配给每个用户, 分配结果见图1 (b) ;第二步是从用户返回到产品, 用户将所分得资源按照用户的度平均分配给与之相连的产品, 结果见图1 (c) 。通过上述过程得到的最终的资源分配, 按照资源权重的大小进行排序, 得到产品的排序为2, 3, 5, 7, 1, 4, 6。针对目标用户, 除去用户已选择的产品2, 3, 5, 7, 用户未选择的产品排序为1, 4, 6。排序靠前的产品可以推荐给目标用户。

2. Heats算法。任意产品oβ分配给产品oα的资源权重计算公式为:

图2表示采用Heats算法产品通过二部图进行资源分配的过程。与Probs算法不同的是, 第一步Heats算法将产品的资源按照用户的度平均分配给每个用户, 分配结果见图2 (b) ;第二步用户将所分得资源按照产品的度平均分配给与之相连的产品, 结果见图2 (c) 。通过上述过程得到的最终的资源分配, 按照资源权重的大小得到产品的排序为7, 2, 3, 5, 1, 4, 6。除去目标用户已选择的产品, 用户未选择的产品排序为1, 4, 6。由此可见, 两种算法所得到的结果是相同的。

二、结论

本文主要在用户-产品二部图推荐算法的基础上, 分别利用Probs和Heats算法考虑推荐系统的准确性和多样性, 最终得到目标用户未选择产品的排序列表, 排名靠前的产品表示其受用户欢迎程度更高。

参考文献

[1]Zhang G Q, Zhang G Q, Yang Q F, et al.Evolution of the Internet and its cores[J].New Journal of Physics, 2008, 10 (12) :123027

[2]Zhou T, Su R Q, Liu R R, et al.Accurate and diverse recommendations via eliminating redundant correlations[J].New Journal of Physics, 2009, 11 (12) :123008

[3]刘建国, 周涛, 汪秉宏.个性化推荐系统的研究进展[J].自然科学进展, 2009, 19 (1) :1-15

[4]Brin S, Page L.The anatomy of a large-scale hypertextual Web search engine[J].Computer networks and ISDN systems, 1998, 30 (1) :107-117

[5]Kleinberg J M.Authoritative sources in a hyperlinked environment[J].Journal of the ACM (JACM) , 1999, 46 (5) :604-632

个性化图书推荐系统研究 篇8

一用户数据获取

获得用户信息有两种方法:一种是显示获取, 一种是隐式获取;其中第一种方式获取用户信息是目前最常用的一种方法。显示获取就是通过用户注册信息和用户对网络资源的显示评分来获取用户可能感兴趣的信息特征。隐式获取就是以web数据挖掘、人工智能等技术辅助获取用户浏览网页的相关信息。通过用户浏览记录提取用户的兴趣和爱好, 并将用户的偏好转化为结构化数据并存储在数据库中。信息获取过程, 用户无需参与, 能够获取很多用户兴趣偏好的反馈信息。但是隐式获取用户信息, 由于没有用户的主动参与, 所以存在很多随机性和不确定性。

豆瓣是中国最富盛名的评论和社交网站, 上面有大量用户的读书行为数据。对于一个用户来讲, 其有关读书的行为数据包括已读、浏览等类型, 一旦某本图书出现在已读、浏览两者之一的列表中, 我们就认为用户对这本书感兴趣, 我们的目的就是获取用户这样的行为数据, 并利用这样的数据来衡量推荐系统的质量。我们利用网络爬虫从豆瓣上抓取用户以及该用户的读书记录, 并将结果保存到数据库当中。

二图书文本预处理

当前, 在处理文本信息的过程中, 一般情况下, 选取词作为文本的特征项表现要优于选择词组或者字。因此, 本文选择使用词作为文本的特征项。我们首先将小说文本分成词, 由这些词组成向量元素来表示文本。但是, 我们使用中文分词器切分词条时, 经常含有大量的单个独立字, 这些独立字不仅携带信息量较少, 而且对文本分类的准确性和处理效率产生极大影响。因此, 我们在进行文本分词时, 首先要过滤单个独立字。此外, 一些数学符号以及英文字符对文本分类贡献极小, 可以忽略。最后, 需要过滤掉纯英文词条。经过上述预处理过程, 可以有效地降低文本词条向量的维数。提高文本特征向量的中文纯度。图书文本预处理实现过程如图1。

图书文本预处理后, 就可以把表示为相应的特征向量, 假设我们通过特征抽取技术抽取到的特征词个数为M, 第i个特征词表示为Ti, 那么一本图书文本表示为:{WT1, WT2, …, WTM}, 其中WTi表示特征词的权重。权重计算通常采用TF-IDF方法。

三图书文本相似度计算

本文采用向量空间模型来计算图书之间的相似性。向量空间模型 (VSM) 是由Salton等人于上个世纪60年代提出的, 目前

在信息检索、知识挖掘等领域都有着广泛的应用。其基本思想是将图书看成是由彼此之间相互独立的一个个词组成的, 即上文所说的特征向量, 同时根据每个词在文档中的重要程度为其赋予一定的权重, 即上文所说的词频-反文档频率, 这样就可以将一本图书表示为 (ω1, ω2, …, ωn) 这样的向量形式。进而我们可以用如下的公式来计算两本图书之间的相似性。其中Ti表示文本i的特征向量, T1, i表示文本1的第i个特征词对应的权重。

四图书推荐

当用户浏览网页时, 我们可以根据用户历史的浏览记录, 计算出用户的可能的兴趣爱好, 并把用户的图书浏览记录利用特征抽取技术抽取成特征向量, 然后和网络图书相比较, 通过计算图书之间的文本相似度, 把最相似的前5本图书推荐给用户。至此, 我们的图书推荐系统构建完毕。图书推荐系统流程图如下图。

五总结

本文构建了一个基于内容的图书推荐系统, 通过用户行为数据获取, 图书文本向量提取技术, 以及图书相似度计算对用户进行图书推荐, 实现了图书推荐的个性化和准确性的统一。

参考文献

[1]刘建国, 周涛, 汪秉宏.个性化推荐系统的研究进展[J].自然科学进展, 2009, 19 (1) :1-15

推荐系统中在线特征提取研究 篇9

推荐系统具有非常广阔的用户群体, 人们已经逐渐从传统的全文搜索方式转变到智能结果排序的方式, 推荐系统能够根据用户的喜好对查询内容进行智能筛选和排序。 推荐系统最重要的内容是对用户的兴趣的提取, 并能够将这种实时兴趣的变化反馈到结果的筛选和排序上, 推荐引擎作为一种在线推荐的形态, 需要对用户的特征进行在线提取和分析, 这是推荐引擎的要义, 主要针对推荐引擎中在线特征的提取进行研究。

1在线处理工具

数据实时性的重要性已经在各类系统中凸显出来, 为了保证用户的相关数据能够在用户接口层进行实时提取和分析, 各类型的在线存储和处理工具产生。

(1) HBase在线数据库。 HBase是一种分布式环境下的在线数据存储平台, 它是伴随着分布式系统的发展而共同发展。 HBase作为一种分布式环境下的数据存储环境, 能够支持大数据量的数据写入和查询并能够保持较高的系统性能。 HBase的表结构如图1所示。

HBase通过API的方式能够为应用程序提供接口对HBase底层的数据存储进行操作而无须了解底层存储的内部细节, 能够将应用开发和数据存储分离, 这种API的访问模式在用户数据的在线提取分析并存储的过程中优势尤为明显, 能够快速地将用户的数据保存下来而不会对整体的系统性能造成影响, 推荐系统可以针对保存下来的数据进行离线分析, 能够很大程度上将在线数据存储和数据分析分离。

HBase在线数据库不仅在在线数据存储方面有很大优势, 本身作为数据库工具在数据的离线处理方面也同样适用。 HBase的数据存储基于分布式文件系统, 能够集成Hadoop工作环境, 能够对HBase内部数据进行Map Reduce计算。 大量的特征数据分析都需要离线做大量的数据处理和分析, 包括对清洗数据的模型训练等。

(2) Storm实时流处理工具。 Storm实时流处理工具最早由Twitter提出, 因Twitter业务上需要对用户高频发情况下的用户推文信息做在线处理, Storm消息流处理工具正是在这种环境下被研发并投入使用。

Storm同样是一种分布式环境下消息流处理工具。 国内的微博同样在应用上大量采用了Storm, Storm能够聚合多种数据源, 并能够将多种数据源进行聚合做在线处理, Storm在数据的处理性能上具有非常明显优势, 它不像Hadoop作为一种离线的数据处理方式, Storm更主要地作为在线的消息队列处理工具。 更重要的Storm是分布式实时数据处理工具, 它能够和很多分布式处理框架相结合, Storm能够实时将数据写入到HDFS上, 也能够作为一些实时流处理工具的输入数据源, 比如spark streaming的在线处理能够以Storm作为数据处理源。

(3) Message Queue消息队列工具。 Message Queue是一种消息队列的存储和处理工具, 它作为信息的载体能够承载信息流的传递和处理。 HBase作为一种数据在线写入形态, 可能会对底层存储产生过高的负载, 因为数据存储单元可能同时面临数据查询的任务, 这会导致数据块整体的存储和查询效率降低。 此处Message Queue可以作为一种很好的中间层来平衡这之间的性能差异。 HBase可以直接将数据写入Message- Queue进行缓存, Message Queue通过控制消费速率的方式来保证对底层数据存储块的压力。 此处的Message Queue是作为缓冲池的作用存在, 能够缓解数据写入速率和数据存储块访问不均衡性带来的系统性能问题。

(4) Redis和Memecache在线存储工具。 Redis和Meme- cache作为数据的存储单元具有非常高的性能, 其数据写入速率比HBase更快。 Memecache是一种纯内存的数据存储工具, 因为是内存型数据库, 因此具有非常高效的数据存储和访问效率。 这两种工具不仅在特征的在线提取时具有非常重要的意义, 在实际的数据推荐时也同样有很大的应用场景, 基于协同过滤的方式对用户进行推荐时, 需要保存用户和项目大量的KV信息, 这对于Redis和Memecache是很好的应用场景。 Redis和Memecache和区别主要在数据的保存上, Redis并非一种纯内存型的数据库, 它是通过有选择性地将内存中数据刷写到磁盘上, 因此当机器断电等状态时, 数据能够通过磁盘进行恢复, 相反, Memecache这种纯内存型数据库断电后数据会全部丢失。

2特征提取方法

推荐系统作为一种在线推荐形态, 对各种数据的实时性要求非常高。 用户特征的实时提取作为整个推荐系统的第一步具有非常重要的意义。 特征包括用户维度的特征和内容本身维度的特征两个方面。

用户维度的特征包括用户历史特征信息以及用户当前推荐环境下的实时特征信息。 用户历史特征可以通过对用户历史行为进行分析提取获得, 用户实时特征数据通过需要一些在线分析, 比如用户当前浏览了某一件商品, 需要将当前商品映射到用户的某个兴趣维度上, 评论信息和购买信息等都是用户实时特征的反映, 这些实时信息在用户使用推荐系统时尤为重要, 需要将用户每次的实时行为都提取并反馈到用户特征维度上, 通常用户行为的提取等可以通过Storm实时流接入, 在Storm实时流内部对接入的用户行为进行分析并快速映射到用户特征维度上。 商品信息维度的特征相对则较为固定, 每次可根据推荐的预筛选内容对内容维度的特征进行实时提取, 内容维度的特征同样需要在线实时分析, 同样可以采用Storm的方式分析处理。 因为需要保存用户的全量的原始特征数据, 可将用户维度的原始特征数据以Redis方式存储来保存特征访问时的时间效率。

推荐系统中存在多种维度的特征, 用户维度和项目维度的一些简单特征可以很简单地完成, 某些深层次的特征则并非通过简单的Storm数据流就可以完成。 以用户维度为例, 在对用户推荐时, 可能需要依赖历史其他用户对该用户的评价信息, 这其实是需要实时地处理历史到当前大量数据量, 通常对于此种情况, 可以保留用户历史当前某个时间点的全量数据, 当该用户在新的时间被新用户新增评价时, 可将新增加的评价信息去更新全量数据来保证用户特征数据的鲜活性。 对内容维度存在同样的问题, 在推荐系统中对用户推荐的依据实际上可以理解为用户对商品的CTR预估, 商品维度上历史CTR信息是一个非常重要的特征, 它反映了该商品历史的点击情况, 历史CTR信息作为深层的特征信息, 需要对该商品历史的数据做全量分析。

3结语

分析了当前推荐系统的主要应用场景, 作为时下各大平台检索通道中主要业务支撑对象, 提高推荐系统的推荐准确率能够给平台带了极大的经济效益。 推荐系统是用户和平台之间的接口, 用户通过推荐系统能够直接感知平台的体验, 在推荐系统的整体架构分析中, 在线特征的分析提取是整个推荐系统的核心, 分析时下各个主流的在线信息处理工具, 并分析了在推荐系统的特征提取环节如何将各个工具应用到具体的特征提取中。

摘要:推荐系统作为目前主流的推荐形态已经在各大平台上获得了广泛应用。推荐系统最核心的要求是实时性,推荐系统的存在形态是一种实时在线的推荐方式,能够根据用户的动态兴趣变化实时调整推荐结果和推荐顺序,因此用户实时的兴趣变化捕捉和分析尤为重要。

关键词:推荐系统,在线推荐,特征提取

参考文献

[1]朱小琴.基于Apriori算法的个性化电影推荐系统设计与实现[J].九江学院学报(自然科学版),2016,01:84-86+119.

[2]海本斋,解瑞云.基于贝叶斯网络的上下文推荐算法[J].计算机科学,2014,07:275-278.

[3]杜静,段会川.基于上下文的智能应用推荐系统架构设计[J].信息技术与信息化,2008,05:38-40+43.

[4]焦亚琴,刘晓云,张银叶.基于Mahout的个性化电子商务推荐系统研究[J].电脑知识与技术,2015,11:261-264.

广电智能推荐系统的应用研究 篇10

1 智能推荐系统概述

1.1 智能推荐系统的基本框架

智能推荐系统是一种建立在海量数据挖掘的平台,通过收集并分析用户大量的行为日志,根据用户的偏好,推荐具有高度针对性的信息。帮助用户发现对自己有价值的信息的同时也能让信息展现在对其感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢[1]。

图1是一个智能推荐系统的基本框架图。

智能推荐系统输入变量主要分为3个维度:

1)用户维度,包括人口统计学特征、用户兴趣爱好、用户行为等。

2)物品维度,包括物品的属性(关键字、特征描述等)、当前热门程度、平均分等。

3)时间维度,包括季节、观看时段、时间间隔。

用户自身兴趣和关注点是随着时间推移不断变化的,关注用户近期行为最能体现其目前的兴趣,同时物品的热度也会随时间发生变化。用户通过推荐系统给出推荐列表去访问信息,并将反馈信息传递给智能推荐系统。推荐系统能够实时响应用户的反馈,个性化地调整推荐列表,从而满足用户不断变化的兴趣。

1.2 智能推荐系统的核心算法

1)经典推荐算法

智能推荐系统的核心是推荐算法,算法的优劣决定着推荐系统的性能[2]。当前随着用户对推荐系统的需求不断增长,很多经典的推荐算法被广泛应用。协同过滤(Collaborative Filtering-based)推荐算法主要是利用对用户历史行为的分析,寻找具有类似行为或兴趣的用户和其感兴趣的物品,找到用户或物品之间的相关性,然后基于这些相关性进行建议推荐。基于内容(Content-based)推荐算法则不需要用户对物品的评价,通过分析用户浏览物品的特征,向用户推荐与这些物品特征相似的物品。这些经典的推荐算法主要研究对象主要是用户和物品,通过比较二维矩阵中相似度来推荐。这些推荐算法也分别存在一些问题,例如协同过滤推荐存在冷启动、数据稀疏、新颖性方面表现不佳,而基于内容推荐则存在物品特征较难抽取、计算复杂、无法满足即时推荐的要求等问题。

2)推荐算法的改进

近几年随着应用的推广和研究的深入,许多新的或者改进的推荐算法被相继提出。为提高用户的兴趣和物品之间的联系,引入基于标签的推荐算法可以深入了解用户行为,指导并改进推荐系统的推荐质量。文献[3]总结了国内外基于标签的推荐研究成果,利用基于图论、基于聚类的标签推荐来描述“用户-标签-物品”的三元关系,提高了推荐的准确率和新颖度。随着Web2.0的发展,很多网站都利用Facebook的社交网络数据给用户提供社会化的推荐。基于社交网络的推荐算法受到关注和应用,文献[4]通过研究社交网络的社会关系、兴趣传播、信任传递、时间等因素,建立社交网络用户兴趣模型,结合个人兴趣和兴趣传播两方面信息对目标用户进行准确的推荐,提高了推荐的质量。推荐系统中引入时间维度,让推荐系统能够准确预测用户在某个特定时间的兴趣。用户兴趣不断变化,推荐系统能够实时响应用户的新行为,让推荐列表不断变化,以此提高推荐效果。文献[5]提出一种计算用户评价时间与项目发布时间的时间间隔,根据用户时间权重值的大小,可以判断该用户是积极用户还是消极用户,以及用户对新项目的偏好程度的方法,能够较好地解决冷启动问题。文献[6]先在传统协同过滤算法的基础上,通过引入反映人们遗忘规律的艾宾浩斯遗忘曲线,提出一种基于时间效应的改进协同过滤推荐算法,并通过引入时效性集合的概念对数据进行预过滤,提升了推荐的准确度。

广电业务应用中用户的偏好矩阵远远小于未观看的物品矩阵,使用基于物品的协同过滤算法会影响推荐系统的性能。基于用户的协同过滤推荐则主要是给用户推荐和他兴趣相似的其他用户喜欢的物品。加入时间信息后,相似用户最近的兴趣显然比很久之前的兴趣更加接近被推荐用户当前的兴趣。利用加入时间衰减函数的改进皮尔逊相关系数测出两个用户的相似度,时间衰减项越小,代表用户之间产生这一行为的时间相隔越远,两个用户的兴趣相似度就会越小。

因电视的操作交互界面受到限制,推荐数量不宜太多。时间变化的推荐系统里,需要建立的是动态的推荐列表,并且提高推荐的精确性。文献[7]提出了一种比较物品推荐数量和推荐评分的“数量-分数曲线”,如图2所示。在“数量-分数曲线”中通过寻找拐点找到划分推荐评级和推荐数量的最佳平衡点。

2 智能推荐系统在广电业务中的应用

广播电视媒体的发展已经进入融合时代,生产制作的节目其传播渠道和呈现方式也不局限于传统的广播电视,还包括互联网、移动终端APP、社交应用等。在融合媒体时代,内容、渠道、用户三者关系发生了根本的变化。生产制作域的融合和终端传播域的分化,形成了新型的传播模式。海量的媒体产品进行汇聚,再分流给多种终端,由用户根据所需进行个性化配置。用户希望精准迅速、随时随地获得需要的内容。在整个传播体系中,用户占据着主导的地位。随着用户需求和传播渠道的变化,广电媒体平台在提供海量内容的同时,还要提供丰富的服务。从服务的角度看,就是要更注重与观众的交互,分析掌握观众的个性化需求,才能真正把受众变为用户。智能推荐是为用户提供个性化服务的关键,也是媒体融合的一个重要体现。

广电智能推荐系统的智能性体现在主动发现当前或潜在的用户需求,根据用户历史行为记录的积累分析以及对媒体和应用内容的价值评估和热度评估,将用户信息与内容信息进行智能关联与匹配,预测用户可能感兴趣的内容资源信息。预测分析结果输出为智能推荐策略,包括共性化内容推荐策略和个性化内容推荐策略。共性化内容包括热点关注资源、根据收视情况统计出来的预计热门媒体和应用内容、根据相关媒体宣传需要与用户关注情况得出的热点聚焦内容等,同时也包括运营商推荐内容,如时事要闻、重点推荐等。个性化内容是在用户历史行为分析积累的基础上得出的用户当前或潜在的内容资源需求。为了准确把握用户的需求,可用于分析的信息包括用户基本信息如年龄、性别、爱好等,由用户行为的统计信息能够刻画用户的收视习惯,由观看内容信息和社交关系的分析可以获得用户的兴趣。

广电的主要应用场景是家庭环境,通过多人家庭用户的收视行为分析产生对个人的个性化推荐服务一直是广电推荐业务的难点[8]。融合媒体时代的内容传播模式是立体的、全方位的,包括大量的用户互动、参与,如“摇电视”、“伴随客户端”等形式,用户也会通过微信、微博公众号等方式关注,甚至参加线下活动。因此广电业务需要构建全方位的信息采集和大数据分析,将传统广电渠道和互联网渠道的数据打通,形成智能化的应用。

广电智能推荐应用除了形成内容与用户之间的适配,还需要形成内容与终端的适配。全媒体的业务分别在机顶盒、个人PC、手机、平板PC、互联网电视等终端呈现。不同的终端对应着不同的发布渠道、传播过程和展现形式。推荐系统需要识别终端类型与终端能力,建立用户信息关联和用户终端设备可管理机制,实现跨媒体的立体式服务。

针对智能推荐系统在广电中的应用,设计出广电智能推荐应用系统架构如图3所示。

广电智能引擎推荐系统由如下7个方面组成:

1)用户与广电系统的交互接口:智能推荐系统通过该交互接口收集用户的基本信息和行为记录,同时用户可以通过该交互接口获取个性推荐结果。

2)移动端APP:在移动端方面,设置用户关联账号,用户可以通过移动端登录广电网络的平台,订阅自己喜欢的频道或者节目,用户可以随时随地获得心仪的节目推荐和节目预告。用户行为收集方面,数据的来源不仅限于广电网络,用户通过手机、平板等移动端设备参与互动、评价等活动是获取用户个性化信息的关键组成部分。利用语义分析等技术处理用户的主观评价数据,追踪用户分享、转发到社交应用的信息,可以更准确地把握用户的偏好和需求。

3)用户行为数据库:该数据库用于存储用户在使用广电和移动端中的各种行为记录,例如浏览记录、播放记录、具体的时间长短与播放时段,进行降噪和归一化工作以及云端存储,可供深度挖掘的原始数据资源。

4)用户建模:推荐系统根据用户注册信息、历史行为数据,进行数据挖掘,为用户建模,例如用户年龄、职业、爱好、社交网络关系等,同时也根据推荐对象的相关信息来构造对象模型[9]。

5)第三方信息平台:视频节目标签特征提取也可以通过关联互联网的第三方平台,例如国内的豆瓣、时光网;用户标签基于社交网络,例如微博、微信、博客、QQ,在这些社交网站中,每个用户都有自己的个性化信息墙,从中提取用户标签较为方便。

6)视频节目资源库:视频节目资源数据库的核心是视频资源信息采集分类工作。数据采集量大,利用大数据、云计算等技术,通过网络信息爬虫抓取,模板建立进行标签识别,从而抓取到准确的影视元数据。可引入对视频内容的画面分析识别,深入挖掘出视频节目背后具体的对象,例如一些商品、地名、人物等。

7)智能推荐引擎:利用用户已构建好的模型和视频资源信息特征作为输入,通过智能推荐引擎的核心算法,输出个性推荐列表返回给用户。考虑到广电业务中电视节目视频的数据量庞大,数据相对不够稳定,内容需频繁更新,故选择时间融合基于用户的协同过滤推荐,引入时间效应,可以保证用户每天收到的推荐是不一样的,保持推荐结果的新颖性和多样性,同时可以控制在一段时间内热门的视频节目,防止用户过于跟风。单一的推荐算法并不能发挥推荐系统应有的效果,可以引入近几年兴起的基于标签的推荐、基于社交网络的推荐,提高推荐算法的效率。Netflix从2006年起开始举办Netflix Prize推荐算法设计大赛[1],有很多选手综合采用多种推荐算法去改进推荐结果,得到混合推荐算法,从而达到更好的推荐效果。

3 总结与展望

为适应传统媒体和新兴媒体业务融合发展,广电需要建立开放的、融合的、智能的推荐系统架构。广电智能推荐系统对内容、渠道、用户三方面进行统一数据收集、信息管理、深度挖掘,从而识别用户共性化和个性化需求,承载多样化媒体业务新形态。同时广电智能推荐系统存在一些难点,主要包括直播节目元数据关联、用户安全隐私、家庭用户兴趣偏好分析等问题。这些难点需要进一步深入研究。

本文设计了针对广电业务的智能推荐应用系统框架,并对未来的研究方向进行构想。广电智能推荐系统是家庭智能化的重要组成部分,服务于运营,通过媒体与用户之间的双向交流,站在用户的角度为其提供定制服务。通过媒体融合的应用场景和相关技术,把视频内容与其背后蕴藏的丰富信息进行深度关联、精准传播。通过智能化平台的建设,识别用户共性、个性化的需求,利用内容整合、网络融合,为用户高效率、高质量、立体化地提供其真正需要的内容服务,以此提高广电运营在未来的竞争力。

参考文献

[1]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.

[2]陈萌,杨成,王欢,等.交互式电视中个性化推荐系统的研究[J].电视技术,2012,36(14):37-40.

[3]易明,邓卫华.基于标签的个性化信息推荐研究综述[J].情报理论与实践,2011,34(3):126-128.

[4]邢星.社交网络个性化推荐方法研究[D].大连:大连海事大学,2013.

[5]于洪,李俊华.一种解决新项目冷启动问题的推荐算法[J].软件学报,2015,26(6):1395-1408.

[6]基于时间效应和用户兴趣变化的改进推荐算法研究[D].北京:北京邮电大学,2014.

[7]HIROI K,MORITA H.High-accuracy time-variant recommender system with number-score curve[C]//2014 IEEE Fourth International Conference on Consumer Electronics Berlin(ICCE-Berlin).[S.l.]:IEEE Press,2014:106-110.

[8]李培琳,赵明,王炳飞.广电家庭用户个性化推荐的难点和解决思路[J].电视技术,2015,39(18):33-35.

推荐系统 篇11

关键词:云计算;技术;个性化;系统

中图分类号: TP3 文献标识码: A 文章编号: 1673-1069(2016)32-166-2

0 引言

如今,互联网技术的深入发展,开始与各个领域实现有机融合,更多的人开始参与到在线购物、社交网络等网络活动中,网络给人们提供了一个无限的信息资源空间,这个资源库中包含了各式各样的信息,随之发展起来的信息检索技术便捷了人们对信息的搜索需求,搜索引擎成为用户获取信息的主要渠道,但该技术无法为用户提供个性化的兴趣服务,这就需要建立基于云计算的个性化推荐系统,这也是本文所要分析的主要内容。

1 云计算技术与个性化推荐系统概述

1.1 云计算技术

云计算技术依托的是互联网,将互联网的相关服务以动态化、易扩展、虚拟化的资源提供给用户。云计算的定义有很多种,目前较为认可的是云计算技术是根据用户使用量来进行相应交易的计算模式,云计算能够为用户提供便捷、按需的网络访问,进入网络、服务器、应用软件等可配置的计算资源共享区域,这些可以快速提供的资源,无须进行过多的管理,并与服务供应商交互不多[1]。云计算平台所拥有的超强计算能力,可以应用在模拟核爆炸、预测市场发展趋势及气候变化等活动中。

1.2 个性化推荐系统

推荐系统就是结合用户或顾客的购买行为规律以及兴趣特点来推荐相应的信息或商品,使用户满意。现如今,电子商务发展态势迅猛,商品的种类和数量与日俱增,网络信息是冗杂的,用户或顾客需要花费大量的时间找寻目标信息与商品,信息过载问题直接影响了用户或顾客的满意度,导致用户的流失。个性化推荐系统在此形势下应运而生,所谓个性化推荐系统是利用海量数据挖掘技术,通过云计算平台构建的一种高级商务智能平台,主要服务于网站,为用户提供完全个性化的决策支持和信息服务[2]。

2 基于云计算技术的个性化推荐系统分析

2.1 推荐算法与推荐策略

2.1.1 推荐算法

推荐系统利用各个网页间、网页与关键词之间的粗粒度关联和排序,实现为用户推荐相应信息与商品的服务。随着系统的不断发展,其也开始利用网络化计算能力,注重用户兴趣与模型的分析,而个性化推荐系统是在推荐系统的基础上建立的更高级的信息导向系统。个性化推荐系统的构建需要推荐算法的支持,常用的有协同过滤推荐算法、基于内容的推荐算法、关联规则推荐算法、混合推荐算法等。其中协同过滤推荐算法还可以细分,根据不同的算法特征分为基于用户的推荐算法(也叫作基于存储的算法、基于邻居的算法)、基于项目的推荐算法、基于模型的推荐算法等。这些推荐算法都具有自身的优缺点(详见表1),为了弥补各类推荐算法的缺陷,可以将两种互补的算法结合起来[3]。例如基于内容的算法和协同过滤算法这两种算法,我们可以为用户直接展示用不同算法得出的推荐结果集,也可以先用第一种算法得出一种结果集,再用第二种算法计算第一种结果集,进而得到更加精确的结果,更好地满足用户的需求。

2.1.2 推荐策略

以往许多的推荐系统都是结合单一的推荐算法和推荐策略建立的,在使用的过程中逐步暴露除了系统个性化与适应性方面的缺陷,无法结合实际的应用优化推荐策略。因此,在构建个性化推荐系统时要充分结合当下推荐系统的优势以及瞬息万变的市场需求,制定出综合化、系统化、合理化、可行性较高的推荐策略。

前文分析了各类推荐算法的优缺点及应用场景,基于此,本文提出的个性化推荐系统中应用的推荐策略是根据推荐系统数据量的大小制定的,当数据量偏小时系统会采用传统的个性化推荐算法;当数据量偏大时系统会利用云计算平台进行计算,具体就是将数据集发送到云平台的各个节点来实现多节点分布式大规模数据计算。

2.2 系统架构及流程设计

2.2.1 系统架构

云计算技术集成了分布式计算、网格计算、并行计算和网络存储等先进的技术,其有机整合了多个经济性较好的计算实体,逐步形成了具有超强计算能力的分布式系统。为了充分发挥出云计算技术的优势,本文设计的基于Google云计算平台的个性化推荐系统架构如图1所示,该系统能够对大规模数据进行快速、准确地处理,并且可以根据业务规模的不断扩大进行相应的拓展,充分展示了较高的通用性与扩展性[4]。

基于云计算技术的个性化推荐系统主要包括以下几部分:①推荐计算子系统,该子系统由数据预处理模块、数据挖掘模块、推荐模块组成,其中数据预处理模块的功能包括异构数据的过滤、统计、转换等;数据挖掘模块主要是计算推荐结果的聚类,需要充分利用聚类、关联规则算法进行分别计算;推荐模块则是利用各类算法计算出精准的推荐结果,已达到用户的需求。②业务应用子系统,该子系统主要是为后期的系统扩展服务,根据业务需求的变化转变系统的功能,并为系统需求制定合理的推荐规则。③基础云计算平台,其充分利用集群提供的大容量计算能力,在不同节点上进行大量的计算。

2.2.2 个性化推荐系统的操作流程

本系统的推荐流程是依据Map Reduce软件架构,其是处理海量数据的并行编程模式,主要适合应用于大规模数据集的并行运算,其封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供可以把大容量的计算自动并发和分布执行的简单通用接口。具体如图2所示[5]。

3 结束语

综上所述,开发设计基于云计算技术的个性化推荐系统是适应时代发展需求的,其能够更好地满足和引导用户信息需求。本文设计的系统还不完善,还需在以后的运行实践过程中不断的改进。

参 考 文 献

[1] 肖理钏.基于云计算模式的图书文献个性化推荐技术研究[J].科技广场,2015(08):22-27.

[2] 應毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111-117.

[3] 谷瑞.基于云计算的个性化推荐系统的研究[J].苏州市职业大学学报,2013(04):14-16+21.

[4] 朱夏,宋爱波,东方,罗军舟.云计算环境下基于协同过滤的个性化推荐机制[J].计算机研究与发展,2014,10:2255-2269.

基于协同过滤技术的推荐系统综述 篇12

随着电子商务和Web在线服务的迅速发展,信息搜索和选择变得越来越迫切。面对海量的商品数据,用户对于选择哪一种商品有些困惑,因为他们可能没有足够的知识和时间对这些可供选择的商品进行一一评价。推荐系统是电子商务中最流行和最得力的工具之一,它可以有效地帮助在线用户处理信息过载的问题。推荐系统可以根据用户的历史访问记录和个人喜好来预测最适合用户的商品清单。为了更好地提供个性化推荐,研究者们提供了各种算法和方法。

目前推荐系统主要分为三类。(1)基于内容的推荐:它根据用户过去喜欢的产品,为用户推荐和他过去喜欢的产品相似的产品。(2)协同过滤:使用其他用户的意见评估某一件产品。协同过滤技术收集大量关于用户行为信息,历史记录,点击模式,根据用户之间的相似性把其他用户喜欢的产品推荐给该用户。(3)混合方法:结合了不同的过滤方法。比如基于内容的推荐系统,基于人口统计学的推荐系统,基于效用的推荐系统和基于基础知识的推荐系统。

本文首先对协同过滤推荐算法进行了分析,其次指出协同过滤算法存在的挑战,再者总结相关工作,最后进行了总结。

2 协同过滤推荐算法

在推荐系统中协同过滤算法被广泛的应用。例如基于内存的(Memory-based)协同的过滤算法已经部署到Amazon的商业系统中(http://www.amazon.com/)。

2.1 基于内存的协同过滤算法根据最近邻居算法被分为两类

2.1.1 基于项目的协同过滤算法

基于项目的协同过滤算法主要关注最相似的项目。主要思想是用户对于相似的项目具有相似的看法。基于项目的协同过滤技术克服了用户的冷启动问题,并且提高了可扩展性。

算法思想:(1)项目k,用户h还没有做出选择;项目m,用户h已经选择了;(2)计算k和m之间的相似度c(利用Pearson相关相似性或者余弦相似性);(3)根据相似度c为用户h推荐项目k,返回相似度最高的前N个项目。

2.1.2 基于用户的协同过滤算法

基于用户的协同过滤算法主要关注最相似的用户。基于用户协同过滤算法的推荐系统根据相似用户即最近邻居的评分进行预测。

算法思想:(1)对于任一的物品k,用户u还没有做出选择;对于任一的用户v,他已经选择了物品k;(2)计算用户u和v之间的相似度c(利用利用Pearson相关相似性或者余弦相似性);(3)根据相似度c为用户u添加物品k,并返回相似度最高的前N个物品。

2.2 基于模型的协同过滤算法

基于模型的协同过滤算法是基于学习模型。它通过分析训练数据,总结学习模型,然后通过学习模型进行预测。基于模型的协同过滤算法也主要分为两类。

2.2.1 聚类模型

多项式混合模型也被称为聚类模型,其中所述概率是有条件从参与投票的C类变量获得几个相对小的离散数字。在某些类中,不再考虑哪些涉及到不相关项目的偏好,聚类模型定义了选票的联合概率,类的边缘概率,以及条件分布概率。

Pr(Vi|C=C)=从用户选票的训练数据中计算选票条件概率。

2.2.2 贝叶斯模型

贝叶斯模型是在一个有向无环图中,这个模型在一个三元体<M.D,@>,M表示随机变量,D表示有向弧,@表示条件概率表明确了有多少个节点依赖于它的父节点。

3 特点和挑战

3.1 数据稀疏

随着电子商务系统规模的扩大,用户数据和项目数据急剧增加,使得用户-项目矩阵出现极端稀疏性,从而导致推荐系统的质量下降。数据稀疏问题也叫“冷启动”问题,当系统中新增加一个用户或者项目,由于没有足够的用户和项目信息,所以很难找到它的最近邻居,对于新用户,因为缺乏评分记录和历史购买记录从而不能给出很好的推荐。

3.2 可扩展性

用户和项目的急剧增长,传统的协同过滤算法将会面临严重的扩展性问题,因为计算资源超过了实际的可接受水平。例如千万级的用户(M)和百万级的项目(N),协同过滤算法的复杂度为O(n)已经很大了,然而,很多系统需要根据用户在线需求立即做出推荐,而不管他们的购买记录和历史评分,这就需要一个具有很高扩展性的协同过滤系统。

3.3 同义词问题

一些推荐系统会因为名字的不同把项目分成了不同的种类。

3.4 特殊用户问题

特殊用户是指他们的观点和大部分人们的观点不一致,因此他们不能受益于协同过滤。

4 相关工作

回顾一下我们的研究工作表明,为了更好地做好推荐系统,研究者们使用了各种各样的协同技术,比如个性化协同过滤,基于用户的协同过滤,基于项目的协同过滤等等。当然,协同过滤的一些缺点比如冷启动,数据稀疏,可扩展性也被发现和克服。Yechun Jiang等讨论了个性化协同过滤在Web服务推荐中的应用。计算相似性是Web服务推荐技术中的主要部分,利用相似度,一种行之有效的混合协同过滤技术被提了出来,它集成了基于用户的协同过滤算法和基于项目的协同过滤算法,并且他们利用真实的Web服务数据集WSRec做了实验,其中数据集包括150位用户的超过150万条测试结果,这些用户是来自100个公开的Web服务遍布世界各地的不同的国家。这个实验结果表明这种方法大大增加了推荐质量。Anand Shanker等为学生阅读设计了在线图书推荐系统,它是根据图书的价格和出版社的名字为学生推荐图书,结合了基于用户的协同过滤的特点和关联规则挖掘。该推荐系统采取离线模式把学生的Web文件存储起来,首先系统扫描买家文件记录找到买家之前买的图书种类,比如小说、教科书、参考书等,然后找到它的子类,例如第一级类别是教育方面的,那么它的子类别可能是计算机数据结构、操作系统等,第三步对事物数据库应用关联规则得出图书列表,第四步把基于用户的协同过滤技术应用在第三步得到的图书列表为目标用户推荐前N项图书。

Jyoti Gupta and Jayant Gadge运用协同过滤算法为用户做推荐,在这个系统中是利用其它用户的评分进行推荐,他们解决了协同过滤算法所面临的稀疏性、可扩展性和冷启动的问题。项目相似度和用户集群离线计算,从而具有可扩展性。当一个用户的可用评分比较少时一种自适应加权方案将提高预测的质量,它是使用基于用户集群的人口统计为用户赋予更高的权值。比如一个新用户,为基于项目的协同过滤增加权重作为用户的可用评分项,这是一个可扩展的解决方案并且解决了用户的冷启动问题。

ZhichaoQuan在他的研究中利用用户个性改进用户模型,提出了两个基于个性的协同过滤算法:第一个是从用户的个性角度计算用户相似性,并选择最近邻,然后进行推荐;第二个是使用个性项目评分矩阵,然后为目标用户做出推荐。因为人的性格比较稳定,所以基于人的个性的推荐也比较稳定,这就避免传统用户模型的频繁更新问题,大大减少了计算成本。如果能够很好地获得用户个性,那将不再有冷启动的问题,传统的协同过滤推荐项目的数量过大,而在所提出的方法中,个性因素在数量上比较少,也不随时间的变化而变化,这在一定程度上缓解了稀疏性问题。这种方法的缺点是:在推荐之前必须得到用户的特征,这会增加推荐系统的工作,如果没有最好的方式来获得新用户的特性,“冷启动”问题就会发生。所以当新用户进来时,如果没有准确获得用户特征,那么就要利用他们的兴趣爱好挖掘出特征,然后做出推荐。

5 结束语

上一篇:创伤性蛛网膜下腔出血下一篇:抑制作用