电子商务推荐系统

2024-06-10

电子商务推荐系统(精选12篇)

电子商务推荐系统 篇1

(一) 电子商务推荐系统及构成

随着互联网的普及和电子商务的发展, 商品推荐系统逐渐成为电子商务系统的一个重要研究内容之一。由于它能帮助客户发现他们想要的商品, 方便了用户, 提高了营销效果, 因此在电子商务中获得了巨大的成功。由于具有很强的实用性, 因此, 目前几乎所有大型的电子商务系统都不同程度地使用了各种形式的推荐系统。电子商务中的推荐系统首先从客户那里获得客户所喜爱的产品信息, 然后向他推荐可能满足需要的商品。其过程类似销售人员帮助客户完成购买过程。其作用主要表现在三个方面:将电子商务网站的浏览者转变为购买者;提高电子商务网站的交叉销售能力;提高客户对电子商务网站的忠诚度。从层次结构看, 电子商务推荐系统可以分为三部分:输入功能模块、推荐方法模块与输出功能模块。

1. 输入功能模块。

包括隐式浏览输入、显式浏览输入、客户数值评分输入、客户文本评价输入、关键词和客户购买历史以及项目属性输入等;隐式浏览输入就是在客户不知情的情况下将客户访问电子商务系统的浏览行为作为推荐系统的输入。显式浏览输入则是有目的地向电子商务推荐系统提供自己的兴趣爱好。客户数值评分输入, 就是将客户对商品的数值评分数据作为推荐系统的输入。客户文本评价输入, 是客户对已经购买的商品或自己熟悉的商品以文本的形式进行个人评价, 其他客户浏览该商品时, 可以看到客户对商品的客观文本评价信息, 从而帮助自己决定是否购买该商品。客户购买历史输入是指推荐系统将客户的购买历史作为隐式评分数据。一旦客户购买了特定商品, 则认为客户喜欢该商品, 推荐系统根据客户的购买历史产生相应的推荐。关键字和项目属性输入, 则是将客户在搜索引擎中输入关键字作为推荐系统的输入, 或者将客户当前正在浏览的商品类别作为推荐系统的输入。

2. 推荐方法模块。

它是推荐系统的核心部分, 采用的推荐技术决定着推荐系统的性能优劣。该模块是根据一定算法, 根据输入模块的数据, 得出对目标用户的推荐, 个性化推荐研究的都集中在寻找好的推荐方法。在实际应用中, 电子商务推荐系统一般采用多种推荐技术的组合, 尽量利用各种推荐技术的优点, 提高推荐系统的性能和推荐质量。

3. 输出功能模块。

它是指将得到的推荐以一定的形式反馈给客户。根据项目的特点, 目前主要有两种类型的推荐系统, 一种是以网页为对象的个性化推荐系统, 主要采用Web数据挖掘的方法与技术, 为用户推荐符合其兴趣爱好的网页;另一种是在网上购物环境下, 以商品为推荐对象的个性化推荐系统, 为用户推荐符合其兴趣爱好的各类产品, 如各种书籍、音像等, 这种推荐系统也称电子商务个性化推荐系统。以商品输出为推荐对象是电子商务推荐系统中最为普遍的一种输出, 推荐的商品以超链接的形式提供给客户。另外的输出形式有个体文本评价输出、个体数值评分输出、电子邮件输出等。推荐系统的个性化是指为每个用户推荐适合他们偏好和兴趣的产品, 而不是千篇一律。

(二) 电子商务推荐系统技术介绍

1. 内容过滤推荐技术。

内容过滤推荐技术主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。基于内容的推荐系统通过将顾客的偏好与产品内容自动匹配来给顾客提供建议。在基于内容的系统中, 产品由其普通属性描述, 通过相关特征的属性来定义项目或对象, 向客户推荐与其以前喜欢的产品相似的产品。其优点是简单、有效;其缺点是特征提取的能力有限, 过分细化, 不能为顾客发现新的感兴趣的资源, 只能发现和顾客已有兴趣相似的资源。这种方法通常被限制在容易分析内容的商品的推荐, 而对于一些较难提取出内容的商品, 如音乐CD、电影等就不能产生满意的推荐效果。

2. 协同过滤荐技术。

协同过滤推荐是个性化推荐中研究和应用最多的方法。其前提假设是存在具有相似兴趣爱好的用户群, 每个用户都有与其兴趣爱好相似的邻居用户, 以属性或兴趣相近的用户经验与建议作为提供个性化推荐的基础。协同过滤技术有助于搜集具有类似偏好或属性的用户, 并将其意见提供给同一集群中的用户作为参考, 以满足人们通常在决策之前参考他人意见的心态。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好程度计算的, 也就是说如果其邻居用户喜爱某项目, 则该用户也很可能会喜爱该项目。协同过滤最大优点是不需要分析对象的特征属性, 所以对推荐对象没有特殊的要求, 能处理非结构化的复杂对象, 如音乐、电影等。缺点有两个:一个是稀疏性, 亦即在系统使用初期, 由于系统资源还未获得足够多的评价, 系统很难利用这些评价来发现相似的用户;另一个是可扩展性, 亦即随着系统用户和资源的增多, 系统的性能会越来越低。

3. 基于规则的推荐技术。

关联规则挖掘技术往往利用实际交易数据作为数据源, 它可以发现不同商品在销售过程中的潜在相关性。基于规则的推荐技术在评价表上挖掘项目间的关联规则 (项目关联) 和用户间的关联规则为当前用户进行推荐。使用项目关联进行推荐时, 把已购商品作为规则头, 推荐对象作为规则体, 其中关联规则的发现最关键且最耗时, 但可以离线进行。其优点是简单、直接, 缺点是规则质量很难保证, 而且不能动态更新。此外, 随着规则的数量增多, 系统将变得越来越难以管理。

4. 基于效用的推荐。

基于效用的推荐是建立在对用户使用项目的效用情况计算商品对用户的效用来作出推荐的。焦点问题是如何为每一位用户创建出合适的效用函数, 因此, 用户资料模型很大程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性, 如提供商的可靠性和产品的可得性等考虑到效用计算中。

5. 基于知识的推荐。

基于知识的推荐在某种程度是可以看成是一种推理技术, 它不是建立在用户需要和偏好基础上推荐的。这种推荐系统具有特定商品满足特定用户需要的知识, 并由此推导出用户需要与某一推荐物品的相互关系。用户描述可以是支持这种推导的任何知识结构, 所以用户资料可以是任何能支持推理的知识结构, 它可以是用户已经规范化的查询, 也可以是一个更详细的用户需要的表示。

6. 组合推荐。

由于各种推荐方法都有优缺点, 所以在实际中, 组合推荐经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果, 然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法, 但在某一具体问题中并不见得都有效, 组合推荐一个最重要原则就是通过组合后要能避免或弥补各自推荐技术的弱点。在组合方式上, 有研究人员提出了七种组合思路:

(1) 加权:加权多种推荐技术结果。

(2) 变换:根据问题背景和实际情况或要求决定变换采用不同的推荐技术。

(3) 混合:同时采用多种推荐技术给出多种推荐结果为用户提供参考。

(4) 特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用。

(5) 层叠:先用一种推荐技术产生一种粗糙的推荐结果, 第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。

(6) 特征扩充:一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。

(7) 元级别:用一种推荐方法产生的模型作为另一种推荐方法的输入。

对推荐系统总体性能的评价是推荐系统研究的重要组成部分。目前大都只是采用准确率、召回率等评判尺度对推荐算法进行评价, 并没有真正意义上的、提升到对整个推荐系统进行的评价, 尤其缺乏从个性化程度、持久性程度、系统的安全性以及用户接受程度等多方面对推荐系统进行综合的评价。

(三) 电子商务推荐技术存在的问题和发展方向

综合目前电子商务中个性化推荐系统的现状可以看出, 大多数个性化推荐系统只是给用户推荐一些不同类别的资源, 而对用户正确行为的推荐却比较少。未来电子商务推荐技术研究的发展主要体现在以下几个方面:

1. 组合推荐技术的研究。

众所周知, 现存的推荐技术已经得到推广和应用, 但各种技术都存在一些缺陷, 能否将各种推荐技术融合起来作到取长补短是未来电子商务推荐技术研究的重要课题。

2. 推荐技术准确度的研究。

目前的推荐技术推荐的准确性还得不到保证, 准确度的研究还局限在手工实验阶段, 因此, 研究出自动的准确性验证理论模型就显得非常重要。

3. 数据获取方面。

主要还是依赖用户的显式评价, 在自动获得用户的隐式信息方面做得不够。

4. 研究过于集中解决推荐算法性能的提高。

对推荐系统的开发与应用, 尤其是与企业其它系统的集成应用, 在辅助企业的市场销售, 客户管理和企业商务智能方面缺乏研究。

(四) 结束语

电子商务推荐系统, 一方面有助于电子商务网站内容和结构自适应性的实现, 另一方面在帮助客户快速定位感兴趣的商品的同时也为企业实现了增值。但电子商务推荐系统的推荐算法设计以及推荐系统体系结构等关键技术也面临一系列挑战。由于各种推荐技术各有其优缺点, 组合推荐方法把各种推荐技术结合起来、推荐技术准确度验证模型的研究以及改进数据获取方法等方面将是电子商务推荐系统未来的研究方向。

参考文献

[1]余力, 刘鲁, 罗掌华.我国电子商务推荐策略的比较分析[J].系统工程理论与实践, 2004, (8) :96-101.

[2]Coo ley R, Mobasher B, Srivastava J.Data p repara2t ion fo r m ining wo rld w ide W eb brow sing pat terns.Journal of Know ledge and Info rmat ion System s, 1999 (1) :230-241

[3]R.D.Lawrence, G.S.Almasi, V.Kotlyar, M.S.Viveros, S.S.Duri, Personalization of supermarket product recommenda-tions, IBM Research Rport, 2000:43-75.

[4]邓爱林, 朱扬勇, 施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报, 2003, (9) .

[5]曾春, 邢春晓, 周立柱.个性化服务技术综述[J].软件学报, 2002, (10) .

电子商务推荐系统 篇2

二、活动宗旨:丰富大学生活、活跃校园气氛,让同学们更深

入的了解电子商务;激发和促进我院学生网络创业能力的提高;通过大赛吸引企业的关注、参与和支持,增加校企之间的沟通与交流。

三、活动组织机构:

主办单位:经济管理学院

承办单位:学生处团委、武装部

四、活动对象:潍坊学院全体同学

五、活动时间地点:

初赛 5月12日610

1复赛 5月17日6101

决赛 5月23日6101

六、会场布置:

正前方拉横幅,投影仪。决赛时评委正中央第一排,选手坐西侧的前五排,4名礼仪负责给各位评委添水,自律部组织人员进行现场秩序维护。

七、活动流程:

(一)前期准备:

1.利用海报、刊版、广播等方式进行宣传;

2.5月之前,科技创新部组织人员到各院系自习室进行口头宣传。宣传内容包括:⑴大体进行电子商务大赛的介绍,包括历届大赛

活动及其重要性、大赛主题、内容及组队形式;⑵可对参赛的具体方式或参赛作品进行列举,使大家更加了解大赛形式;⑶初稿要以电子稿进行投递;⑷投稿必须具备的内容:a.项目名称b.大概简述c.自身优势;⑸再次强调初赛复赛决赛时间。

(二)初赛:

1、评委按评分标准进行初步审核然后进行选择

评分标准:主要通过参赛名称、参赛作品概述、自身优势分析这三方面进行选择;

注:初赛评委由经济管理学院部长级以上历年参加电子商务大赛有经验者。

2、评委按投稿日期分配稿件,且每组有两位评委,进行共同评选,商讨所投稿件是否可晋级,采用十分制,选出30支队伍进入复赛。那种模棱两可的稿件作出标记,以备最后稿件多出时可有所选择。

(三)复赛:

1、比赛时间:将入选的50支队伍分为两组,分别在5月17日上下

午进行复赛,评选出10支队伍进入决赛。

2、比赛内容:每组选手拥有5分之内的表达时间,陈述内容主要包

括:依据ppt流程,条理清晰的阐述自己所选方案的重点优势。

3、计分方式:两名同学收起评委的打分,去掉最高最低分,进行平

均计算。

4、评分标准:依据ppt制作的严谨性,及各组讲解的流利性,现场的发挥进行打分。

5、复赛评委:历年各院系在电子商务中获奖选手。

(四)决赛:

1、比赛流程:

a.每组有8分之内的阐述时间,阐述过后,评委打第一组分数,然后由台下观众及其他团队进行提问,问题数为3至5个。依据回答,评委给出第二组分。

b.在前三组进行结束之后,穿插一个现场演练节目;

c.在第六组比赛结束后,主持人简述赞助方的经营销售状况:赞助方的地理位置,主要经营的业务,目前业务状况等;台下选手站在主人的立场对店面以后的经营提出自己的见解,依选手的见解程度,给于一定的分数奖励,奖励在1分之内;

d.在全部比赛结束后,由于最后一组的分数还没统计完毕,需请一名评委对此次活动进行总评;

e.由某领导宣布比赛结果。

2、计分方式:两名同学收起评委的打分,算出两次总和,去掉最高

最低分,进行平均计算。

3、决赛评委:熟知电子商务大赛的老师,领导。

八、物资经费统计:

横幅10米40元

纸杯、适量的果盘80元

电子商务推荐系统 篇3

【关键词】网络数据挖掘;个性化电子商务;推荐系统

【中图分类号】C37【文献标识码】A【文章编号】1672-5158(2013)07-0109-01

引言

在信息化全方位发展的今天,电子商务之所以能在世界范围内迅速发展,其优势在于方便、快捷、成本低、受限少。然而,电子商务也同样存在一些必须解决的问题,就是用户和商家之间的互选问题,即用户对所需产品的挑选和商家对用户所需的了解。通过网络数据挖掘与电子商务的恰当结合,就可以很好的解决这一问题,对电子商务的发展起到了很大的帮助。

1 网络数据挖掘

1.1 网络概述

在社会生活中存在着关乎人们工作和生活的各种各样的系统,通过对其本质进行分析,可以得到一个抽象的包含众多节点和连接节点的边的网络。网络是复杂系统的研究工具,为复杂系统的研究提供了新的模式和思想方法。

1.2 网络数据挖掘推荐算法

1.2.1 基于二部分图网络结构的推荐算法

因为系统的主体都是用节点来表示的,但是网络中的节点可以是一个类型,也可以不是一个类型。节点的连接关系用矩阵表示,这类节点属于单模式网络;节点不是一种的类型,不同类型的节点之间才能连接的网络称为二部分网络。

运用二部分图结构的算法,把推荐的系统中项目节点看作是具备一定的,能够分配出去的资源,同时可以把资源分配给其他看好的商品项目。

1.2.2 基于用户关联网络的推荐算法

之所以可以将网络思想引入推荐算法,是因为电子商务系统中的用户与商品及用户与用于之间具有关联性,这种基于网络的商务系统具有非常强大的适应性。主要思想就是:首先,建立用户选择的商品与评价信息之间的关联图,以权值计量。然后,在已形成的关联图中,按某商品的全部使用记录,把该商品推荐给其它相关权值较大的用户。

2 个性化电子商务推荐系统

2.1 个性化电子商务推荐系统的内容

电子商务是指有商务能力的实体,通过现代的电子技术来进行商务活动的过程。特别是现阶段,电子商务所表现出的优势越来越明显。现有的个性化推荐系统在主动为用户提供所需的信息或服务的基础上,更能同时满足为企业谋利益的要求,能为企业大力发展潜在用户,也就是可以通过个性化推荐系统实现双向推荐。

2.2 推荐系统的主要研究内容

2.2.1 信息的获取以及模型建立

随着因特网在全球的迅速发展,在准确获取用户信息的基础上,包括用户浏览行为等内容在内的交互式用户信息获取方式成为发展的趋势,这就要求在获取用户信息时,要对信息提前进行分类。

模型建立和更新的数据来源于不同途径得到的用户信息数据,并与其数量和质量密切相关,通过数据清理和转换筛选出适用于建模的数据。现阶段常见的建模技术有:关联规则挖掘、基于内容的过滤、聚类算法等。

2.2.2 推荐算法设计的有关研究

推荐算法有实时、准确、高效的特点,现在使用的主要算法都具有不同的适用领域,由于电子商务系统的使用率日渐增多,用户数据库的内容也越来越多,因此必须要在保证算法准确性的基础上,同时对其实时性进一步研究。尽管新的设计正在不断被推出,但都有一定的片面性,所以,想要得到较理想的推荐算法还需要进一步的研究。

2.2.3 评价推荐系统存在的问题

由于推荐系统的应用领域较多,并且不同的推荐系统的评价目的各异,另外,现在的评价指标大多只注重评价系统的单一特征,想对目前的推荐系统进行客观的评价还是比较困难的。现在常用的六种准确度评价指标有:预测准确度、排序准确度、半衰期效用指标、距离标准化指标、预测打分关联、分类准确度。

2.2.4 一些应用方面的问题

研究推荐系统的目的就是使其能够在不同的领域中取得应用,虽然推荐系统已经取得很好的应用效果,但其发展空间还是非常巨大的,如发展企业需要的潜力用户、拓宽推荐系统应用领域等。

3 数据挖掘与个性化推荐系统

电子商务系统中的信息量非常巨大,并且保持与日俱增的趋势,数据挖掘技术可以让这些蕴含着非常有用的规则和模式的数据得到很好的运用,从而更好的提供个性化服务。

3.1 聚类分析技术

聚类就是把数据在无指导的情况下通过非预先设定方式进行分组划分,这些数据之所以具有潜在性是因为它们都是在划分过程中自动生成的。利用这种技术得到的数据更有关注意义,更适合于分析使用。在个性化推荐系统中,通过聚类技术将客户按照不同的特征划分成不同的部分,这就使得搜索工作的效率大大提高。

3.2 关联规则技术

关联规则就是在数量庞大的数据中找出项集中的有用规则,以其高效的性能和伸缩性而成为是一个很热门的数据挖掘技术。但关联规则也有它的不足之处,就是参数阈值设置时会影响规模的效率。

关联规则中有两个很重要的概念,即置信度和支持度。以商品销售为例,关联规则生成步骤如下:第一步,从所有销售产品中找到全部的繁项集,这也是关联规则挖掘的核心和热点所在。第二步,生成关联规则,在频繁项目集中找到同时符合最小置信度和最小支持度的关联规则。

3.3 协同过滤技术

协同过滤是现阶段使用频率最多、效果最好、最受欢迎的一项技术。该技术主要是针对用户,通过搜索目标用户得到用户的行为偏好同时做出商品评价。通常所说的协同过滤技术主要指基于用户的协同过滤技术,随着对该技术的不断研究和发展,基于商品项目的协同过滤技术也得到了不断的提高。

3.3.1 基于用户的协同过滤技术

该技术的研究对象主要是用户,并且在现实生活中的使用率较高。即通过假设,把对某一商品具有相似评价的用户列为相似用户,并由此推断归结到一起的相似用户对其他商品也会有相似的评价。

基于用户的协同过滤算法实施步骤:(1)获取用户信息,即利用用户—项目矩阵描述用户所获得的商品的信息,这是用户信息获取步骤中最主要的内容;(2)相似性的计算以及相似用户集的产生,就是通过相似性计算得到与目标用户相似的用户群,得到符合相似用户数的一定数量的相似用户;(3)生成推荐结果,是在相似用户集的基础上,根据推荐方法生成推荐结果。

3.3.2 基于项目的协同过滤技术

基于项目的协同过滤技术的研究对象主要是商品项目。该技术就是用相似性计算,得到用户评价的商品项目与目标项目的相似值。利用它们之间的共性,预测用户对目标项目的评价值,通过这样的方式来获得同类商品信息。

结束语

电子商务推荐系统的应用领域非常之广,特别是将网络数据挖掘技术与其相结合,更好的符合了电子商务领域的用户所需。本文系统地阐述了网络数据挖掘和个性化商务系统以及他们之间的结合,探讨了网络技术在个性化商务系统中的应用。在今后的工作过程中,还应加强对基于网络数据挖掘的个性化电子商务推荐系统的深入研究,以切实提升系统运行的安全性与可靠性。

参考文献

[1] 张远程,康永胜.基于swarm平台和社交网络的电子商务个性化推荐系统仿真模型的理论构建[J].计算机光盘软件与应用,2012,(21):124-125

[2] 艾丹祥,左晖,杨君.基于三维协同过滤的C2C电子商务推荐系统[J].计算机工程与设计,2013,34(2):702-706

基于需求线索的电子商务推荐系统 篇4

电子商务时代,消费者面对大量的商品信息,往往难以发现最需要或最适合的商品。因此,电子商务系统通常采用具有采购助手功能的推荐系统来帮助消费者选购商品, 它能够自动收集消费者可能最感兴趣的商品,并推荐给客户[1,2]。当前流行的电子商务推荐系统根据其所采用的推荐技术大致可以分为四类[3]:一是基于内容过滤的推荐系统;二是协同过滤推荐系统;三是基于内容过滤和协同过滤的混合推荐系统;四是基于数据挖掘技术的推荐系统,这也是目前使用最为广泛的推荐技术。

尽管,当前基于离线数据挖掘的电子商务推荐系统得以广泛应用,但此类系统仍然存在一些不可忽视的问题,如:时效性差、实时性不高等[4,5,6]。基于对这些问题的分析,本文提出了一种基于在线需求线索的电子商务推荐系统及其模型。

1问题描述与分解

目前广泛应用的协同过滤、内容过滤等推荐系统存在着以下几个问题:

首先,这些系统的时效性较差:它们需要经过一个较长的时滞后(通常是24小时或更长时间),系统内积累起一定数量的交易及浏览数据,才能够进行客户的需求分析与推荐处理。这种数据积累过程带来两类时效性问题:1)电子商务销售的产品中有相当数量的应时商品(例如时尚产品),如数据积累时滞过长将会使销售方丧失众多商机;2)相当数量的客户进入电子商务系统,购物需求是有明显变化的,具体表现在,购买的目标对象(相邻或相隔几次)通常将有较大变化;本系统的需求调研发现,相邻两次购买相同或相似产品的客户不足8%;因此,以相近或相邻的购物记录作为短时推荐依据显然存在不足。

其次,这些系统收集和积累的信息内容存在易变性:例如:当前流行的推荐系统主要收集与积累客户的购物信息,包括:购物时间、购买商品种类与特征等,而这些信息通常变化较大,难以提供长久可靠的推荐依据;尽管购物品味、购物浏览行为等主观需求因素较少发生变化,但当前鲜有推荐系统对其进行发掘与利用,浪费了大量可用信息,进而丢失了大量商机。

此外,由于当前的推荐系统中,主要的信息收集、存储、处理与推荐等任务都由服务器完成,导致服务器成为了“计算”瓶颈,同时导致推荐工作的延迟很大、客户端(浏览器)计算资源闲置等问题。

为解决上述问题,本系统提出下列解决方法,并在电子商务推荐系统中加以应用:

当前的推荐系统大多采用B/S(浏览器/服务器)模式,即导购和购物网页传输至客户端,由浏览器“执行”;针对该模式中传统推荐系统时效性差的问题,本系统在客户端监测、采集和传递连续的在线顾客行为信息,并生成推荐系统所需的“需求线索”信息,从而减少客户端(浏览器)与服务器间的频繁交互,达到降低通信负荷,提高时效性的目的。

针对传统系统信息内容的易变性,本系统一方面在客户端对客户的在线浏览和购物行为进行监测和处理,从而进行在线需求的分析;另一方面对客户的长期购物记录在客户端进行特征化处理,再将其较为固定的购物行为特征、购物品味等历史需求线索存储在服务器,以空间换时间,从而提高二次信息利用的效率,进一步提高时效性。

2主要思路、模型与算法

2.1主要思路与系统模型

本系统的结构模型与主要思路如图1所示。

为了解决上述问题,本系统构建了一些与传统系统不同的数据结构与功能模块:

本系统中采用的特殊数据结构为“需求线索”。该结构描述为<Ti, Oi, Ci, OPi ,…>,其中Ti为需求活动发生时间;Oi为需求行为目标(被选购的商品、被浏览页面等);OPi为需求行为(浏览、评估、订购等);Ci为需求行为特征(复杂数据结构,包括喜好强度、滞留时间等)。

本系统中的特殊模块包括:

1) 在客户端(浏览器)运行的“在线需求监测模块” 该模块存储在服务器,当客户进入电子商务系统时,自动传输至客户端,并由浏览器执行;模块内部含有客户操作队列,用于保存客户端的信息浏览、商品检索等体现需求特征的活动,并由此进行客户的需求线索构建与购物倾向分析;但具体的分析过程交由服务器完成,避免在服务器与客户端频繁交互历史数据。

2) 在服务器上运行的需求线索与商品特征“匹配与检索模块” 传统推荐系统中通常也有类似模块,但通常是将客户的历史购物记录与当前的存货作匹配,从中择优进行商品推荐;本系统的匹配模块则结合客户端的“在线需求监测模块”提供的在线需求进行“需求VS商品”匹配,不但提高了客户满意度,而且避免了传统推荐系统的反复叠加匹配操作,提高了系统运行效率。该模块中应用了模糊匹配算法,构建了多维度“需求VS商品”匹配空间,具体描述见“2.3节关键算法”。

3) 在服务器上运行的“需求线索管理模块” 传统推荐系统通常将单个客户的每次购物记录直接存储,以便系统挖掘推荐信息;本系统的需求线索管理模块,在客户端完成购物活动后,将需求线索收集至服务器,将购物记录与反馈信息结合,作相应处理后,进一步完善需求线索的内容,作为下次推荐的依据。

2.2推荐流程

本模型由4个主要步骤组成:

1) 客户需求线索监测 当客户进入电子商务系统时,在线收集客户的需求行为信息,并作预处理,寻找其注意力焦点;并在客户端构建对应的需求线索,其内容包括了其需求活动、需求对象、需求行为特征等。

2) 需求测度 当客户在线需求强度超过阈值时,根据客户端获得的需求线索与服务器预存的历史需求线索,通过相似测度等操作,通过“需求VS商品”匹配空间中得出客户的当前需求特征(需求目标特征、需求强度、需求模式等)。

3) “需求VS商品”匹配计算与商品信息库检索 服务器通过检索商品信息,根据客户当前需求的特征,在“需求VS商品”匹配空间提取那些商品特征与客户需求匹配的商品。

4) 需求线索后期处理与推荐实施 对推荐商品列表进行修改和调整,以通过多种在线广告或离线方法提交给客户;并将最终成功交易的结果保存在“需求VS商品”匹配方案库中。推荐完成后,客户将从推荐列表中选择相应商品,这些结果将经过处理,作为反馈信息提交给需求线索管理模块,进一步完善该客户此次交易的需求线索,作为下一次推荐和客户需求管理的参考依据(包括购物倾向、浏览习惯等)。

2.3关键算法

通常,电子商务系统的推荐过程是连续,因此不可能等待收集交易信息的工作实施完成再进行推荐匹配,而是需要提供及时的推荐信息,并在客户退出系统前提供推荐商品列表。本系统采用的匹配空间模型与算法描述,如图2所示。

为了提供尽可能快捷准确的推荐匹配服务,本系统采用蒙特卡罗方法实现“需求VS商品”匹配测度。本系统中设定Ri表示特定商品i的特征和客户最大需求之间的距离;g(Ri)表示可通过程度到Ri程度时,匹配空间内的相应的评估分数能够提供推荐商品的TopN列表[7],而f(Ri)为各种当前客户的需求线索条件参数的分布密度函数,则:

<g>=∫∞0g(r)f(r)dr

根据概率统计的理论,<g>是随机变量g(Ri)的数学期望。当推荐系统将向客户提供TopN推荐列表时,每次提取的记录依次为r1,r2,…,rN,则N次提取之值为g(r1),g(r2),…,g(rN)的算术平均值:

g¯Ν=1Νi=1Νg(ri)

它们代表了商品的可推荐程度(通常,算术平均值为积分<g>的估计值,或近似值)。本算法将待推荐商品空间X的样本X1,X2,…,XN的算术平均值作为所求解的近似值;根据大数定律:如X1,X2,…,XN独立同分布,且拥有有限期望值(E(X)<∞),则:

Ρ(limΝX¯Ν=E(X))=1

即商品可推荐程度随X样本的算术平均值变化,当子样数N充分大时,以概率1收敛于它的期望值E(X)。基于这种事实,虽然单个商品的信息样本可能达到客户需求的满意度较低,但是随着商品样本的增多,客户需求线索的丰富,“需求VS商品”叠加空间内的可用信息不断增加,该算法能够实现快速的匹配检索服务。

3系统仿真实验结果

本系统通过仿真在线营销环境进行了模拟。

仿真环境通过虚拟购物方式论证该系统的实际效果。10个测试周期后,向测试客户以电子邮件形式,请他们就新老系统的使用满意度作在线对比调查;发送在线调查问卷400份,收到回复327份,其中有效回复297份。

表1给出了客户满意度的调查对比。从7个主要调查项的对比中可以看出:较之老系统,新系统大大提高了客户满意程度。

同时,由于能够对客户需求线索进行跟踪,本系统具有良好的自适应能力;较之传统推荐系统采用的离线数据挖掘等方法,基于在线监测方法的推荐商品选择速度更快,时效性更加好(由于实际的推荐实施采用在线广告方式实施,客户不能评估推荐列表的生成速度,因此该实验在服务器中进行:推荐Top10商品的速度测试中,新系统运行速度平均提高了37%以上)。

图3显示了平均在10个监测周期内,客户获得推荐商品列表的平均时耗与平均浏览时间对比。该实验证明,本系统能够通过短暂的需求线索分析,将能够吸引客户浏览本网站更多的信息,大大提高了客户关注度,从而提高在线销售业绩。

4结语

本文给出了一个基于需求线索的电子商务推荐系统的基本模型、数据结构、关键算法以及运行流程。该系统采用需求线索监测的方式收集客户当前的需求信息,从而进行需求倾向预测,提高了系统的实时性和时效性;并通过需求VS商品叠加空间匹配和检索推荐商品列表,提高了客户满意度。仿真实验证明该系统性能良好,具有一定的应用价值。未来的研究目标是进一步提高需求线索监测的准确性,扩展客户需求识别的利用领域,以及寻找更高速的“需求VS商品”匹配算法。

摘要:传统电子商务推荐系统采用离线方式分析和处理客户需求信息,因而丧失了时效性。为解决相关问题,提出了基于需求线索的推荐系统。给出了系统的基本模型、数据结构、关键算法以及运行流程。该系统采用需求线索跟踪的方式收集客户当前的需求信息,从而进行需求倾向分析;并在需求VS商品叠加空间中匹配和检索需要推荐的商品与客户。在线营销仿真实验表明,系统具有较好的及时响应能力和较高的客户满意度。

关键词:电子商务,推荐系统,在线需求线索

参考文献

[1]陈婷,韩伟力,杨珉.基于隐私保护的个性化推荐系统[J].计算机工程,2009,35(8):283-285.

[2]刘枚莲,丛晓琪,杨怀珍.改进邻居集合的个性化推荐算法[J].计算机工程,2009,35(6):196-198.

[3]蒋国瑞,青海,黄梯云.一种柔性的电子商务推荐系统[J].计算机应用研究,2009,26(3):930-933.

[4]马宏伟,张光卫,李鹏.协同过滤推荐算法综述[J].小型微型计算机系统,2009,30(7):1282-1288.

[5]郭艳红,邓贵仕,雒春雨.基于信任因子的协同过滤推荐算法[J].计算机工程,2008,34(10):1-3.

[6]何波,陈媛,王华秋,等.基于智能体的电子商务协作推荐系统[J].计算机工程,2007,33(9):216-218.

电子商务实习日志(推荐9篇) 篇5

虽然才到刚到单位不久,但是总体觉得同事们都很随和,很好相处,并没有因为我是新人而排挤歧视我,也没有因为我是新人而使唤来使唤去的。感觉社会并非我当初想象的那么险恶和肮脏,对社会又恢复了点信心。而且这些天公司的指导人给我耐心讲解了有关公司的概况、规模、机构设置、人员配置等等,使我认识到对一个公司也只能是从整体上大致了解了一下。但是至于内部具体的细节是怎么也弄不清楚的。我想先对公司有个大概了解,在对自己的岗位工作有所认识,要知道公司设那个岗位的目的,要达到预期的效果,才能保证公司的正常运行。而且部门运转什么的呆了久了、熟悉了自然会明白其中奥妙了。主管总是鼓励我说不懂的可以多问,问同事。慢慢来就入行了!

篇二:电子商务毕业生实习日志

好几天没写日记了!由于工作太忙,所以忽略了几天日记。但是很有必要总结一下这几天的实习感悟。经过今天的学习,我基本上熟悉了公司的业务流程。其实,说实话我目前从事的工作基本上是客户服务。与人打交道的。但是这也需要我们熟悉公司业务才能为客户解决问题。当有客户提到公司的业务时候我们能很好的为他人解决。每当为客户解决了一个问题的时候我总是感觉很欣慰。主管看到我逐渐实习了业务也在不断鼓励支持我。每当有问题的时候主管总是乐于解决回答我的提问。我记得主管的一句话就是“秉承一切只能靠自己看,猜想,厚着脸皮求教。”这句话意味深长!

篇三:电子商务毕业生实习日志

今天的天气非常不错,秋高气爽。刚走出学校,踏上了工作岗位,一切都是那么的新鲜,然而新鲜过后却感到压力很大——走出校园需要与人交流与沟通,公司里要学的东西学校里都没有学过。发现有很多东西自己都不会,甚至都没有接触过。面对太多的疑问自己的内心产生了很大的压力。内心充满了矛盾,然而事实证明我多虑了,这里有和蔼的领导和友好的同事,他们给了我极大的帮助和鼓励,在第二天上班通过和同事们的交流我获得最多的是鼓励和信任,使自己逐渐有了信心和勇气,能够勇敢的去面对任何挑战。铁别感谢主管李哥的鼓励与支持!相信自己,我能行的!

篇四:电子商务毕业生实习日志

以下是我实习的一些个人感受,因为我发现在工作中心态同样很重要:实习本来就是大学里边必须经历一个阶段,但是在实习期间我们以什么心态对待确实很重要,首先我们要面对的真实的社会,工作是辛苦的,其次是我们的工资很低,且在不同公司不同的部门待遇不同,尽管做了同样的工作甚至更累,但却拿更低的工资。所以我们必须抱着一种学习的心态,公司赚钱,我们学东西。再加上社会本来就那样,劳动与报酬并不一定是平等公平的,只有认识到这点,才能以正确的心态去对待我们的实习,才能积极主动、有责任的去完成任务。这是我进来公司领悟到的事情,作为实习生更是要清楚自己的职责,不能和别人比较,心态很重要,有时候会觉得我做的事情比别人多,但是别人工资不知道是我的几倍,其实不能也不应该这样想,因为我现在主要是学习东西,能学到东西这就是潜投资,谁都要经历这样一个过程.所以,学到东西才是最重要的!

篇五:电子商务毕业生实习日志

感悟二:要

篇六:电子商务毕业生实习日志

其实天天写实习日记也没有那么多的感悟与发现。今天还是和之前的几天差不多,熟悉公司业务,熟悉如何操作。但是公司有个好处就是天天在下班前半个小时,开会讨论一天的收获以及发现的不足之处等等问题。

在一天的紧张工作之后,同事们总是满怀激情的提出工作当中遇到的问题,并且能说出自己的一些个人见解。对于我就只能在旁边学习了。

篇七:电子商务毕业生实习日志

这一天过的很慢很慢,可能是闲的吧。我一直很自信,认为自己是优秀的,但到这里来,感觉自己什么都不会,连使用传真机和复印机都是同事教的。自我安慰吧,哎,第一次嘛,慢慢就能实现自我了。可能今天太闲,觉得有点空虚,但这是我自己选的路,既然选了,我要坚定的走下去。因此,我不抱怨,我相信我自己的能力。

今天的收获可以总结为两个(自己都觉得有点可笑),学会了使用复印机和传真机。回到家后不知怎么了,感到有些疲倦。是因为闲的?我笑了一下,哎,上班都是这样吧。我只是对工作有了一个大概的认知,至于怎么高效率地完成工作,还需要时间来证明。相信我可以很快地进入状态。

篇八:电子商务毕业生实习日志

今天给我安排了任务,说是针对公司业务做一个策划活动。随后给我发了一份文档。我看了后就傻了,这是什么啊?虽然都是文字的,但是我能理解一小半就不错了,看着文档就发呆了好久。最后不断问同事相关的业务等知识,并且针对该业务做一些详细的解说等等。我深深体会到了积累知识的重要性。俗话说:要给学生一碗水,自己就得有一桶水。我对此话深有感触。以往觉得很容易操作的office,但主管要求我完成某次产品统计的数据与记录时,我却一头雾水,感觉和平时计算机课堂中学的完全不一样,这也让我感到巨大的惭愧。因为以前的自己总以为这些东西学不学得好与专业没有多大联系,殊不知工作不是专攻一个方面,而是考察我们的综合知识水平。“书到用时方恨少”袭上心头!没办法只能用最笨的办法来做文档。深深体会到我在学校里学的知识,还是很少很少。

篇九:电子商务专业的实习日志

实习名称:网络营销实习生

最近把表达的欲望到发泄到TX微博上,很少更新博客文章了,动笔的时候有那么一段时间竟然找不到任何书写的感觉,真是罪过。在Amy的博客上看到这篇关于实习的征文活动(欢迎大家关注:-)),知道Amy童鞋和秋水大侠一直以来为帮助后辈成长所做的种种努力,又想起自己作为他们博客的忠实读者,长期从他们的文章中吸收了大量宝贵的精神财富,却从来没有想过要做点什么,就觉得羞愧万分…于是决定这次无论如何都要响应一下这个活动,作为一名正在金蝶友商实习的新兵,有许多自己的想法和大家分享一下,欢迎大家拍砖。

怎么找到一个好实习

经历半个多月的寻找,终于让我等到了友商的实习工作。这期间也有过彷徨和挣扎,特别是看到其他同学陆续找到实习岗位的时候,心情就愈加烦躁,拼命提醒自己一定要淡定。找一份实习一点都不难,难的是找一份好实习。对于实习,我的态度是宁缺毋滥,即使这意味着要等待也是值得的。我的习惯是在做每件事情之前先立一个目标,作一个规划。由于之前也受过一些结构化思维的训练,所以很快就列出了目标和实现途径。先确定总的目标是到一家互联网/电子商务的大公司实习,现阶段的目标则是要增加我的简历的曝光度,吸引目标对象(企业)的关注。第一步就是重新修改简历(简历怎么写也有很多技巧,这里就不展开了,有空可以就这个话题再写一篇。);然后是确定传播途径,一是通过熟人推荐/介绍(这个已经被证实,推荐找到实习的成功率很高),这时候平时的人脉积累就能很关键了,我在纸上随手就写了几个人名;二,是通过社会化网络,校内,微博,豆瓣社区等地方都是很好的媒介;三、是通过智联,中华招聘网,等网站平台去投与目标相关的岗位;四、留意大型公司的招聘启事,有针对性的投简历;五,更多。有了前面的这些准备,我到具体执行的时候就能有章可循了,后面的结果也证实先前的这些准备工作是非常有必要的,我最终是通过腾讯微博上找到了友商的实习。总结一下:找实习的过程其实就是自我营销的过程,把自己作为一个产品,用营销的思维去营销自己,才能获得好的效果。

还有其他的一些经验,比如要把握好时机,有些大公司的暑期实习计划启动得很早,一般都在3、4月份开始,到5月低基本上就停止接收简历了,对于心仪的公司岗位,那就要提前做好准备了。再比如找实习之前最好先问自己几个问题:我想要什么样的实习吗(什么类型的公司,什么样的工作内容)?我选择大公司还是小公司,为什么?我是更看重待遇还是更看重能力的培养?这些问题都想清楚了再去行动效果才会更好。

如何最快的融入新环境?

相信每个实习生都会遇到类似的问题:经过一番努力,终于得到了心仪的职位。可面对陌生的环境,新的同事,如何迈出融入新团队的第一步又成为了棘手的问题。特别是如何处理好职场中微妙的人际关系,这个问题困扰了我很久。在努力调整自己的同时,我在网络上找到下面的一段文字,说得很好,值得反复思考:

一.多看少说,多观察少动作。每一个人初到一个新的工作环境,最好都能注意观察你的工作环境。公司的工作氛围是开放还是保守,同事之间的交流方式是直接还是含蓄,穿著打扮是正式还是休闲,部门与部门之间的合作是顺利还是曲折,每家公司都不一样。在此情况之下,如果贸然行事或按照自已过去的方式行为处事,多半会碰壁,为以后的相处增加了难度。对新环境的大致情况比较了解后,再调整自已,让自已按照新公司的情况一步步融入集体。

二.行事低调,谦和。公司里一般都会按到来先后顺序论资排辈,如果行事太张扬,穿著太突出,肯定会引起大家的反感或抵触,这个印象分马上就下去了。

三.心态平和,不要急于马上和同事打成一片。其实对于新来的人,周围的同事也都会有好奇心,会暗中观察你,但不会马上很急于来跟你联络。一些一来就跟你很热络的人不见得以后会真心待你。所以这个时候如果你很急切地对周围人示好,只会欲速则不达。

四.调整期望值,最好认清自已到这里来主要是工作的,和同事之间是工作上的合作关系而不是交流个人感情。期望值调整好后,你的言行举止才会得体大方,不温不火,从而引起别人对你的好感。另外职场上主要还是工作关系,积极在工作上与他人配合,让大家能愉快地工作 其实是比较理想的方式,如果抱著交朋友交心这样的心态到职场,受挫的可能性较大。如果在职场上能交到朋友是你的幸运,如果没有交到朋友则属正常。

五.对环境保持敏感度,掌握一些处事技巧,尤其是一些职场新人,有时候会稀里糊涂把自已卷入一些不必要的办公室政治里去,最终成为牺牲品。最好不要与某个部门或某几个人走得太近,感觉到有派系之争或个人争斗时尽量置身事外,与同事之间保持适当的距离是比较恰当的。

工作内容又杂又繁琐,怎么办?

实习生的工作基本上可以用杂、多、繁琐这些词来概括,我们网络营销实习生在友商的第一周基本就是在资料收集,产品要点整理,百科词条撰写等这些“基础推广”工作中度过的,这类工作基本上就是人力活,而且没什么技术含量。对于这样的工作安排,刚开始的时候我和同部门的另一位实习生都比较抗拒,后来也能慢慢接受了。为什么一定要我们先从最简单的资料收集工作开始,我想至少能找出两个理由,一个是我们刚进公司,对公司的业务不了解,一边收集资料可以一边熟悉公司业务;另一个是,小事情更能体现一个人的态度,只有把这些小事都做好了,主管才可能把更重要的事情交给你去做;后面发生的事情也证实了我的想法,第二周开始对友商产品的SEM关键词进行拓展的时候,前面的资料收集等工作就开始派上用场了,关键词列表中的基础词就基本来自于我第一周收集的资料中;另外,即使是小事,要想做好也没有那么容易的。编写百科词条的时候,我第一天用了1个多小时刷刷提交了4份百科词条,第二天上班一看,竟然一条都没有通过。所以,我不得重新编辑,这一次我仔细研究了百科词条的撰写规范,摸清了编辑的脾气,用了四个小时把新的词条整理上传上去,这一次上传的所有词条才得以全部通过了。给我的感受是:即使是看起来最简单事情也没有想象得那么容易,认真做好每一件事情才是王道。

如何转变学生心态

在公司遇到什么人,我还是习惯于介绍自己是一个学生,习惯的力量还真的很可怕。可我知道在公司实习的时候,就不应该再把自己当成学生了。为什么拒绝把自己当成学生,理由很简单。作为学生的我们,即使我们迟到、旷课、不交作业,老师最多责备几句,却从来不会让我们负责任,我们更不会因为这个事情而有什么损失。可是在公司,你试试看上班迟到,任务不按时完成会有什么后果。整个学校营造了一种安逸的环境,可是现实的社会却不是这样的。不要把自己当成学生很重要,这个心态的转变是步入职场的新的起点。当你在实习的时候遇到问题,如果公司有导师可以帮你解决,那自然是最好;如果没有导师帮忙,你就要想办法自己解决了,要学会独立解决问题的能力,因为以后再也没有人来手把手,一步一步教你了。拒绝以学生的心态去对待实习工作,把自己当做专业人士,按照专业人士的标准要求自己,你你才有可能真的成为专业人士,才能让你的其他人(包括你的同事,你的老板和你的客户)都认为你是专业的。要是老把自己当成学生,其他人也只会把你当学生看待,你也永远只是个不懂世事的小毛孩。

实习与就业:

实习的工作是否一定要和自己的将来的就业方向一致,我觉得这个不一定。我一个已经毕业的师兄,大三的时候是一家网络营销公司的网络营销实习生,可毕业之后却去了另一个互联网公司做产品运营。我个人的理解,实习是帮助自己确定自己以后职业方向的一个很好的方法。有这样实习的机会,我们最好能同时了解几个不同的工作信息,作为确定将来的职业发展方向的依据,但这个将来的职业并不一定要和现在的实习工作内容一模一样。

无论如何,每一份实习机会都难能可贵,抓住这样的机会以后就应该像刘润说的榨干你所能学习的一切东西,因为你永远不知道你今天学到的东西会在将来对你有什么帮助!

[

电子商务推荐系统 篇6

广汽本田第九代雅阁

第九代雅阁重点对外观、动力总成和整车配置进行了升级,并被冠以“超级雅阁”的称号。第九代雅阁一共发布了6款车型,其中2.0L、2.4L和3.0L排量各有两款。其按配置可以划分为豪华版、豪华导航版、尊贵版与旗舰版四个档次。

第九代雅阁中央进气格栅采用了类似锋范的三横条式大面积镀铬设该车车身整体设计如同泪滴状已达到降低风阻从而提高燃油经济性之目的。车尾采用双边单出隐藏式排气尾管,其中2.0L车型尾部无任何排量标识,2.4L和3.0L车型则均标注了排量信息。乘员舱方面,宽度与后排膝部空间均提升15mm。第九代雅阁2.4L车型采用VTEC可变气门升程系统+VTC可变气门正时技术以及缸内直喷系统。

上海通用别克新君越

别克新君越在外型上的主要变化包括标志性的直瀑式格栅的面积有所增大,头灯的造型有所调整并且在灯眉处加入了像回旋镖式的展翼LED日间行车灯组的模块,与车尾的展翼式LED尾灯遥相呼应,非常抢眼。此外,在前保险杠的部分,也较现款有所调整,整个前脸风格更为犀利。车身尾部,新款君越的显著变化除了新增的展翼式尾灯设计,双出尾管的造型也略有调整,排气包覆在了后保险杠之内,与车身形成一体。此外,尾部还加入了贯穿两个尾灯的镀铬亮条,更显大气,新车在牌照架样式上也有细微调整。

在车身尺寸方面,新款君越较老款车型的车身长度和高度分别增加了5mm和3mm,而轴距保持不变依旧为2837mm。另外,该车还共有托帕石棕、极光银、墨玉黑、琉璃金和象牙白五种外观颜色,以及米色、黑色和棕红色三种内饰颜色可供选择。

新款君越还引入了Intellisafe安全系统,包括全车速自适应巡航、碰撞警告、车道偏离预警、车道变更辅助以及泊车辅助在内的智能主动安全系统等。

动力方面,新君越3.0L车型搭载了一款3.0L V6 SIDI智能直喷发动机,并与6速手自一体变速箱,而新款君越2.0T和2.4L版车型则是销售主力,配第二代全新的6速手自一体变速箱。

电子商务推荐系统 篇7

关键词:电子商务,Mahout,商品推荐,Hadoop

随着信息技术的飞速发展和政府对电子商务领域的积极推动,目前电子商务正以前所未有的速度蓬勃发展。但随着用户和需求的不断增长,电商交易环节中结构化与非结构化数据的存储和处理,用户需求种类的多样化等问题也提出了更高的要求。电子商务交易的商品数量及相关信息等呈爆炸性的增长,如何在这些海量信息中识别出真正有价值的信息也变得越来越困难。尽管Hadoop软件框架的发展与工具的应用越来越成熟,能够较好地实现对海量数据的存储与计算,但将海量的数据存储在云端只是解决了数据的存储问题,如何满足用户的需求,将云数据转化为对用户有价值的信息并能高效、准确地推荐给用户才是目前电子商务网站亟需解决的关键问题。

自1992年Goldberg D等人提出首个基于协同过滤的推荐系统[1]以来,电子商务个性化推荐服务得到了快速发展。2008推出的开源Apache Mahout是基于Hadoop分布式框架的机器学习算法库。[2]其中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集,同时规范了数据结构,并标准化了程序开发过程。[3]此外,Mahout还提供了大量的功能实现,包括聚类、集群、分类、协同过滤和进化程序等数据挖掘算法。通过使用Apache Hadoop库,Mahout可以有效地扩展到云中。[4]

本文基于Mahout设计开发了一个电子商务商品推荐系统,通过对用户已经产生的浏览记录、购买喜好、价格承受区间、商品内在的相关性等数据的挖掘及过滤,实现自动化、智能化和个性化的信息过滤服务,帮助用户发现所需商品,商家也可利用推荐进一步激发用户的购买欲望。

1 Mahout开发环境

Mahout最初应用的平台是Hadoop集群平台,但是现在经过扩展,Mahout已经不仅仅适用于Hadoop集群云平台,还可以单机运行算法,即与使用Java编写的算法是一样的,而且这个算法还是优化过的。

配置Mahout环境之前必须安装好Java,然后就可进行Ma⁃ven的安装。因为Mahout是利用Maven来构建和发布项目的。Maven是一个命令行工具,它管理依赖关系、编译代码、形成软件包、生成文档并发布正式版本。如果已经安装了Eclipse,Ma⁃ven就已经被集成在其中了,可以直接使用Maven配置文件(pom.xml)来配置并导入项目。如果没有安装Eclipse,则首先要到Maven官网http://maven.apache.org/download.cgi下载Maven软件的bin版,解压到/home/mahout/apache-maven-3.1.0,然后设置环境变量。在系统环境变量配置文件中输入:sudo vim/etc/profile并在其中添加:

然后使用命令source/etc/profile更新环境变量,输入mvn–version,则安装完毕。

此外也可以到Mahout官网(http://mirror.bit.edu.cn/mahout/)下载Mahout-0.7版本,然后解压缩和安装。在终端输入命令:tar–zxvf mahout-distribution-0.7.tar.gz解压发布版到/home/mahout/mahout-distribution-0.7目录中,即可安装成功。

2 基于Mahout的电子商务推荐系统设计

2.1 推荐算法简介

Mahout的推荐算法也称为协同过滤算法模块,主要包括基于项目的分布式协同过滤和使用并行矩阵分解的协同过滤两种类型。[5]

项目即为电子商务网站中的各种商品。基于项目的协同过滤就是利用项目(商品)之间的相似度来为用户进行项目(商品)的推荐。项目之间的相似度通过不同用户对该项目的评分(即偏好值)来求出,每个项目都有一个用户向量,两个项目之间的相似度便是根据这个用户向量求得的。求得项目之间的相似度,便可以针对用户对项目的评分清单来推荐与清单中极为相似的项目(商品)。两个商品项目之间的相似度计算可以使用诸如Pearson距离、余弦距离、对数似然距离等向量距离计算公式来求出,就得到了项目相似度矩阵。

使用并行矩阵分解的协同过滤核心思想则是把所有的用户以及项目想象成一个二维表格,该表格中有数据的单元格(i,j)就是第i个用户对第j个项目的评分,然后利用该算法使用表格中有数据的单元格来预测为空的单元格。预测得到的数据即为用户对项目的评分,最后按照预测的项目评分从高到低排序,便可进行推荐。

2.2 系统设计

本文主要采用Mahout的基于项目的协同过滤算法来实现电子商务商品的推荐。其中两个商品项目的相似度计算采用欧几里德距离的计算公式求出。其基本思想为:对于两个用户User1和User2,看成是n维空间的两个向量x和y,xi表示用户User1对itemi的偏好值,yi表示用户User2对itemi的偏好值,它们之间的欧几里德距离是如式(1)所示:

则商品项目对应的欧几里德相似度,一般采用式(2)进行转换,所求得的值越大,说明两者之间的距离越小,相似度越大。

算法的实现一共包括六个步骤:1)根据用户对商品的偏好表求出用户矩阵;2)根据用户对商品的偏好表求出项目(商品)矩阵;3)求出项目矩阵的平方和;4)根据项目矩阵、项目矩阵平方和求出项目(商品)相似度矩阵;5)整合用户矩阵、项目相似度矩阵,得到用户-项目相似度矩阵;6)根据用户-项目相似度矩阵求出用户推荐矩阵。六个步骤使用7个Map Reduce的Job任务来进行数据处理。第一个Job任务是进行项目的数据格式转换,即把项目(商品)的编号由长整型转换为整型,并将同一个用户评价过的所有项目进行整合得到用户矩阵。算法的第二、三步分别用一个Job来实现。第四步求项目(商品)相似度矩阵需由两个Job任务共同处理完成,这是因为其中的第一个Job任务是依次对每个项目进行相似度的计算,第二个Job任务则需将前一个Job中已计算好的相关相似度(但未关联到该项目中)续接到该项目中。算法的第五步和第六步分别使用一个Job来进行处理,第五步就是将用户矩阵和项目相似度矩阵执行拼接,得到的用户-项目相似度矩阵。第六步则在第五步的基础上来计算用户推荐矩阵,得到最后向每位用户推荐的商品结果。

整个系统设计采用B/S架构,这样能充分支持多用户并发使用的情况。数据库采用My SQL数据库集群,存储用户信息、商品等固定属性数据、用户偏好值、推荐引擎产生的结果等数据。其中用户对商品的偏好表如表1所示(只列出一部分)。

其中部分核心代码为:

3 结束语

Mahout提供了一个伪分布式的推荐引擎框架,并且是一个可伸缩的机器学习算法库,通过使用Hadoop可以将用户集合分在n台机器上,实现分布式并行计算,对大数据集进行处理。本文通过引入介绍Mahout的推荐算法,设计了一个电子商务商品的推荐系统,可为用户推荐所需要的商品,促进商品的销售。下一步将深入研究结合更大数据量及更多属性集合上进行高效地推荐。

参考文献

[1]GOLDBERG D,NICHOLS D,OKI B M,et al.Using collabora-tive filtering to weave an information tapestry[J].Communica-tion of the ACM,1992,35(2):61-70.

[2]ANIL R,DUNNING T,FRIEDMAN E.Mahout in action[M].USA:Manning,2011:66-86.

[3]朱倩.浅谈基于Mahout推荐引擎的构建[J].数字技术与应用,2015(4):44-45.

[4]建新,徐迪威.基于云计算平台的海量数据挖掘技术在塑料电子商务平台中的应用[J].广东科技,2011(8):59.

电子商务推荐系统 篇8

关键词:电子商务系统,协同过滤推荐算法,算法研究

一、引言

电子商务迅猛发展的时代已经到来,网上购物的交易方式正在改变着传统的商业模式。2007年,电子商务的交易额达到了8900亿人民币。面对如此众多的商品,无疑会大大增加用户发现满意商品的困难。于是个性化推荐系统逐渐成为电子商务领域中的一项重要的研究内容,得到了广泛关注。

研究电子商务推荐系统对企业和社会具有很高的经济价值。电子商务个性化推荐系统的关键是建立用户模型。推荐系统的热点问题是推荐技术和推荐算法的研究。推荐算法是整个推荐系统的核心,它的性能决定了最终推荐结果的好坏。为了建立合理的用户模型,满足不同用户对实时性、推荐方式等的要求,产生了一系列的推荐技术和算法。涉及的技术包括基于内容的过滤技术、协同过滤技术、关联规则挖掘技术、分类和聚类技术、神经网络技术等等。

协同过滤推荐是迄今为止最成功的个性化推荐技术,被应用到很多领域中,协同过滤相当突出的优点是其决策基础是“人”而不是“内容的分析”,能针对任何形态的内容进行过滤,更能处理相当复杂和艰难的概念呈现,以获得意料之外的结论。

文章重点研究电子商务系统中协同过滤推荐算法。

二、电子商务推荐算法的研究

目前的电子商务推荐系统中运用的推荐算法主要可分为三大类:基于内容的推荐算法(Content-based Recommendation Algorithm)、基于规则的推荐算法(Rule-based Recommendation Algorithm)和协同过滤推荐算法(Collaborative Filtering Recommendation Algorithm)。

1. 基于内容的推荐算法是信息过滤研究的派生和继续

基于内容的推荐系统需要分析资源内容信息,根据用户兴趣建立用户档案(Profile),用户档案中包含了用户的品位、偏好和需求信息。然后根据资源内容与用户档案之间的相似性向用户提供推荐服务。在一个这样的系统中,通常采用相关特征来定义所要推荐的物品。

2. 关联规则挖掘技术在零售业得到了广泛的应用,它可以发现不同商品在销售过程中的潜在相关性

随着数据挖掘的兴起,关联规则被应用于推荐系统,形成了一种新的推荐技术——基于规则的推荐技术。基于规则的推荐技术在评价表上挖掘项目间的关联规则(项目关联)和用户间的关联规则为当前用户进行推荐。使用项目关联进行推荐时,每条项目关联的前件相当于一个兴趣组,而规则的后件则相当于这个兴趣组的推荐。如果当前用户对该规则前件中的所有项目都喜欢,那么就把规则的后件以一定可信度推荐给当前用户。而使用用户关联进行推荐时,用户关联的后件必须是当前用户,使用用户关联的前件中的用户的共同兴趣模拟当前用户的兴趣,模拟的可信度就是用户关联的可信度,以此作为推荐的依据。

3. 协同过滤(Collaborative Filtering)的基本概念就是把这种推荐方式变成自动化的流程

协同过滤主要是以属性或兴趣相近的用户经验与建议作为提供个性化推荐的基础。透过协同过滤,有助于搜集具有类似偏好或属性的用户,并将其意见提供给同一集群中的用户作为参考,以满足人们通常在决策之前参考他人意见的心态。

本人认为,协同过滤技术应包括如下几方面:(1)一种比对和搜集每个用户兴趣偏好的过程;(2)它需要许多用户的信息去预测个人的兴趣偏好;(3)通过对用户之间兴趣偏好相关程度的统计去发展建议那些有相同兴趣偏好的用户。

三、协同过滤推荐现有算法的分类研究与分析

正是因为传统协同过滤推荐算法存在着诸多问题,研究者们才不断提出改进的协同过滤推荐算法。

1. 全局数值算法

全局数值算法每生成针对一个用户的推荐项目列表就需要扫描用户评价数据库一遍,这种方法能随数据的变化而变化,实现也比较简单,所以被大量才采用。但是在实践中数据稀疏性难以解决,面对庞大的用户数据库,推荐产生也非常耗时,从而使得整个电子商务推荐系统的实时性难以保证,成为全局数值算法面临的主要挑战。

2. 基于模型的算法

基于模型的算法只需扫描一遍用户评分数据库就可以完成对所有用户的推荐。优点是建立的模型相对于原始数据集而言小得多,因此能有效缓解推荐算法的实时性问题。但模型具有滞后效应,为了保证模型的有效性,必须周期性的对模型进行更新。而模型的训练代价高,因此该算法不适合数据更新频率快的系统。

3. 组合推荐算法

(1)协同过滤和基于内容的结合算法。两种算法的结合可以利用基于内容算法的优点,对项目进行相似度匹配,尤其当项目尚未得到用户评价的情况下也能推荐给用户,避免新项目问题;另一方面利用协同过滤的特点,当用户数和评价很多时,协同过滤推荐更准确。

(2)协同过滤和基于关联规则的结合算法。关联规则技术用于协同过滤系统是利用Apriori算法通过挖掘用户的评价记录的关联来进行推荐。该算法往往首先对客户的购买行为进行关联规则挖掘,并进行单一客户的偏好建模;然后,应用协同过滤技术寻找与此客户兴趣相似的客户集,并从客户集中找出和目标最相似的客户;最后根据匹配集合求解推荐意见。规则模型的形成可以离线进行,协同过滤推荐算法与基于规则算法的结合可以保证有效推荐系统的实时性要求。

四、协同过滤推荐算法的改进

传统的协同过滤推荐算法是用邻居用户对某一项目的偏好信息来判断用户对该项目的偏好,邻居用户是和当前用户具有相似兴趣爱好的用户。但在传统的协同过滤推荐算法中,邻居用户和当前用户的共同兴趣爱好并不一定是要预测的项目方面的兴趣爱好,而可能是另一方面的兴趣爱好。如果还是用这些邻居用户来预测,其误差可想而知。

1. 基于用户多兴趣的协同过滤推荐算法

基于此,我对传统协同过滤算法将作如下改进:(1)对用户兴趣进行分类,因为在系统中用户的兴趣是通过对项目的选择来进行了解的,所以把对用户兴趣的分类转化为对项目的分类,引入用户兴趣度的概念,来探讨用户在不同类别项目中所表现出来的兴趣差异,进而实现对用户多兴趣的了解。(2)对于同一用户,如预测项目所属类别不同,用来预测的邻居用户也不同,也就是邻居用户与待预测的项目在内容上具有一定相似性,从而保证用来预测的邻居用户与当前用户在待预测项目上具有相似的兴趣爱好。(3)用户具有多兴趣性,但用户对每类项目的兴趣也是不尽相同的,在推荐集中考虑以用户对不同类别项目的兴趣度作为权重,来分配每类项目的推荐数目。

首先将项目采用某种技术按照某种标准划分为不同类别,然后把对此类项目有评价的用户的评价信息映射到此类,统计参数,计算用户在每类项目的兴趣度,当超过阈值时,认为该用户对该类项目有兴趣偏好,并由这些用户形成聚类,从聚类中搜寻针对此类项目的邻居用户,产生推荐。

(1)按照分类规则对项目进行分类。把整个项目空间划分成若干类别,每个项目可能属于多个类别,每个类别包含至少一个项目。目前对项目进行分类有众多方法。

(2)映射评价信息,统计参数,计算用户兴趣度,建立用户兴趣度矩阵,构造用户兴趣偏好特征。假设提出了用户兴趣度Ai,j,即用户i对项目类别j的兴趣度,来衡量用户对某一类别项目的兴趣偏好。

其中Mi,j表示用户i所评价的项目类别j中的项目数目;Nk表示项目类别k中包含的项目数目。

(3)依据用户兴趣度矩阵和项目类别体系,进行用户聚类,形成用户兴趣模型。

2. 算法说明

(1)由于对同一用户,需要分别在不同的项目类别中分别计算其邻居用户。

(2)该算法对数据的稠密性要求比传统的协同过滤推荐算法要高。

(3)用户的兴趣可能会随着时间而变化,有的项目类别可能会随着时间的推移使用户对他失去兴趣,所以推荐系统必须密切注意用户的兴趣是否改变,最好的办法就是持续跟踪。

(4)推荐算法同样具有新异性,但不像传统算法那样更具有新异性,同另一角度也说明该推荐算法更具准确。因为新异性在一定程度上是和准确性相对的,不可能新异性和准确性同时很高,准确性高的算法必然会新异性低,反之亦然。

五、基于用户多兴趣的协同过滤推荐算法的电子商务推荐系统分析

协同过滤技术基本思想是基于评分相似的最近邻居的评分数据向目标用户产生推荐,推荐算法处理的基础数据是不同用户对项目的评价。评价可以是布尔型的也可以是实数,数值的大小代表喜欢的程度,也称为评分。协同过滤有利于判断符合用户兴趣的商品。例如在用户评价表中共有M个用户对N个商品进行了评分,要在M个商品项中找出符合用户兴趣的S个项向用户推荐。基于此,我们做如下推荐系统的分析:

1. 业务需求分析

电子商务网站有两个方面需要个性化推荐系统,即改善客户关系和提高网站的销售能力。(1)改善客户关系。个性化推荐系统要能够在用户的使用过程中尽可能的满足用户的需求,实时地和用户保持互动和联系,及时获得用户的需求并做出响应,能根据用户的反馈信息进行学习和自我完善。(2)提高网站的销售能力。能够吸引更多客户购买;在用户购买时实施交叉销售,用户的推荐请求,给出最适合于用户的商品,并推荐其他相关的商品;为网站对商品进行更新提供信息支持,辅助网站及时推出有热销潜力的特色商品,实现与其他网站的差异化销售。

2. 用户需求分析

用户访问电子商务网站的主要目的是寻找并购买需要的商品。其需求主要表现在:(1)用户在网站中要能够顺利地寻找到所需要的商品,根据对商品信息的了解、系统的推荐程度和其他人的评价等决定是否购买。(2)用户能根据自己的认识对商品进行评分和评价。评分是一些个性化推荐算法的数据基础,应该鼓励用户对商品进行评分。评分或评价也是用户做出购买决定的参考。(3)系统服务定制。用户能选择并享受系统设定的个性化服务,这些服务是管理员分析用户的兴趣对系统进行的功能设置。

3. 业务分析

用户访问电子商务网站的主要目的是选择购买符合自己需求商品,整个业务流程从登录网站到购买商品生成订单结束。从什么渠道怎么支付如何获得商品实体是在网站外部完成的,不在网站上的业务流程之内。

4. 数据流图(DFD1层)主要处理分析

个性化推荐系统主要有以下处理过程:用户定制服务、行为记录、个性化推荐、购买商品、对商品评分等。第一层数据流图可如图1所示:

用户根据系统设置的服务进行服务的定制。系统获得用户选择的服务项目编号,查询数据库是否设置并开通该服务,如果是保存用户定制到用户定制表中;否则返回错误信息。用户定制DFD如图2所示:

用户在个性化推荐系统中的浏览行为,如点击链接、查看商品信息等都会被记录到日志中,也能被系统记录,作为挖掘用户兴趣的信息。用户行为记录过程的DFD如图3所示:

六、结束语

电子商务推荐系统是个新兴的研究与应用领域。随着用户需求水平的提高,推荐算法与系统的研究在不断发展和完善。文中提出的基于用户多兴趣的协同过滤推荐改进算法,正是为了解决现实中存在的用户兴趣问题而产生的。算法中由于对项目进行了分类,所以跨越项目类别和推荐的新异性在一定程度上可能不及传统的协同过滤推荐算法。这将在未来的研究中要进一步思考和研究的问题。

参考文献

[1]邓爱林 左子叶 朱扬勇:基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,14(9):P1665~1671

[2]欧立奇 陈莉 马煜:协同过滤算法中新项目推荐方法的研究[J].微计算机信息,2005,21(11~3):P186~187

[3]索琪 卢涛:基于关联规则的电子商务推荐系统研究[J].哈尔滨师范大学自然科学学报,2005,21(2):P50~53

电子商务推荐系统 篇9

1 电子商务推荐系统定义

电子商务推荐系统的定义为:“利用电子商务网站向客户提供商品信息和建议, 帮助用户决定应该购买什么产品, 模拟销售人员帮助客户完成购买过程。”推荐系统的当前工作就是根据一定的算法, 给出对目标用户的推荐项目。在网上购物环境下的以商品为推荐对象, 为用户推荐符合其兴趣爱好的各类产品, 如各种书籍、音像等。这种推荐系统也称电子商务个性化推荐系统, 简称电子商务推荐系统。

2 电子商务推荐系统的作用

商家通过推荐系统保持与客户的联系, 提高电子商务系统的访问量, 从而提高电子商务系统的销售能力。推荐系统主要通过如下三种途径增加销售:

2.1 将电子商务系统的浏览者转变为购买者

电子商务系统的访问者在浏览过程中经常并没有购买欲望, 电子商务推荐系统能够挖掘出一些潜在用户, 向他们推荐其感兴趣的商品, 从而将一些网站商品的浏览者变成实际的购买者。

2.2 提高电子商务系统的交叉销售能力

电子商务推荐系统在用户购买过程中向其推荐其他有价值的商品, 使用户购买自己确实需要但在购买过程中没有想到的商品。这种个性化电子商务能够发现用户的购买模式, 减少用户冗余访问, 从而有效提高电子商务系统的交叉销售能力。

2.3 建立和加强用户的忠诚度

如果电子商务推荐系统的推荐质量很高, 那么用户会再次访问这个网站, 并会推荐给其他人。由于这种“一对一”的服务, 进一步吸引了用户, 使用户在站点上逗留的时间加长, 有效地防止用户离去, 提高了用户对电子商务站点的忠诚度。

3 基于关联规则个性化商品推荐系统的实现

基于关联规则的推荐算法可以分为离线的关联规则推荐模型建立阶段和在线的关联规则推荐模型应用阶段。离线阶段使用各种关联规则挖掘算法建立关联规则推荐模型, 这一步比较费时, 但放在离线模块进行;在线阶段根据建立的关联规则推荐模型和用户的购买行为向用户提供实时的推荐服务。

3.1 关联规则

关联规则是一种发现数据集中项与项之间可能存在的相关性的挖掘技术。以下给出的数学模型用来描述关联规则的发现问题。设I={i1, i2, …, im}是项目集合, 其中的元素称为项 (item) 。记D为交易 (Transaction) T的集合, 这里交易T是项的集合, 并且T?I。对应每一个交易有唯一的标识, 如交易号, 记作T I D。设X是一个I中项的集合, 如果X?T, 那么称交易T包含X。一个关联规则是形如X?Y的蕴涵式, 这里X?I, Y?I, 并且X∩Y=φ。规则X?Y在交易数据库D中的支持度 (S upp or t) 是交易集中包含X和Y的交易数与所有交易数之比, 记为support (X?Y) , 即s up p or t (X?Y) =|{T:X∪Y?T, T∈D}|/|D|规则X?Y在交易集中的可信度 (Confidenc e) 是指包含X和Y的交易数与包含X的交易数之比, 记为con fidenc e (X?Y) , 即c on fidenc e (X?Y) =|{T:X∪Y?T, T∈D}|/|{T:X?T, T∈D}|给定一个交易集D, 挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度 (Minsupp和最小可信度 (Mi nconf) 的关联规则。可信度说明了蕴涵的强度, 而支持度说明了规则中所出现模式的频率。具有高可信度和强支持度的规则称为“强规则” (S t r o n g Rules) 。一般地, 给定一个事务数据库, 关联规则挖掘问题就是通过用户制定最小支持度和最小可信度来寻找强关联规则的过程。

3.2 模式产生

通过用户给定的最小支持度, 寻找所有频繁项目集, 即满足support不小于minsupport的所有项目子集。事实上, 这些频繁项目集可能具有包含关系。算法实现的过程如下:首先产生频繁1-项集L1, 然后是频繁2-项集L2, 直到有某个r值使得L r为空, 这时算法停止。这里在第k次循环中, 过程先产生候选k-项集的集合Ck, Ck中的每一个项集是对两个只有一个项不同的属于L k-1的频集做一个 (k-2) -连接来产生的。Ck中的项集是用来产生频集的候选集, 最后的频集Lk必须是Ck的一个子集。Ck中的每个元素需在交易数据库中进行验证来决定其是否加入L k, 这里的验证过程是算法性能的一个瓶颈。这个方法要求多次扫描可能很大的交易数据库, 即如果频集最多包含10个项, 那么就需要扫描交易数据库10遍, 这需要很大的I/O负载。很明显, 本算法有两个缺点:一是可能产生大量的候选集, 二是可能需要重复扫描数据库。为此, 可以引入修剪技术来减小候选集Ck的大小, 这样可以显著地改进生成所有频集算法的性能。经过挖掘发现的模式将按照结构化的方式存储在模式数据库中。一般地, 我们只关心那些不被其他频繁项目集所包含的最大频繁项目集的集合。发现所有的频繁项目集是形成关联规则的基础。

3.3 推荐过程

通过用户给定的最小可信度, 在每个最大频繁项目集中, 寻找confidence不小于Min confidence的关联规则。关联模式形成后, 使用关联规则推荐算法用顾客原始交易记录作为数据源, 通过数据预处理转换成标准顾客交易数据。产生top_n推荐的算法步骤如下:

(1) 根据交易数据库中每个用户购买过的所有商品的历史交易数据创建每个用户的事务记录, 构造事务数据库。

(2) 使用关联规则挖掘算法对构造的事务数据库进行关联规则挖掘, 记为关联规则集合R。

(3) 对每个当前用户u, 设置一个候选推荐集P u, 并将候选推荐集Pu初始化为空。

(4) 对每个当前用户u, 搜索关联规则集合R, 找出该用户支持的所有关联规则集合R I, 即关联规则左部的所有商品出现在用户u的当前购买数据和历史交易记录中。

(5) 将关联规则集合R I右部的所有商品加入候选推荐集Pu。

(6) 从候选推荐集Pu删除用户已经购买过的商品。

(7) 根据关联规则集合RI的置信度对候选推荐集Pu中所有候选项进行排序, 如果一个项在多条关联规则中出现, 则选择置信度最高的关联规则作为排序标准。

(8) 从候选推荐集P u中选择置信度最高的前N个项作为推荐结果返回给当前用户u。

4 结束语

近几年来, 随着电子商务的蓬勃发展, 商家竞争的日趋激烈, 电子商务推荐系统应运而生。通过推荐系统实现个性化服务已成为电子商务应用的一项新兴技术。关联规则作为数据挖掘的主要方法之一, 也引起了人们越来越多的关注。我们相信, 推荐系统技术的应用将使电子商务Web站点更人性化、更个性化、更能符合每个用户的喜好。

参考文献

[1]Peltier·J·W, Schibmwsky·J·A, Schuhz·D·E, et al.Interactive psychographics:cross-selling in the banking industry[J].Journal of Advertising Research, 2002, 4 (2) :7-22.

[2]Kirchner·H, Tolle·K·K, Krieter·J.Decision tree technique applied to pig farming data sets[J].Livestock Production Science, 2004, 12 (90) :191-200.

[3]王飞.面向电子商务的web数据挖掘的研究与设计[D].四川大学硕士论文, 2006:45-57.

[4]游文, 叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展, 2006, 16 (9) :70-72.

电子商务推荐系统 篇10

所谓的个性化推荐系统是指依据网络消费者的浏览行为和历史购买记录提取网络消费者的潜在偏好, 在此基础上为其推荐满足其当前偏好的商品。目前, 根据提取消费者偏好的方法还划分, 个性化推荐系统可分为基于协同过滤的推荐系统、基于关联规则的推荐系统和基于内容的推荐系统。其中, 协同过滤推荐算法是推荐系统中应用最为广泛的一种技术, 它是利用群组中其他用户对商品的偏好预测当前用户对其它商品的偏好, 并选择满足当前用户偏好的N个商品推荐给用户。它又分为基于用户的协同过滤推荐系统和基于项目的协同过滤推荐系统两种, 基于用户的协同过滤推荐系统是依据邻居用户对项目的评分对当前用户的未评分项目进行预测, 而基于项目的协同过滤推荐系统是依据项目的相似性评估网络消费者的偏好。这两种方法都是依据用户对项目的历史评分, 由于用户对项目的评分存在较大的随意性, 而且在大规模电子商务环境下经用户评分的项目非常稀少, 因此基于协同过滤的方法存在很大的缺陷。主要体现在以下几个方面: (1) 数据稀疏问题, 在大规模电子商务环境下, 经同时被多个用户评分的项目非常稀少, 从而导致邻居用户的计算不够精确, 推荐精度低; (2) 可扩展性和实时性差, 随着用户数量的增加, 算法执行时间成线性增长; (3) 冷启动问题, 对于已经存在于电子商务系统中的项目, 系统能够较好的得到推荐, 而对于新进项目或很少被用户评分项目却很难被及时推荐给用户, 这就导致推荐的商品过于陈旧。

对于数据稀疏性问题, 最常用的方法是给缺省值赋予固定值或平均值, 增加用户共同评分的项目数, 但是这种方法忽略了用户对项目偏好的差异性特征, 因此很少使用。于是, 研究者又提出基于奇异值分解法和主成分分析法的推荐系统, 通过降低项目空间维度提高评分密度, 但是在维度较高情况下极易导致数据的丢失, 使得找到的最近邻居用户不够精确。为了防止有效数据的丢失, 基于项目评分预测的协同过滤算法应运而生, 该方法是通过计算项目间相似性评估用户对未评分项目的值, 在一定程度上解决了数据稀疏性问题, 然而在计算相似性时仍使用传统的度量方法, 在数据量极端稀疏情况下, 对同一项目具有共同评分的用户又是极为稀少, 因此评估的评分值仍不够精确。对于可扩展性和冷启动问题, 做常用的方法就是将多种推荐模型有机结合, 建立混合的推荐系统, 但是在构建时面临较大的复杂性。

为了解决基于协同过滤的推荐系统存在的上述缺陷, 研究者又提出将数据挖掘技术引入到电子商务个性化推荐系统中, 从而出现了基于关联规则的推荐系统。基于规则的技术中的规则可以由用户自己来定或利用基于关联规则的挖掘技术定, 通过已生成的规则向用户实现推荐服务。一个规则本质上是一个If-Then语句, 规则可以利用用户静态属性或用户动态信息来建立。其优点是简单、快捷。但是利用规则来推荐信息与规则的质量和数量密切相关, 其缺点是随着规则的数量增多, 系统将变得越来越难以管理。典型基于规则的系统有IBM的Web Sphere、Broad Vi2sion。

无论是基于协同过滤的推荐系统还是基于关联规则的推荐系统, 都仅仅适用于非结构化的商品推荐, 以用户对商品的整体偏好为依据构建偏好模型, 进而搭建推荐系统, 而对于结构化的商品来说却不合适。对此, 研究者提出了基于内容的推荐系统。基于内容过滤的技术是通过比较推荐资源与用户描述文件来推荐资源, 通过与用户定义的资源描述文件进行对比, 并且对其相似词的资源进行搜索, 得到用户可能感兴趣并且没有看过的内容进行推荐。这大大增加了推荐的范围, 也增加了用户可以精确定位自己所需要的内容的可能性。典型的系统有Personal Web Watcher、Web Mate、Web ACE等。

个性化推荐在电子商务营销领域发挥着巨大的作用, 服务于人们的工作、学习、生活。虽然国内外学者提出了诸多个性化推荐系统, 但均有其各自的优缺点, 如何更好的结合各自的优势或者探索更好的推荐系统, 仍是个性化推荐领域研究的核心课题。

摘要:个性化推荐系统是电子商务个性化服务的核心技术, 它是根据网络消费者的历史购买记录或当前浏览行为捕获其潜在偏好, 进而为其推荐符合其当前偏好的商品。个性化推荐可以有效的过滤大量无关商品, 降低消费者的选择成本, 提高商品交易效率。本文立足于个性化推荐系统, 分类总结了近年来提出的个性化推荐系统的核心思想, 讨论了有代表性的研究成果, 深入分析了个性化推荐系统亟待解决的基本问题, 并总结展望了当今的发展方向。

网络推荐系统的三大挑战 篇11

亚马逊的创始人杰夫·贝佐斯说:“有100万个顾客就应该有100万个亚马逊。”为了达到这样一个梦想,过去十年中无数专家学者投身于推荐方法和技术的创新中。虽然目前网络推荐系统在各个行业都获得了广泛关注和认可,但总体来说,网络推荐系统的发展仍然处于比较初级的阶段。

今天,我们的推荐系统似乎还没有想象中这么聪明。当你从某网站上购买过一个马桶刷之后,2个月内每当你在互联网上浏览新闻时,蹦出来的广告总是与马桶有关,似乎它们还分不清购买一个马桶刷和专业马桶清洁工之间的区别。当你试图在某购物网站上寻找一款MP3播放器,你会发现出现在推荐界面的要么是销量最大的(这款产品往往也是同档次产品中比较便宜的款式),要么是网站主推的广告产品(这款产品肯定也是网站收益最高的产品),或者你只好在几十个品牌上百种各类播放器中用自己发酸的眼睛慢慢浏览,这时你不由得感慨:“想安安静静听会儿音乐真难啊!”

可见,推荐系统领域仍然面临着大量亟待解决的问题和挑战,有些问题属于技术性难题,如数据稀疏性问题、冷启动问题、大数据处理能力问题等,有的问题则属于系统设计方面的问题,如系统脆弱性问题、推荐效果评价问题等。这里,我们主要从用户体验的角度提出三个推荐系统面临的挑战以及可能的解决方案。

挑战1 用户对推荐系统“信任”的建立

在网络推荐系统的应用中,首先要解决的问题是用户的“信任”问题。用户在接触到推荐信息时,对于信息的接受意愿首先是基于对信息可信性的判断。该信息是否准确?该信息是否客观真实?该信息的生成过程是否透明?用户“信任”问题的解决直接关系着用户对推荐信息的采纳意愿以及随后的购买意愿和购买行为。

这个关键问题的解决必须通过两个途径来进行:展示能力;显示善意。研究者基于信任——技术接受模型,发现推荐系统的能力和善意影响用户对推荐系统的信任,信任影响推荐系统的感知有用性,并最终影响到对推荐系统的采纳意愿。

推荐系统的能力是指推荐系统是否能为用户做出准确的推荐,也就是推荐结果的准确性。大量的研究表明推荐系统的算法影响到推荐信息的准确性,因此对于推荐逻辑和推荐算法的研究在网络推荐系统研究领域受到学者的关注和偏爱。但实际上,这个准确性的评价标准并不是客观的,而是基于用户感知到的推荐结果与其偏好的匹配程度。同时,这种匹配程度的判断还会受到很多外部线索的影响,例如,其他用户对产品的评价分布、产品信息线索等。

推荐系统的善意显示是指推荐系统是否愿意如实、客观地为用户做出推荐。它包含了3个方面:1、推荐结果的客观性,即推荐结果是否真正依据当前用户的偏好信息与其他相关数据,通过计算机算法客观得出推荐建议,而不是为了商业目的刻意诱导用户去购买某些商品。2、推荐过程的透明度,即网络推荐系统是否提供推荐结果从何产生的原因,如阿里巴巴网站上的“购买此商品的顾客也同时购买”,表明此推荐信息是参考类似用户的购买行为,为当前用户所做出的推荐。3、推荐过程的用户参与性,即网络购物环境下让用户了解推荐产生的过程并允许用户与推荐系统进行信息的互动。如亚马逊使用的网络推荐系统会根据用户过去的消费记录,提供一系列相关商品建议用户进行评价(“喜欢”、“不喜欢”),随后推荐系统根据用户的评价信息即时推荐一批新的他们很可能感兴趣的商品。这样的网络推荐系统设计提高了用户参与度,很好地实现了与用户的双向互动。

挑战2 推荐信息准确性、多样性和新奇性的平衡

向用户推荐商品的过程中,最保险的做法莫过于给他推荐最流行和评分最高的产品,因为从概率的角度这些产品被喜欢的可能性最大,最起码这些商品被讨厌的概率会很小。例如,一项在某餐馆的研究发现:研究者在某些餐桌上向顾客展示出最受欢迎的五道菜肴的销量排名信息,这些菜肴的需求量提高了13%-20%,并且用户的用餐满意度也提高了。但是从用户体验的角度来说,这种策略不一定是最佳的选择,因为用户很可能已经知道了这些热销流行的产品,所以得到的信息量很少。长此以往,在用户的心目中对于网络推荐系统的信任就会有所下降。从另一角度来讲,更加多样化和新奇的产品推荐对网站来说也是有利可图的。多样化和新奇的产品不仅可以提高用户的体验满足感,而且对网站而言,低知名度的产品与知名产品相比所带来的毛利率更高。

遗憾的是,推荐信息的准确性、多样性和新奇性之间确实存在一定的矛盾。准确的推荐风险最小但用户体验性不足(用户认为这样的推荐过于大众化);多样化的推荐受众最广但准确性欠缺(推荐信息缺乏针对性);新奇的推荐最令人惊喜但面临较大的风险(推荐一个没人用过或者评价较低的产品,可能引起用户的警惕甚至反感)。如何权衡三者之间的矛盾成为推荐系统亟待解决的一个重要问题。

一个可能的解决方向在于用户行为的深度挖掘。一般而言,随着购物经验的积累,用户对于推荐信息中的多样化需求越来越高,并希望看到更多的“意外之喜”。所以,新用户倾向于选择热门的商品,而老用户对小众商品关注更多;新用户所选择的商品相似度更高,老用户所选择的商品多样性更强。例如,针对新老客户不同的行为模式,推荐系统可以提供类似于滑动按钮来调节“准确性—多样性”之间的平衡——用户想看热门时,算法提供热门推荐;用户想找点很酷的产品时,算法提供更多样化的推荐。

挑战3 社会化媒体与网络推荐系统

在当前技术条件下,企业能够记录、收集用户在各个领域(如文化消费、娱乐消费、电子消费品、耐用品等)、各个渠道(如网上商城、移动终端等)、各个购买阶段(产品知晓、品牌比较、产品购买、购后评价、社会互动等)的感知、行为数据并将这些数据进行整合,从而使得企业对市场的理解和对用户的需求洞察更加实时化、精准化。但这仅仅是个性化网络推荐系统的开始。很多年前,研究者就发现,用户更加相信朋友的推荐而不是商业化的“推荐信息”。社会影响要比用户的历史行为的相似性更加重要,通过社会网络分析可以更加准确地预测用户的需求和购买行为。

社会化媒体的兴起为网络推荐系统提供了新的机会——社会化推荐。如果用户的历史交易数据能够与一些社会化媒体数据(如Facebook、Twitter、微博、微信等)结合起来,那么企业将打通用户生活方式与消费行为之间的桥梁,构建出用户全面细致的生活方式图谱。我们可以通过了解用户全面的兴趣图谱预测其需求偏好,可以通过了解用户的购物经历从而判断其决策偏好,可以通过了解用户的社会网络理解其社会化需求。通过这些数据的结合,我们可以跟踪并迅速应对用户偏好的变化,能够准确预测出用户的潜在需求,能够运用社会化网络的智慧为用户提供个性化解决方案,甚至在用户自己都不知道或者不能清楚表达出某个需求时,准确地为用户设计、推荐、提供与其“情投意合”的产品和服务。

王毅:中央财经大学商学院副教授

电子商务推荐系统 篇12

关键词:数据挖掘,关联规则,电子商务推荐系统,数据库技术

0 引言

随着电子商务的迅猛发展,人类进入了信息社会和网络经济时代,商务信息爆炸式增长,客户选择喜欢的商品变得困难。如何帮助各种客户顺利地完成购物活动成为网站赢得利润和信誉的关键。在这种情况下,为客户提供个性化推荐服务的电子商务推荐系统应运而生。电子商务推荐系统“利用电子商务网站向客户提供商品信息和建议,帮助客户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”[1]。电子商务推荐系统最大的优点在于它能收集用户感兴趣的资料,并根据用户兴趣偏好主动为用户做出个性化推荐。

个性化推荐系统主要有3个作用:将电子商务网站的浏览者转变为购买者;提高电子商务网站的交叉销售能力;提高客户对电子商务网站的忠诚度。

目前,学者对电子商务推荐系统有大量的研究,主要集中在数据的获取和推荐技术[2]。个性化推荐是通过推荐算法从大量复杂的数据中分析出客户的消费习惯和偏好,因此大量有价值的数据是推荐的基础。随着网络技术的发展和数据库技术的广泛应用,电子商务中的数据也日益丰富和复杂。在推荐技术研究中,关键的问题是根据系统的数据确定合适的推荐算法。目前,学者主要致力于两方面研究:一方面努力提高算法的效率,满足实时性的要求;另一方面,改进目前的算法,使推荐效果更加完美准确。

电子商务分为B2C和B2B两种模式。本文主要侧重于对B2C电子商务的分析,应用于综合性的零售网站。目前主要的推荐方法有基于关联规则的推荐,基于内容的推荐,基于协同过滤的推荐等[3]。本文讨论关联规则在电子商务推荐系统中的应用。

1 数据挖掘与电子商务推荐

电子商务推荐系统是将数据挖掘技术应用到电子商务领域的范例。随着电子商务的应用,数据库中可以收集到大量的用户数据,如用户交易数据、用户注册数据、用户评分数据、用户咨询数据等。这些数据中蕴含着丰富的知识,基于数掘的推荐系统通过数据挖掘技术对用户行为和用户属性进行学习,从中获取有价值的知识,根据得到的知识产生推荐。

基于数据挖掘的推荐系统根据数据挖掘技术建立用户档案。用户档案的建立可以基于对用户长期行为的分析,如用户的浏览记录,购买历史、性别、职业、收入、年龄等。也可以基于用户的当前行为,如用户当前的会话行为、当前购物篮信息、当前浏览商品等。

2 电子商务推荐系统

2.1 电子商务推荐系统的结构

电子商务推荐系统主要由三大部分构成:数据采集部分、推荐方法部分和输出部分[4]。数据采集部分用来接收用户的输入信息;推荐方法部分根据一定算法和用户数据,得出对目标用户的推荐。该部分是整个推荐系统的核心部分,个性化推荐方面的研究很大一部分都集中在找到好的推荐方法;输出部分主要是指将得到的推荐以某种形式反馈给用户。

输入部分主要负责对用户信息的收集和更新。输入主要指目标用户,即要求获得推荐的人为得到推荐而必须进行一些输入,以表达自己的偏好,包括隐式浏览输入、关键词和项目属性输入和用户购买历史等。

输出部分主要负责在系统获得输入信息后,输出推荐给用户的内容。主要形式有:

①建议:又分为单个建议、未排序建议列表、排序建议列表,典型的如Top-N:推荐系统根据客户的喜好向客户推荐最可能吸引客户的前N件产品;

②预测:系统对给定项目的总体评分;

③个体评分:输出其他客户对商品的个体评分;

④评论:输出其他客户对商品的文本评价。

推荐方法部分是推荐系统的核心部分,负责对输入数据的处理,决定着推荐系统的性能优劣。推荐方法部分以推荐算法为技术支撑。

2.2 电子商务推荐系统的信息模型

电子商务系统中存在着丰富而复杂的数据,如用户交易数据、用户注册数据、用户评价数据、用户咨询数据等。这些数据中蕴含着丰富的知识,是进行电子商务推荐的基础。通过对当前主要大型购物网站的调查研究,总结出了电子商务网站的主要信息模型,如图1所示。

另外,在大多数基于Internet的网上购物商店中,商家都对商品进行了明确的分类,图2是一个简单的示例。商品分类在知识发现过程中起着重要作用。在许多实际应用中,强关联规则更易于出现在商品分类的高层,但可能会出现公共知识的重复;另一方面,低层的关联规则可能更令人感兴趣,但发现的难度更大。因此,在关联规则挖掘中选择适当的层次对于关联规则的挖掘是非常重要的。

2.3 推荐技术的选择

在进行个性化推荐时,选择合适的推荐技术是成功的关键。零售网站的特点是商品种类繁多,顾客群广泛,网站访问量比较大。基于内容的推荐只能推荐与已购买商品相似的商品,不能发现潜在感兴趣的商品;协同过滤推荐的效果取决于客户的评价分数。在现有的零售网站中,大量的商品没有客户评价或评价稀少,不适合应用协同过滤推荐技术;关联规则与其他的技术比较有如下的优点:数据源简单,不需要特殊数据源,只要有准确的交易记录即可;具有对用户购买行为的预测性,挖掘用户的潜在兴趣;可以挖掘不同类型的商品,对商品特性没有要求[5]。于是可以看出,关联规则比较适合应用在零售网站中。

关联规则挖掘就是发现数据集中项集之间有趣的关联或相互关系[6,7]。它是数据挖掘领域的一个重要分支,最近几年已被业界所广泛研究和应用。在电子商务领域,关联规则主要用于商品、链接或页面的个性化推荐。关联规则常用的挖掘算法是Apriori算法和FP-Growth算法。

Apriori算法的缺陷是它会产生巨大的候选集,需要多次扫描数据库[8,9]。如果最长的模式是n,则需要n+1次数据库扫描,当数据库较大时,性能会受到较大影响,大大降低挖掘的效率。研究者还提出了各种改进的Apriori算法,但是都不能克服原来固有的缺陷。

FP-Growth算法不需要生成大量候选项集,大大降低了搜索开销,提高了挖掘效率[10,11]。对FP-Growth方法的性能研究表明:对于挖掘长的和短的频繁模式,它都是有效的和可伸缩的,并且效率约比Apriori算法快1个数量级。

通过以上比较,本文选择FP-Growth算法进行关联规则的挖掘。

3 电子商务推荐系统的设计实现

在此提出了一个电子商务推荐系统的体系结构如图3所示。该结构分为两个部分:离线部分和在线部分。离线部分的功能是首先对原始数据进行预处理产生事务集,然后对事务集进行挖掘产生关联规则;在线部分与用户的实时交互,利用离线生成的关联规则和数据库中的信息进行分析,产生推荐,然后将推荐结果通过浏览器返回给用户。

为了验证系统的合理性和适用性,采用AdventureWorks数据源对系统进行了测试。

3.1 离线挖掘关联规则

系统的离线挖掘部分使用VS2008进行开发,数据库采用SQL Server 2005。在这一部分中,可以完成系统参数的设置、预处理、关联规则的挖掘等功能,用户界面如图4所示。

(1)系统参数的确定

在关联规则的挖掘中,首先要确定最小支持度和最小置信度两个参数。支持度是对关联规则重要性的衡量,表示这条规则的频度;置信度是对关联规则准确度的衡量,表示规则的强度。

(2)预处理

数据库中的原始数据不适合直接进行数据挖掘,需要进行预处理。预处理主要完成了以下数据处理:

①联合查询顾客表、商品表、销售订单表、销售订单明细表、商品型号表、生成事务表。事务表包括订单号,商品型号字段;

②去除事务表中商品数为1的事务;

③生成频繁项集表;

④去除事务中的非频繁商品,并将事务中的商品按降序排列。

(3)关联规则的挖掘

这里选择FP-Growth算法进行关联规则的挖掘,在第2节已经作了详细的分析。在FP-Growth算法中,最关键的两个数据结构是FP-Tree和关联规则表。将FP-Tree保存在数据表中,具体结构如图5所示。这个数据表结构充分描述了FP-Tree中的节点间的关系,节点编号表示节点在树中的惟一编号;名称表示节点所代表项目的名称;计数表示项目在事务集中出现的频次;父节点编号指向本节点的父节点;子节点数表示本节点的孩子节点数,可以判断该节点是否是叶节点。

关联规则存储在个性化推荐系统的数据库中,以备在线推荐使用,如图6所示。其中,置信度表示关联规则的强度,反映了规则的可信度。置信度是生成推荐列表的重要指标。置信度越高的规则,其结果越容易被推荐给用户。

在这一过程中主要分为3个步骤如图7所示:首先根据事务集建立FP-Tree,然后挖掘FP-Tree生成频繁项集,最后根据频繁项集产生关联规则。

3.2 在线推荐

进行在线推荐时,系统首先识别当前登录的用户,然后通过分析用户已购买商品信息与规则信息运算出推荐信息。在线推荐的流程如图8所示。

4 结语

本文以数据挖掘中的关联规则理论为基础,从应用的角度分析了电子商务系统中个性化推荐系统的需求和信息模型。针对B2C网上零售商店的特点,选择基于关联规则的个性化推荐技术,设计了一个电子商务个性化推荐系统。现实中的电子商务系统包含大量复杂的数据,只用关联规则还不能达到完美的效果。因此,下一步的工作是结合多种数据挖掘模型,实现更加完善的个性化推荐服务。

参考文献

[1]RESNICK Varian.Recommendation systems[J].Commu-nications of the ACM,1997,40(3):56-58.

[2]易明.基于Web挖掘的电子商务个性化推荐机理与方法研究[D].武汉:华中科技大学,2006.

[3]SARWAR B,KARYPIS G,KONSTAN J.Analysis of re-commendation algorithms for E-commerce[C].[S.l.]:ACM Conference on Electronic Commerce,2000.

[4]刘丽霞,庄奕琪.电子商务系统的数据挖掘与智能推荐预测的研究[J].计算机工程与科学,2008,30(2):92-95.

[5]高彩霞.基于关联规则挖掘的网上书店电子商务的研究与设计[J].大同:山西大同大学,2008.

[6]HAN Jia-wei,KAMBER M.Data mining concepts&tech-niques(Version 1)[M].Beijing:China MachinePress,2001.

[7]张峰,常会友,衣杨.基于规则的电子商务推荐系统模型和实现[J].计算机集成制造系统,2004,10(8):898-902.

[8]BODON F.A fast APRIORI implementation[C].Florida:Proc.of the IEEEICDM Workshop on FIMI'03,2003.

[9]AGRAWAL R,SRIKANT R.Fast algorithms for miningassociation rules in large databases[C]//Proceedings of20th International Conference on Very Large Data Bases.Santiago De Chile,Chile:[s.n.],2003:487-499.

[10]王新宇,杜孝平,谢昆青.FP-Growth算法的实现方法研究[J].计算机工程与应用,2004,40(9):174-176.

上一篇:作物科学施肥技术下一篇:患儿满意度