个性化资源推荐

2024-05-31

个性化资源推荐(共10篇)

个性化资源推荐 篇1

一、引言

在协作学习中, 符合学生特征的学习资源对学习结果发挥着至关重要的效能[1]。因此, 学习资源的组织是协作学习活动设计必须重点考虑的要素之一[2]。

随着信息科技的迅猛发展, 计算机与网络技术应用于协作学习的研究得到不断推进, 网络协作学习作为计算机支持协作学习的重要形式已获大众认同[3], 其学习平台在网络技术的支持下得到越来越多的关注, 学习资源的组织形式也日渐实现网络化。但目前大多数的网络学习平台还仅仅处于资源共享的初级状态, 只是将教材直接发布到学习平台中, 造成所有学生的学习内容都是简单雷同的, 没有发挥出网络学习“以学生为中心”的优势。

此外, 随着网络学习平台中的资源不断增多, 学生要快速准确地定位感兴趣的信息变得越来越困难。为了挑选适合自己的学习资源, 他们通常要费时费力地检索、浏览后才能确定是否符合个人所需。因此, 亟需一种有效的数据挖掘技术应用于目前的网络学习平台中, 为学生提供符合其学习特征的信息服务, 从而创造一个智能化和个性化的网络学习空间。

正因为当前的网络学习平台都只是单纯致力于向学生提供海量的数据, 而缺乏有效的个性化推荐机制[4]。所以, 在网络学习平台中引入基于数据挖掘的资源推荐服务可以使学生从“信息超载”中解脱出来, 减少学生在资源检索上花费的时间和精力, 使网络学习平台从以资源为中心转向“以学生为中心”, 朝着信息服务的更高层次发展[5]。

鉴于云计算技术被公认为当下数据存储访问的有力保证, 本研究通过在云端搭建协作学习平台, 利用云计算技术设计稳定、快速、有效的学习资源管理模型, 为网络协作学习的资源库建设提供新的案例参考。同时以Web数据挖掘技术为协作学习活动引入个性化资源推荐服务, 满足学生对信息资源的个性化需求, 推动协作学习活动走向智能化和人性化。

二、知识背景

为能更清晰地解释本研究中云协作平台的个性化资源推荐服务原理, 以下将对相关的知识背景做一个概述。

(一) Web数据挖掘

如前文所述, 如何从海量数据中获取感兴趣的资源?数据挖掘的出现解决了这一难题, 它所指的是从大量、繁复、模糊、随机的结构化数据库信息中提取隐含的有用数据的过程[6]。

网络技术的快速扩张, 衍生发展出数据挖掘技术对网络数据的研究分支, 即Web数据挖掘, 它以分布式存储于Web文档和服务中的非结构化海量数据为处理对象。

如图1 所示, Web数据挖掘根据处理对象的不同可分为内容挖掘、结构挖掘和日志挖掘[7]。

Web日志挖掘在Web数据挖掘中的应用非常广泛, 因此本研究将详细探讨Web日志挖掘。

Web日志挖掘是从Web服务器日志中挖掘有用信息来发现用户浏览规律和预测其访问行为的技术[8]。目前研究得最多的是对日志文件的挖掘。如表1 所示, 在Web服务器日志中记录的信息存在一般文件所具有的完整结构和相应格式。当用户访问Web站点时, 相关的日期和时间、登录的名称和地址、请求的页面和状态等数据, 都会在日志中留下相应记录, 因而对其进行数据挖掘是可行的。

常见的Web日志挖掘有以下两种:

1.一般使用模式的挖掘

一般使用模式的挖掘是指通过分析用户的使用记录来了解用户的访问路径和对Web站点的浏览模式及倾向, 从中获取页面的逻辑关联, 为改进Web站点的组织结构提供决策依据。

2.个性化使用记录的追踪

个性化使用记录的追踪倾向于分析用户的访问习惯, 然后根据用户的使用偏好提供符合其兴趣要求的的个性化服务接口。

本研究将采取Web日志挖掘中个性化使用记录的追踪技术提取云协作平台用户的个性化信息。根据这些信息再借助Web文本挖掘技术便可构建起相应的个性化推荐服务。

(二) 个性化推荐服务的设计

传统的网络学习平台受数据处理与存储能力的局限, 和资源库之间只存在着简单的数据交换[9], 学生只能通过学习平台提供的简单的浏览与查询功能进行网络学习, 学习过程缺少智能化。由于智能化需要根据用户的个性化需求提供信息服务, 或通过分析用户的行为习惯和使用偏好, 主动向其提供可能需要的信息服务, 所以随之而来的是海量数据的存储和处理。因此要提高学习平台的智能性, 满足学生个性化学习的要求, 需借助云计算的分布式处理和虚拟化技术的优势, 为网络协作学习活动引入个性化资源推荐服务。本研究所架设的支持个性化推荐服务的云协作平台结构如图2 所示。

1.个性化推荐服务模型

具体的实际应用如图3 所示, 主要体现为:在云协作平台中提供大量的学习资源, 当学生发现新的学习资源时, 并不知道该资源对其是否有用, 因而需要浏览资源的具体内容或者描述说明, 若该资源不符合其学习的需要, 这种浏览就毫无意义。为了节省时间, 提高网络学习的效率, 可在学习平台中引入个性化推荐功能, 通过分析该学生在以往使用过程中所产生的个性化信息来预测新的资源是否能够满足其学习的需求, 并将预测结果反馈给该学生。在此基础上, 学习平台将向该学生推荐可能对其有帮助的资源。

2.个性化推荐服务流程

当学生通过云协作平台进行网络学习时, 与Web服务器产生推荐服务的交互数据, 这些数据主要包括该学生访问Web时留下的一些信息, 其中包括:登录时间、用户名称、访问次数、请求页面等。Web服务器首先将这些交互数据提取出来形成Log文件;然后对这些数据进行分析, 从中提取该学生的个性化信息, 并将这些信息存入其个性化信息库, 作为今后进行资源推荐的学习依据;最后再根据这些信息, 对学习平台中的学习资源进行分析, 找出对该学生学习可能会有帮助的资源, 并将这些资源推荐给该学生。同时, 上述流程会在一定的时间间隔后被反复执行。

三、方法设计

(一) 个性化信息挖掘技术

学生对哪些学习资源感兴趣是最直接也是最有效反应学生个性化需求的信息。因此, 根据学生的Web服务器日志信息, 挖掘出该学生曾经浏览过的学习资源, 可以判断其中哪些是其感兴趣的, 哪些是其不感兴趣的。目前, 利用浏览兴趣度来判断用户对浏览内容是否感兴趣的方法已经得到广泛认同[10]。以下将对浏览兴趣度的测算进行描述。

假设该学生对一个资源的累计浏览次数为C, 每次浏览的持续时间为T, 浏览资源的总字节数为B, 则浏览兴趣度P的计算公式为:

在学习平台中, 一个学习资源可能是文本, 也可能是图像、动画、音频、视频等多媒体文件。而公式 (1) 并没有考虑文件类型的不同所产生的差异;另外, 每个学习资源不仅包含资源本身, 还包含一个对资源的简单描述, 称为资源的简介。因此, 根据学习资源的上述两个特点, 定义如下算法计算该学生对一个资源的兴趣度I。

算法1 学生- 资源兴趣度算法

输入:累计浏览次数C, 每次浏览的持续时间T, 浏览资源的总字节数B, 资源内容系数 α, 资源类型系数 η, 资源简介系数 β。

输出:学生对资源的兴趣度I。

Step1:计算资源内容的浏览兴趣度Pc。

假设累计浏览次数为n, 每次浏览的持续时间为Tc, 浏览资源内容的总字节数为Bc, 资源内容系数为 α, 资源类型系数为 η, 则资源内容的浏览兴趣度Pc的计算公式为:

Step2:计算资源简介的浏览兴趣度Pb。

假设累计浏览次数为m, 每次浏览的持续时间为Tb, 浏览资源简介的总字节数为Bb, 资源简介系数为 β, 则资源简介的浏览兴趣度Pb的计算公式为:

Step3:计算资源的浏览兴趣度P。

根据公式 (2) 和 (3) , 资源的浏览兴趣度P的计算公式为:

Step4:计算学生对资源的兴趣度I。

假设资源的总数为N, 则学生对资源的兴趣度I的计算公式为:

如果存在I ≥ 1, 则认为该学生对这个资源感兴趣, 否则不感兴趣。

从Web日志中很容易就能获取上述信息, 因此不难判断在已访问的资源中哪些是该学生感兴趣的, 哪些是不感兴趣的, 这些信息就构成了该学生的个性化信息。

学习平台可以根据这些个性化信息为该学生推荐其可能感兴趣的学习资源。

(二) 学习资源推荐技术

根据个性化信息推荐学生可能感兴趣的学习资源的过程, 实际上就是对学生没有访问过的资源进行分类的过程。因此可以将已访问过的学习资源作为样本集, 实现资源分类。

在各种分类方法中, 朴素贝叶斯分类法的逻辑结构简单, 能快速、准确地进行文本分类, 而且性能稳定, 实施花销小[11]。所以, 本研究选取朴素贝叶斯分类法来实现学习资源的个性化推荐。

1.朴素贝叶斯分类原理

假设样本集C上有m个分类, 记作C={c1, c2, …cm};每个样本包含n个属性值A={A1, A2, …An}, 分别使用n维特征向量X={x1, x2, …xn} 表示。根据朴素贝叶斯定理, 后验概率为:

由最大似然假设概念可知, P (X) 对于所有类为常数。公示 (6) 可以简化为:

一般情况下, 如果类ci的先验概率{P (c1) , P (c2) , …P (cm) } 未知, 则通常假设它们是等概率的, 即:

此时类ci的先验概率P (ci) 可以不纳入计算和判断之中, 最大化P (ci|X) 等价于P (X|ci) 。但在大多数情况下会假设t为类ci的训练样本数, T为训练样本总数, 则类ci的先验概率能由公式P (ci) =t/T计得。

如果给定样本集中属性数量较多, 计算P (X|ci) 的难度可能会加大。为降低P (X|ci) 的计算复杂度, 可以假设各个类之间是相互独立的, 各属性的取值不存在依赖关系, 即:

先验概率{P (x1|ci) , P (x2|ci) , …P (xn|ci) } 可以从训练样本中求得。

对于每个属性AK, 如果AK是离散的, 则P (xk|ci) =sk/si, 其中sk是属性AK的属性值xk在类ci中的训练样本数, si是ci中的训练样本数;如果AK是连续的, 则利用数据处理软件将每个连续属性进行离散化处理, 然后再用相应的离散区间替换连续属性值[12]。

当给未知样本X分类, 根据公式 (7) , 对每个类ci计算P (ci|X) , 当且仅当:

样本X被分配到类ci中。换而言之, 样本X被分配到使P (ci|X) 最大化的类ci中。

基于朴素贝叶斯分类法的训练流程和分类流程如图4 所示。

综上可知, 朴素贝叶斯分类法不仅有着宽广的应用范围, 而且还能很好地扩展到超大规模的问题解决上面, 这一点非常符合云协作平台中资源推荐的海量数据处理需求。以下将利用朴素贝叶斯分类原理进行个性化学习资源推荐的算法设计。

2.资源推荐算法

根据朴素贝叶斯分类法预测未知样本的工作原理, 定义如下算法计算资源分类概率P。

算法2 资源推荐算法

输入:样本属性A、特征向量X。

输出:资源分类概率P。

Step1:建立特征向量集。

根据从Web日志中挖掘出的当前用户的个性化信息, 将已访问过的的学习资源分为感兴趣类c1 和不感兴趣类c2, 提取每个资源或其资源描述的特征向量, 形成训练集。

当出现新的未知分类的学习资源X时, 处理资源或其资源描述的内容, 建立未知资源X的n维特征向量{x1, x2, …xn}。

Step2:计算概率P1、P2。

由公式 (7) 可知, 未知资源X属于类c1 的概率P1和属于类c2的概率P2分别为:

Step3:计算概率P (c1) 、P (c2) 。

假设N1、N2 各表示类c1、c2 资源的总数, 则类c1、c2 的先验概率P (c1) 、P (c2) 分别为:

Step4:计算概率P (X|c1) 、P (X|c2) 。

根据公式 (9) , 概率P (X|c1) 、P (X|c2) 分别为:

Step5:计算概率P (xi|c1) 、P (xi|c2) 。

假设|V|为未知资源X的特征向量总数, TF (xi, c1) 、TF (xi, c2) 分别为特征向量xi在类c1、c2中出现的次数之和, 则资源X的特征向量xi在类c1、c2中的概率P (xi|c1) 、P (xi|c2) 分别为:

Step6:判断资源表类2别资源并测试向实用验数户据集推荐。

分别计出未知资源X是该用户感兴趣类资源c1的概率P1和不感兴趣类资源c2的概率P2。如果存在P1>P2, 则该用户可能对资源X感兴趣, 否则可能对资源X不感兴趣。如果资源X属于感兴趣类资源c1, 则推荐给当前用户。学生 (数据集) 感兴趣 (项) 不感兴趣 (项) 学生 (数据集) 感兴趣 (项) 不感兴趣 (项) 学生S1 (U1) 323 245学生S6 (U6) 357 226学生S2 (U2) 313 233学生S7 (U7) 398 266学生S3 (U3) 364 274学生S8 (U8) 399 340学生S4 (U4) 407 300学生S9 (U9) 384 274学生S5 (U5) 261 224学生S10 (U10) 341 224学生 (数据集) 总数正确数正确率学生 (数据集) 总数正确数正确率表3标记为感兴趣的资源统计情况

四、实验分析

本研究采用小学五年级的信息技术学科来验证推荐服务的有效性。首先从云协作平台的资源推荐服务器中随机选取10名学生的Web日志作为实验数据。将学生收藏到“个人云盘”中的学习资源标记为学生感兴趣的资源, 将置于“回收站”中的学习资源标记为不感兴趣的资源。然后从资源内容或资源简介中提取这些资源的特征向量构成资源测试实验数据集如表2所示。Vjj iicxTVFFcx Tcx P1222, , 1| (18)

(一) 信息表挖3 掘标记的为有感兴效趣性的资测源试统计情况

对于每一名学生Si, 测试其个性化信息挖掘的有效性, 具体实验过程如下:学生 (数据集) 总数正确数正确率学生 (数据集) 总数正确数正确率学生S1 (U1) 34829384.20%学生S6 (U6) 36433190.93%学生S2 (U2) 32428888.89%学生S7 (U7) 381 324 85.04%学生S (U) 352 296 84.09%学生S (U) 393 334 84.99%

1.从Web日志中提取学生Si的日志记录。

2.对学生Si的Web日志记录进行数据清理, 提取其中与数据集Ui中的资源所对应的访问日志。

3.根据算法1计算学生Si对数据集Ui中的每一个学习资源的兴趣度I。

4.根据兴趣度I是否大于1对学习资源进行分类, 将分类结果与实际分类属性进行比较, 计算方法的正确率。

实验结果如表3、表4和表5所示。

从表5 可以看出, 个性化信息挖掘的正确率总体达到85% 以上, 基本满足学习资源推荐的实际需求。

(二) 推荐效果测试

对于每一名学生Si, 对其学习资源推荐的总体推荐效果进行实验测试, 具体实验过程如下:

1.从资源数据集Ui中随机选取50% 的资源作为训练集, 剩余50% 的资源作为测试集。

2.应用算法1 提出的个性化信息挖掘方法, 对训练集中的学习资源进行是否感兴趣的分类, 构成最终的训练集。

3.应用算法2 提出的基于朴素贝叶斯分类原理的学习资源推荐方法, 对测试集中的资源进行推荐, 计算推荐的正确率、查准率和查全率。

4.重复10 次测试后, 计算所有测试数据的平均值, 作为学习资源推荐的最终测试结果。

实验测试结果如表6 所示:

从表6 可以看出, 学习资源推荐的正确率、查准率和查全率均超过80%, 其中平均正确率达到83.76%, 平均查准率达到82.22%, 平均查全率达到81.93%, 基本满足学习资源推荐的实际需求。

五、结束语

本研究将数据挖掘技术应用于云计算支持的协作学习平台中, 提出了基于Web日志挖掘的个性化信息提取方法和学习资源推荐方法, 为网络协作学习活动引入了个性化资源推荐服务这股“活水”, 从而提高了网络学习平台的智能性, 满足了学生个性化学习的需求。本研究的实验结果表明, 构建在云协作平台上的个性化资源推荐方法具有较高的正确率、查准率和查全率, 基本符合个性化学习资源推荐的实际要求。

个性化推荐技术还在不断地发展和变化中, 应用的领域也在不断地扩大和深化。从本研究所做工作来看, 虽然在一定程度上解决了网络协作学习活动中个性化资源推荐服务的一些问题, 但着眼点比较单一, 存在着以下两个方面需要作进一步的完善。

第一, 本研究中的大部分技术都是沿用Web数据挖掘中现有的成熟技术, 虽然能够实现推荐服务的基本功能, 但实现的方法、手段和效率都有待提高。因此, 下一步还需要继续探讨Web挖掘的其他新技术, 以达到改进算法的目的。

第二, 跟踪学生学习兴趣的动态变化是本研究忽略的问题。学生特定的学习行为能够反应出学生当前的学习兴趣所在。因此, 应当重视跟踪学生这类学习行为并重新设计数据库的文件结构以便做好信息记录。此外, 个性化推荐服务需要更为深入地发掘能够体现学生学习偏好的行为特征, 从而为学生提供更加切合实际的推荐服务。

摘要:研究指出, 符合学生特征的学习资源对提高协作学习的效率有着重要的影响。但随着学习资源的不断增多, 传统的“人找信息”模式已难以适应学生对学习资源的需求。针对目前海量数据带来的“信息超载”问题, 可考虑借助云计算的海量数据处理能力, 以及Web数据挖掘的信息提取手段和资源推荐技术, 设计一种基于云计算支持的协作学习资源推荐方法。实验表明, 构建在云协作平台上的资源推荐方法具有较高的精确度, 基本符合个性化学习资源推荐的实际要求。

关键词:云计算,协作学习,个性化,资源推荐,数据挖掘

个性化资源推荐 篇2

摘要:在实时推荐服务中,如果较早的进行个性化推荐,商家通过点击流收集到得信息较少,推出的个性化方案可能并不能精确命中用户的需求,无法转化为顾客的购买行为;如果为了收集到尽量多的信息而延后推荐,那么就面临着用户流失的风险。那么,如何在推荐时间和推荐质量之间进行权衡呢?文章通过博弈论的方法,构建了一个模型,并就其简单情形进行了分析,得出均衡的时间t。

关键词:个性化推荐;博弈论;实时性;推荐质量

一、 引言

个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。随着web2.0的成熟和普及,个性化推荐在技术和形式上突飞猛进。在新的网络环境下,用户不再是被动的网页浏览者,而是成为主动参与者。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手段,更重要的是可以增进用户的黏着性。个性化推荐系统已经给电子商务领域带来巨大的商业利益。据Vent ureBeat统计,Amazon的推荐系统为其提供了35%的商品销售额。

當前计算机技术的不断发展也为个性化推荐提供了有力的保障。传统数据挖掘技术和点击流分析技术能够帮助网络销售商随时更新网站内容,给每位浏览该网站的用户提供个性化的服务,以及时抓住当前用户。以往的推荐技术都是根据用户历史浏览和购买行为,预测其后续的需求,从而推出个性化推荐方案。然而,每个人的需求其实是一个实时性的,即会随着时间的变化而变化。比如说,今天我需要一块香皂,明天可能需要一个U盘,如果根据以往的购买历史行为,作出的个性化推荐必然困囿于家居方向,而完全没办法兼顾实时的用户需求。对用户点击流的分析技术可以帮助我们部分解决这个问题。用户登录网站后,会有不同的点击行为,形成一系列的点击流,从中商家可以分析出用户当前感兴趣的商品,如此实时的监控技术可以使得商家并不完全根据用户历史消费行为来推出个性化推荐方案。结合点击流分析和数据挖掘技术,商家可以利用用户的历史消费信息和当前的实时浏览信息共同决定个性化推荐的方案,如此一来,能够较好地提高个性化推荐的精确度和转化率。

新的技术和方式的应用必然会遇到新的问题。对点击流的分析可以帮助商家更实时的了解用户需求,并做出适当的个性化推荐。然而,既然是对“流”的分析,必然涉及到时间的问题。即:从用户登录网站以来,必然要发生一系列的点击行为,那么,在何时推出个性化推荐的方案,才能使得效果最好呢?可以设想一下,如果较早的进行个性化推荐,商家通过点击流收集到得信息较少,推出的个性化方案可能并不能精确命中用户的需求,无法转化为顾客的购买行为--我们称之为“推荐质量低”;如果为了收集到尽量多的信息而延后推荐(相对应着更高的“推荐质量”),那么就面临着用户流失的风险--用户不可能永久的停留在你的网站上,一旦在一定的时间内没有搜寻到满意的商品,很有可能会离开,或者是用户在某一时点已经找到满意的商品从而完成购买行为,此时,个性化推荐失去了价值,从而失败——尽管你的推荐方案可能是质量高的(精确地命中了用户的需求)。另外,从用户的角度考虑,更长时间的浏览,必然导致搜寻成本的上升,从而降低顾客的满意度,使得顾客黏性下降,不利于商家留住老顾客。因此,如何在推荐时间和推荐质量中进行权衡,是商家必须考虑的一个问题。

基于以上的问题,本文应用博弈论的方法,对商家的个性化推荐和顾客的商品搜索行为进行分析,以帮助商家决策如何进行实时个性化推荐,已获得最大收益。

二、 文献回顾

消费者在进行网上购物时,产品的不同显示方式会对消费者的购买决定产品影响,Eric(2004)对智能软件代理进行了研究,结果发现智能软件代理的应用会影响网上购物的效果,包括购物时间、消费者做出购买决策时的信心、消费者做出购买决策的质量和选择要购买的产品所花费的认知努力。Sicilia(2005)对网站交互性做了研究,主要是对比交互性网站和非交互性网站对顾客处理信息及购物经历的不同影响,发现交互性的购物网站有着更多的信息处理过程、消费者对网站和产品的支持率也会更高。Cai和Xu(2008)研究发现电子商务中产品列表的不同设计也会影响消费者的购物决策,当产品质量与产品价格呈正相关关系时,如果顾客想选择高质量的产品,那么就应该按照倒序的方式来排列商品。网上购物决策支持系统的使用也会对消费者的购物行为和购买决策产生影响,有关网上购物决策支持系统的研究也有很多。H?覿ubl和Trifts(2000)曾对两种交互式决策辅助工具进行了实证研究:推荐代理RA(顾客可对商品属性的重要程度和每种属性可以接受的取值范围做出选择,推荐代理就会给出符合顾客要求的产品以供顾客选择)和比较矩阵CM(系统将会以矩阵的方式列出每种商品的不同属性情况以供顾客选择),结果发现不同的交互式决策辅助工具会对可行集的大小和质量、购买决策的质量产生影响。Bharati和Chaudhury(2004) 通过实证研究证明不同的决策支持系统会影响消费者网上购物的满意程度。Garrity(2005)也通过实证研究分析了决策支持系统的设计对顾客决策和决策结果的影响。Benbasat(2007)对推荐代理RA进行了进一步的研究,主要是推荐代理的类型、输入情况、使用过程和输出情况对顾客行为的影响。Wang(2009)又对三种有着不同的决策战略支持能力的辅助决策工具(Additive-compensatory based aid/补偿型的决策辅助工具,Elimination-based aid/消除式的决策辅助工具以及Hybrid aid supporting both strategies/混合型的决策辅助工具)怎样影响顾客感知和使用意向进行了研究,结果显示:补偿型的决策辅助工具相对于消除式的决策辅助工具来说限制性较小、得出产品建议的质量更高、购买过程所付出的努力程度更小,但是混合型的决策辅助工具与补偿型的决策辅助工具并没有什么显著的不同。Song(2007)的研究也发现,考虑到顾客对产品属性重要程度偏好和权重的决策工具更受顾客的青睐。

随着居民生活质量的提高,现有的网上购物方式已经不能满足消费者的需求,人们希望能够通过网络买到满足自己个性化需求的产品,这时对能够支持消费者实现个性化定制的决策工具的研究也就开始出现了。Dabholkar(2006)发现消费者网上购物时关注对信息定制的机会,而网站能够提供许多可选择的替代品的资料并不是很重要,减少风险、节省搜寻努力才是最重要的目标,这才是顾客使用评级网站的基本动机。Kamis等人(2008)通过一个实验来研究在线顾客使用Alternative-based和Attribute-based决策支持系统时的产品定制情况,并且运用认知适配理论发展了一个有着四个中间变量(感知易用性、感知有用性、感知愉快感、感知控制感)的理论模型,前因包括两种个性化决策支持工具和任务的复杂度。结果发现:决策支持工具会通过感知有用性和感知愉快感来影响消费者的行为倾向;在使用Attribute-based决策支持工具的时候,使用者的感知有用性和感知愉快感会更多,都优于Alternative-based DSS。任务复杂度对感知有用性和感知愉快感的影响是倒U型变化的,随着任务复杂度的增加,感知有用性和感知愉快感先增大再减小。最后还发现:Alternative-based DSS的使用者的感知易用性和感知控制感都会随着任务复杂度的增加而减小,而Attribute-based DSS的使用却可在任务复杂度较大时大大提高消费者的感知易用性和感知控制感。

Levav等人(2010)对个性化定制过程中属性的定制顺序进行了探讨,自变量主要为不同属性的定制顺序、依照属性选择集的大小进行排列;不同的定制顺序会影响使用者的意愿支付价格、定制时间、对默认选项的接受程度和满意度。文章设计了三个渐进的实验来检验假设,这篇文章主要研究了依照属性选择集的大小排列定制属性时,顺序的不同对定制效果的影响。

Shuk Ying Ho等(2011)研究了及时个性化推荐与消费者行为的关系,該文通过对消费者搜寻理论进行演绎的方式提出了多个假设,并通过实验室和实地数据进行了验证,其结果显示,随着时间的推移,商家进行个性化推荐的质量会越来越高(命中顾客需求的精确度)。本文的假设之一就是基于该文章的结论,推荐质量是关于时间的一个增函数,但其是一个概率上的增函数,即随着时间的增加,高质量的推荐的概率越大。

以上关于文献的回顾显示,在个性化推荐领域中,关注时间属性的文章很少。另外,大部分文章都是从实证的角度来研究问题,而应用博弈论的观点来分析问题的文章很少。因此,本文基于博弈论的角度,从商家和顾客双方入手,从理论上对个性化推荐中推荐时间和推荐质量的问题进行分析,以期能得到好的结果,对个性化推荐领域有理论和实践的贡献。

三、 模型构建

本文中,博弈的双方为电子商务的卖家和买家。对于卖家而言,其个性化推荐的质量为q,其出现的概率是推荐时间的增函数,Pq=Q(t)。对买家而言,有三个选择,离开网站、拒绝推荐、接受推荐,为了分析的方便,并且不失真实性,我们把前两种选择归为一类,即买家有两个选择,接受推荐和拒绝推荐。买家搜寻时间越长,成本越高,从认知上考虑,愿意继续搜寻的愿望越小,从而越容易离开网站或者拒绝推荐。因此,买家离开网站或者拒绝个性化推荐的概率是时间的减函数,其随着时间的增加而减少,我们定义为Ps=S(t),相应的,买家接受推荐的概率为(1-Ps)。如果买家接受卖家的个性化推荐,购买推荐产品,则买家和卖家双赢,分别都获得收益;若买家拒绝推荐,则双方分别付出成本,而没有收益。定义卖家的成本为收集买家点击流所花费的资源,其随着时间的增加而增加,设为mc=mc(t)。定义买家的成本是搜寻产品的时间花费,亦为时间的增函数,设为cc=cc(t)。买家的收益根据卖家推荐质量的不同而不同,其为质量q的函数,设为cr=cr(q),若拒绝推荐,则收益为0;卖家的收益相对固定,设为mr。如此,可构造博弈双方的收益矩阵,如表1。

四、 模型分析

对上述模型进行分析,需要注意:如果顾客购买了质量低的推荐——这完全是有可能的,因为顾客对自己的需求存在一定的盲目性,可能由于商家的广告或者是网页上的视觉误差,而购买了不是自己所需的商品--那么总体来说,买家的收益可以为负值。如此,上述收益矩阵则不存在完全占有策略,而需要进行分析。

1. 两质量模型。为了分析的方便,我们仅关注两种质量:在t时刻,商家给出的推荐为低质量的推荐q1(顾客接受后有负的收益),出现的概率为(1-Pq1),和给出的推荐为高质量的推荐q2(顾客接受后有正的收益),出现的概率为Pq1。如此,收益矩阵可以简化为表2。

其中,q1表示低质量推荐,其买家的收益函数为负,q2代表高质量推荐,其买家的收益函数为正。所以,买家接受推荐和拒绝推荐的期望收益分别为:

cr1=[cr(q1)-cc(t)]*[1-Q(t)]+[cr(q2)-cc(t)]*Q(t)

cr2=[-cc(t)]*[1-Q(t)]+[-cc(t)]*Q(t)

同理,卖家在时间t给出推荐的期望收益为:

mr1=mr2=[mr-mc(t)]*[1-S(t)]-mc(t)*S(t)=mr(1-S(t))-mc(t)

对卖家而言,若要买家没有完全占有策略,需要使得 cr1=cr2。即,选择适当的时间t,使得:

cr1=[cr(q1)-cc(t1)]*[1-Q(t)]+[cr(q2)-cc(t2)]*Q(t)=cr2=[-cc(t1)]*[1-Q(t)]+[-cc(t2)]*Q(t)

两边合并同类项可得:

■=■

从上式中可以看出,对于卖家而言,若想达到均衡解,必须寻找到某一个时间点t,使得上式成立。

而对于买家而言,不论其作出何种选择(拒绝或者接受推荐),卖家的期望收益均相同,也就是说,买家的行为不能对卖家造成影响。但是卖家的期望收益会随着时间的延长而减少,因此,卖家需要尽量快得作出推荐。

因此,综上所述,在买家和卖家之间的博弈选择中,卖家处于占优的一方,其策略选择将会影响到买家的策略,相反地,买家的策略选择对卖家不会造成影响。从而,对卖家的行为求出均衡解时,整个博弈可以达到均衡。

五、 总结

随着网络的发展,信息大爆炸现象日趋明显,电子商务背景下的零售业竞争及其激烈。为了应对残酷的生存环境,各大商家纷纷推出各种营销战略,个性化推荐服务是其中应用较广泛,效果比较明显的一种策略。在新技术的推动下,个性化推荐服务不但能够跟顾客的历史消费记录作出推荐,还能根据对顾客点击流的分析实时地作出推荐。然而,在实时推荐中,选择恰当地时间进行推荐,是商家需要考虑的一大问题。本文应用博弈论的方法,从卖家和买家双方的角度出发,构造了一个双人博弈模型,并就其简化情形进行了求解分析,得出结论:卖家只有选择适当的时间t,使得其满足■=■,才能最大限度地促使买家接受推荐,购买产品,同时,延时推荐的时间越长,卖家的期望收益就越小;然而,买家的决策并不会影响到卖家的行为。

本文将博弈论的方法应用到个性化推荐当中,这在已往的文献中是没有的,具有一定的理论意义。同时,其结果对指导商家进行实时推荐服务具有一定的实践意义。然而,本文也存在一些不足,未能对复杂情况的博弈模型进行求解分析就是其中之一。另外,模型当中的参数均为虚拟函数,没有具体的函数形式,对于实际的应用有很大的障碍,如何通过实证数据的分析得出具体的函数形式亦是未来的研究方向。

参考文献:

1. 刘建国,周涛.个性化推荐系统的研究进展.自然科学进展,2009,(1):1-15.

2. R.Eric Hostler, Victoria Y.Yoon, Tor Gu- imaraes.Assessing.The Impact of Internet Agent On End Users' Performance.Decision Support Systems,2005,(41):313-323.

3. Maria Sicilia,Salvador Ruiz,Jose L.Mun- uera.Effects of Interactivity In A Web Site. Journal of Advertising,2005,34(3):31.

4. Shun Cai, Yunjie (Calvin) Xu. Designing Product Lists for E-commerce:The Effects of Sorting on Consumer Decision Making.Journal of Human-computer Interaction,2008,24(7):700-721.

5. H?覿ubl, Gerald, Trifts. Consumer Decision Making In Online Shopping Environments:The Effects Of Interactive Decision Aids. Marketing Science, 2000,19(1):4-21.

基金项目:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)“在线个性化定制:内在独特性需求与外在社会化影响之间的平衡”(项目号:14XNH087)。

作者简介:周良(1985-),男,汉族,江西省都昌县人,中国人民大学商学院博士生,新加坡国立大学信息系统系联合培养博士生,研究方向为电子商务、在线个性化定制;王璇(1968-),女,汉族,北京市人,北京化工大学经济管理学院运营管理系系主任、副教授,研究方向为电子商务、信息管理与信息系统;王宁(1987-),女,汉族,山东省临沂市人,中国人民大学商学院博士生,德国亚琛工大联合培养博士生,研究方向为电子商务、在線个性化定制。

个性化资源推荐 篇3

关键词:移动学习,个性化,学习资源推荐,模型

引言

手机等移动设备的普及使得随时随地的学习成为可能,但如何快速准确地检索、定位自己所需的资源是学习者在学习过程中面临的困难。个性化学习资源推荐关注学习者个体的特征与偏好,匹配学习者具体的学习情境,将合适的学习资源推送给学习者。以往的推荐系统不能结合用户情境信息因素,不能够个性化地满足用户的需求,于是基于情境感知的个性化推荐显得尤为重要。此外,满足学习者需求的个性化学习资源是受多因素共同影响的,用户本身的特点兴趣、学习的目标以及对学习资源的反馈等都是重要的影响因素。

一、个性化资源推荐现状分析

国外首次实现推荐功能的是1992年构建的邮件过滤系统,该系统是基于协同过滤算法完成的,用于解决公司的资讯过载问题。1997年,人们正式提出推荐系统的概念,但此时的推荐系统还只用于电子商务领域。此后推荐系统的研究迅速展开,逐步扩展到决策支持系统方面,随着大众需求的提高,用户希望出现个性化的推荐,个性化推荐成为研究者关注的热点。在教育领域内,由于近年来网上学习资源的增多导致了信息过载等问题,使学习资源的个性化推荐成为学者研究的焦点,研究成果包括基于用户行为兴趣偏爱的推荐和基于情境的个性化推荐等。

(一)基于情境的资源推荐

结合情境的推荐能够更加个性化地服务于大众。将情境感知结合到人体健康、医疗等应用软件,使用户获取的信息更加符合实际情境。在教育领域内,Yau[1]研究了移动学习环境下地理位置、网络状况以及学习时间等因素对个性化移动学习的影响,为移动学习环境下的资源推送提供了大量的经验。根据不同的情境特点推送给用户不同的资源信息,这对于推送的个性化有很好的促进作用。

(二)基于学习者个人人关兴趣的推荐

为实现对用户推荐信息的个性化,学者们往往会考虑用户的兴趣偏好以及其他一些细节上的属性信息从而实现对用户的个性化信息推荐。2012年,孙歆[2]等结合协同过滤算法以学习过程中用户学习行为和在线学习资源的特点为基础,设计了基于协同过滤技术的在线学习资源个性化推荐模型。2015年,查英华[3]等人从高职学生的学习兴趣特征方面考虑,建立了学生与学习资源之间的二元关系,使学生的学习易于迁移和扩展,实现了个性化的推送。以上学者从用户的个人行为偏爱等角度去提升资源推送的个性化,使用户获取到基于兴趣属性的学习资源。

(三)考虑学习者特点的推荐

牟智佳[4]等以学习者模型为分析对象,以个性化推荐系统为技术支持,设计了基于学习者模型的个性化学习资源推荐框架。以上总结了国内外学者关于个性化资源推荐在基于情境信息、学习者用户行为兴趣爱好和学习者特点等方面的推荐研究。研究者解决了基于个性化推荐的不同内容的研究问题,并给出了自己的设计方案和思想。但关于学习资源的个性化推荐的具体细节介绍还不够全面,例如:没有考虑学习者的学习目标和用户反馈等内容,更没有关于学习情境、学习者行为兴趣、学习者特点、学习目标和用户反馈相结合的个性化推荐。

二、移动学习的优势和个性化推荐的需求

(一)移动学习的优点

移动学习的优点:学习场景的可变换性、学习时间的碎片化和学习内容的多样化。移动学习的一个非常突出的优点就是学习场景的可变换性,即学习者可以在不同场景、不受地理位置的限制进行学习;人们进行移动学习时可以不受时间的限制、利用空闲时间进行碎片化学习,学习者对于学习的时间控制度是相对自由的,碎片化的学习有利于学习者对知识的掌握和理解;学习内容的多样化,网上的学习资源的种类繁多、呈现形式趋向于多样化,使学习者能够有更多的选择去接触更多的教育资源。

(二)移动学习个性化资源推荐的需求

移动学习逐渐成为人们日常学习的一种方式,与传统的教室学习不同,这种学习方式使学习者有着不一样的学习体验,学习者对于系统推荐的学习资源也有了新的实际需求。

1.学习资源推荐的内容

吸引用户阅读兴趣的内容具有多样化、有针对性和实时性强等特点。被推荐的学习资源内容的多样化可以激发他们的学习兴趣,使学习者对推荐的学习资源有新鲜感。在实际学习中,一部分用户是具有明确的学习目标的,针对用户想要达到的学习目标进行个性化推荐,能提高用户对推荐资源的学习使用率。内容的实时性表现在推荐系统依据用户的反馈评价筛选出最新的学习资源。

2.学习资源推荐的情境

在移动学习环境下,用户对学习资源的需求随情境而改变。个性化的推送方式考虑到每一位学习者的实际地理情境和时间情境,从而筛选出最适合当前情境的学习资源。结合了情境信息而推送的学习资源更加容易被学习者所接受。在不同的环境里,声音和明暗程度等对学习者的学习有一定的影响,推送的学习资源应从优先适合这些环境的资源中去筛选。

3.资源推荐的形式

个性化学习资源的推荐形式是非常重要的,学习资源本身可以是多形式的,例如:文本、图片、视频等格式。学习者的学习兴趣和接受理解的水平不同,所以,依据用户的偏向性选择资源的推荐形式更能提高用户对推荐资源的学习兴趣。

三、移动学习中的个性化推荐模型

(一)当下当下常见的个性化资源推荐算法

1. 协同过滤算法

该算法的基本原理是:根据学习者的学习记录形成学习者用户模型,然后利用相似性度量方法计算学习者用户或学习资源之间的相似度。常用的相似度量方法有:余弦相似度和皮尔森相关系数等。找出与该用户或学习资源相似度高的新用户或学习资源,形成“邻居”,然后对这些“邻居”进行评分高反馈好的资源推送。该算法的缺点是冷启动问题和稀疏问题。

2.基于内容的推荐算法

该推荐算法主要是利用用户选择对象的内容特征,匹配用户兴趣偏好,其特征提取是对推荐对象的文本内容进行分析[5]。其优点是它不需要其它用户的数据,没有冷启动问题和稀疏问题,并且简单直观,不需要领域知识。缺点是基于内容的用户资料是需要有用户的历史数据来支撑计算的,对多媒体的特征提取还不成熟以及无法适用多语言描述的推荐对象。

3.关联规则的推荐

基于关联规则的推荐技术是先由管理员定制出相关的规则条目,然后依据定制的规则度量项目间的相互关联性,最后将关联密切的项目推送给用户[6]。优点是可以应用于所有领域,具有通用性。缺点是新录入系统的学习资源由于缺乏支持度而不会被推送,且随着规则的数量增多,系统将会越来越难以管理。

4.基于社会化标签的个性化推荐

基于社会化标签的个性化推荐原理是通过对用户以往浏览的各类资源所拥有的标签进行综合分析,寻找推算出用户所喜欢的目标标签,然后把持有相关目标标签的学习资源推荐给学习用户,从而实现个性化推荐。用户在标注资源时所使用的标签既反映了用户自身的兴趣,又反映了资源的特点。缺点是难于精准地对学习资源进行标签划分。

(二)个性化推荐模型应用的算法

本模型采用的是基于社会化标签的思想,将推荐的影响因素归纳为标签,分别为情境因素、用户特点因素、用户兴趣因素、用户目标因素和反馈因素。将网络上的学习资源比作N维欧几里得空间中的向量,向量的维度可以为n维,每一维度代表学习资源的一个标签特征,在本模型中将n=5,即情境、用户特征、用户兴趣、用户目标和反馈5个标签特征,每一个标签拥有自己的子标签,它们的数值代表该特征标签影响推荐效果的大小权重。每一个学习资源相对应的每一个用户都有一个自己的社会化标签集合。依据各因素的权重综合计算出学习资源的推送优先级(如图1)。

(三)个性化推荐模型

在该模型中,系统结合学习者的学习情境模块、学习者特点模块、学习者兴趣模块、学习者的学习目标模块和反馈更新模块以及个性化推送内容模块的属性权值筛选出个性化的学习资源,从而实现个性化学习资源的推送(如图2)。

1.学习情境模块

该模块主要用于管理学习者的地理位置信息情境和学习时间情境。地理位置信息情境按照外界干扰因素程度来划分,考虑到声音嘈杂度、光线亮度,将其分为高、中、低三个干扰程度。学习时间情境分为早上、白天、晚上,分类出适合的文本、图片、音频和视频的学习资源属性。根据不同的学习情境计算出适合用户的学习属性。

2.学习者特点模块

该模块用于建立存储风格迥异的学习者模型,从学习者的年龄、性别、受教育水平、学习内容4个属性来建立学习者的个人模型,将新的学习者与之前学习者模型进行相似性比较,然后选择重叠性高的学习者模型资源进行优先推送。

3.学习者兴趣模块

该模块用于搜集学习者用户的兴趣,通过存储学习者的浏览记录和学习资源的标签,搜集记录学习者感兴趣的和不感兴趣的内容,能够直观地体现出学习者的学习需要,为个性化资源推荐模型提供了丰富的信息支撑。

4.学习目标模块

该模块用于存储学习者的学习目标,信息的收集途径为用户的标签选择。

5.反馈更新模块

该模块用于存储用户的反馈和评价信息,使系统实时地对用户的兴趣习惯等进行更新。

6.个性化推送内容模块

在该模块中,系统结合学习者的学习情境模块、学习者管理模块、学习者兴趣模块、学习者的学习目标模块和反馈更新模块的属性权值筛选出个性化的学习资源。

学习资源推送流程分为数据收集、信息筛选、个性化推送和反馈四个阶段。

首先,进行数据收集阶段。该阶段的目的是收集学习者用户的个人资料,旨在通过这些信息来了解用户的需求,并将这些信息划分到学习情境模块、学习者特点模块、学习者兴趣模块和学习者目标模块。通过新用户的注册信息,或通过第三方软件账号的登录来获权知道新用户的个人信息。然后是信息筛选阶段。该阶段是系统根据数据收集阶段得到的用户需求倾向筛选网络资源的过程,综合经过反馈模块更新后的学习者特点模块、学习者兴趣模块、学习者目标模块和学习者情境模块得到的信息来完成筛选过程。在众多资源中筛选出适合学习者的学习资源,然后通过GPS定位、手机的型号特点和网络类型等获知情境信息。其次,是个性化推送阶段。该阶段是个性化推荐系统向每一位学习者用户推送个性化学习资源的阶段。经过信息筛选阶段,个性化推荐系统向每一位学习者推送符合学习者个人需求的学习资源,然后把学习资源发送到学习者用户的应用界面上。最后,反馈更新阶段。该阶段是根据用户的行为轨迹变化和用户的评价来收集每一位用户的最新进展信息,并将其反馈到最开始的收集资源阶段。

(四)个性化推荐模型的优点

个性化的学习资源推荐模型是基于学习情境、学习者特点、学习者兴趣爱好、学习目标和反馈更新5个维度来考虑的个性化资源推荐模型。依据用户实际应用中所遇到的实际情况而推出适合学习者的学习资源。综合考虑了学习者的情境信息、学习者的特点、学习者的兴趣爱好、学习者特点和用户的个人反馈等维度,更加综合全面地给学习者推荐用户喜欢的学习资源。

四、有待进一步研究的问题

本文对移动学习环境下学习资源的个性化推送模型进行了具体的阐述,提出了适用于不同情境下的个性化资源推送模型。在教育学习方面,个性化资源推荐能够帮助学习者更快地选择自己有效的信息资源,但关于该学习资源的个性化推荐的相关研究还有待继续深入,如用户信息的安全性问题、如何推荐真正适合用户的资源信息和基础学习资源数据库的建设问题。

参考文献

[1]Jane Yin-Kim Yau,Mike Joy.A Context-Aware Personalised M-learning Application Based on M-learning Preferences[J].International Journal of Mobile Learning and Organisation,2011,(01):1-14.

[2]孙歆,王永固,邱飞岳.基于协同过滤技术的在线学习资源个性化推荐系统研究[J].中国远程教育,2012,(08):78-82.

[3]查英华,朱其慎.基于个性化推荐的移动学习模式探究——以高职学生为例[J].职教论坛,2015,(23):57-60.

[4]牟智佳,武法提.电子书包中基于学习者模型的个性化学习资源推荐研究[J].电化教育研究,2015,(01):69-76.

[5]王小军,王运,郝.个性化推荐系统在移动学习中的应用研究[J].中国教育信息化,2015,(23):20-23.

个性化推荐:电子商务驱动力 篇4

由于供应链和物流的发展,在电子商务的虚拟环境下,商家在网上所能提供的商品种类和数量非常多,用户想找到自己感兴趣的商品,就需要浏览大量的无关信息,这个过程会导致用户不断流失,用户也无法通过一个小小的计算机屏幕就能很方便地发现自己感兴趣的商品。因此,用户亟需电子商务系统具有一种类似采购助手的功能来帮助其选购商品,它能根据用户的兴趣爱好自动地推荐给每个用户可能感兴趣且能让用户满意的商品。

在此情形下,电子商务个性化推荐系统(Personalized Recommender Systems in E-commerce)应运而生,也称个性化推荐系统(Personalized Recommender Systems),它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求。

个性化推荐系统犹如汽车的发动机,将电子商务发展带入一个新的时代:个性化时代。通过数据的积累和分析,通过技术的不断应用和创新,人们在海量资讯的信息时代自由翱翔。

电子商务个性化推荐的框架

电子商务个性化推荐(Personalized Recommendation in E-Commerce)是电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买的过程。它能收集用户兴趣资料并根据用户兴趣偏好主动为其做出个性化的推荐,这样,当用户每次输入用户名和密码登录电子商务网站后,推荐系统就会自动按照用户偏好程度的高低推荐给用户最喜爱的产品。

按系统的观点,电子商务个性化推荐框架可视为三个模块组成部分,分别是输入、输出和推荐方法与技术,如图1所示。

个性化推荐的输入模块表明从哪里去获取用户的偏好。所以主要涉及两部分,一是用户信息获取的平台,最典型的平台当然是传统的电子商务平台和网站,但随着社会网络(如Facebook、Twitter、Renren等)的应用,基于社会网络的社会商务的广泛应用,社会商务系统也成为获取用户信息的平台。从偏好的表现形式来看,包括隐式浏览输入、显式浏览输入等。显式偏好主要包括用户的评分、用户关系标注等;隐式偏好主要包含用户的浏览、查询等。此外,在移动商务环境下,用户的情景信息,如所在地址、天气等,也是推荐的输入。

个性化推荐的输出主要包含两种形式,一是预测,预测用户对某商品的偏好;二是推荐,基于预测直接给用户推荐其可能感兴趣的商品。具体从应用上看,主要包括偏好预测、链接预测、专家发现、朋友搜索以及个性化搜索等。

推荐方法模块是推荐系统的核心部分,决定着推荐系统的性能优劣。主要的推荐技术包括:

协同过滤推荐

协同过滤推荐(Collaborative Filtering Recommendation)是目前研究最多的个性化推荐技术,它是基于邻居用户的资料得到目标用户的推荐,推荐的个性化程度高。具体来讲,协同过滤推荐一般主要分为两类:一是基于内存的协同过滤(Memory-based Collaborative Filtering),其基本思想是用统计的方法得出所有用户对物品或者信息的偏好,然后发现与当前用户口味和偏好相似的“邻居”用户群,基于某个邻居的历史偏好信息,为当前用户进行物品的推荐,所以该方法也称基于用户的协同过滤(User-based Collaborative Filtering)或基于邻居的协同推荐(Neighbor-based Collaborative Filtering);二是基于模型的协同过滤推荐(Model-based Collaborative Filtering),是指根据用户和物品的直接历史点击或购买记录,来计算物品和物品之间的相似度,得出一个模型,然后根据用户的历史偏好的物品信息,将挖掘到的类似的物品推荐给用户,即用此模型进行预测。

与传统文本过滤相比,协同过滤有以下优点:一是能够过滤难以进行机器自动基于内容分析的信息,如艺术品、音乐;二是能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;三是推荐具有新颖性。正因为如此,协同过滤在商业应用上也取得了不错的成绩。Amazon、CDNow、MovieFinder都采用了协同过滤的技术来提高服务质量。

基于内容的推荐

基于内容的推荐(Content-based recommendation)是信息过滤技术的延续与发展,项目或对象是通过相关特征的属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,依据用户资料与待预测项目的相匹配程度进行推荐,如新闻组过滤系统NewsWeeder。

基于用户统计信息的推荐

基于用户统计信息的推荐(Demographic-based recommendation)的推荐系统是基于用户个人属性对用户进行分类,再基于类对类中的用户进行推荐,它不要求有一个历史的用户数据,但协同过滤和基于内容的推荐技术则都需要。

基于关联规则的推荐

基于关联规则的推荐(Association rule-based recommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象,其中关联规则的发现最为关键且最耗时,是算法的瓶颈,但可以离线进行,商品名称的同义性问题也是关联规则的一个难点。

此外,还用基于效用的推荐(Utility-based recommendation)和基于知识的推荐(Knowledge-based recommendation),前者基于用户对产品的效用函数,后面更多采用人工智能和推理技术。

个性化推荐系统的作用

目前个性化推荐在电子商务企业有着较为广泛的应用。Amazon 被业界认为是当之无愧的“推荐之王”,是目前公认的推荐应用最为成功的案例,从推荐的形式来看,Amazon把推荐服务放到了网站的各个角落;在推荐方法技术上,Amazon综合了多种推荐服务类型,基于item相似性和相关性,基于浏览/购买历史,基于协同过滤等等,能够根据客户当前查看页面类型,当前关注的产品信息等内容动态地组合这些推荐服务。著名团购网站Groupon也推出个性化交易功能,向用户推送其认为用户会感兴趣的交易,个性化能帮助该网站抵御500个克隆网站的侵袭,将允许Groupon提供不限量的交易,也能提供大城市外的业务交易。

电子商务个性化推荐在实践中对电子商务具有重要意义。Amazon.com的前总裁Jeff Bezos说,“如果我在网上有3百万个客户,我将要建立3百万个商店”,其意思就是说要为每一个客户建立一个个性化的商店,以便提供更个性化的客户服务。个性化推荐的最大优点在于,它能收集用户特征资料并根据用户特征,如兴趣偏好,为用户主动作出个性化的推荐。而且,系统给出的推荐是可以实时更新的,即当系统中的商品库或用户特征库发生改变时,给出的推荐序列会自动改变。这就大大提高了电子商务活动的简便性和有效性,同时也提高了企业的服务水平。事实上,个性化服务可以给企业带来巨大的商业价值,一个成功的个性化推荐系统的作用主要表现在以下几个方面:

一是将电子商务网站的浏览者转变为购买者。电子商务系统的访问者在浏览过程中经常并没有购买欲望,个性化推荐系统能够向用户推荐他们感兴趣的商品,从而促成购买过程。

二是提高电子商务网站的交叉销售能力。个性化推荐系统在用户购买过程中向用户提供其他有价值的商品推荐,用户能够从系统提供的推荐列表中购买自己确实需要但在购买过程中没有想到的商品,从而有效提高电子商务系统的交叉销售。

三是提高客户对电子商务网站的忠诚度。与传统的商务模式相比,电子商务系统使得用户拥有越来越多的选择,用户更换商家极其方便,只需要点击一两次鼠标就可以在不同的电子商务系统之间跳转。个性化推荐系统分析用户的购买习惯,根据用户需求向用户提供有价值的商品推荐。如果推荐系统的推荐质量很高,那么用户会对该推荐系统产生依赖。因此,个性化推荐系统不仅能够为用户提供个性化的推荐服务,而且能与用户建立长期稳定的关系,从而有效保留客户,提高客户的忠诚度,防止客户流失。

据说Amazon 30% 的销售是依靠推荐带来的。著名掘客类网站Digg在使用个性化推荐技术后,Digg行为的活跃度获得了明显的提高,每天的用户Digg总数提高了40%,平均每个有digg行为的用户每天会获得200个推荐结果,用户好友数增加了24%,用户的评论数增加了11%。

电子商务个性化推荐的未来

目前,几乎所有的大型电子商务系统,如Amazon、eBay等,都不同程度地使用了各种形式的推荐系统。各种提供个性化服务的Web站点也需要推荐系统的大力支持。个性化推荐系统具有良好的发展和应用前景。未来个性化推荐可能会有以下重要的发展方向:

面向社会商务的推荐

随着社会网络和Web2.0的发展,未来电子商务可能更多依托于社会网络平台,基于这种平台的社会商务可能成为未来电子商务的重要发展方向。在社会商务环境下,用户成为商务活动的主体,更加强调用户与用户的互动与共享,在这个环境下,个性化推荐的作用将更为重要,推荐的内容包括好友推荐、商品推荐等。

微博是目前影响最大的一种重要社会网络,聚集了大量的客户,基于微博的个性化营销是未来营销的一个重要思路。企业可以通过借助微博,基于用户的推荐,对新产品进行病毒式营销。Hotmail在早期通过病毒营销的方式,在半年时间里就吸引了1200万注册用户,每天超过15万新用户的速度发展,但其费用还不到竞争者的3%;Unilever(联合利华)通过策略主题为"Dove - Real beauty"的病毒营销活动,在不到10天的时间里,有230万消费者,扩大产品知名度(Van der Lans et al. 2010)。著名唱片公司TiVo1为推广新唱片,选择1000多位用户为其免费提供唱片。

移动商务环境下的推荐

目前的电子商务还主要是以互联网为主体,随着未来三网融合以及智能手机、便携式计算机、PDA等智能终端的发展,移动电子商务是未来发展的一个新动向。相应地,面向移动商务的推荐也变得更加重要。这主要有两方向的原因,一是移动终端界面小,用户操作不方便,更需要一种自动化的推荐方法帮助用户方便地推荐其偏好的商品;二是在移动环境下的推荐下除了需要考虑用户的偏好,推荐还必须考虑用户的情景信息,如时间、地点、天气等。

移动个性化服务是指移动内容和服务的提供商根据用户的年龄、身份、职业等个人特点、偏好等因素以及情景,为用户提供针对性的个性化的服务。在这种模式下,用户不再只提意见和要求,而是作为参与者与内容提供商一起按照用户的需求开发出能使他们产生共鸣的个性化产品,并通过自制或定制的产品来展示自己的独特个性。一个最广泛的应用行业就是旅游业,从用户最开始的旅游地点的推荐,到行程路线、交通工具、住宿、购物等各个环节,都可以为用户提供个性化的服务,这种推荐不但要考虑用户偏好,还必须基于用户当前的地点、天气和环境等因素。

交互式个性化推荐

目前推荐的一个前提假设是用户能较为清晰地表达出自己的偏好,但事实上很多时候用户难以自己表达出自己的偏好,需要与系统进行交互,用户对系统给出的推荐进行评判,然后系统再进行推荐,多次循环的交互推荐,才能保证推荐准确性。Amazon允许用户提供或者修正推荐所依赖的信息,比如用户可以查看并修改自己的档案、浏览历史,可以对感兴趣的或不感兴趣的商品进行管理和打分,可以通过社区进行讨论、评论、反馈相关商品,而所有这些信息一经修改或产生后直接对推荐的结果产生影响,从而提供推荐的准确性。比如,某用户去想购买一台电脑,如果该用户对电脑知识一无所知,他是无法通过一些具体配置指标来准确描述其偏好的,在这种情况下,也许推荐系统需要通过和用户进行交互,不断识别其偏好。

进一步提高个性化推荐算法的精度

个性化推荐的核心部件是推荐方法,但目前已有方法本身存在一些问题,影响推荐算法的准确度,未来研究的一个主要方向将是针对这些问题提出推荐方法的改进。主要问题包括稀疏问题(Sparsity),因为用户的评价数据非常稀疏了,使得个性化推荐方法无法使用,或推荐精度非常低;冷开始(Cold-Start)问题,指如果一个新项目没人去评价它,或都不去评价它,则这个项目肯定得不到推荐;奇异发现(Serendipity)问题,如何使推荐的结果既符合用户的偏好,又能保证产品间的差异最大化;健壮性问题,由于竞争的原因,竞争对手人为地假数据,推荐系统如何能识别并保证推荐结果是可靠的。

由单个推荐方法向商务智能分析工具转化

个性化推荐算法研究 篇5

1 个性化服务的发展

个性化服务最初是于1995年卡耐基·梅隆大学的A Robert等人在美国人工智能协会上提出的Web2Watcher个性导航系统作为起始的,是一个开始的标志。而后1999年德国Dresden技术大学的J Tanja实现了个性化电子商务原型系统TELLIM,从此个性化服务开始向全球发展。2000年,NEC研究院D B kurt等人为搜索引擎Cite Seer增加了个性化推荐功能,我国也在此时开始了个性化的研究。到2001年,个性化的研究已经在商业领域得到了广泛的应用。

2 个性化服务的含义

个性化服务通过手机和分析用户信息来学习用户的兴趣和行为[1],能够更好地理解用户,发现用户隐藏的兴趣和群体用户的行为规律,从而制定相应的信息过滤策略,按照用户的个性化信息进行主动的推荐服务。它能为不同用户提供不同的服务,以满足各自同的需求。个性化技术的应用使得用户的需求在网页访问上得到了进一步的体现,从而节省了用户的宝贵时间;其次,个性化的研究有助于实现用户的隐性需求,可以进一步挖掘用户的需求,从而为用户提供更加完善的服务;第三,个性化有助于提高用户对网站的忠实度,由于某个网站保存了用户的相关个性化信息,从而方便用户下次访问时提供更加快捷和准确的服务,对于网站本身也是有很多益处。

3 个性化服务的研究领域

个性化服务的研究领域很广泛,搜索引擎方面个性化服务应用最为广泛。具有代表性的有Google的i Google服务,网络是一个巨大而且分布广泛的全球化的信息服务中心,因而网络是个性化发展的一个宽广的平台,潜力无限。

电子商务同样是值得开发和研究的行业。自从电子商务的兴起,人们对于这种便捷和快速、安全的购物方式就十分青睐。商品的琳琅满目总是使得我们很难找到自己需要的商品。然而个性化的研究则可以很好解决这个问题,它不仅解决了用户搜索自己所需商品的时间,同时个性化服务做得好的网站得到了用户的信赖,增加了网站的人气和人们的忠实度,另一个方面同时也可以进一步推销网站的相关商品。因而个性化服务已经成为电子商务发展的加速器。

在传媒行业个性化的深入也得到了体现。随着信息技术发展和应用的深入,网上的新闻采、编、发更加速了新闻的流程。而且由于网络的时效性、快速性、广泛性、廉价性和交互性,网络往往成为更多读者阅读新闻的选择。但是网络如今的信息泛滥,新闻也是多的令人目不暇接,因而个性化的引入使得读者在阅读后网站可以记录下该用户的阅读偏好,以便提供相关内容更加贴合用户的需求。比如,一个用户长期阅读军事方面的内容,而对其他的内容不是经常阅读,通过个性化算法可以在以后给用户提供更加全面和丰富、实时的军事信息,对于网站改进自己的服务和提高用户的忠诚度有着深远的影响。

在网络学习方面,学习者很难找到适合自己学习的内容,网络上又有大量有用资源没有被学习者发现,形成了巨大的浪费。个性化的研究可以提高学习效率,给用户提供更加准确的信息,增强学习效果。

4 个性化服务的实现

要实现个性化服务,学习和跟踪用户的行为和兴趣是首要任务,而后设计一种合适的表达方式。组织好资源,选取资源的特征,才能把资源推荐给用户,并保证采用合适的推荐方式。此外,系统的体系结构也是重要问题,其在服务器端、客户端和代理端实现的利弊也是考虑的重中之重。因为这些方面都是相互制约的。

4.1 用户描述文件

对个性化服务系统,最重要的是用户的参与,为了实现用户的兴趣与行为的跟踪,应为每个用户建立一个用户描述文件。在收集用户的信息之前,首先需分析用户愿意提供什么信息,用户一般都很注意个人信息的保密性[2],调查显示,大多数用户不愿意提供私有、敏感的信息,比如个人收入和信用卡号等。因而在进行跟踪时需要对此进行着重的考虑。

4.1.1 用户描述文件的表达

不同个性化服务系统的用户描述文件都各自有各自不同的特点,用户描述文件从内容上可以划分为基于兴趣的和基于行为的两种类型[3]。兴趣的类型是向用户提出对其兴趣的需求。这种做法比较尊重用户自己的隐私权,用户可以将自己平时的喜好来显示的告诉Web站点,从而得到自己需要个性化服务的部分,简单、快捷、交互性好。而对于行为的方式,在用户第一次使用个性化服务系统的时候,系统可以要求用户对自己的基本信息和感兴趣的内容进行描述,也可以第一次显示地进行交互。在定制好一个用户描述文件之后,系统可以让用户自主修改,也可以由系统自适应地修改,这样,系统就可以随用户兴趣的变化而变化。系统要自适应修改用户信息,必须根据学习的信息源分析当前用户的行为,从而调整用户兴趣的权重或调整用户兴趣层次结构。以便该服务系统可以向用户提供更精准的个性化需求。

4.1.2 用户描述文件的更新

用户描述文件的更新用户描述文件不可能是一成不变的,用户的需求是时刻都在改变的。根据用户的需求改变,用户描述文件应该进行相应的更新,从而满足用户进一步的需求,进而提升服务的精确度和交互性,进而赢得服务在用户心中的地位。因而对于用户描述文件的更新而言,又分为显示更新和隐式更新。显示更新是提供单独的服务模块,让用户可以自行进行需求的更变,其实现简单方便,与用户的交互性好,缺点是更新的范围受限。而隐式更新则要体现在用户操作上的习惯方面。用户的很多都可以反映用户的喜好。用户行为可以表现为查询、浏览页面、标记书签、信息反馈、鼠标点击、操作滚动条、前进、后退等,这些信息则可以用于个性化服务系统对描述文件进行创建和更新。Web日志挖掘中根据网页的点击次数来评价用户对该网页的兴趣是最常使用的方法,同样也可以根据用户在网页停留的时间来进行判断,当然这些都是不全面的。个性化服务系统应用的领域决定了它所处理的资源。目前,个性化服务系统所处理的资源仅仅限于文本范畴。资源的描述与用户的描述紧密相连,一般的做法是用同样的机制来表达用户和资源,资源描述文件可以用基于内容的方法和基于分类的方法来表示。基于内容的方法是从资源本身抽取信息来表示资源,使用最广泛的方法是用加权关键词矢量;基于分类的方法是利用类别来表示资源,对文档资源进行分类有利于将文档推荐给对该类感兴趣的用户。文本分类方法有多种,如朴素贝叶斯、K2最近邻方法和支持向量机等[4]。资源描述文件主要是为采用基于内容的过滤作准备的,因为该技术是通过比较资源与用户特征来推荐资源。

4.2 资源描述文件

个性化服务系统应用的领域决定了它所处理的资源。目前,个性化服务系统所处理的资源仅仅限于文本范畴。资源的描述与用户的描述紧密相连,一般的做法是用同样的机制来表达用户和资源,资源描述文件可以用基于内容的方法和基于分类的方法来表示。基于内容的方法是从资源本身抽取信息来表示资源,使用最广泛的方法是用加权关键词矢量;基于分类的方法是利用类别来表示资源,对文档资源进行分类有利于将文档推荐给对该类感兴趣的用户。文本分类方法有多种,如朴素贝叶斯、K2最近邻方法和支持向量机等[4]。资源描述文件主要是为采用基于内容的过滤作准备的,因为该技术是通过比较资源与用户特征来推荐资源。

5 个性化推荐

用户得到的个性化服务应该是Web提供给用户的各种个性化推荐得以实现。因而如何实现用户的个性化需求则成了个性化的一个关键点问题。根据已经建立的资源描述文件和更新的资源描述文件,可以得知用户的个性化需求方向,但是具体实现对用户的服务还是应该靠个性化推荐。个性化推荐可以采用基于规则的技术、基于内容过滤的技术和协作过滤技术。

5.1 基于规则的技术

基于规则的技术中的规则可以由用户自己来定或利用基于关联规则的挖掘技术定,通过已生成的规则向用户实现推荐服务。一个规则本质上是一个If-Then语句,规则可以利用用户静态属性或用户动态信息来建立。其优点是简单、快捷。但是利用规则来推荐信息与规则的质量和数量密切相关,其缺点是随着规则的数量增多,系统将变得越来越难以管理。典型基于规则的系统有IBM的

Web Sphere、Broad Vi2sion[5]。

5.2 基于内容的技术

基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源。相似度计算是其重点考虑的问题。绝大多数时候用户不能够将自己所需要得到的消息进行精确表达,这也是基于规则的技术中的缺点。因为人类语言的千变万化使得Web能够提供给我们的规则是有限的。因而使用基于内容的技术可以是通过与用户定义的资源描述文件进行对比,并且对其相似词的资源进行搜索,得到用户可能感兴趣并且没有看过的内容进行推荐。这大大增加了推荐的范围,也增加了用户可以精确定位自己所需要的内容的可能性。但同时也有可能为用户带来更多所不需要的信息。典型的系统有Personal Web Watcher[6]、Web Mate[7]、Web ACE[8]等。

5.3 协作过滤技术

协作过滤是根据用户的相似性来推荐资源。它与基于内容的过滤技术不同的地方是它是通过比较用户描述文件而非资源与用户描述文件来进行判断的。基于近邻用户的协作过滤技术应用比较普遍,它只依赖于用户对项目的评分矩阵,因此对于各种特定应用都有较好的适应性,通常把各个评分值当做一个向量,计算其相似度,找出最相似的邻居,根据与之最相似邻居的兴趣或偏好预测出该用户的兴趣或偏好。代表系统有Group Lens[9]、Site Seer[10]等。该方法在实践过程中遇到两个很难解决的问题:稀疏性问题和可扩展性问题。稀疏性问题也就是指在系统使用初期,由于系统资源的评价还不够多,因而该方法很难利用这些评价来发现相似的用户。可以利用LSI(latent semantic indexing)[11]方法来降低维空间,增加数据的密度,从而更容易发现用户间的相似性。可扩展性问题也就是指随着系统用户和资源的增多,该方法性能会越来越低。人们提出了基于规则[12]、聚类方法、贝叶斯网等,在文献[13]中提到了两种改进的用户最近邻选择方法,当用户数量较大时,可以比较快速、准确地找到目标用户的最近邻居,在一定程度上可以改善扩展性问题。

6 结束语

个性化服务是当前的主流网络推荐技术,在各个领域中都在发挥着巨大的作用,服务着人们的工作、学习、生活,但是个性化的算法确实千差万别,各个算法都有自己的侧重点和优势,但是却没有一个近乎完美的算法,即每个算法都有自己不可避免的缺陷。如何将这些不足之处予以避免,如何将某些算法的优势予以整合,将是今后对个性化算法优化的一个方向。

个性化图书推荐系统研究 篇6

一用户数据获取

获得用户信息有两种方法:一种是显示获取, 一种是隐式获取;其中第一种方式获取用户信息是目前最常用的一种方法。显示获取就是通过用户注册信息和用户对网络资源的显示评分来获取用户可能感兴趣的信息特征。隐式获取就是以web数据挖掘、人工智能等技术辅助获取用户浏览网页的相关信息。通过用户浏览记录提取用户的兴趣和爱好, 并将用户的偏好转化为结构化数据并存储在数据库中。信息获取过程, 用户无需参与, 能够获取很多用户兴趣偏好的反馈信息。但是隐式获取用户信息, 由于没有用户的主动参与, 所以存在很多随机性和不确定性。

豆瓣是中国最富盛名的评论和社交网站, 上面有大量用户的读书行为数据。对于一个用户来讲, 其有关读书的行为数据包括已读、浏览等类型, 一旦某本图书出现在已读、浏览两者之一的列表中, 我们就认为用户对这本书感兴趣, 我们的目的就是获取用户这样的行为数据, 并利用这样的数据来衡量推荐系统的质量。我们利用网络爬虫从豆瓣上抓取用户以及该用户的读书记录, 并将结果保存到数据库当中。

二图书文本预处理

当前, 在处理文本信息的过程中, 一般情况下, 选取词作为文本的特征项表现要优于选择词组或者字。因此, 本文选择使用词作为文本的特征项。我们首先将小说文本分成词, 由这些词组成向量元素来表示文本。但是, 我们使用中文分词器切分词条时, 经常含有大量的单个独立字, 这些独立字不仅携带信息量较少, 而且对文本分类的准确性和处理效率产生极大影响。因此, 我们在进行文本分词时, 首先要过滤单个独立字。此外, 一些数学符号以及英文字符对文本分类贡献极小, 可以忽略。最后, 需要过滤掉纯英文词条。经过上述预处理过程, 可以有效地降低文本词条向量的维数。提高文本特征向量的中文纯度。图书文本预处理实现过程如图1。

图书文本预处理后, 就可以把表示为相应的特征向量, 假设我们通过特征抽取技术抽取到的特征词个数为M, 第i个特征词表示为Ti, 那么一本图书文本表示为:{WT1, WT2, …, WTM}, 其中WTi表示特征词的权重。权重计算通常采用TF-IDF方法。

三图书文本相似度计算

本文采用向量空间模型来计算图书之间的相似性。向量空间模型 (VSM) 是由Salton等人于上个世纪60年代提出的, 目前

在信息检索、知识挖掘等领域都有着广泛的应用。其基本思想是将图书看成是由彼此之间相互独立的一个个词组成的, 即上文所说的特征向量, 同时根据每个词在文档中的重要程度为其赋予一定的权重, 即上文所说的词频-反文档频率, 这样就可以将一本图书表示为 (ω1, ω2, …, ωn) 这样的向量形式。进而我们可以用如下的公式来计算两本图书之间的相似性。其中Ti表示文本i的特征向量, T1, i表示文本1的第i个特征词对应的权重。

四图书推荐

当用户浏览网页时, 我们可以根据用户历史的浏览记录, 计算出用户的可能的兴趣爱好, 并把用户的图书浏览记录利用特征抽取技术抽取成特征向量, 然后和网络图书相比较, 通过计算图书之间的文本相似度, 把最相似的前5本图书推荐给用户。至此, 我们的图书推荐系统构建完毕。图书推荐系统流程图如下图。

五总结

本文构建了一个基于内容的图书推荐系统, 通过用户行为数据获取, 图书文本向量提取技术, 以及图书相似度计算对用户进行图书推荐, 实现了图书推荐的个性化和准确性的统一。

参考文献

[1]刘建国, 周涛, 汪秉宏.个性化推荐系统的研究进展[J].自然科学进展, 2009, 19 (1) :1-15

基于LBS的个性化推荐算法 篇7

大多数人的个性化推荐的定义[1]是由Resinck&Varian在1997年给出的。随着移动互联网的发展, 国内外研究个性化推荐算法的学者不在少数。Belkin和Croft对Cognitive filtering的概念进行了扩展, 提出基于内容的过滤 (Content-Based Filtering) 。由此形成的基于内容 (Content-Based) 的推荐算法能够解决用户冷启动、缓解数据稀疏性等问题, 但是其自身的缺点是提取特征能力受到技术限制, 无法推荐配置文件以外的推荐信息。学术届研究最多的是协同过滤 (Collaborative filtering-based) 的个性化推荐算法但是其同样存在着用户冷启动的问题, 扩展性和同一性也存在不足。另外还有其它的如基于规则 (Rules-Based) 的推荐算法也存在着关联规则的制定过于死板等问题。因此也有学者为了解决这些问题, 将各种算法结合起来, 利用每一种算法的各自优势, 弥补各自的缺点, 形成新的混合式推荐算法。

本算法在研究了现有算法的基础上将推荐看作一种了解用户兴趣偏好, 整合用户历史评分信息, 并引入了位置因素, 帮助用户缩小其选则空间进而利于用户最终做出决策的过程。本算法研究完成之后将满足如下一些特色要求:本算法将对用户兴趣变化敏感, 能处理短期兴趣;能处理变化较大的项目属性, 对位置变化敏感;无用户冷启动问题。本算法能够很好地满足在移动中使用位置感知服务的用户需求。

2. 基于LBS的个性化推荐系统的算法设计

2.1 初步推荐信息

作为个性化推荐算法我们将能否发掘用户的潜在兴趣作为算法优越程度的重要指标。所以我们借鉴经典的协同过滤算法将所有的用户对所有的项目评分合起来形成一个矩阵, 称为用户—项目评分数据矩阵[2]。通过用户对已知项目的评分找到与他评分相似的用户群, 即最近邻, 再利用最近邻对未知项目 (用户没有评分的项目) 的评分算出用户对未知项目的预测评分Pu, i。整个过程大致分为两步:邻居形成和推荐形成。

本算法基于LBS[3]则需要考虑用户当前的即时位置, 我们将距离信息作为一个参数变量, 纳入到个性化推荐算法之中。利用指数衰减方程公式1计算用户u对项目i的偏好程度受距离的影响值。其λ中的值是经过反复的正负修正[4]得到的。

由此便可以屏蔽不满足用户距离要求的推荐信息, 防止信息过于冗长。由上述描述推导公式2可形成初步的推荐列表List1。

2.2 优化推荐算法

接下来我们将优化推荐信息并且解决用户冷启动的问题。本算法引入多属性决策[5]的思想就是将各个项看作n维空间中的点, 进而测试这些点与用户需求的距离。我们根据用户的兴趣偏好定义项目的各个属性, 大致各分为区间属性和集合属性。并且将属性值标准化到统一的量纲上。经过标准化的项目属性值可以构成一个项目属性矩阵, 该矩阵包含一定量的信息, 根据Shannon信息熵理论[6], 熵是不确定性的指标。我们可以确定项属性的权重, 得到加权推荐矩阵。如下公式3 (ω为权重, χ为标着化属性值) :

要确定推荐信息那么首先要确定用户对兴趣偏好的最大最小可接受范围。因此我们将标准化后各属性取值的最大值组合成理想方案A+, 同时将最小值组合成负理想方案A-, 即

之所以选用标准化后的最大值和最小值, 是因为标准化属性值代表了该属性满足用户需求的能力, 越能满足用户的需求则值越大。形成正负理想方案后我们先计算项目i到A+和A-的欧几里德距离Si+、Si-, 然后计算计算项目i与理想方案A+的相对接近程度Ci+。Ci+的值越接近于1说明项目i满足用户需求的程度越大, 对该值按降序排列即可得到根据用户兴趣偏好筛选后形成的项目推荐列表List2。

最后我们根据初步推荐信息List1和筛选后兴趣偏好推荐列表List2 (即两个列表中共有的项目是最符合用户兴趣的) 形成单一的推荐或者Top-N的推荐列表, 推荐给用户。

3. 算法实验结果分析

3.1 相同偏好下不同位置的敏感性

在相同偏好P1下, 我们选取了两个不同的位置坐标B (120.158072, 30.259809) C (120.160217, 30.248317) (相同城市) 。对于P1的偏好设置如下表1:

推荐结果如表2、表3:

可见, 虽然使用相同的偏好信息, 但是本算法针对不同的地点给出了完全不同的推荐列表。

3.2 冷启动测试

我们选取两个不同的用户, 一个是拥有大量历史评分数据的用户小王, 一个是没有历史评分数据的用户小明。由于新用户注册时都需要显示选择兴趣偏好, 我们设置小王和小明两个用户的兴趣偏好相同。为了更好地体现该系统没有用户冷开始问题, 我们将小王和小明定位同一地点D (120.100497, 30.864658) , 使用相同偏好, 偏好P2设置如表4所示:

测试结果如表5、表6所示:

由上表可知对于一个新用户, 即使他没有历史评分, 本算法也能很好地根据用户在注册时所选择的兴趣偏好为用户提供出个性化推荐信息, 说明该系统无用户冷开始问题。

4. 结论

通过对上述算法的实验分析可得如下结论:

首先, 由相同位置下对偏好变化的敏感性测试结果可知, 本算法可以很好地处理用户的短期兴趣, 可以根据用户兴趣偏好的变化立即做出反应并给出与新偏好相适应的推荐结果, 对兴趣变化敏感。

其次, 由相似偏好下对位置变化的敏感性测试结果可见, 本算法可以很好地处理像距离这样快速变化的属性。另外由该测试可以看出, 本算法是位置敏感的, 针对不同的用户位置能够产生相应的推荐结果, 并且具有产生新奇推荐的能力。

第三, 由于本算法根据用户显示的输入偏好信息来综合用户的兴趣偏好, 并且本算法能很好地处理用户的短期兴趣, 所以无论用户是不是新用户、身处何地, 他都能够从系统中获得针对其偏好和环境的充分个性化的推荐, 这也就是说本算法不存在用户的冷开始问题。

最后本算法的相对精度较高, 能很好地根据用户的即时位置、挖掘用户的历史评分、综合用户的兴趣偏好, 为用户提供个性化的推荐信息, 能够满足实际应用的需要。

参考文献

[1]李新煜.旅游移动商务中基于位置感知的推荐系统研究[D].中国科学技术大学, 2011.

[2]李宇澄.协同过滤算法研究[D].复旦大学计算机技术, 2005.

[3]曾勇.移动LBS系统的实现[D].电子科技大学, 2004.

[4]杨芳, 潘一飞, 李杰等.一种改进的协同过滤推荐算法[J].河南工业大学学报, 2010, 03.

[5]邓爱林.电子商务推荐系统关键技术推荐系统[D].复旦大学计算机软件与理论, 2005.

基于好友影响的个性化推荐模型 篇8

随着在线消费的日益普及和交易额的逐步增大, 各大电子商务企业为了更好的吸引用户和提高网站的交叉销售量, 在其网站中都采用了个性化推荐的功能, 期望通过记录客户的购买信媒体息及物品的关联性向网站用户推荐他们感兴趣的商品, 从而增加了网站浏览者到消费者的转换率。

与此同时随着社交网络的发展, 用户的消费行为也从原来的货比三家变成了如今的通过产品销量及其反馈来进行消费决策, 在价格可接受的范围内, 用户的评分和评价影响了绝大多数用户的在线购买行为。相比于普通用户的评论, 消费者更愿意接受和信任的是其好友的评论及其推荐, 同时社交媒体的发展也为了解好友的购买行为提供了支持。

目前的电子商务推荐系统主要还是以经典的User-Based模型, Item-Based模型和LFM模型为主的推荐。本文将考虑社交网络中好友的因素, 在个性化推荐用户模型的构建中考虑好友的推荐因素, 给出推荐的模型和算法, 并通过数据抓取、分析、处理对模型进行验证、调优, 最后对于电子商务网站的个性化推荐提出改进意见。

二、相关研究

1992年, 美国施乐公司研究所开发了Tapestry系统, Tapestry的设计主要是为了解决施乐公司在Palo Alto的研究中心邮件过滤的问题。1994年, 明尼苏达大学双城分校计算机系的一个实验室推出了Group Lens推荐系统, 该系统向用户推荐文章。其运用了非常著名的协同过滤算法 (Collaborative filtering) 。

在Group Lens之后还有性质相近的Tivo, 影音推荐系统;Movie Lens, 电影推荐系统;Ringo, 音乐推荐系统等等。如今的You Tube等网站也采用的相似的思想。

随后在各类电子商务网站, 个性化推荐系统得到了广泛应用, 包括亚马逊 (Amazon.com) 、淘宝, 当当等购物网站。

协同过滤 (Collaborative Filtering) , 是指利用拥有相似兴趣或拥有共同经验的群体的喜好来向用户推荐其感兴趣的内容。用户通过评分等机制将信息传递给系统, 达到过滤的目的, 从而帮助兴趣相似的用户进行筛选。信息的反馈并不仅限于好的评分, 差的评分也包括在内。协同过滤同时又可分为评分过滤以及群体过滤, 其后者正逐渐成为电子商务当中很重要的一环。群体过滤 (Social Filtering) 即根据顾客的购买历史记录以及具有相似购买行为的顾客群的购买行为去推荐当前顾客所可能感兴趣的内容。除了推荐之外, 近年来也有研究数学运算让系统自动计算喜好的强弱程度从而加强推荐质量, 也许不是百分之百完全推荐正确, 但由于加入了强弱的评分让这个概念的应用更为广泛。

三、基于好友因素的个性化推荐模型的构建

基于Web2.0的社交媒体注重用户的交互作用, 用户会聚集成一个个的群体, 拥有相同爱好或兴趣的用户会聚集成一个兴趣小组, 从而形成以兴趣为聚合的社区。在这样一个社交社区中, 用户的购买决策从关注商品的价格、质量、功能, 转变到了关注商品的销量和用户的评论, 而其中评论和销量的数据中又有大众和好友的区分。

1. 研究对象选取

本文拟建立的是社交媒体中评论和销量对于推荐模型的改进, 对于选取的研究对象需要满足以下条件:

(1) 拥有大量注册用户

(2) Web2.0社区, 用户可以创造内容

(3) 拥有用户购买决策或消费倾向的数据

(4) 拥有API, 可容易获取数据

(5) 拥有评论、销量等基本反馈因素

(6) 拥有好友关系, 或兴趣小组

结合以上要求, 本课题选择豆瓣读书作为研究对象, 豆瓣以书影音起家, 一直致力于帮助都市人群发现生活中有用的事物, 通过桌面和移动产品来服务都市日常生活的各个方面。

豆瓣读书拥有活跃的用户群体以及丰富的好友关系网络, 对于本文的数据获取是一个便利条件。

2. 模型的总体设计

本文结合个性化推荐中产品因素和用户因素, 同时在此基础上我们增加了一个反馈因素的影响。在社交媒体影响下, 影响用户购买行为的因素包括产品影响、自身影响、反馈影响, 这些因素分别包含了以下的内容:产品影响 (产品的特性, 诸如产品的基本信息, 品质、质量等内容) , 自身影响 (包含用户的基本信息, 如出身日期, 出身地, 以及用户的偏好) , 反馈影响 (他对对自身的影响, 包含好友关系, 好友数量, 好友影响力, 他人对业务的评价, 包含用户的评论、评分, 他人对业务的选择, 包含用户的购买行为) 。为此选取的影响因素总体设计如图1所示:

3. 模型构建及假设

根据选取的研究对象以及模型的总体设计, 结合豆瓣的数据特点, 用户的阅读行为与用户自身特性, 书本特性, 普通用户行为以及朋友行为相关, 对模型的因变量以及自变量设计如图2所示:

根据计量经济学的建模方法, 建立一个多元Logit模型如式1所示:

其中U代表用户自身的因素, O代表其他用户的因素, B代表书籍本身的因素, ε为误差量 (噪声) , 模型中设计相关自变量与因变量设计如表1所示。

根据用户多元Logit模型以及自变量的选取, 用户的阅读行为可以表示为式2, 其中α1α2α3α4为自身属性系数, β1β2β3β4β5为反馈属性系数, γ1为书本属性系数。

根据用户行为模型的设计, 提出的如下假设:

(1) 用户存在从众效应, 阅读量大的数据会增大用户对该书籍的阅读。

(2) 拥有大量书评的图书会加大用户的阅读可能性。

(3) 用户更倾向于阅读偏好 (具有相同标签) 的图书。

(4) 高评分的图书更容易吸引用户。

(5) 用户的书评信息对用户的阅读产生积极影响。

(6) 在线反馈对用户的阅读倾向产生积极影响。

4. 数据获取及验证

为研究反馈机制对Web2.0时代的消费者购买决策产生的影响, 需要根据前一节中的模型设计进行数据采集并验证模型, 借助豆瓣开放的API, 编写数据采集程序, 可以获取到验证模型的数据。

根据模型数据需求, 首先获得豆瓣热门图书榜单的图书, 从每本书的评论中随机抽取2位有效用户 (阅读量>10) , 获得40位目标用户的基本信息, 好友关系, 阅读历史信息, 书本信息, 设计数据抓取方案如图3所示。

根据研究需要, 编写程序获得待处理队列, 包括书本ID, 用户ID, 用户好友ID, 并放入待处理队列, 编写程序获得需要的处理的数据并存储。数据处理流程如图4所示。

四、个性化推荐系统的研究结论

1. 模型验证

对于本文中的用户阅读行为研究 (0不读, 1为阅读) , 不能满足正态性和方差齐性, 故不能直接使用线性模型来拟合方程。而Logistic回归正是处理因变量是二分类或多分类变量的一种方法。现已广泛应用于队列研究, 已成为分类因变量的首选多变量分析模型。

根据上一节的模型设计以及数据抓取方案的设计, 为研究反馈机制对Web2.0时代的消费者购买决策产生的影响, 将处理后的数据使用Stata软件进行Logistic回归分析。

对上一节中采集到的数据进行预处理, 统一数据单位, 所有的日期用天来表示, 对于用户阅读偏好Upref进行取对数处理, 得出的运行结果如图5所示。其中P>|z|中的数值, <0.01代表自变量在1%的水平上显著, <0.05代表自变量在百分之5的水平上显著, <0.1代表自变量在百分之10的水平上显著。

2. 模型分析及结果

根据上一节的模型验证以及分析结果, 其中P>|z|中的数值<0.1时代表该自变量对用户行为有显著影响, 从分析结果可以看出以下变量对用户的阅读行为有着显著影响, UPref (用户的阅读偏好) , FRead (用户好友中对书的阅读行为) , Bread (书本的总阅读量) 。

3. 结论

由分析结果可以得出结论, 大部分选择的变量与用户的阅读行为存在着关系, 其中用户阅读偏好, 好友的阅读行为, 书本的阅读总量存在显著影响, 而用户的自身阅读总量, 用户的注册时间对用户的阅读行为影响力有限。

结合前文中提出的假设, 可以得出以下推论:

(1) 用户存在从众效应, 阅读量大的数据会增大用户对该书籍的阅读。

(2) 用户更倾向于阅读偏好 (具有相同标签) 的图书。

(3) 用户好友的阅读行为对好友的阅读倾向有显著影响。

(4) 在线反馈对用户的阅读倾向产生积极影响。

综上所述, 在Web2.0时代, 得益于用户的参与, 在线反馈在个性化推荐系统中占据着很大的比重, 也正成为各大研究的热点, 在线反馈对用户的购买决策产生了显著影响。个性化推荐系统的研究与开发对用户发现有价值的信息以及电子商务网站推荐用户感兴趣的内容都有很重要的意义。

摘要:随着社交媒体的广泛应用, 在电子商务行为中, 消费者很大程度上的购买决策会受到他人因素的影响, 尤其是好友的影响。本文提出了社交媒体网络下, 用户评论和销量对于推荐模型的影响, 建立了基于社交媒体中好友的评论的个性化推荐模型。通过从国内的社交网络中采集相关数据, 对模型的效果进行了验证。

关键词:个性化推荐,社交网络,好友影响,推荐模型

参考文献

[1]Goldberg, D., Nichols, D., Oki, B.M., Terry, D.Using collaborative filtering to weave an information tapestry[J].Communications of the ACM, 1992, (35) :61-70.

[2]P.Resnick.GroupLens:An Open Architecture for Collaborative Filtering of Netnews, ”Proc[J].Computer Supported Cooperative Work, 1994:175-186.

[3]Ali, K., van Stam, W.TiVo:making show recommendations using a distributed collaborative filtering architecture[J].In:Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004:394-401.

[4]Linden, G.Smith, B.;York, J., Amazon.com recommendations:item-to-item collaborative filtering, Internet Computing, IEEE, Jan/Feb 2003:76-80.

个性化资源推荐 篇9

关键词:用户浏览行为;电子商务;个性化推荐系统;兴趣度

中图分类号:F713文献标识码:A文章编号:1009-3044(2007)12-21528-02

An E-commerce Recommend System based on User Browse Behavior's Mining

HE Ying1,2,JIANG Wai-wen1

(1.School of Information Science and Engineering,Central South University,Changsha 410008,Cina;2.Hunan Vocational College of Commerce,Changsha 410205)

Abstract:This paper,we introduce the personalized recommend system for E-commerce and propose a new recommend system model based on user's browse behavior to mine his interests and gives its flow chart and mining algorithms in detail.

Key words:browse behavior; E-commerce;personal recommendation system;interest

1 引言

近年来,因特网的规模正以惊人的速度发展。人们越来越希望网页的内容能够从原先的以“网站”为中心转变成以“用户”为中心,尽可能地自动调整以迎合每个用户的浏览兴趣,从而让每个用户能够感觉到他是网站的唯一用户。在日趋激烈的竞争环境下,电子商务网站要想有效保留用户、防止用户流失、提高销售量,就必须实现个性化服务,即对不同用户投其所好,采取不同的服务策略,提供不同的服务内容,这就需要建立电子商务网站的个性化推荐系统。

2 电子商务网站的个性化推荐系统

电子商务中的推荐系统是利用统计学、人工智能、数据挖掘等技术,分析访问者在电子商务网站的访问行为,产生能帮助顾客访问感兴趣的产品信息的推荐结果,引导顾客的购买行为,从而产生可观的利润。推荐系统首先要分析以前顾客行为数据,建立表示顾客行为的模型,并充分利用模型对其它顾客推荐有兴趣购买的产品信息。这就要求推荐系统首先必须知道用户的兴趣、偏好和访问模式等信息。而在电子商务中,用户很多浏览行为都能很好地反映用户的兴趣。基于用户浏览行为的Web挖掘技术就是通过对用户浏览Web时的访问行为、访问频度、访问内容等浏览信息进行挖掘,发现蕴涵的、未知的、有潜在应用价值的非平凡的模式,从而获得用户兴趣,提取出用户的特征,获取用户访问Web的模式,为用户实现主动推荐,提供个性化服务。

3 基于用户浏览行为的挖掘流程

3.1在客户端获取行为数据:输入Web文档,当用户浏览完网页后,输出用户在该文档上的浏览行为,同时记录Web文档的相关信息

3.2數据预处理:对数据进行清洗,滤掉脏数据,保留一些能表示用户对某页面兴趣度的信息。

3.3用户兴趣度计算:根据选取出来的行为数据建立兴趣模型,进而计算出能反映用户兴趣的网页兴趣度。

3.4推荐:主要根据挖掘结果实施推荐,将用户感兴趣的内容的链接添加到用户正在浏览的网页。

3.5结果修正:根据用户浏览行为的反馈对推荐进行修正,如果用户接受推荐,则进行巩固;否则,根据用户的反馈进行重新推荐。

4 基于用户浏览行为的挖掘算法

4.1行为数据的选取

一个用户浏览网页时的行为数据是非常丰富的,大致可以分为以下几类:

(1)表示用户兴趣的显式行为 如利用问卷调查等形式收集用户感兴趣的信息。

(2)表示用户兴趣的标记行为 如执行保存、打印页面等动作。

(3)表示用户兴趣的操作行为 如执行剪切、复制、粘贴、搜索文本等操作行为。

(4)表示用户兴趣的链接行为 指用户在浏览页面时点击某个超链接或没有点击某个超链接等行为。

(5)表示用户兴趣的重复行为 指某个用户在某个页面上点击了 “更多”,就可以认为用户对这个页面有更多的兴趣。

(6)表示用户不感兴趣的行为 如某用户经常访问某网站,但经常只浏览其中某些页面,则认为此用户对该网站其他网页不感兴趣。

4.2网页兴趣度计算

虽然能够揭示用户对网页的兴趣度PageInterest的浏览行为很多,常规使用浏览时长、网页字节数乘积与总浏览时长、总信息数乘积的比值作为网页的兴趣度。定义为:

而经研究表明,不但用户停留在网页的浏览时间PageTotalTime能揭示用户兴趣,另外还有一种关键行为:翻页/拉动滚动条次数Number同样也表达了用户对该网页的关心程度。经仔细的分析和实验,发现PageTotalTime, Number与网页兴趣度PageInterest之间的定量关系为:

PageInterest=0.1123*PageTotalTime+ 0.0711*Number+ 95.8883

因此改进的网页兴趣度计算算法如下:

输入:用户浏览信息矩阵

输出:网页兴趣度矩阵

function PageInterest;

begin for logx=1 to n

//找出该网页的最大允许访问时间

maxtime=find(maxtime,topic);

//找出该网页的最小允许访问时间

mintime=find(mintime,topic);

//如果用户时间小于最小时间或大于最大时间,但进行了保存操作,则将其转化为对等的标准时间。

If browsetime>maxtime or browsetime

if issaved

browsetime=standtime;

endif

endif

//确定该网页的位置,并修改总浏览时长

k=locate(browtime,page_logx);

browtime(k)=browtime(k)+browtime;

endfor;

//以路径为单位计算总浏览时长、翻页/拉动滚动条次数

for j=1 to pagenum

totaltime=totaltime+browtime(j);

totalnumber=totalnumber+number (j);

endfor

for j=1 to pagenum

interest(j)= 0.1123*totaltime+ 0.0711* totalnumber + 95.8883

endfor

end function

时间复杂度分析:每条浏览行为记录计算一次,执行时间与浏览记录数量成正比,时间复杂度为O(n)。

空间复杂度分析:需要的存储空间与网页为数目成正比,最大为网页数,因此空间复杂度为O(n)。

4.3 基于用户浏览行为的挖掘算法

输入:用户浏览行为矩阵

输出:用户浏览模式

function PreferedBrow(browdata as browdatarr);

//计算前缀为path路径数

amount=count(s,path)

for i=1 to amount

interest=browdata(s,path)

if interest>mininterest

addpath(path)

endif

endfor

end function

算法的时间复杂度与用户浏览事务集合元素和浏览的最大路径长度有关,是O(M*N),其中,M表示用户浏览集体的元素数,N表示最大浏览路径长度。另外,由于该算法是一个递归算法,需要的辅助空间栈的深度为最大浏览路径长度数。

5 结束语

随着电子商务、电子政务以及网络远程教育等电子服务的发展,研究 Web环境下的个性化服务具有重要且现实的意义。本文提出的算法使得 Web 信息服务提供者根据用户网络浏览行为可正确把握其兴趣所在并可动态地对其兴趣改变进行跟踪,根据这些个性化信息调整 Web 信息资源的组织方式,最大效率地为用户提供方便快捷且实用的个性化服务。

参考文献:

[1]韩家炜,孟小峰.等. Web挖掘研究[M].计算机研究与发展,2001,38(4)405-413.

[2]Claypool M., Le E, Waseda M., et al. Implicit interest indicators. In: Campbell M,ed.Proceeding of the ACM Intelligent User Interfaces Conference (IUI), New York: ACM Press,2001.14-17.

[3]劉培刚.Web挖掘技术在电子商务中的应用研究[J].情报学报,2002(6).

电子商务平台个性化推荐模型设计 篇10

一、利用多媒体技术介绍电子商务平台个性化推荐模型特点

在电子商务平台个性化推荐模型教学过程中,需要利用先进的多媒体技术,将电子商务平台个性化推荐技术特点(安排专业调查人员,实时调查分析顾客相关信息,并且根据客户的实际需求,为其推荐或者提供让客户满意的产品或者服务),更加形象、立体地呈现出来,借助多媒体技术中的模拟人物进行情境演绎,或者利用精美的PPT展示整个设计过程,帮助学生更加深入掌握其特点,激发学生的学习兴趣。与此同时,在恰当的时机进行理论知识讲授,并且告知学生设计电子商务平台个性化推荐模型的重要性,即:一方面能够有效地满足广大顾客的个性化消费需求(由于每个客户自身个性特征、消费能力、消费审美等不同),另一方面有利于帮助企业建立良好且稳定的客户群(积极拓展消费者范围,将潜在客户发展为长期稳定客户)。

二、课堂实验设计教学

在课堂实验设计教学中,需要将学习的主动权归还给学生, 学生自主采用用户(包括项目)组合的协同过滤算法以及前瞻选择抽样算法,先对顾客样本(实验样本)进行筛选过滤,并且将这些顾客进行效用值分类(利用定义样本)。另外,还要把效用值最大的顾客视为本次研究样本推荐的依据(且进行特殊的标记), 在此条件下,解决所对应的问题,如:稀疏性问题和扩展性问题, 并且这样的实验研究方法具有重大优势,即:有利于调动广大用户的兴趣,并且有效地降低了推荐成本,提升了推荐质量,有利于帮助企业获取最大利润。在实验设计的过程中,学生遇到难以解决的问题,需要保持冷静的头脑,先自主解决,实在想不出解决办法的时候,可以请教教师(教师起到辅助、支持和参与的作用)。另外,在实验设计中,学生需要注意动态挖掘顾客行为。可以采用动态调查的方式,按照时间顺序将广大消费者的购买行为进行排序,并且将有关联的行为进行提取和整合,科学地预测出消费者的消费偏好以及消费能力,并且在调查过程中注重数据的完整、真实、客观。然后,结合教师的指导,进行预处理样本数据(利用抽样技术)。参考Movelines站点提供的数据,精准计算(尽可能降低误差),最终获取研究成果,并且在获取研究成果之后,进行小组分享交流,教师组织学生开展交流会,及时查找并且弥补学生设计的疏漏,从而提高教学质量,全面提升学生的动手实践能力,提升学生的综合技能和综合素质。

三、教学思考

电子商务平台个性化推荐模型设计教学需要根据学生的实际情况(包括学生的个性特征、学习能力、创新意识、创新能力、 动手实践能力等)开展,而且教学需要做好相应的服务工作,学生与教师保持和谐的互动交流关系,科学合理地设置相关参数, 保证顾客信息的完整、真实、客观,做好市场分析,通过先进技术后期处理,尽可能降低误差,实现教学质量质的飞跃,帮助学生养成良好的学习习惯,促进学生身心健康发展。学生自主通过一系列的顾客信息分析,及时掌握顾客行为动态,采用抽样技术对样本数据进行预处理,并且采用协同过滤算法、用户(包括项目) 组合算法进行对照实验,得出误差值最小的电子商务平台个性化推荐模型,并且将个性化深入细节,如:服务内容保持个性, 即:服务内容根据顾客的实际需求进行制定和调整,为顾客提供他们感兴趣的消费平台,尽可能地降低消费者精力的消耗;服务方式采用“PULL”服务模式,即:将信息直接发布在网页上,方便消费者直接浏览,节省消费者的浏览时间,获取消费者的满意等,实现了教学主动权的回归,与此同时,促进了教学水平的提高。

总而言之,电子商务平台个性化推荐需要综合考量不同个性、不同消费观念的顾客的实际需求,并且简化电子商务平台个性化推荐程序,尽可能地节省消费者的浏览时间,避免消费者精力的消耗,在最短时间内,吸引消费者的眼球,使得消费者对产品或者服务产生兴趣,并且将兴趣转化为消费行动力,从而提升经济效益和社会效益。另外,在教学上,需要实现质的飞跃,才能推动其可持续发展。

参考文献

[1]王茜,钱力.大数据环境下电子商务个性化推荐服务发展动向探析[J].商业研究,2014(8):150-154.

[2]贺桂和,曾奕棠.基于情境感知的电子商务平台个性化推荐模型研究[J].情报理论与实践,2013,36(6):81-84.

上一篇:引力相互作用下一篇:水利机械