偏好推荐

2024-10-07

偏好推荐（精选4篇）

偏好推荐篇1

1 概述

近些年,随着移动网络技术的日益成熟,大量日益增长的网络信息资源涌入移动网络环境中,因此信息过载和信息迷失已严重制约了人们对网络信息的使用。随之而来的是移动网络客户在移动设备上想要购买商品时的挫败感。为了缓解这些问题,搜索引擎和信息检索技术应运而生。但是它们只是将用户等同处理,其并没有考虑用户的特性,没有针对不同的用户反馈有针对性的资源,所以反馈的信息量很大,用户很难找到自己真正喜爱的信息。另一方面,这些问题一部分原因是由于受到了手机的一些特性制约。与电脑相比,手机具有更小的屏幕、更小巧的输入按键以及相对单一的浏览器。因此,移动用户所使用的移动网络应用界面相对来说不如传统网络的亲切适用。为了更好地满足移动用户的搜索偏好,一种更有效的搜索辅助功能应运而生--个性化推荐服务。

本文通过移动环境下获取用户偏好信息,并将MADM算法结合OWA算子分析个性化用户的偏好信息,进而反馈用户隐性信息需求。

2 基于移动环境下的用户信息数据挖掘

用户的偏好信息是通过移动站点中用户浏览行为的相关信息获取,以此建立模型并预测用户偏好。数据的来源是移动网络服务器内的网页数据记录,这与传统网络有些类似,但移动网络由于其独特的特性更简洁更具有优势。首先,在传统网络中,网页中含有大量GIF、JPG、SWF文件等无关元素,并且清除耗时巨大。然而,在移动网络中,受流量、屏幕限制,更多的元素是文本,例如。其次,在移动网络环境中,所有用户只能由单一的电话或是电子设备来接输送数据。这是记录用户信息的必要条件,主要用于防止在用户识别过程中出现混乱。另外,我们可以利用用户的这些相关信息提供更有效的推荐服务。再次,在移动网络中,每个用户在一定时间内所有页面的接收,都会在日志中的特定字段用相同值记录下来,例如会话标识,并且我们可以用会话标识字段作为识别每个用户个体的标识。

因此对于移动环境下的用户信息处理可以分三个步骤:第一阶段是规范化数据挖掘,主要任务是信息选取和信息预处理,可以将日志、Web内容、用户信息等资源中筛选出能为挖掘算法可用的规范化数据,其结果是后续数据处理的基础,所以必须对数据源数据整理并规范化处理;第二阶段是数据预处理,主要任务是识别用户、用户路径记录、识别会话、筛选相关数据等;第三阶段是建模,主要是根据先前处理过的数据建立推荐模型向用户提供进行推荐服务,这是个时时处理的过程,需要考虑用户某时段内浏览路径,用户的浏览路径信息指的就是用户在某时间段在网站内所浏览的不同页面。

3 用户访问偏好兴趣挖掘

在移动网络环境下,就前面提到,由于移动网络的特殊性,我们可以借此对新注册用户和浏览用户这些潜在消费群体推荐。通过用户的浏览轨迹获取偏好,进而分析独立客户偏好特性来进行有针对性的推荐服务。其整个过程如下图1所示。

在此假定用户对某有限数量的特定商品感兴趣,其中该商品分类中的有限商品中每个商品是用户点击浏览过的一个页面。用户浏览时间、点击率、页面结束等信息,我们利用C.Sha⁃habi提出的客户追踪机制原理获取,所得信息自动记录在用户行为数据库内,用来反应用户对该项目的偏好,从而推测出用户的偏好兴趣。可根据用户当前的行为数据,获取商品之间的关系,所要达到从用户行为中反馈的不完全偏好信息提取某用户对该商品的偏好序列,而后通过MADM方法估算每个属性的权重。

假定用户偏好程度有如下情况:

a.用户对只浏览的商品,浏览累积时间越长用户越偏好。

b.相比只浏览商品,用户对放入购物篮的商品更偏好。

同时,首先通过最近产生的反馈产生对偏好判断的最大数设置的约束集,以此类推。假定将某类商品定义成一个集合A={a1,a2,……,am},设该类商品集合中每个商品有同属性集C={c1,c2,……,cn},PK是浏览页面集合PK={pk|k=1,…,T},pk表示所浏览的第k个页面,浏览某商品al所用时间是t(al)。

从用户浏览行为中提取兴趣项目。

根据图1所示,根据用户浏览行为的偏好获取的具体过程如表1所示:

4 结束语

移动网络服务的发展目标更多的是体现在用户在搜索过程中的快速准确找到目标,并且因为移动网络的特殊性,还应考虑便利性和效益问题,需要针对上述问题探讨更愉快的用户购物体验。因此本文通过移动网络环境数据挖掘,提炼用户反馈的不完全偏好信息,并通过分析用户的访问路径向用户推荐个性化的信息服务,以期提高推荐的准确率和用户满意率。

摘要：近几年,随着移动互联网的迅速发展、移动终端计算速度的快速提升、移动操作系统的逐渐统一,移动终端的信息资源数量正呈爆炸性的增长。在移动网络环境下,分析用户的浏览行为,并从中提取相关偏好信息,从而实现向用户推荐个性化的信息服务。

关键词：移动环境,用户偏好,挖掘推荐

参考文献

[1]李微娜,马小琪,冯艳光.基于MADM方法的个性化推荐研究[J].现代情报,2011(5).

[2]查凯莱巴蒂.Web数据挖掘[M].北京:人民邮电出版社,2009.

[3]王继民,李雷明子,郑玉凤.基于日志挖掘的移动搜索用户行为研究综述[J].情报理论与实践,2014(3).

[4]李微娜.面向用户偏好的MADM方法在个性化推荐中的应用[D].哈尔滨:黑龙江大学,2011.

偏好推荐篇2

在当今信息爆炸的时代, 如何快速获取用户所需要的信息变得越来越重要。推荐系统的出现能够很好的解决这样一个问题, 推荐系统能够向用户提供符合他们偏好的物品。为了提高用户的满意度, 一个可靠、高效的推荐系统变得越来越重要。协同过滤 (基于领域的算法) 是应用最广泛的推荐算法之一, 它主要是利用行为的相似度计算兴趣的相似度[1]。协同过滤主要有两大类, 一类是找到与目标用户兴趣相似的用户集合, 根据相似用户集来向用户推荐用户没有听说过的物品, 称为基于用户 (user-based) 的协同过滤 (UBCF) [2];另一类是计算物品之间的相似度, 根据物品的相似度和用户的历史行为为用户进行推荐, 称为基于物品 (item-based) 的协同过滤 (IBCF) [3]。

协同过滤有两种传统的处理方法:k-NN方法和关联规则方法[4,5]。虽然这两种方法能在一定程度上为用户推荐感兴趣的物品, 但是他们的推荐效果不是很理想, 性能不高, 其主要原因是受到它们本身模型限制。k-NN方法假设数据属性之间相对独立, 但通常情况下并非如此;相关规则只能有限的表示数据之间复杂关系[6,7]。

聚类[8]算法可以减少复杂操作所需要处理的数据规模, 降低数据稀疏性。用户偏好能够很好的反应物品的流行度。神经网络[9]能够有效的学习用户之间的复杂关系, 隐藏节点能够提高性能, 同时神经网络也很容易添加各种信息作为输入层特征向量的一部分来进一步提高模型的学习性能。传统协同过滤方法由于存在稀疏问题或只能有限的表达数据之间关系, 导致推荐效果不好。针对传统方法存在的不足, 本文采用一种用户偏好与神经网络模型 (P-MLP) 相结合的方法, 该方法首先对用户聚类, 降低数据稀疏性问题, 其次利用神经网络与用户偏好相结合来有效学习用户之间复杂关系。实验结果表明, 本文方法在准确率、召回率、F1 三个指标上均优于传统的方法, 推荐效果比传统的方法好。

1 问题描述

对于一个给定的目标用户ut和其他用户集U={u1, u2, …, un}, 假设用户ut的历史行为H={I1, I2, …, Im}, 其中Ii (1≤i≤n) 表示用户ut对物品的评分。对于一个目标物品集合T={t1, t2, …, tn}, 本文旨在将目标物品集T中用户ut喜欢的物品推荐给用户ut。

1.1 用户偏好

根据原始的用户-物品评分数据集, 可以得到用户分布矩阵, 用户被分到三个子集中: (1) 用户不喜欢这个物品 (不喜欢) ; (2) 用户对这个物品喜欢程度一般 (一般喜欢) ; (3) 用户很喜欢这个物品 (很喜欢) 。表1 是一个n×3 的用户分布矩阵, n表示物品集的数量, Nij表示喜欢 (不喜欢、一般喜欢) 物品i的人数, 其中1≤j≤3。

表2 是一个概率矩阵, 通过表1 计算得到, Pij表示所有用户中选择集合j所占的概率, i表示物品。Pij可由下面公式计算得到:

1.2 三层感知机模型

三层感知机 (MLP) [8]主要分为输入层、隐藏层、输出层, 其中输入层到隐藏层是一个全连接的层, 隐藏层到输出层是一个分类器softmax回归 (逻辑回归) 。可以采用下述模型:

式 (2) 中:B1表示输入层到隐藏层的偏置;W1表示输入层到隐藏层的权重 (也叫链接系数) ;B2表示隐藏层到输出层的偏置;W2表示隐藏层到输出层的权重;函数G (采用softmax分类器) 和s是两个激活函数。

1.3 信息集成

当数据集中的评分信息不足的时候, 就会存在稀疏问题, 导致模型性能不高。因此, 为了进一步提高性能, 解决稀疏问题, 在三层感知机模型 (MLP) 的输入层输入向量中加入用户偏好 (P-MLP) 。如图2 所示:

其中Pi表示用户对物品i的偏好概率, U={u1, u2, …, un}表示与目标用户相似度最高的用户集, n表示选取的相似用户个数。

2 算法描述

聚类能够降低数据的稀疏性, 神经网络能够有效的学习用户之间复杂关系, 用户偏好能够反映物品流行度。因此通过对用户聚类, 在神经网络的输入层中加入用户偏好, 就能实现降低数据的稀疏性和有效的学习用户之间复杂关系。

具体实现时, 需要先对模型进行训练, 才能对目标用户行为进行预测。具体算法步骤如下:

step 1 使用k-means方法对用户聚类并得到行为相似的用户;

step 2 计算用户的偏好, 得到概率矩阵;

step 3 对数据集按4:1 分成训练集和测试集;

step 4 得到训练集和测试集中每个用户的特征向量Vfi-nal;

step 5 使用训练集对P-MLP模型进行训练, 得到最终模型;

step 6 根据训练好的模型对测试集进行预测。

对于一个用户u和物品i, step 1得到U={u1, u2, …, um}和Vsim=[r1i, r2i, …, rmi], 其中m表示选取相似用户的数量, U表示相似用户集, rmi表示用户um对物品i的评分。step 2得到用户对物品i的偏好向量, 其中n表示对物品i评过分的用户总人数, m1i表示喜欢物品i的人数, m2i表示物品i喜欢程度一般的人数, m3i表示不喜欢物品i的人数。通过step 1和step 2可以得到step 4中每个用户最终的特征向量。

3 实验与结果分析

在这部分, 本文将从准确度 (precision) , 召回率 (recall) , F1三个指标对比分析本文方法和传统方法。首先介绍实验使用的数据集以及对数据集的处理, 其次介绍相关性能指标, 最后分析使用不同聚类K值对性能影响、比较加入偏好的三层感知模型 (P-MLP) 与单纯的三层感知模型 (MLP) 、P-MLP与K-NN和关联规则的比较。

3.1 数据集

本文实验使用Each Movie数据集。该数据集包含来自72196 个用户对1628 部电影的2, 811, 983 个评分。电影打分有六个不同的值, 从0.0 到1.0 的分值, 分值越高表示电影越受用户喜欢。本文选择为100 部以上电影评过分的前1000 个用户作为实验数据集, 然后将数据集随机分为训练集和测试集, 训练集和测试的比例是4:1。在实验中, 为了更有效的训练本文的方法, 本文对数据集进行了转换 (如表3 所示) , 对于用户没有过行为的电影本文设定评分值为0.0。一般情况下处理没有作用过的缺省数据是比较困难的, 通过对评分的转换, 能够方便本文方法的训练。在训练MLP模型时, 本文仅考虑目标用户评分大于0.7 或小于0.3, 用户对物品评分大于0.7 被认为是喜欢该物品, 小于0.3 被认为是不喜欢该物品。

3.2 衡量标准

本文使用三个不同的指标来评估本文方法与传统方法的性能[10]。

用户间的相似度本文使用改进余弦相似度计算得到相似度最高的前n个用户, n表示参照用户的数量。使用三个不同的指标来评估方法性能:准确度 (precision) , 召回率 (recall) , F1。

令R (u) 是根据用户在训练集上的行为给用户做出的推荐列表, 而T (u) 是用户在测试集上的行为列表, U是用户集合, 那么推荐结果的召回率定义为:

推荐结果的准确率定义为:

推荐结果的F1 定义为:

3.3 聚类K值的影响

使用K-means对用户聚类, 聚类的数量K值对整体的结果也有很大影响。实验结果表明, 在其他条件相同的情况下 (相同的P-MLP方法, 相似度最高用户数量n=10) , 不同的K值在三个指标上面都会有差异, 随着K值的增大, 三个指标先由小到大然后再由大到小, 结果如表4 所示:

3.4 P-MLP与MLP比较

MLP是三层感知模型, P-MLP是加入用户偏好的三层感知模型, 在实验中其他条件都相同 (聚类的数量K=10, 相似度最高用户数量n=10) , P-MLP的整体性能都比MLP模型性能高, 推荐结果的准确率、召回率、F1 都是P-MLP模型高。两个模型方法的性能如表5 所示:

3.5 P-MLP与传统方法性能比较

在这部分中, 将比较本文的方法与现有的协同过滤方法。为了比较的公平性, 训练集和测试集都是一样的。数据集选择在Each Movie数据集中为100 部以上电影评过分的前1000 个用户。数据集按4:1 随机分成训练集和测试集。表6 展示了PMLP方法与KNN、关联规则的比较结果, 其中P-MLP方法分别使用了聚类数量K = 5、K = 10、K = 15 三个模型方法。通过这个表可以看出, 本文的P-MLP方法与现有的方法在性能上有很大的提高, 其中在P-MLP模型方法中, 当聚类K = 10 的时候, 总体的性能最高。准确率、召回率、F1 都最大。

4 结论

本文主要针对传统协同过滤算法中存在的稀疏性问题和用户之间复杂关系表达问题, 采用了一种神经网络与用户偏好相结合的协同过滤推荐算法, 该方法首先对用户进行聚类, 然后采用神经网络与用户偏好结合训练得到模型, 最后利用训练后的多层神经网络来预测用户对物品的评分情况。实验结果表明, 本文采用的方法与传统的方法 (KNN、关联规则) 比较, 在准确度 (precision) , 召回率 (recall) , F1 三个指标上有较大的提高。

摘要：随着互联网服务和产品的大量增加, 高效、可靠的推荐系统变得越来越重要。协同过滤是应用最广泛的推荐算法之一。传统的基于用户的协同过滤仅考虑共同评分的物品来计算用户的相似度, 容易忽略用户之间的相关性。本文采用一种基于神经网络和用户偏好的协同过滤方法, 首先通过聚类算法解决稀疏性问题, 其次通过神经网络与用户偏好相结合来学习用户之间的相关性, 最后利用训练后的多层神经网络来计算用户对物品的评分情况, 来有效提高推荐效果。本文采用Each Movie数据来进行验证, 并和现有的一些方法进行比较。实验结果表明, 所推荐的协同过滤推荐算法在准确率、召回率、F1三个指标上均优于传统的方法, 推荐效果比传统的方法好。

关键词：推荐算法,神经网络,用户偏好,聚类,协同过滤

参考文献

[1]Shih Y Y, Liu D R.Product recommendation approaches:Collaborative filtering via customer lifetime value and customer demands[J].Expert Systems with Applications, 2008, 35 (1) :350-360.

[2]Sarwar, B.M., Karypis, G., Konstan, J.A.and Ried, J.:Item-based Collaborative Filtering Recommender Algorithms.Accepted for publication at the WWW10 Conference (2001) .

[3]Linden G, Smith B, York J.Amazon.com recommendations:Item-to-item collaborative filtering[J].Internet Computing, IEEE, 2003, 7 (1) :76-80.

[4]Lin W, Alvarez S A, Ruiz C.Collaborative recommendation via adaptive association rule mining[J].Data Mining and Knowledge Discovery, 2000, 6:83-105.

[5]Sarwar B, Karypis G, Konstan J, et al.Analysis of recommendation algorithms for e-commerce[C]//Proceedings of the 2nd ACM conference on Electronic commerce.ACM, 2000:158-167.

[6]Herlocker J L, Konstan J A, Borchers A, et al.An algorithmic framework for performing collaborative filtering[C]//Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval.ACM, 1999:230-237.

[7]Claypool M, Gokhale A, Miranda T, et al.Combining content-based and collaborative filters in an online newspaper[C]//Proceedings of ACM SIGIR workshop on recommender systems.1999, 60.

[8]李秀娟.KNN分类算法研究[J].科技信息, 2009 (31) :81-81.

[9]Junlin Z, Heng C, Tongwen H, et al.A Distributional Representation Model For Collaborative Filtering[J].ar Xiv preprint ar Xiv:1502.04163, 2015.

偏好推荐篇3

随着社会经济的发展和个人收入水平的逐渐提高, 居民的家庭理财意识不断增强, 但各地区的理财文化及消费者偏好均存在较大不同。国内外关于银行理财产品的研究文献颇为丰富, 多数研究讨论市场、风险、销售等总体概况分析领域 (张辉, 2008;谷秀娟, 门彦顺, 2009;李志强, 赖劲宇, 2010) , 但关注客户个体理财行为的研究较少, 尤其是对于客户的理财产品选择行为的关注不多。随着经济体制改革的不断深化, 大陆居民收入持续稳步增加, 理财产品的种类也日益丰富和完善, 以满足日渐多元化的客户需求。受年龄增长、退休等因素的影响, 居民的收入会相应减少, 其对理财产品的偏好及选择也会随之变化, 如可能更偏好同时配送现金和股息的股票型理财产品 (John&Alok, 2006) 。可见, 当收入发生变化, 加之受个人因素、外部市场等内外部因素影响时, 银行理财客户对理财产品的选择必然会有不同的结果。

陈彤和王积田 (2010) 对中国大陆理财客户的研究发现, 他们大多不具备冒险精神, 理财产品的选择以保守型的储蓄、房产及保险为主。而在经济快速发展的印度尼西亚, 其民众理财心理需求偏好因两种特质而有不同的选择, 一类为具有较强的投资风险承受度者, 能经常投资及接受高风险产品, 勇于尝试及学习各式的理财经验;另一类为安全的投资者, 只能投资低风险的产品并且较少交易, 理财偏好停留在保守商品, 理财经验有限 (Endang, 2011) 。此两种极端特质的产生, 可能源于对现有财产的悲观或乐观发展趋势判断, 悲观者理财选择倾向以『保值、保障』为主, 反之, 乐观者则相信经济环境会持续好转, 故理财选择以把握时机的『投机』为多, 倾向追求最大利润为原则。另外, 从历史理财观来看, 中国大陆的理财客户普遍倾向勤俭节约的保守型为主, 但由于传统的计划经济渐趋开放, 私人也可能为社会财富的占有者或支配者之一 (华金秋, 2002) 。又随着整体经济成长, 使高资产客户 (HNWI, High Net Worth Individual) 也呈正相关成长, 大陆高资产客户大致区分三种理财类型, 保守型、稳健型和积极型。其资产构成以房地产、股票、基金、另类投资和债劵及现金存款为主, 并大都喜欢持有房地产、股票及现金存款, 对离岸资产的关注程度也较高 (王小平, 2011) 。

本文基于上述四类心理特质, 衍生出四种默认假设模式———投机型、偏投机但混合保守、偏保守但混合投机及保守型, 以湖南地区客户对理财产品的选择偏好为研究对象, 在分析当地理财客户群体属性及理财选择偏好因素的基础上, 探讨经济快速发展地区的客户理财行为发展模式。首先, 采用叙述偏好法进行问卷设计, 以各理财产品综合特质及其可能产生的概率为规划方向, 结合消费者偏好分析领域中常运用的多项罗吉特 (MNL) 及巢式罗吉特计量模块 (NL) 来分析湖南地区理财客户的偏好情况。此分析方式与以往的研究的差异, 在于以叙述性偏好法搭配计量统计方式, 按照属性的显著水平判断区域特质或偏好, 更为精准。

二、研究方法与假设

采用个体需求分析模式, 基于叙述性偏好法设计调查问卷, 并运用多项罗吉特 (MNL) 及巢式罗吉特 (NL) 进行理财客户群体的偏好研究, 对比不同模式下各属性 (即变量) 的显着反应水平状态, 估计湖南地区客户理财偏好的共通特质。

(一) 多项罗吉特 (multinomial logit model)

罗吉特模型的基本假设包括: (1) 随机效用理论; (2) 效用最大化原则, 即假定消费者为理性决策者, 当其面对备选方案时, 会选择偏好效用最大的理财产品; (3) 效用函数之随机项ε为独立且一致的Gumble分配, 即选择概率假设εiq为相同与独立服从Gumbel分配, 即基金、股票、外币、保险、定存等方案各自独立于相同出发点的分配。

假设所有的方案属于Cq, i≠j表示全部方案不可能重复, Cq为消费者q所有可选择的理财产品集合。该式代表消费者q对于i方案的偏好高于其他备选方案时, 会选择i的方案。数学表达式为

当消费者实际选择的理财产品与其衡量的效用不一致时, 效用函数可能存在不可衡量部分。因此可将效用函数区分为可衡量部分V与不可衡量ε部分, 公式表示为:

其中, εiq为效用不可衡量部分, 称为效用的随机项, 假定β为待估计参数向量, 上式可进行如下改写:

依据多项罗吉特 (MNL) 选择概率, 并以最大概似法 (Maximum Likeilhood Method) 做为模型参数估计的方法, 如 (4) 式所示:

其中, Piq为消费者q选择方案的概率。

(二) 巢式罗吉特 (nested logit model)

巢式罗吉特模型假设消费者在选择理财商品时, 会基于所欲购买商品的金额、期限、报酬率及获利概率等因素, 依个人的偏好确定理财选择。一般而言, 理财客户可选择的理财产品主要可划分为五类:基金、股票、外币、保险、定存, 但在正式决策时通常只分类为三种, 取决于巢式罗吉特模型之选择模型可利用条件概率的方式加以呈现, 如下 (5) 式:

其中, Vi表示于第一巢层选择理财类型i的效用;Pi/m表示巢层m所选择状况i之理财条件概率;Pm是巢层m之理财边际概率;Nm为在巢层里所有变量包括i及q;μm为巢层里的所有包容值 (或称关联系数) ;μ为包容值系数, 且其合理范围为0<μ<1;Γm指下巢层内方案里之所有变量。选择概率即为消费者在进行决策的巢状结构下概率, 可用 (6) 式与 (7) 式表示:

(8) 式的最大概似法之公式是对所有选择集合中的元素对组合, 将每种组合是为替选方案, 找出对数概似函数值极大之参数值。在对最大概似法估计出的所有参数进行检验时, 需预先确定参数的正负符号是否符合过去的先验知识, 并以t检验观察在某一置信水平下参数值是否达显着水平, 以此判断构建的模型效果是否显着。

LL为个体样本的概似函数;Q为观测的总样本数;fiq为观测指标值, 该值为1, 表明消费者q选择理财方案i;若为0, 表示选择其他方案。

(三) 研究假设

一般而言, 消费者对于五种商品的风险等级选择高低依序为:①股票→②基金→③外币→④保险→⑤存款。本文藉由个体问卷搜集, 搭配多项罗吉特及巢式罗吉特分析, 使产品在假定的选择情境下, 比较多项罗吉特时, 所有理财商品的选择属于同质类, 没有层次分类, 即每个选择都假定是平等独立的。但实际上, 消费者很可能已针对可能的选项内容默认分类, 故再利用巢式罗吉特模式, 即可由方案、变量及属性所分析出来有显着结果之属性, 归纳出受访者的特质及偏好, 故可能较多项罗吉特更进一步贴近受访者的真实偏好。

根据问卷特质及理财客群可能假设, 以及各产品的风险特征, 仿真四种理财商品选择偏好模式如下图1。

其中, 模拟状态分别假定为:I表示风险追高的逐利者, 偏好以获得最大收益及最大收益以外产品的投资者偏好选择;II表示保守及投机兼顾的混合偏投机理财者, 偏好风险最高及最低者 (极端) 以外的偏好选择归类;III表示保守及投机兼顾的混合偏保守理财者, 偏好货币及货币以外的理财投资偏好选择;IV表示极端保守型, 以财产保障为第一优先, 偏好不会赔钱及有可能投资损失的产品以外的选择。

三、基于叙述性偏好法的调查问卷设计

(一) 问卷结构

本研究问卷分为三大部分, 第一部分为个人投资理财行为调查, 主要是了解受访者现行的理财状况;第二部份为假设性的投资产品选择意愿调查, 通过不同行业的小众受访者进行理财访谈机制 (pre-test问卷调查) , 利用SPSS直交法设计排列, 随机产出16种组合, 挑选其中最适宜的4种模拟情境设计, 以此可了解受访者心中真实的理财想法;第三部份为受访者的基本数据, 包括受访者的背景等。经过pre-test调查后筛选, 最终得到五个方案 (基金、股票、外币、保险、定存) 及四个变量 (报酬率、获利概率、投入金额、投入期间) 的叙述性偏好组合情境设计。

(二) 基于叙述偏好法的问卷设计

(1) 叙述方案设计。由于本文研究消费者对于银行理财商品的偏好, 故方案设计为直接考虑的目前大陆常见的银行理财商品, 包括基金、股票、外币、保险与存款等。其中存款为民众理财的基本需求, 因此以其作为其他方案的比较基准。

(2) 属性与水平值。根据产品特征及预期设计的理财方案, 选择报酬率、获利概率、投入金额与投入期限等变量作为理财产品的属性。各属性的水平值通过小规模访谈的方式确定, 针对不同年龄及职业具有理财资格的客户开展开放式问卷的调查, 结合预期的产品属性类别, 将其属性与水平值在每题中皆固定, 其中存款因是比较基准, 仅考虑1种包装方式。具体设计结构如表1:

(3) 情境组合与实验设计。依据表1的理财方案, 以实验设计方式, 发展适宜的直交表, 用以排列组合问卷每题各方案应考虑的方案, 再将其平均分配于4个不同种类的问卷 (A、B、C、D) 。因此每份问卷内容编排了4个叙述偏好问题提供予受访者选择其心目中的最佳方案, 如表2所示。

(4) 理财行为与基本情况。除了叙述偏好问项设计之外, 研究内容也将受访者的理财行为与基本数据等特质纳入问卷分析, 后续可用以提高模式的解释能力及增加地区客群及客群偏好对理财行为的分析。理财行为的问题包括投资经验、投资态度、投资期限、投资目的、主要往来银行、理财信息来源、理财分配比例与交易次数等。基本情况则包括性别、年龄、教育程度、职业、收入与婚姻等问题。

(三) 调查过程及样本特性分析

本文以湖南长沙地区年龄介于30-45岁间, 学历较高, 经济状况良好的优质人士为主要问卷对象, 探讨其对理财商品 (基金/股票/外币/保险/定存) 的偏好特征。调查期间为2011年12月-2012年1月, 随机发放四种不同的问卷, 其商品包装的主要差异在于包装商品的报酬率、获利概率、投入金额与投入期间, 最后获取有效分析问卷数179份, 整体有效问卷数在90%以上。根据回收问卷分析受访者叙述方案选择与样本数据特征如表3所示:

从表3可看出, 受访者男性数量多于女性1.5倍, 年龄多为30-39岁, 家庭年收入以50-200万元人民币为主。受访者不论何种性别、教育及行业都偏好股票。在受访者对于产品损失的态度方面, 股票的损失是最让人感到焦虑的, 尤其损失达投资时的10-20%, 最让人焦虑。当基金的损失达20%以上时, 焦虑感会明显浮现。保险、定存与投资损失的关联较小, 不易产生焦虑感。

四、偏好模式分析

(一) 数据描述

为了解受访客户对不同理财产品包装属性的感受, 搜集了179份完整问卷, 每份问卷设计了4项叙述偏好题, 可得716笔分析资料, 据此构建多项 (MNL) 及巢式罗吉特 (NL) 模型, 以分析客户理财偏好及营销特征, 结果如表4所示。

根据表4模型结果, 多项罗吉特考虑了25个解释变量, 而巢式罗吉特则考虑了26个解释变量, 整体模型解释绩效ρ2各为0.349及0.351, 透过本模型利用巢式罗吉特的特质进行分析, 为锁定特定客群, 并进一步归纳客群可能的行为模式, 客群理财偏好模式的精准度可提升到35.1%;下面根据问卷变量与模型的关系, 对包装方案、包装属性、社会经济及人口统计特性与理财状况等变量分别说明。

(1) 包装方案。本文探讨的理财商品包括基金、股票、外币、保险与定存等五大产品, 据此作为模型设定的方案常数, 经客户行为分析后, 湖南理财者偏好将财富运用的产品包装归类区分为三大类型, 第一类为定存、第二类为外币、第三类则为基金/股票/保险 (货币以外的理财选择) 。

(2) 包装属性。大陆的理财者对于“赔”的强烈感受大于“赚”的。“赔”的系数的呈现负值, 并且t值反应大于“赚”的状况, 即表示当投资损失达某一程度时, 投资人负面情绪反应程度会被更加放大。

(3) 社会经济及人口统计特性。双薪家庭的理财行为偏好买基金, 在一般民营机构上班的, 则不偏好外币商品。依职业来看, 企业主及制造业偏好基金, 而军人、公务员、教师等职业则偏好存款。教育程度越低者越能接受保险, 年龄越长者越偏好存款。

(4) 理财状况。关于理财特质分析, 消费者会因为行员服务态度良好而选择某间银行为主要理财往来银行时, 则此类消费者会偏好存款商品, 也就是说, 如果消费者与行员关系良好有初步的信赖度时, 存款是很容易的入门款商品。当投资占个人收入比重越高时, 则会越加偏好股票商品。但每月理财交易次数越少者, 则越喜欢股票商品, 据此推论消费者投资股票交易时, 投资金额较其他产品交易大。

如果理财者为家庭中主要理财具一定经验的人, 会偏好股票交易。喜欢听家人/朋友推荐理财信息者, 也会偏好股票投资。投资目的若为确保资产安全性, 获得固定收益者, 就不会选择股票当作投资标的。家庭收入用于金融投资 (存款除外) 的比例越低, 越会偏好选择保险。当理财者的过往投资经验为仅有存款或债劵时, 他们对于保险也会产生喜好, 但若过往曾在股票基金外汇等理财产品有投资经验时, 他们对于基金的偏好较高。

(二) 模式构建与分析

根据巢式罗吉特所产出的参数、t值及相似性系数, 发现消费者的理财选择模式中将基金、股票及保险归纳为同一种类, 其他商品为另一类, 产出最贴近客群的显着性选择模式, 故湖南地区的理财客户群体偏好为货币及货币以外的理财选择模式, 如图2所示:

(1) 风险种类

根据多项罗吉特与巢式罗吉特的模式推论, 其相似性系数之结果与默认模式的象限III较为吻合。结合理财商品的风险状态和客户的理财心理, 产生四种预设的模拟状态, 发现最接近湖南地区的理财客群所呈现之风险类型属于投机与保守混合, 但偏向保守。据此, 可对湖南当地可能的客群属性进行推断, 进而根据其理财行为及偏好模式, 衍生规划最适当的理财商品营销包装、银行管理或主管机构监理模式。

(2) 理财偏好商品包装

上文研究显示, 湖南地区的理财客户群体属于混合偏保守型, 结合表3的关联分析及上表4偏好特征, 将理财行为及选择偏好等信息综合归纳, 如表5所示:

注:○指表偏好模式明显值;X指表偏好模式不偏好明显值。

首先, 购买理财产品的经验越丰富, 其对基金的偏好度就越降低;双薪家庭 (即稳定收入结构者) 更偏好基金, 可以考虑将基金包装成投资理财入门款商品, 并针对双薪家庭族群提供营销上诱因, 以激励其投资。同时, 银行人员的服务态度和质量有助于吸引理财客户选择定存类产品。因此, 如能针对上述两类消费者, 打造客户需求导向的整合性商品及服务 (Tuli, 2007;Sheng, 2007) , 如在客户同时投资基金和定存时, 提供手续费折扣优惠, 针对双薪家庭收入者 (即基金商品的目标潜力客户) , 提供适当的营销宣传及建议, 以更好地贴近目标客户需求, 节省银行的营销成本。

其次, 股票偏好度会随着理财投资金额占个人收入比重的提高而增大, 尤其当购买客户是家庭中主要理财交易决策者时状况更为明显, 故建议可提供金融顾问或专家建议的行态模式, 触动 (trigger) 交易决策者的投资脚步。但金融机构除了积极触动客户的理财交易行为外, 也应及时地进行风险告知义务并分析其投资的安全线, 既提升活络安全交易数量, 也能有效降低客户申诉风险。

再次, 保险的偏好者以过往投资经验不多、教育程度不高或家庭收入投资比例低者 (存款除外) 的客户为主。历史投资经验的多寡会影响客户理财行为, 缺少投资经验的客户在面临理财商品选择时, 会产生矛盾、犹豫的心态 (Kida, 2010) 。因此, 银行可提供理财套餐类商品, 搭配有利的诱因, 以影响客户对商品需求的判断, 逐步让经验缺乏的客户不断获取经验 (Sheng, 2007) 。

在理财行为的风险方面, 年家庭收入越高者越偏好风险度较高的股票、基金等产品。投资经验和风险承受度高的客户对于股票、外币偏好度明显更高, 而风险承受度较低的客户对保险、定存有相对更高的偏好程度。投资经历超过两年以上的客户对股票的偏好程度持续增加, 并将所持有的理财产品逐渐由保险及定存移转至股票, 同时, 对于基金偏好会逐渐降低。此外, 风险承受度低的客户数量为风险承受度高的客户数量的两倍, 可见绝大部分客户都属于保守型。

湖南地区之消费者理财行为属于保守及投机兼顾的混合偏保守类型 (货币及货币以外的理财投资偏好选择) , 银行可针对此类客户群体的需求, 提供以人民币存款、外币存款、保险等风险性较低的产品营销包装模式 (bundle product) , 积极有效地引导客户树立理财理念, 积累理财经验。

五、结论与建议

本文研究显示, 湖南地区的理财客户群体属于投机与保守混合型 (偏保守型) , 其理财产品的选择主要偏好于“货币以外的理财选择”与“货币的选择”, 对于高风险的理财产品需求偏低。因此, 建议该地区银行理财产品中, 将保守型的理财产品比重维持在较大比例, 可配合目前保守型人数约占三分之二, 设定六、七成为保守型产品, 以利理财产品的监督管理及鼓励创新并行, 达到安全活跃的交易市场状态。

基金持股偏好研究篇4

我国证券基金投资业于上世纪90年代中后期起步, 首先出现的是封闭式基金, 然后才出现了开放式基金。1998年3月27日, “基金开元”和“基金开泰”两只封闭式基金的发布, 拉开了我国证券投资基金发展的序幕;2000年10月《开放式证券投资基金试点办法》颁布;2001年9月, 我国第一只开放式基金——“华安创新”诞生, 标志着我国证券投资基金进入了一个全新的发展阶段;2002年8月, 第一只以债券投资为主的开放式基金——南方宝元债券基金成立;2003年3月, 系列基金诞生, 随后的避险保本型基金和准货币型基金也都相继问世。随着ETF基金的出现, 国内投资市场对基金的关注也达到了空前的地步。

如何在证券市场成千上万的投资品种中挑选投资对象是所有投资者都必须面对的问题, 也是投资成败的关键。而无论是机构投资者还是个人投资者都具有不同的投资偏好, 这种投资偏好必然反映在股票的某种属性上, 因此我们便可以从投资者所持有的股票特性来考察其投资偏好。因为封闭式基金不具备广泛的市场意义, 所以本文以中国开放式基金为重点研究对象, 主要分析开放式基金在投资方面的偏好。通过整理相关文献, 找出与基金持股有关的因素, 然后通过回归的方法验证这些因素在基金持股过程中是否起到了重要作用。

其中本文主要研究的因素包括:单个股票的月度市场风险溢价、市盈率、市净率、股票总市值、每股净资产以及上市时间长度 (以月为单位) 。开放式基金持股票好的研究, 一方面有利于找出现有开放式基金持股是否存在着规律性, 其操作分割上是否具备一致性;从而为单个投资人或者券商提供一个相关参考依据。另一方面, 有利于对基金持股的合理性和正确性作出一个公平的判断;验证基金的投资是否遵循了市场的规律。

2 数据来源与参数说明

现有文献关于基金持股偏好多集中于对开放式基金的研究。其主要研究因素主要集中于对上市公司的毛利率、每股经营性现金流和换手率。并且尤其倾向于持有毛利率、每股经营性现金流和换手率都相对较高的上市公司。

有关文献资料认为, 偏股型基金之间表现出较大的同质性。从回归结果看, 在实际运作中无论是成长型基金、价值型基金还是混合型基金, 都重点考察了流通盘和每股收益两个指标, 并且都偏好大流通盘和高每股收益的股票。反映出目前我国尽管基金名称林林总总, 招募说明书中声称投资风格各异, 但实际上操作风格、持股偏好都非常相似。其次开放式基金更注重股票的流动性。开放式基金随时面临赎回的压力, 因此必然更加关注股票的流动性风险。最后, 从操作风格上看, 开放式基金更趋谨慎。开放式基金注重对上市公司质地的考察, 重点关注了毛利率和经营性现金流。从财务角度看, 毛利率体现了公司产品的深加工程度, 反映了公司对产品售价下降和原材料成本上升的承受能力;而每股经营性现金流则体现了公司每股收益的“含金量”。对这两个指标的重视, 反映出开放式基金在选择股票时更注重对基本面的研究, 并且倾向于选择经营风险和财务风险相对较小的上市公司。

本文选取2002年一季度到2005年四季度的所有开放式基金重仓股作为文章的研究立足点。重仓股数据主要来自于和讯基金网站所公布的每季度各基金公报。选取其中所报道的持股数目前10位股票作为重仓股。然后按季度对这个重仓股进行汇总, 并将其所占流通市值的比例作为因变量。通过研究发现, 所有重仓股汇总后, 所占其流通市值的比例大约为2%-5%, 符合重仓股的要求。单个股票的月度市场风险溢价数据, 来自于对市场月回报率数据和单个股票月回报率数据的回归得到。市场月回报率数据主要通过对每月上证指数的回报率来求得。上证指数数据来源于大智慧股票行情软件。月回报率计算方法如下:

undefined

以月度市场回报率作为自变量, 以月度股票回报率作为因变量进行回归, 相应的回归系数就是单个股票的月度市场风险溢价。具体计算公式如下:

Ri=α+βRm+ε

其中, Ri为月度股票i的回报率, Rm为月度市场回报率, β为单个股票的月度

贝塔值。除此之外, 关于2002年一季度到2005年第4季度所有重仓股的每股收益率、

市净率、股票总市值、每股净资产数据, 均来自于大智慧股票行情软件。

3 数据选择与模型检验

3.1 自变量的确定

本文将基金所持重仓股占该股流通市值比例作为自变量, 该变量代表着在对应的季度, 样本基金重仓股所占该对应股票流通股的比重。

本文用Ki代表该观测变量, 具体计算公式如下:

其中M代表中国股票市场中开放式基金总数。可以得到如下数据:

从上面表格可以看出:

(1) 重仓股的数量是在逐年递增。

这一方是由于开放式基金数量的不断增加, 投资类型更加丰富所造成的, 另一方面, 也是因为中国股市本身的发展所推动的。股票市场的成熟, 使得更多的具有投资潜力的股票被发现。

(2) 重仓股占该股票的流通股比例偏小。

最大平均值为2005年的0.12753。说明基金作为一个特殊的投资实体。其投资和控股的能力, 不足以操纵整个市场。市场本身的走向是居多复杂力量的综合结果。

(3) 重仓股占该股票的流通股比例逐年递增。

这说明, 机构投资者占股票市场行为主体的比重越来越大, 股票市场行为进一步趋于规范化。

3.2 因变量的选择

证券投资基金的投资都是由研究驱动的, 也即基金经理在对宏观经济、行业和公司进行深入分析的基础上作出投资决策。在微观层面上, 基金经理十分重视股票基本面的分析, 他们分析的主要公司指标有:每股收益、每股净资产、净资产收益率、主营业务收入增长率、每股现金流量、每股股息、流通股本、流通股比例和股利收益等。这些指标完全由公司自身状况决定, 与股票的市场表现无关, 因此被称之为公司特征变量。除了股票的公司特征变量外, 基金经理在制订投资决策时还考虑以下变量, 它们是市盈率、市净率、股票季度收益、股价、流通市值、换手率、β值、标准差、上市年龄等, 这些变量与股票的市场表现有直接或间接的关系, 因此被称为市场特征变量。通常, 基金经理在做投资决策时要综合考虑股票的公司特征和市场特征, 为了全面分析这些特征变量对基金投资决策的影响。

3.3 分析方法

本文在考虑共线性问题的基础上采用线性回归的方法构建模型, 所选取的因变量包括:包括单个股票的月度贝塔值、每股收益、市净率、股票总市值、每股净资产以及上市时间长度 (以月为单位) 。本文主要采用因子分析方法, 分析以上自变量是否确实在开放式基金持股票偏好中期到重要作用, 同时通过回归所得到的结果和对各因素的显著程度以及回归参数的分析。

3.4 模型建立以及回归结果

针对本文所选取的因变量和自变量, 建立如下模型;

undefined

其中, 其中y代表重仓股被所有基金所持有的数量。β代表单个股票的月度贝塔值, EPS代表该支重仓股的每股收益, P/B代表重仓股的市净盈率, NAP代表该支重仓股的股票总市值、P代表重仓股的每股净资产, 最后M代表上市时间长度 (以月为单位) , 代表回归残差。

利用E-viewa5分析工具, 通过回归分析, 可以得到如下回归结果:

Y=0.02314-0.007β+0.064EPS+0.0027P/B+0.0005135P-0.00012M+ε

(0.01017 0.003457 0.006008 0.001517 0.001277 4.17E-05)

R2=0.09715

从回归结果可以看出, 拟合优度R2=0.09715<0.4, 说明整个回归线性回归过程并不能完全反映数据之间的真实情况。所选取的自变量, 不能完全反映因变量的变化。从方差分析的角度来看, 在F检验值为29.94279的条件下, 而统计F值数据为1.07E-32, 远远小于32.14817。这说明回归过程十分显著, 不存在异方差现象。

参考文献

【偏好推荐】推荐阅读：

用户偏好05-10

社会偏好05-18

股权偏好07-27

公共偏好07-30

使用偏好07-30

媒体偏好09-05

并购融资偏好05-14

多维偏好分析06-06

融资偏好行为06-23

保险需求偏好08-16