客户数据

2024-06-21

客户数据(精选12篇)

客户数据 篇1

市场经济给企业发展带来了日益激烈的竞争环境, 企业开始重视客户资源的发掘与分析, 企业的工作重心逐渐从产品转移到客户。客户关系管理是客户细分的有效工具, 而数据挖掘技术就是客户细分有力的技术支撑。

1 理论研究

1.1 客户关系管理

客户关系管理的目标是依靠高效优质的服务吸引客户, 同时通过对业务流程的全面优化和管理, 控制企业运行成本。客户关系管理是一种管理理念, 将企业客户视作企业发展最重要的企业资源, 采用企业服务优化等手段来管理客户关系。客户关系管理并不是单纯的信息技术或者管理技术, 而是一种企业生物战略, 通过对企业客户的分段充足, 强化客户满意的行为, 优化企业可盈利性, 将客户处理工作上升到企业级别, 不同部门负责与客户进行交互, 但是整个企业都需要向客户负责, 在信息技术的支持下实现企业和客户连接环节的自动化管理。

1.2 客户细分

客户细分由美国学者温德尔·史密斯在20世纪50年代提出, 认为客户细分是根据客户属性将客户分成集合。现代营销学中的客户细分是按照客户特征和共性将客户群分为不同等级或者子群体, 寻找相同要素, 对不同类别客户心理与需求急性研究和评估, 从而指导进行企业服务资源的分配, 是企业获得客户价值的一种理论与方法。

因此我们注意到, 客户细分其实是一个分类问题, 但是却有着显著的特点。

1.2.1 客户细分是动态的

企业不断发展变化, 用户数据不断积累, 市场因素的变化, 都会造成客户细分的变化。所以客户细分工作需要根据客户情况的变化进行动态调整, 减少错误分类, 提高多次细分中至少有一次是正确分类的可能性。

1.2.2 受众多因素影响

随着时间的推移, 客户行为和心理会发生变化, 所以不同时间的数据会反映出不同的规律, 客户细分方法需要在变化过程中准确掌握客户行为的规律性。

1.2.3 客户细分有不同的分类标准

一般分类问题强调准确性, 客户关系管理则强调有用性, 讲求在特定限制条件下实现特定目标。

1.3 数据挖掘

数据挖掘就是从大型数据库数据中提取有价值的、隐含的、事前未知的潜在有用信息。数据挖掘技术不断发展, 挖掘对象不再是单一数据库, 已经逐渐发展到文件系统、数据集合以及数据仓库的挖掘分析。

2 客户细分的数据挖掘

2.1 逻辑模型

客户数据中有着若干离散客户属性和连续客户属性, 每个客户属性为一个维度, 客户作为空间点, 全部客户都能够形成多为空间, 作为客户的属性空间, 假设A={A1, A2, …Am}是一组客户属性, 属性可以是连续的, 也可以离散型, 这些属性就形成了客户m维属性空间。同时设g是一个描述客户属性的一个指标, f (g) 是符合该指标的客户集合, 即为概率外延, 则任一确定时刻都是n个互不相交集合。在客户价值概念维度上, 可分为“有价值客户”“潜在价值客户”“无价值客户”三种类型, 定义RB如下:

显然RB是一个等价关系, 经RB可分类属性空间为若干等价类, 每个等价类都是一个概念类, 建立客户细分, 就是客户属性空间和概念空间映射关系的建立过程。

2.2 客户细分数据挖掘实施

数据部分有客户数据存储和概念维数据构成, 客户数据存储有企业全部内在属性、外在属性以及行为属性等数据, 方法则主要有关联规则分析、深井网络分类、决策树、实例学习等数据挖掘方法, 通过对客户数据存储数据学习算法来建立客户数据和概念维之间的映射关系。

2.3 客户细分数据分析

建立客户动态行为描述模型, 满足客户行为非确定性和非一致性要求, 客户中心的管理体制下, 客户细分影响企业战术和战略级别决策的生成, 所以数据挖掘要能够弥补传统数据分析方法在可靠性方面的缺陷。

2.3.1 客户外在属性

外在属性有客户地理分布、客户组织归属情况和客户产品拥有情况等。客户的组织归属是客户社会组织类型, 客户产品拥有情况是客户是否拥有或者拥有哪些与其他企业或者其他企业相关产品。

2.3.2 内在属性

内在属性有人口因素和心理因素等, 人口因素是消费者市场细分的重要变量。相比其他变量, 人口因素更加容易测量。心理因素则主要有客户爱好、性格、信用情况以及价值取向等因素。

2.3.3 消费行为

消费行为属性则重点关注客户购买前对产品的了解情况, 是客户细分中最客观和重要的因素。

2.4 数据挖掘算法

2.4.1 聚类算法

按照客户价值标记聚类结果, 通过分类功能, 建立客户特征模型, 准确描述高价值客户的一些特有特征, 使得企业在之后的市场活动中能够迅速发现并抓住类似的高价值客户, 全面提高客户的整体价值水平。

通常都采用中心算法进行客户的聚类分析, 分析涉及的字段主要有客户的基本信息以及与客户相关业务信息, 企业采用中心算法, 按照企业自身的行业性质以及商务环境, 选择不同的聚类分析策略, 有主属性聚类分析和全属性聚类分析两类。主属性聚类分析是企业根据在企业标度变量中选择主要弧形作为聚类分析变量。通常区间标度变量选用的度量单位会对聚类分析结果产生很大影响, 选择的度量单位越小, 就会获得越大的可能值域, 对聚类结果的影响也就越大。

2.4.2 客户分析预测

行业竞争愈加激烈, 新客户的获得成本越来越高, 在保持原有工作价值的同时, 客户的流失也受到了企业的重视。为了控制客户流失, 就需要对流失客户的数据进行认真分析, 找寻流失客户的根本原因, 防止客户的持续流失。数据挖掘聚类功能同样能够利用在客户流失数据分析工作中, 建立基于流失客户数据样本库的分类函数以及分类模式, 通过模型分析客户流失因素, 能够获得一个最有可能流失的客户群体, 同时编制一个有针对性的挽留方案。

之后对数据进行分析并利用各种数据挖掘技术和方法在多个可供选择的模型中找出最佳模型。初始阶段, 模型的拟合程度可能不理想, 但是随着模型的不断更换和优化, 最终就有可能找出合适的模型进行数据描述并挖掘出流失数据规律。通常模拟模型都通过数据分析专业和业务专家协作完成, 采用决策树、贝叶斯网络、神经网络等流失分析模型, 实现客户行为的预测分析。

3 结语

从工业营销中的客户细分观点出发, 在数据挖掘、客户关系管理等理论基础上, 采用统计学、运筹学和数据挖掘技术, 对客户细分的数据挖掘方法进行了研究, 建立了基于决策树的客户细分模型, 是一种效率很高的管理工具。

摘要:本文主要研究客户关系管理中的客户细分的数据挖掘, 对客户关系管理、客户细分以及数据挖掘的内涵与相关理论进行了认真学习, 并对客户细分的数据挖掘方法进行了研究, 为以客户关系为中心的企业管理模式提供了技术支持。

关键词:客户关系管理,客户细分,数据挖掘

参考文献

[1]董宪, 赵卫东.客户关系管理中数据挖掘技术的研究与应用[M].福建电脑, 2012 (4) .

[2]成文伟, 黄金才.数据仓库与数据挖掘[M].人民邮电出版社, 2012.

[3]魏娟, 梁静国.基于数据挖掘技术的企业客户关系管理 (CRM) [J].商业研究, 2011 (7) .

[4]刘文昌.APriori算法在客户关系管理中的应用[J].长春大学学报, 2011, 15 (4) .

[5]费贤举, 王文琴, 庄燕滨.基于关联规则的数据挖掘技术在CRM中的应用研究[J].常州工学院学报, 2011, 15 (4) .

客户数据 篇2

1.客户基本信息

身份信息--年龄,职位

家庭信息--地域,家庭组成联系方式

教育信息--教育背景

职业信息--收入情况,职业前景,行业类别,工龄

客户价值 利润贡献度(客户收入,客户成本),忠诚度

生活方式--理财计划

2.客户统计分析资料

服务偏好

产品偏好

风险偏好

消费需求

3.银行投入信息

(1)静态账户信息

主要产品和服务情况,客户信用评级,用户对银行评价

(2)动态交易信息

交易记录(交易频率 交易额度 交易地点等)

大数据时代如何定位客户 篇3

你了解你的客户吗?你能区分客户群体中哪些是忠诚客户,哪些则可能因为稍稍的价格差异就离你而去?你的营销和广告投入究竟主要是面向哪类客户群体?这些问题并不容易解答。企业的战略决策、广告攻势、营销活动,通常都很难收到预期效果,原因都在于定位客户之难。

全球营销传播机构奥美集团旗下奥美互动纽约公司董事总经理麦德奇长期致力于数据挖掘分析,他领导的团队受到多家跨国公司乃至整个业界的好评。麦德奇和《纽约时报》作家保罗·布朗合著推出的《大数据营销:定位客户》一书,介绍了如何应用大数据理念、技术与方法辨认出最有价值客户,并提出了企业如何提高接触这类客户的成效、增加其购买力的思路。

如何定位客户

定位客户,首先需要设定目标,这其实是筛查客户的过程。该书第二章通过航空、汽车销售等行业的企业案例,对通过开发利用数据来完成识别客户并予以价值分类的操作,作了详细说明。有价值的客户,可以经一系列的问答,对应发掘出数据来辨识。该书作者特意强调了结合统计模型预测与个人直觉,以提高数据应用价值的重要性。

找到客户并不意味着万事大吉,如何跟客户交流,怎样确保这种交流能够激发客户兴趣、反映客户喜好、挖掘其潜在的购买动机,才是定位客户的重中之重。这就意味着,大数据时代,即便掌握更多数据,企业仍需应用定性和定量分析等工具,来筛查客户数据。

大数据技术和方法可以帮助企业更精准地找到客户(地点捕捉)。书中介绍了四种行动方式:借助特定媒体客户的个人介绍,使企业的目标客户与这些客户的信息相匹配;了解目标客户的住址;了解怎样通过客户住址、邮寄地址、网络cookie接触具体某个人;通过确定某一类固定客户样本来确认地址信息。

定位客户工作,还包括制定相关预算,这同样离不开数据挖掘分析,可采用相应的计量经济学模型,基于历史角度估算特定时期的媒体成本和消费习惯,确定特定营销成本的增减会带来怎样的长期影响。具体操作中,企业需要通过优化测量指标、选择方案来提高基于数据分析的营销的成效。

有何问题存在

该书作者指出,目前,无论是线上还是线下,广告投放的精准度相比过去都有了本质性的提升。更多企业已经开始通过对话、建立关系、互动娱乐等方式来接触客户、定位客户,这一过程又产生了更多有价值的数据。问题在于,更多的互动主要出现在社交网络、搜索引擎、广告网络等外部平台,这就使得大数据应用的成本凸现,并且,在许多国家和地区,企业通过自行捕捉收集和购买等方式掌握的消费者数据,存在侵犯消费者隐私权的法律风险。该书作者强调,企业需确保消费者的选择权,尽可能通过某种利益让渡的方式,让消费者从数据提供中获得直接好处。

构建大数据深耕客户资源 篇4

那么, 商业银行应当如何做好应对客户消费需求日益趋向多样化和个性化的准备, 并且提高银行对客户的黏性呢?笔者认为必须通过大数据中心的构建, 来实现对新客户的吸纳与旧客户的维护。

确立客户数据在营销战略中的基础性作用

为保住业绩而去拉更多的客户, 仅仅是银行做好客户群体的吸纳与维护工作的第一步。只有通过大数据中心, 银行才体会得到和客户牵手的真实感:这个客户是银行的真实客户, 他的金融消费行为是在银行的密切关注下完成的。例如通过他定期在加油站的刷卡记录, 我们知道他可能有一辆车;通过他定期在酒店、宾馆的刷卡记录, 我们知道他可能是一名经常出差的商务人士;通过他定期在香港、澳门首饰专卖店、奢侈品商店的刷卡记录, 我们知道他可能会对富有投资及收藏价值的商品感兴趣……当前2014年的银行征信工作正在深入铺开, 这就是我们推进大数据中心构建的一个重要节点:存量人民币基本账户信息正在大量收集, 电子化信息档案正在一一建立, 信用评价机制正在不断健全, 而信用信息正在实现共享和应用。

搭建大数据中心后台

做好客户群体的吸纳与维护, 就必须建立能够有效针对客户的消费行为进行细致而强大的数据分析与挖掘的数据仓库。这个大数据中心应当具有超级计算中心提供的超强计算能力, 可以充分利用动态配置、资源集合、数据服务和标准化的基础设施, 并辅以相应的营销分析系统, 通过网络、业务数据以及运维支撑系统的融合, 基于海量数据而非经验和直觉来进行管理和分析, 并最终作出决策。这个大数据中心将会给银行带来巨大的规模经济效应, 因为不同的细分市场所配备的资源是不一样的, 所以精细化的客户管理将会使资源和细分市场的匹配达到最佳。基于大数据中心的建设将会成为重点突破方向, 细致、真实的客户资料能带给银行不可估量的价值, 对其他业务有一定的参照和引导作用, 并对进一步做好客户服务、实现金融交叉销售有极大的帮助。

基于大数据中心进行有效的客户管理

只有练就卓越的服务能力才能留住客户, 因此必须做好客户群体的维护, 管理好包括客服在内的整个后台业务。银行应当在内部专门成立一个实力强大的数据挖掘小组, 根据营销导向和信用导向, 通过收集客户关系管理系统和交易数据库所搜集的数据, 对客户的消费习惯作出深入的分析, 对每一个客户进行行为评估。知道客户的个性消费喜好以后, 银行就可以进行主动的经营和有效的客户管理, 根据客户的需求定制个性化的服务, 在客户最需要的时候向他提供最合适的产品和服务:例如在营业网点进行各种形式的贵金属产品展示;举办富有投资、收藏价值的纪念品沙龙品鉴活动;代理特色金币、十二生肖纪念邮票、个性定制的手工艺品……

此外, 因为大数据中心解决了信息不对称的问题, 银行还可以拿着这样的数据报表要求商户给我们的客户专门的优惠;我们也可以用这些数据与商场进行谈判, 要求他们提高我们的回佣, 因为我们的客户能给它们带来效益。在搭建了良好的售后服务系统, 和客户建立了良好的互动关系以后, 我们还可以实现最大效用的客户管理:口碑营销, 让客户帮忙去转介绍。开发新客户需要很大的成本, 但是做好老客户只需要用心!这就是我们在战略上重视大数据中心的最终理由——黏住客户的基础。

客户数据 篇5

会员卡搜集的资料主要是会员的个人信息,包括性别、联系方式、居住地址等,同时由于会员在消费时需刷卡才能积分并享受优惠,故所有会员的每一次消费信息包括花费金额、购买时间、所购商品名称、所购商品的促销折扣、享受的总折扣都有记录。但该商场仅将此资料作为积分兑奖的依据加以利用,同时对长时间未到店的用户进行短信促销推广,这样做实际仅利用了CRM数据库中很小的一部分信息,对于海量的会员购物细节信息并没有加以深度的利用。

在周边商场不断打折促销的压力下,该商场采用同样的折扣手段进行促销以吸引消费者,但效果不佳,商场的营业额出现了增长的停滞甚至下跌。商场面对困境决定对用户的数据进行深度的发掘,希望能够对商场的会员采取有针对性的促销措施,以避免客户的流失。

CRM是步枪 数据挖掘是

针对这一案例,本尼菲咨询数据挖掘咨询顾问认为,传统企业管理的优势通常体现在后台,ERP系统帮助企业实现了内部商业流程的优化,提高了生产效率。而面对前台变幻莫测的市场时,企业往往缺乏真正有效的工具的帮助,诸如:什么产品最受欢迎、哪些顾客偏好购买哪种产品、原因是什么、有多少回头客、什么类型的客户为企业带来现金流、什么类型的客户为企业带来利润、哪些用户较具成长能力、哪些用户有离开的倾向、离开的原因有哪些等,目前大部分企业还只能依靠经验来推测,CRM系统的应用还仅仅局限在浅层,很多数据并没有被转化为能够帮助客户的知识加以利用,而仅仅是作为一个数据被忽略掉了。

目前CRM系统已经为企业提供了一个收集、分析和利用各种客户信息的系统,帮助企业充分利用其客户管理资源,也为企业在电子商务时代从容自如地面对客户提供了科学手段和方法。目前所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少。如何有效地利用这些海量的信息,是摆在大多数企业面前的一个重大的问题。

大量的调查和行业分析家都明确了这样一个事实,即建立和维持客户关系是取得竞争优势的惟一且最重要的基础,这是网络化经济和电子商务对传统商业模式变革的直接结果。而实现这一目标的有力武器就是数据挖掘。

数据挖掘与CRM之间的关系类似于枪和子弹的关系,CRM就是一支步枪,而数据挖掘工具则为这支步枪装备了强力的 。这一组合将成为企业赢得市场、取得市场成功的有效助力。

数据分析形成会员分类 进行精细化营销

那么,怎样才能对用户的数据进行深度挖掘呢?让我们看看这个商场是怎么做的。

首先,这个商场根据用户的消费额和消费频率将用户进行分级,对消费金额较高的重点客户进行定期电话回访,以保证高端客户稳定。在这个环节中,数据挖掘团队首先对用户的消费额度和消费频率进行平均,再将每一个用户的消费频率和消费额度与平均值相比,得到与平均值有显着差异的用户,通过进一步的电话和短信访问区分出高价值客户和低价值客户,

再将高价值用户的消费额与消费频率进行交叉,对高价值用户进行进一步的细分。其次,分析师根据用户的消费频率和购物习惯将用户进行分类,根据对会员进行的电话访问结果和消费数据的分析,建立了会员的购物模式分类模型,通过聚类分析,将会员归类到各个细分的类别当中,再经过与商场的一线人员的实际沟通,对分类结果进行进一步的修正。对每一个新加入的会员经过判别分析后直接归入到其所属的类型当中,在经过一段时间的观测取得一定量数据后,即可对其展开针对性的营销推广活动。

用户在持有会员卡进行一定频率的消费后,模型自动判断用户在商场的购物类型和习惯,将会员细分为价格敏感型、超市购物型、品牌忠诚型、附近居住型等不同的类型。根据差别分析的结果检验,商场发现,价格变化对价格敏感型用户的差别影响程度达到了87.2%,其他类型的用户群体在差别检验中,也显着地体现出了其主要的影响因素。

这一结果首先被应用于针对性的定制营销。商场有针对性地发送了不同的促销信息,包括对价格敏感型用户在推送内容上主要以打折促销信息为主,将其习惯在商场购买的商品的相关打折促销信息准确地通过短信推送到其手中。而对于品牌忠诚型消费者则有选择地推送相关品牌的新品上市、价格促销等信息。同时通过与用户的频繁接触,对用户的个人信息进行了定期的维护和更新,使得商场有能力通过邮件递送的方式,将过去需要消费者到店领取的优惠券直接递送到消费者的手中。

在第二阶段,根据本地消费者与商场会员的购物习惯,将本地消费者习惯购买的商品的相关信息,根据消费者的购物习惯进行共同的促销信息推送,以吸引原本在其他地方购买商品的用户在本商场进行更多的相关产品购买。例如购买品牌服装的女性消费者通常具有较大的化妆品及护肤用品的消费需求,在过去,由于商场面积较大以及商场一贯的高端形象,很多消费者是在其他商场购买化妆品和护肤用品的,但经过对消费者购物习惯的数据挖掘后,商场针对只在商场购买服装的女性消费者有针对性地根据其购物的价位推送相关化妆品和护肤用品的广告,同时调整了购物通道的设计,使得消费者能够更容易从服装区到达化妆品区域。经过一个月左右的实际检验,商场的化妆品和护肤用品销售额得到了大幅度的增长。

图1商场根据用户的消费频率和购物习惯将用户进行分类,建立了会员的购物模式分类模型

针对性营销商场数据采集与分析会员消费

图2商场通过对CRM系统数据采集与分析,对会员进行有针对性的营销。

链接

零售企业如何有效应用CRM数据

针对目前在各零售企业普遍应用的CRM系统情况,本尼菲数据挖掘分析师建议:

首先,在企业系统建设规划阶段,充分考虑来自不同部门的近期及长期需求,充分将CRM系统实施后可能会为企业的运营带来的变化向各部门详细阐述,由各部门提出各自对于系统的期望和要求,统一汇总调整后整理为系统的建设需求。在此过程中,要充分考虑CRM数据挖掘对于企业市场营销与市场微观环节的影响以及对决策支持的重要性。

其次,在CRM设计阶段预留出足够的升级空间,比如数据库在设计时不仅要考虑目前有能力收集的数据,更要为未来可能会收集到的数据预留出足够的空间。

同样,系统的设计不仅是为了收集数据进行统一的提取和分析,还要考虑未来逐步实现智能数据分析,将真正的商业智能逐步引入到系统当中,这就需要在数据搜集、传输、储存等环节充分考虑到这方面的要求。

数据时代的 客户导向型组织 篇6

一项调查显示,在受访的200名市场营销决策者中,超过63%的人认为客户导向非常重要。然而,只有42%的受访者在做战略决策时考虑了客户因素。这一落差可能只说明了一件事:人们在使用“客户导向”这个词时并没有正确理解其内涵。

事实上,客户导向可以简单定义为:企业聚焦于客户的需求和行为,而不是内部驱动因素(如追求短期利润)。客户导向型组织不仅需要制定相应的战略,还需要建立相应的文化和理念。在此框架下,企业可以利用合适的工具全面深入地了解客户,优化客户接触点,并最终将自身打造成客户导向型组织。(参见副栏“打造客户导向型组织”)

在打造真正的客户导向型组织方面,乐购(Tesco)无疑是一个成功范例。这家连锁超市的战略目标是赢得顾客一生的忠诚。公司前任CEO特里·莱希爵士(Sir Terry Leahy)提出的营销口号是“我们要比任何竞争对手更了解我们的顾客”。而实现这一目标的抓手就是乐购的会员卡计划。1995年,乐购推出的会员卡计划,是一次真正的创新突破。发行会员卡这个想法是由咨询顾问埃德温娜·邓恩(Edwina Dunn)和克莱夫·哈姆比(Clive Humby)提出的。经过短暂试点后,时任乐购董事长的麦克劳林勋爵(Lord MacLaurin)惊讶地表示:“短短3个月,你们比我这个从业30年的人更了解我的顾客。”自1990年代中期开始,乐购一直通过会员卡奖励机制收集和挖掘顾客数据。顾客每消费1英镑,就可以获得1个积分,相当于1便士。对于有些商品,积分可以翻一倍、二倍,甚至三倍。每个季度末,乐购会把顾客累积的积分兑换成相应金额的代金券,邮寄给顾客。

据乐购统计,从开始发行会员卡到2002年年底,乐购奖励给顾客的金额达到了10亿英镑。当然,也正是因为数据的收集和应用,公司营业额和利润的增长速度远远超过市场平均水平。很快,乐购超越了最强对手Sainsbury’s,成为英国最大的连锁超市。分析顾客购物行为和细分群体,然后据此为顾客提供积分奖励,这种做法极好地推动了乐购的发展。深入了解顾客,不仅给乐购增加了数亿英镑的利润,还开创了新的业务领域,如提供个人金融服务,向顾客销售保险等产品。

莱希表示,如果没有会员卡收集的数据,公司非食品业务的利润就不可能增加那么多,公司网站tesco.com也不可能这么快获得成功。1919年乐购创立时只是伦敦的一家街边小铺,现在它已是世界上最大的网上食品超市。乐购会员卡发明人邓恩和哈姆比相信,是数据让乐购成为了一家完完全全的客户导向型组织。这同时也解释了为什么乐购能够解决“吸引各类购物者”这一难题。在网上论坛中,一位顾客用略带诙谐的话准确解释了乐购的成功秘诀:“我都不知道家里的卫生纸快用完了,他们却早知道了。”

从1990年代中后期开始,欧洲或美国的大型企业都声称自己是客户导向型组织,或者至少正在朝那个方向迈进。如果让这些组织的高管们到法官面前发誓自己说的是实话,想必他们中绝大多数人都会拒绝。要持续以客户为导向,就意味着必须颠覆20世纪大众市场的价值创造逻辑。如果我们在这里提出,数据驱动营销可以成为这一变革的决定性推动因素,对此应该不会有人感到吃惊。

价值创造逻辑的颠覆

采购部门说了算!在零售行业,哪个营销人员或销售人员在提出自己的营销或销售点子时没有碰过这样的钉子?不过别担心,今后采购部门不再是什么都说了算了。过去,营销和销售部门一向都是组织与客户的交互界面,在福特主义的价值创造逻辑中,这个界面没什么特殊的。但是,到了产品和服务几乎可以互换的今天,客户导向已成为最后一个重要的差异化因素,从而把营销和销售推到了企业的中心位置。如果这些部门能够及时做足功课,并在数据的帮助下深入了解客户,它们就能推动企业完成一直没有迈出的那一步:成为真正的客户导向型组织。副栏“逆转价值链”描述了客户导向理念下彻底颠覆的价值创造逻辑。

与此同时,企业还需要进行一系列组织变革,目的是要大大提高那些与客户或客户数据打交道的人的重要性。这些变革包括更加重视与客户的沟通,建立新的汇报关系,重新分配客户分析资源,整合潜在使用者,以及与客户中间人建立新的伙伴关系。通常,最省事的做法是,把分析和规划职能都集中到营销部门,这样就能把资源分配到每一个与客户直接互动的地方。所有这些变革对于组织来说可能是爆炸性的,这也就引出了一个决定性因素:克服对变革的抵制情绪。

组织变革向来艰难。当企业想把焦点放在自己的客户身上时,需要完成的变革任务同样艰巨。虽然你可能希望找到让人更开心的变革理由,但危机,尤其是那些威胁企业生存的危机,常常是促使企业实施变革的起点。难怪在2008年金融危机爆发后,许多企业开始利用数据开辟新的客户渠道。我们参与了许多类似项目,发现这些变革过程和其他变革管理过程几乎没什么两样。变革一开始,大家都认识到需要建立新的管理链条和商誉——或者至少看上去是这样。到了中间阶段,阵地战爆发了,变革抵制势力嗅到了他们的机会。最糟糕的情况是,他们阻止每一个人做出改变。旧体系已不灵光了,而新体系还没有完全建立起来。我们的美国同事把这种情况称为“进退两难”。在这一阶段,数据挖掘项目常常因为得不到贯彻而告终。

数据是催化剂

几年前,欧洲一家大型包装材料制造商的许多B2B客户都感到公司对它们关注不够。客户在订购时,如果所需的包装材料或数量不同,就得和不同的业务人员打交道。公司拥有十几个工厂,每个工厂都有自己的销售部门。和其他分权型组织通常出现的情况一样,这些工厂和部门没有形成一个连贯的整体。其实公司管理层早就知道这个基本问题。但是,仔细、全面地分析了数据库之后,他们才意识到内部混乱的严重程度。客户常常同时向三个或三个以上的工厂订货,而且必须事先弄清楚可以从哪个工厂订到哪种货。如果客户自己克服了这个困难,销售团队做的就只是回答客户的一些询问。如果确实存在单个客户的销售活动,也只是出于偶然,或因为有私人交情。

nlc202309020536

为了彻底解决上述问题,我们根据业务量情况将该公司的客户分为三类,然后在公司总部层面进行大客户管理,并给所有重要客户分配了专门的联系人。这样一来,有些工厂就失去了优质客户,可以想见员工对此怨声载道。在变革重组的同时,公司还组织了讨论会,让员工学习使用新的客户关系管理工具,同时讨论变革重组的原因和好处。新的组织结构建立后,员工的学习讨论并未就此结束。在后续的讨论会上,大家出谋划策,为新流程提出合理的调整方案。重要的是,大家在讨论会上量化和讨论了重组带来的价值提升。变革带来了积极的影响,无论是最重要客户的业务额,还是公司总体业务额,都有了大幅增加。很快,争论的声音平息了,就连那些最尖锐的批评者也偃旗息鼓了。与此同时,公司系统收集了客户反馈,并且很快发现客户满意度在逐渐提高。在下一阶段,公司找到并实施了各种方法,通过数据分析发现各个客户的潜力。最终,该制造商学会了以客户导向的方式积极开拓市场,并在此后几年实现了远高于行业平均水平的增长速度。

打造客户导向型组织

从我们开展的众多成功项目中,可以得出这样一个结论:数据驱动营销可以成为企业向客户导向型组织转型的一个——如果不是唯一的——决定性因素。从这一点,我们又可以发现一系列关键成功因素以及需要克服的障碍。下面就是真正成为客户导向型组织的路径。

快速成功并传播捷报 简单有效的80/20法则同样适用于数据项目。在变革转型时,最好先快速取得一些成功,从而激励大家追求更多的成功。因此,我们强烈建议数据驱动营销的支持者把重点放在20%能带来最大收益的数据上。美国连锁药店沃尔格林(Walgreens)的一位营销经理萌发了一个简单的想法,他想看看7,000个门店的邮政编码与当地报纸上的广告预算匹配程度如何。这些报纸的读者群分布广泛,但人们通常都会选择离家不到2英里的药店去买药。这也就是说,公司的广告预算浪费很大。于是,沃尔格林做出了一个理所当然的决定:不再向离门店2英里之外的地区投放插页广告。虽然这个决定对销售额没有产生什么影响,但营销预算节省了近500万美元。而且,数据收集和分析都是在一台普通的电脑上完成的,成本也不大。很快,营销投资回报率数字在整个公司传开了,更多的营销分析项目开始涌现。

在数据营销项目中,易于理解的最佳实践案例几乎总能最有效地反驳抵制声音。当管理者面对其他部门或自己团队成员的质疑时,这些案例可以给他们提供一定的安全感或有力论据。试点项目的成功消息也应该立即分享给有关部门决策者(如产品开发部门或生产规划部门的同事),因为深入的客户洞察可能对他们也有帮助。任何感兴趣的同事都可以成为盟友。我们看到,在许多公司,以数据为导向的同事们纷纷建立起跨部门的关系网络。当然,这样做对内部营销和销售部门的名声不会带来任何损害。

获得管理高层的支持 毋庸置疑,对企业来说,向数据驱动的客户导向型组织转型是一项战略决策。无论各种证据和成功试点项目如何证明了变革转型的必要性,要改变企业文化,必须由企业高层来推动和指引。托马斯·达文波特(Thomas H. Davenport)仔细研究了“分析型竞争者”(analytical competitor,参见本刊2006年2月号《用分析去竞争》)的CEO的履历,其中包括凯撒娱乐公司(Caesars Entertainment)的加里·洛夫曼(Gary Loveman)、亚马逊公司(Amazon)的杰夫·贝索斯(Jeff Bezos),以及第一资本公司(Capital One)的理查德·费尔班克(Richard Fairbank)。他们都拥有技术或科学背景,都是偏好数学和统计学的信息科学家或经济学家。当然,可能也有例外,但我们还没发现。客户数据的深度使用是不会从公司底层发起的。在客户数据驱动的组织里,高管层是分析应用的推动者。他们必须具备相应的技术知识,这样才能提出正确的问题,并用正确的指标量化项目进展。他们参与团队会议,并在项目实施遇到困难时鼓舞大家的士气。

但是,如果企业的董事会或管理层不相信客户数据的威力,他们就会继续依靠自己的直觉或传统智慧进行决策。但愿他们的直觉能给他们带来好运。不过,从《斯隆管理评论》(MIT Sloan Management Review)与IBM商业价值研究院(IBM Institute for Business Value)合作开展的一项研究来看,现在只有少数人持有这种态度。在受访的3,000名企业决策者中,只有四分之一的人觉得,建立数据驱动流程的真正障碍是高管层不予支持。我们的经验也表明,很多时候,是高管们抱怨自己的团队对数据营销缺乏兴趣,而不是反过来。

逐步建设分析资源 才华横溢的数据人才不大会从投资银行和对冲基金蜂拥转行到营销领域(两个领域之间的工资差异应该是主要原因)。不过,越来越多的营销组织开始寻找数学、统计和科学分析方面的人才。由于这些技能都是稀缺资源,所以这项任务很艰巨。但是,企业很清楚,它们需要招揽合适的人才:在前文提到的斯隆-IBM研究中,三分之二的营销决策者承认,他们缺乏能够解读复杂客户数据的人才。如果人才招聘环节得到改善,营销经理下一步要做的就是,学会充分重视这些分析人才的价值,从而使他们能够留在组织中。数据分析人才常常性格内向,而许多营销部门里外向和自我的人不在少数,因此,冲突很难避免。夸夸其谈的创意人员能够获得很多嘉许,但他们的胜利最终可能被证明得不偿失。数据人才清楚自己的价值。他们可能不会抱怨自己没有受到重视,但如果他们心里感到非常不满,就会选择离开。

无可否认,数据分析人才并不是客户导向型组织的人力资源部门所面临的唯一挑战。经常接触社交媒体的企业还希望自己的员工能够很好地融入在线社交网络。当然,这并不只是年龄问题,但是,那些四五十岁的人不能因为自己每小时查看黑莓手机或iPhone不下10次,就认为自己是网络社交老手。为了优化在Twitter上新推出的广受欢迎的客户服务,百思买(Best-Buy)、O2、德国电信(Deutsche Telekom)等许多支持密集型企业(supportintensive business),正在积极招募“数字原住民”(digital natives)。斯隆-IBM研究还表明,引入全面商业分析的第二大障碍是管理者的能力。这也给企业董事会和CEO们提出了一个清晰的警示:如果他们希望在业务流程中更加重视客户和客户数据,就要对管理者提出新的能力要求。

nlc202309020536

至于数据营销需要什么设备,我们很难列出一套通用的规则。企业利用简单的Excel或Access工具就能快速取得一些成功。不过,基本的规则是,从一开始就考虑到新的IT基础设施的可扩展性。这需要企业一开始就进行大量投入,而这种投入可能会阻碍企业实施任何数据驱动营销。其实,企业也可以换个角度来考虑这个问题:在企业现有的IT设施上,增加一些小的软件包,常常就可以创造出大量的增加值。未来几年里,随着商业分析成本下降,以及云解决方案不断推出,这个问题就会迎刃而解。不过,选择合适的工具和合作伙伴,仍会是重要的成功因素。

建立数据一致性 每一点客户数据都描述了一小部分现实。复杂数据的问题是,根据这些数据,我们可以对企业现实做出许多不同的解读。对统计数据的解读方式多种多样,这个问题和统计学本身一样古老,即便在云计算时代,这个问题也不会立即消失。我们经常看到,不同部门或分公司在做决策时使用不同的客户价值定义,或者使用不同的方式来描述客户特征,生成不同的数据格式。

如前文所述,数据驱动的决策往往采用集中形式。这样做符合事物的本质,因为把数据集中起来分析,价值会更大。如果各个部门或分公司分析能力较弱,也不知道哪些方法在什么地方进行了尝试,取得了什么样的结果,那么就算它们都进行类似的回归分析,产生的结果肯定不会好过公司把数据集中起来进行分析。集中分析可以在某个具体的地方进行,不过在云计算时代,就不一定非得这样了。同时,集中分析还可以提高数据的一致性。

对企业来说,好的客户数据管理就是好的知识管理。在世界一些地方,尤其是在欧洲,人们尚未完全接受这样一种观念:信息是一种资源,只有使用,它才会有价值。如果企业中有更多的成员看到客户数据,他们就会更快地意识到要成为真正的客户导向型组织。

过去几年里,eBay等企业成功尝试了所谓的“沙箱”技术,也就是一种封闭的IT测试环境,在这个环境里,员工可以安全地“摆弄”数据,用数据做试验,而不会对主要数据库基础设施造成任何损害。那些最好的想法(也就是结果评估最好的想法)不仅会被采纳,而且可以成为整个组织的标准做法。如果数据一致性得以建立,并且所有员工对企业目标有统一认识,那么,以数据为支持的客户导向型企业就能兼顾集中管理和分散管理,商学院里关于这两种管理的历史争论也将得以平息。

说服员工 基于数据的营销创新有其优势,因为可以用确凿数据予以支持。毕竟,这正是数据存在的部分原因。但是,数据营销应用的引入并不能使我们摆脱人类固有的特性:人们往往高估已有事物的价值,低估新事物的价值。在引入数据营销时,好的变革管理就意味着运用最佳实践,保持良好沟通,改变招聘流程,常常还要进行结构重组。企业必须对员工进行培训,让他们学会使用新的软件工具,最好是能够自己开展对照组试验以及建立预测模型。企业应该设立切合实际的中期目标,并密切关注这些目标是否实现。美国一些企业在营销中积极使用分析方法,同时还改变员工激励机制。它们以假设情境作为对照,来评估和奖励工作业绩。这些举措有助于大多数员工接受数据营销。当然,总会有少数顽固分子不愿意合作。对于这帮人,我们建议采纳保罗·法尔科内(Paul Falcone)在101 Tough Conversations to Have with Employees(中文版《101招搞定难缠员工》由经济科学出版社于2012年出版)一书中提出的招数。和谐是一种甜蜜的毒药,只会让许多企业失去活力。有时,大棒比胡萝卜更管用。

危机复原力与关键时刻

你不需要用水晶球,就能确切预测出,今后几年,许多市场的经营情况都会出现波动。至少,不确定性是可以肯定的。财政政策和金融市场的风险积聚,注定了这种不确定性的存在。当变化和波动呈现系统性时,我们必须学习如何应对它们。情境方法将在很大程度上取代规划工具。数据和预测建模不会帮我们找回1960年代对增长型市场的可靠规划。但是,它们至少会在两个方面对分析驱动企业有所帮助。一方面,客户导向型企业比其他企业能更好地留住客户,因此,受市场波动的影响更小。另一方面,分析型竞争者能更快地发现危机中的潜在机会。它们能够更准确地建立不同的市场情境模型,并推算出相应结果。它们还能够更快地确定市场突变带来的影响,并更好地做出应对。

总之,了解客户并根据客户需求建立商业模式的企业,更具有危机复原力。至此,一个封闭的循环形成了。人们常说,危机是企业进行客户导向重组的触发器。虽然危机复原力的提升看起来像是变革转型的良性副产品,但在今后几年里它很可能成为客户导向型组织最有价值的资产。

为了突出这种发展趋势,一些企业引入了“首席客户官”(Chief Customer Officer)这个职位。首席客户官的工作是确保客户在各个接触点(关键时刻)获得尽可能积极的体验。我们不相信,像一些运用神经学的营销人员所预测的那样,10年后销售和营销部门将不复存在。我们认为,客户体验管理(customer experience management, CEM)会受到更多的重视。和许多营销概念一样,客户体验管理也可以被看作“新瓶装旧酒”。良好的客户关怀和沟通可以让客户感到满意,使他们忠于品牌,甚至成为狂热的品牌大使。1980年代,北欧航空公司(SAS Scandinavian Airlines)老板詹·卡尔森(Jan Carlzon)提出,公司每年有5,000万个“关键时刻”(尽管每个时刻平均只持续15秒钟),在这些时刻,公司员工可以与乘客进行沟通,使公司形象深烙在乘客的头脑中。卡尔森的理念就体现了上面的这种逻辑。而如今,数据将大大推动客户体验管理。有了数据,员工就可以在接触客户之前做好准备,有条不紊地利用那些关键时刻,将客户培养成品牌大使。

观点概要

在产品和服务几乎可以互换的今天,客户导向已然成为许多企业经营模式的核心要素,也是最后一个差异化因素。要做到持续以客户为导向,就必须颠覆20世纪福特主义的价值创造逻辑,而数据驱动营销无疑可以成为这一变革的决定性推动因素。

nlc202309020536

想要真正成为客户导向型组织,企业应该:

快速成功并传播捷报 在变革转型时,最好先快速取得一些成功,从而激励大家追求更多的成功。在数据营销项目中,最佳实践案例几乎总能最有效地反驳那些抵制的声音。

获得管理高层的支持 对企业来说,向数据驱动的客户导向型组织转型是一项战略决策。无论各种证据和成功试点项目如何证明了变革转型的必要性,要改变企业文化,必须由企业高层来推动和指引。

逐步建设分析资源 越来越多的营销组织开始寻找数学、统计和科学分析方面的人才。如果人才招聘环节得到改善,营销经理下一步要做的就是,学会充分重视这些分析人才的价值,从而使他们能够留在组织中。

建立数据一致性 数据驱动的决策往往采用集中形式。这样做符合事物的本质,因为把数据集中起来分析,价值会更大。同时,集中分析还可以提高数据的一致性。如果数据一致性得以建立,并且所有员工对企业目标有统一认识,那么,以数据为支持的客户导向型企业就能兼顾集中管理和分散管理。

说服员工 在引入数据营销时,好的变革管理就意味着运用最佳实践,保持良好沟通,改变招聘流程,常常还要进行结构重组。企业必须对员工进行培训,改变员工激励机制。

银泰:以客为先的零售融合

面对网络零售带来的巨大冲击,百货零售商都在苦苦寻找出路,而银泰商业集团显然拥有先见之明,早在2010年就建立银泰网,进入电子商务领域,如今则要利用自己积累的互联网运营能力反哺实体百货,实现零售业态的新融合。

为了推动泛渠道的零售融合,银泰制定了“以客为先”战略,用互联网零售模式改造实体门店。银泰鼓励消费者用手机号注册会员,用手机通过店内WIFI登录会员认证界面,并用自己的微博和微信账号登录银泰网和银泰APP客户端。银泰这样做的目的,就是为了给消费者建立身份标识,并通过技术手段,将不同身份标识指向同一个消费者,实现消费者线上线下数据的融合。一旦有了消费者的身份标识,无论消费者出现在哪个渠道,银泰都能加以识别,并收集有关消费者的描述性数据、行为数据、交互数据,以及情感信息。

为所有消费者建立数据库后,银泰可以对消费者的购买行为和偏好进行分析,找出共同需求,然后按照需求将消费者进行分类。这样一来,银泰就能针对某种生活方式策划一些促销活动,通过对不同品牌不同商品的搭配组合,满足特定消费群体的需求。同时,形成了对消费者的个性化洞察后,银泰还可以实现精准营销,当消费者出现在门店、银泰网、银泰APP等不同渠道时,给他们的手机或在网页上推送他们感兴趣的商品和促销信息,引导他们消费。

银泰的反哺策略还将包括推动实体百货的单品管理、数据挖掘、店面改造等方面的创新。其最终目的是,将线上线下渠道融为一体,实现整个零售业态的蜕变升级。

客户数据 篇7

使用数据挖掘技术对客户进行细分就可以识别具有相似特征的客户群,这样就可以了解各种不同的、具有各自特征的客户情况, 从而基于客户分群工作进行进一步的客户分析和市场策略制订。 因此客户分群模型建立的意义主要就是通过对客户进行分群,分析各种客户群的特征来为企业管理层提供决策支持。

1客户分群的理论阐述

就市场营销的理论来说,营销手段可以分为几个层次:首先是大众营销,对所有客户进行不考虑特性差异的宣传;然后是基于市场细分的营销,把客户分为几个群体,对每个群体进行针对性宣传,也就是所说的一对一精确营销。

客户细分的基本依据是每个客户作为消费者对同一产品的具体功能需求和关注点是不同的。 作为服务提供者的运营商必须尽可能地考虑这些差异, 发现存在于客户中的具有不同特征或消费习惯的客户群体, 在此基础之上面向不同群体执行更具针对性的管理或营销策略。

客户分群总的来说有两大类方法,一类是手工方法,一类是自动方法。 手工方法就是人为地进行客户划分,即业务人员根据自己的业务知识以及对客户的了解程度, 出于某种管理或者营销上的目的把客户分为几个群。 这种分群的划分原则是预先已知的, 比如按照客户消费额划分成 “高价值客户”、“低价值客户”;按照是否大客户划分为“普通用户”、“大客户用户”。 这种手工进行客户细分的方法通常只能考虑少数几个变量, 如果想多考虑一些变量,尤其是大部分连续型的行为变量,就必须使用自动分群方法了。

自动分群是通过使用数据挖掘提供的聚类算法, 确定自己认为会有价值的输入变量,通常数量较多,通过挖掘算法根据数据的特点决定把客户分为不同群体, 分出来的群与群之间差异尽可能大,群内差异尽可能小。

客户分群的关键在于根据什么变量来进行细分。 在移动通信行业,商家可以获得的数据很多,主要有客户行为数据、人口统计数据以及一些附加数据。 其中客户行为数据包括客户通话清单数据、客户账务数据以及客户拨打客服电话的记录等,这些都是通过计算机采集到的,具有很好的数据质量,同时也是最有价值的客户信息,是了解客户特征的最重要的数据。 因此,根据客户行为数据进行客户分群会具有更高的可用性。

2客户分群的技术分析

客户分群模型的建立需要依靠数据挖掘技术。 通过客户分群挖掘,企业能发现过去所不知道的客户类型,对自己的客户有更科学、更全面的了解,这无疑会使客户管理工作和营销工作能够更容易地进行。 比如, 通过客户分群了解不同客户群的详细的、特有的需求,这样就能够发现新的营销机会;通过客户分群了解不同客户群的特点, 这样就能有针对性地开展差异化客户服务,增加客户满意度;还可以基于客户分群进行有针对性的营销宣传活动, 这样的宣传会比无目标的大众宣传更加有效;等等。

数据挖掘技术可以分为两种类型: 预测型数据挖掘和描述型数据挖掘。

预测型数据挖掘是要从一系列数据中找出特定变量(称为 “目标变量”)与其他变量(称为 “预测变量”)之间的关系,也就是掌握预测变量是如何影响目标变量的。

描述型数据挖掘是要在一系列预先不知道有任何关系的数据中查找关系的技术。 描述型数据挖掘常用的技术有聚类和关联分析。

聚类是要把整个数据库分成不同的群组。 它的目的是要使群与群之间差别很明显,而同一个群内的数据尽量相似。 与预测型挖掘不同的是,聚类是无指导的学习,体现在方法上就是不用指定目标变量。 聚类算法有两种:划分聚类法和层次聚类法。 其中划分聚类法可以指定聚为几类, 层次聚类法由算法根据数据情况自动确定聚为几类。 神经元网络和K-Means是比较常用的聚类算法。 聚集之后最主要的是对分群的结果给出商业角度的解释,这样才有实际意义。

客户分群就很适合使用聚类的方法。 首先,通过聚类的数据挖掘把所有客户按照特征分成几群,建立客户分群模型;其次, 分析各群客户的特征,主要是行为特征;再次,分析每一群客户特征体现出来的信息有什么商业价值, 为管理和营销人员提供制定管理或营销计划的依据;最后,建立完善的分群模型维护流程以适应市场的变化。 还可以从客户发展的角度考虑,根据客户产生的收益、客户通话行为特征、客户信用度风险等数据进一步建立客户价值评估模型,对客户群进行更深入的挖掘与分析。

3客户分群模型的构建与探讨

3.1总体框架

(1)基于客户行为数据,使用各种聚类算法生成客户分群模型;

(2)分析不同算法得到的分群结果,选取最好的模型,好模型的标准是群与群之间差异尽量大而群内差异尽量小;

(3)使用挖掘工具提供的数据探索工具分析各客户群特征;

(4)建立客户信用度风险评估模型,给出每个客户的信用度风险指标;

(5)建立客户价值评估模型,根据客户所产生的消费额、 客户通话行为以及客户信用度风险指标建立一个全面评估客户价值的客户价值函数,更合理地评估每个客户的价值。

3.2数据规范性

K-Means聚类算法是采用计算距离来度量记录之间的差异大小。 这种方法决定了聚类所输入的数值大小不同对结果的影响是不一样的。 取值比较大的变量,比如通话时长,变量单位通常是秒,值都非常大,这样在计算对象差异性的时候,这个变量的影响就会很大;然而对于一些取值比较小的变量,比如通话次数,取值就不会很大,这样计算差异的时候该变量的影响度就会减小。

在进行聚类之前应该对数据进行规范化处理, 这样可以大大提高聚类的效果。 常用的规范化方法有最大-最小规范化和Z-SCORE规范化。 其中最大-最小规范化是把数据在指定的区间内进行等比缩放;Z-SCORE规范化是计算每一个变量与平均值之间的差异大小和平均差异(使用标准差或者平均绝对偏差) 的比值。 本文采用的是Z-SCORE规范化方法,具体过程如下:

(1)计算平均绝对偏差(mean absolute deviation)Sf

式(1)中,x1f, … ,xnf是变量f的n个度量值,mf是f的平均值,即:

(2)计算标准化的度量值Z-SCORE

(3)计算斜率

以上三步都是通过SQL在数据库中进行的, 这样经过规范化后的数据就可以用来进行聚类了。

3.3建立聚类模型

K-Means聚类算法对于处理大数据集情况的效率是很高的,因此选择使用K-Means算法进行聚类。K-Means算法工作流程如下:

(1)任意选择K个对象作为初始的簇中心 (K预先指定);

(2)Repeat;

(3)根据簇中对象的平均值,将每个对象重新赋给最类似的簇;

(4)更新簇中的平均值 ,即计算每个簇中对象的平均值 ;

(5)Until不再发生变化,直到达到某个阈值 。

在实际的模型建立过程中, 通过聚类共获取到12个客户群,这里不再进行详述。

3.4模型分析

分析方法是把模型提供的各变量组内均值做最大-最小规范化后,划分出各类的优势特征和弱势特征,从而给各组一个描述性的名字。 给出的名字反映的是该组最大特征,但并不是唯一特征。 分析过程中把各变量规范化为0~10的公式如下:

式(4)中,V是被规范化的值、V_N是被规范化后的值、MIN_V是V值所在变量的最小值、MAX_N是V值所在变量的最大值。

这样变量的所有值将会被规范化为从0到10的区间,原值被等比缩放。 这样一个值在同一个变量中比其他值大还是小就很明显了。 各值只和同一个变量的其他值有可比性。 在分析过程中,规范化后的值被标上了不同颜色,这样对各类进行分析的时候对其优势字段、弱势字段就能一目了然。

分析过程中判断一个变量是否优势字段, 不光看某类中这个变量大还是小,还要看其他类在该变量上的取值情况。 例如, 如果某类中一个变量取值很大, 但是其它类在该变量上的取值同样也很大,那么这个变量就不是优势变量。

4结论与思考

以上仅是对客户分群模型构建的初步分析, 通过模型可以得到各群用户的显著特性, 并针对各客户群的特性给出一定的市场建议。 可能有些建议并不是很可行,但客户分群的思想以及所获取的客户分群模型还是极有效的, 未来基于该模型可以做很多事情,达到目标明确、事半功倍的效果。

例如, 通过了解各客户群的优势特征和弱势特征可以识别新的营销机会,从而有针对性地进行差异化套餐设计;客服部门可以参考客户分群的结果对不同类型的客户进行有针对性的差异化客户服务;市场部门再设计促销活动的时候,可以参考客户分群情况来选择正确的宣传目标和途径; 客户分群还可以与离网预测模型相结合, 在进行客户挽留的时候了解挽留目标的特征无疑是很有帮助的。

摘要:客户分群是企业从大众营销向差异化营销过渡的必由之路,也是未来保持竞争优势的基础。随着社会经济的发展和用户需求的多元化,企业需要把识别客户特征作为一项核心的市场分析活动,关注如何保持和拓展现有的客户价值。文章从移动通信运营商的角度,阐述了建立客户分群模型的理论基础和技术手段,根据客户行为数据采用聚类的数据挖掘方法构建总体模型,并对数据规范性、聚类算法以及模型分析方法等进行说明,提高客户分群的有效性及应用价值。

客户数据的有效分析与应用 篇8

还记得二十多年前, 我去美国求学, 非常幸运开始接触数据分析。随后的上世纪九十年代中期, 美国商业银行意识到数据分析的重要性, 开始招收统计学、运筹学、计量经济学等专业毕业生。我因精通数据分析的SAS软件, 第一份工作是加入了原Bank One的营销技术部, 作为业务分析师开始了16年的零售银行生涯。而中国银行业现在正处在历史转折点, 也已意识到数据分析的重要性。

从国外银行的发展历程看, “数据驱动型战略”已成为零售银行在专业化管理方面新崛起的一个经营理念和实践。“数据驱动”提倡的是基于事实的决策过程与结果, 也就是科学管理, 即用数据和事实来检验真理。比如, 国外商业银行高管每天看报表, 包括运营、客户、财务等, 实际就是看一些对客户信息管理和客户数据分析的数据。而国内银行现在面临的难题是, 怎样把数据挖掘出来, 把数据变成生产力, 放在业务部门进行运用。

实际上客户数据大体可分为两大类:第一是行为数据, 即客户实际交易的一些东西, 如账户里的余额和刷卡这些相对动态的数据。第二就是客户的特征, 即客户的性别、年龄、文化和教育程度等这些相对静态的数据。但银行最重要的是做好自身的定位, 尤其对客户的定位。例如民生银行现在提出先立足小客户、民营客户和高端客户, 客户定位非常明确。

当然, 对于客户定位有时候还得细分。比如瞄准小微企业, 但小微企业还是太大, 还可以在行业里进一步细分等。要通过客户空间度、生命周期等进行数据分析, 从而在战略上发现“哪些人是最有价值的客户”。

国外银行在数据分析转型过程中, 会围绕客户把产品落到实处。像美国银行的零售条线, 已经把原有的按产品条线的组织框架全部解散, 信用卡部已经不存在。信用卡跟零售部完全整合起来变成近千人的庞大机构, 按照层级面分高、中、低端客户。这是一场巨大的变革。

其实国内银行从事前端营销, 就是进行客户关系管理。比如每家银行都有客户增值服务, 增值服务后效果怎么样?应该对客户满意度、银行自身优化等数据都进行分析。除了最简单的观察营销活动量增长, 关键还要对投入产出进行分析。

在国外数据分析已经非常成熟, 数据库营销是一个很标准的自动化流程, 营销的投入产出过程管理都有具体的数据分析。现在国内银行在这方面还有很多难题需要解决, 尤其是历史数据本身就没有去积累, 在营销活动结束后, 投入产出比较难分析。

我曾经和朋友发表过一本《数据库营销》的书, 书里有许多营销活动的案例。其中有一个是关于个人贷款的数据库营销。我将这个活动细分得特别清楚:邮寄出去、回应、预期是多少, 从第一年到第四年收益支付都有一个预测。在国外, 银行专门对营销活动有把控和预测, 在投入之前, 要先给营销总监看数据分析。如果LV不达标, 营销总监不会同意执行。

因此, 银行内部的精细化管理与科学决策取决于银行对客户信息的管理水平及客户信息的分析能力。客户行为和特征的分析已经贯穿到整个业务流程, 从客户分层、产品设计、数据库营销、交叉销售、流失预测、授信审批和贷后催收等各个业务环节。数据分析已经成为业务决策管理中不可或缺的一部分, 目前国内银行最需要完善的应该在如下四个方面:

第一, 完善客户信息。完善客户信息是一项长期的任务, 要从营销、客服等人员做起。数据质量的改进永无止境, 要有信心、恒心和耐心。特别是对于中小银行, 尽早开始积累客户数据, 包括交易、账户、客户及市场相关信息。

第二, 搭建开发式数据平台。客户信息和数据是银行的共有资源, 在开发和分享的同时, 注意防范操作风险, 保证合规政策的执行与落实。在建立企业级数据仓库的同时, 要建立营销、风险、外呼等数据集市, 包括为分行提供有力的信息与分析支持。

第三, 加强分析与应用能力。要做精、做好银行的零售和信用卡业务, 必须有强大的业务分析能力与数据支持。零售银行的SAS分析团队犹如保险公司的“精算”, 其价值和作用是不容置疑的。银行要从团队建设、技能培训、业务知识、一线经验等方面开始培养业务分析人才。既有业务经验又有统计知识、并熟练掌握SAS, SQL等分析技能的复合型人才目前还相当稀缺。

第四, 倡导科学决策和精细化管理。精细化管理是银行发展的必然阶段, 随着市场竞争的激烈化、存贷利率的市场化, 客户需求越来越复杂、越来越挑剔, 有针对性地差异化营销和个性化服务等将更加重要。

客户数据 篇9

客户数据的收集与存储是实施客户关系管理的根基。随着办公自动化的推广,数据库和网络技术的应用,各企业拥有的客户信息越来越多,增长迅速。在这海量的、异构的信息资源中,蕴含着具有巨大潜在价值的信息资源,比如客户的基本资料、产品交易信息及客户反馈信息等[1]。企业要想不陷入信息的沼泽中,必须拥有强有力的数据分析工具,用以实现客户关系管理的目标。而数据仓库和数据挖掘技术的发展可以很好地解决这个问题。

1 数据仓库与数据挖掘技术

1.1 数据仓库

数据仓库是一个在企业管理和决策中面向主题的(Subject-Oriented)、集成的(Integrated)、反映历史变化的(Time Variant)、相对稳定(Non-Volatile)的数据集合[2]。

数据仓库要求数据量大,数据正确全面,所以数据在进入数据仓库前必须经过提取、转换与集成,把数据按主题分类,形成多维数据模型。它以多维数据模型为基础,实现数据的分析处理,主要用于支持管理决策。数据进入数据仓库后,一般会被长期保存,基本不会进行修改和删除操作,主要实现数据的查询。

数据仓库与传统关系型数据库不同,主要区别在于数据仓库打破了关系数据库中数据的规范性,实现了数据的重组,增加了数据冗余度;其次传统关系型数据库为了实现数据处理的及时性,要求数据尽量少,而数据仓库为了更有效的实现数据查询,要求存储的数据尽量多,实现海量存储。

1.2 数据挖掘技术

数据挖掘技术,是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域,并在金融、商业零售、电信以及生物医学和基因分析等领域得到广泛应用。

1.2.1 数据挖掘的概念

数据挖掘(Data Ming),是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识一般可表示为概念(Conce Pts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式[3]。

数据挖掘是知识发现的过程,是将未加工的数据转换为有用信息的整个过程。该过程包含一系列的步骤:确定业务对象、数据准备、数据挖掘、模式评估和知识表示[4]。

1.2.2 数据挖掘的技术与方法

数据挖掘方法是以数据库为对象,基于机器学习、科学计算、统计分析等技术,形成了数据挖掘方法和技术。一般,数据挖掘常用的技术与方法可以分为以下几个方面:

1)决策树方法

决策树方法是利用信息论的原理建立决策树,主要用于分类和预测。决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则比较直观,易于理解,实用效果好,影响较大,因而得到广泛应用。决策树最早的算法是Quinlan提出的ID3算法,最流行的是其改进版的C4.5算法。

2)聚类方法

聚类分析是直接分析样本,按照各样本数据间的距离远近将样本数据分成若干个不同的类。一般,同一类中的对象相似度很高,不同类中的对象相似度很差。聚类分析属于无监督的分类方法。

3)统计分析方法

统计分析方法是通过统计学中的技术方法实现数据库的数据分析,发现数据间的关系和规律。常用的方法有:回归分析、相关分析、主成分分析等。

4)关联规则

关联规则通过对给定数据集中的数据进行关联分析,描述一个事物中某些属性频繁同时出现的条件,发现隐藏在其中的有趣的联系或规律。一旦建立起数据项间的关联规则,则其中某一项的属性值就可以依据其他属性值进行预测。

5)可视化技术

可视化数据分析技术在传统图表功能基础上进行了拓展,为用户提供交互式的数据浏览,帮助用户更清楚地剖析数据。当所要识别的不规则事物是一系列图形而不是数字表格时,人的识别速度是最快的。

2 数据仓库与数据挖掘技术在客户关系管理中的应用

2.1 客户关系管理

客户关系管理(CRM)关注的是企业与客户之间实时、方便的信息交互,通过与客户多渠道的接触、交流和沟通,实现从“接触管理”到“客户关怀”的角色转变,企业的经营中心也从产品或市场转变为客户。客户关系管理最核心的任务是对企业运营过程中所得到的各种数据进行分析,进而为企业经营决策提供支持和依据。

从功能上来看,CRM系统可分为三种类型[5]:

1)操作型CRM

操作型CRM也称为流程型CRM,主要用于客户信息的自动集成过程,实现企业各部门对客户信息的协同合作。

2)分析型CRM

分析型CRM用于分析操作型CRM中产生的各种数据,使用数据仓库和数据挖掘技术产生商务智能,为企业决策提供支持。

3)合作型CRM

合作型CRM用于企业与客户的合作服务系统,包括电话、呼叫系统、电子邮件等,它能实现客户信息的全面收集。

2.2 数据仓库的形成

数据仓库是CRM的中央存储系统。在这个信息爆炸的时代,各个企业经过长期经营,收集了大量的客户数据。而这些海量、异构的数据被分散在不同部门,没有得到充分合理的利用。因此,首先要做的是对这些海量分散的数据进行清洗、集成和转换,建立一个整合的、标准化、结构化的数据模型,形成全面、一致和面向决策的数据,即数据仓库。对已形成的数据仓库,按照不同的主题,产生多个对应的数据处理模块,如普通客户数据模块,Vip客户数据模块,团体客户数据模块等,这种多数据模块的建设有利于分析不同客户的行为特点。

2.3 数据挖掘技术的应用

使用数据挖掘技术对企业客户信息进行分析,从而挖掘出对企业发展有价值的信息,如:新客户开发、交叉销售及预测、客户信用分析、客户细分、客户类别分析等客户关系管理功能,为企业决策者提供更有效的的决策支持,最大程度地发挥企业CRM的作用。

近年来,随着市场竞争的加剧,企业要想获得一个新客户,所花费的开销往往是争取留住老客户的几倍。有统计数据表明:

1)公司一般每年平均流失10%的老客户;

2)企业留住5%的老客户,利润提升100%;

3)开发新客户的成本是留住老客户成本的5-8倍;

4)一个公司如果将其客户流失率降低5%,其利润就可能增加25-85%。

因此保持老客户就显得更有价值。那么,如何才能预防、减少客户的流失呢?一个非常重要的工作就是要找出顾客流失的原因。我们可以通过数据挖掘技术实现这一目标。

现以电信公司判断用户离网的可能性来做分析,首先进行数据准备,抽取一定量的用户信息,提取的信息主要包括:用户号码、用户类型、用户状态、话费性质(长话/市话)、欠费情况、投诉次数等,利用这些数据,我们来建立判断用户离网可能性的模型。

在数据准备和适当的预处理之后,我们采用决策树中的C4.5算法建立决策树模型。这里,我们引入了信息论中的信息增益率的概念并以此作为属性选择的标准,其核心是在决策树的各级节点上选择属性时用信息增益率作为属性选择标准。通过计算这些属性的信息增益率,找出“投诉次数”属性作为决策树的根节点。扩展决策树节点,进行分枝,其他中间节点也是选择各节点检测属性增益最大的属性,同级的预选属性的增益相同时,规定选择属性值个数较少的属性作为当前节点的分枝,最后,我们可以生成一棵决策树。

生成的决策树还需要进行进一步验证,才能最终得到可用的分类模型。选择一些具有共同特征的已离网用户作为测试数据,输入属性值进行离网判断,检验模型的正确性,生成最终的决策树模型。

使用生成的决策树模型,对比用户的信息是否贴近离网用户的特征属性值,能大致预测出该用户的离网可能性,对离网可能性高的用户,根据其特征属性进行挽留工作,从而预防、减少客户的流失。

3 结束语

在当前的技术形式下,将数据仓库和数据挖掘技术有效运用在CRM中,对企业收集的大量客户数据信息进行分析,挖掘出对企业发展有价值的客户信息,从而更有效地提升企业的竞争能力,树立企业的品牌形象,帮助企业实现有效的市场营销和客户服务,达到成功挽留客户的目的。相信未来会有更多的行业加入使用客户关系管理的行列中,通过数据仓库和数据挖掘技术挖掘出对自身发展有用的信息,也必使的目标得到更好的实现。

参考文献

[1]白雪.数据挖掘技术在客户关系管理中的应用研究[J].大众科技,2012(2).

[2]Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.

[3]陈安.数据挖掘技术及应用[M].北京:科学出版社,2006.

[4]董宁.数据挖掘技术在CRM中的应用[J].计算机工程与设计,2007(6).

智能客户端本地数据加密方案 篇10

1.1 智能客户端的概念

智能客户端 (Smart Client) 是Microsoft在推出.NET战略过程中重点推广的一种新的网络应用软件结构, 结合了C/S和B/S结构的优点。既能像C/S结构一样提供丰富的用户体验, 又能像B/S结构一样方便地部署;既可以在线运行, 也可以离线运行。在Microsoft的大力推广下, 智能客户端技术引起了业界的广泛关注。一些评论员认为“智能客户端代表了一种新的软件开发模式”[1], 是“EPR技术创新的最佳切入点”[2]。

1.2 智能客户端的特点

根据Microsoft描述, 智能客户端具有利用本地资源 (Make use of local resources) 、利用网络资源 (Make use of network resources) 、支持偶尔连接的用户 (Support occasionally connected users) 、支持智能部署和更新 (Provide intelligent installation and update) 等特征。其中, 支持偶尔连接的用户是智能客户端最突出的一个特点。该特征使得用户可以在明确脱机、使用低带宽或高延迟网络、连接时断时续的情况下继续高效地工作。简言之, 智能客户端必须支持离线运行。

1.3 智能客户端架构

智能客户端本质上是一种分布式的应用程序, 运行时需要联机访问分布在Intranet或Internet上的资源, 同时还需要将业务逻辑和数据分发到各客户端上。

联机运行时, 智能客户端从服务端获取业务数据, 同时在本地缓存一个数据副本。当网络无法接通时, 直接读取本地缓存的数据, 执行业务操作后, 标记更改的数据, 待网络接通后再提交到数据库进行更新。

2 智能客户端本地数据安全需求分析

如前所述, 为了支持脱机运行及提高运行速度, 智能客户端需要将一部分业务逻辑和数据缓存到本地, 由此也引发了一系列的安全问题。确保这部分数据的安全, 也是构建安全智能客户端的关键。下面简要分析本地数据的安全需求。

(1) 机密性。机密性是指缓存的数据不能泄露给非授权的用户或实体。机密性一般可以通过访问控制或加密来实现。在智能客户端解决方案中, 因为数据是缓存在本地的, 入侵者可以很容易的绕过应用系统的访问控制机制而直接获取数据副本。因此, 机密性主要依靠加密来实现。另外, 加密结果直接存储在客户端, 还应防范攻击者获取副本后实施暴力破解。

(2) 完整性。完整性是指缓存的数据不能被非授权用户任意修改, 尤其是商业数据, 对一些关键数据的非法篡改可能导致不可估量的损失。完整性一般通过数字签名来实现。

(3) 可用性。可用性需要保证数据在需要服务的时候, 随时可用的特性, 实现可用性涉及网络、系统、应用程序、用户等多方面的要素。

在上述几个安全需求中, 机密性是首要需求, 是智能客户端的第一条安全防线。下面简要分析实现机密性的解决方案。

3 解决方案

3.1 对称加密

加密方法主要有对称加密和非对称加密两种类型。因为非对称加密速度慢, 不适合加密大量数据, 通常只用来加密密钥或用户口令。因此, 加密智能客户端本地数据, 主要使用对称加密方法。在具体算法上, 可以选择DES、Triple DES、RC2、Rijndael等。采用对称加密方案, 其优点是加解密速度快, 缺点是需要自行管理密钥。整个方案的保密性完全取决于密钥安全与否, 一旦密钥泄露, 整个安全体系都将受到威胁。其次, 对称加密方案不能有效防范离线暴力破解。

3.2 DPAPI加密

DPAPI (Data Protection API) 是Windows操作系统提供的一组用来对内存中字节数组以及存入磁盘中的字节数组进行保护的API。不需额外管理密钥, DPAPI会使用用户或计算机凭据来加密数据。如果加密时与当前Windows账户进行了关联, 则其他Windows账户无法解密数据;如果加密时与计算机进行了关联, 则该计算机上的所有Windows账户都可以解密数据。但无论采用何种方式, 解密只能在实施加密的计算机上进行。即使攻击者获得了加密数据副本, 也很难实施离线暴力破解。其次, 如果在加密过程中将用户口令作为附加数据参与运算, 则解密时还需要输入正确的用户口令。因此, DPAPI加密方案相当于提供了Windows、应用程序两个级别的双重保护。

DPAPI加密方案同样具有加解密速度快的优点, 最重要的是不需要管理密钥, 可以让开发人员专注于业务逻辑的实现;同时, 因为加密、解密必须在同一台计算机上完成, 可以较好地防范离线暴力破解。

3.3 DPAPI加密方法

DPAPI提供了两种加密机制, 一种是加密内存流 (由Protected Memory实现) , 二是加密硬盘数据 (由Protected Data实现) 。加密智能客户端本地数据主要使用Protected Data类。

Protected Data类提供了Protect () 、Un Protect () 两个方法用于加密和解密。函数声明如下:

//加密数据

Protect (byte[]user Data, byte[]optional Entropy, Data Protection Scope scope) ;

//解密数据

Unprotect (byte[]encrypted Data, byte[]optional Entropy, Data Protection Scope scope) ;

其中, 参数optional Entropy是一个附加的字节数组, 用来加密数据, 解密时必须提供相同的字节数组。参数scope用来指定数据保护范围, 取值Current User时加密与计算机及当前Windows用户关联, 取值Local Machine时仅与计算机关联。

4 DPAPI加密实例

某物流管理平台, 为了提高工作效率, 采用智能客户端解决方案, 在脱机状态下也能完成日常办公业务, 联网后再提交到服务器更新。

4.1 执行流程

系统运行后, 首先检测网络状况, 如果联网则对用户执行联机身份验证, 通过后从服务端获取必须的数据, 序列化后使用DPAPI加密, 结果保存在客户端程序目录下;如果脱机则对用户执行脱机身份验证, 通过后从客户端本地读取加密的数据, 使用DPAPI解密后呈现数据, 用户可执行相关的业务数据。

4.2 加密函数

函数Protect (byte[]plain Bytes, string file Path, string user Pwd) 实现加密, 参数plain Bytes为待加密的字节数组, file Path指定用于保存加密结果的文件路径, user Pwd传递用户口令, 该值转换为字节数组后将参与加密, 这样只有加密者才能解密数据。

protected void Protect (byte[]plain Bytes, string file Path, string user Pwd)

{byte[]optional Entropy=Encoding.UTF8.Get Bytes (user Pwd) ;

byte[]cipher Bytes=Protected Data.Protect (plain Bytes, optional Entropy, Data Protection Scope.Local Machine) ;

File Stream fs=new File Stream (file Path, File Mode.Create, File Access.Write) ;

fs.Write (cipher Bytes, 0, cipher Bytes.Length) ;

fs.Close () ;

}

4.3 解密函数

函数Un Protect (byte[]plain Bytes, string file Path, string user Pwd) 实现解密, 参数与加密函数Protect () 的参数相同, 只是plain Bytes用于存储解密后的结果。另外, user Pwd传递的用户口令必须与加密时所用的口令完全一致, 否则无法解密。

4.4 加密结果

以货源信息审核模块为例, 数据加密的结果如下图2所示。

DPAPI加密结果为二进制文件, 加密密钥由Windows操作系统管理, 解密需要在同一台计算机上实施。由于使用了用户口令作为附加数组参与加密, 解密时还需要输入用户口令。

参考文献

[1]智能客户端开发人员中心.智能客户端定义[DB/OL].http://msdn.microsoft.com/zh-cn/smartclient/bb313755.aspx, 2009

[2]Matthew MacDonald, Erik Johansson.C#数据安全手册[M].崔伟, 毛尧飞, 译.北京:清华大学出版社, 2003

客户数据 篇11

关键词:数据挖掘;聚类分析;决策树分析;客户保有

引言

现今,数据挖掘技术已经被广泛应用于实际的商业决策,解决如何在企业减少投资的同时提高资金回报问题。在美国,制造业、零售业、通讯业、金融业、保险业以及医疗服务等都已经较为成熟地掌握了数据挖掘技术,应用时间较长。在国内,随着市场经济的发展,数据挖掘也逐渐有了自己的市场,尤其是在电信业。近两年,电信业的经营观念已逐步从“以产品为中心”转变为“以客户为中心”,为此,了解现有客户的行为,分析客户的需求是非常重要的。通过数据挖掘技术,从电信公司大量的历史数据中挖掘分析客户消费的行为特征,并在市场预测的基础上制定有针对性的市场营销计划等,是电信服务业实现以客户为中心的服务目标的重要手段。

1数据挖掘技术

数据挖掘,又称为数据库中的知识发现,是一种从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的信息和知识的过程,其目的是从大量数据中寻找有用的信息。目前,数据挖掘技术有聚类、决策树、关联规则、神经网络、支持向量机等方法,它们通过机器学习的途径获取信息,以用于决策支持、预测、估计等领域。不同的数据挖掘方法具有不同的应用范围。在电信行业中,客户细分一般可用聚类方法,而针对客户流失预测及客户保有问题,采用决策树方法,相对来说,其结构和推理的过程更清楚。

1.1聚类分析

聚类是数据挖掘领域最为常见的技术之一,它将不同个体按相似度大小相近的原则聚集成类。相似度是根据描述对象的属性来计算的。距离是经常采用的度量方式。通过聚类过程形成的每一个组成为一个类。通过聚类,数据库中的记录可被划分为一系列有意义的子集,我们可以借此分析较大的、复杂的,连续有许多变量的数据库。应用在市场研究领域,聚类分析是市场细分、寻找不同目标市场及其人员特征的非常简单而又非常有效的方法。

主要的聚类方法大体上可以分为:划分方法、层次方法、基于密度的方法、基于网格的方法以及基于模型的方法等。K-均值算法是比较常用的算法,为经典的划分方法。算法描述如下:

算法1:k-均值聚类算法

输入:类的数目k和n个对象

输出:被标记聚类类别的n个体

方法:

(1)任意选择k个对象作为初始的类中心;

(2)根据类中对象的平均值,按相似性大小给每个对象(重新)赋予类标记;

(3)更新类的平均值以及类中心;

(4)若类中心不再发生变化,则输出,结束;否则转(2)。

1.2决策树分析

决策树是目前最常用的分类技术之一,它是类似于流程图的树结构,其中,每个内部结点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶结点代表类或类分布。决策树算法的核心思想是贪心算法,它以自顶向下递归的划分一控制方式构造决策树,即从树的根结点处的所有训练样本开始,选取一个属性来区分这些样本,该属性的每一个值产生一个分支,然后将此思路递归地应用于每个子结点上,直到结点的所有样本都区分到某个类中。

各种决策树算法之间的主要区别就是如何选择属性进行划分,以经典的决策树算法C4.5为例,它选择具有最高信息增益的属性作为待划分的属性:

设T是有t个数据样本的集合,假设有k个不同类,设T中的c类包含t个样本,任意一个样本属于类c的可能性为t/t。

设属性V具有互不重合的n个值,可以用属性V将T划分为n个子集,这里Ti中的所有实例的取值均为v。如果v选作测试属性(即最好的划分属性),则这些子集对应于由包含集合T的结点生长出来的分枝。设ti是子集Ti中c类的样本数。根据v划分的子集的熵或期望信息。

其中几项充当第一个子集的权重,且等于子集(即V值为vi中的样本个数除以T中的样本总数。熵值越小,子集划分的纯度越高。

将属性v作为划分属性所获得的信息增益。

根据此公式计算每个属性的信息增益,算法C4.5将具有最高信息增益的属性选作给定集合的测试属性,创建一个结点,并根据属性的每个值创建分枝。

2在电信行业客户保有中的应用

客户流失是电信行业普遍面临的问题,尤其是在市场饱和期,竞争异常激烈,客户具有更多的选择,争夺新客户入网的成本已经远远高于挽留现有客户的成本,从实际的业务角度来看,如何保有自己的客户,如何展开客户挽留的行动的问题已经迫在眉睫。

通过数据挖掘技术在大量的历史数据中进行挖掘分析:利用聚类分析技术进行客户细分,挖掘不同客户群的业务特征;利用决策树技术进行客户流失倾向预测,可以针对流失倾向较高的群体,并结合这些客户对应的客户群特征,采取有针对性的客户挽留策略。

2.1客户细分

细分是指将一个大的客户群体划分成一个个细分群,同属一个细分群的客户彼此相似,而隶属于不同细分群的客户则有不同的典型特征。客户细分主要涉及的数据挖掘技术为聚类分析。通过客户细分,能深刻理解不同客户群的典型特征,从而对客户总体构成有更准确的认识,对客户的服务和营销更具针对性。

在客户属性中,总费用是一个能反映出客户级别的属性,月总费用越高的客户等级越高,是应该特别珍惜的资源。但并不是等级低的客户就不值得关注了,相反,月总费用低的客户更有升高等级的潜力,同样值得关注。

运用马克威软件,对月总费用这一属性进行聚类,采用的是K-Means快速聚类法。对聚出的类(共9类)进行统计分析,结果发现,有的类包含客户太少,如1个,2个等。对这些类进行合并,不妨将这一个大类(原先标识分别为1、2、3、4)的标识设为0。再对此时形成的6个类进行统计分析,得出表1。可以清楚地看出92.33%的客户月总费用集中在88.62元左右。

2.2客户流失预测

通过数据挖掘建立流失预测模型,分析客户流失倾向即可在客户流失之前做出预警并给出量化指标衡量该客户流失可能性的大小。业务人员也可以根据每个客户的流失可能性对客户从高到低排序,找出流失倾向较高的群体,并结合这些客户对应的分群特征,采取相应的客户挽留策略,以进行更加精细的客户保有工作,提高客户挽留的成功率。

首先通过相关性分析,可以找出每一个客户属性与客户行为和客户流失概率之间的相关性。通过比较选择,删除那些和客户流失概率相关性不大的变量,可以减小模型的复杂程度,使建立的模型更加精确。其次在模型建立以后,需要用大量的数据对

建立的模型进行修正和检验。—个未经检验的模型如果被贸然推广使用,就有可能由于模型的不精确给应用项目带来损失。故在建模时通常会把数据分为两部分:训练集和测试集,训练集用于建模,而测试集用于验证模型,以避免模型出现“过拟合”的情况。

利用马克威分析系统,先采用每隔10条记录取一条的系统抽样法从248796例客户的大样本中抽出2488例客户作为样本,运用数据挖掘技术中的决策树方法对样本进行挖掘,以应收费用、欠费金额、在网时长作为输入变量,客户流失作为目标变量(其中0表示未流失,1表示流失),挖掘结果如图1所示。

从此决策树可以清楚地看出:如果应收费用在[-5.51,259.72]范围内,并且欠费金额在[-0.01,21.12]范围内,则客户流失的可信度为79.92%。在大样本下,通过以上记录条件进行选择得到:应收费用在[-5.51,259.72]范围内的客户有2488例,其中欠费金额在[-0.01,21.12]范围内有1803例,而在这1803例客户中有1424例流失,即有78.98%(=1424/1803)的客户流失,与用决策树方法得出的可信度之间的误差为0.94%。可见用训练集所建的预测模型能很好地对测试集进行预测,并且可以清楚地看出哪些客户容易流失。当然,为了能将模型应用到洞察力营销当中,还需要业务专家、市场营销人员等的参与,从业务上指导变量的筛选。

2.3客户保有策略

选择合适的目标客户群、确定有针对性的保有策略,是确保整个客户保有营销活动成功的关键所在。基于洞察力营销的客户保有是一个应用数据挖掘技术帮助企业构建更个性化并有更高利润的市场营销活动的过程。洞察力营销是一个闭环的自我学习过程(如图2所示)。

通过将客户细分模型与客户流失预测模型紧密结合,既能洞察各客户的业务特征,又能获取客户的流失倾向,便于市场营销部门选取流失倾向较高的客户采取针对性的保有策略,比如:针对流失倾向较高的近郊密切型客户:推荐本地亲情连线套餐,例如20元包打40元区间电话;针对流失倾向较高的传统长途型客户:传统转IP,释放风险,先推荐17909电信直拨,然后再推荐国内长途亲情连线;针对流失倾向较高的异商IP型客户:进行IP反争夺,推荐电信IP包月或保底套餐、分段折扣电信lP预付费卡;针对流失倾向较高的本地商务型(多与移动、联通用户通话)客户:要派客户经理直接上门挽留,推荐包月或保底套餐、预存话费送小灵通、小灵通彩铃免费送等。

3结束语

客户数据 篇12

《测试数据的不安全性:无法预见的危机》报告显示,62%被调查公司在开发过程中使用真实客户数据,而不是虚拟数据进行测试应用。上述公司中,89%使用客户文档,74%使用客户名单。这些经常被采用的真实数据包括员工记录、供应商记录、客户帐号、信用卡号码、社会保障号和其他借贷或偿还信息。由于测试在非生产环境下进行,这些企业或许认为测试数据不会有隐私泄漏的危险,而实际上这些环境比起生产环境,其安全性更低。测试数据可能暴露给包括内部测试人员、顾问、合作伙伴和境外人员等各种未经授权的人员。事实上,5 2%的公司将他们的应用测试外包,49%的公司将真实数据透露给了外包公司。

《测试数据的不安全性:无法预见的危机》报告显示,采用真实客户数据做测试的公司,有一半没有采取措施保护相关信息。其他重要发现还包括:

50%的接受调查机构不清楚数据是否在测试中被泄漏;

41%的接受调查机构表示他们不保护用于软件开发的真实数据;

38%的接受调查机构不确定他们用于测试或开发的真实数据是否已丢失或被盗;

26%的公司不知道应该由谁负责保护测试数据,并指出敏感数据没有明确的拥有权。

为此,数据泄漏的案例时有发生,在一家国际制药公司中,有一位员工未经批准在公司的笔记本电脑上安装了文件共享软件,泄漏了约1.7万名前员工和现员工的个人数据;一位编程顾问试图出售一家保险公司11.2万多个客户的数据,其中包括个人信用信息、社会保险号码、出生日期;一个重要政府机构最近发生了数据泄漏,影响到约2.8万名工作人员及其家庭成员等等,这些都引起了业内人士的警醒。

康普科纬迅公司产品解决方案高级副总裁John Wliiiams表示:“很少有人意识到在开发和应用测试中的风险有多大。所有商业机构都有义务保护客户数据的隐私。为消除测试数据安全性风险,越来越多的客户使用我们的Test Data Privacy解决方案,为他们创建安全有效的测试数据,提供一个自动、可重复的方法。

康普科纬迅公司成立于1973年,为全球领先IT企业。一直致力于为客户提供更专业、更快捷的服务方案,协助企业的IT业务,为企业带来最大的IT效益。Compuware解决方案加快关键业务系统的开发、改善质量和提升效能,增加效率、控制成本和提高员工生产力。

如今,许多企业纷纷采取措施,加强对生产数据的保护,同时,加强测试期间对数据的保护同样十分重要,Compuware的数据保密解决方案独特而且全面。该解决方案拥有特殊的流程、技术以及专业技术,可确保对开发生命周期中所有阶段的数据进行保密。通常,为确保测试的质量。企业必须使用有效的数据,利用各种表格、文件体现数据之间不同的工作关系。鉴于生产数据中已对有效数据和关系进行定义,测试数据通常在生产环境中创建。

在测试期间保护生产数据意味着,在维持完整性、一致性和可用性的同时,对数据进行保护。要实现这种保护,需要一个数据保护工作台,以对测试数据进行转换、老化、加密和验证。

使用数据伪装,保护敏感数据

保护生产数据并非一次即可完成。企业必须将数据保护的任务作为日常测试流程的一部份,并加入至流程中。通过在线或应用程序接口(API),数据伪装有助于在测试任务流中,自动采用最佳实践方法对数据进行保护。这为IT人员提供了一致的保护程序,同时无需再开发自定义程序。

精确、有效的测试需要提取的数据,可能包含在各种格式中,如DB2表格、Oracle表格、SQL服务器表格、维持数据之间的关系对测试的质量至关重要。为确保对数据的保护,可以对数据进行字段级别的伪装。伪装规则和标准可以很容易地采用在各种机关中,并被重复使用,从而使流程变得可重复。

如果需要编造的可读数值代替真正的数值,转换是非常有效的方法。通过转换对名称进行替换,测试人员获得的是有效数据,而不是使用业界标准加密进行数据保护得到无用信息。同样,如果客户需要维持字段组合,如城市、省份、国家的邮政编码等之间的完整性,同时保护个人地址,通过转换替换掉门牌号和街道名称,则可以保留有效组合的完整性。

几乎所有行业都会在测试中捕捉、存储和使用出生日期。需要保持出生年份完整性的日期数据,如果对其进行保护,则必须具有老化处理功能,以便根据业务需求对日期进行时老化处理。例如,在医疗和保险行业,个人的出生年份对测试非常重要,因为这些日期对于所覆盖的范围和定价等应用程序测试至关重要。通过设定选择标准,仅对出生月份和日期进行老化处理,则可以维护出生年份的完整性,同时降低个别出生日期的敏感性。

加密可以保护与其他数据字段有关联的数字字段,而无需嵌入智能程序。使用加密程序对数值进行替换,替换出来的数据是唯一一致的,而且有确实的意义。采用密匙加密的安全性更高,因此只有选定的个别人才能对重要的字段进行加密或解密。

为独特的测试值生成新的数据

与其使用现有生产数据信息进行测试,倒不如创建新的、编造的数据更为简便和安全,无论是凭空捏造还是来自于其他地方。数据生成可为发票、订单号等项创建新的、唯一的测试值。可规定范围,在该范围内生成数据值,创建现实、有效的测试环境。

通过久经考验、最佳实践的方法,Compuware提供这些流程、技术,使无论是分布式、或混合环境中的数据保密项目能够获得成功。Compuware产品有助于定义和创建可重复的流程,使生产执行实现自动化,并提供验证保密规范的报告和必要的审核证明。此外,Compuware还拥有管理该流程的知识和经验。

上一篇:锚钉系统下一篇:独立分量分析及应用