大数据产品竞品分析

2024-06-23

大数据产品竞品分析（通用12篇）

大数据产品竞品分析篇1

互联网教育大数据分析领域竞争产品分析报告

中国的教育永远没有解决学生如何独立思考、自由精神和人格平等的问题，永远没有让学生提出疑问、不找标准答案，没有解决如何锻炼他们的创造能力的问题。——俞敏洪

【中国互联网教育整体趋势】

纵观中国教育互联网产业，截止到2015年11月31日，通过数据显示，记录在案的互联网教育公司共有1487家，在整体互联网企业中占比约7%，比例在其他诸行业中较为靠前。在细分方向上，在线教育创业的四大龙头分别K12、儿童早教、职业教育、语言学习，它们总共囊括65%互联网教育市场份额。这个行业的创业在产品模式和参与者背景上都出现了一些新变化，家教O2O在创业项目中变着越来越频繁。数据显示教育+O2O项目中，有超过60%的产品都2014年之后才成立的，而且在2015年的上半年又一波较为集中的获投热潮。越来越多传统教育的从业者甚至是传统教育机构的创办者，也出现在了互联网教育的创业市场中，比较典型的有疯狂老师、轻轻家教、跟谁学等。其中很多公司都获得了投融资的支持：

对于互联网教育，BAT在2015年都有不同程度的加码布局。百度在今年上半年最主要的动作，是在今年6月时拆分旗下的作业帮，成立独立新公司——小船出海教育科技（北京）有限公司，并且在9月时引入红杉和君联资本的投资。这是百度对自身业务的又一次“精兵简政”，也是百度“航母计划”的试水和实践，有助于进一步提升和完善百度在O2O和K12教育上的市场布局。阿里巴巴在今年5月份把淘宝同学升级为淘宝教育，并表示将展开更多与线下教育机构的合作，帮助优质的线下机构向线上机构转型。而在就在刚刚过去的一周，阿里还推出了在线直播客产品，并针对农村等教育资源匮乏地区，联合第三方服务商筹备建立云识别技术平台，打造K12在线教育内容库，建设乡村的云端课堂。腾讯在今年除了进一步发展自身的腾讯课堂业务之外，也对在线教育的创业公司（疯狂老师和易题库）进行了金额不低的投资，从家教O2O和K12智能题库两个细分领域进行布局。

【中国互联网教育“教育大数据分析”行业趋势】

在通过对中国互联网教育的整体趋势分析中，我们可看出在线教育创业的四大龙头分别为K12、儿童早教、职业教育、语言学习，而在我们将“教育大数据分析”应用深入的12K教育当中，真正涉及到“大数据分析”的公司确是屈指可数。

“中国教育大数据研究院”2015年9月19日成立。我国已有不少学校和机构开始了数据挖掘的探索，但仍处于实验阶段，并且多数只应用于本校学生不对外互联。

另外，通过对互联网产品知名门户网站“36氪”、“虎嗅”、“人人都是产品经理”“品图网”等的搜索发现，现国内知名度较大的一家互联网教育企业“深圳远景同程”，拥有 “阅卷易” 与 “码上学” 两大在线教育平台，功能包括：

1)“阅卷易”，主要服务于一线的初中教师，为其提供智能组卷、联考和混考阅卷、作业布置、统计分析等服务； 2)“码上学”，App 是与 “阅卷易” 相配合的初中学生客户端，拥有测练诊断报告、个性化分层作业、智能错题本、同城名校名卷、巩固练习等功能。

这两个平台的主要作用是为教师减轻教学负担、收集数据进行教学参考；为学生和家长提供常态化、贯穿学业全过程的考试和练习评价系统，提供符合学生实际能力的个性化学习方案。

除“深圳远景同程”外，更多的互联网教育公司并没有涉足“教育大数据分析”行列，当然也不排除仍有很多处在理论实践阶段中的小型创业公司。所以，目前看来“教育大数据分析”拥有巨大的市场空间，而我们也具备了厚积薄发的能力。

【我们在“教育大数据分析”中的行业优势】

在“教育大数据分析”工作中，我们已积累了多年的实践经验

1)核心技术已攻克并在实践中得以验证。

2)对教育理念深刻理解，熟识整个教学、教务流程。

3)初步建立了科学的，得到教育权威机构认同的评测数学模型。4)稳定团结，精干的研发团队。

【总结】中国互联网教育中针对12K教育的产品主要集中在在线教育、多媒体教学等。而这样的“互联网+教育”模式，并不能从根本上解决教学中的痛点。在所有的教育公司中，我觉得都犯了一个比较严重的错误，忘了一个核心点，也就是学习本身这件事情，永远是一个苦差事，它不是一件好玩的事情。老师、家长和学生心目中大部分人考虑的，不是线上还是线下，也不是时尚还是不时尚，他们考虑的是，无论线上线下，最终的学习要求到底有没有达到。“教育大数据分析”将致力于运用科学的手段减轻老师教学负担，减轻学生课业负担。让学生在学习成绩逐步提升的过程中能够轻松学、愉快学。

大数据产品竞品分析篇2

越来越多的企业认识到数据分析能够带给企业业务的价值。中桥的多选项调查结果显示 (图1) , 企业认为大数据分析能够带来的主要业务价值依次是:提高生产过程的资源利用率, 降低生产成本;根据商业分析提高商业智能的准确率, 降低传统“凭感觉”做决策的业务风险;动态价格优化利润和增长;获取优质客户。这表明大数据已经对企业的成本、业务决策、利润有着直接的影响。中桥的另外一组调研数据显示, 目前越来越多的企业级用户考虑从批量分析 (大数据创造价值的第一阶段) 向近实时分析 (第二阶段) 发展, 从而提高IT创造价值的能力。同时, 数据分析在快速从商业智能向用户智能发展。中国市场正逐步从大数据降低成本向大数据加速业务增长、提高利润以及突破创新发展。

中桥调查显示, 目前中国用户主要是通过数据分析来提高整个企业的运营效率, 降低运营成本。从图2对数据类型的调查结果来看, 目前, 中国企业的数据分析还是以结构化数据为主, 如数据库或事务性数据。此外办公文件、计算机/网络日志文件、文本/信息等也是企业数据增长的主要来源, 同时也是能够攫取出价值的数据类型。

而就导致大数据问题的数据来源调查显示 (图3) , 毫无疑问, 数据库首当其冲, 是企业大数据的主要来源;而半结构化和非结构化数据如软件和网络日志、感应数据、社群等也已经纳入企业数据分析的主要范畴, 这表明企业已经意识到这些数据对于业务的重要性, 这也是实现从 (大) 数据分析第一阶段到大数据分析第二阶段的必要条件。也成为未来24个月用户通过IT创造价值的IT投资重点。

中国市场大数据分析方法

在了解了企业大数据的来源和种类之后, 如何采取有效方式对这些数据进行分析, 从而最大程度攫取数据价值, 转化为最明智的商业决策以利于企业业务运营, 是企业对大数据进行分析的目的所在。从目前中国大数据分析的分析方法来看 (图4) , 有33.8%的企业选择针对具体工作负载来调整通用数据库;22.0%的受访企业选择数据分析云计算服务 (如软件即服务和/或基础设施即服务) ;还有20.7%的企业选择自定义开发的解决方案。仅4.8%的用户使用了并行处理 (MPP) 分析数据库, 3.3%使用了对称处理 (SMP) 分析数据库。这一结果表明, 大多数的中国企业仍处于数据分析的第一阶段。而且, 目前中国用户大多采用通用数据库、云计算或自定义开发的解决方案和数据库工具作为大数据分析方法, 而没有选择去购买数据分析的软件。

如何写竞品分析报告篇3

竞品分析是对所研发产品的同类型产品进行分析讨论，并给出类比归纳的分析结果，用以了解现有产品的相关信息，从而借鉴于研发产品中。特别是当具体到进行产品交互界面、视觉表现方面的分析的时候。应该有如下这样的步骤：（1）设定分析目标——竞争对手/同类产品；

（2）将同类功能模块或交互、外观细节编组作表；（3）根据比较结果作进一步分析。

竞品分析的框架

主要有三部分内容：竞品、分析维度和分析准则。1）竞品选择：

我们可以选择较为优秀的产品进行分析，而不需要贪大求全选择所有的竞品。2）分析维度：

通常我们进行竞品分析，可能会从以下几个维度进行对比分析：战略定位、盈利模式、用户群体、产品功能、产品界面（交互方式、视觉表现）等。竞品分析是每一个互联网从业人员都需要做的一项基本工作。不同的职能区分，侧重点会不一样。如运营人员可能更加侧重产品的战略定位、盈利模式、推广方式，产品策划人员更侧重于产品定位、目标用户、产品功能。交互设计师更侧重于产品界面、具体的交互形式。当然这些维度是有机联系的，断然不可以孤立对待。3）分析准则：

拿交互设计的竞品分析来说，我们需要参照“可用性准则”来进行分析，可用性准则有很多不同版本，当前较为常用的10项可用性准则为：1，一致性和标准性；2，通过有效的反馈信息提供显著的系统状态；3，方便快捷的使用；4，预防出错；5，协助用户认识，分析和改正错误；6，识别而不是回忆；7，符合用户的真实世界；8，用户自由控制权；9，美观，精简的设计；10，帮助和说明。

竞品分析的内容

包含两部分：竞品各个维度下的特性罗列以及分析评价。1）特性罗列：

以产品功能维度而言，我们需要将竞品A具体哪些功能、竞品B具有哪些功能一一呈现。这一部分是竞品分析的基础，或者称之为分析评价的对象。2）分析评价：

以交互设计的竞品分析为例，依照一定的可用性评价指标，对界面布局、交互方式、动画效果等进行分析评价。

通常孤立地从操作体验上很难评判哪种交互方式更好，因为还涉及到一些产品层面的考虑。故我们可以单另交代交互设计师所建议的处理方式，并说明理由。这一点对于竞品分析而言也至关重要。

竞品分析的阶段

竞品分析的4个阶段：

1）用户研究阶段。将竞品分析作为即将形成的用户需求文档（如人物角色)的参考。

2）概念模型或内容模型阶段。基于竞品分析构架模型，这个阶段的竞品分析倾向于功能分析、逻辑框架。

3）设计阶段（即高保真原型图、设计效果图）。竞品分析针对非常具体的设计问题，将其当作设计的源泉，并以此作为设计的依据。

4）可用性测试。主要是针对某一具体功能、问题做深入的对比，以此作为可用性测试结果的佐证。

在产品研发之初进行详尽的竞品分析，并形成竞品分析文档。深入的竞品分析文档可以作为产品组各职能成员沟通的基础，让大家在产品认识上达成更广泛的共识，更加有利于产品研发。

2014款卡罗拉竞品试题篇4

1、（2012年7月19日）东风日产推出第三代轩逸，2013年轩逸销量达到259500辆，是卡罗拉的强劲对手之一。

2、轩逸的主力车型为1.6CVT舒适版12.9万，以及1.6CVT豪华版13.5万，主要优势为（）

3、新卡罗拉的油耗表现优异，1.8L手波百公里综合油耗为6.5L,同等排量轩逸为（6.9L），新卡罗拉1.8LCVT百公里综合油耗为6.1L，而轩逸为（6.7L）

4、卡罗拉和轩逸轴距同为2700MM,但卡罗拉的后排空间达到706MM,而轩逸为（），而轩逸后排中央突起达到100MM，严重影响了中间乘客的乘坐舒适性。

5、朗逸是上海大众自主设计研发的一款车型，现款上市时间为（），2013年总销量达到374100辆。

6、朗逸的主力车型为1.6L自动风尚版12.49万，以及1.6自动舒适版13.79万，主要优势为（）

7、轩逸长宽高分别为4605x1765x1460MM,而轴距为（2700mm）

8、很多客户觉得大众操控性都好，但朗逸的表现却值得推敲。其功率1.6L为（81kw),1.4T为（96kw）而卡罗拉1.6L和1.8L则分别达到90KW和103KW。

9、卡罗拉的后排空间达到706MM,而朗逸为（）

10、相比之下，朗逸的不足主要表现在（）

11、一汽大众将速腾包装成一款具有“B级车品质”的A级车，现款上市时间为（），2013年总销量达到271200辆。

12、速腾的主力车型为1.6自动时尚版14.38万，以及1.6自动舒适版15.08万，主要优势为（）

13、速腾长宽高分别为4644x1778x1482MM,而轴距为（2651mm）

大数据安全分析篇5

当前, 绝大多数的安全分析技术都是针对小数据量设计的, 在面对海量数据时难以发挥作用, 这就导致了新的攻击手段出现后, 现有的安全分析技术难以在短时间内进行检测和追溯。攻击方总是想方设法去突破原有的攻击思路, 创新攻击技术和手段, 从而达到攻陷对手的目的。而防守方面对变化莫测、创新不断的攻击, 很难找到统一的、行之有效的方案来主动应对攻击, 更多的时候只能被动挨打。安全数据的大数据化、以及传统安全分析技术所面临的挑战和发展趋势, 都预示着大数据分析将成为解决企业信息安全问题的重要手段。

当前, 业界已经出现了将大数据分析技术应用于企业信息安全的技术——大数据安全分析 (Big Data Security Analysis, 简称BDSA) 。借助大数据安全分析技术, 企业能够更好地解决海量安全数据的采集、存储和分析问题, 借助基于大数据分析技术的机器学习和数据挖掘算法, 能够更加智能地洞悉信息与网络安全的态势, 更加主动、弹性地去应对新型复杂的威胁和未知多变的风险;能够及时发现企业内网中已经发生或正在发生的未知威胁, 对威胁进行快速的回溯和定性, 轻松分辨出APT攻击和普通网络攻击, 洞察未知威胁, 为企业提供持续有效的安全支持。

展望未来, 大数据安全分析将会全面应用于APT攻击检测、0day恶意代码分析、网络取证分析、网络异常流量检测、大规模用户行为分析、安全情报分析、信誉服务、代码安全分析等多个网络安全领域, 特别是对传统的SOC (Security Operations Center, 安全运营中心) 平台将会产生颠覆性的影响。

SOC平台是指以资产为核心、以安全事件管理为关键流程, 采用安全域划分的思想, 建立一套实时资产风险模型, 协助管理员进行事件分析、风险分析、预警管理和应急响应处理的集中安全管理系统。安全管理平台的核心之一便是安全信息与事件管理, 也称作SIEM (Security Information and Event Management) 系统。通常, SIEM为来自企业和组织中所有IT资源 (包括网络、系统和应用) 产生的安全信息 (包括日志、告警等) 进行统一的实时监控、历史分析, 对来自外部的入侵和内部的违规、误操作行为进行监控、审计分析、调查取证、出具各种报表报告, 实现IT资源合规性管理的目标, 同时提升企业和组织的安全运营、威胁管理和应急响应能力。一般的SIEM系统都具有安全事件的采集、范化、存储、分析、展示等几个过程, 而这与大数据分析的收集、存储、分析和可视化过程是完全相同的, 因此, SIEM天然具有应用大数据分析技术的特质。

大数据产业中心升级分析篇6

转型升级的意见

以大数据为代表的新一代信息技术是新科技和产业革命的重要引擎。为加快培育中关村大数据产业集群，充分发挥大数据在工业化与信息化深度融合中的关键作用，推动中关村国家自主创新示范区（以下简称中关村示范区）产业转型升级，根据《中关村国家自主创新示范区战略性新兴产业集群创新引领工程（2013—2015年）》，制定本意见。

一、加快培育中关村大数据产业集群

关于温州矮凳桥灯具市场竞品情况篇7

1.市场描述：

矮凳桥东方灯具市场是全国最早的灯具市场，有约100家商户入驻，涉足商业照明领域品牌有：国际品牌：飞利浦，欧司朗。国内一线品牌：雷士，欧普，三雄，二线：扬业，阳光，企一，佛山照明，TCL，雷蒙等。低端的有：星辉星运，本帮华强，名派照明，领航以及广东过来其他小品牌。历经多年的发展，品牌数量的增加，现在市场已经逐步形成每个商户都有自己的主打品牌，并且朝着专卖，专营的方向发展，保护自己的利益最大化。

2.产品对比：

扬业现代办公照明：主要竞争品牌有雄宇办公照明，这个品牌对于矮凳桥市场来说也是在撤退了，仅仅依靠现代办公照明，这个市场是比较难生存的，温州这个区域市场总体的需求决定的。

格栅灯盘：高端的欧司朗，飞利浦，价格比我们扬业要贵一倍多，主要做一些高端的项目工程。雷士，阳光，TCL工程照明，佛山照明。价位相对适中，品质要求比较高，品牌要求不是非常高的工程项目，像佛山照明品牌生存比较久，市场渠道知名度比较响也是作为市场调货产品来销售。

T8，T5支架：佛山照明，阳光，三雄，飞利浦。这个系列产品，我们主要对手在于佛山照明和阳光。我们的品牌定位和他们在同一个层次，对于工程项目来说，我们产品可以比较容易的去替代他们的产品。

筒灯，射灯：企一，雷士，TCL，雷蒙。他们都是有专卖店，专业的展示。都是有工程人员做推广，像企一，雷士市场内店面形象，户外广告做的比较有优势。这一块我们可以向下压，朝着我们下面的品牌走。用这些产品的单位（使用者）追求的不是简单的照明，而是效果，我认为他们在层次，价格上可以有所提高。可以走一些灯具产品做的比较杂的商户，建立起相应的展示，条幅，提高见面率提高品牌效应从而达成销售。

扬业照明

大数据产品竞品分析篇8

作为最早提出“大数据时代到来”的企业, 麦肯锡公司曾指出:“大数据已渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈余浪潮的到来[1]。”继云计算、物联网、移动互联网之后, “大数据”作为信息技术领域又一次颠覆性的技术革命, 已经在金融、医药、交通、海洋等各个行业以及物理学、生物学、环境学、药学等科学领域广泛应用[2]。

然而, 如何从海量并貌似杂乱无序的数据中揭示内在规律, 挖掘有用信息, 进而通过辅助决策系统、专家系统等进行科学的决策, 是大数据时代面临的重要科学问题。尤其是对这些纷繁复杂的数据进行科学的分析, 实现“数据—信息—知识”[3]三个层次的提炼, 正是“数据分析”课程主要研究的内容。

“数据分析”课程是国内绝大多数高校在信息与计算科学等信息类专业的本科生开设的必修课/选修课[4], 是“概率论与数理统计”课程的后续延伸及应用, 也是“数据挖掘”课程的先修课程。“数据分析”课程主要介绍了数据分析的基本理论与方法, 详细叙述数据分析中线性回归分析、方差分析、主成分分析、典型相关分析、判别分析、聚类分析和Bayes分析等重要的分析方法。虽然“数据分析”课程可看作数理统计学理论与方法的综合应用, 但其更注重实际的应用问题解决的全过程, 从中得到有价值的信息与知识。

在大数据时代下, 大量数据分析处理需求大大助长了各行业及企业对统计、计算机背景相结合的人才的需求[5], 如数据分析师、数据工程师、数据科学家等等, 迫切需要同时掌握数据分析的基本理论与数据分析具体技术, 并且能够通过计算机软件 (SAS、SPSS、Eviews等) 对数据进行分析与处理的复合型人才[6]。通过“数据分析”课程, 学生将初步掌握数据分析的基本理论与方法, 培养和锻炼利用实际数据来分析、解决实际问题的能力, 这些技能将对学生升学深造和就业工作, 具有非常重要的意义。

本文在对“数据分析”课程多年的观察与教学的基础上, 对本科阶段“数据分析”课程存在问题进行深入剖析, 并给出一些初步的建议。

二、存在问题

然而, 笔者在最近几年的授课过程中, 发现“数据分析”课程在学生的学习过程和能力培养方面容易存在以下问题:

1. 理论课程难度较大, 造成学生学习困难。

“数据分析”课程作为“概率论与数理统计”、“高等代数”等课程的后续课程, 需要学生对数学类专业课有比较扎实的基础与深入的理解。如“数据分析”课程中的回归方程的显著性检验方法, 需要学生已经掌握“概率论与数理统计”的多元正态分布的定义和数字特征、假设检验等内容, 同时具有“高等代数”的矩阵运算 (包括矩阵的加、乘法, 求逆阵, 计算特征值和特征向量等) 的基础。同时, “数据分析”与“概率论与数理统计”课程在内容上也是有所差异的:前者强调从实际数据中挖掘尽可能多的有用信息, 属于后者的理论与方法的综合应用。因此, “数据分析”课程的理论难度较大, 对于学生学习提出了很高的要求。

2. 动手能力要求高, 考验学生的编程能力。

“数据分析”课程的知识点不仅仅停留在理论推导上, 对于已经建立的数学模型, 需要借助与计算机对大批量的数据进行处理, 尤其是常用的统计软件在汉化过程中, 不能很好地解决专业术语的翻译。因此在运用计算机软件解决实际问题时, 对学生计算机编程能力和专业外语知识要求也很高。如在SAS中, 有一整套的编程命令, 以命令的方式来建立数据集, 并对数据集进行操作, 甚至在实现某些分析算法 (如Box-Cox变换) 的时候, 还会调用到选择语句和循环语句。学生往往处于被动学习的地位, 只能按照教师的指导, 运行一些简单的程序, 如仅仅敲打书上例题程序, 缺少实验过程中的动手分析、设计和测试环节, 无法发挥学生的积极性与创造性。这样的实验很难让学生体会到实际的数据处理及编程环境, 学会解决编程中碰到的意外问题, 因此难以激发学生的实验兴趣, 从而降低了教学的效果。

3. 对于计算机运行结果, 需要较高的分析问题能力, 考察学生分析能力。

很多同学能够通过计算机调用统计软件中各程序模块的运行, 但仅仅能达到验证结果的目的, 往往对计算结果中所包含的统计学等深层次的含义知之甚少, 更不必说从中提炼出有用的知识。如很多同学知道某统计量的假设检验概率值p<0.0001, 仅表示出现的概率极小, 但不知道其假设条件, 故无法做出统计推断与检验。如此将计算机工具与数据分析强行割裂, 使得学生分析问题的能力很难得到提高。因此, 对于计算机运行结果, 需要较高的分析能力, 找出其问题的本质。

三、课程建议

鉴于上述存在问题, 笔者对大数据时代下“数据分析”课程进行了探索, 提出了如下建议:

1. 建议“数据分析”课程紧密衔接“概率论与数理统计”、“高等代数”等数学类基础课程。

在授课过程中, 根据学生情况, 逐步深入难度。课堂讲授理论学时建议在48个学时以上, 可确保知识的系统性和正确性, 可对教材中内容完整讲解。对于定理的证明, 建议通过黑板等传统手段仔细推导与讲解, 对于部分超出课程要求的繁难的理论证明可以略去或改为学生自学。如在典型相关分析的过程中, 对于典型相关变量和典型相关系数的求法, 可以先给学生讲解有关结果;尤其是计算矩阵平方根的逆矩阵, 着重讲解算法过程。例题和习题的选取, 一般建议选取具有实际背景的观测数据。通过这些例子的分析, 使学生了解数据分析方法的具体应用, 体会数据分析的全过程。有条件的学校可以通过微课视频等形式, 将“数据分析”各个知识点制作成微课, 供学生反复观看使用。

2. 建议增加实验学时, 培养编程动手能力。

建议“数据分析”课程安排上机实验学时不少于16个学时, 选择对常用统计软件 (SAS、SPSS或Eviews) 的一种进行仔细讲解, 使用SPSS或Eviews, 其图形界面可以帮助学生理解复杂的过程, 使用SAS可以让学生了解SAS的编程语言和语法结构。有条件的高校, 建议采用英文版的软件, 可使学生熟悉统计学的专有名词, 为今后的进一步阅读外文文献提供帮助。笔者在实际教学过程中, 结合SAS 9.4展开介绍, 上机实验学时为16课时, 可以使学生有足够的时间进行例题和习题的操作练习。在安排上机的过程中, 根据学生的具体情况, 开展如Box-Cox变换等SAS程序的阅读与编写, 加深对该变换算法的理解和该变换本质———满足线性回归模型的假设条件的理解。

3. 建议增加课程大作业, 实现数据综合分析。

课程大作业可以让学生接触到一个完整的分析问题、解决问题的过程。对于本科生来说, 建议指导教师给出一些具体的题目, 如大城市雾霾天气的影响因素、景点游客满意度等。这些热点问题更容易激发学生的学习兴趣。在大作业中, 鼓励学生通过调查问卷或查阅相关统计年鉴, 以获得相应的原始数据, 并从实际数据中不断挖掘尽可能多的有用信息以及希望从数据中得到的知识。根据计算机运行结果, 进一步分析数据特征, 学会从原始数据到有用信息再到科学知识的一个提炼过程。最后, 通过同学讨论与发言以及教师的点评, 来帮助学生培养分析问题和解决问题的能力。如针对大城市的雾霾天气, 请查找相关数据, 对可能的形成原因进行分析, 提出合理的假设, 并对治理雾霾天气提出合理化建议。可让学生查阅雾霾出现的时间、温度、湿度以及相关的工农业生产指标进行分析, 进行主成分分析等, 尝试寻找导致雾霾的主要原因。

四、结束语

随着移动设备和各类传感器的普及, 数据量已经从TB级跃升到PB、EB级乃至ZB (1ZB=10~21Byte) 级别, 大数据时代已经来临。面对如此惊人的数据, 对于数据的分析和挖掘需求已变得十分的迫切;同时, 充分利用大数据所带来的信息, 如何充分利用这些数据, 使其为国家、企业决策乃至个人服务, 是今后很长一段时间内科学研究和工程技术领域的重要内容。

在这种时代背景下, “数据分析”课程作为信息与计算科学等相关专业的一门重要课程, 将在很大程度上培养学生的数学思维与计算思维, 提升学生的分析与解决实际的问题能力, 增强学生在升学深造和就业工作时的核心竞争力, 更好地融入到大数据时代中去。

摘要：大数据时代下, 迫切需要从海量的数据中揭示内在规律、发掘有用信息、帮助人们科学决策。这正是“数据分析”课程研究的基本内容。本文分析了信息与计算科学等本科专业开设“数据分析”课程中存在的一些问题, 从教学目标、教学内容、教学方式与学时分配等方面, 提出了“数据分析”课程的一些建议及初步探索方案。

关键词：数据分析,大数据,课程探索

参考文献

[1]页川.大数据时代背景下挖掘教育数据的价值[J].中国远程教育, 2013, (4) :94-95.

[2]董志清, 廖正琦.《多元统计分析》课程的教学体会及探讨[J].重庆文理学院学报 (自然科学版) , 2010, (2) :82-84.

[3]董梅生.提高应用统计学课程教学效果的几点体会[J].安徽工业大学学报 (社会科学版) , 2011, (3) :119-120.

[4]梅长林, 范金城.数据分析方法[M].北京:高等教育出版社, 2006.

[5]向程冠, 熊世桓, 王东.浅谈高校大数据分析人才培养模式[J].中国科技信息, 2014, (9) :138-139.

大数据时代信息安全问题分析论文篇9

1.1隐私泄漏问题

在人们的日常生活生产当中，涉及到的信息多种多样，包括自己的相关信息也包括别人的信息。总而言之，日常生活生产使用信息是不可避免的。在大数据时代背景下，信息能够更加快捷方便地交换传输，提高人们生活工作的效率[3]。但大量的数据信息汇集，用户的信息隐私等泄漏的风险也在加大。例如，用户通过微信、QQ、等社交平台晒自己的生活日常，以及网上购物，收发邮件等都会涉及到个人信息以及个人隐私，如手机号码、姓名、住址、照片等等，这些信息不仅会被他人的掌握，也被网络运营商掌握。通过我们的网上足迹，可以查到我们的很多的信息和隐私。以网上购物为例，新浪和阿里巴巴公司合作后，淘宝用户浏览的相关商品以及购物的习惯等会被记录下来，当与之关联的账户登录新浪时，数据库会经过特定算法推算后，精确地推荐该用户应该感兴趣的商品信息[4]。网络服务渐趋“人性化”，但与此同时也给人们的信息和隐私安全带来极大的风险。

1.2安全防护系统存在问题

随着社会信息化加强，人们在利用各种电子、信息设备时，信息安全防范意识也在不断增强，无论是手机还是电脑，都会安装一些安全防护系统如360安全卫士、手机管家、电脑管家等等安全防护软件。对于普通大众来说，这种方式可以较好地保护自己的信息和隐私。但是对于企业以及国家来说，这些安全防护系统起到的作用并不大。企业和国家的信息涉及到一定的机密成分，在数据大量储存的情况下，则需要提高安全防护系统的层次和水平。如果信息安全得不到保障，严重的会导致整个行业甚至是国家陷入危险的境地。但是，目前的安全防护系统应对不断发展的.信息技术时，仍然还有许多的漏洞[5]。而安全防护系统的更新升级速度远远跟不上数据量爆炸式的增长，也不能抵御新的病毒，系统也因此瘫痪，由此大数据时代面临的信息安全问题也涉及到安全防护系统的滞后问题。

1.3网络恶意攻击

高校教育大数据的分析挖掘与利用篇10

摘要,本文从高校教育大数据的汇聚融合与挖掘应用的角度,分析了如何运用教育大数据技术推动大学管理和人才培养的创新改革的思路和方法。首先,分析了教育大数据对高校现代化、精细化、规范化管理的4个价值,其次,给出了高等教育大数据技术平台的基本技术架构,第三,结合教育大数据实际应用,介绍了陕西省高等教育质量监管大数据中心、MOOC中国、西安交通大学教学质量综合监控与评价三个典型案例,最后,提出了教育大数据分析挖掘中的3项基础性关键技术

关键词,高等教育,大数据,分析,挖掘

一、教育大数据分析挖掘的价值

高校大数据分析挖掘至少有四个典型价值, 一是使得大学的管理更加精准高效,可以朝着智慧治理、分类管理、过程监控、趋势预测、风险预警的方向发展,真正实现基于大数据分析规律的精准治理,改变管理的模糊性, 二是可以更加准确地分析评价课堂教学的质量,过去我们对课堂、对老师的评价是定性和模糊的,而在大数据智慧课堂的模式下,可以真正实现采集样本的持久化,采集方式的多元化,挖掘手段的多样化,分析技术多维度,通过这些方式可以提高课堂教学的质量, 三是使得教和学更加智慧,更加有效。对学生来说,老师可以了解学生学习的进展情况,发现学习兴趣点,以及对老师讲的哪些内容理解或者不理解,学习路径分析及课程推荐等等。对教师而言,不仅可以跨校跨地域分享他人的优秀课程,而且可以对学习者进行精准分类,进行个性化指导, 四是资源服务的个性化、精准化推荐与服务,学习绩效的个性化评价,以及个性化教学管理,个性化手机内容推送等等,这些功能将有效提升教与学的效率和质量

二、教育大数据技术平台的总体设计

首先,我们对高等教育大数据技术平台有一个总体的顶层设计,如图1所示。这不仅是学校自己要有一个大数据的管理平台或者是数据中心,而且也是面向区域乃至全国的平台。教育部评估中心正在努力建立国家级高等教育教学质量监控大数据中心,陕西省也是这样考虑的。数据来自高校、教育管理部门以及行业、第三方、企业用人单位等等各方面采集的数据,该数据平台既有大学的业务数据、课程资源,也有政府部门的统计数据,还有学生网上学习的日志数据,用户产生的UGC数据,比如微信、微博、论坛等等的数据,基于大数据平台,开展面向学习者、面向高等教育管理机构、教师、高校等提供服务,并和教育部评估中心、主管部门等

进行数据交换与对接

显然,这样一个大数据平台必须是一个高性能的计算平台,没有这样的基础设施一切无从谈起,所以去年我们学校花了很大的力气做了两件事,一个是把校内二级单位原来小的集群计算进行整合,形成学校统一的高性能云计算平台,既面向校内的科学研究、人才培养提供服务,其实也可以为社会提供合作共建共享模式。目前,我们已建立了一种自我造血机制,四两拨千斤,以这个平台吸引更多的外部资源,努力扩展平台的性能和应用

三、教育大数据分析挖掘的典型应用案例

目前,我校的高性能平台除了应用于材料、航天、能动、信息等大型科学计算之外,还开展了以下三项典型的大数据应用

案例1,陕西省高等教育质量监控与评估大数据应用

图2所示的是陕西省高等教育的整体架构。其数据基础是来自陕西省100多所高校的各种办学状态数据,有将近700个表格,以及陕西省教育厅各个职能部处的各种各样的管理数据,此外还有行业第三方提供的数据,包括招生、就业数据等等,这个平台上我们开展预测预警、查询在线分析、信息发布、统计决策等等,主要是为省级教育管理部门、评估机构、教育管理机构提供各种各样的办学状况的分析、统计、关联分析

建设全省高等教育大数据服务平台,实时采集各高校的办学状态数据,其根本目的是为了汇聚全省各高校的办学状态数据,打破数据孤岛,融合各方数据,实现横向关联比较、纵向历史分析,提供精准服务,支持科学决策

首先,该平台面向省教育厅提供了11项功能,从根本上解决了原来各处室间的数据孤岛的问题,实现了数据融合,横向关联,纵向融通,这个数据和各个高校是实时融通的,为省教育厅领导和职能部处提供了领导仪表盘、各职能处室的专项服务、81张高基表及年报年鉴表格的自动生成、绩效分析、招生就业及办学指标计算、教育评估等功能,从根本上解决了数据碎片化及其治理问题

其次,面向全省高校辅助决策,为高校领导以及校内各个职能部处提供了系列功能,包括办学情况综合分析和在线查询,专业结构分析比较,校级的教学质量监控评测体系,教师管理等等,这些功能非常实用,这是大学实现精细化、规范化、现代化管理的必备基础。以我校为例,我们过去教师的数据可能在人事处、教务处、科研院等学校的职能部门,采取本平台以后,把教师有关的所有数据都进行了融合,打通了所有原来割裂的数据。从去年开始,我们学校的职称评聘,考核全部基于这一平台,全部在大数据里,建立健全了基于数据驱动的精准化服务,解决了数据碎片化历史遗留问题,实现了从管理信息化向服务信息化的根本转变

第三,为本科教育教学评估及专业认证提供技术支撑。鉴于本平台能提供比较全面的高校办学状态数据,便于专家在进校之前全面系统地掌握学校办学的情况,找到问题,精准查看验证,提高效率,给高等教育评估提供了重要支持。基于本平台,我们成立了中国西部高等教育评估中心,接受陕西省教育厅指派的省属本科高校的审核评估和专业论证。如果没有这一高等教育大数据平台的支撑,工作量和难度是极其巨大的,甚至难以实现

案例2,MOOC中国技术平台

MOOC中国成立于2015年1月,到目前为止已经有121所高校加入,理事单位40家,会员单位80家。该平台的宗旨是,做政府想做的,做社会愿意做的,做单一高校做不了的事情。例如,真正解决校际资源共享、学分互认等,开拓远程教育国际化等未来发展的难题。图3给出了MOOC中国的技术框架。其核心是互联网+教育,实现互联网教育从1.0到2.0的升级。基于这一平台,既要开展网络教育业务的国际化,比如我们牵头成立的“丝路大学联盟”,其目的之一是借助MOOC中国平台,实现网络教育业务的国际化,通过MOOC中国平台,面向“一带一路”国家开展开放教育和技能培训

到目前为止,MOOC中国已经有了9911门课程,用户将近600万,其中光IT培训的有500多万,学历教育在读

学生50多万

案例3,西安交大教育教学大数据分析挖掘与应用

学校非常重视教育信息化技术融入和应用到教育教学之中,去年一次性建成了80个智能教室,把物联网技术、云计算技术应用于智能教室和教学一线,基于物联网技术实现教室设备的集中管理、智能控制,同时,将互联网技术深度融入到教室的管理当中,除了多媒体的直播录制功能以外,还提供了学生考勤和专家的精准督导,通过云平台来集中管理各个教室,比如说开投影机、关电源、关多媒体设备等等,都可以通过后端的云平台集中管控,真正实现教室管理的数字化、智能化、精细化,提升了教学保障的能力,也大大提高了教室管理的效率。更重要的是,这些教学的过程数据可以全程采集下来,获得数据,有了这些数据,就可以做精准化分析服务,建立西安交大教学质量大数据监测中心目前,我校的教学大数据主要包括两大部分,一是教师在授课过程中的全程录制的课堂实况,二是学生在学习过程中产生的大量日志数据。基于这个平台,我们可以开展教育教学的大数据关联分析,开展课堂教学质量的综合评价,实现正面激励、负面惩戒、精准督导,实现教学评价从模糊宏观到量化精准、从每学期制到持续常态、从部分随机到全面覆盖、从事后评价到实时动态的根本转变。通过评价激励老师敬畏课堂,评选精品课堂、示范课堂,在全校内进行正面

表彰,另外也作为教学质量评价的重要依据,包括教师的职称晋升,评选最喜爱的老师等等

此外,本系统还为学院领导和管理部门提供了针对性的信息服务与决策支持,以数据说话,量化分析,改变了以前我们的模糊评价,采取多维度、全覆盖、持续化、精细化的过程评价与监控

四、教育大数据分析挖掘的若干关键技术

首先,介绍一下大数据人工智能的基本原理。前段时间,AlphaGo战胜世界围棋冠军这一故事炒得很热。这对我们的教育科研工作者提出了一个重要的课题,到底人工智能会不会战胜人类的智能,将来教师存在的主要价值是否还有必要,863计划正在研究一个项目,到2020年,人工智能软件参加高考得分要超过一本线,这就是说,计算机教出来的机器软件参加高考都能达到一本线以上。这就引起我们的思考,这是一个深层次的方向性问题。当然我们今天不是谈这个问题,而是我们要看看AlphaGO的原理,其核心是价值计算函数,用收益函数来判断围棋下一步该落子到哪里其收益是最大的,其中采用了人工智能深度学习方法。AlphaGO并非天生聪明,其实他的智慧是分三步完成的, 第一步,给AlphaGO输入了3000万个人类围棋高手的棋谱和走法,任何一个人是不可能记住3000万个棋局的,只有人工智能才能记住第二步,AlphaGO自己和自己对弈,在对弈过程中找到自己的薄弱点,进而改进和完善,这其实和人的学习原理类似

第三步,才是人机对弈,从职业选手到世界围棋冠军,通过这样不断的对弈完善算法,校正学习,使得AlphaGO具有强大的智能计算能力。AlphaGO的难点在哪,其关键在于在一个巨大的落子空间选一个最大的收益点,或者落子点,称之为MovePicker，函数,这个空间很大,有10170次方,在如此庞大的计算空间中选择最优函数,只能依靠高性能计算平台

AlphaGo为我们研究大数据问题提供了思路和启发。我们在研究教育大数据问题中需要着力攻克以下理论与技术难题

第一,大数据造成了严重的认知碎片化问题。比如,大家在百度搜糖尿病会检索出4440万个数据源,谁也看不过来,并且里面还有一大堆真假难辩的数据。所以,碎片化知识的聚合是一个非常基础的难题,高度的碎片化降低了知识的可用性,造成了分布性、动态化、低质化、无序化等典型的问题

一方面是知识的碎片化,另一方面是每个人的兴趣和需求还不一样。所以,资源的碎片化整合以及个性化推荐是今后人工智能中的关键问题。我们的思路是,一方面,我们要

从资源的角度把无序、分散、低质的资源进一步重组以后形成知识点,形成有序的知识地图,另一方面,要对学习过程进行跟踪,实现兴趣、个性、情感等方面的动态分析与挖掘,两者结合起来,建立基于用户兴趣和个性的资源推荐,最后实现个性化精准过滤,通过知识地图面向用户提供导航学习,从而缓碎片化知识的问题。开展这一研究也要建立庞大的基础数据,就像刚才讲的AlphaGO,光靠智能软件肯定不可能那么聪明,需要建立庞大的知识地图、知识图谱,并将其放到了国际开源社区和开放数据平台之上第二,碎片化知识的聚合问题。其目的是解决“既见树木,又见森林”的问题,破解“学习迷航”、“认知过载”的问题。我们正在承担国家自然科学基金重点项目,研究如何将多源、片面、无序的碎片化知识聚合成符合人类认知的知识森林,找出主题与主题之间的认知关系,最后形成一个知识森林,其中需要解决主题分面树的生成、碎片化知识的装配、知识森林生成、学习路径选择与导航等有关知识地图、知识图谱构建与应用等许多基础性关键技术

第三,学习行为的分析和挖掘技术。网上学习最大的好处我们可以把教师和学生所有的教与学的行为记录下来,讨论、作业、习题、笔记及进度记录下来,有了这些数据,我们可以进行后续分析,开展学习行为的特征识别和规律发现等等,既可以跟踪挖掘某个个体的学习规律,也可以找出一

个群体、一个小组的特征和规律。针对不同的课程,开展课程点击率、学习人群、知识关注点、学习时间等的分析与跟踪,刻画一个学生学习的过程,从时间、空间和课程知识导航的角度,甚至围绕某个知识点,研究学习者的特征、行为、交互等相互之间的关系,为老师深化课程改革、探索以学生为中心的教学设计具有非常重要的意义

大数据产品竞品分析篇11

2011年10月18日Gartner公司发布2012年十大战略技术报告, 将大数据列为一项需要突破的战略技术。此后, 大数据概念开始在业界和学术界中引起广泛关注。出现大数据这一主题的原因可归结为以下几个方面:数据存储费用急剧下降, 移动互联网设备的普及, 社交网络应用程序的崛起以及激增的消费数据的可用性。大数据的规模大、类型复杂、来源多样以及数据产生速度快等特性均给传统的数据管理技术带来了新的挑战, 同时也给数据库领域标准带来了机遇与挑战。

2 大数据特点及技术现状

大数据的特点首先表现在数据规模上, 数据量非常大, 从TB级上升至PB级, 并仍在爆炸性增长;其次表现在数据类型上, 数据类型多样, 包括结构化数据、半结构化数据和非结构化数据;再次表现在速度上, 数据产生速度非常快, 需要快速、实时的分析处理;最后表现在数据的价值和准确性上, 大数据被用于企业决策, 因此对大数据的真实性和正确性提出了更高要求。

在大数据时代背景下, 传统的关系数据库技术难以满足大数据分析的要求, 2004年Google公司提出的Map Reduce技术作为面向大数据分析和处理的并行计算模型, 引起了业界和学术界的广泛关注。Map Reduce是进行大规模数据分析处理的灵活而有效的工具, 相对于关系数据库, Map Reduce具有高度的扩展性、容错性、快速装载和易于使用等优点;但是, 在性能上还有待提高, 且目前基本不兼容现有的商务智能工具。关系数据库技术和Map Reduce各有优缺点, 如何融合关系数据库和Map Reduce技术, 设计同时具备两者优点的技术架构, 也是大数据分析技术的一个研究方向。

3 现有数据管理标准对大数据的支持

数据库领域标准主要分为国际标准和国家标准两类。

国际标准主要是ISO/IEC JTC1/SC32 (数据管理与交换) 分委会制定和发布的ISO/IEC 9075《信息技术数据库语言SQL》 (简称SQL) 系列标准和ISO/IEC 13249《信息技术数据库语言SQL多媒体和应用包》 (简称SQL/MM) 系列标准。

国内标准主要有四项, 2012年发布的GB/T28821-2012《关系数据管理系统技术要求》 (简称技术要求) 和2012年批准立项的三项非结构化数据管理国家标准。

3.1 SQL标准

ISO/IEC 9075《信息技术数据库语言SQL》系列标准由ISO/IEC JTC1/SC32/WG3工作组制定, 提供了广泛的支持关系表的结构化数据、用户自定义对象和XML数据的存储和检索功能。SQL标准现有9部分:

—第1部分:框架 (ISO/IEC 9075-1:2011) ;

—第2部分:基础 (ISO/IEC 9075-2:2011) ;

—第3部分:调用层接口 (ISO/IEC 9075-3:2008) ;

—第4部分:持久存储模块 (ISO/IEC 9075-4:2011) ;

—第9部分:外部数据管理 (ISO/IEC 9075-9:2008) ;

—第10部分:对象语言绑定 (ISO/IEC 9075-10:2008) ;

—第11部分:信息和定义模式 (ISO/IEC 9075-11:2011) ;

—第13部分:使用Java程序设计语言的SQL例程和类型 (ISO/IEC 9075-13:2008) ;

—第14部分:与XML有关的规范 (ISO/IEC9075-14:2011) 。

SQL标准在存储和检索结构化数据管理方面给大数据技术提供了支持。

3.2 SQL/MM标准

ISO/IEC 13249《信息技术数据库语言SQL多媒体和应用包》系列标准由ISO/IEC JTC1/SC32/WG4工作组制定, 支持文本、空间、图像等复杂数据类型的存储和检索。SQL/MM标准现有六部分:

—第1部分:框架 (ISO/IEC 13249-1:2007) ;

—第2部分:全文 (ISO/IEC 13249-2:2003) ;

—第3部分:空间 (ISO/IEC 13249-3:2011) ;

—第5部分:静态图像 (ISO/IEC 13249-5:2005) ;

—第6部分:数据挖掘 (ISO/IEC 13249-1:2006) ;

—第7部分:历史 (ISO/IEC 13249-7:2013) 。

大数据的一大特点是数据类型多样, SQL/MM标准提供了文本、空间、图像、历史数据等类型的支持。其中“空间”提供了地理信息数据处理所需的多种函数, 为处理GPS数据和地理信息的大数据应用提供了标准支持。“数据挖掘”则为在大数据基础上进行分析决策提供了支持。

3.3 技术要求

2012年发布的国家标准GB/T 28821-2012《关系数据管理系统技术要求》是我国自主制定的数据库产品类标准。该标准规定了作为大型通用的关系数据库管理系统产品, 应满足的所有功能, 这些功能按照功能性、可靠性、易用性、维护性等特性进行分类。

该标准在ETL组件、存储管理、OLAP、数据挖掘、数据集成等商务智能工具及表容量、大对象存储等方面对关系数据库如何处理大数据提供了支持。

3.4 非结构化数据管理标准

(1) 《非结构化数据表示》

该标准目前处于制定阶段, 内容包括数据模型和特征列表两个方面内容。数据模型规定非结构化数据的基础值类型范围, 数据与特征之间的层次关系;特征列表则分类型地列举出非结构化数据可以实现、提取和抽象的特征元素, 为非结构化数据管理提供交换依据。

(2) 《非结构化数据访问接口规范》

该标准目前处于制定阶段, 内容包括集群配置管理接口、任务管理接口、存储组件接口、分析组件接口、索引组件接口和搜索组件接口定义等。

(3) 《非结构化数据管理系统技术要求》

该标准目前处于制定阶段, 内容包括非结构化数据处理要求、系统功能要求、兼容性要求、接口要求和性能要求等。

大数据时代处理的数据有大量非结构化数据, 上述三项国家标准建立了非结构化数据的统一表达机制、统一了非结构化数据访问接口、规定了非结构化数据管理系统技术要求, 在非结构化数据管理方面给大数据技术提供了支持。

4 数据库领域标准的机遇与挑战

Map Reduce目前被国际广泛应用于海量数据分析, 然而, 大量数据仍然存储在SQL数据库中, 并且许多应用也离不开SQL数据库, SQL数据库进行大规模数据挖掘是必需的。这给SQL标准的发展带来了机遇, 同时由于目前没有海量数据处理框架标准和基于该框架的数据挖掘标准, 如何利用SQL机制处理大数据挖掘存在一定难度。可以考虑从以下几方面对SQL标准进行扩展:

(1) 数据存储和检索。现有的数据库语言SQL标准支持结构化数据、用户自定义对象和XML数据的存储和检索, 为支持大数据, 需要进一步支持多种新的对象类型, 制定与Map Reduce处理方式类似的新特征。此外, 还需对调用层接口进行扩展以支持分布式访问。

(2) 对复杂数据类型的支持。现有的SQL/MM标准定义的复杂数据类型包括文本、空间和静态图像, 在大数据环境下, 还需增加对多种非结构化数据的支持, 如音视频、时态数据等, 还需增加内容解决大规模数据挖掘问题。

此外, 现有的数据库相关标准中的部分内容也适用于大数据的管理, 需要识别出这些内容, 对现有管理标准进行整合, 使其能与新制定的标准一起更好地为大数据及数据分析服务。

随着大数据技术的逐渐成熟, 将会给更多的数据库相关标准制定带来机遇, 例如:术语标准、体系结构标准、接口标准和检测规范类标准等, 以满足大数据分析处理的需求。

参考文献

[1]Orlando Fla.Gartner Identifies the Top 10Strategic Technologies for 2012[EB/OL]. (2011-10-18) [2013-10-11].http://www.gartner.com/it/page.jsp?id=1826214.

[2]覃雄派, 王会举, 杜小勇, 等.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报, 2012, 23 (01) :32-45.

[3]王珊, 王会举, 覃雄派, 等.架构大数据:挑战, 现状与展望[J].计算机学报, 2011, 34 (10) :1741-1752.

精准营销下的大数据分析利用篇12

于大部份营销者来说，网站再定向(onsite retargeting)是其中一个最重要的营销手段，所谓网站再定向的意思是对曾访问您网站的用户进行宣传，在他们浏览网络时向其展示广告。此手段之所以重要是因为在第一次接触中真正转化为购买的只占2%，而没有产生购买就离开网站的人群体高达98%。网站再定向的威力在于它能够帮助你吸引很多的潜在客户，由于这些用户之前已经访问了您的网站一次，这意味着他们确实对您的产品和服务感兴趣。当你不断向这些用户显示相关的广告，将能够吸引他们回访并完成购买。理论上，网站再定向技术听起来完美，但执行起来，却可能让很多广告主走入死胡同，因为它只能够覆盖到旧有的访客，而无法接触新访客。对于广告主来说，网站再定向是一把双刃刀，它虽然能带来绝佳的ROI，却由于覆盖度不足，会在无形中扼杀销售机会。

其实无论是广告数据或购买行为数据，网络都能记录下来，而网络的实时记录特性，让它成为当下广告主实现定位营销的不二之选。随着技术不断革新，广告主精细化定位的需求也不断得到满足。在随后的篇幅中，我们会简单地对比几大定位技术，并通过电商案例分析来讨论如何让这些数据技术协同起来，促成客户从浏览广告到掏钱购买的转化，实现广告主的收益最大化。

网络营销的精细化定位潜力只有在大数据的支持下才能完全发挥出来。图中的数据金字塔划分出了数据的四个层级。最底层是广告表现数据，是关于广告位置和其表现的信息。具体而言，就是广告位的尺寸、在网页的位置、以往的点击率、可见曝光(viewable impression)等指标。

再上一层就是受众分类数据。如今，市场上的数据提供商可以通过用户的线上和线下的行为，来收集到广告受众的兴趣、需求等数据。这些不会涉及个人真实身份的信息会被分析，并划分为不同的群組，例如性价比追求者、网购达人等。有了受众分类数据，广告主可以在互联网上按自己的需求和品牌的特性来投放。受众分类数据的针对性更强，也能带来比单纯依赖广告表现数据更好的点击率与转换率，因为它提供了消费者行为和偏好等宝贵信息。

第三层是搜索动机数据。搜索再定向是个用于发掘新客户的技术。它的出现让我们能够发掘出那些很可能会购物的用户，因为他们已经开始搜索与广告主产品相关的信息了。那些具有高商业价值的数据可以进一步被筛选出来，广告主可以将具有高购买意愿的人们再定向到自己的产品信息上来。

而位居数据金字塔顶端的是站内客户数据，这指的是用户在广告主网站上的用户行为数据，包括了用户浏览的页面，下载的信息，以及加入购物车的商品等数据。网站用户通常是那些已经了解过品牌并且对公司也熟悉的一群人。

对于广告主来说，金字塔四层的数据都独具价值。举例而言，广告表现数据是每个广告主都首先会关注的信息，因为这些信息在大多数广告管理平台和广告交易平台都能轻易获得的。同时，那些与用户需求和偏好相关的数据，能够助力广告主更好地实现精细化营销。因此，要想针对性地影响消费者购买路径的每个过程，我们就需要把这四层的数据分析整合，才能制定一个更全面的营销方案。

以下，我们将分享一个真实的案例，让广告主明白应当如何打通各层数据，制定覆盖消费者购买路径的精准定位的营销方案。

案例分享

背景：爱点击的客户，国内最知名的电子商务网站之一，希望能提高ROI(投资回报率)和线上交易数量

挑战：客户已经使用了网站再定向技术来实现一个较好的ROI，但是，从再站内定向所带动的交易数量开始有下降的趋势。

优化策略︰利用多重数据的整合，提升转化漏斗每一阶段的人群数目，以提升总转化量

第一步：网站再定向

广告主会发现网站内再定向带来的购买转化量有限，这是因为大部份广告主只会再定向曾经将商品加入购物车的访客。要想提升网站再定向的效果，最优的方法是根据用户浏览过的页面进行属性分类，并呈现具有针对性的内容。具体参考下图：

有了全面的追踪和分类，再定向受众数量的基数大幅增加。在短短两个星期内，交易数量显着提升，尤其是来自老访客的成交量更是大幅提升44%。

第二步：搜索再定向(search retargeting)及购买第三方受众分类数据

一方面，再定向可以有效地召回老访客，增大重复进入网站及购买的可能性。但同时，广告主还应该考虑怎么能增加新访客，以保证转化漏斗有足够的新增流量。

首先，我们利用搜索关键词捕捉有兴趣的用户，然后储存有关的用户数据，最后，在交易平台上将合适的广告呈现给该用户。此外，我们还会关注第三方受众分类数据中那些有着同样行为特征的用户信息，整合在一起进行精准投放。

在进行搜索再定向及购买受众数据后，新客户所带来的成交大幅度上升254%，广告效果花费CPA下降29%，同时增加该网站整体的浏览量。

第三步：利用机器学习(Machine Learning)进一步扩大客户的数量

用户来进行定位广告投放。XMO的算法可以对比客户的CRM消费者数据与第三方受众数据，并预测出哪些网络用户会有特定的购买倾向。在这个案例中，XMO能通过机器学习来不断产生新的受众，平均每周能够细分出一个有着230万样本的人群。通过将广告投放到我们已有的目标受众群和由机器学习锁定的新目标受众，我们可以看到非常喜人的广告效果，虽然CPA轻微上升14%，但新客户成交量大幅增长26%说明了机器学习能有效地为广告主发掘新客户。

什么是机器学习(Machine Learning)?(摘自维基百科Wikipedia)机器学习是人工智能的核心，根据数据或以往的经验，通过设计算法来模拟背后机制和预测行为，并获取新的数据。这是一个重新组织已有的知识结构使之不断改善自身性能的过程。研究者可以

通过机器学习来抓取现有数据的特征来预测未知的概率分布，找到新的具有相同特征的数据并加入库中。机器学习中最关键的就是开发出能智能识别复杂模式并能智能化决策的算法。

观点总结

多渠道数据的整合可以在两方面帮助广告主提高广告表现。

【大数据产品竞品分析】推荐阅读：