大数据时代的数据管理(通用8篇)
大数据时代的数据管理 篇1
褚宝福 鲍静 摘 要:大数据时代提高学生解读数据能力是我们提升教学有效性的新课题。面对《经济生活》教材中的众多经济数据,我们不能止步于浅层次的文本阅读,还需要将它们从“知识”“情感”和“思想”三个维度上进行解读,使其融入知识、能力及情感态度价值观“三维”目标之中,为拓宽学生知识视域、提升学习能力、培育正性情感、树立正确价值观服务。关键词:经济数据 知识性解读 能力性解读 思想性解读 褚宝福,男,浙江省嘉善高级中学,中学高级教师;鲍静,女,浙江省嘉善高级中学,中学一级教师。大数据时代,学会正确解读数据已成为人们应具备的重要技能之一。因此,培养和提升学生解读数据能力就成为我们提升教学有效性的新课题。普通高中思想政治课教科书中设置了大量的数据,仅人民教育出版社2014年3月第6版普通高中必修1《经济生活》教科书中选用的经济数据就达20多处。面对这些经济数据,笔者发现有不少教师在教学时只是将其作为一般文本材料让学生自己阅读,而没有立足于时代需求、从新的角度来解读,这既是对教材资源的浪费,也不利于学生的真正发展。为此,本文结合课程标准的要求,倡导对经济数据进行三个层次的解读:知识性解读、能力性解读及思想性解读,并期望以此提升学生的数据解读能力、力促学生的发展和课堂教学有效性的提高。
一、经济数据的知识性解读 所谓知识性解读,指的是教师在教学时,能够从纵横两个视角引导学生对《经济生活》中的数据进行解读,让学生获取相关的经济学知识,以达成思想政治课的知识目标。1.基于纵向视角的知识性解读。从纵向视角对经济数据进行知识性解读,强调的是对一定的经济数据进行历史性考察,并据此解读出相应的经济学知识。如对教科书第10页“2010年4月8日人民币对美元的汇率中间价为682.59,2013年4月8日人民币对美元的汇率中间价为626.5”这一数据,我们的历史性考察分两步:首先是选择四个典型的历史时期来考察汇率情况。一是1953年到1972年,国家实行计划经济,实行严格管制和固定不变的汇率政策,使人民币对美元的汇率基准价长期稳定在246.1上。二是1981年至1993年,国家实行对外开放,发展社会主义市场经济,为扶持出口,增加外汇收入,人民币对美元的汇率基准价控制在149和195.8之间。其中1985年至1993年国家为平衡国际收支,实行官方牌价与外汇调剂价格并存的政策,使人民币对美元的汇率基准价由293.6逐渐上升到576.2。三是1994年至2005年,为进一步完善发展社会主义市场经济体制,国家逐步形成了以市场供求为基础的、单一的、有管理的浮动汇率制。人民币对美元的汇率基准价保持在835与819间浮动。四是2005年7月21日起至今,实行以市场供求为基础的、参考一蓝子货币进行调节、有管理的浮动汇率制度。人民币对美元的汇率基准价水平由797上升到619,并呈稳中有升的特点。其次,在上述四个时期考察的基础上,我们可引导学生解读出这样一些基本的经济学知识:一是我国的汇率政策是为适应并促进不同时期经济社会发展的需要而制定的,期间经历一个由严格管制向市场逐渐过渡的历史过程,并呈日趋市场化开放化的发展趋势。二是汇率是以另一国货币来表示的本国货币的价格,其高低最终由外汇市场决定,但同时也会受到国家政策等因素的影响;三是一国汇率数据的变动会对该国经济发展和居民生活带来一定的影响。我国人民币汇率总体呈上升趋势,这对我国经济发展和人民生活既有利也有弊,需要我国防范汇率风险等。2.基于横向视角的知识性解读。从横向视角对经济数据进行知识性解读,强调的是对经济数据横向间的各类关系进行分析,并解读出其中所蕴涵的经济学知识。如对教材第66页“财政收入”这一数据,我们的知识性解读也分两步进行:首先将教材上“2012年财政收入”来源项目细化,并选择典型项目进行横向分析。一是分析财政收入、税收收入、非税收收入的数量及关系:2012年财政收入117210亿元(不含债务收入),税收收入100601亿元,非税收收入16639.24亿元,分别占全部财政收入的85.83%和14.20%。二是分析税收中几个主要税种的数量及关系:国内增值税26415.5亿元、国内消费税7875.58亿元、营业税15747.64亿元、企业所得税19654亿元、个人所得税5820.28亿元、关税103.5亿元等,其中国内增值税已成为我国目前税收的主要来源,企业所得税次之,营业税居第三,然后是国内消费税和个人所得税,关税数量较少。三是分析非税收收入中主要项目数量及关系:行政事业性收费4579.54亿元、国有企业利润1154.02亿元、罚没1559.81亿元等,其中行政事业性收费最多位居第一,而国有企业上交利润相对比较少,低于各类罚没收入。四是几类主要国有企业利润数量及关系:烟草企业252.64亿元、石油化工企业308.45、电力企业76.74亿元、煤炭企业106.54亿元、电信企业106.90亿元、电子企业1.65亿元、金融企业0.33亿元、转制科研企业1.88亿元等,其中石油化工、煤炭、电力等资源类国有企业利润占总利润的42.61%,而科技为主的国有企业利润只占总利润的9.5%。其次在上述分析的基础上,我们可引导学生解读出这样一些基本经济学知识:一是税收是依法取得财政收入的基本形式,是财政收入的主要来源。二是增值税、营业税、企业所得税等是国家收入的主要来源,但也直接影响企业的生存和发展。当前的税收改革特别是“营改增”,对国家税收总量及企业发展与竞争力影响甚大。三是非税收收入中行政事业性收费太多,而国有企业上交利润偏低,与国有经济的性质、地位及作用不匹配。四是国有企业利润结构不合理,其中资源类国有企业的利润占利润总量过高而科技类国有企业利润偏低,这表明我国仍需要大力推进经济发展方式的转型升级。
二、经济数据的能力性解读 所谓能力性解读,指的是教师在教学时,能够引导学生运用比较、综合两种方法对《经济生活》中的经济数据进行解读,提升学生分析数据和概括数据的能力,以达成思想政治课的能力目标。1.基于比较方法的能力性解读。运用比较方法对经济数据进行能力性解读,强调的是对不同的经济数据,依据一定的标准进行相应的比较,以培养和提升学生分析数据的能力。如对教材第82页虚线框中的“农村居民人均纯收入”和“城镇居民人均可支配收入”数据的能力性解读,可分下述两种情况:首先,对同一经济主体在不同时间点上的数据进行纵向比较性解读,以培养学生纵向分析数据的能力。如可将教材82页上“农村居民”和“城镇居民”两类经济主体的经济数据,分别补充上2013年和2014年的最新数据,形成下述比较表格: 依据上述表格数据,引导学生分别分析从2009年至2014年农村居民人均纯收入和城镇居民人均可支配收入数据变动的特点:城乡居民人均收入逐年增加,但农村居民收入增长速度快于城镇等。其次,对同一时间点上不同经济主体的数据进行横向比较性解读,以培养学生横向分析数据的能力。我们同样可依据上述表格,引导学生分析我国在2009年至2014年期间,每年农村居民和城镇居民人均收入数据的差异情形:城镇居民收入高于农村居民,绝对差距数据在拉大等。2.基于综合方法的能力性解读。运用综合方法对经济数据进行解读,强调的是在一定的范围内对不同经济主体的经济数据进行相应的综合,以培养学生的数据概括能力。一般我们可选择两种主要范围展开综合性解读:首先就同一教学单元中的经济数据进行综合性解读,以培养学生从单元经济数据中概括出相应结论的能力。如对第二单元“生产、劳动与经营”中的主要数据,我们按照因果联系的逻辑原则,将“我国主要产品产量居世界位次”、“城乡居民储蓄存款余额”、“储蓄存款利息和股票价格”、“投资理财的分配数额”、“保险理赔数额”等数据进行综合,形成下述数据体系:依据上述体系,引导学生对①②③④四组原因结果关系进行概括,可得到这样的结论:随着我国我国经济不断发展、经济实力不断增强,居民储蓄余额不断增加,同时由于国家经济的发展和居民储蓄余额的增加,会引起居民投资理财途径的多样,而这会进一步提高了居民的储蓄余额和国家经济的发展,由此在居民投资与国家经济发展间形成了相互促进的良性互动。总之,一国经济的发展与投资间存在着密切的关系,需要我们正确地处理。其次对教材中不同单元中经济数据进行综合性解读,以培养学生从不同单元经济数据中概括出相应结论的能力。如对第二单元“生产、劳动与经营”和第三单元“收入与分配”中的众多数据,我们同样可依照因果联系的逻辑原则,进行综合,形成下述综合体系: 依据上述体系,引导学生对①②③④⑤⑥六组原因结果关系进行概括,可得到这样的结论:第一,随着我国经济的发展,不仅带来居民投资增多和日趋多样,而且还促使国家财政收入、企业收入和居民收入不断提升及财政支出数量的增加。第二,我国居民投资和财政投资的增加,必然促进我国经济的发展。第三,国家财政收入的增加、企业利润、居民收入的不断提升,也必将推动我国经济的发展。第四,在国家财富一定情况下,投资的增加会引起收入的减少,而收入的增加会引起投资的减少,两者存在此消彼长的关系。第五,国家、企业和个人之间收入分配结构的变化会影响国家经济的发展,同样国家投资结构和居民投资变动也会影响国家经济的发展。总之,一国经济的发展既需要投资的作用,也需要消费的作用,因此必须协调好投资与消费的关系,实现经济的转型与持续发展。
三、经济数据的思想性解读 所谓思想性解读,指的是教师在教学时,能够引导学生从现象和原因两个层面对《经济生活》中众多经济数据进行解读,让学生接受情感熏陶和价值观教育,以达成思想政治课的情感态度价值观目标。1.基于现象层面的思想性解读。经济数据本身较为抽象枯燥,缺乏情感,但与数据形成、变动相关的经济现象却是具体、丰富的。教学时,我们可借助这些现象进行情感性解读,让学生接受情感熏陶、培养学生积极向上的正性情感。如对教材89页中的“投资和消费对经济增长的贡献率”数据,我们在教学时可分两种情形进行:首先选择与“投资对gdp增长贡献率”的经济现象进行解读,如列举各省市县政府投巨资建设“美丽乡村”,培养学生热爱乡村的情感。其次,我们选择与“消费对gdp增长贡献率”数据相关的经济现象进行解读,如例举因书香社会建设而形成的“阅读消费”现象培养学生热爱读书的情感喜好。2.基于原因层面的思想性解读。经济数据本身反映的是一种客观事实,显得呆板和冷漠,缺乏生动的教育性。但数据产生及变动背后的原因,却值得人深入思考。教学时借助这些数据背后的原因,我们可以让学生了解党和政府所做出的各种努力和探索,进而借此进行价值观教育,以帮助学生树立正确的价值观。如对教材89页中的“投资和消费对经济增长的贡献率”数据,我们可以对其进行补充扩展并形成下述表格,然后分两种情形进行解读。首先选择“投资对gdp增长贡献率”数据进行原因性解读。我国2000年至2014年“投资对gdp增长贡献率”呈现由低到高、再由高到低的变动特点,主要原因有二:一是我国投资政策由偏向追求发展速度转向追求发展质量与效益,二是投资结构由偏重经济建设转向民生发展。这样的解读,不仅可使学生认识到我们党和政府立足经济发展的实际,制定和实施科学的投资政策,实现了经济的平稳运行,而且还能体会到政府在制定和实施投资政策时始终坚持“以人为本、以民为本”的出发点和落脚点,从而有利于学生树立乐于为国家、为民众奉献的正确价值观。其次选择“消费对gdp增长贡献率”数据进行原因性解析。自2010年后我国“消费对gdp增长贡献率”保持持续增长态势,其背后的重要原因是政府贯彻落实科学发展观,扩大内需、提高城乡居民生活水平,努力实现经济发展方式的转型。这样的原因解读,不仅让学生认识到政府根据经济发展的客观规律,充分发挥消费对经济的拉动作用,实现经济发展方式的转型,而且还能真正体会到政府在制定和实施消费政策时同样始终坚持提升人民生活水平、满足人民需要这一社会主义生产的本质与目的,从而有利于学生树立以人民利益为最高的价值标准和价值追求。学会筛选、分析、解读数据,是大数据时代生存发展的必备技能。普通高中教科书中的数据,作为一种教学资源,不应该只停留于浅显的阅读文本层次上。我们需要站在培养学生适应时代发展要求的新高度来解读,将知识、能力、情感态度价值观等目标融入经济数据的教学之中,让枯燥的、抽象的,甚至是呆板的、冷漠的经济数据富有灵性,充满情感。(责任编辑:刘丹)
大数据时代的数据管理 篇2
按照百度百科的解释, 大数据技术 (Big Data) , 或称巨量资料, 指的是所涉及的资料量规模巨大到无法通过目前主流软件工具, 在合理时间内达到撷取、管理、处理, 并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume (大量) 、Velocity (高速) 、Variety (多样) 、Value (价值) 。显然上述解释仅仅是描述了大数据的一些特征, 对于企业如何开发大数据、利用大数据进行运营管理, 并没有过过多的指导。
本文建议传统企业在建设大数据系统的过程中, 不仅要建设数据分析平台, 更要构建起一个数据分析的生态圈, 让人人都是分析师, 让数据分析渗透到企业运营的每个环节, 真正实现数据运营、科学决策的管理模式。构建数据分析生态圈, 可以概括为“两个市场, 一个平台”, 两个市场是指业务数据市场、分析工具市场, 一个平台是分析观点分享平台。
2 业务数据市场, 让业务数据变得开放透明
业务数据是分析的源泉, 没有数据就谈不上大数据。企业经过多年的信息化建设, 一般都会有多套业务系统在运行, 如办公自动化系统 (OA) 、财务管理系统、ERP系统等不一而足, 但这些业务系统都是孤岛式隔离, 数据缺乏整合, 而且底层数据库都是经过专业设计, 复杂度较高, 非厂家技术人员难以使用, 通常都是利用定制报表的方式进行分析和使用。因此, 在利用数据上存在着数据提取难度高、报表需求响应慢、数据准确性差等问题。
产生上述问题的原因在于, 传统数据结构复杂, 对业务人员不开放, 利用报表的方式提供数据时, 需求人员期望的数据与技术人员提供的报表之间存在着巨大的鸿沟。建设业务数据市场就是将各业务系统的数据进行抽取、清洗、整合之后, 按照业务过程重新进行整合, 封装为统一粒度、统一维度的数据库表。这些数据表的特点就是能被业务人员所理解并解读分析, 这样业务人员可以在较早期就发现数据中间存在的问题。在建设数据市场的过程中, 有几点需要特别注意。
(1) 采用维度建模方法, 以“易懂性、易用性”为原则
业务数据市场的数据是供企业分析人员使用, 他们更多的是不懂技术的业务人员, 数据结构应该符合多数人的直觉, 而非像传统“三范式”那样, 需要借助复杂的ER图才能表述清楚。对于专业的IT人员, 尤其是要抵制将维度模型设计成“雪花模型”以节省数据重复、增加灵活性的诱惑, 从而带来模型复杂性的代价。
(2) 全面梳理业务, 实现数据的互联互通
传统企业的业务系统, 多数是烟囱式的软件系统, 若不在企业层面进行业务梳理, 就不能很好地对数据进行整合, 提取有价值的信息。在整合数据的过程中, 必须要有统一的维度才能有效实现数据整合, 比如统一的客户编码、身份证号等, 所以梳理企业层面的统一维度是实现数据整合的关键步骤。
(3) 分主题、稳步推进
企业运营涉及的业务过程众多, 眉毛胡子一把抓是不可能的。在建设企业数据市场时, 要根据企业的特点, 优先建设对运营最重要的业务, 尽快投入使用, 逐步完善, 比如一个销售类的企业可以先将订单业务整合起来。
如图1所示, 采用维度建模方法构建中间层数据结构, 可以大大降低数据的使用难度。以事实表为中心的中间层模型, 可以让业务人员将主要精力放在理解数据和业务上, 避免过多的技术细节所带来的技术门槛和恐惧心理。
将生产库的交易数据转换为维度模型, 必然带来非常大的数据转换工作量, 因此ETL过程就成了整个项目成败的关键, 选择或打造一个性能优良的ETL框架是系统的核心。笔者建议可以从选择开源的ETL框架开始, 图形化的开发框架会给研发带来极大的便利, 降低学习成本。图2为图形化的ETL开发框架。
3 分析工具市场, 打造适合需要的分析框架
数据是一座金矿, 但还需要依赖好的工具才能将金子提炼出来。直接分析原始数据虽然灵活, 但更加适用于高水平的人员, 对于大多数的一线员工, 应该提供更加易用的分析工具, 如报表、图表、报告等, 将业务指标以形象的方式展现出来。分析工具市场就是企业内部汇集分析工具的地方, 提供给员工根据自身情况使用。
分析工具市场包含两部分功能, 一是制作分析工具的开发平台, 一是运行分析工具的门户平台。在建设分析工具市场的过程中, 有几点需要注意。
(1) 分析工具市场建设
从技术角度来看, 分析工具市场可以找到众多的软件系统满足需求, 企业可以根据实际情况, 或采购、或使用开源, 搭建这么一套软件系统, 既能让企业自己定制报表、分析图表, 也能将制作好的分析报表展现出来。
(2) 分析工具的开发以企业自身为主, 外购为辅
分析工具与业务特点、人员使用习惯等因素紧密关联, 其需求变化频率高, 全部依赖外部厂家开发, 一方面费用较高, 另一方面需求响应也不及时, 可能等开发出来, 分析的需求却没有了。因此企业要培养自己的开发队伍, 可以利用数据市场中的数据开发出各类查询报表、分析图表等。
分析工具是数据分析环节最成熟、也是选择性最多的环节, 有非常多优秀的BI工具可供选择, 商业中的有Cognos、SAP等, 开源的有Pentaho、BIRT等, 但数据可视化仅是数据分析的起点, 要想将数据价值挖掘出来, 还需要数据分析人员对分析工具进行深入分析, 提炼出知识并进行固化和传播, 才能让数据发挥价值, 形成从知识到洞察的转换。图3所示为数据可视化图标类型。
4 分析观点分享平台, 让数据分析社交化
大数据时代, 在数据充裕的同时, 带来了有价值分析结果的匮乏。数据分析, 绝对不是高高在上的阳春白雪, 而是需要人人参与、百家争鸣的氛围, 要在企业内部树立人人都是分析师的理念。
分析观点分享平台的建设, 采用类似于朋友圈、微博等社交媒体的机制, 让每个人都有机会表达对数据的分析观点, 通过转发、评论机制, 让有价值的观点浮上来。在这个过程中, 分享观点的个人可以获得成就感, 转发、评论的人有参与感, 企业从中获取到对运营决策有价值的想法, 基于数据分析过程实现了科学、民主的决策。在建设分享平台的过程中, 有几点需要注意。
(1) 人员关注机制
由于企业运营不同于互联网, 存在着一定的封闭特性, 不建议采用微博关注的开放性, 而应该采用朋友圈类似的“关注-同意”的朋友机制, 避免不适当的关注带来的信息泄露。
(2) 分享范围控制
由于企业数据的特殊性, 员工在分析观点的时候需要控制分享范围, 避免机密信息的泄露。控制分享范围, 既要有人工控制, 也要从平台层面通过权限控制, 如财务数据的分享范围仅限某几个部门或人员等。
(3) 分享观点排序算法
综合多种因素对发表出来的观点进行排序, 以便让展现到每个人眼前的都是最符合期望的内容, 营造一个良好的分享环境, 避免劣质内容驱逐优质观点给生态圈带来的毁灭性打击。
5 实践
根据上述思路, 我们规划了一个数据分析平台的产品, 分为三个阶段进行演进, 即智能报表阶段、企业内部数据整合和大数据分析三个阶段, 遵循“整体规划、分步实施”的路线。在实际推广中, 引导客户优先解决现阶段最迫切的问题, 比如统计报表, 通过经营分析平台的构建, 充分调动每个人的积极性和能动性, 减少定制化工作的数量及频率, 有效利用企业经营中产生的数据。图4是数据分析平台的技术架构图。
如图5所示, 数据分析平台的第一阶段是“智能报表”阶段, 其重点是建设数据中间层、提供灵活的分析工具, 让企业的每个人都能参与到数据分析的过程中。因此, 产品的技术架构也就围绕着这两个目标进行重点建设。
其中, 数据建模和数据集市所用到的方法论就是本文第一节所提到的“维度建模”, 将中间层数据通过上层的数据分析工具开放给用户进行分析, 最终通过报表、仪表盘等形式呈现给各级人员进行决策管理, 实现数据价值的体现。
6 结束语
大数据时代的数据观 篇3
有句英文:It's not a rocket science。意思是事情很简单,没有火箭科学那么复杂。大数据自有大数据的科学,它是比火箭科学更深的科学,自有那些比火箭科学家更牛的牛人来解决并最终为大众提供一个未来大数据应用的平台。至少在这个平台出现之前,我认为大数据和我们企业没有半毛的关系。
不过,我们可以不关心大数据,绝不是说我们可以不关心数据。
电子商务时代的营销革命性的一面,就是其数据的全面性。网站用户的每一个细微的行为,都会被记录下来作为我们所谓的数据资源,用来对用户的消费爱好与行为进行统计分析,并根据分析结果采取相应的市场措施。这是传统经济所不可想象的用户行为数据,确实十分令人激动。可是一些人一激动,就开始了无限的想象,把数据应用推向非理性。
这让我想起了电子商务刚刚开始时在美国出现的一对一营销(One to One Marketing),那也是被整个社会高调宣传的最新的营销理论,有人甚至说一对一营销是营销界有史以来可以与市场细分并列的营销革命。在大数据的大幕后面,隐藏的也是这个“一对一营销”的冲动和梦想:我们有足够的大数据来分析消费者的行为,通过大数据的分析,我们能够准确地预测用户的需求,所以可以通过正确的预测,向用户提供一对一的销售和服务,以提高我们通常所说的用户体验。
当初我有幸作为一个冷静的观察者对此理论进行了系统的分析,发现当年一对一营销创始人在其网站上所列举的9大成功案例没有一个是真正成功的!那么,一对一营销有什么问题呢?
首先,一对一营销有悖规模化经营的工艺质量成本优化原理。每个用户的消费爱好与行为都不尽相同,除非企业是为每个用户量身定制,除非用户愿意支付比大众化商品服务更高的价格,否则不可能真正做到一对一。
其次,企业不可能提供一对一的商品或服务。用户的消费需求千姿百态,任何一个企业都不可能满足所有用户的个性需求。如果一对一营销真的能够实现,它向用户提供的,并不是用户最喜欢的商品服务,而是企业所能提供的商品服务中用户最不讨厌的。
第三,一对一营销有悖市场细分的科学原理。因为不能提供全方位的商品服务,所以要通过市场细分来聚焦企业的商品和服务。抛弃市场细分的理论谈一对一营销,企业的营销一定会迷失方向:究竟哪个用户的需求需要满足,哪个用户的需求可以忽视呢?
第四,一对一营销可能也是不需要的。市场上提供的商品和服务,往往都是通过细分优化的结果,它一定应该满足“人以群分”的规律。例如我们制造的衣裤鞋帽只有有限的尺寸,绝不是“一对一”。根据一对一营销的理论,我们是不是需要对每个消费者都量身定制呢?
第五,或许有人会问:我们用“一对一”来预测用户的具体商品需求,这有什么问题吗?事实是,如果你懂得市场细分的统计学方法,就会了解,所谓的“一对一”营销,实际上是多个市场细分的结果,我称之为“动态市场细分”。
第六,一对一营销不可能达到理想中的一对一精准性。一对一营销理论以为,通过精密的统计分析,我们能够向用户提供其最需要的商品或服务。但事实是即使有大数据,统计学的预测也绝不像我们想象的那样精准,一对一的精准预测是很难实现的。
最后,互联网技术有比所谓“一对一营销”更有效的方法来提升用户体验。与大数据的统计分析预测相比,与用户互动让用户告诉你他需要什么肯定比任何数据预测更精准,只要你的活动不让用户讨厌;同时,用户浏览页面的内容相关性,也比根据其过去的购买浏览记录预测的结果更可靠。
电商数据的应用是个大题目,本文只能谈点皮毛。我对互联网时代的电商数据应用,有这样一些认识:
1.不要迷信大数据。现在一谈到数据就傍以大数据,甚至有人把美国传统超市的数据都拿来当做大数据渲染,让人不寒而栗;
2.数据很重要,要认真系统规划数据的收集、分析及应用;
3.不要为了数据而数据。数据的收集、分析及应用要业务导向,要以营销结果导向;
4.改进用户体验要依据数据分析,但不要盲目地希望通过数据的统计分析预测来改进用户体验,数据不是万能的;
5.在分析数据时,一定要以市场细分的理论为指导,更聚焦在用户的分类及如何提高聚焦细分市场的用户体验,切不可将用户看做是单个的个体来分析处理;
6.所谓“一对一”的用户体验,是通过多维的市场细分统计分析实现的,但不可迷信它的精准性;
7.在数据之外,互联网还提供了更多可能更有效的方法来提升用户体验。
最后一句话总结:数据很重要,但数据不是万能的。这应该是我们大数据时代的数据观。
大数据时代的思维 篇4
互联网思维与大数据思维有交集但又不重合。目前热炒的互联网营销案例,基本上剥离了大数据,更多是题材炒作和传播方式炒作。而大数据营销也不局限于互联网,它还包含了线下营销。
营销艺术与科学之辩
如何看待这两种营销思维?事实上互联网思维和大数据思维的PK,本质是关于营销的艺术和科学之争。一个流派认为营销是门艺术,只可意会不可言传;另一流派则把营销当作科学对待,通过对消费者行为数据的收集和分析,得出优化营销的策略。
互联网思维可以理解为三个关键词——体验、话题、传播。体验是消费者在使用产品或享受服务时体验到的感觉,以互联网媒介可以迅速将体验转化成话题传播出去,传播之后又引发新的体验,进而引发更多的话题及传播。
大数据实际上是营销的科学导向的自然演化。大数据思维有三个纬度——定量思维、相关思维、实验思维。
第一,定量思维,即提供更多描述性的信息,其原则是一切皆可测。不仅销售数据、价格这些客观标准可以形成大数据,甚至连顾客情绪(如对色彩、空间的感知等)都可以测得,大数据包含了与消费行为有关的方方面面;第二,相关思维,一切皆可连,消费者行为的不同数据都有内在联系。这可以用来预测消费者的行为偏好;第三,实验思维,一切皆可试,大数据所带来的信息可以帮助制定营销策略。
这就是三个大数据运用递进的层次:首先是描述,然后是预测,最后产生攻略。
一切皆可测:迪士尼MagicBand手环
美国迪斯尼公司最近投资了10亿美元进行线下顾客跟踪和数据采集,开发出MagicBand手环。游客在入园时佩戴上带有位置采集功能的手环,园方可以通过定位系统了解不同区域游客的分布情况,并将这一信息告诉游客,方便游客选择最佳游玩路线。此外,用户还可以使用移动订餐功能,通过手环的定位,送餐人员能够将快餐送到用户手中。利用大数据不仅提升了用户体验,也有助于疏导园内的人流。而采集得到的顾客数据,可以用于精准营销。这是一切皆可测的例子,线下活动也可以被测量。
一切皆可连:网上订餐追踪系统
一家做订餐配送的互联网企业,在送外卖的自行车和汽车上安装一套软件和追踪系统,从配送外卖中采集了大量数据,如谁订了什么外卖、经过什么路线、到了谁的家里……而通过对数据的分析,可以得出哪家餐馆的什么外卖比较受欢迎,最快捷的路径是那一条等,在此基础上为商家提供备料建议,并规划一条合理高效的送餐路线。利用分析表面看似无关联的大数据,公司能够提供优化餐馆运营的增值服务。
一切皆可试:电商页面推荐功能
电商购物中,商品页面的其他产品推荐是个重要的功能(例如“买过该商品的人还买过XXX”)。如何量化和优化推荐功能的效果?有研究机构做了这样一个测试:按顺序向用户推荐全部/屏蔽部分推荐/屏蔽所有推荐,经过一个月测试之后,跟踪被测试对象的购买情况,发现不屏蔽推荐的短期效应最高,购买量最多。而屏蔽所有推荐的效果要优于屏蔽部分推荐。而原先购买过商品的消费者在被屏蔽推荐之后,商品的销售额下降更快,因而可以得出推荐功能对有忠诚度的客户作用更大。更有趣的是推荐功能的长期效果。研究发现,不论首次购买过程中用户是否购买了推荐商品,第二次的访问情况都遵循这一规律:未被屏蔽推荐的顾客中,10%的人会再次访问,被屏蔽推荐的访问率是9%,而实际转化成访问的次数是8%,如果再结合老顾客推荐效果会更好,最后会产生超过10%的营收提高。总体看来,推荐的效果更可观。
从描述到预测,再到产生攻略
社交网络分析跟踪,将消费者社交网络上的关键词频率转化为可视化表达,对消费者进行分类,进而做针对目标客群的精准营销,这是大数据营销的描述阶段。
预测阶段的案例是对信用卡使用情况的研究。原先每家银行只能看到消费者的本行刷卡记录,银行据此消费记录对客户实行奖励。其中存在的问题是,客户使用非本行信用卡的消费情况无从知晓,银行无法了解客户的实际消费情况,哪些是隐藏的“消费大户”。解决这一问题的难点在于,他行的数据记录很难获得,因此研究机构就使用第三方零售商调研的数据,通过建立模型,将两种数据融合,再对消费者的实际消费情况进行预测。模型中原先可能年消费只有-3000元的消费者,实际消费达到了4万,这些人成了非常有潜力的银行客户。
在攻略阶段,银行可以根据预测结果调整客户奖励政策,例如给年均消费3000元的客户提高返点,或者提供更丰富的积点兑换产品等,使这部分人群变成银行的忠诚顾客。
东方智慧与西方知识不可偏废
互联网思维如何PK大数据思维?“互联网时代”这个词在中国特别火,但在美国还未听说。这是因为互联网思维更契合传统东方思维方式。东方文化强调智慧,而西方更强调知识,智慧来源于经验,而知识来源于数据。诸葛亮和司马懿是一组典型的智慧PK知识的代表。司马懿是诸葛亮的最大对手,他可能是早期的大数据最佳应用者。从诸葛亮几点睡觉,吃几碗饭,他就能判断诸葛亮活不长了;而诸葛亮则凭借智慧猜出司马义胆子小,不敢进入空城。中国人崇尚智慧,可能更注重互联网思维,但光有互联网思维还不够,还要对数据有更深的认识和更好的运用。
大数据思维不像互联网思维那样令人热血沸腾。最近一项研究表明,采用大数据的公司比不采用大数据的公司利润平均高6个百分点。6个百分点也许不那么起眼,但“积少成多、聚沙成塔”,在激烈的竞争环境中,这是可以让企业生存下来、脱颖而出的资本。在美国排名前十的电商网站中,8家是传统零售商,只有2家是纯电商(亚马逊和易贝)。传统零售商拥有大量数据——沃尔玛一天的数据量达到PB级,这个数据资源能够转化为企业赢得比赛的耐力。由于大数据时代有内在的使从企业从做大到做强的反馈逻辑,企业做大之后会产生更多数据,对消费者的理解也就更深刻,营销更精准,企业变得更强,然后会产生更多的数据,从而形成正面反馈,这是一种最终的数据驱动成长模式。
运用大数据来指导营销决策,是许多并购战略的内在逻辑。
最理想的状态是科学与艺术的结合。可穿戴运动相机制造商GoPro的上市,就是大数据思维和互联网思维结合的成功案例。这家原本只生产实体相机的公司,先是开发出了带有WIFI功能的相机,用户可以将拍摄的照片和视频即时分享到互联网,内在的逻辑是从体验到传播再到分享的互联网思维;此后GoPro进入大数据的分析运用阶段,对用户拍摄的内容进行分类,将内容和潜在的广告商匹配。此外,GoPro还购买了电视频道的转播权,通过数据分析哪些时段适合播放什么内容,再与广告匹配,实现精准营销。GoPro从一家实体相机生产商,拓展出了社交平台,甚至是媒体的功能。
大数据时代舆情管理的三大变革 篇5
要点:随着互联网的迅速发展,大数据带来的信息风暴正在改变我们的生活、工作和思维。无论政府和企业,对网络舆情的分析研判应对,正面临着大数据的挑战。
大数据,正由技术热词变成一股社会浪潮乃至国家战略。
随着互联网的迅速发展,大数据带来的信息风暴正在改变我们的生活、工作和思维。无论政府和企业,对网络舆情的分析研判应对,正面临着大数据的挑战。在大数据时代,对网络舆情管理必将在管理思维、工作模式、技术方法等领域发生重大变革。
一、大数据时代的舆情管理工作变革
(一)社会治理与舆情管理
2011年全球被创建和复制的数据总量为1.8ZB(10的21次方),其中75%来自于个人,远远超过人类有史以来所有印刷材料的数据总量(200PB)。过去几年全世界产生的数据量甚至超过了历史上2万年来产生的数据量的总和。我们的世界正在被数据化,一切皆可“量化”,数据“取之不尽,用之不竭”。这带来了更大的管理问题,信息爆炸与信息对称。比如,环保部门投入巨资监测环境数据,构建环境物联网,尽力还原真实环境治理现状的实时的基础数据库,以辅助决策治理。但是公众常常通过手机拍摄雾霾天气或是污染现场,并且在网络上快速传播。环境监测公示数据与网民环境感受,一旦不能形成对应,势必产生负面情绪。
(二)从重视到行动
新形势下,网络舆情管理,亟需新的工作体系与之匹配。通过成立本单位网络舆情管理小组、制定相关制度,培养专业人才,结合第三方专家顾问,建立健全网络舆情管理工作体系。从而,以维护群众的权利来树立政府的权威,倾听民意进行科学决策。
我们看到,有一些政府机构已经逐步摸索形成了这样的舆情管理的责任机构,网络舆情管理小组,值得借鉴。单位主要领导担任小组组长,单位下属各部门确定专人为小组成员,并分别组成监测,分析,应对等职能部门。制定舆情管理工作制度,做到网络舆情工作有章可循,完善网络舆情的联动应急机制。加强信息公开和第三方顾问,善用互联网思维模式,通过新媒体多种形式和手段,信息公开,倾听民意,疏导舆情。
二、大数据时代的舆情管理思维变革
(一)认识与转变
在10年前,我们将互联网称为“虚拟世界”。在今天,网络“虚拟世界”正在向“镜像世界”转化。虚拟世界的匿名性、非对称性、非真实性,正在转变为镜像世界的对称性、真实性(真实的画面、真实的情感等)、即时性。在全球范围内,大到国家社会治理,小到企业经营个人形象,都受到了网络舆情的影响和改变。在这种情况下,对网络舆情的管理思维必然发生改变,这种改变可能会带来政府舆情管理相关行政职能的改变,面对网络舆情的行政流程的改变,政府信息
公开速度和透明度的改变,信息发布的效率和方式的转变。这种改变应上升为社会治理体系的一个重要组成部分。
(二)创新管理,融入网络
舆情管理从流程上看包括是监测、发现、研判、应对。但是,在网络舆情面前,是不是拥有这样的流程就能够从容应对呢?问题还是大量存在的。这和我们大多数政府企业的管理模式相关,我们看到,很多单位的舆情工作只是一个或几个工作人员负责,或者一个部门负责,发现问题的处理办法是层层上报,由领导批复处理。实际上,这样的模式与网络舆情管理是不吻合的,难以做到全面分析,准确研判,及时应对。那么,如何创新舆情管理的模式呢。舆情管理,应自上而下,形成一整套全新的工作体系。一把手总负责,全员转变思维模式。充分借助大数据技术分析力量,和第三方专家顾问力量。敢于接受网络曝光和检验,融入网络,充分在网络空间展示形象。这样才能消减物理与文化空间的矛盾和区隔。
三、大数据时代的舆情分析技术变革
(一)移动互联网将再次改变舆情格局
据最新数据,我国手机上网网民突破5亿,80%的手机网民使用手机看新闻。各大互联网门户网站,纷纷在移动新闻客户端上发力,大有形成第四大互联网入口的趋势。随着4G网络的普及,视频类应用将迎来新的爆发,视频的真实感将更大的拉近网络空间的距离感。移动互联网的每个信息发布节点,将是每一个网民,全民麦克风的时代即将爆发。在这个背景下,网络舆情将会演变为何种格局,大数据
分析技术在哪些方面还能拥有用武之地?这一领域,势必会迎来新的技术突破与应用。
(二)用大数据预判舆情趋势
《大数据时代》的心得体会 篇6
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。
第一个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。也就是说样本等于总体;
第二个转变是对研究数据不会追求精度,而且追求混杂性,小数据时代下,追求精确度是合理的,因为我们收集的数据很少,所以要越精确越好,包括如今仍然也在使用这种办法;但是在某些时代,尤其是在大数据时代背景下,快速获得一个大概轮廓和发展脉络,要比精确性重要得多,既然选择了整体性,肯定要忽视细节和确定性;
第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。
这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。
这本书给我感触最深的就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。
首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。
这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。
第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像Candide那样精确地翻译每一句话,它谷歌翻译之所以优于IBM的.Candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。
而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。
一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。
过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。
数据挖掘—大数据时代的重要工具 篇7
关键词:数据挖掘,大数据,信息
随着互联网与信息技术的发展,数据已经渗透到当今每一个行业和业务职能领域,数据的爆炸性增长预示着“大数据”时代已经降临,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,都将开始这种进程。数据挖掘正是这一进程进步发展的重要力量。
1. 数据挖掘的定义
数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息,即从大量的、不完全的、有噪声的、随机的、模糊的数据中,提取隐含其中的、规律性的、人们事先未知的、但又是潜在的有用信息和知识的过程。数据挖掘是一个在海量数据中利用各种分析工具发现模型与数据间关系的过程,它可以帮助决策者寻找数据间潜在的某种关联,发现被隐藏的、被忽略的因素,因而被认为是在这个数据爆炸时代解决信息贫乏问题的一种有效方法。
数据挖掘作为一门交叉学科,融合了数据库、人工智能、统计学、机器学习等多领域的理论与技术。数据库、人工智能与数理统计为数据挖掘的研究提供了三大技术支持[1]。
2. 数据挖掘的过程
数据挖掘的最终结果是从大量数据中发现可用的知识,这一过程一般包括数据准备、数据挖掘、结果表达与解释三个阶段,如图1所示。
数据准备是数据挖掘中的关键一环,它直接影响到数据挖掘的效率、精准度以及所得模式的有效性。该阶段可分为数据集成、数据选择、数据预处理三个子阶段。数据集成是把多个不同的数据源合并处理成一个共同的数据源,清洗脏数据、处理数据中的遗漏、解决语义模糊性等。数据选择就是决定并选出需要分析的数据,即目标数据,缩小处理范围,提高数据挖掘质量。数据预处理通常包括消除重复数据、消除噪声、遗漏数据处理、数据类型转换等,目的是把数据处理成适合于数据挖掘的形式,并在数据选择的基础上对挖掘数据做进一步的约简,减少内存资源和处理时间,使挖掘更有效。
数据挖掘是根据数据特点和结果知识表达方式选定某一适合的数据挖掘算法(分类、聚类、回归、关联等算法),把数据中潜在的有用的模式搜索出来。它是整个挖掘过程中最为关键的一步,也是技术难点。
结果表示是把所有最终经挖掘发现的知识直观地通过可视化技术展示给用户,以帮助用户理解和解释数据挖掘的结果。若结果不能满足挖掘任务的需要,则需要重新进行以上的挖掘过程。
在理解数据挖掘过程的这三个步骤时,应注意以下几点:第一,数据挖掘只是整个挖掘过程中的关键一步;第二,不但所选用的数据挖掘方法可以影响挖掘质量的好坏,所挖掘数据的数量和质量同样会决定挖掘结果的成败。如果在挖掘过程中选取了不适当的甚至是错误的数据,或者是对数据进行了错误的处理,挖掘结果都不会成功;第三,整个挖掘过程是一个不断反馈、循环往复的过程。例如,在挖掘过程中用户发现由于目标数据或者是挖掘方法的原因而产生了不理想的挖掘结果,此时都需要重复以前的挖掘过程,甚至重新开始;第四,在数据挖掘的每个阶段,可视化技术都起着重要作用。在数据预处理阶段,为了更好地选取目标数据,用户需要对所选数据有一个初步的了解,此时可以用直方图、散点图等统计可视化技术来显示相关数据;在数据挖掘阶段,用户可根据具体研究领域的不同选择相关的可视化工具;在结果表示阶段,可视化技术的选择应该考虑到可以使发现的知识易于表达和理解[2]。
3. 数据挖掘的功能
数据挖掘功能一般可以分为预测和描述两类[3]。预测性挖掘是对目标数据进行推算处理,进而达到预测的目的。描述性挖掘则是用来刻画目标数据集合的普通特性。概括起来,数据挖掘功能主要包含以下几个方面:分类、聚类、偏差检测、概念分析、概念描述、信息摘要、关联分析、时序演变分析和元数据挖掘。
数据挖掘功能一般是与目标数据类型相关联的。一些功能可以用在多种不同的数据类型上,而一些功能只能用在某一特定的数据类型上。因此在确定数据挖掘任务时,必须综合考虑目标数据类型、数据挖掘功能和用户的兴趣。
4. 数据挖掘的应用
由于数据挖掘可以从大量数据中发现原来未知的信息和知识,在当下的大数
据时代,它给庞大的数据资源赋予了新的含义,它们不再是难以处理的垃圾,而是不可或缺的资源。以下主要从三个方面介绍数据挖掘在一些领域中的应用。
(1)在DNA分析中的应用
将基因的编码序列和非编码序列进行区分是进行基因研究的基础,两种序列的区分不但需要大量的实验,而且需要繁重的计算,所以在区分准确度和分类方法上如果能够有所提高,那么对于基因研究的贡献无疑是巨大的。将编码序列和非编码序列进行区分实质是一个分类问题,分类问题在数据挖掘中已经有了很多研究,可以使用比较成熟的分类算法对两种序列进行区分。
某些疾病不只与单个的基因有关,而是某几种基因组合起来共同作用的结果。此时可以利用数据挖掘中关联分析的方法确定在目标样本中同时出现的基因种类。由此人们可以发现各基因组以及基因之间的关系。
(2)在金融业中的应用
由于业务需要,金融业需要收集整理大量数据,这些数据通常比较可靠、完整和高质量,跟踪分析这些数据可以发现隐含其中的数据模式及特征,并由此得到某个客户或组织的金融和商业兴趣,进而察觉到金融市场的变化趋势。数据挖掘在金融领域中的应用主要包括数据清理、金融市场分析与预测,账户分类、银行担保和信用评估等。
(3)在市场业中的应用
数据挖掘技术应用在市场业主要体现在对消费者行为分析和对市场定位上。它基于市场营销学的市场细分原理,假定“消费者过去的行为是其今后消费倾向的最好说明”。通过收集处理有关消费者消费行为的大量信息,掌握特定消费个体或群体的消费倾向、消费需求和消费习惯,从而确定相应个体或群体下一步的消费行为,并以此为基础,对所识别出来的消费人群进行针对性极强的特定营销,这与传统的不针对特定消费人群的大规模营销手段相比,为企业大大节约了营销成本,获得了更好的营销效果,也增加了企业利润。
5. 数据挖掘的发展
数据挖掘的研究如日中天,目前,国内外很多公司、大学和研究机构都非常
看好数据挖掘的发展前景,并且在这个方面开展了深入研究。今后研究的热点可能有:数据挖掘与数据仓库相结合的研究,数据挖掘与数据仓库一体化的研究;对各种非结构化数据,如:多媒体数据、图形图像数据和文本数据的挖掘;研究Internet上的数据挖掘方法;研究专门用于知识发现的数据挖掘语言。
数据挖掘满足了大数据时代用户对信息的需求,随着大量的基于数据挖掘的面向用户的决策支持产品的不断问世,数据终将与能源、物质一样成为人类不可或缺的重要资源,也只有到那时,信息时代才会真正到来。
参考文献
[1]朱玉全,杨鹤标,孙蕾数据挖掘技术[M].南京:东南大学出版社,2006.11
[2]朱明.数据挖掘(第二版)[M].合肥:中国科学技术大学出版社,2008.11
大数据时代的数据管理 篇8
除了对一二三产形成影响外,块数据的出现也在创造基于服务自身需要的产业链条,这个产业链条有两种分类:一种是从“硬件”上来讲,就是构建一整套产业体系;一种是从“软件”上来讲,就是诞生新的商业体系。
新的产业体系
基于块数据的产业几乎涉及信息基础设施建设、硬件终端设备、软件应用等各个层级,构成了一个完整的产业体系,而且它还具有一个很鲜明的特点,就是对一个地方既有的产业基础要求相对不高,而对当地的生态环境、资源禀赋、地质条件等则有较高要求。这对于在传统制造业发展时代落后而生态良好的城市和地区来说将是一轮新的发展机遇。
一般来讲,要推动产业链建设,基本的发展策略是“抓两头促中间”,即一手抓数据中心,一手抓呼叫中心,促进大数据核心产业的发展;“抓平台促开放”,即大力推动大数据公共平台建设,促进政府数据的开放和共享;“抓产业促发展”,即拓展大数据在工业、农业和服务业的深入应用,促进大数据产业发展;“抓软件促硬件”,即推进智慧城市信息系统的集成与应用,带动集成电路、网络设备、服务器、安全产品、智能终端等硬件的生产。
新的商业模式
如果把数据作为一条贯穿整个大数据产业发展的主线,那么,块数据产业发展的一种思路就是以建设全城、全覆盖、全免费的WiFi 系统为基础,实现大数据,尤其是“块上”数据的集聚,推动互联网产业的发展和大数据交易市场的形成,最终建立完整的互联网金融产业体系。具体可分为以下3个阶段。
一是建设一张覆盖全城的特殊局域网,通过特许经营等方式,降低管道、光纤等基础设施的建设与运营成本,并对WiFi 提供有力支撑。在此基础上,形成城市的互联网主入口,聚集访客量和浏览量,不断拓展规模,推动“块上”数据的快速积累,形成社会数据汇聚。
二是要通过政府数据开放和企业数据有偿共享,搜集形成城市的大数据汇聚平台;建立大数据交易市场体系,以商品化的方式推动大数据的交易和流通,通过免费和市场两种方式来实现数据的敞开供应,然后,在海量的数据中寻找和分析数据化的活动轨迹,挖掘提炼数据价值。
三是在实现块数据持续聚集、流动的基础上,实现数据与产业的深度融合,进而推动整个产业结构的优化升级,特别是推动互联网金融等新兴业态的发展。
这3个层次体现了形成块数据并发现块数据价值的基本过程,它们之间并不是相互割裂的关系,而是互相影响、共同推进,由于无线城市、大数据交易市场和产业应用都已在前文做过阐述,这里重点介绍互联网金融业态。
互联网金融是近两年才提出来的一个概念,特别是伴随着余额宝用短短10 个月时间积累到5000亿元巨额资金的现象级事件,让互联网金融迅速蹿红。从块数据的角度来讲,由于块数据带来每个行业条状数据的记录,直至对整个区域、各个领域、全部行业、所有自然和人文现象的记录、分析、挖掘,让金融企业可以在通过抵押、质押、担保等传统手段控制风险的老路子之外开辟一条新路。即可以根据企业的日常经营状况,包括销量、现金流、盈利等;个人的生活状况,包括以往贷款还款记录、信用卡使用状况、违法犯罪情况、个人财产状况、个人健康状况等,去全面衡量贷款主体的信用。与传统的银行采用的风险控制技术相比,大数据让风险控制技术成本更低,更接近客户真实的信用状况,而且不需要实物抵押。当互联网和大数据结合起来,就能够让企业比客户自己更接近客户、更了解客户,传统金融所拥有的信息优势、风控优势、资金优势都将大打折扣。这可能带来以下几个场景。
开辟新的超级市场 阿里金融也好,余额宝也好,其服务的对象都是散户、中小微企业这些传统金融行业因为利润率不足、风控手段有限等原因而放弃的群体。马云曾经讲过,传统银行服务的是20%的高端人士,而互联网金融服务的是剩下80%的普通人士。试想,对于单笔以百、千为单位的贷款,如果让银行去做,基本上是亏损的;而对于以1元为起点的基金认购,放给任何一家传统基金公司来做赢利恐怕都不现实,这就给了互联网金融在夹缝中生存和发展的机会。而互联网聚沙成塔、滴水成海的特点又将这些单独的看起来赢利空间有限的金融业务不断放大,最终可能造就一个万亿级的新市场。
创造新的金融业态 如果说产业革命的起点是科技创新,那么顶端就是金融创新。凭借着对大数据的运用,新的金融业态不断产生,并对传统金融行业产生巨大的挤压甚至是颠覆效应,比如,第三方支付、P2P平台、互联网理财和电子货币的发展就正从支付领域、信贷领域、股权融资等各个方面对业已形成的传统行业进行再造。其中第三方支付作为发展最早的互联网金融业态,到2013 年已经达到10 万亿元的规模,涉及货币汇兑、互联网支付等各种业务类型;P2P作为网络信贷的中坚力量,已经发展出线上线下融合,并提供担保征信的具有中国特色的新的金融业态;而众筹这种全新的融资方式为解决某些金融难题提供了新路径。举个例子,对一些以往一般投资者难以参与的大型基础设施建设,如高速公路修建等,普通民众将可以以小额投资的众筹方式参与,既拓宽了居民投资渠道,又破解一些地方特别是中西部地区基础设施建设的融资难题。可以说,到目前为止,所有传统金融业态都已经有了网络版,而且这个网络版还是效率、便利程度、收益的升级版。
衍生新的金融需求 伴随着虚拟经济的发展,网络上各种虚拟财产的保护、基于电商的物流配送以及各类资产的定价、交易、保护等,为证券、保险、银行数据信托等行业提供了新的市场机会,特别是在块数据时代,一些新的需求应运而生。比如数据期货,把某个省份全部教育数据搜集起来,然后通过标准化,做出一个期货产品,放到数据期货市场上去,依靠市场的力量进行交易,这当然有很大的风险,也还有很多问题需要解决,却很有可能在未来的某一天成为现实。可以预计,数据保险、数据信托、数据银行、数据结算等都是数据市场所需要的金融服务。
本文节选自《块数据——大数据时代真正到来的标志》,文字有删节。
【大数据时代的数据管理】推荐阅读:
大数据时代的数据观05-14
大数据时代的数据挖掘09-26
大数据时代的教育10-25
大数据时代的人才管理05-11
大数据时代的媒体融合05-13
大数据时代的企业决策05-14
大数据时代的终端安全05-15
大数据时代的应用研究06-12
大数据时代的思维变革06-16
大数据时代的CFO07-04