大数据时代的电影业

2024-10-21

大数据时代的电影业(共12篇)

大数据时代的电影业 篇1

大数据时代为电影产业的发展提供了创新的路径, 为电影产业的未来发展指明了方向。电影产业应该明确了解大数据时代的优势, 合理利用大数据时代的机遇, 正视互联网对电影产业的挑战。电影产业在未来发展中, 深挖大数据时代中的价值, 促进电影产业的发展。大数据背景下的电影产业, 在机遇和挑战中构建发展的平台。目前, 电影产业处于激烈的竞争状态, 如何利用大数据时代, 成为电影产业发展中重点考虑的问题。

1 大数据时代对电影产业的影响

现代大数据时代的到来, 数据在电影产业中占有重要的地位, 是一项不可忽视的资源。电影产业是一项传统的行业, 大数据时代的初期兴起, 对电影产业造成了一定的影响, 分析如下。

1.1 产业多元化

传统的电影产业是单一的, 受到大数据时代的影响, 电影产业朝向多元化的方向发展。大数据时代冲击下, 互联网成为承载电影的主要平台, 如:网络电影、微电影等, 近几年, 非传统的运营商层出不穷, 添加了电影产业的竞争关系, 消费者对互联网的追求, 对传统电影载体有一定的冲击, 可见产业多元化对电影产业的影响[1]。产业多元化, 虽然加重了电影产业的竞争力, 但是也拓宽了电影运营的途径, 通过多方渠道提供消费平台。

1.2 整体稳定性

大数据时代在电影产业中引入了分项的产业, 电影产业的整体稳定受到很大的影响, 当大数据技术自身作为一部分加入到电影产业中, 也就意味着电影产业会在整体稳定性方面做出变革, 必须系统地维持产业的稳定。传统电影产业在发展中, 必然会受到大数据的影响, 如何抓住机遇并面临挑战, 成为电影产业关注的问题。基于大数据时代的电影产业, 应该在技术、营销、处理等方面进行变革, 维护产业的稳定发展。

2 电影产业在大数据时代下的变化

电影产业在大数据时代下的变化, 主要体现在商业模式、数据分析两个方面, 均对电影产业造成很大的影响。

商业模式注重电影产业中的产品服务, 可以控制电影产业链和电影市场, 在大数据基础上的商业模式, 为电影产业提供海量的数据, 能够降低电影产业链中数据统计的难度[2]。例如, 电影《港囧》, 其在上映之前, 已经有数据公司专门预估了《港囧》电影的票房, 分别给出10亿、15亿和20亿的票房数据参考, 数据公司的票房参考信息, 可以给电影的上映提供指导, 电影行业可以挖掘出更有价值的商业信息, 促进商业模式的信息化发展, 保障电影的前瞻性。

数据分析是大数据技术的核心, 其在电影产业中占有重要的地位, 成为电影产业的一个项目, 专门为电影产业链提供相应的数据。数据分析在电影产业中, 改变了行业的分析方式, 更加注重数据的加工, 筛选海量的数据信息, 应用到电影产业中, 而且数据分析对电影产业的改变, 不仅体现在表面, 也表现在电影产业的实质中, 确保电影产业跟上时代的发展速度。

3 大数据时代电影产业的机遇

大数据已经成为现代电影产业的背景, 电影本身是一类系统的产业项目, 其中涉及到多利益, 受到大数据的影响, 所以大数据带来的机遇, 为电影产业的发展提供必要的条件。下面结合现代电影产业的状态, 分析大数据提供的机遇。

3.1 市场定制

大数据时代下, 电影行业可以利用互联网分析消费者的需求, 按照市场定制电影类型。近几年, 电影市场朝向多元化的方向发展, 主要是通过大数据, 调查消费者的喜好, 进而确定电影的发展方向。大数据提倡电影的多元化发展, 不同消费者的需求不同, 多元化的定制方式, 能够满足消费者的多种需要, 丰富电影结构[3]。市场定制的影响, 将消费者的行为、心理搬上荧幕, 广泛受到消费者的好评。大数据提供的市场定制机遇, 强调了“消费者”、“心理需求”、“个性选择”等关键词, 直接拓宽了电影产业的范围, 不局限于某一个拍摄题材, 促进了电影产业的发展。

3.2 规范投资

投资是电影产业发展中最为关注的项目, 投资中含有较高的风险, 也是体现电影价值的一项因素。在电影市场中存在投资人不获益的情况, 因此, 大数据时代为电影产业的投资提供了规范的手段。在电影未投放到电影院之前, 通过大数据计算, 可以掌握设计、定位、广告等方面的基本费用, 投资人参考数据后, 理性地进行投资, 将电影产业的投资转型为“数字驱动”, 同时还能规范电影产业的整体投资市场, 保障投资人的利益回报。

3.3 衍生产品

衍生产品在电影产业中逐渐成熟, 其中不可忽视大数据时代提供的机遇。大数据为电影衍生品提供了销售的途径, 满足大量消费者的需求, 促使衍生品成为电影市场中的重要产业链。例如:胡巴、小黄人等, 都是畅销的电影衍生品, 大数据在衍生品中, 提供了线上销售的机遇, 而且也是由于衍生品的存在, 带动了电影的发展。电影市场通过数据分析, 向消费者提供衍生品, 表明现代电影对消费者的重视, 消费者自身可以感受到电影行业的进步, 拉近了两者的关系。

3.4 营销策划

网络营销是大数据时代带动电影发展的一项手段, 经过大数据的分析, 电影发行商掌握消费者的喜好, 准确定位电影市场, 很好地抓住电影的卖点。营销策划中, 利用了大数据对消费者的调查, 影片在发行前期, 发行人通过大数据技术, 了解了该影片的目标人群、年龄范围以及消费水平, 从而制定恰当的营销策略。例如:《大圣归来》电影的营销策略, 大数据调查了不同的消费群体, 70%是年轻化的消费群体, 其营销策划中, 主要传播四项要素, 即:有情怀、有格调、有态度、有诚意, 利用微信营销和微博营销的方式, 为营销策划提供平台, 电影未播出前, 已经出现了大量的口碑评价, 已经成为《大圣归来》影片良好开端的标志。

3.5 利润分享

利润分享是电影产业的发展方向, 随着大数据时代的到来, 电影产业按照消费者的需求, 改进了商业模式, 提升了经济效率。在大数据时代中, 电影产业选择利润分享, 确保了经济利润分配的公平与公正, 发行公司、投资方等, 均可分到相应的利润, 以经济为基础, 电影产业链上的各个环节, 都可以处在优质的状态, 由此为电影行业提供高水平的支持。

4 大数据时代电影产业的挑战

大数据时代为电影产业创造机遇的同时, 也带来了诸多挑战, 电影产业为了立足传媒行业, 必须准确地判断电影市场, 将大数据时代的挑战, 转化为发展的动力。

4.1 创作挑战

电影在创作上, 比较重要的一点是创新, 以特殊的视角向消费者展示故事情节, 并不是单纯依靠大数据就可以完成的。虽然大数据技术可以分析消费者以及电影市场, 但是并不能决定电影的细节及制作, 在电影创作上形成很大的挑战。大数据推动了电影产业的发展, 电影人可以参考大数据, 制作时还要做到创新。目前, 多数电影人会担心大数据带来的创作挑战, 部分电影人过分利用大数据, 忽视了电影制作的本质, 导致电影创作停滞不前, 严重缺乏技术性[4]。现代大数据时代下的互联网公司参与电影的选择, 增加了电影创作挑战的压力, 间接减少了电影中的创作成分, 进而降低了电影产业的价值。

4.2 时效挑战

大数据时代对电影产业的时效挑战, 是指电影行业通过大数据技术, 获取了大量的数据, 盲目地分析电影数据后, 预估市场价值, 体现了大数据的预见性, 实际大数据是在以往发生事件的基础上, 为未知事物进行分析, 最终的分析结果不代表是必然事件, 而且在大数据操作的过程中, 时间发生变化, 大量数据达不到时效的要求, 如果电影产业对大数据技术的利用不当, 即会影响电影产业的未来发展, 致使电影产业陷入到危机状态。因此, 电影产业在面对大数据时代时, 需要明确时效方面的挑战, 参考大数据分析, 同时考虑各项数据存在的滞后性特点, 有选择地进行数据应用。

4.3 优化挑战

大数据技术在电影产业中, 了解了消费者自身后产生数据, 而且各项数据均是按照消费者的价值设定, 分析数据出现机械性、非客观的特点, 实际缺乏优化。例如:电影行业获取海量数据, 数据中包含了所有需要的元素, 如果电影行业没有能力甄别、筛选, 海量数据可能会掩盖电影产业需要的真实信息, 因而电影行业无法掌握消费者的心理需求。机械数据的存在, 对电影产业提出了新的要求, 促使电影产业面临着优化挑战, 将电影作为产品, 通过数据优化的方法调整产品所需的数据, 以消费者为中心, 挑选可用的数据。

5 电影产业在大数据时代下的发展

电影产业在大数据时代下的发展, 越来越精细化, 在机遇和挑战并存的时期, 电影产业同样可以找准发展的关键。在大数据环境中, 电影产业的重点放在消费者方面, 充分体现人性关怀, 电影是群体的延伸, 通过电影表现人的群体, 而电影所需的素材, 需要大数据技术的归纳与总结。

大数据时代对未来电影产业的影响, 虽然有一定的风险, 但是潜在发展的机遇, 促使电影产业在竞争中学会求生存, 在坚守电影本质的基础上, 寻找到创新的元素, 融入到电影产业中[5]。电影产业要充分利用大数据技术提供的环境, 创建具有发展力的环境后, 不断提升电影的价值, 同时注重价值的挖掘, 将大数据技术应用到电影行业的各个产业链内, 推进电影产业的良性发展, 满足社会及消费者的需求, 彰显大数据时代下电影产业的优势。

6 结语

大数据时代的成熟发展, 势必影响电影产业的发展, 面对大数据时代影响下的电影市场, 产业应该衡量机遇和挑战, 稳定地占领电影市场。电影产业可以将大数据作为一项工具, 利用互联网提高电影产业的经济效益, 促进电影产业的市场化、国际化发展, 既可以通过大数据促进传播, 也可完成国内外电影产业的互动和交流。电影产业在大数据时代引领下的机遇和挑战, 都是电影产业发展中不可缺少的因素, 可以辅助电影产业发挥各项功能, 提高电影产业的绩效, 由此可见, 机遇、挑战的存在, 推进了电影产业的未来发展。

参考文献

[1]唐瑶.新媒体时代中国电影营销的问题与对策[D].辽宁大学, 2012.

[2]刘婧.大数据时代下中国电影营销的问题与对策[D].兰州大学, 2014.

[3]童杨帆.大陆微电影发展现状与产业化路径探析[D].西南交通大学, 2014.

[4]朱永德.网络2.0时代电影版权面临的挑战、机遇和对策[N].中国电影报, 2009-11-19.

[5]张彦华.大数据时代国内传媒产业的挑战与机遇[J].现代传播 (中国传媒大学学报) , 2013 (11) .

大数据时代的电影业 篇2

数据库管理形式是大数据管理不断发展的重要成果,也是到目前为止最后的一个阶段。在计算机技术不断发展的过程中,计算机内部的容量得到了很大程度的提高,并且大数据的管理和维护成本也相应的有所下降。同时,在大数据管理形式不断发展的过程中,对其系统管理内存不足等现象,进行了全面的提高,有效的实现了资源共享,也在最大程度上保证了大数据的安全、稳定等性能。另外,在大数据时代的大数据库管理的过程中,不在近几年只是固定在某一个计算技术应用体系,而是面向整个管理体系,以此在最大程度上提高了大数据共享的性能,使大数据与大数据形成一个独立的个体,对其大数据进行了全面、有效的、统一的管理,为我国信息技术的发展提供了重要方向。

“大数据”时代的大智慧 篇3

我们进入了“大数据”时代。

说这话的是腾讯公司网络媒体事业群总裁刘胜义,在2012年4月24日北京召开的腾讯2012智慧峰会上,他刚作为中国数字营销界惟一代表,从纽约参加完美国全球数字峰会归来。

大数据到底有多大?

在这次集结了全球著名畅销书《公众风潮:互联网海啸》作者乔希·贝诺夫(Josh Bernoff)、畅销书《社会消费网络营销》作者拉里·韦伯(Larry Weber)等众多国内外营销行业的一线专家、学者、从业者的峰会上,“应势而变应人而熠”的主题异常突出。营销环境发生了哪些变化,应该如何有效应对?

刘胜义说,由于实名制社区以及电子商务应用的普及,用户的网络ID和真实身份产生了更多关联。现在的营销,需要更多地倾听、理解用户需求,通过解读数据来获得营销洞察并制定方案。

乔希·贝诺夫用“公众风潮”去描述互联网在全球范围内所带来的营销变革。通过对中国社会文化的调研和用户洞察,“中国消费者的社会化生活时间更加碎片化,中国的社会化媒体也没有如在美国出现的Facebook或Twitter那样的一家独大的局面,中国的社会化媒体似乎更需要一种更为强大的整合能力和跨平台发展”。他认为中国具有深厚的社会化营销土壤,但营销者仍面临如何明确目标、打造传播内容、评估营销结果等各方面挑战。

拉里·韦伯在会上分享了在亚马逊非常愉快的一次购物体验,因为亚马逊知道怎么创造环境、合理使用大数据,并且优化和分享它们,为用户提供了适时、适合的信息。他以国际范围内最为出色的运用社交网络和社会化媒体的营销案例,并点明了其如何充分发挥了社会化媒体的魅力。

坐拥7亿QQ用户、4.25亿微博用户、2.024亿朋友网活跃用户及突破1亿微信用户的腾讯,有海量的数据在平台上产生。如果广告主通过有效的推广流程,把腾讯用户和品牌消费者的关系联动起来,形成一个营销闭环,那么,“大数据”的价值就真正展现出来了。

当然,数据挖掘并非意味着侵犯用户隐私。大数据是整个WEB2.0革命的重要组成部分,世界网络业的领军公司,例如Google,Facebook,苹果和亚马逊这样用户广泛、数据完备的公司都在探索此类服务,并已经处于先发位置。中国的营销人,也要因势而变,尽快拥抱大数据时代的到来。

大块头有大智慧

在峰会上,腾讯正式发布了其酝酿已久的社会化营销平台。刘胜义表示,“腾讯社会化营销平台的上线,是腾讯社会化变革最主要的动作,是广告产品全面向社交化升级的最重要环节。”

据介绍,腾讯社会化营销平台集用户、产品、技术和方法论于一体,广告主不但可以通过该平台选择自己需要的广告产品,还可以通过后台随时监测广告效果,随时根据需求优化、调整投放策略,并且全程按效果付费。这也是国内首个开放、自主、可控的数字营销平台。

腾讯公司网络媒体产品部助理总经理刘曜表示,社会化营销平台让互联网营销服务变得更加人性化。营销模式从聚众、分众过渡到了如今的开放时代,消费者的关系网络在互联网的推动下日益强大,广告主期望参与到消费者的关系网中,参与他们的沟通,从关注流量转变为开始关注消费者的反馈,也就真正形成了以人为本的营销。

网络媒体变革同时带来了营销方法论的提升,新的方法论将更多地基于社交化、人性化和便携化的思考。在以影响人的内心和价值观为核心的营销3.0时代,升级后的腾讯智慧MIND营销方法论,将体现互联网眼球经济向互动经济演进的基本方向。

腾讯公司全国策划总经理翁诗雅表示,“腾讯社会化营销平台的发布,开启了国内社交网络的商业化实质性阶段。腾讯的一系列富有前瞻性的可视化产品上线,将带领所有合作伙伴提前步入全民社会化营销时代。”

基于此,腾讯2012年全面启动社会化战略,一方面展开腾讯社会化媒体和社交网络的内部融合,通过对旗下腾讯网、腾讯视频、腾讯微博、QQ空间等平台的社交化改造以及平台融合,增强社交价值,提升腾讯网络媒体在社会化营销领域的实效。另一方面,腾讯微博与QQ空间已经开始全面融合,各媒体产品也在全面升级。

如即将全面改版的腾讯微博,在简化界面、减少芜杂信息的同时,以“微频道”突出用户的兴趣图谱与社交图谱的并存,激发用户从读人到读内容的兴趣。腾讯企业版微博也将全面提升,从“微空间”到“微卖场”,社会化电商模式全面开放。腾讯微博事业部总经理邢宏宇表示,腾讯的社会化电子商务、愈简愈包容的开放平台及内容、用户、数据多维度打通的大平台,它们的全面融合将成为腾讯探索未来运作模式及盈利模式的良好开始。

正如乔希·贝诺夫在演讲中所说的那样,“在新的数据化时代,数字媒体是信赖与规模的核心。”经一系列的社会化筹备和战略调整而形成的腾讯社会化营销平台,将继续引领国内数字媒体营销的发展趋势。

【相关链接】

腾讯智慧峰会是腾讯公司组织的高端峰会,世界级营销大师分享对互联网在线营销趋势的新锐洞察,探讨在线营销发展新方向。

2012年4月24日,“应势而变、因人而熠”腾讯2012智慧峰会(第五届)在北京隆重召开。峰会以开放、互动、多元的平台,首次向国内用户展示了全球最前沿的社会化营销的理论和产品,开启了国内全新的社会化营销时代。

大数据时代的数据仓库建设 篇4

按照百度百科的解释, 大数据技术 (Big Data) , 或称巨量资料, 指的是所涉及的资料量规模巨大到无法通过目前主流软件工具, 在合理时间内达到撷取、管理、处理, 并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume (大量) 、Velocity (高速) 、Variety (多样) 、Value (价值) 。显然上述解释仅仅是描述了大数据的一些特征, 对于企业如何开发大数据、利用大数据进行运营管理, 并没有过过多的指导。

本文建议传统企业在建设大数据系统的过程中, 不仅要建设数据分析平台, 更要构建起一个数据分析的生态圈, 让人人都是分析师, 让数据分析渗透到企业运营的每个环节, 真正实现数据运营、科学决策的管理模式。构建数据分析生态圈, 可以概括为“两个市场, 一个平台”, 两个市场是指业务数据市场、分析工具市场, 一个平台是分析观点分享平台。

2 业务数据市场, 让业务数据变得开放透明

业务数据是分析的源泉, 没有数据就谈不上大数据。企业经过多年的信息化建设, 一般都会有多套业务系统在运行, 如办公自动化系统 (OA) 、财务管理系统、ERP系统等不一而足, 但这些业务系统都是孤岛式隔离, 数据缺乏整合, 而且底层数据库都是经过专业设计, 复杂度较高, 非厂家技术人员难以使用, 通常都是利用定制报表的方式进行分析和使用。因此, 在利用数据上存在着数据提取难度高、报表需求响应慢、数据准确性差等问题。

产生上述问题的原因在于, 传统数据结构复杂, 对业务人员不开放, 利用报表的方式提供数据时, 需求人员期望的数据与技术人员提供的报表之间存在着巨大的鸿沟。建设业务数据市场就是将各业务系统的数据进行抽取、清洗、整合之后, 按照业务过程重新进行整合, 封装为统一粒度、统一维度的数据库表。这些数据表的特点就是能被业务人员所理解并解读分析, 这样业务人员可以在较早期就发现数据中间存在的问题。在建设数据市场的过程中, 有几点需要特别注意。

(1) 采用维度建模方法, 以“易懂性、易用性”为原则

业务数据市场的数据是供企业分析人员使用, 他们更多的是不懂技术的业务人员, 数据结构应该符合多数人的直觉, 而非像传统“三范式”那样, 需要借助复杂的ER图才能表述清楚。对于专业的IT人员, 尤其是要抵制将维度模型设计成“雪花模型”以节省数据重复、增加灵活性的诱惑, 从而带来模型复杂性的代价。

(2) 全面梳理业务, 实现数据的互联互通

传统企业的业务系统, 多数是烟囱式的软件系统, 若不在企业层面进行业务梳理, 就不能很好地对数据进行整合, 提取有价值的信息。在整合数据的过程中, 必须要有统一的维度才能有效实现数据整合, 比如统一的客户编码、身份证号等, 所以梳理企业层面的统一维度是实现数据整合的关键步骤。

(3) 分主题、稳步推进

企业运营涉及的业务过程众多, 眉毛胡子一把抓是不可能的。在建设企业数据市场时, 要根据企业的特点, 优先建设对运营最重要的业务, 尽快投入使用, 逐步完善, 比如一个销售类的企业可以先将订单业务整合起来。

如图1所示, 采用维度建模方法构建中间层数据结构, 可以大大降低数据的使用难度。以事实表为中心的中间层模型, 可以让业务人员将主要精力放在理解数据和业务上, 避免过多的技术细节所带来的技术门槛和恐惧心理。

将生产库的交易数据转换为维度模型, 必然带来非常大的数据转换工作量, 因此ETL过程就成了整个项目成败的关键, 选择或打造一个性能优良的ETL框架是系统的核心。笔者建议可以从选择开源的ETL框架开始, 图形化的开发框架会给研发带来极大的便利, 降低学习成本。图2为图形化的ETL开发框架。

3 分析工具市场, 打造适合需要的分析框架

数据是一座金矿, 但还需要依赖好的工具才能将金子提炼出来。直接分析原始数据虽然灵活, 但更加适用于高水平的人员, 对于大多数的一线员工, 应该提供更加易用的分析工具, 如报表、图表、报告等, 将业务指标以形象的方式展现出来。分析工具市场就是企业内部汇集分析工具的地方, 提供给员工根据自身情况使用。

分析工具市场包含两部分功能, 一是制作分析工具的开发平台, 一是运行分析工具的门户平台。在建设分析工具市场的过程中, 有几点需要注意。

(1) 分析工具市场建设

从技术角度来看, 分析工具市场可以找到众多的软件系统满足需求, 企业可以根据实际情况, 或采购、或使用开源, 搭建这么一套软件系统, 既能让企业自己定制报表、分析图表, 也能将制作好的分析报表展现出来。

(2) 分析工具的开发以企业自身为主, 外购为辅

分析工具与业务特点、人员使用习惯等因素紧密关联, 其需求变化频率高, 全部依赖外部厂家开发, 一方面费用较高, 另一方面需求响应也不及时, 可能等开发出来, 分析的需求却没有了。因此企业要培养自己的开发队伍, 可以利用数据市场中的数据开发出各类查询报表、分析图表等。

分析工具是数据分析环节最成熟、也是选择性最多的环节, 有非常多优秀的BI工具可供选择, 商业中的有Cognos、SAP等, 开源的有Pentaho、BIRT等, 但数据可视化仅是数据分析的起点, 要想将数据价值挖掘出来, 还需要数据分析人员对分析工具进行深入分析, 提炼出知识并进行固化和传播, 才能让数据发挥价值, 形成从知识到洞察的转换。图3所示为数据可视化图标类型。

4 分析观点分享平台, 让数据分析社交化

大数据时代, 在数据充裕的同时, 带来了有价值分析结果的匮乏。数据分析, 绝对不是高高在上的阳春白雪, 而是需要人人参与、百家争鸣的氛围, 要在企业内部树立人人都是分析师的理念。

分析观点分享平台的建设, 采用类似于朋友圈、微博等社交媒体的机制, 让每个人都有机会表达对数据的分析观点, 通过转发、评论机制, 让有价值的观点浮上来。在这个过程中, 分享观点的个人可以获得成就感, 转发、评论的人有参与感, 企业从中获取到对运营决策有价值的想法, 基于数据分析过程实现了科学、民主的决策。在建设分享平台的过程中, 有几点需要注意。

(1) 人员关注机制

由于企业运营不同于互联网, 存在着一定的封闭特性, 不建议采用微博关注的开放性, 而应该采用朋友圈类似的“关注-同意”的朋友机制, 避免不适当的关注带来的信息泄露。

(2) 分享范围控制

由于企业数据的特殊性, 员工在分析观点的时候需要控制分享范围, 避免机密信息的泄露。控制分享范围, 既要有人工控制, 也要从平台层面通过权限控制, 如财务数据的分享范围仅限某几个部门或人员等。

(3) 分享观点排序算法

综合多种因素对发表出来的观点进行排序, 以便让展现到每个人眼前的都是最符合期望的内容, 营造一个良好的分享环境, 避免劣质内容驱逐优质观点给生态圈带来的毁灭性打击。

5 实践

根据上述思路, 我们规划了一个数据分析平台的产品, 分为三个阶段进行演进, 即智能报表阶段、企业内部数据整合和大数据分析三个阶段, 遵循“整体规划、分步实施”的路线。在实际推广中, 引导客户优先解决现阶段最迫切的问题, 比如统计报表, 通过经营分析平台的构建, 充分调动每个人的积极性和能动性, 减少定制化工作的数量及频率, 有效利用企业经营中产生的数据。图4是数据分析平台的技术架构图。

如图5所示, 数据分析平台的第一阶段是“智能报表”阶段, 其重点是建设数据中间层、提供灵活的分析工具, 让企业的每个人都能参与到数据分析的过程中。因此, 产品的技术架构也就围绕着这两个目标进行重点建设。

其中, 数据建模和数据集市所用到的方法论就是本文第一节所提到的“维度建模”, 将中间层数据通过上层的数据分析工具开放给用户进行分析, 最终通过报表、仪表盘等形式呈现给各级人员进行决策管理, 实现数据价值的体现。

6 结束语

大数据时代的电影业 篇5

方存

内容摘要:

随着信息技术的飞速发展,税收征管也已经进入大数据时代,由于数据信息化的广泛运用,使海量数据的即时获取和精确分析成为现实,为研究纳税人办理涉税业务特征提供了良好条件,带来了税收服务手段、服务理念、服务载体、服务管理的大跨越……

关键词:大数据

应用

管理

信息化

现今很多人随时都会拿起手机发微信、微博,要购物不是上超市而是上淘宝、京东,外出就餐先看大众点评,有问题不是找老师而是找百度„„在我们的日常生活中,已经离不开这些网络应用。这些网络应用都有共同的特征,就是通过海量的数据,进行云计算后让用户获得到更好的应用体验。这些随时随地抓取数据的网络应用,让我们感受到,大数据的时代已经到来。

随着信息技术的飞速发展,税收征管也已经进入大数据时代,由于数据信息化的广泛运用,使海量数据的即时获取和精确分析成为现实,为研究纳税人办理涉税业务特征提供了良好条件,带来了税收服务手段、服务理念、服务载体、服务管理的大跨越。近年来,广东地税依据纳税人类别、涉税业务类别、办理时段等信息,依托数据信息化逐步形成了服务大厅、网上办税、纳服热线、自助办税、短信服务等多种渠道并存的大服务格局。

一、实现大数据管税的意义

从目前我们系统的数据量来看,还算不上真正意义的大数据。我们的征管系统中大量的数据都是传统的结构化的数据,已经达到了一定的数量,应该更多的是关注如何提高数据质量,如何应用好这些数据。而对于正在生长的海量的非结构化数据,则要关注怎么收集、用什么方式有效管理,从海量数据中发现有用的信息,深入挖掘分析、与征管系统数据综合利用,如何“要让睡着的数据醒过来”,转化为税源,才真正体现涉税数据的价值,才能实现“信息管税”。

在涂子沛的《大数据》中提出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。充分运用大数据的思维和手段,对于大力推进税收治理能力现代化,不断提高税收管理水平,意义重大。

二、当前税收数据应用管理的中存在的问题

近年来,地税部门在税收征管和信息化建设方面积累了大量的理论和实践经验,也取得了丰硕的成果。但受诸多因素的制约,在涉税数据采集、分析、利用等方面还存在一定的问题,影响税收数据的应用效用。

(一)征纳双方信息不对称日益突显

纳税人经营信息存在多样化和复杂化,地税机关获取纳税人信息的复杂性和工作难度明显增加,获得纳税人信息的渠道相对单一,主要是采用纳税人自报与税务机关根据自身工作需要进行采集所得到的信息。虽然省局与市局正在尝试进行政府部门之间的信息共享,但是这些仅仅是起步阶段,还没有完全形成有效、规范的机制。这些因素导致税务机关对纳税人生产经营状况、销售情况、生产成本等信息的掌握不全面,加上税务部门自身也没有一套完善的决策支持体系,严重影响税收数据的收集质量。

(二)税费征收管理系统过多,相互之间存在信息壁垒

目前,地税系统使用软件相对繁多,与税费征管有关的系统包括大集中征管系统、电子办税服务厅、税源管理平台、两业系统、数据综合展现平台、存量房交易计税价格评估系统等十多个操作系统,这其中有省局开发的,也有市局开发的。这些征管系统有部分在数据交换上互不共享,而软件开发公司也不一致,系统维护相对繁琐,给基层税务人员实际操作带来了很大的困扰。

(三)信息数据分析利用的广度深度不够

一是对现有数据的分析利用不足。目前的税收分析主要对税收任务的分析,只是局限于对某些数据的纵向对比分析。虽然这几年在这方面进行了大量的努力,但是没有形成长效的、可持续发展的数据分析模型,与宏观经济、市场变动、企业财务数据等联动分析不足,没有完全发挥数据信息利用应有的作用。二是税收业务与技术没有有效的融合。目前在基层税务机关这是最为薄弱的一个环节,业务与技术基本上还是各自为政,没有形成业务与技术的有效融合,导致对各方信息的横向比对和各时间段信息的纵向分析不足,从分析比对中发现问题的能力较弱,无法形成对信息分析利用的合力,制约了对信息的深度分析利用。

(四)专业信息技术人才缺乏,数据得不到有效利用

目前,以我县的干部职工为例,能够掌握比较系统的、全面的计算机知识的干部很少,另一方面,由于年轻干部交流频繁,精通税收业务的干部也不算多。因此税收信息化建设队伍任务繁重、人员不足、素质不齐等问题比较突出,高素质的专业化人才更是相当缺乏,即懂技术又懂业务的复合性人才更是屈指可数。这就造成即使拥有大量的有用数据,我们的基层税务人员也不懂分析利用,无法及时从中获取有效的数据信息。

三、完善税收数据应用管理的几点思考

(一)运用大数据的思维和手段,树立“信息管税”的新理念 我们都已清楚的看到,大数据时代所带来的思维方式、管理模式、监控手段等方面的变革,对税收征管工作带来了深远而巨大的影响,税收征管已经离不开信息化手段,紧密依托数据信息手段开展税收征管工作,已经成为税收工作的必然要求。结合风险管理和大数据理念,做为新征管改革的突破口,将大数据税收征管模式与先进的管理理念相结合,技术创新与管理创新相结合,通过税源监控、税收分析、纳税评估、税务稽查等质量控制手段,达到堵塞漏洞、纠正偏差、提高税收质量的目的。

(二)制定数据规范化,提高数据质量 要提高数据质量,必须要有数据管理标准和采集操作规范。一是要规范数据采集渠道。建立基层分局、县区局、市局、省局四级数据采集网,有条件的可设置涉税数据采集专业岗位,专门从事纳税人生产信息、交易信息、经营动态信息的采集。二是要加强数据质量的管理。按照统一标准录入有关数据,对采集的数据进行逻辑和真实性检验,把好数据进口关;制定数据审计规则,加强数据质量事中控制和事后比对,将数据质量纳入绩效考核,为数据应用提供准确可靠的信息来源。三是实行信息数据集中处理。建立覆盖采集、交换、分析、应用等主要环节的数据管理体系和运行机制,实现各个管理系统各类征管数据统一存储、加工和管理,实现各类信息资源互通互联共享,实现征管工作各环节在信息化支撑条件下的相互衔接。

(三)充分发挥政府职能作用,实现全社会的涉税信息共享 一方面,大时代数据必将全方位构建数据网络体系,通过政府部门建立大数据仓库,实施统一的信息管理平台,将工商、供电、建设、房产、交通、国土等政府各部门的数据实施统一管理,并对这些数据建立政府数据共享机制。另一方面,积极健全各政府部门间的信息网络,明确各部门通过网络获取信息的相应用户权限,彻底改变信息离散、各自为阵的局面,实现高效的信息共享,为税务部门全面掌握涉税信息提供强有力的外部环境支撑。同时,地税部门的反馈信息也可以帮助社会综合治税的成员单位掌握有关情况,查找各自工作中的不足和监管漏洞,共同提高管理水平。

(四)创新数据挖掘分析方法,打造智能税务

在调查研究的基础上,不断探索,创建科学有效的数据挖掘和分析体系。要建立税收数据仓库,对分散在各个应用系统中的数据进行集成、整合和统一管理,实现数据资源省级集中和共享,为数据挖掘分析提供基础支持。创新税收数据挖掘分析方法,应当注重五个结合:一是宏观与微观相结合。通过宏观分析了解本地区范围内不同行业、不同税种、不同类型企业的税收情况,找到税收管理的薄弱环节,对有疑点的企业、存在问题多的行业从微观上进行纳税评估、税务稽查,采取切实措施强化管理,堵塞漏洞。二是上级与下级相结合。瞄准税收管理现代化方向,省市县层层落实税源专业化管理思路,分级分类加强税收数据挖掘分析工作。三是全面与重点相结合。在全面分析的基础上,各地要结合本地实际突出重点,有的放矢地开展重点数据挖掘分析。四是定量与定性相结合,形成完整的科学的税收分析方法体系。五是动态与静态相结合。进行税收数据挖掘分析时,注意动态数据与静态数据的结合使用,坚持从经济看税源,从纳税人的发展看税源。

(五)培养复合型税务人员,满足大数据税收工作需要

人的因素是搞好一切工作的前提,实行税收现代化管理,必须培养复合型税务人员。复合型人才是“一专多能”、“多专多能”,以博见长,知识面广,易于融会贯通、触类旁通。培养既精通税收业务,又熟练掌握法律、财会、统计分析、计算机等方面知识和技能的复合型人才,是大数据时代税收工作对拥有复合型税务人员的需求。

在大数据时代,我们每个人既是数据的创造者,又是数据的使用者,这就要求每个税务干部,必须要有大数据的思维,运用大数据方法和手段,不断创新税收管理手段和方式,才能实现税收现代化。

参考文献:

(1)涂子沛《大数据》 广西师范大学版社,2012年7月(2)谢永健 《大数据:实现税收现代化的利器》 中国税务报,2014年9月17日

大数据时代的经营 篇6

在经验时代,当所有人都在盲人摸象的时候,企业之间比拼的是决策者的头脑和思维。当进入大数据时代,仅仅有思维和头脑已经不够了,因为有人已经站在大数据顶端,全面地看到了整头大象,只知道埋头工作不知道抬头看方向的企业,是要被淘汰的。今天企业做经营决策不能再依靠经验模式,而是要用大数据分析的方式来进行。

“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”麦肯锡最早提出了“大数据时代”的概念,确实,大数据正在改变我们的生活和思维方式,也成为了新服务、新商业、新经营的源泉,成为很多政客、企业家进行决策的分析依据。

奥巴马团队的大数据战术

奥巴马竞选团队是利用大数据的一个典范。美国总统竞选的时候,候选人背后会有智囊团,智囊团由很多选举专家构成,这个专家团队为候选人出谋划策。但奥巴马参与总统竞选的时候,除了智囊团之外,还有一个数据分析团队。

奥巴马的数据分析团队每天把网上的用户从1000多个纬度进行数据分析,每天进行6.6万次的模拟选举。通过模拟选举,他们能够推知哪些州是奥巴马的坚定支持者,哪些州是奥巴马的坚定反对者,还有哪些州是摇摆州。那么分析结果出来之后,摇摆州的选民,就是他们需要争取的。这还不够,接下来他们会进一步分析出摇摆州里最有影响力的两个人,如果取得这两个人的支持,信任这两个人的那些人也就都会支持奥巴马。有一次,通过数据网络,他们发现某个州的两个“影响力人物”总是会到一个不知名的网站上发言。于是,奥巴马就到这个网站上做了一次演讲,这个州的支持率很快就上去了,那个摇摆州的很多人马上变成了奥巴马的拥护者。

另外,数据团队还能分析出奥巴马每次演讲完了之后什么人会离开他,他们甚至知道奥巴马的夫人春天去演讲拉票效果远远好过秋天。所以奥巴马其实在竞选的过程中完全用了大数据的分析,而所有的这些信息,都不是传统的选举专家所能获得的。这些优势,是帮助奥巴马取得竞选成功的重要因素之一。

大数据与影视剧的联姻

2014年10月7日,《中国好声音》第三季落下帷幕。张碧晨凭借其在“巅峰之夜”的出色发挥,荣获第三季冠军。与以往的电视节目不同,《中国好声音》第三季在博得收视率的同时,也成为了网络热点。统计数据显示,《中国好声音》一跃成为决赛当天最热话题,占据了搜狗微信搜索10大热搜词榜首的位置,在新浪微博上同样闯进热门话题前5位。

《中国好声音》第三季有这么高的关注度,一个很重要的原因,就是节目制作组借助网络平台,通过大数据分析,抓住了人们的关注点。《中国好声音》第三季的网络独家播放媒体是腾讯视频,两者的深度合作,使得节目组可以通过腾讯平台,获得大数据的支持。

比如,通过对相关微信公众号文章进行分析可以发现,学员唱功、比赛结果、音乐人评价、娱乐八卦、内幕揭秘等热点资讯和花边信息,占相关文章总量近8成,这些是大家最关注和感兴趣的内容。那么,这些内容就可以作为产品的卖点。业内人士也指出,移动互联网时代,微博、微信等社交平台,能够在短时间内显示出一系列热点数据,这些大数据可以作为影视节目制作的指导。

通过对网络大数据进行解读,不仅可以从中了解年轻用户群体的关注与兴趣点,探索如何更好地满足这一群体的需求,还可以参考大数据,设置微信公众号内容,进一步提升关注度。例如:除比赛本身外,大家会对其中的八卦爆料、选手个性、背后故事等非常关注。那么,公众号就可以将这些内容作为重点,有针对性地发布广播内容。

传统的影视节目制作的时候,无论是节目形式还是角色选定,大都是依靠调研公司的调研或者编剧导演的经验认知。虽然这样的制作流程能保证影视节目的严谨性,但是这种制作方式缺乏时效性,难以适应市场的快速变化。大数据技术可以解决时效性的问题,而且能够通过互动,使制作方时刻注意到观众们的兴趣喜好,及时优化节目,尽可能满足更多观众的口味。

《中国好声音》的成功,只是大数据与影视节目结合的一次试水,其令人惊喜的效果,也预示着大数据与影视节目联姻的美好前景。大数据分析,能够让网民意志影响到节目进程和角色选择,这样一来,普通观众会获得一种参与感。而参与感和互动,正是互联网时代生产和消费模式的重要特点。

当大数据与影视剧联姻的大幕拉开,影视产业会还会带给我们很多惊喜,同时,也给传统影视企业敲响了警钟——当别人通过大数据研究的方法涉足影视,之前埋头做事的方式是不是可行,就成了一个值得深思的问题了。

孩子王——有温度的数据

专业从事孕婴童商品一站式购物与服务的“孩子王”2009年开设第一家旗舰店,此后短短5年时间,这家公司已经布局了9个省份,开设了近70家门店,拥有200万会员。

“孩子王”的发展速度,是很多传统零售公司难以想象的,孩子王的数据分析模式,正是造成这种差距的原因。

孩子王在经营过程中充分运用了大数据分析模式,它的数据库无所不包,只要是孩子王的客户,小孩一个月喝多少克奶粉,每天需要用几块尿布,他们都一清二楚。“让数据有‘温度’”是孩子王进行数据分析的理念,他们更注重收集消费者最真实的想法,通过深度挖掘,在消费者产生需求之间,提前投放广告,创造满足。

比如:如果顾客买了二阶段奶粉,那就一定需要买大号纸尿裤。孩子王可以知道哪些顾客买了二阶段的奶粉,却没有买大号纸尿裤,那么,孩子王在一周之内就会向这些顾客赠送用于购买纸尿裤的优惠券。并且,这样的优惠券是由厂商提供的,孩子王不需要太大的投入。顾客们用了优惠或免费送的纸尿裤后,就有可能建立起对这个品牌的追随。这种营销就是精准营销。

毫无疑问,精准定向的广告投放不仅更加有效,还会让用户感到贴心。与之相比,传统的宣传单轰炸的方式则显得没有人情味,效率也太低。这也正是孩子王在短时间内创造出同类传统公司难以想象业绩的重要原因,孩子王的飞速发展,是大数据经营的又一次成功展示。

现在唯一需要考虑的是:大数据经营在社会上完全普及的时代,会以多快的速度到来?

(作者系腾讯资深培训师、科技趋势研究专家,本文节选自其所著《时代的变换》一书)

电影遇上大数据 篇7

情节1:在上映前提前预测是否赚钱

利用大数据的分析, 针对社交网络上大家对电影、导演、演员等评论和关注程度, 也就是以前我们听到的“闲言碎语”, 通过分析建模后, 我们就可以在电影放映前一定时间段内预测它的票房, 从而判断这部电影是否赚钱。国内已经有公司开始做这件事情, 那就是我们投资的一家叫新影数讯的公司。

那么这样做, 到底效果如何?预测的准不准呢?我们举个例子, 当冯小刚导演的《1942》将要上映前将近一个月的时间, 我们通过对社交网络的数据进行分析, 得出的结论是这部电影的票房是3.8亿左右, 这个数字可是与当时电影界人士预期的7亿票房相去甚远!为此发行方还专门为此事找上门来, 提出强烈质疑。但是结果呢?最后《1942》的票房3.64亿。

综合目前我们对所有国内上映的电影所进行的票房预测, 在进行电影是否可以赚钱和赔钱的预测中, 准确率100%, 而具体到票房数值时, 准确率在80%-85%之间。

但是, 当电影拍出来之后, 再进行预测, 其结果已经基本确定, 该投的资已经投出, 那么这种预测对于电影产业本身来讲并不能起到真正的决策作用, 于是, 电影遇上大数据就给我们带来了下面的情节。

情节2:可以预测导演和演员的受欢迎程度

一部电影, 谁来导, 谁来演, 很大程度上决定了这部电影的投入产出, 因为导演的品位、演员的受欢迎程度, 都决定了这部电影的未来命运。

有的导演适合导喜剧类的片子, 那么如果他要是导演战争类的, 那么会怎样?有的演员适合演清纯角色, 如果换成了搞笑角色, 那么会怎样?如果演员在同期有多部影片上映, 频繁出现在屏幕上, 会怎样?哪几个演员放在一起是有积极作用的, 哪几个演员放在一起会影响电影拍摄?导演以及演员的演艺周期是什么样子的?出场费高的演员有没有可能用出场费稍低的演员来替换?所有这些问题, 通过数据库和建模, 都能给出圆满的答案。

在我们的分析中, 就发现范冰冰和李冰冰的粉丝群体有明显的差异, 因此, 对于他们两位适合演什么类型的电影就可以判断出来。

当然, 导演也好, 演员也好, 如果没有好的剧本, 那么也无法获得好的回报。在一些没有立意、没有深度、没有内容的影片中, 即使是郑少秋、成龙这样的著名演员, 也不能发挥出最大的作用。因此, 接下来的情节就是影片剧本内容的问题。

情节3:可以预测剧本内容受欢迎程度

好的内容永远是电影的核心。但是, 什么样的内容才是受欢迎的电影内容呢?那自然是观众热议的内容了。

于是我们可以把剧本的内容段落放在社交网络中, 根据它的传播和评论情况, 来分析判断这段内容是否合适, 是否受观众欢迎。也可以根据社交网络中大家关心的热点进行电影内容的修改和植入。前段时间美国Netflix公司根据大数据分析, 投用户所好地翻拍了英国广播公司 (BBC) 的经典老片《纸牌屋》, 因为大数据告诉我们, 还会有许多人点播这部1991年的老剧, 而这群观众里不少人喜欢《七宗罪》的导演大卫·芬奇, 也很爱看奥斯卡得主凯文·史派西的电影, 就这样, 《纸牌屋》把这三项热门因素集结在一起, 推出了大数据时代的新型电视剧, 由大卫·芬奇导演, 凯文·史派西主演。

大数据时代的档案数据整合研究 篇8

随着网络技术和计算机软件技术的快速发展, 越来越多的行业引入了云概念, 将传统的单一独立系统变成可以数据集成共享的统一系统, 在云计算系统中, 云计算成为当前研究的热点, 其通过海量的信息将数据的量变转换为系统的质变, 从而解决日常生产运营的各类问题, 相关文献将其成为“ 大数据”。 随着大数据时代的到来, 商业、 工业以及其他国民经济领域将逐渐依赖于大数据的分析和决策。 大数据时代的档案数据的整合也成为档案管理部门研究的热点和关键点。 档案数据的整合包括数据的存储、 数据的挖掘以及数据的保护。 档案管理将通过档案数据整合实现大数据的处理。 本文将结合实际工作经验, 对大数据时代的档案数据整合进行分析和研究。

二、 大数据时代的档案数据整合

( 一) 相关概念及技术应用

当前大数据渗透到人们生活的各个方面, 而在档案管理方面其甚至突破了原来的简单衔接实现的资源共享和工作协同, 而是将现有的大数据视角下的所有与档案相关的数据信息资源进行整合, 通过大数据、档案信息以及整合进行集成方面的剖析。 在大数据时代的档案数据整合通过对网络技术、 计算机技术以及数学算法运算等技术手段, 借助社会组织单元之间的协同合作, 将分布零散在不同的领域, 不同的行业的大数据资源通过一定的规则进行联接, 实现了一个具有程序化、 一体化和科学合理化的管理整体。 因此, 大数据时代的档案数据整合应用的技术主要包括: 系统集成技术; 计算机网络信息安全技术; 数据分类、 检索和索引技术; 数据存储与数据压缩技术。

( 二) 大数据时代的档案数据整合实务

我国自引入档案大数据整合以来, 各地对档案信息化进行了颇有成果的探索, 构建了一定规模的技术设备和管理系统, 而当前由于体制方面的、 管理方面的不够成熟还存在着各自开发、 各自成系统的情况, 这导致数据接口不一、 数据共享难, 对于大数据时代来说, 单一的共享原则上不算共享。 而如上所述, 由于技术应用环境的不同, 当前多数信息系统处于一个无统一管理、 无全共享的环境。 后台数据库更是由于开发者的独立开发和数据接口设计的不一导致数据库的数据结构等技术方面共享出现难题。 实际工作中, 我们更愿意将其联接成一个可以简单、快捷的数据库群, 实现大数据的自由、 高效的流动与交互, 从而实现系统的有序化和统一化。 从这一点上来讲, 大数据时代的档案数据整合必须实现技术上的信息整合。

与技术整合相对应的是管理方面的整合, 这也是档案数据整合的核心部分。 大数据时代的档案数据整合工程是一个复杂的管理工程, 不仅需要档案资源整合技术的支持也需要科学管理方面的整合, 营造与其相匹配的管理环境。 因此实践中必须有统一的管理协调单位对整个整合工作进行统一调配和管理, 并与此同时实现整个数据整合工程的监督管理体系的监理, 对工程的实施进行监督。 最后树立合理的数据整合观念意识, 实现对数据整合工作的智力支持, 与此同时, 制定相应的规章制度, 促进相关组织单元的互相交流和学习。

最后, 面对当前越来越严峻的网络安全隐患, 档案数据的整合在大数据时代也有其自我的要求。 此处的网络数据安全方面的考虑也可以称为安全整合。 安全整合在于对档案馆 ( 室) 内部所已整合的、 待整合的、 正整合的大数据进行有效的保护, 使其不容易从外部进行非法的篡改、 破坏和泄露, 确保相应数据的完整性、 机密性和真实性。 另一方面必须确保档案信息的完整性, 对身份认证、 信息加密以及访问控制等软件信息完整性进行有效整合, 确保档案数据的资源不被篡改和盗窃。

( 三) 大数据时代的档案数据整合模式

按照当前大数据的具体需要和相关规范标准, 当前大数据时代的档案数据整合必须解决三个主要问题, 分别是数据采集与处理、 数据基础技术问题和数据分析应用问题。 因此, 大数据时代的档案数据整合模式可以通过设计相应的三个层次进行实践设计, 一是数据融合处理; 二是平台融合; 三是服务融合。 数据融合通过统一的数据接口标准对当前存在的档案信息系统及其相关的信息系统进行异构异地数据的存取和开放。 因此, 数据的接口标准及相关开放规范是数据资源融合的基础和关键。 这个过程是一个较为统一的管理过程, 相关管理部门在权衡数据资源利益与开放资源收益方面必须有较好的处理方式, 相关文献指出解决大数据利用带来的价值分配问题需要法律及相关的行业标准和制度依据。 再之, 数据融合归根到底必须构建一个能够统一管理、 具有层次化的数据中心管理平台, 对来自包括档案信息系统在内的各个数据主体和行业数据进行统一管理和价值分配。

其次, 对于平台融合而言, 基础设施是上述大数据管理的基础, 也是数据融合的重要手段。 大数据时代的档案数据融合也是一种信息技术问题, 其必须在实际工作中解决包括数据采集、 数据处理、 数据分析、 数据安全以及数据存储共享等多个现代信息技术关键问题。 因此平台融合讲到底还是技术融合, 如何利用现有的网络技术、 计算机技术、数据库技术、 数据挖掘技术、 机器学习技术、 云技术等多种新技术进行数字资源平台的搭建是平台融合的关键问题, 也是大数据时代档案数据整合的核心所在。

最后, 大数据的利用和开发目的在于为决策者、 管理者以及其他服务享受者提供一站式综合服务, 因此服务融合的主要目标在于如何对现有大数据的分析和利用。 实践中, 服务融合更多指的是以大数据和平台为实现基础, 进行数据采集、 分析和共享等, 为特定的用户提供特定的服务, 实现最终数字资源融合。

三、 结束语

档案数据作为采集具有历史价值和实现现有价值的数据信息, 其为社会经济发展提供了较好的基础数据和生产要素支持。 大数据时代下的信息化建设也是我国当前信息化建设的一个重要组成部分, 因此, 大数据时代下的档案数据整合是具有较强实践意义的一个工程, 既是大数据时代信息化的实质要求也是当前档案信息化建设的重要内容。 因此, 我们必须利用当前的关键技术, 在大数据时代的环境下抓住机遇, 挖掘大数据背景下的数据资源, 对档案信息进行整合, 使档案数据能够安全、 便捷面向大众, 促进自我价值的提升和行业的进步。

参考文献

[1]孙玉玲.大数据时代数字出版产业的发展趋势[J].出版发行研究, 2013.

[2]马建光, 姜巍.大数据的概念, 特征及其应用[J].国防科技, 2013.

大数据:电影行业的“双刃剑” 篇9

一、大数据在电影行业的应用

(一) 电影制作

2013年被称作“大数据元年”, 在这一年, 一部基于大数据分析的电视剧《纸牌屋》在影视业引发了热议。Netflix有效利用了基于用户的在线操作行为所产生的数据, 包括用户搜索请求, 在观看过程中诸如暂停、快进等行为以及用户评分, 通过分析这些数据, 发现1991年的BBC经典老片《纸牌屋》仍然有大量用户点播观看, 大卫芬奇与凯文史派西是他们最为关注和喜爱的导演和演员, 该公司在这个基础上确定了剧本内容以及导演、演员等主创人员。所翻拍的影视剧《纸牌屋》在2013年上线后, 人气高涨, 为Netflix带来300万的新增用户, 同时引燃了大数据在电影行业的广泛关注。这是一次将大数据运用到影视行业的成功尝试。大数据时代的到来, 使原本以传统产品类型的思维方式转变成以用户为中心的大数据思维。

1. 受众参与剧本创作

为了迎合受众口味, 国内电影制作公司也充分调动网民、观众参与剧本创作。这种互动参与模式最明显的体现就是在众筹中, 通过这种方式调动观众的参与度进而挖掘潜在的观众群体。2014年7月10日上映的《老男孩之猛龙过江》的情节设置就运用大数据对网民的意见进行了整合分析, 其中75%的网友意见被采纳而融入进影片制作过程中。大数据不仅影响剧本的前期创作, 对于那些“边播边拍”的影视剧来说, 大数据更是深入到其创作的各个阶段。观众在追剧过程中通过网络平台发表的评价, 运用大数据能实时进行分析与反馈, 这就为充分考虑社会舆论及观众意见, 甚至会以此来修改剧情走向带来了可能。可见, 大数据思维深刻地改写着电影工业的内容和生产体系。

2. 分众与定制电影

大数据对电影观众进行了细分。2014年《爸爸去哪儿》大电影就是一个明显的例证。当部分观众及业内人士质疑其电影本质时, 这部电影以惊人的票房成绩赚得盆满钵满。诚然, 这仅仅是在电影大银幕上放映的一档电视节目, 它并不需要全民都喜欢, 其锁定的目标受众即是这档真人秀电视节目的粉丝群体, 可以说其是为这部分粉丝群体专门定制的一部电影。无论是《爸爸去哪儿》还是《纸牌屋》, 经过大数据技术筛选处理的信息, 其效用多半是为电影制作者提供受众偏好的划分起到一个参考作用。

3. 降低投资风险

事实上, 那些不依据大数据而生产制作出来的影视作品的影响力未必就弱于此, 但以大数据分析把握受众需求无疑降低了投资风险。由于电影生产需要高额的费用, 加上投放电影市场面临的诸多不确定因素, 其前期制作过程投入的大量资金则需要后期收回成本。前期制作中通过大数据预测观众喜好, 可以以此确定创作阵容和情节设置, 帮助投资方和制片方锁定一定的受众群体。为了确保利益最大化, 国内相关的影视投资公司甚至建立影视剧网络播放数据采集平台, 通过这个平台评估演员、明星的人气与实力, 充分发挥大数据技术的作用。

(二) 电影营销

大数据对电影产业最直接的影响体现在电影的宣传与发行上。电影发行方在影片的发行过程中需要制定并实施影片营销宣传方案, 如今掌握了大数据营销就是掌握了电影成功的命脉。营销的主要目的就是使更多的观众接触到电影信息, 挖掘潜在的观影群体, 通过大量的宣传工作最终引发消费行为, 引导观众购买电影票进入影院观看电影。电影营销包括线下和线上, 传统营销主要以线下为主, 以影院为主要阵地, 围绕电影产品开展的各项宣传活动, 在影院提高观影人次, 例如用开展影院社交互动、电影主创人员观众见面会、促销产品与有奖互动形式以及主题观影等活动来吸引观众参与, 以扩大电影的知名度及影响力。与此同时, 发行方需要向影院争取更多的排片, 因为影片的排片率直接影响到电影的票房收入。在大数据时代, 大数据技术能够使线下营销更为高效有利。同时, 运用O2O思维方式, 通过线上调研、贴吧、微博等线上平台抓取数据, 分拣提炼有价值的数据从而将观众进行精准化分类, 有针对性地制定不同策略及投放方式, 实现线上发起, 线下完成, 以达到最大效益。

大数据促成了O2O时代的到来, 线上营销已经成为电影营销环节的关键。而细分到线上营销的每一个环节都离不开大数据的预测与指导。乐视影业作为大数据营销的引导者, 在电影产品投放市场前的调研与数据分析时, 主要处理产品数据、平台数据、渠道数据以及终端数据四大类。产品数据帮助定位基于影片的目标受众并对这类观众的构成进行分析, 之后, 通过分析各大网络平台与媒体的定位和影响力确定电影产品投放的平台。除了媒体和社交网络, 产品品牌也是重要的平台之一。找准平台能够更为高效、广泛地接触到目标受众, 达到宣传效果。然后再考虑到如何有效地激发目标人群的消费行为, 以及通过哪些渠道能够直接地促成目标人群的购买。互联网时代人们的消费方式发生了巨大的改变, 电商渠道多元化, BAT阵营、团购网站、第三方在线票务网站、院线自营售票网站以及电影社区等线上购票系统竞争激烈。另外, 渠道数据不仅仅是分析线上电商渠道, 同时还兼顾到线下渠道, 针对目标人群的喜好选择合适的渠道。最后, 如何服务好目标人群, 完成项目与观众间的勾连, 这就是通过终端数据需要来解决问题。《小时代》作为大数据营销策略践行最为成功的案例, 乐视影业功不可没。该公司创新事业副总裁陈肃通过总结, 认为乐视影业的核心竞争力是线上线下的O2O平台, “一定三导”“五屏联动”加地面的系统模式。乐视影业打出的这套“组合拳”注意到线上和线下的数据整合, 成为当下电影产品所践行的成功商业营销模式。

(三) 电影放映

大数据能够为影片提供前导性的市场预测。2013年, 谷歌公布了一份名为《用谷歌搜索量化电影魔力》的白皮书, 宣称利用电影票房预测模型, 能够提前一个月预测电影上映首周的票房收入, 其准确率可达94%。这种基于电影相关搜索量和票房收入的关联性所建立的模型, 是大数据分析在电影业的一次尝试。这种方式打破了以往抽样调查所带来的不准确性与波动性, 大数据所具有的全样本特性能够更为精确地预测票房。但在业内人士看来, 这种模型过于粗放, 仅仅凭借搜索量却忽视了影片的其他相关数据, 比如微博微信等社交平台上的话题活跃度、电影社区网站的影片评分、影片的评论文本等因素, 都在一定程度上影响了电影票房的预测。这种基于大数据的票房预测能够有效指导电影的制作、营销, 帮助制片方和发行方及时制定或改变策略。同时, 提前预测票房也为影院排片起到指导性作用。除了在上映前预测票房, 伴随大数据技术的进一步完善还可以做到在影片上映期间的动态预测, 根据影片场次、票房的比例及上映期间卖出速度的数据分析, 对上映影片的场次进行合理分析, 并给予调整预警, 帮助影院及时对排片和场次作出调整。

除了票房方面的数据能够指导影院排片, 同时需要考量与收集的数据还涉及到影院自身、观影人群以及影片三个方面。影院自身的特征包括放映设备、影院环境、地理位置、座位数、历史票房、历史排片等数据都会影响到观影人次及电影票房收益。利用大数据技术分析, 针对不同的影院对影片的排片数量及场次规划给出合理建议, 可使影院票房收益达到最大化。另外, 通过大数据分析不同城市、不同区域、不同档次的观影人群的差异, 可以给出最优化建议, 进行差异化排片。最后, 根据影片自身类型、质量等差异, 通过大数据分析, 建立不同时段不同影片类型的消费能力指数, 制定不同时段、不同场次的合理定价。

此外, 大数据系统还能对影院票房进行监管, 控制“偷票房”现象的发生。2014年, 多家影院推出晒出“偷票房”电影票的活动, 通过观众举报对违规影院实施严厉处罚。而新的措施通过影院联网的大数据技术, 影院每出一张票的详细信息都会立即反馈到数据终端上, 力求影院售票透明化。

二、大数据引发的问题与思考

大数据技术在电影行业的应用才刚刚起步, 尚不够成熟, 还需要通过对大数据技术进行不断地研究和开发, 使之更好地契合电影行业的特点, 以促进电影业的发展。除了大数据技术自身的问题之外, 大数据参与电影制作等各个环节, 也凸显出许多问题, 争议性颇高。

(一) 大数据“扼杀艺术家才华”[1]

大数据在电影的宣传、营销方面作用很大, 但其对电影制作的影响却受到诸多质疑。文化产品中常提到的一个悖论明显显现出来, 那就是商业和艺术的对立。这虽然是一个老生常谈的问题, 但大数据技术的确颠覆了电影制作的模式, 一个好故事、好剧本的诞生, 以往都是经过编剧、导演的亲身经历、实地考察, 下大功夫完成的, 而通过大数据分析写出的剧本往往是网民、观众的群策群力, 这固然能够为故事带来许多新鲜的想法和创意, 类似《丝男士》剧本的创作就是由20个段子手共同完成的。这样编写而成的故事拍成的影视剧采取的是分段式的结构, 但电影的剧本则要求更高, 编剧太多往往使主题多义甚至造成影片结构散乱。搜狐视频首席运营官刘春就提醒说, 在大数据时代不要忘记艺术创作的重要性[2]。乐视影业创新事业副总裁陈肃在被问及大数据对电影创作的影响时表示, 互联网对制作的消解很严重, 这是一个消解权威的模式[3]。类似《小时代》《爸爸去哪儿》这样的影片, 都是面向特定群众的消费需求而定制出来的电影, 甚至对于粉丝来说, 对影片艺术质量的要求并不高, 这也就造成了口碑的两极分化。面对这一问题, 陈肃认为, 电影有三个价值:商业价值、娱乐价值和社会价值。他指出电影应该不仅具有娱乐功能, 最终应该走向电影文化与生活, 既要有《小时代》这样娱乐性强的影片, 也要有《归来》这种严肃、有深度的电影。确实, 大数据技术仅仅是帮助电影生产预测和分析的工具, 而一个影片是否能够获得成功, 关键还是在于电影本身。

(二) 大数据有风险

电影行业利用大数据, 仍然面临着许多风险。2014年国庆档上映的影片《黄金时代》就遭遇了大数据预测票房失灵的局面。影片上映前, 在百度百发的新闻发布会上宣布其预测的《黄金时代》的票房为两到三亿。而事实上, 上映五周其内地票房只达到了5154万[4]。而百度百发预测的票房是基于《黄金时代》众筹项目的数据情况得出的。《黄金时代》是由百度推出的众筹平台“百发有戏”的首批众筹项目之一, 其目标是在30天内筹集1500万金额, 但最终只获得了3301位支持者的180万元[5]。众筹所带来的数据并不能完全代表观众的喜好程度, 这种以实际金钱为回报的形式不能排除那些不了解项目本身, 而仅将其作为一个理财项目的投资者, 这部分人群势必会误导对大数据的分析。除此之外, 电影的商业效益和票房是由多种因素共同作用的结果。大数据分析只能对当下和短期的市场情况与受众群体进行有效预测, 而处在信息爆炸的时代是难以预知几年后的观众消费习惯的。当电影按照大数据分析得出的结论投入制作后, 要经历三五年甚至更长时间制作完成的影片所面临的社会与人群早已发生改变。这就提醒电影行业人士, 大数据技术固然具有诸多便捷与优势, 但不能盲目使用, 现阶段要做的更多的是培养大数据思维。

(三) 大数据侵犯隐私权

大数据技术越来越深入广泛地渗入到电影行业的各个环节, 技术本身并无好坏之分, 但大数据由于涉及到用户信息的收集、使用, 有时甚至未经用户同意, 将用户数据用于商业谋利, 会对用户造成困扰。通过大数据分析用户行为, 可以根据用户喜好推荐有价值的信息, 例如许多音乐类APP会在用户打开其主页时根据其近期的播放历史推荐相似歌曲, 而淘宝和百度则更甚, 当用户在浏览网页时, 经常会看到根据淘宝或者百度搜索记录而推送相关的广告信息, 这些广告会影响到用户体验同时也意味着隐私的暴露。因此, 电影行业在利用大数据技术对用户信息进行处理时, 应当注重对隐私的保护, 防止信息外漏, 给用户带来不必要的困扰。

三、结语

新的技术的来临必然要经过各方面的考验, 自电影诞生以来, 经历了有声电影、彩色电影、宽银幕技术、3D技术等技术革命, 在这些变革中, 随着时间的推移, 其价值和意义逐渐凸显出来, 有些技术在今天仍然争论不断。电影因技术而生, 随着技术的发展而发展, 虽然目前大数据技术成为电影行业的一把“双刃剑”, 还面临着诸多问题及不成熟之处, 但不可否认它给电影行业带来了新的可能。作为一门新技术, 应当理性使用, 发挥最大效用, 努力规避风险。除了要针对其存在的问题努力完善大数据技术, 还应当依托政府颁布相关的政策法规, 规范市场秩序, 引导大数据技术的科学发展, 健全监管机制, 促使大数据技术更好地为电影行业服务。

摘要:随着数字技术的不断发展, 互联网时代的信息爆炸, 大数据技术开始进入人们的视野, 其价值越来越受到重视。如今, 大数据在金融、互联网等行业已经得到广泛应用, 电影行业也经历着以网络为核心的重大变革, 大数据技术开始渗入到电影生产的各个环节, 在给电影行业带来新的可能的同时也带来了诸多问题, 如扼杀艺术家才华、风险加大、侵犯隐私等。虽然目前大数据技术成为电影行业的一把“双刃剑”, 还面临着诸多问题及不成熟之处, 但不可否认它给电影行业带来了新的可能。作为一门新技术, 应当理性使用, 除了要针对其存在的问题努力完善其技术外, 还应当依托政府颁布相关的政策法规, 规范市场秩序, 引导其科学发展, 更好地为电影行业服务。

关键词:大数据,电影营销,电影放映

参考文献

[1]刘超.“大数据”时代:电影数据分析扼杀艺术家才华[EB/OL].http://cul.china.com.cn/cswh/2013-07/04/content_6085122.htm, 2013-07-04.

[2]搜狐副总裁刘春:影视创作不能迷信大数据[EB/OL].http://money.163.com/13/0626/04/9294GSNT00253B0H.html, 2013-06-26.

[3]陈肃, 詹庆生.电影大数据:分众和定制时代的思维方式[J].当代电影, 2014, (06) :4-9.

[4]艺恩网[EB/OL].http://www.cbooo.cn/m/612791.

大数据时代下信息数据安全的探讨 篇10

根据IDC (互联网数据中心) , 预计在2017年将达到530亿美元, 同时Google趋势反映出大数据的关注度, 表明我们已经进入到大数据时代, 所以各国在大数据方面提出了自己的发展部署。2012年3月, 白宫网站发布《大数据研究和发展计划》, 提出将通过收集庞大并且复杂的数字资料, 获得知识和洞见以提升能力, 并协助加速在科学上发现的步伐, 强化美国国土安全。欧盟启动了“未来投资计划”, 总投资3500亿欧元推动大数据等尖端技术领域创新。2013年9月中央政治局以实施创新驱动发展战略为题举行第九次集体学习, 主题之一就是大数据的发展情况。

1 什么是大数据

1.1 大数据的概念

顾名思义, 可将翻译为大规模数据或海量数据, 因为这些数据结构较为单一, 人们还能用传统的技术和方法进行分析和处理, 所以它并不能完全概括大数据的本质内涵。实际上大数据至今没有一个权威性的定义。麦肯锡称:”数据, 已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈余浪潮的到来”。亚马逊网络服务有一个简单的定义:“大数据就是任何超过了一台计算机处理能力的庞大数据量”。大数据在维基百科中定义为:”所涉及的数据量规模巨大到无法通过当前主流软件工具, 在合理时间内达到管理、截取、处理、并整理成为帮助企业经营决策更积极目的的信息”。综上意见, “大数据”被IDC定义为:为了更经济更有效地从大容量、高频率、不同类型和结构的数据中获取价值而设计的新一代架构和技术, 用它来描述和定义信息爆炸时代产生的海量数据, 并命名与之相关的技术发展与创新。

1.2 大数据的特点

目前, 较为统一认识的是大数据具有四个基本特点:第一, 数据量大。从TB级别跃升到PB或EB级别。第二, 数据类型多。比如视频、博客、图片、音频信息等。第三, 价值密度低。比如在连续不间断监控视频中, 有价值的可能就是一两秒。第四, 处理速度快。有些数据的实时性非常强, 需要很快的速度来处理。

1.2.1 数据量大 (Volume)

这是大数据的基本属性。根据IDC估计, 到2020年, 全球数据使用量预计将达到35.2ZB。使数据规模增加的原因有很多, 首先是迅速发展和应用的互联网, 比如, 社交网络、搜索引擎等网站、传感器及移动网络等都在不停的产生数据, 促使当前数据增长比以往任何一个时期都要快。其次是随着不同传感器获取数据能力的不断提高, 获取的数据也越接近于事物本身, 描述事物的数据量也会增加。最后是采样的样本不断变大, 以前是用少的数据量描述大事物, 这样得出结论可能不准确, 随着技术的发展, 样本数目逐渐接近原始的总体数据, 高数据量带来高的精确性, 可以从更多的细节来了解事物属性, 同时所需的数据量也会显著增多。

1.2.2 数据类型多样 (Variety)

这是大数据的重要特性。当前的数据存储、处理、查询都是基于数据格式统一、事先定义好的结构化数据。但随着互联网快速发展, 涌现出大量的非结构化数据, 由于非结构化数据没有统一的结构属性, 所以在存储时, 不但要存储数据还要存储结构, 这样增加了数据存储、处理的难度。目前人们上网不但要浏览新闻、网上购物, 还要发送微博、视频聊天及上传下载文件等, 那么这些数据大部分是非结构化数据。综上所述, 即将处于主流地位的非结构化数据量已占到总数据量的75%以上, 且增长速度比结构化数据快, 那么数据的分析和处理将面临挑战。

1.2.3 数据处理速度快 (Velocity)

大数据分析区分于传统数据挖掘的显著特征。随着微信、移动网络等信息传播、获取技术的不断发展, 数据的产生也更快速和方便, 产生数据的量也越大, 即呈新摩尔定律式的快速增长, 不断产生的数据也要求有相应的处理速度来匹配, 才能使得大数据发挥有效的作用, 否则快速增长的数据不能给解决问题带来优势, 反而变成一种负担。同时, 网络中的数据是不断变化的, 通常这种数据的价值会随着时间的变化而降低, 如果数据在规定的时间节点内没有得到有效快速的处理, 那么这些大量的数据就失去了其存在的价值。此外, 在许多环境中要求能够实时处理新增的数据, 比如在京东, 亚马逊、淘宝等电子商务网站中, 就具有很强的时效性, 大数据以数据流的形式产生、消失, 且数据量的产生表现形式不是一条直线形式, 而是呈现为波浪式, 这就要求对大数据的处理要快速、实时、持续。

1.2.4 数据价值密度低 (Value)

这是大数据的重要特性。从统计学角度看, 可以对传统的结构化数据进行采样, 然后进行抽象、分析和归纳等处理, 那么在进行采样时, 样本越大, 所得到的统计结果也就越接近于事物本身。但是对于大数据通常是直接采用全部数据, 由于省去了归纳和采样, 就包含了所有的数据信息, 保障了分析结果的可靠性, 但同时也带来了许多无用的信息, 所以大数据关注的非结构化数据的价值密度偏低。如果能将它们“提纯”并迅速处理为有价值的信息, 就相当于掌握了一把能够开启宝藏大门的钥匙。目前, 如何通过强大的机器算法更迅速地完成数据的价值“提纯”, 是大数据时代亟待解决的难题。

2 国内外开展的相关工作

美国政府由于意识到大数据技术的重要性, 所以将大数据看作“未来的新石油”, 把其作为战略性技术进行大力的推动, 于是, 在2012年3月宣布投资2亿美元资金启动“大数据研究和发展计划”, 大力改善和推动与大数据有关的政策, 组织和分析工具和技术, 以提升美国利用收集的庞大且复杂的数字资料, 提炼真相的能力, 协助工程领域创新步伐、加速科学, 转变教育和学习模式, 强化美国国土安全。

国内对大数据的应用主要集中在能源/制造、公共事业、金融等三大领域。2011年12月工信部发布了物联网“十二五”规划, 把信息处理技术作为4项关键技术创新工程之一被提出来, 其中包括了海量数据存储、数据挖掘、图像视频智能分析, 这都是大数据的重要组成部分。2013年11月国家发改委正式批复同意, 国家超级计算天津中心建设“面向新兴产业的大数据处理技术研发与应用”国家地方联合工程实验室。这也是目前国家发展改革委在大数据领域批准的第一家工程实验室。这些都说明了大数据得到了国家层面的充分重视。

3 大数据技术

大数据的核心思想是对数据采集、处理、加工、挖掘、分析等, 把数据资源转化为有价值的信息, 为政府部门、企事业单位和个人创造经济价值和社会价值。

3.1 大数据采集

随着互联网、云计算和物联网的迅猛发展, 传感器、RFID射频、移动设备及社交网络等方式所产生的各种类型的非结构化、结构化的海量数据, 要获取这些数据, 必须要解决针对大数据源的感知、识别、适配、传输、接入等技术。主要是提供大数据服务平台所需的虚拟服务器, 物联网资源和非结构化、半结构化和结构化数据的数据库等基础支撑环境, 重点要攻克分布式虚拟存储技术, 大数据获取、挖掘、分析等操作的可视化接口技术, 大数据的压缩技术、网络传输与大数据隐私保护技术等。

3.2 大数据存储

从海量数据时代开始, 大量数据的长期存储、数据迁移一直都是研究的主题。目前主要存储方式有:存储局域网络 (SAN) 、网络附加存储 (NAS) 、直接外挂存储 (DAS) 和IP SAN等。这几种存储方式虽然是不同时期的产物, 但是各有特色, 数据中心往往是根据要处理的数据对象和自身的服务器数量进行选择。此外, 最近这云端存储非常流行, 其实就是一种虚拟化的存储。所谓虚拟化, 就是将原有的服务器中的硬盘空间划分为若干个独立的小空间, 这样在一台服务器上就可以提供多种存储服务, 既节约存储成本, 又提高了存储效率, 也是异构数据平台的最好选择。

3.3 大数据挖掘

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们事先不知道的、又是潜在有用的信息和知识的过程。海量数据挖掘一直是热点和难点, 也是一种决策支持过程, 它主要基于人工智能、数据库、模式识别、机器学习、统计学、可视化技术等, 高度自动化地分析大量数据, 做出归纳性的推理, 从中挖掘出先前未知的并有潜在价值的信息, 帮助决策者调整市场策略, 减少风险, 做出正确的决策。

当前非结构化的数据是按TB级别增长, 以至于达到PB、EB级别, 因此无法使用常规的工具或技术来处理。由于大数据的规模是不断在扩大的, 所以在数据挖掘过程中要考虑其增长带来的影响, 因此, 大数据的挖掘需要采用云计算技术和分布式挖掘, 目前较流行的且适用于各种类型的大数据挖掘工具是Hadoop, 这个工具具有高效、高扩展、高可靠性和高容错率等特点。

3.4 大数据分析

众所周知, 在全部大数据中, 大约有80%是非结构化和半结构化数据, 而被利用的数据很少, 大部分的非结构化数据尚未得到开发利用, 所以最重要的是对大数据进行分析, 只有通过分析才能获取很多有价值的信息。那么越来越多的应用涉及到大数据, 而这些大数据的属性, 包括速度, 数量, 多样性等都是呈现了大数据不断增长的复杂性, 所以大数据的分析方法在大数据领域就显得尤为重要, 大数据分析普遍采用统计方法来进行。统计与分析主要利用分布式数据库, 或者分布式计算集群来对存储于其内的海量数据进行的分类汇总和分析等, 以满足常见的分析需求。

4 大数据面临的机遇和挑战

由于大数据会给企业和组织带来有价值的信息, 所以会形成以大数据为中心的一个完整的产业链, 在这个链上的每个节点即会产生相应的价值。但由于大数据是个新兴的产业, 所以在技术不成熟, 人才稀少及安全方面都会有一定的挑战。

4.1 机遇

大数据打破了传统信息体系架构, 将数据仓库转化为具有信息共享和连接、流动的数据池。大数据技术使人们可以利用非结构化的数据类型, 分析出有价值的信息, 从而使企业组织更加高效和智能。

(1) 大数据的应用和挖掘成为核心, 将从多个方面创造价值。大数据从采集、传输、存储, 一直到数据的挖掘和应用, 在这一系列的过程中, 会产生出多个方面价值, 这将会影响企业未来的运营模式。

(2) 在大数据使用中, 安全尤为重要, 这为企业带来发展契机。随着移动互联网、物联网等新兴IT技术迅速发展, 有价值的数据无处不在, 这对信息安全提出了更高要求。同时, 基于大数据领域出现的产品与技术将为安全分析提供新的可能性, 信息安全贯穿于大数据产业链的各个环节, 这将推动信息安全产业的大发展。

4.2 挑战

大数据发展在面临重大机遇的同时, 也面临一些挑战。

4.2.1 信息安全问题

目前, 人们生活越来越多地与互联网发生关联, 每天产生大量的数据, 如何防止非法用户对数据被篡改或窃取, 这不是一个防火墙就能满足安全要求的, 而目前中国相关法律法规还存在许多空白, 互联网监管还存在一些漏洞, 所以必须采取专门针对大数据的安全保护措施, 以满足大数据应用带来的新的安全需求。

4.2.2 人才和技术问题

设计和实施大数据解决方案, 需要专业化技术和工具, 包括建模、统计学、自然语言处理和可视化技术。目前, 我国数据产业发展仍然存在一些短板, 如核心技术缺失, 相关工具软件少, 复合型人才匮乏, 政府数据开放程度低等。大数据产业的发展, 不能光靠炒概念, 而是要遵循市场规律, 努力的把短板补上。

4.2.3 数据存储的问题

目前, 所产生的数据量正呈新摩尔定律增长, 但就数据的保存和管理来说, 目前的技术改进并不大, 而数据的易失性风险却在增加。大数据的存储将会是一个非常严重而现实的问题, 但最后还是要依赖于硬件进行处理和计算的, 所以硬件的更新换代将是大数据发展的基础。

5 结束语

随着人们对大数据的认识不断提高, 数据也将被越多的企业当作一种无形的资产, 那么与大数据相关工具的研发也将受到企业的重视, 处在大数据产业链中各个结点也将受益, 也将逐步提高自身的素质及服务水平。

摘要:随着移动互联网、便携设备和云计算技术的发展, 人类社会进入了“大数据”时代。人类产生、获取、处理和存储的数据量正以指数级别增长, 这样改变人类的生活、工作和思维方式。伴随着机遇和挑战的同时, 也有大数据本身安全问题, 如何解决这些问题, 并挖掘出有价值的信息是具有十分重要的意义。

关键词:大数据,数据挖掘,关键技术,信息安全

参考文献

[1]马建光, 姜巍.大数据的概念、特征及其应用[J].国防科技, 2013.

[2]严霄凤, 张德馨.大数据研究[J].计算机技术与发展, 2013.

大数据时代的电影业 篇11

关键词 大数据 科学数据 共享模式 公众需求 数据开放

分类号 G250.73

Abstract Scientific data are the important achievements of scientific research and the inevitable results of the development of science and technology. Four sharing modes of scientific data in the era of Big Data are introduced by this paper, that is the national policy-driven, the exchange between sectors, the enterprise development and the participation of international organizations. Finally, some suggestions are given for the development of sharing scientific data in China.

Keywords Big Data. Scientific Data. Sharing mode. Public demand. Open data.

1 概述

1.1 大数据时代的信息特征分析

随着社交网络、电子商务以及移动通信的发展,一个大规模生产、分享和应用数据的时代正在开启。以“PB”(1024TB)为单位的大数据时代已经来临。“大数据”一词由英文“Big Data”翻译过来。麦肯锡全球研究所报告《大数据:创新、竞争和生产力的下一个前沿》对“大数据”的定义为:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。

大数据走近人们视野不久,但业界公认的大数据有四个“V”字开头的特征:Volume(容量),Variety(种类),Velocity(速度)和最重要的Value(价值)。Volume是指大数据巨大的数据量与数据完整性,数据量级已从TB发展至PB乃至ZB,可称海量、巨量乃至超量。Variety则意味着数据类型繁多,越来越多地表现为网页、图片、视频、图像等半结构化和非结构化数据信息。Velocity是指数据传递速度快时效高,更快地满足实时性需求。Value则是大数据的终极意义——满足人类的需求,在尽可能短的时间内发掘其价值[1]。

1.2 科学数据的概念分析

科学数据是人类社会从事科技活动所产生的原始观测数据、探测数据、试验数据、实验数据、调查数据、考察数据、遥感数据、统计数据、研究数据以及相关的元数据和按照某种需求系统加工的数据,具有科学价值和使用价值[2]。科学数据是信息时代一种特殊的社会资源,具有明显的潜在价值和可开发价值,并在应用过程中得以增值。很显然,大数据这一宽泛的概念包括科学数据,科学数据也是大数据的内容之一。

2 大数据时代科学数据的信息共享需求

2.1 国家战略需求

大数据时代的到来使得数据成为一种资产,正成为与物质资产和人力资本相提并论的重要生产要素。科学数据这一具有战略意义的资源,更是成为社会的重要资产。一个国家和企业的发展在很大程度上取决于其科技创新水平,而对科学数据进行系统的综合分析是实现科技进步与创新的重要方式。无论是资源、能源的开发,还是高新技术产业化,无不是在科学数据的积累与支持下,实现理论与技术创新的结果。特别是在以知识为基础的经济中,越来越多的以知识、信息和数据应用为主要目的信息管理、加工与发布的产业,在现代信息技术引领下正在拉动“数字经济”[3],也就是现在正在发生的“大数据经济”。长期以来,我国已经积累了较为丰富的科学数据资源,但大多数仍存在于资料堆或档案柜中,没有经过有效的整理和建库,数字化程度较低,很多数据库往往局限于本部门、本单位使用,甚至个人使用,造成了科技资源的巨大浪费。所以打破科学数据壁垒,实施科学数据共享,是国家发展战略的必然要求。

2.2 科学研究的要求

当前的科学是多学科交叉的科学,是围绕数据展开的全球研究,并将越来越依赖于数据。科学研究就是科学数据的生产过程,一些科学数据本身就是其重要的研究成果。科学数据资源既是研究的成果与积累,又是支持更为复杂的创新研究所不可替代的资源存量。尤其在大数据时代,科学数据量激增,科学研究越来越依赖于系统的、高可信度的基础科学数据分析。21世纪以来全球科技活动不断增强,一系列重大科学工程的兴起、复杂科学问题研究的提出、大型科学研究计划的产生,导致前所未有的国际合作局面的形成,也导致了全球范围内对科技信息资源交流、互通的客观需求。因此,实现科学数据的共享,科学家就可以不再受限于数据的来源、格式以及国界,也不必质疑科学技术对于数据处理与存储的能力,可以在全球海量的科学数据中发掘创新的潜力。

2.3 科学数据的公众化需求

大数据的时代,科学数据的需求不仅仅局限于政府、科研单位以及企业,社会公众也越来越需要科学数据。科学数据对于社会公众,不仅仅是提高自身的知识水平和科学素养的源泉,也是日常生活中不可或缺的重要信息资源。如今个人电脑、智能手机及其掌上智能设备的普及,互联网的应用和发展,使得公众对这些基本科学数据获取的需求更为强烈。例如人们出行需要全球定位系统的信息,关注个人健康需要医学信息。以前人们出行导航只是了解路线,而现在可以用交通大数据采集到的信息来预测未来城市几点到几点的整个通行情况,给出行者提供一个非常好的决策帮助。同样,在医疗健康领域,大规模复杂数据已经变得很普遍,通过对大量病人的各类数据进行挖掘分析,可以更有效地找出疾病成因,进而提供针对性的预防、诊断和治疗措施。尽管社会公众大多数是非专业人士,但可见在大数据时代,公众对科学数据的质量要求是越来越高,对科学数据的发布渠道、发布频率、表现形式等要求也会越来越高。

nlc202309040905

3 大数据时代的科学数据共享模式研究

科学数据按基本社会属性分类,可分为战略性科学数据、公益性科学数据以及商业性科学数据[4]。目前科学数据共享模式主要表现为国家制约的公益性无偿共享模式和市场制约的产业化运行模式。前者强调数据的公开和公益性共享,后者强调保护数据产权和商品性质。具体来讲,有以下四种模式。

3.1 国家政策驱动模式

借鉴国际科学数据共享经验,美国是典型的国家政策驱动模式。早在1991年6月美国总统事务办公厅就发布了“全球变化研究数据管理政策”,该政策的核心就是实行“完全与开放”的科学数据共享。美国政府在科学数据共享方面根据投资来源的不同,严格区分两种不同的数据共享机制。政府拥有、生产和政府资助生产的数据纳人到“完全与开放”的共享机制中,即除涉及危害国家安全、影响政府政务和公务员个人隐私的数据外,其他都必须公开。私营公司投资生产的数据纳入到“平等竞争”市场化共享机制中。在这两种不同共享机制中,美国联邦政府均起到主导作用,所不同的是采取的方式和管理的环节不同。两种机制互相补充,促进全社会对科学数据的获取、共享和广泛应用。对于国有科学数据,由国家统筹规划数据共享机制与体系,提供数据共享工作预算和保障,以及相关政策法规的制定、完善和监察。“完全与开放”的科学数据共享政策,使得一度曾各自为政,混乱的数据管理走向有序运作的轨道,科学家从得不到数据的抱怨走向数据共享,科学数据的开发水平和开发能力逐步提高,惠及了地球科学、生命科学、材料科学等各个领域,也极大地刺激了美国经济的发展。人类社会在大数据背景下,数据开放已成为潮流。2009年,Data.gov网络平台在美国正式上线,按原始、地理数据和数据工具三个门类开放数据,截至2012年11月,Data.gov共开放388 529项原始数据和地理数据,汇集了1 264个应用程序和软件工具、103个手机应用插件。欧盟开放数据战略(Open Data Strategy)于2010年11月由欧盟委员会首次提出,并于2011年11月底被欧盟数字议程采纳,基本概念是公共经费支持的信息应该得到最广泛的使用,其中科学数据的开放是其全面开放数据政策的重要组成部分[5]。

3.2 部门之间交换模式

科学数据的共享首先应该从生产科学数据的部门共享开始。为避免重复生产,科研单位内部之间以及各科研单位之间的科学数据,在不侵犯知识产权的情况下,第一步要努力做到共享。以数据和信息为基础的经济、社会和科学发展中,一般情况下没有哪一个部门能够总是拥有某项科研活动需要的所有数据产品,尤其对于广大的科学社区,其研究内容广泛,对开放共享有着强烈的需求,研究过程中往往需要来自多个数据生产部门的不同区域、不同时期、不同尺度、不同学科的数据资源[6],因此部门之间的数据交换显得急需和迫切。例如,地震工作部门各单位收集并存档的各种地震科学数据,其他部门或单位为保障重大工程的建设安全而专门建立和管理的专用地震监测台网和强震动监测设施所收集并存档的地震科学数据,均属于共享范围[7]。浙江省地理空间数据交换平台项目目前是全国首家省级地理空间数据交换平台,由浙江省政府和国家测绘地理信息局合作共建、省测绘与地理信息局承建。该平台实现了浙江全省地理空间信息资源在各部门的交换与共享,已为近30家省级部门、市县用户和企事业单位提供相关地理信息服务,支持了40个业务应用系统[8]。

3.3 企业发展带动模式

现代企业的发展离不开信息和数据的支持,而企业的发展也能促进信息和数据的传播与分享。一个企业的发展需要科学的方案,也需要科学数据来进行产品的进一步研发以及科技成果的转化。数据积累量、数据分析能力、数据驱动业务而非流程驱动业务的能力将是决定企业生死存亡的关键。数据的重要性使得企业必将收集和分析海量的各类型数据,并快速获取影响未来的信息。在这一过程中,企业就会做出有益于科学数据共享的决策与措施,例如由企业出资的科学合作项目的开发,有企业参与的科学资源共享平台的构建,以及企业自建商业性的科学数据库。只有学术和产业价值融合,才能真正发挥科学数据的应用价值。虽然学术界和产业界关注的价值点并不完全一致,但仍存在一些共性,发现和利用其中的共性,对解决科学数据共享中出现的问题很重要。跨界合作是积极且有意义的尝试,学术界可以致力于基础技术的研究,盈利模式的分析则由企业去完成。同时,学术界和产业界在某些交叉领域形成竞争也是一种良性的模式。一些大企业会对前沿技术和数据积累追踪最新的学术成果,甚至自己做学术研究,学术界也在积极推进产业化思考。

3.4 国际组织参与模式

随着人们对科学数据共享意识的提高,越来越多的国际组织参与进来,进行国际间的交流与合作,满足国际社会对科学数据共享的需求。在国际科学联合会(ICSU)的组织下,1957年成立了世界数据中心(World Data Center),开展地球科学、空间科学和环境科学领域数据的收集、整理、系统化、标准化及交流服务等活动。世界数据中心不仅在地球科学、空间科学和环境科学领域积极推进了数据管理和共享,还积极参与许多重大的国际科学计划,为人类科学事业的发展作出了贡献。国际科技数据委员会(Committee on Data for Science and Technology)成立于1966年,其宗旨是提高科学数据的质量,推动对科学数据的收集、交换、服务和共享。CODATA 致力于提高对整个科技领域有重要变化的数据的质量、可靠性、管理与可访问性,向科学家和工程师提供对国际数据活动的访问,促进直接合作,并利用互联网初步构建了全球范围内的科学数据交换体系。CODATA 通过建立标准格式促进数据交换、共享,并协调各国数据项目,定期召开国际数据学术会议,提高国际对科学数据共享的认识和深入探讨数据共享等学科方面的问题。

4 结语

以上这四种科学数据共享模式相互交叉和渗透,在大数据时代继续存在并向深远发展。应该说我国的科学数据资源十分丰富,近年来国家各有关部门相继成立了专门的信息中心,如国家基础地理信息中心、国家海洋信息中心、国土资源部信息中心、国家气象信息中心等等,这些信息中心成为政府部门向社会提供公益性、基础性服务的重要窗口。我国目前需要从政策法规、技术规范、组织管理各个层面保证科学数据共享工作的顺利进展。

nlc202309040905

首先,相较于欧美发达国家,我国政府对有关法规政策的发布还远远不够,应对大数据的挑战,政府必须出台更多关于科学数据共享和数据开放方面的法规政策。

其次,加大数据开放平台的建设。大数据时代开启“智慧城市”的建设,“智慧城市”是在城市化与信息化融合等背景下,综合利用物联网、云计算等信息技术手段,结合城市现有信息化基础,融合先进的城市运营服务理念,建立广泛覆盖和深度互联的城市信息网络,对城市的资源、环境、基础设施、产业等多方面要素进行全面感知,并整合构建协同共享的城市信息平台。“智慧城市”建设内容繁多,在数据开放平台的构建中离不开科学数据的支撑,也从中促进科学数据的共享。

最后,在国际科学数据共享的大环境中,积极参与国际合作与交流,借鉴国际上先进的共享模式与经验,只有这样才能提高我国科学数据共享水平,让科学数据真正走出封闭的实验室,走向社会,走向世界。

参考文献:

[ 1 ] 赵国栋.大数据的定义和特征[EB/OL].[2013-10-11].http://blog.sina.com.cn/s/blog_537e497a01019pi3.html.

[ 2 ] 江洪,钟永恒.国际科学数据共享研究[J].现代情报,2008(11):56-58.

[ 3 ] 黄鼎城,郭增艳.科学数据共享管理研究[M]北京:中国科学技术出版社,2002:36.

[ 4 ] 黄鼎城,郭增艳.科学数据共享管理研究[M]北京:中国科学技术出版社,2002:130-140.

[ 5 ] 欧盟委员会副主席Neelie Kroes:希望每个欧洲人都

参与数字化[EB/OL].[2013-10-11].http://www.open-access.net.cn/5f00653e83b753d652a86001/20125e74/46708/6b2776df59d454584f1a526f4e3b5e2dneelie-kroes-5e0c671b6bcf4e2a6b276d324eba90fd53c24e0e-65705b575316.

[ 6 ] 刘润达,赵辉,李大玲. 科学数据共享平台之数据联盟模式初探[J].中国基础科学,2010(6):27-32.

[ 7 ] 地震科学数据共享管理办法[EB/OL].[2013-10-11].http://data.earthquake.cn/policy/gxbf.htm.

[ 8 ] 浙江建成全国首家省级地理空间数据平台[EB/OL].[2013-10-11].http://kjsb.zjol.com.cn/html/2013-02/22/content_21927.htm.

左建安 南京大学信息管理系2011级硕士研究生。江苏南京, 210093。

陈 雅 南京大学信息管理系教授。江苏南京, 210093。

(收稿日期:2014-02-08 编校:刘 明)

大数据时代的CFO 篇12

一、大数据时代:CFO的职能与地位

互联网时代, C T O的角色急剧上升, 成为影响互联网科技企业走向的重要管理者;同样, 大数据时代, CFO将在企业价值创造中扮演更为重要的角色, 因而也将享受更高的待遇和拥有更广泛的管理职能和更大的管理权限。

(一) 向整合型CFO的转变

CFO在公司治理结构中的重要程度与企业发育状态高度相关, 销售驱动型企业 (营业额1亿元-20亿元) CFO基本处于账房先生状态, 附加值相对较低, CFO可发挥价值空间大约为25%;管理驱动型企业 (营业额20亿元-100亿元) CFO天然处于业务流程的中枢位置, 成为企业走向精益管理的发动机, 但前提是管理层对此的认同, CFO可发挥价值空间大约为50%;资本控制型企业 (营业额100亿元以上) 将是未来中国式跨国公司演变的最终形态, CFO可发挥价值空间最高达100%。

对应下来, CFO具体可分为三种:第一种是核算型CFO, 该类型CFO业务焦点为以核算为基础的流程管理;第二种是管理型CFO, 该类CFO业务焦点为以效率与风险为核心的流程管理;第三种是价值创造型CFO, 该类CFO业务焦点为以资本运作为核心的集团整合。

从核算型CFO到管理型CFO到整合型CFO, 突出表现在三种能力的全面提升:经营活动的反映能力、风险控制能力、决策支持能力。

整合型CFO要更好地履行财务总监的角色, 必须做好四方面工作:支持企业战略、管控业务过程、完善流程运营、创造企业效益。

(二) CFO向CPO (首席绩效官) 的转变

据美国最佳实务研究和定量分析顶尖机构CFO执行委员会 (CFO Executive Board) 2011年调查显示, 财务部门被迫浪费大量的时间在搜集和验证数据 (47%) 以及管理流程 (50%) 上, 相反, 最为核心的增值分析只占据23%的比例。造成这种现状的直接原因便是前瞻理念以及核心技术的缺失。这个时代的CFO以及其带领的财务部门已然站在了重要的抉择关头:要低绩效的现状还是高价值的新角色?结果显而易见。CFO执行委员会 (CFO Executive Board) 2011年调查显示, 65%的CFO将商业智能、分析、绩效管理视为公司最重要的年度技术计划。《麻省理工学院斯隆管理评论》和IBM商业价值研究院联合举行的2011年新智能企业全球高管调查和研究项目指出, 2011年, 58%的企业已经将分析技术用于在市场或行业内创造竞争优势, 实现业务价值, 这一数据比2010年增加了21%。

从上文的数据中我们可以得知, 大数据时代CFO的主要职能在于价值分析和企业整体绩效的提升。通过利用先进的管理技术和平台, 对海量的财务、商业数据进行分析, 进而发掘价值增长点。通过高效的财务流程对企业的现金流、收购兼并、资源配置、风险管控等进行管理, 利用大数据等分析工具获得深度洞察, 将资源更好配置在快速增长的领域, 从而不断为企业创造价值。

二、大数据时代:CFO的挑战与洞察

全球最大的管理会计师组织——英国皇家特许管理会计师公会 (C I M A) 以及美国注册会计师协会 (AICPA) , 日前联合对全球2000多位财务高管进行的调研显示, 34%的受访者认为对大数据的错误分析或不利于营收, 86%的企业表示难以把日益庞大的数据量转化成有价值的管理洞察力, 44%的受访者表示自己的公司缺少这样的技术实力去理解并利用此项新技术, 只有53%的企业在为增强自身的大数据能力而进行投入。

调研结果与人们对大数据未来价值的预期大相径庭。87%的人认为大数据以及相关的分析技术将在未来十年改变商业的面貌, 不去利用这项新技术, 将导致企业在十年后被淘汰出局。

受访者表示, 企业在试图通过大数据洞察管理时, 面临以下障碍:从不同的数据库及数据孤岛抓取数据的困难 (62%) ;首先确保抓取的数据是可靠的、高质量的 (51%) ;能从非财务数据中提炼出管理意见 (46%) ;确保从数据中得来的管理意见可以用于改进绩效 (43%) ;在海量数据中找出有意义的趋势及见解 (39%) ;智能可视化报告 (34%) 。

上述数据对各大企业的CFO及总会计师来讲, 挑战无疑是十分巨大的。面对挑战, CFO和总会计师们应该如何应对, 以便在未来的竞争中占据制高点呢?

(一) 迅速而深入地学习新的分析方法, 修炼深厚内功

大数据时代, 数据本身的性质、特征发生了巨大变化, 分析、处理数据的技术和方法也发生了极大变革。大数据的分析处理将主要由相关的专业人士或由专业软件来进行, CFO或总会计师并不需要精通所有分析技术和技巧。但最基本的分析技术还是需要掌握的, 否则不利于CFO和总会计师从全盘的角度考虑问题。

(二) 尽早着手大数据处理平台建设

大数据是大势所趋, 但各企业对于大数据的敏感度并不一致, 像一些大型集团企业或互联网企业可能需要以较快的速度推进大数据处理平台建设, 而一些中小型企业则可能在时间上的要求并不那么紧迫。大数据处理平台建设是一项战略行动, 需要董事会及其他高级管理层取得共识才能顺利推进, 所以CFO和总会计师必须在协调各方思想方面付出更多时间和更大精力。

(三) 建设更加智能的信息管理体系

上一篇:自主合作探究式教学下一篇:水利灌溉管理