媒体大数据(共12篇)
媒体大数据 篇1
一、大数据的概念
大数据 (Big Data) 并不是一个全新的概念, 这个词汇诞生前, 我们通常将类似技术称为数据仓库 (Data Warehouse) 或商业智能 (BI) , 那么为什么大数据会在最近一两年成为和云计算齐名的新名词呢, 关键在于大数据所蕴含的商业价值, 坦率的说挖掘出这些商业价值并非易事, 它需要一套完整的方法论及配套的IT工具。目前大数据在互联网行业特别是电商应用比较深入, 也产生了可观的价值, 媒体本身是数据制造者, 但并未顺理成章的成为大数据驾驭者, 究其原因主要是因为媒体的数据尚未形成完备的价值链分析体系, 所以这些数据没有产生增值效应, 伴随全媒体时代的到来, 媒体需要将全价值链的数据整合, 应用相关的IT技术实施挖掘, 把媒体大数据的价值提炼出来, 为指导媒体从信息采集、加入、生产、投放的全流程提供有价值的决策信息。
大数据目前没有准确概念, 我们通过分析大数据的特点, 尝试给出一个概念轮廓:业界通常用Volume (容量) 、Variety (种类) 、Value (价值) 、Velocity (速度) 这4个V来概括大数据。大数据的特点包括:第一, 数据体量巨大, 从TB级别跃升到PB乃至EB级。第二, 数据类型繁多, 按照组织类型分为结构化、非结构化和半结构化数据, 按照使用类型分为文本、图片、音频、视频、网页、表格、日志等无限多类型的数据。第三, 价值数据挖掘难度大, 即价值密度的高低与数据总量的大小成反比。以视频为例, 一部一小时的视频, 在数据挖掘过程中有用的数据可能仅仅只有几分钟, 如何通过云计算更迅速地完成大数据的价值“提纯”是目前大数据价值体现的关键。第四, 大数据的价值生成速度, 我们常说效率就是金钱, 在大数据领域同样适用, 同样的大数据你先分析出价值点, 就会领先竞争对手生产适销对路的产品, 对于媒体更是如此, 同样的报道, 如何组织更适合受众欢迎的内容, 大数据的分析工具会给你一些启示, 这些启示可能就是领先对手的价值点。
二、大数据的价值
大数据的价值是怎样体现的呢?我们不妨分析两个成功案例, 第一是e Bay, 互联网行业的代表, 第二是沃尔玛, 传统行业的代表。
“e Bay在5年前就建立了大数据分析平台。在这个平台上, 可以将结构化数据和非结构化数据结合在一起, 通过分析促进e Bay的业务创新和利润增长。”e Bay分析平台高级总监Oliver Ratzesberger如是说。现在, e Bay的分析平台每天处理的数据量高达100PB, 超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为, e Bay定义了超过500种类型的数据, 对顾客的行为进行跟踪分析, 最显著的变化反应在广告费上。e Bay对互联网广告的投入一直很大, 通过购买一些网页搜索的关键字, 将潜在客户引入e Bay网站, 为了对这些关键字的广告投入、产出进行衡量, e Bay建立了一个数据分析系统。通过这个系统, 可以精确计算出每一个关键字为e Bay带来的投资回报, 通过对广告投放的优化, 自2007年以来, e Bay产品销售的广告费降低了99%, 顶级卖家占总销售额的百分比却上升至32%。
传统零售商巨头沃尔玛, 早在1969年就开始使用计算机来跟踪存货, 1974年就将其分销中心与各家商场销售情况运用计算机进行库存控制;1983年, 沃尔玛所有门店都开始采用条形码扫描系统;1987年, 沃尔玛完成了公司内部的卫星系统安装, 该系统使得总部、分销中心和各个商场之间可以实现实时、双向的数据传输。采用这些在当时还是超前的信息技术来搜集运营数据为沃尔玛最近20年的崛起打下了坚实基础。如今, 沃尔玛拥有着全世界最大的数据仓库, 在数据仓库中存储着沃尔玛数千家连锁店在65周内每一笔销售的详细记录, 这使得业务人员可以通过分析购买行为精确了解他们的客户。
从上面的案例我们可以看到对于现代企业而言, 大数据已经不是可选项, 而是必选项, 谁的数据越多, 分析结果越好, 谁就越有可能立于不败之地。IDC在其关于大数据的报告中指出, 领军企业与其他企业之间最大底差别在于新数据类型的引入, 那些没有引入新的分析技术和新的数据类型的企业, 不太可能成为其行业的领军者。
数据资产正在当仁不让地成为现代商业社会的核心竞争力。与其他行业相比, 互联网行业已提早感受到大数据对商业价值带来的深刻变化, 当很多企业还在因为大数据对本行业的变革无所适从时, 一些互联网企业已经完成了核心竞争力的重新定义, 这种核心竞争力的体现意味着大数据时代的来临。
媒体无一例外都握有大量数据, 但这些数据通常只是媒体的生产内容, 并没有把从生产者到消费者的全价值链数据整合起来, 比如媒体的营销数据是否已和生产数据实现精确关联, 所有类型的数据是否已实现精确地元数据描述, 这些都是进行大数据分析的关键。
三、如何使用大数据
1、媒体中大数据的产生及应用方式
要驾驭大数据首先要清楚它产生的过程, 我们看一下典型媒体大数据的产生流程 (见图1) 。
通过图1可以看出, 媒体的全流程生产都会产生数据, 这些数据该怎样获取呢, 笔者提出如下建议:
(1) 传统环节的数据整合, 这主要涵盖信息的采集、加工和投放, 这些数据可以直接获取, 并可按照行业标准的XML格式进行描述, 这些数据的整合很多媒体都已完成 (通常称为媒资系统) , 优化的方向是逐渐提升元数据描述精度和广度。
(2) 传统方式用户行为数据, 因为很多数据没有电子化, 这部分数据的采集比较困难, 需要涉及人工或第三方途径获取行为数据, 但数据本身仍然很有价值。
(3) 新媒体方式用户行为数据, 数据完全电子化, 采集比较容易, 核心点在于采集的数据颗粒度要足够细致, 如受众对于某信息的获取方式是直接浏览还是搜索链接、使用的什么关键词找到、浏览过程页面停留时间等多维度数据信息。
在获取了相当数量的大数据后就要对它进行分析了, 这里同样提出一些基本原则:
(1) 大数据的价值就像散列在沙子中的金粒, 不可能一下全部提取出来, 也很难全部提取出来, 它是遵循人们对知识的认知过程来逐渐体现价值的。按照循序渐进的原则, 先找出一些最基本的规律进行分析, 比如信息、受众及获取方式的分布规律, 不同信息内容与受众群体的分布等等。
(2) 逐步开始培养数据分析师。大数据的价值体现关键还在人, 因为大数据的分析模型是人设计的, 其他类似云计算、数据仓库、BI等技术只是不可或缺的工具。伴随着大数据的发展, 一类被称为数据分析师的高端人才也应运而生, 所以媒体若想用好大数据是需要一支数据分析师队伍。
(3) 大数据的分析结果可以指导媒体设计产品类型及增值方式。通过分析信息产品的受众分布可以帮助设计更多产品类型及计算人员分布合理性, 通过分析产品的组合获取方式可以设计更加合理的增值产品。
(4) 大数据辅助高层决策。大数据的分析结果是建立在数据基础上的科学分析, 换句话说它的计算结果是完全量化的, 所以当媒体高层需要对企业战略发展作出决定时, 合理的大数据分析结果可以提供非常有价值的决策支撑。
前面对媒体如何使用大数据在业务层面进行了简单分析, 在技术层面我们同样需要分析目前的技术是否已经为大数据做好准备?
2、构架面向未来的大数据系统
传统应对大数据的IT技术通常是数据仓库或BI, 通过应用大型关系数据库、多维分析引擎、小型机、SAN存储可实现对一定规模结构化数据的分析, 可以看出, 传统IT技术的计算能力及存储能力以纵向扩展为主, 横向扩展一般, 这对于一般规模的数据挖掘问题不大, 但是当面对大数据的4V特性时, 传统IT技术就显得力不从心了, 伴随着云计算时代的到来, 完全的分布式计算和分布式存储是解决大数据分析的最佳利器。
分布式计算和分布式存储在互联网等超海量数据处理领域已经得到了大量成功应用, 实践证明这种体系架构是一种高度伸缩的, 计算能力及存储能力趋于无限扩展的高性价比数据处理平台, 这个平台的典型代表就是Hadoop或者基于此架构的延伸产品, 它可以在一个平台很好解决大数据的两个关键问题, 即数据的存储和数据的分析计算, 所以基于此平台建设的大数据系统有如下特点:
(1) 本身就是云计算平台。处理好大数据一定需要一个强大的计算平台, 很多企业都已开始尝试建设自有的云计算平台, 这些平台达到一定规模后就直接可以用于部署大数据, 而大数据又可以充分利用云计算平台的计算能力, 所以从这个意义上讲, 大数据和云计算是珠联璧合, 云计算是基础, 大数据是应用。
(2) 大数据系统和原有数据平台是融合关系。这种融合体现在两方面, 首先是原有数据平台是数据源, 经过ETL过程后数据进入大数据系统, 但并不是所有数据都进入, 这主要取决于需要分析的内容和分析的方式;第二并非所有分析都在大数据平台上完成, 原有数据平台已经具备了一定的分析能力, 这些分析功能不应浪费, 而应该集成, 即大数据分析系统是所有数据平台分析结果的总集合, 每个数据平台仍然承担一定的分析任务, 只有最适合或是计算任务最复杂的分析直接在大数据系统上完成。
(3) 大数据系统是一个整合的分析平台。基于Hadoop架构建设的大数据系统并不是万能的, 它的Map/Reduce模式更适合于海量半结构化数据的并行处理, 传统RDBMS、BI仍然在结构化数据处理方面拥有不可替代的优势, 所以大数据分析系统应该是一个整合的分析平台, 即每种分析过程都有最适合的技术, Hadoop本身的分析工具目前也不够完善, 还远未达到类似RDBMS、BI商品化软件的完成度, 所以如果计划使用Hadoop架构, 是需要一只能力较强的软件开发队伍。
(4) 分布式数据存储。大数据系统要同时面对超海量数据存储及超多类型数据处理两个挑战, 要实现解决这两个挑战的和谐统一, 首先需要选择一个强大的分布式数据存储平台, 也称集群存储系统。它要实现随着数据量的提升性能可线性增长, 同时要处理好各种类型数据进行分析时整体系统的负载是基本均衡的, 这是一个比较复杂的课题, 它和数据的分布方式及分析过程都密切相关, 所以在构建大数据系统时要考虑这些问题, 也许只有相对最优方案, 因为谁都不知道大数据到底能找到多少价值。
(5) 建立中间层数据接口标准。由于大数据分析是多个子系统协同计算的过程, 所以各子系统的结果数据及子系统之间数据交互是需要一套标准的, 这个标准要实现可以追踪任何颗粒度的数据在大数据系统全流程是如何变化的, 这样任何数据及任何系统间的分析都是可以互相继承的, 这个标准程序化后将演进为虚拟层, 即分析师不用关心数据源在什么地方, 而只需设计某分析系统需要使用哪些数据得到什么结果。
(6) 重要的是先做起来。前面的描述可以看到构建一个完整的大数据系统并不简单, 但这并不妨碍我们把事情先做起来, 在大数据应用最纯熟的互联网行业, 他们通常遵从简单、直接的原则, 即并不对数据进行大量的重新整合, 原有数据能直接利用就直接利用, 目的就是通过尽量简单的方式得到分析结果, 所以借鉴这个原则, 媒体应该首先对目前已有的数据进行分析, 找到一些规律, 即明白自己需要什么, 目前的系统提供不了什么, 这样才能为构建成熟的大数据系统打下基础。
四、总结
通过上面分析我们不难看出大数据基本遵循着“数据收集-知识形成-智慧行动” (引自驾驭大数据一书) 的过程, 同时应该看到“数据只是源, 思想才是分析之父, 有价值有影响力的分析才是优质分析”。大数据的分析结果是区别于报表或固定数据呈现模式的, 它是媒体把握现状、预测趋势的一种利器, 充分利用好大数据可以更好地驾驭未来。
今天的大数据时代, 让商业的生态环境在不经意间发生了巨大变化, 媒体和受众的界限正在变得模糊, 无处不在的智能终端, 随时在线的网络传输, 互动频繁的社交网络让信息传播方式发生了革命性变化, 同时意味着媒体第一次有机会进行大规模、精准化的受众行为研究, 作为对变革最敏感的媒体行业, 应该主动地拥抱这种变化, 从战略到战术层面做好更加适应这个新时代的准备。
媒体大数据 篇2
今天给大家讲讲基于大数据究竟可以告诉我们什么?基于现实中的几个案例我们来用事实进行分析:
意料之外:胸部最大的是新疆妹子
某宝【大数据】平台显示,购买最多的文胸尺码为B罩杯。B罩杯占比达41.45%,其中又以75B的销量最好。其次是A罩杯,购买占比达25.26%,C罩杯只有8.96%。在文胸颜色中,黑色最为畅销。以省市排名,胸部最大的是新疆妹子。啤酒与尿布
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的【大数据】分析成果早已成了大数据技术应用的经典案例,被人津津乐道。数据新闻让英国撤军
2010年10月23日《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
Google成功预测冬季流感
2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的【大数据】进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。大数据与乔布斯癌症治疗
乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命
磨砺营IT教育版权所有
http://
大数据可以鉴别产品真假
意大利帕马森雷佳诺干酪同业公会是一间防止造假或无证生产帕马森雷佳诺干酪的质量监控联营公会。过去,判断干酪的真伪是一个极为耗时的复杂过程,需要手动抽查 600多家乳品店。而现在,大数据分析解决方案提供的条码标签和传感器功能,让其能够有效监控日常生产与产品,从而帮助他们准确判断和追溯每批产品是否纯正。也帮助了客户解决风险和欺诈的挑战。
大数据可以降低成本,增加营业额
迪凡斯动物园和水族馆只能凭借以往的经验猜测每一天的游客数量,并决定聘用多少员工以及准备多少物资。现在通过大数据分析解决方案,他们可以将移动端验票及天气预报等多个不同来源的数据关联在一起进行综合分析,实现了对游客数量的精准预测。同时,从这些数据中获取洞察,帮助他们能够更好地预测游客需求,并且做出更加有效的业务决策,让游客在每一次游览中都能获得满意的服务。
过去对于企业来说,消费者仅仅是个模糊的概念。通过大数据,让企业能清晰的触摸到用户们的“轮廓”,让企业更准确地捕捉用户的需求和消费心理。同时,通过对数据资源的收集和挖掘利用,企业获得了取之不尽、用之不竭的信息资源,一切变的可量化。大数据颠覆了传统企业的生产模式,引发了管理变革,成为了企业再现代化新的驱动力。
今天的大数据时代,让商业的生态环境在不经意间发生了巨大的变化,无处不在的智能终端,随时在线的数据传输,互动频繁的社交网络让消费者的面孔从模糊变得清晰,对于企业来说,企业第一次有机会进行大规模的精准化的消费者行为研究;作为保持着持续变革欲望的企业,主动地拥抱这种变化,从战略到战术层面开始自我的蜕变和进化将会让企业更加适应这个新的时代。
当别人还在说故事用想象来建构未来的时候,我们已经开始用数据绘制新的商业蓝图。
大数据时代新旧媒体共生共赢之路 篇3
2013年全球每秒钟发送290万封电子邮件,每天Twitter上发布5000万条消息,Youtube上传视频2.88万小时…… “大数据元年”来临了,同时催生了一大批新媒体,在一定程度上威胁着传统媒体的生存,加速新闻产业的变革。但在实际中,我们也看到新媒体犹如一把双刃剑,在为传统媒体的发展提供新契机的同时自身也“受伤”,两者唇亡齿寒的相互依存局势成了当下的传播现实。
一、新旧媒体的优劣比较
(一)新媒体的优劣势
一般认为新媒体是继报纸、电台、电视台等旧媒体之后在新的技术支撑体系下出现的媒体形态,包括:网络广播、网络电视、手机电视等。其主要特点是传播速度快、覆盖面广、互动性强。
1.新媒体的优势
提升新闻时效性。报业竞争主要表现为时效性的比拼,但是在信息技术支持下的电子媒体,正在迅速瓦解报纸的这种传统优势,例如,广东南方报业传媒集团为了增强时效性,以全媒体的视野,将集团主办的报刊数字化,做报网互动,在官方网站同步发布相关新闻的同时,还推出可用手机阅读的电子版、官方微博,让不愿意看报纸的人也能随时随地看到南方报业的报道。
增强受众主动性。传统媒体的受众易受到时间、地点、空间等多种客观因素的影响,几乎不可能自主决定在何时、何地、以何方式来接受信息,而新媒体则能够打破制约受众接受信息的各种限制因素,让他们能够以手机短信、移动网络等方式掌握国内外的最新动态和资讯,实际上,新媒体的出现已经在不知不觉中使人们与生活对话的方式发生了翻天覆地的变化。
减少信息成本。与报纸相比,新媒体在信息获取量方面有了跨越式的提升,而在终端设备技术、传输技术高速发展的支持下,新媒体的信息获取成本已近乎于零,可以说,低成本发行网络带给报纸的传统优势在新媒体的冲击下已经荡然无存。
新媒体无边界。新媒体打破了电视收视的空间限制,将新进技术应用到手机电视、车载移动电视和楼宇电视,帮助媒体和广告商锁定旧电视难以把握的年轻人和高收入群体等。消解旧媒体之间的边界,消解国家之间、社群之间、产业之间的边界,消解信息发送者与接收者之间的边界。
2.新媒体的劣势
消息缺乏权威性。大多新媒体过分追求新闻发布速度或者为了追求点击率而忽略了新闻的真实性,导致新媒体信息的可信度降低。根据最近的《中国十二城市互联网使用状况及影响调查报告》的统计结果(中国社科院发展研究中心发布),报纸、广播、电视三大传统媒体依然深得广大网民的高度信任,而网络新闻则名落孙山,在信任度排行榜上位列倒数第一。
易传播不良信息。由于新媒体的新闻生产者没有任何准入标准,个人道德素质无法鉴别评价,特别是不少网络上的虚假信息,混淆视听。因此,准入门槛的不存在使新媒体新闻的真实性失去了专业和道德的屏障,为一些不健康的因素以及低级趣味提供了滋生和繁衍的温床,导致思想道德和文化品位出现滑坡现象。
(二)传统媒体优劣势比较
1. 传统媒体的优势
学术价值高。每一种图书、期刊都有与之相对应的学术领域,撰写任务主要由学者和专家们完成,并且在撰写之前已经对受众需求等内容进行了严格的调查。所以,那些具有较高学术水平的作品大多由旧媒体创造,在指引科研方向、开拓学术领域等方面发挥着重要作用,而这种作用,是绝大多数新媒体所不能比拟的。
专业化运作。如期刊、图书等旧媒体,无论是在信息采集、内容审阅,还是文字润色、制作成书等环节,都有专业的技术人员进行严格地把关。在专业化运营模式的制约下,只有那些真正具备专业水准的优秀原创作品才能最终脱颖而出,并最终使旧媒体在信誉、品牌、权威性等方面具有独特优势。
2. 传统媒体的劣势
对受众缺乏了解。事实上,旧媒体的软肋从产生起就开始存在。读者是谁,在哪里,有何需求,是否变化等此类问题,基本上凭借一种定性式的估计。
传播速度慢。相对于新媒体而言,传统媒体的传播速度慢得多。如报纸,当天发生的事情一般只能第二天才能见报。
二、新旧媒体的关系
人类传播史一再告诉我们,传播媒介和传播技术始终呈叠加性状态发展,任何新媒介都不可能完全取代已有的旧媒介。如今,各类传统媒体的数字化步伐加快,逐渐演变成为新媒体。新媒体扬长避短,通过资源整合,发挥了更大的传播效应,新旧两种媒体形成一种共存共荣的局面。
媒体形式。由于虚拟化、无纸化是新媒体所呈现最多的两种状态,所以受众难免因此对其产品与服务的质量产生疑虑,而传统媒体的呈现方式则具备感性特征,如杂志、报纸都可以拿在手中被实实在在地感受到。另外,新媒体对物资设备都有较高的要求,传统媒体则具备成本低廉、方便阅读等优势。
媒体内容。由于开放度较高,所以一些违背社会道德规范的内容难免会进入新媒体的传播体系,并在受众当中造成负面的后果与影响。传统媒体由于受各类政策和技术的制约,其传播体系中极少出现违背社会道德规范的内容,从这个角度来看,较少的内容和资源反而成为传统媒体参与竞争的有力武器,而实际上,新媒体在内容方面对传统媒体还是有着较高依赖度的。
媒体受众。根据近年来“全国城市居民媒介与消费调查”的统计结果,杂志受众在传统媒体受众中所占比例最高,广播对于开车族的吸引力有增无减,绝大部分时段的电视观众保持平稳,并且有向晚间黄金时段集中的趋势。阅读网站新闻则进入到网民上网目的的前五名。从以上结果我们可以看出,新媒体与传统媒体各自掌握着不同的受众群。
媒体管理。传统媒体所采取的严格管理机制在很大程度上确保了自身在受众心中的公信力,在这种约束的影响下,传统媒体也逐渐具备了严谨和规范的特征。而新媒体由于属于开放性的平台,而且管理机制相对模糊,所以在很多时候所传播的新闻只有通过传统媒体的确认,受众才能够完全相信和接受。从这一点我们也可以看出,模糊的管理机制极大地弱化了新媒体的权威性与公信力。
nlc202309051127
三、新旧媒体共生共赢之路
(一)传统媒体数字化之路
1.顺应时代发展,占据新兴内容产业制高点。要以原有的媒介内容为基础,通过开设独立网站的方式对信息的内容和总量进行进一步地扩张,使自身成为跨媒体的信息平台。也可以采取联合经营方式共同完成一个大型新闻网站的创办和经营,不同媒体依然负责各自的优势领域,以此获得信息的规模优势与更强的综合展示能力。
2.做数字化媒体的建设者,使传统媒体焕发新活力。挖掘资源特质,最大程度地满足依旧对旧传媒抱有浓厚兴趣受众群体的实际需求,对自身产品进行进一步的扩展,例如,以提供广告和资讯服务为主的免费报刊,以生活服务为主的社区类报刊,以深度解析为主的新闻类报刊。
多品牌延伸。品牌延伸的可行方向主要包括:电子商务、电子图书和期刊、网络视频和音频业务、中介服务、会展经济等领域,以便更好地实现对新市场的拓展和占领。
3.整合既有资源,提升核心竞争力。对于产业内部而言,所谓资源整合,就是将产业内部零散的价值碎片整合在一起,让提供给受众的服务不再是种类繁多又彼此独立的价值存在,而是在每一则具体的知识、智慧和信息服务之外,带给受众以生活方式的昭示以及精神家园的归属感。对于产业外部而言,资源整合则是要打破传媒的介质壁垒与现有的传媒经营格局,实现传播形态向不同介质形态的迅速扩张,以此满足信息时代对于传媒产业所提出的新要求。
旧传媒产业的发展,既离不开多渠道的行业资源以及广泛的社会资源的配置与整合,也需要行业资源的内部良性配置,所以,在开展科学、全面、深入可行性研究的同时,我们还必须要进行切实可行的制度安排,从而创造出适应社会发展需要的运营模式,进而加大传媒政策的开放力度。
(二)新媒体发展途径
新媒体的发展,就是对传统媒体的影响力进行分流,同时最大限度冲破自身局限性的过程,不过就目前的实际情况来看,新媒体内容的整合与发布,或多或少都要借助传统媒体的力量来实现,所以我们可以判定,随着我国知识产权制度的进一步明晰,缺乏整合能力与原创内容的新媒体在内容方面的劣势会被进一步放大。而想要解决这个问题,新媒体一方面要加大从业人员信息获取的能力,另一方面也要注意扩大自身在互动性方面的优势,最大限度调动受众原创的积极性,让自己的内容变得更加丰富多彩。
(作者单位:广州市教育科学研究所教育导刊杂志社)
参考文献
[1]张骋. 新媒体时代传媒的转向——从工具到本体[J]. 编辑之友,2013(8):48-50.
[2]高永亮. 广播电视媒体强化“新闻立台”的路径探析[J]. 现代传播,2013(8):157-158.
[3]王志刚,谢芳.新媒体环境下的报纸受众特征[J]. 青年记者,2013(17).
[4]张意轩,于洋. 大数据时代的大媒体. 人民网-人民日报,2013–01–17.
[5]张涛甫,项一嶔. 大数据时代的传统媒体突围 [J]. 新闻记者,2013(6):35-36.
[6]赵晶,徐喆. 大数据时代:媒体的发展现状及其趋势[J]. 今传媒,2013(9).
大数据引发媒体变革 篇4
1. 大数据的分析和挖掘
“大数据”一个起源于欧美的词汇。真正提出Big data(大数据)一词的是美国麦肯锡全球研究院(MGI)于2011年5月发表的一篇名为“Big data:The next frontierfor innovation,competition and productivity”(大数据:未来创新、竞争、生产力的指向标)的研究报告,至此“大数据”关键词沿用至今。
“大数据”最直接的理解是容量非常大的数据集合,但是结合“用现有的一般技术难以管理”的现状,可以看出大数据具有复杂特性,通常可以用4个V开头的关键词来描述大数据即:数据容量大(Volume)、数据多样性(Variety)、流动速度快(Velocity)、价值密度低(Value)。互联网时代,尤其是社交网络、电子商务与移动通信把人类社会带入了一个以“PB”(1024TB)为单位的结构与非结构数据信息的新时代。国际数据资讯(IDC)公司监测报告表明,全球数据量大约每两年会翻一番,预计到2020年,全球将拥有35ZB的数据量。
大数据等于大机遇,重点不是数据有多大,核心是如何挖掘和利用大数据进行预测。BI(Business Intelligence,商业智能)主要目的是分析从过去到现在发生了什么变化、变化的原因,对所存储的企业内、外部数据进行组织性系统性的集中、整理和分析,从而获得对企业决策有价值的知识和观点。例如,过去一年中报纸、杂志的发行量如何,它在各个各地区中的发行量又如何。
随着硬件和软件技术的发展,高能、低耗、集成度高的CPU出现,承担数据处理任务的计算机的性价比提升。硬盘等存储器随着存储容量的增加,价格和重量成走低趋势。硬件设备的提升使得大规模数据分布式处理技术Hadoop和针对非结构数据处理NoSQL技术得以在通用服务器上运行,Hadoop和NoSQL的最大功能,就是能够实现对大量非结构化数据进行高速的处理。
“云计算”使得大数据的挖掘成本降低,很多时候用户要进行大数据分析,也可以租用“云计算”服务,以付费的方式,使用由计算机集群组成的计算处理环境和大规模数据存储环境,来实现大数据分析。例如:Amazon的云计算服务EC2(ElasticCompute Cloud)和S3(Simple Storage Service)服务,就提供了这样的技术需求。为了提高数据挖掘的功效,机器学习技术尤为重要,它最主要的功效是能够使用从大量数据中自动学习知识和有用规则来预测未来,例如:可以从庞大的数据中挖掘有价值的规则对未来发行量进行预测,这是大数据核心应用。
“搜索时代”的来临是网络带给网民最方便的应用。在baidu的搜索框中,只需要输入一部分汉字关键字或者是汉语拼音字符,搜索条下面立即就会显示出一些与搜索关键字相关联的建议,例如,只要输入“大数据”或者“dashuju”,搜索条下面就会自动提示“大数据时代”、“大数据技术”、“大数据分析”等索引联想项。这样的搜索关键字建议、提示都是对用户庞大的搜索史记录进行分析后得出的。另外,在以拼音输入“dashujufenxiyanjiang”这样的字符索引关键字百度时,百度会显示“你要找的是不是:大数据分析演讲”这样的提示,这种“输入修正功能”也是通过相同的原理实现的(此项机器学习技术来源于“google”)。
同样在新浪微博搜索条中会实时出现“大家正在热搜:曲面屏幕手机”等实时信息,也还会在搜索条下面实时出现“查看完整热搜榜”、“索契冬奥会”等热搜关键字,原理都是应用了对搜索数据记录学习并进行实时分析实现的。
在淘宝网购物搜索一件商品时会在商品网页的下方显示“您可能感兴趣的宝贝…”,在亚马逊网购物搜索一件商品时会在商品网页下面出现“购买了此商品的顾客也同时购买”同类产品显示,这是大数据分析应用结果,是Amazon创造的最广为人知的一种商品推荐系统。
2、媒体大数据
大数据时代对传统媒体既是挑战又是机遇,对未来的媒体形态和格局将会产生深远影响。媒体的大数据大致可以分为两类,一类是历史数据:这些报、刊、书的纸质出版物已经逐步数字化,还要包括20世纪以后的媒体电子出版物。当文字变成数据存储为结构数据,计算机就可以通过灵活的标引,查询等方式,提高历史数据的使用价值。另外一类数据网络数据:包括社交网络、物联网、移动网络产生的自媒体随时记录数据,它包括文字、视频、音频,其数据特征是数据量大、杂乱无序属于非结构数据,这些蕴涵着极大的价值,对开展个性化服务和定向预测起到非常重要的作用,需要深度挖掘。如图所示。
3. 大数据提升媒体影响力
媒体本身就是生产和传播信息的产业,一直以来中国的新闻媒体都是传统媒体做主导,虽然有自媒体的出现情况有所变化,但是传统媒体一直保持着深度报道的优势。大数据时代使得信息源更加丰富,媒体通过对海量数据资源,进行搜集、整合、加工等数据分析,可以精准了解受众行为习惯和兴趣喜好,制订出满足受众需求传播内容和传播策略,实现精准传播,同时根据受众的反馈数据,及时调整内容和策略扩大受众人群,这样既保持了传统媒体的深度报道又提高了影响力。如在索契冬奥会2014年2月13日中国运动员李坚柔摘得首金,几秒钟以后立刻在新浪微博和twitter瞬间占据了话题榜,最多的话题是“幸运”、“奇迹”摘金,从大数据分析可以看出李坚柔是话题人物,这个话题不仅是中国队夺得的首金,更多的是说由于场上其他国家队员失误导致李坚柔幸运夺金,中国体育报作为体育界的权威报纸,经过分析受众的关注点,策划了2月14日针对“奇迹”写了“没有努力就没有奇迹”深度采访,针对“幸运”写了“首金背后:从童话到现实”对话中国短道速滑功勋教练李琰的深度报道,这样的策划既迎合了受众的关注热点又保持了深度报道,同时提升了中国体育报的影响力。
4. 大数据舆情分析
大数据时代媒体具有数据优势,应该善于收集、分析、使用数据,通过对数据资料的收集、整理提出有针对性的舆情分析报告。如“小升初就近入学”,通过大数据的深度发掘,可以了解有多少人赞成有多少人反对,并可以推算出这个决定会在哪些方面有利,哪些方面有弊。大数据舆情分析是通过算法得来,虽然在变量设置上有操纵性和能动性,但是比较之前人工化的议程来的更科学更理性。有研究机构预测,未来媒体将实现整体结构转换,数字分析人员将占采编人员总比例的五分之一。
5. 大数据预测价值
我们有理由相信大数据对未来媒体的发展会起到决定性的作用。例如:作为媒体在年底的时候都会评选这一年的风云人物,可以先通过网络索引搜索“某某”,通过搜索索引记录数量和媒体的新闻报道数量确定其是否是热门人物,确定热门人物后,再通过媒体的历史数据找寻历史轨迹,一个年度风云人物的策划就完成了,这个风云人物既是热点人物又有历史资料作为支持同时又是热搜人物,形象一下就立体丰满了,这个选题策划一定能有好的收益,同时我们还可以将这个年度风云榜的榜首人物提供给广告供应商,达到媒体和企业双赢的经济效益。另外对于媒体的专业期刊,可以从网络中提取读者对某种体育器材感兴趣的数据,加之历史数字市场份额占有率综合分析,提供一份体育某种器材行业市场调查分析报告给相应的企业,这可能是媒体未来和企业的最好合作方式,即:媒体大数据深度挖掘是企业最好的数据分析中心,是实现媒体大数据的核心应用。
媒体经营管理可以利用大数据对目标受众群体和特定阶段的客户需求进行精准分析和市场调研,根据此结果阶段性地调整新闻生产中各类信息的权重,提供有针对性的新闻信息服务,增加媒体影响力,赢得更多的企业合作客户。
媒体大数据 篇5
学大数据,选择成都大数据培训学校要慎重
成都国信安大数据培训由副教学总监,优秀讲师带队并亲自授课,秉承成都国信安一贯的专业品质态度,在课程质量,学生素质,就业服务上相当严格要求,并以学业满意就业为目标,打造国内优秀大数据培训班,感兴趣的同学不妨关注国信安教育基地了解一下吧。
大数据的火爆,让很多企业都意识到发展大数据的重要性,那么是不是所有企业都可以成为大数据公司?
美国麦肯锡公司近期开出了一张书单,列出利用大数据进行自我发展的一些潜力行业,其中就有电信、金融、保险、信息、交通、医疗等,都可以利用大数据技术,从中获得很大的发展空间。
大数据将是软件产业一个非常重要的发展方向。
我们知道,现在从IT时代走向DT时代,也就是数据技术的时代。将来每一家公司都有可能成为一家大数据公司,大数据将成为一种核心的竞争力。刚刚在贵阳召开的数博会显示,大数据将成为中国“十三五”期间重点规划的产业,这将是坚定不移的战略。
在2016年第二十届中国国际软件博览会专题论坛上,华盛顿大学陈一昕教授表示:一些行业通过与大数据有机结合,比如在电信行业,电信运营商的中国移动、中国电信、中国联通(600050),包括一些其他的公司,比如亚信、东方国信(300166)等等,作为电信运营商,都能做好大数据的变现业务。目前而言,电信行业其实面临着非常大的挑战,随着国家提出降费的要求,运营商的流量被管道化,公众因此就会利用微信等工具,进而导致运营商可能面临着新的发展困境,竞争也由此更加激烈。
在电信运营商看来,他们的数据其实是一块非常重要的资产,也就是说,公众可以看到电信运营商拥有稳定的数据源,每个人手机上时刻产生大量数据,包括用户的套餐、和谁通话、基站位置、地理位置、有没有欠费等数据,以及数据的变现问题。陈一昕说:“电信运营商拥有着一座巨大的数据金矿,但是,如何把这些金矿当中的矿石打造成金戒指,这是运营商面临的巨大挑战。” 医疗行业和大数据结合,会有非常大的潜力。关于这一业务,第一次驱动力是医保核算,以医院的需求为指导。第二次是互联网+医疗,通过新医改,医疗信息化,特点是以政府需求为主导,以共享为核心的区域医疗信息化。目前,第三次浪潮的驱动力应该说是移动医疗、大数据分析,其特点是健康管理,不光是在医院内部,同时也在医院外部。国信安教育基地
我们可以看到随着医疗行业的重大变化,它的数据量是越来越大了,其从原来简单的结构化数据,到现在的医疗大数据,其中包含了大量的非结构化的数据,比如说像图像、文档。中国一个中等城市50年积累的数据达到10个PB,如何处理和分析挖掘这些数据价值,相信这里面有巨大的市场。
教育行业,也是我国信息化战略的重要组成部分。陈一昕表示,目前在线学习市场,也是非常大的市场,在线教育市场以年均18%的速度在增长,2017年预计在线学习人数达到1.2亿人,基础教育一年的数据量也是非常庞大的,我们可以看到一年的数据量达到ZB级别,利用教育的数据、互联网的技术,以及云计算等等,这些技术促使在线教育繁荣。陈一昕觉得,未来教育还是线上线下相结合的模式。就像以前的计算机技术收到追捧一样,在DT时代,大数据培训开始受到重视。
金融行业,在大数据的技术来看,我们可以看到金融行业是大数据技术,相对而言,它是走在前面的行业,因为金融行业更依赖于数据。很多层面上,金融业的大数据技术是走在其他行业前面的,包括银行要对用户进行风险分析,精准控制。保险业更需要通过大数据,对用户进行分析,进行潜在用户的挖掘,对欺诈行为进行预防。另外在证券行业,现在量化交易也是发展非常快,对股价的预测、对投资的趋势等等都可以用大数据的技术来进行管理,进行优化。陈一昕同时强调了医疗养老数据的安全隐私这一块,数据不会丢失,数据不会恶意的泄露或者盗窃,从数据安全角度来看是非常重要的。
四川地处中国大西南,肥沃的土地,丰富的自然资源,悠久的历史和绚烂多彩的少数民族文化,构成了多样性的自然和文化旅游资源。如今在广大农村地区,越来越多有前瞻性的家长鼓励自己的孩子去学习一门技术,因为他们已经意识到:技术人才在就业方面更具优势。在这个拼爹的时代,拼背景?拼人脉?我们并没有优势,只有掌握一门技术,才能在就业场上拥有自己的一席之地。俗话说的好:掌握一门技术,走遍天下都不怕。那么,学什么技术有前途呢?
大家对于IT培训一定有所了解吧,今天,小编就为大家收集和整理了有关的信息,希望能让大家有更深一步的了解!今天小编想给大家扒一扒大家感兴趣的IT培训!国信安教育基地
大数据技术的发展方向很多,如果想做大数据可视化的朋友注意了,可视化正面临这样的挑战。
拓展性和动态分析是可视化的两个主要的挑战。举例来说,对大型动态数据,原本A问题的答案和B问题的答案也许在同时应对AB两个问题时就不适用了。基于可视化的方法迎接了四个挑战,并将它们转化成以下的机遇。多源:开发过程中需要尽可能多的数据源。
体量:使用数据量很大的数据集开发,并从大数据中获得意义。
质量:不仅为用户创建有吸引力的信息图和热点图,还能通过大数据获取意见,创造商业价值。
高速:企业不用再分批处理数据,而是可以实时处理全部数据。
大数据可视化的多样性和异构性(结构化、半结构化和非结构化)是一个大问题。高速是大数据分析的要素。在大数据中,设计一个新的可视化工具并具有高效的索引并非易事。云计算和先进的图形用户界面更有助于发展大数据的扩展性。
可视化系统必须与非结构化的数据形式(如图表、表格、文本、树状图还有其他的元数据等)相抗衡,而大数据通常是以非结构化形式出现的。由于宽带限制和能源需求,可视化应该更贴近数据,并有效地提取有意义的信息。可视化软件应以原位的方式运行。由于大数据的容量问题,大规模并行化成为可视化过程的一个挑战。而并行可视化算法的难点则是如何将一个问题分解为多个可同时运行的独立的任务。国信安教育基地
高效的数据可视化是大数据时代发展进程中关键的一部分。高维可视化越有效,识别出潜在的模式、相关性或离群值的概率越高。大数据可视化还有以下几点问题:
视觉噪声:在数据集中,大多数对象之间具有很强的相关性。用户无法把他们分离作为独立的对象来显示。
信息丢失:减少可视数据集的方法是可行的,但是这会导致信息的丢失。高速图像变换:用户虽然能观察数据,却不能对数据强度变化做出反应。大型图像感知:数据可视化不仅受限于设备的长宽比和分辨率,也受限于现实世界的感受。
高性能要求:在静态可视化几乎没有这个要求,因为可视化速度较低,性能的要求也不高。
可感知的交互的扩展性也是大数据可视化面临的挑战。可视化每个数据点都可能导致过度绘制而降低用户的辨识能力,通过抽样或过滤数据可以删去离群值。查询大规模数据库的数据可能导致高延迟,降低交互速率。
在大数据的应用程序中,大规模数据和高维度数据会使进行数据可视化变得困难。当前大多数大数据可视化工具在扩展性、功能和响应时间上表现非常糟糕。可视化分析过程中,不确定性是有效的考虑不确定性的可视化过程巨大挑战。
可视化和大数据面临许多的挑战,下面是一些可能的解决方法:
1.满足高速需要:一是改善硬件,可以尝试增加内存和提高并行处理的能力。二是许多机器会用到的,将数据存储好并使用网格计算方法。2.了解数据:请合适的专业领域人士解读数据。
3.访问数据质量:通过数据治理或信息管理确保干净的数据十分必要。4.显示有意义的结果:将数据聚集起来到一个更高层的视图,在这里小型数据组和数据可以被有效地可视化。
5.处理离群值:将数据中的离群值剔除或为离群值创建一个单独的图表。成都国信安专业的大数据培训机构,成都国信安温馨提示:更多大数据学习资料关注成都国信安官方网站。国信安教育基地
媒体大数据 篇6
[关键词]大数据;流媒体;内容生产
[作者单位] 李冰,北京交通大学语言与传播学院;郄婧琳,北京交通大学语言与传播学院。
[基金项目]中央高校基本科研业务费专项资金资助“数字环境下的中外版权制度改革研究”(项目编号:H14JB00080)的成果之一。
《纸牌屋》(House of Cards)是由美国最大的在线影片租赁提供商网飞公司(Netflix)在2013年初推出的首部自制剧集。这部改编自1990年BBC同名迷你剧的电视剧以时下的美国华盛顿为背景,将政客间的利益交换和人性困局进行了淋漓尽致的展现。该剧不仅在艺术成就方面得到了业界的普遍认可——第一季播出后先后获得2013年度艾美奖最佳导演奖、最佳选角奖和金球奖最佳女主角奖——同时也因为其对大数据的成功运用成为视频内容生产领域的新的里程碑。因此,本文以大数据为背景,选取《纸牌屋》作为研究对象,通过深入探究其内容生产策略,以期为我国的视频内容生产方提供一定的意见和建议。
一、《纸牌屋》与大数据
1.《纸牌屋》诞生:大数据助力投资决策
资料显示,自2012年开始,各大流媒体公司包括网飞、葫芦(Hulu)、亚马逊(Amazon)、Youtube等都加大了原创内容的投入,“亚马逊工作室”甚至早在2010年底就开始了相关运作,但直到《纸牌屋》的出现,流媒体的观看数据才一举超过传统电视媒体。这不仅仅是内容的胜利,更是大数据的胜利,具有划时代的意义。
正如麦肯锡在报告中指出的,“大数据让企业能够创造新产品和服务,改善现有产品和服务,以及创造全新的商业模式。” 2000年,创办仅3年的网飞公司开始启用推荐系统Cinematch,该系统将基于用户视频点播的基础数据(如评分、播放、快进、时间、地点、终端等)储存在数据库后通过数据分析,计算出用户可能喜爱的影片,并为之提供定制化的推荐。2006年,网飞公司启动了基于机器学习和数据挖掘的大奖赛,意图进一步提升Cinematch系统的准确率。在接下来的几年中,随着Cinematch系统的不断升级和用户数据的不断增多,网飞公司对于用户喜好也有了更深入的了解。2007年,随着网飞公司战略重点由原本的主营业务DVD租赁向流媒体视频点播服务转变,原本网站使用的推荐系统的目标和数据特征均随之发生了根本性的变化,网飞公司则开始进入以分布式计算(Hadoop)为主要架构的大数据时代。与较为私密的DVD观看相比,在流媒体视频的收看过程中,用户不仅会在播放控制器上留下暂停、快进、回看和关闭等收视行为记录,还会在观影后做出留言反馈、收藏、与网友互动或分享至社交媒体等行为。如此一来,网飞公司所能获取的用户个人偏好数据得到了极大的丰富。
以《纸牌屋》为例,在决定投拍《纸牌屋》之前,网飞公司的工作人员在大数据的帮助下发现用户中有很多人仍在点播1991年BBC经典老片《纸牌屋》,同时这些用户还喜欢大卫·芬奇(David Fincher)执导的作品和奥斯卡得主凯文·史派西(Kevin Spacey)主演的电影,这些高重合度的数据帮助工作人员进一步明确了庞大的目标受众群体的存在。换句话说,网飞公司通过数据分析准确把握了用户的脉搏,为《纸牌屋》的胜利打下了良好的基础。
确定大卫·芬奇为导演,凯文·史派西为主演后,网飞公司决定投资参与《纸牌屋》的制作。在提出了无需先看试播集、预付一亿美元资金、一次性订购完整的两季内容,以及不干涉剧集的艺术创作过程、制作团队保有最终剪辑权等诱人条件后,网飞公司最终与制片方达成合作,获得了《纸牌屋》的两年独播权,从此,改变了自己多年来仅仅作为电视台首播后的线上播出渠道的历史。2013年2月,《纸牌屋》第一季正式上线后,网飞公司的用户数增加了300万,达到2920万。
2.《纸牌屋》推广:大数据时代的营销手段
网飞公司不仅通过数据挖掘来了解《纸牌屋》的受众基础并确定《纸牌屋》的演职人员名单,更将大数据灵活运用于剧集的宣传推广。在具体操作过程中,网飞公司主要是通过数据挖掘,进一步明确潜在受众中不同群体的不同偏好属性,从而针对该属性进行有针对性的推荐,这种做法无疑可以最大限度地激发用户的观看欲望。譬如说,基于数据挖掘显示的忠实观众,网飞公司会通过推荐系统将其“锁定”,并為之推送适合其观影风格的“有针对性的”宣传片。而对于那些非忠实观众,网飞公司则不会向其过度推荐,以免形成不必要的骚扰,造成适得其反的宣传效果。
据数据分析的结果,《纸牌屋》的制作团队共剪辑出6版1分钟—4分钟不等的宣传片向用户进行推送。尽管这6版宣传片所选取的素材片段基本相同,但镜头和旁白的多样组接、搭配方式使得每部宣传片都有不同的侧重点。例如,喜爱观看女性主义公路电影《末路狂花》(Thelma & Louise)的用户会更多地看到介绍主要女性角色的预告片;电影《商海通牒》(Margin Call2011)的粉丝则被推送男主角凯文·史派西的宣传片版本;而对于那些喜爱导演大卫·芬奇的用户,网飞公司则会贴心地送上导演大卫·芬奇的凸显人性黑暗且视觉感强烈的特色宣传短片。
在大数据的帮助下,借助这种有针对性的宣传推广方式,《纸牌屋》未播先火,赚足了关注度和话题度。等剧集正式播出后,凭借着优良的制作、紧凑的剧情和便捷的观看方式,《纸牌屋》一跃成为当年度的收视黑马。
二、《纸牌屋》与流媒体平台
网飞公司独家首播的两季《纸牌屋》均采用了全季13集一次性打包上线的播出方式,且上线时间均定为周五(第一季2013年2月1日首播,第二季2014年2月14日首播),以方便用户能够在周末进行“狂欢式”(Binge)观看。网飞公司的这一举措打破了美剧每周一集的播出惯例,更打破了美国观众几十年来每周定时追剧的收视习惯。根据eMarketer最新数据,2013年,美国成年人平均每天花费在手机、电脑等数字设备上的时间为4小时40分钟,首次超过花费在电视上的4小时31分。 通过接入高速互联网的流媒体平台,媒介生态正在发生根本性的变化。用户开始从传统的收视模式中解放出来,他们在观看电视节目上拥有了更大的选择权和自由度,“一人一个电视台”的时代正在来临。
全集打包上线的播出方式不仅大大增强了剧集订户观看时间的自由性,也进一步提升了用户的黏合度。事实上,网飞公司的这一举措并非一时冲动,而是由流媒体平台的特点所决定的。首先,作为在线流媒体视频提供商而非电视网或有线电视台,网飞公司长期以来都是通过辛迪加分销系统购买电影和电视剧,而这些在各大电视台经过几轮播出的剧集已经具备了全集打包上线播出的条件;其次,网飞公司作为“付费观看”的视频网站,主要依靠用户购买而不是广告来获得盈利,这就使得网飞公司首先考虑的因素是用户需求而不是广告观看流量;再者,近年来,随着延时收视(Timeshifted TV)、点播收视(Video-On-Demond,VOD)等观看方式的普及,美国观众“攒剧”观看的做法已并不罕见。人们常常使用数字视频录像机TiVo定时录制所追的剧集,并“囤积”至一起观看,而以网飞公司为代表的流媒体播放平台的兴起,更是助长了这一风气。有报道指出,美国观众甚至因为突降的暴雪而在Twitter上向网飞公司请求提前一天放出第二季内容,以便在难以出行的坏天气中打发时间。
《纸牌屋》推出后,传统电视产业深刻感受到了日益壮大的流媒体公司带来的竞争压力。由于可以不依赖电视网而成为视频内容的推送平台,同时,流媒体可以更加有效和精准地满足用户需求,这些流媒体公司的用户数量增长迅速。更为重要的是,流媒体公司所拥有的大量用户数据使得它们能够在此基础上建立精准的智能推荐系统。这正是流媒体公司最有价值的资产和最大的竞争力所在。据调研公司Parks Associates预测,到2017年,在线视频播放设备将进入超过38%的美国家庭。我们有理由相信,随着在线视频业务垂直整合频率的不断加快和整合程度的加深,在线视频产业也将进入一个视频、语音和数据服务同互联网深度整合的新时代。
三、启示与建议
网飞公司财报显示,2013年公司股价一路上扬,第四季度营收达到11.8亿美元,比2012年同期增长了24.3%;净利润4800万美元,同比增长超过500%。除营收大幅度增加之外,网飞公司的用户数也迎来了高速增长。2013年第4季度,美国国内市场新增用户数量233万,美国流媒体总用户数量达到3342万,付费流媒体用户数量达到3171.2万。除用户数量的不断增加之外,网飞公司也不忘继续充实自己的内容数据库。除自制剧之外,根据与迪士尼签订的最新协议,从2016年开始,迪士尼出品的电影在影院放映后将成为网飞公司的在线片源,授权范围包括迪士尼、皮克斯、漫威以及迪士尼自然等出品的所有真人及动画电影。大数据时代的来临催生了各行各业的变革,网飞公司作为流媒体视频行业的领军者,在内容生产过程中所采用的策略正在影响着整个行业。
与美国相比,我国在线视频行业同样处于快速发展時期。从用户规模来看,根据CNNIC《第34次中国互联网络发展状况统计报告》显示,截至2014年6月,中国网民规模达6.32亿,其中网络视频用户规模4.39亿,较2013年底增加1057万人。 从产业收益来看,2014年第3季度,中国在线视频季度市场规模达68.2亿元,环比增长9.3%,同比增长83.2%。 尽管用户人群不断扩大、收益不断增长,但面对长期以来习惯了免费午餐的观众们,国内各大视频网站仍基本采用广告主付费模式来获取利润,这种将广告和视频内容简单生硬结合在一起的模式常常会使用户产生反感。特别是由于版权保护的缺失和各项政策的出台,国内在线视频产业的盈利之路更显未知。
近年来,国内各大视频网站虽然在高额版权的重压之下纷纷展开内容自制战略,但却囿于自身定位模糊、专业人才稀缺和数据技术薄弱等原因,导致相关产业的未来发展受到很大影响。因此,如何利用在线视频收视数据进一步改善用户体验;如何开发更好的盈利模式,在广告主和用户之间实现双赢;如何发展数据技术,改善用户体验?这就需要我们对诸如网飞公司这样的行业领军者进行深入的分析和解读。
1.借助流媒体平台获取数据
传统媒体由于受到播出平台的限制,在数据资源获取方面处于劣势。随着流媒体平台建设的逐渐完善,用户数据收集显然变得更加简便易行,这些丰富的用户数据作为内容生产方重要的决策参考,能够帮助提升购片和投资决策的精准度,改善用户体验以增加其黏合度,并最终带来不菲的收益。
但需要注意的是,流媒体平台在收集数据的过程中,不应仅仅考虑自身的盈利模式和业务特点,更应在数据解构式的全面收集、数据间相关性的挖掘,以及对算法的不断优化等方面进行灵活处理。
2.通过数据把握受众需求
在传统的影视制作过程中,尽管也会通过焦点小组访谈、调查问卷发放等手段来了解受众,但由于样本范围较小,误差较大,受众的整体面目依然是模糊不清的。借助大数据的帮助,内容生产方第一次能够更便利、更准确地把握受众需求。所谓更准确,不仅指其能够通过社交媒体上的分享和评论来把握受众,也指其能够通过对数据资源的挖掘,将原本集群化、模糊化的受众形象变得明晰可见,受众的个人化特色和分布式特征也将借助数据的力量得以呈现。
在此需要强调的是,所谓的把握受众需求,并不仅仅是根据用户个体的播放记录、收藏评论等明显“表达”推断出的简单偏好,而是在对,如观看时长、播放次数及其他细节化收视行为综合考虑、主动挖掘价值核心点的基础上,对用户真实喜好尽力“还原”。
总而言之,得益于对大数据和流媒体平台的应用,网飞公司从《纸牌屋》前期的投资制作到后期的上线推广,步步为营,打破了传统的电视剧内容生产模式,开创了以分析用户数据为前提、确定目标受众为重点、优化营销推广为手段的视频内容生产新策略。具体而言,网飞公司即是在充分收集数据和精细管理的基础上,进行了订户的需求分析和数据度量,进而依据数据分析的结果进一步明确目标受众并做出了准确的投资购买,同时,在宣传推广阶段同样参照大数据的指引执行了剧集的细分化推广。与政策法规较为健全、市场化程度较为彻底的美国相比,我国的视频内容生产才刚刚起步,但“他山之石,可以攻玉”,通过学习和借鉴,相信我们的在线视频网站也能够在大数据时代走出一条属于自己的成功之路。
[1]麦肯锡. 大数据:下一个竞争、创新和生产力的前沿领域 [J]. 赛迪译丛,2012(25).
[2]Janko Roettgers. For House of Cards and Arrested Development, Netflix Favors big data over big ratings [EB/OL] (2013-02-12) [2014-07-20]. http://gigaom.com/2013/02/12/netflix-ratings-big-data-original-content/.
[3]Esther Zucherman. A Snow Day ‘House of Cards’ Release Would Be a Coup for Netflix [EB/OL] (2014-02-13) [2014-07-23]. http://www.thewire.com/entertainment/2014/02/snow-day-house-cards-release-would-be-coup-netflix/358055/.
[4]Netflix. Netflix Releases First-Quarter 2014 Financial Results [EB/OL] (2014-04-21) [2014-07-23]. http://ir.netflix.com.
[5]中国互联网络信息中心(CNNIC). 第34次中国互联网络发展状况统计报告[Z]. 2014-07-21.
当新媒体遇到“大数据” 篇7
我们现在生活在一个数字信息爆炸的时代, 身边每时每刻都在产生数据信息。随着计算机运算速度的增加, 存储空间的扩大, 以及云计算技术的出现, 如何利用好这些数据, 让整个计算机界的热情达到了空前的高度。在电信、金融等行业甚至已经达到“数据就是业务”的地步, 这种趋势让很多相信数据会产生价值的企业做出了改变。
“Big Data”可以理解为大数据, 也可以理解为海量数据, 但是这两者还是存在区别的。大数据包含了海量数据, 除此之外还包含多种类型的数据。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。该定义可以从两个角度来分析:一方面是数据容量的不断扩大, 数据集合的范围已经从兆字节 (MB) 到吉字节 (GB) 再到太字节 (TB) , 甚至还有拍字节 (PB) 、艾字节 (EB) 和泽字节 (ZB) 的计数单位出现。著名咨询公司IDC的研究报告称, 未来十年全球大数据将增加50倍。仅在2011年, 就有1.8ZB (也就是1.8万亿GB) 的大数据创建产生。这相当于每位美国人每分钟写3条微博, 而且还是不停地写2.6976万年。在未来十年, 管理数据仓库的服务器的数量将增加10倍以便迎合50倍的大数据增长。另一方面, 日益增长的集成式大数据已不再适宜于用当前管理数据库的工具来进行分析处理。其难点包括:数据的抓取、存储、检索、共享、分析以及可视化等。
2“大数据”带来的挑战
“大数据”在物理学、生物学、环境生态学、自动控制等科学领域和军事、通讯、金融等行业已经存在很久了, 在互联网领域却是最近几年才出现的, 而对于电视台的新媒体领域现在才刚刚暂露端倪, 在未来马上就要成为我们不可回避的问题之一。这主要有如下几个方面:
首先, 随着电视台新媒体业务的发展, 电视台新媒体业务从最初的图文网站为主, 逐步走向以视音频节目为主, 图文共存的形式, 这样数据量大大的增加。
其次, 用户的终端变得更加丰富, 从原先的台式机变为现在的手机、平板电脑、电视机等多终端, 这就要求我们的系统提供更全面的系统服务, 提高用户的粘度, 增强用户体验, 而这所有的一切都大大的增加了数据量。
再次, 现在的用户对互联网的依赖程度越来越高, 越来越多的用户会把更多的时间花费在网络上, 他们可以在上面进行购物、聊天、看视频、工作等更多的活动, 这些也大幅的增加了系统的数据。
现在越来越多的企业开始重视“大数据”, 根据艾瑞调查统计的数据在2011年日本大数据产业1900亿日元, 预计在2020年这个产业将会达到1万亿日元。大数据的出现为广电带来了新的课题, 同时也带来了更多的机遇。从市场运营的角度来看, 数据量的大规模的增加是让我们精确把握用户的网络行为模式的基础, 如果能够充分利用, 我们就可以通过大数据的分析及处理得到用户行为分析, 可以个性化、精确化、智能化的进行广告推送以及服务推广服务。新的广告模式和产品推广形式的会比现有的广告模式性价比高出几倍甚至几十倍。同时, 新媒体公司也可以通过对大数据的把握, 大大地增加用户粘性, 开发新产品和新服务, 降低运营成本。从现实的问题看, 主要有以下三个方面的问题。
首先, 大数据挑战了传统广电公司领导的战略决策能力。新媒体业务和技术与传统广电业务区别非常大, 数据量的急剧增长不仅要求在带宽和存储设备等基础设施方面要增加大量投入, 而且会使广电公司处于进退两难的境地。如果任数据增长, 不予理会, 那就很可能失去未来发展的机会, 失去业内竞争的本钱, 早晚会被产业淘汰或者居于下游;如果与时俱进, 转型适应大数据时代的到来, 那就需要对新媒体现有产品和运营体系进行全面的改造, 例如网站架构的重新设计;产品的标准化、通用化、模块化;商业模式的创新等等。这对新媒体公司而言, 既要维持现有业务, 保持业绩的稳定和增长, 又要加大投入, 迅速转型, 是个进退两难的处境。
其次, 大数据的出现挑战了新媒体公司的技术开发和数据处理能力。大数据的出现以及潜在的商业价值不仅要求新媒体公司使用专门的数据库技术和专用的数据存储设备, 而且更要求专门的数据分析方法和使用体系。目前业内流行的一般数据挖掘方法和通用商业数据库无法满足大数据时代的挑战。而且, 新媒体公司需要大数据处理方面的大量高端专业人才, 这不仅指一般的程序员和数据库工程师, 而且指数学和统计学家、社会网络学家、社会行为心理学家等等。对海量数据的分析不能仅仅局限在一般数据规律和模型的把握水平上, 而且要有理论思维和全面把握的综合深入能力。
第三, 大数据挑战了新媒体公司的组织和运营能力。一般中小网络公司都没有专门的数据管理和分析专家, 即使是大型网络公司中, 数据管理和分析部门也处于分散、被动、辅助的地位, 是公司的龙尾而不是龙头。大数据时代的数据分析基本单位是个人用户, 寻找的是个人的全面、完整、动态、实时的网络行为模式以及在此基础上归纳出来的群体行为模式, 而不是过去那种基于单个产品、服务、频道的碎片式静态统计分析。所以, 对大数据的整体把握是新媒体公司产品开发、运营设置、商业模式的基础和出发点, 是龙头而不是龙尾。这就需要对现有公司架构、组织体系、资源配置和权力结构进行重组, 让数据管理与分析部门处于公司整体的上游位置。
Facebook最近在总部的一次会议中披露的一组数据可以给大家一个初步的印象, 来一起看看每天Facebook上都得处理多少数据吧:
1.25亿Facebook上分享的内容条数;
2.27亿“赞”的数量;
3.3亿上传照片数;
4.500+TB新产生的数据;
5.105TB每半小时通过Hive扫描的数据;
6.100+PB (1PB=1024TB) 单个HDFS (分布式文件系统) 集群中的磁盘容量。
Facebook的工程总监Parikh解释了这些数据对于Facebook的意义:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据, 那你只是空有一堆数据而已, 不叫大数据。”
目前Facebook有着世界最大的分布式文件系统, 单个集群中的数据存储量就超过100PB。在Facebook内部, 从一开始就没有在不同的部门之间 (比如广告部和用户支持部) 设立障碍或者分割数据。这样一来产品开发者就可以跨部门获得数据, 实时知晓最近的改动是否增加了用户浏览时间或者促成了更多的广告点击。
作为普通用户, 大家也许会对如此海量的数据心存不安, 担心自己的数据被随意浏览。对此Facebook表示有各种防范措施来防止此类事情的发生, 比如所有的数据读取记录都会被存档, 哪些人看过哪些数据都是记录在案的;如果有员工越线, 会被直接开除。Parikh着重强调:“在这件事上我们的政策是零容忍。”
3“大数据”的数据分析
目前, 一提到大数据大家就会想到Hadoop数据分析平台, Hadoop在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势, 事实上已成为当前互联网企业主流的大数据分析平台。
Hadoop平台对业务的针对性较强, 按照数据分析的实时性, 分为实时数据分析和离线数据分析两种。
实时数据分析一般用于金融、移动和互联网B2C等产品, 往往要求在数秒内返回上亿行数据的分析, 从而达到不影响用户体验的目的。要满足这样的需求, 可以采用精心设计的传统关系型数据库组成并行处理集群, 或者采用一些内存计算平台, 或者采用HDD的架构, 这些无疑都需要比较高的软硬件成本。目前比较新的海量数据实时分析工具有EMC的Greenplum、SAP的HANA等。
对于大多数反馈时间要求不是那么严苛的应用, 比如离线统计分析、机器学习、搜索引擎的反向索引计算、推荐引擎的计算等, 应采用离线分析的方式, 通过数据采集工具将日志数据导入专用的分析平台。但面对海量数据, 传统的ETL工具往往彻底失效, 主要原因是数据格式转换的开销太大, 在性能上无法满足海量数据的采集需求。互联网企业的海量数据采集工具, 有Facebook开源的Scribe、Linked In开源的Kafka、淘宝开源的Timetunnel、Hadoop的Chukwa等, 均可以满足每秒数百MB的日志数据采集和传输需求, 并将这些数据上载到Hadoop中央系统上。
按照大数据的数据量, 分为内存级别、BI级别、海量级别三种。
这里的内存级别指的是数据量不超过集群的内存最大值。不要小看今天内存的容量, Facebook缓存在内存的Memcached中的数据高达320TB, 而目前的PC服务器, 内存也可以超过百GB。因此可以采用一些内存数据库, 将热点数据常驻内存之中, 从而取得非常快速的分析能力, 非常适合实时分析业务。MongoDB大集群目前存在一些稳定性问题, 会发生周期性的写堵塞和主从同步失效, 但仍不失为一种潜力十足的可以用于高速数据分析的NoSQL。此外, 目前大多数服务厂商都已经推出了带4GB以上SSD的解决方案, 利用内存+SSD, 也可以轻易达到内存分析的性能。随着SSD的发展, 内存数据分析必然能得到更加广泛的应用。
BI级别指的是那些对于内存来说太大的数据量, 但一般可将其放入传统的BI产品和专门设计的BI数据库中进行分析。
海量级别指的是对于数据库和BI产品已经完全失效或者成本过高的数据量。
除了Hadoop以外, 海量数据级别的优秀企业级产品也有很多, 但基于软硬件的成本原因, 目前大多数互联网企业采用Hadoop的HDFS分布式文件系统来存储数据, 并使用MapReduce进行分析。法务研究机构巨头LexusNexus最近就无私地开源了其分析平台HPCC系统。MarkLogic也公开了其非结构化数据库MarkLogic Server, 可用于大数据分析。此外, Splunk的搜索引擎也在获得关注, 可以用于搜索和分析机器数据, 例如服务器日志。
4 大数据的误区
目前, 我们的新媒体普遍拥有海量的客户信息, 包括在线交易记录及社交媒体数据等。但是, 成功的关键是要能够从不同渠道和来源的数据中洞察价值, 而具备收集并分析这些数据能力的企业将在竞争中拥有显著优势。
但是, 数据的非结构化已经成为新媒体公司的重大挑战。新媒体公司已经熟悉收集和分析结构化数据, 如传统的销售年报信息。目前, 许多新媒体公司都困惑于如何收集和分析更多类型的多结构化数据, 如网络日志、传感器网络、社交网络、互联网文本和文件、互联网搜索索引、视频档案以及电子商务交易数据等。
由于这些数据的结构问题及大数据类型的复杂关联, 导致无法应用现有的传统技巧进行大数据分析。这为新媒体公司带来了新的任务, 需要开发一套全新方法, 不仅能够处理传统数据, 而且可以便捷地分析和应用这些新兴数据, 而不是仅仅进行储存。
误区一:大数据是针对数据量和数据增长量而言
这种说法并不完全正确。的确, 大数据包括海量的以指数速度增长的传统业务数据, 也包括Web应用、社交网络、视频、照片等新渠道生成的各种数据。同时, 大数据还很复杂, 进行收集、储存、管理和分析的难度极大。
目前, 两种类型的数据都在不断增长。据IDC集团出版的《2011年十大预测》报告称:“企业正被淹没在信息海洋里, 却仍渴望获得更多信息, 这也为大数据分析和管理带来了巨大机遇。”该报告指出, 企业的愿望终将实现。“全球数据总量 (digital universe) 将扩张近50%, 达到约1.8 ZB (约合2万亿Gb) 。作为参考, 专家们预计1EB相当于长度高达3600万年高清视频文件产生的数据量。”
误区二:新媒体公司淘汰并更换现有分析系统以应对大数据时代到来
这个完全没有必要。建立大数据分析能力需要人才、流程和技术的完美组合。如果新媒体公司尚未发掘现有商业智能环境的价值, 在启用大数据分析平台前需率先解决该问题。当传统业务数据分析被赋予大数据的视野, 才能实现大数据分析的真正价值, 带来透明和全面的业务观点, 从而创造出业务迅猛发展的机会。
首先, 新媒体公司应制定计划, 明确应用大数据分析要达成的业务目标。依据这些目标, 新媒体公司应部署适用的硬件和软件以应对挑战。根据一线员工的需求部署商业智能解决方案, 帮助他们做出最佳决策。在采用正确的技术支持后, 新媒体公司用户和数据科学家能够迅速收集和分析新的数据源, 发掘业务需要的洞察力。
误区三:大数据只对谷歌、Facebook和亚马逊这样的高科技公司才有意义
无论是互联网公司、财富500强、或者小型企业, 都与大数据的爆炸式增长息息相关。无论所在行业或企业规模, 数据分析已经成为当前重要的业务需求。现今, 在新媒体公司运营中若无法从业务数据中获得真正的洞察, 是绝不可行。全球主要市场的企业正在实现新一代高级分析应用的转型, 通过全新方式应用海量的传统数据和新型数据, 提供更深入、更智慧的洞察力。而且, 新媒体公司的竞争优势取决于在商业环境中管理和分析所有关键数据的能力, 以及帮助新媒体公司做出最佳决策的洞察力。
误区四:数据科学家和大数据分析是2012年的IT界时尚
大数据分析绝非一时狂热, 这点毋庸置疑。正如O'Reilly Media创始人Tim O'Reilly所言:“我们正在开创迷人的数据驱动应用新世界, 这是一个任由我们塑造的世界。”目前, 数据科学家已经成为独立的职业, 奋战在塑造这个商业新世界的最前线, 精通数据的专家将成为新时代中的重要成员。
数据科学家必须对数据充满好奇, 拥有专心钻研的态度, 积极进取并善于批判性思考。他们具有对业务流程的深刻理解, 同时融合数学、统计学, 以及使用Excel、SQL和分析工作台等技能。目前, 市场对拥有技术能力及商业意识的专业人才需求量巨大。
误区五:大数据的价值取决于Hadoop及同类软件的技术处理能力
没有任何单一技术能够满足所有需求。根据新媒体公司努力解决的业务问题, 建立大数据分析能力需要人才、流程和各种技术的完美组合, 而最关键的是释放这些数据的商业价值。这将需要复杂的分析应用, 其中包括数字营销优化、欺诈侦测和预防和社交网络分析等。
Hadoop在大数据技术库中拥有一定价值及重要位置。Hadoop既是框架, 更是实现多结构数据过滤、转化及整合的优异平台, 类似于未搭载引擎或车身的跑车底盘。采用这种架构, Hadoop可以支持迭代及实时数据探索和分析, 快速发现新数据及数据的变化模式。
5 总结
大数据的到来是未来广电新媒体系统不得不面对的事情, 作为计算机领域的新兵, 大数据的处理以及相应的数据挖掘工作将是我们广电新媒体系统未来需要面对的难题。在某种程度上可以说, 谁大数据处理的好, 谁就能赢得未来的市场。大数据成功的关键在于要能够整合新媒体公司现有的传统业务数据和新型数据, 通过开放访问整个新媒体公司生态系统并整合各种来源的数据, 新媒体公司可以应用大数据分析对客户进行超级全面的分析, 进一步改善用户体验和销售业绩。
摘要:随着新媒体业务在广电系统的发展, 我们不可避免的要面对“大数据”对整个产业发展的影响。在其他行业中, 大数据已经得到了充分、足够的重视, 而广电对其重视程度还不够。本文通过对大数据的基本情况的介绍, 对广电新媒体的挑战, 以及可能会带来的误区几个方面进行了简单的介绍。
大数据——媒体的机遇与挑战 篇8
也许给出这样的论断为时尚早, 但大数据将在新闻领域引起的震荡是不容忽视的, 因此我们有必要对大数据有所了解。
一、认识大数据
大数据是在计算机及存储技术高度发达、互联网的普及和广泛应用的前提下产生的概念, 它既是资源, 也是工具。作为资源, 大数据有着普遍认同的四个特征:数据量巨大 (Volume) 、数据类型繁多 (Variety) 、价值密度低 (Value) 和处理速度快 (Velocity) 。美国加州大学圣地亚哥分校提供的数据显示:2008年全球数据总量为9.57z, 更加令人震憾的是当今世界所有信息中只有不到2%是非数字化的, 而数字数据量每三年就可以翻一番。
作为工具, 人们利用大数据进行数据分析, 趋势判断。正是由于数据量大、数据品种繁多的特点, 大数据的价值体现比率较低。要从浩如烟海的庞杂数据中获得富有价值的信息, 就要借助于相应技术, 对数据归类整理和聚类分析。
奥运会称得上是目前世界上规模最大的活动。奥运会期间产生的数据是任何一个单项活动所不能比拟的。因此, 我们不妨通过奥运会这个窗口对大数据及媒体发展趋势做进一步的观察。
二、奥运会的大数据
2012年伦敦奥运会的总体数据量可以透过英国电信网的统计得到, 包括奥运会“体制内数据”和部分“体制外数据”。据估算, 伦敦奥运会期间每秒钟有60GB的数据量流经英国电信局网络, 伦敦奥运会的现场直播节目超过2000小时。奥运期间, 世界上有85亿台个人电脑、智能手机与互联网相连。
社交媒体方面, 奥运会期间, 仅推特用户平均每秒推出13000条信息;8亿人每天通过facebook了解奥运会新闻, 而facebook每天承载的数据量达到15T (15兆兆字节) 。在奥运会上, 当博尔特完成了100米冲刺后, 推特用户以每分钟8万条信息的数据量推送与此相关的信息。如果这个数字还不够震撼的话, 奥运会开幕式时966万推特用户同时发出的信息, 相当于2008年北京奥运会期间推特用户推送信息的总和。
与奥运会相关的信息数据中有一部分是在奥运会场馆中产生的, 包括主新闻中心、技术中心等管理服务类场馆和各比赛场馆, 我们将这些数据称为“奥运会数据服务”ODF (即前面提到的“体制内数据”) 。ODF服务是国际奥委会为包括21600名注册媒体在内的奥林匹克大家庭成员提供的专项数据信息服务, 内容庞大、繁杂且详细, 其中既包含实时数据、历史数据, 也有运行数据;包括人员、比赛、天气、媒体、交通等等各项奥运会相关信息。伦敦奥运会期间, 近4, 000名专业技术人员每天24小时保证着900台服务器、1, 000套网络和安全设备, 以及超过1万部PC设备的运行。这些设备产生和管理的数据随时通过奥运会信息系统汇集、存储, 同时提供给以文字摄影媒体和转播商为主的奥运会注册用户。
三、奥运会媒体对大数据的开发利用
大约20年前, 在国际奥委会新闻委员的协调下, 世界上一些著名通讯社和报纸联合建立起一个名为WNPA的组织 (世界新闻通讯社组织) , 它的主要功能就是研究并实现将奥运会产生的各种数据 (ODF的雏形) , 并将其转换成媒体能够接收和解析的格式, 供媒体使用。无论过去还是现在, 奥运会期间产生的ODF数据都算得上是海量信息。它包含的数据量巨大, 各种数据混合在一起传输, 因此媒体要从中获取对自己有用的信息, 就要从技术上解决制定数据标准、过滤和筛选等问题。
美联社的下属公司STATS, 有100多年从事体育数据统计和分析的历史, 它的数据统计范围覆盖目前世界上300多项体育赛事, 详细到重要赛事的每个场地、每场比赛、每个人的数据。以奥运会篮球项目的技术统计为例:
STATS通过奥运会数据专线连接到ODF数据服务, 通过专门设计的应用程序对数据进行过滤、解析、整理、分类, 得出有关篮球的数据, 按照事先确定的不同用途, 经过设计人员的加工和包装, 以不同形式呈现给用户。经过处理的篮球项目的相关技术统计以及运动员和教练的背景信息、比赛感想等内容, 为体育记者撰写新闻提供了丰富的素材。同时, STATS公司还将这些数据资源向公众付费开放, 这样就使凡有兴趣了解体育赛事详细信息的受众很方便地得到相关数据。借助于此项服务, 网络媒体等非传统专业新闻媒体不用通过专门的采访, 就可以写出有深度的稿子;体育研究部门拿到这些数据, 就可以有针对性地进行研究, 提出运动趋势的预测, 为运动员和运动队提供训练建议等。
四、传统媒体面临的挑战和机遇
随着各种数据的增多, 各个行业的数据, 必然会越来越多地向公众开放。通过大数据工具, 就能解决筛选有用信息的问题, 使新闻素材的获取变得更加容易。它将进一步缩小新兴媒体和传统专业媒体之间获取深度新闻数据能力上的差距, 因此会给传统媒体带来更大的竞争压力。
随着大数据技术的普遍应用, 一些过去由人工完成的新闻采写工作开始由计算机代替。例如, 奥运会奖牌榜的制作和更新:
奥运会数据服务ODF实时提供奥运会每个比赛项目获奖运动员及所属国家的信息数据及其背景信息, 通过大数据手段将有关数据筛选出来, 按照所属国家和金银铜牌分类, 即可形成一个奥运会多媒体奖牌榜产品的雏形, 经过适当编排, 就可以在平面媒体上发布。再经过声光电多媒体手段的设计包装, 就可以在网络和电视等媒体上向观众呈现。如果需要, 可以增加和变换分类, 使奖牌榜内容更加丰富多彩。奥运奖牌榜的模板设计好以后, 剩下的工作就是将实时更新的数据按照分类填入具体区域, 全部工作均由计算机自动完成。上述整个过程基本概括了计算机进行体育新闻采写的原理。
目前, 计算机采写新闻还局限在体育和金融领域。但随着新闻模板的积累及丰富, 计算机采写新闻的领域将不断扩大, 由此也将给新闻行业带来新的挑战和思考。
大数据思维与新媒体演进 篇9
李希光等认为:“数据新闻学 (data journalism) 或称数据驱动的新闻学 (data driven journalism) , 被认为是计算传播学的一个具体应用。通过挖掘和展示数据背后的关联与模式和丰富的、具有互动性的可视化, 数据新闻学已成为新闻学的新疆域和应用范例, 并作为一门新的新闻分支进入主流媒体。”由此可见, 大数据对于新闻业的影响已经不可忽略, 而这种影响也不仅仅停留在业务层面上, 还应该引起新闻界和新闻媒介组织更深层次的思考。
大数据的兴起及其对新闻业影响的日益深刻的根源何在?笔者认为, 大数据的兴起, 一是和具有数字化传播特征、日益开放的互联网传播平台有关, 二是和互联网开放平台上的海量自媒体以及各种主动、被动形成的海量非结构化或互不关联的内容相关。也就是说, 大数据环境的形成, 是互联网社会化、社会互联网化 (包括物联网技术) 发展的一个必然结果, 大数据本身已经成为包括传统媒体和互联网媒体在内的所有媒体生存发展环境的重要构成要素之一。如果仅仅拿大数据和全媒体两个概念相比较的话, 可以发现, 大数据作为媒介组织发展的新型环境要素而言更为真实, 而全媒体则更多是媒介组织的一种臆想, 全媒体的概念更多是在用户层面或业务层面, 一般情况下还到不了媒介组织战略的层面。但是大数据对新闻业的影响则可以在业务层面之外, 进一步涉及到媒介组织的战略和运营管理层面。在此背景之下, 媒介组织应对大数据的兴起和发展趋势有更为深刻的认识, 才有利于其自身的创新发展和自我调适。笔者认为, 就大数据传播对于专业化媒介组织发展的影响而言, 大数据应有三个核心特点需要引起专业化媒介组织的特别注意。
一、在组织层面, 大数据将推动新闻业新型开放环境的生成。
大数据传播的核心之一是开放, 既包含具有开放特征的数据, 也包含具有开放特征的环境。而具有开放特征的互联网环境正是大数据传播形成的根本要素。在这个层面上, 大数据传播的开放精神和互联网新媒体的开放精神在实质上又是一致的。各种类型的专业化媒介组织如何顺应大数据和互联网开放的方向, 并获得新的发展, 这是一个值得思考的问题。专业化媒介组织所处的开放环境所带来的一个直接结果就是公开和透明。一个社会的政治、经济、文化、历史等各方面的信息经过不断数据化的过程, 即可使得人们通过对这些数据的分析不断获得对于社会环境更为真实的理解和认识, 这本身是人类社会发展的一种进步。与此同时, 这种开放的传播环境自然也导致媒介组织同样也处于这样开放的传播环境之中。这将使得社会公众对于媒介组织内容传播及其组织运行的评价更加公开、即时、全面, 而这种评价又将影响到市场环境和政治环境对于专业化媒介组织的关注程度和评价取向。彭兰的观点值得引起注意, 她认为:“大数据技术是检验专业媒体质量的另一个参照物, 在大数据技术面前, 无论是在反映全局性事实还是趋势性规律方面, 媒体现有报道方式与报道成果的缺陷都日渐暴露。但大数据技术既是参照物, 又可以成为专业媒体未来的方法与工具, 利用大数据技术, 专业媒体的报道水准将得到有效的提升。”因此, 对于专业化媒介组织而言, 更加趋于开放的传播环境一方面意味着大数据传播已成为需要媒介组织密切关注的重要趋势, 另外一方面也意味着更加开放、透明的环境将对专业化媒介组织的运营管理提出更高的要求。
二、在业务层面, 大数据将警醒新闻业发展不能偏离人本核心。
大数据传播的核心是人。对于大数据而言, 人是直接和间接形成大数据的核心来源。即使是各种类似基于物联网以及机器与机器通信所形成的各种信息或者是由于互联网用户自身行为在互联网系统中形成的各种显示其互联网生活轨迹的各类数据, 其最终的逻辑指向和服务目标也同样是人。因此, 在大数据传播环境下, 阅读内容的人, 创造内容的人, 留下互联网生活轨迹的人, 都应该成为媒介组织关注的重点, 而且应该是不可偏离的核心。彭兰认为:“个体的数据又有‘内容型’数据与‘活动型’数据之分。内容型数据对应的情形是, 用户行动的目的就是生产出直接在网络中发布的内容;而活动型数据 (如人们在电子商务活动中的购买行为记录) , 本身并不是用户有意识生产的内容, 而是用户活动的附属产物, 但它同样是用户行为的重要记录, 甚至是研究用户个性的重要依据。随着越来越多的人开始习惯于网络化生存, 活动型数据也成为个体人生中的重要痕迹。”因此, 可以看到, 大数据传播的总体来源是人, 大数据传播的基本核心也是人。而只有能够真正为人这个主体提供有价值或者高附加值内容服务的大数据才是真正有价值的技术形态。所以, 如何关心处于移动互联网大数据时代核心节点的人并为之提供不可或缺的内容服务, 应成为专业化媒介组织所关注的一个非常重要的问题。
即使在大数据传播环境之下, 人依旧是各种信息消费的主体, 这一点并没有发生变化。即使新技术可以使新闻业务类型发生新的裂变和分化, 但是这种裂变和分化依旧不能使机器化的应用完全替代人在专业化新闻内容生产中的核心地位, 而这种裂变和分化所解放出的新闻生产力正可以应用到更高层次的为人这个核心主体服务的层面上来。与此同时, 作为移动互联网时代独立传播自媒体的人, 也自然而然成为互联网传播平台乃至社会化传播进程中的传播主体。对于既是信息消费主体, 又是信息传播主体的独立传播自媒体群落来说, 其和专业化媒介组织的关系将发生新的变化。自媒体主体群落在接受各种专业化和社会化信息的同时, 也提供关于事实的社会化信息和关于所接受信息的社会化评价, 这使得媒介组织的传播环境在互动性层面发生了重要变化。在这个意义上, 自媒体传播主体群落既需要专业化媒介组织的即时信息和专业评论, 也会通过自身的社会化评价对专业化媒介组织的管理运营造成一定程度的影响。在新兴传播技术赋权的前提下, 专业化媒介组织和自媒体传播主体群落都得到了新兴传播技术的赋权, 但是以上两大主体在赋权之后的传播格局中所发生的变化方向却有所不同:独立自媒体传播主体群落的传播权大幅提高, 而作为传统大众传播时代的专业化媒介组织的传播权却相对降低。在互联网化和社会化传播环境之下, 传统专业化媒介组织和独立自媒体传播主体群落之间的关系将发展成为更加相互关联、相互依托、相互作用的重要传播关系。
三、在战略层面, 大数据将推动新闻业进一步重视客观规律的探寻和把握。
大数据传播的最为重要的核心之就是数据背后所隐藏的规律。海量的非结构化数据的出现, 使得人们在认识世界发展规律的时候多了一个重要的探寻维度, 即人们可以通过对大数据的分析揭示以前没有显现的社会发展的内在规律, 而这种大数据传播所呈现的内在规律则可以显示人在新型传播环境中的需求类型和传播逻辑。因此, 在大数据传播的基础之上, 进行专业化的趋势分析和深度报道将有可能成为媒介组织发展的应有的趋势性方向。从这个角度来说, 专业化媒介组织可以在大数据传播环境下更为准确地把握社会公众的需求和情绪的变化, 从而更为即时、准确地为社会公众提供专业化的信息内容服务。不过从另外一个角度来看, 专业化媒介组织在准确把握社会公众的信息需求的变化的同时, 也不能单纯迎合社会公众的信息需求, 而要在更高的层面上将真相和真实的信息呈现给社会公众。也就是说, 并非所有来自社会公众的信息需求都应该成为媒介组织所关注和满足的内容。虽然伴随着独立自媒体传播主体群落的兴起, 但是专业化媒介组织不应该成为社会公众在大数据传播环境下所呈现的各种内容需求的奴隶, 而应该成为大数据传播中的智者——开放的合作者、专业的超越者和人性的守护者, 既能满足大数据时代社会公众的信息需求, 又能为社会公众提供超越其固有需求的更具有人性的信息服务。
在扩散传播过程中, 新兴传播技术本身存在着各种不确定性, 但是总的演进趋势又是清晰的, 因此专业化媒介组织对于大数据传播的理解, 应该敏感地洞察各种不确定性的根源, 并真正把握大数据传播环境的实质, 而这应该是一个去伪存真、辩证调适的过程。总而言之, 在新媒体传播领域, 在新的概念、思维方式、运营模式出现的时候, 专业化媒介组织只有仔细辨析, 判明实质, 明确自我方位, 选择调整策略, 才能一直保持自身具有活力的创新发展态势。在移动互联网时代, 在大数据运营环境之中, 这就要求所有专业化媒介组织具有开放的组织特征, 能够根据外在环境的不断变化作出有效调整, 并持续保持自身整体向好的发展趋势;同时也要求专业化媒介组织能够在各种新兴传播技术层出不穷的环境下, 将内容生产和运营管理的焦点持续聚在人这个核心主体上。如果片面关注技术, 而忽略了技术背后所应关注的人的因素, 专业化媒介组织迟早会遭到背离所应坚持的客观规律的惩罚。而只有明确大数据环境下专业化媒介组织的运营规律和传播规律, 才不会使自身的实际运营与其具体环境和战略目标相脱离。
大数据时代:平面媒体启示录 篇10
美国《自然》杂志在2008年9月4日提出大数据的概念, 进入2012年后, 大数据一词越来越多地被提及, 人们用它来描述当下信息时代产生的海量数据, 并命名与之相关的技术发展与创新。哈佛大学社会学教授加里·金说:“这是一场革命, 庞大的数据资源使得各个领域开始了量化进程, 无论学术界、商界还是政府, 所有领域都将开始这种进程。”《纽约时报》2012年2月的一篇文章宣称, “大数据时代已经降临, 在商业、经济及其他领域中, 决策将日益基于数据和分析而做出, 而并非基于经验和直觉。”
有这么一个故事:一位年轻人应聘上海某高档小区物业管理, 入职后每天拿着条形码扫描枪, 在小区垃圾堆里寻找条形码, 扫描、归档。一段时间后, 他竟然借此形成调查报告, 从该小区居民看什么报纸、喝什么水、吃什么油到买什么衣服, 数据琳琅满目。报告后来被卖给某公司, 这位年轻人获利不少。这个故事描述了一个新时代的商机——掘金“大数据”。
大数据的第二个故事, 美国一家名为气候公司的企业, 每天都会对美国境内超过100万个地点, 未来两年的天气情况进行超过1万次的模拟。随后该公司将植物根系结构和土壤孔隙度的相关数据, 与模拟结果相结合, 为成千上万的农民提供农作物保险。这是一个全新的商业模式, 其利用了人、社会、自然三种数据, 把粗放式的商业保险个性化了。
二、大数据的时代
大数据, 或称巨量资料, 是指当前互联网时代由众多社会组织和个人在各种社会活动和个体活动中所产生的大量非结构化和半结构化数据。所谓的非结构化数据, 是指离散的、无确定排列规律和排列次序的数据。通俗地说, 是来自各方面的、没有经过筛选的数据。
世界上的数据可以分成两类: (1) 传统的数据, 如银行的金融交易活动、运营商的计费信息, 以及其他公共服务类公司的大量用户信息, 这是一种线性的数据, 可以称之为交易型的数据; (2) 网络时代的大数据, 是离散的。比如访问谷歌、百度、淘宝的用户生成信息, 产生了随机的、发散的、爆发式的大数据。相较于传统数据, 大数据更能反映这个世界的真实情况, 人们在网站上会公布大量的图片来记录个人的生活和社会的变化。如今, 一天之内人们上传的照片数量就相当于柯达发明胶卷之后拍摄的图像总和。
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡。麦肯锡称:“数据, 已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈余浪潮的到来。”虽然有些看法认为, “大数据”在军事、金融、通讯等行业存在已有时日, 但2012年以来的这一波“大数据”浪潮, 其影响力和效应必将波及全世界的全部行业。
麦肯锡的判断, 基于一个事实——信息爆炸。有数据显示:一天之中, 互联网产生的全部内容可以刻满1.68亿张光盘。发出的邮件有2940亿封之多 (相当于美国两年的纸质信件数量) ;发出的社区帖子达200万个 (相当于《时代》杂志770年的文字量) ;而且, 全世界所有数据中, 90%是过去两年内产生的。
“大数据时代”区别于之前的“小数据时代”主要有两个不同:
一是“数字化”内涵有了新的变化。一方面, 大数据时代的“数字化”并不等同于十年前纸质文档“数字化”。如今的“数字化”更多的是指“以数据指导业务”的运营模式, 而不像以前那样是由业务向数据提出需求。另一方面, 在大数据时代, 人们更多地依赖全量数据分析而不是依赖采样。而过去, 人们习惯于采集样本, 对样本进行分析, 得出结论, 然后决定运营方式。
二是数据的互联互通。数据在全社会范围内流通, 不再是企业独有。企业现在所面对的, 不仅仅是其内部数据互联互通的问题, 也需要面对数据在全社会范围内的互联互通问题。比如:当某传媒集团准备创办一份母婴期刊, 在做可行性方案时, 不仅需要了解同类期刊的运营情况, 还需要在全社会范围内, 采集婴儿出生率、年轻母亲喜爱的产品、购物渠道、哪些网站受母亲青睐, 它们为什么吸引母亲, 等等。在社会上, 将会有一些组织搜集与分析客户所需的这些互联互通的“大数据”。
“大数据”的特征是4V:Volume, Variety, Value, Velocity:
Volume (数据量大) 。大数据的起始计量单位至少是P (1000个T) 、E (100万个T) 或Z (10亿个T) 。
Variety (类型繁多) 。数据类型包括网络日志、音频、视频、图片、地理位置信息等, 多类型的数据对数据的处理能力提出了更高的要求。
Value (价值密度低) 。随着物联网的广泛应用, 信息感知无处不在, 信息海量, 但价值密度较低, 如何通过强大的机器算法更迅速地完成数据的价值“提纯”, 是大数据时代亟待解决的难题。
Velocity (速度快时效高) 。处理速度快, 时效性要求高。这是大数据区分于传统数据最显著的特征。大数据时代对人类的数据驾驭能力提出了新的挑战, 也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。
一些国家敏锐地觉察到“大数据”的巨大价值, 迅速启动“大数据”战略。2013年3月22日, 奥巴马政府宣布投资2亿美元拉动大数据相关产业发展, 将“大数据战略”上升为国家意志。奥巴马政府将数据定义为“未来的新石油”, 并表示一个国家拥有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分, 未来, 对数据的占有和控制甚至将成为陆权、海权、空权之外的另一种国家核心资产。
联合国也在2012年发布了大数据政务白皮书, 指出大数据对于联合国和各国政府来说是一个历史性的机遇, 人们如今可以使用极为丰富的数据资源, 来对社会经济进行前所未有的实时分析, 帮助政府更好地响应社会和经济运行。
众多大企业更是敏锐地意识到数据正在成为最重要的资产, 数据分析能力将是企业的核心竞争力。IBM执行总裁罗睿兰认为, “数据将成为一切行业当中决定胜负的根本因素, 最终数据将成为人类至关重要的自然资源”。Teradata (天睿公司, 美国前十大上市软件公司之一) 大中华区首席执行官辛儿伦表示, 随着大数据时代的到来, 企业应该在内部培养三种能力。第一, 整合企业数据的能力;第二, 探索数据背后价值和制定精确行动纲领的能力;第三, 进行精确快速实时行动的能力。麦肯锡在一份名为《大数据, 是下一轮创新、竞争和生产力的前沿》的专题研究报告中提出, “对于企业来说, 海量数据的运用将成为未来竞争和增长的基础”。海尔总裁张瑞敏指出, 在大数据时代, 消费品制造企业必须要从大规模制造过渡到大规模定制, 过去一个产品型号可以生产几万件到几百万件, 而现在可能需要几十万个型号。
三、大数据时代的企业生存
全球知名奢侈品牌PRADA在每件衣服上都有RFID码。每当一个顾客拿起一件PRADA进试衣间, RFID会被自动读取。每一件衣服在哪个城市哪个旗舰店什么时间被拿进试衣间停留多长时间, 数据都被存储起来加以分析。如果有一款式的衣服销量很低, 以往的做法是直接淘汰。但如果RFID传回的数据显示这款式的衣服虽然销量低, 但是进试衣间的次数多, 那就说明如果对衣服的某个细节做微小改变它就会非常受欢迎。
华尔街“德温特资本市场”公司首席执行官保罗·霍廷每天的工作之一, 就是利用电脑程序分析全球3.4亿微博账户的留言, 进而判断民众情绪, 再以“1”到“50”进行打分。根据打分结果, 霍廷再决定如何处理手中数以百万美元计的股票。霍廷的判断原则很简单:如果所有人似乎都高兴, 那就买入;如果大家的焦虑情绪上升, 那就抛售。这一招收效显著——当年第一季度, 霍廷的公司获得了7%的收益率。华尔街2%的企业搜集微博等平台的“非正式”数据;如今, 接近半数企业采用了这种手段。
2012年上半年, 阿里金融投放贷款130亿元, 自2010年自营小贷业务以来, 其已累计投放280亿元, 为超过13万家小微企业、个人创业者提供170万笔贷款, 而不良贷款率不到1%——这是银行难以想象的。原来, 通过阿里巴巴、淘宝、天猫、支付宝等平台, 阿里金融能对卖家进行定量分析, 前期搜集包括平台认证和注册信息、历史交易记录、客户交互行为、海关进出口信息等信息, 再加上卖家自己提供的销售数据、银行流水、水电缴纳等情况。同时, 阿里金融还引入了心理测试系统, 判断企业主的性格特征。所有信息汇总分析后, 企业主的信用评级便出来了。
大数据为企业的发展提供了有利的条件。国金证券在一份报告中说, 能够从“大数据”中获益的, 首先是研发“大数据”的软件供应商, 像谷歌、雅虎和亚马逊等, 都正在开发或使用“大数据”解决方案。其次是那些懂得利用客户群优势垂直整合产业链的公司。再次, 善用数据资产或者具备数据管理、分析能力的公司也获益颇丰。
四、平面媒体的应对之策
飞速发展的互联网时代, 在飞速淘汰传统信息的存储和传播方式。2000年, 数字存储信息占全球数据量的1/4, 另外3/4的信息都存储在报纸、胶片、黑胶唱片和盒式磁带等媒介上。2007年, 全球数据中只有7%是存储在报纸、书籍、图片等媒介上的模拟数据, 其余都是数字数据。2013年, 世界上存储的数据中, 非数字数据只占不到2%。
如果说, 互联网高速发展的十年, 严重挤压了传统平面媒体的生存空间。那么“大数据”时代对传统平面媒体又意味着什么呢?
互联网是一个信息交流的平台, 它的特点是跨越时空限制的信息流。平面媒体实质上也是信息平台, 但是它传播信息的快捷性和阅读的延展性都不如互联网。虽然平面媒体的权威性和可信度在现阶段仍然具有某种优势, 然而这种优势能否保持尚难以定论。
不过由于人们的阅读习惯以及某些特殊的原因, 平面媒体依然会有一定的生存空间。比如, 科研交流的特殊需求, 再比如, 幼小的孩子不方便也不适合网络阅读、学生的某些学习方式只能采用纸质阅读、老年人更喜欢平面媒体, 等等。大众化的阅读势必被互联网吸引走, 而平面媒体的发展方向应该是小众化、精品化。正如海尔总裁张瑞敏所说, 在大数据时代, 消费品制造企业要从大规模制造过渡到大规模定制, 从过去一个产品型号生产几万件到几百万件, 到现在需要几十万个型号。“百万大刊”的时代渐行渐远, 而为特定读者“定制”的高品质、高附加值的精品期刊将会成为常青树。笔者在写这篇文章时得知, 两家全国知名的百万期刊, 在江苏都有分印点, 但是五年之内, 在江苏的印量, 一家从50万降至30万, 一家从15万降至3万, 跌幅惊人, 且无止跌的迹象。这就是一个证明。
美国德克萨斯大学信息系统博士林漳希认为, 如果不能利用“大数据”以更加贴近消费者、深刻理解需求、高效分析信息并做出预判, 企业的衰落将不可避免。按照Teradata大中华区首席执行官辛儿伦的观点, 在大数据时代, 企业应该在内部培养三种能力。第一, 整合企业数据的能力;第二, 探索数据背后价值和制定精确行动纲领的能力;第三, 进行精确快速实时行动的能力。国金证券也指出, 在大数据时代获利的企业, 应该懂得利用客户群优势, 垂直整合产业链。这些见解颇值得传统平面媒体经营者思考。
传统平面媒体普遍历史较长, 大多在互联网兴起之前便已存在。在十几年或几十年的进程中, 积累了大量的资源, 这些资源包括编辑队伍、作者人脉、读者群体、出版数据、发行渠道等。但长期以来对这些资源粗放经营, 缺少精耕细作。在大数据时代, 传统媒体的经营者应该深入分析读者的需求, 整合资源, 整合产业链, 在市场形态、产品形态、运作形态等方面进行适应性调整, 这样才能获得新的生存和发展。
刊网联动应该是传统平面媒体在大数据时代的基本运作形态, 同时也是一种产品形态。以网助刊, 以刊带网。网站为刊物与读者的互动提供了最便捷的平台, 网站还能为刊物迅速进行读者需求分析, 从而提高市场应对的能力和速度。刊物的既有资源优势也可以成为网站的优势, 能够迅速提高网站的知名度和点击率。可是, 很多平面媒体至今依然是“一头沉”, 只关心报刊的版面, 忽略网站的作用。即使开设了网站, 也常常把报刊主办单位的网站与报刊的网站混为一谈, 或把报刊网站仅当作橱窗, 没有投入足够的人力物力。网站内容更新缓慢, 没有与读者互动的页面, 更没有采集读者信息的功能。
在产品形态的选择方面, 近年来, “一刊多版”现象其实就是对读者需求的回应。在刊号资源不能有效供给的情况下, 这个趋势不可能停止。但是在调整、增加版别, 或推出数字产品之前, 媒体经营者应该充分利用大数据做需求分析, 而不是凭经验主观臆断。
利用大数据做需求分析即必须挖掘读者的阅读习惯和喜好, 在纷繁杂乱的数据背后找到更符合读者兴趣和习惯的产品和服务, 并对产品和服务进行有针对性的调整和优化。而深刻理解读者需求、高效分析市场信息需要专门的高端人才。这意味着平面媒体的运作形态应该建立在以市场为导向重新优化组织结构的基础上。目前传统平面媒体运行的信息分析和决策依然是凭直觉, 经验化的, 没有专业的分析人员和分析工具, 不能适应大数据时代全量数据分析的要求。建立高素质的信息分析队伍和信息采纳机制应该是当前传统平面传媒企业紧迫的工作。
精准营销是互联网企业和通讯企业利用大数据开拓市场的主要策略, 也将成为其他行业的运营方向。对于平面媒体, 精准营销就是寻找读者、满足读者、留住读者。依托读者数据库进行精准营销是改变平面媒体市场形态的一个重要举措, 某知名报社的社长针对大数据时代的媒体竞争格局曾经指出:“新媒体格局下媒体的竞争力首先是品牌的比拼, 其次是数据库的比拼!”这句话很有道理。但是数据库的建设不能只局限于读者身份的采集, 而忽视读者需求的听取;数据库的架构不应该是封闭式的, 而应该是开放式的。否则只能算初级阶段, 离大数据时代的标准还很远。所以确切地说, 平面媒体建设的数据库, 不仅是读者数据, 还应该包括与媒体运作相关的全量数据。
前雅虎总经理谢文断言, 2013年是大数据时代元年, 2015年左右大数据必有大创新出现。对传统平面媒体来说, 大数据时代的到来, 既可能是奋进的号角也可能是衰亡的丧钟。依靠大数据, 创新经营理念, 可望获得新的生存和发展机遇;反之, 如果不能化压力为动力, 变被动为主动, 被淘汰将是不可避免的。
参考文献
[1]百度百科.大数据时代[DB/OL].http://baike.baidu.com/link?url=Gvugk0BTH5NfdPw6byI-Ydroh4_aGlISLbX4w8pVDd7KXwg TjNUXiwerSh-iNyffpbkei7RLxriZHGVB2ZFzk_.
[2]中国行业研究网.解读大数据的概念及挑战[DB/OL].http://www.chinairn.com/news/20130123/899257.html.
[3]逸凡.大数据定义探究[DB/OL].http://bigdata.cnw.com.cn/bigdata-column/htm2013/20131008_284070.shtml.
[4]郑玲微.大步跨入“大数据”时代[J].信息化建设, 2013 (4) .
[5]周季钢, 吴刚.一个价值万亿美元的商机摆在地球人面前——掘金“大数据”[N].重庆日报, 2013-02-26.
媒体大数据 篇11
中国传媒大学新媒体研究院院长赵子忠教授首先发表欢迎致辞,对于与北京大学、清华大学、中国会展经济研究会一起,就会展大数据领域展开联合研究和学术探索寄予了充分的希望。中国会展经济研究会袁再青会长发表致辞,预祝会展大数据研究中心发挥思想引领和科研探索之力,在推进中国会展行业的未来发展中发挥巨大价值。随后,中国传媒大学新媒体研究院卢迪副教授与北京逸格盛视大数据科技有限公司副董事长刘佳女士,共同为“会展大数据研究中心”揭牌。揭牌仪式上,北京大学新媒体研究院院长谢新洲教授、清华大学新闻与传播学院金兼斌教授被聘为中心学术委员会学术专家;中国会展经济研究会会长袁再青、中国会展经济研究会常务副会长储祥银、北辰会展集团副总经理、国家会议中心总经理刘海莹、北辰会展研究院副院长许锋被聘任为中心首批会展行业专家。
会展大数据研究中心由中国传媒大学新媒体研究院与北京逸格盛视大数据科技有限公司于2016年2月联合设立,目的是为了推进会展行业与大数据的融合应用,促进会展产业的信息化、数据化。中国传媒大学新媒体研究院是2008年成立的最早一批“新媒体”科研教学单位,下设“国际大数据实验室”,将为会展大数据研究中心提供思想理论指导和大数据技术支持。北京逸格盛视大数据科技有限公司具有十余年展览行业从业经验,专注于大数据展览、展示,致力于“大数据+会展”的创新融合,为会展大数据研究中心的科研成果落地载体。
目前,北京逸格盛视大数据科技有限公司可以将大数据服务贯穿于从市场调研、需求分析、场地搭建到周边设计、品牌追踪和客户管理的主要业务场景,提高会展企业的决策准确性、科学性和运转效率;同时为会展企业提供多维度、全方面的数据分析报告,协助会展企业构建自身数据资产、实现信息化升级与全球化战略目标。在第四届“京交会”上,会展大数据研究中心就通过自主研发的大数据平台,为“京交会”提供了实时在线的数据可视化展示,让主办方、参展商与观众能够实时查询、浏览数据和分析结果,及时感知国内外社交媒体平台及网民的信息反馈,准确判断认知、态度和情感;并在“京交会”后,发布了基于自主研发会展大数据平台数据采集和数据分析能力的《2016年第四届“京交会”全球互联网传播效果数据报告》,以全球互联网平台上关于“京交会”信息的发布时间、发布数量、发布地区、关键词词频为评估指标,并从全球互联网平台和互联网网民两个维度进行分析,以“京交会”在全球主流互联网平台传播效果与网民关注度分析两方面呈现,进而帮助主办方调整市场宣传战略策略,改善“京交会”自身的产品和服务,提升“京交会”的品牌价值。此外,会展大数据研究中心还为“2016杭州G20峰会”、“2016夏季达沃斯论坛”、“2016上海MWC大会”等全球瞩目的重大会议提供了国际大数据分析服务,通过全球传播效果大数据报告的呈现帮助主办方全面客观了解信息传播情况,从而调整海外的传播策略,扩大会议的知名度与影响力。
会后,与会专家领导就“会展+大数据”展开了充分交流。专家们对会展业与大数据的应用融合提出了思考与建议:一是会展业没有形成完整高效的产业链,数据资源分散、完整性低,大数据与会展业的融合,能够为产业链各个环节提供新的信息服务模式、创造新的价值;二是会展业的数据采集方式仍较为落后,传统的问卷调查、展商录入等数据采集方式形成数据单一,会展业应紧跟时代潮流,与其它关联产业的数据进行对接,如贸易数据、物流数据等公开数据以及微博、微信等互联网平台数据;三是会展业现有的数据资源不够规范,数据的标准化、准确性低,在未来打造精准的数据库将是会展业信息化发展的重要基础;四是会展业的信息化程度较低,面对已有的数据资源并不能很好地转化为数据资产,数据价值利用率低下,会展业的自我信息化升级已时不我待。
会展大数据研究中心的成立,标志着中国会展业的信息化、数据化发展开启了新篇章,会展大数据研究中心将为中国会展行业的转型与升级发挥加速器和创新引擎的作用。
大数据时代的媒体云互动电视应用 篇12
随着云时代的来临, 大数据 (Big data) 也吸引了越来越多的关注。大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换言之, 如果把大数据比作一种产业, 那么这种产业实现盈利的关键, 在于提高对数据的“加工能力”, 通过“加工”实现数据的“增值”。其爆发式增长被公认为是新的自然资源。大数据具备4个V的特点:体量 (Volume) ——非结构化数据的超大规模增长, 数据体量是传统结构化数据库的10倍到50倍, 数据从TB级跃升为PB级。多样性 (Vairety) ——数据的内容多样, 可以是文本、图像、视频或者机器数据以及其他类型的数据等。价值密度 (Value) ——价值密度低, 商业价值高。以视频为例, 连续不间断监控过程中, 可能有用的数据仅仅有一两秒。速度 (Velocity) ——数据分析要求以最高的速度实时产生, 而非传统数据挖掘技术的事后分析。
目前, 行业对于采用云计算技术支撑广电互动电视应用已经形成了共识, 通过“媒体云”平台, 传统的广播电视可以具备点播、时移、回看等功能, 进而向用户提供统一高效的互动电视业务体验。然而, 如何进一步经营好互动电视服务, 为用户提供具有差异化、个性化的高品质服务成为了提升交互电视运营价值的一个课题, 大数据技术的应用为这一诉求带来了完美的解决方案。
广电业务云平台通过引入大数据技术, 可以从以下几个层次收集数据并进行实时分析, 进而获得相应的信息。
用户收视数据——通过对于用户在不同时间收看不同电视频道, 进而了解用户关注的电视频道乃至电视节目内容、类型等信息。
用户点播数据——通过收集分析用户对于VOD的使用情况进而了解用户的收视习惯以及对于点播节目的喜好信息。
机顶盒终端使用数据——通过对于终端设备运营情况数据的收集与分析进而了解用户的使用习惯以及网络的运行状况。
通过对于以上数据的收集分析, 可以为用户提供全新的互动电视服务形式, 可以有效地提升业务到达率和用户活跃度, 进而提高用户的ARPU值。这些全新的典型应用包括:
个性化的EPG
在双向网络条件下, 借助于云平台和大数据技术, 用户的EPG不再是千篇一律, 系统可以依照用户的喜好以及收视习惯, 在用户的终端EPG上有针对性的推荐内容, 从而实现EPG的个性化。进一步的, 可以通过社交化能力的导入, 在EPG中实现了解用户的好友、邻居等其他用户的收视热点, 大大增强用户的活跃度。
智能节目推荐
通过云计算平台和大数据技术对于用户收视行为的分析, 以及对于播出节目内容和后台系统的分析, 可以在用户观看电视节目的时候有针对性的向用户推荐相关联的节目, 这一推荐类型存在以下形式。
开路频道导视
通过对于EPG数据的挖掘, 可以将传统的基于时间线的频道资源碎片化, 进而切分成基于内容的分块的频道资源。系统可以通过先验知识的自动化分析, 进而可以了解到每个电视频道在不同时间段播出的节目类型, 进而可以根据节目类型将频道进行聚类。这改变了过去以频道编号或者频道类型进行分类的频道方式, 进而可以依照当前频道播出的节目类型对于所有频道进行动态分类。采用这样的方式, 可以大大方便用户选择收看的电视频道, 变被动的扫描频道为主动的选择感兴趣的电视频道进行收看。 (见图1、2)
点播推荐点播
通过对于点播数据媒资内容的分析, 可以实现对于点播节目内容的关联, 进而可以在用户点播观看VOD节目时对用户推荐其他类似主题、类似导演、类似演员的节目。进而, 通过对于用户行为的分析, 可以向用户推荐其他用户观看的热门节目等, 增强用户使用VOD服务的活跃度。
直播推荐点播
用户当前正在观看某电视台播出的某部电视剧的第6集, 传统情况下在其播完后用户只能在次日才能收看到该电视剧的下一集, 然而如果VOD系统中恰好也有这部电视剧, 那么就可以在该电视剧的第6集播出时提示用户通过VOD点播观看该电视剧的第7集, 进而可以有效地提升互动电视的使用率。 (见图3)
智能广告投放
数字电视机顶盒的UI与交互界面为在系统中开展广告运营提供了很好的空间。传统的数字电视广告包括EPG广告、音量条广告、换台广告、贴片广告等。通过媒体云平台与大数据技术的应用, 广告的投放可以更加智能。一方面系统通过前文所属的对于电视频道当前播放节目内容类型的分析, 进而为该时段该频道的相关广告位投放相关联的广告。例如会将啤酒的广告自动投放在与体育、娱乐等相关联的节目频道与时段, 而将日用品的广告自动投放在与生活、女性相关联的节目频道与时段。另一方面, 系统可以对于用户收视习惯与行为喜好进行实时分析, 进而为时常收看体育节目的用户投放体育用品广告, 为时常收看娱乐节目的用户投放时尚用品的广告。 (见图4)
实时收视率分析与导视
借助媒体云平台与大数据技术, 收视率的统计不再是一个难题。系统可以通过双向网络实时收集每一个终端的收视情况, 借助于对用户所在区域的了解, 实时分析不同时段每个电视频道的收视率情况, 乃至不同电视频道播出的不同电视节目的收视情况 (见图5) 。此外, 借助于收视率分析数据, 系统可以对用户的收视行为进行实时引导, 例如将需要推广的电视频道的栏目通过推送广告的方式下发到用户终端, 从而对用户收视情况进行实时引导, 实时影响不同频道的收视率。
实时网络运行状况报告
在双向网络的情况下, 用户的机顶盒终端的运行情况不再是一个无法探测的黑盒子, 而是可以通过自动向平台报告终端运行状态, 进而可以了解终端和网络的运行情况, 有助于运营商分析统计提升数字电视网络的运营质量。例如, 借助于业界通用的TR069终端网管协议, 云平台可以实时了解网络中每一个终端的观看节目、信号质量、网络时延、终端CPU内存等的使用情况等。这样在网络发生故障造成信号中断或者终端个体原因发生故障时, 系统可以第一时间了解到故障的发生, 进而在用户投诉之前掌握到问题, 主动优先为用户提供更好的保障服务。 (见图6)
【媒体大数据】推荐阅读:
大数据时代的媒体融合05-13
大数据时代的新闻媒体09-07
大数据对新媒体的影响06-19
大数据环境下的电视媒体发展06-03
数据多媒体11-20
多媒体数据压缩08-09
多媒体数据库10-07
多媒体数据库实现技术10-01
多媒体数据库建设规范09-14
媒体大融合07-11