大数据和数据化思考

2024-05-21

大数据和数据化思考(共12篇)

大数据和数据化思考 篇1

大数据是现代社会高速发展的产物, 给人们的生活带来诸多便利。就高校而言, 大数据的真实价值在于如何被有效利用。高校应运用大数据的思维和技术, 构建财会信息系统, 建立科学的绩效考评体系, 提高资金利用效率, 有效防范及监控财务风险, 为学校健康快速发展提供科学决策数据。

1 大数据的内涵

目前关于大数据的定义在业内还没统一的表述。身份定位不同、角度不同, 对大数据的理解也有差别。

全球最具权威的IT研究与顾问咨询公司Gartner指出:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡对其定义则是:大数据是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集合。赛迪智库也提出, 大数据是一个相对的概念, 并没有一个严格的标准限定多大规模的数据集合才称得上是大数据。它认为大数据应是数据对象、技术与应用三者的统一:一是从从对象角度看, 大数据是大小超出典型数据库软件采集、储存、管理和分析等能力的数据集合;二是从技术角度看, 大数据技术是从各种各样类型的大数据中, 快速获得有价值信息的技术及其集成;三是从应用角度看, 大数据是对特定的大数据集合、集成应用大数据技术、获得有价值信息的行为。

大数据主要有六个典型特征。一是容量大。数据的大小决定所考虑的数据的价值和潜在的信息;二是种类多。充分体现了数据类型的多样性;三是速度快。获取数据的速度超乎想象;四是可变性。这对有效处理和管理数据造成了一定妨碍;五是真实性。这保证了数据的质量;六是复杂性。数据来源渠道多, 信息量巨大。

2 大数据对高校财务管理的影响

近年随着我国高等教育的快速发展, 教育体制改革的逐步推进, 高校财务管理工作环境也日渐复杂。同时, 对财务服务工作也提出了更多更严更高的要求。在大数据时代的背景下, 高校对数据信息的处理和利用已经成为财务管理工作的重要内容。大数据对高校财务管理的影响主要体现在以下三个方面。

2.1 使高校财务管理更加高效便捷

借助信息化技术, 高校财会人员能够从海量数据中提取出对学校发展有利的关键信息, 能够利用信息化平台向决策领导层、上级主管单位等提供高效的信息服务, 能够突破传统财务管理模式, 消除时间和地域上的限制, 从而实现各种管理系统的有机结合, 能够有效避免信息的重复和孤立。

2.2 对高校财务管理质量提出了新的更高要求

传统的财务报表主要是以数字信息来单纯地反映单位收支、资金动作等经济现状。而大数据背景下的财务报表则要求反映学校所有资产、科研、人事、教学、后勤等方面的详细信息。因此, 传统的数据处理方式已无法满足当前财务报表编制的需要。怎样持续收集各方面的数据, 并经过科学分析转换成准确有效的财务信息是各高校面临的实现问题。大数据背景下的财务服务工作, 要求学校各部门、各单位之间相互配合, 要求更加精细的管理, 要求更加高效的服务。

2.3 对高校财务风险管控提出了严格要求

随着网络信息技术的不断进步, 网络环境亦发生了很大变化, 高校财务信息系统也面临着愈来愈多的挑战。在大数据背景下, 高校财务海量信息的整理、处理、输入、输出、通讯等是组成会计信息系统的关键部分。这些主要部分都可能存在信息数据泄露、被盗等风险。如何应对因信息数量的激增而导致信息通道的拥堵, 如何优化数据分析、过滤、筛选等功能, 如何提高数据处理效率, 如何有效封堵管理漏洞等问题, 对高校财务风险管控的要求越来越高。

3 高校财务管理存在的问题

3.1 部分高校尚未构建科学完善的信息服务体系

当前, 部分高校还没有构建科学完善的信息服务体系, 对网络财务平台运用不够, 大大影响了管理效率。究其原因, 一是没有构建成熟的网络服务平台, 影响了工作效率;二是部分高校虽然在数字化校园建设中构建了网上账务服务平台, 但对数据的利用率较小;三是部分高校还未有效整合全校的大数据, 无法对现有的数据进行科学分析, 财务管理实效性不高。

3.2 财会信息集成化程度低

笔者调查发现, 部分高校的财会信息系统没有与校园数字系统完全融合, 与科研管理、教学管理、资产管理、人事管理等系统之间, 缺少数据接口、规范统一的标准, 大数据集成化程度较低, 信息共享性较差。如果不能有效整合各个部门现有的基础数据, 若不能及时掌握、利用学校的办学资源, 那么财务预算在优化配置办学资源方面的作用就很难得到有效发挥, 将会大大影响资金的使用效率。

3.3 财务管理信息系统无法满足决策需要

当前多数高校的财会信息系统主要用来完成预算、结算、报账、工资发放、学费收缴等单纯的数字作用。但其决策支持功能不强, 无法满足高校财会工作科学化、规范化、精细化的要求, 不能有效支持财会工作中的评价、规划、决策、控制等内容, 不能向学校领导层提供及时、科学、准确、完整的决策信息。

3.4 部分财会人员的综合素质有待提高

信息化时代的来临、新《高等学校会计制度》的颁布实施、高校财会工作信息化和经济业务的复杂化, 对财会工作人员的综合素质提出了新的要求。为适应时代步伐, 财会人员需要具备扎实的专业技能, 能够熟练操作计算机, 同时还应掌握相关经济、法律、管理等方面的知识, 应具备较强的分析判断和协调沟通能力, 以便能更好地为学校提供优质的服务。然而, 不少高校还存在财会人员综合能力不强的现象。部分财会人员对做账、记账、和结账业务非常熟悉, 对日常工作中使用的核算原则和会计科目非常了解, 但很多财会人员在此基础上不愿继续学习新的知识, 大大影响了财务服务工作效率。高校财会人员经常与审计、财政、税务、物价等政府部门打交道, 如果缺乏扎实的专业知识, 或者不具备较强的分析判断和协调沟通能力, 不仅不能服务于学校发展, 还有可能使学校及教职员工蒙受损失。

4 大数据时代加强和改进高校财务管理的思考

4.1 加强和改进高校财务管理的必要性

一是适应网络信息技术发展的需要。随着网络信息化技术的高速发展, 大数据对高校财务工作的影响愈发深入。在大数据背景下, 传统的会计工作已不能满足信息技术发展的需要。随着高校财务管理信息系统的推广应用, 很多传统的人才工作将被计算机替代。而财会人员将投入更多的精力, 运用大数据进行分析处理, 为高校决策管理层提供科学有效的财务信息数据。因此, 在大数据时代, 进一步加强高校财务管理是适应网络信息技术发展的需要。

二是适应当前高校财务体制改革发展的需要。《高等学校会计制度》正式实施以后, 使会计科目、会计基础、会计报表、会计核算等均发生了很大变化。这都对高校财务管理提出了新的更高要求。为适应当前高校财务体制改革发展的需要, 财务工作必须借助服务载体, 优化学校资金结构, 不断提高管理效率。

4.2 构建综合财务管理平台

要充分利用发达的现代信息技术, 把核算、决策等功能融入到财务管理平台中, 以满足财务预算、控制、结算、监督、风险防控、工资管理、绩效评价、信息公开、决策支持等需要, 以实现财务管理与科研管理、教学管理、资产管理等系统数据有效对接, 提高资金利用效率。对此, 高校应统一整合财务数据和其它业务的基础数据, 拓展财务管理的范围, 细化预算管理, 建立智慧数据分析模型, 规范财务信息发布, 整合财务管理系统和科研、教学、资产管理等系统的无缝链接, 科学构建综合性、服务型财务管理平台。

4.3 构建网络服务平台

网络财务服务平台的开发与运用是高校信息化建设的重大突破, 是利用网络信息技术手段进行财务管理的先进服务方式。传统的财务管理服务模式, 需要专门的财务人员把相关信息逐一手工录入电脑。这样很容易产生服务效率低下等问题。因此, 传统的财务管理服务模式已不能适应高校发展的需要。网络信息技术的发展与应用, 为构建财务服务平台提供了必要的技术支持。网络信息化模式的开发与运用, 可以大大提高财务管理效率和服务水平。

目前, 河南科技大学构建的网络财务服务平台包括“财务查询系统”、“网上报账系统”、“网上申报管理系统”和“科研管理系统”。该网络财务服务平台的优势主要有以下四个方面:一是报销手续简化, 报账人员可以自由选择时间, 随时填报, 之后将报账资料送至财务部门, 无需现场等待, 财务部门处理完成后以短信方式通知;二是有利于科研项目经费预算、决算的填写。财务部门在系统中对部分科研经费按其管理办法, 对报销的内容进行了归类, 对今后申报经费预算及填报项目决算有较为直接的指导作用;三是轻松管理教职工的科研项目, 查询其所负责的全部项目的收支明细、借还款情况和当前余额。同时也可以查询各种关于项目的资金情况;四是按照国家政策要求, 细化报销手续, 进一步规范财务管理, 有利于信息共享, 有利于项目检查、审计, 提升财务管理效率和服务水平。

4.4 提高财务人员综合素质

为适应高等教育快速发展和经济全球化的要求, 高校财务人员只有不断提升其综合素质, 才能有效增强财务服务的质量和效率。对此, 可以从以下几个方面着手:一是高校领导要高度重视财务人员综合素质对财务服务工作的影响, 加强学习型、服务型财务队伍建设;二是加强对财务人员专业技能的培养, 注重其财务知识的更新, 以适应高等教育快速发展的需要;三是要优化财务人员知识结构, 加强对经济、管理、法律等相关专业知识的培训学习;四是加强财会队伍职业道德建设, 提高财会人员道德修养, 进一步完善高校内部控制和外部监督机制, 进一步完善财会人员职业道德评价体系;五是对财务人员加强服务意识的宣传教育, 使其充分认识服务工作的重要性。在服务质量和服务水平提高方面加大投入, 逐步建立并完善服务流程。

参考文献

[1]赵姗.大数据时代来临, 中国准备好了吗[N].中国经济时报, 2013-7-1, A11.

[2]吴静慧.关于加强高校财务服务工作的思考与建议[J].市场论坛, 2015 (11) .

[3]吴静慧.高校会计职业道德建设存在的问题及其改进途径[J].经济视角, 2014 (12) .

[4]崔洪俊等.大数据时代高校财务管理信息系统构建探讨[J].财会通讯, 2015 (31) .

[5]艾明阳.大数据时代高校财务精细化管理对策[J].现代经济信息, 2014 (19) .

[6]韩丹丹.大数据时代下高校财务管理如何做好基础数据的分析[J].财会学习, 2015 (18) .

[7]胡芳菲.大数据时代下的高校财务精细化管理研究[J].企业改革与管理, 2016 (1) .

大数据和数据化思考 篇2

应对大数据时代信息安全问题,当务之急是需要增强对大数据信息安全的保护意识。大数据技术发展时间较短,相关技术人员的观念还停留在传统的数据库信息管理中,缺乏对于大数据时代信息安全管理的足够重视。因此,技术人员需要及时调整自身心态,加强对信息安全的重视。而对于普通民众而言,在浏览网页、进行网络购物时,对陌生网站需要提高警惕,切莫草率留下个人信息,特别是身份证号、银行账号等相关重要信息。同时,政府也需要加强对信息安全管理的监管,提升数据管理的有效性,避免造成重大损失。

3.2建立健全信息安全保障体系

在当前大数据时代背景下,建立健全信息安全保障体系,是提高信息安全管理水平、降低信息泄露风险的有效措施。建立信息安全保障体系,首先需要建立标准化的数据类型,将各种类型的.数据标准化,从而确保引擎能够自动捕捉所需要信息。其次,需要制定数据标准化的指标系统,对相关数据进行指标分类,从而能够迅速有效的识别数据,提取数据。最后,需要开发、设计高度集成的信息安全管理工具,从而能够更加全面、有效的对信息安全进行保障。

3.3深化推进信息安全技术改革

大数据时代的到来,给信息技术产业带来的新的发展机遇。虽然当前在信息安全问题上面临种种问题,但这同时也意味着才信息技术行业仍有不足需要改进,因此,深化推进信息安全技术改革势在必行。相关企事业单位,需要加强人力物力的投入,培养相应的信息技术人才,推动信息安全技术的持续发展。

4结语

综上所述,在大数据时代下,不论是政府行业或是金融行业,甚至是生活中的各行各业,都面临着信息安全变革所带来的威胁,而在此境况下,要应对信息安全问题,不仅需要增强对信息安全的保护意识,更需要建立健全信息安全保障体系,深化推进信息安全技术改革,从意识、体制、技术三个方面保障大数据时代下各个行业以及个人的信息安全。

参考文献

[1]陈韵.大数据时代的信息安全问题及对策研究[J].电子技术与软件工程,,23:212-213.

[2]王世伟.论大数据时代信息安全的新特点与新要求[J].图书情报工作,,06:5-14.

[3]李婷.大数据时代网民信息安全问题与策略研究[D].黑龙江大学,2015.

[4]张艳欣,康旭冉.大数据时代社交网络个人信息安全问题研究[J].兰台世界,,05:24-25.

[5]肖广娣,凌云.大数据时代信息安全分析[J].电脑知识与技术,,35:7937-7938.

[6]马晓星.大数据时代面临的信息安全问题研究[A].天津市社会科学界联合会.科学发展协同创新共筑梦想——天津市社会科学界第十届学术年会优秀论文集(中)[C].天津市社会科学界联合会:,2014:5.

[7]冯伟.大数据时代面临的信息安全机遇和挑战[J].中国科技投资,,34:49-53.

大数据下的空间数据挖掘思考 篇3

关键词:大数据时代;空间数据挖掘;发展趋势

中图分类号:TP311.13

随空间信息的概念进入公众视野、成为研究人员的探讨议题后,部分专家便预测了空间数据挖掘的必然出现,由于大数据时代对于数据的特殊要求及属性定位,势必会带动一股对于数据整合手段的讨论热潮,而空间数据挖掘技术随之应运而生。从简单的同类事件各类型数据的对比提炼,到各类型事件多样化数据的收集、整合,空间数据挖掘技术较数据挖掘技术的提升空间巨大。

1 论文议题概念与意义

随各类型资料、信息的聚集量逐渐扩大,信息整合技术手段层出不穷,可以说,我们当下生活的环境已进入大数据时代。各类型事件、各类型组织、各类型研究议题均无法脱离大数据时代的长远影响。大数据时代已经开启便注定其今后的主导地位。而空间数据挖掘则是大数据时代的主要代表思想,从其概念看,空间数据挖掘指的是将存在于空间领域、表面看毫无规律、内在联系不明显的隐含数据信息运用相关特征及模型建立手段进行提炼的过程。其操作过程包含数据的准备过程、选择过程、预处理过程、缩减过程、变换过程、配套研发过程等多个环节,每一环节都紧密相扣。就已有空间数据挖掘研究现状看,较成熟的空间数据挖掘手段包括概率论、空间分析、统计分析、归纳学习、空间关联、聚类分析、神经网络、决策树、粗集、趋势探测、云理论、遗传算法、可视化处理等等类型。大数据时代的空间数据挖掘技术研究所经历的发展历程呈现初步提升、类型多元化变换的良性趋势。

对于空间数据挖掘技术,人们由最初的简单数据提取逐步演化为如今对技术手段的不断优化,可以说,大数据时代的社会轮廓愈发清晰明朗。大数据时代的空间挖掘技术也逐渐从专业领域研究人员所用手段逐步变为日常生活中经常出现的行为模式。从政府执政参考、学校教学手段提升、专业领域研究、到社会现象规律探究,各行各业随处可见大数据空间数据挖掘思想的影子。或许人们在操作过程中并不确定其手段的数据挖掘属性,然而大数据时代的空间数据挖掘思想就这样的逐步渗透到我们的生活中。

本文议题设定原则在于协助人们明确自身所处社会时代的大数据特性,以前人思想分析为基础,明晰空间数据挖掘思想对人们日常生活的重大影响及其优势。

2 空间数据挖掘的特点及应用范围

信息时代必然的结果是巨大数量级的各样信息的逐渐积累,无章可循的大量信息无法给人提供有效信息及功能,那么我们可以称之为垃圾信息。倘若没有空间数据挖掘作用,那么我们周围的所有信息将以杂乱无章的混乱形式充填,加之空间信息的增长速度极快,根据领域个性化要求进行的空间数据挖掘技术的出现十分必要。

2.1 空间数据挖掘的特点归纳。空间数据由于其区别于普通数据的多样性及复杂性,注定了空间数据挖掘手段具备一定特殊属性。在查阅相关资料后笔者发现空间数据挖掘的特点可以从其本身特性及应用特性两方面予以概括。

(1)数据来源多样且丰富、数据数量级庞大、数据类型众多、数据呈现形式表面看非常复杂;(2)所依托手段水平较高,常常借助空间搜索引擎使用机制对復杂空间数据予以组织。由于空间数据挖掘技术的定位较此前大数据环境下的简单数据整合、聚类而言有很大提升,所涉及的相关技术手段的水平自然而然随之提升;(3)空间数据挖掘手段类别多样,对于不同领域要求有不同属性表现。由于应用范围多样且复杂,空间数据挖掘手段的类型也随之发生不同变化,每一类空间数据挖掘技术都依据所负责的领域研究内容而在侧重点上有所不同;(4)空间数据挖掘原则为多尺度、多维度并行分析。面对现代社会日趋多元化、复杂化、空间化的数据信息整合需求,空间数据挖掘手段虽然各自存在不同,但其发展趋势方向为多领域并行分析。原因在于各类型领域的共同性注定了今后信息整合的归一性。

2.2 空间数据挖掘的技术支撑。目前国际上公认的具有代表性的空间数据挖掘技术支持系统包括Descartes、GeoMiner、ArcViewGIS的S_plus接口数据库系统。这三种SDM系统在不断的实践应用过程中均表现出令人满意的可视化地图与DM之间的结合能力。可以提供根据用户数据需求的多样聚类、数据信息分类等挖掘形式。Descartes作为专门的空间数据可视化技术,其工作原则为与DM工具Kepler两者联合在一起。而GeoMiner系统相对庞大,在实际运用过程中会对空间数据信息平台的资源配置要求过高,也可能会造成一定程度的资源浪费。而较为常用的GIS系统在应用过程中同样存在一定缺陷,虽然其技术本质为解释性语言的一种,但其功能性上较C语言而言较慢,也就是说,GIS系统较难实现对相对量多的数据库的挖掘。

以GIS中数据挖掘的过程,帮助理解空间数据挖掘的技术方案。首先,根据一定的主题要求及背景知识,从现有的空间数据中提取数据进行分析、处理。其次,选择合适的算法,确定参数。得出挖掘数据后对其进行评价,再以用户能够全面理解的方式呈现给用户。

2.3 空间数据挖掘的应用领域。正如前文所说,空间数据挖掘的涉及领域范围极广,对人们工作、生活、学者研究乃至国家政策都有潜移默化的影响,其优势已被国际认可。就目前空间数据挖掘的发展现状看,其应用领域包括国家国防建设及安全筹划、人们日常生活及身体健康、气候变化及天气预测、地质勘探及环境调研、地震预防及突发性事件应对规律等。近几年来被热议的智慧城市、智慧地球等新兴理念也同样受到空间数据挖掘的影响。

天文学、地质学、灾害学等领域需要依托以往经验、规律进行有效预测、算法设置、要点归纳,而大数据时代下的空间数据挖掘思想恰恰迎合了这种需求,值得注意的是,空间数据挖掘技术在危机管理及危机预警行业的应用频繁、效用显著。由此可以推测,今后空间数据挖掘技术在经验探究、规律总结类研究领域的应用比重将会更大。

3 空间数据挖掘的应用趋势及发展预测

分析大数据下的空间数据挖掘现状笔者发现,就目前社会市场环境下的应用需要,空间数据的所有特征并未被人们完整地注意到,某些待开发领域特征的存在注定了空间数据挖掘技术的深入研发远景。比如,对于多来源的空间数据的预处理技术水平尚不能完全满足各行业、各类型组织的应用需求,对于空间数据的种类划分及对应技术方法的研讨仍在进行。

而今互联网的迅猛发展也为空间数据挖掘技术的前行助力,空间上必然存在的信息属性不确定性逼迫着空间数据挖掘者们持续进步。在分析空间数据挖掘思想的特征、目标、现状的基础上,笔者认为,空间数据挖掘今后的发展方向必然是各类型、领域、行业的专业化空间数据整合技术的研发,其目标在于协助人类更直观、多角度、完整地认知世界、环境及社会,帮助人们提升自身面对知识的有效提取能力。可以说,大数据时代下的空间数据挖掘技术的核心发展目标在于更好的服务于人类社会的发展。

4 结束语

虽然已有空间数据挖掘技术水平基本满足现有信息结构化处理需求,但随各领域研发进度的深入、多样化,已有的空间数据挖掘技术的不断强化、提升成为大数据时代下的空间数据挖掘技术的必然发展趋势。从技术及理论方法两方面,完成实践与理论的双向完善,成为各领域专家、研究人员今后的工作重点。

参考文献:

[1]蒋良孝.空间数据挖掘的回顾与展望[J].计算机工程与应用,2003(06).

[2]李德仁.论空间数据挖掘和知识发现[J].武汉大学学报,2011(06).

[3]段晓君.可视化数据挖掘技术及其应用[J].计算机应用,2000(01).

大数据和数据化思考 篇4

关键词:大数据时代,“四V”特征,税务数据

数据浪潮迎面而来,全世界每一分钟有超过六亿个电邮产生,你的每一次买卖交易、每一次就诊记录,都被巨大的数字网络记录下来,网络平台每秒包含数百万个事件。美国数据科学家维克托·迈尔·舍恩伯格专注于数据研究10年之后,提出“大数据(Big Data,BD)”的概念,认为大数据带来的信息风暴正在改变人们的生活、工作和思维,大数据带来了一次重大的时代转型。

1 我们已进入大数据时代

2014年热播美剧《纸牌屋》,是大数据运用的成功典范,美国总统奥巴马在第二季开播几小时前发Twitter呼吁:“明天《纸牌屋》回归,请大家不要剧透。”《纸牌屋》的制造商是Netflix,Netflix基于其3 000万北美用户观看视频时留下的行为数据汇入后台进行分析,由此在纸牌屋的拍摄、内容和发布方式上进行了一系列革新,果然取得了巨大的成功。在大数据时代里,谁能掌握好数据,谁就能提高洞察力,谁就能抢占先机和主动权。

通常把大数据的特征概括为“四V”。一是体量大(Volume Big)。全世界的数据量级可用海量、巨量乃至超量来描述,并且每日还在快速增长。二是多样化(Variable Type)。大数据的范畴非常广泛,网页、图片、视频、图像、声音与位置等信息都属于大数据的内容。三是快速化(Velocity Fast)。数据流往往需要快速、持续的实时处理。四是高价值和低密度(Value Highand LowDensity)。以视频安全监控为例,连续不断的监控视频中,有重大价值者可能仅为一两秒的数据流,从这一两秒的数据流,可能会挖掘出最有价值的图像信息。

2 国外先进的大数据应用借鉴

2.1 美国交通安全管理局的成功实践

美国被称为“车轮上的国家”。1966年,美国的人口数为1.96亿,有1.01亿注册驾驶员、0.94亿机动车辆,车祸死亡人数首次突破了5万,成为全美餐前饭后讨论的焦点话题。针对此现象,美国国会第一时间做出行动,在最短的时间内通过了《高速公路安全法》,要求联邦政府“立即建立一套有效的交通事故记录系统,以分析确定交通事故及伤亡的原因并采取相应措施”。交通安全管理局因此事件的触动成为美国联邦政府最早开始大规模收集、分析、应用数据的部门之一。通过对交通事故的全方位数据分析,有针对性地制定相应措施,自此,美国每年车祸死亡人数呈下降趋势,到2011年,虽然此时美国的人口和车辆的数量、密度相比1966年都成N倍增长,但交通事故死亡人数为32 310人,同比减少1.7%,创下了自1949年以来的最低水平。

2.2 澳大利亚税务局的大数据应用

澳大利亚税务局利用大数据,着力让税务机关更为精确地打击“不遵从”行为。2006年,澳大利亚税务局投资5000万澳元,建立大数据分析平台,着力于提升海量数据分析和评估技术,把握偷税趋势和特征,对纳税人进行分类管理,对不同纳税人制定了不同的风险监控指标,并采取多种措施予以重点监管,取得了非常好的成效。澳大利亚税务局还通过基于大数据平台的风险评估对个人所得税、退税构建了一套行之有效的审核指标,筛选出疑点退税申请人并进行重点审查,成效显著。

3 国内税务部门大数据实践及存在问题

在大数据时代,要想占领制高点,全面应用大数据是实现税收现代化的必由之路。全国各地很多税务局都积极行动起来,在大数据潮流中勇于实践和创新。

3.1 税务系统数据应用主要做法

有的省税务局建立了云计算平台和大数据平台,广泛采集工商、海关、银行等部门数据,大量收集互联网涉税交易数据,建立涉税企业数据分析及风险预警机制。对碎片化的信息进行分析和提炼,对一些漏税的情况进行查补,作为纳税评估的依据,效果非常好。有的省通过对税收数据的深入分析,了解纳税人的特征,对纳税人加以细分,针对各种不同特征群体纳税人提供个性化服务,提高纳税服务水平。还有的税务局以发票信息为主的同时,多方位收集涉税信息,分析我国经济发展的情况,分析区域经济体治理架构和经营模式,总结出企业生产经营的周期规律,充分体现了大数据应用的价值。

3.2 税务系统数据应用存在问题

税务系统应用大数据虽取得了一些成就,但仍然存在一些问题。主要表现在以下几个方面。一是数据应用协调机制较差。业务部门和技术部门之间交流和沟通不够,缺少一个相互制约的工作流程及相应的管理监督机制。二是数据质量仍存大量问题,数据共享范围较窄。综合征管系统是系统整合的核心系统,仍然存在大量数据录入不完整、不准确等问题,导致出口退税、防伪税控、车辆购置税、货运发票以及电子申报和税银系统数据不完整。其次,数据共享范围不够。使数据分析中许多与纳税人紧密相关的银行帐面信息、企业工商信息、海关信息、相关联企业信息以及各省之间企业信息仍无法实现共享,从而制约了数据应用与分析的准确性和有效性的提高。三是数据应用在整体范围上主动性、能动性和连贯性不够。在较多情况下,基于数据应用分析可以有效筛选出可能有问题的纳税人,但在后续的流程与制度规定上,包括现有的稽查选案在内的各种后续管理都难以有效利用数据分析结果来提高工作效率和水平,后续征管流程的脱节使得数据应用无法充分体现其价值。

4 大数据时代税务数据发展趋势的思考

4.1 大数据时代优化税收征管

大数据时代为优化税收征管奠定了坚实的数据基础。通过共享丰富的第三方社会信息,集成、整合现有信息系统,并运用大数据处理技术进行分析比对,实现税务人员随时随地分析纳税人申报、缴税的真实性和准确性。通过建立功能齐全、内容丰富、便捷高效的全流程无纸化网上办税平台,纳税人打破时间和空间的局限实现7*24小时便利办税。为完成上述目标,从数据角度考虑需重点做好以下工作。

(1)全面拓宽数据共享。全面拓宽数据共享范围(如实现工商、海关、银行、公安、国地税等信息共享,实现网络涉税信息共享),打造高品质的数据共享平台,从法治层面明确信息共享的职责分工、质量标准、工作流程和绩效评价,为获取丰富的第三方信息提供了有力的保障。

(2)提高数据质量。制定数据质量管理办法、考核办法和数据变更规范等制度,在税务系统组织进行基础数据的清理。建立数据质量问责机制,对新录入的数据出现问题的严格问责,逐级追究责任。利用信息技术,建立数据安全监控机制,一旦发现有违规操作,系统自动预警,及时查处,防范数据安全风险。理清数据与数据之间的逻辑关系,做到逻辑关系明确清晰,提升数据质量。

(3)借助高效的大数据分析工具。面对海量数据,单纯依靠人工无法处理。借助先进的信息化手段,实现涉税数据间的逻辑关联、智能比对、自动验证和实时预警,才能事半功倍,把复杂问题简单化。如利用Hadoop进行大数据分析,实现对组织收入、税源管理、风险管理等各方面工作的全面监控,并大幅度降低成本。

4.2 利用大数据挖掘技术应用数据

要充分挖掘大数据价值,必须要有一套行之有效的管理机制,包括科学合理的机构、岗责、工作制度和流程,按照渐近式的建设模式,建立和完善大数据应用平台,根据不断变革的业务需求,突出重点,分步实施,重点聚集以下工作。

(1)以优化纳税评估为基础。根据我国不同时期的经济发展情况、不同地区的产业结构和行业特点、纳税人的生产经营规模、财务核算情况等信息资料,借助大数据分析手段,根据不同税种和税源情况,制定出科学合理的纳税评估指标,建立和完善科学合理的纳税评估预警系统;按照建模、分析评估、实地调查、评定处理等程序,对纳税人申报缴税的真实性和准确性进行全面系统的评估,做到有的放矢,精准管理。

(2)以实现全过程执法监控为核心。基于大数据,通过建立税收征管和执法行为监控体系,实现税收征管全过程留痕,多方位监控税务部门的执法行为,做好事前、事中和事后监控三个环节,让权力在阳光下运行,从源头上防控廉政和执法风险。

(3)以提供决策支持为重点。通过数据挖掘技术对数据分类处理,分析不同地区的经济总量、宏观税负、行业税负、税收总量等指标,分析税收收入与经济发展的关系,科学判断税收收入增减的原因,从而发现税收管理和执法中的不足之处。通过构建各种经济发展模型、税收模型,在大数据分析和挖掘的基础上,实现科学估算收入规模和准确预测税收走势,为领导决策提供有力的科学依据。

(4)以提高纳税服务水平为根本。充分运用数据分析、数据共享和数据挖掘等手段,开展以提升纳税服务水平为主要目的关联性分析,以数据的方式了解纳税人涉税事项的发生频率以及涉税事项之间的关联程度,用数据说话,对纳税人进行分类管理,不断创新纳税服务手段,优化服务方式,拓宽服务内容,从而科学安排服务流程,提高服务水平,为纳税人提供特色服务,真正实现纳税人所盼,税务人所向,提升纳税服务的满意度和税收遵从度,降低纳税成本和税收流失率,实现数据兴税。

5 结语

大数据时代,是一个大规模生产、分享和应用数据的时代,数据在税收业务中的核心价值日渐体现,从信息管税到数据管税,如何从大数据中挖掘出税收征管的价值,税务部门任重道远,大有可为。

参考文献

[1]徐子沛.大数据:正在到来的数据革命[J].当代贵州,2012(31):64.

[2]陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012,36(17):14-15.

大数据和数据化思考 篇5

来源:《中国组织人事报》 作者:刘永 2013-09-25 15:19:

32随着信息技术的迅猛发展,数据正成为与物质资产和人力资源相提并论的重要生产要素。特别是近年来,“大数据”一词持续升温,其带来的信息风暴正逐步变革着我们的思维、工作和生活。作为基层人才工作者,应对大数据时代给人才工作带来的挑战与机遇成为当前必须面对和思考的课题。

靠“数据”指引提高引才实效。对于县(区)而言,人才工作的重点在企业。坚持企业为主体,突出高层次人才和高技能人才的引领带动,统筹推进各类人才队伍建设,要精准分析产业发展与人才需求,特别是要动态掌握全县哪些产业有哪些企业,哪些企业有哪些人才需求。同时,区域位置、行业隶属、产业基础、企业规划和人才需求也各不相同,传统的信息采集较为烦琐且不够准确。以往这些大都是靠粗略估算或走访调查获得,而进入大数据时代之后,通过数据搜集和联机分析,就能动态地形成点(企业)、线(产业链)、面(地区)的完整分析,再运用动态的数据报告,有针对性地编制人才招引的长远规划和阶段计划,组织各类招才引智活动,切实提高引才工作实效。

凭“数据”倒逼促进作用发挥。人才引进并非最终目的,人才引领社会经济发展才是题中之义。随着人才项目数量的增多,其项目绩效如何,既是社会各界关注拷问的热点,也是人才部门需要冷静思考的难点。人才作用发挥情况的衡量离不开绩效的评估,而绩效评估离不开数据的说明。人才主管部门可以根据人才项目实际,科学设置数据指标,如“人才项目总产值及人均产值”、“人才项目销售利税及人均销售利税”、“产业节点对产业链形成的贡献”、“专利申请及授权量”等,通过量化测评、专项审计、现场评审等多种形式,采取类比法、定性评价法、加分项等不同方法,以动态的绩效评估推进人才项目在经济社会发展中的作用发挥。

让“数据”促进服务环境优化。从粗放式管理向精细化管理转变,大数据理念在人才服务领域同样也可以发挥事半功倍的作用。当前,各地都普遍认识到人才服务的重要性,但准确把握把握人才需求,有针对性地优化服务环境的方法手段还不多。通过信息手段利用已有的数据,就可以很轻松地梳理出人才的内在需求。例如,现在许多地方推出了类似“市民卡”的“人才绿卡”,为人才在创业创新、就医保健、子女入学、研修培训、社会保障方面等提供便捷服务。如果通过计算机对人才使用这些公共服务的类别、次数、频率等数据的梳理分析,就可以很准确地找出人才最需要和最常用的服务有哪些,然后根据这些数据调整服务布局、改进服务举措,这样人才服务环境可以得到进一步优化。

大数据带来的信息安全思考 篇6

【关键词】大数据;信息安全;隐私保护;监管

随着信息技术的快速发展,网络上的数据出现了爆炸式增长。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。有研究表明,如今人类两天所创造出来的数据量,比人类文明开始到2003年所创造的信息量还多,且速度仍在加快,人类已经迈入大数据时代。大数据正成为有巨大价值的经济资产,并将带来全新的创业方向、商业模式和投资机会。但大数据的信息安全也存在巨大的隐患,被视为有巨大价值的数据应该如何保护和监管?

一、大数据的主要特点

(一)大数据的概念。大数据,是指所涉及的资料规模非常巨大,無法在合理时间内完成数据的采集、管理、处理,并整理成为企业和机构经营决策提供帮助的信息资源,是由数量巨大、结构复杂、类型众多数据构成的数据集合。物联网、移动互联网、车联网、手机、电脑以及遍布各个角落的各种各样的传感器,都是数据的来源。大数据是继云计算、物联网之后IT产业又一次颠覆性的技术变革。

(二)大数据与云计算。大数据的特色在于对海量数据的挖掘,它必须依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。通过云计算对大数据进行分析、预测,会使决策更为精准,释放出更多数据的隐藏价值。

(三)大数据的影响。麦肯锡公司最早在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。

大数据市场的快速发展,主要得益于非结构化数据和半结构化数据的爆炸式增长。伴随着智能移动设备的普及以及社交网络的兴起,及各种随身设备、物联网、云计算和云存储等技术的发展,使得更多终端和数据可以接入网络,人和物的所有轨迹都可以被记录。大数据对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响。

二、信息安全的隐忧

(一)大数据存在被窃取的风险。在国内信息化建设中,关键的软硬件大多使用国外的产品和技术,国外的产品可能存在“后门”等安全隐患,造成信息数据被窃取。我们存储在邮箱、云端甚至电脑终端里面的数据,通过网络都有可能泄露出去。重要数据一旦泄露,就会对企业或国家造成巨大的损失。

斯诺登事件让全世界知道了美国的“棱镜”计划,谷歌、微软、Facebook、雅虎等互联网巨头都向美国政府提供服务器后门,让美国国家安全局可以获得包括电子邮件、搜索记录、视频、语音通话、照片、文件传输、社交信息等海量数据。据《华盛顿邮报》2010年的研究表明,美国国家安全局每天拦截并存储的电子邮件、电话和其他通信记录多达17亿条。斯诺登同时披露,美国政府大量入侵中国的电脑并窃取情报。

(二)大数据对个人网络隐私保护的冲击。在信息时代,不仅个人身份数据广泛存在于政府、银行、医院、学校等众多组织的电脑网络中,同时,我们每天上网浏览、搜索、社交、购物等行为数据,都存储在网络公司的服务器中。亚马逊和淘宝记录着我们的个人注册信息与购物习惯,谷歌和百度记录着我们的网页浏览习惯,QQ和微信记录着我们的言论和社交关系网。每个人的活动其实无时不刻都被不同组织的数据库纪录和监视。尽管许多大数据的提供者尽力消除数据中的个体身份信息,但在大数据时代,把个人信息模糊化或匿名化处理,对隐私保护都没有效果,主要原因是由于实名制社区及电子商务应用的普及,用户的网络ID和真实身份产生了更多关联,同时我们能收集到的数据也越来越多,我们也可以结合很多不同来源的数据进行分析。谷歌和Facebook的理念是:人就是社会关系、网上互动和内容搜索的加和。无处不在的智能终端、随时在线的网络传输、互动频繁的社交网络,让以往只是网页浏览者的网民的面孔从模糊变得清晰。通过大数据分析可以从网上收集到一个人的最广泛的信息,任何上网痕迹都可以通过强大的运算能力得到分析比对,人们的真实身份、性格、消费习惯、需求等等个人信息都可以被还原。这些数据如果被别有用心地利用和整合,个人的隐私和尊严将不可避免地受到伤害。

(三)大数据容易成为网络攻击的目标。由于数据比较集中,信息量也比较大,大数据更容易成为网络攻击的显著目标。数据一旦失窃,造成的损失和影响都是很大的。大数据也可能成为高级病毒的载体,对于庞大的数据来讲,恶意软件隐藏在数据当中很难被发现。据国家互联网应急中心报告显示,2012年中国境内有1400多万台主机被境外木马或僵尸网络控制服务器所控制,还有50多个网站用户信息数据库在网上公开流通或私下售卖,其中被证实为真实信息的数据近5000万条。

三、思考与对策

(一)加强大数据法律法规建设。由政府部门对大数据的发展做好总体规划和引导,做好顶层设计,制定相应的大数据信息安全法律法规,明确各类大数据的保护等级和措施,制定完善的数据管理和安全制度,加强敏感和重点领域要害数据的监管,维护信息安全,把建设信息安全体系作为国家的战略。

(二)加强自主研发和创新。政府部门应设立专项资金,引导并推动科研机构和企业加强研究和技术创新,争取逐步掌握核心技术,避免过度依赖进口产品,以免造成信息安全隐患。加快面向大数据的信息安全技术的研究,培养专业人才,建立并完善大数据信息安全体系。国家投资建设的通信网络应尽量使用国内软硬件产品,以增强通信网络的自主可控性,进而保障国家、企业和个人的信息安全,为社会经济发展创造良好条件。

(三)加强数据保护意识。对企业和机构而言,应强化自身的软硬件安全建设,减少系统和软件漏洞,以更好的抵御网络安全风险,同时应加强数据保护意识,加强内部监管,规范大数据的使用和流程,以防止数据泄露。对个人而言,应该尽量避免在网络上留下个人身份信息,同时应避免在网络上使用一些敏感词汇,以加强自我保护。

参考文献

[1]维克托.迈尔-舍恩伯格,肯尼思.库克耶.大数据时代[M].浙江人民出版社.

大数据和数据化思考 篇7

春江水暖:统计推断

“竹外桃花三两枝,春江水暖鸭先知”出自北宋诗人苏轼著名的题画诗《惠崇春江晚景》,作者寥寥几句,勾勒出早春江景的优美画境。特别是“春江水暖鸭先知”,把水温冷暖描绘得富有情趣、美妙传神。由画中“桃花初放、江暖鸭嬉、芦芽短嫩”,推知画外“河豚欲上”的初春气息,我们除了从中欣赏画中有诗、诗中有画之外,还可以找到统计推断的影子。

统计推断是根据随机性的观测样本以及问题的条件和假定,对未知事物作出以概率形式表述的推断。概率论是统计推断的理论基础。统计推断问题常表述为:所研究的问题有一个确定的总体,其总体分布未知或部分未知,通过从该总体中抽取的随机观测样本作出与未知分布有关的某种结论。统计推断的基本问题可以分为两大类:一类是参数估计问题;另一类是假设检验问题。如上述题画诗通过随机抽取一个“鸭嬉”画面,测得“江暖”,进而推断早春真的来了。如果研究的问题是“早春是否来临”,就需要通过样本“鸭子是否入水嬉戏”检验这个命题是否成立,这也是一种推断形式,即假设检验。由于统计推断是由样本推断总体,因此根据样本对总体所作的推断,并不能做到完全精确和可靠,其结论要以概率的形式表达。也许作为样本的江水受光照的影响有冷暖之别,并非春来;或者嬉水的鸭子并不惧寒冷,也未可知。统计推断的目的,本来就是利用问题的基本假定及包含在观测数据中的信息,作出尽量精确和可靠的结论。

常用的抽样方法有:简单随机抽样、周期系统抽样、分层抽样和整群抽样。采取适当的抽样方法确保抽样的代表性,可有效地控制和提高统计推断的可靠性和正确性。比如此诗中除了“江暖鸭嬉”,还有“桃花初放”、“芦芽短嫩”等抽样结果共同来支持早春来临的结论。

在水一方:数据挖掘

“所谓伊人,在水一方”出自诗经秦风《蒹葭》,抒发主人公河畔倘佯,凝望对岸日夜思念的意中人之情,虽望穿秋水、可望难即,但其孜孜以求、执着追寻之意,颇有数据挖掘的意思。

数据挖掘(Data mining)又称资料探勘、数据采矿,是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的一种决策支持过程。主要基于人工智能、在线分析和处理、情报检索、机器学习、模式识别、专家系统、统计学、数据库、可视化技术等诸多理论和方法,高度自动化地分析相关数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整策略,减少风险,做出正确的决策。针对市场企业而言,数据挖掘是一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。数据挖掘是知识发现过程的三个阶段(数据准备、数据挖掘、结果表达和解释)之一,主要是通过与用户或知识库交互分析每个数据,从中寻找规律,其任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析,等等。

生活中有很多数据挖掘的例子。比如在传统市场营销中,街上派送的宣传单、手机上的广告短信、推销电话等,都只是基于人群或者简单的用户、住户信息推送的,盲目且浪费。数据挖掘则以市场细分原理为基础,假定“消费者过去的行为是其今后消费倾向的最好说明”。通过收集、加工和处理消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,并以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。又比如,当银行账户申请双人联合账户时,可通过联合账户的数据挖掘,分析推断该用户是抱得“伊人”归,还是仍然隔岸相望,来决定向用户定向推销用于房贷、教育投资等业务,还是转而推送婚庆商品和服务业务,或者推送特快专递鲜花、礼品等业务。

上善若水:大数据

“上善若水,水善利万物而不争。”语出《老子》,意为最高境界的善行就像水的品性一样,泽被万物而不争名利。水有滋养万物的德行,它使万物得其利,而不发生矛盾、冲突。海量的大数据,最终能不能成为这样一种水,值得期待。

1980年,未来学家阿尔文·托夫勒在《第三次浪潮》中,将大数据赞为“第三次浪潮的华彩乐章”。受技术所限,大数据时代并未随之到来。直到2009年前后,大数据才开始逐步受到信息技术行业的关注。在历经批判、质疑、讨论、炒作等种种之后,大数据终于迎来了2013年———媒体所称的大数据元年。大数据到底有多大?有资料预计,2013年世界上存储的数据能达到约1.2泽(12亿TB)字节,印刷成书可以覆盖整个美国52次,存于标准光盘则可以堆成五堆,每一堆都可以高达月球。专家预测到2020年,全球每年新创的数据容量将会达到40泽(400亿TB)字节,如果要用标准光盘储存互联网在一天里传送的数据,大约需要2.5亿张光盘。

大数据的原理在统计人的眼里并不复杂,从抽样调查的角度看,样本选取的越多,得到的统计结果就越接近真实的结果。从海量的、多样的、迅速更新的数据中实时“提纯”出有用信息,就是大数据的意义所在。越来越多的政府和企业,迅速涉足这些隐藏在数据汪洋中的大金矿。许多世界级的互联网企业、社交平台、电商,就连商场营销和影视制作都有大数据的身影。比如一举成名的美剧《纸牌屋》,就是源自美国视频网站Netflix对喜欢BBC剧、导演大卫·芬奇和演员凯文·史派西的用户数据中的交集数据分析,打造出的一部“大数据”剧集。

大数据和数据化思考 篇8

“大数据”一词, 最早是全球知名咨询公司麦肯锡提出来的, “数据, 已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。人们对于海量数据的挖掘和运用, 预示着新一波生产率增长和消费者盈利浪潮的到来。”, “在美国具备高度分析技能的人才 (大学及研究生院中学习统计和机器学习专业的学生) 供给量, 2008年为15万, 预计到2018年将翻一番, 达到30万。然而, 预计届时对这类人才的需求将超过供给, 达到44万~49万人的规模。这意味着将产生14万~19万的人才缺口。仅仅四五年前, 对于数据科学家的需求仅限于google、Amazon等互联网企业中, 在最近重视数据分析的企业, 无论是哪个行业, 都在积极招募数据科学家, 这也会令人手不足的状况雪上加霜。”__摘自麦肯锡2011年5月全球研究院的报告 (大数据:未来创新、竞争、生产力的指向标) [1]。

2 数据分析行业一则最新的人才招聘广告

我们从2014年11月15日51job.com网上发布了1643条数据分析人才招聘职位中选取其中一则数据分析人才招聘[2]:

广州迅蒙龙贸易有限公司, 招聘岗位:淘宝数据分析师

职位描述: (1) 负责淘宝、天猫、京东店铺销售数据统计; (2) 针对推广方案, 进行数据分析、挖掘, 为推广方案达到最佳效果提供数据支撑; (3) 负责数据监测, 数据分析, 数据挖掘, 撰写分析报告;结合实际业务需求, 进行深度的数据分析; (4) 建立客户、产品的分析模型, 提出产品、业务改善建议;用相关工具进行数据提取, 分析顾客及市场特征, 提供相应的运营建议, 增强用户的黏性; (5) 建立运营数据分析模型, 针对流量、用户行为等进行监控和统计, 提供流量、转化率、流失率等; (6) 为网店制定相关数据标准, 根据数据决定网店页面布局及宝贝关联, 改进进店导流关键流程, 提升付费转化率, 减少各环节的订单流失; (7) 以数据为依托制定精准营销流程规范, 对线上营销 (包括钻展、直通车、淘宝客) 进行数据分析和评估, 提供数据报表和改善建议, 提升营销效果; (8) 对竞争对手的产品及同类新产品进行定期数据监控, 并形成对产品改进的有效建议; (9) 定期进行数据分析报告撰写及数据汇报工作。

岗位要求: (1) 心理学、统计学、电子商务、数据挖掘、数学、市场营销、计算机等相关专业大专以上学历; (2) 能熟练操作Excel、Access、Powerpoint等办公软件, 运用SAS、SPSS或R等专业统计分析工具; (3) 熟悉数据库营销的推广手段, 有相关工作经验优先; (4) 优秀的数据分析能力和业务学习能力, 善于从海量数据中总结规律;敏锐的观察力, 及时根据数据发现问题; (5) 具备良好沟通协调能力、性格开朗, 做事认真踏实, 工作态度好, 应变能力强, 善于团队协作; (6) 熟悉淘宝相关的数据产品, 精通淘宝递阶转化率相关指标及提升方法。

3 大数据时代数据分析人才的素质要求

从上面的数据分析招聘可以看出, 大数据分析是数学、统计学、计算机科学 (机器学习) 等交叉学科, 目前国内最主要运用在银行、电信、证券基金公司、网站分析等, 核心是关注和研究客户, 网站分析是大数据分析的典型应用, 也是目前需求量最大的人才缺口。目前国内专业划分过于单一, 而网站分析是综合技能很强的岗位, 专业技能上这类人才必须要精通计算机的数据库技术, 用于提取、管理和分析数据;要熟悉一门脚本语言, 用于编写程序;要具有较好的数据建模能力, 精通统计知识和统计分析软件, 特别是适合大数据分析的R软件或SAS软件, 用于挖掘数据关系;要具备有营销知识和心理学知识, 能很好的分析和解释客户行为;要具备些基础的经济学知识。通识素质上要善于从海量数据中总结规律;敏锐的观察力, 及时根据数据发现问题;必须具备良好沟通协调能力、性格开朗, 做事认真踏实, 工作态度好, 应变能力强, 善于团队协作。

4 我校数据分析人才培养的思考及对策

我校是较早开展大数据分析人才培养的高校, 从2010年开始, 我校信息与计算科学专业正式开设了数据分析方向, 当时我们查阅了全国所有高校, 都没有数据分析本科专业, 只有中国人民大学统计学院的数据分析方向应用统计硕士。当时该方向计算机方面开设的必修课程有C语言、面向对象C++、数据结构、数据库系统、网络数据库, 数据仓库与数据挖掘等, 并且C++、数据结构、数据库均设置了课程设计, 以加强实践环节的训练, 数学方面开设的必修课程有数学分析、高等代数、解析几何、概率论与数理统计、常微分方程、运筹学、数学建模等, 还开设了计算智能专业选修, 并且数学建模开设了课程设计, 要求学生参加全国大学生数学建模竞赛, 以检验数学建模课设的实效;统计方面的必修课程主要有多元统计分分析、抽样技术、应用时间序列分析、非参数统计分析、应用随机过程、市场调研与预测、面板数据分析等, 学习的软件有SPSS、SAS、E-VIEWS、MATLAB、STATES等, 统计选修课有统计软件数据挖掘等;开设的经济学课程有微观经济学、宏观经济学、计量经济学、财务管理专业必选课, 还有金融学、投资学等专业选修课;开设的营销课程有市场营销、消费者行为学、网络营销等。

从今天的情况看, 我们数据分析方向的课程设置是科学合理的。当然随着大数据的飞速发展, 我们也有需要加以改进和调整的地方, 如应开设一个脚本语言课程, 如Python, 需要开设“网站分析”之类的非常实用的专业选修课, 需要加强R软件的学习等[3,4], 其次有些课程虽然开设了, 但实效大打折扣, 不少学生觉得学校学的实际中都用上, 学习积极性不高, 因此理论知识水平和实践操作水平都不如我们的初衷。

通过大量查阅大量新近的数据分析岗位要求, 我们提出如下对策:第一适当调整课程, 增加“Python”必选课, 增加“网站分析”等专业选修课;第二转变教师教学思想观念, 变教理论为教能力, 提高教师大数据分析实战水平, 加强与企业、公司合作, 积极开展大数据分析应用研究, 给学生提供丰富的实战实例和场所, 极大地提高学生学习热情和积极性, 只有学生由被动学习转到了主动学习, 理论学习自然会如饥似渴, 刻苦钻研;第三, 加强与我校计算机学院物联网专业之间的沟通与联系, 开展互联网、物联网大数据分析的基础研究, 互相促进, 共同发展, 广泛开展教师间、师生间大数据分析技术交流, 争取多出高水平的科研成果;第四, 积极开展对外交流和联系, 扩大我校大数据分析的知名度。

摘要:在认真分析了新近一则数据分析人才招聘信息的基础上, 提出了大数据分析时代数据分析人才的必须具备的素质要求, 结合我校信息与计算科学专业数据分析方向人才培养的实际情况, 提出了几点需要改进的意见, 并给出了对策。

关键词:大数据分析,数据分析师,人才培养

参考文献

[1]黄林, 王正林.数据挖掘与R实战[M].北京:电子工业出版社, 2014, 6.

[2]http:/www.51job.com.

[3]李明.R语言与网站分析[M].北京:机械工业出版社, 2014, 4.

“大数据时代”现代林业的思考 篇9

关键词:大数据时代,现代林业,智慧林业

1 林业生态化

生态红线是我国继“1.2亿hm2耕地红线”后, 另一条被提升到国家层面的“生命线”, 体现了党和国家加强自然生态系统保护的坚定意志和决心。我国虽然有庞统的生态系统资源, 但是其可视化程度低, 普通公民并不能对生态红线直观地感受, 随着我国经济社会快速发展, 破坏自然资源、侵占生态用地时有发生。“数字林业”产生的大量数据没有得到有效分析, “大数据时代”具有可视化分析的特点, 对于林权登记、一类、二类资源调查相关数据等大数据特点, 可以通过图、表, 甚至是检索简介就可知道此地块的地类、特点、性质等基本信息, 如同看图说话一样简单明了。

2 林业的产业化

大数据时代的到来, 让深居山区的农民了解了市场的需求, 使林业产业化为山区、农村提供更广阔的就业和致富空间。而拥有市场关键在产品竞争力。因此产品规范生产和技术要求至关重要, 这同时又激发一些从事林业生产的企业研究林农学科学、用科学的热情, 促进生产技能和整体素质不断提高。林业产业化以其特有的兼容性, 促进生产、加工、销售各环节的融合, 国家、集体、个体等各种经济成分的融合, 以及跨行业、跨地区的融合, 使各种资源在更大范围内, 按市场规律进行配置, 扩展林业及林业经济舞台和空间, 优化了经济结构, 深化和扩大资源利用, 有效地提高林业综合生产能力、林农收入水平和林业整体经济实力。

3 林业社会化

林业社会化服务体系仍不健全, 总体服务水平较低, 服务内容比较单一, 服务管理不够规范。特别是林业技术、信息、金融和保险服务缺乏, 不能适应现代林业生产发展的需要。所以建立新型林业社会化服务体系, 为农民据时代全方位的生产经营服务势在必行。通过大数据的联合, 把千家万户的分散生产经营变为千家万户相互联结, 共同行动的合作生产、联合经营, 实现小规模经营与大市场的有效对接, 大幅度降低市场风险和自然风险, 政府职能部门合理设置基层林业公共服务机构, 建立新型林业合作经济体系, 对林农的生产提供相应的指导。利用大数据平台的共享性, 使农户能及时掌握各种信息, 促进林业向现代化方向发展提供的产前、产中和产后服务的总和, 其建设包括林业专业合作组织、科技推广体系、融资体系和风险管理体系的构建。

4 林业旅游化

大自然的美是生态给予我们的回报, 这也践行了可持续发展为理念, 以保护生态环境为前提, 以统筹人与自然和谐为准则, 并依托良好的自然生态环境和独特的人文生态系统, 采取生态友好方式, 开展的生态体验、生态教育、生态认知并获得身心愉悦的旅游方式。“大数据时代”的到来, 打破了传统旅游行业的格式化和框架。通过相关平台的融合, 为一些小众群体的生态林业旅游提供便利。如桃花盛开的季节, 相约去赏花;葡萄成熟的日子相约去采摘, 炎热的夏季相约去林中避暑等, 从周边的农家乐到私人定制的路线, 总能在千千万万的人群中找到大数据的一线牵。大自然的鬼斧神工使各地生态旅游都独具特色, 这也就为林业旅游的多样性提供便利, 为林业发展旅游化成为一种新的经济增长点。

5 林业的科技化

为加快林业科技化进程, 应实施科技兴林人才战略。大数据时代下智慧林业建设, 全面应用云计算、物联网、移动互联等新一代信息技术, 使林业实现智慧感知、智慧管理、智慧服务。建立和完善林业科技培训网络信息流量大、交换速度快的优势, 根据季节农时做好经常性的信息收集发布工作, 通过多种形式, 为社会提供及时准确权威的信息服务, 建立和完善林业科技培训制度和培训网络, 大规模开展科技培训, 要紧紧围绕林业重点工程建设, 加强林业新技术推广培训和继续教育, 加快知识更新, 全面提升林业工作者的业务水平和工作能力。

大数据给教育带来的思考 篇10

1 国内外教育领域大数据的应用

进入二十一世纪, 大数据分析应用到美国公共教育中, 成为教学改革的重要力量。美国的一些企业已成功地商业化运作教育中的大数据, 全球最大的信息技术与业务解决方案公司IBM与亚拉巴马州的莫白儿县公共学区进行大数据合作。结果显示, 大数据对学校工作具有重要作用。IBM与这一学区合作时, 除了学生成绩不好之外, 该县还面临着辍学率已增加到48%的严峻情况。为了应对这一巨大的挑战, 该县在学生数据的基础上建立了一个辍学指示工具, 借助IBM的技术支持重新建立大数据, 进而利用大数据分析来改善学区内所有学生的整体成绩。如今美国学校能够以85%的精确度预测学生的升学率, 从而把注意力集中在辍学风险比较大的学生身上。①从国外大数据运用教育的实践看:数据挖掘是提高教学管理质量与水平的一种工具;在国内, 数据挖掘在教育领域尚未引起普遍关注, 对大数据新类型技术趋势带来的机遇与挑战、对未来教育的变革的认识有待提高, 高校教学管理领域围绕大数据展开的研究讨论作为前沿课题已开始起步, 国内软件开发商也将此提到了主要议题。

2 大数据使教育步入实证时代

我国传统模式教育大量信息的获取和传播方式是相对单一和简单的, 在学习效率和资源利用上存在一定的浪费与相对不足的矛盾, 信息的真实性有待进一步挖潜;在教学效果上不能满足不同层次的学生需求, 教学的差异化、个性化和多样性等方面大打折扣。大数据时代的来临, 为传统教育转型带来了新的契机与挑战。当今国内有关教育变革多集中在在线教育上, 例如分析找出教学过程中的问题, 如何培养学生的自主学习能力, 建立终身学习的理念等简单变革的在线教育。大数据的到来改变了教育理念和教育思维方式, 使教育将不再是靠理念和经验来传承的社会科学, 它将变成一门实实在在的基于数据的实证科学。②未来3~5年社会竞争将以服务和创新为核心, 大数据给教育提供了另外一种可能, 不单是从学校教学的顶层设计, 涵盖课堂、课程、师生互动等的各个环节、各个方面;而且教育专业人士也能够将自己的教学核心技能运用到教育数据集和其他数据集中, 至关重要的是, 大数据使得教育者的理念和思维方式发生了深刻变化, 能够让大数据变小, 变得更结构化。

3 大数据使教育成为数据支撑的行为科学

(1) 课题主干是顶层设计和超前理念。在向大数据时代跨越过程中, 视频成为主要载体、教育资源极其丰富、翻转课堂、按需学习、终身学习等等这些必将成为主流模式。教育环境的设计、教育实验场景的布置、教育时空的变化、学习场景的变革、教育管理数据的采集和决策, 这些过去靠拍脑袋或者理念灵感加经验的东西, 在云、物联网、大数据的背景下, 变成一种数据支撑的行为科学。③

(2) 教育中的数据挖掘是迈向大数据分析的基础。教育数据挖掘是一个将来自各种教育系统的原始数据转化为有用信息的过程, 这些有用信息可为教师、学生、家长、教育研究人士以及教育软件系统开发人员所利用。目前教育对信息数据的挖掘主要集中在四个方面:一是针对教育系统恰当运用数据挖掘技术为优化教育规划和管理、提高教育教学质量、改进教育软件设计与开发提供有益帮助所做的数据分析;二是针对教学教务管理教育机构在教育教学过程中适时应用数据挖掘所做的技术支持;三是针对教育未来研究人士基于各种专业数据库, 借助数据挖掘方法, 更全面、快速、准确地了解某一教育研究领域的现状, 预测未来发展方向的分析;四是针对教育教学过程、管理过程及研究过程中相关信息的采集和存储科研单位所做的有价值的数据分析。

4 大数据在教育领域的发展趋势

大数据时代对教育者从更深层次中获得与使用真实数据和完整数据能力提出了新的挑战, 同时也为教育者获得更为深刻、全面的洞察能力提供了广阔的空间, 从而实现教育理念和教育思维方式的创新。

(1) 教育理念和教育思维的创新。我国传统的教育大多是教育主管部门和教育工作者通过教学经验的学习、总结、积累和继承展开的, 这是相对单一和简单的。大数据时代的教育必将革新教育理念和教育思维方式, 它使所挖掘的教育数据在广度、深度和细分度上不断延伸, 也更加符合学生实际与教学实际的教育, 从而制定出符合实际的教育教学策略。大数据是教育未来的根基, 没有数据的留存和深度挖掘, 教育信息化只能流于形式。④

(2) 实现个性化教育。大数据带来的一个革新是实施个性化教育具有了可能, 真正实现从群体教育的方式转向个体教育。运用大数据技术, 我们可以时时记载每一个学生个体即时性的行为与现象。通过对这些数据的技术整合、分析评估教学过程中学生个体在不同期间的学习状态、表现和水平;也给教育者提供最为真实、最为个性化的学生个体数据信息, 教育者在教学过程中通过数据分析可以因材施教, 从而提高学生个体, 乃至学生整体的学习水平。

毋庸置疑, 以大数据时代为标志, 我国经济已然迈进了以知识为中心的时代, 迎接大数据需要形成“大数据思维”, 大数据不仅是应用性工具, 而且是重要的思维方法。从这个角度看, 重视大数据, 也是一次思维方式的变革。教育者应从对大数据的认识中, 掌握工作方向与目标, 探索工作规律, 大数据必将改变我们的教育理念和思维方式。

摘要:在当今信息时代, 云技术、物联网和基于二者的大数据技术正推动教育发生变革, 大数据时代的教育, 将成为一门实实在在的实证科学, 它使所挖掘的教育数据在广度、深度和细分度上不断延伸, 从而革新教育理念和思维方式, 使教育成为另一种可能。

关键词:教育,大数据,数据挖掘,数据应用

注释

11 祝智庭, 沈德梅.基于大数据的教育技术研究新范式.电化教育研究, 2013.10:5-13.

22 《上海教育》编辑部.大数据带教育步入“实证时代”.上海教育, 2013.17:1-5.

33 胡德维.大数据“革命”教育.光明日报, 2013-10-19.

大数据和数据化思考 篇11

关键词:大数据;电子档案工作;思考;商榷

《档案管理》2013年第6期刊发了张淑芳同志撰写的《浅议“大数据”时代下的电子档案建设趋势》一文(以下简称“张文”)。作者从相关概念的界定、电子档案建设的政策依据、电子档案建设的保障措施三个方面,多层次阐述了“大数据”时代下电子档案建设的趋势,文章在给予我们许多新知识、新观念、新理论、新观点的同时,也有一些值得讨论和商榷的地方。这里提出来与张淑芳同志商榷,如有不妥之处请张淑芳同志及广大档案界同仁给予指正。

1  电子档案建设的提法有待商榷

张文在题目中使用了“电子档案建设”这样一个词组,个人以为这种用法不妥。一是“电子档案建设”没有一个明确的含义,在知网中运用句子检索“电子档案建设”+“是指”,或“电子档案建设”+“指”, 再或“电子档案建设”+“是”进行检索,没有检索到相关句子。这就是说,在现有文献中没有对“电子档案建设”进行明确的界定或定义。二是从词典上查阅,“建设”一词的意思是指:“创立新事业;增加新设施;充实新精神。”[1]电子档案组合在一起应该是创立、增加或者充实一种新的档案之义,但从张文中的表述看,“电子档案是指通过计算机磁盘等设备进行存储,与纸质档案相对应、相互关联的通用电子图像文件集合”。[2]是“以电子影像技术为支撑,将纸质档案转化为电子信息”或者是“把应用系统的电子信息进行凭证化处理后”的产物。是档案的另一种载体方式。简单理解即:“电子档案”是“转化”或“处理”而来的,不是创立、增加、充实得来的。三正是因为这个词组意思不明,用法欠妥,所以在文献中采用这种用法的也很少,百不及一。据笔者在中国知网文献数据库中检索,在篇名中涉及“电子档案”的2695篇文献中只有14篇使用“电子档案建设”,约占0.5%;在主题中涉及“电子档案”的10294篇文献中只有39篇使用“电子档案建设”, 约占0.38%; 在全文中涉及“电子档案”的60864篇文献中只有468篇使用“电子档案建设”,约占0.76%。据此,个人以为在标题中使用“电子档案工作”较为妥当。

2  电子档案概念存在矛盾

关于电子档案的概念,我国的档案学者给出的定义不尽相同。这里我们不讨论张文中关于“电子档案”的概念与其他学者所下定义的差别,主要讨论张文中有关“电子档案”概念表述存在的一些矛盾之处。关于“电子档案”,张文中是这样表述的:“电子档案是指通过计算机磁盘等设备进行存储,与纸质档案相对应、相互关联的通用电子图像文件集合。在大数据背景下,电子档案是具备数量巨大、结构复杂、类型众多特征的数据集合。”[3]这一表述前后及与其文中其他部分关于电子档案的表述存在一些矛盾之处。

其一:张文电子档案概念第一句中强调了三点:一是“通过计算机磁盘等设备进行存储”,二是“与纸质档案相对应、相互关联”,三是“通用电子图像文件集合”。而在后一句中则没有了“与纸质档案相对应、相互关联”,“通用电子图像文件集合”也变成了“类型众多特征的数据集合”。从范围上看,前一句中“电子档案”所指的是与纸质档案相对应、相互关联的电子图像文件,而后一句中则指的几乎是所有电子数据。从类型上看,前一句中“电子档案”所指的是电子图像文件,而后一句中则指的几乎是所有类型的电子数据。前后表述意思不一。

其二,张文对电子档案的建设目标的表述是:“一言概之,就是实现纸质档案的电子化管理和电子信息的档案化管理。”[4]从这一表述中,我们可以将“电子档案”理解为“纸质档案的电子化”和“电子信息的档案化”的产物。而这在电子档案概念的表述中只看到了“纸质档案的电子化”部分,没有看到“电子信息的档案化”的部分。

作者在论文中给其讨论或论述的主体下定义,对其讨论或论述的问题进行界定是正常的,也是必要的。但这种定义或界定,在一篇论文中前后要保持其内涵与外延相一致。否则就应当给予说明,以避免读者在阅读时产生误解或异议。

3  电子档案工作环境的功能的部分设计缺乏现实可行性

张文中对电子档案环境的功能设计做了比较详尽的阐述,认为:“理想中的电子档案环境应是为各类档案提供统一的形成、积累、捕获、迁移、鉴定、管理、归档、查询、加载、展现、应用的平台。”应当说这是一个不错的、理想化的方案。在现实中缺乏可行性。

首先,以“统一电子档案入口”为例。要实现“能够以影像技术、条形码技术、版式电子数据文件等技术为支撑,实现对不同介质、不同类别的档案进行标准化封装处理,转化为统一的入口文件,并保证电子档案的真实性、完整性、有效性和可追溯性”。[5]而这就意味着要对一个单位中所有业务应用系统进行改造或增加相应的功能模块。就一般单位而言,除了系统内的办公自动化(OA)系统外,还有诸如专门的财务管理系统、人事管理系统、招生系统,课程管理系统、教学管理系统、科研管理系统、后勤管理系统、图书馆管理系统,以及销售管理系统、仓贮管理系统、安防系统等众多系统。以高校为例,一个普通高校使用的系统就多达十几二十个,这些系统有国家教育行政管理部门统一配发的,有省级教育行政管理部门统一配发的,也有国家及地方财政主管机关下发使用的,有的则是住在地党委政府要求使用的,有些是单位自行开发的,还有的是从市场上购买的商品化软件。这些系统出自不同的主管部门,由不同开发单位开发,使用不同的开发和运行平台,不同的后台数据库,有着不同的数据结构。这种情况下,在系统使用后要求这么多不同层次、不同隶属、不同平台、不同运行环境、不同数据库及数据结构的加上一个统一的电子档案入口,不仅经费支出远超一般单位的承受能力,就是与这么众多开发单位进行需求上的专业沟通与协调就不是单位档案管理人员所能承担得起的。“统一电子档案入口”的设想,如果没有国家层面的顶层设计,指望每个基层单位的档案工作者的努力,很难实现。

其次,张文认为:电子档案系统应提供对档案流程的自定义。“使用产品化的流程管理工具,实现流程的可维护性。流程管理工具应满足自定义需求。当电子档案流程变化时,档案员能够自行通过平台增加、删除或修改流程。并能够根据业务需要,为每个环节设置分配不同的业务角色,采取可靠的安全防护技术,满足各类业务档案管理流程不同的需要。”[6]这里我们暂且不考虑电子档案管理系统是否能够与一个单位的全部业务系统实现全兼容与互操作,仅允许“档案员能够自行通过平台增加、删除或修改流程。并能够根据业务需要,为每个环节设置分配不同的业务角色”,就是给予了档案员超级系统管理员的权限,而目前档案员的信息技术素养就很难挑得起这个担子,负起这个责任。

最后,张文提出:“统一的电子档案管理平台搭建好后,并在其上加载常规档案管理业务(如,以卷为单位的文书档案和以件为单位的文书档案管理模块),实现所有的操作人员能够在同一个平台上,对不同类别的档案进行管理。该平台应支持多类别档案的业务加载,档案员根据新增工作需求,能够使用平台提供的工具,自行实现其他门类电子档案(如,专题档案、业务档案)的添加及修改,能将非通用文件格式的图像电子文件转换成通用格式,或将相关软件一并收集,并注明其软硬件环境和相关数据。”[7]这有两点疑问:一是这里的“所有的操作人员”是指单位所有档案管理人员,还是所有使用生成电子档案的业务系统的工作人员?如果是指单位所有档案管理人员,那就意味着要求档案管理人员熟悉并熟练使用单位的全部业务系统;如果是指所有使用生成电子档案的业务系统的工作人员,那就意味着所有业务人员都必须熟悉档案管理流程,并可以进入档案管理系统对电子档案进行添加及修改。现实情况是,前一种情况难以实现,后一种情况不能允许。二是“将相关软件一并收集,并注明其软硬件环境和相关数据”。这是一种理想化的状态,现实中难以实现。因为现在许多业务系统只给使用单位提供一个客户端,根本不给你提供整个系统,你也就无法对系统一并收集。退一步讲,就算系统提供者向你提交了系统副本,档案工作者如何对归档的系统进行甄别、测试、保管和提供备份安装服务,都是些短期内不易解决的棘手难题。

4  加大档案信息化的资金投入并非电子档案建设的有效保障措施

张文中将加大档案信息化的资金投入列为电子档案建设的保障措施之一。强调:“按照国家档案局、河南省信息化工作领导小组要求,各级档案部门应积极向财政部门反映,要求落实有关资金扶持政策,加大信息化资金投入。按照信息化目标考核要求,出台政策,强力推进,为档案信息化顺利推进创造条件。”[8]不可否认,巧妇难为无米之炊,没有资金保障,要实现档案信息化是办不到的。但绝不是有了资金保障就一定能实现档案信息化。档案信息化并不只是有几台计算机,装几套软件,录一些数据,扫几张图片那样简单。档案信息化要的是思维方式的转变。在这方面,我们应当向企业学习。因为,“企业和市场像猎豹一样永远拥有敏锐的嗅觉,当企业和市场进入到对‘大数据的实施和行动阶段后,处理非结构化数据库工具的先进性、方便性得到了越来越多的认可。档案信息化也应从中吸取经验,接受‘大数据工具处理非结构化数据库的技术和理念,从海量档案信息中筛选、整合、获取关键信息满足用户需求”。[9]而其中的核心就是转变思维方式,学会运用信息化思维、技术性思维和商业化思维。

参考文献:

[1] 建设.百度百科. http://www.baidu.com/s?wd=%E5%BB%BA%E8%AE%BE&ie=utf-8

[2][3][4][5][6][7][8]张淑芳. 浅议“大数据”时代下的电子档案建设趋势[J]. 档案管理,2013(6):54~55.

[9]滕水生,周甜甜,许熠莹. 将商业化运作思维引入《产品设计》课程教学实践的改革探讨[J]. 设计,2012,(10)168~169.

大数据和数据化思考 篇12

越来越多的企业认识到数据分析能够带给企业业务的价值。中桥的多选项调查结果显示 (图1) , 企业认为大数据分析能够带来的主要业务价值依次是:提高生产过程的资源利用率, 降低生产成本;根据商业分析提高商业智能的准确率, 降低传统“凭感觉”做决策的业务风险;动态价格优化利润和增长;获取优质客户。这表明大数据已经对企业的成本、业务决策、利润有着直接的影响。中桥的另外一组调研数据显示, 目前越来越多的企业级用户考虑从批量分析 (大数据创造价值的第一阶段) 向近实时分析 (第二阶段) 发展, 从而提高IT创造价值的能力。同时, 数据分析在快速从商业智能向用户智能发展。中国市场正逐步从大数据降低成本向大数据加速业务增长、提高利润以及突破创新发展。

中桥调查显示, 目前中国用户主要是通过数据分析来提高整个企业的运营效率, 降低运营成本。从图2对数据类型的调查结果来看, 目前, 中国企业的数据分析还是以结构化数据为主, 如数据库或事务性数据。此外办公文件、计算机/网络日志文件、文本/信息等也是企业数据增长的主要来源, 同时也是能够攫取出价值的数据类型。

而就导致大数据问题的数据来源调查显示 (图3) , 毫无疑问, 数据库首当其冲, 是企业大数据的主要来源;而半结构化和非结构化数据如软件和网络日志、感应数据、社群等也已经纳入企业数据分析的主要范畴, 这表明企业已经意识到这些数据对于业务的重要性, 这也是实现从 (大) 数据分析第一阶段到大数据分析第二阶段的必要条件。也成为未来24个月用户通过IT创造价值的IT投资重点。

中国市场大数据分析方法

在了解了企业大数据的来源和种类之后, 如何采取有效方式对这些数据进行分析, 从而最大程度攫取数据价值, 转化为最明智的商业决策以利于企业业务运营, 是企业对大数据进行分析的目的所在。从目前中国大数据分析的分析方法来看 (图4) , 有33.8%的企业选择针对具体工作负载来调整通用数据库;22.0%的受访企业选择数据分析云计算服务 (如软件即服务和/或基础设施即服务) ;还有20.7%的企业选择自定义开发的解决方案。仅4.8%的用户使用了并行处理 (MPP) 分析数据库, 3.3%使用了对称处理 (SMP) 分析数据库。这一结果表明, 大多数的中国企业仍处于数据分析的第一阶段。而且, 目前中国用户大多采用通用数据库、云计算或自定义开发的解决方案和数据库工具作为大数据分析方法, 而没有选择去购买数据分析的软件。

上一篇:有效改进下一篇:主动安全与被动安全