统计局统计大数据(精选8篇)
统计局统计大数据 篇1
市统计局大数据中心2018年工作要点
根据省局大数据中心2018年信息化工作安排及南充市、县、乡三级目前统计信息化建设现状及存在的短板及问题,结合市局统计工作改革与发展对信息化提出的支撑与保障要求,2018年大数据中心工作要点如下:
一、亮特点工作
(一)全力推进和做好统计大数据中心建设
不断深化优化新建大数据中心机房建设、网络系统、安全系统、应用系统的建设技术方案,做实做细各项准备,以便机房技术用房确定后,能在尽量短的时间内高效推进统计大数据中心的建设,并同步做好机房、高清视频会议暨综合管理展示大屏的建设、升级工作和局内现有机房各信息化系统的调试集成工作。
(二)建立基本完备的信息网络安全体系
在大数据中心的建设过程中,优化网络结构,通过部署防火墙、行为管理、堡垒机、数据库审计、日志审计等安全设备,建立起较全面的安全技术防护设施。通过采取多种措施,确保市县两级VRV安全客户端注册率每月均达100%,提升杀毒软件安装率,进一步完善安全管理有关制度。按《网络安全法》的要求,在新的大数据中心各项信息系统建设完成后,聘请有资质的专业测评公司对信息系统进行安全检测及提出完善整改报告,通过等级保护测评。圆满完成省局及市政府及有关部门对我局的各类安全检查,确保全年不出任何安全事故,建成省内市州领先的基本完备的信息网络安全体系。
二、重点工作
(一)做好三农普、四经普有关数据处理工作 按省局有关工作时间安排,在国家审定农普数据反馈后,及时做好三农普市、县两级资料开发的数据处理系统搭建和汇总出表工作。做好四经普数据处理设备准备(PDA设备的管理、新设备的采购)、数据处理方案制定、处理环境的搭建、应用系统的技术培训、数据处理期间的技术保障等各类数据处理工作。
(二)继续推进县(区)、乡(镇)信息化基础建设 在2017年推进县、乡信息化标准化建设取得明显成效的基础上,针对各地还未达标和还存在的薄弱环节部分,按省中心有关工作要求,继续推进基层信息化基础建设。利用统计深改的形势背景,努力争取形成规范扎实的基层信息化管理体制,在机构设立、人员配备、网络建设(专网向社区延伸、市县专网增设备用网络线路)、环境设施(专用机房、二代防火墙、UPS电源等)、安全体系建设等方面持续推进,为后续统计改革发展对基层信息化工作提出的全新要求打下良好基础。并通过按月通报有关工作进展来促进各县区间互相借鉴学习经验和发现弥补自身短板,争取在信息化基层基础工作中追齐地市一流水平。
(三)清理信息化资产账目
细致清理局内现有实际使用中的信息化资产,通过与财务信息化固定资产账目的比对,及时配合局办公室审核报废已过期没再使用的信息化资产,避免信息化财务账目臃杂混乱,与实际在用资产不一致而形成的管理紊乱。
(四)进一步规范软件正版化工作
在局采购了大批正版化软件的基础上,今年在局内各计算机上全面安装部署正版软件,并加强管理,规范流程及手续,做好每台电脑软件维护安装等的工作记录,完善各类制度及资料,圆满通过各级对正版化工作的考核检查。
三、常规性工作
(一)做好网站管理维护工作。做好日常网站服务器的软硬件维护管理和监控工作,及时做好网站后台的信息审签,每月处理修改网站内发现的无效链接及错别字,按实际工作需求做好网站版面的修改完善。
(二)做好一套表平台的管理维护。每月计算生成一套表直报率情况表、一址多报企业数量情况表、内网代报表等资料并送有关科室。做好对平台账户的赋权和账户管理工作,做好对平台的技术支持保障工作。
(三)和广电对接,争取将市县网络各区县的接入带宽和市局汇聚带宽进一步提升。
(四)做好对中心机房路由器、交换机、服务器、VPN网关、磁盘阵列、视频会议MCU、UPS电源系统、空调运行、网络及各安全设备的运维监控和故障处理。
(五)完成信息化年报表的部署、收集、审核和上报工作。
(六)做好对局内各科室、局、队、办软硬件的维护管理。
(七)做好对视频会议系统、VRV安全管理系统、金山网络版杀毒系统等的运行维护管理。
(八)做好对全市SSL VPN 账户的维护管理。
统计局统计大数据 篇2
近年来,随着英国维克托·迈尔-舍恩伯格的《大数据时代》和美国Bill Franks的《驾驭大数据》等著作的出版,大数据引起了社会的广泛关注,人们已经意识到大数据时代正在呼啸而至。大数据几乎对每个领域都会产生影响,所以限于不同领域各自的特点,对大数据的表述也不同,但是一个广泛的观点是:“大数据是一个数据集合,这个数据集合是无法在规定时间里用常规软件工具对它进行搜集、整理和分析的。”
2 大数据时代对统计数据的挑战
大数据时代需要既讲机遇也讲挑战。各个应用领域的不断变化使得统计学成为一门难以成熟的学科。所以在数据分析的世界里,统计学发展的终身动力是不断提高驾驭数据的能力。大数据是推断数据,不是原始数据,所以会存在抽样偏倚、随机的和非随机的误差。数据包括原始数据和推断的数据。数据的认知范围有限,所以数据可解释的范围就有限。模型是对数据信息的汇总,由于数据信息有限,所以模型可解释的程度也有限。超出模型可解释的程度,就是对模型进行一系列的假设。大数据方法研究需要多学科的联合,统计学家需要关注实时决策和计算机资源,计算机学家需要了解算法和统计推断的复杂性。
3 大数据时代对统计数据质量的影响
3.1 大数据时代对数据时效性的影响
库克耶和舍恩伯格认为:大数据不用抽样调查的方法,而用所有数据的方法。数据科学家甚至提出“样本=总体”,这或许意味着统计工作重心要转移。舍恩伯格和库克耶认为抽样调查有很多自身的不足:一是样本的随机性很难实现;二是不适合考察有子类别的情况;三是采样忽略了细节的考察,而大数据分析则可以弥补抽样调查的这些不足之处。如果说之前统计工作的重点在于数据搜集和整理,那么大数据时代统计工作的重心就是如何搜集整理分析有用的信息。这样一来,已经得出的数据结论可能不具有这个时代的特点,即失去了时效性。
3.2 大数据时代对数据真实性的影响
大数据时代除了对数据的时效性有影响之外,对数据的真实性也有影响。由此,当通过网络搜集数据时,首先需要考虑的是,数据是否是由自动化算法系统产生?如果是,究竟有多少?以淘宝网为例,大量的虚假评论已经影响了信息的真实。
4 大数据时代统计工作的应对之策
大多数的研究指出,当前统计方面存在的问题在于业务部门没有利用好大数据导致数据资源缺乏;企业内部信息孤岛导致数据的有效信息无法充分利用;工作人员数据分析能力差导致大数据时代下统计工作很难进行。
4.1 国家应对之策
在大数据时代下,要保障统计数据质量,国家应当做到以下几点:
(1)尽快改革当前统计管理体制的制约,保证统计独立调查、独立报告、独立监督的职权不受侵犯。在大数据时代,统计体制改革要与时俱进,尽快建立符合我国国情的统计管理体制。
(2)充分发挥党委政府的主导作用,赋予各其统计数据质量的主体责任。要发挥各级地方党委政府对本区域统计数据质量的主体责任,将统计数据质量的好坏作为考核一个地区领导业绩的主要方面之一。
(3)尽快建立引导一个提速增效的统计考核评价指标体系,完善党政领导的绩效考评机制。
4.2 企业应对之策
企业应做到以下几点:信息以数据形式呈现,强化建设数据标准;融合结构化和非结构化数据;推广应用大数据,促进使用信息资源;重视数据的安全管理。
4.3 个人应对之策
统计学家必须积极学习新事物,适应大数据环境,拓展统计学的应用领域,创造出新的统计方法。大数据时代带给我们的挑战与机遇并存。
参考文献
[1]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2).
[2]郑京平,王众全.官方统计应如何面对Big Data挑战[J].统计研究,2012(12).
[3][英]维克托·迈尔-舍恩伯格.大数据时代——生活工作与思维的大变革[M].周涛,译.杭州:浙江人民出版社,2013.
[4]Brian Hopkins,Boris Evelson.Expand Your Digital Horizon with Bigdata[N/OL].www.asterdata.com,2011-09-30.
[5]邱东.大数据时代对统计学的挑战[J].统计研究,2014(1).
[6]耿直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1).
面对大数据,政府统计何为 篇3
面对大数据,政府统计需要大思维
面对大数据,政府统计需要开阔的思维方式、准确的职能定位、明确的工作宗旨。需要有超前的思想意识、缜密的逻辑思维。笔者认为大思维包括三个方面:一是主体思维,二是管理思维,三是服务思维。
主体思维。《统计法》明确规定,国家建立集中统一的统计体系,实行统一领导、分级负责的统计管理体制。国家统计局负责组织领导和协调全国的统计工作。互联网也好,大数据也好,它们都是现代信息技术条件下快速处理海量数据的手段。互联网公司、电子商务公司替代不了政府发布统计信息,不具备权威性。因此,大数据环境下,政府统计仍然是主体,政府统计不能缺位,更不能失位。只有顺势而为,才能有所作为。无论在任何情况下,政府统计的主体地位不能动摇。
管理思维。面对大数据,政府统计必须加快改革发展步伐,树立“大统计”理念,由“从事统计”向“管理统计”转变,充分发挥政府统计的管理职能,加强对源头统计、部门统计和民间统计的统一指导和规范化管理工作,努力建立“统筹设计、规范运行、监督有效、信息共享、合作开发、互惠双赢”的政府统计管理工作新格局。
服务思维。2013年全国统计工作会议首次提出了建设服务型统计的要求。笔者认为政府统计的服务应该是全方位的、主动式自觉服务,由“要我服务”向“我要服务”转变。用统计理念引导服务对象,用统计方法指导服务对象,用统计标准规范服务对象,把“售后服务”变为“买前指导”,让政府统计工作成为事前“埋管”布局,而不是事后“挖坑”添乱,体现出贴心服务的诚意,实现双赢的目标。
面对大数据,政府统计需要大设计
我们经常说到顶层设计,笔者认为政府统计的顶层设计应该是整体的、全方位的、全流程的大设计,包括源头数据采集设计、部门统计设计和政府统计设计三个环节。
源头数据采集设计是基础。目前,国家实施的企业一套表联网直报工作迈出了由分散设计向统一设计、传统报送向智能化采集的第一步。但这也仅仅是第一步,还有大量的“三下”单位、部门以及针对住户和个人的调查内容还没有纳入到一套表中。笔者认为对调查对象内部统计活动的设计都应该纳入政府统计的设计管理之中,它是大数据环境下,政府统计采集源头数据、利用行业管理信息和行政记录的原始节点,是统计部门的基础性工作。
部门统计设计是关键。《统计法》赋予了国家统计局对部门统计调查项目的管理权、部门标准的审批权。但在现实工作中,国家统计局履行上述职权还存在一定困难。笔者认为最根本的原因是没有将部门统计设计工作纳入到政府统计设计管理之中。在大数据环境下,如果能够从浩瀚的大数据洪流中整理出政府统计所需的信息,不再需要相关填报单位互相报送,把这些记录所获得的信息有序纳入政府统计设计管理之中,通过统计专业的标准化设计,通过标准的“统计语言”便可以实现部门统计与政府统计“无障碍交流”,部门统计也就真正成为源头数据与政府统计的链接点。
政府统计设计是灵魂。统计设计是统计工作的起点,统计设计质量直接关系到政府统计工作的整体效率。其构思应该是全方位、立体式、纵横交错的复式设计。政府统计设计应该跳出统计本身,站在适应经济社会发展需要并与国际接轨的高度去定位。这项工作应由国家统计局领导下的包括统计用户、基层单位、调查对象、高校和科研院所在内的各方专业技术人员共同研究完成,提高政府统计设计的统一性,增强可操作性。
面对大数据,政府统计需要大平台
面对大数据,笔者认为政府统计应该建立两个平台。
建立数据管理平台,理顺统计调查流程。在大数据环境下,政府统计机构必须搭建好数据管理平台,这个平台包括“一库”、“一表”、“一平台”。它的管理模式是:在“一平台”上,按照“一库”管理好“一表”。目前国家进行的“四大工程”已经运行“一库”(基本单位名录库)和“一表”(一套表)。从运行情况看,缺少的是一个科学合理的数据管理平台,影响了对基本单位名录库的质量维护和对一套表单位现场的有效管理。笔者认为组建以社区为模块的统计数据采集平台势在必行。目前,我国行政区划中最基本的单位是社区(村委会),它具有范围适中、相对固定的特点,作为名录库维护的一级平台非常适合,从而有利于形成现有体制下统一完整、真实准确、更新及时的国家法定调查单位库和抽样框。社区统计这一新的统计组织方式若能在政府统计改革中成功运行,将有助于在大数据环境下,对海量数据实施分块管理,理顺统计调查流程。
建立数据分析研究平台,发展统计生产力。开发、利用好国家的统计资源,仅靠政府统计自身的力量是难以做到的。建议建立数据分析研究平台,敞开统计的大门,让更多的部门、大专院校、科研机构的专家学者和科研人员参与统计数据的分析研究工作,达到统计“领唱”、部门“齐唱”的效果,一起奏响现代统计的“大合唱”。让更多的人掌握统计数据的“生产工艺”和统计产品的生产流程,进而了解统计、认识统计、研究统计,增加统计工作的透明度,提高政府统计公信力,让统计科研成果迅速转化为统计生产力。
面对大数据,政府统计需要大监督
随着统计报表报送方式的改变,再像过去挨家挨户的统计执法检查方式已经落后。联网直报方式为规模执法、系统统一执法提供了公开透明的操作平台。在这个平台上,通过对数据的系统比对,可以批量地发现很多共性和个性问题,有些问题的存在是合理的,有些问题的存在是不合理甚至是违法的。这是大数据环境下,政府监控统计数据质量最直接、最有效的监督手段,是技术和制度上的大监督。建议省、市专业执法人员通过政府统计数据处理平台把发现的问题直接反馈给国家统计局执法监察室,再由国家指派地方相关部门进行现场取证,对于确实存在的问题按照法定程序依法进行查处,同时把存在的漏洞反馈给设计部门,真正实现统计执法检查的规范化、制度化、专业化,实现政府统计的大监督。
大数据正在改变着人们的工作生活乃至思维方式。作为统计人,我们尤应正视大数据给政府统计工作已经带来和将要带来的各种影响,抓住机遇,迎接挑战,不断完善政府统计工作的方式和方法,充分开发政府统计资源,加速发展统计生产力,实现政府统计的大突破。
编辑:单之卉 / 邮箱:szh@bjstats.gov.cn
大数据对统计学的挑战和机遇论文 篇4
大数据给统计学提供了机遇、挑战和紧迫感。本文阐述着大数据的环境利用大数据的目的和大数据带来的整个变革;介绍着有关大数据的研究动向;探讨着大数据包含的信息,大数据的准备处理、抽样和分析方法。
当今社会,一方面人们在每个的获取数据。各个科学领域都在大量的获取数据。自然科学领域收集着从宏观的天文数据到微观的基因数据。从经济、金融和人文社会科学收集着大量的数据。
一些人们在不断地制造和收集着数据,相信着这些数据也许会对人有用。当然,也有人们不再继续呆在实验室里考核着研究,仅仅依靠着强大的网络数据来进行研究。而人们也在很被动着积累着数据。
随着互联网这样的大时代到来,各种方法也涌现出来。各式各样的数据如滔滔江水连绵不绝的涌现出来。现如今数据这样的大体系也在悄悄进行着变化。统计学又面临着新的机遇和挑战,这当然需要在方法论上有所突破和改变。
一、大数据及其目的
大数据是一个大样本和高维变量的数据集合。针对这样的问题,用于统计学上来说就是采用抽样减少样本量,最后达到需要的精度。关于这样的问题,急需要变量选择、降维、压缩、分解。广义的说,大数据涵盖了许多种领域,像多源、混合的数据,自然科学、人文社会、经济学、网络、通讯、商业和娱乐各样的领域。这其中大数据涉及了各种数据类型,包括文本和语言、录像和图像、时空网络与图形。
大数据的目的就是将数据转化为知识,探索着数据将会产生的机制。并且大数据有着记录保存自然和社会现状的作用。现在的人收集着许多大量的数据。虽然还不是那样的了解。但是依然相信需要保存现在这个社会经济发展的整个过程,满心期待在今后的岁月长河中不断地分析和解释着。
大数据将形成自然和人文社会的历史长河,不仅用于当今时代的研究。甚至对于转基因食品对子孙后代的影响来继续深究问题,为未来的人留下先今的`历史材料。
二、大数据的处理、抽样与分析
(一)数据的预处理。大数据的预处理包含数据清洗、不完全数据填补、数据纠偏和矫正。统计机构的数据是经过严格的抽样设计所得到的[1]。有着代表性和系统误差小的优势。互联网的数据速度更快、量大、项目繁琐,但是难以避免一些这样的问题。将统计机构的数据作为标准来对互联网进行校正。从而将互联网数据作为补充资源对统计机构的数据进行随时随地的更新。这或许是解决问题的一个思路。
(二)大数据环境的抽样。大数据的抽样方法有待研究。不管锅有多大。只要可以充分的均匀搅拌。知道其中的滋味就可以了。针对大数据流环境,需要探索从源源不断的数据流中抽取可以满足统计目的和精度的样本[2]。需要研究新的抽样方法。可以有适应性、序贯性以及动态的抽样方法。
尽力数据流的缓冲区,记录着数据所发生的一切变化。利用其他各种抽样技术。比如滚雪球这样的方法,从种子开始逐步扩大着样本。从各种随机种子出发。不断加入新鲜的种子,了解当代网络性质和结构。
(三)大数据的分析和整合。针对大数据的高维问题,需要研究降维和分解的方法。探讨压缩大数据的方法,直接对压缩的数据进行传输、运算和操作。除了常规的统计分析方法,包括高维矩阵、降维方法、变量选择之外,需要研究大数据的实时分析、数据流算法。
(四)数据不需要保存,只是需要扫描一遍数据的数据流算法。只是考虑计算机内存和外存的数据传送问题。分布数据和并行计算的方法。
针对多种不同数据库的环境,利用关系数据库技术,根据关键字将很多小数据库连接成一个大数据。并且,在这些大的数据库中还可以分解出许多的小数据库。组合出不同的东西,更可以做出许多有创意的东西。
在大数据环境,很多的数据集不再有标识个体的关键字,传统的关键数据库连接方法不再适用。探索不必经过整合多数据库,直接利用局部数据进行推断结果传播的方法。利用统计性质信息损失地分解和压缩大数据。
(四)网络图模型。网络图模型用图的结构描述高维变量之间的相互关系,包括贝叶斯网络、无向图概率模型、因果网络等。网络模型是处理和分析高维大数据和多源数据库的有效工具。目前已经有丰富的图模型的软件系统。网络图模型可以用于分解大数据集合,处理多源数据库,来进行计算。它还可以引入隐变量简化复杂的关联联系。最终确定并能区分该目标节点的原因与结果。
结论:一个新生事物的出现会导致传统观念和技术的革命。数码照相机的出现导致传统相片胶卷和影像业的己近消亡。模型不再重要,当年统计学最得意的回归预测方法将被淘汰。大数据的到来将对传统的统计方法进行考验。统计学会不会像科学哲学那样,只佩戴着历史的光环,而不再主导和引领人们分析和利用大数据资源。大数据充满了许多的随机性。现在看到的大数据也给统计学带来了机遇。
统计局统计大数据 篇5
摘要:大数据时代的到来不言而喻,统计学又是一门和数据分不开的学科,在当前形势下统计学如何发展,本文就此,从大数据的基本概况,统计学的学科介绍,二者如何相结合这三个方面出发,对统计学未来的发展前景进行了分析。
关键词:大数据;统计学;前景
一、引言
在现如今的社会,无论是干什么都离不开信息。小到穿衣吃饭,大到国防军事,每一样都需要信息才能完成。信息是一个名词,围绕着它有信息的产生、信息的处理加工、信息的传递、信息技术的发展等等的一系列环节。所以在现代社会信息就如同一个核心细胞,其他细胞的工作都是围绕它展开进行的。我们对信息一定要敏感而精准。
二、何为大数据时代
大数据最初是由麦肯锡公司所提出来的,它在物理、生物、化学、金融、通讯行业出现并存在已经有一段时日,但它真正为人们所熟知认识却是因为互联网行业的飞速发展。人们总是用它来表述现时代是一个信息爆炸、海量、共享的时代。现如今一个决策的出台不再是凭借昔日的经验和感觉,而是数据的收集、整理、处理、分析所得出的结论。这就表示了一个新的时代,也就是信息数据时代的到来,经济、商业、金融、贸易等多个领域,信息已经成为主宰。这就是大数据时代,也是信息的年代。
三、统计学专业基本概况
统计学,从名称来看貌似是一个新兴专业,其实不然,它是一门非常古老的学科。它最早始于希腊雅典的亚里士多德时代,距今已有两千多年的历史。统计学是通过对数据信息的搜索、整理、分析、描述,以达到窥测所测对象的本质的目的,它是预测对象未来性的一门综合性科学。运用到了大量的数学和其他学科的专业知识,它的使用范围几乎涵盖了社会科学和自然科学的各个领域。统计学家王见定的研究已经说明了数理统计学永远打不败社会统计学,所以在以后的发展道路上,将是社会统计学与数理统计学共存与互补共同前行的模式。
目前作为高校所开设的`一门学科,统计学专业主要有一般统计、经济统计两类专业方向,它所培养的是具有良好的数学、经济学素养,熟练掌握统计学的基本理论和方法,熟练地运用计算机分析数据,在企业、事业单位、经济管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的专业型精英类人才。
四、如何很好发展大数据时代下的统计学专业
首先从上文的论述中我们可以得出以下结论:統计学的技术手段是,搜索、整理、分析、描述数据,它的目的是预测、推断检测对象的本质,它是一门综合性非常强的科学性学科。从它的使用广度上来看,它几乎覆盖了社会科学和自然科学的各个领域。所以统计学的“势力”非常大。
而统计学所依赖的基础则是数据,传统的统计学中数据的收集主要包括实验数据、调查数据以及各种途径收集到的第二次数据。但是在经过一段时期的实践后人们发现这种方法得到的数据经常会存在一定范围内的误差,这对样本的客观性是一个根本上的影响,同时样本选取结果产生影响,因此传统的数据收集方法很难适应统计学的飞速发展的需要。从这个层面上来说,大数据的出现是科学发展到一定阶段的必然结果。因此大数据的产生和统计学的发展有着密不可分的关系。从另一面来看大数据的出现也是统计学中的核心环节实现,也就是数据的采集实现了大幅度的跨越。大数据时代的到来意味着检测对象的任何数据都能应用到统计过程中,打破了数据采集处理的局限性,再加上精准、合理的统计处理方法,使得统计结果将更具有代表性和说服力。
同时大数据、统计学、云计算技术三者的强强联合,预计未来的统计学势必会发生革命性的变革。大数据将对未来产生深刻影响,目前可以预见的统计学未来发展的前景有以下两个关键的点:第一点是在数据中科学性将和数据本身形成联盟。数据科学独立门户成为一门专门的学科势不可挡,数据的重要性不言而喻。统计学也将乘浪前行迎来新的发展的奇迹。对于数据平台,也将实现跨领域共享,最终将数据的共享扩展到企业层面,成为未来产业的一员。第二点则是数据的管理处理的竞争力大大增强,数据管理成为企业竞争力中的核心竞争力,直接关乎财务表现。数据资产是一个企业的核心资产,这个理念会逐步深入人心。之后,企业对于数据管理便有了更加精准的定位,企业就会将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关。届时,统计学的相关知识将会有大作为,每一位统计学专业的学生的就业前景将是不可估量的。统计学的发展前景也是一片大好,大数据、云计算、统计学三者则是珠联璧合,我国乃至全世界的信息技术又会迎来新的浪潮,并且是一浪高过一浪,让我们拭目以待。
五、结束语
本文就大数据,统计学二者的定义、概念首先做了介绍。其次是对统计学和大数据包括云计算在内的联合后的优势,以及未来的发展前景做了合理的分析与预测。数据时代已经扬帆起航,我们每一个人万万不可落后,我们要追赶信息技术的时代潮流,乘风破浪,迎难而上。为我国信息技术的发展增砖添瓦,为实现自我的价值奋斗不息。
参考文献:
[1] 薛艳.大数据时代统计学专业教学体系的改革[J].教育教学论坛,(4):110-111.
[2] 周茂袁.大数据时代统计学专业教学改革的初步探索[J].教育教学论坛,2015(35):105-106.
[3] 李政,赵彦云.适应大数据时代的美国统计学大学教育(下)[J].中国统计,2015(4):24-25.
统计局数据自查报告 篇6
实行网上直报以来,其优越性逐渐突显出来,减少了中间环节人为的干扰,我县“三上”企业统计机构基本健全,统计人员大部分由财务人员兼任,直报过程中,能够及时、准确地按照要求和企业的实际情况上报,没有发现有意提供不真实资料的行为,自实行一套表制度以来,除接轨过程中客观存在的问题以外,报表运行相对稳定,但也存在有一些问题:
一、基础建设方面:
有的企业或部门存在领导对统计工作不够重视,数据报出比较草率,审核不严,部门统计工作缺乏规范,觉得统计可有可无,数据真实与否无关紧要,所以导致基层统计基础建设薄弱,比如,硬件设备的配置,统计台帐和统计档案的建立、统计人员素质的培养及统计方法的运用等等都受到了限制,不能严格按要求和制度来完成,此外,基层统计人员少,流动性大,业务素质参差不齐,工作负担重,业务经费紧张,这些情况制约着统计工作的有效开展。阻碍了全县统计一套表的顺利实施。
二、数据质量方面:
在具体的报表过程中存在以下问题:1、在年报上报过程中,有些指标项需调整,在网上直报过程中,有的项能进行顺利调整但有的项则不能运行,导致个别数据有一定差异。2、劳资报表中工资总额和职工人数分别填累计数和本季数,企业填报的时候,很容易填错,导致数据质量问题。3、在生产月报上报的过程中,企业财务是在上报时间之后才能结算出来,也就是企业本期的产品销售单价是在上报时间之后才能计算出来,导致一些相关数据(现价产值、销售产值)只能以上月、上季或者上年的平均数计算或者预估,与本期数据有差别。另外,网上直报的时候,遇到节假日,上报时间可能会有顺延情况,但县区上报市局的时间不顺延,必须是月后2日以前,也导致企业有些数据会出现预估情况。
针对以上自查过程中出现的问题,我局将从以下几方面整改:
1、健全制度,包括学习和监管制度,加强统计继续教育,扩大教育范围,转变基层企业领导和统计人员的观念,首先保证统计人员的稳定性;其次要让基层统计人员学习有关统计法律法规知识和相关的专业知识,鼓励其参加全国的统计技术职称考试,从而提高基层统计人员的业务素质。
2、完善统计台帐,搞好统计分析工作。统计数据要做到“数出有据”,真实反映本企业的情况,必须依据统计法律法规和统计报表制度建立健全原始记录、统计台账,并利用统计方法和统计数据做好企业的统计分析工作,提高数据的利用率。
3、推进基层统计工作的信息化、网络化。随着企业一套表的进一步推开,要求基层统计工作要逐步实现无纸化,我局将从硬件和软件上积极配合,尽快实现并轨。
官方统计与大数据对比分析 篇7
一、两种数据的基本含义对比
官方统计, 即政府统计, 包括统计工作、统计资料、统计科学三个方面的内容, 其核心就是利用统计技术和工具获取统计数字, 加工成有价值的统计数据资料或者信息。统计工作者依照《统计法》所从事的统计日常事务, 即对国民经济行业20个门类98个大类开展统计调查、数字采集、加工、资料汇总、分析、资料和方法制度研究, 并在实践中围绕统计工作不断总结形成理论, 如统计学、统计实务、统计计量、预测、模型等不断完善的科学理论体系, 来指导统计实践不断服务经济社会发展。
对于“大数据” (Big Data) , 研究机构Gartner给出这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别上看, “大数据”指的是无法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。这一定义揭示“大数据”是客观世界发展过程的存在, 把社会上现存的或正在发展的, 庞杂无序又似分类和规范化的数据现象笼统的、模糊性的以虚拟语言概括为大数据, 目前还没有形成系统性理论体系。它的发展是建立在社会化数据集合基础上, 各个行业或者系统被普遍的应用和推进, 并逐步形成系统的知识和理论。
二、数据表现形式与特点对比
当前官方统计数据与大数据在实践操作中的表现形式与特点存在差异 (见表1) 。
三、应用及价值对比
(一) 官方统计数据应用及价值
1. 官方数据的常规应用。
(1) 对历史的宏观经济社会运行状况的数量或价值量反映 (数据信息量化公布) ;
(2) 采用常规的统计技术、工具和方法对统计数据进行分析研究, 并根据需要进行前瞻性统计预测。
2. 官方数据的应用深度。
(1) 为党和政府各级领导机构决策和宏观调控提供统计数据资料;
(2) 为社会公众了解情况, 参与社会经济活动提供统计数据资料;
(3) 为科学研究提供统计数据资料;
(4) 为国际交往提供统计数据资料。
(二) 大数据的应用及价值
大数据本身并没有什么价值, 基于大数据的处理和分析才能为企业带来巨大的商业附加值。面对激烈的市场竞争, 越来越多的企业逐渐意识到数据已经成为新的生产资料。如支撑业务战略决策、提高顾客服务水平、促进销售获得客户、开发创新研究、强化财会业务、产品质量监测、企业管理等, 拥有数据并正确使用和挖掘数据将会成为企业成功的核心竞争力, 大数据如何转化为财富将成为大数据时代一个持久的研究课题, 成为一种基本上与资本、劳动力同样重要的经济投入。大数据正成为企业的新型资产, 形成竞争力的重要基础。
“大数据”的企业价值体现在以下几方面:数据的高透明度及易取性, 企业竞争战略与方式的影响, 信息的实时应用及平台监测, 推进企业管理变革, 规划企业经营模型, 改革企业人才发展计划。
四、数据的挖掘途径对比
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中人们事先不知道但又有潜在价值的信息和知识的过程。其过程主要有采集、甄别、描述性分析或预测性分析。官方统计数据与大数据的处理方式基本相同, 具体如下:
从数据采集→数据预处理→数据存储→数据分析/挖掘→结果展现
统计数据分析是对单一数据集、结构化数据进行预处理分析、集中式分析, 以实证性分析为主。而大数据分析更多的是为非结构化数据、迭代增长的数据集进行实时或流处理、分布式分析, 以探索性分析为主。
五、官方统计与大数据技术对比
(一) 数据采集技术
随着IT技术日趋发展与提升, IT技术成为人们推进生产、提升生活质量的重要手段。当前, 官方所采用终端数据采集手段 (结构化和半结构化制式录入报表报送模式) 将逐渐比社会化客户或者单位数据集合终端网络工程技术所淡化, 同时数据不以统计定式报表制度来反映, 而是以繁杂的混合式结构状态存在和使用, 并实时公布和变化。
(二) 数据处理技术
当前, 官方统计的单机终端和计算中心功能将远远不能满足非结构化等数据处理, 特别是针对不同领域、不同行业、不同企业、不同层次社会活动等带来更多的、不精确的、庞杂的全体数据。仅是相关关系的数据集合, 在价值密度较低, 且要求处理速度快的筛选、加工技术高的大数据处理中, 当前官方统计显得微不足道, 如:云计算、并行数据挖掘技术、数据挖掘集成技术、物联网等会逐步得到普及和应用, 这必将迫使官方统计技术变革。但这种数据模式, 直接影响官方数据描述状态。
(三) 数据容量与积累
现有的IT技术不能满足如摩尔定律式的数据增长, 同时大数据存储必将随之以等量级的扩展能力不断的增容和改进, 并以全新的如智能化闪存技术等来解决持续吞吐能力以及数据延迟性 (高速缓存) 问题。在解决大数据存储容量同时, 还要处理好历史数据存储、技术衔接与应用。官方数据的定式存储性与大数据这种能力存在一定差距。
(四) 数据安全性问题
繁杂的大数据以其不可思议的速度和强度在网络中运动, 数据各种结构层出不穷, 各种数据安全标准和保密性要求层次不同, 在高度透明且平等的网络手段运行中, 统计数据采集、处理以及公布的程式命令, 受到致命的挑战, 安全识别与隐私、保密性的兼容和设防控制技术, 超越了目前官方《统计法》规定相关界定。安全与隐私、保密与网络的透明是当前和今后面临数据处理重大命题。
(五) 数据成本与灵敏度问题
无论是官方统计还是大数据使用者, 在日趋发展的IT业中掌握信息、获取洞察、挖掘决策等需要对等的技术平台支持, 不管是采用Hadoop系统、流计算、数据仓库和信息整合与治理等都需要与之相适应的的硬件和软件成本投入, 有投入才有数据资本的产出。同时, 在技术的选择中, 还要剔除数据重复、破损、漏洞、衍生码等, 这就要求技术的兼容性与灵敏度要更高, 无论是数据迁移、替换、衔接、集合划分、计算识别等, 都有其操作的具体性与灵敏性问题。这同样增加了数据的产出成本。官方统计与其相比承载度欠缺。
六、官方统计与大数据行为对比
政府部门可以从传感器、卫星、社交媒体、移动通信、电子邮件、无线射频识别设备和企业应用程序等持续不断地接收数据, 并设法管理数据。因此, 政府面临的挑战是:捕集、摄取、分析、存储、分配和数据安全, 并将其转化为有意义、有价值的信息。官方统计作为数据收集、加工、发布的权威部门, 受大数据公布形式、速度、形态以及受众深度 (社会效果) 和广度 (覆盖范围) 等影响较大。从目前看:
(一) 数据工作流程
官方统计是从报表设计—报表布置—报表受理—数值采集—数值加工—录入汇总—审核 (复核) —上报 (或报批) —公布 (或分析) (即从政府需求—客户供给—政府运用—宏观管理—服务客户) 。大数据将产生于行业、产业或者某一专业领域的每一客户 (或企业) 等繁杂多样的数据集合, 只需采用必要的技术分类或者技术移转等手段, 满足行业、产业、企业等所需要的数据资料, 从顾客需求—客户供给—客户挖掘—客户提升。这个流程给官方统计改革具有重大参考价值。同时, 使统计调查 (普查、专项调查、抽样调查等) 方式和数据采集途径发生质的根本变化, 调查的设计将建立在大数据技术和后台软件支撑的基础上, 通过逻辑清洗、技术验证、层次归类等提炼统计数据和数据价值的分享 (数据扬弃与拿来) 。特别是推进第一产业统计调查和农村住户调查方式的变革, 催生住户记账、市场交易等技术改革。
(二) 基础工作管理
依据《统计法》可知, 官方统计基础工作是统计报表综合管理部门和填报单位, 为满足统计调查、加工整理、分析和数据质量评估需要建立的原始记录、台账、资料管理与公布, 以及所从事此项工作的机构、人力、物力、财力、法律法规执行等正常保障, 且统计基础管理所需投入和基本保障成本随着业务量的增加在不断快速扩大。大数据则借助数据共享机制和数据源集聚平台或大数据处理技术对行业或者领域等数据加以管理与挖掘、分析, 提出再造数据价值, 推进数据源企业或行业持续发展。这一目的和官方统计的最终目的具有同一性, 同样具有将数据转化为无形资本, 转化成市场自发调解产业分布方向, 转成企业搏击市场的竞争利器, 也是淘汰落后企业的残酷手段。大数据服务功能和目的与官方统计数据具有高度融合性和一致性, 但在管理模式和途径上, 具有完全不同的风格和模式, 这也是官方统计可以利用和融合的平台。
(三) 数据管理平台
“如果无法测量, 那么你就无法管理”。官方统计管理平台是在政府行为下建立的从PC终端逐级加工录入网络报送系统构成的, 结构式和半结构为主的计算中心交互平台。即使国家统计局建立的超级联网直报系统, 也回避不了企业层级审核。这种模式是企业只报不反馈。信息是不对称报送系统, 并不是完全的数据管理应用平台, 企业本身没有直接享受到报送数据所馈赠的数据信息、反馈回报或者提出企业改进或推动企业发展的数据价值效应。大数据平台建设, 却以市场机制为先导, 弥补了官方统计的缺陷, 带给企业数据价值的直接分享。
(四) 数据采集设计
当前, 统计数据来源主要是依据《统计法》和统计行业分类标准, 按照既定设计好的统计报表, 逐级定期报送或者周期普查或者根据需要开展专项调查所得, 是一种较为规范的数值采集方式, 有明确的报送性质、目的、指标内容、填报方法、计算方法、逻辑关系、时间点界定等, 严格按照统计报表制度规范填报数值, 但不涵盖填报对象所有的数据, 只是与统计需求相关的数值。大数据除在数据管理中提到企业或者产业活动单位自主行为外, 更多的是数据源的繁杂性、快速性、关联性、隐性、安全性、技术性等, 大数据相对统计数值更加全面和非结构化, 而统计数值最终要走向半结构和非结构化来阐明和体现统计结果与成效。大数据这种来源与归属具有发散性和统一性, “把技术带给数据, 不是把数据送给技术”, 这种方式针对性强、灵活性和效益性更好, 也是官方统计值得借鉴和分享融合的平台。
(五) 数据价值描述
行业市场的大数据价值密度值是最高的, 经过浅度处理便可以产生巨大的价值。而官方统计采集的是标准式数值, 是一个规定模式下的经济社会价值量的描述, 隐形体现或者折射经济社会发展成果进程状况, 反映的是一个历史性的某时期的较为宏观层面上的生产生活发展状况。成果主要以结构化和半结构化形态出现, 结果的视觉感、感悟性、灵敏度、受众深度等较为欠缺。从这一层次看, 官方统计挖掘技术的延伸必将走向大数据技术应用化。
(六) 数据处理业务
按照现有的统计方法制度, 统计数据的处理是以结构式报表形式, 按照国家统计局设计的指标体系和方法制度, 通过PC机处理系统, 分行业分专业和统一口径, 进行分级汇总加工上报评估认定, 并依法公布和展示的主要处理方式来开展统计业务。在大数据环境下, 由于微观数据的细分和共享, 数据的供给、需求以及存在方式发生了根本性变化, 社会提供共享数据成为数据处理公司生存法则, 大量有价值的数据资源在IT技术的支撑下, 得到社会和政府的认可和应用。现有的数据资源和存储方式可以成为统计业务分享和采集的途径, 催生统计采集渠道和处理流程与数据转换发生关键技术性变革。共享利用、处理清洗、筛选加工、转化成统计数据资源成为当前和今后官方统计数据处理方向。
七、官方统计直面大数据
在现实生产生活过程中数据量急速膨胀, 新信息要么是未曾扑捉或未曾有过, 如何及时有效地捕捉有真知灼见的新价值信息, 对庞大的网络和现实数据进行科学管理、分享和转化、建模挖掘等从中提取新的深刻见解, 为当前和今后官方统计介入和分享大数据, 推进统计技术革命提供了难得的机遇和动力。当前, 官方统计面临的任务和工作挑战日益加剧, 可利用的数据激增, 历史与现实数据和技术应接不暇难以应对, 官方统计面临的问题包括:如何收集、加工、管理控制和利用所有瞬息万变的大量新数据?如何提高行业间既独立又综合关联的信息集合?如何通过详实掌握数据来源, 并回溯至经过验证的可信数据源以提高数据质量, 分享挖掘成果?哪些现有和未来先进的可视化技术、工具和格式可用于表达信息, 从而实现快速分析, 并提出新的深刻见解?这些都是官方统计应该面对和正视的现实困境, 将决定和改变官方统计业务和整个数据生态系统中收集、分析、管理、存储及分配数据的方式。目前, 如物联网、淘宝网、支付宝、手机移动平台、数据终端采集等先进的IT技术工具正在不断创新发展, 与人们息息相关的银行借贷卡、医保卡、公交一卡通、购电卡、购气卡、税务联网报税、远程教育等数据在技术的支撑下得到有效发挥和应用。纷繁复杂的生产生活中数据与技术、技术与数据构成的大数据现象令人吃惊, 同时令数据管理者振奋与困惑。驾驭大数据, 在官方统计和全球经济中创造价值, 其影响广泛而深远。这为我国官方统计借助和利用大数据技术平台, 创新中国模式的统计运作方法, 加快统计改革与创新, 不断提高数据统领和管理能力提供参考和依据, 让数据真正成为政府的参谋助手。
八、对中国统计改革的思考
(一) 建立融合大数据的统计运行平台
大数据统计建设是一项有序的、动态的、可持续发展的系统工程, 必须建立良好的运行机制, 以促进建设过程中各个环节的正规有序, 实现统合, 搞好顶层设计。
1. 建立适应和拓展的大数据关键技术平台。
以数据存储、云计算、并行数据挖掘技术、隐私保护技术、数据挖掘集成、数据仓库等为基本技术设施, 建立适合官方统计与大数据衔接的数据技术支撑体系, 整合大数据技术转化成官方统计技术。无论是自主研发、共同开发还是借助现有的技术设备改进, 还是充分利用社会技术, 采取技术租赁、技术嫁接、技术联姻等方式, 积极推进中国统计制度重溯和方法再造, 吸纳和利用社会数据资源和技术, 建立依法可信的官方统计社会资源认定体系, 实现通过技术清洗和筛选后的社会数据为统计所用和服务, 以达到官商共赢, 使大数据转化为有价值的统计数据资料。积极推进大数据服务官方统计、官方统计数据与大数据相互转化与分享技术平台建设, 建设具有中国先进技术模式的大数据与官方统计共同发展技术平台。同时, 建立高度透明的大数据资源管理规范、技术准则、清洗规则、逻辑框架等大数据利用办法, 以提升大数据在官方统计的利用水平、利用质量和利用强度。
2. 优化统计内部机构设置。
按照大数据运行模式和要求, 在现有的运行机制和模式基础上, 从数据流程着手, 以成果效应或者效果为重点和归属, 以大数据融入和数据技术转化应用为载体, 以行业分类为基础, 积极探索大数据模式下, 内部机构职能的设计和划分, 拓展数据采集渠道和方式, 满足大数据服务官方统计整合需要。
3. 建立配套的政学体系。
建立和完善确保大数据统计技术运行平台正常运转和发展的政策体系, 使大数据技术与数据采集、处理、挖掘、成果展示与分享的工作有法可依, 有章可循。同时, 明确每个技术流程操作规范与监督, 建立和完善技术指导性手册。
4. 积极探索大数据统计运作模式下。
国家统计局地方调查队与全国各地区统计局在业务形态、工作分工、职能优化、资源整合、功能定位等方面改革或调整, 建立更加科学合理的中国统计管理运行新模式。
(二) 建立规范的数据生态环境标准
没有标准就没有系统。应建立面向不同主题、覆盖各个领域、不断动态更新的大数据统计生态环境建设标准, 为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。
1. 方法制度是统计工作的依据和标准。
积极探索和创新符合大数据统计需求的统计工作制度和数据运行的方法制度。工作制度要跟进大数据统计运行流程与操作规程。方法制度要符合大数据统计采集、清洗、加工整合、数据验证、挖掘分析、成果展示要求, 在准确度、时效、灵活度等方面允许一定的弹性空间, 力争短时间内与大数据模式和社会需求衔接。
2. 技术标准是做好大数据统计的关键。
(1) 要积极探索和创新研发适合与跟进大数据结构化、半结构化甚至非结构化数据聚集整合, 以及衔接转换与转化的软件技术标准;
(2) 建立国家大数据中心与各地区分级匹配的硬件设施保障体系与标准;
(3) 改进和优化现有数据终端采集系统, 特别是农村住户调查以及零散的调查客户 (对象) 的数据采集终端, 改革传统的结构化报送程式, 逐步向结构化与半结构化、非结构化相结合的综合报送方式过渡, 提升数据规范, 增强数据全面性、自我验证性、准确性;
(4) 改进和优化政府行政记录数据采集传输方式, 解决数据终端分享与隐私、安全保密技术。
3. 搭建坚实的数据共享平台。
数据只有不断流动和充分共享, 才有生命力。应在各专业数据库建设基础上, 通过数据集成, 实现各级各类指挥信息系统的数据交换和数据共享, 特别是数据元单位的数据成果分享。使数据在服务国家和部门的同时, 更加贴近和融入全社会、企业, 把为微观群体、实体经济服务作为最终目标和质量提升, 从而真正实现和体现大数据统计为人民服务的宗旨。
(三) 改革统计数据专业化管理
一是专注于数据信息查找、访问和使用关键业务信息的能力。二是获得完整的认识。充分了解数据信息并承认并非所有的信息都是同等重要的。三是保证数据信息的有效性。使用重复数据删除和归档技术来保护更重要的数据信息, 同时存储更少的数据信息。四是设置一致的政策。这是必须基本一致的政策数据信息, 即无论数据信息存储在何处, 无论其是在物理环境、虚拟环境或云环境中, 都必须强制执行一贯政策。统一数据信息分类, 自动发现拥有数据信息的部门和使用的具体信息, 访问控制和分配, 自动信息保留和删除, 并加速电子发现的过程。同时要易于数据的整合与集中, 包括现有的IT环境和接合;易于扩展与伸缩, 适应未来巨大变化需求;易于管理与维护, 包括现有的异构环境;具备极大的可靠性、可控性、安全性;能够降低总体拥有成本, 不仅是软硬件, 还有管理、电力、人力等。
(四) 改革数据挖掘途径与方法
数据来源于经济社会, 最终服务还是经济社会, 挖掘成果对经济社会有价值的数据才是统计工作存在的价值。可见数据的大小多少并不是关键, “大数据”对不需要的用户一文不值。目前, 国内数据挖掘应用仍停留在数值分析与图表描述的初级阶段, 更何况行业、企业大规模的运用数据挖掘技术尚需时日。数据挖掘是数据库研究、开发和应用最活跃的一个分支, 是多学科的交叉领域, 它涉及数据仓库技术、人工智能、机器学习、神经网络、模式识别、知识库系统、高性能计算、数据可视化等多方面知识。利用这些技术与手段来处理和挖掘数据, 目前常见的挖掘研究路径有:一是统计上常用的“假设检验”, 通过“假设—数据—验证”的过程来体现数据挖掘成效。二是数据库知识发现, 这也是目前计算机科学不断运用与探索新的挖掘技术的路径。就是利用人们预先设计好的计算机编程来观察数据, 主要借助数据可视化工具或者计算机分析数据中各个因子相互之间的相关程度等方式, 这个“数据—结论”的路径较为直接。虽然这一路径受到技术的限制, 但这种路径会随着计算技术和程序的创新和发展在不断的提高挖掘水平和深度。数据挖掘的主要任务有数据汇总、概念描述、分类、聚类、相关性分析、偏差分析、建模等。数据挖掘的过程可表述为:业务理解 (发现问题—确定客户目标、资源评估、挖掘目标、挖掘计划等) ;数据理解 (确定挖掘的数据、数据描述、数据探索、数据质量甄别等) ;数据准备 (选择数据、清洗数据、数据重建、格式调整等) ;建立模型 (模型评价、挖掘模型选择、建立模型) ;模型评估 (结果评估、步骤评估、计划执行与调整等) ;成果展示 (展示成果、模型监测和维护、模型更新) 。
(五) 培养高素质的专业队伍
大数据建设的每个环节都需要依靠专业人员完成。因此, 一是必须培养和造就一支懂指挥、懂技术、懂管理的大数据统计建设专业队伍;二是逐步建立和培养大数据统计挖掘和具备深度洞察力的专业调查分析人才队伍;三是积极调动和聚合利用全社会调查咨询机构, 延伸大数据统计人才整合和社会人才队伍建设, 以及推进社会建立健全调查咨询管理框架和统计咨询社会体系建设与管理;四是在条件成熟的情况下, 适度调整和聚合国家调查队和各地区统计局专业人才队伍的整合管理与使用。
摘要:“大数据”生产和使用的社会化, 直接挑战当前官方统计生产和使用以及数据生态环境和运行模式。本文通过对官方统计与大数据现象、表现形式及特点、数据流程、数据使用、数据挖掘、数据技术、数据行为等对比分析, 对中国统计如何正确面对和正视“大数据”现象对官方统计的影响进行思考, 从统计运行平台、生态环境标准、专业化管理、挖掘途径与方法、人才队伍、问题解决等方面提出建议。
关键词:大数据现象,官方统计,分析与思考
参考文献
[1]涂子沛.大数据[M].广州:广州师范大学出版社.
[2]朱志军, 闫蕾, 等.大数据——大价值、大机遇、大变革[M].电子工业出版社, 2012.
[3]郭晓科.大数据[M].北京:清华大学出版社.
[4]大数据:下一个创新、竞争和生产力的前沿[J].赛迪译丛, 2012 (25) .
[5]赛迪顾问股份有限公司.大数据产业生态战略研究2012.
基于大数据背景的统计工作分析 篇8
【关键词】大数据;统计工作;应对措施
一、引言
科技的进步使得大数据时代已经到来,信息网络科技的发展使人们的生活发生了翻天覆地的变化,对各种数据进行统计的各种也有很大发展,各种新的技术和理念也在统计工作中得到应用,对统计工作发展的效率与质量都有很大的积极作用。但是,大数据背景下,也产生大量更多渠道的信息,这也对统计工作有一定干扰作用,带来一定的挑战,这是时代发展必然面临的问题,因此需要积极应对,抓住机遇,应对大数据背景下的挑战。下面对大数据背景下统计工作进行详细的研究。
二、大数据背景概述
大数据并不是一项具体的技术,而是时代的现象,具有以下特征,数据的数量比较大,数据的类型也更加多样,数据的处理也比较迅速,数据的价值比较高,密度比较低。在网络信息发展迅速的今天,对社会进行管理,作出决策都离不开对各种信息的统计与分析,几乎全部个人都使用各种工具向数据信息的平台和终端传输信息和数据,信息与数据的庞大已经超出传统对信息进行分析和转存体系工作的能力。为了更好的对这些数据和信息进行利用,确保信息的稳定,就要对统计工作进行改进和完善,这就催生了云计算技术。而大数据就是人们在面临一个类别和体量都很大,需要实时高速进行处理,其没有价值的数据比较多时,这个数据体感官的称呼,这是时代发展的展示。
三、大数据背景下统计工作面临的问题
1.数据源头的采集与设计方面的问题。传统数据的采集主要由国家统计局对调查表进行设计,然后基层的统计人员,按照调查表的说明进行填报并上报。当前,我国实施企业一套表联网直报工作就是对传统统计的改进,统一的设计一套表,但是,从实际的情况来看,这一方法还没有深入得到发展,大量住户、部门和单位的统计并没有在一套表内。对调查对象进行统计是大数据背景下政府对数据进行采集的源头,这是整个行业的信息和行政管理的关键。使调查对象的内部统计设计进入政府的设计中使时代的要求,也是统计工作的基础,因此需要不断改进。
2.部门统计设计中的问题。我国相关法律对统计的部门权利的范围、工作的内容和目标等都有规定,赋予国家统计局对相关统计部门进行管理的权利。但是从实际的情况看,国家统计局使用权利还有一定的困难,出现问题的原因主要使部门统计的设计没有进入政府统计设计的管理中。而且,部门的统计和政府的统计之间没有良好的衔接,很多基层统计的人员向部门或者政府送报资料时,没有对数据的质量有足够的重视,进而使数据出现冲突的现象,因为统计工作内容、方法和目的等的不同,各个部门之间统计的结果和统计局的数据有所差异,而且统计局和部门之间缺乏协调与沟通,还会引起重复进行劳动的现象,浪费大量人力、物力和财力,是统计出的数据可信度降低。
3.相关统计部门因为人员和经费等方面的缺乏,导致源头的数据缺乏可信度。统计工作中涉及很多部门,工作的经费也主要是各级地方政府财政的支持。目前,一些基层政府的领导对有形政绩比较关注,统计工作是对宏观的社会和经济效益进行反映,无法给地方带来直接的效益,这就造成很多领导缺乏重视,一些统计工作必需的经费页经常不能落实,对统计工作发展有很大影响。
四、统计工作适应大数据背景的措施
大数据背景下,统计的报表已经不是获得数据唯一的手段,各种网络信息平台的覆盖,不仅造成数据的爆炸增长,也使大量的数据可以在线实时使用,每个企业和部门可以提供与生产数据,统计部门也不是对数据进行采集的唯一单位,各行各业都能在统计工作中发挥自己的作用。
1.需要建立起对统计的数据进行管理的平台。面对着大数据时代,政府的统计需要建立起两个不同的平台,第一,是对数据进行管理的平台,这是大数据背景下,政府的统计部门需要对大量的数据进行有效、科学的管理,对统计的资源进行有效的整合,第二,是对数据进行分析和研究的部门,政府的统计部门需要对数据与资源进行开发和利用,把数据信息转化成有效的统计生产力。
2.建立健全对大数据信息进行共享的平台。随着我国基层统计的发展,各种统计制度也在不断完善,为了加深统计工作的职能,就要在各级统计机构内部,建立起大数据信息共享的平台,以便各级部门间能够对数据进行互补,使数据的分析、研究、查询和服务工作相融合,向人们和政府提供更加准确、全面、多角度的统计信息数据与权威的分析,并使统计工作的系统和权威得到提高。
3.要加大对大数据背景下专业人才进行培养的力度。大数据背景下,统计工作有以前单纯数据的统计转变为更加复杂的分析,这对统计人员专业的素质和水平也有更高要求,从目前实际的情况看,专业的人才比较缺乏,这就需要加强对统计人才的培养,强化各级单位间的学习与交流,促进部门内部统计人员素质的提升,并定期开展一些专业的培训,鼓励部门统计人员参加,还可以吸收一些具有专业分析素质的人才,提高整个统计工作人员的水平。
五、结语
综上所述,在大数据背景下,统计分析工作面临着严峻的形式,需要引起相关人员的重视力度,抓住时代的机遇,不断进行创新与改革,切实发挥出统计工作在社會生活中的作用,为社会发展作出贡献。
参考文献:
[1]岳大波. 大数据时代下对统计工作的思考[J]. 办公自动化, 2014(23):34-35.
[2]王晓军. 基于大数据背景的统计工作建议[J]. 企业改革与管理, 2015(22).
[3]汪海亚. 探析大数据时代背景下基层数据统计面临的机遇和挑战[J]. 统计与管理, 2015(3):26-27.
作者简介: