数据分析与统计(共12篇)
数据分析与统计 篇1
计算机技术的发展和普及, 为信息的传递带来了方便, 也为信息数据统计提供了平台。信息统计不仅对于个人具有重要的作用, 而且对企业和国家的决策都会产生重要的影响。并且数据统计也为解决问题提供了一种方式。但是数据解决问题的前提是提供正确有效的数据, 即统计信用。所以统计的信用程度如何成了数据统计的关键。
一、对于统计信用与统计数据的简介
所谓的统计信用是指:在数据统计的过程中, 数据统计者或者是提供数据的人在参与的过程中, 利用科学有效的方式将数据合理的安排、推理、分析, 最终为企业, 或者政府服务。所提供的数据与事实相符的程度为统计的信用。在整个统计数据与统计信用的过程中应该注意两点:
首先, 数据要有真实性。在数据统计的过程中, 数据不真实, 不准确, 导致统计数据分析错误, 甚至给企业或政府决策带来错误信息的指导, 严重影响统计数据的使用。
其次, 数据应该用科学的方式去统计。随着我国社会经济的发展, 科学技术是第一生产力的观念不断地深入人心, 所以在数据统计的过程中首先讲科学统计, 不能出现不符合科学规律的统计。否则统计数据的不真实性, 将影响统计信用的使用, 最终影响统计数据质量和信用的提高。众所周知, 数据统计的最终目的是为解决问题提供一定的依据。试想一下, 如果所采集的数据本身存在虚假的话, 或者缺乏完整性, 那么最终的结果肯定与事实是不一致的。所以在数据统计的过程中, 要尽量保证数据的真实性和完整性。
二、关于统计信用与统计数据存在的问题
目前在数据统计的过程中还存在许多的问题, 如果不改进, 将会对于最终的决策产生不良的后果。经过笔者调查研究发现, 目前信用统计主要存在以下几种不足:
首先, 数据统计的重要性得不到足够重视。因为我国科学技术发展的时间并不长, 使得目前大多数的企业或政府并没有认识到数据统计的重要性。认为数据统计在工作过程中不过是起到记录的作用, 无关紧要, 可有可无, 即使出现错误也可以原谅, 这样的心态使得数据统计的发展举步维艰, 停滞不前, 更不要说统计的信用问题。
其次, 说到数据统计可以解决一定的问题, 指的是正确的、科学的、有效的数据统计方式, 才能找到工作过程中正确的统计数据, 从而发现工作中的薄弱环节, 才能有效指导工作。但是目前的问题是, 有些企业政府认识到了数据统计的作用, 但是仅仅将数据的统计放在次要的位置上, 作为最后总决策的辅助资料。这样的重视程度, 统计信用的问题更是抛到一边。
最后, 我国的相关政策落实不够彻底也是目前数据统计与统计信用得不到重视的原因。目前我国已经出台了相关的数据统计的法律法规, 并且这些法律法规经过实践证明可行性是比较高的, 但问题在于, 关于统计的法律法规得不到公民的认可, 很多的公民在进行数据统计时, 依然我行我素, 不依照法规办事, 对于最终的统计信用造成了一定的影响, 要增加公民的依法行事的意识。
三、对于统计信用与统计数据存在不足的解决办法
(一) 加强统计信用的意识
一件事情成功与否很大程度上取决于意识。只有在意识上认可某一件事情, 才会尽全力去完成。目前很多的民众不相信数据统计的重要作用, 主要是在以往的数据统计使用中, 出现过因为数据统计而使得最终的结果不理想的情况。出现这样的问题, 并不是数据统计这种方式本身不好, 而是因为在数据统计的过程中所应用的方法不科学, 不合理造成的。并且在数据统计的过程中应该注意, 数据统计不仅仅是简单的数据之间的积累, 要通过数据之间的积累, 总结出一定的规律, 使得在解决问题的过程中, 可以提供一定的思路, 从而达到最终解决问题的目的。很多人在数据统计与统计信用方面存在这样的一种误区, 即:数据统计是企业在发展的过程中必不可少的一种工具, 与政府的职能没有太大的关系, 这样便出现了对于数据统计与统计信用的认识误区。数据统计与统计信用在政府决策时同样发挥着重要的作用。不仅仅是民众要认识到数据统计与统计信用的重要性, 政府的执法部门同样要将这件事放到一定的高度上去看待, 一旦出现与数据统计与统计信用法规相违背的事情要严肃处理。
(二) 建立统计信用与统计数据的相关制度
没有规矩不成方圆, 各行各业都应该具有标准和规范, 才能得到长足的发展。目前随着社会经济的快速发展, 我国传统的数据统计与统计信用的制度已经跟不上时代的发展, 所以当务之急便是建立一套新的统计信用与数据统计的制度。现在的时代计算机技术飞速发展, 为经济的发展做出了巨大的贡献, 并且也渗透在各行各业中, 数据统计可以改变传统的方式, 使用计算机相关的技术, 并且也应该加强数据统计与统计信用相关法规的建设, 使得民众在数据统计的过程中有法可依, 加大对于数据统计法规的宣传。人才制度同样是数据统计与统计信用需要关注的重点, 人才是推动社会发展的最根本的力量。目前很多的数据统计的人员在操作方面还是可圈可点的, 但是谈到相关的理论时, 便是一片空白, 当然笔者并不是说需要一批书呆子, 但是理论联系实际是基本的学习方法。所以目前, 数据统计需要的便是一批专业的人才, 这些人才需要强大的扎实的理论基础, 并且也可以熟练的操作数据统计的系统。二十一世纪需要的人才不再是掌握单一技术的人才, 而是多方面发展的具有复合知识背景的人才。
(三) 进行必要的维信措施
前文已提及, 目前我国数据统计与统计信用发展的时间并不长, 很多人根本没有意识到数据统计与统计信用的重要作用。所以要想使得数据统计与统计信用在企业与政府的发展中占有一席之地, 就要明确的认识到, 这不是一蹴而就的, 需要一个漫长的过程。在建立数据统计与统计信用的过程中, 需要每个工作人员踏实践行相关的要求。当然, 在人们意识到数据统计与统计信用的重要性之后还要有相关的维信措施。所谓的维信是指维护数据统计与统计信用的真实性。首先就要在制度上作出要求, 这样可以基本保证工作人员统计数据的真实可靠性。其次, 应该认识到数据是掌握在工作人员手中的, 工作人员心中的维信观念如何直接影响最终的数据统计信用。所以要不断地给员工灌输统计信用的意识, 不断增加员工的责任感与信用度, 使之认识到统计的信用与最终的统计质量息息相关。只有保证统计的信用, 才能得到优良的数据, 为最终的结果提供强有力的保障。
四、结语
信息时代在计算机技术的支撑之下已经来临, 面对庞大的数据库, 进行统计数据是必要的举措。本文主要研究了与统计信用与统计数据质量相关的一些问题。首先对于统计信用与统计数据进行了简单的介绍, 然后介绍了统计信用与统计数据存在的不足, 在不足的基础之上提出了一定的改进措施。值得一提的是, 统计信用的建立不是一蹴而就的, 需要长时间的积累, 并且维信的措施也是必要的。总之统计信用与统计数据还需要全社会的努力。
摘要:随着科学技术的发展, 人们进入了信息时代。各种数字信息影响着人们的生产生活。数字信息在给人们提供方便的同时, 也让人们逐渐意识到数据统计的重要性。数据统计是企业政府部门进行决策的基础, 只有真实有效的数据统计才能使得企业政府作出正确的决定。所以本文将对统计信用与统计数据的质量进行研究。
关键词:统计信用,统计数据,质量研究
参考文献
[1]唐继明.数理统计如何建成统一独立的统计学[M].职教与经济学研究 (娄底职业技术学院) , 2006 (4) .
[2]霍宏伟.探析数理统计方法在工业企业中的实际应用[J].现代经济信息, 2009 (4) .
[3]杨海杰.数理统计方法在分析一些经济量关系中的应用[J].武汉工程职业技术学院, 2009 (1) .
数据分析与统计 篇2
(第三组)
数据统计与分析是一个比较复杂、比较费时和费力的工作,在工作中,小组成员既要有明确的独立的分工,也要有集体的团队的协作精神。每个人在统计数据时都要做到认真严谨、实事求是,要有耐心而不是用一颗浮躁的心来对待工作。在数据分析中,要用一颗客观的、真实的心来做好对统计数据的客观分析与评价。这样才能使问卷调查统计出来的数据真实有效,为下一步的工作实施和决策做好准备。
我们这次东华理工大学校园文化调查问卷印发的总数为210份,其中有6份未收回,实际收回问卷共204份,其中无效问卷(被调查人未填写性别、专业、年级等相关信息)有5份,则实际有效问卷为199份。合格问卷占总数的94.76%,问卷收回率较高。在接下来的数据统计与分析中,则以此199份有效问卷的数据来统计,并计算数据结果。
此次参与问卷调查的年级有11级大
一、10级大
二、09级大三的学生,08级大四学生未参与调查,其中问卷调查又以大一学生为主,有186人,占总人数的93%;而大二学生只有8人,占总人数的4%,大三学生只有5人,占总人数的3%。在此次参与问卷调查的性别比中,女生有136人,占总人数(199人)的68.34%;男生有63人,占总人数的31.66%。问卷调查的女生占有多数。
此外,这次问卷所调查的专业有15个专业,其中文科类专业(广告、法学、对外汉语、英语)调查人数有133人,所占总人数的百分比为66.83%;经济类专业(国际贸易、旅游管理、会计、市场营销、物流管理)调查人
数有50人,占总人数的百分比为25.12%;理科类专业(自动化、科工程、土木工程、资源勘探、信息管理、测绘工程)调查人数有16人,占总人数的百分比为8.05%。调查对象以文科类同学占多数。
在这次数据统计与分析过程中,我们发现了问卷还存在一些问题,但总体还是好的。首先,问卷中存在漏字的情况,主要是出题组印刷前没有认真做好校对的工作造成的;其次,选项有的出现错乱及其选项中没有明确注明题目是多选或者单选的题目,因此在我们数据统计过程中也带来了一些困惑,但经过向出题组的询问,我们还是明确了题目的多选与单选问题。但我想,这对于我们的调查所统计出来结果,其实际真实效果多少会有一些水分的。再次,就是我们问卷的发放组没有考虑我们要调查的比例的分配,比如年级的比例分配、专业类别的比例分配、男女性别的比例分配。这样就造成我们统计分析出来的数据有一点不合理性、不太全面性。此外,我们数据统计与分析小组中也出现过一些问题,由于我们从来没有做过数据统计与分析的工作,因此缺乏经验,在统计数据过程中其实每一道题也有不不合理的作答选项,而我们第一次都把他们统计上了,没有考虑到每道题都有回答无效的答案。而后来的结果是,又让我们成员重新统计了一次,这次考虑了把每道题目中无效答案剔除后,再统计出每道题目中有效答案的选择数量。
数据统计与分析不但要有团队协作的精神,而且还要会懂电脑,利用Excel操作系统来计算出最终的数据结果。这就在不同的两个方面考查了我们当代大学生应有的素质。在这次数据统计与分析过程中,我们组成员都表现得积极认真,按时按量地完成了我们每个人所分配的任务。因此在这次数据统计与分析中我们组虽然花费了有一定的时间,但还是比较少的,而且成功地完成了这次统计任务。这也为下一组的成员的论文写作及其总结工作争取了更多的时间。在使用Excel操作系统时,由于有些成员不会使用此操作,所以给其他会操作的成员增加了工作量。在此也让这些不会使用电脑操作系统的同学能够体会到对于掌握好电脑基础知识的重要性。希望他们都能够好好地学习这些知识,为今后的工作和学习带来更多的便利。
这次问卷调查的数据统计与分析实践活动,让每个同学都有收获。有的收获了出题时应当注意的问题,有的收获了问卷调查中所获得的经验,有的收获了同学们之间的友谊,使同学之间的交流与沟通在实践活动中无形当中就增加了,有的〃〃〃〃〃〃
总之,我们都认为这次问卷调查实践活动是一次成功的实践活动,因为在这次调查活动中,我们都看到了每一个同学都在努力的把事情做的更好,都认真地对待自己所分配到的任务,都在积极的讨论与交流。
统计与数据共舞 分析与应用齐飞 篇3
【关键词】统计;生活;数据;分析;实践
《义务教育数学课程标准(2011年版)》(以下简称《标准(2011版)》特别提出了一些核心概念,在四大领域之一的“统计与概率”的内容有了较大调整,特别强调培养数据分析观念,与学生的现实生活联系紧密,小学教师如何在实践中培养儿童的数据分析观念,这个命题走入笔者教学的研究视野。所谓数据分析观念,具体表现在:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析作出判断,体会数据中蕴涵着信息。”史宁中教授强调:“人们在实际生活和各行各業中面临的数据越来越多,必须树立利用数据的意识,掌握一些分析数据的方法和模型。所以数据分析观念是非常重要的。”
一、唤醒生活经验,体悟数据意识
《标准(2011版)》:“通过对数据的简单分析,体会运用数据进行表达与交流的作用,感受数据蕴涵信息”可以说统计在日常生活中随处可见,儿童在生活中有一定的统计基础,如统计家中的人口数、给自己玩具分类数个数等等,但这些经验大多数据少,对数据分析的需要不足,进入小学学习后,首先就是要唤醒他们的生活经验,从学生的生活实际出发,选取学生最感兴趣的话题,使学生感到统计就在自己的身边,激发学生学习的动机。
【案例】让儿童进行喜欢看什么动画片进行调查。喜欢吃什么水果的调查,做一些有趣的实验。如可以让学生做一口气能数多少个数,一口气能把回形针吹多远、跑步后脉搏跳动会比静止时快多少等等游戏和实验,类似这样的例子很多,在教学中要注意收集,利用课后实践活动时间前续进行调查,一年级可以调查喜欢的小动物,二年级可统计班级同学的年龄,三年级可统计班级同学拥有博客的数据,高年级可针对家庭住房、电话调查、生活中的楼盘价格,电视数量等生活中的常见信息进行调查与统计等等。
让学生统计和分析在游戏和实验中获取的数据,这样学生的学习就会“其乐无穷”。通过生活中的数据了解,积累经验,体悟数据可以了解身边的现象,进一步感受统计的价值。
二、亲历统计过程,发展数据观念
《标准(2011版)》强调:“能从报纸杂志、电视等媒体中,有意识地获得一些数据信息,并能读懂简单的统计图表。”教师注意把统计的过程随教学过程充分展示出来,渗透自然,学生乐于接受。通过对情况的亲身体验,让学生感悟数据来源的真实性,引发儿童的数据分析需求,教师要注意让统计的过程随教学过程充分展示出来,渗透自然,学生才能乐于接受。对统计表的分析注意了开放性,让学生扮演统计员的角色,师生互动、生生互动,充分发挥了学生的主动性、参与性,学生经历了知识的产生、形成、发展和再创造的过程,使课堂成了学生主动探究的乐园。
【案例】实践活动“我能扔多远?”
活动准备:垒球若干个,盘尺,测量记录单
活动方法:分小组进行扔垒球活动,扔后先估测长度,再进行实际测量。分小组填写好记录单:
活动记录单
班级专门利用一节体育课时间,和体育老师一起开展了此项活动,学生们参与其中,收集数据,亲历了数据产生的全过程。
"大数据"与政府统计改革分析 篇4
关键词:大数据,政府日常管理,统计改革
0前言
网络大数据时代的到来, 意味着我国现有信息生产力的水平将会有阶段性的突破和提高, 大数据不是简单的海量数据的堆砌, 而是包括文本文字、视频、音频以及各种零散化、非结构化信息的融合的统称, 通过各种各样的渠道来搜集大量的信息, 针对这些信息采用大数据的分析方式。从海量数据中挖掘出更丰富更精准的信息应用到生产实践中, 而政府日常工作过程中会处理社会各界大量的信息数据, 因此, 政府统计分析与"大数据"技术的结合, 也是时代发展的必然趋势。
1 政府统计所面临的挑战
多年以来, 传统的政府统计部门一直秉承"为国民经济发展保驾护航"的原则, 而勤勤恳恳的进行工作, 且在很大程度上取得了辉煌的成绩, 从全国人口普查、到四大工程建设, 再到GDP数据统计分析、经济普查等都有政府统计部门辛勤劳作的背影。这样在很大程度上保障了我国现代化建设在高速发展的同时, 也能够有经验可依、有数据可分析, 避免了盲目发展可能带来的各种严重后果。利用对原有数据的统计分析, 改善现今工作, 提高工作效率。但随着社会的快速发展, 政府统计工作所面临的挑战也越来越多, 具体如下:
(1) 对政府统计原有工作方式的巨大冲击
传统的统计工作方式与现代社会的发展需要越来越显得格格不入, 各种工作模式、工作方法上的弊端导致在信息统计方面的能力日显乏力, 且经过传统统计工作得出的数据结论与实际情况存在偏差, 往往一些统计结果一公布, 就会引起社会各界的质疑, 这样不仅降低了统计部门工作的权威性, 也从侧面损害了政府的权威形象。而大数据的统计处理方式, 是运用"互联网+"、云计算等最新的网络技术获取海量的数据, 再利用复杂的数学建模、数据挖掘等进行数据分析, 技术含量很高、工作方式也全然不同。
(2) 对政府统计信息的冲击
新时代的到来, 使得政府的信息搜集来源的广度大大增加, 统计部门的数据搜集工作不再是单一的一家数据服务代理机构或者是几家机构进行, 而应该将政府内部各个部门之间的非机密数据进行内部共享, 让原本"孤岛式"的信息搜集统计方式变成一体化的共享模式。这样就是对传统政府统计信息方式的一次彻底颠覆, 通过政府内部的数据处理平台, 进行海量的数据交换和传输, 让统计部门的数据来源更加丰富, 数据的处理工作也更加有效。
2 政府统计的改革方式分析
互联网时代的到来推动着政府统计部门的巨大变革, 这不仅仅是技术、理念层面的变革, 更是统计部门人员、工作方式的改变。也是政府整体统计环境的巨大更新。
(一) 数据收集环节改革的具体措施
在新的数据统计背景下, 统计数据的工作无论是从渠道的建设, 还是技术手段的革新, 都对传统的统计工作产生巨大的冲击, 特别是在数据收集环节。数据的收集的理念、方式都应该结合现代社会的发展以及技术的快速更替而进行。大数据时代的数据搜集方式应该更加注重渠道的建设、新技术的应用;例如:"互联网+"、移动通信网等技术的应用, 具体而言就是与搜索引擎公司进行战略合作, 对每天海量的信息数据进行统计分析。另外就是向中央直属部门报备, 要求内部非机密信息的共享, 便于统计工作的展开等等。这样才能够真正保证数据搜集量的广度以及真实度。
(二) 数据利用环节改革的具体措施
新时期, 社会上需要统计的层次以及方面都急剧扩大。传统的统计分析方式已经不能够容纳海量数据的分析工作。这就需要结合新技术、新模式来对"大数据"技术统计上来海量数据进行分析, 从而确保海量的数据能够被充分的利用, 不断寻找海量数据的统计规律, 从而提高信息数据的利用效率。
(1) 整合数据。通过各种外部或者政府内部统计搜集的信息数据, 通常十分繁杂, 无法直接进行有效的应用分析。因此, 首先要进行数据归类, 之后形成数据模块, 对不同的数据类型再进行深度分析、挖掘。经过分析之后的有效数据再进行整合, 通过结构化或者是非结构化的方式来完成数据的预处理工作, 这样数据的分析才是真实有效的。
(2) 推进数据共享。积极探索政府内部数据共享的各项工作, 挖掘信息数据的内在价值, 帮助部门与部门之间的信息能够得到有效利用, 使得数据共享之后能够起到1+1>2的效果。
(3) 开发更有技术含量的统计产品。政府统计部门通过大量工作得出的结果就是统计产品。统计产品主要包括各项经济指数、民生指数、分析报告、专题调研报告等。在大数据的时代背景下, 应该开发拥有更多技术含量、简单易懂的统计产品, 同时注重统计产品的质量以及真实程度, 使新技术的应用能够真正服务为民。
3 结语
综上所述, 政府统计部门的技术改革以及大数据研究模式的改革要同步进行, 这样才能够保证统计数据的真实性、可靠性。为政府其他部门的决策研究提供有力的数据参考。
参考文献
[1]杨美沂.数据大集中环境下统计生产流程再造[J].统计与信息论坛, 2010 (25) :10-13.
数据统计与分析演讲稿 篇5
以下是我们的数据统计与分析
1、通过分析原始数据,我们发现湛师运动人数多,对运动设施的需求量大
由图表一我们可以看到:
高达45人的受访者一周运动次数在1—2次间,30人在5次以上,还有8人一周基本没有运动,经过计算湛师学生一周运动量次数至少有两万次。另外周一至周五,运动场在日间基本是不开放的,而且体育馆或篮球场总是有体育课,学生们也有课,所以大家基本都在周六日或晚上运动,人流量太大。因此我校对于运动设施的需求较大。
2、其次,我们发现湛师学生不进行运动的原因与运动场地的问题有较大的联系
通过图表二,我们可以看出受访者不进行的运动的原因有很多,其中以自身因素不进行运动是不进行运动的原因,但是也有32人认为有场地数量少的因素,将近三分之一的人数,还有13人认为是运动场地远,还有其他的客观因素。由此可以看出湛师运动设施的场地数量和分布位置对大部分湛师人的运动次数有一定的影响。
3、我们的调查问卷还涉及到湛师学生对湛师运动设施的了解程度
由图表可知,超过半数人对运动设施的了解程度一般,但还是有21人认为他们不了解湛师的运动设施,只有23人认为他们在了解程度以上的。由此可以看出大部分湛师人对湛师的运动设施都处于一知半解的状态甚至是不了解,因此湛师应该加大对湛师运动设施的宣传力度,加深湛师人对运动设施的了解。
4、关于目前湛师运动设施存在的问题
从表格与图中可看出,最多人人为学校运动设施存在的最大的问题是运动设施的运动数量较少,其次是有33%的被调查者认为湛师的运动设施年久失修,有损失,接着也有学生认为运动设施还存在人为损失的问题,最后是7%的学生觉得游泳馆的收费是有问题的。经过调查我们不难看出学校在运动设施方面还存在着许多的问题,最大的问题就是设施的年久失修和数量过少的问题,所以建议学校可适量地增加运动设施,定期地派人进行维修,光靠学校的力量是不足以维护好学校的设施,我们同学自己也要维护好这些公共的财产。
5、此外关于湛师学生认为数量不足的运动场地
从表和图中可以看出,大多数的人即27%的人认为学校的羽毛球场的数量不足,还有相当一部分人认为游泳馆的场地有限,占到19%,觉得篮球场和乒乓球场数量不多的人数差不多相同,最后剩下少部分人觉得其它运动场地的数量少,比如排球场、田径场和足球场。大多数同学反映,不是他们不想运动,而是运动场地实在是有限,或者是场地离中心地区较远,较偏僻,这应该引起学校的重视。
6、表六是湛师学生对湛师运动设施的爱惜情况
通过表与图可知,在调查身边的同学对运动设施的爱惜情况的问题上,明显可看出绝大多数人都觉得身边的同学对运动设施的爱惜情况是一般般,有17%的人的身边的同学是爱惜运动设施的,剩下的10%的人的身边的同学是不爱惜运动设施的。爱惜设施的程度与自身的素质有关,不爱惜设施的同学还是大有人在,但我们维护好公共设施时才能更好的维护自己的利益,我们自己才能更多的享受运动给我们带来的好处。
7、表七是学校在关于运动设施的问题上与学生沟通的程度
如表7和图所示,大学生们在关于学校在有关设施问题上有没有及时有效地与同学沟通的问题上,给出了自己的意见。68%的同学认为学校在运动设施的问题上很少与学生及时有效地沟通,同时也占了较大比重的28%的同学表示没怎么留意,很少的同学认为学校在关于运动设施的问题上与学生沟通较多,占到被调查者的4%。所以希望学校可以在以后有关设施的问题上多与同学沟通,可以派几名代表与学校进行对话,可传达出学生的意见。
8、表八是湛师学子对现有的运动设施改进的看法
由表8与图可得出,大学生们对我校现有的运动设施积极地提出了自己的看法,看来大学生对自身有切实利益的问题还是比较关心的。我们不难看出,43%的学生认为学校目前应该着手完善室内室外的运动设施,接着认为学校应该加派人手维护运动设施和应该增添更多的休息区的人数是一样的,最后也有相当一部分也就是17%的学生认为学校应该加大宣传,增强学生维护公共设施的意识,很少有学生选择其它的。现在大学生运动的群体不是特别高,这也跟学校对运动设施方面的关注度,这应该引起学校的重视,通过有效的手段提高学生对运动的重视。
通过本次数据分析我们的除了以下调查结论与建议
1、调查结论:(1)由本次调查可知湛师学生对运动设施的需求量较大,而湛师学生不想运动的原因与目前湛师运动设施所存在的问题有很大的关系。(2)湛师运动设施存在的问题主要是运动设施的数量少与设施年久失修,有严重损伤,当然运动设施的破损与学生对湛师运动设施的爱惜程度有很大的关系,因为很多同学对湛师运动设施的爱惜程度都是一般般,不爱惜设施的同学也不少。(3)学校在关于运动设施的问题上很少与学生进行沟通,大部分学生对于湛师运动设施的了解程度都是一般般,甚至是不了解,这使得很多关于运动设施的问题得不到及时的解决与完善,也使得学生们对运动设施的需求与建议得不到满足与答复。
统计新人与数据的对话之路 篇6
听数据说话
对于统计新人来说,周围的一切都是陌生的。因此,这个时候,更要学会谦虚。具体来说,需要我们主动更新知识结构,从统计入门知识学起,要像海绵一样,“贪婪”地吸收一切有用的知识。同时,我们也要多听多看,随时随地积累知识。做到向书本学习、向同事学习、向实践学习,学会看统计表格,学会看统计指标解释,进而读懂统计数据的内涵。
在读懂统计数据的内涵后,统计新人需要渐渐地与统计进行沟通和交流。当我们看到眼前密密麻麻的数据时,静下心来,可以先在心里多问几个为什么,再不断地反复推敲,去伪存真,从而获得真实而准确的统计数据。
用数据说话
从迈进统计大门的那一天起,一定程度上意味着我们向专业统计人的目标又靠近了一步。虽然我们终日埋身数海,但不能因此被统计数据所累,而是要让统计数据有更多的“用武之地”。例如,统计数据要更多地为社会公众服务,这就需要我们统计人充分利用手中掌握的大量统计数据和信息,通过加工和整理,让一组组数据生动起来,使其成为服务经济社会发展、服务领导决策的一篇篇调研文章和分析报告,让更多的人分享统计成果。
论交通量数据统计、分析与应用 篇7
交通量数据是在有组织、有计划地交通量调查的基础上, 通过统计整理和分析, 所取得的交通量的统计资料;交通量数据统计与分析能够充分反映本地区公路交通量的变化和发展趋势, 评价公路对现有交通车辆的适应程度及交通运输服务质量水平, 为公路交通行业的发展、公路建设的总体布局与规划[1], 公路建设项目的可行性研究等提供科学的数字和理论依据。
通过对全市76个间隙式观测点、3个连续式观测点的观测数据资料进行及时、准确、完整的数据统计汇总, 并进行深入的数据分析, 对管理线路等级、交通流量等提供第一手资料。
一、交通量调查数据的整理和分析
交通量调查经过观测记录、数据采集后, 需要对取得的原始数据进行认真处理和分析, 把它们转换成有用的数据指标, 才能让这些花费了大量人力、物力、财力所获得的资料发挥有效的作用[2]。
1. 交通量数据分类整理。
交通量数据的整理首先要根据大量的原始数据来计算出混合交通量自然数和当量数。由于交通量时刻都在变动, 一般常见的都是取某段时间的交通量平均值来衡量该段时间的交通量代表。一般在进行交通量的数据整理时, 常分成三类[3]: (1) 按交通组成的不同可分机动车交通量、非机动车交通量和行人交通量。机动车交通量包括各类汽车和拖拉机等。非机动车包括畜力车、电动车、人力车、自行车等。 (2) 按观测时间的不同可分秒交通量 (5 min、10min、15 min) 、小时交通量、白天12小时交通量、16小时交通量, 日、周、月、年交通量。 (3) 根据用途不同平均交通量通常可分为平均日交通量、周平均日交通量、月平均日交通量、年平均日交通量、高峰小时交通量。
2. 交通量数据计算。
通过以下公式计算各类公路的总交通量及在公路网中所占的比重。
(1) 线路交通量。线路交通量式中Ni——线路上各观测站调查日交通量 (辆/D) ;Li——线路上各观测站对应的调查区间长度 (km) ;n——线路上观测站的个数。同类公路的路线交通量=辖区内每条同类公路的路线交通量之和;调查区域内线路交通量=辖区内几类公路路线交通量之和。 (2) 日交通量。日交通量=路线交通量/路段全长;同类公路日交通量=同类公路路线交通量/同类公路里程总和;调查区域日交通量=调查区域内路线交通量/调查区域内几类公路里程总计。 (3) 各类公路里程及路线交通量比重。各类公路里程比重=各类公路里程小计/几类公路里程总计;各类公路路线交通量比重=各类公路路线交通量小计/几类公路路线交通量总计。
3. 经过计算整理, 可以得到本市、县、区各类公路线路交通量比重调查表 (以2009年为例) 。
二、交通量时空变化分析
交通量的时间变化是指某一公路断面交通量在不同时间的变化情况。交通量的空间变化是指同一时间交通量在道路网上不同地点的流量分布。在进行了24小时交通量的连续观测后, 就可以整理为以小时为单位的交通量统计表, 绘制交通量的时变图, 以分析交通量的变化趋势。了解上下高峰小时出现的时间、数值大小和夜间交通的情况等。
通过对不同公路的交通量时变图的分析可知 (见图1、图2) , 地方公路交通量时空变化具有以下几个特点: (1) 交通量时变图一般呈波浪形曲线分布, 一般都有上下午高峰出现; (2) 不同性质公路的空间分布规律有差异, 市道和重要县道交通流量较大, 高峰期时间拉长, 而次要的县道和乡道交通流量小, 高峰期集中; (3) 不同经济发展规模的地区, 所连接的公路的交通量时变规律有差异, 相同性质的公路在经济愈发达的地区交通量愈大。
三、交通量数据的应用
通过对交通量调查资料的整理和分析, 可以了解各类公路的交通量及其各自在路网中的比重, 同时也可以了解交通量的空间分布和时间分布特性、交通量的各种变化规律和影响因素、从而为道路网规划、道路设计和建设、交通管理和控制、工程的经济分析和效果对比、交通安全等各个方面提供了可靠的根据[4]。交通量调查资料在我市公路的应用和所起的作用主要体现在以下几点。
1. 为道路养护管理提供依据。
为提高公路养护的质量和经济效益, 道路的经常性维修经费及养路定员编制的额定, 以交通量的大小及道路施工质量、线路性质及养护经费等情况综合确定, 并以交通量大小作为主要的决定因素, 充分利用观测数据为道路养护管理服务。如我们对在3 000辆/日以上的道班除按里程配备养护工人和增加临时养护工加强养护外, 还充分利用交通时变柱状图, 合理安排道班工人在非车辆高峰小时进行路面养护作业, 车辆高峰期则进行路肩、桥涵构造物及绿化带等养护作业, 从而提高了养护效率和安全系数。
2. 为远景交通量预测提供根据。
通过大量的交通量数据进行统计分析, 找出交通量时间和空间上的变化规律, 根据历年的交通量数据来计算路线的交通量年递增率, 找出交通量增长规律, 从而可以推算出远景交通量, 预测未来交通量的发展趋势, 为公路建设的宏观决策提供依据。例如, 衡阳市2005—2015年交通公路网规划中的远景交通量就是以历年观测取得的交通量数据和汽车起讫点调查 (OD调查) 等资料为基础进行预测的。
3. 为交通控制与管理提供依据。
交通控制的实施离不开交通量的现状和需求, 如果脱离了交通量流向和流量的实际, 则交通控制的效果就会大大降低。例如, 根据实测的交通量数据, 对一些人口比较密集的乡镇除设置限速或村庄标志外, 有些还加设交通信号灯或突起横标线提醒驾驶员注意安全。并对交通量大的市、县道设置齐全的交通标志和路面标线, 加强路政管理力度, 使公路经常保持良好的技术状况, 使道路的通行能力得到提高。
4. 为已有道路评定提供依据。
运用交通量调查数据, 可以计算出路线的交通拥挤度, 判断现有道路是否达到饱和程度, 以评定道路的使用情况, 评价现有公路对交通运输通行要求的适应状况和服务社会的水平。例如, 以交通拥挤度低于2.0的, 属于畅通或拥挤路段, 说明道路还能基本满足运输需要, 车辆行驶较安全。拥挤度在2.0~3.0的, 属于堵塞路段, 说明道路的通行能力已满足不了运输的需要, 车辆行驶安全度较差。拥挤度大于3.0的, 说明道路已远远不能满足交通运输的需要, 属于严重堵塞路段, 车辆行驶极不安全, 迫切需要对原有公路进行改造以提高其通行能力。
5. 为公路设计提供依据。
根据现有道路的是否满足运输需要来进行总体布局, 在确定了规划项目后, 在项目的前期工作要进行可行性研究, 要新修或改建一条公路, 都要利用大量的交通量数据来进行经济论证和分析, 论证公路建设项目的必要性、合理性与可行性。建设项目决定之后, 在公路设计的过程中, 公路的技术等级确定、道路交叉口类型确定、公路路面厚度的设计计算等也都要利用到交通量数据。
结语
交通量数据统计能准确、及时、全面、系统地提供各级公路上的各种交通工具的数量及构成比例, 准确预测未来交通量的发展, 为公路建设总体布局与规划、公路建设可行性研究、旧路改造、公路工程设计等提供首要资料, 为公路基础设施建设和投资规模提供确切可靠的依据。随着社会的发展, 对交通量调查统计也提出了新的要求和任务, 需要我们加强交通量调查管理, 进一步探讨交通量调查的分析与应用, 充分发挥交通量调查的作用, 使交通量调查能更好地服务于社会。
参考文献
[1]交通部公路规划设计院.公路交通调查指南[M].北京:人民交通出版社, 1990.
[2]肖华.浅谈交通量调查数据的分析与应用[J].科技信息, 2007, (25) .
[3]王国秋.公路交通量调查数据分析[J].北方交通, 2008, (6) :192-194.
官方统计与大数据对比分析 篇8
一、两种数据的基本含义对比
官方统计, 即政府统计, 包括统计工作、统计资料、统计科学三个方面的内容, 其核心就是利用统计技术和工具获取统计数字, 加工成有价值的统计数据资料或者信息。统计工作者依照《统计法》所从事的统计日常事务, 即对国民经济行业20个门类98个大类开展统计调查、数字采集、加工、资料汇总、分析、资料和方法制度研究, 并在实践中围绕统计工作不断总结形成理论, 如统计学、统计实务、统计计量、预测、模型等不断完善的科学理论体系, 来指导统计实践不断服务经济社会发展。
对于“大数据” (Big Data) , 研究机构Gartner给出这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从数据的类别上看, “大数据”指的是无法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。这一定义揭示“大数据”是客观世界发展过程的存在, 把社会上现存的或正在发展的, 庞杂无序又似分类和规范化的数据现象笼统的、模糊性的以虚拟语言概括为大数据, 目前还没有形成系统性理论体系。它的发展是建立在社会化数据集合基础上, 各个行业或者系统被普遍的应用和推进, 并逐步形成系统的知识和理论。
二、数据表现形式与特点对比
当前官方统计数据与大数据在实践操作中的表现形式与特点存在差异 (见表1) 。
三、应用及价值对比
(一) 官方统计数据应用及价值
1. 官方数据的常规应用。
(1) 对历史的宏观经济社会运行状况的数量或价值量反映 (数据信息量化公布) ;
(2) 采用常规的统计技术、工具和方法对统计数据进行分析研究, 并根据需要进行前瞻性统计预测。
2. 官方数据的应用深度。
(1) 为党和政府各级领导机构决策和宏观调控提供统计数据资料;
(2) 为社会公众了解情况, 参与社会经济活动提供统计数据资料;
(3) 为科学研究提供统计数据资料;
(4) 为国际交往提供统计数据资料。
(二) 大数据的应用及价值
大数据本身并没有什么价值, 基于大数据的处理和分析才能为企业带来巨大的商业附加值。面对激烈的市场竞争, 越来越多的企业逐渐意识到数据已经成为新的生产资料。如支撑业务战略决策、提高顾客服务水平、促进销售获得客户、开发创新研究、强化财会业务、产品质量监测、企业管理等, 拥有数据并正确使用和挖掘数据将会成为企业成功的核心竞争力, 大数据如何转化为财富将成为大数据时代一个持久的研究课题, 成为一种基本上与资本、劳动力同样重要的经济投入。大数据正成为企业的新型资产, 形成竞争力的重要基础。
“大数据”的企业价值体现在以下几方面:数据的高透明度及易取性, 企业竞争战略与方式的影响, 信息的实时应用及平台监测, 推进企业管理变革, 规划企业经营模型, 改革企业人才发展计划。
四、数据的挖掘途径对比
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中人们事先不知道但又有潜在价值的信息和知识的过程。其过程主要有采集、甄别、描述性分析或预测性分析。官方统计数据与大数据的处理方式基本相同, 具体如下:
从数据采集→数据预处理→数据存储→数据分析/挖掘→结果展现
统计数据分析是对单一数据集、结构化数据进行预处理分析、集中式分析, 以实证性分析为主。而大数据分析更多的是为非结构化数据、迭代增长的数据集进行实时或流处理、分布式分析, 以探索性分析为主。
五、官方统计与大数据技术对比
(一) 数据采集技术
随着IT技术日趋发展与提升, IT技术成为人们推进生产、提升生活质量的重要手段。当前, 官方所采用终端数据采集手段 (结构化和半结构化制式录入报表报送模式) 将逐渐比社会化客户或者单位数据集合终端网络工程技术所淡化, 同时数据不以统计定式报表制度来反映, 而是以繁杂的混合式结构状态存在和使用, 并实时公布和变化。
(二) 数据处理技术
当前, 官方统计的单机终端和计算中心功能将远远不能满足非结构化等数据处理, 特别是针对不同领域、不同行业、不同企业、不同层次社会活动等带来更多的、不精确的、庞杂的全体数据。仅是相关关系的数据集合, 在价值密度较低, 且要求处理速度快的筛选、加工技术高的大数据处理中, 当前官方统计显得微不足道, 如:云计算、并行数据挖掘技术、数据挖掘集成技术、物联网等会逐步得到普及和应用, 这必将迫使官方统计技术变革。但这种数据模式, 直接影响官方数据描述状态。
(三) 数据容量与积累
现有的IT技术不能满足如摩尔定律式的数据增长, 同时大数据存储必将随之以等量级的扩展能力不断的增容和改进, 并以全新的如智能化闪存技术等来解决持续吞吐能力以及数据延迟性 (高速缓存) 问题。在解决大数据存储容量同时, 还要处理好历史数据存储、技术衔接与应用。官方数据的定式存储性与大数据这种能力存在一定差距。
(四) 数据安全性问题
繁杂的大数据以其不可思议的速度和强度在网络中运动, 数据各种结构层出不穷, 各种数据安全标准和保密性要求层次不同, 在高度透明且平等的网络手段运行中, 统计数据采集、处理以及公布的程式命令, 受到致命的挑战, 安全识别与隐私、保密性的兼容和设防控制技术, 超越了目前官方《统计法》规定相关界定。安全与隐私、保密与网络的透明是当前和今后面临数据处理重大命题。
(五) 数据成本与灵敏度问题
无论是官方统计还是大数据使用者, 在日趋发展的IT业中掌握信息、获取洞察、挖掘决策等需要对等的技术平台支持, 不管是采用Hadoop系统、流计算、数据仓库和信息整合与治理等都需要与之相适应的的硬件和软件成本投入, 有投入才有数据资本的产出。同时, 在技术的选择中, 还要剔除数据重复、破损、漏洞、衍生码等, 这就要求技术的兼容性与灵敏度要更高, 无论是数据迁移、替换、衔接、集合划分、计算识别等, 都有其操作的具体性与灵敏性问题。这同样增加了数据的产出成本。官方统计与其相比承载度欠缺。
六、官方统计与大数据行为对比
政府部门可以从传感器、卫星、社交媒体、移动通信、电子邮件、无线射频识别设备和企业应用程序等持续不断地接收数据, 并设法管理数据。因此, 政府面临的挑战是:捕集、摄取、分析、存储、分配和数据安全, 并将其转化为有意义、有价值的信息。官方统计作为数据收集、加工、发布的权威部门, 受大数据公布形式、速度、形态以及受众深度 (社会效果) 和广度 (覆盖范围) 等影响较大。从目前看:
(一) 数据工作流程
官方统计是从报表设计—报表布置—报表受理—数值采集—数值加工—录入汇总—审核 (复核) —上报 (或报批) —公布 (或分析) (即从政府需求—客户供给—政府运用—宏观管理—服务客户) 。大数据将产生于行业、产业或者某一专业领域的每一客户 (或企业) 等繁杂多样的数据集合, 只需采用必要的技术分类或者技术移转等手段, 满足行业、产业、企业等所需要的数据资料, 从顾客需求—客户供给—客户挖掘—客户提升。这个流程给官方统计改革具有重大参考价值。同时, 使统计调查 (普查、专项调查、抽样调查等) 方式和数据采集途径发生质的根本变化, 调查的设计将建立在大数据技术和后台软件支撑的基础上, 通过逻辑清洗、技术验证、层次归类等提炼统计数据和数据价值的分享 (数据扬弃与拿来) 。特别是推进第一产业统计调查和农村住户调查方式的变革, 催生住户记账、市场交易等技术改革。
(二) 基础工作管理
依据《统计法》可知, 官方统计基础工作是统计报表综合管理部门和填报单位, 为满足统计调查、加工整理、分析和数据质量评估需要建立的原始记录、台账、资料管理与公布, 以及所从事此项工作的机构、人力、物力、财力、法律法规执行等正常保障, 且统计基础管理所需投入和基本保障成本随着业务量的增加在不断快速扩大。大数据则借助数据共享机制和数据源集聚平台或大数据处理技术对行业或者领域等数据加以管理与挖掘、分析, 提出再造数据价值, 推进数据源企业或行业持续发展。这一目的和官方统计的最终目的具有同一性, 同样具有将数据转化为无形资本, 转化成市场自发调解产业分布方向, 转成企业搏击市场的竞争利器, 也是淘汰落后企业的残酷手段。大数据服务功能和目的与官方统计数据具有高度融合性和一致性, 但在管理模式和途径上, 具有完全不同的风格和模式, 这也是官方统计可以利用和融合的平台。
(三) 数据管理平台
“如果无法测量, 那么你就无法管理”。官方统计管理平台是在政府行为下建立的从PC终端逐级加工录入网络报送系统构成的, 结构式和半结构为主的计算中心交互平台。即使国家统计局建立的超级联网直报系统, 也回避不了企业层级审核。这种模式是企业只报不反馈。信息是不对称报送系统, 并不是完全的数据管理应用平台, 企业本身没有直接享受到报送数据所馈赠的数据信息、反馈回报或者提出企业改进或推动企业发展的数据价值效应。大数据平台建设, 却以市场机制为先导, 弥补了官方统计的缺陷, 带给企业数据价值的直接分享。
(四) 数据采集设计
当前, 统计数据来源主要是依据《统计法》和统计行业分类标准, 按照既定设计好的统计报表, 逐级定期报送或者周期普查或者根据需要开展专项调查所得, 是一种较为规范的数值采集方式, 有明确的报送性质、目的、指标内容、填报方法、计算方法、逻辑关系、时间点界定等, 严格按照统计报表制度规范填报数值, 但不涵盖填报对象所有的数据, 只是与统计需求相关的数值。大数据除在数据管理中提到企业或者产业活动单位自主行为外, 更多的是数据源的繁杂性、快速性、关联性、隐性、安全性、技术性等, 大数据相对统计数值更加全面和非结构化, 而统计数值最终要走向半结构和非结构化来阐明和体现统计结果与成效。大数据这种来源与归属具有发散性和统一性, “把技术带给数据, 不是把数据送给技术”, 这种方式针对性强、灵活性和效益性更好, 也是官方统计值得借鉴和分享融合的平台。
(五) 数据价值描述
行业市场的大数据价值密度值是最高的, 经过浅度处理便可以产生巨大的价值。而官方统计采集的是标准式数值, 是一个规定模式下的经济社会价值量的描述, 隐形体现或者折射经济社会发展成果进程状况, 反映的是一个历史性的某时期的较为宏观层面上的生产生活发展状况。成果主要以结构化和半结构化形态出现, 结果的视觉感、感悟性、灵敏度、受众深度等较为欠缺。从这一层次看, 官方统计挖掘技术的延伸必将走向大数据技术应用化。
(六) 数据处理业务
按照现有的统计方法制度, 统计数据的处理是以结构式报表形式, 按照国家统计局设计的指标体系和方法制度, 通过PC机处理系统, 分行业分专业和统一口径, 进行分级汇总加工上报评估认定, 并依法公布和展示的主要处理方式来开展统计业务。在大数据环境下, 由于微观数据的细分和共享, 数据的供给、需求以及存在方式发生了根本性变化, 社会提供共享数据成为数据处理公司生存法则, 大量有价值的数据资源在IT技术的支撑下, 得到社会和政府的认可和应用。现有的数据资源和存储方式可以成为统计业务分享和采集的途径, 催生统计采集渠道和处理流程与数据转换发生关键技术性变革。共享利用、处理清洗、筛选加工、转化成统计数据资源成为当前和今后官方统计数据处理方向。
七、官方统计直面大数据
在现实生产生活过程中数据量急速膨胀, 新信息要么是未曾扑捉或未曾有过, 如何及时有效地捕捉有真知灼见的新价值信息, 对庞大的网络和现实数据进行科学管理、分享和转化、建模挖掘等从中提取新的深刻见解, 为当前和今后官方统计介入和分享大数据, 推进统计技术革命提供了难得的机遇和动力。当前, 官方统计面临的任务和工作挑战日益加剧, 可利用的数据激增, 历史与现实数据和技术应接不暇难以应对, 官方统计面临的问题包括:如何收集、加工、管理控制和利用所有瞬息万变的大量新数据?如何提高行业间既独立又综合关联的信息集合?如何通过详实掌握数据来源, 并回溯至经过验证的可信数据源以提高数据质量, 分享挖掘成果?哪些现有和未来先进的可视化技术、工具和格式可用于表达信息, 从而实现快速分析, 并提出新的深刻见解?这些都是官方统计应该面对和正视的现实困境, 将决定和改变官方统计业务和整个数据生态系统中收集、分析、管理、存储及分配数据的方式。目前, 如物联网、淘宝网、支付宝、手机移动平台、数据终端采集等先进的IT技术工具正在不断创新发展, 与人们息息相关的银行借贷卡、医保卡、公交一卡通、购电卡、购气卡、税务联网报税、远程教育等数据在技术的支撑下得到有效发挥和应用。纷繁复杂的生产生活中数据与技术、技术与数据构成的大数据现象令人吃惊, 同时令数据管理者振奋与困惑。驾驭大数据, 在官方统计和全球经济中创造价值, 其影响广泛而深远。这为我国官方统计借助和利用大数据技术平台, 创新中国模式的统计运作方法, 加快统计改革与创新, 不断提高数据统领和管理能力提供参考和依据, 让数据真正成为政府的参谋助手。
八、对中国统计改革的思考
(一) 建立融合大数据的统计运行平台
大数据统计建设是一项有序的、动态的、可持续发展的系统工程, 必须建立良好的运行机制, 以促进建设过程中各个环节的正规有序, 实现统合, 搞好顶层设计。
1. 建立适应和拓展的大数据关键技术平台。
以数据存储、云计算、并行数据挖掘技术、隐私保护技术、数据挖掘集成、数据仓库等为基本技术设施, 建立适合官方统计与大数据衔接的数据技术支撑体系, 整合大数据技术转化成官方统计技术。无论是自主研发、共同开发还是借助现有的技术设备改进, 还是充分利用社会技术, 采取技术租赁、技术嫁接、技术联姻等方式, 积极推进中国统计制度重溯和方法再造, 吸纳和利用社会数据资源和技术, 建立依法可信的官方统计社会资源认定体系, 实现通过技术清洗和筛选后的社会数据为统计所用和服务, 以达到官商共赢, 使大数据转化为有价值的统计数据资料。积极推进大数据服务官方统计、官方统计数据与大数据相互转化与分享技术平台建设, 建设具有中国先进技术模式的大数据与官方统计共同发展技术平台。同时, 建立高度透明的大数据资源管理规范、技术准则、清洗规则、逻辑框架等大数据利用办法, 以提升大数据在官方统计的利用水平、利用质量和利用强度。
2. 优化统计内部机构设置。
按照大数据运行模式和要求, 在现有的运行机制和模式基础上, 从数据流程着手, 以成果效应或者效果为重点和归属, 以大数据融入和数据技术转化应用为载体, 以行业分类为基础, 积极探索大数据模式下, 内部机构职能的设计和划分, 拓展数据采集渠道和方式, 满足大数据服务官方统计整合需要。
3. 建立配套的政学体系。
建立和完善确保大数据统计技术运行平台正常运转和发展的政策体系, 使大数据技术与数据采集、处理、挖掘、成果展示与分享的工作有法可依, 有章可循。同时, 明确每个技术流程操作规范与监督, 建立和完善技术指导性手册。
4. 积极探索大数据统计运作模式下。
国家统计局地方调查队与全国各地区统计局在业务形态、工作分工、职能优化、资源整合、功能定位等方面改革或调整, 建立更加科学合理的中国统计管理运行新模式。
(二) 建立规范的数据生态环境标准
没有标准就没有系统。应建立面向不同主题、覆盖各个领域、不断动态更新的大数据统计生态环境建设标准, 为实现各级各类信息系统的网络互连、信息互通、资源共享奠定基础。
1. 方法制度是统计工作的依据和标准。
积极探索和创新符合大数据统计需求的统计工作制度和数据运行的方法制度。工作制度要跟进大数据统计运行流程与操作规程。方法制度要符合大数据统计采集、清洗、加工整合、数据验证、挖掘分析、成果展示要求, 在准确度、时效、灵活度等方面允许一定的弹性空间, 力争短时间内与大数据模式和社会需求衔接。
2. 技术标准是做好大数据统计的关键。
(1) 要积极探索和创新研发适合与跟进大数据结构化、半结构化甚至非结构化数据聚集整合, 以及衔接转换与转化的软件技术标准;
(2) 建立国家大数据中心与各地区分级匹配的硬件设施保障体系与标准;
(3) 改进和优化现有数据终端采集系统, 特别是农村住户调查以及零散的调查客户 (对象) 的数据采集终端, 改革传统的结构化报送程式, 逐步向结构化与半结构化、非结构化相结合的综合报送方式过渡, 提升数据规范, 增强数据全面性、自我验证性、准确性;
(4) 改进和优化政府行政记录数据采集传输方式, 解决数据终端分享与隐私、安全保密技术。
3. 搭建坚实的数据共享平台。
数据只有不断流动和充分共享, 才有生命力。应在各专业数据库建设基础上, 通过数据集成, 实现各级各类指挥信息系统的数据交换和数据共享, 特别是数据元单位的数据成果分享。使数据在服务国家和部门的同时, 更加贴近和融入全社会、企业, 把为微观群体、实体经济服务作为最终目标和质量提升, 从而真正实现和体现大数据统计为人民服务的宗旨。
(三) 改革统计数据专业化管理
一是专注于数据信息查找、访问和使用关键业务信息的能力。二是获得完整的认识。充分了解数据信息并承认并非所有的信息都是同等重要的。三是保证数据信息的有效性。使用重复数据删除和归档技术来保护更重要的数据信息, 同时存储更少的数据信息。四是设置一致的政策。这是必须基本一致的政策数据信息, 即无论数据信息存储在何处, 无论其是在物理环境、虚拟环境或云环境中, 都必须强制执行一贯政策。统一数据信息分类, 自动发现拥有数据信息的部门和使用的具体信息, 访问控制和分配, 自动信息保留和删除, 并加速电子发现的过程。同时要易于数据的整合与集中, 包括现有的IT环境和接合;易于扩展与伸缩, 适应未来巨大变化需求;易于管理与维护, 包括现有的异构环境;具备极大的可靠性、可控性、安全性;能够降低总体拥有成本, 不仅是软硬件, 还有管理、电力、人力等。
(四) 改革数据挖掘途径与方法
数据来源于经济社会, 最终服务还是经济社会, 挖掘成果对经济社会有价值的数据才是统计工作存在的价值。可见数据的大小多少并不是关键, “大数据”对不需要的用户一文不值。目前, 国内数据挖掘应用仍停留在数值分析与图表描述的初级阶段, 更何况行业、企业大规模的运用数据挖掘技术尚需时日。数据挖掘是数据库研究、开发和应用最活跃的一个分支, 是多学科的交叉领域, 它涉及数据仓库技术、人工智能、机器学习、神经网络、模式识别、知识库系统、高性能计算、数据可视化等多方面知识。利用这些技术与手段来处理和挖掘数据, 目前常见的挖掘研究路径有:一是统计上常用的“假设检验”, 通过“假设—数据—验证”的过程来体现数据挖掘成效。二是数据库知识发现, 这也是目前计算机科学不断运用与探索新的挖掘技术的路径。就是利用人们预先设计好的计算机编程来观察数据, 主要借助数据可视化工具或者计算机分析数据中各个因子相互之间的相关程度等方式, 这个“数据—结论”的路径较为直接。虽然这一路径受到技术的限制, 但这种路径会随着计算技术和程序的创新和发展在不断的提高挖掘水平和深度。数据挖掘的主要任务有数据汇总、概念描述、分类、聚类、相关性分析、偏差分析、建模等。数据挖掘的过程可表述为:业务理解 (发现问题—确定客户目标、资源评估、挖掘目标、挖掘计划等) ;数据理解 (确定挖掘的数据、数据描述、数据探索、数据质量甄别等) ;数据准备 (选择数据、清洗数据、数据重建、格式调整等) ;建立模型 (模型评价、挖掘模型选择、建立模型) ;模型评估 (结果评估、步骤评估、计划执行与调整等) ;成果展示 (展示成果、模型监测和维护、模型更新) 。
(五) 培养高素质的专业队伍
大数据建设的每个环节都需要依靠专业人员完成。因此, 一是必须培养和造就一支懂指挥、懂技术、懂管理的大数据统计建设专业队伍;二是逐步建立和培养大数据统计挖掘和具备深度洞察力的专业调查分析人才队伍;三是积极调动和聚合利用全社会调查咨询机构, 延伸大数据统计人才整合和社会人才队伍建设, 以及推进社会建立健全调查咨询管理框架和统计咨询社会体系建设与管理;四是在条件成熟的情况下, 适度调整和聚合国家调查队和各地区统计局专业人才队伍的整合管理与使用。
摘要:“大数据”生产和使用的社会化, 直接挑战当前官方统计生产和使用以及数据生态环境和运行模式。本文通过对官方统计与大数据现象、表现形式及特点、数据流程、数据使用、数据挖掘、数据技术、数据行为等对比分析, 对中国统计如何正确面对和正视“大数据”现象对官方统计的影响进行思考, 从统计运行平台、生态环境标准、专业化管理、挖掘途径与方法、人才队伍、问题解决等方面提出建议。
关键词:大数据现象,官方统计,分析与思考
参考文献
[1]涂子沛.大数据[M].广州:广州师范大学出版社.
[2]朱志军, 闫蕾, 等.大数据——大价值、大机遇、大变革[M].电子工业出版社, 2012.
[3]郭晓科.大数据[M].北京:清华大学出版社.
[4]大数据:下一个创新、竞争和生产力的前沿[J].赛迪译丛, 2012 (25) .
[5]赛迪顾问股份有限公司.大数据产业生态战略研究2012.
统计与概率高考试题分析 篇9
摘要:统计的主要考点有:抽样方法、频率分布直方图、茎叶图、样本的数字特征、线性回归分析、独立性检验的思想方法等.概率主要考查:概率的概念和性质、古典概型和几何概型、互斥事件的概率等.考查以基本概念和基本运算为主, 多为一道客观题和一道解答题, 一般地, 客观题难度不大, 易于得分, 解答题多以古典概型为主, 而且常常与统计知识进行综合.结合最新高考试题来看看这部分内容在高考中是如何考查的。
关键词:高中数学,统计与概率,高考
统计与概率问题在日常生活中随处可见, 与我们的衣、食、住、行密切相关, 是同学们学以致用的重要体现. 因此, 在历年各地高考中备受命题者的青睐, 其新颖的背景也形成了高考试题中一道道亮丽的风景线. 统计的主要考点有: 抽样方法、频率分布直方图、茎叶图、样本的数字特征、线性回归分析、独立性检验的思想方法等. 概率主要考查: 概率的概念和性质、古典概型和几何概型、互斥事件的概率等. 考查以基本概念和基本运算为主, 多为一道客观题和一道解答题, 一般地, 客观题难度不大, 易于得分, 解答题多以古典概型为主, 而且常常与统计知识进行综合. 下面我们结合最新高考试题来看看这部分内容在高考中是如何考查的.
图书馆统计数据的处理与分析 篇10
关键词:图书馆,统计,数据处理,数据分析
图书馆日常活动中, 不断地产生着大量的数据。这些数据是掌握图书馆工作状况, 了解图书馆动态发展的主要依据。对这些数据进行处理分析对于提高图书馆管理与服务水平具有重要的意义。
1 图书馆统计数据的种类及主要特征
图书馆统计数据按照统计内容可以分为馆藏统计数据、读者统计数据、服务统计数据、内业工作统计数据。
馆藏统计数据。包括馆藏文献信息的类型、品种、数量、质量及金额等。
读者统计数据。包括本馆读者的数量及其构成。
服务统计数据。包括馆藏文献流通数量、阅览数量以及各种专项服务数量, 如检索咨询数量、科技查新数量、专题服务数量、图书馆局域服务数量等。
内业工作统计数据。包括采访工作数量、编目工作数量、业务经费数量及其使用情况、设备的数量、能力及利用情况等。
按照统计范围划分, 又可分为总量统计数据与分量统计数据。总量统计数据反映的是统计对象总体情况, 如馆藏总数, 读者总数, 文献流通量总数等等。分量统计数据反映的是某一统计对象中不同类型、类别的情况。如馆藏中不同类型文献的数量, 同一类型文献中不同类别文献的数量, 读者中不同层次读者群的数量结构等等。
图书馆统计数据是在图书馆日常活动中产生的, 具有明显的动态性特征, 它往往同时反映着藏书、读者、馆员等多方面的关系。如图书流通量, 既能够反映出馆藏被利用的情况, 也能够反映读者对图书的需求特点, 还能够反映出馆员的工作数量。因此相关性、动态性是图书馆统计数据的主要特征。而真实性、准确性则是对图书馆统计数据的基本要求。
2 目前图书馆统计数据处理与分析中存在的主要问题
随着现代信息技术的飞速发展, 几乎所有的图书馆都采用图书馆自动化系统进行管理。虽然各图书馆使用的自动化系统不尽相同, 但都或多或少的提供了统计功能, 从而使大量繁琐、纷杂的数据统计变得简单、快捷, 图书馆的统计工作不断得到加强。尽管如此, 在图书馆统计工作中还存在一些问题主要表现在以下几个方面。
(1) 许多图书馆领导不重视统计工作, 所收集到的数据只是作为年终总结和给上级部门填写报表的依据, 对所获取的统计数据很少进行综合性、动态性分析, 甚至有些数据失真。
(2) 目前绝大部分图书馆自动化系统都是采用“列举法”设计统计功能的, 往往预先设置的数据统计在事后只能满足部分业务的需要, 在数据的处理上仍处于简单的积累, 即只具有将各时段统计数据收集建库的功能, 并不能对这些数据进行分析比较研究, 缺少可扩展任意指令统计以及报表、图示等功能, 不能形成对图书馆业务发展和决策所需的分析性统计结果。
(3) 相当一部分图书馆管理人员不能熟练应用统计数据处理与分析的基本方法, 不能从多角度、多层次、多途径对所获取的数据进行处理与分析, 在图书馆规章中要求建立对统计数据进行分析与处理报告制度的很少。
针对目前图书馆统计工作中存在的问题, 笔者认为除了图书馆领导应重视加强统计工作、充分利用图书馆自动化系统的统计功能外, 掌握图书馆统计数据处理与分析的基本方法, 对于充分发挥图书馆统计在管理中的作用具有重要的现实意义。
3 对图书馆统计数据进行处理与分析的基本方法
统计分析方法主要包括描述统计与推断统计。描述统计是对原始数据进行处理, 针对数据的特点进行分析, 得出结论。推断统计是通过数据样本特征推论出总体特征, 并做出预测、检验假设。在此, 仅对应用描述统计对图书馆数据进行处理与分析的基本方法归纳如下。
3.1 列表
列表法是汇总各种统计数据的一种基本的直观方法。根据统计表产生的时间, 可分为调查统计表和计算分析统计表。前者一般用来填写与记录原始统计资料;后者则多为对数据统计分析过程中的分析计算用表。
按照统计表的内容特征, 可分为普通表、分组表和组合表三种。
普通统计表是从数量上说明总体内各个单元特征的一张清单, 主要用于原始数据的记录、统计资料的整理和作为数据转化为和运算的记录表格。
分组表是按某一特征对总体单位进行分组而编制的分组数据记录表。如图书馆馆藏分类统计表, 不同类型读者图书借阅数量统计表等等。
组合表是按照两个或两个以上特征对总体单位进行分组而编制的分组记录表格。它既可用作运算表, 也可以表示统计资料整理的结果。如不同类型读者借阅不同类别图书统计表, 图书馆文献资源建设情况统计表等等。
3.2 图示
对图书馆数据处理用图示的方法, 可以使有些统计数据更为直观。常用的图示方法有柱形图、分布多边型图、累计分布曲线图、饼形图。运用计算机作图, 只要掌握方法, 将有关数据输入, 就可极为简便准确地做出根据需要所选择的图形。
3.3 计量指标体系
为了说明图书馆工作中发生和发展的各种现象及过程, 图书馆统计工作中常常需要拟订以计划指标体系为基础的相互关联的数量化统计指标体系, 以便通过指标体系的数量方面来反映图书馆工作的全过程。如藏书利用率、书刊流通率、藏书保障率、读者到馆率等等。一个完整的量化指标一般包括名称、目的、范围、定义、计算方法、解释、出处等。不同的量化指标按照其对象又可组成不同的指标体系, 如图书馆文献资源建设指标体系、读者服务指标体系、自动化建设指标体系等。根据图书馆计量统计指标体系要求对数据进行收集、处理与分析是图书馆统计工作的基本内容, 也是评价图书馆业务工作的基本方法。
3.4 统计数据分析报告
根据统计结果撰写分析报告是对图书馆数据处理与分析的最后一个环节, 也是最重要的环节。无论是按照列表、图示的方法, 还是按照一定的计量指标体系的要求对图书馆统计数据进行处理, 得到的往往只是表象, 更为深层的结论只能通过分析才能得出。
图书馆统计数据分析报告一般包括以下几个部分: (1) 总的介绍:说明本次数据分析报告的对象、范围、目的、意义; (2) 数据说明:解释数据的来源、获取的程序和方法; (3) 数据处理:按照一定的要求用列表或图示的方法把数据表达出来, 按照有关指标对数据进行计算; (4) 数据分析:对统计数据处理结果进行研究、分析, 对显现或隐含的问题进行讨论; (5) 结论:总结研究、讨论、分析后形成的结果; (6) 意见或建议:根据结论对提高或改进图书馆工作提出意见或建议。
总之, 只要我们掌握方法, 及时对图书馆统计数据进行处理与分析, 就能充分发挥统计数据在改进和提高图书馆工作中的作用。
参考文献
“统计与概率”中常见的错误分析 篇11
一、 不注重统计与概率的实际意义
1. (2014·内蒙古呼和浩特)以下问题,不适合用全面调查的是( ).
A. 旅客上飞机前的安检
B. 学校招聘教师,对应聘人员的面试
C. 了解全校学生的课外读书时间
D. 了解一批灯泡的使用寿命
【错解】A、C.
【分析】旅客上飞机前的安检,意义重大,宜用全面调查,故此选项错误;学校招聘教师,对应聘人员面试必须全面调查,故此选项错误;了解全校同学课外读书时间,数量不大,宜用全面调查,故此选项错误;了解一批灯泡的使用寿命,具有破坏性,工作量大,不适合全面调查,故D选项正确.
【点评】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考察的对象的特征灵活选用,一般来说,对于具有破坏性的调查,无法进行普查、普查的意义或价值不大时,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.
二、 基本概念理解不深刻导致概念性错误
2. (2013·云南昆明)为了了解2013年昆明市九年级学生学业水平考试的数学成绩,从中随机抽取了1 000名学生的数学成绩. 下列说法正确的是( ).
A. 2013年昆明市九年级学生是总体
B. 每一名九年级学生是个体
C. 1 000名九年级学生是总体的一个样本
D. 样本容量是1 000
【错解】B、C.
【分析】2013年昆明市九年级学生的数学成绩是总体,原说法错误,故本选项错误;每一名九年级学生的数学成绩是个体,原说法错误,故本选项错误;1 000名九年级学生的数学成绩是总体的一个样本,原说法错误,故本选项错误;样本容量是1 000,该说法正确,故本选项正确.
【点评】本题考查了总体、个体、样本、样本容量的知识,解题要分清具体问题中的总体、个体与样本,关键是明确考察的对象. 总体、个体与样本的考察对象是相同的,所不同的是范围的大小. 样本容量是样本中包含的个体的数目,不能带单位.
三、 基本方法理解不深刻导致过程性错误
3. (2014·山东临沂)某中学随机抽查了50名学生,了解他们一周的课外阅读时间,结果如下表所示:
【点评】此题主要考查了几何概率、三角形内切圆的性质以及等边三角形的性质等知识,求出等边三角形的高与内切圆的半径是解题关键.
“统计与概率”中常见的错误分析 篇12
一、不注重统计与概率的实际意义
1.(2014·内蒙古呼和浩特)以下问题,不适合用全面调查的是().
A. 旅客上飞机前的安检
B. 学校招聘教师,对应聘人员的面试
C. 了解全校学生的课外读书时间
D. 了解一批灯泡的使用寿命
【错解】A、C.
【分析】旅客上飞机前的安检,意义重大,宜用全面调查,故此选项错误;学校招聘教师,对应聘人员面试必须全面调查,故此选项错误;了解全校同学课外读书时间,数量不大,宜用全面调查,故此选项错误;了解一批灯泡的使用寿命,具有破坏性,工作量大,不适合全面调查,故D选项正确.
【点评】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考察的对象的特征灵活选用,一般来说,对于具有破坏性的调查,无法进行普查、普查的意义或价值不大时,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.
二、基本概念理解不深刻导致概念性错误
2.(2013·云南昆明)为了了解2013年昆明市九年级学生学业水平考试的数学成绩,从中随机抽取了1 000名学生的数学成绩. 下列说法正确的是().
A. 2013年昆明市九年级学生是总体
B. 每一名九年级学生是个体
C. 1 000名九年级学生是总体的一个样本
D. 样本容量是1 000
【错解】B、C.
【分析】2013年昆明市九年级学生的数学成绩是总体,原说法错误,故本选项错误;每一名九年级学生的数学成绩是个体,原说法错误,故本选项错误;1 000名九年级学生的数学成绩是总体的一个样本,原说法错误,故本选项错误;样本容量是1 000,该说法正确,故本选项正确.
【点评】本题考查了总体、个体、样本、样本容量的知识,解题要分清具体问题中的总体、个体与样本,关键是明确考察的对象. 总体、个体与样本的考察对象是相同的,所不同的是范围的大小. 样本容量是样本中包含的个体的数目,不能带单位.
三、基本方法理解不深刻导致过程性错误
3.(2014·山东临沂)某中学随机抽查了50名学生,了解他们一周的课外阅读时间,结果如下表所示:
则这50名学生一周的平均课外阅读时间是 ______ 小时.
【常见错误】求4,5,6,7这四个数的平均数,对平均数的理解不正确.
【分析】
【点评】此题考查了加权平均数在实际生活中的应用,根据题意分析出本题应选用加权平均数而非算术平均数.
四、数学思想、数学方法运用不灵活导致错误
4. (2014·湖北黄石)一般地,如果在一次实验中,结果落在区域D中每一个点都是等可能的,用A表示“实验结果落在D中的某个小区域M中”这个事件,那么事件A发生的概率PA=M/D. 如图1,现在等边△ABC内射入一个点,则该点落在△ABC内切圆中的概率是 ______.
【常见错误】因对几何概率认识不够深刻而无从下手,或在计算面积的过程中不够熟练导致错误.
【分析】利用等边三角形及其内切圆的性质以及锐角三角函数关系得出DO,DC的长,进而得出△ABC的高,再利用圆以及三角形面积公式求出即可.
【数据分析与统计】推荐阅读:
数据统计与分析演讲稿05-17
认真回顾《小学数学“统计与数据分析观念”的教学研究与案例评析》《统计》哪个情境的设计给你的启发最大?09-27
商务统计数据分析论文07-07
统计数据质量问题分析07-11
统计数据质量提高分析11-12
统计数据分析报告07-01
旅游统计数据分析计划07-30
商场数据统计分析系统12-02
统计数据分析求职信07-26