数据统计资料

2024-10-19

数据统计资料(共8篇)

数据统计资料 篇1

如何收集数据分析资料数据

(一)发表于 2012-12-13 00:47 来源:本站原创

不论是竞争对手分析还是商业情报竞争,都需要收集各种各样的资料,来满足分析的需求。资料的收集随着目标推进而不段迭代的过程,假如某公司要推某国战类型的游戏,抢占媒体档期、第一时间吸引目标用户,而某公司又知道其竞争对手之一也要推同类型风格的游戏,于是判定竞争对手游戏公测时间成了该公司的一个数据需求,于是有了如下图这样一个不断跟进的过程:

前面一篇《如何界定你的竞争对手》中也多次提到一些资料的概念,那么这些资料的分类如何,我们如何去收集?我相信做过数据分析相关工作的人都能随随便便说出好些条,但要系统的说出一些资料来源有些难,今天小编就和大家来理一理一手资料和二手资料的来源途径,当然有时候一手资料和二手资料的来源相同,而判定一手资料和二手资料主要取决于最初收集资料的时间。一手资料来源

1.销售人员与顾客用户 通常企业内认为最没有被充分利用的资料来源是销售人员,他们常年累月与顾客接触,可以非常了解竞争对手最近的一些信息,也可以发挥类似于市场调研人员的作用和顾客用户交流沟通。2.企业员工

企业每个员工都对其负责领域的产品市场有所了解,从不同的角度出发,集思广益之后都能得到一些有价值的竞争信息。3.上游厂商

传统意义上的供应商以及互联网行业相关的带宽提供商,企业都可以通过相关途径找到相关有用信息,比如一些包装纸箱生产厂商都会在其包装上表示生产厂家和地址等装运信息,通过对包装厂商的信息可以进一步推断竞争对手的销售情况;对于相关互联网企业而言,广告站点投放观察、网站流量查询等都可视为此途径。4.第3方调查咨询公司

这里所说的基本上是指第三方咨询公司与企业进行的合作调研项目,比如很多网游公司在游戏推广前就会找调研公司合作招募一些样本做问卷调查或是样本在线跟踪服务。5.投资银行

投行的分析师每年都会对行业内的企业或产品进行大量的研究分析,这些以大量二手资料以及投行分析观点构成的投行研究报告也是一个很好的资料来源。二手资料来源

1、企业内容资料

企业过去的营销计划以及争对竞争对手收集的的历史数据等,都是很好的资料来源,特别是互联网企业,内网空间的资料共享更是为资料的查找提供了便利性。

2、地方报纸

很多地方报纸都会对本地区做的好的企业做相关报道,关注查阅当地报纸或许是个不错的方式,在互联网时代,很到地方报纸都有其网络版,还有梅花网这样的企业会专门采集一些地方报纸数据,供其用户使用。

3、企业财报

企业财报这一来源通常只对上市企业有效,很多投资咨询公司都会对财报进行研究分析,比如邓白氏的《商业资信报告》,i美股的企业研究报告等。

4、招股书

这一途径同样只争对特定的企业,不知大家对唯品会的招股书是否还记忆犹新,正因为他的招股书,让大家了解到了他的用户数、订单数以及超级高的重购率。

5、专利和商标资料 专利和商标资料通常可以帮助我们了解相关产品或技术方面的信息,或许大家有关注或了解最近闹的不可开交的三星与苹果专利官司,还有谷歌为了专利而收购MOTO手机的事例,在我国,专利情况可在国家知识产权局官网上查询。

6、一般商业出版物和行业出版物

很多杂志都会根据自己的调查出一些参考数据,譬如早在2001年美国著名的杂志《产业标准》就出了互联网相关的100个数据,披露了互联网相关的人数、金融、广告、发展规模、电子商务等数据。当然,每个行业都有自己的杂志,比如现在比较热的电商行业相关的杂志就有《互联网周刊》、《财经》、《天下网商》、《卖家刊》等,当然大家也可以关注@数据分析 在微博上整理的非商业性文件《电商视野周刊》。

7、新闻报道

企业公关通常会向媒体披露一些企业信息,或是新品发布,或是高层人事变动等,通过点滴的信息积累或许就能发现很多有价值的资料。互联网相关的新闻报道大家可以看几大门户的科技频道以及Techweb等站点。

8、促销宣传资料

这种途径在传统行业使用较多,通常其促销宣传册上都会对产品特点以及价格等做详细说明,如果你关注过银行或保险行业的一些宣传资料,你还会发现他们的宣传资料做得跟数据分析报告一样。

9、咨询公司数据报告

咨询公司数据报告通常是我们最先想到的。艾瑞、尼尔森、易观国际、DCCI等的咨询公司每年都会出大量的互联网相关的行业或专题报告,通过简版免费完整版收费的方式供大家查阅。

10、员工沟通

企业博客或企业内刊、同事间的交流也能在不经意间获得很多的有用信息,对于外部,天涯爆料、人人发帖、微博、博客爆料等,至今我都不知道有多少企业内幕消息以这样的方式被爆出来。

11、行业协会

很多成熟的行业都会有政府牵头,成立相关行业协会。行业协会某种程度上讲发挥了部分政府职能,协会常常会组织行业内的企业开会探讨,会请业内知名企业宣讲其对行业的发展看法及其企业成功的经验介绍,此外,有的行业协会还会组织一些市场调研活动,对行业摸底。

12、政府来源

说的政府资料来源,或许大家首先想到的是统计局。尽管大家对他提供的数据是各种质疑,但在并不是排除他作为二手资料来源途径的理由,此外,譬如新闻出版总署分管着游戏出版版号的批复,游戏企业常常在那里了解最新的竞争对手动态。此外,还会提供一些行业数据出版数据,譬如:新闻出版总署最近公布的《2011年全国新闻出版行业基本概况》数据显示,截至2011年年底,全国共有出版社580家(包括副牌社33家),其中,中央级出版社220家(包括副牌社13家),地方出版社360家(包括副牌社20家)。

13、电子数据服务

这种网络或电子数据库提供的二手资料有点类似于论文期刊资料检索库,国内的电子数据服务本人最常使用的应该是百度统计数据搜索(tjsj.baidu.com),而国外的一些电子数据服务数据库则要全的多,比如标准普尔公司、DIALOG公司、邓白氏公司等。

14、网络

前面提到的很多来源都与网络有关,当你需要寻找某个公司的产品信息时,你第一时间想到的或许就是利用谷歌或者百度去搜一下,从产品官网或其他人的介绍中去进一步的了解产品信息。

当然,除了上面介绍的这些渠道外,还有很多其他的渠道,比如招聘信息、行业峰会、产品展会、企业参观、核心人员消息刺探等等,简单的说,一切与产品或企业相关的媒介、人都可能成为你的信息资料来源。前面说了这么多的资料来源途径,那么获取资料的手段有那些呢?请听下回分解。

如何收集数据分析资料数据(二)

发表于 2012-12-14 03:02 来源:本站原创

上篇《如何收集数据分析资料数据

(一)》主要讲述了数据分析资料收集的一些来源,知道那里有资料,并不等于资料就是你的,如何通过合理合法的手段去获取自己需要的资料则是本篇的主要内容。

谈到这个话题,很容易让人想到一个职业——“私家侦探”,从某种程度上讲,情报分析师和私家侦探的工作性质相似,传统行业有些手段和很多的电影情节相似,比如空中侦查,早在1984年Keebler公司因为雇佣飞机拍摄保洁厂房生产设备而被保洁起诉,又比如收集公司废弃杂物(办公垃圾、废旧设备等),2000年的时候某著名数据库软件商就因此道而被媒体曝光,还有发布招聘广告、挖角对手核心人员之类的手段等。本帖更多的则是从互联网的角度出发,讲述一些互联网资料获取手段。

1、使用竞争对手产品

通过使用竞争对手产品能发现对方很多产品以及运营上的小秘密,有人说,在互联网上没有秘密可言,的确如此,只要你保持对竞争对手的关注,什么产品特点、推广运营手段等都能了解得一清二楚。当然,比使用竞争对手产品更有效的方法是偷偷的成为对方的小股东,特别是对于上市公司而言,对手的重大策略以及相关资料信息都会主动推送到你手中。

2、社交媒体探密

通过RSS订阅、QQ群、微博、搜索引擎关键词订阅等手段可以实现对竞争对手主动或被动的了解,特别是在一些行业的QQ群中,很多群规定群名片为:公司-地区-昵称(或真名),有时候说者无心,听者有意,只要将信息稍作验证,便可知真伪,而QQ好友推荐、QQ圈子等产品的出现,更是大大提高了此法的便捷性;此外,微博也如此,小编映像中较深的两个案例,一个是@数据分析产品经理 根据刘强东微博的关注关系分析京东商城企业内部架构以及负责人,另一个则是@数据化管理 老师在其博客中提到的关于微博隐私泄漏的系列描述,很多人在毫无知觉的情况下就将企业的销售信息给泄漏了。

3、招聘信息、问卷调查之类的双刃剑

当你希望通过招聘广告吸收竞争对手员工同时,也暴露了你的市场产品目标;网络调查问卷也是如此,很多产品类的调查问卷题目就很明确的表达出了调查者未来可能考虑的市场策略意图,特别是一些满意度调查,调查的问题就是未来调整改进的方向,譬如下图所示的某电商网站的满意度调查,从题目可以推测未来他们的评价系统将做调整修改。

4、邮件试探

企业邮箱作为大家日常工作的重要工具,每逢节假日或出差,有的人总喜欢将邮箱设置为自动回复状态,譬如:”xx正在休假中,有事情找xx部门的xxx,他的电话是138xxx”,这样无意中就泄漏了相关信息,特别是有的企业喜欢将企业邮箱名称设置为ceo@xxx.com,所有成员收件设置为all@xxx.com之类更是容易中招。

5、“特定”公开渠道

这里的特定是指有某些平台厂商,比如淘宝上卖家交易产品、交易价格、用户评价、交易数量等这些都可以在淘宝卖家信息处获取,还有譬如竞争对手网站流量alexa大体查询,站长工具查询网站相关信息、百度指数查询推广做的如何,对于一些外贸类的站点还可以使用comscore、谷歌站点趋势查询、谷歌ad planner等,越是成绩好的产品资料越是容易被收集。此外,对于一些有特定资源的企业,了解其竞争对手某些状况则是易如反掌,比如苹果可以轻易的通过其系统获取其生态系统内的相关产品的所有数据情况,支付宝了解到相关商家的营收情况。当然,还有很多不是那么道德的方法,比如在市场上购买黑客泄漏的竞争对手数据库数据、高价挖墙角、在自家产品中装特定代码偷窥用户手机或电脑上的其他产品程序(目前移动互联网行业的普遍做法)等。总结

数据资料收集的办法有很多种,在收集的过程中最后不要穿越道德的底线,更不要去触犯用户隐私,在合理合法的正当途径下通过正当的手段去获取竞争对手数据资料信息。最后,还是用一张简单的思维导图完成对全文的总结。

数据统计资料 篇2

一、统计信息资料泄露概念

统计泄露是指统计部门在为社会提供的统计信息资料中, 不泄露任一单个个体 (如个人、企事业单位等) 的资料。这里有两层意思, 一层是统计泄露的问题, 另一层是控制方法的问题, 两者是密不可分的。

众所周知, 统计部门对外公布的资料, 基本上来说有两种, 即汇总 (综合) 资料和微观资料 (调查单位原始资料) 。事实上, 原始数据是汇总数据的原材料, 在计算机大规模使用以前, 实际上我们只把它用来汇总制表, 然后向社会提供汇总数据。现在, 由于计算机现代化技术的应用, 使原始数据的提供变成了现实, 我们也在不知不觉中以某种形式向社会提供了这方面的服务。由于原始数据泄露的危险性大大高于汇总数据, 所以, 人们对统计泄露控制的需求日益增加。

统计机构的目标是为社会提供丰富的统计资料, 在提高数据质量和详细程度的同时, 也增加了单个个体资料泄露的危险性。这种泄露当然不是统计产品本身的意图, 而是由于社会获取资料的权力与单个个体资料需要保密的权力之间的差距造成的。因此, 简单的说, 统计泄露控制的最大目标就是在有效的保护单个个体资料 (使人们认不出资料属于哪个个体) 的前提下, 为社会提供尽可能多的信息 (但不应损害数据的完整性、准确性和可用性)

二、目前统计信息资料泄露的现状

进入信息时代, 信息成为一项重要资产。以网络为载体, 以信息资产为核心的新经济革新了传统的资产运营模式。信息资产蕴涵的价值随着技术的进步不断得到提升。企业需要把信息看作一种战略资源, 将其作为资产要素进行有效监管, 其中包括了对信息本身、信息技术及设备、从事信息活动的组织和人员的有效管理。

目前, 个人信息泄露问题非常严重, 个人信息泄露危害无处不在。刚拿到新房钥匙就有人上门推销装修、保单刚要到期就有人向你推销保险、刚打完股票咨询电话众多股票公司的服务电话就蜂拥而至、刚从电视购物买了东西就有很多公司打来新产品的推销电话。包括姓名、职业、电话、家庭住址等在内的个人信息资料不经意就会被公然暴露在世人面前。一家门户网站曾做过一次有关个人信息泄露的调查, 结果显示, 90%的网友遭遇过个人信息泄露。现在更是出现了明码标价售卖个人信息的情况, 在某些网站只需输入搜索的人名, 就可以立即查到此人的信息, 甚至包括家庭电话、手机号码、工作单位、婚姻状况、犯罪记录、银行借贷记录、个人财产记录等个人重要信息。如“100元出售当地30万车主电话、地址等详细信息”、“孕产妇信息一元一条”之类的信息, 也频繁在网上出现。更为严重的是, 这些泄露出去的信息往往被犯罪分子利用。目前, 利用个人信息进行敲诈、诈骗的案件已成高发态势, 防不胜防。信息化在提高企业管理效率的同时, 也使企业同时承受着巨大的信息安全的风险。全球平均20秒就发生一次计算机病毒入侵;互联网上的防火墙约25%被攻破;窃取商业信息的事件平均以每月260%的速度增加;约70%的网络主管报告了因机密信息泄露而受损失。而病毒的泛滥, 更让国内众多企业蒙受了巨额的经济损失。因此, 加强信息安全建设, 已成为目前国内外企业迫在眉睫的大事。

三、统计信息资料泄露的危害

首先给犯罪分子以可乘之机, 我国社会的不断发展, 个人信息使用频率不断增加, 伴随着这种趋势, 个人信息受到侵犯的情况也已呈蔓延之势, 给人们的工作和生活带来了极大的影响。目前, 利用个人信息进行敲诈、诈骗的案件已成高发态势, 防不胜防。2012年10月31日江苏一起诈骗案, 5个月竟然拨打7000个电话, 骗了22名受害人。

其次造成公民对调查机构的信任危机, 作为一名统计人员, 我有切身体会, 2010年的人口普查, 按照上级统计要求必须进入每家每户, 取得填写个人资料, 然而当我们带着工作证挨家挨户去敲住户的门时, 遇到的各种状况, 让我终身难忘记, 有的不开门, 有的即使开门了也不给进屋, 甚至进屋后还冷着脸, 好像我们就是小偷, 就是来窃取他们的个人资料似的, 还有的说着难听的话, 这就是对我们公共调查机构产生了一种信任危机, 担心我们把取得的资料给他们泄露出去, 给他们带来骚扰、损失或伤害。

四、统计信息资料泄露的控制方法

1、对外发布时采取的保护措施

首先对原始资料的保护, 在对原始资料对外进行公布的时候, 要对原始资料进行必要的修改, 确保对外公布的安全性, 对原始数据的保护有以下几种方法a、隐名法。即在原始数据发布之前, 从文件中删除直接表识变量, 如姓名、地址、电话等。b、抽样法。由于是从普查对象中随机抽选的一个样本, 所以就无法确定某记录是否属于某个特定的个体。c、全局重编码。把原始数据资料中的变量按新的变量重新分组, 由于它包含的资料没有原始数据那么详细, 因而也起到了避免泄露数据的作用。d、局部隐藏。这种方法指导数据资料中的相关记录进行处理, 而不对全部记录进行替换, 这种方法实用任何变量。e、取消极端数据。为了避免数据资料, 在公布是把这些极端数据从原始资料中删除。

其次就是对汇总的数据资料的保护a、“单元隐藏”法。这是一种最常用的方法, 就是简单地把不公布的单元的值从表中隐藏掉, 这种方法应注意的一个问题是, 尽可能避免数据用户通过表中的相关数据计算或估算出个体资料。b、重新设计汇总表。除了隐藏单元的数据外, 人们还可以考虑重新设计汇总表, 如行合并、列合并等。c、改变分组的范围。这种泄露控制的目标, 是通过改变分组的范围来避免统计资料的泄露。d、近似数。这种方法主要是通过对结果进行干扰, 以达到对出现频数较小的数据单元进行保护的目的, 这种方法的基本指导思想是:先确定取舍的基数, 然后再找该数的最大整数倍数, 最后再按照一定的“近似规则”对余数进行取舍。

2、在数据存储方面, 采用可靠的存储介质

现代科技发展, 信息技术产业盛行, 很多病毒的发明严重威胁着计算机的安全, 导致信息泄露, 计算机网络安全信息管理很有必要。由于不同的存储方式的安全性不同, 可以选择保密性好的数据库文件, 而且在相应数据库管理系统中能够实现强大的数据操作系统;其次选用安全性能好的存储介质, 切实做到网络信息安全防护, 才能有利的实现健康的计算机网络安全环境, 有效的防止统计信息泄露。

3、建立统计信息保护的网络系统工程, 减少中间环节

加强统计网络信息传递的安全因素。首先, 对信息共享的过程进行监控。在施行信息交流和共享过程的同时, 应加强信息交流和共享数据的动态控制;其次, 加强防火墙建设, 免遭网络信息集成中的信息系统遭受外部黑客人侵的危险。统计信息的泄露很大一部分是网络安全问题带来的, 以目前网络信息维护防范的现状, 加强信息安全管理就要从计算机安全技术上着手, 对计算机系统的安全信息漏洞加以检测、修补、分析, 同时根据监测分析的结果制定有针对性的完善防护措施方案;构建安全系统体系即建立起有针对性的系统安全防火墙、网络杀毒防护软件、入侵检测扫描系统等防护安全体系。严格按照安全管理制度的要求加以规范, 同时要加强安全防护意识。目前许多资料的上报都是采用网上直报系统, 网上直报系统提供了一个灵活、规范的数据采集和处理平台, 大大减少中间环节, 降低泄露的几率,

4、加大统计信息泄露刑事处罚力度, 加强学习教育, 专人保管

统计信息的泄露除了计算机的安全隐患外, 人为因素不可忽视, 统计人员的责任心不强, 导致信息泄露的例子不在少数, 对于这些人为因素造成的统计信息泄露, 统计部门应该经常组织学习, 提高对职业道德重要性的认识, 加强统计人员的保密意识, 增强统计人员的责任心, 同时加大对统计信息泄露的刑事处罚力度。一是对信息资料的泄露者, 除按法律规定处罚外, 还要利用公众舆论对不注重职业道德的统计人员进行谴责, 利用大会小会, 讲人不讲事, 使其他统计人员从中汲取教训。二是坚持诚信用人的原则。对那些俯首贴耳, 弄虚作假, 不关心群众的统计人员, 坚决不聘用在统计岗位, 即使专业能力再强, 缺少职业道德也是如此。三是尽快建立完善的市场退出机制。对那些不遵守行业守则, 不守信用, 泄露个人资料严重者, 将驱逐出统计行业。

5、建立统计信息保密制度

(1) 对属于根据秘密的统计资料, 应该标明密级。 (2) 在属于国家秘密的统计资料刊物和文件的制作、收发、传递、摘抄、保存和销毁, 应严格审批手续, 并形成一套制度。 (3) 不准在私人交往和通信中泄露属于国家秘密的统计资料。 (4) 属于私人、家庭的单项调查资料, 非经本人同意, 不得泄露, 这里的单项资料是指统计部门收集的反映个人及家庭情况的原始登记材料, 这样不仅有利于保护被调查者的合法权益, 而且有利于消除被调查者的后顾之忧, 增进被调查者对调查者的信任感, 使他们能够如实的提供统计资料。

6、建立健全的防止统计信息泄露监督体系

统计监督体系的构建包括内部监督、社会监督的监督体系, 内部监督包括要加强对调查项目的管理, 取得的统计信息资料进行监督, 确保从源头上控制统计信息泄露, 降低传输过程中的泄露;社会监督包括通过热线电话、电子邮件和官方网站3种途径受理市民反映统计信息泄露问题, 或者聘请社会业务监督员, 定期召开座谈会的形式, 加大社会监督力度。

监督作为一种权利, 常常与利益相伴, 即监督与奖惩是紧密联系在一起的, 没有有效的奖惩结构, 监督作用和效力就随之削弱。当前违法成本较低, 很大程度上影响了统计监督效力的发挥本末错位——重视监督检查, 忽视制度建设。

改革开放以来, 我国统计行业也得到了蓬勃的发展, 统计工作取得了巨大的进步, 统计是一个信息系统, 它的目标是向统计信息使用者提供决策有用的信息, 从而充分发挥统计信息资料的作用, 切实控制统计信息资料的泄露。

摘要:统计资料, 是指统计活动过程中所产生的、反映国民经济和社会发展情况的统计成果以及与之相联系的其他资料的总称。在取得统计资料以后, 统计部门就应该对统计资料进行严格的管理, 防止统计信息的泄露, 对被统计对象造成不必要骚扰、损失和伤害。本文通过对实际操作中的一些信息泄露途径及造成的危害, 提出了应对统计信息泄露控制一些相关的措施。

关键词:信息资料,泄露,控制

参考文献

[1]任志勇, 张洪毅, 孟祥鑫.网络信息安全技术的发展[J].信息与电脑 (理论版) , 2009;8

[2]高波.基于网络信息安全技术的探讨[J].科技资讯, 2009;14

[3]梁方明, 李海洋.网络信息安全分析与研究方向[J].中小企业管理与科技 (上旬刊) , 2009;5

[4]羊兴.网络信息安全技术及其应用[J].科技创新导报, 2009;24

[5]赵秦.计算机网络信息安全技术研究[J].中国新技术新产品, 2009;14

[6]石书红.信息安全技术浅析[J].电脑编程技巧与维护, 2009;06

[7]杨龙月, 宋辉, 乌小茜.计算机网络信息安全防范[J].网络与信息, 2009;08

数据统计资料 篇3

【关键词】统计学 数据资料 作用 处理方法

由于人工数据处理缺乏专业理论为指导,造成企业数据资料处理结果不符合实际情况,对经营决策制定产生了误导作用,破坏了内部营运秩序的和谐性。因而,深入分析统计学理论,对原始数据处理具有多方面的参考意义。

一、统计学主要理论

统计学是原始数据处理不可缺少的指导理论,具有专业性、科学性、准确性等特点,满足了原始数据统计工作要求。根据统计方法的不同,可以将统计学分为描述统计学和推理统计学,每一种理论在实际应用阶段都发挥了不同的作用。两大理论介绍如下:

(一)描述统计学

给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。从数据构成情况来说,描述统计学是对现有数据的一种描述,这类数据资料是“已知”的,无需经过相关的推算处理。例如,企业在制定财务报表时,利用统计学工具对原始数据进行描述,最后得到的数据表格则是一种专业性报表,对现实结果具有真实的呈现作用。

(二)推断统计学

观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推断统计学。推断统计学适用于未知数据资料处理,结合已知数据结果进行相关的计算、推理,由专业人员按照固定计算方法完成数据处理。例如,财务人员根据一个季度生产销售计划,推断统计出下个季度的销售额度。

二、统计学对原始数据资料处理的作用

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。结合实际应用情况,统计学理论对原始数据资料处理具有广泛性作用,集中表现为:

(一)导向性

推广统计学理论,让原始数据处理工作有了明确的导向性,而不是盲目地收集、处理数据,提高了原始资料的可利用价值。面对不断变换的数据资料,统计学理论能够积极发挥统计参谋作用,做到既真实反映发展实际,又科学预判发展趋势,为市委、市政府决策提供重要支撑。尤其在企业经营改革阶段,统计学指导着原始数据的处理工作,避免数据资料调配失误产生的不利影响。

(二)客观性

统计学理论遵循原始数据的客观性,严格按照数据资料内容执行处理计划,从而保证了所有数据资料结构真实有效。例如,描述统计学中,统计人员以客观数据准则为依据,既注重原始资料的收集与处理,也重视数据结果的审查与应用,不断加强统计基层基础建设,维持统计数据真实准确。此外,统计理论也要求“不虚报、不瞒报,实事求是”,保证数据结果经得起推敲和考验。

(三)实效性

市场经济政策是不断变化发展的,相对应企业数据资料也是日趋更新,原始数据处理坚持实效性是必不可少的。无论是描述统计学或推断统计学,其数据处理方案都十分注重实效性。统计工作可以跟随环境变化而不断地调整,推动大数据、云计算等信息化手段在统计工作中的应用,确保统计数据快速及时,同时加强对数据的深度分析研究,提升了原始数据的实效性。

(四)科学性

伴随着社会信息资源多样化发展,原始数据资料内容变得更加多样性。统计学理论指出,科学调整重要统计指标体系,注重对抽查样本及时更新,特别要围绕信息经济、智慧经济发展重点;强化专项调查和测算,提高原始数据处理前瞻性,为决策提供重要参考。例如,加强外部的协调沟通和系统内的数据整合,确保各个层级、系统数据的准确可靠、相互对应、完整统一。

三、统计学工作需注意的事项

基于信息化时代,如何建立更加科学的数据统计模式,这是现代企业经营管理必须考虑的问题。统计学理论具有广泛性的利用价值,它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。为了提高原始数据资料处理质量水平,统计学工作必须注意:

(一)人员方面

随着市场经济不断发展,企业越来越重视各项数据资料收集与分析,统计学理论成为市场决策分析中不可缺少的指导知识。必须安排专业人员从事统计工作,这样才能维持原始数据资料处理结果准确无误,体现出统计学在原始数据中的利用价值。

(二)监管方面

原始数据资料处理阶段,需注重统计结果的监督管理,从数据审查、结果分析、资料统计等方面,增强统计监督力度。审查监督是为了进一步提升数据的准确性,为企业经营决策提供实用性数据,对未来经营提供科学的指导作用。

四、结论

数据信息是企业经营规划的“风向标”,掌握实时数据可以指导经营者调整营运方案,改变传统经营与管理决策,实现内部组织营运模式的最优化。为了改变传统数据资料统计存在的不足,必须要建立更加稳定的统计工作模式,利用统计学理论完善数据处理体制,全面提升数据资料处理的标准性,为企业经营提供最真实的数据结果。

参考文献

[1]刘虹.浅析企业会计与统计在市场经济条件下的相互适应性[J].中国集体经济.2011(19).

[2]于晶雪.浅析企业的会计核算與统计核算的关系[J].商场现代化.2011(15).

[3]黄杰.论会计与统计的关系[J].商场现代化.2011(20).

[4]徐延红.浅议政府统计与企业会计的协调发展[J].统计科学与实践.2010(07).

数据统计资料 篇4

一、教学大纲要求

(一)掌握内容

1.频数分布表与频数分布图(1)频数表的编制。(2)频数分布的类型。(3)频数分布表的用途。2.描述数据分布集中趋势的指标

掌握其意义、用途及计算方法。算术均数、几何均数、中位数。3.描述数据分布离散程度的指标

掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。

(二)熟悉内容

连续型变量的频数分布图:等距分组、不等距分组。

二、教学内容精要

计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。

(一)频数分布表的编制

频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,„20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:

1.求数据的极差(range)。

RXmaxXmin(2-1)

2.根据极差选定适当“组段”数(通常8—10个)。

确定组段和组距。每个组段都有下限L和上限U,数据χ归组统一定为L≤χ

频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。

(二)描述频数分布中心位置的平均指标

描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。1.算术均数

算术均数(arithmetic mean)简称均数,描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示,其计算方法如下:

(1)直接法:直接用原始观测值计算。

XXn(2-2)

(2)加权法:在频数表基础上计算,其中X为组中值,f为频数。

X2.几何均数

几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。其计算公式为:(1)直接法

fXf(2-3)Glg(2)加权法

G3.中位数

lg1lgXn(2-4)

1flgXf(2-5)

中位数(median)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。

为奇数时 MXn1(2-6)

21为偶数时 MXnXn(2-7)

(1)2(2)22-1 常用平均数的意义及其应用场合

平均数 均数 意义平均数量水平

应用场合

应用甚广,最适用于对称分布,特别是正态分布

等比资料;对数正态分布 几何均数平均增(减)倍数 中位数

(一)反映数据变异程度大小的变异指标 位次居中的观察值水平偏态分布;分布不明;分布末端无确定值

变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。

1.极差

极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

RXmaxXmin(2-1)

2.百分位数与四分位数间距

(1)百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。百分位数用Px表示,0< x <100,如25%位数表示为P25。在频数表上,百分位数的计算公式为:

PxLxixfxnx%fL(2-8)

(2)四分位数间距(inter-quartile range)是由第3四分位数(Q3= P75)和第1四分位数(Q1= P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。其计算公式:

QRQ3Q1(2-9)3.方差

方差(variance)表示一组数据的平均离散情况,其计算公式为:

2X2 S(2-10)

n14.标准差

标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:

S(X)2XXn12X2n(2-11)n15.变异系数

变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示,计算公式为:

CVSX100%(2-12)平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。如常用XS或M(QR)。

三、典型试题分析

1.名词解释:平均数

答案:平均数(average)是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。

[评析]本题考察平均数的概念。平均数是一类统计指标,并不单纯指算术均数。2.描述一组偏态分布资料的变异度,以()指标较好。A.全距 B.标准差 C.变异系数 D.四分位数间距 答案:D [评析]标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选D。

3.用均数和标准差可以全面描述()资料的特征。A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 答案:C [评析]本题考察均数和标准差的应用条件。4.同一资料的标准差是否一定小于均数?

答案:均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。标准差可大于均数,也可小于均数。

5.试述极差、四分位数间距、标准差及变异系数的适用范围。

答案:这三个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。

四、习题

(一)名词解释

1.频数表 2.算术均数 3.几何均数 4.中位数 5.极差 6.百分位数 7.四分位数间距 8.方差 9.标准差 10.变异系数

(二)单项选择题

1.各观察值均加(或减)同一数后()。

A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 2.比较身高和体重两组数据变异度大小宜采用()。A.变异系数 B.差 C.极差 D.标准差

3.以下指标中()可用来描述计量资料的离散程度。A.算术均数 B.几何均数 C.中位数 D.标准差

4.偏态分布宜用()描述其分布的集中趋势。

A.算术均数 B.标准差 C.中位数 D.四分位数间距

5.各观察值同乘以一个不等于0的常数后,()不变。A.算术均数

B.标准差 C.几何均数

D.中位数 6.()分布的资料,均数等于中位数。A.对称 B.左偏态 C.右偏态 D.偏态 7.对数正态分布是一种()分布。A.正态 B.近似正态 C.左偏态 D.右偏态

8.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。A.均数 B.标准差 C.中位数 D.四分位数间距

9.()小,表示用该样本均数估计总体均数的可靠性大。

A.变异系数 B.标准差 C.标准误 D.极差

10.血清学滴度资料最常用来表示其平均水平的指标是()。

A.算术平均数 B.中位数 C.几何均数 D.平均数 11.变异系数CV的数值()。

A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 12.数列

8、-3、5、0、1、4、-1的中位数是()。

A.2 B.0 C.2.5 D.0.5 13.关于标准差,那项是错误的()。

A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 14.中位数描述集中位置时,下面那项是错误的()。

A.适合于偏态分布资料 B.适合于分布不明的资料

C.不适合等比资料 D.分布末端无确定值时,只能用中位数

15.5人的血清滴度为 <1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好(A.平均数 B.几何均数 C.算术均数 D.中位数

16.数列0、48、49、50、52、100的标准差为()。

A.50 B.26.75 C.28.90 D.70.78 17.一组变量的标准差将()。

A.随变量值的个数n的增大而增大 B.随变量值的个数n的增加而减小 C.随变量值之间的变异增大而增大 D.随系统误差的减小而减小

。)18.频数表计算中位数要求()。

A.组距相等 B.原始数据分布对称 C.原始数据为正态分布或近似正态分布 D.没有条件限制 19.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。

A.1.5 B.1.9 C.2.1 D.不知道数据的总个数,不能计算平均数

20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。

A.均数为7天,很好的代表了大多数的潜伏期 B.中位数为3天 C.中位数为4天

D.中位数为3.5天,不受个别人潜伏期长的影响

21.某地调查20岁男大学生100名,身高标准差为4.09cm,体重标准差为4.10kg,比较两者的变异程度,结果()。A.体重变异度大 B.身高变异度较大 C.两者变异度相同

D.由单位不同,两者标准差不能直接比较

(三)判断正误并简述理由 1.均数总是大于中位数。()2.均数总是比标准差大。()3.变异系数的量纲和原量纲相同。()4.样本均数大时,标准差也一定会大。()5.样本量增大时,极差会增大。()

(四)计算题

1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示: mg/m3 : 1 2 3 4 5 ug/m3 : 1000 2000 3000 4000 5000 分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。

2.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。19.0 12.0 14.0 14.0 8.2 13.0 6.5 12.0 15.0 17.2 12.0 12.7 25.0 8.5 20.0 17.0 8.4 8.0 13.0 15.0 20.0 13.0 13.0 14.0 15.0 7.9 10.5 9.5 10.0 12.0 6.5 11.0 12.5 7.5 14.5 17.5 12.0 10.0 11.0 11.5 16.0 13.0 10.5 11.0 14.0 7.5 14.0 11.4 9.0 11.1 10.0 10.5 8.0 12.0 11.5 19.0 10.0 9.0 19.0 10.0 22.0 9.0 12.0 8.0 14.0 10.0 11.5 11.0 15.0 16.0 8.0 15.0 9.9 8.5 12.5 9.6 18.5 11.0 12.0 12.0

3.测得某地300名正常人尿汞值,其频数表如下。试计算均数、中位数、何者代表性较好。

表2-2 300例正常人尿汞值(μg/L)频数表

尿汞值 0-4-8-12-16-20-例数 49 27 58 50 45 22 尿汞值 24-28-32-36-40-44-

例数 16 9 9 4 523-1 300 289 294 294 297 297 299 299 299 300 300 96.33 98.00 98.00 99.00 99.00 99.67 99.67 99.67 100.00 100.00 XfXf=15.08μg/L(2)求中位数

ixnfL=13.28μg/L fM2由频数表可以看出,此资料为偏态分布,因此用中位数代表性较好。4.答案:(1)求均数

79101415XX11.00

n5(2)求离均差之和 MLxXX=0.00 5.答案:

(1)求术前各指标

XXn666.40mg/ml SXX2n1SCV100%=82.83%

XXXn=551.99mg/ml(2)求术后各指标

127.20 mg/ml

SCVXXn1SX2=101.27 mg/ml

100%=79.61% mg/ml 两组资料均数相差悬殊,故而只能用变异系数比较两组何者变异度大,虽然术前变异系数较大,但差异并不明显,需做进一步的统计分析才能知道何者变异度大。

6.答案:

其平均滴度的倒数为

Glg1flgXlgf165.7036.67 42平均滴度为1︰37。

数据统计资料 篇5

为了加强___银行总行内部统计报表和统计资料的管理,根据中国______银行统计制度、报表管理规定以及统计报表制度,结合总行内部各类报表管理的实际情况和要求,对统计报表、统计资料管理作如下规定。

一、根据我行业务发展状况和管理需要,___银行统计分为综合统计和专业统

计两大类。综合统计主要反映___银行业务的综合情况及主要业务工作成果。专业统计主要反映各业务部门日常管理所需要的一些主要资料。

二、各种综合性统计报表(包括临时报表),由计划部统一制定,统一管理,统一编号,报行领导批准后统一下达,并送国家统计局备案。

三、全行性专业定期统计报表和临时性调查表(国家有关主管部门统一制定的报表除外),由各职能部门提出表式和编制说明,经计划部门会签、编号,报行领导批准后下达,同时抄送计划部。职能部门制发的专业统计报表要与综合性统计报表内容、口径、指标解释、计算方法等相衔

接避免出现矛盾,职能部门设置统计报表和统计指标时应本着互为补充、数据共享、精简报表、避免重复、减轻基层行负担的原则,同时要考虑凡各行原始记录卡能反映的内容,原则上不另加指标,如确需增加,可通过增加原始记录卡的有关指标解决。

四、为保证全行统计数据的完整准确,总行有关职能部门直接经办的各类存、拨、贷款业务应按《统计报表制度》要求,定期向计划部提供有关数据。各部门应设专人负责此项工作。

五、总行计划部是归口管理统计报表和统计资料的职能部门,有权对会签的各类统计报表提出修改意见。各职能部门的统计报表数字,汇总后要抄送计划部一份,以便整理全行性统计资料,及时向行领导定期反映全行业务概况。汇总后报表抄送计划部的日期:计划、筹资、信贷、投资、建经、房地产、国际业务、调查部等8个部门的业务专业统计月报、季报,在报告期后20日内;其他部门的专业统计报表可按本部门规定的报出日期汇总后抄送。

六、对外提供综合类统计数字,由计划部归口协调,报行领导审定后提供。各职能部门的统计资料经各部主任审查、报主管行长审定后方可向外提供或公布,同时抄送计划部。

七、本办法自1993年元月1日起实行。1990年2月制定的《___银行总行统计报表和统计资料管理暂行办法》即行废止。

统计资料档案管理制度 篇6

二、统计档案属国家所有,任何人不得据为已有,统计人员因工作变动时,必须移交所有统计档案资料。

三、统计档案要有专人负责,并严格遵守档案管理的有关规定,统一编号、统一格式装订,保管期限按照国家档案管理制度的有关规定执行。

四、统计档案严格执行统计档案资料的保密制度,不准外借,不准私自带回家中,不准损坏丢失。

水文数据资料代表性简析 篇7

牛鼻河现有一个国家基本水文站——小长安水文站, 设于1957年, 位于罗城县小长安镇, 控制流域面积1005km2, 占牛鼻河流域面积的76.4%, 平均年径流量12.3亿m3, 每平方公里年产水量122万m3。实测最大流量6500m3/s, 发生于1962年, 调查最大流量5290m3/s, 发生于1910年, 小于实测最大流量。

1小长安水文站径流资料

小长安水文站为融江支流阳江流域控制站, 水文站控制集雨面积1005km2, 河段长度72km, 平均坡降2.96‰。水文站主要观测项目有水位、流量、降雨等, 自建站以来资料记录、收集完整, 有1960年以来连续的长系列径流资料, 本次收集有该站1960年~2009年共50年实测径流资料, 数据见表1。

2小长安水文站径流系列代表性分析

2.1 长短系列统计参数对比分析

样本对总体代表性的高低可以理解为样本分布参数与总体分布参数的接近程度, 因此可以以长系列统计参数为标准来检验短系列资料的代表性。实际计算中, 通常从长系列资料中, 选取几个短系列, 计算统计参数, 并与长系列统计参数进行对比分析比较, 若计算结果比较接近, 则认为该站资料具有一定的代表性。

根据小长安水文站径流系列丰枯水年分布规律, 选取1960~1989年、1980~2009年两个时间段作为短序列, 分别计算其统计参数, 与长系列进行比较。经计算两个短系列和长系列计算成果见表2。

由表2可知, 1960~1989年流量均值、Cv值与长系列成果相比, 均基本相同;1971~2002年流量与长系列相同, Cv值长系列略低8%;1980~2009年流量比长系列略低3.83%, Cv值比长系列略低8%。三个短系列的平均流量值与Cv值与长系列均相差很小, 因此, 从长短系列统计参数角度来看, 小长安站1960~2009年径流系列具有较好的代表性。

2.2 差积曲线法

差积曲线法也是水文计算中经常采用的一种代表性分析的方法。根据小长安站1960~2009年实测径流资料, 采用差积曲线法进行代表性分析, 差积曲线图见图1。

由图1可知, 小长安站年径流系列各流量周期变化规律明显, 具有连丰连枯、丰枯交替和枯水段持续时间长等特点。根据图中反应的情况看, 本次采用的50年资料中, 出现了6个丰水年组、5个枯水年组, 其中1960~1962、1968~1971、1976~1980、1986~1987、1993~1998、2007~2009为6个丰水年组, 1963~1967、1972~1975、1981~1986、1988~1992、1999~2006是5个枯水年组。整个系列中, 丰水年有23年, 枯水年有27年, 枯水年略多于丰水年, 总体分布均

匀, 系列具有较好的代表性。

2.3 累积平均分析

利用小长安水文站1960~2009年50年实测径流资料, 进行年平均流量累积均值计算, 作年平均流量累积平均过程线图, 见图2。由图2可见, 年流量均值从1985年开始稳定在1附近, 说明系列具有较好的代表性。

3结语

水文资料是水利工程设计中水文计算的基础数据, 其代表性对于整个工程水文计算成果的精度具有重要意义。根据《水利水电工程水文计算规范 (SL278-2002) 》, 径流系列应通过分析系列中丰、平、枯水年和连续丰、枯水段的组成及径流的变化规律, 评价其代表性。径流系列较长时, 可采用滑动平均、累积平均、差积曲线等方法, 分析评价该系列或代表段系列的代表性。

本文中采取了三种方法对小长安水文站1960~2009年50年的实测径流资料进行了代表性分析。从分析结果看, 小长安站径流资料长短系列的平均值和Cv值相比, 相差不大;小长安站50年径流资料丰枯交替变化明显, 整个系列具有完整的丰、平、枯周期;根据年平均流量累积曲线可以看出, 系列均值在长度达到25年后趋于稳定。综上, 小长安站1960~2009年径流系列具有较好的代表性。

摘要:我们在做水文分析计算时, 常常要先对所用资料的代表性进行分析, 即该资料应该对水文的周期波动、丰枯交替以及特征值, 确定各个系列的统计参数等客观规律具有代表性意义。本文在选取水文站径流系列资料的计算成果基础上, 采用差积曲线法、长短系列统计参数对比分析法及累积平均法, 分析其丰枯变化规律及特征值变化等特性, 对该水文系列的代表性进行分析。

关键词:水文资料,代表性,统计参数

参考文献

[1]《水利水电工程水文计算规范 (SL278-2002) 》

统计分析在测评资料中的应用 篇8

【关键词】 统计分析测评资料应用

1. 测评资料的搜集

搜集测评的信息资料或搜集测评数据是测评过程中进行统计工作的第一个阶段,是全部统计工作的基础。常用的搜集方法大致省三种:一是收集,即从日常的工作记录、统计报表、档案资料中搜集。二是抽样调查,即采用科学的方法和手段深入实际搜集客观资料的一种方法。在抽样调查中,又有随机抽样(亦称无限制抽样)、分层抽样、多阶抽样、集团抽样和系统抽样五种形式。实践表明,把其中的多阶抽样与分层抽样结合起来,是抽样中最好的一种抽样方法。最后一种是测量,即依据一定的标准和系统的法则来把所测评对象的特质或度量的等级以数字记录下来,这些数据就是可以用于统计的资料。

2. 测评资料的初步整理

测评资料的统计分类又称统计分组。这是对测评资料进行初步整理的第一步工作。分类时所依据的特征称为分类的标志,分类标志按形式可分为性质标志和数量标志两种,也就是说分类的类别按形式分,可分为性质类别和数量类别两大类。性质类别反映测评对象所属组别与种类的不同。例如将测评客体按男女或年龄来分组,就是属于性质类别。数量类别就是将测评数据按其数值大小排列出一个秩序来。

2.1统计表。

统计表是以表格形式表达测评数据关系的重要工具,它可以化繁为简地反映表中各类测评对象或数据的情况,便于分析、对比、计算和记忆。统计表的形式通常有简单表、分组表和复合表三种。制表应该符合有关的基本原则。首先,要求表的结构简单明了。一张表只能有一个中心,避免包罗万象的大表。其次,要求表的层次清楚。项目排列要按照逻辑顺序合理安排。制表的具体要求是:①标题应简明扼要说明表的内容;②表的内容应分别以横、纵、总概等标题加以说明;③数据书写精确度要整齐划一;④表中的横竖线条不宜过多。表两侧的竖线可以省去。

2.2频数分布表。

频数分布表也称次表分布表。常见的有简单频数分布表、累积频数分布表和累积百分比分布表三种形式。

编制简单频数分布表的步骤是:①求全距:H=A—B,A、B分别为测评数据中的最大、最小的数值。②决定组数与组距。欲将所有数据分成若干组时,要先确定组数和组距。组数一般以10一15个为宜。组数确定后,则组距可以利用公式i=全距/组数来求。组距一般以3、5、7等奇数个单位为好。但有时也可先定组距之后再求组数;③决定组限。组限就是每组测评数据的起止范围。每组数据的最低值为下限,最高值为上限。组中值=(上限+下限)/2;④登记频数。分好组后,就可以将每个测评数据归入相应的组内,并以符号I、II、III或“正”字逐个登记,然后求出每组内的总数f。

2.3频数分布图及其绘制方法

2.3.1统计图。

统计图是以点、线、面、体来表示各种数据间关系及其变动情况的重点工具。它形象直观,便于整体比较。常见的统计图有条形、圆形、曲线形和象形图几种。制图的基本规则常有以下几条:①根据资料的性质和分析的目的。正确选择适合的图形;②图的标题要简明扼要,切合图的内容,标题一般写在图形的下方;③图的尺度线与图形基线要垂直。尺度分点要清楚,以便于读数和计数。不能用同—尺度表示性质不同的两种计数单位;④图的横坐标与纵坐标的数字,分别是按笛卡儿坐标形式自左向右、由小到大、自上而下、由大到小排列的;⑤图中线条的粗细,应依其重要性而区别;⑥在同一个图例中比较两个对象时,使用的比例要相同。数量大小最好用条形图的长短来表示,而固定其宽度;⑦图形中,如有必要分别加解释的地方,可用图注加以说明。图注应简明扼要,字体要小并写在图题的下方;⑧为了美观易看,对于有纵横轴的图形,其高度与宽度之比以接近3:5为宜。

2.3.2频数分布图

频数分布图也称次数分布图,是以曲线或折线来表示相应的频数分布表的—种统计图。常见的有直方图与多边图两种。直方图是以面积表示频数的分布,即用位于横轴上各组上下限之间的矩形面积,表示各组频数分布的情形。其作法如下:①作横轴,然后把各组的上下限或组中值分别于横轴上,但要在横轴的两端至少各空一个组距的位置;②作纵轴,在纵轴上标尺度及单位以表示频数;③按各组的频数定出在纵轴上的高度并作出与横轴平行的直线,这一直线便于与相加的上下限延长线交成一个直立矩形。由于横轴上各组距之间是连续的,故所有的矩形组成一个并立的直方图。多边图是以相应纵轴上的高度点来表示频数分布的图形。它的制作可以在直方图的基础上进行。所不同的是,它以各组的组中值点为横坐标,以各组的频数为纵坐标描出相应的代表点来,然后用直线段把相邻的两点连接起来.最后形成一根起于或止于横轴的折线。当其起止点均在横轴上,这一折线就与横线构成一个封口的多边图形。

3. 测评资料的分析

经过对测评数据与资料的归类、列表、绘图等初步整理工作后,测评对象的面貌和某些特征可能已经反映出来了。要进一步把握测评对象的本质特征,就必须进一步做些分析工作,分析与计算出一些统计量数来。一般只要进行如下一些测评数据分析工作:集中量数的计算、差异量数的计算、相关与回归的分析、总体平均数与比率的推断、显著性检验以及方差分析等。下面分别进行扼要介绍。

3.1集中量与差异量

集中趋势和离中趋势是测评数据频数(次数)分布的两个基本特征。前者是反映关于在分布中大量测评数据向某点集中的情况,它一般以集中量数来描述;后者是反映关于测评数据分布中大量数据彼此离散的情况,它一般以差异量数来描述。

所谓集中量数,指的是一组同类测评数据的代表数值,它表明了该测评对象群体的数量特征。它一般用来进行测评对象群体间的比较,以判明某一测评对象群体与另一测评对象群体的差别。

3.2差异检验法

当计算出两个人在50项测评指标各自得分的平均数、相关系数或其他统计量后,发现它们彼此不同时,为了确定其差异的程度,常常要进行显著性检验,即确定这种差异程度到底如何。

显著性检验也是统计推断的一种方法,它可以用来确定一个具有已知统计量的样本是不是来自某一个确定的总体。换句话说,样本统计与总体统计量的差异究竟是由于抽样所引起的随机误差造成的,还是两者之间存在实质上的差异,这也需要过异性检验才能确定。比如,某企业员工素质测评平均成绩为75分,人力资源部从某车间中随机抽取了26名员工,其测评平均成绩为76.6分,显然这26名员工的平均成绩比整个企业的平均成绩最高1.6分,但能否由此就说,该车间的员工素质水平比整个企业的员工素质高呢?还不能。因为产生1.6分的差异的原因可能有两个:一是抽样引起的,例如刚好抽到该车间一些素质较好的员工;二是该车间员工的素质水平的确高于整个企业其他部门员工的素质。要判断这种差异到底是由哪一种原因引起的,就需要进行显著性检验。因此,无论是两个样本统计量之间差异的显著性检验,还是样本与总体之间的差异的显著性检验,其目的都是确定差异是实际的还是抽样不当造成的。在这种两者必居其一的选择中,如果否定了其中之一也就相应肯定了另一个选择。因此,若否定了差异是由抽样误差造成的,则就肯定了差异是实际存在的。但事实上,很难有百分之百的把握断定差异是或不是由抽样误差造成的,一般只能进行大概的判断,这就要求我们借助于概率论的理论了。

参考文献:

[1] 黄明凤 兵团现代农业发展测评与分析[J]统计教育2009年03期.

[2] 周少华 统计分析在干部综合考评中的运用[J]党建研究2007年09期.

上一篇:铁路桥墩柱施工方案下一篇:如何有效提高音乐课教学质量