分层抽样

2024-09-15

分层抽样(共5篇)

分层抽样 篇1

一、调查目的及抽样设计

近年来, 非公有制经济迅速发展, 占经济总量的比重不断提高, 非公企业的市场主体地位也日益突显, 逐渐成为活跃市场、推动行业技术革新、促进产业结构优化的重要力量。而人才是第一生产力, 是企业扩大发展, 提高企业综合竞争力的重要基础, 因此为了全面了解云南省非公有制企业 (单位) 人力资源状况, 本文对云南省非公有制企业 (单位) 调查, 解剖云南省总体总量、各州市、全省各行业非公有制企业 (单位) 人力资源的分布情况, 为非公有制人才队伍建设提供一个必要的依据。

报告运用分层算法对云南省16个州、市的18个国民经济行业门类非公有制企业 (单位) 人才资源状况进行抽样调查。

二、分层方案

1. 分层抽样原理

(1) 层数及样本量确定。将每一个行业门类的所有企业按照规模分成3层, 1个全部抽取层和2个部分抽取层, 总的样本量是由全部抽取层中的企业的数量和部分抽取层的样本量构成, 公式如下:

其中Nl是全部抽取层中企业的数量, nh为部分抽取层中样本量。

那么根据Lavallee-Hidirou算法。

(2) 样本分配方法。奈曼最优分配各层的单位抽样费用相等, 即ch=c那么费用函数就变为CT=c0+cn此时, 简化为, 这种形式的分配被称为奈曼分配。

2. 抽样框确定

州市的抽样框使用全省基本单位名录库, 根据非公有制法人企业所属的州市, 加工整理成, 云南16个州市的抽样框。

将各州市抽样框中的单位按照行业门类分成18个层 (当某些行业的单位数量为0时, 故不能完全涵盖18个行业) , 按照年末从业人员数据进一步分为1个全部抽取层和2个部分抽取层。各个抽取层的层界限通过kozak确定, 见表。

单位:人

三、结果分析

1. 全省非公有制企业 (单位) 人才的现状

调查结果显示, 云南非公有制单位共有从业人员2039472人。从受教育程度看, 研究生及以上学历有12129人, 占从业人员的比例为0.59%;大学本科有131784人, 比例为6.46%;大学专科有315011人, 比例为15.45%;中专及以下有1580548人, 比例为77.50%。从人才类型看, 比重较大的三种人员分别是经营管理人员、专业技术人员和技能人员, 抽样调查中这三类人员的数量分别为358959人、334451人、668715人。所占比例如图1所示。

2. 分行业的非公人力资源的数量特征

从云南省非公经济企业和员工从业结构来看, 以第三产业为主。从事第三产业的非公企业员工有706581人, 占非公企业员工总数的34.65%。具体来看, 年末从业人员在三大产业中的分布情况为:第一产业16.43%, 第二产业48.93%, 第三产业34.65%。

三大产业中经营管理人员、专业技术人员和技能人员的分布比例分别为:第一产业:9.00%、5.88%、8.77%。第二产业:39.22%、50.39%、59.38%。第三产业:51.78%、43.73%、31.86%。由于采矿业的特殊性质, 第二产业中经营管理人员、专业技术人员和技能人员所占的比例最高, 专业技术人员比重最大。

3. 分地区的非公人力资源的数量特征

经统计分析, 非公从业人员超过100000人的只有昆明、曲靖和邵通三地区。非公从业人员最少的是迪庆, 只有14537人。

云南省各地区的经营管理人员占该地区非公人员总数的比例集中在10%~20%;专业技术人员的比例除了邵通占7.77%外其他地区均集中在10%~20%;各地区的技能人员所占非公人员的比例则区别较大。超过35%的地区有德宏 (38.49%) , 文山 (44.74%) , 昭通 (56.82%) 。

参考文献

[1]秦光荣.强化措施优化环境推动非公有制经济发展再上新台阶—在全省加快非公有制经济发展大会上的讲话[R].2009, 3 (6) .

[2]Lavallee, P.and Hidiroglou, M.A. (1988) .On the Stratification of Skewed Populations.Survey Methodology, 14, 33-43.

分层抽样 篇2

§《分层抽样》教学设计

§2.1.3《分层抽样》教学设计

一、教材所处的地位和作用

本节是在学习了前两节简单随机抽样和系统抽样的基础上,结合此两种随机抽样特点和适用范围,针对总体的复杂性,为提高样本的代表性,有学习掌握分层抽样这种随机抽样的必要性;为下节“用样本估计总体”的学习打下了基础.因此本节内容具有承前启后的作用,地位重要。

二、学情分析

本班学生对本章节的基本知识、基本技能掌握情况良好,具体表现在:概念比较清晰,基础扎实,掌握情况总体不错。大部分学生掌握了一定的解题技巧,具有一定的分析问题、解决问题的能力。但也存在着以下缺失:书写不认真,数字抄错。提取有效信息的能力有待加强。两极分化明显:优生与后进生,水平相差较大。大部分学困生却和优等生却相差好几十分,较为悬殊。这是由于学困生的基础和理解能力较差,并进一步导致学习兴趣降低,从而出现了这种两极分化的现象。

三、教学目标(三维目标)

1、知识与技能目标:

(1)理解分层抽样的概念;(2)掌握分层抽样的一般步骤;

(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。

2、过程与方法目标:

通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法。

3、情感态度与价值观目标:

通过对统计学知识的研究,感知数学知识中“估计”与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。

四、重点与难点

正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题。

五、教学方法

因本节内容较简单,且主要内容为概念型知识,故本堂课主要采用讲授法。

六、设计思路

本节课主要依据五步教学法设计,根据实际情况和教学实践添加承前启后的内容,主要激发学生自主学习和思考的能力,其次是为了让更多的学生当堂吸收本节课的知识。

七、教学过程

教学过程:复习回顾→创设情境,导入新课→启发引导,理性概括→观察感知、例题学习→反思小结、自我提升→课后作业,自主学习→设置思考,埋下伏笔。

(一)复习回顾、设问

问题:上节课学习的系统抽样的基本含义是什么?系统抽样的操作步骤是什么?

思考:设计科学合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性,如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性。对于此类抽样问题,我们需要一个更好的抽样方法。

[设计意图] 我借助这个环节既复习了前两节课的知识为新课的学习做准备,又引发学生认知冲突,激发学生的求知欲,为新课的教学作好铺垫

(二)创设情景、层层递进

近视率(%)请学生思考探究:假设某地区有高中生2400人,初

9085中生10900人,小学生11000人,此地教育部门为了了解8070本地区中小学的近视情况及其形成原因,要从本地区的小6045学生中抽取1%的学生进行调查,你认为应当怎样抽取样50近视率4030本? 2020[设计意图] 从现实生活中的问题出发,引起学生兴100小学初中高中趣。问题设计层层递进,难度呈现梯度,可以满足不同水平学生需要。同时该过程运用了从具体到抽象的方法,为给出分层抽样的定义做准备。

(三)启发引导、形成概念

首先设置讨论

在讨论中学生结合上一环节的具体事例的探讨容易表述出运用分层抽样的方法,但表述过程不具有数学的严谨性是可想而知的。结合学生的表述,教师给出分层抽样定义的规范表达。并结合上一环节的具体事例与学学生探讨分层抽样要遵循的原则。总结分层抽样的具体的操作步骤。

[设计意图] 通过组织讨论,培养学生自主探究,合作交流的能力,培养学生概括归纳能力。通过师生共同探讨对话,深化对分层抽样概念及要遵循的原则的理解,加深对分层抽样过程的理解,利于知识的系统化、条理化。

(四)观察感知、例题学习

1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高

一、高

二、高三各年级抽取的人数分别为多少? 例

2、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。

请学生解决例1,让学生初步应用分层抽样的知识,理解分层抽样的方法。对于例2学生可以确定采用分层抽样的方法,但对具体过程的书写存在一定疑虑。于是我板书例题2的具体过程,引导学生对具体过程的规范书写。

[设计意图]此题引导学生运用分层抽样,加深理解分层抽样的步骤及优点,巩固知识的掌握。

(五)反思小结、培养能力

[设计意图]小节是一堂课的概括和总结,有利于优化学生的认知结构,把课堂教学传授的知识较快转化为学生的素质,也更进一步培养学生的归纳概括能力。

(六)课后作业,自主学习

必做:课本练习1、2 选做:课本练习3 [设计意图]课后作业的布置是为了检验学生对本节课内容的理解和运用程度以及实际接受情况,并促使学生进一步巩固和掌握所学内容。对作业实施分层设置,分必做和选做,利于拓展学生的自主发展的空间

八、教学反思

主要是学生自习为主,老师进行指导,引导学生通过生活中的实际进行自学,参与学习中,合作交流学习本节知识。引入导学案提高高利率。达到了预期的教学效果。

九、板书设计

本节课的板书主要分为两个版块,左半部分为主板,主要书写本节课的标题和主要知识,右半部分为副版,主要用于练习和草稿的书写。板书具体内容根据实际当堂发挥,在此不作具体表述。

分层抽样 篇3

关键词:旅游客源市场,抽样调查,等比例分层抽样

一、选题意义

随着统计学理论与方法走向成熟、计算机信息技术的高速发展,运用抽样调查来研究旅游客源市场有关信息,为旅游规划的设计、旅游产品开发提供基本资料已成为研究者的重要课题。抽样调查来自于成熟的统计学,分析过程又采用先进的计算机统计软件来完成。因此,几乎所有国内外学者都对抽样调查在旅游客源市场研究中的有效性深信不疑。但在实际工作中发现:旅游客源市场的复杂性、特殊性,给抽样调查选取样本带来了难度,获得的数据容易失真。为了克服简单随机抽样的不足,学者开始对旅游客源市场的特殊性进行分析。但由于分析得太细、太全,虽然提高了数据的有效性,但大大降低了操作性。本文尝试在保证一定的可靠度的前提下,根据旅游市场的特点,利用分层抽样中的等比抽样,提高了可操作性。

二、旅游客源市场的特殊性

旅游客源市场的特殊性主要表现在时间属性、空间属性与个体需求属性三个方面。

(一)时间属性主要表现为时间的非连续性。

旅游者时间属性具体表现有:季节集聚现象、大小黄金周集聚现象、周末集聚现象、上班时段集聚现象等4个方面。

1. 季节集聚现象。

各旅游区的气候条件的差异是构成季节集聚现象的主要因素。各旅游区都呈现出明显的淡季与旺季,在取样时要注意有所区别。

2. 大小黄金周集聚现象。

国务院每年都定期发布《全国年节及纪念日放假办法》。客观上促成了两个时期跨度为一周的旅游黄金周:春节、“十一”。四个时间跨度为3天的小旅游黄金周:清明、端午、“五一”与中秋,此外还有传统上的暑假、寒假。从而形成了所谓的“假日经济”。在取样时要注意有所区别。

3. 周末集聚现象。

为了扩大内需,提高国民的生活质量,全国已经普遍实行每周5天工作制,有些部门甚至实行每周4天半工作制。这一工作制度的改变,促进周末休闲度假现象与城市周边周末休闲度假的发展,产生了“周末经济”。在取样时要注意有所区别。

4. 上班时段集聚现象。

因工作性质,有些行业如银行、公安、服务行业等需要采用轮休制,这些行业人员在上班时段出游的机会可能更大。另外,国家已经开始实施带薪休假制度,不同单位带薪假期时段不同,促进了上班时段旅游集聚现象的形成。在取样时要注意有所区别。

(二)旅游者空间属性的非均匀性。

旅游者空间属性的非均匀性,主要体现在两个方面:一是旅游区内部旅游者分布非均匀性;二是旅游客源地居民分布非均匀性。

1. 旅游区内部的旅游者分布的非均匀性。

旅游区内部的旅游者分布的非均匀性主要表现在:一是旅游区内景点自然分布的非均匀性。二是旅游区存在不同的功能区,如消费区、综合服务区、观赏区等,导致旅游者在同一景区内部分布的非均匀性。在取样时要注意有所区别。

2. 旅游客源地居民分布的非均匀性。

我国现处在社会主义初级阶段。各地区、各部门经济发展状况差异较大,导致不同地区的居民出游率与消费能力差别较大。形成明显区别的一级市场、二级市场和机会市场。一级市场,通常情况下可占旅游地接待总人数的40%~60%。二级市场,通常情况下可占旅游地接待总人数的10%左右,如果开发得当,可以转变为一级市场。机会市场,目前占旅游地接待总人数比例人数较少,是一个旅游地有待开发的市场。在取样时要注意有所区别。

(三)旅游者需求的个体差异性。

随着旅游业的迅速发展,旅游业开始由“资源导向型”向“市场导向型”转变。旅游需求呈现出多样化、个性化和易变性,消费行为更加明智。这主要体现在个体年龄结构的差异与社会文化差异两方面。在取样时要注意有所区别。

1. 个体年龄特征的差异。不同的年龄,其购买力、购买欲望和购买权利都不同。据统计,国内旅游者一般以处于30~45岁和16~29岁年龄段的中青年居多,分列一、二名。市场份额基本上为40%和38%左右;其次是45~60岁年龄段的中年人,大约可占17%左右;其它年龄段所占比例较小。在取样时要注意有所区别。

2. 社会文化个体差异。

一般来说,游客文化层次越高,意味着具有较高的旅游文化偏好和经济能力。据统计,具有本科及本科以上学历的游客一般占到总人数的42%左右;其次是大专水平的旅游者,占总人数的32%左右,其他学历阶层的人数较小。在取样时要注意有所区别。

综合所述,在实施抽样调查时,以时间集聚不同、地域分布不匀、个体需求存在差异为基础,按等比例分层抽样进行取样,最大限度地保证全覆盖。

三、运用等比例分层抽样进行旅游客源市场调查的一般程序和方法

一般来说,运用等比例分层抽样进行市场调查分为六个步骤:确定调查目的;确定调查项目、调查单位;样本容量的计算与分配;调查问卷的设计;搜集、整理信息;分析信息,得出结论。

(一)确定调查目的。

调查目的就是通过统计调查所要达到的具体目标,要解决的主要问题。只有确定调查目的,才能解决为什么要调查,进而确定搜集资料的范围和方法以便更好地组织统计调查工作。调查目标需要根据每次调查要解决的问题而确定,要求简单、明确。

(二)调查对象、调查单位。

调查对象是根据调查目的而确定的被调查的统计总体。调查单位是构成调查对象的每一个总体单位。

(三)样本容量的计算与分配。

抽样样本控制要注意三个问题:一是代表性问题,客观上要求抽查人群全覆盖;二是要反映出旅游市场客源分布的特殊性,主次得当,分层抽样;三是要在保证一定把握度的前提下,按等比例进行,有利于计算。

(四)调查问卷的设计。

1. 调查问卷的基本结构。

调查问卷是问卷调查的主要工具,科学地设计问卷,是抽样问卷的关键性环节。问卷的设计质量,直接影响到问卷调查的回收率、有效率以及被调查者的回答质量。概括地说,是由调查问卷的题目、调查与填表说明信、问题和答案、调查实施情况记录等四部分组成。确定题目的原则是主题鲜明、准确,易于填答,易于理解。力求观点新颖、明确具体、言简意赅,题目富于表现力和感染力;调查说明是关于调查的目的、内容与要求;填表说明是告诉调查对象如何填写问卷;问卷的主体内容是指问题和答案,这是问卷的最主要的、最基本的组成部分,通常这一部分既要提出问题,又要给出相应的答案;调查实施情况记录一般设计在整个调查问卷的尾部,用来记录该卷的调查完成情况和有待进一步审核、校正、复查的问题。

2. 设计调查问卷时的常用方法和技巧。

一是问题的提问方式一般有开放式和封闭式。开放式提问要求被调查者根据自身情况自由作答,常常能了解旅游者的真实信息,但不便于统计,主要用于探索性调查;封闭式提问给定备选答案,要求被调查者从中作出选择;对于敏感性问题,应采取迂回方式,避免引起受访者的误解;尽量多使用封闭式,少使用开放式。二是所有的问题排列,要注意问题的逻辑性及排列次序,便于被调查者顺利作答。一般,应该将难度大、开放性和敏感性强的置于后面,使被调查者以一种轻松、愉快的感觉开始作答。三是问卷答案的设计既要遵循互斥性原则,又要遵循完备性原则。

(五)搜集、整理信息。

通过统计调查所搜集得到的原始数据资料都是零乱的,只能反映出样本单位的具体情况和事物的表面现象,不能深刻说明事物的本质,揭示事物的内在规律。只有通过科学的整理加工,才能得到反映总体特征的综合资料,为进一步的分析做准备。搜集的资料是否准确、真实、可靠,统计整理是否能如实揭示出事物的内在规律。是统计分析的前提,决定了调查研究的效果。

1. 旅游客源市场调查的方法。

按搜集资料的方法不同,统计调查可分为间接调查和直接调查。间接调查是指间接地搜集第二手资料的统计调查。如一些出版物、商业资料、网络等媒介上提供的与调查对象有关的所有资料和数据。其特点是:成本低、速度快,来源广,但时效性差,精确度和可靠度不够。直接调查是指直接搜集第一手统计资料的统计调查,如问卷调查法、访问法、网络直拉调查法等。

2. 统计整理的主要步骤。

通过对统计资料进行审核、分组、汇总和编制统计图表等环节。审核主要对资料的准确性、及时性和完整性审核;分组汇总是指根据研究目的和分析的需要,选择整理的标志,并划类分组;编制统计图表是指对整理好的资料编制成统计表或绘制成统计图,以简明扼要地反映旅游客源市场的特征。

(六)分析信息,得出结论。

分析信息,一般主要采用两个软件SPSS和EXCE。SPSS(社会科学统计软件包)是一种集成化的计算机数据处理应用软件;EXCEL(又称电子表格)是微软OFFICE办公软件中的一个重要组成部分,常用来处理统计调查、理化实验等研究型数据的处理。将整理后的有效数据输入SPSS数据库,用SPSS软件进行初步处理;再使用EXCEL处理进行修正,最后再运用SPSS作二次处理.基本上可以保证处理与分析所得到的数据的有效性和科学性。

四、研究难点

(一)数据的搜集、甄别与处理。

由于旅游客源市场的特殊性,如何去搜集、甄别与处理有关数据是运用等比例分层抽样调查的一个主要难点。

(二)分析与检验。

如何利用相关处理软件处理和数学建模去分析数据、得出结论,并检验结果的正确程度,是运用等比例分层抽样调查旅游客源市场的另一个主要难点。本研究不够,还有待于进一步研究。

参考文献

[1]李享.关于抽样调查在旅游调研中存在的问题探讨[J].旅游学刊,1999,14(3):54~57

[2]甘武琳,赵涛.问卷技术在旅游市场调查中存在的问题及改善方法[J].广西大学学报(哲学社会科学学报),2003,25(3):40~42

[3]许春晓.旅游规划新论----市场导向型旅游规划的理论、方法与实践[M].长沙:湖南师范大学出版社,2002:82~108

[4]保继刚等.旅游开发研究:原理、方法、实践[M].北京:科技出版社,1996

[5]陆大道.区域发展及其空间结构[M].北京:科学出版社,1995

[6]邓明艳.成都旅游市场时空分布模型研究[J].国土经济,2000,3:41~42

[7]林刚.试论旅游地的中心结构[J].经济地理,1996,16(2)

分层抽样 篇4

导读:就爱阅读网友为您分享以下“盐城市高中数学第二章统计2.1分层随机抽样教学设计苏教版3讲解”资讯,希望对您有所帮助,感谢您对92to.com的支持!分层随机抽样

一、教学内容解析 《分层随机抽样》 是苏教版普通高中课程标准实验教科书必修三第 2 章第一节的第三课 时。必修三的关于统计的这一教学内容,作用是让学生感受统计的“用样本估计总体”的思 想,学会收集数据,进而对其进行整理,选用合适的方法进行分析,最后能用特征数反映总 体的特征。初步掌握在实际问题中,用统计知识分析、解释生活现象的基本方法。分层抽样 这一节内容是对前面简单随机抽样和系统抽样方法的一个补充,学完这节课后,学生可以形 成较为完整的抽样方法体系,为后面对总体的分析打下坚实的基础,所以本节课起到承上启 下的作用。本节课,教材共设置了一个案例和一个实践

操作问题,从“为什么要进行分层抽样”到 “如何实施分层抽样”,最后阐述“各种抽样方法的适用范围和特点”。整节课,深入浅出 地将一个看似简单的数学概念进行全新地解读,引导学生用数学的思维方法分析现实的问 题,能够透过繁杂的现象,看出其中蕴含的数学道理,全面提升学生的数学素养。经过思考,教者为了凸显统计抽样的必要性和为什么要进行分层抽样,对美国历史上发生的预测总统大 选的失败的案例引入课题,层层深入地说明抽样的要求和分层抽样的适用范围。统计是应用 型的数学知识,脱离了实践操作,就是空谈。本节课,教者安排了一个操作案例,从日常的 教学活动中选取了“班级学生平均身高估计”这个课题,让学生实际操作,真正体现数学在 解决实际问题中的价值和作用,进而真正将统计知识应用到实际问题中。

二、教学目标设计 1.通过具体实例的研究,了解分层抽样的方法以及科学,合理选用抽样方法的必要性。2.了解分层抽样的操作步骤 3.通过对实际问题的对比分析,了解各种抽样方法的适用范围,使学生能根据具体情况选择 适当的抽样方法解决问题。4.了解分层随机抽样的必要性 5.通过实例,在与简单随机抽样的比较中,让学生思考,讨论它的特点,并能根据实际问题 的需要设计恰当的抽样方法,提升学生的数据分析素养。

三、学生学情分析 在必修三的学习中,由于教材的内容在苏教版初中教材中已有涉及,学生对统计 的思1 3

想有初步的了解,学生对这部分内容比较熟悉,教学上更应侧重于应用和实践操作。所以,设置什么样案例,让问题更有代表性,怎样进行课题实践操作,让每个学生参与其中,得到 体验和提升,是本节课成败的关键所在,也是教者着力最多的地方。

四、教学策略分析 为了达成教学目标,突出重点,突破难点,同时由于本节课 是实践操作型的特点,运 用两种教学模式,充分调动学生的积极性,构建有效课堂。一是采用传统的“教师讲授引导式”。本节课的开始,教师通过具体案例,将统计的 思想和抽样的要求渗透其中,紧扣教材内容,让学生明确本节课要完成的任务; 二是“学生动手实践检验”,结合具体问题,从收集数据,找出正确的抽样方法,到 最后数据的分析整理,让学生从中探寻、感悟统计的思想,可以在具体情境中,选择正确的 抽样方法独立完成一次统计抽样过程。

五、教学过程 5.1 设置情境 师:今年是美国总统大选年,希拉里和特朗普正在为总统宝座争得你死我活。在结果出来之 前,各大民调机构和媒体会对选举结果纷纷做出预测。不过美国历史上曾经发生过一次著名 的预测失败的案例.案例 1936 年美国一著名杂志社为了预测总统候选人罗斯福与兰登两人谁能当选,为了了 解公众的意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表,最后收

回 回信 200 多万封,在调查史上是少有的容量,花费了大量的人力、物力,杂志社相信自己的 调查结果——兰登将以 57%对 43%的比例获胜. 最后选举的结果却是罗斯福以 62%对 38% 的巨大优势获胜.试分析这次调查失败的主要原因.(注意在 1936 年电话和汽车只有少数 富人拥有).师: 美国各个阶层对选谁当总统存在着较大分歧,而杂志社从富人阶层中选取的样本不具有 代表性,不能代表全体美国人民的意向,所以导致预测结果失败。那么当总体中的个体差异 比较大时,我们如何抽样,让样本具有更好的代表性呢?我们来看这样一个问题。2 5

【设计意图】: 统计的思想是用样本去估计总体,所以抽取一个能代表总体的样本是进行数学分析的前 题。什么是“好”的样本?较之于生硬的说教,不如举例说明。通过所举的案例学生很快就 能理解,抽样要有“代表性”,这样才能对总体作出合理的估计,达到正确估计总体的目的。那对总体中的个体差异较大的情况,我们如何抽取样本,激发学生的好奇心,引入本节课的 课题。这个案例同时意在培养学生学会用数学的眼光观察世界的习惯,用数学的语言去解释,表达 身边的世界。5.2 提出问题 问题 :为了估计我们班级全体学生(共有 50 人,其中男生 30 人,女生 20 人)的平均身高,我想从班级学生中抽取出容量为 10 的样本进行调查,请问你将如何抽样?(学生讨论)方案 1 用简单随机抽样从 50 人中抽取 10 人 方案 2 用系统抽样法从 50 人中抽取 10 人 师: 还有同学有其他的想法吗? 方案 3 从男生中抽取 6 人,从 女生中抽取 4 人合成 10 人的样本 师:请大家自由讨论下,这三种方案,哪种方案比较好? 学生自由讨论 师:所抽出的样本中什么因素会对样本的平均身高产生重大影响? 生:性别因素 师:为什么? 生:因为男女生的身高存在明显的差异。下面我们具体看一下这几种抽样方法① 全班同学采用简单随机抽样,抽取容量为 10 的样本。生:

简单 随机抽样,有可能抽出的男生偏多,或者女生偏多,这样会与总体的真实情况出 入较大。3 7

②利用学生的学号,用系统抽样的办法抽取 10 位同学的成绩作为样本。生: 系统抽样虽然较简单随机抽样更加便捷,但仍然没有考虑到样本中男女生的人数偏多或 偏少的问题。师:方案 3 明显是考虑到了男女的因素,不会出现男女生人数偏多或偏少的问题,但为什么男生,女生抽出的人数是 6 人和 4 人,而不是各抽 5 人呢? 原因 1:因为总体中的男女生人数之比是 3:2,而样本是要反映总体,所以样本中男女生之 比是 3:2 师:非常好,有没有要补充的? 原因 2:如果男生,女生都各抽 5 人的话,男女生被抽到的可能性是不一样的。总体中男生 人数比女生少,所以男生被抽到的可能性比女生小。师:科学合理的抽样要求每个个体被抽到的可能性是相同的,男生抽 6 人,女生抽 4 人,则 无论男生和女生被抽到的可能性是一样的,所以是合理的抽样。【设计意图】: “性别差异”是影响身高的重要因素,简单随机抽样不能稳定地体现“男生人数与女生人 数是 3:2”的抽样要求。将几种抽样方案进行对比,学生能够感受到“按人数之比”进行 抽样的必要性。师:刚才是我们进行理论分析的结果,那在实际操作中,考虑到了男女因素的方案 3 是否就 一定具有优势呢?统计学是对数据进行收集、整理和分析的数学分支。历史上,数学家为了 收集数据,可以做大量重复的试验。比如,数学家布丰为了检验抛掷硬币,出现正面向上的 概率是 1/2,曾经不间断地

抛掷硬币 4000 多次,从而验证了这个结论。今天我们不妨也学习数学家也做个小小的数学实验,来检验一下这几种抽样方法。5.3 数学实验 5.3.1 准备材料:提供高二某班级身高数据一份。5.3.2 实验过程:(1)两人一个小组,共分为二个大组.第一大组4 9

采用方案 1,利用随机数表法抽取 10 个数据样本,并用计算器算出样本的平均值。第二大组 采用方案 3,先在男生中抽取 6 个数据,再在女生中抽取 4 个数据合成样本,并用计算器算 出样本的平均值.师:我们得到多组数据后,如何对数据进行分析,进一步判断哪组样本数据更接近总体真实 水平 ?(2)用计算机描绘出各组数据的折线图。5.3.3 实验结论:通过数据的折线图,和班级学生身高的实际平均水平作比较,可以发现采 用方案 3 抽取的样本算出的平均值和总体的平均值最为接近,而且数据的波动性更小。【设计意图】:新课程理念要求“教师是引导者、方法的建立者,而不是简单的知识的传授 者”,倡导学生“自主、合作、探究”的学习方法。所以,尽管方案 3 看起来有明显的优点,但我们应该要培养学生看问题不能流于表面,即使不能进行严格的理论证明,也要通过实 践去验证自己的认识是否正确。让学生完整地进行一次数据收集、整理、分析,解释的过程,亲身体会统计学的学科特点,进一步地,提高学生数据分析的素养,全方位地体现新课程理 念。5.3.4 实验反思 师:如果已知班级有个女生个子很高,已经和男生差不多高了,怎么办?5 10

生 1:可以将她剔除掉,生 2:如果剔除的话,就违反了公平性原则,就不是科学合理的抽样。为了减小误差,可以把她的身高数据划归到男生生这一例中去。师:很有道理,这 也就是说我们按照比例抽样,必须要满足每一类型之间的差异要比较大,但是在每一个类型内部,个体之 间差异要尽可能的小,否则就失去了按比例抽样的意义。师:方案 3 就是我们今天要介绍的分层抽样 【设计意图】 创设一个情境,让学生体会分层抽样中对“层”的要求,即层与层之间差异 明显,层次分明,把握住分层的重点。5.4 数学建构,形成概念 你能概括出分层抽样的概念吗? 分层抽样的定义 分层抽样的适用范围 分层抽样的目的 分层的原则 分层抽样的特点 总体“差异明显”为了使样本充分地反映总体的情况(样本有代表性)分成“层次分明”的几部分,(层和层之间的差异要大)按各部分在总体所占的比实施抽样师:你能规划下分层抽样的具体抽样步骤吗? 生:(1)将总体按一定的标准分层;(分层)(2)计算各层的个体数与总体的个体数的比;(定比)(3)按各层个体数与总体的个体数的比确定各层应抽取的样本容量;(确定各层的样本容 量)(4)在每一层进行抽样。师:分层抽样,在实际生活中应用非常广泛,你能举出一些在实际生活中用到分层抽样的例 子吗?【设计意图】 以上,师生进行了大量的数学实践活动,教师需要引导学生用数学的眼光从客

观现实的原型 中,形成抽象的数学概念。“实验、观察、验证、归纳、应用”是本节课的一条主线,至此,6 12

达到了进一步增强学生的抽象思维能力的目标。5.5 数学应用 师:我们现在所处的是“大 数据时代”,互联网日益成为人们获取数据的一个重要来源。例 1.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为 12000 人,其中持各种态度的人数如表所示: 很喜爱 2435 喜爱 4567 一般 3926 不喜欢 1072电视台为进一步了解观众的具体想法和意见,打算从中抽取 60 人进行更为详细的调查,应 怎样进行抽样? 分析:利用分层抽样去抽取 生 1 因为总体中人数较多,所以不宜采用简单随机抽样。师:人数较多能否采用系统抽样? 生:由于持不同的态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥。师:那每一层具体要抽取多少人呢?(板书例题)师:接下来我们具体到每一层应该如何抽样? 生:考虑到人数较多,用系统抽样。师:分层抽样主要是解决总体中差异比较明显的抽样,但具体到每一层,则应该用系统抽样 或是简单随机抽样。【设计意图】 “问题是数学的心脏”,此处,安排一个与本 节课开头类似的案例,学生同样要经历选择 简单随机抽样还是分层抽样的思维过程。但是,此时,学生已经了解分层抽样的概念,能够 明确地提出选择分层抽样的理由。对于分层抽样,学生已经从最初的感知上升到较为深刻的 认识,同

时,能够在数据处理中,灵活地应用,达到了提高学生数学实践能力的目标。师: 目前我们已经学习了三种抽样方法,这就要求我们在实际问题中根据问题的特点科学地 选取合理的抽样方法。例 2.下列问题中,采用怎样的抽样方法较为合理?7 14

(1)从 10 台冰箱中抽取 3 台进行质量检查;(2)某影院有 32 排座位,每排有 40 个座位,座位号为 1—40.有一次报告会坐满了听众,报告会结束以后为听取意见,需留下 32 名听众进行座谈;(3)某学校有 160 名教职工,其中教师 120 名,行政人员 16 名,后勤人员 24 名.为了了解 教职工对校务公开方面的意见,拟抽取一个容量为 20 的样本. 分析(1)总体容量比较小,用抽签法或随机数表法都很方便.(2)总体容量比较大,由于人员没有明显差异,且刚好 32 排,每排人数相同,可用系统抽 样.(3)由于学校各类人员对这一问题看法差异可能很大,故应采用分层抽样方法. 【设计意图】 表面上,这是一组辨析题,学生需要分析具体条件,选择合理的抽样方法进行抽样,温故知 新,加深对不同抽样方法的理解。深层次上讲,统计是应用数学,产 生于生产生活需要,揭示每个实际问题背后的数学原理,并能用数学的方法对收集的数据进行整理、分析,再进 一步指导人们的生产生活。本章是高中阶段与生活实际结 合最紧密的内容,教师应充分利用 这一特点,设置多种情境,让学生置身于多种不同的生活场景,充分感受数学知识在实际生 活中广泛应用,培养学生的理性思维能力.通过例 2 的学习,我们进一步了解到了三种抽样方法的特点

及适用范围,那么这三种抽样方 法,那么之间的区别和联系是什么?我们一起来看一下. 类别 特点 相互联系 适用范围 总体中的个体个数 简单随机抽样 系统抽样 从总体中逐个抽取 较少 抽样过程中 将总体平均分成几部 分,按一定的规则分别 在各部分抽取 性相同 在起始部分抽样时,采 用简单随机抽样 总体中的个体个数 每个个体被 较多 抽到的可能 共同点8 16

分层抽样将总体分成几层,按各 层个体数之比抽取各层抽样时采用简单随 机抽样或系统抽样总体由差异明显的 几部分组成5.6 反思(需要大家去讨论)某城市的两所中学分别对自己学校 12-14 岁学生的身高进行了抽样统计,发现这两所学校 12-14 岁学生的平均身高竟相差了 19CM,这可能吗?他们在抽样的过程中可能出现了哪些问 题? 抽样的代表性不好 1.没 有分层抽样,只是进行了简单随机抽样,分层抽样要考虑到年龄 因素,性别因素. 2.样本的容量较小,也可能会导致差距过大. 3.学校的类型可能不同等原因. 5.7 课堂练习1.某公司生产三种型号的轿车,产量分别为 1200 辆、6000 辆、和 2000 辆.为检验该公司 的产品质量,现用分层抽样的方法抽取 46 辆进行检验,这三种型号的轿车应分别抽 取、、和 辆.2.某所学校有小学部、初中部和高中部,在校小学生、初中生和高中生之比为 5:2:3,且已知初中生有 800 人.现要从这所学校中抽取一个容量为 80 的样本以了解他们对某一问题 的看法,应采用什么抽样方法?从小学部、初中部及高中部各抽取多少名?总体上看,平均 多少名学生中抽取到一名学生?

六、教学设计说明 “分层抽样”在很多教师和学生看来,似乎是很浅显的数学概念,有很多教师认为,根本不 需要“大费周章”地学习它。其实,我们从数学知识的发生、发展、应用、拓展的角度来深 入思考这节课该怎样上,才能感受到数学

教学的魅力。首先,我们为什么要进行分层抽样?回答了这个问题,也就理解了分层抽样的特点和适用范 围。我们希望让知识自然的发生,而不是教师的照本宣科。教者从一个热点时事,美国总统9 18

竞选结果预测提出问题,让学生从荒谬的结论中反思,进而提出 “当总体中个体差异明显时,抽样要有兼顾这种差异”的抽样要求,触及分层抽样的特点,展开本节课的学习,达到“四 两拨千斤” 的效果。接下来,教师和学生就“估计班级全体学生平均身高,需要从班级学生中抽取出样本进行调 查”这个问题展开讨论。师生共同分析、研究、探讨,究竟采用何种方法进行抽样,为后面 的实践操作做好准备。我们从理论上进行分析,鼓励学生深入思考,不要在教师的影响下亦 步亦趋,而是真正培养学生的理性思维能力。在这个环节,我们不但辨析了各自抽样的适用 范围,而且确实了下面将要进行的数学实验的目的。此时,学生经过对各种抽样方法的辨析,初步了解了分层抽样的特点,迫切希望通过实验来验证理论分析的正确性,学生的内心充满 对实验结果的期待,达到了“引而不发跃入也”。本节课最有趣的环节就是数学实验。教师此时是引导员,引导学生进入场地,各自进 行实验;教师也是技术员,将学生能整理的数据输入电脑,进行操作,将结果呈现给学生; 教师也是组织者,有序地安排各大组的学生代表进行实验结果的汇报,与其他组的同学互享 学习成果;教师也是观察者,通过聆听学生的报告,把握学生学习的动态,关注他们的学习进展,发现他们存

在的不足。师生在这个环节,都是学习者,教学互长,共同促进。课程进行到这里,学生已经全面学习了“分层抽样”的概念,数学知识自然形成。学 生不但知道了什么是“分层抽样”,而且通过上面的实验,总结出分层抽样的步骤,加强了 动手实践能力。为了增强教学效果,教师安排了两个例题,进一步辨析,帮助学生识别各种 抽样方法特点,在解决具体问题时,准确地选择合理的抽样方法,达到本节课的教学目的。通过本节课的教学,教师重新认识到数学教育对学生能力培养的重要性。看似简单的现 实问题,如果用数学的思考方式来分析,可以揭示问题蕴含的数学背景,进一步,可以将问 题一般化,不但解决一个问题,而是解决一类问题。数学的课堂教学,不仅仅是数学的基础 知识、基本技能、基本思想的传授,更要训练学生清晰地表达思想方法,有条理地思考、解 决问题,并要对所学进行反思、总结、概括,全面提升学生的数学素养。10 20

分层抽样 篇5

在抽样调查理论中, 最简单也是最核心的抽样方法是简单随机抽样 (SRS, 即Simple Random Sample) , 它的基本思想是从总体单位中抽取一小部分单位, 在抽取过程中保证每个不同的单位被抽中的概率都相等, 然后对样本进行研究分析以此推断总体。但有时在某些调查当中总体规模和样本容量都较大, 且总体的部分单元之间存在较大异质性, 使用简单随机抽样进行推断分析时会偏离总体的真实情况, 此时分层随机抽样 (STRS, 即Stratified Random Sample) 是一种可以很好地适应这种情况的抽样方法。它的基本思想则是将总体单位根据其异质性划分为若干的层, 这些层满足“层差异较小, 层间差异较大”的特征。在此基础上在各层内独立地进行简单随机抽样抽取样本, 以较高的精度估计出各个层的参数, 然后对各层参数的估计值进行加权, 最终得到总体参数的估计。由于充分考虑了总体的结构分布特点, 因此分层随机抽样相比简单随机抽样在估计时能够更加精确有效。

分层随机抽样具有很多的优良性, 然而在分层抽样技术的实践当中, 对于某些调查来说事先进行分层会存在一定的困难。例如, 面对一个现有的抽样框名录, 在调查开始前并不知道每个单位就分层标志而言它应该属于哪一层, 甚至有些情况下各层的单位数也是未知的。而往往某个单位属于哪一层要到数据收集以后才能知道, 例如人口调查中人的标志年龄、性别、民族、政治面貌和教育水平等。在这种情况下, 我们可以先从一个总体中用SRS形式抽取一个样本, 对调查标志进行观察, 然后再对各单元按照某些特征的观察结果进行分层, 用分层抽样的估计方法对总体做出推断。这种抽样由于分层的过程是在随机抽取样本后进行的, 因此叫做事后分层抽样 (PST, 即Post Stratification Sample) 或抽样后分层。

本文主要研究事后分层抽样在某学院2012年12月的大学英语四级考试 (CET-4) 成绩分析中的应用, 用PST和SRS分别进行总体均值 (学院CET-4平均分数) 的估计, 并对估计精度进行评价。

一、估计量及性质

本文主要研究各种抽样方法对总体均值估计的性质。本文对抽样方法的优越性评价主要是比较估计量的方差。

当抽取的样本量较大时, 简单随机抽样 (SRS) 、分层抽样 (STRS) 、事后分层抽样 (PST) 对总体均值估计的性质见表1-1所示。

二、抽样方法的应用与实现

1. 已知总体的描述统计信息

某学院报名参加2012年12月大学英语四级考试共2193人。其中104人由于缺考没有成绩。为了研究的方便, 对该104项缺失项予以剔除重新建立抽样框。新的抽样框共2089个单位。其描述统计信息见下表2-1所示。

因为峰度值接近于0, 可以认为这次考试成绩的分布近似服从正态分布。总体均值为377.26, 处于四级正态常模约4%的位置。最高分547分处于正态常模约64%的位置。总体来看成绩并不理想。因此在英语教学调研中, 有时会在无法获得整体成绩名单时需对英语成绩平均水平做出估计, 因此抽样方法将提供一个重要的方法论依据。

2. 两种抽样方法的实现

(1) SRS抽样

简单随机抽样是直接从抽样框中按照事先编好的序号等概率的抽取约10%的样本, 该抽样过程通过SPSS的“选择个案-随机样本个案-样本尺寸-大约总体10%”功能实现。下表2-2为抽取样本后的描述统计分析结果。

(2) PST抽样

在事后分层抽样中, 第一步是先进行简单随机抽样, 这一步直接使用先前所用SPSS模拟抽得的样本, 在第二步中, 用性别进行单指标事后分层。表2-3是由学生名单得到的性别指标和人数的分布情况。

由此可计算出事后层权分别为:W1=28.3%, W2=71.7% (下标1、2的分别表示男、女) 。

使用SPSS对各层的估计量的计算结果见表2-4所示。

事后分层抽样的估计量计算结果见表2-5所示。

(3) 两种抽样方法的比较

将两种抽样方法的估计结果和误差结果列在同一张表中, 详见表3-1。

由表3-1中可以看出, 事后分层抽样的抽样误差小于简单随机抽样, 说明事后分层抽样的估计精度高。同时, 事后分层抽样的绝对偏差小于简单随机抽样的绝对误差, 事后分层估计量的均值估计量更接近真值, 再次说明事后分层抽样的估计精度高。还可以计算出事后分层抽样方法的设计效应deff (design Effect) , 即

由此可见事后分层抽样可提高样本的精度, 使设计效应deff小于1, 减小了抽样方差。因此事后分层抽样比简单随机抽样有更好的估计精度。

从本文的简单随机抽样与事后分层抽样的对比可以看出, 事后分层抽样方法可以对调查样本按已知的总体进行修正, 使样本分布能同已知总体的分布一致。从技术操作流程上说, 事后分层抽样是在简单随机抽样的基础上使用了关于总体的信息, 因此抽样中所估计的总体相较于简单随机抽样来说更接近实际的总体。但值得强调的是, 对于样本的事后分层完全取决于能否得到有关总体的资料。

在本文的抽样案例中, 如果事先无法获取参加2012年CET-4考试的学生的性别指标的分布特征, 就不可能对调查样本进行性别指标事后分2层。因22此, 事后分层抽样能够进行需要具备的一个重要条件是需要2有从其2它来源得到有关总体分布的资料, 如从相关的统计资料、年鉴或者档案获取的总体资料。

总之, 事后分层抽样相较简单随机抽样来说具备更优的抽样精度, 因此在具备能够获取关于相关估计指标的分布信息条件的情况下, 使用事后分层抽样能估计出更接近总体真实值的估计量。

摘要:本文利用某学院2012年12月CET-4的考试成绩数据, 分别采取了简单随机抽样和事后分层抽样, 对该院本次CET-4平均成绩进行了抽样估计, 并分别计算抽样误差和绝对误差, 得出事后分层抽样具有更好的抽样精度的结论。

关键词:简单随机抽样,事后分层抽样,CET-4

参考文献

[1]金勇进.抽样技术[M].中国人民大学出版社, 2012.

[2]冯士雍, 邹国华.在几种常见的抽样方案下的事后分层[J].应用数学学报, 1997, (2) :228-236.

[3]张咪咪, 徐丽, 林筱文.我国抽样调查方法的最新进展[J].统计与决策, 2010, (8) :3.

上一篇:双专业教学带头人下一篇:纤维水泥基复合材料