考点统计

2024-07-31

考点统计(共5篇)

考点统计 篇1

统计与概率主要是研究现实生活中的数据和客观世界中的随机现象, 它通过对数据收集、整理、描述和分析以及对事件发生可能性的刻画, 来帮助人们做出合理的决策.近年来全国各地的中考数学试题, 对于统计与概率的考查, 既关注了对基础知识和基本技能的考查, 又重视了对统计与概率的思想方法的考查, 同时突出了与其他数学内容的综合.主要考点有:

1.能根据具体的实际问题或者提供的资料, 运用统计的思想收集、整理和处理一些数据, 并从中发现有价值的信息, 在中考中多以图表阅读题的形式出现.

2.了解总体、个体、样本、平均数、加权平均数、中位数、众数、极差、方差、频数、频率等概念, 并能进行有效的解答或计算.

3.能够对扇形统计图、频数分布表、频数分布直方图和频数折线图等几种统计图表进行具体运用, 并会根据实际情况对统计图表进行取舍.

4.在具体情境中了解概率的意义, 能够运用列举法 (包括列表、画树状图) 求简单事件发生的概率, 能够准确区分确定事件与不确定事件.

5.加强统计与概率之间的联系, 这方面的题型以综合题为主, 将逐渐成为新课标下中考的热点问题.

下面举例对本部分内容所涉及的概念进行辨析:

一、总体、个体、样本和样本容量的概念辨析

例1为了了解某地区初一年级7 000名学生的体重情况, 从中抽取了500名学生的体重, 就这个问题来说, 下面说法中正确的是 () .

A.7 000名学生是总体B.每个学生是个体

C.500名学生是所抽取的一个样本D.样本容量是500

【辨析】总体是考察的对象的全体, 个体是组成总体的每一个考察对象, 样本是从总体中抽取的一部分个体, 样本容量是样本中个体的数目, 主要关注“考察对象”, 本题应该选D.

二、平均数、中位数、众数的概念辨析

例2某班第二组男生参加体育测试, 引体向上成绩 (单位:个) 如下:4, 6, 9, 11, 13, 11, 7, 9, 8, 12, 这组男生成绩的平均数是_______, 中位数是_______, 众数是_______.

【辨析】相同点:都是为了描述一组数据的集中趋势.不同点:所有数的总和除以总个数是平均数 (所有数都参与计算) , 一组数据先按大小顺序排列, 中间位置上的那个数据 (如果中间有两个则求它们的平均数) 是中位数 (可能是原数据中的数, 也可能不是原数据中的数) , 众数是出现的次数最多的数据 (一组数据可以有不止一个众数, 也可以没有众数, 如果有众数, 一定是原数据中的数) .本题答案分别为9, 9, 9和11.

三、极差、方差、标准差的概念辨析

例3甲、乙两人各射靶5次, 已知甲所中环数是8、7、9、7、9, 乙所中的环数的平均数为8, 方差s乙2=0.4, 那么, 对甲、乙的射击成绩的正确判断是 () .

A.甲的射击成绩较稳定B.乙的射击成绩较稳定

C.甲、乙的射击成绩同样稳定D.甲、乙的射击成绩无法比较

【辨析】相同点:都是为了描述一组数据的离散程度.不同点:极差是一组数据中的最大值与最小值的差, 方差顾名思义是“差的平方”, 因有多个“差的平方”, 所以要求平均数, 概括为“先平均, 再求差, 然后平方, 最后再平均”, 设一组数据是x1, x2, x3, …xn, 是这组数据的平均数, 则这组数据的方差是:标准差是方差的算术平方根, 公式可表示为:方差 (标准差) 越大 (越小) , 说明数据波动就越大 (越小) , 本题应该选B.

考点统计 篇2

中国大学网在历年的考研数学中,概率统计部分的概念多,公式多,结论多,综合运用多。在数一中概率统计分值为34分,占22.6%。部分考生由于大学阶段未学过或虽学过但由于时间较短来不及复习而痛失基本题的分值,这非常可惜。

因此本文希望能帮助同学梳理概率统计的基础知识点,突出概率统计考题特点:概念多,内涵少,理论依据不复杂,而且解法单一。望能帮助学员理清重点,有的放矢。

一、随机事件与概率

本章需要掌握概率统计的基本概念,公式。其核心内容是概率的基本计算,尤其要熟练掌握古典概型题目的求解,在计算中需要综合运用概率的加法公式、乘法公式、全概率公式以及贝叶斯(Bayes)公式,还需要熟悉排列组合综合运用。

二、随机变量及其分布

本章必须掌握六种典型的随机变量的分布函数(密度函数)。离散型随机变量有0―1分布、二项分布B(n,p)、泊松(Poisson)分布 ;连续型随机变量均匀分布U(a,b)、正态分布 、指数分布 。这些典型的随机变量必须熟练掌握他们的分布函数,密度函数。当然这些公式在记忆可能有些难度,因此可以用对应模型记忆,比如二项分布概率公式,可以理解成把一枚硬币重复抛N次,正面朝上的概率是多少。这样才是在理解基础上的记忆,效果明显,既不容易忘,又能够正确运用到题目的解决中;

随机变量函数的分布,尤其是随机变量X,Y的加法、最大值的函数分布在08,均考过。这部分同时需要结合重积分的计算。

三、多维随机变量的分布

理解二维离散、连续随机变量的联合分布(密度)、边缘分布(密度)的概念;

熟练计算条件概率密度(常见考点);

能够应用重积分的性质计算二维随机变量简单函数的分布,会求多个相互独立随机变量简单函数的分布。

四、随机变量的数字特征

刻画随机变量的性质的数字特征是概率统计的重要内容,不仅是本章内容的重点,并且在全书中,亦是考察的重点、难点。

熟练掌握数字特征,包括数学期望(均值)、方差、标准差定义及其性质;

在掌握这些基本概念后,需要会计算随机变量函数的数学期望,矩、协方差、相关系数性质及其公式,尤其是变量的函数的期望、方差公式(这些是在后面统计章节运用最多的公式);

独立与相关性概念区分。独立能够推出不相关,反之并不一定成立。因相关性考察的是随机变量间的线性关系,两个随机变量可能不存在线性关系(及不相关),但是有其他的函数关系,因此并不一定独立。并且注意二维正态随机变量的独立性与相关性的等价性(这点在题目中经常体现)。

五、大数定律和中心极限定理

了解大数定律和中心极限定理的内容,并熟记它们成立的条件(独立同分布)。

求解各概率分布已知的若干个独立随机变量组成的系统满足某种关系的概率(或已知概率求随机变量个数)的问题,一般采用中心极限定理处理。

六、数理统计的`基本概念

本章是统计章节的基石,因此需要非常熟练掌握其中的定义,运算法则。

数理统计的基本概念主要是总体、简单随机样本、统计量、样本均值、样本方差及样本矩。重点是正态总体的抽样分布,包括样本均值、样本方差、样本矩、两个样本的均值差、两个样本方差比的抽样分布;

熟练掌握 分布、t分布和F分布的概念性质.可了解它们之间的关系,来记忆它们的定义(这三个分布式后续章节统计方法的基础,需要熟练掌握它们的定义及数字特征);

若为总体X的一组简单随机样本,则凡是涉及到统计量的分布问题,一般要用到 分布,t分布和F分布的定义进行讨论;

正态总体的样本均值与样本方差的分布,所得到的3个定理,是后续章节的理论基础,并且其结论是考试的重点!!

七、参数估计

参数估计是统计中的基本方法,尤其是点估计,是比较常用,简单,也是历年考试的重点,基本上每年的考试都会涉及到点估计。

掌握矩估计法(一阶矩、二阶矩)和最大似然估计法。这两个估计法思路清晰,求法固定,而且基本作为解答题出现,因此可以说是考试的得分题目;

估计量的估计量的无偏性、有效性(最小方差性)和一致性(相合性)的概念,其中估计量的无偏性是历年的考试重点。(常考点:样本方差是总体的方差的无偏估计);

理解区间估计的概念,会求单个正态总体的均值和方差的置信区间,会求两个正态总体的均值差和方差比的置信区间(本节需要熟练掌握上一章的3个定理)。

八、假设检验

假设检验是在总体的分布函数完全未知或只知其形式,但不知其参数的情况下,提出对总体的假设,是统计方法的另一类思路。

统计与概率考点与题型分析 篇3

一、随机抽样

考纲要求

(1)理解随机抽样的必要性和重要性.

(2)会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样.

基本考点与题型

1. 简单的随机抽样

例1. 我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )

A.134石 B.169石 C.338石 D.1365石

答案 B.

解析 设这批米内夹谷的个数为x,则由题意并结合简单随机抽样可知,=,解得x≈169,故应选B.

评注 本题以数学史为背景,重点考查简单的随机抽样及其特点,通过样本频率估算总体频率,难度不大.在高考中,考查简单的随机抽样的题目往往比较简单.

2. 系统抽样

例2.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.

若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.

答案 4.

解析 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.

评注 本题将系统抽样与茎叶图综合在一起考查,难度不大.对于系统抽样问题,我们要掌握两点:(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本;(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.

3. 分层抽样

例3. 某学院的A,B,C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取学生________名.

答案 40.

解析 抽样比为=,∴A,B专业共抽取38+42=80名,

故C专业抽取120-80=40名.

评注 分层抽样是三种抽样方法中最重要的一种抽样方法,也是高考命题的热点,多以选择题或填空题的形式出现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:一是计算某一层应抽取的样本数;二是求样本容量.

二、用样本估计总体

考纲要求

(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.

(2)理解样本数据标准差的意义和作用,会计算数据标准差.

(3)能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.

(4)会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.

(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.

基本考点与题型

1. 频率分布直方图

例4.(2016·北京)某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:

(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?

(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.

答案 (1)3;(2)10.5元.

解析 (1)由用水量的频率分布直方图知:

该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.

所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.

依题意,w至少定为3.

(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:

根据题意,该市居民该月的人均水费估计为:

4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5元.

评注 本题主要考查频率分布直方图求频率,频率分布直方图求平均数的估计值.由频率分布直方图进行相关计算时,需掌握下列关系式:(1)×组距=频率;(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.

2. 茎叶图

例5. 某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:

①分别估计该市的市民对甲、乙两部门评分的中位数;

②分别估计该市的市民对甲、乙两部门的评分高于90的概率;

③根据茎叶图分析该市的市民对甲、乙两部门的评价.

答案 ①75,67. ②0.1,0.16. ③ 对甲部门评价较高.

解析 ①由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.

50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.

②由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.

③由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.

评注 在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.

3. 样本的数字特征

例6.(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.

(1)求直方图中x的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?

答案 (1)0.0075.(2)230,224.(3)5.

解析 (1)由(0.002 + 0.0095 + 0.011 + 0.0125 + x + 0.005 + 0.0025)×20=1得x=0.0075,

∴直方图中x的值为0.0075.

(2)月平均用电量的众数是=230.

∵(0.002+0.0095+0.011)×20=0.45<0.5,

∴月平均用电量的中位数在[220,240)内,设中位数为a,则:

(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5,解得a=224,即中位数为224.

(3)月平均用电量在[220,240)的用户有0.0125×20×100=25户,

同理可求月平均用电量为[240,260),[260,280),[280,300)的用户分别有15户、10户、5户,

故抽取比例为=,

∴从月平均用电量在[220,240)的用户中应抽取25×=5户.

评注 样本的数字特征是每年高考的热点,且常与频率分布直方图、茎叶图等知识相综合考查.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.

三、变量间的相关关系

考纲要求

(1)会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.

(2)了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程.

基本考点与题型

1. 相关关系的判断

例7. 为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )

A. 线性相关关系较强,b的值为1.25

B. 线性相关关系较强,b的值为0.83

C. 线性相关关系较强,b的值为-0.87

D. 线性相关关系较弱,无研究价值

答案 B.

解析 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.

评注 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性.

2. 线性回归方程

例8.(2014·重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )

A. =0.4x+2.3 B. =2x-2.4

C. =-2x+9.5 D. =-0.3x+4.4

答案 A.

解析 依题意知,相应的回归直线的斜率应为正,排除C,D.

且直线必过点(3,3.5)代入A,B,得A正确.

评注 回归直线方程 = x+必过样本点中心(,).

四、随机事件的概率

考纲要求

(1)了解随机事件发生的不确定性和频率的稳定性,了解概率意义以及频率与概率的区别.

(2)了解两个互斥事件的概率加法公式.

基本考点与题型

1. 随机事件概率的求法

例9. 随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:

(1)在4月份任取一天,估计西安市在该天不下雨的概率;

(2)西安市某学校拟从4月份的一个晴天开始举行连续2天的运动会,估计运动会期间不下雨的概率.

解析 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为=.

(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为. 以频率估计概率,运动会期间不下雨的概率为.

评注 本题主要考查随机事件的概率与频率的关系和随机事件概率的求法:(1)频率反映了一个随机事件出现的频繁程度,频率是随机的,而概率是一个确定的值,通常用概率来反映随机事件发生的可能性的大小,有时也用频率来作为随机事件概率的估计值.(2)利用概率的统计定义求事件的概率,即通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数,这个常数就是概率.

2. 互斥事件与对立事件的概率

例10. 甲、乙两人下棋,两人下成和棋的概率是,甲获胜的概率是,则甲不输的概率为( )

答案 A.

解析 不输包括和棋与获胜两种情形,故甲不输概率为+=.

评注 运用概率加法的前提是事件互斥,不输包含赢与和,两种互斥,可用概率加法,本题属于简单题.

五、古典概型

考纲要求

(1)理解古典概型及其概率计算公式.

(2)会计算一些随机事件所含的基本事件及事件发生的概率

基本考点与题型

1. 简单的古典概型

例11. 小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M,I,N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )

答案 C.

解析 开机密码的可能有:

(M,1),(M,2),(M,3),(M,4),(M,5),(I,1),(I,2),(I,3),(I,4),(I,5),(N,1),(N,2),(N,3),(N,4),(N,5)共15种可能,

所以小敏输入一次密码能够成功开机的概率是.

评注 作为客观题形式出现的古典概型试题,一般难度不大,解答常见错误是在用列举法计数时出现重复或遗漏,避免此类错误发生的有效方法是按照一定的标准进行列举.

2. 复杂的古典概型

例12. 某中学调查了某班全部45名同学参加书法社团和演讲社团的情况,数据如下表:(单位:人)

(1)从该班随机选1名同学,求该同学至少参加上述一个社团的概率;

(2)在既参加书法社团又参加演讲社团的8名同学中,有5名男同学A1,A2,A3,A4,A5,3名女同学B1,B2,B3. 现从这5名男同学和3名女同学中各随机选1人,求A1被选中且B1未被选中的概率.

根据题意,这些基本事件的出现是等可能的.

事件“A1被选中且B1未被选中”所包含的基本事件有:{A1,B2},{A1,B3},共2个.

因此A1被选中且B1未被选中的概率为P=.

评注 此类问题一般以解答题的形式出现,基本方法有:(1)将所求事件转化成彼此互斥的事件的和事件,再利用互斥事件的概率加法公式求解.(2)先求其对立事件的概率,再利用对立事件的概率公式求解.

3. 古典概率与统计的综合

例13. 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.

B地区用户满意度评分的频数分布表

(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);

(2)根据用户满意度评分,将用户的满意度分为三个等级:

估计哪个地区用户的满意度等级为不满意的概率大?说明理由.

解析 (1)如图所示:

通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.

(2)A地区用户的满意度等级为不满意的概率大.

记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.

由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,

P(CB)的估计值为(0.005+0.02)×10=0.25.

所以A地区用户的满意度等级为不满意的概率大.

评注 有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点.概率与统计结合题,无论是直接描述还是利用频率分布表、频率分布直方图、茎叶图等给出信息,只需要能够从题中提炼出需要的信息,则此类问题即可解决.

六、几何概型

考纲要求

(1)了解随机数的意义,能运用模拟方法估计概率.

(2)了解几何概型的意义.

基本考点与题型

1. 与长度有关的几何概型

例14. 某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( )

答案 B.

解析 因为红灯持续时间为40秒.

所以这名行人至少需要等待15秒才出现绿灯的概率为=.

评注 对于几何概型的概率公式中的“测度”要有正确的认识,它只与大小有关,而与形状和位置无关,在解题时,要掌握“测度”为长度、面积、体积、角度等常见的几何概型的求解方法,本题的测度为长度,是高考中经常出现的一类几何概型送分题.

2. 与面积有关的几何概型

例15. 从区间[0,1]随机抽取2n个数x1,x2,…,xn,y1,y2,…,yn,构成n个数对(x1,y1),(x2,y2),…,(xn,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为( )

答案 C.

解析 利用几何概型,圆形的面积和正方形的面积比为==,所以π=.

评注 求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到全部试验结果构成的平面图形,以便求解.

3. 与其它知识交汇的几何概型

例16. 在区间[0,1]x+y≤上随机取两个数x,y,记p1为事件“x+y≤”的概率,p2为事件“xy≤”的概率,则( )

答案 D.

解析 如图,满足条件的x,y构成的点(x,y)在正方形OBCA内,其面积为1.事件“x+y≤”对应的图形为阴影△ODE,其面积为××=,故p1=<.

事件“xy≤”对应的图形为斜线表示部分,其面积显然大于,

故p2>,则p1<评注 与其它知识交汇的几何概型以测度为面积的居多,解决这类问题的关键是根据题意画出图形,并计算相关面积.这类问题综合性较强,有一定的难度.

变式训练

1. 某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为( )

A. 2 B. 3 C. 4 D. 5

2. 已知甲,乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m、n的比值=( )

8. 某单位为了了解用电量y(度)与当天平均气温x(℃)之间的关系,随机统计了某4天的当天平均气温与用电量(如下表),运用最小二乘法得线性回归方程为=-2x+a,则a=________.

9. 某次测量发现一组数据(xi,yi)具有较强的相关性,并计算得=x+1,其中数据(1,y1)因书写不清楚,只记得y1是[0,3]上的一个值,则该数据对应的残差的绝对值不大于1的概率为________.(残差=真实值-预测值)

10. 已知正方形ABCD的边长为2,H是边DA的中点. 在正方形ABCD内部随机取一点P,则满足|PH|<的概率为________.

11. 某网站针对“2016年法定节假日调休安排”展开的问卷调查,提出了A,B,C三种放假方案,调查结果如下:

(1)在所有参与调查的人中,用分层抽样的方法抽取n个人,已知从“支持A方案”的人中抽取了6人,求n的值;

(2)在“支持B方案”的人中,用分层抽样的方法抽取5人看作一个总体,从这5人中任意选取2人,求恰好有1人在35岁以上(含35岁)的概率.

12. 某校学生参加了“铅球”和“立定跳远”两个科目的体能测试,每个科目的成绩分为A,B,C,D,E五个等级,该校某班学生两科目测试成绩的数据统计如图所示,其中“铅球”科目的成绩为E的学生有8人.

(1)求该班学生中“立定跳远”科目的成绩为A的人数;

(2)已知该班学生中恰有2人的两科成绩等级均为A,在至少有一科成绩等级为A的学生中,随机抽取2人进行访谈,求这2人的两科成绩等级均为A的概率.

变式训练参考答案与解析

1. B. 2. D. 3. A. 4. C. 5. D. 6. C. 7. C. 8. 60. 9. . 10. +. 11. (1)n=40;(2). 12.(1)3;(2).

1. 系统抽样的抽取间隔为=6,设抽到的最小编号为x,则x+(6+x)+(12+x)+(18+x)=48,解得x=3.

2. 根据茎叶图,得乙组的中位数是33,甲组的中位数也是33,即m=3,又甲=(27+39+33)=33,所以乙=(20+n+32+34+38)=33,解得n=8,所以=.

3. 分数低于112分的人对应的频率/组距为0.09,分数不低于120分的人数对应的频率/组距为0.05,故其人数为×0.05=10人.

12.(1)因为“铅球”科目的成绩等级为E的学生有8人,所以该班有8÷0.2=40人,所以该班学生中“立定跳远”科目的成绩等级为A的人数为40×(1-0.375-0.375-0.15-0.025)=40×0.075=3.

(2)由题意可知,至少有一科成绩等级为A的有4人,其中恰有2人的两科成绩等级均为A,另2人只有一个科目成绩等级为A.

设这4人为甲、乙、丙、丁,其中甲、乙是两科成绩等级都是A的同学,则在至少有一科成绩等级为A的学生中,随机抽取2人进行访谈,基本事件空间为Ω={(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁)},一共有6个基本事件.

点击高考中的统计考点 篇4

一、考查抽样方法

例1 (2012年江苏卷2) 某学校高一、高二、高三年级的学生人数之比为3∶3∶4, 现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本, 则应从高二年级抽取名学生.

解:抽取比例与学生比例一致.设应从高二年级抽取x名学生, 则x∶50=3∶10.

解之, 得x=15.

例2 (2012年山东卷) 采用系统抽样方法从960人中抽取32人做问卷调查, 为此将他们随机编号为1, 2, …, 960, 分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中, 编号落入区间[1, 450]的人做问卷A, 编号落入区间[451, 750]的人做问卷B, 其余的人做问卷C, 则抽到的人中, 做问卷B的人数为 () .

解:由系统抽样的特点知, 抽取号码的间隔为=30, 抽取的号码依次为9, 39, 69, …, 939.落入区间[451, 750]的有459, 489, …, 729, 这些数构成首项为459, 公差为30的等差数列, 设有n项, 显然有729=459+ (n-1) ×30.解之, 得n=10, 所以做问卷B的有10人, 故选C.

例3 (2012年天津卷) 某地区有小学21所, 中学14所, 大学7所, 现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查.

(Ⅰ) 求应从小学、中学、大学中分别抽取的学校数目.

(Ⅱ) 若从抽取的6所学校中随机抽取2所学校做进一步数据分析, (1) 列出所有可能的抽取结果; (2) 求抽取的2所学校均为小学的概率.

故从小学、中学、大学中分别抽取的学校数目为3, 2, 1.

(Ⅱ) (1) 在抽取到的6所学校中, 3所小学分别记为A1, A2, A3, 2所中学分别记为A4, A5, 大学记为A6, 则抽取2所学校的所有可能结果为{A1, A2}, {A1, A3}, {A1, A4}, {A1, A5}, {A1, A6}, {A2, A3}, {A2, A4}, {A2, A5}, {A2, A6}, {A3, A4}, {A3, A5}, {A3, A6}, {A4, A5}, {A4, A6}, {A5, A6}, 共15种.

(2) 从6所学校中抽取的2所学校均为小学 (记为事件B) 的所有可能结果为{A1, A2}, {A1, A3}, {A2, A3}共3种,

点评:例1考查了抽样方法中的分层抽样, 解题的关键是明确分层抽样是每层按同一比例抽样.例2考查了系统抽样的概念以及等差数列的概念和通项公式.例3既考查了分层抽样, 又考查了用列举法计算随机事件所含的基本事件数, 古典概型及其概率计算公式等基础知识.考查数据处理能力和运用抽样方法、概率知识解决实际问题的能力.

二、考查统计图表

例4 (2012年陕西卷) 从甲、乙两个城市分别随机抽取16台自动售货机, 对其销售额进行统计, 统计数据用茎叶图表示 (如图1所示) .设甲、乙两组数据的平均数分别为珚x甲、珚x乙, 中位数分别为m甲m乙, 则 () .

解:直接利用公式求解.

故选B.

例5 (2011年浙江卷) 某中学为了解学生数学课程的学习情况, 在3000名学生中随机抽取200名, 并统计这200名学生的某次数学考试成绩, 得到了样本的频率分布直方图 (如图2) .根据频率分布直方图推测, 这3000名学生在该次数学考试中成绩小于60分的学生数是.

解:由直方图易得数学考试中成绩小于60分的频率为 (0.002+0.006+0.012) ×10=0.2, 所以所求分数小于60分的学生数为3000×0.2=600.

例6 (2012年广东卷) 某班50位学生期中考试数学成绩的频率分布直方图如图3所示, 其中成绩分组区间是[40, 50) , [50, 60) , [60, 70) , [70, 80) [80, 90) , [90, 100].

(Ⅰ) 求图中x的值;

(Ⅱ) 从成绩不低于80分的学生中随机选取2人, 该2人中成绩在90分以上 (含90分) 的人数记为ξ, 求ξ的数学期望.

解: (Ⅰ) 由频率分布直方图知,

解之, 得x=0.018.

(Ⅱ) 由频率分布直方图知, 成绩不低于80分的学生人数为 (0.018+0.006) ×10×50=12, 成绩在90分以上 (含90分) 的人数为0.006×10×50=3.

因此ξ可能取0, 1, 2三个值.

ξ的分布列为:

点评:例4与例5主要考查了茎叶图、频率分布直方图及读图、识读和用图的能力.例6主要考查频率分布直方图与概率的关系以及离散型随机变量分布列的求法和数学期望的求法.

三、考查数据的数字特征

(A) nm

(C) n=m (D) 不能确定

解:利用两个样本平均数表示总体平均数, 从而确定系数α.

∴n

例8 (2012年安徽卷) 甲、乙两人在一次射击比赛中各射靶5次, 两人成绩的条形统计图如图4所示, 则 () .

(A) 甲的成绩的平均数小于乙的成绩的平均数

(B) 甲的成绩的中位数等于乙的成绩的中位数

(C) 甲的成绩的方差小于乙的成绩的方差

(D) 甲的成绩的极差小于乙的成绩的极差

解:由条形统计图得到相关数据, 然后利用平均数、中位数、方位差、极差的概念求解.

由条形统计图知,

甲射靶5次的成绩分别为:4, 5, 6, 7, 8;

乙射靶5次的成绩分别为:5, 5, 5, 6, 9.

甲的成绩的中位数为6, 乙的成绩的中位数为5.故B不正确.

甲的成绩的极差为:8-4=4, 乙的成绩的极差为:9-5=4,

故D不正确.故选C.

例9 (2011年江西卷) 变量X与Y相对应的一组数据为 (10, 1) , (11.3, 2) , (11.8, 3) , (12.5, 4) , (13, 5) ;变量U与V相对应的一组数据为 (10, 5) , (11.3, 4) , (11.8, 3) , (12.5, 2) , (13, 1) .r1表示变量Y与X之间的线性相关系数, r2表示变量V与U之间的线性相关系数, 则 () .

解:由线性相关系数公式知,

∴r1>0, r2<0.故选C.

例10 (2011年北京卷) 以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊, 无法确认, 在图5中以X表示.

(Ⅰ) 如果X=8, 求乙组同学植树棵数的平均数和方差;

(Ⅱ) 如果X=9, 分别从甲、乙两组中随机选取一名同学, 求这两名同学的植树总棵数Y的分布列和数学期望.

解: (Ⅰ) 当X=8时, 由茎叶图可知, 乙组同学的植树棵数是8, 8, 9, 10,

(Ⅱ) 当X=9时, 由茎叶图可知, 甲组同学的植树棵数是9, 9, 11, 11;乙组同学的植树棵数是9, 8, 9, 10.分别从甲、乙两组中随机选取一名同学, 共有4×4=16 (种) 可能的结果, 这两名同学植树总棵数Y的可能取值为17, 18, 19, 20, 21.事件“Y=17”等价于“甲组选出的同学植树9棵, 乙组选出的同学植树8棵”, 所以该事件有2种可能的结果, 因此

所以随机变量Y的分布列为:

点评:以上四例通过不同的方式考查了对平均数、中位数、极差、随机变量的分布列、数学期望、方差、线性相关系数等数字特征的理解与求法的驾驭能力, 数据处理能力及综合分析解决问题的能力.

四、考查回归分析

例11 (2012年湖南卷) 设某大学的女生体重y (单位:kg) 与身高x (单位:cm) 具有线性相关关系, 根据一组样本数据 (xi, yi) (i=1, 2, …, n) , 用最小二乘法建立的回归方案为^y=0.85x-85.71, 则下列结论中不正确的是 () .

(A) y与x具有正的线性相关关系

(B) 回归直线过样本点的中心 (珚x, 珔y)

(C) 若该大学某女生身高增加1cm, 则其体重约增加0.85kg

(D) 若该大学某女生身高为170cm, 则可断定其体重必为58.79kg

解:根据线性回归方程中各系数的意义求解.由于线性回归方程中x的系数为0.85, 因此y与x具有正的线性相关关系, 故A正确.又线性回归方程必过样本中心点 (珚x, 珔y) , 因此B正确.由线性回归方程中系数的意义知, x每增加1cm, 某体重约增加0.85kg, 故C正确.当某女生的身高为170cm时, 其体重估计值是58.79kg, 而不是具体值, 因此D不正确.故选D.

例12 (2011年安徽卷) 某地最近十年粮食需求量逐年上升, 下表是部分统计数据:

(Ⅰ) 利用所给数据求年需求量与年份之间的回归直线方程^y=bx+a;

(Ⅱ) 利用 (Ⅰ) 中所求出的直线方程预测该地2012年的粮食需求量.

解: (Ⅰ) 由所给数据看出, 年需求量与年份之间是近似直线上升的, 下面求回归直线方程, 为此对数据预处理如下:

对预处理后的数据, 容易算得

由上述计算结果知, 所求回归直线方程为

(Ⅱ) 利用直线方程 (1) , 可预测2012年的粮食需求量为

点评:以上两列主要考查了回归分析的基本思想及其初步应用、回归直线的意义和求法、数据处理的基本方法和能力, 考查运用统计知识解决简单实际应用问题的能力.

五、有关综合问题

例13 (2012年湖南卷) 某超市为了解顾客的购物量及结算时间等信息, 安排一名员工随机收集了在该超市购物的100位顾客的相关数据, 如下表所示.

已知这100位顾客中一次购物量超过8件的顾客占55%.

(Ⅰ) 确定x, y的值, 并估计顾客一次购物的结算时间的平均值;

(Ⅱ) 求一位顾客一次购物的结算时间不超过2分钟的概率. (将频率视为概率) 獉

解: (Ⅰ) 由已知得25+y+10=55, x+30=45, 所以x=15, y=20.该超市所有顾客一次购物的结算时间组成一个总体, 所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本, 顾客一次购物的结算时间的平均值可用样本平均数估计, 其估计值为

因为A=A1UA2UA3, 且A1, A2, A3是互斥事件,

故一位顾客一次购物的结算时间不超过2分钟的概率为

例14 (2012年辽宁卷) 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况, 随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

(Ⅰ) 根据已知条件完成下面的2×2列联表, 并据此资料你是否认为“体育迷”与性别有关?

(Ⅱ) 将上述调查所得的频率视为概率.现在从该地区大量电视观众中, 采用随机抽样方法每次抽取1名观众, 抽取3次, 记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的, 求X的分布列, 期望E (X) 和方差D (X) .

注:nij表示第i行第j列, i=1, 2, j=1, 2, ni+表示第i行合计值, n+j表示第j列合计值, i=1, 2, j=1, 2.

解: (Ⅰ) 由频率分布直方图可知, 在抽取的100人中, “体育迷”有25人, 从而2×2列联表如下:

将2×2列联表中的数据代入公式计算, 得

因为3.030<3.841, 所以没有理由认为“体育迷”与性别有关.

(Ⅱ) 由频率分布直方图知, 抽到“体育迷”的频率为0.25, 将频率视为概率, 即从观众中抽取一名“体育迷”的概率为

由题意知, X~B (3, ) , 从而X的分布列为:

考点统计 篇5

2.二项式定理重点考查二项展开式中的指定项及二项式的展开式系数问题.

3.概率统计内容是中学数学的重要知识,与高等数学联系非常密切,是进一步学习高等数学的基础,也是高考数学命题的热点内容,纵观全国及各自主命题省市近几年的高考试题,概率与统计知识在选择、填空、解答三种题型中每年都有试题,分值在17分到20分之间.主要考查以下三点:

(1)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;

(2)理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率;

(3)理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些相应的实际问题.

1.20高考试题预测

(1)高考对两个原理及二项式定理的考查.以基础题为主,考查形式比较稳定.

①从内容上看,主要考查分类计数原理和分步计数原理,排列、组合的概念及简单应用.例如全国Ⅰ,6;2010山东,8.

②从考查形式上看,多为选择题和填空题.例如2010北京,4;2010浙江,17.

③从能力要求上看,主要考查学生理解问题的能力、分析和解决问题的能力及分类讨论的思想.例如2010江西,14;2010上海,14.

④从内容上看,高考对二项式定理的考查,主要涉及利用通项公式求展开式的特定项,利用二项展开式性质求系数或与系数有关的问题,利用二项式定理进行近似计算.例如2010全国Ⅰ,5.

上一篇:上消化道下一篇:食管癌切除术后的护理