概率学习论文(共12篇)
概率学习论文 篇1
众所周知, 数学是一门理论性和逻辑性很强的学科, 枯燥的知识, 使得很多同学对数学的学习兴趣不高。但是, 接触概率一章的知识后, 使我改变了以往对数学的认识。概率知识在九年义务教育阶段进行过简单的介绍, 已经具备一定的概率基础知识, 高中阶段的概率更是在初中知识的基础上, 通过实际问题情境, 学习了随机抽样、样本估计总体、线性回归的基本方法, 体会用样本估计总体及其特征的思想;概率学习中, 我们结合具体实例, 通过解决实际问题学习概率的某些基本性质和简单的概率模型, 加深对随机现象的理解, 通过实验估计随机事件发生的概率。
高中阶段接触的概率知识, 充分体现了数学与生活的紧密联系, 概率知识大多解决的是生活中的数学, 在激发我们的学习兴趣方面有着非常重要的作用, 概率的学习也为学生打开了一种全新的接触数学的思维, 开阔了我们的视野。
下面是我学习概率的几点感悟:
一、概率知识在高中阶段的地位
概率知识在高中数学中是一部分相对独立的知识, 与数学其他知识之间联系不太紧密。概率与统计是用数学方法研究随机现象数量规律的科学。概率与统计主要是对不确定现象进行研究, 通过局部情况的分析, 估计和推断整体的规律。这些知识在科学研究、工程技术和经济管理等诸多领域中有着广泛的应用。概率与统计知识也是高考中的必考内容, 而且在考试中属于简单题型。
二、转变学习方法和解题思路
我们都知道数学是一门理论性和逻辑性很强的学科, 在数学学习中, 随着知识的深入, 对我们逻辑思维能力的要求也越来越高。但是, 在学完概率部分知识后, 一个最显著的感受就是, 概率部分知识的学习不同于以往数学知识的学习。代数、几何或是解析几何、三角函数等部分知识的学习和解题都不同程度的要求我们具备一定的逻辑思维能力和严密的推理能力。但是, 概率部分知识的学习不需要我们具有很高的逻辑推理能力, 因为概率部分知识的学习以排列和组合灯知识为主, 研究的主要是随机现象, 结论的得出大都是建立在大量的随机实验的基础上, 因此, 在概率学习中, 我们要重视实验在数学学习中的重要性, 子啊实验基础上研究事件的确定性和不确定性。
新课改的实施, 明确要求。教师的教学要以我们为主体, 培养我们发现问题、分析问题、解决问题的能力。教师在教学中, 只是我们学习的引导者和合作者, 因此, 数学的学习是我们自己的事情, 结合概率知识的特征, 在概率学习中, 我们看到, 教师对概率知识的讲解不再是以往的典例分析, 灌输式的教学, 而是引导我们参与实验, 自主探究。伴随着教师教学方法的改革, 我们在学习概率时也不能采取题海战术, 通过多做题来掌握知识, 因此, 我们要转变以往的数学学习方法, 寻找适合概率学习的方法。
三、创设相关的问题情境, 激发学习兴趣
数学是一门与实际联系紧密的学科, 我们的学习目的就是能够运用所学知识解决实际问题。概率部分的知识显著的特征就是与实际生活的紧密联系。概率部分知识的学习都是建立在实验的基础上, 而且教材中的实验大都是我们所熟知的生活实例, 通过解决实际问题来帮助学生学习概率某些基本性质和简单的概率模型。例如, 排列与组合定义的得出就是我们是结合“在北京、重庆、上海3个民航站之间的直达航线, 需要准备多少种不同的机票?有多少种不同的飞机票价?”这一实际问题背景, 让我们自主思考、进行探讨, 得出结论。相同背景下, 不同的提问, 引发了我们的思考, 让我们在自己熟知的问题中, 探究二者的不同。概率模型的建立大都是借助我们所熟悉的摸球实验、排队问题、彩票中奖、投硬币、掷骰子等实验, 这些都是我们日常熟悉的实际问题, 概率知识的学习结合周边熟知的实例, 很好的激发了我们的求知欲, 让我们深刻体会到了学习的用途, 领悟了数学学习的重要性, 拉近了数学与生活的距离。
总之, 概率部分知识的学习不同于以往数学知识的学习, 它是建立在实验基础上对不确定性现象进行研究, 整个学习过程中, 我们离不开身边熟知的实例, 整个学习都是在积极性高涨的背景下进行。概率作为高考必考内容, 属于容易题的范畴, 我们应该做到不丢分。概率知识很好的诠释了数学与生活的联系, 让我们意识到数学学习的重要性和实用性, 拉近了数学与生活的距离。
摘要:概率知识的学习有着很强的逻辑性与理论性, 同时, 概率与我们的生活之间也有着密切的联系, 学习概率知识不仅是为了取得好的分数, 也是为了更好的应用在实践中。本文主要谈谈笔者在高中数学概率问题学习方面的感悟。
关键词:高中数学,概率学习,感悟
参考文献
[1]刘亮.高考命题公平性探研[J].河北师范大学学报 (教育科学版) , 2016 (06) .
[2]马仲勋.多视角看一道解析几何题[J].数理化解题研究, 2016 (31) .
[3]欢迎订阅新版《新高考》[J].新高考 (英语进阶) , 2016 (10) .
[4]严龙成.地理高考命题思维和教学思维的融合策略[J].中学地理教学参考, 2016 (21) .
[5]杨佳伟, 张正飞.例析电化学高考命题的特点[J].中学生数理化 (学习研究) , 2016 (11) .
概率学习论文 篇2
一学期的概率论学习很快就过去了,经过了一个学期的概率论学习,让我了解到概率论是一门逻辑性很强的学科,学好概率论可以提高分析问题、解决问题,搜集和处理信息的能力。怎样才能学好概率论?可从以下方面着手。上课认真听讲,课后及时复习。适当做题,养成良好的解题习惯。学习新知识,要特别重视课上的学习效率,寻求正确的学习方法。上课时要紧跟老师思路,积极展开思维预测下面的步骤,比较自己的解题思路与教师所讲有哪些不同,同时要注意做笔记。课后做各种习题之前将老师所讲的知识点回忆一遍,正确掌握各类公式的推理过程,不要边做题边翻课本,那样只是暂时的明白,离开书什么也不知道,认真独立完成作业,勤于思考。还应该自己独自认真分析题目,尽量自己解决所有老师安排的习题,适当还做点相关资料。经常进行整理和归纳总结。 要多做题目,熟悉各种题型。首先要从基础题入手,以课本上的例习题为准,再找一些课外的习题,以帮助开拓思路,提高自己分析、解决问题的能力。对于一些易错题,要备有错题本,记下自己的错误解法并且写上正确的解法,两者比较找出自己的错误所在,及时更正。平时要养成良好的解题习惯,让自己的精力高度集中,思维敏捷。如果平时解题时随便、粗心、大意等,所以在平时养成良好的解题习惯是非常重要的。
学习兴趣是学生心理上的一种学习需要,而学习需要是学习动机的主要因素,学习动机则是进行学习的内驱力。概率论作为文化基础课,多数学生认为其课抽象、枯燥无味,无新鲜感而应用价值很大。激发起学习的兴趣,这样会有高的学习质量。因此在概率论的学习过程中,要始终注意培养学习的兴趣,使自己既学到必要的知识,又享受到一定的学习乐趣,达到提高学习质量的目的。然而各门课程的特点不同,培养自己学习兴趣的途径和方法也不尽相同,但是深入钻研教材,根据教材的内容和特点,挖出潜在的有利于培养自己学习兴趣的积极因素并加以充分利用,这一点是共同的。由于《概率论与数理统计》所研究的问题渗透到我们生活的方方面面,每一个理论都有其直观背景。因此,在学习中,应该致力于从多方面入手,去激发自己的兴趣,使自己在体会每个基本概念、定理和公式的产生过程中,掌握概率论与数理统计解题的思想和方法。学生实际上处于一种被动接受教师所提供知识的地位,所以我们要主动去提高自己的自学能力,培养了自己分析、辩论、理论联系实际、与他人合作等综合能力。总之,在概率论与数理统计学习中,教师“施教之功,贵在引导”,即引导学生去发现生活中的随机现象所隐藏的规律性,掌握概率论与数理统计研究问题的方法,而重点还在于我们自己。
概率论与数理统计是一门有着广泛应用的数学学科,因此在教学中我们应准确把握这门课与自己所学专业的结合点,突出其应用性。在学习过程中,将统计理论与实际问题相结合,培养自己用所学的知识去解决具体实际问题的能力及理论联系实际的作风,从而使自己进一步深化理解统计中的基本概念和基本原理。用时也要培养自己的综合素质和创新能力,仅靠课内教学是不可能完全掌握的。在学习中,要紧紧围绕自己的目标,把课内教学和课外活动作为一个整体来考虑,进行优化设计,形成结合。学生自主成立的概率论与数理统计课外兴趣小组。小组活动的宗旨,是利用课余时间,通过定期组织活动,激发大家的学习兴趣,探讨热点、难点问题,加深对理论知识的学习和理解,拓宽知识面,锻炼思考问题和研究问题的能力。组织课外兴趣小组这种方法对于提高学习效果,提高学员综合素质和创新能力有显著成效。
概率学习论文 篇3
[关键词] 概率学习;问题成因;解决对策
概率是中考必考的知识点之一,在现在的中考中已经显得越来越重要了. 从近几年各地的中考试卷来看,概率的考试题目类型大致可分为三类:(1)利用频率值估计概率;(2)利用面积计算概率;(3)利用画树状图或列表法解决生活类实际应用问题. 这些常见的考题中间往往隐藏着一些典型的错误,教师需要借助这些错误,分析错误,纠正错误,让学生得到真正的提高. 学生在初涉概率知识时往往不会觉得很困难,可一旦遇到具体问题,却时常出错. 下面笔者就根据多年来的教学实际,对这些错误原因进行归类和总结,并找出解决这一类错误的有效方法.
对机会的等可能性理解不够导
致错误
问题1 甲、乙、丙、丁四人参加某校教师招聘考试,试后甲、乙两人去询问成绩. 评委对甲说:“恭喜你,你不是最差的,丙是最差的. ”对乙说:“四人的成绩均不相同,但可惜你未能获得第一名. ”请你根据回答的内容进行分析,这四人的名次排列共有______种不同的可能情况.
错解 不知如何作答,瞎猜一个作为标准答案.
正解 根据评委的话,可以将整个事件看成两个部分组成:①应聘者;②考试名次,将条件整理成表格形式.
由表格可知:甲的名次可能是①或②或③,乙的名次可能是②或③,丁的名次可能是①或②或③,丙为第④名,而其余三人只能是①②③中一个名次,所以所有等可能的结果为甲①乙②丙④丁③;甲③乙②丙④丁①;甲②乙③丙④丁①;甲①乙③丙④丁②. 以下列举一些学生常见的错误:(1)根据题目提供的条件多而乱,感觉无从下手,便不会处理;(2)能够确定丙的名次,但如何确定甲、乙、丁的名次没有头绪;(3)甲有3种情况,乙有2种情况,丁有3种情况,所以总共有3×2×3=18种情况;(4)漏掉考虑甲③乙②丙④丁①和甲②乙③丙④丁①这两种情况.
归因与剖析 在确定等可能结果时,首先要弄清楚本题关注的是什么结果,其次结果由谁决定,接着把有关的可能情况分析清楚. 以上题为例,要求名次所有的情况,其次由于丙为第④名,所以名次只与甲、乙、丁有关,接着由题可知甲可能为①②③,乙可能为②③,丁可能为①②③,而三人只能得一个名次而不重复,便可得出答案.
对问题中有无放回的理解出现 错误
问题2 已知红色和蓝色在一起可配成紫色,现有三种颜色,即红色、白色和蓝色,从中任意取出两种颜色来配紫色,问:能配出紫色的概率有多大?
错解 画树状图:
所有等可能的结果共有9种,其中配出紫色的结果有2种,P(配出紫色)=.
正解 画树状图:
所有等可能的结果共有6种,其中配出紫色的结果有2种,
P(配出紫色)==.
错误剖析 没有考虑到:在红、白、蓝三种颜色中,任意取出两种颜色时,不能同时取出两种相同的颜色.
归因与剖析 对于事件中进行两次或两次以上选取时,请学生根据实际情况分析和理解,切不可主观臆断和猜想,要做有依有据的判断,并判断是否有放回.
由于生活常识的缺乏导致等可 能结果错误
问题3 甲、乙两队进行乒乓球团体赛,比赛规则是:两队之间进行3局比赛,并且必须全部打完,至少赢2局的队获胜. 假如甲、乙两队之间每局比赛输赢的机会相同,且甲队已经赢得了第1局,那么甲队最终获胜的概率是多少?
错解 画树状图:
P(甲队最终获胜)=.
正解 画树状图:
P(甲队最终获胜)=.
归因与剖析 比赛的结果有三种情况:胜、平、负,特别是题目中强调“甲、乙两队之间每局比赛输赢的机会相同”. 乒乓球在一局比赛中,先得11分的一方为胜方,10平后,先多得2分的一方为胜方,所以乒乓球比赛的结果只有两种情况:“胜”或“负”. 数学来源于生活,所以如乒乓球比赛的赛制这类生活常识,学生需了解.
由于对关注事件理解有误导致
关注事件的结果数错误
问题4 在某小学“演讲大赛”选拔赛初赛中,甲、乙、丙三位评委对小选手的综合表现分别给出“待定”(用字母W表示)或“通过”(用字母P表示)的结论. 请用树状图表示出对于小选手琪琪,只有甲、乙两位评委给出相同结论的概率是多少?
错解 画树状图:
其中只有甲、乙两位评委给出相同结论的结果有4种,
P(只有甲、乙两位评委给出相同结论)==.
正解 其中只有甲、乙两位评委给出相同结论的结果有2种,
P(只有甲、乙两位评委给出相同结论)==.
剖析与归因 在看树状图时只关注了甲、乙的结论是否一样,并没有考虑丙评委的结论与甲和乙的关系. 认真审题是解题的关键,忽略任意一个小的细节,都会带来整个题目的理解错误,从而导致错解.
由于数学思想、数学方法运用
不灵活导致与其他知识相结合
考查时出现错误
问题5 (1)甲、乙、丙、丁四人做传球游戏:第一次由甲将球随机传给乙、丙、丁中的某一人,从第二次起,每一次都由持球者将球再随机传给其他三人中的某一人,求第二次传球回到甲手里的概率是多少. (请用树状图或列表等方式给出解析过程)
(2)如果甲跟另外n(n≥2)个人做(1)中同样的游戏,那么第三次传球后球回到甲手里的概率是______.
第(1)问比较容易,共有9种等可能的结果,符合条件的情况有3种, 概率为. 下面研究第(2)小问.
解法1 所有等可能的结果共有n3种,其中第三次传球后球回到甲手里的结果有n(n-1)种,P(第三次传球后球回到甲手里)==.
解法2 (画图解决)画出n=2时,三次传球后的树状图,得P===;
画出n=3时,三次传球后的树状图,得P===;
画出n=4时,三次传球后的树状图,得P===,
所以通过表示可得出该题规律为P=.
归因与剖析 从这个问题中,我们明显可以得到两点启示:①第(2)小题在考查学生“化归思想”,如果学生遇到一个题目有多个小题,且每个小题所求的结论类似时,可以尝试用第1小题的处理方式来解决之后的小题,这也是“化归思想”想考查学生的地方. ②遇到找规律的题目时,请注意处理方法:从n的最小值开始去研究题目要求的量,不要怕烦琐,直到所代入的数能从结果中发现规律为止,只要将变化部分用字母代替,不变部分照抄就能得出规律.
归纳与反思
概率是中考命题的重点之一,经常与统计、函数、几何图形等知识综合在一起考查,我们需牢固掌握树状图(列表)法,利用概率公式解决此类问题. 题目千变万化,我们需养成良好的审题习惯,善于总结归纳,力争让自己不断提高. 从五类常见错误来看,阅读和理解是第一步,只有正确地把握题目的含义,抓住阶梯的关键因素,才能有效地避免出错,而从学生的问题中,教师也能反思自身课堂的得失,找到最佳的教学方式,实现最好的课堂效果.
概率学习论文 篇4
“于是, 我开始剥丝抽茧式地研究起概率书来, 原来概率论也算是一本高深莫测的武林秘籍.尤其是那些连续型随机变量, 边缘分布啦……有时明明记住了, 第二天做题时, 总是反应不过来……”
以上是在课余时间我的文科学生们与我笔谈的关于他们对概率论和学习概率论的体会与感想.细细品味, 其实这些学习概率的学生们比概率更可爱.他们用心地体会了, 感受了, 思考了, 在我以为, 这比记住一个概率定理, 学会解一道概率题更可贵.
我愿意启发我的学生们多思考, 然而他们思考之余竟然告诉我:“老师, 概率论是生命中不能承受之晕!”
这便是我教学中的一大难题:如何激发学生的兴趣?
一、我的第一次课
兴趣是最好的老师, 我只是它的助教, 一直希望引导学生们跟它走.而好的开端等于成功的一半, 所以我很重视每学期的第一次课.
第一次课上, 我和同学们做了一个游戏.
假定这是某个文艺晚会中间穿插的游戏:让你从三扇门中选一扇门.有一扇门后面放着一辆汽车, 另外两扇门后放的是山羊, 你选择了一扇门 (比如说1号门) , 知道各扇门后放着何物的主持人打开另一扇门 (比如说是3号门) , 你看到后面是一只山羊, 然后主持人对你说:“你可以改选剩下的那个门 (比如说2号门) , 那么, 你改变还是不改变?”大多数同学颇为冷静地选择不改变, 只有少数人在犹豫, 然而当我说:“你们应当选择改变, 因为选第一扇门时有undefined的机会赢得汽车, 而换选第二扇门时却有undefined的机会赢得汽车.”他们觉得不可思议!在他们的大多数人看来, 换与不换得到汽车的概率都为undefined我接着告诉他们, 这才是概率!需要用我们第一章将要学到的条件概率和全概率定理来解答, 于是, 他们开始期待.
然后我们谈到概率论的起源与发展, 谈到赌博, 谈到排列组合, 谈到期望收益和风险, 谈到寿命分布, 谈到正态分布, 我给他们读了剪报《妈妈越是漂亮, 孩子就越像爸爸》, 并告诉他们如何看待这份资料, 如何用正态分布解释这个结论, 他们在笑声中接受了概率论, 并且开始表现出热情.
当谈到课程的难度时, 我得知他们向师兄师姐们打听来的结果是“概率论很难学, 比微积分还难”, 我给予了确认:是的, 概率论是比较难学, 这一点我们必须得正视.但是, 概率论也很好玩, 这是一门很可爱的课程, 而且充满生活智慧.我用《小王子》中那只很智慧的小狐狸的话来鼓励他们:只要你为概率论用心的付出时间, 它就会在你的生命中变得重要起来, 概率论就会是你独一无二的玫瑰花!
我看见我的可爱的学生们, 跃跃欲试……
二、我的概率课堂
如何调动学生的主动性?
多年来, 这个难题困扰着我, 相信也困扰着许多和我一样的概率论的教书人.课堂教学过程中, 一个很重要的方面是节奏和教案, 特别是我所面对的大多是文科的学生.
一位自称为“门外汉”的关心我的教学的友人曾经与我有以下交谈:
“实际上我觉得一个好的教案就像一个好的剧本, 你就是导演!”
“我所理解的特色是你能控制课堂的局面和授课的节奏, 学生和你都在身心愉悦地享受这种氛围所带来的深入浅出而又生动生活化的知识.”
记得我推导几何分布的无记忆性undefined时, 我给他们举例:比如买彩票.假设社会上定期发行某种奖券, 中奖率为P, 某人每次购买一张, 如果没有中, 下次再继续购买一张, 直到中奖为止.那么根据定理结论, 此人在购买m次没有中的条件下继续购买n次, 仍然不中的概率, 就等于他购买n次没有中的概率, 也就是说把他过去曾经失败过m次这件事给遗忘了!
这就是离散型随机变量的无记忆性!他们恍然大悟!于是, 我们谈到了“忘记也是一种快乐.一个小小的随机变量尚知将过去的失败与不如意忘记, 又何况我们?学习数学过程中的挫折不应该成为继续学习的障碍”.我们还谈到了金庸大侠的《笑傲江湖》里风清扬教令狐冲对付田伯光的“独孤九剑”剑法, 就是先将每一招每一式仔细教会学会, 然后再忘掉, 以达到“融会贯通、信手拈来、以无招胜有招”的境界, 在学习随机变量学习概率论的过程中, 这也许有值得借鉴的地方.
我看见我的可爱的文科生们, 若有所思……
三、我的案例分析
如何推动学生的积极性?
颇值得一提的还有案例分析.案例分析的作用在于:可以让学生们看到自己所学的知识在实际中的应用, 包括用于解决实际中的哪一类问题以及如何解决, 这样使所学的东西生动起来, 仿佛看得见摸得着了.
比如, 用贝叶斯定理解释寓言《黔之驴》.
贝叶斯定理的决策过程是一个通过不断获得信息修正对事物的原有认识, 最后据之作出决策的过程.而寓言中老虎吃掉驴也是基于这样一个决策过程.
首先, 根据自然界弱肉强食的生存法则, 假设真正的强者 (A1) 遇到弱者 (A2) 时, 进攻 (B1) 的概率undefined, 不进攻 (B2) 的概率undefined;而弱者遇到强者, 由于判断错误或饥饿危及生命不得不进攻时, 概率为undefined, 而不进攻的概率为undefined
则有: (1) 驴初到贵州时, “虎见之, 庞然大物也, 以为神”.显然, 这时老虎以为驴为强者, 设P (A1) =0.9, P (A2) =0.1, 因此未敢轻举妄动, 而是“蔽林间以窥之”.
(2) 为了获得信息, 老虎“稍出近之, 慭慭然, 莫相知”.进而, 驴发现了老虎, “他日, 驴一鸣, 虎大骇, 远遁”.然而驴没有向老虎发起任何进攻, 这是一条重要信息, 于是老虎调整了对驴原有的看法:即驴对虎的B2 (不进攻) 发生了, 此时驴仍然是强者的概率调整为:
undefined
同理, undefined
(3) 虽然0.67<0.90, 但是老虎仍然“终不敢搏”, 只好进一步获取信息.老虎“稍近, 益狎, 荡倚冲冒”, 而“驴不胜怒”, 但仅仅是“蹄之”罢了, 仍未做实质性的进攻, 于是B2发生, 此时驴对虎而言仍是强者的概率进一步调整为:
undefined
0.3<0.67<0.90, 老虎甚喜!对驴的本领有了较深刻的认识, 得出“技止此耳”的结论, 因此采取了进攻的策略, 即“跳踉大阚, 断其喉, 尽其肉, 乃去”.大获全胜!
所以, 概率并不是孤立与枯燥的.
我看见我的可爱的学生们, 意犹未尽……
四、我的课后习题
如何帮助学生克服厌学情绪?
对于文科生而言, 学习数学更多的是训练一种抽象思维的能力, 而人的抽象能力是在感性的基础上形成的, 它与语言的关系密切.
因此, 我常常提醒学生, 学习数学可以提高人的思维品质.比如, 注意力集中, 能调动自己的精神指向你所思考的问题 (专注有时也是一种魅力) ;具有深刻的广阔性, 既能认清问题的实质, 又能兼顾整体和细节 (这种训练使你成为一个细致周到的人) ;具有批判性和独创性, 不轻信盲从, 能从不同的角度以不同的方法发现和解决问题 (这能使你显得独立而富有个性) 等等.人的脑袋就像一部机器, 得经常用, 至少, 多学学数学, 解解概率题, 换一种思维方式思考问题, 不会使我们的脑袋那么快“笨”起来, 而这些品质将潜移默化于我们的生活中.
学习概率论, 一定要做习题.
做习题的意义在于:掌握基本概念;重复的练习是一个真正掌握技能的过程, 可以锻炼快速反应, 可以锻炼控制厌倦情绪的能力;多讨论, 多向别人和自己重述解题过程, 因为如果会做, 不一定能解释明白, 而解释的过程中, 会产生很多火花, 发现更多问题, 加深对概念的理解.
当学生们有了一定的兴趣, 而在做题时一旦遇到困难, 他们也容易畏难、厌学, 于是我有时开解他们:“不会做的就猜!把你猜的过程回想一下、总结一下.”事实上, 在教与学的过程中, 知道答案并不是最重要的, 重要的是了解思想的方法, 学会思考的过程.然而在解题之初, 往往又需要进行直觉判断, 需要联想头脑中已有的数学和概率知识, 以及和题目相关的各种公式和定理等, 以寻求解题的思路.
直觉可以在猜和想的概率论学习与训练中培养起来, 当解的题越多, 思考得越多, 头脑中的积累就越多, 越有兴趣, 直觉就越灵.数学家丘成桐说过:“浓厚的感情使我们对研究的对象产生直觉, 这种直觉看对象而定, 例如在几何上叫做几何直觉.”那么我想, 在概率上, 就叫概率直觉吧.
学期结束, 学生们给我谈了如下心得:
“学习概率论这门课程, 可以很好地锻炼自己的思维理性, 可以扩展自己对日常生活一些问题思考的广度和深度, 作出的决定和计划也更加完备和周密.所以我的感受是:即使以后的生活和学习完全不需要用到一丁点概率, 但是我也会终身受益于概率.”
参考文献
[1]袁荫棠.概率论与数理统计.北京:中国人民大学出版社.
[2]龙永红.概率论与数理统计.北京:高等教育出版社.
[3]王振龙.统计哲学研究.北京:中国统计出版社.
概率与数理统计学习心得 篇5
概率论与数理统计是研究随机现象统计规律性的一门数学学科,其理论与方法的应用非常广泛,几乎遍及所有科学技术领域、工农业生产、国民经济以及我们的日常生活。对于作为电子通信专业的我,其日后的帮助也是很大的。
这门课程给我最深刻的体会就是这门课程很抽象,很难以理解,初学时,就算觉得理解了老师的讲课内容,但是一联系实际也会很难以应用上,简化不出有关所学知识的模型。后来经过老师的生动现实的实例分析,逐渐对这门课程有了新的认识。首先,这门课程给我带来了一种新的思维方式。前几章的知识好多都是高中大学讲过的,接触下来觉得挺简单,但是后面从大数定理及中心极限定理就开始是新的内容了。我觉得学习概率论与数理统计最重要的就是要学习书本中渗透的一种全新的思维方式。统计与概率的思维方式,和逻辑推理不一样,它是不确定的,也就是随机的思想。这也是一个人思维能力最主要的体现,整个学习过程中要紧紧围绕这个思维方式进行。这些都为后面的数理统计还有参数估计、检验假设打下了基础。
概率论与数理统计不仅在自然科学中发挥重要作用,实证的方法就是基于数据分析整理并推理预测,而且在社会实践中发挥着重要的不可替代的作用,这是因为 1.人类活动的各个领域都不同程度与数据打交道,都有如何收集和分析数据的问题,因此概率论与数理统计学的理论和方法,与人类活动的各个领域都有关联。
2.组成社会的单元——人、家庭、单位、地区等,都有很大的变异性、不确定性,如果说,在自然现象中尚有一些严格的、确定性的规律,在社会现象中则绝少这规律,因此更加依靠从概率论与数理统计的角度去考察。
概率论与数理统计的发展方向是更加实用,基于多元函数、通过建立数学模型来分析解决问题,理论更加严密,应用更加广泛,发展更加迅速。
概率学习论文 篇6
关键词:滑坡; 概率密度函数; 联合概率结构; Dirac δ函数序列; 混合分布模型
中图分类号:TU312;O213 文献标志码:A 文章编号:16744764(2012)05005707
降雨型滑坡预测方法主要分为2类:基于过程的预测模型(亦称为物理模型)和经验模型。雨水渗入导致岩土体内的孔隙压力增大、有效应力减小和岩土体的抗剪强度降低是降雨型滑坡发生的主要机制[1]。滑坡预测的物理模型则从上述机制出发判断滑坡的状态,即充分考虑降雨数据、降雨入渗过程及其对岩土体的影响,结合岩土体滑坡的稳定性分析,最终确定引发滑坡的降雨量,从而判定滑坡是否发生[29]。然而,该模型所需输入信息,如局部地形条件、岩土的力学参数和水文学参数等都很难准确获得,阻碍了该模型的实际应用[10]。经验模型则部分体现了滑坡产生的机制,仅通过对降雨和滑坡的历史数据进行统计给出滑坡的降雨阈值。模型不同,降雨阈值所采用的控制变量亦不相同,所适用的地区亦不相同。但由于简便易行,经验模型是目前滑坡预测中最为实用的方法。范文亮,等:滑坡概率分析中降雨的联合概率结构〖=〗
本质上,无论是物理模型还是经验模型,均是通过将降雨数据和滑坡的降雨阈值进行对比来判定滑坡的发生与否,只不过前者的降雨阈值是基于物理机制分析得到的,而后者则是通过经验统计给出的。借鉴可靠度理论的概念,滑坡概率Pf可表示为。
式中:Pr{·}表示事件发生的概率;R表示当前降雨数据,类似于可靠度分析中的效应;[R]表示降雨阈值,类似于可靠度分析中的抗力。然而,由于降雨型滑坡影响因素的复杂性,很难由单一控制变量判定,因此R和[R]均为向量,而在可靠度分析中,效应和抗力均为标量。
目前,关于降雨型滑坡的研究主要集中于降雨与滑坡的关系、降雨的入渗和边坡的稳定性分析方面[1116],即更多地关注[R],对于降雨数据R的概率描述鲜有研究涉及。笔者力图针对重庆地区的历年降雨数据,建立可用于重庆地区滑坡概率预测的降雨特征的概率模型。
欲建立R的概率模型,必须先将其具体化,明确其分量。文献[10]详细列举了各研究者曾经使用过的控制变量,包括日降雨量、前期累计降雨量、降雨强度和降雨持时等共25种。结合文献[13]和[17],笔者取日降雨量和前期累计降雨量为控制变量,且取10 d为前期降雨的计算时间段。1 滑坡概率分析
若记日降雨量为R1,10 d累计降雨量为R10,与之对应的阈值分别为[R1]、[R10],那么式(1)可改写为式(2)。
值得指出的是,现有研究中关于R1、R10的处理方式是截然不同的。日降雨量往往用降雨等级表示,即将R1视为离散变量,而10 d累计降雨量则采用真实的数据,即R10视为离散变量,然后根据日降雨量的不同等级再结合10 d累计降雨量的具体数值判定滑坡状态。
一般而言,根据日降雨量大小可分为4个等级,即等级1(小雨,R1∈[0,10) mm)、等级2(中雨,R1∈[10,25) mm)、等级3(大雨,R1∈[25,50) mm)和等级4(暴雨,R1∈[50,∞) mm)。若记第i个降雨等级为Ei,那么式(2)可进一步改写为
若已知Pr{Ei}·pR10|Ei(y)和p[R10]|Ei(z),则滑坡概率计算颇为简单。本文则着重于关注Pr{Ei}·pR10|Ei(y)的获取。由于Pr{Ei}·pR10|Ei(y)描述了2个变量的联合概率结构,但是此2变量分别为离散变量和连续变量,因此,文中将称之为离散连续混合变量的联合概率结构。2 离散连续混合变量的联合概率模型 由上所述,Pr{Ei}表示事件Ei发生的概率,pR10|Ei(y)则表示随机变量的条件概率密度,本质上仍属于概率密度函数。根据降雨历史数据可以方便地给出Pr{Ei}的统计值,但是欲较为准确地确定pR10|Ei(y)的模型则较为困难。目前应用最为广泛的由采样数据确定随机变量概率模型的方法是假设检验方法。该方法的优点在于可以给出一个简单的可用概率模型,但其确定亦是显而易见的,即只能确定单峰的概率密度模型。然而,由于影响因素的复杂性,现实中的许多随机变量并不能采用简单的单峰,往往呈现出多峰性态。笔者拟由密度变换解获得概率密度函数的近似值,然后引入混合分布模型对其进行建模,并通过回归拟合确定关键参数,最后确定联合概率模型。
2.1 累计降雨量的条件密度变换解及其数值逼近
式中:δρ[·]表示Dirac δ函数序列;ρ为适当小量;N为观测数据数量;H(θq)表示θ取θq时的累计降雨量,H0=maxθ∈ΩΘHθ,由于累计降雨量已由实测获得,因此H(θq)和H0实际上表示第q个实测样本R10,q和所有实测值的最大值;Pq=pΘ|Ei(θq)Δθq表示点θq的赋得概率,由于概率守恒,其数值等于H(θq)出现的概率。不失一般性,可假设各观测数据出现的概率均等,即Pq=1/N。于是,式(9)可进一步改写为式(10)。
2.2 混合变量的联合概率模型
根据由式(10)获得的条件概率密度函数计算值,可采用如下的混合分布模型对其进行建模,即[19]
重庆市气象局提供了重庆市自1980年至2009年共30 a的小时降雨数据和2003年至2009年间的分钟降雨数据。基于以上数据可获得日降雨量和10 d累计降雨量的联合观测样本共10 818条。其中,日降雨等级为小雨的樣本10 007条,日降雨等级为中雨的样本530条,日降雨等级为大雨的样本211条,日降雨等级为暴雨的样本70条。
nlc202309032322
需指出的是,10 007條小雨样本中日降雨量为0且累计降雨量很小的记录占有很大比例。一方面,这样的降雨基本不会引起滑坡,另一方面,这些数据会极大地引起建模困难。例如,两者均为0的样本约占16.7%,而理论上连续随机变量取任意值的概率均为零。为简单且便于应用,对日降雨等级为小雨时累计降雨量的概率建模时仅考虑了累计降雨量超过20 mm的数据,共3 763条。此时,E1发生时滑坡的概率为
3.2 10 d累计降雨量的概率密度估计
首先,利用条件密度变换解的Dirac δ逼近对降雨等级为小雨实测样本中选取的3 763条累计降雨量超过20 mm的样本子集进行累计降雨量的概率密度估计,结果如图1所示。为验证密度估计的准确性,将其与频数直方图和经验累积分布函数进行了对比。图1(a)和(b)分别表示与等间距直方图和等频数直方图的对比,其中等频数直方图分10个等频率区间,图1(c)表示与经验累积分布函数的比较,下同。不难发现,计算结果和三者均吻合良好。
类似地,可给出降雨等级为中雨、大雨和暴雨时的密度估计,结果分别示于图2~4。通过与直方图、经验累积分布函数的比较可知上述密度估计是合理且准确的。
值得注意的是,图2中等间距直方图和等频数直方图在累计降雨较小时存在着显著差异,甚至体现于图形趋势上。究其原因在于此区间存在大量样本,在等间距直方图内均位于同一条带内,不能描述出更精细的概率变化;而等频数直方图可以较好地弥补了这一缺陷。
3.3 10 d累计降雨量的混合分布概率模型
显然,上述密度估计值是不便于应用的,为此需建立解析的概率模型。
首先,采用常用的概率模型对其进行建模。由于累计降雨量存在明显的边界(即≥0),因此,可尝试用对数正态分布和3参数Weibull分布对其进行建模,建模准则为均值和标准差一致。将不同降雨等级的建模结果与直方图、密度估计结果进行对比,分别示于图5~8,其中(a)图均为与等间距直方图的比较,(b)图则为与等频数直方图的比较。
图6和图7表明此2种情形对数正态分布较Weibull分布更接近于计算结果,但效果均不理想;图8表明降雨等级为大暴雨时无论是对数正态分布还是Weibull分布均与实际分布相差太远。为此需要采用式(11)所描述的混合模型对此三者进行建模。
根据试算,可得到降雨等级分别为中雨、大雨和暴雨时累计降雨量的混合模型分别为式(17)、(18)、(19)。
3.4 联合概率模型
由式(12)可知,欲建立日降雨量与累计降雨量的联合概率结构,除累计降雨量的条件概率密度模型外,尚需确定Pr{Ei}。根据降雨实测数据,可统计出不同降雨等级的频度函数,如表1所示。
将表1的频度函数和第3.3节累计降雨量的条件概率密度模型代入式(12)即可得到重庆市日降雨量和累计降雨量的联合概率模型。
4 结 论
降雨型滑坡的概率分析和预测中,作为主要输入的降雨是关键参数。笔者以日降雨量和累计降雨量为降雨量的控制参数,结合重庆气象局提供的降雨观测数据,建立了日降雨量和累计降雨量的联合概率模型。与经典意义上的联合概率结构不同,文中沿用降雨型滑坡分析的习惯,将日降雨量视为离散变量,而累计降雨量为连续变量。在此基础上导出了离散变量和连续变量的联合概率模型和条件密度变换解及其Dirac δ函数序列逼近,并提出了基于上述计算结果建立可用的联合概率模型的思路。然后,将上述思路用于重庆市的降雨数据,建立了适用于重庆地区的日降雨量和累计降雨量的联合概率模型。
值得指出的是,文中借鉴可靠度概念建立的滑坡概率分析方法思路清晰、简单、直接,但相比较而言,对相关数据的要求却更为严格,除了降雨量的概率模型之外,尚需获得降雨阈值的概率结构。
参考文献:
[1]李长江. 降雨型滑坡预报的理论、方法及应用[M]. 北京:地质出版社. 2008.
[2]Montgomery D R, Dietrich W E. A physically based model for topographic control on shallow landsliding[J]. Water Resources Research,1994,30:11531171.
[3]Wu W, Sidle R C.A distributed slope stability model for steep forested basins[J].Water Resources Research, 1995, 31:20972110.
[4]Dietrich W E.A processbased model for colluvial soil depth and shallow landsliding using digital elevation data[J]. Hydrological Processes,1995,9(3/4):383400.
[5]Montgomery D R,Sullivan K,Greenberg H M.Regional test of a model for shallow landsliding[J]. Hydrological Processes,1998,12:943955.
[6]Iverson R M.Landslide triggering by rain infiltration[J].Water Resources Research,2000,36(7):18971910.
[7]Borga M.Assessment of shallow landsliding by using a physically based model of hillslope stability[J].Hydrological Processes,2002,16:28332851.
nlc202309032322
[8]Casadei M, Dietrich W E, Miller N L.Testing a model for predicting the timing and location of shallow landslide initiation in soilmantled landscapes[J].Earth Surface Processes and Landforms,2003,28:925950.
[9]Tsai T L, Yang J C.Modeling of rainfalltriggered shallow landslide[J].Environmental Geology,2006,50:525534.
[10]Guzzetti F.Rainfall thresholds for the initiation of landslides in central and southern Europe[J].Meteorology and Atmospheric Physics,2007,98(3/4):239267.
[11]林孝松.滑坡與降雨研究[J].地质灾害与环境保护,2001,12(3):17.
LIN Xiaosong.The study of landslide related to rainfall[J].Journal of Geological Hazards and Environment Preservation, 2001,12(3):17.
[12]张友谊,胡卸文,朱海勇.滑坡与降雨关系研究展望[J].自然灾害学报,2007,16(1):104108.
ZHANG Youyi,HU Xiewen,ZHU Haiyong.Prospect of research on relationship between landslide and rainfall[J].Journal of Natural Disasters,2007,16(1):104108.
[13]张珍,李世海,马力.重庆地区滑坡与降雨关系的概率分析[J].岩石力学与工程学报,2008,24(17):31853191.
ZHANG Zhen,LI Shihai,MA Li.Probability analysis of relationship between landslide and rainfall in Chongqing area[J].Chinese Journal of Rock Mechanics and Engineering,2005,24(17):31853191.
[14]李汝成, 王复明. 降雨入渗对泥岩土混填路堤稳定性的影响[J]. 岩石力学与工程学报,2008,27(11):22602266
LI Rucheng,WANG Fuming.Effect of rainfall infiltration on stability of mudstonesoil mixture embankment[J].Chinese Journal of Rock Mechanics and Engineering, 2008, 27(11):22602266.
[15]王军.降雨入渗对流变介质隧道边坡稳定性的分析[J].岩土力学,2009,30(7):21582162,2167
WANG Jun.Analysis of stability of tunnelslope with rheological medium under rainfall infiltration[J].Rock and Soil Mechanics,2009,30(7):21582162,2167.
[16]张卢明.降雨入渗对滑坡渗流场和稳定性的影响分析[J].铁道工程学报,2009(7):1519.
ZHANG Luming.Effects analysis of rainfall infiltration on the landslide seepage field and stability[J].Journal of Railway Engineering Society,2009,7:1519.
[17]Crozier M J.Prediction of rainfalltriggered landslides: a test of the antecedent water status model[J].Earth Surface Processes and Landforms,1999,24:825833.
[18]范文亮,李杰.广义密度演化方程的δ函数序列解法[J].力学学报,2009,41(3):398409.
FAN Wenliang,LI Jie.Solution of generalized density evolution equation via a family of δ sequences[J].Chinese Journal of Theoretical and Applied Mechanics,2009,41(3):398409.
[19]McLachlan G J,Peel D.Finite mixture models[M].John Wiley & Sons, Inc..2000.
(编辑 王秀玲)doi:10.3969/j.issn.16744764.2012.05.010
概率学习论文 篇7
新课标指导下的新课程, 在每一个学期的最后一个章节都安排了概率统计的内容, 这是对传统教材作出的最大的调整.而事实上, 因教学时间上的限制, 许多的老师都不愿意花时间让学生经历统计的过程, 而在乎统计的结果, 其结果直接导致学生对统计和概率的内容不感兴趣, 不愿深入其中, 把有用的数学当成了无用的数学, 可见, 概率统计教学中的老师的学习指导至关重要.
概率统计与生活实际是密切联系的, 学生的统计观念的建立是统计学习的最终目标.我们一起来了解学生的统计观念的形成形成过程:首先学生通过收集数据的活动, 学习收集数据的方法;然后通过整理和描述数据的活动, 学习表示数据的方法, 体会统计图表在统计工作中的作用;最后才通过处理数据并根据数据处理结果进行判断和预测的活动, 进而学习分析数据的方法, 感受用统计量分析数据的合理性与可行性.如此看来, 老师在课堂中应该重视统计和概率的活动开展, 让学生真正投入到统计的全过程中去, 从提出问题到得出结果, 最终作出决策、评价改进.
例如, 学校委托我班调查全校学生最喜爱的体育活动是什么.围绕这个问题, 可以让学生讨论:“是否要调查学校每一个人?”“只调查本班的同学可以吗?”等问题, 从中可以使学生体会抽样的必要性和样本的代表性.
学生得到数据后, 提出:用什么方法来表示数据?需要计算哪些统计量, 才能达到调查的目的?当学生得出统计结果后, 要求学生能对这些数据作出分析和解释, 作出判断.最后为学校提出合理的建议.
基于概率统计课的活动课的特点, 老师注重学生在活动中的自主探索和合作交流非常重要, 老师应该创设一种气氛, 使学生能够通过积极、主动地思考和探索, 形成自己的结论;能尊重别人的观点, 加强与他人的合作和讨论.在具体实践中应该遵循一些原则:
1. 坚持学生亲身经历统计的全过程
统计的全过程包括:发现并提出问题———运用适当的方法进行收集和整理数据———运用合适的统计图表、统计量等来展示数据———分析数据作出决策———对自己的结果进行交流、评价与改进等.例如, 某学生观察到楼下的超市工作人员在白天清闲, 晚上和周末却人手不够, 所以对超市人员的合理安排产生了兴趣, 这就是一个很好的课题.下面面对的就是如何指导学生进入后续的统计研究过程, 即用适当的方法收集整理数据, 运用图表分析数据, 等等.老师可以利用学生调查到的数据指导学生共同思考以下问题:
一家居民小区的食品超市为了更好地安排营业时间和售货员的人数, 想了解该小区居民一周到超市购买食品的天数.
(1) 你能替该超市的管理人员设计一个调查方案吗?
(2) 该超市的管理人员调查了该小区所有的500户居民, 并得到下面的数据:4, 2, 0, 5, 5, 1, 2, 2, 3, 0, 4, 6, 2, 2, 1, 1, 2, 2, ……你能设法将上述数据整理得较为清晰吗?
(3) 将上述数据整理成频数和频率表;根据上表, 将数据整理成频数分布直方图和折线图.
(4) 根据调查结果, 每周去超市少于3次的居民户占小区总居民户的百分比是多少?你还能获得哪些信息?
(5) 如果你是超市的管理人员, 根据上述调查, 你会作出哪些决策?与同伴进行交流.
2. 精选研究对象, 突出统计与概率的现实意义
学生对现实社会环境中的问题具有越来越强烈的兴趣, 这种兴趣是学习这部分内容的一种极好的动力, 教学中要引导他们把对统计的探索从日常生活发展到现实社会和科学技术中感兴趣的领域.如在统计的教学中可以引入以下的例子:
如, 根据往年本地同一段时间的气温记录, 预测下一年本地这段时间的气温情况.又如, 根据对公共汽车不同时间客流量的统计, 合理地安排发车等等.
联系现实的另一个重要方面是鼓励学生对大众传播工具 (如电视、报纸等) 中出现的统计资料持客观态度, 不轻易相信虚假广告.如一则广告中声称“有75%的人使用本公司的产品”, 但没有指出数据的来源, 也许样本太少, 并不能反映总体的真实情况.又如某人在某地看见一起车祸, 就认为这个地方的交通秩序的好坏, 使学生对统计数字有较为全面、正确的认识.
3. 课堂中创设自由讨论的氛围, 坚持科学求实的态度
统计和概率的课堂引入, 极大地激发了学生的探究精神, 课堂中学生积极参与与否直接影响到课堂的成败.因此老师在课堂中应重视模拟和实验, 不要把这部分内容处理成纯计算的内容.如《在实验中寻求规律》的课堂教学中, 关于抛硬币的实验, 本节的难点是让学生理解实验的频率可以对机会进行估计.可是, “为什么用平稳时的频率来估计事件发生的机会较为合理?”其结论的引出一定要让学生不断地实验, 通过累加实验次数, 慢慢体会实验的次数与逐步稳定的频率的关系, 从而深刻理解到:每次的实验是随机的、无法预测的, 但最终会呈现出自己的规律性.此时难点也就迎刃而解.
【例题精讲】
结论:我们发现, 频率值随着实验次数的增加而逐步稳定.
以上为课堂的实录数据, 试验数据分三步走.学生先各自做10次试验, 此时频率各不相同;然后老师指导学生统计小组的实验数据, 观察统计后的频率数否接近;第三步, 统计全班的实验数据, 观察频率图, 发现了频率逐步稳定到一定的值.当然, 如果条件允许, 老师可以用几何画板进行成千上万的模拟实验, 从而验证结论.
4. 关于概率统计中的评价应更加重视学生的应用能力以及参与中的情感和态度
由于统计的学习与其他内容的学习相比, 更多地强调学生的活动而不只是概念, 强调“做”而不是记忆与运算, 因此, 对统计学习的评价应更多地强调过程而不只是结果.教师应在日常教学中多观察学生, 充分关注学生的个性差异, 特别要观察学生在小组中的表现, 及时记录学生的独特想法, 这不仅有利于教师全面地评价学生, 而且使得评价和教学成为一个有机的整体.教师还应鼓励学生建立自己的成长记录, 记录印象深刻的一次活动、在学习中遇到的困难、需要改进的地方等.例如, 学生将某次统计活动的过程及之后的反思放在自己的成长记录中, 教师可以请他说明整个统计活动的过程 (如需要收集哪些信息、如何收集信息、如何表达信息) , 以及活动过程中的感想和过程后的反思, 让学生进一步体会统计的意义和价值, 发展统计观念, 并增强他们学习统计的兴趣教师也可对此学生的统计活动过程和反思进行评价.
总而言之, 概率统计作为初中新课程的新增内容, 课本上的资源有限, 所提供的资源也可能是有局限的.老师要想提高概率统计的课堂教学效率, 应通过各种渠道开发资源, 完成概率内容的教学和延伸.统计和概率的引入让我们的学生从全新的视角认识到了有用的数学, 也让很多学生在实践中感受到了从来没有过的成功的喜悦.在大量的数据的收集和整理的过程中, 学生逐步培养了合作的意识, 在一次次的模拟试验中磨炼了学生科学求实的态度, 更加令我们欣喜的是学生在其中享受到的快乐.愿我们的老师也能以全新的视角看待统计、应用统计, 让学生的知识真正来源于生活, 用于生活.
概率学习论文 篇8
一、初中学生在学习“统计与概率”过程中出现的问题
1.生活经验和直觉的误区对学习的干扰
受生活经验和直觉误区的影响, 学生对随机现象问题经常反应迟钝甚至误解, 教学上需要澄清一些日常生活经验和直觉的错误认识.例如, 某彩票每周开奖一次, 每次提供万分之一的中奖机会, 若你每周买一张彩票, 连续坚持十年获奖的可能性有多大?按题设, 每次中奖的可能性是
2.受确定性数学的干扰
误认概率是一个似近似值.由于中学介绍的概率统计内容只是初步的知识基础, 再加之受到传统确定性数学思维的影响, 所以很多问题在道理上是难以说清的, 容易产生一些误解.中学数学是采用概率的统计定义和古典定义引进概率概念的.以抛硬币出现“正面”朝上的概率为例, 按照统计定义, 随着抛硬币次数的增加, 出现“正面”朝上的频率越来越稳定于
3.缺乏与日常生活、自然、社会等领域的联系
数学教育家弗赖登塔尔认为:“数学是现实的, 学生从现实生活中学习数学, 再把学到的数学应用到现实中去.”数学来源于生产生活实际, 反过来又应用于解决生产生活实际中的问题.从学生身边的现实例子说起, 掷一石块, 石块下落;路口的红绿灯等是学生亲身经历、感受过的, 而学生往往不能把这些现实生活中的素材跟“统计与概率”联系起来.这些素材来源于现实, 且经过提炼, 体现了一定的教育价值.任意抛掷一枚均匀的硬币、转动能自由转动的转盘、抛掷一枚均匀的骰子等无一不是学生所熟悉和感兴趣的, 由此教师在教学过程中, 可由这些学生熟悉的、感兴趣的素材引入新知识, 使引入的新知识让学生更有兴趣去学习, 由此也培养了学生理论联系实际的意识.
二、“统计与概率”的学习对策
统计与概率所解决的是实际生活中的“活”问题, 只有在用的过程中才能达到对定义、公式、法则、原理的真正理解, 从而才能反过来有效地解决那些生活中的“活”的问题.
1.引进多媒体教学, 使用信息技术, 灵活处理数据
多媒体是一个新兴的、先进的教学手段, 多媒体作为教学中的一种辅助手段, 它能使目标教学如虎添翼, 更能使目标教学显示其优越性.统计与概率, 有些概念比较抽象, 学生学起来有一定困难, 且每个学生的思维能力、思维方式不同, 接受知识的能力也不同, 而利用计算机的交互功能, 教师可根据学生的不同情况调整教学, 学生也能与教师进行信息交流, 从而实现因材施教, 使问题简单化、趣味化.另外, 利用多媒体的动画演示, 可对统计与概率中的一些随机现象进行模拟.再者, 制作多媒体软件, 可以克服由概率统计例题字数较多而产生抄题时间上的浪费, 从而增加课堂信息量.
在数据收集、整理、分析等过程中, 工作量一般比较繁重, 只要有条件都应该使用计算器和计算机.我们可以通过网络收集数据, 利用计算机软件制作统计表, 绘制各种统计图.利用这些统计工具的另一好处就是, 计算准确.使用计算机和计算器可节省大量时间, 我们可以把精力放在体验统计思想和统计活动中去, 从而对统计和概率加深理解.
2.借助游戏或者实验活动, 体会“统计与概率”抽象的概念.
初中学生尚缺乏抽象的思维能力, 对于统计与概率的概念, 以及随机性和随机现象的规律性较难理解.教师应注重使学生在具体情境中体会概率的意义, 同时, 加强统计与概率之间的联系, 避免单纯的数字运算.借助游戏或者实验活动, 帮助学生理解掌握有关知识.
第一, 通过概率试验, 帮助学生体会随机现象的特点.
第二, 通过概率试验, 可以估计一些随机事件的概率.
第三, 通过概率试验, 有利于学生澄清一些错误认识.
例如, 教师可以借助如下游戏使学生领会统计与概率的内涵.现有电影票一张, 小王与小张决定采取“抛掷硬币”的办法决定谁可以得到这张电影票.即每人各有相等的机会抛掷硬币, 直至抛掷的结果为一正一反时为止, 这时可规定硬币正面朝上者得电影票.为了说明抛掷硬币出现正面朝上的可能性是
通过数据的收集、计算整理、过程分析, 使学生在不经意间学习并运用了数学知识.同时, 激发了学生学习数学的兴趣, 培养了学生的实践能力、交流能力和合作精神.
3.通过学生自身的实践活动, 引发统计思考;强调活动, 淡化概念
通过活动体验统计的思想, 建立统计的观念.统计与生活实际是密切联系的, 在收集数据、处理数据以及利用数据进行预测、推断和决策的过程中, 包含着大量的活动, 完成这些活动需要正确的统计思想观念的指导.统计的学习要强调让学生从事简单的数据收集、整理、描述、分析, 以及根据统计结果进行判断和预测等活动, 以便渗透统计的思想, 建立统计的观念.通过收集数据的活动, 学习收集数据的方法, 感受收集数据结果的不确定性和多样性;通过整理和描述数据的活动, 学习表示数据的方法, 体会统计图表在统计工作中的作用;通过分析数据并根据统计结果进行判断和预测的活动, 学习分析数据的方法, 感受用统计量分析数据的合理性与可行性.
概率学习论文 篇9
大肠癌CRC(Colorectal cancer)作为临床最常见的恶性肿瘤之一,其发病率和死亡率逐年增高[1,2,3,4,5]。如今,CRC已经成为世界上癌症死亡率的三大诱因之一,并且是西方国家第二大导致死亡的癌症。肝脏是大肠癌最常见、最易发生转移的器官。肝转移是大肠癌根治性切除后死亡的主要原因。因此,提高大肠癌肝转移的早期诊断率,对提高大肠癌患者的生存率及改善预后有极其重要的意义[6]。
在过去的十几年中,随着计算机科学的日益发展,计算机辅助癌症诊断成为机器学习应用于医学领域的一个重要实践。2002年,文献[7]提出了一种进化性的人工神经网络方法用于乳腺癌的诊断。同年,文献[8]利用人工神经网络的集成算法在患者的活组织切片图像中识别肺癌细胞。2004年,文献[9]的研究结果表明,数据挖掘技术可以成功地用于子宫癌的检测。文献[9]对过去用于癌症诊断的数据挖掘技术(决策树、神经网络、聚类等)进行了回顾,并提出了基于特征选择的SVM方法来进行癌症诊断,其具有很高的性能。2005年,文献[10]用决策树、人工神经网络、Logistic回归算法在数据集上建立乳癌预测模型,并进行比较。2008年,文献[11]提出了一种CLFNN(补充式学习模糊神经网络)算法,对子宫癌进行诊断。
这些研究大多数是直接利用某种机器学习算法建立癌症预测模型,进而预测患者是否得癌症。然而大多数的机器学习算法对类别值的预测输出并不是真正意义上的概率输出,即具有一定的偏差,从而导致建立的癌症预测模型不能准确地用于医生的辅助诊断。本文将概率校正方法引入模型,从而获得算法的真实概率。首先将AdaBoost、Class-balanced SVM的概率结果进行校正,再将其结果和Logistic回归的预测结果(本文并没有对Logistic回归的结果做概率校正,由于其概率预测结果是没有偏倚,能预测出良好的校正后概率值[13])进行集成,获得最终的预测结果。将预测模型在复旦大学附属肿瘤医院的肠癌患者数据集上与其它算法,如AdaBoost、Class-balanced SVM与Logistic回归算法进行了比较,并且在UCI数据集上进行算法比较。结果显示,通过概率校正及集成学习,可以获得更高和更稳定的AUC性能,适合用于现实中医生的临床辅助诊断。
1背景知识
我们使用了三种不同的分类器用于集成:AdaBoost、 Class-balanced SVM、 Logistic回归,由于这三种模型在计算机医学辅助诊断中应用非常广泛,并具有较好的性能。
1.1AdaBoost算法
AdaBoost算法[12],由于其能显著地提高基分类器的准确率,是现在最流行的集成算法。这种算法通过T轮迭代,对弱分类算法进行集成,自适应地改变训练样本的分布,使得弱分类算法聚焦在那些很难分的样本上。实验结果表明,AdaBoost具有较高的AUC值,因此被广泛地应用于计算机辅助诊断中。然而,AdaBoost对样本的概率输出并不是其真实的概率[13]。
1.2SVM和Class-balanced SVM
支持向量机SVM[14]是一种基于统计学习理论的模式识别方法,它在结构风险最小化基础上,为两种不同类别的样本数据找到一个最优分类面。此方法由Boser、Guyon、Vapnik在COLT-92 上首次提出。本文实现的SVM算法是采用线性内核。由于本文采用的医学数据集是类别不平衡的,一般的分类器会倾向于实例数较多的类别以获得较高的准确率。研究者对这种类别不平衡的问题提出了几种解决方案,例如对不同类别的样本赋予不同的权重值,使其达到类别平衡(Class-balanced)的效果[15]。与AdaBoost类似,Class-balanced SVM对样本的概率输出也不是其真实的概率[13]。
1.3Logisitc回归
Logistic回归[16]属于概率型非线性回归,是分析反应变量为独立分类资料的常用统计分析方法。由于对资料的正态性和方差齐性不做要求、对自变量类型也不做要求,使得近年来Logistic Regression模型在医学研究各个领域被广泛用,如流行病学、病因学的队列研究、病例对照研究,临床诊断的判别模型、治疗效果评价等。
1.4集成学习
集成学习算法通过训练多个基分类器,然后结合它们的预测得到最终结果[17]。由于集成过后的预测结果要远远好于单个分类器,近年来研究者越来越多地关注构建好的集成分类器[8,18,19]。一般来说,集成学习分为两步,即首先构建多个组件分类器,然后结合它们的预测结果作为最终的输出。
2基于概率校正和集成学习的肠癌肝转移预测模型
2.1概率校正
大多数的有监督学习算法对实例类别值的预测输出并不是真正意义上的概率输出[13]。它们的预测输出是一个打分值s(x)[20],用来对测试集中的实例从最有可能属于类c的实例到最没有可能属于类c的进行排序。举例来说,对于两个实例x和y,如果s(x)<s(y),则x属于类c的概率小于y属于c的概率,即P(c|x)<P(c|y)。最大边缘算法如SVM、boosted树、boosted树桩倾向于将实例的真实概率值向0和1中间挤压,导致其预测的概率值产生了一个S形状的扭曲。而Naive Bayes模型倾向于将实例真实的概率值向0和1两端靠近。其它模型如神经网络、Logistic回归等则不会产生概率偏倚,能预测出良好的校正后概率值。实验结果表明经过概率校正后,boosted树、随机森林、SVM将预测最优的概率,降低平方误差和对数损失。主要有两种方法可对扭曲的概率进行校正。
(1) Platt Scaling:
当学习方算法预测的概率值产生了一个S形状的扭曲时,是最为有效的概率校正方法。
(2) Isotonic Regression:
一种强大的能纠正任何单调扭曲的概率校正方法。
当数据没有足够多时,Isotonic Regression更容易产生过分拟合,其性能劣于Platt Scaling。当数据集的数目在1000左右时,Platt Scaling的性能要优于Isotonic Regression [13]。因为本文采用的数据集包含1125个实例,所以将采用Platt Scaling方法对AdaBoost和Class-balanced SVM的预测结果进行校正。下面将对Platt Scaling方法做简要介绍。
Platt在1999年提出,通过sigmoid函数将SVM的预测值转化为后验概率。假设一个学习算法的输出为f(x),通过如下sigmoid非线性函数来获得校正概率。
参数A和B通过最大似然估计在固定的训练集(fi,yi)上获得。利用梯度下降方法,可以得出A和B是下式的解:
其中:
在本文的实验中将通过十折交叉验证方式在数据集上获得A和B的值。
2.2将组件分类器的预测结果进行集成
在许多临床医疗数据挖掘中,往往存在多个具有较好AUC性能的模型。一种常用的方法是从其中选择一个最好的模型并将其用于预测未知数据。另外一种方法是将这多个模型的预测结果进行结合以作为集成的输出结果。常用的集成方法有以下三种[8]:
(1) 简单的算术平均;
(2) 加权的算术平均;
(3) 通过学习来对多个预测进行结合。
理论上后两种方式具有更好的效果,但是,它们均需要额外的训练数据。在本文应用中由于给定的数据集有限,所以将采用对多个模型的预测结果进行简单的算术平均方式以集成作为输出结果。
2.3基于概率校正和集成学习的预测模型
图1显示了本文所提出的模型。首先将AdaBoost的预测结果校正。由于医疗数据通常是类别不平衡的,因此采用Class-balanced SVM使数据集类别平衡,然后校正其预测结果。由于Logistic回归的预测结果没有偏差,因此不需要校正其预测结果。最后,将这三个分类器的结果进行算术平均获得最终的输出结果。
3实验
3.1数据集
本文采用的数据集来源于复旦大学附属肿瘤医院2000年至2005年肠癌患者的真实数据, 因此实验数据具有代表性和实际意义。数据集包含1125个实例,每个实例有13个属性(12个预测变量和1个因变量),表1和表2显示了预测变量的信息。因变量是一个二元分类变量,属性值有0和1,0表示肠癌没有肝转移,1表示肠癌肝转移。因变量的分布情况如表3所示。
3.2评估方法
由于这个数据集具有两个特性:(1)类分布不平衡:医学数据预测诊断不同于一般数据的预测[21]。就两类问题而言。从医学上可分为阳性和阴性。阳性结果代表有病,而阴性结果代表没有病。这里阳性代表肠癌肝转移,阴性代表肠癌没有肝转移。数据集中阳性患者的数目和阴性患者的数目比例约为1:10。如果我们用传统的准确率来对这个数据集上建立的预测模型进行评估将是不科学的。因为如果这个分类模型将这100个阳性患者预测为阴性,那么准确率也达到了90%,但这个预测结果对医生的诊断来说是毫无价值的,因为对医生来说,最重要的是正确预测阳性患者。(2)代价敏感性:如果目标是阳性,而预测结果是阴性,即实际上该病人有病,而预测的结果表示该病人没有病。一般把这种称之为假阴性。如果是这样的话,就会错过疾病治疗的最好时机,病情可能进一步加重,甚至会到不可治愈的地步,后果很严重。可见,假阴性的代价是非常的大。还有另外一种情形就是目标是阴性的,而预测结果是阳性,即实际上是没有病,而被认为是有病。一般把这种情况称之为假阳性。同样假阳性也有代价的,本来没有病却被诊断为有病,给病人带来身心痛苦和经济上的损失。通常将假阴性所犯的代价要远远超过假阳性代价。
在大多数研究中,准确率被用作衡量分类器性能的标准[10,23,24],考虑到医学数据集的两个特性,因此,根据ROC曲线及其(某个FP区间的)AUC值来评价模型的性能优劣。
3.3实验结果
首先我们在复旦大学附属肿瘤医院的肠癌患者数据集验证我们的模型。其次,我们在UCI数据集上进一步验证我们的模型性能的优劣。
3.3.1 实验1
表4显示了单个分类器(AdaBoost、Class-balanced SVM和Logistic回归),直接将分类器进行集成,以及本文提出的经过概率校正后进行集成的模型的AUC值。从表4我们可以看出,通过集成学习,AUC值提高了,当经过概率校正后,AUC值进一步提高。
如果不进行概率校正,某些算法倾向于将实例的真实概率值向0和1中间挤压,而某些算法倾向于将实例真实的概率值向0和1两端靠近,这样在集成学习时给不同的算法预测结果赋予不同的权重值。而经过概率校正后,所有的算法在集成时,采用相同的标准,不会产生偏差。由此,AUC值进一步提高。
图2显示了本文模型、AdaBoost、Class-balanced SVM和Logistic回归的ROC曲线。可以看出在0.1-0.3的FP区域(X轴),本文模型的ROC曲线更靠近左上角。在医生进行临床诊断时,X轴上0.1-0.3的区域对做决策起到重要作用。医生通过本文提出的模型的ROC曲线可以更加准确地诊断。
3.3.2 实验2
在10个UCI数据集上进一步验证本文模型。结果见表5所示,*标记了在某一个数据集上AUC值最高的模型,通过表5发现,10个数据集中,在8个数据集上模型的AUC值是最优的,可见,模型的AUC性能比较稳定。
4结语
本文提出了一种基于概率校正和集成学习的肠癌肝转移预测方法。具体来说,使用了三种流行的数据挖掘方法:AdaBoost、Class-balanced SVM和Logistic回归算法,并在复旦大学附属肿瘤医院的肠癌患者数据集上进行了实验。采用ROC曲线和AUC值来评估模型,这种评估方法被广泛地应用与医疗领域。实验结果表明,通过概率校正和集成学习,算法的AUC得到提高。这一结论在UCI数据集上也得到了证实。这种模型可以帮助现实中肠癌患者医生进行辅助诊断。
然而,数据挖掘的目标并不是取代医疗专业人士和研究人员,而是对医生拯救生命提供帮助。目前采用了AdaBoost、Class-balanced SVM和Logistic回归进行集成,未来我们将采用其它新兴的数据挖掘算法如Real AdaBoost、ANN用于集成,以达到更好的AUC值性能。
摘要:提出一种基于概率校正和集成学习的机器学习模型,用来预测患者肠癌肝转移的概率。首先将AdaBoost和Class-bal-anced SVM的概率结果进行校正,再将其结果和Logistic回归的预测结果进行集成,获得最终的预测结果。预测模型在复旦大学附属肿瘤医院的肠癌患者数据集上与其他算法如AdaBoost、Class-balanced SVM、Logistic回归算法进行了比较,结果显示该模型具有更好的AUC性能,更适合于医生的临床辅助诊断。模型的AUC性能在UCI数据集上进一步得到了验证。
概率学习论文 篇10
一统计与概率学习中易犯错误的原因
1. 统计与概率相关知识与其他数学知识联系不大, 学生学习兴趣不高
初中数学知识中, 代数方面主要是实数、整式、分式、二次根式、方程、函数等方面的知识, 几何知识则是平面图形, 这些知识在运算、推理和证明等方面都与统计和概率的相关知识没有多大关系。加之统计与概率这部分知识概念多, 记起来枯燥乏味, 学生学习兴趣不高, 教师在上课时学生思想容易开小差, 对课堂上教师所教知识掌握不好, 出错率也随之增高。
2. 统计与概率中的概念多, 定义接近, 学生容易混淆
在初中阶段有关统计与概率的三个章节中提及的概念近20个, 定义又相近, 如总体和个体、样本和样本容量、频数和频率、平均数和加权平均数、极差和方差、概率和频率……学生不仅要记下这些概念又要掌握它们的联系和区别, 确实不易, 再由于与其他数学知识联系不大和学生学习兴趣不高的因素, 学生会将一些概念混淆, 导致在做相关题目时出错。比如在教学用频率估计概率这部分内容时, 学生总是分不清什么是频率、什么是概率。
3. 统计与概率相关知识在平时考试或中考中所占分值不多, 教师不够重视
笔者所在的学校, 凡有统计与概率有关章节的学期, 期末考试时, 相关知识所占分值为3%~5%。中考时, 也差不多是这个比重 (在全国中小学教师网络培训课程2011年国家培训贵州省初中数学培训中, 綦教授在讲座中也提到过) 。所以教师们在上这部分内容时, 多是轻描淡写, 匆匆上完就进入本册教材的复习, 这也给学生一个误导:这些知识不重要, 学得好不好没关系。这也影响了学生学习这些有关统计和概率的知识, 如此的恶性循环, 导致学生对这部分知识掌握得不牢固, 在考试中遇到相关问题时, 会不会做都不影响太多分数, 也就不再深入思考了。
二统计与概率学习中易犯错误的解决对策
要解决上述问题, 除了教学参考书上明确指出的:注意统计思想的渗透与体现、改进学生的学习方式、挖掘现实生活中的素材进行教学、准确把握教学要求、关注信息技术的使用等要点之外, 本人认为还要注重四点:
1. 教师端正教学态度, 不能轻视统计与概率相关知识
正人必先正己, 教师一定要先端正自己的教学态度, 本着严谨治学、教书育人的原则, 严格按照新课程标准, 围绕三维目标认真组织教学, 认真备好课、上好课, 对有关统计和概率的知识不能轻描淡写一笔带过。只有教师重视这些知识, 才会用心去教, 学生也也才会用心去学。
2. 将抽象概念具体化, 激发学生学习兴趣
前文提到, 初中阶段的统计和概率中涉及概念达看近20个, 这些较抽象的概念学生不易理解, 若借助多媒体课件将一些概念形象化, 用动画展示, 可能激发学生对这些知识的学习兴趣, 再顺势引导学生理解和归纳, 加深对这些概念的印象, 从而强化记忆效果。
3. 改注入式教学为探究式教学
在教学这部分内容时, 多数教师可能是照本宣科、按部就班地引入、分析、讲解问题, 完成课后习题, 学生被动接受。本来学生学习兴趣不高, 这样老生常谈地向学生灌输枯燥的概念, 更是使学生提不起兴趣, 造成教学效果不佳。教师应该充分利用现实生活中的问题, 采取以学生为主体的参与式教学, 引导学生自主探究学习, 顺利完成有关统计和概率的教学目标。
4. 细解相近概念, 强化记忆
教师要引导学生结合实际问题多去理解和区分如总体和个体、样本和样本容量、频数和频率、平均数和加权平均数、极差和方差、概率和频率等定义相近的概念, 采取传统教学手段和信息技术教学手段相结合的教学方法, 师生共同仔细解读, 加深学生对这些概念的理解, 从而强化记忆。另外, 还要加强相关题目的训练, 除了让学生认真完成课堂作业之外, 应该安排学生严格按照教学进度将同步习题和练习题独立完成, 学习小组互相批改, 并将情况及时地反馈给教师, 教师针对共性错误作集体纠正和讲解, 减少学生的出错率。
以上是一家之言, 难免失之偏颇, 笔者在此提出, 权当抛砖引玉, 期盼同仁们有更多好的做法, 相互取长补短, 共同促进。
概率与统计 篇11
例1 已知一组抛物线[y=12ax2+bx+1],其中[a]为2、4、6、8中任取的一个数,[b]为1、3、5、7中任取的一个数,从这些抛物线中任意抽取两条,它们在与直线[x=1]交点处的切线相互平行的概率是( )
A. [112] B. [760] C. [625] D. [516]
分析 求解此类问题的关键在于弄清直线平行的条件是什么?
解 这一组抛物线共[4×4=16]条,从中任意抽取两条,共有[C216=120]种不同的方法. 它们在与直线[x=1]交点处的切线的斜率[k=y|x=1=a+b]. 若[a+b=5],有两种情形,从中取出两条,有[C22]种取法;若[a+b=7],有三种情形,从中取出两条,有[C23]种取法;若[a+b=9],有四种情形,从中取出两条,有[C24]种取法;若[a+b=11],有三种情形,从中取出两条,有[C23]种取法;若[a+b=13],有两种情形,从中取出两条,有[C22]种取法. 由分类计数原理知任取两条切线平行的情形共有[C22+C23+C24+C23+C22=14]种,故所求概率为[760]. 选B.
点拨 分类讨论是指在研究问题时,若对事物的整体研究有困难,可转而研究事物的各个局部,通过选择恰当的切入点,从不同的侧面把原问题变成几个小问题,各个击破,从而完成对整体的研究. 分类讨论时我们要思维慎密、严谨、不重复、不遗漏.
例2 设[AB=6],在线段[AB]上任取两点(端点[A、B]除外),将线段[AB]分成了三条线段.
(Ⅰ)若分成的三条线段的长度均为正整数,求这三条线段可以构成三角形的概率;
(Ⅱ)若分成的三条线段的长度均为正实数,求这三条线段可以构成三角形的概率.
分析 显然第一问可用枚举法求解,第二问可用几何法求解.
解 (Ⅰ)若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为1、1、4,1、2、3,2、2、2共3种情况,其中只有三条线段为2、2、2时能构成三角形,则构成三角形的概率[P=13].
(Ⅱ)设其中两条线段长度分别为[x、y],则第三条线段长度为[6-x-y],则全部结果所构成的区域为[0 若三条线段[x、y]、[6-x-y]能构成三角形,则还要满足[x+y>6-x-y,x+6-x-y>y,y+6-x-y>x,]即为[3 点拨 利用枚举法时要注意求解问题不要遗漏,对几何概型的考查要注意分清几何概型是长度、面积还是体积. 例3 袋子[A]和[B]中装有若干个均匀的红球和白球,从[A]中摸出一个红球的概率是[13],从[B]中摸出一个红球的概率为[p]. (Ⅰ)从[A]中有放回地摸球,每次摸出一个,有3次摸到红球即停止. 求恰好摸索5次停止的概率; (Ⅱ)若[A、B]两个袋子中的球数之比为1∶2,将[A、B]中的球装在一起后,从中摸出一个红球的概率是[25],求[p]的值. 分析 第一问是常规题,第二问是求解概率问题的逆向运用,解题的关键还是在于如何列概率表达式. 解 (Ⅰ)由题意知前4次中有两次摸到了红球,第5次摸到的也是红球,所以概率为[C24×(13)2×(23)2×13][=881.] (Ⅱ)因为[A、B]两个袋子中的球数之比1∶2,所以设袋子[A]中有[m]个球,则袋子[B]中有[2m]个球. 由于从[A]中摸出一个红球的概率是[13],从[B]中摸出一个红球的概率为[p],故袋子[A]中有[13m]个红球,袋子[B]中有[2mp]个红球,[A、B]中的球装在一起后,共有红球[13m+2mp]个, 故[12m+2mp3m=25],得[p=1330]. 点拨 首先应仔细分析题意,当概率分布不是一些熟知的类型时,应全面地剖析各个随机变量所包含的各种事件,并准确判断各事件的相互关系,从而求出各随机变量相应的概率. 例4 对某电子元件的寿命进行追踪调查,情况如下: (Ⅰ)列出频率分布表; (Ⅱ)画出频率分布直方图; (Ⅲ)估计电子元件寿命在100~400 h以内的概率; (Ⅳ)估计电子元件寿命在400 h以上的概率. 分析 (Ⅰ)由题意知,本题已经对所给的数据进行分组,并且给出了每段的频数,根据频数和样本容量做出频率,填出频率分布表;(Ⅱ)结合前面所给的频率分布表,画出坐标系,选出合适的单位,画出频率分步直方图. (Ⅲ)(Ⅳ)理解频率分布表的含义可直接求解. 解 (Ⅰ)频率分布表如下: (Ⅱ)频率分布直方图如下: [频率/组距][寿命(h)][100 200 300 400 500 600] (Ⅲ)由频率分布表可以看出,寿命在100~400h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400h内的概率为0.65. (Ⅳ)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35. 点拨 通过本题可掌握总体分布估计的各种方法和步骤. 画频率分布条形图、直方图时要注意纵、横坐标轴的意义. 例5 甲、乙两种鱼的身体吸收汞,当汞的含量超过体重的1.00ppm(即百万分之一)时,就会对人体产生危害. 质检部门对市场中出售的一批鱼进行检测,在分别抽取的10条鱼的样本中,测得汞含量与鱼体重的百分比如下: 甲种鱼1.31 1.55 1.42 1.35 1.27 1.44 1.28 1.37 1.36 1.14 乙种鱼1.01 1.35 0.95 1.16 1.24 1.08 1.17 1.03 0.60 1.11 (Ⅰ)用前两位数做茎,画出样本数据的茎叶图,并回答下面两个问题: (ⅰ)写出甲、乙两种鱼关于汞分布的一个统计结论. (ⅱ)经过调查,市场上出售汞超标的鱼的原因是这些鱼在出售前没有经过检验,可否得出每批这两种鱼的平均汞含量都超过1.00ppm? (Ⅱ)如果在样本中选择甲、乙两种鱼各一条做一 道菜,(在烹饪过程中汞含量不会发生改变) (ⅰ)如果20条鱼中的每条鱼的重量都相同,那么这道菜对人体产生危害的概率是多少? (ⅱ)根据算出的结论,你对政府监管部门有什么建议?(提出一条建议即可) 分析 求解此题的关键在于如何正确理解茎叶图. 解 (Ⅰ)(ⅰ) 甲 乙 0.6 0 0.8 0.9 5 1.0 1 8 3 4 1.1 6 7 1 8 7 1.2 4 6 7 5 1 1.3 5 4 2 1.4 5 1.5 1. 甲种鱼的汞含量分布成对称性,基本都集中在1.3左右. 乙种鱼的汞含量分布大致成对称性,基本集中在1.0~1.1左右, 2. 甲种鱼的汞含量的中位数是1.355;乙种鱼的汞含量的中位数是1.095. (ⅱ)不一定或者无法确定. (Ⅱ)(ⅰ)易得[P=93100]. (ⅱ)建议政府加强市场管理,鱼要检验后再出售:产鱼的水域尽量减少污染. 点拨 开放性试题最重要的一个特征是答案多元不唯一,考生答题可不必拘泥于一个思路和单一的、固定的答案,所答内容也不必要求与答案完全一致. 解答开放性试题的策略是:(1)认真审题,审题过程一定要全面分析、考虑周到,明确试题的方向与范围,明确题目条件,从而优化解题思路;(2)积极思考,同学们要灵活应用所学的知识,多角度思考、多层次分析、多方位解答,充分体现创新意识;(3)回归书本. 开放性试题往往具有“高起点、低落点”的特点,即题型比较新颖,但解决问题所用的知识仍是书本知识,解答时应以问题为中心在教材中求解;(4)准确阐述,解答时除了必须对所学的知识做到透彻理解和掌握外,还应通过对题目的阅读、理解和分析,推理方法,理清思路,准确地阐述试题的答案. 例6 一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10. 现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为[m],那么在第[k]小组中抽取的号码个位数字与[m+k]的个位数字相同. 若[m=6],则在第7组中抽取的号码是 . 分析 求解此题的关键在于理解系统抽样方法的定义. 解 此问题总体中个体的个数较多,因此采用系统抽样,按题目中要求的规则抽取即可. ∵[m=6],[k=7],[m+k=13], ∴在第7小组中抽取的号码是63. 点拨 本题主要考查了对抽样方法的识别. 当总体中个体个数较多而差异又不大时可采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行. 【专题训练八】 1. 从2011名学生中选出50名学生组成参观团,若采用下面的方法选取:现用简单随机抽样从2011人中剔除11人,剩下的2000人再按系统抽样的方法抽取50人,则在2011人中,每人入选的概率( ) A. 都相等,且为[140] B. 都相等,且为[502011] C. 均不相等 D. 不全相等 2. 若变量[y]与[x]之间的相关系数[r=-0.9362],则变量[y]与[x]之间( ) A. 不具有线性相关关系 B. 具有线性相关关系 C. 它们的线性关系还要进一步确定 D. 不确定 3. 一个均匀的正方体玩具的各个面上分别标以数1、2、3、4、5、6(俗称骰子),将这个玩具向上拋掷一次,设事件[A]表示“向上的一面出现奇数点”(指向上一面的点数是奇数),事件[B]表示“向上的一面出现的点数不超过3”,事件[C]表示“向上的一面出现的点数不小于4”,则( ) A. [A]与[B]是互斥而非对立事件 B. [A]与[B]是对立事件 C. [B]与[C]是互斥而非对立事件 D. [B]与[C]是对立事件 4. 一个电路上装有甲、乙两根熔丝,甲熔断的概率为0.85,乙熔断的概率为0.74,甲、乙两根熔丝熔断相互独立,则至少有一根熔断的概率为( ) A. 0.15×0.26=0.039 B. 1-0.15×0.26=0.961 C. 0.85×0.74=0.629 D. 1-0.85×0.74=0.371 5. 如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( ) [数据] [频率/组距][0.1][0.04][5 10 15 20] A. 12.5 12.5 B. 12.5 13 C. 13 12.5 D. 13 13 6. 最小二乘法的原理是( ) A. 使得[i=1n [yi-(a+bxi)]]最小 B. 使得[i=1n [yi-(a+bxi)2]]最小 C. 使得[i=1n [yi2-(a+bxi)2]]最小 D. 使得[i=1n [yi-(a+bxi)]2]最小 7. 某单位为了了解用电量[y](度)与气温[x](℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: [气温[x](℃)&18&13&10&-1&用电量[y](度)&24&34&38&64&] 由表中数据得线性回归方程[y=bx+a]中[b≈-2],预测当气温为-4℃时,用电量的度数约为( ) A. 58 B. 66 C. 68 D. 70 8. 从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( ) A. [3] B. [2105] C. 3 D. [85] 9. 设[a∈]{1,2,3,4},[b∈]{2,4,8,12},则函数[f(x)=][x3+ax-b]在区间[1,2]上有零点的概率为( ) A. [12] B. [58] C. [1116] D. [34] 10. 签盒中有编号为1、2、3、4、5、6的6支签,从中任意取3支,设[X]为这3支签的号码之中最大的一个,则[X]的均值为( ) A. 5 B. 5.25 C. 5.8 D. 4.6 11. 某地区试行高考考试改革:在高三学年中举行5次统一测试,学生如果通过其中的2次测试即可获得足够学分升上大学继续学习,不用参加后面的测试,而每个学生最多也只能参加5次测试,假设某学生每次通过测试的概率都是[13],每次测试通过与否相互独立. 规定:若前4次都没有通过测试,则第5次不能参加测试,则该学生考上大学的概率为 . 12. 某同学同时掷两颗骰子,得到点数分别为[a]、[b],则双曲线[x2a2-y2b2=1]的离心率[e>5]的概率是 . 13. 温家宝总理在十二五规划中提到十二五期间,要保民生. 为落实温总理指示,某社区办事处调查了居民的身体素质情况,从本社区内随机抽查了50名居民进行百米测试,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组: [频率/组距][秒][13 14 15 16 17 18 19][0.36 0.34][0.18][0.06 0.04 0.02] 如图是按上述分组方法得到的频率分布直方图. 设成绩小于17秒的居民人数占抽查人数的百分比为[x],成绩大于等于15秒且小于17秒的居民人数为[y],则从频率分布直方图中可以分析出[x]和[y]分别为 . 14. 位于坐标原点的一个质点[P]按下述规则移动:质点每次移动一个单位;移动的方向为向上或向 右,并且向上、向右移动的概率都是[12]. 质点[P]移动5次后位于点[(x,y),则x2+y2<25]的概率为 . 15. 设随机变[X]只能取5、6、7、…、16这12个值,且取每一个值的概率均相等,则[P(X>8)]= . 若[P(X<x)=112],则[x]的范围是 . 16. 甲箱的产品中有5个正品和3个次品,乙箱的产品中有4个正品和3个次品. (Ⅰ)从甲箱中任取2个产品,求这2个产品都是次品的概率; (Ⅱ)若从甲箱中任取2个产品放入乙箱中,然后再从乙箱中任取一个产品,求取出的这个产品是正品的概率. 17. 甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5项预赛成绩记录如下: (Ⅰ)用茎叶图表示这两组数据; (Ⅱ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率; (Ⅲ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由. 18. 甲乙两个学校高三年级分别为1100人、1000人,为了统计两个学校在地区二模考试的数学科目成绩,采用分层抽样抽取了105名学生的成绩,并作出了部分频率分布表如下:(规定考试成绩在[120,150]内为优秀) 甲校: (Ⅰ)计算[x、y]的值,并分别估计两上学校数学成绩的优秀率; (Ⅱ)由以上统计数据填写下面2×2列联表,并判断是否有97.5%的把握认为两个学校的数学成绩有差异. 19. 道路交通安全法中将饮酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量[Q](简称血酒含量,单位是毫克/100毫升),当20≤[Q]<80时,为酒后驾车;当[Q]≥80时,为醉酒驾车. 某市公安局交通管理部门在某路段的一次拦查行动中,依法检查了200辆机动车驾驶员的血酒含量,其中查处酒后驾车的有6人,查处醉酒驾车的有2人,依据上述材料回答下列问题: (Ⅰ)分别写出违法驾车发生的频率和醉酒驾车占违法驾车总数的百分数; (Ⅱ)饮酒后违法驾驶机动车极易发生交通事故,假设酒后驾车和醉酒驾车发生交通事故的概率分别是0.1和0.25,且每位驾驶员是否发生交通事故是相互独立的. 依此计算被查处的8名驾驶员中至少有一人发生交通事故的概率. (精确到0.01)并针对你的计算结果对驾驶员发出一句话的倡议. 20. 在一个盒子中,放有标号分别为1、2、3的三张卡片,现从这个盒子中,有放回地先后抽得两张卡片的标号分别为[x、y],设[O]为坐标原点,点[P]的坐标为[(x-2,x-y)],记[ξ=|OP|2]. (Ⅰ)求随机变量[ξ]的最大值,并求事件“[ξ]取得最大值”的概率; (Ⅱ)求随机变量[ξ]的分布列和数学期望. 21. 一袋中有[m(m∈N*)]个红球,3个黑球和2个白球,现从中任取2个球. (Ⅰ)当[m=4]时,求取出的2个球颜色相同的概率; 1 课程特点 随机现象的普遍存在性使得用随机数学来度量其内部的变化发展规律已是一种潮流。但它与确定性现象有着根本的区别, 要求教师在授课中坚持将随机化的思想贯穿整门课程的始终, 将广泛的应用背景作为整门课程的支撑。概率论正是研究随机现象的故有规律性的一门学科, 但它的数学思维方式不同于几何、代数、分析的方法, 具有独特性。数理统计部分是从理论与实际相结合的角度, 根据试验或观察得到的数据来研究随机现象, 并对研究对象的客观规律性作出合理的估计与判断。 2 改革创新的主要措施 2.1 合理设计整本书的教学目标, 合理设计每次课的教学目标 教学目标是指教学活动实施的方向和预期达成的结果, 是上好一堂课的前提, 是保证课堂教学质量与效益的基础。科学合理教学目标的确立有利于教师明确学生“学什么”和教师事后评价学生“学”得怎么样, 有利于教师明确学生“怎么学”和教师“怎么教”问题。下面就此问题, 提出两点教学建议。 1) 通过问题, 正确引入本次课的授课内容, 让学生带着问题思考学习。 2) 采用结果性目标的方式, 明确告诉他们, 学生的学习结果是什么。 比如讲解分布函数这节内容时, 明确告诉学生理解分布函数的定义和三个性质, 会求三种常见的离散型、连续型随机变量的分布函数。当然, 制定教学目标切忌使用模糊性语句, 应遵循整体性、主体性、层次性、可测性、动态性五个原则。 2.2 精心组织教学内容, 重视课程内容革新, 不断充实新发展的理论与应用问题 授课过程应结合所授课院系学生的特点, 把基础知识的学习放在首位, 一定要使全体学生通过本课程的学习, 掌握概率论与数理统计的基本概念, 理解它的基本理论和方法, 从而使学生掌握处理随机现象的基本思想和方法。对于概率论与数理统计的实际应用要特别重视, 加强学生运用概率论知识去解决问题的能力, 注重培养学生的数学思维能力, 分析综合能力, 理论联系实际的能力。同时, 教师要不断提高自身内涵, 向授课对象介绍目前新的研究热点, 不断提高学生的兴趣, 激发专研能力。 2.3 注重全面实施科学授课模式、先进的教学方法和教学手段 作为培养创新性人才的高校教师应注重学生各种能力的培养, 积极探索更科学、更合理的教学和素质教育的思路和途径, 以适应学生的不同需求。解决此问题的最好方法是把启发式教学、研究式教学、提问式和讨论式教学及理论与实践结合的教学方法灵活运用于每堂课中, 取长补短, 摈弃填鸭式、照本宣科式的被动教学模式。 此外, 任课教师要鼓励学生主动发问、质疑和主动回答问题。启发式教学能让学生参与到教学过程中来, 主动思考问题;研究性教法鼓励、引导和鞭策学生自学, 提高学生独立思考问题和解决问题的能力, 为日后做研究奠下基础。不妨把讨论式教法放在“例题解析”、“评定定理”等论方面。在课堂上, 我注重问题的创设, 力求为学生提供氛围, 让他们在实践活动中发现问题, 着手解决问题, 引导学生思考并成为学习的主人, 教师成为学生的”协作者”。 数学理论的研究源于客观实际, 反过来, 通过数学应能解决或解释实际问题。教师应着重重视理论与实践相结合的方法在《概率论与数理统计》学科中得到充分的反映和展示。结合实例讲解概率论对生活现象的解释, 假设检验在生产实践中的广泛应用, 数学软件在概率论与数理统计中的应用, 让他们更深刻地意识到该门课程不是一门孤立的课程, 而是与许多学科都有着紧密的联系, 意识到这门课程的重要性。 2.4 为学生们精心设计和实行学习方法、学习方式 在学习该门课程时, 应注意与其他学科的差异。我们应按照该课程自身的特点找到正确的学习方法, 结合适量的联系, 能取得“事半功倍”的效果。下面笔者结合例子, 提出几点建议。 2.4.1 数学概念的学习方法 对于数学概念, 仔细推敲引入的概念间的内涵和相互间的联系我建议通过以下就几个方面来学习: (1) 记住概念要求的几个条件; (2) 背诵定义, 掌握特性; (3) 与其它概念进行比较, 弄清概念间的关系。 案例1如何理解随机变量的涵义? 分析: (指出理论与实践的关系) 不妨按照“提出问题, 指出研究的必要性———建立概念———分析主要性质———理论与方法的应用———理论进一步发展”几个步骤来指出为何会有这个概念。进一步说明引入随机变量主要意义:将随机试验的结果数量化, 建立了连接随机现象和实数空间的一座桥梁, 自然而然地讲解随机变量的定义。 案例2如何理解随机变量的相关性? 分析:任一概念都有内涵和外延两个特征。对相关性的理解也应按照案例1中的五个步骤来掌握, 在理解这个概念的基础上, 应该还要搞懂与之相关概念比如独立性, 随机事件的相容性等的联系与差异。这样不至于认为概率论的知识之间毫无联系。 2.4.2 数学公式的学习方法 好记性不如烂笔头。对于数学公式的学习, 不防多写几遍, 仔细推敲公式中字母的涵义, 理解变量间的关系, 在公式具体化过程中体会公式中反映的规律和技巧, 了解它的各种等价变换。 案例3二维随机变量的联合分布函数, 边缘分布函数为 分析:对于此公式的学习, 首先要弄清楚联合分布与边缘分布的定义, 联合分布表征两个一维随机变量内部的变化规律, 而边缘分布是描述各个变量自身的变化特征。其次, 结合分布函数的定义导出两者之间的关系, 仔细推敲变量的具体涵义。 2.4.3 数学定理的学习方法 至于定理, 不妨背诵定理, 自己给定理起个名称, 分清定理的条件和结论, 哪些情况下用到哪个定理解题?它揭示的关系是什么?体会定理与逆否定理、逆命题的联系。若定理包含公式, 如中心极限定理定理、全概率定理等等, 对于它们的学习还应该同公式的学习方法结合起来进行。 3 小结 概率论与数理统计的教学改革是一项不断创新、不断完善的工作, 需要广大同仁的不断努力。实践证明, 在教学工作中, 若能做到把多种先进的教法有效结合, 帮助学生掌握正确的学习方法, 能极大的提高教学质量。S 摘要:概率论与数理统计是一门公共基础课课程。针对教师授课、学生学习过程中出现的问题, 本文从该课程的特点着手, 初步讨论了该门课程的教学改革, 分析学习过程中的注意要点, 着重讲解这门课程的学习方法、授课技巧。 关键词:概率论与数理统计,教学改革,学习方法 参考文献概率学习论文 篇12