统计学习方法

2024-08-11

统计学习方法(精选11篇)

统计学习方法 篇1

摘要:本文对统计分析方法的重要性和作用进行分析, 对统计分析技术要点进行分析, 探讨在新的形势下, 如何正确使用统计方法, 提高统计分析水平, 提出自己的建议和意见。

关键词:统计方法,分析水平,建议和意见

一、统计分析的重要性和作用

统计工作是最常见的工作, 统计工作是其他分析工作, 总结工作的基础, 只有正确的进行统计, 其他的工作才能够顺利进行。统计分析强调的是对完整的大量的信息进行处理统计分析研究, 最终以书面形式表达结果的一种分析方法。统计分析工作研究资料的过程, 分析信息的过程, 是感性与理性知识的升华阶段, 运用阶段结果进行统计分析工作, 统计分析是要充分利用现有的统计数据, 在统计专业的基础上, 权衡各方的利益, 进行细致分析, 并提出潜在的问题, 分析研究经济运行过程中出现的各种问题并提出建议。

完整的统计分析工作, 通常都是通过综合运用统计数据进行统计分析工作, 统计工作的作用是非常突出的, 它可以充分发挥统计信息的咨询和监督职能, 提高统计服务质量水平。从而使统计分析在统计工作中占据着非常重要的地位。从某种意义上说, 统计分析的水平, 在一定程度上可以反映一个单位的统计工作水平, 是衡量一个单位统计水平的重要标志, 对一个单位的统计分析有重要的阶段性作用。通过统计分析, 统计部门可以发挥优势, 发挥与统计部门相关的整体功能的发挥, 可以发现统计工作中的新问题, 然后进行改革和创新统计工作, 可以锻炼和培养出具有高素质的统计专业队伍力量, 在统计工作中创造新优势, 形成核心竞争力, 人才一直是企业竞争的关键因素, 综合力量的对比, 最终也体现到人才的竞争上面, 因此, 对于统计工作来说也是一样, 要重视对统计专业人才的培养, 这样才能保证统计分析工作的正常进行。

统计分析工作的重要意义在于, 统计分析工作分析经济运行过程, 是一个强有力的武器, 了解社会和统计任务, 这些任务具体包括收集工作, 整理工作和分析工作, 确定其发展的方向, 这样统计分析工作就可以对经济又很大的借鉴作用, 通过历史分析数据, 得出结论, 指导实践, 这在一定程度上也体现了理论联系实际, 理论指导实践的马克思主义哲学思想, 是有一定的科学依据的。统计分析是科学的“度”的分析工作, 度和量在一定程度上会相互转化, 不注意量的成分, 就会超过一定的度, 不注意度, 量就会在一定程度上有所失衡, 因此, 在统计分析工工作中, 要认真分析好度和量之间的作用, 注重两者之间的相互转换关系, 这样才能做好统计分析工作。在从事经济性能管理, 统计工作等相关的涉及到度量的工作类别中, 必须学会定量分析的方法, 进行科学的测量和分析, 这是是现实地对经济发展的评估的需要。加强统计分析研究工作, 可以更好地发挥统计整体功能, 加快改革和完善统计工作水平。统计分析也是建立在统计工作的新形势的一个重要途径。

二、统计分析技术

统计分析技术的核心在于是不是有突破, 即:研究的内容是新的, 方法也是新的。这里的统计分析技术强调的是创新, 新的内容, 新的方法, 新的理念, 等等, 只有创新才能进行发展, 才会有新的突破。

1、要求的新的内容:

要定量分析, 把握好经济发展的脉搏, 对统计分析技能进行分析和了解, 提高预警, 预测能力, 了解政策取向, 在新的形势下, 我们必须增加可以反映统计时间的因素, 在统计分析中, 时间要素很重要, 有时候会对结果产生很大的影响。

2、四句话级别上做文章, 抓迹象, 看趋势, 了解主要矛盾进行定量分析, 了解自然现象的统计分析新方法的应用。

3、统计分析的过程应注意的一些问题。

垂直指数对比, 各种相关的目标, 反映客观经济现象是好还是坏, 大小, 速度等, 揭露矛盾, 找出差距, 然后对经济现象进行比较分析。通过国家, 区域经济类型之间的所属单位之间的在同一时间不同的相关指标的具体比较分析。与此相反, 在不同时期同一指标的情况, 反映其动态的发展和变化。相对指标分析, 各种经济现象之间的关系。

三、提高统计分析水平

1、写作技巧的能力

要努力提高分析问题的高度, 深入研究问题, 解决问题能力。具有可预见性和指导性, 理论要联系实际, 从实践中来, 到实践中去。这其中的特点是强调准确性强, 有针对性, 时效性, 逻辑性。具有新鲜的创意。为了提高统计分析水平, 统计分析工作应接受社会各级人群的建议, 这是确保优质的服务质量的关键, 只有提高了统计分析水平, 才能够更好的为各种人群服务, 为国家政策服务。

2、坚实的经济基础理论水平

宏观调控决策的统计分析。在市场经济中, 所有的经济活动应遵循的法律经济基础, 按照经济规律, 运用经济理论来观察和分析经济和社会现象, 寻找科学的对策, 这是时间进度和经济分析的客观要求。不明白经济学的基本原则, 就不能完全理解统计指标之间关系的内在含义, 就不可能镇长运用统计分析方法来解决实际存在的问题。因此, 统计分析, 要使用特殊的经济和统计方法, 对大量的统计数据和社会经济现象数据进行客观分析和判断的基础上, 揭示其内在联系和规律。

3、紧密联系地区的实际情况。

对地区的完整的理解, 进行一般统计分析, 只有透彻的了解当地的情况, 为经济和社会形势服务, 这样才能提出有针对性的建议, 统计分析, 进行区域经济统计分析, 如果不明白当地的情况, 可能出现“信息不对称”的情况, 形成错误的结论, 而这样的结论, 对于指导实践来说, 可能是错误的, 实践的方向也可能是错误的, 会造成严重的后果。因此, 我们必须了解当前形势下的经济运行情况, 这是非常重要的, 这在一定程度上决定了事业的成败, 是至关重要的。

4、紧紧围绕经济工作, 进行重点问题分析, 热点问题分析。

统计分析的价值和效率, 引起领导的重视, 这同时也是将工作落到实处的一个很重要的原因, 结果取决于其能力, 紧紧围绕当地党委, 政府, 围绕社会的中心热点, 对统计分析工作的展开具有重要的知道意义。

参考文献

[1]于鹏飞.财务预警系统概念和方法浅析[J].辽宁广播电视大学学报, 2011, (02)

[2]胡克高.用案例教学构建你的课堂[J].新课程学习 (下) , 2011, (05)

统计学习方法 篇2

模型选择的典型方法是正则化,正则化的一般形式如下:

其中,第一项是经验风险,第二项是正则化项,正则化项可以取不同的形式,例如,正则化项可以是模型参数向量的范数。回归问题中,损失函数是平方损失,正则化项可以是参数向量的L2范数:

正则化项也可以是参数向量的L1范数:

经验风险较小的模型可能较复杂,这时正则化项的值会较大,正则化的作用是选择经验风险与模型复杂度同时较小的模型。

正则化符合奥卡姆剃刀原理,在所有可能的模型中,能够很好的解释已知数据并且十分简单的模型才是最好的模型。从贝叶斯估计的角度来看,正则化项对应于模型的先验概率,可以假设复杂的模型有较小的先验概率,简单的模型有较大的先验概率。

统计信息质量提高方法分析 篇3

【关键词】统计信息;质量;体制

1.统计信息失真的原因探讨

造成统计信息失真的原因是多方面的。有人为因素,如篡改、虚报、瞒报、伪造等;也有非人为因素,如调查人员认识能力的局限、调查方法落后、统计管理体制不适应市场需求、信息传递渠道不畅等。主要原因表现为以下几个方面:

1.1统计管理体制存在一定的问题

我国现行的统计管理体制是“双重领导体制”,一是在行政上受中央和地方各级人民政府领导,二是在业务上由国家统计局代表国务院负责和协调国家统计业务工作。当统计工作与行政工作相矛盾时,统计业务部门往往处于被动地位,经常是统计业务工作服从行政工作,当一些地方领导基于自身经济利益和政治利益的追求时,极易诱导或迫使统计人员提供虚假的统计数据。因此,这种“双重领导体制”是造成统计信息失真最重要的原因之一。

1.2干部考核体制存在一定的弊端

近年来,统计数据在各级政府考核领导干部的政绩中越来越重要。不少地方把经济发展数据作为衡量领导干部政绩的主要依据,不能坚持定性与定量相结合,没有建立起严格、科学、规范的业绩评估制度,致使一些干部的头脑中存在着“数字能出官”的观念。有些干部为了自己的政绩在统计数字上大做文章,造成统计信息的人为失真现象,模糊了国民经济运行的实际情况,误导了对当前经济运行情况客观真实地分析和判断。

1.3统计机构不健全,统计人员素质偏低

长期以来,统计部门的机构一直不健全,统计人员待遇偏低,造成统计人员队伍不稳定。在一些企业,统计人员没有专职专责,马虎了事,得过且过,形同虚设;还有一些企业不重视统计工作,根本就没有设置统计机构,使统计工作出现极大的随意性。部分统计人员素质偏低,在实际工作中往往不能严格按照《统计法》的要求去工作,容易唯领导意志是从,结果成为领导造假的帮凶。

1.4统计技术落后

目前,我国许多地方的统计技术还比较落后,不能运用现代信息技术,大规模、高效率、深层次地开发统计资源,不能很好地利用统计信息网络,在统计信息的产业化、社会化、商品化方面做得很不够。各级统计部门应加强网络建设,在全国形成完备的统计信息网络,使统计信息和市场信息有机地结为一体。

1.5执法不严,打击不力

《统计法》中明确规定:“地方、部门、单位的领导人授意统计机构、统计人员篡改统计资料或者编造虚假信息的,依法给予行政处分……”但在实际统计工作中,有法不依、执法不严、违法不纠等现象时有发生,各级统计部门对统计工作的执法力度不够,没有严格按照《统计法》的规定执行,对虚报、瞒报、伪造、篡改统计资料,阻挠统计执法检查等统计违法行为打击不力,致使“假数出官,官出假数”的现象屡屡出现。

2.提高统计信息质量的方法

2.1改革统计管理体制

改变统计机构的隶属关系,维护统计部门的独立性,实行中央、省、县统计机构垂直领导的统计管理体制,各级统计机构对下一级统计机构的人、财、物实行垂直领导,同时服务于当地政府和企业主管部门,使整个统计系统自成体系;实行内部管理,从根本上避免各级政府部门对统计数字的行政干预,保证统计数字的准确性,真正起到监督政府和企业是否正常运行的作用。

2.2完善干部考核制度

对各级干部的考核、评价以及升迁、任免等,都要建立在严格、科学、规范的业绩评估制度之上。组织人事部门在考核干部时,要科学地对待统计数字,不要被表面现象所迷惑。不仅要看到数字,同时也要对社会发展、环境质量、群众意见等多种指标做出综合评价,从而有效地避免因干部考核制度不全面而导致统计信息失真。对那些弄虚作假的干部不仅不提拔,而且还要给予严厉的处罚。

2.3加强基层统计建设,提高信息源头质量

基层统计是整个统计工作的基础和源头,基层统计工作的好坏直接关系到政府统计信息的质量,只有基层的统计数字搞准了,才能使逐级上报的总资料准确;否则,即使科学再发达,使用再高级的电脑操作,也不过是假数真算、自欺欺人。因此,提高统计信息质量,必须把重点放在基层。具体要解决以下几个问题:首先要健全统计机构,配齐统计人员,统计机构之间要形成一个网络,保证统计信息的畅通传递;其次要制定一整套的统计工作考核办法,对统计数据进行经常性的检查,对统计人员定期进行考核,考核结果与奖惩挂钩。

2.4提高统计设计质量

统计设计是指根据统计研究对象的性质、特点以及统计研究的目的,对统计工作的各个方面、各个环节所做出的通盘考虑和安排。统计设计的结果表现为各种设计方案,如统计指标体系、分类、目录、统计调查方案、汇总整理方案等,这些方案对以后各阶段的统计工作具有指导作用。众所周知,产品的生产始于产品的设计,因此,作为统计工作产品的统计信息的质量首先是设计出来的,然后才是生产出来的。如果统计设计不够科学合理,那么就生产不出高质量的统计信息来。

2.5不断改进和完善统计核算方法

提高统计信息质量最关键的是统计制度的创新、核算方法的科学和统计指标体系的完善。首先,必须根据社会经济的发展,建立一套适合中国社会主义市场经济特点的统计制度;其次,要不断改进、规范现有的统计核算方法,对一些核算指标应增加其概念与核算原则;再次,要根据社会经济的发展状况,增加和完善统计指标体系,及时有效地增加专项统计指标体系,以反映我国在经济体制转变过程中出现的新情况、新问题。

2.6提高统计人员的素质

统计人员的政治素质和业务水平是提高统计数据准确性的决定性因素。来自各个方面、各个层次的干扰和影响统计数据的各种举动,最终能否实现,都会在统计部门提供的统计数据上体现出来的,因此,培養造就一支敢于坚持原则,抗干扰能力强、思想端正、热爱统计事业、技能过硬的统计队伍是统计建设中一个永恒的主题。为此,一方面要加强统计人员的职业道德建设,细化职业道德规范,以便于统计人员在业务工作中更好地执行、贯彻和操作,弘扬务实求真、忠于职守的正气;另一方面要采取各种措施,有计划、有组织、多层次、多形式地开展统计人员的业务培训活动,不断提高统计人员的业务素质和适应市场的能力,加强统计队伍的自身建设,为提高统计数据质量提供基础性保障。

2.7加强法制建设,加大执法力度

法制是市场经济的基础,统计法制是与社会主义市场经济体制相适宜的治理统计工作的方式,能够有效地保护统计社会关系的长期稳定和统计调查对象的合法权益。各级统计部门要树立依法行政的理念,克服统计工作中的“人治”思想。首先,要加大统计有关法规的宣传力度,把宣传的重点从统计人员转移到单位、部门领导人,真正在单位、部门领导人中形成统计法律意识和执法的自觉性,对于弄虚作假者,一经查出,要公开曝光,予以严惩;其次,要加大统计数据质量检查频率和统计执法力度,使统计工作切实纳入法制轨道,真正做到有法可依,执法必严,违法必究。 [科]

【参考文献】

[1]仇洪江.统计信息失真的原因及对策[J].北京统计,2004,(3):37~38.

试验统计方法教学方法改革 篇4

1 精选教材,优化教学内容,构建教学体系

教学的基本工具是教材,其也是学生获取知识的重要途径与来源,教师传授教学知识的主要依据,作为教学内容和教学要求的知识载体,贯穿整个教学过程[6]。在教学过程中根据不同授课专业,对教材应有针对性地选择。通过总结、归纳、整理,透彻分析课程内容的内在逻辑联系,形成适合专业特色的课程体系,从而满足实际需求。

试验统计方法课程内容包括试验设计和统计分析2个部分,为确保后续分析的科学性和可行性,试验设计要本着科学性、合理性的原则进行。目前,教学中存在的一个突出问题就是对试验设计重视不足,只注重分析方法、原理推导以及理论知识的应用。因此,应对课程内容进行合理编排,实行试验研究方法设计和统计分析方法并重。加大对试验设计的内容(田间、温室、实验室内的试验设计)、统计分析结果的专业解释和剖析反馈信息等内容的讲解。将试验研究实例贯穿于整个教学过程,以科学试验研究步骤和程序为主线,本着实际生产的要求,通过试验研究的选题和设计、试验方案的制定和实施、试验数据的收集整理到试验数据的统计分析,最后得到科学的结论等,由此提高学生的学习兴趣,对教学内容也更进一步地理解和掌握[5]。

在课堂教学实践中,应转变授课形式,突出技巧性,特别是试验基本原理、方法的讲授。由于该课程的理论、概念和公式较抽象,理解和记忆的难度较大,而在实际中又要灵活运用,因而强调应用案例教学,最好是应用教师科研工作中的实例,深入浅出,突出重点,将抽象的概念讲清、讲透[4]。如在讲授显著性测验、方差分析的基本原理时,要尽量避免只交代方法步骤,尽可能用通俗的语言讲明授课的重点,包括统计方法的背景、基本思路以及应用要点等方面内容,力图使学生能够接受和消化。

2 改革教学方法,创新教学形式,提高教学实效

试验统计方法课程的理论性相对较强,内容较抽象,单一的教学形式容易导致学生注意力涣散,产生视觉、听觉和思维疲劳,学习兴趣也逐渐降低[4,7]。因此,针对课程内容特点,应采用多元化教学形式,有效结合传统板书教学、多媒体辅助教学以及网络教学,由此吸引学生的注意力,提高课堂教学的效果[8]。

传统教学模式被称为“填鸭式”教学方法,表现在教师是主讲者,教学内容完全由教师设计,教学效果取决于教师的组织能力与语言表达能力;学生是被动的接受者,疲于应付作业和考试,“上课时抄笔记、考试前背笔记、考试后全忘记”的现象严重。因此,课程教学模式的教学效率难以提高,学生无法运用统计学的思维和方法分析和解决实际问题。

现代教学模式以培养学生独立获取知识和发现问题、解决问题的能力为目标,教师既是知识的传授者,也是教学活动的组织者。根据课程各章节内容及教学要求,应将新型教学与“讲授式”、“启发式”、“讨论式”等教学方法相结合,力求做到教学内容与方法的优化组合,提高教学效果。例如:对于基本方法部分,应结合各专业知识应用特点,通过精讲统计方法及典型实例,增加综合分析的内容,摘选一些农学研究中的实例或文献资料,进一步剖析、强调各种统计方法的适用条件、范围及注意事项,重点比较、联系各种统计方法;对于试验设计部分,以学生自学与课堂讨论为主,由教师拟定好自学提纲,组织学生进行讨论,引导学生提出问题,通过课堂讨论进而解决问题,最后由教师进行归纳和总结,从而培养学生总结、归纳和独立分析问题的能力[4]。

另外,在课程的讲授过程中采用案例教学法,让学生在课堂上接触各种实际问题,训练学生综合运用理论知识解决实际问题的能力[9]。结合实际应用事例,将抽象、枯燥的理论进行讲解,有利于学生加深对知识的理解和升华,起到举一反三、触类旁通的作用[5]。针对试验统计方法课程数据繁杂的特点,对于繁、难、抽象的内容,要充分学习和利用Excel、SPSS、DPS等软件工具,将学生从繁杂的计算中解放出来,还可以提高他们运用计算机运算的能力,由原来的“粉笔+黑板”方式向“粉笔+黑板+多媒体+实践”相结合的方式转化。

3 应用多媒体辅助教学,培养学生的思维意识和创新能力

随着科学技术的快速发展,大量多媒体技术和多媒体设备逐渐应用到课程教学中,多媒体计算机辅助教学(MCAI)已成为现代教育技术的重要手段,目前在国内外越来越广泛地应用于教学实践中。在传统的课堂教学中,教师以完成课程的教学要求为目标,只考虑将教学内容更快、更好地传递给学生,而很少考虑如何把课程的教学手段同培养学生的创新能力结合起来[4]。采用多媒体计算机辅助教学模式,可以不受时间、空间、微观、宏观的限制,通过生动形象的教学内容,可以达到传统教学方式不可比拟的效果,该方法可帮助学生进行对比、综合和归纳,培养学生的理解能力和创新能力,提高学生分析问题和解决问题的能力。

为全面提升学生的综合能力,在改革教学内容和方法的同时,应加强直观教学的效果,注意将现代化教学手段引入课堂,同时也应引入统计分析软件进行辅助教学。在充分利用大量统计数据的基础上,正确应用假设检验、相关与回归分析、参数估计等统计分析方法,采用统计图形、统计模型、统计表格等方式,研究物质变化特征,这也是教学过程中的难点。应用多媒体计算机辅助教学,使教学内容更加生动、直观、形象,增强学生理解和运用知识点的能力,提高课堂教学效率。

4 突出实践、实验,注重培养学生综合分析素养

试验统计方法课程的最终目的是使学生掌握试验设计和科学的统计分析方法,通过理论联系实际,从而熟练地应用其解决实际问题。一方面,要重视课堂理论知识教学,加强实践教学,使学生在认识实际问题、用理论知识解决实际问题的过程中,进一步加强理解、巩固知识,培养学生处理和解决问题的实践技能。例如:利用学生毕业实习的机会,指导学生针对具体课题进行试验设计、实施和统计分析,独立地完成试验课题的实施和毕业论文的撰写,提高学生的运用技能。

实验教学是理论与实践相结合的重要手段,是将知识转化为能力的媒介,有利于拓展和提高学生综合分析问题的能力。计算机的普及、统计软件的使用使计算变得快捷和准确,有利于使学生在讨论、分析、评价问题方面投入更多的注意力[7]。因此,应充分利用学校的电化教学设施,开设软件实验课,使学生熟练应用统计分析软件,掌握抽象的概念和基本理论,提高利用统计分析软件分析和解决问题的能力。

5 充分利用网络资源,提高教学质量

国际互联网的飞速发展,为开放式教学提供了一个更广阔、便利的学习和研究平台。因为课堂的学习时间有限,在讲解完基本理论知识、内容后,扩展讲解知识的时间很少。将优秀的试验统计方法CAI(computer aided instruions)课件放在WEB服务器上,可以实现教育资源的共享。学生可以在网上获取各种学习资料,浏览相关的统计网站,遇到问题时,还可以通过电子邮件来交流以弥补课堂教学的不足;教师也可以通过网络了解学生的学习情况,通过网上信息反馈修改教案,不断提高教学质量。

6 勤于交流,提高教学效果

课堂教学话动的两大主体是教师与学生,教师的目的是教,学生的目的是学,二者是互动的过程。必须注重并加强师生间的互动与交流,才能及时解决学生在学习中遇到的难题,从而向教师反馈教学中存在的不足并提出改进建议;教师也可以在交流中清楚地了解学生的知识层次、理解能力,从而可以因地制宜、因材施教地调整教学计划,优化课堂教学内容,提高教学效果,促进师生的共同进步与发展。为保证教学互动和师生间必要的交流,在教学过程中主要采用课间交流、作业批改与解析、无记名随堂问卷调查、便利的网络资源等形式[4,7]。

7 改革考核方式,培养综合运用能力

为适应目前教育体制中素质教育的要求,必须从根本上改革传统的考核方式。试验统计方法课程的实践性很强,因而应重点考核学生应用知识和综合分析问题的能力。对于理论知识部分,考核方式以闭卷考试为主;对于统计分析方法的应用,可以采取开卷考试的形式。也可以采用计算机考试与笔试相结合的形式,分析性题以计算机上考试为主,理论性题则以笔试为主[4,5]。开卷考试可以使学生从死记硬背概念和公式中解脱出来,这样既考查了学生解决实际问题的能力,又考查了应用计算机的能力,使学生综合运用知识的能力得到提高。

综上所述,试验统计方法不但理论性强,而且应用性较强,涉及了较多的内容、公式和抽象概念,相对其他专业课程,师生普遍反映难教、难学、难记[5]。因此,学习者需要具备一定的数学基础和较强的逻辑推理能力,只有在理解和掌握知识的基础上,才能实现知识的合理应用。同时,教师也要博览群书、钻研教学内容,提高业务水平,紧跟时代步伐,转变教学理念、钻研教学规律。探索适合该专业特点的教学内容体系、适合不同教学内容的多元化的教学手段和教学方法,注意多种教学方法相结合,提高教学效果[7]。

摘要:试验统计方法是生物学专业的专业基础课,具有较强的理论性和实践性。传统的教学只重视理论知识的传授,忽视了学生分析和解决问题能力的培养。结合多年的教学实践和试验统计方法教学的特点,提出在教学中应选择合适的教材和教学内容,采用多元化的教学方法以激发学生的学习兴趣,加深对课程内容的理解和掌握,同时应强化计算机辅助教学,以培养学生应用统计分析软件的能力。

关键词:试验统计方法,教学改革,教学实践,多媒体教学

参考文献

[1]黄治国,熊俐.《试验设计与统计分析》在生物类专业大学生科研素质培养中的作用[J].四川理工学院学报:社会科学版,2007(S1):128-129.

[2]李六林.提高《生物统计学》教学效果的探讨[J].山西农业大学学报:社会科学版,2009,8(1):94-97.

[3]李玉阁.“生物统计学”课程教学初探[J].生物学杂志,2006,23(5):52-53.

[4]朱香萍,李桢,张庭荣.信息时代《生物统计学》教学的探索与实践[J].农业网络信息,2008(2):81-83,87.

[5]王学敏.高校《生物统计学》课程教学改革的初步探讨[J].经济研究导刊,2010(9):233-234.

[6]惠明,田青.生物工程专业《试验设计与数据处理》的教学探讨[J].河南科技学院学报,2009,37(1):159-162.

[7]王玉,万海同,刘文洪.生物统计学课程教学改革初探[J].中国高等医学教育,2009(10):90,121.

[8]程郁听.《生物统计学》教学改革的几点思考[J].安徽科技学院学报,2009,23(3):32-34.

统计学习的过去、现在和将来 篇5

关键词:统计学习 试验 方法

中图分类号:C812文献标识码:A文章编号:1006-5954(2009)07-058-03

一、引言

统计的发展可以通过其所解决的问题展现:解决的问题不断从简单到复杂,从具体到抽象,这就要求其具有更强的计算能力,不断的从狭义到广义演变。传统统计主要来源于具体的实验,依赖于经典的参数估计方法,而现代统计学习理论是研究利用经验数据进行机器学习的一种一般理论,属于计算机科学、模式识别和应用统计学相交叉与结合的范畴。由于较系统地考虑了有限样本的情况,统计学习理论与传统统计学理论相比有更好的实用性。统计学习(Statistics learning)的起源是一系列著名的实验(如Turing Test等),随着信息技术的不断发展与信息量不断增大的进程,统计学习(Statistical Learning)理论也在逐步完善以适应新的需求。

现今的统计学习虽然已经有了重大的发展,但是若想把事情完全交给机器完成却不能得到理想结果,仍需要加入大量的人类智慧,例如:寻找事物特征、参数选取等等。不过类神经网络、SVM等技术的革新帮助解决了很多现实中复杂的问题,可以应用在诸多模式识别和回归估计问题中,并已经在很多实际问题中取得了很好的应用成果。随着统计学习发展,我们对统计有越来越高的期望,期望其可以发挥人类智慧的作用,计算能力再进一步提高,解决更加复杂的现实问题。

二、统计学习的过去和现在

Alan Turing于1950年提出了一个著名的实验——图灵测试(“Turing Test”):将一个具有智慧的机器和一个人类,放在一个布幕里面。人分别与机器和人类交谈,如果分不出哪一个是机器,哪一个是人类的话,那么机器就具有了人工智能。由此揭开了人工智能(Artificial Intellegence)研究的序幕。在研究中,AI被划分成Weak AI和Strong AI。Weak AI并不是功能较弱,而是指某个系统只要能表现出人类的智力就好,不管底层系统是否真的有人类的智力。Strong AI则是希望建构出来的系统即使不是用细胞做的,他的架构也却是和人类相当,真的具有人类智慧。Weak AI可以由机器学习(Machine Learning)来代表。只要给定问题的范围,训练的资料(training data),就可以由数据中选择特征(Feature selection),然后建构数据的模型(Model selection),最后把这个模型当成学习的成果,拿来做预测(Prediction)。

迄今为止,关于机器学习还没有一种被共同接受的理论框架,其实现方法大致可以分为三种 :第一种是经典的(参数)统计估计方法。包括模式识别、神经网络等在内;第二种方法是经验非线性方法,如人工神经网络(Artificial Neural Networks,ANN);第三种方法是统计学习理论( Statistical Learning Theory或 SLT)。

(一)经典的(参数)统计估计方法

经典的(参数)统计估计方法包括模式识别、神经网络等在内,现有机器学习方法共同的重要理论基础之一是统计学。参数方法正是基于传统统计学,在这种方法中,参数的相关形式是已知的,训练样本用来估计参数的值。

但是随着电脑解决问题的广泛应用,研究人员试图研究复杂问题时,发现了参数体系的缺点。

(1)大规模多变量问题导致了“维数灾难”现象的发生。研究人员观察到,增大可考虑因子的数量就需要成指数的增加计算量。因此,在含有几十个甚至是几百个变量的实际多维问题中定义一个相当小的函数集,也是一种不切实际的想法。

(2)透过实际数据分析,实际问题的统计成分并不能仅用经典的统计分布函数来描述。实际分布经常是有差别的,为了建构有效的算法,我们必须考虑这种差别。

(3)即使是最简单的密度估计问题,最大似然方法也不见得是最好的。

总之,这种方法有很大的局限性。首先,它需要已知样本分布形式,这需要花费很大代价,还有,传统统计学研究的是样本数目趋于无穷大时的渐近理论,现有学习方法也多是基于此假设。但在实际问题中,样本数往往是有限的,因此一些理论上很优秀的学习方法实际中表现却可能不尽如人意。

(二)经验非线性方法

经验非线性方法,如人工神经网络(ANN)。这种方法利用已知样本建立非线性模型,克服了传统参数估计方法的困难。但是,这种方法缺乏一种统一的数学理论。

以人工神经网络为例进行简单的介绍。人工神经网络(ANN),一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入——输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果,这种学习分析的过程被称为“训练”。人工神经网络具有非线性、非局限性、非常定性和非凸性的特点,它是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点。但是,由于在长期发展过程中,由于人工神经网络在理论上缺乏实质性进展,所以新的方法,统计学习理论开始受到越来越广泛的重视。

(三)统计学习理论

统计学习理论( Statistical Learning Theory或 SLT)是一种专门研究小样本情况下机器学习规律的理论,是传统统计学的重要发展和补充,为研究有限样本情况下机器学习的理论和方法提供了理论框架,其核心思想是通过控制学习机器的容量实现对推广能力的控制。该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。V.Vapnik等人从六、七十年代开始致力于统计学习理论方面的研究,到九十年代中期,随着其理论的不断发展和成熟,其受到了越来越广泛的重视。

在提到统计学习理论时不得不说的一个核心概念是VC维。它是描述函数集或学习机器的复杂性或者说是学习能力(Capacity of the machine)的一个重要指标,在此概念基础上发展出了一系列关于统计学习的一致性(Consistency)、收敛速度、推广性能(Generalization Performance)等的重要结论。

在统计学习理论基础上,一种新的通用学习方法应运而生,支持向量机(Support Vector Machine 或SVM)。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalization Ability)。支持向量机方法有以下的几个主要优点有:

(1)它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值。

(2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题。

(3)算法将实际问题通过非线性变换转换到高维的特征空间(Feature Space),在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关。

在SVM 方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数(Radial Basic Function 或RBF)方法、多层感知器网络等许多现有学习算法。目前,SVM算法在模式识别、回归估计、概率密度函数估计等方面都有应用。例如,在模式识别方面,对于手写数字识别、语音识别、人脸图像识别、文章分类等问题,SVM 算法在精度上已经超过传统的学习算法或与之不相上下。

由于 SVM方法较好的理论基础和它在一些领域的应用中表现出来的优秀的推广性能,近年来许多关于 SVM方法的研究,包括算法本身的改进和算法的实际应用,都陆续提出。尽管SVM算法的性能在许多实际问题的应用中得到了验证,但是该算法在计算上存在着一些问题,包括训练算法速度慢、算法复杂而难以实现以及检测阶段运算量大等等。

传统的利用标准二次型优化技术解决对偶问题的方法可能是训练算法慢的主要原因。首先,SVM方法需要计算和存储核函数矩阵,当样本点数目较大时,需要很大的内存,例如,当样本点数目超过 4000时,存储核函数矩阵需要多达128兆内存;其次,SVM在二次型寻优过程中要进行大量的矩阵运算,多数情况下,寻优算法是占用算法时间的主要部分。

SVM方法的训练运算速度是限制它的应用的主要方面,近年来人们针对方法本身的特点提出了许多算法来解决对偶寻优问题。大多数算法的一个共同的思想就是循环反复运算:将原问题分解成为若干子问题,按照某种反复运算策略,通过反复求解子问题,最终使结果收敛到原问题的最优解。根据子问题的划分和反复运算策略的不同,又可以大致分为两类。

第一类是所谓的“块算法”(Chunking algorithm)。“块算法”基于这样一个事实,即去掉 Lagrange乘子等于零的训练样本不会影响原问题的解。对于给定的训练样本集,如果其中的支持向量是已知的,寻优算法就可以排除非支持向量,只需对支持向量计算权值(即 Lagrange乘子)即可。

当支持向量的数目远远小于训练样本数目时,“块算法”显然能够大大提高运算速度。然而,如果支持向量的数目本身就比较多,随着算法反复运算次数的增多,工作样本集也会越来越大,算法依旧会变得十分复杂。因此第二类方法把问题分解成为固定样本数的子问题:工作样本集的大小固定在算法速度可以容忍的限度内,反复运算过程中只是将剩余样本中部分“情况最糟的样本”与工作样本集中的样本进行等量交换,即使支持向量的个数超过工作样本集的大小,也不改变工作样本集的规模,而只对支持向量中的一部分进行优化。

毫无疑问,固定工作样本集的算法解决了占用内存的问题,而且限制了子问题规模的无限增大;但是,从这个意义上来说,固定工作样本集的算法把解标准二次型的寻优问题的时间转嫁到循环反复运算上了,它的反复运算次数一般会比“块算法”多。尤其是 SMO,如果没有一个好的启发式反复运算策略,该算法就是一种盲目爬山法。

基于此,我们提出一种算法思想,希望能够综合两类算法的特点。我们仍旧从最终目标中抽取子问题,借用某种反复运算策略使算法收敛。关键的,我们希望一方面子问题规模不会太小,以免反复运算次数太多,另一方面能借鉴 SMO的思想,利用二次问题的特点,找到子问题的解析解法,或者是近似解,从而不必对每一个子问题都调用寻优算法。

此外,由于 SVM方法的性能与实现的上的巨大差异,我们在求解子问题时不一定要得到精确解(解的精确度可以由反复运算来保证),甚至还可以考虑对最终目标求取近似解。这样,尽管结果的性能会受到影响,但是如果能够大幅度提高运算速度,它仍不失为一种好方法。

三、统计学习的将来

统计学习在现当代社会已经有了飞速发展,但其还不能完全满足人类的需求。在其进一步的发展过程中,仍需要在机器学习问题、语言意识的学习、人机界面等方面进行改进。在完成一项任务时,人类总是希望机器能够自主独立的完成,自己介入的越少越好。这就需要加强机器的文字意识,而不是将所有的信息转化成数字之后机器才能识别。如果人类比较高层次的认知活动,如语言产生意义、寻找类似物品和抽象化的能力,其背后的神经机制若能够被发现,那么我们也可以了解大脑思想的表达方式,人脑和计算机之间可以互相转换数据,这时候人脑的能力和计算机的计算能力,就可以互补,让我们计算帕斯卡尔三角形速度更快而没有负担。计算机也可以运用人类抽象化的能力,更正确地寻找“类似”的东西,并且是以更快的速度达成抽象化才能解决的问题。

四、结语

传统的统计学习为统计学习的发展提供了坚实的理论基础,现代统计理论无论是在假设还是方法上都有了很大的突破和进展。在科学技术飞速发展的今天,统计学习理论广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。相信,统计学习必将会应用于越来越广泛的领域,解决迫在眉睫的问题,提供更大的便利。

■ 名词解释

[1] 人工神经网络

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,主要依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。

[2] 支持向量机

支持向量机是数据挖掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域。

[3] 特征空间

特征空间是相同特征值的特征向量的集合。

[4] 径向基函数网络

径向基函数网络是一种向前反馈网络,可以处理不规则分布的高维数据。

[5]多层感知器网络

多层感知器网络是具有多个中间层的网络系统。

■ 参考文献

[1] Berry Michael J. A., Linoff Gordon S. “Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management” John Wiley & Sons, Inc., 1997

[2] Guape, F.H.; Owrang, M.M. “Database Mining Discovering New Knowledge and Cooperative Advantage” Information Systems Management, 1995,12, pp.26-31

[3] Usama Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, “The KDD Process for Extracting Useful Knowledge from Volumes of Data” Communications of the ACM, 1996, Vol 39., No.11, pp.27-34

[4] Chung, H. Michael; Gray, Paul; Guest Editors “Special Section: Data Mining” Journal of Management Information Systems, 1999, Vol. 16, pp.11-16

统计学习方法 篇6

一、非统计专业学生对统计学的误解

1.对学习难度认识的两极化。在非统计专业的统计学教学中, 有一种很奇怪的现象, 部分同学认为统计学比较简单, 而部分同学认为统计学很难。情况往往是这样, 女生认为统计学简单, 她们只注重统计学的计算层面上, 没有认识到统计方法的本质;而男生则认为统计学较难, 性别差异很明显。而这些简单的认识, 往往都是对统计学的片面了解造成的, 并没有把握到统计学学习的本质。

2.缺乏学习的主动性。对于非统计专业的学生, 统计学课程和他们的专业课程 (尤其是文科性质的专业) 相差较大, 部分学生觉得统计学很难, 看到统计学的符号和公式就头大, 故对统计学的学习兴趣较小, 缺乏主动性。还有一部分非统计专业的学生, 觉得统计学无非是利用一些软件算出一些数值, 非常简单, 现用现学或者临阵磨枪即可, 无须去下较大的功夫, 致使学习的主动性较差。

3.陌生感与距离感。对于非统计专业的学生, 尤其是没有学过高等数学和概率论专业的学生, 看到统计学的一些符号、公式有着一种与生俱来的陌生感, 于是会对统计学的学习产生一些本能的排斥。其实, 统计学只需要有中学的数学基础就可以学习很多的统计思想和统计方法。统计学既是一门科学也是一门艺术, 统计思想对统计学的理解和学习非常重要, 而这往往会使初学者产生一种距离感, 导致了一些消极的学习态度。

4.对统计学的价值缺乏认同。部分非统计专业的学生对统计学的学习价值缺乏认同, 尚未了解统计学的意义和作用。部分学生认为自己距离处理数据比较遥远, 对于统计方法的实用性也缺乏认识, 学习统计学仅限于完成上课任务并且通过考试而已。造成这种误解的原因很多, 既有学生自身的问题, 也有社会环境的问题, 或者是相关专业的其他教学中对统计学的涉及不足, 也可能是教师或者教材存在的问题。

二、统计学在非统计专业教学中可能存在的问题

教学是教师的“教”与学生的“学”两个过程的有机结合, 教学效果的好坏既取决于学生的学习过程, 更取决于教师的教授过程。恰当的教学方式和方法能够有效地激发学生的学习兴趣和主观能动性, 从而使得教学活动收到很好的教学效果。作为教学活动的组织者, 教师在不断增强自身知识体系的接触上, 应该在教学活动的组织方式和方法上多下功夫, 而这点也是非统计专业的统计学教学过程中至关重要的。目前, 非统计专业的统计学教学过程中存在一些问题, 主要体现在以下几个方面:

1.教学内容过于“程式化”。统计学与数学是有一定区别的, 对于统计学的教学, 每一种统计方法都包含着一定的统计思想, 其提出具有实际的应用背景。在教学实践中, 部分教师过分强调统计方法的实施步骤, 而忽视了统计思想的自然性及其传授, 导致其学生对统计方法的认识过于机械化、程式化, 往往对于数据能够熟练地计算其结果, 而对于结果的解释及其应用条件的判断却束手无策。例如, 很多教师在讲方差时, 往往着重于方差的计算, 而忽略了对其定义的理解和认识, 而这往往会导致学生认为统计就是一些数字的误解。

2.与具体专业的结合不够。统计学无所不在, 只要有数据的地方就有统计方法的应用。而统计学真正的意义在于解决实际问题。在非统计专业的统计学教学实际中, 尽管要教授统计学的基本理论和方法, 但是案例教学是必不可少的。教学中的实际例子除了要有代表性还要和具体的专业紧密结合。而部分教师由于对相关专业的应用情况了解不足, 教学过程中的例子往往和相关专业结合不够, 这样会使学生对统计学产生一定的距离感, 不利于学习兴趣的激发。

3.多媒体在统计学教学中的使用问题。传统的教学手段主要是板书。板书是教师的基本技能, 也是最重要的一种教学手段。对于统计学教学而言, 板书教学不利于展示统计方法对于具体数据的实现。随着现代化教学手段的进步, 在统计学的教学实践中, 多媒体教学逐渐占据了重要的地位。多媒体教学的优点是图文并茂, 有利于展示统计方法在统计软件中的实现, 在学生掌握统计理论基础的同时提高了他们的动手能力。在统计学教学过程中, 不应忽视多媒体教学的最要重要。但是多媒体容易使教学速度加快, 不便于学生的理解和吸收。因此, 在统计学教学中, 过分使用多媒体或者基本绝缘于多媒体都存在一定的问题, 要结合所教授的内容, 恰当把多媒体教学引入到传统教学当中, 会获得更好的教学效果。

4.考核方式略显单一。在非统计专业中, 统计学多为考试课。考试形式多采用闭卷考试, 试题类型常包括单项选择、多项选择、判断、简答和计算, 缺乏对统计方法应用能力的考核。在这样的考核方式下, 往往使得临阵磨枪型的学生考试成绩也不错, 使学生对统计学的学习和认识产生误解。而这种考核方式, 对学生的思想也有一定的束缚, 很难培养学生用统计学方法解决实际问题的认知。因此, 教师需要对统计学的考核方式多做些思考, 在考核学生理论水平的同时, 注重培养学生用统计学方法解决实际问题的能力。

三、统计学在非统计专业中教学方法的几点建议

1.注重统计思想的传承。统计学不是一门孤立的学科, 它是人们客观认识自然界和人类社会中各类随机现象的经验总结。任何一种统计方法的产生并不是凭空的, 总是有它的实际应用背景和启发的问题, 可以说统计方法是实际中使用方法的一种理论提升。因此, 在统计学的教学过程中, 要注重统计思想的传承, 培养学生的统计思维和解决实际问题的应变能力, 这样不仅有利于增强学生学习统计学的积极性, 也是创新思维形成的一个前提。

2.注重统计方法的实际应用。统计学来源于实践, 也必定扎根于解决实际问题。实际问题, 往往不是经典统计方法的一个简单应用, 这要求把实际问题首先提炼成统计学的问题, 这就要求统计学教师不仅要不断拓宽专业知识, 还要多多接触非统计专业领域的问题, 善于交流与合作, 这样统计学才有生存和发展的空间。在教学的过程中, 有意识地应用具体专业的实例来传授统计学的方法, 这样容易使学生产生共鸣, 深刻体会统计学在本学科中的应用价值。比如, 在讲授回归方法的时候, 首先把数据的散点图呈现给学生们, 然后让学生们分组讨论, 从直观的想法出发, 如何对一个新的个体进行预测。这样在学习统计方法的同时, 也让学生了解统计方法如何应用。

3.多媒体和板书有机结合。在统计学教学过程中, 板书和多媒体要有机地结合起来, 用板书来传授理论知识, 用多媒体生动地来解释实例和演示统计软件。这样, 两种教学手段充分利用, 相互补充, 才会达到更好的教学效果。比如, 在讲解Logistic回归模型时, 首先应用板书来讲授Logistic模型的模型框架及其建模方法。其次, 对于不同的问题, 哪些适用于Logistic模型。对于不同的统计软件, 如何实现Logistic回归, 这需要用多媒体来演示统计软件的Logistic回归流程。最后对于软件的输出结果, 如何解释。这样的多媒体和板书结合的教学方式, 对于统计方法的教学过程是十分必要和有效的。

4.培养学生用统计方法解决实际问题的能力。统计学教师的教学不仅限于课堂, 还应该组织学生进行多种实践活动, 这样才能更好地调动学生学习的积极性, 培养学习解决实际问题的能力。例如, 在学习聚类分析时, 让学生们3人一组, 对已有的考试成绩进行聚类分析, 首先面临的问题是数据的处理, 对优良中差这类分级的成绩如何赋分, 然后选择合适的聚类方法, 对得出的结果如何进行解释。这个过程中, 小组成员需通过上网或者图书馆查阅相关文献, 用计算机模拟不同的方法, 最后把研究成果用文字报告或者PPT呈现。这样, 原本看似枯燥的方法在实际问题中会变得既有意义又生动, 留给学生们很大的空间去选择和应用统计学方法, 结论也不一定是唯一的, 更有利于调动学生的主观能动性, 培养学生用统计方法解决实际问题的能力。

统计学是实用性极强的一门学科, 在非统计专业的数据处理中统计学将起到不可替代的作用。随着大数据时代的到来, 高维、海量及复杂数据的出现, 统计学与各领域的结合更加密切。对于非统计专业的学生而言, 掌握统计学的基本理论知识, 了解统计学在所学领域的应用, 这对非统计专业学生能力的提高将会起到重要的作用。

摘要:目前, 我国很多高校的非统计专业都相继开设了统计学课程。在非统计专业的统计学教学中, 学生往往对统计学学习难度的认识两极化, 缺乏学习的主动性, 对统计学有陌生感和距离感, 对学习统计学的价值缺乏认同。非统计专业统计学教学应注重统计思想的传承, 注重统计方法的实际应用性, 多媒体和板书有机结合, 培养学生用统计方法解决实际问题的能力。

关键词:统计学,非统计专业,教学方法

参考文献

[1]白日荣, 苏永明.非统计专业统计学教学的改革与创新[J].统计教育, 2007, (12) .

[2]邓海松.关于非统计专业统计学教学的一些见解[J].中国科教创新导刊, 2013, (17) .

[3]闵素芹, 柳会珍.浅析统计学专业创新与实践教学改革[J].统计与咨询, 2010, (6) .

[4]刘芳, 高轶俊.现代教育技术学[M].中国人民大学出版社, 2012, (9) .

统计预测方法实证比较研究 篇7

通过Excel软件, 可以实现多种统计预测方法。本文以1990~2009 年美国加利福尼亚失业率的统计数据为例, 根据其数据特征建立模型, 利用Excel工具对一次移动平均法、一次指数平滑法、时间序列预测法和温特线性与季节性指数平滑法等这四种方法的有效性和适用性进行比较研究。

二、实证分析

笔者收集的数据为1990 年1 月到2009 年9 月的每一年每一季度的平均失业率。时间跨度为20 年, 缺少2009 年第四季度的数据, 一共有79 个。由于失业率是周期性变动的, 因此首先选用时间序列分解法进行预测分析, 分析过程如下:

(一) 季节指数S的计算。季节指数的计算是先用移动平均法剔除长期趋势和周期变动, 然后再按月 (季) 平均法求出季节指数。由于一年有四个季度, 因此移动平均项数要取4, 需做两次移动, 移动平均结果见表1 的第 (5) 栏, 其中第 (5) 栏的第一个数据0.061 是经过以上两次移动平均求得的。 (表1)

将Y除以TC, 即得到了只含周期因素和不规则变动因素的序列SI, 见表1 的第 (6) 栏。将序列SI重新排列, 得表2。根据表2, 采用按季平均法, 即可求出各年的同季平均数, 由于各个季度的平均数之和为399.2132, 不等于400, 因此需要做出修正, 其修正系数为400/399.2132=1.001971。经过修正后, 即得该地区失业率的季节指数, 如表2 的最后一行所示。季节指数一般用百分比表示, 在本例中, 第一季度的季节指数为106.3091%。 (表2)

(二) 长期趋势T的计算。以时间t为自变量, 以失业率Y为因变量, 可求得如下回归方程:

T=0.0763-0.0002t

根据长期趋势方程, 即可求得各个季度的长期预测值, 如2009 年第一季度t=77, 其长期趋势为T=0.0763-0.0002×77=0.061。余下类推, 即可求得长期趋势因素T序列, 如表1 中的第 (7) 栏所示。

(三) 周期变动因素C的计算。将序列TC除以T, 即可得到周期变动因素C, 如表1中的第 (8) 栏所示。

(四) 预测未来的失业率。在进行预测时, 一般无法预测不规则变动因素I, 因此时间序列分解法的预测模型可以表达为:

在本例中, 如果预测2009 年第四季度的失业率, 则可按以下步骤进行:首先求出2009 年第四季度的长期趋势T, 这可以根据长期趋势方程求得。由于2009 年第四季度的t=80, 因此2009 年第四季度的长期趋势T为:

T=0.0763-0.0002×80=0.060922

2009 年第四季度的季节指数为0.9618, 但2009 年第四季度的周期变动C却需要用判断的方法来估计。根据表1 的周期变动C和失业率Y的历史资料, 笔者估计2009 年第四季度的周期变动C为1.2, 这样可以求得2009 年第四季度的失业率的预测值为:

Y^80=T80×S80×C80=0.060922×0.9618×1.2=0.070316

(五) 模型评价。由于b0, b1是通过一元线性回归计算出来的, 因此需对其进行检验。以失业率为y, 以长期趋势为Y^, 通过可决系数 (R2) 的公式, 可求得:

可以看出, 时间序列分解法求得的可决系数过低, 所以此方法不太可靠。

三、总结

经分析, 时间序列分解法的可决系数过低, 仅为0.107877, 不适宜做预测。由于本例没有明显的直线上升或下降趋势, 本文又运用了一次移动平均法、一次指数平滑法和温特线性与季节性指数平滑法进行预测。通过对每一种模型的分析比较, 可以看出使用温特线性与季节性指数平滑法, 得出的标准误差最小, 为0.000015, 且可决系数最小, 为0.9512577, 结合《失业率统计预测的实证研究》一文的研究成果, 如表3 所示。 (表3)

根据表3, 可以得出结论:使用温特线性与季节性指数平滑法进行预测较为准确, 预计2009 年第四季度加利福尼亚的失业率为13.04%。

摘要:通过Excel软件, 可以实现多种统计预测方法。本文以美国加州失业率为例, 利用几种常用的统计预测方法, 根据其数据特征建立模型, 比较其用于预测失业率的有效性和适用性。

关键词:统计预测,时间序列预测法,移动平均,指数平均

参考文献

[1]王立.失业率统计预测的实证研究.合作经济与科技, 2014.12.

[2]王维鸿, 张国平.EXCEL在统计中的应用.北京:机械工业出版社, 2004.

统计学习方法 篇8

1随机—模糊处理的具体方法

设地质岩组力学指标的样本值为a1, a2, a3, …, an, 利用随机—模糊处理方法计算样本方差与均值, 具体计算如下所示:

样本均值 () 计算方法。设论域为M, 则M={a1, a2, a3, …, an} , M内含有模糊子集, 设其为Q, M中的元素设为ai, 其中i的取值范围为1, 2, 3, …, n。Q隶属度是MQ ( ai) , 求Q核的公式如下所示:

如果式中的x珋可以用= f ( a1) 表示, 则x珋= f ( a1) 便是地质岩组在次力学指标下的统计特征。基于上述问题所具备的性质, 例数函数具体表达式如下所示:

其中Di1代表的是ai与Q核电之间的马氏距离, 表达式如下:

其中Ri所表示的是权重, 通常情况下, 多以常数表示, 具体公式如下:

通过上式可知, ai与Q核点之间的Di1越小, 其隶属Q的范围越大, 核点隶属度的值最大不能超过1, 基于实际样本值在Q的隶属度为最大的要求标准, 可以计算x珋的统计特征, 具体目标函数如下所示:

将R01设为常数, 并将其代入上式, 可得以下公式:

参考相关实验数据可知, P01的取值会在一定程度上影响最终计算结果。其取值形式可以通过以下公式进行计算:

不过, 这些公式实在假设R01为常数推演出来的, 其不会随着的变化而变化, 因此, 在应用迭代计算方式计算时, 应保证R01值具有稳定性, 这样便会在很大程度上提升R01取值的难度系数, 要想对此问题进行合理有效的解决, 在计算过程中, 可以择取两步迭算法。

首先, 计算D1 i= ( ai- aR) 2, aR值取随机获取的平均值, 通过计算可得R01, 将其代入上述计算公式, 通过迭代计算法, 计算, 在计算过程中, 不更改aR值, 直至所求符合相关要求。其次, 改变aR值, 重复进行上一步的计算流程, 获取一个全新且符合相关要求的。最后, 对上一步计算方法进行重复执行, 当所得与aR值之间不存在明显差异后, 最终所得即为地质岩土样本的均值。

2模糊方差

设随机变量为Y, 模糊事件为U, 则U上Y的模糊方差可以用以下公式进行表述:

择取第一部分处理均值的方式处理方差, 可以有效提高其准确性。具体计算公式为:

进而便可获取计算该岩土样本模糊方差的公式:

该公式的形式表现为隐函数, 因此, 在求解过程中, 与均值一致, 需要应用迭代计算法。

3标准值、修正系数、变异系数以及标准差计算

通过前两部分的计算, 可以获取岩石样本的均值与方差, 要想计算岩石的标准值、修正系数、变异系数以及标准差, 则需要按照以下方式进行计算。要想求取岩石样本的标准差, 只需要对求取方差的公式进行开平方处理即可。变异系数的表达式为:

关于修正系数的计算方式, 很多规范上均有记录, 不过, 受到人们普遍应用的, 则是以下公式:

标准值的计算公式如下:

其中, fm表示的是岩土样本的参数平均值, 即x珋。应用Fortran75版本的程序计算随机模糊均值、标准值、修正系数、变异系数、方差以及标准差。

4实际应用案例

以我国某工厂的岩石为例, 共采集了四种样本, 设为样本1, 样本2, 样本3, 样本4。其中样本1的取样区域具有裂隙不发育、层内错动性小以及岩体新鲜完整的特点; 样本2的取样区域为岩层内错动带, 裂缝发育程度较大, 每10厘米存有3条左右的裂缝, 但其厚度较小, 最大值不超过9厘米, 主要组分有岩屑、角砾以及压碎岩, 压实性较强。不存在地下水; 样本3的取样区域具有结构呈现镶嵌状、短小裂隙发育程度较大以及层内错动性较强的特点; 样本4取样区域具有层间错动性小、裂隙不发育、断层切割不明显以及岩体新鲜完整的特点。

岩石样本1中, 只有一组不存在裂隙现象, 其他样本中的裂隙存在方向、角度上的差异, 不过裂隙角度最大值不超过45°。第二组与第三组所存在的裂隙不会对岩石强度造成较大的影响, 不过, 第四组具有的裂隙, 会给岩石的强度带来一定程度的不良影响, 降低岩石的软化系数。样本2中, 有两组岩石呈现为灰色, 其余均为紫红色。各组岩石内部含有一定量的杏仁, 但并不呈均匀分布状。样本3中, 在加载方向方面, 与两组岩石与岩层相平行, 其余组的则是与岩层方面相垂直。不过这并不会影响样本的力学参数。样本3中, 四组岩石之所以存在强度方面的差异, 主要取决于其裂隙程度。四组岩石裂隙虽然方向、大小不一, 但均具有高角度特征, 其中1、2组的样本岩石裂隙角度最大值约为70°, 在很大程度上降低了岩石的强度。样本4中只含有少量的斑晶, 属于隐晶质, 裂隙多被矿物填补, 难以有效辨认。

5结论

综上所述, 利用随机—模糊统计方法计算岩土特征参数, 不仅可以有效减少计算量, 还能提高计算结果与实际的贴合度, 值得大力推广。

摘要:在岩土工程中, 人们普遍应用统计方法计算岩土的物理力学参数。统计学方法在对离散岩土的实验数据进行处理时, 将与中值差异性较大的数据称之为孤值, 并认为其代表性较差, 对其忽略不计, 取剩余数据平均值为岩土特征值。应用这种方法处理数据结果, 剔除孤值会导致结果存在人为偏差现象, 不剔除孤值又会导致结果出现系统误差。基于此类问题的干扰, 相关学者逐渐应用数学理论分析岩土特征, 随机模糊统计方法应运而生。

关键词:随机—模糊统计方法,岩土特征,参数指标,统计应用

参考文献

[1]雍睿, 唐辉明, 胡新丽, 等.结构面抗剪强度参数线性拟合方法适用性研究[J].岩土力学, 2012 (S2) .

[2]马建, 孙守增, 杨琦, 等.中国桥梁工程学术研究综述·2014[J].中国公路学报, 2014 (5) .

[3]杨勇, 姜桂春, 文君, 等.岩土参数统计方法及简化计算式的探讨和应用[J].煤田地质与勘探, 2013 (2) .

统计学习方法 篇9

一、企业财务分析中统计相对数的含义和作用意义

1、企业财务分析中统计相对数的含义

相对数是指两个具有联系的指标的比值, 它含有的种类较多, 一般是指在数量上来反映两个相互联系的现象间的对比关系。分为有名数和无名数两类, 在不同情况下可采用不同种类的相对数进行合理化统计分析。

2、企业财务分析中统计相对数的作用

企业中财务分析的统计方法是通过对财务信息的有效的整理和处理, 对企业财务进行相关质量分析。采用数学与物理结合的统计学推断原理, 用样本数据推断整体的过程。通过相关的检验、测试对企业中的财务情况进行特定的分析, 建立起财务相关的数理模型, 通过这个模型对企业中的财务的过程进行监督和控制。在此基础上, 对企业中财务分析的问题进行合理化分析, 制定相关制度改善问题。在企业中, 统计方法是非常适用的, 帮助企业决策一些事件的工具以及数据分析, 对财务情况进行整理和总结。因此, 统计方法在市场预测、可行性分析、方案设计、批量生产等相关工作中都会有所应用。通过统计方法为企业获取良好的经济效益。

3、企业财务分析中统计相对数的意义

通过上文可知相对数是一个比值, 这个比值可以反映两个现象出现的问题之间的联系。由于现在企业财务中所采用的统计方法较多, 而相对数可以直接反映出财务关系, 并且方便、高效、清晰、方便企业财务进行合理化的分析, 因此, 相对数在企业财务统计中具有重大意义。

二、企业财务分析中统计方法的应用领域

1、统计方法在企业财务会计领域的应用

在目前的企业中, 统计方法的应用领域很广, 例如, 在证券公司中, 因为它的内部存在大量的有关数据信息, 因此成为统计数据的来源, 在研究其数据信息时普遍是指证劵公司与会计信息之间的比值, 通过这个比例来探讨两者之间的关系, 最后, 得出结论二者是相互联系的, 会计信息的引起证券价格的变化, 通过这个变化, 从而改变证券公司的经营策略。所以, 可见统计方法在企业财务会计领域中具有重大的应用。

2、统计方法在企业财务管理会计领域的应用

企业内部中, 大家最关心的问题就是财政管理的问题了, 它起到了企业的决策性作用, 正因为财政的关系, 企业将会有大或小的发展。这时, 统计方法就起到了不可替代的作用。首先, 经过统计方法将财务进行合理化分析, 建立起财务与企业规模之间的关系。之后, 企业领导者能够迅速掌握企业实力的信息, 以及企业收益情况。因此, 统计方法在企业财务管理会计领域中具有重大应用。

三、企业财务分析应用的主要统计相对数

1、强度相对数

企业中的财务管理中, 针对强度相对数的应用性比较强, 这是代表着企业的财务经济状况与其他的经济进行对比比较, 从而保证财务的稳定的运行, 也方便出现问题时, 通过这个比率进行特定化的分析。

2、动态相对数

在企业经济中, 针对不同时间的现象与成本经济相比即为动态相对数, 此数据能够体现企业发展的变化的相对发展程度, 在进行财务经济管理的时候, 进行动态相对数的合理化分析, 对每一个数据进行合理分析, 从而判断企业的发展动向。

3、结构相对数

统计常运用指标进行客观事物的体现, 在统计中起到的作用, 结构相对数在和另外指标的联系上得到反映。对于结构相对数, 其为总体整体指标和总体内的部分指标实施合理对比得出的结果。常运用此指标, 进行总体结构合理性的考核。比如:一个企业总资产即为总体, 此总体的两个单位其中之一即为负债总额, 所有者权益即为另一个总体单位。

4、比例相对数

将一个总体内部各种组成部分实施数量对比出现的相对指标比例即为相对指标, 常运用此指标进行总体组成部分具有协调性的考核。一个企业发展是不是具有协调、平稳, 财务指标能够对有关信息作出显示, 能够凭借财务指标信息进行企业财务结构的合理调整。比如:某个企业规模发生迅速萎缩、扩张, 一般地债务比重会出现降低、升高。因此, 能够将企业的所有者权益总量和负债总量实施合理对比, 根据两者比例关系的改变与大小, 进行企业发展是不是达到平衡的观察, 进而战略对是否要进行企业财务战略调整作出决定。常运用此比率, 进行财务风险及企业收益水平的判断。

四、企业财务分析应用的统计方法

进行企业财务分析, 经常运用趋势分析法、比率分析法以及比较分析法这些统计方法。

1、趋势分析法

趋势分析法又称比较分析法和水平分析法, 通过财务账本中的相关资料, 将特定周期和其他连续周期的比例经过对比, 来总结财务中存在的问题, 从而了解财务中资金的增减趋势, 方向和规律, 以此方法来总结企业中的财务经济状况和经营成果, 为公司的未来发展提供帮助。它属于一种动态分析, 在以差额分析法和比率分析法为基础, 同时又能有效地弥补其不足。这种方法包括两种运用形式:其一为运用百分比进行比较分析;其二为利用项目金额进行比较分析。

2、比率分析法

比率分析法是在相同一期的财务报表的基础上对不同财务数据进行数据比较, 针对不同财务与企业问题进行比值问题的探讨, 用比值合理化分析公司企业经济问题和目前状况的发展情况进行分析, 这种方法是一种最基本的财务分析方法, 由于针对不同的财务分析, 对不同的法人代表、管理当局、政府等机构所采用的方式也不相同。针对分析的目的及要求的不同, 常把比率分析法划成三种。

(1) 相关比率分析法。一个项目与不同与它然而存在联系的项目实施对比, 得出的比率即为相关比率。运用此比率指标, 能进行存在关系的业务安排是否合理的考察, 确保顺利地进行企业运营活动。

相关比率分析是根据企业经济活动与经济相互联系的分析, 通过将这两个不同的事物进行分析, 得到比值, 与企业所给出的指标进行比对, 从而在比值看出企业生产经营的状况。通过相关比率分析法, 清晰看出企业发展状况, 从中发现生产中出现的问题之后, 进行合理化解决。

(2) 构成比率分析法。构成比率分析法又叫做比重分析法或者对比分析法。通过经济活动与企业经济进行对比, 构成相关比率, 从中考察该企业的经济总量和成本的预算, 以及探讨在经济总量的比重关系, 体现出部分与整体的存在关系, 在运用这种比率分析方法, 能探究部分与整体之间的关系, 以便协调企业的财务活动。

(3) 效率比率分析法。一个企业的的经济活动所运用的金钱以及企业钱数之间的比率, 其主要体现在财政输出与输入的关系比值。针对这种比率探讨部分财政与整体财政的比值情况, 总结企业的经济状况。例如:利润项目以及资本、销售成本与收入等实施比较, 资本、销售以及成本利润率均能得出, 基于不同视角, 比较企业的获利多少、增减状况。

3、比较分析法

比较分析法即为运用比较以及对比的方式实施分析, 进行具体操作时, 具体有三种比较形式。

(1) 计划指标与实际指标实施对比。对于计划指标, 其为财务管理的实际指标, 基于对财务指标产生影响的有关客观因素, 在对其分析的前提下, 该指标得以制定。将计划指标和实际指标实施对比后, 能够体现企业计划完成状况、程度。

(2) 同一指标实施纵向比较。在企业方式中常常进行统一指标的不同方式比较, 按照惯例, 将历史的预期指标与实际预期指标进行对比。这种方式的合理运作, 将企业中财务经济进行对比性比较, 以此看出企业的营业额以及获得的利益相比较。从另一方面, 可以看出财务中出现的新问题, 方便企业改善问题, 从而加大企业经济。

(3) 同一指标实施横向对比。此方式将同一指标处于各种条件下实施对比, 通常将此企业指标与同种类及同行业实施比较, 其对此企业与同行业间存在差距的揭示是有利的。

五、统计方法中应该注意的几个问题

1、统计方法的结合运用

在企业财务分析中, 针对不同的财务情况需要应用不同的统计方法, 每一种统计方法都有属于自己作用领域, 因此, 采用不同的统计方法将更好的体现出该企业中的财务情况, 用统计方法将企业不同财务问题相结合进行研究, 以便企业更好的发展。

2、注意定量与定性的分析

每一种统计方法都有它的优越性与局限性, 因此, 我们在进行企业财务分析中, 要采用恰当的统计方法。针对具有局限性的统计方法, 我们首先要做好充分的准备, 在运用的过程中出现的问题加以克服。只要良好的运用, 加强对每一种统计方法的定量与定性分析, 针对局限性加以处理, 良好的将统计方法结合, 就能针对企业中财务问题进行合理化分析, 以此加快企业经济化脚步。

总结:目前, 各大企业逐渐进入经济化阶段, 因此, 对于经济化的企业, 统计方法是必不可缺的一项。将统计学方法合理的运用到各个领域中去, 对统计相对数的方法对企业经济进行合理化分析, 从中可以发现企业中存在的相关问题, 以及未来经济发展趋向。从企业的历史经济出发, 探讨到现今企业经济问题中出现的状况, 针对相对比率进行分析。通过这些数据, 企业能够有效将这些数据加入到公司的一些日常工作和决策工作中去, 对企业进行有效控制与考核。从而加强企业发展, 得到进一步企业扩大化。

参考文献

[1]徐芬, 徐武明.对统计指标教学中几个问题的探讨.安庆师范学院学报 (自然科学版) .2008 (2) .

[2]李鸥.揭示奥秘之数——结构相对数.中国统计.2007 (3) .

统计学习方法 篇10

(2)用样本估计总体:了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.

(3)变量的相关性:会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.

(4)统计案例:了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立性检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;②回归分析:了解回归的基本思想、方法及其简单应用.

(1)理解用样本估计总体的思想. 用样本估计总体,是研究统计问题的基本思想方法.

(2)对统计知识的考查,重点涉及分层抽样、频率分布直方图、样本估计总体、样本数据的数字特征(平均数、方差等)等几个知识点. 虽然这类题的难度不大,但有些细节必须关注,如频率分布直方图中小矩形的面积和为1,频率分布表中的频率和为1等.

概率统计教学方法的改革 篇11

以往的灌输式教学, 不能调动学生学习的积极性, 老师和学生都很累, 但教学效果不太理想.在此可以尝试着探索一种新的教学方法, 将教师“教”的主导作用与学生“学”的主动性相结合, 使教师成为学习的导演, 学生成为学习的演员, 最大限度地挖掘潜在能力, 提高教学效果.

1.采用导学与精讲相结合

精讲是少而精, 突出重点, 详略得当, 使教学时间合理分配.“导学”是指导在前, 讲解一些关键性的问题, 然后以学生自学为主.教师要讲清楚各个知识点的基本思想、方法和知识之间的联系, 而对具体的、细化的内容留给学生自己去学习、理解和消化, 以增加课堂信息量.比如, 数学期望和方差的概念要较详细地从概念的实际背景出发进行剖析概念的内涵, 指出数学期望是平均数, 但又不是平均数.方差是用来观测数据的变化程度, 一旦讲清了这一概念, 真正被学生所理解、接受, 学生就了解了学习他们的意义和用处.

2.课堂教学尽量运用启发式教学

注意教学的启发性, 培养独立思维的习惯, 是教学成功的关键.首先, 在教师对教材的处理上, 照本宣科的教学绝不是启发性教学.教案、讲稿是教师掌握、讲授教材的结晶, 但不是一成不变的.因此, 应因时、因学生而变.其次, 在教学方法上, 让全体学生参与教学, 共同探讨.让学生独立思维、主动学习, 对同一问题可变换角度提问, 让学生进行独立思考;或在讲授时故意引人错误观点, 树立对立面, 对比激疑, 引发学生独立思维的习惯与兴趣, 可达到事半功倍的效果.

例如, 一个关于小概率事件的例子:从某工厂的产品中任意抽取200件来抽查, 结果发现其中有6件次品, 能否相信该工厂的次品率p≤1%?

我在讲该题的时候, 设置了一个情景, 假定学生是指将部门的, 正在对该厂进行抽查, 我问他们:你们认定工厂的次品率p≤1%的依据是什么?大家一开始答不出来, 后来在我用小概率事件的定义提示他们, 经讨论, 他们终于知道了思路:若P (x≥6) 很大, 则相信p≤1%;反之, 拒绝p≤1%.经计算P (x≥6) ≤1-undefinedCundefined (0.01) x (0.99) 200-x, 从而得到P (x≥6) ≤0.0166, 所以, 拒绝p≤1%.

3.教学内容与社会生产实践相结合

数学是研究客观世界的数量关系和空间形式的科学, 数学理论教学的目的完全在于应用.对于实际问题如何通过作一些适当的假设, 舍去一些次要的因素, 把实际问题作出适当的简化, 抽象出一个数学问题 (即数学模型) , 找到相应的数值解法, 然后通过计算机的计算与分析, 将所得到的数学答案用于解决或解释实际问题.

4.教学形式多样化

比如, 组织讨论小组, 教师可提出具体问题, 让小组的学生一起来提出解决的办法和方案, 并实际求解.例如讲放回抽样后可以问大家:假设彩票号码有十位, 那么由放回抽样的定义你中大奖的概率有多大?又如, 假设大伙排队抽奖, 而只有一个能中奖, 那么先抽, 后抽有区别吗?然后可组织课堂讨论, 让同学们自己得出结论.教师要多提一些问题让学生考虑, 或者让学生进行一些归纳和总结.一堂课教师能给学生提多少个有价值的问题, 可以成为衡量教学质量的一个具体指标.

5.教学手段现代化

引进现代教学手段多媒体进行教学, 一方面, 可使教学内容得到拓宽, 除课本内容外还可介绍科技新动态, 对概念的物理背景与几何意义可通过图形、动画展示.另一方面, 多媒体教学使得教学更为直观, 对于一些较复杂的图形可以清晰地表达出来, 教学更具动感, 增强学生的学习兴趣, 保证教学效果.老师不要仅仅站在讲台上, 可以经常走到大家当中, 和同学们近距离接触, 可以大大提高学生参与的积极性.

6.考核形式多元化

考核方式要进行必要的调整, 可采取阅卷+开卷+平时成绩的方式.开卷可让学生完成一篇小论文, 内容上可以涉及学过的知识, 也可以是未学过的知识, 其目的在于培养学生独立分析问题与解决问题的能力以及综合运用知识包括写作的能力, 真正把素质教育落实到概率统计教学中去.而平时成绩的出台可以让一些天资禀赋不太好但努力的学生得到信心和补偿.

总之, 只要我们不断的对概率统计教学的改革进行探索和总结, 那么必将全面提高概率统计的教学质量.

摘要:针对目前概率统计教学中普遍存在的弊端, 从教学方法方面分析了概率统计教学的改革思路, 并给出了实施方案.

关键词:概率统计,教学内容,教学方法,改革

参考文献

[1]欧阳自根, 刘亚春.面向对世纪概率统计教学内容与教学手段的改革研究与实践[J].数学理论与应用, 2000 (4) .

[2]向昭红.关于概率统计教学改革的几点意见[J].数学理论与应用, 2001 (4) .

上一篇:数字基带传输下一篇:残疾人社会称谓语研究