统计检验

2024-10-07

统计检验(精选10篇)

统计检验 篇1

关键词:配对计数资料,统计,检验

在临床试验以及医学科研中经常会用到2×2配对设计, 比如用两种方法治疗同一批患者, 以观察两种疗法疗效的差别;用两种培养基培养同一批标本, 看其阳性结果情况等。针对这种设计人们普遍用到的检验方法是χ2检验中的Mcnemar检验, 其公式为χ2= (b-c) 2/ (b+c) (b+c≥40) , 校正公式为 (|b-c|-1) 2/ (b+c) (b+c<40) , 这个公式因其简单易用而受到人们的青睐, 但它有一个明显的缺陷, 即只是利用了检验结果不一致的对子数b和c, 总的样本对子数N却不受任何约束, 也就是说没有充分利用样本所提供的全部信息, 因此有时就不能如实反映客观实际[1], 以一个简单的例子来说明这个问题。

分别有50份、500份和5000份咽拭子样本, 每份标本接种于甲乙两种流脑培养基上, 观察流脑菌生长情况, 结果见表1~表3, 问两种培养基的效果何者为优?

若对以上3个表格用Mcnemar公式进行检验, 会得到同样的结果:χ2=4.90, 但仔细观察表中的数据, 我们会发现对3个表的结果是不能等量齐观的, 而Mcnemar检验恰恰将它们同等对待, 这就是其缺陷所在:只考虑b和c, 而忽视了a和d所能提供的信息, 对样本量的变化视若无睹。

这个问题已引起国内外诸多学者的注意, 正是基于以上考虑, 他们对这一问题进行了深入探讨并提出了相应的解决办法。现将这方面的研究状况综述如下。

1 国外研究状况

对于2×2配对试验设计, 涉及到对多余参量 (n u i s a n c e parameter) 的分析[2], 而这个参数的取值在无效假设中是没有被指定的, 同时这个参数决定着任何一个检验变量的分布形式[3], 消除参数的方法不外乎以下几种:

1.1 条件推断:

这种方法是对统计量进行有条件地讨论, 是由多种方法发展演化而来, 可分为“确切条件推断”和“渐近条件推断 (asymptotic conditional test) ”, 前者是使用确切无效分布, 后者是使用渐近无效分布。Mcnemar检验即属于条件推断的范畴[4]。2×2配对设计的渐近条件推断首先是由Cochran (1950) 依据符号检验提出来的[5]。

1.2非条件推断:

这种方法在非条件无效分布中对多余参量进行了估计, 这是与条件推断不同的地方, 因为它不是直接消除多余参量, 这种方法又可分为“确切非条件推断 (approximate unconditional) ”和“渐近非条件推断 (asymptotic unconditional) ”, 分别对应确切无效分布和渐近无效分布。渐近非条件推断首先是由Mc Nemar在1947年给出的[6], 它与渐近条件推断有相同的渐近分布, 并且无论采用哪一种方法, 最终都会得到相同的检验统计量, 即“Mc Nemar检验”。正是由于人们对Mc Nemar检验的诸多怀疑, Liang和Zeger在1988年提出了一种渐近法来利用结果一致的对子数[7]。

但是国外更倾向于使用“确切非条件推断”来利用多余参量的所有信息[8], Frisen在1980年提出即使计算比较复杂也应该使用“非条件推断”[9]。Suissa和Shuster在1991年提出一种针对配对四格表资料的确切非条件推断方法, 这种非条件推断以简单的z统计量为基础, 所获得的样本含量一般来说要小于确切条件推断, 而且检验效能更高。Miettinen在1968年用不同的方法获得了确切非条件检验方法的渐近非条件功效函数[10], 后续的研究都与Miettinen的结果保持了一致, 包括Bennett和Underwood在1970年对这种检验的确切分布和渐近分布进行的筛选比较[11], Schork和Williams在1980年运用确切非条件功效函数计算了这种检验方法在确切条件形式下的样本含量[12], 以及Duffy在1984年获得的基于渐近无效分布的确切非条件功效函数[13]。由于此种方法在全面利用样本信息这方面的优势, 在计算机已相当普及的今天, 即使遇到运算上的困难, 也应该在实践中推广应用这种方法。

1.3 确切概率法:

Wacholder和Weinberg曾建议将2×2配对设计转变成两样本设计[14], 使原来的样本含量由n变为2n, 用Fisher确切概率法进行检验, 绘制了两种设计条件下的效能曲线并作了比较, 但是这种转换是建立在随机匹配的基础上并且要求配对变量间没有相关关系, Wacholder和Weinberg通过对效能曲线的比较发现, 如果配对变量间具有相关关系并且匹配合理, 配对设计下的Mc Nemar检验的效能还是要高于未配对条件下的Fisher确切概率法, 所以这种方法具有一定的不足。

1.4 各种方法的比较:

无论是哪一种方法, 都不可能十全十美, Miettinen在1968年获得了确切非条件检验方法的渐近非条件功效函数, 后来Duffy对此功效函数的精确性进行了大样本模拟, 小样本时进行了精确计算, 发现在总体上这种函数还是不错的, 但是如果样本量很小, 这种功效函数的结果就会偏离真实值[13], 同时这种方法还有高估检验效能或低估样本含量的嫌疑[15]。确切非条件检验与确切条件检验和渐近条件检验以及渐近非条件检验相比, 确切非条件检验法利用z检验来获得显著水平, 并且考虑了配对样本的总例数, 其显著水平要低于条件推断;另外, 如果在配对设计中使用确切条件法, 与确切非条件法相比, 要增加大约14%的样本含量[3], 在检验效能上, 确切非条件法也要优于确切条件法。

2 国内研究状况

3 国内外研究比较

相比较而言, 国外的研究比国内要早一些, 国内直到20世纪70年代末80年代初才有人涉足这一领域并有正式的文章发表, 因此国外的研究方法显得更成熟, 更有体系, 他们多从数学原理上对每一个公式进行了严密的推导和论证, 而国内的学者多是根据经验而来, 在严谨性上相对欠缺, 正是这一点, 国外学者提出的公式比较繁琐、复杂, 而国内的公式相对简单、直观, 在应用上, 国内的公式更方便。对于公式的验证, 国外多从数学分布、样本含量和两类错误等方面入手, 特别是样本含量和检验效能, 他们会在不同情况下反复进行横向和纵向比较, 以突出新方法的优越性;国内则是通过实例比较, 看两种方法的结果与实际资料的趋同程度来判断孰优孰劣, 还是经验性的东西比较多, 在方法的灵敏度和特异度上没有作深入的探讨。

综上所述, 国内外学者对配对四格表资料检验方法的研究已取得一定成果。我国的研究相对较少, 在许多方面还落后于国外, 因此, 积极进行这方面的研究, 提出一种严谨、合理、方便的检验方法, 对于促进配对四格表检验方法的正确运用, 促进临床科研的科学性和合理性具有重要的意义。

统计检验 篇2

以比较两个组别(实验组与对照组)的男女差异为例。方法

一、如下图所示设置三个变量(组别、性别、人数)

再给“组别”以及“性别”变量添加值

输入数据(我是随机的)

④如下图进行数据加权(教程上要求有这步,原因不明,查了一下有人说是因为这些数据不是原始数据,而是频数表数据,所以要进行预处理)

⑤依次打开:分析(analyze)--描述统计(descriptive)--交叉表(crosstabs),打开交叉表对话框,按图所示将“组别”“性别”分别添加进“行”“列”中,点击交叉表对话框里的“统计量”(statistics),勾选“卡方”以及“McNemar”,点击交叉表对话框里的“单元格”(cell),勾选“行”。

⑥点击“确定”,出现最后结果。会出现三张表,主要看第三张表的pearson卡方检验,渐进sig(双侧)值大于0.05,因此认为不同的性别对两组无显著的差别。最后还得看一下第三张表下面的a中小于5的理论频数不能超过20%,超过了则本次检验不正确,需要(1)增加样本含量,(2)进行合理合并或删除分类。

方法

二、貌似方法二只适用于俩个变量的,列如比较若干组的人数差异性 如下图所示设置两个变量(组别、人数)

再给“组别”变量添加值

输入数据(我是随机的)

④加权处理不知道需不需要,教程上并没有,不过方法一中的解释如果正确,那么次方法也是需要预处理的。

⑤找到非参数检验->旧对话框->卡方检验,将其单击单击打开,将“人数”添加到“检验变量列表”中,点击“选项”,勾选“描述性”

统计检验 篇3

关键词: Excel 生物统计学 t检验 配对设计

1.引言

《生物统计学》是畜牧、兽医、农学、微生物、医学等领域不可缺少的统计工具,越来越多的数据分析离不开生物统计学的原理。随着计算机技术的发展,已有更多的软件被应用于《生物统计学》,如SPSS[1-4],Excel[5],SAS[6]等,但是不同的统计软件具有不同的统计特点,如Excel统计功能简单,操作方便,分析出来的结果更为直观,更适合《生物统计学》的初学者。本文主要介绍如何利用Excel对配对设计数据资料进行t检验,并以案例的形式详细阐述其分析过程。

2.分析工具库的安装

Excel一般并不直接带有“分析工具库”这一模块,需要在Excel的基础上自己安装,安装步骤:Excel的工具 加载宏分析工具库 确定就可以。

3.配对设计的t检验

配对设计是指将参加试验个体两两配对,再将每一个对子内的两个个体独立随机地接受两个处理中的一个。目前主要有自身配对、亲缘配对、条件配对这三种配对方式。

3.1数据资料的建立

例1.用家兔10只试验某种注射液对体温的影响,在注射前1h和2h各测定一次体温,取平均值,注射后1h和2h各测定一次体温,取平均值,问注射前和注射后体温有无显著变化[7]?首先在Excel中把分组的名字写上“注射前体温”和“注射后体温”,分别写在每一列的最上方,然后在“注射前体温”和“注射后体温”下方录入每只家兔的体温数据资料,具体见图1。

3.2 t检验分析

很显然,这是典型的自身配对设计,即注射前和注射后体温形成一个对子,因此我们选用配对的t检验来分析。在Excel中:工具 ?隰数据分析 ?隰平均值的成对二样本分析,点击确定进行分析,然后会出现对话框如图2。输入区域:变量1的区域和变量2的区域,选择“注射前体温”和“注射后体温”原始数据区域。在“假设平均差”处填写0,表示原假设认为这两个样本的总体平均数相等。“标志”前根据需求可以打“√”,也可以不打“√”,如果在变量1的区域和变量2的区域选择原始数据的时候把列上方的名字也选上了,此时就在“标志”打“√”,反之则在“标志”不打“√”。输出选项:输出区域处选Excel空白处,单击确定按钮。

3.3 结果分析

结果部分见图3所示,“t Stat”Excel计算出的t值,图3的最下方4项分别是单尾检验和双尾检验的结果,可以依据题意来选择哪个结果,一般情况是双尾检验。结果分析可以有以下两种途径:(1)可以根据P(T<=t)双尾的显著性概率直接判定,即P(T<=t)=0.000572153<0.01,所以家兔注射前和注射后体温有极显著差异(P<0.01)。(2)可以根据“t Stat”与t双尾临界值的比较来判断,即有|tStat|=5.189340346>2.262158887,所以家兔注射前和注射后体温有显著差异(P<0.05),要想看是否有极显著差异,则需要返回到图2中对显著水准“a=0.01”进行设定,再输出一次结果才可以确定最终的结果。

4.结语

本文主要介绍如何利用Excel对配对设计的数据资料进行t检验,在结果分析部分有2种依据可以判定结果,利用显著性概率P(T<=t)来判定结果更为简单一些,P(T<=t)<0.01表示差异极显著,0.050.05表示差异不显著。如果根据“t Stat”与t双尾临界值来判断结果,需要在图2中将显著水准“a=0.05”和“a=0.01”设定两次,输出两次的结果才可以确定最终的结果,因此根据“t Stat”与t双尾临界值来判断结果相对烦琐一些。 配对设计还有一个特点,即两组数据的个数是一样多的,如果某一组缺失了一个数据,则在另一组与其配对的数据也得剔除才可以进行后面的分析。

参考文献:

[1]白俊艳,徐廷生,张小辉.《生物统计附试验设计》上机实验改革与实践.教育教学论坛,2015,18:247-248.

[2]白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践.畜牧与饲料科学,2013 ,34 (10 ) : 57-58.

[3]白俊艳,武晓红,张小辉,等.生物统计附试验设计课程考核方式的改革与实践.安徽农业科学,2015,43( 5) : 369-370.

[4]秦立金.SPSS统计软件在生物统计课程中的探索研究.赤峰学院学报(自然科学版),2014,30(3):198-199.

[5]韦若勋.生物统计学上机实验课中Excel互动教学方式的应用.高等教育,2013,8:185-186.

[6]黄中文,张丹.生物统计与SAS教学中大学生自主学习能力的培养.新乡学院学报(社会科学版),2013,27(5):140-142.

[7]张勤.生物统计学.北京:中国农业大学出版社,2009.

企业统计报表的可信性检验 篇4

企业统计表如工时报表, 物资、能源消耗报表等, 这些报表的主要用途除上报国家、省、市统计机关和企业上级主管部门外;一个很重要的用途是供企业各级决策部门编制下阶段计划时作为主要依据之一。对于单件、小批类生产的企业, 情况更是如此;其技术指标变动频繁, 而工时、材料定额的修改周期远满足不了计划周期的需要, 故每生产一个新产品, 只有参考近期相似完工产品的资料编制计划, 才能最大限度的减少失误和避免延期交货。遗憾的是, 笔者在企业的生产实践和调查中发现, 这些厂家在利用过去的统计报表平衡任务之间的矛盾, 并预测执行计划当中可能出现的问题时, 常有很大的疑虑, 从而影响计划的制定。显然, 如实反映实际生产过程的工时报表, 对以后编制计划, 修订定额, 都有重大意义;而“水份”过多的工时报表, 只能起反作用。可见, 原始统计报表可信与否, 是科学编制计划, 加强计划对生产的指导作用, 落实责任制指标的关键;也是生产第一线深化改革, 向管理要效益的关键。

二、相对误差的建立

下面仅以单件、小批类企业工时报表 (简称工时报表) 为例进行数理统计分析。

由于各种主、客观因素影响, 工时报表的数值往往有某些出入。如果工时报表内数值有过大的误差, 利用它就很难得出正确结论。因此, 有必要找出一种分析方法, 确认哪些工时报表是可用的, 哪些是不可用的。对于误差很明显的工时报表, 据经验可以否定其使用价值。但对于误差不明显的, 则不能根据经验得出结论, 需进行定量分析。

通常, 基层统计员统计工作时, 不论何时何地, 其统计原则和基本方法是不变的。就是说, 在正常情况下, 其出现误差的情况应该是随机的, 其统计值始终是围绕实际值或多或少的变值。换言之, 如果我们建立:

则相对误差应符合正态分布。μ为相对误差平均值, σ为相对误差的标准差。对于正态分布的Y而言μ=1。

进行了上述处理后, 可通过对一个变量数据变化的分析来衡量报表中各种不同变量的大量数值在总体上的可信程度。那么, 当对工时报表的数值抽样进行假设检验后, 就可判定工时报表的可信性及决定对编制计划是否可用。

三、原理

统计表中数据的误差分为两大类, 一类是系统误差, 表现为相对误差Y有规律的大于或小于1;另一类为随机误差, 用相对误差标准差表示, 记为σ。某一统计表, 如果数据存在某种系统因素而导致误差, 则数据总体的相对误差均值必然大于1或小于1。经抽样计算样本相对误差均值, 根据数理统计中假设检验原理, 可以对总体的相对误差均值是否为1进行判断, 如果通过检验, 认为没有系统误差。对于一个企业, 应有一个稳定的统计系统, 视其基础工作水平高低, 对于某一个变量的统计数值, 认可某一水平的总体相对误差标准差σ0。如果某一报表数据的相对误差标准差, 小于σ0, 则该报表数据的随机误差不大。如果报表数据的相对误差在均值和标准差两方面都通过检验, 则认为该表可信。

四、计算举例

例:已知某工厂以往生产进度统计报表中, 由于统计原则与方法相同, 其数值的相对误差y服从正态分布。其中:相对误差均值μ=1;相对误差标准差σ=0.0 4。

今收到一批新表, 从统计系统目前运行状态来看, 其相对误差偏差不会有多大变化。现抽出10个样品。分别与该批报表形成过程中计调员实际监测到的数据中有关对应数值相对照, 经初步计算, 如下表所示。

问题1:新报表的相对误差均值μ与1有无显著性差异?

问题2:新报表的相对误差标准差σ与认可的数据0.0 4有无显著性差异?

求解:

1. 检验均值

提出假设

H0:μ=1 H1:μ≠1

如果要求95%的可靠性, 取α=0.05, 查t分布表, 得tα/2 (10-1) =t0.05/2 (9) =2.262。由样本数据计算相对误差的样本均值和相对误差的样本标准差s如下:

其中:

检验统计量为:

由于t=0.207<2.262, 因而接受原假设, 即认为新报表的相对误差均值与1无显著性差异, 也就是认为新报表的数据无系统误差。

2. 检验标准差

如果样本标准差s小于σ0, 则认为通过检验。例如本例的s小于0.04, 即可认为σ不大于0.04;如果s明显大于σ0, 则认为σ大于σ0, 这两种情况都不必再进行如下检验了。只有当s略大于σ0时, 才有必要进行下述检验。

提出假设:

H0:σ=0.04 H1:σ≠0.04

应用X 2统计量

如果取显著性水平α=0.0 5, 可查表得到两个邻界值:

且n=10, 然后查表, 得到:

X20.025 (9) =19.023和X20.975 (9) =2.7

显然:2.7

所以无理由拒绝H0, 则应接受H0。

3. 判断

因为μ与1和σ与0.04均无显著性差异, 故该报表可信。

当某次检验结果证明报表存在显著性差异时, 若能肯定计调员监测数据绝对可靠的话, 则应当让统计系统返工, 或判断该次统计报表作废, 这样合格的报表就可以作为计划的科学依据了。

五、结论

本文针对企业统计表中的数据, 提出相对误差的概念, 通过对相对误差均值和标准差的假设检验, 判断统计表的可信程度。并说明本方法在实际工作中的应用方法。

摘要:原始数据是企业各决策部门编制计划的主要依据, 数据是否准确, 是否可信成为关键。运用数理统计的方法分析企业统计表数据的可信性。

关键词:可信性,统计,相对误差

参考文献

统计检验 篇5

课程名称:《医学统计学》

英方名称:《Medicine Statistics》

开课单位:基础医学院预防医学教研室

课程性质:必修课

总 学 时:36学时,其中理论:20学时,实验:16学时

学分:2学分

适用专业:麻醉学、口腔医学、医学影像学、医学检验、药物制剂、社会体育 教学目的:通过教学使学生掌握医学基本的统计学方法,以便为工作后的临床资

料的收集、整理和分析打下坚实的基础。

内容简介:本课程主要通过数值变量资料的统计分析、分类变量资料的统计分析,非参数统计方法、直线相关与回归以及统计图表的讲解,为工作后的临床资料的收集、整理和分析打下坚实的基础。采取多媒体教学方法。基本按理论和实验课的方式上课。

考核形式:闭卷考试

教材:《预防医学》,北京大学医学出版社,王正伦,1版,2004年。参考书目:

1.Kessinger Publishing、Whitman H Jordan,Principles of Human Nutrition:A Study In Practical Dietetics,Publication Date:Dec1,2004.2.Christine Langan、Joseph LaDou,Occupationnal and Environmental Medicine,Publication Date:1997.3.Appleton-Century-Crofts、John M.Last,Public Health and Preventive Medicine,Publication Date:1986.4.《卫生统计学》,人民卫生出版社,方积乾,5版,2005年。

主讲教师:黄厚今教授范奇元教授李 岩副教授

统计检验 篇6

本文提出了对于一些概率系统,针对由概率线性时段不变式描述的系统性质的统计模型检验方法。该方法主要基于模型检验工具UPPAAL完成。主要思想是将概率线性时段不变式转化成概率计算树逻辑(Probabilistic Computing Tree Logic)[2],然后由UPPAAL完成模型检验。主要方法是在原自动机模型的基础上,引入辅助自动机,通过辅助自动机完成线性时段不变式的计算,由UPPAALUPPAAL完成概率计算。

1 概率线性时段不变式

线性时段不变式(Linear duration invariants, LDI)是一类重要的时段演算公式,由周巢尘等人于1994年首次提出,实时系统中的许多安全性质都可以用这类公式进行描述。Pro Cos项目中的一个著名研究实例[29]就是对煤气燃烧器的需求进行形式化表述,比如对于需求——“如果对煤气燃烧器的观察时长l大于等于60秒,则燃气泄露时长不会超过整个观察时长的二十分之一”,就可以使用线性时段不变式来形式化地规约:

这里的leak是一个布尔函数,它表示煤气燃烧器是否处于漏气状态。注意,这里对该煤气燃烧器的观察是一个封闭区间。

然而,在实际情况下系统的行为往往是带有概率的。比如图1这样一个实际系统[3]。开始时,系统在状态s1,处于漏气状态,在该状态下它有两个选择,第一个选择是到达状态s2,第二个选择是到达状态s3,概率分别是0.2和0.8。在状态s2和s3它们分别可以迁移到状态s3和s2,概率都是1。

对于这样的系统,线性时段不变式是否成立就会有一个概率值。

2 概率线性时段不变式的验证思路

给定由n个作为系统组件的时间自动机A1,A2,...,An构成的网络,以及线性时段不变式D,构造一个验证算法,来判断A是否满足D。[4]

足性,就可得知A的所有行为对D的满足性。所以,本节中规定,所有组件自动机都是整数时间自动机。只要限定D的前件中的a、b为整数(包含b为┃的情形),则D就是可离散化性质。那么,只需检验A的所有整数行为对D的满

接着,简要描述验证过程的基本步骤:

1) 将每个组件自动机Ai改造成一个新的时间自动机gi。这种改造是为了标记系统A是否处于某个特定位置,能够帮助计算系统驻留该位置的时长;

2) 构造辅助验证的时间自动机S。在S中,引入两个变量gc和d,gc用于计算对于A的观察时长,d用于计算∑(D) 的值;

3) 要求S与A并行执行,只要观察时长满足时限约束(即D的前件),则S会在观察中的每个整数时刻检验A对D的满足性。

4) 定义一个CTL公式ψ,用于描述所有“失效状态”。所谓“失效状态”,就是使得验证结果为false的状态。A | D等价于该CTL公式是否不被组合系统A|┃S满足。

辅助自动机S如图2所示,其中,

·S有3个状态:初始状态,p0和p1。p0和p1上的约束均为x | 1;4p0=1

·S有4条边:一条从初始状态连向p0的边,执行赋值语句x=1,使得验证最早能从0时刻开始;一条从p0连向p1的边,将变量gc和d初始化为0,用于在观察开始的瞬间检验D的真假;一条从p0连向自身的边,从A运行后一直保持空转,直至某时刻对A的观察正式开始才停止执行,而执行从p0至p1的边,使得观察能从A的任意可达状态开始;剩余一条从p1连向自身的边,它会执行验证函数accum(),用于实时更新gc和d的值;

·S有个本地时钟:x,一旦其值累计至就重置为,表示只在整数时刻检验D的真假。

3 具体实验及分析

在试验中,我们针对图1中所描述的系统,在UPPAAL中景行具体实验。图3和图4分别是图1中描述系统在UPPAAL中的模型以及统计模型检验得到的结果。

可以从结果中看出,对于图1中描述的系统,对于带概率的线性时段表达式的置信区间是[0.902606,1] 置信度为0.95。

4 结论

数理统计在痕迹检验中的运用 篇7

1 数据采集与处理

采集志愿者的赤足长与身高的数据 (如表所示) 。所有样本数据中, 赤足长的测量[1], 均按照同样的方法进行, 即分别确定赤足足迹跟后缘向后最突出点和第二趾头中心点, 将两点的连线作为赤足足迹的测量基线;垂直于测量基线且与赤足足迹最长趾的前缘和跟后缘相切的两条直线间的距离定为赤足长。每个样本的赤足长和身高数据, 需测量3 次取均值做统计分析。值得注意的是, 对于可疑数据 (如个高脚短或个矮脚长样本数据) 的取舍要慎重, 必须遵循一定的原则。取舍的原则:1) 测量中发现明显的系统误差和过失错误, 由此产生的测量数据应随时剔除;2) 采用离群数据的统计检验法, 取舍可疑数据。在足长推断身高的试验中, 可疑数据的取舍一般采用三倍标准差法。

2 相关分析

相关分析是研究现象之间是否存在某种依存关系, 并对具体有依存关系的现象探讨其相关方向以及相关程度, 是研究随机变量之间的相关关系的一种统计方法。利用足长推断留痕人身高时, 我们需要对足长和身高两个变量之间依存性进行分析。如果足长和身高这两个变量依存性高 (相关系数接近+1 或-1) , 就可对数据进行深入的统计分析, 得到变量之间相互依赖的定量关系。相关分析可以采用专业的统计分析软件进行如SAS、SPSS等, 也可使用Excel统计分析工具进行[2]。经过相关分析, 足长和身高相关系数为0.93, 存在显著相关性, 呈线性正相关。因此, 可以利用足长和身高数据进行进一步的统计分析, 建立相应的回归模型。

3 建立回归模型

回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法, 运用十分广泛。回归分析按照涉及的变量的多少, 分为一元回归和多元回归分析;在线性回归中, 按照自变量的多少, 可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型, 可分为线性回归分析和非线性回归分析。因为足长与身高两者呈线性正相关, 所以我们对足长和身高两组数据采用一元线性回归的方法进行统计分析。回归模型中, y表示因变量, x表示自变量, R2为方程的确定性系数;R2值越接近1, 表明方程中x对y的解释能力越强。如图所示, 足长与身高的一元线性回归分析可得回归方程式:y=6.4838x+12.7, 其中R2=0.86968, 数值接近1, 说明利用足长可以推断留痕人的身高, 身高= 6.4838× 足长+12.7。

4 结论

在痕迹检验中, 一个物证会出现很多特征, 如何有机的将这些特征整合起来, 使物证变得强而有力, 是困扰着刑侦人员的难题。数理统计方法应用可以发现可测量特征与特征之间是否存在内在联系、联系是否紧密等现象。因此, 痕迹检验的方法不仅仅是形态学上简单比较, 还可以运用数理统计的方法对某些可测量特征进行统计分析。数理统计方法的应用, 是对痕迹检验方法的改进与补充。

参考文献

[1]史力民, 马建平.足迹学[M].北京:中国人民公安大学出版社, 2014.

统计检验 篇8

股指期货到期日效应(Expiration day effects),是指在股指期货合约到期时,因市场参与者出于不同目的而进行的多种交易(套保、套利、投机等)行为,导致股票现货市场出现暂时性供需失衡现象,反映在股票交易价格上就是涨跌波动,影响到股票到期日的收益。这种现象的主要表现为交易量、收益率和收益波动率等市场特性指标出现异常变化。

对股指期货到期日效应进行研究具有现实意义,因为准确了解到期日效应的现象和市场表现形式,既可以为投资者的交易策略和投资操作方法等提供合理的指导,又能为监管机构监控市场变化、维护公平交易秩序和完善市场政策与法规提供决策依据。

二、文献综述

国内外学者对股指期货到期日效应进行了大量的研究,对到期日的市场是否具有异于平常日的市场特性进行了实证检验,结果表明,许多国家和地区在推出股指期货后出现了到期日效应。其中以Stoll和Whaley(1986)的研究最具代表性,该研究以S&P 500 指数期货、S&P 100指数期权为标的,发现现货市场在到期日最后1小时比非到期日具有较大的收益波动率和交易量。

国内一些学者对股指期货到期日效应也进行了探讨,如蒋瑛琨、彭艳(2007),蔡向辉(2010),黄明、林祥友、陶国兴(2013)从到期日效应检验方法、市场表现、产生的原因和影响因素等方面,对已有研究成果进行了较详细的综述,分析了不同结论产生的原因。

国内对沪深300 指数期货的实证研究大多得出到期日效应不显著的结论,如顾京(2011)采用自回归模型对沪深300股指期货到期日效应进行了实证分析,得出不存在到期日效应的结论,并推测其原因可能与该合约设计合理的交割结算价确定机制以及我国特殊的期货市场投资者结构有关。何汕媛(2012)通过对已实现波动率的OLS回归,对沪深300股指期货是否存在到期日效应进行了实证检验,得出到期日效应不存在的结论。黄明、林祥友、陈国兴(2013)对沪深300股指期货合约到期前及到期日的流动性和波动率的均值差异进行检验,得出存在到期日效应但不显著的结论。

股指期货到期日效应是通过比较到期日与非到期日中各项市场特性指标的差异来加以衡量的。样本的差异性检验方法主要有参数检验和非参数检验。参数检验需要利用总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数做出推断;而非参数检验假定总体分布的具体形式未知,以样本数据本身获取的信息对总体分布的类型和未知进行推断。在总体分布具体形式未知或者不具有足够大的样本容量时,应用传统的参数检验方法进行统计推断可能产生错误的检验结果,特别是在非正态总体、小样本的情况下,传统的参数统计方法(如t检验法、对随机误差分布类型做出假定的OLS回归)不适用于样本的差异性检验,作为替代方法,可以采用非参数统计检验方法。

我国于2010 年4 月16 日正式推出了沪深300 指数期货,国内对沪深300指数期货到期日效应的研究离推出的时间比较短,样本选取所涵盖的到期日个数偏少,如顾京等(2011)和黄明等(2013)的研究中到期日个数分别为7个和22 个,在样本容量较小的条件下使用依赖于严格分布假定的参数检验方法进行差异性检验,无法确保研究结论的准确性和稳健性。

目前,市场虽已先后经历了54 个股指期货合约到期日,但到期日样本的容量(54 个)仍不满足大样本的正态近似条件(金融数据一般要求大于100 个),因此,有必要在进行样本差异的统计检验之前对样本的正态性进行检验,以确定选用何种统计检验方法,主观地直接搬用参数检验方法往往会出现偏差。

基于以上考虑,本文首先对需要进行比较的样本进行正态性检验,以确认是选用参数统计方法还是非参数统计方法,然后用确定的方法对沪深300现货市场在到期日前后相邻交易日的各特定时段与到期日相同时段的日内收益率、日内收益反转进行差异性统计检验,实证考察沪深300股指期货合约到期日前后,沪深300现货市场是否具有异常性变化。

三、研究设计

(一)样本选择与数据来源

本文选取沪深300 现货指数5 分钟日内分时数据作为研究对象,每5 分钟一笔,每日共有48 笔数据,样本期从2010 年4 月16 日至2014 年10 月31 日,共1 101 个交易日,总共52 848 个分时收盘价数据,期间涵盖沪深300 股指期货合约的54个到期日。

本文数据来源于天软平台(Tinysoft.NET)。

(二)日内收益率异常变化的检验

1. 日内收益率的度量。为了深入观察指数期货合约到期日前后的现货日内收益率是否产生异常变化,对每一个交易日t,分别对m=15、m=30、m=60、m=90、m=120,计算t日收盘前m分钟收益率为:

t日收盘后m分钟收益率为:

式中:Pc,t表示t日现货指数收盘价;Pc-m,t表示t日收盘前第m分钟现货指数收盘价;Pc+m,t表示t日收盘后(即t+1日开盘后)第m分钟现货指数收盘价。

收盘前的日内收益率主要用于度量当前交易日收盘前的市场价值,而收盘后的日内收益率主要用于度量下一个交易日开盘后的市场价值,两者互相补充。

2. 日内收益率异常变化统计假设的提出。为了进一步分析股指期货到期日效应发生时间的开始和终结的时间节点,即到期日效应从什么时候开始,持续多长时间后结束,本文采用了与其他文献不同的研究方法,即在非到期日中抽样选取到期日前5 个交易日与到期日后5 个交易日,共10类非到期日,再将每类非到期日分别与到期日进行配对比较分析,而不是将所有非到期日混合在一起与到期日进行比较。

将到期日集合记为T,到期日前第n个交易日的集合记为T-n,到期日后第n个交易日集合记为T+n。对以上计算的某一个时段的收益率序列,分别提取交易日t∈T时的到期日某时段的日内收益率序列与t∈T±n(n值在1、2、3、4、5 中选取)时的非到期日相同时段的日内收益率序列,并对它们检验如下的统计假设:

H0:到期日某时段的现货指数收益率与非到期日相同时段的现货指数收益率无显著差异。

H1:到期日某时段的现货指数收益率与非到期日相同时段的现货指数收益率有显著差异。

根据前述研究方法,非到期日共10 类,故对应于10笔不同时段的日内收益率,每一类选择的非到期日共有10组假设,总共10×10个配对检验。

3. 统计检验方法的选择。两种常用的配对样本差异的检验方法分别为:配对样本t检验和Wilcoxon符号秩检验(Wilcoxon signed-rank test)。配对样本t检验属于参数统计方法,用于检验两种样本(配对与非配对样本)的平均数是否存在显著性差异,其应用的前提条件是样本来自的两个总体应服从正态分布。而Wilcoxon符号秩检验属于秩转换的非参数检验方法,用于检验两种样本差值的总体中位数是否与0存在显著性差异,如果配对资料的正态分布假设不能成立,则应选用Wilcoxon符号秩检验。因此,在选用检验方法时,有必要对样本正态性进行检验,本文采用Jarque-Bera方法进行正态性检验。

Wilcoxon符号秩检验通过对配对样本的差值进行排秩来构建检验统计量的零分布。

设有一配对样本,第i(i=1,2,…,m)对观察值(xi,yi)差值di=xi-yi,Md(d)表示d的中位数,这时Wilcoxon符号秩检验的假设为:

省略所有差值为0的观察配对样本,令剩下的配对子数为n(n≤m),然后根据n个差值的绝对值的大小,由小到大排秩,遇有相同者,取平均秩次;将所排的秩次冠以原差值的符号,称之为差值的符号秩;分别求正秩和(T+)与负秩和(T-),则双侧检验的统计量为T=min(T+,T-);当H0 成立时,各差值的符号完全随机,则共有2n种机会均等可能的符号秩组合(每一种组合出现的概率均为1/2n)。由此可以计算出检验统计量T的概率分布PH0,设T的观测值为T0,则可以计算其双侧检验p值为:PH0(T≤T0),从而做出统计判断。

(三)现货收益率反转效应的检验

基于上述式(1)、式(2)定义的收益率,t日收盘前后m分钟的日内收益率反转指标定义为:

当反转指标Rev(t,m)的值为正,表明t日收盘前后m分钟收益率R(t,c+m)与R(t,c-m)出现反转现象;反之,则表示不存在反转现象。

由于反转现象是一个典型的二分变量,本文采用非参数的二项分布检验(Binomial test)。根据式(3)定义的反转指标Rev,分别检验以下两种情况:1到期日和非到期日各时间区间的收益率反转比率是否显著高于指定概率0.5;2到期日各时间区间的收益率反转比率P1是否显著高于非到期日的反转比率P2。

为了区别于上述日内收益率异常变化的检验,下面,笔者选取所有非到期日(即到期日前5个交易日与到期日后5个交易日)混合在一起与到期日进行比较。

四、实证检验与分析

(一)日内收益率异常变化的Wilcoxon符号秩检验

1. 样本数据的Jarque-Bera正态性检验结果。表1 列示了日内收益率的Jarque-Bera正态性检验结果,值0 表示序列来自正态总体,值1 表示序列不是来自正态总体,显著性水平为α=0.05。

例如,表中第2行第6列的读数为1,表示到期日前第5 个交易日的收盘前15 分钟的日内收益率序列(共54 个样本)不服从正态分布。

注:1T表示到期日、T-5 表示到期日前第5 个交易日、T+5 代表到期日后第5 个交易日;2C-15 表示收盘前15 分钟、C+15表示收盘后15分钟。

从表1第7行数据可知,在到期日的各个时间段的日内收益率序列中,除收盘前后15 分钟的两个日内收益率序列服从正态分布外,其余时间段的日内收益率序列均不服从正态分布,较多的日内收益率序列配对样本来自的总体不同时服从正态分布(至少其中一个样本表现出较明显的尖峰厚尾特性),所以下文选用非参数Wilcoxon符号秩检验进行收益率序列配对样本的比较。

2. 日内收益率异常变化的检验结果。到期日与非到期日相同时段的现货指数日内收益率差异的Wilcoxon符号秩检验结果如下页表2 所示。从表2 可以看出,用于检验各单元格对应的非到期日收益率序列与到期日收益率序列存在显著差异,即样本差值的中位数显著异于0,其中单元格上面和下面的数据分别为平均收益率、符号秩检验的双侧检验p值。

例如,第6行第6列的读数为-0.000 63(0.020 17),表示到期日前第一个交易日收盘前15 分钟的收益率序列(共54个样本)的平均值为-0.000 63,与到期日收盘前15分钟的收益率序列的差异性检验的p值为0.020 17。若p值检验配对样本有显著差异,可利用配对样本平均值的大小信息,辅助判断差异的方向。

从表2可以看出,在所检验的100个收益率序列配对中(基准配对为到期日相同时间段的收益率序列),只有7个符号秩检验的双侧检验p值小于0.05,故从统计意义上看,这些非到期日某时段的收益率序列与到期日相同时间段的收益率序列存在显著差异(在显著性水平5%上)。这些存在差异的配对分别为:(T-1,C-120)、(T-1,C-90)(T-1,C-60)(T-1,C-30)(T-1,C-15)(T-5,C+15)(T+2,C+15),存在显著差异的配对主要集中于到期日前第一个交易日(T-1),在到期日前一个交易日的收盘前120 分钟、收盘前90分钟、收盘前60分钟、收盘前30分钟、收盘前15分钟的日内平均收益率均为负值,且小于到期日相同时间段的日内收益率,这说明到期日前第一个交易日收盘前的日内收益率均显著低于到期日相同时间段的收益率。

笔者还观察到,除(T-5,C+15)、(T+2,C+15)外,其他非到期日的日内收盘前收益率序列与到期日相同时段的日内收益率序列不存在显著差异,因此,我们可以认为,到期日前第一个交易日(T-1 日)的日内收盘前收益率产生了异常的负向变化。

另外,从第5行第11列的读数为-0.001 70(0.811 01)来看,到期日前第一个交易日(T-1 日)开盘后120 分钟(即上午)的平均收益率为-0.001 70,差异性检验p值为0.811 01,与到期日(T日)相同时段的日内收益率相比差异不显著;从第6 行第2 列的读数为-0.004 04(0.015 44)来看,到期日前第一个交易日收盘前120分钟(即下午)的平均收益率为-0.004 04,差异性检验p值为0.015 44,与到期日(T日)相同时段的日内收益率相比差异显著。由此可见,到期日前第一个交易日的上午现货收益率未出现明显的异常变化,到期日前第一个交易日的下午现货收益率则出现了明显的负向变动。

注:1加黑体p值表示在5%的水平上显著;2T表示到期日、T-5表示到期日前5个交易日、T+5代表到期日后5个交易日;3C-15表示收盘前15分钟、C+15表示收盘后15分钟。

(二)日内收益率反转的二项分布检验结果

对到期日和非到期日各时间区间收益率的反转比率运用非参数Wilcoxon符号秩检验方法进行二项分布检验,结果如表3所示。从表3可以看出:

1. 在到期日,现货指数收盘后60分钟收益率(相比收盘前60分钟收益率)的反转比率高达59.26%,单边检验的p-value为0.066 84,在10%的显著性水平上拒绝零假设H0:P1≤0.5,接受备择假设,即其反转比率高于指定概率0.5(这也说明了该反转为非随机行为)。

注:*、**和***分别表示在10%、5%和1%的水平上显著。

2. 在非到期日,现货指数收盘后60 分钟收益率的反转比率则为48.14%,单边检验的p-value为0.879 89,接受零假设H0:P2≤0.5,即其反转比率并没有显著高于指定概率0.5(或未出现明显反转)。

3. 在到期日的现货指数收盘后60分钟收益率的反转比率显著高于非到期日相同时间区间的反转比率(检验p-value为0.038 02,拒绝零假设H0:P1≤P2)。

五、结论

股指期货到期日效应是通过比较到期日与非到期日中各项市场特性指标的差异来加以衡量的。本文首先对配对样本进行Jarque-Bera正态性检验,发现较多的日内收益率序列配对样本来自的总体不同时服从正态分布,表现出较明显的尖峰厚尾特性,因而传统的参数统计方法已经不适用于配对样本的差异性检验。为此,本文选用非参数统计方法,实证检验在沪深300股指期货合约到期日前后,沪深300 现货市场是否出现异常性变化,结果表明,现货市场日内收益率、日内收益反转均发生了显著的异常变化,这说明沪深300指数期货存在到期日效应。由此得出如下两个研究结论:

1. 到期日前第一个交易日(T-1日)的上午现货指数收益率未出现明显的异常变化,到期日前第一个交易日的下午现货指数收益率则出现了明显的负向变动,下午各时间段的收盘前日内收益率均显著低于到期日和其他非到期日相同时间段的日内收益率。

到期日之前现货市场收益率之所以出现异常负向变化,其原因是:在我国新兴的资本市场进行反向期现套利的做空成本较高、操作难度较大,而国内的投资者(包括券商、公募基金和私募基金等)普遍缺乏经验,出于谨慎性考虑,他们主要进行正向套利操作,而这些正向套利资金更多选择的是在到期日之前提前或者分批平仓套利头寸、变现现货组合,这样,有可能促使现货指数在到期日之前就开始出现负向变动。

还有一个比较有力的解释就是:新加坡新华富时中国A50 和我国沪深300 指数期货的个别交割日曾多次给我国沪深A股市场造成很大的冲击,被市场称为“股指到期日魔咒”。而对“股指到期日魔咒”引发市场大幅回调的担忧和恐慌,也使一部分现货投资者在临近到期日之前,就会提前产生看跌预期,更多地倾向于谨慎操作,不轻意出手,甚至出局观望,从而导致现货指数在到期日之前就开始表现不佳。

2. 现货指数在到期日收盘后60分钟存在显著的收益反转现象,其反转比率显著高于非到期日相同时间区间的反转比率。

在非到期日现货指数在15 分钟、30 分钟时间区间存在收益反转现象,而到了到期日,在该时间区间的收益反转现象反而消失了,代之以60 分钟时间区间的收益反转现象,即反转的时间区间被拉长了,这或许与沪深300 指数期货采取到期日现货指数最后2 小时的算术平均价作为交割结算价有关。这种结算价的确定方式有可能加剧现货市场最后2小时多空头的交易博弈,使更长时间区间的收盘前收益率较容易出现过度反应,从而更容易出现收盘后的收益反转现象。

摘要:股指期货到期日效应主要表现为股指期货合约到期时,因市场参与者多种交易行为的存在,导致股票现货市场出现异常性变化。在非正态总体、小样本的情况下,传统的参数统计方法不适用于样本的差异性检验,因此,本文运用非参数的Wilcoxon符号秩检验、二项分布检验方法,对沪深300现货市场在期货合约到期日前后,相邻交易日各特定时间段中的市场特性指标是否存在显著的异常变化进行了实证检验。实证结果表明,现货市场日内收益率和日内收益反转均发生了异常变化,这说明沪深300股指期货存在到期日效应。本文的结论部分地解释了到期日效应的形成原因。

统计检验 篇9

关键词:翻转课堂,实验方法与数据分析,设计,实施

一、绪论

翻转课堂(Flipped Classroom或Inverted Classroom),也叫颠倒课堂,就是将传统的教学模式、教学习惯(老师上课讲解,学生回家做作业)发生翻转,学生课前在家里通过观看教师创建的教学视频而学习新的内容,课上老师与学生相互交流、分享学习的心得以达到教学目的的一种教学形态[1]。

翻转课堂重新调整课堂内外的时间,将学习的决定权从教师转移给学生。这种教学模式下,课堂内的宝贵时间,学生能够更专注于主动的基于项目的学习,共同研究解决问题,从而获得更深层次的理解。教师不再占用课堂的时间来讲授信息,这些信息需要学生在课后完成自主学习,他们可以看视频讲座、听播客、阅读功能增强的电子书,还能在网络上与别的同学讨论,能在任何时候去查阅需要的材料。翻转课堂模式是大教育运动的一部分。互联网尤其是移动互联网催生“翻转课堂式”教学模式[2]。

翻转课堂作为一种“舶来品”信息化教学模式,目前对于“翻转课堂”的研究与应用由原来的起步阶段发展为快速发展阶段[3]。

科学的实验设计和实验结果统计分析是科学实验中不可缺少的部分,是根据实验结果得出正确结论判断时必不可少的理论依据,是现在研究成果发表中必不可少的组成部分。数据统计分析能力是科技、工程、检验等领域人才必须掌握的基本能力之一。

“实验方法与数据分析”课程是关于实验前进行科学、合理的实验设计和实验后对实验数据进行科学处理的理论、方法的课程。课程已经开课多年,在教学中,关注实用性,简化理论推导,突出理论整体理解和掌握,重点教授利用软件完成实验设计和数据分析。

“实验方法与数据分析”翻转课堂课程建设的目的是针对课程中有较多专业软件实际操作内容、应用性强等特点,改变教学模式,针对不同教学内容特点, 分别采用集中教学、集中讨论和视频教学三种教学方式。理论部分集中教学使理论掌握扎实;算例采用课后筛选集中讨论,使学习和专业课题结合,更好地为把实验设计方法和数据统计应用到后续课题研究中做准备;实验设计和数据分析软件实现部分采用视频教学,使学生机动灵活跟随教师的讲解,针对自己的算例,实时实际在电脑中进行专业软件操作。从而总体教学达到使学生充分理解掌握理论,紧密结合专业课题,熟练使用SPSS、mintab等专业应用软件,使学生具备数据统计分析素养,在研究生课题完成中能学以致用,科学地使用实验设计与数据处理知识,并应用在以后的工作学习中。本文主要针对第三部分即软件实现部分的教学内容进行翻转课堂教学设计和实施, 并结合第二部分筛选的与专业有关的算例及习题进行具体教学。

二、翻转课堂教学设计

以课程第四章统计假设检验与参数估计内容为例完成具体的设计与实施,首先设计教学过程如下:

1.将课件内容按主题分解成10张PPT左右的小课件并完成视频录制。课程视频是为了学生课前方便、 灵活学习。按学习规律,人每一段学习注意力集中只能保持10分钟左右,所以视频长短控制在10分钟左右,保持高效学习状态。现在学生都有智能手机,随时可以观看视频,化整为零,可以利用等车、排队等小块时间灵活学习。在视频中间加提问,学生答对问题才可继续观看,在视频结尾加提问,学生答对问题才记录视频完整观看。

2.提前一周左右发课件和视频给学生,要求学生完成自我学习并完成例题软件操作。学生按个人信息登录后看视频学习,并回答视频中的问题,教师可以通过平台数据了解学生观看时间、是否完整观看等情况。问题是要回答正确才能继续观看并完成整个视频。学习后完成例题,自己参考课件、视频内容自行用软件完成,并提交相关数据和结果文件到指定地址。

3.课堂转换到计算机教室上课,课上讨论学习过程中的主要问题,进行答疑并重点讲解重要内容。上课收集同学学习中的问题,并针对有共性的和关键学习点进行重点回答和讲解。并系统重点讲解主要和难点内容。

4.学生课上完成习题。课堂答疑和讲解内容完成之后留习题让学生实际操作,并允许同学互相讨论, 同学之间讨论解决不了的老师再统一答疑。

5.学生课后继续完成习题并复习。课堂教学结束之后布置同学继续完成课后习题,并通过习题练习复习所学内容。

总之,通过上面步骤,将课程内容学习放在课前学生自行完成,课上完成讨论、重点讲解和课上习题练习,课后学生完成课后习题练习巩固学习内容,这样将学习和练习进行了翻转,充分发挥学生的自主性,通过三次重复学习强化学习效果。

三、翻转课堂教学实施

1.将课件内容按主题分解成10张左右的小文件并完成视频录制。按主题分解第四章讲解内容,满足主题突出、内容专一并讲解时间控制在10分钟左右。采用的录制软件是Office2013和Office Mix,最后生成MP4格式视频文件。具体分解主题如表1所示。

2.提前一周左右发课件和视频给学生,要求学生完成自我学习并完成例题。通过完成例题的情况反馈出学生基本完成视频观看,并基本掌握学习内容,可以按照例题过程完成例题的软件操作。也有集中的问题出现,主要是成组和成对资料的假设检验有混淆。

3.课堂转换到计算机教室上课,课上讨论学习过程中的主要问题,进行答疑并重点讲解重要内容。根据同学反馈,集中重点讲解理论:统计假设检验的意义和基本原理;以单个样本平均数的t检验为例重点讲解软件操作过程和数据结果的解读;重点对比讲解单个样本平均数中u检验与t检验的区别和两个样本平均数假设检验中成组资料与成对资料的区别。

4.学生课上完成习题。最后15分钟左右,学生开始完成习题,集中问题还是前面强调的两个不同区别, 经再次反复强调明确,加深理解逐渐不再混淆。

5.学生课后继续完成习题并复习。课后继续完成习题基本正确,说明基本掌握了本章学习内容。

四、翻转课堂教学效果

通过最终期末考试和学生调查反映,这种翻转教学模式使学生理解重点理论透彻、清楚,数据检验软件操作完全掌握。尽管看似多花了时间,但时间很灵活,可以自行安排,学习效率高,省去了课后自己摸索完成软件操作的时间,实际上是节省了时间。说明对于这种侧重应用和重点需要掌握软件操作的课程,翻转课堂教学模式效果好于传统单纯课堂讲解和课堂演示软件操作的教学模式效果,值得大力推广。

参考文献

[1]朱宏洁,朱赟.翻转课堂及其有效实施策略刍议[J].电化教育研究,2013,(08).

[2]http://baike.baidu.com/link?url=TKkv Skq Oi8CUo CGv2qt PCYUhkb Xrq Y10Bjo YUWKYLj Vy Rv-nb T_EYHsg G-hq-o Pq5xx N6LQSr Dc YQRqu Do XFy K[EB/OL]百度百科.翻转课堂.

统计检验 篇10

我们称自变量为因素, 单个表现形式为因素分组.可根据因素个数划分方差分析的类型.若只有1个自变量和1个因变量, 则称为单因素方差分析;相应的, 若有2个自变量, 则称为双因素方差分析, 以此类推.若因变量多于一个, 则称为多维方差分析.

进行方差分析的过程我将其总结为三个步骤:

(1) 表述问题.

(2) 分析离差平方和.

(3) 检验统计独立性.

一、单因素方差分析

1.表述问题

为了找出方差分析的核心, 我们先看下面这个问题:为了考察某种化工产品收率 (%) 的影响, 选择了四种不同的温度.在同一温度下, 各做五次试验.测得的结果如下表所示:

总平均收率x=87.5.

我们的目的是考察温度这个因素对产品收率的影响, 所以在做试验时, 除了温度外, 其他条件如工人的技术水平、原材料、试验器械等都要尽可能地相同.从平均收率来看, 好像温度对收率有一定的影响.但仔细观察一下又不是那样直观.表现在: (1) 同一温度下的收率并不完全一样.所以产生这种差异, 是由于试验过程中存在着各种偶然因素的干扰和测量误差等因素所致.这一类误差统称为试验误差或随机误差. (2) 存在着不同温度的影响.这种由于条件变更引起的差异, 称为条件变差.

现在的问题为:试验误差和条件变差哪一个是主要的.如果条件变差是主要的, 那么应选择较好的工艺条件进行生产或确定进一步的试验方向.

为了叙述方便, 我们把不同条件称为水平, 上面的例子中, 温度分为四个水平, 机器分为m个水平.这里我们引入如下记号:xij=观察值.其中:

i:作为自变量表现形式的因素分组标号 (i=1, 2, 3, …) ;

j:因素分组内观察值的标号 (j=1, 2, 3, …) ;

undefined:因素分组观察值的平均值;

undefined:所有观察值的总均值.

2.分析离差平方和

我们可以这样理解, 若温度对收率无影响, 则某化工产品收率的预测值是undefined.若假设温度对收率有影响, 则应根据温度, 化工产品的预测值分别为undefined.观察值与预测值的偏差undefined归因于随机外部影响, 因而未被解释.于是, 总离差可分解为两部分 (所谓的离差分解) :总离差=已解释离差+未解释离差.

在方差分析中, 可将上述单个观察值的总离差分解推广到所有观察的离差平方和.即总离差平方和=因素分组间离差平方和+因素分组内离差平方和.

现将方差分析计算公式总结如下表二所示:

我们把数据按表二计算如下:

3.检验统计独立性

我们认为求出的因素分组间和因素分组内方差表明, 可猜测因子“温度”对产品的收率没有影响, 为了能在统计上检验此猜测, 我们用Sundefined比Sundefined:

undefined, 其中F实际表示实际F值.

根据表四有undefined

实际F值的评价标准取决于F分布的状况.检验的出发点是零假设 (H0) :不同的温度对产品收率相同;备选假设H1为:不同的温度对产品的收率的影响不同.F检验提出的问题用公式表示为:

H0:α1=α2=α3=0.

H1:至少有一个α值≠0.

通过比较F值与查表所得的理论F值进行检验, 理论F值表对各信任概率给出的一个检验值, 如果给定的显著水平为α=0.05, 则F0.05 (3.16) =3.24, 由于3.1138<3.24, 所以认为温度对产品的收率没有显著影响.

二、双因素方差分析

我们上面讨论的是单因素的方差分析, 但是影响产品质量和数量的重要因素往往不只一个, 例如, 机器、工人的技术水平、原料等都是重要因素.这就需要讨论多因素的方差分析.

为了方便起见, 我们对于两个因素的方差分析也可以总结成下表所示的形式, 便于同学们计算及记忆和理解.

那么我们还是按照上面所论述的因素方差分析的步骤进行两个因素的方差分析.

1.表述问题

要试验8台同类机器性能是否相同, 4名工人的技术是否有显著差异, 使每位工人在每台机器上操作一个工作日得到产量如表五所示:

2.分析离差平方和

根据方差分析基本原理 (离差分解) 我们以如下树形图为基础.

根据上图有如下关系式:

总偏差=因素A造成的偏差+因素B造成的偏差+因素A和B的交互作用造成的偏差+组内偏差.

将其结果计算如下表六所示:

3.检验统计独立性

在双因素方差分析中, 比较所有的均值可以检验两个因素的不同效应.若所有的均值相等, 则可假设两个因素的各因素分组对因变量的影响相同 (零假设) .否则, 可假设至少一个因素分组与其他因素分组产生的影响不同 (备选假设) .其他问题的解决涉及各因素及交互效应的单独分析.此时的零假设为:各因素分组及交互效应的平均值相等.

根据计算的方差分析表, 对α=0.01, F0.01 (2.12) =6.9, F0.01 (2.12) =6, F0.01 (0.12) =4.82, 因19.4>6.9, 30.2>6, 0.55<4.82, 所以促进剂和氧化锌的影响都是显著的, 而它们的交互作用则可以忽略.

三、方差分析的推广

在以上的论述中, 我们都认为每个单元格中的观察值个数相同, 方差分析的第一个推广是引入数据个数不等的单元格, 由此须调整标准差分解分式, 但标准差分解的原理不变, 只是增加对每个观察值的加权.

另一个推广是在分析引入两个以上的因素, 标准差分解的原理同样保持不变.例如, 三因素方差分析与双因素方差分析的原理相同, 加入第三个因素仅使标准差分解略微发生变化.总离差平方和分解如下图所示:

与双因素方差分析相比, 三因素方差分析的特点在于, 可能的交互效应有两个层面:一是因素间两两的交互效应, 二是所有的三个因素的交互效应.分析中引入三个以上的因素, 则因素交互效应的分析层面相应增多, 但此时交互作用的实际意义就会降低或减少.

若根据F检验, 拒绝所有的因素分组影响相同的零假设, 则必然会产生这样的问题:哪些因素分组的影响不同于其他?对此, 可运用所谓的我维检验 (均值检验) .该检验实现了成对均值的比较或均值线性组合间的比较.

四、方差分析的应用建议

要应用方差分析, 必须满足一些前提条件, 这涉及调查数据特征和数据的评价.从科学理论角度看, 必须提出关于自变量 (如温度) 与因变量 (如收率) 间影响关系的假设, 要由方差分析解答的理论问题不能先从数据中得出.除了得出统计上显著的结果, 还能否得出具有重要实际意义的论断取决于影响关系假设的质量.

统计方法对数据的选择提出了一定要求.在研究中, 自变量可能具有任意的测试标准 (名义、序数及基数的尺度) , 但因变量必须是基数测度的.

因素间必须具有明显的区别, 就是说, 它们的必须是完全不同的因变量影响量.若从两个假定不同因素中得出相同的关系, 则因变量的波动不再明确地归因于其中一个因素.

参考文献

[1]盛骤.概率与数理统计.北京:高等教育出版社, 2001 (12) .

[2]李志伟.统计分析概论.北京:对外贸易出版社, 1984 (10) .

[3][德]克劳斯.巴克毫斯.多元统计分析方法.上海:上海人民出版社, 2008 (10) .

[4][美]P.L.Meyer.概率引论及统计应用.北京:高等教育出版社, 1986 (8) .

[5]薛毅.最优化原理和方法.北京:北京工业大学出版社, 2001 (1) .

[6]孙文瑜, 徐成贤, 朱德通.最优化方法[M].北京:高等教育出版社, 2004 (1) .

上一篇:新农村建设模式研究下一篇:企业管理岗位培训工作