分析实验数据策略

2024-05-24

分析实验数据策略(精选10篇)

分析实验数据策略 篇1

分析探究数据是科学探究活动中的一个重要环节, 数据分析有助于学生寻找规律、得出结论, 同时也最具说服力。科学地分析探究数据能使课堂探究变得更真实、准确, 提高科学探究的效率, 对于培养学生的实证意识以及科学概念的形成具有重要的意义。所以, 在科学教学中教师要重视引导学生科学地分析实验数据。下面就以《形状与抗弯曲能力》一课为例, 谈谈如何引导学生分析实验数据。

《形状与抗弯曲能力》是通过实验来探究纸的形状与其抗弯曲能力的关系, 实验的方法是把纸折成不同的形状, 然后在纸上放螺母, 直到纸弯曲接触到桌面。这是一个变量控制实验, 实验除了纸的形状外, 其他条件需要保持不变, 如“桥墩”两边距离、“桥梁”的架空高度、纸的长度、纸的厚度。学生在实验后得到以下的实验数据:

在引导学生分析实验数据时, 笔者采取了三看实验数据的策略。

一看:可疑数据

在不少情况下, 学生在实验过程中会出现偏差或者错误, 对错误的、不具有科学性的数据进行分析, 有可能会得出南辕北辙的结论, 甚至使学生形成不科学的概念。因此, 在对数据进行分析前, 要引导学生对数据进行辨别, 思考这些数据是否有效, 排除可疑数据。

对全班学生收集到的八组数据, 先让学生初步分析, 哪些数据是可以作下一步分析的, 哪些数据是可能存在问题的。学生经过观察提出第8组形状的数据有问题, 因为这组的纸平均能承受6~7个螺母, 与其他组的数据相差比较大。那究竟是怎么一回事呢?笔者请这组的学生把纸拿出来, 然后在实物投影下重新做一次给全班同学看。当他们演示完, 同学们都举起了手, 大家都发现他们组的问题所在, 就是把纸朝横向折了, 这样纸的架空距离就变窄了, 和没有折过的纸相比, 架空距离就不一样了, 这样就没有可比性了。学生一致认为第8组的数据不可信, 需要重新实验后才能使用这些数据。

那是不是平均值接近, 那就说明都是可信的数据呢?这方面学生往往会忽视, 因此需引导学生再分析各组三次的数据, 有个别认真观察数据的学生对第6组的数据提出了质疑, 虽然这组的平均数和其他组的平均数相比, 差别不大, 但这组在同样条件下的三次实验数据差别还是比较大的, 第一次能承受7个, 第二次10个, 第三次15个。那么为什么三次的数据会相差那么大呢?他们认为是因为在实验时不小心会推动桥墩, 从而改变了纸的架空距离。那这样的数据我们还能采纳吗?学生都认为只有在纸的架空距离一样、纸的架高距离一样的前提下得出的数据才是可信的数据, 才能采纳, 所以这组的数据也要重新实验后才能使用。

单位 :个

【反思】

在实际教学中, 学生通过实验得到的“可疑数据”时有出现。而能够从容面对“可疑数据”的教师比较少。教师经常关注的是那些“正常”的数据, 从“正常”数据中总结出我们所需要的规律。但事实上实验得出的数据都需要我们去关注, 不能仅关注部分数据, 因为如果实验的数据本身都有问题, 那我们依靠数据得出的结论也就可能不正确。所以, 教师在让学生分析数据前先要让学生思考“我们得出来的数据都能使用吗”, 排除可疑数据不仅培养了学生思维的严谨性, 还能让学生对实验有更充分地认识。

那怎样知道哪些是可疑数据呢?要先引导学生对数据进行分类, 把相近和差别较大的数据分成两类。然后再来分析差别大的数据, 这时可以先让小组对得出数据的实验设计、实验材料的选择、实验过程的操作等方面进行反思。如果该组学生还是不清楚问题所在, 可以采用实验重现的方法, 让学生在全班重新做一次, 由其他学生帮助他们找出问题。其实, 在这个过程中除了这个小组能正确认识到自己问题外, 其他同学也是在反思自己实验有没有按要求操作、为什么要按要求操作的过程。

另外, 在让学生展示数据、分析数据的过程中, 我们往往只是让他们把实验的平均数展示出来, 然后对平均数进行分析, 其实有些操作不当的数据也会混在其中, 就像上面的第6组的数据, 如果只看平均数不看三次的数据是发现不了他们的问题, 学生可能也不会意识到自己组在实验中没有控制好变量这个问题, 那对他们以后进行变量控制实验是不利的。所以, 除了分析平均数以外还要引导学生分析三次实验的数据, 分析后再排除可疑数据。

二看:过滤后的数据

在排除了可疑数据后, 就可以先对其余的七组数据作分析, 面对纷繁复杂的数据, 让学生先对数据进行分类, 把每一类数据看成一个小的整体, 归纳出它们的范围。从上面的七组数据, 学生归纳出—形纸能承受0个螺母, 形纸能承受2~3.7个螺母, 形纸能承受8~11个螺母, 接着通过层层深入的问题“不同形状的纸承受的螺母数相同吗”、“螺母数的多少与抗弯曲能力有怎样的关系”、“纸的抗弯曲能力与什么有关”来引导学生用数据来说明问题, 最终学生能得出“不同形状的纸抗弯曲能力不同”、“改变形状能增强抗弯曲能力”这样的结论。

很多教师在教学时得出核心结论后就会结束对数据的分析, 学生得出这么多的数据就只为说明核心结论吗?在课上, 笔者会继续让学生对数据进行思考 :你还有进一步的发现吗?你有什么疑问?在短暂的思考后, 学生提出形纸的抗弯曲能力比形纸的要强, 这是为什么呢?为什么改变纸的形状能增强纸的抗弯曲能力?学生的发现和问题都是很有价值的, 于是笔者引导学生先回顾在实验过程中当把螺母放在没有折的纸、形纸和形纸上看纸的变化是怎样的, 再引导学生分析螺母的力在不同形状的纸上是怎样作用的。

【反思】

当我们把全班的数据展示出来, 往往有几十个数据, 分析时就显得很复杂, 为了把数据化繁为简可以把数据分类归纳出它们的范围, 然后在各个范围之间做纵向比较, 也可以让学生把每类数据输入excel表计算出这么多个小组这类数据的平均数再作比较, 这样把数据从复杂变简单, 学生分析起来就轻松多了, 更容易发现规律, 建构起科学概念。

很多教师在让学生分析数据时通常会问“通过这些数据你有什么发现”, 这些问题太空泛了, 学生要么是不知道怎么回答, 要么就是简单复述数据。教师应该把问题分解, 通过逻辑性的细问题串引导学生分析数据。另外, 教师在引导学生分析数据时不能只为了得到正确结论而匆匆做出分析。深挖数据的内涵, 学生的思考就会更深, 收获也会更多。像上例中的深入分析, 学生得到的就不仅仅是“改变形状能增强抗弯曲能力”这个结论, 他们还知道了形纸的抗弯曲能力比形纸的要强, 还懂得了从力的作用这个角度来思考原因。

在分析过滤后的数据时, 为了更直观地看出数据的分布, 可以让学生把数据制成柱状图或折线图, 这样更易于学生发现数据变化规律。科学教材中, 就有许多呈现数据的方式, 如表格、柱状图、饼形图等。在引导学生分析数据时, 应根据不同的数据来选择不同的数据呈现方式。

三看:特殊数据和误差数据

除了纵向看数据, 教师还应该继续引导学生对数据作横向分析。横向分析自己组的三次数据, 自己组的数据和别人的数据, 以此分析自己的实验过程有没有出现问题。

横向比较数据后, 学生发现形的纸抗弯曲能力最多的组能承受11个螺母, 最少的组能承受8个, 相差有3个螺母的重量, 大家都很好奇, 为什么第4小组的形纸能承受那么多, 笔者让第4组和第3组的同学把他们的纸拿上来展示, 学生发现虽然都是形, 但是第4组折的波浪比第3组要多, 那是不是波浪数越多纸的抗弯曲能力越强呢?学生提出这个问题后, 教师便鼓励他们课后自己来做实验, 来解决新的问题。

除此以外, 学生发现很少有一组三次的数据都是一致的, 为什么在同样条件下进行实验, 数据还是会有误差呢?让学生围绕误差产生开展讨论, 学生认为有可能是在放螺母的时候用力没有做到一样, 有时大力些放螺母, 纸的抗弯曲能力就会受到影响。也有些小组提到可能是放螺母的时候没有注意到都集中放在中间, 有些螺母散开放, 那得出的数据就不一样了。那怎样才能减少误差呢?笔者继续让学生思考, 这时学生提出可以用镊子夹着螺母轻轻放在纸上, 这样就可以避免用手放用力过大的问题, 还有学生提出可以用小杯子装着螺母, 这样螺母就不会散开。学生提出的这些建议都非常好, 下节课再让学生用改进后的方法来进行实验, 得出的数据误差就小很多了。

【反思】

当我们强调观察过滤后的实验数据时, 千万别忽视对特殊数据的观察。这里说的特殊数据是指可信但又与众不同的数据, 它很容易被人忽视, 但它的背后同样蕴藏着科学的价值。就像学生发现了形的纸抗弯曲能力最多的组与最少的组相差了3个螺母的重量, 如果教师一笑而过, 觉得不值一提, 那便会失去探究发现的一个良好时机。课后不少学生继续进行了探究, 他们发现纸的波浪数越多, 纸的抗弯曲能力越强, 还有学生发现波浪形结构可以看成是多个三角形组成的, 三角形数量越多纸的承受力就越强。通过对特殊数据的观察, 引发学生提出新的问题, 进行更深入的探究, 就能使学生更好地建构科学概念。

学生在动手之前对实验要控制的变量有了一定的认识, 但实际中还是会出现这样或那样的问题, 导致数据出现误差。及时引导学生对自己活动进行跟进反思就显得尤为重要。可组织学生进行反思 :我们组三次的实验数据一样吗?我们组的实验数据和其他组的数据一样吗?问题可能出在哪里? 实验怎样才能做得更好?通过这样的反思、交流, 学生就会有新的发现、新的问题, 对实验的操作和误差的产生也会有新的认识。虽然分析误差数据花了时间, 但这些时间花得是很有价值的, 学生在这个过程中懂得实验操作不规范、不严谨就会影响实验的数据, 那他们以后做实验就会更认真, 在变量控制实验中也会更懂得去控制变量。

由此可见, 当数据展示在学生面前时, 学生不一定马上能够从数据中找到规律, 教师适当地引导是很重要的。教师除了给时间让学生学着自己分析数据, 还可以有指向性地引导学生对数据先进行观察, 让学生把每一个数据的特点认清楚, 再比较、分析、排除可疑数据, 然后纵向分析数据, 总结出规律, 最后横向比较数据, 思考实验过程中有没有控制好变量, 操作是否得当。

通过三看实验数据, 学生经历着对自己探究过程的整理、分析和反思过程, 深刻地感受到科学研究应该持严谨的态度, 实验数据的价值也大大提高, 而不仅仅是为了得出结论服务。这样的数据分析过程不但能够促进学生的思考, 还可以让学生对于探究活动有更深刻的认识, 帮助学生建构科学概念, 让学生意识到操作严谨的重要性, 从而促进学生科学素养的形成和发展。

分析实验数据策略 篇2

任争刚

权荣 一、基本要求 用 FAMALE.TXT、MALE.TXT 和/或 test2.txt 的数据作为本次实验使用的样本集,利用 C 均值和分级聚类方法对样本集进行聚类分析,对结果进行分析,从而加深对所学内容的理解和感性认识。

二、

实验要求

1、把 FAMALE.TXT 和 MALE.TXT 两个文件合并成一个,同时采用身高和体重数据作为特征,设类别数为 2,利用 C 均值聚类方法对数据进行聚类,并将聚类结果表示在二维平面上。尝试不同初始值对此数据集是否会造成不同的结果。

2、对 1 中的数据利用 C 均值聚类方法分别进行两类、三类、四类、五类聚类,画出聚类指标与类别数之间的关系曲线,探讨是否可以确定出合理的类别数目。

3、对 1 中的数据利用分级聚类方法进行聚类,分析聚类结果,体会分级聚类方法。

4、利用 test2.txt 数据或者把 test2.txt 的数据与上述 1 中的数据合并在一起,重复上述实验,考察结果是否有变化,对观察到的现象进行分析,写出体会 三、实验步骤及流程图

根据以上实验要求,本次试验我们将分为两组:一、首先对 FEMALE 与 MALE 中数据组成的样本按照上面要求用 C 均值法进行聚类分析,然后对 FEMALE、MALE、test2 中数据组成的样本集用 C 均值法进行聚类分析,比较二者结果。二、将上述两个样本用分即聚类方法进行聚类,观察聚类结果。并将两种聚类结果进行比较。

一、(1)、C 均值算法思想

C均值算法首先取定C个类别和选取C个初始聚类中心,按最小距离原则将各模式分配到C类中的某一类,之后不断地计算类心和调整各模式的类别,最终使各模式到其判属类别中心的距离平方之和最小(2)、实验步骤 第一步:确定类别数 C,并选择 C 个初始聚类中心。本次试验,我们分别将 C 的值取为 2 和 3。用的是凭经验选择代表点的方法。比如:在样本数为 N 时,分为两类时,取第一个点和第   1 2 /  N INT 个点作为代表点;分为三类时,取第一、  1 3 /  N INT、  1 3 / 2  N INT 个点作为代表点; 第二步:将待聚类的样本集中的样本逐个按最小距离规则分划给 C 个类中的某一类。

第三步:计算重新聚类后的个各类心,即各类的均值向量。

第四步:如果重新得到的类别的类心与上一次迭代的类心相等,则结束迭代,否则转至第二步。

第五步:迭代结束时,换不同的初始值进行试验,将实验结果进行比较(3)、实验流程图

(4)、本次试验我们用的聚类指标是误差平方和聚类准则 J e 设iN 是第 i 聚类iC 的样本数目,iz是这些样本的均值,则把iC 中得各样本 y 与均值iz 间的误差平方和对所有类相加后为:

  ci C yi eim y J12 当 C 取不同的值时各自算出它们的eJ,进行比较。

二、利用分级聚类方法进行聚类 1、分级聚类法思想:首先把全部样本作为一类看做一类,然后根据一定的目标

函数进行分解。

2、步骤 第一步:开始时,将全部样本当做一类,第二类即为空集。

第二步:将第一类中的第一个样本放入第二类,计算两类样本均值 1 X , 2 X,并确定两类别中样本数目 N1,N2 以及目标函数)2 1()“ 2 1(2 1X X X XNN NE   

第三步:将第一类中剩下的所有样本依次放入第二类中,按照上面运算得出 E值,并比较 E 值大小,选择是 E 值最大的样本,将其归入第二类。并记录此时的E 为 E(2)

第三步:将新的两类按照上面的方法继续划分,直到第 i 次迭代的 E(i)

3、实验流程图

四、实验结果

I I、1、用 FAMALE.TXT 和 MALE.TXT 中的数据组合起来作为样本集:

C=2 时(1)、取第一个和第五十一个样本作为初始聚类中心,得出的实验结果图如下:

得到结果是:星号表示的类别中样本总数为61,点表示的类别中样本总数为39。

两个聚类中心分别为:z1 =(163.5738,53.1541),z2 =(175.8974,68.2692)

(2)、取第二十五个和七十五个样本作为初始聚类中心时得到的实验结果如下:

最终得到的两个聚类中心分别为: z1 =(163.5738,53.1541),z2 =(175.8974,68.2692)

结果可发现取不同的初始聚类中心时两次实验结果相同。

它们的eJ= 5.9707e+003 但是,经过后面的实验我们发现,随着 C 变大,选取不同的初值对聚类结果有较大影响,当 C=2 时影响很小,几乎可以不计。因为当分为两类时,样本的类别特征很明显,所以此时选取不同的初值对聚类结果没有影响,而随着 C 的 增加,初值选择对聚类结果影响将会逐渐变大。

下面是将男女样本所代表的点分别画到图上可得下图:

其中点表示的是女生样本,圆圈表示的是男生样本。其中,男生的样本均值为(173.9200,65.5020)女生的样本均值为(162.8400,52.5960)

通过比较两幅图,可以发现,当去 C=2 时,对数据进行聚类分析得到的聚类结果基本类似于男女生分类,他们的样本均值相差不大,不过还是有一定差别。差别出现在一些身高低于 1.70 米的男生处。

C=3 时得到的聚类结果图如下:

最终的三个聚类中心:z1 =(168.8158,57.0105)

z2 =(159.2333,49.9333)z3 =(176.4375,70.0156)

eJ= 3.9251e+003 从图中可以看出,当划分为三类时,其结果可以看做按照身高与体重的比将样本进行聚类,身高体重比大,较大,小的分别为一类。

C=4 时:得到的分来结果如下:

得到的四个聚类中心为:

z1 =(164.7727,53.3545),z2 =(157.4286,49.2381)

z3 =(176.4375,70.0156),z4 =(170.4400,58.2640)

eJ=3.4318e+003 C=5 时得到的聚类结果如下:

最终的五个聚类中心分别为:

z1 =(170.3462,58.1423),z2 =(158.1579,47.3684),z3 =(163.3913,54.4652)z4 =(176.0741,67.7593)

z5 =(178.4000,82.2000)

eJ= 2.6352e+003 C=6 时得到的聚类结果如下:

最终的 6 个聚类中心分别为:

z1 =(166.9259,54.5889),z2 =(183.3333,66.6667)

z3 =(158.3462,49.8462)z4 =(178.0000,80.6667)

z5 =(171.4737,60.8158)z6 =(175.6842,68.1842)

eJ=

2.5607e+003 1、画出 C 值与eJ之间的关系曲线如下:

由图可以看出,在 C=5 之后,eJ的减小变得缓慢,所以讲此样本集聚为五类最合理 2、把 test2.txt 的数据与上述 1 中的数据合并在一起,重复上述实验,实验结果如下:(1)、取第二十五个和第二百零一个个样本作为初始聚类中心,得出的实验结果图

其中,z1 =(165.0479,53.6491),z2 =(176.4506,69.9378)

eJ= 3.2952e+004 分为一类时的为 7.1410e+004 取第一百个和第三百个样本作为初始聚类中心时得出结果与前面相同。

(2)、C=3

z1 =(174.5561,64.5024)z2 =(163.3438,51.8742)

z3 =(178.8657,80.4776)

eJ =2.0594e+004(3)、C=4 时:

eJ=1.6346e+004 z1 =(175.4783,65.7908),z2 =(159.8548,48.3145)

z3 =(179.3684,81.7368),z4 =(167.5567,56.6485)

(4)C=5 时:

eJ=1.3575e+004 z1 =(170.0510,57.5020),z2 =(175.3836,65.9452)

z3 =(160.5732,50.0512),z4 =(179.6667,91.3889)

z5 =(178.6429,75.7589)(5)、C=6 时

其中,eJ=

1.3018e+004 z1 =(170.6296,55.1241)z2 =(177.2955,68.0057)

z3 =(160.8427,50.6596)z4 =(172.6381,62.9143)

z5 =(181.5952,89.1905),z6 =(176.8488,76.8837)

画出 C 值与eJ之间的关系曲线如下

与图可知,在 C=5 之后,eJ的变化缓慢,所以认为此时仍是将样本集分为五类最合适(4)、将两种样本即进行聚类后的样本中心进行比较,如下表:

样本

C 以 FEMALE 和 MALE 中得数据作为样本 以FEMALE和MALE以及test2中的数据作为样本 2 z1 =(163.5738,53.1541)

z2 =(175.8974,68.2692)

z1 =(165.0479,53.6491),z2 =(176.4506,69.9378)z1 =(168.8158,57.0105)

z2 =(159.2333,49.9333)

z3 =(176.4375,70.0156)

z1 =(174.5561,64.5024)

z2 =(163.3438,51.8742)

z3 =(178.8657,80.4776)z1 =(164.7727,53.3545)

z2 =(157.4286,49.2381)

z3 =(176.4375,70.0156)

z4 =(170.4400,58.2640)

z1 =(175.4783,65.7908),z2 =(159.8548,48.3145)

z3 =(179.3684,81.7368),z4 =(167.5567,56.6485)z1 =(170.3462,58.1423)

z2 =(158.1579,47.3684)

z3 =(163.3913,54.4652)

z4 =(176.0741,67.7593)

z5 =(178.4000,82.2000)

z1 =(170.0510,57.5020),z2 =(175.3836,65.9452)

z3 =(160.5732,50.0512),z4 =(179.6667,91.3889)

z5 =(178.6429,75.7589)6 z1 =(166.9259,54.5889),z2 =(183.3333,66.6667)

z3 =(158.3462,49.8462)

z4 =(178.0000,80.6667)

z5 =(171.4737,60.8158)

z6 =(175.6842,68.1842)

z1 =(170.6296,55.1241)

z2 =(177.2955,68.0057)

z3 =(160.8427,50.6596)

z4 =(172.6381,62.9143)

z5 =(181.5952,89.1905),z6 =(176.8488,76.8837)

从上表可以纵向比较可以看出,C 越大,即聚类数目越多,聚类之间差别越小,他们的聚类中心也越接近。横向比较用 FEMALE,MALE 中数据作为样本和用FEMALE,MALE,test2 中数据作为样本时,由于引入了新的样本,可以发现后者的聚类中心比前者都稍大。但是它们的分布类似,变化不大。

II、将两个样本分别用分级聚类方法进行聚类,得出结果,并与 C 均值聚类法进行比较:

1、对 FEMALE 与 MALE 中数据组成的样本集进行聚类:

由图可见,分即聚类法将样本分为两类,它们的聚类中心分别为 x1 =(163.4667,53.0400)x2 =(175.7500,68.0625)

将它与 C=2 时的 C 均值聚类结果进行比较,分别比较它们的结果图以及聚类中心,下面是它们的聚类中心比较:

聚类方法

C 均值聚类 分即聚类 聚类中心 z1 =(163.5738,53.1541)

z2 =(175.8974,68.2692)

x1 =(163.4667,53.0400)

x2 =(175.7500,68.0625)

比较发现它们的聚类结果很相似。

2、对由 MALE、MALE、test2 中数据组成的样本集进行分级类:

由图可见,分即聚类法将样本分为两类,它们的聚类中心分别为 x1 =(164.9819,53.6229),x2 =(176.4487,69.8868)

将它与 C=2 时的 C 均值聚类结果进行比较,分别比较它们的结果图以及聚类中心,下面是它们的聚类中心比较:

聚类方法

C 均值聚类 分即聚类 聚类中心 z1 =(165.0479,53.6491),z2 =(176.4506,69.9378)

x1 =(164.9819,53.6229),x2 =(176.4487,69.8868)

比较发现它们的聚类结果也很类似 分析:比较发现利用分即聚类方法与利用 C 均值聚类法时 C 取 2 时的聚类结果极其相似,但是,从误差平方和角度考虑,利用 C 均值聚类时 C=2 并不是最好的聚类结果,C=5 时,才是最好的分类,由此可见,从误差平方和角度考虑,C均值聚类法比分即聚类法更优。

五、

土工实验数据分析方法探讨 篇3

【关键词】土工实验;实验数据;数据分析;分析方法

一、引言

在进行实验过程中,由于土体本身所具有的复杂性,土质质检所存在的物理学特性以及采样、运输、存储等等方面所表现出来的特点,都容易对数据造成一定程度的干扰,致使实验的结果出现误差。另外,因为实验本身受到很多因素的干扰,也同样容易发生数据偏差的问题。因此,本文着重从实验数据所涉及的内容,影响实验数据的因素,以及提升实验准确率的角度出发,对土工实验数据分析方法进行探讨。

二、土工试验数据所涉及内容

(一)土的比重实验。土工试验过程中,土的比重实验是非常重要的。一般来说,地域相同或者相近,那么土的比重也将会比较相近。但是,因为在实际操作中,其整个的操作流程比较复杂,所以不同的单位会采用本地所出具的或者考察的相关数据直接进行比重实验,这样容易导致实验数据的误差存在。

(二)土的密度实验。通过土的密度实验可以详细的了解土的组成,可以了解其组成成分的性质,能够为之后的施工提供更多的参考。土的密度与土粒的重量、孔隙体积、孔隙大小、孔隙水重等等内容息息相关,能够反映土的组成和基本结构特征。在进行实验的过程中,要注意尽量避免对取样即时进行实验,最好能够等待土样达到日常状态之后再进行试验,这样可以让土密度实验的结果更加准确。

(三)土的含水量实验。土的含水量实验可以说是土工实验中的核心内容,其实验的情况将会影响到工程地基建设,还会影响到后续工程的稳定性。不同地区的土样其含水量不同,并存在很大程度上的差异性。实验人员在进行取样的过程中,要保证其样品的均匀性,或者具有代表性,否则进行试验所获得的数据就没有任何指导意义,其数据在实践应用中的效率和质量也将会呈现大幅度的下降。

三、土性参数实验结果误差性的原因

(一)土体本身性质导致。依照相关的物理力学和力学性质,我们可以了解到土体的分层具有不均匀性,加上其所处环境的变化,可能发生的雨水冲击、水文变化、其后影响等等语速怒,都会让土体的性质发生改变。这样在进行土工试验的时候就非常容易造成实验结果的差异性,甚至有可能会成为差异产生的主要影响因素。

(二)系统误差。系统误差是由于仪器的某些不完善、测量技术上受到限制或实验方法不够完善没有保证正确的实验条件等原因产生。不同的单位所使用的仪器往往不尽相同,所使用的试验方法也有一定的出入,加上不同的试验方法让土工参数出现离散性,其所实验的数据也就会有所不同。系统误差的存在可以予以避免,其与偶然误差不同,这就需要实验室对设备和系统进行改进。

(三)偶然误差。偶然误差的特点是它的随机性。如果实验人员对某物理量只进行一次测量,其值可能比真值大也可能比真值小,这完全是偶然的,产生偶然误差的原因无法控制,所以偶然误差总是存在,通过多次测量取平均值可以减小偶然误差,但无法消除。偶然误差的存在属于客观存在的现象,其与人为原因所造成的误差有很大的差别,对于两者应当予以区分。

四、土工实验数据分析方法的应用

(一)进行数据检查,果断进行取舍。在进行实验的过程中,如果有明显不符合物理力学性质的值的范围点,则可以通过观察予以了解,实验人员要对其进行细致观察,一旦发现异常立刻予以放弃。一般判断的标准是大部分数值为范围内波动,但是有一点超出正常值或者距离正常值较远,则可以被认定为不合理。在实验数据较多的情况下可以运用3σ法则进行数据之间取舍的考量。在进行实验过程中,存在于之外数值所占比例较少,因此,大于和小于之间数值作为异常处理。

(二)土工实验数据中最小样本数问题。在土工试验过程中,最小样本数问题需要引起人们的重视。实验中的样本数要选取适当,如果样本数过小就会影响实验结果的准确性。但是,样本数的数量并不是随意定制的,其受到多种因素的影响,比如工程规模、工程精度要求、现场勘查情况等等。

(三)土体性质指标的自相关性的问题。根据以往数据实验的关联性,求的往往是其之间的线性相关系数,但是对于其自相关函数通常并没有表现出线性相关,而是指数相关。因此,不能简单依照求相关系数的方法判断其相关性。在进行土工实践过程中,往往可以通过δ对其独立性进行判断。在相关距离 范围内,图形指标基本相关;在此范围外,图形指标基本不相关。但是对于δ事先未知,因此其需要根据样本测值进行求算,一般使用递推平均法对相关距离δ进行计算,并使用间距△Z对δ的影响进行综合考量。一般来说,△Z /δ的数值越大,其各抽样点的土性越接近相互独立,抽样误差也就越小。

五、结束语

土工试验对于土工建设来说影响较大,其影响因素包括土体本身性质、取样仪器情况、人为因素等,需要对此方面予以重视。对其不合理点来说,可以通过3 原则进行剔除。对于其数据相关性来说,其可以通过迭代求解土性指标相关距离予以解决,通过样本的加权平均来对该区域的平均性指标进行估算。为了让样本能够满足实验需要,可以利用Bayes方法对其土性指标与因确认,从而弥补数目不准确的情况。通过此三个方面对其进行方法的应用,则可以有效提升实验数据的准确性、可靠性,可以让实验的结果更加符合实际需要。

参考文献

[1]余海龙,张利宇. 土工实验数据分析方法探讨[J].中国新技术新产品,2015,21:132-133.

[2]刘松玉,蔡正银. 土工测试技术发展综述[J].土木工程学报,2012,03:151-165.

作者简介

例谈科学实验数据的优化策略 篇4

关键词:实验数据,优化,策略

科学探究要培养学生的实证意识。数据作为探究实验中常见的记录手段, 对事物、现象进行定性、定量分析时, 它能使我们的条理更清楚, 结果更精确, 有着其他方法不能替代的作用。作为一线的科学教师, 应重视对学生数据意识的培养, 关注学生实验数据中出现的问题, 并能合理地引导、利用, 使简单枯燥的数字转化为优美动听的音符, 谱写一首和谐的乐章。

一、排摸“特殊数据”

课前, 教师一定要认真研读教材、了解学生、熟悉实验器材, 做好下水实验。预设学生在实验中可能会出现哪些“特殊数据”, 并对造成这些“特殊数据”的原因进行初步分析, 并据此规划和设计教学过程。如2014 年度省小学科学理事会活动中, 笔者执教了五年级下《摆的研究》一课。为了准备实验材料, 笔者进行了多次“下水实验”。第一轮是用“添加钩码”的方法探究“摆锤的重量与摆的快慢是否有关”。试了几次, 并将15 秒内摆动的次数统计如表一。

观察这些数据, 笔者发现数据与科学理论完全不符, 分析其原因是挂钩码存在着问题:一个接在另一个下面, 挂成一长条, 不是挂成一横排, 挂法不同导致了实际摆长发生了变化, 当然摆动次数就变化了。于是笔者再次实验, 把钩码挂成一排, 得到的数据如表二。

第二轮的实验结果较前次在准确度上有很大提升。但不难发现, 3 倍重量的数据仍有误差。在多次实验后笔者发现, 钩码挂在一起时, 摆锤的体积变大, 外形更加不规则, 摆动时有些晃动, 从而影响了摆的重力加速度。为了既不改变摆的长度, 又不改变摆锤的大小, 笔者改进了实验材料, 把钩码换成了两个大小一样但轻重不一样的实心球。第三轮实验, 结果令人满意。从整个下水实验可以得出, 要减少“特殊数据”的产生, 教师要选择合适的实验仪器。

所谓工欲善其事, 必先利其器。教师在“下水实验”中排摸了“特殊数据”, 找到了影响因素, 并有效地进行了改进:从改变挂钩码的方式到改进实验材料。合适的实验材料为学生开展真正的科学探究提供了保障。

二、关注“缺失数据”

实验数据是科学探究过程的见证, 更是得出科学结论的依据。没有了这些数据, 或者说缺少了部分数据, 会直接影响实验的效果。然而, 在科学探究活动中, 学生得到的数据并不是“十全十美”的, 存在着缺失现象, 或遗漏, 或不全, 对此教师应适时引导, 关注这些数据, 增强学生对数据的敏感性, 使学生从被动记录到主动分析数据, 能自觉运用数据来解决问题, 提高探究效率。

如教科版三下《磁铁有磁性》一课, 笔者让学生通过实验完成磁铁能吸引哪些物体的实验记录:能被磁铁吸引的物体请打“ √”, 不能被磁铁吸引的物体请打“ ×”。笔者巡视到其中一个小组时, 发现了如下的实验记录:

笔者发现这个组有两项没有填, 觉得很疑惑“:你们还没有完成吗?他们组都好了。”组长迫不及待地回答说“:老师, 不是的。我们猜测纸片和泡沫是不会被磁铁吸引的, 但实验了几次后发现有些碎纸片和小块的泡沫也会被吸引。所以我们不知道怎么填, 就空在这里了。”此时, 笔者引发学生思考“:为什么磁铁只吸引这些碎纸片、小泡沫呢?”此时, 教师邀请他们上讲台再次进行实验验证, 通过实验他们发现“:小纸片、泡沫原来不是真正被磁铁吸住, 是由于天气干燥、磁铁发热等客观原因造成静电现象吸附在磁铁上面, 是一种假象。”学生恍然大悟, 教师顺势让学生迁移到以前学过的静电现象。

对于此表格数据缺失的原因, 主要还是学生对生活的观察和体验较少, 教师要引导学生通过其他渠道去观察和体验, 因为只有通过比较直观的视觉体验印象才深刻。这就要求教师要能准确把握学生的原有认知, 不武断地作出不合理的判断, 以免抹杀学生学习的积极性, 在充分了解情况的前提下, 启迪学生解决问题, 发现真知。

三、扼制“虚假数据”

蹲下身来, 深入学生, 参与学生的探究过程, 了解真实的数据, 对于培养学生的实证意识至关重要。这个过程, 不仅能拉近师生之间的关系, 让教师及时发现学生中出现的问题, 还能有效避免学生在实验时敷衍了事、弄虚作假。笔者曾经在执教五年级上《蚯蚓的选择》一课时, 就遇到过学生“创造”虚假数据的情况。笔者让学生同时探究土壤和光亮的条件。其中有5 个组进行了“蚯蚓喜欢潮湿还是干燥的土壤观察”的实验。观察实验后, 学生反馈数据记录如下:

在参与各个小组的探究实验的过程中, 笔者有意识地了解了各组的实验数据, 并且根据数据的特征, 选择了3 个组 (第1 组、第2 组和第8 组) 进行汇报。其中第8 组的数据比较特殊, 待在中间的蚯蚓比较多。可是当第8 组的代表上台汇报时, 笔者却发现他们把数据改了, 改得和第2 组的一模一样。以下就是第8 组前后数据的比较 (单位:条) :

笔者问他们为什么没有如实回答, 一位学生说“其他组的结果都是两边的多, 我们肯定是错的!”其他组员则红着脸不说话, 典型的人云亦云, 从众心理。笔者再问“在实验过程中, 实验的真实情况是怎样的呢?”他们的头更低了!他们的记录是实验的真实反馈, 可他们却没有如实面对。对此, 笔者没有在课堂上继续追究, 而是选择在课后与他们小组进行了再一次的实验探究。

盲目的从众心理会影响学生的判断力, 会抑制学生个性的发展, 束缚思维, 扼杀创造力, 使人变得缺乏主见。而科学的探究活动追求的就是真实, 发展的是学生的个性, 这种因盲目的从众心理而“复制”出来的“虚假数据”, 必须加以扼制, 抹去浮华, 使学生的探究回归科学的本质。当然这种扼制还应该是有节制的、委婉的、机智的, 不能适得其反。

四、巧用“另类数据”

科学探究过程中, 由于实验方法、实验器材以及每个人的观察力、操作能力等不同, 实验观测值和标准值之间, 总是存在着一定的差异, 会出现一些另类的数据, 有可能是错误结论, 也有可能是另含玄机。这就需要教师善于捕捉这些信息, 善于引导学生分析这些数据之后的科学知识。

例如六年级上《做框架》一课, 要求学生设计制作一个可以支撑重物的正方体框架。各小组完成了设计图之后便开始实验承重能力。几分钟后, 小组探究结束, 教师将各组数据一一展现在课件中。

接着, 教师让学生仔细观察这些数据, 找出其中的规律。在静静地思考1 分钟之后, 有学生发言:“斜杠越多, 承载能力越大。”教师追问:“你是根据哪些数据找到这个规律的?”这位学生继续以第3 组、第5组和第8 组的数据进行比较。此时, 有学生进行了反驳:“我不同意你的说法, 如第2 组和第4 组比较之后, 斜杠少的反而承载能力更好。”此时, 教师巧妙利用这个生成点, 让第2 组的学生现身说法, 上台展示作品, 当场实验 (斜杆架在正方体框架的对角线上) 。实验后的真实情况让学生心服口服。接着教师再次追问:“第2 组的作品为什么承重力就大了呢?你又有什么新的发现?”学生纷纷举手, 概括出了“三角形框架越多, 承载能力越大”的结论。教师从“另类数据”激发了学生积极的思考, 引发了冲突, 继而合理地利用了这个冲突, 使学生的理解更加深刻。

特级教师章鼎儿曾指出:小学科学教学过程中, 学生犯“错”是难免的事, 从某种意义上说, 越出“错”反而越真实、越科学、越全面、越深刻。学生在探究过程中出现的各种另类数据, 同样是真实的、科学的, 是现实状态的反映。当科学课堂中出现另类数据时, 教师要勇于直面意外, 引领学生去思考、去发现:重视事实根据, 合理怀疑;倾听和考虑他人的不同观点或解释;多次实验, 根据新的证据, 怀疑、修改自己的意见。让学生在质疑、改进的过程中得到锻炼与提升。

五、拾撷“繁杂数据”

数据收集的过程亦是学生实验、实践的过程, 也是学生最喜欢的环节。学生在科学探究活动中, 收集的数据有时会特别多, 看上去会有些凌乱, 它们就像一颗颗散落的珍珠, 只有通过整理、分析——去粗取精, 才能集成一串, 成为项链, 才能发挥数据应有的作用。同时, 当学生面对大量数据时, 往往会显得手足无措。教师此时就应该从学生角度出发, 按照一定的方法厘清关系, 寻找真知。例如在2015 年浙江省小学科学特级教师网络工作室的研讨活动上, 有教师执教了三年级下《磁铁的两极》一课, 教学过程中该教师采用了磁感应传感器, 让每个小组的学生进行充分的实验, 得出了大量的实验数据, 如下表。

以上数据对于学生来说, 烦琐难懂。就连台下听课的教师也为这些学生担心。课堂沉寂了一段时间之后, 该执教教师进行了恰当的引导:“我们可以竖着观察一列数据, 也可以横着比较一行数据。大家再观察比较一下。”方向明确了, 方法了解了, 学生的思路就打开了。接下来的小组讨论非常热烈, 汇报环节更是精彩纷呈。学生不仅明白了不同的磁铁磁力大小不一样, 而且还发现了同一块磁铁中, 两端的磁力最大, 中间的磁力最小。

面对数量众多的数据时, 学生往往会无从下手, 这就需要教师点拨引导, 把有关联的数据放在一起比较, 使这些“零珠碎玉”发挥价值, 让学生在思考、讨论中找出数据中隐含的规律、联系, 串成更有价值的珍珠项链。

在科学课堂教学中, “用数据说话, 用数据验证”这一观点贯穿于整个科学课堂教学中。通过培养学生的数据意识, 使学生通过探究寻求正确的数据来证明自己的观点, 并自觉运用数据解释相关的问题和现象。用数据说话, 有助于学生寻找规律;用数据验证, 有助于学生探究, 从而得出正确、科学的结论, 也能使探究活动变得更真实、更准确、更有效。

参考文献

[1]张红霞.科学究竟是什么[M].教育科学出版社, 2003.

计算机网络数据安全策略分析论文 篇5

2计算机网络安全数据影响因素

对于计算机网络数据安全来讲,不断强化网络数据安全的重要前提就是掌握数据网络安全问题的影响因素,这样才能真正做到治标治本。影响计算机网络数据安全的因素包含很多种,笔者总结了比较常见并且出现频率较高的几种因素,具体如下。第一,网络漏洞问题。网络漏洞问题主要是因为计算机需要根据IP地址将信息传输到计算机中,但是因为计算机的操作系统具有多重性以及多样化特点,所以就会出现一些网络安全漏洞,加上计算机程序经常会一次性运行多个,其中任何一个都能够作为信息传输目标,管理上也会存在很多不足。计算机漏洞是影响计算机网络数据安全的重要因素,需要不断加强重视,才能更好阻止计算机不受到网络hacker或是病毒的攻击[2]。第二,计算机病毒。计算机病毒对于我们来讲并不陌生,它会影响计算机网络运行。我们在生活中或是工作中经常会利用计算机传输或是存储一些文件,并且所有计算机中都会有一个共享的目录,虽然这种共享很好提升了计算机数据传输的效率,但是也带来了一些计算机病毒,若是单个计算机遭受侵犯,会影响相关的数个计算机,这种共享的方式方便了病毒的传播。第三,设备故障问题。计算机本身的硬盘设备若是出现问题,也会引起计算机数据信息的泄露。比如计算机的磁盘失效或是计算机自身的电压不稳定等,都会导致计算机出现问题。很多时候计算机出现故障,经常会造成计算机网络数据丢失。或是相关操作人员对计算机硬件设备操作不当,造成计算机出现问题,数据丢失。

★ 计算机网络论文

★ 计算机网络相关简历

★ 网络协议第二章链路层

★ 计算机网络专业求职信范文

★ 计算机网络基础试题

★ 计算机网络管理个人简历

★ 计算机网络信息安全论文

★ 计算机网络行业实习简历

★ 计算机网络应用求职简历

分析实验数据策略 篇6

1 钢轨打磨试验段和对比段的设置

根据大秦铁路钢轨的伤损现状和现有的钢轨打磨条件, 在钢轨病害情况较为突出的区段设置以维护性打磨为主的钢轨打磨试验段和对比段。根据大秦铁路钢轨伤损数据分析, 半径R≤800 m的曲线区段中钢轨伤损情况最为严重, 其次是大半径曲线和直线区段, 因此本次试验中将钢轨打磨试验段和对比段均设定在半径R=800 m的曲线区段和相邻的直线区段, 并在缓直点、缓圆点、曲中点、圆缓点和缓直点设置测点, 这样不仅便于钢轨观测的定位, 而且可对圆曲线、缓和曲线和直线区段综合考察。试验段和对比段的轨道参数见表1, 测点布置见图1。

打磨试验段和对比段铺设的是75 kg/m U75 V钢轨, 其中曲线上股为淬火轨;曲线下股为热轧轨;直线段为热轧轨。

2 钢轨轨头廓形的分析

通过对比同一测点处不同时期钢轨的廓形变化得到轨头主要部位 (垂磨位置, 轨顶中部, 轨头45°径向和侧磨位置) 的形变或磨耗数据对轨头廓形进行分析 (见图2) 。

既有钢轨打磨试验段和对比段轨头廓形变化与通过总重的关系:1) 试验段和对比段上股的垂向形变分析。曲线半径R800试验段和对比段的垂向变形, 打磨后随累积通过总重的增加, 试验段K266~K269的整体垂向变形还是较低的, 在80 MGT之后, 基本是在0.005 mm/MGT以下, 除圆缓点在100 MGT后有逐渐上升的趋势, 但仍小于0.008 mm/MGT, 对比段K301基本是在0.005 mm/MGT左右, 圆缓点稍高但没有超过0.008 mm/MGT。尽管在打磨后至100 MGT之前, K283的垂向形变量呈下降趋势, 但除曲中点, 其他处明显偏高, 圆缓点和缓直点均超过了0.01 mm/MGT, 至200 MGT后, 基本是在0.005 mm/MGT左右。2) 试验段和对比段上股45°径向的形变分析。随着通过总重的增加, 曲线上股轨距角处45°径向形变速率总体上趋于稳定。试验段K266~K269曲线45°径向形变速率整体上较高, 除圆缓点外, 对比段K301的情况与试验段K266~K269大致相同。试验段K283曲线段45°径向形变速率不够稳定, 除圆缓点外, 与其他两个区段相比, 其他测点处的形变速率偏低。3) 试验段和对比段下股的垂向形变分析。打磨试验段和对比段的垂磨测量位置垂向形变速率在累积通过总重70 MGT之后的趋势大致相同, 试验段K266~K269曲线和直线的形变速率差别较大, 100 MGT之后曲线段是在0.005 mm/MGT左右, 曲中点虽然超过了0.005 mm/MGT, 但仍小于0.008 mm/MGT, 对比段K301在100 MGT之后各点均小于0.005 mm/MGT。经过打磨后至通过总重100 MGT之前, 试验段K283的垂向变形速率基本呈下降趋势, 此后, 除圆缓点到240 MGT趋于稳定外, 其他测点的形变速率基本稳定, 试验段K283曲线段的垂向形变速率整体偏高, 除曲中点外, 其他两点均超过了0.008 mm/MGT。曲线下股踏面中部形变速率, 除试验段K283的圆缓点处有异常变化外, 其他区段或测点的踏面中部形变速率基本较为稳定, 试验段曲线段的形变速率明显要高于直线段, 而对比段K301在累计通过总重100 MGT之后曲线和直线的形变速率小于0.005 mm/MGT。4) 试验段和对比段上股的侧磨分析。从试验段和对比段的测量结果可以看出, 三个区段的侧磨现象均较为严重, 每百万吨通过总重的侧磨速率基本大于0.01 mm/MGT, 圆缓点尤为严重, 大于0.02 mm/MGT。试验段K283和对比段K301曲中点的侧磨速率在60 MGT后呈下降趋势。

3 钢轨轨头工作状态的分析

修理性打磨试验段和对比段钢轨使用情况:根据钢轨伤损记录, 在试验段建段之前, 钢轨伤损情况就比较严重, 主要是在曲上股, 曲下股相对较少, 直线只是在个别处, 在钢轨打磨前后试验段和对比段钢轨伤损情况见表2, 从钢轨伤损统计结果可以看出, 在第一次打磨之前试验段K266~K269和K283的伤损就比较严重, 即使是在轨距角处打磨4遍后, 仍然可以看到明显的裂纹和剥离, 而第一次打磨后至第二次打磨前钢轨伤损数量呈快速增长, 这期间通过总重约有270 MGT, 有些钢轨在第一次打磨几天后就出现核伤, 如K267+22号钢轨的曲上股。从第二次打磨后的结果可以看出, 截至2007年10月, 两处试验段钢轨伤损数量仍然较多, 分别为18处和9处, 这段时间的累积通过总重约180 MGT。

从既有钢轨打磨试验段的钢轨打磨情况看, 由于在打磨前钢轨伤损就较为严重, 因此, 所实施的钢轨打磨虽然在一定程度上缓解了钢轨表面的伤损情况, 改善了轮轨接触情况, 但不能改变钢轨疲劳伤损恶化的趋势, 特别是核伤, 这和预防性打磨试验段第二次打磨后的情况有些类似。从硬度的测量结果可以看出, 在打磨后且通过总重为60 MGT~70 MGT时就应该实施第二次打磨。实际上, 第二次钢轨打磨效果与第一次打磨基本类似。

从对比段的钢轨使用情况看, 由于钢轨侧磨较为严重, 这在一定程度上抑制了钢轨疲劳的发生和发展, 因此, 对比段K301的钢轨疲劳伤损相对较少。对比段K301钢轨侧磨较重的现象可能与行车撒沙和制动减速有关。

4 结语

通过对新轨预打磨可以消除钢轨使用初期的塑性流变和轻度剥离。维护性打磨可缓解钢轨表面的疲劳伤损和改善轮轨接触情况。钢轨打磨应重点打磨轨距角处, 加强曲线上股和直线轨距角处以及曲线下股和直线踏面的打磨。通过钢轨廓形的分析说明轮轨的接触状况, 并对钢轨打磨起到一定的指导作用。曲线区段上股第一次打磨以轨距角处为主, 并辅以轨头廓形修理, 其后的打磨主要是磨削轨距角处和踏面, 无需打磨非工作边。下股第一次打磨以踏面为主, 并尽量去除轨距角处的塑性流变, 其后的打磨重点是踏面, 非工作边根据伤损情况适度打磨;直线段重点以磨削踏面和轨距角处为主。钢轨打磨后, 钢轨表面不得出现发蓝现象, 表面粗糙度不大于12.5μm。

摘要:对重载铁路设立新轨和既有钢轨打磨试验段和对比段, 分析了预打磨和维护性打磨对消除或降低钢轨疲劳伤损影响的作用, 通过对打磨试验段和对比段持续跟踪观测, 对不同通过总重阶段的钢轨轨头廓形、钢轨工作面硬度以及钢轨工作面使用和伤损状况进行记录, 并根据现场采集的实验数据, 结合重载铁路钢轨疲劳伤损特征, 提出了以打磨钢轨轨距角为重点的打磨策略。

关键词:重载,铁路,钢轨,打磨,伤损情况

参考文献

[1]王旭荣.大秦铁路钢轨使用寿命和延长措施研究[J].中国铁路, 2011 (13) :3-5.

[2]张建峰, 高新平, 王卫东.重载铁路钢轨打磨效果分析[J].铁道建筑, 2009 (4) :72-73.

[3]邓建辉, 陈朝阳, 邓勇, 等.轨底坡和轨头廓面对钢轨接触疲劳伤损的影响研究[J].铁道建筑, 2011 (2) :18-19.

[4]胡传亮.钢轨预防性打磨技术的优化研究[J].中国新技术新产品, 2013 (5) :22-23.

投资学数据分析实验体系建设探讨 篇7

一、投资学数据分析实验的内容

所谓投资学数据分析实验, 就是指以现代投资理论的应用与实证研究作为主要内容的实验体系, 主要包括资产定价、利率期限结构、投资组合分析、有效市场研究、业绩评估等几个方面, 根据这些现代投资理论的主要内容, 开展适合学生的数据分析、模型应用、实证研究, 最终形成较为完善的实验体系。具体来说, 围绕固定收益证券可以进行债券定价、债券组合分析、免疫策略的应用、久期和凸性的实验, 围绕股票可以做资本资产定价模型、单因素与多因素模型、套利定价模型应用, 围绕衍生品可以做期权定价的应用, 围绕投资理论可以做资产组合、最优组合建立、组合业绩评估, 围绕市场均衡可以做市场有效性的验证等。

这些实验有些共同的特征, 使它们与传统的证券投资学实验区别开。这些特征包括:

(一) 数据化

现代投资理论的发展是建立在对资本市场大量数据进行统计分析的基础之上的, 这些模型的推导、验证都涉及数据的分析与处理。投资学实验需要学生自己去收集市场的各种数据, 对这些数据进行处理, 然后利用学过的方法对现代投资理论进行应用与验证。

(二) 模型化

现代投资理论的成果经常以模型的方式呈现, 通过这些模型来反映复杂世界中的规律, 从定价模型到资产组合到业绩评估无不以各种模型、指标为工具。所以投资学实验也多围绕着这些模型, 让学生验证这些模型、分析这些模型、应用这些模型。

(三) 综合化

现代投资理论的发展也是多种学科综合的结果, 并且这种趋势日益明显。这些实验也是如此, 要想顺利完成这些实验实际上不仅仅需要金融学知识, 还需要经济学、概率统计、计量经济学等多门课程的基础知识。综合化还意味着这些表面看起来松散的模型其实是一以贯之, 都是围绕着投资分析这一终极目标, 利用这一特点, 我们可以通过综合实验的方法培养学生的综合分析能力, 来对学生进行系统性的考核。

二、投资学数据分析实验体系建设的重要意义

(一) 有利于加深学生对现代投资理论的理解

现代投资理论有较多的理论推导和实证分析, 如果只是单纯介绍还不足以使学生更加深刻的理解这些教学内容, 通过实验的方法, 让学生自己去收集资本市场的数据, 自己利用学过的统计与计量方法去验证前人的研究、去应用前人的研究, 在实验中发现问题、理解问题、解决问题, 自然会对理解教学内容大有裨益。

(二) 有利于培养学生的综合分析能力、提高学生的研究素养

在这些数据分析实验中, 不仅需要他们理解投资学教学内容, 还需要学生运用他们学过的经济学、概率统计、计量经济学等课程的知识。此外, 投资学实验中还有综合性的实验, 学生需要摆脱对单个模型、理论的束缚, 根据实际情况综合运用所学知识来完成实验, 这都是对学生综合分析能力的考验, 对培养学生的研究素养有很大好处。

(三) 是对现有证券投资学实验的有益补充

传统的证券投资学实验大多把实验重点放在交易环节, 强调技术分析方法和财务分析的重要性, 随着各高校实验建设的不断深入, 这些实验已经日益规范和完善。投资学数据分析实验把实验重点放在了对理论的验证与应用上, 很好地弥补了传统实验“重交易、轻分析”的缺点, 两者各有优劣, 相得益彰, 是对现有实验体系的很好补充。

(四) 是研究性教学的有益探索

研究性教学是我国教学改革中的重要方向之一, 对培养创新型人才有着积极作用。投资学作为金融学的重点研究领域集中了大量的研究成果, 是开展研究性教学的良好平台, 实验这种形式作为探索性的研究也适合对学生教学使用, 所以, 数据分析实验的深入开展, 把学生带入学术领域, 引导他们进行力所能及的学术研究是研究性教学的有益探索。

三、投资学数据分析实验体系建设中存在的问题

笔者在过去几年的投资学教学过程中, 逐渐带领学生开展投资学数据分析实验, 在实验的过程中也发现了一些问题。

(一) 实验设计需要掌握理论与实践平衡

实验教学是联系理论与实践的纽带, 在实验建设中始终面临的一个问题就是要掌握理论与实践的平衡。在现实的投资实践中, 现代投资理论已经被广泛应用, 各大投行、研究机构都有一套自己的分析体系与模型工具, 这些数据处理工作已经由计算机完全替代, 所以如果实验完全跟现实操作一样, 你会发现这无助于掌握基本的理论和知识。相反, 如果实验设计过多偏向理论, 就会大大降低实验的应用性, 也不足以引起学生的兴趣。所以投资学实验要精心设计, 既要有助于学生掌握理论知识, 又要使学生明白现实的投资分析中, 这些机构投资者如何来使用这些理论与工具, 掌握两者平衡实则不易。

(二) 实验对学生要求较高

投资学数据分析实验需要学生有良好的理论基础和较强的分析能力, 也需要学生付出努力。在教学过程中, 经常发现同学由于理论基础不牢, 对实验的内容不甚了解, 导致做实验时无所适从。也有的同学顺利完成了实验, 可是发现实验结果不甚理想, 需要他自己去分析研究的时候却总是不得要领。当实验内容偏难的时候就容易使学生产生厌倦, 进而导致应付、抄袭现象的出现。

(三) 实验教学激励机制尚显不足

兴趣是最好的老师, 也是最有力的激励之一。由于投资学数据分析实验偏重理论研究, 这些实验不像技术分析这些内容有着较强的实践性, 很多同学感到学的内容在以后很难应用或者是根本没有用武之地, 这就导致学生学习兴趣不高, 单靠传统的考试、考核来约束学生, 难以达到良好的教学效果。

(四) 作为指导教师也缺乏相应的实践机会

现代投资理论广泛应用于投资分析、基金管理、IPO等领域, 也就是说只有在各大投行、证券公司的核心部门才会接触这些实践活动, 然而, 作为普通教师, 缺乏相关部门和公司的工作经验, 也很难进入到这些公司进行实地考察与学习, 这就使得作为指导教师也只是依据课本理论与学术研究成果来进行实验教学, 这难免有闭门造车的嫌疑, 也影响实验的有用性。

四、完善投资学数据分析实验教学体系应采取的措施

实验教学体系的完善是一项长期工作, 每个学校的具体情况都有所不同, 需要因地制宜, 但无疑都是从改善实验教学方式、优化实验内容、提高教学效果方面来着手。

(一) 加大对实验建设的支持力度

投资学数据分析实验并不是新生事物, 但是从教学实践中来看, 这部分实验普及程度并不是很高, 在内容和体系上也多和传统的证券投资实验合在一起, 没有得到足够高的重视。在实验内容和体系上也还有很大的完善空间, 在实验设计上还需要不断探索, 这些都对教师提出了更高的要求, 需要花费大量的时间和精力。要想把这部分实验建设工作做好, 必须要加大支持力度, 依托学校的专业建设、课程建设, 为实验建设提供必要的硬件和软件设施, 为指导教师争取实践机会, 把实验建设工作落到实处。

(二) 培养学生兴趣, 加强专业引导

今天, 大学教育的很多问题的根源就在于学生学习的功利性, 当学生选择专业不是因为感兴趣而是因为好找工作、挣钱多的时候, 专业的教育就必然带来难题。我们相信, 兴趣是可以培养的, 通过各种各样的活动使学生更快地了解本专业的研究领域与研究意义, 激发他们对所学内容的思考, 才能真正培育他们的学习兴趣, 也只有对专业的真正熟悉和了解才有可能有着长久的学习动力。

(三) 扎实做好理论教学工作

实验教学的目的固然是为实践服务, 是为了提高学生的动手能力, 但是要真正做好实验, 掌握好理论内容是根本前提。在教学过程中, 我们发现, 实验做得好的往往是那些学习认真, 掌握知识较为扎实的同学, 而很多同学之所以碰到问题, 大多是因为对所学内容理解有偏差。所以, 实验其实也是对理论教学成果的检验。理论教学和实验教学二者相辅相成, 要想实验教学效果好, 还是要在理论教学上下功夫, 改变教学方式方法, 及时沟通和交流, 适当练习与讨论都是行之有效的措施。

(四) 改善实验教学方式, 创新激励机制

证券投资的实验过程从组织形式看其实比较单一, 教师说明实验步骤后由学生自己实验, 让学生看看指标、学习分析方法、比比投资业绩, 教师通常只是起到一个答疑解惑的作用, 尽管也会对学生的实验活动进行把控, 但效果并不尽如人意。因此, 在新的实验设计中, 必须加强与学生之间的互动, 改善实验教学方式。具体来说加强互动可以从以下几个方面着手:一是改变组织形式, 比如从单人实验改成分组实验, 小组提交研究成果, 加强学生之间的交流, 各组之间竞争, 加强激励;二是可以改变实验设计, 把原来的实验过程设计成情景模拟, 为不同的组别设计不同的职能与实验内容, 他们之间进行互动。还可以采用任务驱动的方式, 为他们制定特定的实验目标, 由他们自己的实验去自主完成任务等;三是在教学过程中要充分利用配套的网络平台。现在的学生在网络世界中都是异常活跃的, 充分利用这个社交网络平台, 利用网络上的激励机制营造良好的学习氛围, 往往能够起到意想不到的效果。

摘要:现代投资理论在投资学中的地位越来越重要, 但是在实验教学中往往没有得到足够的重视。本文把现代投资理论的应用与研究作为一个单独的实验体系来建设和完善, 从这个角度出发探讨未来投资学实验教学改革的方向, 分析了投资学数据分析实验体系建设中存在的一些问题, 并从实验设计、内容把握和教学方式改革几个方面提出了一些改进建议。

关键词:实验,投资学,数据

参考文献

[1]贾亚南.投资学实践性教学改革的设想[J].江西金融职工大学学报, 2010 (04) .

[2]孙莉.关于对证券投资学课程教学重心进行调整的几点思考[J].经济研究导刊, 2009 (10) .

[3]吴朝霞.关于高校本科金融专业证券投资学课程教学的若干思考[J].当代教学理论与实践, 2010 (08) .

[4]熊广勤.证券投资学课程实践性教学模式探析[J].武汉冶金管理干部学院学报, 2010 (12) .

分析实验数据策略 篇8

关键词:线阵CCD,测径系统,亚像素技术,数据处理

0 引言

火炮,被誉为“战争之神”,在战争中发挥着重要的作用,全面提高火炮性能的检测水平,对提高射击精度、减少维修费用、预防故障等具有十分重要的意义,火炮身管的内径测量是火炮性能检测的主要项目[1]。经过深入分析和调查论证,设计了一套基于线阵CCD技术的光电测径系统,该系统不仅能克服现有测径仪的缺陷,而且精度高,灵敏度好,全面提高了身管内径测量的自动化水平。

CCD即Charge Coupled Devices,译为CCD摄像器件或CCD图像传感器,它可直接将光学信号转换为数字电信号,实现图像的获取、存储、传输、处理和复现。为了提高图像测量的精度,若采用提高硬件分辨率的方法,不但代价昂贵,而且不易实现并受各种条件的制约。亚像素细分技术在这种条件下应运而生,成为近年来图像处理技术中热门研究方向之一,亚像素细分技术的基本思路就是将一个像素再分为更小的单位。本系统在数据的处理上采用亚像素处理技术,实现利用低分辨率CCD进行高精度测量的目的。本文重点介绍基于亚像素技术的几种实验数据处理方法,通过试验对比,确定最佳的数据处理方法。

1 亚像素算法的数据处理

1.1 直线拟合算法

该算法的设计思想是,首先对原始的灰度图像进行平滑滤波,再对平滑后的图像进行求梯度处理。找到梯度值最大的两点,再利用这两点的相邻点的信息进行直线拟合,确定边缘的准确位置。

首先对f(i),i=1,2,…图像进行平滑滤波,得到滤波后的一维图像g(i),根据边缘点处斜率最大的原理,可粗略定位图像的边缘。根据梯度公式R(i)=|g(i)-g(i-1)|得到梯度图像,如图1所示:

通过上述方法找到了边缘的位置,但只是一个粗略的边缘,因此,要通过进一步的计算来确定准确的边缘。在梯度最大的像素两侧各取两个像素进行五点直线拟合,直线的拟合采用最小二乘法。

设梯度最大值的两点像素的位置为i,i+1,且对应各像素点的值为Yi,令拟合直线:yi=axi+b,

于是便得到两个参数,确定了所求的拟合直线。

参考点的选择采用浮动阈值法,取梯度最大两点间的均值作为阈值即,则边缘点的位置,由此便准确计算出了边缘的位置,在实验中边缘的定位精度达到百分之一的像素等级。图2为边缘点及拟合直线图。

对采集的数据按照上述的直线拟合方法进行处理得到的测量结果见表1,由实验结果可以看出,像素的定位精度达到了1/100的像素位置,最大测量误差为0.004um。

采用多点的直线拟合,对于灰度图像的高频分量干扰不太敏感。但是,它对灰度图像边缘的斜率变化特别敏感,如果在位移变化过程中,被测灰度图像边缘的斜率发生变化,将严重地影响测量结果。因而,在选定边缘参考点时,应将参考点选在梯度最大值附近,这样将大大减小或消除由灰度图像边缘斜率变化造成的测量误差。

1.2 灰度矩边缘定位算法

灰度矩边缘定位算法的基本原理就是假设实际图像中的实际边缘分布与理想阶跃边缘模型的灰度矩保持一致,即矩不变性。通过此关系来确定实际边缘的位置[2,3]。

一个信号f(x)的p(p=1,2,3,…)阶矩定义为:

其中n为边缘部分的像素个数。

如果用t表示理想边缘中灰度为b的像素的个数,保持两个边缘的前3阶矩相等,也等价于解下列方程:

可以解得:

其中:

则t就是所求得亚像素的边缘。

首先对测量数据进行平滑滤波,应用上述方法对同一组数据进行处理得到的结果如表2所示。其测量最大误差为0.007um。

1.3 一阶微分期望值的边缘检测方法[4,5]

基于一阶微分期望值的边缘检测方法的基本思想是,设s(x)是原始信号,f(x)是利用光学系统得到的输入图像,它是将s(x)和一个点扩散函数G(x)卷积而得到的:

其中G(x)常可以近似地采用高斯函数:

该方法的具体步骤为:

1)对图像函数f(x),计算它的一阶微分g(x)=|f'(x)|,在离散图像中可用差分来近似一阶微分。

2)根据g(x)的值确定包含边缘的区间,也就是对一个给定的阈值T确定满足g(x)>T的x取值区间[xi,xj],其中1≤i,j≥n。如图3所示。

3)计算g(x)的概率函数p(x),在离散图像中有:

4)计算p(x)的期望值E,并将边缘定位在E处。在离散图像中有:

则E就是要检测的边缘的精确位置[6]。这种方法由于使用了基于统计特性的期望值,所以较好地消除由于图像中噪声造成的多响应问题。

先对实验数据进行3阶平滑滤波,应用上述方法对同一组数据进行处理得到的结果如表3所示。最大测量误差为0.0415um。

2 结论

通过以上三种算法对比,可以看出利用直线拟合法进行数据处理其测量误差最小,可达到0.004um,因此,在该测量系统中采用了此方法,但是,直线拟合法对系统的稳定性要求较高,因此,需要对系统进行准确调焦,尽量减少边缘的模糊区域,所以该方法适合焦距不经常变化的测量。

利用亚像素技术对实验数据进行处理,通过对比各种算法处理的结果,选择最优的方法作为测径系统的数据处理手段。该方法的成功应用,使测径系统的测量精度得到很大的提高,实现了利用低分辨率线阵CCD获得高精度测量的目的,体现了亚像素细分技术的优越性和先进性。

参考文献

[1]火炮静态测量设备原理及其应用.国防科工委司令部教育训练部,1987.

[2]Tabatabai Alij,Mitchell 0 Robert.Edge location to sub pixelvalues in digital imagery.IEEE Transactions on Pattern Analy-sis and Machine Intelligence,1984,PAMI-6(12):188-201.

[3]刘变莲.亚像素边缘检测技术的研究[J].电脑开发与利用,2005,18(11):54-55.

[4]Hu G Z,Cao X P.1992.A sub pixel edge detector using exp-ectation of first order derivatives.SPIE,1657:415-425

[5]章毓晋.图像工程(中册)[M].北京:清华大学出版社,2005.

分析实验数据策略 篇9

《装备保障方案 (计划) 》的制定者同时是军械装备保障需求实验模型的使用者, 需要对实验数据有一个充分的认识理解, 提高对实验数据的信任度, 便于对数据的利用, 发挥应有效益。

针对当前装备保障需求分析中, 作战仿真系统运算复杂不易大量实施、偶然性大以及经验数据针对性不强、战争样式固定, 均不能有效反应装备保障需求的问题, 军械装备保障需求实验的核心计算模型将少量仿真数据与大量历史经验数据有机整合, 利用经验数据的可靠性和仿真数据的针对性, 通过仿真数据合理修正经验数据, 实现优中取优, 建立核心算法, 提高了实验模型输出数据的准确性、实用性。

然而, 军械装备弹药保障需求数据的计算与获取是一个顺序推导的过程, 数据的可靠性合理性需要通过额外的方法进行说明。如图1。

1 基本构想

军械装备保障需求实验模型所提供相关数据的验证是说明数据可靠性、实用性的重要环节, 是实验模型的一项重要内容。模型设计将主要采用目标消耗量类比的方法对相关数据进行验证。

历史数据中, 某次相似战斗时, 分配给使用该弹药的武器的任务是X个敌人, 消灭一个敌人用了A (如, 80) 发, 而此次战斗分配的任务是Y个敌人, 军械装备保障需求实验模型平均为每个敌人准备了B发 (如, 160) 发, 如果加上携运行量, B垌A, 则能够说明数据的可信度。

2 结构设计

由于各种弹药之间存在的替代作用, 不同的人员有不同的爱好, 故这种验证很难基于弹药型号。从历史数据的结构看, 也是按类别统计的, 如对越自卫还击作战, “有消灭一个敌人, 需要用弹药4.5吨”等等统计数据。从这两个方面看, 用类别进行验证具有可行性。

同时, 由于历史提供的只有弹药统计数据, 没有分型号的数据, 而战前需要分型号的数据, 这就需要一个统计过程的逆运算, 即还原运算 (在制定计划时称分配运算更为合适) 。从数学的角度去看, 这是一个不确定的问题, 只有补充条件以后, 才可能算出具体的值。从统计过程看, 各种型号的弹药存在一个比例关系, 而这个真实比例关系的数据很难得到, 但是, 军队制定的基数标准, 是这种经验比例关系的重要体现。因此, 为将类别的量值分配到具体的型号之中, 可以做“等基数”的假设。

基于这个框架, 设计出建议值验证表, 按轻、压、反、高四类分别验证。轻武器用消灭1个敌人所用发数;压制武器用消灭1个排支撑点用弹药吨数;反坦克武器消灭1个坦装目标所用弹药发数;高射武器用消灭1个飞行器所用弹药吨数。参见表1。

3 数据说明

表1中:

第1、2列, 来源于模型提供的建议值, 但需要由基数转换为发数。

第3列, 来源于装备字典。

第4列, 按轻压反高分类小计。

第5列, 计量单位, 固定常数, 暂定为“发”。

第6列, 任务数量, 这是由作战想定中的数据分析得出。轻武器用歼敌人数表示, 主要由作战目的而定, 如围歼战, 一般需要消灭60%以上的人员, 故可由“编制数*60%”设定为任务量。压制武器的排支撑点用建制排数量。反坦克武器用“敌编制坦装目标数量*60%”。。高射武器用“敌人编制飞机导弹数量* (可能) 出动强度”。

第7列, 计量单位, 固定常数, 根据轻压反高四类武器的不同用途, 轻武器主要用于敌方人员, 故用“人数”为计量单位。而压制武器主要对象是压制目标, 而典型的压制目标为“排支撑点”, 其余压制目标, 按炮兵弹药计算, 用发数转换为排支撑点的数量。反坦克武器, 主要对付敌人坦克装甲目标, 故以“坦装目标”为计量单位。高射武器是防御性的, 一般用敌人可能的攻击强度来计算, 但不同的敌机类型、不同的高射武器类型计算方法有所不同, 而总体又必须统一, 故统一用“航次”来计算。

第8列, 单位目标消耗建议值=类别小计/任务指标。

第9列, 经验值, 对于开发编程人员是常数, 但需要专门收集和研究。

第10列, 计量单位。轻压反三类是相对数量, 由于高射武器对于每个敌空袭航次消耗的相对固定的, 根据验证要求, 采用绝对数量, “航次”来表示。

第11列, 比值=单位目标消耗建议值/经验值, 用以说明弹药准备的充足程度。

4 验证结果的运用

装备保障方案制订人员从装备保障需求分析实验模型输出数据的验证中, 得到实验模型输出数据与经验数据的类比结果, 由此判断出实验模型输出数据的可靠程度, 确定保障方案的制订方法, 把握方案的执行过程和结果。

假设方案制订人员根据战斗的需要和战役要求, 设定一个实验模型输出数据的单位目标消耗量与历史经验数据的单位目标消耗量的比值预期为1.8 (即预设约80%的保险量) , 则以轻、压、反、高四类为例, 由上述数据可以得到如表2结果。

5 总体评价

为了增强军械装备保障需求实验模型使用者对实验数据的理解认识, 说明实验数据的可信度, 提出了目标消耗量类比的验证方法。该方法, 通过对历史上的经验值进行分析还原, 以及对不同种类不同型号的武器消灭相同目标量的弹药消耗值进行分析比对, 实现对输出数据的有效验证。有效说明了军械装备保障需求实验模型输出数据的可信度, 保证了军械装备保障需求实验模型的有效应用。

参考文献

[1]张伟.装备保障仿真建模及原型系统实现[J].军械工程学院军事博士学位论文, 2013, 6.

[2]赵武奎, 谷巍.装备保障学[M].解放军出版社, 2003, 7:3.

[3]中国人民解放军军语[M].北京:军事科学出版社, 2011, 12.

[4]萨默维尔 (英) .软件工程[M].北京:机械工业出版社, 2011, 05:3.

[5]赵定海, 黄玺瑛.装备需求过程的诞生[J].系统工程, 2008.

[6]况北林, 陈冬云, 詹澄海.军队后勤运筹学[M].北京:解放军出版社, 1986, 8:11-12.

[7]Ray A, Tangirala S.Stochastic modeling of fatigue crack dynamics for on-line failure prognostics[J].IEEE Transactions on Control Systems Technology, 1996 (4) :443-451.

[8]陈立云.装备保障仿真系统建模及其应用研究[J].军械工程学院军事博士学位论文, 2014, 5.

分析实验数据策略 篇10

一、减少试验误差, 提高试验精度是实验设计的目标

实验设计是将实验的因素和水平做合理的组合以得到不同处理, 并将所得到的实验处理安排到合理的空间或时间下进行实验。根据因素和水平的组合情况, 可以将实验分为全面实验和部分实验。全面实验能反映更多的信息, 但若实验的人力成本和财力成本过高, 或者全面实验的处理数过多, 进而需要更多实验空间或者时间, 则可以考虑采用部分实验。

实验设计中应考虑的关键问题是如何减小实验误差, 提高实验精度。Fisher三原则可较好地指导实验设计, 分别为重复原则、随机化原则和局部控制原则 (即区组化设计) 。在讲述三原则的时候采用设置问题、引导思考的方式使学生一步一步地理解并掌握三原则实验设计的思想精髓。例如, 要测量一个人的身高, 由甲同学测量, 得到了一个身高数据, 那么这个数据是否可靠、准确, 我们无法判断。可以再让乙同学测量一次, 若两次测量的数据较为接近, 则说明甲乙同学的测量结果较为可靠, 否则可以再让更多的同学测量。一个人的身高是唯一的, 但是我们通过测量却得到了不同的数据, 是什么原因造成的呢?怎样做才能提高测量数据的可靠性呢?通过设置问题, 让学生思考其中可能的原因, 从而将学生的被动听课变为主动思考, 加强了教师与学生之间的互动。经过与学生的讨论, 使学生明白测量的数值其实是身高的真实数据与一个随机误差的和, 因此对同一个人进行测量, 所得到的身高数据可能是不同的。随机误差可大可小, 可正可负, 对多个误差取平均, 其均值将趋向于零。基于这种思想, 可以对身高进行多次测量, 将测量结果取平均, 平均值将接近于真实的身高。通过这样的讲解, 学生将深刻地理解重复原则的目的。

随机化原则跟学生讲解的是如何安排实验。实验的各个处理在实施中均需要一定的空间和时间, 如一个处理占用一小块农田, 占用一定面积的培养间, 占用培养箱的一部分, 占用烤箱的一部分等等。我们期望除了实验因素以外的环境条件要尽可能一致, 这样可以提高实验精度, 但现实情况是各个处理所占用的空间很难保持一致, 它们之间往往存在着差异, 这时如何将各个处理安排在特定的空间下是需要考虑的问题。空间差异对实验的影响表现为优势和劣势, 如果某些重复的处理占用了表现为优势的空间, 而另一些重复处理则占用了劣势空间, 这样实验所获取的数据将同时包括实验因素的作用和空间不一致的影响, 很显然这影响了对真实规律的发现, 降低了实验的精度。通过随机安排处理所占用的空间, 可以消除这种优势和劣势的影响, 进而可以有效地比较不同处理的效应。

二、实验因素外其他因素的有效控制, 提高实验精度

一个好的实验设计除了应考虑Fisher三原则外, 还应尽量地控制实验因素外的其他因素 (即环境条件) 尽量一致。可以采用一个例子以递进的方式给学生讲解如何控制环境条件。如研究甲乙两种病毒对烟草的致病能力, 实验设两个重复, 共准备四个小区, 每个小区种植烟草20 株, 待烟草长到一定大小时, 其中两个小区的烟草接种甲病毒, 另两个小区的烟草接种乙病毒, 为提高实验的精度, 四个小区的土壤肥力情况、水分情况等尽量一致, 且病毒在烟草上接种的叶位要一致;但现实情况是不同小区的环境条件不可能完全一致, 而且烟草个体之间是存在差异的, 这导致它们对病毒的敏感性不同。因此该实验可以进一步完善, 在同一株烟草的不同叶位分别接种甲病毒和乙病毒, 在同一株烟草上观察甲乙病毒的致病力可很好地消除小区环境条件的不一致性和烟草植株间的差异;但有可能存在这样的情况:老叶和新叶对病毒的敏感性不同。这样不同叶位接种病毒仍有可能影响实验的精度, 可以进一步完善实验设计, 在同一片叶子上接种两种病毒。随机的在一侧叶子上接种甲病毒, 在另一侧接种乙病毒。至此, 实验因素外的其他因素得到了很好的控制, 实验的精度得到了大幅度的提高。

三、观测数据离散情况统计量的构造

对于实验观测数据的质量如何可用中心趋势和离散趋势两种统计量来表示。中心趋势的统计量经常使用的是算术平均数, 此外还有中数、众数、几何平均数、调和平均数等。在引出为什么要用离散情况来衡量数据质量时, 我通过下面的例子让学生思考。假如要生产一种直径为100 mm的零件, 该零件由甲乙两个工厂生产, 从产品中随机抽取了5 件测量直径, 甲厂的数据如下:98 mm、99 mm、100 mm、101 mm和102 mm;乙厂的数据如下:93 mm、97 mm、100 mm、103 mm和107 mm, 请问哪个工厂生产的零件质量较好?学生可直接判断出甲厂生产的零件较乙厂好。甲厂和乙厂零件的平均直径是相同的, 但是乙厂零件的直径离目标100 mm较远, 所以其质量要差一些, 可见仅用中心趋势的统计量衡量实验数据是不够的。

离散数据的统计量首先想到的是最大值与最小值的差, 即极差。极差的计算非常简便, 仅用了两个数据, 但因为其他的实验数据没有得到利用, 导致了大量信息的丢失, 使极差在衡量数据离散情况时并不稳定。在这里, 我开导学生构造另一种衡量离散情况的统计量, 该统计量应该使用了所有的实验数据。经过思考, 学生基本能想到将实验数据与平均数做差, 因为差有正有负, 因此对差先取平方再求和即可表示数据的离散情况, 该统计量即为离均差平方和, 简称平方和。接下来继续引导学生思考离均差平方和所存在的问题, 假如有A、B两个实验, 且实验数据的离散情况相同, 但是A实验的数据有20 个, B实验的数据有200 个, 即样本容量不同, 因为不断的累加, B实验的离均差平方和必然大于A实验的, 这显然与实际不符, 说明离均差平方和容易受样本容量的影响。可以将离均差平方和除以样本容量以消除这种影响, 并告诉学生在统计上除以的是自由度 (样本容量减1) , 这样所构造的统计量称为方差或者均方。方差的正平方根值为标准差, 是经常用来衡量数据离散情况的统计量, 且标准差的单位与实验数据的单位相同。那么标准差是否就完美了呢?继续引导学生思考以下问题:测量人的身高, 单位为毫米;测量光盘的厚度, 单位也为毫米。如果身高测量的差距为0.5 mm则说明测量精度较高, 但如果是光盘的厚度, 则表明测量的误差过大, 标准差无法有效地判断这两种数据的离散情况。其原因为标准差受到数据平均值的影响, 因此将标准差除以平均值即可以消除这种影响, 这样所构造的统计量为变异系数, 变异系数可有效地衡量不同实验所获得数据的离散情况。

摘要:《实验设计与数据分析》是高等院校培养学生科研能力的一门重要课程, 授课效果直接影响着人才的培养质量。在多年的教学过程中, 采用设置问题、引导思考, 变学生被动听课为主动分析, 加强了教学中师生间的互动, 取得了较好的教学效果。总结了实验设计Fisher三原则中重复原则和随机化原则的授课技巧, 总结了引导学生如何控制实验外因素, 提高实验精度的实验设计技巧, 最后展示了如何通过引导学生思考、构造离散统计量的过程。

关键词:实验设计,数据分析,引导思考,实验精度,离散统计量

参考文献

[1]袁品坦.生物统计在谷氨酸菌种选育中的应用[J].发酵科技通讯, 2000 (2) :33-39.

[2]白世红, 徐元春, 周琨.生物统计在林业科学中的应用[J].山东林业科技, 2005 (4) :94-95.

[3]石培春, 龚江, 李春艳.“生物统计”课程教学探索和思考[J].中国电力教育, 2012 (4) :103-104.

[4]赵晓红, 米生权.《生物统计及应用》教学方法、手段的改革与探索[J].北京联合大学学报 (自然科学版) , 2009, 23 (2) :86-88.

上一篇:公路运输发展方向下一篇:感受幼儿美的心灵