实验报告数据挖掘

2024-05-28

实验报告数据挖掘(精选8篇)

实验报告数据挖掘 篇1

大数据理论与技术读书报告

—--— -K 最近邻分类算法 指导老师 :

陈 莉

学生姓名

:

李阳帆

学 学

号 号

201531 46 7

专 专

业 :

计算机技术

20 16年 8月 月 31 日

摘 摘要

数据挖掘就是机器学习领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合, 让计算机帮助人 们从庞大得数据中智能地、自动地提取出有价值得知识模式,以满足人们不同应用得需要。

K K近邻算法(KNN)就是基于统计得分类方法,就是大数据理论与分析得分类算法中比较常用得一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术得理论与应用研究方法之一。本文主要研究了 K K

近邻分类算法, 首先简要地介了 绍了数据挖掘中得各种分类算法,详细地阐述了 K近邻算法得基本在 原理与应用领域,最后在 mat lab 环境里仿真实现,并对实验结果进行分析,提出了改进得方法。

关键词:K

近邻,聚类算法,权重,复杂度,准确度

1、、引言......................................................................................0 2、、义 研究目得与意义误错ﻩ 错误!未定义书签。

3、、算法想 思想误错ﻩ 错误!未定义书签。

4、、现 算法实现 1ﻩ4、1

置 参数设置误错ﻩ 错误!未定义书签。

4、2 集 数据集 1ﻩ4骤、3实验步骤误错ﻩ 错误!未定义书签。、4 析 实验结果与分析误错ﻩ 错误!未定义书签。

5、、思 总结与反思误错ﻩ 错误!未定义书签。

附件1 1误错ﻩ 错误!未定义书签。

1、、引言 随着数据库技术得飞速发展,人工智能领域得一个分支—— 机器学习得研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习得方法来分析数据,挖掘大量数据背后得知识,这两者得结合促成了数据库中得知识发现(Knowledge Discovery in Databases,简记 KDD)得产生,也称作数据挖掘(Data Ming,简记 DM)。

数据挖掘就是信息技术自然演化得结果。信息技术得发展大致可以描述为如下得过程:初期得就是简单得数据收集与数据库得构造;后来发展到对数据得管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据得分析与理解,这时候出现了数据仓库技术与数据挖掘技术。数据挖掘就是涉及数据库与人工智能等学科得一门当前相当活跃得研究领域。

数据挖掘就是机器学习领域内广泛研究得知识领域,就是将人工智能技术与数据库技术紧密结合,让计算机帮助人们从庞大得数据中智能地、自动地抽取出有价值得知识模式,以满足人们不同应用得需要[1].目前,数据挖掘已经成为一个具有迫切实现需要得很有前途得热点研究课题。

2、、研究目得与意义 近邻方法就是在一组历史数据记录中寻找一个或者若干个与当前记录最相似得历史纪录得已知特征值来预测当前记录得未知或遗失特征值[14]。近邻方法就是数据挖掘分类算法中比较常用得一种方法。K近邻算法(简称 KNN)就是基于统计得分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中得多数样本得类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类得一种重要方法。

大多数分类方法就是基于向量空间模型得。当前在分类方法中,对任意两个向量:

x=与存在 3 种最通用得距离度量:欧氏距离、余弦距离[16]与内积[17]。有两种常用得分类策略:一种就是计算待分类向量到所有训练集中得向量间得距离:如 K近邻选择 K 个距离最小得向量然后进行综合,以决定其类别。另一种就是用训练集中得向量构成类别向量,仅计算待分类向量到所有类别向量得距离,选择一个距离最小得类别向量决定类别得归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量得特征之间得关系,这使得距离得计算不精确,从而影响分类得效果。

3、、算法 思想 K 最近邻(K-Nearest Neighbor,KNN)算法,就是著名得模式识别统计学方法,在机器学习分类算法中占有相当大得地位.它就是一个理论上比较成熟得方法。既就是最简单得机器学习算法之一,也就是基于实例得学习方法中最基本得,又就是最好得文本分类算法之一.其基本思想就是:假设每一个类包含多个样本数据,而且每个数据都有一个唯一得类标记表示这些样本就是属于哪一个分类,KNN就就是计算每个样本数据到待分类数据得距离,如果一个样本在特征空间中得 k 个最相似(即特征空间中最邻近)得样本中得大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近得一个或者几个样本得类别来决定待分样本所属得类别.K—最临近分类方法存放所有得训练样本,在接受待分类得新样本之前不需构造模型,并且直到新得(未标记得)样本需要分类时才建立分类.K-最临近分类基于类比学习,其训练样本由N维数值属性描述,每个样本代表 N 维空间得一个点。这样,所有训练样本都存放在 N维模式空间中.给定一个未知样本,k—最临近分类法搜索模式空间,找出最接近未知样本得K 个训练样本。这 K 个训练样本就是未知样本得 K 个“近邻”.“临近性”又称为相异度(Dissimilarity),由欧几里德距离定义,其中两个点 X(x 1,x 2 ,„x n)与 Y(y 1 ,y 2,„yn)得欧几里德距离就是:

未知样本被分配到K个最临近者中最公共得类.在最简单得情况下,也就就是当K=1时,未知样本被指定到模式空间中与之最临近得训练样本得类.4、、算法实现 4、、1 1 参数设置 K 值得设定 K 值设置过小会降低分类精度;若设置过大,且测试样本属于训练集中包含数据较少得类,则会增加噪声,降低分类效果。通常,K值得设定采用交叉检验得方式(以 K=1为基准),通过查找相关资料,K一般低于训练样本数得平方根,本实验中得训练样本数为 100个,因此选取 k=7。、2 数据集 本文得实验数据采用软木塞得数据集,软木塞得样本可分为三类,分别用1,2,3代表,共 150 个样本,我们选取其中得 100 个样本为训练集,其余得 50 个样本为测试集。每个样本均包含10 维特征,由于用 10 维特征计算量太大,本实验得目得主要就是明白 K-最近邻算法得思想,重点不在计算,因此我们选取其中得两个属性作为

本实验得数据,实验数据得部分截图如图 1 所示。

图 1、部分实验数据、3 实验步骤 第一步,初始化距离为最大值。

第二步,计算未知样本与每个训练样本得距离 dist。

第三步,得到目前 K 个最临近样本中得最大距离 maxdist。

第四步,如果dist小于 maxdist,则将该训练样本作为 K-最近邻样本.第五步,重复步骤 2、3、4,直到未知样本与所有训练样本得距离都算完.第六步,统计K—最近邻样本中每个类标号出现得次数。

第七步,选择出现频率最大得类标号作为未知样本得类标号。、4 实验结果与分析 按照上述实验步骤,在matlab中仿真实现k-近邻分类算法得结果如下图2所示,图中得第一列数据表示样本编号,第二列与第三列表示软如塞数据得两位特征得值,第三列得数字表示本实验得分类结果图,第四列表示样本实际所属类別。

图 3 中列出了详细错误信息.第一行与第一列表示样本类别,第 i 行第 j 列得元素表示第 i类样本被分为第 j 类样本得个数(2≤i,j≤4),第五列表示每类样本分类错误总数,第六列表示错误率。由图中数据易得,本实验得平均正确率为 86、7%。

图 2、7—最近邻分类结果图

图 3、错误统计图

KNN 方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量得相邻样本有关。因此,采用这种方法可以较好地避免样本得不平衡问题。另外,由于 KNN方法主要靠周围有限得邻近得样本,而不就是靠判别类域得方法来确定所属类别得,因此对于类域得交叉或重叠较多得待分样本集来说,KNN 方法较其她方法更为适合。

该方法得不足之处就是计算量较大,因为对每一个待分类得文本都要计算它到全体已知样本得距离,才能求得它得 K个最近邻点.目前常用得解决方法就是事先对已知样本点进行剪辑,事先去除对分类作用不大得样本。该算法比较适用于样本容量比较大得类域得自动分类,而那些样本容量较小得类域采用这种算法比较容易产生误分。

5、、总结与反思 模式分类在现实领域有着非常广泛得应用。

K近邻算法就是模式分类算法中一类常用得算法。本文针对传统得 KNN 算法得不足之处,提出了两点改进措施。

1、针对 KNN 算法得计算量大、速度慢得缺点,对训练数据采用了预处理得方法.首先采用某一聚类方法对训练数据进行分类,然后再与 K近邻方法相结合来判断待测样本得类别。现有得方法都就是经过聚类之后确定类别,按一定得规则挑选出来具有代表性得数据。然后再将这些挑选出来得数据作为训练样本.但这类方法能去除得数据非常有限,因此对计算量大得改进不大,而本文提出得新得算法:在聚类之后,首先计算出来各个类别得中心,然后只需要考虑待测样本与聚类中心得距离就可以.然后再根据最终得到得距离得大小判断该点所属得类别。通过实例验证表明,该方法在算法得时间复杂度方面有一定得改进。

2、关于准确度得问题,我们主要就是舍弃了原来常用得欧式距离得计算公式,主要考虑了属性对分类得影响,在欧式距离得计算中引入了权值.尽管权值得确定在一定程度上增加了计算时间得代价,但就是从改进分类准确率上来说仍然就是必要得,尤其就是在数据中无关属性比较多,传统得分类算法误差较大得情况下学习特征权值尤其适用。权值得确定也已经有了不少得方法,如可以通过神经网络来确定权值等。本文从训练样本出发,逐一统计计算每一个属性对分类结果得影响,根据影响得大小来确定权值。通过实例验证,可知这种方法得到得权值与其她常用得方法相比,在分类准确度方面有一定得提高。

参考文献

[ [1 1] ] 邓箴, , 包宏、用模拟退火改进得

KNN 分类算法 [J ]。计算机与应用化学,2 010,27(3)

:3 03--307.[2 2 ]郭躬德,黄杰,陈黎飞、基于

K NN

模型得增量学习算法 [J ]。模式识别与人工智能,20 10 ,23(5):70 1-7 7 07。

[ 3 ]黄杰,郭躬德,陈黎飞、增量

K K N N 模型得修剪策略研究[J J ].小型微型计算机系统,201 1, , 5(5):

5- 849.[ [ 4] ] 李欢,焦建民.简化得粒子群优化快速

KNN 分类算法[J J ]。计算机工程与应用,2 008,4 4(3 2)):

57--5 5 9。

[ [5 5 ]王晓晔, , 王正欧.K -最近邻分类技术得改进算法[J J ]。电子与信息学报,2005,27 7(3):4 87 7 — 49 1.

[ 6 ] Gu o

Gongde, W ang Hui, Be ll

D D,e t al.U sin g K NN model for aut t o ma ti i c

tex t

ca t egori za a t ion [ J ]、Soft

putin g — A F u sion o f

F F oun dat i on, M e thodo lo gi es

and d

A pplicatio n,200 6, ,1 1 0(5):42 2 3--430.[ [7 7 ]余小鹏,周德翼。一种自适应k-最近邻算法得研究 [J].,计算机应用研究,2006(2): 7 70 0 -7 7 2。

附件 1:

源代码

KNN、m

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %

KNN、m

K-最近邻分类算法 % %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% A=x ls rea d('E : 上课\机器学习模式识别课件 数据\COR K_ STOPPEx RS、xls",2); f=zer os(150,5); f f(:, 1:2)=A(1 :150, 3:4); f1 =A(1 :50,3 :4); f2= A(51:100,3 :4);f3= A(101:15 0, 3:4);c cl s= zero s(1 50,10);o for

i= 1:150

for j =1:1 50

c ls(i,j)=norm(f(i,1:2)-f(j,1 :2));

end end % 对计算出得每个样本与其她 150 个样本(包括自己)得距离排序,选 K=10 arr ay= zeros(300,11); f or ii =1:150

[val ue,inde x]=sort(cl s(i i, :));

arra y(2 *ii— 1,:)=val ue(1: 11);

a rray(2 *ii, :)=in dex(1 :1 1); end 类 %对每个样本分类 fo r ii= 1:150

a11=length(f ind(array(2 *i i,:)〈50));

a12=l ength(f ind(arr ay(2*ii,:)〉50 &a rr ay(2*i i,:)〈100)); ;

a13=len gth(find(a rray(2 *ii,:)〉1 00 &array(2 *i i,:)<15)

0));

if(max(max(a11,a12),a13)==a11)

f(ii,3)=1;

else if(max(max(a11,a12),a1 3)==a12)

f(ii,3)=2;

els e

f(i i,3)=3 ;

end

en d

end % 错误计算 e rro r=ze ro s(3,5);for

i=1 :50

if(f(i,3)= =2)

error(1,2)= error(1,2)+1 ;

end

if(f(i,3)==3)

err or(1,3)= erro r(1,3)+1 ;

end

if(f(5 0+i,3)==1)

er ror(2,1)=erro r(2,1)+ 1;

end

if(f(5 0+i, 3)==3)

err or(2,3)=e rror(2,3)+1 ;

en d

if(f(100+ i,3)==1)

error(3,1)= erro r(3,1)+1;

end

i f(f(100+i, 3)== 2)

er ror(3,2)=er ro r(3,2)+ 1;

end

e nd for

k =1:3 %D 第四列表示错误数 err or(k,4)=err or(k,1)+err or(k,2)+e rro r(k,3);error(k,5)=err or(k,4)/50 ; en d

实验报告数据挖掘 篇2

扬州话是江淮官话的代表方言, 她的存在至少也有三、四百年的历史了。方言学上的“扬州话”一般指扬州城区及毗邻的双桥、城东等乡村的方言, 扬州四乡又称其为“街上话”。它曾经是明朝时期的官话, 至今还有很多古汉语词汇, 以及一些生动的、有意思的口头语。以扬州方言为载体的曲艺有扬州清曲、扬州评剧、扬剧等。这些曲艺已经被列入国家非物质文化遗产。而广义上的扬州话还包括邗江全境20多个乡镇以及仪征北部数乡镇的方言。地级扬州市所辖县的高邮、仪征、宝应等方言, 通常不将其看作扬州方言来研究。本次实验主要是调查扬州话单字字调的发音情况。

1.实验材料和过程

1.1实验目的

(1) 学会独立完成扬州方言单字调的实验研究, 熟悉整个实验的步骤, 运用相应的仪器和软件, 得到声调数据结果, 与传统方言数据进行比较。

(2) 用学习到的声调理论知识将实验数据进行分析讨论, 能够在实际的操作中掌握理论。

(3) 学会编制录音底本, 选取有效的调查字表, 合适的发音人。

(4) 自主完成使用Audition软件录制方言单字调的过程, 在不断调试后, 获取有效音频文档。

(5) 在前次实验的基础之上, 对自己完成的录音文档用Praat软件进行标注和提取数据, 对声调承载段问题有更深入的认识。

(6) 利用Excel表格得出的数据结果描绘出扬州方言声调格局图, 比对传统值和老师实验值的出入, 找出自己实验问题在哪里。

1.2实验准备

1.2.1调查点

(1) 调查点:江苏省扬州市维扬区

(2) 扬州市东经:119°26北纬度:32°24′

(3) 扬州市市区人口 (不算下级单位) :100万左右

(4) 扬州市民族和其人口:90%以上是汉族, 同时有少数各族人民。

(5) 扬州市少数民族语言:无

(6) 方言种类:江淮官话洪巢片扬州话

(7) 方言艺术:扬剧、扬州评话、扬州清曲

1.2.2发音人

(1) 姓名:滕惟茜 (2) 性别:女 (3) 民族:汉

(4) 出生年月:1965年6月 (5) 出生地:扬州市广陵区

(6) 主要经历:一直在扬州生活与工作

(7) 文化程度:高中 (8) 职业:会计

(9) 会说的话:扬州话、不标准普通话

(10) 现在主要说什么话:扬州话

(11) 父亲是哪里人:扬州人

(12) 母亲是哪里人:泰州黄桥人

1.2.3调查人

(1) 姓名:滕菲 (2) 性别:女

(3) 单位:南京师范大学文学院

1.2.4调查人

(1) 调查时间:2012年1月30号

(2) 调查地点:扬州市五台山医院特别检查室

(3) 背景噪音:较为安静, 但笔记本不插电源时本身有声音

1.2.5调查人

(1) 调查字表的确定过程

根据资料的查找, 确定了扬州方言共有五个调类, 分别是阴平、阳平、上声、去声和入声。

以方言声调采录底本为参照, 单字每个调类取12个字, 尽量避免送气音、多音字和在日常生活中不能单说的字。

让发音人检查字表, 检查有没有读音不准确的字, 进行剔除重选, 最终选定调查字表如下:

1.3录音

阴1平.3.1器材方阳案:平笔记本电脑上+声简易录音话去筒声入声

(1) 笔记本电脑:东芝 (M833) —1G内存、Window7系统

(2) 话筒:简易有底座的话筒

1.1.3.2准备工作

(1) 场所:较为安静的办公室, 关闭门窗, 关掉所有交流电源, 包括笔记本电脑的话筒。

(2) 话筒:使用时, 嘴巴不能正对话筒, 要与话筒成斜角, 保持固定的3~5cm, 防止“扑麦”和“爆音”。

(3) 提示和方式:事先和发音人明确“开始录音”和“停止录音”的手势。

(4) 试音:为了让录音人熟悉录音的过程和要求、测试录音效果, 在正式录音前, 让发音人试录部分调查单字调。

1.3.3录音软件

阴平本次调查运阳用平了老师推荐上声的Adobe Au去di声tion3.0版录入音声和音频处理软件。

点12.和34音986频484处43理软2.2件89。71356992.3136445782.34099310032.3738757367点22.345311.439.0483基本2.2录85音193参49数092.30340897892.34233435182.371964342点32.3334 (2616) 25声3道2:.2单81声530道94772.29721084672.3491326522.3722301751点42.3187 (026) 27采8样2.率2:9247411809508H5z2.29315093472.35675664042.3702818893点52.2984 (3632) 34分7辨2.率3:1416669位15082.28814919492.36595672.3681207176点62.2782 (4642) 64音2频2.格35式79:95W1i5n6d3ow2s.P28C3M30 (8*3.3w9a6v) 2.37394561482.3697722777点72.256411.816.033.75录2.音39过549程685412.27452097592.37464350852.3678108741点82.2399 (2410) 68选7择2“.4文07件66”36—55“2新建2.”26选811择37相56应的2.3参669数18和111保1存2文.36件87的688824点92.类21型608—911按14下红2.4色10按255钮032开5始2.录25音71, 882查996看背2.3景63噪780音83和81观2察.36录89音265855点102.人18发86音498后76的波2.4形14, 27及09时808进行2.调252整45。352432.36553438632.367250869

(2) 试音之后, 开始正式录音。按照讲好的手势开始, 因为字较多, 所以四个字一录, 避免发音人因喘气或呼气造成的失败。

(3) 录完之后, 按照声调类别进行归类, 用“混合型粘贴”将每个调类的字剪切在一起, 形成一个整的12个发音字的文件。

(4) 全部结束后进行试听, 查看背景噪音—选中一段无用的过渡段—“效果”—“修复”—“降噪器”, 选择相应的参数, FFT6000, 衰减12DB—“获取特性”—“确定”—再次进入降噪器—“波形全选”—“确定”—二次试听, 达到要求后, 分别保存在F盘的temp文件的五个调类文件中 (文件类型是

(5) 由于第一次操作不熟练, 在进行提取基频时, 发现音频的波形出现问题, 于是再次录音, 但这次的背景没有上次安静, 电平为-40DB———-42DB, 经过降噪之后 (12DB) , 为-52DB———-57DB, 听时仍会感到电脑电池运行的声音。

1.4提取基频和做声调格局图

1.4.1工具:

Praat音频处理软件。

1.4.2提取基频:

(1) 打开声音文件, 由于电脑运行速度慢, 没有将五个声音文件粘贴在一起, 而是分调类依次打开和修改基频。

(2) 选中声音文件Sound—Periodicity—Topitch在对话框中修改:女声:最小Pitchfloor (Hz) :75.0, 最大Pitchceiling (Hz) :600.0, 生成Pitch文件。打开Pitch, 发现呈现的声调再次范围之类, 就不需要再修改Periodicity。

(3) 选中Pitch—Edit进行调整, 去除野点, 补足空余段。首先选中一个声调, 记住其图形特征, 按in不断放大, 直到删除野点时能够不影响其他的声调段, 然后选中要删的点, 选Selection-Unvoice去除野点。而补足空余时, 只能在有数字显示的地方补。

(4) 做好之后, 选中Pitch中的Down to pitch tier, 生成pitch tier文件, 保存在C盘Temp文件夹中。

1.4.3标注文件:

(1) 选中Sund—Annotate—To TextGrid修改All tier name Mary John (说明标注有两层内容) , 下面的不改, 生成TextGrid。

(2) 将Sound和TextGrid关联起来, 点击Edit进行标注。

(3) 我选择的方法是先选中一个字的读音, 将其放大到能看清蓝线的每一点, 逐字进行标注。

标注第一层音节时, 选取用拼音表示, 因为标汉字时, 发现软件有不识别的情况。

标注时, 发现听感和图像显示有较大区别, 按图像说, 有蓝线的地方才应该有声, 但放大到一定限度时, 实际听到的超过蓝线范围, 尤其是遇到送气的辅音。笔者没有选择完全按照图像显示, 而是根据听感, 选择清晰地一段, 因为音节的标注对于最后数据处理没有影响。

标注第二层声调承载段时, 一开始用“主要元音及过渡段”法, 但是多次尝试之后发现, 听耳很难分辨出, 尤其是有韵尾或多音节的情况, 所以最终选择“韵母段”, 同时仍然处理了“弯头”、“降尾”。在标注时, 选择用数字1-7来表示声调, 奇数为阴调, 偶数为阳调, 分别为:阴平-1、阳平-2、上声-3、去声-5、入声-7。

说明:在标注入声时发现, “百”、“读”在蓝线后的一段上有较为清晰的声调出现, 如果不选, 声音显得无力 (后补录, 发现还是这样, 可能是发音人的问题) , 就将后面一段清晰地声音也算在范围之类, 可能对数据有影响。最终T值里, 入声的值有几个基频点不到4, 其余的在4-5之间, 但都偏向4, 就将入值归为4, 与传统值和刘利李老师的实验值5不同。

标注完成之后, 保存文件。

1.4.4提取基频值:

点击Control-Open Praat Script选择脚本:提取音节或声韵母的音高数据, 运行Run将标注层数设为2, 将每个样本提取的数据数设为10。

1.4.5用Excel表格进行数据分析和做声调格局图:

(1) 新建Excel表格, 导入外部数据, 数据为来自C盘temp文件夹中的Pitch (txt) 文档。

(2) 复制数据到Sheet2, 整理数据, 标注顺序排序, 留下标注内容、时长和各基频点值。

(average) 和对数值 (log10) 和标准差 (stdev) 。

(4) 利用Excel表的“公式”, 选取所有对数值中得最大值和最小值阴 (平设最大值刚为、a专, 、尊最、丁小、边值、安为、b开, 、粗对、昏数、商值、三变、飞量为x) 。

(5) 根阳平据公式T=穷 (、l床gx、才-l、g平b、) 寒, 、鹅计、娘算、人出、龙相、难应、麻的、云五度值, 并保

上声纸、l走ga、短-l、g草b、好、受、五、女、老、武、买、有阴平刚、专、尊、丁、边、安、开、粗、昏、商、三、飞

留两位小去数声。帐、正、对、汉、送、放、大、数、饭、岸、漏、用

阳平穷、床、才、平、寒、鹅、娘、人、龙、难、麻、云

(6) 将入声计算出来曲的、出五、突度、各值、桌绘、百制、尺成、拍折、药线、杂图、读, 、修舌改刻度。

上声纸、走、短、草、好、受、五、女、老、武、买、有

要检查数据是否合格, 就要算出基频点的标准差, 单字调<或=25时, 说明数据是可靠的。在本次试验中, 所有数据只有阴平的点9为25.96和点10的标准差为28.88, 其余都合格。

点1-0121

2.1.1.1与已有实验值相比

(1) 阴平和上声的调值完全一样。

(2) 阳平都显示为升调, 上升的幅度大致相同, 但此实验值略高于已有的实验值。

(3) 去声和入声都是高平调, 但此实验值略低。

(4) 相比较, 二次实验值虽有具体数据的不同, 但显示的调型和声拱特征是一样, 此次实验的数据具有可采纳性。

2.1.1.2与传统值 (听感描写) 的相比

对于扬州方言单字调的研究成果, 主要记录在《江苏省志·方言志》与《扬州方言词典中》, 也就是所列出的传统值。实验结果与听感描写基本一致, 但也存在差异:

(1) 阴平的实验结果是41, 但听感描写分别是21和11, 存在较大差异。实验值41是一个全降调, 传统值21也是降调, 数据的不同可能与发音人有关, 同时听觉毕竟只是一个大概感知, 与数据计算会有一定的差别。但另一传统值11, 就完全不同, 这是个低平调, 而不是降调, 可能作为本地人听本地音, 又受到普通话阴平55值的影响, 觉得扬州方言的阴平发音与之相似, 只是低了个调。但两次实验值和传统值1都

认为是降调, 只是调域不同, 那11这个值就有待斟酌。

(2) 阳平的描写较为一致, 都是一个升幅不大的声调实验值与传统值分别是35、24和34、35, 没有多大出入。

(3) 上声的实验值是32, 传统值是42, 只是调域起点的不一样, 都是一个中降调, 结果基本一致。

(4) 去声的已有实验值和传统听感值都是55, 一个高平调。本次实验结果是44, 也是一个高平调, 但发音较低, 可能与发音人本身有关, 但并不与55值冲突。

(5) 入声已有实验值是5, 本次实验和传统值是4, 都是短促的高平调, 同时听感上都能感到短促的收缩。

综上, 实验的结果与听感描写是相一致的, 不同大多是具体数值的差异, 调类、调型也是相同的。可见实验的手段是对传统语音学“口说耳辩”的补充, 利于更加细致的比较研究。

2.1.1.3声调的声学空间

“每一种声调语言或者方言, 都具有一个特定的声调格局。声调格局是由该语言或方言中全部单字调所构成的格局, 是各种声调变化的基础形式。而每一种声调在声调格局中不仅是一条曲线, 而且是一条的带状的声学空间。可以采用带状的包络线来表示声调调位的声学空间。只要一条声调曲线位于这个声学空间中, 就符合这个声调的特征, 就不会为其他的声调。”虽然两次实验值有数据差异, 与传统值也有差别, 但从声调的声学空间来看, 是在范围之内, 也反过来证明了声学空间的存在。

2.2声调承载段讨论

声调承载段的认识发端于声调与音段的认识关系。中国语音学界主要有三说:1.音节说:声调由整个音节承载;2.带音说声调由音节的带音部分承载, 包括带音声母;3.韵母说:声调附着于音节的韵母之上。1995-1996林茂灿的讲话提出“主要元音及过渡段”是声调的承载段。从语图和“弯头”、“降尾”来看, 这种说法更为准确, 但实际操作困难。到底哪里是主要元音, 切分不易, 所以本次实验采取了“韵母段”的做法。在实际操作中, 听感与语图会有差异, 本人将窄带语图不断放大, 但有时还是很难分清, 采取了往韵母段靠的方法, 保证承载段的稳定性。最后结合语图, 处理“弯头”和“降尾”。

原始数据表格:

去声220.44222.98220.93221.10222.32218.86218.15219.44219.70219.92

参考文献

[1]宋益丹.南京方言声调实验研究, 2006.

[2]丁琳.姜堰方言声调实验研究, 2005.

[3]刘利李.江淮方言声调实验研究和折度分析[M].巴蜀书社, 2007.

[4]石峰.语音格局——语音学与音系学的交汇点[M].商务印书馆, 2008.

[5]南开大学语言研究所.语音学实验研究报告写作规范 (草案) [J].南开语言学刊, 2009 (1) .

[6]刘俐李.汉语声调的曲拱特征和降势音高[J].中国语文, 2005 (3) .

实验报告数据挖掘 篇3

关键词:实验;提高;能力

中图分类号:O6—3

一、通过研究分析课本上的某個典型实验,掌握这类实验规律

根据现行教材课本实验内容,可归纳为以下几种类型。物质(固、液、气)的制取实验;理论和定律的证明实验;物质的性质和物质之间的相互关系的实验;定量研究方面的实验。

二、通过教学指导学生准确的选择仪器并会规范的使用仪器。

中学化学实验中常用到下面八种仪器,现将他们的用途及使用方法总结如下1、试管

主要用途:①盛放少量固体或液体;②收集少量气体或验纯;③在常温或加热时,用作少量物质的反应容器;④用作少量气体的发生容器。使用方法:①可直接加热,先均匀加热,再集中在药品部位加热;②给液体加热时液体体积不得超过试管容积的1/3;③使用时试管应干燥,加热液体时试管口不要朝着别人或自己,试管倾斜与桌面成45°角;④加热固体时,试管口略向下倾斜;⑤使用试管夹夹持,夹在试管中上部,加热后不能骤冷,也不能立即放回塑料试管架上。

2、烧杯

主要用途:①用作常温或加热时较多量的液体物质的反应容器;②溶解物质或配制溶液。使用方法:①加热时要垫石棉网,液体体积不超过容积的2/3,加热前外壁应擦干,不能用于固体加热;②进行反应时液体体积不得超过容积的1/3;③配置溶液时,要用玻璃棒轻轻搅拌。

3、酒精灯

主要用途:用于加热物质。使用方法:①灯内酒精的量不可超过容积的2/3,不少于容积的1/4;②灯芯松紧适宜,不能烧焦且应剪平;③不准用燃着的酒精灯引燃另一酒精灯;④不准用嘴吹灭(用灯帽盖灭);⑤不可向燃着的酒精灯内添加酒精;⑥不用时必须盖上灯帽;⑦调节灯焰大小时应熄灭酒精灯;⑧应用外焰加热。

4、量筒

主要用途:量取液体体积(精确到0.1mL,无零刻度).使用方法:①量筒要放平,视线要与凹液面的最低处保持水平(三点一线);②不可加热、不可量取热溶液,不可用于配制溶液不可作反应容器;③应根据所取液体量选取量程合适的量筒。

5、托盘天平

主要用途:称量固体药品(精确到0.1g).使用方法:①称量前检查游码是否在零刻度,天平是否平衡,右偏重向左调,左偏重向右调;②称量时,左物右码,放砝码时,先大后小;③托盘各放一大小相同的纸片称量固体,有腐蚀性、易潮解物应放在玻璃器皿中称量;④用镊子夹取砝码,用后放回砝码盒,游码移回零处。

6、胶头滴管(滴瓶)

主要用途:①取用或滴加少量液体;②滴瓶用于盛放液体药品。使用方法:①取液时先将胶头中的空气挤出,再用滴管取液,不可反复挤压胶头②滴加时应让滴管悬空,位于容器口正上方,不可伸入容器内或接触容器壁;③不能吸液过多,用后不可平放或倒置;④取液之后立即清洗,不可一管多用;⑤滴瓶上的滴管用后不必清洗,但要立即放回原瓶。

7、蒸发皿

主要用途:①蒸发和浓缩结晶液体;②用作较大量固体的加热。使用方法:①可直接加热;②均匀加热,切勿骤冷;③加热结束,用坩埚钳夹持移开。④加热后的蒸发皿不能直接放在试验台上。

8、漏斗(长颈漏斗)

主要用途:①制作过滤器;②向小口容器倾倒液体;③长颈漏斗在气体发生装置中用于注入液体药品。使用方法:①不可向其中倾倒热的液体;②长颈漏斗下端要没入液面以下。

三、通过课本实验的教学教会学生设计验方案

实验设计是根据实验试题的要求,由学生自己设计实验方案,选择实验器材、药品、确定实验步骤、分析实验结果的过程。在整个设计过程中,要认真审题,明确实验目的,结合已知条件,将基本知识、技能灵活应用。

设计性实验主要有以下三种形式:

①在演示实验或学生实验的基础上加以改装,并在条件或器材上加以限制。

②给定实验器材,要求根据所学知识自行设计实验方案和过程以完成实验。

③只提实验目的,要求自行选择实验器材,安排实验步骤,设计实验数据处理方法以及分析实验误差。

设计性实验看似新颖,变化多端,但根本依据就是在中学阶段学过的实验原理和方法。在解答设计性实验题时,一是要注意与我们学过的实验联系起来,尤其是注意学过的实验原理和方法。二是应注意几个设计原则:

①科学性原则。方案所依据的原理要符合基本规律,并能通过实验现象揭露其本质,达到测量、研究和探索的目的。

②安全性原则。实验设计时应避免使用有毒药品和进行具有一定危险性的实验操作。

③可行性原则。实验设计应切实可行,所选用的化学药品、仪器、设备和方法等在中学现有的实验条件下能够得到满足。

④简约性原则。实验设计应尽可能简单易行,应采用简单的实验装置,用较少的实验步骤和实验药品,并能在较短的时间内完成实验。

四、培养学生书写实验报告的能力

写实验报告是实验的重要组成部分,是分析问题解决问题的过程,也是综合运用知识的过程。我们从第一节化学课开始,就注意培养学生写实验报告的能力,其具体做法是:

1、在演示实验中注意培养学生观察现象的能力

为培养学生观察现象的能力,我们对现行化学教材中所讲到的现象进行归纳、综合。有光、热、声、态(状态)、颜色、气味、溶解、沉淀、液化、燃烧等等。在每次演示实验或学生实验中,总是要求学生根据实验内容中有无新物质的生成和上述现象内容来观察,并将观察的结果记录好,认真分析,去伪存真,填写于实验报告中。这样要求学生,不仅使学生知道在实验中要观察些什么,使学生对知识获得比较完整的概念,而且也不会漏掉某些重要的实验现象,以致得不到正确结论。

2、采取具体措施,培养学生书写实验报告的能力

为培养学生写好实验报告,从学生的实际出发,让学生在演示实验的过程中,实事求是地认真观察、分析,并记录于表的空格中,经过几次填写,学生就能比较正确、熟练地对实验进行观察记录,做出解释和结论。培养了学生书写实验报告的能力。

3、培养学生绘制装置图的能力

数据结构实验报告 篇4

电子文档命名为“学号+姓名”,如:E01214058宋思怡

《数据结构》实验报告

(一)学号:姓名:专业年级:

实验名称:线性表

实验日期:2014年4月14日

实验目的:

1、熟悉线性表的定义及其顺序和链式存储结构;

2、熟练掌握线性表在顺序存储结构上实现基本操作的方法;

3、熟练掌握在各种链表结构中实现线性表基本操作的方法;

4、掌握用 C/C++语言调试程序的基本方法。

实验内容:

一、编写程序实现顺序表的各种基本运算,并在此基础上设计一个主程序完成如下功能:

(1)初始化顺序表L;

(2)依次在L尾部插入元素-1,21,13,24,8;

(3)输出顺序表L;

(4)输出顺序表L长度;

(5)判断顺序表L是否为空;

(6)输出顺序表L的第3个元素;

(7)输出元素24的位置;

(8)在L的第4个元素前插入元素0;

(9)输出顺序表L;

(10)删除L的第5个元素;

(11)输出顺序表L。

源代码

调试分析(给出运行结果界面)

二、编写程序实现单链表的各种基本运算,并在此基础上设计一个主程序完成如下功能:

„„„„

„„„„

小结或讨论:

(1)实验中遇到的问题和解决方法

(2)实验中没有解决的问题

数据库实验报告, 篇5

实验一、数据定义及更新语句练习一、实验内容

建立如下 mySPJ 数据库,包括S,P,J,与 SPJ 四个基本表(《数据库系统概论》第二章习题 5 中得四个表),要求实现关系得三类完整性. S(SNO,SNAME,STATUS,CITY); P(PNO,PNAME,COLOR,WEIGHT); J(JNO,JNAME,CITY);SPJ(SNO,PNO,JNO,QTY); 二、完成情况

附上按照实验内容编写得程序代码。

(小四号字,宋体)三、实验结果1、插入一条记录

2、

①将 p 表中得所有红色零件得重量增加 5.②将 spj 表中所有天津供应商得 QTY 属性值减少 10。用子查询。

3、利用Delete 语句删除 p 表中得所有红色零件得记录。

附上各个步骤所用得实验用例与结果显示(小四号字,宋体)

四、问题与解决

(小四号字 , 宋体)1

.实验中遇到得问题及解决过程

.实验中产生得错误及原因分析

首先写出执行语句不成功得时候系统报告得错误信息。然后分析错误原因 , 并给出解决办法。

实验二 简单查询与连接查询 一、实验内容

(一)完成下面得简单查询:

①查询所有“天津”得供应商明细;②查询所有“红色"得 14 公斤以上得零件。

③查询工程名称中含有“厂”字得工程明细。

(二)完成下面得连接查询: ①等值连接:求 s 表与 j 表得相同城市得等值连接。

②自然连接:查询所有得供应明细,要求显示供应商、零件与工程得名称,并按照供应、工程、零件排序。

③笛卡尔积:求 s 与p表得笛卡尔积.④左连接:求 j 表与 spj 表得左连接。

⑤右连接:求spj 表与j表得右连接。

二、完成情况

(一)完成下面得简单查询:

①查询所有“天津”得供应商明细;

②查询所有“红色“得 14 公斤以上得零件。

③查询工程名称中含有“厂”字得工程明细。

(二)完成下面得连接查询:

①等值连接:求 s 表与 j 表得相同城市得等值连接.②自然连接:查询所有得供应明细,要求显示供应商、零件与工程得名称,并按照供应、工程、零件排序。

③笛卡尔积:求 s 与 p 表得笛卡尔积。

④左连接:求 j 表与 spj 表得左连接。

⑤右连接:求 spj表与 j 表得右连接。

附上按照实验内容编写得程序代码。

(小四号字 , 宋体)三、实验结果

附上各个步骤所用得实验用例与结果显示(小四号字,宋体)

四、问题与解决

(小四号字 , 宋体)1

。实验中遇到得问题及解决过程

2。实验中产生得错误及原因分析

首先写出执行语句不成功得时候系统报告得错误信息。然后分析错误原因 , 并给出解决办法。

实验三 分组查询与嵌套查询 一、实验内容

(一)分组查询: 1、求各种颜色零件得平均重量。

2、求北京供应商与天津供应商得总个数。

3、求各供应商供应得零件总数。

4、求各供应商供应给各工程得零件总数。

5、求使用了 100个以上 P1 零件得工程名称。

6、求各工程使用得各城市供应得零件总数.

(二)嵌套查询:

1、in 连接谓词查询: ① 查询没有使用天津供应商供应得红色零件得工程名称。

② 查询供应了 1000 个以上零件得供应商名称。(having)2、比较运算符:求重量大于所有零件平均重量得零件名称。

3、Exists 连接谓词: ① 查询供应 J1 得所有得零件都就是红色得供应商名称. ② 至少用了供应商S1 所供应得全部零件得工程号 JNO. 二、完成情况

(一)分组查询:

1、求各种颜色零件得平均重量.

2、求北京供应商与天津供应商得总个数。

3、求各供应商供应得零件总数。

4、求各供应商供应给各工程得零件总数。

5、求使用了100 个以上 P1 零件得工程名称。

6、求各工程使用得各城市供应得零件总数。

(二)嵌套查询:

1、in 连接谓词查询: ① 查询没有使用天津供应商供应得红色零件得工程名称。

② 查询供应了 1000 个以上零件得供应商名称。(having)

SELECT SNAME FROM S WHERE SNO IN(SELECT SNO FROM SPJ GROUP BY SNO

HAVING SUM(QTY)〉=1000)

2、比较运算符:求重量大于所有零件平均重量得零件名称.

3、Exists连接谓词: ① 查询供应 J1 得所有得零件都就是红色得供应商名称。

② 至少用了供应商 S1 所供应得全部零件得工程号 JNO.附上按照实验内容编写得程序代码。

(小四号字 , 宋体)三、实验结果

附上各个步骤所用得实验用例与结果显示(小四号字,宋体)四、问题与解决

1、在选择数据类型时,没有选择正确得数据类型,导致含有 SUM 得语句不能执行。

(小四号字 , 宋体)1

。实验中遇到得问题及解决过程

2.实验中产生得错误及原因分析

首先写出执行语句不成功得时候系统报告得错误信息。然后分析错误原因 , 并给出解决办法。

实验成绩

评价项目 评分等级 独立完成完整得实验内容,结果完全正确,报告内容完整,排版整洁美观,能真实体现实际操作过程及遇到得问题。

A 完成实验,实验内容较为完整,结果正确,报告内容较为完整,排版较为整洁美观,能体现实际操作过程及遇到得问题。

B B 基本完成实验,结果正确,报告内容欠缺,排版较为整洁美观,能体现实际操作过程及遇到得问题。

C C 不能独立完成完整得实验内容,结果不真实,报告内容欠缺,排版欠整洁美观,不能体现实际操作过程及遇到得问题。

数据结构实验报告 篇6

篇一:数据结构实验报告范例

《数据结构与算法》实验报告

专业 班级 姓名 学号

实验项目

实验一 二叉树的应用

实验目的

1、进一步掌握指针变量的含义及应用。

2、掌握二叉树的结构特征,以及各种存储结构的`特点及使用范围。

3、掌握用指针类型描述、访问和处理二叉树的运算。

实验内容

题目1:编写一个程序,采用一棵二叉树表示一个家谱关系。要求程序具有如下功能:

(1)用括号表示法输出家谱二叉树,

(2)查找某人的所有儿子,

(3)查找某人的所有祖先。

算法设计分析

(一)数据结构的定义

为了能够用二叉树表示配偶、子女、兄弟三种关系,特采用以下存储关系,则能在二叉树上实现家谱的各项运算。

二叉树型存储结构定义为:

typedef struct SNODE

{char name[MAX]; //人名

struct SNODE *left;//指向配偶结点

struct SNODE *right; //指向兄弟或子女结点

}FNODE;

(二)总体设计

实验由主函数、家谱建立函数、家谱输出函数、儿子查找函数、祖先查找函数、结点定位函数、选择界面函数七个函数共同组成。其功能描述如下:

(1)主函数:统筹调用各个函数以实现相应功能

void main()

(2)家谱建立函数:与用户交互建立家族成员对应关系

void InitialFamily(FNODE *&head) //家谱建立函数

(3)家谱输出函数:用括号表示法输出家谱

输出形式为:父和母(子1和子妻1(孙1),子2和子妻2(孙2))

void PrintFamily(FNODE *head) //家谱输出函数

(4)儿子查找函数:在家谱中查找到某人所有的子女并输出,同时也能辨别出其是否为家族成员与是否有子女

void FindSon(FNODE *b,char p[]) //儿子查找函数

(5)祖先查找函数:在家谱中查找到某人所有的祖先并输出,同时也能辨别出其是否为家族中成员。

int FindAncestor(FNODE *head,char son[ ]) //祖先查找函数

(6)结点定位函数:在家谱中找到用户输入人名所对应的结点。

FNODE *findnode(FNODE *b,char p[]) //结点定位函数

(7)选择界面函数:为便于编写程序,将用户选择部分独立为此函数。

void PRINT(int &n)

(三)各函数的详细设计:

void InitialFamily(FNODE *&head) //家谱建立函数

1:首先建立当前人的信息,将其左右结点置为空,

2:然后让用户确定其是否有配偶,如果没有配偶,则当前程序结束,

3:如果有则建立其配偶信息,并将配偶结点赋给当前人的左结点;

4:再让用户确定其是否有子女,如果有则递归调用家谱建立函数建立子女结点,并将其赋给配偶结点的下一个右结点。

5:如无,则程序结束

void PrintFamily(FNODE *head) //家谱输出函数

1:首先判断当前结点是否为空,如果为空则结束程序;

2:如果不为空,则输出当前结点信息,

3:然后判断其左结点(配偶结点)是否为空,如不为空则输出“和配偶信息。

4:再判断配偶结点的右结点是否为空,如不为空则递归调用输出其子女信息,最后输出“)”;

5:当配偶结点为空时,则判断其右结点(兄弟结点)是否为空

6:如果不为空,则输出“,”,并递归调用输出兄弟信息

7程序结束

FNODE *findnode(FNODE *b,char p[]) //结点定位函数

1:当前结点是否为空,为空则返回空;

2:如果和查找信息相同,则返回当前结点;

3:如不然,则先后递归访问其左结点,再不是则递归访问右结点

void FindSon(FNODE *b,char p[]) //儿子查找函数

1:在家谱中定位到要查找的结点,如无则输出“查找不到此人”

2:判断其配偶结点与子女结点是否为空,为空则输出“无子女”

3:不为空则输出其配偶结点的所有右结点(子女结点)。

int FindAncestor(FNODE *head,char son[ ]) //祖先查找函数

1:先在家谱中定位到要查找的结点,如为空输出“不存在此人”,程序结束

2:先将父母结点入栈,当栈为空时程序结束,

3:栈不为空时,判断栈顶元素是否已访问过,

4:访问过,再判断是否为查找结点,如是则输出栈中保存的其祖先结点,并滤过其兄弟结点不输出;不是查找结点,则退栈一个元素

5:未访问过,则取当前栈顶元素,置访问标志——1,同时取其右结点

6:栈不为空或当前所取结点不为空时,转到2;

实验测试结果及结果分析

(一)测试结果

(二)结果分析

(略)

实验总结

基于ExcelXP优化实验数据 篇7

在处理物理实验数据过程中,使用Excel收集数据、分析数据,利用计算机强大的计算功能,快速有效地得到其结果。不仅克服了手工计算耗时易错的缺点,而且有利于科学素质和理论联系实际的思考能力的培养,对培养有深厚基础的创新性人才有深远影响。

本文以处理测量摆的周期认识偶然误差的统计规律的实验数据为例,说明Microsoft Excel在物理实验数据处理中的使用方法和表现出的优越性。

1 数据处理实例

1.1 创建电子表格,输入原始数据

由于Excel XP以表格组织数据,所以须根据物理量的内在联系,创建单表头的“原始数据”表,录入测量数值,(见表1),为数据处理做好准备。

在数据输入过程中,采用Excel XP的预警机制,提高输入数据的准确性。

1)由于测量到的周期在一个小的范围内,可用“数据”菜单中的“有效性”命令设定相应范围。在输入范围外的数据时提出警示。

2)调用“文本到语音”工具栏,选中数据区域,点击“朗读单元格”按纽,与原始实验记录数据核对,杜绝手工输入可能引起的错误。

3)锁定原始数据,使数据呈不可编辑状态,避免误操作。

1.2 调用Excel XP内置函数,快速准确获得统计值

1.2.1 求平均值与标准偏差

1)在新的工作表中建立“标准统计”数据表,设定待求次序段(见表2)。

2)明确平均值与标准偏差与原始数据的函数关系:

求平均值公式:;求标准偏差公式:。

3)调用内置函数,在编辑栏中输入相应的表达式:

(1)选中单元格C4,在编辑栏中输入“=AVERAGE(原始数据!C3:C12)”,引用原始数据表中的数据求出前十个数据的平均值。使用“填充柄”,通过拖拉方法完成公式复制,避免二次输入过程,快速得到其余次序段的平均值。

(2)选中在单元格D4,在编辑栏中输入“=SQRT(DEVSQ(此函数返回各数据点与均值点之差(数据偏差)的平方和)。(原始数据!C3:C12)/9)”,逐次在D5~D14的编辑栏中复制公式并做相应修改,尽量减小手工输入,快速计算出所有标准偏差。

1.2.2 求格罗布斯判据

通过调用函数LN(number),计算出格罗布斯判据系数Gn=LN(105-3)/2.3+1.36-105/550,代入格罗判据公式:验证数据有效性。

在标准的电子数据表格中,通过调用内置函数,随时可以从原始数据中提取出相关数据,快速准确的分析计算出待求物理量,一个复杂的计算过程,在鼠标的点击、拖放过程中实现。

1.3 借助Excel XP图表功能,凸现数据统计规律

1.3.1 描绘平均值变化趋势图

1)在Excel XP的常用“工具栏”上,点击“图表向导”按纽,

2)选择“XY散点图”中的“折线散点图”,点击“下一步”,

3)在“数据区域”中选择“标准统计!$B$3:$C$14”,在系列选项中按列产生,点击“下一步”,

4)设置“标题”、“坐标轴”,“网格线”、“图例”、“数据标志”等选项卡中的相关项,

5)点击“完成”,得到期望的图表。(见图1)

1.3.2 进行分区统计

通过调用函数MIN(原始数据!C3:C107)求出所有数据的最小值,调用MAX(原始数据!C3:C107)求出所有数据的最大值,调用函数COUNTIF(range,criteria)计算出给定区间的数据数目,例如在编辑栏中输入(或通过“插入”“函数”实现)“=COUNTIF(原始数据!C3:C107,"<1.9808")-COUNTIF(原始数据!C3:C107,"<1.9609")”可以统计出介于1.9609~1.9808数据个数,计算出频率及频率和区间宽度的比值。(计算结果见表3:分区统计表)最后据此画出统计直方图。(见图2)

用电子图表代替了传统的坐标纸,简洁明了的传达出平均值随测量次数的增加波动幅度变小的现象,形象的说明了偶然误差和测量次数间的关系及测量数据的分布情况。

在物理实验数据处理过程中,可以借助图形的突出趋势、明确比例、夸张比较等丰富的表现力,明晰数据间的隐含关系;利用图形的可视效果,引发学生的形象思维,使数据分析工作在逻辑和形象思维间得到互补。

2 结束语

随着科技的发展,信息革命将使人类从繁杂的形式化脑力劳动中解放出来,使用计算机可以准确高效地处理各类数据。物理实验必须与现代科学技术接轨,才能激发学生的学习积极性与热情,也才能使现代科技进步的成果渗透到传统的经典课程内容之中。

摘要:该文通过介绍用Excel XP优化处理物理实验数据的过程,说明Excel XP在处理数据中的使用规范,并体验它在处理实验数据中的优越性。

关键词:数据处理,Excel,平均值,标准偏差,统计规律

参考文献

[1]微软公司Microsoft Excel2002标准教程(教师手册)[M].北京:中国劳动社会保障出版社,2002.

实验数据的处理与分析 篇8

1. 实验数据筛选与处理

对实验数据筛选的一般方法和思路为“五看”:

一看数据是否符合测量仪器的精度特点,如托盘天平测得的质量的精度为0.1 g,若精度值超过了这个范围,说明所得数据是无效的;

二看数据是否在误差允许范围内,若所得的数据明显超出误差允许范围,要舍去;

三看反应是否完全,是否是过量反应物作用下所得的数据,只有完全反应时所得的数据,才能进行有效处理和应用;

四看所得数据的测试环境是否一致,特别是气体体积数据,只有在温度、压强一致的情况下才能进行比较、运算;

五看数据测量过程是否规范、合理,错误和违反测量规则的数据需要舍去。

例1 对硝基甲苯是医药、染料等工业的一种重要有机中间体,它常以浓硝酸为硝化剂,浓硫酸为催化剂,通过甲苯的硝化反应制备。

[CH3] [CH3] [CH3] [CH3][NO2][NO2][NO2] [+][+][硝化]

一种新的制备对硝基甲苯的实验方法是:以发烟硝酸为硝化剂,固体NaHSO4为催化剂(可循环使用),在CCl4溶液中加入乙酸酐(有脱水作用), 45℃时反应1 h。反应结束后,过滤,滤液分别用5%NaHCO3溶液、水洗至中性,再经分离提纯得到对硝基甲苯。

(1)上述实验中过滤的目的是 。

(2)滤液在分液漏斗中洗涤静置后,有机层处于 层(填“上”或“下”),放液时,若发现液体流不下来,其可能原因除分液漏斗活塞堵塞外,还有 。

(3)下表给出了催化剂种类及用量对甲苯硝化反应影响的实验结果。

[催

&]

①NaHSO4催化制备对硝基甲苯时,催化剂与甲苯的最佳物质的量之比为 ;

②与浓硫酸催化甲苯硝化相比,NaHSO4催化甲苯硝化的优点有 。

解析 本题主要考查的是物质的性质和制备,同时考查了数据的处理与分析能力,能够迅速在表中提取到有用信息,利用信息解决有关问题。(1)NaHSO4在该反应中作为催化剂,因此反应后过滤的目的是为了回收NaHSO4。(2)该反应是以CCl4作为有机溶剂,CCl4的密度比水大,故有机层在下层;分液漏斗里的液体放不下来,除了分液漏斗堵塞,还有可能是分液漏斗上口活塞未打开。(3)①从题给数据分析,当催化剂与甲苯的比例为0.32时,总产率最高且对硝基甲苯的含量最高;②用NaHSO4作催化剂的优点是在硝化物中对硝基甲苯的比例提高,同时催化剂用量少且能循环使用。

答案 (1)回收NaHSO4 (2)下 分液漏斗上口塞子未打开 (3)①0.32 ②在硝化产物中对硝基甲苯比例提高 催化剂用量少且能循环使用

2. 实验数据综合分析

如何用好、选好数据,是解决这类试题的关键所在。解决这类试题的一般方法为:比较数据,转变物质,分析利弊,确定方案。

a. 对数据进行比较是解决问题的突破口,注意比较数据的交点与重合区。

b. 转变物质则是实现实验目标的重要途径,在一些物质提纯与制备的问题中,往往会提供一些物质沉淀的pH范围、物质的沸点、密度、溶解性等呈现物质的物理性质的数据。在许多情况下,一些物质的相关数据是重叠的,且不利于问题的解决,一般可通过转变物质来解决(如CH3COOH与CH3CH2OH的沸点很接近,要分离两者的混合物,可以通过将CH3COOH转变为CH3COONa的方法,扩大其与CH3CH2OH沸点上的差异,然后通过蒸馏的方法进行分离)。

c. 在实际生产、生活中,除了涉及是否能够通过相应反应来实现实验目标外,还涉及经济效益的问题,在原理、环保等没有大的差异时,选择廉价原料完成相应的实验就成为首选。

例2 “卤块”的主要成分为MgCl2(含Fe2+、Fe3+、Mn2+等杂质离子),若以它为原料,按如下工艺流程图,即可制得“轻质氧化镁”。如果要求产品尽量不含杂质离子,而且成本较低,流程中所用试剂或pH控制可参考附表确定。

[物质&开始沉淀&沉淀完全&Fe(OH)3&2.7&3.7&Fe(OH)2&7.6&9.6&Mn(OH)2&8.3&9.8&Mg(OH)2&9.6&11.1&]

注:Fe2+氢氧化物呈絮状,不易从溶液中除去,所以常将它氧化成为Fe3+,生成Fe(OH)3沉淀而去除之。请填写以下空白:

(1)在步骤②加入试剂X,最佳选择应是 ,其作用是 ;

(2)在步骤③加入的试剂Y应是 ,之所以要控制pH=9.8,其目的是 ;

(3)在步骤⑤时发生的化学反应方程式是 。

解析 从表1可以看出,加入烧碱控制pH=9.8时,即可除去Fe2+、Fe3+、Mn2+,此时Mg2+也会因生成部分Mg(OH)2而进入沉淀中,但因卤块价格低,损失不大,这样做可以保证产品的纯度。将Fe2+氧化成Fe3+,可采用漂白液或H2O2,从价格上看,前者比后者便宜得多,故应选漂白液。

氯化镁制成氧化镁有两条路线:

烧碱路线:MgCl2[+NaOH]Mg(OH)2[灼烧]MgO

纯碱路线:MgCl2[+Na2CO3]MgCO3[灼烧]MgO

烧碱路线不可取,因为烧碱比纯碱的价格高,生成的中间产物Mg(OH)2是胶状沉淀,会造成过滤困难。纯碱价格低,生成的中间产物MgCO3呈粗颗粒状,易过滤,它在水中经一定时间加热后会有一部分水解,生成CO2。CO2的产生可使沉淀变得疏松,灼烧沉淀后可得到轻质MgO。

答案 (1)漂白液 将Fe2+氧化成Fe3+

(2)NaOH 将除Mg2+以外的各种杂质金属离子都生成相应的氢氧化物沉淀,以便过滤除去

(3)MgCO3+H2O[煮沸]Mg(OH)2↓+CO2↑

上一篇:从什么时候开始放寒假下一篇:惠普笔试题目