信效度分析

2024-08-04

信效度分析(共9篇)

信效度分析 篇1

1 研究的前期准备

1.1 研究对象

本研究的样本来自江西科技学院2012级的141名非英语专业高职生。

1.2 研究工具

本研究采用的工具是里克特量表, 选项分为“非常不同意”、“不同意”、“不确定”、“同意”、“非常同意”5种, 分别以5、4、3、2、1计分。问卷包含三个维度:学习态度、学习方法、学习动机。其项目个数分别是13、10、10。

量表在编制过程中, 笔者采用的是逐步排除法:首先去掉极端试题, 然后排除明显与其它项目不在同一类别的项目【2】。

1.3 数据收集以及分析

笔者于上课的第一周, 组织被试匿名进行作答, 用时20分钟。本次研究共发出200份问卷, 收回141份有效问卷, 回收率达到84%以上。作者将问卷的数据输入电脑后, 用spss17.0数据统计软件进行了区分度和信效度检测分析。

2 研究过程

1) 问卷的效度检测

本研究首先采用因子分析来建立结构效度佳的问卷。所谓结构效度, 秦晓晴【3】告诉我们结构效度的确定是由每一结构对观测现象的整个方差的贡献来决定的。如果结构解释的方差越大, 则说明问卷的效度就高。比如本文设计的问卷, 其中的若干个项目代表英语学习的三个结构, 如果结构可以解释大部分“学习态度”的方差, 说明结构佳。而因子分析的目标是将众多的原始变量浓缩成少数几个因子, 这些因子代表了数据的基本结构。该文在研究的过程中预计首先采取的是没有限定抽取因素法, 系统萃取的是特征值大于1的因素。

因子分析的过程中, 首先检测的是KMO值, 其值为0.787。依照Kaiser的观点, 因素分析的适合性为良好。巴特利特球形检验近似方差达到1719.794, 说明数据适合进行因子分析。

作者采用的第一个方法是不限定因素抽取法。结果显示出转抽后的8个共同因素平方和负荷量, 它们的特征值分别是8.213、2.741、2.344、1.947、1.570、1.386、1.238、1.139。联合解释变异量是62.359%。作者打算萃取因素, 预想先删除因素八, 所包含的题项是:第15和16这两道题。按道理应当删除以上题项, 但是若是一次性删除许多题项, 在进行因素分析程序的时候, 可能会丧失很多有用的信息, 因而采取逐题删除法。最终萃取后, 只留下三个因素, 联合解释变异量是50.598%, 保留的因素相当理想, 建构效度良好。

第二个方法是采用限定因素抽取法, 萃取了三个因素, 分别包含的题项是:20、12、11、13、21、5、6、18、23、14、10、19、2、17、7、9、24;25、33、27、8、30、22、3、26、1、4;28、29、31、32。通过对比没有限定因素和限定因素的两种结果, 得知题项12、13、11的归属发生了转移。因此, 应当予以删除。删除的方法也是逐题法。

综合以上两种因素分析法之后, 首先删除负荷量最大的题项13, 随后依次删除12, 11。萃取出了三个因素, 表2为旋转后的成分矩阵表, 可见其负荷量明显向0和1两级分化了, 可以清晰地判断哪个变量归入哪个因子。

累计总方差表中, total栏为各个成分的特征值, 栏中所有成分的特征值超过了1。旋转成分矩阵显示, 各个因子负荷值介于0.442至0.793之间, 高于0.3的可接受值。累计方差贡献率达到了50%以上, 问卷内部一致性良好。

表2为旋转后的成分矩阵表, 表中各个变量根据负荷量的大小进行了排列, 看得出旋转后的负荷量明显向0和1两级分化了。可以从此表中容易判断的出来, 哪个变量可以归入哪个因子。

从表2看出, 问卷的效度较高。因而采用没有限定因素的因素分析法再试一次。

得到KMO值还是0.854, 卡方值为763.054。由表三可知, 特征值大于1的有3个因素, 累计解释方差达到52.326%, 高于50%的最低要求。

表3中的因子负荷表明了原始变量和共同因子之间的相关关系。负荷量越大, 说明两者关系越紧密。一般而言, 0.3为一个标准值, 大于此值被认为有意义。由表可知, 负荷量在0.442到0.793之间, 负荷量高。可见所有的命题都达到0.3的可接受值, 说明量表的结构效度佳。

学习动机可以这样分类:兴趣动机, 成绩动机, 出国动机, 学习情境动机, 社会责任动机, 个人发展动机和信息媒介动机。另外, 学习动机也能分为内在动机 (如兴趣) , 外部动机 (如成绩, 出国, 信息等) 和学习情境动机 (教师, 教材, 同学) 。【4】沃尔夫克 (Woolfolk, A.E., 2001) 说:学习动机不只是涉及学生要学或想学, 还涉及更多含义, 包括计划, 目标导向, 对所要学与如何学的任务的反省认知意识, 主动寻求新信息, 对反馈的清晰知觉, 对成就的自豪与满意和不怕失败。[5]

作者发现有关学习动机的研究已有不少了, 但是对于学习态度的研究还不多。其实, 在传统的情感因素研究中, 态度和动机的地位同样重要[6]。Stem (1983) 区分了外语学习中的三种态度:对语言和语言学习者的一般态度:对目的语语言社团和说目的语者的态度:对学习该语言的态度。Gardner将5种态度测量结果和语言成绩的9个指标作相关分析, 发现某些态度和成绩的某些方面相关。【7】

本文问卷涉及到的三个维度:学习态度、学习动机、学习策略。文秋芳在1996年做了有关学习者因素和大学英语四级考试成绩的关系研究中, 将被试的成绩分成高低分两组。这两组在动机、观念和策略上表现出来的差异证实了文秋芳提出的学习者的自我学习系统模式, 并且学生的动机、观念和策略这三个维度是互相关联和影响的。【8】

最后, 第三个维度:策略。它是说学生为了学好英语所采取的一系列行动。学习策略分为四种:“管理策略”, “形式操练策略”, “功能操练策略”和“母语策略”。并且Bialystok (1981) 和Huang (1984) 的研究中都发现, 使用“功能操练策略”越多的人, 得高分的可能性越大。

2) 区分度与信度检测

简单地说, 信度指的是测量工具在前后几次测出的结果具有一致性和稳定性的特征。【9】如果具有一致性, 则说明测量工具有较好的信度。体现在语言测试中, 也就是看测量的结果是否真实客观地反映了考生的实际水平。【10】笔者依据所查阅的文献, 将量表分为了三个维度。第一个维度检测的是学生的学习态度, 项目数是9, 受试者人数有141人, alpha系数是0.853.表中有一栏为删除各个项目之后的alpha系数, 这个系数便是信度。系数居于0.828到0.858之间, 起伏微弱, 说明可以保留这些项目;第二个维度检测的是学习方法, 项目数为4个, 受试人数为141人, 这个维度的alpha系数是0.664, 各个项目系数介于0.554到0.627之间, 起伏很小, 说明也可以保留这些项目。该量表的系数是0.664, 说明内部一致性十分优良。题项的信度系数均小于分量表系数, 说明量表的内在一致性好。第三个量表的系数是:0.692.最后一栏的系数在0.553到0.662之间, 表明内在一致性很好。

3 结论与启示

这次的研究告诉笔者, 一份调查问卷需要经过预测——试测——施测多个步骤才可以建构信效度较高的问卷。笔者发现, 英语学习情况量表由三个分量表构成:学习态度, 学习动机和学习策略。各个分量表以及总量表的信度较高, 信度系数均有0.6以上。另外, 笔者还对问卷作了效度检测。在进行效度检测的过程中, 首次采用的是因素分析法, 萃取出了六个因素, 得到旋转后的矩阵图, 清晰地看出哪些题项可以归于哪个因素中。其中第五和第六的因素的题项数偏少, 而且负荷量也偏低, 为了使问卷的结构性更佳, 笔者又采用了限制因素抽取法, 抽取了三个因素。

综合以上两种分析问卷信度的方法, 逐题删除, 得到一份结构良好的问卷。问卷的研究内容是调查高职生英语学习的态度、策略以及学习动机三个维度, 综合所作的调查, 得出:三个因素均会不同程度地影响学生的学习情况, 作为教育者应当引导学生采用积极的正确的学习方法和态度, 有效提升学生的英语学习成绩。

摘要:该文通过验证性因素分析, 考察了高职院校理科生英语学习态度动机和策略【1】, 重在解决学生英语学习积极性不高, 策略不当的现象。作者针对所教授班级的学生学习特点【1】设计了调查问卷, 旨在探究其内部信度和结构效度。最终目的 是因材施教, 创立适合学生的教学法, 并有效提高学生成绩。

关键词:高职生,问卷,内部信度,结构效度

参考文献

[1]Huang X H.An investigation of learning, strategies in oral communication that Chinese EFL learners in China employ[M].Unpublished M, 1984.

[2]Gardner.R.C.Second language learning in adults:Correlates of proficiency[J].Applied language learning, 1992 (2) :1-28.

[3]秦晓晴.外语教学问卷调查法[M].北京:外语教学与研究出版社, 2009.

[4]文秋芳, 王海啸.学习者因素与大学英语四级考试成绩的关系[J].外语教学与研究, 1996b, (4) .

[5]吴万佩, 马武林.中学生英语学习动机调查研究[J].师范学院学报, 2006, 26 (3) :124-128.

[6]程幼强, 张岚.大学生英语学习态度问卷的编制及其信效度分析[J].天津外国语大学学报, 2011 (3) .

[7]文秋芳.英语学习的成功之路[M].上海:上海外语教育出版社, 2003.

[8]Bialystok E.Some evidence for the integrity and interaction of two knowledge sources[M]//In R.Anderson (Ed.) New Dimensions in Second Language Acquisition Research.Rowley, Mass:Newbury House, 1981.

[9]孙迪辉, 程启翔.信效度在语言测试中的应用[J].高等教育研究学报, 2007 (3) :148-150.

[10]宋启慧, 尹德谟.语言态度与英语学习成绩的相关性研究[J].科技信息, 2011 (14) .

信效度分析 篇2

关键词 农村小学教师 职业倦怠 情绪衰弱 少成就感 去个人化

中图分类号:G625.1 文献标识码:A 文章编号:1002-7661(2016)10-0015-02

“倦怠的感受正在打击着无数有爱心、有理想、乐于奉献的教师们——教师们已在逐渐地放弃他们的专业工作。”探讨教师的职业倦怠问题无疑有着很强的现实意义。现介绍自编农村小学教师职业倦怠问卷的操作规程和结果,为其他做类似研究者提供测量学工具。

一、方法

1.问卷编制

第一,文献检索和访谈。广泛检索查阅资料,对有关的研究文献进行比较分析,确定理论基础为玛勒诗等人的倦怠模型,学习徐富明等人编制的教师职业倦怠问卷,参考相关文献,主动访谈教师,提炼问卷的项目。

第二,选取27个题目编成预试问卷。测查了教师工作无力、身心疲惫、少成就感、待人冷漠的表现情况。

第三,预测、修编问卷。用预示问卷做了试探性测试,根据与测试情况分析并咨询专家,逐个推敲题目的可读性、相关性、明确性以及问卷的格式编排、记分设计,据此对一些项目进行调整与删改。

第四,制成正式问卷并施测。确定正式施测的问卷,包含16个题目,第一组7个,第二组5个,第三组4个。问卷采用里克特5点记分,“5”代表“最符合”,“1”代表“最不符合”。在前述四个乡随机整群采取被试进行测试,发放问卷360份,回收有效问卷286份。其中男教师120人,女教师166人,平均年龄38.6岁,平均教龄16.2年,测试以学校为单位集体施测,5-10分钟测验结束。

第五,重测和检视信效度。间隔30天,再随机整群抽取两所中心小学教师共38名进行重测。测试时,要求被试仔细阅读指导语,并向被试强调真实回答的重要性。施测38人,得到有效问卷28份。

2.数据分析

所得数据在SPSS统计包中做分析处理。

二、结果

1.自编倦怠问卷的效度

用主成分分析和方差分析方式探索数据,3个因子分别占比为30.406%,10.423%和7.871%。结合文献资料,将3个因子称作情绪衰弱、少成就感和去个人化,见文中表1。

2.自编倦怠问卷的信度

研究中自编倦怠问卷的克朗巴哈系数为0.8155,依题项奇偶将问卷分成两组,两组的相关系数为0.725,分半信度为0.8562。探索三个因子的关系,同质信度为0.7226、0.7105和0.6025。与总分的相关系数为0.782、0.753和0.722。因子相互间存在正相关。研究探明整个问卷的重测信度为0.8025,各因子的重测信度为0.7835、0.7201和0.6632。

3.自编倦怠问卷的项目分析

(1)项目区分度。探索自编问卷的各个项目与其对应的维度间的相关系数。发现,因子1与它包含项目间的相关系数在0.61到0.75之间;因子2与它包含项目间的相关系数在0.55到0.76之间;因子3与它包含项目间的相关系数在0.71到0.75之间。

(2)项目鉴别指数。将被试得分排序,从两端各抽出27%,做为高分组和低分组,计算项目鉴别指数,发现各项目的鉴别指数都在0.24到0.56之间,超过0.36的有9个。

三、讨论

(1)研究用自编的倦怠问卷以16个项目就测查了农村小学教师职业倦怠的3个维度,各项效标都符合心理测量学指标。这表明自编农村小学教师职业倦怠问卷可以作为测查农村教师职业倦怠的简便工具使用。(2)研究中主要检测了维度与对应项目间的相关以及各项目的鉴别指数,结果发现所有指标的相关明显,区分度好。这说明,问卷中的三个因子同质性明显,这有力的支持了问卷的结构效度。(3)这份自编问卷各因子的克朗巴哈系数都较高,表明问卷中各职业倦怠维度的同质性较好,这和预测结果较为吻合。(4)问卷制作规范,但研究中被试来源范围有限制,所以研究结论是否具有普遍性,有待进一步探究、检验。

四、结论

自编倦怠问卷各项指标水平均达到测量学要求,可以用来做职业倦怠有关的研究,探究农村小学教师的职业倦怠情况。

参考文献:

[1]胡春梅,姜燕华.近三十年来国内外关于教师职业倦怠的研究综述[J].天津市教科院学报,2006,(03).

[2]王国香,刘长江,伍新春.教师职业倦怠量表的修编[J].心理发展与教育,2003,(03).

[3]徐富明.中小学教师职业倦怠问卷的编制及信效度检验[J].中国临床心理学杂志,2004,(12).

[本文系甘肃省教育科学“十二五”规划课题,课题批准号:GS【2015】GHB0693研究成果。]

大学生学习倦怠量表信效度分析 篇3

1 对象与方法

1.1 对象

采用分层随机抽样方法选取新疆师范大学、新疆大学和新疆医科大学不同专业和不同年级的在校本科生进行问卷调查。共发放问卷750份,回收有效问卷708份,有效率为94.4%,其中师范性大学206人,综合性大学237人,医科性大学265人;男生278名,女生430名;城镇大学生480名,农村大学生228名;汉族大学生462名,少数民族大学生246名;大一学生167名,大二学生150名,大三学生234名,大四学生157名。

1.2 方法

问卷的编制分2个阶段,先用开放式问卷了解当前大学生学习现状,结合已有的研究确定问卷的结构和框架[3],形成大学生学习倦怠的初始问卷。在大学生中发放问卷进行测试,对测试结果进行项目分析和因素分析,利用统计学对问卷的有关项目进行删除和修订,抽取大学生学习倦怠中存在的共同现象,整理剩余的项目作为正式大学生学习倦怠问卷的项目。最后将正式问卷发放给被试进行正式测试。本次正式问卷共有13个项目,包括情绪低落、行为不当与成就感低3个维度。采用5级计分,从“完全不符合”(记1分)到“完全符合”(记5分)。分数越高,说明学习倦怠程度越高。其中反向叙述题则反向计分。

1.3 质量控制

为了减少调查偏倚,调查之前与被调查班级取得联系,说明调查的目的、意义和内容以及具体措施,取得密切合作。集中统一培训调查小组,认真学习量表内容,统一调查用语和调查方法。问卷采用集体施测的方式,将被调查者集中在教室,由调查组统一发放调查问卷,当场统一收回问卷。及时组织调查人员对收回的问卷进行统一编号和复查,弥补有关项目的不足。对于填写项目不全及时补充,填写内容不足80%者剔除。数据录入由2名专业人员完成,数据录入完毕后,随机抽取20%的问卷进行复核,利用统计软件检查输入的一致性,最终形成分析数据库。

1.4 统计分析

所有资料录入EpiData 3.1数据库,用SPSS 18.0软件包对数据进行t检验、相关分析、因子分析和信度分析;利用Amos 7.0进行验证性因素分析评价结构效度。

2 结果

2.1 条目分析

将学习倦怠量表总分进行高低排序,找出总分排序中高、低各27%的观测值分别为40分和34分,将量表总分高于40分的分数作为高分组,低于34的分数作为低分组,采用独立样本t检验来检验2组在各个条目上的得分差异。结果表明,13个条目决断值的差异均有统计学意义(P<0.05或P<0.01),见表1。表明13个条目均能鉴别出不同受试者的反应程度,故予以保留。

注:*P<0.05,**P<0.01。

2.2 探索性因素分析

首先对数据进行因子分析适合性检验,判断指标主要有KMO和Bartlett球形检验χ2值。本样本KMO值为0.856,说明偏相关性较强;Bartlett值为2 205.67(P=0.000),表明数据的相关矩阵不是单位矩阵,可以进行因子分析[4]。笔者采用主成分分析方法,经方差最大旋转法旋转后提取3个特征根大于1的因子,3个因子累计解释55.88%的方差。结合碎石图(图1)可见前3个因子的特征根有一个下降,分布开始变得比较平缓,从第4个因子开始特征根均小于1,故最终决定抽取3个因素,累计贡献率约为55.88%。量表各项目的因素荷载见表2。

2.3 信度分析

2.3.1 内在一致性信度

学习倦怠量表的Cronbach α[5]为0.83,情绪低落的Cronbach α为0.82,行为不当的Cronbach α为0.71,成就感低的Cronbach α为0.74。

2.3.2 重测信度和分半信度

随机选取150名研究对象进行问卷测试,2周后重测,问卷的重测信度为0.86,各因素的重测信度分别为0.82,0.81和0.80,均高于0.70,表示问卷稳定性较好。把量表以奇、偶数题号分为两半,采用Spearman-Brown分半相关系数计算方法,所得分半信度系数为0.85,表明项目测定内容具有同源性。

2.4 验证性因素分析

根据探索性因素分析得到了3个维度构成的三因素模型,为了确定问卷维度的最佳结构,用Amos 7.0对问卷的结构模型进行验证性因素分析,并假设单因素模型(所有条目作为一个整体来评价学习倦怠)与三因素模型(上述研究中探索性因素分析所得到的模型结构)进行比较,以确定问卷的最佳模型。一般认为模型拟合指数NNFI,CFI均>0.90,RMSEA<0.08,拟合的模型是可以接受的[6,7]。从表3可见三因素模型拟合指数优于单因素模型拟合指数,说明采用三因素结构模型对学习倦怠进行解释是比较适宜的。

注:RMSEA,近似误差的均方根;GFI,拟合优度指数;AGFI,调整的拟合优度指数;NFI,规范拟合优度指数;NNFI,非规范拟合优度指数;CFI,较拟合优度指数。

2.5 效度分析

验证性因素分析结果表明问卷具有较好的结构效度。表4显示问卷总分与3个分量表之间呈明显相关,表明量表有较好的内容效度。

注:*P<0.05,**P<0.01。

3 讨论

为克服量表信度大多仅采用一种方法评价的缺点,本研究同时对量表进行了分半信度和重测信度研究,因而能更客观反映学习倦怠量表的信度。研究结果发现,重测信度和分半信度均高于0.70,提示量表稳定性好。

本研究对数据进行因素分析后,根据以下标准[8]确定因素的数目:因素特征值大于1;因素必须符合卡特尔陡阶检验原则;共同度不低于0.30,因素负荷不小于0.35或0.40;每个因素至少包括3个以上项目,因素比较容易命名。经迭代收敛,得到3个因子,累计贡献率为55.88%,大于推荐值40%,每个条目都在其中一个因素上有较高的负荷值,而对其他因素的负荷值较低。问卷结构符合预定的构思,具有良好的结构效度。

研究发现,三因素模型拟合指数优于单因素模型拟合指数,说明采用三因素结构模型来对学习倦怠进行解释是比较适宜的。内容效度是指测量的内容或项目对总体内容的代表性程度,测验的项目是否充分代表了所要测量的内容范围[4]。各分量表与总量表分的相关可作为考察某量表内容效度的指标[8]。学习倦怠问卷各因素与总量表的相关系数在0.631~0.752之间,表明该问卷具有较好的内容效度。另外内容效度与结构效度有相关性,评价结构效度的量化指标通常可以间接反映内容效度[4]。

综上所述,本次编制的大学生学习倦怠量表具有较好的信度和效度,可以作为大学生学习倦怠的测量工具。

关键词:学习,疲劳,问卷调查,统计学,学生

参考文献

[1]BRANKO S.The syndrome of burnout,self-image,and anxiety withgrammar school students.Horiz Psychol,2001,10(2):21-32.

[2]WEIDONG WU.Study on College Students'Learning Burnout.Asi-an Soc Sci,2010,6(3):131-134.

[3]SCHAUFELI WB,MARTINCZ IM,MARQNCS PA,et al.Burnoutand engagement in university students:Across-national study.J CrossCultural Psychol,2002,33(5):464-481.

[4]李富业,刘继文,连玉龙,等.脑力劳动者职业倦怠测量工具的信度和效度分析.中华劳动卫生职业病杂志,2009,27(3):156-159.

[5]JACINTA M,CHRISTINE A,PAMELAC.Measuring perceived com-municative ability after traumatic brain injury:Reliability and validityof the La Trobe Communication Questionnaire.J Head Trauma Reha-bil,2007,22(1):31-38.

[6]秦浩,陈景武.结构方程模型原理及其应用注意事项.中国卫生统计,2006,23(4):367-369.

[7]温忠麟,侯杰泰,马什赫伯特.结构方程模型检验:拟合指数与卡方准则.心理学报,2004,36(2):186-194.

[8]杨虎民.3-6岁幼儿多元智力问卷编制及分析.阜阳师范学院学报:自然科学版,2006,23(4):68-71.

信效度分析 篇4

(1.西安交通大学体育部,陕西 西安 710049;2.中国民航飞行学院体育部,四川 广汉 618307)

摘 要:通过1 179名大学生问卷调查数据,对首次编制的体育锻炼效果自评量表进行了信度和效度检验,并考察了大学生锻炼效果特征和性别差异。结果表明:EEI具有良好的信度和效度,是一个较好的体育锻炼效果自评工具,测量了学生在乐趣、能力、外貌、健康、社交5个方面体验到的锻炼效果;五类锻炼效果均与锻炼行为呈显著性正相关,锻炼乐趣相关程度最高,是学生参加和坚持体育锻炼的最重要因素;男大学生的锻炼效果自评得分比女生高。

关键词:锻炼效果;量表;心理测量;信度;效度

中图分类号:G807.4文献标识码:A文章编号:1007-3612(2008)10-1404-03

On the Designation, Reliability and Validity of Exercise Effects Inventory (EEI) for Chinese College Students

CHEN Shan-ping1,PAN Xiu-gang1,ZHANG Ping2,ZHANG Zhong-jiang1

(1. Department of Physical Education, Xi'an Jiaotong University, Xi'an 710049, Shaanxi China;

2. Department of Physical Education, Civil Aviation College of China, Guanghan 618307, Sichuan China)

Abstract:The exercise effects inventory (EEI) is tested for its reliability and validity based on a survey of 1179 students. The results show that: the EEI is a reliable and valid measure for exercise effects; its five scales assess the effects of exercise in joy, competence, appearance, fitness and social; the five exercise effects are significantly correlated with exercise behaviors, and joy in exercise, which has most impact on their exercise, has the closest correlation; the EEI score of male students is higher than that of female students.

Key words: exercise effect; inventory; psychometrics; reliability; validity

体育具有健身、教育、娱乐等多种功能[1],大学生参加体育锻炼所产生的效果应该是多方面的[2]。然而,在学生体育评价方面,评价内容主要是体育知识、体育技能和身体素质等,缺乏对学生在体育锻炼中收获到的其他效果的评价,例如:娱乐和交往等,这不利于帮助学生全面认知体育的价值。在评价方式上,主要是从教师角度进行的考试评价,而没有基于学生体验的自我评价,因此,评价结果不能体现锻炼参与者本人对体育锻炼的效果和价值的认同。

帮助大学生正确认知和体验体育锻炼的效果和价值有利于促进大学生坚持体育锻炼[3],因此,有必要在体育考试评价的基础上,增加学生对体育锻炼效果的自我评价,以便帮助学生全面认知体育锻炼的价值,也有利于教师掌握学生对体育锻炼的认同程度。通过文献查阅,还没有发现针对体育锻炼效果的自我评价量表,因此,本文旨在建立大学生体育锻炼效果自评量表,并进行信度和效度分析,为体育锻炼研究和学校体育评价提供一个简便的心理测量工具。

1 研究对象与方法

1.1 研究对象 ┆研究对象为1 179名大学本科生,其中男生896人,女生283人;一年级314人,二年级291人,三年级274人,四年级300人。年龄在16~24岁之间 (M=19.9,SD =1.54)。

1.2 测量工具 通过对学生访谈的总结,我们发现学生对自己锻炼效果的评价是依据参加的体育锻炼满足他们需要的程度,因此参考《身体活动动机测量》(MPAM-R)量表的理论结构反映的个体体育需要类别[4],从反映学生通过体育锻炼在乐趣、能力、外貌、健康、社交5个方面获得的锻炼效果设计了测量题目(表1),编制的题目采用5级Likert量度,5个备择答案分别为“非常同意”、“同意”、“既不同意也不反对”、“不同意”和“非常不同意”。测量题目交6位具有相关经验的专家审阅,认为这些测量题目符合相关变量的定义。为检验锻炼效果自评量表的效标效度,量表配合使用测量锻炼坚持意向的运动承诺量表[5],以及衡量体育人口的三项指标:周锻炼次数、每次锻炼时间和锻炼强度[6]

1.3 研究过程 为了使样本能基本代表本科生的人口特征,以性别和年级为类别依据进行配额抽样,计划每个年级抽样400人,其中男生300人,女生100人,总计1 600个样本。样本选取后,研究者带领学生调查员对调查对象进行了问卷调查,实际发放问卷1 580份,回收1 424份,回收率90.1%,经问卷审核和逻辑校验,剔除无效问卷145份,最后用于统计分析的数据有1 179条。

1.4 数据分析 ┆数据统计使用SPSS 11.0和LISREL 8.53。

2 结果与分析

2.1 项目分析 为评估每个测量项目的特征,通过SPSS的描述性统计考察了各题目的均值、标准差、偏度、峰度。结果显示所有题目的偏度和峰度绝对值远小于2,量表题目的回答数据分布满足正态分布假设。通过检验测验总分最高的27%和最低的27%两组被试在每题得分平均数的差异的显著性,所有题目的CR(临界比率)均达到显著水平,表示这些题目具有很好的鉴别度。

对量表的信度主要考察了量表的内部一致性系数(Cronbach a系数),总量表的a值为0.871,从表1可以看出,锻炼乐趣、健康效果和社交效果分量表的信度系数具有一个很好的a值,高于0.7的标准,外貌效果分量表为0.684,非常接近0.7的水平,表示量表具有很好的内部一致性。能力效果信度系数较低,但高于可接受的0.6的标准,考虑到属于新编制的量表,信度较低很可能是由于测量题目少引起的。

表1 分量表信度和标准化一阶因子负荷值

2.2 验证性因子分析 为了检验量表的结构效度,根据我们量表设计时的理论结构和测量构想,在LISREL 8.53中构建了一个锻炼效果评价的二阶因子模型,验证性因子分析模型以量表的12个题目为显变量,由5个一阶因子(乐趣、健康、能力、外貌、社交)和1个二阶因子(锻炼效果)组成。

计算机分析时,LISREL采用ML(最大概似法),总计进行了23次叠代完成了所有的参数估计。模型的因子负荷标准参数估计结果见表1,除锻炼乐趣的第三个题目的因子负荷低于可接受的标准0.5外,各因子均具有较高的负荷,各因子负荷的t值分布于13.51~23.85之间,均达到0.001的显著水平,说明各分量表的会聚效度是可以接受的。

二阶测量模型的PHI参数估计结果见表2,各因子之间的相关均达0.001的显著水平,各一阶因子对二阶因子(锻炼效果评价)的负荷高于0.7,说明存在一个共同的二阶因子。一阶因子之间具有较合理的相关关系,对于一阶因子之间相关关系高于0.7的5组变量,我们考察了它们之间的区分效度,分别以假设2个变量为独立变量和单维变量两种情况进行了验证性因子分析(表3),分析的结果表明两组变量作为独立变量的整体模型合适度参数优于单维变量合适度,所以这5组变量的区分效度是明显的。

表2 二阶因子负荷值、标准化相关系数

测量模型对于数据的LISREL拟合优度结果(Goodness of Fit Statistics)为:X2(49)= 325.75,NFI= 0.97,NNFI= 0.97,CFI= 0.97,IFI= 0.97,RMSEA = 0.072,SRMR = 0.041。一般认为 X2/df 的值小于5.0时,可以接受模型,本次检验中 X2/df 的值为325.75÷49=6.648,尽管模型拟合的卡方( X2) 值不理想,但由于卡方值会随样本数的增大而不断增大,因此,样本大于1 000时不适合使用卡方准则来评价模型[7]。模型的NFI、NNFI、CFI、IFI均达到最严格的标准0.95,近似误差均方根(RMSEA)达到可接受的0.1标准,标准化残差均方根(SRMR)也达到可接受的0.08标准[8],表明锻炼效果自评量表符合测量学的要求,在大学生中测得的数据支持我们提出的理论结构和测量构想。

表3 五组构想概念的区分效度

2.3 效标关联效度:锻炼效果自评与锻炼行为的关系 锻炼效果与锻炼行为之间应该为正的相关关系。在一定的范围内,锻炼者的锻炼频率越高,每次锻炼时间会越长,每次锻炼的运动量越大,它所获得的锻炼效果越好;锻炼效果越好,锻炼者越渴望和决心继续进行身体锻炼(即运动承诺度越高)。为检验锻炼效果自评量表测得的结果是否符合理论的假设,进行了5种锻炼效果和锻炼行为指标的相关分析,结果见表4。从总体上看锻炼效果自评量表测得的得分与锻炼行为的承诺、频率、时间和运动强度有很强的正相关关系。

表4 锻炼效果自评与锻炼行为的关系

注:“**”:0 01水平上显著;“***”:0 001水平上显著。

2.4 大学生自评的锻炼效果的性别差异 ┆本次研究样本的体育锻炼效果自评情况见表5,大学生锻炼效果自评得分高低依次为:能力效果、健康效果、锻炼乐趣、社交效果和外貌效果;男女大学生在5个锻炼效果自评得分上的均存在显著性差异,男大学生的锻炼效果自评得分均比女生要高。

表5 大学生的锻炼效果自评和男女比较

3 讨 论

体育锻炼效果自评量表是一个二阶因子结构,所测量的大学生体验到的锻炼效果包括5类:1) 锻炼乐趣:指参与体育锻炼产生的积极情感反映,诸如快乐、欢喜和有趣等;2) 健康效果:指参加体育锻炼对促进健康方面的效果;3) 能力效果:指参加体育锻炼对自己能力的提高;4) 外貌效果:指参加体育锻炼对控制体重、改善体型和外表产生的作用;5) 社交效果:指参加体育锻炼在获得友谊和增进交往方面产生的效果。从本次检验的结果来看,量表的题目在测量大学生锻炼动机时具有较高的鉴别度,分量表和总量表均具有良好的内部一致性,量表的结构效度和效标效度也得到了证实,因此,量表的信度和效度符合心理测量学的要求,说明量表是一个较好的体育锻炼效果自评工具,值得在体育研究和体育教学评价中推广使用。

根据驱力理论,个体进行某项活动或行为的努力程度或执着程度将取决于个体由于匮乏状态而产生的内驱力,以及由观察、学习或亲身经历所获得的关于这一活动的或行为的效果体验,如果过去的行为导致好的结果,人们有反复进行这种行为的趋向,过去的行为如果导致不好的结果,人们有回避这种行为的倾向[9]。这一理论假设在效标效度检验中得到验证,运动承诺是指体育锻炼者渴望和决心继续进行身体锻炼的一种心理状态,它与所有的锻炼效果自评均具有非常显著的相关。其他学者的一些研究也表明,学生认识到的体育锻炼的价值与作用和坚持体育锻炼的长期性呈现高度相关( r =0.87),说明对体育自身价值与作用的认识是影响学生坚持体育锻炼的重要因素[10]。因此,在体育教学和体育活动中帮助学生认识和体验体育锻炼的好处,有利于促进学生坚持体育锻炼,形成良好的锻炼习惯。

在与锻炼行为的承诺、频率、时间和运动强度相关关系强度上,锻炼乐趣与锻炼行为的相关程度最高,相关系数远远大于其它四项指标,其次是社交效果,说明这两方面的效果体验对学生参加和坚持体育锻炼的重要性要大于其它三项,是学生坚持体育锻炼的最重要因素,改善这方面的锻炼效果体验对学生参与和坚持体育锻炼有更大的促进作用。

大学生锻炼效果自我评价中,在锻炼乐趣、社交效果和外貌效果方面的得分明显低于能力效果和健康效果的得分,这一评价结果是我们现行体育教育真实的体现,现在的体育教学比较重视传授学生体育知识、培养能力和促进体质健康,比较忽视发挥体育锻炼在娱乐、社交和外貌方面的功能。然而娱乐和社交是学生坚持体育锻炼的最重要因素,因此不难推断:我们当前的体育教育在发挥体育功能上存在不均衡,不利于学生长期坚持体育锻炼。一些研究已经证实了这一现象的存在,体育课结束后很多学生退出体育锻炼,造成大学生体质在这个阶段迅速下降[11-12]。从培养学生终生体育意识,养成终生体育的习惯,促进学生身心健康可持续发展的角度出发,体育教学需要重视发挥体育在娱乐、社交和审美等方面的功能。

从数据分析结果来看,我们的测量模型也存在需要进一步改进之处。首先,锻炼乐趣的第三个题目“我对自己的体育锻炼感到满意”的完全标准化负荷低于0.5的标准,揭示这一题目测量的内容与其他几个题目测量的内容可能存在不一致的地方。从修正指数来看,它在外貌动机中的MI是33.34,在社交动机中的MI是15.1,仔细分析该题目的内容,该题目实际上反映了对锻炼效果的综合评价,该题单独归属于任何一个因子都不恰当,所以应该从量表中删除该题目,删除该题目后,锻炼乐趣的信度系数由0.723提高到0.773。其次,部分子量表a系数较低,应该增加测量题目来提高子量表的信度。

4 结 论

信效度分析 篇5

1 对象与方法

1. 1对象于2010年始, 分别在北京、陕西选取既往有过良好合作关系的16所城市和农村中小学校作为方便样本, 城市和农村中小学校各8所 ( 小学、初中均各占4所) 。兼顾教师地区、性别、年龄、学段分布等综合因素, 选取小学及初中教师共计222名作为研究对象, 收回有效问卷219份, 有效率为98. 6%。两地教师构成特征基本一致: 北京地区教师共93名 ( 42. 5%) , 其中女性58名 ( 62. 4%) , 初中教师52名 ( 55. 9%) ; 陕西地区教师126名 ( 57. 5%) , 其中女性85名 ( 67. 5% ) , 初中教师87名 ( 69. 0% ) 。抽取10% 的调查对象在完成第一次调查后2周内进行重测, 计算每一条目2次得分的相关系数。

1. 2学校心理社会环境的界定及问卷结构

1. 2. 1学校心理社会环境的界定本研究参照世界卫生组织对学校心理社会环境的定义, 即能够创造师生间、同学间相互关怀、信任和友好的环境, 能够形成和谐健康的校园氛围, 使每个学生的个人优势或特长都能得到充分发挥的环境[1]。包括多维性、主观性和文化特异性3个特点。

1. 2. 2问卷的编制以世界卫生组织对健康的学校心理社会环境具备的特征为依据[3], 同时参考本研究对教师进行个人深入访谈的具体情况, 将学校心理社会环境教师评定问卷暂定为亲密度、互动性及公平性3个领域。其中“互动性”包括师生交流、学习支持、教学方式和惩罚方式4个次级维度。

在明确学校心理社会环境的界定及问卷结构后, 主要运用以下方法建立条目池: ( 1) 文献综述; ( 2) 定性访谈: 对象主要是中小学生、任课教师、学校领导及有关部门领导; ( 3) 专家咨询: 邀请相关领域的知名专家, 对各条目进行综合评分并提出具体意见。在上述方法基础上, 最终确定27个条目, 所有条目均为5级评分, 即“总是、经常、有时、很少、从不”对应0 ~4分。1. 2. 3问卷维度的确定和条目筛选运用探索性因子分析对所有条目进行维度的划分。提取特征值 >1的公因子, 共8项; 根据载荷 >0. 3的条目均集中在3个公因子上, 故该问卷定为3个维度, 即“亲密度”, 共3项; “互动性”, 包括师生交流、学习支持、教学方式3个次级维度, 共11项; “公平性”共3项。共计17项。1. 3统计方法采用EpiData 3. 0和SPSS 13. 0软件分别进行数据录入、核查和分析, 通过以下多种方法进行条目筛选。 ( 1) 主观评分法: 在前期专家咨询中获得了各条目的重要性得分 ( 10分制) , 经统计得所有条目重要性得分的平均分为8. 11, 保留得分高于8. 11的条目。 ( 2) 因子分析法: 根据因子分析结果选取在相应公因子上载荷 > 0. 3的条目。 ( 3) 相关系数法1: 选择与所在维度相关系数 >0. 4的条目, 从而保证条目与所在维度的一致性。 ( 4) 相关系数法2: 删除与非所在维度相关系数 > 0. 4的条目。 ( 5) 克朗巴赫系数法 ( Cronbachα) , 计算某一方面的Cronbachα系数, 比较去除其中某一条目后系数的变化, 如果该系数上升, 则说明内部一致性增强, 应该删去; 反之则保留。 ( 6) t检验法: 根据检验结果, 两独立样本在同一条目得分差异有统计学意义, 说明该条目敏感性较好, 能够区分具有不同特征的群体; 否则, 应予以删除。 ( 7) 重测信度法: 对54名教师进行2周后重测, 计算2次测量条目得分的相关系数, 保留相关系数较高的条目, 本研究取重测系数 >0. 6的条目。

2 结果

2. 1可接受性分析在问卷填写中, 调查对象均表示可以理解各个条目的意思。由27个条目组成的条目池花费的平均时间约为5 min, 最终问卷条目数量为条目池数量的63. 0%, 完成时间在10 min以内, 较易接受[8]。此外, 本问卷条 目池条目 完成率为99. 9% , 可见本量表的可接受性较好。

2. 2信度分析3个维度重测得分相关系数分别为0. 540, 0. 872, 0. 659, 问卷总分重测相关系数为0. 736。重测相关系数 > 0. 7可认为问卷具有较好的稳定性[2], 因此本问卷的总体重测信度较好。问卷分半信度系数为0. 761 ( >0. 7) [2], 说明本问卷分半信度非常好。问卷整体Cronbachα系数为0. 813, 各维度Cron- bachα系数分别为0. 402, 0. 846, 0. 437。Cronbachα系数达到0. 7, 说明量表内部一致性较好[2]。因此, 本问卷的内部一致性比较好。

2. 3效度分析问卷中每一个条目都通过各种定性方式认证, 最终保留17个条目, 对每个条目进行验证性因子分析, 互动性维度下的11个条目在因子1上载荷最大, 亲密度维度下的3个条目在因子2上载荷最大, 公平性维度下的3个条目在因子3上载荷最大。因子的累积贡献率为48. 194%。

经过对两个调查地区问卷总分、各维度得分及各二级维度得分t检验比较发现, 除公平性维度差异无统计学意义外, 其余得分差异均有统计学意义。因此尚不能确定教师问卷具有良好的区分效度。见表1。

3 讨论

本研究旨在以促进学生健康发展为目的, 根据标准化问卷开发程序, 对学校心理社会环境教师评定问卷编制进行探索。

为保证问卷质量, 本研究采用了多种方法进行信、效度的控制。在问卷内容方面, 通过对相关领域的专家开展咨询, 及对中小学校领导和教师以及广大在校中小学生进行面对面访谈, 来获取确定问卷内容的第一手资料。在统计分析方面, 主要通过保证条目数量和多种统计分析方法, 运用Cronbanchα系数评定法筛选条目, 以保证整个问卷具有较好的信度。采用验证性因子分析等检验问卷的内容效度和结构效度。

研究中, 因子累积贡献率偏低。可能由于相关性强的变量不够集中, 分属于多类, 所以提取3个主成分时贡献率较低。鉴于此, 在后续的研究中可以适当增加因子, 提取4个或以上的主成分以提高因子累积贡献率。

通过以往调查发现, 北京城区学生在问卷几乎所有条目的得分均高于陕西贫困地区学生, 说明在这两类人群中, 学生问卷具有良好的区分效度[9,10,11]。教师作为学生在校心理社会环境的疏导者, 两地区教师对学校心理社会环境的主观认识可能无差别, 因此教师问卷的区分效度还有待进一步验证。在学生定性访谈中, 教师惩罚方式被认为是影响学校心理社会环境的重要因素, 但在教师问卷条目筛选时这方面的所有条目被删除, 其原因可能是教师对学生的惩罚属于敏感问题, 教师往往倾向于选择比较中性或者更有利的选项; 也可能这类条目本身无区分性, 且专家对此评分也较低。亲密度和公平性两维度信度未达到较理想状况, 其重测信度系数分别为0. 540, 0. 659; Cron- bachα系数分别为0. 402, 0. 437, 均小于0. 7。可能由于其中所含条目数量较少所致。提示亲密度和公平性两维度的内容还需继续完善。

教师是关系学生成长、成才的重要因素, 在关注学生对学校心理社会环境评价的同时, 教师也是十分必要的。本研究在学生问卷开发的基础上, 率先在国内较为客观地就教师对学校心理社会环境的内涵和评价先后进行了探讨。然而由于多种限制, 在条目的权重赋值、内容、数量等方面依然存在局限性, 还需在更大范围充实条目, 同时进行信、效度检验, 进一步发展完善。

参考文献

[1]WHO.WHO information series on school health-Oral Health Promotion:An essential element of a health-promoting school[R].Geneva:WHO, 2003:7-8.

[2]UNICEF.Assessment child-friendly schools:A guide for programme managers in east Asia and the Pacific[R].New York, 2006:1-2.

[3]MCLELLAN L, RISSEL C, DONNELLY N, et al.Health behaviour and the school environment in New South Wales, Australia[J].Soc Sci Med, 1999, 49 (5) :611-619.

[4]LOPEZ EE, PEREZ SM, OCHOA GM, et al.Adolescent aggression:Effects of gender and family and school environments[J].Adoles, 2008, 31 (4) :433-450.

[5]TAKAKURA M, SAKIHARA S.Psychosocial correlates of depressive symptoms among japanese high school students[J].Adoles Health, 2001, 28 (1) :82-89.

[6]WHO.Creating an environment for emotional and social well-Being[EB/OL].[2010-03-09].http://www.who.int/school_youth_health/media/en/sch_childfriendly_03_v2.pdf.

[7]UNESCO.Focusing resources on effective school health[EB/OL].[2010-03-20].http://portal.unesco.org/education/en/ev.php-URL_ID=7122&URL_DO=DO_TOPIC&URL_SECTION=201.html.

[8]NSW.Department of school education:Towards a health promoting school[J].Ryde:Australia, 1996, 31 (2) :49-61.

[9]余小鸣, 袁博成, 安维维, 等.学校心理社会环境评定问卷编制的初步探索[J].中国学校卫生, 2011, 32 (3) :275-277.

[10]袁博成, 余小鸣, 安维维, 等.陕西农村学校心理社会环境状况分析[J].中国学校卫生, 2010, 31 (10) :1248-1250.

信效度分析 篇6

1 对象与方法

1.1 对象

2013年5月,整群抽取蚌埠市实验小学三~ 五年级学生1 786名,其中男生974名,平均年龄为( 10.08±0.91) 岁; 女生812名,平均年龄为( 10.06±0.89) 岁。

1.2 方法

1.2.1 问卷项目的建立

1.2.1.1以儿童、童年期、应激、虐待、忽文献检索视、欺凌、生活事件为检索词在中国学术期刊数据库和Pub Med等数据库中进行文献检索。

1.2.1.2 焦点小组访谈 对 10 名儿童家长、15 名三 ~六年级小学生、6名小学教师进行了焦点小组访谈,并进行转录和分析。

1.2.1.3专家咨询通过文献查阅、焦点小组访谈等方法,初步拟定了“童年期慢性应激评定问卷”的项目池,再进一步通过Dephi方法在儿童保健和儿少卫生学专家中进行3~4轮的专家咨询。

1.2.1.4国内外同类问卷和量表的参考问卷的编制主要参考Bernstein等[10]编制的“儿童期创伤问卷简化版”、Solberg等[9]编制的“欺凌/被欺凌问卷”和胡燕等[8]编制的“中学生生活事件多维评定问卷”等。

1.2.1.5课题组座谈课题组采用上述方法编制了有105个项目的项目池,再根据每个项目的代表性与合理性进行反复斟酌与修改,确定了80个项目的初始问卷。80个项目划分为三大维度,分别为童年期同伴欺凌( 包括言语欺凌、躯体欺凌和社会欺凌,共15个项目) 、童年期虐待与忽视( 包括情感虐待、躯体虐待、性虐待、情感忽视和躯体忽视,共33个项目) 、童年期不良生活事件( 包括家庭、学校与社会、生活和个人,共32个项目) 。

1.2 2 实施与计分方法

“童年期慢性应激评定问卷”为自评式问卷,适用于具有一定阅读和理解能力的小学生( 通常为三 ~ 六年级的小学生) ,初中及以上学生亦可采用该问卷进行回顾性调查。被试者根据自身的经历,评价自己在小学或更小的时候是否有过所列出的不良生活经历; 若有过,再评价不良经历对自己心理的影响程度。测试时间需要10~15 min。

该问卷为Likert 6点量表。若问卷中所列不良经历被试没有经历过,被试直接选取“没有发生过”选项( 赋值为0) ; 若发生过,被试根据对自己心里产生的影响程度依次分为极小影响、较小影响、中度影响、较大影响、极大影响,分别赋值为1,2,3,4,5。

1.2.3 项目分析方法

1.2.3. 1将研究对象按总得分由高到低排敏感性序,得分最高的27% 个体组成高分组,得分最低的27%个体组成低分组,采用两样本t检验法比较各个项目高分组和低分组得分的差异。若两组得分差异无统计学意义,则考虑删除该项目。

1.2.3.2代表性分析各项目与问卷总分以及所属维度总分之间的相关性,相关系数小于0.4的项目考虑剔除; 采用最大正交旋转因子分析法,因子负荷小于0.4的项目考虑剔除; 采用逐步回归分析法,以总分为因变量,以各项目得分为自变量,不能进入回归方程的项目考虑剔除。

1.2.3.3独立性分析各项目与其他维度之间的相关性,若与其他维度的相关性系数大于0.4则考虑删除。

1.2.3.4内部一致性Cronbachα系数是评价问卷内部一致性的首选指标。通常去掉所考察的项目后,观察所在维度的Cronbachα系数变化情况。一般来说,项目数越多,系数则越大。因此,如果从某维度里去掉某个项目后系数不但没有减小反而增大,说明该项目的存在降低了其所在维度的内部一致性,则考虑剔除。

1.2.4 探索性因子分析

在上述项目分析的基础上,对各部分保留的项目进一步进行探索性因子分析,并采用最大正交旋转法。如果一些项目因无法与相同维度的其他项目划分在一起,则考虑给予删除。

1.2.5 信效度分析

包括: ( 1) 重测信度,采用相关系数法对部分重测儿童前后问卷总分和各维度得分进行比较。( 2) 同质性信度,采用Cronbachα系数评价问卷总体和各维度的同质信度。( 3) 分半信度,采用相关系数法比较问卷总体和各维度的分半信度。( 4)内容效度,采用专家评议法评价该问卷的内容效度。( 5) 结构效度,采用探索性因子分析和验证性因子分析模型评价该问卷的结构效度。

1.3 统计方 法

使用Epi Data 3. 1录入数据,采用SPSS 16.0进行统计分析。使用t检验、相关系数、逐步回归等多种统计方法及专家评议对该问卷进行项目分析,同时进行问卷的信度和效度检验。

2 结果

2.1 项目筛选结果

两独立样本t检验的分析结果显示所有项目均可保留。然后重点考查了其他项目分析方法的评价结果,若某项目被选入次数小于或等于4次,则该项目在统计学意义层面考虑删除。

课题组专家对统计学评价建议删除的11个项目逐一进行讨论,根据目前的文献报道和专家意见,最终保留11个项目中的3个项目,即“父母从来不叮嘱我注意安全、注意卫生等”“父母离婚”和“家庭不和睦或家庭暴力”。

2.2 探索性因子分析

在项目分析的基础上,对保留的项目进一步采用最大正交旋转法进行探索性因子分析。结果显示,不良生活环境维度的6个项目全部删除,另外“家里人使用开水、火、香烟等烫我”“父母经常把我一个人独自留在家中”“教师对我有偏见”“学习或兴趣班负担太重”“个人存在生理方面缺陷( 如肢体残疾、眼盲、兔唇等) ”“个人学习成绩差”等6个项目因无法与其相同维度的其他项目划分在一起,经讨论后予以删除。最终形成由60个项目组成的“童年期慢性应激评定问卷”。

2.3 问卷信、效度检验

2.3.1 信度分析

使用最终确定的60个项目的问卷分别在小学三 ~ 五年级,每个年级选取1个班共158名学生间隔14 d进行重测。结果显示,问卷总分和各维度得分前后两次测量之间的相关系数同质性信度、分半信度均达到要求。见表1。

2.3.2 效度分析

2.3.2. 1内容效度该问卷项目的编制采用文献综述、焦点小组访谈、国内外同类问卷筛选,以及课题组评议等方法。最终问卷经专家评议,认为该问卷具有良好的内容效度。

2.3.2.2结构效度采用极大方差正交旋转的因子分析法对该问卷进行因子分析,共获得10个公因子,累计贡献率为59.81%,各项目在公因子中的分布符合问卷的理论维度构想。在探索性因子分析的基础上进行模型构建,验证性因子分析结果显示,GFI,NFI,RFI,CFI拟合指数均大于0. 8,RMSEA近似均方根残差在0.05~0.09之间,表明问卷拟合度较好。见表2。

3 讨论

根据儿童童年期生活环境的生态系统理论编制儿童童年期慢性应激评定问卷[12]。家庭和学校( 幼儿园和小学) 是儿童活动的最主要场所,儿童监护人、教师、伙伴和同学是儿童接触的最主要人群。从家庭环境、学校环境、同伴关系、不良经历4个层面构建该问卷。其中家庭环境维度包括家庭成员间人际关系、父母婚姻状况、家庭结构类型、家庭暴力情况、家庭成员健康状况、家庭成员不良行为习惯、儿童的被抚养经历、家庭的社会关系、家庭社会地位、家庭经济状况、父母期望值、亲子分离情况、家庭突发事件等方面; 学校环境维度包括学业成绩、教师对自己态度、教师批评责骂、与同学或伙伴关系等方面; 同伴关系维度包括同学或伙伴欺凌、嘲笑与侮辱等方面; 不良经历维度包括躯体虐待、情感虐待、性虐待、躯体忽视、情感忽视等方面。这些多维度的项目设计,为准确评定我国儿童童年期慢性应激打下了良好的基础。

本问卷的每个项目均从项目的重要性、敏感性、代表性、独立性、确定性5个角度进行筛选,同时考察每个项目在施测过程中的可操作性和可接受性[13]。另外对从统计学角度考虑剔除的项目再进一步征求专家的意见,不仅保证了本问卷编制过程的科学性,同时增强了本问卷的实际应用性。对筛选后的项目进一步进行信、效度分析显示,该问卷各项指标均符合心理统计学要求,为进一步推广应用奠定了基础。

研究结果表明,该问卷最终保留的项目与预期理论设想基本一致,且具有良好的信度和效度,但尚需进一步扩大范围,在不同类型、不同区域的学生中应用,检验该问卷在不同特征儿童中应用的价值。理想的问卷还应该具有良好的预测效度,以证明该问卷的实际应用价值,因此尚需进一步扩大样本,通过队列研究检验该问卷的预测效度。

慢性应激往往持续、广泛地存在于儿童的整个童年期,是严重影响儿童身心健康的不良经历。该问卷从儿童生活环境生态系统的角度出发,较为全面地评价了儿童童年期主要慢性应激经历,对进一步探讨童年期不良经历对儿童身心健康的近期与远期不良影响提供了有效的工具。

摘要:目的 编制童年期慢性应激评定问卷并对其信效度进行检验,为儿童青少年心理疾患的筛查提供有效工具。方法 综合采用文献检索、焦点小组访谈和专家咨询等方法编制该问卷项目池,并在整群抽取的蚌埠市实验小学三五年级1 786名小学生中进行测试。采用8种统计分析方法如t检验、相关系数、逐步回归等以及专家评议确定问卷最终项目,同时对该问卷的信、效度进行检验。结果 通过8种项目筛选方法,最终形成了童年期同伴欺凌、童年期虐待与忽视、童年期不良生活事件3个大维度,同伴关系欺凌、同伴躯体欺凌、情感与躯体虐待、性虐待、情感忽视、躯体忽视、家庭不良生活事件、学校不良生活事件、个人不良生活事件9个小维度,共60个项目的问卷。问卷重测信度、同质性信度、分半信度分别为0.921,0.946,0.798。探索性因子分析结果表明,问卷结构与理论构想一致。验证性因子分析结果显示,问卷具有较好的按拟合度。结论 童年期慢性应激评定问卷具有较好的信度和效度,可以在更大范围进一步推广应用。

信效度分析 篇7

1 对象与方法

1.1 对象

首先选取北京市某中学的初中和高中各1个班进行预实验。主要是对问题的问法和选项进行修改,对直接翻译过来的内容进行中国化处理,避免出现生硬词汇,提高应答质量。正式施测阶段从2005年9月-2006年5月,以方便整群抽样方法,在北京市东城区的9所初中和高中学校的初中一年级和高中一年级分别选取32个班级作为样本,合计1 257人,其中男生676人,女生581人。年龄分布集中在12~13岁和15~16岁2个年龄段,共回收有效问卷1 143份。

1.2 研究工具

1.2.1 SDQ

本研究以适用于11~16岁的优势与劣势问卷的自我报告版本(self-report version of SDQ)作为研究工具,主要对其中的5个分量表共25道心理学相关题目进行检验。在引进原量表后,严格按照量表修订的原则进行了英汉互译。

1.2.2 SDQ的内容与结构

SDQ整体上适用于3~16岁的幼儿及青少年。SDQ包含家长、教师和自我报告3个版本,同时,对应于不同的年龄段,SDQ设置有相应的版本组合,如在低年龄段则不设置自我报告版本。

SDQ的大多数版本都包括25道反映不同行为方面的题目,这25道题目构成SDQ的核心部分,主要是从心理学角度对儿童青少年的行为进行评估,共分为五大部分:情绪症状、多动/分心、 品行问题、 同伴问题和亲社会行为。前4部分构成总的劣势部分(total difficulties),其得分反映青少年的行为劣势问题;第5部分为优势部分,主要反映青少年社会交往能力的优势。劣势部分的分数越高,出现危险和问题行为的可能就越大;优势部分得分越高,表示优势越大,发生问题行为的可能性越小[7]。

1.3 评分方法

SDQ采用3级分类计分方式,每题分别计0~2 分,每增加1级,增加1分。SDQ共包括25个题目,分为优势与劣势2部分。优势部分题目共20 道,对应于4个分量表,采用3级制正向计分法:(1)不是;(2)一些时候是;(3)总是。分别计0,1,2 分。第2部分题目5道,采用3级负向计分法:(1)总是;(2)一些时候是;(3)不是。分别计2,1,0 分。

1.4 施测程序

施测采用团体纸笔测试的方式,由主试宣读指导语及解释相关细则,采用统一的指导语和统一的答题纸,待被试充分了解答题要求后开始答卷。

2 结果

2.1 内部一致性信度与重测信度

以内部一致性信度作为信度的主要指标,以重测信度作为补充。全量表Cronbach α系数为0.69,总劣势量表α系数为0.68,各分量表的α系数在0. 30~0. 63之间,差异悬殊,平均值为0.47,信度水平较低。重测信度与内部一致性信度在各个分量表上表现出大体一致的分布。见表1。

注:*把亲社会行为分量表的优势得分对应换算为劣势得分,进而计算全量表的内部一致性信度。**总劣势量表和全量表重测信度原始数据缺失。

2.2 各分量表之间的相关性

4个劣势分量表间均呈现正相关,4个劣势分量表与有亲社会行为优势量表均呈现负相关。除了情绪症状分量表与亲社会行为分量表间的相关不具有显著性以外,其他分量表之间的相关均有统计学意义(P值均<0.01)。见表2。

注:**P<0.01。

2.3 因素分析及有效载荷矩阵

Kaiser-Mayer-Olkin(KMO)测度和Bartlett球形检验结果显示:KMO检验值为0.784(>0.5),表明样本大小适合因素分析;Bartlett球形检验值为3 618.715,显著水平为0.000,这说明变量间有共享因数的可能性,做因素分析是合适的。表3~5分别列出了对SDQ进行因素分析后的总体方差解释结果和方差最大正交旋转后因素有效载荷矩阵。结果显示:以特征根大于1作为提取公因素的标准,共提取出8个有效公因素,公因素的方差百分比贡献率占25个变量的52.07%,属于中等水平,用Bartlett公式对其特征值进行无关意义检验,其数学意义明显。

表6结果显示:因素1和因素4主要对应于情绪情感症状分量表;因素2主要对应于亲社会行为量表;因素3主要对应于多动/分心分量表;因素6和因素7主要对应于品行问题分量表;同伴问题分量表的5个题目6,11,14,19,23分散在因素1、因素4、因素5和因素8共4个因素中,并不集中;多动/分心分量表的题目21的载荷情况比较分散,无法找到具有说服力的载荷因素;亲社会行为分量表的题目4的主要载荷因素为因素5,与预计结构有出入。

注:*题目21并没有出现在表格中,因为其没有明显的载荷因数;**分号后的题目为载荷存在偏离的题目,即并不属于表格第3列相应的分量表的题目。

3 讨论

3.1 SDQ内部一致性信度

信度检验结果显示,SDQ的内部一致性信度水平可分为2类:总劣势量表以及情绪症状、多动/分心、亲社会行为分量表信度水平相对较高,α系数分别为0.68,0.57,0.63和0.57;品行问题和同伴问题分量表信度很低,α系数均为0.30。与国内外同类研究的内部一致性结果相比较,发现以下特点:(1)本研究得出的SDQ自我报告版本的内部一致性信度与杜亚松等[8]于上海开展的研究结果基本类似,但与国外同类研究结果相比则相对偏低,除了总劣势量表的内部一致性信度尚可接受外,其余各分量表的信度水平均低于国外其他同类研究[6,7,8,9,10,11]。(2)同类研究的各分量表α系数呈现同升同降的趋势,品行问题分量表和同伴问题分量表在所有研究中均为内部一致性信度较差的2个分量表,且α系数均低于0.65[8,9,10,11,12,13,14]。品行问题分量表在本研究以及Muris等[12]于荷兰、Koskelainen等[13,14]于芬兰开展的研究中为内部一致性信度最差的分量表,且α系数均低于0.60,最低达到0.30。情绪症状、多动/分心及同伴问题分量表的内部一致性信度较好。(3)SDQ自我报告版本的内部一致性信度缺乏稳定性。SDQ自我报告版本的内部一致性信度不仅在同一研究中通常低于家长版本和教师版本,而且在各个研究间缺乏稳定性,以品行问题和同伴问题分量表的各研究间的差异最大。

3.2 各分量表相关

当一个测验的各分量表之间呈低相关且同方向时,表明各分量表独立测量水平高,且测量方向一致;而当各分量表之间相关偏高时,则预示着不同分量表有可能从同一角度重复测量某一潜变量,此时相关偏高的分量表效率降低。SDQ 5个分量表因素分析总体方差解释结果证实了此现象的存在,说明 SDQ各分量表和维度独立测量水平还有待于提高。尽管SDQ各分量表之间均呈相应的相关关系,测量方向一致,但是绝大部分相关均达到了十分显著的水平,说明SDQ存在交叉测量相同潜变量的现象。这种现象不仅影响每个分量表的独立测量水平,同时分量表之间的高相关还会带来因素不独立或存在明显交叉相关,出现表5所示的因素分析结果的交叉负荷,从而影响测验的结构效度。

3.3 结构效度

因素分析结果显示,能够从SDQ中提取出8个有效公因素,尽管没有获得与分量表数量对应的5个公因素,但提取的8个公因素也与各分量表形成一定的对应,与SDQ的假设结果具有一定的相似性,一定程度上验证了SDQ的结构效度,结果尚可接受。但由于分量表间的高相关,公因素间也存在一定的交叉测量题目。杜亚松等[8]于上海的研究共提取了5个公因素,但累计方差贡献率较低(41.8%),5个公因素中只有3个意义明显,另2个表现为各分量表题目混合的因素。与国外同类研究结果[6,7,8,9,10,11,12,13,14,15]的结构效度相比,本研究及国内同类研究所示的结构效度尚存在一定的不足。大部分国外同类研究都能提取出与各分量表一一对应的5个公因素,并且因素间交叉测量现象不明显,与SDQ结构一致,结构效度明显。

3.4 SDQ的跨文化应用

SDQ由美国心理学家Robert等[1]开发,最早应用于英国。作为儿童青少年心理健康和行为问题的测量和诊断工具,SDQ与Child Behavior Checklist(CBCL)等同类量表相比更加简洁、友好,并已有大量研究证实其具有良好的信效度,SDQ也因此成为全球范围内应用最广泛的同类量表之一。如今,SDQ已经被翻译成66种语言,被40多个国家或地区正式引进。尽管在语言版本上SDQ已经相当丰富,但大部分应用和研究都集中在欧洲国家,对于亚洲的印度、日本和使用中文的国家和地区(中国、中国香港、中国台湾、新加坡)的相关信息则少之又少[6],形成了很大的缺失。同时现有研究[6,8]也提示文化差异在引进SDQ过程中的重要性,尤其是对于SDQ自我报告版本,国内研究结果的信效度水平均低于国外同类研究的平均水平,信效度有待提高。

3.5 建议

本研究SDQ自我报告版本内部一致性信度和结构效度水平均低于国外同类研究的平均水平,但各分量表α系数与国外研究呈现同升同降的趋势,说明本研究过程可能存在一定的系统误差,需要对SDQ自我报告版的中文版在翻译、措辞和信效度等方面进行进一步修正和检验。无论是本研究还是国外同类研究的结果,都显示出SDQ自我报告版本的内部一致性信度水平并不令人满意,尤其是品行问题和同伴问题2个分量表。SDQ自我报告版本的结构效度相对明显,同类研究结果相对稳定,但部分分量表存在测量同类潜变量现象,影响了测量因素的独立性,可通过对分量表相关关系的考察解决此问题。

SDQ的中国化和引进是必要的,也是可行的,但信效度有待提高至国外同类研究的水平。现阶段,在我国可将SDQ视为研究工具,在进一步修正、检验和建立基线水平后,再正式投入各方面的实际测试与应用。

摘要:目的 分析优势与劣势问卷自我报告版本的信度、效度,为正式引进该问卷提供依据。方法 采用方便整群抽样方法,选取北京市1257名初高中生作为研究对象,以纸笔测试的方式对其施测优势与劣势问卷的自我报告版本。结果 优势与劣势问卷自我报告版本存在的主要问题是内部一致性信度指标偏低,除全表和总劣势量表Cronbachα系数分别为0.69和0.68外,各分量表内部一致性信度水平均较国外同类研究有所不足,尤其是品行问题和同伴问题2个量表的Cronbachα系数仅为0.30;各分量表的相关方向符合量表设计,测量方向一致,但相关普遍达到统计学水平,说明存在测量同类潜变量现象,影响了测量因素的独立性;因素分析所提取的公因素大体与5个分量表形成了有效的对应,累计方差贡献率达到52.07%,结构效度相对可以接受。结论 优势与劣势问卷在我国应进一步修正、检验和建立基线水平后,再正式投入实际应用。

信效度分析 篇8

1 对象与方法

1.1对象选定高中学生为对象, 原因包括: 探索发展有关健康素养的评价工具, 主要基于高中生身心和行为发育特点及其健康素养与健康危险行为存在交互作用[9]; 同时考虑高中生具备基本维护自身健康的能力, 与国内外居民健康素养调查的常用年龄范围较为吻合; 另外, 高中生在研究的实际操作过程中具有样本收集、现场组织、依从性较好等特点。分层随机整群抽取北京市6个区县 ( 3个城区, 3个郊区) 7所高中的高一、高二年级学生1 516名为调查对象, 收回有效问卷1 489份, 有效率为98.22%。其中城市学生713名, 郊区学生776名; 男生728名, 女生761名; 高一和高二年级学生各占50%。平均年龄 ( 16. 32±0.79) 岁。

1.2高中生健康素养评价问卷的研制

1.2.1高中生健康素养评价初始框架与指标的构建依据Nutbeam等[10,11,12]国内外学者提出健康素养理论模型, 及有关健康素养评价文献, 特别是教育部2008年《中小学健康教育指导纲要》、卫生部和国家标准化管理委员会颁布实施的《中华人民共和国国家标准: 中小学健康教育规范 ( GB/T 18206-2011) 》、卫生部《中国公民健康素养: 基本知识与技能 ( 试行) 》等我国健康素养、健康教育的相关政策要求[7,13,14], 围绕健康知识、健康理念、健康技能和健康行为4个维度, 预设形成高中生健康素养评价初始框架和指标构建。

1.2.2高中生健康素养评价初始框架与指标的调整为验证高中生健康素养评价初始框架与指标在中国背景下的适宜性及可接受性, 研究分别进行了目标人群定性访谈和专家咨询。首先, 在北京市1所高中选取学校健康教育的实施者和接收者, 包括10名学生 ( 男、女生各半) 和3名健康教育相关教师, 开展高中生健康素养定性访谈研究。以学生接受学校健康教育的效果为切入点, 了解初始评价框架中涉及的评价内容与指标在学生和健康教育教师日常生活中的应用。其次, 结合专家德尔菲法[15]进行2轮专家咨询, 共邀请15名国内知名专家对高中生健康素养评价初始框架与指标进行筛选、调整。指标筛选原则为: ( 1) 指标得分低于所有条目的总平均分; ( 2) 当2名及以上专家提出某一条目不适用于高中生时, 删除该条目。

1.2.3高中生健康素养评价问卷的题目编制及预试验在建立高中生健康素养评价最终框架和指标体系的基础上, 遵循科学、准确、适度的原则, 建立测评题库, 并应用计算机技术, 随机形成一套高中生健康素养评价初始问卷。随后, 采用方便整群抽样法, 在北京、上海、河南3个省市各选1所高中1个班级的全部高中生作为调查对象 ( 有效人数100人) , 进行预实验以验证该初始问卷的适用性, 包括难度和区分度分析。

1.2.4高中生健康素养评价问卷的应用性检验分析

以预试验调整之后确定的高中生健康素养评价问卷为本次研究的核心调查工具, 开展北京市高中生健康素养的现况调查。该问卷共计87项, 分为基本情况、健康知识、健康理念、健康技能和健康行为等5个部分内容。

采用卫生部2008年编制“中国公民健康素养问卷”作为高中生健康素养评价问卷的效标, 结合中学生实际情况, 对其问卷技能部分进行相应删减 ( 实测题目为69题) , 考察本研究“高中生健康素养评价问卷”的标准效度。另外, 采用Weiss等[16]于2005年开发“NVS健康素养量表”和Norman等[17]于2006年开发“eHEALS健康素养量表”, 作为高中生健康素养评价问卷健康技能评价部分的客观技能和主观技能评价效标, 2个量表均由郭帅军等[18]进行了汉化。研究共选取240名高中生对所开发的高中生健康素养评价问卷与效标问卷的相关性进行测试。

1.4质量控制问卷均以匿名的个体施测方式, 按照班级为单位进行组织, 并当场检查问卷填写的完整性和真实性。为保证调查资料客观、准确, 在施测前对调查员进行统一标准和调查方法的培训。

1.5统计分析采用EpiData 3.02软件进行数据录入, 利用SPSS 13.0软件对数据进行统计分析, 包括一般统计学描述、信度和效度检验等。

2 结果

2.1高中生健康素养评价的框架和指标体系通过文献回顾、专家咨询、定性研究等多种策略, 确立形成了高中生健康素养评价框架与指标体系。其最终框架与初始框架相比, 第二级和第三级维度指标均有所调整, 最终形成三级维度指标体系, 分别有19个二级和56个三级指标。见表1。

2.2问卷的信度分析本研究采用Cronbachα系数、Spearman-brown分半信度和重测信度, 通过调查1 489名高中生, 对评价问卷的内部一致性信度进行考察。同时在调查2周后按照样本总量的10%再次选取162名高中生进行调查, 计算重测信度以考察评价问卷的稳定性。结果 显示, 问卷的Cronbachα系数、Spearman-Brown分半信度和重测信度系数分别为0.739, 0.764, 0.716 ( P值均<0.01) 。

2.3问卷的效度分析问卷各维度得分与总体问卷得分之间的相关系数在0.511~0.800之间, 均有统计学意义 ( P值均<0.01) 。

采用验证性因子分析的方法对评价问卷的结构效度进行评价。因子分析之前, 以KMO/Bartlett球型检验方法检验取样的适切性, 结果显示, KMO值为0.642, Bartlett球型检验值为293.697 ( P<0.01) 。结构效度的验证从健康技能维度入手, 对其7个客观测评题目进行验证分析发现, 采用主成分分析共提取2个特征根大于1的公因子, 累计可以解释总体变异的37.38%。最大方差正交旋转后各题目的因子负荷以及题目在各维度因子上的分布情况见表2。根据题目表达含义, 确定因子1为“日常保健基本技能”、因子2为“急救与应急技能”, 与原始问卷中健康技能部分的结构相吻合, 表明问卷中健康技能部分的结构效度较为理想。

高中生健康素养评价问卷与“中国公民健康素养问卷”得分的相关系数为0.716, 对应各维度的相关系数在0.463 ~ 0.741之间, 均有统计学意义 ( P值均< 0.01) 。同时, 汉化的“NVS健康素养量表”和“eHEALS健康素养量表”与高中生健康素养评价问卷中健康技能客观和主观评价部分的相关系数分别为0.230, 0.339 ( P值均<0.01) , 说明高中生健康素养评价问卷具有较好的标准效度。

3 讨论

近年来, 健康素养研究领域已被各个国家广为关注。虽然健康素养在国际上已有较为公认的定义[19], 然而, 在实际应用过程中, 人群健康素养从哪些维度进行界定和评价一直是国内外许多研究者探讨的问题[3,20]。

本研究从公共卫生背景出发, 结合中国现有的学校健康教育开展状况, 针对高中生群体, 依据国内外相关的理论模型[10,11,12], 将健康素养的维度界定为健康知识、健康理念、健康技能和健康行为4个方面。并在此维度下, 探索确定了高中生健康素养评价的三级内容结构, 从而为发展高中生健康素养评价问卷的研制提供了框架基础。

在高中生健康素养评价问卷开发研制过程中, 采用文献回顾、定性访谈、专家咨询与现场验证相结合的方法, 问卷的开发研制程序符合心理测量学要求, 通过信效度检验, 进一步验证了高中生健康素养评价问卷的结构。内部一致性信度和重测信度的考察结果表明, 高中生健康素养评价问卷的信度系数均>0.7, 表明问卷的信度较好[21]。内容效度和标准效度检验结果表明, 高中生健康素养评价问卷能够较好地反映问卷各维度的内容, 并具有良好的标准效度。验证性因子分析结果显示, 健康技能维度下题目的预设维度 ( 急救与应急技能、日常保健基本技能) 与实际分析结果 ( 急救与应急技能、一般日常基本技能) 基本吻合, 但提取的2个公因子累计方差贡献率仅为37.38% ( 低于50%) , 表明提取的公因子不够充分, 尚不能完全反映所有测量题目内容, 可能与“急救与应急技能”维度下的题目数偏少有关。以往研究显示, 验证性因子分析时, 每个因子至少应该有3个评价指标[20]。因此, 在今后研究中, 问卷的结构效度还需进一步完善。

信效度分析 篇9

为测量道德脱离的结构, 1996年Bandura等[3]首创了道德脱离量表 (Moral Disengagement Scale) 。量表应用的对象是儿童与青少年, 有良好的信度[4]。针对单亲家庭儿童、大学生、男性少年犯、普通青少年等其他群体的研究也支持问卷的单因素结构, 并具有良好的信度和效度[5,6,7]。我国的一些研究发现, 道德脱离量表在小学高年级学生中呈现六因素结构[8], 在中国大学生被试中呈现相对清晰的八因素结构[9], 并且有些项目并不适合中国被试, 有必要进一步修订。因此, 本研究拟以中国文化背景下的初中生为被试, 对道德脱离量表的适用性进行探讨, 并对量表作必要的修订, 为相关的理论研究奠定基础。

1 对象与方法

1.1 对象

采用整群随机抽样的方法, 从济南市2所普通初中抽取初一、初二、初三学生共883名进行施测, 回收有效问卷826份, 有效率为93.54%。其中男生435名 (52.66%) , 女生391名 (47.34%) ;初一学生276名, 初二学生260名, 初三学生290名。3周后, 对随机选取的46名被试进行重测, 以考察量表的重测信度。

1.2 工具

1.2.1 道德脱离量表

采用Bandura等编制的道德脱离量表进行测量[7]。该量表为自陈问卷, 包括8个分量表, 分别代表1种道德脱离的机制, 即道德理由、委婉标签、有利比较、责任转移、责任扩散、歪曲结果、过失归因和非人性化。每个分量表有4个项目, 共有32个项目。采用5点计分, “1”表示“完全不赞同”, “5”表示“完全赞同”。量表由10名发展心理学专业研究生分别翻译又集体校对2次。再由外语专业研究生进行回译, 对翻译准确性进行确认。同时让2名小学六年级学生对量表意义的可理解性进行确认。最终由1名心理学专家对项目逐条分析, 确认量表内容。

1.2.2 攻击行为问卷

采用Raine等[10]编制的自我报告的主动性和反应性攻击问卷。该问卷包括主动性攻击与反应性攻击2个维度。问卷共包含23个项目, 其中12个项目描述主动性攻击, 11个项目描述反应性攻击。采用3点计分, “0”表示“从不”, “1”表示“有时”, “2”表示“经常”, 分数越高代表攻击性越高。验证性因素分析结果显示, 模型拟合较好 (χ2/df=4.032, RMSEA=0.062, CFI=0.940, IFI=0.940, NFI=0.922, TLI=0.928) , 两因子之间的相关系数为0.608, P<0.01;主动性与反应性攻击的Cronbach's α系数分别为0.81和0.79。

1.3 统计方法

所有数据均采用SPSS 11.5及AMOS 4.0进行统计分析。

2 结果

2.1 项目分析

以项目与问卷总分的相关系数和高低分组在每个项目上的差异为指标, 考察项目的区分度。结果表明, 各项目与问卷总分的相关系数为0.292~0.625 (P值均<0.01) 。将测试总分最高的27%的儿童作为高分组, 测试总分最低的27%的儿童作为低分组, 对每个项目进行平均数差异的显著性检验, 结果显示, 每个项目的平均数差异均有统计学意义 (P值均<0.05) 。表明问卷的各项目均具有良好的鉴别力。

2.2 结构效度

2.2.1 验证性因素分析

根据英文版道德脱离量表的组成内容和测试目的, 提出假设模型M1:一阶单因素模型, 即量表的32个项目共同负荷于1个道德脱离因素上。根据道德脱离包括的8种机制提出假设模型M2:一阶八因素结构, 即道德脱离由八因素共同解释, 量表的32个项目分别负荷于8个因素, 因素之间平行排列, 自由相关。另外, 对这8个因素作相关分析, 结果显示, 因素间相关均有统计学意义 (P值均<0.01) , 见表1。说明因子结构可能蕴涵着更有解释力的高阶因素, 因此有必要进行二阶因素分析。据此提出假设模型M3:二阶一因素一阶八因素模型, 即存在一个高阶因素来充分表达8个因素。在3个假设模型中, 二阶一因素一阶八因素模型 (M3) 的拟合指数比一阶单因素模型 (M1) 和一阶八因素模型 (M2) 能更好地满足拟合优度模型的条件, 拟合最好。由于模型M3中, 责任扩散因素的2个项目“团体中的一个成员不应该因为团体造成的麻烦而受到指责”和“如果一个人只是建议违反规则而没有违反, 而别人在他的建议下违反了规则, 那么建议违反规则的人不该受到指责”的因子负荷小于0.3, 删除后该因素的项目数小于3, 因此将该因素删除, 即形成道德脱离的二阶一因素一阶七因素模型 (M4) 。对模型M4进行验证性因素分析, 模型的拟合度见表2。一阶因子在二阶因子上的负荷值较高且大致相同 (0.78, 1.07, 0.88, 0.94, 0.97, 0.89, 0.91) , 说明二阶因子能够比较充分地表达一阶因子间的关系。因此, 根据模型的简约性原则, 认为M4模型是较优模型, 即道德脱离的结构是二阶一因素一阶七因素模型, 其中一阶七因素为道德理由、委婉标签、有利比较、责任转移、歪曲结果、过失归因和非人性化, 二阶一因素为道德脱离。见表2。

注:P值均<0.01。

2.2.2 效标关联效度

利用主动性和反应性攻击问卷作为效标, 考察道德脱离量表的效度情况, 结果显示, 道德脱离与主动性攻击、反应性攻击均存在正相关 (r值分别为0.38, 0.40, P值均<0.01) 。

2.3 信度检验

本量表的信度检验选用内部一致性系数 (Cronbach's α系数) 、分半系数 (Split-half系数) 和稳定性系数 (重测系数) 作为信度指标。检验结果显示, 总量表的内部一致性系数为0.87, 分半系数为0.82, 重测信度为0.73;各因素的内部一致性系数为0.46~0.70。表明该量表具有较好的信度。

3 讨论

本研究通过对道德脱离量表的各项目进行项目分析, 发现该量表具有较好的项目区分度。进一步通过验证性因素分析发现, 道德脱离量表的结构在中国初中生被试中呈现二阶一因素一阶七因素结构, 即道德理由、委婉标签、有利比较、责任转移、歪曲结果、过失归因和非人性化为一阶七因素, 道德脱离为二阶因素。这与以往结论不一致[5,6,7,8,9]。说明不同的文化背景下、不同被试群体的道德脱离机制可能存在差异, 因此有必要对道德脱离量表进行修订, 以适用于不同的被试群体。本研究采用主动性攻击和反应性攻击问卷为效标, 对道德脱离量表的效度进行考察发现, 道德脱离与主动性攻击和反应性攻击均存在正相关, 说明本研究修订的道德脱离量表具有良好的校标效度。

同时本研究对修订量表的信度分析结果显示, 道德脱离量表具有较好的信度。因此, 经过修订后的道德脱离量表可以供今后在我国开展初中生道德脱离相关研究使用。

参考文献

[1]BANDURA A.Social cognitive theory of moral thought and action//KURTINES WM, GEWIRTA JL.Handbook of moral behavior and de-velopment[M].Hillsdale NJ:Lawrence Erlbaum Associates, Inc, 1991:45-103.

[2]BANDURA A.Moral disengagement in the perpetration of inhumani-ties[J].Person Soc Psychol Rev, 1999, 3 (3) :193-209.

[3]BANDURA A, CAPARA GV, BARBARANELLI C, et al.Mecha-nisms of moral disengagement in the exercise of moral agency[J].JPerson Soc Psychol, 1996, 71 (2) :364-374.

[4]BANDURA A, BARBARANELLI C, CAPRARA GV, et al.Multi-faceted impact of self-efficacy beliefs on academic functioning[J].Child Dev, 1996, 67 (3) :1206-1222.

[5]PELTON J, GOUND M, FOREHAND R, et al.The moral disengage-ment scale:Extension with an American minority sample[J].J Psy-chopathol Behav Assess, 2004, 26 (1) :31-39.

[6]KIRIAKIDIS SP.Moral disengagement relation to delinquency and in-dependence from indices of social dysfunction[J].Int J Offend TherComparat Criminol, 2008, 25 (5) :571-583.

[7]PACIELLO M, FIDA R, TRAMONTANO C, et al.Stability andchange of moral disengagement and Its impact on aggression and vio-lence in late adolescence[J].Child Dev, 2008, 79 (5) :1288-1309.

[8]潘清泉, 周宗奎.儿童道德脱离量表的初步修订[J].中国临床心理学杂志, 2010, 18 (2) :165-167.

[9]王兴超, 杨继平.中文版道德推脱问卷的信效度研究[J].中国临床心理学杂志, 2010, 18 (2) :177-179.

上一篇:创新型临床医学人才下一篇:客户诚信度