教育教学研究中量表的编制与优化

    李烁 李贵安

    

    

    

    摘? 要 教育教学研究离不开评价,评价量表是评价可靠性与有效性的最主要影响因素之一,要保证量表的信效度,必须经过科学的流程进行编制与优化。研究显示,在教育教学研究中,量表编制与优化的一般流程包括明确测量对象、划分测量维度、项目的编制、初步筛选、专家评审、样本试测、基于试测的优化。本研究着眼于流程中的细节问题进行探讨,并结合实例数据加以分析,以供广大研究者参考。

    关键词 教育教学研究;量表编制与优化;因素分析;信度分析

    中图分类号:G652? ? 文献标识码:B

    文章编号:1671-489X(2020)17-0076-03

    1 问题的提出

    教育教学研究离不开评价,没有评价过程的反馈,易使研究过于主观化,研究结果难以令人信服。随着评价理论的不断发展,形成不同种类的评价方式,但无论哪种评价方式,最终都离不开测量量表。要保证量表测量的数据可靠可信,就必须在量表编制与优化过程中使用科学的流程与方法。本研究基于中外测量学的文献及教育学和心理学领域为主的有关文献,总结出普遍适用于教育教学研究中量表编制的科学流程,着眼于细节问题进行探讨,并依据SPSS V21的样本数据作为实例加以分析,以供广大研究者参考。

    2 量表编制

    前期准备工作? 编制一个量表,第一步要明确所测量的对象,这个测量对象一般是研究中的主要概念或主要概念的一部分(如核心素养)。明确测量对象后,还要厘清測量的意义所在。一般而言,在教育教学研究中测量的意义分为两个方面:

    1)研究教育理论时需要获得量化的测量数据,以佐证已有理论或进行理论结构与内容的探究;

    2)教学实践者在进行某项干预后需要通过量化的数据来得到干预对象的某个特质在干预前后的变化情况,从而证明干预的效果。

    许多教育研究者认为,对于想要测量的东西心里早就清清楚楚,但结果却发现自己最初的想法比想象的要含糊得多。如果测量对象没有明晰的理论支撑就着手进行量表项目的编制,会导致很多可靠性与结构上的问题,这样如果到了后面的工作中再来弥补这些问题,将比一开始就把测量对象用完整科学的理论了解清楚要多出成倍的工作量。在量表编制的前期准备过程中,一定要对量表测量的对象所包含的内容与结构十分明晰。

    将测量对象所包含的因素进行分类是十分有帮助的。若测量对象的概念已有明确的结构框架,就可以直接使用,否则需要研究者自己进行分类与归纳。注意:不能只将测量对象的概念划分为几个维度,由于其在教育教学研究中,测量的有关因素一般比较复杂,因此至少需要将其中的每一个维度继续划分成多个次维度,按需要可以再将每个次维度继续细分,以此类推。

    生成初始项目池? 项目就是构成量表的基本单位。理论上,一个好的量表,其项目应该是从有关项目宇(Universe)

    中随机抽取的。由于假定项目宇为无穷大,这就基本上迫使人们打消实际去列举项目宇中所有项目并从其中随机取样的希望。在这一步工作中应该尽量多地罗列所有有关测量对象内容的项目,无须考虑量表长度的问题。因为在这一步,主观认为某个项目“不重要”是没有客观依据的。

    项目的形式多种多样,现在最常见的是李克特型,其他还有瑟斯顿治标法、能力测验题等形式,根据测量对象选择适合的形式即可。如果测量对象的内容很广,可能一些维度的测量不适合用同样的形式,那么这时候可以将不同的维度分别采用不同的项目形式,制作各自维度的分量表,最后再通过设计如相加或加权后相加等方式来计算总分。

    在项目编制过程中需要注意以下三点。

    1)避免冗长。冗长的项目一般过于复杂,难以保证项目的清晰度,容易引发受测者的负面情绪,但前提是不能以牺牲内容的代价来换取表面上的项目简洁性。

    2)避免有歧义的项目。如“我喜欢学习,因为学习让我快乐”,这个项目包含多个导向,做这种题目时受测者会感到困扰与为难,效度较低。

    3)避免过于宽泛。如“有扎实的学科专业知识”,明显不能客观体现被测者的学科专业知识水平。

    3 量表优化

    试测前的优化? 初始项目池一般会比较庞大。考虑到最终量表的简洁性,首先要对量表项目进行初步筛选,主要依照三个方面进行:

    1)删改表述有问题的项目;

    2)高度重复的项目保留其一;

    3)删改相关性有问题的项目。

    邀请有关专家来对池中的项目进行评审,并根据需要请他们对项目进行重新分类。邀请的专家建议包含两个领域:

    1)对量表测量对象有深入研究的专家,他们对测量对象有深刻理解,主要可以检验项目的内容效度;

    2)测量学领域的专家,他们对如何提高量表的信效度有丰富的经验。

    他们对于量表的建议很多都是建设性的,可以参考其建议对项目进行修改与增减。但也要考虑到专家本身也有一定的主观性,所以在更改或删除项目时,尤其需要反复斟酌。经过初步筛选与专家评审两个环节后,试测量表就生成了,之后应进行试测,使用试测获得的数据对量表进行进一步优化。

    探索性因子分析? 因子分析(又叫因素分析)能使研究者把一组反应事物性质、状态、特点等的几个变量简化为少数几个能反映事物内在联系、固有的、决定事物本质特征的因子。它对重新认识测量对象的内容结构有重要意义。

    以下将介绍一些基于探索性因子分析的量表优化方法,使用SPSS V21.0软件,处理软件自带样本数据“breakfast”,并进行实例探讨。因子分析的方法有很多种,还有因子旋转的问题,以下使用的是较常用的主成分分析法与最大变异正交旋转。

    首先是确认因子个数,任一量表的任一项目都与无数个因子有关,但要的只是最主要能反应量表项目的那些因子。如何判断应该取多少个因子合适呢?主要有三种方法。

    1)特征值法。因子的特征值对应的是该因素的方差贡献,因素分析时只需要取特征值较大的几个因子即可,公认的方法是取特征值大于1的因子。如表1所示,按照该方法,样本数据应该取前四个因子进行分析。

    2)累计方差贡献率法。因子的方差贡献率是该因子的特征值与所有因子特征值之和的比值,也可以体现因子解释项目得分变动能力。累计方差贡献率就是几个因子方差贡献率的和,这个值达到一定的百分比,就说明所取的这些因子已经可以解释量表中项目得分的大部分变动。在测量学中阈值一般被规定为80%。如表1所示,按照该方法,样本数据应该取前七个因子进行分析。

    3)碎石检验。这是由R.B.卡特尔提出的决定因子个数的方法。碎石图的横轴是特征值从大到小排列的各个因素,纵轴是各个因素对应的特征值。如图1所示,根据该方法,样本数据可取前3~5个因子。

    因素分析可以将项目进行分类,见表2的旋转成分矩阵。表中数据是各个项目在不同因子上的载荷值,这个值越大,说明该因子越能解释项目的变异。根据数据,可以将某个因子的载荷值较高的一些项目归为一类,原则是每个因子至少需要三个项目,之后再观察这些被归为一类的项目有什么共同特征。如果一个项目在两个因子上的载荷绝对值都超过0.4(如表2中的项目4与项目5),则说明从整个量表的结构上看,这个项目是不良的,综合考虑其重要性后,可以考虑删除。

    信度分析? 信度,又叫可靠性,是指问卷的可信程度。它主要表现检验结果的一贯性、一致性、再现性和稳定性。一般分析量表信度的方法有克隆巴赫α信度、分半信度等。本文基于克隆巴赫α信度,介绍量表信度需要达到的标准与信度分析中可以用来进行量表优化的数据。使用SPSS V21.0软件,处理软件自带样本数据“TV survey”,并进行实例探讨。

    表3中显示了量表的克隆巴赫α值与基于标准化项的克隆巴赫α值。在教育研究中,一般认为总量表的克隆巴赫α值在70%以上就是可靠的。表3中两项都大于70%,证明该样本数据的量表信度达标。如果克隆巴赫α值大于90%,则可能说明项目过多,可以通过相关性分析或探索性因素分析进行筛选。

    此外,信度分析也可以提供筛选项目的参考数据。一般认为,如果删除该项目对信度影响不大,甚至反而增加了信度,则这个项目可以考虑删除。但对信度的影响较小,只能作为删除项目的一个必要条件,不能作为充分条件。很多时候虽然删除一个项目对信度基本没有影响,但如果它在量表中有其特殊的意义,或在因素分析中是一个因子仅有的三个项目之一,则应该保留。

    表4中列出假设删除该项目后这个量表的克隆巴赫α值,通过数据可以得知前两个项目是肯定不可以删除的,因为删除这些项目会大大降低量表的克隆巴赫α值;而最后一个项目删除后反而增加了克隆巴赫α值,就可以考虑删除它。

    4 结语

    综上所述,在教育教学研究中,量表编制与优化的一般流程包括:明确测量的对象与意义、划分测量维度、项目的编制、项目的初步筛选、专家评审、样本试测、基于试测的优化。严格落实这些步骤而产生的量表信效度才有保证,所测量的数据才可具有较高的科学性,从而可很好地支撑研究内容,使人信服。在当今信息爆炸的时代,广大教育教学研究者也更应该注重量化数据的收集,在量表编制与优化上下功夫,才能为自己的研究打下坚实的基础,以使研究内容更为真实,研究结果更有意义。■

    参考文献

    [1]德威利斯.量表编制:理论与应用[M].3版.重庆:重庆大学出版社,2016:15-166.

    [2]陈胜可.SPSS统计分析:从入门到精通[M].北京:清华大学出版社,2010:10-324.

    [3]张勇.大学生自主性学习量表编制方法的研究[J].教学研究,2010,33(6):7-10.

    [4]王登峰,崔红.中国人人格量表(QZPS)的编制过程与初步结果[J].心理学报,2003,35(1):127-136.

    [5]Wang K T, WEI M, ZHAO R, et al. The Cross-Cultural

    Loss Scale: Development and Psychometric Evaluation

    [J].Psychological Assessment,2014,27(1):42-53.

    [6]金艷,揭薇.中国英语能力等级量表的“口语量表”制定原则和方法[J].外语界,2017(2):10-19.

    [7]连榕,杨丽娴,吴兰花.大学生的专业承诺、学习倦怠的关系与量表编制[J].心理学报,2005,37(5):632-636.

    [8]淡鑫.统计学编制量表的基本程序[J].新西部,2015(9):

    144,132.