基于SPSS的教育技术专业学生成绩分析
蒋红星
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]
[摘 要]学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。基于SPSS统计软件,对某班级个案的学生成绩进行相关分析、聚类分析和因子分析,可以发现成绩数据背后潜在的教学规律或教学问题。
[关键词]SPSS 聚类分析 因子分析
[中图分类号] TP319 [文献标识码] A [文章编号] 2095-3437(2014)18-0004-04
一、绪论
学习成绩是衡量学生掌握知识和技能的重要依据,也是教学质量和教学效果的重要反映。通过对学生学习成绩的量化分析,可以发现数据背后潜在的教学规律或教学问题,为改进教学方法、优化课程设置或改善课程评价提供有价值的信息。
本文将对某校教育技术学本科专业某个班级的学习成绩进行相关分析、聚类分析和因子分析,数据来源于该班级一至三年级42门课程的原始成绩,班级人数为43人。因2名学生的成绩缺失严重,实际有效样本为41。个别学生某门课程成绩缺失的,以课程平均成绩替代。本次分析工具采用统计分析软件SPSS19.0。
二、分析方法
(一)相关分析
函数关系是变量间的一种确定性的关系,但在实际问题中,变量间的关系往往不是如此简单,一个变量的值不能由另一个变量的值唯一确定。这种两个变量之间依存关系但又不精确、不稳定的关系称为相关关系。相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法,它把变量之间的相关程度的强弱用适当的统计指标表示出来。
(二)层次聚类分析
聚类分析是研究“物以类聚”的一种有效的统计分析方法。聚类分析能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。[1]在分类过程中,人们不必事先给出一个分类的标准。
主要有两种聚类分析方法,即快速聚类分析方法(适用于大样本)和层次聚类分析方法。其中,层次聚类分析分为两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,成为R型聚类,它使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表型的变量进行分析,从而减少分析变量的个数。[2]
(三)因子分析
教育领域的研究需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有时可以用较少的综合指标来分析存在于各个变量中的各类信息,而各综合指标之间彼此是不相关的。代表各类信息的综合指标称为因子。因子分析的基本思想是将众多的原始变量浓缩成少数几个因子变量,利用这几个公共因子去解释较多需要观测的变量中存在的复杂关系[3],以达到简化现象,发现规律的目的。
三、分析过程
(一)对课程变量的R型聚类分析
对课程变量进行探索性R型聚类分析,可以找到课程之间的某些规律和特点。连续性变量的样本距离测量方法有多种,包括欧氏距离(Eucalidean Distance)、Minkowski距离、Chebychev距离和Pearon相关系数等。在SPSS聚类运算过程中,还需要计算样本与小类、小类与小类之间的亲密程度。SPSS提供了最短距离、最长距离、类间平均链锁法、类内平均链锁法等。[4]
本次分析采用了Pearon相关系数和类间平均链锁法。表1显示了所有课程进行R型聚类分析后的归类情况。
(1)当课程分成两类时。体育课都属于类别2,表明体育课以身体运动和技巧为主,跟其他课程不归属一个类别,符合常理。同时,模拟电子线路实验也属于类别2,可能的原因在于,模拟电子线路实验课程对学生的动作技能有一定的要求。
(2)当课程分成3类时。体育课IV归类出现变化,单独归入类3,说明体育课IV与其他学期的体育课的成绩考核可能存在差别。
(3)当课程分成4类、5类时。数字电路实验从其他课程中脱离出来,单独成为一个类别3,表明数字电路实验在课程评价或课程特性上,与其他课程存在一定的差别。
(4)当课程分成6类时。概率论与数理统计单独成为类别2,原因未知。
(5)当课程分成7类时。成为类别3的课程有马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论、思想道德修养和就业指导。这些课程基本上属于思政课程范畴,具有较强的亲密性。
(6)当课程分成8类时。彩色摄影技术、法律基础和军事理论含军训归为类别1。法律基础和军事理论含军训属于公共基础课,彩色摄影技术与之归为一类,原因未知。
其他大部分课程归为类别2,其中,传播学、英语等属于文科类课程,微机原理、高等数学、模拟电子线路属于理科类课程。从课程性质上看,类别2的课程很多课程之间似乎不存在非常紧密的联系。究其原因,可能在于学生因素或课程因素等,当然,也存在这样解释的可能性:学习成绩好的学生,不管是理科课程还是文科课程,其成绩都倾向于比较好;反之亦然。
四、结论
1.R型聚类分析归类异常的课程的分析。通过对课程的R型聚类分析,结果显示,大部分课程聚类方式符合常理,但是,彩色摄影技术、概率论与数理统计等少部分课程的归类显得异常。其异常的原因,可能是由课程内容或课程性质的特殊性造成的,可能是由于教师课程评价的不规范造成的,当然也可能是由其他因素导致的。针对这些归类异常的课程,建议在教学管理和课程评价等方面予以重点的关注。
同样,体育IV的成绩数据也存在异常。一个方面,它的异常表现在R型聚类分析中,体育IV单独归为一类,与其他三个学期的体育相关性小。另一个方面,在因子分析中,因子4对其他课程的因子载荷很小,但对体育IV的载荷达到0.912,同时,因子1、因子2、因子3对体育IV的载荷很小,因此,体育IV仅由因子4解释,体育IV与其他三个学期的体育课程不存在共同特征,体育IV可能在课程内容或评价方法等方面存在特殊性。
2.学生各学期的英语成绩显著正相关,英语分层教学是有必要的,具体的分班方法可以采用Q型聚类实现。
3.关于部分课程因子分析的讨论。通过对13门课程的因子分析,结果显示,这些课程最终归结为4个公共因子,这四个因子能够解释总变量的66.217%。其中,邓小平理论概论、马克思主义经济学原理(文科)、马克思主义哲学原理、毛泽东思想概论和思想道德修养归属于因子1,高等数学A、概率论与数理统计、离散数学、和线性代数B归属于因子2,体育(I)、体育(II)和体育(III)归属于因子3。利用因子分析,可以将该专业的课程设置划分为若干个目标指向相同的课程群。每个课程群对应了独立的公共因子,内涵了知识、技能和能力方面的共性因素。在教学过程中,应该注重对学生在各个课程群的共性素质和能力的培养。
[ 参 考 文 献 ]
[1] 杨晓明.SPSS在教育统计中的应用[M].北京:高等教育出版社,2004:247.
[2] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003:252-253.
[3] 刘访华,余瑞君.基于因子分析的学生成绩评价对提高本科教学质量的启示[J].中国人民大学教育学刊,2013(4):14-24.
[4] 王亮红,宋代清,徐娜.聚类分析在学生成绩分析中的应用[J].东北电力大学学报,2009(8):35-36.
[责任编辑:戴祯杰]