基于因子分析和聚类分析的学生网络学习行为研究
王坚 张媛媛 柴艳妹
摘 ?要 对学生的网络行为进行研究,首先获取具有典型意义的观测指标构成原始数据集,通过因子分析,提取出能够客观反映学习特征的两个公共因子,并依据不同学生的因子得分进行聚类分析,通过分析结果可以看出,学生网络学习具有群体性的特征。此外,重点讨论未来的改进重点和实施依据。
关键词 学习分析;因子分析;聚类分析;网络学习行为
中图分类号:G645 ? ?文献标识码:B
文章编号:1671-489X(2019)18-0003-03
Analysis of Students Online Learning Behavior based on Factor Analysis and Cluster Analysis//WANG Jian, ZHANG Yuanyuan, CHAI Yanmei
Abstract In this paper, the network behavior of students is studied. Firstly, the original data set is made up of typical observation indi-
cators. Through factor analysis, the common factors that can objec-
tively reflect the characteristics of learning are extracted. According to the factor scores of different students, clustering analysis is
carried out. Through the analysis results, it can be seen that students
network learning has the characteristics of group. This paper also
focuses on discussing the future improvement emphasis and imple-mentation basis.
Key words learning analysis; factor analysis; cluster analysis; on-line learning behavior
1 引言
通过网络平台进行学习,具有学习资源丰富、学生主体性强、交互独特及学习时空灵活的特点[1]。与传统教学模式面对面的交流不同,学生的学习行为更多是源于自发,学习过程由学生自主确定学习步调。学生由于个性特征、学习背景、对待课程态度、网络学习认知以及与其他学生互动程度的不同,其学习行为表现也有较大的差异性。在不同情境下,同一学生个体受到个人兴趣、状态等多方面特征的影响,获得感也有所不同,有时甚至会产生惰性心理,这些都对自身的适应能力和自控能力提出较高的要求,也对教学的组织和引导有着更大的期待。
学习分析是近年来教育技术领域迅速崛起的热点问题,它的出现也推动了教育信息化的浪潮[2]。它从网络入手学习的过程数据,特别是学生的行为数据,采用先进的分析方法和分析工具,如数据挖掘和可视化方法等,对学生在学习过程中遇到的问题进行诊断,并对学习结果做出预测,从而有针对性地优化和增强教学效果[3-4]。
学生的网络学习行为所产生的行为数据间往往具有很强的相关性,运用因子分析方法,可以从多维的特征数据中抽取出因子组合,这些因子不能直接从原始数据中获取,但可以通过转换矩阵等工具计算得到[5]。本文采用因子分析的方法来客观反映学生学习行为特征和本质,并利用因子分析的结果对学生行为进行聚类分析[6-7],对学生样本按照其行为的近似程度,实施无监督的分类过程,对聚类结果进行判别,可以进一步确定导致不同学习行为特征的关键要素,关注学生切实需求,改进教学方法。
2 研究背景
大学计算机基础作为中央财经大学的计算机公共基础课,在培养学生计算思维、提升学生数字素养方面有着重要的作用。在课程教学实践过程中引入混合式教学的理念,即学生的主要学习行为依靠网络教学平台来完成,包括视频学习、在线练习、在线测试、在线讨论等多个环节,同时辅以线下的难点授课、课程答疑、小组讨论、作业评价等项内容,如图1所示。
从图1中可以看出,网络平台中一系列的教学内容、教学环节和教学元素,精心组织和建设后,以包括音视频在内的多种媒介形式展示给学生,供其自主学习。本研究选取2017年参与该混合式教学的219名学生作为研究对象,课程开设周期为15周,以每位学生初次登录到最后登录平台期间所产生的记录数据为主要分析对象,共设计八个观察指标,能够从整体反映学生学习的个性化特征,通过网络后台获取相关日志文件,构成初步数据集,如表1所示。
在网络平台学习过程中,对于视频课件的学习是学生自主掌握有關知识点的重要环节,因此,研究中用学生观看视频的学习时长和学生在线学习时长共同来反映每位学生利用网络教学资源进行学习的时间长度;登录平台频次、观看视频频次以每周为单位,统计学生利用教学资源的次数,用来反映时间频度;在交流与协作类指标中,主要包括学生参与答疑次数(线上/线下)、参与论坛讨论交互次数等;而阶段性检测指标主要考量学生的阶段性学习成果,包括练习完成比、测试完成比等。
3 学习行为因子分析
因子分析(Factor Analysis)也称降维分析,其基本思想是根据变量之间的相关强度对变量进行分组组合,组内变量相关性较强,组间变量相关性较弱。每一组变量代表一个不可直接观测的潜在变量,即公共因子。公共因子可以看作所有指标的共同影响因素,通过因子分析,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即Xi=ai1F1+ai2F2+…+aimFm+εi(i=1,2,…,n)。其中F1,F2,…,Fm为公共因子,εi为指标Xi所对应的特殊因子,表示原始变量中所特有的部分。在原变量X和因子F可以通过转换矩阵A建立关联,表示为:X=AF+ε。其中:
为了能够对学生学习行为进行综合分析,采用因子分析对有关指标特征进行降维,即学生的学习行为可以通过少数几个公共因子来进行解释。表2给出KMO检验统计量与Bartletts球形检验结果。KMO统计量等于0.894,Bartletts球形检验的值为0.000,这些也都说明本例中的数据比较适合进行因子分析。
表3中给出因子分析各个阶段的总方差解释表,根据特征值大于1的主成分提取原则,可以提取出两个公共因子。从表3中可以看出,前两个因子已经可以解释原始变量73.341%的方差,已经包含大部分的信息,即所有学生行为指标可以用这两个公共因子进行表征。公因子经过旋转后的方差贡献有所变化,但总的累积方差贡献率并没有改变,依然是73.341%,而因子间的差异性有所减小。
表4给出旋转后的因子载荷矩阵,从表中可以看出,第一个公共因子在指标X1、X2、X4、X3、X5、X6上有较大载荷,说明这六个指标有较强的相关性,可以归为一类。从指标类型来看,这六个指标属于在线学习参与程度,因此可以把第一个因子命名为学习参与因子。第二个公共因子在指标X8、X7上有较大载荷,同样可以归为一类。这两个指标同属学习检测指标,因此可以把第二个因子命名为课程测试因子。
4 学习行为聚类分析
聚类分析(Cluster Analysis)是研究指标分类问题的一种多元统计方法,不同学生的学习行为具有相似性,通过归类研究,有助于了解和分析不同分类群体的特征。
K-Means聚类算法是目前常用的一种聚类算法,需要首先确定类别数和对应的初始聚类中心,按最小距离原则将各特征值分配到某一类别中,之后不断地计算各个类别中心和调整各特征的类别,以各特征到类别中心的距离平方之和最小作为最终收敛判定依据[7]。
本文采用K-Means算法进行聚类分析,利用进行因子分析过程中产生的所有学生的公共因子作为输入特征,产生聚类结果如表6和表7所示,所有学生被分成三类。
第一类学生普遍具有在线时间长、学习内容具有连贯性的特征,其在线学习参与度高,具有自我约束机制,通过测试、练习积极提升自己的知识掌握能力。还可以判断出,这部分学生具有相当的主动性,乐于交流和相互学习。同时,这类学生在所有学生样本中占比最高,表明网络平台课程环节的设置能够与大多数的学生需求相匹配。
第二类学生网络学习的参与度和自主性最差,对课程学习参与程度不能达到课程基本要求,同时对练习、测试环节的关注程度也比较低,不能适应网络学习中自我约束、自我激励的要求,在学习主动性上亟待提高,必要时可以通过积极有效的手段进行干预。
第三类学生通过练习、测试等环节进行学习的积极性较高,而对在线课程的学习投入方面相对不足。这部分学生喜欢有激励的学习环节,更愿通过做题的方式来快速提升自己;对在线学习的其他环节重视度不高。对于这部分学生,着重需要通过增强网络教学的吸引力,以更加灵活多样的方式来鼓励他们重视学习过程。
从聚类整体结果可以看出,当学生处于第一类别时,能够很好地利用现有网络平台的教学资源,其学习效果整体较好,可以考虑引入适当的激励措施,保持其对网络平台参与的热情和自我把控;当学生处于第二类和第三类时,应及时给予相应的辅助手段,如增强定向辅导或实时沟通,促进学习态度和学习行为的有效转换;特别是对处于第二类别学生,要及时发出学业预警,进行关注。
5 研究结论
本文应用统计方法,通过对不同类型学生群体的行为特征进行分析,可以看出,学生大多能够适应和参与网络学习过程的构建,但仍然有部分学生兴趣不足,需要给予他们更好的沉浸式体验、更多的学习获得感,在平台的建设和设置过程中也需要增强灵活性和自适应能力。未来的工作重点将是以学生兴趣为着眼点,改善学习环境,帮助学生获得感的增强。
同时,本文所使用的学习行为特征,还是以学生的学习过程为主,但学生的学习习惯的养成和学习成绩的获得往往还受到学生的个性化因素的影响,如学生的学习态度、接受能力、情绪因素等,将这些因素结合起来,有助于更好地对学生群体进行分析。此外,本文中采取的聚类方式是事先确定了学生类别的,但实际中学生群体的划分是动态变化的,捕捉这种动态,有助于对实际学习过程的评判。而且单个学生群体的构成和演化有着一定的内在规律,个体的学习行为和群体的学习表征存在某种联系,对每一个群体,需要分析哪一个学生或者哪一些学生构成了核心,每一个人的学习行为是如何影响整个群体的学习过程的。
从增强学习效果的角度,因子分析和聚类分析等方法仅仅是提供了入口,除了及时了解和分析学生行为特征外,还要根据其学习记录,如观看视频情况、作业情况和测试情况,针对不同群体学生的学习规律做好资源服务和内容推送,满足其阶段性需求,同时对未来的学习路径和学习效果进行预测,实现智能追踪,创建自适应的学习系统。
参考文献
[1]邱晓辉.网络学习者信息加工学习行为的分析及研究[D].武汉:华中师范大学,2008.
[2]刘清堂,王洋,雷诗捷,等.教育大数据视角下的学习分析应用研究与思考[J].远程教育杂志,2017,35(3):71-77.
[3]郭炯,郑晓俊.基于大数据的学习分析研究综述[J].中国电化教育,2017(1):121-130.
[4]EDUCAUSE, The New Media Consortium. Learning Analytics[R].The Horizon Report 2011 edition.
[5]贾丽艳,杜强.SPSS统计分析标准教程[M].北京:人民邮电出版社,2010:299.
[6]常浩,逯纪美.多元统计分析在大学生综合素质评价中的应用[J].数理统计与管理,2010,29(4):754-760.
[7]孫吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,
2008,19(1):48-61.