有效学习视角下的学习行为辨识技术
范逸洲 汪琼
【摘要】? 近年来随着MOOC运动的发展,对学习者在线学习行为的分析和挖掘成为研究热点,而研究者和教学者都希望能够基于MOOC积累的大数据增进对网上教与学规律的认识。在此研究背景下,如何科学地辨析和标识学生的有效学习行为,便成为开展这类研究非常基础性的工作,会直接影响后续研究的发展空间,也会影响同类研究发现之间的比较与对话。本研究以一门慕课课程的近五百万条学习数据为基础,介绍了这门课程学生学习“行为标签词典”的产生过程,以及基于行为标签的学习行为辨识做法,特别指出了以往文献中常被忽略的依据不同行为的持续时间定义行为的价值。最后,本研究展示了基于行为标签词典的一个研究案例,即行为标签词典如何帮助我们了解学习者“一次学习”的特征。本研究作为方法论层面非常微观但又非常基础的一个探索,希望能够为领域内的类似研究提供借鉴思路,开启在共同行为辨识基础上的研究对话。同时也希望以本研究为出发点,征集更多有识之士用其他数据集对此模型进行检验、丰富和完善,使其能够成为诸如在线自主学习策略、网上课程教学设计有效性等研究的基础工具。
【关键词】? 学习分析;分析粒度;行为标签;慕课;有效学习;学习行为;行为日志数据;课程教学设计
【中图分类号】? ?G442? ? ? ? ?【文献标识码】? A? ? ? ?【文章编号】? 1009-458x(2021)1-0001-07
一、问题引入
在在线学习情境下,教师面临的教学挑战是“看不见、摸不到”学习者,不能像在面授环境下那样通过察言观色及时修正教学安排,提供学生需要的帮助。近些年,随着MOOC运动的发展,对学生网上学习行为的分析成为活跃的研究领域。除了希望通过数据分析为教师提供学生学习状况描述之外,人们也希望通过MOOC积累的大量学生学习数据,通过学习分析技术,增进对网上教与学规律的认识。在此研究背景下,如何科学地辨析和标识学生的有效学习行为,便成为开展这类研究非常基础性的工作,会直接影响后续研究的发展空间,也会影响同类研究发现之间的比较与对话。本研究聚焦的有效学习行为具体包括三个维度,即有效学习控制、有效执行学习任务和有效评估(张立国, 等, 2010)。有效学习控制是指学习者以学习目标为指引,选择最佳学习路径的过程;有效执行学习任务是指学习者作为自主学习者通过同化、顺应、整合和推演等认知行为达成学习目标的过程;有效评估指的是学习者正确评估自己对知识的掌握程度并继续投入到新学习任务的过程(张立国, 等, 2010)。
在分析学习者在线学习有效行为模式时,很多研究者的分析片段长度都是“一次学习”(session),即学习者从进入学习平台到“离开”学习平台的一个时间段。在当下很多在线学习平台(如慕课平台或智能导师系统)的设计中,除了明显的退出系统操作外,并没有特定的行为日志能够标志“一次学习”的结束,大多数情况下研究者会采用寻找“一个不合理的长日志记录”来切分“一次学习”。例如,某学习者在一个页面上停留了三个小时还没有后续行为,那么很显然他/她离开或中断了“这一次学习”。本研究也取退出系统或长时间不操作的情况作为一次学习的结束标志。
对学生在“一次学习”期间学习行为的辨识研究,早期多采用对各类教学资源的访问动作进行编码,以形成“行为标签词典”,并分析这些动作的频次和顺序。在不同研究中,对原始日志中行为数据打标签的方法和侧重有很大差异。例如,在研究整个学习过程时,学者会将一次学习中的日志数据按照开始学习、开始观看视频、结束观看视频、开始做测验、结束做测验和结束学习等主要学习节点进行打标签工作(Maldonado-Mahauad, Pérez-Sanagustín, Kizilcec, Morales, & Munoz-Gama, 2018; Davis, Chen, Hauff, & Houben, 2016);在研究視频观看行为模式时,学者会侧重视频观看内容的行为标签,如开始观看、暂停、向前寻找、向后寻找、加速播放、减速播放等;在研究学习者在平台上的学习路径时,学者会侧重平台切分的功能模型,如观看视频、完成作业、提交测验、参与问卷、参与论坛、浏览课程材料等(Wen & Rose, 2014; 刘智, 等, 2017)。
后来有学者提出应该更多地给标签赋予一定的意义或者信息,而不是简单地描述行为是什么。例如,有学者把观看行为或者浏览资源的行为分成第一次观看和再次观看(revisit),这样可以从拓展新知识和复习旧知识这两个维度来分析学习行为(Kizilcec, Pérez-Sanagustín, & Maldonado, 2017)。在有些学习策略的研究中,学者通过行为标签赋予日志数据更多的信息和意义。例如,有学者根据视频和测验的先后顺序标记了学习者四类观看视频的行为标签(Boroujeni & Dillenbourg, 2018),也有学者标记了寻求提示或帮助的行为标签(Kock & Paramythis, 2010)。这些研究与本研究有一些契合之处。
本研究以学习者有效学习的行为和策略为出发点,所建立的行为标签词典希望对于教师了解学生、学生认清自己都有意义。因此需要在上述动作编码粒度上再提高一个编码层次,即按照有效学习的视角,就学习者使用资源的状态对学习行为进行标记,并且更关注研究常见的行为组合序列。比如,同样是两次访问某个视频资源,如果第一次访问就看完了完整的视频,那么第二次访问视频就可以视为“复习”,但如果第一次观看只看了几秒,而第二次访问看完了整个视频,则第二次观看应属于“初学”。“初学”“复习”这样的编码更贴近教师关心的学生学习行为,通过对学生网上学习行为的这种编码,就可以了解并刻画学生的行为模式。比如,有学生进入系统后首先会去做测试,然后再根据测试做错的题去看相应的视频。本研究聚焦的编码技术就是要刻画出这样的学习行为序列,为后续研究不同学习行为模式的学习效果奠定基础。
与传统教育研究的编码框架来自理论分析不同,本研究的学习行为分析词典主要来自于经验数据,并用一门MOOC近万名学生的数据检验了行为标签词典的可用性。在此介绍“行为标签词典”的产生过程以及基于行为标签的学习行为的辨识做法,也是为了征集更多有识之士用其他课程数据对此模型进行检验、丰富和完善,使其能够成为有关学生网上学习准备度研究、网上课程教学设计有效性研究的基础工具。
二、研究情境和研究数据
本研究“行为标签词典”的建立情境是北京大学数字化学习研究中心在2014年开发的国内第一门教师專业发展类慕课课程“翻转课堂教学法”。该课程于2014年7月1日首次上线,截至收取本研究数据时已累计开设16个学期(4年),吸引了超过10万名学习者注册、学习。这门课程在开课的第一年中(前3个学期),课程团队对课程资源进行了补充,对教学进度做出了调整,对考核标准也做了修改,从2015年第4个学期开始形成了相对成熟、稳定的课程结构,并保持至今。因此,本研究重点关注第4期到第16期这13个开课周期的学习者及其学习数据,这部分学习者的总注册人次为97,475人次,课程的总体通过率为6.48%。
从这门慕课学习者的参与情况来看,该课程在4年的运行中积累了大量学习者学习行为数据。图1展示了不同统计口径下学习者损失图,图中分别展示了总注册人次、有行为人次、三次以上登录人次、登录跨度超过一周人次、五次以上登录人次、登录跨度超过三周人次、登录跨度超过三周且有三次以上登录人次、通过课程人次。
从图1可以看出,虽然大量的慕课学习者在注册后没有留下丰富的学习行为数据,但由于该课程选课人数多、运行时间长,依然有10,718人是三次以上登录学习并且学习的时间跨度超过了三周,累计留下了五百多万条行为记录。由于本研究聚焦学习者的学习行为和行为模式,因此在后续的分析中舍弃了学习行为非常少的大部分学习者,聚焦于这10,718人次的学习者以及他们的学习行为数据。
本研究主要使用的数据是行为日志数据以及教学设计数据。行为日志数据(log_data)存储了这门课程所有学习者的所有页面浏览行为,包括学习者ID(uid)、浏览页面(url)、上网地址(IP)、浏览时间(时间戳)等,这部分是本研究分析的主体部分。本研究聚焦的学习者群体(10,718人次)共产生了5,183,796条行为日志数据,这是后续在切分分析单元(一次学习)和定义行为标签时主要使用的数据。在定义行为标签时,课程的教学设计数据也起到了很重要的作用,帮助研究者理解不同教学资源的作用(将在下文解释)。
三、为行为数据打标签的过程
1. 行为标签词典建立的过程
基于文献综述以及本研究的具体研究情境和研究问题,本研究首先定义了五个基本的学习行为,包括:1-学习新内容;2-复习旧内容;3-回答提问;4-浏览和参与论坛;5-参与课程考核。在此基础上,通过访谈课程设计和运营的3位慕课教师以及10名选修过多门慕课课程的学习者,进一步了解网络课程教师心目中的有效学习行为,以及学习者口中多样化的学习表现。在选取课程设计和运营教师时,本研究按照具有丰富慕课开发经验并参与课程运营一年以上的标准筛选了三位教师,通过面对面半结构化访谈的方式收集慕课教师基于自身经验对有效学习行为的理解和分析。在选取慕课学习者时,本研究按照至少选修并完成两门以上慕课课程的标准,通过滚雪球的方式筛选了10名学习者,并通过电话结构化访谈的方式,聚焦受访者自身的慕课学习经历、学习行为和典型学习模式等维度收集了丰富的信息。
在这些访谈中,本研究归纳出了另外四类具有一定意义的行为类型,包括:6-把握全局;7-寻求帮助;8-中断或走神;9-寻找(资源)行为。这四类行为在已有文献中较少讨论,而在访谈中网络课程教师和学习者都认为这四类行为虽然可能占比较小,但却对理解学习过程非常重要。例如,访谈的网络课程教师提到在设计课程时,为了让慕课学习者对每个单元或者章节的内容做到“心中有数”,在每一小节的资源前面添加了章节概览视频或者文档,帮助学习者“把握学习的内容,自己制定计划”。这一点在对学习者的访谈中也有提及,学习者谈到“这种设计类似一个预告或者导航”,能够帮助自己明确所处的学习进度和所学知识在整个系统中的位置。当学习者在这类资源上盘桓较久,本研究就将这个行为定义为“把握全局”,这是对一系列具有类似行为的概括,而不仅局限于将行为定义成阅读公告或者观看首个视频。除了这9类行为,所有行为标签中还有?-行为噪声和标志着“一次学习”结束的#-信号行为。这后两类行为是在进行数据检验时从研究操作性角度辨识出来的。
这11类行为标签的具体表述如表1。
这里需要特别说明的是后四类行为,都需要依据或考虑行为的持续时间,按照不同的持续时间对学习行为进行定义,这就涉及如何确定表1中的持续时间划分标准(t1、t2和t3)。
2. 依据不同行为持续时间定义行为
首先,本研究将停留时间小于5秒的行为定义为行为噪声,这里t3=5秒是大多数文献采用的时间标准,即认为学习者很难在短于5秒的时间内做出有意义或者有效的学习行为,视这些行为为随意点击的行为噪声。
其次,本研究将停留时间超过25分钟的行为定义为中断或走神,这是经过统计该慕课中视频和文档等任务的完成时间(如视频观看时长的中位数为14分钟)确定的,学习者在每一个网页停留的正常时间不应过长,如果超过了25分钟则认为学习者可能暂时中断了学习序列或走神在浏览其他网页。因此,t2=25分钟这个时间标准,需要研究者根据每门课的具体情况进行调整。
最后,也是最重要的是如何定义一个信号行为标志着学习者离开了学习,而根据本文第一部分“问题引入”中的介绍,这个问题的本质是如何确定一个“不合理的长停留时间”。文献对于停留时间超过多久就标志着“一次学习”结束的界定存在较大差异,有的文献定义为30分钟(Gasevic, Jovanovic, Pardo, & Dawson, 2017),有的文献定义为45分钟(Liu, He, Xue, Huang, Li, & Du, 2015),还有的文献定义为2小时(Kizilcec, et al., 2017)。
确定“不合理的长停留时间”是多长时间,需要考虑一个平衡的问题,这个时间标准既不能太小也不能太大。如果切分标准太严格(也就是太小),就会导致在学习者学习过程中那些持续时间相对较长的行为(如参加测验、提交作业、浏览文档等)被误认为是中断信号,错误地把“一次学习”切分成了两次甚至多次。同时,当切分标准太严格、“一次学习”的持续时间太短时,“一次学习”这个分析单元上学习者的学习行为不够丰富、持续时间过于碎片化,也会影响后面研究的可靠性。因此,在慕课学习中“一次学习”的切分标准,不宜太过严格,同时也不能太過宽松,因为这就会导致学习者本已结束的某次学习被误认为还在延续,或者出现超长时间的“一次学习”(例如跨越午餐时间的整个上下午都被纳入了“一次学习”)等情况。
也就是说,一个理想的切分标准,首先,应该让切分后的“一次学习”包含较长的学习时间和较丰富的学习行为;其次,应该让多个“一次学习”之间保持合理的时间间隔;最后,应该让跨越午饭、晚饭和夜晚的超长的“一次学习”尽可能少。基于以上几个判断标准,本研究就本课程数据从5分钟到120分钟,以5分钟为间隔(5分钟、10分钟、15分钟、20分钟……110分钟、115分钟、120分钟)测试了所有切分标准在上面几个维度的结果,得到图2的数据。
基于图2中的曲线和斜率计算,可以很清晰地看出:平均“一次学习”(session)时长(sessionlength,即一次学习的持续时间)、大小(sessionsize,即一次学习包含多少条学习行为记录)和间隔(sessiongap,即两次学习之间以天为单位的平均间隔)随着切分标准的变大而变大,并在“45~60分钟”之后变大的速率明显下降并基本维持在一个合理水平;相对而言,不合理“一次学习”(session,即跨越时间过长。例如将前后两天的学习连贯成了一次学习)的个数也随着切分标准的变大而变大,并在“45~60分钟”之后变大的速率明显上升并超过了可接受的合理水平,而且当切分标准为60分钟时不合理“一次学习”(session)个数相较于切分标准为45分钟时的情况已经翻倍。
由于本课程的教学视频大多在10分钟以内,阅读文档字数在5,000字左右,单元测试题20道左右,都是在45分钟以内可以完成的,所以在本研究中当学习者在某个行为的停留时间超过45分钟时,意味着学习者已经离开了这次学习,也就是说意味着“一次学习”的结束。根据这个标准,所有学习者在一个学期内的所有学习行为序列,将被切分成N个“一次学习”(session)。根据上面的标准,10,718名学习者的5,183,796条行为数据被切分成297,065个一次学习,以备后面的数据分析使用。另外,经过统计,慕课学习者每登录平台一次进行学习,平均会发生17.45次行为,平均时长为32.57分钟。因此,本研究认为将“不合理的长停留时间”定为45分钟,是一个既有依据也符合在线学习实际情况的标准。当然,在这里我们更强调得出45分钟的分析过程,对于是否45分钟的标准适用于其他课程、平台或者学习情境则需要更多的研究进行验证。
3. 给课程行为打标签的过程
在完成了行为标签词典后,按照附录中定义的计算规则,对这10,718人次的5,183,796条行为日志数据进行打标签。在给所有学习行为打标签的过程中,标注过程按照表1的顺序依次进行。例如,某学习者的所有视频学习行为都先被标注成了1;然后判断这些视频学习行为对应的资源在其发生的时间点之前是否已经被学习过,如果已经被学习过则改标记为2(覆盖标记1);如果某个被标记为2的视频观看行为对应的资源是技术支持类(如如何同伴互评),那么这个复习旧内容的行为则被理解为学习者(在参与互评时)遇到问题时的求助行为,被改标记为7(再次覆盖标记2)。按照这样的逻辑,将所有学习者的所有学习行为打上了标签,11类行为标签的比例如图3所示。
结合图3可以看出,在所有行为标签中“1-学习新内容”的比例最大,而“7-寻求帮助”的比例最小。其他比例较大的行为类型有“2-复习旧内容”“6-把握全局”“5-参与课程考核”。值得注意的是“?-行为噪声”的占比非常大,因此,在数据分析之初标记这些行为噪声对提高后续分析的有效性和可靠性至关重要。当然,行为噪声并不意味着这些行为没有意义,比如它可以帮助辨识“9- 寻求行为”。在上面的11类行为标签中,虽然第三类、第四类、第七类、第八类和第九类行为的比例较低,都低于10%甚至低于5%,但并不意味着这些行为的意义可以被忽略,恰恰是这些相对低频的行为,区分了不同学习者之间的行为模式和学习策略水平。
四、学习行为标签应用举例:“一次学习”类属研究
至此,基于前面对学习行为的标签化处理,所有慕课学习者的每一次学习就成为一条条由数字构成的“句子”,在此基础上就可以做进一步的研究。比如,在访谈中(资料来自上文提到的10位慕课学习者),一些学生谈到他们会集中时间看课件,然后在下次学习时集中精力做测验。为了证实有多少学生有这样的学习特点,就可以在此研究基础上做聚类分析。
本研究采用聚类分析中最常用的K-Means算法(王梦倩, 等, 2018),对297,065条Session的行为序列数据中9类行为时长占比情况进行聚类。在进行K-Means聚类分析时,首先需要确定聚类的个数,也就是将数据聚类多少类时簇内相似度高,簇间相似度低。这其中主要由簇内误差(within-cluster sum of squared errors,SSE,也叫“簇惯性”)决定,当聚成某类时SSE值最小,则说明这个聚类个数是最恰切的。同时,当K-Means算法的循环次数和运行次数增加时,SSE的值将趋于稳定。为了得到更可靠的SSE值,同时兼顾分析的运行时间成本,本研究选取循环次数为20次并运行K-Means30次,得到SSE值的均值。经过分析发现,当K值(也就是聚类个数)为7时,30次运行得到的SSE均值最低,为0.1328。因此,聚类分析的聚类个数应该选定为7类,也就是说将全部session行为序列聚类成7类最为合理,这7类的聚类结果如图4、图5所示。
通过图4和图5可以看出,学习者一次学习中9种行为时间占比的聚类结果具有两个特点:第一,主题鲜明、目标明确;第二,分布均衡、体现策略。整体而言,聚类结果非常理想,一方面与前面的访谈资料相呼应,另一方面也为后续特征提取提供了新思路。
在主题鲜明和目标明确方面,七类主题学习中有五类呈针状,也就是说当学习者处于这五类主题学习状态时其学习行为非常聚焦。例如,在第一类“学习新内容”的主题学习中,学习者平均花费“一次学习”的75.89%的时间在学习新内容;在第三类“专注于测验”的主题学习中,学习者平均花费“一次学习”的92.81%的时间在做测验、作业和考试等计分任务。通过聚类结果中主题鲜明的特点可以看出,慕课学习者在学习时会有意识或无意识地在“一次学习”中专注于某类学习任务的开展。从这种鲜明的主题学习特征可以看出,大多数慕课学习者在开始“一次学习”时都有较为明确的目标。例如,这次学习的目标就是学习新知识,下次学习的目标就是完成测验,等等。
在分布均衡和体现策略方面,除了第一类“学习新内容”占据所有学习26.32%的比例之外,其他六类学习主题的占比相对均衡,均在12%上下。这说明,从慕课学习者整体的学习主题情况来看,不同主题学习之间是相对均衡的,特别是“复习旧内容”“边测边学”“在互动中学习”等多样化的学习主题占比较大,体现出学习者群体具有一定的策略水平与学习方法。例如,在第六类“边测边学”的主题学习中,学习者在做测验的同时会学习新内容,同时也可能复习旧内容。在访谈中,也有受访者谈到自己的某些学习模式跟聚类分析的发现一致,如“在学新知识之前先自测一下”“做了测验发现哪里掌握不到位再去复习”等高度体现策略水平的行为模式。
五、讨论与总结
本研究尝试基于有效学习研究视角去辨识学生的学习行为,结合课程教学设计所期望的学习行为和学习者在学习过程中习惯采用的学习行为建立了 “行为标签词典”,并用一门课程的数据检验了标签词典的可用性。文中具体展示了对所有学习行为日志进行打标签的过程,展现了如何将“数据”转化成“信息”,给原始数据赋予意义。本研究定义的11种行为标签,与以往简单按照平台界面或功能模块的定义方式不同,融入了对学习行为的基本判断,例如将以往研究中的“学习资源行为”分成了“学习新内容”和“复习旧内容”。这样的行为标签词典,可以给其他相近的研究提供参考和借鉴,同时统一的行为标签词典也为后续基于相同数据或不同数据的研究进行对话提供了可能。
在对上述行为标签词典不同类型行为的统计图(图3)中可以看出,?-行为噪声的占比接近全部行为的20%。这些行为噪声停留时间短、出现位置和频次随机性高,同时这类数据的可解释性差,为基于教育数据挖掘的研究增加了难度。因此,定义、标注并清洗掉这些数据,是大多数研究会选择的一种操作。但本研究从有效学习分析角度来看这些行为噪音,就会发现虽然行为噪声较难解释但也并不是完全没有意义:首先行为噪声可能隐含了学习者处在一种四处乱点、无聊乱翻的学习状态,这对研究学习本身而言是有意义的。另外,本研究定义的9-寻找行为,就是在诸多行为噪声中“拾回”的有价值行为。例如停留时间“短短短长”的行为模式,看似前面三个行为属于行为噪声但是与后面一个较长行为连接在一起后,就隐含了学习者处在一种快速浏览、寻找资源的状态中,这对于研究学习策略也是有意义的。因此,在学习分析中首先需要注意和警惕行为噪声,其次也需要意识到行为噪声对研究的宝贵意义。
在确定分析单元和定义行为标签的基础上,很多教育数据挖掘的方法和技术才可以得到运用,本研究展示了运用聚类分析技术识别学习者“一次学习”的学习主题,并讨论了慕课学习者具有单次学习内主题明确、行为聚焦的学习特点。虽然本研究的重点不在于分析学习主题,但基于真实数据的研究发现从另外一个侧面展示了前面两个基础性步骤的重要性。特别是,只有当清晰地定义了什么是“一次学习”,以及每一个点击“数据”背后隐含了什么行为“信息”时,学习分析的发现才有了从教学层面解读数据的能力。因此,本研究作为一个方法论层面非常微观但又是非常基础的一个探讨,希望能够为领域内的研究者提供一种借鉴或者思路,也许能够开启在共同数据清洗基础上的研究对话。
[参考文献]
刘智,王亚妮,郑年亨,等. 2017. 高校SPOC环境下学习者行为序列的差异性分析研究[J]. 中国电化教育(7):88-94.
王梦倩,范逸洲,郭文革,等. 2018. MOOC学习者特征聚类分析研究综述[J]. 中国远程教育(7):9-19.
张立国,刘晓琳. 2010. 網络有效学习的理论模型构建[J]. 开放教育研究(06):35-41.
Boroujeni, M. S., & Dillenbourg, P. (2018). Discovery and temporal analysis of latent study patterns in MOOC interaction sequences. In Proceedings of the 8th International Conference on Learning Analytics and Knowledge (pp. 206-215).
Davis, D., Chen, G., Hauff, C., & Houben, G. J. (2016). Gauging MOOC Learners' Adherence to the Designed Learning Path. International Educational Data Mining Society.
Gasevic, D., Jovanovic, J., Pardo, A., & Dawson, S. (2017). Detecting learning strategies with analytics: Links with self-reported measures and academic performance. Journal of Learning Analytics, 4(2), 113-128.
Kock, M., & Paramythis, A. (2010). Towards adaptive learning support on the basis of behavioural patterns in learning activity sequences. In 2010 International Conference on Intelligent Networking and Collaborative Systems (pp. 100-107). IEEE.
Kizilcec, R. F., Pérez-Sanagustín, M., & Maldonado, J. J. (2017). Self-regulated learning strategies predict learner behavior and goal attainment in Massive Open Online Courses. Computers & Education, 104, 18-33.
Liu, Z., He, J., Xue, Y., Huang, Z., Li, M., & Du, Z. (2015). Modeling the learning behaviors of massive open online courses. In 2015 IEEE International Conference on Big Data? (pp. 2883-2885). IEEE.
Maldonado-Mahauad, J., Pérez-Sanagustín, M., Kizilcec, R. F., Morales, N., & Munoz-Gama, J. (2018). Mining theory-based patterns from Big data: Identifying self-regulated learning strategies in Massive Open Online Courses. Computers in Human Behavior, 80, 179-196.
Wen, M., & Rosé, C. P. (2014, November). Identifying latent study habits by mining learner behavior patterns in massive open online courses. In Proceedings of the 23rd ACM international conference on information and knowledge management (pp. 1983-1986).
收稿日期:2020-03-19
定稿日期:2020-07-02
作者簡介:范逸洲,博士;汪琼,博士,教授,博士生导师,主任,本文通讯作者。北京大学教育学院数字化学习研究中心(100871)。
责任编辑 张志祯 刘 莉