Knewton:学习分析支持下的自适应学习平台

    李玲静 汪存友

    

    【摘 要】随着大数据技术、学习分析技术的发展,一大批基于数据分析的自适应学习平台应运而生,Knewton就是其中的一个。从学习组织、资源组织两个方面对“Knewton”进行了深层次剖析,得出了一些启示。

    【关键词】Knewton;学习分析;自适应学习

    【中图分类号】G40-057?? 【文献标识码】A?? 【文章编号】1001-8794(2019)07-0029-06

    【收稿日期】2019-04-12

    【基金项目】2019年度教育部人文社科研究青年基金项目“认知诊断理论在个性化学习资源推荐系统中的应用研究”,项目编号为19YJC880080;2018年度山西省高等学校哲学社会科学研究一般项目“义务教育均衡发展背景下中小学校长信息化领导力指数研究”,项目编号为20180305;山西师范大学2018年度教学改革项目“对接与重构:混合式教学模式下大学课程学业评价改革的理论与实践”,项目编号为2018JGXM-02

    【作者简介】李玲静(1982—),女,河南林州人,硕士,讲师,研究方向为远程教育、教育信息化、教师专业发展;汪存友(1982—),男,湖北随州人,博士,教授,研究方向为教育信息化、心理测量、教育评价。

    一、引言

    随着全球教育资源的不断开放共享,一些提供优质教育资源的平台应运而生,如培生、Coursera、Udacity,还有中国大学MOOC等等。但这些优质的教育资源平台都存在一个“软肋”,那就是学习支持服务环节相对“传统”一些。学习分析技术、大数据技术的不断发展为学习支持服务提供了新的支持,Knewton就是在这个背景下出现的,它可以将内容供应商(如培生、剑桥等)所提供的优质内容与其独特的技术和个性化服务对接,进而提升学习者学习体验,并颠覆传统的学习思维,支持建构新型的学习方式——自适应学习。

    “Knewton”作为自适应学习系统的代表,其典型特征就是为不同的学习者用户提供不同的学习支持服务,即实现系统对学习者学习的自适应服务。这有别于传统的学习支持服务,它利用大数据、学习分析等技术能最大限度地挖掘学习者个体的学习需求,能相对“高效”“个性化”地“配置”学习资源、“推送”学习策略、“定制”学习支持服务。笔者以“Knewton”为研究对象,从学习组织、资源组织两个方面对其进行了深层次剖析,最后得出了一些启示与思考。

    二、Knewton学习支持服务

    Knewton是由约瑟·费雷拉(Jose Ferreira)在2008年创办的,成立之初主要支持GMAT、LSAT、SAT等标准化在线考试。当众多数字化教育资源大量充斥着互联网平台的时候,Knewton在2011年之后转而与各大教育资源出版商合作,成为数字化学习资源与学习方式个性化融合的技术支撑平台。截至目前为止,Knewton在120多个国家得到广泛推广。

    Knewton的长期目标是为发行商、学校及全球的学生提供预测性分析及个性化推荐。其中自适应的学习支持工具是Knewton的核心技术。其自适应的学习支持服务主要通过三个环节来实现:数据收集与处理、学习分析、学习推荐。正是通过“数據收集与处理—学习分析—学习推荐”这样的循环往复,使得每个学习者都能得到独一无二的学习帮助。

    (一)数据收集与处理

    数据收集,Knewton主要通过自适应本体和模型引擎来进行。

    1.自适应本体

    自适应本体(adaptive ontology)将学科内容(概念或者知识点)和学习对象(如:教学视频、PPT、网页文本或者试题)进行关系映射,[1]即建立学习内容中不同概念之间的关联,并结合搜集到的数据结果,将学习对象、学习路径、学习者集成在一起,供后续阶段使用。Knewton中存在大量的“异构数据”,既包括数据结构上的异构数据(如文本、图形、图像、视频、音频等),还包括语义上的异构数据(如学习内容数据与学习者特征数据)。由于数据的结构形式、语义表现形式不同,再加之集成的数据量的几何级增加,所以异构数据自适应集成是Knewton在此过程中所要解决的主要问题。

    2.模型引擎

    这里的模型引擎包括心理测试引擎(Psychometrics Engine)、策略引擎(Learning Strategy Engine)以及反馈引擎(Feedback Engine)。[2]个体学习者在使用Knewton的过程中,会产生大量数据集合,包括静态数据、动态数据。静态数据指的是一些相对稳定不变的数据信息,例如学生的注册信息、学习偏好、认知风格等。动态数据指的是在学习过程中动态变化的数据信息。一般“模型引擎”对数据的处理都是针对动态数据而言的。

    心理测试引擎主要收集学习者的知识结构、能力水平、学习进度等动态数据信息,旨在表征学习者的预备学习状态。策略引擎负责收集学习者学习进度安排、学习评价等方面的动态数据信息,旨在揭示学习者在学习过程中对学习资源、学习环境等改变做出的反应,从而为学习策略的制定提供依据。反馈引擎对收集到的数据反馈结果进行统一处理,并将它们充实到自适应本体库中,以丰富自适应本体的元数据信息,旨在为知识图谱与学习过程信息之间的关联映射提供更高度的精准分析。

    (二)学习分析

    学习分析阶段,通过心理测试引擎、策略引擎及反馈引擎对上一阶段收集到的数据进行分析,分析的结果将提供给建议阶段进行个性化学习推荐时使用。Knewton的学习分析的核心技术建立在亚马逊的大数据和云平台服务的基础上,应用了Amazon Elastic Map Reduce (Amazon EMR)分析平台上的大数据集。在这一阶段中主要运用项目反应理论(Item Response Theory,简称IRT)、概率图形模型(Probabilistic Graphical Models,简称PGMs)、凝聚层次聚类(Hierarchical Agglomerative Clustering,简称HAC)等算法来实现自适应分析。[3]

    1.项目反应理论(IRT)

    传统的学习服务平台对学生能力的评估主要存在以下两种问题:

    (1)传统评分方法中测试试题没有贡献度级别分配,所以关于简单问题和复杂问题的回答,对学生学习能力的评估都没有进行差异性分析。

    (2)传统评分方法中对学生能力的评估认定为一个相对恒定的概念,在表征时基本上为常量值表达。

    IRT在学生的能力水平与每道试题之间建立非线性回归模型,它描述了特定能力水平的学生答对特定难度试题的概率情况。给定学生的预估能力和试题难度情况,IRT就可以预测出学生答对该试题的概率水平,反之,若已知学生在若干道试题上的作答结果,IRT就可以反推出学生的知识掌握水平,学生每作答完一道试题,IRT就重新评估一次学生的能力水平,直至稳定。

    采用了IRT的Knewton平台突破了上述两点局限。根据学生对不同试题的表现,Knewton针对试题的贡献度级别与学习者的学习能力进行建模。其中,试题的贡献度级别由难度系数和区分度决定,Knewton对学生能力的表征不再局限于某个唯一的参数,而是通过利用聚焦于概念层面的知识图谱来对学生能力进行动态评估和表征。[4]

    2.概率图形模型(PGMs)

    PGMs是由IRT模型生成的二项反馈函数,在此框架模型中包含了贝叶斯神经网络和马尔科夫随机场等统计方法,以处理多维空间的概率分布并进行有效编码,其应用范围已经涉及网络故障诊断、图像认知、生物网络、语音识别、自然语言处理以及机器人导航等多个领域。PGMs框架为在复杂的环境中动态、连续地进行对象评估提供了一个必要的工具。在Knewton中,PGMs将Knewton中个体学习者的学习活动与系统评估联系起来,从而进一步分析学生知识掌握的水平。

    3.凝聚层次聚类(HAC)

    聚类分析是人们认识和探索事物内在联系的一种手段,“物以类聚,人以群分”是这一理念的最朴素和直观的反映,[5]其目的是将一个数据集划分为若干聚类,并使得同一个聚类内的数据对象具有较高的相似度,而不同聚类中的数据对象的相似度尽可能低。[6]在数据挖掘中,层次聚类是一种分析方法,被用来构建类的层次或者结构。Knewton使用HAC对庞大的学生群体的特征数据(如概念的掌握程度、学习风格、学习兴趣)进行聚类分析,发现存在的潜在簇群,进而用于指导教师对学生进行分组。

    (三)学习推荐

    学习指导阶段则通过推荐引擎(Recommendations Engine)、预测分析引擎(Predictive Analytics Engine)和归一化学习轨迹(Unified Learning History)为教师与学生提供学习建议并提供统一汇总的学习轨迹。

    其中,推荐引擎依据学习目标、学习者的“特征性”、学习投入程度三个指标,为学生提供下一步指导建议;预测分析引擎负责预测学生的学习结果,如学习目标完成的速度、程度以及知识的掌握程度等;归一化学习轨迹主要功能在于建立每个学习者与“学习情境”的关联。这里的“学习情境”涉及“學科知识”“学习应用”“学习时段”等内容。学习者与“学习情境”的关联时间越长,平台对学习者的“认知”越深,从而对学习者的推荐服务也就越“智能”。可以看出,学习者在平台的学习时间越长,其学习轨迹也就越多,其“智能化推荐”精度也越高。

    此外,需要说明的是,受到艾宾皓斯记忆保持力和学习曲线的启发,Knewton推荐引擎将学生学习与遗忘能力曲线整合到模型引擎当中,从而能更“精准”捕捉学生真实的知识储存情况。

    三、Knewton自适应组织机制

    针对Knewton的“自适应”机制,笔者主要从资源组织与学习组织两个维度加以分析。

    (一)资源组织机制

    2015年8月之前,Knewton就陆续地与各大出版集团,如Pearson Education、Macmillan Education、Houghton Mifflin Harcourt等,建立合作关系,通过开放的API接口将各类课程材料进行数字化处理,并提供相应的数字化学习支持服务,Knewton自身并不提供学习资源。2015年8月之后,Knewton开始对个人开放,鼓励用户上传学习资源,其自身也为用户提供一部分学习资源。[7]故在Knewton中存在大量“自适应学习资源”,一类是出版商公开发行的“系统化”学习资源,其特点是结构化程度高、可信度好;另一类是使用平台的“使用者”上传的一些“非系统化”资源,具有颗粒化、碎片化特征。

    纵观当前的各种网络学习平台,其资源的组织方式不外乎三类:“自上而下”式、“自下而上”式、混合式。

    (1)“自上而下”的资源组织方式,是公开出版发行的各种类型的资源(包括文本、声音、视频、动画、表格等)经过“粒化”处理,由“系统化”资源变为“颗粒化”资源的过程。

    (2)“自下而上”的资源组织方式是指“非系统化”资源按照一定的算法进行“聚合”,由“颗粒化”变为“结构化”的过程。

    (3)混合式资源组织方式,是兼有以上两者形式的资源组织方式。

    Knewton平台上资源组织应当归属于第三类。其中自动“粒化”、动态“聚合”在一定程度上体现了Knewton平台的资源组织的“自适应特征”。

    “粒化”的基础是“细粒度”。[8]针对资源的“细粒度”描述,IEEE LOM标准依据功能分了五个层次,[9]分别为:“有用的内容”“信息对象”“学习对象”“学习构件”“学习环境”。“有用的内容”指的是单个的媒体数据,“信息对象”“学习对象”分别指的是个体学习者参与的一节课、一门课程;“学习构件”指的是获得某证书所需要的一系列课程;“学习环境”指与学习相关的所有硬、软件资源的集合。

    资源的“细粒度”直接决定资源的“聚合”程度。“细粒度”过小,不利于展示资源相互间的内在关系。“细粒度”过大,不利于资源的高“绩效”利用。在Knewton中,大量的出版商课程资源,经过“粒化”处理,被分解为粒度合适的“粒化”资源。此外,Knewton在2015年8月后,也实现了对用户(包括教师与学习者)上传资源的“粒化”组织。这两种“粒化”资源(出版商资源和用户资源)最终都是按照“一定算法”来进行自适应“聚合”的。从资源的利用维度看,“粒化”实现了资源有效利用,避免了“冗余”资源的产生,提高了资源利用的“绩效”。从资源生存周期来看,“粒化”一定程度上延长了资源的使用周期。

    “聚合”被认为是当前学习平台中常用的资源组织模式和手段,但资源怎样聚合,以什么样的形式“聚合”,每个学习平台则各有差异,但基本都是以异构性资源的“聚合、组织和呈现”为前提的。“聚合”,有基于语义的聚合,有基于关系(社会网络)聚合,还有基于知识元的聚合。而“呈现”大多都是一种可视化表达,这种表达有“結构性”的、“非结构性”的以及“半结构性”的。

    在大数据的支持下,Knewton通过自适应本体技术,将学习内容整合到学习资源中,依据一定的复杂算法实现了以对象本体为中心的“知识关联”“资源聚合”。聚合后的可视化“知识图谱”,不仅建构了本体对象的“结构性”概念框架,还实现了资源的“跨学科”“动态”“连续”的整合。图1显示了 Knew-ton中资源组织方式。

    (二)学习组织机制

    Knewton平台其影响范围如此之大,除了自适应的资源组织机制之外,还有一个重要的因素——自适应的学习组织机制。自适应的学习过程是学习者通过自身原有知识经验与适应性学习系统进行交互活动来获取知识、获得能力的过程。[10]在此过程中,学习者自我组织、制订并执行学习计划,自主选择学习策略,自主控制学习过程,并进行自我评估。[11]

    可以看到“自主性”贯穿整个适应性学习的全过程。因而,学习者的“自主性”决定着学习者学习的成败。如何激发学习者的“自主性”呢?笔者将从动力机制、学习机制、反馈与强化机制三个方面对Knewton的自组织学习进行分析。

    1.动力机制

    自适应学习的动力机制是指个体学习者自身具有的自组织功能。[12]在Knewton中,影响个体学习者“自组织”的因素体现在丰富的学习资源、积极的学习体验以及终身化的学习档案等方面。

    (1)丰富的学习资源:通过前面的阐述可以知道,Knewton存在大量“自适应”学习资源,范围涉及高等教育、职业教育以及K-12,几乎覆盖了所有层次的主流课程。Knewton学习者数量的批量化增加,在平台运营早期可能得益于“系统化”的出版商资源,但是随着学习的不断深入,“粒化”资源将伴随学习者整个自适应学习过程。

    (2)积极的学习体验:“游戏化”的“教学策略”、多样化的“教学组件”、个性化的“学习目标”在一定程度上能吸引学生对学习的投入度。Knewton通过游戏的“流动”不断地增加学习难度和悬念,使学习者体验“游戏化”学习情境。多样化的“教学组件”(如仪表盘、数字徽章、道具等)可以丰富学习活动,可以实现异质分组、可以实现学习协同,在一定程度上也提高了学生的参与度。个性化的“学习目标”可以使每个学习者在学习过程中都能尽可能地“跟随”目标,不会“偏离”目标太远,这样可以避免“偏离”目标对学生造成的不适感以及挫折感的出现。

    (3)终身化的学习档案:在Knewton中,每个学习者都可以看到一个持续更新的学习概览。概览呈现了学习者已经学过的知识以及将要学习的知识。这个学习概览是不断发展的,随着学生在平台上学习时间的增加,这个概览变得更加“智能”,能“智能”地洞察学生对材料的掌握程度,能“智能”地判断学习者的学习方式等。

    2.基于“连续统”的个性化学习机制

    Knewton以“连续统”的学习组织思想来指导学习者自适应学习过程。这一点有别于传统的单点适应性学习,它不是以一个单独的节点(如通过一次测试考核)来评估学习者的现状以决定学习者的下一步的“学习”,而是通过对学习者的不断测试,来不断挖掘个体学习者在学习中的各种数据,包括概念、结构、媒体格式数据及学习者的“个性特征数据”,并采用复杂算法把这一系列针对每个学习者的数据内容拼接起来,综合做出“判断”,给出“学习路径”。

    学习者在整个学习过程中,采用测验题目与短视频相结合的学习方式,通过对学习环境中的提示和反馈进行自主评价和自主选择,实现“个性化学习”。如Knewton 平台中提供的数学乘方、开方或根式运算(operations with radical expressions)测试,测试内容涉及小学、中学甚至大学课本中的相关知识。[13]故此,在一个测验中可能会出现跨越度较大(从小学到大学)的试题,当学生遇到比较难的知识点,Knewton会自动降低试题级别给予推送,遇到会的知识点时候,会自动提高试题级别,学习者只有通过不断“测试”,才会逐渐接近最适合自己的“学习路径”。这一过程是一个“不间断、连续”的过程。当然,在实际的学习过程中,学习者的自身水平也不是一成不变的,Knewton已将学习者随着学习的不断深入,自身水平也会呈现增长的态势,考虑进模型计算引擎中,从而能更加动态地揭示学习者的真实状态。

    3.反馈与强化机制

    自适应学习虽然是一种自主的、个性化的学习,但它不是一种完全独立的学习,它需要学习环境中有良好的反馈系统,以帮助学生作出自主决策。传统的教学评估反馈往往由于学生人数较多而反馈不及时,针对性不强。而Knewton作为一个自适应学习系统,它能够快速地针对学习者的多个选择和响应提供个性化反馈。反馈主要来自于学习同伴之间反馈以及教师的反馈。通过反馈,学习者可以更好地认知自己的知识掌握程度,同时也在一定程度上促进了学习者之间、学习者与教师之间的协作交流、情感交流。此外,即时的反馈,还可以保持学习者基于资源支持的学习过程的专注力。

    除了反馈之外,强化机制也必不可少。与传统的强化方式不同,Knewton并不要求学习者在较短的时间内反复强化新概念(或技巧)直至掌握,而是采用空间强化(也可以理解为分布式强化)的方式。Knewton将学习的旧知识与新知识资源编织在一起,即在一个较长的时间段中,学习者通过对新知识材料的学习,可以不断强化已经学习过的概念或技巧,这样反复的空间强化可以帮助学习者“长久地”掌握所学,即一旦学习过就能长久记忆。

    四、总结与反思

    “没有两个学生是一样的——他们以不同的速率学习和忘记,来自不同的教育背景,有着不同的智力程度、注意力范围和学习方式”。[14]基于这样的理念,Knewton打破了传统学习方式,把每个学生个体,置于一个更为个性化的情景之中。然而,作为自适应学习平台的典范,给予我们的启示与反思是深远的。

    (一)“社会化”的交互组织机制亟待发展

    日本知识管理专家野中郁次郎提出了显性知识和隐性知识相互转换的SECI过程,[15]提出知识的显隐形转化,通过社会化、外化、融合、内化四个过程来实现。其中,社会化(Socialization)是实现隐形知识传递、创新的前提。

    Knewton虽然在2015年8月以后,实现了对用户的“粒化”资源组织,如Knewton 允许教师创建课程、添加作业, 还允许学习者创建测验题目,如添加内容、题目、选项、答案、解释等,甚至还可创建教学材料,如添加适合年级水平的内容等。但对于平台总体而言,学习者之间的“社会化”互动程度不高,“联通性”不强。个体学习者在学习过程中产生的一些新的想法,因缺乏“社会化”交互,会随时消失。

    社交网络支持的教学实践活动(SNAPP,Social Networks Adapting Pedagogical Practice)在“社会化”方面的功能值得借鉴,它针对学习者的学习行为、交互行为的数据进行挖掘與分析,并运用学习网络图、社会网络图可视化展示学习活动参与者的整体交互全貌以及个别学习者的细节。所以,Knewton在对单个学习者进行“精准”分析的同时,更应该关注学习者在“学习群体”中的现状,推送(推荐)基于某一内容学习而自发组织的“学习社群”,促使学习者展开有意义的讨论,这样可以提高学习者参与度,更有利于学习者“隐形”知识的传递与创新。

    (二)多维度的评价机制亟待建构

    随着机器学习的进一步发展,情感计算走进了教育者的研究视野。情感计算是指机器对人类情感进行识别、翻译和仿真。[16]它是通过摄像头对人脸和手势行为的捕捉,并应用一定的算法捕获和分析情绪反应。

    在个性化学习支持中,可以通过情感计算对学习者的情绪特征和社交关系进行解析。[17]虽然Knewton平台在一定程度实现了对个体学习者 “认知”“行为”的评估,但针对“情绪”评估,knweton还没有相关的技术支持。故此,探索基于“认知”“行为”“情绪”的多维评价机制,对于Knewton而言,仍有一段路需要走。

    综上,可以看出,Knewton平台利用大数据分析技术实现了针对学习者的适应性测试,从而直接引导不同类型的学习者以“最适合”该学习者的链接路径进行学习。Knewton实现了学习者学习方式由“被动”向“主动”、由“统一”向“个性”的转化。“精确诊断”是“对症下药”的前提,Knewton的“自适应测评”是“诊断”的序曲。随着机器学习、大数据技术的不断发展,“诊断”会越来越“精准”,而“自适应测试”也会逐渐过渡到包括情感计算在内的“智慧测评”阶段。如何从“智慧测评”过渡到“智慧学习”可能还需要教育研究者进行长期的、系统化的思考。[18]

    【参考文献】

    [1]周皖婧,辛涛,刘拓.“互联网+”背景下的学生个性化学习系统开发:现状与启示[J].清华大学教育研究,2016(6):79—84.

    [2][14]Wilson K,Nichols Z.Knewton technical white paper[EB/OL].[2017-05-27].http://learn.knewton.com/technical-white-paper.

    [3]Jaffe J.Here is the deck for presenting adaptive learning in the E-education world[EB/OL].[2017-05-27].https://lists.w3.org/ Archives/Public/www-archive/2015Jan/att-0004/Knewton _W3C_presentation_V2.pdf.

    [4]万海鹏,汪丹.基于大数据的牛顿平台自适应学习机制分析:“教育大数据研究与实践专栏”之关键技术篇[J].现代教育技术,2016(5):5—11.

    [5]刘文军,游兴中.一种改进的凝聚层次聚类法[J].吉首大学学报:自然科学版,2011(4):11—14+49.

    [6]钱晓东.数据挖掘中分类方法综述[J].Library and Information Service, 2007,51(3):68—71.

    [7]郭朝晖,王楠,刘建设.国内外自适应学习平台的现状分析研究[J].电化教育研究,2016(4):55—61.

    [8]马翠嫦,曹树金,郑建瑜.多学科领域视角下网络聚合单元概念框架构建研究[J].情报科学,2015(10):16—22.

    [9]Reusable learning: project introduction[EB/OL].[2017-05-11].http://www.reusablelearning.org/.

    [10]杜龙辉.以评价为中心的适应性网络课程设计与开发[D].上海:华东师范大学,2008.

    [11]高晓红.基于网络的自适应学习系统研究[D].上海:上海师范大学,2003.

    [12]时龙.自适应学习的方法论探析[J].教育科学研究,2015(9):5—13+22.

    [13]张华华,汪文义.“互联网+”测评:自适应学习之路[J].江西师范大学学报:自然科学版,2016(5):441—455.

    [15]Nonaka, R.Toyama, N.Konno. SECI, Ba and ladership:a unified model of dynamic knowledge creation[J].Long Range Planning, 2000,33(1):5—34.

    [16]Massachusetts Institute of Technology. Affective Computing[DB/OL].[2017-05-27].http://affect.media.mit.edu/index.php.

    [17]牟智佳.學习者数据肖像支撑下的个性化学习路径破解:学习计算的价值赋予[J].远程教育杂志,2016(6):11—19.

    [18]Zhang Susu,Chang Hua-Hua.From smart testing to smart learning: how testing technology can assist the new gener-ation of education[J].International Journal of SmartTechnology and Learning, 2016,1(1):67—92.

    【Abstract】With the rapid development of Big Data and learning analytics Technology, lots of adaptive learning platforms, taking Knewton as the typical example, are emerging out quickly. In present study, concentrated on how learning activities and learning resources were organized, the Knewton system was firstly deeply discussed, and then some implications about future development of adaptive learning platforms were proposed.

    【Key words】Knewton; learning analytics; adaptive learning