标题 | 基于在线学习行为的个性化学习需求智能挖掘技术研究 |
范文 | 摘 要:随着数字化学习的普及和发展,如何及时发现网络学习过程中学习者的个体学习需求,并实时地提供满足他们需求的数字化学习资源和学习服务已日渐成为Elearning研究领域的关键问题之一。利用人工智能技术,通过提取数字化学习资源中的核心概念和对在线学习行为的自动捕获,建立基于概念图的知识模型,在此基础上智能地挖掘学习者个体认知状态和学习需求,为个性化学习服务提供支持。 关键词:人工智能;个性化学习;学习需求;数据挖掘 DOIDOI:10.11907/rjdk.1511133 中图分类号:TP302 文献标识码:A 文章编号文章编号:16727800(2015)012001203 0 引言 随着互联网技术的发展和数字化教学资源的日益丰富,网络学习逐渐成为一种广泛采用的学习方式。近年来教育心理学研究对学习者在Elearning平台上的学习认知过程分析发现:在网络学习过程中,学习者关于当前所学主题的背景知识存在个体差异,这种差异将对网络学习的过程和学习效果产生影响[1]。学习者在学习一个新的知识点时,需要把新知识点和自己掌握的概念联系起来,以建立新的理解和认知。这些与新知识点关联且已被学习者掌握的概念称为背景知识。由于每个网络学习者的背景知识存在差异,在学习同一个新知识点时,产生不同的学习需求。这导致他们在网络学习过程中的动机、行为不同,学习效果也存在较大差异。因此,需要有新的技术和方法支持依据学习者的不同学习需求提供个性化的学习资源和学习服务。 1 研究问题概述 依据学习者的个体学习需求来提供学习服务的系统称为自适应学习环境。自适应学习环境通过建立该教学 领域的专家知识模型和学习者个人的认知模型,并比较二者的差异来确定学习者的个体学习需求,再提取教学策略模型中的相应教学内容和教学活动实现对该个体学习需求的支持[2]。目前的个性化学习服务通常需要通过人工方式构建知识模型,再比对学习者的知识状态和学习进度来发现学习者的学习需求。这样的人工建模方式需要花费大量时间和人力,并且建立的知识模型只能在该教学领域使用,很难推广到其它知识领域和Elearning平台上,局限性较大。另外,很多自适应系统不能通过常见的在线学习行为及时发现学习者的学习需求,使得在很多网络学习过程中,当无法采集到足够的学习者评测数据时,不能识别学习者的学习需求,严重影响了个性化学习服务提供的及时性和准确性。 为此,本文利用自然语言处理技术,从数字化资源中自动提取和构建领域知识模型,从而摆脱对人工构建领域知识模型的依赖,扩大个性化学习服务的应用领域和范围。通过对在线学习行为数据的捕获和挖掘,在学习者的网络学习过程中自动和及时地发现学习者的个体学习需求。这样不再需要学习者通过完成知识测验来评估认知状态,从而能实时和准确地向学习者提供适合他们个体需求的学习服务。通过在线学习行为自动捕获系统,可以完整地跟踪和收集学习者的在线学习行为数据。本文提出的知识模型构建算法可以智能地从这些数据中提取学习者的学习目标和对相关概念的理解,并用概念图的方式系统地表征学习者当前的认知状态。同时运用自然语言处理技术,对网络数字化学习资源进行提取和解析,通过概念短语提取和概念关系识别技术,生成以概念图表征的领域知识模型。该模型包含了该教学领域内学习者应当掌握的知识概念。在此基础上,本文实现了学习需求的智能挖掘技术,利用概念聚类、核心权重计算和语义结构差异分析等方法,通过比较学习者认知状态和领域知识模型,自动和实时地挖掘学习者个体学习需求,包括核心概念缺失和概念错误。从而提供与学习者个体需求相适应的个性化学习服务。 2 基于概念图的知识模型构建 利用概念图来表征教学领域的知识结构和学习者当前认知状态。概念图用一种层级化的节点-连接结构来呈现一个主题的知识内容。概念图中的每个节点用短语代表一个独立的概念,节点间的连线和标注表示这两个概念间的语义关联[3]。概念图把文字的知识转换成概念和概念间关系的网状图形。概念图的这种网络状层级结构化知识表达,有利于开发一种算法来自动把数字化教学资源转化成以概念图表达的领域知识模型。下面介绍如何从文本数据自动构建基于概念图的知识模型。 2.1 概念短语提取 概念短语是表达领域知识和学习者认知状态的主体,也是构成概念图的要素。本文首先从数字化学习资源和在线学习行为数据的文本中提取大量原始术语,再利用潜在语义分析的方法构建多维术语矩阵,并对这些原始术语进行权重计算,最后形成能够概括领域知识的概念短语集[4]。 为了从原始文档中鉴别和提取概念短语,需要计算原始文档中术语与教学资源文本的相关性,判断这些术语在资源中的语义权重。每一个术语pi的语义权重w(pi)的计算方法如下: w(pi)=TF·IDF(pi)+δ(pi,A)+IG(pi)(1) 其中,TF·IDF为术语频乘以文档频率的倒数,表征该术语在文档中的重要程度;δ为该术语在文本中的开方检验值,表征该术语与各文档的相似程度;而IG可计算该术语给文档带来的信息增益值,表达了该术语对文档的信息贡献。 2.2 概念关系识别 从数字化教学资源中提取概念短语集后,要生成能代表领域知识的概念图,还需要识别这些概念短语之间的语义关联。本文首先通过解析文本,利用词性标注算法提取能够表示概念短语之间语义关联的动词集,并利用LSA(Latent Semantic Analysis)[5]计算各个动词在语义关联表示中的权重值。对提取的所有概念短语进行逐一配对检验,计算它们的语义关联程度,确立它们存在语义关联。 如上所述,通过从教学资源中提取概念短语集并为每对有语义关联的概念短语匹配语义标签,生成代表该教学领域内知识结构的概念图表征,即领域知识模型。将同样的方法用在学习者行为数据上,可以生成代表学习者认知状态的学习者知识模型。 3 个体学习需求的智能挖掘 根据建构主义的观点,学习者对新知识的理解和认知是建立在已经掌握的知识基础之上。当学习者在Elearning平台上学习新知识时,可能存在这样的阶段:他们虽然已经掌握新知识的一部分相关概念,但是对与之相关联的另一部分重要概念还存在认知缺失或错误,无法形成对新知识完整、准确的认知和理解。对于处在上述阶段的学习者,本文的个体学习需求挖掘可以通过智能分析该学习者的网络学习行为(资源浏览、信息检索、信息发布等),确定学习者正在学习的知识专题,找出与该专题相关联的核心概念,并鉴别出学习者缺失或误解的概念,即学习者当前的个性化学习需求,并向学习者提供个性化学习服务。 3.1 学习者核心概念缺失的识别 在学习者当前所学专题中,部分概念短语与该专题联系非常紧密,并与聚类中的很多概念短语存在语义关联,本文称这样的概念短语为核心概念。当学习者在该专题的学习过程中,已经完成了一定数量的相关概念学习后,却没有任何与该核心概念相关的学习行为(包括浏览相关资源;进行与该核心概念有关的信息检索和发布等)。这表明学习者在此阶段对该核心概念还很陌生,但它又是对学习者理解当前所学专题至关重要的,我们称学习者在这个阶段存在核心概念缺失。 本文利用概念图的关联结构和相关度算法来识别和提取当前学习专题中的核心概念。从关联结构上看,与核心概念有语义关联的概念短语数量比一般概念多。另外,同一个专题内的不同核心概念表达的是同一个主题,因此与不同核心概念相关联的概念短语集存在一定的交集。即有一些概念短语同时和多个核心概念有语义关联。与多个核心概念有语义关联的概念短语为关联概念。本文利用核心概念与关联概念的结构特征来辨别和自动提取当前所学专题中的核心概念。假设在同一个专题中的每个概念短语Pi都有一个核心权重W(Pi)和关联权重U(Pi)。核心权重值高的概念短语就是该专题的核心概念。 利用下述算法计算每个概念的核心权重值。其基本思想是:如果一个概念短语与很多有较高核心权重的概念短语有语义关联,它应当有更高的关联权重值;同样,如果一个概念短语与很多有较高关联权重的概念短语有语义关联,它应当有更高的核心权重值。这可以表达为: W(Pi)=∑Pj:(Pj→Pi)U(Pj)(2) U(Pi)=∑Pj:(Pi→Pj)W(Pj)(3) 该算法轮流执行上述两项操作,直到各个概念的权重值达到一个“平衡点”,即它们的权重值在操作后不再发生变化。 对提取出的核心概念,检验其在学习者知识模型中是否有高相关度的对应概念。如果找不到高相关度匹配,则称之为学习者对该核心概念缺失。 3.2 学习者概念错误的判定 学习者在线学习行为中的信息发布、检索和记录等行为能揭示他们对所学知识的认知和理解状态。该认知状态在学习者知识模型中被表征为核心概念及与之有语义关联的概念短语形成的概念图结构。本文把该结构以数学化的模型表达为概念图G=(V,E,δ,λ),其中V为概念图节点的集合,E为概念图中联接的集合,δ:Lv→T为每个节点与概念短语映射关系,λ:Le→S为每个联接与语义关联标签的映射关系。 对于某个核心概念,若学习者模型中对应的语义结构G1与领域知识模型中对应的语义结构G2存在较大差异,系统识别学习者在这个核心概念上存在认知偏差,称为概念误解。G1和G2差异性的计算方法如下: Matching(G1,G2)=MCS(G1,G2)MAX(G1,G2)(4) 其中,MCS(G1, G2)为概念图G1=(V1,E1,δ1,λ1)和G2=(V2,E2,δ2,λ2)的最大共同子图G,从而计算出学习者知识模型和领域知识模型在该核心概念上的语义结构差异,以此为依据识别学习者的概念错误。 4 结语 在网络学习过程中及时地发现学习者的学习需求并基于此向他们提供个性化的学习服务是Elearning发展的趋势和要求。本文利用自然语言处理与人工智能技术实现了一种从在线学习行为数据中自动和实时地评估学习者的认知状态,挖掘其个体学习需求的技术。这种智能挖掘技术突破了依赖学习者完成知识测验来评估认知状态和学习需求的局限,使网络学习平台能更加及时和准确地向学习者提供适应他们个体学习需要的学习服务。 参考文献参考文献: [1] CLARK RC,MAYER RE. Elearning and the science of instruction:proven guidelines for consumers and designers of multimedia learning[M].San Francisco: Pfeiffer, 2011:3341. [2] 张舸,周东岱,葛情情.自适应学习系统中学习者特征模型及建模方法述评[J].现代教育技术,2012,22(5):7782. [3] 赵国庆,陆志坚.“概念图”与“思维导图”辨析[J].中国电化教育,2004(8):4244. [4] 孙珠婷,顾倩颐. 领域概念术语提取中特征项自动抽取方法[J].计算机工程与设计,2012,33(8):31893193. [5] 盖杰,王怡,武港山. 基于潜在语义分析的信息检索[J]. 计算机工程, 2004,30(2): 5861. (责任编辑:陈福时) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。