标题 | 基于数据挖掘的在线学习个性化服务方案设计 |
范文 | 郭飞雁 摘要:基于数据挖掘技术,在分析在线学习个性化服务的基础上,以 Hadoop 为大数据分析平台、MapReduce/Spark为计算框架设计了面向个性化服务的在线学习大数据挖掘解决方案。 关键词:数据挖掘;在线学习;个性化服务;数据采集;数据建模 中图分类号:G434文献标识码:A 1 概述 伴随着互联网技术的发展,教育及知识传播方式也发生了根本变化。在线学习逐步兴起,由于其不受时间、空间限制等特征,逐步被大家所接受。大数据时代的在线学习,也为个性化教学提供了机遇。在线学习者在学习的过程中会产生相应的学习轨迹,例如,观看学习视频时间的长短、访问的学习资源类型、对所学内容的评价等一系列的相关数据。通过在线学习平台或系统对这些数据进行收集并采用合适算法对相关数据进行降维处理,提取在线学习者相关特征,在大数据技术的基础上对在线学习者进行评价及预测,从而对在线学习者进行个性化服务,进一步提高在线学习质量,进而优化学习过程、提高教学效果。[1] 2 基于数据挖掘的在线学习个性化服务 2.1 数据收集 用户行为数据是用作许多个性化服务算法的数据源,因此必须收集在线学习者的学习日志数据。此外,还记录用户用来检索和推荐引擎本身的数据,并进一步优化后续算法。[2] 2.2 角色建模 角色建模包括用户建模和学习资源建模。用户建模和文档建模具有本体建模方法和非本体建模方法,这两种方法都可以在MAPRECECE / SPARK计算框架下高效实现。[3]模型可以由HBASE数据库分发和检索。推荐,检索和推送算法基于建立的用户模型和文档模型以不同方式执行计算,最终找到与用户或输入匹配的文档。[4] 2.3 数据特征选取 考虑到当前在线学习平台之间通常不形成社交网络,可以选择基于内容和基于行为的特征。内容功能涵盖在线学习内容的标题和类别,用户的背景和兴趣等。用户行为则涵盖了他们浏览了哪些学习资源。基于内容和用户行为的特征可以相互补充。 2.4 算法选取 从准确性,效率和稳定性的角度简要分析基于产品和基于用户的协同过滤推荐算法这两种方法在在线学习个性化服务中的适用性。[5] (1)准确性:推荐系统的准确性在很大程度上取决于用户数量与系统中项目数量之间的比率。在线学习用户包括学生,教師,社会人员等。每种类型的用户都可以细分。基于用户的协同过滤可以使在线学习个性化建议更加准确。(2)高效性:尽可能提高挖掘效率。当用户数远远大于项目数时,项目的相似度计算消耗的资源远远少于用户的相似度计算,因此基于项目的协同过滤更有效。(3)稳定性:在线学习资源和在线学习用户不断变化。对于在线学习,一方面,新生每天进入在线学习平台,在线学习者每天都会有结业学生。学生用户很不稳定;另一方面,在线学习平台每天都会有新的学习资源建立,学习资源内容的更新和升级。从稳定性的角度来看,基于用户和基于项目的方法难以区分。 3 基于数据挖掘的在线学习个性化服务方案设计 3.1 在线学习大数据支撑环境 在目前常使用的云计算设施中,HADOOP由于其快速及可靠性为在线学习用户提供了一个大数据分析及处理平台。 3.2 基于数据挖掘的在线学习个性化服务方案 基于以上分析,本文将HADOOP设计为大数据分析平台,将MAPREDUCE / SPARK设计为计算框架,为个性化服务设计在线学习大数据挖掘解决方案。如下图所示: 4 结语 本文在数据挖掘技术的基础上,结合在线学习特点,对在线学习个性化服务进行分析研究,从数据收集、数据建模、数据特征选择、算法选择四方面对在线学习个性化服务进行方案设计,从而进一步提高在线学习的学习质量,为个性化教学提供一种新的方法。 参考文献: [1]赵慧琼,姜强,赵蔚,李勇帆,赵艳.基于大数据学习分析的在线学习绩效预警因素及干预对策的实证研究[J].电化教育研究,2017,38(01):6269. [2]宋远方,冯绍雯,宋立丰.互联网平台大数据收集的瓶颈与区块链理念下的新发展路径探索[J].管理现代化,2018,38(03):2730. [3]高学伟,付忠广,孙力,张刚.基于HADOOP分布式支持向量机球磨机大数据建模[J].河北大学学报(自然科学版),2017,37(03):309315. [4]柳益君,何胜,冯新翎,等.大数据挖掘在高校图书馆个性化服务中应用研究[J].图书馆工作与研究,2017,(5):2329. [5]王茜,邓伟伟,喻继军.一种考虑群成员接受度及相似度的群体推荐算法[J].计算机应用研究,2017,34(11):32853290+3298. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。