新工科背景下机器学习课程建设研究

姚兴华+吴恒洋+方志军+游晓明
摘要:
机器学习课程建设是普通高等院校数据人才的培养重要环节。新工科建设背景下,从教学内容、教学方法、教学手段3方面探讨数据科学与大数据技术专业如何建设机器学习课程。提出机器学习课程应按照数据科学工程应用型人才培养目标,以学生为中心,遵循“知识够用、注重应用、内容先进和总体优化”原则选择教学内容,设计以案例为载体、重互动的教学方法,发展现代化技术教学手段,以保障教学计划实施,提高数据人才培养质量。
关键词:
数据科学;机器学习;新工科;课程建设
DOIDOI:10.11907/rjdk.172388
中图分类号:G434
文献标识码:A文章编号文章编号:1672-7800(2018)001-0221-03
Abstract:Curriculum construction of machine learning is an important part of universities and colleges training data talents. In this paper, based on the emerging engineering education we explore how to construct the machine learning curriculum in the major of data science and big-data technology in the three aspects including teaching contents, teaching methods and teaching techniques. For the training object of application-oriented talents of engineering in data science, the machine learning curriculum construction is student-centered, chooses teaching contents according to the principle “theory being serviceable enough, emphases in applications, knowledge being advanced and optimal totally”, devises teaching methods which take cases as carriers and pay attention to interaction, and develops teaching techniques with modern technology. Such results in the curriculum construction could make sure that teaching programmes are implemented effectively, and improve effects of training data talents.
Key Words:data science; machine learning; the emerging engineering; curriculum construction
0引言
課程建设是学校教学基本建设重要内容,是大学内涵发展的重要抓手[1]。加强课程建设能够有效保证教学计划落实,提高教学水平与人才培养质量。
教育部2017年批准上海工程技术大学开设“数据科学与大数据技术”本科专业。2017年9月招收首批本科学生,培养数据人才主要为数据工程师、数据分析师、数据分析员等。一个合格的数据科学工作者,需精通统计学相关知识,熟练使用机器学习等知识发掘方法,具有坚实的数据分析知识及并行与高性能计算知识[2]。数据科学工作者培养分为4部分:相关基础学科学习、知识发掘方法学习、数据科学理论大数据背景下应用及数据科学行业应用[2]。知识获取是整个数据处理过程的关键与重要目的。所以,知识发掘方法学习是培养数据科学工作者的关键。
学生的知识获取能力,可以通过开设机器学习、统计推理、数据挖掘等课程培养。通过机器学习、统计推理课程,学生可掌握一系列知识获取概率模型,如线性回归模型、逻辑回归模型等[2]。机器学习是大数据分析关键技术,是数据科学与大数据技术专业主要专业课程。因此,重视其课程建设在很大程度上能够保证数据人才培养质量。
1“新工科”建设与数据人才培养
世界范围内新一轮科技与产业革命驱动着新经济形成与发展[3]。目前,我国经济发展进入结构调整、转型升级攻坚期,新旧增长动能正在转换,以互联网为核心的新一轮科技与产业革命正在发展,新技术、新业态、新模式蓬勃兴起[3]。新经济发展迫切需要新型工科人才支撑,要求培养具有创新创业与跨界整合能力的工程科技人才,相应的高等工程教育改革受到前所未有的重视与普遍关注[3-4]。2016年,“新工科”概念的提出为工程教育理论与实践探索提供了新视角,即将国际工程教育改革进行中国本土化[3-5]。新工科教育内涵是:以立德树人为引领,以应对变化、塑造未来为建设理念,以继承与创新、交叉与融合、协调与共享为主要途径,培养未来多元化、创新型卓越工程人才[6]。2017年2月,教育部在复旦大学召开了高等工程教育发展战略研讨会,与会高校共同探讨了新时期工程人才培养、新工科建设与发展路径选择等问题。2017年4月,教育部在天津大学召开新工科建设研讨会,60多所高校与会代表一致认为“新工科”建设与教育应致力于以产业需求为导向,注重跨界交叉融合,探索建立工科发展新范式;紧跟技术发展,及时更新工程人才知识体系;以学生为中心,根据学生志趣选择、设计教学方法与手段。
数据显示,2016年全球大数据市场规模已达453亿美元[7]。赛迪智库预测,2017年我国大数据产业规模有望达到4 185亿元,未来2~3年市场规模增长率将保持在35%左右[7]。大数据产业逐渐成为新经济重要组成部分与推动力量[8]。因此,为新经济发展培养合格数据人才,是我国在新经济发展中占领高新技术制高点的关键,是新工科建设重要内容。
2课程建设目标
“新工科”背景下,数据科学与大数据技术专业以社会需求与企业需求为导向,以交叉融合、共享、创新为主要途径来培养多元化、创新型数据人才。具体而言,就是计算机科学与技术、统计学、智能科学等相关专业进行交叉、融合,培养具有良好个人素质、职业素养、科学素养,系统掌握大数据分析基础理论,熟练掌握大数据采集、处理、分析技术,能够从事金融、商业、电信等领域数据科学工作的高级工程技术创新人才。
机器学习是数据科学与大数据技术专业主要专业课程。机器学习课程建设需围绕数据科学与大数据技术专业培养目标,面向“新工科”建设,在教学内容上增加工程应用案例内容份额,适时引入相关领域最新知识与技术,紧跟学科发展方向,积极探索出一套适用于本课程的有效教学方法与教学手段。
3教学内容建设
机器学习是计算机科学、统计学、智能科学等多学科交叉领域,与数据挖掘、人工智能等共同发展起来,内容上存在交叉与重叠,但又有其自身学科特点,且不断发展出新理论与方法。因此,机器学习课程本科教学需选择与优化教学内容,让学生理解机器学习基本概念、常用机器学习模型、常用学习算法,能够运用机器学习关键技术分析实际问题,了解当前机器学习发展动态。
机器学习前导课程是微积分、高等数学、线性代数、概率论与统计、高级语言程序设计、数据结构与算法,后续课程是并行计算、Hadoop、计算机视觉、视频大数据综合实验、社交网络与信息传播分析综合实验。围绕数据科学工程应用型人才专业培养目标,面向“新工科”建设,本课程教学内容选择将遵循“知識够用、注重应用、内容先进和总体优化”原则。机器学习是实践性较强课程,该课程本科生教学应以知识应用与实践技能为重点内容,并适度引入机器学习最新技术以保证课程内容先进性。
本课程教学内容分为理论教学内容与实践教学内容。基于上述原则,理论教学内容分为3部分:①机器学习基础,通过案例说明机器学习是什么、相关概念及实验工具介绍[6];②机器学习关键技术,通过具体案例应用介绍数据预处理技术、机器学习常见模型与算法,包括决策树、支持向量机、线性回归、逻辑回归、贝叶斯方法、k-均值算法、k-近邻算法、误差逆传播(BP)算法、Boosting算法等;③机器学习前沿技术介绍,如卷积神经网络、循环神经网络、生成式对抗网络、对偶学习等。
实践教学内容将根据机器学习技术不同应用场景,结合理论教学内容第二部分“机器学习的关键技术”进行设计。实践教学中,提升学生对机器学习技术理解及相关应用场景特点的认识,锻炼学生分析问题与解决问题能力,培养学生创新意识与能力。具体实施分为“学习——模仿——分析——应用——开发”5个阶段,体现循序渐进教学过程,逐步引导本科生参与教师科研项目,进一步加强学生项目实践经验。
4教学方法与教学手段建设
面向“新工科”建设,以学生为主体,根据学生志趣与特点设计教学环节,调动学生主观能动性与创造性,培养学生协作、分析、解决问题能力。理论教学以案例应用为载体讲解知识原理,注重问题分析过程与知识技术应用[9-11];实验教学设计实际应用场景,引导学生分析问题场景,鼓励学生尝试、对比不同技术,启发学生思考[12]。
4.1教学方法建设
4.1.1以案例驱动教学
机器学习理论与方法发展,最终目的是解决实际问题,服务生产与生活。该课程理论教学使用案例应用作为问题场景,如2012年美国大选期间,奥巴马麾下有一支由半监督学习研究专家R.Ghani领导的机器学习团队,基于机器学习模型分析结果提示奥巴马如何开展拉票活动。教师通过案例分析引出相关技术,提炼问题引出相关概念,分析、验证、评价案例中技术,总结使用方法。以案例为载体驱动教学,实战性强,学生积极性高,能极大激发学生学习兴趣。通过亲历案例应用解决过程,学生知识结构主动成长,收获信心与成就感。
4.1.2以问题提升教学
根据授课内容与学习目的,合理设计应用场景问题与理论知识问题,提供参考学习资料,启发学生思考、分析,组织学生讨论,促进学生理解机器学习相关技术,培养学生学习与思维能力[10-11]。此外,解决一个问题往往可采用多种机器学习技术完成,哪种技术效果最好?哪种技术效率最高?每种技术应用场景特点是什么?此类问题,教师先鼓励学生查找文献、动手实验,再听取学生实验汇报,给予解答。通过实验分析、比较,学生加深对问题本质的认识,提升对技术、方法的理解。
4.1.3以“鼓励”提升教学
实验教学以实践方式提升学生对机器学习模型、机器学习算法的理解与运用,锻炼学生分析、解决实际问题的能力。实验教学应根据理论教学知识点选择、设计相应实际应用场景。教学过程中,启发学生分析问题场景,鼓励学生按照自己思路尝试解决问题,在解决问题过程中鼓励、启发学生,引导学生分析、总结实验。
4.2教学手段建设
该课程教学可融合多种教学手段,将传统教学方式与现代多媒体、移动手机教学方式相结合,将网络教学与传统教学相结合,将课件制作与最新计算机技术相结合,增强知识内容趣味性,引导学生思考问题、体验解决问题的乐趣。为了提高教学效果及学生自主学习能力,加强两方面教学手段建设:①有效利用网络教学。通过网络,向学生推荐课程课件、课程视频、电子书、会议论文资源、数据集、开源工具箱、学术论坛网站等,进行在线知识问答、提交作业,为学生自主学习提供便利,帮助学生进步。②精心制作课件。根据教学大纲,科学选择教学内容,精心制作PPT,合理组织演示内容,文字、公式结合图片、动画、声音,增加内容生动性与趣味性。
5结语
数据资源是重要现代战略资源。发现大数据中有价值信息,是数据科学工作者的核心工作。培养合格数据人才,对我国新经济发展有着重要作用。本文在新工科建设背景下,围绕数据科学与大数据技术专业本科培养目标,讨论机器学习课程建设目标;分析机器学习教学内容建设工作,提出教学内容选择原则,给出教学内容主要框架;讨论机器学习教学方法与教学手段,提出以案例驱动教学、以问题提升教学、以“鼓励”提升实验教学质量3种教学方法。上述研究成果将能有效保障机器学习课程教学计划实施,提升课程教学质量及数据人才培养质量。
参考文献:
[1]秦磊.课程建设是内涵发展的重要抓手[N].中国教育报,2015-06-02(10).
[2]陈振冲,贺田田.数据科学人才的需求与培养[J].大数据,2016(5):95-106.
[3]吴爱华,侯永峰,杨秋波,等.加快发展和建设新工科主动适应和引领新经济[J].高等工程教育研究,2017(1):1-9.
[4]夏建国,赵军.新工科建设背景下地方高校工程教育改革发展刍议[J].高等工程教育研究,2017(3):15-19.
[5]林健.面向未来的中国新工科建设[J].清华大学教育研究,2017,38(2):26-35.
[6]钟登华.新工科建设的内涵与行动[J].高等工程教育研究,2017(3):1-6.
[7]刘静.大数据:跨界应用进行时[N].中国电子报,2017-03-21(05).
[8]中华人民共和国国务院.促进大数据发展行动纲要[EB/OL].http://www.gov.cn/zhengce/content/2015-09-05/content_10137.htm.
[9]李勇.本科机器学习课程教改实践与探索[J].计算机教育,2015(13):63-66.
[10]胡雪蕾,孙明明,孙廷凯,等.研究生“机器学习”课程教学改革实践与探讨[J].煤炭高等教育,2012,30(1):118-121.
[11]邓志鸿,谢昆青.机器学习课程的教学实践——以北京大学“智能科学与技术”本科专业为例[J].计算机教育,2016(10):18-19.
[12]曲衍鹏,邓安生,王春立,等.面向机器学习课程的教学改革实践[J].计算机教育,2014(19):88-91.
(責任编辑:何丽)
相关文章!
  • 融合正向建模与反求计算的车用

    崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
    摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了

  • 浅谈高校多媒体教育技术的应用

    聂森摘要:在科学技术蓬勃发展的今天,我国教育领域改革之中也逐渐引用了先进技术,如多媒体技术、网络技术等,对于提高教育教学水平有很

  • 卫星天线过顶盲区时机分析

    晁宁+罗晓英+杨新龙<br />
    摘 要: 分析直角坐标框架结构平台和极坐标框架平台结构星载天线在各自盲区状态区域附近的发散问题。通过建