标题 | 计算机工科生数据科学思维人才培养模式研究与实践 |
范文 | 李荣远 龙法宁 陆钊
摘要:随着第四次工业革命的到来,各产业设备逐渐走向智能化。计算机类专业人才培养引入数据科学思维至关重要,针对计算机类工科生思考模式由数据到知识,最终用知识解决问题的传统思维。提出以数据科学与大数据技术、人工智能等专业为背景,探索学生从数据直接解决问题的数据科学思维培养模式。拥有数据科学思维三要素能力(理论、实践、精神)是每个学生必备条件。文章研究如何将数据科学思维融入课堂教学中,探索在学习新技术前,以数据为导向,激发学生从数据收集到萃取价值过程中数据科学思维模式。 关键词:数据科学;传统思维;大数据思维;数据科学三要素;数据价值 中图分类号:TP18? ? ? ? 文献标识码:A 文章编号:1009-3044(2021)01-0144-03 Abstract: With the advent of the fourth industrial revolution, various industrial equipment is gradually becoming intelligent. It is very important to cultivate computer professionals to introduce data science thinking. The traditional thinking of computer engineering students from data to knowledge, and ultimately to solve problems with knowledge. Put forward the background of data science, big data technology, artificial intelligence and other majors to explore the data science thinking training model of students solving problems directly from data. The ability of the three elements of data science thinking (theory, practice, and spirit) is a prerequisite for every student. This article studies how to integrate data science thinking into classroom teaching, and explores how to use data as the guidance before learning new technologies, and stimulate students' data science thinking mode from data collection to value extraction. Keywords: data science; traditional thinking; big data thinking; three elements of data science;data value 1 引言 2013年,Mattmann CA[1]和 Dhar V[2]在《自然》和《美國计算机学会通讯》上分别发表题为《计算——数据科学的愿景》和《数据科学与预测》论文,从计算机科学与技术视角讨论数据科学的内涵,使数据科学纳入计算机科学与技术专业的研究范畴。之后随着数据摩尔定律爆发,将数据科学推向顶端[3]。 “数据科学”与“大数据”是两个既有区别又有联系的术语,可以将数据科学理解为大数据时代一门新科学[4]。数据科学是一门以“数据”为研究对象, 并以数据统计、机器学习、数据可视化等为理论基础, 主要研究数据加工、数据管理、数据计算、数据产品开发等活动的交叉性学科[5]。数据思维是学会如何获取数据、分析数据、萃取数据价值和应用数据的思维[6]。目前,大数据已受到各学科领域的高度关注,成为包括计算机科学和统计学在内的多个学科领域的新研究方向。同时,大数据研究中仍存在一些误区或曲解,如片面追求数据规模、过于强调计算架构和算法、过度依赖分析工具、忽视数据重用、混淆数据科学与大数据的概念以及全盘否定大数据等[7]。计算机工科生主要是培养实际应用能力的工程技术人员,注重实践培养。但现状中,学生遇到数据不知从何着手,用什么工具。计算机或大数据方向学生学习过各种工具。如编程语言:C、Java、Python;大数据主流架构:Hadoop、Spark;机器学习模型:决策树、随机森林;深度学习模型:BP神经网络、CNN、RNN等。缺少使用数据科学分析处理能力,不会融会贯通,或其在学习过程中注重单一概念、模型、算法,无系统性及逻辑性,整个培养过程以运用各种工具为主,缺少以数据为基础到解决问题的逻辑能力。培养模式并不是掌握所有知识体系,再去解决问题,而是根据部分知识直接去解决问题。因此,计算机类或大数据方向教学环境中融入数据科学思维至关重要,并养成数据思维习惯是人才培养模式的关键[8-9]。 2 数据科学思维模式 2.1传统思维到大数据思维模式 面对数据,学生思维模式一般有两种,传统思维和大数据思维。传统思维是我能为数据做什么,而数据科学思维是数据能为我做什么。数据科学主要是从数据中发现潜藏的有价值的信息,并直接解决问题。如图1中对中文翻译“你好吗”传统思维与大数据思维思考模式的异同。 (1)传统思维: Step1:将“你好吗”这句话通过分词,如根据自己系统已有的知识,将句子分3个词,找出这3个词对应的各中文。 Step2:将英文字母进行组织。 (2)大数据思维:“你好吗”这个句子在现实中多次用“How are you”来表示,基于数据直接预测出答案。 2.2数据科学DIKUW模型 数据科学主要研究目标从数据D(Data)到信息I(Information)、知识K(Knowledge)、理解U(Understanding),最终到智慧W(Wisdom)的转化,如图2所示数据科学DIKUW实例转换模型。从数据到智慧呈现金字塔形式逐级攀升,体现思维从过去到未来的一种思考模式。以计算机就业实例为导向,逐一分析未来需学习哪些知识,从而适应社会的发展。DIKUW模型思考过程如下: (1)数据:发现一些零散的数据。 (2)信息:通过多条数据之间的关联得到对应的信息。 (3)知识:从多条信息中发现模型、规律,获得新知识。 (4)理解:利用新增信息、知识理解和洞见新的机会。 (5)智慧:做出数据驱动型决策,有选择性地投资,降低风险,预测未来。 2.3数据科学三要素原则 数据科学不同于其他学科,应具有重要的三要素原则:理论、实践和精神[10]。其中理论与实践一般在各学科中都有涉及。但要保持终身学习的能力,精神至关重要。如3C精神,Creative Working(创造性地工作)、Critical Thinking(批判性地思考)、Curious Asking(好奇性地提问)。需要将这些精神融入理论和实践中去。这3种精神是支撑学生终身学习的精神支柱。 3 数据科学思维课程体系建设 数据科学思维根据数据科学三要素原则,现代信息技术的发展,如百度大脑6.0、自动驾驶汽车、脑机接口Neuralink、智慧仓储、华为5G等高新技术加速万物互联,设备逐渐走向智能化发展。数据科学思维在各项新技术中起关键作用,培养学生养成数据科学思维的能力至关重要。教学培养过程中应从以下几个方面设计。 3.1理论学习 开设数据科学导论理论+实践课程,或者在计算机导论课程中插入数据科学理论知识,由校企合作或资深专家亲授,将现实应用中的云计算、大数据、物联网、人工智能、信息安全、5G技术整体串接。以案例为导向激发学生兴趣,开阔视野,结合专业知识启发性地思考。 3.2实践巩固 通过校企数据挖掘可视化平台、虚拟仿真平台或者开源数据挖掘可视化平台来实践巩固数据科学理论知识。国家推行产教融合、校企合作培养模式,大量企业走进高校,利用企业数据挖掘可视化平台:如曙光、星环大数据挖掘可视化平台;开源可视化平台如Orange、R-Programming、WEKA、RapidMiner等,通过虚拟化技术生动地将模型展示在学生面前,从而激发学生动手实践乐趣。 (1)入门阶段:零基础学生通过平台上组件推拽、流程指向即可实现数据挖掘可视化,方便学生快速掌握机器学习、深度学习等大量模型。 (2)进阶阶段:开设数据科学核心编程选修课程,如Python、R,两种语言已在统计学和机器学习占用一席之地。已开发大量包,两者之间可以通过接口相互调用,学习两者语言是精通数据科学必经之路。企业或学校用现实案例,以企业项目(人脸识别、电影推荐、情感分析、词云图)、竞赛题目(Kaggle、泰迪杯数据挖掘挑战赛、数学建模)为导向,以数据为中心,问题为导向。通过实践学习,让学生掌握数据科学工具能做什么,以及如何做,启发学生数据科学分析问题的能力。 3.3终身学习的精神能力 具有数据科学理论和实践能力,并不行,还需具有良好的精神素质。根据平台虚拟结果的展示,培养学生深度思考的能力,如机器学习训练模型结果差,分析是否过拟合、模型选择是否合理、特征处理是否正确、参数设置是否合理等多维度思考模式,培養学生在解决最终问题的同时,反思为什么,只有让学生保持好奇心同时具有批判性精神是学生终身学习的动力。 4 结语 未来社会逐渐走向智能化,各校高度重视培养先进人才,特别是数据科学与大数据、人工智能等专业人才,目前一些高校已经制定一些培养方案,但人才缺失面临一些问题,数据科学思维培养方式是今后教学改革的重要目标。 参考文献: [1] Mattmann C A. Computing: A vision for data science[J]. Nature, 2013, 493(7433): 473-475. [2] Dhar V. Data science and prediction[J]. Communications of the ACM, 2013, 56(12): 64-73. [3] Gartner J. Gartners 2014 hype cycle for emerging technologies maps the journey to digital business[OL]. http://www.gartner.com/newsroom/id/2819918. [4] Provost F, Fawcett T. Data science and its relationship to big data and data-driven decision making[J]. Big Data, 2013,1(1):51-59. [5] 朝乐门.数据科学理论与实践[M].北京:清华大学出版社, 2017. [6] 姜海红.浅谈大学计算机基础通识课程如何培养学生计算思维与数据思维能力[J].计算机产品与流通,2020(1):258. [7] 崔琳,吴孝银,张志伟.面向学生计算思维培养的数据科学与大数据技术专业课程体系建设模式探究[J].无线互联科技,2020,17(4):121-122. [8] 陈鲸.未来互联网+大数据时代数据科学发展与应用[J].网信军民融合,2019(06):17-20. [9] 朝乐门,邢春晓,张勇.数据科学研究的现状与趋势[J].计算机科学,2018,45(1):1-13. [10] 朝乐门.数据科学[M].北京:清华大学出版社, 2016. 【通联编辑:王力】 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。