教育信息化2.0时代教育数据开放的战略价值与实施路径
杨现民 周宝 郭利明 杜沁仪 邢蓓蓓
摘要:数据的开放与共享是大数据时代的基本特征,正在引起各行各业的高度关注。近年来,随着众多国家大数据战略的提出与推进,教育数据开放的战略意义正提升到新的高度。教育数据开放是指将教育领域内不涉及个人隐私、部门机密和国家安全的教育相关数据通过数据开放接口或数据开放平台(门户网站)等形式对外合理、规范化公开,以实现教育数据的创新应用与价值增值,推动教育事业高质量发展。从战略价值的层面看,教育数据开放是推进新时代更高质量和更高层次教育开放的重要动力,是实现教育数据资产增值的基本保障,是提升政府教育治理能力的有力举措,是推动教育行业发展的关键力量,也是构建智慧教育新生态的基础条件。从实践推进的层面看,我国教育数据开放应基于新时代我国国情与教育发展需要,制定完备的教育数据开放政策,建立统一的教育数据开放平台,规划具有中国特色的教育数据开放路线,建立健全教育数据开放法律法规,以及设计高效的教育数据开放运行机制,以此保障我国教育数据开放的顺利推进。随着大数据技术的发展,教育数据开放面临的隐私保护问题也更加突出,还应特别加强制度层面的规制、技术层面的控制和思想层面的防范。
关键词:教育信息化2.0;教育数据;数据开放;战略价值;实施路径
中图分类号:G434 文献标识码:A 文章编号:1009-5195(2018)05-0010-12 doi10.3969/j.issn.1009-5195.2018.05.002
2018年4月13日,教育部印发《教育信息化2.0行动计划》,指出要构建一体化的“互联网+教育”大平台,整合各级各类教育资源公共服务平台和支持系统,实现教育数据等的有效共享并完善教育数据标准规范,促进政务数据分级分层有效共享(中华人民共和国教育部,2018)。教育信息化2.0的核心目标是以教育信息化全面推动教育现代化,全面提升教育品质,构建新时代教育的新生态(杨宗凯,2018),其具有以下八大特征:更加坚持时代引领、应用驱动、深度融合、教育治理,更加兼顾探索普及、区域差异、社会各方、顶层基层(任友群,2018)。
进入教育信息化2.0时代,我国教育信息化发展将追求更高层次和更广范围的数据开放,并以此为载体推动教育生态的优化与重构。教育数据开放是教育开放的重要组成部分,也应成为教育信息化2.0行动计划的基础性任务。早在2015年10月10日,全国首届教育实证研究论坛就发布了《大力开放教育数据的倡议书》,提倡“更多地开放各级政府部门已经掌握的教育数据、更好地开放已经开发或正在开发的教育数据、更快地开放各级各类教育数据”(全国首届教育实证研究论坛,2015)。然而,目前教育界尚未对教育数据开放形成清晰的认识,仍存在一些基础性问题亟需澄清,比如教育数据开放的本质内涵是什么,有何特征?与教育开放的关系是什么?目前国际社会在教育数据开放领域有何战略举措?教育数据开放具有什么样的战略价值以及如何实施具有中国特色的教育数据开放?基于此,本研究将对我国教育数据开放面临的几个基础性关键问题进行探讨,期望能推动我国教育数据开放的进程与发展。
一、教育数据开放的本质内涵
1.教育数据开放的概念
数据开放是大数据时代发挥数据价值的重要途径,也是大数据时代的重要特征和发展趋势之一。数据开放与开放数据既有联系,又有区别。我们可以把数据开放看作一种行为,把开放数据看作一种结果,数据开放是形成开放数据的前提条件和重要方式。开放数据是指对Web中产生或存在于Web中的各种类型的数据,按照用户特定的需求和相应的互联网协议、规则、框架进行的开发、加工、存储、组织等管理活动,最终目标是实现局域和全部Web空间的数据开放、互通与共享(谭健,2011)。开放数据遵循完整性、原始性、及时性、可获取性、机器可读性、非歧视性(任何人均可获取与访问)、非专有性(格式是通用的)、免许可性8项原则(Open Government Working Group,2007)。
数据开放是指通过数据接口、网站等形式,在业务系统内部、系统之间或面向全社会,合理合法公开特定数据的获取与使用权限。数据开放的主体可以是个人、行政机构、企业、社会组织等。近年来,随着数据开放运动在各个国家和各个领域不断推进,其内涵亦在慢慢拓展。数据开放不仅是一项开放数据的运动,还是一种思维方式、一种文化,即让人们以更加开放、多元的思维平等、合理获取和使用数据,以满足个体、机构以及社会组织的发展需求。
教育数据开放是数据开放的一个子集,特指教育领域的数据开放。文献调研发现,目前尚未有学者或相关组织机构对教育数据开放进行明确地概念界定。本研究认为,教育数据开放是指将教育领域内(主要指各级教育行政部门、各学校以及教育培训机构)不涉及个人隐私、部门机密和国家安全的教育相关数据通过数据开放接口或数据开放平台(门户网站)等形式对外合理、规范化公开,以实现教育数据的创新应用与价值增值,推动教育事业高质量发展。
教育数据开放不仅是数据本身的开放,同时包含数据的采集、整理、发布等一系列数据操作过程的开放以及提供的各种数据服务的开放,比如应用数据辅助学生填报高考志愿、支持学校跟踪评价教育质量、促进个性化学习资源推荐等。需要注意的是,教育数据开放与教育信息公开不同。教育信息公开强调社会公众对教育领域各项信息的知情权,而教育数据开放更侧重于社会公众、组织机构等对教育数据的使用权。
2.教育数据开放的层次
根據数据开放的程度,可将教育数据开放划分为三个层次,分别是教育系统内部业务数据横纵贯通开放共享、教育系统与外部系统之间的数据开放共享以及中国教育与世界教育之间的数据开放共享(见下图)。
图 教育数据开放的层次架构
教育系统内部业务数据开放共享包括纵向开放共享和横向开放共享。纵向的数据开放共享是指各级教育行政部门(国家、省、市、县)之间以及行政部门和其管辖范围内学校之间的数据开放共享。横向的数据开放共享是指教育行政机构各部门(如省教育厅的办公室、财务处、政策法规处、基础教育处等)之间和学校各部门(如人事处、学生处、教务处、财务处等)之间的数据开放共享。随着互联网、云计算等技术的普及应用,各级各类信息化业务系统(如人事管理系统、学籍管理系统、资源管理系统等)主要采用提供标准化数据接口(如HTTP协议接口或Web Service接口)的方式公开数据,以供其他业务系统获取。我国正在推进的“三通两平台”建设工程,就是旨在通过纵向的数据互联互通构建一体化的国家教育管理信息化体系和国家教育资源公共服务体系。2018年4月,教育部发布的《中小学数字校园建设规范(试行)》在信息化应用系统建设方面也明确提出“应用服务之间应实现基础数据共享,避免出现‘信息孤岛”。
教育系统与外部系统之间的数据开放共享是指教育行政部门、学校以及教育培训机构所持有的数据向交通、医疗、金融等行业以及社会组织与公众开放共享,以促进教育数据在整个社会的规范有序流通,激发教育数据市场活力,推动教育行业繁荣发展。进入“互联网+”时代,行业数据的开放共享以及产业效率的快速提升,正推动一体化、联动式的现代产业体系形成。比如,宁波市推出的“智慧校园卡”(中国宁波网,2015),集成了学生组织管理、在校情况推送以及学生校园内外乘车、消费等功能,初步实现了教育系统与金融、交通等行业系统数据的开放共享,对打造宁波智慧教育与智慧城市起到了很好的支撑作用。
中国教育与世界教育之间的数据开放共享是指中国教育领域的数据向其他国家适度开放共享,特别是“一带一路”沿线国家,实现全球教育信息与资源的合理规范开放,促进世界教育均衡与公平。超越国度的教育数据开放共享能够推动各国教育领域的深度合作,解决世界教育的基本矛盾,促进教育国际化,打造人类教育共同體。目前美国、英国、法国等国已经通过本国统一数据开放平台(如Data.gov、Data.gov.uk、Data.gouv.fr等)对外开放教育相关数据集,促进全球教育领域的数据流转。
3.教育数据开放的特征
与政府数据、科研数据等的开放相比较,教育事业与业务本身的独特性导致教育数据开放呈现出三个显著特征:
第一,教育数据开放的数据体系呈现更高的复杂性。完整的数据体系是教育数据开放的基础与前提。大数据时代,根据其来源和范围,教育数据可分为个体教育大数据、课程教育大数据、班级教育大数据、学校教育大数据、区域教育大数据、国家教育大数据等6类(杨现民等,2015)。其中各层教育数据中均包含更多的细化数据,涉及大量过程性数据和结果性数据。此外,随着物联感知、视频录制、图像识别、平台采集(邢蓓蓓等,2016)等大数据采集技术的不断发展,半结构化与非结构化数据在教育数据中的比例亦随之不断增加。大数据时代教育领域内数据类型的不断丰富与数量的不断增加,使得教育数据开放的数据体系呈现出更高的复杂性。
第二,教育数据开放的价值转化周期更长。金融、交通、医疗等行业具有明晰的数据应用模式和流程,能够快速将拥有的数据应用于实践,实现从数据到经济效益的转化。与金融、交通、医疗等行业不同,我国教育数据开放正处于起步阶段,教育领域包含的数据纷繁复杂,对各类开放数据尚未形成明晰的应用模式与流程,难以在短期内看到开放数据带来的经济效益。此外,教育领域的开放数据增值具有隐形化特征,不能在短期内以直观的形式显现出来。如教育数据开放能够催生新的产业模式,增强经济市场活力;能够打破数据壁垒,汇聚数据,为政府、学校以及企业等管理水平的提升提供数据支持,减少其在人力物力方面的投入等。教育数据开放价值的非短期可见与隐形化特征使教育数据开放的价值转化周期更长。
第三,教育数据开放的隐私问题具有更高的敏感性。学习者、教师以及教育管理者是教育活动的核心参与要素,其学习、教学、管理活动是教育数据的重要来源。随着信息技术的不断发展,越来越多的关于学习者、教师以及教育管理者的数据被各种系统和设备所获取和利用,其中包含了大量的隐私数据。不同于其他领域,数据隐私在教育领域更加重要,不仅涉及学生成长、教师发展、家庭希望,也关系到社会发展甚至国家安全,其影响不可小觑(李青等,2018)。教育数据在各教育系统之间开放共享、向社会各方开放将涉及到大量学生、教师以及教育管理者的隐私数据,导致教育数据开放中的数据隐私变得更加敏感。
二、教育数据开放的国际审视
目前全球教育数据开放正处于起步阶段,其作为数据开放运动的一部分,受到众多国家的关注。美国、英国、法国、澳大利亚等国纷纷制定教育数据开放战略,以指导本国的教育数据开放。
美国教育部为响应美国的开放政府计划,从2010年开始,每两年发布一版《美国教育部开放政府计划》,每个版本在上一版本的基础上进行补充和扩展,目前已经发布了5个版本(2010版、2012版、2014版、2015版、2016版)。该计划提出要建立ED Data Express网站,提高公众访问和探索教育部中小学教育办公室(OESE)收集高价值国家级数据的能力;在Data.gov、Recovery.gov、National Center for Education Statistics(NCES)等网站上及时发布教育领域的电子数据;在保护机密的同时提供数据发布和共享方面的技术支持;组织数据战略小组(Data Strategy Team,DST)协调不同部门之间的数据战略问题;设立首席隐私官(Chief Privacy Officer,CPO)协调各部门工作并负责指导隐私政策的制定。此外,美国政府在2014年4月9日发布的《开放数据行动计划》中指出将进一步发布教育等高优先级别的数据,并在政府数据开放平台上开放教育领域的数据集。到目前为止,共有393个数据集可供社会公众免费获取和利用,涵盖了学生、学校、教师、中学教育、特殊教育等众多方面(Data.gov,2018)。
英国教育部于2012年6月发布了《教育部开放数据战略》,对英国教育部开放数据的目标、价值以及到2012年6月为止教育数据开放所取得的成绩进行了总结,并提出未来的教育数据开放计划,即采集和发布大型常规数据集(如开放全国学生数据库的匿名数据访问权限、提供更多的学校数据和学生表现数据、开放学生就读学校和就业机构数据、开放更多有关儿童服务的数据)、注重用户反馈、向企业开放数据从而为学校提供更好服务、不断提高发布数据的质量等(Department for Education,2012)。2013年11月,英国政府颁布了《G8开放数据宪章英国行动计划2013》,提出要开放教育等12个领域的高价值数据集。目前英国数据开放平台Data.gov.uk中已公开1383个教育领域内的数据集,涵盖了学习者、教育培训、国家课程等多方面的数据(Data.gov.uk,2018)。
法国的《透明和协作的政府:法国国家计划》指出,教育作为数字计划的一部分,教师、学生和家长之间数字生态系统的发展需遵循政府数据开放平台战略原则,并对所有数字内容和服务供应商公平开放,同时注重学生个人数据的保护以及数据的可移植性(French Republic,2015)。澳大利亚的《国家政府信息共享策略》对澳大利亚目前的教育数据开放情况进行了总结,如建立MySchool网站,其中包括澳大利亚近1万所学校的简介、每所学校规模、人员配备比、学生背景和国家评估计划中识字和数学测试结果等数据,并向社会公众开放(Office of the Australian Information Commissioner,2010)。新西兰的《高价值公共数据重用的优先级与开放——流程与指南》指出,政府将通过主动发布纳税人资助的数据,协助教育领域、研究领域、科学界和公众共同构建现有数据体系,以获取并应用新知识。此外,法国、澳大利亚和新西兰已在各自的数据开放平台(Data.gouv.fr、Data.gov.au、Data.govt.nz)上不同程度地開放了教育领域相关数据。
目前我国教育数据开放工作大部分停留在信息公开层面,教育数据开放正处于起步阶段。国家已经出台一些政策文件,对教育数据开放进行了初步规定。如《教育信息化“十三五”规划》指出要制订出台教育数据管理办法,规范数据的采集、存储、处理、使用、共享等全生命周期管理,保证数据的真实、完整、准确、安全及可用,实现教育基础数据的有序开放与共享。又如《教育部机关及直属事业单位教育数据管理办法》中提出要推进教育数据的共享,以共享为原则、不共享为例外公开教育数据。此外还提出公开教育数据要依照相关法律法规,在满足社会公众知情权的前提下,有序开放公共教育数据资源。在数据开放平台建设方面,上海市政府数据服务网、深圳市政府数据开放平台等一些发达城市的数据开放平台已经率先公开教育领域的相关数据,并提供了数据接口供第三方直接获取和应用。
三、教育数据开放的战略价值
1.教育数据开放是推进新时代更高质量、更高层次教育开放的重要动力
教育数据开放是教育开放的新特征。随着我国教育开放事业的不断发展,教育对外开放的数据类型和数据量亦不断丰富,教育数据开放将会推动新时代我国教育走向更高层次和更高质量的开放。主要表现为以下三个方面:
第一,教育数据开放有利于提升中外合作办学质量。将学校甚至所在区域内的教育数据向境外合作方开放共享,有利于境外合作方了解学校情况,并根据学校需求合理部署教师、设备等资源,提高办学水平。办学双方数据融通共享能够进一步提高各项评估的科学性,提高教学与管理水平,完善中外合作办学质量保障体系,提升合作办学质量。
第二,教育数据开放有利于推进我国与其他国家的学分互认。中外双方将其所持有的教育数据开放共享,能够使双方更清晰地了解彼此学校的发展状况、教学计划、课程设置、人才培养、教师教学情况等,为学生的学分互认提供更多的选择与评估依据,促进我国与其他国家的学分互认。
第三,教育数据开放有利于推动我国积极参与全球教育治理。向其他国家开放我国的教育数据,一定程度上能够在国际上推广我国教育教学改革发展的经验,强化我国在国际教育治理中负责任的大国形象,深度参与国际教育规则制定。
2.教育数据开放是实现教育数据资产增值的基本保障
大数据时代,教育数据的价值正在被广大教育者重新认识和评估。教育数据不再仅仅是一堆用作统计的简单“数字”,其正在成为一种变革教育的战略资产和科学力量(杨现民等,2016)。教育数据资产作为大数据时代资产的新形式,是指在学校教育活动中产生、并根据教育需要采集与积累、为学校拥有和控制、一切为教育发展服务并能够创造巨大价值的数据资源(潘青青等,2018)。
教育数据开放能够实现教育数据资产增值,主要表现在两个方面:第一,教育行政各部门内的数据开放能促进教育行政数据价值的最大化。教育行政部门掌握着大量的数据资源,行政部门内部数据开放,能够汇聚各部门数据,便于数据的整合、分析,发挥数据的价值,从而促进决策的科学化和教育资源的合理配置,实现教育行政部门内的数据流转与价值创造。第二,学校各部门内的数据开放能促进学校数据价值的最大化。学校作为教育活动的主要发生场所,每时每刻都产生、汇聚着大量的教育数据,学校各部门之间开放彼此拥有的数据能够汇聚学习类数据、教学类数据、管理类数据、科研类数据以及服务类数据等,为发挥教育大数据在教育管理、教学模式、个性化学习、教育评价等方面的重要价值奠定基础,从而实现学校教育数据资产的增值。
3.教育数据开放是提升政府教育治理能力的有力举措
教育行政部门负责制定并指导、督促、检查和组织实施我国教育事业的各项中长期计划,全国各区域、各阶段教育的方针政策、法律法规等,协调其他政府部门共同推动我国教育事业高效、和谐、平衡、可持续发展。合理开放政府各部门数据能够提高政府的整体治理能力(司林波等,2017),教育行政部门作为政府机构的重要组成部分,适度有序开放其持有的数据同样有利于提高教育治理体系和教育治理能力的现代化水平。
第一,开放教育行政部门的数据能够促进社会各方参与教育治理,发挥社会各方对教育部门事务处理的协助作用,推动社会共同治理。教育治理是面向教育领域的一个行动过程,是政府、企业和学校等多社会主体依托正式或非正式制度在主体间进行协调及持续互动的行动过程(刘来兵等,2017)。社会参与能够提高教育行政的回应性,保障教育公共服务公平性,补充公共教育服务供给力量(蒲蕊,2015),推进教育治理行动进程。
第二,开放教育行政部门的数据可以提升部门透明度,提高公信力,保障公众的知情权、监督权和公共数据的使用权。公众可以通过教育部门开放的数据了解目前国家教育领域的重要决策、重要事务以及教育领域当前发生的与公民权利和利益密切相关的事件,并对行政部门的各种决策进行监督,保护自身权益,稳定社会秩序,促进教育行业和谐、可持续发展。
第三,开放教育行政部门的数据可以为教育管理与决策提供科学的数据支持,促进教育决策的科学化。数据开放能够汇聚、整合不同部门的数据,为教育管理者提供更加多元、高质量的数据,通过科学的数据统计与分析使教育决策更加贴近现实问题,识别其特性与规律,从而“对症下药”。
4.教育数据开放是推动教育行业发展的关键力量
教育数据开放能够促进教育领域内、教育领域与其他领域的数据流转与融合,为整个教育行业带来巨大的经济利益,推动整个教育行业发展。
第一,教育行政部门数据的对外开放能推动教育行业发展。政府开放其保有的数据供社会增值开发和创新应用,为其生产、生活和经济社会活动服务,可助推经济增长和社会发展,激发大众创业、万众创新(郑磊,2015)。教育行政部门将其拥有的数据向社会组织、各类教育机构、教育服务公司开放,能够最大程度实现社会数据资源有效配置和充分再利用,同时融合教育、金融、交通、医疗等数据,亦能帶动大数据产业、数据服务产业等新兴产业的发展。
第二,学校教育数据的对外开放能推动教育行业发展。我国的教育大数据产业正在兴起,随着信息技术的不断发展,将创造出巨大的商业价值。一方面,学校将其所拥有的数据向各类教育机构和教育服务公司开放,可以为其提供多元、高质量、高密度的数据集,减少其在数据采集、整合等方面所投入的人力物力,从而将更多的人力物力投入到经营管理、人才培养与创新应用等方面,促进教育市场的良性发展。另一方面,各类教育机构与教育服务公司在拥有学校开放的学生学习、教师教学、教学管理、设备运转等真实数据的基础上,通过数据分析与挖掘,可以为学校及社会提供种类更多、质量更优的服务,从而促进整个教育大数据产业迅速发展,推动其产生更大的经济价值。此外,学校将其拥有的数据向金融、交通、医疗等领域开放,不仅可以使学校师生享有更加个性化的金融、交通、医疗服务,也可以促进形成新的立体式的经济增长模式,推动教育行业快速发展。
5.教育数据开放是构建智慧教育新生态的基础条件
智慧教育是依托物联网、云计算、无线通信等新一代信息技术所打造的物联化、智能化、感知化、泛在化的教育信息生态系统(杨现民,2014)。信息生态强调人与所处信息环境的互动统一,通过彼此间信息交换,促进要素发生改变,进而促进信息生态系统自我组织,自我适应(刘智明等,2018)。数据作为人与信息环境交互的媒介,是信息生态系统中的新要素。大数据时代,信息生态强调开放性,系统开放性是影响和改变信息生态系统的重要因素(陈茫,2015)。教育数据的开放共享能够汇聚学校各部门、各系统所持有的数据,推动整个生态中的数据流转,促进智慧教育“智慧”的实现。
教育数据开放能够促进新时代智慧管理、智慧评价与智慧服务的发展,从而为构建智慧教育新生态奠定基础。智慧管理方面,跨部门的数据开放共享能够极大丰富决策系统所拥有的数据量与数据类型,经过多元数据分析可以更加智能地识别各系统的需求,精简处理流程,科学统筹决策,使各个系统更加智能地运行,推动整个学校的智慧管理水平。智慧评价方面,利用跨部门的数据从多个维度多个层面对教师的教学质量、学生的学习效果等进行评价,可以打破传统的以经验为主、较片面的评价方式,真正实现“用数据说话”的全面智慧评价。智慧服务方面,教育系统与外部系统(如金融、交通、医疗、能源等)的数据互联共享能够使学校、企业、政府形成一个良性的数据开放生态,从而使教育行业为全社会提供更加个性化的学习与培训服务。
四、教育数据开放的实施路径
1.制定完备的教育数据开放政策
政策保障是推动教育数据开放的有效力量。虽然我国已经发布了一些政策文件,如《教育信息化“十三五”规划》《教育管理信息化建设与应用指南》《教育部关于推进中小学信息公开工作的意见》等,对我国教育数据开放工作进行了初步规范与指导,但是,我国仍需制定专门的教育数据开放政策,更加全面、细致地指导我国教育数据开放工作。参照国际上其他国家数据开放政策的内容,并结合我国教育领域的实际情况,笔者认为当前我国教育数据开放政策应涵盖管理规划、机构问责、内容范围、标准规范、人才培养五方面内容,并根据我国教育数据开放进展情况适时调整,不断修改完善。
管理规划类政策主要是做好教育数据开放的顶层设计,通过制定教育数据开放路线图和行动计划,从宏观层面指导和规范整个教育数据开放进程。如美国的《开放数据行动计划》、英国的《开放政府伙伴关系英国国家行动计划》和《英国开放数据路线图2015》等。
机构问责类政策主要是构建统一协调的教育数据开放组织架构。我国需设立教育数据开放相关责任机构、科研院所,并协调目前已有的部门机构,明确机构责任,促进教育数据开放工作的顺利开展,保障我国教育数据开放政策的切实执行,推动教育数据开放相关研究。如法国设立了“国家首席数据官”,创立了Etalab工作组,共同促进法国政府数据开放;澳大利亚设置了政府信息管理办公室、总理内阁部、国家档案馆等众多机构,提升数据开放工作质量。
内容范围类政策主要是厘清教育领域数据开放的范围,教育系统内部、教育系统向其他行业系统、中国教育向世界教育开放什么数据,不开放什么数据。如英国在《G8开放数据宪章英国行动计划2013》中明确指出政府需向公众开放教育、犯罪、交通、财务等14类数据集(Cabinet Office,2013),为英国的数据开放奠定了基础。
标准规范类政策主要是对教育数据开放的数据标准、存储格式、接口标准、数据发布流程、遵循的数据协议等做出规定与指导。如加拿大政府根据阳光基金会“开放政府信息的十项原则”制定了完整性、及时性、机器可读性、非歧视性等10项数据开放原则(Government of Canada,2017)。此外,加拿大还制定了《元数据标准》,定义和描述了数据资源的结构、含义、内容等(胡逸芳等,2017)。
人才培养类政策是对培养教育大数据专业人才做出相关规定。人才是21世纪的核心竞争力,大数据时代国家需培养具有数据素养的高水平人才,设置相关专业和课程,推进教育数据开放培训工作,提高教育数据开放方面的人才储备,并根据我国不同地区的教育数据开放情况合理配置人才,促进我国教育数据开放工作的高效开展。
2.建立统一的教育数据开放平台
我国目前尚未建立国家层面的教育数据开放平台,但国际上已有不少国家建立了国家层面的数据开放平台,如美国的Data.gov、英国的Data.gov.uk、法国的Data.gouv.fr等。因此,我国应加紧建立统一的教育数据开放平台以供民众获取和利用相关数据。教育数据开放平台应注重数据管理、应用服务和管理运行三方面的建设。
数据管理主要包括数据来源、数据质量和数据安全三方面内容。教育数据开放平台的数据要全面广泛,其主要来源于教育行政部门、学校以及教育培训机构。教育行政部门的数据纵向上需包括国家、省、市、县持有的数据集,横向上需包括教育部门、财政部门、工信部门等发布的与教育相关的数据集。学校部分的数据应包括学习、教学、管理等数据。教育培训机构的数据需包括培训课程、课程安排、培训教师信息等数据。数据质量要求平台对数据从精确性、完整性、一致性、时效性和实体同一性(Guo et al.,2002)以及内容的可靠性与可信度等方面进行初步筛选,提升开放数据的整体质量。数据安全要求平台利用新型的加密技术保障数据安全,对涉及个人隐私、部门机密以及国家安全的数据不予开放,或利用数据脱敏技术保障数据隐私不受侵犯,通过申请审核制对数据开放的权限给予控制。
应用服务要求平台提供数据检索和数据下载等服务,以及提供数据接口和数据分析工具等。数据检索需提供关键词检索、高级检索、专业检索等多种检索方式,并根据我国教育领域的实际情况提供数据目录。数据下载要求平台提供多种格式的数据类型,如DOC、XLS、CSV、ODS、RDF等。此外还需提供数据接口以便第三方基于已有数据进行开发,以及提供相关工具便于访问者进行数据分析等。
管理运行包括用户的注册登录、订阅、反馈以及平台的安全防护等。首先,对于有管理需求的用户,平台需提供注册登录功能,对账户进行管理,并向用户推送其所关注的信息。其次,平台需注重用户反馈,提供反馈渠道并根据反馈意见及时调整,以保障平台高效运行。最后,平台管理者需注重平台本身的安全防护,从基础设施建设、管理机制以及管理维护技术等方面保证平台的安全运行。
3.规划具有中国特色的教育数据开放路线
改革开放以来中国教育不断发展,在教育思想、战略规划、教育结构、教育体制等方面发生了根本性的变革,形成了具有中国特色教育体系的基本框架和发展模式(范文曜等,2008)。中国特有的社会体制、教育体制和文化体制,以及经济发展、教育发展情况等使中国的教育数据开放具有中国特色。为推动我国的教育数据开放进程,我国应规划具有中国特色的教育数据开放路线。
第一,“自上而下”开展教育数据开放工作。我国应以“国家→省→市→县”的路线实施教育数据开放。国家制定总体规划政策,每个省根据本省的发展情况在国家总体规划政策指导下确定符合自己省情的教育數据开放政策(如开放范围、开放目标、实施步骤等),下层机构在上层机构的指导下依次严格实施教育数据开放。此外还应鼓励各省、市根据自己的情况积极探索教育数据开放的新路线、新模式等。
第二,从“信息公开”过渡到“数据开放”,从开放“基础数据”到开放“关键数据”,逐步开放教育数据。首先是从“信息公开”过渡到“数据开放”。目前各教育行政部门和学校在《教育部政府信息公开指南(试行)》《高等学校信息公开办法》等文件的指导下已经逐步公开相关信息,接下来应继续推进教育信息公开进程,并逐渐向教育数据开放过渡,有序开放其所持有的数据,供公众获取使用。其次是从开放“基础数据”过渡到开放“关键数据”。各教育行政部门、学校、培训机构应首先公开在读人数、性别比、师生比、培训课程等基础数据,然后再开放行政部门和学校的管理数据、学生的学习数据、教师的教学数据等关键数据。此外,对于涉及未成年人的相关数据应特别注意其开放的程度。
第三,试点先行,带动整个教育领域逐步开放数据。依据“试点先行,以点带面,逐步推广”的原则,选择信息化条件比较好的地区和学校,建立教育数据开放示范点,探索基于开放数据的数据应用模式,教育行政部门、学校和企业之间的协作模式等,并逐渐向全国推广。此外,教育数据开放示范点的地区应给予其他地区相关帮助,建立“一对一”帮扶模式等。
第四,主动开放与申请开放并行。首先,各教育数据开放主体应依照法律法规和国家有关规定主动开放教育部门统一规定的数据项。其次,各教育数据开放主体应依据自身情况,结合申请者的身份信息、数据描述、数据用途等做好教育数据申请开放工作。主动开放与申请开放并行,保证我国教育数据的合理、规范化开放。
第五,培育教育数据开放文化。教育行政部门、学校、企业、社会民众等需明确自身角色定位,创造良好的教育数据开放文化。教育行政部门应发挥其作为政府部门的影响力与执行力,加强宣传教育数据开放,营造良好的数据开放文化氛围,提高教育数据开放主体对教育数据开放的认识,提升教育数据开放的社会认知度。学校、企业、社会民众等需转变固有的思想观念,使数据采集、开放、应用等形成一种习惯,做到人人共享、行业自律。此外,国家应建立相关奖励机制,对开放数据的相关部门和学校给予一定奖励,解决由经典的“囚徒困境”(吴样平等,2005)导致的相关部门和学校不愿开放教育数据的问题。
4.建立健全教育数据开放法律法规
我国目前主要颁布了《政府信息公开条例》《政务信息资源共享管理暂行办法》《中华人民共和国网络安全法》等法规用以保证国家数据开放工作的开展。何渊从中央与地方、政府与市场、国家与社会等方面提出了我国政府数据开放的整体法律框架(何渊,2017),为我国教育数据开放的法律法规修订提供了借鉴。教育数据开放的法律法规应包括中央与地方,主体(教育行政部门、学校、教育培训机构等)与市场,主体与社会,国家与国家四方面内容。
第一,中央与地方。中央需提供顶层的制度设计,修改目前已有的《政府信息公开条例》,制定专门的《教育数据公开法》,指导地方政府制定相关法律法规。此外,中央需构建法律监管机制,对地方政府教育数据开放相关法律法规的制定以及执行进行监督。
第二,主体与市场。一方面要加强对教育行政部门、学校、教育培训机构等教育数据开放主体和企业在数据采集、存储、应用等数据层面的规范保障;另一方面要加强教育企业等的数据责任认定、引导与监督。“规范与监督”双管齐下,既能保证教育市场的活力,又能避免数据垄断、数据独裁、数据伦理、隐私泄露等问题。
第三,主体与社会。一方面要对教育行政部门、学校、教育培训机构等教育数据开放主体的权利和义务进行规定;另一方面要对社会各组织机构、企业、社会民众等的权利与义务进行规定。在整个教育数据的生命周期内,明确双方义务,推动教育开放主体与社会各层面关系的和谐发展。
第四,国家与国家。教育是民生大计,教育数据亦是国家重要保密的内容之一。我国应修改并完善《中华人民共和国保守国家秘密法》,制定《教育数据安全法》,厘清我国向其他国家开放的教育数据内容,明确个人、学校、企业等利益相关者的保密责任。
5.设计高效、透明的教育数据开放运行机制
良好的运行机制是一项工作高效开展的保障。为保证国家教育数据开放工作的顺利开展,我国亟需设计一套高效的教育数据开放运行机制。相丽玲等对我国和其他国家的政府数据开放运行机制中的基本原则、质量控制、整合利用、开放协作及评估机制、监督与问责机制等进行了分析与总结(相丽玲等,2017),对我国教育数据开放的运行机制设计具有借鉴意义。结合我国教育领域的实际情况,教育数据开放运行机制应包括数据整合机制、多方协作机制、评价反馈机制以及监督机制四方面内容。
第一,数据整合机制。数据整合机制包括数据集中、数据整理、数据共享三部分内容。数据集中是将教育行政部门、学校、教育培训机构等的数据进行集聚;数据整理是将数据统一处理,提供多种数据格式,形成统一的教育数据目录和教育信息资源库;数据共享是将集中整合处理后的数据通过数据开放平台发布,并提供数据接口与分析工具供各方获取和应用。
第二,多方协作机制。多方协作机制包括教育系统各部门之间协作、教育系统与外部系统协作两方面内容。参与教育数据开放工作的各方之间需建立合作制度,明确合作目的、合作内容、合作流程、合作形式以及自身责任,并提供合作协商渠道,必要时还要做统一管理等。
第三,评价反馈机制。评价反馈机制的作用是对数据开放工作实施评价、做出诊断、提出改进建议。首先需要设置独立机构或专职人员负责教育数据开放工作的评价反馈;其次需要建立合适的沟通渠道,加强信息反馈;最后需要对评价的内容做出规范,内容包括更新数据的及时性,数据本身的完整性、准确性、可获取性、可操作性等。
第四,监督机制。监督机制由专员监督和公众监督两部分构成。专员监督是指设立独立的机构负责监督教育行政部门、学校以及教育培训机构的教育数据开放工作;公众监督是指利用社会舆论(如网络、电视、报刊等)监督教育领域的数据开放工作。此外还需根据监督对象的不同界定监督的内容,使监督更具有针对性。
五、教育数据开放面臨的隐私保护问题及应 对策略
1.教育数据开放面临的隐私保护问题
大数据时代,教育数据开放在实现教育数据资产增值、提高政府教育治理能力、促进教育行业发展等方面无疑具有巨大的价值,但同时也面临较大的隐私泄露风险。大数据时代数据隐私保护问题主要表现为两方面:一是隐私数据本身被访问导致的隐私泄露,二是非隐私数据关联挖掘导致的隐私泄露。大数据时代隐私泄露的“双重途径”使隐私保护面临着极大挑战。
教育领域和其他领域一样也面临巨大的隐私保护挑战。教育数据开放进一步加剧了大数据时代隐私保护问题的严重性,加重了个人身份信息泄露、个人行为信息泄露、个人偏好信息泄露(唐凯麟等,2016)等伦理问题。商家可利用学习者、教师等的隐私数据通过短信、电话等形式进行产品推销和广告投放,严重影响他们的日常生活、工作和学习。同时,学习者、教师等的隐私数据泄露在一定程度上促使如电信诈骗、电子盗窃、网上非法交易等网络犯罪现象的发生,对他们的财产和生命安全构成威胁,破坏了社会稳定。此外,教育领域内的隐私数据流向他国,经过不断演化分析,在一定程度上可能会威胁国家安全。
2.教育数据开放的隐私保护策略设计
数据开放与隐私保护是一对天生的矛盾体,有效平衡二者的关系是教育数据开放工作顺利开展的重要保障。我国应从制度、技术和思想三个层面破解教育数据开放面临的隐私保护难题。
(1)制度层面
首先,通过立法保护学习者、教师等的数据隐私。《中华人民共和国未成年人保护法》《侵权责任法》和《网络安全法》在宏观上保障了公众的隐私权,我国应加紧制定《隐私法》《教育数据安全法》等具有针对性、可操作性、更加细化的法律法规,明确教育数据的使用细则,规范数据所有者的被遗忘权和删除权(张毅菁,2016),保障我国教育数据开放过程中公众的隐私权益。此外,应以《网络安全法》等法律法规为纲,做好关键信息基础设施保障,重点保障数据和信息安全,强化隐私保护,建立严密保护、逐层开放、有序共享的良性机制(中华人民共和国教育部,2018)。
其次,建立数据隐私与信用等级联动制度。将数据隐私泄露行为与个人、企业、学校、教育行政部门等的信用等级进行联动。如有恶意数据隐私泄露行为则降低其信用等级(严炜等,2016),并在全国公共信用信息公示系统等进行公示,形成数据隐私与信用等级联动机制,使信用等级成为遏制数据隐私泄露的有效力量。
再次,厘清我国教育数据开放的边界。涉及学生隐私的数据不仅包括与学习直接相关的信息(如学习记录、学习结果等),也包括学生管理信息(如考勤情况、监护人信息、健康程度等),还可能包括校园生活中采集的其他数据(如就餐数据、体育锻炼数据)(李青等,2018)。此外,教师与教育管理者的隐私数据同样贯穿于教学活动与管理活动中。我国需要制定相关政策与指令,厘清教育数据开放的边界,确定开放的内容范围,从源头减少隐私数据的采集。
最后,设立专门的隐私保护机构。目前澳大利亚、英国、加拿大均设立了专门的隐私保护机构,以保护公民的隐私权益。如澳大利亚的信息专员办公室设置了隐私专员,总理内阁部设置了隐私和信息公开政策科,共同负责数据开放过程中的隐私保护(陈萌,2017)。我国应设立专门的隐私保护机构,保障我国教育数据开放过程中相关人员的隐私权益。
(2)技术层面
大数据时代教育数据隐私保护技术应包括数据发布、数据加密、访问控制三方面内容。
首先是数据发布。数据发布需采用匿名保护技术,将教育领域中涉及隐私的相关数据进行相应变换,达到数据脱敏的效果。由于大数据时代数据发布的动态性以及学习、教学、管理等数据的多来源性,匿名保护技术需不断改进,并不断开发新的匿名保护模型,以适应大数据时代隐私保护的需求。
其次是数据加密。目前以云平台为依托的数据管理已成为大数据时代数据管理的重要趋势,云服务提供商可以获取、搜索用户存储在云端的数据,攻击者也有可能通过攻击云服务提供商的服务器获取用户的数据(李晖等,2014)。数据加密需采用同态加密(Alabdulatif et al.,2017)、可搜索加密(Wu et al.,2018)、安全多方计算(Miyajimay et al.,2016)等多种方法,保障在云平台上存储、索引以及检索相关数据时,学习者、教师、教育管理者等的隐私不受侵害。
最后是访问控制。数据开放平台需采用先进的多因子身份认证技术,用以应对云计算环境中复杂的攻击方式;使用基于属性加密的访问控制技术和基于角色的访问控制技术(陈兴蜀等,2017)对数据访问权限加以控制,采用分级开放权限的方法保护学习者、教师、教育管理者等的数据隐私。
此外,随着各种学习分析技术在教育领域中不断应用,数据挖掘带来的隐私泄露问题已不可忽视,应加紧改进旧有的数据加密技术,并不断研发新的数据隐私保护技术,用以应对教育领域内数据挖掘带来的隐私保护挑战。
(3)思想层面
思想层面的隐私保护亦是教育数据开放中隐私保护的重要组成部分,其从意识层出发,以更加主動的方式从源头减少数据隐私侵害问题的发生。思想层面的教育数据隐私保护策略可分为培养公众数据权意识和推动行业自律两部分内容。
数据权包括个人数据权和数据财产权两方面内容,其中个人数据权包括数据决定权、数据保密权、数据更正权、数据封锁权、数据删除权等;数据财产权包括数据所有者对自己的数据财产享有的占有、使用、收益、处分的权利(齐爱民等,2015)。学习者、教师以及教育管理者等应在日常的学习、生活和工作中加强自己的数据权意识,对整个数据生命周期中涉及到自己隐私的数据应及时行使数据封锁权、数据删除权以及对数据财产的使用权和处分权等。除此之外,学习者还需对自己的数据进行科学化管理,从源头减少隐私数据的泄露。
在大数据时代,教育数据类型和数量极大丰富,第三方因其技术及管理上的优势已经成为教育数据的主要使用者之一。教育行业以及其他应用教育数据的行业应自觉遵循国家有关隐私保护的法律法规与行业中的规范条例,做到合理合法应用教育数据,营造良好的应用数据氛围,培育良好的应用数据文化,使保护数据隐私成为行业的一种自律行为。
参考文献:
[1]陈茫(2015). 基于大数据的信息生态系统演变与建设研究[J]. 情报理论与实践, (3):26-29.
[2]陈萌(2017). 澳大利亚政府数据开放的政策法规保障及对我国的启示[J]. 图书与情报, (1):18-26.
[3]陈兴蜀,杨露,罗永刚(2017). 大数据安全保护技术[J]. 工程科学与技术, (5):1-12.
[4]范文曜,王建(2008). 优先发展 奠基未来——改革开放30年的中国教育[J]. 教育研究, (8):3-14.
[5]何渊(2017). 政府数据开放的整体法律框架[J]. 行政法学研究, (6):58-68.
[6]胡逸芳,林焱(2017). 加拿大政府数据开放政策法规保障及对中国的启示[J]. 电子政务, (5):2-10.
[7]李晖,孙文海,李凤华等(2014). 公共云存储服务数据安全及隐私保护技术综述[J]. 计算机研究与发展, (7):1397-1409.
[8]李青,李莹莹(2018). 大数据时代学习者隐私保护问题及策略[J]. 中国远程教育, (1):29-36.
[9]刘来兵,张慕文(2017). 大数据时代教育治理现代化的内涵、愿景及体系构建[J]. 教育研究与实验, (2):30-35.
[10]刘智明,武法提,殷宝媛(2018). 信息生态观视域下的未来课堂——概念内涵及教学体系构建[J]. 电化教育研究, (5):40-46.
[11]潘青青,田雪松,杨现民(2018). 大数据时代中小学数据资产的建设与管理[J]. 电化教育研究, (3):49-55.
[12]蒲蕊(2015). 论教育治理中的社会参与[J]. 中国教育学刊, (7):26-31.
[13]齐爱民,盘佳(2015). 数据权、数据主权的确立与大数据保护的基本原则[J]. 苏州大学学报(哲学社会科学版), (1):64-70,191.
[14]全国首届教育实证研究论坛(2015). 大力开放教育数据的倡议书[N]. 光明日报, 2015-10-27(14).
[15]任友群(2018). 走进新时代的中国教育信息化——《教育信息化2.0行动计划》解读之一[J]. 电化教育研究, (6):27-28,60.
[16]司林波,刘畅,孟卫东(2017). 政府数据开放的价值及面临的问题与路径选择[J]. 图书馆学研究, (14):79-84.
[17]谭健(2011). 开放数据及其应用现状[J]. 图书与情报, (4):42-47.
[18]唐凯麟,李诗悦(2016). 大数据隐私伦理问题研究[J]. 伦理学研究, (6):102-106.
[19]吴样平,丁乃鹏(2005). 从“囚徒困境”看教育信息孤岛的形成[J]. 情报科学, (2):292-296.
[20]相丽玲,陈梦婕(2017). 中外政府数据开放的运行机制比较[J]. 情报科学, (4):9-14.
[21]邢蓓蓓,杨现民,李勤生(2016). 教育大数据的来源与采集技术[J]. 现代教育技术, (8):14-21.
[22]严炜,邹盼(2016). 重视大数据背景下的公民隐私保护[N]. 光明日报, 2016-11-05(8).
[23]杨现民(2014). 信息时代智慧教育的内涵与特征[J]. 中国电化教育, (1):29-34.
[24]杨现民,唐斯斯,李冀红(2016). 发展教育大数据:内涵、价值和挑战[J]. 现代远程教育研究, (1):50-61.
[25]杨现民,王榴卉,唐斯斯(2015). 教育大数据的应用模式与政策建议[J]. 电化教育研究, (9):54-61.
[26]杨宗凯(2018). 教育信息化2.0:颠覆与创新[J]. 中国教育网络, (1):18-19.
[27]张毅菁(2016). 数据开放环境下个人数据权保护的研究[J]. 情报杂志, (6):35-39.
[28]郑磊(2015). 开放政府数据的价值创造机理:生态系统的视角[J]. 电子政务, (7):2-7.
[29]中国宁波网(2015). 宁波推出“智慧校园卡”可考勤可消费[EB/OL].[2018-05-03]. http://news.cnnb.com.cn/system/2015/08/27/008387387.shtml.
[30]中华人民共和国教育部(2018). 教育部關于印发《教育信息化2.0行动计划》的通知[EB/OL].[2018-04-20]. http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[31]Alabdulatif, A., Khalil, I., & Reynolds, M. et al. (2017). Privacy-Preserving Data Clustering in Cloud Computing based on Fully Homomorphic Encryption[A]. Proceedings of PACIS 2017: Societal Transformation Through IS/IT[C]. Association for Information Systems (AIS): 1-13.
[32]Cabinet Office (2013). G8 Open Data Charter UK Action Plan 2013[EB/OL].[2018-04-13]. https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/254518/G8_National_Action_Plan.pdf.
[33]Data.gov (2018). Education-Data Catalog [EB/OL].[2018-04-13]. https://catalog.data.gov/dataset?groups=education2168#topic=education_navigation.
[34]Data.gov.uk (2018). Find Open Data[EB/OL].[2018-04-20].
https://data.gov.uk/search?filters%5Btopic%5D=Education.
[35]Department for Education (2012). Department for Education Open Data Strategy: June 2012[EB/OL].[2018-04-20]. https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/320216/DfE_Open_Data_Strategy_0_10.pdf.
[36]French Republic (2015). For a Transparent and Collaborative Government: France National Action Plan 2015-2017[EB/OL].[2018-04-20]. https://joinup.ec.europa.eu/sites/default/files
/document/2015-08/2015_07_09_plan_gouvernement_ouvert_
en_version_finale_0.pdf.
[37]Government of Canada (2017). Open Data 101[EB/OL].[2018-04-13]. https://open.canada.ca/en/open-data-principles#toc95.
[38]Guo, Z., & Zhou, A.(2002). Research on Data Quality and Data Cleaning: A Survey[J]. Journal of Software, 13(11): 2076-2082.
[39]Miyajimay, H., Shigeiy, N., & Miyanishiy, Y. (2016). New Privacy Preserving Back Propagation Learning for Secure Multiparty Computation[J]. IAENG International Journal of Computer Science, 43(3): 270-276.
[40]Office of the Australian Information Commissioner (2010). Towards an Australian Government Information Policy[EB/OL]. [2018-04-20]. https://www.oaic.gov.au/images/documents/information-policy/engaging-with-you/previous-information-policy-consultations/issues-paper-1/ues_paper1_towards_australian_government_information_policy.pdf.
[41]Open Government Working Group (2007). The 8 Principles of Open Government Data[EB/OL]. [2018-04-08]. https://opengovdata.org/.
[42]Wu, L., Chen, B., & Zeadally, S. et al. (2018). An Efficient and Secure Searchable Public Key Encryption Scheme with Privacy Protection for Cloud Storage[J]. Soft Computing. https://doi.org/10.1007/s00500-018-3224-8.
收稿日期 2018-06-20 責任编辑 刘选