大数据时代开放大学数据服务体系构建研究
摘要:从海量的数据中获取有价值的知识,已是一种普遍性的需求。开放大学在多年的数字化校园建设实践中,积累了很多宝贵数据。为了深度挖掘教育大数据的价值,构建高校数据从产生到利用的共享服务体系,为智慧校园建设提供支撑,从数据基础设施层、数据集成层、管理维护层、应用服务层四个层次构建开放大学数据服务架构。建立以数据标准、管理制度为保障,数据服务架构为核心,“个人—部门—学校”为服务主体的层级数据服务体系,形成从业务产生数据到数据反哺服务的良性循环。实践证明,将该数据服务体系架构应用于高校的智慧校园建设中,可为智慧校园的师生提供个性化服务,并为学校的决策支持提供强大的数据支撑。
关键词:大数据;数字化校园;数据集成;智慧校园
DOIDOI:10.11907/rjdk.172190
中圖分类号:TP391
文献标识码:A文章编号文章编号:1672-7800(2018)001-0188-04
Abstract:It is a universal requirement to obtain valuable knowledge from massive data. The Open University has accumulated a lot of valuable data in the practice of the construction of digital campus for many years. In order to dig out the value of big data in education, construct a data sharing service system from generationto use, to provide support for the construction of smart campus architecture, the open university data service architecture is constructed at 4 levels: data infrastructure layer, data integration layer, management layer and application service layer. Establishing data standard and management system as the guarantee, data service architecture as the core, “individual-department-school” as the main body of service, a hierarchical data service system for data analysis services is set up to form a virtuous cycle from business generating data to data feeding services. Practice has proved that the application of data service architecture in the construction of intelligent campus in universities can provide personalized services for teachers and students in smart campus, and provide strong data support for school decision support.
Key Words:big data; digital campus; data integration; smart campus
1数据服务现状及建设意义
随着广播电视大学向开放大学的转型升级,开放大学的信息化建设工作取得了很大成绩,基础设施渐趋完善,信息化服务能力逐渐提升,信息化应用已深入到办学的各个层次。但随着开放大学对信息化建设需求的进一步提升,以及IT新技术的发展,信息化方式也在发生变化,包括从注重业务流程信息化到服务信息化的转变、从信息资源的“数字化”到“数据化”的转变,从“数字校园”到“智慧校园”的转变。在大数据时代,完成信息化方式的转变,数据无疑是核心驱动力[1]。
在山东广播电视大学多年的办学过程中,已经积累了教学、科研、师生信息等大量、高质量的数据,涉及到开放教育、社区教育、成人教育等多种办学形式。传统的以流程为主体的业务服务模式所沉淀下来的数据成为新的宝贵资源,但在实际中开展的数据分析和挖掘工作还非常有限。在当前的数据服务体系建设中,只实现了单个业务系统的业务数据展示分析,以及局部性的数据统计及报表服务。若要了解全省社区教育学员的学习情况与资源利用情况,需要到社区教育平台获取;要了解成人教育的学习资源利用与学习情况需要到成人教育平台获取,或通过工作人员的手头资料来掌握实际情况,而无法实现对于各类远程教育机构的招生、教学质量情况及优质资源共享情况的对比,也未从全局角度深度挖掘有利于学校决策、提升教学策略、合理配置资源等工作的有价值的数据,这种“数据碎片化”问题造成了积累的数据与实际应用需求存在严重偏差。
《山东省人民政府关于促进大数据发展的意见》(鲁政发〔2016〕25号)提出,促进教育大数据的发展应用,探索大数据在教育管理决策、监测评价、公共服务中的运用[2]。开放大学作为大数据时代的参与者和推动者,其中各类学历教育和非学历教育产生的数据具有数量大、种类多、产生快、真实可信和具备分析价值等特点,符合大数据的特征。为彻底解决当前数据服务中存在的数据“碎片化”、共享度不足、数据利用意识欠缺、数据挖掘层次亟待提升等问题,山东开放大学需要对校园信息化的数据整合、共享和利用进行全面构思,建立层次化的数据利用和服务体系,探索一条符合开放大学的数据管理路线[3]。通过对大学的办学招生情况、教学质量、学生就业、师资、财务、健康等数据开展深度分析和应用工作,对开放大学提升精细化、规范化管理水平,使教育评价更加精准,在“教与学”上做到更加智慧,为教师和学生提供个性化的资源推荐和服务是非常重要的一项工作。
2数据服务体系构建思路
围绕学校各类办学中的教学、管理、科研、人事、财务、一卡通、后勤等核心业务信息,注重各业务系统数据的整合和共享,实现各类数据的抽取采集、存储共享、数据挖掘、分析应用等功能。从数据基础设施层、数据集成层、管理维护层、应用服务层4个层次构建开放大学数据服务架构[4]。利用大数据分析、数据仓库等技术,以一系列标准、制度和安全体系为保障,以数据服务架构为核心,以个人、二级单位和学校为主体,建立数据采集、流通共享和应用服务机制。
数据基础设施层是支撑学校数据服务体系正常运行的基本保障,包括服务器、网络环境、数据存储设备及安全设备等。数据集成层通过建立数据共享平台和数据交换中心,解决学校内各业务系统之间的数据交换和数据互通共享问题;管理维护层提供数据采集、数据质量管理、数据备份、数据安全防范等功能;應用服务层是基于数据层之上的管理和应用服务系统,通过个人数据空间、数据分析与展示平台等提供数据分析服务,使每个业务主体都能成为信息化过程中数据管理与服务的受益者,也使数据处理的每个环节都可以由最合适的主体完成。通过在信息技术部门和业务部门间形成互助互利的数据交流模式,提高职能部门提供业务数据的积极性。信息技术部门通过对数据的收集和整理,为学校和业务部门反馈数据的统计和分析结果,建立“个人—部门—学校”自下而上的数据管理机制,形成内需拉动的信息化发展良性循环机制,形成业务产生数据到数据反哺服务的良性循环。高校数据服务体系架构如图1所示。
3数据服务体系架构
3.1数据基础设施层
数据基础设施层由网络、服务器和存储设备等组合构建而成,主要承载数据的存储、运算、容错、调度和通信等任务。数据存储设置分级缓存机制,可实现数据的快速存储和持久化,平台中的数据根据访问时效要求、访问频率及系统内存使用情况进行分级存储。
3.2数据集成层
3.2.1数据资源分类
广播电视大学经过多年的发展,形成了多层次、多种形式办学,学历教育与非学历教育协调发展的办学格局。相应的信息技术支撑环境产生的数据来源多样,数据标准、格式、存储状态等差异较大。为了更好地规范学校的数据管理,为不同需求的用户提供差异化服务,根据数据服务领域的不同,开放大学数据资源可以进行如下分类:基础数据、主题数据、教学数据数字化学习资源数据和应用数据。基础数据包括学校人、财、物等方面组成的基本数据库,如教师库、学生库、固定资产库等;主题数据包括针对业务的数据集合,如教学数据、教务数据等;教学数据包括各类远程教育平台产生的学习行为或教学行为数据,如学生学习情况数据、教师授课情况数据等;数字化学习资源数据包括各类办学中教学资源库通过对各类教育的资源库进行整合、共享,形成综合、可定制服务的综合教学资源库;应用数据包括办公数据、微信等第三方接入数据的整合等。
3.2.2数据集成与共享
无论是面向个人的数据服务,还是院校级的决策支持展示,其中最关键的问题是数据集成。根据“数据集中、服务下延”的原则,既能保护投资、保障效用,又能适应数据变化和数据应用的需要。按照统一的数据标准和规则,利用ETL将分散在各个业务子系统中的数据进行重组、整合、共享与利用。
通过建立学校数据交换集成平台和共享数据中心解决应用系统的数据整合问题。数据交换集成平台独立于业务系统,不含任何业务逻辑。它将各个业务部门的基本数据进行集中整理,实现统一管理,为各个业务应用系统和各类服务系统提供数据支持,保证数据的权威和准确。共享数据中心的数据来源包含数字化校园建设中的各业务系统数据库,其原有设计通常与共享数据中心数据库设计不相符,所以必须利用数据集成工具和数据同步工具解决全局共享问题[5]。通过数据集成工具,把业务系统需共享的数据抽取到共享数据中心,并分类存储形成主题库,通过数据订阅和授权的方式将数据中心的数据资源接入到各类应用系统进行共享和利用。共享数据中心库是所有共享数据的集成地,所有应用系统的共享数据在这里集成。它向下从数据源集成数据并保持更新同步,成为各个应用系统之间的共享数据通道;向上作为统计分析服务的数据源,为其提供从各个应用系统集成的共享数据。共享数据库与数据源的各个应用系统数据库保持更新同步,共享数据库的数据同步分为自动同步和手动同步两种。数据采集更新时,采用学校信息标准,确保数据“谁产生、谁维护”,通过视图、变动跟踪表等形式保证业务系统数据变更的独立和安全。
数据交换集成平台支持Oracle、MySQL等各种异构数据源,通过集成的策略配置,满足不同场景的数据交换需求。数据交换集成平台对上层的应用服务层和下层的数据源都需要提供数据服务接口,数据服务接口可分为直接开放数据库、中间表、接口访问等形式。通常建议采用面向服务体系架构(SOA)封装数据,并采用webservice数据服务共享方式,以减少对数据库的直接访问,满足实时、按需的共享需求。
数据集成从两个维度进行,从结构上对业务类的结构化信息和资源办公类的非结构化数据进行整合,从应用上对业务部门自身产生的数据(私有信息)、部门间共享的数据(交换信息)、为大众提供信息服务的数据(公共信息)进行整合。在数据整合过程中,需加强数据服务接口、访问控制、数据处理、数据适配等功能。通过信息整合提高信息资源的利用率,提高系统间的信息共享、交换、服务和决策支持能力,为构建跨部门的数据交换和共享分析专用平台提供基础。
3.3管理维护层
大数据服务战略不仅包括数据仓库的建设,还包括数据管控体系的建设。为实现对学校数据资源的高效管理,以及高质量和可持续发展,设计相应的数据管理平台,完成数据质量管理、安全管理等功能。
高质量的数据是大数据发挥效能的前提和基础,专业分析工具只有在高质量的大数据环境中才能提取出准确、有用的信息,学校基于这些高质量的分析结果所作出的各项决策才具有权威性[6]。数据质量可以从数据生产过程中的数据采集、数据存储和数据利用各个阶段进行把控。在数据收集阶段,不同数据源产生的数据之间的冲突、不一致问题,可以采用数据监测和定位工具进行处理,生成完善的数据集成日志,同时要保证数据处理的及时性,避免收集到的数据是“过期的”。由于当前学校产生的非结构化数据逐渐增多,在数据存储阶段,存储架构应由传统的结构化数据存储处理方式向同时兼具结构化与非结构化数据存储处理方式的转变。在数据应用阶段,由于数据中心需要和各业务系统进行频繁的同步提取、更新数据,因此需注重数据处理速度,保证交互的数据真实有效。
数据管理和维护包括数据检查、数据入库、数据更新、数据迁移、数据字典维护等。
数据安全管理用于实现用户操作和访问等权限管理、日志管理、备份管理和系统运行监控等。数据的分析使用都会有一个授权过程,数据访问控制主要表现在数据消费者与数据交换集成平台的访问认证。服务消费者在通过数据交换集成平台访问数据时,数据交换集成平台要先对请求服务进行访问鉴权控制,只有合法的访问请求才会被处理[7]。
系统运行监控工具对系统进行健康检查,对各类操作、集成过程、运行情况和数据情况进行运维监控,监督数据质量,避免只抽取、利用而不监督的情况。采用图表、列表等表现形式,展现出系统动态、数据接口情况、数据异常和数据仓库情况等信息。
3.4应用服务层
数据整合和数据管理是为数据服务作保障,所以在数据获取、汇集和存储之后,以量化数据来描述用户属性、业务和服务,使用户属性数字化、业务过程数据化、服务质量可量化,通过信息价值挖掘与用户行为分析,对学校掌握的信息资源进行统一管理和利用,使数据信息产生最大化的价值,为各类用户提供数据挖掘、数据分析、统一检索、信息定制等综合信息服务。
基于此,应用服务层的核心是通过建立统一的数据平台,对外提供统一的数据服务,即面向“个人—部门—学校”三级服务主体建设数据中心和分析平台。在学校一级,更多是针对全校数据资源的展示和决策支持;在部门或学院一级是面向本部门(学院)开展数据统计分析服务;在个人一级,主要是信息的查询与填报。可建立教师和学生个人数据中心,个人中心抽取与“人”相关的各类信息,开展数据展示、数据分析等服务。以教师个人中心为例,数据集主要包括:基本信息、科研创新信息、教学参与信息、资产信息(来自资产管理系统的设备、办公家具等信息)、生活信息(公寓、体检、图书借阅等)[8]。
应用服务层采用科学规划,重构数据基础,以面向角色服务为导向有机结合所有教学、科研、人事、財务、生活等各种相关联的数据资源。通过数据交换集成平台,各类业务数据互联互通,采用统一的代码标志,明确数据“谁产生”与“谁维护”问题。
各级主体的数据采集和分析平台,提供不同层面的数据管理、业务分析和管理决策能力。因为角色不同,对数据的需求不同,分析的内容也不一样。因此,数据分析应用由各级主体灵活定义,通过这种方式建立学校、部门及师生个人的数据采集、流转和服务机制。
4应用实践
根据智慧校园的特征及大数据应用于智慧校园的价值,以需求为驱动,注重各领域之间的关联,开展面向管理、教学、科研、生活等各领域的数据服务应用,助力智慧校园建设[9-10]。
根据服务主体不同,构建了学校管理支持平台,包括招生、就业数据分析、师资数据分析、财务决策数据分析、资产数据分析和办学趋势数据分析等。办学趋势数据分析是对学校各类教育在招生、人才培养模式上的统筹分析,以对比各类办学项目的招生趋势、生源情况、学习资源利用情况等。
构建了教学管理支持平台,包括教研数据分析、学习行为数据分析、数字化学习资源分析等。其中通过教研数据分析构建教师画像,对教师的刻画主要包括教师任课情况、科研情况、实践活动、网上教学活动、学生成绩、职位晋升等信息,描述教师成长轨迹,通过大数据分析推动教学决策调整;学习行为数据分析是根据出勤、课堂表现、成绩、获奖等过程性评价数据,构建学生画像,分析学业成绩和学习行为各要素的相关性,提供个性化的学业诊断。
构建了后勤生活服务数据支持平台,包括一卡通数据分析、健康数据分析、智能提示系统等。其中一卡通消费数据涵盖了餐饮、洗浴、图书馆、健身、娱乐等各类学生消费行为中产生的数据。通过一卡通消费大数据分析,可以挖掘学生校园生活的生活习惯及与其他领域的内在关联性。如校园人流的可视化分析,包括图书馆人数和食堂人数等,通过实时数据的展示,可以让同学们在任何位置、任何时间了解到校园设施和校园资源的使用情况,在一定程度上起到分流、避免拥堵的作用,还可通过智能推荐算法,根据用户习惯,推荐就餐地点和网站站点;健康数据分析是对每年的教职工体检数据进行汇总分析,为个人提供健康生活指南,可使学校为不同人群制定不同的体检套餐服务。
5结语
英国数据科学家迈尔·舍恩伯格认为,大数据对于教育最重要的影响之一就是促进定制化学习与个性化学习,出色的教育应当关注学习过程的改进,从而帮助每一个学生更好地成长。而这一愿景的实现需要科学规划教育大数据服务体系,全校合力,不断加强基础数据建设,统一数据标准,并进行数据分域管理,围绕学校、二级单位、个人所关注的业务数据和信息资源,对数据管理、应用和服务的各个层面不断深化,逐步形成面向不同层面、独具特色的数据服务体系。当然,数据服务体系的建设是一个系统化工作,还需要在人才队伍建设、技术建设、制度建设、数据开放和数据隐私保护等方面不断努力。
参考文献:
[1]宓詠,赵泽宇.大数据创新智慧校园服务[J].中国教育信息化,2013(24):3-7.
[2]山东省人民政府办公厅.山东省人民政府关于促进大数据发展的意见[EB/OL].http://www.shandong.gov.cn/art/2016/10/27/art_285_11182.html.
[3]崔行臣,颜景佐.数字化校园中信息资源整合和共享平台建设研究[J].山东广播电视大学学报,2015(2):23-26.
[4]辛良,侯效礼,陈越,等.中国矿业大学构建主数据管理平台[J].中国教育网络,2016(10):61-63.
[5]许鑫,苏新宁,吴乃冈.高校共享数据中心平台的设计与实现[J].现代图书情报技术,2005(6):48-53.
[6]宗威,吴锋.大数据时代下数据质量的挑战[J].西安交通大学学报:社会科学版,2013,33(5):38-43.
[7]梁倩.华南理工大学面向智慧校园的数据集成平台设计[J].中国教育网络,2016(7):56-57.
[8]赵泽宇,陈翼,张凯,等.复旦大学:大数据促进服务模式转变[J].中国教育网络,2014(1):69-70.
[9]刘敏斯,陈少波.大数据时代高校智慧校园建设研究[J].软件导刊,2015(8):6-8.
[10]胡钦太,郑凯,林南晖.教育信息化的发展转型:从“数字校园”到“智慧校园”[J].中国电化教育,2014(1):35-39.
(责任编辑:黄健)