标题 | 基于云计算的高校就业大数据信息服务平台的应用初探 |
范文 | 毕盛+纳青青 近几年,高校毕业生数量一直持续高位,毕业生就业工作数据量庞大,缺乏信息共享,传统就业信息平台已难满足毕业生对就业工作的需求,就业大数据信息平台的建设已刻不容缓。 云计算技术具有高效、可靠、高可扩展性和易用性的特征,被很多领域广泛的使用。本文讨论的内容是如何将云计算技术应用到就业大数据信息服务平台中,从而高效率、高质量的做好就业服务工作。 Hadoop是由 Apache 开源组织提供的分布式系统基础框架,能够有效的解决海量数据分布存储和分布计算,是云计算技术应用层面很好的解决方案。 一、高校就业大数据信息系统现状 目前,各高校均建设了高校内部的毕业生就业大数据信息平台,一定程度上满足了毕业生就业服务的需要。但是这些系统存在以下几方面问题:第一,系统侧重毕业生和就业信息管理,或者只是学生管理信息系统的一部分,缺乏服务机制,无法实现学生、教师和用人单位的联动。第二,系统资源利用率低,系统运行效率低、安全可靠性和可扩展性差,给学生数据安全带来很大的隐患。第三,系统数据利用率低,多数集中在简单的查询,很难获得有益的知识,提供决策服务。第四,系统缺乏个性化定制,很难适应当前就业工作不断调整的需要。 随着高校、毕业生和企业对就业服务的要求提高,现有的就业信息平台已经不能适应就业工作多元化的增长和发展的需要,影响高校毕业生的就业效果,新型的就业大数据信息平台的建设已成为破解就业工作难题的必要条件之一。 二、构建基于云计算的高校就业大数据信息服务平台 云计算因其强大的计算和数据储存的能力、可靠、安全的共享数据存储中心、客户端的设备配置没有限制等特点已广泛应用各行各业,并日益发展成熟。通过云计算技术建设毕业生就业信息平台,整合和共享就业信息资源,为毕业生就业提供方便、快捷、高效的信息服务平台,破解现有就业信息平台存在的问题。 从研究现状来看,云计算具有以下一特点: 一是强大的计算和数据储存的能力。“云”能赋予用户完成各类应用前所未有的计算能力,为用户储存和管理数据提供几乎无限多的空间。服务器的日常维护也有云服务提供商来进行。 二是最可靠、最安全的共享数据存储中心。通过云存储,数据复制到多台物理机器,避免因硬件崩溃或误操作删除的造成的数据的丢失或损坏。 三是客户端的设备配置没有限制。用户在随时随地方便、快捷、安全的使用位于不同计算机、不同的操作系统的应用服务,从“云”中获取个人的需求。 2.1 构建高校就业云服务平台 根据提供服务资源的类型,云服务被分为三个类别:SaaS(软件即服务)、PaaS(平台即服务)、IaaS(基础设施即服务)。 高校就业大数据信息云服务平台采用 SaaS 模式,通过浏览器和移动终端将软件作为云服务提供给所需用户。用户无需购买软件和维护软件,用户根据业务需求购买相应的云服务,云服务提供商管理相关软件并实施软件的维护。这种方式大大降低用户在软件购买和维护上人力和物力的开支。高校就业信息云服务平台自底向上分别是“云数据层”、“数据服务层”、“业务服务层”、“云服务层”和“应用层”,每层之间采用松耦合,提供相互访问的接口,用户不必关注层内部逻辑。 (1) 数据存储层 高校信息服务平台的数据主要包含学生数据、用人单位数据和高校相关数据,数据是作为平台的基础。为了提供便捷、高效、可靠的数据访问,数据存储层采用云存储技术实现。 (2) 数据服务层 数据服务层建立专门进行云数据层访问的接口程序,用户通过 webservice 或者 API 进行加密数据的访问,数据的具体存储对用户是透明的,这也有效的提高数据安全性,并且为数据的扩展提供基础。 (3) 业务管理层 业务服务层包括高校信息服务平台所有业务,具体包括应聘招聘、就业指导、毕业生困难帮扶、创业等服务内容,这些业务服务于政府、用人单位、高校、学生和社会等不用的用户。由于就业工作随着时间的推移会受到就业形势、政策等很多因素影响,从而导致就业工作业务和用户发生不断变化,所以就业信息服务平台业务服务层要具备高扩展性。基于以上的要求,我们构建了业务服务控制台,业务服务被设计为可插拔式,每项业务可以被挂载在控制台,或者从控制台被卸载,也可以设定业务接口、执行业务升级操作等服务。 (4) 云服务层 云服务层将业务服务层的内容以应用接口的方式提供给应用层,提供的方式是为业务服务层建立 API 接口和webservice 接口。应用层可以通过编程的方式调用业务接口,实现业务访问。 设定中文信息处理和语音识别接口,用户可以通过输入中文关键字或者语音调用业务,在应用层和业务层之间建立更加友好的数据传送,也为移动终端用户提供更加便捷的操作方式。 (5) 应用层 应用层直接面向实际用户,实现就业信息云服务平台不同类型的用户图形界面,从而能够适应不同用户的不同需求。用户既可以通过个人电脑上的浏览器访问获得云服务、也可以使用智能移动终端的应用程序或者微信访问云服务。 2.2 建立基于 Hadoop 的云数据存储 高校就业大数据信息服务平台需要大量的数据进行支持,而且数据逐年增加。利用云存储技术主要解决快速、高效的处理海量数据,从而达到易扩展、低成本、易管理、高效和安全的设计原则。 Hadoop 软件框架的HDFS(分布式文件系统)提供了具备高扩展性、高容错性、高可靠性、高效等特点,并且可以部署在低廉的硬件上,从而降低成本。基于以上内容,高校就业服务平台的数据存储通过 HDFS 分布式存储技术实现云存储,Hadoop 的具体部署 2.3 建立基于 Hadoop 的数据服务 数据服务是就业大数据信息云服务平台重要的业务,用户需要了解学生年龄、学历等数据分布,需要了解就业数据分布,需要了解用人单位人才需求分布,需要了解就业数据内部和外部存在的各种联系。数据服务从海量数据的计算中获得,利用云计算技术能够高效、低成本的解决计算问题,Hadoop 为云计算提供了有效的解决方案,它提供了MapReduce 模型,这个模型解决了传统并行计算在易编程性上的瓶颈,程序员可以更容易的开发分布式并行计算程序。MapReduce 同 HDFS 一样采用一个主控节点和多个计算节点的架构。 将大规模数据集分成多个小数据集,然后这些数据集分給多个 map 节点进行并行处理产生中间结果,最后在 reduce阶段对这些结果汇总,得到最终结果。 三、总结 通过对云计算基础知识和 Hadoop 分布式云计算平台的学习与研究,设计了基于云计算技术的高校就业大数据信息云服务平台,本平台采用五层体系架构,基于 SaaS 构建业务,以云服务方式提供给用户,利用 Hadoop 分布式文件系统实现基础数据云存储,层与层之间利用 webservice 和 API 进行调用。最后,利用 Hadoop 的 MapReduce 云计算模型解决就业大数据信息服务平台的数据服务。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。