高等院校大容量数字资源存储平台 建设研究
田燎
摘要:本文结合作者所在院校私有云数据中心建设的实际情况和经验,探索了高等院校在大容量资源存储中心的规划、设计及建设过程中的预算、架构、实施、安全等核心问题,并提供了一套实际可落地的建设高校大容量资源存储平台的思路和方法。
关键词:大容量存储;虚拟化存储;高速存储;存储安全;云盘
中图分类号:G647? 文献标识码:A? 论文编号:1674-2117(2020)05/06-0169-03
2018年教育部启动了教育信息化2.0行动计划,要求各大院校培育创新驱动发展新引擎,结合国家“互联网+”、新一代人工智能、大数据等重大战略任务,大力推动信息化建设。信息化建设的核心分为应用软件、计算资源和存储资源三大块,同时在高等院校信息化建设过程中,专业和学科建设方面的数字资源积累会越来越多,数字资源存储平台的规划、建设、管理问题将日益突出。本文通过分析高等院校在数字资源存储过程中遇到的容量、速度、个性化需求、安全等问题,提出集中资源、统筹规划,满足多样性的数字资源存储需求解决方案。以下是笔者所在院校在高校大容量资源存储平台建设中的一些经验和思考,供大家借鉴和交流。
● 数字资源存储上存在的问题
1.存储设备老旧,容量小
由于计算机技术的高速发展,硬件存储设备的产品更新迭代也越来越快。早期建立的数字存储设备受到成本、技术等方面限制,往往在性能、容量上已经无法满足现在的数字化教学资源库的建设需求,硬盘容量的单位从原来的GB过渡到TB。
2.存储的读写速度慢
随着SSD固態存储技术的快速普及,传统机械硬盘的读写速度瓶颈得到解决,但SSD存在购置成本过高的问题。
3.存储硬件设备分散
在实际应用过程中,大多数院校没有专门统筹规划过数字资源存储平台,只是在采购服务器的时候附带基本的存储硬盘阵列,存储资源随着服务器的安装位置不同分散在不同的位置。有的服务器由于存储容量不足需要扩容,有的服务器由于数据存储容量小导致大量存储资源闲置。
4.各业务部门数据管理需求差异大
学校各个部门之间由于业务属性和数据内容不同,对数据的私密性有不同的要求,有些注重安全稳定,有些要求开放共享,有些需要授权访问。单个存储系统无法满足个性化的数字资源管理需求。
5.数据安全和容灾能力差
由于分散化部署,没有专业的恒温恒湿机房环境和UPS不间断供电设备,所以存储设备容易出现机械故障,造成数据丢失。
● 解决方案
笔者所在院校针对上述高校数字资源存储和使用存在的问题,提出了高等院校大容量资源存储平台建设方案,措施如下。
1.调研了解业务需求,统筹规划,集中部署(如下表)
通过对学院各部门的需求调研分析,最终决定集中建设、统筹部署便于管理,同时还可以满足各个业务单元个性化使用需求。部署地点设在技术中心核心服务器机房,服务器机房标准必须满足以下三点要求:
①温湿度可控。按照制冷与空调工程协会的“数据处理环境热准则”建议温度范围为20~25℃(68~75℃),湿度范围为40%~55%。
②多路不间断电源。为了避免出现单点故障,全部电力系统线路(包括备用电源)都是全冗余的。数据机房的供电电源要求由一个或多个不间断电源(UPS)和/或柴油发电机组成冗余备用电源。对于关键服务器来说,要同时连接到两个电源,实现N+1冗余系统的可靠性。在发生电力故障时瞬间确保静态开关能够换到另一个备用冗余电源线路。[1]
③专业防火系统。机房的防火系统包括无源和有源两种设计,同时要制订完善的防火行动执行计划和紧急预案。确保在燃烧产生明火前,烟雾探测器能够提前发现火警,启动相应的防护预案。
2.硬件设备选型和架构设计
存储资源平台建设必须兼顾资金预算投入、容量、读写速度等诸多因素,目前市面上诸多专业存储解决方案中,技术含量和后期可扩展性、兼容性最好的是易安信(EMC),DELL、EMC、VMware三家公司同属于一个集团,在计算资源、存储资源和虚拟化方面能够进行技术深度融合,方便部署管理和后期扩展。[2]
因此,计算资源硬件选用了DELL R730加载业务系统,存储系统采用了EMC的PowerVault MD1200(容量50T)和EMC Storage SC4020(容量48T),为满足未来的高速数据处理需求,设备之间使用Brocade 300进行光纤级联通信,为增加数据业务处理缓存速度,使用EMC Compellent SC200加载三块400G的SSD硬盘作为数据缓存。[3]
同时,采用MD1200和SC4020行程的高低搭配方案,服务器1挂载驱动MD1200服务对速度要求不高的存储的业务。MD1200通过Brodcade300交换机与所有服务器直连,利用SC200的SSD硬盘作为数据缓存,专门用于高效快速数据业务处理,硬件架构如下页图1所示。
3.软件平台架构
根据业务需求,为在硬件架构平台的基础上,最大化发挥硬件资源效率,采用了虚拟化集群的方案架构软件平台对存储和计算资源进行管理。虚拟化集群采用Vmware的Esxi6.7+Vcenter最佳优化方案,Esxi整合服务器主机的硬件资源,Vcenter对各个ESXi所管理的硬件计算资源DRS(Distributed Resource Scheduler)动态负载均衡管理,各应用服务器可以根据需求分配计算资源和存储资源,部署简单快速,资源存储管理软件架构如图2所示。同时,Vcenter可以提供精简置备(thin模式)的存储模式,根据业务的实际存储容量需求动态分配使用存储空间,最大化地提高存储空间使用效率。
4.存储资源管理分配的实施部署
根据调研所了解的不同部门存储业务需求,选用开源的NAS是最佳方案。FreeNAS是目前最稳定和广泛的免费开源的NAS服务器管理系统,能够快速搭建网络存储服务器环境。该软件基于FreeBSD、Samba及PHP,支持FTP、CIFS(samba)、NFS protocols、Software RAID(0,1,5)及WEB界面的設定工具。用户可通过Macs、Windows、FTP、SSH及网络文件系统(NFS)来访问存储服务器。[4]
另外,利用Free NAS自带的Jail插件功能,可快速部署基于Next cloud企业私有云盘,实现隐私保护、文件同步备份、部门共享等。
● 结语
目前,虽然有诸多的存储资源管理解决方案,但集中存储依然是唯一能够兼顾环境安全和管理使用安全的最佳方案。另外,高校在建设存储资源管理的时候需要统筹规划,要以数据安全第一的原则,最大化地优化硬件和软件架构配置,提高存储空间使用效率,提供优质的资源存储管理服务,为学科专业建设过程中的各种数字资源保驾护航。
参考文献:
[1]赵志军.通信机房供电现状主要问题及对策[J].科技风,2012(02):1671-7341.
[2]Yan Han.IaaS cloud computing services for libraries:cloud storage and virtual machines[J].OCLC Systems & Services2013,29(02):1065-1075.
[3]Chih Kai Kang,Yu Jhang Cai,Chin Hsien Wu,等.A Hybrid Storage Access Framework for High-Performance Virtual Machines[J].ACM Transactions on Embedded Computing Systems(TECS),2014,13(05):1539-9087.
[4]吴玉芹,张枝令.Linux下iSCSI协议安全性的分析[J].海南大学学报:自然科学版,2010,28(04):332-337.