档案大数据安全面临的挑战与对策研究
朱国康 陈奇志 徐琨
摘要:构建档案大数据是大数据时代档案工作转型、升级发展面临的必然趋势,既是机遇也是挑战。档案大数据在深入挖掘档案的价值、深层次满足用户需求、提供服务等方面有着巨大优势,同时档案安全问题将从传统的档案实体安全延伸到数字档案安全,乃至档案大数据安全。本文基于大数据安全背景,分析在档案大数据建设过程中,档案馆将面临的三个挑战,并从档案大数据的基础平台安全、安全生命周期的技术防护和档案大数据安全的软实力等角度进行深入思考和分析,提出合理的安全管理對策。
关键词:大数据电子档案数据安全
随着大数据技术的不断发展,建设档案大数据平台已经成为档案馆转型升级的重心。诚然,档案大数据平台将创新档案工作模式,极大提升档案工作水平,但是档案大数据平台在带来机遇的同时,也带来了一系列比实体档案安全更复杂、更难抵御的信息安全问题。中国信息通信研究院2018年发布的《大数据安全白皮书》中阐述了大数据平台将面临比过往更多的安全挑战。[1]这与大数据自身蕴含着巨大的价值是密不可分的,越有价值的数据就越有可能遭受网络攻击,数字档案本身就是经过筛选的具有存档价值的数据,因而档案大数据平台也更容易成为网络攻击的对象,保证档案大数据安全就成为档案机构新的使命。
档案大数据安全是建设档案大数据资源平台过程中遇到的新问题,档案大数据安全呈现出新的特点。[2]面对新的安全环境,档案人不但仍然需要切实保证档案数据收集安全、管理系统安全和利用体系安全,[3]而且需要从管理、控制和技术三个层面对档案业务进行重新架构,以增强档案大数据安全防范体系。[4]笔者认为,保障档案大数据安全不仅需要重新、全面性地认识安全风险点和潜在的威胁,而且需要提前谋划,做好安全应对策略。
一、档案大数据安全面临新的挑战
(一)对档案大数据平台防护能力的挑战
传统的档案系统是面向机构或企业的内部局域网,用户相对少,受到网络攻击的可能性很低,而大数据强调开放和共享,档案业务必然面临着外网或者跨网传输等需求,系统运行环境发生根本性变化。
1.档案大数据平台上的资源经过筛选,具有一定的归档价值。换言之,对攻击者就意味着更大的攻击价值,就会吸引有组织和目的性的网络攻击团队,但档案机构过往极少应对专业攻击,缺乏应对经验。
2.档案大数据平台上的网络攻击呈现新特点,尤其是攻击方式更为隐蔽。网络攻击者可以利用基础平台或者档案数据作为“掩体”进行持续攻击,悄无声息地完成档案的窃取。
3.在档案大数据平台建设过程中,软硬件设备都更加复杂,系统之间有更多业务交互、数据传输等。软硬件设备的多样化不但增加了整体的安全漏洞,而且更多对底层设备的安全依赖性也会带来新的隐患。
(二)对档案电子数据安全性的挑战
电子档案数据的安全性问题不仅涉及传统视角的档案原始记录性,而且延伸到数据安全的真实性、完整性、可靠性和可用性。[5]档案大数据所具有的四个基本特征,即体量大、类别多、速度快和高价值等特征无疑将增加档案机构保障档案数据安全的难度,也让档案工作的基本要求——确保档案真实受到前所未有的挑战。
1.档案大数据真实性、完整性、可靠性和可用性更难保证。档案的数据体量越大,其数据的真实性的辨认难度将越大。传统上确保档案数据真实性一般通过人工审核,但是人工审核难以适应大数据平台的数据量,而且更难发现档案数据中隐藏的风险、虚假数据,以及是否完整可用等问题。
2.档案大数据访问控制难度升级。档案大数据平台建设过程中不仅数据量会增加,而且角色和用户等辅助数据也会增加,那么档案数据资源的访问控制问题必然是需要解决的新问题。
3.档案大数据的风险追溯异常困难。档案大数据的数据访问交互不仅速度快,而且体量大,甚至存在双向传输、跨网传输,一旦出现数据安全问题,这些都给追溯、实时分析潜在的攻击源增加了困难系数。
(三)对档案安全配套机制的挑战
做好档案安全工作,关键还在于配套机制的健全和高效。大数据环境对档案安全配套机制的挑战主要集中在档案人员、配套制度和监管措施方面。
1.信息安全归根到底是人与人的攻防对抗,档案数据安全最终依赖于档案人员的掌控能力,但是信息技术无疑是档案人员的薄弱项,这也许是档案机构在建设档案大数据过程中面临的最大的考验。
2.档案大数据强调共建共享的服务机制和高可靠性的安全制度,但是一般而言人性化的服务机制需要开放性,而安全机制往往强调收缩限制,因此同时做好档案安全和服务工作并不简单。
3.传统档案人员的行为是缺少内部监督的,往往依赖制度和档案人员自我的安全意识,而在大数据环境下,任何不符合规范的操作带来的危害更大,因此必须要制定监督体系,但是过于严苛的监管会降低积极性,那么制定符合档案大数据业务发展的内部监管措施是必要的。
二、档案大数据安全的防范对策
(一)增强基础平台的防护能力
基础设备是大数据平台安全的物质基础,可以说没有安全的基础设备,就不可能建设出安全的档案大数据平台。基础平台包含软件和硬件设备,软件是从上往下的层级依赖,软硬件之间存在着兼容性问题,也存在周期性迭代更新的特征。具体安全结构视图如图1所示:
增强档案大数据基础平台的防护能力需要顶层设计,确保人、财、物的持续投入。具体来讲,要做好以下几个方面的工作:
1.做好大数据硬件设备建设。需要做好机房安全建设,确保消防安全;另外,对物理设备进行安全巡查,同时做好机房监控、UPS设备监管和机房进出登记等。
2.重视软件系统安全。提高软件的防攻击应对能力,不断减少系统安全漏洞,购置安全防护软件和防火墙等;落实档案数据备份制度,提高灾难恢复能力;确保档案数据访问权限的细粒度,遵守外网回流的数据审核制度等,同时对操作系统等底层软件要实时升级、修复漏洞,尽可能地加强软件应对网络攻击的能力。
3.落实软件系统等级保护测评。提高档案系统的安全等级保护定级,并利用第三方机构做好安全测评工作,对档案软硬件设备定期进行“体检”,及时发现并解决问题。此外,档案机构要善于利用专业机构的技术力量以提高安全问题应对实力。
4.做好软硬件安全的实时监控和日志分析。档案安全管理者要对设备的安全运行做到可控,及时更换损坏的磁盘,快速修复报告的系统漏洞,快速清理发现的病毒等,同时及时分析服务器和网络安全等设备的安全日志,发现并解决存在的安全问题。
(二)提高档案大数据安全生命周期的技术防护
确保档案数据在其生命周期内安全是档案大数据安全防护策略的核心。在大数据背景下,电子档案的数据安全机制不局限于密级档案数据,而需要对全部档案数据做到安全可控。确保档案大数据在其生命周期内的安全,无疑是一个极大的挑战,甚至涉及法律、社会学、信息技术等。笔者主要从信息技术的角度来探讨构建档案大数据安全机制。数据生命周期内的安全涉及如数据归档入库、长久保管和服务利用等环节,具体来说,要做好以下工作:
1.逐步推行档案数据加密。数据加密是确保档案数据真实性、完整性、可靠性和可用性的最有效方式,但是对大量档案数据进行在线加密并不像传统的数据加密一样,过程十分复杂;其次要同时采用数据平台用户身份认证技术。在数据加密的机制中,同态加密、可搜索加密被认为是较好的能够应用到大数据环境中的加密方式。[6]同時,笔者认为在这些技术完全成熟之前,优先对密级档案进行数据加密,确保密级档案在访问和存储过程中真实有效。另外,引入增强身份认证机制,采用多因子验证是在传统的标准安全认证的基础上增加多个安全凭证,或者采用传统上ID+密码的认证与动态因子的认证体系,从而更加确保访问的用户身份真实,防止攻击者渗入到档案大数据平台中窃取数据。
2.升级数据的访问控制技术。在大量的网络攻击案例中,攻击者多是抓住了档案数据的访问控制漏洞来完成攻击源渗透的。当前档案机构数据访问控制的主要方式是强制性和自主性访问控制,以及基于角色的档案数据访问控制。大数据环境中需要更高级的访问控制技术,才能够实现档案业务中基于访问属性加密访问控制,以及基于角色和访问属性加密相结合的访问控制。因此,通过对档案数据的访问控制技术,有效地规避了档案系统被窃取和泄漏档案数据的风险。
3.增强风险检测与分析机制。对于档案大数据的潜在风险,要早发现,并主动分析风险源。增强风险检测技术首要的就是扩大数据扫描和风险检测范围,将传统上对服务器环境的检测要求延伸到档案业务的数据传输中介区域,比如U盘、邮件和档案员的电脑等;其次要推行分析更长时间跨度内的业务数据和系统日志,制定动态的风险分析策略;最后对数据交互过程中的跨网传输数据要进行实时的风险检测和动态分析,同时需要强调推行档案技术人员与风险智能分析软件协同工作的模式。
(三)完善档案大数据安全的软实力
确保档案大数据安全,同样离不开档案机构的制度、档案人员的安全素养和行为规范等配套机制。笔者把这些相对于设备和平台等硬实力而言,同样不可或缺的配套机制称为软实力。毫无疑问,安全防护需要硬实力的支撑,但是软实力才决定安防等级的高度,更需要不断完善。
1.提高档案人员的信息安全素养。在档案大数据建设过程中,要不断培养和提高档案人员的信息安全素养。信息安全素养主要包括信息安全知识、安全意识、安全伦理道德和安全技能等方面的内容,其中安全技能最为关键。档案机构通过持续加强信息安全学习、开展具有针对性的安全技术交流和培训等,从而有效提高档案人员的安全素养。另外,还需强调选聘信息安全专业的人才充实档案队伍,以应对潜在的网络攻击。
2.平衡档案安全制度和服务机制。档案大数据的安全制度是要在现有规章制度的基础上,与时俱进,补充档案数据安全评估制度、应急防御制度和数据灾难恢复制度等。同时,兼顾改进档案服务利用机制,根据安全风险因子对服务的对象用户进行分类评估,根据不同场景的用户提供差异化的服务。另外,需要平衡好服务机制和安全制度的利益回报,尽量做到安全第一,有序服务的基本要求。
3.构建档案安全行为监督审计。构建档案安全行为监督审计要以用户与档案数据交互日志为参照依据,不但要做好日志记录,还需要做好分析审计工作。在大数据背景下可以构建以Hadoop等常用生态组件为基础的档案人员业务行为分析的日志审计功能。与此同时,档案机构要落实行政制度,安排监督审计人员,做好风险防范工作。
档案安全从来都是档案工作的基础,原国家档案局局长杨冬权曾强调“必须始终坚持把档案安全视作档案工作的生命线,把档案安全工作放在档案工作的首位”[7]。档案大数据安全是档案大数据平台建设过程中需要高度重视和正确应对的问题,必须更多地从系统平台、数据资源和档案人员安全素养等角度进行思考,做好档案大数据风险防范工作,确保档案大数据平台安全、有序建设。
*本文为西南财经大学教师调研项目“基于教学档案对教师教学评价的调查与研究”(项目编号:2018JSG? ZB13)成果之一。
注释及参考文献:
[1]中国大数据产业观察.《大数据安全白皮书(2018年)》发布(附全文)[EB/OL].[2018-07-13].http://www. cbdio.com/BigData/2018-07/13/content_5763797.htm.
[2]秦巧云,周枫,杨智勇.大数据环境下数字档案馆信息安全研究[J].北京档案,2017(6):18-21.
[3]崔海莉.“大数据”时代档案信息安全管理新思考[J].档案学研究,2015(1):93-96.
[4]王毅,赵淑梅.国有企业技术创新与档案大数据管理安全战略研究[J].档案学通讯,2014(2):63-67.
[5]归吉官,吴建华.从“一切文献都具有原始记录性说”谈起——直击档案学基础理论[J].档案学研究,2015(4):24-28.
[6]陈兴蜀,杨露,罗永刚.大数据安全保护技术[J].工程科学与技术,2017(5):1-12.
[7]杨冬权.在全国档案安全体系建设工作会议上的讲话[J].档案学研究,2010(3):4-12.
作者单位:西南财经大学档案馆