标题 | 浅谈大数据时代下的档案信息安全管理 |
范文 | 董凤娟 摘 要:在大数据技术背景下,每天都有海量各种形式的档案资料需要收集处理,再加上已有的档案数据,不少档案工作者已不知该如何应对。随着大数据和云计算时代的到来,档案信息安全管理与传统信息安全管理有着一定的传承逻辑,但也开始慢慢形成一些新的特点和变化。本文将主要探讨大数据时代下的档案信息安全管理等方面的问题。 关键词:大数据;档案;安全管理 大数据技术一经产生,就迅猛发展,像飓风一般影响到社会的各个领域,至今为止,上至国家战略、国防安全管理、科学发展研究,下至城市交通、个人出行等都离不开大数据技术支持。面对着大数据信息技术使用逐渐成熟和普遍,各行各业都被庞大而复杂的数据管理问题困惑,对各种数据和信息进行有效处理和保存已经被人们意识到其重要性,档案行业亦是如此。大数据技术横跨数据存储、虚拟化、云计算、数据库管理、并行计算和数据挖掘等多个技术领域。随着大数据和云计算时代的到来,档案信息安全管理与传统信息安全管理有着一定的传承逻辑,但也开始慢慢形成一些新的特点和变化。 1 档案数据采集安全 档案数据的来源主要有两部分,一部分是电子文档,另一部分是数字化的纸质档案。档案数据的采集安全既重视档案数据能否保持完整安全失,也要尽量避免同一档案数据的重复收集和录入。 1.1 档案数据收集范围扩展 “大数据”和“云计算”的关系,简单的打个比方,“大数据”是我们所拥有的数据,它是我们所能收集的所有个体信息的集合,“云计算”是我们如何运用这些数据的方式方法,我们可以通过不同的计算方式方法,得出样本中我们所需要信息,由于这个“大数据”信息的样本足够大,大到可以代表整个样本的特点,从而体现其参考价值和情报价值。所以进入“大数据”时代后,具体到档案工作,无论是从档案的凭证价值和情报价值,还是档案的现实价值和长远价值来考虑,档案数据收集的范围必须扩大,形式必须多样化。 相对于其他领域的数据而言,档案“大数据”更强调的是数据的全面性,即要收集业务范围内的所有数据档案。不管是全国性的还是省级档案部门,就算是一个基层档案部门,只要收集了其职责范围内的所有档案数据,即使总量不大,也可以称之为运用了“大数据”。因为在使用这些档案的时候,由于采集了所有的样本,在进行数据分析使用的时候,采取的是“样本=总体”的计算方法,简单来说,凡采用这种分析方式的数据分析法,就是“大数据”。当一个单位已经掌握全部或者几乎全部个体的数据,那么就可以运用各种逻辑计算方式,推断出不同的“相关”关系,而不是以样本代替总体推断出结论。所以每一个个体数据都是必要的,档案工作者应该细致地全面地进行统计。由此也可以看出,档案“大数据”中的“大”,不是绝对的“大”,而是相对意义上的“大”,意味着档案数据需要分析对象的总体。 每一个档案管理单位或机构都有其档案收集的范围和权限,在具体工作中,我们会发现,在“大数据”环境下,以单位或机构进行档案信息收集会产生相当程度的冗余。以行政部门为例,各单位每年会收到上级各部门下发的红头文件,各单位在进行档案汇总后,会有相当多相同的文件被重复收集,不管是在数据收集还是在进行数据分析的时候,都会造成一定的麻烦。这就需要档案管理单位提前将各种信息进行逻辑分析,明确规定这类的红头文件需要什么样的单位进行档案归档,而其他相关单位虽不需进行归档,却可以有查询和使用的权限。 1.2 纸质档案数字化过程和结果安全 纸质档案数字化的过程安全是指在档案数字化过程中没有发生危害档案实体和信息安全的事件或行为。因此,一系列的规章制度和规范的操作流程是必要的。首先,要确保提供纸质档案数字化服务的单位的能力和声誉。第二,纸质档案数字化的过程中,要按照严格的规章制度。比如,档案出入库要有严格的登记、交接手续;档案资料不能擅自带离工作现场等。第三不能破坏原有的纸质档案,也不能对原有案卷随意进行拆卷,要以不破坏档案原貌为基础,在数字化扫描的过程中,也不能使档案破损、有污渍,扫描出来的电子版和原件图像要一致。 纸质档案数字化结果安全是指数字化后的档案数据真实有效、能够使用。为了确保数字档案真实可用,必须对电子档案进行严格检查,这也是确保档案信息安全的重要环节。对纸质档案进行数字化后,要及时对电子信息进行检查,主要检查内容有:一是扫描质量,这一环节主要以抽查的形式为主,对于发现的不清晰、不对版的档案要及时返工;二是逻辑检查,将所有档案都录入系统后,通过试用以检测数据是否科学可用;三是程序检测,主要通过杀毒软件查杀数据中可能携带的木马、病毒、恶意程序等。可以定期将数字化档案进行拷贝,备份在多台存储设备上,以防现用数字档案出现安全问题。 2 档案信息管理系统安全 如果说每一份数字档案是人体的细胞,那么档案信息管理系统就像是人体的骨骼和神经系统。档案管理系统经过近20年的发展,已经从单机版,发展到网络版,再到最新的面向服务的数据平台(SOA架构),功能上也逐渐从单一向多元,由低级向智能化发展。大数据时代下的档案管理系统,能否在一定时间段内,将大量的信息进行提取、分析、处理,最后整理成管理者需要的有价值的信息,为管理者提供决策依据,成为档案信息管理至关重要的环节。所以,档案信息安全在很大程度上受档案信息管理系统的影响和制约。 2.1 数据支持平台安全 截止目前,参考国内各领域的大数据建设,档案大数据管理平台至少要满足四个方面的要求:一是云服务商能够提供全面可视化的服务;二是能够兼容海量电子档案;三是数据库有识别目标、锁定威胁来源和敌对事件的相关设置;四是数据平台能够不断扩展。一般来说,能够实现监控管理、风险控制、扩容扩存是档案云数据支持平台安全的基本要求和特点。 2.2 数据计算环境安全 对电子档案进行快速分析处理能力是档案管理系统的一个关键。在大数据背景下,由于电子数据类型复杂且数量庞大,传统的档案信息管理系统无法既迅速又经济地对系统进行拓展。大数据档案管理系统需要对每个电子档案进行详细的类别划分和标注,之后才是对数据进行分布式存储和计算,由于其数据库内容比较大,通常需要几台计算机联合計算,这就需要打破传统档案系统的信息“孤岛”,需要云计算环境予以技术支持。同时,档案大数据系统必须具有目录整理、档案采集、档案审核、系统维护等功能,满足不同使用人群的不同需要,利用现化代网络技术,实现多人多客户端操作。 3 档案数据利用安全 咨询服务是档案数据利用的主要内容,是指在海量档案数据的收集、存储和处理技术基础上产生的一种具有前瞻性的判断和预测能力。大数据颠覆了传统档案的数据查询和利用方式,有了海量电子档案资料,可以通过分析档案数据之间的逻辑关系,推算出有价值的信息。 例如山东诸城恐龙国家地质公园的恐龙化石档案系统,该档案系统收集了一万多块恐龙化石的电子信息,包括化石挖掘时间、地点、序号、挖掘人、化石属种、化石类别、所属年代等,将这些化石录入系统之后,通过系统自动分类,可以根据不同需要得出不同的展示结果。根据恐龙属种,就可以分别查到鸭嘴龙、角龙、暴龙等恐龙的化石标本,再辅之以挖掘地点,就大致可以推断出各种恐龙的埋藏地点。 档案的终极目的是“用”。利用者在档案数据比对分析时,通过轨迹研判、信息关联等方式,由已存的较全面的档案信息,才能得出正确、合理的结论。在这种状况下,可提供利用的数据资源的丰富,就代表了一定程度上的利用环境安全。专家往往是在原理理论和实践经验的基础上,根据一定的因果关系推导,得出具有指导意义的预测结果。而大数据背景下的档案,当样本足够大时,能够覆盖整个样本,就能够减弱对理论和经验的依赖。 4 结语 放眼未来,档案管理工作已不可避免地引入大数据技术,这必将对档案管理工作带来诸多变化,我们必须紧随科技步伐,不断修正更新管理技术,积极主动地为大数据档案管理工作提供更好的安全保障。 参考文献 [1]韩晗.“数据化”的社会与“大数据”的未来[J].中国图书评论,2014(5):27. [2]黄欣荣.大数据时代的思维变革[J].重庆理工大学学报(社会科学),2014(5):15. [3]兰祝刚,刘在国.大数据时代给档案管理带来的挑战与机遇[N].中国档案报,2013-11-29(002). |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。