网站首页  词典首页

请输入您要查询的论文:

 

标题 大数据环境下未来档案馆建设的新构想
范文

    张金安

    [摘? ? 要] 本文从当代环境下大数据这一概念出发,对未来档案馆的特征与构建进行了探究,与此同时对未来档案馆的智能化、多功能化进行展望。

    [关键词] 大数据;未来档案馆;信息档案;数据档案

    doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 21. 066

    [中图分类号] G270.7? ? [文献标识码]? A? ? ? [文章编号]? 1673 - 0194(2018)21- 0156- 03

    0? ? ? 引? ? 言

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越來越密切,生活也越来越方便,大数据就是这个高科技时代的产物。大数据技术代表着数据科学时代的来临,是促进信息技术的进一步发展和广泛使用的标志性技术,人们已经意识到大数据技术将带来无限的生机与活力,它隐含巨大的深度价值,大数据技术对科技发展、未来经济发展甚至上层建筑将带来深远的影响。档案馆作为国家机器的重要组成部分, 发挥着不可替代的作用,各级档案信息化建设水平直接反映了国家机器的运转水平,重视和加强档案信息化建设,档案工作者和科技工作者都责无旁贷。

    1? ? ? 大数据概念的解析与未来档案馆的特征

    1.1? ?什么是大数据

    早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。不过,大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词。所谓“大数据”是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性;需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。百度百科中解释“大数据”一词为Big Data(大数据),或称为巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取管理处理,并整理成为帮助企业经营决策更积极目的的资讯。亚马逊网络服务(AWS)的大数据科学家John Rauser提到一个简单定义:大数据就是任何超过一台计算机处理能力的庞大数据量。维基百科中的大数据是指无法在一定时间内用常规软件工具对其内容进行抓取和处理的数据集合。可见,大数据是真实性极强,数据量巨大,并且建立在所有主数据的基础上,采用数据挖掘技术,对数据集之间的关系进行测试的数据类型。

    1.2? ?未来档案馆的特征

    IT 界普遍认为,大数据具备Velocity、Volume、Variety、Value(4V)特征,应用于未来档案信息化建设,未来档案馆应具备以下五个特征。

    1.2.1? ?高速度

    Velocity (高速度)是指数据的挖掘技术方面、数据处理方面所产生的高速度,传统数据与大数据最本质的区别就是数据处理速度差异。“1秒定律”是最著名的在数据处理方面的定律,就是要在一秒内得出数据处理的结果,如果超出时间,数据就没有任何价值可言。对于未来档案管,面对着大量文件的信息和数据,快速检索查询处理,提升档案发挥作用的是必不可少的档案利用率的重要特性。

    1.2.2? ?容量大、资源化

    随着互联网云存储、移动云计算等技术被广泛使用,将给未来档案和档案数据、档案信息带来一个巨大的数据集。大数据技术的出现,有效解决Volume (大容量的数据),并对未来档案馆提供了无限的数据容量空间,使档案资源文件化变成现实。

    1.2.3? ?数据类型格式来源多样性(Variety)

    大数据不仅是最有效来处理大量的数据的工具,更应对不同的数据来源、数据格式的多样性提供了潜在的可能。数据类型是复杂多样的,包括两个关系和非关系数据,非关系数据指的是社交网络、电子邮件、网络搜索引擎、日志、文件等非结构化数据格式和半结构化数据来源的多样性,而其他的视频图像、音频文本等多种数据格式从一个组织的内部和外部操作相链接。未来的档案存储文件,与现有的档案文件相比,也将扩展到源文件类型格式的多样性,这是未来档案文件的基本特征之一 。

    1.2.4? ?档案历史记忆真实可靠连续智能

    就大数据技术本身而言,它包括诸多先进技术和手段,如大规模并行处理(MPP)数据库分布式文件系统数据挖掘电网分布式数据库可扩展的存储系统云计算平台互联网等,构成一个超大的数据生态系统,在这个系统中,档案工作者在获取和存储更多真实连续可靠的档案信息的同时,通过建立相应的专家决策支持系统,可以实现为人类社会发展提供准确预测和正确决策,使未来档案馆具有智能化特征。

    1.2.5? ?具备数据挖掘特征

    从未来发展趋势来看,档案来源渠道必将呈现多样性,在档案产生过程中,必将面临庞大规模的信息。将大数据的数据挖掘技术运用于未来档案信息化平台,使未来档案馆同样具备了数据挖掘特征,为未来档案存储带来无限的想象空间。

    2? ? ?大数据环境下未来档案馆的模式

    2.1? ?未来档案馆应互联互通资源共享

    档案馆发挥作用的重要条件是现有的档案互联互通和资源共享。针对技术水平而言,现有的技术实现完全可以满足需求。互联网平台的建设使档案馆(室)的相互关联成为现实状态。国家批准、建设和设置各种档案馆(室), 利用这个平台,形成了一个大文件传输通过互联网, 这个平台的形成,深化了档案信息化建设,为实现资源共享提供了有利条件,也是未来档案信息化建设的重要依据和前提。

    2.2? ?未来档案馆应做到资源分级有效管理

    对未来档案馆而言,在各级档案馆内部,应做到资源分级有效管理,这是大数据技术运用的必备条件,所以,对现有档案馆(室),应做到统一布置统一要求,对现有档案要按着规范,合理分类分级管理,并按着要求形成规范的电子文档,以备传输查询和利用。

    2.3? ?未来档案馆应设置权限使使用者合理合法使用档案资源

    对于构建未来档案馆而言,档案信息平台上的所有档案馆(室),均处在同一层面上,所有档案资源被视为同一个数据集,只是分布在不同的存储器(即档案馆)。

    对不同档案馆,档案级别的数量也有所不同。

    在档案信息平台使用上,不同级别的档案馆(室)的访问权限是不同的、权限低的,只能访问同级档案馆的档案库和高级别档案馆中部分同级别的档案分库;权限高的访问权限低的档案馆也应遵循访问权限,进行合理合法访问,并非全部。

    3? ? ? 未来档案馆的智能化功能

    3.1? ?未来档案馆具备为用户提供预决策的智能服务功能

    人工智能的运用和专家决策支持系统的建立,使拥有庞大档案资源的未来档案馆,根据国家和社会的需要,依据档案资源,实现分析预测和决策,为客户提供帮助和支持。首先,进行预测、决策和目标设定;其次,采集所需档案的信息;接着归档存储;最后,对数据进行查询输出或者咨询专家系统再输出。

    3.2? ?未来档案馆具备档案自动生成的功能

    大数据技术的应用,使我们得以解放思想、畅想未来,从档案资源获取渠道上来看,未来档案馆的高智能,必将打破以往被动获取等传统固定的档案来源渠道,扩展到一部分档案是通过社会信息渠道自动筛选生成的,这部分档案必将成为未来档案馆的重要组成部分,并使档案真正实现资源化,为档案馆预决策智能化服务提供支持。

    对于档案通过社会信息渠道自动筛选生成的问题,我们探究式地引入信息档案和数据档案两个概念

    3.2.1? ?信息档案和数据档案概念的界定

    信息档案,笔者认为它是指在那些经过国家认定的信息范畴中,通过互联网等现代技术手段和渠道,进行筛选提取并加以存储的对国家和社会具有保存价值的重要信息。

    数据档案,是指对所存信息档案的各时期各重要节点通过现代技术手段跟踪分析并加以存储的对国家和社会具有保存价值的重要数据结果,数据档案应具有为国家和社会提供可靠可信的预测和决策服务功能。

    3.2.2? ?信息档案库(馆)和数据档案库(馆)的建立

    就档案存储而言,信息技术的革命,必将使以往的不可能即将变为现实,传统的档案存储模式也必将发生跨越式变化,由此我们在探究式地引入信息档案和数据档案概念的前提下,提出信息档案库和数据档案库的概念,未来的档案库(馆),在坚持保留传统档案存储模式的同时,应存在信息档案库(馆)和数字档案库(馆)两类现代化库(馆)。

    所谓信息档案库(馆),应是存储那些经过国家认定的信息范畴中,通过互联网等现代技术手段和渠道,进行筛选提取并加以有序存储的一切重要信息,其功能是准确有序保存历史记忆,有效提供重要历史信息,为社会发展服务。

    数据档案库(馆),应是存储那些对信息档案库所存的信息档案,通过现代先进技术,进行各时期各重要节点跟踪分析预判和决策,并加以存储的数据结果,在功能上应具有有序保存历史数据,为国家和社会提供真实可靠可信的预测和决策服务功能。

    信息档案库和数据档案库的建立,一方面,使档案存储突破了以往单一的被动存储模式,向主动收集重要信息和数据并作为档案长期保存的主动存储模式迈进,这种被动与主动并存的存储方式转变,使档案存储得以有序地无限放大;另一方面,从档案历史记忆特质上看,未来资源化的信息档案以资源化的数据档案为据,这种证据,与以往相对比,将使档案历史记忆变得更加真实可靠,特别是大数据技术使档案实现主动为人类社会发展提供可靠预测和分析决策服务,使未来档案工作前景无限。

    4? ? ? 结? ? 语

    大数据在档案信息化建设中的具体应用,使未来档案馆实现质的飞跃成为可能,它不仅使档案存储资源化,同时使档案从被动存储向主动存储迈进,达到了互联互通、资源共享,加快档案馆智能化建设的步伐等这一切必将对档案历史文化传承、国家政务公开、深化社会服务乃至智慧城市建设,发挥其重要作用。现在中国正处于大发展、大变革的时期,数据的产生、流通、分析及应用越来越广泛,在现如今大数据的环境下,我们应当积极促进档案馆的数据化、高效化,为发展提供更充足的动力。

    主要参考文献

    [1]吴健鹏.大数据环境下档案馆建设发展研究[J]. 兰台世界, 2017(20).

    [2]刘俊兰. 大数据环境下高校数字档案馆建设研究[J]. 兰台世界, 2017(19).

    [3]李伟. 大數据时代我国数字档案馆的建设与发展[J]. 赤子, 2017(7).

    [4]桂定君. 基于大数据的图书馆信息服务体系研究[J]. 河南图书馆学刊, 2014(1):111-113.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/11 0:41:19