大数据环境下档案信息资源整合的SWOTT分析
赵彦昌+段雪茹
摘要:本文运用SWOT分析法,分析了档案部门在大数据时代开展档案信息资源整合自身的优势、劣势,以及面临的外部机遇和挑战,以便运用大数据时代的数据挖掘技术来推进档案信息资源整合的进程。
关键词:大数据档案信息资源SWOT分析
Abstract: This article will use the SWOT analysis method to analysis the advantages ,disadvantages op? portunities and challenges of archives information re? sources integration in the time of big data, which ex? pect to use the data mining technology to promote the progress of archives information resources inte? gration.
Keywords:Big data; Archives information resourc? es; SWOT analysis method
一、引言
大数据时代的到来给档案事业带来了深远的影响。大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。[1]但是事物都有两面性,一方面,大数据能够给人们带来便捷,比如帮助人们获取海量的信息资源;另一方面,也为人们的检索带来难题,比如如何快捷、高效地在海量信息资源中挖掘出满足自己需求的信息。从这个角度而言,档案部门应立足于档案信息资源整合的现状,结合大数据的时代背景,充分应用大数据时代的信息挖掘技术,采取有效的措施应对大数据时代带来的挑战,最终实现档案信息资源的整合。基于此,我们采用SWOT分析法对大数据环境下档案部门开展档案信息资源整合自身的优势、劣势、面临的外部机遇和挑战进行分析,以便档案部门在进行档案信息资源整合时认清形势,扬长避短,抓住机遇,制定符合大数据时代的档案信息资源整合措施。具体如图1所示。
二、优势分析
首先,我们从技术优势、保管条件优势、档案馆数字化现代管理系统三个方面来分析大数据时代现有档案信息资源整合的优势。
(一)档案馆的技术优势
1.目前现有的信息交换技术在档案信息资源整合中的应用。部分档案信息资源的内容是不公开的,涉密性较高。因此,在整合档案信息资源时,既要满足其共享性的要求,又要保障档案信息资源的安全性。第一,传统以纸质档案为主的档案信息资源可以通过用户到档案馆借阅浏览实现信息交换。而数字化的档案资源则可以通过档案网站、档案数据库等“一站式跨库检索”实现共享。第二,为了保障信息交换的安全,引入“用户身份认证技术”。不同的用户具有不同的访问权限,通过这种方式在一定程度上约束用户行为,保障档案信息资源的安全性。
2.大数据时代档案信息资源的利用技术优势。传统档案载体信息资源的利用主要是通过档案馆阅览室借阅、档案复制本、馆内现场人员咨询服务等方式实现的。在大数据时代,还出现了电子档案阅览室、档案云平台网络在线咨询等自主利用方式。例如,辽宁省档案馆网站就有新闻发布室、文化大观园、走进展厅、档案云平台、业务系统专区等模块。在“档案云平台”模块,用户可以通过键入档号、题名等信息,自主查阅政府信息公开文件、档案信息资源、综合档案馆馆藏等。
(二)档案馆的保管条件优势
2014年8月,中共中央办公厅、国务院办公厅联合印发的《关于加强和改进新形势下档案工作的意见》中明确要求:“档案机构要建立健全人防、物防、技防三位一体的档案安全防范体系,确保档案安全。”在此意见的推动下,部分省市档案馆(室)已经基本建成智慧馆库,即以物联网、云计算、大数据等技术为支撑,对档案馆库房进行智能一体化设计,从而实现对档案的集中统一保管,达到档案安全保管工作的网络化、智能化、人性化、科学化。[2]
(三)档案馆数字化现代管理系统的发展
在大数据时代,档案馆建立了数字化现代管理系统。数字化现代管理系统一般分为日常业务管理系统、档案数字化采集系统和数字化档案查阅系统三大板块。除此以外,该系统还包括系统维护、Web浏览查询等功能。各个模块相互协调配合,不仅能够满足档案馆工作人员日常办公的需求,而且能够缩短用户的检索时间,提升检索效率和服务效能,最终促使档案信息资源数字化的顺利开展。以苏州数字化现代档案管理系统的建设为例,苏州市数字档案馆项目已经完成,能够通过网络处理档案馆所有业务,而各机关事业单位信息化建设也已见成效。[3]
三、劣势分析
(一)理念与实践进度不匹配
为了推进档案信息资源的整合,档案工作者提出了“大档案”的理念。“大档案”理念由来已久,但是档案部门只是把“大档案”理念落实到档案馆的建设中,并没有较好地应用在档案信息资源的建设中。因此,我们不仅要提出与时代发展相匹配的管理理念,而且要使理念落实到档案信息资源整合的实践中去。在大数据时代,档案信息资源整合需要各个环节的配合和各个部门协调一致的工作才能完成,各部门、各环节的协调都需要强大的信息系统来组织、协调和实现信息资源共享,使其得到最优化的利用。简言之,档案部门要充分发挥意识的能动作用,让大数据时代的“大档案”理念更好地指导档案信息资源整合的实践工作。
(二)缺乏统一的技术整合规范标准
当前在档案信息资源整合中,档案部门缺乏一套统一的技术整合标准体系,制约了档案信息资源整合更好的发展,因此应该高度重视。“标准化是对档案信息资源各方面建设具有总揽性的前提与基础,也是最亟待解决的实际问题,否则档案信息资源共建共享就无法实现。”[4]可见,只有建立一套档案信息资源整合的标准体系,各地区档案馆在开展档案信息资源整合时才能有据可依。
(三)档案信息资源质量的难把关
一方面,纸质档案信息资源质量鉴定困难。档案馆为了丰富馆藏,改变原本单一的馆藏结构,会不断地在整合工作中更加广泛地收集档案,由于档案种类繁多,类目繁杂,短时间内仅仅依靠档案馆工作人员很难选取大量优质的档案信息资源。此外,档案部门不仅要关注档案信息资源内容的优质性,还要关注其档案载体质量的好坏,二者兼顾才能更好地为档案信息资源质量进行把关。另一方面,数字档案信息资源质量的控制与鉴定也比较复杂。既要控制好数字档案信息资源采集环节的质量,又要控制好录入、组织与开发环节的质量。因此,在进行档案信息资源整合时,如何收集质量优、价值高的档案资源也将是我们面临的问题之一。
四、机遇分析
只有抓住机遇才能更好地发展自己,大数据环境下档案部门开展档案信息资源整合也面临着一些机遇,抓住这些机遇,有利于档案事业更好的发展。
(一)国家政策的支持
“十二五”规划期间,《全国档案事业发展“十二五”规划》中提到要实施公共档案信息资源共享服务工程项目,打造“一站式”档案信息资源共享和服务平台,为社会提供全方位的档案信息服务。[5]“十三五”规划期间,国家档案局印发的《全国档案事业发展“十三五”规划纲要》中也制定了相关政策支持档案信息资源整合的发展。其中,有一项发展目标就是“实现档案资源多样化。依法管理档案资源,各级国家机关、团体、企业事业单位档案实现应归尽归、应收尽收;档案资源更加齐全完整、丰富多元,覆盖人民群众的档案资源体系更加完善。”[6]
(二)大数据环境下信息挖掘技术的进步
随着互联网技术的发展,越来越多的信息以非结构化或半结构化的形式进行存储,如超级文本标记语言(HTML)文档。目前,对这类文档数据访问主要是基于浏览和信息检索技术,而已知浏览器和搜索引擎检索信息的能力是非常有限的。[7]通过Web文本挖掘技术,一方面,可以提升档案信息资源的检索效率。首先,Web2.0通过对信息的聚类处理,把碎片化的信息整合到一起,发挥其最大的利用价值。其次,Web2.0通过对用户的检索痕迹进行分析,使分析结果一目了然,然后通过对分析结果进行分组和标注,使提供的检索内容更加精确,从而优化了用户的检索效果,提升了检索效率。另一方面,极大地提升了服务效能。在搜索信息或者问题时,搜索引擎就会自动推送用户可能感兴趣的信息供用户参考。档案馆可以通过分析用户浏览不同类型信息资源的频率,从而分析关注用户的喜好,这样有利于升级完善更加人性化的推荐、定制等多样化的服务。
(三)信息化建设为档案信息资源整合提供了有利的平台
我国开展的信息化建设为档案信息资源的整合提供了有利的平台。“十二五”规划期间,我国的档案信息化建设已经取得了一些成果,如档案信息化建设初具规模。初步建成以局域网、政务网、因特网为平台,以档案信息管理系统为支撑,以档案目录中心、基础数据库、档案利用平台、档案网站信息发布为基础的档案信息化体系。[8]“十三五”规划期间,《全国档案事业发展“十三五”规划纲要》中也提到了要加快档案管理信息化进程的目标。它要求各档案部门、档案网站等主体加快提升电子档案管理水平。[9]
五、挑战分析
知己知彼,方能百战不殆。档案部门既要抓住机遇,促进档案信息资源整合的开展,也要了解外部面临的挑战和威胁,以便提出相应的解决对策。
(一)信息实时精准管控难
大数据时代,动态性与交互性并存,使得数据实时精准管控难。互联网信息是档案信息资源的重要组成部分,而互联网信息的动态性是显而易见的,具有较大的自由度和随意性。除此以外,在大数据时代,网络构筑起了档案馆和用户之间的互动桥梁,档案馆可以通过档案网站向用户输送信息,公众可以参与互动,实现信息的双向流动。从这个角度而言,档案部门对纷繁复杂、动态性强,互动性紧密的数字档案信息资源实时精准控制的难度越来越大。
(二)对数据分析带来的挑战
大数据时代是一个海量数据和信息爆炸式增长的时代。随着档案部门信息化建设工作的开展,档案信息资源的收集渠道也日趋多元化,数据类型不仅包括结构化数据,而且包括非结构化数据等。由于大数据时代信息类型的多样性发展,使得传统封闭式的档案数据挖掘与分析技术不再适应半结构化数据等的分析处理。“要获得大数据分析的价值,就应关注档案数字资源中的数据关系和语义表征,实现信息整合与知识整合。但目前档案数字资源整合还处于数据整合阶段,偏重于实现异质异构数据在物理或逻辑上的集中和互联互通,仅能为用户提供信息检索服务,这与大数据时代的要求相去甚远。”[10]
(三)安全技术存在的漏洞
大数据时代的到来为档案信息资源整合带来了较多机遇,但是大数据时代也容易出现信息泄密的现象。一方面,在大数据时代,信息种类繁多,档案部门要学会识别哪些档案信息资源能开放,哪些档案信息资源又属于加密的。另一方面,虽然档案馆有采取“用户身份认证技术”来约束用户行为的措施,但是远远不够。目前,互联网的开放性对档案信息的安全构成了一定威胁,比如黑客非法入侵、计算机病毒植入等都能对档案网站信息资源的安全构成挑战。除此以外,在云环境下,云安全也存在着一定的风险。比如云计算的隐私保护问题集中在访问控制方面,上传到云端的敏感数据能否被非授权访问,用户访问时个人身份信息会被保留多久。[11]因此,档案部门要培养掌握计算机技术和档案专业技能的综合素质人才,健全档案信息安全技术等确保档案信息资源整合的安全。
综上,在大数据时代,档案部门开展档案信息资源整合有利于推动我国档案事业的发展,有利于实现档案信息资源的共享、开发和利用。通过上述分析,档案部门在进行档案信息资源整合时要依托自身内部的优势,抓住外部机遇,努力改变内部的劣势,积极应对外部的挑战,制定出符合大数据时代的档案信息资源整合策略,使其更好地为用户服务,实现档案信息资源应有的价值。
*本文为2016年国家社科基金项目“非结构化电子文件管理研究”(项目编号:16BTQ089)的阶段性研究成果。
注释及参考文献:
[1]国务院.促进大数据发展行动纲要[M].北京:人民出版社,2015:2.
[2]吴慧芳,郭庆琳,余武南.档案馆智慧馆库建设研究[J].北京档案,2016(5):27-28.
[3]肖芃,林忠华,卜鉴民.构建区域性大档案格局[J].中国档案,2011(3):22.
[4]刘玉波.档案信息资源共建共享机制建设问题刍议[J].黑龙江档案,2015(1):92.
[5]国家档案局.全国档案事业发展“十二五”规划(摘要)[J].机电兵船档案,2011(2):4.
[6][8][9]国家档案局.全国档案事业发展“十三五”规划纲要[J].中国档案,2016(5):14-16.
[7][11]李智勇,李蒙,周悦.大数据时代的云安全[M].北京:化学工业出版社,2016(3):47-119.
[10]孟歆.大数据时代档案数字资源整合的难点及对策分析[J].山西档案,2015(1):79.