开放数据背景下的文档管理探析
周文泓
摘要:立足开放数据背景探索文档管理发展旨在明确档案领域数字转型方向与策略。本文以理论构建法基于开放数据内涵,明确对文档管理的主要影响点,并通过梳理相应的文档管理研究与实践明晰尚需完善之处。由此,本文提出开放数据背景下的文档管理应当拓展对数据的管理、建设参与协作并行的主体机制、基于开放数据本质优化文档管理模式、为适应开放数据的文档管理提供保障措施。
关键词:开放数据文件管理档案管理档案利用
Abstract: Study on archives management in the background of open data aims to identify direc? tions and strategies of digital transformation of ar? chives field. The paper took the method of theory building to understand effects open data have on records management. With analysis of research and practice progress of records management for open data, some disadvantages were discovered. Thus, the paper proposed that records manage? ment adapting to open data should expand manage? ment of data, establish more participation and col? laboration mechanism, optimize records manage? ment based on essence of open data, and take measures to support records management adapt? ing to open data.
Keywords: open data; archives managements; records management; archives access
引言
当前,开放数据已成为我国政府基于政务信息资源提升国家治理能力的关键行动,无论是信息资源的维护还是相应管理工作的开展无一不与文件、档案部门的工作密切关联。这在档案领域有了一定程度的实践,例如英国国家档案馆在公共部门信息开放中强调要将数据纳入,也有专门的数据库档案专题;美国国家档案与文件署也将开放数据作为其开放政府计划中的重点任务。
研究领域亦有一定成果。一方面,围绕政府信息公开和大数据的相关研究为将文档管理与开放数据关联奠定了基础,例如倡导在大数据背景下文档管理应有的新型管理思维[1],信息公开方面的研究也为在开放政府框架下优化档案机构工作提供建议[2]。另一方面,也有部分研究直指开放数据背景下的文档管理。这类研究主要从两大层面提出档案领域应当充分参与开放数据的项目与行动:一是指出数据应当纳入文档管理的范畴。[3]二是提出文档管理的理论与方法可为开放数据提供有效指导,这既包括在开放数据过程中帮助构建真实可靠、高价值的数据资源体系[4],也涉及档案部门积极将档案进行数据挖掘以参与开放数据行动[5]。这一部分的研究未成系统,但也显示了开放数据背景下探索文档管理的必要性与空间,有待进一步明确开放数据是什么、与文档管理的相互关系、如何在开放数据的框架下开展文档工作等。
因而,本文将基于开放数据的内涵梳理开放数据与文档管理的相互关系,应用文献调研与案例研究呈现开放数据框架下的文档管理行动进展,最后立足当前开放数据提出的挑战来探讨文档管理发展方向。
一、开放数据对文档管理的影响
(一)开放数据内容概览
开放数据是开放政府的组成,它不仅是开放政府的行动构件,也秉承了开放政府透明、参与、协作的理念。[6]隨着理论研究与实践的深入,开放数据颇具规模,从概念层到行动层都形成相对统一的认识与实践,主要体现为:
1.以数据为核心,即开放数据要共享和利用的是一手的原始记录,这就将其同信息公开区分开来。从数据属性来看,其内容、形式、背景都与信息有一定区别,也在是否加工与解读上与信息形成差异。
2.开放拥有双层含义,既是属性也是行动。一方面是指数据要具有开放的特征,从内容到形式保证数据能够在合法合规框架内得到最大的共享与利用。例如,依据开放政府工作组的提议,开放数据应当具备八项特征才能称之为开放:完整、一手、及时、可获取、可机读、非歧视性、非私有、免于授权。另一方面则指开放行动,开放不仅要共享数据,而且要实现数据的开发与利用。[7]
3.开放数据已形成相对一致的行动框架:第一,制度建设,包括国家战略、行动计划、管理规范等从顶层设计到具体规范对开放数据予以规划、协调和指导。第二,组织架构优化,例如设置数据管理机构以统筹与落实开放数据行动。第三,数据平台建设,以作为共享与开发数据资源的入口以及互动交流平台。
(二)开放数据对文档管理的影响要点
开放数据由此影响着文档管理的发展变化,这些影响点也成为文档管理在开放数据背景下的探索方向。
一方面,随着数据成为业务活动形成与利用的重要形式的记录,那么在全程管理框架下,同样处于信息管理领域,开放数据既可能拓展文档管理范畴并促进其优化发展,也可能给予弱化文档管理的话语权。由此,需要考虑:(1)随着数据成为业务活动中重要形式的记录,文档管理是否需要将数据作为更重要的那部分记录进行管理,如何升级对档案的认知与界定,这些数据的形成、采集、整合、鉴定、开发、利用如何同现有的文档管理的流程如捕获、归档、鉴定等相融合,文档管理如何促进数据资源的建设以及开放,文档管理方法是否也会受到数据管理的影响发生变化以及如何变化;(2)随着开放数据的深入,各地纷纷成立数据或数据管理部门,机构内也在建立数据中心。在这种背景下,档案机构与数据机构能否建立更好的协作以及竞争关系,档案机构是否会获得数据归档管理的权力,如若可以,那么和数据机构如何协同,如若不能,档案机构是否面临危机以及如何解决?例如,2016年2月 18日浙江省的《浙江省促进大数据发展实施计划》,其示范工程之一由档案局牵头,提出加强大数据归档管理,制定大数据归档范围、标准,建立统一归档平台,促进大数据证据保全、长期保存和再利用,这需要档案部门探索如何升级优化相应的归档框架、机制与方法。
另一方面,档案机构也是需要开放数据的主体,如何开放数据也是促进其业务工作的重要方面。那么,在开放数据背景下:(1)档案机构如何以数据形式提供档案利用,是仅针对档案资源中本身就以数据形式存在的那部分记录还是要将档案进行数据化处理以提供更加丰富的数据资源;(2)档案工作中会形成哪些数据,档案机构的开放数据包括这些数据的共享吗,开放数据平台与档案信息资源平台是什么关系;(3)随着要求以数据形式来开放信息资源,那么是否在档案资源的建设中会要求在接收之前就尽量以数据形式形成?前文所提的浙江省档案局也提出加强数字档案馆(室)建设,推进档案数据聚合,构建查阅利用档案数据服务平台,完善档案数据共享开放标准。
二、开放数据驱动下的档案研究与实践
上述的那些问题在档案领域已有一定程度的探索,这在理论与实践层面均有成果。
(一)理论研究进展
理论层面已有研究提出,开放数据优化有赖于数据资源的质量,亦要档案机构作为开放主体参与开放数据行动。在开放数据资源的构建上,文档管理理论与方法可以帮助从管理原则、流程、架构、规范等方面提升数据质量,这需要文档管理充分参与到开放数据的全生命周期。国外学者认为尽管开放数据的政策中更多地使用信息和数据这样的提法,但这些信息与数据理当纳入文档管理的框架。[8]数据应用层面,可通过文档控制的方法提供高质量和可信任的数据,例如基于ISO15489标准等以文档管理的要求提供数据的位置、背景和历史等信息来提升数据质量。[9]再如,开放数据将促进数据资源的增长,这些资源的保存与处置提出诸多管理挑战如保管期限的设定,文档的有机联系以及可靠性、准确性、真实性要求都可为数据保管期限表的制定提供借鉴:不会保存所有数据;期限的设定要依赖对业务流程的分析,可推荐使用《ISO/TR 26,122:信息与记录——文档的工作流程分析》[10]。
同时,档案机构成为开放数据的主体也得到倡导,这开放政府框架下开展档案工作的延伸[11]。研究提出,由档案馆、图书馆等公共事业单位搜集、整理和保管的信息也是重要的一部分,这些单位要积极开放数据[12]。一方面,基于开放数据、大数据、数字人文提出档案信息资源的开发与利用的策略,数据形式的资源构建与管理方法得到提倡。另一方面,聚焦当前档案机构的开放数据实践,从制度建立、平台建设、数据资源构建等方面解析美国、英国、新西兰等国的开放数据案例,从而相应优化策略[13]。
总的来说,目前的理论探索有一定成果,但如何基于开放数据要求做好数据的档案化管理有待顶层设计、组织架构、系统开发、流程再造等更多方面的明确与设计。升级优化档案开放利用工作的研究也尚需形成相对全面系统的实施方案。
(二)实践探索的成效
实践层面,多个国家的档案机构都在探索开放数据的最佳实践。以NARA为例,其联邦公报办公室致力于形成和公开高品质的元数据,为了最终用户能赋予其新的用途。在和政府出版局的合作中,发行了联邦法规的电子代码的XML版本。在和总务管理局的合作中,联邦注册登记局将得到机构组织目录,因此他们可以创建和发布与美国联邦政府一致的机读原格式数据。
在我国,北京、浙江、贵州、深圳、青岛、武汉、济南、哈尔滨、佛山、东莞都在各地的开放数据平台上线了相关数据,或是关于档案机构本身的数据如馆藏地址、三公经费一类的数据集,或是以数据形式共享一些档案资源如馆藏目录,涵盖公共服务、机构团体、教育科技、社保就业、企业登记监管、社会发展、资质认定等主题。
然而,当前各档案机构的开放数据并不成熟。一方面,开放数据行动并不全面:(1)制度建设不完善,未形成立足文档管理的开放数据的顶层设计、行动规划、具体方案、规范指南等。(2)档案馆藏中数据形式的记录没有全面的共享,这很大程度上受限于数字化工作,11个地方只开放了75个数据集。例如,北京市档案局在目前北京市整体的开放数据中只提供了关于北京市國家综合档案馆的数据集,这并没有做到以开放数据的形式共享档案信息资源。(3)开放数据没有在档案平台建设中凸显,未提供方便的入口获取开放数据。另一方面,开放数据的成效有限,体现为没有得到用户足够的关注和利用。例如,11个地方的75个数据集截止2018年4月15日只有2052次的下载量。
三、开放数据背景下文档管理的适应性策略
目前,文档管理与开放数据的结合较为有限,从上述的分析与总结来看,还需在如下方面深入探索以更好适应开放数据这一大趋势:
第一,拓展对数据的管理。开放数据呈现的是数据在社会发展过程中发挥着越来越大的作用,在互联网、物联网等技术推动下持续增长的数据正从数量和价值上成为越来越重要的记录,数据亟待可信管理。这意味着文档管理需要将数据作为重要对象,一方面,拓展对数据的档案化管理范围,从业务价值以及未来的研究价值等多方面考察当前数据资源从背景、形式与内容,扩大对数据的归档管理范围。另一方面,在全程管理框架下及时参与数据管理,将文档管理的要求嵌入于数据的形成、采集、处理、整合等全流程中。
第二,建设参与协作并行的主体机制。随着数据科学逐渐成为一门学科,实践中数据机构与部门纷纷设立,文档管理如何同数据管理形成良好的协作与竞争关系需要多方面的探索,开放数据是重要方向。文档管理在开放数据中应当明晰同数据管理的界限,明确理论与方法上的交集以及差异,从而在实践中明晰二者在组织架构中的权责与相互关系。例如,数据部门可主要支持现行数据的采集和挖掘,档案部门可提供价值判定标准、方法以及保管方面的支持以积极参与开放数据资源的建设工作,甚至可在数据质量的管控上起一定的主要作用。此外,在信息资源平台建设上,开放数据平台与档案信息资源平台可相互补充。
第三,基于开放数据本质优化文档管理模式。开放数据是共享与利用的统一,它以多元特征的数据资源为基础。对文档管理而言,不仅是通过参与数据治理来促进开放数据工作,亦可通过开放数据在管理、技术、文化等方面的要求来实现文档管理的优化升级。例如,以完整、一手、及时、可获取、可机读、非歧视性、非私有、免于授权为要求的开放数据将促进文档管理在保障数据真实性、完整性、安全性、有用性上进行更多研究,以利用为目的的开放数据是促进文档管理如何在更加开放的框架下进行流程再造,及时参与数据的档案化管理更是为档案资源建设提供了数据化的基础以促进资源的丰富化和深度的价值挖掘。
第四,为适应于开放数据的文档管理提供保障措施。从我国国家层面的战略来看,开放数据已在局馆长会议等报告中得到倡导,成为国家档案局科技项目2018选题之一。从制度层面来看,在这样的趋势下,除战略引导,还需从政策到规范指南的保驾护航,从而可帮助档案工作人员明确文档管理在开放数据背景下文档管理工作需要调整之处,更能明晰如何在实际工作中如何参与开放数据工作。例如,数据归档指南的制定或是档案机构开放数据目录清单的确认都是需要落实于制度中。同时,技术层面的保障亦是必要,这需要从平台建设、系统开发、辅助工具设计上基于已有的文档管理系统针对开放数据的要求进行一定调整与优化。
1本文在全程管理理念之下将文件、档案进行整体论述,为方便表述,统称文档.
参考文献:
[1]宋淑琴.大数据视野下档案管理思维方式的转变[J].档案学研究,2015(3):36-39.
[2]张斌,黄建军.政府信息公开背景下公共档案馆建设刍议[J].档案学研究2010(6):36-39.
[3] Erik Borglund;Tove Engvall,“Open data?: Data, information, document or record?”,Records Management Journal,24(2),2014,163 -180.
[4] Lluís Esteve Casellas Serra, "The mapping, selecting and opening of data: The records management contri- bution to the Open Data project in Girona City Council", Records Management Journal, Vol. 24(2),2014,87-98.
[5] [13]李孟秋.开放数据环境下英国、美国、新西兰数字档案资源再利用的特点及其启示[J]. 2017(8): 36-38.
[6]骆毅,王国华.“开放政府”理论与实践对中国的启示——基于社会协同治理机制创新的研究视角[J].江汉学术,2016(2):113-122.
[7] [8]艾伯特J.梅杰(李倩译).开放政府:连接“知情”与“建言”[J].国际行政科学评论,2012(3)10-27.
[9]Victoria Louise;Lemieux Brianna;Gormly Lyse Rowledge,“Meeting Big Data challenges with visual analytics”,Records Management Journal,24(2),2014,122–141.
[10] John McDonald;Valerie Léveillé,“Whither the retention schedule in the era of big data and open data?”,Records Management Journal,24(2),2014,99–121.
[11]喻玲.开放政府背景下的档案开放[J].档案与建设,2016(5):12-16.
[12]郑磊.开放政府数据研究:概念辨析、关键因素及其互动关系[J].中国行政管理,2015(11):13-18.
作者單位:四川大学公共管理学院