“数据”范式演进中的档案数据治理多维解析

    赵跃 孙寒晗

    摘? 要:数据时代到来后,国内外“馆藏即数据”“档案即数据”的呼声越来越高。“数据”正逐渐演变为证据、记忆、身份、社群等范式之后的新兴档案范式。当前,学界围绕档案数据内涵以及档案数据治理的能力、策略、模式与体系等问题进行了初步探索,但何为档案数据治理,其内涵、意义、目标、要素分别是什么,档案数据治理框架及其与档案治理的联系与区别是什么,档案数据治理的理论与实践体系,档案数据治理研究的核心问题与框架等都不甚清晰,亟待进一步探索。基于此,我们组织档案学领域青年学者就档案数据治理相关问题展开讨论,观点仅供参考。

    关键词:档案治理;数据治理;国家治理;数据素养;制度建设

    Abstract: After the advent of the data era, the voices of "collection is data" and "archives are data" have become increasingly louder at home and abroad. "Data" is gradually evolving into a new file paradigm after the paradigm of evidence, memory, identity, and community. At present, the academic circle has conducted preliminary explorations on the connotation of archives data and the capabilities, strategies, models and systems of archives data governance, but what is archives data governance, what are its connotations, meanings, goals, and elements, and the archival data governance framework and What is the connection and difference between it and archives governance, the theory and practice system of archives data governance, and the core issues and framework of archives data governance research are not very clear, so further exploration is urgently needed. Based on this, we organize young scholars in the field of archives to discuss issues related to archives data governance, and their views are for reference only.

    Keywords: Archives governance; Data governance; National governance; Data literacy; System Construction

    周文泓(四川大学公共管理学院):档案数据治理融合了国家治理现代化与数据转型两大方向。作为档案事业高质量发展的重要议题,其内涵建构有如下值得破题之处,以期进一步明晰其理解逻辑。

    首先,由外围情境来看,档案数据治理同国家治理现代化的关联是什么?理解二者之间的关系在于确认在“治理”层级承继哪些通用的基本内容与档案视角应显示的特质是什么:一方面,国家治理现代化为档案数据治理提供何种建构驱动力,具体影响点以及影响内容是什么;另一方面,档案数据治理在国家治理能力现代化中具有怎样的定位,怎样产生作用。

    其次,从作用对象着手,数据赋予档案领域哪些发展要点?这是为了明晰融合数据对象、技术、理念、环境等要素后,档案数据治理如何基于治理与档案治理实现内涵建构。一方面,档案对象的数据化将如何变革档案认知与方法。例如,大数据中的全量数据要求是否同档案鉴定产生冲突;另一方面,与非数据化的档案如何协同以实现档案治理范畴下的档案数据治理。正如电子文件单轨制需要考虑同其他非数字格式文件和档案的共生,档案数据治理同样不可将数据形态予以孤立。

    再次,档案数据治理应有怎样的内容体系。一般而言,治理是对管理的协同管理,档案数据治理体现为规则设计系统与对应的规则体系。这既要上升至顶层设计形成档案治理框架,也要将规则面向各类档案活动形成应用场景示范。

    最后,在数据治理、政务数据治理已有丰富理论与实践成果的背景下,档案数据治理的相对内涵同样需要明晰。仅从数据对象来看,档案数据治理如何将纳入档案范畴的那些数据在数据治理中确立边界与关系,以及如何对应理顺数据、档案管理流程?同时,档案数据治理是主要偏重在政务数据治理或公共数据治理范畴,还是如数据治理一般拓展向整个社会运行中所产生的数据?这些都是档案数据治理得以独立并有所借鉴共生的前提。

    李贞贞(湖北大学历史文化学院):档案治理属于国家治理的范畴,是国家治理的子集。学界一般认为档案治理是对档案事务的全方位治理,秉持着多元共治理念,强调档案部门、社会组织和公众协同合作,共同对档案及其相关的一切事务进行谋划、组织、协调和决策等活动和过程。换言之,档案治理是高层次的檔案管理活动,意在多部门协同治理档案问题,促进档案事业发展。而档案数据治理是指档案部门、社会组织和公众等多元主体合作,对档案数据生成、采集、加工、存储、利用等整个生命周期进行的全程管理。档案数据治理的出现并非偶然,而是在信息技术发展、数据价值凸显和档案治理理念普及等背景下发展而来。

    在治理理念上,打破过去档案部门包揽一切档案事务的局面,档案治理和档案数据治理均注重与社会进行更多的协同合作,鼓励社会力量参与到档案事务中来;在治理主体上,档案治理主体和档案数据治理主体都具有多中心化的特征,体现为档案部门与社会的多元共治;在治理手段上,注重采用多样化手段来管理档案事务;在治理目的上,都注重实现国家档案和社会档案资源的有效保存与开发利用。而档案数据治理与档案治理之间最大的差异体现在治理内容上。档案数据治理主要是对不同生命周期的档案数据进行质量管控、组织管理、开发利用等活动,需要从技术、制度等方面构建相应的保障体系,以提高档案数据治理能力和水平;而档案治理内容更加广泛,涉及与档案相关的一切事务。

    张帆(南京大学信息管理学院):档案数据治理与档案治理是被包含与包含的关系,即在档案事业的治理转型过程中,档案数据治理是档案治理的重要治理内容。对于实现档案治理现代化而言,扎实档案数据治理工作,推进档案数据治理现代化是不可回避的问题。档案数据治理在某种程度上来说,是在继承档案治理核心理念的基础上,对档案数据领域的深化。二者既一脉相承,又有所区别,具体的剖析需从概念的构成要素角度入手而展开。

    就治理主体要素而言,二者均有多元化的特征,这一共性源于“治理”理论,多元主体共治可以说是当下治理语境下所有治理活动的共同特征。就客体要素而言,档案治理强调的是全社会范畴的档案资源,档案数据治理顾名思义关注的是全社会范畴的档案数据,其中不仅涉及多元主体形成的具有国家和社会保存价值的档案数据,也包含难以作出价值判断的各种其他类型的档案数据。

    就内容要素而言,档案治理的治理内容是突破了传统意义上只关注体制内档案事务的档案事业,换言之,就是转变为体系化的全社会范畴档案事务,档案数据治理便是其中的构成成分之一。而档案数据治理的内容除了档案数据的采集、组织、长期保存、利用等数据管理工作,还包括档案安全治理和档案服务治理工作。

    就方法要素而言,二者均涉及法治手段、行政手段、经济手段、道德伦理规约手段、技术手段、自治手段和协商合作手段。其中档案数据治理更为强调技术手段,档案数据的质量控制、安全保障、价值实现等均离不开信息技术的保驾护航。就运作要素而言,由于档案事业是档案治理的内容,因此“从严治党的自律式”是其运作方式之一。而档案数据治理仅以档案数据领域事务为内容,因此数据驱动成为其最主要的运作方式,“追究问责的法治式”“自上而下的许可式”“负面清单的自主式”“自下而上的参与式”“横向互动的协商式”和“多层互通的监督式”则是两者共同的运作方式。

    就目标要素而言,档案治理作为国家治理在档案领域的表现,其目标不仅涉及档案事业,还包括助力国家治理现代化的实现。而档案数据治理的核心目标自然是实现档案数据善治,进而助力档案治理现代化的实现。其中,协商协调多元主体的档案利益诉求是二者的共同目标。

    当然,档案数据治理重点关注多元主体围绕档案数据产生的各种需求。就价值要素而言,二者的价值定位均为档案事业发展、档案数据管理发展的转型过程,其价值尺度也均为社会主义核心价值观。

    赵跃(四川大学公共管理学院):在数字时代迎来又一个十年之后,数据资源观、资产观逐渐深入人心。

    从宏观上看,档案数据资源的权属问题成为档案数据治理当中的一大挑战。面对原生增量档案数据的治理,应在多主体参与的复杂生态当中实现协同与共治,理顺数据生产部门、数据管理部门、档案管理部门等多个部门之间的关系。这就需要突破横向和纵向的部门各种鸿沟,通过规划统筹,形成合力勘破档案数据治理之局,由各主体协同共建善治空间。

    从微观上看,要使海量馆藏档案由档案转化为档案数据,再由档案数据转化为数据资源或资产,不仅需要大量人力资源的投入,还需要计算资源与技术的支撑。而面对存量数字化加工后形成的档案数据资源的治理,考虑到档案部门目前面临的人财物等资源不足的现状,更需要重视社会力量,尤其是公众的参与。

    以公众为主的社会力量参与档案数据治理的探讨当中,众包无疑是讨论最多的路径之一。但长期以来,由于档案机构出于数据安全等诸多方面的考虑,加上国内档案机构在档案数据众包渠道、方式和平台等方面的局限,众包这一路径并没有在我国档案数据治理当中发挥出应有的作用。因此,在微观层面的公众参与档案数据治理当中,档案机构迫切需要拓宽公众参与的路径,找到适应我国档案工作环境的路径。

    针对这个问题,我认为可以借鉴美国经验,在档案机构与高校科研机构的合作当中,寻求公众(主要是学生群体)参与档案数据治理的路径。例如,美国马里兰州奴隶制遗产项目(Legacy of Slavery Project)就是多方参与档案数据协同治理的一种模式。该州档案馆承担组织领导责任,马里兰大学数据管护创新中心负责提供技术支持,并在数据分析软件、管理和信息管理方面提供专业知识。中心向马里兰大学信息学院学生传授档案历史研究知识和信息技术知识,教会学生能够利用展示工具和程序,来阅读和利用档案数据。

    档案馆向学生志愿者介绍项目、相关文件以及转录技术。同时让学生和教师,开发技术来利用和展示档案资源,形成合作关系。另外,项目还通过众包来提取数据。同时,美国国家档案与文件署与马里兰大学数字管护创新中心合作开展的二战美裔日本人监禁营档案数据管护项目,同样采取了这种协作治理模式。此模式让资源与技术实现互补,解决档案数据治理问题与开展计算思维教育得以共生。

    倪代川(上海大学图书馆):信息时代,数据为王。2020年10月29日,党的十九届五中全会通过了《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,明确提出“加快数字化发展”战略导向,确立“建立数据资源产权、交易流通、跨境传输和安全保護等基础制度和标准规范,推动数据资源开发利用”“扩大基础公共信息数据有序开放,建设国家数据统一共享开放平台”等战略举措,为新时期档案数据治理研究及其实践提供了战略指引。面对大数据社会的深入发展,档案数据价值凸显,迫切需要强化档案数据治理研究,全面提升档案数据治理能力,扩大档案资源社会影响力。

    一是要完善档案数据制度建设,确保档案数据依法治理。制度建设是档案数据治理能力的基础所在。需要制定完善以新修订的《档案法》为核心的档案数据治理制度体系,为档案数据治理提供制度支撑,确保数字时代档案数据治理依法依规推进,夯实档案数据治理的制度基础。

    二是要加强档案数据标准建设,优化档案数据资源质量。标准建设是档案数据治理的必由路径,攸关档案数据资源的共建共享共治。需要强化顶层设计,完善档案数据质量标准体系,推进“国家—行业—地方—企业”等4个层级的档案数据标准体系建设,并推进国际协作,抢占档案数据“国际标准”话语权,为档案数据治理奠定标准基础。

    三是要提升档案人员数据素养,强化档案数据价值意识。档案工作者是档案数据治理的中坚力量,直接攸关档案数据治理实践的实际效果。需要完善档案人员数据素养教育体系和档案数据素养教育课程内容建设,为档案人员提供多层次、多元化、多样化的数据素养教育支持,全方位增强档案人员的档案数据价值意识。

    四是要强化档案数据技术研发,丰富档案数据产品供给。技术是推进档案数据治理模式、治理方法、治理手段等治理创新的科技密钥。需要聚焦数据科技发展态势,推进档案数据治理的技术攻关与推广应用,强化档案数据开发的品牌化、专题化、多样化与个性化,丰富档案数据产品供给,满足社会大众的档案数据利用需求。

    杨鹏(上海大学图书情报档案系):在数据驱动下,档案学的研究对象沿着信息链从“信息”上溯至“数据”,量大源廣、价裕型多的档案数据开始成为学科分析的新对象。档案界正在借用数据科学的理论和方法,从基于信息科学的“第三范式”向基于数据科学的“第四范式”转变。与此同时,档案数据归属不明、权责不清、异构冗余、烟囱孤岛、隐私伦理、质量安全等问题普遍存在,开展档案数据治理势在必行。

    宏观生态层面,需要立足档案数据生态现状,深入解析档案数据本体因子,开展档案数据战略治理、组织治理、文化治理、生态治理、安全治理、权利治理等,构建科学合理、内涵完善的档案数据治理框架,培育健康平衡、可持续发展的档案数据生态系统。

    中观机制层面,从细粒度数据、制度化标准、法制化规程、知识化开发、智慧化管理等角度,探索档案数据治理运行动力、机理、规律、模式,建立档案部门“元治”、社会多主体协同、多方式多手段融合的档案数据治理运行机制,推动档案数据治理有序进行。

    微观资源层面,以档案数据初治、善治等治理周期和档案数据采集、处理、存储、利用、传播等数据生命周期为主线,双轨开展档案数据资源治理,完善档案数据资源体系,切实保障档案数据真实完整、质量可靠、要素合规、价值实现。

    许晓彤(山东大学历史文化学院):社会生产发展的数字化、网络化与智能化使数据成为构筑数字信任生态的基础单元,保留数据证据对建立数字信任机制、发挥数据资源价值至关重要。为了协助机构在数据时代合理避免纠纷、应对法律风险,有必要从数据粒度对档案的证据价值保障进行系统规划,强化数据时代档案工作的证据保留核心任务,维护档案的本质属性。基于此,笔者参考司法需求,提出两点构想:

    第一,将司法认可的真实性保障技术嵌入档案数据治理流程中。当前,《中华人民共和国电子签名法》《计算机犯罪现场勘验与电子证据检查规则》《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》《最高人民法院关于互联网法院审理案件若干问题的规定》等法律文件陆续明确规定了司法认可的电子证据真实性保障技术,将是否应用电子签名、电子认证、可信时间戳、哈希值校验、区块链等技术作为电子证据真实性审查判断的要点之一。因此,可基于以上技术部署技术方案并嵌入相关信息系统,在档案数据治理流程中适时使用并保留使用痕迹,如部署档案区块链等,以备应诉与审计需求。

    第二,实现“档案数据—电子证据”全链条治理。档案工作实践与电子证据应用渊源已久。如信息治理参考模型(Information Governance Reference Model)中体现了对保管档案信息、遵从诉讼留存义务的要求;司法领域的电子发现参考模型(Electronic Discovery Reference Model)也将信息治理作为起始流程;同时,不列颠哥伦比亚大学露西安娜·杜兰蒂教授团队分别提出了保存链模型(Chain of Custody Model)与数字取证功能模型(Conduct Digital Forensics Function Model),并在此基础上探讨了两个模型的衔接,以加强数字保存与数字取证的业务流程的融合。因此,可参考司法领域的证据保管链制度,实施“档案数据—电子证据”全链条治理。其中,档案数据治理活动作为前端控制决定了电子证据的规格与质量,电子证据应用则作为后端驱动引导着档案数据治理策略的完善,二者融合互鉴,推动档案数据的可信形成、可信流转、可信保管与可信共享。

    (作者单位:赵跃,四川大学公共管理学院;其他作者,略 来稿日期:2021-02-20)