基于长期保存视角的档案管理软件产品功能研究

    耿志杰 凌桂萍

    摘? 要:在分析数字档案长期保存系统功能要求的基础上,对三款档案管理软件产品的长期保存系统功能进行调查,重点分析这三款软件产品在封装功能、迁移功能、身份及权限控制方面存在的不足,并从档案部门提高长期保存意识和软件厂商完善系统功能设计两方面,提出改进策略。

    关键词:数字档案长期保存;档案管理软件产品;系统功能

    Abstract: On the basis of analyzing the functional requirements of the long-term preservation system of digital Archives, the functions of long-term preservation system of the three software products of archival management were investigated, and the three software products were analyzed in terms of the shortcomings of package function, migration function, identity and authority control. Propose strategies on improving the awareness of long-term preservation from archival departments and the functional design of the system from software vendors.

    Keywords: Long-term preservation of digital Archives;Software products of Archival management; system function

    档案部门在开展数字档案长期保存工作中,很多技术策略需要依靠功能完善的信息系统,系统功能直接决定了长期保存工作的成效。目前很多基层档案部门直接从市场上购买档案管理软件产品,这些软件产品的相关系统功能是否完善,对长期保存工作影响重大。1 数字档案长期保存系统功能要求

    数字档案管理系统在满足收集、整理、存储、利用等一般功能的基础上,在长期保存方面,应注重完善以下功能。

    1.1 确保形成可信数字档案资源。无论是传统形式还是数字形式的档案,维护其原始凭证性是整个档案工作的核心。“在维护电子文件真实性、完整性、有效性、安全性的基础上,将具有档案价值的文件移交给档案部门,以便于今后的有效保管和长久利用。” [1]收集工作是档案管理流程的起点,如果在源头上不能保证数字档案的真实性、完整性和可用性,则后续所有工作都将是徒劳的。

    数字档案管理系统在收集环节,系统功能上应具备完善的检测功能,例如采用CA证书、时间戳、元数据审核、信息安全检查等技术方法,确保数字档案的真实性、完整性和可用性,即确保形成可信数字档案资源,为后續长期保存工作提供数字资源对象。

    1.2 支持元数据自动获取、管理。元数据在数字档案长期保存中意义重大,是数字档案管理和长期保存工作的重要基础技术之一。“元数据是电子档案的重要组成部分,其管理方法、管理水平将直接影响电子档案长期保存的真实性和凭证性。”[2]档案部门在元数据获取、管理过程中,一方面应参照国家标准,例如《文书类电子文件元数据方案》(DA/T46-2009)等,制定符合本部门的元数据方案;另一方面针对海量数字档案资源,在元数据方案执行过程中,系统功能应支持元数据自动获取、管理,减少人为因素的不利影响。

    元数据贯穿数字档案管理的全部流程,需要在系统总体架构设计时进行科学规划,系统功能上应实现对元数据的自动获取和管理,具体包括:

    (1)系统应能够实现绝大部分元数据的自动获取。“元数据自动获取是指根据电子文件格式标准所描述的数据标签及其起始位置,从电子档案内部或其扩展属性中提取元数据值。”[3]具体包括电子文件归档过程中的元数据,以及后期封装、存储、检测、迁移等过程中形成的元数据。

    (2)在数字档案接收和后期管理过程中,对于一些需要人工录入的元数据,例如数字档案内容描述元数据等,系统应能够提供元数据字典等技术辅助实现纠错功能,尽量减少人为因素的不利影响。

    (3)在数字档案长期保存过程中,如果发生元数据方案调整等情况,系统也应该具备自动调整、修改、记录等功能。

    1.3 具备完善的封装功能。《数字档案馆建设指南》中管理功能部分要求,“对档案内容数据及其元数据等相关信息建立持久联系,形成长期保存档案数据包和利用数据包”,对于需要长期保存的数字档案,应该以封装数据包的形式进行存储。“封装是指利用标准的、与软硬件无关的XML语言将电子文件与其元数据按照规范结构封装在一个数据包中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系,实现电子文件自包含、自描述和自证明,封装包的信息组织结构符合ISO 14721:2003定义的档案信息包(AIP)模型。”[4]

    为形成长期保存数字档案信息包(AIP),档案管理系统应具备完善的封装功能,根据《基于XML的电子文件封装规范》(DA/T 48-2009)的要求,除完成基本的物理封装和逻辑封装外,还需包括以下功能:

    (1)标识符自动生成、自解析并保证其唯一性。“大量来源不同、主题各异的档案信息包,对档案信息有效组织、数据库日常维护、档案信息包迁移备份、数字档案提供利用提出了更高要求。”[5]档案管理系统通过标识符对这些AIP进行有效管理,系统应具备标识符自动生成、自解析并保证其唯一性的功能。自动生成,即系统自动对每个AIP赋予一个标识符,该标识符可以通过一些元数据组成,或者“元数据+系统自动赋予的某类符号”组成,或者由管理员按照一定规则自定义后批量生成。自解析,即系统的标识符解析服务模块能帮助理解标识符的结构,规定每个字段或字符的含义及特征,并根据需要更新该解析服务模块。唯一性,即一个AIP只有一个标识符,一个标识符只能对应一个AIP。

    (2)保持唯一标识符与AIP的可靠联系。AIP在长期保存过程中,可能会发生备份、迁移等操作,只有始终保持唯一标识符与AIP的一一对应关系,才能保证每个AIP的可控性,进而保证数字档案的真实性、完整性和可用性。

    (3)支持封装规则和元数据方案的调整。当封装规则和元数据方案发生调整时,可以批量对原AIP进行相应调整,即确保封装操作的可逆性。

    (4)封装日志管理及长期保存。封装日志是跟踪封装操作的记录,保证封装日志的独立性、完整性和抗更改性,是跟踪每次封装操作的有效凭证。同时系统应将封装日志与AIP分离存储,以防止两者被同时修改。

    1.4 确保静态存储数字档案的有效管理。在数字档案存储过程中,系统应具备完善的管理功能,对存储的数字档案进行综合维护,以确保其真实性、完整性和可用性。《电子档案管理系統基本功能规定》第22条规定,“系统应具备对电子档案存储状况的监控和警告功能,对存储介质的不稳定、存储空间不足、电子档案非授权访问和系统响应超时等情况发出警告,跟踪和记录警告事项处理过程”;第23条规定,“系统应具备对电子档案真实性、完整性、可用性和安全性等检查功能”。基于上述规定并结合长期保存需要,系统在存储管理中应具备以下功能:

    (1)操作人员身份管理及权限控制。系统对能够接触和操作长期保存数据库的人员身份及其权限进行严格控制,防止非授权访问和越权操作。

    (2)数据检测。系统一方面需要定期对存储的AIP进行检测,例如采用循环冗余校验、MD5值等方法,对数字档案的完整性进行检测,确保长期保存的有效性;另一方面,当进行迁移等操作后,需要进行全面检测,以防止AIP被修改或发生丢失。

    (3)载体管理。系统需要对数据库磁盘阵列的运行和容量进行监控,同时也需要对脱机存储载体的保存情况进行监控,如出现问题应及时反馈。

    (4)日志管理、审计。系统整体的运行情况对数字档案长期保存影响很大,因此需要对系统运行日志进行有效管理,并定期进行审计,及时发现其中威胁长期保存的风险因素。

    1.5 迁移功能。档案管理系统应重点完善格式迁移和系统迁移功能。

    (1)格式迁移。“由于电子档案保管期限很长,甚至是永久保存,就产生了在长时期内对类型众多的格式进行必要管理的需要,以保证电子档案可读性,防止格式过时等基本风险。”[6]当数字档案原存储格式不能满足长期保存需要时,系统应能将旧存储格式批量转换为指定格式,同时自动获取迁移元数据,并生成迁移日志。

    (2)系统迁移。系统迁移是指从旧的计算机软硬件环境迁移到新的环境,这是信息技术发展的必然且较频繁。从长期保存角度考虑,档案管理系统在系统迁移中必须保证AIP的稳定。首先,应避免在系统迁移过程中发生数据丢失;其次,系统从低版本向高版本迁移过程中,必须保证高版本系统的向下兼容性,即确保系统迁移后AIP仍能被正常操作和使用。2 档案管理软件产品系统功能存在的问题

    根据上述对长期保存系统功能要求的分析,本文对市面上的三款档案管理软件产品进行了调查。在对一些基层档案部门调研中发现,他们目前对数字档案管理的认识和需求较低,总体上就是“收进来、管起来、能利用”。因此,他们选用的这三款档案管理软件产品都是围绕基本业务流程展开的,重点是解决数字档案的收集、整理、管理、简单存储和检索利用。

    三款软件都设计有检测功能,在接收环节能够对数字档案的真实性、完整性和可用性进行检测,总体上能够保证形成可信数字档案资源;同时在存储过程中也能够对数字档案进行相关检测,基本能满足长期保存的需要。元数据方面,三款软件都具备部分自动并辅以半自动和人工方式获取元数据,能实现元数据自动管理,可以基本满足长期保存的需要。另外在载体管理、日志管理和审计方面都有相应的功能设计。但是在封装、迁移功能方面,还存在一些问题。

    2.1 封装功能存在缺陷。(1)难以实现标识符的自动生成、自解析并保证其唯一性。某款软件封装功能中以数字签名作为标识符,通过自动赋予每个AIP不同数字签名的机制保证其唯一性,但该机制缺乏解析服务功能,无法实现自解析,可能会导致出现无法通过该类标识符准确判别AIP的问题,其封装功能不完善。另两款软件则无明确的机制和技术方案以实现标识符的自动生成、自解析并保证其唯一性。

    (2)难以保证唯一标识符与AIP的可靠联系。上述某款软件将数字签名作为唯一标识符的方案,因为其没有解析服务机制能够说明该标识符是否由数字档案的某些元数据组成,组成规则如何,AIP存放地址或格式变更后如何依然能保证一一对应关系,难以保证唯一标识符与AIP的可靠联系。同样,另两款软件在标识符解析服务功能上存在缺陷导致无法保证标识符的唯一性,进而也难以保证唯一标识符与AIP的可靠联系。

    (3)无明确方案支持封装规则和元数据方案的调整。对于已封装的AIP存在解封并重新封装的可能,软件的封装功能应支持封装规则和元数据方案的调整。调查发现三款软件在这一方面均无明确的机制和技术方案提供支持,封装功能存在缺陷,同时也会对长期保存中的格式迁移等工作产生影响。

    2.2 迁移功能存在缺陷。(1)在格式迁移方面,三款软件都有相应的设计,但存在格式转换成本高、迁移过程相关数据管理难度大等问题。某款软件在系统内部设计有格式转换功能,其中包含有上百种常见的文件格式,可以实现这些格式之间的转换,这种设计会存在一些问题:首先,对于需要大批量进行格式转换时,该款软件难以满足实际需要;其次,如果该软件的版本没有及时更新,就有可能出现未包含最新格式的情况,如果此时需要转换到这些新格式就会出现问题,需要档案部门及时采购最新版本。某款软件在系统外部另有一套格式转换软件且功能比较强大,可以满足批量转换的需要,但这样的设计也会存在一些问题:首先,格式转换软件需要另外采购,会增加档案部门的成本;其次,由于管理系统软件与格式转换软件相互独立,对迁移元数据、迁移日志的管理和保存会产生不利影响。

    (2)在系统迁移方面,存在数据结构和数据库结构跨厂商不兼容难题。档案部门如果一直使用同一款软件,当该款软件版本升级时,一般会保证高版本的向下兼容性,只要档案部门持续采购,就可以保证原存储数字档案的正常操作,即使出现个别问题,软件厂商也可以帮助解决。但是当档案部门由于各种原因而更换其他厂商的软件时,不同款软件之间的兼容性就会存在很多问题,特别是对原存储数字档案是否能保证正常操作会存在很大风险,进而影响数字档案的长期保存。对此,本文访谈了某款软件的销售技术顾问,他表示如果选用他们的软件,他们会帮助解决上述问题,并“谨慎”地表示一般是可以解决的,但后期如果再选择其他厂商,他们将不再负责。由于档案部门保存的数字档案种类繁多、形式各异,特别是一些异构数据以及不同软件形成的各种数据结构缺陷,对于更换其他厂商的软件时,是否能绝对保证原存儲数字档案的正常操作,将存在很多未知风险。

    2.3人员身份及权限控制设计仍需提高。《数字档案馆建设指南》中存储架构选择部分要求:“适当选择采用单一应用平台,配备数据库服务器、文件存储器、备份服务器、备份软件等构成的存储服务平台。”而目前受硬件条件制约,很多档案部门在存储基础设施上无法达到这样的要求,在调研中还发现有些档案部门存储与提供利用的数字档案共用一套服务器系统,会对长期保存的数字档案造成严重的安全隐患,这就对系统的安全性提出了更高的要求。三款软件在操作人员身份及权限控制方面,都是采取用户名加密码登录的简单认证及基于用户身份的权限控制技术,甚至有的软件在登录界面上还有“记住用户名”“记住密码”的选项,整体安全性水平存在隐患,三款软件在身份识别、权限界定、角色定位方面仍需提高。3 档案管理软件产品功能完善策略

    上述档案管理软件产品在长期保存功能上存在的问题,不能简单地看成是软件厂商在技术设计上存在不足。某款软件的销售技术顾问表示,针对上述很多问题,他们在技术上是完全可以实现的,关键在于档案部门采购中是否提出明确的功能需求。因此对这些问题的解决,需要档案部门和软件厂商协同努力,其中最重要的是档案部门的长期保存意识。

    3.1 档案部门提高长期保存意识。调研中发现一些基层档案部门在长期保存的认识上存在问题。有些档案部门的工作重点集中在数字档案的收、管、用上,对长期保存工作不重视,甚至有工作人员表示那是他退休以后的事情;有些档案部门也认识到长期保存问题,知道封装、迁移等技术方法,但是在很多技术细节上了解不够深入或存在偏差;有些档案部门工作人员表示,在软件采购前期的洽谈中,他们提出了一些长期保存功能需求,但是由于没有采购的决定权,最终导致软件在长期保存功能上没有满足他们的要求。

    档案部门必须认识到数字档案长期保存的重要性和各种潜在风险因素,结合馆藏数字档案资源的特点和长期保存需求,才能制定科学的长期保存技术规划,进而才能明确软件系统功能需求。在目前买方市场的背景下,软件厂商在很多技术方面是可以实现档案部门需求的。

    3.2 软件厂商规范、完善档案管理软件产品功能设计。(1)针对上述系统迁移中存在的问题,每款档案管理软件产品都应该有自己的特色,很难要求它们彼此间都有良好的兼容性,但是在一些基础技术方面,这些软件都应该共同遵循,这样可以减小系统迁移带来的兼容性风险。在封装功能方面,都应该遵循《基于XML的电子文件封装规范》(DA/T 48-2009)的规定;在迁移、备份等功能方面,都应该遵循《电子文件归档与电子档案管理规范》(GB/T 18894-2016)的规定;在元数据方面,都应该遵循《文书类电子文件元数据方案》(DA/T 46-2009)、《照片类电子档案元数据方案》(DA/T 54-2014)、《录音录像类电子档案元数据方案》(DA/T 63-2017)的规定;在数据格式方面,都应该遵循《版式电子文件长期保存格式需求》(DA/T47-2009)的规定。

    (2)在格式迁移、载体管理、操作人员身份管理等功能方面,软件厂商应该尽可能完善相关功能设计,提高长期保存系统功能水平。同时应该与档案部门保持沟通,一方面可以向档案部门宣传长期保存相关技术,提高自身产品的亮点;另一方面也可以避免档案部门提出不切实际的技术要求。

    (3)在调查中发现,有些软件是将各个功能模块封装后,以“标准化”产品向档案部门销售的,这样不利于档案部门在长期保存功能上提出个性化需求。在功能模块组织、添加设计上应该更加灵活,实现按照档案部门需求的个性化定制服务。4 结语

    数字档案长期保存工作依托于功能完善的管理系统,对于软件产品的选购,一方面档案部门需要在认识上予以重视,详细了解相关技术细节,明确系统功能需求;另一方面软件厂商在长期保存功能设计上应更加完善。只有档案部门和软件厂商协同努力,才能更好地开展数字档案长期保存工作。另外,由于作者水平有限,以及所调查软件产品的版本问题,本文不出现三款软件产品的具体品牌,如果对软件产品系统功能认识存在偏差,深表歉意。

    参考文献:

    [1]金波,丁华东.电子文件管理学[M].上海:上海大学出版社,2015:155.

    [2]陶水龙,田雷.电子档案元数据管理方案策略研究[J].档案学研究,2016(2):89-92.

    [3]毛海帆.电子档案元数据方案设计与应用探究[J].档案学研究,2010(1):74-78.

    [4]国家档案局.DA/T 48-2009 基于XML的电子文件封装规范[S].2009.

    [5]祝清松.国内外数字对象唯一标识符应用现状述评[J].情报科学,2012(8):1254-1257.

    [6]钱毅.基于长期保存视角的电子档案格式管理研究[J].档案学通讯,2016(6):52-57.

    (作者单位:上海大学图书情报档案系? 来稿日期:2019-04-17)