OAIS参考模型在数字信息长期保存项目中的应用及启示
谢永宪
信息时代,数字信息资源已经成为战略资源。数字信息资源在海量产生的同时也在大量丢失,世界各国都在积极应对,开展数字信息长期保存项目,探索数字信息保存的规律。但是由于数字信息长期保存技术发展快,标准不统一,严重影响数字信息的交流和互换。这时,OAIS参考模型应需而生。OAIS参考模型为数字信息长期保存项目提供了一个容易接受的应用基础框架,它作为数字信息长期保存的基准框架,已经被各国相关研究机构与保存部门广泛认可,并应用到很多数字信息保存项目中。联网的欧洲图书馆保存项目NEDLIB认为,OAIS参考模型适合于任何类型的档案馆,尤其适合于那些负责信息长期保存与利用的组织。
我国在进行数字信息长期保存相关项目的开发时,有必要采用OAIS作为基础框架模型,这样我国数字信息长期保存工作既能利用国际最新研究成果,跟上国际数字信息长期保存工作发展的步伐,又能实现数字信息长期保存系统与国际同行接轨,保证数字信息长期保存工作的资源共享和信息交换。然而,数字信息长期保存是庞大复杂的工程,没有统一的建设模式;同时也是技术含量高、资本投入高的项目,建设风险很大。这就有必要学习国际上的成功经验,在利用OAIS参考模型开展保存项目时做好相关准备,规避各种风险,少走或者不走弯路,确保项目
顺利完成。
一、OAIS参考模型
OAIS参考模型是美国国家航空和航天局(NASA)和太空数据系统咨询委员会(CCSDS)联合制定的一项标准。2003年,参考模型最终成为ISO标准并颁发。OAIS参考模型本身并不是专门的用来解决数字信息长期保存的特殊技术,而是着重论述了与数字信息保存相关的各种关系和框架概念,以及应对数字信息保存处理过程的策略。OAIS参考模型是一个广泛的模型,涉及并论述了从数字信息存档设计到开放式存储整个过程中的相关问题。它由六个功能模块组成。①摄入:从信息生产者那里接收提交信息包,并且对内容进行准备,然后传递给长期存储模块;②长期存储:负责存储、维护信息包,并在获取功能模块提出请求时将提交信息包提供给该模块;③数据管理:植入、维护和存取那些标识并记录档案馆藏的描述信息以及对存储系统进行检索与管理;④系统管理:通过有关政策、规范、程序、工作流等来监测和控制整个长期保存系统的运行和各个模块的运行,对整体的档案系统提供操纵管理;⑤保存规划:监测OAIS的环境,提供相关建议以确保在OAIS中存储的信息在一段时间之后,仍然能够被相应的目标用户所访问;⑥存取:提供用户检索元数据和索取数字信息单元的界面,提供检索机制,存取存储在OAIS中的信息,还可能承担身份认证和授权管理责任等。
二、OAIS参考模型的实践应用
1、永久保护电子文件真实性国际研究项目(Inter PARES)
1999年加拿大发起成立了永久保护电子文件真实性国际研究项目,项目由包括加拿大、美国、英国、荷兰、中国、韩国等十余个国家的档案馆以及一些大学和研究机构共同参与研究。其主要目标是建立一整套的理论和方法用于切实保障在数字形态中创建或维护的可信的文件,确保电子文件及其真实性的永久保存。Inter PARES项目根据研究目标的需要,对OAIS的六个功能模型进行了取舍,保留了摄入、存储、数据管理、系统管理、保存规划功能,同时放弃了OAIS中规定的一些功能,比如通知潜在用户需要对文件进行保存、什么情况下对文件进行访问等。
2、美国电子文件档案馆项目(ERA)
2005年8月,美国国家档案馆开始了致力于解决政府数字信息长期保存的电子文件档案馆计划,该计划将耗资3.08亿美元、开发时间长达6年。ERA的目标主要是通过保存任何形式的电子记录,以提供给现在及未来的使用者存取。对ERA而言,OAIS模型为其实体、功能、数据流和管理行为提供了一个整体上的框架。在系统内部,OAIS为ERA定了三个虚拟工作区:存取工作区、存储工作区和查询工作区,三个子系统采用相同的信息技术来架构,在ERA内互相支持,共享数据。
3、欧盟NEDLIB的电子出版物保存系统(DSEP)
1998年,欧洲国家图书馆联合会常设委员会发起了NEDLIB项目,欧洲8个国家图书馆、一个国家档案馆和三个出版商参与了这个项目。项目的目标是构建一个基于网络的欧洲保存图书馆的基础框架,与各个国家的国家保存图书馆任务相适应,确保在目前可用的电子出版物在将来同样可供利用。该项目的电子出版物保存原型系统,在OAIS基础上加了一个保存模块,该模块保证了所有存储数据系统在原有各应用系统出现故障的前提下系统仍可使用。通过增加这个分离保存实体模块,使保存网络电子出版物的过程可视化和更精确。
国外著名的对OAIS的应用研究还包括澳大利亚的维多利亚电子档案保存项目、英国的Cedars分布式数字存档原型系统以及美国加利福尼亚大学的数字保存仓储系统等等。
三、几点启示
1、根据需要对模型进行灵活运用
OAIS只是参考模型,而不是系统设计模型,在保存系统设计过程中需要根据不同保存需求进行系统的分解和设计。如,Inter PARES项目放弃了OAIS中规定的一些功能;而NEDLIB的电子出版物保存系统在OAIS基础上加了一个保存模块。
2、优化技术保障策略
OAIS参考模型是对数字信息长期保存系统的外部环境、功能模块及保管对象的概念化,并非具体实施方案,在利用OAIS进行系统设计的过程中会涉及很多技术问题,如系统结构、存储技术、档案系统功能需求等等。目前,实现的途径有:一是数字信息保存机构与实力较强的技术企业合作,进行系统设计,比如美国国家档案馆在ERA项目中与洛克希德·马丁计算机公司合作、荷兰国家图书馆和IBM共同开发e-Depot项目等。二是技术实力强的数字信息保存机构自行设计基于OAIS的保存系统,比如佛罗里达图书馆自动化中心的“黑色档案系统”、加利福尼亚大学的数字保存仓储等。三是引导企业为满足市场上对OAIS利用的需要而开发技术,比如IBM、EMC、HP、SUN等企业,或独立或联合,开发出了智能数据存储(IDS)、数字信息存储系统(DIAS)等技术。
3、开展广泛的合作与交流
数字信息长期保存项目利用OAIS进行系统设计时,涉及技术、标准、法律等众多研究方向,项目的完成需要来自不同机构的合作和共同努力。目前,可以借鉴的合作方式有:一是国家间的合作,如DELOS项目成员来自13个国家;二是不同数字信息长期保存研究机构之间的合作,如NEDLIB项目由8个国家的图书馆、一个国家档案馆和三个出版商共同完成;三是不同行业之间的合作,如荷兰国家图书馆和IBM在e-Depot项目中的合作等。通过不同方式的合作,有利于实现技术的合作攻关、资源的合理分工、经费的最佳分配,保证数字信息长期保存机构完成既定目标。
4、确保必要的资金支持
数字信息保存机构利用OAIS开展长期保存项目,在研发技术、购买设备、人员培训、系统维护等方面都需要进行大量的资金投入。数字信息保存机构很难独立解决资金问题,需要外界资助。美国的ERA项目计划投资3.08亿美元、欧洲委员会电信应用项目资助了NEDLIB项目。我国数字保存机构在开展数字信息长期保存项目时可以向各级主管部门和政府机构申请资助,以保证项目的顺利进行。
5、重视人力资源建设
在利用OAIS进行系统设计过程中,数字信息保存人员要将自己的需求向技术专家进行表达;系统设计完成后,数字信息保存人员需要掌握相关操作的专业技巧。这就要求数字信息保存相关人员即具备信息保存方面的专业知识又具备计算机方面的知识。Inter PARES项目第三阶段的部分任务就是探索如何对相关人员进行培训。我国可以采取多种方式培养符合时代需要的高素质数字信息保存人员,比如正规教育,即在设置信息资源管理及相关学科的高校教育中增加信息技术等课程;继续教育,以在职学习和短期培训为主,同时辅以学术讲座、专题研讨等多种形式。
参考文献:
①宛玲:《国外数字信息长期保存的最新发展及对我国的启示》,《中国图书馆学报》,2004年第2期。
②任平:《欧洲数字信息长期保存研究及其启示》,《大学图书馆学报》,2005年第4期。
③吴江华:《开放性档案信息系统:背景、职责及功能》,《图书·情报·知识》,2006年第9期。
④Inter PARES,Preservation Task Force Report[R],http://www.interpares.org/book/interpares_book_f_part3.pdf
作者单位:中国人民大学信息资源管理学院