电子文件归档与长期保存技术路径研究

陈丽榕
【摘 要】随着社会经济水平的不断提高,传统的纸质档案已经无法满足档案管理工作的需要,因此需要使用电子档案。电子档案的归档比较方便,并且还能够长期的保存,论文主要探讨电子文件归档与长期保存的技术路径。
【Abstract】With the continuous improvement of social and economic level, the traditional paper archives can no longer meet the needs of archives management, so we need to use electronic archives. The archiving of electronic documents is convenient and can be preserved for a long time. This paper mainly discusses the technical path of archiving and long-term preservation of electronic documents.
【关键词】电子文件:归档;长期保存;技术路径
【Keywords】electronic documents; archiving; long-term preservation; technical path
【中图分类号】G275.2 【文献标志码】A 【文章编号】1673-1069(2018)08-0167-02
1引言
档案的信息化管理需要一定的技术支撑,通过建立电子档案数据库,来完成档案的管理并且还能够实现档案的信息共享。电子档案在进行归档保存的时候需要通过一些技术来实现,其中需要注意的就是保持电子档案格式的标准化。
2 电子文件档案概述
电子档案在进行管理的时候需要建立数据库,通过数据库来完成档案的存储以及管理等工作。数据库管理系统中承担文件职责的数据或者是文件的主要组成成分都可以称为电子文件。目前大多数数据库中都存在着大量的表格,这些表格中还会有不同的字段,这些字段中含有不同类型的数据。数据库中数据表的数据就是电子档案的内容,表结构以及表间关系是一些电子文档的背景信息,比如数据库权限、日志以及结构信息等。这些背景信息也是構成电子文档的重要因素。
数据库中的电子文件与传统的电子文件有着很大的不同,因为数据库中的电子文件之间存在一定的联系,并且其内部的逻辑关系也比较复杂,也就是说数据库中的电子文件是一个有机的整体,但是不同数据库中的电子文档只能由自己管理系统中的软件读取。传统的电子文档进行归档的时候档案内容已经办毕了,但是数据库中的电子文档可以随着档案的变化而进行调整[1]。
3 电子文件归档与长期保存难点
3.1 归档范围的确定
电子文件归档的依据是归档范围,但是数据库中的电子文档之间都是相互联系的,这也就导致了归档范围难以确定。如果在进行归档的时候将全部的文件归档,那么就会有一些多余的信息出现,使得电子文档不够简洁。但是如果只选择其中一部分文件进行归档,那么就会造成档案信息的丢失,从而降低了档案的价值。同时,由于电子档案的数据是处于动态变化中的,这样也很难确定归档范围。
当前很多数据库在研究电子文件的时候,分为两种不同的方式。首先是整体论,这种方式是在整体的电子文件数据库中挑选归档文件,但是其需要后台管理系统做技术支撑。还有一种是分散论,就是对所有的数据进行分析,找出需要管理保存的文件,然后再制定具体的管理办法。这种方式是在管理系统的前台进行电子文件管理的,但是与整体论一样都是选择有价值的文件进行归档处理。
3.2 归档方法的选择
电子文件进行归档的时候可以选择物理归档,也可以选择逻辑归档。其中逻辑归档不会对电子文件的存储方式和位置进行改变,只是将权限做了移交。但是物理归档时将电子文件从原有的系统中脱离出来,移交给专门的档案管理部门。如果电子文件是保存在数据库中的,那么进行归档处理的时候就要考虑数据库的安全、效率、规模以及类型等问题,因为数据库中的电子文件会随着实际情况而发生变化。采取逻辑归档的方式,那么一旦业务系统遭到破坏,就会影响到电子文件,使得归档工作不能有效进行。但是选择物理归档的话,电子文件一旦离开数据库就无法进行读取,因此也是应该考虑到的问题。
3.3 电子文件的可读性
电子文件从生成到保存都需要计算机系统作为技术支撑。但是电子文件在整个生命周期中对用户都是不透明的,用户操作的时候只能通过DBMS,但是DBMS的类型不同的话,那么电子文件之间也不能互操作,这样电子文件对计算机系统的依赖程度比较高,管理起来也就比较困难。因此进行归档的时候,不仅要保证电子文件的信息、背景以及内容没有缺失,还要保证电子文件在别的系统中仍然有可读性。比较传统的方式是将电子文件以及系统一起保存。但是这种方式需要对系统进行专门的归档,同时当出现新的系统时还要重新进行归档,使得管理成本升高。因此应该选择更加科学的归档方式,不仅要保证电子文件的安全、完整以及真实,同时还应该降低对系统的依赖,使其在不同的系统中都能够读取。
3.4 电子文件的长期保存
当电子文件归档后主要的目标就是长期保存。因为数据库中的电子文件之间是相互联系并且依赖系统的,因此不能选择传统的长期保存方式。进行电子文件长期保存的时候,应该考虑到所选择的技术、管理以及相关政策等多方面的因素。但是由于我国的电子文件管理起步比较晚,因此相关的标准规范还不够完善,同时相关的管理方式以及保存技术还比较落后,这样导致在电子文件长期保存的时候没有相应的参考,也是一个难点问题。
4 电子文件归档与长期保存的技术路径
4.1 技术总体方案
进行电子文件归档与长期保存的时候,需要解决的问题比较多,比如不同类型DBMS的差异性、电子文件背景信息、结构以及内容的封装、电子文档长期保存的实现方式等。通过分析采用一些技术手段来解决上述的一些问题,首先是不同DBMS电子文件的归档,由ODBC提供统一的数据接口。对电子文件的信息内容等进行封装的时候由DPT实现,这种方式是以SIARD数据库归档标准以及XML可扩展标记语言为基础的,使得电子文件对系统的依赖性降低。进行归档电子文件的长期保存的时候以信息包的形式流转在各管理模块中,而对归档的电子文件进行归档的时候可以使用DVT。这样通过各种技术可以解决电子文件归档和长期保存时遇到的各种难题。
4.2 集中归档时采取统一数据接口
目前市面上存在的数据管理系统比较多,不同类型甚至同一系统不同版本之间的电子文档格式都是不同的,因此不同系统的文件不能互相操作。而ODBC则形成了一套标准的规范,其可以在数据系统与电子文件之间建立统一的接口,这样就可以通过不同的系统对电子文件进行读取,也为电子文件的集中归档提供了方便。
4.3 基于XML开展数据封装
數据库在发展的过程中产生的数据模型比较多,比如对象模型、网状模型以及层次模型等,但是这些数据模型对于系统的依赖程度比较高,归档的时候比较困难。而还有一种模型是关系数据模型,其数据结构基础是二维表,这样就很好地解决了电子文档对系统的依懒性问题。对这种数据模型的电子文件进行保存的时候可以选择将二维表转化为XML格式,这样使得电子文件比较容易读取,因此目前很多数据库都在使用这种模型。XML是W3C推荐的标准,其特点是具有较高的灵活性以及可扩展性,这样用户就能自定义标签格式,电子文档就能在不同的管理系统中进行操作。
4.4 基于OAIS进行数据的长期保存
进行电文文件的长期保存时使用OAIS技术能够提供基本概念框架与参考模型,使得系统中的电子文件能够长期的保存和读取。OAIS中的参考模型有保存规划模块、存取模块、数据管理模块、档案存储模块以及摄取模块等,同时信息数据是以信息包的形式存在的,能够在各模块之间流转。
对电子文件进行保存的时候,首先应该将其转换为符合XML规范的SIARD文件,然后以数据包的形式进入摄取模块,对电子文档的所有信息进行检验,使其能够符合封装的标准。档案存储模块能够将SIP封装为可以长期保存的AIP档案信息,进行封装的时候要保证档案的内容是完整可靠的。
5 结语
随着科学技术的不断发展,电子文件的管理方式也越来越多。但是由于我国的电子文件管理起步比较晚,因此相关制度以及技术都比较落后。进行电子文件归档和长期保存的时候,可以使用一些技术手段,比如XML、OAIS等。
【参考文献】
【1】郑秀玉. 试论电子文件归档方式和途径的选择[J]. 兰台内外, 2006(5):43-43.
相关文章!
  • 谈国企党建工作与企业文化的深

    刘冰中图分类号:F270 文献标识:A 文章编号:1674-1145(2019)5-001-02摘 要 随着我国经济水平的不断提升,国家对社会主义文明建设也越来

  • 北京东交民巷法国邮政局旧址建

    祖晓屹+何昕“法国邮政局旧址”(以下简称“旧址”)位于北京东交民巷中段路北,是东交民巷旧领事馆区现存代表建筑之一。它与南面的首都宾馆

  • 观点速读

    1 徐道文:通关便利化是外贸助推剂长期以来,历史上造成的一些烦琐、重复的通关手续,降低了工作效率,给外贸企业带来很大负担。近年来,海