《档案数字化规范》地方标准第一至四部分解读

    北京市档案局信息化处

    2010年12月29日,市质监局发布北京市地方标准公告2010年标字第16号,由北京市档案局起草的《档案数字化规范》(以下简称《规范》)系列标准第一至四部分正式成为北京市地方标准,并于2011年4月1日起实施。

    《规范》系列标准是在深刻总结北京市档案数字化工作经验并广泛吸取国家和兄弟省市有关档案数字化先进研究成果的基础上,针对北京市档案数字化的实际发展情况而制定的。这是我市第一批档案信息化地方标准,该系列标准的出台将进一步规范和促进北京市档案数字化工作,对推进档案信息资源开发利用,保证档案实体和信息安全具有重要意义。本文就实际工作中如何理解和执行该系列标准进行解读。

    一、制定《规范》系列标准的背景

    近年来,北京市的档案数字化建设发展很快,市和区县档案馆以及绝大部分市属单位都已开始大规模地开展馆(室)藏档案数字化工作。档案数字化是一项长期的系统工程,需要选择加工方式,需要确定工作流程和工作环节,需要制定各种技术指标,是一项技术性较强的工作,必须用统一的标准作为指导和依据。在《规范》第一至四部分出台之前,北京市开展档案数字化工作时可依据的仅有《纸质档案数字化技术规范》(DA/T 31—2005)和《缩微胶片数字化技术规范》(DA/T 43—2009)两个档案行业标准,但这两个行业标准没有覆盖更多载体类型档案,也没有对档案数字化成果的存储和利用提出详细规定,已然不能完全满足北京市大力开展档案数字化工作的需要。为了更好地适应和促进北京市档案数字化建设事业的快速发展,由此,《规范》系列标准便应运而生。

    二、《规范》系列标准的总体框架

    (一)《规范》系列标准的架构

    本次发布的《规范》第一至四部分只是《规范》系列标准的前四部分,规划中的《规范》系列标准共分为八个部分,内容覆盖档案数字化的各个方面:从横向上来说,《规范》系列标准包括纸质、缩微胶片、照片、录音和录像五种载体档案的数字化加工标准;从纵向上来说,《规范》系列标准则涵盖了数字化加工、数字化成果的存储和利用等档案数字化工作的各个环节,从而形成了一个相对完整的档案数字化标准体系。

    除了已发布的前四部分,规划中的《规范》系列标准的第五至八部分将在今后陆续推出。规划中的《规范》系列标准的整体架构见图1。

    

    图1:规划中的《规范》系列标准的架构图

    (二)《规范》系列标准的主要内容及不同部分之间的关系

    《规范》系列标准的第一部分主要规定了档案数字化工作的基本要求和基本流程,是《规范》系列标准的“总纲”,其它部分都是建立在第一部分的基础上的,它适用于各种载体档案数字化的全过程。第二至六部分分别规定不同载体档案数字化加工过程的工作环节和相应的技术要求,其中每一部分适用于某种载体类型档案的数字化加工环节。第七部分主要规定档案数字化成果的存储策略、方式和要求等。第八部分则主要规定档案数字化成果利用的相关技术要求和管理要求等。

    其中,第一部分、第七部分和第八部分就像是大学中的 “公共课”,不论哪个专业的学生都要学习,而第二至六部分就像是“专业课”,不同专业的学生选择相应的“专业课”进行学习即可。在开展档案(不论是何种载体)数字化工作时,在遵守第一、七、八部分(相当于“公共课”)的基础上,再根据档案数字化的具体载体类型在第二至六部分中选择相应载体类型的那一部分(相当于“专业课”),共同作為开展该载体类型档案数字化工作时所要依据的标准。

    三、《规范》与档案行业标准之间的关系

    要深入地理解和执行《规范》,就要弄清《规范》与《纸质档案数字化技术规范》和《缩微胶片数字化技术规范》这两个档案行业标准之间的关系。

    (一)《规范》遵从于两个档案行业标准

    《规范》系列标准是在充分遵从两个档案行业标准的基础上制定的,在档案数字化的总体原则、工作环节划分、工作流程设计等主要问题上都与两个档案行业标准基本保持一致,而不与之相抵触。

    (二)《规范》涉及的内容更全面

    两个档案行业标准仅涉及了纸质和缩微胶片两种载体档案,而《规范》系列标准则包含纸质、缩微胶片、照片、录音和录像五种传统载体档案,涉及的内容更加全面。

    (三)《规范》的某些规定更详细

    在两个档案行业标准中,档案数字化成果的存储和利用这两方面的内容都是作为标准的条款而提出来的,没有更详细的规定。《规范》则将档案数字化成果的存储和利用分别以系列标准的一个部分的形式单独制定标准,其规定更加详细、具体。此外,《规范》还进一步细化了档案数字化加工过程中一些具体环节的操作要求。如《规范》第二部分的5.1条和5.2条分别对“确定扫描页面范围”和“编页”提出了具体的要求,更利于档案数字化操作人员在工作中准确把握和利用标准。

    四、如何使用《规范》

    《规范》作为系列标准,其第一至四部分已经出台,那么应该如何使用呢?

    首先,应该有针对性,即在档案数字化工作中充当不同角色的人员应该有针对性地使用。对于档案数字化建设单位的领导来说,只需要对档案数字化有一个整体的认识和了解,这样他们一般只需要参阅《规范》的第一部分《总则》即可。而对于档案数字化的管理人员和操作人员来说,则更需要明确档案数字化加工流程中的每一个工作环节和详细的技术要求等具体细节,因此他们应该更着重研究使用《规范》的第二、三、四部分。

    其次,档案数字化建设单位不仅在自主生产时要把《规范》作为开展档案数字化工作的依据,而且当采用外包生产方式时,也要在与外包商签署的协议中明确“严格执行《规范》系列标准”这一事项,并在项目完成后按照《规范》规定的有关指标进行验收。

    五、《规范》使用过程中的几个关键点

    目前已出台的《规范》系列标准的第一至四部分中,除了第一部分《总则》外,其它三部分分别是关于纸质、缩微胶片和照片档案数字化加工的标准。在这三种载体档案数字化加工过程中,有几个特别需要注意的地方,如选择扫描色彩模式、选择分辨率、选择档案数字化文件的存储格式等。这里就以开展纸质档案数字化加工为例,对《规范》在使用中的几个关键点作一些简要说明。

    (一)选择扫描色彩模式

    《规范》第二部分7.3条明确了纸质档案数字化加工常用的三种扫描色彩模式,具体包括黑白二值、灰度和彩色模式,但除了蓝图等特殊档案外,一般不推荐采用灰度模式。对于大多数只有文字的纸质档案来说,一般采用黑白二值图像模式扫描即可;当采用黑白二值图像模式不能充分反映档案内容信息时就直接用彩色模式进行扫描。这里之所以推荐选择彩色图像模式而不选择灰度模式,主要是因为在图像文件大小基本相同的情况下,彩色图像的层次更加丰富,清晰度更高,可以更真实地显示档案原貌。当然,如果需要数字化的纸质档案数量不是很多,在资金条件允许的情况下,完全可以全部采用彩色图像模式进行扫描,以实现更好的效果。

    (二)选择扫描分辨率

    《规范》第二部分7.4条规定了纸质档案数字化加工时黑白二值图像模式扫描和彩色图像模式扫描的分辨率均应“不小于200dpi”。

    这里提到的分辨率是纸质档案数字化加工中的一个重要指标参数,它直接决定纸质档案数字化成果的质量。档案数字化建设单位在开展纸质档案数字化之前就应该确定扫描分辨率这一指标参数,分辨率的选定原则是在能够满足当前和未来一段时期内主要需求的前提下,再根据档案类型、档案数量、扫描色彩模式和存储设备空间等情况综合酌定。需要注意的是,《规范》规定的所有指标参数都是最低值,而非最佳值,各单位在实际工作中一般可以选择等同于或略高于《规范》规定的最低值即可。目前北京市相当多的单位都采用分辨率为300dpi的彩色扫描模式来开展纸质档案数字化加工。

    (三)选择图像文件存储格式

    存储格式关乎档案数字化文件是否能够长久保存和安全保管,同时它也是决定档案数字化成果存储空间的重要因素,档案数字化建设单位要慎重选择。《规范》第二部分7.5条规定了纸质档案扫描后的图像文件可以存储为TIFF、JPEG和PDF这三种常见且通用性较好的格式。一般的,黑白二值图像宜保存为TIFF(G4)格式,灰度或彩色图像宜保存为JPEG格式,而以单份文件为单位存储的可保存为PDF格式。各单位应根据本单位的实际情况选择相应的存储格式,并保持存储格式的相对稳定,一般不要随意更改或转换存储格式,以避免可能引起的数据混乱、损坏甚至丢失。

    (四)验收合格率

    验收作为档案数字化加工质量控制的最后一个环节,其重要性不言而喻。为了把好档案数字化加工质量控制这最后一道关卡,结合实际调研情况,《规范》规定了验收合格率应达到99.7%以上(含99.7%),这大大高于档案行业标准95%的验收合格率。验收合格率提高就意味着成本的增加,那么为何《规范》要大幅提高验收合格率这一指标呢?这是因为档案作为历史的真实记录,对社会和个人都担负着极其重要的凭证作用,在笔者看来,与档案的严肃性和重要性相比,适当增加一些成本来提高档案数字化的质量是值得的。其实,严格地说档案数字化本来是不容许出现任何错误的,验收合格率无论设置得多高都不过分,但考虑到现实中在大规模的档案数字化加工过程中由于纷杂的工作环节和人员操作的不稳定性等原因,偶尔出现一些问题又是无法避免的,因此,《规范》提高了验收合格率至99.7%,也就是只有3‰的“容错率”。需要说明的是,在纸质档案数字化加工中通常容易出现的错误主要包括以下三类:一是机读目录著录错误;二是图像质量问题,包括图像模糊,亮度、对比度、饱和度等参数设置不合理、图像歪斜等;三是机读目录与图像文件挂接错误。其中,《规范》规定3‰的“容错率”主要就是针对第二类错误,同时也是唯一可以容忍的一类错误;而对第一、三这两类错误则应该采取“零容忍”的态度,一旦发现这两类错误就应直接退回改正或重做。

    《规范》涉及的内容还有很多,由于篇幅限制不能逐一讨论。但在使用《规范》来开展档案数字化的过程中,如果把握好了以上几个关键点,其它的就都相对容易地参照《规范》系列标准来执行。(执笔人:杨中营)

相关文章!
  • 基于企业文化的国企思想政治工

    陈广梅中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-02摘 要 新形势下,党对国有企业思想政治工作提出更高的要求,需要

  • 一次为中国革命延续火种的伟大

    朱强今年11月12日是我国伟大的革命先行者孙中山先生诞辰150周年。在孙中山先生早期的革命生涯中,有一段流亡海外的经历,这段经历见证了

  • 周强:在县域治理中发挥好司法

    大数据时代,司法案件运行情况成为县域经济社会发展的晴雨表。法院将海量案件信息进行大数据分析,从刑事案件判断治安状况,从民商事案件