特殊载体档案数字化扫描处理方法探析

    庞莉

    摘要:特殊载体档案的数字化关系到整个数字化成果的优劣,是档案能否长期保存和利用的关键。本文就特殊载体档案中图像档案的数字化处理方法及其实际应用过程,进行深入探讨。

    关键词:特殊载体档案数字化处理扫描技术

    特殊载体档案的数字化处理方法和技术发展缓慢,是现今馆藏档案数字化的难点所在。加上特殊载体档案成分与结构比较复杂,易损坏、变质,保存年限低于普通纸张,而又存在诸多扫描障碍和新型软件应用和处理方法的问题,如何完成原载体档案信息的数字化过程以及向新型载体迁移,并保证信息的完整、准确、安全和可重复利用,值得档案界思考。

    一、特殊载体档案的概念及其分类

    “特殊载体档案”在学术界并没有统一的定义,有文章记载美国在20世纪80年代初期,利用特殊载体档案就已经十分普遍了,“在纽约州,计算机机读档案和声像档案已经很普及,利用它们也是非常容易的事情。可是特殊载体档案的介质材料是脆弱的化学乳化剂和电子脉冲,很容易丢失与损坏。”[1]国内对特殊载体档案的概念也没有具体界定,卢晓峰在《特殊载体档案概述》中写道:“特殊载体档案记录信息的载体不是纸质,而是现代新技术条件下产生的新型材料。”作者李长江在《做好特殊载体档案收集工作》中提到:“特殊载体形式的档案主要指非纸质载体形式的文件材料,有照片、底片、录音、录像带、计算机磁盘、缩微胶片、实物、底图及各种电子档案等。”事实上,国家颁布的档案法规对特殊载体档案也没有统一的界定和管理办法,但对不同属性、介质的特殊载体档案分类界定了管理标准,如《照片档案管理规范》《电子文件光盘存储、归档与档案管理要求》《电子文件归档与管理规范》《磁性载体档案管理与保护规范》等。综合上述文献资料,笔者认为特殊载体档案一般是指区别于普通纸质材料的,以磁性材料、感光材料等新型技术材料为主要载体和以影像、图片、声音、电子文件、实物为主要反映形式的历史记录。

    需要说明的是,特殊载体档案的分类也没有统一的标准,马献忠在《关于企业特殊载体档案分类的思考》中提出四种分类方法,依据本文的研究范畴,笔者更倾向于按载体形态把档案划分为一般纸质载体档案和特殊载体档案两个一级类目,然后再以信息内容划分二级类目,例如分为声像档案、电子档案、实物档案三大类。声像档案又可分为图像档案以及影音档案。其中,图像档案是指照片、底片、胶片、图纸等,影音档案是指光盘、磁盘、录像带等以磁介质为载体的档案;实物档案的范围更宽泛,例如锦旗,奖杯,印章、文物,纪念品等。具体分类见图1。

    二、特殊载体档案数字化扫描处理方法分析

    由于特殊载体档案涵盖范围广泛,其中电子档案、以磁介质为载体的声像档案(如磁盘、光盘、录像带等)和实物档案(三维立体物态形状)在数字化过程中不涉及扫描处理方法,因此本文暂不讨论此类特殊载体档案的数字化扫描处理方法。将手写稿划归到本文研究范畴,主要是因为某些手写稿其载体涵盖宣纸或其他画质等特殊纸质,其一般不选用普通掃描处理方法来进行数字化。

    (一)手写稿及特殊文字的数字化扫描处理方法

    1.手写稿的数字化扫描处理方法。手写稿不属于一般纸质档案,其纸质特性有些属于宣纸,有些因为年代久远,早已失去了普通纸质的韧性,呈现出薄软脆的特点。这些手写稿字迹不同且难以辨认,若选用扫描仪扫描,一方面手写稿不易拆卷和重新装订,另一方面扫描后的图像仍然达不到简单利用目的。因此,对于手写稿首先要进行数字化预处理,“运用新型档案保护修护技术,将细菌纤维素应用到既已形成的档案文献纸张上,提高其生理化性能,实现手写稿纸张的修复,从而提高档案数字化的质量。”[2]通常的处理方法是将手写笔记翻拍成JPG图片或者扫描成PDF图片,再用Photoshop或者Adobe Reader软件将图片格式打开,用虚拟打印的方法将文件转换为MDI格式,最后用OCR技术进行识别发送至Word文档。这种方法烦琐且效率低。另外,如果采用拍照的方法,又涉及照片保存问题,且有些手写稿字迹褪去,照片影像模糊不清,不宜扫描。

    对此,可以采用直接捕捉和处理手写笔迹和草图的Carbo软件,直接利用摄像头拍摄手写稿的照片并读取图片。它的处理过程和一般扫描应用非常相似,但是效果比普通扫描更清晰,颜色更逼真,进一步保护了档案资源,处理后的手写稿还可以进行编辑(图2是普通扫描,图3是Carbo软件处理的手写稿档案)。

    2.特殊文字的数字化扫描处理方法。很多历史档案馆的馆藏中有大量手写文书档案和历史档案,这些历史档案中包含古籍、印章、金文等少数民族文字。如藏文、彝文、朝鲜文、满语文等,很多文字濒临灭绝。还存在诸多非常用字体,这些文字年代久远,不便确认。特殊字体中古今字、异体字、繁体字等无法利用传统方式扫描,或在扫描中呈现得不够清晰,影响档案数字化的进程和预期效果。

    特殊文字和字体信息的数字化扫描处理方式有键盘输入、扫描以及数码拍照。键盘输入正确率高,但效率较低,扫描和数码拍照只能转换成图像数据保存。为此我们利用OCR技术,通过处理图像扫描技术的文本数据,将其变成字符数据,即利用多种模式识别算法分析文字形态特征,判断文字的标准编码,并使用通用格式存储在文本文件中。但“OCR技术对打印文本以及清晰图像的文本数据识别率较高,目前在手稿识别、古籍识别等领域还有待进一步突破。”[3]

    针对少数民族文字以及古今字、异体字、繁体字等特殊文字和字体,笔者建议提出规范的数字化方案,设计出具有可行性的少数民族文字、古语、手稿的识别工具,开发特殊文字及字体的数字化档案管理系统。具体来说,就是将少数民族文字、古语、文言文、特殊字形和字体的文字全部录入到一个系统中,此系统可以自动识别文字,并转换成文本性电子文件,也可以将扫描后的文字图像识别存储成电子文本。

    (二)图纸及特殊图形的数字化扫描处理方法

    图纸档案具有复用率高、数量多、幅面大的特点,图纸数字化通常有两种方法:一是用图形软件重新绘制。例如,Auto CAD、Freehand、Coreldraw、Page Maker、Fits等。二是用扫描仪将图纸扫成光栅图输入计算机。例如,图纸档案中A0幅面是最大的,可以使用A0幅面的工程扫描仪对其进行数字化扫描,这种方法较为传统,不能对特殊图形进行处理,也无法直接对光栅图进行编辑。因此,笔者推荐同时采用CAD软件和图形处理软件对图纸进行数字化,这种方法可以根据图纸中特殊图形的实际情况选择适当的方案进行数字化。图纸数字化方法流程如图4所示。

    (三)照片档案的数字化扫描处理方法

    “图像档案的扫描处理方法主要是指数字图像技术,就是将照片、图片、底片等通过输入设备(数码像机、扫描仪、电脑摄像头以及数字摄像机等)所获得的并以数字格式存储的图像,在电脑上用各种图像处理软件,对图像进行各种技术处理,如对污损、残缺图像进行修复、图像文件的管理、检索、打印输出等,以提高档案保管质量和数字化管理水平。”[4]对照片档案使用传统扫描仪或者相机翻拍技术来实现其数字化,传统的数码相机和扫描仪基于CCD技术,无法避免扫描后图像的失真现象和色彩饱和度下降的情况。为了使扫描结果更接近档案原件,笔者建议可以尝试使用三位同步扫描方法。这种方法使扫描仪能够准确捕捉目标图像,减少色彩失真。扫描后的图像处理方法主要有色彩增强技术、增强图形技术和位增强技术三种。除此之外,笔者建议使用Photoshop软件。应用这种软件可以除去因档案老化或扫描程序不正确而造成的瑕疵,同时可以对图像档案中的污渍等进行编辑修理,呈现较好的图像质量。

    (四)底片档案的数字化扫描处理方法

    特殊载体档案中有一部分底片和胶片,如果将底片和胶片冲印成照片,然后用平板扫描仪扫描照片,再将照片信息存入电脑,也能达到数字化的效果,但有失底片和胶片档案的原始性,且普通扫描没有扫描透视稿的功能,因此可选择直接将底片通过底片扫描仪输入计算机。需要注意的是,在扫描底片档案时,不能像普通照片那样通过标准色片来进行扫描的校正。“在扫描底片档案前,需要人工进行底片档案的调整,如对预扫图像,进行色彩上的校正(色相变化)、曝光上的校正(亮度层次)及色彩饱和度的扫描,才能全方位满足档案用户的需要。”[5]掃描时需采用高分辨率,为了达到较好的色彩,底片扫描一般需采用2000DPI以上的分辨率,底片扫描仪的动态范围设定在3.5D左右。扫描完成后的底片图像,可用扫描软件或Photoshop等进行图像校正操作。另外,底片档案数字化处理后需要保存在信息光盘、硬盘或者计算机系统中,其内容一般包括:底片目录数据库文件、缩略图文件、底片图像文件、图像文件浏览器(如Photoshop、ACDSee)、保护文件(实现禁止拷贝功能)等。

    注释及参考文献:

    [1]耿聆.美国特殊载体档案及其保护[J].档案与建设,1988(4):50-51.

    [2]张志惠.细菌纤维素在纸质档案修复中的应用研究[D].昆明:云南大学,2015.

    [3]张丽梅.馆藏档案数字化的技术策略探析[D].哈尔滨:黑龙江大学,2009.

    [4]马淑桂.照片档案数字化技术点滴[J].中国档案, 2001(6):47-79.

    [5]卞咸杰.底片档案数字化扫描的技术指标分析[J].档案管理,2011(6):30-3.

相关文章!
  • 融媒体视域下的新时代国有企业

    赵世强中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-01摘 要 本研究分析了融媒体环境下,传统宣传媒介舆论引导的特点及

  • 给心灵一个家

    付秀宏宋朝文学家苏东坡和佛印禅师是好朋友。有一天,他们两个人在杭州同游。东坡看到一座峻峭的山峰,就问佛印禅师:“这是什么山?”佛印答

  • 投资e学堂拥有一份教育事业

    同步辅导 名师视频 考前冲刺 海量试题下载 永久免费更新E学堂 献给普天下所有含辛如苦的父母一份爱心大礼!家家都能用的起让孩子在家