分布式档案数据库系统的建立及其对档案编研的影响

    郑慧+覃筱媚

    摘要:21世纪初,网络环境下的档案编研就成为人们关注的热点问题之一。然而,人们对将分布式档案数据库系统应用于档案编研缺乏足够的关注。分布式档案数据库系统通过分别设置受众模块、档案原文数据库模块、专家模块、编研模块,对档案编研工作环节、档案编研成果传播、档案编研成果开放范围均产生一定积极影响,将对未来的档案编研工作起到重要作用。

    关键词:分布式档案数据库系统档案数据库档案编研

    The Influence of BuildingDistributed Archival Database System on Archival Compilation

    Abstract: At the beginning of twenty- firstCentury,archival compilation under the network be? came one of the hot issues.How? ever, people paid little attention on the distributed archival data? base system applying on the ar? chive compilation. By setting the audience module, archival original databasemodule,theexperts module, editing module, the dis? tributed archival database system can have a positive impact on the archival compilation work, archival compilation products dissemina? tion and the open range and it will play an important role on the fu? ture of the archival compilation.

    Keywords: distributed archi? val database system; archival data? base; archival compilation

    如果以2001年张文娟在《兰台内外》发表的论文《网络环境下档案编研工作面临的机遇与对策》作为我国研究网络环境下的档案编研的起点,至今这个问题的研究已经持续了14年,相关论著已逾百篇(部),取得了不少有价值的成果。但是,人们对将分布式档案数据库系统用于档案编研的关注不够,在一定程度上忽视了网络环境下分布式档案数据库系统对档案编研带来的积极影响。本文将从建立分布式档案数据库系统入手,进而分析分布式档案数据库系统对档案编研带来的影响。

    一、建立分布式档案数据库系统

    迅猛发展的信息高速公路给档案编研带来了诸多挑战和机遇,如何充分而快速地集合各方资源,缩短档案编研周期,提高编研成果质量,扩大编研成果传播的范围,是大多数档案编研工作者关注的普遍问题。分布式档案数据库系统为编研提供了资源存储的仓库——数据库、成果生产的平台——系统、成果共享的渠道——网络,有利于帮助档案编研工作更好地适应和利用网络环境。

    (一)分布式档案数据库系统

    1.分布式档案数据库系统的概念。分布式档案数据库系统是由分布式数据库系统发展而来的。分布式数据库系统是由分布于多个计算机节点上的若干个数据库组成,每个子数据库系统各自独立,都拥有各自的数据库、中央处理机、终端以及局部数据库管理系统。分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个节点之上的。[1]分布式档案数据库系统就是以档案馆(室)档案数字化成果为基础建立数据库,并将其作为分布式档案数据库系统中的子数据库,通过计算机网络将各子数据库在逻辑上连接形成庞大的数据库。不仅如此,各档案馆(室)的人力资源也通过计算机网络互相连接,促进“死”的档案资源与“活”的人力资源的有机结合。

    2.分布式档案数据库系统的可行性。(1)物理分布与逻辑结合相统一。分散的档案馆(室)就像是分布在不同地理上的节点,网络在虚拟形态上将其连接并构成逻辑上的一个整体,从而构成分布式档案数据库系统最基本的几个点,在物理上分散,在逻辑上属于一个整体。(2)档案数字化与电子档案资源的积累为建立子数据库奠定了基础。分布式档案数据库系统最重要的部分是子数据库内的数据,这些数据由档案数字化成果以及正在不断接收的电子档案组成。全国各省市各级各类档案馆(室)多年来在档案数字化方面取得的成果是最重要的组成部分。南宁市档案局2011年采集了4500分钟的《南宁新闻》电视数据,完成大概51万张A4幅面档案扫描图像[2];2012年上半年共加工完成88916件实体档案611550页(A4)成品图像[3];2013年完成馆藏纸质档案扫描加工60万页,完成民国档案33607页扫描数据的检查验收[4]。档案馆(室)的档案数字化已成为一种必然的同时,档案馆(室)生成和接收的电子档案数量也在逐年增加。正是这些源源不断的档案资源每天为分布式档案数据库系统的子数据库注入新的内容,并使子数据库日益丰满。(3)自主管理,特色经营。每个档案馆(室)管理着自己的档案资源,通过构建有自己鲜明特色的子档案数据库使得数据库系统中的每个“节点”都有别于其他“节点”,实现资源和人力的共享和互补。

    (二)分布式档案数据库系统包含的主要模块

    分布式档案数据库系统是一个庞大的综合体,由许多不同功能的模块构成,设计者可根据不同的服务目的选择设置不同功能的模块。对档案编研工作而言,分布式档案数据库系统主要包括受众模块、档案原文数据库模块、专家模块、编研模块四个主要模块。

    1.受众模块。受众模块的主要功能是在展示档案编研成果的同时,为档案编研成果利用者服务。当前,档案编研成果存在的一个普遍问题就是社会利用率不高,主要利用者为机关团体、企事业单位、领导、研究人员等单位和个人,其他广大的社会群众对其认识和利用的程度不高。受众模块通过接收受众在阅读档案编研成果之后产生的意见、建议、需求等反馈信息,不仅可以促使档案工作者有效地提高档案编研成果的质量,也能更大程度地满足社会用户的需求,克服了编研与需求脱节的弊端。

    2.档案原文数据库模块。档案原文数据库模块是子数据库数据的集合,它是以各子数据库的数字化档案通过计算机网络虚拟联合构建的全文数据库。档案数据库分为档案目录数据库、档案内容简介数据库、档案原文数据库三种类型。由于档案目录数据库与档案内容简介数据库无法直接查找并获取所需的档案全文,不能满足用户的需求,而档案原文数据库是集档案检索与档案全文提供于一体,适应了用户精准和完整的信息需求。中国知网、万方数据库、超星、维普等全文数据库的相对成熟和广泛应用正是全文数据库受到用户普遍欢迎的典型案例。

    3.专家模块。专家模块中的专家实际上指的是档案编研工作者,主要包含两个部分,一是档案馆(室)的档案编研工作者,二是档案馆(室)聘请的各行各业的杰出专家学者。档案馆(室)的工作人员每天都要对档案数据库进行增容、管理、维护等工作,决定了其不可替代的地位。由于档案馆(室)接收的档案涉及各行各业,档案馆(室)工作人员不可能完全熟悉这些行业和领域,因此需要借助各行业、各领域专家的力量,对这些专业性极强的档案相关问题进行分析、研究和解决。

    4.编研模块。编研模块是档案从原材料转变为成品的模块。档案编研模块的功能不仅是为档案编研工作进行实时服务,档案编研工作者也可以按照专题分类进行档案编研前期准备。目前,档案数字化主要是纸质档案进行扫描后转化为数字化信息,成果主要为图片格式,不便于对档案原文数据库进行全文检索。因此,档案编研前期准备必须利用文字识别等技术对图片格式的档案进行可编辑转化,对不能识别的图片应手动转录。

    传统的档案编研成果存在表达方式以文字为主,叙述方式直白简单的现象。信息高速公路快速发展的今天,档案编研应改变传统方式,利用文字、图片、表格、数据、声像等形式进行组合排列,增加成果的吸引力。多种形式相结合的编排方式无疑给档案编研工作者的工作增加了难度,但如果以模块的形式进行编排则会降低难度。档案馆(室)可以请专业人士设计多种不同类型的编排模块,根据编研选题和选材的需要选择套用合适的模块,再通过修改和润色,就能形成丰富多彩、别具一格的档案编研成果,有效地避免了千篇一律。

    二、分布式档案数据库系统对档案编研的影响

    (一)分布式档案数据库系统对档案编研工作环节的影响

    1.受众模块对档案编研选题的影响。档案编研选题有三大要求,选题要“大而全”,防止“炒冷饭”,要“高层次”。“大而全”是指题目内容广泛,能给读者较大的选择空间;“炒冷饭”是指公布别人已经公布过的档案文献;“高层次”是指选题富有内涵,具有理论性和学术特点,能给读者理论指导和学术影响。[5]这些要求归结到一点就是要符合受众需求,能为受众服务。受众模块通过接收受众的反馈,可以帮助档案编研工作者分析总结出哪些选题价值更大、需求更迫切、更有市场,从而拟定“大而全”的选题。受众模块也是档案编研成果的展示模块,包含了一定时间段、一定国家、地区内所有的档案编研成果,通过检索主题就可以避免“炒冷饭”。档案编研成果服务的对象中,各类学者和研究人员是其重要组成部分,他们对档案编研成果的要求是内涵深厚、学术性强。档案编研工作者也可以根据自己的工作实践,结合分析这类受众的反馈,确定“高层次”的选题。

    2.档案原文数据库模块对档案编研选材的影响。档案编研的选材包括档案的查找和挑选,档案原文数据库模块对档案编研的选材有深刻影响。过去,档案的查找与挑选是分开进行的,档案编研工作者在这两个程序上花费了大量的时间、人力和物力。档案的查找分为档案部门内的查找和档案部门外的查找。在档案部门内查找依据从直接全宗到间接全宗查找,根据选题的时间断限和涉及人物相关,不同档案类型查找。在档案部门外的查找则从图书馆、博物馆入手,对散落在社会上的档案进行查找,从新、旧著述中查找。如果说档案的查找是一项浩大的工程,花费了大量时间、人力和物力,那么档案的挑选就是一个在价值、真伪之间不断做取舍的过程。档案的选材要经过初选、复选和定选。由于不同的档案编研工作者的标准不一和交流得不够及时,很容易对同一份档案有不同的看法,在取舍之间面临两难选择。

    档案原文数据库模块中,档案查找就是档案检索,不需要大量的人手分头行动,也不需要大量的时间翻阅档案资料,更不需要在各地的档案馆(室)之间来回奔波。在档案原文数据库中,使用计算机既能实现高效的档案检索,也可以同时对档案进行挑选。在检索与挑选档案时,遇到有疑问的档案材料,还可直接进行在线交流,提高效率,保证效果。

    3.专家模块对档案编研成果的影响。档案是历史的原始记录,具有凭证和参考的作用。档案编研就是为了克服档案实体浩繁、档案信息芜杂、档案载体局限性等障碍,更好地发挥档案的信息价值。档案编研按照层次分为一次编研、二次编研和三次编研。一次编研和二次编研都属于层次比较低,功能比较单一,价值不大的成果。三次编研成果则是以档案为基础,经过分析研究形成的新材料,包含了编者的知识、认识、结论、建议等信息增量,其深度和广度更能满足用户(受众)的多方面深层次需求。然而在档案馆(室)的实际工作中,档案编研多以一次、二次编研成果为主,三次编研成果较少,在一定程度上影响了编研成果利用范围的扩大和增值的实现。这种情况的出现与档案馆(室)工作人员知识结构的单一有密切关系,专家模块就是为解决这一突出问题而设置的。

    档案馆(室)通过聘请各行各业的专家进行含有信息和价值增量的三次编研工作,可以研发出内涵更丰富、价值更大、受众面更广的编研成果,更好地实现“大而全”、“高层次”的选题要求。

    4.编研模块对档案加工编辑的影响。加工编辑是档案编研成果主体内容形成有机统一体的必经之路。加工编辑分为转录、点校、标题拟写、编排等程序。档案编研模块中,档案的加工编辑比过去更省时省力。首先,档案转录从电子版到电子版,不脱离电脑。其次,直接在电子版上标注、删节、统一格式。再次,文字编辑软件自带的纠错功能,有助于档案编研工作者纠错。最后,可以使用设计好的各种模板对文字、图片、音频、视频等多种形式的档案进行加工编辑和混合式编排。

    (二)分布式档案数据库系统对档案编研成果传播的影响

    利用分布式档案数据库系统编研的档案编研成果有文字式、图片式、数据式、声像式等编排形式,纸质出版物的形式已不能完全容纳所有形式的编排。如果以光盘、磁带等形式进行出版传播,会产生高消费,传播范围也会受到一定限制。如果档案编研成果的传播与分享能借助智能手机这个移动的客户端平台,将有助于减少传播费用,扩大传播范围,提高利用率。档案编研的产品除了展示在“受众模块”内让读者阅读之外,也可以存放在移动图书馆内让读者“借阅”。这意味着档案编研成果的阅读不再受限于档案馆(室)、图书馆等空间,也不再受周六周日等时间限制,人们可以在乘坐交通工具、等候客户、睡觉前等闲暇时间,都可以随时随地阅读档案编研成果。

    (三)分布式档案数据库系统对档案编研成果开放范围的影响

    档案每隔一段时间都要进行鉴定以决定销毁还是开放。南宁市档案馆2013年完成馆藏1983年以前形成的到期档案的开放鉴定,共鉴定档案全宗80个,档案1195卷又157件,其中向社会开放档案483卷又76件[6]。每一次鉴定后决定向社会开放的档案的数量非常可观,这对档案编研的影响也是巨大的。出于档案保密的原因,某些选题被迫搁置,关键性档案在选材时不得不被舍弃,档案编研成果只能作为内部资料,不允许对外公开等。分布式档案数据库系统的优势在于,只要文字数据有修改变动,档案原文数据库就能进行实时查询,对于缺少关键性材料的可以及时补充。对于被迫搁置的选题只要满足条件就可以再次启用,档案编研成果若满足对外开放条件则可以立刻通过受众模块进行开放,从而避免了在档案选材和编研成果传播上处置不当而带来不利影响。

    利用分布式档案数据库系统编研的档案编研成果应满足以下条件:首先,能满足受众的利用需求;其次,能利用网络环境形成大范围的传播;最后,档案编研成果的内容质量高,以三次编研成果为主。档案编研成果要满足这些条件还需要经历长时间的研究与实践,特别是在如何发挥档案休闲利用观的问题上要更加努力。如何使人们在基本需求得到满足的前提下,利用自由时间去阅读档案编研成果以满足个人的兴趣和爱好,达到休闲、消遣的目的,并使自身素质得到提高,应是未来档案编研发展继续深入研究的方向。

    参考文献

    [1]林真,黄建峰.以分布式档案数据库建设为核心构建档案信息资源共享体系[C].2008年海峡两岸档案暨缩微学术交流会论文集,2008:27-33.

    [2]南宁市档案局2011年上半年工作总结[2014-05-18].http://nnda.gxi. gov.cn/web/2011-07/104447.html.

    [3]南宁市档案局2012年上半年工作总结[2014-05-18].http://nnda.gxi. gov.cn/web/2012-07/106628.html.

    [4]南宁市档案局2013年上半年工作总结[2014-05-18].http://nnda. gxi.gov.cn/web/2013- 07/107657.ht? ml.

    [5]刘耿生.档案文献编纂学[M].北京:中国人民大学出版社,2007: 62-63.

    [6]南宁市档案局2013年工作总结[2014- 05- 18]. http://nnda.gxi. gov.cn/web/2013-12/107658.html.

    作者单位:广西民族大学管理学院

相关文章!
  • 基于企业文化的国企思想政治工

    陈广梅中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-02摘 要 新形势下,党对国有企业思想政治工作提出更高的要求,需要

  • 一次为中国革命延续火种的伟大

    朱强今年11月12日是我国伟大的革命先行者孙中山先生诞辰150周年。在孙中山先生早期的革命生涯中,有一段流亡海外的经历,这段经历见证了

  • 周强:在县域治理中发挥好司法

    大数据时代,司法案件运行情况成为县域经济社会发展的晴雨表。法院将海量案件信息进行大数据分析,从刑事案件判断治安状况,从民商事案件