基于网络的开放档案目录研究

    武 琳 纪舜丽

    基于网络的档案开放目录是指档案网站提供的以馆藏为检索内容,以档案信息为处理对象并以计算机网络作为传输载体、以原文信息或著录项信息作为检索结果的网络信息检索系统。这是档案利用工作从手工检索过渡到计算机检索的重要表现形式。利用者通过网络对档案馆数据库的档案信息实现远程检索,从而达到在线利用档案的目的。档案开放目录比较全面反映档案馆馆藏信息,“不仅可以使用户进行远距离检索,降低检索成本,提高检索效率,而且可以及时反映档案信息的变化情况,不存在时间上的延迟”。

    一、我国档案开放目录的发展现状

    目前,我国大部分档案网站都推出了档案开放目录,有些还停留在原始的目录浏览阶段,为纸质版本的数字化,但多数已建立起具有查询功能的检索系统。国家级档案馆的在线数据库尚未建立,从省、市、区(县)三级档案馆网站的档案开放目录来看,各地建设水平参差不齐,部分系统有一定亮点,但整体质量不高。

    (一)国内开放目录典型调查

    本文以北京、上海、辽宁、沈阳、绍兴和青岛等地的档案开放目录为典型案例,进行了调查统计,见表1。

    (二)典型案例分析

    除以上几个网站外,对比全国多个开放目录的内容及功能可知:

    

    1、档案种类

    文书档案是档案开放检索的主体,但提供全文使用的网站很少,部分网站对这些文书进行扫描,以图片格式保存后提供线上利用,如北京市档案馆的全文阅览系统。其次,照片、录像开始加入到系统中,有些照片提供免费查看并可下载,视频的可链接率较低,但可看出档案馆开始重视对多媒体信息的提供。

    2、数据内容

    目前几乎所有的档案馆都提供革命历史档案、民国档案及建国后档案,政务色彩较浓,对特色档案的开发不够。北京与沈阳的劳模档案、沈阳与上海的工商档案、北京的诉讼档案、大连的调配书、湖北的辛亥革命档案以及福建省档案馆包括体育、地政、海关、禁毒、闽台关系、名老中医等多达59个专题档案材料的提供给各级档案馆开了个好头,但就全国范围来讲,专题档案检索依然任重而道远。

    3、著录层次

    很多系统都在档案题名上建立了二次链接,但著录项大多数为责任者、形成时间、发文单位、文件编号、档号等几项,缺乏其他描述。然而也有比较出色的,如上海档案馆网上检索服务系统。对每个文件,系统都提供了详细的文件著录项目,并可链接查看所属全宗、类别、案卷的详细信息。

    4、检索功能

    档案检索大体可分为案卷级和文件级两种,案卷级在数量上比文件级占优。系统的设置通常将这两个类别分开,利用者需要在不同的数据库进行检索。上海的查询系统给这些数据库提供了统一的检索入口,利用者可以选择案卷级、文件级或者对所有档案进行查询,不受档案著录层次的限制。另外值得一提的是,上海开放目录采用文件夹内层层浏览的形式,使利用者在直观感受档案组织层级的同时,随时在每一层级内查询所需档案,既增强了灵活性,又可提高目标针对性。

    5、检索效率

    虽然几乎每个系统都提供了关键词检索,但目前所谓的“关键词检索”实质上只是对文件标题进行检索,且加上著录质量总体不高,特别是很多照片档案都没有详细描述,在这种情况下,检全率低成为各系统普遍存在的问题。

    6、提供方法

    由于库藏量小,特别是数字化信息在系统中所占的比例还很小,很多开放目录都无法提供高吸引力的档案资源。绍兴市档案信息网通过开放目录与网站栏目“视频点播”的对接,实现“绍兴新闻视频库”库藏的在线观看,与辽宁的“声像档案”出自同一原理,这种站点资源与目录系统的整合值得注意。

    7、资费标准

    很多网站提供了部分档案的免费查看或下载,但也有部分档案馆对档案实行有偿使用。如浙江省和青岛市档案馆就对大多数馆藏实行利用收费。以青岛市档案馆为例,利用者在该档案馆网站进行注册并以现金、查档卡、邮局汇款或银行汇款等方式交纳查档费后成为高级会员,可通过“留言板”或“在线提交查阅需求”要求查阅所有开放的档案资料全文信息。这种行为目前受欢迎程度不大,但是否具有市场前景关键还在于档案馆能否提供高质量、高实用性的档案材料。

    二、构建我国档案开放目录的途径

    (一)内容选择

    1、把握利用需求,有选择地数字化馆藏

    “根据了解,目前一般区(县)档案馆馆藏量在12-15万卷,按每卷档案50页计算,大约共600-750万页。如将这些档案全文数字化,按照目前市场价格(扫描和输入0.25-0.4元/页)计算,一个区(县)级档案馆全文数字化将需投入150-200万元。”然而,“‘十五期间,中央财政对县级公共图书馆、文化馆基础设施共投入136.4亿元,比‘九五期间增长约50%。而对比之下,同期中央财政对县级国家综合档案馆的投入则为零。”在此情形下,对所有馆藏档案进行全文数字化显然脱离实际。因此。档案目录数字化应成为档案数据库建设的首选环节,然后逐步扩展到档案原文的数字化。档案馆必须正确把握本馆的利用需求,根据目前档案利用的实际情况有选择地进行数字化。强调突出馆藏特色,把有限的资源用在最需要的地方。

    2、整合档案资源,增加民生档案的比例

    “民生档案包括社会保险档案、医疗保险、最低生活保障档案、婚姻登记档案、房地产档案、拆迁安置档案、人口计生档案、药品食品监督档案、环境检测档案、土地承包和林权改革档案等百姓关注、涉民密切的20余个门类档案。”在过去很长一段时间内,档案馆与民众的生活一直处于相对脱离的状态。造成这种局面的原因之一便是档案部门长期注重对政府机构文书的收集,缺少对社会变迁的记录,另一原因是档案部门缺乏服务意识。但随着近年来群众维权意识的提高,档案意识也随之增强,到档案馆查档解决实际问题的趋势越来越突出。据四川省档案馆查阅利用室的工作人员介绍,2007年“查阅社保养老、房屋产权、婚姻登记档案的人员增长特别明显……以成都市为例,2007年该市档案利用人(次)增长幅度达到50%,金牛区、锦江区、青羊区甚至达到了60%以上。从生老病死到衣食住行,民生档案与百姓生活渐行渐近。”0这种现象在全国其他地方档案馆也普遍存在,据张家港市档案馆利用情况的统计,“2005年和2006年的个人利用比例分别为87%和81%。……民生类档案的查阅则在此期间从579卷次/年上升到5740卷次/年,增幅达十倍之巨,并且在‘十五期间一直高高占据档案利用量榜首之位。”这种个人与机构查档比例大逆转的出现反映了群众对档案利用需求的一种新趋势,说明民生档案正成为群众关注的热点。

    3、多媒体检索

    档案载体类型多种多样,常见的包括纸张、缩微胶片、照相印刷品、实物、电影胶片、磁带、声音磁盘、录像带、视频卷带等。将载体类型作为其基本检索途径,利用

    者可以选择其所关心的一种或几种载体类型限制检索结果,专指度强,检索效率高。目前,我国还很少将载体类型作为检索途径(上海很可能是全国惟一的一家),少数网站建立了独立的照片档案目录,但收录照片数量很少,且缺乏详细著录。在目前的技术背景下,文字是最主要的检索手段,图像检索还未得到大范围推广,多媒体文件只有配合详细的文字描述,才能取得用户预期的查询结果。因此,档案馆应加强多媒体档案著录,早日实现真正意义上的多媒体检索。

    (二)系统功能方面

    1、完善系统使用指南

    使用帮助工具的提供是国外网站优于国内网站的一个明显特征,这在专业检索系统的使用中尤其重要。特别是在大众较为生疏的档案领域,一定的提示与引导将大大提高检索的效率。从我国各档案馆网站提供的开放目录来看,利用者明知所需档案存于库中却难以检出的情况非常普遍。因此,当利用者输入关键词但没有得到理想结果时,系统需要有相应的自动响应,提示查询者更换主题或提供相似检索词,以改善查询结果,使利用者耐心在系统上停留。

    2、编制索引辅助查询

    除检索帮助及使用指南外,方便利用的最便捷方式是提供专题目录,并编制各种索引。主题浏览和索引利用都是提高利用效率的方法,尤其对于不熟悉库藏或不擅于编写检索式的利用者更是如此。开放目录索引可以以全宗号或拼音、笔画为序建立树型连接,让利用者对某一机构形成档案或某一专题所有相关材料有一个总体把握,符合档案的来源原则,既起到引导作用,又使部分利用者不至因检索式编写不当而导致漏检。由于检索系统建设还处于初期,所存条目少,这个问题目前在我国档案开放目录中表现不明显,但随着系统内容逐渐增加,索引的编制将越来越迫切。

    3、实现系统无缝链接

    自档案馆开始网站建设以来,“专题展览”、“特色展厅”等栏目一直是各档案馆网站的亮点。但档案开放目录与网站其他内容处于完全分开的两套系统,目录与网页信息无法实现相互链接,使得很多存在于网络的全文资料无法于库内检索时直接获得,利用者需要两边同时搜索才可确定所需信息是否存在。因此,在检索系统自身建设的基础上,如何实现网上展览材料与查询系统的无缝链接是档案开放目录建设的一大课题。

    4、采用标准兼容技术

    目前提供档案开放原文在线阅览的网站不多,北京市档案馆的档案全文检索阅览系统是其中较为典型的一个。虽然该系统目前只提供了北平市五个部门专题目录数据库近152万页的数字化档案,但也可以看出开放目录数据库将提供全文利用的趋势。惟一的不足是,在该系统上查看档案无论是图片还是文档都要安装原文浏览的Accex控件,而这些插件的安装只有对IE浏览器重新设置才不至于被~dOW$拒绝。这是许多利用者较为反感的事情。因此,使用与浏览器标准兼容的技术,消除利用障碍,是档案开放目录检索系统建设应注意的另一问题。

    5、统一人口,跨库检索

    清代档案库、民国档案库、革命历史档案库及现行a公开文件目录作为最常见的四个数据库构成了我国档案馆网站的信息检索系统,而前三个数据库一般是以档案开放目录的形式存在。各网站共同的特点是利用者在检索时只能选取其中的一个数据库进行查询。如果利用者检索的专题其时间连续性较强的话则需遍历若干个数据库才能得到完整的材料,这就给利用者带来很大的不便。因此,提供统一的检索入口,实现跨库检索是目前档案信息检索系统建设需要努力的方向。

相关文章!
  • 基于企业文化的国企思想政治工

    陈广梅中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-02摘 要 新形势下,党对国有企业思想政治工作提出更高的要求,需要

  • 一次为中国革命延续火种的伟大

    朱强今年11月12日是我国伟大的革命先行者孙中山先生诞辰150周年。在孙中山先生早期的革命生涯中,有一段流亡海外的经历,这段经历见证了

  • 周强:在县域治理中发挥好司法

    大数据时代,司法案件运行情况成为县域经济社会发展的晴雨表。法院将海量案件信息进行大数据分析,从刑事案件判断治安状况,从民商事案件