浅论元数据与来源原则变革的深层次联系

    吴申艳

    摘要:元数据与来源原则的变革拥有密不可分的关系。因此,进一步把握元数据与来源原则变革之间的联系能够对来源原则的内涵和实践应用有更深刻的认识。本文从来源原则变革的产生、来源原则的发展、来源原则的成果三个方面探讨元数据在其中的作用程度,提出元数据是来源原则变革的诱因、来源原则变革成果形成的助力者、来源原则变革成果与社会实践的黏合剂。

    关键词:元数据来源原则变革

    Abstract: Metadata has a close relationship with the change of the source principle. Therefore, fur? therunderstandingoftherelationshipbetween metadata and the change of the source principle can have a more profound understanding of the con? notation and practice of the source principle. This pa? per is doing research from three aspects: the princi? ple of change, the principle of development, the principle of source achievements to discuss the role of metadata in the metadata is proposed, the princi? ple of change adhesive inducement, source forma? tion, power source principle change source principle change and social practice.

    Keywords: Metadata;Origin principle;Innovation

    一、引言

    来源原则从20世纪初起就被国际档案界公认为档案专业的基本原则,是当前各国公认的档案整理理论。因此,来源原则的发展和变迁一直受到档案学者的关注。不可否认的是,进入电子文件时代之后,来源原则出现了不适应性,传统的“实体来源”概念受到了挑战。为了让来源原则在电子时代仍然具有生命力,档案学者提出了“概念来源”,即电子时代档案来源的概念不仅指文件的形成机关,而且还包括其形成目的、形成活动、过程、处理程序和职能范围等。

    但是“概念来源”的提出也带来了新的难题——“概念来源”过于抽象并且难以现实操作。于是档案学者将元数据引入了档案领域,提出在电子文件生成、管理和利用的全过程中始终注重掌握元数据,并将其与文件的内容信息一同保留下来,从而成功地解决了“概念来源”如何施行的问题。

    然而,笔者通过查阅来源原则变革的相关文献发现档案学者在论述来源原则的变革时,只是简单提出元数据与来源原则的变革拥有密不可分的关系。但却并没有完整描述清楚元数据与这种变革到底有哪些深层次联系,即元数据在来源原则变革的产生、来源原则的发展、来源原则变革成果及其应用等阶段具体扮演着什么角色,以及在各个阶段的作用程度如何。笔者认为,元数据与来源原则变革的深层次联系的研究是非常必要的,不仅能够促使档案学界对来源原则变革过程和成果等方面有更深刻和清晰的认识,更能够使档案学者通过元数据概念更好地解释“概念来源”的内涵以及通过元数据技术更好地推进“概念来源”的实际操作,增强来源原则在电子时代的生命力。

    二、元数据是来源原则变革的诱因

    (一)元数据概念在档案领域的引用

    元数据是信息技术领域的名词,其在档案领域的引用缘于档案学者试图通过元数据来解决概念来源的现实施行,档案学界对元数据的定义有三个发展阶段:元数据[1]首先由电子文件专家戴维比尔曼引进电子文件研究领域,这一阶段档案学者将元数据在信息技术领域的定义直接移植到档案领域,即将其定义为描述数据的数据,即元数据的含义与计算机技术领域中的元数据的含义是一致的。第二阶段档案学者将其定义为著录元数据,这一阶段元数据在檔案领域有其更为专指的性质和含义,即元数据是关于单一电子文件和文件组合的背景及其相互关系的结构化著录数据,这里的著录元数据被档案人员解释为著录信息。第三阶段档案学者将其定义为电子文件管理元数据,认为元数据是自始至终地描述文件的背景、内容、结构及其管理的数据。

    从元数据定义在档案领域的三个发展阶段可以看出:一方面元数据本身与电子文件的背景、内容、结构等方面有着密不可分的关系,包括电子文件的格式、题名、关键词、作者、版权信息等数据,这些涉及电子文件背景、内容、结构等信息的数据与文件的来源息息相关。另一方面,随着元数据涵义在档案领域的具体化和专指化,档案学者对元数据的理解更加深刻、应用更加便利,从而满足了来源原则需要很好地描述电子文件来源信息的要求。因此,笔者认为元数据在档案领域的引用很好地促进了“实体来源”向“概念来源”的变革。

    (二)元数据以电子文件为桥梁影响来源原则

    电子文件时代,文件的来源联系更为复杂,无法像纸质文件一样具体到某一实实在在的机构、组织或个人。[2]大量的文件管理系统、各种各样的文件载体以及多元的文件形成活动存在于众多办公点,分散在不同的地理空间,也跨越不同的时间、不再对应内部的基层组织机构。计算机和电信革命急剧加速了这种分散化和分离化,业务职能现已跨越所有形态的结构或组织界限。因此,来源原则在电子时代发生变革成为必然,从而有了“概念来源”的出现,既能使电子文件整理适合来源原则的“来源同一性”内涵,又能解决电子文件来源分散的矛盾。

    但笔者认为,电子文件的出现虽然是来源原则变革的最显而易见的缘由,但究其根本还是元数据在起决定性作用。相对于纸质文件,电子文件的形成与计算机密切相关,因此形成了数量庞大、内容复杂依赖机读的元数据记录。通过这些元数据记录我们并不能轻易地识别出不同电子文件的传统意义上的“来源”联系,从而对传统意义上的“实体来源”造成了冲击。因此,正因为电子文件比纸质文件拥有复杂的背景、内容、结构及管理要求,“实体来源”才会显得不适用,所以作为描述电子文件背景、内容、结构、管理要求等内容的元数据才是来源原则出现变革的真正诱因,是来源原则变革的本质所在。

    三、元数据是来源原则变革成果形成的助力者

    (一)实体来源向概念来源的转变需要利用元数据进行解释

    来源原则变革的一个显著成果就是“实体来源”向“概念来源”的转变。“概念来源”是对“实体来源”的继承和发展。在保持“来源同一性”内涵的前提下将“来源”的定义进行新的阐释以适应电子文件整理的需要。[3]冯惠玲教授认为“这个来源就是指文件的形成过程及背景,即文件是由谁,在什么条件下,运用哪些数据,为了什么目的,采用了何种结构形式的等方面的情况”。通过冯惠玲教授对“概念来源”的论述可以发现[4]“概念来源”的实际操作需要档案工作者获取与电子文件生成、保管、利用相关的各种数据,这也就是所谓的元数据。没有元数据的出现,档案工作者无法细节性地描述电子文件的来源信息,所以,元数据的出现为我们解释何谓“概念来源”提供了便利,成功地使“概念来源”更加具体化。

    (二)“概念来源”的应用对元数据的依赖性

    1.元数据贯穿于电子文件全程管理的各个阶段。电子文件的全程管理思想就是指,对电子文件从产生到永久保存或销毁的整个生命周期进行全程管理。[5]从纵向来看,电子文件的整个生命周期可以划分为电子文件管理的系统设计、电子文件形成、电子文件运行、电子文件维护四个阶段。在电子文件管理系统设计阶段需要设计出元数据模型,从而对系统捕捉哪些方面的文件信息做出规定。在电子文件形成阶段和电子文件运行阶段,文件的产生以及流转会按照事先规定好的元数据模型产生一个与之相对应的不断补充的元数据表,通过该元数据表可以对解读该文件的内容、背景、结构信息、操作过程等。电子文件的维护阶段是指对电子文件的原始记录性进行维护,而元数据则是必不可少的依据,离开了元数据,电子文件的原始记录性无法得到保障。因此,我们可以发现从电子文件管理的系统设计到电子文件的最终维护都少不了元数据的参与,它贯穿于电子文件全程管理的各个阶段。

    2.元数据技术能够实现电子文件的全程管理。电子文件时代,适用于纸质文件全程管理的方法和手段已经无法有效解决电子文件这四个阶段的全程管理,因此我们需要寻求创新和突破。基于元数据在电子文件全程管理中扮演着至关重要的角色,所以能够实现电子文件全程管理的突破点就在于元数据技术的应用。

    之所以说元数据技术是电子文件全程管理中的关键,是因为它能够动态功能与静态功能相结合全面监管电子文件的形成过程。[6]静态功能是指元数据的静态映射。元数据中的数据记录与电子文件中的信息内容、背景、结构信息构成了一一对应的映射关系,因此,元数据就可以完整地记录电子文件的原始状态和生成环境。元数据的动态功能是指它可以动态地获取电子文件管理的各项信息。[7]国际《都柏林核心研究项目》将元数据的研究作为解决网络环境查找信息的重点,根据著录信息的类型和范围,将元数据分为三部分:与文件内容有关的数据、对文件负有责任有关的数据以及对文件说明的有关数据。通过这样科学的分类,可以达到对电子文件全方位的描述和著录,从而动态地获取电子文件管理的各项信息。因此,没有元数据技术在电子文件全程管理中的应用,来源原则变革成果的应用也就成为了纸上谈兵。不可否认,不具有任何可操作性的理论成果注定会被世界淘汰。所以,笔者认为,将元数据和元数据技术称为来源原则成果形成的有力助手完全不为過。

    四、元数据是来源原则变革成果与档案工作实践的黏合剂

    (一)增强了来源原则在电子文件时代的生命力

    电子文件时代,一方面我们无法依据“传统来源”原则去掌握电子文件的来源联系,[8]另一方面“概念来源”虽然能通过重新定义来源解决“传统来源”概念无法解决的矛盾,但其内涵又过于抽象和难以把握,电子文件之间的联系更多是计算机之间的逻辑链接,因此“概念来源”在实际中的具体操作成为了难题。

    而元数据的出现正好解决了这个难题。档案界通过不断努力推进档案资料元数据的建设来获取电子文件生成、保管、利用相关的数据。[9]例如,以权利元数据、重要属性元数据、特殊类型数字资源等为代表的元数据元素的不断扩展,为更全面地描述电子文件的来源及不同文件之间的联系带来了便利。再例如,元数据语义技术的发展能促进电子文件内容信息的识别、语法的匹配等等,帮助元数据更好地识别出不同电子文件的来源信息。

    总之,元数据建设的不断进步,包括元数据标准的规范化、元数据元素的不断充实、元数据技术的不断进步等等都间接地为增强来源原则在电子文件时代的生命力作出了贡献。“概念来源”以元数据为媒介在坚持并发扬光大来源原则基本精神的同时更加灵活、巧妙地解释来源概念。一方面能够推动来源原则的理论发展,让来源原则的内涵能够被人们所理解和把握。另一方面在社会实践中,也使来源原则获得了更广泛的适用范围和更广阔的理论指导空间,很好地适应了电子文件的新特点,使来源原则在实践中的操作性更强。

    (二)拓宽了来源原则在档案工作各个环节的适用性

    传统来源概念主要适用于档案整理环节,档案工作者以文件的“来源”来对文件进行分类和组合。[10]而元数据支撑下的“概念来源”则不仅仅适用于档案整理环节,还扩充到鉴定、检索、利用等环节,甚至在这些环节的重要性已经超越了档案整理环节。

    之所以来源原则在除档案整理环节之外的其它环节也能有所适用,是因为为了完整描述电子文件之间的虚拟化来源联系,伴随着文件整个生命周期的元数据都会被保存,而这些元数据正是使得来源原则在档案工作的其他环节也发挥重要作用的关键所在。例如,与文件相关的描述型元数据集,如目录记录、专门索引、用户注解等元数据集就可以在档案检索环节发挥重要作用。档案界可以通过大量的描述型元数据集在档案管理系统中实现来源检索,缺乏了元数据,电子文件之间复杂的虚拟化联系无法被描述,来源检索也就没法实现。除了档案检索环节,魏雁飞学者认为现代职能鉴定理论要求将鉴定的着眼点放在文件形成者的职能、任务和活动上,也就是把鉴定视角“置于一种以文件前后关系为基础,以来源为中心的框架之中,而不是置于以内容为基础的历史文献框架之中”,由上至下地判断档案的价值的这种思想实际是来源原则在档案鉴定领域的应用。[11]在档案利用环节,以档案元数据核心集,即对档案自身形成过程中“历史联系”信息的完整描述信息为依托,建立基于来源的用户个性化服务。档案元数据核心集便于档案资源组织、便于档案资源身份验证,能够将检索到的同一来源文件与目标用户自身属性相结合,从而满足档案用户个性化需求。

    五、结语

    元数据作为伴随文件整个生命周期的数据信息,是对文件形成过程的完整描述。在电子文件时代,它极大地方便了档案工作者对文件,特别是电子文件来源联系的把握。在来源原则到新来源观的整个创变过程中发挥着不可替代的作用。它是来源原则变革的诱因、是来源原则变革成果形成的助力者、也是来源原则变革成果与社会实践的黏合剂。自元数据引入档案领域以来,档案学者一直在积极探索档案领域的元数据建设与发展,形成了众多技术成果和理论成果,这些理论和成果为更好地解释和在实践中应用来源原则发挥了极大地作用。没有了元数据,来源原则的变革也就缺乏了动力,因此未来笔者也希望元数据能够在档案领域发挥着更为宝贵的作用,能够推动档案学走向更高的巅峰,成为档案学科与其他学科融会贯通的典范。

    注释及参考文献:

    [1]于斌,周晶.浅析元数据概念在档案领域中的发展[J].机电兵船档案,2015(1):45-47.

    [2]何嘉荪,楼淑君.后保管时代基础理论研究之三——新来源观解析[J].浙江档案,2013(3):9-14.

    [3]于斌,周晶.浅析元数据概念在档案领域中的发展[J].机电兵船档案,2015(1):45-47

    [4]特里·库克,李音.对数字时代来源原则的反思[J].档案学研究,2011(1):82-85.

    [5]叶晓林.电子文件全程管理之思考[J].档案学研究,2005(1):46-50.

    [6]黄萃.基于元数据的电子文件全程管理[J].档案管理,2003(4):16-18.

    [7]徐维.元数据:电子文件管理的关键所在[J].山西档案,2000(4):11-14.

    [8]祭鸿雁.“新来源观”:实质与意义探析[J].档案学通讯,2003(1):21-25.

    [9]刘建华,张智雄.保存元数据的发展趋势研究[J].图书馆杂志,2016(6):10-16.

    [10]魏雁飞.来源原则在电子信息化时代的传承与创变[C]//2008年档案工作者年会.2008.

    [11]田伟,韩海涛.发挥档案元数据核心集作用推进“互联网+档案”建设[J].档案,2016(6):5-9.

相关文章!
  • 探究国有企业党委办公室的参谋

    张建萍中图分类号:D267 文献标识:A 文章编号:1674-1145(2019)5-053-02摘 要 党委办公室属于企业的党务职能部门,直接受国有企业党委的

  • “城中村”改造:挑战与出路

    易信改革开放30多年以来,借助城市化和工业化双引擎的推动,中国在经济社会建设方面取得了举世瞩目的成就。然而,伴随城市化和工业化的进

  • 薰衣草全身都是宝 火遍全国

    相关专家称,未来的几十年中,有4种“花”商机独特,它们历史悠久,当下热销,前景广阔。种植、观赏、深加工等等全产业链上都有财气,值得关注。