标题 | 描述性元数据MODS特性及应用 |
范文 | 张娟 收稿日期:2011-04-14 〔摘要〕MODS是美国国会图书馆提出的一种描述性元数据,是在MARC基础上发展起来的,用来对数字资源进行描述。本文分析了MODS产生背景、内容、特性、功能及国外应用情况。 〔关键词〕MODS;元数据;文献编目 DOI:10.3969/j.issn.1008-0821.2011.08.018 〔中图分类号〕G254.364 〔文献标识码〕B 〔文章编号〕1008-0821(2011)08-0069-04 Properties and Applications of MODS Metadata Zhang Juan (The Capital Library of China,Beijing 100021,China) 〔Abstract〕MODS is a new descriptive metadata produced by the Library of Congress which is based on the MARC for digital resources description.This paper analyzed the background of MODS,its content,merits,features and applications. 〔Key words〕MODS;metadata;catalogue MODS (Metadata Object Description Schema,元数据对象描述模式),是美国国会图书馆网络发展部和标准办公室于2002年6月提出的一种描述性元数据。MODS是以MARC21的元素和语义学为基础,用XML语言描述的元数据规则,作为一种新兴的资源描述格式,以其独特的优势受到业界人士的关注。MODS在书目描述中适用于网络环境下多种信息资源的描述,它主要应用于图书馆,也可为各种目的使用。MODS标准已经被美国国家信息标准化组织(NISO)通过,MODS的第一版MODS1.0颁布于2002年6月,之后的版本有MODS2.0、MODS3.0和MODS3.1,目前最新的版本是2010年6月公布的MODS3.4版[1]。 1 MODS的产生背景 数字技术和网络技术的发展使得文献信息资源形式发生了重要变化,除传统的纸质文献、缩微资料、录音资料等,电子资源和网络资源迅速发展,成为图书馆文献信息资源的重要组成部分。与传统文献形式不同,电子资源和网络资源以数字化形式存储,由于没有固定的载体形态,基于载体的传统的文献编目格式和规则已不能适用于电子和网络资源的编目。尽管MARC提供了著录电子资源的相应字段,但由于仍是针对传统文献特点而制定,不能较好地对网络资源进行描述。为了解决迅速增长的网络资源的描述问题,美国OCLC和NCSA于1995年提出制定了DC元数据,用以描述资源对象的语义信息,DC以其简单灵活的特点成为众多数字图书馆资源描述的标准。如今,基于MARC格式的传统馆藏书目数据库与基于各种元数据的数字资源描述数据库都已具备相当规模,而且还将长期存在下去,如何实现描述性数据库的整合问题以及异构数据库的检索问题显得十分迫切。建立一种能同时适用于传统文献和数字资源描述的元数据标准成为一个新的方向。 MODS是国会图书馆改造利用MARC的一个创新,不仅能兼容现有的MARC记录资料,而且可以创建原始资源的描述记录,是针对MARC和DC的缺点发展而成的。一方面,MODS包含MARC21的1个子集,MODS的元素对应于MARC的字段和子字段,将MARC21的上百个字段进行了优化组合,同时又比DC元素丰富,满足了原始编目的描述需要。另一方面,MODS使用XML语言,扩充性能强,异构数据间的互操作性好,适合网上的各种数据交换,满足了对数字资源的描述。MODS虽是为图书馆的应用而设计,也可适用于其它资源的描述。 2 MODS的语义和句法 元数据包括语义和句法两个层面,相当于传统文献编目的著录项目与著录格式。对著录项目的选择就是如何选择一种描述性元数据来表达语义,而对著录格式的选择是如何选择一种结构性元数据来提供句法[2]。MODS语义来自MARC,采用元素、子元素和属性的三层定义结构,由2个根元素和20个顶级元素构成,2个根元素分别是MODS和MODScollection。每个元素由若干子元素组成,元素具有元素属性,个别元素没有子元素和属性[3]。 每条记录必备至少1个元素,即“题名信息”及其子元素“题名”,所有元素和子元素都是可以重复的,但属性不可以重复,元素和属性间的次序不固定,显示次序由样式单(stylesheet)来控制。20个顶级元素分别是:题名信息(titleInfo)、主题(subject)、名称(name)、分类(classifacation)、资源类型(type of resource)、相关文献(relatedItem)、体裁形式(genre)、标识符(identifier)、来源信息(OriginInfo)、读者对象(targetAudience)、语种(language)、测绘资料(cartographics)、载体形态描述(physicalDescription)、检索环境(accessCondition)、文摘(abstract)、扩展(extention)、目次(tableofContents)、记录信息(recordInfo)、附注(note)、馆藏位置(location)。 在句法上,MODS采用的是W3C组织(WorldWide Web Consortium) 的XML Schema语言。XML最突出的优点首先表现在:它仅提供使用标记和符号的句法和规则,允许开发者“发明”自己的标签,至于标签的名称和实际含义留给开发者根据应用的需要作适当的选择,这就使得XML能满足多种行业信息交换的需要,为各行业设计具有各自特色的解决方案提供了可能。其次,XML关注的不是数据在浏览器中如何布局和显示,而是关注于怎样描述数据内容的组织和结构,以便于数据在网络上进行交流和处理[4]。XML改变了Web信息的发布方式,适用于网络环境下各种电子资源的处理,提供了对Web信息结构化管理的可能性,使得图书馆参与网络信息资源组织和整理的环境更为有利。 3 MODS的特性 3.1 在继承MARC21语义的基础上又有所扩展 MODS的语义直接来源于MARC,显示了与MARC良好对应关系。同时将MARC中的部分元素进行了优化重组,将重复的字段和子字段去除,将部分表达内容相似的子字段进行了合并,MODS数个元素可以共享一个选择性的识别号属性,以方便元素间的连结[5]。因此与MARC比较,MODS结构较为简单,同时由于沿袭了MARC描述详尽的优点,增加了适用于数字对象的元数据,用于扩展的元素以及管理性元素。 3.2 采用XML句法,灵活性、扩展性、通用性好 由于MODS采用XML语言,利用XML的句法和规则可以自行定义元素,能够满足各种行业信息交换的需要,具有良好的扩展性。由于MARC基于ISO 2709格式,识别必须依赖于专门的软件,其结果无法直接应用于网络。MODS采用XML schema语言,既克服了传统DTD的不足,又为图书馆摆脱数据格式的转换困境提供了可能。XML的简单使其易于在任何应用程序中读写数据,可以更容易的与Windows、Mac OS,Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并分析,并以XML格式输出结果。由于XML语言的通用性,MODS可以实现与DC等多种元数据的整合与转换。 3.3 可用于多种信息资源的描述 MODS是为图书馆编目专门设计的元数据,主要用于对图书馆各类资源的描述,除用于电子资源编目外,它还可以在各种数字图书馆项目中担当不同资源描述格式的角色。由于MODS的语义继承了MARC良好的描述特性和XML语法的灵活性,MODS既能涵盖原始的MARC记录,也能对网络信息、音乐、视频等各种形式的资源进行描述。 4 MODS的功能 MODS作为一种描述性元数据格式,不仅可以用来对各类文献资源进行描述,还具有其它的一些功能和用途。 4.1 可作为Z39.50的特定格式 目前的MARC记录是通过Z39.50协议来实现数据间的通讯和检索操作。Z39.50协议是一个基于C/S结构的网络应用层协议,它通过对编码方式和内容语义的标准化来实现不同系统间的互操作。Z39.50的互操作方案要求各数据库支持统一的搜索语言,或在本地语言和协议语言间能相互转换,它要求各数据库在字段级别实现统一,灵活性较差。同时Z39.50是基于TCP/IP的底层协议,传输层协议是基于TCP/UDP的编程,不能提供HTTP支持,不能在WWW上实现。Z39.50的改进版ZING(Z39.50 International NextGeneration)旨在发展基于Z39.50与Web技术(如XML、SOAP和HTTP)的查询检索功能的附加值,它所定义的检索服务主要回溯检索特定的元数据模式,使用了XML,所以它需要一种与图书馆的MARC兼容的XML元数据模式。MODS由于其灵活性和XML的应用,可能有潜在作为Z39.50下一代通用制定格式。 4.2 可作为METS的延伸标准 元数据编码和传输标准(METS)是1990年以来一些数字化项目中发展而来,在2001年数字化图书馆委员会召开的几次专家会议中制定。它的开发是为了满足描述复杂数据对象的一个标准数据结构。METS是一种XML文件,可将有关数字化资源的元数据进行打包,包括所有描述性的、管理性的、结构化的、权限及其它可用于数字化资源检索,保存和服务的元数据。METS文件包由7个部分组成,头标区、描述性元数据、管理性元数据、文件区、结构图、结构链接和行为区。采用XML语言表示的METS为数字图书馆中对象在不同知识库之间交换的管理提供了一种文档格式。METS中的描述性元数据包括编目和根查数据,现在METS编辑版已经支持3个描述性元数据模式:简单的Dublin Core、MARCXML和MODS[6]。MODS作为描述性元数据方案,是设计用来和METS一起应用的。 4.3 可用作OAI应用中收割元数据 元数据获取标准OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)是数字图书管理数据交换的一个标准,实现跨库数据库检索的元数据互操作协议。架构在HTTP及XML技术之上,主要是由OAI的服务系统向资源提供者抓取MARC记录,OAI是建立在HTTP上的应用协议,指令集可透过HTTP协议传输,但元数据必须遵循XML格式,目前美国国会图书馆为OAI-PHM所建议的格式有3种:MODS、MARCXML和DC,MARCXML太过复杂而DC又过于简单,所以MODS是OAI-PMH中适合用于图书馆领域的描述性元数据[7]。 4.4 将使用XML语法的元数据整合封装为一个电子资源 MODS不仅可以对原始资源进行描述,还可以作为资源集合描述元数据规范,对基于XML语法的各种元数据进行整合封装,以达到异构数据系统间的互操作。资源集合描述元数据的置标规范一般采用XML/XML Schema、RDF等开放标准及基于XML/XML Schema的置标规范。从元数据应用的逻辑模型出发,着重于服务接口和框架的定义,对如何描述、如何封装、如何交换、如何达到语义上的一致进行规定,可以称之为“元数据协议”,常常需要与面向内容的“纯描述型”元数据方案结合起来使用。MODS采用XML结构和语法,可将图书馆的数据库与其它没有使用MARC格式的元数据联合,提供数据查询、检索、管理复杂的数字化对象等多种功能。 5 MODS的国外应用情况 MODS元数据作为一种基于XML语法的新数据格式,克服了MARC字段繁琐,网络检索不便的问题,由于其结构简单,可扩展性和转换性强等优点,自2003年MODS 2.0版就开始应用于实践。到2011年5月为止,向美国国会图书馆注册的MODS实验项目达到34个[8]。部分项目如下: OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)架构中扮演数据转换的角色,以协同合作的方式加快编目的速度,提高编目质量,如澳洲国家图书馆与电影资料馆的Music Australia网站;利用MODS直接著录包含电子资源在内的多种类型资源,如印地安纳大学数字图书馆计划的IN Harmony:Sheet Music from Indiana;以MODS作为METS(Metadata En2coding and Transmission Standard)中的描述性元数据,如西部储备大学人类学西藏研究中心的Tibet Oral History Archive;用MODS作为中介的元数据,让各领域不同的元数据得以相互转换,如加拿大图书馆和档案局的Federated search of AMICUS and MIKAN。 总之,MODS标准是符合数字图书馆和传统图书馆的愿望而产生的适合在网络上运行的元数据,是图书馆学界描述数字化资源的又一次创新,有利于网络环境下信息资源编目元数据的整合和转换。MODS作为一种建立于XML技术基础上的描述元数据,既克服了传统MARC在网络上的检索问题,又弥补了DC元数据元素过于简单不适合描述传统文献资源的缺陷,成为复合图书馆资源描述的最佳选择。虽然目前MODS很难代替MARC和DC各自在资源描述领域的地位,但随着RDA的应用以及数字图书馆的发展,相信MODS在未来的资源描述领域中将发挥更大作用。 参考文献 [1]The Library of Congress.MODS Official Web Site[EB/OL].http://www.loc.gov/standards/mods,2011-05-16. [2]罗昊.XML与数字图书馆编目技术[J].情报资料工作,2003,(6):25-27. [3]刘孝文.从MARC到MODS:编目元数据MODS分析与研究[J].图书馆杂志,2007,(7):14-17,30. [4]罗昊,刘宇.文献编目的第三条道路——MODS的简介与分析[J].四川图书馆学报,2003,(3):31-34. [5]The Library of Congress.MODS:Uses and features[EB/OL].http://www.loc.gov/standards/mods/mods-overview.html,2010-05-16. [6]张铮,李蓓.元数据家族中的新成员——MODS和METS[J].医学信息,2005,(7):743-745. [7]张慧珠.数位环境中机读编目格式的新面貌:MODS的产生与发展[J].台湾国家图书馆馆刊,2006,(2):1-24. [8]The Library of Congress.MODS Implementation Registry[EB/OL].http://www.loc.gov/standards/mods/registry.php,2011-05-16. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。