英国政府网页档案 项目及其启示

    梁皆璇

    摘要:自2009年起,英国国家档案馆开始对政府网页以及社交媒体进行收集和保存。本文分别从政府网页以及社交媒体两个方面对英国国家档案馆的政府网页档案项目进行分析和研究,以期对我国档案工作有所启示。

    关键词:英国国家档案馆政府网页档案社交媒体档案

    随着信息技术的发展,各国愈发意识到网络信息资源的重要性,许多国家纷纷开展了与网络信息资源归档相关的项目,并取得了一定成效。其中,作为网络信息资源重要表现形式之一的政府网页以及社交媒体更是引起了许多国家的重视。本文对英国政府网页档案项目进行分析和研究,以期对我国档案工作有所启示。

    一、英国政府网页档案项目概述

    进入21世纪,英国政府越来越多地在网上发布政府信息并运用一系列数字媒体与市民、企业交流互动,这使得数字形式的公共记录数量迅速增长。收集实体形式和数字形式的公共记录,以及确保能为子孙后代保存并提供实体形式和数字形式的公共记录的利用,便成为英国国家档案馆的主要任务。在这样的背景下,英国政府网页档案项目应运而生。

    英国政府网页档案项目,设置在英国国家档案馆网站首页四大板块“教育服务”(Education)、“文件检索与利用”(Records)、“信息管理指导”(Information Man? agement)、“档案部门”(Archive Sector)中的“文件检索与利用”(Records)板块下,该板块主要为研究提供文献的支持。网页档案项目则提供网络资源的支持,它共有5个部分,分别是“查找英国政府网页档案”(Search the UK Government Web Archive)、“从A—Z浏览馆藏”(Browse our A to Z)、“Twitter档案”(Twitter ar? chive)、“视频档案”(Video archive)以及“专题馆藏”(Themed collections)。由于“查找英国政府网页档案”(Search the UK Government Web Archive)、“从A—Z浏览馆藏”(Browse our A to Z)与“专题馆藏”(Themed collections)这三个部分与英国政府网页档案的网页检索查询功能有诸多重合之处,因此该内容将在网页检索查询方式中重点介绍,而Twitter档案(Twitter archive)、视频档案(Video archive)更多地体现为社交媒体档案的功能,因此本文将其统一纳入社交媒体档案内进行阐述。

    (一)英国政府网页档案

    英国国家档案馆的政府网页项目于2003年9月开始,初期选择收集50个所辖范围内的政府网站,并与非营利的专业网页归档组织Internet Archive合作。随着该项目的发展,从2005年起,政府网页项目与非营利的专业网页归档组织Internet Memory Foundation合作。政府网页项目具备信息集成、服务利用、检索查询、资源共享。在其众多的功能中,检索查询功能是英国政府网页档案最强大的功能之一。

    1.网页档案检索查询方式

    英国政府网页档案提供多种检索方式,能够使用户根据自身的检索偏好,选择不同的检索方式查找到所需内容,此外还有多种检索方式作为补充,从而极大地提高了查全率和查准率。

    (1)主要检索方式

    直接查找。政府网页档案的查找方式分为快速检索和高级检索。快速检索中只需输入关键词即可。其关键词可以是任意词、词组或全文,也可以是一个网址。输入任意词、词组或全文的搜索结果是馆藏中所含搜索项的网页,并清楚地标明该搜索项的位置,在每条搜索结果下详细地提供该网页的摘要、机构信息、原始网址、归档的时间以及按日期顺序排列的、能够收集到的该网页的所有版本。在检索出的每个网页档案顶部均有收集的时间,提醒用户这是网页快照,并非即时网页。输入网址的搜索结果则是按时间排列的所有收集到的网址;高级检索中查找项为所有词、不包含这些词、确切词或短语、分类、文件类型。所有词的检索相当于快速检索功能;确切词或短语搜索的结果至少包含其中的一个词或短语。在高级检索中,用户还可以选择所需类目,即将所有收集的政府网站分到一个或者多个类目下,可选择一个或者至多选择四个类目进行查找,以便于缩小搜索范围。在这种方式下,将政府网站分为11大类,分别是“商业、工业、经济和金融”、“中央和区域政府”、“文化和休闲”、“环境”、“卫生、保健与护理”、“民政、公共秩序、司法与权利”、“荣誉、奖励及委任”、“国际事务与国防”、“公众、社区和住房”、“运输、通信和科技”、“工作、教育和技能”。此外,在每个分类旁均有此分类中归档的所有网址以便查看。文件类型可以选择查找结果的显示方式,显示网页、PDF格式或者两者均显示。

    英国政府网页档案的查找还支持在Firefox浏览器以及Chorme浏览器使用“Memento”的插件。装上“Memento”插件后输入需要的即时网页,点击“Me? mento”工具栏,选定日期和时间后点击设置按钮,在网页中单击鼠标右键则会显示保存的与选择日期和时间最相近的网页档案,以便用户进行网页浏览。[1]

    (2)辅助检索方式

    索引查找。将所有归档的网页按照字母顺序由AZ以及数字的顺序排列编成索引,用户根据索引查找到需要的网页,并点击网页的链接,便可呈现按时间排列的所有该网页的网页档案,并提供即时网页链接。这种查找方式较为简单,为用户节约了大量的时间。

    专题查找。目前按专题查找板块仅有17个专题档案,精选了公众关注度较高的事件以及著名事件,分别展示了这些事件是如何发生的,并记录了政府处理情况。17个专题档案是2006年英国国家安全、2010年4月火山灰危机、2010年5月英国大选、2010年夏巴基斯坦洪灾、2011年3月日本地震、2012伦敦奥运会与残奥会、2010~2013年4年间英国政府财政预算(共计5项)、英国女皇登基六十周年钻石庆典议会演讲、英国区域发展机构、英国透明度议程、金融危机、禽流感、猪流感。

    2.标准支持

    英国政府网页档案之所以具有如此强大的检索功能,重要原因在于有英国政府网页档案的标准支持。相关的标准支持主要体现为英国内阁办公室于2009年3月发布了Cabinet Office Web Standard,其中TG105、TG122、TG125均涉及网页归档。Cabinet Office Web Standard TG105主要包括两部分内容,一部分旨在确保英国国家档案馆定期以及精确保存英国中央政府的网页,另一部分为网页的设计以及网页的维护提供最佳实践指导以便于支持网页归档。[2]Cabinet Office Web Standard TG122,主要涉及利用网站地图使搜索引擎能够查找到网页。网站地图通过一个简单、开放和便于获取的格式在网站上列出可利用的内容。它可以是简单的纯文本URL列表,包含每个URL合适更新、更新的频率等。其内容包括网页地图的重要性、网页地图是什么、如何创建网页地图、上传网页地图、向搜索引擎提交网络地图、向英国政府网页档案提交网页地图以及附录。[3]Cabi? net Office Web Standard TG125涉及管理URL。URL是网页档案的生命线,良好的网页管理将大大减少不可访问的网页数量。TG125正致力于减少网页的不可访问率。其内容包括域名的维护、使用永久网址、使用有意义的URL(人们容易理解的URL)、通过转换管理URL等。[4]

    (二)社交媒体档案

    从时间上看,该项目最早归档的社交媒体档案可以追溯到2006年;内容涉及近年的重大事件,如2012年伦敦奥林匹克运动会等;形式上可分为文字的Twitter(简称推特)档案和视频档案;采集方式上,英国国家档案馆采用自动采集工具有效捕获并提供社交媒体的内容。社交媒体档案的功能也日趋完善。在该项目的试验阶段,主要收集由英国政府部门在线发布的数千个视频和超过6.5万条Twitter,随着社交媒体发展的成熟化,这部分馆藏量也将随着更广泛的网页归档活动持续增长。可以说,社交媒体档案正成为展示政府部门如何使用数字工具与公众进行沟通的重要工具。以下主要对Twitter档案和视频档案进行叙述。

    1.Twitter档案

    Twitter是一个广受欢迎的社交网络及微(博)客服务网站,它允许用户将自己的最新动态和想法以移动电话中的短信息形式发布,英国政府部门普遍都有推特账号,定期在推特上发布信息,英国国家档案馆将推特作为公众记录的一部分进行保存。目前共收集了43个英国政府部门账号的推特档案。点击每个部门的图标都能查看保存的推特并提供即时推特的链接。目前仅支持用户以时间顺序对推特档案进行查询,由于推特档案是按年度进行收集,当前保存了2013年9月之前的推特。[5]而哪些类型的推特应被保存,哪些类型的推特应被舍弃,英国国家档案馆作了详细规定,如将应被保存的推特内容限制在由英国政府部门账号和伦敦奥运会官方账号发出的推特以及这些推特中提到的网页;被舍弃的推特内容主要为政府部门转发的推特,由政府部门发布的推特但其中包含非政府部门推特内容的,也不在归档范围中的。此外推特内容中的链接内容也不属于其归档活动的范围。

    2.视频档案

    视频档案的收集是与世界上最大的视频网站You tube合作的,保存自2007年以来43个政府部门开通的Youtube账号以及2012年伦敦奥运会和残奥会相关的视频。视频和推特一样也是作为公共记录的一部分进行保存。当前视频档案板块为测试版,只能按照形成部门-形成时间-题名的方式进行简单的查找,每一个视频都会标明具体的形成日期、主要内容并为其贴上标签,方便用户的了解。

    二、英国政府网页档案项目对我国的启示

    (一)档案部门应将政府网页及其社交媒体列入馆藏范围

    从必要性角度来说,互联网和社交媒体正成为我国公民行使知情权、参与权、表达权和监督权的重要渠道。一方面,近年来,越来越多的政府部门通过网络开展各项业务,并产生了大量的政府网络信息资源;另一方面,社交媒体(允许人们撰写、分享、评价、讨论、相互沟通的网站和技术)体现在我国即微(博)客,正如火如荼地开展。但互联网也有其自身的缺陷,如若没有相应的项目管理,消失的网页和社交媒体将永远从人们的记忆中消失。

    从可行性角度来说,档案部门在政府网页及其社交媒体信息的收集上有其“先天优势”。政府网页及其社交媒体的采集是档案部门收集电子文件所涉范围。同时,电子文件国家战略的开展可以进一步推进网络信息资源保存战略的实施,档案部门可以借此拓宽领域,将网络信息的保存和数字档案馆结合起来,进行统筹安排。[6]

    (二)充分挖掘采集资源

    笔者认为不论是收集政府网页还是社交媒体都应通过制定元数据编目规则,在网络爬虫(抓取网络资源的工具)采集资源之后,根据元数据编目规则进行。经过编目之后,形成一系列的专题,并提供时间、地域、关键词等多检索途径,使读者能够按照各个分类进行浏览。此外还应支持用户在页面上看到采集网站的编目信息,查看对应年月日的网页内容,如此一来用户就能看到过去相应时间的网页内容。[7]

    此外,在档案馆页面上每月推荐一个采集的主题网站,发布每月的采集网站访问量的排名情况。还可将采集的网页以及社交媒体进行整合,这样不仅为采集的资源增加了新的价值,还为用户更充分便捷地利用档案资源提供了条件。

    (三)积极与相关机构合作

    从长期发展来看,政府网页及其社交媒体作为重要的网络信息资源,仅凭档案部门的一己之力采集与保存是不够的,更需要相关部门间的积极合作。

    收集网页档案方面,应该借鉴英国政府网页档案项目,可与国际上类似的专业网页归档组织合作,也可与我国自有的网页归档机构合作,如Web Infomall——中国Web信息博物馆合作,此外,我国档案馆也可以积极加入国际互联网保存联盟(International Internet Preser? vation Consortium),从而了解以及运用最先进的技术,更好地对政府网页档案进行采集、保存和利用。

    收集社交媒体档案方面,我国可以积极与社交媒体平台合作,并与其达成协议。收集属于档案部门归档范围的,政府部门社交媒体账号内的信息,并定期移交给档案馆,以便提供网上检索查询服务。

    (四)完善相关法律与标准

    在法律方面,政府网页及社交媒体归档保存面临的法律问题主要有三个,即网络信息的收集、保存与利用,这些问题的解决与否直接关系到政府网页以及社交媒体的长远发展。目前,笔者认为可以有两种解决方式。一是档案部门通过对档案法及其实施办法或相关法律进行修正,建立合法呈缴制度,从法律上赋予档案馆保存与处理政府网页资源及其社交媒体资源的权利。但当前我国制定呈缴法的条件还不成熟。因此就现阶段而言,可采用第二种方式也就是采取协商解决的方法,通过与网站所有者协商获得版权所有者的许可。

    在标准方面,标准是否统一直接影响政府网页及其社交媒体的长久保存与利用,因此应该建立统一的标准,如统一的采集标准、元数据、标准数据存储转换格式等,从而避免因保存标准不一致而产生的问题。从这个角度而言,档案部门有必要对政府网页及其社交媒体保存中采集、存储、访问、索引与检索阶段所涉及的标准规范不断予以研究完善,在标准制定的过程中应优先采用国际标准并做到与其他标准的有机衔接。

    参考文献:

    [1][5]Information on web archiving[EB/OL].[2014- 06- 05].http://www.nationalarchives.gov.uk/we? barchive/information.htm.

    [2]Archiving websites[EB/OL].[2013- 04- 13].http:// webarchive.nationalarchives.gov.uk/20130413020040/ http://digitalstandards.cabinetoffice.gov.uk/archiving- web? sites/.

    [3]Exposing your website to search engines[EB/ OL].[2013- 04- 13].http://webarchive.nationalarchives. gov.uk/20130413020040/http://digitalstandards.cabinetof? fice.gov.uk/exposing-your-website-to-search-engines/.

    [4]Managing URLs[EB/OL].[2013-04-13].http:// webarchive.nationalarchives.gov.uk/20130413020040/ http://digitalstandards.cabinetoffice.gov.uk/managing-urls/.

    [6]闫晓创.国外Web Archive项目对我国的借鉴和启示——以澳大利亚的PANDORA项目为例[J].档案学研究,2012(5):79-83.

    [7]陈瑜.日本国立国会图书馆网络信息资源采集保存项目介绍研究[J].图书馆杂志,2014(3):91-94.

相关文章!
  • 基于企业文化的国企思想政治工

    陈广梅中图分类号:D641 文献标识:A 文章编号:1674-1145(2019)4-081-02摘 要 新形势下,党对国有企业思想政治工作提出更高的要求,需要

  • 一次为中国革命延续火种的伟大

    朱强今年11月12日是我国伟大的革命先行者孙中山先生诞辰150周年。在孙中山先生早期的革命生涯中,有一段流亡海外的经历,这段经历见证了

  • 周强:在县域治理中发挥好司法

    大数据时代,司法案件运行情况成为县域经济社会发展的晴雨表。法院将海量案件信息进行大数据分析,从刑事案件判断治安状况,从民商事案件