国外政务社交媒体文件捕获归档工具的分析与比较

    黄士多 焦钰巧

    摘? 要:通过广泛调研国内外政务社交媒体文件管理的制度政策、理论和实践进展,聚焦国外政务社交媒体文件捕获归档工具,从捕获方法与捕获类型、归档范围与深度链接、格式标准与法规遵从、可伸缩性与便捷性等维度进行比较和分析,梳理国外主流捕获归档工具的优势和不足,为我国政务社交媒体文件捕获工具的研发与创新提供理论参考和实践指导。

    关键词:政务社交媒体;捕获归档工具;归档管理

    Abstract: Based on investigating the system, policy, theory and practice progress of government social media records management at home and abroad, this paper focuses on capture archiving tools and compares them on capture methods and types, archiving scope and deep links, format standards and regulatory compliance, scalability and convenience, sort out the advantages and disadvantages of foreign mainstream capture archiving tools, and provide theoretical reference and practical guidance for development and innovation of government social media capture archiving tools.

    Keywords: Government social media; Capture archiving tools; Archiving management0 引言

    國务院《促进大数据发展行动纲要》(2015)[1]指出“大数据已成为国家重要的基础性战略资源”,要求“加快政府数据开放共享,推动资源整合”。《全国档案事业发展“十三五”规划纲要》(2016)[2]将“研究制定重要网页资源的采集和社交媒体文件的归档管理办法”作为主要任务之一。政务社交媒体中包含了大量的政策信息、热点事件、公众评论,优化对政府社交媒体文件的管理不仅是对信息、文件、档案管理理论与方法创新性的探究[3],更是促进政府数据开放、提升政府治理能力的重要行动。据第42次《中国互联网络发展状况统计报告》[4],截至2018年6月,我国在线政务服务用户规模达到4.70亿,占网民总体的58.6%,微信朋友圈、QQ空间、手机微博的使用率分别为86.9%、64.7%、42.1%,政务社交媒体平台已成为各级党政机关和群团组织进行信息服务的重要工具。《中华人民共和国政府信息公开条例》正式实施已有十年之久,近几年我国政务社交媒体文件增长迅速,对海量政务社交媒体文件的优化管理亟须技术上的突破。相比网络存档而言,社交媒体内容本身的复杂性、交互性和非标准化格式等特点增加了实时捕获的难度,对捕获归档工具的设计和研发提出了更高要求。

    因此,本文在调研国内外政务社交媒体文件归档管理现状的基础上,对比分析国外主流社交媒体文件捕获工具的优势和不足,尝试探索一种高效、安全、便捷的政务社交媒体文件归档管理方案,为我国政府社交媒体文件自动捕获与长期保存提供参考指导。1 国内外研究现状及实践进展

    1.1 理论研究层面。文献调研发现,大多数学者主要集中在社交媒体的价值和管理框架探讨以及捕获、保存和利用社交媒体数据的技术方法方面。学者Thomson等[5]和Acker等[6]通过案例分析,证明了社交媒体的价值,强调捕获和长期保存社交媒体信息的必要性。Wiley等[7]提出了信息治理框架,为社交媒体活动的控制、监管和归档提供总体策略和指导方针。Littman等[8]开发和改进了一款应用程序SFM(Social Feed Manager),探索基于API的社交媒体数据收集方法。Espley等[9]提出应用英国国家档案馆网络存档的原则捕获社交媒体文件,基于API捕获社交媒体内容及元数据。Weller等[10]则从道德、法律和方法论维度研究了利用社交媒体共享研究数据的框架和方法。

    相较国外发达国家,国内关于政务社交媒体文件管理的研究多是借鉴国外经验进行宏观层面探讨,主要集中在案例研究、问题分析、对策探究及文献评述等方面。赵玉[11]、周文泓[12]、张江珊[13]、万凯莉[14]、王焕[15]等梳理了英美澳等国家在政务社交媒体文件归档方面的政策法规、管理模式及发展现状,并深入调研了一些社交媒体文件归档项目。在归档策略方面,周文泓[16]认为应设计适应性的文件管理框架、明确政务社交媒体文件的范畴、构建主题协同机制、建立系统的技术体系等;高晨翔[17]提出了社交媒体文件的部分鉴定、前端鉴定方式及其应用条件;宋香蕾[18]提出了在政务微博归档中应采用政府部门、档案馆和第三方平台相互协作的模式。

    1.2 制度政策层面。在制度政策层面,美国早在2010年就已经开始研究政务社交媒体的使用及其价值,并出台了一系列用于指导社交媒体文件管理的政策法规。澳大利亚和英国等国家紧随其后,也出台了相关政策,其不同国家的政策如表1所示。

    

    1.3 实践进展层面。在实践层面,国际上成熟的社交媒体文件归档项目还比较少,且多是在网络存档的基础上发展起来的,在捕获思路、原则和方法等方面对网络存档项目也有所借鉴,具体实践项目详见表2。

    

2 研究方法与过程

    2.1 研究目标。本文聚焦政务社交媒体文件的捕获环节,通过梳理现有的政府社交媒体项目和工具,选取国外主流的社交媒体文件捕获归档工具,从捕获方法与捕获类型、归档范围与深度链接、格式标准与法规遵从以及可伸缩性与便捷性等维度,对比分析不同工具的优势和不足,尝试为我国社交媒体文件归档工具开发提供参考和建议。

    2.2 对比工具选取。本文在调研社交媒体归档项目和30余种社交媒体文件捕获工具[40]的基础上,综合考虑不同社交媒体捕获工具的代表性、功能重复性、易用性和覆盖程度等属性,最终选择Archive-it、ArchiveSocial、WebMirror、WebPreserver.com四个工具作为研究对象,其基本信息如表3所示。

    

3 国外主流捕获工具概述

    3.1 Archive-it。Archive-it是Internet Archive(也叫“网站时光倒流机器”,Wayback Machine)在2006年创建的一个网络档案订阅服务工具。Internet Archive作为全球最大的非盈利性质的网上公共档案馆,它定期收录并永久保存全球网站上可以抓取到的有用信息。网站收集的档案面向公众免费开放,访问网站(https://archive.org/)即可查阅[42]。Archive-it曾与世界范围内16个国家约400个组织合作,主要包括高校、文博机构、政府机关和公共组织等。Internet Archive采集到的网络档案存储在其多元冗余数据中心,用户可以利用Archive-it工具检索、分类和管理已归档的网络档案并创建自己的综合性门户网站,还可以调整社交媒体文件的长度、深度,增加10位其他用户并为每位用户设置权限[43]。Archive-it的网上帮助中心,为用户提供交流学习和获取专业档案人员技术支持的平台。

    3.2 ArchiveSocial。ArchiveSocial公司是第三方归档服务机构,可以按照用户提供的特定社交媒体账户及捕获的页面范围,持续性地捕获与该账户相关的社交媒体信息并提供检索和访问[41]。它直接与第三方社交媒体平台沟通协作,基于云计算和云存储技术进行归档,可以自动检测社交网络流没有提供的、已发布推文的新评论以及编辑、删除行为,在社交媒体信息发布几年之后,仍可以扩展对话内容、回看照片和视频。同时,它可以持续地对目标账户的社交媒体历史进行重复验证,以确保即使网络停机或社交媒体平台设置更改也能准确、完整地捕获社交媒体账户信息。ArchiveSocial还支持编辑、删除、隐藏等操作,历史版本(Version History)工具允许用户按时间顺序查看之前所有的编辑行为,以确保用户拥有可以合法提交的认证记录。

    3.3 MirrorWeb。MirrorWeb创立于2012年,是一家专注于网络存档、社交媒体存档以及FCA合法性等领域的私人控股企业,侧重为监管和诉讼行业提供企业级别的数字媒体合规解决方案,主要服务对象是金融机构、政府机关和公共組织。MirrorWeb每年捕获上千个网站、社交媒体账户,曾参与过英国国家档案馆、英格兰银行的社交媒体文件归档项目。MirrorWeb有专门的入口允许用户随时查看已归档内容并管理社交媒体文件,所有归档内容可供电子发现(eDiscovery)专业人士、诉讼当事人和其他第三方使用独特的URL进行调查。MirrorWeb和亚马逊公司有着密切的合作,通过本地云服务进行社交媒体文件存档,能够提供云服务和可被验证的社交媒体活动信息记录。

    3.4 WebPreserver.com。WebPreserver.com是PageFreezer软件公司为解决网络犯罪相关案件的电子证据捕获方面的问题于2015年4月推出的产品[44]。在使用WebPreserver捕获网页和社交媒体文件时,用户只需要在其官网上填写所要捕获网页的URL地址,并提供姓名、电子邮件、寄付账单地址、信用卡有效期和安全代码等信息即可。WebPreserver的采集的所有网页、源代码和元数据都附有256字节的数字签名和时间戳以确保采集到的数据包满足作为证据的要求,符合电子签名法案(E-Sign Act)、联邦证据法规(Federal Rules of Evidence)及其他监管要求。为方便管理,用户可以进行标签、检索、下载、打印等操作,并输出到行业标准工具中,如EDRM-XML、LexisNexis' Concordance和WARC等。WebPreserver根据数据采集的类型和体量计费,还可以提供相关的公证宣誓书。4 国外主流捕获工具的比较分析

    4.1 捕获方法和捕获类型比较。社交媒体平台的技术配置和归档机构的需求等因素会影响社交媒体文件捕获的方法。目前的捕获方法主要包括:①使用网页抓取或其他软件创建本地版本的网站;②使用网络捕捉工具捕捉社交媒体文件;③使用平台的特定应用程序编程接口(APIs)来提取内容;④使用RSS源、聚合器或手动方法来捕获内容;⑤使用内置于某些社交媒体平台的工具来导出内容[45]。

    在上述4种工具中,ArchiveSocial直接与第三方社交媒体平台沟通协作,基于云计算和云存储技术归档管理社交媒体文件;Archive-it利用网络爬虫工具Heritrix捕获社交媒体文件,可以捕获文本、图片、表格、动态内容以及流媒体信息;WebPreserver.com采用网络快照形式捕获特定URL地址中的社交媒体信息;MirrorWeb与亚马逊公司合作,通过社交媒体平台API可以实现近实时存档,每个捕获的社交媒体文件都有符合ANSI X995标准的可信时间戳管理,提供可扩展、可验证的本地云归档解决方案。不同工具可以捕获的文件类型及适用的社交媒体平台详见表4。

    

    4.2 归档范围和深度链接比较。由于社交媒体的多主体性质以及社交媒体文件内容的复杂性、交互性,对社交媒体文件归档范围和深度链接的处理,不仅涉及捕获文件所需的技术方法,还要与本国的档案政策法规的精神相契合。

    在归档范围层面,Archive-it提供四种归档范围供用户选择,如果用户没有设置归档范围类型,系统默认按照标准格式进行捕获[46];它会把用户提供的URLs地址设定为种子站点,站点内的网页信息都会被捕获,站点外的内容不被抓取。ArchiveSocial严格按照用户指定的社交媒体账户和页面范围捕获内容,以社交媒体账户为单位进行捕获,不仅可以捕获目标账户中评论、回复和私信等完整的社交媒体活动信息,还可以追溯到该账户建立之初的信息。MirrorWeb可以捕获社交媒体平台上包括直接信息、转发信息、外部链接和元数据在内的全部可能的社交媒体活动信息,最大限度地确保信息的准确性、完整性[47]。WebPreserver.com采用网络快照方式对单一网页或社交媒体账户进行小范围归档,只捕获目标地址对应的单一网页页面范围的内容。

    而对于其外部链接,Archive-it已捕获文件中包含的外部链接,因捕获过程中归档范围类型设置不同而有所差异,以标准格式和单页面格式捕获的链接内容不可访问。ArchiveSocial已捕获的社交媒体文件中包含的链接,可以在浏览器新窗口打开访问,归档范围内的所有社交媒体文件,可以通过链接实现内部跳转。WebPreserver.com捕获的内容是以静态页面的格式呈现的PNF和HTML文件,无法查看子页面信息和超链接内容。

    4.3 格式标准和法规遵从比较。由于不同社交媒体平台使用的格式标准、编码方法不同,导致最终形成的社交媒体文件格式各异,不利于文件的后期利用。

    在格式标准层面,Archive-it在捕获社交媒体文件时保留元数据信息,ODS格式的元数据文件可以被上传和下载,支持文件级别和种子地址级别的元数据的编辑。ArchiveSocial直接从社交媒体平台捕获数据,保留社交媒体文件形成时的原始格式和元数据,可以按需输出不同格式的文件。MirrorWeb捕获的社交媒体文件均符合国家标准化组织(ISO)标准和行业规范,日期和时间戳严格按照规则排列存储,所有legacy ARC格式的文件可以轉化为WARC格式。WebPreserver.com每次捕获的社交媒体文件被作为独立个体保存,只能通过PNF和HTML格式输出。

    在法规遵从层面,关于社交媒体文件的法律权限归属问题,ArchiveSocial和北卡罗来纳州合作的社交媒体归档项目为我们提供了示范和借鉴。该项目通过捐赠协议等法律形式明确社交媒体文件的权限归属问题,并规定归档部门、社交媒体平台提供商、数据技术服务公司的权利和义务,以解决后续利用过程中的法律权限问题。而Archive-it在捕获目标账户社交媒体文件时不加过滤地捕获粉丝用户的个人信息,在用户隐私方面存在一定风险。MirrorWeb捕获的所有数据被存储在本地,兼容ISO9001、ISO2500认证和GDPR等规范。MirrorWeb还提供了专门的监控工具对捕获文件的合规性进行实时监测。WebPreserver.com提供谷歌浏览器插件和基于互联网的平台,通过提供符合法院标准格式的时间戳和数字签名的PDF文件,确保捕获到的网页符合法律文件的规范和电子发现(eDiscovery)的要求[48]。

    4.4 可伸缩性和便捷性比较。在文件管理层面,Archive-it作为一个网络档案订阅工具,可以轻松把归档文件集中到同一平台,但使用它捕获和管理社交媒体文件需要掌握一定的信息组织和网络爬虫知识。ArchiveSocial以社交媒体账户为单位进行捕获,捕获期间账户数量可以随时增加,可伸缩性良好。它还可以将不同社交媒体账户中的信息整合到同一平台,监管机构在管理整个机关文件数据的同时允许作为内容生产者的个人和机关控制社交媒体内容,不需要收集用户的个人登录信息和覆盖访问已归档数据,就可以快速连接各社交媒体账户[49]。MirrorWeb支持用户自行设置文件捕获的频次和日程,可以自动创建档案,不需要安装、配置和运行原始社交媒体平台或网站内容管理系统即可访问内容。此外,MirrorWeb还允许用户设置黑名单、白名单权限,可以快速、无缝、安全地进行数据迁移,搜索重放内容,查看报告和通知。WebPreserver.com只适合包含少量内容、小范围的文件捕获。

    在文件利用层面,Archive-it在组织排列、分类管理已捕获文件方面比较突出,它会把每一个合作机构的社交媒体文件作为一个集合,在集合内每个社交媒体文件都会被编码且按档案主题和URLs地址两种方式进行呈现,满足不用检索目的用户的需求。ArchiveSocial支持用户利用日期、内容类型、归属平台、组合关键词等进行筛选,该工具更突出的特点在于用户在使用关键词进行检索时,它可以准确重建与该关键词相关的整个社交媒体对话,允许用户在原始文本中查看所需内容。MirrorWeb提供全文索引和检索,可以根据捕获文件的主要用户群体类型提供个性化账户设置的API端点,以归档数据的访问和利用。WebPreserver.com为捕获到的每个社交媒体文件创建单独的文件夹,仅支持以文件夹的方式查看已捕获内容。5 结论与讨论

    综合上述比较分析结果,Archivesocial和MirrorWeb作为专注于网络存档服务的专业机构,在覆盖范围、专业程度以及海量数据的迁移、管理和利用方面表现得十分出色,适用于拥有巨量社交媒体数据的公共组织、政府部门。Archive-it侧重捕获网页和网站信息且有一定的使用门槛,适用于把门户网站作为主要信息发布平台和服务窗口的小型机构和组织。WebPreserver.com捕获的社交媒体文件附带符合法院标准格式的时间戳和数字签名,适用于司法部门和有取证需求的个人。目前,我国尚未把社交媒体文件明确纳入电子文件管理范畴,在理论和实践层面的探索比较有限,专门用于社交媒体文件捕获归档的工具也没有开发出来。要推进我国政务社交媒体文件管理工作取得进展,应从以下几个方面努力:

    ①尽快推出政务社交媒体文件管理的政策指南,为其归档实践提供系统完善的政策指引和支撑。我国要首先制定高层级的政策,把政务社交媒体文件归档管理纳入顶层设计之中,明确政务社交媒体文件在电子文件领域的重要地位和价值。在此基础上,结合我国现行的《电子文件管理暂行办法》《电子档案移交与接收办法》等规范性文件,针对归档管理的具体环节制定具有实践指导意义的分类方案、保存期限表、格式标准等,从上至下提升全社会管理政务社交媒体文件的意识并推进管理行动。

    ②广泛开展社会合作,发挥集体智慧,协同推进政务社交媒体文件管理模式创新。对外,我国要尝试加入国际互联网保存联盟(International Internet Preservation Consortium,简称IIPC)、互联网记忆基金会(Internet Memory Foundation)等国际组织,积极借鉴国外成果和成功经验。对内,形成以政府机关和档案部门为主体、第三方平台积极配合、公众主动参与的联动模式,促进多方合作,整合优势资源,协同解决归档管理过程中的各种难题。

    ③大力扶持本土的数据技术服务企业、档案服务公司,为社交媒体数据采集和保存业务的发展以及社交媒体文件归档捕获工具的开发创造良好环境。在Web InfoMall项目和WICP项目的基础上,利用现有的镜像存档、网络机器人、天网搜索引擎等网络存档方法,结合聚合器、云计算、数字签名、API接口认证等技术,实现政务社交媒体文件的自动抓取、可重复验证和长期保存,推动我国政务社交媒体文件归档管理工作取得更大进步。参考文献:

    [1]国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2019-04-26].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

    [2]国家档案局.国家档案局印发《全国档案事业发展“十三五”规划纲要》[EB/OL].[2019-04-21].http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.

    [3][16]周文泓.政务社交媒体文件管理问题与对策研究[J].电子政务, 2017(11): 91-98.

    [4]中共中央网络安全和信息化委员会办公室.第42次《中国互联网络发展状况统计报告》[EB/OL].[2019-04-21].http://www.cac.gov.cn/2018-08/20/c_1123296882.htm.

    [5]Thomson S D, Kilbride W. Preserving social media: The problem of access[J].New Review of Information Networking,2015,20(1-2):261-275.

    [6]Acker A,Kriesberg A. Tweets may be archived:Civic engagement,digital preservation and obama white house social media data[J]. Proceedings of the Association for Information Science and Technology, 2017, 54(1): 1-9.

    [7]Information Governance and Security for Social Media[M]// Safeguarding Critical Documents:Implementing a Program for Securing Confidential Information Assets. John Wiley & Sons, Inc.2015: 57-67.

    [8]Littman J, Chudnov D, Kerchner D, et al. API-based social media collecting as a form of web archiving[J]. International Journal on Digital Libraries, 2018,19(1): 21-38.

    [9]Espley S, Carpentier F, Pop R, et al. Collect, preserve, access: Applying the governing principles of the National Archives UK Government Web Archive to social media content[J]. Alexandria,2014,25(1-2):31-50.

    [10]Weller K, Kinder-Kurlanda K E. A manifesto for data sharing in social media research[C]//Nejdl W, Hall W, Parigi P, et al. Proceedings of the 8th ACM Conference on Web Science. ACM, 2016: 166-172.

    [11]趙玉,王健.英国国家档案馆在线社交媒体档案库及其特色[J].档案与建设,2015(12):35-37.

    [12]周文泓.美国政府社交媒体保管政策分析及其启示[J].情报理论与实践,2015,38(9):134-139.

    [13]张江珊.美国社交媒体记录捕获归档的思考[J].档案学研究,2016(4):119-123.

    [14]万凯莉.美国Twitter存档项目对我国社交媒体信息归档的启示[J].浙江档案, 2014(5): 8-11.

    [15][38]王焕.国外政务社交媒体文件归档研究[J].档案学研究,2015(6):99-105.

    [17]高晨翔,黄新荣.我国社交媒体文件归档中的鉴定问题研究[J].北京档案,2017(7):24-26.

    [18]宋香蕾.政务微博档案化模式研究[J].档案学研究,2017(1):51-56.

    [19]Interim Guidance[EB/OL].[2019-04-19].https://www.archives.gov/files/social-media/policies/831-2.pdf.

    [20]U.S. National Archives and Records Administration. Social Media Strategy[EB/OL].[2019-03-29].https://www.archives.gov/files/social-media/strategies/social-media-strategy-2010-12-08.pdf.

    [21]National Archives of America.Bulletin2014-02[EB/OL]. [2019-03-28].https://www.archives.gov/records-mgmt/bulletins/2014/2014-02.html.

    [22]Best Practices for Social Media Capture[EB/OL]. [2019-04-02].https://www.archives.gov/files/records-mgmt/resources/socialmediacapture.pdf.

    [23]National Archives and Records Administration. Automated Electronic Records Management Report/Plan[EB/OL].[2019-04-11].https://www.archives.gov/files/records-mgmt/prmd/A31report-9-19-14.pdf.

    [24]Social Media Strategy-Introduction[EB/OL].[2019-05-03].http://usnationalarchives.github.io/social-media-strategy/introduction/.

    [25]The National Library of Australia. Australian Government Web Archive[EB/OL]. [2018-09-19].http://webarchive.nla.gov.au/gov/about.

    [26]National Archives of Australia. Digital continuity 2020[EB/OL].[2019-04-18].http://www.naa.gov.au/information-management/digital-transition-and-digital-continuity/.

    [27]Basic Web Archiving Guidance[EB/OL].[2019-04-19].http://webarchive.nationalarchives.gov.uk/20150401005016/https://www.nationalarchives.gov.uk/documents/information-management/web-archiving-guidance.pdf.

    [28]Guidance for digital and records management teams[EB/OL].[2019-04-19].http://webarchive.nationalarchives.gov.uk/20150401005016/https://www.nationalarchives.gov.uk/documents/information-management/web-archiving-guidance.pdf.

    [29]Web Archiving at the Library of Congress[EB/OL]. [2019-04-25].https://www.loc.gov/webarchiving/about.html.

    [30]Heritrix. IA Webteam Confluence[EB/OL]. [2019-04-22].https://webarchive.jira.com/wiki/spaces/Heritrix/overview.

    [31]North Carolina State Government. North Carolina State Government Web Site Archives and Access Program[EB/OL].[2019-05-13].http://webarchives.ncdcr.gov/.

    [32]State of North Carolina - Social Media Archive[EB/OL].[2019-04-20].http://nc.gov.archivesocial.com.

    [33]北卡羅来纳州白酒产业推广的社交媒体档案[EB/OL].[2019-05-10].https://wayback.archive-it.org/all/*/http://twitter.com/VisitNCWine/.

    [34]ArchiveSocial.The Obama White House.Social Media achive[EB/OL].[2019-04-26].http://obamawhitehouse.gov.archivesocial.com/.

    [35]澳大利亞PANDORA项目[EB/OL].[2019-05-03].http://webarchive.nla.gov.au/gov/20130328233513/https://twitter.com/DBCDEgov.

    [36]中国Web信息博物馆项目[EB/OL].[2019-04-26].http://www.infomall.cn/.

    [37]王静.中美网页归档项目的对比研究[J].档案与建设, 2015(07): 19-23+14.

    [39]英国国家档案馆UKGWA项目[EB/OL].[2019-04-24].http://www.nationalarchives.gov.uk/webarchive/.

    [40]微口网.档案实务——社交媒体捕获归档工具大汇总[EB/OL]. [2019-04-28].http://www.vccoo.com/v/nvy8ux?source=rss.

    [41]王宁,曲春梅.美英澳政务社交媒体文件归档的经验及启示[J].北京档案,2017(4):41-44.

    [42]Archive-It Blog. About Us[EB/OL]. [2019-04-23]. https://archive-it.org/learn-more/.

    [43]Set up and administer your account-Archive-It Help Center[EB/OL].[2019-05-07].https://support.archive-it.org/hc/en-us/articles/207999976-Set-up-and-administer-your-account.

    [44]Announcing WebPreserver.Collect Web & Social Media as Legally Admissible Evidence[EB/OL].[2019-04-26]. https://www.prnewswire.com/news-releases/announcing

    -webpreserver---collect-web--social-media-as-legally-admissible-evidence-300062308.html.

    [45]National Archives of US. Bulletin 2014-02[EB/OL]. [2019-05-04].https://www.archives.gov/records-mgmt/bulletins/2014/2014-02.html.

    [46]Archive-It Help Center .Assign and edit a "seed type"[EB/OL].[2019-04-27].https://support.archive-it.org/hc/en-us/articles/208332843-how-to-assign-and-edit-a-seed-type.

    [47]MirrorWeb.a guide to social media archiving[EB/OL].[2019-05-07].http://www.mirrorweb.com/download-the-social-media-archiving-ebook.

    [48]PageFreezer Legal [EB/OL].[2019-05-03].https://legal.pagefreezer.com/homepage.

    [49]ArchiveSocial.Social Media Archiving Product[EB/OL].[2019-04-26].https://archivesocial.com/product/.