数字人文视角下的档案信息资源开发问题与对策
赵雪芹 党昭 李天娥
摘要:数字人文为档案信息资源开发工作带来了先进的技术和思维,推动了档案信息资源开发工作的创新发展。文章探讨档案信息资源开发工作应该如何结合数字人文与时俱进。首先,从档案信息资源开发工作的开发主体、开发客体、开发过程、开发成果和档案信息用户五个角度分析了数字人文带来的积极影响;其次,指出了目前档案信息资源开发还处在数字化阶段、开发项目规模较小且分散、档案馆参与的数字人文项目占比较低、开发项目涉及领域单一;最后,可从转变数字档案信息资源整合方式、扩大开发工作规模、深化与数字人文研究团队的合作、拓宽开发工作涉及的领域四个方面来改进上述问题。
关键词:档案信息资源开发 数字人文 数字档案馆
Abstract:Digital humanity brings advanced technology and thinking to the development of ar? chival information resources, and promotes the in? novative development of archival information re? sources development. This paper discusses how the development of archival information resources should be combined with Digital Humanities to keep pace with the times. Firstly, it analyzes the positive impact of Digital Humanities on the devel? opment of archival information resources from five perspectives: the subject, the object, the process, the results and the users. Secondly, it points out that the current development of archives informa? tion resources is still in the digital stage, the scale of development projects is small and scattered, the proportion of Digital Humanities projects that archives participate in is relatively low, and the de? velopment projects involve a single field. Finally, we can improve the above problems from four as? pects: changing the integration mode of digital ar? chives information resources, expanding the scale of development work, deepening the cooperation with the Digital Humanities Research team, and broadening the areas involved in the development work.
Keywords:Archives information resources de? velopment; Digital humanities; Digital archives
檔案信息资源开发一直是档案学领域的重要研究方向,同时也是档案实践工作中最具活力的一个环节,因此档案信息资源开发既是实现档案自身价值的根本途径,也是发展档案事业、传播档案文化的重要途径。如今正是一个数字技术与人文科学相互交融的时代,数字技术为人文学科的发展提供了工具和发展的新思路。我国档案工作者应该抓住数字人文浪潮的机遇,创新档案信息资源开发的技术和形式,整合数字档案资源,以满足公众对档案信息资源的多样化需求,进而增强档案部门的信息服务能力。
目前我国利用数字人文进行档案信息资源开发正处于初级发展阶段,相关理论研究还比较少。朱令俊通过分析欧洲联合数字档案基础设施(CENDARI)项目和威尼斯时光机项目构建了基于数字人文的档案信息资源开发模式[1];杨千结合档案数字人文项目的主体、目标和实施三个方面构建了一个数字人文框架下档案资源开发的新模式[2];赵生辉介绍了国外档案数字人文项目的特点并据此提出了对我国档案数字人文项目实践的启示[3];张卫东等人详细介绍了基于数字人文的档案文化资源整合过程[4];董聪颖通过分析威尼斯时光机项目阐述了数字人文对档案信息资源开发利用带来的影响[5]。
综上所述,国内关于档案数字人文的理论研究包括经验总结、介绍国内外先进案例并进行比较研究、构建新的档案信息资源开发模式等,暂时缺少对数字人文环境下的档案信息资源开发工作现存问题的研究和探索。因此,本文在数字人文视角下,从档案信息资源开发工作的五要素角度分析了数字人文对档案信息资源开发工作带来的积极影响,提出了工作中现存的一些问题,并探讨了可行的改进思路。从数字人文的视角来探究档案信息资源开发的新思路有利于全面认识技术与人文交融的现实状态,也可以在一定程度上丰富档案信息资源开发方面的理论研究,有助于促进档案信息资源开发与数字人文的跨界合作。
一、数字人文的发展阶段
数字人文是指充分运用计算机技术开展的合作性、跨学科的研究、教学与出版的新型学术模式和组织形式。[6]其历史可以追溯到20世纪40年代末期,发展至今可粗略划分为三个阶段。
(一)早期计算机与人文研究时代(20世纪中期)
1949年,意大利耶穌会学者罗贝托·博萨(Ro? berto Busa)与IBM合作,使用基于计算机的自动化技术为神学家托马斯·阿奎那的作品建立了《托马斯著作索引》,开创了“人文计算”的先河。随后诞生了数字人文领域的第一本专业期刊《计算机和人文学》以及专门研究机构“文学与语言学计算协会”。这一时期的数字人文活动通常集中在文学、语言学领域,主要是运用计算机进行人文语料库建设和文本分析。[7]
(二)人文计算向数字人文过渡时代(20世纪后期—21世纪初)
20世纪90年代初,“人文计算”开始被当作一个独立的交叉学科进行研究。随着计算机图形用户界面和万维网的诞生和发展,人文学者开始运用多媒体技术来组织分析人文知识。超文本数字技术的运用逐渐削弱了文本的核心地位,并且人文计算的研究领域也从文学、语言学扩展到了历史、地理、图书情报等多个领域。“人文计算”已经不能全面、准确地指代这一研究领域的内涵与外延,学界认为应采用新的术语来代表此领域的研究。2001年,布莱克维尔出版社出版了《数字人文指南》一书,此后,“数字人文”一词逐渐取代“人文计算”,成为代表这一研究领域的新术语。[8]
(三)当代数字人文时代(21世纪至今)
进入21世纪以来,世界范围内的数字人文项目取得了较快发展,美国的相关研究在世界范围内处于前沿地位。美国国家人文基金会(NEH)肯定了数字人文在推动人文学科发展上的巨大潜力,于2006年专门设置了“数字人文办公室”,以资助数字人文项目的顺利开展。各国纷纷建立数字人文中心展开数字人文项目实践,当代数字人文超越了简单的数据仓储建设和文本编辑与分析,更强调动态的视图化的知识生产和组织模式。
二、数字人文对档案信息资源开发的积极影响
数字人文的发展对档案信息资源开发工作的影响是探讨数字人文视角下档案信息资源开发工作改进思路的前提。
(一)档案信息资源开发主体多元化
随着数字技术的发展,原生电子档案和数字化档案资源越来越丰富,世界各国都在尝试建设档案数字人文项目,如美国的“影谷项目”、英国的“沃顿小镇”项目,以及我国的“津沽史料”“上海记忆”等项目[9]。同时,价值是主客体之间的关系范畴,主体的需要是构成档案价值的前提条件。[10]如果仅以档案馆作为档案信息资源开发的主体,难免会出现开发成果与用户需求不匹配的问题,使档案的价值难以实现。特里·库克等档案学家呼吁档案工作者在数字时代应该成为辅导员、宣传员,鼓励社会公众参与到社会记忆构建中来,以客观公正地反映历史、记录历史。[11]因此,档案领域数字人文项目使档案部门与数字人文研究团队的合作更加深入,档案馆、数字人文研究团队和社会公众逐渐成为档案信息资源开发的多主体。
(二)档案信息资源开发客体微观化
档案信息资源是档案信息资源开发活动的客体[12],是档案信息资源开发工作的基础。现实中,档案馆受到管理能力和资金等客观因素的限制,档案鉴定工作必然会造成某些文件、文件形成者、职能、活动以及社会群体受到优待,而另一些则被边缘化或沉默化。[13]因此,研究者们开始把目光移向社交媒体档案上来,如英国国家档案馆在2009年开始对政府网页和社交媒体进行收集和保存[14];美国国会图书馆在2010年开始对推特(Twitter)自2006年产生的推文进行保存[15]。社交媒体档案的收集和保存意味着档案信息资源的开发工作不应该只专注于宏观的国家大事、名人事迹,普通民众的真实生活和见闻也应该被记录下来。
(三)档案信息资源开发过程合作化
档案信息资源开发过程是将档案信息经过开发转化为相关成果的系统程序。[16]传统档案信息资源开发强调馆藏基础原则,这种开发方式未实现馆藏档案信息资源与用户需求的有效衔接。数字人文的开源共享理念和先进技术促进了档案领域与数字科技的跨界合作,创新了档案信息资源开发的观念并催生了新的开发模式。当前,越来越多的档案数字人文项目以用户需求为导向,以海量档案信息资源为基础,依托先进技术和创新视角,进行档案信息资源深度开发。[17]
(四)档案信息资源开发成果多样化
传统档案信息资源开发成果的类型主要是文本和影音,仅能供人们阅读和倾听,数字人文的加入使得档案信息资源开发成果更加丰富多样。如英国纽卡斯尔市的泰恩·威尔档案馆和博物馆、市图书馆等多家机构联合开发的一款App——“隐秘的纽卡斯尔”。[18]使用这款App漫步在纽卡斯尔的街道上,它将像智能导游一样根据位置信息实时向用户推送相关的照片、影像等档案信息。这种即时的历史与现实碰撞的沉浸式体验远比静态展示档案信息文本更有效果。数字人文的发展对档案信息资源开发提出了新要求、提供了新方法,未来的档案信息资源开发成果将朝着多样化方向发展。
(五)档案信息用户普遍化
用户是否满意是检验档案信息资源开发工作是否合格的重要标准。由于用户的教育背景和成长环境具有很大差异,档案利用需求也是多种多样的,而传统的档案信息资源开发成果过于单调,难以满足广大群众的多样化利用需求。在数字人文热潮下,档案信息资源开发工作开始对更贴近人们生活的题材进行开发,讲述人们自己的故事;开发工作涉及的主体更多元,普通公众有机会参与其中;开发成果也更加多样化。这些变化降低了档案信息资源利用的门槛,必然会吸引更多普通公众利用档案信息资源,推动档案信息利用由小众走向大众。
三、数字人文视角下档案信息资源开发存在的问题
虽然数字人文的发展为我国档案信息资源开发带来了很多积极影响,促进了开发工作的进步与创新,但与国外先进地区相比,我国的档案信息资源开发工作仍存在不足。
(一)档案信息资源开发还处在数字化阶段
我国的档案信息资源开发主要还停留在“数字化”階段,即主要是通过档案数字化以及检索途径的丰富来建设数据库。其目的在于减轻人文研究者的负担,把他们从机械的资料收集劳动中解放出来,但发现问题、分析问题的工作还是由人脑完成,未能发挥数字技术统计分析海量数据的优势,尚未进入“数据化”阶段。档案信息资源开发深度不足,不能将档案信息的粒度从文件级转变为数据级,从信息单元转变为知识节点[19],机器无法识别档案数字化扫描件中的具体内容,这给数据的管理和分析工作带来了很大的不便,档案数据化加工的工作任重道远。
(二)档案信息资源开发项目规模较小且分散
我国的档案信息资源开发项目主要由高校、图书馆、档案馆等研究机构展开,未能与更多领域展开合作,也未能吸引社会公众的广泛参与,缺乏社会性。由于开发主体较为分散,各机构、各地区“各自为政”,也未形成科学的项目开发模式。一方面,这样难以形成广泛的社会影响力;另一方面也难以保障项目成果的质量。如青岛市档案馆的“老青岛”项目、上海市档案馆的“上海记忆”项目的规模都比较小,仅局限于该城市的档案馆内,其开发成果都只在各自对应的档案门户网站上呈现,并且在网站上所占的位置也比较隐蔽,普通用户很难找到,其所呈现的内容也相对单薄,只包含了少量的文字和图片。
(三)档案馆参与的数字人文项目占比较低
目前国内具有代表性的数字人文项目大多由高校或图书馆牵头发起,如上海图书馆的“上海年华”项目、中国人民大学的“北京记忆”项目等。而档案馆参与的数字人文项目很少,目前所知的只有“老青岛”项目、“上海记忆”项目、“津沽史料”等寥寥数个,并且在开发成果的质量和影响力上与图书馆和高校的数字人文开发成果相比差距较大。由图书馆或高校开展的数字人文项目都以独立网站的形式展示其开发成果,内容比较丰富,检索体系比较完整。而由档案馆开展的项目成果通常只在其相对应的档案馆门户网站中展示,其内容比较单薄,检索途径也比较单一。
(四)档案信息资源开发项目涉及领域单一
在儒家注重学史的教育思想、历朝历代重视编史修志以及5000年深厚历史底蕴的影响之下,我国的档案信息资源开发工作主要致力于史学研究和社会记忆留存,在其他领域还存在较大空白。美国的档案数字人文项目涉及的领域很多,除历史学外,还涉及文学、地理学、建筑学等学科。如哈佛大学的“漫步伊甸园”项目,它由哈佛大学地理信息中心利用地理信息系统将保罗·萨洛佩克在全球范围内徒步行走的过程中产生的照片、影像、手稿,以及其行程中的GPS数据绘制成可视化地图,该项目还涉及历史学和文学。[20]而我国的“北京记忆”“盛宣怀档案知识库”等档案数字人文项目主要还是服务于历史文化研究。
四、数字人文视角下档案信息资源开发的新思路
(一)转变数字档案信息资源整合方式
档案数字人文项目必须基于一定规模和体系的档案数字资源才能有效开展,因此按照特定主题对现有的馆藏档案资源进行系统整合是开展档案数字人文项目的基础工作之一。档案信息资源整合可以分为实体档案资源整合和数字档案信息资源整合两个方面。我国实体档案资源整合的经典案例是“深圳、广东顺德、上海浦东新区的‘多档合一模式”和“安徽和县的集中管理模式”[21],其将本行政区划内的多个档案馆进行合并统一管理,实现了档案资源的重新整合与共享,破除了各档案馆之间的信息壁垒,有效避免了档案资源重复管理的资源浪费现象。数字档案信息资源整合应借鉴实体档案资源整合的实践经验,破除“本馆”“本室”的界限,自觉将“本馆”“本室”纳入本地区、全国乃至全球的档案信息资源网络体系中来。
(二)扩大档案信息资源开发工作的规模
我国的档案信息资源项目开发主体较为分散,大多由图书馆、档案馆以及高校科研机构开展,未能形成各领域间的联动。为扩大数字人文背景下档案信息资源开发工作的社会影响力,国家应在宏观层面出台相关政策支持、引导档案部门与数字人文研究团队以及其他学科领域进行合作,建立健全相关技术标准,规范档案数字人文项目开展流程,避免因各地区标准差异造成的开发成果冗杂和资源浪费。此外,档案馆应加强国际交流与合作。档案馆可以积极与国外高校、数字人文中心进行合作与交流,借鉴国外档案数字人文项目的先进管理经验和技术。如浙江大学和哥伦比亚大学合作的“甲骨文数字化”项目,北京大学、哈佛大学费正清中国研究中心等合作的“中国历代人物传记资料库”项目等。[22]
(三)深化档案部门与数字人文研究团队的合作
档案部门应该重视对档案信息内容的深层次开发,创新档案信息开发成果的呈现形式,从整合的档案信息资源中创造出新信息、新知识。然而,档案部门受自身数字技术水平的限制,想要独立达到这种开发水平的难度较大、成本较高。而数字人文研究团队汇集了信息技术领域的专业技术人员,能够为档案信息资源开发提供技术支持和新的思维方式。因此,档案部门应积极参与档案数字人文项目,通过数字人文研究团队提供的先进技术开发更富创造力、竞争力的成果,实现档案部门与数字人文研究团队的优势互补,也为档案开发工作的未来储备优秀人才。
(四)拓宽档案信息资源开发涉及的领域
一是应将公众纳入开发主体中,发挥集体智慧。档案馆可以通过“众包”鼓励公众参与档案信息资源开发。档案馆作为发包方可在前期设置一定的准入门槛并对报名者进行甄选,以控制志愿者的数量和质量,然后,制定项目的整体规划,粗略估计项目进程;在项目进行期间,应及时对参与者进行指导并严格监督项目执行过程和完成情况,在此基础上调整项目计划;在项目完成后,档案馆应审查项目成果,及时修正发现的问题,确保最终成果的质量。[23]通过这种形式可使公众从档案信息资源开发的利用者转变为开发者,档案馆能够从中获取档案信息用户的真实需求,扩大档案信息资源开发成果的适用范围。
二是应促进档案部门与其他学科进行合作开发。档案作为人类社会生活实践的原始记录,能够为其他学科的科学研究提供优质资料。档案部门可以与其他学科领域展开合作,针对该领域的特殊需求共同开发档案信息资源,这样档案信息资源开发涉及的领域也会得到扩展。如流行病学家马塞尔·萨拉西与“威尼斯时光机”项目展开合作,研究17世纪中叶鼠疫肆虐威尼斯的情况。档案数字人文项目可以与医学、政治经济学等众多学科领域进行跨界合作,以精准需求为导向,开发档案资源。
五、结语
随着数字技术的快速发展和广泛应用,越来越多的人文学者开始探索数字技术与人文研究深度融合的新模式。利用数字人文的方法与技术创新档案信息资源开发工作,既符合国家的发展规划,也顺应了时代的发展趋势。档案信息资源的整合、开发、涉及领域以及档案部门与数字人文团队的合作是数据时代档案开发利用的创新体现,数据可视化、数据挖掘分析等数字技术为档案数字人文项目奠定了技术基础。数字人文的兴起为档案信息资源开发工作的转型和发展提供了契机,档案工作者应该抓住机遇,提高档案信息资源开发工作的水平,更好地维护档案机构科学文化事业中心的地位,发挥好其科学文化传播的作用。
注释及参考文献:
[1]朱令俊.基于数字人文的档案信息资源开发模式构建和实施研究[J].浙江档案,2018(12):21-23.
[2][19]楊千.数字人文视域下我国档案资源合作开发模式研究[J].档案与建设,2019(10):8-12.
[3]赵生辉.国外档案领域数字人文项目的实践与启示[J].浙江档案,2015(9):14-17.
[4]张卫东,张天一,陆璐.基于数字人文的档案文化资源整合研究[J].兰台世界,2018(2):17-20;16.
[5]董聪颖.穿梭千年:数字人文对档案信息资源开发利用的影响[J].档案管理,2018(2):11-14.
[6][7][8]伯伦克,德鲁克,伦恩费尔德,等.数字人文:改变知识创新与分享的游戏规则[M].北京:中国人民大学出版社, 2018: 51-52.
[9][20]刘晋如.中美档案数字人文项目比较研究[J].档案管理,2019(2):33-36.
[10]冯惠玲.档案学概论[M].北京:中国人民大学,2006: 47-48.
[11][13]库克,李音.四个范式:欧洲档案学的观念和战略的变化:1840年以来西方档案观念与战略的变化[J].档案学研究,2011(3):81-87.
[12][16][21]金波.档案学导论[M].上海:上海大学出版社, 2018: 263-264.
[14]梁皆璇.英国政府网页档案项目及其启示[J].北京档案,2014(12):38-40.
[15]张小飞,曹航.新媒体视角下的档案信息资源开发理念创新[J].北京档案,2018(9):40-43.
[17]牛力,刘慧琳,曾静怡,等.数字时代档案资源开发利用的重新审视[J].档案学研究,2019(5):67-71.
[18]Tyne and Wear Archive & Museums.About Hidden Newcastle[EB/OL].[2019-08-07].http://www. hiddennewcastle.org.
[22]邓要然.美国图书馆领域数字人文项目研究[J].图书馆工作与研究,2017(8):29-35.
[23]詹逸珂.数字人文项目前端历史档案资源众包探析:特征、风险及其控制[J].山西档案, 2020(2): 77-84.
作者单位:湖北大学历史文化学院