区域性开放档案数字资源共享问题的思考
尹哲
摘要:针对新型冠状病毒性肺炎疫情爆发期间各地国家综合档案馆针对开放档案利用的应对情况,本文研究了国内各省市开展区域性开放档案数字资源共享的现状,分析了区域性开放档案数字资源共享存在的5个主要问题,论证了构建区域性开放档案数字资源共享平台的必要性,对共享平台应具备的5个基本功能提出了建议,并对未来开放档案数字资源共享的前景进行了预测。
关键词:“互联网+” 区域性 开放档案 数字资源共享
岁末年初,一场突如其来、始料未及的新型冠状病毒性肺炎疫情在湖北武汉暴发并随之向全国扩散蔓延。针对疫情期间利用者无法现场查档的实际情况,各地档案馆及时调整服务方式,采取通过电话和网络查阅渠道提供代查服务的办法,为公众查询档案提供安全、便捷的服务,受到利用者的欢迎。作为档案利用中的一类人群,开放档案的利用者范围非常广泛,既包含对档案和历史比较关注的专家学者、研究人员,也包含对档案知识感兴趣的普通群众。因此,开放档案内容信息的查考一直是档案界关注的热点。但是开放档案涉及的范围广,内容相对复杂,利用者更希望直接阅览档案原始内容,因此疫情期间如何采用方便快捷的方式满足此类用户需求显得非常重要。一、区域性开放档案数字资源共享现状
区域性的概念较为广泛,可以包括自然区域、人文区域和经济区域,按照目前档案行业的普遍管理体制,区域性的含义主要是指某一省/自治区/直辖市地理范围内的地区,也可以是跨省区域,如“京津冀”“长三角”等地区。区域性开放档案信息资源共享的概念为:一定区域内,在不改变档案现有的保管位置和实体所有权的情况下,根据开放档案数字资源的特点和用户的需求,借助各种现代技术、方法和手段,将区域内比较分散的开放档案数字资源进行整合与重组,建立区域性的开放档案数字资源中心或共享平台,以增强信息之间的相关性,提高开放档案数字资源的管理效率和利用效率,最终实现区域内开放档案数字资源的最佳社会共享和利用。[1]因此,从发展的趋势来看,由省级档案馆建设区域性开放档案信息共享平台是大势所趋。
据统计,2018年全国各级国家综合档案馆共开放档案10151.7万卷(件),同比增长了4.57%;全年接待利用者659.4万人次,提供利用档案2078.0万卷(件)次,同比分别增长了0.64%、2.18%。从以上数字可以发现,全国开放档案的数量和利用率正在逐年提高。[2]
笔者调研了除香港、澳门、台湾以外的31家省、直辖市和自治区档案馆门户网站,并对网站提供的开放档案查询服务进行了体验。从目前情况来看,部分省市档案部门已着手建设省级区域性开放档案信息共享平台,但建设内容、展现形式、取得效果均有待进一步提升。二、区域性开放档案数字资源共享存在的主要问题
(一)传统的档案服务理念相对落后
传统的档案服务理念是一种被动式服务模式,即利用者需要查找什么档案,档案馆提供相应的查询服务。档案馆的服务对象包含政府部門、科研人员、社会公众等,对不同的服务对象应采取不同的服务模式。政府部门由于有较强的查档意愿和明确的查档目标,采用被动式服务模式无可厚非。而开放档案利用的对象是科研人员和社会公众,恰恰与被动服务模式相反,需要档案馆主动服务,将已经鉴定为开放的档案信息资源通过各种媒介、各种形式加强宣传,主动为利用者提供服务,给利用者一种全新的体验。
(二)利用模式单一,用户体验效果差
在互联网时代和数字化时代的今天,利用者更多的是通过网络和信息技术来查找与传递信息。目前档案馆开放档案主要利用模式仍然是要求利用者到档案馆实地查阅开放档案原件或复制件,不能给利用者在互联网上提供实时在线的服务是目前开放档案信息获取的最大难题。这将大大降低用户查询和检索效率,实际体验效果不好,满意度很差。用户体验虽然没有非常明确的标准,但是只有数字档案共享服务的用户体验呈现出积极、愉快的效果时,数字档案用户才会再次利用数字档案或向其他用户宣传推广数字档案共享服务。[3]
(三)现有的系统功能不完备
目前各档案馆互联网开放档案信息查询服务一般只提供目录数据检索功能,而且检索方式仅局限于普通关键字检索,缺乏高级检索或者模糊检索的方式。利用者的检索结果均为一次性查询结果,利用者的关注条目不支持系统收藏或者标注记录。系统更不能根据利用者检索的关键字或检索结果向利用者提供相关内容智能推送或关联推荐。系统缺少一个便捷交流的功能以满足利用者遇到问题或提出意见时进行信息交互的需求。
(四)数字资源整合不够,数据类型单一
一些省市建设了区域性开放档案信息共享平台,但是平台中数据量少,且类型单一。这说明平台虽然已经建立,但是数字资源整合发布的组织工作并没有开展好。这也可能跟系统因各地档案馆数字资源格式不同造成的兼容性不足也有关系。由于各地档案馆数字化加工标准不同造成各类数字资源格式不统一。开放档案数据类型包括机读目录数据、纸质档案数字化副本、音视频档案数字化副本。目前各档案馆提供查阅的数据类型多以机读目录数据为主,真正具备查阅内容的纸质档案数字化副本数量极少,音视频档案数字化副本基本没有。
(五)数据质量难以控制,信息安全难以保证
开放档案共享平台上数字资源非常少的另一个重要原因是开放档案本身数据质量很难把控,如果档案中包含不宜开放甚至敏感、涉密的内容,发布在互联网上将带来极大的不良影响。由于对档案内容开放审查的难度较大,虽然应该高度重视档案信息安全,但是很多档案馆对开放档案会带来的安全隐患顾虑更多,导致数据上网的难度很大。三、构建区域性开放档案数字资源共享平台的必要性
(一)大数据时代数据整合共享是必然发展趋势
大数据时代的到来,对档案资源整合工作理念、方式都造成了严重的冲击,并且使档案资源数量逐渐呈上升趋势,在人们生产与生活中发挥着越来越重要的作用,有利于提升决策科学性,提升经济效益与社会效益。[4]在数字化时代背景下,档案数字资源与日俱增,运用大数据技术可以为相关人员提供更为精准、快捷的查档服务,大大提升档案信息资源服务效能。因此,大数据时代档案数字资源整合,有利于挖掘隐藏的信息价值,是现阶段信息化的发展趋势。利用技术融合和数据融合,实现跨层级、跨系统、跨地域的协同管理和服务,是实现档案部门实现战略转型的重要手段。然而,开展档案信息资源整合通常受到多种因素的制约,比如馆藏类别的差异、地理环境的限制等。所以,有必要构建一体化的整合体系,打破“信息孤岛”的格局,在“云计算”、Web2. 0挖掘技术等的引领下实现档案信息资源的整合。
(二)互联网时代开放档案实现在线查档是迫切需求
在“互联网+”背景下,利用者获取档案的随机性决定了其无论在何时面临何种档案需求会优先向网络求助。利用者在使用互联网时希望能以最短的时间、最简单的流程通过网络“零距离”获取档案信息。开放档案在完成档案开放鉴定工作的基础上应该能够实现在互联网上查阅,即使档案副本内容无法在线查阅,档案目录信息也应该完全可以在互联网上进行查阅。通过查阅档案目录信息并进行预约查档,利用者明确地了解到其具备该档案查阅权限。除了利用者到档案馆阅览以外,查档结果应该可以通过系统在线授权、电子邮件、线下邮递等方式提交给查档人,真正实现让数据多跑路、让群众少跑腿甚至“零跑腿”的“互联网+”档案服务。四、建议区域性开放档案信息资源共享平台应具备的基本功能
(一)平台整合管理功能
信息资源共享平台首先应具备将不同类型的开放档案数字资源进行整合并加以管理的功能。目前开放档案数字资源类型主要包括机读目录数据库、各类档案数字化副本等。由于机读目录数据库承担了数据检索的关键作用,因此数据库整合后字段设置非常重要,一般来说“档号”“题名”“日期”“责任者”“档案馆名称”等字段应选择保留,其他非重要的字段可忽略,而且“档号”“题名”“档案馆名称”等字段应设置为必填项以保证数据的准确性。由于各地档案馆数字化工作开展的水平不一,采用的数字化加工标准也不尽相同,会给数据整合带来很大难度。建议在导入平台前对数字化副本统一进行格式转换,转换后的数字化副本应保留图像原有样式和较高的质量,并且系统具备浏览时显示数据所在档案馆水印的功能。平台应至少设计三级用户:一是高级管理用户,可对系统功能和整体数据进行管理;二是一般管理用户,由高级管理用户分配对应权限,主要是各档案馆工作人员负责对本馆数据管理、用户交流、预约查档确认等权限;三是普通利用者用户,采用注册登记的方式,具有数据检索、原文阅览、预约查档等权限。
(二)平台公众交互功能
利用者对共享平台的使用方法和开放档案内容并不熟悉,通常会在遇到一些问题时需要与档案馆进行交互。利用者中非专业人士对明清档案、民国档案等历史档案内容更希望通过网络渠道向档案馆专业人士咨询。系统应具备留言咨询功能,用户提出关心的问题并由档案馆工作人员进行解答。利用者和档案馆之间需要双向互动的平台,档案馆通过利用者对档案进行进一步挖掘利用,发现档案的价值和内涵,更加重视档案保护和开发利用;利用者通过档案馆对开放档案的宣传,发现自己的关注与档案内容的契合点,更有利于对档案内在价值的研究。
(三)平台知识服务功能
“互联网+”时代的档案信息系统必须要从传统的信息检索平台转变为档案知识服务平台,主动向用户提供有价值的内容推送或信息訂阅服务。没有这些知识服务,利用者可能不知道自己的一些潜在需求;有了知识推荐,利用者的一部分潜在需求会被激发出来。在知识服务的过程中,平台应该充分根据不同利用者的个性需求提供个性化服务。所谓个性化服务是指在充分利用现有大数据技术的基础上,主动分析、推算用户的档案需求,再利用后台推送、个性化推荐等方式将适合的档案信息主动提供给用户,引发用户的关注。[5]要综合运用语义分析、机器学习、人工智能、知识图谱等大数据技术对海量数字资源进行分析和挖掘,探求数据之间的相关关系,发掘隐形知识和潜在价值,满足用户的知识需求。[6]
(四)平台共享扩散功能
平台数字资源经过整合以后还可以作为共享数据集在一定范围内进行扩散。例如北京、上海、浙江等省市都在开展所在区域的大数据行动计划,加强对政府部门、公用企事业单位及其他公共服务机构数据的统筹管理,而开放档案数字资源可以作为档案行业共享资源在所在区域的政务大数据平台上进行共享。利用者需要的是内容新颖、来源广泛、形式多样的数字档案,这就需要多个数字档案共享服务平台相互协作、互联互通,实现数字档案的跨地区、跨部门共享。
(五)平台协作功能
平台设计时不仅具有线上服务功能,在无法实现线上全流程服务的情况下,同时还应具备“线上+线下”协作功能。“线上”是指利用者登录系统后查询到需要的档案目录向档案所在地档案馆提出预约查档申请,档案馆线上收到申请并最终确认。“线下”是指利用者收到档案馆确认回复后到达档案馆实地调阅开放档案查阅或获取复制件的过程。系统将利用大厅延伸到互联网,对于查档要求实时性不高的请求高效地协同办理,能够较好地满足利用者的实际需求。五、结语
“互联网+”时代各行各业的竞争越发激烈,档案行业必须有一种居安思危的意识,在不断的总结经验和自我反思中才能取得进步。“互联网+”时代开放档案数字资源的便捷利用给档案行业的发展带来了新的契机,不仅仅是给利用者带来了很大的便利,也极大地减少了档案工作者的工作量,势必将形成一种双赢的局面。区域性开放档案数字资源共享平台的构建已经是大势所趋,这项工作需要前瞻性的指导思想、准确的服务定位、先进的技术支持、扎实的业务基础和有力的人才支撑。相信不久国内各地档案部门都将积极开展此项工作,建设完善的区域性开放档案数字资源共享平台,让档案更加走向社会,让社会了解档案。
注释及参考文献:
[1]方璐.我国区域数字档案资源整合问题与策略研究[D].南昌大学,2018.
[2]搜狐新闻.国家档案局:让利用者足不出户实现查档需求[EB/OL].[2019- 03- 29].https://www.sohu. com/a/304689237_162758.
[3]马仁杰,丁云芝.论互联网+背景下我国档案利用者心理需求特点与对策[J].档案管理,2017(1):30-32.
[4]付鑫.大数据时代档案数字资源整合的难点及建议分析[J].兰台内外,2018(11):13-14.
[5]陈伟斌.基于用户体验的数字档案共享服务研究[J].档案管理,2019(2):43-44.
[6]王顺,徐华.大数据时代我国数字档案馆信息服务的问题与对策[J].北京档案,2018(10):17-20.
作者单位:北京市档案馆