从期刊文献引证视角看学科结构与知识演变:以档案学为例
杨瑞仙 孙富杰 石凤娟
摘? 要:本文以档案学领域的八种核心期刊为数据来源,统计分析这些期刊论文的参考文献和引证文献数据,以管窥档案学与其他学科之间知识交流的特点和规律,并建议档案学领域加大与其他学科之间的知识交流深度,提高知识的转化效率,促进档案学的发展。
关键词:档案学;相关学科;被引率
Abstract: In this study, eight core journals in the field of archival science were used as data sources, and statistical analyzes were conducted on the references and citation data of these journal articles to provide insight into the characteristics and laws of knowledge exchange between archival science and other disciplines. The depth of knowledge exchange with other disciplines, the transformation of knowledge, and the development of archives science.
Key words:archives;related disciplines;cited rate1 引言
隨着信息化的推进,学科的交叉、融合现象凸显。本文通过对国内外档案学领域的相关文献进行整理分析,可以发现该领域的研究热点和研究前沿,同时还可以看出该学科也在不断地发展和前进,不断地引进其他相关学科的研究理论和方法,同时,它也在不断地渗透到其他学科中,成为其他相关学科的重要组成部分。国外的学者对档案学相关学科的研究有:苏联学者认为档案学可以利用历史、自然科学史和技术史以及史料学、辅助历史科目、文书学、情报学、国家机关史等科目的成果;德国档案学家认为,档案学既是一门历史学学科,又是一门情报学的学科[1]。国内的学者对这一主题的研究主要集中在定性研究、定量研究、定性和定量相结合的方面。2005年管先海在其文章中提出档案学需学习和借鉴相邻学科的研究成果,如图书馆学、情报学、方志学、统计学、管理学等的研究成果,借鉴相邻学科但又能形成独立的档案学理论[2]。学者们对档案学相关学科的定量研究并不是很多,2012年林强以Citespace为研究工具,对档案学文献进行可视化分析,得出了1998年-2010年的档案学研究热点和核心作者[3]。2013年徐芳在其硕士论文中以CSSCI为数据来源,通过统计2002年-2011年档案学论文的参考文献和施引文献,并使用Netdraw软件绘制了引用和被引网络图来分析档案学学科关联状况[4]。2014年李媚婵和奉国和运用Citespace对档案学领域的文献进行关键词分析、作者分析和机构分析,得出了我国档案学研究力量主要集中在高校,导致实践性不强,学术研究与国际交流不够,档案学研究处于基础阶段的结论[5]。本文采用中国知网引文数据库作为数据源,利用Gephi、Citespace这两个可视化工具绘制知识图谱,探讨档案学的知识吸收和知识扩散情况。2 数据来源与处理
2.1 数据获取。本文以期刊论文为研究对象,采用中国知网引文数据库,选取中国知网中收录的档案学八大核心期刊(分别是档案管理、档案学通讯、档案学研究、山西档案、中国档案、北京档案、档案与建设、浙江档案)[6]在2001年-2010年发表的10826篇论文的参考文献和引证文献,依据其参考文献和引证文献所发表的期刊进行学科分类,进一步揭示出学科之间的知识流动[7]。
2.2 数据整理。数据采集时间为2017年6月10日,我们首先把从中国知网引文数据库上下载的八个期刊论文的参考文献和引证文献复制到excel文件中进行整理,删除参考文献和文献题录中的专著、论文集、报纸文章、学位论文、标准等,只保留期刊论文题录;然后抽取出来源期刊名称,接着按照中国知网的学科分类将期刊对应到学科,再将参考文献的excel表中“学科”列加上“参”作为标记,代表档案学学科引用的学科。同理,将引证文献的excel表中“学科”列加上“引”作为标记,代表档案学学科被哪些学科引用。接着将一列是“参”或“引”加学科,一列是“参:”或“引:”加档案及博物馆(档案及博物馆代表档案学学科)。最后,将做好的excel节点表格保存成Gephi可以识别的csv文档,导入Gephi,绘制可视化知识图谱。3? 档案学学科关联可视化分析
基于以上数据处理可以绘制出与档案学相关的学科网络图(见图1),图的左边是档案学期刊论文引用的期刊论文所属的学科,图的右边是档案学期刊论文被哪些学科的期刊论文引用[8]。本文所研究的档案学学科在知网学科分类中属于档案及博物馆,所以图中的中间节点代表档案学[9]。左右两边的节点代表与档案学相关的学科,节点的大小代表文献量的多少,也代表与档案学的相关度的大小。
3.1 知识吸收。通过数据收集获得的档案学的八个核心期刊的引用文献总量是11200篇期刊文献。从表1可以看出,档案学引用自己学科的数量是8126,占总引用量的72.6%,说明档案学的自引率比较高,也就是档案学知识吸收来源主要是自己学科知识间的流动[10]。排名第二的学科是图书情报与数字图书馆,因为图书情报学与档案学本身就有紧密联系,在学科分类表中,它们同属于一个一级学科,档案学引用图书情报学领域的文献是非常普遍的,表1就非常明显能看出这两个学科的直接相关关系以及联系的紧密度。从引用主题上看,档案学引用图书情报学的主题有图书馆的自动化与网络化、专业教育、资源的开发与利用、图书馆信息服务与用户工作、本体、知识管理、信息可视化、引文分析等。排名第三的是教育综合,主要是因为档案学引用大学学报上的文献比较多。同时,档案学也引用了经济管理、电子信息科学、行政学与行政管理、计算机软件及计算机应用、高等教育、文史哲等领域的论文,但是引用比较少,都在1%以下,可见它们与档案学之间的相关度较低。
3.2 知识扩散。本研究获取的有效施引文献共39216篇,其中自己被自己引用的数量是19693,占总数的50.2%。从知识扩散的角度看,档案学的知识主要是对自身学科的发展贡献比较大,也表明档案学学科正在逐步发展成熟,成为一门相对独立的学科。其次是教育学,占9.5%,教育学施引文献主要涉及的内容是档案的科研与教学、专业教育。排名第三的是图书情报与数字图书馆,其对档案学文献的引用也较多,占比5.3%。同时,档案学知识也在向管理学、基础科学、经济与管理学、中国民族与地方史志、计算机软件及计算机应用等学科扩散。表2更直观地展示出档案学向其他学科的知识扩散情况。
3.3 学科发展及其影响。从知识吸收和知识扩散的综合角度来看,档案学学科内部的知识流动要大于它与外部的知识流动,档案学不论是引用自身的数量还是被自身引用的数量都远远高于它引用其他学科和被其他学科引用的数量,这是因为一个领域新的知识产生之后,不会引起其他学科领域的注意,而是在自身领域内进行发酵,并逐渐引起业内人士的注意,最终成为该领域的核心热点,这也说明档案学正在形成一套自己的理论体系,学科发展正逐步走向成熟。档案学在借鉴其他学科的理论、方法、工具来丰富本学科的学科体系的同时,也被一些学科吸收,融合到其他学科体系。通过对档案学领域知识吸收和知识扩散的分析,我们还可以看出除了档案学自身引用率较高外,它与教育学和圖书情报学的联系也较为密切,无论是从知识吸收角度还是从知识扩散角度看,教育学和图书情报学与档案学之间的知识交流都要高于其他学科,这是因为在学科发展的过程中,会不断与其他学科进行思想碰撞,进行知识交流,而最开始打开知识交流这扇大门的就是同类学科,比如档案学与教育学、图书情报学就属于同类学科,因为同类学科之间所研究事物的方法以及研究事物的方向在很多时候是相近甚至是相同的,它们之间有更多的知识交集,这也为它们的知识交流奠定了基础,如果两个学科没有知识交集,那么它们之间是很难直接产生知识交流的,这就像人与人之间的关系一样,越是有共同爱好的人越能聊到一起,没有共同爱好的人就很少有话说,这也说明教育学和图书情报学已经成为档案学领域的重要组成部分,它们的发展势必会影响到档案学前进的方向[11] 。4 知识流动热点分析
为了能够更加清晰地看出档案学与其他学科之间的知识交流,本文以与档案学联系最为密切的图书情报与数字图书馆(以下简称图情)为例,针对两者之间的知识交流进行分析。选取的数据是CNKI中2001年-2010年所谓10年,档案学所引用的图情文献和被图情引用的档案学文献为数据源,通过检索、去重共得到1380个被图情引用的档案学文献,837个档案学引用图情的文献。本研究选择Citespace 作为可视化工具,通过对搜集的数据进行关键词共现分析,可以得出档案学和图书情报与数字图书馆之间的知识交流热点[12] 。在Citespace 界面,时间切片选择1,主题词来源选择标题、摘要、关键词和标识符,分析节点选择关键词,算法选择Minimum Spanning Tree和Pruning Sliced Networks,数据抽取对象选择默认的Top50,点击运行就可以得到档案学和图情之间的知识流入和知识流出热点,如图2、图3所示。
如图2所示,我们很直观地可以看出2001年-2010年档案学流向图情领域的知识热点,图谱中圆形节点的大小代表频次的多少,节点的位置代表该节点的重要程度。从图2中我们可以看出档案学流向图情领域的知识热点,主要有档案信息、档案工作、国家档案局、数字档案馆、档案事业、档案利用、档案管理、国家档案馆、档案和现行文件等,不难看出,档案学领域的知识流出主要是本领域的知识流出,很少有其他学科的知识被吸收后再流出[13]。如图3所示,我们可以看出图情领域流向档案学领域的知识热点,主要有数字图书馆、图书馆、信息资源、信息服务、元数据、图书馆学、网络环境、长期保存、开放存取和信息管理等,同样是图情领域的主要研究内容。我们把两者的知识交流热点进行词频统计,如表3、表4所示,通过对比我们发现,档案学与图情之间进行知识交流时,基本都是本学科的理论知识单向流入另一学科,很少有知识再回流到本学科,只有极少部分会被本学科再次引用,通过词频统计我们发现档案工作、档案管理、档案、电子政务、档案学、信息资源、数字图书馆和信息服务等,在档案学与图情领域进行知识交流时有一定的回流比例,但占比很少,如表5所示,学科之间进行知识交流时很少有知识回流到本学科也是必然的,因为学科之间在进行知识交流时,更多是把吸收来的知识进行重新组织、加工,使之成为本学科的知识内容,它与原内容有相似之处,但不完全相同,因此学科之间进行知识交流时很少会有原学科的知识进行回流,更多是通过对知识进行吸收,促进本学科的发展,形成新的知识内容,进而再向其他学科进行知识流动[14]。
5 学科关联类别分析
根据学科关联的原因和内容,可以将档案学的相关学科分为同类学科、来源学科、交叉学科和技术支持学科[15]。同类学科是指在研究对象、研究方法等方面有相同或相似的学科,一般同类学科之间的联系较为密切,相互之间的知识流动也比较频繁。来源学科是指某一学科的原归属学科,由于信息资源的不断增多,研究领域的不断扩大,该学科逐渐独立出来,成为一门新的学科,但在研究方法等方面与原学科仍有着千丝万缕的联系。交叉学科是指学科之间在研究方法、学科特点等方面有着相似或相邻的关系,学科之间经常发生主题交叉,这些学科经常会对同一对象进行研究,往往在一门学科出现新的研究热点时,其他交叉学科也会受到影响。技术支持学科是指为某一学科提供理论或技术贡献的学科,通过运用其他学科的成熟的理论或者技术来研究该领域的问题。
档案学的同类学科有图书馆学和情报学,它们不仅在学科分类表中属于同一族,而且早期档案工作与图书馆工作紧密联系,学者们还对图情档一体化进行了深入研究。同时图书馆学和情报学被档案学引用的占比为8.8%,引用档案学的占比为5.3%。檔案学最早从历史学中孕育而来,所以把历史学归类于档案学的来源学科,档案最早是为编史修志服务的,随着时间的变化以及技术的革新,档案学与信息管理学联系广泛,但是从学科关系网络图中可以看出,档案学与其源头学科还是有着千丝万缕的联系,它被档案学引用的占比为0.5%,它引用档案学的占比为2.2%。教育学、政治学、法学、经济管理学等这些与档案学属于交叉学科。它们在学科分类表中的分类虽然有很大的差异,但是它们可能共同研究某一个主题或是将其他学科的理念应用于自己学科领域的研究中。比如,档案学教育教学以及科研可以借鉴教育学先进的教学理念,档案的管理工作也需要运用管理学的一些管理方法。它们被档案学引用的占比为7.3%,它们引用档案学的占比为13%。而计算机软件与计算机应用以及电子信息科学就为档案学的发展提供了技术支撑,也是档案学发展中必不可少的一部分,它被档案学引用的占比为1.3%,它引用档案学的占比也是1.3%。
如表6所示,从档案学引用学科角度来分析,档案学引用最多的学科为同类学科,占比8.8%;其次是交叉学科,占比7.3%;之后是技术支持学科和来源学科,占比分别为1.3%和0.5%。说明同类学科和交叉学科对档案学的影响较大,档案学与图书馆学、情报学、教育学、政治学、法学和经济管理等学科之间的知识交流也比较多,技术支持学科和来源学科虽然有一定的影响,但不是特别明显。
如表7所示,从档案学被引用学科角度来分析,引用档案学最多的是交叉学科,占比13%;然后是同类学科,占比5.3%;最后是来源学科和技术支持学科,占比分别为2.2%和1.3%。我们很容易可以看出档案学对交叉学科和同类学科的影响最大,尤其是在交叉学科中,占比达到了13%,位于其他所有学科之首,足以说明档案学对于交叉学科的重要程度,而技术支持学科和来源学科引用档案学领域的文献相对较少,学科之间的知识交流也比较少。
综上所述,我们可以得出以下结论,如图4、图5所示,我们可以看出在档案学领域,学科自引率和被自引率是非常高的,在自引率中达到了72.6%,在被自引率中达到了50.2%,表明档案学已经发展得很成熟,具有很高的独立性。档案学与其交叉学科和同类学科领域之间也有一定的知识交流,虽然不如档案学自身的引用那么高,但仍能够充分说明档案学也紧随信息时代的步伐,不断加强与其他学科的联系,促进学科之间的知识交流、共同发展。档案学与来源学科之间的联系较少,在参考文献和引证文献中的占比分别只有0.5%和2.2%,说明档案学已经不再那么依赖于来源学科,有了自己的研究问题和研究方法,成为一个独立的学科领域[16]。档案学与技术支持学科之间的联系也比较少,这是由于档案学研究的问题主要是理论问题,基本上不会涉及编程、运算等技术性问题,仅仅是借鉴计算机编写的软件或程序来解决该领域的研究问题,所以档案学与其技术支持学科之间的知识交流也较少。
6 学科关联影响因素分析
任何事物与其他事物发生联系都是由内部因素和外部因素决定的[17],档案学与其他学科之间的关联也不例外。
影响档案学与其相关学科关系的内部因素:每门学科都包含着诸多分支领域和丰富多样的内容,在一些研究内容没有被广泛认可或者没有权威性的成果时,该领域的研究会显得十分分散,不能够引起大家的关注,但随着知识的逐渐渗透和研究的慢慢成熟,越来越多的人开始关注该领域的研究,也逐渐成为研究热点,该学科的研究重心也会随之调整,与其关联的学科也会随之变化。档案学也是如此,在2001年-2010年档案学与其关联学科之间的关系一直起伏不定,一直没有较为稳定的学科关系,这也是由档案学的研究热点所决定的,所以学科自身内部的研究热点的变化会直接影响到它与其他关联学科之间的关系。
影响档案学与其相关学科关系的外部因素:档案学所处的学科环境会直接影响到档案学与其他关联学科之间的联系。每个领域研究学者都有很强的自主选择性,当一个学科领域出现新的研究热点时,会吸引其他学科的学者的关注,进而使其他学者在自身所处的领域进行研究,从而增加了两个学科之间的知识交流。
档案学要想不断丰富其理论体系,只靠内部的知识流动是远远不够的,还需要外部力量的推动。近年来,随着信息技术的发展,档案学学者更加注重档案信息资源管理与开发等方面的研究,因此更多地关注图书情报界的发展和研究动态,从而吸收或借鉴其研究观点和成果。可见,档案学也在根据社会技术的发展来调整自己的研究重心[18],因此档案学学科的发展是由内外部因素共同决定的。7 结语
档案学与相关学科之间的合作交流不断增强是时代发展的必然结果,关于档案学的学科关联研究,档案学界已有学者进行了初步探索,但主要集中于对文章的定性分析。本文主要是基于期刊论文的参考文献与引证文献数据以及运用引文分析、知识图谱、可视化技术等相关理论来研究档案学学科与相关学科的引用与被引用关系,对档案学目前的知识交流现状进行分析,得出档案学与其他学科知识交流的特点和规律,从而可以对学科的研究热点和研究方向进行准确分析和预测,促进档案学领域的发展,通过分析可以得出以下结论:(1)通过对档案学领域论文的参考文献和引证文献的分析,运用Gephi、Citespace等可视化软件绘制出学科之间的关联图,可以直观地看出各学科与档案学之间知识流动的大小和方向,其中档案学与教育学、图书情报学之间的知识交流最为密切,其次是经济与管理综合、政治军事法律综合、基础科学综合等学科。(2)对档案学的关联学科进行分析,可以很明显地看出档案学与交叉学科和同类学科之间的联系较为密切,与来源学科和技术支持学科之间的知识交流较少。(3)对学科关联影响因素的分析,可以得出档案学与各学科之间的关系并不是一成不变的,它是在档案学领域的内部因素和外部因素共同作用下产生的。参考文献:
[1]赵爱国.中外档案学体系比较初探[J].档案,1990(03):22-24.
[2]管先海.对档案学研究发展特点和理论体系构建的思考[J].档案管理,2005(03):21-24.
[3]林强.我国档案学研究现状的可视化分析[J].档案学通讯,2012(2):17-20.
[4]徐芳.我国档案学与相关学科的关联研究[D].山东大学,2013.
[5]奉国和,李媚婵.基于Citespace 的档案学研究可视化分析[J].档案学研究,2014(05):18-23.
[6]解俞,傅荣校.档案学研究十年(1995-2004):动态与问题——基于《档案学研究》、《档案学通讯》、《中国档案》论文分析[J].档案学通讯,2006(01):29-32.
[7] 傅荣校,解俞.十年来(1995-2004)档案学热点问题分布——基于《档案学研究》、《档案学通讯》、《中国档案》论文分析[J].档案学通讯,2006(06):29-32.
[8]胡泽文,孙建军,武夷山.国内知识图谱应用研究综述[J].图书情报工作,2013(03):131-137.
[9]潘连根.我国档案学研究的现状及发展趋势[J].北京档案,2002(04):12-14.
[10]Pettigrew K E, McKechnie L. The use of the information science research[J]. Journal of the American Society for Information Science and Technology,2001,52(I):62-73.
[11]Bluma C. Peritz, Judit Bar-Ilan. The sources used by bibliometrics-scientometrics as reflected in references[J] Scientometrics,2002,54(2):269-284.
[12]陳悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005(02):119-154.
[13]George M. Zinkhan, Martin S. Roth and Mary Jane Saxton. Knowledge Development and Scientific Status in Consumer-Behavior Research: A Social Exchange Perspective[J].Journal of Consumer Research,1992,(19):282-291.
[14]Eugene Garfield. Citation indexing——Its theory and application in science, technology, and humanities[M]. ISI Press Philadelphia, 1983: 61
[15]翟亚军.学科分类及相关概念梳理[J].北京邮电大学学报,2010(02):99-102.
[16]冯秀珍.档案学理论在实践中发展与创新[J].山西档案,2005(S1):108-109.
[17]J.Hipp,U.Guntzer,G.Nakhaeizadeh.Algorithms for association rule mining-a general and comparison[J].SIGKDD Explorations,2000(1):58-64.
[18]李财富.借鉴与融合:中国档案学发展的一个重要途径[J].浙江档案,2004(10):04-07.