我国档案学文献定量研究的发展现状与热点分析

    李晓明

    

    

    

    摘 要:为系统总结我国档案学文献定量研究的发展现状,分析近年的研究热点,依据从中国知网检索获取的相关文献及其增长的数量变化,将档案学文献定量研究近30年的发展划分为三个阶段,分析了各阶段的主要特征;结合使用CiteSpace绘制的关键词共现网络知识图谱,从三个层面梳理了近五年档案学文献定量研究的热点。

    关键词:档案学;文献定量研究;文献计量;研究热点;知识图谱;CNKI;CiteSpace

    Abstract: In order to systematically summarize the development situation of literature quantitative research on archival science, and analyze the research hotspots in China in recent years, this paper divided the 30 years research into 3 stages and analyzed the main features of the different stages, based on the relevant literatures obtained from CNKI by the range of the literature growth. The hotspots of literature quantitative research on archival science in recent five years are analyzed from three aspects, with the help of the network knowledge map of keywords drawn by the CiteSpace software.

    Keywords: archival science; literature quantitative research; bibliometrics; research hotspots; mapping knowledge domains; CNKI;CiteSpace

    1 引言

    文献定量研究是指运用文献计量、科学计量、情报计量、社会网络分析等定量分析方法,从文献及其有关计量元素的数量及其关系和变化等角度来分析学科或主题领域发展变化的一种研究方法,旨在通过定量化的研究来揭示学科或主题领域的现象、过程和规律。文献计量是最早使用并沿用至今的文献定量研究方法,在我国的研究运用始于上世纪70年代末[1]。科学计量、情报计量、信息计量等也随着技术和科学的发展,在文献计量的基础上发展起来,成为关系紧密而又难分难解的邻近学科,也一并成为文献定量研究的几类主要方法。近年来社会网络分析、知识图谱和可视化等随着计算机技术而成熟起来的方法,为文献定量研究注入了新的活力。

    文献定量研究原本是图书馆学科的研究方法,档案学作为同属一个专业类的学科,在学科发展过程中注重借鉴这种方法而使之在档案学研究中得到越来越多的运用。从中国知网(CNKI)检索到的最早的档案学文献定量研究论文发表于1989年,至今已有近30年的历史。回顾和梳理这近30年的历程,总结发展过程中的经验,分析其中的问题及不足并寻求解决之道,对于促进档案学文献定量研究具有现实意义。2014年,王新才等[2]以CNKI期刊导航中的27本档案学期刊为统计源,对运用计量法研究的学术论文进行统计;2016年,陈忠海等[3]统计分析了2004-2015年《档案学通讯》《档案学研究》刊载应用定量研究方法的论文,其中涉及文献调查、h指数等文献定量研究的几类方法。尽管已有少量的相关研究,但这些研究有的分析的样本范围不够全面,有的分析的视角超出了文献定量研究的范畴。因此,有必要以种类更多、数量更大的样本为依据,进行深入的总结和分析。

    2 研究依据与方法

    本研究以从中国知网检索获取的档案学文献定量研究的期刊、会议、學位论文作为分析依据;以文献计量和知识图谱分析为主要研究方法;以CiteSpace[4]及自编软件为数据处理和分析工具。

    2.1样本文献检索。为确保样本数量尽可能接近总体,采用了分次检索的方法,经反复调试后,限定检索年限为1989-2016年。第一次以“计量、知识图谱”等28个定量研究相关词汇为检索词对期刊、博士、硕士、特色期刊、学术辑刊和国内会议共六个数据库进行篇名检索,再以“档案、依法治档”等23个档案专业词汇在结果中检索篇名;第二次先以28个文献定量研究相关词汇对期刊、特色期刊和学术辑刊三个期刊类数据库进行篇名检索,再以“档案学研究”等29种档案期刊刊名(含曾用刊名)在结果中检索来源期刊,检索时间是2017年4月26日,两次检索的结果分别为3249篇和2001篇,作为初选的样本数据。

    2.2 样本数据处理。由于两次检索结果会有部分期刊类的重复数据,同时为提高查全也势必造成较多的误检,必须进行细致的数据处理。数据处理由以下几个过程完成:将两次检索的结果分别保存为电子表格格式后,用WPS表格转换成数据表格式(DBF);利用自编的数据库软件进行作者、关键词和机构的拆分;合并两次检索数据并自动删除重复数据;通过逐一核对原文,剔除无关数据,修正了拟作为有效样本的题录数据,一稿多投的保留一篇,同时对拟作为样本的数据进行了进一步加工(从正文中抽取了研究主题、方法等文献题录外的部分计量元素);利用自编的机构字典,统一了机构名称,区分了同名作者,清除了CNKI的机标关键词,并对部分关键词进行了规范。完成以上处理后,得到有效样本496篇,其中期刊论文473篇、学位论文20篇、会议论文3篇。

    文献被引和下载数据也检索自CNKI,由自编软件处理后合并到统计分析用的数据表中,本研究中用到了文献被引频次。