标题 | 近十年我国数字图书馆学术论文的计量分析 |
范文 | 刘成山 张秀君 [摘要]本文以CSSCI源期刊为数据来源,对2000-2010年的数字图书馆学术论文进行统计分析,用文献计量学方法分析其时空分布、作者分布和主题分布,并用聚类方法对论文主题进行了分析,借以探讨近十年来我国数字图书馆研究的现状、进展及趋势,为我国数字图书馆的进一步研究提供有益参考。 〔关键词〕数字图书馆;文献计量;统计分析;聚类分析 DOI:10.3969/j.issn.1008-0821.2011.03.028 〔中图分类号〕C931.6;TP393 〔文献标识码〕A 〔文章编号〕1008-0821(2011)03-0113-04 Statistic Analysis of the Papers on Digltal LibrariesLiu Chengshan Zhang Xiujun (Economic Management School,Xidian University,Xi餫n 710071,China) 〔Abstract〕The paper gave a statistical analysis of papers on digital libraries issued CSSCI from 2000 to 2010.Their temporal and spatial distribution,author distribution and subject distribution are surveyed by bibliometrics method and their subjects were analized with cluster analysis.The purpose was to discuss the current situation,progress and tendency of the research on digital libraries in the past ten years in China,in order to provide a beneficial reference for further research on digital libraries. 〔Keywords〕digital libraries;bibliometrics;statistical analysis;cluster analysis 在数字图书馆领域,我国的学者已经进行了十余年的研究和实践,取得了斐然的成绩,研究理论趋于成熟,同时建立了一批试验性的数字图书馆系统。本文对近十年来发表在情报学和图书馆学重要期刊上的关于数字图书馆的学术论文进行文献计量与统计分析,力图客观地反映出十年来我国数字图书馆的理论和实践的发展状况,从而分析预测我国数字图书馆领域的研究热点与发展方向,探讨国内研究存在的问题并提出相应的建议,为数字图书馆的研究者提供参考,为推动和促进我国数字图书馆健康发展提供数据支撑和理论支持。 1 数据来源和统计方法 CSSCI(中国社会科学引文索引)[1]的来源期刊具有出版相对稳定、专业性强、学术影响力大等特点,能客观地反映学术研究的基本走向,因此本文选择CSSCI的来源期刊的论文进行统计。利用全球最大的中文知识门户网站CNKI(中国知网)[2]的“中国期刊全文数据库”,限定时间为2000年1月1日-2010年5月1日,题名为“数字图书馆”进行精确检索,限定范围为CSSCI来源期刊的中国图书馆学报、情报理论与实践、中国科技期刊研究、情报科学、情报学报、图书情报知识、图书与情报、档案学通讯、现代图书情报技术、图书馆杂志、图书馆论坛、档案学研究、大学图书馆学报、图书馆理论与实践、图书馆工作与研究、情报杂志、图书情报工作、情报资料工作、图书馆、国家图书馆学刊、图书馆学研究和图书馆建设等22种,结果共检出2 225篇相关文献。删除其中与研究没有直接关系的题录(消息、通知等),实际为2 080篇,合并连载的论文,剩余2 062篇。对这2 062篇文献以手工计数核实,并择要查阅原文。然后对这些文献在期刊中的分布、作者构成等情况进行分析,就这些论文的研究主题进行讨论,同时利用SPSS统计工具进行聚类分析。2 论文的统计分析 2.1 论文的期刊和时间分布 按照上述条件检出的2 062篇论文在CSSCI源期刊的分布和时间的分布见表1 2011年3月第31卷第3期近十年我国数字图书馆学术论文的计量分析Mar.,2011Vol.31 No.3从表中数据可以看出,我国数字图书馆的研究一开始处于增长态势,2002年达到顶峰,然后处于较平稳状态,2007年开始明显下降并保持在了一定水平。这种局面并非是目前研究热潮已经过去了,而是相关的研究更深入、更具体,不再局限于理论方面,而是向着深层次的方向发展。 情报杂志、现代图书情报技术、图书情报工作是近十年载文量最大的3种杂志,占载文总量的34.77%,处于布拉德福定律[3]的核心区;其次是情报科学、情报资料工作、图书馆理论与实践、图书馆论坛、图书馆杂志和中国图书馆学报这6种杂志,占载文总量的38.89%。所有期刊平均载文量为93.73篇,可以看出我国文献集中程度较高,这对专业人员的研究比较有利。 2.2 论文主题分布 论文的研究主题分布如表2所示。 从表2可以看出,近年来数字图书馆的建设发展和相关技术是研究的重点,2002年高峰期结束后,随着年总发文量的逐年下降,数字图书馆理论研究与发展建设方面的论文数量也呈下降趋势,而数字图书馆技术方面的发文量则保持较高势头,年均发文量在30篇左右。由此,可以将2002年作为一个分界点,此后我国数字图书馆研究对初期理论研究与发展建设方面的比重有所减少,而更偏向于技术性方向的深入研究。同时数字图书馆的服务与其相关的法律问题也越来越受到学者们的关注,其中数字图书馆的参考咨询服务更是当前研究讨论的新热点,知识产权问题也是数字图书馆发展过程中遇到的法律问题的核心,两者共占总发文量的18.33%。不难看出,数字图书馆的馆员素质研究及元数据研究仍然是国内的研究薄弱点,今后应该加强理论与实践结合的力度,使我国的数字图书馆研究走向成熟。 3 作者的统计分析 3.1 作者的所属系统和地区分布 检出的论文共属1 430位作者,其所属的系统分布见表3:表3 作者所属系统分布 所属系统作者数量所属系统作者数量高 校1 151部 队24图书馆98研究所23中科院61公 司20党 校38其 它15在1 430位作者中,来自高等院校的占了最大比例,超过了八成。在表中没有表示的是,在高等院校作者中,来自图书馆的比其它系统的多。另外,来自公共图书馆和中科院的作者所占比例相比其他系统的作者要高,总共占11.12%,而其余系统的作者所占比例仅为8.39%。在数字图书馆的研究中,图书馆学界、情报学界和计算机学界的学者都有研究兴趣,但从统计结果看,显然图书馆的研究人员才是该领域研究的主力军。 对作者地区分布进行统计分析,既可以了解各地区数字图书馆研究队伍的现状,又可以揭示各地区在该领域的研究水平。作者的地区分布见表4。 表4 作者的地区分布 省(市、区)作者数省(市、区)作者数省(市、区)作者数省(市、区)作者数北 京237广 东158江 苏101重 庆28天 津65湖 北123浙 江70云 南8河 北29湖 南81上 海68贵 州2山 西12河 南55山 东68陕 西56内蒙古2广 西11福 建28甘 肃16黑龙江40海 南5安 徽25宁 夏15吉 林38香 港2江 西7青 海2辽 宁33四 川40新 疆1(美国)4 由表4可以看出,1 430名作者来自全国除西藏、澳门和台湾外的各省、市、自治区(含美籍4名),分布十分广泛;但作者群主要集中在北京,占作者总数的16.57%。此外,湖北、广东、江苏的作者也较多。加上北京,这4个省市的作者数量占作者总数的43.28%,表明这几个省市是我国数字图书馆研究的核心地区。其他如西北和西南地区,作者量分别占发文作者总量的11.75%,是我国数字图书馆研究欠发达地区。 3.2 核心作者发文量分析 “核心作者”指在某一具体研究领域中能持续研究,并对研究群体成员产生某种影响者,从可量化的角度衡量,研究者正式发表论文的数量可以在一定程度上反映出这种影响力。 按照普赖斯(D.Price)的理论,发表论文量为玬篇以上的作者为该领域的核心作者,其中玬=0.749(η玬ax)1/2[4]。即核心作者中发文量最低的作者发文篇数计算公式为:玬=0.749(η玬ax)1/2,式中η玬ax为发文量最多作者的发文篇数。这里算出玬=0.749(16)1/2=2.996。即在数字图书馆领域核心作者群体的发文量篇均应在3篇以上。 表5给出了我国数字图书馆研究的发文3篇以上的核心作者117名(因篇幅所限,仅列出发文7篇以上者)。表5 核心作者的发文数 核心作者发文数核心作者发文数核心作者发文数盛小平16黄晓斌9刘成山7韩 毅14秦 珂9刘燕权7张晓林13吕 娜8王 军7董 慧11王知津8赵继海7毕 静10张晓青8……王启云10陈 伟7郭海明9刘柏嵩7 这117名核心作者发文量为528篇,占总文献量的25.61%,看来我国数字图书馆研究力量不足,核心作者还没有起到学科带头作用。 4 论文主题的聚类分析 聚类是用来对以一系列变量为特征的对象进行分类,研究对象之间的相似性关系。本文对数字图书馆的学术论文主题利用SPSS统计工具进行K-means(K-均值)聚类[5]。调出K均值聚类分析主界面,将变量2000-2010年移入变量框中,将标志变量region移入个案标记依据框,在方法栏中选择迭代与分类,在聚类数中输入2(即将12种主题聚为两类)。迭代过程中类中心的变化量的图表省略。最终聚类中心间距离和每个聚类中的案例数如图1、图2: 聚类12189.916289.916图1 最终聚类中心间距离 聚类1 2.000210.000有效12.000缺失0.000图2 每个聚类中的案例数 根据设定,按两类聚合确定初始聚类的各变量中心点,未经K-means算法迭代,其类间距离非最优,经迭代运算后类别间各变量中心值得到修正。对聚类结果的类间距离进行方差分析,类间距离差异的概率均小于0.001,表明聚类效果良好。这样,原有12类主题聚合为2类,第一类含原有2类,第二类含原有9类,其余1类缺失。 聚类结果表明,将12种主题被分为两类时,第9种主题即“馆员素质”主题缺失,表明这种主题的研究论文数量很少,无法将其划归于任何一类,其余11种主题中第8和第10即“技术”和“建设与发展”被划为一类,其余9种主题划为一类。这表明近十来年我国数字图书馆的研究主要集中在技术和建设方面,而馆员素质的研究则非常欠缺,其余研究方向大致持平。 5 结 论 由以上分析,结合作者近年来在数字图书馆领域的研究经验,得出以下几点结论: (1)十年来,数字图书馆的研究重点是数字图书馆的技术以及数字图书馆的建设与发展,由表2可知,近年来元数据、技术和版权问题的研究有上升的趋势,对基础理论和管理的研究呈下降趋势,这表明我国数字图书馆研究已经脱离了研究的基础理论的阶段,正在向更高的阶段发展。 (2)目前我国数字图书馆建设中存在的重复建设和难以有效共享的问题,很大程度上是因为缺乏统一的标准规范,所以元数据的相关研究和标准制订成为数字图书馆建设的首要问题。 (3)“以用户为中心”是数字图书馆研究的基调,但相对国外学者的研究,我国对数字图书馆用户分析方面的研究还远远不够,相关的理论还非常欠缺。 (4)新技术应用于数字图书馆领域是一个研究热点。网格、对等网、本体和语义网等方面的技术,在解决传统C/S模式下数字图书馆的海量数据、语义互操作等方面将起到非常关键的作用,研究和应用前景非常乐观。 参考文献 [1]中国社会科学研究评价中心[EB/OL].http:∥www.cssci.com.cn,2010-05-08. [2]中国知网首页[EB/OL].http:∥www.cnki.net,2010-05-08. [3] 布拉德福定律[EB/OL].http:∥baike.baidu.com/view/40589.htm?fr=ala0z1,2010-05-08. [4]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:191-195. [5]Kuncheva L.I.,Vetrov D.P.Evaluation of Stability of k-Means Cluster Ensembles with Respect to Random Initialization[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(11):1798-1808. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。