基于多指标面板数据分层因子分析的期刊动态综合研究
【摘要】文章采用多指标面板数据的分层因子分析法对期刊进行动态的综合研究。该方法的优势在于不仅考虑了数据的横向信息,还考虑了数据的纵向信息,提高了评价的可信度。文章以《中文核心期刊要目总览》提供的16种体育类核心期刊为研究对象,根据2008—2014年版《中国科技期刊引证报告》(扩刊版)提供的8项期刊评价指标,对16种体育类核心期刊的发展态势进行实证分析。结果表明,该方法不仅能对期刊进行较为全面和客观的分析评价,而且信息损失较少,得到了良好的效果。
【关键词】面板数据;分层因子分析;动态综合评价
【作者单位】刘岩,吉林师范大学图书馆。
【基金项目】本文系四平市社会科学基金2016年度研究项目“学术期刊综合发展评价研究”成果之一(项目编号:2016154)。
多指标面板数据是对若干个个体的多个指标变量在不同时间点进行观测而得到的数据。数据具有时间、空间及指标变量三个维度。从横截面上看,数据由若干个样本的不同指标在同一时间的截面数据构成,而从纵向上看,数据由单个样本各个指标在不同时刻的观测时间序列构成[1]。
期刊综合评价的指标众多,单个指标分析存在片面性和局限性。以体育类核心期刊为例,为了使读者全面了解体育类核心期刊的发展动态,卢石[2]等研究者主要对21种体育类期刊的9项评价指标进行了分析,从单个指标的角度进行了横向的比较,但没有对期刊进行综合评价。研究者庄亮[3]对体育类核心期刊的8项指标进行了评价研究,主要利用单个指标评价法对16种体育类核心期刊5年的发展态势进行研究,但没有综合考虑各指标的信息就对期刊进行了综合排名。截面数据的综合评价能够对期刊进行横向的比较研究,然而,一段时间内的动态综合评价更能体现期刊的发展态势[4]。因此,本文采用多指标面板数据的分层因子分析法,建立计量模型来量化各评价指标之间的内在联系,阐述多指标面板数据分层因子分析法在期刊动态综合评价中的分析过程,并应用此方法对体育类的16种核心期刊进行实证分析,探讨体育类核心期刊7年来的动态发展态势,以期为体育类期刊质量的提升提供一定的参考和借鉴。结果表明,该方法不仅能够对期刊进行较为全面和客观的分析评价,而且信息量损失较少,得到了良好的效果。
一、多指标面板数据分层因子分析方法
1. 数据的结构
令xij(t)表示第i(i =1,…, n)个个体的第 j( j =1,…, p)个指标在时刻t (t =1,…,T )的观测,则多指标面板数据的结构如表1所示。
2. 数据的标准化处理
面板数据主要包含了多个个体各个指标在不同时刻的纵向观测,为了考量纵向数据的信息,将通过数据的标准化对各个指标不同时刻的所有观测数据进行拉直来计算此指标的均值和方差,以第 j个指标为例,第 j个指标的样本均值和方差的计算公式分别为和,则标准化的数据为
(1)
3. 分层因子分析模型
(1)横截面数据的因子分析
首先,本文将对每个时间截面上的多个指标的样本数据进行因子分析。令 Z(t)=(Z1(t),…,Zp(t))T(t=1,…,T)是可观测的随机向量,均值和方差分别为E(Z(t))=μ(t),D(Z(t))=Σ(t)。且设F(t)=(F1(t),…,Fm(t)(t))T(m(t )< p)是不可观测的公因子,满足E(F(t))=0, D(F(t))=Im(t),又设误差项ε(t)=(ε1(t),…,εp(t))T与公因子F(t)互不相关,且满足E(ε(t))=0,D(ε(t))=D(t)对角阵。则正交因子模型的矩阵形式为:
Z(t)=μ(t)+A(t)F(t)+ε(t)(t =1,…,T )(2)
在各个时间截面利用方差最大旋转法选择公因子的个数m (t),使得m (t)个公因子的累计贡献率达到85%以上,以各个公因子的方差贡献率为权重构造各个截面的样本综合评价函数f (t)=u1(t)F1(t)+…+um(t)Fm(t)(t)(t =1,…,T )。其中,F1(t),…,Fm(t)(t)为第t个时间截面的m (t)个底层公因子得分,u1(t),…,um(t)(t)为第t个时间截面公因子得分F1(t),…,Fm(t)(t)的方差贡献率。因此,同一截面的所有样本的综合评价值构成该截面的评价向量f (t)=( f1(t),…, fn(t))T。
(2)面板数据的因子分析
将所有个体各个截面的评价向量构成综合评价矩阵
此矩阵可以看成是纵向的面板数据。因此,我们可以将综合评价矩阵看成是T个变量的n次观测矩阵。我们对综合评价矩阵进行检验后做顶层因子分析,可获得纵向面板数据的公因子个数m,使得m个公因子的累积贡献率达到85%以上,利用方差贡献率为权重构造纵向的综合因子得分g=v1G1+…vmGm。其中,G1,…,Gm是面板数据的顶层公因子得分,v1,…,vm是对应公因子的方差贡献率。因此,我们可以得到纵向面板数据的综合评价向量g1,…, gn,对其进行排序,进而获得样本的纵向综合排名。
分层因子分析模型主要通过因子分析法,利用横截面数据和纵向面板数据的综合信息获得样本的综合评价。分层因子分析模型的优势是不仅利用了横截面数据的信息,而且考虑了数据的纵向信息,提高了评价的可信度。
三、实证分析
1.数据来源及指标选取
本文以《中文核心期刊要目总览》[5]提供的16种体育类核心期刊为研究对象,根据2008—2014年版《中国科技期刊引证报告》(扩刊版)提供的2007—2013年的期刊評价指标,选取能够较好体现期刊学术影响力的8项指标进行分析,分别为总被引频次、影响因子、即年指标、引用刊数、学科扩散指标、被引半衰期、来源文献量和基金论文比。数据分析主要通过统计软件R实现。
2.结果分析
(1)横截面数据因子分析结果
首先,本文利用公式(1)将2007—2013年8个指标的面板数据标准化。其次,利用横截面数据的因子分析法,分析2007—2013年各年度的8个期刊评价指标数据,获得每个年度的综合因子得分,并对综合因子得分进行排序,结果见表2。 由于2009年的《中国科技期刊引证报告》(扩刊版)中未统计《首都体育学院学报》的指标信息,故此数据暂缺。
表2 2007—2013年横截面数据的综合因子得分及排序
序号 期刊名称 因子得分 2007 2008 2009 2010 2011 2012 2013
1 北京体育大学学报 得分 1.264 1.052 0.759 1.239 0.893 1.168 1.206
排序 1 2 2 1 2 1 1
2 成都体育学院学报 得分 0.035 -0.199 0.052 -0.159 0.029 -0.022 -0.056
排序 6 10 8 9 9 7 8
3 广州体育学院学报 得分 -0.162 -0.336 -0.332 -0.286 -0.323 -0.383 -0.464
排序 11 12 11 11 12 13 14
4 山东体育学院学报 得分 -0.429 -0.604 -0.790 -0.633 -0.732 -0.426 -0.395
排序 13 13 15 15 15 14 13
5 上海体育学院学报 得分 0.533 0.353 0.359 0.222 0.090 0.366 0.039
排序 3 5 6 5 7 4 6
6 沈阳体育学院学报 得分 -0.653 -0.776 -0.711 -0.626 -0.633 -0.507 -0.312
排序 15 15 13 14 14 15 12
7 首都体育学院学报 得分 -0.545 -0.656 - -0.356 -0.196 -0.338 -0.496
排序 14 14 - 12 11 12 15
8 天津体育学院学报 得分 -0.108 -0.227 -0.183 -0.043 -0.071 -0.263 -0.288
排序 10 11 10 8 10 11 10
9 武汉体育学院学报 得分 0.519 0.438 0.383 0.196 0.311 0.333 0.436
排序 4 4 4 6 4 5 5
10 西安体育学院学报 得分 -0.042 -0.159 -0.046 -0.186 0.0898 -0.077 -0.250
排序 9 9 9 10 8 9 9
11 体育科学 得分 0.890 1.209 0.815 0.967 1.024 0.850 0.583
排序 2 1 1 2 1 2 2
12 体育文化导刊 得分 -0.302 0.038 -0.472 -0.381 -0.344 -0.198 0.552
排序 12 8 12 13 13 10 3
13 体育学刊 得分 0.187 0.497 0.377 0.404 0.361 0.467 0.456
排序 5 3 5 3 3 3 4
14 体育与科学 得分 -0.016 0.064 0.078 0.252 0.119 -0.050 -0.302
排序 7 7 7 4 6 8 11
15 中国体育科技 得分 -0.017 0.204 0.429 0.186 0.310 0.007 0.036
排序 8 6 3 7 5 6 7
16 山东体育科技 得分 -1.153 -0.896 -0.719 -0.797 -0.927 -0.926 -0.745
排序 16 16 14 16 16 16 16
从表2中可以看出,7年间16种体育类核心期刊中稳定排在前2位的期刊分别为《北京体育大学学报》和《体育科学》。《北京体育大学学报》7年间有4年居于首位,3年排在第2名,而《体育科学》仅次于前者,有3年居于首位, 4年排在第2名,这说明以上两种期刊的期刊质量较好,并且学术影响力较高,7年间呈现稳定的发展态势。《体育学刊》2007年、2009年排在第5名,2010—2012年一直稳定排在第3名,2013年排在第4名,说明《体育学刊》从2010年开始,期刊影响力在原有的基础上有所提升,呈现上升的发展态势。《武汉体育学院学报》2007—2009年3年间一直排在第4名,2010年排在第6名,2012—2013年排在第5名,说明此期刊前3年发展比较稳定,后4年在原有的基础上稍有波动,有下降的趋势,应该引起期刊领导和编辑人员的注意。但整体上,《武汉体育学院学报》在16种体育类核心期刊中,期刊质量和学术影响力排在前5名。
7年间期刊质量和学术影响力较高的期刊还有《上海体育学院学报》和《中国体育科技》。《上海体育学院学报》7年间在3—7名之间徘徊,《中国体育科技》7年间在3—8名之间徘徊,这两种期刊排名整体上呈波动趋势,发展态势不是很稳定,但仍排在前6名。
7年间排在倒数后三名的期刊为《山东体育科技》《沈阳体育学院学报》《山东体育学院学报》。《山东体育科技》较稳定地排在第16名,《沈阳体育学院学报》和《山东体育学院学报》总体基本排在12—15名之间。
(2)面板数据因子分析结果
为了考查期刊的动态发展态势,本文将16种体育类核心期刊2007—2013年的7个年度评价向量构成综合評价矩阵,利用面板数据因子分析法,对2007—2013年的综合评价矩阵进行因子分析,得到纵向面板数据的综合因子得分,进而获得纵向的综合排名。同时,笔者将纵向综合评价结果与7年平均影响因子(IF)进行了比较分析,结果见表3。
表 3 面板数据的纵向综合得分、排名及7年平均IF
序号 期刊名称 综合得分 排名 7年平均IF
1 北京体育大学学报 2.029 1 8
2 成都体育学院学报 -0.054 8 10
3 广州体育学院学报 -0.609 12 12
4 山东体育学院学报 -0.957 14 14
5 上海体育学院学报 0.643 5 2
6 沈阳体育学院学报 -1.101 15 15
7 首都体育学院学报 -0.759 13 13
8 天津体育学院学报 -0.376 11 5
9 武汉体育学院学报 0.714 4 7
10 西安体育学院学报 -0.126 9 9
11 体育科学 1.702 2 1
12 体育文化导刊 -0.344 10 11
13 体育学刊 0.756 3 4
14 体育与科学 -0.006 7 3
15 中国体育科技 0.202 6 6
16 山东体育科技 -1.715 16 16
从表3可以看出,16种体育类核心期刊中,纵向综合评价结果与7年平均影响因子结果完全相同的有7种期刊,占43.8%。分别为排在第6名的《中国体育科技》,排在第9名的《西安体育学院学报》,排在第12名的《广州体育学院学报》,排在第13名的《首都体育学院学报》,排在第14名的《山东体育学院学报》,排在第15名的《沈阳体育学院学报》和排在第16名的《山东体育科技》。《体育科学》期刊纵向综合排在第2名,7年平均影响因子排在第1名,这说明16种体育类核心期刊中《体育科学》期刊的学术影响力和期刊质量相对较高。两种方法排名反差较大的是《北京体育大学学报》,纵向综合排名排在第1名,而7年平均影响因子排在第8名,这说明《北京体育大学学报》的综合评价得分较高,但从7年平均影响因子单个指标来看,仍有上升空间。《天津体育学院学报》纵向综合排在第11名,而7年平均影响因子排在第5名,排名反差也较大。
由表2、表3综合来看,16种体育类核心期刊中学术影响力较强的期刊是《体育科学》和《北京体育大学学报》,排名不是很稳定的期刊有《上海体育学院学报》和《中国体育科技》。从整体上看,16种体育类核心期刊呈现均衡的发展态势。
本文主要利用多指标面板数据的分层因子分析法对16种体育类核心期刊进行了动态综合评价研究。分层因子分析法的优势是既考虑了数据的横向信息,又考虑了数据的纵向信息,从而获得纵向的综合排名。通过多指标面板数据分层因子分析法得到的综合排名,可以较为全面和客观地对某一类期刊进行动态的综合分析比较,其结果可以为期刊质量的提升提供一定的参考和借鉴。
[1]肖启华,黄硕琳,王慰. 多指標面板数据因子分析的分层模型及应用[J]. 数学的实践与认识,2015(12):86-93.
[2]卢石,杨红英,刘文娟,何峻. 中文体育类核心期刊评价指标分析——以《中文核心期刊要目总览》(2011版)为例[J]. 广州体育学院学报,2014(6):71-75.
[3]庄亮. 中文体育类核心期刊评价研究[J]. 体育文化导刊,2011(2):143-145.
[4]刘岩. 基于多维面板数据因子分析的中国图书情报学核心期刊综合发展评价研究[J]. 出版广角,2016(1):48-50.
[5]朱强. 中文核心期刊要目总览(第6版)[M]. 北京:北京大学出版社,2011.