因子分析在第三产业资本结构分析中的应用
靳君+潘英飞
西安财经学院商学院
摘 要:文章从因子分析的基本原理、应用等方面作为分析第三产业资本结构的主要方法。本文以国民经济核算中第三产业增加值为例,利用SPSS 软件处理的结果来说明上述方法在评价第三产业资本结构中的应用。
关键词:因子分析;第三产业增加值;资本结构构成
一、因子分析法
1.因子分析的原理。因子分析是选取少数几个公共因子来解释变量中的主要变化,假定有p个变量,且其b变异主要是由一些共同的因子引起的。因子分析的数学模型为:X1=b11F1+b12F2+…+b1mFm+ξ;……;Xp=bp1F1+bp2F2+…+bpmFm+ξp。式中:F = ( F1,F2,…,Fm) 它是不可观测的向量;X=( X1,X2,…,Xp),它是由可测的p个指标构成的p维随机向量。F为X 的公共因子;ξ为X 的特殊因子,包括了随机误差。bij 为因子载荷,它是第i个变量在第j个公共因子上的负荷,矩阵B 称为因子载荷矩阵;
2.因子分析基本步骤。因子分析的基本步骤:(1)构造原始矩阵,对其进行同向化及标准化处理,同时运用统计量检验判断能否进行因子分析;(2)计算相关系数矩阵的特征值和特征向量,根据公共因子的累计贡献率大小,确定因子个数,求初始因子载荷矩阵;(3)如果主因子的含义不清楚,对初始因子矩阵作旋转处理;(4)根据因子载荷大小进行公共因子命名和意义解释;(5)将因子表示成原始指标变量线形组合,估计因子得分;(6)用每个因子的贡献率做权数,给出综合因子得分评价函数。
二、实证研究
以国家统计局的数据文件“第三产业各资本结构增加值”为例,其中变量包括年份,第三产业资本结构各个构成部分的增加值“交通运输”“批发和零售业”、…、“其他”。
1.确定待分析的原始变量是否适合因子分析。因子分析需要选取具有共同特征的少数因子,这就要求原始变量之间有比较强的相关性,否则就无法进行。因此,在作因子分析时,需要对原始变量做相关性分析。SPSS 数据处理系统通过KMO 和Bartlett 检验来判断变量是否适合做因子分析:KMO 检验的目的是确定该数据是否适合进行因子分析,它通过分析观测变量之间的简单相关系数和偏相关系数的相对大小来确定,其取值变化在0 ~1 之间,若KMO取值接近1,说明变量之间的相关可以被其他变量解释,适合进行因子分析;Bartlett 检验目的是确定所要求的数据是否取自多元正态分布的总体,若差异检验的F值显著,表示所取的数据来自正态分布总体,可以做进一步分析。通过SPSS 软件计算得到以上数据的 KMO检验值为0.860 , 因此适合做因子分析;Bartlett 检验的F值等于0.000 , 表明所取的数据来自正态分布的总体。以下是:KMO和Bartlett's Test(表2)。
取样足够度的Kaiser-Meyer-Olkin度量:0.860; Bartlett's的球行度检验近似卡方:755.124;Df :15;Sig :0.000
2.选取公共因子。公共因子的选取有多种方法,本文采用主成份法。主成份法中,累计贡献率达到80%以上时提取的公共因子有效。如表3所示,第一个因子的初始特征值为5.943,大于1,方差贡献率为99.056%。根据提取因子的条件——特征值大于1,本例只选出了一个因子。以下是:解释的总方差(表3)。
成分: 1,2,3,4,5,6;初始特征值合计:5.943,0.047,0.006,0.002,0.001,
0.001;初始特征值方差的%:99.056,0.784,0.096,0.032,0.023,0.009;初始特征值累计% : 99.056,99.840,99.936,99.968,99.991,100.00;提取平方和载入合计: 5.943;提取平方和方差的% : 99.056;提取平方和累计% : 99.056
3.因子表达式。因子负荷矩阵用来反映各个变量的变异主要由哪些因子解释。通过这个矩阵得出各变量的因子表达式: X1=0.991F1+ξ1,…,X6=0.998F1+ξ6。以下是:成分矩阵(表4)。
行业:交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业,其他。成分1: 0.991,0.998,0.996,0.991,0.997,0.998
4.因子得分及综合排名。年份:1980到2011。因子得分F1:-0.
79419,-0.79252,-0.79053,-0.78706,-0.77814,-0.76289,-0.75339,-0.74161,-0.72136,-0.70148,-0.68946,-0.65896,-0.61592,-0.56557,-0.478
22,-0.40442,-0.34274,-0.27731,-0.21279,-0.15846,-0.0734,0.01912,0.11
346,0.22024,0.37622,0.55761,0.81123,1.2417,1.58985,1.89151,2.3641,2.9
1539。综合因子得分;-0.79419,-0.79252,-0.79053,-0.78706,-0.77814,-0.76289,-0.75339,-0.74161,-0.72136,-0.70148,-0.68946,-0.65896,-0.615
92,-0.56557,-0.47822,-0.40442,-0.34274,-0.27731,-0.21279,-0.15846,-0.0734,0.01912,0.11346,0.22024,0.37622,0.55761,0.81123,1.2417,1.58985,1.89151,2.3641,2.91539。综合排名:1980到2011排名依次是32到1。
从表中的综合因子得分的数值来看, 得分值大的年份2011,
2010,2009,2008,2008,2007,它们的综合因子得分值大于1 , 可见自2007年以来第三产业经济发展很快,明显好于其它年份的经济发展状况,说明自2007年以来第三产业资本结构构成较合理。而1980-1990, 这几年的综合因子得分的分值很低,说明80年代的第三产业经济发展水平与近几年相比要落后很多,资本结构发展不太成熟。90年以后第三产业的经济发展越来越好。对国民经济的发展起了重要的促进作用。
三、结论
尽管近年我国的第三产业发展速度很快,但我们也应认识到,速度的增长并不等于质量的全面提升。中国第三产业发展的缓慢与不合理,导致我国经济产业结构的失衡,严重制约了经济的发展,阻碍了人民生活水平的提高。对此,我们在加强工业化改造,大力发展农业的同时,也要制定有利于第三产业发展的政策法规,优化第三产业资本结构。同时我们也应鼓励企业进行技术创新,引进高科技人才,以市场为导向,创新企业的发展机制,为我国第三产业的发展注入新的活力和动力,完善企业的服务体系,提高服务质量。
参考文献:
[1]俞梅珍.服务贸易协定框架下中国第三产业的发展及对策[J].经济参考研究,2000(8).
[2]欧新黔.中国服务业发展报告[M].中国经济出版社,2004.
[3]《spss统计分析》.罗应婷、杨玉娟著.电子工业出版社.