基于因子分析和聚类分析的我国区域发展协调性评价研究
程晨
一、引言
自1990年起,我国不同地区居民的人均收入差距日益扩大,根据国家统计局公布我国近十年来基尼系数为0.45-0.48,当基尼系数处于0.4-0.5区间时定义为收入差距大。以此映射出我国阶层与城乡之间的存在的失衡问题。2020年,我国全面建成小康社会。据统计,2000年我国中部地区GDP占比全国总量20%,西部地区占比17%,东部地区占比63%;2018年我国中部地区占比全国总量22%,西部地区占比19%,而东部地区占比59%。尽管近年来在国家的大力扶持下,比重倾斜有所缓解,但从经济体量来看仍存在不协调。
二、文献综述
国内学者对区域发展的理论研究,大体上从均衡发展过渡为协调发展。改革开放前,受国外学者对传统生产力的理论研究影响,我国学者大多以均衡作为研究方向。后来国内外学者开始研究产业效率对区域发展的影响,自此研究着力于协调发展。学者范恒山(2013)对区域政策深挖探究,他认为从政策上分析区域经济发展路径带来2种结果,一是区域协调发展;二是国民经济发展。学者吴净(2013)通过对分析得出区域经济实质上取决于行政区经济,而区域经济是促进区域发展的强动力,应根据国情规划经济发展路径。学者刘勇(2015)立足十三五,根据我国区域经济空间格局,提出更加详尽的区域划分方案以及空间分区分层系统。学者苏芮(2017)通过建立logistic曲线,以省为单位,发展阶段及综合指数为标尺,得出东部发达地区为高值区,东北地区、中西核心区及晋陕蒙宁为中值区,其他地区则为低值区。
三、研究设计
(一)样本选取与数据来源
评价我国区域发展协调性的指标繁多且复杂,本文中采用综合评价指标对2017年我国31个省或直辖市的区域发展协调性进行研究分析。数据均来自国家统计局发布2018年中国统计年鉴。
(二)指标体系的建立
本文选取2018年中国统计年鉴中的13个指标,分别为:年末人口数(X1)、年末城镇人口比重(X2)、地区生产总值(X3)、地区最终消费支出(X4)、地区居民消费水平(X5)、地区私营企业和个体就业人数(X6)、地区居民消费价格指数(X7)、地区居民人均可支配收入(X8)、地区居民消费支出(X9)、地区一般公共预算支出(X10)、地区一般公共预算收入(X11)、地区固定资产投资(X12)、地区货物进出口总额(X13)。
四、实证研究
(一)数据的标准化以及适用性检验
因子分析可以对数据进行简化,寻求变量的基本结构,再进行量表的效度分析,因此各变量之间存在明显的相关性。利用SPSS(20.0)软件作为统计分析工具,首先计算13个变量的相关矩阵系数,根据计算结果,以此判断运用因子分析的方法是否合适。此次采用的适用性检验方法为:KMO和Bartlett的球形度检验。根据检验结果,当KMO值是0.680时,KMO指标0.6以上,表明适合做因子分析。Bartlett检验的结果为显著,同样表明适用因子分析。
(二)确定公因子数目
本次研究对2018年中国统计年鉴数据的因子分析,也运用了主成分分析法。根据结果可得,13个指标可以简化为2个因子,前2个因子对原13个变量的解释能力为86.782%,可见以主成分得到的前2个因子为综合因子,提取数据86.782%的数据信息。
(三)求解旋转后因子载荷矩阵
对提取的2个因子F1,F2建立因子载荷矩阵,经过3次迭代,根据旋转后因子载荷矩阵可得,在第1个公共因子上高载荷的指标为:X1、X3、X4、X6、X10、X11、X12、X13。上述指标反应了31个省或直辖市区域发展水平的核心指标。而在第2个公共因子上高载荷的指标为X2、X5、X7、X8、X9,这5个指标对应该区域内居民的生活水平发展的指标。因此,命名第1个公共因子为“规模性因子”,主要从宏观上解释区域间发展协调的问题,将第2个因子命名为“基层结构因子”,以个体的角度解释区域间发展结构的情况。
(四)计算因子得分
依据因子载荷矩阵,可得出F1、F2的因子得分表达式为:
采用回归法估计F1、F2的因子得分,以每个因子的方差贡献率除以2个公共因子的总方差贡献率,将得到的比重作为权重,进行加权汇总。最后得到各地区的综合得分F,即将13个指标的数据带入所得公式中,可得出区域发展协调中各个指标的得分,根据排名可评价影响区域发展逐渐差异化的指标。其中区域发展协调性中,显著差异的基本为基层结构因子,表明居民个体的消费水平、居民人均可支配收入以及居民消费支出反映出区域发展水平的高低。居民个体的消费水平高,则意味着该区域发展好,经济较为发达;居民个体消费水平低,则表示该区域欠发达,便会出现区域发展协调性的差异。而固定资产投资、人口数不是区域发展协调性差异的核心因素。
(五)聚类分析
本文采用主成分定义样本之间的距离,根据指标特征可得聚类结果分为3类,总体上看,我国区域发展协调性差异从东南部沿海地区向西部、北部内陆地区由高至低的层次分布,类别内省或直辖市区域发展协调性良好,但类别之间则发展差异较大,协调性差。
第一类为北京、上海,北京作为国家中心城市,全国政治、文化、国际交往、科技创新中心。上海作为我国1978年改革开放中第一批沿海城市,1990年成为首个以金融命名的国家级开发区,同年成立上海证券交易所,制度创新辐射带动长江三角地区飞速发展。区域发展最为发达。
第二类为江苏、山东、浙江、广东。均为沿海城市,交通便利,物流及跨境电商近年来发展迅速,随着良好政策的制定以制度体系的建立,发展较好。特别是广东,自改革开放以来深圳特区的建立,规模效应不断增加,对经济的辐射半径也在不断扩大。江浙地区的电子商务,以阿里巴巴为聚点形成产业链,拉动周边地区经济发展,加之地方政法出台人才引进政策,吸引全国各地大学生落户,高素质人才不断增加刺激发展。
第三类主要分布在我国北部以及西部的内陆城市,与第一、二层次的省或直辖市区域发展协调性差,存在差异。城镇化水平不高,人才外流严重,经济发展略落后于东南部沿海区域的城市。但這25个省或直辖市的区域发展协调性较好,第一行8个省或直辖市发展差异相对更小,居民消费水平大致一样,社会经济结构相似,剩余17个省或直辖市发展协调性较好。从产业类型上分析,第一产业相差不大;第二产业相比第一、二类区域内城市,产业结构合理性还需调整,工业化水平不高,大多产业进行着单一重复的生产,产业链形式单一。而东南部沿海由于区域内联动机制,多方传导,由线逐渐过渡为面,产业链逐步发展成为产业网;第三产业发展同样略微不足,主导产业类型单一且传统,造成发展过程中隐形屏障,区域间联系不紧密,缺乏辐射动力,尽管有支柱型产业也难以传递至周边地区,辐射范围局限性很大。
五、结语
通过因子分析与聚类分析结果得出结论,我国区域发展不平衡的现象一直存在,区域经济协调发展面临的问题也有很多。受区位、要素禀赋、政策、劳动力流向等多方因素的共同作用,我国北部以及西部的内陆城市发展相对节奏缓慢,为缩小区域间差距应当积极落实具有推动力的政策措施。除了给予这些地区优待政策,促进资金流动,增强供给侧改革外,还应当顺应时代发展趋势,效仿东南部沿海城市发展模式,推动第三产业发展。抓住“一带一路”的机遇,借助此次双边多方的合作机制,同其他地区建立联系,逐步建立产业链拉动区域内发展,形成辐射带动效应。(作者单位:西北师范大学)