网站首页  词典首页

请输入您要查询的论文:

 

标题 基于SPSS的31个地区的聚类分析
范文

    

    

    

    摘 要:近年来,随着我国经济的发展,各个地区的经济发展水平也出现了较大的差异,我们抽取具有代表性的31个地区,基于SPSS对他们从人均食品支出、人均衣着支出、人均住房支出、人均家庭设备及服务支出、人均交通和通信支出、人均文教娱乐用品及服务支出、人均医疗保健支出和其他商品及服务支出八个方面进行聚类分析,分析所属同一类的地区所具有的相似性,为经济良好发展提供有效的建议。

    关键词:SPSS;聚类分析;相似性

    一、数据来源及分析

    (一)数据来源

    X1人均食品支出(元/人)X5人均交通和通信支出(元/人)

    X2人均衣着支出(元/人)X6人均文教娱乐用品及服务支出(元/人)

    X3人均住房支出(元/人)X7人均医疗保健支出(元/人)

    X4 人均家庭设备及服务支出(元/人)X8 其他商品及服务支出(元/人)

    图表 1

    注:上图截取了31个地区一部分数据 数据来源:中国统计年鉴

    (二)数据分析

    以上选择的8个指标都很好的从衣、食、住、行四个方面反映了31个地区的人均消费水平,在一定程度了反映了不同地区的发展水平情况,通过运用欧式距离,将它们之间距离最近的两类合并为新类,然后计算新类与当前各类之间的距离,直至类的个数等于1时,画出聚类图,决定类的个数和最终分类数。

    二、SPSS的聚类分析结果

    (一)分类数的确定

    圖表2聚合系数随分类数变化曲线

    将SPSS输出的聚合系数值导入EXCEL中,做出聚合系数随分类数变化曲线,由图表2看出分类数3到5类是最合适的,但由于分类数过多不利于分析,所以我们选择分为3类对31个地区进行统计分析。

    将数据导入SPSS软件,在“分析”菜单中选择“分类”,选择其中的系统聚类分析,将X1到X8八个变量选入变量框中,标注个案中选择地区,再点击右侧“方法”,聚类方法选择组内连接,区间测量采取平方Euclidean距离,并将其采用Z分数标准化,最后,单机确定按钮,SPSS则输出图表3。图表3是对每一个阶段不同聚类结果的反映,其中第四列为聚合系数,其值越大,代表其相似性越大,聚合损失量则会越少。

    (二)具体分类情况

    如上图所示是树状聚类图,由上面分析可知将其分为三类,易得分为北京、浙江、上海、其他地区,三类情况。

    结束语:

    将上海分为第一类,北京、浙江分为第二类,其他分为第三类,根据经验易得第一类为最发达地区,拥有各种机遇,主要发展高新技术产业;第二类为较发达地区,其经济上也有很大的突破,其应主要发展制造业,不断升级改进;第三类为经济欠发达地区,应该借用各地区的优势,积极发展自己特色的产业,提升经济实力。

    参考文献:

    [1]吕卫平,张晓梅.基于SPSS的聚类分析应用[J].福建电脑,2013(09):20-23.

    [2]薛薇.统计分析与 SPSS 的应用 [M].北京:中国人民大学出版社,2011.

    作者简介:刘雪敏(1998-),女,汉族,河北省张家口市人,本科,河北大学经济学院。研究方向:经济统计学。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/16 18:35:43