网站首页  词典首页

请输入您要查询的论文:

 

标题 聚类算法在市政绩效评估中的应用
范文 张小川++严杰++朱常鹏



摘要摘要:针对Kmeans聚类算法,结合市政绩效评估的需要进行改进。以稳定Kmeans聚类算法中心和选取最优聚类个数为目的,提出基于Kruskal算法和轮廓系数法的Kmeans聚类算法。针对区县不同结构实际市政绩效评估数据,按照商业智能和IQR规则进行预处理,然后利用改进的Kmeans聚类算法对预处理后的数据进行聚类分析。实验结果表明,该算法能够有效地确立各市政事件、部件的发生频数等级,帮助市政管理者发现各市政事件、部件之间关联关系,提高其科学决策能力。
关键词关键词:Kmeans聚类算法;Kruskal算法;轮廓系数法;IQR;商业智能
DOIDOI:10.11907/rjdk.1511214
中图分类号:TP312
文献标识码:A文章编号文章编号:16727800(2015)011004803
基金项目基金项目:
作者简介作者简介:张小川(1965-), 男,重庆人,重庆理工大学计算机科学与工程学院教授,研究方向为人工智能、人工生命、计算机软件;严杰(1991-),男,重庆人,重庆理工大学计算机科学与工程学院硕士研究生,研究方向为数据库管理、数据挖掘、数据分析。
0引言
智慧城市是信息化社会中一种以网络为依托,智能融合,全民参与城市塑造的数字城市的高级形态。智慧城市要落地,数字城管是基础[1]。而数字城管是一种能够对城市实现敏捷、高效、全方位、全时段覆盖,并且与传统城市管理不同的全新的城市管理模式[2]。实际上,在十二五期间,数字城管的数据体系、软件体系、应用体系和保障体系已基本建成,为智慧城市建设奠定了坚实的基础。由于信息互联互通与数据共享程度低、建设实效和作用不明显、标准体系与政策法规滞后等问题,造成了数字城管的人力、物力、财力和信息资源浪费。因此,为了提高数字城管管理效率,建立一个科学、合理的绩效评估体系尤为必要。市政绩效评估体系是指在合理制度安排和新的公共行政理念的指导下,运用科学的政府管理方法,提高市政行政管理效率,降低管理成本为目的的综合行政评价体制[3-4]。数字城管每天都在产生大量杂乱无章、价值密度相对较低的数据,如何在指定时间内对这些数据进行提取、管理、处理、整理、分析,并建立一个科学的市政绩效评估体系是一个亟待解决的问题。基于此,文章首先利用商业智能和IQR对已有的市政绩效评估数据进行数据预处理;其次,对改进的Kmeans聚类算法与传统Kmeans聚类算法进行比较,证明改进的Kmeans聚类算法的可靠性;最后,对改进的Kmeans聚类算法的结果进行分析,证明其有效性。
1研究综述
自Kmeans聚类算法由MacQueen于1967年提出以来,Kmeans聚类算法以其简单和易于实现的特点使其成为经典的划分型聚类算法,被广泛使用[5]。由于传统的Kmeans聚类算法存在对初始聚类中心选择敏感,并且需要人工指定聚类个数的问题,因此,很多学者提出了改进的Kmeans聚类算法。
文献[6]基于最小生成树的思想,文献[7]基于密度和欧氏距离积的思想,文献[8]基于粒子群和密度的最大最小距离法的思想,文献[9]基于层次聚类的思想,文献[10]基于距离矩阵的思想,文献[11]基于最小方差的思想,文献[13]基于距离和权值的思想,提出了稳定初始聚类中心的Kmeans聚类算法。
针对最优聚类个数选择问题,大多数聚类算法都是通过聚类有效性评估函数的计算来确定。文献[14]综述了各种聚类有效性评估函数。文献[15]基于DS证据理论,把各种聚类有效性评估函数结合起来,提高了聚类评估的有效性和可靠性。
本文提出基于Kruskal算法和轮廓系数法的Kmeans聚类算法,并将其应用于经过数据预处理的市政绩效评估。实验结果表明,文章提出的算法能够对市政事件、部件有效地进行聚类。使市政管理者更容易发现市政事件、部件的关联关系,确立市政事件、部件的频数等级,从而有利于科学决策。
3实验
3.1数据预处理
商业智能就是利用数据管理功能,将从多个数据源中抽取的数据进行整理、转换和清理,并利用OLTP、OLAP对数据进行分析,最终形成报表。本文利用SQL Server 2008 R2 BI提取原始的某区的市政绩效评估数据,并对数据进行整理,最终形成相关维度表、事实表。利用SQL进行查询,得到的结果如表1所示。表1中,第一列表示市政事件、部件的名称和编号,第一行表示统计周期,表中数据表示的是某一市政事件、部件在某一统计周期内总共发生的次数。
由于表中数据存在孤立点,因此为避免改进的Kmeans聚类算法产生局部最优,需要利用IQR规则进行数据清洗。结果排除了无照经营游商(54)、乱堆物堆料(57)、暴露垃圾(79)、非法小广告(105)。分析排除的这4个市政事件、部件,可以得出这4个市政事件、部件均属于市政事件。其中, 54、57属于街面秩序事件,79属于市容环境事件,105属于宣传广告事件。在日常生活中,这些事件属于高发类事件,市政管理员需要对这些事件加强管理,将它们控制在一个有效范围内。
3.2算法比较
对改进Kmeans聚类算法进行拆分,并利用经过数据预处理后的数据进行运算,最终,绘制聚类个数——轮廓系数图,如图1所示。
从图1可以看出,聚类个数为3时,算法效果最优。因此利用这个聚类个数,对本文提出的算法与传统的Kmeans聚类算法在相同条件下运行79次,记录在运行次数为13、23、37、47、57、67、79时各自聚类中心的变化次数,如表2所示。
在表2中,第一行表示所用聚类算法,第一列表示实验的次数,表中数据表示聚类中心的变化次数。分析表2可得,针对同一数据集,改进的Kmeans聚类算法的运行结果比传统的Kmeans聚类算法更具有可靠性。
3.3结果分析
在最优聚类个数下改进的Kmeans聚类算法得到的最优聚类结果,如表3所示。
表3最优聚类结果
簇类[]聚类结果
簇1[]8、91、101、18、31、40、51、58、80、88
簇2[]64、84、102
簇3[]76、60、74、106、83、98
可以看出8、91、101、18、31、40、51、58、80、88为一类(簇1),64、84、102为一类(簇2),76、60、74、106、83、98为一类(簇3)。结合表1可以看出,簇1在所选的周期上发生次数比簇2和簇3少,簇2发生次数比簇3多,针对以上问题,市政管理者对簇3包含的市政事件、部件应该重点关注。分析簇1,结合表1可得,如果在行道树旁边圈养家禽家畜,或者在行道树边晾晒拖把,就影响了行道树美观,那么可以将擅自饲养家禽家畜和非装饰性树挂与行道树关联起来形成一类。分析簇2,结合表1可得,如果在街边拉一根绳子晾晒衣服,或者在人行横道上放一块广告牌招揽生意,这样影响了行人通行,并且影响了市容环境,由于市容环境问题主要是指城市的清洁卫生问题,因此可以将沿街晾挂和占道广告牌与其他市容环境问题关联起来形成一类。分析簇3,结合表1可得,用餐时段,道路边的店面一般会在店外多加几张桌子、凳子,由于位置太偏,因此老板会在显眼的墙上悬挂广告牌,这样会吸引更多就餐的客人。由于有些客人随地乱丢垃圾,导致道路不洁。所以违章张贴悬挂广告牌匾和道路不洁可以与店外经营关联起来形成一类。由以上分析可得,改进的Kmeans聚类算法的运行结果具有有效性。
4结语
针对市政事件、部件的关联性分析问题,本文提出了基于Kruskal算法和轮廓系数法的Kmeans聚类算法,并将其运用于经过数据预处理的市政绩效评估数据中。与传统Kmeans聚类算法相比,改进的Kmeans聚类算法的运行结果具有可靠性。通过聚类分析,得到改进的Kmeans聚类算法的运行结果具有有效性。
参考文献:
[1]郭嘉凯.智慧城市落地:数字城管先行[J].软件和信息服务,2013,(7):5051.
[2]曾广晖.浅谈数字城管系统[J].江西通信科技,2015,(1):3437.
[3]王谦.政府绩效评估方法及应用研究[D].成都:西南交通大学,2006.
[4]盛明科.服务型政府绩效评估体系构建与制度安排[D].湘潭:湘潭大学,2008.
[5]金建国.聚类算法综述[J].计算机科学,2014,41(11A):288293.
[6]冯波.Kmeans算法初始聚类中心选择的优化[J].计算机工程与应用,2013,49(14):182186.
[7]樊晓光.基于密度和距离积的聚类中心选取方法[J].测控技术,2013,32(10):152154.
[8]杨志,罗可.一种改进的基于粒子群的聚类算法[J].计算机应用研究,2014,31(9):25972599.
[9]李文超,周勇,夏士雄.一种新的基于层次和Kmeans方法的聚类算法[R].张家界,2007.
[10]张靖,段富.优化初始聚类中心的改进Kmeans算法[J].计算机工程与设计,2013,34(5):16911694.
[11]谢娟英,王艳娥.最小方差优化初始聚类中心的Kmeans算法[J].计算机工程,2014,40(8):205211.
[12]周世兵,徐振源,唐旭清.新的K均值算法最佳聚类数确定方法[J].计算机工程与应用,2010,46(10):2731.
[13]王越,王泉,吕奇峰,曾晶.基于初始聚类中心优化和维间加权的改进Kmeans算法[J].重庆理工大学学报:自然科学版,2013,27(4):7780.
[14]周开乐,杨善林,丁帅,罗贺.聚类有效性研究综述[J].系统工程理论与实践,2014,34(9):24172431.
[15]刘燕驰,高学东,国宏伟,武森.聚类有效性的组合评价方法[J].计算机工程与应用,2011,47(19):1517.
责任编辑(责任编辑:陈福时)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/15 13:02:43