标题 | 基于教与学优化算法的特征选择 |
范文 | ![]() ![]() ![]() 摘要摘要:为提高特征选择算法的分类精度,使特征子集尽快达到全局最优,提出了一种基于教与学优化算法的特征选择方法。该方法首先将最大相关最小冗余的过滤式特征选择算法融入其中,然后利用教与学优化算法对特征子集进行迭代寻优,构造一个混合式特征选择框架。经UCI数据集试验,证明了该算法的收敛速度与分类精度均优于其它算法。 关键词关键词:教与学优化算法;特征选择;最大相关最小冗余;迭代寻优 DOIDOI:10.11907/rjdk.1511085 中图分类号:TP312 文献标识码:A文章编号文章编号:16727800(2015)011003603 基金项目基金项目:国家自然科学基金项目(61402482) 作者简介作者简介:张磊(1982-),男,江苏泰兴人,硕士,中国矿业大学徐海学院讲师,研究方向为语义搜索、查询扩展。 0引言 随着计算机技术的发展,数据量呈爆炸式增长,每天都需要处理海量数据。然而,在数据处理过程中不可避免会得到冗余数据,所以需要在处理过程进行预处理即特征选择。特征选择是从已知特征集中,按照某一个评价准则或搜索策略,将高维数据集转化为低维数据集,从而减小需求空间、提高分类精度和加快训练速度。特征选择依据不同的评价准则分为3类,即过滤式(Filter)、封装式(Wrapper)和混合式(Hybrid)。Filter是无导师算法,依赖特征子集本身进行评价,具有分类准确率高、花费时间少等优点,但是降维效果一般。Wrapper是有导师学习算法,需要先确定分类算法,利用分类器性能对特征子集进行评价,这样能提高分类精度,但是花费时间长、泛化能力差。Hybrid将上述两种算法结合起来,不需要对中间结果进行评价,从而简化特征选择过程。 随机算法是一种近似优化算法,在近似求解NP问题时效果较明显,可以将其作为搜索策略运用到特征选择当中。随机算法包括遗传算法(GA)、粒子群优化算法(PSO)和“教”与“学”优化算法(teachinglearningbased optimization:TLBO)等。文献[1]将互信息Filter的模型融合在PSO的Wrapper中,构造一种混合式特征选择方法。文献[2]首先采用标准互信息对目标类进行降序排序,然后利用遗传算法对排序在前的特征子集进行特征选择。本文首先利用Filter中的MRMR(minimalredundancy and maximalrelevance)方法选取最优特征子集,然后用TLBO对最优特征子集进行寻优迭代过程,最后通过实验进行验证。 4结语 本文提出了基于教与学优化算法的混合式特征选择方法,并与随机算法PSO和GA进行了分类精度及参数寻优过程比较。实验证明该算法降维效果比较明显,能够尽快达到全局最优,分类效果较好。 TLBO算法对于高维多峰值优化问题容易陷入局部搜索而丢失全局最优解,而且适用性不强。因此,今后应将研究重点放在进一步改进TLBO优化算法提高分类精度上,增加多重评价标准来扩大本算法的适用范围。 参考文献参考文献: [1]姚旭,王晓丹,张玉玺,等.基于粒子群优化算法的最大相关最小冗余混合式特征选择方法[J].控制与决策,2013(3):413417,423. [2]王娜.基于遗传算法的混合特征选择方法研究[D].西安:陕西师范大学,2012. [3]RAO R V,KALYANKAR V D.Parameters optimization of advanced machining processes using TLBO algorithm[J].EPPM,Singapore,2011(20):2122. [4]拓守恒,雍龙泉,邓方安.“教与学” 优化算法研究综述[J].计算机应用研究,2013,30(7):19331938. [5]VENKATA RAO R,PATEL V.An elitist teachinglearningbased optimization algorithm for solving complex constrained optimization problems[J].International Journal of Industrial Engineering Computations,2012,3(4):535560. [6]VENKATA RAO R , PATEL V.Multiobjective optimization of two stage thermoelectric coolers using a modified teachinglearningbased optimization algorithm[J].Engineering Applications of Artificial Intelligence,2012. [7]李扬,顾雪平.基于改进最大相关最小冗余判据的暂态稳定评估特征选择[J].中国电机工程学报,2013(34):27,179186. [8]姚旭,王晓丹,张玉玺,等.特征选择方法综述[J].控制与决策,2012(2):161166,192. [9]曹静.基于最大相关最小冗余的特征选择算法研究[D].秦皇岛:燕山大学,2010. [10]姚明海,王 娜,齐 妙,等.改进的最大相关最小冗余特征选择方法研究[J].计算机工程与应用,2014(9):116122. 责任编辑(责任编辑:杜能钢) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。