网站首页  词典首页

请输入您要查询的论文:

 

标题 基于多核学习SVM的图像分类识别算法
范文 李红丽+许春香+马耀锋
摘 要: 针对单核支持向量机在图像分类识别中检测精度较低的问题,提出一种多核学习SVM的图像分类识别算法,并将其应用到行人检测问题中。首先,提取行人的积分通道特征包括梯度直方图、彩色通道和梯度特征;然后,使用直方图交叉核、多项式核和径向基核构建混合核SVM分类器;最后,使用交叉验证和网格搜索的方法确定各种核的融合系数。在TUD数据集上的测试结果表明,该方法具有较好的鲁棒性和较高的检测精度。
关键词: 支持向量机; 多核学习; 行人检测; 图像识别; 直方图交叉核; 交叉验证
中图分类号: TN911.73?34; TP311 文献标识码: A 文章编号: 1004?373X(2018)06?0050?03
Abstract: In allusion to the problem that the single kernel support vector machine (SVM) has low detection precision in image classification and recognition, an image classification and recognition algorithm based on multi?kernel learning SVM is proposed and applied to the pedestrian detection problem. The pedestrians′ integral channel features including the gradient histogram, the color channel and the gradient feature are extracted. The hybrid kernel SVM classifier is constructed by using the histogram cross kernel, the polynomial kernel, and the radial basis kernel. The methods of cross validation and grid search are used to determine the fusion coefficients of various kernels. The results from the TUD dataset test show that the method has good robustness and high detection precision.
Keywords: SVM; multi?kernel learning; pedestrian detection; image recognition; histogram cross kernel; cross validation
核学习是一种以核函数和统计学习理论为基础的机器学习方法[1],该方法通常包括核函数的选择与构造、使用核函数构建分类器两个部分[2]。使用核学习方法可以避免显式计算低维空间的样本到高维空间的映射,直接将樣本转化为高维空间的点积[3]。
支持向量机[4](Support Vector Machine,SVM)的本质为核方法,在解决非线性、小样本和高维模式识别问题中表现出了诸多优势。SVM的发展促进了核学习方法,相继出现了核Fisher判别方法、核主成份分析方法、核判别分析以及核独立分量分析[5?7]等。核方法被广泛应用于求解高维、动态、数量多和含噪声等问题中。
然而,每一种核均存在较大的差异,对应于不同的应用场合,目前还没有完备的选择核函数的理论依据。选择与设计适合给定问题核函数,是核方法和SVM共同面临的问题。当数据样本存在多维数据不规则、含异构信息或高维空间分布不平坦等问题时,难以使用单一的核函数映射处理所有样本。因此,众多文献提出了基于混合核或组合核的方法,即多核学习的方法。如文献[8]组合使用径向基核函数和多项式核来提高SVM的分类精度;文献[9]使用多核SVM实现了短语音说话人识别系统;文献[10]使用混合核最小二乘法支持向量机实现了损伤检测,并获取了比单径向基核更高的泛化能力与精度。基于以上分析,本文提出了一种多核学习SVM算法,并将其应用到行人检测问题中。首先,提取行人的积分通道特征包括梯度直方图、彩色通道和梯度特征;然后,使用直方图交叉核、多项式核函数和径向基核函数构建混合核SVM分类器;最后在TUD数据集上的检测结果表明,该方法具有较好的鲁棒性和较高的检测精度。
1 行人特征提取
积分通道特征即使用积分图技术加快特征提取的速度,且融合后的特征相对于HOG特征具有更高的判别能力。积分通道特征具有参数少、来自颜色和梯度等不同的特征源,且检测时能准确定位等特点。
本文使用梯度直方图、彩色通道和梯度特征,这些特征均是对输入图像的线性或非线性变换得到的。特征计算过程如下:
1) 使用线性和非线性变换得到10个不同的通道;
2) 在给定的通道对多个30×30大小的矩形框求和得到一组值;
3) 从每个通道中随机选取200个矩形框,最终得到一个2 000维的特征向量。
系统的检测精度会随着所选取的矩形框数量的增加而增长,但系统的运行时间与特征的维度也会相应增加。本文实验结果表明,选取200个和250个矩形框时检测精度基本相同,且对于240×320分辨率的输入图像分别可以得到2 000维和2 500维特征,而消耗的时间分别为0.026 s和0.034 s。因此,本文对每张图片提取200个矩形框。
2 多核SVM算法
使用核函数的基本性质可以将一些常用的核函数按照一定的模板组合成新的核函数。假设,有定义在[X?X]([X?Rm])上的核函数[k1(x,x′)]和[k2(x,x′)],则式(1)~式(3)均为核函数:
[k(x,x′)=k1(x,x′)+k2(x,x′)] (1)
[k(x,x′)=k1(x,x′)k2(x,x′)] (2)
[k(x,x′)=ak1(x,x′), a?R+] (3)
选取合适的核函数可以获得更强大的泛化能力,本文通过对多种基本核函数进行加权来构造混合核函数,加权方式如下:
[k(x,x′)=p=1Umpkp(x,x′),p=1Ump=1, mp0, p=1,2,…,U] (4)
式中:[kp]为核函数;[mp]为[kp]所对应的权重,各种核函数的权重总和为1。由文献[8]可知,式(4)满足Mercer条件,因此可以用于SVM。从式(4)可知,通过调整权重值来获得不同性能的混合核函数,从而可以更灵活地调节混合核的学习能力,提升分类性能。
3 基于多核SVM的行人检测
目前,众多文献使用SVM进行行人检测,但大多是在特征提取阶段做工作,最后直接使用SVM分类器作为识别工具来检测行人;也有文献通过调整参数、寻找最优参数或增加惩罚项系数C来提升SVM的分类性能。但这些方法只是用单一核函数,而并未考虑到单一核函数的局限性,如径向基核函数的分类结果仅与样本间的角度有关;多项式核函数虽具有较强的泛化能力,但当阶数增加时系统复杂性也急剧增加。因此,本文使用混合核函数来提高SVM的学习能力,文中选取的核函数如表1所示。
具体的行人检测过程包括:行人特征的提取、核函数参数的设置、使用网格搜索寻找最优参数和分类器的训练。本文,首先提取行人的积分通道特征。然后,确定混合核函数的形式及其参数的选择范围,这里使用网格搜索的方法调整核函数的参数和SVM的惩罚项C,并使用交叉验证的方式固定参数,通过比较不同的测试结果得到最优的参数设置。本文构建的混合核函数具有3种核函数的优点,兼具学习能力和泛化能力。
4 实验与结果分析
为了验证本文算法的有效性,在TUD[11]数据集上进行仿真测试,并从鲁棒性和实时性两个方面与传统的HOG+SVM算法[12]、多尺度HOG算法[13]以及HIKSVM算法[14]进行比较。本文程序使用Visual C++和OpenCV库开发,在CPU 2.30 GHz,64位Windows 10系统上进行性能测试。首先,比较本文提出的积分通道特征在不同核SVM上的性能,其结果如图1所示。从图1中可以看出,积分通道特征在多项式核SVM和径向基核SVM上效果较为理想。图2为本文方法在TUD数据集上的测试结果。从图2可以看出,本文算法获得了较高的检测精度,和 HOG+SVM算法相比,提高9%;和多尺度HOG算法相比提高2%;和HIKSVM算法相比提高4%。由實验结果可看出,使用多核融合的学习方法能明显提升SVM的性能。图3为本文的检测示例。
5 结 语
单核支持向量机在图像分类识别问题中通常具有较低的鲁棒性和检测精度,本文提出一种多核学习SVM的图像分类识别算法,并将其应用到行人的检测问题中。首先,提取行人的积分通道特征,包括梯度直方图、彩色通道和梯度特征;然后,使用直方图交叉核、多项式核和径向基核构建混合核SVM分类器;最终,使用交叉验证和网格搜索的方法确定各种核的融合系数。在TUD数据集上的测试结果表明,该方法具有较好的鲁棒性和较高的检测精度。
参考文献
[1] 汪洪桥,孙富春,蔡艳宁,等.多核学习方法[J].自动化学报,2010,36(8):1037?1050.
WANG Hongqiao, SUN Fuchun, CAI Yanning, et al. On multiple kernel learning methods [J]. Acta automatica sinica, 2010, 36(8): 1037?1050.
[2] 尹玉娟,王媚,张金江,等.一种自主核优化的二值粒子群优化?多核学习支持向量机变压器故障诊断方法[J].电网技术,2012,36(7):249?254.
YIN Yujuan, WANG Mei, ZHANG Jinjiang, et al. An autonomic kernel optimization method to diagnose transformer faults by multi?kernel learning support vector classifier based on binary particle swarm optimization [J]. Power system technology, 2012, 36(7): 249?254.
[3] 施逸飞,熊岳山,谢智歌,等.基于多核学习的快速网格分割算法[J].计算机辅助设计与图形学学报,2015,27(11):2031?2038.
SHI Yifei, XIONG Yueshan, XIE Zhige, et al. Fast mesh segmentation based on multiple kernel learning [J]. Journal of computer?aided design & computer graphics, 2015, 27(11): 2031?2038.
[4] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2?10.
DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines [J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 2?10.
[5] 毛临川,吴根秀,吴恒,等.基于信息增益的最优组合因子Fisher判别法[J].计算机工程与应用,2016,52(19):94?96.
MAO Linchuan, WU Genxiu, WU Heng, et al. Optimal combination of factor Fisher discrimination method based on information gain [J]. Computer engineering and applications, 2016, 52(19): 94?96.
[6] 刘君,黄燕琪,熊邦书.融合核主成分分析和最小距离鉴别投影的人脸识别算法[J].计算机工程,2016,42(4):221?225.
LIU Jun, HUANG Yanqi, XIONG Bangshu. Face recognition algorithm fused kernel principal component analysis and minimum distance discriminant projection [J]. Computer engineering, 2016, 42(4): 221?225.
[7] 杨雪萍,杨洪耕,马晓阳,等.基于核独立分量分析的谐波责任划分[J].电力系统及其自动化学报,2016,28(12):109?114.
YANG Xueping, YANG Honggeng, MA Xiaoyang, et al. Determination of harmonic contributions based on kernel independent component analysis [J]. Proceedings of the CSU?EPSA, 2016, 28(12): 109?114.
[8] 姜晓庆,夏克文,林永良.使用二次特征选择及核融合的语音情感识别[J].计算机工程与应用,2017,53(3):7?11.
JIANG Xiaoqing, XIA Kewen, LIN Yongliang. Speech emotion recognition using secondary feature selection and kernel fusion [J]. Computer engineering and applications, 2017, 53(3): 7?11.
[9] 谭熊,余旭初,秦进春,等.高光谱影像的多核SVM分类[J].仪器仪表学报,2014,35(2):405?411.
TAN Xiong, YU Xuchu, QIN Jinchun, et al. Multiple kernel SVM classification for hyperspectral images [J]. Chinese journal of scientific instrument, 2014, 35(2): 405?411.
[10] ARMAND R, CHERUBINI C, TUDURI J, et al. Rare earth elements in French stream waters ? revisiting the geochemical continental cycle using FOREGS dataset [J]. Journal of geochemical exploration, 2015, 157: 132?142.
[11] YAO C, WU F, CHEN H J, et al. Traffic sign recognition using HOG?SVM and grid search [C]// Proceedings of International Conference on Signal Processing. Hangzhou: IEEE, 2014: 962?965.
[12] 傅智勇.HOG+SVM行人检测算法在DM6437上的实现与优化[D].广州:华南理工大学,2012.
FU Zhiyong. Realization and optimization of HOG+SVM pedestrian detection algorithm on DM6437 [D]. Guangzhou: South China University of Technology, 2012.
[13] 丁跃.多核支持向量机及其在人脸识别中的应用[D].重庆:重庆大学,2014.
DING Yue. Multiple kernel support vector machine and its application in face recognition [D]. Chongqing: Chongqing University, 2014.
[14] 周炫余,刘娟,卢笑,等.一种联合文本和图像信息的行人检测方法[J].电子学报,2017,45(1):140?146.
ZHOU Xuanyu, LIU Juan, LU Xiao, et al. A method for pedestrian detection by combining textual and visual information [J]. Acta electronica sinica, 2017, 45(1): 140?146.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/11 10:09:52