标题 | 浅析SVM核函数对手写数字识别的影响 |
范文 | 武昭盟 张成刚 摘要:支持向量机(Support Vector Machine,SVM)是一种高效的机器学习分类算法,针对手写数字识别问题,首先介绍了基于SVM的手写数字识别算法,详细阐述了相关核函数并分析SVM核函数的选择对识别效果影响,最后通过实验验证了算法在选取不同核函数条件下相对应的识别率,为相关SVM识别问题的研究提供了参考。 关键词:支持向量机;手写数字识别;核函数 中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)27-0180-02 手写数字识别技术在现实中有着广泛应用,比如在邮政系统中的信件分拣、统计报表中的数字录入以及银行业务中的票据和信用卡账单处理等等,因此手写数字识别技术的研究具有较高的实用价值。目前针对手写数字识别有基于决策树、神经网络、支持向量机等方法,本文以SVM算法为例,详细阐述基于SVM算法的手写数字识别过程,验证了SVM识别算法的有效性。 1 支持向量机算法 支持向量机(Support Vector Machine,SVM)由Vapnik在20世纪60年代首先提出的, 适用于分类和回归问题。支持向量机以统计学习理论为基础,以结构风险最小化为原则,通过建立一个分类超平面作为决策曲面,最大化正例和反例之间的隔离边缘,达到分类效果。 其中,K代表核函数,主要有以下几种类型: 1) 线性核函数(linear kernel):[Kx,xi=xTxi],主要用于线性可分的数据效果较好,这种核函数的优点是参数少,而且执行速度快。 2) 多项式核函数(polynomial kernel):[Kx,xi=γxTxi+rp,γ>0],可以将低维度的样本空间映射到高维的特征空间,但参数多且计算量大,容易导致“过拟合”。 3) 径向基核函数(RBF kernel)也称为高斯核函数:[Kx,xi=exp-γx-xi2,γ>0]相对于多项式核函数参数较少,而且能够取得较好的性能,对于未知数据分类任务默认选择RBF核函数。 4) 两层感知器核函数(sigmoid kernel):[Kx,xi=tanhγxTxi+r],当SVM采用sigmoid核函数时,其实现的就是一种多层神经网络结构。 因此,如何选择相关核函数取决于分类任务自身的数据分布,对问题要有一定的先验知识;否则,只能凭借经验或者凑试法,用来选择误差最小的核函数。 3 基于SVM的手写数字识别算法 1) 建立模型 基于SVM的手写数字识别算法总体流程为,首先对数据集中的训练数据进行预处理,然后训练SVM模型选取最佳核函数,接下来用训练好的模型测试分类数据,算法流程如下图所示。 2) 预处理 由于手写图片中数字的大小和位置形态各异,预处理过程是消除每幅图像中无关的内容,展现图片本质信息。首先把数据集中每幅图片转换为二值图像,然后截取包含数字的最大区域,此时每幅图片中数字上像素点灰度值为1,背景中像素点值为0,处理前后的图片如下图所示。 4 实验结果及分析 实验平台为MATLAB(R2009a),LIBSVM 工具箱版本为3. 14,可在http: //www. csie. ntu.edu. tw/~cjlin/libsvm/下载。实验选取的数据集中训练样本为100幅手写数字图片,每个手写数字均有10幅图片,而测试样本为30幅手写数字图片,所有图片大小均为25×25像素,如图4所示。 通过上面的实验结果可以看出,当采用RBF核函数时,手写数字测试集的分类准确率最高,其中svmtrain 的惩罚参数c和核函数参数g是在某一范围内离散取值,取使得最终测试集分类准确率最高的c和g为最佳的参数。 5 总结 手写数字自动识别技术不仅使人们摆脱重复且易出错的操作,而且极大地提升了工作效率。本文首先介绍了基于SVM手写数字识别算法的一般过程,描述了相关核函数并分析SVM核函数的选择对识别效果影响,然后使用LIBSVM工具箱进行编程实现,最后通过实验验证了算法在选取不同核函数条件下相对应的识别率,为相关SVM识别问题的研究提供了参考。 参考文献: [1] 石會芳.支持向量机及其在手写数字识别中的应用[D].重庆大学,2013. [2] 杨海.SVM核参数优化研究与应用[D].浙江大学,2014. [3] 王小川.MATLAB神经网络43个案例分析[M].北京航空航天大学出版社,2013. [4] 赵海燕,张世铮,庄丽艳.基于LS_SVM的车牌字符识别[J].内蒙古民族大学学报:自然科学版,2009,24(06):623-625. [5] 李雅琴.SVM在手写数字识别中的应用研究[D].华中师范大学,2007. [6] 吴琳琳.基于SVM技术的手写数字识别的研究[D].山东师范大学,2006. [通联编辑: ] |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。