粒子群优化算法选择特征的运动图像分类
吴雪
摘 要: 为了提高图像分类的效果,考虑当前方法准确实现图像分类的难题,提出粒子群优化算法选择特征的运动图像分类方法。对当前运动图像分类方法的研究现状进行分析,提取不同类型的图像,并采用粒子群优化算法选择最优特征,组成特征向量,将特征向量机作为神经网络的输入,实现运动图像的分类。采用具体图像分类实验进行验证,结果表明,该方法可以描述不同运动图像的类别信息,缩小图像的分类误差,避免其他图像分类方法的缺陷,提高了图像的整体分类正确率。
关键词: 运动图像; 特征选择; 粒子群算法; 图像分类
中图分类号: TN911.73?34; TP317.4 文献标识码: A 文章编号: 1004?373X(2017)17?0047?04
Moving image classification based on particle swarm optimization
algorithm selecting features
WU Xue
(Wuhan Institute of Technology, Wuhan 430205, China)
Abstract: In order to improve the effect of image classification and realize the accurate image classification, a moving image classification method based on particle swarm optimization algorithm selecting features is proposed. The current research status of the moving image classification methods is analyzed to extract the images of different types. The particle swarm optimization algorithm is used to select the optimal feature to compose the feature vector. The feature vector machine is taken as the input of neural network to classify the moving images. The classification experiments of specific images were adopted to make verification. The experimental results show that the method can describe the categories information of different moving images, reduce the classification error of the images, avoid the defects of other image classification methods, and improve the overall image classification accuracy.
Keywords: moving image; feature selection; particle swarm optimization algorithm; image classification
0 引 言
隨着计算机图像处理技术和数码技术的不断发展,在现实生活中产生了大量的运动图像[1]。对运动图像进行快速检索可以便于图像管理,而图像分类是图像管理的基础,建立性能良好的运动图像分类方法具有十分重要和现实的意义,因此图像分类问题引起了人们的高度关注[2?3]。
最原始的运动图像分类主要通过手工方式进行,当图像数量比较少时,该方法可以获得比较理想的图像分类效果,当图像数量比较大时,分类速度慢、费时,给海量图像管理带来了困难[4]。随着自动化技术的不断发展,人们开始采用计算机进行运动图像自动分类,节省了大量的人力,分类速度明显加快[5]。运动图像自动分类首先要提取一定数量、能够描述图像内容的特征,然后根据特征对图像样本进行处理,采用一定的方法建立运动图像分类器,实现运动图像的分类,因此特征直接影响着图像分类结果的好坏。当前运动图像特征主要有纹理、颜色、边缘等特征,每一种特征对每一类图像的分类结果作用是不相同的,它们之间的差异明显[6?7]。单一特征提供的图像内容信息十分有限,为了更好地实现运动图像分类,人们尽可能多的提取运动图像特征,然而特征之间具有一定的相关性,即经常所说的信息冗余,信息冗余对图像分类速度产生不利影响,有时对图像分类的正确率也会产生负面影响,影响图像分类的整体性能[8?9]。有学者提出对图像特征进行降维处理的思想,如主成分分析、判别分析,有效降低了图像特征的维数,加快了图像的分类速度,但只是对图像进行融合,特征对图像分类结果的贡献没有很好的表示出来,有学者采用遗传算法、粒子群算法对运动图像特征进行选择,它们没有破坏图像特征的原始意义,图像分类结果的可解释性好,然而它们也存在一定的不足,运动图像分类结果有待改善[10?12]。
为了提高图像分类的效果,考虑当前方法无法准确实现图像分类的难题,提出粒子群优化算法(PSO)选择特征的运动图像分类方法,结果表明,该方法减少了图像的分类误差,提高了图像的整体分类正确率,可以满足运动图像自动管理的需要。
1 粒子群优化算法选择特征的运动图像分类原理
基于PSO算法的运动图像分类原理为:首先采集运动图像,并提取不同类型的特征;然后采用粒子群算法对最重要的特征进行搜索,选择最重要的特征组成特征向量;最后采用神经网络建立图像分类器进行图像分类,如图1所示。
2 粒子群优化算法选择特征的运动图像分类方法
2.1 提取图像特征
要进行图像分类建模,首先要提取有效图像特征,当前特征主要有颜色、纹理和边缘,不同特征提取方法可以获得不同的特征向量和特征维数,而且可以产生不同的图像分类结果。
2.1.1 提取顏色矩特征
当前颜色特征有很多,如颜色集、颜色聚合向量等,它们均需要对图像进行量化处理,使图像分类的错误率相当高,而且忽略了图像像素间的内在联系。颜色矩(color moments)将图像颜色分布用矩来描述,重要信息常存于低阶矩中,可以通过一阶矩、二阶矩描述颜色分布。不同运动图像的颜色矩特征如表1所示。
2.1.2 提取纹理特征
纹理特征是图像中最常见的一种特征,Gabor滤波具有良好的选择性,能够描述图像的空间特征,为此采用Gabor变换提取图像的纹理特征。Gabor滤波器的函数表示为:
(1)
式中:和为Gabor滤波器的方向和尺度;为高斯窗的宽度率;为最大采样频率;为采样步长;为图像位置;表示求二范数。
将运动图像和滤波器进行卷积操作,可以产生不同尺度和不同的滤波结果,图像特征可以描述为:
(2)
运动图像经过Gabor处理后,每个像素点产生40个幅值,它们组成一个向量,即运动图像的纹理特征向量。
提取运动图像的颜色、纹理特征后,为运动图像自动分类提供了基础,然而运动图像特征数量大,而且具有一定的冗余信息,因此选择粒子群算法对运动图像进行选择。
2.2 粒子群优化算法的特征选择
粒子群优化算法是模拟鸟群觅食的智能优化算法,每个粒子空间中不断调整位置,移动方式如图2所示。
粒子飞行过程中,利用下式估计下次飞行的向量值:
(3)
(4)
式中:为粒子;为的速度;为的当前最优解;为粒子种群的最优解;为随机数;为加权系数。
通过粒子群算法对运动图像特征进行搜索和选择,找到最优的运动图像特征,减少分类器的特征向量维数。
2.3 神经网络的图像分类器
BP神经网络是一种误差反向传播的神经网络,函数逼近能力非常强大,基本结构如图3所示。
BP神经网络的运动图像分类步骤如下:
(1) 采集运动图像样本数据,并进行相应的预处理,如去噪等。
(2) 颜色特征和纹理特征的量纲和类型不同,为了避免量纲对运动图像的干扰,具体进行如下操作:
(5)
(3) 将运动图像特征选择转化为一个优化问题,并建立相应的数学模型,采用粒子群算法求解该数学模型的解,即运动图像特征的最佳子特征。
(4) 根据最佳子特征确定BP神经网络的结构,通过BP神经网络训练,建立运动图像分类器,对运动图像进行分类并输出分类结果。
3 运动图像分类实验及结果分析
为了分析粒子群算法选择特征的运动图像分类性能,选择网球、足球、排球、乒乓球、羽毛球共5类运动图像,它们的样本数如表2所示。
选择PCA选择特征、原始特征、遗传算法选择特征(GA)的图像分类方法进行对比实验,以选择分类正确率(%)、平均训练时间(s)进行评价。运动图像的分类正确率和训练时间如图4,图5所示。
对图4,图5的运动图像分类结果进行分析,可知:
(1) 在所有方法中,原始特征的运动图像分类方法的分类效果最差,这是因为颜色和纹理特征简单组合在一起,特征的维数相当高,分类器的结构复杂,训练时间增加,而且特征之间有一定的相关性,使得特征对图像分类结果产生干扰,运动图像分类的误分率增加,运动图像的分类速度慢,无法满足运动图像管理的实际应用要求。
(2) 相对PCA方法,基于PSO算法的运动图像分类正确率得到提高,这是因为PSO算法对图像特征进行搜索和选择,可以获得更优的运动图像特征,而PCA只能选择运动图像的线性特征,会丢失对运动图像分类结果十分重要的非线性特征,构建的运动图像分类器效果不太理想,虽然图像分类的速度得到了改善,但实际应用价值低。
(3) 相对于GA的运动图像分类方法,PSO算法的运动图像分类结果的误分率减少,得到了更高的运动图像分类正确率,这是因为PSO算法的搜索能力要强于GA,得到了更优的特征,可以更加有效地描述图像内容信息,建立了整体更优的图像分类器,而且图像分类的训练时间更少,提高了图像分类效率。
4 结 语
图像分类广泛应用于图像管理中,对图像进行准确分类,可以提高图像管理效率,获得更优的实际应用价值。为了解决当前图像分类方法的局限性,本文提出粒子群优化算法选择特征的运动图像分类方法,该方法不仅获得了更高的正确率,同时加快了运动图像的分类速度,更好地满足了运动图像的实际应用需要。
参考文献
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] CHEN Y X, WANG J Z. Image categorization by learning and reasoning with regions [J]. Journal of machine learning research, 2004, 5(8): 913?939.
[3] ZHAO G, PIETIKAINEN M. Dynamic texture recognition using local binary patterns with an application to facial expressions [J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 27(6): 915?928.
[4] ZHANG B C, GAO Y S, ZHAO S Q, et al. Local derivative pattern versus local binary pattern: face recognition with high?order local pattern descriptor [J]. IEEE transactions on image processing, 2010, 19(2): 533?544
[5] JIANG Shuhong, CHEN Bingfa. Method of image retrieval based on integrating low level feature with relevance feedback [J]. Machine building and automation, 2009, 38(3): 51?53.
[6] 戴修斌,张辉,舒华忠,等.基于正交矩模糊和仿射混合不变量的图像识别算法[J].东南大学学报(自然科学版),2011,41(1):52?57.
[7] 张刚,马宗民.一种采用Gabor小波的纹理特征提取方法[J].中国图象图形学报,2010,15(2):247?254.
[8] 祝军,赵杰煜,董振宇.融合显著信息的层次特征学习图像分类[J].计算机研究与发展,2014,51(9):1919?1928.
[9] 倪鹏,黄蔚,吕巍,等.基于Zernike矩特征的FCM?RBF神经网络图像分类器[J].吉林大学学报(理学版),2014,52(6):1284?1288.
[10] 谢文兰,石跃祥,肖平.应用BP神经网络对自然图像分类[J].计算机工程与应用,2010,46(2):163?166.
[11] 付岩,王耀威,王伟强,等.SVM用于基于内容的自然图像分类和检索[J].计算机学报,2003,26(10):1261?1265.
[12] 朱飞,王兴起.基于SIFT 算法的体育类图像分类与应用研究[J].计算机应用与软件,2011,28(10):231?234.
摘 要: 为了提高图像分类的效果,考虑当前方法准确实现图像分类的难题,提出粒子群优化算法选择特征的运动图像分类方法。对当前运动图像分类方法的研究现状进行分析,提取不同类型的图像,并采用粒子群优化算法选择最优特征,组成特征向量,将特征向量机作为神经网络的输入,实现运动图像的分类。采用具体图像分类实验进行验证,结果表明,该方法可以描述不同运动图像的类别信息,缩小图像的分类误差,避免其他图像分类方法的缺陷,提高了图像的整体分类正确率。
关键词: 运动图像; 特征选择; 粒子群算法; 图像分类
中图分类号: TN911.73?34; TP317.4 文献标识码: A 文章编号: 1004?373X(2017)17?0047?04
Moving image classification based on particle swarm optimization
algorithm selecting features
WU Xue
(Wuhan Institute of Technology, Wuhan 430205, China)
Abstract: In order to improve the effect of image classification and realize the accurate image classification, a moving image classification method based on particle swarm optimization algorithm selecting features is proposed. The current research status of the moving image classification methods is analyzed to extract the images of different types. The particle swarm optimization algorithm is used to select the optimal feature to compose the feature vector. The feature vector machine is taken as the input of neural network to classify the moving images. The classification experiments of specific images were adopted to make verification. The experimental results show that the method can describe the categories information of different moving images, reduce the classification error of the images, avoid the defects of other image classification methods, and improve the overall image classification accuracy.
Keywords: moving image; feature selection; particle swarm optimization algorithm; image classification
0 引 言
隨着计算机图像处理技术和数码技术的不断发展,在现实生活中产生了大量的运动图像[1]。对运动图像进行快速检索可以便于图像管理,而图像分类是图像管理的基础,建立性能良好的运动图像分类方法具有十分重要和现实的意义,因此图像分类问题引起了人们的高度关注[2?3]。
最原始的运动图像分类主要通过手工方式进行,当图像数量比较少时,该方法可以获得比较理想的图像分类效果,当图像数量比较大时,分类速度慢、费时,给海量图像管理带来了困难[4]。随着自动化技术的不断发展,人们开始采用计算机进行运动图像自动分类,节省了大量的人力,分类速度明显加快[5]。运动图像自动分类首先要提取一定数量、能够描述图像内容的特征,然后根据特征对图像样本进行处理,采用一定的方法建立运动图像分类器,实现运动图像的分类,因此特征直接影响着图像分类结果的好坏。当前运动图像特征主要有纹理、颜色、边缘等特征,每一种特征对每一类图像的分类结果作用是不相同的,它们之间的差异明显[6?7]。单一特征提供的图像内容信息十分有限,为了更好地实现运动图像分类,人们尽可能多的提取运动图像特征,然而特征之间具有一定的相关性,即经常所说的信息冗余,信息冗余对图像分类速度产生不利影响,有时对图像分类的正确率也会产生负面影响,影响图像分类的整体性能[8?9]。有学者提出对图像特征进行降维处理的思想,如主成分分析、判别分析,有效降低了图像特征的维数,加快了图像的分类速度,但只是对图像进行融合,特征对图像分类结果的贡献没有很好的表示出来,有学者采用遗传算法、粒子群算法对运动图像特征进行选择,它们没有破坏图像特征的原始意义,图像分类结果的可解释性好,然而它们也存在一定的不足,运动图像分类结果有待改善[10?12]。
为了提高图像分类的效果,考虑当前方法无法准确实现图像分类的难题,提出粒子群优化算法(PSO)选择特征的运动图像分类方法,结果表明,该方法减少了图像的分类误差,提高了图像的整体分类正确率,可以满足运动图像自动管理的需要。
1 粒子群优化算法选择特征的运动图像分类原理
基于PSO算法的运动图像分类原理为:首先采集运动图像,并提取不同类型的特征;然后采用粒子群算法对最重要的特征进行搜索,选择最重要的特征组成特征向量;最后采用神经网络建立图像分类器进行图像分类,如图1所示。
2 粒子群优化算法选择特征的运动图像分类方法
2.1 提取图像特征
要进行图像分类建模,首先要提取有效图像特征,当前特征主要有颜色、纹理和边缘,不同特征提取方法可以获得不同的特征向量和特征维数,而且可以产生不同的图像分类结果。
2.1.1 提取顏色矩特征
当前颜色特征有很多,如颜色集、颜色聚合向量等,它们均需要对图像进行量化处理,使图像分类的错误率相当高,而且忽略了图像像素间的内在联系。颜色矩(color moments)将图像颜色分布用矩来描述,重要信息常存于低阶矩中,可以通过一阶矩、二阶矩描述颜色分布。不同运动图像的颜色矩特征如表1所示。
2.1.2 提取纹理特征
纹理特征是图像中最常见的一种特征,Gabor滤波具有良好的选择性,能够描述图像的空间特征,为此采用Gabor变换提取图像的纹理特征。Gabor滤波器的函数表示为:
(1)
式中:和为Gabor滤波器的方向和尺度;为高斯窗的宽度率;为最大采样频率;为采样步长;为图像位置;表示求二范数。
将运动图像和滤波器进行卷积操作,可以产生不同尺度和不同的滤波结果,图像特征可以描述为:
(2)
运动图像经过Gabor处理后,每个像素点产生40个幅值,它们组成一个向量,即运动图像的纹理特征向量。
提取运动图像的颜色、纹理特征后,为运动图像自动分类提供了基础,然而运动图像特征数量大,而且具有一定的冗余信息,因此选择粒子群算法对运动图像进行选择。
2.2 粒子群优化算法的特征选择
粒子群优化算法是模拟鸟群觅食的智能优化算法,每个粒子空间中不断调整位置,移动方式如图2所示。
粒子飞行过程中,利用下式估计下次飞行的向量值:
(3)
(4)
式中:为粒子;为的速度;为的当前最优解;为粒子种群的最优解;为随机数;为加权系数。
通过粒子群算法对运动图像特征进行搜索和选择,找到最优的运动图像特征,减少分类器的特征向量维数。
2.3 神经网络的图像分类器
BP神经网络是一种误差反向传播的神经网络,函数逼近能力非常强大,基本结构如图3所示。
BP神经网络的运动图像分类步骤如下:
(1) 采集运动图像样本数据,并进行相应的预处理,如去噪等。
(2) 颜色特征和纹理特征的量纲和类型不同,为了避免量纲对运动图像的干扰,具体进行如下操作:
(5)
(3) 将运动图像特征选择转化为一个优化问题,并建立相应的数学模型,采用粒子群算法求解该数学模型的解,即运动图像特征的最佳子特征。
(4) 根据最佳子特征确定BP神经网络的结构,通过BP神经网络训练,建立运动图像分类器,对运动图像进行分类并输出分类结果。
3 运动图像分类实验及结果分析
为了分析粒子群算法选择特征的运动图像分类性能,选择网球、足球、排球、乒乓球、羽毛球共5类运动图像,它们的样本数如表2所示。
选择PCA选择特征、原始特征、遗传算法选择特征(GA)的图像分类方法进行对比实验,以选择分类正确率(%)、平均训练时间(s)进行评价。运动图像的分类正确率和训练时间如图4,图5所示。
对图4,图5的运动图像分类结果进行分析,可知:
(1) 在所有方法中,原始特征的运动图像分类方法的分类效果最差,这是因为颜色和纹理特征简单组合在一起,特征的维数相当高,分类器的结构复杂,训练时间增加,而且特征之间有一定的相关性,使得特征对图像分类结果产生干扰,运动图像分类的误分率增加,运动图像的分类速度慢,无法满足运动图像管理的实际应用要求。
(2) 相对PCA方法,基于PSO算法的运动图像分类正确率得到提高,这是因为PSO算法对图像特征进行搜索和选择,可以获得更优的运动图像特征,而PCA只能选择运动图像的线性特征,会丢失对运动图像分类结果十分重要的非线性特征,构建的运动图像分类器效果不太理想,虽然图像分类的速度得到了改善,但实际应用价值低。
(3) 相对于GA的运动图像分类方法,PSO算法的运动图像分类结果的误分率减少,得到了更高的运动图像分类正确率,这是因为PSO算法的搜索能力要强于GA,得到了更优的特征,可以更加有效地描述图像内容信息,建立了整体更优的图像分类器,而且图像分类的训练时间更少,提高了图像分类效率。
4 结 语
图像分类广泛应用于图像管理中,对图像进行准确分类,可以提高图像管理效率,获得更优的实际应用价值。为了解决当前图像分类方法的局限性,本文提出粒子群优化算法选择特征的运动图像分类方法,该方法不仅获得了更高的正确率,同时加快了运动图像的分类速度,更好地满足了运动图像的实际应用需要。
参考文献
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] CHEN Y X, WANG J Z. Image categorization by learning and reasoning with regions [J]. Journal of machine learning research, 2004, 5(8): 913?939.
[3] ZHAO G, PIETIKAINEN M. Dynamic texture recognition using local binary patterns with an application to facial expressions [J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 27(6): 915?928.
[4] ZHANG B C, GAO Y S, ZHAO S Q, et al. Local derivative pattern versus local binary pattern: face recognition with high?order local pattern descriptor [J]. IEEE transactions on image processing, 2010, 19(2): 533?544
[5] JIANG Shuhong, CHEN Bingfa. Method of image retrieval based on integrating low level feature with relevance feedback [J]. Machine building and automation, 2009, 38(3): 51?53.
[6] 戴修斌,张辉,舒华忠,等.基于正交矩模糊和仿射混合不变量的图像识别算法[J].东南大学学报(自然科学版),2011,41(1):52?57.
[7] 张刚,马宗民.一种采用Gabor小波的纹理特征提取方法[J].中国图象图形学报,2010,15(2):247?254.
[8] 祝军,赵杰煜,董振宇.融合显著信息的层次特征学习图像分类[J].计算机研究与发展,2014,51(9):1919?1928.
[9] 倪鹏,黄蔚,吕巍,等.基于Zernike矩特征的FCM?RBF神经网络图像分类器[J].吉林大学学报(理学版),2014,52(6):1284?1288.
[10] 谢文兰,石跃祥,肖平.应用BP神经网络对自然图像分类[J].计算机工程与应用,2010,46(2):163?166.
[11] 付岩,王耀威,王伟强,等.SVM用于基于内容的自然图像分类和检索[J].计算机学报,2003,26(10):1261?1265.
[12] 朱飞,王兴起.基于SIFT 算法的体育类图像分类与应用研究[J].计算机应用与软件,2011,28(10):231?234.