面向再制造服务的回转类表面缺陷识别
刘翔+夏绪辉+王蕾
摘 要: 再制造活动现场复杂的环境对获取清晰的再制造目标表面缺陷图像造成了困难,针对这一问题提出一种结合频域与空域特征进行回转类表面缺陷识别的方法。首先使用非下采样Contourlet变换提取原始图像中各尺度下的Contourlet系数特征,并与图像中的灰度纹理特征组合;再采用基于径向基核函数的PCA分析方法对原始特征进行降维处理;最后,利用最小二乘概率分类方法对降维后的特征进行分类。通过对现场采集的图像进行案例分析,所提出的分類识别方法对4类再制造轧辊缺陷的分类平均正确率达到92%以上。
关键词: 再制造服务; 表面缺陷识别; 非下采样轮廓波变换; 核主成分分析
中图分类号: TN911.73?34 文献标识码: A 文章编号: 1004?373X(2017)23?0047?04
Abstract: For the complex environment in remanufacturing activity fields, it is difficult to acquire the clear image with surface defect in the remanufacturing target. Aiming at this problem, a surface detect recognition method of rotational parts is proposed, which is based on the characteristics of frequency domain and spatial domain. The nonsubsampled Contourlet transform is used to extract the Contourlet coefficient characteristics of original image under different dimensions, and then the characteristics are combined with the gray textural characteristics in the image. The PCA method based on radial basis kernel function is adopted to perform the dimension reduction for the original characteristics. The least square probability classification method is employed to classify the characteristics after dimension reduction. The case analysis is carried on for the image acquired on site. By using the proposed classification and recognition method, the average classification accuracy of the four types of the remanufacturing roll surface defect is higher than 92%.
Keywords: remanufacturing service; surface defect recognition; nonsubsampled contourlet transform; kernel principal component analysis
0 引 言
按照不同的表面缺陷制定有针对性的再制造方案是再制造服务活动能否成功的关键。提高物体表面缺陷的识别率,是解决这一关键问题的有效途径。目前,很多学者在如何提高表面缺陷的识别率上开展了深入的研究。
文献[1]为提高钢芯缺陷的识别率,提出一种基于属性数据标准差的邻域粗糙集特征约简算法,该方法有效克服了前向贪心属性约减算法达不到最小约减的缺点,不仅有效地降低特征维数,还提高了分类识别准确率。
文献[2]将时域峰值特征与小波包能量特征结合构成表征图像的混合特征,通过实验证明,混合特征具有比单一小波包能量特征更强的可分离性,将其用于SVM分类具有识别泛化误差小,正确率高的特点。文献[3]采用盲信号ICA分析法提取冷轧带钢表面缺陷特征,并采用PCA对特征进行降维,提高了SVM分类器的识别正确率。文献[4]将DS证据理论引入SVM分类框架,设计了一种多特征SVM?DS决策规则,在缺陷识别正确率和泛化性方面都比SVM有优势。文献[5]针对SVM分类器在多类识别问题中效率较低的问题,采用最优有向无环图支持向量机(DAG?SVM)对带钢表面缺陷进行分类识别,在识别率、识别速度及抗噪性等方面都有较大改善。
考虑到再制造服务现场生产环境恶劣使图像中混入过多的噪声形成“伪缺陷”的实际情况,上述一些方法可能会由于“伪缺陷”的存在使分类识别的性能恶化。本文从提取图像中较为稳定的变换域特征着手,利用非下采样Contourlet变换提取缺陷的变换域特征,采用基于核函数的PCA分析法对提取的特征进行降维处理,利用处理的结果作为最小二乘概率分类器的输入对样本进行分类。最后以轧辊表面缺陷分类识别为案例对该算法进行验证,验证的结果表明,本文提出的算法对于轧辊表面缺陷的分类识别具有较高的识别率。
1 缺陷特征提取与选择
特征提取就是用一组符号或数字将样本的特征表示出来以便于后续处理,特征提取的优劣程度强烈地影响到分类器的设计及其分类性能。而特征选择则是寻找最重要的特征,并忽略掉对正确分类贡献率较低的特征,进一步对所提取的特征进行优化,改善分类器的性能。
1.1 非下采样Contourlet变换
为提取较为完整的缺陷变换域信息,本文采用了文献[6?7]提出的Contourlet变换(CT)的改进方法——非下采样Contourlet变换(NSCT),该方法不仅克服了小波变换在处理二维信号“奇异线”时由于缺少方向性而无法将信号精确表示出来的缺陷,对存在各向异性的图像也能很好地进行多尺度分析;还克服了标准Contourlet变换不具备平移不变性,容易导致伪吉布斯(Gibbs)现象的缺点。非下采样Contourlet变换采用非下采样金字塔结构(NPS)和非下采样方向滤波器组(NDFB)替换标准Contourlet变换中使用的拉普拉斯塔式滤波器(LP)与方向滤波器组(DFB),其原理可用图1表示。
原始图像先经过NPS滤波分解成了一个低通子带和一个带通子带,其中的低通子带是原始图像的逼近,带通子带则是原始图像中的中高频细节;再对带通子带采取NDFB滤波得到图像在各个方向上的细节;同时,对低通子带继续采用如上方法滤波可实现图像多尺度分析。由于NSCT对CT的改进使其具有更好的空域与频域性质,因此能够更好地表征与提取原始图像中缺陷的几何特征。
1.2 基于核函数的PCA分析
主成分分析(PCA)[8]是一种将高维特征映射为低维综合特征的统计分析方法,在模式识别问题中有着广泛的应用。其思想是使降维后的数据与原始数据相比具有最小的信息损失,即降维后的数据是原始数据的正交投影。
2 基于最小二乘原则的概率分类方法
3 案例分析
本文选取国内某大型钢铁企业CSP车间现场采集的752幅4大类轧辊表面缺陷图像作为样本与测试集对文中所提方法进行验证分析,为了后期处理方便,已预先将所有图像统一成80×80大小的分辨率。这4大类缺陷752幅图像的具体情况如表1所示。
为客观验证所提方法的有效性,采用交叉验证的方法。即将样本分为两部分:一部分作为训练样本集;另一部分作为测试集。具体验证过程为:
Step1:从训练样本集中提取特征,构成样本集特征矩阵。
对每个样本共进行5种尺度下的非下采样Contourlet变换,如图2所示(以一种夹渣缺陷为例)。按照原始图像、低尺度图像、高尺度图像的顺序将各图像依次排列,再依先后次序依次提取各图像的灰度均值与方差,最后将这些均值与方差做归一化处理组合起来,作为样本特征。由于每种尺度下的非下采样Contourlet变换最多可有[2i]个子图,因此每个样本可用一个126维的向量表示。
为了减少计算图像纹理特征的复杂度,將样本图像由原来的256个灰度级重新量化成16个灰度级。接下来,提取图像中0°,45°,90°与135°四个方向上的灰度共生矩阵[11](Gray Level Co?occurrence Matrix,GLCM)。再从此矩阵中计算出可以表征图像内容的统计量(能量、熵、二阶矩与相关量)作为纹理特征。由于每一种纹理统计量均有4个方向上的值,对每个方向上的各纹理统计量计算均值与方差可得到一个8维向量。将该8维特征向量与上述126维特征向量进行组合可得134维特征向量。因此,样本集可以表示为一个376×134维的特征矩阵。
Step2:对样本特征进行降维。
按照基于核函数的PCA分析方法对原始特征进行降维,提取前[m]个主要成分作为原始样本特征的替代。图3表示的是基于核函数的主成分累积贡献率。由该图可知,若考虑主成分积累效应<0.8,只需提取前面的3个主成分分量构成新的特征矩阵,但此时描述不同样本的特征数太少,会大大影响分类的准确性;若考虑主成分积累效应<0.9,则需提取前37个主成分分量作为新的特征矩阵,此时描述样本的特征数较多,会增加分类器的复杂程度。综合考虑以上因素,本文选取主成分积累效应<0.85,这样只需提取前面的18个主成分,大大降低了分类器的复杂程度。经过降维,样本的特征矩阵从376×134降为376×18,特征数据被压缩了86.56%。图4反映的是标准PCA与核PCA方法在处理本文特征向量时耗时的情况。由图4可知,核PCA方法在处理样本数量大于特征数量的情况下计算速度较快。
Step3:设计分类器,对降维后样本特征进行分类。表2列出了本文方法得到的分类结果。其中,测试1的结果是将全部样本的前1/2作为训练集,后1/2作为测试集得到的;测试2的结果是将测试1的训练集与测试集交换后得到的。另外,为了验证本文方法的有效性,设计了两组对照组试验。对照组1采用的是“混合特征+SVM”的方法,对照组2采用的是“变换域特征+概率分类”的方法。
4 结 论
针对回转类零部件表面缺陷再制造活动现场复杂的环境对表面缺陷需进行分类识别的要求,利用非下采样Contourlet变换提取样本图像中较为稳定的变换域特征与纹理特征构成分类的特征集,采用基于核函数的PCA分析方法对提取的特征进行降维,最后利用基于最小二乘分类器对测试样本进行分类。从工业现场采集的轧辊样本案例分析结果可知,在样本数不大的情况下,本文所提出的方法对于常见的4种轧辊表面缺陷的平均识别正确率达到92%以上,缺陷识别效果较好。
参考文献
[1] 毛清华,马宏伟,张旭辉.改进邻域粗糙集的输送带缺陷特征约简算法[J].仪器仪表学报,2014,35(7):1676?1680.
[2] 孙红春,谢里阳,邢海涛.基于混合特征和支持向量机的抽油杆缺陷识别[J].东北大学学报(自然科学版),2009,30(2):266?269.
[3] 段志娟,周新星,陈分雄,等.基于独立成分分析的冷轧带钢表面缺陷识别[J].钢铁研究学报,2011,23(10):63?66.
[4] 车红昆,吕福在,项占琴.多特征SVM?DS融合决策的缺陷识别[J].机械工程学报,2010,46(16):101?105.
[5] 任海鹏,马展峰.基于复杂网络特性的带钢表面缺陷识别[J].自动化学报,2011,37(11):1407?1412.
[6] CUNHA A L D, ZHOU J P, DO M N. The nonsubsampled contourlet transform: theory, design, and applications [J]. IEEE transactions on image processing, 2006, 15(10): 3089?3101.
[7] DO M N, VETTERLI M. The contourlet transform: an efficient directional multiresolution image representation [J]. IEEE tran?sactions on image processing, 2005, 14(12): 2091?2106.
[8] JOLLIFFE I T. Principal component analysis [M]. Berlin: Springer, 2002.
[9] SCHOLKOPF B, SMOLA A J, MULLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural computation, 1998, 10(5): 1299?1319.
[10] MULLER K R, MIKA S, RATSCH G, et al. An introduction to kernel?based learning algorithms [J]. IEEE transactions on neural networks, 2001, 12(2): 181?201.
[11] PASARIBU D P. An investigation of textural characteristic for geological purposes [C]// Proceedings of 1996 Geoscience and Remote Sensing Symposium. [S.l.]: IEEE, 1996: 372?373.
摘 要: 再制造活动现场复杂的环境对获取清晰的再制造目标表面缺陷图像造成了困难,针对这一问题提出一种结合频域与空域特征进行回转类表面缺陷识别的方法。首先使用非下采样Contourlet变换提取原始图像中各尺度下的Contourlet系数特征,并与图像中的灰度纹理特征组合;再采用基于径向基核函数的PCA分析方法对原始特征进行降维处理;最后,利用最小二乘概率分类方法对降维后的特征进行分类。通过对现场采集的图像进行案例分析,所提出的分類识别方法对4类再制造轧辊缺陷的分类平均正确率达到92%以上。
关键词: 再制造服务; 表面缺陷识别; 非下采样轮廓波变换; 核主成分分析
中图分类号: TN911.73?34 文献标识码: A 文章编号: 1004?373X(2017)23?0047?04
Abstract: For the complex environment in remanufacturing activity fields, it is difficult to acquire the clear image with surface defect in the remanufacturing target. Aiming at this problem, a surface detect recognition method of rotational parts is proposed, which is based on the characteristics of frequency domain and spatial domain. The nonsubsampled Contourlet transform is used to extract the Contourlet coefficient characteristics of original image under different dimensions, and then the characteristics are combined with the gray textural characteristics in the image. The PCA method based on radial basis kernel function is adopted to perform the dimension reduction for the original characteristics. The least square probability classification method is employed to classify the characteristics after dimension reduction. The case analysis is carried on for the image acquired on site. By using the proposed classification and recognition method, the average classification accuracy of the four types of the remanufacturing roll surface defect is higher than 92%.
Keywords: remanufacturing service; surface defect recognition; nonsubsampled contourlet transform; kernel principal component analysis
0 引 言
按照不同的表面缺陷制定有针对性的再制造方案是再制造服务活动能否成功的关键。提高物体表面缺陷的识别率,是解决这一关键问题的有效途径。目前,很多学者在如何提高表面缺陷的识别率上开展了深入的研究。
文献[1]为提高钢芯缺陷的识别率,提出一种基于属性数据标准差的邻域粗糙集特征约简算法,该方法有效克服了前向贪心属性约减算法达不到最小约减的缺点,不仅有效地降低特征维数,还提高了分类识别准确率。
文献[2]将时域峰值特征与小波包能量特征结合构成表征图像的混合特征,通过实验证明,混合特征具有比单一小波包能量特征更强的可分离性,将其用于SVM分类具有识别泛化误差小,正确率高的特点。文献[3]采用盲信号ICA分析法提取冷轧带钢表面缺陷特征,并采用PCA对特征进行降维,提高了SVM分类器的识别正确率。文献[4]将DS证据理论引入SVM分类框架,设计了一种多特征SVM?DS决策规则,在缺陷识别正确率和泛化性方面都比SVM有优势。文献[5]针对SVM分类器在多类识别问题中效率较低的问题,采用最优有向无环图支持向量机(DAG?SVM)对带钢表面缺陷进行分类识别,在识别率、识别速度及抗噪性等方面都有较大改善。
考虑到再制造服务现场生产环境恶劣使图像中混入过多的噪声形成“伪缺陷”的实际情况,上述一些方法可能会由于“伪缺陷”的存在使分类识别的性能恶化。本文从提取图像中较为稳定的变换域特征着手,利用非下采样Contourlet变换提取缺陷的变换域特征,采用基于核函数的PCA分析法对提取的特征进行降维处理,利用处理的结果作为最小二乘概率分类器的输入对样本进行分类。最后以轧辊表面缺陷分类识别为案例对该算法进行验证,验证的结果表明,本文提出的算法对于轧辊表面缺陷的分类识别具有较高的识别率。
1 缺陷特征提取与选择
特征提取就是用一组符号或数字将样本的特征表示出来以便于后续处理,特征提取的优劣程度强烈地影响到分类器的设计及其分类性能。而特征选择则是寻找最重要的特征,并忽略掉对正确分类贡献率较低的特征,进一步对所提取的特征进行优化,改善分类器的性能。
1.1 非下采样Contourlet变换
为提取较为完整的缺陷变换域信息,本文采用了文献[6?7]提出的Contourlet变换(CT)的改进方法——非下采样Contourlet变换(NSCT),该方法不仅克服了小波变换在处理二维信号“奇异线”时由于缺少方向性而无法将信号精确表示出来的缺陷,对存在各向异性的图像也能很好地进行多尺度分析;还克服了标准Contourlet变换不具备平移不变性,容易导致伪吉布斯(Gibbs)现象的缺点。非下采样Contourlet变换采用非下采样金字塔结构(NPS)和非下采样方向滤波器组(NDFB)替换标准Contourlet变换中使用的拉普拉斯塔式滤波器(LP)与方向滤波器组(DFB),其原理可用图1表示。
原始图像先经过NPS滤波分解成了一个低通子带和一个带通子带,其中的低通子带是原始图像的逼近,带通子带则是原始图像中的中高频细节;再对带通子带采取NDFB滤波得到图像在各个方向上的细节;同时,对低通子带继续采用如上方法滤波可实现图像多尺度分析。由于NSCT对CT的改进使其具有更好的空域与频域性质,因此能够更好地表征与提取原始图像中缺陷的几何特征。
1.2 基于核函数的PCA分析
主成分分析(PCA)[8]是一种将高维特征映射为低维综合特征的统计分析方法,在模式识别问题中有着广泛的应用。其思想是使降维后的数据与原始数据相比具有最小的信息损失,即降维后的数据是原始数据的正交投影。
2 基于最小二乘原则的概率分类方法
3 案例分析
本文选取国内某大型钢铁企业CSP车间现场采集的752幅4大类轧辊表面缺陷图像作为样本与测试集对文中所提方法进行验证分析,为了后期处理方便,已预先将所有图像统一成80×80大小的分辨率。这4大类缺陷752幅图像的具体情况如表1所示。
为客观验证所提方法的有效性,采用交叉验证的方法。即将样本分为两部分:一部分作为训练样本集;另一部分作为测试集。具体验证过程为:
Step1:从训练样本集中提取特征,构成样本集特征矩阵。
对每个样本共进行5种尺度下的非下采样Contourlet变换,如图2所示(以一种夹渣缺陷为例)。按照原始图像、低尺度图像、高尺度图像的顺序将各图像依次排列,再依先后次序依次提取各图像的灰度均值与方差,最后将这些均值与方差做归一化处理组合起来,作为样本特征。由于每种尺度下的非下采样Contourlet变换最多可有[2i]个子图,因此每个样本可用一个126维的向量表示。
为了减少计算图像纹理特征的复杂度,將样本图像由原来的256个灰度级重新量化成16个灰度级。接下来,提取图像中0°,45°,90°与135°四个方向上的灰度共生矩阵[11](Gray Level Co?occurrence Matrix,GLCM)。再从此矩阵中计算出可以表征图像内容的统计量(能量、熵、二阶矩与相关量)作为纹理特征。由于每一种纹理统计量均有4个方向上的值,对每个方向上的各纹理统计量计算均值与方差可得到一个8维向量。将该8维特征向量与上述126维特征向量进行组合可得134维特征向量。因此,样本集可以表示为一个376×134维的特征矩阵。
Step2:对样本特征进行降维。
按照基于核函数的PCA分析方法对原始特征进行降维,提取前[m]个主要成分作为原始样本特征的替代。图3表示的是基于核函数的主成分累积贡献率。由该图可知,若考虑主成分积累效应<0.8,只需提取前面的3个主成分分量构成新的特征矩阵,但此时描述不同样本的特征数太少,会大大影响分类的准确性;若考虑主成分积累效应<0.9,则需提取前37个主成分分量作为新的特征矩阵,此时描述样本的特征数较多,会增加分类器的复杂程度。综合考虑以上因素,本文选取主成分积累效应<0.85,这样只需提取前面的18个主成分,大大降低了分类器的复杂程度。经过降维,样本的特征矩阵从376×134降为376×18,特征数据被压缩了86.56%。图4反映的是标准PCA与核PCA方法在处理本文特征向量时耗时的情况。由图4可知,核PCA方法在处理样本数量大于特征数量的情况下计算速度较快。
Step3:设计分类器,对降维后样本特征进行分类。表2列出了本文方法得到的分类结果。其中,测试1的结果是将全部样本的前1/2作为训练集,后1/2作为测试集得到的;测试2的结果是将测试1的训练集与测试集交换后得到的。另外,为了验证本文方法的有效性,设计了两组对照组试验。对照组1采用的是“混合特征+SVM”的方法,对照组2采用的是“变换域特征+概率分类”的方法。
4 结 论
针对回转类零部件表面缺陷再制造活动现场复杂的环境对表面缺陷需进行分类识别的要求,利用非下采样Contourlet变换提取样本图像中较为稳定的变换域特征与纹理特征构成分类的特征集,采用基于核函数的PCA分析方法对提取的特征进行降维,最后利用基于最小二乘分类器对测试样本进行分类。从工业现场采集的轧辊样本案例分析结果可知,在样本数不大的情况下,本文所提出的方法对于常见的4种轧辊表面缺陷的平均识别正确率达到92%以上,缺陷识别效果较好。
参考文献
[1] 毛清华,马宏伟,张旭辉.改进邻域粗糙集的输送带缺陷特征约简算法[J].仪器仪表学报,2014,35(7):1676?1680.
[2] 孙红春,谢里阳,邢海涛.基于混合特征和支持向量机的抽油杆缺陷识别[J].东北大学学报(自然科学版),2009,30(2):266?269.
[3] 段志娟,周新星,陈分雄,等.基于独立成分分析的冷轧带钢表面缺陷识别[J].钢铁研究学报,2011,23(10):63?66.
[4] 车红昆,吕福在,项占琴.多特征SVM?DS融合决策的缺陷识别[J].机械工程学报,2010,46(16):101?105.
[5] 任海鹏,马展峰.基于复杂网络特性的带钢表面缺陷识别[J].自动化学报,2011,37(11):1407?1412.
[6] CUNHA A L D, ZHOU J P, DO M N. The nonsubsampled contourlet transform: theory, design, and applications [J]. IEEE transactions on image processing, 2006, 15(10): 3089?3101.
[7] DO M N, VETTERLI M. The contourlet transform: an efficient directional multiresolution image representation [J]. IEEE tran?sactions on image processing, 2005, 14(12): 2091?2106.
[8] JOLLIFFE I T. Principal component analysis [M]. Berlin: Springer, 2002.
[9] SCHOLKOPF B, SMOLA A J, MULLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural computation, 1998, 10(5): 1299?1319.
[10] MULLER K R, MIKA S, RATSCH G, et al. An introduction to kernel?based learning algorithms [J]. IEEE transactions on neural networks, 2001, 12(2): 181?201.
[11] PASARIBU D P. An investigation of textural characteristic for geological purposes [C]// Proceedings of 1996 Geoscience and Remote Sensing Symposium. [S.l.]: IEEE, 1996: 372?373.