基于神经网络的体育商标识别模型

潘春光



摘 要: 为了提高体育商标识别的正确率,针对传统模型识别效果差的不足,提出基于神经网络的体育商标识别模型。采用Canny算子对体育商标的边缘进行检测,提取不同类型特征,然后采用神经网络对每一种特征分别建立体育商标识别模型,得到相应的识别结果,采用支持向量机确定每一种模型识别结果的权值,根据权值得到体育商标的最终识别结果。仿真对比实验结果表明,该模型的体育商标识别正确率达到95%以上,体育商标的识别率要远远低于其他体育商标的识别模型,同时满足体育商标识别的实时性要求。
关键词: 体育商标; 识别模型; 神经网络; 广告牌
中图分类号: TN711?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)01?0049?04
Abstract: In order to improve the accuracy of the sports trademark recognition and remedy the deficiency of poor recognition effect of the traditional model, a sports trademark recognition model based on neural network is proposed. The Canny operator is used to detect the edge of the sports trademark, and extract the different type features. The neural network is adopted to establish the sports trademark recognition model for each feature, and obtain the corresponding recognition results. The support vector machine is employed to determine the weight of the recognition result of each model. The final recognition result of the sports trademark was obtained according to the weight. The experimental results of simulation contrast show that the accuracy of the sports trademark recognition model can reach up to 95%, the sports trademark recognition rate is much better than that of other sports trademark recognition models, and the model can meet the real?time requirement of the sports trademark recognition.
Keywords: sports trademark; identification model; neural network; billboard
0 引 言
随着我国体育事业的迅速发展,体育产品越来越多,体育竞赛中的体育产品广告增多,竞争日益激烈[1]。商标是识别产品的重要标志,因此,如何准确地识别体育产品商标具有十分重要的研究意义[2]。
针对体育产品商标的识别问题,专家们进行了相关研究,涌现了一些体育产品商标的识别模型[2]。最初采用人工方式对体育产品商标进行识别,该方法简单,但耗时长、无法自动识别,对于多样的体育商标识别效率低[3]。随着信息处理技术应用的不断深入,有学者提出一些体育产品商标自动识别模型,将体育产品商标看作是多种类型的识别问题,通过一定的规则将体育产品商标归划到相应的类别中[4]。由于是多分类问题,必须建立体育产品商标的多分类器,当前可以建立多分类器的算法有神经网络、贝叶斯网络等[5?7],在所有算法中,神经网络的学习速度最快,可以满足实时性要求,在体育产品商标识别中应用最广[8]。体育产品商标的特征可以描述体育产品商标的特点,当前特征有颜色、纹理、SIFT特征等[9],受到运动员以及其他物体对商标遮挡的影响,单一特征仅能描述体育商标某一方面的信息,识别正确率难以满足体育商标识别的实际要求。近年来,有学者提出了多种特征的体育商标识别模型,分别对单一特征建立体育商标识别模型,然后通过加权获得体育商标的最终识别结果,但权值均采用人工方式确定,具有盲目性,权值无法描述特征对体育商标识别结果的贡献,因此如何进行体育商标的精确识别仍然面临巨大的挑战。
为了提高体育商标识别的正确率,提出一种基于神经网络的体育商标识别模型,结果表明,本文模型的体育商标识别正确率达95%以上,识别结果要优于其他体育商标识别模型。
1 相关理论
1.1 Canny算子
1.3 神经网络
BP神经网络能够以任意精度逼近函数,学习过程分为两阶段:信号正向传递、误差反向传递。第一阶段信号从输入层经过隐含层到达输出层,如果输出误差不符合实际要求,便进入第二阶段。第二阶段信号的误差从隐含层向输入层传递,并根据信号的误差不断修正各神经元的权值,直到误差满足实际要求为止。
基于神经网络的体育商标识别模型的工作步骤为:
(1) 收集体育商标图像,并对其进行灰度化处理。
(2) 采用Canny算子对体育商标图像中的目标边缘进行检测,提取商标轮廓。
(3) 分别提取体育商标的颜色、纹理以及SIFT特征,并采用式(7)对它们进行归一化处理:
(4) 设和分别为输入和输出神经元的数量,根据式(8)确定神经网络的隐含层神经元数量:
(5) 对神经网络反复训练,直到训练误差达到实际要求为止。
(6) 利用训练好的神经网络对体育商标进行识别,输出相应的识别结果。
1.4 支持向量机
2 本文的体育商标识别模型
本文体育商标识别模型综合考虑特征间的互补性,避免单一特征信息量少的缺陷,同时合理确定权值,解决人工方式确定权值的不足,具体工作步骤为:
(1) 采用Canny算子检测体育商标边缘、提取特征;
(2) 采用神经网络的体育商标识别模型;
(3) 最后采用支持向量机估计模型的权值,输出体育商标的识别结果。
本文模型的框架如图2所示。
3 实验结果及分析
3.1 体育商标样本
选择体育产品商标类型为:LG,BRIDGESTONE,TISSOT,VISA和ADIDAS,它们的类别标签分别采用1~5进行描述,样本数量的分布情况见表1。选择权值人工方式确定多特征权值的识别模型进行对比实验。
3.2 结果与分析
3.2.1 单一特征的识别正确率
采用BP神经网络分别对颜色特征、纹理特征以及SIFT特征分别建立体育商标识别模型,得到的识别正确率见表2。从表2可以看出,单一特征的体育商标识别正确率均低于85%,不能满足体育商标识别的实际应用要求,这主要是由于它们只能提供片面信息,识别结果没有太多的实际应用价值,同时也证明了本文采用多特征建立体育商标识别模型的思想是正确的。
3.2.2 估计单特征的权值
将单一特征的体育商标识别结果输入到支持向量机中进行学习和回归,得到单一特征的权值见表3。从表3可以看出,在所有特征中,SIFT特征的权值最大,其次是颜色特征,最小为纹理特征,说明SIFT特征对体育商标识别结果的贡献最大,这与实际情况相符。
3.2.3 与对比模型结果对比
本文模型与对比模型的体育商标识别正确率和识别时间分别如图3和图4所示。从图3和图4可知,相对于对比模型,本文模型的体育商标识别正确率大约提高了5%,而且识别时间也大大减少,符合体育商标识别的实时性要求,这主要是由于本文模型采用支持向量机对单一特征权值进行合理确定,建立了更加合理的体育商标识别模型,能够准确地描述体育商标类别与特征之间的变化关系,具有更高的实际应用价值。
4 结 论
体育商标识别非常复杂,传统模型无法准确描述其变化特点,本文利用支持向量机和神经网络的优点,提出基于神经网络的体育商标识别模型,首先采用神经网络根据单一特征建立相应的体育商标识别模型,然后采用支持向量机确定它们的权值,并通过对比实验对其性能进行分析。结果表明,本文模型的体育商标识别效率大幅度提高,识别正确率可以满足体育商标识别的应用要求。
在实验过程中发现一些问题有待解决,如支持向量机的参数设置影响识别结果,今后将解决支持向量机参数的设置问题,产生更加合理的权值,以获得更优的体育商标识别效果。
参考文献
[1] PELISSON F, HALL D, RIFF O, et al. Brand identification using Gaussian derivative histograms [J]. Machine vision and applications, 2004, 16(1): 41?46.
[2] WATVE A, SURAL S. Soccer video processing for the detection of advertisement billboards [J]. Pattern recognition letters, 2008, 29(7): 994?1006.
[3] PHAN R, ANDROUTSOS D. Content?based retrieval of logo and trademarks in unconstrained color image databases using color edge gradient co?occurrence histograms [J]. Computer vision and image understanding, 2010, 114(1): 66?84.
[4] LIU W Y, SUN X M, WANG L. Trademark contour extraction based on improved snake model [J]. Journal of computational information systems, 2009, 5(3): 1253?1260.
[5] LI D D, KWONG C P. Understanding latent semantic inde?xing: a topological structure analysis using Q?analysis [J]. Journal of the American Society for Information Science and Technology, 2010, 61(3): 592?608.
[6] HALIN A A, RAJESWARI M, RAMACHANDRAM D. Shot view classification for playfield?based sports video [C]// Proceedings of 2009 IEEE International Conference on Signal and Image Processing Applications. Kuala Lumpur: IEEE, 2009: 410?414.
[7] 王三虎,姚望舒,凌兴宏.基于SIFT和角点特征的商标检索算法[J].计算机应用,2011,31(7):1841?1843.
[8] 卜江,老松杨,白亮,等.一种体育商标中广告牌商标的实时识别算法[J].自动化学报,2011,37(4):418?426.
[9] 孙林,吴相林,周莉,等.对扭转鲁棒的SIFT图像匹配在商标识别中的应用[J].计算机工程与设计,2011,32(4):1406?1410.
[10] 林传力,赵宇明.基于SIFT特征的商标检索算法[J].计算机工程,2008,34(23):275?277.