标题 | 基于深度学习的植物识别技术的发展 |
范文 | 彭鸿元 吴恋 郑旭 张雯雯 兰腾腾 摘要:随着大数据的崛起,机器学习被越来越多的学者学习并研究,深度学习是机器学习研究中的一个新的领域,主要目的为通过计算机模拟人大脑的活动来解释数据,例如图像,声音和文本。本文通过深度学习中的植物识别这一模块,为大家简要地介绍了深度学习中植物识别的相关方法与技术。 关键词:深度学习;植物识别;卷积神经网络;植物;图像 中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)19-0200-03 Abstract: with the rise of big data, machine learning is more and more scholars study and research, deep learning is a new field in machine learning research, main purpose is through the computer simulation of human brain activity to explain the data, such as images, sound and text. This paper introduces the methods and techniques of plant identification in deep learning by means of plant identification in deep learning. Key words: deep learning; Plant identification; Convolutional neural network; Plants; image 1 引言 地球上的植物种类繁多,目前已发现的植物总数越有50万种,植物的分类鉴别已然成了一个难题。近些年来,植物识别课题在深度学习领域得到持续的关注。研究学者们的目光主要集中在如何正确快速的识别上。随着神经网络科学的发展,人们放弃了从单一特征识别的方法,通过各学科之间的交融,从而达到更快速准确的识别效果。特征提取的学习方法一直都是处理智能识别问题的核心。 植物的分类是保护工作的基石,但现在植物的鉴别主要依靠人工进行,识别率低且耗时较长。特别是针对像贵州这样自然条件优越,珍贵植物药材丰富的地域,对于大多数不懂植物资源的人掌握和发现更多的植物药材信息对人文发展、经济发展都具有重要的推动作用。对于植物的鑒别需要一定的专业知识和相当丰富的经验积累,有的情况下植物专家都很难准确的辨别出植物类别。所以借助人工智能的方法使计算机能够通过图片识别出植物,认识一种植物我们将不用再去翻阅繁多的资料,也不用再对着搜索框为关键词发愁,通过获取图片直接进行识别。这对于植物的研究、植物相关教学工作、植物的科普以及贵州特色经济发展具有相当重要的意义。 2 基于深度学习的植物识别技术现状 近年来,基于图像分析的植物识别显然成了深度学习的焦点。在植物识别过程中,主要根据植物的形态和纹理来对不同的植物进行区分,同时还可根据颜色情况进行区分,如花、树枝、叶子、果实等,在颜色、形态和纹理上各不相同。由于植物的叶子采集起来很方便,并且可以作为标本保存很长时间,通过对植物的叶片进行分类、研究植物叶片的特点成为很多研究人员的研究热点。虽然目前植物识别技术已经取得了长足的进步,但仍然存在很多不足,比如目前的叶片分析过程中很多分析过程都是人工完成的,这种人工技术同时在背景复杂的条件下,识别率得不到保证。 2.1 传统植物识别方法现状及存在的问题 国内,有很多学者对植物领域做出了相当大的贡献。其中有王丽君课题组开发了观叶种类识别系统,该系统基于图像多特征融合,在分析叶子时包含了收集叶片的颜色、纹理和形状等特征,在识别算法中采用SVM算法,使得系统的叶子识别分辨率达到91.41%。杨天天课题组选择了7种柳属(Salix)叶片作为样本,采用颜色、纹理和形状等特征作为数字化指标,采用这种多个特征融合的方式来识别后,系统综合识别准确率达到90.8%。翟传敏课题组在识别方法上,提出了叶缘与叶脉分数维特征作为识别参考的方法,该方法引入叶片识别领域,再一次拓展了叶片识别的范畴。 在国外,CLEF论坛从2011年开始就组织植物识别和分类比赛,积累了大量植物图像识别经验,随后在2014年又开始利用植物器官和植物综合拍照来识别,提升了植物图像识别难度。截止到2015年,识别过程中的植物样本数量已达到1000以上。在ImageCLEF2011中,研究人员Villena-Roman利用 SIFT(尺度不变特征转换)的算法来研究植物识别技术,该研究证明SIFT技术可有效应用到植物识别领域。研究人员Backes试图将复杂网络算法(ComplexNetworkmethod)应用到叶片分析过程中,该研究表明,负责网络算法在采样噪声叶子的图像识别方面取得很好的效果。 2.2 基于深度学习的植物识别技术 2.2.1 深度学习之卷积神经网络 卷积神经网络是首个多层结构学习算法由Lecun等人提出,为了提高训练效率而通过空间相对关系减少参数数目。深度学习是机器学习中一种基于数据进行特征提取的方法。传统手工提取特征被机器所取代。主要目的为通过计算机模拟人大脑的活动来解释数据,例如图像,声音和文本。与机器学习相同的是,深度学习的方法也可分为监督学习与无监督学习之分。例如:卷积神经网络(Convolutionalneuralnetworks,简称CNN),是前馈神经网络中的一种,该神经网络中的神经元可应答一些覆盖单元,在大型图像的处理方面有着一定的优势。由于任何图像中相邻的像素点在空间上存在着一定的相关性,这一特点跟像素点在整个图像中的位置无关,是通用的特征。这一特性被卷积网络中的卷积层充分利用,在此基础上得到了一组卷积核(滤波器)F={ 与卷积核相似的图像块,响应值也较高,所以卷积核也被认为是特征的收集器,不同的特征由不同的卷积核所提取。卷积核的优势相当明显:第一,在权值共享模型中,由于自由变量参数个数大幅度减少,使得该模型的训练效率大幅度提升;第二,部分处理过程不会损坏像素特性,可在下一次处理中继续使用;第三,像素本身的固有特性使得该模型在平移过程中保持不变。常见的CNN由卷积层(convolutionallayer)、池化层(poolinglayer)和一个全连接层和输出层组成。卷积层主要功能采用卷积操作感知局部特征,并通过权值共享的方式来提取同一类特征,并采用卷积核这一工具提取不同类型的特征。在上述的CNN网络中,通常在输入层、池化层的后面实现卷积层的功能,这些功能主要包括对特征图谱或者输入图像进行卷积滤波。池化层的主要功能是对卷积得到的特征图谱进行局部统计计算,分别计算多个局部空间区域的平均值这一参数。通过将池化单元进行平移,就可以得到不同小范围区域的数值,通过这种方式可减少特征图谱的维度,从而大幅度降低了拟合的概率且使输入图像具有平移不变性。全连接层是网络层的输出和输出层的分类器的中间过渡层。全连接层主要完成汇总的功能,它会将上面的卷积层分析得到的特征图进行汇总,得到一系列的特征向量。基于这种对应关系,通常将一到多个连接层置于卷积层的后面。处理完特征向量的生成后,随后有两种处理方式:第一:对所有的特征向量进行分类,参考依据是特征向量的特征;第二:采用softmax对所有的特征向量进行分类,如下公式所示, N为类别总数。 在不正确处理的情况下由于层数过多,常会造成过度拟合,为避免这种情况的发生,常使用权值衰减(Weightdecay)、数据扩充(DataAugmentation)在模型训练中。 卷积神经网络的核心技术: 权值共享技术:在一张图片上,为了提取不同像素点的同一类特征,借助权值共享技术,采用卷积核对不同像素区域进行特征提取。权值共享除了可提取同一类特征,还可保证特征提取过程中提取区域位移的不变性。假设某个特征位置相关特征已变化,卷积核在对特征图谱滤波时,不会因为特征位置特性的变化而无法提取特征。除此以外,权值共享技术大幅度降低了模型中的数据训练难度,同时也降低了训练样本数量需求,提升了训练模型的泛化能力和容错能力。 池化采样技术:该技术类似于视皮层中的分析细胞,对卷积层提取的特征图谱进行处理,分别统计计算各个局部区域,得到局部区域上的平均值或极值这些参数。相比以前的提取技术得到的特征,該技术得到的特征具有更低维度,在识别结果上更加准确,同时不会出现过拟合的问题。池化采样技术在使用过程中具有特征位置无关性的特点,它只关心多个特征之间的相对位置,实现深度提取卷积层传递的特征样本,使最终得到的特征具有平稳不变性,即使特征位置发生变化或者轻微扭曲,随后的池化层都能成功提取该特征。 2.2.2 当前基于深度学习的著名植物识别网络 2.2.2.1 GooleNet 为了能够同时考虑卷积神经网络深度、神经网络宽度以及模型训练难度,GoogLeNet采用了Inception的结构。他们在ILSVTC-2014上提交的是一个22层的深度网络,在分类和检测中都得到了十分理想的效果。GoogLeNet团队在研究过程中大量使用了1*1卷积层,这样做的好处是移除计算瓶颈,同时能减少计算量,并且不会影响整个网络的计算性能,并且卷积神经网络深度、神经网络宽度都得到了不同程度的优化,考虑到统计相关性,一个稀疏网络结构可以重新构建出最优结构。GoogLeNet团队在研究中去除了连接层,减少了大量的自由变量,为构建更深的网络提供了可能。 2.2.2.2 VGGnet KarenSimonyan又被称为VGG团队,该团队在一项研究中重点研究了大批量图像识别过程中卷积网络深度对计算结果准确率的影响。他们在改变卷积网络深度时,主要采用的方法是使用不同规模的卷积核,当使用小卷积核堆叠方法,就可得到高深度的模型。通过小卷积核的使用,实现了卷积网络深度的提升,效果也比之前的设计模型有了大幅度提升。这个设计结构提升了图像识别技术的准确率,别能够在其他数据集泛华方面得到应用,在ILSVRC-2014排名中斩获第二名。VGG研究团队对卷积神经网络模型的改善是使用模仿人脑模式,提高识别能力的思想展开的。详细的操作是如下:将该网络结构的相关参数进行标准化配置,在相对稳定的情况下加强网络深度,并同步改变涉及的全部卷积层的卷积核大小,做到在对网络层数增多的同时满足卷积神经网络模型的相关要求,保证参数在能够接受的水平之内。 除此以外,VGG团队大量使用1*1卷积核,使得输入通道的线性系数得到提升。 3 植物识别技术的发展 第一个方向是根据图像发展的检索科技,原理是对图像里的相关元素特点先录入检索库里面,这些特点会以矢量特征进行建模,相关信息包括图像元素的色彩,文理特点,外观模样和这些元素之间的空间联系等等。检索手段是根据上述元素特点整合使用,可以对相关的对象做相同点 检索。这个科技已经涉广泛领域,例如电脑识别技术、信息数据库、图形处理等,是未来发展的基石技术,同时也推动了其他技术的发展。基于图像的研究可以分为三类:最初只是在研究怎么提取相宜的全局特征和怎么配对。目前已经使用了这种手段的项目有:IBM的QBIC,MIT的Photobook,Columbia的VisualSEEk等。由于应用了系统的图像特点,这个手段目前只在简单的对象上进行应用,这些对象包括某个建筑物图像,某张自然风光图像,某个独立物品的图像等进行检索识别。 第二个研究路劲是在一定范围内的图像检索办法:怎样对某个范围内的图像进行截取获取图像相关特点,并对每个截取部分的图像内容特点进行研究分析,能够将每个截取部分的个性特征展示出来,然后结合每个截取的部分的图像特征,得到整个图像的独特个性特点,最后通过这些相似的特点描述准则来和其他图像进行对比识别。使用这种检索技术的代表项目有Netra,Blobworld,SIMPLIcity等。即便这样的手段相对而言是比较适合使用者检索的思维模式,但是考虑到图像分割截取分析是一个非常艰难的技术,所以目前采用翻个图像事检索的手段检索成功的准确率较低,还没有得到大力的推广使用。 上述描述的兩个研究路劲都是基于图像开展的,对图像进行分析,采用固定的相似度比对方法。第三个研究方向则在人机交互为基础上进项开展,应用对使用者的需要特点进行猜测式分析,实时地对使用者的需求进行调整,采用相关技术对使用者的需求做特点分析,进一步减小检索范围,加入算法对检索时的一些词语进行分析,从而加大底层信息库和上层使用者检索的言语差距。为什么会想到这种手段呢?原因是先前有例子可以追寻RuiYong最先将其用到CBIR领域,其实例证明这种检索的手段非常好;其次这种方法实际的技术也是当下比常用的在对图像研究检索基础的热点,同时伴随着很多的反馈手段出现,而比较成功的代表项目有:Mars,PicHunter,FourEyes和MindReader等。 4 总结 本文首先描述了植物识别的意义和用途,基于深度学习的植物识别技术对植物相关教学工作,植物的科普及当地的植物相关经济发展起到了较好的推动作用。本文首先阐述了国内外叶片识别技术的发展现状以及目前的相关研究方向。随后介绍了深度学习技术,并将卷积神经网络算法应用到图像识别中。卷积神经网络从下到上分别是卷积层,池化层,全连接层,卷积神经网络的核心技术有权值共享和池化采样。详细介绍了几种植物识别技术。卷积神经网络(CNN),GooleNet用于对植物的分类和监测,在增加卷积神经网络深度和宽度的同时,减少了计算量。VGGnet从网络深度改进了卷积神经网络模型,提高了在大规模图像识别背景下对植物识别的准确率。随着科技的发展与学者们的大力研究,在不久的未来深度学习将会迎来更大的挑战与变革,更加便利于我们的日常生活。 参考文献: [1] 袁银,王东斌,刘永金.基于深度学习的植物图像识别方法研究[J].现代农业科技,2017(23):278-280. [2] 刘晶晶.基于深度网络特征学习的植物叶片识别算法研究与实现[D].深圳:深圳大学,2017. [3] 林心怡.我国植物辨识科普发展研究[D].陕西:西北农林科技大学,2017. [4] 刘孟南.基于深度学习的植物图像集识别技术研究[D].福建:华侨大学,2017. [5] 胡直峰.植物图像识别方法研究及实现[D].浙江:浙江大学,2017. [6] 张帅,淮永建.基于分层卷积深度学习系统的植物叶片识别研究[J].北京林业大学学报,2016. [7] 马珍玉.基于深度学习和SVM的植物叶片识别系统的研究与测试[D].内蒙古:内蒙古农业大学,2016. [8] 张宇卉.基于反向训练和深度学习的植物图像集分类算法研究[D].福建:华侨大学,2016. [9]YangYingGan,ChunShengHou,TingZhou,et al.PlantIdentificationBasedonArtificialIntelligence[J].AdvancedMaterialsResearch,2011,1279(255). [10]YuSun,YuanLiu,GuanWang,et al.SergioSolinas.DeepLearningforPlantIdentificationinNaturalEnvironment[J].ComputationalIntelligenceandNeuroscience,2017,2017. [11]AlaaTharwat,TarekGaber,AboulEllaHassanien.One-dimensionalvs.two-dimensionalbasedfeatures:Plantidentificationapproach[J].JournalofAppliedLogic,2016. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。