深度学习在遥感图像目标检测中的应用与展望

    摘 要:目标检测作为图像处理中的一个重要应用领域,在军民多领域都拥有重要的研究和应用价值。随着网络和传感器技术的发展,图像、视频等多媒体媒介也与之俱增,为目标检测提供了丰富的样本数据。尤其是随着深度学习方法的应用,目标检测精度得以大幅提高并得到了广泛应用。本文首先介绍了目标检测技术;然后重点介绍了目前深度学习技术在遥感图像目标检测中的应用进展;最后讨论了深度学习方法应用于目标检测时存在的困难和挑战,并对今后的发展趋势进行展望。

    关键词:目标检测;深度学习;自动检测;特征提取

    DOI:10.12249/j.issn.1005-4669.2020.26.314

    1 引言

    目标检测是计算机视觉领域中一个非常重要的研究问题。随着通信网络和传感器技术的快速发展,生活中每时每刻都在产生大量的数字图像数据,如何精确快速的对图像中的目标进行识别检测变得越来越重要。由于我们不仅关注对图像的简单分类,而且希望能够准确获得图像中存在的感兴趣目标及其位置,并将这些信息应用到现实任务中,因此目标检测技术受到了广泛关注。

    目标检测其主要目标是从给定的图像或者视频中定位感兴趣的标并进行目标分类,这就需要从图像中对目标进行特征提取从而进行目标分类,而且需要对目标进行边界框的提取。近年来,随着深度学习技术的发展及其在目标检测领域的广泛应用,目标检测在速度和精度上都有了较大的进步。相比于人工设计的特征,通过模型自动提取和学习的特征可以更好的表达图像中的目标。而且在传统的方法中,手动提取的特征泛化能力较弱,不能很好的适应大规模的目标检测任务。随着深层次的卷积神经网络的广泛应用,通过多层级的卷积核,实现由低层次抽象到高层抽象的组合,从而将图像的特征进行更精确的提取。即使在复杂背景下,深度学习依然可以高频次的提取低层特征,比如边界、轮廓、形状、颜色、旋转角等,同时深度学习还可以组合低层特征,得到更有区分性和鲁棒性的特征。

    2 应用进展

    深度学习技术在遥感图像目标检测中的应用很广泛,主要对土地覆盖分类、道路提取、建筑物提取、小目标检测、变化检测等这几个方面进行总结阐述。

    1)土地覆盖分类。利用深度学习做遥感影像的分割需要大量的标签信息,但是这通常是一个耗时耗力的工作,为了克服缺少大量标签数据的问题,Scott等人提出了通过模型微调和数据增强进行迁移学习,在土地利用分类中达到了97%-98%的分类精度。在土地利用分类中,针对样本类别不均衡和错误标记的情况,Alexander等人在U-Net结构上,采用Lovasz-Softmax损失函数成功缓解了这些问题。Xiwei Yao等人更关注于在高分辨率卫星影像上自动标注样本,通过结合具有判别性的高级特征和弱监督特征迁移提出了统一的标注框架,与完全的监督分类方法表现的更有竞争力。

    2)植被覆盖分类。植被覆盖制图是监测自然资源的必要任务,在农业方面可以辅助估算农作物产量。Zhang等在卷积神经网络CNN的基础上构造了由两层构成的卷积编码神经网络,第一层由两套卷积核分别提取耕地和林地特征,第二层由两个编码器组成,它们使用非线性函數来编码学习的特征,将编码结果映射到相应的类别号。该模型在GF-2影像的测试结果达到了0.91的精度。Kussul等采用深度学习的方法,做小麦、玉米、大豆等农作物类型的识别达到了85%以上的精度。

    3)道路提取。道路信息对城市交通规划,导航数据更新具有重要的作用。利用遥感影像提取道路是遥感领域的一项基本任务,在过去十年间一直是一个热门话题。利用深度学习的技术提取道路相比于传统方法具有很大的提高。在2018 CVPR DeepGlobe竞赛中,Lichen Zhou等人提出了D-LinkNet的语义分割网络,并获得了第一的成绩。D-LinkNet采用编码器-解码器结构,通过扩张卷积和预训练编码器进行道路提取任务,在一定程度上可以处理道路的窄、连通、复杂和跨度等问题,但是仍然有一些道路连通性的问题需要解决。

    4)建筑物提取。遥感影像中建筑物提取也是一项基本任务,但是由于我国各个地方的建筑风格迥异,导致建筑物在遥感影像上呈现的形态各式各样,对计算机自动提取是很大的挑战。Bittner等人融合了多种数据源,提出了一种端到端的全卷积神经网络,它能够结合不同数据源的光谱和高度信息,自动生成建筑物的轮廓。在DeepGlobe建筑物提取挑战赛中,Zhao等人使用基于Mask R-CNN的实例分割算法来提取建筑轮廓,但是提取的建筑边界也实际不太相同,因此提出了Mask R-CNN与建筑物边界规则化相结合的方法,得到了很好的可视化效果。

    5)小目标检测。近年来利用深度学习进行目标检测已经达到了很高的精度,在飞机识别方面,Hu等验证了Fast R-CNN模型和SSD模型可用于检测高分辨率遥感影像中的飞机,在检测速度上,SSD更有优势,但是对于小飞机来说R-CNN模型具有更大的优势,并且更适合于复杂场景的检测。为了让网络更适应于密集的小目标检测,Ding等采用多尺度改进和多种改进方案组合的密集卷积网络,来增强VGG16网络结构。通过实验验证,本方法对飞机和车辆的检测精度分别达到了90.7%和87.9%。为了解决小目标检测的问题,Chen等提出了混合深度神经网络(HDNN),通过将DNN的最后卷积层和最大池化层划分成可变感受野或最大池化大小的多个块,使得HDNN能够提取可变尺度特征,在检测城市等复杂背景下的车辆表现优异。

    6)变化检测。变化检测在遥感中具有重要意义,高分辨率遥感图像的出现大大提高了我们从空间监测土地利用和土地覆盖变化的能力,同时,高分辨率遥感影像相比于其他卫星影像提出了新的挑战。Wang等人将Faster R-CNN应用于变化检测,得到了比传统方法更高的精度。Zhao等人构造一个两侧具有相同耦合层数的近似对称深度神经网络,将两幅图像变换成相同的特征空间,使两幅图像的特征更具有区分性,通过逐像素比较特征配对可以生成差异图像。

    3 思考与展望

    深度学习技术在目标检测中的应用范围迅猛发展,但是还是存在着一些无法忽视的困难:

    1)目标的隐蔽性。鉴于目标隐蔽性的特点,深度学习技术作为一种计算机视觉工具,很多隐藏目标无法识别,还需要结合其他手段,使目标在图像或视频中凸显出来。

    2)深度学习在目标应用中的理论不完善。深度学习技术是近些年来人工智能的关键技术。在目标检测中的应用尚不成熟,况且目标的敏感性比较高,在很多时候受到的限制比较多。

    3)大规模数据样本集缺乏。虽然来源于多种平台、多源传感器获取的图像、视频等数据有很多,但是这些数据并不能直接提供需要的目标类别、位置信息,为明智决策提供情报。深度学习技术起初训练数据的时候,需要大量的标记样本数据集支持,但是鉴于数据的保密性,对于目标检测模型,缺乏大量的多样性标记样本集。

    针对不同的问题,解决的办法不尽相同。鉴于目标的隐蔽性,结合不同的数据源将目标地物凸显出来,然后进行样本制作,用于训练模型。结合传统的目标检测技术,弥补深度学习目标检测技术理论的不完善,同时考虑虚拟环境下虚拟数据的大规模应用。标记样本需要大量的人力物力,对于海量样本支撑的目标检测技术基本无法实现,所以无标记样本的目标检测技术会成为重点研究目标。

    参考文献

    [1]李晓斌,江碧涛,杨渊博等.光学遥感图像目标检测技术综述[J].光学遥感图像目标检测技术综述,2019,0(4):95-104.

    [2]王伦文,冯彦卿,张孟伯.光学遥感图像目标检测方法[J].系统工程与电子技术,2019(10):2163-2169.

    作者简介

    赵明衍(1990-),男,山东济南人,研究生,助教,火箭军士官学校。