计算机中生成式对抗网络的研究进展及展望
段风磊
摘?要:生成对抗网络(GAN)作为一种深层次的计算机学习模型,已经成为近年来神经网络领域中非常具有发展前景的一项技术模型,本文通过对相关文献的整理和查阅,首先简述了原始的生成对抗网络的组成以及其相关特征,随后基于原始网络的一些严重缺陷介绍了相关的改进网络的优化方法,最终对整篇论文进行总结,并对未来的发展进行了展望。
关键词:计算机;生成式对抗网络;图像处理;研究进展
Abstract:Generate countermeasures network(GAN,Generative Adversarial Networks)is a kind of deep-seated computer learning model,which has become a very promising technical model in the field of neural network in recent years.Through the collation and integration of relevant literature,this paper first described the composition and relevant characteristics of the original generative countermeasure network,and then introduced the relevant optimization methods of the improved network based on some serious defects of the original network.Finally,we summarize the whole paper and look forward to the future.
Key words:Computer;generative countermeasure network;image processing;research progress
1 緒论
Goodfellow基于博弈论中零和谈判的观点于2014年提出了“生成式对抗网络”这一概念,这一方法是用深度学习网以及相关模型络来验证图像真伪从而生成数据样本的。生成对抗网络目前以及成为计算机领域以及图像识别领域非常重要的方法之一,具有非常广阔的发展前景,GAN网络是不断的通过生成模型以及判别模型两者之间的竞争得到所需的数据样本的。GAN学习模型可适用多种不同情况下的数据处理分析[1]。
2 原始生成式对抗网络模型
2.1 GAN网络结构
模型分为生成模型(Generative Model)和判别模型(Discriminative Model)。下图1就是GAN模型的结构组成。
2.2 生成网络
生成器本质上是一个可微分函数,生成器接收随机变量z的输入,经生成假样本。在GAN中,生成器对输入变量z基本没有限制,z通常是一个100维的随机编码向量,z可以是随机噪声或者符合某种分布的变量。生成器理论上可以逐渐学习任何概率分布,经训练后的生成网络可以生成不和真实图像完全一样的逼真图像,实际上是生成网络学习了训练数据的一个分布,从而形成了相关的近似分布,这在数据增强应用领域方面非常的重要[2]。
2.3 判别网络
判别器实际上本质与生成器是一样的都是一种可以微分的函数,在生成对抗网络中,其实判别器的作用同它的名字一样就是判别输入的样本是否为真实样本,并在此基础上通过循环来指导生成器进行下一步的训练与合成。
3 改进的生成式对抗网络模型
生成对抗网络含有多种优点如具有更强大的预测能力;与强化学习相比,对抗式学习更接近人类的学习机理。但他也存在致命的缺点,即网络难以收敛。本文通过对文献的梳理,整理出几个被广泛认可的改进模型如下:
3.1 条件生成对抗网络
基本GAN系统的图像生成过程比较没有约束,所以越大的图像,用基本的GAN系统越难以控制。为了对这个情况进行改进以及研究,Mirza[3]等提出条件生成对抗模型(Conditional GAN)。该模型除了像原始网络一样输入之外,还会再输入一个条件变量c,CGAN结构如图2。比如一段描述句子,镶嵌到与之对应的图片中,经过训练,模型可以“看图说话”;c同样可以是对应的目标图片,这样GAN可以有目标地去学习。
3.2 深度卷积生成对抗网络
该卷积模型相较于全连接模型更加适用于处理分析比较复杂的图像数据。所以Rad ford等[4]研究者提出了深度卷积GAN(deep convolutional GAN,DC-GAN)它是把原始GAN中的两个生成与判别模型改进换成了两个深度CNN。使用步幅卷积和微步幅卷积有效地保留了特征信息[5],从而能对较复杂的问题以及图像处理的更加完美。
3.3 Wasserstein生成对抗网络
原始GAN训练出现梯度消失和模式崩溃的主要原因是使用JS距离来衡量两个分布。
3.4 基于能量的生成对抗网络
文献[6]从能量模型的角度改进了原始网络,研究出来了基于能量的生成对抗网络(Energy Based GAN,EB-GAN)模型。因为它的判别器D主要由自编码器(auto-encoder)构成,这就使得它判别输入图像的真假是通过重新构建图像的像素质量高低来决定的。EB-GAN的实验表明,在实验过程中其表现确实比原始GAN网络更好,图像更稳定同时分辨率更高,对于整体起到了优化的作用。
4 结语
GAN目前是一个较为全新的领域,各个专家学者也在这个领域不断的创新研究提出各种各样的想法以及改进措施,本文主要总结了原始生成对抗网络的基本构成以及特征,以及近些年来一些经典的改进网络及其实现过程,在整理的过程中受益匪浅,学到了许多,也更加深入的了解了这一块的内容,日后也希望能更多的通过对生成网络的了解,来发现更具有价值的改进模型。科技不断的发展进步,越来越智能的时代即将来临,让我们带着创新上路,不断学习进步!
参考文献:
[1]朱秀昌,唐贵进.生成对抗网络图像处理综述[J].南京邮电大学学报(自然科学版),2019,39(3):1673-1682.
[2]梁俊杰,韦舰晶,蒋正锋,等.生成对抗网络GAN综述[J].计算机科学与探索,2019,14(1):1-17.
[3]Mirza M,Osindero S.Conditional Generative Adversarial Nets[J].Computer Science,2014:2672-2680.
[4]朱虹,李千目,李德强.基于单个卷积神经网络的面部多特征点定位[J].计算机科学,2018,45(4):273-279.
[5]曹仰杰,贾丽丽,陈永霞,等.生成式对抗网络及其计算机视觉应用研究综述[J].中国图像图形学报,2018,14(1):1-17.
[6]Zhao J B,Mathieu M,LeCun Y.Energy-based generative adversarial network[EB/OL].2017-03-06.