标题 | 基于残差网络人脸年龄估计 |
范文 | 白昊洋+胡睿康+马可心+高策 摘要:人脸图像年龄估计在计算机视觉领域中已经成为一项非常重要的任务,具有广泛的实际应用价值。针对非受限条件下人脸图像年龄分类困难的问题,提出了一种基于深度残差网络的非受限条件下人脸年龄分类方法。首先,具体介绍了34层残差网络的结构,并将其作为卷积神经网络模型处理人脸年龄分类问题。然后,对Adience数据集详细描述,并在此数据集上对网络训练和测试。最后,通过与现有年龄估计方法的结果进行对比,可得该文方法获得了较好的年龄分类准确度。 关键词:残差网络;人脸图像:年龄分类:非受限条件:Adience数据集 中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)14-0169-02 1概述 人脸图像包含很多信息,如身份、表情、姿态、性别和年龄。其中,年龄是人的重要生物特征,可以应用于多种场景,如基于年龄的人机交互系统、基于年龄的访问控制、电子商务中个性营销及刑事案件侦查中的年龄过滤等n,。很多研究者在人脸图像年龄估计方面做了大量研究,早期,主要用Gabor,LBP,SFP和BIF等提取特征以及SVM方法进行年龄分类,这些人工提取特征的方法在受限条件下的人脸数据集上获得了不错的结果,但是在非受限条件下的人脸年龄分类任务中效果不佳;近几年,深度卷积神经网络(DCNN)成为了计算机视觉领域的研究热点。从5层的LeNet,到8层的AlexNet,再到19层的VGGm和22层的GoogleNet,直到上千层的ResNets,无论是网络的学习能力还是深度都得到显著提高。因此,越来越多的学者采用DCNN解决年龄分类问题,并证明其在非受限条件下能获得明显优于手工提取特征方法的结果。 在人脸年龄分类中,人脸图像往往受到面部姿态、光线、化妆和背景等影响,极大地限制了人脸年龄分类的准确性。针对非受限条件下人脸图像年龄分类困难的问题,本文提出了一种基于深度残差网络的非受限条件下人脸年龄分类方法。 2 34层残差网络 He等提出了深度残差网络(ResNets),该网络采用残差块作为网络的基本组成部分,可以很大程度上解决DCNN随着深度增加而带来的网络退化问题。ResNets在原始卷积层外部加人越层连接(shoacut)支路构成基本残差块RB,使原始的映射H(X)被表示为H(X)=F(X)+x。ResNets通过残差块结构将网络对爿(X)的学习转化为对F(X)的学习,而对F(X)的学习较H(X)更为简单。基于残差块更易学习的特性,ResNets通过顺序累加残差块成功地缓解了DCNN的退化问题,提高了网络性能。 ResNet-34结构如图1所示,残差块的具体表达式如下,函数F(x)表示残差映射,x和y分别代表残差块的输入和输出。当x和F数相同时,采用式(1),此时越层连接既没有增加额外参数也没有增加计算复杂度。当x和F维数不同时,采用式(2),通过越层连接执行1×1卷积映射G(x)以匹配维数。 ResNet-34网络输入图像大小为224×224。首先经过卷积层,卷积核为7×7,步长为2,输出特征图为112×112;再经过最大池化层;其次经过四组不同残差块,各残差块组的残差块数量分别为3、4、6和3,并且同组中的残差块输入输出维度相同,分别为64、128、256和512,各组输出特征图大小依次为56×56、28×28、14×14、7×7。最后经过平均池化层和全连接层,通过softmax分类器,输出分类结果。 3数据集 Adience数据集来自人们从智能手机设备自动上传到网络相册的图像。这些图像在上传之前并没有经过人工过滤,且这些图像都是在非受限条件下拍摄的。这些图像在头部姿势、面部表情和光线条件质量等方面都存在很大差异,所以在Adi-ence数据集下的人脸图像年龄分类任务面临巨大挑战。 Adience包含2284个人的26580张人脸图像,年龄范围为0-100岁,共8个年龄段(0-2,4-6,8-13,15-20,25-32,38-43,48-53,60-),年龄分布如表1。 4实验结果与分析 为了提升网络的人脸分类性能,本文选用ResNet-34在人脸图像Adience数据集上做年龄分类。训练和测试时动量值为0.9,权重衰减为0.0001。batch大小设为64,epoch设为164,初始学习率为0.1,在81和122个epoch之后学习率分别降为0.01和0.001。本文实验模型采用Nvidia Titan X GPU训练,运行环境為torch7。 本文采用文献[7]中的交叉验证方法,将Adience数据集分成五组不同图像(fold-0,fold-1,fold-2,fold-3,fold-4),令其中一组图像作为测试集,其余四组图像作为训练集,共构成五种检测方式。通过计算平均分类准确度和1-off值作为评估标准。在fold-0测试的年龄分类准确度的曲线图如图2所示,由此可知网络能够很好地收敛。 为了验证本文方法的有效性,将现有在Adience数据集上的年龄分类方法与本文方法对比,各方法人脸年龄分类结果如表2所示。由表2可以看出本文提出的方法获得了除DEX w/IMDB-WIKI Pretrain方法以外的最高年龄分类准确度,主要由于文献[10]用大规模人脸数据集IMDB-WIKI微调网络。不经过大数据集对网络微调时,本文提出的基于深度残差网络的年龄分类方法获得了最高年龄分类准确度。 5结论 针对非受限条件下人脸图像年龄分类准确度低的问题,本文提出了一种非受限条件下的残差网络人脸年龄估计方法。采用ResNet-34网络在非受限条件下的Adience数据集上进行了年龄分类实验。实验结果表明当不用大数据集微调时,本文提出的方法能够有效地提高非受限条件下人脸图像年龄分类准确度。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。