网站首页  词典首页

请输入您要查询的论文:

 

标题 基于深度学习的面部表情识别分析
范文

    刘宣彤

    摘?要:在“互联网+”技术的发展推动下,人脸识别技术也逐渐趋于成熟,但是面部表情识别技术作为难点技术,尚未被有效攻克,如果将面部表情识别技术与物联网技术相结合,则会赋予计算机以人类的感情,有利于物联网时代的开启。本文通过对面部表情识别方法进行分析,希望对促進面部表情识别技术的发展有所帮助。

    关键词:深度学习;面部表情;识别

    面部表情是一种人类特有的情感表达方式,也是分析人类情感和行为的重要依据,在“互联网+技术”和人工智能技术发展的背景下,面部表情识别技术已经成为人们重点关注的话题,并出现了多种识别方法。伴随着芯片处理能力的不断加强,研究人员已经将目光转向深度学习,已经取得了初步的成效。因此,对基于深度学习的面部表情识别进行研究,具有十分重要的意义。

    一、深度学习

    深度学习指的是在多层神经网络上,应用不同种类的机器学习算法,对图像、文本等问题进行解决的算法集合。[1]基于深度学习,计算机可以对数据结构进行发现和调整,并依据前一个图层的表示,对每个图层表示进行计算。深度学习最显著的特点就是特征学习,其目的在于获取分层特征信息,以此来解决传统特征提取方法存在的问题。深度学习就是所谓的深度神经网络训练,伴随着硬件处理能力的不断提升,重新成为了相关领域重点关注的内容。

    二、基于深度学习的面部表情识别分析

    (一)面部表情图像预处理

    预处理是面部表情识别的重要步骤,其主要目的在于排除干扰特征提取的各项因素,例如:环境、姿势和背景等,在干扰排除后,让人类面部表情直接与系统相对接,促使面部特征对应的语义位置准确无误。实现预处理的方法有以下几种:一是人脸检测;二是人脸对齐;三是数据增强;四是人脸归一。

    1.人脸检测

    人脸检测主要是对人类的面部进行检测,在检测的同时,排除干扰因素和其他区域。传统的人脸检测方法主要由人工操作完成,工作人员会利用专业的设备完成这项工作,但是这种检测方法,无法有效克服环境因素的干扰,检测效果十分有限。而隐马尔可夫人脸检测器应用效果却十分显著,取得了广泛的应用。在深度学习阶段,又出现了一系列先进的人脸检测器,不仅工作效率高,还能应对各种干扰因素的影响。目前,级联结构的卷积神经网络的应用,使人脸检测性能得到显著增强。

    2.人脸对齐

    为进一步强化人脸检测的效果,人脸对齐技术应运而生,人脸对齐好比在一个已经设置好固定点位的系统中,对这些固定点进行搜索,继而构成人脸的形状。人脸对齐首先会由一个大致的形状开始,然后不断对人脸形状进行细化和估计。[2]在搜索点的过程中,需要使用以下两种信息:一是人脸外观;二是人脸形状。形状是指为搜索提供一个大致的范围,目前使用最为广泛的方法是IntraFacc软件。

    3.数据增强

    深度学习虽然效果十分显著,但对于数据的要求十分严格,只有确保数据量的充足有效,才能强化工作效果。但是现阶段常用的FER数据集,却无法完全满足深度学习对数据的要求,继而会导致过拟合现象的发生。因此,数据增强成为了保证面部表情识别有效性的重要步骤。目前,应用效果显著的数据增强方法有以下几种:一是旋转反射变换法;二是缩放变换法;三是尺度变换法;四是对比度变换法;五是颜色变化法。这些数据增强方法的应用,促进了面部表情识别技术的发展。

    4.人脸归一化

    由于灯光和头部姿势的变化,会对面部表情识别效果造成直接的影响,因此,应用人脸归一化方法,消除这些变化的对识别效果的影响十分关键。常用的人脸归一化方法为两种:一是灰度归一化;二是几何归一化。增加图像的亮度,凸显图像的细节,消除外界环境因素对图像的干扰,是灰度归一化的主要功能。除了增加亮度功能之外,灰度归一化还可以调整对比度。对比度调整方法包括直方图均衡化、IS归一化、DCT归一化和高斯归一化法等。在这些方法中,比较适用于深度学习面部表情识别的方法为直方图均衡化,究其原因,主要是这种方法较为稳定,契合于网络模型。几何归一化的功能是生成面部视图,但现阶段,该方法的发展还不完善,尚存在一定的不足。

    (二)基于序列特征的方法

    基于序列特征的方法主要有两种:一种是光流法;另一种是模型法。其中光流法是指帧在变化过程中会凸显出来一些重要的特征信息,在明确图像序列目标的构造的基础上,对目标的形变和图像颜色在空间和时间上的变化情况进行把握,这种动态化序列特征提取,应用范围十分广泛。而模型法是指利用模型对人的面部进行追踪,并将通过追踪获取的模型和帧图像信息作为依据,对人的面部表情进行有效的识别。

    (三)深度卷积神经网络

    深度神经网络已经被广泛应用于视觉对象识别任务之中,它能够使神经网络的大数据处理能力得到显著提升,其方法是在神经网络内构建一个与人类大脑相似的学习结构。这个学习结构可以对一些多级表示和抽象进行学习,从而赋予计算法在声音、文字和图像中找到复杂模式的能力。研究人员在2012年发现将自动编码器应用于CNN之中,做逐层训练,可以对高层次的网络进行训练,但经过继续研究,发现初始化策略的效果要优于逐层训练,因而提出了批量归一化方法,这一方法的使用,促进了深层网络的发展,从而使深层学习面部表情识别成为了可能。

    三、结论

    综上所述,面部表情识别具有非常高的实用价值和商业价值。如今,对于面部表情识别的研究正在不断进行,在此期间,产生了多种方法和结构。通过对这些方法进行分析,有利于加深我们对面部表情识别的理解。

    参考文献:

    [1]陆嘉慧,张树美,赵俊莉.基于深度学习的面部表情识别研究[J].计算机应用研究,1-8[2019-03-07].

    [2]夏晨.基于视频序列的人脸表情识别方法研究[D].合肥工业大学,2018.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/16 7:58:32