《基于深度学习的面部表情识别分析》-工学论文，科技论文-论文范文参考-科学狗论文网

标题

基于深度学习的面部表情识别分析

范文

刘宣彤

摘?要：在“互联网+”技术的发展推动下，人脸识别技术也逐渐趋于成熟，但是面部表情识别技术作为难点技术，尚未被有效攻克，如果将面部表情识别技术与物联网技术相结合，则会赋予计算机以人类的感情，有利于物联网时代的开启。本文通过对面部表情识别方法进行分析，希望对促進面部表情识别技术的发展有所帮助。

关键词：深度学习;面部表情;识别

面部表情是一种人类特有的情感表达方式，也是分析人类情感和行为的重要依据，在“互联网+技术”和人工智能技术发展的背景下，面部表情识别技术已经成为人们重点关注的话题，并出现了多种识别方法。伴随着芯片处理能力的不断加强，研究人员已经将目光转向深度学习，已经取得了初步的成效。因此，对基于深度学习的面部表情识别进行研究，具有十分重要的意义。

一、深度学习

深度学习指的是在多层神经网络上，应用不同种类的机器学习算法，对图像、文本等问题进行解决的算法集合。[1]基于深度学习，计算机可以对数据结构进行发现和调整，并依据前一个图层的表示，对每个图层表示进行计算。深度学习最显著的特点就是特征学习，其目的在于获取分层特征信息，以此来解决传统特征提取方法存在的问题。深度学习就是所谓的深度神经网络训练，伴随着硬件处理能力的不断提升，重新成为了相关领域重点关注的内容。

二、基于深度学习的面部表情识别分析

（一）面部表情图像预处理

预处理是面部表情识别的重要步骤，其主要目的在于排除干扰特征提取的各项因素，例如：环境、姿势和背景等，在干扰排除后，让人类面部表情直接与系统相对接，促使面部特征对应的语义位置准确无误。实现预处理的方法有以下几种：一是人脸检测;二是人脸对齐;三是数据增强;四是人脸归一。

1.人脸检测

人脸检测主要是对人类的面部进行检测，在检测的同时，排除干扰因素和其他区域。传统的人脸检测方法主要由人工操作完成，工作人员会利用专业的设备完成这项工作，但是这种检测方法，无法有效克服环境因素的干扰，检测效果十分有限。而隐马尔可夫人脸检测器应用效果却十分显著，取得了广泛的应用。在深度学习阶段，又出现了一系列先进的人脸检测器，不仅工作效率高，还能应对各种干扰因素的影响。目前，级联结构的卷积神经网络的应用，使人脸检测性能得到显著增强。

2.人脸对齐

为进一步强化人脸检测的效果，人脸对齐技术应运而生，人脸对齐好比在一个已经设置好固定点位的系统中，对这些固定点进行搜索，继而构成人脸的形状。人脸对齐首先会由一个大致的形状开始，然后不断对人脸形状进行细化和估计。[2]在搜索点的过程中，需要使用以下两种信息：一是人脸外观;二是人脸形状。形状是指为搜索提供一个大致的范围，目前使用最为广泛的方法是IntraFacc软件。

3.数据增强

深度学习虽然效果十分显著，但对于数据的要求十分严格，只有确保数据量的充足有效，才能强化工作效果。但是现阶段常用的FER数据集，却无法完全满足深度学习对数据的要求，继而会导致过拟合现象的发生。因此，数据增强成为了保证面部表情识别有效性的重要步骤。目前，应用效果显著的数据增强方法有以下几种：一是旋转反射变换法;二是缩放变换法;三是尺度变换法;四是对比度变换法;五是颜色变化法。这些数据增强方法的应用，促进了面部表情识别技术的发展。

4.人脸归一化

由于灯光和头部姿势的变化，会对面部表情识别效果造成直接的影响，因此，应用人脸归一化方法，消除这些变化的对识别效果的影响十分关键。常用的人脸归一化方法为两种：一是灰度归一化;二是几何归一化。增加图像的亮度，凸显图像的细节，消除外界环境因素对图像的干扰，是灰度归一化的主要功能。除了增加亮度功能之外，灰度归一化还可以调整对比度。对比度调整方法包括直方图均衡化、IS归一化、DCT归一化和高斯归一化法等。在这些方法中，比较适用于深度学习面部表情识别的方法为直方图均衡化，究其原因，主要是这种方法较为稳定，契合于网络模型。几何归一化的功能是生成面部视图，但现阶段，该方法的发展还不完善，尚存在一定的不足。

（二）基于序列特征的方法

基于序列特征的方法主要有两种：一种是光流法;另一种是模型法。其中光流法是指帧在变化过程中会凸显出来一些重要的特征信息，在明确图像序列目标的构造的基础上，对目标的形变和图像颜色在空间和时间上的变化情况进行把握，这种动态化序列特征提取，应用范围十分广泛。而模型法是指利用模型对人的面部进行追踪，并将通过追踪获取的模型和帧图像信息作为依据，对人的面部表情进行有效的识别。

（三）深度卷积神经网络

深度神经网络已经被广泛应用于视觉对象识别任务之中，它能够使神经网络的大数据处理能力得到显著提升，其方法是在神经网络内构建一个与人类大脑相似的学习结构。这个学习结构可以对一些多级表示和抽象进行学习，从而赋予计算法在声音、文字和图像中找到复杂模式的能力。研究人员在2012年发现将自动编码器应用于CNN之中，做逐层训练，可以对高层次的网络进行训练，但经过继续研究，发现初始化策略的效果要优于逐层训练，因而提出了批量归一化方法，这一方法的使用，促进了深层网络的发展，从而使深层学习面部表情识别成为了可能。

三、结论

综上所述，面部表情识别具有非常高的实用价值和商业价值。如今，对于面部表情识别的研究正在不断进行，在此期间，产生了多种方法和结构。通过对这些方法进行分析，有利于加深我们对面部表情识别的理解。

参考文献：

[1]陆嘉慧，张树美，赵俊莉.基于深度学习的面部表情识别研究[J].计算机应用研究，1-8[2019-03-07].

[2]夏晨.基于视频序列的人脸表情识别方法研究[D].合肥工业大学，2018.

随便看

科学优质学术资源、百科知识分享平台，免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。