标题 | 基于互联网视频的人脸检测综述 |
范文 | 宁毅 陈金龙 摘要:人脸检测技术是多学科的课题,覆盖了数学,数字图像处理,神经网络,机器学习有等学科内容,具有非常重要的应用价值。互联网人脸检测是互联网人脸识别系统的前提,找到鲁棒性强,检测效率高的人脸检测方法非常有必要。文章通过介绍互联网人脸检测的研究背景以及研究现状,指出互联网人脸检测的难点所在,并分析目前人脸检测的主要研究方法以及方法的优缺点,最后对人脸检测的技术的发展进行展望。 关键词:人脸检测;互联网视频;肤色模型 中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)03-0166-02 1 互联网视频检测研究背景以及意义 互联网视频是已经成为互联网主要应用领域之一,用户人数高速增长,覆盖率不断提高。根据中国互联网中心数据,截至2016年12月,我国网民规模达7.31亿,普及率达到53.2%。全年共计新增网民4299万人,增长率为6.2%,其中至2016年12月底我国网络视频用户规模接近5.5亿人。对互联网的视频研究具有非常重要的意义。近年来,犯罪率上升,通过互联网视频来作为重要安全防范手段,被广泛应用于公安、交通、金融等诸多领域。其中比较典型的应用为互联网视频的人脸检测。 如何充分利用互联网视频中人脸时间信息和空间信息克服互联网视频噪声明显,分辨率低,光照、姿态变化剧烈等困难是研究的重点。美国的MIT、CMU大学和中国的自动化所、清华大学等都对基于视频人脸检测检测进行了广泛的研究,而且目前随着机器学习和深度学习的广泛研究对视频人脸检测产生了重大影响,因此有必要对现阶段基于视频的人脸检查方法进行分析和总结,期望更好的指导未来的研究。 作为互联网视频人脸识别的前提,互联网视频人脸检测是指通过输入互联网视频确定视频中人脸的具体方位、姿态。随着计算机技术的发展,在视频人脸检测领域相关的科研成果不断涌现,出现了方式,方法不一样的检测方法。目前主要的人脸检测方法有:基于肤色模型的方法、几何特征的方法、基于统计理论的方法、基于视频的运动分析方法。 2 目前人脸检测的主要方法 2.1 基于膚色模型检测方法 肤色特征是人脸区域的重要特征,是人脸区别与其他物体的极少数特征之一。它不受人类表情变换的影响,具有相对的稳定性,但亮度变化影响肤色检测。经大量的研究发现无论是黄种人、白种人还是黑种人,肤色在色彩空间中分布较为集中,利用人体肤色检测可以大幅度减少检测时间。但当背景颜色或视频图像其他物体颜色与皮肤颜色接近的时候会产生误差。肤色模型是指在一定的色彩空间描述肤色分布的模型。因此建立肤色模型首先先选取一定的颜色空间,目前的颜色空间有RGB、LUV、YIQ、HSV等,其次是根据选取的颜色空间建立数学模型。肤色模型的优点是对人体姿态、面部表情不敏感,具有较强的鲁棒性。但是当光照较强时背景亮度过高与肤色接近,从而造成误检;当光照不足时,肤色亮度不够往往会造成误检,因此需要研究出不同光照条件下肤色分割的取值。常见的颜色空间有: 2.1.1 RGB颜色空间 RGB颜色空间也称为红蓝绿色彩空间,能用RGB值表示的颜色,是单色光中的红绿蓝(色光三原色,波长也是严格规定的,R 700.0nm,G 546.1nm,B 435.8nm),按不同比例的混色光。 在RGB颜色空间中,图像中每个像素点都在都可以用图1像素空间点来表示。在图1中RGB颜色空间立方体中,RGB颜色立方体的原点(0,0,0)表示该点R,G,B颜色值为零意思为该点为黑色,当R,G,G各分量最大的时候,该点为白色。一般情况下其他颜色空间都可以由,R,G,B颜色空间转换过来。 RGB肤色模型的优点是对人体姿态、面部表情不敏感,具有较强的鲁棒性。但是当光照较强时背景亮度过高与肤色接近,从而造成误检;当光照不足时,肤色亮度不够往往会造成误检,因此RGB往往不适合直接用于肤色分割。 2.1.2 HSI颜色空间 当人观察一个彩色物体时,往往用色调、饱和度、亮度来描述物体的颜色, HSI(Hue-Saturation-Intensity)正是基于符合描述人类观察而产生的,HSI颜色空间是由色度(HUE),饱和度(Saturation),亮度(Intensity)组成。这种色彩空间符合人类观察色彩的方式,同时也有利于数字图像处理。它是由R,G,B空间转换而来。 颜色的色度指与它最接近的波普波长,色度为零时表示为红色,色度为120为绿色,240时为蓝色,色度在0-240为可见光的颜色,当色度在240-360时为非可见光。 颜色的饱和度是指与它图2中某一点与圆心之间的距离,在圆周围上的饱和度为1,在圆心的饱和度为0,可以通过这样的方式理解饱和度:一副亮度很强的绿色的饱和度为1,当往里面添加水时,色彩慢慢稀析,饱和度变小,但是亮度不变。 HSI的优点在与将亮度信息I与色度H,和饱和度S区分开来,当人脸肤色检测时,肤色的聚类性只与色度和饱和度有关,与亮度无关,这样就可以通过计算色度和饱和度来区分人脸也背景出来。 HSI可以通过如下公式计算出来: 2.2 基于几何特征的检测方法 人脸具有明显的几何性质,比如耳朵的对称性,眼睛的对称性等。侧影识别是最早的基于几何特征的人脸检测方法,该方法从人脸侧脸轮廓线选取特征点,利用这些点组成的几何特征来进行识别。目前太多数证件照为人脸正面因此该检测方法往往根据耳朵、眼睛、鼻子的形状和五官在脸上的几何分布。对于耳朵、眼睛等人脸部件的轮廓边缘提取目前常用的算法有:微分算子法、拉普拉斯高斯算子法(LOG)、Canny边缘检测算子。 在图像进行边缘特征提取前,需要对图像进行预处理。对于人脸检测,首要工作就是耳朵等主要人体器官进行定位,定位之前应对人脸图像进行归一化,图像归一化的运算定义为:g=f(x',y')=f[a(x,y),b(x,y)],其中f(x,y)表示输入图像,g(x,y)表示输出图像,函数a(x,y),b(x,y)描述了唯一的空间变换。 基于几何特征的人脸检测方法优点有:1)符合人类的视觉识别机理,便于理解。2)相对于肤色模型来说,该方法对光照照射不敏感。但该方法的缺点有:1)人脸的表情变化、特征点遮挡时,该方法检测效果不佳。2)从不同图像中选点相对稳定的特征点时不容易选取。但是由于人脸的部件提取往往都是由边缘算子提取出来,所以这种人脸检测方法往往对于图像质量的要求比较高,对于光照、背景、噪音等要求比较高,因为噪音、阴影等往往对人脸部件边缘造成破坏,进而影响算法的有效性。 2.3 基于统计理论的人脸检测方法 随着统计理论分析和机器学习以及深度学习在人脸检测中的广泛应用,涌现出大量的研究成果。该方法是通过对大量样本进行训练,找出人脸样本的统计特性,构建出检测分类器,使用分类器进行人脸检测。目前常用方法有支持向量机和Adboost。 支持向量机方法,由训练和检测两部分组成,训练过程由大量人脸样本和非人脸样本训练SVM分类器,使得获得超优分类平面。检测的时候用训练好的SVM分类器来检测图像中的人脸。 Adboost是通过选择少量关键的视觉特征,产生高效的强分类器,在用级联方式将各强分类器合成更加复杂的层叠分类器。该方法在人脸检测方面速度比较快。 通过统计理论的人脸检测方法算法较为稳定,但是样本的采集工作繁重,采集样本的好坏往往对检测效果影响较大。 3 结束语 目前人脸检测技术快速发展,在刷脸支付、刷脸考勤等新型应用中得到快速应用,人脸检测的精度大大提高,检测时间快速减少。然而,人脸具有丰富的表情特性,以及互联网视频清晰度不足,光照和环境等影响。在很多背景復杂情况下,互联网视频人脸检测难以达到较好效果。因此在今后工作中研究的重点为:1)在实际应用中,单一方法往往检测效果较低,因此采用多种检测方法的联合使用,提高检测精度。2)在前人研究基础之上,提出新的检测算法提高检测效率。 参考文献: [1] 陈锻生, 刘政凯. 肤色检测技术综述[J]. 计算机学报, 2006(2). [2] 陈雅茜, 雷开彬. 人脸识别技术综述[J]. 西南民族大学学报:自然科学版, 2007(4). [3] 肖阳. 人脸检测算法综述[J]. 电子技术与软件工程, 2014(4). [4] 艾海舟, 梁路宏, 徐光祐, 等. 基于肤色和模板的人脸检测[J]. 软件学报, 2001(12). [5] 杨新权. 基于肤色分割及连续Adaboost算法的人脸检测研究[D]. 重庆: 电子科技大学, 2013. [6] 陈冠潼. 人脸检测与识别算法的研究与应用[D]. 大连: 大连理工大学, 2013. [7] 袁正海. 人脸识别系统及关键技术研究[D]. 南京: 南京邮电大学, 2013. [8] 段玉波, 任璐, 任伟建, 等. 基于肤色分割和改进AdaBoost算法的人脸检测[J]. 电子设计工程, 2014(12). [9] 王寻, 赵怀勋. 基于改进的肤色空间和几何特征的快速人脸检测研究[J]. 计算机应用与软件, 2015(02). |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。