网站首页  词典首页

请输入您要查询的论文:

 

标题 一种人脸检测与识别方法的设计与实现
范文

    张璟 张奕 张永梅 杨飞 李旭茹

    

    

    

    摘要:2015年考试作弊已被列入我国刑法,考生的诚信和考场的纪律也越来越值得关注和重视。因此需要一种合理便捷的方法检查并防止作弊现象的发生。人与人之间的特征有很大区别,生物特征识别技术就是利用人类自身特征来证明身份,相对于传统考试验证身份,该技术有很大的优势和发展前景。本文讨论了4种常用的生物识别技术:指纹考试检测技术、虹膜考试检测技术、人脸考试检测技术、静脉考试检测技术。通过对这些技术的分析与研究,发现人脸识别技术最为有效。本文设计与实现了一种人脸检测与识别方法,实现对考生身份的确认,检测和识别效果较好。

    关键词:考试身份识别系统;虹膜识别;人脸识别;Haar特征;识别准确率

    中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)24-0194-05

    Abstract: Exam cheating has been included in Chinas criminal law in 2015. Therefore, it needs a reasonable and convenient method to prevent the occurrence of cheating. The characteristics of human beings are very different, so biometric identification technologies valid peoples identity by using human biometric characteristics. Compared with the traditional ways to verify the identity, the technology has great advantages and application prospects. This paper discusses fingerprint detection technology, iris detection technology, face detection technology and vein detection technology in the exams. Through the study of these technologies, face recognition technology is found to be the most effective way. The paper designs and implements a face detection and recognition method of the exam identity confirmation, achieves better detection and recognition effects.

    Key words: Identification system in examination; Iris recognition; Face recognition; Haar feature; Identification accuracy

    高考、研究生入学等大型考试,最大特点就是准备时间长,参考人数多,公民关注度高。以往考试中,教育部一般按照当地学校提供的身份证、照片等个人信息制作准考证。在考试过程中,监考教师要在10分钟之内核查全部考生的身份。随着科技发展,流程化和集体作弊的技术日趋猖獗。替考团队可以伪造考生的信息,修改考生照片,甚至找外貌相似的学生替考。在不熟悉考生的情况下,监考教师很难迅速地判断考生身份,而且每个监考教师的判断标准参差不一,无法保证考试的公平性。

    为了提高考试的规范性、权威性和公平性,杜绝考场出现替考的作弊情况,生物识别技术应运而生。生物识别技术利用考生独一无二的特点进行核查。相比传统的人工识别,生物识别速度快、识别率高、客观性强,并且简化了考试核查流程,节约了大量的人力物力,可以从根本上解决考试作弊问题,维护考试的公平。

    1 生物识别的主要方法及特点

    生物识别技术就是利用人类独一无二且易于识别的信息,用一组特别的算法进行取样核对,分析其特征,得到一组唯一的编码,如果编码与数据库中保存的相同就表明其验证成功,反之验证失败。这种技术跨越了生物领域、物理领域、计算机领域与统计领域,同时借助大数据、云端处理来准确高效地识别,从而实现了智能化和自动化,符合考场的要求和当代社会发展的趋势。

    指纹识别是当今社会发展最为迅速的生物检测技术。指纹是最容易残留的个人信息,它包含的特征多,我们的双手至少有5000个可以识别的特征,现在国内外的指纹识别技术大都采用基于细节特征,即采用基于图像处理的指纹识别算法,有两种比较有代表性的指纹识别算法,一种是基于方向滤波增强,并在指纹细化图上提取特征的算法,另一种是直接从指纹灰度图上提取特征的算法[1,2]。由于指纹图像的噪音、皮肤弹性引起的非线性形变,或者在手指出汗或者有污渍的情况下,会出现不易识别的情况,导致识别过程中出现误差,影响识别率等。而且在大型考试中,由于考生人数庞大,因此设计的数据库很庞大,也不利于系统的运行和维护[3,4]。另外它还存在一个重大漏洞,就是当替考者使用指纹膜,甚至更隐蔽的透明指纹贴时,机器可能误判,这样一个不可避免的隐患使指纹不适合作为考场中取证的特征。

    静脉识别系统用红外线提取考生静脉的分布及特点并作为判断依据来进行识别。用一组唯一的编码保存其特征值,若特征值与以前考生存储的信息相同,则可以进行判断。首先,静脉识别是活体识别,由于需要采集手部皮下的静脉图像,用红外对手背皮下的静脉图像进行照影,与手背表面的图像特征无关。所以手背表面的污渍或者天气炎热时出汗等带来的障碍均没有影响。另外双手无须接触设备,卫生安全,考生易于接受。在考场中使用静脉识别,安全性特别高。作为活体识别的静脉识别花费的代价太高昂,而且研究复杂。不利于在高考和研究生这样上百万人数的考试中大规模使用和推广,可以在今后选拔性更高且考生不多的情况下使用。

    虹膜识别是一种不需要接触考生的生物识别技术。首先抓拍并确定人的整个眼部图像,在特定的算法下抓取虹膜的某些特征,这样就获取到了一组唯一的编码,如果与本地数据库中保存的编码信息一致,则可以判断其为本人。在考场中,虹膜识别无须接触机器就可以检测,方便快捷,仅仅数秒就可以给出结果,并且识别率很高[5]。但虹膜识别很难将图像获取设备的尺寸小型化,设备造价高,无法大范围推广,而且镜头可能产生图像畸变,而使虹膜识别的可靠性降低。

    人脸识别需要对考生的面部进行扫描,通过系统特定的算法对其某些特征进行提取来识别人的身份特征[6,7,8]。人的五官、脸型等一些微小的特征都可以作为观察点来鉴别,将这些特征点编排得到一组独特序列,与数据库中已经存储好的数据进行比较,当达到一定阈值,就可以判断为本人,反之亦然。该技术需要考生在报名时提前存储其人脸信息,在考试时,只需简单拍摄一下就可以轻松识别,实现对考生身份的确认,以达到又好又快的检测和识别效果。相比于人工检查的繁琐与不确定性,其整个过程快速高效,很符合考场的环境。

    2 一种人脸检测与识别方法

    2.1 系统主要功能

    该系统采用Visual C++编程实现,主要完成了三个功能:从给定的图像中检测出人脸区域并识别;从给定的视频流中检测出所有出现的人脸信息;检测出摄像头拍摄区域的人脸信息,显示相关信息。

    该系统具体实现分为三个阶段:(1)训练。先采集人脸图像组成训练集,识别训练所需要的数据,保存每个人的代表脸;(2)检测识别。当再次输入图像、视频时,利用已知特征,截取图像或视频中的人脸区域;(3)身份认证。最后提取该区域人脸特征,与训练阶段得到的特征相对比,识别并显示相应的人物信息。

    在人脸图像的训练阶段,常用的脸部特征包括基于面部的几何特征,基于模板的模板匹配特征,基于数学的主成分分析特征等。在本系统中,用到了两种特征:主成分分析特征和基于统计的Haar特征。其中,Haar特征用于人脸检测部分所需要的分类器,主成分分析特征用于人脸识别阶段。

    在人脸检测与识别阶段,采用前一阶段训练得到的Haar特征分类器从输入的图像中截取出人脸区域,然后用前一阶段得到的主成分分析特征对截取到的人脸进行主成分分析,并与训练阶段得到的特征相对比,识别出相应的信息。

    本文在统计学习的基础上,对待识别的对象、视频加以处理,从中提取人脸区域,提取所需要的人脸特征,与已经训练过的人脸相比较,识别出人物身份。图1给出了人脸检测与识别系统的组成。

    2.2图像的预处理方法

    在图像处理过程中,图像增强是一个十分重要的环节。图像增强就是采用一系列技术来改善图像的视觉效果或将图像转换成一种更适合于人眼观察和计算机自动分析的形式。本文将所有待处理图像转换为灰度图像统一处理。由于受光线影响,人脸区域可能出现阴影或是整体区域显示暗淡。针对这一问题,本文采用直方图均衡化方法对图像进行增强处理。

    2.3 人脸区域的检测方法

    在实际应用中,输入的图像不可能是规则的截取人脸区域,所以,对于输入图像,应先找出图像中的人脸区域。从一幅图像里提取出人脸区域,就必须遍历图像,计算量将会大大增加。如何从一幅图像中快速准确地找出人脸区域是本文考虑的重要因素。

    本文处理的主要是包含人脸以及背景的图像或是一幅图像中也可能含有多个人脸的图像;另外,在处理视频流时,图像较多,对速度要求较高。针对这几种要求,本文采用Haar特征作为人脸检测的依据,它具有检测准确,速度快的特点。

    Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如:脸部的一些特征能由矩形特征简单的描述,例如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。

    对于图2中的A、B和D这类特征,特征数值计算公式为:v=Sum(白)-Sum(黑),而对于C来说,计算公式如下:v=Sum(白)-2*Sum(黑);之所以将黑色区域像素和乘以2,是为了使两种矩形区域中像素数目一致。通过改变特征模板的大小和位置,可在图像子窗口中穷举出大量的特征。图2的特征模板称为“特征原型”;特征原型在图像子窗口中扩展(平移伸缩)得到的特征称为“矩形特征”;矩形特征的值称为“特征值”。矩形特征可位于图像任意位置,大小也可以任意改变,所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化,使得很小的检测窗口含有非常多的矩形特征。

    由于训练样本通常有近万个,并且矩形特征的数量非常庞大,如果每次计算特征值都要统计矩形内所以像素之和,将会大大降低训练和检测的速度。因此引入了一种新的图像表示方法——积分图像,矩形特征的特征值计算,只与此特征矩形的端点的积分图有关,所以无论此特征矩形的尺度变换如何,特征值的计算所消耗的时间都是常量。这样只要遍历图像一次,就可以求得所有子窗口的特征值。

    Adaboost是adaptive boost的缩写,它是一种迭代算法。其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器融合起来,作为最后的决策分类器。使用Adaboost分类器可以排除一些不必要的训练数据特征,并将重点放在关键的训练数据上。

    2.4人脸识别方法

    对于一张截取的人脸区域图,由于受拍摄角度、光照、表情、饰物、年龄等的影响,也会表现出很大的差异;对于这些差异,如何提取特征,准确识别出相应的人脸,是人脸识别研究的重点。

    在人脸识别阶段,本文所要处理的是检测阶段提取的规则的人脸,且识别的人脸一定是事先采集过的人脸图像,在训练集中对所有人脸提取PCA特征,并保存。识别时,采用主成分分析的方法提取待识别人脸特征,并与训练阶段的人脸特征相比较,识别出相应的人脸。

    完整的PCA 人脸识别包括如下步骤:人脸图像预处理、读入人脸库、训练形成特征子空间、将训练图像和测试图像投影到上一步骤中得到的子空间上、选择一定的距离函数进行识别。下面详细给出整个过程。

    (1)读入人脸库。归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成测试集。设归一化后的图像是n×m,按列相连就构成N=n×m 维矢量,可视为N 维空间中的一个点,可以通过K-L 变换用一个低维子空间描述这个图像。

    2.5实验结果与分析

    本文的具体步骤主要包括训练阶段、识别阶段。训练阶段:在CAS-PEAL人脸数据库中选取40个人的人脸图像,包括20个男性和20个女性,每个人选取的有不同表情的、带有饰物、不同光照的、正常表情的一共12幅图像,共480幅。其中选取240幅(每人6幅)作为训练对象,在这6幅图像中选取一幅作为这个人的代表图像。训练过程分为两步:

    (1)对这240幅图像做人脸检测、加入到人脸库、输入个人信息、输入密码,这些数据都将作为识别阶段的识别依据,所输入的个人信息将写入单独文件保存;

    (2)对这240个归一化的人脸进行K-L变换,提取这240幅人脸的平均脸、特征向量矩阵,并把这240幅人脸图像投影到特征向量矩阵,保存特征值。

    识别阶段:

    (1)读入图像,本文选择灰度图像作为处理对象,所以在接收到一幅图像时,首先转换为灰度图像;

    (2)预处理。本文采用直方图均衡化方法处理减弱光线带来的影响,通过把原图像的直方图通过变换函数修正为分布比较均匀的直方图,从而改变图像整体偏暗或整体偏亮,灰度层次不丰富的情况;

    (3)人脸检测。利用训练阶段所得的Haar特征分类器,检测图像中的人脸区域并标记,同时,将检测到的人脸区域截取保存,将截取区域显示为“当前脸”。当一幅图像中含有多幅人脸时,检测标记出多个人脸,点击“下一个人脸”时,则可识别一幅图像中不同的人脸;

    (4)人脸识别。点击“识别”,本文将识别当前显示在“当前脸”区域的人脸。提取当前检测到的人脸,先做预处理,然后进行K-L变换,投影到训练阶段所得的特征脸矩阵,得到的特征值与训练阶段的特征值求欧氏距离。将最小的欧氏距离对应的人脸作为识别人脸,并显示出对应的代表图像。

    本文在Visual C++平台,利用MFC库编程实现。鼠标左键双击界面,显示运行主界面,主界面中包括当前处理的步骤等。如图3所示,按钮“打开图像”、“打开视频”、“打开摄像”分别打开不同的数据来源,对于这三种数据来源,有其不同的用处。图像将主要用于构建人脸数据库、输入个人信息、输入个人代表图像、识别当前图像人物身份。对于视频文件,本文主要监测视频中出现的人物,并显示其相应的信息。对于摄像头采集到的数据,主要对其进行认证登陆处理。其中,视频文件、摄像头实时视频文件也可转化为图像来源。以下将对三种不同来源的数据处理过程分别加以说明。

    当处理对象为图像时,打开的图像显示在“待检测图像区域”,当点击“人脸检测”时,将检测显示在“待检测图像”区域的图像,检测完成后,以方框的形式标记在待检测图像中。此时,若图像中没有检测到人脸区域,将弹出“未检测到人脸”的提示框;当检测到人脸区域时,标记并将显示在“检测到的人脸”区域,这个是归一化的人脸,是识别的具体对象。此时,若检测到多幅人脸,点击“下一个脸”按键,可依次把各个人脸显示在“检测的人脸”区域。人脸检测结果如图4所示。

    此时,若点击“添加到库”,则将“检测到的人脸”区域显示的人脸图添加到人脸库,同时弹出个人信息输入界面,提示输入个人信息。输入完成后,点击确定,系统自动保存个人信息,并把该人脸图加入到人脸库。当添加新的人脸后,一定要重新训练,即点击“训练”按钮。在图4界面时,当点击识别按钮时,本文将对检测到的人脸进行识别,并将识别结果显示在个人信息区域,给出个人姓名,以及识别到的具体图像。如图5所示。

    当打开的数据是视频文件时,本文弹出“Vedio”视频播放窗口,当检测到视频文件中的人脸区域时,本文将视频截图显示在主界面的“待检测图像”区域。然后对此图像按照图像人脸检测方法进行,并弹出所有检测到的人物信息。

    本文完成了对图像、视频文件、实时视频人脸检测提取、人脸识别,人脸识别平均正确率为90%,具有较高的安全性。关于其缺陷可能的原因如下:

    (1)Haar特征训练时,针对的是正常人脸区域,而且光线较好。当遇到戴有饰物或是光线变化的人脸时,检测效果不够理想;

    (2)主成分分析的方法对于表情变化较大的人脸,或是人戴有饰物时,容易识别错误,这可能是训练人脸数量有限造成的。

    3结论

    本文对各个领域中广泛使用的4种生物识别技术进行了剖析,设计了人脸防作弊检测技术。本文将多种特征结合起来进行检测、识别,先用Haar特征与Adaboost分类器相结合的方法对人脸与非人脸区域加以区分,实现对人脸的检测;而后对检测到的人脸进行分割处理,最后利用主成分分析的方法对人脸进行识别。

    参考文献

    [1] 刘成, 彭进业. 基于多任务学习的自然图像分类研究[J]. 计算机应用研究,2012,29(7):2773-2775.

    [2] 毕雪芹, 苏艳娟, 王琪. 嵌入式指纹识别系统的设计及试验研究[J]. 国外电子测量技术,2015,2:50-53.

    [3] 宋思瑶. 指纹识别在学校考试系统中的应用[D]. 吉林大学,2011.

    [4] 马建敏. 基于指纹识别的考试管理系统设计与实现[D]. 河北科技大学,2011.

    [5]陈晴, 易开军.现代虹膜识别技术在考生身份验证系统中的应用初探[J]. 工业和信息化教育,2015,8:81-85.

    [6] 李鑫, 张俊. 基于深度信念网络和多任务学习的人脸识别[J]. 电脑知识与技术,2016,12(17):165-168.

    [7] 刘向东. 基于PCA算法人脸识别的MATLAB实现[J]. 电脑知识与技术,2016,12(12):193-194.

    [8] 袁正海. 人脸识别系统及关键技术研究[D]. 南京邮电大学,2013.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/10 20:50:37