基于区域改进LBP 和KNN 的人脸识别
刘吉安 江金滚
摘要:传统基于LBP特征的人脸识别算法因为受到人脸位置的影响,识别效果差;基于此,该文提出了基于区域改进的LBP和KNN的人脸识别方法。首先将整张图片划分成若干个小区域,再对每个子区域内各个位置的像素点都提取其LBP特征,接着,在每个子区域内建立自己的LBP特征统计直方图。然后,将所有直方图按顺序串联起来,并对其进行归一化,一张图片便能通过一个归一化直方图来表示。最后,将最终的归一化的直方图作为人脸特征,并采用KNN算法完成人脸识别。实验结果表明该划分方法能够有效地提升识别效果。
关键词:人脸识别;人脸特征;LBP;KNN
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)13-0184-02
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部分析、验证等一系列相关技术,通常也叫做人像识别、面部识别。相对于指纹等其他生物特征,人脸识别有其独特的优势,应用前景广泛。适用于公园、工厂、超市、住宅区、商业街等公众活动和聚集场所的重要部位。目前在已经有大量系统中应用到了人脸识别技术,例如:出入管理系统、门禁考勤系统、监控管理、安全防范、照片搜索、来访登记、ATM机智能视频报警系统、监狱智能报警系统、RFID智能通关系统及公安罪犯追逃智能报警系统等都可以引入人脸识别技术。经过四十多年的发展,人脸识别技术取得了巨大的进步。在信息检索领域,可进行人物图片的检索;在安防系统中,可以达到实时监测的优良效果;在人工智能等其他领域,人脸识别的应用也有相当重要的意义。但是在进行人脸识别时,仍然有很多因素影响着识别效果。因此,人脸识别应用还有许多需要解决的关键问题。
本实验针对人脸识别技术中的特征提取步骤进行了改进,提取特征前对图像进行了区域分割,以消除人脸位置所带来的影响。识别过程如下,首先对需要识别的图片进行预处理,然后,提取人脸特征,与人脸数据库中的信息进行比较,得到正确的人脸编号,识别完成。
1 基本的LBP特征
人脸特征代表如何对人脸建模,并确定使用何种检测与识别算法。人脸特征在用于测量人脸之间的相似性中,是最为有效的。
目前,存在着多种从图片中提取人脸特征的方法。其中局部二进制模式(LBP)特征是比较优秀的一种。这种特征是Ojala在1996年提出的。使用LBP能够描述数字图像的纹理和形状。
某一位置的LBP特征是由当前区域内该位置周围的像素以二进制的模式组成的,把所有获取到的特征串联起来,形成一个直方图,并进行归一化,则这个直方图表示的就是当前的人脸。在人脸识别领域,LBP特征主要是计算当前位置八邻域的二进制模式值。按照顺时针的顺序,从左上位置开始比较,对于大于中心像素的,设置为1,否则设置为0。这就获得了一个八位的二进制数,通常情况下,将其转换为十进制数字,作为该位置的特征。
图像之间通过测量它们直方图之间的距离,来判断它们的相似性。在实验中,使用的是卡方距离。其中样本集用S表示,测试集用M表示:
2 区域改进的LBP特征
由上述基本的LBP可知,该特征与位置信息关系紧密,直接对两张图片提取特征,进行识别分类的话,则会因为“位置没有对准”而产生很大的误差。故在本次实验中,对直接提取进行改进,这里采用分块的思想,来消除位置的影响。首先将一张完整的图片划分为N*N个子区域,再对每个子区域内各个位置的像素点都提取其LBP特征,然后,在每个子区域内建立自己的LBP特征统计直方图。这样,就可以用一个统计直方图来进行描述一个子区域。最后,将所有直方图按顺序串联起来,并对其进行归一化,于是,一张图片便能通过一个归一化直方图来表示。
例如:有一张200*200像素大小的图片,取N为5,则该图片就被划分为25个子区域。在每个子区域内的每个像素点,提取其LBP特征,然后,建立统计直方图;这样便得到了25个子区域,即25个统计直方图,将它们串联起来并归一化后,就可以用这个归一化直方图来表示图片了。之后,我们利用各种相似性度量函数,判断两张图片之间的相似性。
3 KNN算法
在模式识别领域中,K近邻算法(KNN算法),是一种用于分类和回归的算法。在分类中,KNN算法输出的是分类的类别号。一个对象的分类是由其相邻的多个对象“多数表决”确定的,这里我们将这多个对象称之为“邻居”。我们给这k个最近邻居(k为正整数,通常较小)赋予不同权值,再把权值和最大的类别的编号,赋值给当前对象。若k = 1,则该对象的类别直接由最近的一个邻居赋予。在本次研究中,经过对不同k值的取值,最终取k等于5。
KNN是一种基于实例的学习,或者是局部近似和将所有计算推迟到分类之后的惰性学习。K近邻算法是所有的机器学习算法中最简单的之一。邻居都取自一组已经正确分类的对象。虽然没要求明确的训练步骤,但这也可以当成是此算法的一个训练样本集。
一般情况下,将欧氏距离作为距离度量,但是这是只适用于连续变量。通常情况下,如果运用一些特殊的距离来计算度量的话,K近邻分类精度可显著提高,在本次人脸识别研究中,使用卡方距离来度量,效果甚佳。
4 实验及结论
本次实验的样本数据库采用的是我们自己采集的大量照片,这些照片基本上是由双飞燕的PK-910H这款摄像头拍摄的。
样本数据库共有200张人脸照片,测试数据库共有100张人脸照片,识别率的计算方法是,识别正确的照片数量除以测试数据库的照片数量。
在本次实验中,需要建立人脸数据库,步骤如下:采集大量含有人脸的图片,对这些图片进行预处理,将图片灰度化并分割区域,之后提取人脸特征,把相关信息存入到数据库中。人脸识别阶段的前期步骤与建立数据库时相同,在提取特征之后,利用卡方距离以及KNN算法与数据库中信息进行比较,最终得到其正确的分类,识别完成。
基础的实验之后,为了研究区域个数对实验结果的影响,进而在划分不同子区域个数时进行了实验。
从实验结果可以看出,对整张图片划分区域后,识别率有明显的提升。另外,区域的划分个数对识别率是有一定影响的,既不是越少越好,也不是越大越好。所以,实际应用中要对每个参数的不同取值都尽可能进行尝试,以到达最优效果。本项目中的数据库而言,划分成25个区域取得的效果是最佳的。
参考文献:
[1] Ojala T, Pietikainen M, Harwood D. A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition, 1996(29).
[2] Altman N S. An introduction to kernel and nearest-neighbor nonparametric regression[J].The American Statistician , 1992,46(3): 175–185.
[3] 张翠平,苏光大.人脸识别技术综述[J].中国图像图形学报,2000,5(A):886-894.
[4] 江小辉.基于改进型 LBP 特征的人脸识别研究[D].金华:浙江师范大学,2009.
[5] 郑瑾.基于人脸识别技术的模拟考勤系统的研究与设计[J].福建电脑,2010(8).
[6] 黄非非.基于LBP的人脸识别研究[D]. 重庆:重庆大学,2009.
[7] 陈健斌.图像特征提取及其相似度的研究和实现[D]. 西安:西安电子科技大学,2012.