超全的最新的人脸识别特征点定位方法 下载本文

1.2 人脸特征点定位方法综述

目前为止,国内外学者们已经提出了人脸特征点定位的方法[3],依据定位所需要的基本信息的类型,人脸特征点定位的方法可以大致分为以下六类:(1)灰度信息的方法;(2)先验规则的方法;(3)几何形状的方法;(4)统计模型的方法;(5)小波的方法;(6)3D 方法。

1.2.1 基于灰度信息的方法

几何投影法:几何投影方法是利用人脸特征灰度与其他部分的差异,先统计出不同方向上的灰度值和,根据和的变化找出特定的变化点,然后利用投影灰度值基于统计的方法将不同方向上的变化点位置相结合,找到人脸特征点的位置。投影的方法计算量较低,但当姿态变化较大或者背景较复杂时容易失效。

谷分析:图像中亮度比周围像点暗的区域就称作谷,通过亮度比较的方法,就可以对人脸的各个关键部位如眼睛、眉毛、鼻子、嘴巴等相对较暗的区域进行定位。虽然其受光照影响比较大,但考虑到计算量低的优势也在定位方法中常见。

1.2.1先验规则的方法

根据人脸特征的一般特点总结出一些经验规则就称作基于先验规则的方法。人脸图像有一些明显的基本特征,比如人脸的长度比例,满足“三庭五眼”,脸部区域的双眼、鼻子和嘴巴等脸部特征处的亮度一般低于其周边区域;两眼间的对称以及眼睛与鼻子的三角分布规律,都是人脸识别的重要根据。此方法虽然简单,但是远远不能满足复杂的人脸结构的正确定位,于是该方法一般只用于粗定位,精定位还要结合其他的方法来实现。

镶嵌图法:我们可以用一组相同大小的方格去划分图像,每个方格的灰度取格中各像素灰度的均值,根据一定的规则确定哪些可能是人脸的方格区域,将确定的可能存在人脸的方格的变长减半,重新构建镶嵌图,重复第一步的工作,找到眼睛,鼻子,嘴巴等脸部特征所在的位置,然后对这两次得到的脸部区域二值化,利用边缘检测最终精确定位各个特征的位置。

二值化定位:得到图像的直方图,选择合适的阀值将图像二值化,二值化后区域的相对位置和面积形状等几何信息就可以用来确定瞳孔的位置,再通过眼睛与其他特征点的位置关系和几何关系等对其他的人脸特征点进行定位。显然该方法受光照和图像质量等的影响较大。

广义对称法:显然,在人脸图像中,眼睛眼、眉毛、鼻子等都具有较强的点对称性。为我们通过定义广义对称变换来描述点对称性,通过考察人眼中心点的强对称性和脸部特征的几何分布来对人脸的特征点进行定位,该方法仅仅利用了各点的对称性,计算量很大,而且也会因为光照表情等影响产生大量的候选点,大大影响到定位精度。

1.2.3 基于几何形状的方法

Shake 算法:该方法利用一条由几个控制点组成的闭合曲线,再利用一个进行匹配的能量函数来作为评价标准,当不断迭代最后使得能量函数最小化时就定位到人脸特征点。Snake是主动的,总是最小化能量函数,因此表现出一种动态特性。但是由于人脸的多样性和复杂性以及图像中的噪声等复杂因素的影响,在使用刚性模型分割人脸轮廓时遇到了很大的困难。另外,Snake模型也没有利用关于对象的知识,所以过于灵活,很难做到精确的特征点提取。

可变形模板方法:把眼睛特征为有两条抛物线(上下眼睑)和一个圆(虹膜)构成的几何图形,通过优化的方法来调整其参数以达到最佳的匹配,嘴巴、下巴等也可以采用类似的几何图形建模。但是,固定的几何图形并不能很好地建模实际上会千差万别的眼睛形状,而光照、姿态和表情的变化更使得采用这种固定的简单数学模型难以适应这些复杂的变化,因此很难实现鲁棒的特征提取。优化速度慢、容易陷入局部极小也阻止了该算法的进一步发展。

基于点分布模型算法:ASM和AAM都是基于点分布模型(Point Distribution Model,PDM)的算法在PDM中,外形相似的特定类别物体,比如人脸、人手的形状通过若干关键的特征点的坐标串接成原始形状向量。对训练集中的所有形状向量进行对齐操作后,对它们进行PCA分析建模,保留的主成分形成最终的形状模型,形状模型的参数反映了形状的主要可变化模式,ASM搜索则首先通过局部纹理模型匹配得到各个特征点的更佳的位置,经过相似变换对齐后,通过

统计形状模型对其进行约束,而后再进行局部纹理模型的匹配,形成一个迭代过程,以期形状模型最终匹配到输入的形状模式上去。在ASM中,仅使用了特证点局部纹理特证作为启发式信息,没有使用全局的纹理约束,实践中发现ASM很容易陷入局部极小。

而在AAM中,则采用了形状和纹理二者融合的统计约束,即所谓的统计表观模型。AAM搜索借鉴了基于合成的分析技术的思想,通过模型参数的优化调整使得模型能够不断逼近实际输入模式,模型参数的更新则放弃了ASM中的局部纹理搜索过程,仅使用一个线性预测模型根据当前模型和输入模式之间的差别来预测和更新模型参数。AAM尽管利用了全局纹理,但却抛弃了局部纹理匹配过程,因此会在一定程度上降低关键特证点配准的精度,而且其线性预测模型也有较大的局限性,在初始位置偏离目标位置过大时,则很难收敛到正确位置。

1.2.4 基于统计模型的方法

肤色唇色分割法:该方法是使用统计方法建立起人脸特征的色彩模型,定位时遍历候选区域,根据被测点的色彩与模型的匹配度筛选出候选的人脸特征点。该方法主要是对人脸面部特征的色彩信息进行研究,构造人脸特征的色彩模型,利用人脸肤色的色彩信息进行特征点定位。基于色彩信息实现简单,但容易受环境的影响,定位的可靠性不高。

特征脸法:该方法利用K-L变换将表征人脸的高维向量映射到由若干个特征向量(也称Eigenface特征脸)张成的子空间中,先用主成分分析模型重构被检区域,求出重构图与原图之间的距离,当距离小于一定阈值时,即被认定为候选区域。该方法的缺点是针对不同脸型要分别建模,搜索时采用金字塔策略,算法复杂度高。另外,主成分分析着重优化和解析图像,而没有着重于特征点的定位。

支持向量机:支持向量机(Support Vector Machines,SVM)是Vapnik等提出的基于风险最小化原理的统计学习理论,用于分类与回归问题。将SVM 方法用于脸部特征检测,使用了方形扫描窗口,将眉毛与眼睛作为一个整体作为定位的对象,从而减少了眉毛对定位的干扰。Jefrey Huang则采用该方法来检测眼睛。但是由于训练需要求解计算复杂度极高的二次规划问题,内存需求量大,其次是训练样本个数较大时,会得到大量的支持向量,使分类器计算量过高。

模板匹配法:模板匹配法是较早用于面部特征点定位的方法之一,也是使用范围较广的一种。这是由于模板匹配法具有比较直观、易于构造等优点。在对图像进行预处理的基础上产生特征的候选区域,之后通过一个具有几何约束(五官模板的相关量)的模板对特征加以定位。Sako等人采用彩色直方图方法分割脸部区域和嘴唇区域,并根据眼睛的结构和灰度信息特点预先构造了眼睛模板,利用此模板进行搜索以确定眼睛的位置匹配的过程是利用事先建立的面部特征的模板在候选窗口逐点滑动进行特征匹配定位。模板匹配需要考虑面部特征的尺寸缩放、方向旋转等变化,所以计算量很大,并且由于光照的不均匀变化往往引起模板匹配的失败,所以基于模板匹配的人脸检测方法较适合于人脸尺寸、方向、光照等有一定的约束条件或者先前已确定的情况。该方法虽然速度较慢,但正确率较高。

人工神经网络:人工神经网络(ANN)在模式识别中有着广泛的应用,特别适合研究非线性问题。完整的人脸图像受个体差异、眼睛状态和目标对象姿态等变化的影响较大,而子特征点(包括左右眼角和上下眼眶顶点)附近区域相对稳定,根据这一特点,Waite 等以各子特征点附近的灰度图像为输入,分别建立神经网络。检测时,先用各个神经网络对目标区域进行遍历搜索,再结合先验知识对搜索结果进行筛选和结合。这个算法训练过程比较简单,有较强的鲁棒性。但缺点是区分度不足。

贝叶斯概率网络方法:Kin 和 Cipolla 使用一个 3 层的概率网络来对脸型建模,其网络结构如图1。他们在搜索中采用了自底向上的搜索策略,结合使用高斯滤波器和边缘检测算法找出双眉、鼻和嘴的候选点(对应于网络中的第1层),据邻近候选点之间的相对关系两两配对为水平或垂直组合(对应于网络中的第2层),并进一步归入脸部的上、下、左、右 4 个区域(对应于网络中的第3层),从而筛去虚警点。

1.2.5 基于小波的方法

弹性图匹配法:该方法是面部关键特证定位的另一个重要算法,该方法将人脸面部关键特证点的属性及其他们之间的位置关系通过一个属性图进行描述,图的顶点对关键特征点的局部纹理建模(通过Gabor特征),图的边则反映了特征