重庆邮电大学本科毕业设计(论文)
特征匹配是计算两个人脸图像特征样本的特征模块间的相似度即将采集到的人脸图像的特征模版与系统中已存储的特征模版进行比对,并输出最佳匹配对象。在本文主要讲解使用最近邻法分类器欧几里得距离来判别人脸图像,在实际广泛使用的还有基于SVM即支持向量机,基于神经网络和图匹配的方法。
第五节 本章小结
本章由人脸识别的研究背景,人脸识别技术的主要难点,人脸识别的发展趋势和人脸识别流程四个小节构成。在人脸识别的研究概况小节主要讲解人脸识别的研究概况及基于PCA人脸识别算法实现的研究意义。在人脸识别的发展趋势小节主要讲解人脸识别技术未来的走向。在人脸识别技术的主要难点小节主要讲解人脸识别的主要技术难点及本文是在什么样的条件进行试验的。人脸识别小节讲解本文人脸识别的流程。
- 8 -
重庆邮电大学本科毕业设计(论文)
第二章 人脸图像的获取
第一节 人脸图像获取
随着计算机科技和微电子的发展,现在人脸图像采集设备也越来越多。常用的采集设备有数码相机,数码摄影机等。但是采集设备成像原理各异,有些设备对某类人脸图像的采集效果比较好,进而人脸识别率高,对不同类的人脸图像采集效果差,进而人脸识别率低。不过随着现在科技的发展,这个问题已基本上被解决。另外,人脸图像采集的形式不同也会影响识别率。人脸图像的采集形式主要有两种:一为静态人脸图像,二位动态人脸图像。静态人脸图像的采集相对比较简单,用数码相机即可获取。动态人脸图像相比静态人脸图像获取难度较大,但其更加贴近实际需求,应用场合更加广阔。
动态人脸图像相比于静态人脸图提供了更加客观的信息量。但同时也带了问题,动态人脸图像序列里的某一幅图像可能会产生瞬间模糊,这将会影响其识别率。上述问题是由人脸的多变性产生的。对于动态人脸图像要考虑如何在序列中提取清晰的图像又不丢失局部信息。同时建立人脸图像间的相关性是有必要的,可以有效的提高识别率。在实际中,要采用何种人脸采集形式要取决于应用的需求和场合。一般而言,动态人脸图像采集应用于特殊场合,如犯罪识别过程,而静态人脸图像采集应用于普通的安全场合。
对于静态人脸图像采集要注意要确保人脸表情正常,姿态无倾斜,光线尽量均匀,并且要对周围的光源做必要的处理,避免受到周围强光和不均匀异色光的干扰。采集完成后要对每个对象的图像做必要的审核,剔除掉不符合要求的人脸图像。
第二节 人脸分割
人脸识别是通过对人脸进行精确定位,并从图像中提取人脸区域。人脸分割属于图像分割,是人脸识别系统中不可缺少的一环。要对人脸进行识别一般需要将人脸区域从采集到的图像中分离出来。
人脸分割比较经典的方法有数据驱动和模型驱动。数据驱动方法直接对图像进行处理,不依赖于先验知识。其包含有基于边缘检测的方法,基于阀值的方法和基于区域增长的方法。基于模型的方法需要先验知识。其包含有活动轮廓模型等。采集到图像中人脸区域颜色和纹理变化较大,因此如果要实现精确分割,只利用图像的数据信息是不够的,所以实际中基于模型的方法使用的比较多。
- 9 -
重庆邮电大学本科毕业设计(论文)
基于边缘的分割方法需要两个步骤,分别为边缘检测和边缘连接。该方法先提取边缘后再进行边界连接,得到分割轮廓。但是这个方法也存在问题,实际中由于噪声的图像的影响,常常会检测到假的边缘,从而导致错误的分割。
基于阀值的方法是使用采集到图像的灰度直方图计算出分割阀值,又可以分为全局阀值方法和局部阀值方法。全局阀值方法是使用整个图像的灰度信息,来得到用于分割的阀值。局部阀值方法是图像不同区域得到对应不同区域的阀值即一个阀值对应图像的一个子区域。在实际中,由于噪声等因素的影响,直方图经常不能有明显的峰值出现,这是选择阀值并不合理,它是由阀值分割的特点决定的。此方法只考虑了图像的灰度信息,抛弃了图像的其他信息。对于灰度差不明显的图像,得不到令人满意的结果。
基于区域增长的方法是将含有相似性质的像素集合起来形成一个新的区域。首先把图像分割成较小的区域,有可能非常小,甚至可能是一个像素。在每个子区域中,对经过适当定义能反映一个物体内成员隶属度的性质进行计算,每个子区域会用一组参数来表示该区域。然后对相邻区域所有边界进行分析,若便捷信息强,则边界不变,若边界信息弱,则消除个边界并合并相应的邻域。它是一个迭代过程,每一步重新计算边界信息,若没有区域合并,迭代完成,图像分割完成。该方法开销较大,但可以使用图像的相关性质进行边界定位。该方法当前研究的区别在于区域性质差异上。
基于模型的方法,都是通过引入统计信息来得到高鲁棒性。其中活动轮廓模型是使用在图像上的一条动态曲线,在内力曲线本身新的表现和外力图像信息的表现共同作用下趋于对象的轮廓。模型方法具有丰富的先验知识,在实际中具有很好的适应性和鲁棒性。目标分割与识别通过将目标集合和统计信息表示为模型,是其成为目标的搜索匹配或监督分类。
第三节 人脸数据库
人脸数据库是人脸识别研究,开发和评测不可缺少的。每个人脸识别系统都需要一个人脸数据库。人脸图像数据库的设计对人脸识别系统的识别率有着非常大影响。设计一个在所有变化情况下都能正确识别的系统是非常困难的,而且也没有必要。所有人脸识别系统都是在一定的约束条件进行的。所以有必要建立满足不同需要的人脸数据库。
常用人脸数据库如下:
国外人脸数据库的有FERET人脸数据库, MIT人脸数据库,YALE人脸数据库,PIE人脸数据库,ORL人脸数据库,AR人脸数据库和Essex人脸数据库。FERET人脸数据库是人脸识别中最常用的数据库,包含多姿态和多光照的人脸灰度图像,但其多为西方人脸图像,每个人的人脸图像变化较少。MIT人脸数据库有麻省理工大学媒体实验室建立,由16位志愿者的2592副多姿态,多光照和不同大小的图像组成。PIE人脸数据库有卡内基梅隆大学建立,由
- 10 -
重庆邮电大学本科毕业设计(论文)
68位志愿者的41368副不同姿态,多光照和不同表情的图像组成。ORL人脸数据库由剑桥大学AT&T实验室建立由40位志愿者的400幅图像组成,其中部分志愿者的图像还有姿态,表情和光照的变化。由于其人脸变化模式较少,现已很少使用。AR人脸数据库为西班牙巴塞罗那计算机视觉中心建立,由116人的3228幅图像构成。采集是在严格控制摄像机参数,光照变化,摄像机距离等条件下进行的。Essex人脸数据库是英国埃塞克斯大学的人脸数据库。任何人都可以下载它的人脸数据库,但是你不能发布,打印,销售或发行这些图像。这个人脸数据库由Libor Speacek博士主持的计算机视觉研究项目在维护。这个数据库由faces94,faces95,faces96,grimace四个库组成。这样做的目的是为了增加难度。Faces96和grimace是这个数据库最难识别的。它们的背景和比例是变化的,人脸表情是极度变化的。英国埃塞克斯大学计算机视觉研究项目鼓励研究者公布使用这个数据库取得人脸识别结果。我们在本文采用的是它的face94数据库。faces94数据库中人脸图像是在受试者坐在距离相机固定位置,并要求讲话的情况下采集而成。讲话的目的是为了采集面部表情的变化。每个图像的大小为180*200,图像的背景是蓝色的。有轻微的姿态变换,无光照变换。
国内人脸数据库有中科院计算技术研究所银晨科技面向识别联合实验室建立的CAS—PEAL人脸数据库。该数据库是基于目前的人脸数据库大多都较小或图像变化因素单一,人脸图像的多为西方人,其面部特征与东方人存在一定的差别,需要建立一个大规模,多因素的东方人脸数据库的需求建立的,共采集了1040位志愿者(595名男性,445名女性)的99450幅图像。该数据库根据不同的变化因素又分为7种模式子库。这7种变化因素为姿态,表情,饰物,光照,背景,距离和时间跨度,其中以姿态,表情,饰物和光照为主,故称为PEAL(pose,expression,accessory和lighting的简写)。CASE—PEAL—R1为CASE—PEAL的共享版,可以提供给研究人员用以研究使用。其中研究人员指的是研究生导师或其他固定职位的研究员,不包括学生。
第四节 本章小结
本章主要介绍人脸图像获取,人脸分割和人脸数据库。在人脸图像获取和人脸分割两个小节中主要介绍常用的人脸获取方法及获取人脸原始图像后如何分割出我们需要部分的方法,也为后面人脸图像数据库打下了基础。在人脸数据库一节中,主要介绍了常用的人脸数据库及本文的实验是在Essex人脸数据库中我们选择出来的子库中进行的。这样做的目的是我们的工作中心集中在核心人脸识别算法的性能研究上。
- 11 -