图2.5 左侧为测试图像,右侧为检测结果。
基于学习的目标检测方法有两种性能评价方法:针对分类器性能评价的ROC(receiver operating characteristic)曲线和针对检测结果评价的RP(recall-precision)曲线。
ROC曲线描述了分类器在扫描窗口级别的性能,正面测试样本是一系列和模板同样大小且包含目标的窗口,负面测试样本是从背景图像中抽取的和模板同样大小且不包含目标的窗口。ROC一般定义为检测率(detection rate, DR)和虚警率(false alarm rate, FAR或false positive rate, FPR)之间的变化关系。检测率和虚警率的定义如下:
检测率(DR)=#TruePositives (2.9)
#TruePositives?#FalseNegatives
虚警率(FAR)=#FalsePositives (2.10)
#TrueNegatives?#FalsePositives
ROC曲线的横坐标为虚警率,纵坐标为检测率。曲线越靠近左上角,表明性能越好。不同的ROC曲线可以用指定虚警率下的检测率或曲线下的面积(area under curve, AUC)进行比较。如图2.6,是基于MIT+CMU测试集的人脸检测ROC曲线。
图2.6 MIT+CMU测试集的人脸检测ROC曲线
另外一个和ROC曲线极为相关的曲线是DET(detection error tradeoff)曲线,它和ROC曲线表达信息相同,不过采用漏检率(miss rate)作为纵坐标,所以DET曲线越靠近左下角表明分类器的效果越好。ROC曲线或DET曲线评价方法简单、直接,可以有效地评价一个分类器对目标的鉴别性。缺点在于它不是直接对检测结果的评价,忽略了前期预处理和后期临近结果融合对检测性能的影响。
RP曲线可以有效地评价一个检测器的检测结果,无论该检测结果是否由基于统计学习的方法得到。它的测试集合是一系列标注了目标位置的图片,检测器的输出是目标可能的位置和相应的概率,通过变化阈值可以得到一系列检测结果。对每个检测结果进行分析,得到每个阈值点的查全率(recall)和查准率(precision),它们的定义如下:
查全率(recall)=#TruePositives (2.11)
#TruePositives?#FalseNegatives
查准率(precision)=#TruePositives (2.12)
#TruePositives?#FalsePositives
一个检测结果是否正确,取决于它与目标真实位置间的重叠程度。假设一个检测结果对应的位置为bp,相邻目标的真实位置为bgt,当
a0?area(bp?bgt)area(bp?bgt) (2.13)
大于50%时,该检测结果被视为正确的检测结果(true positive)。同时需要注意的是当一个真实目标对应多个检测结果时,只有一个检测结果可以作为正确的检测结果,其余的检测结果被视为虚警(false positive)。绘制RP曲线时,用“1-查准率”作为横坐标,查全率作为纵坐标,曲线越靠近左上角,表明性能越好。
3 基于AdaBoost的人脸检测方法概述
在上文中详细介绍了人脸检测的研究方法以及基于学习的人脸检测方法的一般流程。在下文中将重点讲解基于学习的人脸检测方法的代表——AdaBoost方法,对于AdaBoost人脸检测器结构如图3.1所示,
强分类器级联强分类器:离散Adaboost特征提取:Haar特征
图3.1 AdaBoost人脸检测器结构
从上到下分为三个组成部分:
? haar矩形特征的提取与积分图的转换 ? 训练基于AdaBoost的强分类器 ? 多个强分类器的级联
当然,对于快速的人脸检测研究也有三个主要的研究方向。第一个方向是寻找新的图像特征去减少分类器的数量。第二个方向是修正现有的学习方法或者引
入新的选择特征的学习方法。第三个方向是减少子图像的数目从而达到加速检测速度。
我们将以图3.2来组织我们的系统。
图像 裁剪图像 对比拉伸 转变为积分图 人脸检测 人脸 非人脸
图3.2 人脸检测系统流程
AdaBoost人脸检测系统是以强分类器级联的方式构成的。每一个强分类器由若干个弱分类器构成,并且这些弱分类器具有权重值和带有阈值的特征。
对于一幅图像,我们可以通过从不同的位置和大小来产生众多的子图像。每一个强分类器可以排除一定数目的子图像;被排除的子图像将不再被处理。大多数被排除的子图像是非人脸子窗口,极少数是人脸图像。该流程如图3.3所示。
所有扫描的窗口1T2T3T候选目标窗口FF舍弃的背景窗口F
图3.3 分类器级联结构
4 矩形特征与积分图
4.1 引言
本章节描述了对 AdaBoost人脸检测训练算法速度很重要的两方面,特征的选取和特征值的计算。