基于韦伯定律的图像相似度检测应用研究
4.2.1 仿真实验算法 .............................................................................................. 28 4.2.2 数据库 .......................................................................................................... 31 4.2.3 参数讨论 ...................................................................................................... 32 4.3 实验结果与分析 ..................................................................................................... 32
4.3.1 WLD特征值提取结果 ................................................................................ 33 4.3.2 WLD特征直方图结果 ................................................................................ 33 4.3.3 图像之间的相似度 ...................................................................................... 34 4.3.4 图片旋转相似度变化测试 .......................................................................... 34 4.3.5 图像缩放相似度变化测试 .......................................................................... 35 4.3.6 程序运行时间的测试 .................................................................................. 36 4.3.7 性能比较 ...................................................................................................... 37 4.4 小结 ......................................................................................................................... 38 结 论 .................................................................................................................................. 40 参 考 文 献 ............................................................................................................................ 42 致 谢 .................................................................................................................................. 45
- II -
基于韦伯定律的图像相似度检测应用研究
1 绪论
1.1 研究背景及意义
人类获取外界信息的主要方式来源于视觉,那么人类在世界中轻而易举的通过视觉找到自己需要的物体的能力即为物体检测。物体检测也是计算机视觉的研究热点之一,它是人类视觉中的基本步骤和功能,全世界的数字图像容量以惊人速度增长。随着图像处理、图像识别、计算机视觉等技术领域飞速的发展,人们对图像相似度检测越来越关注。图像相似度主要用于对于两幅图像之间内容的相似程度进行打分,根据分数的高低来判断图像内容的相近程度。图像特征提取和相似度计算是机器视觉的基础,为了进一步的应用比如图像检索、图像配准、目标识别追踪与分类、纹理识别、机器人漫游、三维重建、运动跟踪、精确制导、指纹验证、场景分类、视觉数据挖掘、气象预报等,我们需要进行特征值的提取和相似度的检测。
近年来,对于图像局部不变特征的研究逐渐成为了目标识别相关研究的重点。特征是用来描述物体特定状态或者特定固有图像的表示方法。找到灵活、鲁棒且代表大多物体形状的特征是极其有意义的。特征值提取和相似度检测只是一种方法,归根结底,它是为了用计算机代替人工处理自然界中大量的物理信息。计算机代替人眼对于图像相似度的检测更定量化更具体。众多专家学者在此提出局部不变特征,大体可分为稀疏特征和密集特征。前者是先检测到图像的边界点,后者是逐点进行特征值的提取。
所以,研究并且实现基于WLD(韦伯局部特征)[1]的图像相似度检测可以为其他应用服务。
1.2 国内外研究现状
图像相似度检测与图像匹配近几十年来一直是研究的重点。最早的研究是在20世纪70年代进行的,美国从事飞行器辅助导航系统等军事应用研究中提出来。经历了10多年的发展,从80年代以后,其应用逐步从原来单纯的军事应用扩大到其它领域。 国内外现阶段对图像匹配研究主要是以提高匹配的精度和速度为主,同时对匹配方法的通用性及鲁棒性也有一定要求。已研究比较多的匹配方法主要分为基于图像灰度的匹配方法和基于图像特征的匹配方法。基于灰度相关的图像匹配方法,主要处理不存在旋转的匹配对象,且已经提出了各种各样针对灰度匹配的方法,如:Leese于1971年提出的MAD算法,Barnea D I和Silverman于1972年提出了序贯相似性检测法—SSDA,紧接着又提出了归一化积相关算法—NCC,这些方法在时间复杂度或匹配精度[2][3][4]上均存在一定问题,不适应于实际的匹配应用。对各种匹配快速算法的研究,主要是从尽可能
- 1 -
基于韦伯定律的图像相似度检测应用研究
减少匹配运算量或搜索的位置数这两个角度入手。后分别对MAD、NCC和SSDA等经典模板匹配算法进行改进[5][6],以提高匹配速度:将多个算法进行融合,以提高匹配速度和准确度;又提出新的匹配方法,即基于图像灰度值编码的匹配方法[7],较传统匹配算法在速度上提高了一个数量级,但其仅适应于矩形匹配对象,且对局部光照变化非常敏感,从而影响匹配准确度。但在实际应用当中,一般以不规则匹配对象居多,且环境的光照变化也是非常不稳定因素,因此算法设计过程中必须考虑这几个因素。有多种方法在搜索策略方面普遍提高[8],比如分层搜索技术、遗传算法、最小二乘、模拟退火、能量最小、削减搜索分支、多子区域相关匹配等。匹配速度主要从两个方面来分析,一方面分析在同样硬件环境下,同样匹配精度和要求下,比较所研究方法和其它方法的实际运算时间;另一方面分析算法,90年代初Swain 和 Ballard提出的颜色直方图计算方法十分简便[9],对全局颜色特征进行统计。如图1.1所示,图像相似度在下标不同的图片中有所体现。图像相似度是对于图像之间内容的相似程度打分,即以数值的形式表示两幅图像的相似的程度。
图1.1 图像相似度示意图
- 2 -
基于韦伯定律的图像相似度检测应用研究
特征提取一般可分为全局特征和局部特征两大类,其中,全局特征用于描述人脸的整体特征。其得到的特征向量中每个维度都包含着全图的信息。全局特征的提取主要有两种方法:空频域变换方法[10],比如离散余弦变换(Discrete Cosine Transform,DCT)、傅立叶变换(Fourier Transform,FT)等;基于子空间的算法,包括局部线性嵌入(Local Linear Embedding,LLE)、等距特征映射(Isometric Feature Mapping)、局部保持投影(Locality Preserving Projection,LPP)、主成份分析(Princinpal Component Analysis,PCA)、线性判别分析(Linear Discriminant Analysis,LDA)等非线性的流形学习算法。而局部特征侧重于描述图像局部细节变化的情况,提取的特征向量每一维度只对应着图像中某一局部的信息。局部特征对于光照、姿态、表情、遮挡等因素变换具有较强的免疫力[11]。现在,局部特征提取越来越受到研究人员的关注,我们常用的局部特征主要包括非负矩阵分解(Nonnegative Matrix Factorization,NMF)、尺度不变特征变换[12][13](Scale Invariant Feature Transform,SIFT)[14]、局部二元模式(Local Binary Pattern,LBP)、Gabor小波等。近年来对于局部不变特征的研究是目标识别及分类的重点,大量的论文都提出局部不变特征的标准。它们被分成两类,一类是稀疏特征,另一类是密集特征。典型的稀疏特征SIFT由Lowe提出并得到应用。由于SIFT具备尺度及旋转变换的不变性,SIFT在内容匹配上效果很好。在此基础上,Schmid和Mikolajczyk量化直方图参数改进了SIFT特征,Ke和Sukthankar提出了PCA-SIFT特征。Lzaebnik等人提出了旋转不变特征(Rotation Invariant Feature Transform,RIFT)。Bay等人提出了通用应用积分图(Integral Image)实现快速SIFT特征计算的快速SIFT算法,并且在一个较小的直方图中量化了梯度方向。Winder和Brown从一个大的训练集里学习了一个优化的匹配模型。Mikolajczyk 和 Matas 提出了优化线性投影算法来提高 SIFT 特征的匹配程度和匹配速度。同样的,为了达到提高局部特征的检测速度,Tola 等人用卷积和替代了 SIFT 特征中权重和。[15]就密集特征而言,例如,Gabor 小波特征、局部二值特征(LBP)。Gabor滤波器同样可以被认为是方向和边界检测器。统计结果表明,这些在给定区域的特征经常带有纹理信息。Gabor 小波被广泛应用在图像分析应用中,包括图像纹理分类,图像分割,运动跟踪以及人脸识别。另一种非常重要的密集特征是局部二值特征(LBP)。这种特征由于它的简单性和性能表现,在最近得到了广泛的关注。最近 LBP 有很多的变化版本来实现不同情况下的工作。Ahonen 等人,通过 LBP 来做人脸识别。Rodriguez 和 Marcel 提出了适应性 LBP 直方图的人脸识别。Tan 和 Triggs 在不同光照的条件下,改变了人脸识别的界限值,来达到人脸识别的目的。Zhang 等人,提出了局部 Gabor 二值特征[16],作为人脸识别的特征在人脸识别应用上来说,当前人脸检测的方法可分为基于知识模型、基于统计模型的方法。Yullie等人利用嘴巴、眼睛等器官
- 3 -