基于韦伯定律的图像相似度检测应用研究
它们的Red、Green、Blue空间直方图分别如图2.8、图2.9所示。
图2.8 原示例图片RGB空间直方图
图2.9 处理后图片RGB空间直方图
- 12 -
基于韦伯定律的图像相似度检测应用研究
而原示例图片和处理后图片WLD特征直方图分别为图2.10和图2.11所示。
图2.10 原示例图片WLD特征直方图
图2.11 处理后图片WLD空间直方图
- 13 -
基于韦伯定律的图像相似度检测应用研究
由以上各图可知,各个颜色在图像中的比例不变处理后,图2.6与图2.7的RGB颜色空间直方图相同,而WLD空间直方图完全不同。说明传统颜色直方图只反映了图像中所占的百分比,而丢失了图像颜色的空间分布信息。故此算法优点在于实现简单、算法容易,缺点在于颜色直方图算法只反映了图像中所占的百分比,而丢失了图像颜色的空间分布信息。
(2)数学上的矩阵分解算法优缺点
这种算法的优点是具有良好的稳定性,降低了特征空间的维数,提高了抵抗干扰和噪声的能力。但是缺点是这个算法实现相对比较困难,对数学矩阵计算相关要求非常高,并且奇异值分解得到的奇异矢量中有负数存在,不能很好的解释奇异矢量的物理意义。
(3)基于特征点的相似度算法优缺点
这种算法好处是对同一个物体,两个不同角度得到的照片可以找到很多匹配点,并且此算法的准确性也较高,一般来说这种算法的抗旋转与抗噪声的效果比较好。但是缺点在于有时候基于特征点的相似度计算只能计算完全相同,不能计算相似;而且特征提取方法的计算代价通常较大,需要一些自由参数和事先按照经验选取的阈值,因而不便于实时应用。
(4)直方图匹配算法优缺点
这种算法的优点是直方图能够很好的归一化,计算直方图来计算相似度很方便、效率较高且计算量相对较小。但是这种算法的缺点也很明显:
① 该直方图反映的是图像像素灰度值的概率分布,但是对于这些像素原来的位置在直方图中并没有体现。
② 两幅图像之间的距离度量,采用的是巴氏距离或者归一化相关系数,分析数学向量方法越界分析图像。
③ 就信息量的道理来说,采用一个数值来判断两幅图像的相似程度本身就是一个信息压缩的过程,距离用一个数值表示存在不准确性。
2.2 巴氏距离、欧氏距离、马氏距离计算图像相似度
2.2.1 三种距离共同满足的条件
若使用dij表示第i个样品和第j个样品之间的距离,那么对一切i,j和k,dij应满足四个条件:
(1) 当且仅当i=j时,dij=0; (2) dij≥0;
(3) dij=dji (体现对称性);
- 14 -
基于韦伯定律的图像相似度检测应用研究
(4) dij≤dik+djk (体现三角不等式)。 2.2.2 巴氏距离计算图像相似度 (1)巴氏距离
巴氏距离(巴塔恰里雅距离 / Bhattacharyya distance)是统计学的一种概念,它测量的是两个离散或者连续概率分布的相似性即两组样本的相关性。常在分类中测量类之间的可分离性,在同一个定义域X中,概率分布p和q的巴氏距离定义有离散概率分布和与连续概率分布。其中,BC是巴氏系数(Bhattacharyya coefficient)。巴塔恰里雅是印度统计研究所的统计学家,在直方图相似度计算中,巴氏距离的效果相对较好,计算相对较为复杂。巴氏距离计算图像相似度结果BC为[0,1]的浮点数,其值越大表示两幅图的相似度越高,当BC=1时,两幅图精确匹配。
(2)巴氏距离计算公式 ① 离散概率分布
对于在X数域上的两个离散概率分布p和q,巴氏距离定义为:
DB(p,q)??ln(BC(p,q)) (2.1) 其中BC(p,q)有公式
BC(p,q)??p(x)q(x) (2.2)
z?X那么BC被称为Bhattacharyya系数(巴氏系数),0≤BC≤1,0≤DB≤∞。 ② 连续概率分布
连续分布时,Bhattacharyya系数如下定义:
BC(p,q)??p(x)q(x)dx (2.3) 此时BC被称为Bhattacharyya系数(巴氏系数),0≤BC≤1,0≤DB≤∞。 ③ 说明
当满足以上两种情况中的任何一种时,DB巴氏距离无需遵循三角不等式,但是
1?BC必须遵循三角不等式。
对于多变量的高斯分布如公式2.4,DB计算公式如2.5所示,协方差的分布如公式2.6所示。
- 15 -