融合颜色特征和纹理特征的图像检索算法
耿艳萍+高红斌+任智颖
摘 要:文章结合颜色特征和纹理特征,利用欧氏距离计算两幅图像的相似度进行图像检索。首先,在HSV空间下,提取颜色特征并进行归一化处理。然后,提取GLCM的特征值,并结合Tamura特征形成更加丰富的纹理特征。最后,分别计算待检索图像和图像库中图像的颜色和纹理相似度,在不同权重下融合颜色和纹理特征得出最终相似度。Matlab实验表明,不同种类的图像,分配颜色和纹理的不同权重时,有不同的查准率。调整图像的特征权重可以提高查准率。
关键词:图像检索;GLCM;Tamura;多特征融合
随着数字图像技术的发展,人们面临着丰富多样的图像,根据需求从大量图像中检索出匹配的图像,是值得探究的问题。图像检索技术分为基于文本和基于内容的检索。基于内容的图像检索(Content Based Image Retrieval,CBIR)是提取图像库中圖像和待检索图像的特征进行相似度比较,从而得出结论。基于内容的图像检索特征包括两个方面:一类是底层视觉特征,如颜色、纹理、形状等[1];一类是高层语义特征,即图像内容的语义描述与各类物理特征之间的逻辑关系[2]。本文提取第一类特征,在不同种类的图像组成的图像库中,检索出与待检索图像相似的图片。
单一的基于颜色的相似度计算[3]不能完全表达图像内容,故这种检索算法的查准率很低。另外,常见的基于内容的图像检索特征还有纹理特征,用于捕捉图像表面的粒度与重复出现的模式[4]。常用的纹理特征有基于灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)的特征,文献[5]用广义图像灰度共生矩阵做图像检索,但查准率和查全率的提升效果不显著。另一常用的纹理特征是Tamura特征,文献[6]用改进的Tamura纹理特征提高图像检索性能,相对于Tamura特征有了一定的提升,但提高有限。本文结合颜色特征和融合后的纹理特征(GLCM和Tamura特征融合)进行图像检索,并给出了颜色特征和纹理特征在最佳查准率下的权重系数,提高了查准率。
1 HSV颜色空间量化及特征提取
颜色特征与其他视觉特征相比,它对图像尺寸、方向、视角等变化不敏感,同时,颜色特征对图像质量的变化,噪声有很好的鲁棒性。故图像检索中,颜色特征的成功提取起着重要的作用[7]。
相对于RGB空间,HSV(色调,饱和度,亮度)空间对颜色的表达和人们的视觉习惯一致。故把RGB空间转化为HSV空间,为了提高检索的效率和准确率,对HSV空间的值进行非均匀量化。本文中,H量化为16级,S量化为4级,V量化为4级。
对HSV空间量化以后,把H,S,V 3个分量构造成一维的颜色特征向量:HSV=H*16+4*S*4+V。
2 纹理特征的提取和融合
2.1 灰度共生矩阵
本文计算GLCM的统计量作为纹理信息的一部分,GLCM能反映灰度图像的灰度在空间位置上的分布情况,用来描述灰度空间的相关性。其定义为:图像I(i,j)中距离为d,方向为θ的任意两个灰度像素同时出现的联合概率分布,记作p(i, j,d,θ),由这些概率值形成灰度共生矩阵P=[p(i, j,d,θ)]L×L,其中,θ一般取0°,45°,90°,135°;L为灰度级数。通常情况下,在计算GLCM前由于灰度级过大会导致计算量大、费时长,所以要先压缩灰度级。
灰度共生矩阵不能直接表示图像的纹理特征。在GLCM的基础上,用一些统计量描述纹理特征,本实验中,使用了对比度、相关性、熵、平稳度、能量这5个统计量。
(1)对比度。
其中P,Q是待检索图像和图像库中图像,s1和s2是颜色特征和纹理特征的权重,C,T分别代表颜色特征和纹理特征,本算法中纹理特征是融合GLCM特征和Tamura特征的8维特征向量。
颜色重点描述图像整体特征,而纹理重点描述图像局部特征,单一的任何一种特征对图像信息提取不全,本文在颜色特征的基础上,提取了GLCM和Tumura纹理特征,使纹理特征信息更加全面,比以往论文中采用颜色特征和单一纹理特征进行图像检索准确率更高。过程如图1所示。
4 实验结果分析
4.1 实验设置
本实验硬件配置为:Core(TM)i5-4300CPU@1.90GHz 2.50 GHz和RAM为4 GB;软件配置为64位的Windows7操作系统,MATLAB R2014a。为了测试算法性能,实验随机抽取Corel图像库中的一部分图像(五大类:恐龙、车、大象、花、马,各40张)作为图像库。
4.2 实验分析
根据上文提出的算法,在一个库中对相似度距离排序,在40张图像(即目标类图像总数目)中筛选与目标图像(待检索图像)同类的图像数目,计算同类中所有图像的查准率并求出平均查准率。
5类图像的例图如图2所示,实验结果如表1所示。
由表1得出,当颜色和纹理特征权重不同时,查准率也不同,但每一种图像的查准率都基本符合正态分布,根据实验结果,恐龙和车在颜色和纹理权重比为0.6∶0.4时查准率最高,大象在颜色和纹理权重比为0.5∶0.5时查准率最高,花朵和马在颜色和纹理权重比为0.4∶0.6时查准率最高。
由于恐龙图像颜色较为单一,颜色特征明显,所以颜色权重比较大(0.6∶0.4)时,查准率就相对较高(92.813%)。车图像颜色特征也比较明显且本身纹理与其他种类图像不同,所以查准率也比较高(92.00%)。花朵和马背景颜色虽然相似,但纹理特征显著不同,所以当增大纹理所占权重为0.4∶0.6时,查准率提高。大象的背景颜色为绿色,与马和花朵的背景颜色相似,且纹理倾向不是很明显,所以大象在颜色特征和纹理特征权重为0.5∶0.5时,查准率达到最高,即对大象图像而言,所提取的颜色和纹理特征在图像检索时所起作用相当。但相对于其他4种图像,大象的平均的查准率为64.42%,相对较低。
5 結语
通过颜色特征和纹理特征的融合,本文提出的算法能够较好地进行同类图片及相似图片的检索。实验发现,查准率与颜色和纹理的权重s1,s2密切相关。同一种图像的颜色特征与纹理特征的权重不同导致查准率有很大差异。通过多次实验得到了不同种类图像检索时,颜色特征和纹理特征的最佳权重比,在一定程度上提高了检索的准确率。将来,为了提高查准率,可以进一步获取GLCM特征和Taumra特征融合时的最佳权重比。
[参考文献]
[1]刘瑞军,顾嘉伟,陈谊. 一种多低层特征结合的CBIR检索方法[J].小型微型计算机系统,2015(6):1336-1340.
[2]李有锋.基于颜色和纹理特征的图像检索相关算法研究[D].成都:电子科技大学,2009.
[3]李长勇,曹其新,郭峰.基于主色直方图特征匹配的蔬果分类方法[J].上海交通大学学报,2009(12):1898-1903.
[4]高程程,惠晓威.基于灰度共生矩阵的纹理特征提取[J].计算机系统应用,2010(6):195-198.
[5]姚宏宇,李弼程.基于广义图像灰度共生矩阵的图像检索方法[J].计算机工程与应用,2005(34):98-100.
[6]郝玉保,王仁礼.改进Tamura纹理特征的图像检索方法[J].测绘科学,2010(4):136-138.
[7]CHEN J,SHAN S G,HE C,et al.WLD:a robust local image descriptor[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010(9):1705-1720.
Abstract:Combining color features and texture features, this paper uses Euclidean distance to calculate the similarity of two images, and then retrieves the image. Firstly, the color feature is extracted and normalized in HSV space. Then, the feature values of gray level co-occurrence matrix(GLCM)are calculated and combined with Tamura features to form more abundant texture features. Finally, the final similarity is obtained by fusing color and texture features under different weights. Matlab experiments show that different kinds of images have different precision when assigning different weights of color features and texture features. Adjusting the feature weight of image can improve the precision ratio.
Key words:image retrieval; GLCM; Tamura; multi-feature fusion