网站首页  词典首页

请输入您要查询的论文:

 

标题 数字图书馆图像资源检索框架的构建与实现
范文 数字图书馆图像资源检索框架的构建与实现——基于非下采样的Contourlet变换+徐彤阳+任浩然+张国标



[摘要]图像检索为数字图书馆的发展提供了技术支持,图书馆应重视数字化发展以提升服务质量。本文提出一种数字图书馆图像资源检索框架,并对系统的实现过程做了详细的分析。同时,在提取图像特征时提出了一种基于非下采样的con.toudet变换图像检索算法(NSCT),能够在大量图像数据中挖掘有效的特征信息。该算法首先对图像进行多尺度、多方向分解,然后计算低频和高频中不同方向的子带系数的标准差和均值作为图像的纹理特征。实验结果显示,本文提出的图像检索框架具有可行性,能够为用户提供更优质的搜索服务,并且与同类特征提取算法进行比较,该算法具有良好的检索性能和较高的查准率、查全率。
[关键词]数字图书馆;图像检索;框架构建;非下采样conlourIet
DOI:10.3969/j.issn.1008—0821.2017.06.009
[中图分类号]C250.76 [文献标识码]A [文章编号]1008—0821(2017)06—0055—06
随着计算机技术、网络技术及多媒体技术的快速发展,人们进入了“读图时代”,大量图像源源不断的产生,而且图像本身具有生动性、直观性和易懂性的特点,满足了人们对信息的需求,成为信息处理领域中的主要处理对象。尽管数字图书馆图像采集技术以及存储技术也在不断地进步,但如何从大量的图像数据中分析出有价值的内容并对这些海量的图像进行有效的组织,使用户能快速、准确地找到他们感兴趣的信息,成为研究者们研究的热点之一。同时,在大数据时代,用户的信息素养越来越高,对信息的质量要求也不断提高,也对图书馆产生了更新、更高的要求。而图像检索技术的发展,能够更好地满足用户对图像检索匹配的精准度要求,改善用户在图像检索过程中的信息检索体验。总之,对图像检索领域的深入研究将决定大数据时代数字图书馆能否抓住机遇提升自己的发展水平。
近年来,对图像检索需求和检索行为等方面的研究已经取得了丰富的成果,但在如何提高用户图像检索效率的问题上并没有统一合理的解决措施,而图像检索技术恰恰能够弥补这一缺失,现阶段的图像检索技术主要分为基于文本的图像检索和基于内容的图像检索两大类。传统的基于文本的图像检索系统是先对图片信息用关键字进行描述和注释,该技术虽然已经在数字图书馆图像检索领域中有了比较成熟的研究经验,但依靠手工标注会浪费大量的精力并且人为的主观性理解不能充分表达图片的内涵,使得图像检索的结果并不尽如人意。图像文本包含更多的内容,这些丰富的信息需要使用一定的方法和技术进行挖据,采用内容的检索方法不仅可以对图像信息进行客观合理的描述,而且采用相似性度量的手段有效地提高了检索效率,满足了信息时代发展的需求,于是基于内容的图像检索(CBIR)成为数字图书馆研究的主要方向。
本文通过构建一种基于内容的数字图书馆图像资源检索框架,并利用非下采样的Contourlet变换方法对图像资源进行特征提取,提高了图像检索精准度,有效地实现了数字图像资源检索方案,为数字图书馆图像资源的搜索提供了参考价值。
1基于内容的图像检索研究现状
CBIR结合人工智能、认知心理学、面向数据库等方面的学科知识,利用计算机视觉等方面的理论对图像进行自动检索,它不再依赖人工注释,具有节省人力、客观、可建立复杂描述和应用前景广阔等诸多优点,因而该技术被广泛研究。现阶段CBIR主要从以下两个方面进行研究:
1)图像特征提取。图像特征提取就是通过映射或变换将高维信息转换成计算机识别的底层特征的过程,常用的特征包括颜色特征、形状特征、纹理特征等,这些特征要尽可能维数小、獨立性好才能对图像的描述具有更好的相似性。
2)相似匹配和图像特征索引。提取图像特征后,如何采用合理的方法对特征集进行匹配和索引以提高图像检索的精度成为该阶段的主要研究方向,图像匹配和索引大致分为3类技术:相似性测量、聚类分析、相关反馈技术。主要框架概念图如图1所示。
1.1特征提取
特征是图像的一种固有属性。在CBIR检索模型中,对特征向量的提取是实现图像检索的关键步骤之一,也是数字图书馆图像检索领域研究的重点和难点。特征提取的内容主要有基于低层的特征提取和基于高层语义的特征提取两个方面。尽管高层语义特征能够更好地反映图像特征。目前也出现了有关高层语义特征提取的相关研究,但图像低层特征与高层语义特征之间存在着巨大的“鸿沟”,如何从低层特征中提取语义信息并将它们融合在一起仍然处于瓶颈期,所以近几年对图像特征提取的研究主要还是从颜色、形状、纹理等低层特征来进行的。
颜色作为图像内容的底层特征之一,在图像检索领域的研究中得到广泛应用。颜色特征易于从图像中提取,它对图像的变化依赖性较小,可以有效地减少旋转、尺度不一所带来的干扰。除了采用颜色直方图对颜色特征进行提取以外,还可以采用颜色聚合向量、颜色协方差和颜色矩等方式提取。
形状特征是图像的另一个重要特征,包括了部分图像语义信息,形状特征的优点是可以通过算法提取将图像低层特征和高层特征很好地融合在一起,这样就可以得到图像中的检索目标。但形状特征受图像的平移、缩放、旋转等变换的影响,有一定的局限性。有关形状特征的图像检索,可以通过基于边界特征的或基于区域特征这两种方法来提取。
纹理是绝大多数物体表面的固有属性,不同物体表面的组织结构之间的排列规则不相同,人们通过感官视觉可以轻易地分辨不同的纹理。纹理特征能够反映像素在领域空间的灰度分布规律,是对像素在局部区域之间关系的一种度量。针对纹理特征的提取算法已经有了很多研究成果,目前纹理分析的方法基本分为统计法、结构法、模型法和空间/频率域联合分析法这4类方法。
1.2特征的索引与匹配
对数字图书馆图像资源特征提取后,如何将图像数据集进行索引和匹配成为主要的问题,如何解决语义鸿沟问题是这一过程的主要研究难点。相似性度量是图像特征匹配非常重要的组成部分,其承担着判断图像是否相关的重要作用,常用的相似性度量算法有曼哈顿距离、夹角余弦、兰式距离、欧式距离和编辑距离等。每一种相似性度量算法都有其优点也有其应用的局限,对于不同的应用和不同的图像特征,在设计图像检索系统时,相似性度量算法的选择和设计是不可忽视的一步。同时,单一地通过一种相似度测量方法难以产生健壮的、符合人类感知的图像序列,来解决这一问题,研究人员还需要从图像聚类、分类和相关反馈技术进行改进。
聚类和分类适用于处理大规模、非结构化的图像数据。Murthy在对图像检索时提出了K-means聚类并结合分层的方法,首先根据图像颜色特征将其分为不同类别,再利用K-Means算法进行进一步的聚类,分层聚类能够有效忒搞检索速度,K-Means算法通过对向量与其聚类中心之间的距离进行评价,高校准确地获得聚类结果。张永库等人在利用改进颜色聚合向量提取图像颜色特征的基础上,找到服务条件的特征向量作为初始聚类中心,利用分散度与贡献度进行聚类并建立特征索引库,提高了检索的效率。
相关反馈为人们提供了与系统交互的机会,通过反馈检索结果,可以不断提高检索效率。芮勇等人最早提出了相关反馈技术,并将其应用于基于内容的图像检索中。现阶段有关图像检索的相关反馈技术研究方向为减少系统与用户的交互次数,满足用户的检索需求从而提高检索的效率和精度。
2数字图书馆图像资源检索框架构建
本文构建的基于内容的数字图书馆图像检索框架主要由特征提取、相似匹配、反馈输出这3个模块组成。其中对图像资源特征提取,建立特征数据库是构建数字图书馆检索系统的核心,也是本文研究的重点。具体模型框架如图2所示。
系统首先对存储在数字图书馆数据库中的图像进行自动提取特征,然后用多维的特征向量来表示,存入到图像特征数据库。而用户根据自己的检索需要,选择一张或几张样本图像,同样用相同特征提取方法提取特征向量。最后,系统计算出特征数据库中特征向量和提取的样本图像的多维特征相向量的相似距离,根据距离进行排序,再结合相应的索引信息,最终就能获得一定程度上相似的图像。
2.1图像预处理
由于生成图像数据的工具、手段以及图像在传输时会引入噪声,导致图像质量下降。因此,为了提高图像检索效果,在收集图像数据集后,不能直接作为检索图像,本文首先对原始图像灰度处理,然后采用中值滤波的方法对图像进行去噪以减少图像检索的干扰因素。
2.2图像数据库特征提取
特征提取是数字图书馆图像检索系统实现的重要环节,信息提取的完整性直接影响数字图书馆图像检索的效果,纹理特征反映图像本质信息,是近年来较为常用的提取图像信息的方式,本文提出了一种NSCT纹理算法提取图像特征,并通过实验并与同类算法比较分析,该算法具有较好的检索效果,可以为数字图书馆图像检索系统的实现提供参考方案。
2.2.1 NSCT算法
NSCT算法是由Contourlet变换发展而来的,Contourlet变换的基本思想是用近似的“线段”来逼近原始图像,相比小波采用“点”来逼近,可以利用更少的系数来近似原始图像,因而具有良好的各异性和方向性。它很好的解决了二维或更高维奇异性,可以获得更多的高频中各个方向的细节信息。但是,采用Contourlet变换对图形进行分解时,必须对图像信号频繁地进行采样操作,导致分解的过程中不仅缺乏平移不变性还容易信息失真,为此Cunha等人针对Contourlet变换的一些局限性进行改进,提出非下采样的Contourlet变换,在分解和重构过程中,取消了上、下采样操作,具有较好的平移不变性。
NSCT由非下采样的金字塔滤波器NSP和非下采样的方向滤波器组NSDFB实现。如图3所示,图像首先经NSP分解为低通部分和带通部分,然后带通部分通过DFB进行多方向分解,类似的分解步骤可以对低频子带继续迭代滤波,实现对信号的多尺度、多方向分析。因为多尺度分解和多方向分解是相互独立的,所以各高频子带上的方向分解数都可以是2的任意正整数次幂。与Contourlet变换相比,由于剔除了下采样环节,经NSCT分解后的图像与原始图像尺寸一致,在保持平移不变性的同时也保留了更多的图像细节。
3.2结果分析
通过实验结果看出,相比同类算法,本文提出的算法在检索目标图像后,返回前7、10、20、30幅图像的平均查准率要明显高于其它类方法,同时该算法检索五幅图像的平均查全率达到80%,优于Harr小波变换检索40%和文献[16]提出的检索算法59%,不仅使数字图书馆图像检索框架得以有效实现,而且具有较高的检索准确率。
4结语
大数据时代,图书馆新兴的数据分析、知识挖掘、信息处理等服务为数字图书馆带来了历史性的发展机遇,图书馆通过总结数据中存在的规律,挖掘潜在价值,将促进图书馆服务水平的提升。图像检索技术为数字图书馆图像采集与处理提供了新的技术支持和科技创新的平台,能够更好地实现图书馆的服务宗旨。本文构建了数字图书馆图像资源检索框架,并提出了一种基于NSCT的图像纹理检索算法,实验结果显示该算法實用便捷,具有较好的鲁棒性和较高的检索性能,对数字图书馆图像检索的服务模式具有一定参考价值。多种特征融合和相关反馈机制可以进一步提高图像检索精度,将是以后研究的重点。
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/6 0:08:22