网站首页  词典首页

请输入您要查询的论文:

 

标题 基于固视微动与初级视皮层神经机制的轮廓检测模型
范文

    万术娟 林川 李福章

    

    

    

    摘? 要:已有研究表明,生物视觉系统中第二视觉通路主要是基于固视微动响应特性来完成视觉信息的特征提取.受此启发,提出一种基于固视微动与初级视觉皮层神经机制的轮廓检测模型,以注视中心为原点,通过不同角度下偏移的高斯一阶导滤波器模拟视觉神经细胞的固视微动特性,其中偏移量由图像的局部特征信息计算得到;然后将不同偏好方向下多个角度偏移模板的滤波能量与注视中心的响应能量竞争得到经典感受野的最优能量响应;最后通过高斯差分函数对最优能量响应进行纹理抑制并获得最终的目标轮廓输出.BSDS数据集的定性和定量实验结果表明,所提出的检测模型能够获得更完整更连续的轮廓特征,具有较高的性能评测指標.

    关键词:轮廓检测;固视微动;初级视觉皮层;纹理抑制

    中图分类号:TP391.41? ? ? ? ? ? ? DOI:10.16375/j.cnki.cn45-1395/t.2020.04.011

    0? ? 引言

    在计算机视觉领域中,目标的轮廓信息作为中层视觉主要特征之一,是目标识别[1]、图像分割[2]等高级任务的重要基础,在运动分析[3]以及对象跟踪[4]等领域也得到了广泛的应用.在仿生型轮廓检测研究中,主要通过研究哺乳动物初级视觉皮层V1区的视觉感知机制,来解决从复杂场景中提取到目标真实轮廓这一难题.V1区神经元中心区域(经典感受野)对外界刺激产生兴奋性响应,其周边广大区域(非经典感受野)对中心响应能量产生强烈的抑制性作用.受该机制启发,Grigorescu等[5]通过二维gabor函数和高斯差(DOG)函数分别模拟简单细胞的经典感受野和非经典感受野,并提出了各向同性抑制和各向异性抑制两种轮廓检测模型,为后续基于生物视觉特性的轮廓检测方法研究提供了深刻的启发.基于初级视觉皮层中同时存在方向选择性和非方向选择性的周边抑制神经元机制, Long和Yang等[6-7]进一步改进了方向选择性模型并提出一种方向选择性和非选择性的融合方法,结果表明这种融合模型比单独一种方向选择性模型或者非选择性抑制模型表现更出色.然而只考虑亮度或方向特征的视觉特征信息线索过于单一,往往导致部分细节轮廓的丢失.因此,Yang等[8-9]结合了方向(OI)、亮度(LI)、亮度对比度(CI)等多种特征线索,并将这些特征线索有效地融合,使得在复杂场景中也具有较高的轮廓检测性能.视觉细胞感受野的动态特性是学者们一直以来的重点关注之一,潘亦坚等[10]将改进的神经元激活函数sigmoid提取出感受野的局部尺度信息用于调制非经典感受野的抑制响应,取得较好的轮廓检测性能.相比同心圆拮抗式感受野的检测模型,Sang和Zeng等[11- 12]发现非经典感受野并不是严格的同心圆结构,他们认为抑制区域存在于感受野的两侧,因此,他们提出蝶形的抑制模型,在保留轮廓的同时有效抑制更多的背景纹理.另一部分学者,考虑到人眼固视状态下的微动特性,在传统非经典感受野模板的基础上等间隔地选取8个方位的子区域,并通过每个角度方位的子区域置换数值的方法模拟固视微动[13-15],获得较好的轮廓检测效果.

    上述模型对固视微动的模拟都是基于非经典感受野模型的改进,未考虑固视微动对经典感受野的影响.因此,本文在现有经典感受野仿生模型的基础上,以注视中心为原点,结合由局部特征信息计算得到的偏移量对高斯一阶导滤波器进行多个角度偏移模拟视觉细胞的微动特性,并与模拟注视中心的响应能量竞争得到经典感受野的最优能量图;然后由高斯差分函数(DOG)模拟的非经典感受野对最优能量图进行抑制得到轮廓特征图.为了检验所提出模型的性能,通过权威的BSDS数据集进行定性和定量的实验测试,并与同类仿生轮廓检测模型进行效果的对比.结果表明,本文模型能够较准确地区分目标轮廓和背景纹理,在当前仿生轮廓检测模型中具有较好的鲁棒性.

    1? ? 模型

    当停止眼球的所有运动,静止的图像将变得模糊不清并突然消失[16].可见,眼球的微动对人类视觉的产生有着至关重要的作用.受此启发,将高斯一阶导滤波器的注视中心向4个不同角度进行微动,模拟视觉细胞固视微动机制对视觉信息的响应过程.本文模型的检测流程如图1所示,输入图像分别与模拟注视中心的滤波器O以及4个不同角度偏移下的滤波器a、b、c、d卷积并通过竞争机制得到最优能量图,最优能量图经过DOG函数抑制纹理后获得轮廓特征图.最后,通过非极大值抑制方法对轮廓特征图进行特征信息的细化.

    1.1? ? 结合固视微动的经典感受野响应

    在大脑中,根据视觉皮层的结构和生理功能的差异将其划分为V1、V2、V3、MT等多个脑区[17] ,V1区作为大脑视觉信息处理的第一站,具有检测边缘、线条等视觉要素的功能,并且在处理视觉信息的过程中表现出明显的偏好方向选择性.因此,用高斯一阶导函数来模拟具有偏好方向选择性的初级视觉皮层神经元:

    其中:[θ]表示神经元的偏好方向参数[(θ∈[0, π))]; [γ]表示感受野长短轴比例的常数([γ=0.5]);[σ]为高斯函数中的标准偏差,其决定感受野的大小.

    实际上,人类视觉系统对于静止不动的物体,主要是通过眼球的固视微动机制来判断物体的远近距离并且增强物体的边缘响应[18].因此,本文基于固视微动的生理机制,通过变换高斯一阶导模板坐标,构建具有微动特性的高斯一阶导新模型.高斯一阶导新模型的坐标变换方式如下:

    [D]表示高斯一阶导模板坐标的偏移量,在[x]和[y]方向设定相同的偏移量.k表示偏移量与感受野大小的相关程度,设定[k=1]. [g(x, y)]为输入图像[Ix, y]经过高斯函数(公式(2),其中[γ=1])平滑并归一化之后的结果.高斯函数滤波一方面是为了去除噪声,使偏移量的计算更精准;另一方面考虑到偏移量由局部特征决定更符合生理特性.

    在二維坐标中,有4个象限,因此,高斯一阶导模板坐标偏移的角度就有4个,向坐标的正方向偏移用“+”号表示,反之则用“-”号.将偏移量的角度代入公式(5)(分别为[xd1=x+D],[yd1=y+D];[xd2=x-D],[yd2=y+D];[xd3=x-D],[yd3=y-D];[xd4=x+D],[yd4=y-D])就可表示朝各个角度偏移距离[D]的坐标变换.图2以模板中心坐标为例,展示了朝各个角度偏移后的坐标变化.

    在初级视皮层,结合固视微动特性的经典感受野模型通过竞争机制,得到最优响应:

    1.2? ?非经典感受野响应

    视觉细胞的非经典感受野存在于经典感受野的外圈范围,其直径约为经典感受野直径的3~6倍[19].非经典感受野对于经典感受野的响应能量主要表现出一定程度上的调制作用.传统的非经典感受野模型采用DOG函数[20]来模拟抑制作用随距离的增大而减小.DOG函数表达式如下:

    2? ? 实验结果与分析

    为了表达更简便,在后续的实验及描述中将通过MPV模型来表示所提出的检测模型.通过轮廓检测领域内权威的BSDS数据集,基于通用的F-measure性能评测体系[21]对所提出MPV模型的性能进行定性和定量的实验测试(容差参数maxDist=0.007 5).其中,F-measure的具体计算如下:

    其中:[TP]表示被正确检测的轮廓像素个数;[FP]表示被错误检测的轮廓像素个数;[FN]表示被遗漏检测的轮廓检测像素个数;[P]表示精确率(Precision);[R]表示回归率(Recall);[F]为二者的调和平均,表示模型的检测轮廓与真实轮廓(Ground Truth)之间的相似性.通常,F-measure评判方法对应有3个标准的性能指标:ODS(整个数据集取最优阈值)、OIS(每幅图像取最优阈值)和AP(平均精确率).

    本文模型(MPV)的参数组合[σ∈{1.0, 1.5, 2.0, 2.5}],[θ∈{8, 12, 16}],[α∈{0.9, 1.0, 1.1, 1.2}],并通过在Berkley分割数据集(BSDS300/500)的实验测试,取得最优参数为[σ=1.5],[θ=8],[α=1].为了突出固视微动在提取图像轮廓信息中的重要性,将文献[5](ISO(Div))中没有模拟固视微动机制的检测轮廓图与本文模型(MPV)的检测轮廓图作对比,如图3所示.图3(a)为自然图像,图3(b)为真实轮廓(Ground Truth),图3(c)为 ISO(Div)模型检测轮廓图,图3(d)为本文模型(MPV)检测轮廓图.实验结果表明,在固视微动的作用机制下,检测出更多的有效信息,使弱轮廓得到增强,保留的轮廓更完整.

    3? ? 结论

    在图像处理及计算机视觉领域里,轮廓检测作为一项基本研究任务,如何精准高效地区分目标轮廓和背景纹理一直是研究的重点和难点.近年来,眼动在研究上取得新的研究成果,为仿生型轮廓检测提供了新的原理和方法.一直以来,学者们主要考虑固视微动生理机制在非经典感受野区域对纹理抑制的作用效果,而忽略了在视觉细胞经典感受野区域的应用.因此,本文通过图像的局部信息计算得到高斯一阶导滤波器的偏移量,并建立具有固视微动特性的高斯一阶导新模型,有效地模拟了固视微动生理机制在视觉细胞经典感受野的作用机制.实验表明,引入了固视微动生理机制的高斯一阶导新模型能够检测更多的轮廓细节,抑制更多的背景纹理,表现出更优的检测性能.实际上,固视微动是一个复杂的生理过程,这一生理现象对视觉各层面都产生直接的影响.然而,本文只在初级视觉皮层考虑了环境周边信息和偏移角度因素对固视微动的影响,没有从时间的角度研究固视微动的动态变化,构建的模型较理想化.其他因素(如颜色、亮度对比度、时间等)对固视微动的影响,以及固视微动在其他视觉层面对视觉信息处理所做的贡献都有待进一步研究.

    参考文献

    [1]? ? ?TANG Q L,SANG N,ZHANG T X. Extraction of salient contours from cluttered scenes[J]. Pattern Recognition,2007,40(11):3100-3109.

    [2]? ? ?闫夏,谭光兴,林川.基于免疫聚类算法的MRI膝关节图像分割[J].广西科技大学学报,2015,26(1): 70-74.

    [3]? ? ?TANG Q L,SANG N,ZHANG T X. Contour detection based on contextual influences[J]. Image & Vision Computing,2006,25(8):1282-1290.

    [4]? ? ?TANG Q L,SANG N,ZHANG T X. A neural network model for extraction of salient contours[C]// Proceedings of the Second International Conference on Advances in Neural Networks. Advances in Neural Networks – ISNN 2005:316-320.

    [5]? ? ?GRIGORESCU C,PETKOV N,WESTENBERG M A.Contour detection based on nonclassical receptive field inhibition[J]. IEEE Transactions on Image Processing,2003,12(7):729-739.

    [6]? ? ?LONG L,LI Y J. Contour detection based on the property of orientation selective inhibition of non-classical receptive field[C]// 2008 IEEE Conference on Cybernetics and Intelligent Systems. IEEE:1002-1006.

    [7]? ? ?YANG K F,LI C Y,LI Y J. Potential roles of the interaction between model V1 neurons with orientation-selective and non-selective surround inhibition in contour detection[J].Frontiers in Neural Circuits,2015,9:30.

    [8]? ? ?YANG K F,LI C Y,LI Y J. Multifeature-based surround inhibition improves contour detection in natural images[J]. IEEE Transactions on Image Processing,2014,23(12):5020-5032.

    [9]? ? ?YANG K F,LI Y J. A coutour detection model based on surround inhibition with multiple cues[C]// Chinese Conference on Pattern Recognition,Beijing,China, September 24-26,2012. Berlin:Springer Heidelberg,2012:145-152. http://dx.doi.org/10.1007/978-3-642-33506-8_19.

    [10]? ?潘亦坚,林川,郭越,等.基于非经典感受野动态特性的轮廓检测模型[J].广西科技大学学报,2018,29(2):77-83.

    [11]? ?桑农,唐奇伶,张天序.基于初级视皮层抑制的轮廓检测方法[J].红外与毫米波学报,2007,26(1): 47-51,60.

    [12]? ?ZENG C,LI Y J,YANG K F,et al. Contour detection based on a non-classical receptive field model with butterfly-shaped inhibition subregions[J]. Neurocomputing,2011,74(10):1527-1534.

    [13]? ?林川,李亞,曹以隽.考虑微动机制与感受野特性的轮廓检测模型[J].计算机工程与应用,2016,52 (24):210-216.

    [14]? ?窦燕,康锦华,王丽盼.结合人眼微动的新型非经典感受野模型[J].光学学报,2019,39(3):136-143.

    [15]? ?LIN C,ZHANG Q,CAO Y. Multi-scale contour detection model based on fixational eye movement mechanism[J]. Signal,Image and Video Processing,2020,14(1):57-95.

    [16]? ?DITCHBURN R W, GINSBORG B L. Vision with a stabilized retinal image[J]. Nature,1952,170(4314): 36-37.

    [17]? ?WALLISCH P,MOVSHON J A. Structure and function come unglued in the visual cortex[J]. Neuron, 2008,60(2):195-197.

    [18]? ?毛晓波,陈铁军.仿生型机器视觉研究[J].计算机应用研究,2008,25(10):2903-2905,2910.

    [19]? ?寿天德. 视觉信息处理的脑机制[M].合肥:中国科学技术大学出版社,2010.

    [20]? ?刘建立,沈菁,王蕾,等.织物纹理的简单视神经细胞感受野的选择特性[J].计算机工程与应用,2014, 50(1):185-190.

    [21]? ?MARTIN D R, FOWLKES C C,MALIK J. Learning to detect natural image boundaries using local brightness,color,and texture cues[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004,26(5):530-549.

    (责任编辑:黎? 娅)

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/10 16:04:28