标题 | 基于协方差矩阵的压缩感知跟踪算法 |
范文 | 黄庆俊+何儒汉![]() ![]() ![]() 摘要:压缩感知是信号处理领域的新理论,用于目标跟踪算法时可在大量底层特征中提取出少量重要信息,减少计算量,提高算法速度。传统的基于压缩感知的跟踪算法,为了保证算法速度,对压缩后的特征简单建模,准确性还有待提高。提出一种基于协方差矩阵的压缩感知跟踪算法,先利用压缩感知原理获取压缩后的Haar特征,再利用协方差矩阵融合Haar特征区域内的底层多维特征,以此构建目标模型,并通过搜索当前目标区域的邻域,利用流形空间上的距离度量算法匹配最佳目标,从而提高算法准确性。关键词:压缩感知;特征融合;协方差矩阵;Haar特征;LogEuclidean黎曼测度DOI:10.11907/rjdk.162874 中图分类号: TP312 文献标识码: A 文章编号: 16727800(2017)004003104 0引言 压缩感知(Compressive Sensing,CS)理论是信号处理领域最近几年才提出的新理论[13]。信号处理包括4个基本过程:采样、压缩、传输以及恢复。压缩感知理论将采样与压缩过程结合在一起,在采样过程中对信号进行压缩,可以低于香农定理的频率获取采样数据,简化信号处理过程,因而得到了信号处理领域的广泛关注。同时,该理论在应用科学的诸多领域,如统计学、信息学、编码领域等也有着相当重要的应用,推动了这些领域的基础研究发展。 目标跟踪是计算机视觉等热点研究领域的核心课题之一[47],其主要过程可分为目标建模和目标匹配。使用大量底层特征建模目标可以使匹配结果更准确,但会牺牲算法效率。压缩感知理论在信号采集过程中提出的新方法为目标跟踪领域带来了启发。Zhang等[8]在基于CS理论的实时跟踪系统研究,使用压缩感知理论对高维原始特征集降维,减少底层特征计算量,从而提高算法速度。另外,在目标跟踪领域,基于协方差矩阵的跟踪算法获得了广泛研究[1016]。协方差矩阵可以融合多种底层特征,同时保持低维特性,从而减轻了目标匹配过程的计算复杂度,保持了算法效率与鲁棒性之间的平衡。 传统的基于压缩感知的跟踪算法(Compress Sensing Tracking,CT)利用压缩感知理论对原始数据中大量的Haar特征采样压缩,得到压缩后的特征。随后简单计算Haar特征的区域积分作为特征值,以保证算法具有较快的处理速度。最后通过构造多组贝叶斯分类器来提高跟踪结果的准确性。由于特征模型较为简单,算法面对复杂场景如光照、干扰等状况不能保持较好的鲁棒性。基于此,提出一种基于协方差矩阵的压缩感知跟踪算法。使用协方差矩阵对压缩后的Haar特征进行进一步处理,强化目标模型的表征能力,从而提高传统压缩感知跟踪算法的准确度。1基于协方差矩阵的压缩感知跟踪算法原理及实现在CT基础上,使用协方差矩阵描述算子融合多种底层点特征构造基本特征模型,改善算法适应能力,基本过程如下: ①应用协方差矩阵构造压缩后的特征模型;②对搜索区域的待定目标计算相应的匹配模型;③根据匹配模型选择合适的相似度算法,以决定最优的待定目标;④更新特征模型,转②继续跟踪或者结束算法。1.1壓缩特征提取 Haar特征是计算机视觉等领域中常用的特征描述方法,若直接使用Haar特征来构建特征模型,则对于一个20*20的目标区域,可选的特征矩形将超过80 000个。尽管计算简单,但由于数量较大,使得最终仍需要较多计算时间。因此,结合压缩感知理论构造特定的压缩矩阵,当选择合适的观测矩阵后,可以减少大量不必要的计算量,同时保留必要的Haar特征。 假设X={X1,X2…XN}表示目标区域内所有的Haar特征,V={V1,V2…VM}为降维后的特征,N>>M。压缩过程为V=RX。 采用传统压缩感知跟踪算法[8]中使用的随机测量矩阵:rij=〖JB({〗1 概率1/s0 概率1-1/s在公式(1)中,当s取值为2或3时,所构造出的测量矩阵满足Johnson-Lindenstrauss推论。最后得到的矩阵会非常稀疏,很方便进行后续处理。算法中,s取值为m/4,最终的低维观测值中不超过3个非零值,即用不超过3个矩形区域的组合(称为Haarlike特征)对目标区域建模,从而大大减轻了计算量。1.2协方差矩阵特征计算传统的压缩感知跟踪算法在获取压缩后的矩形特征后,对矩形区域内的单一点特征取积分值,以此构建目标模型。该处理可以使算法具有很高的速度,但鲁棒性不够优秀。为提高鲁棒性,使用协方差矩阵进一步处理压缩后的区域特征,融合区域内的多种点特征,同时保持较低维度。选定Haar特征组合即Haarlike特征后,可以得到2~3个矩形特征区域。对每一个矩形区域,提取区域内的点特征(坐标、颜色分类、梯度等),建立相应的协方差矩阵模型。设I为视频序列的某一帧图像,R是待定目标区域,F是对当前目标区域的建模,F(x,y)=(I,x,y),即F是对当前图像上目标区域内所有像素的某种变换,表示区域中所有像素的d维底层特征向量,C表示计算的d×d的协方差矩阵,即:其中,μ表示区域内底层特征的均值向量,根据该公式可以得到区域R上的协方差矩阵。该协方差矩阵融合了d维的底层特征,底层特征可以任意选择每个像素点的位置、梯度、颜色以及其它点特征。协方差矩阵中的每一个分量都表示相应的两个底层特征之间的关联信息。实际过程中,通过公式(2)计算协方差矩阵的过程往往过于繁琐,计算速度相对较慢,文献[4]提出的一种基于整体图像的积分图快速计算方法可以提高运算速度。同时考虑到目标运动过程中的时空连续性,在计算积分过程中只需对局部区域进行计算,从而进一步提高计算速度。 1.3目标匹配方法 在传统的压缩感知跟踪算法中,取得目标模型后,在目标区域周围采样构造贝叶斯分类器,利用分类器对待定目标进行匹配识别。尽管需要多次采样计算,但由于目标模型相对简单,总计算量并不大。当选择使用协方差矩阵来构造目标模型时,由于协方差矩阵本身计算量较大,采样后的总计算量过于庞大,即使能完成跟踪任务,算法已不具有实际应用意义。因此,有必要选择其它方法来匹配目标。由于协方差矩阵模型已经融合了多种底层特征,因此可以简单地通过计算目标模型之间的距离来判断相似度。协方差矩阵是个正定矩阵,欧式空间中的相关算法并不适用于协方差矩阵,可以采用黎曼流形领域中的距离测度方法计算协方差矩阵之间的距离。文献[17]中的log-Euclidean度量方法计算量相对较少,计算速度相对较快,因此本文采用该方法。首先对正定矩阵X进行奇异值分解,得到X=U*S*UT,随后对X进行log运算,可以得到:对每个待定目标,计算目标的Haarlike特征的协方差矩阵值,应用流形距离度量算法,计算目标Haarlike特征的协方差矩阵与当前目标Haarlike特征的协方差矩阵之间的流形距离。在Haarlike特征中选择2~3个矩形特征,最后会得到2~3个协方差矩阵距离。将这些距离值累加,最终可以得到待定目标与当前目标之间的相似度关系。最后选择最接近的待定目标作为最终结果。在传统的压缩感知跟踪算法中,通过使用多种压缩后的HaarLike特征构造分类模型,利用多个分类模型同时对待定目标进行分类,以提高识别准确性。本文中同样采用多个Haarlike特征,分别计算对应特征下的流形空间距离,将多个距离累加,得到最终的待定目标相似度,并以此选择最优目标作为跟踪结果。〖JP+2〗考虑到在实际应用场景中,并不是所有特征都对跟踪具有正反馈效果,如某些特征可以很好地匹配人物的正面姿态,而某些特征则对侧面姿态具有更好的识别能力。因此,可以在跟踪过程中为不同特征赋予不同权重,以更好地适应人物当前的状态变化。特征权重调整过程如下:〖JP〗(1)初始化M个Haarlike特征,每个特征的权值均为1/M。(2)在T帧时,计算当前目标Haarlike特征的协方差矩阵模型。(3)对搜索窗的每一个待定目标计算相应的M个Haarlike特征的协方差矩阵模型。(4)for i=1:M 计算待定目标与当前目标的第i个Haarlike特征协方差矩阵之间的流形距离 若距离超过阈值,则其它M-1个Haarlike特征的权值增加1/M end(5)归一化权重,计算加权距离值,取距离最近的待定目标作为最终目标。同时以当前权值作为当前M个Haarlike特征的权重。最后整个算法的主要流程如图1所示。1.4 协方差矩阵特征模型更新假设当前已有前T帧视频序列的目标模型,需要获取下一帧所需要的目标模型。最直观的想法是使用已有目标模型的均值作为新的目标模型,由于协方差矩阵事实上是黎曼流形中的一点,因此可以使用黎曼流形中相应的均值计算方法。Li等[17]提出了一种基于log-Euclidean黎曼测度的均值算法。该算法只需经过基于矩阵的对数和指数运算即可得到协方差矩阵均值。相比于其它方法,该算法计算量少,计算速度快。其公式如下: 1.5基于協方差矩阵的压缩感知跟踪算法实现 (1)应用协方差矩阵构造压缩后的基本特征模型。在利用CS理论选择2~3个随机矩形作为特征后,计算相应矩形区域的协方差矩阵;计算协方差矩阵时,选择每个像素的位置、梯度和颜色值来构造7*7的CM;重复操作以得到多个压缩后的特征模型。本文选择重复100次。 (2)计算多组Haarlike特征的协方差矩阵特征值。 (3)检索目标,确认最优结果。对每一个待定目标,计算相应Haarlike特征的协方差矩阵值,根据流形距离度量算法计算多个流形距离,应用加权距离算法计算待定目标距离,最终确定最优目标。 (4)若需要继续跟踪,则返回(2);否则,算法结束。 2实验 对比算法包括传统的压缩感知算法(CT)、基于局部搜索的协方差矩阵跟踪算法(COV)和基于全局搜索的协方差矩阵跟踪算法(GLOCOV)以及本文算法(WCTCOV),使用trackerbenchmark平台的标准视频帧序列basketball进行实验。 实验中,CT算法在首次发生干扰后丢失目标,且随后不能自动找回;由于全局范围内干扰,GLOCOV多次丢失目标,但可以将其自动找回;COV算法则仅在局部搜索目标,跟踪稳定,准确性不高;本文算法保持稳定,且效果更好。实验过程如图2所示(彩图见封三),青色为人工标定的结果,红色为本文算法结果,绿色为CT跟踪结果,蓝色为COV跟踪结果,黑色为GLOCOV跟踪结果。 图3所示(彩图见封三)为每一帧的目标与人工标定目标的重合率。如图所示,CT重合度很快下降,丢失目标,随后跟踪失败;WCTCOV算法始终保持较高的重合度,具有较好的鲁棒性;COV与GLOCOV由于仅有搜索区域的差别,两者在局部有相同的匹配结果,即图中两者多次重合;GLOCOV在全局搜索目标,当干扰较多时,会匹配错误结果丢失目标,但可以快速将其找回。 表1所示为4种算法的有效目标占比,以及有效目标的平均重合率。其中有效目标占比表示与标定目标有重合的帧数与视频序列长度的比值。重合率表示重合区域占标定目标的百分比范围。有效目标占比可以直观地说明算法跟踪对目标的识别能力,显然,应用协方差矩阵后,算法可以更多地识别到目标。重合率可以说明算法跟踪结果是否足够准确,显然重合率高的更为准确。因此,本文算法对目标识别的准确度同样相对较高。 通过实验可以得出结论,相较于原始的压缩感知算法,使用协方差矩阵后,算法对于干扰、目标快速运动等状况有了更强的适应能力,可以更多、更准确地检索到目标。尽管如此,在实验中当干扰超过一定限度后,本文算法同样会丢失目标。当前算法通过在上一帧目标周围的局部范围内搜索目标,以提高算法搜索速度,当目标超过该局部范围时,算法并不能正确地寻找到目标。因此,当遮挡出现时,目标丢失。在后续工作中,可以在目标丢失时适当增加搜索范围,从而在一定程度上提高算法鲁棒性。 参考文献:[1]DO T T,GAN L,NGUYEN N,et al.Sparsity adaptive matching pursuit algorithm for practical compressed sensing[C].Asilomar Conference on Signals,Systems and Computers,2008:581587. [2]BARANIUK R,DAVENPORT M,DEVORE R,et al.A simple proof of the restricted isometry property for random matrices[J].Constructive Approximation,2008,28(3):253263. [3]EMMANUEL C,LAURENT D,DAVID D,et al.Fast discrete curvelet transforms[J].Multiscale Modeling & Simulation,2006,5(3):861899. [4]YILMAZ A,JAVED O,SHAH M.Object tracking: a survey[J].Acm Computing Surveys,2006,38(4):8193. [5]侯志强,韩崇昭.视觉跟踪技术综述[J].Acta Automatica Sinica,2006,32(4):603617. [6]K CANNONS.A review of visual tracking[R].Technical Report.Computer Science and Engineering,York University,2008. [7]YANG H,SHAO L,ZHENG F,et al.Recent advances and trends in visual tracking: a review[J].Neurocomputing,2011,74(18):38233831. [8]ZHANG K,ZHANG L,YANG M H.Realtime compressive tracking[C].Computer Vision,2012:864877. [9]TUZEL O,PORIKLI F,MEER P.Region covariance: a fast descriptor for detection and classification[C].Computer VisionECCV 2006,European Conference on Computer Vision,Graz,Austria,2006:589600.〖ZK)〗[10]〖ZK(#〗GUO Q,WU C,FENG Y,et al.Conjugate gradient algorithm for efficient covariance tracking with JensenBregman LogDet metric[J].Computer Vision Iet,2015,9(6):814820. [11]WANG D,LI L,LIU W,et al.Bayesian covariance tracking with adaptive feature selection[M].Advances in Neural Networks – ISNN 2014,2014:516523. [12]XIE Y H,WU C D.Covariance tracking algorithm on bilateral filtering under lie group structure[J].Applied Mechanics & Materials,2014 (6):682686. [13]ROMERO A,LACASSAGNE L,GOUIFFS M,et al.Covariance tracking: architecture optimizations for embedded systems[J].EURASIP Journal on Advances in Signal Processing,2014(1):115. [14]顧鑫,王华,李喆,等.基于积分协方差矩阵的粒子滤波目标跟踪[J].激光与红外,2014(12):13841386. [15]谢英红,吴成东.基于投影群和协方差流形双重建模的目标跟踪[J].仪器仪表学报,2014,35(2):374379. [16]芦鸿雁,赵方舟.基于协方差描述子的红外目标粒子滤波跟踪算法[J].微电子学与计算机,2013,30(4):7174. [17]LI X,HU W,ZHANG Z,et al.Visual tracking via incremental logeuclidean riemannian subspace learning[C].Proc of IEEE Conference on Computer Version and Pattern Recognition,2008:18(责任编辑:黄健) Abstract:Compressed sensing is a new theory in the signal processing.It can extract the important features from lots of lowlevel features when it is used for object tracking.Traditional tracking algorithm based on compressed sensing used a simple target model to keep the speed.To improve its accuracy,a compressed sensing tracking algorithm based on covariance matrix has been proposed.First,Haar features are compressed.by compressed sensing.Second,based on covariance matrix,a new target model with more lowlevel features is obtained.Then,the neighborhood of the current target is searched and the best target is matched using the manifold distance measure.Finally,the proposed algorithm gets a better accuracy.Key Words:Compressed Sensing; Feature Fusion; Covariance Matrix; Haar Feature; LogEuclidean Riemann Measure |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。