标题 | 新一代视频编码标准HEVC帧间预测插值滤波技术 |
范文 | 吴笛++任李 摘要:新一代视频编码标准HEVC(High Efficiency Video Coding-高效率视频编码)目前采用基于DCT的插值滤波技术(DCTBased Interpolation Filter(DCTIF)),与传统滤波器相比,在降低复杂度的同时,其压缩性能获得了较大提升。由于DCTIF技术提案理论部分论述较少,且没有与传统编码滤波技术作实验对比。为此,详细阐述了DCTIF滤波原理,分析了插值计算过程和滤波系数的计算。同时,对H.264/AVC传统滤波以及定向自适应插值滤波器(DAIF)和DCTIF作了对比试验。实验表明,对于各种分辨率的视频,比较H.264/AVC传统插值滤波和定向自适应插值滤波器(DAIF),码率分别平均降低了42.15%和35.47%。 关键词:高效率视频编码;DCT插值滤波;码率; 定向自适应插值滤波器;H.264/AVC DOIDOI:10.11907/rjdk.151899 中图分类号:TP301 文献标识码:A 文章编号文章编号:16727800(2015)008001903 0 引言 新一代视频编码标准HEVC(High Efficiency Video Coding)[1],其核心目标是在H.264/AVC high profile[2]的基础上,压缩效率提高一倍,即在保证相同视频图像质量的前提下,视频流的码率减少50%。在提高压缩效率的同时,可以允许编码端适当提高复杂度。 HEVC根据高分辨率视频的特点,同时兼顾低分辨率视频,采用基于DCT的插值滤波器(DCTIF)。该滤波器具有以下特性:①滤波器能够通过整数位置已重建像素直接通过差值准确地计算出任何分数位置的像素;②由于滤波器采用无级联方式,不仅简化了运动补偿过程,同时也降低了计算复杂度;③滤波器对于更精确分数位置的像素,如1/8,1/12等采用与半像素及1/4像素统一的滤波方式,算法具有较好的扩展性。 1 DCTIF插值滤波计算过程 1.1 分数像素运动估计 目前,通过HEVC测试软件HM11.0[3],对于低复杂度和高效率两种编码模式采用统一的8抽头DCT-IF。任意α∈[-(M-1),M](M为整数),分数位置像素值P(α)为: P(α)=(∑Mm=-M+1Refm×fm(α)+2Q-1)>>Q(1) 上式中,M为滤波器抽头数的一半,Refm为一维滤波的输入,即整数位置像素值组成的向量Ref-M+1, Ref-M+2,…,RefM,fm(α)表示位于Ref0和Ref1之间α分数位置像素的滤波系数,Q为滤波系数所用的比特数。增大Q的值可以更加精确地表示滤波系数,但同时也会增加所需的内存容量和传输带宽。 1.2 插值计算过程 DCTIF是二维可分离滤波器,图1为图像像素亮度分量的四分之一像素运动估计,8抽头DCT-IF滤波示意图,深色部分为整数位置像素,Q=6。 具体步骤如下:(1)水平分数位置像素a、b、c通过一维水平DCT-IF滤波器,由下式计算得到: 式中,x,y表示像素坐标,f(x,y)(14)、f(x,y)(24)、f(x,y)(34)分别表示在14、24、34位置像素的8抽头DCT-IF滤波系数。(2)垂直分数位置像素d(x)、h(x)、n(x)通过一维垂直DCT-IF滤波器,由下式计算得到: 由上述插值计算过程可以看出,与AIF和DAIF对每个像素单独进行滤波计算不同,DCTIF对于任意分数位置像素,均采用同样模式的一维滤波器进行插值计算,且整个滤波器为非级联方式,运算复杂度较小。 2 DCT-IF滤波原理及其滤波系数 假设{pi}, i=-(M-1),…,M为一平滑函数p(x)整数点上的值,则可以通过DCT得到其变换系数Ck: Ck=1M∑Ml=-M+1p(l)cos(2l-1+2M)kπ4M(17) 通过DCT反变换可以得到整数点位置x=-(M-1),-(M-2),…,M的值: p(x)=∑2M-1k=1Ckcosπ(2x-1+2M)k4M(18) 分数位置点的位置可以根据公式19得到: p(α)=∑2M-1k=1Ckcosπ(2α-1+2M)k4M(19) 对于插值滤波具体分为两步: (1)把输入向量Refm通过一变换核函数进行分解表示,其整数位置像素值pm为: pm=∑Ckφk(xm)(20) (2)对公式(20)作DCT反变换,进行尺度为α的相移,即得到α分数位置像素的值pα: pα=∑Ckφk(x0+α)(21) 因此,滤波系数为前向DCT变换矩阵D和DCT反变换矩阵wT(α)的乘积: fT(α)=wT(α)D(22) 为整数位置的像素DCT变换矩阵,其矩阵中的元素由公式(23)得到: dij=1Mcos(2j-1+2M)iπ4M(23) 其中,0≤i≤2M-1,-M+1≤J≤M。wT(α)为α分数位置的像素DCT反变换矩阵,其矩阵中的元素由公式(24)得到: w(α)=1/2,i=0cosπ(2α-1+2M)i2M,1≤i≤(2M-1) (24) 由公式(22)可以看出,DCTIF的滤波系数是固定的,相比AIF和DAIF对于每个分数位置像素不断调整滤波系数,DCTIF运算量减少较多。从公式(22)看,系数计算复杂度较高,但由于在实际测试软件中,能够以无乘法运算实现[6],实际运算只包含位移和加法,所以DCTIF的运算复杂度与AIF和DAIF相比小很多。表1为8抽头滤波系数表,每个滤波系数用6bit表示。这里同时给出了计算滤波系数的运算次数。表中只列举了分数位置α≤1/2时的滤波系数,α>1/2时,根据镜像对称原理计算得到: 3 实验结果及分析 由于测试软件存在整体差异,很难精确评估DCTIF与DAIF两者编码性能的差异。文献[4]说明了在HEVC测试软件中单独开启DCTIF时的编码效率,其结果对整体实验效果影响较小。 图2为WQVGA(416x240)和720p(1280x720)测试序列RD的曲线图(QP=22,27,32,37)[5]。从图中可以看出,对于低分辨率格式的视频,在相同PSNR值下,DCTIF码率较DAIF和H.264/AVC最大分别降低了26%和39%,平均分别降低了22.3%和31.8%;对于高分辨率视频,DCTIF码率较DAIF和H.264/AVC最大分别降低了48%和56%,平均降低了43%和52.5%。 图2 WQVGA和720p序列RD曲线图(low delay) 表2为与DAIF比较各分辨率视频码率减小百分比情况。CS1、CS2为两种编码配置设置,分别对应随机访问点(random access)即增加I帧数目,和低延时算法(low delay)[6]。 表2中,在random access和low delay两种编码配置条件下,针对所有测试序列,其码率平均减小了43.72%和35.47%;其中,B类(1080p)和C类(832x480)序列码率降低最为明显,分别为48.17%、51.61%(CS1)和38.33%、34.45%(CS2);BQTerrace序列码率降低最高,达到了58.65%和54.25%;码率降低最少的为D类序列(416x240),其中BQSquare序列码率降低最少,但也达到了40.93%和19.17%。通过表2可以看出,DCTIF对于各种分辨率视频,无论是在random access或low delay编码条件下,其编码效率都有较大提升。 4 结语 比较AIF及DAIF,DCTIF采用固定系数进行插值运算,不需要针对每个子像素进行最佳滤波系数选择,再加上DCTIF在测试软件中实现了无乘法运算,只有位移和加法,并且对滤波系数进行了优化,减少了运算次数,降低了算法复杂度。实验证明,在random access或low delay编码条件下,其码率分别降低了43.72%和35.47%,对于高分辨率视频编码效率提升尤为明显。对于4K(2560x1600)的超高分辨率视频,DCTIF编码效率有所降低。因此,进一步提高针对超高分辨率的视频编码效率是未来的研究方向。 参考文献: [1] WIEGAND T,OHM J,SULLIVAN G, et al.Special section on the joint call for proposals on high efficiency video coding (HEVC) standardization[J].IEEE Trans on Circuits and Systems for Video Technology, 2010,20(12):1661. [2] WIEGAND T,SULLIVAN G,BJOTEGAARD G,et al.Overview of the H.264/AVC video coding standard[J].Circuits and Systems for Video Technology, 2003,13(7):560567. [3] Svn_HEVCSoftware Revision 4529: /tags[EB/OL].https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/. [4] HAN W J,MIN J,KIM I K, et al.Improved video compression efficiency through flexible unit representation and corresponding extension of coding tools[J].IEEE Trans on Circuits and Systems for Video Technology, 2010,20(7):1709. [5] BJONTEGAARD G.Calculation of average PSNR differences between RD curves[S].13th VCEG Meeting, Austin, 2001,VCEGM33. [6] ISO/IEC JTC1/SC29/WG11.Joint call for proposals on video compression technology[S].Proc 91st MPEG Meeting, 2010. (责任编辑:黄 健) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。