SVC+SFU融合的云视讯技术研究与方案应用
潘士勇
摘 要:本文从视讯技术的发展出发,历经了以MCU架构为代表的早期视讯技术,到以SVC+SFU融合架构为代表的新型云视讯技术,并详细解析了SVC和SFU的技术细节,最后综合技术架构优势,在当前政策热点线上远程教学场景中进行了实际应用与总结。
关键词:SVC;SFU;云视讯;在线教学
1 技术背景
在当前疫情下,我们看到云视讯技术大规模应用到远程办公,远程教育,远程医疗等场景。而视频会议技术在这几年的发展中,经历了比较大的变革,即从硬件MCU架构,发展成当前主流的云视讯技术方案。
在传统的视讯技术时代,整体以硬件MCU架构[1]为主,主体采用H.264 AVC单层编码,结合H323/SIP协议[4]实现多方通讯。MCU架构出现的相关长时间内,在硬件视频会议中应用非常广泛,但是整体需要购买一套硬件MCU设备加视频会议硬件终端,拥有成本高。
MCU架构下,服务端需要对接收到的多路视频进行全编全解,存在很大的性能瓶颈,对于网络链路,通常需要专线来支撑,无法得到大规模应用。随着互联网的发展以及音视频技术的成熟,带来了视讯行业的变革,从传统MCU向云视讯[2]进行跨越。下面將针对云视讯的关键技术进行细化的解析及方案应用说明。
2 技术解析
(1)SFU(全称Selective Forwarding Unit,选择性转发单元),是一种通过服务器来路由和转发音视频流的技术。SFU形如一个媒体流路由器,接收终端的音视频流,按需转发给其他终端,SFU的拓扑和功能模型如下图1所示:
如上图1所示,4个终端分别为A1~A4,它们之间要互相进行视频通话,只需要将自己本地的一路流向服务器推送,然后按需订阅自己所关注的其他终端的视频流,如A1/A4关心其他3个终端的视频流,则将其他3方的视频流全部订阅并拉到本地进行解码合成处理,而A2只关心A1的视频流,则只需要订阅A1这一路流即可,实现按需订阅,整体框架上更加灵活。SFU转发服务器全程不需要对视频流进行编解码,只是选择性转发,整体负载也较轻,更加容易实现大规模应用。
(2)SVC(全称Scalable Video Coding,可适性视频编码)在H.264基础上扩展了语法和工具集,支持具有分级特性的码流。通过SVC机制编码产生的码流包含一个或多个可以单独解码的子码流,各子码流具有不同的码率,帧率和空间分辨率。在终端能力、系统资源、网络状态事先不可知的情形下,可以更好地发布视频流,实现在满足码流具有灵活可伸缩性的同时,也保证高的编码效率。
(3)以SVC+SFU融合架构为代表的新型视讯技术。终端采用SVC编出多层视频流,服务器利用SFU转发替代传统MCU二次编解码方法。从而实现在弱网络环境下利用时域可分级,抛弃部分时域级实现网络适应性。一方面弱化对中心节点的要求,一方面弱化对网络的强依赖,从而推动了云视讯的广泛应用。
SVC+SFU融合技术模型如下图所示,发送PC共享的是一路视频流,按SVC规则编码为三层发送给SFU转发服务器,SFU根据接收端的情况,发现接收PC网络状况不错,于是将0、1、2三层都发给接收PC;发现接收Pad网络不好,则只将0层发给接收Pad;发现接收Phone网络较好,但性能一般,则将0、1层发给接收Phone。通过SVC+SFU相融合的技术方案,从而实现可以适应不同的网络环境和终端类型。
3 架构优势
采用先进的SVC分层编解码+SFU选择性转发技术,实现高质量且流畅的音视频互动方案:
(1)终端采用先进的SVC柔性分层编码技术,以及优异的抗丢包能力,自动适应学校多种网络环境。支持N方清晰、流畅、实时的音视频互动,在55%丢包的情况下声音能听清,在35%丢包的情况下视频依然流畅。
(2)服务端采用SFU选择性转发技术,只对数据进行转发,不对数据进行解密、解码,数据只在发送端和接收端解密和解码。既保障数据传输过程中的保密性,同时也可以减轻云端的处理瓶颈,减少远程双方的延时,最好的情况下,延时小于300ms。
4 案例应用
随着城镇化进程的发展,优质的资源都往城镇聚集,在教育这块体现得尤为明显。而在边远山区,村小教学点,师资缺乏,有一些课程开不全,存在较严重的教育不均衡问题。国家为了解决城镇学校与偏远薄弱校的教育资源均衡问题,推出了新一轮的扶持政策,主要包括:新一轮薄改政策、“三个课堂”应用指导意见[5]等。在此政策场景下,主要建设诉求包括如下几点:
4.1 覆盖多个应用场景
整体方案应能满足课中实时音视频互动教学的基本要求,通过部署在学校或教学点的设备,以及部署在教育局的平台,解决偏远薄弱地区缺师少教问题,通过网络研修支持网络教研新形态,支持跨区域共享,实现优质资源均衡。
4.2 音视频清晰稳定
针对网上专门开课或同步上课,需要适应多种网络环境,在教育城域网或互联网接入场景中,都需要降低网络丢包、抖动和时延等现象对教学互动带来的影响,避免卡顿,实现流畅清晰的音视频传输效果。
4.3 更好的线上互动
应充分考虑学生居家通过BYOD设备接入参与互动学习的新模式,满足老师和大多数学生在教室线下教学+部分学生线上学习的需求。
针对上述应用场景与建设诉求,本文设计了一种基于云视讯技术的整体架构,整体方案示意图如下图3:
4.3.1 如图3所示,整体解决方案中,包括如下几个关键组成
(1)区县管理中心:部署教学服务业务平台、云视讯服务平台。其中:教学服务业务平台推荐部署在电教馆的数据中心,提供点播直播、巡课督导、课程管理等服务;云视讯平台部署在公有云上面,满足专递课堂场景中的一拖多的实时互动,同时方便提供BYOD设备通过互联网接入。
(2)主讲教室(授课教室)/听课教室:部署配套的硬件设备,包括音频处理设备、视频采集设备、侧屏电视。在老师授课电脑上安装互动教学软件,实现远程的画面控制、音频控制及相关的教学工具功能。
4.3.2 整体采用云视讯部署架构,实现易扩容,轻管理的效果
(1)区县统一的教学服务业务平台,采用容器技术,运行在虚拟机上面,安装方便,并且容易进行扩容与迁移。
(2)采用SVC+SFU融合的云视讯技术架构,实现多个教室之间的实时互动教学,免去视频会议服务器的部署和维护,并通过云端集群部署,实现音视频流量的负载均衡、服务异地多活备份,比传统硬件MCU方案,可以减少30%的拥有成本。
5 结语
纵观上文,对视频会议的核心技术进行分析,并综合选择了一种SVC+SFU融合的技术方案,应用于当前政策热点场景专递课堂建设方案中,主体采用云视讯架构,云化部署与服务,可以更好地适应后续的可扩展。
参考文献:
[1]蒋林涛.视讯技术的现状及发展趋势[J].数据通信,2004,(2):22-26.
[2]曹春江.融合云视讯系统技术方案研究和应用[J],技术研究,2018,(9):10-12.
[3]唐洪飞.基于IMS的云视讯平台方案应用研究[J],邮电设计技术,2016,(4):48-59.
[4]高威,刘洋,李秋明.基于SIP协议的多业务融合视频会议系统的设计与实现[J].信息通信,2011,(4):56-57.
[5]中华人民共和国教育部.教育部关于加强“三个课堂”应用的指导意见http://www.moe.gov.cn/srcsite/A16/s3342/202003/t20200316_431659.html,2020-03-03.