标题 | 普通商用Android手机终端语音质量评估方法研究 |
范文 | 张勇 摘 要 本文提出了一种利用普通商用Android手机终端进行MOS语音质量评估的方法,该方法通过在普通Android手机终端上安装软件,拨打IVR语音平台,对语音通话进行监控并进行录音形成通话录音文件,并在手机终端实现ITU-P.862中推荐的语音评估算法PESQ,输入标准参考语音文件和通话录音文件经计算后输出MOS评估结果,评估结果关联终端设备信息、无线信息以及位置信息等进行上报,实现语音质量整体评估。 关键词 MOS;语音质量评估;Android手机终端 中图分类号 G2 文献标识码 A 文章编号 1674-6708(2018)205-0131-05 随着移动网络发展的日趋成熟,用户对网络的整体语音服务质量的要求不断提高,语音服务质量与通常所讲的移动网络信号质量有很大的区别,语音服务质量更好地反映用户对网络的真实感受情况,其好坏直接影响着用户对于运营商的选择。因此,建立一套能客观体现用户感知的语音质量评价标准,更好的对网络语音服务质量进行定量分析和评估,成为移动网络运营商在网络建设过程中必须考虑的关键问题。 现有MOS语音质量的评估包括基于无线指标的(RxQual)简单评估[ 1 ]、人为主观MOS评估方法、基于无线电链路参数的移动电信网络中的语音质量测量、基于智能手机的语音质量评估系统设计与实现、利用NGN终端进行控制拨打进行语音质量测试的方法、以及专业测试设备集成硬件进行MOS计算等方法,以上方法总体上可以分为:早期的人为主观评估、基于无线指标模拟估算评估、专业硬件设备集成PESQ算法进行评估的方法。 现有的语音质量评估人为主观评估主观性大,评估不客观且成本高;利用单一无线指标RxQual评估或者利用多项相关无线指标参数计算语音质量的估算值进行评估,估算值不能真实评估语音质量;专业测试设备硬件集成PESQ算法进行评估,不能直接在普通通用终端直接使用,成本高且不利于推广。网络语音在终端、无线、路由、交换等传输过程中,都会出现导致人为主观感觉的语音质量变差问题,以上所有方法都不适用普通通用手机终端进行语音质量的真实感知评估。 本文提出了一种利用普通商用Android手机终端进行MOS语音质量评估的方法,并充分考虑到普通商用Android手机终端的多样性、语音质量评估的便利性、语音评估的有效性,建立IVR语音平台,利用普通Android手机终端安装软件的方法进行语音质量的评估,全面推广后,大数据量的语音质量结果上报进行点、线到面的整体通讯网络语音质量评估。 1 MOS原理 MOS(Mean Opinion Score)语音质量测试是衡量通信系统的重要指标,网络语音在终端、无线、路由、交换等传输过程中,都会出现导致人为主观感觉的语音质量变差问题,因此,如何对用户感知的语音质量进行评估是语音服务质量评测过程中面临的重要问题。 MOS语音测试是通过选择不同的人对接收的语音和原始语音进行主观感觉对比,从而得出MOS结果,目前语音测试方法有主观测试和客观测试两种: 主观测试是按照1-5分对接收到的电话语音质量进行评分(最好为5,最差为1),ITU组织在1996年8月制定为标准,其P.800标准详细进行了定义。 客观测试不同于原有的主观评估方法,客观测试通过使用计算机来比较其通过通信网络传输前后的语音质量好坏程度及其相对应的级别,主要有:PSQM、PSQM+、PESQ等。 PSQM(Perceptual Speech Quality Measurement)是通过比较计算机产生波形文件(Wave File)通过网络传输前后的变化,计算语音质量好坏程度及相对应的MOS级别来评估语音质量,PSQM在1996年被国际电联ITU-T采纳为P.861建议。 PESQ(Perceptual Evaluation of Speech Quality)是支持各类端对端网络语音质量评价,PESQ可以根据各种感知标准来客观地评价语音信号的质量,感知指标与人类对语音质量的感受完全吻合的,并可以实现完全量化,在2001年2月ITU组织将PESQ语音质量定义为P.862标准。 PESQ是在 PSQM基础上发展而来,相比起PSQM,PESQ有了长足的进展,PESQ能更准确地模拟人的语音感知,更接近与主观听觉测试语音质量评测。 P862与PSQM算法语音分值曲线如图1: ![]() MOS语音质量定义:主观测试和客观测试方法都必须将测试的最终结果对应到MOS值上,MOS语音质量值定义如表1所示。 ![]() 2 PESQ算法 PESQ(Perceptual Evaluation of Speech Quality)采用插入式測试算法,通过提取输出信号并与参照信号进行比较计算出差异值,一般情况下,输出信号和参照信号的差异性越大,MOS参数值越低。PESQ方法综合考虑了语音传输过程中的编码、解码失真、错误、丢包、延时、抖动和过滤等因素,通过PESQ方法能客观评价语音信号的质量,对语音质量进行量化,是目前语音质量评侧中比较标准和商用化程度最高的算法。 PESQ测试处理过程如图2。 ![]() PSQM测试方法:PSQM测试是通过发送语音参考信号,并在网络的另一端采用数字信号处理的方式比较接收到的信号和语音参考信号,通过PSQM算法量化估算出网络语音质量MOS值。 3 MOS影响因素 网络语音在无线网络传输中会经过终端、无线、路由、交换等传输过程,多个网元都参了语音质量的处理,因此在任何语音传输的任何环节出现问题,都会引起语音质量问题,通过对传输过程中各种情况下语音质量进行对比,可以发现和总结影响MOS值的关键因素。 3.1 语音编码方式 现网中几种主要语音编码方式。 ![]() 在正常无线网络环境情况下,几种语音编码方式与MOS值的关系为:EFR>AMR>FR>AMR-HR>HR。 3.2 RXQUAL及C/I影响 对于无线网络,网内干扰和网外干扰都可能直接影响网络接收质量,网络干扰降低了基站解调能力,造成误码,使得语音帧解析错误,形成丢帧影响语音质量,对于语音质量的影响范围很大,C/I是反映通信网络干扰水平的重要指标,也是影响手机RXQUAL的主要因素,RXQUAL及C/ I的好坏直接决定着无线网络环境的好坏和网络语音质量的好坏。 对手机用户,RXQUAL差必然会对通话质量产生影响,同样也会影响MOS值。根据实际测试结果: 当RXQUAL>4.5时,MOS值开始出现下降;当RXQUAL>5.4时,下行MOS值<3.0,通话不太清楚,影响用户通话质量; 当RxQual>6时,下行MOS值<2.0,出现较大杂音或断续,严重影响通话质量。 3.3 切换频次 移动通信网络是由多个蜂窝小区组成,通过采用切换技术提供通信服务,为了保证用户在移动过程中得到持续的通信服务,系统必须要持续提供切换服务,因此,切换是通信系统中最基本、最重要的特性,系统在切换过程中需要通过TCH帧来传送相关切换信令,在从源信道切换到目标信道过程中,必然会存在TCH 帧丢失的情况,因此通话过程中由于切换导致的语音断续是不可避免的,整个切换过程牺牲了话音的连续性,对话音质量存在一定的影响。在PESQ算法模型中考虑了切换对语音的影响,根据现网实际测试结果,异常情况下的切换对语音MOS值影响较大。 乒乓切换:乒乓切换是由于同频同BSIC而造成的切换失败,导致手机不停的向错误小区发切换申请,由上述可知,频繁的乒乓切换会带来语音断续和不连续,严重影响客户通话感知,导致MOS值明显偏低。 另外,由MOS值产生的原理可知,要保持MOS语音测量值正常,在6秒的通话时间内最多受到两次切换的影响,当6秒通话时间内多次切换时也将会带来语音断续和不连续的问题,影响用户感知,要减少网络的切换频次,可以采用几种方法进行调整: 1)调整小区天线方向角和下倾角进行覆盖优化。 2)调整切换参数,调整切换参数可以通过调整切换参数BSC级别的TINIT参数,TINIT参数设置的原理为,在增加TINIT值设置后,在切换成功后,TINIT将规定限制时间内不允许手机再次进行切换,从而达到减少切换次数的效果。 3)增加小区级的切换迟滞值(KHYST)、场强滤波长度(SSLENSD/I)和质量滤波长度(QLENSD/I)设置,通过设置可以有效推迟小区间的切换间隔,能有效减少切换次数。 在进行上述调整切换参数设置时,统一也会带来切换不及时造成掉话的负面影响,因此,在实际参数调整设置过程中,需要根据网络实际运行特点进行合理设置。 3.4 DTX不连续发射 在移动通信网络中,开启DTX不连续发射会降低用户通话过程中的话音质量,但可以提升网络的C/I,提升C/I有助于降低网络干扰,提供网络传输质量,因此,在实际测试结果,无线网络中打开DTX或关闭DTX,MOS值都会有少许影响,在实际应用中,可以需要根据网络实际情况进行合理设置。 3.5 移动台速率影响 对于高速度情况下移动的用户,会因为多径影响导致误码上升,从而影响通话质量,造成MOS值下降。根据实际测试,速率在400km/ h~500km/h时会出现多普勒效应,移动基站收到的移动台信号会出现频偏的情况,当频偏达到1 320Hz~1 650Hz时,移动基站将出现无法正确解码终端信号的情况,因此高速度情况下对于语音质量MOS值的影响是比较严重的。 3.6 链路质量、传输质量影响 语音传输的过程中,会通过不同的链路和路由进行传输,不同的链路和路由也是影响MOS值的一个重要因素,在语音质量评估中出现大量的误码、滑码、传输闪断、坏帧过多、信令重传等情况时,一般都是由于传输质量不好引起的,从原理上来看,传输过程中的传输质量、链路质量的问题相当于在传输过程中出现了一些话音帧的丢失,话音帧的丢失是非常严重的问题,因此也是影响话音质量MOS值的重要因素。 4 现有MOS语音质量评估缺陷 现有的MOS语音质量的评估方法基于无线指标的(RxQual)简单评估、人为主观MOS评估方法、基于无线电链路参数的移动电信网络中的语音质量测量、基于智能手机的语音质量评估系统设计与实现、利用NGN终端进行控制拨打进行语音质量测试的方法、以及专业测试设备集成硬件进行MOS计算等方法,无法直接在普通通用终端直接使用,成本高且不利于推廣,不适应现有的MOS语音质量评估。 1)采用专用定制测试手机或者早期智能手机,不是普通商用或现有通用的手机终端,不能获取真实用户感知数据。 2)专业测试设备语音质量评估成本高。 3)专业测试设备携带不便,效率低。 4)不便于推广和大量评估数据的获取。 5 Android终端MOS评估方法 在普通商用Android手机终端上进行MOS语音质量评估,需在Android手机终端上安装软件,通过拨打IVR语音平台,Android系统对语音通话进行监控并进行录音形成通话录音文件,手机终端采用软件方式实现ITU-P.862中推荐的语音评估算法PESQ[2],输入标准参考语音文件和通话录音文件经计算后输出MOS评估结果,评估结果关联终端设备信息、无线信息以及位置信息等进行上报,最终形成有效语音质量整体评估数据源。 普通商用Android手机终端进行MOS语音质量评估的步骤包括: 手机信息采集:利用Android系统机制启动服务或者其他常驻内存线程采集无线网络环境信息、位置信息和终端设备信息。 启动手机呼叫监控并拨打IVR语音平台:利用Android系统机制启动手机呼叫监控服务;通过手动或者自动拨打特定IVR语音平台,IVR语音平台提供标准放音,至少8秒以上,循环播放。 手机录音并生成退化录音文件:手机从拨打开始进行内录,应答至少8秒后挂机,获取从拨打开始到挂机结束形成退化录音文件,可循环拨打形成连续多个退化录音文件。 利用PESQ算法输出评估结果:利用手机内置软件方式实现PESQ算法,输入退化录音文件和内置参考语音文件,最终输出评估结果。 评估结果和采集信息关联并上报:将语音测试评估结果和手机采集信息通过特征值关联,并上报服务端进行持久化存储,形成整体语音质量评估的可靠全面数据源。 Android终端MOS语音质量评估流程如图5。 ![]() 詳细步骤说明如下: 1)手机信息采集。手机信息采集是特指普通商用智能终端的通用信息采集和手机作为主叫的呼叫事件信息采集。其中,通用信息采集的内容上可以分为无线网络环境信息、位置信息和终端设备信息等,包括但不限于:主服小区唯一标示信息、信号强度、经度、维度、终端型号、终端固件版本号,通用信息采集频率为1次/秒;呼叫事件信息采集信息内容包括被叫号码、起呼时间、接通时间、应答时间、挂机时间等基本呼叫信息。 2)启动手机呼叫监控并拨打IVR语音平台。利用Android系统机制,启动监听手机呼叫服务,服务包括呼叫监听服务和Radio日志服务。拨打特定IVR语音平台,拨打有效时长(从应答后至少8秒)、拨打次数及拨打间隔可设置,拨打方式可以手动进行或者通过任务计划方式定时启动拨打; 其中,所述启动手机呼叫监控的具体描述如下。 Android操作系统版本不同,低于4.1的版本同时启动呼叫监听服务和Radio日志服务,其他版本启动呼叫监听服务;呼叫过程的监控内容包括呼叫振铃时间、应答时间和挂机时间,遵循如下原则: (1)利用Android系统机制准确判断手机呼叫振铃开始(CALL_STATE_RINGING)和呼叫结束(CALL_STATE_OFFHOOK)时间。 (2)Android操作系统版本不同,低于Android 4.1的手机采用系统Radio Log日志监听精确应答时间,其他终端应答时间采用呼叫振铃时间+应答时延(经验值)。 其中,所述IVR语音平台的具体描述如下: IVR语音平台具有特定的接入号码,对接入的电话自动应答并播放参考语音文件,参考语音文件有效长度至少8秒以上,播放超过特定时长自动挂断,不超过挂断时长阈值时,循环播放(沉默间隔2秒)标准参考语音文件。 (3)手机录音并生成通话录音文件。手机从拨打测试开始进行录音,挂机后结束录音,形成一个录音通话文件采样片段,针对录音通话文件采样片段进行剪辑,从拨打应答开始每8秒形成一个录音通话文件,丢弃沉默间隔2秒录音片段,末尾不足8秒片段丢弃,最终形成一个或者多个录音通话文件。 其中所述录音的具体描述如下: 基于Android手机录音模块差异,录音方式采用内录或者外录,内录指内部录音,特指针对语音呼叫下行(Rx)音频的录制;部分Android机型不支持内录,采用听筒声音外放,音源类型设置为MediaRecorder.AudioSource.CAMCORDER,保证音源最小衰减和减少干扰,此种录音方式称为外录。 (4)利用PESQ算法输出评估结果。利用普通商用手机端通过软件方式实现PESQ算法,输入通话录音文件和参考语音文件,拨打测试结束后输出语音质量评估结果。一次拨打IVR语音平台过程可生成一个或者多个语音通话文件,按照时间特征值对参考语音文件进行剪辑,形成一对或者多对语音通话文件和参考语音文件的输入,通过PESQ算法获得一个或者多个MOS值,如果是多个MOS值则进行平均,最终一次呼叫获取一个MOS评估结果。 其中,PESQ算法是ITU-P.862中推荐的语音评估最新算法,算法通过电平调整、滤波、时间对齐、听觉转换、扰动处理、坏段标示及坏段重对齐等系列处理后最终形成认知模型,获取评估结果。 5)评估结果和采集信息关联并上报。MOS语音质量评估结果和手机采集信息通过拨打呼叫事件进行关联,关联遵循如下原则: (1)一次拨打呼叫合成一条手机采集信息,包括通用信息和呼叫事件信息。 (2)一次拨打呼叫合成一个呼叫事件。 (3)一个呼叫事件获取一个MOS评估结果。 完成关联后,上报服务端并进行持久化存储。 基于Android手机终端实际测试情况能获得用户真实用户感知情况,基于用户真实MOS值可以进行弱MOS分析,从覆盖、质量、切换、编码方式及传输质量深入分析各个原因并进行有针对性的优化。 (1)覆盖优化。覆盖作为优化的基础,起着至关重要的作用,对多项指标均有重要的影响,包括对MOS的影响。MOS分析可以从过覆盖、弱覆盖、背向覆盖、主服小区不明显、室分泄露及覆盖调整方面对MOS值低且存在覆盖问题进行剖析。 过覆盖。过覆盖小区对网络指标影响较大也是目前网络常见问题之一,过覆盖会产生频率干扰及孤岛效应,对MOS值影响较大。 优化建议:可通过控制覆盖范围:查看小区功率等级、功率类型以及机械下倾角与电子下倾角;可以通过层间切换门限及层间切换统计时间与持续时间来控制该路段的切换;可以对主服小区的邻区进行核查,添加合理邻区。 弱覆盖。弱覆盖形成的低电平质差对网络质量也有一定的影响且是对MOS影响较大,形成原因主要有以下几点:因地形、物业等原因无法建站导致;因建筑阻挡等原因导致;因屏蔽严重导致;因覆盖调整导致等。 优化建议:在优化无法满足的情况下提交新建站计划,如工期较长可提交拉远站或一体化机房等缓解。 背向覆盖。因工天馈接反或调整过程中方位角偏离主服范围较大等因素形成的背向覆盖对MOS影响较大。 优化建议:对背向覆盖问题,可以核实工参信息经纬度及小区方位角;现场勘查实际覆盖情况,避免天线直射或小角度直射易反射物体,判断是主集与主集接反、主集与分集接反、分集与分集接反还是两小区主分集完全接反,提交天馈整改工单或直接派单上站梳理馈线。 主服小区不明显。在高层建筑或基站密度较大区域,因覆盖重叠度较大而出现频率资源紧张,复用度大导致的频率干扰问题较为严重,导致异常事件影响MOS语音质量。 优化建议:对周边站址进行实地勘察,调整覆盖,梳理切换,凸显主服小区。 室分泄露。室分泄露是因为室分功率等级及功率类型较大或为了吸收话务调整室分小区层级较高等导致重选及切换占用,严重影响MOS语音质量。 优化建议:调整室分基站功率等级及小区所在层级;功率等级较小情况下可派单至室分厂家增加衰减;结合(PI、PT、CRO、PBGT、P/N等参数)调整重选及切换。 (2)质量优化。质量是直接影响MOS指标重要的因素,由于干扰、传输误码、硬件故障及弱覆盖等原因导致,现网中的一些质量问题的主导因素便是干扰,干扰目前主要分为网内干扰、外部干扰,硬件问题等。针对外部干扰的诸多原因,可以结合话务量与干扰带等级的变化进行初步分析再结合扫频定位,通过安装滤波器,或申请无委进行解决,网内干扰目前较为严重的是网内的同、邻频干扰,需要对基站小区经纬度核实,合理规划覆盖,修改部分干扰频点等手段解决。 (3)切换优化。切换优化是通过对实际网络运行状况进行优化,设置相关切换参数的方法达到改善用户感知的目标,在实际网络运行中,切换不合理会切换到质量差小区,引起MOS分值低,因此需要反复检查相关切换参数设置。 切换优化可以采用调整小区天线方向角和下倾角进行覆盖优化;调整切换参数包括通过调整切换参数BSC级别的TINIT参数;增加小区级的切换迟滞值(KHYST)、场强滤波长度(SSLENSD/I)和质量滤波长度(QLENSD/I)设置,有效推迟小区间的切换间隔等方法。在实际参数调整设置中,都需要根据网络实际运行特点进行合理设置。 (4)编码优化。不同编码方式对MOS影响不同,其中半速率对MOS值影响较大,通过分析语音编码方式与MOS值,我们可以盡量采用半速率语音编码方式,并尽可能多使用全速率语音编码方式。另外,我们也可以尽量减少半速率话务,这样可以大幅提高全网MOS大于等于3的比例。 (5)传输质量优化。网络传输问题是指网络突发故障,包括网元硬件故障和传输线路故障,网络传输问题常常导致小区出现通话突然中断情况,出现大量掉话,造成最差的MOS测量值,在实际应用测试中,需及时发现和处理网络中的网络传输问题,保障传输线路正常。 6 创新点 1)利用普通商用Android手机终端进行MOS语音质量评估,该方法形成的装置进行推广应用为建立语音质量评估体系提供了通用、准确、有效的数据源基础。 2)手机信息采集的方法以及和MOS评估结果的关联规则充分考虑到普通商用手机终端型号及Android操作系统的多样性、评估采样数据的有效性,能高效完成测试和获取丰富客观的MOS评估数据。 3)本次提出的Android手机录音并生成通话录音文件的方法和规则充分考虑到普通商用手机终端型号及操作系统的多样性,制定了录音方式、起止时间、录音时长等规则,采集的录音结果信息能为MOS语音质量评估提供准确、有效输入数据源。 7 应用价值 基于普通商用Android手机终端进行MOS语音质量评估方法弥补了现有的利用专业测试设备近似模拟普通商用手机端进行语音质量的评估方法的不能真实体现用户感知、成本高、效率低、以及不便推广的不足,充分考虑到普通商用手机的移动性、便利性和通讯网络MOS语音质量评估的准确性、有效性,在实际网络语音质量评估工作中,关注网络语音质量提升人员甚至普通员工通过采用本方法对应装置进行拨打测试评估,随时随地拨打测试并上报测试结果及手机采集信息,形成体现用户真实感知、大量、全面的MOS语音质量评估数据源。 参考文献 [1]李晓辉.LTE移动通信系统[M].西安:电子科技大学出版社,2013. [2]孙新建,邹霞,曹铁勇,等.基于加权巴克谱失真的语音质量客观评价算法[J].数据采集与处理,2006. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。