VTS模拟器情景对话智能评估系统

冀宝仙+王胜正+施朝健+孙振






摘要:为实现VTS值班人员适任能力培训和评估的自动化、智能化,确保评估结果客观、公正和合理,构建VTS模拟器情景对话的智能评估系统。该系统通过建立标准航海通信用语语料库提高在线语音识别系统的精确性。引入基于语法规则的匹配分析模型对由语音识别系统得到的文本字符串进行匹配分析。详细介绍基于加权的实操评估准则制定方法。该系统利用智能技术能实现部分VTS情景对话的自动化评估,减轻评估人员的负担,且能避免人工评估的主观性和不公平性。
关键词: 船舶交通管理系统(VTS); 智能评估系统; 标准航海通信用语; 智能语音识别; 实操评估准则
中图分类号: U691.1 文献标志码: A
Abstract: To realize the automation and intelligence of the competency training and evaluation for VTS duty officers, and to ensure that the evaluation results are objective, fair and reasonable, the intelligent evaluation system of situational dialogues in the VTS simulator is built. A corpus database of standard marine communication phrases is established to improve the accuracy of the online speech recognition system. The matching analysis model based on the grammar rules is proposed to carry out the matching analysis on text strings obtained by the speech recognition system. The formulation method of practical operation evaluation criteria based on weighting is introduced. By the intelligent technology, this system can partially implement the automatic evaluation on the VTS situational dialogues, reduce the burden of the evaluators, and avoid the subjectivity and unfairness due to manual evaluation.
Key words: Vessel Traffic Services (VTS); intelligent evaluation system; standard marine communication phrase; intelligent speech recognition; practical evaluation criterion
0 引 言
VTS模擬器培训是提高VTS工作人员基本素质和专业技能的有效途径,也是更加全面提高海上交通管理水平的有效方法。VTS模拟器培训在我国已经得到了很好的应用,由上海海事大学与中国海事局共同研制开发的VTS模拟器已经得到成功的应用与推广[1],目前已完成对3 000余人次VTS值班人员的培训和考试,并于2016年9月通过国际航标协会(IALA)官方认证。然而,目前VTS值班人员适任能力评估依然采用教练员一对一的测评方法,不仅消耗大量人力、物力,评估效率低下,而且不同水平教练员的测试标准难以统一,导致评估过程存在一定的不公平性。因此,提出使用智能评估方法解决上述问题具有非常重要的意义。尽管航海教育领域也针对各种航海智能评估系统开展了广泛的应用研究[2-5],但是VTS模拟器与其他航海模拟器在智能评估方式和内容上有较大差别,因此不能简单借鉴或复制一般航海模拟器的智能评估方式。
VTS模拟器实操评估一般包括VTS系统操作技能评估和情景对话评估两大类。操作技能评估的主要目的是评估VTS值班人员对VTS软件操作的熟悉程度,评估学员操作行为的正确性,这与一般航海模拟器的操作评估类似。情景对话评估是评估值班人员如何利用恰当的语言通过语音通信工具与船员进行快速有效的沟通,从而合理地为船舶提供助航服务,并有效组织港区和航道的船舶航行活动。在情景对话评估中,中英文标准航海通信用语中包含大量的专用名词和习惯用法,导致通用的语音识别方法准确率较低,无法直接利用语音识别系统来评估语言服务的正确性。因此,情景对话评估成为整个VTS模拟器智能评估中的核心和关键技术问题。
本文结合当前VTS模拟器的技术条件,通过引入科大讯飞在线语音识别平台,在现有语音识别模块的基础上进行二次开发,构建一种VTS值班人员适任能力智能评估系统。首先根据《IMO标准航海通信用语》(以下简称SMCP)建立基于VTS标准航海通信用语的语料库,并上传到语音识别服务器,为现有语音识别平台补充词库,提高语音向文本转换的准确性;其次构建VTS通信用语的语法规则库,以便解决通用的在线语音识别平台专业用语识别上存在的精度较差的问题;最后设计VTS情景对话实操评估规则,为获得客观的VTS模拟器实操评估结果提供一种有效的评估准则。
1 VTS模拟器智能评估系统关键技术
1.1 航海通信用语语料库的建立
由于海事业务具有全球性,船员通常具有不同的文化、语言背景,VTS信息、助航和交通组织服务与一般性信息服务有所区别,VTS服务用语必须充分发挥信文标识的作用,同时必须注意语句的简洁性、用词的准确性、语意的完整性、表达的规范性以及指导的适度性[6]。常用的语音识别开发工具包中的语音识别模块对航海领域的专业性词汇或术语的识别不准确,因此本系统采用由相关领域专家根据航海国际公约、IMO决议及通函、IALA指南及建议等构建的包含一般术语、VTS专用术语、外部通信术语(如遇险通信术语、安全通信术语、VTS服务标准用语等)等的完整的航海专用中英文双语语料库。
表1所示为VTS模拟器的典型情景对话实操训练和考试题实例。从情景对话内容可以看出,在通常的对话内容中,除包含“太行山”“红浮”等地名或专用名词之外,还会出现很多数字、中英文夹杂在一起的情况,例如“京港VTC”“1.5 n mile”“临1号浮”等。对于这种情景对话,标准的讯飞Web语音识别平台的识别率不到80%,这显然无法满足情景对话实操评估的要求。因此,根据IALA V-103建议,按有关VTS值班人员适任能力培训示范课程目录及培训标准、SMCP、《全国VTS实操培训大纲》、我国的VTS模拟器实操评估题库编制评估项目与内容,采用纯文本utf8格式编辑用户词库表,例如:VTS,VTC,洋山港[枚举全国所有港口名称],船名[枚举题库中涉及到的所有船舶名称],北航道[枚举题库中涉及到的所有航道名称],雷达,红浮,绿浮……在使用语音识别系统进行识别时,上传该通信用语语料库到识别服务器平台,补充词库,提高语音识别准确度。
1.2 基于音、词和语法规则的混合匹配分析模型
海事通信用语在表达上力求科学、准确、简洁和清晰。因此,本系统中严格根据SMCP和《全国VTS实操培训大纲》要求编制了双语语料库[7],构建了基于混合语法规则的匹配分析模型[8-10],以便对语音识别得到的文本进行匹配分析,得到客观准确的评估结果。
因为汉语中存在近义词、同音字等现象,容易发生混淆,所以中文文本的匹配分析比英文文本的匹配分析更为复杂。本系统中采用拼音、语法规则和关键词规则匹配分析的混合匹配分析模型对语音识别结果进行评估,计算评估成绩。
语法规则匹配,即基于命令词识别指定关键词组合的词汇或固定说法的短句,是中文文本匹配分析中最重要的一步。本系统中首先根据讯飞平台《ABNF语法编写指南》构建标准航海用语文法规则文件,为VTS模拟器实操评估中信息服务、交通组织服务、助航服务和应急处置等4大类23个场景的题库材料编制相应的文法规则。文法等同于正则表达式,它定义了一个句子集合,例如一个用来匹配“船舶呼叫VTS中心”的对话的文法规则如下:
#ABNF 1.0 UTF-8;
root task_final;
#ABNF HEAD-END;
$vts_name = 京港VTS | 京港VTC
$ship_name = 太行山 | 太行山輪 |太行山轮船 |太行山船;太行山号;
$call= 呼 | 叫 |呼叫;
$task_final = $vts_name, $ship_name $call;
上述文法规则涵盖了实现海事专业通信用语的多种说法:
京港VTS,太行山呼
京港VTS,太行山轮呼
京港VTS,太行山轮呼叫
京港VTS,太行山轮船呼叫
京港VTS,太行山号呼叫
京港VTC,太行山呼
……
基于混合语法规则进行匹配分析的过程中,首先将语音识别得到的文本以字为单位转换成对应的拼音字符,并与标准答案的拼音进行模糊匹配,如标准答案是“太行山”,则拼音是“tai hang shan”“tai han san”“tai han shan”或“tai hang san”都判别为识别正确,消除了同音字、卷舌音、前后鼻音等口音问题造成的影响;然后加载已编辑好的文法规则,采用语法规则匹配方法对语音识别得到的文本进行修订,如语音识别结果是“太行山呼”,而标准答案是“太行山号呼叫”,在上述通信用语的多种说法中包含了“太行山呼”的说法,则基于模糊拼音判别进行语法规则匹配可以判定该文本匹配正确,并将语音识别得到的文本修订为“太行山号呼叫”,以便进行关键词规则匹配。类似地,循环遍历所有语音识别结果,最终统计所有匹配正确的文本数目。
关键词规则匹配分析是在考试题的标准答案中
图1 VTS模拟器中情景对话智能评估流程设置关键词作为考试答案匹配的主要对象,也是评估成绩的主要依据。在编辑标准答案时会对关键词进行标注,例如标准答案“太行山号,能见度不良天气,请注意使用安全航速航行”,其中关键词是“*能见度*不良*安全航速*”,然后在修订过的文本中遍历查找与标注的关键词匹配的词组,并累计匹配正确的关键词数目。最终循环遍历,直至完成所有文本的关键词规则匹配。图1是VTS模拟器中情景对话智能评估流程。
英文语句以单词为最小结构单元,以空格为分隔标记,且英文具有严格的语序[11-12],因此英文文本匹配分析比中文文本匹配分析简单。英文文本匹配分析流程与中文文本类似。本系统中根据SMCP编制了相应的关键词语法规则,由于英文本身就是字符串组合,不需要进行拼音字符转换过程,可以直接进行语法和关键词规则匹配分析。
1.3 基于加权的情景对话实操评估规则
本系统中采用基于加权的方法计算评估结果。经拼音和语法规则匹配分析后判定为正确的文本数目,记为n1;待匹配分析的文本长度,记为N1;累计匹配正确的关键词数目,记为n2;标准答案中关键词总数,记为N2。因此,两种判别方式的分值计算可以表示为SCi=niNi×100, i=1,2
2 VTS值班人员适任能力智能评估系统构架和实现 图2为VTS模拟器智能评估系统的架构,主要包括智能评估教练员指挥控制端、智能评估客户端、VHF通信设备、智能评估服务器端和Web语音识别云服务平台等5个部分。
智能评估教练员指挥控制端主要由客户端参数设置、VTS操作技能评估管理、VTS信息服务标准化用语评估管理、评估过程实时动态监控和评估过程记录与回放管理等5个功能模块构成。智能评估客户端主要由用户登录界面、VHF语音采集器和学员操作指令拾取与传递模块组成。智能评估服务器端进行数据存储与处理,它与Web语音识别云服务平台联接[13],提供语音识别服务。智能评估系统的工作原理框图见图3。
根据本文提出的VTS模拟器智能评估系统架构与关键技术,利用Visual C#.NET开发了智能语音评估系统模块,见图4。
图4a)提供评估内容编辑和评分规则编辑功能,评估内容支持中文和英文2种语言。在评估前,首先添加评估考试内容,如图4a)所示添加了“信息服务”评估情景,在情景規则交互界面上添加了评估具体内容,并针对评估内容设置了关键词。
图4b)提供了评估过程监控功能,评估员可以动态监控评估过程,了解评估情况。当开始进行评估时,考官自动发送消息,如“京港VTC,‘太行山轮呼叫”,学员端即可以收听到该段语音播报;随后服务端等待学员的语音回复;服务端收到学员语音后,即利用本文前述语音识别方法,对学员的语音回复进行翻译,并存储在服务端数据库中。依此循环,直到该情景对话结束。
图4c)提供了评估结果,在完成了所有情景项目后,系统根据本文提出的评分规则自动进行分数计算。
图4d)提供了评估结果对比分析,既可以进一步了解学员的知识掌握情况,又可以验证本文方法的准确性。系统设置了10套评估题,对30位VTS值班人员随机选取一套题进行自动评估,统计其评估结果,平均绝对误差为8%,远低于直接采用讯飞平台的平均绝对误差19%。这充分说明建立航海通信用语语料库和进行文法规则处理对VTS情景对话评估的有效性。
3 结束语
VTS值班人员适任能力智能评估系统弥补了传统VTS值班人员适任能力人工测评工作量大、主观评判缺乏公正性的不足,为VTS值班人员训练评估提供了新的方法,在一定程度上促进了我国VTS值班人员训练评估的发展。VTS值班人员适任能力智能评估系统不仅适用于VTS值班人员操作技能和信息服务标准化用语的培训和评估,同时也可用于船员、引航员等海事领域相关工作人员的专业技能水平培训和评估,还可用于水上交通事故预测与分析、新的规则和章程的测试等领域。该系统能够从整体上提高海事领域相关工作人员专业技能水平和航海通信用语标准化水平,提高船舶交通组织、管理、服务水平,有助于改善港口水域环境、通航环境,也有助于船舶的安全操纵,有利于船舶的航行安全,具有非常高的实际应用价值。
参考文献:
[1] 王胜正, 张英英, 黄玉贵, 等. VTS与船舶操纵综合模拟器构建关键技术[J]. 上海海事大学学报, 2014, 35(2): 1-5. DOI: 10.13340/j.jsmu.2014.02.001.
[2] 方诚, 任鸿翔. 航海模拟器智能评估方法综述[J]. 中国航海, 2015, 38(4): 48-52.
[3] 杨晓, 金一丞, 任鸿翔, 等. 航海仪器操作智能评估系统的设计与实现[J]. 中国航海, 2013, 36(4): 28-33.
[4] 陈丽宁, 任鸿翔, 金一丞. 船舶雷达/ARPA智能考试系统的研究[J]. 重庆交通大学学报(自然科学版), 2011, 30(5): 1049-1053. DOI: 10.3969/j.issn.1674-0696.2011.05.0036.
[5] 蒋效彬, 任鸿翔, 王德龙, 等. 航海模拟器的锚泊操纵自动评估系统[J]. 上海海事大学学报, 2016, 37(1): 82-86. DOI: 10.13340/j.jsmu.2016.01.015.
[6] 张美红, 梁小成. 标准航海通信用语(SMCP)在VTS服务中的应用[J]. 中国水运, 2009, 9(9): 143-144.
[7] 罗卫华. 海事英语及其语料库研究[M]. 大连: 大连海事大学出版社, 2008.
[8] 朱国华. 文本信息处理中汉语句法分析方法研究[D]. 大连: 大连理工大学, 2005.
[9] 邵刚. 基于中文的句法分析系统的研究与实现[D]. 西安: 西安科技大学, 2008.
[10] 过冰. 智能语音对话系统中基于规则和统计的语义识别[D]. 北京: 北京邮电大学, 2013.
[11] 刘文慧. 标准海事通信用语与日常英语口语的差异分析[J]. 大连海事大学学报(社会科学版), 2010, 9(6): 106-108.
[12] BILLE P, GRTZ I L, VILDHJ H W. String matching with variable length gaps[J]. Theoretical Computer Science, 2012, 443: 25-34.
[13] 刘琳茜, 李永康, 索红军. 云服务安全平台研究开发与语音识别应用[J]. 软件导刊, 2014, 13(1): 7-8.
(编辑 贾裙平)