英汉双语语音识别与翻译平台的设想与开发
摘 要:随着学科的交叉融合,语音识别技术的突破对文化旅游项目具有重大的现实意义,对陕西旅游业的发展起着重要作用。本文将研究智能手机中语音识别交互的方式,初步实现陕西主要旅游景点英汉双语语音识别与翻译平台的开发,加大对陕西旅游及文化传播的力度和效果。
关键词:旅游景点;英汉双语语音识别;翻译
西安作为古丝绸之路的起点,迫切需要向世界展示其独特的地域特色和文化特色。实现主要景点的英汉双语语音识别与翻译将大大提高对外文化的宣传力度和效果。因此,充分利用当前高科技的发展,开发与建设英汉双语语音识别与翻译平台将有力地推动陕西旅游的发展,并且扩大陕西的对外交流与文化影响力。本文将从三个方面对于这一平台的初步开发进行研究。
一、目前陕西主要旅游景点翻译中的问题
经过小组成员对陕西主要旅游景点的双语翻译的实地调查,发现景点里英汉双语翻译水平良莠不齐。这不仅阻碍了旅游景点的宣传,也降低了这些景点在国外游客心中的第一印象。当前市场上的主要翻译错误有以下几种:
1.乱译和误译:比如壶口瀑布中 英文指示牌,“依次通行请勿停留”被翻译成“in order to pass please stay”,而这句话直译成汉语其实是“为了通过请停留”的意思。全然不能正确表达标识提示内容的翻译。另外,3月1日直接被译为3months 1day。
2.景点名称不统一。
3.拼写错误:最常见的一种情况,有些因为印刷错误或者各种因素所导致的单词字母确实,易被忽视的一种,容易导致游客的迷惘和误解。
4.语法错误:比如继续参观译为“Keeping visit”,这是一个典型的错误,正确形式Keep应该为动词原形的祈使句“Keep visiting”。
诸如此类翻译时出现的错误,导致游客对景点文化理解错误和误解,因此要建立一个陕西省旅游英文语言资料库,需要精确的翻译景点名称。建立基于场景的翻译以及多语言信息服务,给予不同语言游客的了解溝通需求和桥梁。
二、机器语音识别现状
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。
但是机器语言翻译准确率还不够高,对于旅游文化当中的文化翻译,习语翻译等无法恰当让接受者理解,这就需要建立一个强大而准确的语言资料数据库,汇集优秀翻译。
1.语音识别系统设计的技术依据。语音识别是计算机翻译软件不可缺少的一部分,主要针对不同语言进行识别处理,帮助游客快速地了解景区。语音识别技术主要包括:特征提取技术、模式匹配技术两大技术,也是系统设计需考虑的重点。
2.特征提取技术。一般来说,语音识别系统辅助功能涉及到收录、处理、传递等三个环节,这也是语音识别系统设计的关键所在。计算机语言与自然语言之间存在极大的差异性,如何准确识别两种语言的差异性,这是翻译软件识别时必须解决的问题。
3.模式匹配技术。模式匹配技术采用智能识别器,由翻译器录入语音之后自主化识别、分析,减小了人工翻译语句的难度。
三、双语翻译器语音识别系统设计及应用
双语(多语言)景点翻译器是外国游客的操作工具,游客翻译器功能可准确地理解景点名称、特色,这对语音识别系统设计提出了更多要求。设计语音识别系统要考虑翻译器具体的工作流程,事先编排一套符合翻译软件工作的方案,提高人机语言转换速率。语音识别系统设计及应用情况:
1.识别模块。语音识别方法主要是模式匹配法,根据不同翻译要求进行匹配处理,实现英语翻译的精准性。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
2.前端模块。前端处理是指在特征提取之前,先对原始语音进行处理,这是预处理操作的主要作用。语音识别系统常受到外界干扰而降低了翻译的准确性,设计前段处理模块可消除部分噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。例如,比较常用的前端处理有端点检测和语音增强。
3.声学模块。语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。声学特征的提取与选择是语音识别的一个重要环节,这一步骤直接关系到翻译器的工作效能,对英语语音识别有很大的影响。
4.搜索模块。英语语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。
5.执行模块。实际应用中,语言识别系统凭借执行模块完成操作,对英语语言识别方式进行优化择取,以最佳状态完成英语翻译工作。
四、结语
随着信息化建设时期进入成熟期,英汉双语语音识别系统将彻底改变了传统人工翻译模式的不足。但是,存在的问题也有很多,比如英汉双语翻译内容越来越复杂,翻译器语音识别系统承载的数据范围更广,必须实施更新翻译软件产品,才能进一步提升英汉双语语音识别的智能化翻译水平。
参考文献:
[1]丁大刚.旅游英语的语言特点与翻译[M].上海:上海交通大学出版社,2008:78
[2]孙广治.旅游景点介绍的汉英翻译实践报告-以陕西关中地区为例[J].《黑龙江大学学报》,2014.(10):25-26
[3]杜卫卫.英语翻译器语音识别系统设计[J].《电子测试杂志》,2015.(4):38-40
关键词:旅游景点;英汉双语语音识别;翻译
西安作为古丝绸之路的起点,迫切需要向世界展示其独特的地域特色和文化特色。实现主要景点的英汉双语语音识别与翻译将大大提高对外文化的宣传力度和效果。因此,充分利用当前高科技的发展,开发与建设英汉双语语音识别与翻译平台将有力地推动陕西旅游的发展,并且扩大陕西的对外交流与文化影响力。本文将从三个方面对于这一平台的初步开发进行研究。
一、目前陕西主要旅游景点翻译中的问题
经过小组成员对陕西主要旅游景点的双语翻译的实地调查,发现景点里英汉双语翻译水平良莠不齐。这不仅阻碍了旅游景点的宣传,也降低了这些景点在国外游客心中的第一印象。当前市场上的主要翻译错误有以下几种:
1.乱译和误译:比如壶口瀑布中 英文指示牌,“依次通行请勿停留”被翻译成“in order to pass please stay”,而这句话直译成汉语其实是“为了通过请停留”的意思。全然不能正确表达标识提示内容的翻译。另外,3月1日直接被译为3months 1day。
2.景点名称不统一。
3.拼写错误:最常见的一种情况,有些因为印刷错误或者各种因素所导致的单词字母确实,易被忽视的一种,容易导致游客的迷惘和误解。
4.语法错误:比如继续参观译为“Keeping visit”,这是一个典型的错误,正确形式Keep应该为动词原形的祈使句“Keep visiting”。
诸如此类翻译时出现的错误,导致游客对景点文化理解错误和误解,因此要建立一个陕西省旅游英文语言资料库,需要精确的翻译景点名称。建立基于场景的翻译以及多语言信息服务,给予不同语言游客的了解溝通需求和桥梁。
二、机器语音识别现状
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。
但是机器语言翻译准确率还不够高,对于旅游文化当中的文化翻译,习语翻译等无法恰当让接受者理解,这就需要建立一个强大而准确的语言资料数据库,汇集优秀翻译。
1.语音识别系统设计的技术依据。语音识别是计算机翻译软件不可缺少的一部分,主要针对不同语言进行识别处理,帮助游客快速地了解景区。语音识别技术主要包括:特征提取技术、模式匹配技术两大技术,也是系统设计需考虑的重点。
2.特征提取技术。一般来说,语音识别系统辅助功能涉及到收录、处理、传递等三个环节,这也是语音识别系统设计的关键所在。计算机语言与自然语言之间存在极大的差异性,如何准确识别两种语言的差异性,这是翻译软件识别时必须解决的问题。
3.模式匹配技术。模式匹配技术采用智能识别器,由翻译器录入语音之后自主化识别、分析,减小了人工翻译语句的难度。
三、双语翻译器语音识别系统设计及应用
双语(多语言)景点翻译器是外国游客的操作工具,游客翻译器功能可准确地理解景点名称、特色,这对语音识别系统设计提出了更多要求。设计语音识别系统要考虑翻译器具体的工作流程,事先编排一套符合翻译软件工作的方案,提高人机语言转换速率。语音识别系统设计及应用情况:
1.识别模块。语音识别方法主要是模式匹配法,根据不同翻译要求进行匹配处理,实现英语翻译的精准性。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
2.前端模块。前端处理是指在特征提取之前,先对原始语音进行处理,这是预处理操作的主要作用。语音识别系统常受到外界干扰而降低了翻译的准确性,设计前段处理模块可消除部分噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。例如,比较常用的前端处理有端点检测和语音增强。
3.声学模块。语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。声学特征的提取与选择是语音识别的一个重要环节,这一步骤直接关系到翻译器的工作效能,对英语语音识别有很大的影响。
4.搜索模块。英语语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。
5.执行模块。实际应用中,语言识别系统凭借执行模块完成操作,对英语语言识别方式进行优化择取,以最佳状态完成英语翻译工作。
四、结语
随着信息化建设时期进入成熟期,英汉双语语音识别系统将彻底改变了传统人工翻译模式的不足。但是,存在的问题也有很多,比如英汉双语翻译内容越来越复杂,翻译器语音识别系统承载的数据范围更广,必须实施更新翻译软件产品,才能进一步提升英汉双语语音识别的智能化翻译水平。
参考文献:
[1]丁大刚.旅游英语的语言特点与翻译[M].上海:上海交通大学出版社,2008:78
[2]孙广治.旅游景点介绍的汉英翻译实践报告-以陕西关中地区为例[J].《黑龙江大学学报》,2014.(10):25-26
[3]杜卫卫.英语翻译器语音识别系统设计[J].《电子测试杂志》,2015.(4):38-40