湖州市旅游外宣材料汉俄平行语料库建设及应用研究
李国华 陈陈林
摘要:在“一带一路”倡议快速发展的今天,湖州作为江南历史文化名城和“乡村旅游”、“两山理论”诞生地,来湖旅游、留学或参加国际会议的原俄语区国家人数与日俱增。目前看来,国内关于语料库的建设还很缺乏,各地所建立的旅游外宣语料库以“汉英”平行语料库为主,而另一方面湖州市与独联体各国家文化、科技交流日益密切,英语外宣很难满足俄语区游客需求。因此,建立“汉俄”双语平行语料库是一种必然。文章在探讨“汉俄语料库”建设过程基础上并展望该语料库的前景。
关键词:旅游语料库;汉俄;湖州
中图分类号:H35文献标识码:A文章编号:1003-2177(2020)05-0013-03
0 引言
2016年12月湖州市政府发布了《湖州市旅游发展总体规划》。《规划》中明确指出要改变目前湖州外向发展程度低的局面,加快湖州旅游国际化步伐,提升湖州旅游产品和旅游服务的国际化水平,提升湖州入境旅游的核心竞争力。旅游景区和旅游公示语的俄语翻译起到了关键作用。一方面为入境游客提供方便,另一方面能够更好的展现湖州形象。语料库是应用计算机技术对大量自然语言材料进行处理、储存,以供检索、索引和统计分析的大型資料库[1]。储存在语料库中的文本是整合湖州旅游外宣材料的重要资源。除了起到旅游外宣材料作用之外,语料库的建成还可以应用到外语教学,外语研究等诸多方面。本文就建设湖州旅游外宣汉俄双语语料库的研究为出发点,并探究语料库在湖州旅游和外语教学中的更多应用。
1 国内外研究现状
平行语料库实质上是指两种不同的语言以译文对应形式储存在统一语料库中,在使用者需要检索某一特定关键词时,包含此关键词的句段可以呈现出来。旅游双语语料库是出于某些特定的研究目的而收集旅游领域的语料文本建立起来的语料库[2]。
目前国内外语料库研究已取得较大进展,各语种各领域涉及广泛,但是旅游双语语料库仍较为少见。国外较知名的旅游领域语料库研究有英国埃塞克斯大学,2007年研究建成的37,795词的英语旅游文本语料库,还有日本大学所建成的单语语料库,其中涉及介绍京都旅游文本885篇。国内较大规模的是香港理工大学所建立的200万字的新型双语语料库。上海外国语大学于2019年筹备成立“上海外国语大学语料库研究中心”。根据CNKI数据显示,国内关于双语语料库研究发表的文章仅53篇(截至2020年1月4日),且绝大多数是汉英双语语料库研究。目前同其他语种的语料库建设有“云南省旅游汉日平行语料库”和“内蒙古旅游外宣蒙汉英三语平行语料库”等。
综上所述,国内语料库研究取得一定进展,但是各地语料库不开放且区域地理历史文化不同、语料库文本语言不同,借鉴性较小。可见,建立一个汉俄双语语料库前景十分令人期待。所以,湖州市旅游汉俄双语语料库的创建是多应用的,不仅能够起到服务地方,宣传城市的作用,还可以为俄语教学学习者提供材料,为今后湖州地区的俄语外宣材料的继续丰富打下基础。
2 建立湖州市汉俄双语语料库的意义
湖州市作为江南历史文化名城,“丝绸文化”起源地,“美丽乡村”和“两山理论”诞生地,旅游资源丰富,自然、人文景观独特,本语料库建设具有重大意义。
2.1 提升城市形象,扩大城市国际影响力
湖州市先后获评国家环保模范城市、国家卫生城市、国家园林城市、中国优秀旅游城市、中国魅力城市、全国城市综合实力百强市、国家森林城市等荣誉称号,并成为全国首个地市级生态文明先行示范区。湖州既有南浔古镇、丝绸小镇等人文景观,又有莫干山、南太湖等自然景观,近年来成为“美丽乡村”的样板地,中国童装城等现代工业享誉世界。
湖州市的旅游业蓬勃发展,来湖旅游、工作的一带一路沿线的俄语区国家公民逐年增多,前景光明,“世界乡村旅游大会”、“中国治理的世界意义”等国际会议在湖州成功举办,湖州文化正在不断的走出去。但是外国游客了解湖州主要通过博物馆、景区等地的英语标识语,而俄语区国家公民普遍英语程度掌握低,不能深入了解湖州文化。因此,建立汉俄旅游语料库能够促进湖州在一带一路沿线的国家的知名度提升,能够较早的在俄语国家建立“湖州品牌”。
2.2 提高翻译人才素质,服务地方发展
近年来在湖州召开的国际会议中,关于旅游文化的领域逐年增多,而且近年来湖州建立了同乌克兰合建的“新兴技术研究院”。同乌克兰、白俄罗斯、阿塞拜疆共同建立的“跨文化研究中心”。这就预示了湖州将同一带一路沿线俄语国家展开密切合作,而翻译工作不可忽视,笔者发现,在重大活动时,人力的翻译费时费力,而语料库的存在可以极大提高工作效率。另外,湖州市内举办的对外活动俄语翻译多为外聘翻译或高校内俄语优秀的大学生,但是他们对湖州文化缺乏了解,不知该如何介绍湖州,本语料库可以作为教学工具和文化素材。
3 湖州市旅游外宣材料汉俄平行语料库的创建
具体流程如图1所示。
语料库的设计规划:对语料库内容的总体设计;
语料的收集与整理:收集文本、翻译文本、清洁文本;
语料的预处理:将语料分为汉语,俄语两种文本分别储存在word文档;
语料的加工:将翻译好的文本实现主体句级对译,特色词汇词级对译;
语料的存储:使用TXT纯文本形式将汉俄预料存放于两个文档中;
语料库检索:导入到检索软件中实现检索功能。
3.1 语料库的总体设计
本语料库的建设主要按照湖州市各行政区介绍,湖州市著名历史文化遗产介绍,湖州著名非物质文化遗产介绍分为三个方面。语料库中存有的语料都应该是在语言的实际运用中真实出现过的,并且能够真实地反映当地的民风物貌[3]。这三个方面的内容将选取具有代表性的内容,自然、人文景观以各个区县为中心,包括“两山理论”、“湖商精神”等湖州优秀的思想传统。将形成以汉语为原语,以俄语为译语,经过加工形成在句子层面进行对齐的湖州市旅游汉俄双语平行语料库。
3.2语料搜集与整理
语料的搜集与整理是语料库建设的基础。主要内容涉及:
(1)收集原始汉俄双语语料,这些语料主要来源于湖州市政府官网、对外宣传官方资料、地方旅游与宣传主管部门网站及纸质资料、调研期间收集到的旅游景点的官方介绍、景区内标牌以及个别翻译工作者和旅游从业者长期积累的精品资料。如湖州市政府官网,南太湖论坛,俄罗斯网站Яндекс等;(2)对采集到的语料进行筛选和增补,根据人们的阅读习惯和官方的常用表述,选取具有代表性,质量较高的精品双语语料;(3)将搜集到的语料输入电脑建立统一格式的电子文本,分组进行翻译;(4)查漏补缺,对部分非常重要但缺乏对应俄语文本的资料,组织专业翻译人员进行翻译,再把对应俄文语料补充进去;(5)关键性特色词汇审定。我们将组建熟练掌握俄语文化的专家审定小组,对汉俄双语语料中的关键性特色词汇进行审定。
3.3 语料的预处理
当准备入库的语料被确定之后,我们需要人工清洁文本,将清洁后的汉俄文本分别以相同格式储存在不同文档中,我们采用WPS來进行电子文本形式储存。
3.4 语料加工
收集完成的汉俄双语语料经过以上处理之后,需要做语句对齐处理。语料间的对齐是平行语料库中的关键步骤。我们进行双语对齐的时候,对于少数湖州市的特色词汇我们将从语料中选取对应的俄语词汇进行词级对齐,由于汉语俄语分属不同语系,实现大量词级对齐难度较大,所以其他语料主要实现句级对齐。少数较为成熟的,稳定的常用语料语段实现段落对齐,我们采用txmall软件进行自动对齐校正。
3.5 语料储存
我们在语料储存时选择将汉语俄语文本放在两个不同的文档中,为避免日后语料选择的冗杂,我们选择将不同内容素材放置在不同的文档中加以储存。
3.6 语料检索
初步建成的语料库不可避免地会出现错误。所以在日后的工作中,需要不断地改进语料库。然后对其进行扩充,不断地完善其内容和功能。如果分别储存汉俄语料检索时,就有必要借助平行语料的工具。我们采用TMROBOT进行双语检索测试,并之后再进行人工校对。
4 湖州市旅游汉俄双语平行语料库建设现状及前景展望
4.1 研究现状
(1)语料库建设的难点。本研究旨在建立一个语料内容真实,丰富全面,应用广泛的湖州地区旅游与外宣材料汉俄平行语料库。湖州市旅游汉俄平行语料库的建设在该地区是一项首创,在研究的过程中存在诸多比较难解决的问题。首先是语料的搜集问题。湖州市两区三县人文自然景观各不相同,历史文化深厚,分布也较为分散。如何搜集这些语料,尽量做到覆盖全面,是本项研究面临的第一个难点。
(2)其次是语料的整理与翻译工作。由于目前湖州地区乃至整个浙江地区旅游外宣资料俄语文本稀缺,现有的俄语语料问题重重,而且该地区俄语人才较少,难以对大量的陌生文本进行审校翻译。所以对所有语料进行人工整理、校对、审定,从而提高语料库的质量,对本研究是一个重大挑战。在翻译期间,我们借助了一些精度较高的辅助软件进行翻译。
(3)确保收入语料的效度需要大量的校正工作。在语料库建成之后,为建成大型地方旅游语料库,日后长期的校正,增补工作仍需人力来继续支持,这也是本语料库建设不可忽视的一部分。
4.2 前景展望
在计算机技术的支持下,双语平行语料库方法对湖州地区旅游事业产生影响。建成后的湖州市旅游汉俄双语平行语语料库将具有广泛的应用前景,主要包括以下方面:
(1)将开创性的在湖州地区建立俄语外宣材料,将为地方对外传播文化起到重要作用。笔者设想语料库建成后将有力推动湖州市在一带一路沿线俄语国家影响力,对接湖州市政府2020年出台的“南太湖人才”计划,吸引更多海外人才来湖发展。
(2)学习者旅游翻译语料库还可应用于旅游翻译“翻译教学大纲和教学教材的设计、语料库驱动翻译学习和翻译测试等领域的研究”[4]。推动俄语外宣材料建设发展,使旅游汉俄双语表达更加规范,为培养俄语旅游人才提供条件。
(3)可用作教学参考。语料库建成后,将在俄语教学中扮演重要角色,将积极促进语言研究和翻译教学。并且成为大学生实践的一块“试验田”,为学生综合能力发展打下基础。
5 结论
随着语料库建成后的广泛应用,湖州市旅游汉俄双语平行语料库可以对湖州入境旅游特别是针对一带一路国家民众在湖旅游起到重大作用。此外,本语料库还可以帮助规范旅游汉俄表达;进行语言教学和翻译教学,有利于促进湖州市旅游业的进一步发展。
参考文献
[1]和佳.云南省旅游汉日双语平行语料库的创建和应用[J].蚌埠学院学报,2017(6):99-103.
[2]卢蓉.“一带一路”背景下国内旅游文本平行语料库的建设及应用研究[J].文化创新比较研究,2019(25):108-109.
[3]陈昕媛.地方性旅游景区翻译语料库的创建及其应用[J].旅游管理研究,2015(12):39.
[4]黄娟娟.海丝本土双语旅游语料库建设构想——以泉州为例[J].外国语言文学,2016(4):249-253.
(责编:王锦)