大学英语四、六级考试(CET)汉英段落翻译中的多模态大数据信息检索策略
曾江霞
摘 要:大学英语四、六级考试(CET)汉英段落翻译每年考试后都会有神翻译上热搜,表明学生在翻译遣词造句方面存在较多困惑。文章采用多模态大数据思维理念,将传统工具书和网络词典等工具结合,按CET段落翻译常见主题(中国的文化、历史及社会发展)和翻译标准,提供更精准、个性化的翻译信息检索策略, 搜索文本、图片、音视频等多模态信息。并针对词汇、术语和习惯表达,通过案例探析CET段落翻译信息检索策略,结果发现:机器翻译和在线词典检索可搜索基础信息,但有时有歧义。在机器翻译和在线词典的基础上,用在线百科全书、搜索引擎、术语库、语料库和社交网络等工具进行个性化搜索组合,可营造文本、图片、音视频和海量网络语料的多模态大数据语境,能够更准确地选择合乎语境的地道表达,还可发现、积累多模态学习材料,提高大学英语翻译教学信息素养。
关键词:大学英语四、六级考试;汉英段落翻译;多模态大数据;信息检索策略;信息素养
中图分类号:H310.42;G434 ? ? ?文献标志码:B ? ? ? 文章编号:1673-8454(2021)02-0048-05
一、引言
全国大学英语四、六级考试(College English Test,以下简称CET)中的汉英段落翻译题型有着极高的社会关注度。每年两次考试后,CET神翻译都会上网络、微博、知乎等的热搜,甚至上央视新闻[1](见图1),引发了学生的各种吐槽。如2019年12月四级“四代同堂”译为four people in one home,六级调侃“荷花开了我自闭了”,卷子质量很好,下次再来……这些吐槽揭示的主要是词汇(包括专业领域术语)、句法学习中的汉式英语和生造词。这表明学生具备一定的信息素养,有问题会在网络释放信息。在信息时代可以顺应国家政策和学生特点,通过提高学生在英语学习中的信息素养改善学习质量。《教育信息化2.0行动计划》的出台 [2]顺应了信息技术的发展,推进了“互联网+教育”,制定了信息素养全面提升行动计划,加强了教师和学生的信息素养。
大数据时代具有文本、音视频、网页等多模态特征。大数据与深度学习结合促进了人工智能应用[3],带来更多智能化搜索体验,往往可以在日常英语教学中运用传统工具书和多模态的翻译信息检索确立较规范准确的表达。
当前已有一些翻译信息检索的相关研究:王华树、李莹[4]概述了大数据和人工智能时代的新特点,提出互聯网信息检索是当代大学生信息素养的一个重要体现,介绍了搜索引擎(分类、方法等)及文档、图片、音视频等网络搜索的案例。卢植、胡健[5]评估了网页、在线词典、数据库、术语库、翻译记忆库、语料库、在线机器翻译和自媒体等主要网络资源在术语检索验证中的优劣。
信息检索在翻译教学和实践中越来越重要,但缺乏针对性的翻译检索策略的普及与拓展。大多数大学生检索词汇常用词典和一些机器翻译,缺乏更多的组合检索策略,可能影响检索结果的准确性。笔者结合多模态大数据相关理念、CET相关要求,分析翻译信息检索策略案例,主要是词汇、表达和术语检索,为CET和大学英语翻译教学提供了大数据时代新思路,提高了大学英语翻译教学中的信息素养。
二、多模态大数据、大学英语四六级考试(CET)段落翻译信息检索概论
1.多模态大数据理论
大数据时代具备多模态大数据特征。大数据是指结构化(如数字、字母等信息)和非结构化(文本、音视频和网页等多媒体内容)的海量数据集合。Mayer-Sch?觟nberger[6]指出,大数据时代由于处处皆可数据化(Datafication),要具备大数据思维,向更多、更杂、相关性三个思维转变。多模态话语分析将对语言本身的研究拓展到图像、声音等多模态意义资源,以及相关的媒体(Media)技术(如纸、印刷、计算机、软件和硬件等)研究[7]。可见大数据具有文本、音视频、网页等多模态特征,形成多模态大数据特征。
在大数据时代,海量的信息资源及其价值开发与利用成了重要的议题,信息检索是其中重要的手段和技能,也是信息素养的重要体现。信息素养的概念不断扩大,除了表示发现、检索、分析和利用信息外,还包括数据素养 (Data Literacy,如对数据的敏感性、收集、分析、利用和批判性思维等)、媒介与信息素养(Media and Information Literacy,如微信、微博、在线社群等)和视觉素养(Visual Literacy,如图片搜索、信息可视化等)。这些专业技能通常被称为“ 21 世纪的必备技能”[8] [9]。这意味着信息检索的维度也具备多模态大数据特征。
翻译信息检索总体上要具备多模态大数据思维:
(1)通过传统和大数据驱动的网络多种信息检索平台。G?觟pferich[10]概括了翻译能力中的工具和研究能力(tools and research competence),主要包括传统和电子工具使用能力,如参考书、词典、百科全书、术语库及其他数据库、平行文本、搜索引擎、语料库、术语和翻译管理系统、机器翻译系统等,平台可参照以上工具。
汉英翻译和英语写作中通常用的工具包括:①在线词典主要查基本表达,如有道词典、必应词典、朗文和牛津词典。其中,有道词典嵌入了牛津、新牛津、韦氏和柯林斯。②机器翻译查初步用法,如有道、谷歌、百度、必应、搜狗。③搜索引擎主要使用必应国内和国际版,在线百科主要进一步明确词义内涵,如不列颠百科和自由百科。④语料库主要可搜索本族语口笔语地道表达、单词搭配和文化背景,如当代美国英语语料库COCA、英语国家语料库BNC和lingle10^12(https://www. linggle.com/)语料库搜索引擎。⑤术语库查较规范、权威的术语表达,如全国科学技术名词审定委员会推出的权威词典术语在线(http://www.termonline.cn/ index.htm)。
(2)在信息检索中根据具体的文本类型提取信息,可能搜索文本、图片、图像、音视频等多模态信息。要注意多种传播媒介传达的信息资源,包括知乎、微博等社交媒体,多媒体(印刷、电子书及电子资源、声音、影像、计算机网络等)、超媒体(多媒体与超文本结合的超链接技术)等传播渠道,电脑、平板、手机等不同介质。
(3)由于大数据容量巨大,为实现更个性化和更精准的搜索,搜索引擎、语料库等有时要进行高级检索,有时使用通配符如星号(*)、等号(=)等。
2.大学英语四、六级考试(CET)段落翻译要求与翻译信息检索
CET翻译要求可为信息检索提供范围与标准参考。据《全国大学英语四、六级考试大纲(2016年修订版)》(以下简称《大纲》)[11],CET四、六级翻译题型要求如下:要求考生能将题材熟悉、语言难度较低(四级)/中等(六级)的汉语段落译成英语,段落内容涉及中国的文化、历史及社会发展。译文基本准确地表达原文的意思,语句通顺,句式和用词较为恰当(四级)/句式运用恰当,用词贴切(六级),能运用基本的(四级)/较好地运用(六级)翻译策略。能在半小时内将长度为140—160(四级)/180—200(六级)个汉字的段落译为英语。试题呈现的是一个或几个汉语段落,不含生僻的专业词汇或习语。六级内容略高于四级。要求考生在规定时间(30分钟)将汉语段落译成英语,分值15分。
据《大纲》 [11] 要求,目前的CET翻译题评分标准采用了总体印象式评分,满分为15分,分为五个档次:14分档(13—15分)、11分档(10—12分)、8分档(7—9分)、5分档(4—6分)和2分档(1—3分)。其衡量标准涉及表达原文意思准确,译文流畅,语言通顺、连贯和准确,是否有语言错误等方面,根据其不同程度定档。这些要求实际上说明了翻译标准,用词和句式贴切是重要内容。白玲等[12]归纳了笔译量表中的典型笔译特征,即准确性、完整性、得体性、连贯性和规范性,可作为翻译标准参考。
规范性具体标准可参照翻译国家标准《翻译服务译文质量要求》(GB/T 19682-2005)[13]中的基本要求:①忠实原文,完整、准确地表达原文信息,无核心语义差错;②术语统一,术语符合目标语言的行业专业通用标准或习惯,并前后一致;③行文通顺,符合目标语言文字规范和表达习惯,行文清晰易懂。
中国英语能力等级量表翻译策略可为信息检索策略提供参考。由于CET相當于量表的5—6级[14],可参照其中的笔译能力分量表5—6级译前、译中和译后翻译策略[15]:译前能明确翻译目的,根据翻译任务合理规划翻译过程,能借助工具书或网络资源等常见翻译辅助工具了解相关专业知识,确定专业词汇意义;译中能根据需要进行增补或删减,转换句式;译后能借助工具书和网络资源修正译文用词和语法,主要是译文在信息完整、内容忠实等方面存在的问题。可见其中工具书和网络资源检索起很重要的作用。
总之,翻译信息检索可紧扣大学英语四、六级考试(CET)段落翻译主题——中国的文化、历史及社会发展,注意翻译总体准确、规范,词句贴切,术语一致,同时可参照中国英语笔译能力分量表翻译策略。
三、大学英语四、六级考试(CET)段落翻译中的信息检索案例分析
如果仅用机器翻译、在线词典和检索,有时会发现信息缺失或多种意义歧义,还需进一步明确上下文中具体选择。通常会叠加搜索引擎、语料库为查询地道表达提供多模态语境。现有一些理论加案例研究主要针对:谷歌[16]、百度[4]搜索引擎,维基百科[4],COCA语料库的写作纠错[17]以及COCA语料库在翻译中术语、短语查证和通配符例证 [18],Webcorp语料库的网络查询技巧[16]。许多研究需要普及并拓展一些用法。
以下主要针对CET汉英翻译,用案例展示组合各种工具的翻译检索策略,主要包括机器翻译、在线词典、百科全书、搜索引擎(主要是必应)、术语库(主要用“术语在线”)和语料库(主要用COCA更多应用功能,如搭配)。案例中主要针对划线部分的表达进行检索。
1.用传统、网络词典及语料库检索查相邻词搭配
例1:不久前,中国获得了在印度尼西亚(Indonesia)建造一条高铁的合同;中国还与马来西亚(Malaysia)签署了为其提供高速列车的合同。(CET6-2015)
网络译文:Not long ago, China not only obtained a contract for construction of a high-speed rail in Indonesia, but also signed a contract with Malaysia to provide high-speed trains...
改译: Not long ago, China not only won/got a contract to build a high-speed rail in Indonesia…
为验证“获得了在印度尼西亚(Indonesia)建造一条高铁的合同”表达,主要查“合同”contract一词的搭配,可以用牛津(嵌入有道中)以及朗文在线词典。牛津词典搭配为contract to do sth.,如to win/(get)/be awarded a contract to build a new school (获得承建一所新学校的合同),contract with sb.,如to enter into/make/sign a contract with the supplier (与供应商签合同)。朗文词典搭配为have/ sign/ enter(into)/ agree to/make/negotiate/ break/ draw up/win(get) a contract。
语料库COCA中用List一栏用_v* a contract查a contract之前所有动词(或在POS中选择verb.ALL放到a contract之前),可发现sign/have/get/win/ award/negotiate/make…+ a contract。可知“获得……合同”用obtain a contract不够地道。根据汉语上下文选择合适英译词,改为win/get a contract to build a high-speed rail,而sign a contract with sb.网络译文搭配可行。
2.用权威在线术语库确立规范化术语表达
例2:由于通信网络的快速发展,中国智能手机用户数量近年来以惊人的速度增长。这极大地改变了许多人的阅读方式。(CET4-2018)
“通信网络”网络译文:communications network/ communication networks/ communication network…
“通信网络”改译: communication network
查询“通信网络”的英译,先可查见有道词典多个表达:communication network、communications network、 telecommunication network、CCCNET,network of communication。为确认更准确、规范地表达,可查经全国科技名词审定委员会审定权威词典“術语在线” ,其中“通信网络”表达为communication network。
3.用机器翻译、在线词典、百科全书、搜索引擎等平行文本验证词汇与习惯表达
例3:荷花迎骄阳而不惧,出污泥而不染,象征纯洁、高雅……(CET6-2019)
网络译文:Lotus, as it does not fear the strong sunshine and keeps clean in the dirty soil, symbolizes purity and elegance and represents people's noble morals.
改译:Braving/facing the blazing sun fearless and rising from(or: growing out of)the mud unstained, the lotus represents/ symbolizes purity and elegance (or: lotus flowers represent/symbolize purity and elegance).
通常按由粗放到细致,遵循机器翻译、在线词典、在线百科、搜索引擎和语料库等话题相似的中英文平行文本验证顺序,主要查“出污泥而不染”表达,简要查“迎骄阳而不惧”,同时为查内容相似的平行文本以考察多模态语境要查“荷花”的各种表达。主要检索策略如下:
(1)用机器翻译(如谷歌)查表达,“荷花”为lotus,“出污泥而不染” 为sluge without staining,不能直接使用。
(2)进一步用词典检索,如必应词典,可查常见意思和网络释义,有的配图片。查“荷花”为lotus、 lotus flower,网络释义为 Nelumbo nucifera和water lily,并配有荷花图片。查water lily指“睡莲”(a plant that floats on the surface of water, with large round flat leaves and white, yellow or pink flowers),在有道词典里牛津、新牛津、韦氏和柯林斯查,都指“睡莲”。 “出污泥而不染”为come out of the dirty mud unsoiled、 emerge unstained from the filth、 rise unsullied from mud (referring to water lilies) 和remain undefiled in spite of general corruption, vice, etc。
(3)进一步查百科全书,确立不同英文翻译的细微意思差别。在“不列颠百科全书”(https://www.britannica.com/plant/ lotus- plant-common-name)中查lotus,可知其有约100个品种,分布在欧亚非和北美温带地区(containing about 100 species distributed in temperate regions of Europe, Asia, Africa, and North America),Nelumbo nucifera(荷花、中国莲)是亚洲热带和亚热带Nelumbonaceae (莲科)水生植物一种。
(4)查搜索引擎获得专业性同主题相似平行文本,选择合乎语境的“荷花”词义以及“出污泥而不染”的可能英语表达。以lotus flower为关键词查必应搜索引擎,可在园艺中查荷花类型(https://www. homestratosphere. com/ types-of- lotus-flowers/)。根据所查英语(Lotus flowers are floating aquatic plants from the Nelumbo family and are native to southern Asia and Australia. The pink lotus is the national flower for both India and Vietnam while Korea, China and Japan celebrate the flower's beauty by holding the Lotus Festival.),可知lotus和lotus flowers都可用。
按照中国的荷花为标准,查有关中国花英文网站如http:// www.thedailychina.org/ the-symbols -of-chinese-flowers/,相关文章可知lotus的各部分有不同意义,荷花出淤泥而不染(Generally, the lotus represents virtues of purity. Furthermore, the different parts of the Lotus can have different representations and meanings. The flowers of the lotus represent enlightenment. …This flower is also known as a gentleman's flower — it grows out from the mud, pure and unstained.)。黑体字部分即为“出污泥而不染”可参照的平行文本。
(5)可查知乎中荷花与睡莲的差异,有生态学专业人士答复,如“睡莲、水莲、莲花、荷花有什么区别?”(https://www.zhihu.com/question/35580000)
总之,荷花(lotus/ lotus flower)是水生植物,water lily通常表示“睡莲”。“出淤泥而不染” 中的“淤泥”不译为“土壤”soil,如keeps clean in the dirty soil,而是“污泥”mud,可借鉴grows out from the mud, pure and unstained译法和词典中的搭配。
4.用相关主题书籍和搜索引擎搜文本、视频等平行文本检索习惯表达
例4:和睦的大家庭曾非常令人美慕。过去四代同堂并不少见。(CET4-2019)
网络译文:The harmonious family used to be particularly enviable. It's not rare for four generations live together in the past.
改译:A harmonious extended family was the envy of many people, and it was common to see four generations under one roof(or: four generations in an extended household).
可通过以下步骤检索习惯表达“大家庭”和“四代同堂”:可以查阅与家庭文化相关的书籍,如Blair[19]中Humans in Families一章提到“大家庭” [A senior male dominates the family, whether defined as several generations in an extended household or in more recent times, as a nuclear family (one couple plus their children)],其中的extended family就指由祖父母(grandparents)和叔伯/舅舅(uncle)、姑妈/姨妈(aunt)等组成的大家庭。还可用网络词典查初步表达,结合搜索引擎验证。
如在有道查“四代同堂”表达为four generations, 以及网络释义We Are Family和four generations in one house。在此信息提示下,将four generations作为备选翻译关鍵词,在必应搜索的国内版搜索“four generations 四代同堂”可搜到音视频图文并茂的报道,如2019年1月出现在China Plus的《“四世同堂”短视频爆火 "Four generations under one roof" video goes viral》(http://chinaplus.cri.cn/nihao/learn-through-news/27/20190108/233198.html)和中国日报“英语点津”的《抖音“四世同堂”短视频火遍全球,中国式亲情暖哭外国网友》(http://language.chinadaily.com.cn/a/201901/13/WS5c3a8d90a 3106c 65c34e4140.html)。报道中“四代同堂”表达为four generations under one roof,随之自然传播到海内外。
四、结束语
《教育信息化2.0行动计划》提出加强师生信息素养的目标,结合大数据时代文本、音视频、网页等多模态大数据特征,翻译信息检索总体上要具备多模态大数据思维:主要运用参考书、机器翻译、在线词典、百科全书、术语库、搜索引擎和语料库等多种工具,搜索文本、图片、图像、音视频等多模态信息,通过高级检索和通配符等进行精准和个性化检索。翻译信息检索可紧扣大学英语四、六级考试(CET)段落翻译主题,即中国的文化、历史及社会发展,注意词句贴切,术语一致,翻译总体准确、流畅、规范,检索策略可参照中国英语能力等级量表中的笔译能力分量表。
CET案例分析主要针对不同重点,应用了不同翻译检索策略:用传统、网络词典及语料库检索查相邻词搭配,表达更地道;用权威在线术语库使术语表达更权威;在线词典和机器翻译通常会聚合多种网络词义,需根据上下文进一步了解内涵,用机器翻译、在线词典、百科全书、搜索引擎和语料库等平行文本验证地道表达;用相关主题书籍和搜索引擎搜文本、视频等平行文本表达。案例表明:翻译信息检索策略往往根据具体任务和目标灵活组织,除了机器翻译和在线词典的基本检索,用百科全书、搜索引擎(如必应)、术语库(如“术语在线”)、语料库(如COCA)和社交网络等工具组合搜索搭配、术语和习惯表达,可营造更好的文本、图片、音视频和海量语料的多模态大数据语境,使英语表达更地道。
在检索过程中往往还能找到相关的书籍、在线音视频等学习材料,聚焦CET翻译题型常见话题,将检索和长期积累结合起来,有利于培养学生探究式学习习惯,提高大学英语翻译教学信息素养,用英语讲好中国故事,为增进全球社会、科技文化交流打下基础。
参考文献:
[1]央视新闻客户端.当四六级遇上神翻译 来跟央视小编学英语[EB/OL]. http://m.news.cctv.com/2019/12/14/ARTItJnUbQTrPvk85Cflvhsq191214.shtml.
[2]教技[2018]6号.教育部关于印发《教育信息化2.0行动计划》的通知[Z].
[3]李开复,王咏刚.人工智能[M].北京:文化发展出版社,2017.
[4]王华树,李莹.翻译技术简明教程[M].北京:世界图书出版公司,2018.
[5]卢植,胡健.术语翻译的网络检索策略研究[J].上海翻译,2019(2):72-77+95.
[6]Mayer-Sch?觟nberger V & K. Cukier . Big Data: A Revolution that Will Transform How We Live, Work and Think[M]. London: John Murray,2013.
[7]O'Halloran K L & B A Smith. Multimodality and Technology[A]. In Chapelle, C.(eds.) The Encyclopedia of Applied Linguistics[C].Oxford: Blackwell/Wiley,2013.
[8]黄如花,钟雨祺,熊婉盈.国内外信息素养类MOOC的调查与分析[J].图书与情报,2014(6):1-7.
[9]黄如花,李白杨.MOOC背景下信息素养教育的变革[J].图书情报知识,2015(4):14-25.
[10]G?觟pferich S. Towards a model of translation competence and its acquisition: the longitudinal study TransComp[J].Behind the mind: Methods, models and results in translation process research,2009(4):11-37.
[11]全國大学英语四、六级考试委员会.《全国大学英语四、六级考试大纲(2016年修订版)》[EB/OL]. http://cet.neea.edu.cn/html1/folder/16113/1588-1.htm.
[12]白玲,冯莉,严明.中国英语笔译能力等级量表的构念与原则[J].现代外语,2018,41(1):101-110+147.
[13]GB/T 19682-2005.翻译服务译文质量要求[S].
[14]王守仁.中国英语能力等级量表在大学英语教学中的应用[J].外语教学,2018(4):1-4.
[15]GF0018-2018.中国英语能力等级量表(China's Standards of English Language Ability)[S].
[16]李长栓.非文学翻译理论与实践[M].北京:中译出版社,2012.
[17]张高峰,史晓燕.语料库在英语写作教学纠错反馈中的应用[J].中国教育信息化,2018(4):68-71.
[18]王华树.翻译技术教程(上、下册)[M].北京:商务印书馆,2017.
[19]Blair, J.G. Western Civilization with Chinese Comparisons (Third Edition)[M].Shanghai: Fudan University Press,2010:110.(编辑:李晓萍)