基于平行语料库的中国特色词汇双语词表建设

    刘芳

    

    

    摘要:为了解决四六级新题型段落翻译中中国特色词汇翻译难问题,该研究使用《用英语说中国》系列丛书,建立微型汉英平行语料库,使用主题词生成软件和平行检索软件,建成中国特色词汇双语词表。文章简述了词表编制过程及该词表的应用。

    关键词:语料库;翻译;双语词表

    1引言

    新四六级考试中增加了汉译英段落翻译,根据大纲要求翻译内容涉及中国的历史、文化、经济、社会发展等。以2014年12月六级翻译为例,三套题目分别涉及到中国的经济发展,文学艺术以及教育三方面,其中出现了一系列具有中国特色的词汇,如计划经济、市场经济、十二五规划、医保、道家、儒家、书生、吟诗作画、大学文凭、职业学院、欠发达地区和外来务工人员等。由于很难在英语中找到对应词,它们往往成为翻译中的障碍或难点。因此本研究计划利用《用英语说中国》系列丛书,建设中国特色词汇双语词表,以期规范翻译,辅助教学。

    2双语词表建设过程

    本研究所用文本收集自《用英语说中国》丛书,20082009年间由上海科学普及出版社发行,北京浩瀚英语研究所制作。共12册,50余万字,分别为历史、民俗、艺术、文化、名城、名人、旅游、体育、名校、影视、科技和经济。本丛书采用汉英对应的形式,旨在向外国友人介绍中国并为中国的英语学习者提供帮助。下面简要介绍一下《用英语说中国》平行语料库的建设过程及双语词表的提取。

    首先,将该丛书扫描为电子文本,人工核对、去杂后整理成清洁文本。每本书包括若干个汉英文本,将12册书按内容整理成19个类别,分别为:旅游、名城、名人、名校、经济、古代科技、近代科技、古代史、近代史、传统体育、现代体育、国画、建筑、美食、民间表演、民间工艺、文学、影视及传统习俗。按类别加序号命名,分别整理成该丛书的汉英单语语料库。其次,采用句子对齐的级别,人工将汉英文本对齐。第三,利用北京外国语大学许家金教授研发的BFSU Powerconc软件分别作出19个类别的汉语词表以及全套书的汉语词表,词表按词出现的高低排序。因为汉语分词问题较复杂,本研究分别选取了汉语的2词、3词、4词、5词及6词词表。第四,利用北京外国语大学梁茂成教授研发的keyword plus软件,将每类5个词表分别与总体的5个词表相比较,得出每个类别的5个主题词表,主题性按loglikelihood(对数似然率)从大到小排列,取对数似然率大于3.84的词。图1为古代科技类的4字主题词表。第五,人工检查每个类别的主题词表,去除无翻译意义的词。通过该方法获得的汉语主题词是由出现频率决定的,因此不可避免地会遗漏一些出现频率不高的汉语文化主题词,为了弥补这一不足,可增补人工筛选的主题词,放在每个主题词表的最后。第六,利用Paracon软件,加载双语平行语料,检索所有主题词,记录其各种翻译形式,建成双语词表。如表1所示,以“传统习俗”类的2字和4字词表为例(篇幅所限仅取前10个词)。

    3结语

    为了解决四六级翻译中中国特色词汇翻译难问题,该研究使用《用英语说中国》系列丛书,建立微型汉英平行语料库,首先在汉语文本中找到关于中国历史文化经济等方面的19类主题词(每类分别取2字至6字的词),然后利用平行语料库检索软件检索出这些主题词的各种翻译方法,建成双语词表。该词表具有以下优点:(1)基于真实文本,翻译较为系统准确。(2)主题词表的排列基于词频,出现频率高的词在前,符合习得顺序。(3)类别划分清晰,查找方便,可作为学生自学的素材。(4)教师还可利用该词表引导学生进行汉语文化主题词翻译方法和翻译策略的研究。

相关文章!
  • 融合正向建模与反求计算的车用

    崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
    摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了

  • 浅谈高校多媒体教育技术的应用

    聂森摘要:在科学技术蓬勃发展的今天,我国教育领域改革之中也逐渐引用了先进技术,如多媒体技术、网络技术等,对于提高教育教学水平有很

  • 卫星天线过顶盲区时机分析

    晁宁+罗晓英+杨新龙<br />
    摘 要: 分析直角坐标框架结构平台和极坐标框架平台结构星载天线在各自盲区状态区域附近的发散问题。通过建