高水平大学英语学习者英语演讲比赛即兴演讲的词汇丰富性研究
【摘要】词汇丰富性能够有效评价二语产出的质量。詞汇丰富性基于二语写作提出,而当前对口语的词汇丰富性研究相对较少。为此,本研究从词汇多样性、词汇复杂性、词汇密度和词汇偏误率四个维度定量分析高水平大学英语学习者英语演讲比赛即兴演讲语篇的词汇丰富性。研究结果显示:首先,对于高水平大学英语学习者的英语即兴演讲来说,词汇丰富性对演讲质量的提升有积极的作用,但演讲质量难以通过某一个词汇丰富性指标进行评定;其次,词汇复杂性与词汇偏误率二者关联紧密,且相比词汇复杂性,词汇偏误率对选手即兴演讲质量有较大影响;再次,词汇密度不适合区分高水平二语者口语产出质量。本研究对二语英语学习者口语的词汇丰富性分析进行了尝试,也为英语学习者提升口语能力提供了参考。
【关键词】大学生英语演讲比赛;即兴演讲;高水平二语口语;词汇丰富性
【作者简介】汪义忻(1998.08-),男,汉族,浙江衢州人,浙江大学外国语言文化与国际交流学院硕士研究生,研究方向:二语习得、计量语言学。
一、引言
词汇丰富性又称词汇多样性或词汇复杂性。在二语写作中,词汇丰富性反映了词汇得到有效使用的程度,是评价写作质量的一种方式 (Read, 2000)。为全面评价二语产出的质量,从不同角度出发,词汇丰富性包含不同的测量指标。在Read (2000)的研究中,词汇丰富性包括词汇多样性、词汇复杂性、词汇密度及词汇偏误率。近年,词汇丰富性在国内有关二语写作的研究中得到广泛应用。现有研究可分为三类:词汇丰富性与二语写作质量关系研究、二语写作中的词汇发展研究以及二语写作词汇丰富性对比研究(张晓东、任娇娇,2018)。在词汇丰富性与二语写作质量关系方面,汪顺玉(2011)分析了大学英语四级写作样卷的分数高低与词汇复杂度之间的关系,并探究了以不同的词汇复杂度指标分析不同质量英语作文的有效性。在二语写作词汇丰富性发展特征的历时研究方面,王海华、周祥(2012)和朱慧敏、王俊菊(2013)探究了大学生英语写作的词汇丰富性发展特征,探讨了整体词汇复杂度及具体词汇复杂度指标的历时变化;张会平(2020)则将中国英语初学者作为研究对象,对其二语写作词汇丰富性发展特征进行探究。而在二语写作词汇丰富性的对比研究方面,陈建林(2011)基于CEW语料库,发现了英语专业大学生在记叙文与说明文两种体裁的作文之间的词汇丰富性存在差异。虽然词汇丰富性这一概念基于写作提出,但同样存在对口语文本的词汇丰富性研究,如曹贤文、田鑫(2020)探究了任务构思条件对汉语二语口语产出中词汇丰富性的影响,纵向比较了两种任务构思条件下学习者的口语词汇复杂度的变化。相较于国外,国内对二语口语的词汇丰富性研究尚有较大发展潜力。而二语演讲作为二语口语的重要组成部分,其在词汇丰富性视角下存在的问题仍有待解答。基于此,本研究以Read (2000)对词汇丰富性的定义为理论框架,从词汇多样性、词汇复杂性、词汇密度和词汇偏误率四个角度研究高水平大学英语学习者英语演讲比赛中即兴演讲的词汇丰富性,探究高水平大学生在不同能力组之间演讲语篇的词汇复杂性是否存在差异,并借助量化数据尝试分析出现当前现象的动因。
二、研究设计
本研究使用的语料取自21世纪杯英语演讲比赛官方网站大学组演讲视频的即兴部分,将选手依照最终获奖级别从高到低分为三个组:顶尖组、次顶尖组和半决赛组。顶尖组包含全国总决赛的冠军、亚军和季军;次顶尖组包含获得全国总决赛一等奖和二等奖的选手;半决赛组包含入围全国半决赛,但没有晋级全国总决赛的选手。演讲语篇由人工转写,出现的语病不进行人为修正。得到顶尖组语料10725词,次顶尖组语料8637词,半决赛组语料9859词。在转写之后,本研究利用MATTR软件分析词汇多样性,利用Range软件分析词汇复杂性,利用Go Tagger进行词性标注,并手动检查词汇错误。实验数据由Excel进行汇总,使用SPSS进行数据分析。
三、数据分析与结果
1. 词汇多样性。常用的词汇多样性测量方法是TTR,但该方法对文本篇幅的变化适应性不佳,其结果会随篇幅增大而减小。基于此,MATTR这一方法能够弥补篇幅增大导致词汇多样性降低这一缺点。该方法选取特定长度的窗口,在文本中不断移动。窗口中获得的型例比经过平均之后得到移动平均型例比MATTR。本研究便使用MATTR作为衡量指标。不同于一般推荐使用的500词窗口大小,考虑到即兴演讲语篇的篇幅较短,500词窗口常超出篇章长度,本研究采用100词窗口测量词汇多样性。
2. 词汇复杂性。计算词汇复杂性的Range工具包含三个词表。第一个词表包含英语中最常用的前1000词,第二个词表包含英语中最常用的第二个1000词,紧随第一个词表之后。前两个词表中没有出现,但在高中和大学使用的文本中常用的词汇组成第三个词表。本研究使用该工具计算即兴演讲语篇中超过2000词词表外的词汇占总文本总长度的比例,将其作为词汇复杂性,根据 Read (2000)的观点,该指标能够反映二语使用者是否能精确而地道地使用二语进行表达。
3. 词汇密度。词汇密度指文中的实意词在全文中的比例,它能对文章的语义丰富性进行预测。实意词这一概念与功能词相对,包括动词(除系动词、情态动词外)、名词、形容词和副词(Ure, 1971)。词汇密度可以衡量语言使用者是否有效传达信息。
4. 词汇偏误率。词汇偏误率指出现错误的词汇占全文的比重。而在本研究中,演讲稿经过人为转写,因此不考虑词汇的拼写错误。
按照研究设计,我们得出的词汇丰富性描述性统计结果如下:
在第一个指标词汇多样性方面,通过SPSS计算得到每组文本的MATTR均服从正态分布,且方差具有齐性。进行单因素方差分析后,得到F(2, 68) = 4.599,p =0 .013, η2 =0 .119,可见存在显著的组间差异。事后检验显示,对于不同级别的选手,顶尖组与半决赛组之间的MATTR存在显著差异 (p =0 .045),次顶尖组与半决赛组之间的MATTR存在显著差异 (p =0 .033),但顶尖组与次顶尖组之间的MATTR不存在显著差异 (p = 1.000) 。
在第二个指标词汇复杂性方面,总计结果显示每一組文本超过2000词的词汇出现频数所占全文总词数的百分比符合正态分布。但通过方差齐性检验发现三组样本的方差不具备齐性。在进行不假定等方差的单因素方差分析后,得到结果显示,顶尖组与次顶尖组之间存在显著的组间差异 (p =0 .004),顶尖组与半决赛组之间不存在显著差异 (p =0 .608),次顶尖组与半决赛组之间不存在显著差异 (p = 0.162)。
在第三个指标:词汇密度方面,由于半决赛组内的样本不符合正态分布,因此使用K-W检验,结果显示三组之间在词汇密度上不呈现显著差异 (p =0 .466)。
在第四个指标:词汇偏误率上,由于半决赛组内的样本同样不符合正态分布,使用K-W检验后,结果显示三组之间在词汇偏误率上存在显著差异 (p =0 .010)。对于不同级别的选手,成对比较显示顶尖组与次顶尖组之间不存在显著差异 (p =0 .359),次顶尖组与半决赛组之间不存在显著差异 (p = 0.068),而顶尖组与半决赛组之间存在显著差异 (p =0 .003)。
四、讨论
本次对词汇丰富性的研究选用词汇多样性、词汇复杂性、词汇密度和词汇偏误率四个指标,对大学高水平英语演讲比赛即兴演讲语篇进行分析,数据显示:在词汇多样性上,顶尖组选手和次顶尖组选手之间难分胜负。但相比于进入决赛的两组选手,半决赛组选手则稍逊一筹。词汇多样性的差异反映了晋级决赛的选手在词汇的灵活使用上有着更高的水准,进一步说明了词汇多样性对高水平选手的重要性。
对于词汇复杂性,本研究认为应将其结合词汇偏误率进行解读,因为选手在使用相对更高级的词汇时,也承担着更高的出错风险。在超2000词范围的词汇所占全文的比例上,顶尖组和次顶尖组区别显著。在两组词汇偏误率近似的同时,在调用更高的超2000词高级词汇比重上,顶尖组的选手比次顶尖组的选手更加自如。但是,顶尖组和半决赛组、次顶尖组和半决赛组之间的超2000词词汇占全文比重未见明显差异。次顶尖组的高级词汇使用率显著低于顶尖组,而词汇偏误率显著高于半决赛组,说明次顶尖组在词汇的选择上相对保守,但也更为稳健。而半决赛组虽然在超2000词比重上有更高的平均值,但词汇复杂性分布与次顶尖组之间并无显著差异,不能就此断言半决赛组比次顶尖组有更广泛的词汇运用。对比词汇偏误率,可以推测半决赛组在超2000词外单词的高比重是由于采取较为激进的词汇选择策略造成的。半决赛组选手广泛选用词汇的意识值得肯定,但他们更高的出错率说明其整体把握能力尚不及其他两组,显示出次顶尖组到半决赛组的区别之一在于更低的词汇偏误率,也提醒着选手在选用高级词汇的同时也应对它的使用进行考虑,挑选有把握的词进行发挥。
而在词汇密度方面,三组未见明显差异。Ure (1971)将文本词汇密度达到40%作为区分口语和书面语的通常标准。基于此,三组选手均超过50%,因而有较高的词汇密度,达到了“出口成章”的水平,都能够有效传达信息,因此,词汇密度不是一个在高水平比赛中区分选手能力的指标。
五、结语
本研究结果显示,高水平大学英语学习者英语演讲比赛即兴演讲的词汇丰富性水平在整体上虽然没有出现明显的梯度差异,但在部分指标上仍可见显著区别。据此,本研究推测,高水平二语演讲的总体词汇丰富性差异,不是某一个词汇丰富性指标的单独效果,也非各指标彼此独立、相对均衡发展产生的结果,而是存在相互交叉关系的词汇丰富性指标共同作用的结果。一些关键性指标,如词汇偏误率,相比词汇复杂性,对比赛结果有更大的影响。但可以肯定的是,词汇丰富性对演讲质量的提升有着积极的作用。
本研究运用词汇丰富性,尝试分析了二语演讲语篇,为二语口语的词汇丰富性分析提供了新的思路。不过,同时存在一些不足:首先,对于晋级全国比赛的三个等级的选手,虽有入围半决赛和总决赛,决赛一等奖、二等奖和总决赛冠亚季前三名之分,绝对而言,在所有高水平英语学习者中,这些选手仍属于顶尖行列。在后续研究中有待增加真正意义上的相对低水平文本以提高选手口语能力的区分度及研究结果的普遍适应性。其次,演讲比赛即兴演讲是多种能力的综合,语言词汇丰富性仅为其中一个方面,涵盖多方面的文体学分析或能得到更完善的结果。另外,一些文本之外的内容,如手势、重音等也应当作为考虑因素,对演讲比赛进行多模态分析,以期获得更为全面的发现。未来可在更丰富的语料基础上采用更全面的方法进行演讲语篇的相关研究。
参考文献:
[1]Read J. Assessing Vocabulary[M]. Cambridge: Cambridge University Press, 2000.
[2]张晓东,任娇娇.二语即时作文高低分组词汇丰富性对比研究[J].北京第二外国语学院学报,2018(4):41-52.
[3]汪顺玉.大学英语四级写作样卷的词汇复杂度分析[J].重庆邮电大学学报(社会科学版),2011(6):104-110.
[4]王海华,周祥.非英语专业大学生写作中词汇丰富性变化的历时研究[J].外语与外语教学,2012(2):40-44.
[5]朱慧敏,王俊菊.英语写作的词汇丰富性发展特征——一项基于自建语料库的纵贯研究[J].外语界,2013(6):77-86.